Questionnaire d’auto-évaluation¶
Explications¶
L’enseignement « Ingénierie de la fouille et de la visualisation de données massives » (RCP216) s’intéresse principalement à la mise en œuvre de méthodes de fouille et de visualisation de données dans un contexte de données massives. Pour bien suivre le cours et les travaux pratiques, nous considérons qu’il est nécessaire d’avoir
de bonnes connaissances mathématiques et statistiques générales, ainsi qu’une maîtrise de méthodes statistiques pour la fouille de données,
une connaissance élémentaire de techniques de gestion de données massives faiblement structurées et de techniques de passage à l’échelle par distribution,
la capacité à utiliser le système d’exploitation linux et à écrire de courts programmes dans au moins un langage de programmation.
Le bref questionnaire suivant devrait vous permettre d’évaluer dans quelle mesure vous disposez de ces pré-requis. Vos réponses sont anonymes et non enregistrées par le système. Il est donc nécessaire que vous notiez vous même les numéros des questions auxquelles vous n’avez pas donné la (ou les) bonne(s) réponse(s). A la fin du questionnaire, dans la section Conclusions, vous trouverez des recommandations suivant cette auto-évaluation.
Attention, certaines questions sont formulées de façon plutôt informelle, essayez de répondre quand même.
Questions¶
Conclusions¶
Pour les questions de 1 à 7 : si vous avez répondu correctement à moins de 3 questions alors vous devriez réviser les notions mathématiques de base (d’algèbre linéaire et de probabilités) pour pouvoir suivre convenablement les cours et les travaux pratiques de l’unité d’enseignement RCP216.
Si vous n’avez répondu correctement à aucune des questions 8 et 9, vous devriez suivre un enseignement d’aprentissage statistique et/ou de fouille de données au préalable. Dans le cadre du certificat de spécialisation « Analyse de données massives » et dans le Master de statistiques, un tel enseignement est donné dans « Entreposage et fouille de données » (STA211) et il est fortement conseillé de suivre STA211 avant RCP216. Dans un autre cadre et si votre formation antérieure est plutôt en informatique qu’en statistiques, vous pouvez suivre « Apprentissage statistique : modélisation descriptive et introduction aux réseaux de neurones » (RCP208) suivie éventuellement de « Apprentissage statistique : modélisation décisionnelle et apprentissage profond » (RCP209).
Aucune des questions ci-dessus n’évalue vos connaissances dans le domaine des techniques de gestion de données massives faiblement structurées et des techniques de passage à l’échelle par distribution. Ces connaissances ne sont pas strictement indispensables avant de suivre RCP216 mais les posséder vous facilitera le suivi du cours et la réalisation des projets. Dans le cadre du certificat de spécialisation « Analyse de données massives », ces connaissances sont acquises dans l’enseignement « Bases de données documentaires et distribuées » (NFE204) et il est fortement conseillé de suivre NFE204 avant RCP216.
Si vous n’avez répondu correctement à aucune des questions 10 et 11, vous devez suivre d’abord un enseignement de base en algorithmique et programmation, par exemple au Cnam NFP135 ou NFA031.
Enfin, si vous n’avez répondu correctement à aucune des questions 12 et 13, il vous serait utile de vous familiariser avec le système d’exploitation linux car les travaux pratiques de RCP216 se déroulent sur une plateforme linux (même si en général vous serez en interaction avec Jupyter et non directement avec le système linux). Pour cela, vous pouvez consulter les commandes linux les plus utilisées.