Préambule

Vous trouvez ici le support de l’unité d’enseignement (UE) « Ingénierie de la fouille et de la visualisation de données massives » proposée au Cnam Paris (code Cnam RCP216). Les informations pratiques en format Cnam se trouvent sur la fiche descriptive de l’UE (onglet « Informations pratiques »).

Ce support est librement et directement accessible. Si vous suivez l’UE RCP216 du Cnam dans le cadre d’une formation financée par un organisme (employeur, Pôle emploi, Conseil régional, etc.), il est indispensable de passer par http://lecnam.net pour accéder à ces supports (plutôt que de consulter directement ce site public) afin que des indicateurs de suivi puissent être transmis à cet organisme.

Ouverture

Cette unité d’enseignement (UE) est ouverte en formation à distance (FOD) nationale au premier semestre de l’année universitaire (octobre à février, inscriptions en ligne au Cnam Paris fin septembre). Elle ouvre également en présentiel (le soir ou hors temps ouvrable, HTO) au Cnam Paris, au second semestre de l’année universitaire (de février à juin).

Positionnement de RCP216 dans les parcours

Dans le certificat « Analyste de données massives », RCP216 doit être suivie après avoir terminé NFE204 et STA211. Cet ordre est fortement conseillé ; ne pas le respecter vous compliquera très significativement le travail.

Dans le Master Statistique Sciences des données et dans le Diplôme d’ingénieur Spécialité Bio-informatique, RCP216 doit être suivie après STA211. Pour quelques notions utiles il est possible de se référer au support en ligne de NFE204.

Conditions d’accès

L’inscription est sans agrément mais il est important de satisfaire les pré-requis (rubrique « Conditions d’accès » sur la fiche descriptive de l’UE). Ne sous-estimez pas l’importance de ces pré-requis, lors des cours et des travaux pratiques (TP) les enseignants ne peuvent pas passer beaucoup de temps sur des rappels.

Nous vous proposons d’évaluer vous-même, en utilisant ce questionnaire web, dans quelle mesure vous êtes prêt.e à suivre cette UE. Ce questionnaire vous permet une auto-évaluation anonyme et sans enregistrement des résultats.

Organisation de l’enseignement

Chaque séance de cours est suivie par une séance de travaux pratiques (TP) qui se déroule sur un serveur JupyterHub du Cnam. Il est toutefois possible de tout installer sur votre ordinateur portable pour travailler avec.

Les supports de cours et de TP détaillés, ainsi que les diapositives employées, sont accessibles à partir du menu situé à droite. Tous les supports de cours et de TP mis en ligne peuvent évoluer à tout moment. Pour les TP, les réponses aux questions sont mises en ligne 2 à 3 semaines après la séance et retirées avant le début du semestre suivant.

Lors des TP et dans la réalisation des projets d’UE vous pouvez rencontrer des problèmes très divers, allant des fautes de frappe (plus fréquentes qu’on le pense !) à des anomalies de configuration de logiciels. Pour les résoudre vous avez la possibilité de vous adresser aux enseignants, mais ils ne sont pas toujours disponibles, peuvent ne pas trouver la réponse rapidement ou peuvent avoir des difficultés à régler le problème à distance pour la FOAD. Vous rencontrerez en général des problèmes auxquels d’autres se sont confrontés et vous trouverez les solutions sur des forums en ligne, à l’aide d’un moteur de recherche. Dans d’autres cas vous avez aussi la possibilité d’utiliser le forum de l’UE sur Moodle (lecnam.net) (accès réservé aux auditeurs inscrits à l’UE). Si vous avez une question urgente pour un enseignant, mieux vaut la lui envoyer par courriel directement. L’adresse de courriel est de la forme prénom.nom@cnam.fr.

L’équipe enseignante actuelle est composée de Michel Crucianu (responsable de l’UE), Raphaël Fournier-S’niehotta et Wafa Aissa.

Evaluation

La note finale est la moyenne non pondérée entre la note d’examen et la note de projet. L’examen est un examen sur table. Pour vous permettre de voir la nature des questions et des réponses attendues, nous avons mis en ligne les sujets des examens de janvier 2019, février 2021 et juin 2022. Nous considérons qu’il n’est pas utile de mettre plus de sujets en ligne.

Lors de l’examen vous pouvez consulter comme seul document écrit deux feuilles A4 (recto-verso) écrites à la main ; l’objectif est de vous inciter à faire vous-même la synthèse que vous utilisez pendant l’examen.

Pour l’examen il y a une session de rattrapage. La planification des examens est accessible ici (rubrique « Examens »).

Le projet choisi parmi les sujets que nous proposons doit être réalisé individuellement, vous avez ici les instructions et la liste des sujets. Le projet peut être réalisé sur un serveur JupyterHub du Cnam, il n’est pas nécessaire d’installer de logiciels spécifiques sur votre ordinateur personnel.

Travail nécessaire pour valider l’UE

Le bon suivi de cette UE exige du temps chaque semaine. Il y a une séance de cours (2h) et une séance de travaux pratiques (2h) par semaine. L’évaluation est faite à travers un examen et un projet dont la préparation demande aussi du temps. Enfin, vous aurez peut-être à actualiser certaines connaissances antérieures, cela demande également du temps. Par ailleurs, suivre des cours le soir, après un travail à plein temps, sollicite plus qu’un suivi classique en formation initiale.

Liens indispensables

« Quels sont les horaires des enseignements ? » « Où a lieu le TP aujourd’hui ? » « Quand a lieu l’examen ? » « Qui est la/le responsable du certificat Analyste de données massives ? » « Quelle est ma note ? » - à toutes ces questions (et quelques autres) vous trouverez très facilement les réponses en ligne, ce serait gentil de ne pas les poser par courriel aux enseignants, qui ne trouveront peut-être pas le temps pour répondre.

Horaires et lieux des enseignements, entrez RCP216, choisissez le semestre et la modalité dans le menu déroulant. Il est également possible d’installer l’application Planni Cnam.

Dates et lieux d’examen rubrique « Examens » (les enseignants ont la même source d’information, ils n’en sauront ni plus, ni plus tôt).

Notes et autres informations concernant votre inscription au Cnam (« Au besoin les auditeurs peuvent écrire à examens.centreparis @ cnam.fr qui se chargera de répondre en cas de question relative à leurs notes »). Les enseignants ne sont pas autorisés à communiquer directement une note par téléphone ou par courriel.

Informations concernant le certificat Analyste de données massives

Ressources

Le point d’entrée pour le certificat de spécialisation « Analyste de données massives » du Cnam Paris.

Instructions pour l’installation de Spark.

Les autres UE du certificat de spécialisation Analyste de données massives :

Autres UE du Cnam qui peuvent servir d’introduction (et parfois d’approfondissement) à certains sujets abordés :

Liens externes

Ressources pédagogiques en statistique à l’INSA de Toulouse, avec de nombreux exemples en R et Python.