Préambule

Vous trouvez ici le support de l’unité d’enseignement (UE) « Ingénierie de la fouille et de la visualisation de données massives » proposée au Cnam Paris (code Cnam RCP216). Les informations pratiques en format Cnam se trouvent sur la page http://formation.cnam.fr/par-ecole/ecole-siti/informatique/ingenierie-de-la-fouille-et-de-la-visualisation-de-donnees-massives-669631.kjsp.

Le support sous forme PDF de la partie fouille de données du cours se trouve ici. Ce support PDF est mis à jours moins fréquemment que le support HTML.

Ouverture

Cette unité d’enseignement (UE) est ouverte en présentiel (hors temps ouvrable, HTO) au Cnam Paris depuis 2015, à la fois au premier et au second semestre de l’année universitaire. Elle ouvre également en formation à distance (FOD) nationale au premier semestre de l’année universitaire 2016-2017 (donc d’octobre 2016 à février 2017, inscriptions en ligne au Cnam Paris fin septembre 2016).

Nous vous proposons d’évaluer vous-même, en utilisant ce questionnaire web, dans quelle mesure vous êtes prêt(e) à suivre cette UE. Ce questionnaire vous permet une auto-évaluation, anonyme et sans enregistrement des résultats.

Positionnement de RCP216 dans les parcours

Dans le certificat « Analyste de données massives », RCP216 doit être suivie après avoir terminé NFE204 et STA211. Changer cet ordre fortement conseillé vous compliquera très significativement le travail.

Dans le Master Sciences, technologies, santé mention statistique et mathématiques appliquées spécialité statistique, RCP216 doit être suivie après STA211. Pour quelques notions utiles il faudra se référer au support en ligne de NFE204.

Conditions d’accès

L’inscription est sans agrément mais il est important de satisfaire les pré-requis (« conditions d’accès » sur la fiche descriptive de l’UE). Ne sous-estimez pas l’importance de ces pré-requis, lors des cours et des travaux pratiques (TP) les enseignants ne peuvent pas passer beaucoup de temps sur des rappels.

Nous vous proposons d’évaluer vous-même, en utilisant ce questionnaire web, dans quelle mesure vous êtes prêt(e) à suivre cette UE. Ce questionnaire vous permet une auto-évaluation, anonyme et sans enregistrement des résultats.

Pour les cours du soir, afin de permettre la bonne organisation des TP, les inscriptions pour le semestre en cours seront arrêtées après la seconde semaine de cours et TP.

Organisation de l’enseignement

Chaque séance de cours est suivie par une séance de travaux pratiques (TP). La séance de TP a lieu immédiatement après le cours pour un des groupes de TP et (lorsque cela est possible) le lendemain soir pour l’autre groupe de TP. Il est envisageable de changer de groupe d’une semaine sur l’autre, en fonction de vos disponibilités. Il est en revanche nécessaire d’avoir des groupes assez équilibrés pour pouvoir travailler seul sur un ordinateur et pour que l’enseignant arrive à répondre rapidement à toutes vos questions. Il est possible d’apporter votre ordinateur portable pour travailler avec, l’enseignant peut éventuellement vous assister avec l’installation de Spark lors de la première ou deuxième séance de TP.

Tous les supports de cours et de travaux pratiques mis en ligne peuvent évoluer à tout moment. Pour les travaux pratiques, les corrections et réponses aux questions sont mises en ligne après deux ou trois semaines (et retirées après l’examen).

Lors des TP et dans la réalisation des projets d’UE vous pouvez rencontrer des problèmes très divers, allant des fautes de frappe (!) à des anomalies de configuration de logiciels. Pour les résoudre vous avez la possibilité de vous adresser aux enseignants, mais ils ne sont pas toujours disponibles, peuvent ne pas trouver la réponse rapidement ou peuvent avoir des difficultés à régler le problème à distance. Vous rencontrerez en général des problèmes auxquels d’autres se sont confrontés et vous trouverez les solutions sur des forums en ligne, à l’aide d’un moteur de recherche. Dans d’autres cas vous avez aussi la possibilité d’utiliser le forum de l’UE. L’inscription à ce forum est nécessaire pour y poster. Si vous avez une question urgente pour un enseignant, mieux vaut la lui envoyer par courriel directement. L’adresse de courriel est de la forme prénom.nom@cnam.fr.

Les enseignants qui interviendront lors des séances de cours et/ou de travaux pratiques sont : Michel Crucianu, Raphaël Fournier-S’niehotta, Marin Ferecatu, Pierre Cubaud.

Evaluation

La note finale est la moyenne non pondérée entre la note d’examen et la note de projet. L’examen est un examen sur table. Pour l’examen il y a une session de rattrapage. Nous avons mis en ligne les sujets des examens de juin 2015, février 2016 et juin 2017.

Lors de l’examen, depuis le second semestre 2016-2017, vous pouvez consulter comme seul document écrit deux feuilles A4 (recto-verso) écrites à la main ; l’objectif est de vous inciter à faire vous-même la synthèse que vous utilisez pendant l’examen.

Le projet doit être réalisé individuellement, vous avez ici les instructions et la liste des sujets. Afin de réaliser le projet il sera nécessaire d’installer Spark sur un ordinateur auquel vous pouvez avoir accès tous les jours. Pour cela, vous pouvez suivre ces instructions d’installation. Faites cette installation au plus tôt pour avoir le temps de résoudre les éventuels problèmes d’installation avant de commencer à travailler sur le projet. Le travail sur le projet doit démarrer aussi tôt que possible après la validation du choix du sujet, ne le laissez pas pour les deux dernières semaines avant la date de rendu de projet.

Travail nécessaire pour valider l’UE

Le bon suivi de cette UE exige du temps chaque semaine. Il y a une séance de cours (2h) et une séance de travaux pratiques (2h) par semaine, le même soir pour un des groupes, d’autres soirs pour les autres groupes. L’évaluation est faite à travers un examen et un projet dont la préparation demande aussi du temps. Enfin, vous aurez peut-être à actualiser certaines connaissances antérieures, cela demande également du temps. Par ailleurs, suivre des cours le soir, après un travail à plein temps, sollicite plus qu’un suivi classique en formation initiale.

Liens indispensables

« Quels sont les horaires des enseignements ? » « Où a lieu le TP aujourd’hui ? » « Quand a lieu l’examen ? » « Qui est la/le responsable du certificat Analyste de données massives ? » « Quelle est ma note ? » - à toutes ces questions (et quelques autres) vous trouverez très facilement les réponses en ligne, ce serait gentil de ne pas les poser par courriel aux enseignants, qui d’ailleurs pourraient ne pas trouver le temps de vous répondre.

Horaires et lieux des enseignements, entrez RCP216, choisissez le semestre et la modalité dans le menu déroulant. Il est également possible d’installer l’application Planni Cnam.

Dates et lieux d’examen rubrique « Examens » (les enseignants ont la même source d’information, ils n’en sauront ni plus, ni plus tôt)

Notes et autres informations concernant votre inscription au Cnam (« Au besoin les auditeurs peuvent écrire à examens.centreparis @ cnam.fr qui se chargera de répondre en cas de question relative à leurs notes »)

Informations concernant le certificat Analyste de données massives