Vous trouvez ici le support du cours « Ingénierie de la fouille et de la visualisation de données massives » proposé au Cnam Liban (code Cnam RCP216).

Contenu de l’enseignement au Liban

Cours

Introduction (certains sujets mentionnés sur cette page Introduction ne seront pas abordés dans l'enseignement au Liban)

Hachage sensible à la similarité (LSH, incluant Hachage sensible à la similarité , LSH pour métriques courantes, Amplification de fonctions LSH)

Recherche par similarité. Application aux systèmes de recommandation

Fouille de données textuelles

Fouille de flux de données

Fouille de réseaux sociaux partie 1, partie 2

Visualisation : introduction générale (cours, vidéo 1, vidéo 2, vidéo 3), présentation de Processing (vidéo 1, vidéo 2)

Visualisation : enjeux perceptifs (cours, vidéo 1, vidéo 2, vidéo 3)

Visualisation : représentations (cours, vidéo 1, vidéo 2)

Travaux pratiques

Introduction à Spark et Scala

Manipulation de données numériques. Exécution d'applications

Echantillonnage. Analyse en composantes principales

Fouille de données textuelles

Fouille de flux de données

Fouille de réseaux sociaux, première partie

Fouille de réseaux sociaux, deuxième partie

Introduction à Processing

Cartographie

Petits multiples

Par ailleurs, des instructions d'installation de Spark sont disponibles.


Après la séance introductive, vous devez suivre les cours détaillés en ligne (liens ci-dessus, les cours non encore disponibles le seront progressivement). Des séances de regroupement virtuel auront lieu une fois par mois, ce sera surtout l'occasion de poser des questions à l'enseignant. Les travaux pratiques se dérouleront sur place, à Beyrouth, sur la base des supports mis en ligne (liens ci-dessus).

Vous pouvez, bien entendu, lire la totalité des supports de cours et de travaux pratiques mis en ligne sur le site du cours, même s'ils ne concernent pas les sujets listés ci-dessus.

La note finale sera la moyenne non pondérée entre la note d'examen et la note de projet. Les sujets de projet seront proposés fin avril. Vous pouvez prendre connaissance ici des sujets de projet proposés à Paris le semestre précédent.