Ingénierie de la fouille et de la visualisation de données massives (RCP216)¶
Contenu du cours :
- Préambule
- Cours - Introduction
- Travaux pratiques - Introduction à Python
- Cours - Réduction du volume de données
- Travaux pratiques - Introduction à Spark
- Cours - Réduction de l’ordre de complexité
- Travaux pratiques - Lecture, écriture et manipulation de DataFrames. Exécution d’applications
- Cours - Recherche par similarité. Application aux systèmes de recommandation
- Travaux pratiques - Echantillonnage. Analyse en composantes principales
- TP++ - Analyse factorielle discriminante - Étape descriptive
- Cours - Classification Automatique
- Travaux pratiques - Classification automatique avec k-means
- Cours - Fouille de données textuelles
- Travaux pratiques - Analyse de textes avec Spark NLP
- Cours - Apprentissage supervisé à large échelle
- Travaux pratiques - SVM linéaires
- Travaux pratiques - Discrimination de textes avec Spark NLP
- Cours - Fouille de graphes et réseaux sociaux (1 et 2)
- Travaux Pratiques — Introduction à GraphFrames : chemins et centralités
- Travaux pratiques - Analyse d’un grand graphe (Medline)
- Cours - Détection de communautés dans les graphes
- Cours - Visualisation d’information
- Travaux pratiques - Visualisation de données
- Cours - Visualisation de graphes et réseaux sociaux
- Travaux pratiques - Visualisation de graphes avec Gephi
- Cours - Fouille de flux de données
- Travaux pratiques - Fouille de flux de données
- Cours - Ethique dans la fouille de données
- Travaux pratiques - Détection et correction des disparités