User Tools

Site Tools


Sidebar

Home

Research

Teaching

Master
Old courses

Private

teaching:master

Data Mining/Machine learning

Syllabus

Informations de base

  • Nom du cours : Data Mining/Machine learning.
  • Nombre de crédits : 4 ECTS
  • Mode d'évaluation : Projet (40%) + Examen final (60 %)
  • Nombre de séances : 24h Cours et 12h TP (sur rlogo.jpg ou Weka).
  • Prérequis : Cours M1 en Analyse Factorielle, Algèbre linéaire, éléments de statistiques descriptives et inférentielles.

Motivations

Ce cours a pour objectif d'introduire les notions de fouille de données et d'apprentissage statistique dans un contexte de grands volumes de données. Il s'agit de former les étudiants aux méthodes de description et de représentation de données multidimensionnelles ainsi qu'aux méthodes de base de leur analyse ; en particulier les méthodes de réduction de dimensionalité (ACP), d'apprentissage non-supervisé (kmeans, CAH, régles d'association) et d'apprentissage supervisé. Le cours sera guidé par des exemples pratiques de données d'entreprises. Les Travaux dirigés se feront sous le logiciel rlogo.jpg et/ou Weka.

Domaines d’applications, quelques exemples :

  • Marketing (anticiper les comportements des clients, concevoir des offres ciblées).
  • bioinformatique (étude des lien entre gènes).
  • Analyse d’enquêtes.
  • Séries financières.
  • le Web.
  • etc.

Objectifs d’apprentissage

  • Savoir se débrouiller face à des grands volumes de données.
  • Savoir quelle méthode appliquer dans quel cas.
  • Se souvenir de tout cela en entreprise et dans les cours du Master :
  • Devenir un Data Analyst/Scientist

Programme Prévisionnel

  1. Introduction générale
  2. Classification non-supervisée
    • K-means
    • Classification hiérarchique
    • Association
    • Réduction de dimensionalité : ACP, SVD
    • Latent Semantic Analysis
  3. Classification Supervisée
    • Arbres de décision
    • Régression
    • Séparateurs à Vaste Marge

Calendrier Prévisionnel parcours normal

Consignes pour le projet

Le projet est pour vous une opportunité d'explorer un problème intéressant d'apprentissage automatique.Il s'agit de mettre en oeuvre un ou plusieurs algorithmes sur des données “réelles”. Vous pouvez choisir l'une des compétitions Kaggle parmi les compétitions actives. Vous expliquerez en quoi consiste la compétition, la nature des données, et les méthodes que vous comptez employer pour les tester sur ces données.

Les projets peuvent être réalisés par équipe de 2 étudiants (ou exceptionnellement de3 étudiants). Les membres des équipes sont responsables du découpage du travail de telle sorte que tous les membres contribuent significativement au projet.

Livrables

Les projets donnent lieu aux “livrables” suivants :

  1. Rapport final : 6 pages (strict. Les rapports de plus de 6 pages ne seront pas lus !) (60% du projet)
  2. Archive contenant le code, un fichier ReadMe expliquant son utilisation/installation et une documentation des différentes partie de celui-ci (40% du projet)

Le rapport final doit être soumis dans le format d'un papier ICML. Celui-ci sera évalué en tenant compte de:

  1. La nouveauté du projet proposé et des applications envisagées. Les équipes sont encouragées à proposer de nouvelles idées et de nouvelles applications. Un projet qui apporte de nouvelles idées (méthodes, algorithmes, applications, théories) obtiendra une meilleure note qu'un projet assez banal.
  2. La rigueur et le caractère extensif de l'analyse et/ou des expériences réalisées. Un projet qui répond vraiment aux interrogations et aux doutes éventuels des relecteurs sur l'intérêt de la méthode et sur les performances annoncées obtiendra une note plus élevée.
  3. Une attention particulière doit être portée sur l'évaluation de l'approche, et sur l'effort d'analyse des résultats obtenus.
  4. L'expression, la clarté des explications et la qualité d'exposition. Les rapports peuvent être écrits en français ou en anglais, du moment que c'est clair et bien écrit.

Dates importantes

Formation classique
  • 30 avril 2017 (23:59) : 10 avril 2016 (23:59) : dépôt du rapport final et de l’archive sur mycourse
Formation en apprentissage
  • 16 mars 2016 : envoi d'une description du projet proposé (1 page)
  • 30 avril 2016 (23:59) : envoi du rapport final et de l'archive
teaching/master.txt · Last modified: 2018/02/20 16:01 by atif