Semaine 8

Objectifs

Vous êtes désormais familiers avec le schéma VI-ME-RÉ-BAR – [VI]sualisation, [ME]sure, [RÉ]férence (baseline), [BAR]res d’erreur, et vous avez appris à classifier des jeux de données simples:

  • Collecter et traiter des images (recentrage automatique, seuillage etc.).

  • Extraire des attributs sur les couleurs (ad-hoc), la forme (ad-hoc ou matched filters) ou les pixels (PCA).

  • Entraîner un classificateur (oneR, k-NN, arbre de décision, perceptron ou autres) sur vos données d’entraînement.

  • Calculer un score de performance du classificateur sur vos données de test.

À l’occasion du second mini-projet, vous allez appliquer ces connaissances et votre savoir faire à vos propres données, en développant de nouveaux aspects de l’analyse (biais sur les méta-données) ou en allant plus loin des les concepts déjà introduits (PCA, nouveaux classificateurs).

Ce travail, commencé en Semaine 7 va se poursuivre sur les deux dernières séances:

Semaine 8 : 28 - 31 mars (dépôt le 4 avril à 22h)

  • Validation du jeu de données auprès de vos chargées et chargés de TP et import de celui-ci dans votre dépôt de la semaine 8. Préparation de votre jeu de données, prétraitement et analyse.

Semaine 9 : 4 - 8 avril (dépôt le 11 avril à 22h)

  • Fin du projet, retour sur les classificateurs.

Semaine 11 : Soutenances de projet

  • Selon les groupes de TD: le 20 ou le 21 avril. Voir le planning sur eCampus.

Le travail est à faire en binôme, le même que pour le premier mini-projet sauf demande motivée auprès de vos chargées et chargés de TP.

Consignes pour votre projet

Autres bonnes pratiques :

  • Gardez une trace des expérimentations intermédiaires («nous avons essayé telle combinaison de features; voici les résultats et la performance obtenue»).

  • Vous mettrez dans le fichier utilities.py les utilitaires des TP précédents (load_images, …) que vous souhaiterez réutiliser, ainsi que vos nouvelles fonctions.

  • Lorsque pertinent pour les explications, vous pourrez afficher le code de vos fonctions avec show_source.

  • Complétez régulièrement le paragraphe de revue de code ci-dessous, pour qu’il affiche le code de toutes les fonctions que vous avez implantées. Vérifiez à chaque fois le résultat des outils de vérifications (flake8, …).

  • Lorsque vous aurez besoin de brouillon – par exemple pour mettre au point du code – créez des petites feuilles Jupyter séparées pour ne pas polluer votre document.

Au travail!

  1. Relisez les instructions pour le téléchargement et le dépôt des TPs, ainsi que les bonnes pratiques.

  2. Téléchargez le sujet de TP Semaine8

  3. Ouvrez la feuille index pour retrouver ces consignes.

  4. Ouvrez la feuille jeu_de_donnees et suivez les instructions pour préparer votre propre jeu de données.

  5. Ouvrez la feuille analyse et suivez les instructions pour lancer une première analyse sur le jeu de données fourni.

  6. Ouvrez la feuille extraction d’attributs et suivez les instructions pour, une première fois prétraiter vos données et en extraire des attributs.

  7. Ouvrez la feuille classificateur et suivez les instructions pour votre une première classification.

  8. Itérez entre les feuilles précédentes pour améliorer les performances de votre classification.

  9. Préparer votre présentation. Elle devra présenter de façon synthétique votre jeu de données, vos expériences, vos observations, vos interprétations.

    Un squelette de diaporama Jupyter vous est fourni; vous pouvez aussi produire un diaporama en pdf.

Bon Projet!