Semaine 3: première classification automatique par apprentissage statistique

Consignes

Avant le lundi 14 février 22h00:

  • [ ] Déposez le TP n°3 (noté par correction automatique; 5% note finale)

Avant mercredi 16 février 10h45:

TP: classification automatique d’images de pommes et bananes

Objectif

La classification automatique d’images par apprentissage statistique sera le fil directeur des semaines à venir. Nous allons commencer en douceur cette semaine, en reproduisant une analyse de données préexistante dont l’objet est de classer des photographies très simples de pommes et de bananes. Ce sera l’occasion de vous familiariser avec le schéma VI-ME-RÉ-BAR – [VI]sualisation, [ME]sure, [RÉ]férence, [BAR]res d’erreur. Ce sera aussi l’occasion de mettre en œuvre quelques bonnes pratiques pour la rédaction de documents exécutables reproductibles.

En semaine 4 et 5 (mini projet 1), vous traiterez d’autres jeux de données, en abordant l”extraction d’attributs et l”utilisation d’autres classificateurs. Ce sera aussi l’occasion d’aborder le traitement d’images.

Les semaines suivantes nous approfondirons le sujet pour vous amener au projet final où vous classerez automatiquement des images de votre cru.

Au travail!

  • [ ] Relisez si nécessaire les instructions pour le téléchargement et le dépôt des TPs.

  • [ ] Téléchargez le sujet de TP Semaine3.

  • [ ] Ouvrez la feuille index pour retrouver ces consignes.

  • [ ] Consultez la section « Rapport » en fin de feuille.

  • [ ] Partez à la découverte des bonnes pratiques.

  • [ ] Effectuez votre analyse de donnees, en suivant la trame et les instructions fournies.

  • [ ] Choisissez le jeu de données que vous analyserez lors du mini projet 1 (Semaines 4 & 5)

  • [ ] Inscrivez vous avec votre binome pour le projet 1 dans le document partagé.

Rapport

Cette feuille joue aussi le rôle de mini-rapport qui vous permettra à vous et votre enseignant d’évaluer rapidement votre avancement sur ce TP.

Au fur et à mesure du TP, vous cocherez ci-dessus les actions que vous aurez effectuées; pour cela, double-cliquez sur la cellule pour l’éditer, et remplacez - [ ] par - [x]. Vous prendrez aussi des notes ci-dessous. Enfin, vous consulterez la section « Revue de code » ci-dessous pour vérifier la qualité de votre code.

En quelques mots, qu’avez-vous appris?

Quelles difficultés avez vous éventuellement rencontrées?

Qu’avez vous aimé ou moins aimé dans ce TP?

Notes libres

Revue du code

Affichage du code des principales fonctions
from intro_science_donnees import show_source
from utilities import *
# Feuille 2_analyses_donnees.md
show_source(error_rate)
Conventions de codage

L’outil flake8 permet de vérifier que votre code respecte les conventions de codage usuelles de Python, telles que définies notamment par le document PEP 8. Si la cellule suivante affiche des avertissements, suivez les indications données pour peaufiner votre code.

from intro_science_donnees import code_checker
code_checker("flake8 utilities.py")