Semaine 5

Consignes

Avant mardi 1er mars à 22h:

  • Relire les diapos du cours 5

  • Rendu final du mini-projet 1. Vous devrez avoir déposé votre version finale du dossier Semaine5 sur GitLab. Pour les binômes, chaque membre devra faire un dépôt séparé, même si les deux soumissions sont identiques.

TP: fin du mini-projet 1

La semaine précédente, vous avez appliqué le schéma VI-ME-RÉ-BAR – [VI]sualisation, [MÉ]trique, [Ré]férence, [BAR]res d’erreur – pour la classification de votre propre jeu de données. Vous avez:

  • Fait quelques essais avec un des jeux de données fournis

  • Déroulé l’analyse de données avec des attributs simples (par exemple rougeur et élongation) ainsi qu’un premier classifieur, afin d’obtenir votre référence: sans chercher à optimiser, quelle performance de classification obtient-on?

  • Implémenté d’autres attributs et déroulé à nouveau l’analyse pour obtenir une meilleure performance.

Objectifs

L’objectif de cette deuxième semaine de mini-projet est de mettre en application le cours de cette semaine en explorant d’autres classificateurs. Vous pouvez au choix:

  • Implémenter l’un des classificateurs décrits dans le cours:

    • OneR(**)

    • KNN: k-plus proches voisins (*)

    • Arbre de décision (*)

    • Fenêtre de Parzen (*)

    • Perceptron (**)

  • Essayer plusieurs autres classificateurs fournis par Scikit-Learn comme par exemple:

    • Autre méthode de noyau (****)

    • Perceptron multi-couche (****)

Au travail!

  • [ ] Vérifiez votre inscription avec votre binôme pour le projet 1 dans le document partagé. Inscrivez-vous aussi si vous n’avez pas encore de binôme!

  • [ ] Téléchargez le sujet de TP Semaine5 (rappel des instructions)

  • [ ] Recopiez dans Semaine5 vos feuilles de travail de la semaine 4:

      cd ~/IntroScienceDonnees/Semaine5
      cp ../Semaine4/?_*.md .
    
  • [ ] Ouvrez la feuille index pour retrouver ces consignes.

  • [ ] Consultez la section « Rapport » en fin de feuille.

  • [ ] Révisez les bonnes pratiques vues en semaine 3.

  • [ ] Partez à la découverte des classificateurs.

  • [ ] Reprenez votre analyse de la semaine dernière dans la feuille analyse de donnees avec vos propres classificateurs.

  • [ ] Si nécessaire, relisez les instructions pour le téléchargement et le dépôt des TPs, ainsi que les bonnes pratiques.

Rapport

Cette feuille joue le rôle de mini-rapport ci-dessous. Elle vous permettra à vous et votre enseignant ou enseignante d’évaluer rapidement votre avancement sur cette première partie du projet.

Au fur et à mesure, vous cocherez ci-dessus les actions que vous aurez effectuées; pour cela, double-cliquez sur la cellule pour l’éditer, et remplacez - [ ] par - [x]. Vous prendrez aussi des notes ci-dessous. Enfin, vous consulterez la section « Revue de code » ci-dessous pour vérifier la qualité de votre code.

VOTRE RÉPONSE ICI

Revue du code

Affichage du code des principales fonctions
from utilities import *
# Feuille 2_images.md
show_source(show_color_channels)
Conventions de codage

L’outil flake8 permet de vérifier que votre code respecte les conventions de codage usuelles de Python, telles que définies notamment par le document PEP 8. Si la cellule suivante affiche des avertissements, suivez les indications données pour peaufiner votre code.

assert run_without_error("flake8 utilities.py")

Barême indicatif /20

  • 1_tableaux.md : 1,5 points

  • 2_images.md : 2 points

  • 3_features.md : 1 point

  • 4_analyse_de_données.md : 10 points

  • 5_classificateur.md : 4 points (+ 3 points bonus pour le OneR)

  • index (semaine 4 et 5) : 1,5 points