Semaine 1

Consignes

Pendant le TP puis chez vous:

  • Faire les cinq feuilles de travail de TP ci-dessous;

  • Déposer le tout au fur et à mesure sur GitLab (submit), et tout particulièrement en fin de TP.

Avant mardi 23 à minuit:

  • Relire les diapos du cours.

  • Lire les notes de cours de statistiques jusqu’à Pair Plots

  • Répondre au Quizz qui sera déposé sur eCampus (5 points).

  • Avoir déposé au moins une fois votre TP sur GitLab, même incorrect ou incomplet (5 points).

Pour aller plus loin et prendre de l’avance:

TP

Objectif

L’objectif de cette première séance est de vous familiariser avec les outils que nous utiliserons pendant tous le semestre: forge GitLab, environnement Jupyter, programmation simple avec Python, tableaux de données et statistiques. Pour motiver le prochain cours, vous mènerez aussi une première étude statistique pour tester une hypothèse sur la composition des jurys d’assise dans le contexte de la lutte pour les droits civiques aux États Unis.

Environnement de travail

L’organisation des TPs est très similaire à celle des autres cours d’informatique comme «programmation impérative» ou «programmation modulaire».

Vous pouvez travailler sur les machines des salles de TP, sur le service JupyterHub@ParisSaclay, sur le serveur de secours (lien à venir), ou bien sur votre propre machine si vous avez installé les logiciels adéquats (instructions à venir). En salle de TP, évitez d’utiliser le service JupyterHub afin de ne pas le surcharger.

Téléchargement et dépôt des TPs

Pour télécharger et déposer les TPs et projets, nous utiliserons le même outil que d’habitude (travo). Il a été enrichi pour utiliser GitLab pour faire de la correction automatique.

Téléchargez le sujet de TP en tapant la commande suivante dans un terminal:

intro-science-donnees fetch Semaine1

En salle de TP, il se peut que la commande ne soit pas encore installée sur votre machine. Dans ce cas, utiliser à la place:

~nthiery/intro-science-donnees fetch Semaine1

Ouvrez le navigateur de fichiers de Jupyter. En salle de TP, ce sera:

intro-science-donnees jupyter notebook

Ouvrez la feuille de travail ~/IntroSciencesDonnees/Semaine1/index.ipynb et suivez les instructions à partir de là.

Pour déposer votre travail sur GitLab, tapez dans un terminal (si vous êtes dans le groupe MI3):

intro-science-donnees submit Semaine1 MI3

Pour lancer la correction automatique sur GitLab et obtenir votre score:

intro-science-donnees fetch_feedback Semaine1

Bonnes pratiques

Comme pour les autres cours d’informatique, vous allez travailler alternativement dans plusieurs environnements (salle de TP, JupyterHub, …). Pour éviter de vous mélanger les pinceaux avec plusieurs versions du même devoir, nous vous rappelons les bonnes pratiques:

  • En début de séance: mettez systématiquement à jour votre devoir avec fetch.

  • En cours de séance: déposez de temps en temps votre devoir avec submit pour le sauvegarder.

  • En fin de séance: déposez systématiquement votre devoir avec submit.

Feuilles de travail

Dans ce cours, nous utiliserons Jupyter comme environnement de travail et Python comme langage d’interaction et de programmation. La plupart d’entre vous ont suivi les cours «Info 111: Programmation Impérative» et «Introduction à la Programmation» au premier semestre et êtes déjà familiers avec Jupyter et Python; les deux premières feuilles sont donc principalement des rappels. Prenez tout de même dix minutes pour les faire toutes les deux, notamment pour vous familiariser avec la correction automatique et les compréhensions.