Salle de TP virtuelle#

Le dépôt ComputerLab définit un environnement virtuel pour travailler sur le matériel pédagogique du Cours « Introduction à la Sciences des Données », L1 Info, Faculté des Sciences d’Orsay, pour déploiement en salle de TP, sur MyDocker-VD, JupyterHub@Paris-Saclay, Binder, ou sur sa propre machine. Il facilite, lorsque nécessaire, l’installation de tous les artefacts requis :

  • logiciels : Python, Jupyter et quelques bibliothèques classiques (voir le fichier environment).

  • configuration pour la gestion des devoirs avec Travo

  • utilitaires « maison ».

  • jeux de données.

La page Case Départ propose plusieurs options pour accéder au matériel pédagogique pour travailler dessus interactivement. Dans la plupart de ces options, vous n’avez rien à installer. Mais si vous souhaitez travailler en local sur votre machine personnelle, vous devez au préalable installer l’environnement virtuel en suivant les instructions ci-dessous.

Installation de l’environnement virtuel#

Note

Les instructions ci-dessous supposent que vous ayez accès à un terminal muni du système de gestion de version git, et que vous avez un petit peu de familiarité avec ces derniers. Ces instructions devraient être valides sous toute plateforme supportée par conda-forge et notamment Windows, MacOS, Linux. Elles sont fournies telles quelles, sans support technique. Toute suggestion d’amélioration bienvenue.

Avec conda (recommandé)#

  1. Si vous ne l’avez pas déjà, installez le gestionnaire d’environnements conda. Nous recommandons l’utilisation de l’installateur Miniforge. Voir son guide d’installation.

  2. Si ce n’est déjà fait, activez votre environnement conda (voir les instructions d’installation).

  3. Si vous ne l’avez pas déjà, installez mamba (plus rapide que conda; fourni directement par mambaforge) :

    conda install -c conda-forge mamba
    
  4. Si vous ne l’avez pas déjà fait, téléchargez la «salle de TP virtuelle» :

    git clone https://gitlab.dsi.universite-paris-saclay.fr/L1InfoInitiationScienceDonnees/ComputerLab.git ~/IntroScienceDonnees
    
  5. Installez les logiciels requis :

    cd ~/IntroScienceDonnees/binder/
    mamba env create
    

    La liste des logiciels, ainsi que les jeux de données seront mis à jour régulièrement en cours de semestre. Pour mettre à jour votre installation :

    cd ~/IntroScienceDonnees/binder/
    git pull
    mamba env create --force
    

Avec pip#

  1. Assurez vous que vous avez toutes les bibliothèques requises (voir le fichier environment.yml).

  2. Installez les utilitaires « maison » et jeux de données :

    pip install git+https://gitlab.dsi.universite-paris-saclay.fr/L1InfoInitiationScienceDonnees/Assets.git
    

Avec Docker#

Une image docker du cours est fournie dans le registre de conteneurs du projet Gitlab du cours. Voici son identifiant :

gitlab.dsi.universite-paris-saclay.fr:5005/l1infoinitiationsciencedonnees/computerlab/image:latest

Pour la lancer en local, faites:

cd ~/IntroScienceDonnees/
docker run --rm --name IntroScienceDonnees -u $UID:$GID -p 8888:8888 -v .:/media -e MPLCONFIGDIR=/tmp/mpl gitlab.dsi.universite-paris-saclay.fr:5005/l1infoinitiationsciencedonnees/computerlab/image jupyter-lab --ip 0.0.0.0 --notebook-dir=/media

Après le lancement, vous pourrez voir dans les logs ce qui suit; cliquez sur le dernier lien, celui commencant par http://127.0.0.1 :

[I 2024-01-19 09:47:33.289 ServerApp] Use Control-C to stop this server and shut down all kernels (twice to skip confirmation).
[W 2024-01-19 09:47:33.292 ServerApp] No web browser found: Error('could not locate runnable browser').
[C 2024-01-19 09:47:33.292 ServerApp]

    To access the server, open this file in a browser:
        file:///home/mambauser/.local/share/jupyter/runtime/jpserver-1-open.html
    Or copy and paste one of these URLs:
        http://ad678f846664:8888/lab?token=6450d393ba60a9a02c9c2ddb8bf4fb7dafcf23ab3a483f6f
        http://127.0.0.1:8888/lab?token=6450d393ba60a9a02c9c2ddb8bf4fb7dafcf23ab3a483f6f

Vérification de l’installation#

À faire.