Partie 3 : fichiers CSV#
Dans cette partie, on va traiter les fichiers tels qu’ils sont réellement distribués, en utilisant le format CSV (Comma Separated Values). C’est un format texte répandu pour représenter des données tabulaires. D’ailleurs, vous pouvez charger ce type de fichier directement dans un tableur, par exemple pour vérifier à la main que vos résultats sont corrects.
Ouvrez le fichier donnees/donnees-test.csv
sur le serveur Jupyter (ici) et sélectionnez en haut le point virgule « ; » comme Délimiteur
pour voir apparaitre les données sous forme d’un tableur.
Fermez le fichier, puis ouvrez le en ouvrant le dossier donnees
puis clique droit sur le fichier et Òuvrir avec : Editeur
. Vous voyez maintenant le même fichier directement tel qu’il est sauvegardé au format texte (et tel que vous allez le lire avec C++)
Exercice 7 : un premier fichier CSV
L’objectif est de reprendre l’exercice 2, mais en partant du fichier de
données tel qu’il est fourni par https://opendata.paris.fr:
donnees/liste_des_prenoms.csv
Chaque ligne de texte représente une ligne du tableau, et les cellules sont séparées par des point-virgules. La première ligne d’un fichier CSV est une ligne d’entête qui correspond au nom des colonnes du tableau.
Consulter et essayer le programme
getline-exemple
dansgetline-exemple.cpp
. Il utilise la fonctiongetline
, dont la documentation est donnée dansgetline.hpp
Vous constaterez que cette fonction modifie la chaîne de caractère “resultat” passée en argument ! De fait, le symbole “&” indique que “resultat” est passé par référence. Vous verrez les détails au second semestre.
Attention ! Vous remarquez que le fichier csv contient deux colonnes avec des nombres « Nombre prénoms déclarés » et « Nombre total cumule par annee ». Ces nombres sont les mêmes presque tout le temps (mais pas tout le temps !) et surtout on comprend mal à quoi correspond la différence. On se basera sur le nombre en dernière colonne pour nos calculs. Vous voyez ainsi que les données réelles sont rarement parfaites et parfaitement formatées !
À l’aide de la fonction
getline
, implanter le programmeprenoms-csv.cpp
et qui fait le même calcul queprenoms.cpp
mais à partir du fichier CSV.Remarque : pour vos tests et le debuggage, vous pouvez utiliser le fichier
donnees/donnees-test.csv
qui utilise le même format mais avec moins de données.
Exercice 8 : généralisation
L’objectif de cet exercice est d’ajouter à notre bibliothèque des
fonctionnalités génériques pour les fichiers CSV. On implantera les
fonctions dans tableau-lecture-csv.cpp
. Des tests sont fournis dans
tableau-lecture-csv-test.cpp
Complétez la fonction
litTableauCSV(string nom_fichier, int nb_colonnes)
du fichiertableau-lecture-csv.cpp
dont la documentation est donnée danstableau-lecture-csv.hpp
et lancez les tests correspondant danstableau-lecture-csv-test.cpp
Si vous êtes vraiment bloqués, vous pouvez copier-coller l’implantation fournie dans le fichier
en_cas_d_urgence_briser_la_glace.cpp
. On vous demandera tout de même de savoir expliquer comment elle marche!\(\clubsuit\) Même chose, mais sans avoir besoin de spécifier le nombre de colonnes