Cours 9: Impact de la science des données et du numérique sur notre société
Contenu
Cours 9: Impact de la science des données et du numérique sur notre société¶
Précédemment
Inititation à la science des données
Initiation à l’apprentissage statistique
Classification d’images
Cette semaine
Science et société: l’impact de la science des données et du numérique sur notre société (sources: shift project, ADEME et gouvernement)
Numérique : réseaux de communications + terminaux + data centers
Comment maximiser l’impact positif du numérique et de la science des données en minimisant son impact négatif ?
Une question en apparence inutile mais aussi insoluble
Contexte : le numérique dans notre société¶
Les énergies fossiles représentent 80% de la consommation d’énergie mondiale
Elles sont responsables d’une grande partie des émissions de gaz à effet de serre.
Ces émissions impactent notre climat et nos sociétés.
Le numérique consomme de l’énergie mais permet aussi d’en réduire la consommation en permettant une certaine optimisation
Impacts positifs¶
Le numérique pour limiter la consommation d’énergie¶
utilisation plus efficace des ressources
diminution des pertes (capteurs d’humidité,..)
Repose sur de l’analyse des données !
Développement économique et social¶
augmentation de la productivité des entreprises,
création d’emplois,
commerce mondialisé
Science ouverte et utilisation critique des données publiques¶

Prenons l’exemple des données publiques de data.gouv.fr, site développé depuis une dizaine d’années:
Ouverture des données: partage des données dont disposent les institutions (généralement, publiques, depuis la loi Cada 1978). Cela implique:
la gratuité,
des formats facilement traitables,
et réutilisables.
3 objectifs :
améliorer le fonctionnement démocratique (transparence, concertation);
améliorer l’efficacité de l’action publique;
intégration des données dans de nouveaux services à forte valeur ajoutée économique ou sociale.
Avantages :
simplification des systèmes d’informations par la création de nouvelles bases de données;
accès facilité par internet aux documents administratifs.
informations publiques réutilisables à d’autres fins que la mission de service public pour laquelle elles ont été produites ou reçues.
Impacts négatifs¶
Effet direct Le numérique consomme de l’éléctricité…
Effets indirects
Augmentation de l’utilisation des ressources informatiques par sa facilitation (smartphones vs. Nokia 3310)
Production de matériel informatique (métaux rares, pollution loin de la France)

Consommation énergétique¶
Etude de 2018 (projection à partir de cette date): 4 scénarios
Consommation électrique en 2017 : 21000 TWh (augmentation d’1,5%/an)
Observation : la part du numérique (DEC) a augmenté de 70% entre 2013 et 2020

Postes de consommation¶

Nombre de postes numériques par personne¶

Empreinte carbone des calculs numériques¶
L’ADEME (Agence de l’Environnement et de la Maîtrise de l’Energie, créée en 1991) propose des moyens de calculer l’empreinte carbone des parcs numériques dans le secteur privé et public.

Empreinte carbone: équivalent C02 qui prend en compte les différents gaz responsables du changement climatique.
Prend en compte chaque étape du cycle de vie des équipements en incluant le transport et l’utilisation.
Bien que le calcul soit critiqué, il donne un ordre de grandeur tout à fait pertinent.
Dans le secteur privé¶
Exemple d’estimation moyenne de l’empreinte carbone de l’accès à internet (au 01/01/2022):
Réseaux mobiles : 50 gCO2e/Go
Réseaux fixes : 3,95 kgCO2e/mois/abonné.
L’utilisation des réseaux fixes est à privilégier dès que possible.
Dans le monde de la recherche¶
Estimer la consommation énergétique d’un entrainement d’un réseau de neurones n’est pas chose facile.
Recherche active récente : exemple de calcul de vos émissions, ML CO2 Impact
Les émissions dépendent des infrastructures et de votre code.
Une thèse en apprentissage statistique émet plusieurs tonnes de CO2.
Prenons l’exemple d’une thèse 2018-2022, qui a émis 2,9 tonnes de CO2 (source : doctorat de Téo Sanchez, non encore publiée)

Ordre de grandeur et objectif des émissions en France

Et pour la suite ?¶
L2 : Introduction à la science des données
Cours assuré par Marc Evrard (MCU, LISN)
Apprentissage supervisé (classification + régression)
Apprentissage non supervisé
Evaluations (cross-validation par exemple)
Analyses statistiques (un peu plus de mathématiques même si ca restera léger)
TP = utiisation de
sklearn
.
Conclusions¶
Cours d’initiation:
Observation n’est pas interprétation (l’observation est toujours possible! normalement elle ne devrait pas poser de problème)
identifier la question précise à laquelle on souhaite répondre c’est déjà une large partie du travail en science des données
Notions d’apprentissage statistiques, classificateurs, langage python
Recul sur l’importance du numérique et des données dans notre société
Vous avez récupéré des images, les avez prétraitées, analysées leur composition et vous avez produit un classificateur en python. Auriez-vous pensé faire ca dès la L1 ? Bravo !