Cours 9: Impact de la science des données et du numérique sur notre société


Fanny Pouyet
L1 Informatique
Janvier - Mai 2022

Précédemment

  • Inititation à la science des données

  • Initiation à l’apprentissage statistique

  • Classification d’images

Cette semaine

  • Science et société: l’impact de la science des données et du numérique sur notre société (sources: shift project, ADEME et gouvernement)

Numérique : réseaux de communications + terminaux + data centers

Comment maximiser l’impact positif du numérique et de la science des données en minimisant son impact négatif ?

Une question en apparence inutile mais aussi insoluble

Contexte : le numérique dans notre société

  • Les énergies fossiles représentent 80% de la consommation d’énergie mondiale

  • Elles sont responsables d’une grande partie des émissions de gaz à effet de serre.

  • Ces émissions impactent notre climat et nos sociétés.

  • Le numérique consomme de l’énergie mais permet aussi d’en réduire la consommation en permettant une certaine optimisation

Impacts positifs

Le numérique pour limiter la consommation d’énergie

  • utilisation plus efficace des ressources

  • diminution des pertes (capteurs d’humidité,..)

Repose sur de l’analyse des données !

Développement économique et social

  • augmentation de la productivité des entreprises,

  • création d’emplois,

  • commerce mondialisé

Science ouverte et utilisation critique des données publiques

source : https://www.gouvernement.fr/action/l-ouverture-des-donnees-publiques

Prenons l’exemple des données publiques de data.gouv.fr, site développé depuis une dizaine d’années:

Ouverture des données: partage des données dont disposent les institutions (généralement, publiques, depuis la loi Cada 1978). Cela implique:

  • la gratuité,

  • des formats facilement traitables,

  • et réutilisables.

3 objectifs :

  1. améliorer le fonctionnement démocratique (transparence, concertation);

  2. améliorer l’efficacité de l’action publique;

  3. intégration des données dans de nouveaux services à forte valeur ajoutée économique ou sociale.

Avantages :

  • simplification des systèmes d’informations par la création de nouvelles bases de données;

  • accès facilité par internet aux documents administratifs.

  • informations publiques réutilisables à d’autres fins que la mission de service public pour laquelle elles ont été produites ou reçues.

Impacts négatifs

Effet direct Le numérique consomme de l’éléctricité…

Effets indirects

  • Augmentation de l’utilisation des ressources informatiques par sa facilitation (smartphones vs. Nokia 3310)

  • Production de matériel informatique (métaux rares, pollution loin de la France)

Consommation énergétique

  • Etude de 2018 (projection à partir de cette date): 4 scénarios

  • Consommation électrique en 2017 : 21000 TWh (augmentation d’1,5%/an)

  • Observation : la part du numérique (DEC) a augmenté de 70% entre 2013 et 2020

Postes de consommation

Nombre de postes numériques par personne

Empreinte carbone des calculs numériques

L’ADEME (Agence de l’Environnement et de la Maîtrise de l’Energie, créée en 1991) propose des moyens de calculer l’empreinte carbone des parcs numériques dans le secteur privé et public.

source : https://expertises.ademe.fr
  • Empreinte carbone: équivalent C02 qui prend en compte les différents gaz responsables du changement climatique.

  • Prend en compte chaque étape du cycle de vie des équipements en incluant le transport et l’utilisation.

  • Bien que le calcul soit critiqué, il donne un ordre de grandeur tout à fait pertinent.

Dans le secteur privé

Exemple d’estimation moyenne de l’empreinte carbone de l’accès à internet (au 01/01/2022):

  • Réseaux mobiles : 50 gCO2e/Go

  • Réseaux fixes : 3,95 kgCO2e/mois/abonné.

  • L’utilisation des réseaux fixes est à privilégier dès que possible.

Dans le monde de la recherche

  • Estimer la consommation énergétique d’un entrainement d’un réseau de neurones n’est pas chose facile.

  • Recherche active récente : exemple de calcul de vos émissions, ML CO2 Impact

  • Les émissions dépendent des infrastructures et de votre code.

  • Une thèse en apprentissage statistique émet plusieurs tonnes de CO2.

  • Prenons l’exemple d’une thèse 2018-2022, qui a émis 2,9 tonnes de CO2 (source : doctorat de Téo Sanchez, non encore publiée)

Ordre de grandeur et objectif des émissions en France

Et pour la suite ?

L2 : Introduction à la science des données

  • Cours assuré par Marc Evrard (MCU, LISN)

  • Apprentissage supervisé (classification + régression)

  • Apprentissage non supervisé

  • Evaluations (cross-validation par exemple)

  • Analyses statistiques (un peu plus de mathématiques même si ca restera léger)

  • TP = utiisation de sklearn.

Conclusions

  • Cours d’initiation:

    • Observation n’est pas interprétation (l’observation est toujours possible! normalement elle ne devrait pas poser de problème)

    • identifier la question précise à laquelle on souhaite répondre c’est déjà une large partie du travail en science des données

    • Notions d’apprentissage statistiques, classificateurs, langage python

    • Recul sur l’importance du numérique et des données dans notre société

  • Vous avez récupéré des images, les avez prétraitées, analysées leur composition et vous avez produit un classificateur en python. Auriez-vous pensé faire ca dès la L1 ? Bravo !