Le service numérique limite-il la quantité de données utilisées pour la phase d’apprentissage au strict nécessaire ?

Version 2. Dernière mise à jour le

Algorithmie

Objectif

Il s’agit de s’interroger sur les données collectées et de minimiser les impacts environnementaux associés à leur collecte et à leur traitement pour la phase d’entraînement, en privilégiant des données existantes et en limitant la collecte de nouvelles données. Ce critère est pertinent pour la phase d’apprentissage, caractérisée le plus souvent par une forte obsolescence des bases de données utilisées.

Mise en œuvre

Veiller à réutiliser, si possible, des données existantes (notamment libres de droit) afin de limiter la collecte de nouvelles données et la puissance de calcul requise pour l’analyse incrémentielle de données. Questionner l’empreinte environnementale de l’acquisition de nouveau matériel de stockage contre celui du téléchargement systématique des données lorsque nécessaire.

Veiller à limiter la captation de nouvelles données pour la phase d’apprentissage.

Appliquer les critères 7.1 et 7.2 pour la mise en place de cache, de compression et de politique de gestion pour les données de la phase d’apprentissage.

Comme le souligne le rapport de la CNIL « Données, Empreinte et Libertés » (2023), certains impératifs de respect de la vie privée et objectifs d’écoconception se rejoignent.

Moyen de test ou de contrôle

Utiliser des bases de données existantes pour l’entraînement de son service numérique. Vérifier que la collecte de données est minimisée et mentionner les méthodes mises en œuvre dans la déclaration d’écoconception du service numérique.

Examiner également, la mise en place des critères 7.1 et 7.2 pour la mise en place de cache, de compression et de politique de gestion pour les données utilisées pour la phase d’apprentissage.

Le critère est validé si le service utilise, dès que cela est possible, des bases de données existantes et applique les critères 7.1 et 7.2 pour la phase d’apprentissage tout en documentant sa gestion de données, et l’inclusion des enjeux de sobriété, dans sa déclaration d’écoconception.