Le service numérique utilise-t-il une stratégie d’inférence optimisée en termes de consommation de ressources et des cibles utilisatrices ?
Version 2. Dernière mise à jour le
Objectif
Réduire l’empreinte environnementale des modèles algorithmiques utilisés dans le domaine de l’intelligence artificielle en optimisant le besoin en ressources de leur phase d’inférence. Ce critère est particulièrement important pour l’intelligence artificielle (IA) générative. Si la phase d’entraînement a longtemps été perçue comme la plus consommatrice en énergie, le développement de l’IA générative tend à accroître la part de consommation d’énergie de la phase d’inférence, du fait du nombre de requêtes utilisateurs pour les services massivement consommés par le grand public. L’optimisation de la phase d’inférence est nécessaire pour aboutir à des modèles d’intelligence artificielle plus frugaux.
Mise en œuvre
Définir une stratégie d’inférence qui minimise le besoin en ressources et répond strictement au besoin des cibles utilisatrices. Mettre en place des indicateurs de suivi de consommation d’énergie, besoin en ressources de calcul, nécessaires à la phase d’inférence. Ces métriques sont à analyser par rapport à la satisfaction des utilisateurs. Fixer des objectifs de minimisation de la consommation en ressources, en tenant compte du ratio entre ressources consommées et satisfaction des utilisateurs. S’assurer que la phase d’inférence permet d’optimiser le nombre de requêtes utilisateurs.
Utiliser des CPU, GPU ou des TPU efficaces, dont la localisation géographique est cohérente avec leurs activités et minimise l’empreinte environnementale (en particulier, dans un pays à l’intensité carbone la plus faible possible).
Moyen de test ou de contrôle
La stratégie d’inférence du service est adaptée aux cibles utilisatrices en minimisant les ressources nécessaires à son fonctionnement et les requêtes inutiles. Des indicateurs de suivi de consommation en ressources et de satisfaction des utilisateurs sont mis en place pour ajuster la phase d’inférence, avec pour objectif la frugalité du modèle sous-jacent au service.
Le critère est validé si le service numérique démontre dans sa déclaration d’écoconception la mise en place de principes d’écoconception dans sa phase d’inférence, adaptée aux besoins des utilisateurs.