On a tous et toutes constaté l’explosion de l’usage de l’intelligence artificielle ces derniers mois, tant dans le cercle professionnel que personnel. Il n’y a plus un logiciel qui sort sans être “powered by AI”, et on a tous un·e ami·e qui répond avec plus d’assiduité à ChatGPT qu’aux messages qu’on lui envoie.
Cet essor s’accompagne évidemment de nombreuses voix qui alertent sur les dangers des intelligences artificielles : nos emplois vont-ils disparaitre ? les intelligences artificielles peuvent-elles nous manipuler avec de fausses informations ? ou encore quel est leur impact sur l’environnement ? Et c’est sur cette dernière question que l’on va s’arrêter. Cet article vise à évaluer l'influence de l'intelligence artificielle sur notre environnement. En d'autres termes, dans quelles mesures chaque requête sur ChatGPT contribue-t-elle à dégrader notre planète ?
Afin de garder cet article pratique et utilisable par chacun, j’ai choisi de ne garder dans la définition d’intelligence artificielle (IA) que celle de grands modèles de langage (Large Language Models ou LLM). Les LLM forment une sous-catégorie de ce qu’on appelle l’intelligence artificielle générative (Generative AI). L’IA générative se définit par la construction de modèles permettant de produire de la donnée similaire à la donnée sur laquelle elle a été entrainée. La sous-catégorie des LLM est celle des tâches liées au langage naturel1. Pour faire simple, on entraine une intelligence artificielle en lui faisant lire les six premiers livres Harry Potter, on lui demande ensuite de finir l’histoire par un dernier tome (c’est l’input ou le prompt), et elle nous produit un livre pour conclure la saga, livre qui sera cohérent parce qu’elle connait le début de l’histoire.
De l’autre côté de notre question, et toujours dans l‘objectif d’avoir quelque chose d’actionnable, je vous propose qu’on calque notre mesure de l’impact environnemental aux grandes lignes de l’analyse du cycle de vie (ACV ou Life Cycle Assessment LCA en anglais). L'ACV est une méthode qui évalue l'impact total d'un produit ou service, en tenant compte de toutes les étapes, de l'extraction des matières premières à la fin de vie, en passant par sa fabrication et son utilisation3. L'impact est mesuré en kilogrammes équivalent CO2 (CO2e), une unité qui convertit les émissions de gaz à effet de serre selon leur potentiel de réchauffement global sur 100 ans. Cela permet de d’accumuler et de comparer facilement les impacts des différents gaz4. Par exemple, une tonne de méthane émise par un élevage bovin équivaut à 28 tonnes de CO2e, car le méthane a un pouvoir de réchauffement 28 fois supérieur au CO2 sur une période de 100 ans5. Voici un tableau pour vous donner un ordre de grandeur du CO2e :
Produit | tonnes CO2e par an |
---|---|
Smartphone6 | 0,014 |
Jean coton | 0,025 |
Réfrigérateur de 250 litres | 0,031 |
Ordinateur portable | 0,042 |
Un humain en France en 20227 | 9,2 |
La France en 2022 | 623 millions |
En revanche cet article n’est pas une publication scientifique, et je ne pourrais faire de mesure précise de chacune des étapes de vie d’un LLM. L’idée est plutôt de suivre la méthode de l’ACV en condensant des écrits déjà produits et en convertissant les mesures estimées en CO2e. On va donc faire de grossières estimations et approximations. Les chiffres résultants de ces calculs doivent être pris avec beaucoup de sens critique.
Commençons quelque peu par simplifier le modèle en considérant que les LLM n’ont besoin que de data centers (centre de stockage informatique) et de puces électroniques pour fonctionner.
En parallèle d'une révolution logicielle, une révolution matérielle est en cours concernant les puces électroniques. L'IA repose sur des puces capables d'être 10 à 100 fois plus rapides qu'une puce traditionnelle8. La fabrication de ces puces est un des pôles majeurs d’impact sur l’environnement. En 2021, les émissions de la production de puces en Europe étaient comprises entre 10,7 et 13,7 millions de tonnes de CO2e9. On va extrapoler ce résultat en considérant que l’Europe représente 8% à 10% de la production mondiale de puces électroniques10. Donc, les émissions de la production de puces électroniques en 2021 pourraient être estimées entre 133,8 et 137 millions de tonnes de CO2e.
D’après une étude de Data411, les data centers européens produisent entre 405 et 625 tonnes de CO2e par mégawatt par an - en excluant la fabrication du matériel électronique. Pour vous donner un repère, la construction seule est responsable de 75 à 105 tonnes de CO2 par mégawatt d'infrastructure construite. En 2023, on estime que les data centers du monde ont consommé 40 000 mégawatt, on peut donc estimer l’impact des data center entre 16,2 millions et 25 millions de tonnes CO2e par an.
Mais il faut bien comprendre que ces data centers et ces puces ne sont pas à usage exclusif de l’intelligence artificielle. D’ailleurs, leur usage principal est plutôt celui d’applications classiques. Nous allons donc essayer de comprendre la part des LLM dans ce copieux gateau qui représente déjà entre 150 et 162 millions de tonnes de CO2e par an, soit l’équivalent des émissions de 17 millions de français par an.
Les chiffres présentés ci-dessus sont en constante augmentation12. Les intelligences artificielles contribuent à l'accroissement de notre consommation de ressources informatiques en raison de leur besoin très accru. Certains chercheurs estiment que l’IA représente déjà 10 à 20% de l’utilisation des data centers16. Explorons les raisons de cette consommation et déterminons quelle part elle représente.
Une étude révèle que GPT-3, avec ses 175 milliards de paramètres, a généré 552 tonnes de CO2e uniquement pour son entraînement, avant même sa publication13. GPT-4, doté de dix fois plus de paramètres14, aurait donc, en théorie, émis 5 552 tonnes de CO2e durant son entraînement. Toutefois, ce chiffre doit être nuancé en considérant les améliorations algorithmiques et les progrès des machines utilisées pour l'entraînement.
Par exemple, un modèle comme Bloom, avec 100 milliards de paramètres, a émis 39,4 tonnes de CO2e lors de son entraînement17. La diversité des facteurs influençant les émissions des modèles rend difficile la standardisation de leur mesure. Néanmoins, depuis 2021, au moins 33 modèles avec autant ou plus de paramètres que GPT-3 ont été développés, soit environ 8,25 modèles par an15.
Une estimation prudente suggère que l'entraînement annuel des LLM pourrait représenter 4 554 tonnes de CO2e (552 * 8,25), soit 0,02 % de l'utilisation totale des centres de données. Cette estimation rejoint celle faite par Carbon Direct18.
En 2022, Google estimait que 40 % des émissions liées à l'IA provenaient de l'entraînement des modèles, tandis que les 60 % restants étaient attribués à l'inférence, c'est-à-dire aux requêtes effectuées par les utilisateurs sur des plateformes comme ChatGPT19. Cependant, évaluer l'impact des recherches utilisant un LLM devient complexe, car il est nécessaire de comparer leurs émissions à celles des alternatives qu'elles remplacent. Par exemple, une recherche sur ChatGPT pourrait remplacer une recherche Google.
On sait qu’une recherche Google émet 0,2 grammes de CO2e20, et qu'une recherche ChatGPT en émet dix fois plus, soit 2 grammes de CO2e21. En 2024, Google a enregistré 14 milliards de recherches par jour, contre 37,5 millions pour ChatGPT22. Cela se traduit par 1,02 million de tonnes de CO2e pour Google contre 27 375 tonnes de CO2e pour ChatGPT, sur une base annuelle.
Cependant, Google intègre également de l'IA dans son moteur de recherche, et la majorité des logiciels font de même. Cette intégration généralisée complique l'évaluation précise de l'impact environnemental des requêtes sur les LLM, car il devient difficile de distinguer les émissions spécifiques attribuables à l'IA des autres composantes logicielles.
Faisons une pause. J'ai commencé cet article avec l'intention de mettre en lumière l'impact alarmant des IA sur l'environnement, mais je constate que les chiffres actuels ne sont pas aussi préoccupants que prévu. Cependant, il est évident que l'ensemble du secteur informatique doit adopter une approche plus sobre. La tendance actuelle pourrait devenir exponentielle, et dans dix ans, la situation pourrait être bien plus inquiétante. De plus, il est très difficile de mesurer précisément les émissions attribuables à l'IA, car elles sont souvent estimées de manière approximative. Cela dit, je me demande si l'IA ne pourrait pas, au contraire, offrir des solutions pour réduire notre impact environnemental.
En explorant les applications de l'intelligence artificielle au-delà des grands modèles de langage, on découvre rapidement son potentiel pour stimuler l'innovation, notamment dans le domaine environnemental. Un rapport de 2018, bien que daté, produit par PwC et le Stanford Woods Institute for the Environment, illustre plusieurs exemples d'impact positif22 :
Sans nécessairement chiffré ces initiatives, elles nous donnent des secteurs d’exploitation raisonnés de l’intelligence artificielle qui lui permettrait de combler son impact relativement néfaste sur l’environnement.
L’un des avantages de décortiquer l’empreinte environmental de l’intelligence artificielle est de pouvoir trouver des solutions concrètes pour répondre à chacun des points d’inquiétude. En voici une liste non-exhaustive.
J’aurais voulu conclure cet article en disant : “Voilà, votre prochaine recherche sur ChatGPT émettra 2 kg de CO2e.” Mais la réalité de l’impact environnemental des intelligences artificielles est bien plus complexe. Cet impact est enchevêtré avec notre usage actuel de l’informatique, et l’isoler dans son ensemble est une tâche que cet article écrit en quelques jours ne peut surmonter.
Je dois toutefois avouer ma surprise face à l’échelle des résultats présentés, que j’imaginais bien plus importants. Cependant, il faut analyser ces données avec intelligence et les considérer non pas comme un état figé, mais comme le début d’une révolution. Les quelques milliers de tonnes de CO2e émises par l’IA ne sont que la fumée d’un feu qui pourrait rapidement devenir incontrôlable.
Il existe toutefois des usages et des solutions qui peuvent nous permettre de garder la main et de continuer à utiliser l’IA comme un outil au bilan carbone favorable.
En attendant, si vous souhaiter prolonger la lecture avec un article plus technique et complet sur la durabilité des intelligences artificielles, je vous invite à consulter Towards Sustainability of AI: A Systematic Review of Existing Life Cycle Assessment Approaches and Key Environmental Impact Parameters of Artificial Intelligence
Et je ne peux que vous inviter à utiliser le calculateur de ecologits.ai - dont le travail est remarquable - qui vous permet d’avoir une idée de l’impact de vos discussions avec votre LLM préféré : https://huggingface.co/spaces/genai-impact/ecologits-calculator