Les classements ESG sous-estiment massivement les émissions de carbone

Les estimations d’émissions souffrent d’un biais de sélection qui sous-estime considérablement leur coût social, selon Olivier Scaillet, de l’Université de Genève.

Les classements des firmes en fonction de leur impact environnemental (le «E» de ESG), essentiellement basés sur les émissions de carbone, s’appuient sur des données erronées, selon une étude publiée par Cathy Yi-Hsuan Chen (Université de Glasgow), Abraham Lioui (EDHEC Business School) et Olivier Scaillet (Université de Genève et Swiss Finance Institute). Ce travail académique intitulé «Green Silence: Double machine learning carbon emissions under sample selection bias», publié en juillet 2025, ne manquera pas d’interroger les gérants de fonds de placement et les responsables des politiques économiques, en particulier environnementales. L’apport de cette étude à la recherche en finance souligne la qualité des travaux menés par le Geneva Finance Research Institute (GFRI) à Genève.

«Ce biais se traduit annuellement par des pertes fiscales de 2,6 milliards de dollars aux Etats-Unis».

Les auteurs attirent l’attention sur un biais de sélection considérable dans les estimations d’émissions de carbone des entreprises. Ce biais se traduit annuellement par des pertes fiscales de 2,6 milliards de dollars aux Etats-Unis et par une sous-estimation du coût social des émissions de plusieurs centaines de milliards de dollars.

Dans certains cas et certaines périodes, la sous-estimation des émissions atteint 30%, selon l’étude. Entre 2010 et 2023, elle s’élève à 1 gigatonne de CO2 (soit un milliard de tonnes), si bien que la sous-estimation par entreprise et par an correspond à 8'000 vols d’un Airbus A380 entre Heathrow et New York, indique Olivier Scaillet. L’étude se limite aux émissions de carbone, mais la sous-estimation pourrait s’étendre à d’autres variables environnementales. Olivier Scaillet, professeur de finance et de statistique à l’Université de Genève et co-auteur de l’étude, répond aux questions d’Allnews:

Quel est le message central de votre travail de recherche?

L’économie rencontre fréquemment ce qu’elle nomme le «sample selection bias», c’est-à-dire un biais de sélection de l’échantillon. Celui-ci s’opère pour de bonnes ou de mauvaises raisons. En m’intéressant aux émissions de CO2, j’ai été surpris par certaines études financières à ce sujet. En effet, lorsqu’une entreprise accepte de communiquer le volume de ses émissions de carbone, elle le fait pour de bonnes raisons: si elle est vertueuse, elle se plaira à présenter ses chiffres; si elle ne l’est pas, elle sera incitée à ne pas les révéler. On laisse alors les fournisseurs de données (data vendors) procéder aux estimations. Par conséquent, l’échantillon des firmes qui divulguent leurs émissions n’est pas aléatoire.

Qui sont ces fournisseurs de données?

Nous utilisons TruCost (S&P), mais il en existe de nombreux autres, comme MSCI ou Refinitiv. Ces sociétés vendent leurs données, lesquelles sont ensuite utilisées par les autorités et par l’industrie des fonds de placement pour établir le classement des firmes plus ou moins exposées à la transition énergétique. Les gérants d’actifs analysent leur portefeuille notamment à l’aune des émissions des entreprises afin de définir leur label. Un classement est ainsi établi. À notre avis, il existe une sous-estimation massive des émissions de carbone qui rend ces classements erronés. Nous le montrons notamment en utilisant l’indice de Jaccard, qui compare la similarité entre deux échantillons: le nôtre et celui des fournisseurs de données. Cet indice met en évidence une très faible similarité: des firmes sont classées comme vertueuses alors qu’elles ne le sont pas.

Comment expliquez-vous cet écart?

Nous ne connaissons pas le détail de la méthodologie des data vendors, mais elle est probablement relativement simple et repose sur des imputations naïves telles que la taille ou les ventes de la firme. Le proxy taille et le proxy ventes se transforment ainsi en proxy des émissions de carbone.

Ces variables sont beaucoup trop frustes à notre avis, si bien que la sous-estimation des émissions de CO2 est massive.

Combien de caractéristiques prenez-vous en compte?

Notre méthodologie est beaucoup plus avancée, car nous corrigeons ce biais de sélection de l’échantillon et utilisons – ce qui est nouveau – un modèle à haute dimension (high-dimensional setting). Plutôt que de reprendre un petit nombre de caractéristiques (taille et ventes), nous analysons 173 caractéristiques. Une imputation naïve avec une règle de trois (taille, ventes et émissions de CO2) ne fonctionne pas: elle ne dispose pas de la granularité nécessaire pour identifier les firmes qui divulguent leurs émissions avec une similarité suffisante avec celles qui ne les divulguent pas.

«Plutôt que de reprendre un petit nombre de caractéristiques (taille et ventes), nous analysons 173 caractéristiques».

Les résultats montrent la nécessité de ce modèle à haute dimension: sur les 173 caractéristiques, seules 30 sont inactives. Nous avons donc besoin empiriquement de l’information contenue dans 140 variables et non dans 3. Notre méthodologie sélectionne les bonnes variables avec une probabilité proche de 100%.

Le titre de votre étude parle de «double machine learning». De quoi s’agit-il?

Le double machine learning est une méthode statistique avancée que l’on peut résumer ainsi: lors de l’utilisation d’un modèle à haute dimensionnalité, comprenant un très grand nombre de variables explicatives, les estimations produisent un biais de régularisation. Un second biais apparaît en raison du très grand nombre de caractéristiques. Ce dernier est inévitable si l’on veut gérer la complexité du modèle liée à la multitude de variables utilisées. Cette complexité va de pair avec la finesse de la granularité. On sélectionne uniquement celles qui sont importantes, mais on en conserve un grand nombre. Le maintien de ce grand nombre de variables explicatives doit être intégré à la méthodologie statistique.

Pourquoi les fournisseurs de données se limitent-ils à l’emploi d’un minimum de caractéristiques?

Les fournisseurs de données utilisent des méthodes relativement simples parce qu’ils ne sont probablement pas des statisticiens ou économètres très avancés. Notre travail montre que ces méthodes trop simplistes conduisent à un énorme biais.

Que proposez-vous?

Deux remèdes sont possibles. Soit on continue d’accepter une publication des émissions sur base volontaire (Voluntary Disclosure), et notre méthodologie permet alors de pallier le problème des firmes qui ne divulguent pas leurs émissions. Soit le régulateur rend obligatoire la publication des émissions de CO2 des entreprises. Dans ce dernier cas, le biais de sélection disparaît naturellement puisqu’il n’y aurait plus d’émissions à estimer.

Les «bonnes entreprises», qui émettent peu de carbone, sont aujourd’hui incitées à publier leurs données; les autres, non. Une obligation de disclosure révélerait que ces dernières polluent davantage que ce que rapportent les fournisseurs de données.

Ne trouve-t-on pas dans les fonds ESG les entreprises qui publient leurs émissions, donc les entreprises vertueuses?

Peut-être, et c’est bien là le problème. Il existe deux populations d’entreprises: celles qui se révèlent elles-mêmes et celles qui ne le font pas. Pour cette dernière catégorie, les spécialistes utilisent les données publiées par les fournisseurs. Il existe donc des émissions de CO2 réelles et des émissions estimées. Les deux sont placées dans une seule population pour établir un classement. Or les données estimées provenant des fournisseurs ne sont pas fiables. Par conséquent, une entreprise vertueuse qui publie ses émissions peut se trouver lésée par une mauvaise estimation d’une entreprise qui ne les publie pas : cette dernière serait alors classée comme plus vertueuse alors qu’elle ne l’est pas. La conclusion est importante: l’estimation du degré ESG d’un fonds de placement repose sur des données incorrectes.

Pourquoi la concurrence ne fonctionne-t-elle pas entre les fournisseurs de données?

Elle fonctionne, mais plusieurs études montrent une forte corrélation entre leurs estimations. Ces vendeurs tendent à suivre le modèle des agences de notation obligataire: après quelques années, la corrélation de leurs notations est proche de 1. Ces classements deviennent alors non informatifs.

Le rôle de la recherche académique est de pointer ces incohérences. C’est ce qui a été fait pour les classements ESG. C’est ce que nous faisons avec les classements climatiques.

Est-ce que la situation s’améliore dans le temps?

Nous observons une amélioration progressive. La sous-estimation a diminué depuis 2010, car de plus en plus d’entreprises publient leurs émissions.

Que coûterait le changement de système?

Rien. Les estimations sont aisées. Il suffit d’employer notre code. Les firmes qui ne publient pas seraient alors évaluées à leur juste impact environnemental et n’auraient plus d’incitation à cacher leurs émissions. La transparence serait ainsi bienvenue pour encourager les entreprises à innover et à rendre leur chaîne de production plus propre.

Comment établissez-vous que les recettes fiscales sont réduites de 2,6 milliards de dollars aux Etats-Unis à la suite de la sous-estimation des émissions?

Il existe un marché où s’échangent les quotas d’émission. Ce marché permet d’obtenir un prix fiable pour une tonne de CO2. En multipliant ce prix par le volume de la sous-estimation, nous avons pu établir ce chiffre colossal.

Les émissions carboniques ont aussi un coût à long terme, que les économistes appellent le coût social du carbone. Ce dernier mesure les dégâts environnementaux d’une tonne de CO2 émise en plus sur plusieurs décennies. Nous montrons que, sur la période 2010–2023, la sous-estimation de ce coût atteint 560 milliards de dollars.

Cette sous-estimation résulte-t-elle d’une volonté politique?

Non, je ne le pense pas. Compte tenu des résultats de notre étude, il reste à voir s’il existera une volonté politique pour forcer les entreprises à passer d’un système volontaire à un système obligatoire de publication des émissions. Il appartiendra aux régulateurs et aux autorités politiques de se prononcer.

Pour les investisseurs, quelle est la conséquence de votre étude?

Si un investisseur cherche à placer son argent dans des fonds de placement «verts», donc avec un bon score ESG, nous montrons qu’en réalité il investit de manière erronée, car le score ESG du fonds repose sur des données fausses. L’investisseur croit que son fonds est «vert», alors qu’il ne l’est pas nécessairement.

Le gérant du fonds ESG en est-il conscient?

Non. Le sélectionneur de titres placés dans le fonds utilise les données fournies par les fournisseurs. Il établit son classement des entreprises supposées «vertes» sans prendre en compte la sous-estimation. Notre étude montre que le classement censé distinguer les bons et les mauvais élèves est biaisé.

Le gérant ne peut-il pas aussi s’appuyer sur les entreprises qui participent volontairement aux standards ESG développés ces dernières années?

Effectivement, il peut se limiter aux entreprises qui transmettent leurs données volontairement. Mais je ne crois pas que les fonds ESG n’investissent que dans les entreprises qui publient leurs émissions. D’ailleurs, ils ne devraient pas car ce serait la double peine pour les entreprises qui divulguent leurs émissions. Elles divulguent ce qui est déjà un effort stratégique et financier. Si en plus elles sont laissées de côté parce que d’autres semblent plus vertueuses, on risque de leur ôter les incitations à publier leurs émissions.

Les banques sont souvent critiquées pour leurs investissements et crédits qui ne respecteraient pas suffisamment les critères de durabilité. Votre méthodologie serait-elle utile dans ce cas?

Dans l’équation qui prédit les émissions de carbone, le facteur taille est souvent utilisé, mais notre méthodologie montre que la taille de l’entreprise n’est pas prédominante. D’autres caractéristiques importent davantage.

Quelles sont les principales caractéristiques?

Si la taille de l’entreprise ne joue pas un rôle significatif, les principaux facteurs qui déterminent le niveau des émissions sont: les perspectives de croissance de l’entreprise (intensité de la R&D), sa rentabilité, son activité d’investissement et sa structure de capital.

Notre étude souligne la nécessité de prendre en compte un très grand nombre de caractéristiques, ce qui renforce la pertinence du modèle à haute dimension.

Aujourd’hui, les perspectives de croissance les plus fortes viennent de l’intelligence artificielle. Les entreprises de ce secteur sont-elles visées?

C’est une autre question. Mais dans les débats sur l’IA et la finance, comme celui organisé par le GFRI il y a peu pour son 15^e anniversaire, il est apparu, à ma grande surprise, que personne n’évoquait la consommation d’énergie de l’IA.

On sait pourtant que l’IA est une grande consommatrice d’électricité. La volonté actuelle de développer le parc de véhicules électriques se heurte déjà aux contraintes de production d’électricité en Europe, mais ces estimations ne prennent pas en compte les besoins actuels et futurs de l’IA.

Si l’on évalue les profits futurs de l’IA, on sous-estime son coût. La concurrence sera de plus en plus forte entre, d’une part, la consommation d’électricité des véhicules électriques et, d’autre part, celle de l’IA. Le coût de l’électricité augmentera sans doute à long terme, à moins d’investir massivement dans toutes les sources disponibles.

Cet article est réservé aux investisseurs qualifiés