Best-in-Universe und andere Daten von Clarity.ai vom März 2025
Basierend auf denselben Basisdaten können sehr unterschiedliche ESG-Scores berechnet werden. In der Praxis finden sich häufig relativ anspruchslose Best-in-Class-Ansätze. Mit einem Best-in-Universe-Ansatz lassen sich Nachhaltigkeitsunterschiede aber viel besser erkennen. SDG-Umsätze differenzieren nachhaltige Investments sogar noch stärker.
ESG-Ratings oder ESG-Scores?
ESG-Scores sind die beliebtesten Indikatoren, um die Nachhaltigkeit von Geldanlagen zu messen. Jeder kann solche Scores auf Basis von Umwelt-, Sozial- und Unternehmensführungsinformationen erstellen. ESG-Ratings sind ESG-Scores von Ratingagenturen. Im Folgenden nutze ich den Oberbegriff ESG-Score.
ESG-Scores werden oft kritisiert, weil sie sich je nach Berechner stark unterscheiden können (vergleiche z.B. diese neue OECD-Studie: Behind ESG ratings: Unpacking sustainability metrics). Die Gründe dafür sind Unterschiede in den verwendeten Daten und in den Methoden zur Aggregation der Daten. Einige Marktteilnehmer hoffen, dass die ESG-Scoring-Unterschiede mit dem geplanten Europäischen (ESG) Datenpool weitgehend verschwinden (vgl. Einrichtung eines European Single Access Points (ESAP)). Das erwarte ich nicht.
In diesem Beitrag zeige ich, dass selbst mit demselben ESG-Datenpool sehr unterschiedliche ESG-Scores gebildet werden können. Der besonders konsequente Best-in-Universe-Ansatz wird bisher aber nur sehr selten genutzt. Ich zeige auch, dass SDG-vereinbarer Umsatz eine wichtige aber ebenfalls kaum genutzte Ergänzungskennzahl für ESG-Scores ist.
Methodische Unterschiede von Best-in-Class-ESG-Scores
2012 haben wir damit begonnen, die Aktien mit den besten ESG-Scores unseres damaligen Datenanbieters auszuwählen. Aber viele der Unternehmen mit den besten ESG-Scores hielt ich nicht für besonders nachhaltig. Ein Grund: Die ESG-Scores basierten auf Vergleichen mit Unternehmen aus denselben Branchen, also einem Best-in-Class-Ansatz. Ich wollte aber keine relativ guten ökologischen Unternehmen aus ökologisch schlechten Branchen in meine Portfolios aufnehmen.
2020 habe ich Clarity.ai als Anbieter von Nachhaltigkeitsdaten ausgewählt. Ein wichtiger Grund war die Möglichkeit, individuelle ESG-Scores zu erstellen, insbesondere Best-in-Universe-Scores.
Unterscheidungsmerkmale unterschiedlicher ESG-Scores sind das Universum der Unternehmen, für die Scores berechnet werden, die ESG-Gewichtungsschemata und die Benchmarks für die relativen ESG-Scores.
Für diese Analyse nutze ich vier unterschiedliche ESG-Scores: Der „Normale Durchschnitt“ ESG-Score verwendet alle Unternehmen und alle Daten ohne spezifische ESG-Gewichtungsdifferenzierungen nach Branchen. Dieser Ansatz macht wenig Sinn und wird sehr selten genutzt.
Beim ESG-Score „Alle Unternehmen“ (Clarity.ai Bezeichnung) werden nur Unternehmen mit einer ESG-Datenrelevanz von mindestens 25 % verwendet und die Gewichtung erfolgt anhand eines sogenannten Branchenkonsens. Für den ESG-Score „Hohe Relevanz“ werden nur Unternehmen mit einer Datenrelevanz von mindestens 40 % zugelassen und es wird ebenfalls nach Branchenkonsens gewichtet. „Alle Unternehmen“ und „Hohe Relevanz“ sind Best-in-Class-Ansätze. Ich nutze einen maßgeschneiderten „Best-in-Universe“-Ansatz für alle Unternehmen mit mindestens 25 % Datenrelevanz sowie Branchenkonsensgewichtung.
Anders als bei manchen anderen Anbietern werden für die ESG-Scores nur nachhaltigkeitsrelevante Informationen berücksichtigt und keine Finanzkriterien. Scores von über 50 von 100 sind Indikatoren für relativ geringe ESG-Risiken.
Große Unterschiede zwischen aggregierten ESG-Bewertungen auf der Grundlage desselben Datenpools
Für den Vergleich der unterschiedlichen ESG-Scoring-Ansätze habe ich sechs Aktienindex-ETFs ausgewählt, die ich für die Performance-Einschätzung des von mir beratenen Investmentfonds nutze. Bei dem Fonds handelt es sich um einen globalen Small- und teilweise Mid-Cap-Aktienfonds mit SDG-Ausrichtung. Der Fonds ist hauptsächlich in Aktien des Gesundheitswesens und „grüne“ Aktien aus den Bereichen erneuerbare Energien und Industrie investiert.
Die scheinbar gute Nachricht zuerst: Methodenunabhängig weisen alle ausgewählten ETFs (Indizes) durchschnittliche aggregierte ESG-Scores von mindestens 54 von 100 auf (Siehe Abb. 1: Titelbild des Blogposts). Das deutet auf geringe ESG-Risiken hin (Siehe Abb. 1: Titelbild des Blogposts). Der All Countries World ETF hat sogar einen Score von mindestens 63.
Die Unterschiede zwischen den durchschnittlichen ESG-Bewertungen der Methoden reichen von 74 bis 62, was einer Differenz von fast 20 % entspricht (siehe Zeile „Average“ in Abbildung 1 oben). Beim New Energy ETF beträgt der Unterschied zwischen dem besten und dem schlechtesten ESG-Score 30 % (Spalte „Difference Best/Worst“).
Meiner Erfahrung nach sind ESG-Scores nicht normalverteilt sondern tendenziell besser als 50 von 100. Sehr niedrige und sehr hohe Scores sind äußerst selten. In einer kürzlich durchgeführten Analyse tausender Fonds habe ich keinen einzigen Fonds mit einem Best-in-Universe ESG-Score von über 72 gefunden (vgl. Hohe SDG Umsätze? Nur wenige Investmentfonds!).
Noch größere Unterschiede bei separaten E-, S- und G-Scores
In einer zusätzlichen Analyse habe ich die separierten E-, S- und G-Scores miteinander verglichen (vgl. Abb. 2). Bei der Best-in-Universe-Methode fallen die Sozial-Scores der Healthcare-, New Energy- und Small-Cap-ETFs unter 50. Mit 44 ist das Sozialrisiko von Small-Caps demnach relativ hoch, während es bei den beiden erstgenannten ESG-Scoringmethoden mit 66 bzw. 61 gering erscheint.
Abb. 2: Sozial-Scores ausgewählter Fonds

Während die verschiedenen Methoden bei den Governance-Scores nur um 5 % und bei den ökologischen Scores um 10 % voneinander abweichen (nicht aus den beiden Abbildungen ersichtlich), beträgt die Divergenz bei den sozialen Scores 36 % (s. Zeile bzw. Spalte „Difference Best/Worst“). Der Small-Cap-ETF weist mit 50% die größte Abweichung zwischen einem Normal Average S-Score von 66 und einem Best-in-Universe S-Score von 44 auf.
Und die Streuung der ESG-Bewertungen einzelner Aktien ist noch erheblich größer als die diversifizierter Indizes (vgl. Zeile „Difference Best/Worst“ in Abb. 3 und auch Glorreiche 7: Sind sie unsozial?).
Abb. 3: Sozial-Scores für die Aktien der sogenannten „Glorreichen 7“

Best-in-Universe-Scores sind am strengsten und differenzieren am meisten
Der Normal Average Score, aber auch die anderen Best-in-Class Scores, sind (viel) weniger streng als der Best-in-Universe Score (siehe Average in Abb. 1, 2 und 3).
Wenn einige Bewertungsmethoden zu systematisch (z. B. linear) höheren oder niedrigeren Werten als andere führen würden, könnten die Scores durch Auf- oder Abschläge leicht miteinander verglichen werden. Die Rangfolge der ESG-Scores der verschiedenen Indizes und Wertpapiere ist jedoch manchmal unterschiedlich: Der Small-Cap-ETF hat immer die niedrigste aggregierte ESG-Bewertung. Aber der Mid-Cap-ETF hat die beste ESG-Bewertung mit der Best-in-Class All Companies, nicht aber mit der Best-in-Class High Relevance oder der Best-in-Universe-Bewertung (vgl. Abb. 1). Die Nachhaltigkeits-Rangfolge der ETFs unterscheiden sich noch etwas mehr, wenn nur die E- oder S-Scores verglichen werden (vgl. Abb. 2).
Auch die Differenz zwischen den besten und den schlechtesten ESG-Scores der weniger strengen Index-Scoring-Ansätze liegt nur 18% auseinander, während sie beim Best-in-Universe-Scoring-Ansatz um 30% differiert. Die Differenz der Best-in-Universe E- und S-Scores steigt sogar auf über 40% (vgl. Abb. 2).
Fast alle Forscher und Praktiker scheinen Best-in-Class-Bewertungen zu verwenden. Ich bezweifle, dass viele Fachleute den sehr einfachen Ansatz des normalen Durchschnitts nutzen. Ich gehe davon aus, dass sie in der Regel einen weniger strengen „Alle Unternehmen“-Score verwenden und nicht den strengeren „Hohe Relevanz“-Ansatz, allerdings kenne ich keine Studien zur Nutzungshäufigkeit. In Veröffentlichungen finden sich zudem vor allem aggregierte ESG-Scores und viel seltener differenzierte E-, S- und G-Scores (ein frühes Beispiel dafür siehe Fetsun/Söhnholz: „A quantitative approach to responsible investment: Using ESG multifactor models to improve equity portfolios“ Veritas Investment Arbeitspapier, präsentiert auf der PRI Academic Network Conference in Montreal, 23. September 2014).
Warum SDG-Umsätze wichtiger als Best-in-Universe Scores sind
Um besonders nachhaltige Investments zu identifizieren, sind ESG-Scores unzureichend (vgl. 18 Dimensionen nachhaltiger Anlagepolitik – DVFA veröffentlicht grundlegend überarbeiteten Leitfaden und kostenfreies Tool zu verantwortungsvoller Anlagepolitik). Bisher gibt es aber keine umfassenden Nachhaltigkeitskennzahlen.
Neben guten ESG-Scores, also geringen ESG-Risiken, ist vielen Anlegern die Vermeidung unerwünschter Aktivitäten und der Grad nachhaltiger positiver Aktivitäten wichtig. Für den ersten Punkt habe ich eine umfassende Liste von „Exposures“ definiert und für die analysierten ETFs miteinander verglichen. Bei dieser Kennzahl schneidet der ESG-schlechteste Small-Cap ETF besser als andere genutzten ETFs ab (vgl. Abb. 1).
Mir ist eine möglichst gute Vereinbarkeit mit den Nachhaltigen Entwicklungszielen der Vereinten Nationen (SDG) besonders wichtig (vgl. 241203_Nachhaltigkeitsinvestmentpolitik_der_Soehnholz_Asset_Management_GmbH.pdf). Der Grund: Sehr viele Unternehmen mit hohen ESG-Scores bieten Produkte oder Dienstleistungen an, die ich nicht für ökologisch oder sozial vorteilhaft halte. Das gilt zum Beispiel für 6 der Glorreichen 7 (die typischerweise hohe aggregierte Best-in-Class ESG-Scores aufweisen).
Ursprünglich habe ich Aktien auf der Grundlage ihrer „reinen“ Ausrichtung auf Marktsegmente wie erneuerbare Energien und Gesundheitswesen ausgewählt. Inzwischen muss ich die SDG-Vereinbarkeit nicht mehr selbst einschätzen, da Claity.ai (und einige andere) jetzt aktivitätsbasierte Netto-SDG-Umsätze für viele Aktien bereitstellen (zur Definition dieser und anderer SDG-Metriken siehe SDG-Umsätze: Die wichtigste Nachhaltigkeitskennzahl).
Diese Kennzahl differenziert noch erheblich deutlicher zwischen besonders nachhaltigen (vgl. New Energy Abb. 1) und besonders wenig nachhaltigen (vgl. Small Caps) Investments als ESG-Scores.
Zwar gibt es – wie für ESG-Scores – auch mehrere SDG-Umsatz-Berechnungsmethoden (Aktivitäts- oder Entity-basiert, brutto- oder netto) mit sehr unterschiedlichen möglichen Ergebnissen, aber diese sind einfacher nachvollziehbar als die ESG-Methoden.
Fazit: Transparente und mehr (Best-in-Universe) Nachhaltigkeitsindikatoren verwenden
Anbieter und professionelle Nutzer von Nachhaltigkeitskennzahlen sollten klar begründen, welche sie verwenden. Darüber hinaus sollten Anleger darauf hingewiesen werden, dass einige der Wertpapiere sogenannter nachhaltiger Produkte möglicherweise hohe ESG-Risiken oder geringe SDG-vereinbare Umsätze ausweisen. Idealerweise werden separate E-, S- und G-Scores und SDG-Umsätze pro Wertpapier veröffentlicht. Auch potenziell kritische Aktivitäten sollten offengelegt werden.
Bisher habe ich nur sehr wenige Investmentanbieter gesehen, die dies tun.
Hinweis: Ich bin Berater des FutureVest Equity Sustainable Development Goals Fonds, Mitglied des DFVA Fachausschusses Impact und Kunde von Clarity.ai.
Meinen Offenlegungsansatz findet man unter https://futurevest.fund/ in den Rubriken „Fondspositionen“ mit ESG-Risiken und SDG-Erträgen, CO2-Informationen, Exposure-Informationen und Informationen zum Shareholder Engagement und dokumentiert in der „Nachhaltigkeitsinvestmentpolitik“.
Dieser Beitrag wurde zunächst in Englisch geschrieben und dann mit Hilfe der kostenlosen Version von DeepL.com übersetzt.