SEO

Harmonic Centrality: Wie deine Web-Graph-Position deine KI-Sichtbarkeit beeinflusst

Oskar Eder / 17. März 2026

SEO-Zitrone im Detektivlook vor futuristischem Labor zur Harmonic-Centrality-Debatte.
  • Home
  • Blog
  • Harmonic Centrality: Wie deine Web-Graph-Position deine KI-Sichtbarkeit beeinflusst

Harmonic Centrality (HC) ist die Infrastrukturmetrik im GEO-Set. Stell dir das Web als Landkarte vor. PageRank sagt dir, wie viele Straßen zu einem Ort führen und wie wichtig diese Straßen sind. Harmonic Centrality (HC) beantwortet eine andere Frage: Wie zentral liegt dieser Ort? Wie viele andere Ziele kann er über wenige Abzweigungen erreichen? Diese Unterscheidung war für SEOs lange akademisch. Sie wird strategisch relevant, weil dieselbe Metrik, die Common Crawls Crawler steuert, mitbestimmt, welche Inhalte in KI-Trainingskorpora überrepräsentiert sind – und damit als Quelle bekannter werden.

Diesen Inhalt mit KI-Tools zusammenfassen

ChatGPTPerplexityClaude

TL;DR: Das Wichtigste zu Harmonic in Kürze

  • Harmonic Centrality (HC) misst, wie zentral eine Domain im Web-Graph vernetzt ist und damit, wie häufig Common Crawls Crawler sie für KI-Trainingsdaten archiviert.
  • 64 % der analysierten großen Sprachmodelle nutzen Common-Crawl-Daten. Hohe HC erhöht die Wahrscheinlichkeit, in diesen Datensätzen überrepräsentiert zu sein.
  • HC ist kein Google-Ranking-Signal und kein Zauberhebel, sondern eine messbare Infrastrukturmetrik, die Linkstrategie und technische Priorisierung mit einem neuen Blickwinkel versieht.

Was ist Harmonic Centrality? Definition und Abgrenzung zu PageRank

PageRank und Harmonic Centrality sehen oberflächlich ähnlich aus, messen aber grundlegend verschiedene Dinge. PageRank bewertet Autorität: Wie viele hochwertige Links zeigen auf eine Domain? HC bewertet Topologie: Wie nahe liegt eine Domain an allen anderen Knoten im Netzwerk? Vor diesem Hintergrund ist HC keine Weiterentwicklung von PageRank, sondern eine andere Perspektive auf Netzwerke. Wer beide Metriken verwechselt, zieht falsche strategische Schlüsse.

Eine Domain mit hoher HC ist gut vernetzt im Sinne von erreichbar: Sie kann viele andere Domains über wenige Link-Sprünge erreichen, und umgekehrt. Das macht sie zu einem Knotenpunkt, nicht unbedingt zu einer Autorität. HC wird für SEOs und GEO-Teams relevant, weil Common Crawl sie auswertet und aktiv einsetzt. CCBot (der Crawler der gleichnamigen Non-Profit-Organisation, die seit 2008 das Internet in großem Maßstab archiviert) nutzt HC als primäres Priorisierungssignal: Domains mit höherer HC werden häufiger gecrawlt.

Harmonic Centrality im Kontext: der strukturelle GEO-KPI

Harmonic Centrality wirkt eine Ebene unterhalb der anderen GEO-KPIs. Sie schafft die strukturelle Voraussetzung dafür, dass ein KI-Modell eine Domain in seinen Trainingsdaten kennt, bevor es die erste Anfrage verarbeitet. Die anderen fünf KPIs messen, was Modelle dann in ihren Antworten mit deiner Marke tun:

  • Detection Rate prüft, ob das Modell deine Marke auf direkte Nachfrage korrekt identifiziert. Eine Detection Rate von null mach talle weiteren KPI-Werte schwer interpretierbar. 
  • Visibility Percentage misst, in wie viel Prozent der Prompts deine Marke überhaupt auftaucht, unabhängig von Position oder Häufigkeit. 
  • Share of Model setzt deine Nennungen ins Verhältnis zur Gesamtzahl aller Markennennungen im Cluster und zeigt deine relative Wettbewerbsposition.
  • Citation Rate fragt, in wie vielen dieser Antworten deine Marke als klickbarer Link oder Fußnote ausgegeben wird. Das ist der entscheidende Faktor für Traffic aus KI-Antworten.
  • Sentiment Score bewertet, ob die KI deine Marke positiv empfiehlt, neutral erwähnt oder kritisch einordnet.
  • Wer alle fünf KPIs gemeinsam trackt und HC als strukturelle Grundlage versteht, hat ein vollständiges Lagebild der eigenen Generative Engine Optimization und die Grundlage, um Maßnahmen nicht nach Bauchgefühl, sondern nach Datenlage zu priorisieren.

Wie Harmonic Centrality deine KI-Sichtbarkeit beeinflusst: die Wirkungskette

Common Crawl ist kein Randsignal. Die Mozilla Foundation hat in ihrer Analyse „Training Data for the Price of a Sandwich“ bestätigt: 64 % der 47 untersuchten großen Sprachmodelle nutzen mindestens eine gefilterte Common-Crawl-Version. Für GPT-3 stammten über 80 % der Trainingstokens aus diesen Daten.  Daraus ergibt sich eine nachvollziehbare Kette: 

Hohe HC → CCBot priorisiert die Domain → häufigere Einträge in monatlichen Common-Crawl-Archiven → stärkere Repräsentation in KI-Trainingsdaten → höhere „Baseline Familiarity“ des Modells mit dieser Quelle. 

Baseline Familiarity bedeutet: Das Modell kennt die Domain aus dem Training, bevor es überhaupt eine Suchanfrage verarbeitet. Das ist kein Garant für Zitierungen, aber eine Voraussetzung für sie. Wer im Trainingsdatensatz schlicht nicht vorkommt, startet jede Retrieval-Anfrage mit einem strukturellen Nachteil. 

Das gilt allerdings nicht universell: Aktuelle KI-Plattformen wie ChatGPT nutzen neben dem Trainings-Weltwissen auch Live-Retrieval-Systeme (RAG). Für diese Echtzeit-Abfragen spielen Faktoren wie Aktualität, inhaltliche Relevanz und strukturierte Daten eine mindestens gleichwertige Rolle. Die HC ist damit ein Hebel für das on-model-Wissen des Modells, nicht für das Retrieval-Ergebnis.

Was Harmonic Centrality wirklich leistet: Korrelation oder Kausalität?

Domains, die im Common-Crawl-Web-Graph am höchsten ranken (Facebook, Google, YouTube, Wikipedia), gehören auch zu den am häufigsten von LLMs zitierten Quellen. Das klingt zunächst nach einem direkten Beweis, ist es aber nicht.

Brie Moreau hat in einer Untersuchung über zwei Millionen Zitierungen analysiert, was mit KI-Citation-Wahrscheinlichkeit korreliert. Das stärkste Signal ist klassisches Google-Ranking: Domains auf Position 1 haben eine Zitierwahrscheinlichkeit von rund 46–48 %, auf Position 10 sinkt sie auf etwa 19–20 %. HC erklärt die Spitzenreiter im Web-Graph nur teilweise. Dass Facebook oder Wikipedia häufig zitiert werden, liegt primär an ihrer genuinen Autorität und Bekanntheit, nicht daran, dass CCBot sie oft gecrawlt hat. Die Präsenz im Trainingsdatensatz wirkt als Verstärker, nicht als alleiniger Treiber. 

Für Teams, die GEO-Strategien aufbauen, bedeutet das: HC ist kein Shortcut. Wer glaubt, durch Links aus peripher vernetzten Quellen die HC-Werte sinnvoll zu verbessern, investiert in ein Signal mit unsicherem ROI. Wer hingegen gezielt Links aus zentral vernetzten Knotenpunkten aufbaut, kann die eigene Lage im Web-Graph strukturell verbessern. Ohne substanzielle Inhalte, klare Autorenschaft und technische Sauberkeit bleibt dieser Effekt marginal.

 

Harmonic Centrality im Wettbewerbsvergleich: ein Praxisbeispiel

Der CC Rank Checker (webgraph.metehan.ai) macht HC für beliebige Domains messbar und vergleichbar über fünf Zeitperioden von 2023 bis 2025. Das Tool indexiert die Top 10 Millionen Domains pro Zeitperiode aus dem Common-Crawl-Web-Graph mit aktuell rund 18,2 Millionen einzigartigen Domains. Wer nicht gefunden wird, liegt außerhalb dieser Schwelle. Auf Basis dieser Daten ergibt sich für smartlemon.de folgendes Bild (Stand: aktuellste verfügbare Periode, Quelle: CC Rank Checker, webgraph.metehan.ai):

DomainHC ScorePR ScoreEinordnung
smartlemon.de~1.400.000~980.000Solide PR-Position, HC mit Luft nach oben
Wettbewerber A~820.000~1.100.000Besser vernetzt, schwächere PR-Autorität
Wettbewerber B~290.000~310.000Stark in beiden Dimensionen
Wettbewerber C~2.100.000~1.800.000Randposition im Web-Graph

Was diese Zahlen konkret bedeuten: SMART LEMON hat eine solide Autorität im klassischen Sinne (PageRank), ist aber im Netzwerk weniger zentral vernetzt als Wettbewerber B. Das deutet darauf hin, dass die Backlink-Strategie bisher Autorität priorisiert hat, die topologische Lage im Web-Graph aber noch Potenzial bietet.

Wettbewerber A zeigt das umgekehrte Profil: gut vernetzt, aber mit weniger eingehenden Links aus relevanten Quellen. Beide Profile können bei KI-Sichtbarkeit unterschiedlich wirken. So könnte Wettbewerber A zwar häufiger gecrawlt werden, SMART LEMON von den KI-Modellen aber als verlässlichere Quelle eingestuft werden. Die Kombination beider Signale ist das strategische Ziel.

Screenshot: smartlemon.de im CC Rank Checker

Screenshot: smartlemon.de im CC Rank Checker

  • HC messen und als Signal nutzen: Mini-Workflow

HC zu ignorieren, weil sie kein direktes Ranking-Signal ist, wäre genauso falsch wie sie als neuen PageRank zu behandeln. Sie ist ein messbarer Indikator für die topologische Lage im offenen Web und damit für Crawl-Frequenz und Trainingsdaten-Repräsentation.

  • Schritt 1 – Realitätscheck (5 Minuten): Den CC Rank Checker unter webgraph.metehan.ai aufrufen, die eigene Domain eingeben und HC Rank sowie PageRank für die aktuellste verfügbare Periode notieren. Das Tool indexiert die Top 10 Millionen Domains pro Zeitperiode aus dem Common-Crawl-Web-Graph mit aktuell rund 18,2 Millionen einzigartigen Domains. Wer nicht gefunden wird, liegt außerhalb dieser Schwelle.
  • Schritt 2 – Wettbewerbs-Benchmark: Fünf bis zehn direkte Wettbewerber in dasselbe Tool eingeben und die Werte vergleichen. Ausreißer identifizieren: Wer ist deutlich zentraler vernetzt? Über mehrere Perioden?
  • Schritt 3 – Backlink-Strategie anpassen: Die entscheidende Frage beim Linkaufbau lautet nicht mehr nur „Hat diese Domain Autorität?“, sondern zusätzlich: „Ist sie ein Hub im Netzwerk?“ Ein einzelner Link von einer zentral vernetzten Domain kann für die HC mehr bewegen als viele Links aus Randnetzwerken.
  • Schritt 4 – Technische Grundlage sichern: CCBot darf nicht per robots.txt blockiert sein. Wer das tut, reduziert die eigene Crawl-Frequenz aktiv – und damit die Archivpräsenz, die HC erst wirkungsvoll macht (Für die Analyse von Crawling, Indexierung und technischen Auffälligkeiten solltest du sonst auch die Google Search Console heranziehen – auch wenn sie primär Google-Traffic zeigt, liefert sie wertvolle Hinweise auf allgemeine Crawlability-Probleme, die sich ebenfalls auf CCBot auswirken können.).
  • Schritt 5 – Inhalte zitierfähig halten: HC ohne inhaltliche Substanz ist strukturelles Rauschen. Klare Kernaussagen in den ersten Textabsätzen, überprüfbare Fakten, saubere Autorenschaft und strukturierte Daten erhöhen die Wahrscheinlichkeit, dass ein gut gecrawlter Inhalt auch zitiert wird.

HC ist kein neues Google-Ranking-Signal und kein Zauberhebel oder eine eigene Strategie für KI-Sichtbarkeit. Sie ist ein messbarer Blick auf die eigene Lage im offenen Web-Graph und auf die Frage, wie attraktiv eine Domain für einen Crawler ist, dessen Daten in die Trainingspipelines der wichtigsten KI-Systeme fließen. Wer HC als Ergänzung zu klassischen Autoritätssignalen versteht, hat ein Instrument, das Linkstrategie und technische Priorisierung mit einem neuen Blickwinkel versieht.

Du willst wissen, wie zentral deine Domain im Web-Graph steht – und was das für deine KI-Sichtbarkeit bedeutet? Wir analysieren HC Rank und PageRank im Wettbewerbsvergleich und zeigen dir, wo topologische Lücken bestehen. Sprich uns an.

Häufige Fragen und Antworten zur Harmonic Centrality als mögliche KPI im GEO

Ist Harmonic Centrality ein offizielles Google-Ranking-Signal? 

Nein. HC ist eine Metrik aus dem Common-Crawl-Web-Graph, der unabhängig von Google betrieben wird. Google nutzt seinen eigenen PageRank und eine Vielzahl weiterer Signale. HC hat keine bestätigte direkte Wirkung auf Google-Rankings – ihr strategischer Wert liegt in der Verbindung zu Crawl-Priorisierung und KI-Trainingsdaten.

Wie unterscheidet sich HC von PageRank konkret?

PageRank fragt: Wie viele starke Links zeigen auf diese Domain? HC fragt: Wie kurz sind die Verbindungswege dieser Domain zu allen anderen Domains im Netzwerk? Eine Domain kann hohen PageRank und niedrige HC haben – und umgekehrt. Beide Metriken erfassen unterschiedliche Aspekte von Netzwerkposition.

Warum ist CCBot nicht zu blockieren, wenn man KI-Sichtbarkeit anstrebt?

CCBot ist der Crawler, der Domains für Common Crawls monatliche Archive erfasst. Wer CCBot blockiert, verhindert, dass die eigene Domain in diese Archive aufgenommen wird – und reduziert damit direkt die Wahrscheinlichkeit, in KI-Trainingsdatensätzen zu erscheinen, die auf Common Crawl basieren.

Wie oft sollte ich HC messen?

Common Crawl veröffentlicht monatlich neue Web-Graph-Daten; Metehan Yesilyurts Tool umfasst derzeit fünf Perioden von 2023 bis 2025. Quartalsweise Checks sind ein sinnvoller Rhythmus, um Trendveränderungen zu erkennen – insbesondere nach größeren Linkbuilding-Kampagnen oder nach dem Aufbau neuer Partnerpublikationen.

Oskar Eder
Werkstudent Online Marketing

Im Jahr 2023 das erste Mal etwas von SEO gehört - seit August 2024 Teil des SMART LEMON Teams. Als Werkstudent vorrangig im Bereich SEO & GEO kümmert sich Oskar um Analysen, Keyword-Recherchen und Onpage-Optimierungen im Bereich der Suchmaschinenoptimierung.

menu-2