SEO

LLM-Spuren in der Google Search Console: Workflows für KI-Signale

Oskar Eder / 15. Juli 2025

Smart-Lemon-Maskottchen jagt mit Lupe leuchtende KI-Footprints im Serverraum, kleine KI-Roboter schauen zu; oben steht „Google Search Console“.
  • Home
  • Blog
  • LLM-Spuren in der Google Search Console: Workflows für KI-Signale

Sind Large-Language-Models (LLMs) und Google AI Overviews (AIO) in der Google Search Console (GSC) trackbar? Grundsätzlich nicht so einfach, aber es lassen sich über Umwege zumindest Spuren nachweisen. Mit diesem Beitrag zeigen wir die eine Reihe kompakter Workflows für die GSC und BigQuery, die du zur Erkennung und Analyse nutzen kannst.

Diesen Inhalt mit KI-Tools zusammenfassen

ChatGPTPerplexityClaude

TL;DR

  • Long-Tail-Queries erkennen: ≥ 12-Wort-Queries decken häufig LLM-Prompts oder Voice-Flows auf. Für BigQuery auch als Fallback ohne Regex.
  • Entitäten per Klammer clustern: ( ) / [ ] signalisieren Kontexte, die LLMs kombinieren müssen.
  • Steuer-Prompts sichtbar machen: Phrasen wie „be sure to reply in …“ verraten LLM-interne Befehle.
  • Business-bezogene Keywords und Muster können ebenfalls Aufschluss bringen.

Wer oder was genau stellt diese Anfragen?

Das lässt sich zumindest aus diesen Daten nicht genau ableiten. ChatGPT wird es sehr wahrscheinlich nicht sein, denn dieses LLM greift bekanntlich auf die Bing-Websuche zurück. Wobei, diese Aussage ist nicht in Stein gemeißelt. So haben in den vergangenen Tagen einige SEO-Kollegen berichtet, dass ChatGPT für einige Suchanfragen auf die Google-Suche zugegriffen habe. Das ist sicherlich auch im Kontext der Abschaltung der Bing Web Search API ab dem 11. August 2025 und der Ankündigung eines eigenen OpenAI-Browsers zu lesen. Ob und wann hier dann aber Änderungen seitens OpenAI greifen, können wir nur spekulieren.

Vor diesem Hintergrund liegt der Verdacht nahe, dass es Google Gemini oder die AI Overviews sind. Falls du Nutzer/Klicks aus Indien oder den USA hast, kann es auch der AI Mode (siehe SEO-Newsletter #133) sein. Oder es sind KI-Agenten, die ganze Tasks automatisieren. Insofern lohnt sich auch ein Blick in Google Analytics, um zu schauen, welche KI–Crawler und Bots (hauptsächlich) Traffic auf deine Seite schicken. Gegebenenfalls lassen sich hier Muster erkennen – ein wichtiger Schritt, um LLMs und SEO strategisch zusammenzudenken und die Wechselwirkungen zwischen Suchsystemen und Content gezielt zu analysieren.

1) Long-Tail-Queries (≥ 12 Wörter)

Ziel: Wir möchten alle Suchanfragen herausfiltern, die mindestens zwölf Wort-Tokens enthalten. Dort verstecken sich einerseits sehr spezifische Nutzerfragen, andererseits typische Prompt-Fragmente, mit denen LLMs Google füttern. 

Vorgehen: Ein Regex zählt Wortgrenzen (\b) und selektiert alles ab fünf Tokens. Anschließend sortieren wir nach Impressions, um sofort zu sehen, wo das Volumen sitzt. 

Ergebnis: Du erhältst eine Liste langer Anfragen samt Klick-, CTR- und Positionsdaten. Perfekt, um Content-Lücken im Long-Tail aufzuspüren oder plötzliche LLM-Spuren zu erkennen.

Tipp: Die Zahl am Ende bestimmt die Wortzahl. Probiere verschiedene Werte aus. Da die LLM-Anfragen normalerweise sehr lang sind, kannst du die Zahl höher oder niedriger setzen.

Regex für die Google Search Console

In der Google Search Console kannst du dafür folgenden Regex-Filter nutzen.
				
					(\b\w+\b[\s,.!?]*){12,}
				
			
Testweise kannst du auch statt auf die Wort- auf die Zeichenzahl gehen, wie hier im vorliegenden Beispiel (mindestens 100 Zeichen):
				
					^(?i)[\w\W\s\S]{100,}$
				
			

SQL für BigQuery

Hast du deine Google Search Console (GSC) mit BigQuery verbunden, liefert folgende SQL-Vorlage das gewünschte Ergebnis, kann aber natürlich auf eine deutliche größere Datenmenge zugreifen. SQL
				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM   `projekt.dataset.searchdata_site_impression`
WHERE  REGEXP_CONTAINS(
          LOWER(query),
          r'(\b\w+\b[\s,.!?]*){12,}'
       )
ORDER  BY impressions DESC;

				
			

2) Entitäten in Klammern – semantische Goldgrube

Ziel: Aufdecken, welche Zusatzbegriffe Google per runden oder eckigen Klammern an die Query hängt. Oft sind das Synonyme, Varianten oder konkrete Spezifikationen.

Vorgehen in BigQuery: Zuerst filtern wir alle Zeilen, die überhaupt Klammern enthalten. Dann extrahieren wir den Klammer-Inhalt mit REGEXP_EXTRACT und packen ihn in eine neue Spalte entity. Ein COALESCE sorgt dafür, dass runde und eckige Klammern in derselben Spalte landen.

Ergebnis: Du bekommst eine Tabelle mit Original-Query und sauber isolierter Entität. Daraus lässt sich schnell ablesen, welche Kategorien, Varianten oder Synonyme Google verknüpft. Hier findest du sicherlich genügend Material für Schema-Markup und ggf. auch Prompt-Vorlagen.

Regex-Regel für Google Search Console

				
					[\[\(][^\[\]\(\)]+[\]\)]
				
			

SQL für BigQuery

Variante 1:

				
					WITH raw AS (
  SELECT *
  FROM   `projekt.dataset.searchdata_site_impression`
  WHERE  REGEXP_CONTAINS(query, r'\(|\[')
)
SELECT
  query,
  COALESCE(
    REGEXP_EXTRACT(query, r'\(([^)]+)\)'),
    REGEXP_EXTRACT(query, r'\[([^\]]+)\]')
  ) AS entity,
  clicks,
  impressions,
  sum_top_position
FROM raw
ORDER BY impressions DESC;

				
			

Variante 2: Plan B – Wortzählung ohne Regex

Ziel: Wie in Variante 1, aber ohne Regex-Engine. Gerade bei sehr umfangreichen Tabellen lässt sich dadurch die Performance erhöhen.
Vorgehen: Wir splitten die Query per Leerzeichen und zählen die Tokens mit ARRAY_LENGTH().
Ergebnis: fast identische Trefferbild wie der Regex-Ansatz, nur minimal ungenauer bei Sonderzeichen, dafür blitzschnell und perfekt für Near-Real-Time-Dashboards.

SQL

				
					SELECT
  query,
  clicks,
  impressions
FROM   `projekt.dataset.searchdata_site_impression`
WHERE  ARRAY_LENGTH(SPLIT(query, ' ')) >= 5;

				
			

3) „Be sure to reply in …“ – Googles Steuer-Prompts sicht­bar machen

Ziel: Zeilen finden, die nach internen Control-Phrasen klingen, zum Beispiel „be sure to reply in german“. Solche Fragmente tauchen nur im Bulk-Export auf und verraten Tests in Googles Answer-Pipeline.
Vorgehen: Wir suchen nach einem Punkt gefolgt von der englischen Instruktion „be sure to reply in <language>“. Groß-/Kleinschreibung nivellieren wir mit LOWER().
Ergebnis: Die Abfrage liefert eine Short-List möglicher Prompt-Leaks inklusive Leistungsmetriken. Mehrfache Vorkommen oder steigende Impressions deuten darauf hin, dass Google gerade neue LLM-Antworten austestet.
Tipp: Ggf. diese Vorgabe kombinieren mit Longtail-Queries, um eine noch genauere Filterung zu erreichen und probiere hier gerne auch deutschsprachige Varianten.

Regex-Regel für Google Search Console

				
					please|provide|reply|describe|description|be sure
				
			

SQL für BigQuery

				
					-- Combined SQL for detecting multiple AI-style request phrases in German
SELECT
  query,
  clicks,
  impressions
FROM   `projekt.dataset.searchdata_site_impression`
WHERE  REGEXP_CONTAINS(
          LOWER(query),
          r'\\.\\s*be sure to reply in\\s+[a-z]+'
          '|(please|provide|reply|describe|description|be sure)'
       );
				
			

4) Sprachmuster & Struktur

KI-Systeme wie Gemini, Chat GPT oder Perplexity folgen bei Suchanfragen klaren Mustern. Wer sie erkennt, kann LLM-Traffic gezielter identifizieren und analysieren.

Typische Struktur-Elemente

LLM-Queries sind oft systematisch aufgebaut – mit Phrasen wie zeitlichen Bezügen („last 24 months“, „since 2023“).

Regex-Regel für Google Search Console (englisch/deutsch)

				
					(last|past|recent|previous)\s\d+\s(months?|years?|quarters?)|since\s20(2[3-5])|(2024|2025)\s(updates?|trends?|developments?|changes?)
				
			
				
					(letzten?|vergangenen?|jüngsten?|vorherigen?)\s+\d+\s+(monate?n?|jahre?n?|quartale?n?)

				
			
				
					(seit|ab|zwischen|während)\s+(Januar|Februar|März|April|Mai|Juni|Juli|August|September|Oktober|November|Dezember)?\s*202[3-5]

				
			

SQL für BigQuery (englisch/deutsch)

				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(last|past|recent|previous)\s+\d+\s+(months?|years?|quarters?)|' ||
  r'(since|from|between|during)\s+(january|february|march|april|may|june|july|august|september|october|november|december)?\s*202[3-5]|' ||
  r'202[4-5]\s+(updates?|trends?|developments?|changes?)'
)
ORDER BY impressions DESC;
				
			
				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(letzten?|vergangenen?|jüngsten?|vorherigen?)\s+\d+\s+(monate?n?|jahre?n?|quartale?n?)|'  -- relatives Zeitintervall
  || r'(seit|ab|zwischen|während)\s+(januar|februar|märz|april|mai|juni|juli|august|september|oktober|november|dezember)?\s*202[3-5]'  -- absoluter Datumsbezug
)
ORDER BY impressions DESC;

				
			

Status-Checks sind ebenfalls möglich: „currently developing“, „latest updates“

Regex-Regel für Google Search Console (englisch/deutsch)

				
					currently\s(developing|working|planning|building|implementing)|(latest|current|ongoing|active)\s(projects?|initiatives?|developments?)
				
			
				
					(neueste?|aktuelle?|laufende?|aktive?)\s+.{0,20}\s+(projekte?|initiativen?|entwicklungen?)

				
			

SQL für BigQuery (englisch/deutsch)

				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'currently\s+(developing|working|planning|building|implementing)|' ||
  r'(latest|current|ongoing|active)\s+.{0,20}\s+(projects?|initiatives?|developments?)'
)
ORDER BY impressions DESC;
				
			
				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(neueste?|aktuelle?|laufende?|aktive?)\s+.{0,20}\s+(projekte?|initiativen?|entwicklungen?)'
)
ORDER BY impressions DESC;

				
			

Wie verhält es sich mit zukünftigen Themen? („roadmap“, „upcoming features“)

Regex-Regel für Google Search Console (englisch/deutsch)

				
					(roadmap|pipeline|upcoming|future|planned)\s(features?|releases?|products?)|(forecast|prediction|outlook|projection)\s20(2[4-6])
				
			
				
					(roadmap|pipeline|kommend[a-z]*|zukünftig[a-z]*|geplant[a-z]*)\s+.{0,20}\s+(funktionen?|veröffentlichungen?|produkte?)

				
			

SQL für BigQuery (englisch/deutsch)

				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(roadmap|pipeline|upcoming|future|planned)\s+.{0,20}\s+(features?|releases?|products?)|' ||
  r'(forecast|prediction|outlook|projection)\s+.{0,20}\s+202[4-6]'
)
ORDER BY impressions DESC;
				
			
				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(roadmap|pipeline|kommend[a-z]*|zukünft[a-z]*|geplant[a-z]*)\s+.{0,20}\s+(funktionen?|veröffentlichungen?|produkte?)'
)
ORDER BY impressions DESC;
				
			

Mitbewerber- bzw. Marktvergleiche sind mit Phrasen wie „market position“ oder „versus competitors“ machbar.

Regex-Regel für Google Search Console (englisch/deutsch)

				
					(competitor|competitive|market)\s(analysis|landscape|position|intelligence)|versus\s(competitors?|industry|market\sleaders?)
				
			
				
					(wettbewerbs?|markt|konkurrenz)\s+(analyse|landschaft|position|intelligenz)

				
			

SQL für BigQuery (englisch/deutsch)

				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(competitor|competitive|market)\s+(analysis|landscape|position|intelligence)|' ||
  r'versus\s+(competitors?|industry|market\s+leaders?)'
)
ORDER BY impressions DESC;
				
			

Auffällige Fachsprache

Viele Anfragen enthalten Business-Vokabular, das auf automatisierte Recherche hindeutet:

Regex-Regel für Google Search Console (englisch/deutsch)

				
					strategic\s(initiatives?|plans?|roadmap|direction|goals?)|cutting-edge\s(technology|features?|developments?|innovations?)|innovative\s(solutions?|approaches?|products?|services?)
				
			
				
					strategisch[a-z]*\s+(initiativen?|pläne?|fahrplan|richtung|ziele?)

				
			

SQL für BigQuery

				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(competitor|competitive|market)\s+(analysis|landscape|position|intelligence)|' ||
  r'versus\s+(competitors?|industry|market\s+leaders?)'
)
ORDER BY impressions DESC;
				
			
				
					SELECT
  query,
  clicks,
  impressions,
  ctr,
  position
FROM `projekt.dataset.searchdata_site_impression`
WHERE REGEXP_CONTAINS(
  LOWER(query),
  r'(wettbewerbs?|markt|konkurrenz)\s+(analyse|landschaft|position|intelligenz)'
)
ORDER BY impressions DESC;

				
			
Solche Muster – vor allem in Kombination mit langen Queries – sind starke Indikatoren für KI-basierten Traffic.

Was lässt sich aus diesen Daten ableiten?

Auf den Spuren von KI-getriebenen Systemen interessieren uns primär wiederkehrende Muster. 

  • Gibt es Queries, die immer gleich aufgebaut sind und nur einzelne Begriffe (Marke, Produkt, Namen) austauschen? 
  • Solche Suchanfragen weisen sehr wahrscheinlich so gut wie keine Klicks, aber dafür umso mehr Impressionen auf – ein typisches Bild für automatisierte Abfragen durch LLMs oder neue Formate wie AI Overviews.

Wichtig: Prinzipiell ist das keine komplett trennscharfe Analyse. Je nach Domain und Umfeld kann es natürlich auch sein, dass du Suchanfragen von „normalen“ Nutzern findest. Mit den zuvor skizzierten Workflows kannst du

  • besser sehen, wie Suchanfragen von LLMs aussehen,
  • welche Themen du bereits belegst,
  • welche URLs von Relevanz sind. Achte dabei besonders auf Differenzen gegenüber “normalen” Nutzer:innen: Gibt es eine URL, die insgesamt kaum Traffic bringt, aber über LLMs Sichtbarkeit erzeugt?

Dashboard für das Google Looker Studio

Als kleines Goodie für dich gibt es hier ein ergänzendes Looker-Studio-Dashboard, das die oben beschriebenen Regex-Regeln anwendet und dir entsprechende Daten liefert.

Wenn du ein eigenes Dashboard haben willst, meld dich gerne bei uns!

Fazit

Mit diesen Workflows identifizierst du Long-Tail-Trends, entknotest versteckte Entitäten, enttarnst Googles Steuer-Prompts und behältst LLM-Traffic im Blick. In BigQuery kannst du die Abfragen als Scheduled Queries aufsetzen, vergleiche Woche für Woche und du hast dein persönliches Radar für jede Veränderung im AI-Suchkosmos. Wenn du damit noch nicht gearbeitet hast, empfehlen wir unsere Anleitung zum GSC-Datenexport in BigQuery.

Ein Tipp zum SchlussProbiere unbedingt weitere Filter und Varianten aus – zum Beispiel auch deutschsprachige Regex-Varianten, um herauszufinden, ob sich damit zusätzliche Muster oder KI-Signale entdecken lassen. Für entsprechende Vorschläge und Formulierungen können ChatGPT & Co. ebenfalls gut behilflich sein!

Oskar Eder

Im Jahr 2023 das erste Mal etwas von SEO gehört - seit August 2024 Teil des SMART LEMON Teams. Als Werkstudent SEO kümmert sich Oskar um Analysen, Keyword-Recherchen und Onpage-Optimierungen im Bereich der Suchmaschinenoptimierung.

SMART LEMON Newsletter

Nichts mehr verpassen! Erhalten Sie aktuelle Infos rund um die Themen SEO, SEA, Web & Social Media.

menu-2