Wie misst man GEO-Erfolg? Neue Kennzahlen für das KI-Zeitalter

Solange Erfolg im Web hieß „auf Platz eins bei Google", war die Messung einfach: Rankings beobachten, Klicks zählen, fertig. Sobald KI-Antworten die Suche übernehmen, trägt diese Logik nicht mehr. Eine Seite kann häufig in KI-Antworten genannt werden und trotzdem kaum noch direkte Klicks bekommen, weil der Nutzer die Antwort schon gelesen hat. Wer GEO ernst nimmt, braucht andere Kennzahlen.

Warum das Keyword-Ranking an Aussagekraft verliert

Das Ranking misst eine Position in einer Liste. Wenn die Antwort aber über der Liste steht und aus mehreren Quellen zusammengesetzt ist, sagt die Position wenig darüber aus, ob ein Unternehmen sichtbar war. Dazu ein technisches Problem: Klassische Analyse-Skripte wie Google Analytics erfassen nur Menschen mit Browser, nicht die KI-Bots, die eine Seite crawlen, um daraus eine Antwort zu bauen. Ein Teil des relevanten Geschehens findet damit außerhalb der gewohnten Statistik statt.

Drei Kennzahlen, die im KI-Zeitalter zählen

Die Messung verschiebt sich von „Wo stehe ich?" zu „Werde ich genannt?". Drei Größen sind dafür brauchbar.

Erwähnungen in KI-Antworten. Die direkteste Frage: Taucht das Unternehmen auf, wenn man typische Kundenfragen in ChatGPT, Perplexity oder der Google AI Overview stellt? Das lässt sich nicht vollautomatisch und lückenlos erfassen, aber stichprobenartig prüfen — mit einer festen Liste relevanter Fragen, regelmäßig wiederholt.

Share of Model Voice. Aus dem Vergleich mit dem Wettbewerb entsteht ein Anteilswert: Bei wie vielen der geprüften Fragen wird das eigene Unternehmen genannt, bei wie vielen der Mitbewerber? Das ist kein exakter Marktanteil, sondern ein Richtungsindikator — aber einer, der über die Zeit eine Entwicklung zeigt.

Referral-Traffic aus KI-Quellen. Manche KI-Antworten verlinken die Quelle, und ein Teil der Nutzer klickt. Dieser Verweis-Traffic, etwa von chatgpt.com oder perplexity.ai, taucht in der Web-Statistik als eigene Quelle auf. Er ist heute oft klein, aber er wächst — und er zeigt, dass eine Nennung tatsächlich Besucher bringt.

Wer crawlt überhaupt? Der Blick ins Logfile

Bevor man Wirkung misst, lohnt der Blick darauf, ob die KI-Bots die Seite überhaupt besuchen. Diese Information steht nicht in Google Analytics, sondern im Server-Logfile: Dort hinterlässt jeder Zugriff eine Zeile, auch der von ChatGPTs oder Perplexitys Crawler. Wer die Logfiles auswertet, sieht, wie oft und welche Seiten die KI-Systeme tatsächlich lesen. Das ist die Vorstufe jeder Wirkungsmessung — denn was nicht gecrawlt wird, kann auch nicht zitiert werden.

Wie man die Frageliste aufbaut

Das Verfahren steht und fällt mit den Fragen, die man stellt. Brauchbar sind nicht die eigenen Wunsch-Suchbegriffe, sondern die Formulierungen, mit denen ein Kunde tatsächlich an eine KI herantritt — ganze Sätze statt Stichwörter. Statt „Steuerberater Karlsruhe" also „Welcher Steuerberater in Karlsruhe ist auf Ärzte spezialisiert?". Eine Liste von fünfzehn bis dreißig solcher Fragen, die das eigene Leistungsspektrum und die wichtigsten Zielgruppen abdeckt, genügt für den Anfang.

Entscheidend ist die Disziplin in der Wiederholung: dieselben Fragen, in festem Abstand, idealerweise im selben Wortlaut und mit dokumentiertem Ergebnis. Erst die Konstanz macht aus Einzelbeobachtungen einen Trend. Wer heute andere Fragen stellt als im Vormonat, misst nichts Vergleichbares. Ein einfaches Tabellenblatt — Frage, Datum, genannt ja/nein, welche Quelle — reicht dafür völlig aus.

Was die Logfile-Auswertung konkret zeigt

Im Server-Logfile geben sich die KI-Crawler über ihre Kennung zu erkennen. Zu den heute relevanten gehören GPTBot und OAI-SearchBot von OpenAI, ClaudeBot von Anthropic, PerplexityBot sowie Google-Extended, mit dem Google den Zugriff für seine KI-Produkte steuert. Eine Auswertung zeigt dreierlei: ob diese Bots die Seite überhaupt besuchen, wie häufig sie das tun und welche Bereiche sie bevorzugt lesen. Bleibt ein bestimmter Crawler ganz aus, lohnt der Blick auf die robots.txt und auf die Ladezeiten — ein Bot, der zu lange auf eine Antwort wartet, bricht ab.

Diese Auswertung lässt sich nicht mit einem fertigen Analytics-Dashboard erledigen, weil die gängigen Werkzeuge KI-Bots gar nicht erst erfassen. Sie erfordert einen Blick auf die rohen Logdaten — einmalig eingerichtet, danach regelmäßig wiederholbar. Der Aufwand ist überschaubar, der Erkenntnisgewinn handfest: Man sieht zum ersten Mal, wer die eigenen Inhalte für KI-Antworten ausliest.

Von der Kennzahl zur Entscheidung

Eine Zahl ist nur so viel wert wie die Entscheidung, die sie ermöglicht. Steigt der Anteil der Fragen, bei denen das Unternehmen genannt wird, war die Arbeit an Struktur und Inhalten richtig — und es lohnt, sie auf weitere Themen auszuweiten. Bleibt der Wert über Monate flach, obwohl regelmäßig publiziert wird, liegt das Problem selten an der Menge der Texte, sondern an ihrer Eigenständigkeit: Sie liefern der KI keinen Grund, gerade diese Quelle zu zitieren.

Sinnvoll wird die Messung deshalb erst im Zusammenspiel mit dem Geschäft. Ein gelegentlicher Abgleich mit den tatsächlichen Anfragen — kamen Kontakte, die das Unternehmen über eine KI-Empfehlung gefunden haben? — verbindet die weiche Kennzahl mit harter Wirkung. Beides zusammen genügt, um zu beurteilen, ob sich der Aufwand trägt, ohne ein aufwendiges Monitoring-System zu betreiben.

Die ehrliche Einordnung

Diese Kennzahlen sind jünger und unschärfer als ein Keyword-Ranking. Es gibt keinen etablierten Standard, kein Werkzeug, das alles sauber abbildet, und die KI-Systeme antworten nicht reproduzierbar — dieselbe Frage kann zweimal verschieden ausfallen. Wer hier exakte Prozentwerte verspricht, verspricht zu viel. Brauchbar sind die Größen trotzdem: nicht als Punktwert, sondern als Trend. Sofern man dieselben Fragen über Monate hinweg gleich stellt, wird sichtbar, ob die Sichtbarkeit in KI-Antworten steigt oder fällt.

Gern richten wir für Ihr Unternehmen ein einfaches, wiederholbares Messverfahren ein — von der Logfile-Auswertung bis zur Frageliste.

Quellen: Google Search Central (Crawling und Logfile-Grundlagen); allgemeine GEO-Messpraxis. Referral-Quellen je nach KI-Plattform.

Häufige Fragen

Kann ich GEO-Erfolg so exakt messen wie ein Google-Ranking?

Nein. Die KI-Antworten sind nicht reproduzierbar, es gibt keinen etablierten Standard. Die Kennzahlen taugen als Trend über die Zeit, nicht als exakter Punktwert.

Sehe ich KI-Bots in Google Analytics?

In der Regel nicht. Analytics erfasst Menschen mit Browser. Die KI-Crawler stehen im Server-Logfile — dort lässt sich auslesen, wer wann welche Seite besucht.

Lohnt sich der Aufwand für einen kleinen Betrieb?

Eine schlanke Variante reicht: eine feste Liste typischer Kundenfragen, monatlich geprüft, plus ein gelegentlicher Blick ins Logfile. Das zeigt die Richtung, ohne ein großes Monitoring aufzubauen.

Wie misst man GEO-Erfolg? Neue Kennzahlen für das KI-Zeitalter

Warum das Keyword-Ranking an Aussagekraft verliert

Drei Kennzahlen, die im KI-Zeitalter zählen

Wer crawlt überhaupt? Der Blick ins Logfile

Wie man die Frageliste aufbaut

Was die Logfile-Auswertung konkret zeigt

Von der Kennzahl zur Entscheidung

Die ehrliche Einordnung

Häufige Fragen

CloudWebDevs

GEO Part 2: Der DOM-Tree als API – Warum KI-Crawler Page-Builder hassen

Strukturierte Daten für Stellen- und Immobilienanzeigen: von Google for Jobs und KI-Suchen gefunden werden

Von ChatGPT empfohlen werden: GEO für kleine Betriebe und Mittelstand

Elektrobetrieb: Kunden digital erreichen — von der PV-Anfrage bis zum Notdienst