Wenn Künstliche Intelligenz „zufällig“ denkt: Warum bei KI-Modellen so oft die Zahl 27 gewählt wird

Ein kleines Experiment mit großer Aussagekraft

Ein aktueller viraler Post in der KI-Community zeigt eine scheinbar banale, aber tiefgründige Beobachtung: Fünf verschiedene Sprachmodelle – darunter GPT, Claude und andere – wurden unabhängig voneinander gebeten, eine zufällige Zahl zwischen 1 und 50 zu nennen. Alle antworteten mit „27“. Was auf den ersten Blick wie ein merkwürdiger Zufall wirken mag, entpuppt sich bei genauerem Hinsehen als Symptom einer grundlegenden Eigenschaft generativer Sprachmodelle: Sie erzeugen keine echte Zufälligkeit. Vielmehr spiegeln sie die statistischen Strukturen ihrer Trainingsdaten wider – und darin scheint die Zahl 27 eine auffällige Rolle zu spielen.

Sprachmodelle und die Illusion von Zufall

Große Sprachmodelle wie GPT-4 oder Claude wurden auf riesigen Mengen an Textdaten aus dem Internet trainiert. Dabei haben sie gelernt, auf Basis von Wahrscheinlichkeiten vorherzusagen, welches Wort oder Token am wahrscheinlichsten als nächstes folgt. Wird eine offene Frage wie „Wähle eine Zahl zwischen 1 und 50“ gestellt, greifen die Modelle auf Muster zurück, die sie häufig gesehen haben. Und im Internet scheint „27“ besonders oft als vermeintlich „zufällige“ Zahl genannt zu werden. Dieses Muster wird vom Modell übernommen und spiegelt sich in den Antworten wider. Es ist keine bewusste Entscheidung, sondern das Resultat von Wahrscheinlichkeitsverteilungen, die aus den Trainingsdaten gelernt wurden.

Warum gerade die 27?

Die Beliebtheit der Zahl 27 ist kein reiner Zufall. Zahlreiche psychologische Studien zeigen, dass Menschen bestimmte Zahlen – insbesondere ungerade Zahlen zwischen 20 und 30 – als besonders „zufällig“ empfinden. In Foren, Quizshows und Spielen wird die 27 häufig genannt, wenn es darum geht, eine willkürliche Zahl auszuwählen. In der Welt der Tokenisierung, also der Art und Weise, wie Sprachmodelle Texte in mathematisch verarbeitbare Einheiten zerlegen, ist „27“ oft ein einzelnes, gut verarbeitetes Token. Das macht es für ein Sprachmodell effizienter und attraktiver, diese Zahl zu wählen – eine Kombination aus Datenhäufigkeit und technischer Optimierung.

Die Konsequenzen für den Einsatz generativer KI

Was bedeutet dieses Verhalten für den praktischen Einsatz generativer KI? Wer KI-Modelle „out of the box“ nutzt, ohne eigene Daten, Finetuning oder gezielte Kontextvorgaben, wird oft mit generischen Ergebnissen konfrontiert – eben weil das Modell auf durchschnittliche Muster zurückgreift. In kreativen oder kritischen Anwendungen, etwa in der Textgenerierung, im Design oder in der Entscheidungsunterstützung, kann das zu vorhersehbaren, wenig differenzierten Resultaten führen. Es ist daher wichtig, dass Anwender ein Verständnis dafür entwickeln, wie Sprachmodelle zu ihren Antworten gelangen – und wie man durch Prompt-Design oder Parameteranpassungen gezielt beeinflussen kann, welche Arten von Ausgaben erzeugt werden.

Zwischen Durchschnitt und Vielfalt: Die Bedeutung von Kontext

Die „27er“-Frage zeigt eindrucksvoll, wie eng Sprachmodelle mit den gelernten Mustern des Internets verknüpft sind. Ohne zusätzlichen Kontext reproduzieren sie das, was sie am häufigsten gesehen haben. Wer Vielfalt, Individualität oder echte Kreativität erwartet, muss diese gezielt einbauen – etwa durch fein abgestimmte Prompts, gezielte Temperature- und Top-p-Einstellungen oder durch die Integration eigener, domänenspezifischer Daten. Die Herausforderung besteht darin, die deterministische Natur der Modelle zu verstehen und dennoch kreative Nutzungsmöglichkeiten zu schaffen.

Fazit: Kein Fehler, sondern ein Spiegel menschlicher Muster

Dass KI-Modelle auffällig häufig die Zahl 27 nennen, ist weder Zufall noch Fehlfunktion. Es ist ein Spiegel unseres kollektiven digitalen Verhaltens – und ein deutliches Zeichen dafür, wie eng maschinelles Lernen mit menschlichen Kommunikationsgewohnheiten verknüpft ist. Wer generative KI effektiv einsetzen will, sollte diese Muster nicht nur erkennen, sondern auch gezielt durchbrechen können. Denn Innovation entsteht nicht im Durchschnitt, sondern durch differenziertes Verständnis und gezielte Gestaltung.

Zurück
Zurück

Vom scheinbar simplen Trick zur strategischen Perspektive

Weiter
Weiter

ENLIL: Zwischen Verkehrsfluss und Datenstrom – Eine neue Schnittstelle für urbane Intelligenz