Unendlich viele Affen auf Twitter
Posted by Bastian • Wednesday, June 2. 2010 • Category: Aktuell: , i love my computerDas Infinite Monkey Theorem besagt ja, dass unendlich viele Affen mit unendlich vielen Schreibmaschinen irgendwann durch puren Zufall die Werke von Shakespeare nachschreiben würden. Würde auch klappen, nur leider hat der olle Shakespeare so manche Zeile an Text generiert weshalb es zwar irgendwann klappen würde, aber es dürften so manche Terajahrtausende ins Land ziehen bis das «by chance» klappt.
Einen Simulator der dieses Theorem relativ bequem an seinem Computer durchspielt gibt es schon online zu finden. Und wie man in einem Video sehen kann wurde das auch schon mit etwas weniger Affen und mit Tastaturen anstelle von Schreibmaschinen ausprobiert. Mit genauso sichtbar wenig Erfolg. Bis man also den kompletten Shakespeare zufällig getroffen hat können wir noch ein bisschen warten. Übrigens lässt sich dieses Theorem ganz wundervoll mit der Evolution in Verbindung (riesige, unwahrscheinliche Sprünge ./. graduelle Veränderungen) bringen.
Für Twitter gibt es ja schon jede Menge sinnvoller und sinnloser Bots. Aber einen der dieses Theorem nachspielt fehlt meines Wissens nach bislang. Deshalb habe ich mich heute morgen als Entspannung von der Bachelor-Arbeit mal kurz daran gesetzt so ein Ding zu schreiben. In der Theorie kann man natürlich auch alle Tweets vorformulieren und absetzen. Immerhin lassen sich in 140 Zeichen nur endliche Kombinationen von Zeichenfolgen unterbringen.
Doch auch das wird dauern. Der Bot arbeitet zur Vereinfachung mit 42 verschiedenen Zeichen (das Alphabet von A bis Z ohne Umlaute, die Ziffern von 0-9, verfeinert mit ein paar Satzzeichen). An jeder der 140 Stellen eines Tweets wählt der Bot eines der Zeichen aus.
Das macht in der Summe also 42^140 verschiedene Möglichkeiten in denen man die Zeichen anordnen kann. Zum Vergleich: Selbst wenn man bei unserem normalen Lotto die Kugeln zurücklegen würde (um eine Zahl mehrfach ziehen zu können) gäbe es “nur” 49^6 verschiedene, mögliche Kombinationen. Der Bot zieht allerdings nur alle 10 Minuten zufällig einen Tweet aus den 42^140 Möglichkeiten. Zum einen um Twitter nicht zu fluten und zum anderen um es noch halbwegs lesbar zu halten. Doch damit verzehnfacht sich auch gleichzeitig die benötigte Zeit.
Und dabei vernachlässigt man noch völlig das der twitter typing monkey auch durchaus mehrfach die genau gleiche Kombination ziehen kann. Es wird also noch dauern bis alle Kombinationen in der Timeline auftauchen. Falls ihr trotzdem dabei zuschauen wollt könnt ihr dem kleinen Äffchen folgen was, freundlicherweise auf einer Maschine von Jochen gehostet, an seinem Keyboard sitzt.



2 Comments
Gleichzeitig ist das Problem des «doppelt» ziehens zumindest für unsere Lebenszeit auch noch gar keins: Bei der zweiten Ziehung beträgt die Wahrscheinlichkeit einer Dublette nur 1/(42^140). Und selbst bei der 100.001 Ziehung eines Tweets rangiert die Wahrscheinlichkeit mit 100.000(42^140) noch ziemlich nahe gegen Null.
Zu einem Problem werden doppelte Ziehungen erst kurz vor «Ende», also wenn fast alle Kombinationen ausgereizt wurden. Aber keine Angst: Das werden du und ich nicht erleben. Und auch unsere Kinder und Enkel nicht. Vermutlich wird unsere Sonne auch erloschen sein bevor das problematisch wird.
Add Comment