von Frank Ufen
Im Jahre 2010 hatte New York 8.175.000 Einwohner. Los Angeles war mit 3.793.000 Menschen die zweitgrößte Stadt der Vereinigten Staaten. Es folgten Chicago mit 2.696.000, Houston mit 2.100.000 und Philadelphia mit 1.526.000 Einwohnern. Zwischen den Einwohnerzahlen sämtlicher US-amerikanischen Städte besteht ein verblüffender statistischer Zusammenhang: Die zweitgrößte Stadt hat ungefähr halb so viele Einwohner wie New York, die drittgrößte Stadt hat etwa ein Drittel der Einwohnerzahl New Yorks, die viertgrößte Stadt etwa ein Viertel, die fünftgrößte etwa ein Fünftel, und so weiter bis zur kleinsten Stadt.
Zieht man zum Vergleich die Größenverhältnisse deutscher Städte heran, lassen sich ganz ähnliche statistische Regelmäßigkeiten feststellen. Im Jahre 1999 betrug die Einwohnerzahl von Berlin 3.341.000. Hamburg, die zweitgrößte Stadt, erreichte mit 1.705.000 Einwohnern ziemlich genau die Hälfte der Einwohnerzahl Berlins, München als die drittgrößte Stadt verfügte mit 1.195.000 Einwohnern über etwa ein Drittel, Köln mit 963.000 Einwohnern über ein Viertel und Frankfurt am Main mit 644.000 Einwohnern über ein Fünftel der Bevölkerung Berlins.
Dieser eindeutige statistische Zusammenhang zwischen dem Rangplatz einer Stadt und ihrer Einwohnerzahl bedeutet, dass die Bevölkerungsverteilung dem Zipfschen Gesetz gehorcht – das heißt, die Einwohnerzahl jeder Stadt verhält sich umgekehrt proportional zu ihrer Position in einer absteigenden Rangfolge. Das Zipfsche Gesetz ist nach dem amerikanischen Linguisten George Kingsley Zipf (1902-1950) benannt, einem der bedeutendsten Pioniere auf dem Gebiet der quantitativen Erforschung sprachlicher Phänomene. Zipf hat entdeckt, dass das in einer beliebigen indoeuropäischen Sprache (oder in irgendeinem Roman) am häufigsten gebrauchte Wort ungefähr doppelt so oft vorkommt wie das am zweithäufigsten verwendete, drei Mal so oft wie das am dritthäufigsten auftauchende und so weiter. Zipf hat außerdem herausgefunden, dass die Wörter einer Sprache, die in der Alltagskommunikation am häufigsten verwendet werden, in aller Regel auch die kürzesten und die ältesten sind.
Mittlerweile hat sich herausgestellt, dass es noch etliche andere gesellschaftliche, physikalische und biologische Phänomene gibt, die dem Zipfschen Gesetz unterworfen sind. Hierzu gehören beispielsweise die Verkaufszahlen einer ganzen Reihe von Gütern wie Bücher, DVDs, Schuhe oder Kinokarten, die Größe von Unternehmen, die Häufigkeitsverteilung von Website-Besuchen oder von Zitierungen wissenschaftlicher Aufsätze, die Verteilung der Vermögen und Einkommen, Fluktuationen auf Finanzmärkten, die Häufigkeitsverteilung von Waldbränden, Vulkanausbrüchen und Erdbeben oder die Art und Weise, wie genetische Informationen in Proteine übersetzt werden.
Die Sache hat allerdings einen Haken. Oft geht die Rechnung nicht glatt oder überhaupt nicht auf, wenn man das Zipfsche Gesetz anwendet. Das zeigt schon ein kurzer Blick auf die neueste Liste der größten Städte Deutschlands. Im Jahre 2013 hatte München plötzlich 1.408.000 Einwohner und war damit erheblich größer, als es das Zipfsche Gesetz voraussagt. Dasselbe gilt beispielsweise für Ulm, mit 119.000 Einwohnern die Nummer 61 auf der Liste. Völlig aus dem Rahmen fällt Österreich, wo es gegenwärtig 1.766.000 Wienerinnen und Wiener gibt, gefolgt von gerade einmal 270.000 Grazerinnen und Grazern. Und wenn es um die Größenordnungen der Städte in der Dritten Welt geht, funktioniert das Zipfsche Gesetz offenbar überhaupt nicht mehr.
Bislang ist erst teilweise geklärt, welche Mechanismen dem Zipfschen Gesetz zugrunde liegen und auf welche Umstände es zurückzuführen ist, wenn solche Regelmäßigkeiten immer wieder durchbrochen werden oder wenn sie ganz ausbleiben. Doch jetzt ist die Forschung einen großen Schritt vorangekommen. Kürzlich sind die Wiener Komplexitätsforscher Bernat Corominas-Murtra, Rudolf Hanel und Stefan Thurner durch Computersimulationen und Berechnungen zur Erkenntnis gekommen, dass das Zipfsche Gesetz universal gültig und immer dann am Werk ist, wenn man es mit komplexen Systemen zu tun hat, die sich ständig verändern und deren Entwicklung in hohem Maße von ihrer eigenen Vergangenheit determiniert wird. Die Wissenschaftler berichten darüber in der neuesten Ausgabe der Proceedings of the National Academy of Sciences.
Dass ein System von seiner eigenen Vergangenheit determiniert wird, bedeutet laut Corominas-Murtra, Hanel und Thurner im Wesentlichen, dass seine Aktionsspielräume desto mehr schrumpfen, je mehr Zeit schon vergangen ist. Solche geschichtsabhängigen Systeme würden einem Schriftsteller gleichen, der einen Roman schreibt. Ganz am Anfang kann er sich aus der Gesamtmenge der Wörter seiner Sprache irgendeines herauspicken. Doch danach werden seine Wahlmöglichkeiten durch die Regeln der Grammatik, die Handlungssituationen und das Eigenleben der Figuren immer weiter eingeschränkt. Dass es nicht selten zu erheblichen Abweichungen von den Werten kommt, die sich nach dem Zipfschen Gesetz eigentlich ergeben müssten, lässt sich auf zufällige Ereignisse und äußere Störfaktoren zurückführen.
„Das Faszinierende ist, dass wir zeigen konnten, dass auch diese zufälligen Störfaktoren beziehungsweise Überraschungen wiederum zu Gesetzmäßigkeiten führen, die dann genau die Abweichungen vom Zipfschen Gesetz erklären“, erklärt Stefan Thurner. Damit werde es erstmals möglich, nicht nur Dutzende Prozesse zu verstehen, die exakt dem Zipfschen Gesetz folgen, sondern auch Hunderte von Fällen, wo es sich um Abweichungen handelt. „Das macht es zum Beispiel jetzt möglich zu erklären, warum Internetserver ebenso nach einem zipfähnlichen Gesetz funktionieren wie Webpage-Besuche, Krankheitshäufigkeiten oder die Tonfolgen in der Musik.“ Thurner stellt weiter fest: „Das Zipfsche Gesetz ist seit etwa 80 Jahren Gegenstand der Forschung, und intellektuelle Größen wie unter anderem Benoit Mandelbrot, Herbert Simon oder Noam Chomsky, haben versucht, eine plausible Lösung dafür zu finden. Diese, denke ich, ist uns jetzt gelungen, die auf dem Beweis eines einfachen mathematischen Satzes aufbaut und daher universell gültig ist, und eben nicht nur das Zipfgesetz erklärt, sondern auch die Abweichungen davon, welche so oft beobachtet werden. Ein Anwendungsbereich könnte systemisches Risiko sein, dass man also das Verständnis jetzt nutzen kann, um Systeme zu bauen, die nicht auf das Zipfgesetz führen. Denn viele Systeme, die sich nach dem Zipfgesetz verhalten, sind relativ leicht verletzlich unter gezielten Angriffen. Ein Beispiel dazu ist das Internet. Wenn Sie wissen, welche Server Sie angreifen und damit stilllegen wollen, können Sie mit sehr wenigen Angriffen einen Großteil des Verkehrs lahmlegen.“
Schlagwörter: Frank Ufen, Komplexitätsforschung, Statistik, Stefan Thurner, Zipfsches Gesetz