von Stephan Wohanka
In Das Blättchen 8/2014 zeigte ich, dass Big Data im Dienste der Politik diese „entpolitisiert“ und zusammen mit dem NSA-Skandal zur Bedrohung der bürgerlichen Demokratie und Freiheit wird. Ebenso gravierende Folgen wie für das politische kann Big Data für das wissenschaftliche System haben: Schon eine auf Details verzichtende wissenschaftstheoretische Analyse zeigt, dass die Datenflut einem neuen Herangehen an das „Komplexe“ den Weg bereitet, das einen Zuwachs kausalen Wissens in quasi allen Wissenschaften erwarten lässt.
Nicht nur sozialwirtschaftliche Forschungen leiden darunter, die Komplexität ihrer Gegenstände auch nicht durch Reduktion auf eine geringe Anzahl bestimmender Parameter und/oder mittels einfacher funktionaler Abhängigkeiten beherrschen zu können. Die „ceteris paribus-Klausel“ („unter gleichen Umständen“) in der Ökonomie ist dafür beredter Beweis! Ein ehrlicher Nobelpreisträger der Wirtschaftswissenschaften gab zu, sich „heroic simplifications“ zu bedienen. Dies ist nicht weiter verwunderlich, denn einer „inexakten“, das heißt chaotischen Welt – und das ist die soziale Welt – ist mit Exaktheit nicht beizukommen! Deshalb bewegen sich Sozialwissenschaften in einem grundsätzlichen Widerspruch und können in der Regel nur mehr oder weniger brauchbare Ergebnisse liefern, denn stets erwiesen sich die untersuchten Phänomene als zu komplex, zu stark kontextabhängig und kaum verallgemeinerbar. Den augenfälligsten Beweis für diese Überforderung liefert das Versagen der ökonomischen Zunft, die aktuelle Wirtschaftskrise vorausgesehen zu haben sowie klare und eindeutige Ratschläge zur Milderung ihrer Folgen geben zu können. Stattdessen sind wir Zeugen einer wissenschaftlichen „Krise“ mit erbittert geführten Scharmützeln zwischen neoliberalistischen bis hin zu vom Keynesianismus geprägten Schulen.
Big Data bedeutet nun zum einen einen Quantensprung in der Menge und Verfügbarkeit von Daten, zum anderen qualitativ neue Möglichkeiten im Bereich statistischer Methoden, so genannte nichtparametrische Ansätze. Nur diese sind den neuen Daten- und Informationsmengen überhaupt gewachsen; anders als die Werkzeuge des alten statistischen Paradigmas der Normalverteilung. So wird erstmals eine Wissenschaft unter epistemischen (erkenntnistheoretischen) Rahmenbedingungen möglich, die nicht mehr vom menschlichen Erkenntnisapparat abhängt und eben geschilderte Schwierigkeiten schlichtweg umgeht: Gewaltige Rechenkapazitäten, gekoppelt mit nahezu unbegrenzten Speichermöglichkeiten und einer weitverzweigten, internetgetriebenen Sensorik erlauben, die unterschiedlichsten Parameter miteinander zu korrelieren. Ein typisches Big-Data-Problem untersucht die Abhängigkeit einer oder mehrerer Variablen von einer großen Anzahl von Parametern oder Indikatoren mit dem Ziel, kausale Zusammenhänge aufzudecken. Dabei entsteht Kausalität durch Korrelationen („Korrelationen reichen aus“ – so Chris Anderson, US-amerikanischer Wissenschaftsjournalist und Unternehmer); und das entgegen tradierter Ansichten, wonach Korrelation nicht ausreicht, um Kausalitäten zu begründen. Algorithmen spüren in den riesigen Datengebirgen Muster auf, ohne auf eine vorherige oder spätere Einbindung in einen theoretischen Kontext angewiesen zu sein! Je mehr unter diesen Umständen über wissenschaftliche Zusammenhänge herausgefunden wird, desto weiter entfernt man sich von Modellen, Formeln, Theorien; sie erweisen sich häufig als zu vereinfachend; siehe oben.
In Informatikerkreisen spricht man schon seit einiger Zeit von einem neuen, vierten Wissenschaftsparadigma – neben (1) Theorie, (2) Experiment und (3) klassischer rechnergestützter Modellierung nun die (4) nummerische Simulation. Diese Einordnung geht auf den Turingpreisträger Jim Gray zurück: „Das neue Modell wissenschaftlicher Forschung ist, dass die Daten von Instrumenten aufgenommen oder von Simulationen erzeugt werden bevor sie von Software verarbeitet und die Ergebnisse als Information oder Wissen in Computern gespeichert werden. Wissenschaftler erhalten erst ziemlich spät einen Einblick in ihre Daten.“ Für die Untersuchungen respektive Forschungen werden jeweils die ursprünglichen (rohen) Daten bemüht. Eine Reduktion auf funktionale Zusammenhänge findet nicht mehr statt. Es entsteht ein Wissenschaftsparadigma ohne universelle Gleichungen und Formeln, ohne allgemeingültige Gesetze!
Craig Venter beispielsweise hat das so genannte Schrotschussverfahren zur Sequenzierung des Genoms entwickelt: Ultraschnelle Automaten sequenzieren ganze Ökosysteme und Supercomputer „berechnen“ die Datenmenge – ganz so wie das auch Google macht, um für Werbung und personalisierte Suche zu Ergebnissen zu gelangen. Venter fand so Tausende bisher unbekannte Arten von Bakterien und andere Lebensformen und hat die Biologie weiter vorangebracht als andere Forscher seiner Generation.
Venter ist trotzdem die Ausnahme, er ist Biologe. Zunehmend gewinnt ein neuer Typus von Forschern Einfluss auf die Entwicklung der Wissenschaften: Informatiker, Mathematiker und Statistiker. Sie bringen kaum wissenschaftliches Gespür für das jeweilige Fach mit, aber Erfahrung im Umgang mit großen Datensätzen und statistischen Analyseprogrammen. Ihnen gegenüber stehen konzeptionell anders denkende Geistes-, Sozial-, aber auch Naturwissenschaftler, die auf die „Googlesierung“ ihrer Wissenschaft nicht immer „amused“ reagieren und von den technologischen Fortgängen nur vage Vorstellungen haben.
Es lohnt, die weitere Entwicklung aufmerksam zu verfolgen! Digitale Medien veranlassen die Forscher auch, ihr Verhältnis zur Gesellschaft zu verändern – einmal verführen die Medien zu verstärkter Selbstvermarktung, zum anderen zu direkter, öffentlichkeitswirksamer Präsentation von Forschungsergebnissen. Um nur zwei Plattformen zu nennen: Science Slam und arXiv.org.
Schlagwörter: Big Data, Datenflut, digitale Medien, Stephan Wohanka