Fünf Mythen über Big Data

Headerbild Big Data Big Dreams

In Zeiten des Hypes sind der Fantasie kaum Grenzen gesetzt. Doch jetzt kommt Big Data auf dem Boden der Tatsachen an. Die fünf größten Träume und warum sie geplatzt sind.

Big Data – Big Dreams

Der Begriff Big Data ist zwar in aller Munde, doch kaum einer weiß, was sich dahinter verbirgt. Laut dem aktuellen Digital-Index der Initiative D21 kann nur jeder fünfte Bundesbürger mit dem Begriff etwas anfangen. Definieren lässt sich Big Data am trefflichsten als automatisierte Sammlung und Auswertung großer Datenmengen aus verschiedenen Quellen mit dem Ziel, Muster zu erkennen und daraus neue Einsichten zu gewinnen sowie im besten Fall einen wirtschaftlichen oder sozialen Mehrwert zu ziehen.

1. The bigger, the better

„Die Masse macht’s“, könnte man meinen, wenn man den Begriff Big Data hört. Analysten sind sich aber einig: Auch wenn durch die Digitalisierung immer größere Mengen an Bits und Bytes entstehen, ist es angebracht, einen Teil davon zu entsorgen. Daten, aus denen sich keine nützlichen Informationen ableiten lassen, kosten Geld.
 

Allein über das Volumen der Daten ist Big Data unzureichend definiert.
Dr. Anna Wehofsits

„Die Frage ist: Wie hoch ist die Qualität der Daten?“, erklärt Tobias Ahnert, Big-Data-Spezialist bei der Beratungsfirma Deloitte. Wenn aus einem klaren Datensee, in dem man fischen kann, durch ein Übermaß unstrukturierter und nicht klassifizierter Informationen ein trüber Sumpf werde, gehe die Übersicht verloren. „Allein über das Volumen der Daten ist Big Data unzureichend definiert“, betont die Ethikforscherin Dr. Anna Wehofsits. Zu prüfen sei, „mit welchen Verfahren und nach welchen Kriterien Daten erhoben und zusammengeführt werden“.

2. Big Data produziert den gläsernen Wähler

Seit der Wahl Donald Trumps zum US-Präsidenten und dem Brexit-Votum wird massiv über datenbasierte Kampagnen mithilfe sozialer Netzwerke diskutiert. Mit personalisiertem digitalem Politmarketing können Kandidaten oder Parteien die Lebenswelten von individuellen Nutzern ansprechen und ihnen maßgeschneiderte politische Botschaften servieren, heißt es.

Als Meister auf diesem Gebiet gilt Dr. Michal Kosinski von der Universität Stanford. Als Student tüftelte der gebürtige Pole ein mathematisches Verfahren aus, mit dem sich anhand von Facebook-Likes und anderen öffentlich zugänglichen Daten der Charakter eines Menschen ermitteln und sein Verhalten vorhersagen lassen soll. Die Big-Data-Firma Cambridge Analytica (CA) übernahm den Ansatz Kosinskis und warb damit, die Persönlichkeit aller 190 Millionen in den USA registrierten Wähler psychometrisch erfasst zu haben.

Peter Metzinger, Geschäftsführer der Agentur business campaigning, tut die Selbstdarstellung von CA als „Luftblase“ ab. Anhand weniger Likes könne man Personen nicht genau einstufen.

3. Big Data und Datenschutz schließen sich aus

Für diese These scheint einiges zu sprechen. Elementare Prinzipien des Datenschutzes sind die Zweckbindung und die Datensparsamkeit, was sich wie das Gegenteil von Big Data anhört. Unvereinbar sind die vermeintlichen Gegenspieler aber nicht, da vielfach anonyme Daten für Analysen ausreichen.

„Privacy by Design“ lautet das Stichwort, also der Einbau von Datenschutz direkt in die Technik. Wenn man das Risiko minimieren will, dass massenhaft Daten hoher Qualität auf einzelne Personen zurückgeführt werden können, sollte man Quelldaten anonymisieren. Trotzdem ist Vorsicht geboten: „Auch solche Datensätze, die keinen direkten Personenbezug aufweisen, können durch die Kombination mit anderen Datensätzen personenbeziehbar werden und sehr spezifische, möglicherweise sensible Details über bestimmte Personen oder Gruppen verraten“, sagt die Technikphilosophin Wehofsits.
 

Wir leben in einer Welt, in der riesige Mengen von Daten und angewandte Mathematik alle anderen Werkzeuge ersetzen, die man sonst noch so anwenden könnte.
Chris Anderson

4. Big Data ist ein marktfertiges Produkt von der Stange

Bei Big Data handelt es sich oft um eine Lösung, die auf der Suche nach einem Problem ist, sagt Gartner-Analystin Debra Logan. Die größte Herausforderung sei herauszuarbeiten, welche Fragen damit beantwortet werden sollten. Wenn etwa verschiedene Informationstypen, wie Zahlen, Bilder oder Texte, als Grundlage dienen, wird es schnell kompliziert.

Hinter dem Hype steckt der Irrglaube, komplexe soziale Systeme ließen sich maschinell detailgetreu abbilden. Doch nicht nur können Daten diskriminierend wirken. Es besteht auch die Gefahr, Korrelationen (X und Y treten häufig zusammen auf) und Kausalitäten (aus X folgt Y) zu verwechseln.

Für die verschiedenen Anwendungsgebiete von Big Data gebe es keine Pauschallösungen, halten Berater von PricewaterhouseCoopers entsprechend fest. Auch bei den Ergebnissen gehe es um Eintrittswahrscheinlichkeiten und Prognosen, die interpretiert werden müssten, nicht um exakte Kalkulationen.

„Für treffende Big-Data-Analysen braucht es fast einen promovierten Informatiker“, ergänzt Deloitte-Big-Data-Spezialist Ahnert. Ganz so leicht ist es eben nicht, aus großen Datenmengen sinnvolle Relationen herauszuziehen und die Ergebnisse dann auch noch angemessen praktisch umzusetzen.

5. Big Data ist der Heilsbringer der digitalen Gesellschaft

Die mit Big Data verbundenen Verheißungen sind groß. Chris Anderson erhob zu seiner Zeit als Chefredakteur des Technologiemagazins WIRED Big Data 2008 gar zur einzig legitimen Erkenntnisform: „Wir leben in einer Welt, in der riesige Mengen von Daten und angewandte Mathematik alle anderen Werkzeuge ersetzen, die man sonst noch so anwenden könnte.“

Doch gibt es kaum konkrete Erfolgsbeispiele für Big-Data-Anwendungen, die über Optimierungsprozesse etwa im Marketing, bei Fertigungsprozessen, bei Finanzdienstleistungen oder in Transport und Logistik hinausgehen. Hinter dem Hype steckt der Irrglaube, komplexe soziale Systeme ließen sich maschinell detailgetreu abbilden. Big-Data-Analysen verstärkten die „blinde Zahlengläubigkeit“, moniert die Ethikerin Wehofsits.
 

Internet der Dinge

Die Daten gehören den Autofahrern

Cloud Computing

Deutschland, deine Cloud

Auf den Servern externer Dienstleister Speicherplatz zu unterhalten und Anwendungen zu betreiben, statt eine eigene Infrastruktur aufzubauen. Doch wie lässt sich garantieren, dass es dabei sicher zugeht?

Digitale Transformation

Was tun mit Big Data?

Google erlaubt den Blick in seine Datenzentren und zeigt: Die scheinbar ortlose Welt digitaler Informationen hat sehr wohl physische Entsprechungen. Doch was passiert dort genau?