Was tun mit Big Data?

Big Data

Google erlaubt den Blick in seine Datenzentren und zeigt: Die scheinbar ortlose Welt digitaler Informationen hat sehr wohl physische Entsprechungen.

Wo das Herz des Internets schlägt, ist es vor allem laut. Die Rechenzentren mit Tausenden von Servern, die Suchanfragen für Google bearbeiten und speichern, sind 24 Stunden in Betrieb, stehen dicht an dicht. Damit sie nicht heiß laufen, kühlen gigantische Ventilatoren und Klimaanlagen die Maschinen auf die optimale Betriebstemperatur – und machen einen unheimlichen Lärm.

Den Informationen der Welt, die in den Rechenzentren von Google, Facebook, Microsoft und Amazon zusammenlaufen, macht das Gewummer nichts aus. Milliarden von Suchanfragen bearbeiten die Konzerne täglich, meist dauert das nur wenige Sekunden – obwohl manche Daten dazu erst von Deutschland durch den Atlantik bis in die USA und wieder zurückgeschickt werden. Einer der beiden Google-Gründer, Larry Page, hatte sogar die Vorstellung von einer Suchmaschine, die Ergebnisse schon liefert, noch während man seine Anfrage eingibt. Die Nutzer sollten denken, dass Google ihre Gedanken lesen kann. „Wenn man über etwas nachdenkt, selbst wenn man nicht viel darüber weiß, bekommt man eine automatische Antwort“, sagte er.

Diese Vision ist heute Realität. Die Suchalgorithmen verbinden die Anfragen aller Nutzer unmittelbar miteinander. Die meistgesuchten Vorschläge erscheinen, noch während man seinen Suchbegriff tippt. Das kann nur funktionieren, wenn die Rechenzentren fehlerfrei arbeiten. Das gilt auch für alle anderen Wirtschaftsbereiche, die Datenzentren benötigen: Banken und Versicherungen, Verwaltungen und Kommunen, Universitäten, aber auch Telekommunikationsunternehmen.

Seit Menschen von überall aus arbeiten können, steigt die Nachfrage nach datenintensiven Applikationen immer weiter. Cloud-Computing ist weiterhin ein großes Thema und Unternehmen wie Google betreiben großen Aufwand, um die Unmengen an Daten, die bereits auf den Servern abgespeichert sind, zu nutzen und die Frage zu beantworten: Was tun mit Big Data? Denn alle zwei Jahre verdoppelt sich das Datenvolumen. Täglich kommen große Mengen weiterer Daten hinzu.

Doch wie kommen die Daten eigentlich in die Cloud? Und welchen Weg legt eine Suchanfrage zurück, bis Antworten darauf beim Nutzer erscheinen? Zunächst leiten die Computer im Netzwerkraum eines Rechenzentrums die Anfragen an den richtigen Server im nächsten Raum weiter. Die Computer, die in diesem Serverraum stehen, kommunizieren auch mit den anderen Datenzentren weltweit. Hier werden Milliarden von Anfragen bearbeitet, Videos hochgeladen und E-Mails auf Viren geprüft. Alle Daten werden auf mindestens zwei verschiedenen Servern gespeichert, falls einer von ihnen ausfällt. Von den wichtigsten Daten wird außerdem eine Kopie auf digitalen Kassetten gespeichert. Geht eine Festplatte kaputt, wird sie zerstört. Dazu hat sich Google selbst verpflichtet.

In Bezug auf die Sicherheit von Cloud-Daten deutscher Nutzer und Unternehmen könnte die aktuelle Gesetzeslage in den USA unangenehme Folgen haben. Der im Zuge des Kampfs gegen den internationalen Terrorismus verabschiedete „USA Patriot Act“ erlaubt es den amerikanischen Behörden, auf Daten zuzugreifen, die ein Dienstleister mit Hauptsitz in den Vereinigten Staaten speichert. Viele Datenschützer in Deutschland sind der Meinung, dass davon auch Rechenzentren in Europa betroffen sind, wenn diese von amerikanischen Unternehmen betrieben werden. Microsoft, Google und das Institut für Informationsrecht an der Universität Amsterdam haben diese Einschätzung bestätigt. Die Experten dieses Instituts gehen sogar davon aus, dass die US-Behörden schon dann Zugriff verlangen könnten, wenn das Unternehmen, das den Cloud-Speicherplatz anbietet, einen Großteil seiner Geschäfte in den USA macht.

Die meisten Datenzentren von Internet- und Technikunternehmen stehen in den USA, aber auch in Finnland, Großbritannien und Belgien. In Hongkong, Taiwan, Singapur und Chile entstehen zurzeit ebenfalls Großprojekte dieser Art. Auch in Deutschland gibt es mehrere bedeutende Datenzentren. Eines der größten steht in Frankfurt am Main, betrieben vom britischen Unternehmen Telehouse. Der Standort ist nicht zufällig gewählt. Denn Frankfurt ist nicht nur ein Handels- und Finanzzentrum, sondern auch eine Datenmetropole, weil hier wichtige Internetleitungen zusammenlaufen. Unter anderem in dem Internetknoten DE-CIX, dem größten seiner Art weltweit.

Die Orte: Datenzentren kann man nicht überall bauen

Google betreibt nicht nur in Nordamerika Datenzentren, sondern auch auf vielen anderen Erdteilen, in Europa unter anderem am Finnischen Meerbusen und in Belgien. Viele Faktoren spielen eine Rolle, wenn sich das Unternehmen für einen neuen Standort entscheidet. Zuverlässige Stromversorgung und die Nähe zu natürlichen Wasservorkommen sind nur zwei davon. auch das Klima ist wichtig: Denn wo es kalt ist, sinkt der Aufwand für die Kühlung, weil das Kühlwasser durch die Außenluft auf niedriger Temperatur gehalten wird. An einigen Standorten hat sich Google außerdem dafür entschieden, bestehende Gebäude zu nutzen und anzupassen, statt einen Neubau zu errichten.

Die Menschen: Manchmal braucht es Handarbeit

Auch die hochmodernen Datenzentren von Google kommen nicht ohne menschliche Hilfe aus. im Gegenteil: Die Mitarbeiter sind unerlässlich, damit Internetnutzer zu jeder tages- und Nachtzeit in Sekunden E-Mails abrufen und die suche benutzen können. In allen Rechenzentren gibt es zahlreiche Teams, die dafür sorgen, dass Defekte rechtzeitig erkannt und behoben werden. Sie prüfen, warten, reparieren und überwachen die vielen tausend einzelnen Komponenten, die Server, die kilometerlangen Leitungen, die Stromversorgung. Viele der Google-Datenzentren sind derart groß, dass die Mitarbeiter mit Fahrrädern von einem Ende des Gebäudes zum anderen fahren.

Die Technik: Rasen schnell und trotzdem nachhaltig

Damit keine wertvolle Zeit verloren geht, während weltweit Millionen von Suchanfragen eingehen, nutzt Google innerhalb der Datenzentren Glasfaserkabel, um Daten von a nach b zu übertragen. Solche Verbindungen sind bis zu 200.000-mal schneller als ein normaler Internetanschluss für Privathaushalte. Damit die Serverparks von Google ohne Unterbrechungen laufen, müssen sie aber nicht nur permanent mit Daten versorgt werden, sondern brauchen auch ständig Strom und Kühlwasser. Das Unternehmen versucht, diese Ressourcen so sparsam wie möglich einzusetzen. Zum Beispiel, indem einige Datenzentren statt frischen Trinkwassers gering verschmutztes Abwasser nutzen, so genanntes Grauwasser.

Digitale Sicherheit

Die Deutschen und der Datenschutz

Digitale Identitäten

Die Rolle Sicherer Identitäten beim digitalen Wandel

Bei der digitalen Transformation von Unternehmen lohnen sich Investitionen in Sichere Identitäten.

Digitale Identitäten

Was ist eine digitale Identität?

Die eigene Identität lässt sich auch digital nachweisen. Um Missbrauch und Diebstahl vorzubeugen, müssen solche Identitäten sicher sein.