Was ist Big Data?

Big Data steht begrifflich zunächst einmal für riesige Datenmengen, die mit einem PC oder Firmenserver nicht mehr zu verarbeiten sind, des Weiteren meint man damit auch die Technologie, mit der diese Daten in Datenzentren verarbeitet werden. Die Größe der Daten bezieht sich nicht nur auf ihr Volumen, sondern auch auf die Geschwindigkeit des Generierens und der Transformation (velocity) und schließlich auf die oft riesige Bandbreite der verwendeten Datenquellen und -typen (variety). Letzteres ist ein Problem, wenn aus Daten in unterschiedlichsten Ursprungsformaten eine neue Datei entstehen soll.

Wo entstehen Datenmengen für Big Data Anwendungen?

In vielen Bereichen unseres Lebens werden wir mit Big Data konfrontiert, ohne dass wir das immer bewusst registrieren. Beispiele wären unter anderem:

  • Kreditkartendaten
  • elektronische Kommunikationsysteme (Telefone, Internet)
  • Navigationssysteme
  • Aufzeichnungen von Überwachungssystemen
  • Social-Media-Informationen
  • Daten für die Industrie
  • Daten für Kraftfahrzeuge
  • Daten, die Behörden und Unternehmen erheben
  • Smart Homes Technik
  • Big Data im Business-Bereich

In Geschäftsprozessen werden durch Big Data Systeme viele Verbesserungen erreicht. Ganz besonders profitieren die Bereiche Informationstechnik, Technologieentwicklung und Marketing. Es gilt: Je größer das Unternehmen ist, desto intensiver muss es sich den Herausforderungen stellen, die durch die riesigen Datenmengen entstehen. Betroffen sind also Konzerne, aber auch die Marktforschung, das Gesundheitswesen, die Vertriebs- und Servicesteuerung, große Verwaltungen und natürlich Nachrichtendienste. Sie alle erfassen am laufenden Band sehr viele Daten, bereiten sie auf und nutzen sie wirtschaftlich oder zu behördlichen Zwecken. Zwischen Behörden und Wirtschaftsunternehmen gibt es zwar Unterschiede in der Zielrichtung, aber nicht in der Art des Umgangs mit Big Data. Es kommt in beiden Bereichen die adäquate Technologie zum Einsatz.

Statistische Herausforderung durch Big Data

Das Problem der Massendaten ist ihr exponentielles Wachstum. Das weltweit erzeugte Datenvolumen dürfte sich etwa alle zwei Jahre verdoppeln (Stand: 2018), allerdings beruht diese Aussage auf Schätzungen. Möglicherweise verläuft die Entwicklung sogar noch rasanter, weil Daten immer schneller automatisiert erfasst werden. Daten entstehen unter anderem durch Protokolle von Telekommunikationsverbindungen (CDR = Call Detail Record), durch Webzugriffe (Logdateien), durch Kameras, Sensoren und Mikrofone, durch automatische Erfassungen von RFID-Daten, durch Finanztransaktionen, den Energieverbrauch, die Verschreibungen von Medikamenten, die zahllosen Bestellungen und Buchungen von Unternehmen sowie durch wissenschaftliche Forschung. Seit etwa 2012 gilt Big Data als Megatrend des neuen Jahrtausends. Eine Kernfrage lautet, welche Daten es sich lohnt zu speichern. Die Speicherkapazitäten werden zwar immer größer und preiswerter, doch die Datenmengen wachsen in Teilbereichen noch schneller – so etwa die Zahl der Webseiten und der Content im Internet. In vielen Bereichen speichert man daher nur noch Metadaten oder wertet relevante Daten umgehend aus und speichert nur die Analyseergebnisse.

Big Data und Datenschutz

Der Begriff Big Data ist nicht nur positiv konnotiert, weil die technologische Möglichkeit der Datensammlung und -analyse zur unerwünschten Überwachung führen kann. Die Staaten reagieren zwar darauf wie jüngst die EU mit der seit 2018 verbindlich geltenden Datenschutz-Grundverordnung, doch es fragt sich, ob diese gesetzlichen Maßnahmen reichen. Dennoch lässt sich die Technologie nicht aufhalten, sie lässt sich bestenfalls in einem gewissen Umfang kontrollieren.

 

Bildquelle: Pixabayuser jplenio

Redaktion

Industrie-Journal verarbeitet alle Themen rund um Wirtschaft, Innovationen, Technologie und weitere spannende Bereiche. Angetrieben werden wir von Neugier und wollen die spannenden Prozesse in der Industrie und der Digitalisierung mit diesem Blog begleiten.

Alle Beiträge ansehen von Redaktion →