Was bedeutet Big Data?

Big Data ist ein Sammelbegriff für die Verarbeitung von "großen Datenmengen". Der Begriff selbst ist in letzter Zeit (zu Recht) in die Kritik gekommen, da er nicht eindeutig definiert ist und zudem in einer Vielzahl von Definitionsversuchen in eher schwammigen Beschreibungen daherkommt. In Abgrenzung zu den seit vielen Jahren in Unternehmen betriebenen Data Warehouses könnten die Volatilität, Heterogenität und der Umfang der auszuwertenden Daten dienen.

Big Data Anwendungen basieren in der Regel auch nicht auf ETL-Prozessen, sondern werten große Datenbestände direkt und in Echzeit aus. Das Problem von Big Data Anwendungen ist somit nicht die Speicherung sehr großer Datenmengen sondern die zielgerichtete und effektive Real Time Nutzung und die Bestimmung der Relevanz dieser Daten. Bei der Relevanzbestimmung der Daten geht es vor allem darum, aus den Daten entsprechende geschäftsrelevante Informationen abzuleiten, Muster zu erkennen und diese für die Verbesserung von Prozessen, Services und Produkten zu nutzen. Vor diesem Hintergrund ergibt sich offensichtlich eine große Ähnlichkeit zu dem altbekannten Begriff des Data Mining und die Analysetechniken für die Big Data basieren weitesgehend in der Tat auf Statistik und Wahrscheinlickeitsrechnung, Artificial Intelligence und Data Mining.