Wir leben in einer zunehmend von Daten angetriebenen Welt. Wie Ihre Organisation ihre Datenstrategie sowie ihren Ansatz - einschließlich der Wahl von großen Daten- und Cloud-Technologien - definiert, wird einen entscheidenden Unterschied in Ihrer Konkurrenzfähigkeit in der Zukunft ausmachen.
Nutzen Sie den vollen Geschäftswert Ihrer Daten
Der Begriff „Big Data“ unterliegt als Schlagwort einem kontinuierlichen Wandel; so wird mit ihm ergänzend auch oft der Komplex der Technologien beschrieben, die zum Sammeln und Auswerten dieser Datenmengen verwendet werden. Die gesammelten Daten können dabei aus verschiedensten Quellen stammen.
Big Data kann Geschäftsprozess-Verbesserungen in allen Funktionsbereichen von Unternehmen, vor allem aber im Bereich der Technologieentwicklung und Informationstechnik sowie des Marketings erzeugen.
Bisher haben vor allem grosse Unternehmen und Bereiche der Wirtschaft, Marktforschung, Vertriebs- und Servicesteuerung, Medizin, Verwaltung und Nachrichtendienste die entsprechenden digitalen Methoden für sich genutzt: Die erfassten Daten sollen weiterentwickelt und nutzbringend eingesetzt werden.
Heute dient die Erhebung der Daten auch kleinen und mittelständischen Unternehmen zur Trendforschung in den sozialen Medien und Werbeanalysen, um zukunftsweisende und möglicherweise gewinnbringende Entwicklungen zu erkennen und darauf rechtzeitig zu reagieren.
Datenmengen verarbeiten
Unstrukturierte und halbstrukturierte Datentypen passen typischerweise nicht gut in traditionelle Data-Warehouses, die auf relationalen Datenbanken basieren, welche auf strukturierte Datensätze ausgerichtet sind. Darüber hinaus sind Data Warehouses nicht in der Lage, die Verarbeitungsanforderungen zu erfüllen, die von Sätzen großer Daten ausgegeben werden, welche häufig aktualisiert werden müssen - oder sogar kontinuierlich, wie bei Echtzeitdaten über den Aktienhandel, die Online-Aktivitäten von Website-Besuchern Oder die Leistung von mobilen Anwendungen.
So nutzen Organisationen, die große Daten sammeln, verarbeiten und analysieren Frameworks, welche die Verarbeitung großer Datensätze über Cluster von Computern mit einfachen Programmiermodellen ermöglichen. Diese Lösungen wurden entworfen um u.a. als Landeplatz- und Staging-Bereiche für Daten verwendet zu werden, bevor sie in ein Data Warehouse oder eine analytische Datenbank zur Analyse geladen werden, in der Regel in einer zusammengefassten Form, welche für relationale Strukturen förderlich ist.
Häufiger wird auch ein Datensee angenommen, welcher als primäres Repository für eingehende Datenströme dient. In solchen Architekturen können Daten direkt in einem Cluster analysiert oder durch eine Verarbeitungsmaschine laufen. Wie beim Data Warehouse ist das Sound Data Management ein wichtiger erster Schritt im großen Datenanalytikprozess. Daten, die in einer Big Data Lösung gespeichert sind, müssen ordnungsgemäß organisiert, konfiguriert und partitioniert werden, um eine gute Leistung sowohl für Extrakt-, Transformations- und Lade- (ETL-) Integrationsaufträge als auch für analytische Abfragen zu erhalten.