Datenstrategie

Ein für alle mal: Datensilos einreißen

20.09.2023 - Datensilos sind eine Erfindung aus der IT-Hölle, die Unternehmen schwerfällig bis unlenkbar machen können. Die schlechte Nachricht: Sie verstecken sich in fast jedem Unternehmen. Die gute: Sie lassen sich fast immer auflösen.

von Dominik Grollmann

Jeder Unternehmer muss Datensilos hassen - und kaum ein Unternehmen könnte von sich behaupten, dass es sie nicht gibt. Datensilos enthalten Informationen, die vom Rest des Unternehmens getrennt sind und von einer Abteilung, properitären Anwendungen oder Geschäftseinheit kontrolliert werden. Meist gar nicht aus schlechter Absicht, sondern schlicht, weil eine bessere Lösung fehlt oder niemand einen bestimmten Ablauf bedacht hat. Gerade in gewachsenen IT-Infrastrukturen gedeihen die Datenverstecke besonders gut.

Trotzdem sind Datensilos nicht unbedingt ein Zeichen von schlechtem IT-Management oder einem mangelhaften Verständnis für digitale Prozesse. Die meisten Datensilos entstehen, wenn Unternehmen erfolgreich sind und schnell wachsen:

  • Für verschiedene Teams und neue Aufgaben werden spezialisierte Anwendungen angeschafft. Diese lösen wie vorgesehen das Problem, greifen aber nicht ineinander.
  • Produktpalette, Produktionsabläufe und -Dienstleister ändern sich, die bestehenden IT-Prozesse werden daran händisch angepasst und fallen aus dem vorgesehenen Raster.
  • Gerade in Wachstumsphasen ist viel Flexibilität gefordert. Schnelle, schlanke und effiziente Lösungen sind dann wichtiger als Grundlagenüberlegungen.
All dies passiert in jedem Unternehmen und muss den Erfolg zunächst nicht bremsen. Im Gegenteil: Gerade weil die einzelnen Abteilungen so handeln, performen sie oft so gut. Nach einer Weile führt dies jedoch zu einer Struktur, die sich immer weiter von der idealen Datenhaltung entfernt. Die Silos werden größer und bedeutender und bedrohen schließlich den Unternehmenserfolg.

Denn mit den Silodaten sind dem Unternehmen - oder zumindest Teilen davon - Informationen entzogen. Sie sind anderen Mitarbeitern unbekannt, was zu teuren Fehlentscheidungen führen kann. Parallel entsteht die Gefahr, dass auch die Daten im Silo nicht mehr auf dem aktuellen Stand sind, weil die Rückkopplung zu anderen Abläufen fehlt. Auch dadurch können Fehler und Mehrarbeit entstehen. Zuletzt entstehen Ineffizienz und Reibungsverluste, weil Daten inkompatibel werden und in mühsamer manueller Arbeit konvertiert werden müssen.

Auf lange Sicht können Datensilos daher zu einem teuren und gefährlichen Problem werden. Die gute Nachricht: Meist kommt es nicht so weit. Schlicht, weil sie den geschäftlichen Alltag schon zuvor mit einer ganzen Reihe weniger dramatischen Problemen behindern. Denn Datensilos stören die Arbeit in vielerlei Hinsicht:

Datensilos
  • führen zu einer großen Abhängigkeit von einzelnen Systemen.
  • erschweren die Implementierung neuer Anwendungen.
  • behindern den Datenaustausch über standardisierte Schnittstellen und ...
  • erfordern daher ein hohes Maß an Customizing, ...
  • was Updatefähigkeit und Sicherheit beeinträchtigt.
  • führen in der Summe zu einer umständlich zu pflegenden, wenig flexiblen und kaum agilen IT-Infrastruktur.
Folge: Neue Systeme können nicht oder erheblich verlangsamt eingeführt werden, Innovationen werden gebremst. In den meisten Fällen wird eine fähige IT-Abteilung daher schon über die Bildung schwer zugänglicher Dateninseln klagen, bevor diese ein geschäftskritisches Maß erreichen.

Datensilos aufbrechen - Daten zentralisieren


Nicht nur aus Management, sondern auch aus IT-Sicht sprechen also gute Argumente dafür, Datensilos zu vermeiden beziehungsweise aufzubrechen. Doch wie geht man dabei am besten vor? Schließlich ist das Kind ja meist schon in den Brunnen gefallen. Müssen überhaupt alle Daten zentral gehalten werden - also auch die Einladungen zur Weihnachtsfeier? Welches System im Unternehmen soll dazu den "Hut" aufhaben? Oder sollen alle Apps gleichberechtigt sein und lediglich auf eine gemeinsame Datenbank zugreifen? Und wie geht man mit Anwendungen um, die schlicht und einfach selbst ihre Datenhoheit beanspruchen?

Szenario 1: Alles in den Data Lake


In den vergangenen Jahren ist ein Begriff populär geworden, der eine sehr radikale und endgültige Lösung verspricht: Der Data Lake. In ihn werden im besten Falle einfach alle Daten und Dateien aus dem Unternehmen "gekippt". Völlig unstrukturiert, ohne jede Aufbereitung. Die Kundenstammdaten ebenso wie die eben erwähnte EMail-Einladung zur Weihnachtsfeier.

Eine leistungsfähige Software ist später in der Lage, alle relevanten Informationen zu finden und zusammenzuführen. Vorbild für dieses Konzept sind das Internet und Google - oder besser noch: ChatGPT mit seinen KI-Funktionen. Schließlich sind auch im Web Informationen gänzlich unstrukturiert gespeichert und können trotzdem jederzeit gefunden und hervorragend aufbereitet ausgegeben werden.

Vorteil dieser Idee:

Flexibilität:

Data Lakes ermöglichen die Speicherung von strukturierten und unstrukturierten Daten aus verschiedensten Quellen.

Zukunftssicherheit:

Bei der Implementation des Data Lakes muss nicht festgelegt werden, welche Informationen in Zukunft genutzt werden sollen. Alle Daten sind vorhanden und es gehen keinerlei Informationen verloren, weil die Daten in ihrem Rohformat gespeichert bleiben.

Skalierbarkeit:

Data Lakes können große Datenmengen aufnehmen und sind in der Regel gut skalierbar, sodass sie mit den Anforderungen wachsen können.

Datenintegration:

Ein Data Lake erlaubt die Integration verschiedener Datenquellen und -formate an einem Ort. Dadurch wird es einfacher, Daten zu kombinieren und neue Erkenntnisse zu gewinnen.

Datenanalyse:

Durch die zentrale Speicherung können Analysten und Data Scientists leichter auf die Daten zugreifen und fortschrittliche Analysen durchführen. Dies kann zu besseren Einblicken und datengesteuerten Entscheidungen führen.

Es liegt auf der Hand, dass diese Art der Datenhaltung zugleich äußerst ressourcen- und performancehungrig ist. Außerdem droht durch die Strukturlosigkeit zugleich ein gewisser Kontrollverlust, der es erschwert, beispielsweise Compliance- oder Datenschutzregeln anzuwenden oder zu überwachen.

Nachteile des Data Lake-Konzepts:

Datenqualität:

Da Data Lakes unterschiedliche Datenquellen und -formate akzeptieren, kann die Qualität der gespeicherten Daten variieren. Es ist wichtig, Maßnahmen zur Datenbereinigung und -qualitätssicherung zu implementieren, um sicherzustellen, dass die Daten zuverlässig und aussagekräftig sind.

Komplexität:

Data Lakes können aufgrund ihrer Flexibilität und der Vielfalt der gespeicherten Daten komplex sein. Die Verwaltung und Organisation der Daten erfordert entsprechendes Fachwissen und eine klare Datenstrategie.

Datenschutz und Sicherheit:

Da Data Lakes auch sensible Informationen enthalten, müssen Maßnahmen zur Sicherheit und zur Einhaltung der Datenschutzvorschriften ergriffen werden. Also: Zugriffsschutz, Verschlüsselung und Überwachung der Daten.

So bestechend die Idee des Data Lakes zunächst erscheinen mag, so untauglich ist sie in vielen Anwendungsfällen als operative Datenlösung. Gerade im Marketing und in unternehmenskritischen Geschäftsprozessen ist eine hohe Kontrollgenauigkeit meist entscheidender als maximale Flexibilität.

Szenario 2: Data Quality Management im Data Warehouse


Strukturierte Daten sind unter diesem Aspekt deutlich dankbarer - zumal oft gar kein entscheidender Informationsverlust einhergeht. Schließlich kennen Unternehmen ihre Geschäftsprozesse genau und wissen, welche Informationen sie dafür benötigen. Nur leider sind diese in den verschiedenen Sub-Systemen verteilt.

Um die Silos zu heben, bietet sich ein Umweg durch den Data Lake an: Mittels individuellen Scripten und speziellen Helfer-Tools werden alle Daten von Interesse aus ihren Anwendungen extrahiert, transformiert und in den Datensee gepumpt. Dort werden sie durch ein Data Warehouse (etwa Big Query von Google) homogenisiert, den Anforderungen entsprechend aufbereitet und im passenden Exportformat ausgegeben.

Schließlich lässt damit beispielsweise die Datenbank einer zentralen Unternehmensapplikation befüllen, die anschließend alle maßgeblichen Prozesse steuert beziehungsweise alle ihr untergeordneten Anwendungen über Schnittstellen mit Daten bedient. Sofern die Anwendungen nun im Unternehmen nun ordentlich aufgesetzt sind (und sich nicht wieder erneute Parallelabläufe und Schattenprozesse einschleichen) gehören Datensilos damit der Vergangenheit an.

Szenario 3: Data Management Platform - Zentral speichern, dezentral verteilen


Gerade an diesen stringent geordneten Abläufen fehlt es allerdings oft - sonst wären die Datensilos ja gar nicht erst entstanden. Und oftmals ist der gerade beschrieben Perfektionismus in der unternehmerischen Praxis auch gar nicht erwünscht, geschweige denn umzusetzen. Denn wirklich gut könnte eine solche Strategie nur gelingen, wenn die gesamte IT-Infrastruktur für die eigenen Ansprüche maßgeschneidert wäre. In allen anderen Fällen ist oft schon die Frage schwierig zu beantworten, welches System überhaupt das Unternehmen steuern soll. Ist ein kunden- oder produktzentrierter Ansatz gewünscht? Soll das ERP (Enterprise Resource Management) oder das CDP (Customer Data Platform) den Lead erhalten? Welche Einschränkungen ergeben sich daraus für die folgenden Systeme?

Aber selbst wenn sich diese Fragen aus dem Stehgreif beantworten lassen würden, würde es oft nicht weiterhelfen. In der Praxis sind viele Unternehmen ganz oder in Teilen auf Standard-Anwendungen angewiesen, die ihre eigenen Einschränkungen mitbringen und in deren Architektur ein Zusammenspiel mit fremden Prozessen nur auf bestimmte Weise oder gar nicht vorgesehen ist. Dies kann so weit gehen, dass sie als typische Stand-Alone-Applikation eine bestimmte Vorgehensweise und damit auch die komplette Datenhoheit für sich beanspruchen. In der Praxis ist die IT-Infrastruktur immer ein guter Kompromiss, aber niemals die perfekte Lösung.

Aber auch damit lässt es sich sehr gut leben: Mittels einer Zwischenschicht lässt sich die Datenspeicherung von den Applikationen entkoppeln. Dazu wird eine Data Management Platform oder Data Governance Framework als Middleware zwischen dem (Cloud)-Speicher und den Applikationen gezogen. Datenanfragen werden nicht mehr direkt aus einer Datenbank oder dem Dateisystem bedient, sondern statt dessen durch die Middelware gemanagt. Jede Information, die durch die Middelware geht, kann von ihr konsistent und nach einheitlichen Regeln aufbereitet werden. Auf diese Weise lassen sich die Daten beliebiger Applikationen in Echtzeit durch eine zentrale Instanz kontrollieren und manipulieren, selbst wenn eine andere Applikation die Hoheit über diese Daten für sich beanspruchen will.

Selbst in einer heterogenen Systemlandschaft kann so eine hohe Datenkonsistenz, -qualität und -sicherheit hergestellt werden, die sich von einer zentralen Stelle aus managen und kontrollieren lässt. Vor allem ist sichergestellt, dass alle wesentlichen Unternehmensdaten in einer zentralen Datenbank bereitgestellt werden und alle Applikationen aus dieser Datenbank bedient werden können. Neue Anwendungen lassen sich in dieses Konzept zudem leicht andocken, weil Schnittstellen oder Exportfunktionen quasi jedes beliebige Format erzeugen und entgegennehmen können. Zuletzt lassen sich Analysefunktionen schnell auf- und Compliance-Regeln zuverlässig umsetzen.

Eine Frage der Technik - und der Unternehmenskultur


Datensilos sind eine ernstzunehmende, aber keine unüberwindbare Herausforderung. Es gibt technische Ansätze, die die Daten-Konsolidierung erleichtern und die Silo-Bildung zumindest erschweren. Trotzdem sollte man sich nicht der Illusion hingeben, man könne mit Technik alleine den geheimen Datenspeichern ein für alle mal Herr werden.

Letztlich entstehen Informationssilos, weil in Unternehmen die (berechtigte) Forderung nach schnellen und flexiblen Lösungen dem (ebenso berechtigten) Wunsch nach festen und zuverlässigen Prozessen entgegen steht. Je starrer eine Organisation ist, desto größer der Drang nach alternativen Lösungsweg. Wenn Datensilos entstehen, sollte sich das Management daher durchaus fragen, ob strukturelle Maßnahmen dafür sorgen können, dass alle Informationen wieder in einem gemeinsamen Kanal landen.

Endgültig kommt diese Frage in der Chefetage an, wenn die Silos gar nicht erst erkannt werden - und zwar nicht, weil sie übersehen werden, sondern weil man sie nicht ernst nimmt oder gar nicht sehen will.

Ein gutes Beispiel dafür ist zum Beispiel der Kundensupport, der in vielen Unternehmen vor allem als lästige, weil unproduktive Kostenstelle betrachtet wird. Bestenfalls wird sie in den Datenfluss eingebunden, damit sie Anfragen schnell (und damit kostengünstig) beantworten kann. Dass es sich bei dieser Abteilung aber zugleich um eine sehr wertvolle Schnittstelle zum Kunden handelt, bemerken nur wenige Unternehmen. Der Dateninput dieser Abteilung wird dann vollständig unterschätzt - ein weiteres Datensilo, das sich aber mit Technik alleine nicht aufbrechen lässt. Dafür braucht es eine Kultur des Zuhörens.

Ihr Guide im New Marketing Management - ab 6,23 im Monat!

Hat Ihnen diese Beitrag weiter geholfen? Dann holen Sie sich die ONEtoONE-Premium-Mitgliedschaft. Sie unterstützen damit die Arbeit der ONEtoONE-Redaktion. Sie erhalten Zugang zu allen Premium-Leistungen von ONEtoONE, zum Archiv und sechs mal im Jahr schicken wir Ihnen die aktuelle Ausgabe.

Mehr zum Thema:

Vorträge zum Thema:

  • Bild: Jonas Rashedi
    Jonas Rashedi (FUNKE ONE GmbH)

    Data - Business vs. IT: How to Get Data-Driven

    In der digitalen Ära ist Daten der entscheidende Treibstoff für Unternehmen, um Wettbewerbsvorteile zu erlangen, den Kundenservice zu verbessern und innovative Produkte und Dienstleistungen zu entwickeln. Doch obwohl die Wichtigkeit von Daten anerkannt wird, gibt es oft eine Kluft zwischen den geschäftlichen und technischen Ansichten darüber, wie Daten am besten genutzt werden können.

    Vortrag im Rahmen der DMEXCO Digital DialogStage 2023 am 20.09.23, 11:30 Uhr

www.hightext.de

HighText Verlag

Mischenrieder Weg 18
82234 Weßling

Tel.: +49 (0) 89-57 83 87-0
Fax: +49 (0) 89-57 83 87-99
E-Mail: info@onetoone.de
Web: www.hightext.de

Kooperationspartner des

Folgen Sie uns:



Besuchen Sie auch:

www.press1.de

www.ibusiness.de

www.neuhandeln.de