Big Data Analytics meets Business Intelligence: Ansprüche an Architektur, Governance und Compliance
Jede größere Managementrunde setzt sich mit datenbasierten Reports auseinander. Die zugrunde liegende Datenhaltung und -visualisierung ist das Anwendungsgebiet der Business Intelligence (BI): Daten – oft aus Controlling und Berichtswesen – werden für bekannte Zwecke verarbeitet. Anders gesagt: Der Use Case ist bekannt, IT-Architektur, Governance und Compliance richten sich danach. Advanced Analytics und Big Data Analysen funktionieren anders. Die Gemeinsamkeit mit BI ist die enge Orientierung an der Wertschöpfung. Fragen nach Architektur und Governance stellen sich hingegen neu.
Klassische Architektur und Governance für BI-Lösungen
Um BI-Lösungen ausführen zu können, werden die operativen Daten eines Unternehmens regelmäßig in ein relationales Data Warehouse geladen und für analytische Auswertungen aufbereitet.
- Dabei sind in der Regel alle Daten, die in den Reporting- oder Analytics-Prozess einfließen, im Vorfeld bekannt.
- Sobald Daten verarbeitet werden, geht es im regulierten Markt sofort auch um eine Governance, die sich an den Compliance-Richtlinien ausrichtet, wie sie vom BSI, aber auch von der BaFin vorgegeben sind.
- Das führt dazu, das für alle involvierten Daten im Vorfeld eine Risikobewertung stattfindet und die Architektur der Lösung (inklusive z.B. Plattformen und Nutzerberechtigungen), auf die nach Risiko klassifizierten Datencluster abgestimmt wird.
- Außerhalb der technischen Lösungen werden die getroffenen Regelungen festgehalten in einer dokumentierten Governance-Struktur, die alle Punkte enthält, auf die behördliche Prüfer achten.
Erweiterte Architektur für Advanced Analytics Lösungen
Wer Advanced Analytics für die Verbesserung wertschöpfender Prozesse nutzen möchte, muss sich die Use Cases im Rahmen von Innovationsprozessen erarbeiten und die bestehende Data Warehouse Architektur erweitern. Dabei lassen sich beispielhaft zwei Anwendungsfälle unterscheiden, die in unterschiedliche Systemlösungen münden:
KI-gestützte Klassifikationssysteme
Durch Künstliche Intelligenz gestützte KPIs oder Klassifikationssysteme wie zum Beispiele Modelle zur Fraud Detection oder Bewertung von Kreditrisiken beruhen zumeist auf einer heterogenen Datenwirtschaft aus strukturierten, semi-strukturierten und unstrukturierten Daten. Im Umgang mit diesen Daten kann ein klassisches relationales Data Warehouse maximal noch einen Teil der Systemlösung darstellen.
Echtzeit-Analysen großer Datenmengen
Auch für Analysen von großen Datenmengen in Echtzeit, zum Beispiel bei der Verarbeitung von Daten aus IoT Devices oder Click-Streams für Customer und Sales Analytics reichen die Kapazitäten des klassischen Systems nicht mehr aus. Eine fehlende Skalierbarkeit zeigt der klassischen Architektur schnell die Grenzen auf.
Das Data Lakehouse als technische Basis
Eine zeitgemäße Lösung für die aufgezeigten Limitierungen ist ein Data Lakehouse in der Cloud: Eine Kombination aus relationaler Datenbank für strukturierte Daten und einer Data Lake Komponente für semi- und unstrukturierte Daten. Das Data Lakehouse Konstrukt ermöglicht es, im selben System sowohl Business Intelligence Prozesse als auch Advanced Analytics Use Cases bewirtschaften zu können.
Regulatorik: Auch Datenhaltung in der Cloud erfordert individuelle Risikobewertungen
Neben den Annehmlichkeiten und Vorteilen, die diese Cloud-Dienste mitbringen, müssen sich die Unternehmen immer auch sicher sein können, dass regulatorische und datenschutzrechtliche Auflagen beim Einsatz dieser Technologien gesichert werden können.
Dazu sichern die Cloud-Anbieter den Kunden beispielsweise die Kontrolle über den Speicher und Verarbeitungsort der Daten zu. Dennoch liegt die letztliche Verantwortung bei der Geschäftsführung der Unternehmen, die auf diese Cloud-Dienste zurückgreifen.
Der Governance-Rahmen, den das Unternehmen unter Compliance-Gesichtspunkten erstellen muss, kann nicht so einfach innerhalb der verwendeten Tools generiert werden. Ein Beispiel: Der Cloud-Anbieter selbst sollte gar nicht den vollen Einblick in die Natur der verarbeiteten Daten erhalten – er würde sonst selbst zum Risiko als potenzielles „Datenleck“.
Der Cloud-Anbieter kann einem Unternehmen daher nicht die grundlegende Arbeit der Risikobewertung abnehmen und die (plattform-neutrale) Bewertung der Maßnahmen, wie diese Risiken „mitigiert“, das heißt verlässlich und nachvollziehbar behandelt werden können.
Das gilt insbesondere, wenn es um personenbezogene Daten geht. Wer personenbezogene Daten von einem Cloud-Anbieter verarbeiten lassen will, hat verschiedene Möglichkeiten, um das Risiko auf ein kleines Maß zu senken, wie beispielsweise
- Pseudonymisierung und Anonymisierung
- Verschlüsselung
- Verträge
- organisatorische Vereinbarungen uvm.
Wenn außerdem KI zur Auswertung herangezogen wird, muss trotzdem jederzeit nachvollziehbar sein, wie die verwendeten Daten verarbeitet werden. Hierzu können Methoden der Explainable Artificial Intelligence (XAI) zum Einsatz kommen, um zu erklären, wie die Modelle zu ihren Ergebnissen kommen.
Fazit: Wer über Plattformen hinausdenkt, öffnet die Tür zu innovativen Lösungen
Mit der Ergänzung von Business Intelligence um Advanced Analytics entsteht ein neuer Möglichkeitsraum für Unternehmen - auch im regulierten Umfeld. Je nach Art der Daten und der Art ihrer Verarbeitung steigt dabei die Komplexität, was Compliance angeht. Letztlich müssen die Risiken müssen so individuell bewertet werden, wie die Lösung des Problems ausgestaltet wird. Dieser Aufwand steht dem möglichen Gewinn an Wertschöpfung gegenüber. Um diese Potenziale zu erschließen, sind verschiedene Rahmenkonstrukte verfügbar, die über die gewählte Cloud-Plattformen hinausgehen.
Jetzt die Business Intelligence Lösungen von matrix technology kennenlernen
Jetzt die Cloud Consulting Lösungen von matrix technology kennenlernen
Jetzt die Advanced Analytics Lösungen von Informationsfabrik kennenlernen
Dieser Beitrag entstand in redaktioneller Partnerschaft zwischen matrix technology und der Informationsfabrik. Die Partner sind Teil der X1F Unternehmensgruppe, die Leistungen und Kompetenzen rund um Business Prozesse, Infrastruktur und Data Analytics bündelt.
BI und Big Data Analytics – Vergleich in vier Dimensionen
Business Intelligence und Big Data Analytics zielen darauf ab, bessere Entscheidungen zu ermöglichen. Marktforscher sehen große Wachstumsraten voraus. Aber wann eignet sich welche Lösung? In unserem Factsheet vergleichen wir die beiden Lösungen anhand von vier Dimensionen: Praktische Anwendung (Use Cases), Infrastruktur-Voraussetzungen, Regulatorik und Investitionen.