Schmuckbild
Cloud & Hosting

Azure Data Warehouse: Businessdaten analysieren und neue Geschäftsmodelle identifizieren

Wo warten vielversprechende Absatzmärkte auf Ihr Unternehmen? Mit welchen Dienstleistungen können Sie sich vom Wettbewerb absetzen? Die Antworten auf diese Fragen liegen vielleicht schon in Ihren Businessdaten. Mit einem Data Warehouse machen Sie Geschäftschancen sichtbar und nutzen Wachstumspotenziale.

Auf rund 10 Milliarden US-Dollar Umsatz allein im Jahr 2024 schätzt der Businessanalyst Mordor Intelligence die Größe des Marktes für Active Data Warehousing. Bis zum Jahr 2029 gehen die Analysten von einem Anstieg auf etwa 17 Milliarden US-Dollar aus. Das entspräche einem jährlichen Wachstum von mehr als 10 %.

Als einer der großen Cloudanbieter am Markt bietet auch Microsoft Werkzeuge für die Datenanalyse im Data Warehouse an. Erfahren Sie hier, welche Tools dies sind und wie ein Azure Data Warehouse arbeitet.

Inhaltsverzeichnis

Was ist Azure Data Warehouse von Microsoft?

Azure ist der Markenname der Cloud-Computing-Plattform von Microsoft. Unter dieser Dachmarke bietet der Hersteller seinen Geschäftskunden rund 200 verschiedene Cloud-Dienste an. Die Bandbreite dieser Dienste reicht von Werkzeugen für die Software-Entwicklung und Containerisierung, über Backup-Services bis hin zu Datenbank-Applikationen für die Speicherung und Analyse großer Datenmengen („Big Data“).
Bei der Bezeichnung von Speicherbeständen für sehr große Datenmengen folgt Microsoft den branchenüblichen Einteilungen.

Azure Data Warehouse

Ein Azure Data Warehouse (auf Deutsch: „Lagerhaus“) ist ein Datenspeicher („Repository“) auf Azure-Basis, in dem Sie Ihre Geschäftsdaten für die Datenanalyse ausschließlich strukturiert ablegen. Strukturierte Daten sind Daten, die ein bekanntes Format haben und daher auch in Tabellenform gespeichert werden können. Eine Datenbank, die mit solchen Tabellen arbeitet, wird auch relationale Datenbank genannt.
Die Reihenfolge beim Verarbeiten von Businessdaten in einem Data Warehouse lautet in der Regel: Erfassen – Strukturieren/Schematisieren – Speichern – Analysieren. Dieses Prinzip wird im Englischen auch als „Schema-on-Write“ bezeichnet, weil das Datenmodell bereits beim Speichern (Englisch: „to write“) zugewiesen wird.

Azure Data Lake

Ein Azure Data Lake (auf Deutsch: „Datensee“) ist ein Datenspeicher, in dem Sie Geschäftsdaten auch unstrukturiert verwahren können. Auch gemischte Datenbestände, die sich aus strukturierten, teilstrukturierten und unstrukturierten Daten zusammensetzen, sind möglich. Weil unstrukturierte Daten nicht in Tabellen organisiert werden können, arbeitet ein Data Lake mit nicht-relationalen Datenbanken, anderen Speicherformaten oder auch einer Kombination aus relationalen und nicht-relationalen Datenbanken.
Im Data Lake lautet die Reihenfolge in der Datenverarbeitung: Erfassen – Speichern – Strukturieren/Schematisieren – Analysieren. Die Daten werden also erst dann vollständig in eine Struktur gebracht, wenn sie für die Businessanalyse wieder ausgelesen werden (Englisch: „to read“). Entsprechend heißt dieses Prinzip im Englischen auch „Schema-on-Read“.

Azure Data Lakehouse

Neben den beiden Ordnungsprinzipien Warehouse und Data Lake gibt es in der Praxis auch Mischformen aus den beiden Repository-Varianten, die parallel mit Schema-on-Write und Schema-on-Read arbeiten. Solche Datenspeicher werden dann als Data Lakehouse bezeichnet. Es handelt sich hierbei um ein Kunstwort, das die Bezeichnungen Data Warehouse und Data Lake kombiniert.
Die Analogien zum Lagerhaus und zum Datensee sind nicht zufällig gewählt. Das virtuelle Datenlagerhaus organisiert seine Daten über mehrdimensionale Tabellen, vergleichbar dem Koordinatensystem im Hochregallager eines echten Lagerhauses. Der Datensee hingegen speichert seine unstrukturierten Inhalte jeweils dort, wo gerade Platz verfügbar ist. Erst bei der Entnahme der Daten zur Analyse ergeben sich deren tatsächliche Dimensionen.
Typische Data Warehouses und Data Lakes enthalten heute sehr große Datenmengen bis in den Bereich von mehreren Petabytes. Das Handling solcher Volumina übersteigt üblicherweise die Kapazitäten lokaler Datenserver. Daher werden derartige Repositories zunehmend „cloudnative“, also direkt innerhalb einer Datencloud errichtet.
Gut gelaunter Mann mit einem Headset vor einem Notebook.

Microsoft Azure: Back-up, SharePoint und Virtual Desktops

Sichern und archivieren Sie wertvolle Daten jetzt noch einfacher.

Mit Single-Sign-on für IT-Anwendungen und SharePoint-Integration stellen Sie Desktop-Anwendungen jetzt noch schneller bereit.

Und mit dem Azure Virtual Desktop konzentrieren Sie sich auf Strategie und Management – statt um die Verwaltung Ihrer Infrastruktur.

Architektur eines Azure Data Warehouse

Ein Azure Data Warehouse ist kein Standardprodukt, sondern wird für jedes Unternehmen individuell geplant und errichtet – in Abhängigkeit von den dort anfallenden Datenmengen, Datentypen und den dahinter stehenden Geschäftsprozessen.
Microsoft Azure gehört außerdem zu den meistgenutzten Cloud-Plattformen weltweit. Daher gibt es neben den oben genannten eigenen Diensten von Microsoft viele weitere Applikationen von Drittanbietern, mit denen Sie Ihre Daten in der Azure-Cloud sammeln, aggregieren und auswerten können. Somit gibt es zahlreiche Bausteine, aus denen Sie Ihr Azure Data Warehouse errichten können.
Die Azure-Umgebung ist hierfür bewusst offen und flexibel gestaltet. So können Sie mit den verfügbaren Werkzeugen individuelle „Datenpipelines“ für die Verarbeitung, Analyse und Visualisierung Ihrer Businessdaten erstellen.
Hierfür unterstützt Azure nahezu alle heute gängigen Programmsprachen wie C#, Java, JavaScript, Python, PowerShell und Go. Speziell für Machine Learning, Big Data und Datenanalytik gibt es außerdem Schnittstellen für R und Scala.
Ihre Ausgangsdaten selbst können Sie beispielsweise On-Premises verwahren, also in einem Datenspeicher auf dem eigenen Firmengelände. Sie können sie auch in einer Microsoft-Cloud oder anderen Clouds speichern. Die Clouds können wiederum als Private Cloud oder Public Cloud oder als Mischform („Hybrid Cloud“) eingerichtet sein.
Das Foto zeigt eine Frau mit Smartphone

Whitepaper: Ihr Weg in die Cloud

Cloud-Lösungen sind entscheidend für die digitale Transformation. Mit unserem ausführlichen Leitfaden erwerben Sie das notwendige Wissen für die Migration auf moderne(re) Systeme. 

  • Die wesentlichen Migrationsschritte im Überblick
  • Spannende Fallbeispiele
  • Aktuelle Studienergebnisse
Jetzt kostenlos downloaden

Aufbau und Funktion einer Datenpipeline

Für die automatisierte Verarbeitung der Daten aus dem Azure Data Warehouse schlägt Microsoft selbst eine vierstufige Datenpipeline vor. Sie setzt sich aus folgenden Elementen zusammen:

Stufe 1: Datenquellen

Am Anfang der Pipeline stehen die zu verarbeitenden Daten. Sie können aus einem Cluster unterschiedlicher Datenstandorte und Quelltypen und stammen. Die Quellen können beispielsweise relationale und SQL-Datenbanken sein (Microsoft SQL Server, MySQL, Oracle oder SQLite, IBM Db2). Die Daten können aber auch direkt aus einem Customer-Relationship-Management (CRM) oder einem Enterprise Resource Planning (ERP) angeliefert werden, beispielsweise Microsoft Dynamics 365 oder SAP ERP.

Stufe 2: Datenintegration

Die Datenintegration, also das automatisierte Zusammenführen der Daten aus den oben genannten Quellen, erfolgt bei Microsoft in der sogenannten Azure Data Factory (ADF). Genau wie Amazon mit AWS Glue und Oracle mit Oracle GoldenGate bietet auch Microsoft mit ADF einen eigenen Clouddienst für diese Aufgabe. Daneben gibt es am Markt auch Produkte anderer Hersteller wie Informatica PowerCenter, Fivetran oder Denodo Platform.
Auf der Stufe der Datenintegration gibt es verschiedene Verfahrensmodelle wie „Extrahieren, Transformieren und Laden“ (ETL) und das modernere „Extrahieren, Laden und Transformieren“ (ELT) sowie die im Umfang noch einmal darüberhinausgehende Datenintegration als drittes Modell. Letzteres bietet auch Funktionalitäten wie das sogenannte Datenmapping, bei dem Inhalte aus den Quelldatenbanken nach vorgegebenen Regeln jeweils dazu passenden Feldern aus der Zieldatenbank zugeordnet werden.

Stufe 3: Analyse

Bei der Datenanalyse werden die zuvor gesammelten, strukturierten und aggregierten Daten nach vorgegebenen Kriterien ausgewertet. Microsoft selbst bietet Ihnen hierfür seinen Dienst Azure Analysis Services. Auch hier gibt es wieder weitere Alternativen am Markt wie Amazon Redshift, Google BigQuery und icCube.

Stufe 4: Visualisierung

Die Visualisierung der Daten setzt an der Mensch-Maschine-Schnittstelle an. Sie macht die ermittelten Daten mittels Diagrammen, Grafiken und aggregierten Tabellen sichtbar und fassbar für Marktanalytiker, Business Development Manager und Führungskräfte. Microsoft setzt hier mit seinem Visualisierungswerkzeug Power BI an. Dieses bietet auch Exportschnittstellen, um die erhobenen und visualisierten Daten beispielsweise zurück in ERP zu transferieren, um sie mit anderen Geschäftsdaten besser in Beziehung zu setzen.
Mann steht inmitten einer Server-Racklandschaft in einem Rechenzentrum

Vodafone Total Cloud Professional Services

Wir beraten Sie in jeder Phase Ihres Cloud-Projekts und erarbeiten mit Ihnen, welche IT-Ressourcen Sie haben – und welche Sie brauchen. Zusammen entwerfen wir in unserer Roadmap das Design und den Aufbau Ihrer optimalen IT-Landschaft.

  • Effiziente Beratung auf den Punkt
  • Alles aus einer Hand

Mögliche Anwendungsfälle

Data Warehouses werden bereits seit vielen Jahren für die Datenanalyse genutzt und sind daher bereits in zahlreichen Branchen als Werkzeug der Business Intelligence (BI) etabliert.
Mit dem Aufkommen immer größerer Datenmengen entwickeln sich auch die Data Warehouse-Technologien und die Analysewerkzeuge fortlaufend weiter. Inzwischen bieten immer mehr Anbieter neue Funktionen auf Basis künstlichen Intelligenz (KI) für die Datenanalytik, aber auch für die Visualisierung.
Besonders datengetriebene Branchen und Unternehmen arbeiten naturgemäß viel mit Data Warehouses. Dazu gehören:
  • IT- und Kommunikationsanbieter
  • Banken und Versicherungen
  • Unternehmen mit internetbasierten Geschäftsmodellen
  • Unternehmensberatungen und Business Developer
  • Technologieunternehmen
Ein Mann und eine Frau sitzen lächelnd vor einer Tischplatte, auf der mehrere Computer stehen. Beide blicken auf ein Tablet.

Microsoft Fabric - Die Zukunft der Datenanalyse auf Azure

Microsoft Fabric ist die ganzheitliche Datenplattform für Unternehmen, die Datenintegration, Analyse und KI-gestützte Erkenntnisse in einer einzigen Lösung vereint. Mit nahtloser Einbindung in Microsoft Azure ermöglicht Fabric eine skalierbare, sichere und leistungsstarke Datenverarbeitung - von der Quelle bis zur Visualisierung.

Nutzen Sie die volle Power von Microsoft Fabric auf Azure. Für schnellere Insights und smartere Entscheidungen!

Sicherheit, Governance und Compliance

Wo viele Geschäftsdaten verwahrt und ausgewertet werden, müssen immer auch die Themen Sicherheit und Compliance mitgedacht werden. Praktisch alle Data Warehouses speichern in ihren Beständen auch persönliche Daten von Kund:innen, Mitarbeiter:innen oder Geschäftsparter:innen im Sinne der Datenschutz-Grundverordnung.
Microsoft hat seine Rechenzentren zwischenzeitlich nach Regionen und Ländern geclustert und bietet Ihnen so die Möglichkeit, den Verwahrungsort Ihrer Daten vorab zu bestimmen. Innerhalb Deutschlands gibt es beispielsweise die Datenstandorte Berlin und Frankfurt.
Doch Datenschutz und Datensicherheit müssen im Fall eines Data Warehouses entlang der gesamten Verarbeitungspipeline garantiert sein. Wenn Sie Ihre Daten beispielsweise in einem Rechenzentrum in Deutschland verwahren, aber das von Ihnen genutzte Analysewerkzeug eines Drittanbieters Ihre Daten auf einem Server außerhalb der EU analysiert, ist dies mit hoher Wahrscheinlichkeit bereits ein Verstoß gegen die Datenschutzgrundverordnung.
Gerade bei aktuellen Werkzeugen mit KI-Funktionalität besteht immer ein gewisses Risiko, dass ein Teil der Verarbeitung auf Servern außerhalb der EU erfolgt.
Microsoft garantiert deshalb, dass die als Software-as-a-Service (SaaS) aufgesetzte Variante seines KI-Werkzeuges Microsoft 365 Copilot Ihre Geschäftsdaten nicht auf anderen Servern speichert. Nutzen Sie aber stattdessen die kostenlose Variante des Microsoft Copilot, haben Sie diese Gewährleistung nicht.
Ein Mann mit Kapuze sitzt vor einer Tastatur, im Vordergrund grüne Viren- und Datensymbole

Risikofreies Cloud-Computing: Vodafone Total Cloud Security

Immer mehr DDoS-Attacken, professionellere Hacker-Angriffe, gestiegene Compliance-Anforderungen – nie war es wichtiger, Ihre Infrastruktur vor Risiken zu schützen als heute.

Unser DDoS Mitigation Service analysiert einlaufenden Traffic und alarmiert Sie automatisch bei drohenden Attacken. Mit Managed Firewall bekommen Sie umfassenden hardware-dedizierten Schutz vor IT-Gefahren. Außerdem verfügen wir über die ISO 27001-Zertifizierung für Cloud & Hosting Services und für Rechenzentrums-Dienstleister in Deutschland.

Laufender Betrieb und Kostenkontrolle

Um ein Data Warehouse zu betreiben, reicht es nicht, nur die notwendige Software, die Rechenleistung und den Speicherplatz anzumieten. Denn jede Datenanalyse ist nur so gut, wie die zugrundeliegenden Daten und die Qualität aller Verarbeitungsschritte entlang der Datenpipeline.
Daher haben sich in den letzten Jahren einige spezialisierte Berufe rund um Einrichtung und Betrieb von Data Warehouses etabliert. Dazu gehören Administrator:innen, sowie Sicherheits- und IT-Expert:innen mit entsprechenden Spezialisierungen für Cloudmanagement und Cloudsicherheit. Dazu gehören auch Datenbank-Expert:innen sowie Datenmodellierer:innen und Data Warehouse Business Analyst:innen für die eigentliche Businessanalytik.
Ein Data Warehouse ist kein temporäres Projekt, sondern wird üblicherweise über einen langen Zeitraum geplant, eingerichtet, mit Daten befüllt und im laufenden Betrieb ständig weiterentwickelt.
Für Unternehmen, die angesichts der schwer kalkulierbaren Kosten eines eigenen Data Warehouses mehr Planbarkeit wünsche, gibt es daher inzwischen auch das Datenlagerhaus als Online-Service aus der Cloud. Ein solches Produkt wird auch als Data-Warehouse-as-a-Service (DWaaS) bezeichnet.
Symbolische Cloud-Darstellung

Garantierte Sicherheit: Private-Cloud-Angebote von Vodafone

Legen Sie bei Cloud-Anwendungen Wert auf garantierte Sicherheit? Dann ist die Private Cloud genau die richtige Lösung für Sie. Denn genau das bietet die auf Ihre Ansprüche zugeschnittene IT-Infrastruktur in unserem Tier3+-Rechnzentrum in Frankfurt.

Unsere Private-Cloud-Angebote sind einfach und flexibel skalierbar – passgenau zu Ihrem Business-Bedarf. So ist Ihr Unternehmen allen Anforderungen in einem dynamischen Markt gewachsen und haben dabei stets Ihre Kosten und Ressourcen im Blick.

Das Wichtigste zu Azure Data Warehouse in Kürze

  • Auf der Azure-Cloudplattform von Microsoft können Sie ein eigenes Data Warehouse betreiben.
  • Ein Data Warehouses unterscheidet sich vom ebenfalls sehr verbreiteten Data Lake durch die Form der gespeicherten Daten. Alle Daten im Data Warehouse sind strukturiert und können daher in relationalen Datenbanken gespeichert werden.
  • Ein Data Warehouse ist ein individuelles Produkt, dass passend zum Unternehmen und den dort zu analysierenden Datenbeständen geplant und eingerichtet wird.
  • Entlang einer virtuellen Pipeline werden die Datenbestände eines Data Warehouses gesammelt, aggregiert, analysiert und schließlich für die Entscheider:innen und Analyst:innen im Unternehmen aufbereitet.
  • Inzwischen gibt es auch Data Warehouses als zu mietenden Cloudservice. Ein solches Produkt wird als Data-Warehouse-as-a-Service (DWaaS) bezeichnet.
Das könnte Sie auch interessieren:
Cloud & Hosting

Cloud-Back-up: So sichern Sie Ihre Daten einfach und bequem in der Wolke

Cloud-Back-ups bieten kostengünstigen Speicher für die Sicherung großer Datenmengen und ermöglichen einet nahezu unterbrechungsfreie IT-Wiederherstellung. Mittlerweile nutzen 90 % der deutschen Unternehmen Private oder Public Clouds, wie der Bitkom „Cloud Report 2025“ zeigt – unter anderem für die Datensicherung. Wie Cloud-Back-ups funktionieren und was Sie als Unternehmen beachten sollten, erfahren Sie hier.

Digitalisierungsberatung

Die Beraterinnen und Berater helfen Ihnen kostenlos und unabhängig bei praktischen Fragen und geben konkrete Tipps. Vereinbaren Sie einen unverbindlichen Termin um Ihr Anliegen zu besprechen.

Termin vereinbaren