Schmuckbild
IoT

Was ist ein Data Warehouse?

Alle wichtigen Geschäftsdaten an einem Ort zentral gesammelt und bereit für die punktgenaue Auswertung. Das leistet ein Data Warehouse. Es ist eine verlässliche Grundlage für wichtige Geschäftsentscheidungen und liefert – richtig angelegt und genutzt – echte Wettbewerbsvorteile.

Eine Analyse kann nur so gut sein wie die Daten, auf denen sie basiert. An dieser Stelle kommen Data Warehouses ins Spiel. Hier können Sie relevante Daten aus verschiedensten Quellen speichern, strukturieren und verknüpfen. Wir werfen einen Blick auf die Funktionsweise und Vorteile dieser Lösung und zeigen, warum ein Data Warehouse die Grundlage für eine sinnvolle Verknüpfung von Business Intelligence und Data Engineering ist.

Inhaltsverzeichnis

Was ist ein Data Warehouse?

Ein Data Warehouse (DWH) ist wie ein zentrales Archiv für wichtige Geschäftsdaten. Anders als die Systeme, die Sie für den täglichen Betrieb nutzen, speichert ein DWH Daten aus verschiedenen Quellen – internen wie externen – an einem Ort und bereitet sie nach Themen sortiert auf. So entsteht eine einheitliche und verlässliche Grundlage für alle Arten von Auswertungen und Berichten. Data Warehouses sind also speziell für analytische Zwecke konzipiert.
In der Praxis kann das so aussehen: Unternehmen nutzen verschiedene Programme für unterschiedliche Aufgaben – etwa für Verkauf, Buchhaltung, CRM und Marketing. Ein Data Warehouse sammelt die relevanten Informationen aus all diesen Systemen, ordnet sie und macht sie so nutzbar. In vielen Branchen ist diese Art der Datenaufbereitung auch gesetzlich vorgeschrieben. Die Aufsichtsbehörden in Europa geben beispielsweise strenge Regeln für Banken vor: Der Basler Ausschuss für Bankenaufsicht (Basel Committee on Banking Supervision, BCBS) legt etwa Grundsätze für die „effektive Aggregation von Risikodaten und die Risikoberichterstattung“ fest und macht so Data Warehouses notwendig.
Eine Frau sitzt lächelnd vor einem Notebook

Vodafone Modbus Cloud Connect

Das All-in-One-Produkt für eine direkte Verbindung von Modbus-RTU-Geräten über LPWA (NB-IoT & LTE-M) in die Cloud.

  • Einfache Installation & Inbetriebnahme
  • Einfaches IoT-Upgrade von Bestandsgeräten (Retrofit)
  • Einfache, autarke Datenkommunikation über Narrowband-IoT & LTE-M
  • Einfacher und gesicherter Betrieb über den Lebenszeitraum

Data Warehouse vs. Datenbank vs. Data Lake vs. Data Mart

Um ein Data Warehouse richtig zu verstehen und in der Folge korrekt aufzusetzen, sollten Sie einige Fachbegriffe rund um das Thema kennen. Dazu gehören die klassische Datenbank, der Data Lake und der Data Mart. Die Unterschiede und Zusammenhänge erläutern wir im Folgenden.
Datenbank: Hierbei handelt es sich um eine digitale Ablage. Der größte Unterschied zwischen einem Data Warehouse und einer Datenbank sind der primäre Zweck und die Art der gespeicherten Daten. Datenbanken sind darauf ausgelegt, Daten für den täglichen Betrieb zu speichern, abzurufen und zu verwalten. Sie laufen beispielsweise im Hintergrund von Webshops, Buchhaltungs- und Kundenmanagementsystemen. Anders als Data Warehouses speichern Datenbanken üblicherweise nur aktuelle Daten und erlauben so keine Analyse von Trends und Mustern über bestimmte Zeiträume hinweg.
Data Lake: Hier können Sie große Mengen an Rohdaten in verschiedenen Formaten ablegen. Im Gegensatz zum Data Warehouse, bei dem die Daten schon vor der Speicherung einem strengen Schema unterliegen (Schema-on-Write), wird im Data Lake das Schema erst bei der Analyse angewendet (Schema-on-Read). So lassen sich vielfältige Daten speichern, ohne dass vorher genau klar sein muss, wie sie genutzt werden.
Data Mart: Dies ist eine Teilmenge eines Data Warehouse, die auf eine bestimmte Geschäftseinheit oder Abteilung zugeschnitten ist. Ein Data Mart enthält in der Regel eine Auswahl von Daten, die für die jeweiligen Nutzer:innen relevant und aufbereitet sind. Data Marts vereinfachen den Zugriff auf die benötigten Informationen, da die Datenmenge im Vergleich zum gesamten Data Warehouse reduziert ist.

Vorteile eines Data Warehouse

Data Warehouses helfen Ihrem Unternehmen dabei, aus Daten einen Vermögenswert zu machen. Die strategische Zusammenführung und Auswertung der Daten ermöglichen fundierte Entscheidungen und präzisere Prognosen. Im Zusammenspiel mit Predictive Analytics entdecken Sie so neue Geschäftsmodelle.
Natürlich können Sie die benötigten Informationen auch auf anderem Weg beschaffen – indem Sie etwa Ihre Beschäftigten mit der Recherche und Analyse beauftragen. Doch ein Data Warehouse spart dabei Zeit und Ressourcen, erleichtert die Datenaufbereitung und umgeht Fehlerquellen.
So kann ein Data Warehouse auch ein Vorteil Ihren Mitbewerbern gegenüber sein, wenn Sie es schaffen, präzise Rückschlüsse auf Kundenbedürfnisse zu ziehen. Der entscheidende Faktor dabei können etwa historische Daten sein. Sie lassen Rückschlüsse auf Trends zu und ermöglichen ein exaktes Risikomanagement. Durch die Bereinigung der Daten im Data Warehouse entsteht außerdem ein Pool an hochwertigen und verlässlichen Informationen.
Ein Mann sitzt mit Tablet im Gewächshaus

Narrowband-IoT und­ LTE-M:­ Konnektivität im IoT-Umfeld

Ganz gleich, wo Sie sich aufhalten: Mit Narrowband-IoT und LTE-M gelingt Maschinenkommunikation auch unter schwierigen Bedingungen. Und das bei besonders geringem Stromverbrauch und somit langen Akkulaufzeiten.

  • Narrowband-IoT sorgt für beste M2M-Netzabdeckung
  • Über LTE-M lassen sich auch Sprachdaten übertragen
  • Auch in Kellern oder entlegenen Gebieten einsetzbar
Jetzt mehr erfahren

Architektur und Komponenten

Die Architektur eines Data Warehouse umfasst im Wesentlichen vier zentrale Komponenten:
  • Eine leistungsstarke Datenbank
  • Prozesse zur Datenintegration (ETL oder ELT – Extract, Load, Transform – die Prozesse unterscheiden sich in der Reihenfolge)
  • in Metadaten-Management
  • Zugriffswerkzeuge für die Endnutzer:innen
Datenbank: Sie ist das Herzstück eines Data Warehouse und kann entweder On-Premises oder als Cloud-Lösung genutzt werden.
Datenintegration: Hier harmonisiert das Data Warehouse die Daten aus den verschiedenen Quellen. Das System gleicht unter anderem die Formate an: etwa das Datum („YYYY-MM-DD“ oder „DD.MM.YYYY“) oder ob bei Zahlen ein Punkt oder ein Komma als Dezimaltrennzeichen verwendet wird.
Metadaten: Sie liefern Informationen über die Herkunft, Verwendung, Bedeutung und Struktur der Daten. Beispielsweise erhalten Tabellen eine passende Spaltenbeschriftung (z.B.: Kunden-ID, Name, Adresse). Außerdem erfahren Nutzer:innen, wie einzelne Begriffe in Ihrem Unternehmen definiert sind (etwa: Der Umsatz ist der Gesamtbetrag der verkauften Waren abzüglich Retouren).
Zugriffswerkzeuge: Hierbei handelt es sich um die Schnittstelle zu den Nutzer:innen, die Informationen filtern und analysieren. Dazu zählen folgende Tools:
  • Klassische Berichts- und Abfragetools (z.B. SAP Crystal Reports oder Microsoft SSRS)
  • OLAP-Systeme (Online Analytical Processing, z.B. Microsoft Analysis Services oder Tableau Cube)
  • Data-Mining-Lösungen (z.B. KNIME, RapidMiner)
  • Plattformen für Machine Learning (z.B. TensorFlow oder Azure Machine Learning)

Technologien und Konzepte

Das grundsätzliche Konzept hinter einem Data Warehouse ist ein System aus verschiedenen Schichten. Die bereits erwähnten ELT-Prozesse bilden dabei den Einstieg – dann folgen diese Schichten:
  1. Datenschicht: Sie enthält die extrahierten und transformierten Daten. Technologien wie Datenbankserver und Datenintegrationswerkzeuge sind in dieser Schicht relevant für die Verwaltung und Bereitstellung der Daten.
  2. Semantische Schicht: Sie zielt darauf ab, Daten für die Nutzer:innen zu vereinfachen. Hier spielen die erwähnten OLAP-Systeme eine zentrale Rolle.
  3. Analytische Schicht: Auch Frontend- bzw. Präsentationsschicht genannt. Hier kommen die Zugriffswerkzeuge zum Einsatz.
Dieser Schichtaufbau ist eine vereinfachte Darstellung des Konzepts Data Warehouse. Moderne Varianten und Weiterentwicklungen legen einen Fokus auf Anwenderfreundlichkeit, um Fachanwender:innen einen direkten und einfachen Zugriff zu ermöglichen. Dabei hilft etwa eine erweiterte und verbesserte semantische Schicht, Daten leichter zu verstehen, in Beziehung zu setzen und mit Geschäftsinformationen zu erweitern. Darüber hinaus lassen sich virtuelle Arbeitsbereiche definieren, in denen beispielsweise Beschäftigte aus unterschiedlichen Bereichen gemeinsam an einem Bericht arbeiten können.
Schmuckbild
Ein typisches Data Warehouse besteht aus mehreren, aufeinander aufbauenden Schichten.

Business Intelligence und Data Engineering

Business Intelligence (BI) analysiert Daten und unterstützt die Entscheidungsfindung. Data Engineering umfasst Prozesse und Infrastruktur für die Sammlung, Speicherung und Aufbereitung dieser Daten. Ihr Data Warehouse ist dafür die Basis.
Data Engineers sind verantwortlich für den Aufbau, die Wartung und die Optimierung der Data-Warehouse-Infrastruktur. Sie stellen sicher, dass die Qualität der Daten stimmt und sie so geordnet sind, dass nachgelagerte BI-Anwendungen zuverlässig funktionieren. Denn BI-Tools nutzen die Daten im Data Warehouse, um Berichte zu erstellen, Dashboards zu visualisieren, Trends zu identifizieren und komplexe Analysen durchzuführen. An anderer Stelle im V-Hub erfahren Sie mehr zum Thema Big Data Analytics.
Das Bild zeigt eine Hand unter einer symbolischen Wolke

Flexibel, skalierbar und sicher: Vodafone Cloud- und Hosting-Services

Sie suchen Cloud-Lösungen, die sich individuell und flexibel entsprechend Ihrer Business-Anforderungen anpassen lassen?

Bei der Sie bei Bedarf alle Services aus einer Hand erhalten und sich über Performance und Datensicherheit keine Gedanken machen müssen?

Gerne helfen wir Ihnen bei der Auswahl der passenden Cloud & Hosting Services für Ihr Unternehmen und unterstützen Sie mit Informationen, worauf es anderen Unternehmen bei der Auswahl eines passendens Cloud-Anbieters ankommt. 

Anwendungsfälle und Beispiele von Data Warehouses

Data Warehouses kommen in verschiedenen Branchen und Bereichen zum Einsatz. Zwei Beispiele sind:
Optimierung der Lieferkette: Ein Produktionsunternehmen möchte Engpässe in seiner Lieferkette vermeiden und gleichzeitig Kosten senken. Das Data Warehouse führt Daten der Produktionsplanung, Lagerverwaltung und Logistik mit den Informationen der Zulieferunternehmen zusammen. Damit lassen sich nun die Lieferzeiten analysieren, die Lagerbestände optimieren und die Performance der Zulieferer bewerten.
Kundenanalyse im Einzelhandel: Um das Kundenverhalten besser zu verstehen und Marketingkampagnen zu optimieren, könnte ein Einzelhandelsunternehmen ebenfalls ein Data Warehouse nutzen. Hier laufen Verkaufsdaten aus den Kassensystemen, dem Online-Shop und CRM-Daten zusammen. Damit könnten Sie beispielsweise Kundensegmente identifizieren: Kund:innen mit ähnlichen Kaufmustern oder demografischen Merkmalen. Oder Sie analysieren das Kaufverhalten: Welche Produkte werden häufig zusammen gekauft? Welche Produkte werden zu bestimmten Zeiten oder in bestimmten Regionen besonders stark nachgefragt?

Data Warehouse: Das Wichtigste in Kürze

  • In einem Data Warehouse laufen wichtige Geschäftsdaten aus verschiedenen Systemen und Abteilungen zusammen.
  • Es fungiert als zentrales Archiv, mit dem Sie Analysen und Berichte erstellen und Prognosen für die Zukunft treffen können.
  • Wichtige Vorteile eines Data Warehouse sind die Schaffung eines Pools an qualitativ hochwertigen Daten und die Ersparnisse an Zeit und Ressourcen bei der Erhebung und Analyse der Informationen.
Das könnte Sie auch interessieren:
Digitalisierung
Schmuckbild

So hoch ist der Datenverbrauch im Homeoffice

Videokonferenzen, Downloads hochauflösender Grafiken, Uploads von Projektdateien und Software-Aktualisierungen – an einem einzigen Tag im Homeoffice kann der Datenverkehr viele Gigabyte betragen. Viele Beschäftigte arbeiten mittlerweile einen oder mehrere Tage die Woche zu Hause, und nicht immer funktioniert das DSL oder der Kabelanschluss einwandfrei. Dann müssen Sie unter Umständen auf den Internetzugang via Mobilfunknetz ausweichen. Doch wie viel Gigabyte sollten Sie an Datenverbrauch kalkulieren, wenn Sie per LTE oder 5G ins Internet gehen? Nach einer Erhebung von Statista arbeitet mittlerweile rund ein Viertel der Beschäftigten mindestens einen Tag der Woche im Homeoffice (Stand: Februar 2025). In manchen Branchen ist der Anteil sogar erheblich höher und einige Firmen setzen komplett auf Remote-Arbeitsplätze. Das Datenvolumen, das an einem Tag im Homeoffice anfällt, kann je nach Tätigkeit und Branche ebenfalls erheblich variieren. Kann ein Mobilfunkvertrag diese Datenmengen überhaupt abdecken?

Digitalisierungsberatung

Die Beraterinnen und Berater helfen Ihnen kostenlos und unabhängig bei praktischen Fragen und geben konkrete Tipps. Vereinbaren Sie einen unverbindlichen Termin um Ihr Anliegen zu besprechen.

Termin vereinbaren