Entdecken Sie, wie Microsoft Fabric die Datenanalyse revolutioniert, und erfahren Sie, wie seine Kernfunktionen Unternehmen dabei unterstützen, datengesteuerte Entscheidungen zu treffen.
Microsoft Fabric ist die neue einheitliche Datenanalyseplattform von Microsoft und Azure Data. Sie ist dafür zuständig, eine Reihe von Daten-Toolsets (von denen einige bereits im Azure-Produktset vorhanden sind) unter einem Dach zu vereinen. Stellen Sie es sich als eine einzige Lösung vor, um Zahlen zu verarbeiten und Erkenntnisse zu liefern.
Das Ziel von Microsoft Fabric ist es, Unternehmen und Datenexperten zu ermöglichen, das Potenzial ihrer Daten für das Zeitalter der künstlichen Intelligenz zu erschließen. Fabric hat die Art und Weise, wie Daten interpretiert werden, revolutioniert und Analysen für jedermann zugänglich gemacht – nicht nur für Datenwissenschaftler.
In diesem Artikel werden wir Microsoft Fabric weiter entmystifizieren und uns mit seinen Kernfunktionen, einschließlich OneLake, und den verschiedenen auf der Plattform verfügbaren Workloads befassen. Am Ende des Artikels haben Sie einen aktuellen Einblick in Fabric und seine Vorteile.
Was ist Microsoft Fabric?
Microsoft Fabric ist eine All-in-One-Analyseplattform für Unternehmen und Datenexperten. Die Plattform deckt alles ab, von Data Science und Echtzeitanalysen bis hin zu Datenspeicherung und Datenmigration. Es handelt sich um eine zusammenhängende Plattform, die verschiedene Tools und Technologien in einer einzigen Lösung vereint.
Um sich Fabric vorzustellen, muss man sich zunächst seinen Zweck klarmachen: Einfachheit. Mit diesem Tool können Unternehmen Daten aus mehreren Quellen in einer einzigen Umgebung zusammenführen. Dank dieser Einfachheit können sich Datenexperten auf die Ergebnisse konzentrieren und nicht auf die Technologie, die sie verwenden. Außerdem müssen Datenteams nicht stundenlang überlegen, wie die Lizenzen für Synapse, Azure Data Factory und Power BI miteinander interagieren.
Funktionen von Microsoft Fabric
Das Microsoft-Team hat fünf Schlüsselbereiche als Unterscheidungsmerkmale zwischen Fabric und dem Rest des Marktes definiert. Dazu gehören:
#1 Eine umfassende Analyseplattform
Jedes Analyseprojekt hängt von mehreren unterstützenden Systemen ab. Diese unterstützenden Systeme haben oft einzigartige Anforderungen und erfordern oft Input von mehreren anderen Anbietern. Die Integration der verschiedenen Produkte dieser Anbieter kann eine schwierige, heikle und teure Aufgabe sein.
Hier kommt Microsoft Fabric ins Spiel.
Microsoft Fabric lindert dieses Problem, indem es Teams eine einzige Lösung bereitstellt, die eine einheitliche Benutzeroberfläche, Architektur und eine Vielzahl weiterer Tools bietet, die zum Extrahieren und Präsentieren von Erkenntnissen aus Daten erforderlich sind.
#2 Seezentriert und offen
Data Lakes sind oft chaotisch und komplex, was ihre Erstellung, Integration und Verwaltung zu einer äußerst anspruchsvollen Aufgabe macht. Sobald der Data Lake betriebsbereit ist, kommt es außerdem zu Datenduplizierung und Abhängigkeit von einem Anbieter. Dies ist auf die Verwendung mehrerer Datenprodukte zurückzuführen, die verschiedene proprietäre Datenformate auf demselben Data Lake verwenden.
Fabric löst dieses Problem durch die Einführung einer integrierten Software as a Service (SaaS), eines Multi-Cloud-Datensees namens „OneLake“. So wie alle Microsoft 365-Anwendungen automatisch an OneDrive angeschlossen werden, sind alle Workloads von Fabric in OneLake eingebunden.
Die integrierte Integration von OneLake hilft dabei, allgegenwärtige und unorganisierte Datensilos zu beseitigen, die entstehen, wenn Teammitglieder ihre eigenen getrennten Speicherkonten konfigurieren. OneLake bietet dem gesamten Team eine einzige, einheitliche Speichereinheit, die das Auffinden und Teilen von Daten vereinfacht.
#3 Künstliche Intelligenz
Der OpenAI-Dienst von Azure ist auf jeder Ebene in Microsoft Fabric integriert, damit Benutzer das volle Potenzial ihrer Daten ausschöpfen können. Diese Integration ermöglicht es Entwicklern auch, die Leistungsfähigkeit generativer KI auf Kundendaten anzuwenden und Geschäftsbenutzer bei ihrer Suche nach Erkenntnissen aus Daten zu unterstützen.
Da Copilot in jede Microsoft Fabric-Datenerfahrung integriert ist, können Benutzer Konversationssprache verwenden, um:
- Erstellen Sie Modelle für maschinelles Lernen
- Entwickeln von Datenflüssen und Datenpipelines
- Code und ganze Funktionen generieren
- Ergebnisse visualisieren
Benutzer können sogar ihre eigenen benutzerdefinierten Konversationssprachenerlebnisse erstellen, die ihre Daten mit Azure OpenAI Service-Modellen kombinieren und diese dann als Plug-Ins veröffentlichen.
#4 Empowerment für alle Geschäftsanwender
Teams innerhalb einer Organisation streben danach, eine datengesteuerte Kultur zu fördern, in der jeder befähigt wird, mithilfe von Daten bessere Entscheidungen zu treffen. Microsoft Fabric trägt dazu bei, diese Kultur zu fördern, indem es Analysen für alle zugänglich macht. Genauer gesagt ist Fabric tief in die typischen, alltäglichen Microsoft 365-Anwendungen integriert. Dadurch können Sie Ihre Microsoft 365-Anwendungen in einen zentralen Punkt zum Aufdecken und Anwenden von Erkenntnissen verwandeln.
#5 Kostensenkung durch vereinheitlichte Kapazitäten
Wenn verschiedene Produkte von mehreren Anbietern in einem einzigen Projekt kombiniert werden, kommt es in der Regel zu erheblicher Verschwendung. Dies liegt daran, dass Rechenkapazität in mehreren Systemen bereitgestellt wird, z. B. in Data Engineering, Data Warehousing und Business Intelligence. Sobald eines dieser Systeme ungenutzt ist, kann seine Kapazität nicht von einem anderen System genutzt werden, was bedeutet, dass Ressourcen verschwendet werden.
Fabric lindert dieses Problem, indem es die Komplexität des Ressourcenkaufs und -managements reduziert. Mit Fabric ist es möglich, einen einzigen Rechenpool zu kaufen, um alle Workloads (z. B. Datenintegration, Datenwissenschaft usw.) zu betreiben. Dieses All-Inclusive-Modell reduziert die Kosten erheblich, da alle ungenutzten Rechenressourcen in einem Workload von jedem beliebigen Workload genutzt werden können.
OneLake: Das Herz des Stoffes
Das Herzstück von Microsoft Fabric ist OneLake. In OneLake werden praktisch alle in Fabric verwendeten Daten gespeichert. Wie der Name schon sagt, ist OneLake ein einzelner, einheitlicher, logischer Datensee, der für die Unterstützung aller Ihrer Fabric-Workloads verantwortlich ist.
Oft wird ein Vergleich zwischen OneLake und OneDrive gezogen. Microsoft sagte beispielsweise: „Ähnlich wie Office Word-, Excel- und PowerPoint-Dateien in OneDrive speichert, speichert Fabric Seehäuser, Lagerhäuser und andere Objekte in OneLake.“ Dies hat viele dazu veranlasst, die Analogie zu übernehmen, dass OneLake für Daten das ist, was OneDrive für Dateien ist.
Vor der Einführung von OneLake erstellten Unternehmen in der Regel mehrere Lakes für verschiedene Teams, anstatt an einem einzigen Data Lake zusammenzuarbeiten, unabhängig davon, ob dies die Verwaltung zusätzlicher Ressourcen bedeutete. OneLake wurde eingeführt, um diese Herausforderungen zu beseitigen, indem Datensilos aufgebrochen und die Zusammenarbeit durch eine vereinfachte Verwaltung von Unternehmensdaten verbessert wird.
Zu den wichtigsten Funktionen gehören:
Verknüpfungen
Mit der Verknüpfungsfunktion können Benutzer Daten aus verschiedenen Geschäftsgruppen und Domänen in ihrem virtuellen Datenprodukt kombinieren. Dies bedeutet, dass Organisationen Daten problemlos zwischen verschiedenen Benutzern und Anwendungen austauschen können, ohne Informationen unnötig verschieben oder duplizieren zu müssen. Der Begriff „Verknüpfung“ bezieht sich auf Daten, die an weiteren Dateispeicherorten gespeichert sind, die sich innerhalb desselben Arbeitsbereichs oder in verschiedenen befinden können. Unabhängig vom Speicherort lässt die Verknüpfungsreferenz Dateien und Ordner so erscheinen, als wären sie lokal gespeichert.
Offenheit
Microsofts Azure Data Lake Storage (ADLS) Gen2 ist eine Suite von Funktionen für Big Data-Analysen, die auf Azure Blob Storage aufbaut. ADLS Gen2 bietet nicht nur riesigen Speicher, sondern akzeptiert auch strukturierte und unstrukturierte Datentypen. Diese Information ist nützlich, da OneLake auf ADLS Gen2 aufbaut und daher auf jeder Ebene offen ist.
OneLake ist auch mit vorhandenen ADLS Gen2-Anwendungen wie Azure Databricks kompatibel, da es dieselben ADLS Gen2-APIs und SDKs unterstützt. Daher sind keine Kenntnisse von Microsoft Fabric erforderlich, um auf die zugrunde liegenden Daten zuzugreifen. Benutzer können auf Daten in OneLake zugreifen, als wäre es ein riesiges ADLS-Speicherkonto für die gesamte Organisation.
Eine Kopie der Daten
Mit OneLake ist das Kopieren von Daten, damit sie mit einer anderen Engine verwendet werden können, oder das Aufbrechen von Silos, damit die Daten zusammen mit anderen Daten analysiert werden können, überholt. Es ist nicht mehr erforderlich. Laut der Dokumentation von OneLake „ zielt OneLake darauf ab, Ihnen den größtmöglichen Nutzen aus einer einzigen Datenkopie zu ziehen, ohne dass Daten verschoben oder dupliziert werden müssen.“
Governance als Standard
Einer der einzigartigen Vorteile von SaaS-Diensten ist das Konzept der Mandanten. Ein Mandant definiert eine Gruppe von Kunden, die gemeinsamen Zugriff und bestimmte Berechtigungen für eine Softwareinstanz haben. In der OneLake-Dokumentation heißt es: „ Zu wissen, wo die Organisation eines Kunden beginnt und endet, bietet eine natürliche Governance- und Compliance-Grenze, die letztendlich unter der Kontrolle eines Mandantenadministrators steht.“ Im Wesentlichen werden alle Daten, die in OneLake landen, standardmäßig verwaltet.
Fabric-Workloads und Benutzererfahrungen
Microsoft Fabric umfasst mehrere Workloads, die jeweils für bestimmte Personas entwickelt und automatisch in OneLake integriert werden, um jedem Benutzer ein einzigartiges Plattformerlebnis zu bieten.
Zu diesen Arbeitslasten gehören:
Datenfabrik
Die Datenfabrik bietet über 150 Konnektoren zu Cloud- und lokalen Datenquellen, die Möglichkeit zur Orchestrierung von Datenpipelines und Drag-and-Drop-Funktionen zur Datentransformation.
Synapse-Datentechnik
Die Datentechnik-Workload verfügt über coole Features, die innerhalb von Fabric funktionieren, wie z. B. Lakehouse. Ein Lakehouse-Artefakt existiert innerhalb seines eigenen Arbeitsbereichs und ermöglicht das, was Microsoft als „großartige Authoring-Erfahrungen“ mithilfe der Spark-Engine beschreibt. Es gibt auch andere coole Vorteile, wie den sofortigen Start mit Live-Pools und die Möglichkeit zur Zusammenarbeit.
Synapse-Data Warehouse
Die Data Warehouse-Workload bietet Dateningenieuren und -analysten eine konvergente Lakehouse- und Data Warehouse-Erfahrung. Hinter dem Warehouse steht ihre branchenführende (in Bezug auf offene Datenformate), einheitliche, serverlose und dedizierte SQL-Engine python dictionary.
Synapse-Echtzeitanalysen
Die Echtzeitanalyse-Workload ermöglicht Entwicklern das Streamen von Daten von IoT-Geräten (Internet of Things), Telemetriedaten, Protokollen und mehr. Sie können auch große Mengen halbstrukturierter Daten mit hoher Leistung und geringer Latenz analysieren, da die Kusto Query Language (KQL) als Grundlage dient.
Synapse-Datenwissenschaft
Mit der Data Science-Workload können Benutzer den gesamten Data Science-Prozess von Anfang bis Ende durchlaufen. Dies geschieht, indem Datenwissenschaftlern eine Vielzahl von Tools zur Verfügung gestellt werden, die zum Erstellen anspruchsvoller KI-Modelle, zur Zusammenarbeit an Projekten sowie zum Trainieren, Bereitstellen und Verwalten von Modellen für maschinelles Lernen erforderlich sind.
Business Intelligence (Power BI)
Das Herzstück der Business Intelligence-Arbeitslast von Fabric ist Microsofts branchenführender und KI-gesteuerter Analysedienst Power BI. Damit können Unternehmensanalysten und andere Benutzer Erkenntnisse aus Unternehmensdaten gewinnen. Darüber hinaus ist Power BI eng in Microsoft 365 integriert, sodass Unternehmen relevante Erkenntnisse direkt aus jedem der 365-Produkte gewinnen können.
Datenaktivator
Data Activator ist eine intuitive, codefreie Schnittstelle innerhalb von Microsoft Fabric, die dazu konzipiert ist, selbstständig Aktionen als Reaktion auf erkannte Muster oder bestimmte Bedingungen in sich entwickelnden Daten zu initiieren.
Fazit
Microsoft Fabric ist eine bahnbrechende Plattform, die eine Vielzahl von Azure-Tools und -Diensten unter einem einheitlichen Dach vereint.
Seine Kernfunktionen, wie OneLake und seine verschiedenen Workloads, ermöglichen Unternehmen und Datenexperten, intelligentere, datengesteuerte Entscheidungen zu treffen. Egal, ob Sie ein erfahrener Datenwissenschaftler oder ein Business-Analyst sind, der die Leistungsfähigkeit von Daten nutzen möchte, Microsoft Fabric bietet eine umfassende Lösung, die komplexe Datenaufgaben vereinfacht.
Eine der wichtigsten Integrationen in Microsoft Fabric ist Power BI, der branchenführende Analysedienst von Microsoft. Wenn Sie tiefer in die Datenanalyse und -visualisierung eintauchen möchten, sehen Sie sich unseren Skill Track „Power BI Fundamentals“ an . Dieser Track vermittelt Ihnen die Fähigkeiten, die Sie benötigen, um Rohdaten in aussagekräftige Erkenntnisse umzuwandeln – eine Fähigkeit, die die Funktionen von Microsoft Fabric perfekt ergänzt.