Dieser Blogbeitrag enthält alle notwendigen Informationen zu Power Query – einem der wichtigsten und leistungsstarken Tools im Microsoft Azure Power BI Service.
Wenn wir Power BI verwenden, verwenden wir unwissentlich Power Query-Funktionen zum Importieren und Transformieren von Daten für die weitere Verwendung. Dieser Blog bietet einen Nischenüberblick über Power Query und bespricht weitere seiner Funktionen.
Hinweis: Wenn Sie mit Power BI , seinem Zweck, seinen Vorteilen, Terminologien und zugehörigen Karriererollen nicht vertraut sind , lesen Sie Einführung in die Microsoft Power BI-Plattform | Alles, was Sie wissen müssen
In diesem Blogbeitrag geht es um:
Was ist Power Query?
Power Query ist ein leistungsstarkes Power BI-Tool, das Power BI-Vorgänge beim Suchen, Verbinden und Laden unterschiedlicher Daten aus verschiedenen Quellen übernimmt. Außerdem formt und transformiert es die importierten Daten, sodass sie zum Erstellen von Visualisierungen verwendet werden können. Es wird in Power BI auch als Self-Service-ETL-Tool bezeichnet, da es Daten eigenständig extrahieren, laden und transformieren kann. Sie können in Power BI Desktop darauf zugreifen, indem Sie im Home- Menü auf die Option „Daten abrufen“ klicken .
Vorteile von Power Query
Power Query bietet zahlreiche Vorteile und ist daher für viele BI-Reporter oder Analysten die bevorzugte Wahl:
- Kostenlos: Power Query ist als kostenloser Tool-Dienst in Power BI verfügbar. Power BI-Benutzer müssen es nicht als zusätzliches Add-On kaufen oder aus externen Quellen installieren. Melden Sie sich einfach beim Power BI-Konto an und verwenden Sie es sofort.
- Umfangreiche Datenquellen: Power Query unterstützt die Verbindung und den Import einer riesigen Liste von Datenquellen. Dazu gehören Excel-Dateien oder Arbeitsmappen, Text- oder CSV-Dateien, Dateien aus der Cloud oder lokale Datenspeichersoftware.
- Excel-Integration: Power Query ist jetzt kostenlos für alle in Microsoft Excel integriert. Dies erleichtert Excel-Benutzern den Wechsel zu Power BI, wenn sie nach einem grundlegenden ETL von Daten schöne Berichte erstellen möchten.
- Benutzerfreundlich: Power Query erfordert nicht, dass der Benutzer Codeteile lernt oder verwendet, um ETL-Vorgänge auszuführen. Der Power Query Editor, die Umgebung für Power Query, bietet einfache GUI-Vorgänge zum Auswählen, Ziehen und Klicken, um dieselben ETL-Aufgaben für Benutzer auszuführen, die mit dem Codieren nicht vertraut sind. Ein weiterer Vorteil besteht darin, dass die GUI-Option Ihre Arbeit schneller und einfacher macht.
- Nicht wiederkehrende Aufgaben: Der größte Vorteil von Power Query besteht darin, dass die Benutzer dieselben Aufgaben oder Datenoperationen nicht nach einer gewissen Zeit neu schreiben/durchführen müssen. Dies liegt daran, dass alle in Power Query ausgeführten ETL-Schritte als Abfrageschritte im Editor gespeichert werden. Um eine Operation zu wiederholen, gehen Sie einfach zu dem jeweiligen Abfrageschritt und aktualisieren Sie ihn. Dadurch können sich die Benutzer leichter auf die Geschäftslogik konzentrieren und müssen sich weniger Gedanken über das Verfahren machen.
- M-Sprache: Dies ist die Abfragesprache für Power Query, um Aufgaben wie die Verbindung zu Daten, deren Import und die Umwandlung in Datenmodelle auszuführen. Sie ist als Programmiersprache leicht zu erlernen und anzuwenden und führt alle Vorgänge effizient aus. Die M-Sprache ist eine Groß-/Kleinschreibung beachtende und funktionale Sprache, die aus „let“- und „in“-Blockanweisungen besteht, die wie jede andere Sprache Variablen, Konstanten und Funktionen enthalten. Die Ausgabe der Abfragen kann entweder an den Power BI-Datenmodellbereich oder an eine Excel-Arbeitsmappe gesendet werden.
Ein Blick auf den Power Query Editor
Der Power Query-Editor ist eine Umgebung, in der wir mit Power Query arbeiten können. Werfen wir einen Blick in den Power Query-Editor und verstehen wir seine verschiedenen Teile und ihre Zwecke.
- Um den Power Query-Editor nach der Anmeldung bei Power BI Desktop zu öffnen, gehen Sie zur Option Daten abrufen im Home- Menü -> Leere Abfrage
Da noch keine Daten importiert wurden, ist der Power Query-Editor leer. Schauen wir uns an, in welche Teile der Editor unterteilt ist:
- Abfragebereich: Zeigt eine Liste aller aktiven Abfragen im Projekt. Eine Abfrage kann als Container mit mehreren Schritten der Datentransformation betrachtet werden, die mit Code (M-Language) oder der GUI durchgeführt werden. Wenn Sie eine Abfrage auswählen, werden die transformierten Daten im mittleren Bereich angezeigt. Doppelklicken Sie auf die Registerkarte der Abfrage, um ihren Namen zu ändern, oder ziehen Sie sie, um ihre Reihenfolge zu ändern. Sie können auch nicht wiederkehrende Aufgaben der Abfrage ausführen, indem Sie sie einfach aktualisieren oder in eine andere Abfrage kopieren und einfügen.
- Registerkarte „Formel“: Diese Registerkarte zeigt einen kurzen Ausschnitt der neuesten M-Language-Befehle im Zusammenhang mit den Transformationen, die an den Daten in einer bestimmten Abfrage oder den Schritten innerhalb einer Abfrage durchgeführt wurden. Auch wenn die Transformation mithilfe der GUI durchgeführt wird, zeigt die Registerkarte „Formel“ den angewendeten Backend-M-Codeausschnitt. Sie können die Registerkarte erweitern, um den gesamten Befehl anzuzeigen.
- Abfrageeinstellungen: Dieser Abschnitt auf der rechten Seite zeigt alle Informationen der ausgewählten Abfrage aus dem Bereich „Abfragen“. Er besteht aus zwei Unterabschnitten:
- Der Abschnitt „Name“ zeigt den aktuellen Abfragenamen, an dem wir arbeiten
- Angewandte Schritte zeigt nacheinander die in der Abfrage ausgeführten Transformationsschritte an. Ein Abfrageschritt bearbeitet die Ausgabe des vorherigen Abfrageschritts in der Liste. Daher ist die Reihenfolge dieser Schritte wichtig. Schritte einer Abfrage innerhalb von Angewandte Schritte können in beliebiger Reihenfolge angeordnet, umbenannt und mit einem Rechtsklick auf diesen Schritt gelöscht werden. Eine Abfrage wird in der Reihenfolge ausgeführt, in der ihre Schritte im Abschnitt Angewandte Schritte angeordnet sind .
Wenn Sie im Bereich „Abfragen“ auf eine beliebige Abfrage oder im Bereich „Angewandte Schritte“ auf deren Schritte klicken, wird die jeweilige Änderung am Datensatz im mittleren Bereich angezeigt. Die zugrunde liegenden Daten werden im Editor jedoch nicht geändert. Er erstellt Datenansichten entsprechend der ausgewählten Abfrage oder eines Transformationsschritts innerhalb einer Abfrage.
Daten im Power Query-Editor importieren
Um mehr Einblicke in die Funktionen des Power Query-Editors zu erhalten, laden wir Beispiel- Webdaten hinein. Wir laden den Webdatensatz von TechStocks , der die täglichen Aktienkursinformationen von drei Unternehmen enthält: Apple, Google und Microsoft. Sie können die URL des Datensatzes herunterladen oder eingeben, um ihn hier zu importieren . Wir importieren den Datensatz, indem wir seine URL angeben:
Unser Editor sieht jetzt viel aktiver und interaktiver aus. Der importierte Datensatz ist in der Mitte des Datenbereichs zu sehen. Sehen wir uns die Änderungen an, die sich ergeben haben:
- Abfragebereich: Eine neue Abfrageregisterkarte mit dem Namen TachStocks (Name unseres Datensatzes) wurde erstellt.
- Abschnitt „Name“ (Abfrageeinstellungen): Hier wird der Name der Abfrage angezeigt, mit der wir uns aktuell befassen.
- Menü: Dieses Menüband zeigt viele Funktionen und Vorgänge, die wir mit unserem Datensatz durchführen.
- Spaltennamen: Zeigt uns die Spaltennamen im Datensatz zusammen mit Symbolen, die ihren Datentyp angeben. Es enthält auch eine Pfeilschaltfläche, um die gesamte Spalte auszuwählen und einige Spaltenoperationen durchzuführen.
- Abschnitt „Angewandte Schritte“ (Abfrageeinstellungen): Hier werden alle Transformationsschritte angezeigt, die in der Abfrage ausgeführt wurden. Obwohl wir eine einfache Abfrage zum Importieren unseres Datensatzes durchgeführt haben, hat der Power Editor automatisch einige Abfrageschritte für uns ausgeführt, z. B. das Einfügen der Spaltennamen als Überschriften in den ursprünglichen Datensatz und das Zuweisen geeigneter Datentypen zu allen Spalten.
- Wenn wir auf einen der Abfrageschritte klicken, können wir eine Ansicht der Daten als Ausgabe der Transformationsschritte sehen, die vom ersten Abfrageschritt bis zum ausgewählten Abfrageschritt (einschließlich) angewendet wurden
. Wenn wir beispielsweise auf die Schrittnamen „ Promoted Headers “ klicken, können wir den Datensatz mit seinen Headern als Spaltennamen, aber mit nicht angewendeten Datentypen in den Spalten sehen. Der Schritt „ Geänderter Datentyp “ zeigt alle Abfrageschritte, die für die Daten durchgeführt wurden: vom Import bis zur entsprechenden Änderung der Spaltendatentypen.
- Wenn wir auf einen der Abfrageschritte klicken, können wir eine Ansicht der Daten als Ausgabe der Transformationsschritte sehen, die vom ersten Abfrageschritt bis zum ausgewählten Abfrageschritt (einschließlich) angewendet wurden
- Registerkarte „Formel“: Wenn wir uns im Schritt „ Geänderter Datentyp “ befinden, zeigt die Registerkarte den entsprechenden Codeausschnitt in der M-Sprache an, der im Backend angewendet wurde, damit die Transformation funktioniert.
Der erweiterte Editor
Dieser Editor ist der Hauptort, an dem Sie Ihre Abfragen in Form von M-Language-Code ausprobieren können. Er zeigt auch den Code an, den der Editor für eine bestimmte Abfrage oder einen bestimmten Abfrageschritt erstellt.
- Klicken Sie im Home- Menü auf die Schaltfläche „Erweiterter Editor“
Sie können den vorhandenen Code im erweiterten Editor sehen oder mit dem Schreiben Ihrer eigenen Abfrage beginnen. Im Bild unten im erweiterten Abfrage-Editor ist der hervorgehobene Teil des Codes die letzte auf den Datensatz angewendete Transformation, die genau in der Registerkarte „Formel“ oben wiedergegeben ist.
Wie oben erläutert, können Sie sehen, dass die M-Sprache im erweiterten Editor aus Blockanweisungen „let“ und „in“ besteht.
Um das Fenster zu schließen, wählen Sie die Schaltfläche „Fertig“ oder „Abbrechen“ .
Arbeiten mit dem Power Query-Editor
Lassen Sie uns den Datensatz ein wenig transformieren, um unsere zuvor besprochenen Konzepte weiter zu verdeutlichen. So erstellen Sie eine neue Abfrage:
- Klicken Sie unten mit der rechten Maustaste auf den grauen Bereich des Abfragebereichs -> Neue Abfrage -> Leere Abfrage
Wir verwenden die vorhandene Abfrage, die zuvor erstellt wurde (TechStocks). Lassen Sie uns einfache Datentransformationen durchführen und sehen, wie der Power Query Editor damit arbeitet. Führen Sie diese Vorgänge mit der GUI und in der folgenden Reihenfolge aus:
- Datenspalte in absteigender Reihenfolge sortieren
- Filtern Sie die Spalten AAPL, GOOG und MSFT, um Zeilen mit Nullwerten zu entfernen.
Sie können in den angewandten Schritten die Reihenfolge der Abfrageschritte sehen (wir haben diese Schritte für Ihr besseres Verständnis umbenannt). Sie stoppt beim letzten Schritt, den wir angewandt haben, d. h. beim Filtern der MSFT-Spalte. Der zugrunde liegende M-Code für diesen letzten Schritt wird auch auf der Registerkarte „Formel“ angezeigt .
Stellen Sie sich eine Geschäftsumgebung mit unübersichtlichen und riesigen Datenmengen aus der realen Welt vor, in der umfangreiche Transformationen durchgeführt werden müssen, um ein perfektes Datenmodell für Visualisierungen zu erstellen. Sie müssen die angewendeten Abfragen verfolgen, vorherige Schritte replizieren oder zu ihnen zurückkehren und ähnliche oder logische Schritte in einer einzigen Abfrage zusammenfassen. Hier kann die wahre Stärke von Power Query genutzt werden, um die Arbeit einfach und schnell zu machen.
Power Query ist daher effektiv bei der Datenbearbeitung und Speicherung aller vorherigen Abfrageinformationen zur späteren Wiederverwendung. Power Query bietet viele weitere Vorteile bei der Datentransformation mit der M-Language, um leistungsfähigere und komplexere Datentransformationen zu erstellen.
Änderungen an Power Query speichern
Nachdem wir alle Vorgänge im Power Query-Editor ausgeführt haben, müssen wir Änderungen am Datenmodell in unserem Power BI Desktop anwenden und speichern, bevor wir den Power Query-Editor beenden.
- Gehen Sie im Editor zum Menü Datei -> Schließen und Übernehmen
Dadurch werden nur Ihre importierten und transformierten Daten in der Schaltfläche „Datenmodell“ auf der linken Seite des Power BI-Desktops gespeichert. Wenn Sie mit Ihrem Datenmodell zufrieden sind, müssen Sie das gesamte Projekt speichern, bevor Sie die Power BI-Desktop-Anwendung schließen.
- Gehen Sie zum Menü Datei -> Speichern / Speichern unter, um Ihr Power BI-Projekt zu speichern
Damit ist unser Verständnis davon, wie Power BI Power Query für seinen ETL-Prozess verwendet, abgeschlossen.
Zertifizierung für Power BI: Microsoft [PL-300]
Microsoft bietet die Zertifizierung „Microsoft Certified Power BI Data Analyst Associate [PL-300]“ an , die für BI-/Datenanalysten oder Fachleute von Vorteil ist, die an der Erstellung von BI-Berichten zur Lösung von Geschäftsproblemen beteiligt sind. Sie bestätigt Ihre Power BI-Kenntnisse auf dem Markt und hilft Ihnen, das volle Potenzial von Power BI auszuschöpfen. Dies ist von Vorteil, da Power BI über umfangreiche Funktionen verfügt, um Unternehmen bei der Erstellung umfangreicher Visualisierungen und Daten-Apps zu unterstützen, die genau auf ihre Anforderungen zugeschnitten sind.
Nächste Schritte zum Einstieg in die PL-300-Zertifizierung:
In unserem PL-300-Zertifizierungsschulungsprogramm decken wir mehr als 10 praktische Übungen ab. Wenn Sie Ihre Reise zum Microsoft Certified: Power BI Data Analyst Associate beginnen möchten , probieren Sie unseren KOSTENLOSEN KURS aus.