최신Microsoft Data Engineering on Microsoft Azure (DP-203 Deutsch Version) - DP-203 Deutsch무료샘플문제
문제1
Hinweis: Diese Frage ist Teil einer Reihe von Fragen, die dasselbe Szenario darstellen. Jede Frage in der Reihe enthält eine einzigartige Lösung, die die angegebenen Ziele erreichen könnte. Für einige Fragensätze gibt es möglicherweise mehr als eine richtige Lösung, während für andere möglicherweise keine richtige Lösung vorhanden ist.
Nachdem Sie eine Frage in diesem Abschnitt beantwortet haben, können Sie NICHT mehr darauf zurückkommen. Daher werden diese Fragen nicht im Überprüfungsbildschirm angezeigt.
Sie entwerfen eine Azure Stream Analytics-Lösung, die Twitter-Daten analysiert.
Sie müssen die Tweets in jedem 10-Sekunden-Fenster zählen. Die Lösung muss sicherstellen, dass jeder Tweet nur einmal gezählt wird.
Lösung: Sie verwenden ein Sitzungsfenster mit einer Timeout-Größe von 10 Sekunden.
Erfüllt dies das Ziel?
Hinweis: Diese Frage ist Teil einer Reihe von Fragen, die dasselbe Szenario darstellen. Jede Frage in der Reihe enthält eine einzigartige Lösung, die die angegebenen Ziele erreichen könnte. Für einige Fragensätze gibt es möglicherweise mehr als eine richtige Lösung, während für andere möglicherweise keine richtige Lösung vorhanden ist.
Nachdem Sie eine Frage in diesem Abschnitt beantwortet haben, können Sie NICHT mehr darauf zurückkommen. Daher werden diese Fragen nicht im Überprüfungsbildschirm angezeigt.
Sie entwerfen eine Azure Stream Analytics-Lösung, die Twitter-Daten analysiert.
Sie müssen die Tweets in jedem 10-Sekunden-Fenster zählen. Die Lösung muss sicherstellen, dass jeder Tweet nur einmal gezählt wird.
Lösung: Sie verwenden ein Sitzungsfenster mit einer Timeout-Größe von 10 Sekunden.
Erfüllt dies das Ziel?
정답: B
설명: (KoreaDumps 회원만 볼 수 있음)
문제2
Sie entwerfen eine Finanztransaktionstabelle in einem dedizierten Azure Synapse Analytics-SQL-Pool. Die Tabelle verfügt über einen gruppierten Columnstore-Index und enthält die folgenden Spalten:
* TransactionType: 40 Millionen Zeilen pro Transaktionstyp
* Kundensegment: 4 Millionen pro Kundensegment
* TransactionMonth: 65 Millionen Zeilen pro Monat
* Kontotyp: 500 Millionen pro Kontotyp
Sie haben die folgenden Abfrageanforderungen:
* Analysten analysieren am häufigsten Transaktionen für einen bestimmten Monat.
* Bei der Transaktionsanalyse werden Transaktionen in der Regel nach Transaktionstyp, Kundensegment und/oder Kontotyp zusammengefasst. Sie müssen eine Partitionsstrategie für die Tabelle empfehlen, um die Abfragezeiten zu minimieren.
Auf welche Spalte sollten Sie die Partitionierung der Tabelle empfehlen?
Sie entwerfen eine Finanztransaktionstabelle in einem dedizierten Azure Synapse Analytics-SQL-Pool. Die Tabelle verfügt über einen gruppierten Columnstore-Index und enthält die folgenden Spalten:
* TransactionType: 40 Millionen Zeilen pro Transaktionstyp
* Kundensegment: 4 Millionen pro Kundensegment
* TransactionMonth: 65 Millionen Zeilen pro Monat
* Kontotyp: 500 Millionen pro Kontotyp
Sie haben die folgenden Abfrageanforderungen:
* Analysten analysieren am häufigsten Transaktionen für einen bestimmten Monat.
* Bei der Transaktionsanalyse werden Transaktionen in der Regel nach Transaktionstyp, Kundensegment und/oder Kontotyp zusammengefasst. Sie müssen eine Partitionsstrategie für die Tabelle empfehlen, um die Abfragezeiten zu minimieren.
Auf welche Spalte sollten Sie die Partitionierung der Tabelle empfehlen?
정답: A
설명: (KoreaDumps 회원만 볼 수 있음)
문제3
Sie verfügen über ein Azure-Abonnement, das ein Microsoft Purview-Konto enthält.
Sie müssen den Microsoft Purview-Datenkatalog durchsuchen, um Assets zu identifizieren, die über die AssetType-Eigenschaft „Table“ oder „View“ verfügen. Welche Abfrage sollten Sie ausführen?
Sie verfügen über ein Azure-Abonnement, das ein Microsoft Purview-Konto enthält.
Sie müssen den Microsoft Purview-Datenkatalog durchsuchen, um Assets zu identifizieren, die über die AssetType-Eigenschaft „Table“ oder „View“ verfügen. Welche Abfrage sollten Sie ausführen?
정답: B
문제4
Sie erstellen einen Apache Spark-Auftrag in Azure Databricks, der JSON-formatierte Daten erfasst.
Sie müssen einen verschachtelten JSON-String in einen DataFrame konvertieren, der mehrere Zeilen enthält.
Welche Spark SQL-Funktion sollten Sie verwenden?
Sie erstellen einen Apache Spark-Auftrag in Azure Databricks, der JSON-formatierte Daten erfasst.
Sie müssen einen verschachtelten JSON-String in einen DataFrame konvertieren, der mehrere Zeilen enthält.
Welche Spark SQL-Funktion sollten Sie verwenden?
정답: B
설명: (KoreaDumps 회원만 볼 수 있음)
문제5
Sie entwerfen einen Azure Synapse Analytics-Arbeitsbereich.
Sie müssen eine Lösung empfehlen, die eine doppelte Verschlüsselung aller ruhenden Daten bietet.
Welche beiden Komponenten sollten Sie in die Empfehlung einbeziehen? Jede Kegelantwort stellt einen Teil der Lösung dar. HINWEIS: Jede richtige Auswahl ist einen Punkt wert.
Sie entwerfen einen Azure Synapse Analytics-Arbeitsbereich.
Sie müssen eine Lösung empfehlen, die eine doppelte Verschlüsselung aller ruhenden Daten bietet.
Welche beiden Komponenten sollten Sie in die Empfehlung einbeziehen? Jede Kegelantwort stellt einen Teil der Lösung dar. HINWEIS: Jede richtige Auswahl ist einen Punkt wert.
정답: A,C
설명: (KoreaDumps 회원만 볼 수 있음)
문제6
Sie verfügen über ein Azure-Abonnement, das einen Azure Synapse Analytics-Arbeitsbereich mit dem Namen „ws1“ und ein Azure Cosmos D6-Datenbankkonto mit dem Namen „Cosmos1“ enthält. Costmos1 enthält einen Container mit dem Namen „Container 1“ und „ws1“ enthält einen SQL-Pool „Serverless1“.
Sie müssen sicherstellen, dass Sie die Daten im Container mithilfe des serverlosen1 SQL-Pools abfragen können.
Welche drei Aktionen sollten Sie durchführen? Jede richtige Antwort stellt einen Teil der Lösung dar. HINWEIS: Jede richtige Antwort ist einen Punkt wert.
Sie verfügen über ein Azure-Abonnement, das einen Azure Synapse Analytics-Arbeitsbereich mit dem Namen „ws1“ und ein Azure Cosmos D6-Datenbankkonto mit dem Namen „Cosmos1“ enthält. Costmos1 enthält einen Container mit dem Namen „Container 1“ und „ws1“ enthält einen SQL-Pool „Serverless1“.
Sie müssen sicherstellen, dass Sie die Daten im Container mithilfe des serverlosen1 SQL-Pools abfragen können.
Welche drei Aktionen sollten Sie durchführen? Jede richtige Antwort stellt einen Teil der Lösung dar. HINWEIS: Jede richtige Antwort ist einen Punkt wert.
정답: C,D,E
문제7
Sie entwerfen einen interaktiven Azure Databricks-Cluster. Der Cluster wird selten verwendet und für die automatische Beendigung konfiguriert.
Sie müssen sicherstellen, dass die Clusterkonfiguration nach der Beendigung des Clusters auf unbestimmte Zeit erhalten bleibt. Die Lösung muss die Kosten minimieren.
Was sollte man tun?
Sie entwerfen einen interaktiven Azure Databricks-Cluster. Der Cluster wird selten verwendet und für die automatische Beendigung konfiguriert.
Sie müssen sicherstellen, dass die Clusterkonfiguration nach der Beendigung des Clusters auf unbestimmte Zeit erhalten bleibt. Die Lösung muss die Kosten minimieren.
Was sollte man tun?
정답: A
설명: (KoreaDumps 회원만 볼 수 있음)
문제8
Sie haben eine Azure Stream Analytics-Abfrage. Die Abfrage gibt einen Ergebnissatz zurück, der 10.000 unterschiedliche Werte für eine Spalte namens „clusterID“ enthält.
Sie überwachen den Stream Analytics-Auftrag und stellen eine hohe Latenz fest.
Sie müssen die Latenz reduzieren.
Welche zwei Aktionen sollten Sie durchführen? Jede richtige Antwort stellt eine vollständige Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.
Sie haben eine Azure Stream Analytics-Abfrage. Die Abfrage gibt einen Ergebnissatz zurück, der 10.000 unterschiedliche Werte für eine Spalte namens „clusterID“ enthält.
Sie überwachen den Stream Analytics-Auftrag und stellen eine hohe Latenz fest.
Sie müssen die Latenz reduzieren.
Welche zwei Aktionen sollten Sie durchführen? Jede richtige Antwort stellt eine vollständige Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.
정답: B,E
설명: (KoreaDumps 회원만 볼 수 있음)
문제9
Sie verfügen über ein Azure-Abonnement, das ein Azure Synapse Analytics-Konto enthält. Das Konto ist in ein Azure Repos-Repository namens Repo1 integriert und enthält eine Pipeline namens Pipeline1. Repo1 enthält die in der folgenden Tabelle gezeigten Zweige.

Von featuredev aus entwickeln und testen Sie Änderungen an Pipeline1. Sie müssen die Änderungen veröffentlichen. Was sollten Sie zuerst tun?
Sie verfügen über ein Azure-Abonnement, das ein Azure Synapse Analytics-Konto enthält. Das Konto ist in ein Azure Repos-Repository namens Repo1 integriert und enthält eine Pipeline namens Pipeline1. Repo1 enthält die in der folgenden Tabelle gezeigten Zweige.

Von featuredev aus entwickeln und testen Sie Änderungen an Pipeline1. Sie müssen die Änderungen veröffentlichen. Was sollten Sie zuerst tun?
정답: C
문제10
Sie verfügen über einen dedizierten Azure Synapse Analytics-SQL-Pool.
Sie müssen eine Tabelle mit dem Namen FactInternetSales erstellen, die eine große Faktentabelle in einem dimensionalen Modell darstellt.
FactInternetSales wird 100 Millionen Zeilen und zwei Spalten mit den Namen SalesAmount und OrderQuantity enthalten.
Auf FactInternetSales ausgeführte Abfragen aggregieren die Werte in SalesAmount und OrderQuantity aus dem letzten Jahr für ein bestimmtes Produkt. Die Lösung muss die Datengröße und die Ausführungszeit der Abfrage minimieren.
Wie soll der Code vervollständigt werden? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

Sie verfügen über einen dedizierten Azure Synapse Analytics-SQL-Pool.
Sie müssen eine Tabelle mit dem Namen FactInternetSales erstellen, die eine große Faktentabelle in einem dimensionalen Modell darstellt.
FactInternetSales wird 100 Millionen Zeilen und zwei Spalten mit den Namen SalesAmount und OrderQuantity enthalten.
Auf FactInternetSales ausgeführte Abfragen aggregieren die Werte in SalesAmount und OrderQuantity aus dem letzten Jahr für ein bestimmtes Produkt. Die Lösung muss die Datengröße und die Ausführungszeit der Abfrage minimieren.
Wie soll der Code vervollständigt werden? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

정답:

Explanation:
Box 1: (CLUSTERED COLUMNSTORE INDEX
CLUSTERED COLUMNSTORE INDEX
Columnstore indexes are the standard for storing and querying large data warehousing fact tables. This index uses column-based data storage and query processing to achieve gains up to 10 times the query performance in your data warehouse over traditional row-oriented storage. You can also achieve gains up to 10 times the data compression over the uncompressed data size. Beginning with SQL Server 2016 (13.x) SP1, columnstore indexes enable operational analytics: the ability to run performant real-time analytics on a transactional workload.
Note: Clustered columnstore index
A clustered columnstore index is the physical storage for the entire table.

To reduce fragmentation of the column segments and improve performance, the columnstore index might store some data temporarily into a clustered index called a deltastore and a B-tree list of IDs for deleted rows.
The deltastore operations are handled behind the scenes. To return the correct query results, the clustered columnstore index combines query results from both the columnstore and the deltastore.
Box 2: HASH([ProductKey])
A hash distributed table distributes rows based on the value in the distribution column. A hash distributed table is designed to achieve high performance for queries on large tables.
Choose a distribution column with data that distributes evenly
Reference: https://docs.microsoft.com/en-us/sql/relational-databases/indexes/columnstore-indexes-overview
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables- overview
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables- distribute
문제11
Sie verfügen über einen Azure Synapse Analytics-Arbeitsbereich.
Sie planen, eine Lake-Datenbank mithilfe einer Datenbankvorlage in Azure Synapse bereitzustellen.
Welche beiden Elemente waren in der Vorlage enthalten? Jede richtige Antwort stellt einen Teil der Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert
Sie verfügen über einen Azure Synapse Analytics-Arbeitsbereich.
Sie planen, eine Lake-Datenbank mithilfe einer Datenbankvorlage in Azure Synapse bereitzustellen.
Welche beiden Elemente waren in der Vorlage enthalten? Jede richtige Antwort stellt einen Teil der Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert
정답: C,D