최신Databricks Certified Data Engineer Associate Exam (Databricks-Certified-Data-Engineer-Associate日本語版) - Databricks-Certified-Data-Engineer-Associate日本語무료샘플문제
문제1
データエンジニアが以下のコマンドを使用して新しいデータベースを作成しました。
customer360 データベースが存在しない場合は作成します。
customer360データベースは、以下のどの場所に配置されますか?
データエンジニアが以下のコマンドを使用して新しいデータベースを作成しました。
customer360 データベースが存在しない場合は作成します。
customer360データベースは、以下のどの場所に配置されますか?
정답: A
문제2
データエンジニアは、メモリ使用量を削減しパフォーマンスを向上させるために、Deltaテーブルから一部の列のみを読み込みたいと考えています。どのSpark DataFrame操作を使用すべきでしょうか?
データエンジニアは、メモリ使用量を削減しパフォーマンスを向上させるために、Deltaテーブルから一部の列のみを読み込みたいと考えています。どのSpark DataFrame操作を使用すべきでしょうか?
정답: D
문제3
ノートブックが失敗しないようにするために、ジョブクラスタがサポートする最大出力はどれくらいですか?
ノートブックが失敗しないようにするために、ジョブクラスタがサポートする最大出力はどれくらいですか?
정답: C
설명: (KoreaDumps 회원만 볼 수 있음)
문제4
データエンジニアは、テーブルストアの配列列 employees において、経験年数が 5 年を超える従業員を識別するためのカスタムロジックを適用する必要があります。このカスタムロジックでは、各行に対して経験年数が 5 年を超えるすべての従業員の配列である新しい列 exp_employees を作成する必要があります。このカスタムロジックを大規模に適用するために、データエンジニアは FILTER という高階関数を使用したいと考えています。
以下のコードブロックのうち、このタスクを正常に完了できるのはどれですか?
データエンジニアは、テーブルストアの配列列 employees において、経験年数が 5 年を超える従業員を識別するためのカスタムロジックを適用する必要があります。このカスタムロジックでは、各行に対して経験年数が 5 年を超えるすべての従業員の配列である新しい列 exp_employees を作成する必要があります。このカスタムロジックを大規模に適用するために、データエンジニアは FILTER という高階関数を使用したいと考えています。
以下のコードブロックのうち、このタスクを正常に完了できるのはどれですか?
정답: A
문제5
アセットバンドルの構造とはどのようなものですか?
アセットバンドルの構造とはどのようなものですか?
정답: D
설명: (KoreaDumps 회원만 볼 수 있음)
문제6
データエンジニアが個人のノートパソコンで作業しており、クラウドストレージ上のDelta Lakeに保存されているデータに対して複雑な変換処理を実行する必要があります。エンジニアはDatabricks Connectを使用してDatabricksクラスターと連携し、ローカルIDEで作業することにしました。Databricks Connectは、エンジニアがDatabricksクラスターと連携しながら、ローカルマシン上でコードの開発、テスト、デバッグをシームレスに行えるようにするには、どのような仕組みになっているのでしょうか?
データエンジニアが個人のノートパソコンで作業しており、クラウドストレージ上のDelta Lakeに保存されているデータに対して複雑な変換処理を実行する必要があります。エンジニアはDatabricks Connectを使用してDatabricksクラスターと連携し、ローカルIDEで作業することにしました。Databricks Connectは、エンジニアがDatabricksクラスターと連携しながら、ローカルマシン上でコードの開発、テスト、デバッグをシームレスに行えるようにするには、どのような仕組みになっているのでしょうか?
정답: A
설명: (KoreaDumps 회원만 볼 수 있음)
문제7
データエンジニアは、毎朝仕事を始める前に実行される単一タスクのジョブを持っています。上流のデータの問題を特定した後、元のタスクの前に新しいノートブックを実行するための別のタスクを設定する必要があります。
データ エンジニアが新しいタスクを設定するために使用できるアプローチは次のどれですか。
データエンジニアは、毎朝仕事を始める前に実行される単一タスクのジョブを持っています。上流のデータの問題を特定した後、元のタスクの前に新しいノートブックを実行するための別のタスクを設定する必要があります。
データ エンジニアが新しいタスクを設定するために使用できるアプローチは次のどれですか。
정답: B
문제8
次のコマンドのうち、データベース customer360 の場所を返すものはどれですか?
次のコマンドのうち、データベース customer360 の場所を返すものはどれですか?
정답: B
문제9
データエンジニアが、特定の培地中の細菌数を計算する関数をDatabricks Notebookに作成した。

アナリストはノートブック内でこの関数を使用する際に、誤ったデータ型の入力引数を指定することがあり、その結果、実行時にエラーが発生する可能性があります。
データエンジニアが入力として誤ったデータ型が提供されたかどうかを迅速に特定するのに役立つDatabricksの機能はどれですか?
データエンジニアが、特定の培地中の細菌数を計算する関数をDatabricks Notebookに作成した。

アナリストはノートブック内でこの関数を使用する際に、誤ったデータ型の入力引数を指定することがあり、その結果、実行時にエラーが発生する可能性があります。
データエンジニアが入力として誤ったデータ型が提供されたかどうかを迅速に特定するのに役立つDatabricksの機能はどれですか?
정답: D
설명: (KoreaDumps 회원만 볼 수 있음)
문제10
データエンジニアには、パイプラインの迅速な反復開発に加え、データ取り込みの失敗後には確実にロールバックを行い、規制遵守のための監査証跡を確保し、AIとBIワークロードの両方に対して単一の信頼できる情報源への一貫したアクセスを提供する能力が求められます。
データエンジニアは、ニーズを満たすためにどのような戦略を採用すべきでしょうか?
データエンジニアには、パイプラインの迅速な反復開発に加え、データ取り込みの失敗後には確実にロールバックを行い、規制遵守のための監査証跡を確保し、AIとBIワークロードの両方に対して単一の信頼できる情報源への一貫したアクセスを提供する能力が求められます。
データエンジニアは、ニーズを満たすためにどのような戦略を採用すべきでしょうか?
정답: C
설명: (KoreaDumps 회원만 볼 수 있음)
문제11
データ分析チームは、常時接続のSQLエンドポイントに接続した際に、DatabricksのSQLクエリの実行速度が遅すぎることに気づきました。チームメンバーの多くが同じ小さなクエリを同時に実行している際にこの問題が発生すると主張し、データエンジニアリングチームに支援を依頼しました。データエンジニアリングチームは、各チームのクエリが同じSQLエンドポイントを使用していることに気付きました。
データ エンジニアリング チームがチームのクエリのレイテンシを改善するために使用できるアプローチは次のどれですか。
データ分析チームは、常時接続のSQLエンドポイントに接続した際に、DatabricksのSQLクエリの実行速度が遅すぎることに気づきました。チームメンバーの多くが同じ小さなクエリを同時に実行している際にこの問題が発生すると主張し、データエンジニアリングチームに支援を依頼しました。データエンジニアリングチームは、各チームのクエリが同じSQLエンドポイントを使用していることに気付きました。
データ エンジニアリング チームがチームのクエリのレイテンシを改善するために使用できるアプローチは次のどれですか。
정답: A
문제12
データエンジニアがSpark DataFrame変換パイプラインを作成しています。このパイプラインは、結果をDeltaテーブルに書き込む前に、filter、select、joinなどの複数の変換操作で構成されています。これらの変換を実行前に最適化できるSparkの特性はどれですか?
データエンジニアがSpark DataFrame変換パイプラインを作成しています。このパイプラインは、結果をDeltaテーブルに書き込む前に、filter、select、joinなどの複数の変換操作で構成されています。これらの変換を実行前に最適化できるSparkの特性はどれですか?
정답: D
문제13
汎用クラスターと職種別クラスターの違いを説明してください。
データエンジニアリングチームがクラウドストレージからデータを読み込むためのPythonノートブックを作成しました。このジョブはテスト済みで、今後は本番環境でスケジュールする必要があります。
この場合、どのクラスターを使用するのが最適でしょうか?
汎用クラスターと職種別クラスターの違いを説明してください。
データエンジニアリングチームがクラウドストレージからデータを読み込むためのPythonノートブックを作成しました。このジョブはテスト済みで、今後は本番環境でスケジュールする必要があります。
この場合、どのクラスターを使用するのが最適でしょうか?
정답: A
문제14
データエンジニアがDatabricksでクラスタを構成しており、複数のSparkエグゼキュータがワーカーノード間でタスクを同時に実行できるようにしたいと考えています。タスクの実行を担当するクラスタコンポーネントはどれですか?
データエンジニアがDatabricksでクラスタを構成しており、複数のSparkエグゼキュータがワーカーノード間でタスクを同時に実行できるようにしたいと考えています。タスクの実行を担当するクラスタコンポーネントはどれですか?
정답: D
문제15
データエンジニアはデータパイプラインのメンテナンスを行っています。データの取り込み時に、ソースデータの品質が低下し始めていることに気付きました。データエンジニアは、品質レベルの監視プロセスを自動化したいと考えています。
データ エンジニアがこの問題を解決するために使用できるツールは次のどれですか。
データエンジニアはデータパイプラインのメンテナンスを行っています。データの取り込み時に、ソースデータの品質が低下し始めていることに気付きました。データエンジニアは、品質レベルの監視プロセスを自動化したいと考えています。
データ エンジニアがこの問題を解決するために使用できるツールは次のどれですか。
정답: E