Databricks Certified Data Engineer Associate Exam (Databricks-Certified-Data-Engineer-Associate日本語版) - Databricks-Certified-Data-Engineer-Associate日本語 시험문제 [2026]

문제1
データエンジニアが以下のコマンドを使用して新しいデータベースを作成しました。
customer360 データベースが存在しない場合は作成します。
customer360データベースは、以下のどの場所に配置されますか？

A. dbfs:/user/hive/warehouse

B. 正しい回答を判断するには、さらに情報が必要です

C. dbfs:/user/hive/database

D. dbfs:/user/hive/database/customer360

E. dbfs:/user/hive/customer360

정답: A

문제2
データエンジニアは、メモリ使用量を削減しパフォーマンスを向上させるために、Deltaテーブルから一部の列のみを読み込みたいと考えています。どのSpark DataFrame操作を使用すべきでしょうか？

A. orderBy

B. groupBy

C. フィルター

D. 選択

정답: D

문제3
ノートブックが失敗しないようにするために、ジョブクラスタがサポートする最大出力はどれくらいですか？

A. 15MB

B. 30MB

C. 10MB

D. 25MB

정답: C

설명: (KoreaDumps 회원만 볼 수 있음)

문제4
データエンジニアは、テーブルストアの配列列 employees において、経験年数が 5 年を超える従業員を識別するためのカスタムロジックを適用する必要があります。このカスタムロジックでは、各行に対して経験年数が 5 年を超えるすべての従業員の配列である新しい列 exp_employees を作成する必要があります。このカスタムロジックを大規模に適用するために、データエンジニアは FILTER という高階関数を使用したいと考えています。
以下のコードブロックのうち、このタスクを正常に完了できるのはどれですか？

A.

B.

C.

D.

E.

정답: A

문제5
アセットバンドルの構造とはどのようなものですか？

A. メタデータを一切含まないワークスペースアセットのみを含む圧縮アーカイブ(ZIP)。

B. 新しいワークスペースに移行するアセットの名前を列挙した単一のプレーンテキストファイル

C. ランタイム環境とアセットのソースコードを含むDockerイメージ

D. プロジェクトの成果物、リソース、および構成を指定する YAML 構成ファイル

정답: D

설명: (KoreaDumps 회원만 볼 수 있음)

문제6
データエンジニアが個人のノートパソコンで作業しており、クラウドストレージ上のDelta Lakeに保存されているデータに対して複雑な変換処理を実行する必要があります。エンジニアはDatabricks Connectを使用してDatabricksクラスターと連携し、ローカルIDEで作業することにしました。Databricks Connectは、エンジニアがDatabricksクラスターと連携しながら、ローカルマシン上でコードの開発、テスト、デバッグをシームレスに行えるようにするには、どのような仕組みになっているのでしょうか？

A. Databricksランタイムを模倣したローカル環境を提供することで、エンジニアが好みのIDEを使用してコードを開発、テスト、デバッグできるようにします。

B. Databricksランタイムを模倣したローカル環境を提供することで、エンジニアはDatabricks独自のWebインターフェースのみを介してコードの開発、テスト、デバッグを行うことができる。

C. Databricksランタイムを模倣したローカル環境を提供することで、エンジニアはDatabricksで必要とされる特定のIDEを使用してコードを開発、テスト、デバッグできるようになります。

D. ネットワーク接続を必要とせずにローカルマシンからSparkジョブを直接実行できるようにすることで

정답: A

설명: (KoreaDumps 회원만 볼 수 있음)

문제7
データエンジニアは、毎朝仕事を始める前に実行される単一タスクのジョブを持っています。上流のデータの問題を特定した後、元のタスクの前に新しいノートブックを実行するための別のタスクを設定する必要があります。
データエンジニアが新しいタスクを設定するために使用できるアプローチは次のどれですか。

A. 新しいジョブを最初から作成し、両方のタスクを追加して同時に実行することができます。

B. 既存のジョブに新しいタスクを作成し、それを元のタスクの依存関係として追加できます。

C. 既存のジョブ内の既存のタスクを複製し、更新して新しいノートブックを実行できます。

D. 既存のジョブに新しいタスクを作成し、元のタスクを新しいタスクの依存関係として追加できます。

E. 既存のタスクを新しいジョブに複製し、それを編集して新しいノートブックを実行できます。

정답: B

문제8
次のコマンドのうち、データベース customer360 の場所を返すものはどれですか?

A. 場所を説明します customer360;

B. データベース customer360 の説明を記述します。

C. データベース customer360 を使用します。

D. データベース customer360 を削除します。

E. ALTER DATABASE customer360 SET DBPROPERTIES ('location' = '/user'};

정답: B

문제9
データエンジニアが、特定の培地中の細菌数を計算する関数をDatabricks Notebookに作成した。

アナリストはノートブック内でこの関数を使用する際に、誤ったデータ型の入力引数を指定することがあり、その結果、実行時にエラーが発生する可能性があります。
データエンジニアが入力として誤ったデータ型が提供されたかどうかを迅速に特定するのに役立つDatabricksの機能はどれですか？

A. Sparkユーザーインターフェースには、このセッションで使用されている変数を含むデバッグタブがあります。

B. データエンジニアは、変数が何であるかを確認するために、print文を追加する必要があります。

C. Databricks デバッガーを使用すると、変数エクスプローラーを使用して変数の値を一目で確認できます。

D. Databricks デバッガーは、誤ったデータ型が送信された場合にエラーを発生させるブレークポイントを有効にします。

정답: D

설명: (KoreaDumps 회원만 볼 수 있음)

문제10
データエンジニアには、パイプラインの迅速な反復開発に加え、データ取り込みの失敗後には確実にロールバックを行い、規制遵守のための監査証跡を確保し、AIとBIワークロードの両方に対して単一の信頼できる情報源への一貫したアクセスを提供する能力が求められます。
データエンジニアは、ニーズを満たすためにどのような戦略を採用すべきでしょうか？

A. クラウドオブジェクトストレージのみで、復旧とガバナンスのためにアドホックSQLクエリを使用します。

B. 監査証跡および BI 配布用の一時的なインメモリ DataFrame。

C. Delta Lake ACID トランザクションとタイムトラベル。一貫したアクセスと履歴のために Unity Catalog によって管理されます。

D. 手動ファイルバージョン管理とロールバックのための毎晩のコピーを備えたDBFS CSVストレージ。

정답: C

설명: (KoreaDumps 회원만 볼 수 있음)

문제11
データ分析チームは、常時接続のSQLエンドポイントに接続した際に、DatabricksのSQLクエリの実行速度が遅すぎることに気づきました。チームメンバーの多くが同じ小さなクエリを同時に実行している際にこの問題が発生すると主張し、データエンジニアリングチームに支援を依頼しました。データエンジニアリングチームは、各チームのクエリが同じSQLエンドポイントを使用していることに気付きました。
データエンジニアリングチームがチームのクエリのレイテンシを改善するために使用できるアプローチは次のどれですか。

A. SQL エンドポイントのスケーリング範囲の最大境界を増やすことができます。

B. SQL エンドポイントの Serverless 機能をオンにできます。

C. SQL エンドポイントの自動停止機能をオンにできます。

D. SQL エンドポイントのサーバーレス機能をオンにし、スポットインスタンスポリシーを「信頼性最適化」に変更できます。

E. SQL エンドポイントのクラスターサイズを増やすことができます。

정답: A

문제12
データエンジニアがSpark DataFrame変換パイプラインを作成しています。このパイプラインは、結果をDeltaテーブルに書き込む前に、filter、select、joinなどの複数の変換操作で構成されています。これらの変換を実行前に最適化できるSparkの特性はどれですか？

A. チェックポイント処理

B. 放送

C. 並列処理

D. 遅延評価

정답: D

문제13
汎用クラスターと職種別クラスターの違いを説明してください。
データエンジニアリングチームがクラウドストレージからデータを読み込むためのPythonノートブックを作成しました。このジョブはテスト済みで、今後は本番環境でスケジュールする必要があります。
この場合、どのクラスターを使用するのが最適でしょうか？

A. ジョブクラスター

B. 汎用クラスター

C. Unityカタログが有効になっている任意のクラスター

D. サーバーレスSQLウェアハウス

정답: A

문제14
データエンジニアがDatabricksでクラスタを構成しており、複数のSparkエグゼキュータがワーカーノード間でタスクを同時に実行できるようにしたいと考えています。タスクの実行を担当するクラスタコンポーネントはどれですか？

A. ノートブック

B. ドライバー

C. ジョブスケジューラ

D. 執行者

정답: D

문제15
データエンジニアはデータパイプラインのメンテナンスを行っています。データの取り込み時に、ソースデータの品質が低下し始めていることに気付きました。データエンジニアは、品質レベルの監視プロセスを自動化したいと考えています。
データエンジニアがこの問題を解決するために使用できるツールは次のどれですか。

A. オートローダー

B. Unity カタログ

C. データエクスプローラー

D. デルタ湖

E. デルタライブテーブル

정답: E

최신Databricks Certified Data Engineer Associate Exam (Databricks-Certified-Data-Engineer-Associate日本語版) - Databricks-Certified-Data-Engineer-Associate日本語무료샘플문제

KoreaDumps의 제품으로 GO GO GO !

자격증의 중요성:

KoreaDumps 제품의 가치:

무료샘플 받아보기:

완벽한 서비스 제공: