dbt project on Snowflakeの一般提供の発表

データ変換は、堅牢なデータパイプラインを構築するために不可欠な、効果的なデータ戦略のコアな構成要素です。長年にわたって、データチームはdbt(データ構築ツール)を利用して、SQLとSnowparkの変換ワークフローにモジュール化、バージョン管理、テストなどのソフトウェアエンジニアリングのベストプラクティスを取り入れてきました。
しかしながら、そのプロセスが常にスムーズであったとは限りません。データチームとプラットフォームオーナーは、しばしば以下のような共通の課題に直面します。
- インフラストラクチャのオーバーヘッド:Snowflakeに加えて外部オーケストレーター(Airflowなど)のコンピュートを管理すると、メンテナンスが複雑化し、異なるシステム間での信頼性が低下する可能性があります。
- デバッグの課題:ログやパフォーマンスデータがオーケストレーターやクエリログに分散しているため、根本原因やボトルネックの発見が困難です。
- ガバナンスのギャップ:新しいチームにパイプラインの構築と展開を任せることは難しく、特に学習曲線が急であったり、セキュリティの統一が課題となっている場合には困難です。
- CI/CDセットアップ:データ変換コードのための堅牢で自動化された継続的統合と継続的デリバリ(CI/CD)のセットアップは、多くの場合、品質と迅速な展開を確保するために多大なカスタムエンジニアリング作業を必要とします。
現在は、dbtのパワーをSnowflake上でネイティブに利用できます。dbt project on Snowflakeにより、データチームはSnowflake内で直接、dbtプロジェクトを構築、実行、監視できます。Snowflakeにおける次世代のSQLオーサリングである新しいWorkspacesエディタにより、チームはプロジェクトの編集とデバッグが可能です。dbt project on Snowflakeは、GitHub ActionsなどのCI/CDツールを介したdbtプロジェクトの展開やテスト管理において、Snowflake CLIと完全に同等の機能を提供します。これらのネイティブオプションは、コンテキストの切り替えを減らし、セットアップを簡素化し、データパイプライン開発のライフサイクル全体を加速します。

「人命を救うケアを日々提供している非営利団体にとって、あらゆるコスト管理が重要になってきます。データおよび分析プラットフォームを再構築する際、私たちは機能性とシンプルさ、コストのバランスが取れた、適切な規模のツールを必要としていました。dbtがSnowflakeのエコシステムの一部となったため、進むべき道が明確になりました。現在、私たちはdbtワークフロー全体を、Snowflake内でネイティブに実験、コード化、テスト、展開、スケジュール、そしてモニタリングしています。単一のプラットフォームに統合したことで、有用なシンプルさが生まれ、コストの透明性が向上し、エンジニアは価値提供の迅速化に集中できるようになりました」
— Chris Androsoff氏
dbt project on Snowflakeにより、チームはコラボレーションしてモジュラー型のスケーラブルなデータプロダクトを構築し、下流のアナリティクス、AI、アプリケーションを提供します。この機能をプレビューしたお客様は、トランスフォーメーションパイプラインを1日以内に構築できる能力(34%向上)と、トラブルシューティングできる能力(11%向上)に、より大きな確信を持てたと報告1しています。
1 2025年4月から6月にかけて、dbt project on Snowflakeを初めて使用する前後の17人のユーザーを対象として、構築とトラブルシューティングのスピード向上を測定しました。

Charlie Hammondによるデモで、dbt project on Snowflakeについて学習できます。
dbt project on Snowflakeで開発を加速
dbt project on Snowflakeは、データエンジニアが変換パイプラインの標準化と自動化のためにワークフローを合理化します。そのために、以下が可能になります。
- 開発とテスト:Gitと統合されるファイルベースのIDEを使用して、Workspacesでdbtプロジェクトを作成、アップロード、編集できます。データ品質のテスト実行とモデルの検証を行います。
- 可視化とデバッグ:有向非巡回グラフ(DAG)をコンパイルして可視化し、リネージと依存関係をUIで直接検査できます。
- 展開とオーケストレーション:ネイティブのSnowflakeタスクを使用してデータパイプラインの展開とスケジューリングを行えるため、オーケストレーションが簡素化します。ネイティブのWorkspaces IDEから直接、COMPILE、TEST、RUNなどのさまざまなdbtコマンドを選択できます。
- モニタリングとトレース:粒度の高いロギングとトレースにより、実行履歴を監視できます。
開始手順
既存のdbtプロジェクトをGitからインポートする場合も、ゼロから開始する場合も、dbt project on Snowflakeを簡単に開始できます。
- Snowsight Workspacesに移動します。
- dbtプロジェクトの作成またはGitリポジトリからのインポートを選択します。
- 既存のSnowflake仮想ウェアハウスを使用してプロジェクトを実行します。
スタートチュートリアル、またはSnowflake Labsからコードを入手できます。この機能がもたらす運用効率、標準化、簡素化された開発者体験により、より多くのチームがモダンデータプロダクトを構築、展開できるようになります。詳細については、Snowflakeドキュメントを参照するか、開発者ガイドページをご覧ください。
