dbt project on Snowflakeの一般提供の発表

dbt

データ変換は、堅牢なデータパイプラインを構築するために不可欠な、効果的なデータ戦略のコアな構成要素です。長年にわたって、データチームはdbt(データ構築ツール)を利用して、SQLとSnowparkの変換ワークフローにモジュール化、バージョン管理、テストなどのソフトウェアエンジニアリングのベストプラクティスを取り入れてきました。

しかしながら、そのプロセスが常にスムーズであったとは限りません。データチームとプラットフォームオーナーは、しばしば以下のような共通の課題に直面します。

  • インフラストラクチャのオーバーヘッド:Snowflakeに加えて外部オーケストレーター(Airflowなど)のコンピュートを管理すると、メンテナンスが複雑化し、異なるシステム間での信頼性が低下する可能性があります。
  • デバッグの課題:ログやパフォーマンスデータがオーケストレーターやクエリログに分散しているため、根本原因やボトルネックの発見が困難です。
  • ガバナンスのギャップ:新しいチームにパイプラインの構築と展開を任せることは難しく、特に学習曲線が急であったり、セキュリティの統一が課題となっている場合には困難です。
  • CI/CDセットアップ:データ変換コードのための堅牢で自動化された継続的統合と継続的デリバリ(CI/CD)のセットアップは、多くの場合、品質と迅速な展開を確保するために多大なカスタムエンジニアリング作業を必要とします。 

現在は、dbtのパワーをSnowflake上でネイティブに利用できます。dbt project on Snowflakeにより、データチームはSnowflake内で直接、dbtプロジェクトを構築、実行、監視できます。Snowflakeにおける次世代のSQLオーサリングである新しいWorkspacesエディタにより、チームはプロジェクトの編集とデバッグが可能です。dbt project on Snowflakeは、GitHub ActionsなどのCI/CDツールを介したdbtプロジェクトの展開やテスト管理において、Snowflake CLIと完全に同等の機能を提供します。これらのネイティブオプションは、コンテキストの切り替えを減らし、セットアップを簡素化し、データパイプライン開発のライフサイクル全体を加速します。

code build
Figure 1: A look at the dbt project CI/CD lifecycle.

「人命を救うケアを日々提供している非営利団体にとって、あらゆるコスト管理が重要になってきます。データおよび分析プラットフォームを再構築する際、私たちは機能性とシンプルさ、コストのバランスが取れた、適切な規模のツールを必要としていました。dbtがSnowflakeのエコシステムの一部となったため、進むべき道が明確になりました。現在、私たちはdbtワークフロー全体を、Snowflake内でネイティブに実験、コード化、テスト、展開、スケジュール、そしてモニタリングしています。単一のプラットフォームに統合したことで、有用なシンプルさが生まれ、コストの透明性が向上し、エンジニアは価値提供の迅速化に集中できるようになりました」

— Chris Androsoff氏
STARSデータ担当ディレクター

dbt project on Snowflakeにより、チームはコラボレーションしてモジュラー型のスケーラブルなデータプロダクトを構築し、下流のアナリティクス、AI、アプリケーションを提供します。この機能をプレビューしたお客様は、トランスフォーメーションパイプラインを1日以内に構築できる能力(34%向上)と、トラブルシューティングできる能力(11%向上)に、より大きな確信を持てたと報告1しています。

1 2025年4月から6月にかけて、dbt project on Snowflakeを初めて使用する前後の17人のユーザーを対象として、構築とトラブルシューティングのスピード向上を測定しました。

blognov

Charlie Hammondによるデモで、dbt project on Snowflakeについて学習できます。

 

dbt project on Snowflakeで開発を加速

dbt project on Snowflakeは、データエンジニアが変換パイプラインの標準化と自動化のためにワークフローを合理化します。そのために、以下が可能になります。

  • 開発とテスト:Gitと統合されるファイルベースのIDEを使用して、Workspacesでdbtプロジェクトを作成、アップロード、編集できます。データ品質のテスト実行とモデルの検証を行います。
  • 可視化とデバッグ:有向非巡回グラフ(DAG)をコンパイルして可視化し、リネージと依存関係をUIで直接検査できます。
  • 展開とオーケストレーション:ネイティブのSnowflakeタスクを使用してデータパイプラインの展開とスケジューリングを行えるため、オーケストレーションが簡素化します。ネイティブのWorkspaces IDEから直接、COMPILE、TEST、RUNなどのさまざまなdbtコマンドを選択できます。
  • モニタリングとトレース:粒度の高いロギングとトレースにより、実行履歴を監視できます。 

開始手順

既存のdbtプロジェクトをGitからインポートする場合も、ゼロから開始する場合も、dbt project on Snowflakeを簡単に開始できます。

  1. Snowsight Workspacesに移動します。
  2. dbtプロジェクトの作成またはGitリポジトリからのインポートを選択します。
  3. 既存のSnowflake仮想ウェアハウスを使用してプロジェクトを実行します。

スタートチュートリアル、またはSnowflake Labsからコードを入手できます。この機能がもたらす運用効率、標準化、簡素化された開発者体験により、より多くのチームがモダンデータプロダクトを構築、展開できるようになります。詳細については、Snowflakeドキュメントを参照するか、開発者ガイドページをご覧ください。

 

eBook

The Essential Guide to Data Engineering

モダンデータエンジニアリングの手法では、組織のすべてのビジネスユニットに対して高速で信頼性の高い、質の高いデータが生成されます。組織やエコシステム全体で、簡単かつセキュアにデータを共有できます。
記事をシェアする

Snowflake Cortex AIでのGemini 3の提供開始を発表:よりスマートで迅速、かつ安全なAI構築を支援する、Google Cloudとの連携強化

SnowflakeとGoogle Cloudは、Gemini AIモデルをSnowflake Cortex AIにネイティブに統合し、お客様がガバナンスの確保されたデータで生成AIアプリケーションを構築し、スケーリングできるようにします。

Snowparkの一般提供開始

%%excerpt%% 本日、あらゆるユーザーにデータプログラマビリティを開放する開発者フレームワークであるSnowparkの、正式な一般提供の開始を発表できることをうれしく思います。

Icebergテーブルとの相互運用性を備えたオープンなストレージが一般提供開始

Snowflakeの容易さ、性能、ガバナンスをオープンデータ形式により簡単に適用できるようになりました。

ストレージコストの最適化とコンプライアンスの簡素化を実現するストレージライフサイクルポリシーの一般提供を開始

Snowflakeの新しいストレージライフサイクルポリシー(現在はGA)を使用してデータのライフサイクルを自動的に管理することで、コンプライアンスを簡素化し、ストレージコストを削減できます。

エンタープライズAIを加速する無限のデータ

Snowflakeは、開発者がエンタープライズAIをより迅速に構築できるよう支援します。Horizon Catalog、Openflow、Postgresの新しいツールは、移行を合理化し、データガバナンスを簡素化します。

SQL開発を大幅に加速:Snowflake Workspacesの一般提供開始

Snowflake Workspacesは現在、SnowsightでGAとなりました。組み込みGit、AIコパイロット、チームコラボレーション機能を備えたモダンな開発エクスペリエンスで、SQLワークフローをアップグレードできます。

PalantirとSnowflake、信頼性が高く、フリクションレスなAI提供で提携を発表

SnowflakeはPalantir Technologiesと提携し、組織が生成AIとエージェント型AIを効果的に統合できるように支援します。

時系列ASOF結合分析の一般提供開始

タイムスタンプに基づいて異なるテーブルのレコードを効果的に関連付ける

RANGEベースのウィンドウフレームで時系列分析を加速(一般提供)

Unlock powerful time-series analytics with Snowflake's enhanced RANGE-based window frame, now generally available.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • 30日間の無料トライアル
  • クレジットカード不要
  • いつでもキャンセル