ガイド
Get Started with Iceberg Tables on Snowflake-Managed Storage
フルマネージドのIcebergテーブルを作成し、互換性のあるエンジンを接続するためのステップバイステップのクイックスタートガイドです。
最初のCREATE ICEBERG TABLE文から、実稼働に対応したApache Iceberg™テーブルを起動できます。すべてのテーブルにエンタープライズレベルの保護、オープンな相互運用性、自動化されたストレージメンテナンスを適用できるため、チームはデータプロダクトをより迅速に提供できるようになります。
暗号化、Time Travel、Fail-Safe、クロスプラットフォームレプリケーションの各機能により、CSPのIAMやセキュリティ設定のオーバーヘッドなしで、テーブルが標準機能として保護されます。
Snowflake Horizonのガバナンス下で、Iceberg互換のエンジンから、Apache Iceberg™テーブル向けSnowflakeストレージへの双方向読み取りおよび書き込みアクセスが可能になります。
ストレージのレイアウト、圧縮、ガベージコレクション、ライフサイクル管理がバックグラウンドで実行されます。チームがCREATE ICEBERG TABLE文を実行するだけで、Snowflakeがこれらの一連の管理を担います。
移行の理由
組み込みの保護機能


オープンスタンダード
Icebergデータにアクセスするために新しいアナリティクスツール、変換フレームワーク、またはAIワークロードが必要になった場合でも、Snowflakeストレージなら煩雑な管理は必要ありません。メタデータ、ファイル、ガバナンスは、Snowflakeが管理する他のIcebergテーブルと同様に機能します。
自動化されたインフラストラクチャ
必要なセットアップは、CREATE ICEBERG TABLE文を実行することだけです。Snowflakeは、テーブルメンテナンス操作を自動的かつ継続的に処理します。エンジニアはインフラストラクチャの保守に追われることなく、AI-readyのパイプラインや新しいデータプロダクトのリリースに集中できます。


コストが予測可能
請求対象はテーブル内のアクティブデータのみであり、孤立したファイル、失敗したメンテナンスジョブによる出力、メタデータのオーバーヘッドなどは含まれません。Snowflakeのコンピュートからのストレージリクエストコストは発生しません。予期しないアクティビティによって請求に驚かされることはありません。
Snowflakeストレージ
Apache Icebergテーブル向けSnowflakeストレージに関する詳細情報をご確認いただけます。
Icebergテーブルは、ガバナンスの確保された単一のデータに対して複数のエンジンを動作させるオープンテーブルです。
Apache Iceberg™テーブル向けSnowflakeストレージを使用すると、Snowflakeがストレージのレイアウト、コンパクション、ガベージコレクション、ライフサイクル管理を自動的に処理します。最初のCREATE ICEBERG TABLE文を実行するだけで、暗号化、Time Travel、Fail-Safe、クロスプラットフォームレプリケーションなどの保護機能が組み込まれたフルマネージドのIcebergテーブルを作成できます。
セルフマネージド型のストレージは、運用の負担がチームにかかります。これには、IAMの設定、ライフサイクルポリシー、コンパクション、ガベージコレクションを含む、30以上のセットアップおよびメンテナンス作業が含まれます。ポリシーの設定ミスが1つでもあるとテーブルのメタデータが破損する恐れがあり、ファイル数が管理されずに増加するとコストの予測が困難になります。
Snowflake Horizonによって管理された同一のテーブルに対し、互換性のあるIcebergエンジンから読み取りおよび書き込みを行うことができます。データを複製したり、単一の環境にロックインされたりすることなく、使い慣れたエンジンやツールを活用できます。
Apache Iceberg™テーブル向けSnowflakeストレージは、 Horizonカタログ を使用して、互換性のあるIcebergエンジンに対する安全な双方向の読み取りおよび書き込みアクセスを提供します。これにより、データの複製や同期パイプラインを作成することなく、ガバナンスの効いた単一のテーブルを維持しながら、データスタック全体での高度な相互運用性を実現します。
Snowflakeは、圧縮、ガベージコレクション、ライフサイクル管理を含む、Icebergテーブルのメンテナンスを自動化します。チームがこれらの作業を手動でスケジュールしたり管理したりする必要はありません。Snowflakeのコンピュートによるストレージリクエストコストが含まれているため、定期的なメンテナンスによって個別のリクエスト料金が請求に加算されることはありません。
Snowflakeはテーブルベースの料金体系を採用しているため、請求対象はテーブル内のアクティブデータのみとなります。Snowflakeのコンピュートによるストレージリクエストコストが含まれているため、孤立したファイル、メタデータのオーバーヘッド、さらにはGET、PUT、LISTリクエストのすべてがコストに加算されるセルフマネージドストレージで発生しがちな、バケットベースの課金による予期しない請求を回避できます。