Snowflake Connect: AI(1月27日開催)

Snowflakeの最新イノベーションでデータとAIの可能性を最大限に引き出します。

Snowflake for Developers開発者ガイドはじめての Cortex AI 関数(日本語版)

はじめての Cortex AI 関数(日本語版)

Cortex LLM関数
Sho Tanaka, Dash Desai

概要

Cortex AI 関数は、SQL をマルチモーダルデータ向けの AI クエリ言語として再定義し、強力な AI 機能を Snowflake の SQL エンジンに直接組み込みます。Google、OpenAI、Anthropic、Meta などの業界をリードする LLM を使用して、使い慣れた SQL コマンドでテキスト、画像、音声にわたるスケーラブルな AI パイプラインを構築できます。 新しい FILE データ型によるマルチモーダルデータのネイティブサポートにより、Cortex AI 関数は AI_FILTER やAI_AGGREGATE などの AI オペレーターと従来の SQL をシームレスに統合し、アナリストがエンタープライズグレードのセキュリティとガバナンスを維持しながら、多様なデータタイプをより効率的かつコスト効率よく処理できるようにします。

Cortex AI 関数とは?

Cortex AI 関数は、構造化データと非構造化データ分析の間の従来の壁を取り払い、別々のツールや専門的なスキルの必要性を排除します。

主な3つのメリット:

  • 使い慣れた SQL 構文によるシンプルさ - 複雑なコーディングなしで、あらゆるアナリストを AI エンジニアに変革
  • Snowflake のクエリエンジンとの統合による高性能処理 - 30 %以上高速なクエリランタイムを実現
  • 従来の AI 実装と比較して最大60%のコスト削減

セットアップ不要で単一プラットフォームにすべてのデータタイプを統合することで、Cortex AI 関数は企業全体で AI を活用した分析を民主化します。

Cortex AISQL

ユースケース

Cortex AI 関数は、多様なデータタイプを扱うあらゆる業界の組織に恩恵をもたらします:

  • 金融サービス:ニュースフィードをフィルタリングし、社内の保有銘柄と結合することで、コーポレートアクション処理を自動化
  • 小売・ EC:顧客レビューを分析し、懸念されるパターンを特定することで、製品品質の問題を検出
  • ヘルスケア:非構造化の臨床ノート、トランスクリプト、画像と構造化された患者記録を橋渡しすることで、医学研究を加速
  • 法務:契約分析とコンプライアンス監視を効率化
  • メディア:マルチモーダルデータ分析によるコンテンツの最適化と広告のターゲティング

ビジネスアナリストは AI の専門知識なしでインサイトを抽出でき、データエンジニアはよりシンプルなパイプラインを構築でき、データサイエンティストはより豊富な特徴量セットを作成できます - すべて使い慣れた SQL を使用して。

前提条件

学習内容

Cortex AI 関数の強力なオペレーターを使用して、自然言語で Snowflake 内のマルチモーダルデータを分析する方法を学びます。

  • AI_COMPLETE:テキストや画像を含むさまざまな入力に対して、AIによるテキスト補完や説明を生成
  • AI_TRANSCRIBE:音声ファイルの文字起こし
  • AI_FILTER:セマンティックフィルタリング
  • AI_AGG:複数行にわたるインサイトの集約
  • AI_CLASSIFY:テキストと画像の分類

作成するもの

テキスト、画像、音声ファイルにわたるマルチモーダルデータで Cortex AI 関数を使い始めるための Snowflake Notebook

セットアップ

ステップ 1. Snowsight でSQLワークシートを作成し、setup.sqlを開いて、すべてのステートメントを上から順に実行します。

ステップ 2. サンプルの画像ファイルをダウンロードし、Snowsight >> Data >> Add Data >> Load files into a Stageを使用して、ステップ1で作成したDASH_DB.DASH_SCHEMA.DASH_IMAGE_FILESステージにアップロードします。

ステップ 3. サンプルの音声ファイルをダウンロードし、Snowsight >> Data >> Add Data >> Load files into a Stageを使用して、ステップ1で作成したDASH_DB.DASH_SCHEMA.DASH_AUDIO_FILESステージにアップロードします。

ステップ 4. Snowsight でSQLワークシートを作成し、images.sqlを開いて、すべてのステートメントを上から順に実行してIMAGESテーブルを作成します。

ステップ 5. Snowsight でSQLワークシートを作成し、audio.sqlを開いて、すべてのステートメントを上から順に実行してVOICEMAILSテーブルを作成します。

ステップ 6. cortex_ai_functions.ipynbをクリックして、GitHubからNotebookをダウンロードします。(注意:右クリックでダウンロードしないでください。)

ステップ 7. Snowsightで:

  • 左側のナビゲーションメニューで、Projects » Notebooksをクリック
  • 右上のNotebookの下矢印をクリックし、ドロップダウンメニューからImport .ipynb fileを選択
  • 上のステップでダウンロードしたcortex_ai_functions.ipynbファイルを選択
  • Create Notebookポップアップで
    • Notebook locationにはDASH_DBDASH_SCHEMAを選択
    • Python environmentにはRun on warehouseを選択
    • Query warehouseにはDASH_WH_Sを選択
    • Notebook warehouseにはデフォルトのSYSTEM$STREAMLIT_NOTEBOOK_WHを選択
    • Createボタンをクリック

ステップ 8. Notebookを開く

  • 右上のStartボタンをクリック

注意:この時点で、セッションの開始に数分かかる場合があります。ステータスがStartingからActiveに変わるまで、先に進むことはできません。

Notebookの実行

前提条件:セットアップに記載されているステップが正常に完了していること。

以下は、ダウンロードしてSnowflakeアカウントにインポートしたcortex_ai_functions.ipynb Notebookのコードウォークスルーです。

ステータスがStartingからActiveに変わったら、すべてのセルを上から順に実行します。

セル Import_Libraries

Notebookのセルを実行するために必要なライブラリをインポートします。

セル Multimodal

AI_COMPLETE()AI_TRANSCRIBE()を使用して、テキスト、画像、音声データにわたる顧客の問題を特定し、SQLオペレーターがすべてのモダリティでシームレスに機能する様子を確認します。

  • テキスト:メール
  • 画像:スクリーンショット
  • 音声:ボイスメール

セル Preview_Data

ネイティブ FILE データ型により、すべてのデータ形式を1つのテーブルに統合できることに注目してください。

セル AI_FILTER

JOIN ... ON AI_FILTER()を使用して、顧客の問題と既存のソリューションをセマンティックに「結合」します。

セル AI_AGG

AI_AGG()を使用して、複数行にわたる集約されたインサイトを取得します。

セル AI_CLASSIFY

AI_CLASSIFY()を使用して、下流のアプリケーションで使用できるラベルを分類します。例えば、MLモデルのトレーニングに使用できます。

==================================================================================================

オプション:セル結果に画像を表示する

Preview_Dataセルの統合データの一部として Notebook 内に画像を表示したい場合は、以下の手順に従ってください。

ステップ 1. SQL ワークシートで、以下のステートメントを実行して、サンプル Python ファイルを保存するためのSnowflake マネージド内部ステージを作成します。

 create or replace stage DASH_DB.DASH_SCHEMA.DASH_PY_FILES 
    encryption = (TYPE = 'SNOWFLAKE_SSE') 
    directory = ( ENABLE = true );

ステップ 2. Snowsightを使用して、snowbooks_extras.pyDASH_DB.DASH_SCHEMA.DASH_PY_FILESステージにアップロードします。

ステップ 3. 既存のcortex_ai_functions.ipynb Notebook を再度開き、右上のPackages >> State Packagesをクリックして、@DASH_DB.DASH_SCHEMA.DASH_PY_FILES/snowbooks_extras.pyを入力し、Importをクリックします。

Add package

ステップ 4. セッションがActiveの場合は、クリックして現在のセッションを終了します。それ以外の場合は、Startをクリックして新しいセッションを開始します。これにより、パッケージリストも更新され、カスタムパッケージsnowbooks_extrasが含まれます。

注意:この時点で、セッションの開始に数分かかる場合があります。ステータスがStartingからActiveに変わるまで、先に進むことはできません。

ステップ 5. Import_Librariesのライブラリリストにimport snowbooks_extrasを追加し、セルを実行します。

ステップ 6. Preview_Dataセルを実行すると、以下のようにINPUT_FILE列に画像が表示されます。

snowbooks_extrasをインポートする前

Data without images

snowbooks_extrasをインポートした後 -- 以下のように拡大画像を表示するには、2回クリックする必要があります(正確にはダブルクリックではありません :))。

Data with images

まとめとリソース

おめでとうございます!マルチモーダルデータでCortex AI 関数を使い始めるための Snowflake Notebook を正常に作成しました。

学んだこと

Cortex AI 関数の強力なオペレーターを使用して、自然言語で Snowflake 内のマルチモーダルデータを分析する方法を学びました。

  • AI_COMPLETE:テキストや画像を含むさまざまな入力に対して、AIによるテキスト補完や説明を生成
  • AI_FILTER:セマンティックフィルタリング
  • AI_TRANSCRIBE:音声ファイルの文字起こし
  • AI_AGG:複数行にわたるインサイトの集約
  • AI_CLASSIFY:テキストと画像の分類

関連リソース

Updated 2026-01-22

This content is provided as is, and is not maintained on an ongoing basis. It may be out of date with current Snowflake instances