より深いインサイト抽出に向けた新たな大規模言語モデルを発表
6月 27, 2023
※本報道資料は米国スノーフレイク社が6月27日に発表した内容の抄訳です。
スノーフレイク、プラットフォームの高速化やパフォーマンスの向上を継続しつつ文書からのより深いインサイト抽出に向けた新たな大規模言語モデルを発表
- Document AI(プライベートプレビュー中)は、Snowflakeのファーストパーティ大規模言語モデル(LLM)を活用して文書からのより深いインサイトの抽出を実現し、速度、正確さ、シンプルさの向上により優れた価値を創出
- Booking.comなどの顧客が、Snowflake Icebergテーブル(近日中にプライベートプレビュー提供開始)を使用して、Snowflakeのパフォーマンス向上やオープンフォーマットで保存されたデータのガバナンス強化を推進中
- 新しいSnowflakeパフォーマンス指数は、ユーザーの反復ワークロードのクエリ時間の15%向上を示す(メトリクス追跡開始時点との比較)*1
2023年6月28日(日本時間): データクラウドを提供するスノーフレイク(ニューヨーク証券取引所:SNOW)は本日、年次のユーザーカンファレンスであるSnowflake Summit 2023において、企業が重要なユーザーワークロードのパフォーマンス向上を継続しながら自社のあらゆるデータの価値をよりスムーズに創出することを可能にする、同社の単一統合プラットフォームへの機能強化を発表しました。Document AI(プライベートプレビュー中)などの新たなイノベーションをベースに、スノーフレイクは、ユーザーのドキュメントの理解を助け、非構造化データの活用を可能にする、Applicaの画期的な生成AIテクノロジーをもとに構築した新たなLLMをリリースします。スノーフレイクはさらに、高速なパフォーマンスや、Snowflakeカタログ内のデータと他のカタログで管理されているデータ両方に対するエンタープライズ級のガバナンスによりデータサイロの解消を促進し、組織によるオープンテーブルフォーマットの使用を可能にする、Icebergテーブル(近日プライベートプレビュー予定)への更新も発表いたします。さらに、新しいSnowflakeパフォーマンス指標(SPI)は、スノーフレイクが現在推し進める性能改善の透明性やメトリクスを向上させます。すでにメトリクス追跡開始以降の直近8か月間において 安定的な顧客ワークロードのクエリ時間が15%*1改善したことがSPI指標により示されており、スノーフレイクが継続して取り組んでいる顧客のための価格性能比の向上を裏付ける数字と言えます。
Snowflakeの単一プラットフォームや継続したイノベーションのメリットを実感している企業の1つにFidelity Investmentsがあります。日々4,000万を超える顧客にサービスを提供する世界最大金融機関の1つである同社において、Fidelityの世界中の68,000社強の関連企業の主要なステークホルダーは、Snowflakeの統合データプラットプラットフォームを活用してインパクトを推進しています。
Fidelity InvestmentsのCIO兼データアーキテクチャ&エンジニアリング部門法人リーダーのMihir Shah氏は次のように語っています。「組織内のあらゆるデータを一元化することはすべてのCIOの夢であり、データクラウドはそれを実現してくれます。組織にまたがる主なステークホルダーが同じシングルソースオブデータに対する可視性を持ち、シームレスに質問に答え迅速に問題を解決できることが不可欠です。データクラウドは、データサイロを解消し、主なステークホルダー間にまたがるデータへの管理されたアクセスを提供してくれるため、継続的な大規模イノベーションや効率化の促進を実現し、最終的に顧客に対する価値創出につながっています」
Snowflakeは、LLMでデータクラウドを強化
IDCによると、今後5年間で、世界のデータの90%は、文書、画像、動画、音声といった形式の非構造化データとなると予測されています*2。組織は、こうし膨大な非構造化データを継続的に保存していますが、これらのデータから価値あるインサイトを抽出することは、これまでのところ、手作業によるエラーを起こしがちなプロセスが必要であり、その実行に必要なスキルを持つ人的リソースも限られています。Snowflakeの非構造化データへのサポートをもとに構築された、Snowflakeのビルトインソリューション「Document AI」は、自然言語処理を使用し、組織がスムーズに文書の持つ価値を理解し抽出することを可能にします。
Document AIはSnowflakeによるApplicaの買収(2022年9月)を機に実現したもので、Applicaの用途特化型マルチモデルLLMを活用しています。本モデルをSnowflakeのプラットフォームと統合することにより、組織は請求額や契約条件といったコンテンツを文書から容易に抽出し、ビジュアルインターフェースや自然言語を使用して結果の微調整を行うことが可能となります。顧客は、社内チームのビジネスへの理解を深め、安全かつスケーラブルな方法でユーザーの生産性向上を図るためにDocument AIを使用しています。スノーフレイクは、Document AIを手始めとして、これらの機能をより多くのタイプの非構造化データに活用できるよう計画しています。
SnowflakeによるIcebergテーブルを活用したパフォーマンスの向上とデータガバナンスの拡張
Apache Icebergがオープンテーブルフォーマットに対する業界標準としての地位を固めその使用度が高まっていることを受け、Snowflakeは企業がより容易にデータクラウドの価値をIcebergデータに拡張できるよう取り組んでいます。Icebergテーブルを活用することで、組織は自社のストレージにあるApache Icebergフォーマットのデータを、そのデータの管理者がSnowflakeや外部組織であるかにかかわらず活用できると同時に、Snowflakeの使いやすさ、パフォーマンス、統一されたガバナンスのメリットを享受することができます。そのため、システム間のデータの移動や複製の必要性がなくなりデータ管理が簡素化されるだけでなく、柔軟性の向上やコスト削減も実現することができます。さらに、多様なアダプター、コントリビューター、およびその他市販ソリューションで構成されるApache Icebergのエコシステムは拡大を続けており、これらを利用してストレージをフューチャープルーフ化することで、ベンダーロックインや頻繁な移行を回避できます。Booking.comなどの顧客は、Snowflake Icebergテーブルを活用して、データクラウドの力を自社のすべてのデータに適用しています。
Snowflakeは、安定した顧客ワークロードのクエリ時間を15%向上(メトリクス追跡開始時点との比較)
スノーフレイクは「カスタマーファースト」 を最も重要な価値として掲げています。スノーフレイクeは常に、性能、効率性の向上を図り、多くの場合においてユーザー側でのアクションを必要としない、定期的なリリースを伴う継続的なイノベーションの提供に注力しています。こうした取り組みの一環として、スノーフレイクはこの度、実際の顧客ワークロードを分析することで一定期間における改善を定量化することのできる新たなSPIを導入しました。本SPIによると、メトリクス追跡開始以降の直近8か月間において、Snowflake上での安定した顧客ワークロードのクエリ時間が15%向上*1したことが明らかになっています。新しいSPIは、顧客のために常にコストやパフォーマンスの最適化を図るというスノーフレイクのコミットメントの一翼を担うもので、一定期間のプロダクションワークロードに対するプラットフォーム機能やハードウェア改善の定量化されたパフォーマンスインパクトの透明性向上を実現します。
さらにスノーフレイクは、SQLユーザー向けプレビルトの機械学習機能(パブリックプレビュー中)などのより幅広い高度なアナリティクスのサポートの面でも単一プラットフォームの向上に取り組んでおり、新たなデータ品質メトリクスや分類機能(いずれもプライベートプレビュー中)による統合されたガバナンスやプライバシーの拡張を進めています。
Snowflakeのプロダクト担当上級副社長であるChristian Kleinerman(クリスチャン・クレイナマン)は次のように述べています。「Snowflakeの単一プラットフォームは今後も私たちのイノベーション戦略の中核を成すものであり、顧客がSnowflakeの業界をリードする性能、スケール、ガバナンスによるメリットを享受しながら自社データにシームレスにアクセス、理解、保護できるよう、常に向上を図っていきます。私たちは、顧客のために新たなデータの時代を開拓し、AIの活用や、従来はフォーマットやロケーションなどにより拘束を受けていたデータサイロの解消を通じて、企業がデータクラウド上でデータを利用しインサイトを取得するあり方を根本から変えるべく今後も取り組みを進めていきます。」
Snowflakeはまた、データサイエンス、データエンジニアリング、アプリケーション開発のデータプログラマビリティを拡張する新たなイノベーションや、組織がデータクラウド上で大規模に業界をリードするアプリケーションを配信・収益化するのを可能にする新機能をSnowflake Summit 2023にて発表しました。
*1 2022年8月25日~2023年4月30日のSnowflake社内データに基づく。SPIを計算する際には、提示された期間に実行されたお客様のワークロードのうち、処理されたクエリ量とデータ量の両方が安定していて比較可能なワークロードのグループを特定します。クエリ時間の短縮は、ハードウェアとソフトウェアの改善やお客様の最適化などのいくつかの要因の組み合わせによってもたらされました。
*2 IDC, Inc. Dell Technologies提供によるホワイトペーパー(2022年)「デジタルトランスフォーメーションを実践する企業における新たな非構造化ストレージ要件への対応」Ashish Nadkarni, Doc #US47731121RF(2022年10月)
関連情報
- Snowflake パフォーマンス指標の詳細はこちら。
- Snowflake単一プラットフォームのパフォーマンスやミッションクリティカル性の向上、より幅広いデータタイプのサポートについてはこちらのブログ記事をご覧ください。
- Icebergテーブルに関する最新発表をこちらの Snowflake Summit 2023セッションで確認し理解を深めましょう。こちらのブログ記事もご覧ください。
- LinkedInやTwitterで、Snowflakeの最新のニュースや発表をチェックしましょう。
将来の見通しに関する記述について
このプレスリリースには、明示または黙示を問わず、(i)Snowflakeの事業戦略、(ii)開発中または一般に提供されていないSnowflakeの製品、サービス、テクノロジー、(iii)市場の拡大、トレンド、競争状況に関する考察、(iv)Snowflake製品とサードパーティプラットフォームの統合およびサードパーティプラットフォーム上でのSnowflake製品の相互運用性と可用性についての言及など、将来の見通しに関する記述が含まれています。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出するForm 10-Q(四半期レポート)やForm 10-K(年次レポート)内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用してはなりません。
© 2023 Snowflake Inc. All rights reserved. Snowflake、Snowflakeのロゴ、および本書に記載されているその他すべてのSnowflakeの製品、機能、サービス名は、米国およびその他の国におけるSnowflake Inc.の登録商標または商標です。本書で言及または使用されているその他すべてのブランド名またはロゴは、識別目的でのみ使用されており、各所有者の商標である可能性があります。Snowflakeが、必ずしもかかる商標所有者と関係を持ち、または出資や支援を受けているわけではありません。
スノーフレイクについて
スノーフレイクは、あらゆる組織がSnowflakeデータクラウドを用いて自らのデータを最大限に活用するのを支援します。多くのユーザー企業がデータクラウドを利用して、サイロ化されたデータの統合、データの発見と安全な共有、データアプリケーションの推進、さらには多様なAI/MLや分析ワークロードの実行を進めています。データやユーザーがどこに存在するかに関係なく、スノーフレイクは複数のクラウドと地域にまたがり単一のデータ体験を提供します。多くの業界から何千ものお客様(2023年4月30日時点で、2022年のForbes Global 2000社(G2K)のうち590社を含む)が、Snowflakeデータクラウドを組織全体で幅広いビジネスに活用しています。詳しくは、snowflake.comをご覧ください。
メディアからのお問い合わせ
<本件に関するお問い合わせ>
Snowflake株式会社
PR担当 山中
出典:Snowflake Inc.