注:本記事は(2022年2月14日)に公開された(New Snowflake Features Released in January 2022)を翻訳して公開したものです。

2022年のはじめ、Snowflakeに注目すべき機能が多数追加されました。非構造化データのサポートとSnowpark(Scala APIとJava UDF)の両方を一般でご利用いただけるようになり、これらを組み合わせることでさらに高い効果が得らます。例えばSnowparkを利用すると、自然言語処理のテキストファイルやDICOM画像などの非構造化データをSnowflakeで直接処理できるようになります。また、Snowflake Scriptingのパブリックプレビューにより、レガシーシステムからの移行がよりシンプルなものとなりました。1月に行われた発表のすべての内容については、こちらをご覧ください。

最新のアーキテクチャ

非構造化データのサポートを一般公開

Snowflakeの非構造化データのサポートには、Snowflakeで非構造化データの保存、アクセス、処理、管理、ガバナンス、共有を行うための機能が組み込まれています。これにより、構造化データ、半構造化データ、非構造化データをクラウド上でシームレスに管理し、分析できるようになりました。開始の方法はこちらをご覧ください。

データプログラマビリティ

Snowparkを一般公開

Snowparkでは拡張性が重視されています。データエンジニア、データサイエンティスト、その他の開発者が、Scala、Python(プライベートプレビュー版)、Javaなど、各自の好きなプログラミング言語やツールとDataFrameなどの使い慣れたプログラミング構造を使用して、より効率的かつ効果的にデータを扱えるよう設計されています。さらに、その作業をデータが存在する場所、つまりSnowflakeのスケーラブルで安全なコンピュートエンジン上で行えるよう構築されています。詳しくはこちらをご覧ください

プラットフォームの最適化

Snowflake Scriptingのプレビュー

複雑なSQLフローを作成して保存するための新しい手続き型言語、Snowflake Scriptingのパブリックプレビューを開始しました。すでに公開されているJavaScriptのストアドプロシージャに加え、SQLでの翻訳、スクリプトの作成、ストアドプロシージャの作成が可能になります。レガシーデータウェアハウスのクラウドへの移行を検討している場合、その移行が以前よりもシンプルに実行できるようになります。ぜひSnowflake Scriptingのご利用をお試しください。

パイプラインのオブザーバビリティとエクスペリエンス

パイプラインの可視性とエクスペリエンスの向上

Snowflakeユーザーは、コピー履歴のダッシュボードを利用することで、パイプラインの可視性を高めることができるようになりました。このダッシュボードには、一括データロード(COPY INTO

コマンドを使用)のコピー履歴が365日分表示され、Snowpipeでデータ取得の可視性が高まります。

また、プレビューではSnowpipeの新しいエラー通知機能も利用できます。これは、ステージングされたファイルからのデータ読み込み中にSnowpipeでエラーが発生した場合、クラウドメッセージを使用してエラーを説明する通知をトリガーし、ファイル内のデータをさらに分析できるようにする機能です。

コピー履歴のダッシュボードSnowpipeのエラー通知機能の詳細はこちらをご覧ください。

グローバルガバナンス

他の列に基づく条件付きのマスクデータを一般公開

複数の条件列に基づいてデータマスキングポリシーを作成できるようになり、アクセスポリシーの柔軟性が高まるとともに、データをより簡単に管理できるようになります。条件付きマスキングポリシーは、複数のテーブルやビューに適用可能です。詳しくはこちらをご覧ください

Snowflakeデータマーケットプレイス

Snowflakeユーザーは、Snowflake データマーケットプレイスを利用して、200社以上(2021年10月1日時点)のプロバイダーが提供する有用性の高いサードパーティデータやサービスを見つけてそれにアクセスしたり、Snowflakeデータクラウドで自社製品を販売したりできます。詳しくはSnowflakeデータマーケットプレイスをご覧ください。

最近追加されたSnowflakeデータマーケットプレイスプロバイダー

人事

SmartMarketData

2014年より、SmartMarketDataは、オルタナティブデータ分野でのリーダー的存在となっている革新的企業です。SMDは、ユニークで関連性の高いオルタナティブデータを発見し、ウォール街で利用できるように製品化を支援しています。詳しくはこちらをご覧ください

顧客の位置情報

Onemata

Onemataは、コンプライアンスを重視し、SDKから派生したモバイルロケーションデータを提供する最大手のプロバイダーです。意思決定者が日常業務のツールに位置情報を直接かつ簡単に統合できるよう、堅牢で費用対効果の高いソリューションを提供しています。詳しくはこちらをご覧ください

データインフラストラクチャ

Monte Carlo

2019年に設立されたMonte Carloは、自動化されたエンドツーエンドのデータオブザーバビリティプラットフォームです。機械学習ファーストのこのソリューションは、データエコシステム全体の鮮度、分布、ボリューム、スキーマ、系統に関する問題をデータチームに通知し、「データのダウンタイム」を回避するのに役立ちます。Monte Carloが生成する合成メタデータは、ダッシュボードの構築、データプラットフォームチームの性能分析、ならびにSLAへのコミットメントとトラッキングに役立ちます。この詳細レベルによって、使用状況、アクセス、データ品質のチェックに基づき、どのデータがビジネスにとって最も重要であるかを把握することが可能となります。詳しくはこちらをご覧ください

金融サービス

Mintec Ltd.

Mintecは、世界の大手食品および製造ブランドが、より効率的で持続可能な調達戦略を実施できるようサポートしています。同社は、15,000種類以上の農産物素材、関連産業の素材とエネルギーの市場価格と予測を提供しています。同社のデータを活用することで、顧客は価格に関する理解を深め、支出を分析し、自信を持って交渉できるようになります。Mintecのデータは、時間の節約、ヒューマンエラーの削減、より実用的で効率的な結果の達成を目的としています。詳しくはこちらをご覧ください

ウェブサイトのキーワードトラフィック

Similarweb

Similarwebは、大企業や中小企業(SMB)向けのデジタルインテリジェンスプロバイダーです。同社のプラットフォームは、信頼性の高い包括的で詳細なデジタル環境のビューを提供し、顧客が市場で競争力を持てるよう支援します。同社の独自技術が、数百万のウェブサイトやアプリを網羅し、毎日数十億のデジタルインタラクションやトランザクションを分析して、そのデジタルシグナルを実用的なインサイトに変換しています。ビジネスリーダーから戦略チーム、アナリスト、マーケティング担当者、カテゴリーマネージャー、営業担当者、投資家まで、誰もが迅速かつ効率的に強力なビジネスチャンスを発見し、競争上の潜在的脅威を特定し、市場シェアを獲得し、収益を拡大するための重要な意思決定を行うことができます。詳しくはこちらをご覧ください

小売りとパッケージ製品

Skupos

Skuposは、米国のコンビニエンスストアやパッケージ製品(CPG)市場のPOSデータをリアルタイムで取得し、クレンジングと分析を行うデータ企業です。同社のCPG POSデータセットは14,000以上の独立系小売業者から入手したものであり、NielsenやIRiなど、他に所有しているもののないデータも含まれています。Skuposは特に、CPG企業が概略的な競争力学からロケーション固有の流通や実行に至るまでのトレンドを把握できるようサポートしています。同社のフルブランドプラットフォームには、未加工データフィード、インサイトダッシュボード、小売店の全ネットワークにおけるプロモーションの活用が含まれています。詳しくはこちらをご覧ください

Catalina Marketing

Catalinaは、ショッパーインテリジェンスと、ターゲットを絞った店舗、テレビ、デジタルメディアでのショッパージャーニーのパーソナライズで市場をリードする企業です。Catalinaは、世界で最も堅牢なリアルタイムショッパーデータベースを活用することで、CPGブランド、小売業者ならびに代理店がメディアの計画、実行、測定の各段階を最適化できるようサポートしています。同社は、預けられたデータのプライバシーとセキュリティを最優先し、消費者の信頼を維持することに重点を置いています。同社は、米国、コスタリカ、ヨーロッパ、日本で事業を展開しています。詳しくはこちらをご覧ください

マーチャントプロセッシングデータ

North American Bancard

North American Bancard(NAB)は、加盟店とその顧客の決済プロセスをシンプル化しています。決済テクノロジーのイノベーターとして、ほぼすべての業界の加盟店に決済ソリューションを提供しており、シンプル化された顧客、従業員、業務の収益性を最大化する在庫の管理によって支えられています。これには、ビジネスの分析を実行するために使用できる加盟店や取引決済処理データなどの関連データの提供が含まれます。詳しくはこちらをご覧ください

旅行とホスピタリティ

Yuvoh Analytics

Yuvoh Analyticsは、貸主、資産運用会社、その他の金融サービス企業向けに評価サービスを販売しています。その機械学習モデルでは、未加工状態のデータが大量に消費されます。例えば同社のデータウェアハウスには、2018年まで遡ったすべてのAirbnb物件の日次スナップショットが含まれています。1日に500万件以上の物件がスキャンされており、すべての物件の空室カレンダーは6か月間記録されます。また、毎日約10億もの数字とデータが収集されています。詳しくはこちらをご覧ください

—–

​​将来の見通しに関する記述について

この投稿には、次の項目に関する記述も含め、明示的および暗示的な将来の見通しに関する記述が含まれています。(i)Snowflakeの事業戦略、(ii)開発中または一般に公開されていないものを含むSnowflakeの製品、サービス、技術提供、(iii)市場の成長、動向、競争に関する考慮事項、(iv)Snowflakeの製品とサードパーティプラットフォームとの統合、相互運用性および利用可能性。これらの将来の見通しに関する記述は、さまざまなリスク、不確実性、前提に左右されます。これには、Snowflakeが証券取引委員会に提出したForm 10-Q(四半期レポート)およびForm 10-Kのアニュアルレポート内の「リスク要因」などのセグメントに記載されているリスク、不確実性、前提が含まれます。これらのリスク、不確実性、前提を考慮すると、将来の見通しに関する記述において予想または暗示されている結果と比較して、実際には大きく異なる結果や反対の結果に至る可能性があります。そのため、将来の見通しに関するいかなる記述も、未来の出来事についての予測として利用してはなりません。

© 2022 Snowflake Inc.  All rights reserved.  Snowflake、Snowflakeのロゴ、および本書に記載されているその他すべてのSnowflakeの製品、機能、サービス名は、米国およびその他の国におけるSnowflake Inc.の登録商標または商標です。本書で記載または使用されているその他すべてのブランド名またはロゴは、識別目的でのみ使用されているものであり、それぞれの所有者の商標である可能性があります。Snowflakeは、これらいずれの所有者とも関連づけられることはなく、また、これらの所有者による後援や支持を受けているものでもありません。