注:本記事は(2021年7月27日)に公開された(Modern Data Infrastructure for Freedom to Explore)を翻訳して公開したものです。

モダンデータインフラストラクチャーは、しっかり指導しながら探索の自由を与える、優れた子育てのようなものです。

数週間前ミュンヘンで開催されたDLD Summerにおいて、プリンストン高等研究所の理論物理学者、Robert Dijkgraaf氏は「将来、私たちは世界を研究するだけでなく、デザインするようになるだろう」と予言しました。1 現在の世界から集められた情報は、これらのデザインの燃料となります。人工知能は意思決定を導き、この新しい世界を進む私たちを助けてくれるでしょう。このイベントのテーマである「It’s Only the Beginning…(まだ始まったばかり)」は、これらの予言の実現に向けた道のりを反映しています。

「Doing Better with Data and AI(データとAIを利用して向上する)」と題されたパネルディスカッションでは、人の知性をAIで増強するための新たな最前線と、それを実現するための最新のデータインフラストラクチャーについて取り上げました。2 Cresta社の創設者兼CEOであるZayd Enam氏は、人工知能に関する現在の態度は「怠惰」に基づいていると主張しました。3 AIによって私たちの仕事が自動化され、仕事が奪われるという話がありますが、それは短絡的すぎる考え方です。そのような怠惰な者の見方をよりクリエイティブな視点に変えるべきだと、同氏は主張しています。人間とはクリエイティブなものです。人間は、俊敏性や強靭さでは他の種に劣るかもしれませんが、私たちはそれを補う道具を作ります。槍、車輪、テレグラフ、電話、コンピューター。これらはすべて生産性を高めるための基礎となってきました。電話を手に取って地球の反対側にいる家族、友人、または同僚と話ができることや、自転車や車に乗ってより速く移動できることを疑う人はいないでしょう。スティーブ・ジョブズはかつて「コンピューターは心の自転車のようなものだ」と言いました。4 自転車を使えば移動が速くなります。そこでEnam氏は疑問を投げかけます。なぜAIに対する私たちの視点はこれほどまでにネガティブなのか。他の道具のように、AIは新しい可能性を解き放つ基礎となるべきではないかと。

Cresta社は、カスタマーサービスを初めての使用事例とする専門知識エンジンを開発しました。このモデルは、顧客とのやり取りのトランスクリプトから学習し、将来にもっと良いやり取りができるようインテリジェンスを増強します。このツールにより、カスタマーサービス担当者はどうすれば効果が上がるかを理解でき、何によって良い結果が得られ、何が悪い結果につながるのかを学ぶことができます。Crestaは、チャットボットと対話するというツールではなく、実在の人とのさらに知的な対話を助けるものです。Crestaは人との交流に取って代わるのではなく、その交流をより良いものにしていきます。

ディスカッションは次に、これらの新しいツールを導入する方法にシフトします。AIは可能性の範囲を広げますが、企業は新しいツールをさまざまなコンテキストで実験する必要があります。これらの新しいモデルをトレーニングするには、広範なソースからの大量のデータが必要です。速いペースで実験とイノベーションが行われる世界においてこれらの新しい取り組みをサポートするには、どのようなデータインフラストラクチャーが必要でしょうか。

実験を可能にする最新のデータインフラストラクチャー

これをデプロイするための最新のデータインフラストラクチャーとベストプラクティスは、子育てによく似ていると私は思います。重要なことは、悲惨な結果を招かないようガイドラインの範囲内で自由に探索と学習をさせること、可能性を実現する技術を模索するための安全な環境を与えることです。Snowflakeはそのような陰と陽を、最新のデータインフラストラクチャーに提供します。

Snowflakeデータクラウドは実験とイノベーションを可能にします。そのデータシェアリングとマルチクラスターのアーキテクチャは、高い性能と伸縮性を提供します。それが意味することは何でしょうか。性能という側面で言えば、それは頭をとんとんしながらお腹をさすったりする、つまり同時に複数の動作をできるだけすばやくすることを子どもに教えるようなものでしょうか。いいえ。おそらく、それ以上の意味があるでしょう。たとえば仕事と私生活のバランスをとり楽しみながらすべてをこなすことを学ぶような。これは私が学んだ重要な教訓で、他の人にも伝えたいと思っています。一方、データの世界でこれが意味するのは、大量のクエリや分析ワークロードを実行しながら、データの取り込みや処理も行うことです。しかし同時に、失敗を恐れることなく実験や学習を行って、スキルを向上させることも意味します。たとえば転がり落ちることを恐れないでバイクにまたがるというようなことです。繰り返しになりますが、データやアナリティクスの世界でこれが意味するのは、新しいモデルを迅速にテストし、機能するかどうかを確認することですが、この際、役に立つのが高性能のデータインフラストラクチャーです。

伸縮性の面で言うと、子育てと同様、必要な時にそこにいることが重要です。最近のコロナ禍において、システムの拡大や縮小を必要とする企業を見てきました。Instacartやその他のオンライン生鮮食品サービスは需要が大きく伸びましたが、航空会社や空港は旅行の激減により縮小しました。最新のデータインフラストラクチャーはクラウドベースであるため、この種の柔軟性が備わっています。必要な時には傍にいて、不要になれば立ち去ることができるということです。さらにSnowflakeの従量課金モデルでは、使用しなかった分への支払は不要となります。

データクラウドは、事業部門や部課といった組織内部でも、パートナーや顧客といった外部でも、データシェアリングを促し、データのサイロを解消します。さらにSnowflakeデータマーケットプレイスは、サードパーティのプロバイダーが提供する何百ものデータセットへのアクセスを円滑化します。データセットには、顧客データ、企業特性データ、経済指標、気候、位置情報または健康情報など、複雑で動的なビジネス環境を渡っていく上で役立つ「代替的」データなどがあります。これも子育てに似ていると言えます。これは親戚での集まりや、お泊りや、友人一家との交流といったお楽しみのようなものです。

ガイドラインを提供するデータガバナンス

しかし私たちは皆、ルールがある中で成長します。私たちは管理された世界で生きています。私の家では大きな声を出して構わない場所と静かにしなければならない場所が決まっていました。また何をしてよくて、何がいけないのかを心得ていました。時には「絶対禁止」と明確に言い渡されていたこともありました。しかし大きくなるにつれ、ルールは緩やかになっていきました。小さいころは「街灯が点く時間までには帰ってきなさい」だったのが、ティーンのころは「夜中までには帰ってきなさい」になりました。これらのルールは探索する自由を与えてくれましたが、トラブルに巻き込まれないためにはガイドラインも必要でした。

データクラウドは、管理された環境も提供してくれます。データガバナンスは、私たちがデータで探索、共有、コラボレーションする際にトラブルに遭わないようにするガイドラインを定めます。データガバナンスは単なるセキュリティやプライバシー保護ではありません。もちろんデータを保護することが中心ですが、大きな声を出してよい場所を知った時のようにデータについて知ることややっと車のキーを手にしたときのようにデータを解き放つことも含まれます。

データガバナンスには教育も必要です。組織は人々にデータについて認識させ、それが組織にもたらす価値を理解させ、データをキャプチャするにしろ、保護するにしろ、利用するにしろ、各ロールごとの責任を受け入れさせる必要があります。この種のトレーニング、つまりデータリタラシーは、データドリブンの文化を作り上げるために不可欠であり、従業員の新人研修の要素に組み込むべきです。

AIイノベーションが急速に進む世界において私たちは、この最新のデータインフラストラクチャーの陰と陽の両方を必要としています。私たちはデータとAIの力を理解し始めたばかりであり、さらに詳しく調査していく必要があります。しかし、ニュースを見ても分かるように、世の中にはリスクがつきものであるため、私たちは従うべきガイドラインやルールが必要です。今日のデータガバナンスが明日のAI倫理となります。あるいは夜更かししすぎたあの時のように、すでに明日は来ているのかもしれません。


1 bit.ly/36R0X6O
2 bit.ly/36RAXbc
3 cresta.com/
4 bit.ly/3zgFDng