Produit et technologie

Snowflake Cortex Search : recherche hybride de pointe pour les applications RAG

Snowflake Cortex Search : recherche hybride de pointe pour les applications RAG

Snowflake Cortex Search, un service entièrement géré de recherche de documents et autres données non structurées, est maintenant en public preview. Avec Cortex Search, les entreprises peuvent facilement déployer des applications de génération augmentée de récupération (RAG) avec Snowflake, alimentant ainsi des cas d'usage tels que le service client, la recherche financière et les chatbots de vente. Cortex Search offre une recherche sémantique et lexicale de pointe sur vos données textuelles dans Snowflake grâce à une interface utilisateur intuitive, et il est fourni avec les fonctionnalités robustes de sécurité et de gouvernance qui ont fait la réputation de Snowflake.

Relever le défi de la création d’applications RAG de haute qualité

Depuis le début, la mission de Snowflake est de permettre à ses clients d’extraire davantage de valeur de leurs données. À l’ère de l’IA d’entreprise, cette mission s’étend plus que jamais aux données non structurées, où la RAG est devenue une approche standard de la personnalisation des applications de chat génératif avec des données propriétaires. La RAG permet aux entreprises de créer, entre autres, des applications puissantes de service client, de vente et de R&D qui exploitent avec précision leurs données propriétaires.

Cependant, bien que la récupération soit un composant fondamental de toute pile d’applications d’IA, la création d’un système de RAG de haute qualité et hautes performances reste difficile pour la plupart des entreprises. Considérez les composants à gérer pour réussir le déploiement de la RAG à grande échelle :

  • Infrastructure et opérations : les équipes en charge de la plateforme doivent déployer et gérer de nombreux composants de récupération : modèles d’intégration hébergés, bases de données vectorielles, pipelines d’indexation des données, modèles de reclassement hébergés, outils d’observabilité et plus encore.
  • Réglage de la qualité des recherches : les ingénieurs et les data scientists doivent passer du temps à évaluer des modèles et des configurations de paramètres pour ajuster les composants de récupération et de classement à leurs cas d'usage commerciaux spécifiques.
  • Sécurité et gouvernance : les équipes de sécurité doivent mener des examens approfondis pour s’assurer que chaque composant de la pile traite les données en toute sécurité et respecte les politiques de gouvernance.

Cortex Search déploie la recherche hybride à l'échelle de l'entreprise

Cortex Search est intégré nativement dans Snowflake, conçue pour répondre aux requêtes en 200 à 300 ms sur de gros volumes de texte. Il prend en charge la recherche « floue » : le service prend en charge les requêtes en langage naturel et renvoie les résultats textuels les plus pertinents, ainsi que les métadonnées associées. Il est optimisé pour une faible latence, ce qui en fait un backend idéal pour les applications interactives des utilisateurs finaux. Et lorsqu’il est associé à des LLM de pointe dans Cortex AI, Cortex Search peut être utilisé pour développer des chatbots puissants.

Cortex Search offre des capacités de recherche de classe mondiale alimentées par l’IA à un coût total de possession (TCO) moindre. Cela signifie que vous pouvez consacrer moins de temps à la gestion de l'infrastructure et au réglage de la qualité de la récupération, et plus de temps à la création de superbes applications basées sur l'IA pour les utilisateurs finaux. Il est conçu en gardant à l’esprit les principes suivants :

  • Facilité d’utilisation : une infrastructure entièrement gérée signifie que les responsabilités opérationnelles sont prises en charge par Snowflake. Cortex Search offre une ingestion incrémentielle automatisée avec un service à faible latence.
  • Qualité de recherche de pointe : obtenez d’office des capacités de recherche « floues » de pointe, sans réglage nécessaire.
  • Sécurisé et contrôlé : bénéficiez des mêmes fonctionnalités de sécurité et de gouvernance que le reste de vos données Snowflake.
Quote Icon

Nous avons développé Coda Brain, une plateforme d’IA qui comprend les utilisateurs et leur permet d’exploiter toutes les données structurées et non structurées de leur entreprise. Pour soutenir le système RAG non structuré de Coda Brain, nous avions besoin de résultats de recherche de haute qualité et nous ne voulions pas devoir gérer l’infrastructure de recherche à l’échelle pour chaque locataire. Cortex Search est idéal pour Coda Brain. Nous bénéficions d’une recherche de meilleure qualité qu’avec des produits similaires, avec des frais d’exploitation moindres. »

Shishir Mehrotra
Co-Founder and CEO, Coda

Indexation et service entièrement gérés

Cortex Search permet à tout membre de l’entreprise d’exploiter un moteur de recherche puissant. Le service indexe et intègre automatiquement vos données de manière incrémentielle, ce qui signifie qu’il ne traite que les lignes modifiées de la source de données sous-jacente.

Toute la complexité opérationnelle de la création du service de recherche est résumée dans une seule instruction SQL pour la création du service. Cela supprime la charge de créer et de gérer plusieurs processus d’ingestion, d’intégration et de service, ce qui libère du temps pour se concentrer sur le développement d’applications d’IA de pointe.

Une fois le service créé, il est facile de l'interroger depuis votre application via les API REST ou Python. Cela inclut à la fois les applications hébergées dans Snowflake (e.g., Streamlit in Snowflake) ou les applications hébergées dans un environnement externe.

Qualité de recherche de pointe avec la recherche hybride

Cortex Search offre une qualité de recherche de pointe grâce à une interface conviviale. La colonne vertébrale de Cortex Search est le composant de recherche vectorielle, qui est alimenté par Arctic Embed M, le modèle hautes performances et rentable de Snowflake. En plus d’Arctic Embed, Cortex Search exploite la recherche lexicale et le reclassement dans ce qu’on appelle une approche « hybride » de la récupération et du classement. Ainsi, chaque requête de recherche vers un service Cortex Search utilise :

  • Recherche vectorielle pour la récupération de documents sémantiquement similaires
  • Recherche par mots clés pour récupérer des documents lexicalement similaires
  • Reclassement sémantique pour classer les documents les plus pertinents dans l’ensemble de résultats

Cette technique de récupération d’ensemble prend également en charge le filtrage des métadonnées sur toutes les requêtes, ce qui vous permet de filtrer la recherche à un sous-ensemble de documents pertinents. Par exemple, un agent du service client pourrait filtrer sa requête de recherche floue aux seuls tickets de l’année 2024 provenant de clients de la région EMEA.

La recherche hybride plus performante que la recherche vectorielle ou la recherche par mots clés

Cortex Search combine les avantages de la recherche vectorielle, de la recherche par mots clés et du reclassement sémantique dans une interface de recherche unique. Nos recherches internes montrent que cette approche donne des résultats de recherche de meilleure qualité pour une variété de workloads de recherche orientés RAG qu’une recherche vectorielle ou une recherche par mots clés seule. Cela signifie que vous bénéficiez d’une amélioration de la qualité prête à l’emploi par rapport aux bases de données vectorielles autonomes, qui fournissent généralement uniquement des recherches vectorielles sans recherche lexicale ni reclassement. En fait, sur un ensemble échantillonné de benchmarks publics et propriétaires de type « questions-réponses », nous avons constaté que l’approche hybride de récupération de Cortex Search a augmenté de plus de 12 % par rapport à la seule recherche vectorielle simple et dépasse considérablement la recherche par mots clés simple (voir Figure 3 ci-dessous). 

Cette pile complexe de récupération et de reclassement est entièrement gérée, ce qui vous évite d’avoir à assembler et à ajuster les hyperparamètres pour plusieurs services de récupération et de reclassement. Plus de détails sur les recherches derrière la pile de récupération Cortex Search seront partagés sur notre blog Snowflake Engineering.

Maintenir les normes élevées de sécurité et de gouvernance de Snowflake

Si la facilité d’utilisation et la grande qualité de recherche sont des caractéristiques importantes, nous savons qu’une position solide en matière de sécurité et de gouvernance est absolument stratégique pour toute entreprise développant des applications basées sur l’IA.

Sécurisé : toutes les opérations de Cortex Search, y compris les intégrations vectorielles et le service de requêtes de recherche, s’exécutent entièrement dans le périmètre de Snowflake et les données de chaque client sont isolées de toutes les autres.

Gouvernance : les services Cortex Search sont des objets de niveau schéma dans Snowflake et s’intègrent aux politiques de contrôle d’accès basé sur les rôles (RBAC) existantes dans un compte Snowflake. Cela signifie que vous pouvez accorder l’utilisation d’un service comme vous le feriez pour tout autre objet Snowflake. Pour les contrôles d’accès au niveau des documents ou des blocs, vous pouvez utiliser le filtrage des métadonnées pour vous assurer que le service ne renvoie que les résultats que le client est autorisé à consulter. 

Cas d’usage réels de Cortex Search

Les clients Snowflake développent une gamme d’applications de recherche alimentées par l’IA dans Snowflake, notamment :

  • Assistants de recherche et de productivité : les chatbots, activés avec le contexte des données propriétaires de votre entreprise, contribuent à améliorer l'efficacité de vos équipes, en simplifiant le processus de recherche d'informations pertinentes dans de grands ensembles de documents. Voici quelques exemples :
    • Support client : aider les agents de support à trier rapidement et efficacement les tickets et à trouver la meilleure réponse à la question du client
    • Données financières : permettre aux analystes financiers de récupérer et de comparer rapidement les rapports de revenus de différentes entreprises
    • Ventes : fournir au personnel commercial les études de cas et documents de présentation les plus pertinents pour leurs clients
    • R&D : aider les chercheurs à trouver et synthétiser de la documentation scientifique pertinente pour leurs recherches
  • Recherche basée sur l’IA : réduire le temps nécessaire pour trouver des informations non structurées pertinentes, pour une utilisation plus efficace des actifs les plus précieux. Voici quelques exemples :
    • Recherche de produits : recherche lexicale et sémantique de produits dans un catalogue en ligne en fonction du titre du produit, de ses caractéristiques et des avis
    • Recherche documentaire : recherche de site pour naviguer dans les pages de support technique et de documentation produit

Ce n’est que le début de Cortex Search, et nous avons hâte de voir ce que nos clients vont construire avec cette puissante fonctionnalité de recherche dans Snowflake.

Essayez Cortex Search

À partir d’aujourd’hui, Cortex Search est en public preview dans ces régions Snowflake et sera bientôt déployé dans un ensemble étendu de régions. Consultez les ressources suivantes pour vous lancer :

Guide Snowflake de l'IA générative et des LLM

Partager cet article

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Where Data Does More

  • Essai gratuit de 30 jours
  • Aucune carte bancaire requise
  • Annulation à tout moment