BUILD: The Dev Conference for AI & Apps (Nov. 12-14)

Hear the latest product announcements and push the limits of what can be done in the AI Data Cloud.

Produto e tecnologia

Descubra a nova tendência de IA generativa com capacidade de processamento baseada em GPU do Snowpark Container Services

Descubra a nova tendência de IA generativa com capacidade de processamento baseada em GPU do Snowpark Container Services

O surgimento da inteligência artificial (IA) generativa está inspirando as organizações a imaginar um futuro onde a IA encontra-se integrada a todos os aspectos de suas operações com o objetivo de proporcionar ao cliente uma experiência mais humana, personalizada e eficiente. No entanto, a implementação da infraestrutura de capacidade de processamento necessária, especialmente unidades de processamento gráfico (GPUs) para grandes modelos de linguagem (large language models, LLMs), é um verdadeiro desafio. O acesso aos recursos necessários dos provedores de nuvem exige um planejamento cuidadoso e uma espera de até um mês devido à alta demanda por GPUs. Além do mais, após a obtenção das GPUs, a operação da infraestrutura requer conhecimentos especializados e aumenta os custos indiretos, o que pode limitar as inovações. 

Para ajudar as organizações a transformar essa visão complexa em realidade, uma visão baseada no acesso fácil a uma infraestrutura de GPU sem sobrecarga operacional adicional, a Snowflake oferece aos clientes acesso aos LLMs líderes do setor por meio de funções sem servidor no Snowflake Cortex (em versão preliminar privada). E agora temos o prazer de anunciar a versão preliminar pública do Snowpark Container Services, que oferece aos desenvolvedores uma capacidade de processamento elástica e sob demanda com GPUs para todos os tipos de desenvolvimento de aplicativos LLM personalizados e casos de uso avançados. 

Com a versão preliminar pública desse novo runtime do Snowpark, que ajuda os desenvolvedores a registrar e implementar imagens de contêineres sem esforço em sua conta Snowflake, os clientes com problemas de capacidade obtêm acesso rápido à infraestrutura de GPU. Não há necessidade de adquirir instâncias por conta própria ou fazer reservas com o provedor de nuvem pública.

No escopo da IA generativa, esse novo runtime do Snowpark permite que os desenvolvedores implementem contêineres de forma eficiente e segura para realizar tarefas como as seguintes, entre outras mais:

Por que a Snowflake criou um serviço de contêiner?

Para expandir os recursos do mecanismo do Snowflake para além das cargas de trabalho baseadas em SQL, a Snowflake lançou o Snowpark, que adicionou suporte para Python, Java e Scala dentro da capacidade de processamento de armazenamento virtual. Além disso, a Snowflake criou o Snowpark Container Services, para ampliar a flexibilidade a praticamente qualquer linguagem, estrutura ou biblioteca, bem como para o hardware de sua escolha, incluindo GPUs. 

Como a Snowflake continua a trazer a capacidade de processamento para os dados, os desenvolvedores se beneficiam da possibilidade de eliminar desenvolvimento e gerenciamento adicionais de pipeline, bem como da redução dos tempos de espera relacionados à movimentação de grandes volumes de dados para plataformas separadas. Como o Snowpark Container Services foi desenvolvido com o processamento intensivo de dados em mente, os desenvolvedores conseguem carregar e processar sem dificuldade milhões de linhas de dados.   

Esse é o caso da equipe de engenharia da Sailpoint, cujo modelo de segurança de identidade passou de um pipeline de orquestração complexo para uma única tarefa de execução. Leia mais sobre a experiência da Sailpoint com o Snowpark Container Services nesta série de duas partes do blog (parte 1, parte 2).

Por que o Snowpark Container Services é único?

Governança integrada: o Snowpark Container Services funciona dentro da mesma estrutura de governança de dados do Snowflake Horizon. Ao ter a mesma governança sobre os dados e capacidade de processamento, os desenvolvedores podem garantir com mais facilidade que eles estejam protegidos para simplificar as análises de segurança de novos desenvolvimentos. 

Experiência unificada de serviços: o Snowpark Container Services reduz a carga operacional envolvida na implementação de contêineres porque vem com registro de imagem integrado, infraestrutura de capacidade de processamento elástica e um cluster gerenciado baseado em Kubernetes, além de outros serviços necessários para executar contêineres na produção (ver a Figura 1). 

Determinação de preços simplificada: a experiência de serviços integrados também faz com que a determinação de preços seja mais simples. O Snowpark Container Services cobra apenas pela capacidade de processamento e pelo armazenamento, o que significa que não há cobrança separada para o registro, o gateway, os logs e tudo o mais que for necessário para as implementações da produção. 

O melhor de tudo é que são necessários apenas dois elementos para passar de uma imagem de contêiner no seu ambiente de desenvolvimento para um serviço dimensionável na nuvem: a imagem do contêiner e um arquivo YAML de especificação. 

Que melhorias técnicas foram feitas durante a versão preliminar privada?

  • Melhorias de segurança e governança: aprimoramos o controle sobre as questões de segurança, incluindo saída, entrada e rede. Inscreva-se aqui para saber mais sobre o assunto em nossa próxima palestra técnica sobre segurança.
  • Aumento das opções de armazenamento: adicionamos soluções de armazenamento mais diversificadas, incluindo volumes locais, memória e estágios do Snowflake. Também estamos expandindo para incluir o armazenamento em blocos (atualmente em versão preliminar privada).
  • Tipos de instância mais diversificados: adicionamos instâncias de alta memória e alocação dinâmica de GPU para cargas de trabalho intensivas.

Pronto para começar?

Nossa equipe está trabalhando rapidamente para disponibilizar o Snowpark Container Services em todas as regiões de AWS, com suporte para outras nuvens na sequência. 

Aqui estão alguns recursos para ajudar você a dar os primeiros passos:

  • Implemente seu primeiro contêiner no Snowflake (observação: o Snowpark Container Services não está disponível para contas de avaliação gratuita). Quickstart
  • Receba notificações quando novas regiões estiverem disponíveis. Github
  • Saiba mais sobre Snowpark Container Services. Documentação
  • Veja como o Snowpark ML e o Snowpark Container Services simplificam a implementação de LLMs. Demonstração
  • Participe de uma palestra técnica sobre o futuro dos aplicativos corporativos de IA com o VP of Product da Landing AI. Inscreva-se

Estamos ansiosos para ver tudo o que você está criando no Data Cloud com esse novo runtime que permite flexibilidade de desenvolvimento quase ilimitada. 

Authors
Share Article

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Comece seus 30 diasde avaliação gratuita

Teste o Snowflake sem custo por 30 dias e conheça o Data Cloud, que ajuda a eliminar a complexidade, o custo e as restrições de outras soluções.