Descubra a nova tendência de IA generativa com capacidade de processamento baseada em GPU do Snowpark Container Services
O surgimento da inteligência artificial (IA) generativa está inspirando as organizações a imaginar um futuro onde a IA encontra-se integrada a todos os aspectos de suas operações com o objetivo de proporcionar ao cliente uma experiência mais humana, personalizada e eficiente. No entanto, a implementação da infraestrutura de capacidade de processamento necessária, especialmente unidades de processamento gráfico (GPUs) para grandes modelos de linguagem (large language models, LLMs), é um verdadeiro desafio. O acesso aos recursos necessários dos provedores de nuvem exige um planejamento cuidadoso e uma espera de até um mês devido à alta demanda por GPUs. Além do mais, após a obtenção das GPUs, a operação da infraestrutura requer conhecimentos especializados e aumenta os custos indiretos, o que pode limitar as inovações.
Para ajudar as organizações a transformar essa visão complexa em realidade, uma visão baseada no acesso fácil a uma infraestrutura de GPU sem sobrecarga operacional adicional, a Snowflake oferece aos clientes acesso aos LLMs líderes do setor por meio de funções sem servidor no Snowflake Cortex (em versão preliminar privada). E agora temos o prazer de anunciar a versão preliminar pública do Snowpark Container Services, que oferece aos desenvolvedores uma capacidade de processamento elástica e sob demanda com GPUs para todos os tipos de desenvolvimento de aplicativos LLM personalizados e casos de uso avançados.
Com a versão preliminar pública desse novo runtime do Snowpark, que ajuda os desenvolvedores a registrar e implementar imagens de contêineres sem esforço em sua conta Snowflake, os clientes com problemas de capacidade obtêm acesso rápido à infraestrutura de GPU. Não há necessidade de adquirir instâncias por conta própria ou fazer reservas com o provedor de nuvem pública.
No escopo da IA generativa, esse novo runtime do Snowpark permite que os desenvolvedores implementem contêineres de forma eficiente e segura para realizar tarefas como as seguintes, entre outras mais:
- Ajuste do LLM
- Implementação de banco de dados vetorial de código aberto
- Processamento de incorporação distribuída
- Transcrição de voz para texto
Por que a Snowflake criou um serviço de contêiner?
Para expandir os recursos do mecanismo do Snowflake para além das cargas de trabalho baseadas em SQL, a Snowflake lançou o Snowpark, que adicionou suporte para Python, Java e Scala dentro da capacidade de processamento de armazenamento virtual. Além disso, a Snowflake criou o Snowpark Container Services, para ampliar a flexibilidade a praticamente qualquer linguagem, estrutura ou biblioteca, bem como para o hardware de sua escolha, incluindo GPUs.
Como a Snowflake continua a trazer a capacidade de processamento para os dados, os desenvolvedores se beneficiam da possibilidade de eliminar desenvolvimento e gerenciamento adicionais de pipeline, bem como da redução dos tempos de espera relacionados à movimentação de grandes volumes de dados para plataformas separadas. Como o Snowpark Container Services foi desenvolvido com o processamento intensivo de dados em mente, os desenvolvedores conseguem carregar e processar sem dificuldade milhões de linhas de dados.
Esse é o caso da equipe de engenharia da Sailpoint, cujo modelo de segurança de identidade passou de um pipeline de orquestração complexo para uma única tarefa de execução. Leia mais sobre a experiência da Sailpoint com o Snowpark Container Services nesta série de duas partes do blog (parte 1, parte 2).
Por que o Snowpark Container Services é único?
Governança integrada: o Snowpark Container Services funciona dentro da mesma estrutura de governança de dados do Snowflake Horizon. Ao ter a mesma governança sobre os dados e capacidade de processamento, os desenvolvedores podem garantir com mais facilidade que eles estejam protegidos para simplificar as análises de segurança de novos desenvolvimentos.
Experiência unificada de serviços: o Snowpark Container Services reduz a carga operacional envolvida na implementação de contêineres porque vem com registro de imagem integrado, infraestrutura de capacidade de processamento elástica e um cluster gerenciado baseado em Kubernetes, além de outros serviços necessários para executar contêineres na produção (ver a Figura 1).
Determinação de preços simplificada: a experiência de serviços integrados também faz com que a determinação de preços seja mais simples. O Snowpark Container Services cobra apenas pela capacidade de processamento e pelo armazenamento, o que significa que não há cobrança separada para o registro, o gateway, os logs e tudo o mais que for necessário para as implementações da produção.
O melhor de tudo é que são necessários apenas dois elementos para passar de uma imagem de contêiner no seu ambiente de desenvolvimento para um serviço dimensionável na nuvem: a imagem do contêiner e um arquivo YAML de especificação.
Que melhorias técnicas foram feitas durante a versão preliminar privada?
- Melhorias de segurança e governança: aprimoramos o controle sobre as questões de segurança, incluindo saída, entrada e rede. Inscreva-se aqui para saber mais sobre o assunto em nossa próxima palestra técnica sobre segurança.
- Aumento das opções de armazenamento: adicionamos soluções de armazenamento mais diversificadas, incluindo volumes locais, memória e estágios do Snowflake. Também estamos expandindo para incluir o armazenamento em blocos (atualmente em versão preliminar privada).
- Tipos de instância mais diversificados: adicionamos instâncias de alta memória e alocação dinâmica de GPU para cargas de trabalho intensivas.
Pronto para começar?
Nossa equipe está trabalhando rapidamente para disponibilizar o Snowpark Container Services em todas as regiões de AWS, com suporte para outras nuvens na sequência.
Aqui estão alguns recursos para ajudar você a dar os primeiros passos:
- Implemente seu primeiro contêiner no Snowflake (observação: o Snowpark Container Services não está disponível para contas de avaliação gratuita). Quickstart
- Receba notificações quando novas regiões estiverem disponíveis. Github
- Saiba mais sobre Snowpark Container Services. Documentação
- Veja como o Snowpark ML e o Snowpark Container Services simplificam a implementação de LLMs. Demonstração
- Participe de uma palestra técnica sobre o futuro dos aplicativos corporativos de IA com o VP of Product da Landing AI. Inscreva-se
Estamos ansiosos para ver tudo o que você está criando no Data Cloud com esse novo runtime que permite flexibilidade de desenvolvimento quase ilimitada.