Data Engineering

Conectando Oracle e Snowflake AI: o Snowflake Openflow Connector for Oracle agora está disponível ao público

Bancos de dados Oracle são a base de algumas das principais operações empresariais do mundo, desde cadeias de fornecedores globais até serviços de saúde e transações financeiras em tempo real. Com o Cortex Code e o Openflow, os dados Oracle agora são conectados aos outros dos dados da sua empresa no Snowflake, permitindo a você criar agentes de IA com contexto completo em minutos.

Tradicionalmente, as equipes de dados só conseguiam acessar os dados transacionais Oracle por meio de ETL em lote ou plataformas complexas de CDC, resultando em insights atrasados para os dashboards operacionais. As arquiteturas CDC multicamadas aumentaram a complexidade, os custos e o risco operacional. A demanda dos clientes é por reduzir a sobrecarga de tecnologia, evitar plataformas caras e, ao mesmo tempo, aproveitar os dados quase em tempo real e o movimento de baixa latência.

A Snowflake reconheceu essa necessidade e, por isso, com satisfação anunciamos o lançamento geral ao público do Snowflake Openflow Connector for Oracle, desenvolvido em colaboração com a Oracle. Ele é uma integração totalmente gerenciada, nativa e sem agente que transmite dados diretamente da sua instância Oracle para o Snowflake, sem exigir que os clientes gerenciem infraestruturas adicionais de replicação de terceiros. O Snowflake Openflow Connector for Oracle já está disponível em todas as regiões comerciais da AWS com implementações Bring Your Own Cloud (BYOC) e em regiões comerciais da AWS e Azure com implementações do Snowflake.

Testado em produção: sucesso de clientes

Não criamos esse conector apenas para ser compatível com Oracle. Nosso objetivo ao desenvolvê-lo foi oferecer suporte às necessidades de ajuste de escala de grandes ambientes empresariais. Durante a fase de pré-visualização, os clientes testaram os limites da arquitetura, e os resultados falam por si.

Yes Energy oferece análises de dados praticamente em tempo real capazes de acelerar as decisões do mercado de energia

Para a Yes Energy, empresa líder em dados do mercado de energia, "rápido" não era rápido o suficiente. Para alimentar sua análise de dados, a empresa precisava migrar imensos conjuntos de dados históricos para o Snowflake. Usando os snapshots paralelizados do Openflow Connector, a Yes Energy conseguiu uma grande redução nos tempos de carregamento.

Quote Icon

A otimização que vimos com essa nova integração tem sido revolucionária para o nosso pipeline. A performance inicial de carregamento instantâneo obtida com o conector é uma imensa melhoria para o fluxo de trabalho do nosso produto principal. Uma tabela que antes levava mais de 10 dias para carregar agora carrega por completo em apenas 5 horas e 40 minutos, e vimos a carga de uma tabela de 130 milhões de linhas cair de 14 horas para apenas 1 hora."

Dan Goodman
Staff Engineer, Yes Energy

Alta performance, baixo impacto

O medo de qualquer DBA é de que uma ferramenta de replicação afete a performance do banco de dados de origem. Desenvolvemos o Openflow Connector para ser o "bom cidadão" na sua rede, minimizando o impacto sobre recursos de rede e do sistema.

  • Latência próxima ao tempo real: as alterações são capturadas pelo Oracle via XStream quase em tempo real e transmitidas para o Snowflake continuamente. Os dados chegam na tabela de diário do Snowflake em segundos após serem enviados na origem. Aliado a ciclos de fusão a cada minuto, o conector alcançou latência de ponta a ponta de P90 em menos de 2 minutos. Em testes de estresse interno, manteve-se estável em 600 tabelas em 15.000 mudanças por segundo durante 18 horas consecutivas.1
  • Mínimo impacto da fonte: o conector usa a API Oracle nativa XStream para capturar alterações diretamente do log redo, uma abordagem baseada em log que evita consultar tabelas de origem. Em testes internos do HammerDB TPC-C no Oracle 19c sob cargas de trabalho OLTP de alta taxa de transferência sustentáveis, permitindo a captura de alterações acrescentou sobrecarga de CPU insignificante e impacto de menos de um milissegundo à latência de envio da transação.

Parceria confiável com a Oracle

Conectar sistemas de missão crítica requer confiança e confiabilidade. O Snowflake Openflow Connector for Oracle é o resultado da estreita colaboração entre a Snowflake e a Oracle, cultivada desde o início para cargas de trabalho corporativas. Uma parceria que possibilita os seguintes benefícios:

  • Processo Oracle nativo de captura de dados modificados (CDC): o conector incorpora de forma nativa a própria tecnologia Oracle de captura de dados modificados, licenciada diretamente da Oracle para OEM, de modo a ler registros de mudanças lógicas (LCRs) do servidor de saída do XStream, praticamente em tempo real. Isso utiliza a tecnologia Oracle de captura de dados modificados baseada em XStream, que também é usada nos produtos de replicação da Oracle.
  • Modelo de suporte simplificado: os clientes trabalham com a Snowflake como ponto de contato único, enquanto um parceiro Oracle oferece suporte direto aos componentes Oracle quando necessário. Isso reduz as trocas e possibilita uma resolução coordenada de problemas.
  • Suporte de duas empresas líderes de mercado: para a Snowflake, o conector disponibiliza uma importante fonte de dados corporativos para o Snowflake AI Data Cloud. Na Oracle, isso amplia o alcance do Oracle Database para os ecossistemas modernos de nuvem e IA.
  • Confiança das empresas em IA: os clientes têm acesso a uma arquitetura de última geração capaz de trazer dados transacionais confiáveis do Oracle para o Snowflake quase em tempo real, apoiados por dois fornecedores empenhados em trabalhar em parceria para o sucesso de longo prazo.

Juntos, Snowflake e Oracle ajudam os clientes a passar de sistemas transacionais isolados em silos para dados prontos para IA, sem comprometer a performance ou a confiabilidade da fonte.

Por que o contexto “nativo” é importante

Como o conector funciona com a estrutura do Snowflake Openflow, ele se beneficia dos mesmos controles de governança e processamento elástico que se espera do AI Data Cloud:

  • Arquitetura sem agentes: não há software para instalar em seus servidores Oracle. É possível configurar a conectividade usando opções de rede privada, como AWS PrivateLink ou Azure Private Link.
  • Escalabilidade: de modo automático, o conector amplia a escala dos recursos para lidar com picos na geração de logs, ajudando sua organização a acompanhar o ritmo durante as horas de pico de negociação ou eventos sazonais.
  • Operações simplificadas: use o Cortex Code para configurar o seu Openflow Connector for Oracle em segundos. Gerencie a replicação diretamente do plano de controle do Snowflake Openflow e monitore usando o Snowflake SQL nativo, alertas ou um dashboard Streamlit.

Para entender a filosofia de engenharia por trás dessa arquitetura e como ela se diferencia fundamentalmente do middleware já existente, leia o anúncio de versão preliminar privada que criamos em conjunto com a Oracle.

Da conectividade aos agentes de IA, em uma única conversa

Historicamente, configurar o Oracle CDC tem sido um projeto de vários dias que requer conhecimento especializado de DBA, como configuração de servidores de saída do XStream, dimensionamento de logs redo, configuração de logs suplementares e solução de erros criptográficos ORA. Com o Cortex Code, o agente de codificação impulsionado por IA da Snowflake, essa dificuldade acaba por meio de um fluxo de trabalho guiado e conversacional.

O Cortex Code oferece serviços com conhecimento do conector Oracle desenvolvido especificamente, que entende sua arquitetura. Ela orienta você através dos pré-requisitos de XStream passo a passo, gerando o SQL exato de que sua DBA precisa, verificando a configuração, implementando o conector, validando o fluxo de dados e resolvendo problemas se eles surgirem. O que antes exigia um manual de instruções completo e um ticket de suporte agora acontece em uma única sessão de terminal.

Mas o melhor é o que acontece depois que os dados chegam. Como o Cortex Code entende tanto a camada de conectividade quanto o stack de IA do Snowflake, a mesma conversa que configura seu pipeline Oracle pode criar imediatamente um serviço do Cortex Analyst com base nos dados replicados, criar um agente do Snowflake Intelligence que processe todas as informações ou conectar um app Streamlit para o monitoramento em tempo real.

Veja o que acontece na prática:

$ cortex

> I need to replicate our Oracle 19c orders database to Snowflake

  I'll help you set up the Openflow Oracle CDC connector. First, a few
  questions about your environment:

  1. Is this Oracle on-prem, OCI, or AWS RDS?
  2. Do you have an existing Oracle license, or do you need the embedded
     license from Snowflake?

> It's on RDS and we have an independent license. Oracle credentials
  are in our external vault at vault/oracle-prod, Snowflake credentials
  in ~/.snowflake/connections.toml with key at ~/.ssh/sf_rsa_key.p8.
  Use ORACLE_REPLICA database and REPLICATION_WH warehouse.

  Got it — AWS RDS Oracle 19c with BYOL licensing. I've loaded your
  Oracle credentials from the vault and Snowflake connection config.

  Here's the SQL your DBA should run to prepare the Oracle source.
  I'll generate each step:

  -- Step 1: Configure archived redo log retention (RDS Standard)
  BEGIN
    rdsadmin.rdsadmin_util.set_configuration(
      name  => 'archivelog retention hours',
      value => '24');
  END;
  /
  COMMIT;

  -- Step 2: Enable XStream replication and supplemental logging
  ALTER SYSTEM SET enable_goldengate_replication=TRUE SCOPE=BOTH;
  ALTER SYSTEM SET STREAMS_POOL_SIZE = 2560M;
  ALTER DATABASE ADD SUPPLEMENTAL LOG DATA (ALL) COLUMNS;

  -- Step 3: Create XStream administrator (CDB architecture)
  CREATE USER c##xstreamadmin IDENTIFIED BY "****"
    DEFAULT TABLESPACE xstream_adm_tbs
    QUOTA UNLIMITED ON xstream_adm_tbs
    CONTAINER=ALL;

  GRANT CREATE SESSION, SET CONTAINER, EXECUTE ANY PROCEDURE,
    LOGMINING TO c##xstreamadmin CONTAINER=ALL;

  BEGIN DBMS_XSTREAM_AUTH.GRANT_ADMIN_PRIVILEGE(
    grantee => 'c##xstreamadmin',
    privilege_type => 'CAPTURE',
    grant_select_privileges => TRUE,
    container => 'ALL'); END;
  /
  ...

  Shall I generate the connect user, outbound server, and remaining
  steps for your ORDERS schema?

> Yes, tables ORDERS, ORDER_ITEMS, and CUSTOMERS

  Here's your outbound server setup:

  BEGIN
    DBMS_XSTREAM_ADM.CREATE_OUTBOUND(
      server_name  => 'XOUT_ORDERS',
      table_names  => 'ORCL.ECOMMERCE.ORDERS,
                       ORCL.ECOMMERCE.ORDER_ITEMS,
                       ORCL.ECOMMERCE.CUSTOMERS',
      schema_names => NULL);
  END;
  /

  After your DBA runs this, I'll deploy the connector and verify the
  XStream link. Ready?

> DBA ran it. Let's deploy.

  Deploying oracle-independent-license flow... ✓
  Configuring source parameters... ✓
  Verifying XStream connectivity... ✓
    ├─ Capture status: ENABLED
    ├─ LogMiner session: MINING
    └─ XStream state: SENDING CHANGES
  Starting flow... ✓

  Your tables are replicating. ORDERS is in SNAPSHOT_REPLICATION state
  — initial load is in progress. I'll check back when it reaches
  INCREMENTAL_REPLICATION.

  Meanwhile — want me to set up a Cortex Analyst semantic model over
  these tables so your team can query order data in natural language?

Comece hoje mesmo.

Agora, o Snowflake Openflow Connector for Oracle está disponível ao público. Você pode começar a transmitir seus dados de missão crítica diretamente do catálogo do Openflow Connector a partir do Snowsight. Para ajudar você a começar logo:

Vamos conectar com segurança seus dados do Oracle para IA.

 


1 Benchmark interno realizado pela Snowflake em novembro de 2025 no Oracle 19c com servidor de saída XStream. Carga de trabalho: 15.000 mudanças por segundo em 600 tabelas sustentadas durante 18 horas. Latência de ponta a ponta medida a partir do envio de origem para a disponibilidade de dados nas tabelas-alvo do Snowflake. Os resultados são de ambientes de teste controlados e não são garantidos nas implementações em produção. A latência real pode variar de acordo com as características da carga de trabalho, condições de rede, configuração do Oracle e configurações da conta Snowflake.

Subscribe to our blog newsletter

Get the best, coolest and latest delivered to your inbox each week

Onde os dados fazem mais

  • Avaliação gratuita de 30 dias
  • Sem precisar de cartão de crédito
  • Cancele a qualquer hora