참고: 이 내용은 2022. 5. 26에 게시된 컨텐츠(Delivering on Innovation: Snowflake’s Transformative Enhancements Since BUILD Summit)에서 번역되었습니다.

Snowflake는 개발자 프레임워크인 데이터 클라우드와 Snowpark를 계속 개선해 나가며 개발자에게 역량을 부여하고 데이터 애플리케이션을 강화하는 데 초점을 맞추고 있습니다.

매년 개최되는 개발자 콘퍼런스인 Snowflake BUILD 기간 당시와 그 이후 7개월 동안 당사는 Snowpark 및 데이터 클라우드에 진행된 여러 가지 혁신 사항을 발표했습니다. 다음은 6월 13일부터 16일까지 라스베이거스의 Caesar’s Forum에서 열리는 Snowflake Summit 2022를 앞두고 발표한 주요 내용의 일부입니다.

Python용 Snowpark: Snowflake에서는 기본적으로 가장 가파르게 성장하는 프로그래밍 언어 중 하나인 Python을 Snowpark의 일부로 이용하실 수 있습니다. Python용 Snowpark를 사용하면 Snowflake 플랫폼의 보안, 거버넌스 및 탄력적인 성능을 활용하여 확장 가능하며 최적화를 거친 파이프라인과 애플리케이션 및 머신 러닝 워크플로를 구축하는 동시에 선호하는 언어로 데이터 협업 작업을 진행할 수 있습니다. Python용 Snowpark는 현재 비공개 미리보기 중입니다.

기타 Snowpark 업데이트

당사는 또한 BUILD 이후로 Snowpark에서 다음을 포함한 일련의 개선 작업을 진행했습니다. AWS의 Snowpark Scala API 및 Java UDF
GA, Azure 및 GCP의 공개 미리 보기를 통해 클라우드 공급업체 전반의 고객이 Snowpark의 이점을 누릴 수 있습니다.
표 형식의 Java UDF는 GA에서도 이용할 수 있으며, 이는 테이블에서 작동하며 테이블 형식의 결과를 반환합니다. 사용자는 테이블 함수의 도움을 받아 문자열 분할, 파일 구문 분석 및 모델 맞춤 통계와 같은 Snowflake에서 제공해 드리는 사용 사례를 크게 확장할 수 있습니다. Snowpark Java API는 Snowpark에서 지원하는 또 다른 클라이언트 언어이며 현재 공개 미리 보기로 제공되고 있습니다.

파이프라인을 보다 쉽게 구축하고 실행하기 위하여 Snowpark API에 대한 저장 프로시저 지원은 클라이언트 측에서 작성된 코드(현재 Java 및 Scala 지원)가 프로시저 내에서 작동하고 Snowflake 내에서 실행될 수 있도록 만들어 줍니다. 개발자들은 별도의 클라이언트를 관리하지 않아도 Streams 및 Tasks와 같은 Snowflake의 기능을 이용하면 Snowflake 안에서 복잡한 워크플로를 완벽하게 구축하고 실행하며 계획을 준비할 수 있습니다. 이러한 작업으로 복잡성을 낮추고 관련된 시스템의 수를 줄이며 Snowflake에서 모든 작업을 안전하게 관리할 수 있습니다.

오브젝트 태깅: 오브젝트 태깅을 사용하면 데이터 객체를 민감한 PII로 식별하거나 비용 센터에 속하는 것으로 식별하는 태그와 같은 비즈니스 컨텍스트를 적용하여 데이터를 더 쉽게 확인하고 제어할 수 있습니다. 나만의 사용자 정의 태그로 구성된 고유한 라이브러리를 만들고 이를 열과 테이블/뷰, 데이터베이스, 웨어하우스 등과 같은 원하는 개체에 연결할 수 있습니다.

기록 액세스: 기록 액세스 기능은 데이터의 이동과 변경을 더욱 잘 알아볼 수 있도록 만들어 줌으로써 데이터 포인트를 계속 확인하고 오류를 다시 추적할 수 있습니다. 데이터의 출처와 데이터에 있었던 일, 데이터의 기존 위치를 확인하고 앞으로 데이터를 둘 곳을 결정할 수 있습니다.

인터랙티브 사용 사례의 성능: Snowflake는 속도와 처리량이 필수적인 인터렉티브 사용 사례를 지원하기 위한 목적으로 데이터 애플리케이션 및 임베디드 분석을 위한 탄력적인 성능을 보이는 엔진을 개선했습니다. 현재 일반에 공개된 해당 업데이트에서는 동시성과 처리량이 늘었으며 실행이 더욱 빨라졌습니다.

Snowflake 스크립팅: Snowflake 스크립팅은 절차적 논리에 대한 도움을 더해주는 Snowflake SQL의 연장선상에 있습니다. Snowflake 스크립팅을 이용하여 저장 프로시저와 저장 프로시저 외부에 프로시저 코드를 작성하실 수 있습니다.

비정형 데이터에 대한 지원: 비정형 데이터에 제공하는 Snowflake의 지원 사항에는 Snowflake 내에서 비정형 데이터를 저장하고 액세스하며 처리 및 관리, 통제 및 공유하는 기능이 포함되어 있습니다. 원활한 환경을 만끽하며 여러 클라우드 전반에 걸쳐 정형, 반정형 및 비정형 데이터를 관리하며 분석할 수 있습니다.

SQL API: Snowflake SQL API는 REST API로 Snowflake 데이터베이스의 SQL을 통해 데이터 액세스와 데이터 업데이트 시에 이용하고 사용자 설정 앱을 개발하는 데 사용할 수 있습니다. SQL API를 이용하면 표준 쿼리는 물론 대부분의 DDL과 DML 문을 실행할 수 있습니다.

당사는 6월에 열릴 Snowflake Summit 2022에서 혁신의 다음 물결을 알리게 되어 기쁩니다. 새로운 소식을 가장 먼저 확인하시려면 CEO인 Frank Slootman 씨, 공동 창립자이자 제품 부문 사장인 Benoit Dageville 씨, 제품 부문 SVP인 Christian Kleinerman 씨가 발표할 당사의 개막 기조연설에 참여해 보세요.