
"성능상의 이유로 Snowpark로 전환하고 싶었는데 정말 쉽게 전환할 수 있었어요. PySpark 코드를 Snowpark로 변환하는 것은 import 구문을 변경하는 것만큼이나 간단했습니다."
수석 데이터 엔지니어
Homegenius
Python 및 기타 프로그래밍 언어를 Snowflake의 데이터와 병렬로 실행하는 라이브러리 및 코드 실행 환경 세트입니다.
Python 및 기타 프로그래밍 코드를 Snowflake의 관리형 데이터에 적용합니다.
유지 관리나 오버헤드가 필요 없는 탄력적인 확장성을 제공합니다.
일관성 있는 엔터프라이즈급 거버넌스 제어 및 보안을 제공합니다.
Spark 또는 확장 가능한 Pandas(PuPr)를 모델로 한 DataFrame을 사용하여 쿼리를 작성하고 데이터를 변환하세요.
이 Python 라이브러리를 사용하여 Snowflake ML의 전체 ML 수명 주기에 걸쳐 모델 및 피처 개발과 운영에 필요한 통합 API에 액세스할 수 있습니다.
사용자 정의 함수(UDF)나 Stored Procedure를 사용해 사용자 지정 Python, Java, Scala 코드를 작성하고 실행합니다. Anaconda 리포지토리의 내장형 패키지를 활용할 수 있습니다.
Snowflake 관리형 인프라에서 컨테이너 이미지를 등록, 배포 및 실행(PuPr)하세요.
Python을 사용하여 원시 데이터를 데이터 파이프라인을 위한 모델링된 형식으로 변환하세요.
Snowpark를 사용하는 고객은 관리형 Spark 대비 평균 4.6배 향상된 성능과 35%의 비용 절감 효과를 보고 있습니다.1
Snowflake에서 데이터 레이크, 웨어하우스, Iceberg Table과 연결된 데이터를 변환할 수 있습니다.
Snowpark ML을 사용한 엔드투엔드 ML 워크플로우 구축 및 운영
Scikit-learn 및 XGBoost와 같은 Python 프레임워크를 사용하여 데이터 이동 없이 Snowflake ML에서 배포 및 관리할 수 있는 모델을 전처리, 피처 엔지니어링, 훈련할 수 있습니다.
ML 모델과 생성형 AI LLM을 원하는 프로그래밍 언어로 구축하고, 컨테이너 이미지로 패키지화하고, 구성 가능한 CPU 및 GPU에 배포하여 개발자의 유연성을 극대화할 수 있습니다.
*2024년 4월 기준




















"피처 엔지니어링과 같은 데이터 사이언스 작업을 데이터가 있는 곳에서 직접 수행할 수 있다는 것은 엄청난 이점입니다. 덕분에 업무 효율성이 더 높아졌고 일도 즐거워졌습니다."
데이터 사이언스 책임자
EDF
12022년 11월부터 2024년 1월까지 Snowpark와 관리형 Spark 서비스의 속도 및 비용을 비교한 고객 프로덕션 사용 사례 및 개념 증명 실습 기준. 모든 조사 결과는 실제 데이터를 기반으로 한 실제 고객의 결과를 요약한 것이며, 벤치마크를 위해 가공된 데이터 세트를 반영하지 않습니다.