기하급수적으로 늘어나는 데이터와 데이터를 규모에 맞게 수집, 변환 및 분석해야 할 필요는 Hadoop, Hive 및 Apache Spark와 같은 기존 테크놀로지를 사용하는 조직에 새로운 문제를 제시합니다. 이러한 문제로는 복잡한 인프라, 확장성 문제, 보안, 사일로화된 데이터 등이 있습니다.

조직이 특정 Spark 워크로드를 Snowflake로 마이그레이션하면 Snowflake 플랫폼의 제로에 가까운 유지 관리, 데이터 공유 기능, 내장 거버넌스, Snowpark를 통해 원하는 프로그래밍 언어를 사용할 수 있는 능력과 같은 이점을 누릴 수 있습니다. 데이터 엔지니어와 개발자는 Snowpark를 사용하여 Snowpark에서 지원되는 익숙한 데이터프레임 및 사용자 지정 함수와 함께 Python, Java나 Scala를 사용하여 강력하고 효율적인 파이프라인, 머신 러닝(ML) 워크플로우와 데이터 애플리케이션을 구축할 수 있습니다. 

여러분의 조직도 Spark 워크로드를 Snowflake로 마이그레이션하면 혜택을 누릴 수 있을지 Spark에서 Snowflake로의 마이그레이션 가이드에서 알아보시기 바랍니다.

이 가이드에서 다루는 내용은 다음과 같습니다.

  • 의사 결정 시 고려할 Snowflake 기능(데이터 공유 및 Snowpark 포함)
  • 마이그레이션에 적합한 워크로드를 판단하는 데 도움이 되는 4가지 질문
  • 이러한 워크로드를 Snowflake로 마이그레이션하여 해결할 수 있는 문제
  • 마이그레이션을 시작하기 전에 수집해야 하는 정보에 대한 체크리스트
  • 4단계 마이그레이션 계획