참고: 이 내용은 2022. 6. 9에 게시된 컨텐츠(Cloud Computing Technologies Are Driving Value-Based Healthcare Collaborations)에서 번역되었습니다.

클라우드 컴퓨팅 기술은 특유의 규모와 유연성 덕분에 의료 보건 산업의 데이터 협업에서 오랫동안 기다려온 기회를 열어줄 잠재력을 지니고 있습니다. 전통적으로 클라우드 이전의 컴퓨팅 환경을 위해 설계된 데이터 플랫폼 아키텍처는 의료 보건 관련 기관의 협업 역량을 제한해 왔습니다. 이러한 플랫폼 중 일부는 목적에 대한 조정을 거쳐 클라우드 서비스로 이용할 수 있도록 만들어졌으나, 플랫폼에 담긴 근본적인 아키텍처는 환자에게 더 나은 치료 결과를 이끌어 내는 데 사용할 수 있는 모든 데이터에 대한 액세스를 지속해서 제한하고 있습니다.

클라우드를 우선시하는 데이터 플랫폼은 의료 보건 기관에게 데이터 수집과 분석 및 공유라는 장애물을 넘어서고, 증거 기반의 협업에 유의미한 돌파구를 이끌어 내는 데 도움이 될 수 있습니다. 그 방법은 다음과 같습니다.

데이터 수집

The Pew Charitable Trusts의 최신 설문조사에 따르면 미국 성인의 대다수가 환자와 공급업체에 보건 정보 접근을 늘려야 한다는 것에 찬성합니다. 81%에 달하는 사람들이 여러 공급업체에서 공통되는 환자의 보건 정보를 공유할 수 있어야 한다고 응답했습니다. 그렇지만 이는 보통 말처럼 쉽지 않은 일입니다. 환자 데이터는 여러 소스에서 비롯되며 다양한 형식으로 제공됩니다. 업계에서는 복잡하게 구성된 또 다른 층을 더하여 특정한 환자 데이터의 부분 집합에 대해 공통 데이터 모델을 표준화하려는 노력이 생겨났습니다. 그 결과로 모든 환자 데이터를 하나의 증거 소스로 수집하는 작업은 거의 불가능해졌으며, 이는 확신을 갖고 환자의 결과를 이끌어낸 변수의 분리를 맡은 조직 내 및 조직 간의 하부 협업에 영향을 주었습니다. 

예:

  • OMOP(Observed Medical Outcomes Partnership) 양식은 보상 청구와 전자 의료 기록(EMRs)에 대한 표준을 제공합니다. 
  • 미국 식품의약국(FDA)와 같은 규제 기관은 SDTM(Study Data Tabulation Model)을 따르기 위해 임상 연구 데이터를 필요로 합니다. 
  • 진단 장비에서 얻은 비정형 데이터는 DICOM(디지털 의료 영상 전송 장치) 양식이나 CT, MRI 스캔과 같은 다양한 표준을 따릅니다. 
  • 의료사물인터넷(IoMT)은 게놈 시퀀서에서 활동 추적기기에 이르기까지 JSON, XML 및 VCF와 같은 기존의 관계형 데이터베이스에 ‘적합’하지 않은 반정형화된 여러 가지 형식으로 데이터를 생성합니다. 

클라우드를 기반으로 한 여러 데이터 플랫폼은 클라우드 스토리지의 유연성과 확장성을 이용해 전체 정형, 반정형 및 비정형 환자 데이터를 한 가지 중앙 저장소로 통합하고 단순한 단일 인터페이스를 통해 이러한 데이터를 모두 이용할 수 있도록 함으로써 데이터 수집 문제를 해결해 줍니다. 클라우드 객체 저장소는 고도로 정형화된 CSV에서 반정형화된 VCF 데이터 및 비정형 DICOM 파일 등의 모든 데이터를 한곳에 보관하며, 이러한 작업은 저렴한 비용과 언제나 무한정에 가까운 규모로 진행할 수 있습니다. 그 이후로 마주하는 문제는 다양한 환자 정보에 액세스하는 것으로, 이는 데이터를 증거로 바꾸는 데 필수적인 분석적 인사이트를 얻기 위해서입니다. 

데이터 분석

환자 데이터의 출처와 구조가 다양해져 가므로 서로 전혀 다른 정보를 저장소 한 군데로 통합하는 작업만으로는 충분하지 않습니다. 다양한 요인이 결과를 이끌어내게 되는 결정적인 인사이트는 사용 가능한 모든 데이터에 대한 포괄적인 분석에 달려 있습니다. 기존 관계형 데이터베이스의 도전 과제는 분석에 앞서 대규모의 관련 환자 데이터를 변환해야 하는 경우가 흔히 있다는 점입니다. 이로 인해 복잡성과 액세스에 대한 장벽이 만들어집니다. 또한 고정 용량의 클라우드 이전 환경을 위해 설계된 여러 데이터베이스에서 전형적으로 나타나는 현상인 저장과 처리 능력의 밀착 결합으로 인해 데이터의 신규 탐색 또는 동시 탐색으로 인한 수요 변화를 수용하기 위해 인프라를 추가로 공급해야 하는 경우가 많습니다. 다시 말하자면 이러한 이유로 운영상의 복잡함과 비용이 발생하며 데이터 액세스에 대한 장벽이 만들어집니다.  

클라우드 스토리지와 컴퓨팅 리소스를 최대한 이용할 수 있도록 만들어진 여러 데이터 플랫폼이 이러한 기술적 한계를 다루고 있습니다. 원격 의료 앱에서 연결된 의료 기기 데이터에 이르기까지 이제는 풍부한 반정형화 환자 정보에 즉시 액세스할 수 있으며, 기존의 처방전과 청구 데이터와 같은 정형화된 정보와 더불어 이러한 정보를 사전 처리와 변환 단계를 거치지 않고도 SQL을 이용해 대규모로 분석할 수 있습니다. 계산 리소스에서 스토리지를 완전히 분리하는 논리 작업을 거치면 이러한 리소스를 즉시 독립적으로 확장할 수 있어 데이터 액세스에 있었던 기존의 장벽과 복잡함을 없앨 수 있습니다. 이러한 작업은 특히 실행 시에 상대적으로 많은 양의 처리 능력과 더불어 역사상으로 세심한 관리와 고가 전용 하드웨어가 필요했던 머신 러닝 및 AI 최첨단 기술과 연관되어 있습니다.

데이터 공유

가치 기반 협업의 핵심은 안전하고 통제된 방식으로 이루어지는 환자 정보의 교환 및 공동 액세스에 있습니다. 그러나 기존의 데이터 플랫폼은 공유되는 데이터의 양과 그 빈도 및 활용성을 크게 제한하고 있습니다. API와 파일 전송 또는 이메일에 첨부된 스프레드시트를 통한 데이터 교환에 사용되는 메커니즘은 물리적으로 데이터 복사와 이동을 진행하는 레거시 프로세스에 주로 의존합니다. 복사와 이동이 이루어지며 데이터가 옮겨지고 이로 인해 지연이 발생하여 신체 활동 추적기기와 같은 연결 장치에서 환자 고주파 데이터의 가치가 약화됩니다. 다른 위치에 동일한 데이터의 여러 복사본을 만들면 버저닝과 참조 가능한 “골든 레코드”를 유지하는 작업과 관련해 복잡성이 발생하며, 이는 다른 당사자가 별도의 복사본을 다루기 때문입니다. 그리고 환자 개인 정보의 보호 및 데이터 거버넌스라는 관점에서 민감한 개인 정보에 대한 물리적 복사, 이동, 개인 정보 제거 및 보호가 필요하다는 점은 데이터 공유를 저해하는 분명한 요인이었습니다.  

클라우드를 우선하는 데이터 플랫폼 아키텍처는 클라우드 컴퓨팅 리소스의 규모와 유연성에 대한 접근을 유지하면서 물리적인 데이터 복사 및 이동 시에 필수적인 요건을 없애 정보 교환에 대해 근본적으로 다른 방식으로 접근할 수 있도록 해 줍니다. 예를 들어, 코로나19 연구 데이터베이스는 공중 보건 및 정책 연구원이 무료로 이용할 수 있는 익명으로 구성된 안전한 환자 데이터 세트를 제공하며, 이는 청구 및 전자 건강 기록(EHR)에서 실험실 및 인구 통계 데이터에 이르기까지 30곳이 넘는 미국 소재 의료 보건 및 기술 회사에서 제공하는 데이터를 이용해 만들어졌으며 데이터를 제공하는 의료 및 기술 회사가 HIPAA 규정을 계속 준수할 수 있도록 구성되었습니다. 처방, 진단, 환자 이력, 청구 및 보상 데이터 등의 기존 자산을 다양한 범주의 대체 자산과 함께 이용하기 위해 의료 증거 정보를 교환하는 행위가 다양하게 나타나고 있습니다. 협업에 참여하는 사람들은 교환 작업에 초대를 받아 특정 자산에 대한 보안과 세분화, 읽기 전용 또는 읽기/쓰기 액세스에 대한 권한을 요청하고 이를 부여할 수 있습니다.

의료 보건 기관이 가치에 기반한 의료 보건 행위로 환자에게 더욱 나은 결과를 가져다주는 데 성공하기 위해서는 방해받지 않고 다양한 소스에서 데이터로 협업하며 인사이트를 얻을 수 있어야 합니다. 업계를 선도하는 의료 보건 기관은 Snowflake의 의료 보건 및 생명 공학 데이터 클라우드(Healthcare and Life Sciences Data Cloud)가 지닌 현대적인 데이터 역량을 이용해 가치를 기반으로 한 의료 보건 협업을 이끌고 있습니다. 더 자세히 알아보려면 당사의 백서 실제 증거를 위한 의료 및 생명 과학 데이터 클라우드를 읽어보세요.

실제 증거를 위한 의료 및 생명 과학 데이터 클라우드: 환자 결과 달성을 위한 급진적인 협업 접근 방식 구현