한의대 생활/└ NGS 와 CDM
3. CDM ( 공통 데이터 모델 정리 )
조재성 원장
2019. 1. 8. 10:47
- 의료 빅데이터의 종류
- 전자의무기록
- 환자질병 등록 정보
- 환자 건강 모니터링 기기 자료
- 유전체 정보
- 보험청구자료
- 의료기관의 정보시스템의 예
- 전자의무기록(Electronic Medical Records : EMR) : 환자의 진료정보 전산화
- 처방전달시스템(Order Communication System : OCS) : 각종 검사 및 약물 처방 정보 처리
- 의료영상시스템(Picture Archiving and Communication System : PACS) : CT나 MRI 등 의료영상
- 검사정보시스템(Laboratory Information Management System: LIMS) : 혈액검사 등 각종 검사정보 처리
- 병원정보시스템
- 운영계 : 실제 진료가 이루어지는 환자 정보들을 축적하는 단계
- 분석계 : 축적된 자료를 활용하여 병원에서 사용자 중심의 의사결졍지원 및 다차원적 분석을 위한 정보 기반을 제공
-> 표준화를 통해 여러 병원과 연결되어 환자 질병의 사전 예방 및 관리 중심으로 진화 중 - 현재의 병원정보시스템은 각 병원마다 다른 구조 -> 자기 병원의 환자 데이터를 기반한 연구만 가능
각 병원의 데이터를 같은 포맷인 공통 데이터 모델(Common Data Model : CDM)로 변경하는 개념이 대두되고 있음.
이러한 표준화된 데이터를 기반으로 최근 다양한 분산연구망(Distributed Research Network : DRN)을 통한 연구가 활발히 진행 중 - DRN(Disributed Research Network)의 종류
- Sentinel Initiatives
- Observational Health Data Sciences and Informatics(OHDSI)
- National Patient Centered Clinical Research Network(PCORnet)
공통 데이터 모델
- 개념 : 병원들의 데이터를 효율적으로 활용하기 위해 정의한 표준화 데이터 구조. 국제 표준용어체계 기반으로 구성되어 각 의료기관의 데이터를 공통 데이터 모델로 바꾸기 위해서는 각 의료기관에서 사용되는 용어들을 표준용어체계로 매핑하는 작업이 필요
- 연구목적에 따른 종류
- CDM의 구성항목은 각 모델의 목적에 따라 다르며, 의료기관이목적에 따라 선택하여 구축
- 약물 감시 : Sentinel CDM
- 미국 FDA는 2008년 Sentinel Initiative(분산 연구망 일종) 를 통해 EMR과 보험청구기록 등 기존 데이터 베이스를 Sentinel CDM으로 변환
- 분산형 정보체계 : FDA질의 전송 -> 각 기관은 정보보호기준에 따라 요약정보를 FDA에 전송하는 안전한 체계
- 구성
- 필수 테이블 : 등록(enrollment) , 인구통계(demographics), 외래 처방(outpatient dispensing), 방문기록(encounter), 진단(diagnosis), 처치/수술(procedure) 등 6 개
- 부가적인 테이블 : 검사 결과(laboratory), 활력징후(vitals), 원내처방(inpatient dispensing), 원내수혈(inpatient transfusion), 사망(death), 그리고 사망원인(cause of death) 등 6개 - 필수테이블은 모든 트너가 공통적으로 구축, 부가적인 테이블은 보험회사를 제외한 일부 의료기관에서만 CDM으로 구축
- Sentinel CDM v7.0.0 구성요소
- 18개의 연구기관(Data partner)이 Sentinel CDM 연구에 참여 중
- 데이터들(records)은 PatID(unique person identifier)라는 고유 식별자로 연결
- 13개 테이블 -> 특징별 8개로 분류 : - 임상 연구 방법론의 적용 및 평가 : OMOP CDM
- OMOP에서는 분산형 연구망(DRN) 구축을 목표로 OMOP CDM을 개발하여 오픈소스 툴을 개발
- 2013년 OHDSI Research Network로 변경하여 데이터 표준화(Data standardization), 의료기기 안전감시(Medical Product Safety Surveillance), 비교 효과 연구(Comparative Effectiveness Research : CER) 등을 다루고 있다.
- OHDSI는 임상 효과 연구를 위한 보건의료 관찰자료(Observational data)의 효과적 활용을 위한 공공-민간 협력기구로서, 관찰 자료 분석 방법론 연구, 관찰 자료 처리용 분석도구 개발, 협력 연구를 위한 오픈소스 연구자원 구축을 목표로 함.
- OMOP CDM v6.0은 총 40개 테이블로 구성, 크게는 7개의 엘리먼트로 구성
- Standardized Vocabularies
- Standardized Metadata
- Standardized Clinical Data Tables
- Standardized Health System Data Tables
- Standardized Health Economics Data Tables
- Standardized derived Elements
- Results Schema
- OMOP CDM의 목적 : 관찰 자료의 표준화된 포맷을 제공, 분석 방법론(알고리즘)을 적용하기 쉬운 구조로 임상연구에 중요한 약물 복용과 그 조건의 기간(Drug era, Condition era)의 정의를 제공
- 환자 중심 임상 연구 네트워크 : PCORnet CDM
- PCORnet은 Patient Centered Outcome Research Institute(PCORI)가 환자 의사결정을 비교한 비교 효과 연구를 효율적으로 수행하기 위해 설입한 분산 연구망으로 4개의 의료기관, 6개의 보험회사가 참여하고 있다.
- 연구의 정확도와 효율성이 높아진 대규모 연구를 수행함으로써 미국의 보건의료 시스템을 지원하는 것이 목표
- 미국 PCORI에 의해 운영
- PCORnet CDM v4.1은 Mini-sentinel CDM을 기반으로 하고 총 17개의 테이블로 구성
- 효율적인 관찰연구, 실험연구를 지원하는 네트워크인 The National Patient-Centered Clinical Research Network(CCRNs)를 구축함으로써 비교효과연구를 수행하기 위한 역량을 증진시키는 것을 목적으로 함
- 신약 개발과 질병의 메커니즘 규명 등과 같은 기존 연구보다는 대규모 임상시험을 시행하기 어려운 문제에 대해 의사결정을 지원하기 위한 관찰 임상연구를 수행하고자 하며, 2014년 아스피린이 심장질환을 예방할 수 있는지 알아보기 위한 빅데이터 연구를 시작
공통 데이터 모델의 활용
대표적인 연구활동으로는 미국 FDA의 능동적인 약물 감시를 위한 Sentinel Initiative, OHDSI Research Network의 분산 네트워크 기반 임상 빅데이터 연구가 있다.
- 미국 FDA의 능동적 약물감시를 위한 Sentinel Initiative
- 미국 FDA가 특정 약물의 안정성 이슈를 협업센터에 문의
- 협업센터는 약물 안정성 이슈를 Sentinel CDM으로 분석 가능한 질의로 변환 후 데이터 파트너에게 전송
- 데이터파트너는 협업센터의 질의문에 따라 CDM으로 변환되어 있는 DB를 분석후 축약하여 요약결과를 다시 협업센터로 전송
- 협업센터는 특정 약물 안정성 이슈의 분석 결과를 FDA에 전송
- OHDSI Research Network의 분산 네트워크 기반 임상 빅데이터 연구
- 분산 네트워크를 활용한 CDM 임상 빅데이터 연구는 상이한 자체 DB를 가진 의료기관들이 정보를 공유하고 연구를 수행하는데 효과적이다.
- 다양한 CDM 중 OMOP CDM은 Setinel CDM보다 연구목적의 복잡한 자료구조를 가지며, 다양한 표준용어체계의 매핑을 통해 구성된다.
- OMOP CDM의 사용을 위해서는 SNOMED-CT, RxNORM, LOINC 등의 의료 국제표준용어를 'OMOP concept_id' 용어체계와 매핑해야하며, 이에 필요한 vocaabulary set을 concept 테이블에 담아 공개하고 있다.
- OHDSI Research Network에서 제공하는 Achilles는 CDM 자료를 테이블별로 시각화해서 보여주며, Atlas는 웹 기반 자료분석 도구로 웹 인터페이스로 코호트 구축, 성향변수맞춤, 생존분석, 상대위험도 계산 등의 통계분석을 쉽게 할 수 있다.
- 콜롬비아대학교에서는 류마티스 관절염에 대해 RWD를 기반으로 무작위 임상 시험 결과를 예측하는 연구 진행 중
- 류마티스 관절염 환자에서 tocafitinib과 adalimumab 및 etanercept의 안정성을 후향적, 관찰적, 비교 코호트 연구를 진행하였다. - 결과적으로 OHDSI의 방향성은 아래 그림과 같다.