국립암센터, ‘AI와 빅데이터’ 암 진단·치료 등 활용방안 모색
2022-06-15
14회 국제심포지엄 개최…미 NCI 암 연구 데이터 커먼즈(CRDC) 등 소개
△국립암센터 14회 국제심포지엄 전경
[의학신문·일간보사=이승덕 기자]국립암센터가 인공지능(AI)와 빅데이터를 주제로 암 관련 빅데이터 활용을 모색하는 자리를 가졌다.
국립암센터는 15일 국가암예방검진동 8층 국제회의장에서 ‘암에서의 인공지능과 빅데이터: 지식에서 행동으로(AI and Big Data in Cancer: from Knowledge to Action)’을 주제로 제14회 국제심포지엄을 개최했다.
이번 심포지엄은 라는 주제로 국내외 인공지능과 빅데이터 전문가들이 참석한 가운데 진행됐다. 이번 심포지엄에서 전문가들은 인공지능과 빅데이터에 대한 주요 업적과 최신 동향을 공유하고 이를 활용한 새로운 치료 및 연구 전략을 제시해 국제 교류의 장을 펼쳤다.
‘한국의 헬스케어 빅데이터’를 주제로 진행된 첫 번째 세션에서는 최귀선 국립암센터 암빅데이터센터장이 ‘암 빅데이터: 도전과 기회’를 주제로 발표했다.
최귀선 센터장은 양질의 암 빅데이터를 생산, 구축, 제공하는데 주도적인 역할을 해 온 국립암센터 주요 성과를 소개하고, 국가암데이터센터의 비전과 계획을 제시했다.
최 센터장은 "지난해 9월 국가암데이터센터로 지정받은 것을 기점으로 공공과 민간에서 독자적으로 수집·활용하는 데이터를 상호연계하여 새로운 부가가치를 창출하고, 데이터를 기반으로 암 질환을 극복하고자 한다”면서 “올해 국가암데이터센터는 복지부가 주관하는 K-CURE 사업에 참여해 암 임상데이터 활용 네트워크를 구축하고, 암단백유전체연구 등에서 멀티 오믹스 데이터를 임상데이터와 함께 수집, 공개할 계획을 수립 중”이라고 말했다.
두 번쌔 세션에서는 밴더빌트대학교 의료센터 교수인 폴 해리스 박사가 유전체 분석 프로그램인 ‘올 오브 어스(All-of-Us) 연구 프로그램’을 소개했다. 미국 국립보건원(NIH)이 2018년부터 추진 중인 이 프로그램은 미국 전역의 다양한 인종을 포함해 백만 명 이상의 유전체 정보 등 의생명데이터를 질병연구에 활용할 계획으로 마련됐다.
클라우드 기반 디지털 플랫폼을 활용해 수집하는 데이터는 유전정보를 기반으로 건강관련 설문과 진료기록, 신체계측, 웨어러블 디바이스를 활용한 라이프로그 정보, 디지털 헬스 데이터, 생체시료를 포함한다.
프로그램의 책임연구자인 폴 해리스 박사는 “최근 이 프로그램은 10만 개에 달하는 전정 유전체 데이터와 16만 5천개의 유전형 분석자료도 공개했다”라고 설명했다. 또한, 폴 해리스 박사는 프로그램의 연구대상자 모집, 데이터 수집 방법, 데이터 활용 모델 등 올 오브 어스(All-of-Us) 프로그램의 전반적인 내용과 활용방안, 향후 계획 등에 대해 발표했다.
△최귀선 국립암센터 암빅데이터센터장(왼쪽)과 폴 해리스 밴더빌트대학교 의료센터 교수
세 번째 세션에서는 스웨인 첸 아마존 웹 서비스(AWS) 학자(싱가포르 국립대학교 의학부교수)가 ‘아마존 웹 서비스(Amazon Web Services, AWS) 클라우드를 사용한 암 연구의 혁신 가속화’를 주제로 특별강연을 펼쳤다.
스웨인 교수는 “암은 게놈의 질병이라고 일컬어져 왔다. 하지만 현재 암 연구는 다중 오믹스와 다중 모달 분석으로 빠르게 이동되고 있다”며 “후성유전학, 대사체학, 단백질체학, 미생물군집 관점의 통합은 암에 대한 이해, 진단 및 치료의 차세대를 이끌 것이다”라고 말했다.
스웨인 교수는 “이러한 다중의 거대한 데이터셋은 복잡성을 수반하는데 이에 대한 해결책은 인공지능과 머신러닝이다”라며 아마존 웹 서비스에 대해 이어서 소개했다. 스웨인 교수는“AWS는 데이터 통합, 합성 및 추론을 용이하게 할 뿐만 아니라, 인공지능 및 머신러닝을 사용해 다중모드 데이터에서 통찰력을 제공하는 다양한 서비스 및 솔루션 제품군을 보유하고 있다”라며, 암 연구에 있어서도 AWS가 필요함을 강조했다.
이어 에리카 킴 미국 국립암연구소(NCI) 생체의학 정보학 프로그램 전문가가 ‘미국 국립암연구소 연구 데이터 커먼즈(NCI Cancer Research Data Commons)’에 대해 발표했다.
에리카 킴은 기초 또는 임상 암 연구의 가속화를 위해서는 질병의 분자적 기반을 식별하기 위한 다중모드 데이터셋으로의 접근이 필수적임을 강조했다. 미국에서 2016년 수립된 암 정복 계획(Cancer Moonshot)에 따라, 캔서 문샷의 과학적 방향 개발을 위한 권고안 제시를 위해 NCI가 블루 리본 패널(Blue Ribbon Panel)을 구성했다.
에리카 킴은 “캔서 문샷 블루 리본 패널에서도 다양한 데이터 유형을 최대한 활용하기 위해서는 정보학에 대한 투자가 최우선 과제라고 언급했다”라며, “NCI는 암의 원인 규명, 치료법 향상, 예방 도구의 개발 등을 지원하기 위해 연구자들에게 대규모 데이터에 대한 액세스를 지원하는 가상 데이터 에코시스템인 암 연구 데이터 커먼즈(Cancer Research Data Commons, CRDC)를 개발했다”라고 말했다. 또한, CRDC를 통해 연구자가 최신 클라우드 기반 인프라에서 결과를 분석, 공유 및 저장할 수 있게 구축된 ‘NCI 클라우드 리소스’ 등 프로그램 전반에 대해 소개했다.
국립암센터는 NCI와 한미 암 공동연구 활성화 및 협력 연구 진행을 위한 연구자 교류를 우선적으로 진행하기로 했으며, 이를 통해 향후 각국에 축적된 암 데이터의 공동 활용을 통한 다양한 연구가 가능할 것으로 기대된다. 에리카 킴은 “클라우드 리소스를 공동 활용한 암 연구는 데이터 생태계 확장 및 다양한 연구 개발로 이어져 한미 양국의 암 연구에 큰 진전이 있을 것으로 기대된다”라고 덧붙였다.
네 번째 세션에서는 ‘암 연구의 인공지능’을 주제로 발표가 이어졌다. 홍동완 가톨릭대학교 교수는 ‘암 멀티-오믹스 빅데이터를 활용한 인공지능 연구’를 주제로 전 세계와 국제 암 컨소시엄에서 주목하고 있는 암 멀티오믹스 빅데이터에 대해 소개했다.
홍 교수는 약 2만 페타바이트 규모에 이르는 임상 멀티오믹스 데이터에 대해 언급하며 이를 활용한 연구를 위해 연구자들이 유념해야할 데이터 유형, 구조 및 표준화 등에 대해 설명했다.
이어 홍 교수는“멀티 오믹스 데이터와 인공지능을 이용한 진단 또는 치료 후보를 발굴하기 위해서는 질병 유형 및 환자 유형, 생물학적 연구 등의 연구 목적에 따라 멀티오믹스를 분류해야 한다”라며 “AI 모델의 재현성을 높이기 위해 DNA 서열 등의 데이터 사용을 권고한다”라고 말했다.
마지막 세션은 ‘인공지능 기술의 임상적용’을 주제로 진행됐다. 황보율 국립암센터 암빅데이터 인공지능연구과장은 ‘병원 인공지능의 미래방향’에 대해 발표했다.
황보율 인공지능연구과장은 “암에서의 인공지능은 의료영상, 의료정보, 유전체 등 각종 의료데이터를 통해 인공지능 모델을 개발·적용하고자 하는 노력이 지속됐으나 실제 의료현장에 적용하기는 어려웠다”라며, “실제 사용자인 의료인과 의료 현장의 니즈 파악이 미흡해 의료현장에서의 실질적 편의를 만들어내지는 못했기에, 이제 실제 솔루션을 사용할 사용자의 수요를 기반으로 의료인과 기업이 의료기기 소프트웨어를 개발할 필요가 있다”고 강조했다.
또한, “병원에서 클라우드 기반의 빅데이터, 인공지능 개발 및 실증 플랫폼의 구축이 필요하며, 기업과 학계가 모두 동참하는 선순환 체계가 필요하다”라고 덧붙였다.