한국과학기술원(KAIST·카이스트) 이재길 교수 연구팀이 개발한 신종 코로나바이러스 감염증(코로나19) 해외유입 확진자 수 예측 방법의 모식도. 출처=뉴스1

신종 코로나바이러스 감염증(코로나19)이 2차 대유행 조짐을 보이고 있는 가운데 국내 연구진이 신종 코로나바이러스 감염증(코로나19) 해외유입 확진자 수를 예측할 수 있는 기술을 개발했다.

19일 한국과학기술원(KAIST·카이스트)은 산업 및 시스템공학과 이재길 교수 연구팀이 코로나19 해외유입 확진자 수를 예측할 수 있는 빅데이터·인공지능(AI) 기술을 개발했다고 밝혔다.

이 기술은 해외 각국의 확진자 수와 사망자 수, 코로나19 관련 키워드 검색 빈도 및 한국으로의 일일 항공편 수, 한국으로의 로밍 고객 입국자 수 등 빅데이터에 AI 기술을 적용해 향후 2주간의 해외유입 확진자 수를 예측한다.

연구진은 해외 각국의 코로나19 위험도를 산출할 때 우선 공식적으로 알려져 있는 확진자 수와 사망자 수를 활용했다. 다만 이러한 수치는 진단검사 수에 좌우되기 때문에 코로나19 관련 키워드 검색 빈도를 함께 입력 데이터로 활용해 해당 국가의 코로나19 위험도를 실시간으로 산출했다.

아울러 실시간 입국자 수는 기밀정보로 외부에 공개되지 않기 때문에 매일 제공되는 한국 도착 항공편수와 로밍 고객 입국자 수를 통해 이를 유추해냈다.

로밍 고객 입국자 수 데이터는 KT로부터 제공 받았는데, 이는 KT 고객 입국자만을 포함한다는 한계가 있어 연구진은 일일 항공편수를 함께 고려함으로써 문제를 해소했다.

연구진은 국가 간의 지리적 연관성도 이번 연구에서 고려했다. 특정 국가의 코로나19 발병이 이웃국가로 더 쉽게 전파되며 국가 간 교류도 거리에 따라 영향을 받기 때문이다.

연구진은 이에 따라 각 대륙으로부터의 해외유입 확진자 수를 예측해 전체 해외유입 확진자 수를 예측하도록 하는 AI 모델(Hi-COVIDNet)을 설계했다.

이후 연구진은 약 한 달 반에 걸쳐 해당 모델에 데이터 훈련을 시킨 뒤 향후 2주간 한국으로의 해외유입 확진자 수를 예측했다. 그 결과, 이 모델은 기존 시계열 데이터 예측 기계학습 또는 딥러닝 모델 대비 최대 35% 더 높은 예측 정확도를 달성했다.

KAIST 측은 "코로나19 확진자 수가 급증할수록 해외유입에 의한 지역사회 확산의 위험성도 항상 뒤따르기 마련"이라며 "이재길 교수 연구팀이 개발한 해외유입 확진자 수 예측기술은 방역 시설과 격리 시설 확충, 고위험 국가 입국자 관리 정책 등에 폭넓게 응용·적용될 수 있을 것으로 보여 기대가 크다"고 밝혔다.

이번 연구는 KAIST 지식서비스공학대학원에 재학 중인 김민석 박사과정 학생이 제1저자로, 강준혁·김도영·송환준·민향숙·남영은·박동민 학생이 제2~7저자로 각각 참여했다. 오는 24일 최고권위 국제 학술대회 'ACM KDD 2020'의 'AI for COVID-19' 세션에서 연구결과가 발표될 예정이다.

아울러 이번 연구는 KAIST 글로벌전략연구소의 코로나19 AI 태스크포스(TF)팀의 지원을 받아 진행됐다. 또 KT와 과학기술정보통신부의 '코로나19 확산예측 연구 얼라이언스'를 통해 로밍 데이터 세트를 지원받아 이뤄졌다.

저작권자 © AI라이프경제 무단전재 및 재배포 금지