요약정리

“구글 AI, 5분 만에 날씨 내다본다”

2020.02.04

기상·기후 예측에 인공지능(AI)을 적용하려는 시도가 활발한 가운데  구글이 AI로 5~10분 만에 최대 6시간 이후 날씨를 예측하는 프로그램을 선보였다. 구글의 칼라 브롬버그  ‘공익을 위한 AI’ 프로그램 리드는 2월4일 서울 역삼동 구글코리아에서 화상 기자간담회에서 “신경망을 이용한 기상 예측은 기존 (예측) 방법보다 정확도가 훨씬 높다”라며  현재 개발 중인  AI 기반 기상 예측 모델 ‘나우캐스트(Nowcast)’를 소개했다.

이 프로그램을 이끌고 있는 브롬버그 리드는 “예보는 통근, 주말 나들이 계획부터 홍수, 산불, 장마 등 여러 재난을 예측하는 데 있어 중요하다. 날씨는 식량 생산, 의식주 문제와도 긴밀히 연관돼 있다”라며 “이상기후로 인해 시시각각 변하는 날씨를 실시간으로 예측, 효과적으로 대비해야 할 필요성이 늘어났다. 이에 딥러닝을 도입해 날씨를 단기예측하는 방법을 고안했다”라고 설명했다.

머신러닝을 날씨 예측에 활용하는 방법

현재 일기예보 시스템은 방대한 규모의 관측 데이터를 모두 통합해 반영하고 있다. 브롬버그 리드에 따르면 미국해양대기청은 하루 100테라바이트(TB)에 달하는 원격탐지 데이터를 수집, 슈퍼컴퓨터 날씨예측 엔진에 이를 입력하는 방식으로 열흘 간의 전세계 날씨 흐름을 예측한다.

해당 엔진은 지난 50여년에 걸쳐 개발된 것으로, 대기역학과 열방사, 녹지, 호수, 해양 등의 영향을 수치로 분석한 물리적 과정을 직접 시뮬레이션하는 계산법에 기반한다.

단점은 시간이다. 이 시스템은 날씨 예측에 6시간여가 소요돼 하루 서너 번만 실행할 수 있다. 하루에 6시간 이상 경과된 날씨만 예측할 수 있어, 갑작스러운 기상 변화에는 대응하기 어렵다는 얘기다. 컴퓨팅 자원의 가용성으로 인한 제약도 있다. 5K 해상도로만 구동되기 때문에 일부 지역에서는 분석이 어렵다는 게 구글 측 설명이다.

반면 구글은 예보 시간을 대폭 단축했다. 나우캐스트는 단 5~10분 만에 기상을 분석한다. 브롬버그 리드의 주장에 따르면 공간 해상도도 1㎞로 미국 해양대기청(NOAA)의 예보모델 ‘HRRR’보다 10배 더 상세하다.

비결은 머신러닝이다. 구글은 기상예측 모델에 데이터 중심의 비물리적 방식을 채택했다. 사전지식에 의존하지 않고 교육용 예시 자료만을 토대로 대기 물리 근사치를 계산하는 법을 신경망에 학습시켰다.

예를 들어 미국 전역을 가로, 세로 256㎞ 타일 조각으로 나누고, 지난 한 시간 동안 2분 간격으로 레이더 영상 데이터를 수집한다. 이를 바탕으로 컨볼루션 신경망(Convolutional neural networks, CNN)이 지금으로부터 최대 6시간 이후의 레이더 영상을 예측하는 식이다. HRRR은 최대 3시간의 계산 지연이 생기지만 구글은 최신 데이터를 기반으로 예측하기 때문에 즉각적인 예보가 가능하다는 설명이다.

단, 이는 단기예측에만 해당된다. HRRR에 사용된 수치 모델은 완전한 3D 물리 모델을 사용하기 때문에 장기적으로 예측할 때 더 유리하다. 이에 구글은 빠른 예측이 가능한 머신러닝 모델과 장기 예보에 유리한 HRRR을 결합해 예측 가능성을 높일 예정이라고 밝혔다. 3D 관측에 머신러닝을 직접 적용하는 방법도 고려하고 있다고 덧붙였다.

이날 간담회에 참석한 함유근 전남대 지구환경과학부 교수는 “통계모형, 역학모형을 거쳐 딥러닝이 등장했지만 한 가지 정답만 있는 것은 아니다. 딥러닝으로 예측을 할 때도 가상 시뮬레이션 결과가 없으면 기존 역학모델보다 정확도가 떨어진다”라며 “이 같은 모형들은 하나가 나왔다고 해서 다른 방식을 배척하는 게 아니라 상호보완하는 관계”라고 강조했다.

구글은 브롬버그 리드는 “지금 당장은 기상예측 모델을 상용화할 계획은 없다”라며 “머신러닝 기법을 이용해 얼마나 날씨를 정확하게 예측할 수 있는지에 대해 연구과제로만 삼고 있다”라고 말했다. 또 “머신러닝으로 인류가 직면한 문제를 해결할 수 있을 거다. 공익을 위한 AI 연구가 영향을 미칠 수 있을 거라 생각한다”라고 말했다.

|이날 간담회에서 함 교수는 기상청의 국지적인 일기예보 시스템에 대해 아쉬움을 표했다. 함 교수는 “동네 예보와 같은 국지적인 예측은 사실상 불가능하다. 우리나라 기상청이 하고는 있지만 이는 사람들이 필요로 하니 서비스적인 측면을 고려해 제공해주는 것뿐, 전세계에서 우리나라만 하고 있는 것”이라고 말하기도 했다.

이날 간담회에서 함유근 전남대 지구환경과학부 교수는 네이처에 게재한 ‘합성곱 신경망 기법(CNN·Convolutional Neural Network)’을 응용한 엘니뇨 예측 모형을 소개하기도 했다.

엘니뇨는 남미 페루연안에서 적도에 이르는 태평양상의 수온이 상승하는 기상이변 현상을 일컫는다. 엘니뇨가 나타나면 세계 각지에 홍수·가뭄·폭설 등이 발생한다.

함 교수는 딥러닝으로 엘니뇨 현상의 발달 여부 등을 최장 18개월 전에 예측할 수 있는 모형을 개발했다. CNN 기법을 적용, 위성으로 관측한 해수면 온도 등을 제시하면 엘니뇨 지수를 예측하도록 했다. 기존 모델은 1년 정도를 예측했다고 한다. 함 교수에 따르면 정확도는 70% 이상이다.

함 교수는 “엘니뇨 예측 가능시기가 18개월로 늘어나면 엘니뇨로 인한 옥수수 가격 폭등과 같은 문제에 대해 선제적으로 대응할 수 있게 된다”라며 “올해도 약한 엘니뇨의 해인데, 호주 산불 같은 경우도 선제적으로 예측해 대비했다면 피해가 적었을 것”이라고 말했다.

다만 엘니뇨 같은 기후 예측은 어려움이 따른다. 데이터가 부족하기 때문이다. 매일 날씨를 예보하는 기상 예측과는 달리 기후는 대기의 종합적인 결과다.

오늘은 강수량 70%로 예상됩니다. 우산을 준비하셔야 할 것 같습니다→기상 예측

올 겨울은 평년보다 따뜻하겠습니다→기후 예측

같은 기간 동안 수집할 수 있는 데이터가 다르다는 의미다. 기상은 1년 동안 365개의 데이터가 생기지만 기후는 1개월 기준으로 하면 12개의 데이터만 모인다. 함 교수는 “똑같이 100년을 관찰해도 기후 예측은 데이터가 현저히 적다”라고 말했다. 이 같은 한계를 극복하고 기후 예측 정확도를 높이는 게 기후학계의 과제라고 함 교수는 말했다.