구글, ‘별 헤는 인공지능’ 내놓다

별 하나에 추억과 사랑을 담기엔 우주의 별은 무수히 많다.

가 +
가 -

가슴 속에 하나 둘 새겨지는 별을
이제 다 못 헤는 것은
쉬이 아침이 오는 까닭이요,
내일 밤이 남은 까닭이요,
아직 나의 청춘이 다하지 않은 까닭입니다.

윤동주 시인이 별을 다 세지 못하는 이유에는 안타까움의 정서가 담겨있다. 하지만 현실의 천문학자가 우주의 별을 모두 헤아리지 못하는 이유는 데이터가 너무 방대하기 때문이다. 별 하나에 추억과 사랑을 담기엔 우주의 별은 무수히 많다. 기술이 발전하면서 태양계 바깥의 외계 행성을 찾는 일도 가능해졌지만 방대한 양의 데이터를 분석해 별을 명확하게 헤아리기엔 시간이 턱없이 부족하다. 구글은 인공지능(AI)을 활용해 이러한 문제를 해결했다. 머신러닝 기법을 적용해 효과적으로 데이터를 분석하는 방식이다.

구글코리아는 1월31일 AI 혁신과 천체의 발견을 주제로 한 ‘구글 AI 포럼’을 열고 자신들의 성과를 소개했다. 구글은 머신러닝 기법을 적용해 2개의 새로운 행성을 발견했다. 텍사스대학교 연구팀과 협업을 통한 프로젝트 결과물이다. 크리스 샬루 구글 시니어 리서치 스프트웨어 엔지니어는 지난해 12월19일 미국항공우주국(NASA)의 케플러 우주 망원경이 수집한 데이터 속 행성을 식별하는 머신러닝 모델을 개발해 성과를 나타냈다고 발표했다. 이날 행사에서는 크리스 샬루 엔지니어가 직접 해당 성과를 설명하는 시간을 가졌다.

 

머신러닝을 통한 행성 식별

천체물리학자들은 외계 행성을 찾기 위해 주로 NASA의 케플러 망원경을 통해 얻은 방대한 양의 데이터를 분석한다. 별의 밝기 데이터를 분석해 별을 헤아리는 방식이다. 케플러 망원경은 4년 동안 약 20만개의 항성을 관찰하면서 약 140억개의 데이터 포인트를 만들었다. 이는 약 2000조개의 행성 궤도가 존재할 수 있다는 의미다. 데이터를 분석하는데 엄청난 시간이 소요될 수밖에 없다. 구글 연구팀은 머신러닝을 적용해 데이터 검토에 드는 시간을 단축했다. 머신러닝이란 현재 AI 연구의 주가 되는 분야로, 컴퓨터가 인간과 비슷한 방식으로 학습하는 걸 말한다. 즉, 학습에 있어 인간이 직접적인 규칙을 제공하지 않고 컴퓨터가 스스로 데이터를 통해 학습하고 규칙을 일반화해 예측하도록 하는 기술이다.

빛의 곡선

그동안 천문학자들은 2단계에 거쳐 행성을 찾아내는 작업을 했다. 먼저, 컴퓨터 알고리즘을 사용해 ‘빛의 곡선’상의 어떤 지점에서 빛이 줄어드는지 식별한다. 다음으로, 천문학자 자신의 눈으로 신호들을 하나하나 식별하고 탐지해서 어떤 신호가 어떤 행성에서 발생한 건지 다른 외부 요소에 기인한 건 아닌지 판별한다. 케플러 미션은 2009년 5월부터 시작됐고 그 이래로 천문학자들은 약 3만개에 달하는 신호들을 분석해 2335개 이상의 행성을 확인했다. 하지만 수동으로 하나하나 신호를 검색하고 검토하는 데는 시간이 많이 든다. 또 신호가 강하게 잡힌 데이터만 분석할 수밖에 없다. 사람의 눈으로는 신호가 약한 데이터의 노이즈를 걷어내고 해당 신호가 행성인지 행성이 아닌지 구분하기 어렵기 때문이다.

실제 행성에서 생성된 신호와 다른 요인에 의해 만들어진 신호

구글 연구팀은 나선형 신경망 모델을 적용했다. 구글 포토에서 이미지 분류에 사용되는 신경망 모델이다. 1만5천개 이상의 케플러 신호 데이터셋을 이용해 행성과 행성이 아닌 것을 판별하도록 학습시켰다. 실제 행성으로 인해 생성된 신호 패턴과 별표면의 흑점이나 쌍성 등 다른 물체 때문에 만들어진 신호 패턴을 구별하도록 했다. 이 모델은 96%의 확률로 행성을 제대로 식별해냈다. 연구팀은 이 학습된 모델을 가지고 항성 670개에서 추출한 데이터를 탐색했고 그 결과 2개의 새로운 행성을 발견했다.

구글 연구팀이 새롭게 발견한 두 행성 ‘케플러80g’, ‘케플러90i’

연구팀은 새롭게 발견한 두 행성에 ‘케플러80g’와 ‘케플러90i’라는 이름을 붙였는데, 이 중 케플러90i는 특별하다. 우리 태양계 외부에 존재하는 태양계 중 하나인 ‘케플러90’을 공전하는 8번째 행성으로 밝혀졌기 때문이다. 지구가 속한 우리 태양계 외부에 존재하는 태양계 중 8개의 행성을 보유하고 있는 것으로 밝혀진 건 케플러90이 최초다.

 

미래를 위한 또 한 걸음

크리스 샬루 엔지니어는 아직 해결하지 못한 과제가 있다고 밝혔다. 케플러 망원경을 통해 관찰한 한 행성이 전면에 있는 항성을 공전하는 건지 뒤에 있는 별을 돌고 있는 건지 현재 머신러닝 모델은 판별하지 못한다. 이 때문에 탐사하고 있는 행성이 어떤 별 주위를 공전하고 있는지에 대해 천문학자들을 통해 재검토받고 있다. 이 문제는 위치 정보를 신경망 모델에 접목하는 방식으로 해결할 계획이다. 크리스 샬루 엔지니어는 “활용할 수 있는 로데이터 중 흑백사진을 통해 어느 위치에서 신호가 발생했는지 알 수 있다”라며 “이를 적용하면 모델이 실제로 봐야 하는 데이터양이 훨씬 많아지기 때문에 수개월 동안 문제를 해결해 나갈 예정”이라고 밝혔다.

크리스 샬루 구글 시니어 리서치 스프트웨어 엔지니어

또 지금까지 연구팀이 활용한 데이터는 케플러 망원경을 통해 수집한 20만개의 항성 데이터 중 670개에 불과하다. 구글 연구팀은 더 많은 케플러 데이터를 활용해 아직 발견되지 않은 수많은 외계 행성을 찾아낼 계획이다. 크리스 샬루 엔지니어는 “20만개에 달하는 항성 데이터를 머신러닝을 통해 전부 검토하는 게 1차 목표”라며 “추후 NASA뿐만 아니라 다른 우주항공기관에서 수집된 다양한 데이터를 적용하고자 한다”라고 말했다. 천체망원경 속에 하나 둘 새겨지는 별을 이제 다 헤는 날이 머지않아 보인다.

이날 행사는 원격 화상 방식으로 이뤄졌다.

외계 생명체를 발견할 가능성에 관해 묻는 질문에는 “지금까지 발견한 행성은 생명체가 살기엔 온도가 너무 높아 생명체가 존재할 가능성은 없지만 향후 적절한 온도 대의 행성을 발견하면 생명체 존재 가능성도 살펴보고자 한다”라고 답했다. 또 “구글 연구팀이 사용하는 기법은 행성을 식별하는 것에만 한정돼 있기 때문에 적절한 온도대의 행성을 식별하면 다른 망원경으로 행성의 생물학적 구성을 확인할 수 있어야 다른 연구도 가능할 것”이라고 덧붙였다.

네티즌의견(총 1개)