이세돌의 마지막 상대 ‘한돌’, 어떻게 진화할까?

이세돌은 중국 '절예'에 못 미치는 것으로 평가했다.

가 +
가 -

2016년 알파고와의 세기의 대국에서 패하면서 본의 아니게(?) 인공지능(AI)의 진화 속도를 실감케 해줬던 프로기사 이세돌 9단이 최근 은퇴했다. 그는 은퇴전 상대로도 국산 바둑 AI ‘한돌’을 선택했고, 1승2패로 대국을 내주며 프로기사 생활을 마무리했다. 한돌도 이세돌과 마지막 대국을 벌인 AI로 이름을 남기게 됐다.

| 1국 당시 첫 수를 고민하는 이세돌 9단의 모습

한돌 실력은? ‘알파고 마스터’ 이상 ‘알파고 제로’ 이하

이세돌 9단은 한돌과의 대국이 끝난 뒤 세계 최정상 바둑 AI로 꼽히는 중국의 절예 보다는 한수 아래라는 평가를 내렸다. 같은 조건에서 바둑을 두는 호선(맞바둑)이 아닌 2점을 미리 깔고 두는 접바둑에서 약점을 보였다는 지적도 받았다. 접바둑에 대한 준비 기간이 부족했던 탓이다.

NHN은 한돌의 실력에 대해 2016년 이세돌과 대국을 벌인 ‘알파고 리’나 2017년 중국 최고수 커제를 꺾은 ‘알파고 마스터’는 능가하는 것으로 보고 있다. 알파고의 최종 버전인 ‘알파고 제로’에는 아직 못 미치는 것으로 알려졌다. 한돌 3.0은 지난 8월 ‘2019 중신증권배 세계 AI 바둑대회’에 참여해 3위를 기록했다. 1위는 중국 ‘절예’였다.

한돌은 지난 1월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단, 신진서 9단과의 릴레이 대국에서 전승을 거뒀다. 세계 랭킹 1위 수준인 신진서 9단은 당시 한돌에 대해 “한돌이 (이세돌 9단과 대결한) 알파고 리 버전보다 센 것 같다”라며 “커제 9단과 뒀던 알파고 마스터 버전과 비교했을 때 약간 부족하거나 비슷한 수준까지 올라왔을 거라 생각한다”라고 평가했다.

당시 한돌은 2.0 버전이었다. NHN이 2017년 12월 첫선을 보인 한돌은 지난해 12월, 올해 7월 두 차례 판올림을 거쳐 현재 3.0 버전으로 업그레이드됐다. NHN에 따르면 한돌 3.0은 2.0 버전과 겨뤘을 때 90% 이상의 승률을 기록했다.

이세돌 9단과 겨룬 한돌도 3.0 버전이었다. 단, 접바둑에 대한 학습이 이뤄지지 않은 상태에서 2개월 동안 새롭게 개발이 진행됐다. 한돌을 개발한 이창율 NHN 게임AI팀 팀장은 “접바둑을 준비한 지 2개월밖에 안 됐으며, 머신러닝은 학습량과 데이터가 많을수록 성능이 올라가는데 전체적으로 그렇지 못했다”라고 밝힌 바 있다.

NHN에 따르면 기술적으로 한돌은 알파고와 비슷한 방식을 따랐다. ‘지도학습’과 ‘강화학습’의 강점을 결합한 머신러닝 기법이 적용됐다. 현재 버전의 한돌은 무작위/자가대국으로 만든 기보로부터 학습한 정책망 및 더 정확한 가치망을 사용해 롤아웃 없이 MCTS 수읽기 알고리즘을 통해 다음 수를 예측한다.

여기에 자가 대국을 통해 생성한 기보를 이용해 학습하는 과정을 반복하면서 지속적으로 성능이 개선되고 있다.  현재 알파고 최종 버전인 ‘알파고 제로’와 마찬가지로 인간의 기보가 아닌 스스로 만든 기보로 학습하는 등 인간의 개입을 최소화한 방식도 적용됐다.

한돌로 확보한 노하우, 게임 서비스에 적극 투입

알파고를 개발한 구글 관계사인 딥마인드는 범용 AI를 추구라는 회사다. 특정 용도에 최적화된 현재 AI와 달리 여러 곳에 동시에 사용할 수 있는 AI를 개발하는 것이 딥마인드의 비전이다.

딥마인드는 지난해 12월 알파고를 통해 얻은 AI 기술을 바탕으로 단백질의 3차원 형태를 예측하는 ‘알파 폴드’를 공개했다. 인류의 난제인 단백질 구조를 규명한다면 생명체의 근원적 현상에 대해 접근하고 질병을 고칠 수도 있다. 신약 개발에 미칠 파장도 크다.

딥마인드는 올해 1월 ‘스타크래프트2’ 프로게이머를 이기는 ‘알파스타’를 선보여 다시 한번 관심을 불러일으켰다. 알파스타의 개발 목적은 단순히 ‘스타크래프트2’에서 인간을 이기기 위해서가 아니다. 게임을 통해 얻은 AI 기술은 다양한 과학과 실제 문제를 해결하는 데 필요한 기술로 응용된다.

| 알파스타 관점에서의 스타크래프트2 (사진=딥마인드)

알파스타 공개 당시 딥마인드는 “매우 긴 데이터 시퀸스에 대한 복잡한 예측을 하는 근본적 문제는 날씨 예측, 기후 모델링, 언어 이해 등과 같은 실제 세계에 나타난다”라며 “우리는 알파스타 프로젝트에서 얻은 기술이 이러한 분야에 활용돼 상당한 발전을 이룰 가능성에 대해 매우 흥분하고 있다”라고 밝혔다.

한돌을 앞세워 NHN이 가는 방향은 딥마인드와는 다르다. 한돌은 게임 서비스에 초점을 맞추고 있다.

NHN은 한돌의 개발 및 서비스 목표에 대해 ‘바둑의 기력이 높은 AI뿐만 아니라, 바둑을 배우고 싶고 바둑을 즐기는 모든 이용자에게 도움을 줄 수 있는 AI를 만들어 보다 재미있는 서비스를 만들어나가는 것’이라고 밝혔다.

한돌은 현재 한게임 바둑 내에서 일반사용자와 대국이 가능하다. 사용자의 기력을 고려한 맞춤형 AI 대국도 지원한다. 한돌이 다음 수에 대한 힌트를 주기도 한다. 이 밖에도 NHN은 프로기사의 기풍을 학습해 이창호풍 한돌, 이세돌풍 한돌 등 기풍 변경을 통한 대국 고도화 등을 추진 중이다. 또 한돌에서 사용한 기술을 장기, 퍼즐 등으로 확대 적용할 계획도 갖고 있다.

NHN은 AI를 활용한 서비스 개선에 집중하고 있다. 한돌을 통해 쌓은 AI 기술 노하우를 다른 게임 서비스에 활용하고 나아가 게임 외 서비스에도 응용하는 방식이다. ‘닥터마리오 월드’ 등 퍼즐 게임 난이도 예측에도 한돌을 통해 쌓은 AI 기술 노하우가 일부 활용됐다. NHN은 추천 서비스, 이미지 검색 등 다양한 자사 서비스 개선을 위한 AI를 연구 중이라고 밝혔다.