컴퓨팅 자원, 데이터, 알고리즘, 개발자의 재능. 인공지능(AI)에 필요한 4요소다. 강력한 연산 성능을 갖춘 컴퓨팅 자원을 바탕으로 잘 정제된 데이터를 알고리즘에 학습시켜 재능 있는 엔지니어가 AI 모델을 설계한다. 어느 한 축이 틀어지면 AI 기술 경쟁력을 갖추기 힘들다. 세계 각국이 AI 경쟁력을 확보하기 위해 각축전을 벌이는 가운데 한국에 부족한 것은 무엇일까. 전문가들은 데이터와 인력 부족 문제를 꼽는다. 하드웨어 역량은 갖췄지만 소프트웨어 역량이 충분하지 못하다는 지적이다. 현재 한국은 AI 선진국으로 꼽히는 미국과 비교해 2년 정도 기술 격차가 있는 것으로 알려졌다.

지난 6월26일 구글코리아가 주최한 ‘AI 위드 구글 2018’ 컨퍼런스에 국내 산학연 주요 인사들이 참석해 AI 혁신에 대한 지식과 앞으로의 도전 과제를 논의했다. 이번 컨퍼런스에는 구글 본사에서 AI 프로젝트를 총괄하는 제프 딘 시니어 펠로우가 연사로 참석했으며, 국내 학계에서는 카이스트 황의종 교수, 국내 산업계에서는 SK텔레콤 AI리서치센터의 김윤 센터장, 카카오모빌리티의 유승일 데이터랩장, 국내 스타트업에서는 원티드랩의 황리건 제품 총괄 겸 공동창업자와 뷰노 정규환 CTO가 참여했다. 참석자들은 산학연이 AI 부문에 대한 개방과 협력을 통해 부족한 역량을 메꿔야 한다고 지적했다.

(오른쪽부터) 구글 AI 총괄 제프 딘 시니어 펠로우, 카이스트 황의종 교수, SK텔레콤 AI리서치센터의 김윤 센터장, 카카오모빌리티의 유승일 데이터랩장

 

세계 속 한국의 AI 현주소

시장조사업체 IDC에 따르면 전세계 AI 시장은 매년 56% 성장하고 있으며 2022년까지 1천억달러(약 112조원) 이상의 수익 규모를 형성할 것으로 전망된다. 이 가운데 한국이 차지하는 비중은 얼마나 될까. 황의종 카이스트 교수는 국가 간 AI 경쟁력에 관한 지표로 특허를 들며 전체 7319건의 AI 특허 가운데 한국은 약 3% 비중을 차지한다고 밝혔다. 미국은 47%, 중국은 19%, 일본은 15%의 비중을 차지하는 것과 비교하면 미미한 수치다. 이들 특허의 대부분은 IBM, 구글의 모회사 알파벳, 마이크로소프트, 바이두, 알리바바 등 거대 IT 기업을 중심으로 나온다. 황의종 교수는 한국의 AI 기술 수준이 미국보다 2년, 일본과 비교해 1.1년가량 늦는다고 진단했다.

자료: 카이스트 리서치 플래닝 센터

한국 정부는 로봇, 컴퓨팅, 빅데이터, 자율주행차 등의 분야에 연구·개발(R&D) 투자를 하고 있지만 AI 선진국과 비교하면 적은 수준이다. 한국형 AI 프로젝트인 ‘엑소브레인’의 경우 약 1천억원의 예산이 들어갔지만 미국은 비슷한 유형의 프로젝트에 30억달러(약 3조3천억원), 유럽은 12억달러(약 1조3천억원), 일본은 9억달러(약 1조원)을 투자하고 있다. AI 강국과 비교해 적게는 10배에서 많게는 30배가량 R&D 투자 규모 차이가 있는 셈이다.

 

데이터와 인력 부족

AI 경쟁력 격차는 인프라에서 나온다. 특히 이번 컨퍼런스에서 전문가들은 데이터와 인력 부족 문제를 공통으로 짚었다. 황의종 교수는 국내에서 AI 연구를 선도하는 카이스트도 AI 관련 연구 비중이 5% 수준이라며 AI 연구 생태계를 확장할 필요가 있다고 지적했다. 또 학계에서는 연구에 필요한 데이터 인프라를 확보하기 쉽지 않은데 업계와 협업이 어렵다고 토로했다. 개방된 오픈소스 소프트웨어나 공공 데이터를 활용하고 있지만 대부분 해외 데이터이기 때문에 한국에 맞춤화된 데이터가 있으면 더 도움이 될 것이라고 말했다.

카이스트 황의종 교수

업계 역시 데이터와 인력 확보의 어려움을 토로했다. SK텔레콤 AI리서치센터의 김윤 센터장은 “고급 인력과 AI 관련 인력을 확보하기 힘들고 수천만명, 수억명 정도의 대규모 사용자를 충족시킬 수 있는 서비스를 개발하기 위한 AI·ML 데이터 인프라가 현저히 부족하다”라며 “한국 대기업의 공통적인 문제는 연구와 프로토타입 선행 개발과 상용화 조직이 분산돼 있어 각 조직 간에 벽이 있고 상용화를 최적화하는 데 어려움이 있다”라고 밝혔다. 또 “AI 기술의 현주소에 대한 오해, 과분한 기대 등이 혁신을 어렵게 한다”라고 덧붙였다.

전문가들은 데이터 확보가 어려운 이유로 개방성, 표준화, 불분명한 규제 등을 꼽았다. 좁게는 조직 간, 넓게는 정부와 업계, 학계 간의 협업이 잘 이뤄지지 않다 보니 데이터를 좁은 울타리 안에서만 구하거나 주로 해외의 공공 데이터를 활용해야 한다. 이때 한국어가 걸림돌이 되기도 한다. AI 알고리즘을 돌리기 위해선 정제된 데이터가 필요한데, 한국어로 표준화된 데이터가 부족하다 보니 업계에서는 데이터를 정제하는 밑바닥 작업부터 시작해야 한다. 연구·개발의 효율성이 떨어진다는 말이다.

또 뚜렷하지 않은 규제도 데이터 확보를 어렵게 한다. AI 의료 스타트업 뷰노의 정규환 CTO는 “개인정보, 민간정보에 대한 정의나 데이터 수집에 대한 기준이 불명확하다”라며 “기준에 대한 정답이 없기 때문에 서로 양보하면서 합의가 이뤄져야 중간에서 산업도 일어나고 사업을 할 수 있는데, 서로 팽팽하게 양보하지 않는 상황이어서 적절한 합의가 필요하다”라고 말했다.

 

한국의 AI 잠재력

이 같은 어려움이 있지만, 한국은 AI 기술 잠재력을 갖춘 나라로 평가받는다. 구글 본사에서 AI 프로젝트를 총괄하는 제프 딘 시니어 펠로우는 “한국은 AI에 대한 관심과 기대가 두드러지며 다양한 분야에서 머신러닝과 AI를 활용하고 있다”라며 “한국은 이미 과학과 수학 교육 등에서 우수하며 그만큼 AI 혁신에서 성공할 것”이라고 말했다. 또 “어떤 산업이나 AI나 머신러닝의 영향을 받을 텐데, 한국은 반도체, 휴대폰, 통신 사업 등 여러 산업에서 AI를 활용할 수 있고 그로부터 얻을 수 있는 잠재력이 있어 전망이 밝다”라고 덧붙였다.

구글 본사에서 AI 프로젝트를 총괄하는 제프 딘 시니어 펠로우

이날 행사에 참석한 권용현 과학기술정보통신부 지능정보사회 추진단 부단장은 “정부에서도 다른 나라에 뒤지지 않게 데이터와 인력을 공급하고 필요한 기술력을 지원하는데 애를 쓸 예정”이라며 “AI 기술력 확보와 시장 창출은 데이터가 없는 상태에서 할 수 없기 때문에 정부가 수요를 창출해주는 게 중요하며 이를 위해 공공 서비스의 정보화 시스템을 단계적으로 AI를 쓰는 지능형 시스템으로 바꿀 계획”이라고 밝혔다. 또 AI 인력 확보를 위해 “AI에 초점을 맞춘 대학원을 최소 3~6개 정도 만들고 실제 프로젝트에 기반한 커리큘럼을 만들어서 시행할 것”이라고 말했다.

spirittiger@bloter.net

사랑과 정의의 이름으로 기술을 바라봅니다. 디바이스와 게임, 인공지능, 가상현실 등을 다룹니다.