LG·네이버 뛰어든 ‘초거대 AI’...'초거대' 의미는?[IT흥신소]

발행일 2021-05-27 07:42:01
‘블로터 IT흥신소’는 독자 여러분의 질문을 받고, 궁금한 점을 대신 알아봐 드립니다. IT에 관한 질문, 아낌없이 던져주세요. 이메일(bloter@bloter.net), 페이스북(/bloter.net), 네이버TV, 유튜브 모두 열려 있습니다.
요즘 정보통신기술(ICT)업계의 화두로 ‘초거대 AI’가 떠오르고 있습니다. 네이버·카카오·LG·KT·SKT 등이 국내 초거대AI의 주도권을 잡기 위해 막대한 투자를 하고 있죠.

그렇다면 왜 기업들이 초거대AI에 집중할까요? 우리 머릿속 이상적 인공지능의 개념에 한층 가까워지는 것이기 때문입니다. 지금까지의 AI가 단순히 우리에게 도움을 주는 수단이었다면, 초거대AI는 인류가 지금까지 하지 못했던 새로운 일을 할 수 있게 해줍니다. 그 일은 과연 무엇일까요?

(영상 디자인=박수혁)
 
2016년 이세돌 9단과 알파고의 바둑 대국을 기억하실 겁니다. 기계가 인간을 절대로 이기지 못할 것으로 보였던 바둑에서 최정상급 기사를 이긴 이벤트였죠. 물론 우리는 이세돌과 알파고의 4국에서 기계의 오류를 보기도 했습니다. 하지만 인류는 그보단 AI의 무한한 가능성에 더 주목했죠.

AI는 어떤 식으로 활용되고 있나요? 여러분들이 넷플릭스에서 보고 싶은 프로그램을 추천받을 수 있고요. 페이스북에 사진을 올리면 내 얼굴을 알아서 인식해주죠. 메일함에서 스팸메일을 걸러내거나 스피커에 BTS 노래를 틀어달라고 하면 자동으로 틀어주기도 합니다. AI로 인해 생겨난 편의죠.

그렇습니다. 지금까지의 AI는 우리의 삶에 편의를 주는 수준에 그쳤습니다. 본질적으로 뭔가를 바꾸고 있다는 이미지를 심진 못했죠.

2016년 알파고는 우리 삶에 AI라는 임팩트를 줬지만, 그 이후 실제 삶의 변화를 극적으로 가져오진 못하고 있다.

하지만 우리가 모르는 사이, AI는 여전히 진화하고 있습니다. 단순히 어떤 일의 도움을 주는 걸 뛰어넘어 새로운 부가가치를 창출하기 시작했는데요. 이런 관점에서 최근 주목받는 게 바로 ‘초거대AI’입니다.

초거대 AI란 과연 무엇일까요. 사실 비교적 보편적 단어가 된 ‘AI’와 ‘딥러닝’에 대한 대중의 이해도 또한 낮은 편입니다. 일단 이 두 가지 용어가 무엇인지를 정리해보겠습니다.

AI란 기계의 인적지능화를 의미합니다. 기계가 스스로 무언가를 학습하고, 판단해, 결과물을 내놓는 것이죠. 기존엔 사람이 특정한 규칙과 데이터를 집어넣으면 기계가 그에 맞게 결과값을 뽑아냈습니다. 하지만 현대의 인공지능은 인간의 최소한의 개입으로 스스로 데이터를 분석해 규칙을 찾아냅니다. 이를 ‘머신러닝’이라 부르죠.

AI와 함께 발달한 개념은, 바로 ‘인경신경망’입니다. 인간의 신경망, 일명 뉴런 구조를 본떠 만든 인공지능 모델을 뜻하죠. 우리 몸속에 100조개 이상의 ‘뉴런’과 ‘시냅스’가 신호를 전달하는 것처럼, 인공신경망도 특정 데이터의 일부 조각을 받으면 이를 다른 뉴런으로 넘기면서 최종 결과물을 산출합니다. 데이터는 많으면 많아질수록 그 정확도가 높아지죠.

인공신경망은 인간 몸 속 뉴런의 작동 방식을 차용해 만든 AI 기술이다.(사진=픽사베이)


인공신경망은 한때 사장될 위기에도 처했습니다. ‘기울기 소멸 문제’와 같은 데이터 처리에 있어서 생긴 기술적 한계 때문인데요. 여러 해결책을 통해 이를 극복한 게 바로 2000년대 등장한 딥러닝입니다. 비정제 데이터의 노이즈를 최소화할 수 있게 만든 것이죠. 이를 통해 기존 기계학습에 비해 다량의 데이터나 복잡한 자료를 분석하는 걸 가능하게 만들었습니다.

딥러닝과 기존 AI의 차이는 무엇일까요. 기존엔 사람이 AI의 작동 로직을 직접 넣어줬다면, 딥러닝에선 비지도학습(Unsupervised Learning), 그러니까 별도의 로직 입력 없이도 스스로 논리적 사고 학습을 할 수 있게 됐습니다. 그리고 딥러닝 이전과 이후는 청동기와 철기로도 비유될 정도도 인공지능 학계에 딥러닝이 준 영향은 지대합니다.

이제 초거대AI를 말할 차례입니다. 초거대AI는 딥러닝 기법을 쓰는 인공신경망 가운데서도 그 파라미터가 무수히 많은 AI를 뜻합니다. 파라미터는 인공지능 모델의 ‘학습량’으로 생각하면 쉽습니다. 학습량이 많을수록 좋은 결과를 낼 가능성이 높은 것처럼, 파라미터가 많을수록 AI가 데이터를 분석하는 퍼포먼스도 비약적으로 늘어나게 되죠.

현존하는 최고의 초거대AI는 세계적 인공지능 연구소 ‘오픈AI’라는 곳에서 만든 GPT-3란 모델인데요. 파라미터 수가 1750억 개입니다. 2018년 만들어진 GPT-1의 파라미터가 1억1000만 개였으니, 2년만에 무려 1500배가 넘게 성장한 겁니다.

현존 최다 파라미터를 가진 초거대AI는 Open AI란 곳에서 만든 GPT-3다. 사진은 Open AI 프로젝트 홈페이지.

그렇다면 초거대AI로는 무슨 일이 가능해질까요. 지난 수백년간 쌓인 무수한 논문과 특허를 AI가 직접 분석해 데이터베이스를 만들고 거기서 유의미한 콘텐츠를 뽑아낼 수 있습니다. 세상에 없었던 물질을 개발할 때도 구조에 따른 효과를 AI가 예측할 수 있습니다. 신약을 개발하거나 신소재를 개발하는 등에 활용될 수 있죠.

초거대AI에 대한 국내 기업의 관심은 지대합니다. LG는 1000억원 넘게 들여 GPT-3의 3배에 달하는 파라미터 수 6000억 개인 초거대AI를 만든다고 하고요. SK텔레콤과 카카오도 한국판 GPT-3를 목표로 모델을 만들고 있죠. 네이버와 KT는 서울대, 카이스트 등 산학과 손잡고 관련 연구를 하고 있습니다.

국내 굴지의 ICT 기업들이 2020년부터 초거대AI 개발에 투자를 하고 있다.

LG는 초거대AI를 산업 현장의 공정을 자동화하고, 차세대 배터리와 고효율 발광 물질, 항암제 등 신약 개발에도 적용한다고 하죠. KT는 원천기술과 산업AI 분야에 총 20여개의 초기 연구를 진행한다고 하고요. 네이버는 지난해 서울대와 손잡고 만든 초거대AI 모델을 포털 검색창에 적용했고, 최근엔 한국말로 대화가 가능한 초거대AI '하이퍼 클로바'를 공개한데 이어 올해는 카이스트와 수백억원을 들여 창의적 AI 기술을 연구할 거라 합니다. 

이걸 알아보기에 앞서 솔직히 ‘초거대’라는 용어가 다소 거창하다고 느꼈습니다. 그런데 확인해보니 초거대AI는 인공지능이 새로운 부가가치를 창출하는 데 필요한 기술로 보입니다. 인간이 물리적으로 할 수 없는 엄청난 데이터를 분석해 의미있는 결과값을 창출하는 게 가능해지기 때문입니다.

네이버가 초거대AI 하이퍼클로바를 공개했다.(사진=네이버)

물론 AI의 부작용이나 오류에 대한 우려도 있는 게 사실이죠. 또 아직 인간의 뇌가 가진 에너지 효율성이나 인지능력, 감정 등의 디테일한 사고는 AI가 구현하지 못하는 것도 맞습니다. 하지만 그보단 AI가 전에 없던 부가가치를 창출하고, 이를 통해 우리 인류의 여러 난제를 극복할 수 있다는 믿음이 더 커지고 있어 보입니다. 그리고 초거대AI는 이를 실현할 중요한 단초가 될 것으로 판단됩니다.

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300

요일별 Edition