구글 산하 딥마인드의 주특기로 알려진 강화학습(Reinforcement learning) 인공지능(AI) 기술은 2016년 이세돌 9단을 상대로 승리를 거둔 AI '알파고'를 통해 일반에도 알려졌다.

유명세만 놓고 보면 강화학습은 차세대 AI 기술의 핵심 주자로서 손색이 없다. 강화학습에 초점을 맞춘 딥마인드 프로젝트들도 계속해서 화제를 몰고 다닌다. 하지만 AI를 직접 하는 이들 사이에선 강화학습으로 실전에서 효과를 보려면 아직 갈길이 멀다는 지적도 적지 않다.

차세대 AI와 관련해 강화학습이 너무 많은 관심을 빨아들이는 것을 불편하게 여기는 분위기도 있다. 강화학습은 특수한 상황에  최적화돼야 효과를 낼 뿐더러 만만치 않은 컴퓨팅 비용을 요구하다 보니 비즈니스 관점에선 투자대비효과(ROI)를 뽑기가 만만치 않다는 것이다.

이런 가운데, 국내 기업용 AI 소프트웨어 기업 애자일소다(대표 최대우)가 강화학습에 기반 정형 데이터 분석 플랫폼을 올해안에 선보이고 엔터프라이즈 시장 공략에 나서겠다고 밝혀 눈길을 끈다. 프로토타입을 내놓는게 아니라 상용 제품을 올해 공식 출시하는 것이 애자일소다의 로드맵이다. 엔터프라이즈 시장을 겨냥해 강화학습을 상용화한 케이스는 흔치 않다. 애자일소다 표현을 빌리면, 현재로선 세계 최초다.

"기존 딥러닝과는 다른 결과 도출 가능해져"

강화학습은 AI가 특정 목표를 향해 움직이도록 동기를 부여하기 위해 처벌과 보상이라는 인센티브를 활용한다. 핵심인 딥러닝이지만, 인센티브가 개념이 붙어 있다보니 돌아가는 방식은 일반적인 딥러닝과는 차이가 있다. 애자일소다의 한 관계자는"강화학습은 어떤 미션에 맞게 딥러닝이 행동하도록 해준다"고 설명했다.

강화학습을 업무용으로 쓰기가 만만치 않다는 일부 인식에 대해 애자일소다는  비즈니스 환경에서 쓰이는데 초점을 맞췄다고 강조한다. 100% 검증한 것은 아니지만, 실제 데이터를 갖고 테스트를 진행해본 결과 기존 머신러닝이나 룰 기반 분석으로는 할 수 없는 것을 구현해 볼만 해졌다는 것이다.

애자일소다가 강화학습 분석 플랫폼을 앞세워 노리는 1차 타깃 시장은 금융권이다. 회사 관계자는 "사기 탐지, 대출 한도 조절 및 보험 클레임 관련 업무에 강화학습 기반 분석 플랫폼을 적용하는 것에 초점을 맞추고 있다"라며 "지금은 금융권이 우선이지만 향후에는 제조 분야 등으로도 확장해 나갈 수 있을 것이다"라고 말했다.

애자일소다는 현재 강화학습 기반 분석 플랫폼 패키지단 개발은 완료했다. 사용자 인터페이스(UI)를 붙이는 단계를 남겨두고 있다. 지금 개발 속도라면 올해 4분기에는 공개가 가능할 것으로 보고 있다. 회사 관계자는 "엔터프라이즈용 강화학습 솔루션이 없어 벤치마킹할 사례가 없다보니 조심스럽게 준비하고 있다. 출시전에 많은 검증도 거칠 것이다"라고 말했다.

회사측에 따르면 공개될 분석 솔루션은 기업 입장에선 일일이 구축하는 방식은 아닐 것 같다.  '클릭 바이 클릭'(Click by Click) 형태로 강화학습을 훈련하고 배치할 수 있는 형태가 될 것이라는 설명이다. 회사 관계자는 "사용자 입장에서 플랫폼을 적용하기 위해 커스터마이징을 할 필요없이 만드는 것을 목표로 하고 있다"라고 말했다.

애자일소다는 강화학습 플랫폼을 공식 출시한 것은 아니지만 레퍼런스는 이미 확보했다. 어느 기업의 경우 현재 이 솔루션을 시범 사용중으로, 기존 머신러닝보다 좋으면 도입하겠다는 입장이라고 한다.

강화학습에 대한 애자일소다의 대담한 베팅이 먹혀들려면 쓰는 사람들이 딥러닝이나 룰 기반 시스템과는 뭔가 다르다는 것을 체감하게 해줄 필요가 있다. 강화학습이 기존 머신러닝이나 딥러닝, 룰 기반 모델보다 좋다는게 100% 검증된 것은 아니지만 큰틀에서 보면 기존 AI로는 할 수 없는 게 강화학습을 통해 가능해질 것이라는게 애자일소다 입장이다.

회사 관계자는 "기존 딥러닝과 강화학습을 같이 쓰는데도 있고, 강화학습만 쓰는 곳도 있다"라며 "지금은 몰라도 중장기적으로는 강화학습이 기존 딥러닝을 대체하는 방향으로 갈 것으로 보고 있다"라고 말했다.

저작권자 © 블로터 무단전재 및 재배포 금지