카카오 “딥러닝 기술 상향평준화, 어떤 서비스 만드느냐가 중요”

카카오는 카카오톡의 강점을 최대한 활용할 계획이다.

가 +
가 -

인공지능(AI) 기술이 개방성을 중시하면서 기술적 수준은 상향평준화되고 있다. 학계와 업계 모두 최신 AI 연구 기술을 재현 가능한 수준으로 공개하는 추세다. 구글과 마이크로소프트는 ‘AI의 민주화’를 말하며 자사의 기술을 타사에서 쓸 수 있도록 오픈 API 형태로 개방하고 있다. 국내 기업들도 마찬가지다. 네이버와 카카오 모두 AI 관련 API를 공개하고 있다. 이에 따라 기술 자체보다는 기술을 어떻게 적용할지에 대해 초점이 맞춰지고 있다.

카카오는 5월17일 서울 한남동 사옥에서 AI 기술 기자간담회를 열고 카카오의 시각 엔진과 이에 이를 활용한 자사 서비스를 소개했다. 이날 발표에 나선 최동진 카카오 AI부문 멀티미디어처리파트 파트장은 “딥러닝 기술은 이미 상향평준화 됐으며 중요한 점은 같은 기술을 이용해서 어떤 서비스를 만드냐다”라고 말했다. 기술이 상향평준화된 상황에서 기술 자체보다는 기술을 어떻게 이용자에게 와닿는 서비스로 풀어낼 것인지가 중요하다는 설명이다.

최동진 카카오 AI부문 멀티미디어처리파트 파트장

 

카카오의 시각엔진 기반 서비스

시각엔진 혹은 컴퓨터비전이라고 불리는 기술은 사람의 시각 기능을 기계로 구현해 영상을 이해하는 기술이다. 쉽게 말해 컴퓨터의 눈 역할을 하는 AI 기술이다. 딥러닝 기술을 기반으로 컴퓨터가 개와 고양이의 이미지를 학습해 구분해내는 사례가 대표적이다. 컴퓨터비전은 사물이나 데이터를 군집화하고 분류해 컴퓨터가 인간처럼 판단하고 학습할 수 있도록 하는 딥러닝 기술에 기반한다. 가공된 데이터 세트를 던져주면 컴퓨터가 스스로 학습하는 방식이다. 이를 바탕으로 컴퓨터 비전은 비약적인 발전을 이뤘다. 특정 이미지를 주고 어떤 사물인지 판단하는 테스트에서 사람은 5%의 오답률을 보이지만, AI의 오답률은 3%대로 낮아졌다.

카카오는 이런 시각엔진을 바탕으로 다양한 서비스를 내놓고 있다. 카카오의 시각엔진 기술과 서비스는 ▲이미지 분류 ▲객체 검출 ▲유사 이미지 ▲얼굴 ▲스마트 썸네일 등 크게 5가지로 나뉜다. 먼저 이미지 분류의 경우 개와 고양이를 구분하듯 다양한 이미지를 분류해주는 기술이다. 대표적인 서비스로는 2016년 출시된 ‘꽃검색’이 있다. ‘다음’ 앱을 통해 서비스되는 꽃검색은 1천여종의 꽃을 인식하고 95%의 정확도를 보인다. 또 검색에서 성인 이미지를 걸러내는 데도 쓰인다. 과거엔 색 기반으로 이미지 분류가 이뤄져 씨름 선수나 스모 선수 사진이 성인 콘텐츠로 분류되기도 했지만 최근엔 딥러닝을 기반으로 하고 있기 때문에 세밀한 분류가 가능하다.

객체 검출은 영상과 이미지를 분석해 어떤 사물이 있고 해당 사물이 어디에 위치해 있는지 자동으로 찾는 기술이다. 예를 들어 지도상의 실제 거리 모습을 보여주는 다음 로드뷰 서비스의 경우 노출되면 안 되는 차량 번호판이나 사람 얼굴 등에 객체 검출 기술을 적용해 자동으로 흐릿하게 처리할 수 있도록 한다. 카카오 측은 기술 도입 전과 비교해 90%의 작업량 감소 효과를 얻었다고 밝혔다. 유사 이미지 검색 기술에는 비슷한 이미지끼리 서로 뭉치도록 학습하는 메트릭 러닝 기술과 수십억장의 이미지에서 가장 가까운 수십장의 이미지를 찾는 검색 기술이 들어간다. 카카오톡에서 주고 받은 이미지를 길게 누르면 유사 이미지를 30ms 이내에 검색할 수 있는 서비스가 지난해부터 적용됐다.

시각엔진을 적용해 이미지를 자동으로 보기 좋게 잘라주는 ‘스마트 썸네일’ 기술

또 이미지나 영상에서 사람 얼굴을 인식하고 얼굴의 특징점을 검출하는 기술이 있다. 눈, 눈썹, 코, 입 등의 특징점을 검출하고 얼굴의 각도나 방향, 성별과 나이까지 읽어낸다. 이 기술은 카카오톡 치즈 등에 적용돼 얼굴 위에 다양한 스티커 필터를 구현하는 데 사용된다. 스마트 썸네일은 시각엔진을 활용해 가장 보기 좋은 형태로 이미지 썸네일을 자동 생성하는 기술이다. 과거엔 이미지 크기가 맞지 않아 썸네일을 보여줄 때 사람 얼굴이 엉뚱하게 잘려져 있는 경우를 볼 수 있었는데, 현재 카카오 내 모든 서비스는 스마트 썸네일을 통해 자동으로 보기 좋은 썸네일을 생성해준다.

 

향후 서비스 계획

카카오는 시각엔진의 객체 검출, 이미지 분류 기술을 활용해 올해 안에 유사 상품 검색 기능을 도입할 예정이다. 이미지 안의 상품을 검색하고 바로 구매까지 할 수 있도록 서비스를 구현할 예정이다. 또 유명인 얼굴인식 시스템을 구축해 포털 다음 등에 적용할 계획이다. 유명인의 사진에 자동으로 태그를 생성해 동명이인을 잘못 구별하는 걸 방지하거나 인물정보를 자동으로 수정하고 융명인 관련 콘텐츠를 찾아내는 데 활용할 예정이다. 카카오 측은 언론사에서 동명이인의 사진을 잘못 게재하는 경우에 대해서도 해당 기술을 적용해 오보를 사전에 방지하는 등 다양한 활용방안을 고민하고 있다고 밝혔다.

‘카카오 헤어샵’ 가상 염색 서비스

올 7월에는 미용실 예약 서비스 ‘카카오 헤어샵’에 가상 염색 서비스가 도입된다. 가상의 이미지를 실제처럼 생성하는 ‘생성적 적대 신경망(GAN)’ 기술을 적용해 어울리는 염색 컬러를 가상으로 경험해볼 수 있다. 카카오 측은 기존 상용 서비스들은 GAN 기술이 적용되지 않아 염색이 어색하게 적용되는 경우가 많은 반면, 자사 서비스는 더욱 자연스러운 모습을 보일 거라고 자신했다. 이밖에도 카카오는 이용자에게 높은 가치와 유용함을 제공할 수 있는 다양한 시각 엔진 중심 신규 서비스를 선보일 계획이라고 밝혔다. 또 ‘카카오 미니’ 등의 하드웨어 제품에도 시각 엔진을 붙이는 테스트를 진행 중이라고 전했다.

타사와 서비스 차별화에 대해선 자신들의 강점인 카카오톡을 최대한 활용해 이용자 접점이 높은 서비스를 만들어내겠다는 계획이다. 카카오 측은 각 업체별로 자신의 서비스에 특화된 방향으로 기술을 붙이는 경향이 있다며, 카카오는 카카오톡을 활용해 이용자에 편리한 AI 기반 서비스들을 서비스를 내놓겠다고 밝혔다.

네티즌의견(총 0개)