인공지능(AI)은 마법처럼 여겨지곤 한다. "충분히 첨단화된 기술은 마법과 구별할 수 없다"는 영국 SF 소설가이자 미래학자인 아서 찰스 클라크의 말처럼 AI 기술은 인간을 압도하는 신비로운 무언가로 묘사되곤 한다. 알파고 쇼크 이후 이 같은 경향은 더욱더 짙어졌다. 그러나 현실의 AI는 쓸모가 많지만 만능은 아니다. 특히, 데이터라는 원료가 없으면 작동하지 않는다.

"AI 알고리즘이 가진 제약은 데이터 주도의 AI라는 점이다. 비 데이터 주도의 AI는 존재하지 않기 때문에 해결하고자 하는 문제를 AI 통해 풀려고 할 때는 디지털 데이터가 충분한지가 중요하다. 그렇지 않으면 AI를 통해 문제를 해결할 수 없다. AI는 분명히 유용한 도구지만, 적재적소에 사용돼야 효과를 발휘한다."

쑨민 애피어 최고 AI 과학자는 데이터의 중요성을 강조했다. 우리가 흔히 AI라고 일컫는 머신러닝은 컴퓨터가 스스로 데이터를 통해 학습하고 규칙을 일반화해 예측하도록 하는 기술이다. 좁은 영역에서 문제를 해결하는 도구로 사용되고 있으며, 데이터가 필수적이다. 디지털 마케팅은 AI를 통해 문제를 풀 수 있는 분야 중 하나다. 공해에 가까운 무분별한 광고를 이용자 맞춤형으로 가치 있게 전달해줄 수 있다. 역시 기반이 되는 건 데이터다.

▲  | 쑨민 애피어 최고 AI 과학자
▲ | 쑨민 애피어 최고 AI 과학자

대규모 데이터를 얻을 수 있는 분야


애피어는 디지털 마케팅 솔루션 제공에 주력하고 있는 AI 기술 기업이다. 2012년 대만에서 설립된 이후 현재 아시아 지역 14개 도시에 지사를 두고 있다. 현재 1천여 글로벌 브랜드 및 에이전시에 서비스를 제공하고 있으며, 세쿼이아, 소프트뱅크, 라인 등을 포함한 다수의 투자사로부터 총 1억6200만달러(약 1900억원)의 자금을 유치했다.

쑨민 최고 AI 과학자가 마케팅 분야에 뛰어든 이유는 데이터에 있다. 쑨민 최고 AI 과학자는 컴퓨터 비전, 자연어 처리(NLP), 딥러닝, 강화학습 등을 전문적으로 연구했다. 앤드류 응, 페이페이 리, 실비오 사바레지 등 AI 분야 리더들과 함께 연구를 진행한 바 있으며, 워싱턴 대학교에서 컴퓨터 과학 및 공학 박사 취득 후 연구원으로 근무했다. 이후 국립 칭화대 전기공학부 부교수를 거쳐 지난 2017년 애피어에 합류했다.

2009년에는 페이페이 리가 이끄는 이미지넷 프로젝트에 크라우드소싱 아이디어를 제공했다. 이미지넷은 방대한 양의 이미지 분류 데이터베이스를 바탕으로 딥러닝에 크게 기여한 프로젝트다. 데이터는 AI가 학습할 수 있는 방식으로 가공돼야 하는데 온라인으로 연결된 불특정 다수의 사람을 통해 데이터 전처리 작업을 맡기는 크라우드소싱 방식으로 방대한 가공 데이터를 모을 수 있었다.

쑨민 최고 AI 과학자는 로봇 오퍼레이팅 시스템(ROS) 및 마이크로소프트 키넥트의 인간 자세 추정 시스템의 초기 개발자이기도 하다. AI 업계에서 굵직한 경력을 가진 그는 디지털 마케팅 분야에서 데이터를 활용한 AI 비즈니스의 가능성을 보았다.

쑨민 최고 AI 과학자는 "두 프로젝트를 참여하면서 배운 교훈은 데이터의 중요성"이라며 "충분한 양과 적절한 분포도를 가진 데이터를 확보하고, 좋은 머신러닝 모델을 갖춰 이를 결합했을 때 최적의 솔루션이 나온다"라고 말했다. 이어 "데이터를 쉽게 얻을 수 있고 대규모 데이터 얻을 수 있는 분야가 많지 않은데 디지털 마케팅은 대규모 데이터를 얻을 수 있는 분야고, 머신러닝을 적용했을 때 비즈니스적 영향력이 커 성공할 수 있는 사례가 있는 곳이라 생각돼 합류를 결정했다"라고 밝혔다.

디지털 마케팅에 활용되는 언어 데이터


애피어에서 쑨민 최고 AI 과학자의 역할은 크게 세 가지다. 기존 제품에 최신 딥러닝 기술을 접목해 성능을 높이는 일, 디지털 마케팅 분야에서 기업들이 겪는 애로사항을 파악해 머신러닝을 통해 극복할 수 있는 문제점을 식별하고 대응하는 것, 머신러닝 팀을 이끌면서 애피어의 장기적 방향 제시 및 이에 맞는 AI 기술 개발 등이다.

특히 자연어 데이터 분석에 공을 들이고 있다. NLP 기술을 활용해 웹사이트나 앱상에서 비구조화된 언어를 분석하고 이를 디지털 마케팅에 활용하는 식이다. 기본적인 내용, 키워드 관련성, 문장의 분위기 및 어조 등을 파악해 신호를 추출하고 디지털 마케팅 모델에 적용한다.

애피어의 ‘아익슨(AIXON)’에는 이 같은 NLP 기술이 적용됐다. 데이터에 기반해 고객에 대한 이해를 높일 수 있도록 지원하는 솔루션인 아익슨은 온라인상의 키워드를 추출해 사람들의 관심사항을 파악하고 특정 이용자들의 디지털 흔적을 분석할 수 있도록 돕는다. 애피어는 현재 한국을 비롯해 일본, 대만, 싱가폴, 동남아 등 12개 국가에 서비스를 제공 중이다.

▲  | 쑨민 애피어 최고 AI 과학자는 언어, 이미지 등 비구조화 데이터를 활용한 디지털 마케팅 솔루션 개발에 주력하고 있다.
▲ | 쑨민 애피어 최고 AI 과학자는 언어, 이미지 등 비구조화 데이터를 활용한 디지털 마케팅 솔루션 개발에 주력하고 있다.

쑨민 최고 AI 과학자는 "이 같은 서비스를 위해 해당 국가 언어의 말뭉치 데이터셋을 토대로 모델을 사전 훈련해야 한다"라며, "지난 2년간 한 활동이 12개국의 언어에 대한 독점 데이터 구축이었으며, 디지털 마케팅에 사용할 수 있는 데이터셋을 만들고 있다"라고 말했다.

이어 "언어마다 새로운 표현이 생겨나기 때문에 한 번의 모델 구축으로 끝나는 게 아닌 재학습을 통해 언어 베이스를 변화시켜야 하고 이를 안정적으로 운영하기 위해 많은 노력을 기울이고 있다"라고 밝혔다. 또 언어 데이터에 담긴 편향성을 제거하고 다른 언어로 확대 전개하는 일이 중요하다고 짚었다.

광고에 대한 피로감 해소에 주력


광고는 온라인 공간을 지탱해주는 기반이 되지만, 이용자들은 무분별한 광고 노출에 피로감을 호소하고 있다. 광고 제거 도구가 성행하고 있으며, 애플 등의 거대 테크 기업들도 광고 추적 제한 기능을 내놓고 있다. 원치 않는 광고가 지속해서 따라다니는 일이 사용자 경험을 해친다는 판단에서다.

이에 대해 쑨민 최고 AI 과학자는 "관심도 없는 것에 대해 광고가 계속 나오면 피로감을 느낄 것"이라며, "이용자가 보다 나은 경험을 하는 것에 대해 중요하게 생각하고, 이런 차원에서 애플의 광고 추적 제한 기능은 합리적이라고 생각한다"라고 말했다.

애피어는 이용자의 광고 경험을 개선하기 위해 사용자별로 다른 알고리즘 조합을 사용한다. 최종 사용자(엔드 유저) 그룹별로 맞춤화된 서비스를 제공하기 위해 알고리즘 조정 작업을 거치고 있다. 쑨민 최고 AI 과학자는 최종 사용자 경험이 개선됐을 때 좋은 성과가 나오는 모습을 확인할 수 있었다고 설명했다.

예를 들어 방문 웹사이트 정보를 바탕으로 페이스북 등에 뜨는 리타겟팅 광고는 사용자 관심사 기반으로 광고를 제시해 구매 확률을 높이는 기법으로 알려졌지만, 자신을 따라다니는 광고를 선호하지 않는 이용자도 상당수다.

"단기간에 이용자 성향을 빠르게 식별해 리타겟팅 광고를 선호하지 않는 사람에게는 리타겟팅하지 않는 게 중요하다."

쑨민 최고 AI 과학자는 리타겟팅 광고를 클릭하지 않는 이용자를 파악해 해당 그룹에 대한 알고리즘 재조정을 거친다고 밝혔다. 이를 통해 사용자 경험 개선뿐만 아니라 사업자 입장에서도 광고비를 아낄 수 있다는 설명이다. 또 "디지털 마케팅이 누군가의 권리를 빼앗지는 않지만 사용자 경험을 중요하게 생각한다"라며, "이용자에게 피로감을 주는 것이 있다면 멈춰야 한다"라고도 말했다.

쑨민 최고 AI 과학자는 "막대한 데이터를 바탕으로 최신 AI 기술을 적용한 디지털 마케팅 솔루션은 고객 만족도가 높고, 만족도가 높으면 데이터가 늘고, 데이터가 늘면 성능이 개선되는 선순환 구조가 만들어지며, 이 같은 부분이 애피어가 가진 경쟁력이자 차별점"이라고 밝혔다.

저작권자 © 블로터 무단전재 및 재배포 금지