[B2B스타트업] 데이터과학자들의 실험실, 넘버웍스

가 +
가 -

최근 데이터과학과 관련된 시장이 성장하고 있다. 대기업에는 데이터과학 부서를 설립하고 데이터 산업과 관련된 스타트업도 늘어나고 있다. 넘버웍스는 2015년 5월 설립된 스타트업이다. 아직 설립한 지 6개월여 밖에 안 된 이 회사는 이미 여러 고객과 함께 프로젝트를 진행할 정도로 관심을 받고 있다. 하용호 대표는 잘 나가던 대기업을 그만두고 스타트업에 뛰어들었다. 이유가 뭘까.

“6살때부터 컴퓨터를 좋아했어요”

하용호 대표의 아버지는 학교 교사였지만 평소에 기계에 관심이 많은 분이었다. 그 피를 이어받아서일까. 하용호 대표는 6살 무렵 아버지가 사놓은 8비트 컴퓨터를 만지작거리며 컴퓨터에 빠져들게 됐다.

“어렸을 때 피아노 학원을 다녔는데요. 1년 동안 진도가 안 나가서 선생님이 난감해하셨어요. 그런데 컴퓨터 학원은 제가 어머니한테 보내달라고 먼저 졸랐대요. 컴퓨터 학원에서는 별거 아닌 작은 걸 만들어도 제가 신나하면서 공부했다고 하더라고요. 그렇다고 뭔가 엄청나게 결과물을 만들려고 노력을 한 건 아니고요. 그저 컴퓨터를 좋아하고 늘 가까이 했던 거라고 보시면 돼요. 고등학교 때는 기숙사 생활을 해서 개인용 컴퓨터가 없어서요. 그래서 항상 학교 전산실에 있었어요. 그때 웹 사이트 게시판같은 것도 만들어봤어요.”

하용호 대표는 어린시절 로봇이 나오는 만화영화를 보면서 ‘나도 저런 로봇을 만들고 싶다’는 막연한 꿈을 꾸었다. ‘똑똑한 기계’에 대한 동경은 그의 공부 방향에도 영향을 끼쳤다. 모바일, 웹 프로그래머 등으로 진로를 정할 수 있었지만 데이터, 분산처리, 인공지능 등을 더 공부하고 싶었다. 전자과를 선택해 하드웨어와 소프트웨어가 어떻게 결합되는지 배웠고 틈틈이 뇌과학, 자연어 처리, 유전공학 같은 수업도 들었다.

“머신러닝을 공부하려면 많은 분야를 통섭하면서 알아야 한다고 생각해요. 자연스레 인지과학, 통계, 컴퓨터, 논리학, 기호학 등에 관심이 생겼어요.”

2007년 하용호 대표는 첫 직장으로 데이터베이스(DB) 회사에 들어갔다. 당시 컴퓨터 수십대를 엮어 대용량 처리하는 기술에 관심이 높아졌고, DB 회사에서 그러한 연구를 할 수 있다고 들었기 때문이다.

“입사동기들과 사장님을 만나는 첫 시간이었어요. 다른 동기들은 간단히 이름만 소개하는데, 저는 검색엔진 기술을 개발하고 싶다고 혼자 주저리 주저리 떠들었어요. 실제로 입사 후 검색엔진팀이 생겨 합류했어요. 돌이켜보면 그때만큼 행복하게 공부하던 시절이 없었어요. 당시 연구실 동료들은 컴퓨터과학쪽 출신들이 많았고 저는 전자과니깐 이론적인 지식이 뒤처져 있었거든요. 정말 많은 논문을 보고 밤새 공부했고요. 다른 동료들에게 배우면서 성장했던 때였어요. 저는 모르는 걸 알게 됐을 때 기쁨이 크거든요. 배웠던 내용을 실제 제품에 적용할 수 있으니 너무 재밌었죠.”

numberworks_ceo_01

▲하용호 넘버웍스 CEO

하용호 대표는 여러 회사를 거쳐 대형 통신사에 입사했다. 과거 회사에서 직함이 주로 개발자였다면 통신사쪽으로 이직했을 때부터 본격적으로 데이터과학자라는 직함을 갖게 됐다. 통신사에는 사용자수도 많고, 생성되는 데이터도 많았다. 그 덕분에 여러가지 도전적인 실험을 할 수 있었다고 한다. 하지만 3년여 시간을 지나면서 좀 더 다양한 데이터를 접하고 싶다는 마음도 커졌다. 이미 업계에서 데이터과학에 대한 수요가 있다는 것을 알았고, 마침 동료 3명이 함께 회사를 만들자고 제안을 했다. 그렇게 올해 데이터과학자가 모인 스타트업, 넘버웍스가 출범했다.

“내부에 실력 있는 데이터과학자들이 많은 게 넘버웍스의 큰 장점이죠. 데이터과학자끼리 서로 더 좋은 데이터 알고리즘이나, 분석 방법 등을 겨루는’카글‘이란 웹사이트가 있어요. 저희 직원 4명도 이와 비슷하게 일하고 있어요. 모두 데이터과학자이니 서로의 생각이 옳은 건지 아닌지 제안도 해보고 검증받고 있습니다. 넘버웍스는 ‘통찰력’이나 ‘분석보고서’를 제공하는 것이 아니라 구체적으로 매출을 늘릴 수 있는 방법을 제안하면서 경쟁력을 늘리려고 합니다.”

“데이터과학은 프로그래밍과 다른 분야”

데이터과학은 여전히 많은 사람에게 익숙지 않은 개념이다. 특히 분산처리 기술 등과 데이터 과학은 서로 어떤 차이가 무엇일까?

“기존 프로그래밍 업계에서의 결과물은 프로그램으로 나와요. 이때 100번 실행될 기능을 위해 코드 1개를 정교하게 작성해야 하죠. 데이터과학에서는 특정 기능은 한 번만 실행될 수 있어요. 그 한 번을 위해 서로 다른 코드 100개를 작성해야 해요. A 관점에 작성해보고, B 관점에서 작성해보는거예요. 데이터과학의 결과물은 ‘이득’이예요. 반대로 사업에 도움이 되는 결과물이 안 나왔다면, 해당 데이터 프로젝트는 실패한 것이죠. 사업에 도움이 되는 방법이 무엇인지 알아내려면 데이터를 계속 다르게 바라보며 시행착오를 반복해야 하고요. 데이터과학자들은 시행착오와 재실험하는 주기를 빠르게 만들려고 노력합니다.”

더 읽어보세요!

현재 데이터과학을 가장 많이 활용하는 곳이 e커머스 업체의 ‘추천 기능’이다. 여성 고객에게는 의류 상품 광고를 보여주고 남성 고객에게는 자동차 관련 광고를 보여주는 식이다. 한 제품을 장바구니로 선택하면 비슷한 경쟁 제품이나 같이 활용할 수 있는 제품을 보여주기도 한다. 하지만 이에 대한 추천 정확도는 낮을 수 있다. 모든 20대 여성이라고 꼭 의류를 좋아한다고 보장할 수 없기 때문이다.

기존 추천 기술은 대부분 아마존이 사용한다던 ‘협업 필터링’을 활용해 사용자 성향을 분석한다. 넘버웍스는 단순히 사용자를 분류하는 것에서 그치지 않고 각 개인의 특성을 알아내는 데 집중하고 있다. 예를 들어 넘버웍스는 홈페이지 첫페이지 화면 모습과 카테고리 정렬을 사용자마다 다르게 보여주는 기술을 제공하고 있다. 하용호 대표는 “실제로 이 방식을 활용해서 e커머스 매출이 20~30% 올랐다는 걸 확인했다”라며 “특정 사용자는 가격 민감도가 얼마나 되는지, 금요일 몇 시부터는 충동구매할 요소가 많다든지 등을 알아내고 이를 화면에 적용하려고 하고 있다”라고 설명했다. 넘버웍스는 앞으로 기계 스스로 학습해 개인 맞춤화 기능 알아서 제공하는 기술 개발에 힘쓸 예정이다.

“데이터 가치를 세상에 증명해보고 싶어”

넘버웍스는 현재 e커머스 고객들과 주로 일하고 있다. 고객과 일하는 방식은 이전과는 다르다고 한다. 과거에는 고객이 분석을 요청하면 몇 달 뒤 원하는 결과를 얻게 된다. 그 전에 고객과 분석 업체가 만날 때는 중간 점검을 할 때 정도다. 하지만 데이터과학 분야에서는 고객과 ‘배너광고 클릭수를 높이기 위한 방법’을 알기로 결정했다면 데이터과학 업체와 고객 간 의사소통이 끊임없이 이뤄진다. 사용자 그룹도 바꿔보고 알고리즘도 바꿔보는 등 계속 변수를 바꿔봐야하는데, 여기서 고객의 의견을 들어봐야 하기 때문이다. 가설을 세우고, 실험하고, 수정하는 과정이 짧을수록 결과물도 좋다. 넘버웍스는 고객과의 활발한 의사소통을 강조하면서 사업을 진행하고 있다.

numberworks_ceo_02

▲넘버웍스 홈페이지

국내에 데이터과학자들은 흔치 않다. 특히 현재 데이터과학자들은 석·박사 과정을 마친 고학력자가 많다. 그럼 데이터과학자가 되기 위해서 학위가 꼭 필요할까?

“석사과정을 거치면 도움이 되긴 해요. 데이터‘과학’이라고 부르잖아요? 과학은 가설을 설정하고, 수정하고, 실험하는 과정을 거치는데요. 이러한 과정은 석사 논문을 쓰면서 연습을 할 수 있어요. 통계같은 수학적 지식은 긴 시간을 거쳐 공부해야 하거든요. 다시말해 학부 수준을 뛰어넘어야 하는데 회사를 다니면서 남는 시간에 공부하기 좀 부담스럽죠. 데이터과학을 직업으로 활용하려면 결과물을 비전문가에게 잘 설명하는 연습도 필요합니다. 이러한 자질도 석사 생활 때 세미나 등을 여러 발표의 기회에서 늘릴 수 있어요. 현재 데이터과학과 관련된 논문, 오픈소스 기술 등도 전부 영어 기반이라 영어 실력도 중요해요.”

넘버웍스는 우선 e커머스와 금융쪽 고객을 찾아 매출을 늘릴 예정이다. 장기적으로는 다양한 산업 고객을 만나 입지를 넓히고 비전문가가 이용하기 쉬운 데이터 제품개발에 힘쓸 계획이다.

“사실 저희 넘버웍스 직원들 모두 데이터 ‘덕후’들이에요. 그래서 ‘이런 데이터는 이전에 못 접한 데이터인데?’라는 생각이 들 때면 호기심이 확 커지죠. 지금은 회사 규모를 어떻게 키우겠다는 목표보다는, 더 많은 데이터를 다루고 더 많은 결과물을 내고 싶다는 욕심이 큽니다. 돈을 많이 벌고 안정적인 업무 환경을 원했다면 이전 회사를 나올 이유가 없었겠죠. 앞으로 다양한 경험을 듣고, 원하는 걸 자유롭게 만들고 싶어요. 데이터의 가치를 세상에 증명해보고 싶습니다.”