트렌드

[넘버스]코로나 시대 신종 부업 ‘데이터 라벨러’, 얼마나 버나

2020.09.04

숫자들(Numbers)로 기업과 경제, 기술을 해석해 보겠습니다. 숫자는 정보의 원천입니다. 정보는 누구에게나 공개되어 있고 숫자도 누구나 볼 수 있지만, 그 뒤에 숨어 있는 진실을 보는 눈은 누구나 가지고 있는 것이 아닙니다. 누구나 공감할 수 있도록 숫자 이야기를 <넘버스>로 쉽게 풀어보겠습니다.

출처=크라우드웍스

AI 학습 데이터 플랫폼 기업 크라우드웍스가 최근 흥미로운 조사 결과를 발표했습니다. 회원 2600여명을 대상으로 실시한 ‘데이터 라벨러 현황 분석’ 설문조사에서 응답자의 절반 이상(54.3%)이 현재 직장인(43.8%)과 자영업자(10.5%)라고 응답한 건데요. 의외로 많은 사람이 부업으로 데이터 라벨링을 하고 있었던 겁니다.

부업은 본업의 벌이가 충분하지 않을 때 선택할 수 있는 추가적인 소득 확보원입니다. 최근에는 코로나19가 장기화되며 소득 불안정성이 커지자 부업에 눈을 돌리는 사람들도 많아지는 추세죠. 인크루트가 올해 6월 발표한 ‘투잡 구직 현황’을 보면 응답자의 45.1%가 ‘코로나19로 본업의 수익이 줄어 투잡을 선택했다’고 답했습니다.

실제로 통계청이 발표한 ‘2020년 2분기 가계 동향 조사’에서는 소득 하위 20%의 근로소득이 상위 20%보다 4.5배 더 줄었다는 결과가 나와 있습니다. 조금 특수한 상황이지만, 코로나 확산세가 절정이었던 지난 3월에는 모 항공사 같은 대기업 직원들도 무급휴직에 들어가거나 임원들은 급여의 60%를 반납하기도 했죠. 핵심은 이제 계층과 빈부를 넘어 누구나 언제든 경제적 불안에 놓일 수 있다는 걱정이 아무래도 사람들이 부업에 더 관심을 갖게끔 만든 이유일 것입니다.

그럼 대표적인 부업에는 어떤 일들이 있을까요? 전통의 대리운전과, 최근 수요가 급증한 라이더(배달기사)가 떠오릅니다. 물론 이를 전업으로 하는 분들도 많지만 파트타임 근무를 유연하게 할 수 있다는 점에서 기본적으로 좋은 부업의 조건을 갖고 있습니다. 여기에 지난달 23일 배달대행업체 ‘바로고’는 배달 수행 건수가 1년 전에 비해 158% 폭증했다고 밝혔는데요. 최근 사회적 거리두기가 일반화되며 비대면 배달 수요가 늘어나고 있는 까닭입니다. 다만 이들 일에는 장벽이 있습니다. 대부분 면허가 필요하고, 근무 중 사고 발생률도 높은 편입니다.

최근 라이더 5000명 충원을 밝힌 바로고 /사진=바로고

데이터 라벨링 부업, 왜 주목받지?

결국 수입은 조금 적어도 상대적으로 안전하고 누구나 쉽게 할 수 있는 부업에 대한 관심이 높아지고 있는데요. 예전에는 우스갯말로 ‘인형 눈 붙이기’ 부업을 한다고 했는데, 최근에는 ‘디지털판 인형 눈 붙이기 부업’이란 별명으로 데이터 라벨링이 주목받고 있습니다. 특히 올해 라벨러 수요가 높아지고 있는 이유는 배달과 달리 코로나19 때문이 아닙니다. 인공지능(AI)의 발달과 국내 AI 역량을 발전시키고자 하는 정부의 의지가 시기적절하게 들어맞은 결과물이거든요.

정부는 올해 ‘디지털 뉴딜’의 핵심 사업으로 ‘데이터 댐’ 구축 사업을 들었습니다. 데이터 댐은 공공과 민간의 네트워크에서 생성되는 데이터들을 모으고, 이를 가공·활용하도록 유도함으로써 인공지능 고도화 및 일자리 창출이라는 효과를 동시에 얻고자 하는 사업입니다.

프로젝트 규모도 적지 않습니다. 관련 사업 추진을 위해 올해 총 4991억원의 추경이 편성됐고, 데이터 댐 7개 분야 중 ‘AI 학습용 데이터 구축사업’에만 예산의 59%인 2925억원이 투입될 예정입니다. 사실상 학습용 데이터 구축을 위한 데이터 댐이라고 봐도 무방할 정도군요.

이 예산이 투입되는 정부 과제에는 총 1920개 기업과 기관이 신청하고 4.2대 1의 높은 경쟁률을 보인 끝에 최종 584곳이 선정됐습니다. 그리고 앞으로 이들 기업에 필요한 인력들이 바로 ‘데이터 라벨러’들입니다. 본격적인 과제 수행이 시작된 뒤부터는 라벨러 수요도 전보다 더 늘어날 수밖에 없음을 예측해볼 수 있습니다. 정부 역시 데이터 댐 사업으로 약 10만개의 신규 일자리가 창출될 것으로 기대하고 있습니다.

인형 눈 붙이기는 첨단 산업에서도 계속된다(?) /사진=픽사베이

인공지능과 사람이 상생하는 일

그럼 데이터 라벨링은 대체 무슨 일을 하냐고요? 간단하게 설명하겠습니다. 바로 사람이 인공지능을 위한 학습 자료를 만들어 주는 일입니다.

어린 시절 우리는 그림책에 그려진 동물과 그 이름을 보고, 혹은 그걸 읽어주는 부모님을 통해 동물의 개념을 학습했습니다. 인공지능이 지식을 습득하는 법도 다르지 않습니다. 만약 호랑이가 찍힌 사진이 있다면, 사람이 사진에 호랑이가 나온 부분을 표시한 뒤 ‘호랑이’라는 라벨(이름표)를 붙여주면 인공지능이 라벨링 된 호랑이 사진들의 특징을 반복 학습하며 호랑이를 인지할 수 있게 되는 것입니다.

그런데 이 자료는 그 누구도 아닌 사람이 직접 만들어야 합니다. 사람에겐 단순한 일이지만 인공지능이 결코 혼자서 할 수 없는 일이죠. 게다가 인공지능은 양질의 학습 데이터가 많이 주어질수록 정확도가 높아집니다. 정부가 국내 인공지능 수준을 끌어올린다며 학습용 데이터 구축에 막대한 예산을 쏟아붓는 이유도 이 때문입니다.

국내 뿐 아니라 세계 시장도 빠르게 성장할 것으로 보입니다. 글로벌 시장조사기관들에 따르면 향후 6년간 데이터 라벨링 시장은 연평균 28.4%씩 성장해 2026년에는 4조원 이상의 규모를 형성할 것으로 예측됩니다.

데이터 라벨링도 종류는 다양하지만 대부분 기본적인 인지 능력과 컴퓨터 사용 능력만 있다면 언제 어디서든 누구나 쉽게 할 수 있는 일입니다. 특히나 요즘처럼 부업의 수요는 많은데 일자리가 한정된 상황에선 더욱 주목받을 수 밖에 없는 거죠.

 

데이터 라벨링 작업 주기 및 평균 작업 시간 /자료=크라우드웍스

최저시급 이상은 벌 수 있다?

또 부업을 선택함에 있어 중요한 건 역시 수익입니다. 데이터 라벨링은 과연 얼마나 벌 수 있을까요? 보고서를 발간한 크라우드웍스 측에 직접 문의해봤습니다.

Q. 보고서에 나온 것처럼 평균 2시간 일을 한다고 쳤을 때 평균 수익은 얼마인가요?

A. 고정적이진 않습니다. 우선 작업할 수 있는 프로젝트가 있어야 하고, 작업 난이도에 따라서도 보상의 차이가 크기 때문입니다. 그래서 작업자들도 고정된 시간에 근무하기보단 상시로 접속해 조금씩 일하는 경우가 많아요.

일례로 프로젝트 하나당 2시간 미만 작업에 4만원까지 버는 것도 있지만 일부이고, 프로젝트 성격에 따라 작업자의 요건도 달라집니다. 가령 ‘토익 몇 점 이상인 사람’ 혹은 어떤 서베이의 경우 특정 차량을 보유한 사람만이 참여할 수 있는 프로젝트도 있습니다. 그래도 회사 방침상 숙련자 기준으로 최저시급 이상은 보장하는 쪽으로 설계하고 있죠.

Q. 코로나19 확산 이후 작업자 수도 늘어났나요?

A. 지난해까지는 20~30대 여성이 전체 작업자의 70% 이상이었다면 코로나19가 발생한 올해 초 이후부터는 30대 남성분들의 비중이 증가했습니다. 또 작업자가 늘어나며 프로젝트 공급보다 수요가 많아졌고, 기업들이 요구하는 데이터 난이도도 높아지고 있었는데요. 최근 정부의 데이터바우처 사업 등을 통해 이달 초부터 프로젝트 공급이 다시 늘고 있는 상황입니다.

부업으로의 적합성은 OK, 직업으로는?

아마 수익이 충분한 수준인가에 대해선 개인의 기대치에 따라 평가가 조금 갈릴 것 같습니다. 어쨌든 안전하고 시공간의 제약이 없으며, 육체노동이 수반되지 않는 환경에서 최저시급 이상의 벌이가 보장된다면, 수익이 높지만 다소 위험한 부업보다는 괜찮은 구석도 분명 있겠죠. 게다가 비대면이 강조되는 코로나 시국에서는 완전한 비대면 부업인 데이터 라벨링의 가치가 잠재적으로 더 높게 평가될지도 모릅니다.

끝으로 이런 생각도 해볼 수 있습니다. ‘데이터 라벨링은 부업을 넘어 직업이 될 수도 있을까?’. 이는 과거 AI 스타트업 ‘슈퍼브에이아이’를 취재했을 때도 긍정적인 답변을 얻었던 질문인데요. 크라우드웍스 역시 데이터 라벨러가 직업으로 확장될 수 있는 가능성이 충분하다고 답했습니다.

데이터 라벨링은 처음에는 데이터를 수집하고 가공하는 ‘작업자’로 시작했다가 충분한 경험과 내부 평가를 통과한 사람에게는 라벨링 결과를 평가하는 ‘검수자’의 역할이 주어지게 됩니다. 그리고 검수자가 된 후부터는 처리할 수 있는 작업량이 대폭 늘어나므로 수입도 크게 증가한다고 하는데요. 현재 데이터 라벨링으로 고소득을 올리고 있는 사람들도 대부분이 검수자라고 합니다. 또 이들 가운데 우수한 사람들은 계약직 직원으로 채용하고 있다고 하네요.

코로나19로 모두가 힘든 상황이지만 생존을 위한 수단은 다양합니다. 그 안에서 또 누군가는 새로운 기회를 포착하기도 하겠죠. 정부에서도 데이터 라벨링처럼 산업 발전에 기여하며 수익 창출도 가능한 일자리들을 앞으로 더 많이 발굴해주었으면 하는 바람입니다.

sugyo@bloter.net

더 쉽고, 알차게 쓰겠습니다.