경영진들이 알아야 할 데이터 분석의 오해와 진실

가 +
가 -

빅데이터 처리나 데이터 분석은 체감할 수 있는 성과가 바로 나오는 성격의 일이 아니다. 시간을 갖고 꾸준하게 해야, 일정 시점이 지나 효과를 느낄 수 있는 경우가 대부분이다. 방향을 잘못 잡으면 시간을 갖고 꾸준히 한다 해도 효과는 없는 경우도 적지 않다는 후문이다. 요약하면 빨리 빨리와 대충대충은 데이터 분석과는 ‘상극의 코드’일 수 있다.

스타벅스코리아 데이터사이언티스트 출신인 차현나씨가 쓴 책 <데이터읽기의 기술>을 보면 데이터 분석 역량은 해당 회사의 기업 문화와 밀접한 관련이 있다. 경영진이 데이터 분석을 어떻게 바라보느냐가 해당 업무의 퍼포먼스를 좌우한다. 잘 모르는 임원이 수시로 참견하고 끼어들면 결과는 그저 그럴 수 밖에 없다.

저자에 따르면 적지 않은 기업 임원들이 빅데이터에 대해 이런저런 착각들을 하고 있는 것 같다.

빅데이터를 경험하지 못한 임원들이 하는 착각 중 하나는 조금이라도 숫자를 다루던 사람을 빅데이터 조직에 발령내면 그 일을 할 수 있겠지라는 것이다. 물론 할 수도 있고 못할 수도 있지만 코딩을 단기간에 습득할 수 있으리라는 것은 보통 희망사항으로 끝난다. 요즘 들어 과거의 영어 학습 시장 만큼, 다양한 데이터 학습 코스를 볼 수 있다. 한달만에 할 수 있다고 이야기하는 코스도 있다. 그러나 그렇게 짧은 시간에 얻을 수 있는 것은 아주 기초적인 배경일 뿐이다.

어릴 때부더 코딩을 하고 대학에서 컴퓨터 사이언스를 전공한 데이터 엔지니어 만큼의 분석을 몇주, 몇달만에 할 수 있다는 말 자체가 성립하기 어렵다. 데이터에 대한 기술 뿐 아니라 경험은 간단하게 따라잡을 수 있는 것이 아니다. 그런 지름길이 있다면 지금의 데이터 사이언티스트 부족 현상을 설명할 수 없다. 몇주 몇달로 할 수 있는 것이라면 내년 이맘때 즈음엔 데이터 엔지니어나 데이터 분석가 부족 현상은 없어져야 한다.

마치 100일만에 영어 정복이 가능하다면 이미 대부분의 사람이 영어를 유창하게 할 수 있어야 하는 것처럼 말이다. 물론 과거보다는 어렵지 않게 접근할 수 있는 툴과 서비스가 많이 나왔다. 코딩의 어려운 부분은 블랙박스로 만들어 뒤에 숨기고 간단한 툴로 분석이 가능하도록 하는 것이다. 몇해전부터 상당히 즐겨 사용하는 툴이 있는데, 잘만 활용하면 아주 까다로운 분석이 아닌 이상 코딩 없이 드래그앤드롭으로 차트를 만들 수 있다.

정말 빅데이터의 가치를 빛낼 수 있는 분석은 여전히 까다롭고 많은 논리적인 과정을 필요로 한다. 빅데이터 분석이 필요치 않은 단순한 분석이라면 이미 기업내 화면으로 조회할 수 있는 대시보드에 완성되어 있을 것이다. 그러나 정말 궁금한 하나의 숫자를 알아내기 위해 몇백, 몇천줄의 코딩이 필요할 수도 있다. 이것을 기존 툴로 해내기는 어렵다.

데이터 분석 후 당연해 보이는 결과가 나오면,  빅데이터를 잘 모르는 많은 임원들은 뻔한거 아니냐?는 식의 반응을 보인다. 천리길도 한걸음부터라고 처음에는 당연한 결과를 도출하고, 시간이 가면서 좀더 통찰력이 있는 결과물을 뽑아 내는게 순서라는 것을 가슴으로 느끼지 못한데 따른 결과다.

데이터 분석을 하는 사람들은 관계자들과 분석 내용을 리뷰할 때 이거 내가 다 알던 건데 뭐가 새롭느냐라는 이야기를 듣는 일이 자주 있다. 실제로는 한번도 데이터로 분석한 적이 없는 내용인데도 그렇다. 빅데이터를 분석했으면 알지 못하던 새로운 걸 찾아내주길 바라는 기업 관계자들이 많다. 돈과 시간과 인력을 들였으니 내가 몰랐던 획기적인 이야이를 짜잔하고 들고 와주길 바라는 마음도 이해가 간다. 그러나 늘 그런 것은 아니지만 데이터로 처음 분석을 시작할 땐 그야말로 상식적인 이야기를 듣게 될 것이다. 지금까지는 감으로 가정으로 알던 내용을 처음으로 데이터로 증명하는 시간이기 때문이다. 보통 그때의 증명은 상식에 대한 증명이 될 가능성이 높다.

데이터 분석을 해보니 임원 본인의 생각과 다른 결과가 나온다면? 이 경우도 환영받지 못할 가능성이 높다. 임원이 데이터 분석의 결과를 인정하지 않으려 할 수 있다는 얘기다.

내 상식이랑 다른데 뭔가 잘못된거 아닌가? 이 말은 데이터를 분석하는 사람들이라면 내가 생각하지 못한 것을 가지고 왔으면 하는 말만큼, 많이 듣는 질문일 것이다. 상식적이지 않은 숫자가 결과로 나왔을 때 실제로 데이터 오류를 발견하는 일도 많다. 데이터를 분석하는 과정에서 흔하게 일어나는 일이다. 그러나 데이터 검증을 마치고 난 뒤 최종적으로 나온 인사이트에 대해서 내 생각과 다르다라고 말하는 경우도 많다. 아이러니하게도 내가 생각하지 못한 것을 가지고 왔으면 하는 말과 내 상식이랑 다른데 잘못된 거 아니냐라는 말을 같은 사람이 하는 경우가 많다. 그 사람은 자신이 듣고 있는 이야기기 이미 정해져 있기 때문이다.