“공공기관, 데이터 활용부터 시작하자”

가 +
가 -

지난 4월26일 한국정보화진흥원은 빅데이터 분석을 기반으로 사회변화와 환경을 예측해 범정부 차원에서 국정운영 전략을 세우겠다며 ‘빅데이터 국가전략 포럼’을 발족했다. 빅데이터가 새로운 산업 이슈로 떠오르고, 미국과 영국을 비롯한 해외 정부들이 잇따라 빅데이터 관련 조직을 세우면서 투자하는 모습을 보이는 행보에 합류한 것이다. 한국전자통신연구원(ETRI), 과학기술정책연구원, IBM, SAS, 그루터, 솔트룩스를 비롯한 국내 빅데이터 관련기관과 전문기업 40여곳이 참여했다.

업계에선 빅데이터 국가전략포럼 등장에 바로 우려의 시선을 보냈다. 국내서 빅데이터에 대한 정의가 제대로 합의도 되지 않은 상태에서, 참여한 기업들만의 정부 프로젝트 따먹기가 이뤄지는 게 아닌가 하는 생각에서다. 여기에 빅데이터에 대한 가치는 분석외 처리 기술 분야 등 다양하게 있는데, 정부 기관마저 과도하게 ‘분석’ 중심으로 빅데이터를 받아들이고 있는게 아닌가 하는 걱정도 있었다.

세간의 이런 걱정에 대해 김현곤 한국정보화진흥원 국가정보화기획단장은 ‘걱정할 필요 없다’라고 못박았다. “데이터 양과 모습만 가지고 빅데이터를 말할 수 있는 건 아닙니다. 지금까지 빅데이터의 요건을 설명한 자료는 너무 많이 나왔습니다. 각 요건을 충족하지 않는 데이터는 빅데이터가 아닐까요? 빅데이터는 데이터 형태를 규정짓기 위해 나온 단어가 아닙니다. 기존 방식과는 다르게 데이터를 살펴보자는 사회 현상을 나타내는 말입니다.”  김현곤 단장은 빅데이터에 대해 진지하게 검토했으며 분석이 아니라 처리하는 과정에도 신경을 썼다고 자신했다. 이 모든 고민 끝에 빅데이터 국가전락포럼을 발족했다는 것이다.

빅데이터 국가전략포럼은 속칭 가트너가 정의한 3V(크기, 속도, 다양성)로만 빅데이터를 바라보지 않았다. 포럼을 발족하면서 김현곤 단장은 빅데이터를 어떻게 바라볼 것인지에 대한 고민을 가장 먼저 했다. 기존에 나와있는 조건으로만 빅데이터를 설명하자니 관련 기술이나 인력을 포함해 함께 설명하기 힘들었고, 왠지 빅데이터라는 틀을 한정 짓는 느낌이라 적합하지 않다는 생각에서다.

“결국 빅데이터를 하나의 개념이 아닌 자원, 기술, 인력으로 나누어 살펴보기로 했습니다. 효과적으로 데이터를 활용하기 위해선 잘 정리된 데이터 자원과 이 데이터를 가공하고 분석처리하는 기술, 여기서 의미를 찾아낼 수 있는 인력이 필요하더군요”

빅데이터를 정의하는 조건을 정립하는 단계서 벗어나고 보니, 국내에 ‘빅데이터가 있다, 없다’라는 식의 논쟁은 포럼에게 중요하게 다가오지 않았다. ‘빅데이터’가 아닌 ‘데이터’가 주가 된 탓이다. 오히려 활용할 수 있는 데이터를 발견하고 이와 관련된 새로운 프로세스를 이해하고, 데이터 과학자를 키울 수 있는 환경 마련이 더 시급한 것으로 파악됐다.

그 다음 준비는 자연스럽게 환경 마련으로 이어졌다. 포럼이 발족된지 한 달이 채 안 됐지만, 정부기관 데이터 수집한 뒤 이를 민간에게 공개하고, 활용할 수 있는 방안 준비 작업에 들어갔다. 정부기관이 갖고 있는 데이터로 섣불리 빅데이터 분석을 하겠다는 것이 아니다. 정부 기관이 갖고 있는 자료는 무엇이며, 그 자료들을 분석하면 어떤 가치를 이끌어 낼 수 있는지를 살펴보겠다고 나선 것이다.

“최소한 민간기업은 그동안 고객 데이터를 가지고 고객관계관리(CRM)이나 전사적자원관리(ERP)처럼 다방면에 활용하고 있었습니다. 하지만 정부기관은 가장 많은 데이터를 갖고 있으면서 데이터를 활용하는 면에서는 가장 느린 행보를 보였지요.” 공공기관들이 정책 관련 데이터를 수집하지 않았다거나 분석을 하지 않았단 얘기가 아니다. 다만 데이터를 그저 데이터로만 대했을 뿐이다.

“국가 전략이나 정책을 세우는 데 있어 주로 해외 좋은 사례 벤치마킹, 전문가 의견 수렴, 문헌조사 방식을 도입했습니다. 그 많은 데이터를 국가 전략 수립에 어떻게 활용해야 하는지에 대한 고민이 부족했던 것이지요. 빅데이터가 뜨면서 많은 공공기관들이 자신들이 수집한 데이터를 어떻게 활용할지 고민하고 있습니다. 정부가 나서 데이터 분석 관련 공무원 교육도 준비중입니다.”

물론 빅데이터 국가전략포럼이 하고자 하는 일을 위해서는 넘어야 할 산이 많다. 공공기관이 수집한 데이터를 어느 선까지 민간에게 공개할 것인지에 대한 법적 논의가 필요하다. 개인정보보호법을 존중하면서도 데이터를 분석해 가치를 얻을 수 있는 범위가 어디까지인지에 대한 국가적 합의도 필요하다. 가까운 일본을 비롯해 영국과 미국은 이미 빅데이터를 국가 전략 수립을 위한 중요한 가치로 선정하면서, 관련 법 제정에 한창이다.

“18대 국회에서 데이터 공개법을 두고 논의가 한창이었습니다. 상정되지 못하고 국회가 마무리되면서 19대 국회에서 다시 논의해야 하는 상황이 됐지만, 노력할 생각입니다. 법이 따라가지 못해 데이터를 분석하지 못한다는 일은 만들지 않으려고 합니다.”

빅데이터 국가전략포럼에 최종 종착지는 오바마 정부의 ‘빅데이터 연구개발 이니셔티브’이다. 미국은 대통력 직속기관인 과학기술정책실을 통해 약 2억달러 이상을 투입해 빅데이터 기술을 개발하겠다며 홈페이지를 통해 공공기관 데이터를 공개했다. 데이터를 수집, 저장, 보관, 관리, 분석, 공유하는 데 필요한 기술 발전과 과학과 엔지니어링 연구에도 지속적으로 투자하겠다고 밝혔다.

“이제 시작입니다만, 잘 된다면 국내 공공기관이 수집한 정보를 홈페이지에서 통합적으로 볼 수 있는 날이 올지 모릅니다. 우선 가까운 목표로 통계청이 수집하는 원본 데이터라도 기업이 활용할 수 있는 방안을 모색중입니다.”

최근 영국은 빅데이터 프로젝트라며 ‘국민건강 미래예측 서비스’를 만든 바 있다. 각 병원별, 약국별로 흩어져 있는 데이터를 하나의 데이터베이스로 통합한 뒤 지역별 질병 발병 가능성을 분석했다. 여기서 더 나아가 이를 국민건강 미래 예측 시스템으로 활용했다. 국내도 머지 않았다.