‘공개’했다고 다 열린 데이터인가

가 +
가 -

1월24일 ‘링크드데이터콘퍼런스’ 행사장에서 흥미로운 얘기를 들었다.

문화체육관광부는 2013년 10월 ‘전국문화기반시설총람’을 웹에 공개했다. 전국 도서관과 박물관, 미술관의 위치와 규모, 운영시간, 운영프로그램 등을 망라한 책자다. 문화체육관광부는 PDF 파일로도 공개했다. 물론 무료다.(PDF 파일은 공공데이터포털과 문화체육관광부에서 내려받을 수 있다.)

이종훈 씨는 이 자료를 보고 지도에 뿌리면 더 쓸만한 정보가 되겠다고 생각했다. 헌데 PDF는 정보를 가공하기에 불편했다. A4 530쪽 분량인데 엑셀로 일괄 변환하니 깨졌다. 530쪽을 일일이 들춰가며 수정해야 했다. 그래서 문화체육관광부에 책자로 만들기 전의 파일을 달라고 요청했다. 텍스트이든 엑셀이든 쓸 수 있는 자료를 줄 수 있겠느냐고 물었다.

돌아온 대답은 ‘안된다’였다. 자료를 수정할 수 있기 때문이란다. 이미 다 공개된 정보인데.

이종훈 씨는 문화체육관광부 직원을 설득하는 데 실패하자 2013년 11월, 정보공개시스템을 통해 자료를 요청했다. 문화체육관광부는 이때도 거절했다. 이번에는 공공데이터포털에 있는 정보제공신청 방법을 쓰기로 했다. 이런 일이 긴급하게 처리될 리가 없었다. 해를 넘기고서야 답변을 받았다. ‘줄 수 없다.’

govdata_mcst_opendata_reject

 

▲문화체육관광부는 전국 문화기반시설총람을, 데이터를 수정할까봐걱정돼 PDF 파일로 자료를 공개한다고 설명했다.

이종훈 씨가 자료를 발견하고 3개월이 지났다. 정부에서 파일을 받는 건 포기하기로 했다. PDF 파일 속 내용을 엑셀로 정리하는 작업을 아르바이트생에게 맡겼다. 작업은 2월에 끝날 예정이다.

이 얘기는 강연 중 ‘공공데이터 개방’이갈 길이 멀다는 걸 드러낸 사례로 나왔다. 얘기를 꺼낸 강현숙 크리에이티브커먼즈 코리아(CCKorea) 활동가는 커뮤니티에서 들은 얘기라고 말했다. 그는 “법률이 개정되어 공공 데이터가 모두 공개될 것이라고 기대했는데…”라며 이 얘기를 꺼냈다.

발표가 끝나고 나서 점심시간. 혼자 먹어야 했다. 누구라도 붙잡고 같이 먹어야겠다 싶어서 한 사람에게 인사를 건넸다. 이런, 바로 위 얘기 주인공이다. ‘이 사람은’의 이름이 이종훈인 것도 그제야 알게 됐다.

식당으로 가는 길에 이종훈 씨에게 슬며시 물었다. “알바 써서 엑셀로 작업한 파일, 공유하려면 참 아깝겠어요.”

그가 원래 원한 것은 무료로 공개된 엑셀 파일이었다. 그런데 본인이 비용을 들여 만든 엑셀 파일을 무료로 공개할까. 그게 알고 싶었다. 내 질문에 숨은 꼼수를 알아챘는지 이렇게 대답했다.

“무료로 공개할 거예요. 그 파일 가지고 다른 사람이 서비스를 만들거나 활용하면 더 좋고요.”

개인이면 진작에 포기했을 것이다. 일단 PDF 파일이 엑셀 파일로 제대로 변환되지 않는 단계에서 ‘에잇’하고 말았을 일이다. 이종훈 씨는 전국문화기반시설총람이란 자료를 회사에서 쓰면 좋겠다고 생각했단다. 그가 다니는 회사는 지리정보를 활용해 서비스를 만든다. 그러니까 이런 일에 익숙하고, 자료를 요청하려면 어떤 절차를 밟아야 하는지 정도는 아는 전문가에 해당한다. 총람의 원자료가 엑셀 파일로 있다는 것도 금세 알았다. 물론, 문화체육관광부의 담당 직원과 여러 차례 통화한 끝에 들은 얘기다. 하지만 전화할 생각도 못한 사람은 엑셀 파일이 있다는 것조차 몰랐을 게다. 결국, 그런 전문가도 원자료를 얻지 못했다.

오늘도 공공데이터포털 대문에는 몇 개 기관이 얼마나 많은 자료를 공개했는지를 보여준다. 2014년 1월24일 기준 696개 기관이 데이터세트 7024개, 오픈API 629개를 공개했다. 그중에 전국문화기반시설총람도 들었다. 이 자료는 이종훈 씨가 겪은 일에서 보듯, 공개만 됐을 뿐이다.공공데이터포털 대문

▲공공데이터포털 대문 한편에 데이터 공개 현황이 보인다.

이날 링크드데이터콘퍼런스 기조연설을 한 윤종수 판사는 “공공데이터는 해킹하고 싶은 데이터여야” 한다고 말했다.

다른 연사들도 비슷한 꺼냈다. 공공데이터를 활용하는 사람들의 모임 ‘열려라 공공데이터’에서 활동하는 이명진 리스트 이사는 “1박2일짜리 공공데이터 해커톤을 하고 나서 ‘데이터가 표준 포맷이면 좋겠다’, ‘PDF로 되어 있어서 활용하기 어렵다’, ‘데이터 처리하는 데에 해커톤 1박2일(14시간)을 다 보냈다’라는 얘길 들었다”라고 말했다.

정부는 공개해도 탓하느냐고 볼멘소리를 할 수도 있다. 이종훈 씨에겐 ‘PDF로 공개했는 걸’이라고 말하고 싶을 게다. 혹시라도 이렇게 생각한다면 이 말을 새겨듣자.

“공공데이터는 시민과 정부가 소통하는 출발점이라고 생각합니다. 이제 정보가 공개되는 것은 피할 수 없어요. 먼저 공개를 해서 선례를 만들거나 아니면 마지못해 공개하거나죠.” (강현숙 CCKorea 활동가)

[새소식]

2월10일, 문화체육관광부 정보통계담당관실에서 연락이 왔다. 해당 부서와 협의해 데이터 원본을 홈페이지에 공개했다고 했다.
전국 문화기반시설 총람 엑셀파일은 ‘문화체육관광부 홈페이지→자료공간→동향·현황자료’로 들어가 ‘문화기반시설‘로 검색하면 내려받을 수 있다. (2014년 2월11일 오전 10시 수정)