‘탐색적 데이터 시각화’를 통한 문제해결 접근법 ①제주도 대중교통 사례 분석

가 +
가 -

지난 정부의 미래준비위원회가 만든 ‘10년 후 대한민국, 미래 일자리의 길을 찾다’ 보고서에서 언급된 4차 산업혁명 시대에 필요한 인재의 핵심 역량 TOP3 중 가장 첫 번째로 언급된 것은  ‘창의성 기반의 문제해결력’이라고 합니다. 그 뒤로 꼽힌 역량은 기계와의 공생능력, 소통능력 등이었습니다.

결국 인간이 기계와 차별화되면서도 기계를 활용해 보다 많은 가치를 창출하기 위해서는 인간만의 ‘창의적인 문제해결 역량’이 필수적이라는 것이지요. 물론 이 조사 결과 외에도 각국의 기업 대상 설문조사에서도 다양한 방법을 사용해 업무를 수행하는 이른바 ‘문제 해결 스킬’이 점차 중요하게 대두되고 있습니다. 말마따나 국내에서도 이에 대한 관심도는 꾸준히 증가하고 있고, 이러한 흐름은 자연스럽게 비즈니스 분야의 인재 트렌드로도 이어져 오늘날 ‘문제해결 역량’은 기업의 인재 양성 및 발굴분야에서도 주요하게 꼽는 핵심역량지표 중 하나가 되었다고 볼 수 있습니다.

<문제해결역량에 대한 사람들의 관심도 증가 추이> 연도별 '문제해결' 키워드에 대한 교보문고의 도서검색량은 매년 증가하는 형태를 보이고 있다.

<문제해결역량에 대한 사람들의 관심도 증가 추이> 연도별 ‘문제해결’ 키워드에 대한 교보문고의 도서검색량은 매년 증가하는 형태를 보이고 있다.

· · · · ·

개인과 조직의 창의적 문제해결 방법,
탐색적 데이터 시각화를 통한 문제검증부터!

그렇다면 창의적 문제해결은 어떤 방식으로 할 수 있을까요? 우선 대표적인 방법으로 디자인씽킹(Design Thinking)이 있습니다. 이는 문제 해결에 있어서 디자이너들이 문제를 풀던 방식대로 사고하는 것을 말합니다. 즉, 일종의 ‘문제를 해결하기 위해 설계를 수차례 바꿔나가는 서비스 디자인 방법론’을 전반적인 비즈니스의 문제 해결 과정에 도입한 것입니다.

그런데 이 디자인씽킹 과정에, 데이터를 가장 쉽고 효과적으로 다룰 수 있는 ‘데이터 시각화’라는 프로세스를 잘 접목하면 기대 이상의 시너지를 낼 수 있습니다. 이러한 문제해결 솔루션을 앞으로 ‘데이터 기반 디자인씽킹’이라고 부르도록 하겠습니다.

데이터 기반 디자인씽킹에서는 데이터 시각화를 활용하여 문제를 정의하고 검증하는 활동을 주로 진행합니다. 그리고 이를 위해서는 우선 데이터를 기반으로 문제를 바라보는 시각과 함께 끈질기게 다양한 데이터를 탐색하여 수집된 데이터를 시각화 차트로 만들어보고, 다양한 각도에서 시각화 결과물을 탐색하며 의미를 이해하는 등의 데이터의 시각적 분석을 통한 인사이트 도출이 중요합니다.

<데이터로 보는 디자인씽킹 프로세스 도식화> 탐색적 데이터 시각화는 '1단계: 현재 상태의 문제 정하기'를 위해 사용한다.

<데이터로 보는 디자인씽킹 프로세스 도식화> 탐색적 데이터 시각화는 ‘1단계: 현재 상태의 문제 정하기’를 위해 사용한다.

오늘은 이 데이터 기반의 디자인씽킹 과정 중에서도 문제해결의 앞 단에서 가장 중요한 문제정의와 검증과정을 중심으로, 이 단계에서 주요하게 쓰이는 ‘탐색적 데이터 시각화’의 방법과 이를 통한 인사이트 도출과정에 대해 살펴보도록 하겠습니다.

비즈니스 문제해결 과정에서 데이터 분석 작업은 기존의 서비스 디자인적인 영역과 완전히 분리되어 있었지만, 최근 데이터 시각화 기술이 발전하고, 이를 활용할 수 있는 영역과 중요성이 증대되면서 비즈니스 문제를 디자인하는 영역에서 데이터 비전문가나 일반인도 시각화를 통한 데이터 분석이 가능하게 되었다.

비즈니스 문제해결 과정에서 데이터 분석 작업은 기존의 서비스 디자인적인 영역과 완전히 분리되어 있었지만, 최근 데이터 시각화 기술이 발전하고, 이를 활용할 수 있는 영역과 중요성이 증대되면서 비즈니스 문제를 디자인하는 영역에서 데이터 비전문가나 일반인도 시각화를 통한 데이터 분석이 가능하게 되었다.

참고로 탐색적 데이터 시각화란 비즈니스 문제를 해결하는 과정 중에서도 특히 사용자에 대한 공감과 올바른 문제 정의가 필요할 때 주요하게 쓰이는 방법입니다. 수집된 데이터를 통해 상황을 빠르게 파악한 후, 가설을 설정하고 다시 데이터를 통해 검증하며 문제정의를 완성해가는 모든 과정에서 탐색적 데이터 시각화 활동이 이루어진다고 볼 수 있습니다.

이 방법에 대한 좀 더 쉬운 이해를 돕기 위해 구체적인 사회 이슈 사례 몇 가지를 바탕으로, 시각적인 탐색 및 분석 과정을 통해 실제로 ‘문제를 어떻게 정의’해나가는지에 대한 과정을 살펴보도록 하겠습니다. 첫 번째 케이스 주제는 제주도의 대중교통 관련 불만을 해결하자”입니다.


실제 사례 분석 : 제주도의 대중교통 관련 불만을 해결하자.

먼저 제주도의 대중교통 관련 불만을 해결하기 위해 관련된 데이터를 살펴봐야하겠습니다. 데이터를 수집하는데 있어 핵심은, 가장 적합한 연관키워드를 찾아내는 것입니다.

그럼 제주도 사례에서 중점적으로 살펴봐야 할 핵심 키워드는 무엇일까요? 실제 제주도의 대중교통으로는 지하철이 존재하지 않고, 버스가 대표적인 대중교통이므로, ‘버스를 핵심 키워드로 설정합니다. 이 버스라는 키워드를 통해 최근 1년 동안의 웹, SNS, 블로그 등의 소셜 데이터 분석을 진행해본 결과는 아래와 같았습니다.

'버스' 키워드에 대한 연관 말뭉치를 시각화한 워드클라우드 차트

‘버스’ 키워드에 대한 연관 말뭉치를 시각화한 워드클라우드 차트

버스와 관련되어 도출된 핵심 연관 키워드들 중에서도 빈도가 많고유의미한 키워드 4개는 다시 아래 1~4번으로 정리되는데여기에 대중교통과 관련된 불만인 만큼 아이디어를 더해서 교통사고라는 키워드를 5번으로 추가해보았습니다.

  1. 정류장
  2. 버스기사
  3. 교통사고
  4. 버스비
  5. 버스시간표

이  5개 핵심 키워드를 조합하여 아래와 같은 가설을 설정해보았습니다여기에 탐색적 데이터 시각화 과정을 이용하여 비교적 간단하게 가설을 검증해볼 수 있습니다우선 첫 번째 가설을 시작으로몇 가지 사례만 탐색적 데이터 시각화를 통해 빠르게 확인해보겠습니다.

  1. 정류장이 불편하다
  2. 버스기사가 불친절하다
  3. 교통사고가 잦다
  4. 버스비가 비싸다
  5. 버스시간표가 알기 어렵다

1. 정류장이 불편하다.

먼저 “정류장이 정말 불편할까?” 라는 가설을 가지고, 데이터 기반의 사고로 전환하기 위해서는 어떻게 가설을 설정하면 좋을까요? 세부적으로는 정류장의 양과 질적인 부분에 대한  개의 가설 나눌  있습니다.

  1. 제주도에는 정류장이 충분하지 않다.
  2. 제주도의 정류장은 질이 좋지 않다.

그리고 나서 빠르게 탐색적 데이터 시각화를 진행해봅니다. A의 가설을 검증하기 위하여일단 전국의 광역시급 이상 시도들의 정류장 수와 인구 수를 가져와서 시각화하면 아래와 같은 그래프를 발견할 수 있습니다.

도시별 전체버스정류장수 대비 인구수 비교

도시별 전체버스정류장수 대비 인구수 비교

정류장 정보가 없었던 인천을 제외하면 평균적으로 인구가 많은 지역이 정류장도 많이 보유하는 것으로 나타났습니다특히 서울시가 생각보다 정류장이 많이 없다는 사실은 주목할 만합니다다만, A가설(제주도에는 정류장이 충분하지 않다) 검증하기에는  데이터는 충분하지 않았고면적 대비 정류장의 인구 대비 정류장의     탐색적인 시각화 작업이 필요하다는 것을   있습니다이에 따라 정류장의 수를 면적으로 나눈 수치를  시도별로 시각화하면 아래와 같습니다.

정류장의 수 대비 지역면적 상대비교(좌), 정류장수 대비 지역별 인구수 비교

정류장의 수 대비 지역면적 상대비교(좌), 정류장수 대비 지역별 인구수 비교

첫 번째 그래프에서 보이는 것과 같이 면적에 비해 정류장의 수는 서울이 가장 많게 나왔으며, 제주는 평균적인 모습을 보였습니다. 대략적으로 보기에는 인구의 규모와 비례하는 것 같아 보이나, 두 번째 워드클라우드 그래프를 보면 제주는 오히려 인구에 비해 다른 지역보다 정류장이 많은 축에 속한다는 것을 알 수 있습니다. 따라서, 가설(제주도에는 정류장이 충분하지 않다) 사실이 아닌 것은 틀린 가설이 됩니다.

그렇다면 가설(제주도의 정류장은 질이 좋지 않다) 어떨까요사실질적인 부분(정류장이 훌륭한지 엉망인지)   있는 데이터는 설문조사나 품질에 관한 지표들인데이는 굳이 데이터를 시각화해보지 않더라도 인터넷 검색을 통해서 보다 간단히 파악할  있습니다.

카카오로드맵을 통해 살펴본 제주도의 버스정류장 현황. 단순히 폴대형 표지판만 세워진 버스정류장도 있고 인도와 차도의 구분이 거의 없을 만큼 간격이 좁아서 버스를 기다리는 승객이 안전하게 머무를 수 있는 공간이 없다.

카카오로드맵을 통해 살펴본 제주도의 버스정류장 현황. 단순히 폴대형 표지판만 세워진 버스정류장도 있고 인도와 차도의 구분이 거의 없을 만큼 간격이 좁아서 버스를 기다리는 승객이 안전하게 머무를 수 있는 공간이 없다.

일반적인 버스 정류장에 비해제주도 버스 정류장”을 검색했을 때 나오는 이미지들은 대체로 ‘정류장’ 수준이 아닌 단순 표지판 수준의 표시에 그친다는 것을 알 수 있습니다. 이 외에도 아래와 같이 정류장에서 기다리는 사람들의 시선을 가로막는 구조물이나, 차도로 고개를 내밀어야만 오고 가는 버스를 확인할 수 있는 형태의 불편한 버스 정류장도 존재했습니다. 따라서, B가설(제주도의 정류장은 질이 좋지 않다) 성립하는 으로 판단되었습니다.

다시 정리해보면, 첫 번째 가설이었던 “제주도의 버스 정류장은 불편하다”는 “A.정류장의 수가 충분하지 않다”와 “B.정류장의 질이 좋지 않다” 두 가지로 세분화 되었었습니다. 이후 탐색적 시각화와 정성적인 아이데이션 조사기법 등을 복합적으로 활용하여 B. 제주도 정류장의 상태와 퀄리티가 좋지 않다 적합한 문제정의로 도출되었음을 확인할  있었습니다.

2. 버스기사가 불친절하다

다음으로는 “버스기사는 불친절할까?”라는 가설이 입니다. 이 가설을 검증하는데 핵심적인 태스크 중 하나는 ‘불친절하다’라는 정성적인 부분을 어떻게 데이터 기반의 관점으로 재해석할 것이냐는 것입니다. 이를 위해 불친절하다라는 개념을 조금 다르게 생각하는 사고가 필요합니다. 이를 테면 일반적인 경우 보통 한 사람이 할 일이 너무 많거나 바빠지면 불친절해지기 쉽습니다. 이러한 관점의 사고를 통해 “버스기사가 불친절하다”라는 부분은 “운전해야하는 버스의 수 대비 운전자 수가 적다”로 대체해보도록 하겠습니다.

지역별 운전버스 수(막대) 대비 운전기사의 수(라인)를 그린 콤보차트

지역별 운전버스 수(막대) 대비 운전기사의 수(라인)를 그린 콤보차트

지역별 운전버스 수(막대) 대비 운전기사의 수(라인)를 그린 콤보차트로 나타내본 결과, 얼핏봐서는 제주도의 경우 버스 대비 운전자의 수가 부족한 것 같지는 않아 보였습니다. 좀 더 자세한 결과 값을 보기 위해 버스/운전자를 비율로 나누고, 평균 기준선을 막대그래프 위에 구분하여 자세히 살펴보도록 하겠습니다.

지역별 버스/운전자수 비율 비교

지역별 버스/운전자수 비율 비교

이번엔 버스/운전자수를 비율로 계산하고 전체 지역의 총 평균값을 계산하여 기준선으로 설정 후 막대그래프로 범주를 비교해보았습니다. 좀 더 확연하게 결과에 대한 구분이 가능해졌고 제주도는 전체 지역별 평균과 대비해서도 버스 대비 운전자의 수가 부족하지는 않다는 것을 알 수 있었습니다. 따라서 버스기사의 수가 버스대비 적다는 가설은 기각되었습니다.

3. 교통사고가 잦다

마지막으로 제주도가 유독 교통사고가 잦은지 알아보기 위해, 인구대비 교통사고 건수를 지역별로 비교해보았습니다.

지역별 교통사고(라인) 대비 인구(라인)수

지역별 교통사고(라인) 대비 인구(라인)수

단순 건수로 집계해보아도, 제주도의  인구대비 교통사고가 많은 것을 볼 수 있습니다.

좀 더 확연하게 시도별로, 인구대비 교통사고를 사고율로 변환하여 지역별 사고율을 살펴보았더니 제주도가 독보적인 1위로 올라섰습니다. 국내 대표 관광도시에다 렌트카 중심으로 교통이 운영되는 만큼 사고가 잦았다는 것입니다.

마지막으로 궁금한 점은, 그렇다면 과연 정말로 서울의 최고 유동인구 도시인 강남보다 많을까? 하는 것입니다. 교통사고통계분석시스템인 TAAS를 이용하여 실제 교통사고에 대한 통계 데이터를 탐색해보도록 하겠습니다.

제주도 서귀포시의 교통사고 통계 결과(위)와 서울 강남구의 교통사고 통계결과(아래)(http://taas.koroad.or.kr/)

제주도 서귀포시의 교통사고 통계 결과(위)와 서울 강남구의 교통사고 통계결과(아래)(http://taas.koroad.or.kr/)

놀랍게도 제주도의 경우 차vs사람의 교통사고 건수가 225건, 차vs차의 교통사고건수가 966건으로, 교통사고 비율은 4.29배였고, 이는 3.14배로 나타난 서울시 강남구(차vs사람 811, 차vs차 2,550)보다 더 높은 것으로 나타났습니다. 특히, 유동 인구 수로 비율을 따져보았을 때 차vs차 교통사고는 강남구보다 제주도가 월등히 높은 것을 확인할 수 있습니다.

또한 제주 서귀포의 인구가 18만 명이고 서울 강남구의 인구가 50만 명이라는 인구통계를 기반으로 해당
데이터를 다시 들여다보면 차vs사람 사고의 비중은, 제주도가 0.125%, 서울 강남구가 0.162%인 만큼 유동인구 전국1위인 강남구만큼 제주도의 “차vs사람”교통사고 비중이 적지 않다는 것을 알 수 있습니다.


최종 문제정의 도출 결과

결국 위에서 처음 언급한 가설 5가지 중, 탐색적 데이터 시각화를 통해 최종 검증된 가설은 총 2가지로 1. 정류장이 불편하다는 것과 2. 교통사고가 잦다는 것이었습니다. 이를 기반으로, 아래와 같은 진짜 해결이 필요한 최종 문제리스트를 도출할 수 있게 됩니다.

  1. 제주도에는 제대로 된 정류장이 필요하다
  2. 제주도에는 차대사람 교통사고를 줄여야 한다
  3. 제주도에는 차대차 교통사고 역시 줄여야 한다

· · · · ·

지금까지 제주도 대중교통에 대한 불만을 해결하자는 주제로 탐색적 데이터 시각화를 통해 데이터를 탐색하고, 최종 문제를 도출하는 과정을 간략히 살펴보았습니다. 사실, 이 주제는 2018년 국민디자인단이라는 사업에서 실제로 디자인씽킹 프로세스를 이용하여 약 1년 동안 진행된 프로젝트입니다. 국민디자인단은 실제 공공기관의 문제를 디자인씽킹으로 해결하기 위해 국민들이 참여해 정책과 공공서비스를 디자인하는 정책 워킹그룹입니다.

주목할 만한 사실은, 이 1년 간의 프로젝트 전체 기간 중 절반 이상을 소모하여 도출한 문제 정의와 이번 데이터 시각화를 바탕으로 진행한 문제 정의의 도출 결과가 똑같았다는 점입니다. 특히, 디자인씽킹 기반의 탐색적 데이터 시각화 과정을 통해서 기존 국민디자인단에서는 거론되지 않은 ‘교통사고’에 대한 추가적인 문제도 정의해볼 수 있었다는 것도 상기해볼 만한 점입니다. 다음 편에서는 탐색적 데이터 시각화를 통해 문제를 해결해가는 또 다른 사례를 이어 살펴보도록 하겠습니다.


※ 이 글은 데이터 시각화 전문기업 뉴스젤리 블로그에도 게재됐습니다.
※ 이와 같이 데이터 시각화 전문 콘텐츠를 월 1회 메일함으로 보내드립니다. (☞ 구독 신청하기)
※ 데이터 시각화의 다양한 트렌드와 정보를 빠르게 얻고 싶다면? (☞ 시각화 커뮤니티(페북 그룹) 가입하기)

네티즌의견(총 0개)