효과적인 데이터 시각화 대시보드를 만드는 방법


데이터 활용 역량, 데이터 리터러시가 요구되는 시대, 데이터 리터러시 역량을 기르고, 실질적인 데이터 활용을 위해 우리는 시각화에 집중할 필요가 있습니다. 지난 ‘실무에서 데이터를 활용하는 방법, 데이터 시각화 대시보드!’ 글에서 우리는 데이터 리터러시 역량을 키우기 위해 필요한 시각화에 대해 알아보고, ‘데이터 탐색 및 인사이트 도출을 위해서 데이터 시각화 대시보드가 유용하다’는 것을 알아보았습니다. 특히 실제 기업에서 데이터 시각화 대시보드를 활용하는 사례에 대해 언급하여 실질적인 시각화의 활용이나, 데이터 시각화 도입을 염두에 두고 있던 분들의 많은 관심을 받았습니다.

이어지는 이번 글에서는 같은 시각화 대시보드를 만들더라도, 더 나은 시각화 대시보드를 만들기 위해 미리 알아두어야 할 것들에 관해 이야기하고자 합니다. 실제로 기업 고객의 대시보드 시각화 기획 및 컨설팅을 직접 진행하면서 얻게 된 인사이트를 정리한 것이므로, 관련 업무를 진행하고 있거나 진행할 계획을 가진 분들에게 실질적인 도움이 되리라 생각합니다!

· · · · · ·

데이터 시각화 대시보드 사용자의 니즈를 파악하는 3가지 방법


 

데이터 시각화 대시보드란 한 개 이상의 시각화 차트를 한 화면에 모아서 배치하고, 데이터를 탐색할 수 있도록 설계한 화면입니다. 여기에서 중요한 점은 ‘설계'를 한다는 것입니다! 단순히 여러 개의 차트를 한 화면에 나열했다고 해서 좋은 데이터 시각화 대시보드라고 할 수 없습니다. 데이터 시각화 대시보드를 통해 무엇을 알고 싶은지, 어떤 목적으로 사용하고자 하는지 그 니즈에 대한 정확한 파악이 전제되고, 이에 따라 설계된 데이터 시각화 대시보드를 좋은 대시보드라고 할 수 있습니다.

그렇다면 좋은 데이터 시각화 대시보드를 만들기 위해 알아야 할 니즈는 어떻게 파악할 수 있을까요?

▲  | 데이터 시각화 대시보드 사용자의 니즈를 파악하는 3가지 방법
▲ | 데이터 시각화 대시보드 사용자의 니즈를 파악하는 3가지 방법

이를 위해서는 크게 3가지를 확인해야 합니다. 첫 번째 보유하고 있는 전체 데이터 중 사용자가 보고 싶고 분석하고 싶은 데이터는 무엇인지 확인합니다. 처음부터 전체 범위의 데이터 모두를 분석하려고 하지 말고, 구체적으로 확인하고 싶은 궁금증을 해결할 수 있는 데이터는 무엇인지 파악합니다. 이를 통해 데이터 분석 대상의 범위 정할 수 있습니다.

두 번째 분석 대상 데이터가 어떤 정보를 포함하고 있는지 확인합니다. 쉽게 말해 데이터 파일 내 어떤 변수가 포함되어 있는지 보는 것입니다. 날짜 데이터 변수가 있는지, 어떤 항목 데이터 변수가 있는지 파악합니다. 또 수치 변수로는 어떤 지표가 있는지 파악합니다. 여기에서 중요한 것은 ‘단순히 어떤 지표가 있구나!’에서 그치는 것이 아니라 다수의 지표 중 기업(조직)뿐만 아니라 실제로 데이터 시각화 대시보드를 보는 사람(실무자)이 가장 중요하게 생각하는 지표(핵심 지표)가 무엇인지를 확인하는 것입니다. 만약 핵심 지표가 없다면, 이를 결정해야 합니다.

▲  | 제품 판매량과 실판매가 지표를 중심으로 만들어진 데이터 시각화 대시보드
▲ | 제품 판매량과 실판매가 지표를 중심으로 만들어진 데이터 시각화 대시보드

위 데이터 시각화 대시보드 사례는 제품 판매량과 실판매 가격 지표를 중심으로 만들어진 한 의류 기업의 데이터 시각화 대시보드입니다. 어떤 브랜드, 어떤 종류의 제품이 많이 팔렸는지, 또 어떤 지역에서 많이 팔렸는지 등을 파악할 수 있습니다. 이것만 보면 잘 만들어진 데이터 시각화 대시보드라고 할 수 있습니다.

그러나 경우에 따라 그렇지 않을 수도 있는데요! 예를 들어 이 기업이 가장 중요하다고 보는 핵심 지표가 판매량이 아니라 재고량이라면 위 대시보드는 큰 의미가 없어집니다. 재고량 데이터는 확인할 수 없기 때문입니다. 따라서 데이터 시각화 대시보드를 만들기 이전에 기업(조직)뿐만 아니라 실제로 대시보드를 활용할 사람(실무자)가 중요하게 생각하는 핵심 지표가 무엇인지 파악하는 것이 매우 중요합니다.

마지막으로 데이터 시각화 대시보드를 보고 인사이트 도출을 할 사람(실무자)이 구체적으로 무엇을 궁금해하는지 ‘시나리오' 형태로 파악합니다. 단순히 ‘그냥 무엇을 알고 싶다'가 아니라 ‘어떻게 알고 싶다'라는 데이터 탐색 과정 혹은 데이터를 보고자 하는 순서를 구체적으로 물어보고 파악합니다. 우리는 이 과정을 통해 데이터 시각화 대시보드로 알고 싶은 구체적인 니즈를 알 수 있습니다. 실제로 저희가 기업의 데이터 시각화 대시보드 기획 및 컨설팅 과정에서 가장 중요하게 생각하는 단계입니다. 그 이유는 이 단계를 얼마나 깊이 있게 진행하고 파악하느냐에 따라서 최종 시각화 대시보드의 결과물이 확연히 달라지기 때문입니다. 사례를 통해 알아보도록 하겠습니다.

▲  | 지역별 렌터카 이용 현황 대시보드 - (위) 지역 렌트 이용 탐색형 대시보드, (좌) 지역 렌트 이용 비교 분석형 대시보드, (우) 지역 렌트 이용 요약형 대시보드
▲ | 지역별 렌터카 이용 현황 대시보드 - (위) 지역 렌트 이용 탐색형 대시보드, (좌) 지역 렌트 이용 비교 분석형 대시보드, (우) 지역 렌트 이용 요약형 대시보드

위 데이터 시각화 대시보드는 지역별 렌터카 이용 현황 데이터를 활용해 만든 것입니다. 3개의 시각화 대시보드의 형태만 보면, 서로 다른 데이터를 활용해 만든 대시보드라고 생각할 수 있지만, 사실을 모두 다 같은 데이터를 활용한 결과물입니다. 왜 이렇게 다른 결과물이 만들어진 것일까요? 그 이유는 각 대시보드를 통해 찾고자 하는 핵심 인사이트가 다르기 때문입니다.

▲  | 지역별 렌터카 이용 현황 대시보드 - 지역 렌트 이용 탐색형 대시보드
▲ | 지역별 렌터카 이용 현황 대시보드 - 지역 렌트 이용 탐색형 대시보드

가장 먼저 ‘지역 렌트 이용 탐색형 대시보드’를 볼까요? 이 시각화 대시보드는 특정한 지역 한 곳의 렌터카 이용 현황을 파악하기 위한 목적에 따라 만들어졌습니다. 특정 지역의 렌트 이용 현황을 지도 시각화 중심으로 파악하고 그 외 해당 지역의 월별 렌트 현황, 운행 용도별 렌트 현황, 주행 시간별 분포 등의 데이터를 확인할 수 있습니다. 한 지역을 기준으로 데이터를 상세히 파악하는 데 효과적인 대시보드입니다. 그러나 만약 여러 지역의 데이터를 한눈에 비교하고 싶다면 어떨까요? 위 대시보드를 그대로 활용한다면 비교를 원하는 지역별 데이터를 개별적으로 확인한 뒤 취합하여 비교해야 하는 불편함이 발생합니다.

▲  | 지역별 렌터카 이용 현황 대시보드 - (좌) 지역 렌트 이용 비교 분석형 대시보드, (우) 지역 렌트 이용 요약형 대시보드
▲ | 지역별 렌터카 이용 현황 대시보드 - (좌) 지역 렌트 이용 비교 분석형 대시보드, (우) 지역 렌트 이용 요약형 대시보드

그러나 위 이미지와 같이 ‘지역 렌트 이용 비교 분석형 대시보드’나 ‘지역 렌트 이용 요약형 대시보드’를 활용한다면 여러 지역의 데이터도  한번에 비교하여 데이터 인사이트를 도출할 수 있습니다. ‘지역 렌트 이용 비교 분석형 대시보드’(왼쪽)는 비교를 원하는 2개의 지역을 선택하여 데이터를 확인 및 비교하는 데 유용합니다. 만약 2개 이상의 지역 데이터를 한 번에 비교해보고 싶다면 ‘지역 렌트 이용 분석형 대시보드’보다 ‘지역 렌트 이용 요약형 대시보드’가 훨씬 효과적입니다. ‘지역 렌트 이용 요약형 대시보드’(오른쪽)에서 각 지역을 평가할 데이터 지표 기준을 선택하면, 해당 데이터 기준으로 상위 6개 지역의 렌트 현황을 한눈에 확인할 수 있습니다. 우리는 이 사례를 통해 왜 데이터 시각화 대시보드를 만드는 데 있어서, 사용자가 데이터로 알고 싶은 바를 구체적으로 파악하는 것이 중요한지 이해할 수 있습니다.

데이터 시각화 대시보드를 만들 때 고려해야 하는 3가지


데이터 시각화 대시보드를 사용하는 사람의 니즈를 구체적으로 파악했다면, 다음 단계는 실제로 데이터 시각화 대시보드를 만드는 것입니다. 시각화 대시보드를 만들 때 주의해야 할 점은 무엇이 있고, 어떤 점을 고려하면 더 나은 데이터 시각화 대시보드를 만들 수 있을까요? 데이터 시각화 대시보드를 만들 때 고려해야 하는 3가지에 대해 알아보겠습니다.

▲  데이터 시각화 대시보드를 만들 때 고려해야 할 3가지 요소
▲ 데이터 시각화 대시보드를 만들 때 고려해야 할 3가지 요소

첫 번째 데이터 시각화 대시보드 내 개별 시각화 차트는 데이터의 특성과 활용 목적에 맞는 시각화 유형을 사용합니다. 같은 데이터라도 어떤 시각화 유형을 사용하느냐에 따라서 직관적으로 데이터 인사이트를 찾아내는 데 정도의 차이가 발생합니다. 시간 흐름에 따라 변화하는 데이터 값의 추이 변화를 표현하고자 한다면 선 차트가 효과적이고, 전체 중 특정 항목이 차지하는 구성 비중을 표현하고자 한다면 파이 차트를 활용하는 것이 효과적입니다.

▲  | 시각화 차트와 데이터 표를 함께 활용한 데이터 시각화 대시보드의 예시 화면
▲ | 시각화 차트와 데이터 표를 함께 활용한 데이터 시각화 대시보드의 예시 화면

또 필요에 따라서는 도형을 활용한 시각화 차트 외 데이터 표(table)를 함께 활용하는 것이 도움이 되기도 합니다. 도형으로 데이터를 표현한 시각화 차트가 많은 양의 데이터를 한눈에 볼 수 있도록 요약하는 데에는 효과적이지만, 세부적인 데이터 항목 및 수치를 찾아내는 데 어려움이 있기 때문입니다. 이는 데이터 시각화 대시보드를 보는 사람이 누구냐에 따라서 시각화 차트 유형의 활용 대시보드 구성을 달리해야 한다는 이야기로 이어집니다.

기업 내에서 시각화 대시보드를 주로 활용하는 사람이 특정 부서의 실무자인 경우 도형을 활용한 시각화 차트와 데이터 표를 함께 활용한 대시보드가 유용합니다. 많은 경우 실무자는 문제 해결 및 개선안 도출을 위해 상세한 데이터 분석과 인사이트를 도출해야 하므로, 빠르게 세부적인 데이터 항목 및 수치를 찾는 것이 중요하기 때문입니다. 이 경우 데이터 표뿐만 아니라 인터랙티브 데이터 시각화 대시보드의 툴팁 기능을 활용해 상세 데이터값을 빠르게 볼 수 있도록 하는 것도 방법입니다. 반면, 기업의 경영진을 위한 시각화 대시보드라면 기업의 핵심 KPI 지표를 모니터링하는 것이 주요한 목적이므로 데이터 표를 통한 세세한 데이터 정보보다는 데이터를 요약하여 직관적으로 전달하는 도형을 활용한 시각화 차트 중심의 대시보드가 효과적입니다.

두 번째, 데이터 시각화 대시보드 한 화면을 구성하는 시각화 차트 수는 최대 5개 정도로 제한합니다. 종합적인 데이터 인사이트 도출을 위해 여러 개의 시각화 차트를 한 번에 볼 필요가 있다고 해서 무조건 많은 것이 좋다고 할 수 없습니다. 대시보드 한 화면 내 너무 많은 시각화 차트를 구성할 경우 오히려 너무 많은 시각화 차트가 보여주는 데이터 인사이트 중 무엇이 중요한 인사이트인지 구별하기 어려운 상황을 맞게 될 수 있습니다. 효과적인 데이터 시각화 대시보드는 단순히 차트를 나열하는 것이 아닌 얻고자 하는 핵심 데이터 인사이트 도출을 목표로 설계된 것이므로, 목표 달성을 위해 필요한 최소한의 시각화 차트와 인터랙티브 기능 요소만으로도 충분히 데이터 인사이트를 도출할 수 있습니다.

▲  | 시간 흐름에 따라 데이터의 변화를 보고자 하는 목적이라면 연도별로 데이터를 필터링할 수 있는 인터랙티브 기능 요소를 활용한다.
▲ | 시간 흐름에 따라 데이터의 변화를 보고자 하는 목적이라면 연도별로 데이터를 필터링할 수 있는 인터랙티브 기능 요소를 활용한다.

인터랙티브 데이터 시각화 대시보드에서 활용할 수 있는 데이터 필터, 차트 간 인터랙션 등의 인터랙티브 기능 요소는 데이터 시각화 대시보드를 활용할 사람의 구체적인 니즈와 사용 시나리오를 반영하여 활용합니다. 사용자가 원하는 데이터 인사이트를 도출할 수 있는 데이터 탐색 시나리오를 만들고, 이에 따라서 각 기능 요소의 위치나 활용 방식을 적용합니다.

세 번째, 모든 니즈를 충족시킬 수 있는 단 하나의 대시보드를 만들려고 하기보다, 구별되는 각각의 니즈를 충족시킬 수 있는 여러 개의 데이터 시각화 대시보드를 만듭니다. 단 하나의 시각화 차트로 모든 데이터 인사이트를 도출할 수 없듯이, 데이터 시각화 대시보드 하나로 찾기 원하는 모든 데이터 인사이트를 발견할 수 없습니다.

▲  | 항목별 데이터 시각화 대시보드를 개별적으로 제작 및 탭으로 구분 (출처 : 뉴스젤리, 서울시 소비자 피해 인포맵)
▲ | 항목별 데이터 시각화 대시보드를 개별적으로 제작 및 탭으로 구분 (출처 : 뉴스젤리, 서울시 소비자 피해 인포맵)

따라서 데이터 시각화 대시보드를 보는 사람이 누구인지, 데이터 탐색의 세부 기준 - 인구 특성별, 지역별, 시간별 등-을 무엇으로 할 것인지 등의 기준으로 개별 데이터 시각화 대시보드를 만듭니다. 한 화면으로 만들되 각 대시보드를 탭으로 구분하여 대시보드별 이동을 쉽게 하는 것도 방법입니다. 이 경우 개별 데이터 시각화 대시보드에서 도출할 수 있는 인사이트가 구체적이고 명확하므로, 효과적으로 핵심 인사이트를 빠르게 파악할 수 있습니다.

· · · · · ·


지금까지 효과적인 데이터 시각화 대시보드를 만들기 위해 사용자 니즈를 파악하는 3가지 방법과 실제 데이터 시각화 대시보드를 구성하는 데 있어서 고려해야 할 3가지 방법에 대해 자세히 알아보았습니다. 각 방법이 전하는 내용은 다르지만, 모두 데이터 시각화 대시보드를 보고 활용하는 사람의 니즈에 적합한 시각화 대시보드를 만들기 위한 것이라는 목적은 동일합니다. 즉, 효과적인 데이터 시각화 대시보드를 만드는 것은 모두가 만족할 수 있는 결과물을 만드는 것이 아니라, 데이터를 활용하고자 하는 목적과 그 목적을 달성하기 위해 알아야 할 명확한 데이터 인사이트를 찾을 수 있고, 또 데이터 인사이트를 실제 업무로써 찾아내야 하는 사람을 가장 만족할 수 있는 형태가 되어야 한다는 의미입니다.

여러분이 보고 있는(만든) 데이터 시각화 대시보드는 어떤가요? 누구를 위한 것인가요? 얼마나 만족스러운가요? 이번 글을 통해 효과적인 데이터 활용을 위해 적합한 데이터 시각화 대시보드를 만들고 활용하는 데 도움이 되었길 바라봅니다.

※ 이 글은 데이터 시각화 전문기업 뉴스젤리 블로그에도 게재됐습니다.
※ 이와 같이 데이터 시각화 전문 콘텐츠를 월 1회 메일함으로 보내드립니다. (☞ 구독 신청하기)
※ 데이터 시각화의 다양한 트렌드와 정보를 빠르게 얻고 싶다면? (☞ 시각화 커뮤니티(페북 그룹) 가입하기)

저작권자 © 블로터 무단전재 및 재배포 금지