소사이어티

사람들

arrow_downward최신기사

DAISY

성별, 연령별, 지역별…데이터를 나누면 인사이트가 보인다

시각적 데이터 탐색 및 분석을 위한 데이터 집산(Data Aggregation) 이야기를 이어가 봅시다. 지난 글에서는 데이터 집산 개념과 수치형 변수를 활용한 데이터 집산에 대해 알아보았습니다. 이번 글에서는 범주형 변수를 활용한 데이터 집산의 개념과 시각화 유형에 대해 자세히 알아보겠습니다. · · · 데이터를 보는 수십 개의 눈, 어떤 기준으로 볼 것인가 범주형 변수란 무엇일까요? 범주형 변수(dimension)란 개별 항목(category)으로 구분되는 데이터 값을 갖는 변수를 말합니다. 일반적으로 값은 텍스트, 날짜 형태를 띱니다. 간혹 숫자 형태의 값을 갖는 변수를 범주형 변수로 활용하기도 하는데, 이 경우 수학적으로 계산할 수 없다는 점에서 수치형 변수와 구별됩니다. 이를 범주형 변수의 종류로 설명할 수 있는데, 좀 더 세분화해 ① 텍스트 ②...

DAISY

숫자는 계산하라고 있는 것, 차트 만들기에서도 예외 없다

지난 글 ‘데이터 하나로 몇 개의 차트를 만들 수 있을까요?’에서 데이터 집산(Data Aggregation)의 개념을 알아보았습니다. 시각화에서 데이터 집산은 그 기준이 되는 변수의 유형에 따라 두 가지(수치형, 범주형)로 나뉘는데요. 이번에는 수치형 변수를 활용해 데이터 집산을 해보고, 시각화했을 때의 효과까지 자세히 알아봅니다. · · · · · 시각화 차트를 만드는 순간, 당신은 이미 데이터 집산을 했다 먼저 수치형 변수의 개념을 간단히 알아봅시다. 수치형 변수(measure, value)란 계산이 가능한 숫자 형태의 값을 가진 변수를 의미합니다. 시각화 차트는 수치형 변수와 범주형 변수(dimension, 항목(category)으로 구분되는 값)의 조합으로 만들어집니다. 이때 범주형 변수 항목별로 수치형 변수의 값이 합산(SUM)되는 것이 일반적입니다. 시각화 차트를 만드는 과정을 통해 자세히 알아보겠습니다. 먼저 시각화를 하기 위해 필요한 데이터인 로우(raw)...

DAISY

데이터 하나로 몇 개의 차트를 만들 수 있을까?

 데이터 하나로 만들어진 이 모든 차트 데이터 분석 결과 보고서나 자료를 보면, 많은 시각화 차트와 데이터 표가 포함된 경우가 많습니다. 이런 보고서를 보고 있노라면, ‘이 보고서에 정말 많은 종류의 데이터가 활용됐구나’, ‘이 모든 것을 다 이해하기는 힘들겠다’ 등의 생각이 듭니다. 데이터에 압도되는 듯한 느낌이 드는 것이죠. 그러나 꼭 그럴 필요는 없습니다. 사실 특정 조사 기관이 하나의 조사를 한다면, 해당 조사 결과 데이터는 하나로 정리되었을 것이기 때문입니다. 여기에서 데이터란 정제되지 않은 상태의 원본 데이터인 로우(raw) 데이터를 의미합니다. 이들이 보고서에 여러 개의 시각화 차트와 데이터 표를 넣은 이유는 데이터 분석 과정에서 발견한 여러 인사이트를 전달하기 위한 보조 자료로써 활용했기 때문입니다. 여기에서 우리는...