비즈니스

기업 비즈니스, 보안, 네트워크, 기업용 소프트웨어

arrow_downward최신기사

[그래프]

실무에서 데이터를 활용하는 방법, 데이터 리터러시와 시각화 대시보드!

데이터 리터러시와 시각화 대시보드 이해하기 사회적으로 데이터 활용에 대한 중요성이 강조되면서, 공공, 민간 분야 가리지 않고 데이터 활용을 기반으로 한 다양한 시도가 이어지고 있습니다. 동시에 데이터를 다룰 줄 아는 인력에 대한 수요도 증가하고 있습니다. 그러나 현실은 인력 자체가 부족한 상황입니다. 최근 소프트웨어정책연구소와 전자정보통신산업진흥회 등 유관 기관과 업계는 2022년까지 빅데이터 산업에서 부족한 인력 수를 2,785명으로 추산했습니다. 문제 상황을 극복하기 위해 기업은 데이터 분야의 역량을 가진 인재를 채용하는 방법뿐만 아니라 자체적으로 인재 육성을 위한 프로그램을 진행하는 등 적극적으로 나서고 있습니다. 이런 흐름은 사회에서 데이터 활용 역량을 보유한 사람이 경쟁력 있는 인재로 인정받고, 그 역할을 하게 된다는 것을 의미합니다. 현업에서 실무를 하는 사람들이...

DAISY

성별, 연령별, 지역별…데이터를 나누면 인사이트가 보인다

시각적 데이터 탐색 및 분석을 위한 데이터 집산(Data Aggregation) 이야기를 이어가 봅시다. 지난 글에서는 데이터 집산 개념과 수치형 변수를 활용한 데이터 집산에 대해 알아보았습니다. 이번 글에서는 범주형 변수를 활용한 데이터 집산의 개념과 시각화 유형에 대해 자세히 알아보겠습니다. · · · 데이터를 보는 수십 개의 눈, 어떤 기준으로 볼 것인가 범주형 변수란 무엇일까요? 범주형 변수(dimension)란 개별 항목(category)으로 구분되는 데이터 값을 갖는 변수를 말합니다. 일반적으로 값은 텍스트, 날짜 형태를 띱니다. 간혹 숫자 형태의 값을 갖는 변수를 범주형 변수로 활용하기도 하는데, 이 경우 수학적으로 계산할 수 없다는 점에서 수치형 변수와 구별됩니다. 이를 범주형 변수의 종류로 설명할 수 있는데, 좀 더 세분화해 ① 텍스트 ②...

DAISY

숫자는 계산하라고 있는 것, 차트 만들기에서도 예외 없다

지난 글 ‘데이터 하나로 몇 개의 차트를 만들 수 있을까요?’에서 데이터 집산(Data Aggregation)의 개념을 알아보았습니다. 시각화에서 데이터 집산은 그 기준이 되는 변수의 유형에 따라 두 가지(수치형, 범주형)로 나뉘는데요. 이번에는 수치형 변수를 활용해 데이터 집산을 해보고, 시각화했을 때의 효과까지 자세히 알아봅니다. · · · · · 시각화 차트를 만드는 순간, 당신은 이미 데이터 집산을 했다 먼저 수치형 변수의 개념을 간단히 알아봅시다. 수치형 변수(measure, value)란 계산이 가능한 숫자 형태의 값을 가진 변수를 의미합니다. 시각화 차트는 수치형 변수와 범주형 변수(dimension, 항목(category)으로 구분되는 값)의 조합으로 만들어집니다. 이때 범주형 변수 항목별로 수치형 변수의 값이 합산(SUM)되는 것이 일반적입니다. 시각화 차트를 만드는 과정을 통해 자세히 알아보겠습니다. 먼저 시각화를 하기 위해 필요한 데이터인 로우(raw)...

DAISY

데이터 하나로 몇 개의 차트를 만들 수 있을까?

 데이터 하나로 만들어진 이 모든 차트 데이터 분석 결과 보고서나 자료를 보면, 많은 시각화 차트와 데이터 표가 포함된 경우가 많습니다. 이런 보고서를 보고 있노라면, ‘이 보고서에 정말 많은 종류의 데이터가 활용됐구나’, ‘이 모든 것을 다 이해하기는 힘들겠다’ 등의 생각이 듭니다. 데이터에 압도되는 듯한 느낌이 드는 것이죠. 그러나 꼭 그럴 필요는 없습니다. 사실 특정 조사 기관이 하나의 조사를 한다면, 해당 조사 결과 데이터는 하나로 정리되었을 것이기 때문입니다. 여기에서 데이터란 정제되지 않은 상태의 원본 데이터인 로우(raw) 데이터를 의미합니다. 이들이 보고서에 여러 개의 시각화 차트와 데이터 표를 넣은 이유는 데이터 분석 과정에서 발견한 여러 인사이트를 전달하기 위한 보조 자료로써 활용했기 때문입니다. 여기에서 우리는...

광고 데이터

마케터가 알아두면 좋은 '낯선' 시각화

우리는 데이터를 통해 문제를 발견하고자 합니다. 데이터에서 문제를 볼 줄 알아야 하는데, 여기에 시각화의 필요성이 있습니다. · · · · ·  마케팅 데이터로 해보는 시각화 마케팅의 경우 사용자의 반응을 즉각적으로 확인하고, 그에 따른 적절한 행동을 취할 때 마케팅 효율을 높일 수 있습니다. 시각화는 이런 통찰을 가능하게 합니다. 통찰은 단순한 과정이 아니라 내부 요인 간의 관계를 통해 대상들 사이에 숨겨진 관계를 찾는 것을 의미합니다. 이 관계를 찾으면 과거를 알 수 있고, 현재가 보이며, 미래에 대해 짐작할 수 있습니다. 그렇다면 시각화는 어떻게 할 수 있을까요? 시각화에도 프로세스가 있습니다. 시각화를 통해 어떤 목적을 달성할 것이냐에 따라 심화된 단계로 나아갈 수 있습니다. 시각화 프로세스는 그 과정과 목적에 따라...

뉴스젤리

[4월-1주차] 데이터 뉴스 큐레이션 #17

“한 번 유용한 정보는 언제봐도 유용하다!” 여러분 모두가 뉴스 큐레이션을 통해서 유용한 정보를 얻어 가셨으면 좋겠네요. 뉴스젤리의 데이터 뉴스 큐레이션 17번째 지금 시작합니다. 데이터로 파헤치는 미세먼지 이야기들 데이터로 파헤치는 봄나들이 방해꾼, 미세먼지! 날씨가 따뜻해서 산책하러 밖을 나갔다가 희뿌연 하늘 때문에 계획을 취소하신 경험이 있으신가요? 요즘 연일 미세먼지 주의보가 발령돼 많은 분이 마스크를 쓰고 다니는데요. 데이터를 통해서 미세먼지가 무엇이고, 우리나라 미세먼지는 얼마나 나쁜 수준인지 파헤쳐보도록 하겠습니다. ☞자세히보기 [단독] 축사 몰린 익산 ‘나쁨’ 年68일 최다… 공장 많은 평택 年60일 최근 우리가 사는 한반도는 미세먼지에 갇혀 있다고 해도 무방한데요. 그런데 이 데이터를 본다면 여러분이 사는 곳이 얼마나 미세먼지가 심한지 알 수 있겠네요. 지난 한 해 동안...

데이지

데이터 속 인사이트 찾기, ‘시각화’로 충분하다

“시각화만 가지고 어떻게… 분석이 좀 돼야 하지 않나요?” 그렇죠. 틀린 말은 아니네요. 근데 100% 맞는 말도 아닙니다. ‘시각화 분석(visualization analysis)’이란 말이 있습니다. 사실의 나열에 불과했던 텍스트들을 시각화 작업을 통해 그 의미를 분석할 수 있도록 하는 것을 말합니다. 일례로 시각화를 통해 우리는 데이터 속의 비교, 변화, 분포 등과 같은 상관관계들을 한눈에 보고 좀 더 쉽고 빠르게 그 가치를 알 수 있게 되는 것이죠. 그래서 데이터 시각화의 목적은 단순히 데이터를 ‘시각적으로 아름답게 디자인’하는 것보다 ‘시각적인 분석을 통해 의미를 찾을 수 있도록’ 만드는 것에 좀 더 의의를 두어야 할 필요가 있습니다. 사실 시각화 분석 작업만 제대로 해도 봐야할 데이터의 십중팔구는 충분히 인사이트를 찾을...

OECD

데이터로 풀어보는 행복에 관한 3가지 궁금증

행복한 삶을 사는 것은 누구나 바라는 일입니다. 그런데 인간이 느끼는 ‘행복'이라는 상태는 어떻게 만들어지는 것일까요? 이번 글에서는 행복이라는 주제와 관련한 다양한 데이터 시각화 자료로 개인의 행복 지수와 스트레스 지수에 영향을 미치는 3가지 요인에 대해 알아보도록 하겠습니다. 이번에 살펴볼 데이터 자료는 'The Data Behind Happiness'(플로틀리 블로그, 2016)를 원문 출처로 번역하되 일부 내용의 경우 직접 작성했습니다. 1. 데이터로 풀어보는 행복에 관한 3가지 궁금증 궁금증 1) 노력만 하면 행복해질 수 있을까? 남들보다 좀 더 열심히 일하고 노력하면 정말 행복해질 수 있을까요? 노력한 만큼 좋은 결실을 바라는 것은 당연지사이겠지만 어쩌면 개인의 노력과 그로 인한 행복은 별개의 문제일지도 모르겠습니다.  UC 리버사이드의 심리학 교수 소냐 류보머스키가 발표한 '행복도...

Embedding Projector

구글, 고차원 데이터 시각화 도구 오픈소스로 공개

구글이 텐서플로우를 활용한 데이터 시각화 도구를 오픈소스 프로젝트로 지난주 공개했다. '임베딩 프로젝터'라는 기술이다. 구글은 공식 블로그에서 "최근 머신러닝이 이미지 인식, 번역, 의료 진단 등 다양한 부분에서 성장하고 있다"라며 "머신러닝 연구원들에게는 점점 데이터를 어떻게 탐색하고 모델 안에서 통합할지가 중요해졌다"라고 말했다. 또한 "차원이 백 단위나 천 단위로 커지면서 데이터 탐색이 힘들어지는 걸림돌이 존재했다"라며 "이에 맞는 특별한 도구가 필요하다고 보았다"라며 임베딩 프로젝터를 개발한 이유를 밝혔다. 임베딩 프로젝터는 웹기반 도구로, 인터랙티브한 데이터를 분석하고 시각화할 수 있도록 도와준다. 텐서플로우를 일부 활용했으며, 사용자는 별다른 설치 없이 웹사이트에서 바로 임베딩 프로젝터를 이용할 수 있다. 고차원의 데이터를 2D, 3D 모드로 바꿔 표현할 수 있으며, 확대와 축소 및 회전화면서...

분석

스플렁크, 시각화 기능 강화한 '엔터프라이즈6.4' 공개

시각화, 데이터 처리에 있어 분석 못지않게 중요한 부분이다. '구슬이 서 말이어도 꿰어야 보배'란 속담이 있듯 데이터 분석만 해서는 일이 이뤄지지 않는다. 분석한 데이터를 원하는 기준에 따라 잘 분류해서 누구나 보기 쉬운 형태로 가공할 수 있어야 한다. 마이크로소프트, IBM을 비롯해 오라클, SAP 등이 빠른 데이터 분석과 함께 시각화 기능을 강조하는 이유다. 실시간 운영 인텔리전스 소프트웨어 업체인 스플렁크도 마찬가지다. 스플렁크는 4월6일 ‘스플렁크 엔터프라이즈6.4’와 서비스형 소프트웨어(SaaS)인 ‘스플렁크 클라우드’를 선보이면서 새롭게 추가한 시각화 기능을 주요 기능으로 내세웠다. 스플렁크 엔터프라이즈6.4와 스플렁크 클라우드는 기존과 다른 새로운 대화형 시각화 기능을 제공한다. 이 기능은 추가기능 앱 장터로 불리는 스플렁크베이스에서 오픈 라이브러리로 공유할 수 있다. 스플렁크 사용자라면, 본인 구미에...