비즈니스

기업 비즈니스, 보안, 네트워크, 기업용 소프트웨어

arrow_downward최신기사

bi

데이터 시각화에서 정제된 데이터가 필요한 이유

데이터 시각화를 위해 필요한 정제된 데이터 데이터는 뉴스, 기사, 보고서, 발표 자료 등 다양한 분야에서 시각화의 형태로 자주 활용됩니다. 데이터 시각화가 데이터 안의 숨겨진 유의미한 의미를 쉽고 빠르게 찾을 수 있도록 돕기 때문인데요. 하지만 이는 정제된 데이터가 준비되어 있다는 것을 전제로 합니다. 그렇다면 데이터 시각화를 위해 필요한 정제된 데이터란 무엇이며 어떻게 정제해야 할까요?  · · · · · 하나. 표 형태의 데이터와 원 자료(Raw data)의 차이 우리가 일반적으로 알고 있는 데이터는 어떤 모습일까요. 주로 표 형태의 자료를 볼 수 있는데요. 표 형태의 자료들은 통계적으로 처리되지 않은 원 자료(Raw data)가 아니라 원 자료를 특정 조건에 따라 계산하여 정리한 통계 데이터를 보기 쉽게 정리한 것입니다. 그래서 표에서 값을 나타내는 하나의...

ai

AI 데이터 플랫폼 크라우드웍스, 100억원 규모 투자 유치

인공지능(AI) 학습에 필요한 데이터를 수집하고 가공해주는 플랫폼 스타트업 크라우드웍스가 총 100억원 규모의 시리즈 B 투자를 유치했다고 9월16일 밝혔다. 이번 투자에는 한국투자파트너스, HB 인베스트먼트 등 8개 투자사가 참여했다. 크라우드웍스는 지난해 DSC 인베스트먼트, BA 파트너스로부터 시리즈 A 투자를 유치한 바 있다. 크라우드웍스는 크라우드소싱 방식으로 AI에 필요한 데이터를 수집하고 가공해주는 플랫폼이다. AI 분야에서 데이터는 원유로 불린다. 딥러닝 방식의 학습에 필수적이기 때문이다. 하지만 원유에 정제 과정이 필요하듯이 데이터 역시 AI가 학습할 수 있는 방식으로 가공돼야 한다. 이 데이터 처리 작업은 대부분 사람의 수작업으로 이뤄진다는 점에서 한계에 부딪힌다. 딥러닝 방식으로 학습에 필요한 방대한 데이터양에 비해 가공 데이터의 수가 부족한 문제다. 크라우드웍스는 아마존처럼 크라우드소싱 방식으로 문제를...

DAISY

데이터 하나로 몇 개의 차트를 만들 수 있을까?

 데이터 하나로 만들어진 이 모든 차트 데이터 분석 결과 보고서나 자료를 보면, 많은 시각화 차트와 데이터 표가 포함된 경우가 많습니다. 이런 보고서를 보고 있노라면, ‘이 보고서에 정말 많은 종류의 데이터가 활용됐구나’, ‘이 모든 것을 다 이해하기는 힘들겠다’ 등의 생각이 듭니다. 데이터에 압도되는 듯한 느낌이 드는 것이죠. 그러나 꼭 그럴 필요는 없습니다. 사실 특정 조사 기관이 하나의 조사를 한다면, 해당 조사 결과 데이터는 하나로 정리되었을 것이기 때문입니다. 여기에서 데이터란 정제되지 않은 상태의 원본 데이터인 로우(raw) 데이터를 의미합니다. 이들이 보고서에 여러 개의 시각화 차트와 데이터 표를 넣은 이유는 데이터 분석 과정에서 발견한 여러 인사이트를 전달하기 위한 보조 자료로써 활용했기 때문입니다. 여기에서 우리는...