05-04 00:07
Notice
Recent Posts
Recent Comments
관리 메뉴

Scientific Computing & Data Science

[Data Analysis] 개요 / 데이터 시각화의 중요성 본문

Data Science/Data Analysis

[Data Analysis] 개요 / 데이터 시각화의 중요성

cinema4dr12 2014. 4. 27. 22:21

데이터 시각화의 목적은 그래프 등의 형태로 표현하여 숫자 또는 문자만으로는 발견하기 어려운 패턴 또는 관계를 한 눈에 발견하기 쉽도록 하는 것이다. 시각화는 일단 멋있어 보이는 것도 중요하며 무엇보다 의미를 찾아낼 수 있도록 하여 의사결정에 기여를 해야한다. 결국 데이터를 시각화한다는 것은, 복잡한 데이터 세트(그것이 크든 작든)의 설명을 보다 효과적으로 전달하기 위함이다.

데이타 시각화의 종류는 매우 다양한데 대표적인 것으로는,


  • 바 차트 (Bar Chart)



  • 파이 차트 (Pie Chart)



  • 히트 맵 (Hear Map)



  • 빈도 워들 (Frequency Wordle)



등이 있다. 이외에도 보다 다양한 종류가 있는데 이에 대해서는 데이터 시각화에 대한 내용을 다룰 때 소개하도록 하겠다.


데이터 시각화 기법을 중심으로 분류하여 정리하면 다음과 같다:

  • 데이터 맵핑 (Data Mapping)

  • 타임 시리즈 (Time Series)

  • 관련성 및 상관관계 (Connections & Correlations)

  • 스캐터플롯 맵 (Scatterplot Map)

  • 트리, 하이라키, 반복 (Tree, Hierarchy, Recursion)

  • 네트워크 & 그래프 (Networks & Graphs)


탐구적 데이터 분석(exploratory data analysis)의 목표들은 다음과 같다:

  • 데이터 오류 감지

  • 추정에 대한 확인

  • 숨겨진 패턴 찾기

  • 적합 모델의 예비 선택

  • 변수들 간 관계 결정


데이터 시각화 및 탐구적 데이터 분석에 대한 보다 자세한 내용은 차후에 다루도록 하겠다.

Comments