빅데이터/Data Visualization

데이터 시각화 02 - 시각화 기술

H-V 2022. 1. 20. 13:57

유투버 '이수안 컴퓨터' 강의 참조

 

 

 

01 시각화 차트 

  • 시각화를 통해 어떤것을 보여 줄 것인가에 따라 차트 선택이 달라진다
    (비교/관계/구성/분배 등)

 

  • 'http://datavizcatalogue.com' 을 통해 어떠한 종류의 차트들이 있고 어떤식으로 사용을 하는지 볼 수 있다. 

 

  • 시각화 뿐만아니라 시각화 프로젝트를 어떻게 구성하는지에 대한 사이트도 참조 하자 ('https://datavizproject.com/')

 

 

 

 

02 차트 종류

  • 차트 종류는 대략 14가지 정도가 많이 쓰인다. 그중 몇개를 보도록 하자

- 막대 그래프

  • x와 y축을 기준으로 '막대'를 써 그래프로 표현

* 스택 막대 그래프

 

 

 

- 도트 플롯

  • '점'을 써서 표현하며 많은 양의 막대대신 쓰면 유용 하다
  • 항상 정렬을 하는것이 보는 입장에서 좋다

 

 

- 히트맵

  • 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합시킨 단어로, 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분포 형태의 비쥬얼한 그래픽으로 출력하는 것이 특징

 

 

 

 

03 시각화 기술

 

- 시간 시각화

  • 경제활동과 관련된 시계열 (국내 총 생산(GDP), 소비자물가지수, 수출액 등) 을 이해하기 위해 사용
  • 물리적 활동과 관련된 시계열 (일일강수량, 기온, 지진발생건수 등)을 이해하기 위해 사용
  • 회사 경영, 인구관련, 품질관리, 통신 공학 등 시계열과 관련된 결과물에대한 이해와 해석을 위해 사용
  • Scatter Plot, 라인 차트, 계단식 차트, 박스플롯 등을 사용

 

 

 

 

- 분포 시각화

  • 분포 데이터를 구분할 때 사용. 샘플 측정 범위에서 분류를 시킴
  • 분포 데이터는 최대, 최소, 전체 분포의 특성을 가짐
  • 보통 전체의 부분을 나타내기 떄문에 데이터의 양이나 크기가 어떻게 분포되어있는지에 대한 정보를 얻기 위해 사용
  • 단일, 다중, 경험적 분포 등 여러가지로 활용이 됨
  • 주로 막대/파이/트리맵을 사용

 

 

 

- 관계 시각화

  • 어떠한 항목이 다른 항목에 어떤 영향을 주는지 알기 위해 사용
  • 스캐터플롯, 히스토그램, 버블 차트등을 써서 표현

 

 

- 비교 시각화

  • 다양한 변수의 특징을 한 번에 비교하여 전체적인 정보 표현이 가능
  • 히트맵, 체리노프페이스, 스타차트 등을 써서 표현