빅데이터/Data Visualization
데이터 시각화 02 - 시각화 기술
H-V
2022. 1. 20. 13:57
유투버 '이수안 컴퓨터' 강의 참조
01 시각화 차트
- 시각화를 통해 어떤것을 보여 줄 것인가에 따라 차트 선택이 달라진다
(비교/관계/구성/분배 등)
- 'http://datavizcatalogue.com' 을 통해 어떠한 종류의 차트들이 있고 어떤식으로 사용을 하는지 볼 수 있다.
- 시각화 뿐만아니라 시각화 프로젝트를 어떻게 구성하는지에 대한 사이트도 참조 하자 ('https://datavizproject.com/')
02 차트 종류
- 차트 종류는 대략 14가지 정도가 많이 쓰인다. 그중 몇개를 보도록 하자
- 막대 그래프
- x와 y축을 기준으로 '막대'를 써 그래프로 표현
* 스택 막대 그래프
- 도트 플롯
- '점'을 써서 표현하며 많은 양의 막대대신 쓰면 유용 하다
- 항상 정렬을 하는것이 보는 입장에서 좋다
- 히트맵
- 열을 뜻하는 히트(heat)와 지도를 뜻하는 맵(map)을 결합시킨 단어로, 색상으로 표현할 수 있는 다양한 정보를 일정한 이미지위에 열분포 형태의 비쥬얼한 그래픽으로 출력하는 것이 특징
03 시각화 기술
- 시간/분포/관계/비교/인포그래픽스로 기술이 나뉜다 ('https://paullydia.tistory.com/70' 블로그 참조)
- 시간 시각화
- 경제활동과 관련된 시계열 (국내 총 생산(GDP), 소비자물가지수, 수출액 등) 을 이해하기 위해 사용
- 물리적 활동과 관련된 시계열 (일일강수량, 기온, 지진발생건수 등)을 이해하기 위해 사용
- 회사 경영, 인구관련, 품질관리, 통신 공학 등 시계열과 관련된 결과물에대한 이해와 해석을 위해 사용
- Scatter Plot, 라인 차트, 계단식 차트, 박스플롯 등을 사용
- 분포 시각화
- 분포 데이터를 구분할 때 사용. 샘플 측정 범위에서 분류를 시킴
- 분포 데이터는 최대, 최소, 전체 분포의 특성을 가짐
- 보통 전체의 부분을 나타내기 떄문에 데이터의 양이나 크기가 어떻게 분포되어있는지에 대한 정보를 얻기 위해 사용
- 단일, 다중, 경험적 분포 등 여러가지로 활용이 됨
- 주로 막대/파이/트리맵을 사용
- 관계 시각화
- 어떠한 항목이 다른 항목에 어떤 영향을 주는지 알기 위해 사용
- 스캐터플롯, 히스토그램, 버블 차트등을 써서 표현
- 비교 시각화
- 다양한 변수의 특징을 한 번에 비교하여 전체적인 정보 표현이 가능
- 히트맵, 체리노프페이스, 스타차트 등을 써서 표현