데이터 시각화(Data Visualization)는 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달되는 과정
데이터 시각화의 목적은 도표(Graph)라는 수단을 통해 정보를 명확하고 효과적으로 전달하는 것.
이 외에도 여러가지 그래프들이 있다!
디지털 시대의 인간들은 영상/디지털 매체/클라우드 서비스 등을 통해 무한정의 데이터에 노출이 되어있으며 이와같은 환경의 변화에 따라 데이터 표현과 수용방식의 변화가 요구 되고 있다
무한정에 가까운 정보들을 시각적으로 묘사하고 필요한 정보만 효율적이고 명확하게 제공하는 데이터 시각화의 필요성이 점점 증가 하고 있다. 예전의 전통적 시각화 기술들은 시스템 로그나 실험 분석 결과등 한정된 데이터에 대한 단순 통계정보를 그래프로 표현 했다면 현재 빅데이터 시대에서는 빅데이터 시각화 기술을 통해 모든 데이터를 무한정 데이터를 보다 잘 요약하고 한눈에 살펴볼 수 있도록 시각화 방법론의 중요성이 계속해서 커지고 있다
빅데이터 시각화에서는 '미적 형태' 와 '기능성' 두가지 모두를 가져가는것이 강조 되고 데이터들의 연결과 그룹핑을 표현하는데 중점을 둔다
02 데이터 시각화 단계
'Ben Fry' 미국 데이터 시각화 전문가는 데이터 시각화 단계를 7가지로 나누었다.
획득 → 분석 → 필터 → 마이닝 → 표현 → 정제 → 소통 으로 진행 된다.
획득(Acquire) 디스크 파일이나 네트워크등을 통해 소스로부터 데이터를 얻는다
분석(Parse) 데이터의 의미에 대한 구조를 제공하고 카테고리별로 분류 및 정렬
필터(Filter) 관심 있는 데이터를 제외하고 모든 데이터 제거
마이닝(Mining) 패턴을 식별하거나 수학적 문맥에 데이터를 배치하는 방법. 통계/데이터 마이닝 방법 적용
표현(Represent) 막대 그래프, 목록 또는 트리같은 기본 시각적 모델 선택
정제(Refine) 기본 표현을 개선하여 보다 선명하고 시각적으로 매력적이게 되도록 함
소통(Interact) 데이터를 조작하거나 볼 수 있는 기능을 제어하는 방법을 추가
데이터 시각화는 나폴레옹이 전쟁을 했을 당시 부터 사용이 된걸로 추정이 된다.
전쟁 시작 부터 끝까지 군인들의 수를 표현 해 놨다
또는 영국에서 콜레라가 발생 했을 당시 콜레라 원인을 알고 싶어 발생한 지역을 다니면서 정보를 수집하고 수집된 지역을 지도위에 표시했더니 당시 이 지역 주민들이 사용하던 워터 펌프를 중심으로 콜레라가 발생한것을 발견
크림 전쟁 당시 나이팅게일은 전장에서의 부상보다 병원의 열악한 위생환경으로 사망하는 사람들이 더 많다는것을 알게 되었고 이를 글과 표만으로는 부족하다 느꼈고 여기에 정보를 조금 더 효과적으로 전달하기위해 '로즈다이어그램(나이팅게일 차트)'를 써서 전달하였음.
역사 차트 또한 쉽게 볼 수 있도록 시각적으로 표현이 되었다.
02 데이터 시각화 기법
- 데이터 시각화 기법은 '미학' 의 중요성이 대두 된다.
- 이 미학은 위치, 모양, 크기, 색, 선폭, 선 종류 등으로 나타낸다.
- 데이터 시각화 시의 사용되는 데이터 유형
▶ 데이터가 아래와 같이 주어진다면 어떻게 시각화 처리를 할 것인가?
스케일 Position(위치)/Shape(모양)/Color(색상) 을 고려
▶ 히트맵/꺽은선 그래프 등으로 위치-모양-색상을 고려하여 시각화가 가능하다
좌표계와 축 시각화를 할때에는 좌표와 축 방향을 잘 이해야해하고 좌표와 축에 적절한 설명이 들어가야 한다.