-
데이터 시각화 03 - 인터렉티브 시각화 / 시각화 디자인 원칙빅데이터/Data Visualization 2022. 1. 20. 17:07
유투버 '이수안 컴퓨터' 강의 참조
인터랙티브 데이터 시각화란?
- 최근 '인터랙티브 콘텐츠' 가 이슈가 되고 있는데 인터랙티브 콘텐츠란 한 방향으로 사용자에게 제공되는 콘텐츠가 아닌 콘텐츠 내에서 여러가지 방식으로 액션하고 이에 따라 변화하는 콘텐츠를 기반으로 쌍뱡향 소통을 하는 콘텐츠를 일컫는다.
- 인터랙티브 콘텐츠는 기각화와 접목되었을때도 그 효과가 발휘되는데 사용자의 자유로운 데이터 탐색과 인사이트 도출을 돕고 인터랙티브 시각화 차트를 활용해 스토리텔링 강화 및 사용자 데이터 활용 경험을 가능하게 하는것이 큰 장점
- 다음 링크(https://www.gapminder.org/tools/#$chart-type=bubbles&url=v1)를 들어가보면 인터랙티브가 대략 어떤것인지 볼 수 있다.
인터랙티브 시각화 툴 - 태블로(Tableau)
- 데이터 시각화 툴중 하나로 다른 BI솔루션에 비해 데이터 시각화 자유도가 높고 필요한 기능을 대부분 지원이 가능하다
- 데이터 연동 및 많은 양의 데이터를 빠르게 처리 가능
- 차트를 그릴때 추천형식으로 쉽게 그릴 수 있음
- 데이터 분석시에 어려운 통계 기능을 손쉽게 하도록 기능 제공
- 시각화 대시보드 및 다양한 기능도 함께 제공
- 무료이나 유료를 쓰면 더욱더 다양한 기능을 쓸 수 있음
인터랙티브 차트 예제
▶ 시각화 원칙
01 게슈탈트 이론
- 독일어로 형태 혹은 양식이라는 뜻으로 형태를 지각하는 방법을 담은 원칙으로 일컫음
- '전체는 독립적으로 존재하는 부분의 합보다 더 큰 것으로 인식 된다'라는 이론을 기반으로 함
- 출현(Emergence)
- 사람들은 일반적인 윤곽의 형태로 요소들을 먼저 식별하는 경향이 있음
- 뇌는 복잡한 물체보다 단순하고 잘 정의된 물체를 더 빨리 인식
- 구상화(Reification)
- 사람들은 전체 중 일부가 없을때도 사물을 인식 함
- 우리 뇌는 기존의 지식을 토대로 완성되지 않은 형태를 완성시켜 인지 가능
- 다중 안정성(Multi-Stablity)
- 사람들은 모호한 물체를 여러 가지 방식으로 해석
- 우리 뇌는 확실한 것을 좋아하기 때문에 인식한 여러 관점 중 한가지만 인식
- 따라서 다른 관점은 인지하기 어려움
- 불변성(Invariance)
- 사람들은 회전하거나 크기를 변화해도 하나의 개체로 인식
- 우리 뇌는 관점, 조명, 색상, 크기등의 변화에도 불구하고 사물들이 일정하고 불변하다고 인지하는 경향이 있음
- 근접성(Proximity)
- 서로 가깝게 배치 된 요소는 더 멀리 떨어진 요소보다 관련성이 높은 것으로 인식
- 이러한 방식으로 다른 요소는 주로 개별 요소가아닌 그룹으로 관주
- 공통 영역(Common Region)
- 근접성 원리와 비슷하게 동일한 영역 내에 배치되는 요소는 하나의 그룹으로 인식
- 유사성(Similarity)
- 비슷한 시각 특성을 공유하는 요소는 그렇지 않은 요소보다 더 관련이 있다고 인식
- 폐합(Closure)
- 완성되지 않은 형태는 종종 인식 할 수 있는 패턴 또는 그림으로 인식
- 폐합의 원칙은 형태가 불완전하거나 일부가 포함되지 않은 경우에도 발생
- 대칭(Symmetry)
- 대칭 요소는 거리에 관계없이 소석되어있는것으로 인식되어 견고함과 질서를 느끼게 함
- 연속성(Continuation)
- 선 또는 부드러운 곡선으로 배열 된 요소는 무작위로 또는 거친선으로 배열 된 요소보다 관련된다고 인식
- 공동운명(Common Fate)
- 같은 방향으로 움직이는 요소는 관련이 있다고 인식
- 다른 방향은 관련이 없다고 인식
02 비례 잉크의 원리
- 시각화에서 음영 처리된 영역의 크기는 해당 영역이 나타내는 데이터 값에 비례함
- 예를 들어 0과 다른 값으로 시작하는 막대를 그리면 막대 길이와 막대 끝점의 길이가 모순되는 정보를 전달하며, 동일한 요소를 가진 서로 다른 두값을 보여주기떄문에 내부적으로 영관이 없어 보임
- 막대, 사각형, 임의 형상의 음영 영역 또는 표시된 데이터 값과 일관되거나 일치하지 않을 수 있는 가시적 범위가 분명한 기타 요소를 사용할 때 마다 유사한 문제 발생이 가능하며 모든 경우에 모순이 없도록 해야함
03 재현성 및 반복성
- 시각화는 plotted 데이터를 사용 할 수 있고, 적용되었을 수 있는 데이터 변환이 정확하게 지정된 경우 재현이 가능
- 예를 들어 그림을 그리고 나서 그린 정확한 데이터를 보내준다면 실질적으로 비슷하게 보이는 그림을 준비 할 수 있음
- 동일한 데이터를 표시하기 위해 약간 다른 글꼴이나 색상, 포인트 크기를 사용할 수 있어서 두 수치는 정확히 동일하지 않을수 있지만 동일한 메세지를 전달하므로 서로 복제함
- 원시 데이터에서 마지막 픽셀까지 정확하게 동일한 시각적 외관을 재현 할 수있다면 시각화는 반복 가능
(지터와 같이 그림 속에 임의의 요소가 있더라도 그러한 요소들은 반복 가능한 방식으로 지정되어야 하고 미래에 재생성이 가능해야함) - 랜덤 데이터의 경우 일반적으로 반복성은 시드를 설정하고 기록하는 특정 난수 생성기를 지정해야 함
04 내용과 디자인의 분리
- 좋은 시각화 소프트웨어는 그림의 내용과 디자인에 대해 따로 생각 할 수 있어야 함
- 콘텐츠별로 특정 데이터에 맞게 알맞은 유형과 차트를 참조 해야 함
- 디자인은 전경색, 배경색, 글꼴, 축/플롯 제목 등 특징을 잘 설명해야 함
같은 데이터라도 다른 디자인으로 표현 가능 05 스토리 텔링
- 대부분의 데이터 시각화는 소통을 목적으로 이루어짐
- 데이터에 대한 통찰력을 가지고 있고 잠재적인 청중을 가지고 있으며 통찰력을 청중들에게 전달하려고 함
- 성공적인 스토리 텔링을 위해서는 분명하고 흥미 진진한 이야기를 제시해야함
- 스토리란?
- 사실적이거나 발명된 관찰, 사건들의 집합등 청중들에게 감정적인 반응을 일키티는 순서로 제시
- 긴장에서 해결로 가는 흐름을 스토리 아크(Arc)라고 하며 좋은 스토리에는 명확한 아크가 있음
- 일반적인 그림을 그려라
- 가장 중요한것은 청중들이 이해할수 있어야 함
- 청중들이 그림을 보고 바로 유추할수 있어야 주요 경향과 관계를 이해 할 수 있도록 그려야 함
- 독자들이 시각화의 의미를 이해하고 데이터가 주는 패턴, 의미등을 볼 수 있도록 모든것을 할 필요가 있음
- 가능한 단순화 하고 스토리에 불필요한 모든 특징들을 제거하고 중요한 포인트만 남겨야 함
나쁜 시각화의 예 좋은 시각화의 예 06 복잡한 그림을 향해 쌓기
- 때때로 많은 양의 정보를 한번에 포함하여 보여 주고 싶기도 하는데 이때 마지막에 완전히 복잡하게 보여주기 전에 먼저 간단한 버전의 그림을 보여주고 시작하면 이해하기 쉬움
07 그림이 기억에 남도록 하라
- 막대그래프를 예로 단순하고 깨끗하며, 산만함을 피하고 읽귀 쉬우며 중요한 요점에 집중이 가능함
- 단순한 그림들은 결국 일반적이게 보이며 기억에 남기 힘듬
- 데이터 집합에 관련된 사물이나 그림등 특징을 반양함으로써 시각적 요소를 추가하여 기억에 남도록 가능
08 일반성을 가지며 반복하지 마라
- 지나친 반복성은 이해력과 집중력을 흐트림
왼쪽은 단순 반복 그래프, 오른쪽은 다른 그래프들을 이용하여 보여줌 '빅데이터 > Data Visualization' 카테고리의 다른 글
데이터 시각화 06 - Matplotlib (DF활용/누적 막대/다중 막대/원그래프) (0) 2022.01.22 데이터 시각화 05 - Matplotlib (저장/텍스트/여러 데이터/막대그래프) (0) 2022.01.21 데이터 시각화 04 - Matplotlib (기본/스타일) (0) 2022.01.21 데이터 시각화 02 - 시각화 기술 (0) 2022.01.20 데이터 시각화 01 - 개념, 역사 그리고 기법 (0) 2022.01.16