[빅데이터분석기사 필기] Ⅳ.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (2)
키워드🔑
시간시각화, 막대그래프, 누적 막대그래프, 선그래프, 영역차트, 계단식그래프,
공간시각화, 등치지역도, 등치선도, 도트맵, 도트플롯맵, 버블맵, 버블플롯맵, 카토그램,
관계시각화, 산점도, 산점도 행렬, 버블차트, 히스토그램,
비교시각화, 플로팅바차트, 히트맵, 체르노프페이스, 스타차트, 평행좌표그래프, 인포그래픽
02. 분석 결과 해석 및 활용
2. 분석 결과 시각화
1) 시공간 시각화
(1) 시간 시각화
- 시간에 따른 데이터 변화를 표현
- 주요 관심요소: 경향성, 트렌드, 추세
- 시간 시각화 유형: 막대그래프, 누적 막대그래프, 선그래프, 영역차트, 계단식그래프
막대그래프 | 누적 막대그래프 | 선 그래프 | 영역 차트 | 계단식 그래프 |
---|---|---|---|---|
Bar Graph | Stacked Bar Graph | Line Graph | Area Chart | Step Line Graph |
- 동일 너비 막대 여러개 - 막대: 특정 범주 - R: geom_bar() |
- 전체 비율 보여줌 - 여러범주를 동시에 차트로 표현 가능 |
- 점: 수량 - 점들을 선분으로 이음 - 시간에 따른 크기변화 |
- 색을 채운 영역 y축 값은 0부터 시작 - 시간에 따른 크기변화 |
- 변화가 생길 때까지 x축과 평행한 선 유지 - 값이 변하는 지점에서 급격하게 뛰어오름 |
(2) 공간 시각화
- 지도 상에 해당하는 정보를 표현
- 대부분 위도&경도 사용함
- R에서 정적/동적인 방법으로 시각화 가능
- 정적 공간 시각화 패키지: maps, mapproj, maptools, mapplots
- 동적 공간 시각화 패키지: RgoogleMaps, ggmap
- 공간 시각화 유형: 등치지역도, 등치선도, 도트맵, 도트플롯맵, 버블맵, 버블 플롯맵, 카토그램
등치지역도 | 등치선도 | 도트맵/도트 플롯맵 | 버블맵/버블 플롯맵 | 카토그램 |
---|---|---|---|---|
Choropleth Map | Isometric Map | Dot (Plot) Map | Bubble (Plot) Map | Catogram |
- 색상으로 구분 - 데이터값 크기에 따라 채도/밝기 변화 - 인구밀도가 다른 경우 왜곡되는 결점 존재함 |
- 등치지역도 결점 극복 - 데이터값 크기에 따라 색상 농도 변화 |
- 산점도 처럼 점으로 표현 - 활용: 시간 경과에 따라 점진적인 확산을 나타내는 경우 |
- 데이터값 크기에 따라 서로 다른 크기의 원형으로 표시 | - 데이터 값 크기에 따라 면적을 왜곡시킴 - 지리적 형상크기를 조절 - 재구성된 지도 |
2) 관계 시각화
(1) 관계 시각화
- 관계 시각화
- 다변량 데이터 사이에 존재하는 변수간 연관성/분포/패터을 찾는 시각화 방법
- 상관관계를 시각화하는 기법
- 한 가지의 요소의 변화가 다른 요소의 변화와 관련이 있는지 표현하는 시각화 방법
- 관계 시각화 유형: 산점도, 산점도 행렬, 버블차트, 히스토그램
산점도 | 산점도 행렬 | 버블 차트 | 히스토그램 |
---|---|---|---|
Scatter Plot | Scatter Plot Matrix | Bubble Chart | Histogram |
- 두 변수 각각 X축, Y축 - (X, Y) 순서쌍이 하나의 점 - R: geom_point() - 상관관계/군집화/이상값 패턴 파악에 유용함 |
- 다변량 변수 데이터에서 가능한 모든 변수 쌍에 대한 산점도를 행렬 형태로 표현 |
산점도의 점/마크에 여러 의미를 부여하여 확장된 차트 |
- 자료분포 형태를 직사각형 형태로 시각화 - 특정 변수에 대한 구간별 빈도수 |
3) 비교 시각화
(1) 비교 시각화
- 다변량 변수 데이터를 제한된 2차원에 효과적으로 표현
- 비교 시각화 유형: 플로팅바차트, 히트맵, 체르노프페이스, 스타차트, 평행좌표그래프
플로팅 바 차트 | 히트맵 | 체르노프 페이스 | 스타 차트 | 평행 좌표 그래프 |
---|---|---|---|---|
Floating Bar Chart | Heat Map | Chernoff Faces | Star Chart | Parallel Coordinates |
- 최소~최대 수치까지 막대가 걸쳐있게 표현 - 범주 내 값의 다양성, 중복 및 이상값 파악 - 간트차트라고도 부름 |
- 여러 변수를 비교 - 각 변수는 열 방향 - 칸별로 색상 구분 - 최솟값 옅은 색 - 최댓값 진한 색 |
- 얼굴 하나로 표현 - 데이터를 눈코입 등과 일대일 대응 |
- 각 변수의 표시 지점을 연결하여 별모양 도형으로 나타냄 - 최솟값은 중심점 - 최댓값은 가장 먼 끝점 |
- 다변량 데이터를 평면에 가시화 |
4) 인포그래픽
(1) 인포그래픽(Infographics)
- 인포그래픽
- 중요 정보를 하나의 그래픽으로 표현함
- 복잡하고 어려운 정보/데이터를 쉽고 명확하게 이해할 수 있도록
- 그래픽과 텍스트가 균형을 이루도록 조합
- 인포그래픽 유형: 지도형, 도표형, 스토리텔링형, 타임라인형, 비교분석형, 만화형
- 활용방법: 퍼블릭 데이터 활용, 템플릿과 아이콘 배치, 무료 툴 활용, 저작권 설정, 인포그래픽스 홍보
댓글남기기