[빅데이터분석기사 필기] Ⅳ.빅데이터 결과 해석 - 02. 분석 결과 해석 및 활용 (1)
키워드🔑
데이터시각화, 시간시각화, 분포시각화, 관계시각화, 비교시각화, 공간시각화,
시각화도구, 태블로, 인포그램, 차트블록, 데이터래퍼,
비즈니스기여도평가, 총소유비용(TCO), 투자대비효과(ROI), 순현재가치(NPV), 내부수익률(IRR), 투자회수기간(PP)
02. 분석 결과 해석 및 활용
1. 분석 결과 해석
1) 분석 모형 해석
(1) 데이터 시각화(Data Visualization)
- 데이터 시각화
- 데이터에 대한 이해를 돕기위해, 그림/도형과 같은 그래픽 요소들을 이용하여 데이터를 묘사/표현하는 과정
- 선/막대/원 등으 ㅣ기하나 도형과 같은 양식을 이용하여 데이터 특징을 설명할 수 있는 모양으로 만들거나 색상/레이블 등의 특성을 활용하여 데이터를 표현한다
- 데이터 시각화 기능 구분
- 설명 기능: 전달하려는 메세지, 주요한 분석결과를 설명 → 사용자에게 명확하게 보여줘야함
- 탐색 기능: 데이터에 숨겨진 관계와 패턴을 찾기 위함 → 사용자가 직접 탐색함
- 표현 기능: 이야기 전달과 공감을 불러일으키기 위함 → 예술적 표현, 작품
- 데이터 시각화의 목적
- 사용자가 주제에 대해 더 잘 이해하고 느끼게 하는 것
- 정보 전달: 전달 & 분석 → 실용적 & 과학적인 측면
- 설득: 공감 & 설득 → 추상적 & 예술적인 측면
- 데이터 시각화 절차
- 구조화 → 시각화 → 시각표현
- 구조화: 목표 설정/데이터 표현 규칙&패턴 탐색/시각화 요건정의/시나리오&스토리 구성
- 시각표현: 그래프 보정&품질향상/전달요소 강조/인터랙션 기능 적용/결과물 검증
(2) 데이터 시각화 유형
📌 시간/분포/관계/비교/공간 시각화
시간 시각화 | 분포 시각화 | 관계 시각화 | 비교 시각화 | 공간 시각화 |
---|---|---|---|---|
시간 흐름에 따른 변화 경향/트렌드 파악 |
분류에따른 변화를 최대/최소/전체분포 등으로 표현 |
집단간 상관관계 확인 → 다른수치 변화 예측 |
데이터간 차이점/유사성 관계확인 |
지도를 통해 시점에 따른 경향/차이 확인 |
막대 그래프 점 그래프 |
파이 차트 도넛 차트 트리맵 |
산점도 버블차트 히스토그램 |
히트맵 평행 좌표 그래프 체르노프 페이스 |
등치선도 도트맵 카토그램 |
(3) 시각화 분석을 위한 데이터 유형
📌 범주 및 비율 / 추세 및 패턴 / 관계 및 연결
- 범주 및 비율
- 범위: 값의 범위 파악
- 분포: 개발 변수&변수 조합이 가지는 분포 형태 파악
- 순위: 크기 기준으로 순서 확인 - 최댓값/최솟값/중위수/사분위수
- 측정: 값이 가지는 중요성 파악 - 숫자 자체보다 깊이있는 조사
- 추세 & 패턴:
- 추세 방향: 값이 증가/감소
- 추세 패턴: 선형/지수형 or 변화없음
- 추세 속도: 어느 정도로 추세가 급한가
- 변동 패턴: 반복패턴, 변동폭, 무작위 패턴 등
- 중요도: 확인한 패턴이 중요 or 잡음 파악
- 교차: 변수간 교차(점), 중첩 발생 여부 확인
- 관계 & 연결
- 예외: 이상값과 같은 정상범위 벗어난 변수 파악
- 상관성: 변수간 관련성 강한/약한 상관관계 존재 확인
- 연관성: 변수와 값의 조합간 의미있는 관계 파악
- 계층 관계: 데이터 범주의 구성/분포/관련성 파악
(4) 빅데이터 시각화 도구
📌 태블로 / 인포그램 / 차트블록 / 데이터래퍼
- 태블로(Tableau): 데이트를 클라우드에 저장 → 차트/그래프/지도 등의 다양한 그래픽 기능 제공
- 인포그램(Infogram): 실시간으로 인포그래픽을 연동해줌
- 차트 블록(Chart Blocks): 코딩없이 데이터베이스 형태의 데이터를 쉽게 시각화 → 웹기반 차트 구현
- 데이터 래퍼(Data Wrapper): 사용자 목적에 따라 제작할 수 있는 레이아웃 제공 → 차트/맵으로 데이터를 변환
2) 비즈니스 기여도 평가
(1) 비즈니스 기여도 평가
- 비즈니스 기여도 평가
- 사업수행에 영향을 주는 요소를 수치화된 자료형태로 산출하는 평가방법
- 비즈니스 기여도 평가지표: 총소유비용/투자대비효과/순현재가치/내부수익률/투자회수기간
총 소유 비용 | 투자 대비 효과 | 순 현재가치 | 내부 수익률 | 투자 회수 기간 |
---|---|---|---|---|
TCO | ROI | NPV | IRR | PP |
한 자산을 획득하려 할때 주어진 기간동안 모든 연관비용을 고려 |
자본 투자에 따른 순 효과의 비율 (투자 타당성) |
특정시점의 투자금액과 매출금액의 차이를 이자율로 고려 |
순 현재가치를 0으로 만드는 할인율 (연단위 기대수익 규모) |
누계 투자금액과 매출금액의 합이 같아지는 기간 (흑자 전환 시점) |
- 고려사항
- 효과 검증: 검출률 증가, 향상도 개선 등의 효과 제시
- 성능 검증: 시뮬레이션을 통한 처리량, 대기시간, 대기행렬 감소
- 중복 검증: 타 모델링과의 중복에 따른 효과를 통제/제시할 수 있어야 함
- 최적화 검증: 최적화를 통해 목적함수가 증가한 만큼의 효과 제시
댓글남기기