[빅데이터분석기사 필기] Ⅱ.빅데이터 탐색 - 02. 데이터 탐색(2)
키워드🔑 중심경향성, 산포도, 분포, 히스토그램, 막대형 그래프, 박스 플롯, 산점도, 시공간 데이터, 다변량 데이터, 비정형 데이터
키워드🔑 중심경향성, 산포도, 분포, 히스토그램, 막대형 그래프, 박스 플롯, 산점도, 시공간 데이터, 다변량 데이터, 비정형 데이터
키워드🔑 데이터 탐색, EDA, Four R’s, 저항성, 잔차해석, 자료재표현, 현시성, 상관관계 분석, 산점도, 공분산(경향), 상관계수(방향+강도)
키워드🔑 차원축소, 주성분분석(PCA), 특이값분해(SVD), 요인분석, 독립성분분석(ICA), 다차원척도법(MDS), 파생변수, 변수변환, 단순 기능 전환, 비닝, 정규화, 표준화, 불균형 데이터 처리, 임곗값이동, 앙상블기법, 언더샘플링, ENN, 토멕 링크 방법, CNN,...
키워드🔑 변수, 종속변수, 독립변수, 변수선택, 필터기법, 정보 소득, 카이제곱 검정, 피셔 스코어, 상관계수, 래퍼기법, 전진선택법, 후진제거법, 단계적방법, RFE, SFS, 유전 알고리즘, 단변량 선택, mRMR, 임베디드기법, 라쏘, 릿지, 엘라스틱넷, SelectFro...
키워드🔑 이상값, 이상값 검출, 통계 기법, ESD, 기하평균, 사분위 수, 표준화 점수, 딕슨의 Q검정, 그럽스 T-검정, 카이제곱 검정, 시각화, 머신러닝 기법, 마할라노비스 거리, LOF, iForest, 이상값 처리, 삭제, 대체법, 변환, 박스플롯 해석, 분류하여 처리
키워드🔑 데이터 전처리, 데이터 정제, 데이터 세분화, 결측값, 단순 대치법, 다중 대치법
키워드🔑 데이터 저장 시스템, 분산 파일 시스템, 데이터베이스 클러스터, NoSQL, BASE, CAP 이론
키워드🔑 데이터 적재, 데이터 적재 아키텍쳐, 서버 노드 아키텍처, 데이터 아키텍처, 네트워크 아키텍처, 플루언티드
키워드🔑 데이터 보안관리, 비식별화, 가명처리, 총계처리, 데이터값 삭제, 범주화, 데이터 마스킹, 적정성 평가, 데이터 품질검증
키워드🔑 데이터 속성, 데이터 측정 척도, 명목척도, 순서척도, 등간척도, 비율척도, 데이터 변환, 평활화, 집계, 일반화, 정규화