[빅데이터분석기사 필기] Ⅲ.빅데이터 모델링 - 02. 분석기법 적용 (2) 의사결정나무
키워드🔑 의사결정나무, 분류함수(분류규칙), 분리기준, 성장, 가지치기, 교차타당성, 카이제곱 통계량, 지니 지수, 엔트로피 지수, 순수도, CART, C4.5 & C5.0, CHAID, QUEST
키워드🔑 의사결정나무, 분류함수(분류규칙), 분리기준, 성장, 가지치기, 교차타당성, 카이제곱 통계량, 지니 지수, 엔트로피 지수, 순수도, CART, C4.5 & C5.0, CHAID, QUEST
키워드🔑 회귀분석, 선형성, 독립성, 등분산성, 비상관성, 정상성, 추정, 최소제곱법, 회귀계수, 결정계수, F-통계량, 로지스틱회귀분석, 다중공선성
키워드🔑 파라미터, 하이퍼파라미터, 모델링, 비즈니스영향도평가, R, Python, 학습용데이터, 검증용데이터, 평가용 데이터
키워드🔑 분석모형, 통계기반, 기술통계, 상관분석, 회귀분석, 분산분석, 주성분분석, 판별분석, 데이터마이닝, 분류, 예측, 군집화, 연관규칙, 머신러닝, 지도학습, 비지도학습
키워드🔑 추론통계, 점추정, 불편성, 효율성, 일치성, 충족성, 구간추정, 신뢰수준, 신뢰구간, 가설검정, 귀무가설, 대립가설, 제 1종 오류, 제 2종 오류, 검정통계량, p-value
키워드🔑 표본추출, 확률분포, 포아송분포, 베르누이분포, 이항분포, 정규분포, 표준정규분포, T-분포, 카이제곱분포, F-분포, 표본분포
키워드🔑 기술통계, 기초통계량, 평균, 중위수, 최빈값, 범위, 분산, 표준편차, 평균의 표준오차, 분포(첨도, 왜도), 상관분석, 회귀분석, 선형성, 등분산성, 독립성, 비상관성, 정규성, 분산분석, 주성분분석, 판별분석
키워드🔑 중심경향성, 산포도, 분포, 히스토그램, 막대형 그래프, 박스 플롯, 산점도, 시공간 데이터, 다변량 데이터, 비정형 데이터
키워드🔑 데이터 탐색, EDA, Four R’s, 저항성, 잔차해석, 자료재표현, 현시성, 상관관계 분석, 산점도, 공분산(경향), 상관계수(방향+강도)
키워드🔑 차원축소, 주성분분석(PCA), 특이값분해(SVD), 요인분석, 독립성분분석(ICA), 다차원척도법(MDS), 파생변수, 변수변환, 단순 기능 전환, 비닝, 정규화, 표준화, 불균형 데이터 처리, 임곗값이동, 앙상블기법, 언더샘플링, ENN, 토멕 링크 방법, CNN,...