[빅데이터분석기사 필기] Ⅲ.빅데이터 모델링 - 02. 분석기법 적용 (8) 베이지안기법
키워드🔑
확률, 교사건, 표본 평균, 표본 분산, 표본 표준편차, 표본 공분산, 상관계수, 상관계수 행렬,
조건부확률, 전확률의정리, 베이즈정리, 베이즈 확률
02. 분석기법 적용
2. 고급 분석기법
4) 베이지안 기법
(1) 확률 및 기본 통계이론
- 확률(Probability)
- 비슷한 현상이 반복해서 일어날 경우, 어떤 사건이 발생할 가능성을 숫자로 표현하는 방법
- 같은 원인에서 특정한 결과가 나타나는 비율
- 교사건(Intersection of Event)
- P(A⋂B) = 사건 A, B에 동시에 속하는 기본 결과들의 모임
- 통계 파라미터: 표본 평균, 표본 분산, 표본 표준편차, 표본 공분산, 상관계수, 상관계수 행렬
- 표본 공분산(Sample Covariance)
- 2개 이상의 변량 데이터가 주어질 경우, 각 변량간의 변화하는 양상을 나타내는 통계적 척도
- 2가지 변수(x,y)가 변하는 정도를 수로 나타냄
- 한 변수가 변할 때 다른 변수가 변하는 정도, 두 변수가 동시에 변하는 정도
- 변량(Variance): 조사내용으로서의 특성을 수량으로 나타낸 값(연속 변량, 이산 변량)
- 표본 평균: 무게 중심
- 총합 / 개수
- 표본 분산: 흩어진 정도
- 평균값의 차이에 대한 제곱의 평균
- 표본 표준편차
- 분산의 제곱근(단위 일치시킴)
- 표본 공분산
- 각 변량간의 변화하는 양상
- 상관계수
- 두 변량간의 상관관계
-
(0 ≤ ρ ≤ 1)
- 상관계수 행렬
- 각 변량같의 상관계수를 행렬로 나타낸 값
- 표본 평균: 무게 중심
- 표본 공분산(Sample Covariance)
(2) 조건부 확률
📌 어떤 사건이 일어난다는 조건에서 다른 사건이 일어날 확률
- 조건부 확률(Conditional Probability)
- 2개의 사건 A, B에 대하여
- 사건 A가 일어난다는 선행조건 하에
- 사건 B가 일어날 확률
- A → B 조건부 확률 P(B│A) = P(A⋂B) / P(A), P(A) ≠ 0
- B → A 조건부 확률 P(A│B) = P(A⋂B) / P(B), P(B) ≠ 0
(3) 전 확률의 정리
📌 사건의 원인을 나눔 → 원인이 되는 확률의 가중합으로 사건의 확률을 구함
- 전 확률의 정리(Law of Total Probability)
- 나중에 주어지는 사건 A의 확률을 구할 때
- 사건 A의 원이을 여러가지로 나누어서
- 각 원인에 대한 조건부 확률P(A│Bi)과
- 그 원인이 되는 확률P(Bi)의 곱에 의한
- 가중합으로 구할 수 있다
- 전 확률의 정리 공식 P(A) = P(B1 ⋂ A) + P(B2 ⋂ A) + … + P(Bn ⋂ A) = P(B1) P(A│B1) + P(B2) P(A│B2) + … + P(Bn) P(A│Bn) = ∑ P(Bi) P(A│Bi)
(4) 베이즈 정리
- 베이즈 정리(Bayes’s Theorem_
- 어떤 사건에 대해 관측 전 원인에 대한 가능성과 관측 후 원인 가능성 사이의 관계를 설명
- 두 확률변수의 사전확률과 사후확률 사이의 관계를 설명하는 확률이론
- 베이즈 확률
- 어떤 사건 B가
- 서로 배반인 A1, A2, … , An 중에서
- 어느 한 가지 경우로 발생하는 경우,
- 실제 B가 발생할 때, 이것이 Ai일 확률
-
P(Ai B) - B를 표본공간S 내 임의의 사상(집합)이라고 하고,
- 서로 배반인 사상 A1, A2, … , An 의 합 사상 = 표본공간S라고 하면,
- B사건을 근거로 Ai사건이 발생할 확률
댓글남기기