[Data Mining] 딥러닝의 기초 - 퍼셉트론, 인공신경망
딥러닝의 기초 - 퍼셉트론, 인공신경망
표기 방식

퍼셉트론
Frank Rosenblatt(1957)

참고 - 활성함수

퍼셉트론의 한계

다층퍼셉트론
- 퍼셉트론의 선형분류기를 비선형분류기로
- 다수의 인공신경세포(노드, Node)로 구성된 층(Layer)으로 구분
- 입력층, 은닉층(Hidden Layer), 출력층으로 구성

은닉층의 역할
- 도메인을 선형분류 가능하도록 변화시킴

수식으로 표현하는 다층퍼셉트론
가중치의 표현

인공신경세포의 표현

은닉층의 인공신경세포(노드)의 값 계산

다층퍼셉트론의 출력층 노드의 계산

입력층 → 은닉층의 행렬-벡터 표현

입력층 → 출력층의 행렬-벡터 표현(앞먹임, Feed-forward or forward pass)

다층퍼셉트론과 행렬곱
- 지금까지의 수식은 하나의 데이터에 대한 결과
- 다층퍼셉트론의 입력층 → 출력층의 계산은 데이터에 대해 “독립”
- 데이터 간의 의존성이 없기 때문에 동시에 계산 가능
- 입력값-출력값의 데이터가 100개 있다고 가정할 때

- 입력층 → 은닉층의 계산의 변화

[참고] 행렬곱이 왜 중요한가?
- 많은 계산을 요구하는 O(n^3) 알고리즘
- 4만 x 4만 행렬곱에 필요한 메모리는 약 12GB

- 행렬곱은 계산자원(CPU, GPU, FPGA, AP, …)을 가장 잘 활용할 수 있는 알고리즘

댓글남기기