[빅데이터분석기사 필기] Ⅰ.빅데이터 분석 기획 - 01. 빅데이터의 이해(3)
01. 빅데이터의 이해
2. 빅데이터 기술 및 제도
키워드🔑
인공지능, 빅데이터, 개인정보보호, 개인정보 비식별화
2) 인공지능의 개념
(1) 인공지능의 개념
- 인공지능
- 인간의 지적능력을 인공적으로 구현하여
- 컴퓨터가 인간의 지능적인 행동, 사고를
- 모방할 수 있도록 하는 소프트웨어
- 인공지능 ⊃ 머신러닝 ⊃ 딥러닝
(2) 빅데이터와 인공지능의 관계 ⇒ 상호보완 관계
- (인공지능의 분석력, 예측력) + (빅데이터의 신뢰성, 현실성) ⇒ 의미있는 결과 도출
- 빅데이터로 말미암아 비정형 데이터 고속 분석이 가능해짐 → 1950년대에 등장한 인공지능을 최신트렌드로 끌고 올 수 있게 됨 → 자체 알고리즘으로 스스로 학습하는 딥러닝 기술 → 특정 분야에서 인간의 지능을 뛰어넘는 능력!
- 상호보완 관계
- 빅데이터는 인공지능의 구현완성도 높여줌
- 인공지능은 빅데이터의 문제해결 완성도를 높여줌
- 빅데이터 기술이 주목받는 이유: 우수한 정보처리를 바탕으로 의미있는 결과를 도출
- 빅데이터와 인공지능의 목표가 부합 → 빅데이터는 인공지능을 위한 기술이 될 가능성이 크다
3) 개인정보보호법·제도
(1) 개인정보보호: 정보 주체(개인)의 개인정보 자기 결정권을 철저히 보장하는 활동
- 개인정보 자기 결정권:
자신에 관한 정보가 언제, 어떻게, 어느 범위까지 타인에게 전달 및 이용될 수 있는지를
그 정보 주체가 스스로 결정할 수 있는 권리 - 개인정보: 살아있는 개인에 관한 정보/ 개인을 알아볼 수 있는 정보
(2) 개인정보보호의 필요성: 개인정보는 정보사회의 핵심 인프라
- 유출 시 피해 심각함/ 정보사회 핵심 인프라/ 개인정보 자기 통제권
(3) 빅데이터 개인정보보호 가이드라인
- 개인정보 비식별화/ 재식별 시 즉시 조치/ 민감정보 처리 금지
- 처리 사실, 목적 등을 공개해 투명성 확보/ 수집정보의 보호조치
(4) 개인정보보호 관련 법령
- 개인정보 보호법/ 정보통신망법/ 신용정보법
- 위치정보법/ 개인정보의 안전성 확보조치 기준
(5) 개인정보보호 내규
📌 데이터 수집 시 개인정보보호를 위한 가이드라인
- 정보보호 업무처리 지침/ 개발 보안 가이드/ 개인정보 암호화 매뉴얼
- 소프트웨어 개발 보안 구조/ 기술적, 관리적 보호
4) 개인정보 활용
(1) 개인정보 비식별화
- 개인정보 일부/전부를 삭제/대체 → 다른 정보와 쉽게 결합해도 특정 개인을 식별할 수 없도록 하는 조치
- 데이터값 삭제 / 가명처리 / 총계처리 / 범주화 / 데이터 마스킹 등
(2) 개인정보 비식별화 절차
📌 사전검토 → 비식별 조치 → 적정성 평가 → 사후관리
(3) 개인정보 비식별 조치 방법
📌 가명처리 / 총계처리 / 데이터삭제 / 범주화 / 마스킹
- 가명처리: 식별할 수 없는 다른 값으로 대체
- 휴리스틱 익명화 / 암호화 / 교환방법
- ex) 홍길동, 20대
- 총계처리: 통곗값 적용
- 총계처리 기본방식 / 부분집계 / 라운딩 / 데이터 재배열
- ex) 연구실 학생들 키 합: 650cm
- 데이터 삭제: 특정 데이터값 삭제
- 속성값 삭제 / 부분 삭제 / 준 식별자 제거를 통한 단순 익명화
- ex) 주민등록번호 → 90년대, 여성
- 데이터 범주화: 범주화(해당 그룹의 대푯값으로 변환), 범위화(구간 값으로 변환)
- 범주화 기본방식 / 랜덤 올림 / 범위 방법 / 세분 정보 제한 방법 / 제어 올림
- ex) 박씨, 20~30세
- 데이터 마스킹: 전체 또는 부분적으로 대체값(공백, *, 노이즈)으로 변환
- 임의 잡음 추가 / 공백과 대체 방법
- ex) 이OO, OO대학 재학
(4) 재식별 가능성 모니터링
- 정기적으로 모니터링 → 점검 항목 중 어느 하나에 해당하면 추가적인 비식별 조치 강구
- 내부 요인의 변화: 추가적인 정보 수집 / 이용과정에서 생긴 새로운 정보 / 신규 or 추가 구축되는 시스템 등
- 외부 환경의 변화: 새로운 재식별 사례, 기술, 연계가능한 정보가 출현하거나 공개된 것으로 알려진 경우
댓글남기기