2 분 소요

01. 빅데이터의 이해

2. 빅데이터 기술 및 제도

키워드🔑
인공지능, 빅데이터, 개인정보보호, 개인정보 비식별화

2) 인공지능의 개념


(1) 인공지능의 개념

  • 인공지능
    • 인간의 지적능력을 인공적으로 구현하여
    • 컴퓨터가 인간의 지능적인 행동, 사고를
    • 모방할 수 있도록 하는 소프트웨어
  • 인공지능 ⊃ 머신러닝 ⊃ 딥러닝


(2) 빅데이터와 인공지능의 관계 ⇒ 상호보완 관계

  • (인공지능의 분석력, 예측력) + (빅데이터의 신뢰성, 현실성) ⇒ 의미있는 결과 도출
  • 빅데이터로 말미암아 비정형 데이터 고속 분석이 가능해짐 → 1950년대에 등장한 인공지능을 최신트렌드로 끌고 올 수 있게 됨 → 자체 알고리즘으로 스스로 학습하는 딥러닝 기술 → 특정 분야에서 인간의 지능을 뛰어넘는 능력!
  • 상호보완 관계
    • 빅데이터는 인공지능의 구현완성도 높여줌
    • 인공지능은 빅데이터의 문제해결 완성도를 높여줌
  • 빅데이터 기술이 주목받는 이유: 우수한 정보처리를 바탕으로 의미있는 결과를 도출
  • 빅데이터와 인공지능의 목표가 부합 → 빅데이터는 인공지능을 위한 기술이 될 가능성이 크다

3) 개인정보보호법·제도


(1) 개인정보보호: 정보 주체(개인)의 개인정보 자기 결정권을 철저히 보장하는 활동

  • 개인정보 자기 결정권:
    자신에 관한 정보가 언제, 어떻게, 어느 범위까지 타인에게 전달 및 이용될 수 있는지를
    그 정보 주체가 스스로 결정할 수 있는 권리
  • 개인정보: 살아있는 개인에 관한 정보/ 개인을 알아볼 수 있는 정보


(2) 개인정보보호의 필요성: 개인정보는 정보사회의 핵심 인프라

  • 유출 시 피해 심각함/ 정보사회 핵심 인프라/ 개인정보 자기 통제권


(3) 빅데이터 개인정보보호 가이드라인

  • 개인정보 비식별화/ 재식별 시 즉시 조치/ 민감정보 처리 금지
  • 처리 사실, 목적 등을 공개해 투명성 확보/ 수집정보의 보호조치


(4) 개인정보보호 관련 법령

  • 개인정보 보호법/ 정보통신망법/ 신용정보법
  • 위치정보법/ 개인정보의 안전성 확보조치 기준


(5) 개인정보보호 내규
📌 데이터 수집 시 개인정보보호를 위한 가이드라인

  • 정보보호 업무처리 지침/ 개발 보안 가이드/ 개인정보 암호화 매뉴얼
  • 소프트웨어 개발 보안 구조/ 기술적, 관리적 보호

4) 개인정보 활용


(1) 개인정보 비식별화

  • 개인정보 일부/전부를 삭제/대체 → 다른 정보와 쉽게 결합해도 특정 개인을 식별할 수 없도록 하는 조치
  • 데이터값 삭제 / 가명처리 / 총계처리 / 범주화 / 데이터 마스킹 등


(2) 개인정보 비식별화 절차
📌 사전검토 → 비식별 조치 → 적정성 평가 → 사후관리


(3) 개인정보 비식별 조치 방법
📌 가명처리 / 총계처리 / 데이터삭제 / 범주화 / 마스킹

  • 가명처리: 식별할 수 없는 다른 값으로 대체
    • 휴리스틱 익명화 / 암호화 / 교환방법
    • ex) 홍길동, 20대
  • 총계처리: 통곗값 적용
    • 총계처리 기본방식 / 부분집계 / 라운딩 / 데이터 재배열
    • ex) 연구실 학생들 키 합: 650cm
  • 데이터 삭제: 특정 데이터값 삭제
    • 속성값 삭제 / 부분 삭제 / 준 식별자 제거를 통한 단순 익명화
    • ex) 주민등록번호 → 90년대, 여성
  • 데이터 범주화: 범주화(해당 그룹의 대푯값으로 변환), 범위화(구간 값으로 변환)
    • 범주화 기본방식 / 랜덤 올림 / 범위 방법 / 세분 정보 제한 방법 / 제어 올림
    • ex) 박씨, 20~30세
  • 데이터 마스킹: 전체 또는 부분적으로 대체값(공백, *, 노이즈)으로 변환
    • 임의 잡음 추가 / 공백과 대체 방법
    • ex) 이OO, OO대학 재학


(4) 재식별 가능성 모니터링

  • 정기적으로 모니터링 → 점검 항목 중 어느 하나에 해당하면 추가적인 비식별 조치 강구
  • 내부 요인의 변화: 추가적인 정보 수집 / 이용과정에서 생긴 새로운 정보 / 신규 or 추가 구축되는 시스템 등
  • 외부 환경의 변화: 새로운 재식별 사례, 기술, 연계가능한 정보가 출현하거나 공개된 것으로 알려진 경우

댓글남기기