바로가기 메뉴
본문 바로가기
주메뉴 바로가기
푸터 바로가기

인공지능 산업 육성을 위한 개인정보보호 정책 개선방안 연구

담당부서
개인정보협력팀
전화
061-820-2750
이메일
등록일
2020-12-29
조회
4364

요약
1. 제목

인공지능 산업 육성을 위한 개인정보보호 정책 개선방안 연구
  
2. 연구의 목적 및 중요성

  인공지능 기술의 급속한 발전으로 세계 주요국들은 인공지능 주도권을 확보하기 위해 다양한 정책을 내세우고 있다. 대한민국도 2019년 12월 인공지능 국가전략을 제시했다. 인공지능 생태계 구축을 위해 인프라 확충과 과감한 규제 혁신이 필요하다고 강조했다. 광주광역시는 2024년까지 ‘인공지능 기반 산업융합 집적단지’를 조성한다고 발표했다.
  인공지능 기술의 발전과 더불어 다양한 혁신적인 제품 및 서비스가 나올 것으로 예상된다. 하지만 인공지능 사업자가 인공지능 제품 및 서비스를 고도화하는데 있어서 현행 법제도 및 규제가 큰 걸림돌로 작용하고 있다. 특히, 개인정보 규제로 인해, 인공지능 사업자가 인공지능 학습 데이터셋을 수집하고 활용하는데 있어서 상당한 어려움을 겪고 있다. 인공지능 산업이 발전하기 위해서는 인공지능 학습 데이터셋 활용이 무엇보다 중요하기 때문에 관련 개인정보 이슈를 우선적으로 해결해야 한다. 따라서 인공지능 산업 생태계에서 가장 중요한 역할을 하는 인공지능 사업자 대상으로 설문조사와 심층 인터뷰를 실시하여 개인정보 규제 관련 의견을 수렴할 필요가 있다.
  한편, 인공지능과 빅데이터는 불가분의 관계에 있다고 할 수 있다. 즉, 빅데이터가 없는 인공지능은 무용지물이다. 인공지능 사업자는 각자의 사업에 적합한 양질의 데이터를 필요로 하며, 그것을 제대로 활용하기를 바라고 있다. 대한민국이 인공지능 강국으로 성장할 수 있는지는 인공지능 학습 데이터셋을 얼마나 잘 구축하고 활용하는지에 달려있다고 해도 과언이 아니다. 현재 우리나라는 다양한 형태의 데이터 활용 센터를 운영하고 있지만, 인공지능 사업자에게 실질적인 도움을 주지 못하는 것으로 파악된다. 또한, 인공지능 산업 발전에 촉매제 역할을 할 것으로 보이는 데이터 결합에 대한 수요가 매우 적은 편인 것으로 확인된다. 이러한 현상이 발생하고 있는 원인으로 개인정보 규제, 개인정보 및 정보보안 이슈 등을 들 수 있다. 따라서, 국내 인공지능 사업자, 연구자 등이 필요로 하는 양질의 인공지능 학습 데이터셋을 공급·가공·분석할 수 있는 새로운 형태의 데이터 활용 인프라 구축 방안을 모색하고 이에 맞는 개인정보보호 정책 개선 방안을 살펴봐야 한다.

3. 연구의 내용 및 범위

가. 주요 분야별 AI 사업 관련 개인정보 규제 및 이슈 파악
 o 주요 분야별 인공지능 사업자 대상 설문조사 실시
 o 주요 분야별 인공지능 사업자 대상 심층 인터뷰 실시
 o 전문가 자문을 통한 인공지능 개인정보보호 이슈 정리 및 고도화

나. 주요국 인공지능 정책 조사 및 분석
 o 주요국 인공지능 대응 조사 및 분석
 o 주요국 인공지능 관련 법령, 가이드라인, 국가 전략 등 조사 및 분석

다. 주요국 데이터 활용 센터 조사 및 분석
 o 주요국 데이터 활용 센터 조사 및 분석
 o 주요국 데이터 활용 센터 운영 정책 조사 및 분석

라. 국내 데이터 활용 센터 조사 및 분석
 o 국내 주요 데이터 활용 센터 대상 설문조사 실시
 o 국내 주요 데이터 활용 센터 대상 심층 인터뷰 실시
 o 국내 주요 데이터 활용 센터에서의 개인정보 이슈 조사 및 분석
 o 전문가 자문을 통한 인공지능 개인정보보호 이슈 정리 및 고도화

마. 인공지능 산업 육성을 위한 개인정보보호 정책 개선방안
 o 인공지능 관련 해외 개인정보보호 법제도 조사 및 분석
 o 인공지능 관련 국내 개인정보보호 법제도 이슈 조사 및 분석
 o 인공지능 산업 육성을 위한 개인정보보호 법제도 개선방안
 o 광주형 인공지능데이터은행 설립 및 운영 방안

4. 연구결과

가. 주요 분야별 인공지능 사업 관련 개인정보 규제 및 이슈 파악

  주요 분야별(자율주행, 헬스케어, 에너지, 금융, 보안, 기타) 인공지능 사업자 대상으로 설문조사 및 심층 인터뷰를 실시한 결과, 대다수가 사업 수행하는데 있어서 개인정보보호 및 데이터 관련 어려움을 겪고 있는 것으로 파악되었다. 
  인공지능 제품 개발 및 인공지능 서비스 운영 담당자들은 인공지능 사업 수행 관련 어려움으로 ‘데이터 수집 및 분석 등 데이터 이슈’, ‘양질의 데이터 부족’을 가장 많이 꼽았다. 인공지능 제품 및 서비스를 개발하기 위해서는 학습 데이터가 필요하며, 또한, 성능 향상을 위해서 새로운 데이터를 바탕으로 지속적인 학습이 이루어져야 한다. 하지만 현재 분야를 불문하고 대다수 인공지능 사업자가 데이터 수집에 많은 애로사항을 느끼고 있는 것으로 조사되었다. 예를 들어, 자율주행 기업 담당자는 “공공데이터포털, 빅데이터개방시스템 등에서 데이터를 얻을 수 있지만 이러한 데이터는 지나치게 범용적이거나 품질이 낮아 사용이 어렵다”고 말했다. 
  또한, 일부 인공지능 개발 담당자는 개인정보 규제로 인한 어려움을 토로했는데, “데이터 확보 과정에서 개인 정보에 대한 규제가 강하다보니, 외부에서 소속정보나 얼굴 등이 담긴 데이터를 받기는 현실적으로 힘들다”면서 “그렇다보니 내부에서 개인에게 동의를 구한 뒤 관련 영상정보를 구하려고 하면 매우 한정된 분량의 데이터만 수집할 수 있다는 한계가 있다”고 덧붙였다. 이러한 데이터 관련 어려움은 에너지, 금융, 보안 등 다른 분야에서도 동일하게 나타나는 것으로 조사되었다. 따라서 주관부처는 유연한 유권해석을 바탕으로 특정 사업에 대해서는 개인정보 수집 관련 특례를 부여하는 방안이 필요할 것으로 보인다. 또한, 기업 및 기관 간에 서로 데이터를 자유롭고 안전하게 공유할 수 있는 방안을 논의할 수 있는 자리가 지속적으로 마련되어야 한다. 특히, 설문 조사 및 심층 인터뷰를 통해 에너지 분야에서 전력에너지 데이터 공급이 수요를 전혀 따라가지 못하고 있다는 것을 확인했는데, 정부 주도하에 이러한 이슈를 해결할 필요가 있다.
  
나. 주요국 인공지능 정책 조사 및 분석

  미국, EU 등 주요국들은 인공지능 경쟁에서 주도권을 확보하기 위해 인공지능 국가 전략을 제시하고 있다. 해외 주요국의 인공지능 정책 현황을 조사하고 분석한 결과, 첫째, 각국은 최근 인공지능 연구개발 예산을 대폭 확대하고 국가적 차원에서 인공지능 기술 개발 연구에 집중하고 있다. 둘째, 인공지능 인재를 육성하기 위한 교육 인프라를 확충하고 있다. 셋째, 정부와 민간 기업과의 긴밀한 협력을 통해 인공지능 산업 생태계를 구축하고 있다. 넷째, 인공지능 관련 스타트업과 중소기업 지원을 확대하고 있다. 다섯째, 인공지능 산업 육성에 걸림돌이 되는 규제를 완화하는 등 제도적 정비를 실시하고 있다. 따라서 대한민국도 인공지능 강국으로 발돋움하기 위해 다양한 산업 육성 정책을 제시할 필요가 있다.

다. 주요국 데이터 활용 센터 조사 및 분석

  미국, EU, 영국, 프랑스, 중국 등 주요국 데이터 활용 센터를 조사하고 분석한 결과, 첫째, 해외 주요국들은 정부 주도의 공공 데이터 활용 센터를 운영하고 있다. 예를 들어, 영국의 공공데이터포탈은 농업, 경제, 금융, 교육, 문화, 에너지, 환경, 의료, 교통 등 다양한 분야의 데이터를 한 곳에서 수집, 저장, 개방하고 있다. 이를 참고하여 데이터 접근성 및 효율성을 극대화할 수 있는 원스톱 데이터 활용 센터를 설립할 필요가 있겠다. 둘째, 공공데이터를 무료로 개방하는 공공데이터포탈, 데이터를 사고 파는 데이터 거래소, 자체 보유한 데이터를 외부에 개방하는 빅데이터개방시스템 등과 같이 다양한 데이터 유통 방식이 존재한다. 예를 들어, 일본의 경우, 정보주체 개인과의 계약에 의거해 개인 데이터를 관리하고, 개인의 지시 또는 미리 지정한 조건에 따라 개인을 대신하여 타당성을 판단한 후 데이터를 제3자에게 제공하는 모델인 정보이용신용은행을 운영하고 있다. 데이터의 다양한 유통 방식 사례를 참고하여 정부 주도 혹은 민간기업 주도 방식 중 어느 것을 선택할 것인지 또는 두 가지 방식 모두 고려할 것인지에 대해 고민할 필요가 있으며, 무엇보다 정부 차원에서 민간 기업의 참여를 유도할 수 있는 방안을 논의할 필요가 있다. 이 밖에도, 데이터 활용 센터 설립 시, 데이터 표준화 및 호환성과 데이터 유출 등을 방지하기 위한 보안, 그리고 데이터 거래 계약 관련 분쟁 등 다양한 사항들을 고려해야 한다.

라. 국내 데이터 활용 센터 조사 및 분석

  국내 주요 데이터 활용 센터 조사 및 분석을 실시한 결과, 첫째, 기업, 연구자 등이 다양한 분야의 데이터를 활용할 수 있는 인프라는 일정 수준 구축되어 있으나, 그 활용도는 아직 미흡하다. 특히, 이종데이터 결합 수요가 상당히 저조한 것으로 드러났다. 둘째, 데이터 활용 센터가 보유하고 있는 데이터 분석 환경이 열악하며 시설 증대에 어려움을 느끼고 있다. 따라서 대용량 데이터를 빠르게 처리할 수 있는 컴퓨팅 파워를 갖춘 인프라가 구축될 필요가 있어 보인다. 셋째, 데이터 활용 센터를 운영하는데 있어서 개인정보 침해 및 보안 이슈가 존재한다. 특히, 민감정보를 보유하고 있는 기관의 담당자가 말하길, 데이터 유출 및 재식별에 대한 우려가 상당히 높은 상태이며, 법적 리스크로 인해 소극적 대응을 할 수 밖에 없다고 했다. 넷째, 데이터결합전문기관으로 지정받고 있는 데이터 활용 센터가 늘어나고 있다. 이것은 데이터 활용 센터가 데이터를 제공하는 수준에서 벗어나 데이터 결합을 통해 새로운 가치를 창출하기 위해 노력을 하고 있다는 것을 말한다. 다만, 아직까지는 데이터 결합 수요가 많지 않은 것으로 파악된다. 데이터 결합을 위해서는 가명처리 작업을 수행해야 하는 등 절차적 번거로움 및 어려움이 존재한다. 또한, 현재 데이터결합전문기관은 ‘셀프 결합’을 원칙적으로 할 수 없다. 이러한 것들이 데이터 결합 저해 요인으로 작용하고 있는 것으로 판단된다. 따라서 이러한 이슈를 해결하여 데이터 결합 수요를 증대시킬 필요가 있다. 다섯째, 이번 조사 대상에 포함된 데이터 활용 센터뿐 아니라 대다수 데이터 활용 센터에서 수요자 중심이 아닌 공급자 중심의 데이터 제공·개방이 이루어지고 있다. 이러한 이유 때문에 인공지능 사업자의 데이터 활용 센터 이용이 저조한 것으로 보이며. 데이터 활용 센터 활용도를 높이기 위해서는 수요자 중심의 맞춤형 데이터 제공이 필요하다. 즉, 인공지능 사업자가 인공지능 개발을 하는데 있어서 필요한 데이터를 그들이 원하는 양만큼 제공할 수 있는 인프라가 구축되어야 한다.

마. 인공지능 산업 육성을 위한 개인정보보호 정책 개선방안 마련

  국내 개인정보보호 법제도 이슈사항으로, 첫째, 인공지능 학습 데이터셋 거래 시장 부재 또는 활성화 부족을 들 수 있다. 둘째, 인공지능 학습 데이터에 대한 접근 제한이 있다. 셋째, 인공지능 학습 데이터셋 가공을 위한 지원 시스템 부재 혹은 가공의 어려움이 있다. 이외에도 대용량 데이터셋 처리를 위한 컴퓨팅 인프라 부족 등 여러 문제점이 존재하는데, 이것을 해결하지 못하면 다른 나라와의 인공지능 경쟁에서 뒤떨어지게 될 것이다. 따라서 기술적, 제도적 등 다양한 측면에서 인공지능 산업 발전 장애 요인을 제거할 수 있는 방안을 강구해야 한다. 
  본 연구는 해외 주요국 데이터 활용 센터 조사 및 분석, 국내 주요 데이터 활용 센터 대상 설문조사 및 심층 인터뷰, 해외 주요국 인공지능 관련 개인정보보호법제도 조사 및 분석, 국내 개인정보보호 법제도 이슈 조사 및 분석 등을 바탕으로 기존 데이터 활용 센터와 차별화되는 인공지능데이터은행을 아래와 같이 제안한다.
  첫째, 수요자 요구에 충실한 맞춤형 데이터 제공
  둘째, 수요자 요구에 충실한 맞춤형 설계
  셋째, 데이터 수요·활용에 관한 종합 서비스 제공
  넷째, 데이터 제공·기증, 이용에 대한 합리적 수준의 제한적 책임
  다섯째, 개발자, 중소기업 등의 아이디어 보호
  여섯째, 24시간 개방된 ‘안심 존’ 서비스 제공 
  일곱째, 데이터 제공자·기증자의 재산권 보장
  여덟째, 데이터은행에 대한 관리·감독 체계

5. 활용에 대한 건의 

  인공지능 사업자 대상 설문조사 및 심층 인터뷰를 통해 도출된 개인정보 이슈 및 개인정보 규제 관련 어려움은 향후 인공지능 관련 개인정보보호 법제도 개선을 위한 기초 자료로 활용될 수 있다. 또한, 국내외 주요 데이터 활용 센터 조사 분석 및 국내 개인정보보호 법제도 이슈 분석을 통해 도출된 인공지능데이터은행 설립 방안은 향후 유사한 데이터 활용 센터, 특히 광주 인공지능집적단지 내 데이터 활용 센터를 구축하는데 있어 유용한 시사점을 줄 것이다.
6. 기대효과

  이번 연구는 대한민국이 IT 강국을 넘어 AI 강국으로 나아가는데 필요한 첫걸음이 될 수 있을 것으로 기대한다. 
  정부 측면에서 바라보면, 이번 연구가 주요국 선진 인공지능 정책 사례 분석을 제공함으로써, 인공지능 산업 육성을 위한 정책을 마련하는데 있어서 관련 정부부처에게 도움을 줄 수 있을 것이다.
  사업자 측면에서 바라보면, 이번 연구가 개인정보 규제 관련 어려움을 해소할 수 있는 기회를 인공지능 사업자에게 제공함으로써, 인공지능 사업자가 양질의 인공지능 학습 데이터를 활용한 혁신적인 인공지능 제품 및 서비스를 제공하는데 도움이 될 것으로 기대한다.
  종합적으로 보면, 이번 연구가 인공지능 기술과 빅데이터의 활용이 그 어느 때보다 중요한 지금 이 시점에, AI 산업 발전을 저해할 수 있는 이슈를 발굴하고 더 나아가 이를 해결할 수 있는 법제도 개선방안을 제시함으로써, 궁극적으로 이번 연구가 우리나라 인공지능 산업 육성에 기여할 것으로 기대한다.

목차
제 1 장  서 론 1
   제 1 절 연구 배경 및 필요성 1
   제 2 절 연구 내용 및 범위 7

제 2 장 주요 분야별 AI 관련 개인정보 이슈 조사 및 분석 9
   제 1 절 자율주행  12
   제 2 절 헬스케어  28
   제 3 절 에너지 37
   제 4 절 금융 52
   제 5 절 보안 59
   제 6 절 기타 70
   제 7 절 이슈 정리 및 시사점 77

제 3 장 주요국 AI 정책 조사 및 분석 81
   제 1 절 대한민국 81
   제 2 절 미국 84
   제 3 절 EU 87
   제 4 절 영국 89
   제 5 절 프랑스 91
   제 6 절 일본 94
   제 7 절 분석 종합 및 시사점 96

제 4 장 주요국 데이터 활용 센터 조사 및 분석 99
   제 1 절 미국 99
   제 2 절 EU 108
   제 3 절 영국 114
   제 4 절 프랑스 117
   제 5 절 중국 119
   제 6 절 분석 종합 및 시사점 122

제 5 장 국내 데이터 활용 센터 조사 및 분석 124
   제 1 절 국내 데이터 활용 센터 조사 및 분석 126
   제 2 절 이슈 정리 및 시사점 138

제 6 장 AI 산업 육성을 위한 개인정보보호 정책 개선방안 142
   제 1 절 AI 관련 해외 개인정보보호 법제도 현황 142
   제 2 절 AI 관련 국내 개인정보보호 법제도 이슈 160
   제 3 절 AI 관련 개인정보보호 법제도 개선방안 167
   제 4 절 광주형 인공지능데이터은행 설립 및 운영 방안 177

부 록 183

[나주본원] (58324) 전라남도 나주시 진흥길 9 한국인터넷진흥원 대표번호 : 1433-25(수신자 요금 부담) [서울청사] (05717) 서울시 송파구 중대로 135 (가락동) IT벤처타워 [해킹ㆍ스팸개인정보침해 118] Copyright(C) 2021 KISA. All rights reserved.
Now Loading