04-29 02:46
Notice
Recent Posts
Recent Comments
관리 메뉴

Scientific Computing & Data Science

[Data Science / Articles] 빅 데이터 공포…‘사생활은 없다’ 본문

Data Science/Articles

[Data Science / Articles] 빅 데이터 공포…‘사생활은 없다’

cinema4dr12 2015. 8. 3. 14:08

기사원문: http://magazine.hankyung.com/business/apps/news?popup=0&nid=01&c1=1003&nkey=2015073101026000231&mode=sub_view

미국의 버락 오바마 대통령은 작년 사생활 보호권 전문가·과학기술자·사업가 등과 빅 데이터가 가져오는 민간 및 공공 영역에서의 사생활 침해 위협을 파악하고 이를 최소화하면서 정보를 자유롭게 공유할 수 있는 방안을 검토하라고 지시했다. 미 대통령 과학기술자문위원회(PCAST)는 기술적인 관점을 중심으로 이를 검토, ‘빅 데이터와 사생활 보호권 : 기술적인 관점(BigData and Privacy : A Technological Perspective)’이라는 보고서를 제출했다. 이 보고서에 담긴 주요 내용을 살펴본다.

사라진 ‘은둔의 권리’

기술 발전과 사생활 보호의 충돌은 새로운 일이 아니다. 예를 들어 벤저민 프랭클린에 의해 1775년 도입된 우편 시스템은 편지를 중간에 가로채 읽어 보는 일이 비일비재 해 편지 개봉을 금지하는 법이 1782년 제정됐다. 이 문제는 전신 및 전화가 보급되며 반복됐다. 또한 카메라가 보급되면서 발생되는 문제로 현대 사생활 보호법의 효시인 ‘사생활 보호에 관한 권리’가 1890년 발표됐다.

빅 데이터는 사생활 보호의 관점에서 양적·질적으로 새로운 차원의 문제를 야기한다. 정보통신기술(ICT)의 발전으로 개인에 대한 다양한 정보들이 대규모로 생성·수집·분석·공유되고 있다. 빅 데이터 기술은 개인과 사회에 많은 혜택을 약속하고 있지만 동시에 축적된 데이터의 공개, 데이터의 오남용, 데이터의 부정확성 등 심각한 사생활 침해 가능성을 포함하고 있다.

본격적인 논의를 위해 사생활 보호에 관한 주요 권리들을 알아보자. 우선 ‘혼자 있을 수 있는 권리’로 알려진 비밀을 지킬 수 있고 은둔할 수 있는 권리가 있다. 정치적 견해 등 본인의 의견을 익명으로 표현할 수 있는 권리가 있고 본인의 개인 정보를 타인이 접속하는 것을 제한할 수 있는 권리도 있다. 또한 본인에 관한 정보가 채용 등의 결정에서 부정적으로 사용되는 것을 막을 수 있는 권리가 있으며 정부의 간섭 없이 건강·성 등의 개인적인 영역의 결정을 내릴 수 있는 권리가 있다. 미국에서 이러한 권리들은 전체적으로 또는 부분적으로 보호받고 있다.

그러나 최근 빅 데이터 활용 사례들을 보면 다양한 사생활 침해의 가능성이 두드러진다. 문제는 기술의 발전으로 앞으로는 더 다양한 사례들이 더 많은 규모로 일어날 수 있다는 것이다. 그러면 가까운 미래에 빅 데이터 기술로 구현될 환경을 살펴보자.

우선 미래의 주거 환경을 살펴보자. 편리와 안전을 위해 다양한 센서 장비가 설치되고 있다. 연기와 일산화탄소를 감지하는 화재경보기는 대부분이 설치돼 있고 라돈(radon) 감지기의 설치도 확산되고 있다. 가까운 장래에는 오염 및 알레르기를 일으키는 물질을 탐지하는 장비도 설치될 것으로 예상된다. 또한 냉장고에는 상한 음식에서 나오는 냄새를 파악하거나 포장에 있는 무선 자동 인식 장치(RFID) 등의 전자태그를 이용해 유통기한을 파악할 수 있을 것이다.

또한 집 전화, 휴대전화 외에도 노트북, 태블릿 PC 등 모든 방에는 마이크가 설치돼 있다. 초음파나 적외선을 이용하는 CCTV는 가시광선을 이용해 움직임뿐만 아니라 물체를 구별하고 얼굴 인식을 제공하는 쪽으로 진화할 것으로 예상된다. 각각의 기술은 별다른 이슈가 없을 수 있지만 이들이 결합되면 우리의 가장 사적인 행동까지도 노출될 수 있다.

다음으로 교육 환경을 살펴보자. 무크(MOOC) 등 온라인에 있는 자료를 분석해 개인의 학습 능력과 학습 방법 등에 대해 파악할 수 있다. 기존에도 가능했던 평점 등의 수준이 아니라 다양한 학습법에 대한 반응, 추상적인 개념의 이해 능력, 수업 집중도 등의 세밀한 내용을 알아낼 수 있다. 이들은 다양한 학습 방법으로 학생에게 최적화된 교육을 제공하지만 정보의 오남용 시 문제점도 심각할 수 있다.

마지막으로 의료 환경을 살펴보자. 앞으로는 환자의 치료 기록 및 유전자 염기서열, 임상시험 등의 병원 기록을 바탕으로 환자에게 맞춤형 치료를 제공할 것으로 예상된다. 또한 모바일 장비를 이용한 진단도 확산될 것으로 보인다. 예를 들어 치매 여부를 파악하기 위해 본인에 관한 정보를 휴대전화로 보내 확인하게 하고 단어의 의미를 반복적으로 물어보고 지난 일들을 기억하게 하는 등의 방법이 출현할 것으로 예상된다.

90% 확률로 데이터 주인 예측

우리에 관한 이런 민감한 정보를 보호하는 방법 중 하나가 이름·주민번호·전화번호 등 개인을 확인할 수 있는 정보를 삭제하는 비식별(de-identification) 기법이다. 문제는 빅 데이터 기술의 발전으로 비식별된 기록에서 삭제된 정보를 복구하는 것이 가능해지고 있다는 것이다. 예를 들어 한 실험에서는 우편번호·생년월일·성별 등의 정보로 데이터의 주인을 90% 확률로 맞힐 수 있었고 앞으로 이 정확도는 계속 높아질 것으로 예상된다.

그러면 우리의 개인 정보에 관련된 빅 데이터는 어떤 것이 있을까. 우선 디지털 형식으로 생성된 ‘본 디지털(born digital)’ 데이터가 있다. 이는 e메일·문자메시지·전화번호·비밀번호 등 인간이 정보통신 기기를 사용하면서 발생한다. 이들은 사용자에게 보다 나은 서비스를 제공할 목적으로 생성·저장·활용되고 있다. 예를 들어 웹사이트에 접속할 때 만들어지는 임시 파일인 쿠키는 웹서핑을 편리하게 만들지만 이를 이용해 사용자가 다녀간 웹페이지를 파악할 수 있다. 또 SNS 친구 목록을 이용해 다양한 서비스가 제공되지만 이를 악용한 스팸 등의 문제도 있다. 현재 관련 기업들은 이러한 데이터들을 필요 이상으로 수집하면서 문제의 위험을 키워 가고 있다.

다음으로 센서로부터 생산되는 ‘센서 데이터’가 있다. 여기에는 음성통화, 화상통화, CCTV 동영상, 컴퓨터 단층 촬영(CT) 및 핵자기공명장치(MRI) 영상, 유전자 염기서열 등이 있다. 이들은 많은 정보를 포함하고 있어 특히 공개에 유의해야 한다. 또한 기술 발전으로 센서 데이터의 규모와 종류가 폭증하고 있어 이에 대해 중점적으로 관리할 필요가 있다.

마지막으로 이러한 데이터를 가공해 만들어진 분석 데이터가 있다. 데이터 마이닝 기법을 통해 사물이나 사건을 분류할 수 있고 기존의 행동을 바탕으로 미래의 행동을 예측할 수 있으며 이례적인 상황을 감지할 수도 있다. 또한 기업 등의 의사 결정을 지원하기 위해 여러 종류의 데이터를 통합해 활용하는 사례도 증가하고 있다.

예를 들어 최근 각광받고 있는 SNS 분석이 있다. 페이스북·트위터 등에 게시된 정보를 이용해 사람의 성격·선호도 등을 파악하는 기술이 빠르게 발전하고 있다. 이를 이용해 테러 조직원을 찾아 내고 범죄 용의자의 습관 및 동기를 파악하며 상품 판매 전략의 수립에도 활용되고 있다. 한 분석에 따르면 아이폰을 소유한 친구가 있으면 본인이 아이폰을 구매할 확률이 3배 높아진다고 한다. 각각의 데이터는 커다란 의미가 없지만 가공된 정보는 민감한 것이 많다.

사생활 침해의 위협을 최소화하며 빅 데이터가 가져 오는 다양한 혜택을 누리기 위해서는 본 디지털 및 센서 데이터를 수집하는 ‘데이터 수집가’, 이를 분석해 의미를 도출하는 ‘데이터 분석가’, 이를 활용하는 개인·민간·공공의 ‘데이터 사용자’ 계층에 대한 종합적인 규제를 수립하고 적용할 필요가 있다. 특히 중심이 되는 것이 데이터 사용자에 관한 규제다. 빅 데이터의 성격상 원시 데이터 만으로는 사생활 침해의 가능성을 판단하기 어렵기 때문이다.

빅 데이터는 사생활 보호에 관해 지금까지 겪어 보지 못한 새로운 차원의 문제를 야기한다. 이렇게 다양한 사람들의 이해가 상충되는 사항에 대해 균형 잡힌 해결책을 도출하는 것은 결코 쉽지 않은 문제다. 이러한 논의가 사회에서 합리적으로 진행되기 위해서는 관련된 기술에 대해 정확하게 이해할 필요가 있다.


Comments