2021 빅데이터 활용 보고서 이것만 참고하세요!

2021. 4. 2. 10:31IT 트렌드가 한눈에!

안녕하세요. 오늘 파수는 HIRA 빅데이터 브리프를 가져왔습니다.

 

HIRA 빅데이터 브리프는 보건ㆍ의료 빅데이터 연구 활성화를 위해 건강보험심사평가원이 분기별로 발간하고 있는 보고서입니다.

 

 

데이터3법 통과가 보건ㆍ의료기관과 어떤 관련이 있을까요?

일단 데이터3법의 핵심은 이것입니다.

 

" 그동안 개인정보보호법에 의해 활용될 수 없었던 개인의 데이터들이 안전한 비식별화/가명화 과정을 거친다면, 활용이 가능하다 "

-데이터3법- 

 

때문에 개인정보에 해당돼 기존에 활용될 수 없었던 국민건강보험공단의 데이터 혹은 보건복지부의 데이터들이 서로 같은 목적과 안정성 아래에서 활용되어 더 유의미한 정보를 도출할 수 있게 된 것이죠. 서로 정보가 교류가 불가했던 영역들이 데이터3법으로 인해 활용이 가능해지면서, 개인의 건강에 미치는 요인 등을 다방면에서 분석이 가능해진 것입니다.

 

 

다시 말해 이미 쌓인 빅데이터 속 정보들을 어떻게 분류하고 안전하게 활용할 것인가에 대한 방법으로 개인정보 비식별화ㆍ가명화가 떠오르면서 보건ㆍ의료기관에서도 개인정보 활용이 핵심 사업으로 주목받고 있습니다. 이에 보건복지부가 개인정보보호법의 일환으로 국민건강보험공단, 건강보험심사평가원, 한국보건산업진흥원 3개 기관을 보건ㆍ의료분야 결합 전문기관으로 선정하였고, 그중 건강보험심사평가원이 HIRA 빅데이터 브리프를 통해 보건ㆍ의료기관의 개인정보 보호와 활용에 대한 통찰을 내놓은 것이죠.

 

하지만 활용적 측면에서 볼 때, 데이터의 수집 목적, 유형에 따라 데이터 활용이 어려운 경우가 많습니다. 또한 개인정보보호법과 의료법, 국민건강보호법 등 다양한 법률 사이의 간극을 어떻게 해결한 것인지에 대한 이슈도 존재합니다.

 

 

 

이에 안전한 비식별화ㆍ가명화 처리에 앞장서고 있는 파수도 글 기고를 제안받아 의견을 전달할 수 있었는데요. 안전한 비식별화ㆍ가명화 처리에 있어 보건ㆍ의료기관의 경우, ‘보건ㆍ의료 데이터 활용 가이드라인’의 기준을 먼저 철저히 따르는 것에서부터 시작해야 한다고 밝혔습니다.

 

더하여, 안전한 비식별화ㆍ가명화 처리에서는 데이터의 분석을 통해 유의미한 정보를 추출하면서,민감정보는 유출되지 않도록 하는 것이 핵심 능력으로 여겨지는데요, 이를 위해서는 전통적인 통계적 노출 제어(Statistical Disclosure Control)에 대해 이해가 필요합니다.

 

전통적인 통계적 노출 제어‘데이터베이스 접근 없이 알 수 없는 개인의 정보는 다른 방법으로도 알 수 없어야 한다’는 기존 정보보호의 원칙으로 여겨지는 논리입니다. 하지만 여기에는 명백한 오류가 있습니다.

 

 

위의 이미지는 대학교의 두 교수가 신입생들의 장학금 관련 연구를 위해 발표한 같은 연구결과입니다. 만약 학생 A가 친구들 중 학교를 그만둔 친구가 있는지 확인하고, 학생 B가 이민 간 사실을 알게 될 경우, 해당 학생 B의 부모가 연간 2억 이상의 소득을 올린다는 사실을 쉽게 확인할 수 있겠죠? 이와 같이, 학부모 소득 데이터베이스에 접근하지 않았음에도 쉽게 개인의 정보를 알게 되어, 전통적인 개인정보보호 원칙에도 오류가 있다는 것을 쉽게 증명할 수 있습니다.

 

 

그렇다면, 오류가 있을 수 있는 전통적인 통계적 노출 제어 대신 파수가 제안하는 새로운 개인정보보호법은 무엇일까요? 바로 개인정보의 민감도 등급을 바탕으로 데이터를 분류하는 차등정보보호법이 그것입니다. 개인정보의 평균값에 따라 등급을 매기고, 민감도를 결정하게 되면 개인정보 노출을 통제하면서 데이터를 활용할 수 있다는 것이 가장 큰 장점인데요, 이 또한 민감도를 결정짓는 방법론에 대해 많은 연구와 조사가 동반되어야 합니다.

 

 

파수는 보건ㆍ의료 데이터 활용 가이드라인을 원칙 첫 번째로 준수하면서, 컴플라이언스와 데이터 거버넌스, 정보노출 통제 기술을 기반으로 안전한 가명처리 기술 개발을 시도하고 있습니다. 이러한 기술들에 대한 이해도를 개발에 녹이려는 시도가 있기에, 다양한 공공기관과 의료기관에 개인정보 비식별화 솔루션인 AnalyticDID를 전달할 수 있었다고 생각합니다.

 

K-빅데이터에서 앞장서고 있는 파수의 의견이 담긴 HIRA 빅데이터 브리프를 통해 보건ㆍ의료기술 및 IT기술 트렌드에 트렌드세터가 되어 보시기 바랍니다.

 

 

빅데이터 트렌드세터 되기 ↓

HIRA 빅데이터 브리프 제4권 4호.pdf
0.81MB

 

파수 개인정보 비식별화 솔루션 자세히 보러가기

http:// https://www.fasoo.com/products/analyticdid