AI로 개인정보 탐지? 딥페이크 범죄, 이미지 속 개인정보를 보호하는 AI 활용법

2024. 11. 1. 10:04IT 트렌드가 한눈에!

최근 AI 관련 범죄 소식이 화제입니다. 특히 딥페이크 관련 범죄가 심각한 수준입니다. SNS 등 인터넷에 업로드한 개인정보, 사진을 AI로 가공해 범죄에 사용하는 수법을 사용하는데요. 가족이 납치당했다는 피싱 소재로 활용하거나, 디지털성범죄로 이어지는 등 현재 심각한 사회문제로 자리 잡았습니다.

경찰도 딥페이크 범죄 집중 단속에 들어갔으며, 교육기관을 포함한 정부 각처에서 딥페이크 예방 교육, 피해 신고 등 대응 방안을 촉구하고 있습니다. 각종 예방 및 대응 방법이 거론되고 있지만 아직까지 확실한 해결책을 마련하지 못하고 있는 상황입니다.

 

심각한 사회문제로 자리잡은 딥페이크 범죄

 

초기에 일부에서 거론된 예방법 중 하나는 온라인상에 개인정보나 사진을 업로드하지 않는 방법이었습니다. 하지만 다소 현실성이 떨어지죠. 어떤 방식으로든 이미 개인정보가 온라인에 노출됐을 가능성이 높고, 일상을 공유하는 SNS 사용을 제한하기도 쉽지 않기 때문입니다.

이렇게 온라인에 노출 및 불법유통되는 개인정보를 보호하고, 범죄나 불법행위 등 2차 피해를 예방하기 위해 개인정보보호위원회에서 대응 방안을 발표했습니다. 개인정보 탐지에 AI 기술을 활용하는 방안을 주요 내용으로 하는데요. AI 범죄에 활용되는 개인정보를 AI 기술로 보호하겠다는 취지로 해석됩니다.

 

개인정보보호위원회 – 개인정보 노출, 불법유통 대응 강화방안

 

정부는 470만여 개 국내외 웹사이트에 노출된 개인정보를 효과적으로 탐지할 수 있는 AI 기술을 개발 및 적용할 계획입니다. 기존에 탐지 가능한 범위가 텍스트 형태로 정형화된 정보였다면, 주민등록번호나 전화번호 등이 포함된 이미지 정보까지 탐지 대상을 확대합니다.

이를 바탕으로 추후에는 딥페이크 확산에도 대응해 얼굴 등 영상에 포함된 개인정보까지 탐지하고 삭제할 수 있는 시스템으로 고도화해 나갈 예정이라고 밝혔습니다. 이와 더불어, 노출 게시물의 신속 차단을 위해 주요 포털 및 SNS 사업체들과 핫라인을 강화해 삭제 기간을 단축하는 방안을 내놓았고, AI 학습과정에서 온라인에 노출된 개인정보가 제외되도록 오픈AI, 구글, 메타 등과 정기적으로 공유할 계획입니다.

 

개인정보를 탐지하는 AI 기술

 

이번 발표에서 가장 주목할만한 부분은 ‘탐지 대상의 확대’라고 볼 수 있습니다. 실제로 많은 조직에서 겪고 있는 대표적인 에로 사항을 반영하기 때문입니다. 알고 계시겠지만, 기업 및 기관들은 보유한 개인정보를 보호해야 할 법적 의무를 가집니다. 이를 위해 먼저 어떤 데이터에 어떤 개인정보가 포함돼 있는지 탐지해야 합니다.

문제는 개인정보가 다양한 형태로 저장된다는 점입니다. 텍스트로 존재하기도 하지만, 이미지나 PDF 파일에 포함되는 경우도 있죠. 기존의 개인정보 검출 기술은 텍스트 정보를 중심으로 하고 있기 때문에, 이미지 속 개인정보 탐지는 현재 많은 조직의 고민거리 중 하나입니다.

 

검출이 까다로운 이미지 속 개인정보

Fasoo AI-R Privacy (이하 AI-R Privacy)가 이 고민을 해결하기 위해 개발된 AI 기반의 개인정보 보호 솔루션입니다. PDF나 이미지 파일에서도 개인정보를 검출하고, 비식별 처리를 할 수 있는데요. 예를 들자면, 신분증을 카메라로 찍은 이미지 파일, 주민등록등본을 스캔한 PDF 파일에서도 개인정보를 탐지할 수 있죠.

이 과정을 위해 이미지에서 문자 및 기호를 판독하는 OCR (Optical Character Recognition, 광학 문자 인식) 기술이 적용됐습니다. 많이들 사용하는 명함 사진을 찍어 업로드하면 텍스트로 저장해주는 서비스와 같은 기술이라고 생각하시면 됩니다!

 

광학 문자 인식, OCR (Optical Character Recognition)

 

텍스트로 변환된 데이터 속에서, AI-R Privacy는 개인정보를 찾아냅니다. AI-R Privacy의 AI 모델은 한글과 개인정보의 특성을 학습해 개인정보를 탐지할 수 있죠. 기존 솔루션들은 특정 개인정보들의 패턴을 설정해 그와 일치하는 정보를 찾아내는 방식으로 개인정보를 검출합니다. 반면 AI-R Privacy는 텍스트의 문맥을 이해하고 찾아내기 때문에, 특정한 패턴이 없는 정보에서도 개인정보를 검출할 수 있습니다. 사람 이름, 상호명, 주소와 같은 정보가 대표적이죠.

개인정보를 검출한 후에는 사용자의 니즈에 따라 조치할 수 있습니다. 주로 내부 결재 시스템, 외부 공개 게시판, 메일 서버와 같은 특정 시스템에 연동해 사용하는데요. 지금 업로드하려는 파일에 개인정보가 포함돼 있다고 경고 알림을 띄우거나, 개인정보 부분을 마스킹 처리한 상태로 변환하는 방식입니다.

획기적이고 편리한 AI 기술이 다수 등장하면서, 이를 악용하는 사례 또한 늘어나고 있습니다. 이에 맞춰서 앞으로의 사이버 보안 체계는 AI를 접목한 기술, 안전한 AI 활용을 위한 기술 중심으로 발전할 전망입니다. 개인정보보호위원회의 이번 발표도 이 전망을 뒷받침한다고 볼 수 있죠.

이미지, PDF 파일 속 개인정보를 고민 중이시거나, 기존 기술로 탐지하지 못하는 개인정보를 검출하는 AI 솔루션을 찾는다면 언제든 문의해주세요! AI 시대를 준비하는 AI-Ready Security를 경험하실 수 있습니다!

 

 

파수 문의하기 | Fasoo Contact Us

여러 번 보는 것보다 한 번의 상담이 더욱 효과적입니다. ‘파수’는 (이하 ‘회사’는) 고객님의 개인정보를 중요시하며, “정보통신망 이용촉진 및 정보보호”에 관한 법률을 준수하고 있습

www.fasoo.com