AI 시대, 콘텐츠 관리 하고 계신가요? 간과해선 안되는 AI학습 데이터 관리

2023. 5. 11. 09:58IT 트렌드가 한눈에!

우린 어느새 AI라는 단어에 익숙해졌습니다. 다양한 분석 기술에 사용해 온 AI기술 외에도, ChatGPT와 같이 사용자의 요구에 따라 결과물을 만들어주는 ‘생성형 AI’까지 등장했죠. 이제 모든 분야의 조직들이 AI 기술을 활용할 방법을 찾고 있습니다. 바야흐로 ‘大 AI시대’입니다.

지난 포스팅에서 업무 환경에서 ChatGPT를 활용하다가 발생한 정보 유출 사고에 대해 짧게 다뤘는데요. 오늘은 조금 다른 이야기를 해볼까 합니다. AI 기술 활용 전에 반드시 준비해야 할 데이터 관리, 즉 ‘콘텐츠 관리’입니다.

 

 

https://blog.naver.com/fs0608/223096112751

 

반도체 기술유출, ChatGPT 보안, 반드시 사전 차단이 필요하다

대한민국은 반도체와 IT 분야에서 눈부신 기술 발전을 이뤄낸 가장 대표적인 국가입니다. 그런데 자랑스...

blog.naver.com

 

ChatGPT와 같이 서비스를 공유하는 환경은 개인 및 기업 정보가 유출될 위험이 있습니다. 최근 이와 관련된 논의가 뜨겁게 진행되고 있죠. 그런데 정보 유출 외에도 AI활용을 위해 고려해야 하는 점이 있습니다.

바로 AI 결과물의 신뢰도 문제입니다.

 

이 문제는 공유 서비스 환경에만 국한되지 않습니다. 자체적으로 AI를 개발하거나, 개발된 AI 기술을 조직내에서만 활용할 때도 발생할 수 있는 문제입니다.

 

개인 및 기업 정보 유출 위험이 있는 공유 AI 서비스

 

AI 결과물의 신뢰도 문제라니, 감이 잘 안 오시나요?

업무에 AI를 활용하려면, 먼저 ‘학습’ 과정이 필요합니다. 우리가 AI를 활용하려는 주된 이유는 복잡한 업무의 자동화와 새로운 가치 창출이죠. 이를 위해선 무엇보다AI가 정확한 결과물을 만들어 낼 수 있어야 합니다. AI가 부정확한, 혹은 최신화 되지 않은 데이터로 학습한다면 그 결과물의 신뢰도는 떨어질 수밖에 없습니다.

 

예시로 우리 조직에서 고객의 이름과 소속을 입력하면 해당 고객과의 커뮤니케이션 히스토리를 파악해 어떤 프로젝트를 제안할지 추천해주는 AI를 개발했다고 가정해보겠습니다. 그런데 AI에게 학습 시킨 데이터가 최신화 되지 않았다면? 히스토리를 정확하게 파악하지 못하고 부적합한 프로젝트를 추천해줄 수 있습니다.

이런 상황을 방지하고 AI를 업무에 효율적으로 활용하기 위해선 학습시킬 콘텐츠를 철저하게 관리해야 합니다.

 

AI 결과물들의 신뢰도 문제

 

콘텐츠 관리의 핵심은 ‘유출 및 유실 방지’와 ‘최신화’입니다. 우리 콘텐츠가 외부로 유출되는 상황은 당연히 막아야 하고, 언제 어디서든 최신화 된 콘텐츠를 사용할 수 있어야 합니다.

 

최근 각광받고 있는 콘텐츠 관리 방법은 VCI (Virtual Content Infrastructure)입니다. 콘텐츠 하나 하나를 가상화해 물리적 위치와 무관하게 관리하는 방법입니다.

VCI는 콘텐츠가 생성될 때마다 즉시 가상화합니다. 가상화 된 콘텐츠는 실시간으로 고유한 ID를 부여 받고, 암호화됩니다. 콘텐츠 자체를 관리하고, 보호한다는 의미죠.

VCI 환경에서 콘텐츠는 항상 최신 버전을 유지합니다. 고유한 ID 안에서 버전이 관리되기 때문에 사용 및 변경 이력을 쉽게 확인할 수 있습니다. 혹시 파일이 유실되더라도 서버에서 손쉽게 찾을 수 있죠. 즉, 랜섬웨어 공격 등의 이유로 파일을 사용할 수 없게 되더라도, 서버에서 다시 찾아 그대로 사용할 수 있다는 뜻입니다. 물론 폴더나 해시태그를 기반으로 콘텐츠를 분류해 정리도 가능합니다. 각 콘텐츠는 DRM을 기반으로 암호화 돼 유출 또한 걱정 없습니다.

 

https://www.fasoo.com/solutions/virtual-content-infrastructure

 

문서가상화(VCI)

문서가상화 기술 정보 제공, 기존의 VDI 한계 극복, 문서중앙화 완벽 대체, 문서의 공유 및 관리의 편의성 향상, 데이터 중심 암호화 적용과 자동 백업 기능 제공, 최적의 원격 및 재택 근무 환경

www.fasoo.com

 

VCI를 활용하면 AI에게 학습시킬 데이터를 철저하게 관리할 수 있습니다. 항상 모든 콘텐츠가 최신 버전을 유지하고 있고, 필요에 따라 이전 버전 데이터를 사용할 수도 있기 때문입니다. 정확한 데이터로 학습된 AI는 정확한 결과물을 만들어 낼 수 있습니다. 위에서 말씀드린 예시 속 난처한 상황에 처하지 않을 수 있고요.

사실 콘텐츠 관리가 중요하다는 점은 평소 업무 환경에서도 똑같습니다. 많은 고객 분들이 파수에서 VCI 기반의 문서 관리 플랫폼과 외부 협업 플랫폼을 찾는 이유입니다. AI 학습을 위한 데이터가 아니더라도, 우리는 언제나 최신화 되고 안전한 콘텐츠를 사용해야 하니까요.

 

 

https://www.fasoo.com/products/wrapsody

 

Wrapsody

엔터프라이즈 문서 플랫폼 Wrapsody, 문서중앙화 완벽 대체, 문서가상화(VCI) 기술 기반 문서 관리 솔루션, 실시간 랜섬웨어 대응, 문서 중심의 효율적인 문서 관리를 지원하는 파수 랩소디

www.fasoo.com

 

 

바야흐로 ‘大 AI시대’입니다. 많은 조직이 다양한 목적으로 AI기술을 활용하고자 합니다. 그런데 정작 중요한 콘텐츠 관리는 신경 쓰고 계신가요?

간과해선 안되는 AI시대의 필수 준비사항, 콘텐츠 관리입니다. 혹시 콘텐츠 관리에 어려움을 가지고 계시다면, 언제든 파수를 찾아주세요!

 

이번에는 콘텐츠의 품질/퀼리티 이슈에 대해 이번 포스팅에서 짚어봤는데, 다음에는 학습해야 하는 콘텐츠, 즉 학습 대상 데이터 수량을 획기적으로 줄여 AI 학습 ROI를 확보할 수 있는 방안에 대해 공유 드려보겠습니다.