2024. 4. 22. 18:11ㆍIT 트렌드가 한눈에!
기업 및 기관에서의 대규모 언어 모델(LLM) 활용은 이미 선택을 넘어 필수가 됐습니다. 실제로, 퍼블릭 LLM 활용은 이제 우리의 일상이 됐다고 할 수 있습니다.
이런 변화 속에서, 기업 및 기관은 LLM 도입과 활용을 고려해 우리 조직에 적합한 LLM을 찾는데 많은 시간을 할애하고 있을텐데요. 도입에 앞서, 보안 문제와 할루시네이션(환각 현상)을 고려해야함은 물론 비용에 따른 효율도 간과할 수 없습니다.
그래서 최근에는 목적에 맞게 여러 개의 경량화 모델, sLLM을 도입하는 것이 생성형 AI를 효율적으로 활용할 수 있다고 주목받고 있는데요.
오늘은 기업용 sLLM 중에서 어떤 것을 도입해야 하는지에 대해 알아보려고 합니다. 우선, 퍼블릭 LLM과 프라이빗 LLM의 차이점에 대해서는 이미 잘 알고 계실 것이라 생각합니다. 파수 블로그에서도 이 주제에 대해 다룬 바 있습니다. (LLM vs sLLM, 로컬 구축 방안 그리고 활용 사례 살펴보기)
퍼블릭 LLM의 경우, 공개된 데이터를 기반으로 학습하기 때문에 정보의 양이 방대합니다. 그러나 때로 정확하지 않거나 사실과 다른 답변이 나올 수 있습니다. 또한 학습 당시의 정보만을 담고 있기 때문에 학습이 되지 않은 데이터나 그 이후에 나온 데이터에 대해 대답할 수 없는 제약을 갖고 있습니다. 실시간 검색이 지원되지 않기 때문에 학습 당시까지의 지식을 기반으로 한 대답만 할 수 있죠.
이 문제를 해결하기 위한 방안 중 하나로 ‘검색 증강 생성(RAG, Retrieval Augmented Generation)’ 기법이 있습니다. LLM이 질문과 관련된 지식 정보를 검색하는데, 답을 할 수 없는 경우 추가로 검색해 알맞은 답변을 할 수 있도록 도와줍니다. 이를 통해, LLM이 학습 당시의 데이터 베이스에만 의존하는 것이 아니라, 최신 데이터를 포함해 더 넓은 범위의 정보에 기반한 답변을 생성할 수 있게 됩니다.
RAG 기법의 핵심은 ‘벡터 데이터 베이스’와 ‘임베딩’ 이라는 두가지 도구에 있습니다. 문맥에 기반한 검색을 위해서는 텍스트와 같은 비정형 데이터를 벡터로 변경해 벡터 데이터 베이스에 저장돼야 하는데, 이렇게 백터화하는 과정을 임베딩이라고 합니다.
이러한 기술이 적용된 기업용 프라이빗 LLM, sLLM을 도입한다면 조직의 목적에 맞게 AI를 활용할 수 있습니다. 특정 도메인이나 산업에 특화된 대량의 데이터로 학습함으로써 전문 용어를 이해하고 답변할 수 있으며, 보다 정확하고 문맥에 맞는 답변을 제공합니다. 또한 내부 서버에 설치해 운영하는 온프레미스 구축을 통해 정보 유출을 방지할 수 있습니다.
이처럼 기업용 sLLM을 도입함으로써, 조직은 더 정확하고 신뢰할 수 있는 데이터 기반의 의사결정을 할 수 있게 됩니다. 정보 유출의 우려 없이도 맞춤형 해결책을 제공받을 수 있는 것이죠.
최근 파수는 ‘Ellm (Enterprise LLM)을 직접 개발해 출시했는데요. 온프레미스 구축형 sLLM으로, 조직의 선별된 내부 데이터를 학습시켜 비즈니스 상황에 따른 최적화된 결과를 도출합니다. 코딩(개발), 법률, 세무, 금융 등 다양한 직군, 산업 환경에서도 정확도와 신뢰성이 높은 정보를 제공합니다.
엘름은 특정 작업이나 도메인에 맞는 작은 데이터셋을 사용해 모델을 추가적으로 훈련시킬 수 있으므로 높은 비용 문제로 LLM 도입을 주저하는 기업에서는 특정 부서, 조직에만 도입해 활용할 수도 있습니다. 엘름은 기업이 가지고 있는 지식을 최적으로 활용할 수 있도록 돕습니다.
또한, 엘름의 아키텍처에서 네비게이터 역할을 하는 Ellm CX는 여러 목적에 맞춰 구성된 온프레미스 구축형 sLLM들과 복수의 퍼블릭 LLM들을 연결해 지휘자 역할을 하며 적합한 답변을 도출할 수 있도록 설계됐습니다.
특화 데이터에서 정확한 답변을 도출하고, 유창한 한국어를 구사하는 LLM을 찾고 계신가요? 저희 파수에게 문의주세요.
[LLM/AI 용어집]
LLM 이란?
대형 언어 모델(Large Language Model)로, 대량의 데이터를 기반으로 사전 학습된 초대형 딥 러닝 모델입니다. 맥락을 파악하고 적절한 문장을 생성하거나 문장의 의미를 이해할 수 있어 사람과 유사한 텍스트를 생성할 수 있습니다.
sLLM이란?
소형 언어 모델(Small Large Language Model)로, 기본적으로 LLM과 같은 기능을 수행하지만, 모델의 크기가 LLM에 비해 상대적으로 작습니다. 모델의 매개 변수(Parameter)의 수를 줄이고 미세조정(Fine-tuning)을 통해 정확도를 향상하는 것이 핵심입니다.
'IT 트렌드가 한눈에!' 카테고리의 다른 글
비정형데이터 가명처리 기준 주요 내용, 정규표현식과 AI 기반 가명처리 (35) | 2024.05.07 |
---|---|
아이폰, 갤럭시 부고 스미싱 클릭했다면? 스미싱 / 피싱 예방과 대처, 근본적인 대비책 (70) | 2024.04.29 |
뜨거웠던 생성형 AI & 보안 컨퍼런스 FDI 2024의 현장, Get AI-Ready: Enterprise LLM, Data and Security (2) | 2024.04.09 |
종합병원 환자 개인정보 유출 사고, 계속되는 민감정보 유출에 대비하기 위해서는 (30) | 2024.04.05 |
CPPG, CISSP 자격증 및 보안 담당자 교육 이수 행사 G-PRIVACY 2024 현장! 생성형 AI (챗GPT, 제미나이) 보안 (28) | 2024.03.29 |