생성형 AI, LLM, 머신러닝, 딥러닝, 자연어처리··· AI 관련 용어 정리

2023. 7. 27. 17:10IT 트렌드가 한눈에!

알파고와 이세돌 9단의 대결, 기억하시나요?

2016년 당시 인공지능과 인간의 대결로 큰 주목을 받았었죠. 대결은 알파고의 4:1 승리 마무리 됐습니다. 결과에 많은 이들은 충격을 받았는데요. 바둑은 그 수가 워낙 다양해 오랫동안 인공지능이 정복하지 못한 분야였기 때문입니다. 당시 이세돌 9단은 한 매체와의 인터뷰에서 “알파고가 신의 경지는 아니다. 인간이 패배한 것이 아니라 이세돌이 진 것이다”라는 이야기를 해 화제가 되기도 했습니다.

세기의 대결 이후, 인공지능 기술은 일반 대중들 사이에서 큰 관심을 받기 시작했습니다. 그리고 2022년 11월, 초거대 AI라 불리는 챗봇 ChatGPT가 등장했습니다. 아직 이른 단계지만, 관심은 매우 뜨겁습니다. 뉴스, 블로그, 유튜브 등 다양한 미디어에서 AI 콘텐츠들이 쏟아지고 있는 현상만 봐도 알 수 있죠.

 

그래서 오늘은 AI와 관련된 용어들을 간략하게 설명 드리는 시간을 가져보려 합니다! 초거대 AI, 머신러닝, 딥러닝 등 분명 들어는 봤지만 확실하게 알진 못했던 다양한 용어들을 쉽게 정리해 전달 드릴테니, 많관부!

 

다가온 AI의 시대

 

1. AI (Artificial Intelligence)

AI는 Artificial Intelligence의 약자로, 인간의 지능을 갖춘 컴퓨터 시스템을 의미합니다. 인간의 지능을 프로그램 및 시스템에 인공적으로 구현해 문제 해결, 자동화, 예측 및 판단 등 다양한 작업을 효율적이고 정확하게 수행함을 목표로 합니다.

 

2. 초거대 AI

초거대 AI는 대용량 데이터를 학습해 인간처럼 합리적인 추론이 가능한 AI 모델입니다. 이는 자체적인 학습을 통해 지식을 습득하고, 인간과 비슷하거나 더 나은 문제 해결 능력을 가지고 있다고 평가되는데요. ChatGPT의 개발사 OpenAI의 GPT-4, 네이버의 하이퍼클로바, LG의 엑사원 등이 초거대 AI로 분류되고 있습니다.

 

Generative AI, ChatGPT

 

위 이미지를 보시면, Generative AI, LLM, ChatGPT 등 익숙한 단어들이 보이실 겁니다. 이는 인공지능 챗봇, ChatGPT가 어떤 기술들로 구성돼 있는지를 간략하게 보여주는데요.

 

 

3. Generative AI

Generative AI는 뜻 그대로 생성형 AI라고 불리며, 콘텐츠를 생성하는 인공지능 을 의미합니다. 대표적인 예로 ChatGPT가 있습니다. 유저와 대화를 통해 정보를 학습하고 문맥을 파악해 다양한 정보를 제공하죠. ChatGPT 이외에도 Generative AI는 이미지, 음악, 텍스트 생성 등 다양한 작업에 활용됩니다.

 

4. 자연어처리 (Natural Language Processing)

자연어 처리는 인간의 자연어를 컴퓨터가 분석하고 처리하는 기술입니다. 이는Generative AI인 ChatGPT를 구현하기 위한 필수 기술인데요. 자연어 분석 및 이해를 통해 컴퓨터는 문장 구문 및 감정 분석, 텍스트 분류, 기계 번역 등 여러 작업을 수행합니다. 여기서 자연어는 말 그대로 평소에 우리가 의사소통에 사용하는 언어를 의미하며, 이는 C언어나 Java와 같이 의도적으로 만든 인공어와 대비되는 개념입니다.

 

5. LLM (Large Language Model)

LLM은 뜻 그대로 대형 언어 모델입니다. 이는 자연어 처리 안에 포함된 언어 모델 중 하나인데요. 정보를 모으고 학습해 맥락을 파악하고, 적절한 응답을 생성하는 기능을 수행합니다. 이는 인간의 언어를 이해하고 생성하는 데 중요한 역할을 하는 기술로, 자동 대화 시스템, 정보 검색 등 다양한 분야에서 활용됩니다.

 

Genrative AI, 자연어처리, LLM

 

6. GPT (Generative Pre-trained Transformer)

GPT는 OpenAI에서 개발한 언어 모델의 시리즈를 가리킵니다. 위에 설명 드린 대형 언어 모델 LLM이 특정하게 구현된 형태라고 생각하시면 되는데요. GPT는 트랜스포머 아키텍처를 기반으로, 대규모 데이터를 사전 학습 한 후, 다양한 자연어 처리 작업에 미세조정(Fine-tuning)돼 사용됩니다.

정리하면, 자연어처리 기술 안에 대형 언어 모델 LLM이 있고, 그 LLM 모델의 한 종류가 GPT입니다. 그리고 이 GPT를 활용한 Generative AI 서비스가 바로 우리에게 익숙한 ChatGPT가 되는 거죠.

 

7. Conversational AI

Conversational AI는 대화형 AI로, AI가 인간의 언어를 분석하고 인식해 자유롭게 대화하거나 음성을 텍스트로 변환하는 등의 기능을 제공합니다. ChatGPT 이외에, 대표적으로 네이버가 제공하는 클로바노트가 있는데요. 클로바노트는 인간의 음성을 인식해 이를 요약하거나 번역하는 작업을 수행합니다. 즉, Conversational AI는 인간의 음성 인식과 대화 기능에 중점을 둔 AI라고 할 수 있겠습니다.

 

8. 트랜스포머 (Transformer)

트랜스포머는 자연어 처리 작업에 적용되는 방법론 중 하나입니다. 기술의 핵심은 바로 특정 문장의 단어 및 구조를 추적해 맥락과 의미를 학습함에 있습니다. 이는 현재 언어 및 이미지 번역에 주로 쓰이고 있는데요. AI 전문가들은 해당 기술이 AI 패러다임 변화를 견인하고 있다는 언급을 할 정도로 혁신적인 기술로 평가받고 있습니다.

 

9. Fine-tuning (미세조정)

Fine-tuning 이란 미리 학습된 모델을 특정 작업이나 데이터에 맞게 재조정하는 행위를 의미합니다. 즉, 특정 AI 모델을 새로운 작업에 적용하고자 할 때, 기존 모델에 새로운 데이터 셋을 학습 시켜 최적화해 나가는 과정입니다. 예를 들어, 어떤 회사 임직원이 A 부서에서 B 부서로 이동한다고 했을 때, B 부서에 대한 교육이 새로 필요하겠죠? 이러한 일련의 교육 과정을 Fine-tuning이라고 합니다.

 

GPT, Conversational AI, 트랜스포머, Fine-tuning

 

10. Public AI

Public AI는 일반 대중에게 공개돼 접근 가능한 AI를 의미합니다. 특정 소속이 아니더라도 자유롭게 활용 가능하며, 보통 인터넷을 통해 접근 가능한 다양한 오픈소스 AI, API, 서비스 등을 포함합니다. 제약 없이 편리하게 사용 가능하지만 악의적인 행위에 이용되거나 중요 정보 유출 등 다양한 위험성이 존재합니다.

 

11. Private AI

Private AI는 제한된 그룹이나 조직 내에서 사용되는 AI를 의미합니다. 이는 보안상 이유로 일반 대중에게 공개되지 않으며, 주로 특정 조직이나 연구소 등에서 내부적인 용도로 사용합니다. 의료, 금융, 제조 등 여러 산업 군에서 활용되며, 효율성과 보안에 중점을 둔 AI라고 할 수 있겠습니다. 이미 많은 기업들이 Public AI의 위험성을 인지하고 Private AI로 전환하기 위한 방안을 모색하고 있기도 합니다.

파수 또한, 기업 및 기관이 Generative AI의 이점은 최대로 활용하면서, 중요 데이터를 안전하게 보호할 수 있는 Private AI 모델을 준비하고 있습니다.

 

12. Local AI

Local AI는 인공지능이 개별 디바이스 (컴퓨터, 스마트폰 등)에 내장돼 작동하는 AI를 의미합니다. 음성 비서 앱이나 스마트홈 시스템같이 실시간 응답 기능을 제공하는 시스템을 생각하시면 이해가 편합니다. 또한, 사내 업무 환경 같이 특정 로컬 환경에서 사용되는 AI 모델을 Local AI라고 부르기도 합니다.

 

Public AI, Private AI, Local AI

 

13. 머신러닝 (Machine Learning, ML)

머신러닝은 데이터 분석과 학습을 통해 예측과 결정을 수행하는 AI 기술입니다. 음악 스트리밍 서비스가 대표적인 예입니다. 스트리밍 서비스를 이용해 보셨다면, ‘내가 좋아할만한 음악 추천’ 같은 카테고리를 본 적이 있으실 텐데요. 유저들의 선호 취향을 파악하고 학습해 비슷한 음악을 추천하는 기술이 머신러닝이며, 이는 여러 산업 군의 자동화된 작업에 대부분 적용되는 기술입니다.

 

14. 딥러닝 (Deep Learning, DL)

딥러닝은 머신러닝의 방법 중 하나로, 기계가 사람의 도움 없이 정확한 결정을 내릴 수 있도록 돕는 기술입니다. 이를 위해선 ‘인공신경망 (ANN)’이 필요한데요. 딥러닝의 핵심은 이 인공신경망을 통해 기계가 스스로 학습하고 판단하는 행위가 가능하단 점에 있습니다. 즉, 인간과 가장 유사한 AI 개발을 위해 반드시 필요한 기술이라고 할 수 있습니다.

 

 

 

머신러닝, 딥러닝

 

15. AI 편향성 (AI Bias)

AI 편향성은 AI 시스템이 정당하지 않거나, 부당하게 특정 그룹이나 개인을 차별하는 경향을 가진 것을 의미합니다. 편향성은 다양한 방식으로 나타날 수 있는데요. 대표적으로 훈련 데이터의 불균형으로 인한 ‘데이터 편향’, 개발 과정에서 개발자의 편견이나 선입견이 반영된 ‘개발자 편향’, AI를 활용한 추천 시스템에서 유저의 기존 선호도만 강화해 다양한 콘텐츠 노출을 저해하는 ‘확증 편향’이 있습니다.

 

16. 할루시네이션 (Hallucination) 현상

할루시네이션이 현상이란 환각 현상이라고도 하며, AI가 잘못된 정보를 마치 사실인 것처럼 제시하는 현상입니다. 대표적으로 ‘세종대왕 맥북프로 던짐 사건’이 있는데요. ChatGPT에게 실재하지 않는 가상의 사건을 질문하자 해당 질문을 마치 진짜 있었던 사건처럼 대답해 한동안 이슈가 됐었죠. 전문가들은 할루시네이션 현상 극복을 위해 신뢰성 있는 데이터 확보와 훈련 방법 및 평가 프로세스 개선의 중요성을 강조하고 있습니다.

 

Content Mnagement for AI

 

파수는 이전부터 본격적인 AI 시대를 위한 준비를 하고 있었는데요. 올바른 AI 콘텐츠 학습 방법부터 AI 기술 관련 보안까지 다양한 솔루션들이 준비돼 있으며, 파수 국/영문 홈페이지에 AI 관련 콘텐츠들이 지속적으로 업로드 될 예정입니다.

 

https://www.fasoo.com/solutions/ai-content-management

 

AI 콘텐츠 학습

AI 콘텐츠 학습에 대한 정보 제공, AI 시대에 문서가상화가 필요한 이유, 기업 정보 (Corporate Intelligence)가 포함된 주요 데이터의 효율적인 AI 학습 방법 제공, ROT 데이터의 식별 및 제거를 통한 콘텐

www.fasoo.com

 

 

AI가 인간을 완벽하게 대체하게 되는 날이 과연 오게 될까요? 의견은 분분하지만, 생성형 AI의 시대가 도래했다는 사실은 분명합니다. 앞으로 기업 입장에서 중요한 건 이 변화에 대응하는 방식일 겁니다. 오늘은 AI와 관련된 용어들을 설명해 드렸는데요. 많은 도움이 되셨으면 좋겠습니다^^

다가온 AI의 시대, 늘 그랬듯 AI전문기업으로 거듭나고 있는 파수가 앞장서겠습니다!