LLM(Large Language Model)

김박사 2025. 11. 18. 19:15

2025. 11. 18. 19:15

텍스트 데이터를 학습한 모델
단, 많은 텍스트(상상을 초월하는)

LLM은 단순히 문장을 이어 쓰는 수준이 아니라:

같은 기능을 지원해야함.

ChatGPT, Claude, Gemini, Llama, Qwen 같은 것들이 모두 LLM
(다만, 매개변수가 수십억개 이상으로 증가되는 모델들은 파운데이션 모델로 또 구분되기도 함)

LLM의 핵심 구성 요소

2017년 구굴이 발표한 모델 구조

LLM의 뇌에 해당

핵심 기술:

이 구조로 인해 인공지능은 변환점을 맞이함

모델의 지능 = 파라미터 수 * 학습 데이터 품질

파라미터가 많아지면 모델의 "표현력"이 증가해서 더 정확한 추론과 자연스러운 언어 처리가 가능

Pre-Training (사전 학습)
: 웹 전체, 책, 논문, 코드 등 대용량 데이터를 사용해 "언의어 규칙"을 학습하는 단계
훈련 목표 : 다음 토큰(단어/문자)을 예측해봐
이 단순한 원리로 문법, 의미, 상식, 세계 지식을 전부 배움
ㄴ돈이 미친듯이 드는 단계
ㄴPre-Training에 엄청난 리소스가 발생하기에 RAG 등이 발전한 경향도 존재
Fine-Tuning (파인튜닝)
: 사전학습된 모델에 특정 모델의 데이터(영어 교정, 법률 QA, 코드)로 추가 학습.
ㄴ이것도 시간 많이 들어감, 며칠은 걸림
Instruction Tuning (명령어 학습)
: LLM이 사람의 질문/명령을 잘 이해하고 대답하도록 만든 과정
RLHF (Reinforcement Learning from Human Feedback)
: 사람이 모델의 답변을 평가(Evaluation)해서, 더 좋은 답변을 하도록 강화학습 하는 단계

CUDA(Compute Unified Device Architecture) (0)	2025.12.03
AI 강의 (0)	2025.11.24
A2A(Agent2Agent) protocol (0)	2025.11.19
MCP(Model Context Protocol) - AI 시대의 새로운 표준 인터페이스 (0)	2025.11.19
RAG(Retrieval-Augmented Generation) (0)	2025.11.18