[Project를 위한 공부]

[Project를 위한 공부] RAG 정의 정리

dyk98 2025. 1. 20. 18:46

RAG 란?

RAG(즉, Retrieval-Augmented Generation)는 정보 검색 시스템과 자연어 생성 모델을 결합한 방식으로, 사용자에게 보다 정확하고 풍부한 정보를 제공하기 위해 사용이 됨
주로 두가지 주요 단계를 포함하는데

사용자 질문이나 입력에 따라 외부 데이터베이스 또는 문서에서 관련 정보를 검색.
여기서 사용되는 검색 방식은 TF-IDF, BM25, 혹은 Dense Retrieval 모델(Sentence Transformers, DPR 등)일 수 있음.
이 단계에서 찾은 정보는 후속 단계에서 답변 생성을 보조하기 위해 사용됩니다.

검색된 정보를 기반으로 자연어 생성 모델(주로 GPT와 같은 Transformer 기반 언어 모델)을 사용하여 답변을 생성합니다.
생성된 답변은 검색된 정보를 인용하거나 보완하여 정확성과 신뢰성을 높입니다.
즉 LLM model을 좀더 효율적으로 개인화 및 실용화 시기키 위해 좀더 좋은 퀄리티있는 질문을 하기 위해 만들어진 기법인듯 함.

RAG 는 LLM 의 한계 인 허위정보 제공, 오래되거나 일반적인 정보제공, 신뢰할수 없는 출처 잠조, 용어 혼동등으로 정확성의 결여라는 문제를 좀더 보안해주는 역할을 한다.
RAG의 작동 방식
외부 데이터 생성:
- 데이터베이스, 문서 등 외부 소스를 벡터로 변환해 저장.
관련 정보 검색:
- 사용자 쿼리를 벡터 데이터베이스와 매칭해 관련 데이터 검색.
LLM 프롬프트 확장:
- 검색된 데이터를 추가해 LLM 입력(프롬프트)을 보강.
외부 데이터 업데이트:
- 실시간 또는 주기적으로 데이터 갱신.

그뜻은 괜찮은 RAG 활용으로 개인화 시켜 AgentAI 와 같은 식으로 만들수도 있고 작업의 자동화 및 최적화를 시켜 업무의 기획에 있어 많든 시간을 아낄수 있는듯하다.

RAG란? - 검색 증강 생성 AI 설명 - AWS

시맨틱 검색은 방대한 외부 지식 소스를 LLM 애플리케이션에 추가하려는 조직의 RAG 결과를 향상시킵니다. 오늘날의 기업은 매뉴얼, FAQ, 연구 보고서, 고객 서비스 가이드, 인사 관리 문서 리포지

aws.amazon.com

[Project 를 위한 공부] API 와 같은 중요한 정보 관리 방법들.. (0)	2025.01.23
[Project 를 위한 공부] Middleware 정리 (0)	2025.01.21
[Project 를 위한 공부] Serializer 와 Deserializer (3)	2025.01.16
[Project를 위한 공부] github.io 로 블로그 정검하기 (3)	2025.01.14
[Project를 위한 공부] Meta data 정리 (2)	2025.01.13

dyk98 님의 블로그

Managing My Time More Valuable