RAG 란?
RAG(즉, Retrieval-Augmented Generation)는 정보 검색 시스템과 자연어 생성 모델을 결합한 방식으로, 사용자에게 보다 정확하고 풍부한 정보를 제공하기 위해 사용이 됨
주로 두가지 주요 단계를 포함하는데
- 정보 검색 (Retrieval)
- 사용자 질문이나 입력에 따라 외부 데이터베이스 또는 문서에서 관련 정보를 검색.
- 여기서 사용되는 검색 방식은 TF-IDF, BM25, 혹은 Dense Retrieval 모델(Sentence Transformers, DPR 등)일 수 있음.
- 이 단계에서 찾은 정보는 후속 단계에서 답변 생성을 보조하기 위해 사용됩니다.
- 생성 (Generation)
- 검색된 정보를 기반으로 자연어 생성 모델(주로 GPT와 같은 Transformer 기반 언어 모델)을 사용하여 답변을 생성합니다.
- 생성된 답변은 검색된 정보를 인용하거나 보완하여 정확성과 신뢰성을 높입니다.
즉 LLM model을 좀더 효율적으로 개인화 및 실용화 시기키 위해 좀더 좋은 퀄리티있는 질문을 하기 위해 만들어진 기법인듯 함.
- RAG 는 LLM 의 한계 인 허위정보 제공, 오래되거나 일반적인 정보제공, 신뢰할수 없는 출처 잠조, 용어 혼동등으로 정확성의 결여라는 문제를 좀더 보안해주는 역할을 한다.
- RAG의 작동 방식
- 외부 데이터 생성:
- 데이터베이스, 문서 등 외부 소스를 벡터로 변환해 저장.
- 관련 정보 검색:
- 사용자 쿼리를 벡터 데이터베이스와 매칭해 관련 데이터 검색.
- LLM 프롬프트 확장:
- 검색된 데이터를 추가해 LLM 입력(프롬프트)을 보강.
- 외부 데이터 업데이트:
- 실시간 또는 주기적으로 데이터 갱신.
그뜻은 괜찮은 RAG 활용으로 개인화 시켜 AgentAI 와 같은 식으로 만들수도 있고 작업의 자동화 및 최적화를 시켜 업무의 기획에 있어 많든 시간을 아낄수 있는듯하다.
https://aws.amazon.com/ko/what-is/retrieval-augmented-generation/
RAG란? - 검색 증강 생성 AI 설명 - AWS
시맨틱 검색은 방대한 외부 지식 소스를 LLM 애플리케이션에 추가하려는 조직의 RAG 결과를 향상시킵니다. 오늘날의 기업은 매뉴얼, FAQ, 연구 보고서, 고객 서비스 가이드, 인사 관리 문서 리포지
aws.amazon.com
'[Project를 위한 공부]' 카테고리의 다른 글
[Project 를 위한 공부] API 와 같은 중요한 정보 관리 방법들.. (0) | 2025.01.23 |
---|---|
[Project 를 위한 공부] Middleware 정리 (0) | 2025.01.21 |
[Project 를 위한 공부] Serializer 와 Deserializer (3) | 2025.01.16 |
[Project를 위한 공부] github.io 로 블로그 정검하기 (3) | 2025.01.14 |
[Project를 위한 공부] Meta data 정리 (2) | 2025.01.13 |