RAG(검색 증강 생성)이란

theeyesofpine 2024. 8. 26. 16:23

2024. 8. 26. 16:23

들어가며

최근 인공지능 기술의 발전으로 다양한 분야에서 혁신을 일으키고 있습니다. 하지만 ChatGPT 를 사용하면서 느꼈던 점은 일반적인 내용으로만 답변을 하며 전문적이거나 내가 가진 데이터들을 활용하기 힘들다는 점이었습니다.

이러한 한계를 극복하기 위해 Privit한 정보를 활용하여 LLM을 사용할 수 없을까해서 나온것이 벡터 DB를 활용한 RAG입니다.

검색 증강 생성인 RAG에 대해서 DBA적 측면에서 간단하게 설명을 하고 들어가겠습니다.

검색 증강 생성(Retrieval Augmented Generation, RAG) 는 DB에 있는 정보 등의 별도 정보원을 제공하여 환각 현상을 방지하고 사용자가 원하는 LLM의 답변 품질을 개선한 프로세스입니다.

Oracle AI Vector Search는 벡터를 관계형 데이터, 그래프 데이터, 공간 데이터 및 JSON 컬렉션과 결합할 수 있는 정교한 쿼리를 구현하기 위해 Enterprise Retrieval Augmented Generation(RAG)을 지원합니다.

검색 증강 생성은 LLM의 한계를 해결하기 위해 개발된 접근 방식입니다.

§ RAG는 사전 학습된 언어 모델의 강점과 응답 생성 중에 데이터 세트 또는 데이터베이스에서 최신의 정확한 정보를 실시간으로 검색하는 기능을 결합합니다.

§ RAG 구현을 통해 LLM과 소통하고 AI 벡터 검색을 통해 발견된 비즈니스 데이터로 LLM의 지식이 증가합니다.

GPT(Generative Pretrained Transformer)와 같은 LLM의 주요 문제는 마지막 업데이트 시점까지 훈련받은 패턴과 데이터에만 기반하여 응답을 생성한다는 것입니다.

즉, 훈련이 중단된 후에는 새로운 실시간 정보에 액세스하거나 통합할 수 있는 능력이 본질적으로 부족하여 오래되거나 불완전한 정보에 대한 응답이 제한될 수 있습니다.

LLM은 개인의 환경에 특화된 데이터를 알지 못하고 일반적인 데이터정보만 가지는 한계가 있습니다.

따라서 LLM이 지닌 한계인 일반적인 데이터정보를 극복하기 위해 ORACLE DB내에 정보까지 확장시켜 조회하는 RAG를 구축하게 되었습니다.