RAG, AI Agent란 무엇인가 | 지식의 확장과 집중 | 구조화된 데이터
업스테이지 프라이빗 세미나 2회차 AI Agent/ RAG 기술 동향
요즘 가장 핫하고 많은 분들이 관심을 가지고 있는 주제, 바로 에이전트와 RAG입니다. 저도 정말 관심이 많은데요. 4월 9일 업스테이지의 프라이빗 세미나(Up-Edu Private Seminar) 2회차에서 “AI Agent/ RAG 기술 동향”을 주제로 기술 소개와 인사이트를 공유했습니다.
1회차 세미나에서는 AGI 시대에 앞으로 어떻게 살아야 할 것인가를 다뤘다면, 이번 회차에서는 AI Agent/ RAG 두 기술의 개념과 차이점, 그리고 이를 구현하는 과정에서 데이터 처리에 대한 내용을 다뤘는데요. 업스테이지 테크 리드 박준현 님께서 나와 현직자의 관점에서 자세히 설명해주셨습니다. 현직자만이 말할 수 있는 풍부하고 생생한 이야기들을 쏙쏙 뽑아 요약, 정리했습니다.
RAG의 진짜 능력은 지식의 확장과 집중에서 나온다
RAG(Retrieval-Augmented Generation)는 '검색 증강 생성'으로 번역됩니다. 이 중에서 가장 중요한 것은 무엇일까요? 많은 분들이 ‘검색’ 부분을 언급합니다. 하지만 박준현 리드님께서 강조한 것은 ‘증강’이였습니다.
“증강이라는 의미를 두 가지 방식으로 해석할 수 있습니다. 하나는 지식의 확장이고, 다른 하나는 지식의 집중입니다.”
LLM(대규모 언어 모델)은 학습한 지식의 틀 안에서만 답변을 합니다. 보편적이고 일반적인 지식들을 학습했기 때문에 LLM이 가진 지식에는 한계가 있습니다. RAG는 이 한계를 극복하기 위해 실시간으로 업데이트되는 정보를 외부에서 검색해 LLM의 지식을 확장합니다. 또한 LLM이 가진 보편적인 지식이 아닌, 특정 영역에 집중된 정보를 제공함으로써 더 정확한 답변을 가능하게 합니다.
예를 들어 마약 관련 법에 대해 물어보면, LLM은 일반적인 미국 법 위주의 답변을 합니다. 하지만 한국의 마약류 관리법을 직접 참조해 답변한다면 훨씬 더 정확하겠죠. 이것이 지식을 집중시키는 RAG의 가치입니다.
RAG를 잘 하려면 좋은 데이터가 필요하다
데이터를 증강하기 위해 가장 중요한 것은 데이터입니다. 세상에는 수많은 종류의 데이터가 있지만 그 중에서도 질이 높은 데이터는 정보가 집약되어 있는 도큐먼트들입니다. 표와 차트가 있고, 단이 나눠져 있기도 하며, 머릿말이나 꼬리말, 쪽수 등 시각적으로 구분되는 다양한 정보들이 압축되어 있습니다. 중요한 글씨가 굵게 처리되어 있기도 하고, 글자의 크기를 다르게 하여 부가적인 정보를 전달하기도 합니다.
RAG를 통해 이러한 도큐먼트를 참조하기 위해서는 문서 내 구조적인 정보를 모두 담은 데이터로 변환시켜야 합니다. (그래서 업스테이지에서 다큐먼트 파서를 만들었고, 업스테이지 콘솔 플레이그라운드에서 이를 테스트해볼 수 있다고 합니다.)
AI 에이전트, LLM의 한계를 보완하다
“LLM 시대가 오면서 하나의 모델로 여러 태스크를 풀게 되었지만, 실제와 이상은 달랐습니다. 예를 들어 숫자 계산은 LLM으로 굳이 필 필요가 없죠. 컴퓨터 자체가 기본적인 계산기니까요.”
에이전트는 LLM이 모든 문제를 효율적으로 해결하지 못한다는 깨달음에서 등장하게 되었습니다. 에이전트 개념도 확장과 집중이라고 볼 수 있습니다. 에이전트는 LLM이 추론(Reasoning)에 집중하게 하고, LLM이 잘하지 못하거나 외부 자원을 활용해야 하는 작업은 별도의 도구로 분리합니다. 각 도구가 자신의 영역에서 최적의 성능을 발휘할 수 있게 한 것입니다.
에이전트 워크플로우의 핵심은 목표에 따라 작업들을 쪼개서 설계하는 것입니다. 예를 들어 “오늘 날씨는 어때?”를 에이전트로 푼다면 어떨까요? 강력한 LLM 라우터가 워크플로우를 제어하고, 날씨 에이전트, 웹 검색 에이전트, 요약 에이전트가 각각 붙어 있을 것입니다. 날씨 에이전트에는 기상청 API가 붙어서 날씨를 조회하고요. 이와 같이 워크플로우를 만든다고 했을 때 파라미터를 설계하고 Task Decompose(업무 세분화) 하는 것이 중요하다고 할 수가 있겠습니다.
또한 에이전트 워크플로우를 만들 때 동기식으로 반복하면서 검색에 병목이 생기거나 시스템에 부하가 발생할 수 있습니다. 사용자 경험을 위해서는 어떤 부분에 에이전트 워크플로우를 적용할지 사람이 신중하게 선택해야 할 부분들도 있습니다.
에이전트는 구조화된 데이터를 받는다
에이전트 시스템의 성공적인 작동에 있어 구조화된 데이터(Structured Data)의 중요성도 강조했습니다. 에이전트도 기본적으로 컴퓨터이기 때문에 컴퓨터가 이해할 수 있는 언어를 받아야 합니다. LLM은 비정형 데이터를 이해할 수 있지만, 에이전트들은 정형 데이터를 받았을 때 정해진 액션을 더 잘 수행하기 때문입니다.
에이전트 워크플로우에서는 LLM은 사용자의 비정형 쿼리나 문서 데이터를 받아 구조화된 형태로 변환한 뒤에 다른 에이전트에게 전달합니다. 즉 비정형 데이터를 구조화된 데이터로 변환하는 것이 핵심이며, 업스테이지는 이러한 필요성에 대응하여 '인포메이션 익스트랙션' 기능을 새롭게 제공한다고 강조했습니다. 이 도구는 수백 장에 달하는 문서도 에이전트가 활용할 수 있는 구조화된 데이터로 변환할 수 있으며, API로도 제공됩니다.
재미있게 읽으셨나요?
이 글이 도움이 되셨다면
제가 직접 쓰고 만드는 뉴스레터를 구독해보세요!
매주 수요일마다 주요 AI 소식들과 인사이트를
메일함에 넣어드립니다.
https://eddienewsletter.stibee.com/
AI안테나
인공지능과 함께 만드는 AI 뉴스
eddienewsletter.stibee.com