▶️25분
[영상] GPT-4o 멀티모달 RAG 구현하기
Day 2: Hybrid Search
[영상] GPT-4o 멀티모달 RAG 구현하기
RAG 심화 > Day 2: Hybrid Search
학습 목표
GPT-4o Vision의 이미지 이해를 RAG 파이프라인에 통합하는 세 가지 패턴을 설명할 수 있다 이미지·표·텍스트를 각각 요약해 통합 인덱스에 저장하는 멀티모달 청킹 전략을 설계할 수 있다 제조 도면 PDF에서 텍스트와 이미지를 추출·임베딩하는 코드 흐름을 작성할 수 있다 멀티모달 RAG와 텍스트 전용 RAG의 RAGAS 지표 차이를 해석할 수 있다
플레이어 로딩 중...
핵심 포인트
- • 멀티모달 3패턴: ①이미지→텍스트 요약 후 인덱싱, ②이미지 임베딩 별도, ③멀티벡터
- • GPT-4o: 이미지 base64 인코딩 후 메시지에 첨부
- • unstructured 라이브러리: PDF에서 표·이미지 자동 분리 추출
- • 멀티모달 추가 시 Context Recall 평균 15~25% 향상