▶️25

[영상] 한글 BM25 + FAISS 하이브리드 검색

Day 1: 멀티모달 RAG

학습 목표

한국어 BM25가 효과적인 이유와 형태소 분석의 필요성을 설명할 수 있다 FAISS IndexFlatL2와 IndexIVFFlat의 차이를 성능 관점에서 비교할 수 있다 BM25 + FAISS 하이브리드에서 RRF 점수 합산 방식을 설명할 수 있다 멀티모달 RAG가 필요한 제조 시나리오를 두 가지 이상 제시할 수 있다

플레이어 로딩 중...
핵심 포인트
  • 한국어 BM25: Mecab/Kiwi 형태소 분석기로 조사·어미 제거 후 토크나이징 필수
  • FAISS(Meta): 순수 벡터 라이브러리, IndexIVFFlat로 1억 벡터 100ms 이내 검색
  • RRF 공식: score = Σ 1/(k + rank_i), k=60
  • 멀티모달 필요: CAD 도면 결함 분석, 설비 사진 이상 탐지, PDF 표 추출