45분
실습: 임베딩 모델 비교 실험
Day 2: 청킹 & 임베딩
실습: 임베딩 모델 비교 실험
RAG 기초 > Day 2: 청킹 & 임베딩
학습 목표
OpenAI 임베딩 모델을 사용하여 텍스트를 벡터로 변환할 수 있다 코사인 유사도를 계산하여 문서 관련성을 판단할 수 있다 제조 용어 임베딩 품질을 테스트할 수 있다
임베딩 모델 비교 실험
제조 도메인 텍스트로 임베딩 모델의 성능을 직접 테스트한다.
환경 설정
에디터 로딩 중...
실습 목표
- OpenAI 임베딩으로 제조 용어 벡터화
- 코사인 유사도로 관련성 측정
- 제조 도메인 쿼리 vs 문서 매칭 실험
- (선택) BGE-M3 로컬 모델 비교
에디터 로딩 중...
힌트 보기
- • USE_OPENAI = True로 바꾸려면 OPENAI_API_KEY 환경변수가 필요하다.
- • 코사인 유사도가 0.7 미만이면 "관련 없음"으로 판단하는 임계값을 설정해볼 것.
- • BGE-M3는 sentence-transformers 라이브러리로 로컬에서 사용 가능: SentenceTransformer("BAAI/bge-m3")
정답 보기
에디터 로딩 중...