45

실습: 임베딩 모델 비교 실험

Day 2: 청킹 & 임베딩

학습 목표

OpenAI 임베딩 모델을 사용하여 텍스트를 벡터로 변환할 수 있다 코사인 유사도를 계산하여 문서 관련성을 판단할 수 있다 제조 용어 임베딩 품질을 테스트할 수 있다

임베딩 모델 비교 실험

제조 도메인 텍스트로 임베딩 모델의 성능을 직접 테스트한다.


환경 설정

에디터 로딩 중...

실습 목표

  1. OpenAI 임베딩으로 제조 용어 벡터화
  2. 코사인 유사도로 관련성 측정
  3. 제조 도메인 쿼리 vs 문서 매칭 실험
  4. (선택) BGE-M3 로컬 모델 비교
에디터 로딩 중...
힌트 보기
  • USE_OPENAI = True로 바꾸려면 OPENAI_API_KEY 환경변수가 필요하다.
  • 코사인 유사도가 0.7 미만이면 "관련 없음"으로 판단하는 임계값을 설정해볼 것.
  • BGE-M3는 sentence-transformers 라이브러리로 로컬에서 사용 가능: SentenceTransformer("BAAI/bge-m3")
정답 보기
에디터 로딩 중...