20

Day 3 이해도 점검: QLoRA 학습

QLoRA 학습 실행

6문제

Q1. QLoRA 학습 시 Train Loss는 0.3인데 Val Loss가 1.5로 올라갔다면?

Q2. 8GB GPU에서 7B 모델을 학습할 때 메모리 부족이면 가장 먼저 시도할 것은?

Q3. SFTTrainer에서 packing=True의 효과는?

Q4. Unsloth가 표준 HuggingFace 대비 2배 빠른 주된 이유는?

Q5. 학습 후 일반 질문 답변 품질이 떨어지는 "파국적 망각"의 해결책이 아닌 것은?

Q6. 학습률 스케줄러 "cosine"의 특징은?