LLM 평가지표
https://colab.research.google.com/drive/18ncb5Q_2Hp7cxVzMjRLMRxsE8xEZya9j
Google Colab Notebook
Run, share, and edit Python notebooks
colab.research.google.com
- semscore, bertscore 정도가 낫다.
- bleu, rouge 점수는 사람이 매긴 점수와 유사성/상관관계가 없다 .
- 현실적으로는 semscore, bertscore + 사람이 직접 평가
- 요즘 트렌드는 각자의 모델에 맞는 평가지표 만들어서 쓴다.
- 아직은 llm이 미완성 단계라고 보고 지속적으로 평가지수에 대해 알아
Langchain prompt
https://colab.research.google.com/drive/18VEFd6NlgtQpc6IfG4VXXn5wyAzO_qyU
Google Colab Notebook
Run, share, and edit Python notebooks
colab.research.google.com
- https://colab.research.google.com/drive/1tlhWw7IDQ5Io1XZKHQzRJ8cpiHLZgLWY#scrollTo=beARkQjPboM3
- ChatPrompt Template : role, message 정의
- tuple형태의 메시지도 가능함.
Google Colab Notebook
Run, share, and edit Python notebooks
colab.research.google.com
youtube 영상 캡션 따서 데이터셋 만들고 finetuning하기
- 프롬프트 + 캡션 + eos 토큰 으로 다시 구성해서 데이터 셋 만들기
- finetuning
- sftt (supervised fine-tuning trainer)
- runpod에서 RTX A5000, 50 GB Disk, 50 GB Pod Volume 생성
- hf_token, hf repo_id , 모델명 등을 수정
https://drive.google.com/file/d/1jLmTfdgOautwlPq_TGnSorACmMFDGTyI/view?usp=drive_link
'SK Networks Family AI bootcamp 강의노트' 카테고리의 다른 글
55일차 [aws 특강] (0) | 2025.04.04 |
---|---|
55일차 [ langchain / outputparser] (0) | 2025.04.04 |
53일차 [ RLHF(강화학습)/ DPO/PPO ] (0) | 2025.04.02 |
52일차 [ Fine-tuning/ Prompt, Quantization,GGUF, PEFT ] (0) | 2025.04.01 |
51일차 [ Fine Tuning ] (0) | 2025.03.31 |