μ€ν κ°μ
λ³Έ μ€νμ νκ΅μ΄ μν 리뷰 λ°μ΄ν°μ (NSMC)μ μ¬μ©νμ¬ meta-llama/Llama-2-7b-chat-hf λͺ¨λΈμ λ―ΈμΈ νλνκ³ , νκ΅ μν 리뷰μ κΈμ λλ λΆμ μ λΆλ₯νλ λͺ¨λΈμ νμ΅νμμ΅λλ€. μ€νμ Hugging Faceμ PEFTμ SFTTrainerλ₯Ό μ¬μ©νμ¬ μννμΌλ©°, νκ°λ μ νλ λ° νΌλ νλ ¬μ ν¬ν¨ν λ€μν μ§νλ₯Ό ν΅ν΄ μ΄λ£¨μ΄μ‘μ΅λλ€.
μ€ν νκ²½ μ€μ
λͺ¨λΈ: KT-AI/midm-bitext-S-7B-inst-v1
νμ΅ λ°μ΄ν°: NSMC (λ€μ΄λ² μν 리뷰 λ°μ΄ν°μ
)
νμ΄νΌνλΌλ―Έν° λ° μ€μ
λ―Έλλ°°μΉ ν¬κΈ°: 1
μνμ€ κΈΈμ΄: 384
νμ΅λ₯ : 1e-4
μν μ: 1
μ νλ ν₯μμ μν λ Έλ ₯
νλ ¨ λ°μ΄ν° νμ₯ νλ ¨ λ°μ΄ν°μ κ°μλ₯Ό 2000κ°λΆν° μμνκ³ 1000κ°μ© νμ₯νμ¬ νμ΅μμΌ°μ΅λλ€.
ν둬ννΈ ν νλ¦Ώ λ³κ²½ λ€μν ν둬ννΈ ν νλ¦Ώμ μλνμ¬ μ΄λ€ νμμ΄ λͺ¨λΈμ μ±λ₯μ ν₯μμν€λμ§ νκ°νμ΅λλ€.
νλ ¨ μ΄ μ€ν μ λ³κ²½ νλ ¨ μ€ν μ΄ λμμλ‘ λ λ§μ λ°μ΄ν°λ₯Ό μ²λ¦¬ν μ μμ΅λλ€. νμ§λ§ λ무 λκ±°λ νλ ¨ λ°μ΄ν° κ°μκ° μΆ©λΆνμ§ μλ€λ©΄ μ€λ²νΌν λ μ μκΈ° λλ¬Έμ 800μ λλ‘ λ무 λμ§ μκ² λ³κ²½νμ΅λλ€.
μμ 3κ°μ§ λ°©λ²μ μ‘°ν©νμ¬ μ νλκ° 0.9 μ΄μμ΄ λ μ μλλ‘ νμ΅μμΌ°μ΅λλ€.
λΆλ₯ κ²°κ³Ό
Confusion Matrix
TP | TN | |
---|---|---|
PP | 446 | 28 |
PN | 62 | 464 |
Classification Report
precision | recall | f1-score | support | |
---|---|---|---|---|
Negative | 0.88 | 0.94 | 0.91 | 492 |
Positive | 0.94 | 0.88 | 0.91 | 508 |
accuracy | 0.91 | 1000 | ||
macro avg | 0.91 | 0.91 | 0.91 | 1000 |
weighted avg | 0.91 | 0.91 | 0.91 | 1000 |
κ²°κ³Ό λΆμ
μ νλλ 0.910μΌλ‘ λͺ¨λΈμ΄ 1000κ° ν μ€νΈ λ°μ΄ν° μ€ 910κ°μ λν΄ μ νν μμΈ‘μ μννλ€. TP : 446, TN : 464, FP : 28, FN : 62μ κ²°κ³Όκ° λμλ€. λ―ΈμΈνλλ λͺ¨λΈμ μ£Όλ‘ κΈμ μ μΈ λ¦¬λ·°λ₯Ό λΆμ μ μΌλ‘ μλͺ» μμΈ‘νλ κ²½ν₯μ΄ μλ€.