Vì sao quan trọng. Mạng nơ-ron làm việc với
số thực, không với nhãn văn bản.
One-hot biến "chó/mèo/chim" → [1,0,0]/[0,1,0]/[0,0,1] để có thể so sánh với đầu ra softmax.
Cross-entropy loss = −Σ yᵢ·ln(pᵢ) chỉ còn −ln(p_{nhãn đúng}) vì các yᵢ còn lại = 0.
Nhãn k trong K lớp → vectơ e_k ∈ {0,1}^K, eₖ=1, eⱼ=0 (j≠k)
Xanh = nhãn thật (one-hot, 1 ô = 1); Cam = softmax dự đoán. Loss = −ln(pₖ) với k = vị trí 1 trong one-hot.
BÀI TẬP · K = 5 lớp
Mã hóa các nhãn sau thành vectơ one-hot
CROSS-ENTROPY · nhãn thật vs. dự đoán
Nhãn thật: lớp 4 | Softmax: p = […]
Loss = −ln(p_4) = −ln(0.6) =
✎ Tự kiểm tra
- Nếu mô hình dự đoán đúng 100% (p_y = 1): Loss = ? →
- Vectơ one-hot có bao nhiêu số 1? →