Phiếu in A4 · tính tay Mức: nhập môn · ML cổ điển (B)
Bài B7
Naive Bayes — Naive Bayes classifier
Họ tên: Ngày: Thời gian: ~13 phút
Vì sao quan trọng. Naive Bayes đảo ngược xác suất: từ "thư rác hay viết chữ X" suy ra "thấy X thì có phải
rác". Giả định độc lập "ngây thơ" biến phép tính thành phép nhân đơn giản mà hiệu quả.
P(lớp | x) ∝ P(lớp) · ∏ᵢ P(xᵢ | lớp) → chọn lớp có tích lớn nhất
💡 Trực giác
Mỗi đặc trưng bỏ một lá phiếu cho từng lớp; nhân hết với "thành kiến ban đầu" P(lớp), tích cao nhất thì thắng.
"Naive" = coi các đặc trưng không liên quan nhau.
Xác suất 0 cho một từ sẽ "giết" cả tích → thực tế dùng làm trơn Laplace (cộng 1 vào mọi đếm).
5
Hình minh họa
tích phiếu
Hai cột là điểm tích lũy của mỗi lớp; lớp có cột cao hơn thắng. Chuẩn hóa = chia cho tổng hai cột.
✎ Tự kiểm tra — đáp án
Giả định "naive" → Các đặc trưng độc lập với nhau khi đã biết lớp.
Vì sao làm trơn? → Tránh xác suất 0 làm cả tích về 0.
Rút ra. Naive Bayes = P(lớp)·∏P(đặc trưng|lớp), chọn lớp lớn nhất; nhanh và mạnh cho văn bản.
Bài tiếp (B8): chia dữ liệu bằng cây quyết định dựa trên entropy & information gain.
Làm toán AI ✍️ — Bài B7 · Naive BayesTrang 3/3 · ĐÁP ÁN