Phiếu in A4 · tính tay Mức: nhập môn · ML cổ điển (B)
Bài B8
Cây quyết định: Entropy & IG — Entropy & Information Gain
Họ tên: Ngày: Thời gian: ~14 phút
Vì sao quan trọng. Cây hỏi từng câu "có/không" để tách lớp — dễ hiểu, dễ giải thích. Bí quyết: chọn câu hỏi làm dữ
liệu "sạch lớp" nhất. Entropy đo độ lẫn lộn; IG đo lợi ích một phép chia. Đây cũng là nền của Random Forest, XGBoost.
Tiêu chí chia → Information Gain lớn nhất (giảm entropy nhiều nhất).
Rút ra. Entropy đo lộn xộn, IG đo lợi ích chia; cây tham lam chọn IG lớn nhất ở mỗi bước.
Bài tiếp (B9): độ "bẩn" thay bằng Gini (CART) — rẻ tính hơn, ý tưởng tương tự.
Làm toán AI ✍️ — Bài B8 · Entropy & IGTrang 3/3 · ĐÁP ÁN