← Mục lục
Làm toán AI ✍️ · Toán × AI
Phiếu in A4 · tính tay
Mức: nhập môn · ML cổ điển (B)
Bài B11

Gradient Boosting — ý tưởng (XGBoost/LightGBM)

Họ tên: Ngày: Thời gian: ~12 phút
Vì sao quan trọng. Một cây nông dự đoán dở, nhưng cộng dồn nhiều cây, mỗi cây sửa lỗi còn lại của cây trước, thì rất mạnh — chiến thắng nhiều cuộc thi ML trên dữ liệu bảng. "Gradient" vì phần dư chính là gradient của loss MSE.
F₀ = trung bình  |  rₘ = y − Fₘ₋₁ (phần dư)  |  Fₘ = Fₘ₋₁ + η·hₘ(x)  (hₘ khớp rₘ)
💡 Trực giác Như sửa bài nhiều lượt: dự đoán thô trước, xem còn sai bao nhiêu (phần dư), rồi thêm một "miếng vá" nhỏ chuyên chữa phần sai đó. Lặp vài lượt, mỗi lượt vá thêm một ít (×η để khỏi vá quá tay).
0

Cho sẵn

3 mẫu
y = (2, 4, 9)  |  F₀ = trung bình  |  η = 0.5
Vì sao: bắt đầu bằng dự đoán "ngu nhất nhưng hợp lý" = trung bình; rồi sửa dần.
1

F₀ & phần dư

r = y − F₀
F₀ = (y₁+y₂+y₃)/3 =
r = (, , )
Vì sao: với loss MSE, phần dư chính là −gradient → "boosting theo gradient".
2

Mô hình yếu h₁ khớp dư

≈ r
h₁ = (, , )  (khớp đúng r ở ví dụ tối giản)
Mẹo: thực tế h₁ chỉ xấp xỉ r, không khớp hoàn hảo.
3

Cập nhật F₁ = F₀ + η·h₁

bước một phần
F₁ = F₀ + η·h₁ = (, , )
Vì sao: chỉ bước một phần (η<1) về phía đúng → giảm sai từ từ, tránh khớp quá (overfit).
Làm toán AI ✍️ — Bài B11 · Gradient BoostingTrang 1/3 · ĐỀ
Làm toán AI ✍️ · Toán × AI
Phiếu in A4 · tính tay
Gradient Boosting — tiếp theo
Bài B11

Gradient Boosting — dư mới & hội tụ

4

Dư mới & lặp

r₂ = y − F₁
r₂ = y − F₁ = (, , ) → so với r₁ thì
Vì sao: sau khi vá một phần, sai số còn lại (dư mới) nhỏ hơn dư cũ → vòng sau tiếp tục co lại.
Lặp tiếp với h₂ khớp r₂… tổng các cây hội tụ về y. Mỗi vòng phần dư co lại.
5

Vẽ sai số qua các vòng

|r₁| → |r₂|
Vì sao: mỗi nhóm 3 cột là |dư| của 3 mẫu; nhóm sau (|r₂|) phải thấp hơn nhóm trước (|r₁|).
Tự vẽ chiều cao từng cột theo |r₁|, |r₂| đã tính; boosting kéo sai số xuống dần.
✎ Tự kiểm tra
  1. Mỗi mô hình mới học cái gì? →
  2. Vì sao nhân học suất η < 1? →
Làm toán AI ✍️ — Bài B11 · Gradient BoostingTrang 2/3 · ĐỀ
Làm toán AI ✍️ · Toán × AI
ĐÁP ÁN
Bài B11

Gradient Boosting — lời giải & kiểm tra

1

F₀ & phần dư

F₀ = 5  |  r = (−3, −1, 4)
2–3

h₁ & cập nhật F₁

h₁ = r = (−3, −1, 4)
F₁ = 5 + 0.5·h₁ = (3.5, 4.5, 7)
4

Dư mới & lặp

nhỏ dần
r₂ = y − F₁ = (−1.5, −0.5, 2) → nhỏ hơn r₁
Lặp tiếp với h₂ khớp r₂… tổng các cây hội tụ về y. Mỗi vòng phần dư co lại.
5

Sai số thu nhỏ qua các vòng

|r₁| → |r₂|
Nhóm cột |r₁| (trước) cao hơn nhóm |r₂| (sau) — boosting kéo sai số xuống dần.
✎ Tự kiểm tra — đáp án
  1. Mô hình mới học → Phần dư (sai số) của tổng các mô hình trước.
  2. Vì sao η < 1 → Bước từ từ để tránh khớp quá, tăng khái quát.
Rút ra. Boosting = cộng dồn mô hình yếu, mỗi cái chữa dư của tổng trước (= đi theo gradient của loss). Hết Phần B. Sang Phần C (nơ-ron) — Bài tiếp: lớp tuyến tính, hàm kích hoạt, một nơ-ron.
Làm toán AI ✍️ — Bài B11 · Gradient BoostingTrang 3/3 · ĐÁP ÁN