← Mục lục
Làm toán AI ✍️ · Toán × AI
Phiếu in A4 · tính tay
Mức: nhập môn · Phần A
Bài A13

Quy tắc chuỗi — Chain rule

Họ tên: Ngày: Thời gian: ~12 phút
Vì sao quan trọng. Mạng nơ-ron là hàm lồng hàm lồng hàm… Muốn biết loss đổi thế nào theo một trọng số ở lớp sâu, ta nhân các đạo hàm dọc chuỗi. Quy tắc chuỗi chính là cơ chế backpropagation.
y = f(u),   u = g(x)  ⇒  dy/dx = (dy/du) · (du/dx)
💡 Trực giác Chuỗi hàm như dây chuyền bánh răng: bánh x quay làm bánh u quay, bánh u quay làm bánh y quay. Tốc độ y theo x = tích các tỉ số truyền của từng khâu. Nhiều khâu thì cứ nhân tiếp.
0

Cho sẵn hàm lồng

y(u(x))
y = u²  ,  u = 3x + 1  ;  xét tại x = 1
Lớp ngoài: bình phương. Lớp trong: hàm tuyến tính. Cần dy/dx tại điểm đã cho.
1

Đạo hàm lớp ngoài dy/du

coi u là biến
y = u² → dy/du = (tổng quát)
u(1) = 3·1 + 1 = → dy/du =
Vì sao: tạm coi u là biến, đạo hàm lớp ngoài trước — đúng tinh thần "từ ngoài vào trong".
2

Đạo hàm lớp trong du/dx

tuyến tính
u = 3x + 1 → du/dx =
Hàm bậc nhất có độ dốc hằng = hệ số của x.
3

Nhân lại

tích các khâu
dy/dx = (dy/du)·(du/dx) = 8 · 3 =
Vì sao: nhân vì ảnh hưởng truyền nối tiếp — x lay u, u lay y; tổng hiệu ứng là tích.
4

Kiểm bằng khai triển

xác nhận
y = (3x + 1)² → y' = 2(3x + 13; tại x = 1: =
Trong backprop, đây là "δ của lớp trên × đạo hàm cục bộ" lan ngược từng lớp.
✎ Tự kiểm tra
  1. Vì sao backprop chính là quy tắc chuỗi? →
  2. dy/dx ghép hai khâu bằng phép gì? →
Làm toán AI ✍️ — Bài A13 · Quy tắc chuỗiTrang 1/2 · ĐỀ
Làm toán AI ✍️ · Toán × AI
ĐÁP ÁN
Bài A13

Quy tắc chuỗi — lời giải

1

dy/du

y = u² → dy/du = 2u
u(1) = 3·1 + 1 = 4 → dy/du = 2·4 = 8
2

du/dx

u = 3x + 1 → du/dx = 3
3

Nhân lại

dy/dx = 8 · 3 = 24
4

Khai triển kiểm tra

y' = 2(3x + 13; tại x = 1: = 2·4·3 = 24 ✓ (khớp)

Sơ đồ: dây chuyền bánh răng x → u → y

tích tỉ số
Mỗi mũi tên là một "tỉ số truyền": x→u là du/dx = 3, u→y là dy/du = 8. Tốc độ tổng = tích = 24.
✎ Tự kiểm tra — đáp án
  1. Backprop = quy tắc chuỗi vì? → Mạng là hàm lồng nhau; gradient nhân dồn các đạo hàm cục bộ.
  2. Ghép hai khâu bằng? → Phép nhân (dy/du · du/dx).
Rút ra. Quy tắc chuỗi = nhân đạo hàm dọc theo chuỗi hàm; đó là cách gradient chảy ngược qua mạng. Bài tiếp (A14): mở rộng sang nhiều biến → gradient (vectơ các đạo hàm riêng).
Làm toán AI ✍️ — Bài A13 · Quy tắc chuỗiTrang 2/2 · ĐÁP ÁN