Vì sao quan trọng. Mạng nơ-ron là hàm lồng hàm lồng hàm… Muốn biết loss đổi thế nào theo một trọng số ở lớp sâu,
ta nhân các đạo hàm dọc chuỗi. Quy tắc chuỗi chính là cơ chế backpropagation.
y = f(u), u = g(x) ⇒ dy/dx = (dy/du) · (du/dx)
💡 Trực giác
Chuỗi hàm như dây chuyền bánh răng: bánh x quay làm bánh u quay, bánh u quay làm bánh y quay. Tốc độ y theo x =
tích các tỉ số truyền của từng khâu. Nhiều khâu thì cứ nhân tiếp.
0
Cho sẵn hàm lồng
y(u(x))
y = u² , u = 3x + 1 ; xét tại x = 1
Lớp ngoài: bình phương. Lớp trong: hàm tuyến tính. Cần dy/dx tại điểm đã cho.
y' = 2(3x + 1)·3; tại x = 1:
= 2·4·3 = 24 ✓ (khớp)
▦
Sơ đồ: dây chuyền bánh răng x → u → y
tích tỉ số
Mỗi mũi tên là một "tỉ số truyền": x→u là du/dx = 3, u→y là dy/du = 8.
Tốc độ tổng = tích = 24.
✎ Tự kiểm tra — đáp án
Backprop = quy tắc chuỗi vì? → Mạng là hàm lồng nhau; gradient nhân dồn các đạo hàm cục bộ.
Ghép hai khâu bằng? → Phép nhân (dy/du · du/dx).
Rút ra. Quy tắc chuỗi = nhân đạo hàm dọc theo chuỗi hàm; đó là cách gradient chảy ngược qua mạng. Bài tiếp (A14):
mở rộng sang nhiều biến → gradient (vectơ các đạo hàm riêng).
Làm toán AI ✍️ — Bài A13 · Quy tắc chuỗiTrang 2/2 · ĐÁP ÁN