Phiếu in A4 · tính tay Mức: nhập môn · ML cổ điển (B)
Bài B1
Hồi quy tuyến tính 1 biến — Linear Regression
Họ tên: Ngày: Thời gian: ~13 phút
Vì sao quan trọng. "Học" trong ML = chọn tham số để dự đoán khớp dữ liệu. Hồi quy tuyến tính cho thấy
trọn vòng: có dữ liệu → chọn w, b → đo sai số. Đây cũng là khung của một nơ-ron sau này.
ŷ = w·x + b | w = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)² | b = ȳ − w·x̄
💡 Trực giác
Đặt một cây thước lên đám điểm sao cho tổng "khoảng hụt" nhỏ nhất. Độ dốc w cho biết x tăng 1 thì y tăng mấy;
b là điểm cắt trục y. Công thức trên chính là vị trí thước tối ưu (bình phương nhỏ nhất).
0
Dữ liệu cho sẵn & trung bình
3 điểm
(xᵢ, yᵢ)
1
1
2
3
3
5
x̄ = (1+2+3)/3 =
ȳ = (1+3+5)/3 =
Vì sao: hồi quy "xoay quanh" điểm trung bình (x̄, ȳ) — mọi công thức đo lệch khỏi điểm này.
Vì sao: tử số đo "x và y cùng lệch trung bình thế nào" (hiệp phương sai); chia cho độ trải của x → độ dốc.
2
Chặn b & dự đoán
đường khớp
b = ȳ − w·x̄ =
→ đường: ŷ = ·x +
Dự đoán x = 4: ŷ =
Mẹo: thử lại 3 điểm vào đường — nếu khớp cả ba thì MSE = 0 (dữ liệu thẳng hàng).
3
Đồ thị đường khớp
điểm + đường
Mỗi chấm cam là một điểm dữ liệu; đường lam là ŷ = w·x + b.
Khoảng cách dọc từ điểm tới đường là phần dư (residual); least squares tối thiểu tổng bình phương phần dư (MSE, Bài D1).
Vì sao: ở đây dữ liệu thẳng hàng nên đường đi qua đúng cả 3 điểm → phần dư = 0. Dữ liệu thật thường có dư ≠ 0.
✎ Tự kiểm tra
w cho biết điều gì về quan hệ x–y? →
Vì sao bình phương sai số (không phải trị tuyệt đối)? →
Làm toán AI ✍️ — Bài B1 · Hồi quy tuyến tính 1 biếnTrang 1/2 · ĐỀ
w cho biết → độ dốc: x tăng 1 đơn vị thì ŷ đổi w đơn vị
Bình phương sai số vì → phạt mạnh sai lớn & có công thức đóng (đạo hàm gọn)
Rút ra. Hồi quy tuyến tính = chọn w, b tối thiểu sai số bình phương; đây là "nguyên tử" của học có giám sát.
Bài tiếp (B2): nhiều đặc trưng → ŷ = w·x + b với x là vectơ.
Làm toán AI ✍️ — Bài B1 · Hồi quy tuyến tính 1 biếnTrang 2/2 · ĐÁP ÁN