Phiếu in A4 · tính tay Mức: nhập môn · ML cổ điển (B)
Bài B4
k-NN — k láng giềng gần nhất — k-Nearest Neighbors
Họ tên: Ngày: Thời gian: ~12 phút
Vì sao quan trọng. k-NN cho thấy ý tưởng cốt lõi của ML: mẫu giống nhau thì nhãn giống nhau. Không
huấn luyện, chỉ cần khoảng cách — nền tảng của truy hồi (retrieval) và nhiều hệ gợi ý.
d²(x, xᵢ) = Σ (xⱼ − xᵢⱼ)² → chọn k điểm d nhỏ nhất → nhãn = đa số phiếu
💡 Trực giác
Hỏi k người hàng xóm gần nhất rồi theo số đông. k nhỏ → nhạy nhiễu; k lớn → mượt nhưng có thể "nuốt" ranh
giới lớp. So sánh khoảng cách thì dùng d² là đủ (khỏi căn) → số đẹp hơn.