← Mục lục
Làm toán AI ✍️ · Toán × AI
Phiếu in A4 · tính tay
Mức: nhập môn · ML cổ điển (B)
Bài B5

k-means 1 vòng — k-means clustering

Họ tên: Ngày: Thời gian: ~13 phút
Vì sao quan trọng. Nhiều khi ta có dữ liệu nhưng không có nhãn. k-means tự tìm cấu trúc nhóm — nền của phân khúc khách hàng, nén màu ảnh, khởi tạo cho nhiều thuật toán khác.
Gán: cụm(xᵢ) = argminⱼ ‖xᵢ − μⱼ‖   |   Cập nhật: μⱼ = trung bình các điểm thuộc cụm j
💡 Trực giác Hai vòng xen kẽ: (1) mỗi điểm chọn tâm gần nhất làm nhà; (2) mỗi tâm dời về giữa đám con của mình. Lặp tới khi không ai đổi nhà → cụm ổn định.
0

Dữ liệu cho sẵn & tâm khởi tạo

4 điểm, k=2
điểm (x, y)
1
1
2
1
5
4
6
5
P₁(1,1) · P₂(2,1) · P₃(5,4) · P₄(6,5)
Tâm đầu: μ₁ = (1,1)   μ₂ = (6,5)
Vì sao: dùng (bình phương khoảng cách) để so — đỡ phải khai căn, kết quả so sánh vẫn đúng.
1

Gán theo tâm gần nhất

so d²
P₂→μ₁: d² =  |  →μ₂: → cụm
P₃→μ₁: d² =  |  →μ₂: → cụm
Cụm 1 =   Cụm 2 =
Vì sao: mỗi điểm về tâm gần hơn để giảm tổng khoảng cách nội cụm (within-cluster).
2

Dời tâm về trung bình

mean cụm
μ₁ = ((1+2)/2, (1+1)/2) = (, )
μ₂ = ((5+6)/2, (4+5)/2) = (, )
Mẹo: tâm mới = trung bình tọa độ các điểm trong cụm; chỉ tính trên đúng các điểm đã gán.
Làm toán AI ✍️ — Bài B5 · k-means 1 vòngTrang 1/3 · ĐỀ
Làm toán AI ✍️ · Toán × AI
Phiếu in A4 · tính tay
k-means — tiếp theo
Bài B5

k-means 1 vòng — hội tụ & hình

3

Vòng tiếp có đổi cụm?

kiểm hội tụ
Gán lại 4 điểm với tâm mới (μ₁, μ₂ ở Bước 2): có điểm nào đổi cụm không? →
Kết luận:
Vì sao: khi không điểm nào đổi nhà, tâm không dời nữa → thuật toán hội tụ, dừng.
4

Vẽ 4 điểm & đánh dấu tâm

2 cụm
Vì sao: nhìn hình thấy rõ hai cụm tách nhau → tâm dời về giữa mỗi đám.
Tự đánh dấu tâm cũ (× lam = P₁, P₄), tâm mới (★ cam) và tô màu cụm cho 4 điểm.
✎ Tự kiểm tra
  1. k-means có cần nhãn không? →
  2. Khi nào dừng vòng lặp? →
Làm toán AI ✍️ — Bài B5 · k-means 1 vòngTrang 2/3 · ĐỀ
Làm toán AI ✍️ · Toán × AI
ĐÁP ÁN
Bài B5

k-means 1 vòng — lời giải & kiểm tra

1

Gán theo tâm gần nhất

P₂→μ₁: 1  |  →μ₂: 32cụm 1
P₃→μ₁: 25  |  →μ₂: 2cụm 2
Cụm 1 = {P₁, P₂}   Cụm 2 = {P₃, P₄}
2

Tâm mới

μ₁ = (1.5, 1)  |  μ₂ = (5.5, 4.5)
3

Vòng tiếp có đổi cụm?

Gán lại với tâm mới → các điểm giữ nguyên cụm → đã hội tụ, dừng.
Vì sao: khi không điểm nào đổi nhà, tâm không dời nữa → thuật toán dừng.
4

Hình minh họa

2 cụm
× lam = tâm cũ, ★ cam = tâm mới đã dời về giữa cụm. Mỗi đường nối điểm tới tâm cụm của nó.
Vì sao: k-means nhạy với tâm khởi tạo; khởi tạo xấu có thể ra cụm kém → chạy nhiều lần, chọn kết quả tốt nhất.
✎ Tự kiểm tra — đáp án
  1. k-means có cần nhãn không? → Không — đây là học không giám sát.
  2. Khi nào dừng? → Khi không điểm nào đổi cụm (tâm không dời nữa).
Rút ra. k-means = lặp gán-rồi-dời-tâm tới hội tụ; đơn giản nhưng phụ thuộc khởi tạo & số cụm k. Bài tiếp (B6): giảm chiều dữ liệu bằng PCA (dùng trị riêng A11).
Làm toán AI ✍️ — Bài B5 · k-means 1 vòngTrang 3/3 · ĐÁP ÁN