Vì sao quan trọng. Để hai ma trận nhân được thì kích thước phải khớp; chuyển vị là cách xoay chiều
một ma trận cho khớp. Trong attention, điểm tương đồng là QKᵀ; khi lan ngược gradient, dòng chảy qua đúng Wᵀ.
Nắm chuyển vị là gỡ được một nửa rối rắm chỉ số.
(Aᵀ)ij = Aji | A là m×n ⇒ Aᵀ là n×m
💡 Trực giác
Đặt một tấm gương trên đường chéo chính (góc trên-trái xuống dưới-phải) rồi soi: ma trận lật qua đường chéo đó.
Số trên đường chéo đứng yên; mọi số khác đổi chỗ với "đối xứng" của nó. Nói gọn: hàng i thành cột i.
0
Cho sẵn ma trận A
2×3
A 2×3
1
2
3
4
5
6
2 hàng, 3 cột → viết là 2×3 (hàng trước, cột sau). Chuyển vị sẽ làm hai số này đảo chỗ.
1
Viết Aᵀ — hàng i của A thành cột i
3×2
Aᵀ 3×2
Chép hàng 1 của A (1, 2, 3) xuống thành cột 1 của Aᵀ; hàng 2 của A xuống thành cột 2.
Vì sao: phần tử ở (hàng i, cột j) chuyển sang (hàng j, cột i) — chỉ là đổi tên trục, không đổi giá trị.
2
Kích thước đảo chỗ
dim
A là 2×3 ⇒ Aᵀ là
×
Mẹo: hai số kích thước chỉ việc đổi chỗ cho nhau (m×n → n×m).
3
Lật hai lần
đối hợp
(Aᵀ)ᵀ =
Vì sao: chuyển vị là phép đối hợp — làm hai lần ra chính nó, vì hàng→cột→hàng quay về vị trí cũ.
4
Dùng thật: QKᵀ trong attention
attention
Q là 2×3, K là 2×3. Muốn ma trận điểm tương đồng cần Q · Kᵀ:
dim(QKᵀ) = (2×3)·(3×2) = ×
Q·K không nhân được (3 ≠ 2 ở giữa). Chuyển K thành Kᵀ (3×2) thì số cột của Q khớp số hàng của Kᵀ → ra ma trận điểm 2×2.
✎ Tự kiểm tra
Ma trận m×n sau chuyển vị có kích thước gì? →
Phần tử nào không đổi chỗ khi chuyển vị? →
Làm toán AI ✍️ — Bài A6 · Ma trận chuyển vịTrang 1/2 · ĐỀ
Làm toán AI ✍️ · Toán × AI
ĐÁP ÁN
Bài A6
Ma trận chuyển vị — lời giải
1
Aᵀ — hàng thành cột
Aᵀ 3×2
1
4
2
5
3
6
Cột 1 của Aᵀ = hàng 1 của A (1, 2, 3); cột 2 = hàng 2 (4, 5, 6).
2
Kích thước
A là 2×3 ⇒ Aᵀ là
3 × 2 (hai số đảo chỗ).
3
Lật hai lần
(Aᵀ)ᵀ = A (trở lại ban đầu)
▦
Sơ đồ: hàng → cột (lật qua đường chéo)
minh họa
dim(QKᵀ) = (2×3)·(3×2) = 2 × 2
Hàng 1 (lam) của A nằm dọc thành cột 1 của Aᵀ; hàng 2 (cam) thành cột 2. Số trên đường chéo (1 & 5) đứng yên.
✎ Tự kiểm tra — đáp án
m×n sau chuyển vị? → n×m (đảo kích thước).
Phần tử nào không đổi chỗ? → Các phần tử trên đường chéo chính (i = j).
Rút ra. Chuyển vị = lật qua đường chéo, đảo kích thước, giữ đường chéo. Nó làm cho các tích như
QKᵀ, AᵀA, Wᵀδ khớp chiều. Bài tiếp (A8): nhân ma trận × vectơ — mỗi hàng một tích vô hướng.
Làm toán AI ✍️ — Bài A6 · Ma trận chuyển vịTrang 2/2 · ĐÁP ÁN