Orthogonality#
Все нормы в этой главе считаются евклидовыми: если \(\boldsymbol x \in \mathbb R^n\), то
Orthogonal vectors and bases#
Два вектора \(\boldsymbol x, \boldsymbol y \in \mathbb R^n\) называются ортогональными, \(\boldsymbol x \perp \boldsymbol y\), если
Если все вектора базиса \(\boldsymbol x_1, \ldots, \boldsymbol x_n\) в \(\mathbb R^n\) попарно ортогональны, то такой базис называется ортогональным. А если впридачу все вектора базиса имеют единичную длину, то этот базис называется ортонормированным (ОНБ). Например, стандартный базис \(\boldsymbol e_1, \ldots, \boldsymbol e_n\), \((\boldsymbol e_i)_j = \delta_{ij}\), является ортонормированным базисом в \(\mathbb R^n\). Это самый распространённый ОНБ, но отнюдь не единственный. Стобцы/строки любой ортогональной матрицы образуют ортонормированный базис. Например, столбцы матрицы поворота на угол \(\theta\)
образуют базис в \(\mathbb R^2\) при любом \(\theta \in [0, 2\pi)\).
Orthogonal subspaces#
Ортогональными могут быть не только векторы и матрицы, но и целые подпространства. Подпространства \(U \subset \mathbb R^n\) и \(V\subset \mathbb R^n\) называются ортогональными, \(U\perp V\), если \(\boldsymbol u \perp \boldsymbol v\) для всех \(\boldsymbol u \in U\), \(\boldsymbol v \in V\).
Например, в трёхмерном пространстве плоскость \(Oxy\) и перепендикулярная ей прямая \(Oz\) являются ортогональными подпространствами. Ортогональны также любые две перендикулярные прямые в \(\mathbb R^n\), проходящие через начало координат. А вот, скажем, плоскости \(Oxy\) и \(Oxz\) не являются ортогональными подпространствами в \(\mathbb R^3\), хотя угол между ними составляет 90°. Обеим этим плоскостям принадлежит, например, вектор \(\boldsymbol x = (1, 0 ,0)\), и \(\boldsymbol x^\top \boldsymbol x = 1 \ne 0\).
Из последнего примера видно, что если пространства \(U\) и \(V\) ортогональны, то \(U \cap V = \{\boldsymbol 0\}\). В противном случае у них есть общий вектор \(\boldsymbol x \ne \boldsymbol 0\), и равенство \(\boldsymbol x^\top \boldsymbol x = \Vert \boldsymbol x\Vert^2 \ne 0\) противоречит условию ортогональности этих подпространств.
Важные примеры ортогональных подпространств дают пространства, связанные с матрицей \(\boldsymbol A \in\mathbb R^{m\times n}\). А именно, оказывается, что
i. e., the nullspace of \(\boldsymbol A\) is orthogonal to its row space, and left nullspace of \(\boldsymbol A\) is orthogonal to its column space.
Докажем первое свойство. Если \(\boldsymbol x \in N(\boldsymbol A)\), то \(\boldsymbol{Ax} = \boldsymbol 0\). Это означает, что вектор \(\boldsymbol x\) ортогонален каждой строке матрицы \(\boldsymbol A\), ведь
Следовательно, \(\boldsymbol x \perp \boldsymbol y\) для всех \(\boldsymbol y \in C(\boldsymbol A^\top) = \mathrm{span}(\boldsymbol a_1, \ldots, \boldsymbol a_m)\), и поэтому \(N(\boldsymbol A) \perp C(\boldsymbol A^\top)\). Второе свойство доказывается аналогично.
Orthogonal complement#
Ортогональное дополнение подпространства \(V \subset \mathbb R^n\) определяется как множество всех векторов \(\boldsymbol x \in \mathbb R^n\), ортогональных любому вектору \(\boldsymbol y \in V\):
Например, множество векторов \(\boldsymbol x \in \mathbb R^n\), ортогональных фиксированному вектору \(\boldsymbol a \in \mathbb R^n\), образует подпространство размерности \(n-1\) (гиперплоскость), ортогональное прямой, заданной вектором \(\boldsymbol a\). Эта гиперплоскость имеет уравнение \(\boldsymbol a^\top \boldsymbol x = 0\); вектор \(\boldsymbol a\) называется также вектором нормали к этой гиперплоскости.
Ортогональное дополнение подпространства \(V \subset \mathbb R^n\) всегда является подпространством в \(\mathbb R^n\). В самом деле, если \(\boldsymbol x, \boldsymbol y \in V^\perp\), то
и поэтому \(\alpha \boldsymbol x + \beta \boldsymbol \in V^\perp\).
Ортогональное дополнение, как следует из названия, дополняет подпростанство до всего пространства. Поэтому для всякого подпространства \(V \subset \mathbb R^n\) справедливы равенства
Любые два ортогональных пространства \(U, V \subset \mathbb R^n\) перескаются по нулю, поэтому \(\dim U + \dim V \leqslant n\). В случае равенства эти подпространства являются ортогональными дополнениями друг друга: \(U^\perp = V\), \(V^\perp = U\). Вообще для любого подпространства \(V \subset \mathbb R^n\) верно равенство \((V^\perp)^\perp = V\).
Ортогональное дополнение является частным случаем прямой суммы. Например, если \(\boldsymbol u\) и \(\boldsymbol v\) — два неколлинеарных вектора на плоскости, то \(\mathrm{span}(\boldsymbol u) \oplus \mathrm{span}(\boldsymbol v) = \mathbb R^2\). Однако ортогональными дополнениями друг друга эти одномерные подпространтва будут только в том случае, если \(\boldsymbol u\perp \boldsymbol v\).
Возвращаясь к ортогональным пространствам матрицы \(\boldsymbol A \in\mathbb R^{m\times n}\), поскольку \(N(\boldsymbol A) \perp C(\boldsymbol A^\top)\) и \(\dim N(\boldsymbol A) + \dim C(\boldsymbol A^\top) = n\), ядро и row space являются ортогональными дополнениями друг друга в \(\mathbb R^n\):
Аналогично пару взаимно ортогональных подпространств в \(\mathbb R^m\) образуют \(N(\boldsymbol A^\top)\) и \(C(\boldsymbol A)\).
Fundamental theorem of linear algebra#
Такое название (преимущественно в англоязычной литературе) носит следующая теорема.
Fundamental Theorem of Linear Algebra. Пусть матрица \(\boldsymbol A\) размера \(m\times n\) имеет ранг \(r\). Тогда
\(\underbrace{\dim N(\boldsymbol A)}_{n-r} + \underbrace{\dim C(\boldsymbol A^\top)}_{r} = n\);
\(\underbrace{\dim N(\boldsymbol A^\top)}_{m-r} + \underbrace{\dim C(\boldsymbol A)}_{r} = m\);
\(N(\boldsymbol A)^\perp = C(\boldsymbol A^\top)\), \(N(\boldsymbol A^\top)^\perp = C(\boldsymbol A)\).
В этой формулировке, в частности, содержится утверждение о том, что столбцовый и строковый ранги матрицы совпадают. Кроме того, каждый вектор \(\boldsymbol x \in \mathbb R^n\) единственным образом представляется в виде суммы \(\boldsymbol x = \boldsymbol y + \boldsymbol z\), \(\boldsymbol y \in C(\boldsymbol A^\top)\), \(\boldsymbol z \in N(\boldsymbol A)\), так что \(\boldsymbol {Ax} = \boldsymbol {Ay}\).
Exercies#
Докажите теорему Пифагора: если \(\boldsymbol x \perp \boldsymbol y\), то \(\Vert \boldsymbol x\Vert^2 + \Vert \boldsymbol y\Vert^2 = \Vert \boldsymbol x + \boldsymbol y\Vert^2\).
Пусть \(U = \mathrm{span}(\boldsymbol x_1, \ldots, \boldsymbol x_k)\), \(V = \mathrm{span}(\boldsymbol y_1, \ldots, \boldsymbol y_\ell)\) и \(\boldsymbol x_i \perp \boldsymbol y_j\) при всех \(i =1, \ldots, k\), \(j = 1,\ldots, \ell\). Докажите, что \(U \perp V\).