Rzut (algebra liniowa)

Rzut lub projekcja^[a] – uogólnienie pojęcia rzutu znanego z geometrii elementarnej: idempotentny endomorfizm liniowy określony na danej przestrzeni liniowej, czyli operator liniowy zachowujący swój obraz, tzn. dla którego każdy element obrazu jest punktem stałym tego przekształcenia.

Rzuty/projekcje ortogonalne są uogólnieniem pojęcia rzutu prostokątnego z geometrii euklidesowej (zob. osobna sekcja); w przestrzeniach unitarnych (tzn. z iloczynem skalarnym, np. przestrzeniach euklidesowych) są to nie mniej, nie więcej operatory samosprzężone.

Rzut ukośny

Rzut $\mathrm {T}$ wzdłuż prostej $k$ na prostą $m.$

Niech dana będzie przestrzeń liniowa $V$ (nad ustalonym ciałem). Przekształcenie liniowe $\mathrm {P} \colon V\to V$ tej przestrzeni w siebie spełniające warunek idempotentności

\mathrm {P} ^{2}=\mathrm {P} ,

czyli $\mathrm {P} {\big (}\mathrm {P} (\mathbf {v} ){\big )}=\mathrm {P} (\mathbf {v} )$ dla każdego $\mathbf {v} \in V$ nazywa się rzutem (ukośnym) lub projekcją.

Odwzorowanie $\mathrm {P}$ można scharakteryzować w następujący sposób: dowolny wektor $\mathbf {v} \in V$ można przedstawić w jednoznaczny sposób w postaci sumy $\mathbf {v} =\mathbf {w} +\mathbf {u} ,$ gdzie $\mathbf {w} \in \ker \mathrm {P}$ oraz $\mathbf {u} \in \mathrm {im\;P}$ ^[b]. Oznacza to, że $V=\ker \mathrm {P} \oplus \mathrm {im\;P} ,$ czyli $V$ jest sumą prostą jądra i obrazu $\mathrm {P} .$ Jeżeli $V$ jest skończeniewymiarowa, zaś $U$ jest jej podprzestrzenią liniową, to na mocy twierdzenia o rzędzie istnieje rzut $\mathrm {P} ,$ dla którego $\mathrm {im\;P} =U$ (jeśli $0<\dim U<\dim V,$ to rzutów określonych na $V$ o obrazie $U$ jest nieskończenie wiele).

Dla danych podprzestrzeni $W,U$ przestrzeni $V$ spełniających $V=W\oplus U$ przekształcenie $\mathrm {P} \colon V\to V$ nazywa się rzutem na $U$ wzdłuż $W,$ jeśli dla każdego $\mathbf {v} \in V$ zachodzi

\mathrm {P} (\mathbf {v} )\in U

oraz

\mathbf {v} -\mathrm {P} (\mathbf {v} )\in W.

Jedynymi wartościami własnymi rzutu są zero i jedynka, tzn. widmo rzutu $\mathrm {P}$ jest równe $\sigma (\mathrm {P} )=\{0,1\}$ ^[c]; ponadto rzut jest diagonalizowalny i w szczególności (w ciele charakterystyki zerowej) jego ślad jest równy wymiarowi obrazu^[d]. Z drugiej strony, jeśli przekształcenie $\mathrm {A}$ ma widmo $\sigma (\mathrm {A} )=\{0,1\}$ i jest diagonalizowalne, to $\mathrm {A}$ jest rzutem^[e].

Jeśli $\mathrm {P}$ jest rzutem na $U$ wzdłuż $W,$ to przekształcenie $\mathrm {Q} =\mathrm {I} -\mathrm {P} \colon V\to V$ dane wzorem $\mathrm {Q} (\mathbf {v} )=\mathbf {v} -\mathrm {P} (\mathbf {v} )$ jest rzutem na $W$ wzdłuż $U$ ^[f]. Tym samym rozkładowi $V=U\oplus W$ odpowiada para rzutów $\mathrm {P} ,\mathrm {Q} .$

Rzut ortogonalny

Jeżeli $\mathrm {P}$ jest rzutem (ukośnym) na $U$ wzdłuż $W$ oraz $V=W\perp U$ jest ortogonalną sumą prostą, to $\mathrm {P}$ nazywa się rzutem ortogonalnym (na $U$ wzdłuż $W$ ). Wówczas $W=U^{\perp }$ jest dopełnieniem ortogonalnym $U,$ czyli zachodzi $V=U^{\perp }\oplus U,$ a więc $V=(\mathrm {im\;P} )^{\perp }\oplus \mathrm {im\;P} ,$ gdyż wtedy $\ker P=(\mathrm {im\;P} )^{\perp },$ gdzie $\mathrm {im\;P}$ oraz $\ker \mathrm {P}$ oznaczają odpowiednio obraz i jądro rzutu $\mathrm {P} .$

Konstrukcja ortogonalnej sumy prostej wymaga istnienia (niezdegenerowanej) symetrycznej formy dwuliniowej określonej na przestrzeni (tzw. przestrzeń ortogonalna): zwykle rozważa się przestrzenie z iloczynem skalarnym (tzw. przestrzenie unitarne); w przypadku przestrzeni nieskończonego wymiaru zakłada się dodatkowo zupełność, co sprawia, że przestrzeń unitarna $V$ staje się przestrzenią Hilberta – istnienie zapewnia wtedy twierdzenie o rzucie ortogonalnym. W tym kontekście rzut ukośny nazywa się operatorem idempotentnym, a rzut ortogonalny znany jest jako operator rzutowy.

Rzut jest ortogonalny wtedy i tylko wtedy, gdy jest i) samosprzężony^[g] lub ii) normalny lub iii) dodatni (dodatnio określony) lub iv) izometryczny. Rzuty ortogonalne są operatorami ograniczonymi (czyli ciągłymi), a gdy są nietrywialne: o jednostkowej normie operatorowej^[h]; z drugiej strony ograniczony (równoważnie: ciągły) operator liniowy $\mathrm {A}$ na przestrzeni Hilberta jest rzutem ortogonalnym wtedy i tylko wtedy, gdy $\mathrm {A} ^{*}\mathrm {A} =\mathrm {A} .$

Gdy rozważana przestrzeń jest zespolona, gwiazdkę przy oznaczeniu macierzy należy interpretować jako sprzężenie hermitowskie, w pozostałych przypadkach – jako transpozycję; w przypadku przekształceń gwiazdka oznacza (antyliniowe) przekształcenie sprzężone do danego.

Jeśli $\mathbf {u} _{1},\dots ,\mathbf {u} _{k}$ jest bazą ortonormalną podprzestrzeni $U$ zaś $\mathbf {A}$ oznacza macierz typu $n\times k,$ której kolumnami są $\mathbf {u} _{1},\dots ,\mathbf {u} _{k},$ to macierz rzutu ortogonalnego dana jest wzorem

\mathbf {P} _{\mathbf {A} }=\mathbf {AA} ^{*}

i reprezentuje ona przekształcenie, które można zapisać jako^[i]

\mathrm {P} _{\mathrm {A} }(\cdot )=\sum _{i=1}^{k}\mathbf {u} _{i}\langle \mathbf {u} _{i},\cdot \rangle .

W szczególności rzut na prostą (przestrzeń jednowymiarową) rozpinaną przez wektor jednostkowy $\mathbf {u}$ dany jest wzorem $\mathrm {P} _{\mathbf {u} }(\cdot )=\mathbf {u} \langle \mathbf {u} ,\cdot \rangle ,$ a jego macierz ma postać $\mathbf {P} _{\mathbf {u} }=\mathbf {uu} ^{*}$ ^[j].

Macierz $\mathbf {A} ^{*}$ reprezentuje izometrię częściową $\mathrm {A} ^{*},$ która znika na dopełnieniu ortogonalnym podprzestrzeni $U,$ zaś $\mathrm {A}$ jest izometrią, która zanurza $U$ w przestrzeń $V.$

Warunek ortonormalności można opuścić; jeżeli $\mathbf {u} _{1},\dots ,\mathbf {u} _{k}$ jest bazą (niekoniecznie ortonormalną), a macierz $\mathbf {A}$ zawiera te wektory jako kolumny, to rzut ma postać^[k]

\mathbf {P} _{\mathbf {A} }=\mathbf {A} (\mathbf {A} ^{*}\mathbf {A} )^{-1}\mathbf {A} ^{*}.

Reprezentowane przez tę macierz przekształcenie nadal zanurza $U$ w przestrzeń $V,$ jednak nie musi być już izometrią.

Przykłady

Przekształcenie tożsamościowe jest rzutem ortogonalnym reprezentowanym przez macierz jednostkową, np. $\left[{\begin{smallmatrix}1&0\\0&1\end{smallmatrix}}\right]$ (operator jednostkowy jest operatorem rzutowym).

Przekształcenie liniowe, którego macierz ma postać $\left[{\begin{smallmatrix}1&0\\0&0\end{smallmatrix}}\right],$ jest rzutem ortogonalnym, podczas gdy zadane macierzą $\left[{\begin{smallmatrix}0&1\\0&1\end{smallmatrix}}\right]$ jest rzutem (ukośnym), ale nie ortogonalnym (pierwsza macierz opisuje operator rzutowy, druga – tylko idempotentny).

Przestrzeń $\mathrm {L} ^{2}(\mathbb {R} )$ funkcji rzeczywistych całkowalnych z kwadratem (w sensie Lebesgue’a) jest ortogonalną sumą prostą przestrzeni $M,N$ funkcji parzystych i nieparzystych; rzuty $\mathrm {P} _{M},\mathrm {P} _{N}$ odpowiednio na $M,N$ dane są wzorami^[l]
$\mathrm {P} _{M}f(x)={\tfrac {f(x)+f(-x)}{2}}\qquad {\text{ oraz }}\qquad \mathrm {P} _{N}f(x)={\tfrac {f(x)-f(-x)}{2}},$

przy czym

\mathrm {I} -\mathrm {P} _{M}=\mathrm {P} _{N}.

Niech $A$ będzie zbiorem mierzalnym $\mathbb {R} ,$ np. przedziałem, z funkcją charakterystyczną $\chi _{A}.$ Wówczas^[l] $\mathrm {P} _{A}f(x)=\chi _{A}(x)f(x)$ jest rzutem ortogonalnym $\mathrm {L} ^{2}(\mathbb {R} )$ na podprzestrzeń funkcji o nośniku zawartym w domknięciu ${\overline {A}}.$

Zamiast wspomnianej wcześniej przestrzeni Hilberta $\mathbb {R} ^{n}$ z operatorem $\mathrm {P} _{\mathbf {u} }(\mathbf {x} )=\mathbf {uu} ^{*}\mathbf {x}$ można rozważać inne: w przypadku przestrzeni ciągów $\ell ^{2}(\mathbb {Z} ),$ gdy $\mathbf {u} =\mathbf {e} _{n},$ gdzie $\mathbf {e} _{n}=\left(\delta _{k,n}\right)_{k=-\infty }^{+\infty }$ ^[m], oraz $\mathbf {x} =(x_{k}),$ to rzut przyjmuje postać $\mathrm {P} _{\mathbf {e} _{n}}(\mathbf {x} )=x_{n}\mathbf {e} _{n}.$

Jeśli z kolei dana jest przestrzeń $\mathrm {L} ^{2}(\mathbb {T} )$ jest przestrzenią funkcji o okresie $2\pi$ ^[n], a $u=1/{\sqrt {2\pi }}$ jest funkcją stałą o jednostkowej normie, to rzut ortogonalny $\mathrm {P} _{u}$ przekształca funkcję $f$ w jej średnią $\langle f\rangle ,$ gdzie
$\langle f\rangle ={\frac {1}{2\pi }}\int _{0}^{2\pi }\!\!f(x)\ \mathrm {d} x.$

Odpowiadający temu rzutowi rozkład ortogonalny,

f(x)=\langle f\rangle +f'(x),

rozbija funkcję na stałą część średnią

\langle f\rangle

i zmienną część

f'

o zerowej średniej.

Stosowany w matematycznym opisie mechaniki kwantowej operator liczby cząstek dla fermionów jest operatorem rzutowym.

Uwagi

↑ Etymologia w artykule projekcja.
↑ Wystarczy przyjąć $\mathbf {u} =\mathrm {P} (\mathbf {v} )$ oraz $\mathbf {w} =\mathbf {v} -\mathbf {u} ,$ wtedy
${\begin{aligned}\mathrm {P} (\mathbf {w} )&=\mathrm {P} {\big (}\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big )}=\mathrm {P} (\mathbf {v} )-\mathrm {P} ^{2}(\mathbf {v} )\\&=\mathrm {P} (\mathbf {v} )-\mathrm {P} (\mathbf {v} )=\mathbf {0} .\end{aligned}}$
Jedyność tego przedstawienia wynika z obserwacji działania $\mathrm {P}$ na $\mathbf {v} ,$ mianowicie $\mathrm {P} (\mathbf {v} )=\mathrm {P} (\mathbf {w} +\mathbf {u} )=\mathrm {P} (\mathbf {w} )+\mathrm {P} (\mathbf {u} )=\mathbf {0} +\mathbf {u} =\mathbf {u} .$
↑ Niech $\mathbf {v}$ będzie wektorem własnym stowarzyszonym z wartością własną $\lambda$ rzutu $\mathrm {P} .$ Wówczas
$\lambda \mathbf {u} =\mathrm {P} (\mathbf {u} )=\mathrm {P} {\big (}\mathrm {P} (\mathbf {u} ){\big )}=\mathrm {P} (\lambda \mathbf {u} )=\lambda ^{2}\mathbf {u} ,$
a ponieważ $\mathbf {u} \neq \mathbf {0} ,$ to $\lambda =\lambda ^{2},$ czyli $\lambda (\lambda -1)=0,$ skąd $\lambda =0$ lub $\lambda =1.$
↑ Niech $\mathbf {u} _{1},\dots ,\mathbf {u} _{k}$ będą bazą $U.$ Wówczas zakładając, że $\mathbf {u} _{i}=\mathrm {P} (\mathbf {v} _{i}),$ otrzymuje się $\mathrm {P} (\mathbf {u} _{i})=\mathrm {P} ^{2}(\mathbf {v} _{i})=\mathrm {P} (\mathbf {v} _{i})=\mathbf {u} _{i}$ $(i=1,\dots ,k),$ zatem dowolny niezerowy wektor w obrazie $P$ jest wektorem własnym z wartością własną $\lambda =1.$ W ten sposób wymiar przestrzeni własnej $\mathrm {P}$ dla wartości własnej $\lambda =1$ jest niemniejszy niż rząd $\mathrm {P} .$ Z twierdzenia o rzędzie wynika jednak, że $\dim \mathrm {im\;P} +\dim \ker \mathrm {P} =\dim V_{1}(\mathrm {P} )+\dim V_{0}(\mathrm {P} )=\dim V$ (gdyż $\ker \mathrm {P} =\dim V_{0}(\mathrm {P} )$ ) dlatego suma wymiarów dwóch podprzestrzeni jest równa wymiarowi całej przestrzeni $V.$ Bazy obrazu i jądra tworzą razem bazę wektorów własnych $V,$ tzn. $V=\mathrm {im\;P} \oplus \ker \mathrm {P} ,$ stąd $\mathrm {P}$ jest diagonalizowalny i wymiar przestrzeni własnej $\mathrm {P}$ dla wartości własnej $\lambda =1$ jest równy rzędowi $\mathrm {P} .$ Ponieważ ślad jest sumą wartości własnych (w ciele charakterystyki 0), to $\mathrm {rank\;P} =\dim \mathrm {im\;P} =\dim V_{1}(\mathrm {P} )=\mathrm {tr\;P} .$
↑ Jeśli $\mathrm {A} =\mathrm {BDB} ^{-1},$ gdzie $\mathrm {D}$ jest jednokładnością (tj. przekształceniem, którego macierz jest macierzą diagonalną) wyłącznie z wartościami własnymi równymi zeru lub jedynce (na przekątnej głównej), to
$\mathrm {A} ^{2}=\mathrm {BDB} ^{-1}\mathrm {BDB} ^{-1}=\mathrm {B} \mathrm {D} ^{2}\mathrm {B} ^{-1}=\mathrm {B} \mathrm {D} \mathrm {B} ^{-1}=\mathrm {A} ,$
gdyż $\mathrm {D} ^{2}=\mathrm {D} ,$ zatem $\mathrm {A} ^{2}=\mathrm {A} ,$ a więc $\mathrm {A}$ jest idempotentne, czyli jest rzutem.
↑ Z bezpośredniego rachunku wynika, że
${\begin{aligned}\mathrm {Q} ^{2}&=(\mathrm {I} -\mathrm {P} )^{2}=(\mathrm {I} -\mathrm {P} )(\mathrm {I} -\mathrm {P} )\\&=\mathrm {I} ^{2}-\mathrm {PI} -\mathrm {IP} +\mathrm {P} ^{2}\\&=\mathrm {I} -2\mathrm {P} +\mathrm {P} =\mathrm {I} -\mathrm {P} =\mathrm {Q} \end{aligned}},$
czyli $\mathrm {Q} ^{2}=\mathrm {Q} .$
↑ Wychodząc od samosprzężoności i idempotentności $\mathrm {P}$ oraz dowolnych wektorów $\mathbf {u} ,\mathbf {v} \in V$ otrzymuje się $\mathrm {P} (\mathbf {u} )\in U,$ $\mathbf {v} -\mathrm {P} (\mathbf {v} )\in W$ oraz
${\begin{aligned}&{\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} ^{2}(\mathbf {u} ),\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} (\mathbf {u} ),\mathrm {P} (\mathrm {I} -\mathrm {P} )(\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {u} ),(\mathrm {P} -\mathrm {P} ^{2})(\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {0} {\big \rangle }=0\end{aligned}},$
gdzie $\langle \cdot ,\cdot \rangle$ oznacza iloczyn skalarny przestrzeni $V,$ a $\mathrm {I}$ to operator tożsamościowy. Stąd $\mathrm {P} (\mathbf {v} )$ oraz $\mathbf {v} -\mathrm {P} (\mathbf {v} )$ są ortogonalne. W drugą stronę, z ortogonalności rzutu $\mathrm {P}$ wynika jego samosprzężoność, gdyż
${\big \langle }\mathbf {u} ,\mathrm {P} (\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {v} {\big \rangle }={\big \langle }\mathbf {u} ,\mathrm {P} ^{*}(\mathbf {v} ){\big \rangle }$
dla dowolnych $\mathbf {u} ,\mathbf {v} \in V;$ zatem istotnie $\mathrm {P} =\mathrm {P} ^{*}.$
↑ Dla dowolnego wektora $\mathbf {v} \in V$ z nierówności Cauchy’ego–Schwarza jest
${\big \|}\mathrm {P} (\mathbf {v} ){\big \|}^{2}={\big \langle }\mathrm {P} (\mathbf {v} ),\mathrm {P} (\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {v} ),\mathbf {v} {\big \rangle }\leqslant {\big \|}\mathrm {P} (\mathbf {v} ){\big \|}\ \|\mathbf {v} \|,$
czyli ${\big \|}\mathrm {P} (\mathbf {v} ){\big \|}\leqslant \|\mathbf {v} \|,$ co oznacza, że $\mathrm {P}$ jest ograniczony, przy czym norma operatorowa $\|\mathrm {P} \|\leqslant 1.$ Jeśli $\mathrm {P} \neq \mathrm {\theta } ,$ to istnieje $\mathbf {v} ,$ dla którego $\mathrm {P} (\mathbf {v} )\neq \mathbf {0}$ oraz ${\big \|}\mathrm {P} ^{2}(\mathbf {v} ){\big \|}={\big \|}\mathrm {P} (\mathbf {v} ){\big \|},$ a więc $\|\mathrm {P} \|\geqslant 1.$ Dlatego ostatecznie $\|\mathrm {P} \|=1.$
↑ W notacji Diraca jest $\mathrm {P} _{\mathrm {A} }=\sum _{i=1}^{k}|\mathbf {u} _{i}\rangle \langle \mathbf {u} _{i}|.$
↑ Wtedy $\mathbf {P} _{\mathbf {u} }(\mathbf {x} )=\mathbf {uu} ^{*}\mathbf {x} .$ W stosowanej głównie w fizyce notacji Diraca jest $\mathrm {P} _{\mathbf {u} }=|\mathbf {u} \rangle \langle \mathbf {u} |;$ wówczas $\mathrm {P} _{\mathbf {u} }(\mathbf {x} )=|\mathbf {u} \rangle \ \langle \mathbf {u} |\mathbf {x} \rangle .$ W matematyce zwykle zapisuje się $\mathrm {P} _{\mathbf {u} }=\mathbf {u} \otimes \mathbf {u}$ za pomocą iloczynu tensorowego (a dokładnie: iloczynu diadycznego).
↑ Macierz $(\mathbf {A} ^{*}\mathbf {A} )^{-1}$ jest „czynnikiem normującym”, który odzyskuje normę: operator pierwszego rzędu $\mathbf {uu} ^{*}$ jest rzutem, tylko gdy $\|\mathbf {u} \|=1;$ dzieląc przez $\mathbf {u} ^{*}\mathbf {u} =\|\mathbf {u} \|^{2}$ otrzymuje się rzut $\mathbf {u} (\mathbf {u} ^{*}\mathbf {u} )^{-1}\mathbf {u} ^{*}=\mathbf {uu} ^{*}/\|\mathbf {u} \|^{2}$ na podprzestrzeń $\mathrm {span\;} \mathbf {u} .$
↑ ^a ^b Oznaczenia $\mathrm {P} _{X}f(x)$ należy rozumieć jako ${\big (}\mathrm {P} _{X}(f){\big )}(x),$ gdzie $\mathrm {P} _{X}(f)$ jest operatorem, którego argumenty i wartości są funkcjami z przestrzeni $\mathrm {L} ^{2}(\mathbb {R} ),$ tzn. $\mathrm {P} _{X}\colon \mathrm {L} ^{2}(\mathbb {R} )\to \mathrm {L} ^{2}(\mathbb {R} )$ dla pewnej podprzestrzeni $X$ przestrzeni $\mathrm {L} ^{2}(\mathbb {R} ).$
↑ Zob. delta Kroneckera $\delta _{k,n}.$
↑ Por. grupa okręgu $\mathbb {T} .$

Bibliografia

F.W. Gehring, P.R. Halmos, C.C Moore: A Course in Functional Analysis. Nowy Jork: Springer-Verlag, 1985.

Linki zewnętrzne

Paweł Lubowiecki, nagrania na YouTube, Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego, kanał „Uczelnia WAT”, 30 stycznia 2024 [dostęp 2024-09-09]:

[1] Etymologia w artykule projekcja.

[2] Wystarczy przyjąć $\mathbf {u} =\mathrm {P} (\mathbf {v} )$ oraz $\mathbf {w} =\mathbf {v} -\mathbf {u} ,$ wtedy
${\begin{aligned}\mathrm {P} (\mathbf {w} )&=\mathrm {P} {\big (}\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big )}=\mathrm {P} (\mathbf {v} )-\mathrm {P} ^{2}(\mathbf {v} )\\&=\mathrm {P} (\mathbf {v} )-\mathrm {P} (\mathbf {v} )=\mathbf {0} .\end{aligned}}$
Jedyność tego przedstawienia wynika z obserwacji działania $\mathrm {P}$ na $\mathbf {v} ,$ mianowicie $\mathrm {P} (\mathbf {v} )=\mathrm {P} (\mathbf {w} +\mathbf {u} )=\mathrm {P} (\mathbf {w} )+\mathrm {P} (\mathbf {u} )=\mathbf {0} +\mathbf {u} =\mathbf {u} .$

[3] Niech $\mathbf {v}$ będzie wektorem własnym stowarzyszonym z wartością własną $\lambda$ rzutu $\mathrm {P} .$ Wówczas
$\lambda \mathbf {u} =\mathrm {P} (\mathbf {u} )=\mathrm {P} {\big (}\mathrm {P} (\mathbf {u} ){\big )}=\mathrm {P} (\lambda \mathbf {u} )=\lambda ^{2}\mathbf {u} ,$
a ponieważ $\mathbf {u} \neq \mathbf {0} ,$ to $\lambda =\lambda ^{2},$ czyli $\lambda (\lambda -1)=0,$ skąd $\lambda =0$ lub $\lambda =1.$

[4] Niech $\mathbf {u} _{1},\dots ,\mathbf {u} _{k}$ będą bazą $U.$ Wówczas zakładając, że $\mathbf {u} _{i}=\mathrm {P} (\mathbf {v} _{i}),$ otrzymuje się $\mathrm {P} (\mathbf {u} _{i})=\mathrm {P} ^{2}(\mathbf {v} _{i})=\mathrm {P} (\mathbf {v} _{i})=\mathbf {u} _{i}$ $(i=1,\dots ,k),$ zatem dowolny niezerowy wektor w obrazie $P$ jest wektorem własnym z wartością własną $\lambda =1.$ W ten sposób wymiar przestrzeni własnej $\mathrm {P}$ dla wartości własnej $\lambda =1$ jest niemniejszy niż rząd $\mathrm {P} .$ Z twierdzenia o rzędzie wynika jednak, że $\dim \mathrm {im\;P} +\dim \ker \mathrm {P} =\dim V_{1}(\mathrm {P} )+\dim V_{0}(\mathrm {P} )=\dim V$ (gdyż $\ker \mathrm {P} =\dim V_{0}(\mathrm {P} )$ ) dlatego suma wymiarów dwóch podprzestrzeni jest równa wymiarowi całej przestrzeni $V.$ Bazy obrazu i jądra tworzą razem bazę wektorów własnych $V,$ tzn. $V=\mathrm {im\;P} \oplus \ker \mathrm {P} ,$ stąd $\mathrm {P}$ jest diagonalizowalny i wymiar przestrzeni własnej $\mathrm {P}$ dla wartości własnej $\lambda =1$ jest równy rzędowi $\mathrm {P} .$ Ponieważ ślad jest sumą wartości własnych (w ciele charakterystyki 0), to $\mathrm {rank\;P} =\dim \mathrm {im\;P} =\dim V_{1}(\mathrm {P} )=\mathrm {tr\;P} .$

[5] Jeśli $\mathrm {A} =\mathrm {BDB} ^{-1},$ gdzie $\mathrm {D}$ jest jednokładnością (tj. przekształceniem, którego macierz jest macierzą diagonalną) wyłącznie z wartościami własnymi równymi zeru lub jedynce (na przekątnej głównej), to
$\mathrm {A} ^{2}=\mathrm {BDB} ^{-1}\mathrm {BDB} ^{-1}=\mathrm {B} \mathrm {D} ^{2}\mathrm {B} ^{-1}=\mathrm {B} \mathrm {D} \mathrm {B} ^{-1}=\mathrm {A} ,$
gdyż $\mathrm {D} ^{2}=\mathrm {D} ,$ zatem $\mathrm {A} ^{2}=\mathrm {A} ,$ a więc $\mathrm {A}$ jest idempotentne, czyli jest rzutem.

[6] Z bezpośredniego rachunku wynika, że
${\begin{aligned}\mathrm {Q} ^{2}&=(\mathrm {I} -\mathrm {P} )^{2}=(\mathrm {I} -\mathrm {P} )(\mathrm {I} -\mathrm {P} )\\&=\mathrm {I} ^{2}-\mathrm {PI} -\mathrm {IP} +\mathrm {P} ^{2}\\&=\mathrm {I} -2\mathrm {P} +\mathrm {P} =\mathrm {I} -\mathrm {P} =\mathrm {Q} \end{aligned}},$
czyli $\mathrm {Q} ^{2}=\mathrm {Q} .$

[7] Wychodząc od samosprzężoności i idempotentności $\mathrm {P}$ oraz dowolnych wektorów $\mathbf {u} ,\mathbf {v} \in V$ otrzymuje się $\mathrm {P} (\mathbf {u} )\in U,$ $\mathbf {v} -\mathrm {P} (\mathbf {v} )\in W$ oraz
${\begin{aligned}&{\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} ^{2}(\mathbf {u} ),\mathbf {v} -\mathrm {P} (\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} (\mathbf {u} ),\mathrm {P} (\mathrm {I} -\mathrm {P} )(\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {u} ),(\mathrm {P} -\mathrm {P} ^{2})(\mathbf {v} ){\big \rangle }\\&={\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {0} {\big \rangle }=0\end{aligned}},$
gdzie $\langle \cdot ,\cdot \rangle$ oznacza iloczyn skalarny przestrzeni $V,$ a $\mathrm {I}$ to operator tożsamościowy. Stąd $\mathrm {P} (\mathbf {v} )$ oraz $\mathbf {v} -\mathrm {P} (\mathbf {v} )$ są ortogonalne. W drugą stronę, z ortogonalności rzutu $\mathrm {P}$ wynika jego samosprzężoność, gdyż
${\big \langle }\mathbf {u} ,\mathrm {P} (\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {u} ),\mathbf {v} {\big \rangle }={\big \langle }\mathbf {u} ,\mathrm {P} ^{*}(\mathbf {v} ){\big \rangle }$
dla dowolnych $\mathbf {u} ,\mathbf {v} \in V;$ zatem istotnie $\mathrm {P} =\mathrm {P} ^{*}.$

[8] Dla dowolnego wektora $\mathbf {v} \in V$ z nierówności Cauchy’ego–Schwarza jest
${\big \|}\mathrm {P} (\mathbf {v} ){\big \|}^{2}={\big \langle }\mathrm {P} (\mathbf {v} ),\mathrm {P} (\mathbf {v} ){\big \rangle }={\big \langle }\mathrm {P} (\mathbf {v} ),\mathbf {v} {\big \rangle }\leqslant {\big \|}\mathrm {P} (\mathbf {v} ){\big \|}\ \|\mathbf {v} \|,$
czyli ${\big \|}\mathrm {P} (\mathbf {v} ){\big \|}\leqslant \|\mathbf {v} \|,$ co oznacza, że $\mathrm {P}$ jest ograniczony, przy czym norma operatorowa $\|\mathrm {P} \|\leqslant 1.$ Jeśli $\mathrm {P} \neq \mathrm {\theta } ,$ to istnieje $\mathbf {v} ,$ dla którego $\mathrm {P} (\mathbf {v} )\neq \mathbf {0}$ oraz ${\big \|}\mathrm {P} ^{2}(\mathbf {v} ){\big \|}={\big \|}\mathrm {P} (\mathbf {v} ){\big \|},$ a więc $\|\mathrm {P} \|\geqslant 1.$ Dlatego ostatecznie $\|\mathrm {P} \|=1.$

[9] W notacji Diraca jest $\mathrm {P} _{\mathrm {A} }=\sum _{i=1}^{k}|\mathbf {u} _{i}\rangle \langle \mathbf {u} _{i}|.$

[10] Wtedy $\mathbf {P} _{\mathbf {u} }(\mathbf {x} )=\mathbf {uu} ^{*}\mathbf {x} .$ W stosowanej głównie w fizyce notacji Diraca jest $\mathrm {P} _{\mathbf {u} }=|\mathbf {u} \rangle \langle \mathbf {u} |;$ wówczas $\mathrm {P} _{\mathbf {u} }(\mathbf {x} )=|\mathbf {u} \rangle \ \langle \mathbf {u} |\mathbf {x} \rangle .$ W matematyce zwykle zapisuje się $\mathrm {P} _{\mathbf {u} }=\mathbf {u} \otimes \mathbf {u}$ za pomocą iloczynu tensorowego (a dokładnie: iloczynu diadycznego).

[11] Macierz $(\mathbf {A} ^{*}\mathbf {A} )^{-1}$ jest „czynnikiem normującym”, który odzyskuje normę: operator pierwszego rzędu $\mathbf {uu} ^{*}$ jest rzutem, tylko gdy $\|\mathbf {u} \|=1;$ dzieląc przez $\mathbf {u} ^{*}\mathbf {u} =\|\mathbf {u} \|^{2}$ otrzymuje się rzut $\mathbf {u} (\mathbf {u} ^{*}\mathbf {u} )^{-1}\mathbf {u} ^{*}=\mathbf {uu} ^{*}/\|\mathbf {u} \|^{2}$ na podprzestrzeń $\mathrm {span\;} \mathbf {u} .$

[funarg-12] Oznaczenia $\mathrm {P} _{X}f(x)$ należy rozumieć jako ${\big (}\mathrm {P} _{X}(f){\big )}(x),$ gdzie $\mathrm {P} _{X}(f)$ jest operatorem, którego argumenty i wartości są funkcjami z przestrzeni $\mathrm {L} ^{2}(\mathbb {R} ),$ tzn. $\mathrm {P} _{X}\colon \mathrm {L} ^{2}(\mathbb {R} )\to \mathrm {L} ^{2}(\mathbb {R} )$ dla pewnej podprzestrzeni $X$ przestrzeni $\mathrm {L} ^{2}(\mathbb {R} ).$

[13] Zob. delta Kroneckera $\delta _{k,n}.$

[14] Por. grupa okręgu $\mathbb {T} .$

[a]

[b]

[c]

[d]

[e]

[f]

[g]

[h]

[i]

[j]

[k]

[l]

[m]

[n]