4.1Definition

4.1.1 Was ist ein Vektorraum? Erst das Bild, dann die Regeln

Was haben Pfeile in der Ebene, Polynome wie 3x22x+13x^2 - 2x + 1 und 2×22 \times 2-Matrizen gemeinsam? Auf den ersten Blick nichts. Doch mit allen dreien darf man dasselbe tun: man kann zwei davon addieren und man kann eins mit einer Zahl strecken. Genau diese zwei Fähigkeiten machen aus einer Menge einen Vektorraum.

Halten wir das anschaulichste Beispiel fest, das du schon kennst: die Ebene R2\mathbb{R}^2. Ein Element ist ein Pfeil vom Ursprung zu einem Punkt (x1,x2)(x_1, x_2). Zwei Pfeile addierst du, indem du sie aneinanderhängst (Spitze an Schaft). Einen Pfeil streckst du, indem du seine Länge mit einer Zahl α\alpha multiplizierst; ist α\alpha negativ, dreht er um. Beide Ergebnisse sind wieder Pfeile in der Ebene. Diese Abgeschlossenheit ist der ganze Kern der Idee.

Ein Vektorraum VV ist also eine Menge von Objekten, die wir Vektoren nennen, zusammen mit zwei Rechenoperationen: einer Addition ++ (kombiniert zwei Vektoren zu einem dritten) und einer Skalarmultiplikation \cdot (kombiniert eine Zahl α\alpha mit einem Vektor). Damit das Rechnen sich vernünftig verhält, müssen diese Operationen acht Regeln erfüllen, die wir gleich anschauen. Die Skalare nehmen wir aus den reellen Zahlen R\mathbb{R}; allgemein dürfen sie aus einem Körper KK kommen (etwa R\mathbb{R} oder C\mathbb{C}). In Worten: ein Vektorraum ist eine Spielwiese, auf der Addieren und Strecken erlaubt sind und nie aus der Wiese hinausführen.

!
Die zwei Operationen eines Vektorraums
:V×VV,(a,b)ab:K×VV,(α,a)αa\begin{aligned} &\oplus : V \times V \to V, && (\mathbf{a}, \mathbf{b}) \mapsto \mathbf{a} \oplus \mathbf{b} \\ &\odot : K \times V \to V, && (\alpha, \mathbf{a}) \mapsto \alpha \odot \mathbf{a} \end{aligned}
\oplus heisst innere Operation (Addition), \odot heisst äussere Operation (Skalarmultiplikation). Meist schreibt man schlicht ++ und \cdot. KK ist der Skalarkörper, bei uns R\mathbb{R}.
Notation Notation: ⊕ und ⊙
\oplus ist die innere Operation (Addition zweier Vektoren), \odot die äussere Operation (Skalar mal Vektor). Die abstrakten Symbole betonen, dass es nicht die gewohnte Zahlenaddition sein muss. Ab hier schreiben wir einfach ++ und \cdot.
Notation Notation: K
KK ist der Skalarkörper, aus dem die Streckfaktoren stammen. Bei uns durchweg K=RK = \mathbb{R} (reeller Vektorraum); allgemein auch C\mathbb{C}.
Merke Bild im Kopf
Ein Schuhkarton voller Objekte, für die Addition und Skalierung Sinn ergeben und nie aus dem Karton herausführen.

4.1.2 Die acht Axiome eines Vektorraums

Welche Regeln muss das Addieren und Strecken genau erfüllen? Es sind acht Stück, und keine davon ist überraschend: jede ist eine Rechenregel, die du beim Vektorrechnen längst unbewusst benutzt. Wir gruppieren sie nach den zwei Operationen. Die ersten vier (A1 bis A4) betreffen nur die Addition, die letzten drei (M1 bis M3) die Skalarmultiplikation. Achtung: M2 fasst zwei Distributivgesetze in einer Zeile zusammen, deshalb sind es insgesamt acht Einzelregeln, nicht sieben.

!!!
Axiome der Addition (A1 bis A4)
(A1)u+w=w+u(A2)(u+w)+v=u+(w+v)(A3)0V  mit  u+0=u(A4)u  (u)  mit  u+(u)=0\begin{aligned} \text{(A1)} \quad & \mathbf{u} + \mathbf{w} = \mathbf{w} + \mathbf{u} \\ \text{(A2)} \quad & (\mathbf{u} + \mathbf{w}) + \mathbf{v} = \mathbf{u} + (\mathbf{w} + \mathbf{v}) \\ \text{(A3)} \quad & \exists\, \mathbf{0} \in V \;\text{mit}\; \mathbf{u} + \mathbf{0} = \mathbf{u} \\ \text{(A4)} \quad & \forall\, \mathbf{u}\; \exists\, (-\mathbf{u}) \;\text{mit}\; \mathbf{u} + (-\mathbf{u}) = \mathbf{0} \end{aligned}
Alles für alle u,v,wV\mathbf{u}, \mathbf{v}, \mathbf{w} \in V. (A1) Kommutativität, (A2) Assoziativität, (A3) Nullvektor (neutrales Element), (A4) inverses Element (Gegenvektor zu jedem u\mathbf{u}).
!!!
Axiome der Skalarmultiplikation (M1 bis M3)
(M1)(αβ)u=α(βu)(M2)(α+β)u=αu+βuα(u+w)=αu+αw(M3)1u=u\begin{aligned} \text{(M1)} \quad & (\alpha \cdot \beta) \cdot \mathbf{u} = \alpha \cdot (\beta \cdot \mathbf{u}) \\ \text{(M2)} \quad & (\alpha + \beta) \cdot \mathbf{u} = \alpha \cdot \mathbf{u} + \beta \cdot \mathbf{u} \\ & \alpha \cdot (\mathbf{u} + \mathbf{w}) = \alpha \cdot \mathbf{u} + \alpha \cdot \mathbf{w} \\ \text{(M3)} \quad & 1 \cdot \mathbf{u} = \mathbf{u} \end{aligned}
Für alle α,βR\alpha, \beta \in \mathbb{R} und u,wV\mathbf{u}, \mathbf{w} \in V. (M1) Assoziativität, (M2) Distributivität (zwei Gesetze: Skalar über eine Summe von Skalaren, dann über eine Summe von Vektoren), (M3) Neutralität der Eins.
Definition Vektorraum
Menge VV mit Addition ++ und Skalarmultiplikation \cdot, die die acht Axiome A1 bis A4 (Addition) und M1 bis M3 (Skalarmultiplikation) erfüllt. Die Elemente heissen Vektoren.
Notation Notation: 0 (Nullvektor)
0\mathbf{0} bezeichnet den Nullvektor aus A3. Manche Texte schreiben dafür OO. Er ist nicht zwingend die Zahl 00, sondern das neutrale Element der Addition in diesem VV.
Merke Acht, nicht sieben
M2 bündelt zwei Distributivgesetze in einer Zeile. Insgesamt sind es acht Einzelregeln.

4.1.3 Beispiele: ℝⁿ, Matrizen, Polynome, Funktionen

Was ist alles ein Vektorraum? Sobald eine Menge mit sinnvoller Addition und Skalarmultiplikation ausgestattet ist und die acht Axiome erfüllt, ist sie einer. Hier sind die Standardbeispiele, die in jeder Prüfung auftauchen. Verschiedene Sprachen, gleiche Grammatik.

Der wichtigste ist der Rn\mathbb{R}^n: alle Spaltenvektoren mit nn reellen Einträgen. Daneben der Cn\mathbb{C}^n mit komplexen Einträgen und der Raum Rm×n\mathbb{R}^{m \times n} aller reellen m×nm \times n-Matrizen (komponentenweise addiert und gestreckt). Spannender wird es bei PnP_n, dem Raum aller Polynome vom Grad höchstens nn: zwei Polynome addiert man koeffizientenweise, und mit einer Zahl multiplizieren ändert nichts am Grad. Ein Polynom ist also ein Vektor, sobald man ++ und \cdot darauf erklärt.

Funktionen liefern die letzten Beispiele: C[a,b]C[a,b] sind die auf dem Intervall [a,b][a,b] stetigen Funktionen, C1[a,b]C^1[a,b] die zusätzlich einmal stetig differenzierbaren. Auch sie bilden Vektorräume, denn die Summe zweier stetiger Funktionen ist stetig und ein Vielfaches ebenso. Ein Sonderfall: der Raum PP aller Polynome (ohne Gradschranke) ist unendlichdimensional; er besitzt kein endliches Erzeugendensystem, weil man für beliebig hohe Grade immer neue Bausteine braucht.

!!
Der Vektorraum ℝⁿ
Rn={x=(x1x2xn):x1,x2,,xnR}\mathbb{R}^n = \left\{ \mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} : x_1, x_2, \ldots, x_n \in \mathbb{R} \right\}
Analog Cn\mathbb{C}^n mit Einträgen aus C\mathbb{C} und Rm×n\mathbb{R}^{m \times n} als Menge aller reellen m×nm \times n-Matrizen.
Vektorraum Elemente Dimension
Rn\mathbb{R}^n Spaltenvektoren mit nn reellen Einträgen nn
Rm×n\mathbb{R}^{m \times n} reelle m×nm \times n-Matrizen mnm \cdot n
PnP_n Polynome vom Grad n\leq n n+1n + 1
PP alle Polynome (jeder Grad) \infty
C[a,b]C[a,b] stetige Funktionen auf [a,b][a,b] \infty
Standard-Vektorräume auf einen Blick
Definition Pₙ (Polynomraum)
Pn={P_n = \{ Polynome vom Grad höchstens n}n \}, also a0+a1x++anxna_0 + a_1 x + \cdots + a_n x^n. Vektorraum der Dimension n+1n + 1.
Definition C[a,b], C¹[a,b]
C[a,b]C[a,b]: auf [a,b][a,b] stetige Funktionen. C1[a,b]C^1[a,b]: zusätzlich einmal stetig differenzierbar. Beide sind unendlichdimensionale Vektorräume.

4.2Struktur

4.2.1 Unterraum: ein Vektorraum im Vektorraum

Wann ist eine Teilmenge eines Vektorraums selbst wieder ein Vektorraum? Stell dir den R3\mathbb{R}^3 vor und darin eine Ebene durch den Ursprung. Addierst du zwei Vektoren aus dieser Ebene, landest du wieder in der Ebene; streckst du einen, ebenso. Die Ebene ist ein Vektorraum im Vektorraum. Eine verschobene Ebene (die nicht durch den Ursprung geht) dagegen nicht: dort führt schon das Verdoppeln eines Vektors hinaus.

Eine nichtleere Teilmenge UU von VV heisst Unterraum, falls sie unter beiden Operationen abgeschlossen ist: (a) die Summe zweier Elemente von UU liegt wieder in UU, und (b) ein Vielfaches eines Elements von UU liegt wieder in UU. Mehr braucht man nicht zu prüfen; die acht Axiome erbt UU automatisch von VV. In Worten: ein Unterraum ist eine Teilmenge, aus der man durch Addieren und Strecken nicht herauskommt.

Zwei Folgerungen sind sofort wichtig. Erstens: jeder Unterraum enthält den Nullvektor (setze in (b) den Faktor α=0\alpha = 0). Das liefert einen blitzschnellen Test. Zweitens: {0}\{\mathbf{0}\} und VV selbst sind immer Unterräume von VV (die beiden „trivialen" Fälle).

!!!
Unterraum-Kriterium
(a)a,bU:  a+bU(b)aU,αR:  αaU\begin{aligned} \text{(a)} \quad & \forall\, \mathbf{a}, \mathbf{b} \in U:\; \mathbf{a} + \mathbf{b} \in U \\ \text{(b)} \quad & \forall\, \mathbf{a} \in U,\, \alpha \in \mathbb{R}:\; \alpha \cdot \mathbf{a} \in U \end{aligned}
UU \neq \emptyset vorausgesetzt. Aus (b) mit α=0\alpha = 0 folgt 0U\mathbf{0} \in U.

Beispiel: Ist der Lösungsraum von Ax = 0 ein Unterraum?

  1. Schritt 1: Was ist die Menge?
    Wir nehmen V=RnV = \mathbb{R}^n und eine n×nn \times n-Matrix AA. Betrachtet wird die Lösungsmenge des homogenen Systems.
    Also U={xRn:Ax=0}U = \{ \mathbf{x} \in \mathbb{R}^n : A\mathbf{x} = \mathbf{0} \}. Wir prüfen die zwei Bedingungen.
    U={xRn:Ax=0}U = \{ \mathbf{x} \in \mathbb{R}^n : A\mathbf{x} = \mathbf{0} \}
  2. Schritt 2: Bedingung (a), Abgeschlossenheit unter Addition
    Seien a,b\mathbf{a}, \mathbf{b} zwei Lösungen, also Aa=0A\mathbf{a} = \mathbf{0} und Ab=0A\mathbf{b} = \mathbf{0}. Ist a+b\mathbf{a} + \mathbf{b} wieder eine Lösung?
    Wegen der Linearität der Matrixmultiplikation:
    A(a+b)=Aa+Ab=0+0=0A(\mathbf{a} + \mathbf{b}) = A\mathbf{a} + A\mathbf{b} = \mathbf{0} + \mathbf{0} = \mathbf{0}
  3. Schritt 3: Bedingung (b), Abgeschlossenheit unter Skalierung
    Sei a\mathbf{a} eine Lösung und αR\alpha \in \mathbb{R}. Ist αa\alpha \mathbf{a} wieder eine Lösung?
    Wieder mit der Linearität:
    A(αa)=αAa=α0=0A(\alpha \cdot \mathbf{a}) = \alpha \cdot A\mathbf{a} = \alpha \cdot \mathbf{0} = \mathbf{0}
  4. Schritt 4: Schluss
    Beide Bedingungen sind erfüllt, und 0\mathbf{0} liegt in UU (denn A0=0A\mathbf{0} = \mathbf{0}).
    Also ist der Lösungsraum von Ax=0A\mathbf{x} = \mathbf{0} ein Unterraum von Rn\mathbb{R}^n. Dieser Unterraum hat einen Namen: der Kern von AA.
Definition Unterraum
Nichtleere Teilmenge UVU \subseteq V, die unter Addition (a) und Skalarmultiplikation (b) abgeschlossen ist. Ein Unterraum ist selbst ein Vektorraum und enthält stets 0\mathbf{0}.
Merke Schnelltest
0U    U\mathbf{0} \notin U \;\Rightarrow\; U ist kein Unterraum. Spart oft die ganze Rechnung.
Querverweis Verweise
→ Kap. 1: Kern als Lösungsraum

4.2.2 Durchschnitt und Summe von Unterräumen

Wenn du zwei Unterräume U1U_1 und U2U_2 desselben VV hast, wie kombinierst du sie zu einem neuen? Es gibt zwei natürliche Wege, und beide ergeben wieder einen Unterraum.

Der Durchschnitt U1U2U_1 \cap U_2 besteht aus allen Vektoren, die in beiden Räumen liegen. Anschaulich: die gemeinsamen Vektoren. Die Summe U1+U2U_1 + U_2 besteht aus allen Vektoren, die sich als u1+u2\mathbf{u}_1 + \mathbf{u}_2 mit u1U1\mathbf{u}_1 \in U_1 und u2U2\mathbf{u}_2 \in U_2 schreiben lassen. Anschaulich: alles, was man durch Kombinieren je eines Vektors aus jedem Raum erreichen kann.

Vorsicht beim Wort „Summe": U1+U2U_1 + U_2 ist nicht etwa nur die Vereinigung der beiden Mengen. Die blosse Vereinigung wäre meist gar kein Unterraum (Summen über die Grenze hinweg fehlen). Erst indem man alle Summen u1+u2\mathbf{u}_1 + \mathbf{u}_2 zulässt, wird die Menge abgeschlossen und damit ein Unterraum.

!!
Durchschnitt und Summe (beide Unterräume von V)
U1U2={uV:uU1 und uU2}U1+U2={u1+u2:u1U1,u2U2}\begin{aligned} U_1 \cap U_2 &= \{ \mathbf{u} \in V : \mathbf{u} \in U_1 \text{ und } \mathbf{u} \in U_2 \} \\ U_1 + U_2 &= \{ \mathbf{u}_1 + \mathbf{u}_2 : \mathbf{u}_1 \in U_1,\, \mathbf{u}_2 \in U_2 \} \end{aligned}
Beide Konstruktionen liefern wieder einen Unterraum von VV.
Formel Durchschnitt
U1U2={u:uU1uU2}U_1 \cap U_2 = \{ \mathbf{u} : \mathbf{u} \in U_1 \wedge \mathbf{u} \in U_2 \}
Formel Summe
U1+U2={u1+u2:uiUi}U_1 + U_2 = \{ \mathbf{u}_1 + \mathbf{u}_2 : \mathbf{u}_i \in U_i \}
Merke Nicht die Vereinigung
U1U2U_1 \cup U_2 ist im Allgemeinen kein Unterraum. Erst die Summe U1+U2U_1 + U_2 ist abgeschlossen.

4.2.3 Linearkombination und Span

Welche Vektoren kannst du aus gegebenen bauen, wenn du nur addieren und strecken darfst? Genau diese Frage beantworten Linearkombination und Span.

Eine Linearkombination der Vektoren v1,,vn\mathbf{v}_1, \ldots, \mathbf{v}_n ist jeder Vektor der Form a1v1+a2v2++anvna_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + \cdots + a_n \mathbf{v}_n mit Skalaren aiRa_i \in \mathbb{R}. Du gewichtest also jeden Baustein mit einer Zahl und summierst. Die Menge aller dieser Kombinationen heisst Span (oder lineare Hülle, oder erzeugter Unterraum): span{v1,,vn}\operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\}. Anschaulich: zwei Richtungspfeile im Raum spannen eine Ebene auf, drei unabhängige spannen den ganzen R3\mathbb{R}^3.

Wie prüft man, ob ein bestimmter Vektor w\mathbf{w} im Span liegt? Man schreibt die vi\mathbf{v}_i als Spalten in eine Matrix V=(v1,,vn)V = (\mathbf{v}_1, \ldots, \mathbf{v}_n) und fragt, ob das lineare Gleichungssystem Vx=wV\mathbf{x} = \mathbf{w} lösbar ist. Hat es eine Lösung x\mathbf{x}, so sind die Komponenten von x\mathbf{x} genau die gesuchten Gewichte, und w\mathbf{w} ist eine Linearkombination der vi\mathbf{v}_i. So wird die Span-Frage zu einer Gauss-Rechnung, die du schon beherrschst.

!!
Linearkombination
v=i=1naivi=a1v1+a2v2++anvnmit a1,,anR\begin{aligned} \mathbf{v} &= \sum_{i=1}^{n} a_i \, \mathbf{v}_i = a_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + \cdots + a_n \mathbf{v}_n \\ & \text{mit } a_1, \ldots, a_n \in \mathbb{R} \end{aligned}
Die aia_i heissen Koeffizienten oder Gewichte der Kombination.
!!!
Span (erzeugter Unterraum) und Lösbarkeitstest
span{v1,,vn}={i=1naivi:aiR}wspan    Vx=w lo¨sbar\begin{aligned} \operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\} &= \left\{ \sum_{i=1}^{n} a_i \mathbf{v}_i : a_i \in \mathbb{R} \right\} \\ \mathbf{w} \in \operatorname{span} &\iff V\mathbf{x} = \mathbf{w} \text{ lösbar} \end{aligned}
V=(v1,,vn)V = (\mathbf{v}_1, \ldots, \mathbf{v}_n) ist die Matrix mit den vi\mathbf{v}_i als Spalten.

Beispiel: Polynome spannen P₃ auf

  1. Schritt 1: Die Bausteine und das Ziel
    Wir prüfen eine Span-Aussage in einem Polynomraum statt im Rn\mathbb{R}^n. Das zeigt, dass „Span" überall gleich funktioniert.
    Gegeben die Polynome p1=x3+x2p_1 = x^3 + x^2, p2=x22x4p_2 = x^2 - 2x - 4, p3=3x+4p_3 = 3x + 4, p4=2x+3p_4 = 2x + 3. Behauptung: span{p1,p2,p3,p4}=P3\operatorname{span}\{p_1, p_2, p_3, p_4\} = P_3.
  2. Schritt 2: Was heisst „= P₃"?
    P3P_3 wird von 1,x,x2,x31, x, x^2, x^3 erzeugt. Wenn wir diese vier Monome aus unseren pip_i bauen können, können wir jedes Polynom vom Grad 3\leq 3 bauen.
    Es genügt also, 1,x,x2,x31, x, x^2, x^3 als Linearkombination der pip_i darzustellen.
  3. Schritt 3: Koeffizientenvergleich
    Durch Vergleichen der Koeffizienten gleicher Potenzen löst man jedes Monom auf.
    Man findet (nachrechnen lohnt sich):
    1=3p42p3x=3p34p4x2=p2+4p42p3x3=p1p24p4+2p3\begin{aligned} 1 &= 3p_4 - 2p_3 \\ x &= 3p_3 - 4p_4 \\ x^2 &= p_2 + 4p_4 - 2p_3 \\ x^3 &= p_1 - p_2 - 4p_4 + 2p_3 \end{aligned}
  4. Schritt 4: Schluss
    Alle vier Monome sind darstellbar, also auch jede ihrer Kombinationen.
    Damit ist span{p1,p2,p3,p4}=P3\operatorname{span}\{p_1, p_2, p_3, p_4\} = P_3. Beachte: das Monom x4x^4 liesse sich nie bauen, weil alle pip_i höchstens Grad 33 haben; die vier Polynome erzeugen P4P_4 also nicht.
Definition Span / erzeugter Unterraum
span{v1,,vn}\operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\} ist die Menge aller Linearkombinationen der vi\mathbf{v}_i. Stets ein Unterraum von VV.

4.2.4 Lineare Unabhängigkeit anschaulich

Wann ist ein Vektor in einer Sammlung überflüssig? Anschaulich dann, wenn er keine neue Richtung beiträgt, weil er sich schon aus den anderen zusammenbauen lässt. In der Ebene heisst linear unabhängig: keine zwei Vektoren zeigen in dieselbe Richtung (keiner ist ein Vielfaches des anderen). Im Raum heisst es: die Vektoren liegen nicht alle in einer gemeinsamen Ebene. Sobald einer „in der Spur" der anderen liegt, sind sie abhängig.

Die saubere Definition macht aus „keine Richtung doppelt" eine Gleichung: v1,,vn\mathbf{v}_1, \ldots, \mathbf{v}_n heissen linear unabhängig, wenn das homogene System ixivi=0\sum_{i} x_i \mathbf{v}_i = \mathbf{0} nur die triviale Lösung x1==xn=0x_1 = \cdots = x_n = 0 besitzt. Gibt es eine andere Lösung (mit mindestens einem xi0x_i \neq 0), so heissen sie linear abhängig; dann lässt sich ein Vektor durch die anderen ausdrücken. In Worten: unabhängig bedeutet, dass die einzige Art, den Nullvektor zu kombinieren, das Nichtstun ist.

Das verbindet sich direkt mit Kapitel 1: ixivi=0\sum_i x_i \mathbf{v}_i = \mathbf{0} ist Vx=0V\mathbf{x} = \mathbf{0} mit der Spaltenmatrix VV. Nur die triviale Lösung bedeutet trivialer Kern, und das bedeutet voller Spaltenrang. So gilt das Rang-Kriterium: rang(V)=n\operatorname{rang}(V) = n (volle Spaltenzahl) ist gleichbedeutend mit linearer Unabhängigkeit der nn Spalten.

!!!
Definition lineare Unabhängigkeit
v1,,vn linear unabha¨ngig      i=1nxivi=0hat nur die Lo¨sung  x1==xn=0\begin{aligned} & \mathbf{v}_1, \ldots, \mathbf{v}_n \text{ linear unabhängig} \\ \iff\; & \sum_{i=1}^{n} x_i \, \mathbf{v}_i = \mathbf{0} \\ & \text{hat nur die Lösung}\; x_1 = \cdots = x_n = 0 \end{aligned}
Andernfalls (nichttriviale Lösung existiert) heissen sie linear abhängig.
!!
Rang-Kriterium
rang(V)=n    v1,,vn sind linear unabha¨ngig\operatorname{rang}(V) = n \;\Longrightarrow\; \mathbf{v}_1, \ldots, \mathbf{v}_n \text{ sind linear unabhängig}
V=(v1,,vn)V = (\mathbf{v}_1, \ldots, \mathbf{v}_n) mit den Vektoren als Spalten. Voller Spaltenrang = Unabhängigkeit.

Beispiel: Unabhängigkeit mit einem Parameter t

  1. Schritt 1: Die Vektoren
    Ein Parameter tt steckt in den Vektoren. Wir suchen, für welche tt sie unabhängig sind. Das ist ein klassischer Prüfungstyp.
    Gegeben v1=(1,0,0)T\mathbf{v}_1 = (1, 0, 0)^{\mathsf{T}}, v2=(0,2,t)T\mathbf{v}_2 = (0, 2, t)^{\mathsf{T}}, v3=(2,4,t2)T\mathbf{v}_3 = (2, 4, t^2)^{\mathsf{T}}.
    v1=(1,0,0)Tv2=(0,2,t)Tv3=(2,4,t2)T\begin{aligned} \mathbf{v}_1 &= (1,\, 0,\, 0)^{\mathsf{T}} \\ \mathbf{v}_2 &= (0,\, 2,\, t)^{\mathsf{T}} \\ \mathbf{v}_3 &= (2,\, 4,\, t^2)^{\mathsf{T}} \end{aligned}
  2. Schritt 2: Homogenes System aufstellen und eliminieren
    Unabhängig heisst: a1v1+a2v2+a3v3=0a_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + a_3 \mathbf{v}_3 = \mathbf{0} nur trivial. Wir bringen die Spaltenmatrix in Stufenform.
    Mit der Zeilenoperation IIIIIIt2II\text{III} \to \text{III} - \tfrac{t}{2}\,\text{II} entsteht das Pivotelement t22tt^2 - 2t:
    (1020240tt2)    IIIt2II    (10202400t22t)\begin{pmatrix} 1 & 0 & 2 \\ 0 & 2 & 4 \\ 0 & t & t^2 \end{pmatrix} \;\xrightarrow{\;\text{III} - \frac{t}{2}\text{II}\;}\; \begin{pmatrix} 1 & 0 & 2 \\ 0 & 2 & 4 \\ 0 & 0 & t^2 - 2t \end{pmatrix}
  3. Schritt 3: Pivot analysieren
    Genau dann wenn das letzte Pivot verschwindet, gibt es eine freie Variable und damit nichttriviale Lösungen.
    t22t=t(t2)=0t^2 - 2t = t(t - 2) = 0 gilt für t=0t = 0 und t=2t = 2. Bei diesen Werten sind die Vektoren abhängig.
    t22t=0    t{0,2}t^2 - 2t = 0 \iff t \in \{0, 2\}
  4. Schritt 4: Schluss
    Für alle übrigen tt ist das letzte Pivot ungleich null, also voller Rang.
    Die drei Vektoren sind genau dann linear unabhängig, wenn
    tR{0,2}t \in \mathbb{R} \setminus \{0, 2\}

Unabhängigkeit gilt auch für Funktionen als Vektoren. So sind sin(x)\sin(x) und cos(x)\cos(x) in C[a,b]C[a,b] linear unabhängig: aus asin(x)+bcos(x)=0a \sin(x) + b \cos(x) = 0 für alle xx folgt a=b=0a = b = 0. Dagegen sind sin(x)\sin(x), sin(x+2)\sin(x + 2), cos(x)\cos(x) linear abhängig, denn das Additionstheorem liefert sin(x+2)=sin(x)cos(2)+cos(x)sin(2)\sin(x + 2) = \sin(x)\cos(2) + \cos(x)\sin(2), also ist sin(x+2)\sin(x+2) schon eine Kombination der beiden anderen.

Definition Lineare (Un)abhängigkeit
v1,,vn\mathbf{v}_1, \ldots, \mathbf{v}_n sind unabhängig, wenn ixivi=0\sum_i x_i \mathbf{v}_i = \mathbf{0} nur trivial lösbar ist, sonst abhängig. Eine Menge mit 0\mathbf{0} ist stets abhängig.
Merke Geometrie
R2\mathbb{R}^2: unabhängig = verschiedene Richtungen. R3\mathbb{R}^3: unabhängig = nicht in einer gemeinsamen Ebene.

4.2.5 Erzeugendensystem, Basis und Dimension

Was ist die kleinste Menge von Vektoren, die einen ganzen Raum aufspannt? Zu wenige Vektoren erreichen nicht alles, zu viele enthalten Überflüssiges. Genau in der Mitte sitzt die Basis.

Ein Erzeugendensystem von VV ist eine Menge v1,,vn\mathbf{v}_1, \ldots, \mathbf{v}_n mit V=span{v1,,vn}V = \operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\}; jeder Vektor lässt sich also aus ihnen kombinieren. Existiert ein endliches Erzeugendensystem, heisst VV endlichdimensional. Eine Basis ist ein Erzeugendensystem aus linear unabhängigen Vektoren, anschaulich: ein Koordinatensystem mit gerade genug Achsen, keine zu viel, keine zu wenig. Die Anzahl der Basisvektoren heisst Dimension dim(V)\dim(V) und ist für jeden Raum eindeutig.

Hat VV die Dimension nn, so gilt eine handfeste Faustregel: mehr als nn Vektoren sind immer abhängig; weniger als nn sind nie erzeugend; und genau nn Vektoren sind genau dann unabhängig, wenn sie erzeugend sind. In diesem Fall bilden sie eine Basis. Bei nn Vektoren fallen die beiden Eigenschaften „unabhängig" und „erzeugend" also zusammen, du musst nur eine prüfen.

Für kk Vektoren v1,,vkRn\mathbf{v}_1, \ldots, \mathbf{v}_k \in \mathbb{R}^n fasst man die Lage in der Spaltenmatrix A=(v1,,vk)A = (\mathbf{v}_1, \ldots, \mathbf{v}_k) mit Rang rr zusammen. Die folgende Tabelle fasst das auf einen Blick zusammen.

Eigenschaft Bedingung am LGS Rang
erzeugend Ax=bA\mathbf{x} = \mathbf{b} lösbar für alle bRn\mathbf{b} \in \mathbb{R}^n r=nr = n
linear unabhängig Ax=0A\mathbf{x} = \mathbf{0} nur trivial lösbar r=kr = k
linear abhängig Ax=0A\mathbf{x} = \mathbf{0} hat nichttriviale Lösung r<kr < k
Basis beides zugleich, also det(A)0\det(A) \neq 0 n=k=rn = k = r
Erzeugend, unabhängig, Basis über den Rang (A ∈ ℝⁿˣᵏ, r = Rang(A))
!!
Dimension
dim(V)=Anzahl der Vektoren einer Basis von V\dim(V) = \text{Anzahl der Vektoren einer Basis von } V
Für jeden endlichdimensionalen Vektorraum eindeutig, unabhängig von der gewählten Basis.
Definition Basis
Linear unabhängiges Erzeugendensystem von VV. Jeder Vektor ist dann eindeutig als Linearkombination der Basisvektoren darstellbar.
Definition Dimension
dim(V)\dim(V) = Anzahl der Vektoren in einer Basis. Für jeden endlichdimensionalen VV eindeutig.
Merke Dimensionsregel (dim V = n)
Mehr als nn Vektoren: abhängig. Weniger als nn: nicht erzeugend. Genau nn: unabhängig     \iff erzeugend     \iff Basis.

4.2.6 Koordinaten bezüglich einer Basis

Wie schreibst du denselben Vektor in einer anderen Basis? Denk an eine Adresse: derselbe Ort hat im einen Stadtplan andere Koordinaten als im anderen. Der Vektor bleibt, die Zahlen ändern sich mit dem gewählten Achsensystem.

Ist B={b1,,bn}B = \{\mathbf{b}_1, \ldots, \mathbf{b}_n\} eine Basis von VV, so lässt sich jeder Vektor x\mathbf{x} eindeutig als x=ixibi\mathbf{x} = \sum_i x_i \mathbf{b}_i schreiben. Die eindeutig bestimmten Koeffizienten x1,,xnx_1, \ldots, x_n heissen Koordinaten von x\mathbf{x} bezüglich BB. Anschaulich sind sie das Rezept: wie viel von jedem Basisvektor man nehmen muss. Man fasst sie zum Koordinatenvektor [x]B[\mathbf{x}]_B zusammen. Wichtig: diese Zahlen hängen von der Basiswahl ab, eine andere Basis liefert andere Koordinaten für denselben x\mathbf{x}.

!!!
Koordinaten bezüglich der Basis B
x=i=1nxibi=x1b1++xnbn[x]B=(x1xn)\mathbf{x} = \sum_{i=1}^{n} x_i \, \mathbf{b}_i = x_1 \mathbf{b}_1 + \cdots + x_n \mathbf{b}_n \qquad\Longrightarrow\qquad [\mathbf{x}]_B = \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}
B={b1,,bn}B = \{\mathbf{b}_1, \ldots, \mathbf{b}_n\} Basis. Die xix_i sind eindeutig und hängen von BB ab.

Beispiel: Koordinaten in P₂

  1. Schritt 1: Basis und Polynom
    Wir bestimmen Koordinaten in einem Polynomraum, wo „Vektor" = Polynom ist. Die Basis ist nicht die Standardbasis, das macht es lehrreich.
    Basis B={b1=1,  b2=x,  b3=3x21}B = \{\, b_1 = 1,\; b_2 = x,\; b_3 = 3x^2 - 1 \,\} von P2P_2. Gesucht: die Koordinaten von p(x)=11x22x+1p(x) = 11x^2 - 2x + 1.
    B={1,  x,  3x21},p(x)=11x22x+1B = \{\, 1,\; x,\; 3x^2 - 1 \,\}, \qquad p(x) = 11x^2 - 2x + 1
  2. Schritt 2: Hilfsdarstellung von x²
    Die Basis enthält 3x213x^2 - 1 statt x2x^2. Um Potenzen zu vergleichen, drücken wir x2x^2 durch die Basis aus.
    Es gilt x2=131+13(3x21)x^2 = \tfrac{1}{3} \cdot 1 + \tfrac{1}{3}(3x^2 - 1), also x2=13b1+13b3x^2 = \tfrac{1}{3} b_1 + \tfrac{1}{3} b_3.
    x2=131+13(3x21)x^2 = \tfrac{1}{3} \cdot 1 + \tfrac{1}{3}\,(3x^2 - 1)
  3. Schritt 3: Ansatz und Koeffizientenvergleich
    Wir setzen pp als Kombination a1b1+a2b2+a3b3a_1 b_1 + a_2 b_2 + a_3 b_3 an und vergleichen die Koeffizienten von 11, xx und x2x^2.
    Aus 11x22x+1=a11+a2x+a3(3x21)11x^2 - 2x + 1 = a_1 \cdot 1 + a_2 \cdot x + a_3 (3x^2 - 1) folgt:
    a1=143,a2=2,a3=113a_1 = \tfrac{14}{3}, \qquad a_2 = -2, \qquad a_3 = \tfrac{11}{3}
  4. Schritt 4: Koordinatenvektor
    Die drei Koeffizienten sind die gesuchten Koordinaten.
    Also ist der Koordinatenvektor von pp bezüglich BB:
    [p(x)]B=(1432113)[p(x)]_B = \begin{pmatrix} \tfrac{14}{3} \\[2pt] -2 \\[2pt] \tfrac{11}{3} \end{pmatrix}
Notation Notation: [x]B[\mathbf{x}]_B
[x]B[\mathbf{x}]_B ist der Koordinatenvektor von x\mathbf{x} bezüglich der Basis BB: die Spalte der eindeutigen Koeffizienten xix_i aus x=ixibi\mathbf{x} = \sum_i x_i \mathbf{b}_i.
Prüfungstipp Prüfungstipp
Koordinaten hängen von der Basis ab. Frage immer: „bezüglich welcher Basis?" Ohne Basis ist [x]B[\mathbf{x}]_B bedeutungslos.

4.3Normierte Vektorräume

4.3.1 Die Norm: Länge im Vektorraum

Wie lang ist ein Vektor, und was soll „lang" überhaupt heissen, wenn der Vektor ein Polynom oder eine Funktion ist? Im R2\mathbb{R}^2 misst du die Pfeillänge mit Pythagoras. In einem abstrakten Vektorraum verallgemeinert die Norm diese Idee.

Eine Norm auf VV ist eine Abbildung :VR\lVert \cdot \rVert : V \to \mathbb{R}, die jedem Vektor eine reelle Zahl (seine „Länge") zuordnet und drei Bedingungen erfüllt. (I) Positivität: die Länge ist nie negativ und genau dann null, wenn der Vektor der Nullvektor ist. (II) Homogenität: streckst du den Vektor um den Faktor α\alpha, skaliert die Länge um α|\alpha|. (III) Dreiecksungleichung: die Länge einer Summe ist höchstens die Summe der Längen.

Diese drei Forderungen sind genau das, was man intuitiv von „Länge" erwartet. Nichts kann negativ lang sein, doppelt so weit gestreckt ist doppelt so lang, und der direkte Weg ist nie länger als ein Umweg über einen dritten Punkt. Mehr steckt nicht dahinter.

!!!
Norm als Abbildung mit drei Axiomen
:VR,{(I)v0   und   v=0    v=0(II)αv=αv(III)v+wv+w\lVert \cdot \rVert : V \to \mathbb{R}, \quad \begin{cases} \text{(I)} & \lVert \mathbf{v} \rVert \geq 0 \;\text{ und }\; \lVert \mathbf{v} \rVert = 0 \iff \mathbf{v} = \mathbf{0} \\ \text{(II)} & \lVert \alpha \cdot \mathbf{v} \rVert = |\alpha| \cdot \lVert \mathbf{v} \rVert \\ \text{(III)} & \lVert \mathbf{v} + \mathbf{w} \rVert \leq \lVert \mathbf{v} \rVert + \lVert \mathbf{w} \rVert \end{cases}
Für alle v,wV\mathbf{v}, \mathbf{w} \in V und αR\alpha \in \mathbb{R}. (I) Positivität, (II) Homogenität, (III) Dreiecksungleichung.
Notation Notation: ‖v‖
v\lVert \mathbf{v} \rVert ist die Norm (Länge) von v\mathbf{v}. Ein Index gibt an, welche Norm gemeint ist: v2\lVert \mathbf{v} \rVert_2 euklidisch, v\lVert \mathbf{v} \rVert_\infty Maximum, vp\lVert \mathbf{v} \rVert_p die pp-Norm.
Definition Norm
Abbildung :VR\lVert \cdot \rVert : V \to \mathbb{R} mit Positivität, Homogenität und Dreiecksungleichung. Verallgemeinert den Begriff der Länge.

4.3.2 Standard-Normen: euklidisch, Maximum, p-Norm

Es gibt mehr als eine Art, Länge zu messen. Im Rn\mathbb{R}^n sind drei Normen besonders gebräuchlich, und sie geben demselben Vektor verschiedene Längen, weil sie verschiedene Fragen beantworten.

Die euklidische Norm (oder 22-Norm) ist die gewohnte Pythagoras-Länge v2=v12++vn2\lVert \mathbf{v} \rVert_2 = \sqrt{v_1^2 + \cdots + v_n^2}, die Luftlinie zum Punkt. Die Maximumsnorm (oder \infty-Norm) nimmt einfach den betragsmässig grössten Eintrag, v=maxivi\lVert \mathbf{v} \rVert_\infty = \max_i |v_i|, also den grössten Einzelschritt. Dazwischen liegt die pp-Norm, die für pp \to \infty in die Maximumsnorm übergeht und für p=2p = 2 die euklidische ist.

Auf endlichdimensionalen Vektorräumen sind all diese Normen äquivalent: zu je zwei Normen \lVert \cdot \rVert und \lVert \cdot \rVert' gibt es eine Konstante cc, sodass 1cxxcx\tfrac{1}{c}\lVert \mathbf{x} \rVert' \leq \lVert \mathbf{x} \rVert \leq c\,\lVert \mathbf{x} \rVert'. Sie unterscheiden sich also nur um konstante Faktoren; eine Folge, die in einer Norm gegen einen Grenzwert läuft, tut das auch in jeder anderen. (In unendlicher Dimension stimmt das nicht mehr, dort kann die Wahl der Norm alles ändern, dazu gleich.)

!!!
Euklidische Norm (2-Norm)
v2=v12+v22++vn2\lVert \mathbf{v} \rVert_2 = \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2}
Die gewohnte Pythagoras-Länge eines Vektors im Rn\mathbb{R}^n.
!!
Maximumsnorm und p-Norm
v=max1invivp=(i=1nvip)1/p\begin{aligned} \lVert \mathbf{v} \rVert_\infty &= \max_{1 \leq i \leq n} |v_i| \\ \lVert \mathbf{v} \rVert_p &= \left( \sum_{i=1}^{n} |v_i|^p \right)^{1/p} \end{aligned}
Die \infty-Norm nimmt den grössten Betrag, die pp-Norm verallgemeinert; p=2p = 2 ergibt die euklidische Norm.
!
Norm-Äquivalenz (endliche Dimension)
1cx    x    cx\tfrac{1}{c}\,\lVert \mathbf{x} \rVert' \;\leq\; \lVert \mathbf{x} \rVert \;\leq\; c\,\lVert \mathbf{x} \rVert'
In einem endlichdimensionalen Vektorraum gibt es zu je zwei Normen so eine Konstante c>0c > 0.

Ein Zahlbeispiel: für v=(1,3,4)T\mathbf{v} = (1, 3, 4)^{\mathsf{T}} ist v2=1+9+16=26\lVert \mathbf{v} \rVert_2 = \sqrt{1 + 9 + 16} = \sqrt{26} und v3=1+27+643=923\lVert \mathbf{v} \rVert_3 = \sqrt[3]{1 + 27 + 64} = \sqrt[3]{92}. Derselbe Vektor, zwei verschiedene Längen, je nach gewählter Norm.

Formel Euklidische Norm
v2=ivi2\lVert \mathbf{v} \rVert_2 = \sqrt{\textstyle\sum_i v_i^2}
Merke Alle Normen äquivalent
In endlicher Dimension unterscheiden sich je zwei Normen nur um konstante Faktoren. Konvergenz ist dann unabhängig von der gewählten Norm.
Merke Bild im Kopf
22-Norm = Luftlinie zum Punkt. \infty-Norm = grösster Einzelschritt entlang einer Achse.

4.3.3 Normen auf Funktionenräumen und Konvergenz

Wie misst man den Abstand zweier Funktionen? Auch Funktionen sind Vektoren (im Raum C[a,b]C[a,b]), also brauchen sie eine Norm. Es gibt wieder mehrere natürliche Wahlen.

Die Maximumsnorm f0=maxaxbf(x)\lVert f \rVert_0 = \max_{a \leq x \leq b} |f(x)| nimmt den grössten Funktionswert dem Betrag nach, den höchsten Ausschlag der Kurve. Die Integral-pp-Norm fp=(abf(x)pdx)1/p\lVert f \rVert_p = \left( \int_a^b |f(x)|^p \, dx \right)^{1/p} mittelt dagegen über das ganze Intervall; sie ist gross, wenn die Funktion insgesamt viel Fläche unter sich hat. Beide messen „Grösse einer Funktion", aber verschieden.

Mit einer Norm wird der Satz „eine Folge nähert sich einem Grenzwert" präzise: eine Folge {vn}\{\mathbf{v}_n\} in VV konvergiert gegen v\mathbf{v}, wenn der Abstand vvn\lVert \mathbf{v} - \mathbf{v}_n \rVert gegen null geht. Hier zeigt sich, warum die Norm-Wahl in unendlicher Dimension wichtig ist: dieselbe Funktionenfolge kann in der einen Norm konvergieren und in der anderen nicht.

!!
Normen auf C[a,b]
f0=maxaxbf(x)fp=(abf(x)pdx)1/p\begin{aligned} \lVert f \rVert_0 &= \max_{a \leq x \leq b} |f(x)| \\ \lVert f \rVert_p &= \left( \int_a^b |f(x)|^p \, dx \right)^{1/p} \end{aligned}
f0\lVert f \rVert_0 Maximumsnorm (grösster Ausschlag), fp\lVert f \rVert_p Integral-Norm (gemittelt über das Intervall).
!!
Konvergenz bezüglich einer Norm
{vn}v    limnvvn=0\{\mathbf{v}_n\} \to \mathbf{v} \iff \lim_{n \to \infty} \lVert \mathbf{v} - \mathbf{v}_n \rVert = 0
Der Abstand zwischen Folgenglied und Grenzwert geht gegen null.

Ein warnendes Beispiel: die Funktionenfolge fn(x)=11+(nx)2f_n(x) = \dfrac{1}{1 + (nx)^2} auf [1,1][-1, 1] konvergiert in der Maximumsnorm nicht gegen die Nullfunktion. Denn an der Stelle x=0x = 0 ist stets fn(0)=1f_n(0) = 1, also fn=10\lVert f_n \rVert_\infty = 1 \neq 0 für jedes nn. Obwohl die Funktionen abseits der Null beliebig klein werden, bleibt die Spitze bei x=0x = 0 stehen, und die Maximumsnorm sieht genau diese Spitze.

Definition Konvergenz (bzgl. Norm)
{vn}\{\mathbf{v}_n\} konvergiert gegen v\mathbf{v}, falls vvn0\lVert \mathbf{v} - \mathbf{v}_n \rVert \to 0. Hängt von der gewählten Norm ab.
Prüfungstipp Achtung
In unendlicher Dimension entscheidet die Norm-Wahl über Konvergenz. Dieselbe Folge kann in einer Norm konvergieren, in einer anderen nicht.

4.4Das Skalarprodukt

4.4.1 Das Skalarprodukt: Winkel messen

Wie misst man den Winkel zwischen zwei Vektoren, und sogar zwischen zwei Polynomen? Die Norm gibt Längen, aber keine Winkel. Dafür braucht es ein neues Werkzeug: das Skalarprodukt. Es steckt den Winkel zwischen zwei Vektoren in eine einzige Zahl.

Ein Skalarprodukt auf einem reellen Vektorraum VV ist eine Abbildung ,:V×VR\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}, die jedem Paar von Vektoren eine reelle Zahl zuordnet und drei Bedingungen erfüllt: (I) Bilinearität (linear in jedem der beiden Argumente), (II) Symmetrie (x,y=y,x\langle \mathbf{x}, \mathbf{y} \rangle = \langle \mathbf{y}, \mathbf{x} \rangle) und (III) positive Definitheit (x,x0\langle \mathbf{x}, \mathbf{x} \rangle \geq 0, mit Gleichheit nur für x=0\mathbf{x} = \mathbf{0}).

Im Rn\mathbb{R}^n ist das Standardskalarprodukt die vertraute Komponentensumme x,y=xTy\langle \mathbf{x}, \mathbf{y} \rangle = \mathbf{x}^{\mathsf{T}} \mathbf{y}. Es hängt mit Längen und Winkel über x,y=xycos(φ)\langle \mathbf{x}, \mathbf{y} \rangle = \lVert \mathbf{x} \rVert \, \lVert \mathbf{y} \rVert \cos(\varphi) zusammen, wobei φ\varphi der Winkel zwischen den Vektoren ist. Daraus liest man beides ab: die Längen (über x,x=x2\langle \mathbf{x}, \mathbf{x} \rangle = \lVert \mathbf{x} \rVert^2) und den Winkel. Jedes Skalarprodukt erzeugt nämlich eine eigene Norm, die induzierte Norm a=a,a\lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}. Umgekehrt kommt aber nicht jede Norm von einem Skalarprodukt.

!!!
Skalarprodukt: die drei Axiome
,:V×VR,{(I)x+αy,z=x,z+αy,z(II)x,y=y,x(III)x,x0,    x,x=0    x=0\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}, \qquad \begin{cases} \text{(I)} & \langle \mathbf{x} + \alpha \mathbf{y}, \mathbf{z} \rangle = \langle \mathbf{x}, \mathbf{z} \rangle + \alpha \langle \mathbf{y}, \mathbf{z} \rangle \\ \text{(II)} & \langle \mathbf{x}, \mathbf{y} \rangle = \langle \mathbf{y}, \mathbf{x} \rangle \\ \text{(III)} & \langle \mathbf{x}, \mathbf{x} \rangle \geq 0,\;\; \langle \mathbf{x}, \mathbf{x} \rangle = 0 \iff \mathbf{x} = \mathbf{0} \end{cases}
Für alle x,y,zV\mathbf{x}, \mathbf{y}, \mathbf{z} \in V, αR\alpha \in \mathbb{R}. (I) bilinear, (II) symmetrisch, (III) positiv definit. Wegen der Symmetrie (II) genügt Linearität im ersten Argument.
!!!
Standardskalarprodukt und induzierte Norm
x,y=xTy=xycos(φ),a=a,a\langle \mathbf{x}, \mathbf{y} \rangle = \mathbf{x}^{\mathsf{T}} \mathbf{y} = \lVert \mathbf{x} \rVert \, \lVert \mathbf{y} \rVert \cos(\varphi), \qquad \lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}
φ\varphi ist der Winkel zwischen x\mathbf{x} und y\mathbf{y}. Nicht jede Norm wird von einem Skalarprodukt induziert.
Notation Notation: ⟨u, v⟩
u,v\langle \mathbf{u}, \mathbf{v} \rangle ist das Skalarprodukt der Vektoren u\mathbf{u} und v\mathbf{v}, eine reelle Zahl. Manche Texte schreiben uv\mathbf{u} \cdot \mathbf{v} für das Standardskalarprodukt.
Definition Skalarprodukt
Abbildung ,:V×VR\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}, bilinear, symmetrisch und positiv definit.
Formel Induzierte Norm
a=a,a\lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}

4.4.2 Weitere Skalarprodukte: Matrizen und Funktionen

Geht ein Skalarprodukt auch für Matrizen oder Funktionen? Ja, und genau das macht den abstrakten Begriff so nützlich: Winkel und Orthogonalität lassen sich überall erklären, wo man ein Skalarprodukt hat.

Im Rn\mathbb{R}^n kann man das Standardprodukt mit einer Matrix AA verzerren: x,yA=xTAy\langle \mathbf{x}, \mathbf{y} \rangle_A = \mathbf{x}^{\mathsf{T}} A \mathbf{y}. Das ist genau dann ein Skalarprodukt, wenn AA symmetrisch und positiv definit ist (alle Eigenwerte >0> 0). Für Funktionen aus C[a,b]C[a,b] definiert das Funktionen-Skalarprodukt f,g=abf(t)g(t)dt\langle f, g \rangle = \int_a^b f(t)\,g(t)\,dt einen Winkel zwischen Kurven; man kann es zusätzlich mit einer Gewichtsfunktion versehen, etwa f,g=11f(x)g(x)x2dx\langle f, g \rangle = \int_{-1}^{1} f(x)\,g(x)\,x^2\,dx. Und auf dem Matrizenraum R2×2\mathbb{R}^{2 \times 2} liefert die Spur das Spur-Skalarprodukt A,B=Spur(ABT)\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}}).

All diese Produkte erfüllen dieselben drei Axiome wie das Standardprodukt; nur die konkrete Rechenvorschrift unterscheidet sich. Damit gelten auch alle Folgesätze (Projektion, Cauchy-Schwarz, Pythagoras, Gram-Schmidt) unverändert in jedem dieser Räume.

!!
Drei weitere Skalarprodukte
x,yA=xTAyf,g=abf(t)g(t)dtA,B=Spur(ABT)\begin{aligned} \langle \mathbf{x}, \mathbf{y} \rangle_A &= \mathbf{x}^{\mathsf{T}} A \mathbf{y} \\ \langle f, g \rangle &= \int_a^b f(t)\,g(t)\,dt \\ \langle A, B \rangle &= \operatorname{Spur}(A B^{\mathsf{T}}) \end{aligned}
Matrix-Skalarprodukt (mit symmetrisch positiv definitem AA), Funktionen-Skalarprodukt auf C[a,b]C[a,b], Spur-Skalarprodukt auf Rm×n\mathbb{R}^{m \times n}.
!
Beispiel: matrixgewichtetes Skalarprodukt
A=(2225)x,yA=2x1y12x1y22x2y1+5x2y2\begin{gathered} A = \begin{pmatrix} 2 & -2 \\ -2 & 5 \end{pmatrix} \\ \langle \mathbf{x}, \mathbf{y} \rangle_A = 2 x_1 y_1 - 2 x_1 y_2 - 2 x_2 y_1 + 5 x_2 y_2 \end{gathered}
Ein Skalarprodukt genau dann, wenn die Eigenwerte von AA positiv sind (hier der Fall).
Definition Funktionen-Skalarprodukt
Auf C[a,b]C[a,b]: f,g=abf(t)g(t)dt\langle f, g \rangle = \int_a^b f(t)\,g(t)\,dt. Macht zwei Funktionen orthogonal, wenn das Integral ihres Produkts verschwindet.
Definition Spur-Skalarprodukt
Auf Rm×n\mathbb{R}^{m \times n}: A,B=Spur(ABT)=i,jaijbij\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}}) = \sum_{i,j} a_{ij} b_{ij}. Es gilt A,A=i,jaij20\langle A, A \rangle = \sum_{i,j} a_{ij}^2 \geq 0.
Merke Positiv definit
x,yA=xTAy\langle \mathbf{x}, \mathbf{y} \rangle_A = \mathbf{x}^{\mathsf{T}} A \mathbf{y} ist ein Skalarprodukt     \iff AA symmetrisch und alle Eigenwerte >0> 0.

4.4.3 Orthogonalität, Projektion, Cauchy-Schwarz, Pythagoras

Was heisst „senkrecht" im Vektorraum, und wie projiziert man einen Vektor auf einen anderen? Mit dem Skalarprodukt lässt sich beides sauber fassen, und es gelten dieselben Sätze, die du aus der ebenen Geometrie kennst.

Zwei Vektoren x,y\mathbf{x}, \mathbf{y} heissen orthogonal (Schreibweise xy\mathbf{x} \perp \mathbf{y}), wenn ihr Skalarprodukt verschwindet: x,y=0\langle \mathbf{x}, \mathbf{y} \rangle = 0. Die Orthogonalprojektion von x\mathbf{x} auf einen Vektor y0\mathbf{y} \neq \mathbf{0} ist derjenige Vielfache von y\mathbf{y}, der x\mathbf{x} am nächsten kommt: z=x,yy,yy\mathbf{z} = \dfrac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y}. Sie zerlegt x\mathbf{x} in einen Anteil entlang y\mathbf{y} (das ist z\mathbf{z}) und einen Rest senkrecht dazu. Genau diese Zerlegung steckt später hinter dem Gram-Schmidt-Verfahren.

Zwei klassische Ungleichungen begleiten das Skalarprodukt. Die Cauchy-Schwarz-Ungleichung x,y2x,xy,y\langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \, \langle \mathbf{y}, \mathbf{y} \rangle beschränkt das Skalarprodukt durch die Längen (sie garantiert, dass cos(φ)\cos(\varphi) wirklich zwischen 1-1 und 11 liegt). Und der Satz von Pythagoras gilt für orthogonale Vektoren: x+y2=x2+y2\lVert \mathbf{x} + \mathbf{y} \rVert^2 = \lVert \mathbf{x} \rVert^2 + \lVert \mathbf{y} \rVert^2. Ein Vektor mit Länge 11 heisst Einheitsvektor; jeden Vektor x0\mathbf{x} \neq \mathbf{0} macht man durch Teilen durch seine Länge zu einem solchen.

!!!
Orthogonalität und Orthogonalprojektion
xy    x,y=0,z=x,yy,yy(y0)\mathbf{x} \perp \mathbf{y} \iff \langle \mathbf{x}, \mathbf{y} \rangle = 0, \qquad \mathbf{z} = \frac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y} \quad (\mathbf{y} \neq \mathbf{0})
z\mathbf{z} ist die Projektion von x\mathbf{x} auf die Richtung von y\mathbf{y}.
!!!
Cauchy-Schwarz und Pythagoras (x ⊥ y)
x,y2x,xy,yx+y2=xy2=x2+y2\begin{aligned} & \langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \cdot \langle \mathbf{y}, \mathbf{y} \rangle \\ & \lVert \mathbf{x} + \mathbf{y} \rVert^2 = \lVert \mathbf{x} - \mathbf{y} \rVert^2 = \lVert \mathbf{x} \rVert^2 + \lVert \mathbf{y} \rVert^2 \end{aligned}
Cauchy-Schwarz gilt immer; die Pythagoras-Gleichung nur für orthogonale x,y\mathbf{x}, \mathbf{y}.

Beispiel: Orthogonalprojektion in der Ebene

  1. Schritt 1: Die Vektoren
    Wir projizieren konkret in R2\mathbb{R}^2 mit dem Standardskalarprodukt, damit die Formel greifbar wird.
    Gegeben x=(6,2)T\mathbf{x} = (6, 2)^{\mathsf{T}} und y=(2,1)T\mathbf{y} = (2, 1)^{\mathsf{T}}. Gesucht: die Projektion z\mathbf{z} von x\mathbf{x} auf y\mathbf{y}.
  2. Schritt 2: Skalarprodukte berechnen
    Die Projektionsformel braucht x,y\langle \mathbf{x}, \mathbf{y} \rangle im Zähler und y,y\langle \mathbf{y}, \mathbf{y} \rangle im Nenner.
    Es ist x,y=62+21=14\langle \mathbf{x}, \mathbf{y} \rangle = 6 \cdot 2 + 2 \cdot 1 = 14 und y,y=22+11=5\langle \mathbf{y}, \mathbf{y} \rangle = 2 \cdot 2 + 1 \cdot 1 = 5.
    x,y=14,y,y=5\langle \mathbf{x}, \mathbf{y} \rangle = 14, \qquad \langle \mathbf{y}, \mathbf{y} \rangle = 5
  3. Schritt 3: Einsetzen
    Der Bruch 145\tfrac{14}{5} ist der Streckfaktor, mit dem man y\mathbf{y} skaliert.
    Also:
    z=145(21)=(285145)\mathbf{z} = \frac{14}{5} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} \tfrac{28}{5} \\[2pt] \tfrac{14}{5} \end{pmatrix}
Notation Notation: ⊥
xy\mathbf{x} \perp \mathbf{y} heisst „x\mathbf{x} orthogonal (senkrecht) zu y\mathbf{y}", gleichbedeutend mit x,y=0\langle \mathbf{x}, \mathbf{y} \rangle = 0.
Formel Orthogonalprojektion
z=x,yy,yy\mathbf{z} = \frac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y}
Formel Cauchy-Schwarz
x,y2x,xy,y\langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \langle \mathbf{y}, \mathbf{y} \rangle
Definition Einheitsvektor
Vektor mit x=1\lVert \mathbf{x} \rVert = 1. Aus jedem x0\mathbf{x} \neq \mathbf{0} macht man einen durch x/x\mathbf{x} / \lVert \mathbf{x} \rVert.

4.4.4 Orthonormalbasis: das bequemste Koordinatensystem

Warum ist eine Basis aus lauter senkrechten Einheitsvektoren so angenehm? Stell dir kariertes Papier mit quadratischen Einheitskästchen vor, gegenüber einem schiefen, verzerrten Gitter. Auf dem karierten Papier liest man Koordinaten direkt ab; im schiefen Gitter muss man rechnen. Genau diesen Komfort liefert eine Orthonormalbasis.

Eine Orthonormalbasis (ONB) ist eine Basis aus paarweise orthogonalen Einheitsvektoren: je zwei verschiedene stehen senkrecht aufeinander, und jeder hat Länge 11. Solche Vektoren sind automatisch linear unabhängig und bilden eine Basis. Und zu jeder Basis gibt es eine Orthonormalbasis, die man mit dem Gram-Schmidt-Verfahren (nächster Abschnitt) konstruiert.

Der Hauptvorteil: in einer Orthonormalbasis {e1,,en}\{\mathbf{e}_1, \ldots, \mathbf{e}_n\} sind die Koordinaten eines Vektors einfach seine Skalarprodukte mit den Basisvektoren, xi=x,eix_i = \langle \mathbf{x}, \mathbf{e}_i \rangle. Du musst kein lineares Gleichungssystem mehr lösen, um einen Vektor in der Basis darzustellen; ein Skalarprodukt pro Koordinate genügt. Das ist der Grund, warum man Orthonormalbasen überall bevorzugt, von der Fourier-Analysis bis zur Quantenmechanik.

!!!
Orthonormalbasis
ei,ej={1,i=j0,ijx=i=1nx,eiei\langle \mathbf{e}_i, \mathbf{e}_j \rangle = \begin{cases} 1, & i = j \\ 0, & i \neq j \end{cases} \qquad\Longrightarrow\qquad \mathbf{x} = \sum_{i=1}^{n} \langle \mathbf{x}, \mathbf{e}_i \rangle \, \mathbf{e}_i
Paarweise orthogonale Einheitsvektoren. Die Koordinaten sind dann einfach xi=x,eix_i = \langle \mathbf{x}, \mathbf{e}_i \rangle, kein LGS nötig.
Definition Orthonormalbasis (ONB)
Basis aus paarweise orthogonalen Einheitsvektoren: ei,ej=0\langle \mathbf{e}_i, \mathbf{e}_j \rangle = 0 für iji \neq j und ei=1\lVert \mathbf{e}_i \rVert = 1.
Merke Koordinaten gratis
In einer ONB ist xi=x,eix_i = \langle \mathbf{x}, \mathbf{e}_i \rangle. Kein Gleichungssystem, nur ein Skalarprodukt pro Koordinate.

4.4.5 Gram-Schmidt-Verfahren: das Kochrezept

Wie macht man aus irgendeiner Basis eine Orthonormalbasis? Das Gram-Schmidt-Verfahren ist das Rezept dafür. Die Grundidee in einem Satz: nimm der Reihe nach jeden Basisvektor, ziehe seine Schatten (Projektionen) auf alle schon fertigen Einheitsvektoren ab, und normiere den Rest auf Länge 11.

Das folgende Kochrezept arbeitet die Basis b1,,bn\mathbf{b}_1, \ldots, \mathbf{b}_n Schritt für Schritt ab. In jedem Schritt entsteht zuerst ein unnormierter Zwischenvektor (wir schreiben ihn mit Tilde, e~k\tilde{\mathbf{e}}_k), der senkrecht auf allen vorherigen steht, und danach der fertige Einheitsvektor ek=e~k/e~k\mathbf{e}_k = \tilde{\mathbf{e}}_k / \lVert \tilde{\mathbf{e}}_k \rVert.

Gram-Schmidt: das Kochrezept Schritt für Schritt

  1. Schritt I: ersten Vektor normieren
    Der erste Basisvektor gibt schon die erste Richtung vor; er muss nur auf Länge 11 gebracht werden.
    Teile b1\mathbf{b}_1 durch seine Länge:
    e1=b1b1\mathbf{e}_1 = \frac{\mathbf{b}_1}{\lVert \mathbf{b}_1 \rVert}
  2. Schritt II: zweiten Vektor senkrecht machen, dann normieren
    Von b2\mathbf{b}_2 ziehen wir den Anteil entlang e1\mathbf{e}_1 ab (seinen Schatten), damit der Rest senkrecht auf e1\mathbf{e}_1 steht.
    Zwischenvektor bilden, dann normieren:
    e~2=b2b2,e1e1,e2=e~2e~2\tilde{\mathbf{e}}_2 = \mathbf{b}_2 - \langle \mathbf{b}_2, \mathbf{e}_1 \rangle\,\mathbf{e}_1, \qquad \mathbf{e}_2 = \frac{\tilde{\mathbf{e}}_2}{\lVert \tilde{\mathbf{e}}_2 \rVert}
  3. Schritt III: dritten Vektor von zwei Schatten befreien
    Nun gibt es schon zwei fertige Richtungen e1,e2\mathbf{e}_1, \mathbf{e}_2; beide Schatten von b3\mathbf{b}_3 werden abgezogen.
    Wieder Zwischenvektor, dann normieren:
    e~3=b3b3,e1e1b3,e2e2e3=e~3e~3\begin{aligned} \tilde{\mathbf{e}}_3 &= \mathbf{b}_3 - \langle \mathbf{b}_3, \mathbf{e}_1 \rangle\,\mathbf{e}_1 - \langle \mathbf{b}_3, \mathbf{e}_2 \rangle\,\mathbf{e}_2 \\ \mathbf{e}_3 &= \frac{\tilde{\mathbf{e}}_3}{\lVert \tilde{\mathbf{e}}_3 \rVert} \end{aligned}
  4. Schritt IV: allgemeiner Schritt k
    Das Muster setzt sich fort: ziehe von bk\mathbf{b}_k alle Schatten auf die bereits fertigen e1,,ek1\mathbf{e}_1, \ldots, \mathbf{e}_{k-1} ab, dann normiere.
    So bis k=nk = n, am Ende steht die Orthonormalbasis {e1,,en}\{\mathbf{e}_1, \ldots, \mathbf{e}_n\}:
    e~k=bkj=1k1bk,ejejek=e~ke~k\begin{aligned} \tilde{\mathbf{e}}_k &= \mathbf{b}_k - \sum_{j=1}^{k-1} \langle \mathbf{b}_k, \mathbf{e}_j \rangle\,\mathbf{e}_j \\ \mathbf{e}_k &= \frac{\tilde{\mathbf{e}}_k}{\lVert \tilde{\mathbf{e}}_k \rVert} \end{aligned}
Formel Gram-Schmidt (allgemeiner Schritt)
e~k=bkj<kbk,ejej\begin{aligned} \tilde{\mathbf{e}}_k = \mathbf{b}_k - {} \\ \sum_{j<k} \langle \mathbf{b}_k, \mathbf{e}_j \rangle \mathbf{e}_j \end{aligned}
Merke Merksatz
Subtrahiere die Schatten auf alle fertigen ej\mathbf{e}_j, normiere den Rest. Immer mit dem normierten ej\mathbf{e}_j rechnen.
Notation Notation: ẽₖ
e~k\tilde{\mathbf{e}}_k ist der unnormierte Zwischenvektor (senkrecht auf den vorherigen). Erst ek=e~k/e~k\mathbf{e}_k = \tilde{\mathbf{e}}_k / \lVert \tilde{\mathbf{e}}_k \rVert ist der fertige Einheitsvektor.

4.4.6 Durchgerechnete Beispiele

Wie läuft Gram-Schmidt an echten Zahlen ab? Hier zwei vollständig durchgerechnete Beispiele, eines im R3\mathbb{R}^3 mit dem Standardskalarprodukt, eines auf einem Polynomraum mit einem Integral-Skalarprodukt. Beide folgen exakt dem Kochrezept aus dem vorigen Abschnitt; nur die Rechenvorschrift für ,\langle \cdot, \cdot \rangle und \lVert \cdot \rVert ändert sich.

Beispiel 1: Gram-Schmidt im ℝ³ (Standardskalarprodukt)

  1. Schritt 1: Ausgangsbasis
    Drei linear unabhängige Vektoren, die wir orthonormalisieren. Skalarprodukt und Norm sind die Standard-Varianten.
    Gegeben:
    a1=(1,1,0)Ta2=(1,2,1)Ta3=(1,0,1)T\begin{aligned} \mathbf{a}_1 &= (-1,\, 1,\, 0)^{\mathsf{T}} \\ \mathbf{a}_2 &= (1,\, -2,\, 1)^{\mathsf{T}} \\ \mathbf{a}_3 &= (1,\, 0,\, 1)^{\mathsf{T}} \end{aligned}
  2. Schritt 2: erster Einheitsvektor
    Normiere a1\mathbf{a}_1. Es ist a1=1+1+0=2\lVert \mathbf{a}_1 \rVert = \sqrt{1 + 1 + 0} = \sqrt{2}.
    Also:
    e1=12(110)\mathbf{e}_1 = \frac{1}{\sqrt{2}} \begin{pmatrix} -1 \\ 1 \\ 0 \end{pmatrix}
  3. Schritt 3: zweiter Vektor, Schatten abziehen
    Bilde e~2=a2a2,e1e1\tilde{\mathbf{e}}_2 = \mathbf{a}_2 - \langle \mathbf{a}_2, \mathbf{e}_1 \rangle\,\mathbf{e}_1. Hier ist a2,e1=32\langle \mathbf{a}_2, \mathbf{e}_1 \rangle = -\tfrac{3}{\sqrt{2}}.
    Nach dem Abziehen entsteht der Zwischenvektor:
    e~2=(12121),e~2=14+14+1=32\tilde{\mathbf{e}}_2 = \begin{pmatrix} -\tfrac{1}{2} \\[2pt] -\tfrac{1}{2} \\[2pt] 1 \end{pmatrix}, \qquad \lVert \tilde{\mathbf{e}}_2 \rVert = \sqrt{\tfrac{1}{4} + \tfrac{1}{4} + 1} = \sqrt{\tfrac{3}{2}}
  4. Schritt 4: zweiter Einheitsvektor
    Normieren mit dem Faktor 1/e~2=231 / \lVert \tilde{\mathbf{e}}_2 \rVert = \sqrt{\tfrac{2}{3}}.
    Ergebnis:
    e2=23(12121)\mathbf{e}_2 = \sqrt{\tfrac{2}{3}} \begin{pmatrix} -\tfrac{1}{2} \\[2pt] -\tfrac{1}{2} \\[2pt] 1 \end{pmatrix}
  5. Schritt 5: dritter Vektor und Schluss
    Ziehe von a3\mathbf{a}_3 beide Schatten ab und normiere. Der Zwischenvektor wird e~3=(23,23,23)T\tilde{\mathbf{e}}_3 = (\tfrac{2}{3}, \tfrac{2}{3}, \tfrac{2}{3})^{\mathsf{T}}.
    Nach dem Normieren erhält man den letzten Basisvektor:
    e3=13(111)\mathbf{e}_3 = \frac{1}{\sqrt{3}} \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}
!
Ergebnis Beispiel 1: die Orthonormalbasis
e1=12(1,1,0)Te2=23(12,12,1)Te3=13(1,1,1)T\begin{aligned} \mathbf{e}_1 &= \tfrac{1}{\sqrt{2}}\,(-1,\, 1,\, 0)^{\mathsf{T}} \\ \mathbf{e}_2 &= \sqrt{\tfrac{2}{3}}\,(-\tfrac{1}{2},\, -\tfrac{1}{2},\, 1)^{\mathsf{T}} \\ \mathbf{e}_3 &= \tfrac{1}{\sqrt{3}}\,(1,\, 1,\, 1)^{\mathsf{T}} \end{aligned}
Probe: alle drei haben Länge 11 und stehen paarweise senkrecht.

Beispiel 2: Gram-Schmidt auf P₄ (Integral-Skalarprodukt)

  1. Schritt 1: Skalarprodukt und Bausteine
    Hier sind die Vektoren Polynome, und das Skalarprodukt ist ein Integral. Wir orthonormalisieren span{1,3x4}\operatorname{span}\{1, 3x^4\}.
    Mit p,q=01p(x)q(x)dx\langle p, q \rangle = \int_0^1 p(x)\,q(x)\,dx und den Bausteinen w1=1w_1 = 1, w2=3x4w_2 = 3x^4.
    p,q=01p(x)q(x)dx,w1=1,w2=3x4\langle p, q \rangle = \int_0^1 p(x)\,q(x)\,dx, \qquad w_1 = 1, \quad w_2 = 3x^4
  2. Schritt 2: erster Einheitsvektor
    Normiere w1=1w_1 = 1. Es ist 1,1=011dx=1\langle 1, 1 \rangle = \int_0^1 1\,dx = 1, also w1=1\lVert w_1 \rVert = 1.
    Das erste Polynom ist schon normiert:
    e1=1e_1 = 1
  3. Schritt 3: zweiten Vektor senkrecht machen
    Ziehe den Schatten von w2w_2 auf e1e_1 ab. Es ist 3x4,1=013x4dx=35\langle 3x^4, 1 \rangle = \int_0^1 3x^4\,dx = \tfrac{3}{5}.
    Der unnormierte Zwischenvektor:
    e~2=3x435\tilde{e}_2 = 3x^4 - \tfrac{3}{5}
  4. Schritt 4: Norm des Zwischenvektors
    Für die Normierung braucht man e~2=e~2,e~2\lVert \tilde{e}_2 \rVert = \sqrt{\langle \tilde{e}_2, \tilde{e}_2 \rangle}.
    Man rechnet e~2,e~2=01(3x435)2dx=1625\langle \tilde{e}_2, \tilde{e}_2 \rangle = \int_0^1 \left( 3x^4 - \tfrac{3}{5} \right)^2 dx = \tfrac{16}{25}, also e~2=45\lVert \tilde{e}_2 \rVert = \tfrac{4}{5}.
    e~2,e~2=1625    e~2=45\langle \tilde{e}_2, \tilde{e}_2 \rangle = \tfrac{16}{25} \;\Rightarrow\; \lVert \tilde{e}_2 \rVert = \tfrac{4}{5}
  5. Schritt 5: normieren, Schluss
    Teile e~2\tilde{e}_2 durch 45\tfrac{4}{5}, also multipliziere mit 54\tfrac{5}{4}.
    Man erhält den zweiten Einheitsvektor:
    e2=e~2e~2=54(3x435)=154x434e_2 = \frac{\tilde{e}_2}{\lVert \tilde{e}_2 \rVert} = \tfrac{5}{4}\left( 3x^4 - \tfrac{3}{5} \right) = \tfrac{15}{4}x^4 - \tfrac{3}{4}

Auch auf dem Matrizenraum R2×2\mathbb{R}^{2 \times 2} läuft das Verfahren identisch, mit dem Spur-Skalarprodukt A,B=Spur(ABT)\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}}). Orthonormalisiert man dort die Basis der symmetrischen Matrizen B1=(1110)B_1 = \bigl(\begin{smallmatrix} 1 & 1 \\ 1 & 0 \end{smallmatrix}\bigr), B2=(1110)B_2 = \bigl(\begin{smallmatrix} 1 & -1 \\ -1 & 0 \end{smallmatrix}\bigr), B3=(0111)B_3 = \bigl(\begin{smallmatrix} 0 & 1 \\ 1 & 1 \end{smallmatrix}\bigr), so erhält man B~1=13B1\tilde{B}_1 = \tfrac{1}{\sqrt{3}} B_1, B~2=16(2110)\tilde{B}_2 = \tfrac{1}{\sqrt{6}} \bigl(\begin{smallmatrix} 2 & -1 \\ -1 & 0 \end{smallmatrix}\bigr) und B~3=(0001)\tilde{B}_3 = \bigl(\begin{smallmatrix} 0 & 0 \\ 0 & 1 \end{smallmatrix}\bigr). Will man diese ONB des Unterraums der symmetrischen Matrizen zu einer ONB des ganzen R2×2\mathbb{R}^{2 \times 2} ergänzen, fügt man eine normierte schiefsymmetrische Matrix hinzu, etwa B~4=12(0110)\tilde{B}_4 = \tfrac{1}{\sqrt{2}} \bigl(\begin{smallmatrix} 0 & 1 \\ -1 & 0 \end{smallmatrix}\bigr); sie steht automatisch senkrecht auf allen symmetrischen Matrizen.

Formel ONB aus Beispiel 1
e1=12(1,1,0)Te3=13(1,1,1)T\begin{aligned} \mathbf{e}_1 &= \tfrac{1}{\sqrt{2}}(-1,1,0)^{\mathsf{T}} \\ \mathbf{e}_3 &= \tfrac{1}{\sqrt{3}}(1,1,1)^{\mathsf{T}} \end{aligned}
Formel ONB aus Beispiel 2
e1=1,e2=154x434e_1 = 1, \qquad e_2 = \tfrac{15}{4}x^4 - \tfrac{3}{4}
Merke Spur-Eigenschaften
Spur(AB)=Spur(BA)\operatorname{Spur}(AB) = \operatorname{Spur}(BA) und Spur(AT)=Spur(A)\operatorname{Spur}(A^{\mathsf{T}}) = \operatorname{Spur}(A). Damit ist A,A=aij20\langle A, A \rangle = \sum a_{ij}^2 \geq 0.

Aufgaben mit Musterlösungen

Übungsaufgaben mit ausführlichen Musterlösungen werden hier ergänzt. Bis dahin lohnt es sich, die durchgerechneten Beispiele in den Abschnitten 4.2, 4.4.3 und 4.4.6 selbst nachzurechnen: das Unterraum-Kriterium an einer eigenen Teilmenge prüfen, eine Orthogonalprojektion bilden und eine kleine Basis mit Gram-Schmidt orthonormalisieren.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!
Variablen-Glossar (10 Einträge)
VV ein Vektorraum (Menge mit Addition und Skalarmultiplikation) -
UU ein Unterraum von V -
0\mathbf{0} der Nullvektor von V (in manchen Texten O geschrieben) -
α,β\alpha, \beta Skalare aus ℝ -
span{}\operatorname{span}\{\ldots\} die lineare Hülle, der von Vektoren erzeugte Unterraum -
[x]B[\mathbf{x}]_B Koordinatenvektor von x bezüglich der Basis B -
v\lVert \mathbf{v} \rVert Norm (Länge) des Vektors v -
u,v\langle \mathbf{u}, \mathbf{v} \rangle Skalarprodukt von u und v -
xy\mathbf{x} \perp \mathbf{y} x und y sind orthogonal (senkrecht) -
PnP_n Vektorraum der Polynome vom Grad höchstens n -