Kap. 4: Vektorräume — STEM Animations

4.1Definition

4.1.1 Was ist ein Vektorraum? Erst das Bild, dann die Regeln

Was haben Pfeile in der Ebene, Polynome wie $3x^2 - 2x + 1$ und $2 \times 2$ -Matrizen gemeinsam? Auf den ersten Blick nichts. Doch mit allen dreien darf man dasselbe tun: man kann zwei davon addieren und man kann eins mit einer Zahl strecken. Genau diese zwei Fähigkeiten machen aus einer Menge einen Vektorraum.

Halten wir das anschaulichste Beispiel fest, das du schon kennst: die Ebene $\mathbb{R}^2$ . Ein Element ist ein Pfeil vom Ursprung zu einem Punkt $(x_1, x_2)$ . Zwei Pfeile addierst du, indem du sie aneinanderhängst (Spitze an Schaft). Einen Pfeil streckst du, indem du seine Länge mit einer Zahl $\alpha$ multiplizierst; ist $\alpha$ negativ, dreht er um. Beide Ergebnisse sind wieder Pfeile in der Ebene. Diese Abgeschlossenheit ist der ganze Kern der Idee.

Ein Vektorraum $V$ ist also eine Menge von Objekten, die wir Vektoren nennen, zusammen mit zwei Rechenoperationen: einer Addition $+$ (kombiniert zwei Vektoren zu einem dritten) und einer Skalarmultiplikation $\cdot$ (kombiniert eine Zahl $\alpha$ mit einem Vektor). Damit das Rechnen sich vernünftig verhält, müssen diese Operationen acht Regeln erfüllen, die wir gleich anschauen. Die Skalare nehmen wir aus den reellen Zahlen $\mathbb{R}$ ; allgemein dürfen sie aus einem Körper $K$ kommen (etwa $\mathbb{R}$ oder $\mathbb{C}$ ). In Worten: ein Vektorraum ist eine Spielwiese, auf der Addieren und Strecken erlaubt sind und nie aus der Wiese hinausführen.

Die zwei Operationen eines Vektorraums

\begin{aligned} &\oplus : V \times V \to V, && (\mathbf{a}, \mathbf{b}) \mapsto \mathbf{a} \oplus \mathbf{b} \\ &\odot : K \times V \to V, && (\alpha, \mathbf{a}) \mapsto \alpha \odot \mathbf{a} \end{aligned}

\oplus

heisst innere Operation (Addition),

\odot

heisst äussere Operation (Skalarmultiplikation). Meist schreibt man schlicht

+

und

\cdot

K

ist der Skalarkörper, bei uns

\mathbb{R}

Notation Notation: ⊕ und ⊙

\oplus

ist die innere Operation (Addition zweier Vektoren),

\odot

die äussere Operation (Skalar mal Vektor). Die abstrakten Symbole betonen, dass es nicht die gewohnte Zahlenaddition sein muss. Ab hier schreiben wir einfach

+

und

\cdot

Notation Notation: K

K

ist der Skalarkörper, aus dem die Streckfaktoren stammen. Bei uns durchweg

K = \mathbb{R}

(reeller Vektorraum); allgemein auch

\mathbb{C}

Merke Bild im Kopf
Ein Schuhkarton voller Objekte, für die Addition und Skalierung Sinn ergeben und nie aus dem Karton herausführen.

4.1.2 Die acht Axiome eines Vektorraums

Welche Regeln muss das Addieren und Strecken genau erfüllen? Es sind acht Stück, und keine davon ist überraschend: jede ist eine Rechenregel, die du beim Vektorrechnen längst unbewusst benutzt. Wir gruppieren sie nach den zwei Operationen. Die ersten vier (A1 bis A4) betreffen nur die Addition, die letzten drei (M1 bis M3) die Skalarmultiplikation. Achtung: M2 fasst zwei Distributivgesetze in einer Zeile zusammen, deshalb sind es insgesamt acht Einzelregeln, nicht sieben.

!!!

Axiome der Addition (A1 bis A4)

\begin{aligned} \text{(A1)} \quad & \mathbf{u} + \mathbf{w} = \mathbf{w} + \mathbf{u} \\ \text{(A2)} \quad & (\mathbf{u} + \mathbf{w}) + \mathbf{v} = \mathbf{u} + (\mathbf{w} + \mathbf{v}) \\ \text{(A3)} \quad & \exists\, \mathbf{0} \in V \;\text{mit}\; \mathbf{u} + \mathbf{0} = \mathbf{u} \\ \text{(A4)} \quad & \forall\, \mathbf{u}\; \exists\, (-\mathbf{u}) \;\text{mit}\; \mathbf{u} + (-\mathbf{u}) = \mathbf{0} \end{aligned}

Alles für alle

\mathbf{u}, \mathbf{v}, \mathbf{w} \in V

. (A1) Kommutativität, (A2) Assoziativität, (A3) Nullvektor (neutrales Element), (A4) inverses Element (Gegenvektor zu jedem

\mathbf{u}

!!!

Axiome der Skalarmultiplikation (M1 bis M3)

\begin{aligned} \text{(M1)} \quad & (\alpha \cdot \beta) \cdot \mathbf{u} = \alpha \cdot (\beta \cdot \mathbf{u}) \\ \text{(M2)} \quad & (\alpha + \beta) \cdot \mathbf{u} = \alpha \cdot \mathbf{u} + \beta \cdot \mathbf{u} \\ & \alpha \cdot (\mathbf{u} + \mathbf{w}) = \alpha \cdot \mathbf{u} + \alpha \cdot \mathbf{w} \\ \text{(M3)} \quad & 1 \cdot \mathbf{u} = \mathbf{u} \end{aligned}

Für alle

\alpha, \beta \in \mathbb{R}

und

\mathbf{u}, \mathbf{w} \in V

. (M1) Assoziativität, (M2) Distributivität (zwei Gesetze: Skalar über eine Summe von Skalaren, dann über eine Summe von Vektoren), (M3) Neutralität der Eins.

Definition Vektorraum
Menge

V

mit Addition

+

und Skalarmultiplikation

\cdot

, die die acht Axiome A1 bis A4 (Addition) und M1 bis M3 (Skalarmultiplikation) erfüllt. Die Elemente heissen Vektoren.

Notation Notation: 0 (Nullvektor)

\mathbf{0}

bezeichnet den Nullvektor aus A3. Manche Texte schreiben dafür

O

. Er ist nicht zwingend die Zahl

0

, sondern das neutrale Element der Addition in diesem

V

Merke Acht, nicht sieben
M2 bündelt zwei Distributivgesetze in einer Zeile. Insgesamt sind es acht Einzelregeln.

4.1.3 Beispiele: ℝⁿ, Matrizen, Polynome, Funktionen

Was ist alles ein Vektorraum? Sobald eine Menge mit sinnvoller Addition und Skalarmultiplikation ausgestattet ist und die acht Axiome erfüllt, ist sie einer. Hier sind die Standardbeispiele, die in jeder Prüfung auftauchen. Verschiedene Sprachen, gleiche Grammatik.

Der wichtigste ist der $\mathbb{R}^n$ : alle Spaltenvektoren mit $n$ reellen Einträgen. Daneben der $\mathbb{C}^n$ mit komplexen Einträgen und der Raum $\mathbb{R}^{m \times n}$ aller reellen $m \times n$ -Matrizen (komponentenweise addiert und gestreckt). Spannender wird es bei $P_n$ , dem Raum aller Polynome vom Grad höchstens $n$ : zwei Polynome addiert man koeffizientenweise, und mit einer Zahl multiplizieren ändert nichts am Grad. Ein Polynom ist also ein Vektor, sobald man $+$ und $\cdot$ darauf erklärt.

Funktionen liefern die letzten Beispiele: $C[a,b]$ sind die auf dem Intervall $[a,b]$ stetigen Funktionen, $C^1[a,b]$ die zusätzlich einmal stetig differenzierbaren. Auch sie bilden Vektorräume, denn die Summe zweier stetiger Funktionen ist stetig und ein Vielfaches ebenso. Ein Sonderfall: der Raum $P$ aller Polynome (ohne Gradschranke) ist unendlichdimensional; er besitzt kein endliches Erzeugendensystem, weil man für beliebig hohe Grade immer neue Bausteine braucht.

Der Vektorraum ℝⁿ

\mathbb{R}^n = \left\{ \mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{pmatrix} : x_1, x_2, \ldots, x_n \in \mathbb{R} \right\}

Analog

\mathbb{C}^n

mit Einträgen aus

\mathbb{C}

und

\mathbb{R}^{m \times n}

als Menge aller reellen

m \times n

-Matrizen.

Vektorraum	Elemente	Dimension
$\mathbb{R}^n$	Spaltenvektoren mit $n$ reellen Einträgen	$n$
$\mathbb{R}^{m \times n}$	reelle $m \times n$ -Matrizen	$m \cdot n$
$P_n$	Polynome vom Grad $\leq n$	$n + 1$
$P$	alle Polynome (jeder Grad)	$\infty$
$C[a,b]$	stetige Funktionen auf $[a,b]$	$\infty$

Standard-Vektorräume auf einen Blick

Definition Pₙ (Polynomraum)

P_n = \{

Polynome vom Grad höchstens

n \}

, also

a_0 + a_1 x + \cdots + a_n x^n

. Vektorraum der Dimension

n + 1

Definition C[a,b], C¹[a,b]

C[a,b]

: auf

[a,b]

stetige Funktionen.

C^1[a,b]

: zusätzlich einmal stetig differenzierbar. Beide sind unendlichdimensionale Vektorräume.

Querverweis Verweise
→ Kap. 1: ℝⁿ als Spaltenvektoren

4.2Struktur

4.2.1 Unterraum: ein Vektorraum im Vektorraum

Wann ist eine Teilmenge eines Vektorraums selbst wieder ein Vektorraum? Stell dir den $\mathbb{R}^3$ vor und darin eine Ebene durch den Ursprung. Addierst du zwei Vektoren aus dieser Ebene, landest du wieder in der Ebene; streckst du einen, ebenso. Die Ebene ist ein Vektorraum im Vektorraum. Eine verschobene Ebene (die nicht durch den Ursprung geht) dagegen nicht: dort führt schon das Verdoppeln eines Vektors hinaus.

Eine nichtleere Teilmenge $U$ von $V$ heisst Unterraum, falls sie unter beiden Operationen abgeschlossen ist: (a) die Summe zweier Elemente von $U$ liegt wieder in $U$ , und (b) ein Vielfaches eines Elements von $U$ liegt wieder in $U$ . Mehr braucht man nicht zu prüfen; die acht Axiome erbt $U$ automatisch von $V$ . In Worten: ein Unterraum ist eine Teilmenge, aus der man durch Addieren und Strecken nicht herauskommt.

Zwei Folgerungen sind sofort wichtig. Erstens: jeder Unterraum enthält den Nullvektor (setze in (b) den Faktor $\alpha = 0$ ). Das liefert einen blitzschnellen Test. Zweitens: $\{\mathbf{0}\}$ und $V$ selbst sind immer Unterräume von $V$ (die beiden „trivialen" Fälle).

!!!

Unterraum-Kriterium

\begin{aligned} \text{(a)} \quad & \forall\, \mathbf{a}, \mathbf{b} \in U:\; \mathbf{a} + \mathbf{b} \in U \\ \text{(b)} \quad & \forall\, \mathbf{a} \in U,\, \alpha \in \mathbb{R}:\; \alpha \cdot \mathbf{a} \in U \end{aligned}

U \neq \emptyset

vorausgesetzt. Aus (b) mit

\alpha = 0

folgt

\mathbf{0} \in U

Beispiel: Ist der Lösungsraum von Ax = 0 ein Unterraum?

Schritt 1: Was ist die Menge?

Wir nehmen $V = \mathbb{R}^n$ und eine $n \times n$ -Matrix $A$ . Betrachtet wird die Lösungsmenge des homogenen Systems.

Also $U = \{ \mathbf{x} \in \mathbb{R}^n : A\mathbf{x} = \mathbf{0} \}$ . Wir prüfen die zwei Bedingungen.

$U = \{ \mathbf{x} \in \mathbb{R}^n : A\mathbf{x} = \mathbf{0} \}$
Schritt 2: Bedingung (a), Abgeschlossenheit unter Addition

Seien $\mathbf{a}, \mathbf{b}$ zwei Lösungen, also $A\mathbf{a} = \mathbf{0}$ und $A\mathbf{b} = \mathbf{0}$ . Ist $\mathbf{a} + \mathbf{b}$ wieder eine Lösung?

Wegen der Linearität der Matrixmultiplikation:

$A(\mathbf{a} + \mathbf{b}) = A\mathbf{a} + A\mathbf{b} = \mathbf{0} + \mathbf{0} = \mathbf{0}$
Schritt 3: Bedingung (b), Abgeschlossenheit unter Skalierung

Sei $\mathbf{a}$ eine Lösung und $\alpha \in \mathbb{R}$ . Ist $\alpha \mathbf{a}$ wieder eine Lösung?

Wieder mit der Linearität:

$A(\alpha \cdot \mathbf{a}) = \alpha \cdot A\mathbf{a} = \alpha \cdot \mathbf{0} = \mathbf{0}$
Schritt 4: Schluss

Beide Bedingungen sind erfüllt, und $\mathbf{0}$ liegt in $U$ (denn $A\mathbf{0} = \mathbf{0}$ ).

Also ist der Lösungsraum von $A\mathbf{x} = \mathbf{0}$ ein Unterraum von $\mathbb{R}^n$ . Dieser Unterraum hat einen Namen: der Kern von $A$ .

Definition Unterraum
Nichtleere Teilmenge

U \subseteq V

, die unter Addition (a) und Skalarmultiplikation (b) abgeschlossen ist. Ein Unterraum ist selbst ein Vektorraum und enthält stets

\mathbf{0}

Merke Schnelltest

\mathbf{0} \notin U \;\Rightarrow\; U

ist kein Unterraum. Spart oft die ganze Rechnung.

Querverweis Verweise
→ Kap. 1: Kern als Lösungsraum

4.2.2 Durchschnitt und Summe von Unterräumen

Wenn du zwei Unterräume $U_1$ und $U_2$ desselben $V$ hast, wie kombinierst du sie zu einem neuen? Es gibt zwei natürliche Wege, und beide ergeben wieder einen Unterraum.

Der Durchschnitt $U_1 \cap U_2$ besteht aus allen Vektoren, die in beiden Räumen liegen. Anschaulich: die gemeinsamen Vektoren. Die Summe $U_1 + U_2$ besteht aus allen Vektoren, die sich als $\mathbf{u}_1 + \mathbf{u}_2$ mit $\mathbf{u}_1 \in U_1$ und $\mathbf{u}_2 \in U_2$ schreiben lassen. Anschaulich: alles, was man durch Kombinieren je eines Vektors aus jedem Raum erreichen kann.

Vorsicht beim Wort „Summe": $U_1 + U_2$ ist nicht etwa nur die Vereinigung der beiden Mengen. Die blosse Vereinigung wäre meist gar kein Unterraum (Summen über die Grenze hinweg fehlen). Erst indem man alle Summen $\mathbf{u}_1 + \mathbf{u}_2$ zulässt, wird die Menge abgeschlossen und damit ein Unterraum.

Durchschnitt und Summe (beide Unterräume von V)

\begin{aligned} U_1 \cap U_2 &= \{ \mathbf{u} \in V : \mathbf{u} \in U_1 \text{ und } \mathbf{u} \in U_2 \} \\ U_1 + U_2 &= \{ \mathbf{u}_1 + \mathbf{u}_2 : \mathbf{u}_1 \in U_1,\, \mathbf{u}_2 \in U_2 \} \end{aligned}

Beide Konstruktionen liefern wieder einen Unterraum von

V

Formel Durchschnitt

U_1 \cap U_2 = \{ \mathbf{u} : \mathbf{u} \in U_1 \wedge \mathbf{u} \in U_2 \}

Formel Summe

U_1 + U_2 = \{ \mathbf{u}_1 + \mathbf{u}_2 : \mathbf{u}_i \in U_i \}

Merke Nicht die Vereinigung

U_1 \cup U_2

ist im Allgemeinen kein Unterraum. Erst die Summe

U_1 + U_2

ist abgeschlossen.

4.2.3 Linearkombination und Span

Welche Vektoren kannst du aus gegebenen bauen, wenn du nur addieren und strecken darfst? Genau diese Frage beantworten Linearkombination und Span.

Eine Linearkombination der Vektoren $\mathbf{v}_1, \ldots, \mathbf{v}_n$ ist jeder Vektor der Form $a_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + \cdots + a_n \mathbf{v}_n$ mit Skalaren $a_i \in \mathbb{R}$ . Du gewichtest also jeden Baustein mit einer Zahl und summierst. Die Menge aller dieser Kombinationen heisst Span (oder lineare Hülle, oder erzeugter Unterraum): $\operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\}$ . Anschaulich: zwei Richtungspfeile im Raum spannen eine Ebene auf, drei unabhängige spannen den ganzen $\mathbb{R}^3$ .

Wie prüft man, ob ein bestimmter Vektor $\mathbf{w}$ im Span liegt? Man schreibt die $\mathbf{v}_i$ als Spalten in eine Matrix $V = (\mathbf{v}_1, \ldots, \mathbf{v}_n)$ und fragt, ob das lineare Gleichungssystem $V\mathbf{x} = \mathbf{w}$ lösbar ist. Hat es eine Lösung $\mathbf{x}$ , so sind die Komponenten von $\mathbf{x}$ genau die gesuchten Gewichte, und $\mathbf{w}$ ist eine Linearkombination der $\mathbf{v}_i$ . So wird die Span-Frage zu einer Gauss-Rechnung, die du schon beherrschst.

Linearkombination

\begin{aligned} \mathbf{v} &= \sum_{i=1}^{n} a_i \, \mathbf{v}_i = a_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + \cdots + a_n \mathbf{v}_n \\ & \text{mit } a_1, \ldots, a_n \in \mathbb{R} \end{aligned}

Die

a_i

heissen Koeffizienten oder Gewichte der Kombination.

!!!

Span (erzeugter Unterraum) und Lösbarkeitstest

\begin{aligned} \operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\} &= \left\{ \sum_{i=1}^{n} a_i \mathbf{v}_i : a_i \in \mathbb{R} \right\} \\ \mathbf{w} \in \operatorname{span} &\iff V\mathbf{x} = \mathbf{w} \text{ lösbar} \end{aligned}

V = (\mathbf{v}_1, \ldots, \mathbf{v}_n)

ist die Matrix mit den

\mathbf{v}_i

als Spalten.

Beispiel: Polynome spannen P₃ auf

Schritt 1: Die Bausteine und das Ziel

Wir prüfen eine Span-Aussage in einem Polynomraum statt im $\mathbb{R}^n$ . Das zeigt, dass „Span" überall gleich funktioniert.

Gegeben die Polynome $p_1 = x^3 + x^2$ , $p_2 = x^2 - 2x - 4$ , $p_3 = 3x + 4$ , $p_4 = 2x + 3$ . Behauptung: $\operatorname{span}\{p_1, p_2, p_3, p_4\} = P_3$ .
Schritt 2: Was heisst „= P₃"?

$P_3$ wird von $1, x, x^2, x^3$ erzeugt. Wenn wir diese vier Monome aus unseren $p_i$ bauen können, können wir jedes Polynom vom Grad $\leq 3$ bauen.

Es genügt also, $1, x, x^2, x^3$ als Linearkombination der $p_i$ darzustellen.
Schritt 3: Koeffizientenvergleich

Durch Vergleichen der Koeffizienten gleicher Potenzen löst man jedes Monom auf.

Man findet (nachrechnen lohnt sich):

$\begin{aligned} 1 &= 3p_4 - 2p_3 \\ x &= 3p_3 - 4p_4 \\ x^2 &= p_2 + 4p_4 - 2p_3 \\ x^3 &= p_1 - p_2 - 4p_4 + 2p_3 \end{aligned}$
Schritt 4: Schluss

Alle vier Monome sind darstellbar, also auch jede ihrer Kombinationen.

Damit ist $\operatorname{span}\{p_1, p_2, p_3, p_4\} = P_3$ . Beachte: das Monom $x^4$ liesse sich nie bauen, weil alle $p_i$ höchstens Grad $3$ haben; die vier Polynome erzeugen $P_4$ also nicht.

Definition Span / erzeugter Unterraum

\operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\}

ist die Menge aller Linearkombinationen der

\mathbf{v}_i

. Stets ein Unterraum von

V

Querverweis Verweise
→ Kap. 1: Spaltensicht (b im Span der Spalten)
→ Kap. 1: Bild = Span der Spalten

4.2.4 Lineare Unabhängigkeit anschaulich

Wann ist ein Vektor in einer Sammlung überflüssig? Anschaulich dann, wenn er keine neue Richtung beiträgt, weil er sich schon aus den anderen zusammenbauen lässt. In der Ebene heisst linear unabhängig: keine zwei Vektoren zeigen in dieselbe Richtung (keiner ist ein Vielfaches des anderen). Im Raum heisst es: die Vektoren liegen nicht alle in einer gemeinsamen Ebene. Sobald einer „in der Spur" der anderen liegt, sind sie abhängig.

Die saubere Definition macht aus „keine Richtung doppelt" eine Gleichung: $\mathbf{v}_1, \ldots, \mathbf{v}_n$ heissen linear unabhängig, wenn das homogene System $\sum_{i} x_i \mathbf{v}_i = \mathbf{0}$ nur die triviale Lösung $x_1 = \cdots = x_n = 0$ besitzt. Gibt es eine andere Lösung (mit mindestens einem $x_i \neq 0$ ), so heissen sie linear abhängig; dann lässt sich ein Vektor durch die anderen ausdrücken. In Worten: unabhängig bedeutet, dass die einzige Art, den Nullvektor zu kombinieren, das Nichtstun ist.

Das verbindet sich direkt mit Kapitel 1: $\sum_i x_i \mathbf{v}_i = \mathbf{0}$ ist $V\mathbf{x} = \mathbf{0}$ mit der Spaltenmatrix $V$ . Nur die triviale Lösung bedeutet trivialer Kern, und das bedeutet voller Spaltenrang. So gilt das Rang-Kriterium: $\operatorname{rang}(V) = n$ (volle Spaltenzahl) ist gleichbedeutend mit linearer Unabhängigkeit der $n$ Spalten.

!!!

Definition lineare Unabhängigkeit

\begin{aligned} & \mathbf{v}_1, \ldots, \mathbf{v}_n \text{ linear unabhängig} \\ \iff\; & \sum_{i=1}^{n} x_i \, \mathbf{v}_i = \mathbf{0} \\ & \text{hat nur die Lösung}\; x_1 = \cdots = x_n = 0 \end{aligned}

Andernfalls (nichttriviale Lösung existiert) heissen sie linear abhängig.

Rang-Kriterium

\operatorname{rang}(V) = n \;\Longrightarrow\; \mathbf{v}_1, \ldots, \mathbf{v}_n \text{ sind linear unabhängig}

V = (\mathbf{v}_1, \ldots, \mathbf{v}_n)

mit den Vektoren als Spalten. Voller Spaltenrang = Unabhängigkeit.

Beispiel: Unabhängigkeit mit einem Parameter t

Schritt 1: Die Vektoren

Ein Parameter $t$ steckt in den Vektoren. Wir suchen, für welche $t$ sie unabhängig sind. Das ist ein klassischer Prüfungstyp.

Gegeben $\mathbf{v}_1 = (1, 0, 0)^{\mathsf{T}}$ , $\mathbf{v}_2 = (0, 2, t)^{\mathsf{T}}$ , $\mathbf{v}_3 = (2, 4, t^2)^{\mathsf{T}}$ .

$\begin{aligned} \mathbf{v}_1 &= (1,\, 0,\, 0)^{\mathsf{T}} \\ \mathbf{v}_2 &= (0,\, 2,\, t)^{\mathsf{T}} \\ \mathbf{v}_3 &= (2,\, 4,\, t^2)^{\mathsf{T}} \end{aligned}$
Schritt 2: Homogenes System aufstellen und eliminieren

Unabhängig heisst: $a_1 \mathbf{v}_1 + a_2 \mathbf{v}_2 + a_3 \mathbf{v}_3 = \mathbf{0}$ nur trivial. Wir bringen die Spaltenmatrix in Stufenform.

Mit der Zeilenoperation $\text{III} \to \text{III} - \tfrac{t}{2}\,\text{II}$ entsteht das Pivotelement $t^2 - 2t$ :

$\begin{pmatrix} 1 & 0 & 2 \\ 0 & 2 & 4 \\ 0 & t & t^2 \end{pmatrix} \;\xrightarrow{\;\text{III} - \frac{t}{2}\text{II}\;}\; \begin{pmatrix} 1 & 0 & 2 \\ 0 & 2 & 4 \\ 0 & 0 & t^2 - 2t \end{pmatrix}$
Schritt 3: Pivot analysieren

Genau dann wenn das letzte Pivot verschwindet, gibt es eine freie Variable und damit nichttriviale Lösungen.

$t^2 - 2t = t(t - 2) = 0$ gilt für $t = 0$ und $t = 2$ . Bei diesen Werten sind die Vektoren abhängig.

$t^2 - 2t = 0 \iff t \in \{0, 2\}$
Schritt 4: Schluss

Für alle übrigen $t$ ist das letzte Pivot ungleich null, also voller Rang.

Die drei Vektoren sind genau dann linear unabhängig, wenn

$t \in \mathbb{R} \setminus \{0, 2\}$

Unabhängigkeit gilt auch für Funktionen als Vektoren. So sind $\sin(x)$ und $\cos(x)$ in $C[a,b]$ linear unabhängig: aus $a \sin(x) + b \cos(x) = 0$ für alle $x$ folgt $a = b = 0$ . Dagegen sind $\sin(x)$ , $\sin(x + 2)$ , $\cos(x)$ linear abhängig, denn das Additionstheorem liefert $\sin(x + 2) = \sin(x)\cos(2) + \cos(x)\sin(2)$ , also ist $\sin(x+2)$ schon eine Kombination der beiden anderen.

Definition Lineare (Un)abhängigkeit

\mathbf{v}_1, \ldots, \mathbf{v}_n

sind unabhängig, wenn

\sum_i x_i \mathbf{v}_i = \mathbf{0}

nur trivial lösbar ist, sonst abhängig. Eine Menge mit

\mathbf{0}

ist stets abhängig.

Merke Geometrie

\mathbb{R}^2

: unabhängig = verschiedene Richtungen.

\mathbb{R}^3

: unabhängig = nicht in einer gemeinsamen Ebene.

Querverweis Verweise
→ Kap. 1: triviale Lösung / Kern
→ Kap. 1: Rang

4.2.5 Erzeugendensystem, Basis und Dimension

Was ist die kleinste Menge von Vektoren, die einen ganzen Raum aufspannt? Zu wenige Vektoren erreichen nicht alles, zu viele enthalten Überflüssiges. Genau in der Mitte sitzt die Basis.

Ein Erzeugendensystem von $V$ ist eine Menge $\mathbf{v}_1, \ldots, \mathbf{v}_n$ mit $V = \operatorname{span}\{\mathbf{v}_1, \ldots, \mathbf{v}_n\}$ ; jeder Vektor lässt sich also aus ihnen kombinieren. Existiert ein endliches Erzeugendensystem, heisst $V$ endlichdimensional. Eine Basis ist ein Erzeugendensystem aus linear unabhängigen Vektoren, anschaulich: ein Koordinatensystem mit gerade genug Achsen, keine zu viel, keine zu wenig. Die Anzahl der Basisvektoren heisst Dimension $\dim(V)$ und ist für jeden Raum eindeutig.

Hat $V$ die Dimension $n$ , so gilt eine handfeste Faustregel: mehr als $n$ Vektoren sind immer abhängig; weniger als $n$ sind nie erzeugend; und genau $n$ Vektoren sind genau dann unabhängig, wenn sie erzeugend sind. In diesem Fall bilden sie eine Basis. Bei $n$ Vektoren fallen die beiden Eigenschaften „unabhängig" und „erzeugend" also zusammen, du musst nur eine prüfen.

Für $k$ Vektoren $\mathbf{v}_1, \ldots, \mathbf{v}_k \in \mathbb{R}^n$ fasst man die Lage in der Spaltenmatrix $A = (\mathbf{v}_1, \ldots, \mathbf{v}_k)$ mit Rang $r$ zusammen. Die folgende Tabelle fasst das auf einen Blick zusammen.

Eigenschaft	Bedingung am LGS	Rang
erzeugend	$A\mathbf{x} = \mathbf{b}$ lösbar für alle $\mathbf{b} \in \mathbb{R}^n$	$r = n$
linear unabhängig	$A\mathbf{x} = \mathbf{0}$ nur trivial lösbar	$r = k$
linear abhängig	$A\mathbf{x} = \mathbf{0}$ hat nichttriviale Lösung	$r < k$
Basis	beides zugleich, also $\det(A) \neq 0$	$n = k = r$

Erzeugend, unabhängig, Basis über den Rang (A ∈ ℝⁿˣᵏ, r = Rang(A))

Dimension

\dim(V) = \text{Anzahl der Vektoren einer Basis von } V

Für jeden endlichdimensionalen Vektorraum eindeutig, unabhängig von der gewählten Basis.

Definition Basis
Linear unabhängiges Erzeugendensystem von

V

. Jeder Vektor ist dann eindeutig als Linearkombination der Basisvektoren darstellbar.

Definition Dimension

\dim(V)

= Anzahl der Vektoren in einer Basis. Für jeden endlichdimensionalen

V

eindeutig.

Merke Dimensionsregel (dim V = n)
Mehr als

n

Vektoren: abhängig. Weniger als

n

: nicht erzeugend. Genau

n

: unabhängig

\iff

erzeugend

\iff

Basis.

Querverweis Verweise
→ Kap. 1: neun Äquivalenzen (Spalten = Basis ⟺ det ≠ 0)

4.2.6 Koordinaten bezüglich einer Basis

Wie schreibst du denselben Vektor in einer anderen Basis? Denk an eine Adresse: derselbe Ort hat im einen Stadtplan andere Koordinaten als im anderen. Der Vektor bleibt, die Zahlen ändern sich mit dem gewählten Achsensystem.

Ist $B = \{\mathbf{b}_1, \ldots, \mathbf{b}_n\}$ eine Basis von $V$ , so lässt sich jeder Vektor $\mathbf{x}$ eindeutig als $\mathbf{x} = \sum_i x_i \mathbf{b}_i$ schreiben. Die eindeutig bestimmten Koeffizienten $x_1, \ldots, x_n$ heissen Koordinaten von $\mathbf{x}$ bezüglich $B$ . Anschaulich sind sie das Rezept: wie viel von jedem Basisvektor man nehmen muss. Man fasst sie zum Koordinatenvektor $[\mathbf{x}]_B$ zusammen. Wichtig: diese Zahlen hängen von der Basiswahl ab, eine andere Basis liefert andere Koordinaten für denselben $\mathbf{x}$ .

!!!

Koordinaten bezüglich der Basis B

\mathbf{x} = \sum_{i=1}^{n} x_i \, \mathbf{b}_i = x_1 \mathbf{b}_1 + \cdots + x_n \mathbf{b}_n \qquad\Longrightarrow\qquad [\mathbf{x}]_B = \begin{pmatrix} x_1 \\ \vdots \\ x_n \end{pmatrix}

B = \{\mathbf{b}_1, \ldots, \mathbf{b}_n\}

Basis. Die

x_i

sind eindeutig und hängen von

B

ab.

Beispiel: Koordinaten in P₂

Schritt 1: Basis und Polynom

Wir bestimmen Koordinaten in einem Polynomraum, wo „Vektor" = Polynom ist. Die Basis ist nicht die Standardbasis, das macht es lehrreich.

Basis $B = \{\, b_1 = 1,\; b_2 = x,\; b_3 = 3x^2 - 1 \,\}$ von $P_2$ . Gesucht: die Koordinaten von $p(x) = 11x^2 - 2x + 1$ .

$B = \{\, 1,\; x,\; 3x^2 - 1 \,\}, \qquad p(x) = 11x^2 - 2x + 1$
Schritt 2: Hilfsdarstellung von x²

Die Basis enthält $3x^2 - 1$ statt $x^2$ . Um Potenzen zu vergleichen, drücken wir $x^2$ durch die Basis aus.

Es gilt $x^2 = \tfrac{1}{3} \cdot 1 + \tfrac{1}{3}(3x^2 - 1)$ , also $x^2 = \tfrac{1}{3} b_1 + \tfrac{1}{3} b_3$ .

$x^2 = \tfrac{1}{3} \cdot 1 + \tfrac{1}{3}\,(3x^2 - 1)$
Schritt 3: Ansatz und Koeffizientenvergleich

Wir setzen $p$ als Kombination $a_1 b_1 + a_2 b_2 + a_3 b_3$ an und vergleichen die Koeffizienten von $1$ , $x$ und $x^2$ .

Aus $11x^2 - 2x + 1 = a_1 \cdot 1 + a_2 \cdot x + a_3 (3x^2 - 1)$ folgt:

$a_1 = \tfrac{14}{3}, \qquad a_2 = -2, \qquad a_3 = \tfrac{11}{3}$
Schritt 4: Koordinatenvektor

Die drei Koeffizienten sind die gesuchten Koordinaten.

Also ist der Koordinatenvektor von $p$ bezüglich $B$ :

$[p(x)]_B = \begin{pmatrix} \tfrac{14}{3} \\[2pt] -2 \\[2pt] \tfrac{11}{3} \end{pmatrix}$

Notation Notation: $[\mathbf{x}]_B$

[\mathbf{x}]_B

ist der Koordinatenvektor von

\mathbf{x}

bezüglich der Basis

B

: die Spalte der eindeutigen Koeffizienten

x_i

aus

\mathbf{x} = \sum_i x_i \mathbf{b}_i

Prüfungstipp Prüfungstipp
Koordinaten hängen von der Basis ab. Frage immer: „bezüglich welcher Basis?" Ohne Basis ist

[\mathbf{x}]_B

bedeutungslos.

4.3Normierte Vektorräume

4.3.1 Die Norm: Länge im Vektorraum

Wie lang ist ein Vektor, und was soll „lang" überhaupt heissen, wenn der Vektor ein Polynom oder eine Funktion ist? Im $\mathbb{R}^2$ misst du die Pfeillänge mit Pythagoras. In einem abstrakten Vektorraum verallgemeinert die Norm diese Idee.

Eine Norm auf $V$ ist eine Abbildung $\lVert \cdot \rVert : V \to \mathbb{R}$ , die jedem Vektor eine reelle Zahl (seine „Länge") zuordnet und drei Bedingungen erfüllt. (I) Positivität: die Länge ist nie negativ und genau dann null, wenn der Vektor der Nullvektor ist. (II) Homogenität: streckst du den Vektor um den Faktor $\alpha$ , skaliert die Länge um $|\alpha|$ . (III) Dreiecksungleichung: die Länge einer Summe ist höchstens die Summe der Längen.

Diese drei Forderungen sind genau das, was man intuitiv von „Länge" erwartet. Nichts kann negativ lang sein, doppelt so weit gestreckt ist doppelt so lang, und der direkte Weg ist nie länger als ein Umweg über einen dritten Punkt. Mehr steckt nicht dahinter.

!!!

Norm als Abbildung mit drei Axiomen

\lVert \cdot \rVert : V \to \mathbb{R}, \quad \begin{cases} \text{(I)} & \lVert \mathbf{v} \rVert \geq 0 \;\text{ und }\; \lVert \mathbf{v} \rVert = 0 \iff \mathbf{v} = \mathbf{0} \\ \text{(II)} & \lVert \alpha \cdot \mathbf{v} \rVert = |\alpha| \cdot \lVert \mathbf{v} \rVert \\ \text{(III)} & \lVert \mathbf{v} + \mathbf{w} \rVert \leq \lVert \mathbf{v} \rVert + \lVert \mathbf{w} \rVert \end{cases}

Für alle

\mathbf{v}, \mathbf{w} \in V

und

\alpha \in \mathbb{R}

. (I) Positivität, (II) Homogenität, (III) Dreiecksungleichung.

Notation Notation: ‖v‖

\lVert \mathbf{v} \rVert

ist die Norm (Länge) von

\mathbf{v}

. Ein Index gibt an, welche Norm gemeint ist:

\lVert \mathbf{v} \rVert_2

euklidisch,

\lVert \mathbf{v} \rVert_\infty

Maximum,

\lVert \mathbf{v} \rVert_p

die

p

-Norm.

Definition Norm
Abbildung

\lVert \cdot \rVert : V \to \mathbb{R}

mit Positivität, Homogenität und Dreiecksungleichung. Verallgemeinert den Begriff der Länge.

4.3.2 Standard-Normen: euklidisch, Maximum, p-Norm

Es gibt mehr als eine Art, Länge zu messen. Im $\mathbb{R}^n$ sind drei Normen besonders gebräuchlich, und sie geben demselben Vektor verschiedene Längen, weil sie verschiedene Fragen beantworten.

Die euklidische Norm (oder $2$ -Norm) ist die gewohnte Pythagoras-Länge $\lVert \mathbf{v} \rVert_2 = \sqrt{v_1^2 + \cdots + v_n^2}$ , die Luftlinie zum Punkt. Die Maximumsnorm (oder $\infty$ -Norm) nimmt einfach den betragsmässig grössten Eintrag, $\lVert \mathbf{v} \rVert_\infty = \max_i |v_i|$ , also den grössten Einzelschritt. Dazwischen liegt die $p$ -Norm, die für $p \to \infty$ in die Maximumsnorm übergeht und für $p = 2$ die euklidische ist.

Auf endlichdimensionalen Vektorräumen sind all diese Normen äquivalent: zu je zwei Normen $\lVert \cdot \rVert$ und $\lVert \cdot \rVert'$ gibt es eine Konstante $c$ , sodass $\tfrac{1}{c}\lVert \mathbf{x} \rVert' \leq \lVert \mathbf{x} \rVert \leq c\,\lVert \mathbf{x} \rVert'$ . Sie unterscheiden sich also nur um konstante Faktoren; eine Folge, die in einer Norm gegen einen Grenzwert läuft, tut das auch in jeder anderen. (In unendlicher Dimension stimmt das nicht mehr, dort kann die Wahl der Norm alles ändern, dazu gleich.)

!!!

Euklidische Norm (2-Norm)

\lVert \mathbf{v} \rVert_2 = \sqrt{v_1^2 + v_2^2 + \cdots + v_n^2}

Die gewohnte Pythagoras-Länge eines Vektors im

\mathbb{R}^n

Maximumsnorm und p-Norm

\begin{aligned} \lVert \mathbf{v} \rVert_\infty &= \max_{1 \leq i \leq n} |v_i| \\ \lVert \mathbf{v} \rVert_p &= \left( \sum_{i=1}^{n} |v_i|^p \right)^{1/p} \end{aligned}

Die

\infty

-Norm nimmt den grössten Betrag, die

p

-Norm verallgemeinert;

p = 2

ergibt die euklidische Norm.

Norm-Äquivalenz (endliche Dimension)

\tfrac{1}{c}\,\lVert \mathbf{x} \rVert' \;\leq\; \lVert \mathbf{x} \rVert \;\leq\; c\,\lVert \mathbf{x} \rVert'

In einem endlichdimensionalen Vektorraum gibt es zu je zwei Normen so eine Konstante

c > 0

Ein Zahlbeispiel: für $\mathbf{v} = (1, 3, 4)^{\mathsf{T}}$ ist $\lVert \mathbf{v} \rVert_2 = \sqrt{1 + 9 + 16} = \sqrt{26}$ und $\lVert \mathbf{v} \rVert_3 = \sqrt[3]{1 + 27 + 64} = \sqrt[3]{92}$ . Derselbe Vektor, zwei verschiedene Längen, je nach gewählter Norm.

Formel Euklidische Norm

\lVert \mathbf{v} \rVert_2 = \sqrt{\textstyle\sum_i v_i^2}

Merke Alle Normen äquivalent
In endlicher Dimension unterscheiden sich je zwei Normen nur um konstante Faktoren. Konvergenz ist dann unabhängig von der gewählten Norm.

Merke Bild im Kopf

2

-Norm = Luftlinie zum Punkt.

\infty

-Norm = grösster Einzelschritt entlang einer Achse.

4.3.3 Normen auf Funktionenräumen und Konvergenz

Wie misst man den Abstand zweier Funktionen? Auch Funktionen sind Vektoren (im Raum $C[a,b]$ ), also brauchen sie eine Norm. Es gibt wieder mehrere natürliche Wahlen.

Die Maximumsnorm $\lVert f \rVert_0 = \max_{a \leq x \leq b} |f(x)|$ nimmt den grössten Funktionswert dem Betrag nach, den höchsten Ausschlag der Kurve. Die Integral- $p$ -Norm $\lVert f \rVert_p = \left( \int_a^b |f(x)|^p \, dx \right)^{1/p}$ mittelt dagegen über das ganze Intervall; sie ist gross, wenn die Funktion insgesamt viel Fläche unter sich hat. Beide messen „Grösse einer Funktion", aber verschieden.

Mit einer Norm wird der Satz „eine Folge nähert sich einem Grenzwert" präzise: eine Folge $\{\mathbf{v}_n\}$ in $V$ konvergiert gegen $\mathbf{v}$ , wenn der Abstand $\lVert \mathbf{v} - \mathbf{v}_n \rVert$ gegen null geht. Hier zeigt sich, warum die Norm-Wahl in unendlicher Dimension wichtig ist: dieselbe Funktionenfolge kann in der einen Norm konvergieren und in der anderen nicht.

Normen auf C[a,b]

\begin{aligned} \lVert f \rVert_0 &= \max_{a \leq x \leq b} |f(x)| \\ \lVert f \rVert_p &= \left( \int_a^b |f(x)|^p \, dx \right)^{1/p} \end{aligned}

\lVert f \rVert_0

Maximumsnorm (grösster Ausschlag),

\lVert f \rVert_p

Integral-Norm (gemittelt über das Intervall).

Konvergenz bezüglich einer Norm

\{\mathbf{v}_n\} \to \mathbf{v} \iff \lim_{n \to \infty} \lVert \mathbf{v} - \mathbf{v}_n \rVert = 0

Der Abstand zwischen Folgenglied und Grenzwert geht gegen null.

Ein warnendes Beispiel: die Funktionenfolge $f_n(x) = \dfrac{1}{1 + (nx)^2}$ auf $[-1, 1]$ konvergiert in der Maximumsnorm nicht gegen die Nullfunktion. Denn an der Stelle $x = 0$ ist stets $f_n(0) = 1$ , also $\lVert f_n \rVert_\infty = 1 \neq 0$ für jedes $n$ . Obwohl die Funktionen abseits der Null beliebig klein werden, bleibt die Spitze bei $x = 0$ stehen, und die Maximumsnorm sieht genau diese Spitze.

Definition Konvergenz (bzgl. Norm)

\{\mathbf{v}_n\}

konvergiert gegen

\mathbf{v}

, falls

\lVert \mathbf{v} - \mathbf{v}_n \rVert \to 0

. Hängt von der gewählten Norm ab.

Prüfungstipp Achtung
In unendlicher Dimension entscheidet die Norm-Wahl über Konvergenz. Dieselbe Folge kann in einer Norm konvergieren, in einer anderen nicht.

4.4Das Skalarprodukt

4.4.1 Das Skalarprodukt: Winkel messen

Wie misst man den Winkel zwischen zwei Vektoren, und sogar zwischen zwei Polynomen? Die Norm gibt Längen, aber keine Winkel. Dafür braucht es ein neues Werkzeug: das Skalarprodukt. Es steckt den Winkel zwischen zwei Vektoren in eine einzige Zahl.

Ein Skalarprodukt auf einem reellen Vektorraum $V$ ist eine Abbildung $\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}$ , die jedem Paar von Vektoren eine reelle Zahl zuordnet und drei Bedingungen erfüllt: (I) Bilinearität (linear in jedem der beiden Argumente), (II) Symmetrie ( $\langle \mathbf{x}, \mathbf{y} \rangle = \langle \mathbf{y}, \mathbf{x} \rangle$ ) und (III) positive Definitheit ( $\langle \mathbf{x}, \mathbf{x} \rangle \geq 0$ , mit Gleichheit nur für $\mathbf{x} = \mathbf{0}$ ).

Im $\mathbb{R}^n$ ist das Standardskalarprodukt die vertraute Komponentensumme $\langle \mathbf{x}, \mathbf{y} \rangle = \mathbf{x}^{\mathsf{T}} \mathbf{y}$ . Es hängt mit Längen und Winkel über $\langle \mathbf{x}, \mathbf{y} \rangle = \lVert \mathbf{x} \rVert \, \lVert \mathbf{y} \rVert \cos(\varphi)$ zusammen, wobei $\varphi$ der Winkel zwischen den Vektoren ist. Daraus liest man beides ab: die Längen (über $\langle \mathbf{x}, \mathbf{x} \rangle = \lVert \mathbf{x} \rVert^2$ ) und den Winkel. Jedes Skalarprodukt erzeugt nämlich eine eigene Norm, die induzierte Norm $\lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}$ . Umgekehrt kommt aber nicht jede Norm von einem Skalarprodukt.

!!!

Skalarprodukt: die drei Axiome

\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}, \qquad \begin{cases} \text{(I)} & \langle \mathbf{x} + \alpha \mathbf{y}, \mathbf{z} \rangle = \langle \mathbf{x}, \mathbf{z} \rangle + \alpha \langle \mathbf{y}, \mathbf{z} \rangle \\ \text{(II)} & \langle \mathbf{x}, \mathbf{y} \rangle = \langle \mathbf{y}, \mathbf{x} \rangle \\ \text{(III)} & \langle \mathbf{x}, \mathbf{x} \rangle \geq 0,\;\; \langle \mathbf{x}, \mathbf{x} \rangle = 0 \iff \mathbf{x} = \mathbf{0} \end{cases}

Für alle

\mathbf{x}, \mathbf{y}, \mathbf{z} \in V

\alpha \in \mathbb{R}

. (I) bilinear, (II) symmetrisch, (III) positiv definit. Wegen der Symmetrie (II) genügt Linearität im ersten Argument.

!!!

Standardskalarprodukt und induzierte Norm

\langle \mathbf{x}, \mathbf{y} \rangle = \mathbf{x}^{\mathsf{T}} \mathbf{y} = \lVert \mathbf{x} \rVert \, \lVert \mathbf{y} \rVert \cos(\varphi), \qquad \lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}

\varphi

ist der Winkel zwischen

\mathbf{x}

und

\mathbf{y}

. Nicht jede Norm wird von einem Skalarprodukt induziert.

Notation Notation: ⟨u, v⟩

\langle \mathbf{u}, \mathbf{v} \rangle

ist das Skalarprodukt der Vektoren

\mathbf{u}

und

\mathbf{v}

, eine reelle Zahl. Manche Texte schreiben

\mathbf{u} \cdot \mathbf{v}

für das Standardskalarprodukt.

Definition Skalarprodukt
Abbildung

\langle \cdot, \cdot \rangle : V \times V \to \mathbb{R}

, bilinear, symmetrisch und positiv definit.

Formel Induzierte Norm

\lVert \mathbf{a} \rVert = \sqrt{\langle \mathbf{a}, \mathbf{a} \rangle}

4.4.2 Weitere Skalarprodukte: Matrizen und Funktionen

Geht ein Skalarprodukt auch für Matrizen oder Funktionen? Ja, und genau das macht den abstrakten Begriff so nützlich: Winkel und Orthogonalität lassen sich überall erklären, wo man ein Skalarprodukt hat.

Im $\mathbb{R}^n$ kann man das Standardprodukt mit einer Matrix $A$ verzerren: $\langle \mathbf{x}, \mathbf{y} \rangle_A = \mathbf{x}^{\mathsf{T}} A \mathbf{y}$ . Das ist genau dann ein Skalarprodukt, wenn $A$ symmetrisch und positiv definit ist (alle Eigenwerte $> 0$ ). Für Funktionen aus $C[a,b]$ definiert das Funktionen-Skalarprodukt $\langle f, g \rangle = \int_a^b f(t)\,g(t)\,dt$ einen Winkel zwischen Kurven; man kann es zusätzlich mit einer Gewichtsfunktion versehen, etwa $\langle f, g \rangle = \int_{-1}^{1} f(x)\,g(x)\,x^2\,dx$ . Und auf dem Matrizenraum $\mathbb{R}^{2 \times 2}$ liefert die Spur das Spur-Skalarprodukt $\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}})$ .

All diese Produkte erfüllen dieselben drei Axiome wie das Standardprodukt; nur die konkrete Rechenvorschrift unterscheidet sich. Damit gelten auch alle Folgesätze (Projektion, Cauchy-Schwarz, Pythagoras, Gram-Schmidt) unverändert in jedem dieser Räume.

Drei weitere Skalarprodukte

\begin{aligned} \langle \mathbf{x}, \mathbf{y} \rangle_A &= \mathbf{x}^{\mathsf{T}} A \mathbf{y} \\ \langle f, g \rangle &= \int_a^b f(t)\,g(t)\,dt \\ \langle A, B \rangle &= \operatorname{Spur}(A B^{\mathsf{T}}) \end{aligned}

Matrix-Skalarprodukt (mit symmetrisch positiv definitem

A

), Funktionen-Skalarprodukt auf

C[a,b]

, Spur-Skalarprodukt auf

\mathbb{R}^{m \times n}

Beispiel: matrixgewichtetes Skalarprodukt

\begin{gathered} A = \begin{pmatrix} 2 & -2 \\ -2 & 5 \end{pmatrix} \\ \langle \mathbf{x}, \mathbf{y} \rangle_A = 2 x_1 y_1 - 2 x_1 y_2 - 2 x_2 y_1 + 5 x_2 y_2 \end{gathered}

Ein Skalarprodukt genau dann, wenn die Eigenwerte von

A

positiv sind (hier der Fall).

Definition Funktionen-Skalarprodukt
Auf

C[a,b]

\langle f, g \rangle = \int_a^b f(t)\,g(t)\,dt

. Macht zwei Funktionen orthogonal, wenn das Integral ihres Produkts verschwindet.

Definition Spur-Skalarprodukt
Auf

\mathbb{R}^{m \times n}

\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}}) = \sum_{i,j} a_{ij} b_{ij}

. Es gilt

\langle A, A \rangle = \sum_{i,j} a_{ij}^2 \geq 0

Merke Positiv definit

\langle \mathbf{x}, \mathbf{y} \rangle_A = \mathbf{x}^{\mathsf{T}} A \mathbf{y}

ist ein Skalarprodukt

\iff

A

symmetrisch und alle Eigenwerte

> 0

4.4.3 Orthogonalität, Projektion, Cauchy-Schwarz, Pythagoras

Was heisst „senkrecht" im Vektorraum, und wie projiziert man einen Vektor auf einen anderen? Mit dem Skalarprodukt lässt sich beides sauber fassen, und es gelten dieselben Sätze, die du aus der ebenen Geometrie kennst.

Zwei Vektoren $\mathbf{x}, \mathbf{y}$ heissen orthogonal (Schreibweise $\mathbf{x} \perp \mathbf{y}$ ), wenn ihr Skalarprodukt verschwindet: $\langle \mathbf{x}, \mathbf{y} \rangle = 0$ . Die Orthogonalprojektion von $\mathbf{x}$ auf einen Vektor $\mathbf{y} \neq \mathbf{0}$ ist derjenige Vielfache von $\mathbf{y}$ , der $\mathbf{x}$ am nächsten kommt: $\mathbf{z} = \dfrac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y}$ . Sie zerlegt $\mathbf{x}$ in einen Anteil entlang $\mathbf{y}$ (das ist $\mathbf{z}$ ) und einen Rest senkrecht dazu. Genau diese Zerlegung steckt später hinter dem Gram-Schmidt-Verfahren.

Zwei klassische Ungleichungen begleiten das Skalarprodukt. Die Cauchy-Schwarz-Ungleichung $\langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \, \langle \mathbf{y}, \mathbf{y} \rangle$ beschränkt das Skalarprodukt durch die Längen (sie garantiert, dass $\cos(\varphi)$ wirklich zwischen $-1$ und $1$ liegt). Und der Satz von Pythagoras gilt für orthogonale Vektoren: $\lVert \mathbf{x} + \mathbf{y} \rVert^2 = \lVert \mathbf{x} \rVert^2 + \lVert \mathbf{y} \rVert^2$ . Ein Vektor mit Länge $1$ heisst Einheitsvektor; jeden Vektor $\mathbf{x} \neq \mathbf{0}$ macht man durch Teilen durch seine Länge zu einem solchen.

!!!

Orthogonalität und Orthogonalprojektion

\mathbf{x} \perp \mathbf{y} \iff \langle \mathbf{x}, \mathbf{y} \rangle = 0, \qquad \mathbf{z} = \frac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y} \quad (\mathbf{y} \neq \mathbf{0})

\mathbf{z}

ist die Projektion von

\mathbf{x}

auf die Richtung von

\mathbf{y}

!!!

Cauchy-Schwarz und Pythagoras (x ⊥ y)

\begin{aligned} & \langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \cdot \langle \mathbf{y}, \mathbf{y} \rangle \\ & \lVert \mathbf{x} + \mathbf{y} \rVert^2 = \lVert \mathbf{x} - \mathbf{y} \rVert^2 = \lVert \mathbf{x} \rVert^2 + \lVert \mathbf{y} \rVert^2 \end{aligned}

Cauchy-Schwarz gilt immer; die Pythagoras-Gleichung nur für orthogonale

\mathbf{x}, \mathbf{y}

Beispiel: Orthogonalprojektion in der Ebene

Schritt 1: Die Vektoren

Wir projizieren konkret in $\mathbb{R}^2$ mit dem Standardskalarprodukt, damit die Formel greifbar wird.

Gegeben $\mathbf{x} = (6, 2)^{\mathsf{T}}$ und $\mathbf{y} = (2, 1)^{\mathsf{T}}$ . Gesucht: die Projektion $\mathbf{z}$ von $\mathbf{x}$ auf $\mathbf{y}$ .
Schritt 2: Skalarprodukte berechnen

Die Projektionsformel braucht $\langle \mathbf{x}, \mathbf{y} \rangle$ im Zähler und $\langle \mathbf{y}, \mathbf{y} \rangle$ im Nenner.

Es ist $\langle \mathbf{x}, \mathbf{y} \rangle = 6 \cdot 2 + 2 \cdot 1 = 14$ und $\langle \mathbf{y}, \mathbf{y} \rangle = 2 \cdot 2 + 1 \cdot 1 = 5$ .

$\langle \mathbf{x}, \mathbf{y} \rangle = 14, \qquad \langle \mathbf{y}, \mathbf{y} \rangle = 5$
Schritt 3: Einsetzen

Der Bruch $\tfrac{14}{5}$ ist der Streckfaktor, mit dem man $\mathbf{y}$ skaliert.

Also:

$\mathbf{z} = \frac{14}{5} \begin{pmatrix} 2 \\ 1 \end{pmatrix} = \begin{pmatrix} \tfrac{28}{5} \\[2pt] \tfrac{14}{5} \end{pmatrix}$

Notation Notation: ⊥

\mathbf{x} \perp \mathbf{y}

heisst „

\mathbf{x}

orthogonal (senkrecht) zu

\mathbf{y}

", gleichbedeutend mit

\langle \mathbf{x}, \mathbf{y} \rangle = 0

Formel Orthogonalprojektion

\mathbf{z} = \frac{\langle \mathbf{x}, \mathbf{y} \rangle}{\langle \mathbf{y}, \mathbf{y} \rangle}\,\mathbf{y}

Formel Cauchy-Schwarz

\langle \mathbf{x}, \mathbf{y} \rangle^2 \leq \langle \mathbf{x}, \mathbf{x} \rangle \langle \mathbf{y}, \mathbf{y} \rangle

Definition Einheitsvektor
Vektor mit

\lVert \mathbf{x} \rVert = 1

. Aus jedem

\mathbf{x} \neq \mathbf{0}

macht man einen durch

\mathbf{x} / \lVert \mathbf{x} \rVert

4.4.4 Orthonormalbasis: das bequemste Koordinatensystem

Warum ist eine Basis aus lauter senkrechten Einheitsvektoren so angenehm? Stell dir kariertes Papier mit quadratischen Einheitskästchen vor, gegenüber einem schiefen, verzerrten Gitter. Auf dem karierten Papier liest man Koordinaten direkt ab; im schiefen Gitter muss man rechnen. Genau diesen Komfort liefert eine Orthonormalbasis.

Eine Orthonormalbasis (ONB) ist eine Basis aus paarweise orthogonalen Einheitsvektoren: je zwei verschiedene stehen senkrecht aufeinander, und jeder hat Länge $1$ . Solche Vektoren sind automatisch linear unabhängig und bilden eine Basis. Und zu jeder Basis gibt es eine Orthonormalbasis, die man mit dem Gram-Schmidt-Verfahren (nächster Abschnitt) konstruiert.

Der Hauptvorteil: in einer Orthonormalbasis $\{\mathbf{e}_1, \ldots, \mathbf{e}_n\}$ sind die Koordinaten eines Vektors einfach seine Skalarprodukte mit den Basisvektoren, $x_i = \langle \mathbf{x}, \mathbf{e}_i \rangle$ . Du musst kein lineares Gleichungssystem mehr lösen, um einen Vektor in der Basis darzustellen; ein Skalarprodukt pro Koordinate genügt. Das ist der Grund, warum man Orthonormalbasen überall bevorzugt, von der Fourier-Analysis bis zur Quantenmechanik.

!!!

Orthonormalbasis

\langle \mathbf{e}_i, \mathbf{e}_j \rangle = \begin{cases} 1, & i = j \\ 0, & i \neq j \end{cases} \qquad\Longrightarrow\qquad \mathbf{x} = \sum_{i=1}^{n} \langle \mathbf{x}, \mathbf{e}_i \rangle \, \mathbf{e}_i

Paarweise orthogonale Einheitsvektoren. Die Koordinaten sind dann einfach

x_i = \langle \mathbf{x}, \mathbf{e}_i \rangle

, kein LGS nötig.

Definition Orthonormalbasis (ONB)
Basis aus paarweise orthogonalen Einheitsvektoren:

\langle \mathbf{e}_i, \mathbf{e}_j \rangle = 0

für

i \neq j

und

\lVert \mathbf{e}_i \rVert = 1

Merke Koordinaten gratis
In einer ONB ist

x_i = \langle \mathbf{x}, \mathbf{e}_i \rangle

. Kein Gleichungssystem, nur ein Skalarprodukt pro Koordinate.

4.4.5 Gram-Schmidt-Verfahren: das Kochrezept

Wie macht man aus irgendeiner Basis eine Orthonormalbasis? Das Gram-Schmidt-Verfahren ist das Rezept dafür. Die Grundidee in einem Satz: nimm der Reihe nach jeden Basisvektor, ziehe seine Schatten (Projektionen) auf alle schon fertigen Einheitsvektoren ab, und normiere den Rest auf Länge $1$ .

Das folgende Kochrezept arbeitet die Basis $\mathbf{b}_1, \ldots, \mathbf{b}_n$ Schritt für Schritt ab. In jedem Schritt entsteht zuerst ein unnormierter Zwischenvektor (wir schreiben ihn mit Tilde, $\tilde{\mathbf{e}}_k$ ), der senkrecht auf allen vorherigen steht, und danach der fertige Einheitsvektor $\mathbf{e}_k = \tilde{\mathbf{e}}_k / \lVert \tilde{\mathbf{e}}_k \rVert$ .

Gram-Schmidt: das Kochrezept Schritt für Schritt

Schritt I: ersten Vektor normieren

Der erste Basisvektor gibt schon die erste Richtung vor; er muss nur auf Länge $1$ gebracht werden.

Teile $\mathbf{b}_1$ durch seine Länge:

$\mathbf{e}_1 = \frac{\mathbf{b}_1}{\lVert \mathbf{b}_1 \rVert}$
Schritt II: zweiten Vektor senkrecht machen, dann normieren

Von $\mathbf{b}_2$ ziehen wir den Anteil entlang $\mathbf{e}_1$ ab (seinen Schatten), damit der Rest senkrecht auf $\mathbf{e}_1$ steht.

Zwischenvektor bilden, dann normieren:

$\tilde{\mathbf{e}}_2 = \mathbf{b}_2 - \langle \mathbf{b}_2, \mathbf{e}_1 \rangle\,\mathbf{e}_1, \qquad \mathbf{e}_2 = \frac{\tilde{\mathbf{e}}_2}{\lVert \tilde{\mathbf{e}}_2 \rVert}$
Schritt III: dritten Vektor von zwei Schatten befreien

Nun gibt es schon zwei fertige Richtungen $\mathbf{e}_1, \mathbf{e}_2$ ; beide Schatten von $\mathbf{b}_3$ werden abgezogen.

Wieder Zwischenvektor, dann normieren:

$\begin{aligned} \tilde{\mathbf{e}}_3 &= \mathbf{b}_3 - \langle \mathbf{b}_3, \mathbf{e}_1 \rangle\,\mathbf{e}_1 - \langle \mathbf{b}_3, \mathbf{e}_2 \rangle\,\mathbf{e}_2 \\ \mathbf{e}_3 &= \frac{\tilde{\mathbf{e}}_3}{\lVert \tilde{\mathbf{e}}_3 \rVert} \end{aligned}$
Schritt IV: allgemeiner Schritt k

Das Muster setzt sich fort: ziehe von $\mathbf{b}_k$ alle Schatten auf die bereits fertigen $\mathbf{e}_1, \ldots, \mathbf{e}_{k-1}$ ab, dann normiere.

So bis $k = n$ , am Ende steht die Orthonormalbasis $\{\mathbf{e}_1, \ldots, \mathbf{e}_n\}$ :

$\begin{aligned} \tilde{\mathbf{e}}_k &= \mathbf{b}_k - \sum_{j=1}^{k-1} \langle \mathbf{b}_k, \mathbf{e}_j \rangle\,\mathbf{e}_j \\ \mathbf{e}_k &= \frac{\tilde{\mathbf{e}}_k}{\lVert \tilde{\mathbf{e}}_k \rVert} \end{aligned}$

Formel Gram-Schmidt (allgemeiner Schritt)

\begin{aligned} \tilde{\mathbf{e}}_k = \mathbf{b}_k - {} \\ \sum_{j<k} \langle \mathbf{b}_k, \mathbf{e}_j \rangle \mathbf{e}_j \end{aligned}

Merke Merksatz
Subtrahiere die Schatten auf alle fertigen

\mathbf{e}_j

, normiere den Rest. Immer mit dem normierten

\mathbf{e}_j

rechnen.

Notation Notation: ẽₖ

\tilde{\mathbf{e}}_k

ist der unnormierte Zwischenvektor (senkrecht auf den vorherigen). Erst

\mathbf{e}_k = \tilde{\mathbf{e}}_k / \lVert \tilde{\mathbf{e}}_k \rVert

ist der fertige Einheitsvektor.

4.4.6 Durchgerechnete Beispiele

Wie läuft Gram-Schmidt an echten Zahlen ab? Hier zwei vollständig durchgerechnete Beispiele, eines im $\mathbb{R}^3$ mit dem Standardskalarprodukt, eines auf einem Polynomraum mit einem Integral-Skalarprodukt. Beide folgen exakt dem Kochrezept aus dem vorigen Abschnitt; nur die Rechenvorschrift für $\langle \cdot, \cdot \rangle$ und $\lVert \cdot \rVert$ ändert sich.

Beispiel 1: Gram-Schmidt im ℝ³ (Standardskalarprodukt)

Schritt 1: Ausgangsbasis

Drei linear unabhängige Vektoren, die wir orthonormalisieren. Skalarprodukt und Norm sind die Standard-Varianten.

Gegeben:

$\begin{aligned} \mathbf{a}_1 &= (-1,\, 1,\, 0)^{\mathsf{T}} \\ \mathbf{a}_2 &= (1,\, -2,\, 1)^{\mathsf{T}} \\ \mathbf{a}_3 &= (1,\, 0,\, 1)^{\mathsf{T}} \end{aligned}$
Schritt 2: erster Einheitsvektor

Normiere $\mathbf{a}_1$ . Es ist $\lVert \mathbf{a}_1 \rVert = \sqrt{1 + 1 + 0} = \sqrt{2}$ .

Also:

$\mathbf{e}_1 = \frac{1}{\sqrt{2}} \begin{pmatrix} -1 \\ 1 \\ 0 \end{pmatrix}$
Schritt 3: zweiter Vektor, Schatten abziehen

Bilde $\tilde{\mathbf{e}}_2 = \mathbf{a}_2 - \langle \mathbf{a}_2, \mathbf{e}_1 \rangle\,\mathbf{e}_1$ . Hier ist $\langle \mathbf{a}_2, \mathbf{e}_1 \rangle = -\tfrac{3}{\sqrt{2}}$ .

Nach dem Abziehen entsteht der Zwischenvektor:

$\tilde{\mathbf{e}}_2 = \begin{pmatrix} -\tfrac{1}{2} \\[2pt] -\tfrac{1}{2} \\[2pt] 1 \end{pmatrix}, \qquad \lVert \tilde{\mathbf{e}}_2 \rVert = \sqrt{\tfrac{1}{4} + \tfrac{1}{4} + 1} = \sqrt{\tfrac{3}{2}}$
Schritt 4: zweiter Einheitsvektor

Normieren mit dem Faktor $1 / \lVert \tilde{\mathbf{e}}_2 \rVert = \sqrt{\tfrac{2}{3}}$ .

Ergebnis:

$\mathbf{e}_2 = \sqrt{\tfrac{2}{3}} \begin{pmatrix} -\tfrac{1}{2} \\[2pt] -\tfrac{1}{2} \\[2pt] 1 \end{pmatrix}$
Schritt 5: dritter Vektor und Schluss

Ziehe von $\mathbf{a}_3$ beide Schatten ab und normiere. Der Zwischenvektor wird $\tilde{\mathbf{e}}_3 = (\tfrac{2}{3}, \tfrac{2}{3}, \tfrac{2}{3})^{\mathsf{T}}$ .

Nach dem Normieren erhält man den letzten Basisvektor:

$\mathbf{e}_3 = \frac{1}{\sqrt{3}} \begin{pmatrix} 1 \\ 1 \\ 1 \end{pmatrix}$

Ergebnis Beispiel 1: die Orthonormalbasis

\begin{aligned} \mathbf{e}_1 &= \tfrac{1}{\sqrt{2}}\,(-1,\, 1,\, 0)^{\mathsf{T}} \\ \mathbf{e}_2 &= \sqrt{\tfrac{2}{3}}\,(-\tfrac{1}{2},\, -\tfrac{1}{2},\, 1)^{\mathsf{T}} \\ \mathbf{e}_3 &= \tfrac{1}{\sqrt{3}}\,(1,\, 1,\, 1)^{\mathsf{T}} \end{aligned}

Probe: alle drei haben Länge

1

und stehen paarweise senkrecht.

Beispiel 2: Gram-Schmidt auf P₄ (Integral-Skalarprodukt)

Schritt 1: Skalarprodukt und Bausteine

Hier sind die Vektoren Polynome, und das Skalarprodukt ist ein Integral. Wir orthonormalisieren $\operatorname{span}\{1, 3x^4\}$ .

Mit $\langle p, q \rangle = \int_0^1 p(x)\,q(x)\,dx$ und den Bausteinen $w_1 = 1$ , $w_2 = 3x^4$ .

$\langle p, q \rangle = \int_0^1 p(x)\,q(x)\,dx, \qquad w_1 = 1, \quad w_2 = 3x^4$
Schritt 2: erster Einheitsvektor

Normiere $w_1 = 1$ . Es ist $\langle 1, 1 \rangle = \int_0^1 1\,dx = 1$ , also $\lVert w_1 \rVert = 1$ .

Das erste Polynom ist schon normiert:

$e_1 = 1$
Schritt 3: zweiten Vektor senkrecht machen

Ziehe den Schatten von $w_2$ auf $e_1$ ab. Es ist $\langle 3x^4, 1 \rangle = \int_0^1 3x^4\,dx = \tfrac{3}{5}$ .

Der unnormierte Zwischenvektor:

$\tilde{e}_2 = 3x^4 - \tfrac{3}{5}$
Schritt 4: Norm des Zwischenvektors

Für die Normierung braucht man $\lVert \tilde{e}_2 \rVert = \sqrt{\langle \tilde{e}_2, \tilde{e}_2 \rangle}$ .

Man rechnet $\langle \tilde{e}_2, \tilde{e}_2 \rangle = \int_0^1 \left( 3x^4 - \tfrac{3}{5} \right)^2 dx = \tfrac{16}{25}$ , also $\lVert \tilde{e}_2 \rVert = \tfrac{4}{5}$ .

$\langle \tilde{e}_2, \tilde{e}_2 \rangle = \tfrac{16}{25} \;\Rightarrow\; \lVert \tilde{e}_2 \rVert = \tfrac{4}{5}$
Schritt 5: normieren, Schluss

Teile $\tilde{e}_2$ durch $\tfrac{4}{5}$ , also multipliziere mit $\tfrac{5}{4}$ .

Man erhält den zweiten Einheitsvektor:

$e_2 = \frac{\tilde{e}_2}{\lVert \tilde{e}_2 \rVert} = \tfrac{5}{4}\left( 3x^4 - \tfrac{3}{5} \right) = \tfrac{15}{4}x^4 - \tfrac{3}{4}$

Auch auf dem Matrizenraum $\mathbb{R}^{2 \times 2}$ läuft das Verfahren identisch, mit dem Spur-Skalarprodukt $\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}})$ . Orthonormalisiert man dort die Basis der symmetrischen Matrizen $B_1 = \bigl(\begin{smallmatrix} 1 & 1 \\ 1 & 0 \end{smallmatrix}\bigr)$ , $B_2 = \bigl(\begin{smallmatrix} 1 & -1 \\ -1 & 0 \end{smallmatrix}\bigr)$ , $B_3 = \bigl(\begin{smallmatrix} 0 & 1 \\ 1 & 1 \end{smallmatrix}\bigr)$ , so erhält man $\tilde{B}_1 = \tfrac{1}{\sqrt{3}} B_1$ , $\tilde{B}_2 = \tfrac{1}{\sqrt{6}} \bigl(\begin{smallmatrix} 2 & -1 \\ -1 & 0 \end{smallmatrix}\bigr)$ und $\tilde{B}_3 = \bigl(\begin{smallmatrix} 0 & 0 \\ 0 & 1 \end{smallmatrix}\bigr)$ . Will man diese ONB des Unterraums der symmetrischen Matrizen zu einer ONB des ganzen $\mathbb{R}^{2 \times 2}$ ergänzen, fügt man eine normierte schiefsymmetrische Matrix hinzu, etwa $\tilde{B}_4 = \tfrac{1}{\sqrt{2}} \bigl(\begin{smallmatrix} 0 & 1 \\ -1 & 0 \end{smallmatrix}\bigr)$ ; sie steht automatisch senkrecht auf allen symmetrischen Matrizen.

Nützliche Zusatz-Identität (Ergänzung)

Diese Beobachtung steht so nicht als eigener Satz in der Vorlesung, ist aber ein praktischer Trick: bezüglich des Spur-Skalarprodukts $\langle A, B \rangle = \operatorname{Spur}(A B^{\mathsf{T}})$ steht jede schiefsymmetrische Matrix ( $B^{\mathsf{T}} = -B$ ) senkrecht auf jeder symmetrischen Matrix. Das folgt aus $\operatorname{Spur}(AB) = \operatorname{Spur}(BA)$ und $\operatorname{Spur}(A^{\mathsf{T}}) = \operatorname{Spur}(A)$ . Deshalb genügt eine schiefsymmetrische Matrix, um eine ONB der symmetrischen $2 \times 2$ -Matrizen zur ONB des ganzen $\mathbb{R}^{2 \times 2}$ zu ergänzen, man muss nicht erst lange eine orthogonale Richtung suchen.

Formel ONB aus Beispiel 1

\begin{aligned} \mathbf{e}_1 &= \tfrac{1}{\sqrt{2}}(-1,1,0)^{\mathsf{T}} \\ \mathbf{e}_3 &= \tfrac{1}{\sqrt{3}}(1,1,1)^{\mathsf{T}} \end{aligned}

Formel ONB aus Beispiel 2

e_1 = 1, \qquad e_2 = \tfrac{15}{4}x^4 - \tfrac{3}{4}

Merke Spur-Eigenschaften

\operatorname{Spur}(AB) = \operatorname{Spur}(BA)

und

\operatorname{Spur}(A^{\mathsf{T}}) = \operatorname{Spur}(A)

. Damit ist

\langle A, A \rangle = \sum a_{ij}^2 \geq 0

Aufgaben mit Musterlösungen

Übungsaufgaben mit ausführlichen Musterlösungen werden hier ergänzt. Bis dahin lohnt es sich, die durchgerechneten Beispiele in den Abschnitten 4.2, 4.4.3 und 4.4.6 selbst nachzurechnen: das Unterraum-Kriterium an einer eigenen Teilmenge prüfen, eine Orthogonalprojektion bilden und eine kleine Basis mit Gram-Schmidt orthonormalisieren.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!

Variablen-Glossar (10 Einträge)

V

ein Vektorraum (Menge mit Addition und Skalarmultiplikation) -

U

ein Unterraum von V -

\mathbf{0}

der Nullvektor von V (in manchen Texten O geschrieben) -

\alpha, \beta

Skalare aus ℝ -

\operatorname{span}\{\ldots\}

die lineare Hülle, der von Vektoren erzeugte Unterraum -

[\mathbf{x}]_B

Koordinatenvektor von x bezüglich der Basis B -

\lVert \mathbf{v} \rVert

Norm (Länge) des Vektors v -

\langle \mathbf{u}, \mathbf{v} \rangle

Skalarprodukt von u und v -

\mathbf{x} \perp \mathbf{y}

x und y sind orthogonal (senkrecht) -

P_n

Vektorraum der Polynome vom Grad höchstens n -