Kap. 5: Lineare Abbildungen — STEM Animations

5.1Definition und Beispiele

5.1 Wann heisst eine Abbildung linear?

Stell dir eine Maschine vor, die Vektoren frisst und Vektoren ausspuckt. Du darfst zwei Dinge mit ihr tun: erst zwei Vektoren mischen (addieren) und dann durch die Maschine schicken, oder erst beide einzeln durch die Maschine schicken und dann das Ergebnis mischen. Eine faire Maschine liefert beide Male dasselbe. Genau diese Fairness ist die Linearität. Und wenn du den Input verdoppelst, verdoppelt sich auch der Output, ohne Überraschung.

Formal: Eine Abbildung $F$ schickt jeden Vektor $\mathbf{x}$ aus einem Vektorraum $V$ (dem Start) auf einen Vektor $F(\mathbf{x})$ in einem Vektorraum $W$ (dem Ziel). Man schreibt $F: V \to W$ , gelesen ‚ $F$ bildet $V$ nach $W$ ab', und $\mathbf{x} \mapsto F(\mathbf{x})$ , gelesen ‚ $\mathbf{x}$ wird auf $F(\mathbf{x})$ abgebildet'. Hier sind $V$ und $W$ zwei beliebige Vektorräume (was ein Vektorraum genau ist, steht in Kap. 4).

$F$ heisst linear, wenn sie zwei Bedingungen erfüllt. Die erste, die Additivität, sagt: Summen darf man vor oder nach dem Abbilden bilden, das Ergebnis ist gleich. Die zweite, die Homogenität, sagt: einen Streckfaktor $\alpha$ darf man vor oder nach dem Abbilden anbringen. Beides zusammen heisst anschaulich: $F$ respektiert die zwei Grundoperationen eines Vektorraums, das Addieren und das Skalieren.

Abbildung

F: V \longrightarrow W, \qquad \mathbf{x} \longmapsto F(\mathbf{x})

V = Startraum (Definitionsbereich), W = Zielraum. Beide sind Vektorräume.

Linearität (i): Additivität

F(\mathbf{x} + \mathbf{y}) = F(\mathbf{x}) + F(\mathbf{y}) \qquad \forall\, \mathbf{x}, \mathbf{y} \in V

Erst mischen, dann abbilden = erst abbilden, dann mischen.

Linearität (ii): Homogenität

F(\alpha \cdot \mathbf{x}) = \alpha \cdot F(\mathbf{x}) \qquad \forall\, \mathbf{x} \in V,\ \alpha \in \mathbb{R}

Ein Streckfaktor darf vor oder nach der Abbildung stehen.

In der Praxis prüft man Additivität und Homogenität meist in einem Rutsch. Man fasst sie zur kombinierten Linearitätsbedingung zusammen. Sie ist die Kernidee dieses ganzen Kapitels: $F$ vertauscht mit jeder Linearkombination. Anschaulich heisst das, man darf $F$ durch eine Summe und an einem Streckfaktor vorbei ‚durchziehen'.

!!!

Linearität, kombiniert (die Kernidee)

F(\alpha\, \mathbf{u} + \beta\, \mathbf{v}) = \alpha\, F(\mathbf{u}) + \beta\, F(\mathbf{v})

Eine Abbildung ist genau dann linear, wenn sie diese eine Gleichung für alle

\mathbf{u}, \mathbf{v}

und alle

\alpha, \beta

erfüllt.

Aus der Homogenität folgt sofort ein nützlicher Spezialfall. Setzt man den Streckfaktor $\alpha = 0$ , so steht da $F(\mathbf{0}) = 0 \cdot F(\mathbf{x}) = \mathbf{0}$ . Jede lineare Abbildung schickt den Nullvektor auf den Nullvektor. Das klingt unscheinbar, ist aber der schnellste Linearitäts-Test überhaupt: bildet eine Abbildung $\mathbf{0}$ nicht auf $\mathbf{0}$ ab, kann sie unmöglich linear sein.

Folgerung: Nullvektor auf Nullvektor

F(\mathbf{0}) = \mathbf{0}

Notwendige Bedingung. Gilt sie nicht, ist F sicher nicht linear.

Linear oder nicht? Drei Tests

Test 1: Matrix mal Vektor ist linear

Der wichtigste Fall überhaupt. Nimm $V = \mathbb{R}^n$ , $W = \mathbb{R}^m$ , eine feste Matrix $A \in \mathbb{R}^{m \times n}$ und $F(\mathbf{x}) = A\,\mathbf{x}$ . Ist das linear?

Additivität: $A\,(\mathbf{x}+\mathbf{y}) = A\,\mathbf{x} + A\,\mathbf{y}$ , weil Matrixmultiplikation distributiv ist. Homogenität: $A\,(\alpha\,\mathbf{x}) = \alpha\,A\,\mathbf{x}$ . Beides passt, also ist jede Matrix eine lineare Abbildung.

$\begin{aligned} F(\mathbf{x}+\mathbf{y}) &= A(\mathbf{x}+\mathbf{y}) = A\mathbf{x} + A\mathbf{y} = F(\mathbf{x}) + F(\mathbf{y}), \\ F(\alpha\mathbf{x}) &= A(\alpha\mathbf{x}) = \alpha A\mathbf{x} = \alpha F(\mathbf{x}) \end{aligned}$
Test 2: die Nullabbildung ist linear

Der langweiligste, aber lehrreiche Fall: $F$ schickt jeden Vektor auf den Nullvektor.

Summe von Nullen ist Null, Streckfaktor mal Null ist Null. Beide Bedingungen sind trivial erfüllt. Die Nullabbildung ist linear.

$F: V \longrightarrow W, \qquad \mathbf{x} \longmapsto \mathbf{0}$
Test 3: eine Verschiebung ist NICHT linear

Nimm $F(\mathbf{x}) = \mathbf{x} + \mathbf{a}$ mit einem festen Vektor $\mathbf{a} \neq \mathbf{0}$ , also ‚schiebe alles um $\mathbf{a}$ '. Sieht harmlos aus, ist aber die häufigste Falle.

Schnelltest: $F(\mathbf{0}) = \mathbf{0} + \mathbf{a} = \mathbf{a} \neq \mathbf{0}$ . Schon hier kippt es. Zur Kontrolle ausführlich: $F(\mathbf{x}+\mathbf{y}) = \mathbf{x}+\mathbf{y}+\mathbf{a}$ , aber $F(\mathbf{x})+F(\mathbf{y}) = \mathbf{x}+\mathbf{y}+2\mathbf{a}$ . Die beiden unterscheiden sich um $\mathbf{a}$ , die Additivität ist verletzt.

$F(\mathbf{x}+\mathbf{y}) = \mathbf{x}+\mathbf{y}+\mathbf{a} \;\neq\; (\mathbf{x}+\mathbf{a})+(\mathbf{y}+\mathbf{a}) = F(\mathbf{x})+F(\mathbf{y})$
Auch die Homogenität scheitert bei der Verschiebung

Zur Vollständigkeit prüfen wir die zweite Bedingung der Verschiebung aus Test 3.

Links steht der um $\mathbf{a}$ verschobene, gestreckte Vektor, rechts der gestreckte verschobene. Für $\alpha \neq 1$ sind sie verschieden.

$F(\alpha\,\mathbf{x}) = \alpha\,\mathbf{x} + \mathbf{a} \;\neq\; \alpha\,(\mathbf{x}+\mathbf{a}) = \alpha\,F(\mathbf{x})$

Die Verschiebung aus Test 3 hat trotzdem einen Namen, weil sie ständig auftaucht (Drehung plus Verschiebung in der Computergrafik, Koordinatenwechsel mit verschobenem Ursprung). Eine Abbildung der Form ‚lineare Abbildung plus festen Vektor' heisst affin linear. Merke dir die Abgrenzung sauber: affin linear ist linear genau dann, wenn der angehängte Vektor $\mathbf{a}$ der Nullvektor ist. Sobald $\mathbf{a} \neq \mathbf{0}$ , ist sie affin, aber nicht mehr linear.

Affin lineare Abbildung

F: \mathbb{R}^n \longrightarrow \mathbb{R}^n, \qquad \mathbf{x} \longmapsto A\,\mathbf{x} + \mathbf{a}, \qquad A \in \mathbb{R}^{n \times n},\ \mathbf{a} \in \mathbb{R}^n

Linear nur für

\mathbf{a} = \mathbf{0}

. Für

\mathbf{a} \neq \mathbf{0}

affin, aber nicht linear.

Ein anspruchsvolleres Beispiel: Polynome

Die Kandidaten

Lineare Abbildungen leben nicht nur im $\mathbb{R}^n$ . Hier ist Start- und Zielraum $P_3$ , der Raum der Polynome vom Grad höchstens 3. Wir testen zwei Abbildungen.

Erstens $F_1: p(x) \mapsto p(x) + 1$ (addiere die Konstante 1). Zweitens $F_2: p(x) \mapsto x \cdot p'(x) + p(1)$ (multipliziere die Ableitung mit $x$ und addiere den Funktionswert an der Stelle 1).

$\begin{aligned} F_1&: P_3 \to P_3,\ p(x) \mapsto p(x) + 1; \\ F_2&: P_3 \to P_3,\ p(x) \mapsto x\, p'(x) + p(1) \end{aligned}$
$F_1$ ist nicht linear

Wieder der Trick mit dem ‚ $+1$ ': Konstanten anhängen ist eine versteckte Verschiebung.

Bilde die Summe ab: $F_1(p+q) = p+q+1$ . Bilde einzeln ab und addiere: $F_1(p)+F_1(q) = (p+1)+(q+1) = p+q+2$ . Differenz: eine 1 zu viel. Nicht additiv, also nicht linear.

$F_1(p+q) = p+q+1 \;\neq\; (p+1)+(q+1) = F_1(p) + F_1(q)$
$F_2$ ist linear: Additivität

Ableiten ist additiv, der Funktionswert an einer festen Stelle ist additiv. Das überträgt sich.

Setze die Summe ein und nutze $(p+q)' = p'+q'$ sowie $(p+q)(1) = p(1)+q(1)$ . Alles sortiert sich genau in $F_2(p)+F_2(q)$ .

$\begin{aligned} F_2(p+q) &= x\,(p+q)' + (p+q)(1) \\ &= x\,p' + p(1) + x\,q' + q(1) = F_2(p) + F_2(q) \end{aligned}$
$F_2$ ist linear: Homogenität

Streckfaktor durchziehen: Ableitung und Funktionswert sind beide homogen.

Es ist $(\alpha p)' = \alpha p'$ und $(\alpha p)(1) = \alpha\,p(1)$ , also lässt sich $\alpha$ vorklammern. $F_2$ erfüllt beide Bedingungen und ist somit linear.

$\begin{aligned} F_2(\alpha\, p) &= x\,(\alpha p)' + (\alpha p)(1) \\ &= \alpha\,\bigl(x\,p' + p(1)\bigr) = \alpha\,F_2(p) \end{aligned}$

Definition Lineare Abbildung
Abbildung

F: V \to W

zwischen Vektorräumen mit

F(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha F(\mathbf{u}) + \beta F(\mathbf{v})

. Äquivalent: additiv und homogen.

Notation Notation: $F$ , $V$ , $W$ , $\mapsto$

F

= Name der Abbildung.

V

= Startraum,

W

= Zielraum (beide Vektorräume).

F: V \to W

liest sich ‚

F

bildet

V

nach

W

ab'. Der Pfeil

\mapsto

(mit Querstrich) verbindet ein einzelnes Element mit seinem Bild:

\mathbf{x} \mapsto F(\mathbf{x})

Formel Kernidee

F(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha F(\mathbf{u}) + \beta F(\mathbf{v})

F

vertauscht mit jeder Linearkombination. Das ist die ganze Definition in einer Zeile.

Merke Schnelltest

F(\mathbf{0}) \neq \mathbf{0}

⇒

F

ist nicht linear. Geht der Nullvektor woandershin, ist nichts mehr zu retten.

Querverweis Verweise
→ Kap. 1: Matrix mal Vektor
→ Kap. 4: Was ist ein Vektorraum

5.1 Jede lineare Abbildung ist eine Matrix

Hier eine Frage, die alles vereinfacht: Wenn $F$ linear ist, wie viel musst du wirklich über $F$ wissen, um sie vollständig zu kennen? Erstaunlich wenig. Es genügt, zu wissen, wohin $F$ die Basisvektoren schickt. Warum? Weil jeder Vektor eine Linearkombination der Basisvektoren ist, und Linearität sagt, dass $F$ mit Linearkombinationen vertauscht. Kennst du die Bilder der Bausteine, kennst du das Bild von allem.

Anschaulich: die Basisvektoren sind die Bausteine des Raums. Lege fest, was $F$ mit jedem Baustein macht, und $F$ ist überall festgelegt. Genau das macht eine Matrix möglich. Um aus $F$ eine Matrix zu bauen, brauchen wir zwei Basen: eine Basis $B = (\mathbf{b}_1, \ldots, \mathbf{b}_n)$ für den Startraum $V$ und eine Basis $C$ für den Zielraum $W$ .

Den Koordinatenvektor eines Vektors $\mathbf{x}$ bezüglich der Basis $B$ schreiben wir $[\mathbf{x}]_B$ . Das ist die Liste der Gewichte, mit denen man die Basisvektoren von $B$ kombinieren muss, um $\mathbf{x}$ zu erhalten. Ist $\mathbf{x} = x_1\,\mathbf{b}_1 + \cdots + x_n\,\mathbf{b}_n$ , dann ist $[\mathbf{x}]_B = (x_1, \ldots, x_n)^\mathsf{T}$ . Ebenso steht $[\mathbf{y}]_C$ für die Koordinaten des Bildes $\mathbf{y} = F(\mathbf{x})$ in der Zielbasis $C$ .

Die Darstellungsmatrix $A$ von $F$ bezüglich $B$ und $C$ übersetzt nun Koordinaten in Koordinaten: aus den Start-Koordinaten $[\mathbf{x}]_B$ macht das Matrixprodukt $A\,[\mathbf{x}]_B$ die Ziel-Koordinaten $[\mathbf{y}]_C$ . So wird aus einer abstrakten Abbildung eine ganz konkrete Matrix, mit der man rechnen kann.

Koordinatenvektoren in Start- und Zielbasis

\begin{aligned} [\mathbf{x}]_B &= (x_1, \ldots, x_n)^\mathsf{T}, \\ [\mathbf{y}]_C &= (y_1, \ldots, y_n)^\mathsf{T}, \qquad \mathbf{y} = F(\mathbf{x}) \end{aligned}

[\mathbf{x}]_B

: Gewichte von

\mathbf{x}

in der Basis

B

[\mathbf{y}]_C

: Gewichte des Bildes in der Basis

C

Darstellungsmatrix: Koordinaten auf Koordinaten

\begin{aligned} (y_1, \ldots, y_n)^\mathsf{T} &= A \cdot (x_1, \ldots, x_n)^\mathsf{T}, \\ \text{kurz}\quad [\,F(\mathbf{x})\,]_C &= A \cdot [\mathbf{x}]_B \end{aligned}

A

= Darstellungsmatrix von

F

bezüglich der Basen

B

(Start) und

C

(Ziel).

Darstellungsmatrix bestimmen (Ableitungs-Operator)

Schritt 1: Räume und Basen festlegen

Ohne Basen gibt es keine Matrix. Wir brauchen je eine Basis für Start und Ziel.

Start $V = P_2$ (Polynome bis Grad 2) mit Basis $B = (1, x, x^2)$ . Ziel $W = P_1$ (Polynome bis Grad 1) mit Basis $C = (1, x)$ . Die Abbildung ist $F: p(x) \mapsto p'(x) + p''(x)$ , also erste plus zweite Ableitung.

$B = (1,\ x,\ x^2), \qquad C = (1,\ x), \qquad F(p(x)) = p'(x) + p''(x)$
Schritt 2: jeden Basisvektor abbilden

Nach dem Kochrezept brauchen wir die Bilder $F(\mathbf{b}_1), F(\mathbf{b}_2), F(\mathbf{b}_3)$ in $C$ -Koordinaten.

Für die Konstante 1 sind erste und zweite Ableitung null. Für $x$ ist $x' = 1$ , $x'' = 0$ . Für $x^2$ ist $(x^2)' = 2x$ , $(x^2)'' = 2$ , zusammen $2x + 2$ .

$\begin{aligned} F(1) = 0 \ &\Rightarrow\ [F(\mathbf{b}_1)]_C = (0,0)^\mathsf{T}; \\ F(x) = 1 \ &\Rightarrow\ (1,0)^\mathsf{T}; \\ F(x^2) = 2x+2 \ &\Rightarrow\ (2,2)^\mathsf{T} \end{aligned}$
Schritt 3: Spalten zusammensetzen

Die drei Koordinatenvektoren werden zu den drei Spalten von $A$ .

$A$ ist eine $2 \times 3$ -Matrix: zwei Zeilen, weil $C$ zwei Elemente hat, drei Spalten, weil $B$ drei Elemente hat.

$A = \begin{pmatrix} 0 & 1 & 2 \\ 0 & 0 & 2 \end{pmatrix}$
Schritt 4: Kontrolle an einem konkreten Polynom

Ein guter Test: rechne einmal direkt und einmal über die Matrix, beides muss übereinstimmen.

Nimm $p(x) = x^2 + x + 4$ , also $[p]_B = (4,1,1)^\mathsf{T}$ (Gewichte von $1$ , $x$ , $x^2$ ). Direkt: $F(p) = (2x+1) + 2 = 2x+3$ , also $[F(p)]_C = (3,2)^\mathsf{T}$ . Über die Matrix: $A\,(4,1,1)^\mathsf{T} = (3,2)^\mathsf{T}$ . Passt.

$\begin{aligned} A \cdot \begin{pmatrix} 4 \\ 1 \\ 1 \end{pmatrix} &= \begin{pmatrix} 0\cdot4 + 1\cdot1 + 2\cdot1 \\ 0\cdot4 + 0\cdot1 + 2\cdot1 \end{pmatrix} \\ &= \begin{pmatrix} 3 \\ 2 \end{pmatrix} = [F(p)]_C \end{aligned}$

Definition Darstellungsmatrix
Matrix

A

, die zu

F

, einer Basis

B

(Start) und

C

(Ziel) gehört. Sie übersetzt

[\mathbf{x}]_B

[F(\mathbf{x})]_C

per

A\,[\mathbf{x}]_B

Notation Notation: $[\mathbf{x}]_B$
Koordinatenvektor von

\mathbf{x}

bezüglich der Basis

B

, also die Liste der Gewichte in

\mathbf{x} = x_1\mathbf{b}_1 + \cdots + x_n\mathbf{b}_n

. Der Index

B

sagt: in welcher Basis gemessen wird.

Formel Übersetzung

[F(\mathbf{x})]_C = A \cdot [\mathbf{x}]_B

Matrix mal Start-Koordinaten ergibt Ziel-Koordinaten.

Merke Kochrezept Abbildungsmatrix
Jeden Basisvektor abbilden → Ergebnis in Zielkoordinaten → als Spalten nebeneinander. Spalte

j

[F(\mathbf{b}_j)]_C

5.2Kern, Bild, Rang

5.2.1 Kern und Bild

Zwei natürliche Fragen zu jeder Maschine: Welche Inputs verschluckt sie zu null? Und welche Outputs sind überhaupt erreichbar? Die erste Frage führt zum Kern, die zweite zum Bild. Beide gehören zum Standard-Werkzeugkasten, wenn man eine lineare Abbildung verstehen will.

Der Kern $\operatorname{Ker}(A)$ ist die Menge aller Startvektoren, die $A$ auf den Nullvektor abbildet. Anschaulich sind das die toten Richtungen der Abbildung: alles, was platt auf null gedrückt wird, verschwindet im Kern. Das Bild $\operatorname{Im}(A)$ ist die Menge aller Vektoren, die als Ergebnis $A\,\mathbf{x}$ wirklich auftreten. Anschaulich ist das die erreichbare Welt: alle möglichen Outputs der Maschine.

Beide hängen direkt mit Gleichungssystemen zusammen. Ein Vektor $\mathbf{x}$ liegt im Kern genau dann, wenn er das homogene System $A\,\mathbf{x} = \mathbf{0}$ löst. Und ein Vektor $\mathbf{b}$ liegt im Bild genau dann, wenn das System $A\,\mathbf{x} = \mathbf{b}$ lösbar ist. Da $A\,\mathbf{x}$ eine Linearkombination der Spalten von $A$ ist (die Spaltensicht aus Kap. 1), ist das Bild genau der von den Spalten aufgespannte Raum.

Kern

\operatorname{Ker}(A) = \{\, \mathbf{x} \in V : A\,\mathbf{x} = \mathbf{0} \,\}

Alle Vektoren, die auf den Nullvektor abgebildet werden. Lösungsmenge von

A\mathbf{x} = \mathbf{0}

Bild

\begin{aligned} \operatorname{Im}(A) &= \{\, \mathbf{y} \in W : \exists\, \mathbf{x} \text{ mit } \mathbf{y} = A\,\mathbf{x} \,\} \\ &= \operatorname{span}\{\mathbf{a}^{(1)}, \ldots, \mathbf{a}^{(n)}\} \end{aligned}

Alle erreichbaren Bildvektoren, gleich dem Spann der Spalten

\mathbf{a}^{(1)}, \ldots, \mathbf{a}^{(n)}

von

A

Bild und Kern als Lösbarkeitsfragen

\begin{aligned} \mathbf{b} \in \operatorname{Im}(A) \;&\Leftrightarrow\; A\,\mathbf{x} = \mathbf{b} \text{ lösbar}, \\ \mathbf{x} \in \operatorname{Ker}(A) \;&\Leftrightarrow\; A\,\mathbf{x} = \mathbf{0} \end{aligned}

Bild = welche rechten Seiten lösbar sind. Kern = Lösungen des homogenen Systems.

Kern und Bild sind nicht irgendwelche Mengen, sondern Unterräume: der Kern $\operatorname{Ker}(A)$ ist ein Unterraum des Startraums $\mathbb{R}^n$ , das Bild $\operatorname{Im}(A)$ ein Unterraum des Zielraums $\mathbb{R}^m$ . Das ist beruhigend, denn es heisst, sie haben jeweils eine Basis und eine Dimension, mit denen man sauber rechnen kann (Unterraum, Basis und Spann sind in Kap. 4 erklärt).

Kern und Bild sind Unterräume

\begin{aligned} \operatorname{Ker}(A) &\subseteq \mathbb{R}^n \text{ ist ein Unterraum}, \\ \operatorname{Im}(A) &\subseteq \mathbb{R}^m \text{ ist ein Unterraum} \end{aligned}

Kern lebt im Startraum, Bild im Zielraum. Beide sind abgeschlossen unter Addition und Skalierung.

Beispiel A: ein einfacher 1×2-Fall

Die Abbildung und ihre Matrix

Mit dem kleinstmöglichen Beispiel sieht man Kern und Bild ohne Rechenaufwand.

$F: \mathbb{R}^2 \to \mathbb{R}$ , $(x_1, x_2)^\mathsf{T} \mapsto x_1 - x_2$ . Die zugehörige Matrix ist eine einzige Zeile.

$F(x_1, x_2) = x_1 - x_2, \qquad A = \begin{pmatrix} 1 & -1 \end{pmatrix}$
Kern: wo wird es null?

Wir suchen alle $(x_1, x_2)$ mit $x_1 - x_2 = 0$ .

Das bedeutet $x_1 = x_2$ . Setzt man $x_1 = x_2 = t$ , durchläuft $(t, t)^\mathsf{T}$ eine ganze Gerade. Der Kern ist also eindimensional, eine Gerade durch den Ursprung.

$\begin{aligned} \operatorname{Ker}(F) &= \{\, (x_1, x_2)^\mathsf{T} : x_1 = x_2 \,\} \\ &= \{\, t\,(1,1)^\mathsf{T} : t \in \mathbb{R} \,\} \end{aligned}$
Bild: was kommt heraus?

Der Output ist eine einzelne Zahl $x_1 - x_2$ . Welche Zahlen sind erreichbar?

Mit passenden $x_1, x_2$ erreicht man jede reelle Zahl. Das Bild ist ganz $\mathbb{R}$ .

$\operatorname{Im}(F) = \mathbb{R}$

Beispiel B: Kern und Bild via Gauss

Die Matrix

Bei grösseren Matrizen liest man Kern und Bild nicht mehr ab, sondern bringt $A$ auf Zeilenstufenform.

Gegeben ist eine $3 \times 4$ -Matrix. Wir lösen $A\,\mathbf{x} = \mathbf{0}$ .

$A = \begin{pmatrix} 2 & 1 & 1 & 0 \\ -4 & 0 & 1 & -3 \\ 2 & 1 & 1 & 0 \end{pmatrix}$
Schritt 1: Gauss-Elimination

Zeilenoperationen ändern den Kern nicht, machen ihn aber ablesbar. Zeile II plus 2·Zeile I, Zeile III minus Zeile I.

Die dritte Zeile fällt weg (sie war eine Kopie der ersten). Es bleiben zwei nichttriviale Zeilen, also zwei Pivots in den Spalten 1 und 2.

$A \rightsquigarrow \begin{pmatrix} 2 & 1 & 1 & 0 \\ 0 & 2 & 3 & -3 \\ 0 & 0 & 0 & 0 \end{pmatrix}$
Schritt 2: freie Parameter wählen

Die Spalten 3 und 4 haben keinen Pivot, also sind $x_3$ und $x_4$ frei wählbar. Aus ihnen ergeben sich $x_2$ und $x_1$ .

Setze $x_4 = s$ und $x_3 = t$ . Rückwärtseinsetzen liefert $x_2 = \tfrac{3}{2}(s - t)$ und $x_1 = \tfrac{1}{4}(t - 3s)$ .

$x_4 = s,\quad x_3 = t,\quad x_2 = \tfrac{3}{2}(s - t),\quad x_1 = \tfrac{1}{4}(t - 3s)$
Schritt 3: Kernbasis ablesen

Zwei freie Parameter bedeuten einen zweidimensionalen Kern. Jeder Parameter liefert einen Basisvektor.

Setze einmal $(s,t) = (1,0)$ und einmal $(0,1)$ , multipliziere zur Lesbarkeit mit 4. So entstehen zwei unabhängige Kernvektoren.

$\operatorname{Ker}(A) = \operatorname{span}\{\, (-3, 6, 0, 4)^\mathsf{T},\ (1, -6, 4, 0)^\mathsf{T} \,\}$
Schritt 4: Bildbasis ablesen (Vorsicht!)

Die Pivots stehen in den Spalten 1 und 2. Diese Spalten sind linear unabhängig und spannen das Bild auf.

Wichtig: nimm die Original-Spalten von $A$ , nicht die der Zeilenstufenform. Also Spalte 1 und Spalte 2 der Ausgangsmatrix.

$\operatorname{Im}(A) = \operatorname{span}\{\, (2, -4, 2)^\mathsf{T},\ (1, 0, 1)^\mathsf{T} \,\}$

Definition Kern

\operatorname{Ker}(A) = \{\mathbf{x} : A\mathbf{x} = \mathbf{0}\}

. Die ‚toten Richtungen', Unterraum des Startraums. Deutsch oft Kern

(A)

geschrieben.

Definition Bild

\operatorname{Im}(A) = \{A\mathbf{x}\}

= Spann der Spalten. Die ‚erreichbare Welt', Unterraum des Zielraums. Deutsch oft Bild

(A)

Notation Notation: $\operatorname{Ker}(A)$ , $\operatorname{Im}(A)$
Wir schreiben

\operatorname{Ker}

(von kernel) und

\operatorname{Im}

(von image). Manche Texte schreiben deutsch Kern

(A)

und Bild

(A)

, gemeint ist dasselbe.

Merke So findet man sie
Kern:

A\mathbf{x} = \mathbf{0}

per Gauss lösen, freie Parameter geben die Basis. Bild: Pivot-Spalten bestimmen, die Original-Spalten als Basis nehmen.

Querverweis Verweise
→ Kap. 1: Spaltensicht
→ Kap. 4: Unterraum, Basis, Spann

5.2.2 Der Rang

Frage: Wie viele unabhängige Richtungen überleben die Abbildung? Genau diese Zahl heisst der Rang. Anschaulich ist der Rang die effektive Breite der Maschine, also wie viele Dimensionen am Ausgang wirklich ankommen. Eine Matrix kann viele Spalten haben und trotzdem nur wenige unabhängige Richtungen erzeugen, der Rang misst das.

Definiert ist der Rang als die Dimension des Bildes, $\operatorname{rang}(A) = \dim(\operatorname{Im}(A))$ . Das ist sofort plausibel: das Bild ist der Spann der Spalten, und seine Dimension ist die Anzahl unabhängiger Spalten, also die Anzahl der Pivots in der Zeilenstufenform. Bemerkenswert: man erhält denselben Wert, ob man unabhängige Spalten oder unabhängige Zeilen zählt. Deshalb gilt $\operatorname{rang}(A) = \operatorname{rang}(A^\mathsf{T})$ , Zeilenrang gleich Spaltenrang.

Rang

\begin{aligned} \operatorname{rang}(A) &= \dim(\operatorname{Im}(A)), \\ \operatorname{rang}(A) &= \operatorname{rang}(A^\mathsf{T}) \end{aligned}

Anzahl unabhängiger Spalten = Anzahl unabhängiger Zeilen = Anzahl Pivots.

Jetzt kommt die wichtigste Formel des Abschnitts, die Dimensionsformel (auch Rangsatz genannt). Sie verknüpft Kern und Bild: die Dimension des Kerns plus die Dimension des Bildes ist gleich der Anzahl $n$ der Spalten, also der Dimension des Startraums.

Lies sie als Erhaltungssatz: die $n$ Input-Dimensionen teilen sich sauber auf. Ein Teil wird ‚verschluckt' (geht in den Kern, also auf null), der Rest ‚überlebt' (landet im Bild). Nichts geht verloren, nichts kommt dazu. Wer also den Kern kennt, kennt sofort den Rang, und umgekehrt.

!!!

Dimensionsformel (Rangsatz)

\dim(\operatorname{Ker}(A)) + \dim(\operatorname{Im}(A)) = n

n

= Anzahl Spalten = Dimension des Startraums. Verschluckt (Kern) plus überlebt (Bild) = alles.

Kerndimension über die Transponierte

\dim(\operatorname{Ker}(A)) = \dim(\operatorname{Im}(A^\mathsf{T}))

Eine weitere Brücke zwischen Kern und Bild über die transponierte Matrix

A^\mathsf{T}

Eine kurze Gegenprobe mit Beispiel B aus dem letzten Abschnitt: die $3 \times 4$ -Matrix hatte $n = 4$ Spalten und einen zweidimensionalen Kern, also $\dim(\operatorname{Ker}) = 2$ . Die Dimensionsformel sagt $\dim(\operatorname{Im}) = 4 - 2 = 2$ , der Rang ist 2. Und genau zwei Pivot-Spalten hatten wir gefunden. Alles passt zusammen.

Definition Rang

\operatorname{rang}(A) = \dim(\operatorname{Im}(A))

= Anzahl unabhängiger Spalten = Anzahl Pivots in der Zeilenstufenform. Es gilt

\operatorname{rang}(A) = \operatorname{rang}(A^\mathsf{T})

Formel Dimensionsformel

\dim(\operatorname{Ker}(A)) + \dim(\operatorname{Im}(A)) = n

Rangsatz: verschluckte plus überlebende Dimensionen ergeben die Spaltenzahl

n

Merke Rang ablesen
Rang = Anzahl Pivots in der Zeilenstufenform. Immer

\operatorname{rang}(A) \leq \min(m, n)

5.2.3 Zusammengesetzte Abbildungen

Stell dir ein Fliessband mit zwei Stationen vor: zuerst läuft jeder Vektor durch die Maschine $F$ , dann durch die Maschine $G$ . Zwei Fragen drängen sich auf: Ist die Gesamtmaschine wieder linear? Und welche Matrix gehört zu ihr? Beide Antworten sind erfreulich klar.

Erstens: Die Zusammensetzung zweier linearer Abbildungen ist wieder linear. Das ist die Grundlage dafür, dass man komplizierte Abbildungen aus einfachen zusammenstückeln darf, ohne die Linearität zu verlieren. Zweitens: Ist $F(\mathbf{x}) = A\,\mathbf{x}$ (von $\mathbb{R}^n$ nach $\mathbb{R}^m$ ) und $G(\mathbf{y}) = B\,\mathbf{y}$ (von $\mathbb{R}^m$ nach $\mathbb{R}^p$ ), so gehört zur Gesamtabbildung das Matrixprodukt $B\,A$ .

Achtung auf die Reihenfolge: Wir schreiben die zusammengesetzte Abbildung $G \circ F$ , gelesen ‚ $G$ nach $F$ ', und sie wirkt $\mathbf{x} \mapsto B\,A\,\mathbf{x}$ . Die Matrix, die zuerst angewendet wird ( $A$ , für $F$ ), steht rechts; die zuletzt angewendete ( $B$ , für $G$ ) steht links. Genau wie bei verschachtelten Funktionen $f(g(x))$ , wo $g$ zuerst dran ist, obwohl es weiter innen steht.

Die beiden Stationen

F: \mathbb{R}^n \longrightarrow \mathbb{R}^m,\ \mathbf{x} \mapsto A\,\mathbf{x}; \qquad G: \mathbb{R}^m \longrightarrow \mathbb{R}^p,\ \mathbf{y} \mapsto B\,\mathbf{y}

Hier ist

B

die Darstellungsmatrix von

G

, nicht eine Basis. Erst

F

, dann

G

Zusammengesetzte Abbildung

G \circ F = H: \mathbb{R}^n \longrightarrow \mathbb{R}^p, \qquad \mathbf{x} \longmapsto B\,A\,\mathbf{x}

Reihenfolge: rechts steht die zuerst angewandte Matrix

A

, links die zuletzt angewandte

B

Ein Dimensionscheck macht die Reihenfolge zwingend: $A$ ist $m \times n$ , $B$ ist $p \times m$ . Das Produkt $B\,A$ passt nur in dieser Reihenfolge zusammen (die ‚innere' Dimension $m$ muss übereinstimmen) und ergibt eine $p \times n$ -Matrix, genau die Form, die von $\mathbb{R}^n$ nach $\mathbb{R}^p$ abbildet. Schriebe man $A\,B$ , würden die Dimensionen meist gar nicht passen.

Definition Zusammengesetzte Abbildung

G \circ F

(‚

G

nach

F

'): erst

F

, dann

G

. Ist

F = A\,\cdot

und

G = B\,\cdot

, dann

G \circ F = (B\,A)\,\cdot

Notation Notation: $G \circ F$
Der Kringel

\circ

heisst ‚nach'.

G \circ F

bedeutet: wende zuerst

F

an, dann

G

. Achtung, die Leserichtung ist von rechts nach links, wie bei

f(g(x))

Formel Komposition

G \circ F: \mathbf{x} \longmapsto B\,A\,\mathbf{x}

Zuerst angewandte Matrix steht rechts.

Querverweis Verweise
→ Kap. 2: Matrixmultiplikation
→ Kap. 2: Nicht-Kommutativität

5.3Skalarprodukt und lineare Abbildungen

5.3 Die Transponierte, Orthogonalität und Lösbarkeit

Bisher lebten Kern und Bild getrennt: der Kern im Startraum, das Bild im Zielraum. Wie hängen sie zusammen? Die Brücke ist das Skalarprodukt. Und gleich danach beantworten wir damit eine der wichtigsten Fragen der linearen Algebra: Wann ist ein System $A\,\mathbf{x} = \mathbf{b}$ überhaupt lösbar?

Das anschauliche Bild: der Zielraum $\mathbb{R}^m$ zerfällt in zwei zueinander senkrechte Teile. Der eine Teil ist das Bild $\operatorname{Im}(A)$ , also alles, was $A$ erreichen kann. Der andere ist der Kern der transponierten Matrix, $\operatorname{Ker}(A^\mathsf{T})$ , also alles, was das Bild nicht erreicht. Zusammen spannen die beiden den ganzen $\mathbb{R}^m$ auf, und sie stehen senkrecht aufeinander. Was das Bild verfehlt, steht also genau orthogonal dazu.

Der Grund dafür steckt in einer Rechenregel für das Skalarprodukt, der Adjungiertheit. Sie sagt: Man darf die Matrix $A$ im Skalarprodukt von der einen auf die andere Seite schieben, wenn man sie dabei transponiert. Diese Gleichung ist im Grunde die definierende Eigenschaft der transponierten Matrix.

Bild und Kern der Transponierten spannen den Zielraum auf

\operatorname{Im}(A) + \operatorname{Ker}(A^\mathsf{T}) = \mathbb{R}^m

Jeder Vektor des Zielraums zerlegt sich in einen Bild-Anteil und einen dazu senkrechten Anteil.

Adjungiertheit (Verschieben im Skalarprodukt)

\langle A\,\mathbf{z},\, \mathbf{y} \rangle = \langle \mathbf{z},\, A^\mathsf{T}\mathbf{y} \rangle \qquad \forall\, \mathbf{z} \in \mathbb{R}^n,\ \mathbf{y} \in \mathbb{R}^m

A

auf die andere Seite schieben macht es zu

A^\mathsf{T}

. Das definiert die Transponierte.

Bild senkrecht zum Kern der Transponierten

\operatorname{Im}(A) \perp \operatorname{Ker}(A^\mathsf{T})

Das Symbol

\perp

heisst ‚steht senkrecht auf'. Die beiden Räume sind orthogonal zueinander.

Dimensionsbilanz im Zielraum

\dim(\operatorname{Im}(A)) + \dim(\operatorname{Ker}(A^\mathsf{T})) = m

Analog zur Dimensionsformel, aber im Zielraum

\mathbb{R}^m

: erreichbar plus unerreichbar = alles.

Aus diesem Bild folgt direkt die Fredholm-Alternative, ein Lösbarkeitskriterium. Anschaulich: $A\,\mathbf{x} = \mathbf{b}$ ist genau dann lösbar, wenn $\mathbf{b}$ keine ‚verbotene Komponente' hat, also vollständig im Bild liegt. Und ‚im Bild liegen' heisst nach dem Senkrecht-Bild: $\mathbf{b}$ steht senkrecht auf allem, was das Bild verfehlt, das heisst senkrecht auf allen Lösungen von $A^\mathsf{T}\mathbf{y} = \mathbf{0}$ .

Das ist enorm praktisch: Statt das ganze System $A\,\mathbf{x} = \mathbf{b}$ zu lösen, prüft man nur ein paar Skalarprodukte. (Was ein Skalarprodukt $\langle \cdot, \cdot \rangle$ und eine Norm genau ist, steht in Kap. 4; hier brauchen wir nur, dass ein Skalarprodukt gleich null genau Orthogonalität bedeutet.)

Fredholm-Alternative (Lösbarkeitskriterium)

A\,\mathbf{x} = \mathbf{b} \text{ lösbar} \;\Longleftrightarrow\; \mathbf{b} \perp \mathbf{y} \ \text{ für alle } \mathbf{y} \text{ mit } A^\mathsf{T}\mathbf{y} = \mathbf{0}

Lösbar genau dann, wenn

\mathbf{b}

senkrecht auf jeder Lösung des transponierten homogenen Systems steht.

Definition Adjungiertheit

\langle A\mathbf{z}, \mathbf{y} \rangle = \langle \mathbf{z}, A^\mathsf{T}\mathbf{y} \rangle

. Die transponierte Matrix

A^\mathsf{T}

ist diejenige, die

A

im Skalarprodukt auf die andere Seite holt.

Notation Notation: $\langle \cdot, \cdot \rangle$ , $A^\mathsf{T}$ , $\perp$

\langle \mathbf{u}, \mathbf{v} \rangle

= Skalarprodukt (eine Zahl).

A^\mathsf{T}

= Transponierte von

A

(Zeilen und Spalten getauscht).

\perp

= ‚steht senkrecht auf', gleichbedeutend mit Skalarprodukt null.

Formel Adjungiertheit

\langle A\mathbf{z}, \mathbf{y} \rangle = \langle \mathbf{z}, A^\mathsf{T}\mathbf{y} \rangle

Verschieben von

A

im Skalarprodukt erzeugt

A^\mathsf{T}

Merke Fundamentalsatz, Kurzform

\operatorname{Im}(A) \perp \operatorname{Ker}(A^\mathsf{T})

, und beide zusammen füllen

\mathbb{R}^m

. Was das Bild verfehlt, steht senkrecht darauf.

Querverweis Verweise
→ Kap. 4: Skalarprodukt, Norm

5.4Lineare Selbstabbildungen

5.4 Invertierbare Abbildungen und Umkehrabbildung

Eine Selbstabbildung bildet einen Raum auf sich selbst ab, $F: V \to V$ . Start- und Zielraum sind also gleich. Die zentrale Frage hier: Kann man die Maschine rückwärts laufen lassen und genau den ursprünglichen Input zurückbekommen?

Anschaulich heisst das, $F$ ist verlustfrei: zu jedem Output gehört genau ein Input, nichts wird vermischt oder plattgedrückt. Wie das Entpacken einer ZIP-Datei, das exakt die Originaldatei zurückgibt. Formal: $F$ heisst invertierbar, wenn es zu jedem $\mathbf{y} \in V$ genau ein $\mathbf{x} \in V$ mit $F(\mathbf{x}) = \mathbf{y}$ gibt. Das Zeichen $\exists!$ steht dabei für ‚es existiert genau ein'.

Ist $F$ invertierbar, definiert man die Umkehrabbildung $F^{-1}$ : sie schickt jeden Output $\mathbf{y}$ zurück auf seinen eindeutigen Input $\mathbf{x}$ . Für Matrizen ist die Bedingung handfest: $F(\mathbf{x}) = A\,\mathbf{x}$ ist genau dann invertierbar, wenn die Matrix $A$ regulär ist (also eine Inverse $A^{-1}$ besitzt). Die Umkehrabbildung ist dann selbst wieder linear, mit Matrix $A^{-1}$ .

Invertierbar (Selbstabbildung)

F: V \longrightarrow V \text{ invertierbar} \;\Longleftrightarrow\; \forall\, \mathbf{y} \in V\ \exists!\, \mathbf{x} \in V: F(\mathbf{x}) = \mathbf{y}

\exists!

heisst ‚es existiert genau ein'. Jeder Output hat genau einen Input.

Umkehrabbildung

F^{-1}: V \longrightarrow V, \qquad \mathbf{y} \longmapsto \mathbf{x} \ \text{ mit } F(\mathbf{x}) = \mathbf{y}

Schickt jeden Output zurück auf seinen eindeutigen Input.

Matrixfall: invertierbar = regulär

\begin{aligned} F(\mathbf{x}) = A\,\mathbf{x} \text{ invertierbar} \;&\Longleftrightarrow\; A \text{ regulär}, \\ F^{-1}(\mathbf{y}) &= A^{-1}\mathbf{y} \end{aligned}

F^{-1}

ist wieder linear, ihre Matrix ist die Inverse

A^{-1}

Hin und zurück ergibt die Identität

F \circ F^{-1} = F^{-1} \circ F = \operatorname{Id}, \qquad \operatorname{Id}: \mathbb{R}^n \to \mathbb{R}^n,\ \mathbf{x} \mapsto \mathbf{x}

\operatorname{Id}

ist die identische Abbildung, die jeden Vektor unverändert lässt.

Definition Invertierbar / Umkehrabbildung

F: V \to V

ist invertierbar, wenn jeder Output genau einen Input hat. Dann gibt es

F^{-1}

mit

F^{-1} \circ F = \operatorname{Id}

Notation Notation: $F^{-1}$ , $\operatorname{Id}$ , $\exists!$

F^{-1}

= Umkehrabbildung.

\operatorname{Id}

= identische Abbildung (

\mathbf{x} \mapsto \mathbf{x}

\exists!

= ‚es existiert genau ein'.

Merke Äquivalenzkette

A

regulär ⇔ invertierbar ⇔

\det(A) \neq 0

⇔ voller Rang ⇔

\operatorname{Ker}(A) = \{\mathbf{0}\}

Querverweis Verweise
→ Kap. 2: Inverse, reguläre Matrix
→ Kap. 3: Determinante, det ungleich null

5.4.1 Koordinatentransformation und Basiswechsel

Hier ist die Frage, um die sich der ganze Abschnitt dreht: Derselbe Vektor, eine andere Basis, wie rechne ich seine Koordinaten um? Und was passiert mit der Matrix einer Abbildung, wenn man die Basis wechselt? Das ist nicht nur Buchhaltung. Die Schwierigkeit eines Problems hängt oft allein von der Wahl der Basis ab. In der richtigen Basis wird aus einer hässlichen Matrix eine Diagonalmatrix, und plötzlich ist alles einfach (genau das ist das Thema von Kap. 6).

Das anschauliche Bild: Ein Basiswechsel ist ein Wechsel der Masseinheit oder der Landkarte. Der Ort, also der Vektor selbst, bleibt liegen, wo er ist. Nur die Zahlen, mit denen wir ihn beschreiben, ändern sich. Die Matrix, die zwischen den beiden Zahlensystemen umrechnet, ist sozusagen der Wechselkurs.

Wir messen denselben Vektor $\mathbf{v}$ in zwei Basen, $B$ und $B'$ . Das liefert zwei Koordinatenvektoren, $[\mathbf{v}]_B$ und $[\mathbf{v}]_{B'}$ . Die Übergangsmatrix rechnet den einen in den anderen um. Wir nennen $T$ die Übergangsmatrix von $B$ nach $B'$ und $S$ die von $B'$ zurück nach $B$ . Da Hin- und Rückrechnung sich aufheben, gilt $T = S^{-1}$ .

Koordinatenvektoren in zwei Basen

[\mathbf{v}]_B = (v_1, \ldots, v_n)^\mathsf{T}, \qquad [\mathbf{v}]_{B'} = (v_1', \ldots, v_n')^\mathsf{T}

Derselbe Vektor

\mathbf{v}

, zweimal vermessen: einmal in

B

, einmal in

B'

Übergangsmatrix T (von B nach B′)

\begin{aligned} [\mathbf{v}]_{B'} &= \bigl(\,[\mathbf{b}_1]_{B'}\ \cdots\ [\mathbf{b}_n]_{B'}\,\bigr) \cdot [\mathbf{v}]_B \\ &= T \cdot [\mathbf{v}]_B \end{aligned}

Spalten von

T

= alte Basisvektoren

\mathbf{b}_j

, ausgedrückt in den neuen Koordinaten

B'

Übergangsmatrix S (von B′ nach B) und ihr Zusammenhang

\begin{aligned} [\mathbf{v}]_B &= \bigl(\,[\mathbf{b}_1']_B\ \cdots\ [\mathbf{b}_n']_B\,\bigr) \cdot [\mathbf{v}]_{B'} \\ &= S \cdot [\mathbf{v}]_{B'}, \qquad T = S^{-1} \end{aligned}

S

rechnet von

B'

zurück nach

B

. Hin und zurück hebt sich auf:

T = S^{-1}

Beispiel C: eine Übergangsmatrix aufstellen

Die zwei Basen

Wir nehmen die einfachste nichttriviale Situation im $\mathbb{R}^2$ : Standardbasis und eine gedrehte Basis.

$B = (\mathbf{e}_1, \mathbf{e}_2)$ ist die Standardbasis. $B' = (\mathbf{e}_1', \mathbf{e}_2')$ mit $\mathbf{e}_1' = \mathbf{e}_1 + \mathbf{e}_2$ und $\mathbf{e}_2' = \mathbf{e}_2 - \mathbf{e}_1$ .

$\mathbf{e}_1' = \mathbf{e}_1 + \mathbf{e}_2, \qquad \mathbf{e}_2' = \mathbf{e}_2 - \mathbf{e}_1$
Spalten aus den neuen Basisvektoren in B-Koordinaten

Um von $B'$ nach $B$ zu rechnen, schreiben wir jeden $B'$ -Vektor in $B$ -Koordinaten als Spalte. Bei der Standardbasis $B$ ist das direkt ablesbar.

$\mathbf{e}_1'$ hat in der Standardbasis die Koordinaten $(1, 1)^\mathsf{T}$ , $\mathbf{e}_2'$ die Koordinaten $(-1, 1)^\mathsf{T}$ . Das sind die beiden Spalten.

$\begin{aligned} [\mathbf{v}]_B &= \bigl([\mathbf{e}_1']_B\ [\mathbf{e}_2']_B\bigr) \cdot [\mathbf{v}]_{B'} \\ &= \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix} \cdot [\mathbf{v}]_{B'} \end{aligned}$

Soweit der Vektor. Jetzt der spannendere Teil: Wie ändert sich die Darstellungsmatrix einer Abbildung $F: V \to V$ beim Basiswechsel? Schreiben wir $[F]_B$ für ihre Matrix in der Basis $B$ und $[F]_{B'}$ für die in $B'$ . Der Zusammenhang ist eine Konjugation: man umrahmt die Matrix mit der Übergangsmatrix und ihrer Inversen.

Lies die Formel von rechts nach links wie einen Arbeitsablauf: Ein Vektor liegt in $B'$ -Koordinaten vor. Erst rechnet $T$ ihn nach $B$ (bzw. das passende Stück), dann wirkt die Abbildung, dann rechnet die Inverse das Ergebnis zurück. Die Abbildung selbst bleibt dieselbe, nur ihre ‚Brille', die Basis, wechselt.

!!!

Basiswechsel der Matrix (Konjugation)

\begin{aligned} [F]_B &= T^{-1}\,[F]_{B'}\,T = S\,[F]_{B'}\,S^{-1}, \\ [F]_{B'} &= T\,[F]_B\,T^{-1} = S^{-1}\,[F]_B\,S \end{aligned}

Die Matrix wird mit der Übergangsmatrix umrahmt (konjugiert). Achte genau, welche Matrix links und welche rechts steht.

Beispiel D: eine Matrix in eine neue Basis umrechnen

Gegeben

Wir nehmen dieselben zwei Basen wie in Beispiel C und eine konkrete Matrix in der Standardbasis.

$B = (\mathbf{e}_1, \mathbf{e}_2)$ , $B' = (\mathbf{e}_1 + \mathbf{e}_2,\ \mathbf{e}_2 - \mathbf{e}_1)$ , und $[F]_B$ ist gegeben.

$[F]_B = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}, \qquad S = \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix}$
Konjugationsformel anwenden

Gesucht ist $[F]_{B'}$ . Mit $S$ als Übergang von $B'$ nach $B$ ist $[F]_{B'} = S^{-1}\,[F]_B\,S$ .

Die Inverse von $S$ ist $S^{-1} = \tfrac{1}{2}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}$ . Einsetzen und ausmultiplizieren.

$\begin{aligned} [F]_{B'} &= S^{-1}\,[F]_B\,S \\ &= \tfrac{1}{2}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix} \end{aligned}$
Resultat

Zwei Matrixprodukte nacheinander, dann der Faktor $\tfrac{1}{2}$ .

Die Abbildung sieht in der Basis $B'$ so aus:

$[F]_{B'} = \begin{pmatrix} 5 & 1 \\ 2 & 0 \end{pmatrix}$

Beispiel E: Basiswechselmatrizen verketten

Drei Basen, definiert durch Vektoren

Oft hat man mehr als zwei Basen und will zwischen beliebigen wechseln. Der Trick: über eine bekannte Zwischenbasis (hier die Standardbasis $C$ ) verketten.

Basis $A = (\mathbf{a}_1, \mathbf{a}_2)$ , Basis $B = (\mathbf{b}_1, \mathbf{b}_2)$ , Standardbasis $C = (\mathbf{c}_1, \mathbf{c}_2)$ . Wir schreiben $T_{CA}$ für den Übergang von $A$ nach $C$ (Ziel $C$ steht im Index links).

$\begin{aligned} \mathbf{a}_1 &= (1,1)^\mathsf{T},\ \mathbf{a}_2 = (2,3)^\mathsf{T}; \\ \mathbf{b}_1 &= (3,0)^\mathsf{T},\ \mathbf{b}_2 = (-2,-1)^\mathsf{T}; \\ \mathbf{c}_1 &= (1,0)^\mathsf{T},\ \mathbf{c}_2 = (0,1)^\mathsf{T} \end{aligned}$
Schritt 1: T von A nach C und zurück

Die $\mathbf{a}$ -Vektoren sind schon in $C$ -Koordinaten (Standardbasis) gegeben, also direkt als Spalten. Die Rückrichtung ist die Inverse.

$\mathbf{a}_1 = \mathbf{c}_1 + \mathbf{c}_2$ , $\mathbf{a}_2 = 2\mathbf{c}_1 + 3\mathbf{c}_2$ . Das gibt $T_{CA}$ ; die Inverse $T_{AC}$ folgt aus der $2 \times 2$ -Inversenformel (Determinante $3 - 2 = 1$ ).

$T_{CA} = \begin{pmatrix} 1 & 2 \\ 1 & 3 \end{pmatrix}, \qquad T_{AC} = T_{CA}^{-1} = \begin{pmatrix} 3 & -2 \\ -1 & 1 \end{pmatrix}$
Schritt 2: T von B nach C und zurück

Genauso für die $\mathbf{b}$ -Vektoren, die ebenfalls in $C$ -Koordinaten vorliegen.

$\mathbf{b}_1 = 3\mathbf{c}_1$ , $\mathbf{b}_2 = -2\mathbf{c}_1 - \mathbf{c}_2$ . Das gibt $T_{CB}$ (Determinante $-3$ ), und die Inverse $T_{BC}$ .

$T_{CB} = \begin{pmatrix} 3 & -2 \\ 0 & -1 \end{pmatrix}, \qquad T_{BC} = T_{CB}^{-1} = \begin{pmatrix} \tfrac{1}{3} & -\tfrac{2}{3} \\ 0 & -1 \end{pmatrix}$
Schritt 3: verketten zu T von B nach A

Jetzt der eigentliche Trick: von $B$ nach $A$ geht man über $C$ . Erst von $B$ nach $C$ , dann von $C$ nach $A$ .

Von rechts gelesen: $B \to C$ (das ist $T_{CB}$ ), dann $C \to A$ (das ist $T_{AC}$ ). Zusammen $B \to A$ . Die Indizes ‚fädeln' sich auf: $T_{AC}\,T_{CB}$ , das innere $C$ kürzt sich gedanklich.

$\begin{aligned} T_{AB} = T_{AC}\,T_{CB} &= \begin{pmatrix} 3 & -2 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} 3 & -2 \\ 0 & -1 \end{pmatrix} \\ &= \begin{pmatrix} 9 & -4 \\ -3 & 1 \end{pmatrix} \end{aligned}$
Schritt 4: die Gegenrichtung und zwei Punkte umrechnen

Symmetrisch erhält man $T_{BA}$ , und damit kann man Koordinaten konkret umrechnen.

$T_{BA} = T_{BC}\,T_{CA}$ . Damit etwa Punkt $P = (1,2)^\mathsf{T}_C$ in die $A$ -Basis und Punkt $Q = (1,1)^\mathsf{T}_A$ in die $C$ -Basis umrechnen (der Index am Vektor sagt, in welcher Basis gemessen wird).

$\begin{aligned} P = T_{AC}\,(1,2)^\mathsf{T}_C &= (-1, 1)^\mathsf{T}_A; \\ Q = T_{CA}\,(1,1)^\mathsf{T}_A &= (3, 4)^\mathsf{T}_C \end{aligned}$

Beispiel F: Komplettaufgabe im ℝ³ (das Prüfungsformat)

Die Abbildung

Das ist die typische Klausuraufgabe: eine $3 \times 3$ -Abbildung, dann Darstellungsmatrix, Basiswechsel, Kern und Bild, alles an einem Stück.

$F: \mathbb{R}^3 \to \mathbb{R}^3$ ist komponentenweise gegeben.

$F(x, y, z) = (7x + 5y - 8z,\ \ 5x + 3y - 4z,\ \ -x - 3y + 8z)^\mathsf{T}$
Teil a: Darstellungsmatrix in der Standardbasis

In der Standardbasis $\mathcal{E}$ liest man die Matrix direkt aus den Koeffizienten ab: Zeile für Zeile die Vorfaktoren.

Jede Komponente liefert eine Zeile von $[F]_\mathcal{E}$ .

$[F]_\mathcal{E} = \begin{pmatrix} 7 & 5 & -8 \\ 5 & 3 & -4 \\ -1 & -3 & 8 \end{pmatrix}$
Teil b: Übergangsmatrix T zur neuen Basis und ihre Inverse

Die neue Basis $\mathcal{B}$ ist über die Standardbasis definiert, also bilden ihre Vektoren (in $\mathcal{E}$ -Koordinaten) direkt die Spalten von $T$ .

$\mathcal{B} = \{\mathbf{e}_1,\ \mathbf{e}_1 + \mathbf{e}_2,\ \mathbf{e}_2 + \mathbf{e}_3\}$ . Die Spalten von $T$ sind diese drei Vektoren. $T^{-1}$ per Gauss-Jordan.

$T = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}, \qquad T^{-1} = \begin{pmatrix} 1 & -1 & 1 \\ 0 & 1 & -1 \\ 0 & 0 & 1 \end{pmatrix}$
Teil c: Darstellungsmatrix in der neuen Basis

Jetzt die Konjugation: $[F]_\mathcal{B} = T^{-1}\,[F]_\mathcal{E}\,T$ . Hier gehört $T^{-1}$ links und $T$ rechts.

Zwei Matrixprodukte nacheinander liefern die Matrix von $F$ in der Basis $\mathcal{B}$ .

$[F]_\mathcal{B} = T^{-1}\,[F]_\mathcal{E}\,T = \begin{pmatrix} 1 & 0 & 3 \\ 6 & 12 & -6 \\ -1 & -4 & 5 \end{pmatrix}$
Teil d: Kern und Bild via Gauss

Für Kern und Bild bringt man $[F]_\mathcal{E}$ auf reduzierte Zeilenstufenform.

Nach der Elimination bleiben zwei Pivots (Spalten 1, 2), Spalte 3 ist frei. Der Kern ist eine Gerade, das Bild ist von den zwei Pivot-Original-Spalten aufgespannt. Gegenprobe: $\dim\operatorname{Ker} + \dim\operatorname{Im} = 1 + 2 = 3 = n$ .

$\begin{aligned} \operatorname{Ker}(F) &= \{\, t\,(-1, 3, 1)^\mathsf{T} \,\}, \\ \operatorname{Im}(F) &= \operatorname{span}\{(7,5,-1)^\mathsf{T},\ (5,3,-3)^\mathsf{T}\} \end{aligned}$

Beispiel G: Basiswechsel im Funktionenraum

Der Raum und die Abbildung

Zum Abschluss ein Transfer-Beispiel: Basiswechsel funktioniert genauso in Funktionenräumen, nicht nur im $\mathbb{R}^n$ . (Die Quelle nennt diese Abbildung $L$ statt $F$ ; gemeint ist dasselbe Konzept.)

$V$ ist der von $\mathcal{B} = \{\cos(x), \sin(x), 1, x, x^2\}$ erzeugte Funktionenraum. Die Abbildung ist $L: f(x) \mapsto f(x) + f'(x) + f''(x)$ .

$\mathcal{B} = \{\cos(x),\ \sin(x),\ 1,\ x,\ x^2\}, \qquad L(f) = f + f' + f''$
Schritt 1: jede Basisfunktion abbilden

Kochrezept wie in 5.1: $L$ auf jeden Baustein anwenden, Ergebnis in $\mathcal{B}$ -Koordinaten.

Für $\cos(x)$ : $\cos(x) - \sin(x) - \cos(x) = -\sin(x)$ . Für $\sin(x)$ : $\sin(x) + \cos(x) - \sin(x) = \cos(x)$ . Für $1$ : $1$ . Für $x$ : $x + 1$ . Für $x^2$ : $x^2 + 2x + 2$ .

$\begin{aligned} &L(\cos(x)) = -\sin(x),\ L(\sin(x)) = \cos(x), \\ &L(1) = 1,\ L(x) = x+1,\ L(x^2) = x^2 + 2x + 2 \end{aligned}$
Schritt 2: Darstellungsmatrix zusammensetzen

Jedes Bild in $\mathcal{B}$ -Koordinaten schreiben und als Spalte einsetzen, fünf Spalten für fünf Basisfunktionen.

Der obere $2 \times 2$ -Block dreht $\cos(x)$ und $\sin(x)$ ineinander, der untere Block behandelt $1, x, x^2$ .

$[L]_\mathcal{B} = \begin{pmatrix} 0 & 1 & 0 & 0 & 0 \\ -1 & 0 & 0 & 0 & 0 \\ 0 & 0 & 1 & 1 & 2 \\ 0 & 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}$

Prüfungstipp: DIE Stolperfalle, die Richtung der Übergangsmatrix

Fast alle Fehler beim Basiswechsel kommen daher, dass man die Richtung von $T$ verwechselt. Drei Merksätze, die das verhindern:

Erstens, die Spaltenregel: Die Übergangsmatrix von der alten Basis $Q$ in die neue $W$ hat als Spalten die alten Basisvektoren, ausgedrückt in den neuen Koordinaten: $T_{Q \to W} = \bigl([\mathbf{q}_1]_W\ \cdots\ [\mathbf{q}_n]_W\bigr)$ . Kurz: ‚alte Basis in neuen Koordinaten als Spalten'.

Zweitens, die Index-Regel: In der Schreibweise $T_{C \leftarrow A}$ (auf dieser Seite kurz $T_{CA}$ ) steht das Ziel zuerst, die Quelle danach. $T_{CA}$ rechnet also von $A$ nach $C$ .

Drittens, der Standardbasis-Trick: Ist eine der Basen die Standardbasis, lässt sich eine Richtung direkt ablesen (die Vektoren der anderen Basis sind ja in Standardkoordinaten gegeben), die Gegenrichtung bekommt man durch Invertieren, $T_{W \to Q} = T_{Q \to W}^{-1}$ .

Und konkret bei der Konjugation: In $[F]_B = T^{-1}\,[F]_{B'}\,T$ gehört $T^{-1}$ nach links und $T$ nach rechts, nie umgekehrt. Vertauschen liefert die inverse Transformation und damit ein falsches Ergebnis.

Definition Übergangsmatrix / Basiswechsel
Matrix, die Koordinaten eines Vektors von einer Basis in eine andere umrechnet. Der Vektor bleibt, nur seine Zahlen ändern sich (‚Wechselkurs').

Formel Spaltenregel

T_{Q \to W} = \bigl([\mathbf{q}_1]_W\ \cdots\ [\mathbf{q}_n]_W\bigr)

Alte Basis

Q

in neuen Koordinaten

W

als Spalten.

Formel Konjugation der Matrix

[F]_B = T^{-1}\,[F]_{B'}\,T

Dieselbe Abbildung, andere ‚Brille'.

T^{-1}

links,

T

rechts.

Notation Notation: $T$ , $S$ , $[\mathbf{v}]_B$ , $T_{CA}$

T

= Übergang

B \to B'

S

= Übergang

B' \to B

, mit

T = S^{-1}

[\mathbf{v}]_B

= Koordinaten in

B

. Index

T_{CA}

= ‚Ziel

C

← Quelle

A

' (Ziel zuerst). Manche Texte schreiben stattdessen

T_{Q \to W}

(Quelle zuerst); dieselbe Matrix, nur die Index-Reihenfolge ist gegenläufig.

Merke Standardbasis-Trick
Ist eine Basis die Standardbasis, ist eine Richtung direkt ablesbar; die andere ist

T_{W \to Q} = T_{Q \to W}^{-1}

Querverweis Verweise
→ Kap. 6: Diagonalisierung als Basiswechsel

Aufgaben mit Musterlösungen

Übungsaufgaben mit ausführlichen Musterlösungen werden in Kürze ergänzt.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!