5.1Definition und Beispiele

5.1 Wann heisst eine Abbildung linear?

Stell dir eine Maschine vor, die Vektoren frisst und Vektoren ausspuckt. Du darfst zwei Dinge mit ihr tun: erst zwei Vektoren mischen (addieren) und dann durch die Maschine schicken, oder erst beide einzeln durch die Maschine schicken und dann das Ergebnis mischen. Eine faire Maschine liefert beide Male dasselbe. Genau diese Fairness ist die Linearität. Und wenn du den Input verdoppelst, verdoppelt sich auch der Output, ohne Überraschung.

Formal: Eine Abbildung FF schickt jeden Vektor x\mathbf{x} aus einem Vektorraum VV (dem Start) auf einen Vektor F(x)F(\mathbf{x}) in einem Vektorraum WW (dem Ziel). Man schreibt F:VWF: V \to W, gelesen ‚FF bildet VV nach WW ab', und xF(x)\mathbf{x} \mapsto F(\mathbf{x}), gelesen ‚x\mathbf{x} wird auf F(x)F(\mathbf{x}) abgebildet'. Hier sind VV und WW zwei beliebige Vektorräume (was ein Vektorraum genau ist, steht in Kap. 4).

FF heisst linear, wenn sie zwei Bedingungen erfüllt. Die erste, die Additivität, sagt: Summen darf man vor oder nach dem Abbilden bilden, das Ergebnis ist gleich. Die zweite, die Homogenität, sagt: einen Streckfaktor α\alpha darf man vor oder nach dem Abbilden anbringen. Beides zusammen heisst anschaulich: FF respektiert die zwei Grundoperationen eines Vektorraums, das Addieren und das Skalieren.

Abbildung
F:VW,xF(x)F: V \longrightarrow W, \qquad \mathbf{x} \longmapsto F(\mathbf{x})
V = Startraum (Definitionsbereich), W = Zielraum. Beide sind Vektorräume.
Linearität (i): Additivität
F(x+y)=F(x)+F(y)x,yVF(\mathbf{x} + \mathbf{y}) = F(\mathbf{x}) + F(\mathbf{y}) \qquad \forall\, \mathbf{x}, \mathbf{y} \in V
Erst mischen, dann abbilden = erst abbilden, dann mischen.
Linearität (ii): Homogenität
F(αx)=αF(x)xV, αRF(\alpha \cdot \mathbf{x}) = \alpha \cdot F(\mathbf{x}) \qquad \forall\, \mathbf{x} \in V,\ \alpha \in \mathbb{R}
Ein Streckfaktor darf vor oder nach der Abbildung stehen.

In der Praxis prüft man Additivität und Homogenität meist in einem Rutsch. Man fasst sie zur kombinierten Linearitätsbedingung zusammen. Sie ist die Kernidee dieses ganzen Kapitels: FF vertauscht mit jeder Linearkombination. Anschaulich heisst das, man darf FF durch eine Summe und an einem Streckfaktor vorbei ‚durchziehen'.

!!!
Linearität, kombiniert (die Kernidee)
F(αu+βv)=αF(u)+βF(v)F(\alpha\, \mathbf{u} + \beta\, \mathbf{v}) = \alpha\, F(\mathbf{u}) + \beta\, F(\mathbf{v})
Eine Abbildung ist genau dann linear, wenn sie diese eine Gleichung für alle u,v\mathbf{u}, \mathbf{v} und alle α,β\alpha, \beta erfüllt.

Aus der Homogenität folgt sofort ein nützlicher Spezialfall. Setzt man den Streckfaktor α=0\alpha = 0, so steht da F(0)=0F(x)=0F(\mathbf{0}) = 0 \cdot F(\mathbf{x}) = \mathbf{0}. Jede lineare Abbildung schickt den Nullvektor auf den Nullvektor. Das klingt unscheinbar, ist aber der schnellste Linearitäts-Test überhaupt: bildet eine Abbildung 0\mathbf{0} nicht auf 0\mathbf{0} ab, kann sie unmöglich linear sein.

Folgerung: Nullvektor auf Nullvektor
F(0)=0F(\mathbf{0}) = \mathbf{0}
Notwendige Bedingung. Gilt sie nicht, ist F sicher nicht linear.

Linear oder nicht? Drei Tests

  1. Test 1: Matrix mal Vektor ist linear
    Der wichtigste Fall überhaupt. Nimm V=RnV = \mathbb{R}^n, W=RmW = \mathbb{R}^m, eine feste Matrix ARm×nA \in \mathbb{R}^{m \times n} und F(x)=AxF(\mathbf{x}) = A\,\mathbf{x}. Ist das linear?
    Additivität: A(x+y)=Ax+AyA\,(\mathbf{x}+\mathbf{y}) = A\,\mathbf{x} + A\,\mathbf{y}, weil Matrixmultiplikation distributiv ist. Homogenität: A(αx)=αAxA\,(\alpha\,\mathbf{x}) = \alpha\,A\,\mathbf{x}. Beides passt, also ist jede Matrix eine lineare Abbildung.
    F(x+y)=A(x+y)=Ax+Ay=F(x)+F(y),F(αx)=A(αx)=αAx=αF(x)\begin{aligned} F(\mathbf{x}+\mathbf{y}) &= A(\mathbf{x}+\mathbf{y}) = A\mathbf{x} + A\mathbf{y} = F(\mathbf{x}) + F(\mathbf{y}), \\ F(\alpha\mathbf{x}) &= A(\alpha\mathbf{x}) = \alpha A\mathbf{x} = \alpha F(\mathbf{x}) \end{aligned}
  2. Test 2: die Nullabbildung ist linear
    Der langweiligste, aber lehrreiche Fall: FF schickt jeden Vektor auf den Nullvektor.
    Summe von Nullen ist Null, Streckfaktor mal Null ist Null. Beide Bedingungen sind trivial erfüllt. Die Nullabbildung ist linear.
    F:VW,x0F: V \longrightarrow W, \qquad \mathbf{x} \longmapsto \mathbf{0}
  3. Test 3: eine Verschiebung ist NICHT linear
    Nimm F(x)=x+aF(\mathbf{x}) = \mathbf{x} + \mathbf{a} mit einem festen Vektor a0\mathbf{a} \neq \mathbf{0}, also ‚schiebe alles um a\mathbf{a}'. Sieht harmlos aus, ist aber die häufigste Falle.
    Schnelltest: F(0)=0+a=a0F(\mathbf{0}) = \mathbf{0} + \mathbf{a} = \mathbf{a} \neq \mathbf{0}. Schon hier kippt es. Zur Kontrolle ausführlich: F(x+y)=x+y+aF(\mathbf{x}+\mathbf{y}) = \mathbf{x}+\mathbf{y}+\mathbf{a}, aber F(x)+F(y)=x+y+2aF(\mathbf{x})+F(\mathbf{y}) = \mathbf{x}+\mathbf{y}+2\mathbf{a}. Die beiden unterscheiden sich um a\mathbf{a}, die Additivität ist verletzt.
    F(x+y)=x+y+a    (x+a)+(y+a)=F(x)+F(y)F(\mathbf{x}+\mathbf{y}) = \mathbf{x}+\mathbf{y}+\mathbf{a} \;\neq\; (\mathbf{x}+\mathbf{a})+(\mathbf{y}+\mathbf{a}) = F(\mathbf{x})+F(\mathbf{y})
  4. Auch die Homogenität scheitert bei der Verschiebung
    Zur Vollständigkeit prüfen wir die zweite Bedingung der Verschiebung aus Test 3.
    Links steht der um a\mathbf{a} verschobene, gestreckte Vektor, rechts der gestreckte verschobene. Für α1\alpha \neq 1 sind sie verschieden.
    F(αx)=αx+a    α(x+a)=αF(x)F(\alpha\,\mathbf{x}) = \alpha\,\mathbf{x} + \mathbf{a} \;\neq\; \alpha\,(\mathbf{x}+\mathbf{a}) = \alpha\,F(\mathbf{x})

Die Verschiebung aus Test 3 hat trotzdem einen Namen, weil sie ständig auftaucht (Drehung plus Verschiebung in der Computergrafik, Koordinatenwechsel mit verschobenem Ursprung). Eine Abbildung der Form ‚lineare Abbildung plus festen Vektor' heisst affin linear. Merke dir die Abgrenzung sauber: affin linear ist linear genau dann, wenn der angehängte Vektor a\mathbf{a} der Nullvektor ist. Sobald a0\mathbf{a} \neq \mathbf{0}, ist sie affin, aber nicht mehr linear.

Affin lineare Abbildung
F:RnRn,xAx+a,ARn×n, aRnF: \mathbb{R}^n \longrightarrow \mathbb{R}^n, \qquad \mathbf{x} \longmapsto A\,\mathbf{x} + \mathbf{a}, \qquad A \in \mathbb{R}^{n \times n},\ \mathbf{a} \in \mathbb{R}^n
Linear nur für a=0\mathbf{a} = \mathbf{0}. Für a0\mathbf{a} \neq \mathbf{0} affin, aber nicht linear.

Ein anspruchsvolleres Beispiel: Polynome

  1. Die Kandidaten
    Lineare Abbildungen leben nicht nur im Rn\mathbb{R}^n. Hier ist Start- und Zielraum P3P_3, der Raum der Polynome vom Grad höchstens 3. Wir testen zwei Abbildungen.
    Erstens F1:p(x)p(x)+1F_1: p(x) \mapsto p(x) + 1 (addiere die Konstante 1). Zweitens F2:p(x)xp(x)+p(1)F_2: p(x) \mapsto x \cdot p'(x) + p(1) (multipliziere die Ableitung mit xx und addiere den Funktionswert an der Stelle 1).
    F1:P3P3, p(x)p(x)+1;F2:P3P3, p(x)xp(x)+p(1)\begin{aligned} F_1&: P_3 \to P_3,\ p(x) \mapsto p(x) + 1; \\ F_2&: P_3 \to P_3,\ p(x) \mapsto x\, p'(x) + p(1) \end{aligned}
  2. F1F_1 ist nicht linear
    Wieder der Trick mit dem ‚+1+1': Konstanten anhängen ist eine versteckte Verschiebung.
    Bilde die Summe ab: F1(p+q)=p+q+1F_1(p+q) = p+q+1. Bilde einzeln ab und addiere: F1(p)+F1(q)=(p+1)+(q+1)=p+q+2F_1(p)+F_1(q) = (p+1)+(q+1) = p+q+2. Differenz: eine 1 zu viel. Nicht additiv, also nicht linear.
    F1(p+q)=p+q+1    (p+1)+(q+1)=F1(p)+F1(q)F_1(p+q) = p+q+1 \;\neq\; (p+1)+(q+1) = F_1(p) + F_1(q)
  3. F2F_2 ist linear: Additivität
    Ableiten ist additiv, der Funktionswert an einer festen Stelle ist additiv. Das überträgt sich.
    Setze die Summe ein und nutze (p+q)=p+q(p+q)' = p'+q' sowie (p+q)(1)=p(1)+q(1)(p+q)(1) = p(1)+q(1). Alles sortiert sich genau in F2(p)+F2(q)F_2(p)+F_2(q).
    F2(p+q)=x(p+q)+(p+q)(1)=xp+p(1)+xq+q(1)=F2(p)+F2(q)\begin{aligned} F_2(p+q) &= x\,(p+q)' + (p+q)(1) \\ &= x\,p' + p(1) + x\,q' + q(1) = F_2(p) + F_2(q) \end{aligned}
  4. F2F_2 ist linear: Homogenität
    Streckfaktor durchziehen: Ableitung und Funktionswert sind beide homogen.
    Es ist (αp)=αp(\alpha p)' = \alpha p' und (αp)(1)=αp(1)(\alpha p)(1) = \alpha\,p(1), also lässt sich α\alpha vorklammern. F2F_2 erfüllt beide Bedingungen und ist somit linear.
    F2(αp)=x(αp)+(αp)(1)=α(xp+p(1))=αF2(p)\begin{aligned} F_2(\alpha\, p) &= x\,(\alpha p)' + (\alpha p)(1) \\ &= \alpha\,\bigl(x\,p' + p(1)\bigr) = \alpha\,F_2(p) \end{aligned}
Definition Lineare Abbildung
Abbildung F:VWF: V \to W zwischen Vektorräumen mit F(αu+βv)=αF(u)+βF(v)F(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha F(\mathbf{u}) + \beta F(\mathbf{v}). Äquivalent: additiv und homogen.
Notation Notation: FF, VV, WW, \mapsto
FF = Name der Abbildung. VV = Startraum, WW = Zielraum (beide Vektorräume). F:VWF: V \to W liest sich ‚FF bildet VV nach WW ab'. Der Pfeil \mapsto (mit Querstrich) verbindet ein einzelnes Element mit seinem Bild: xF(x)\mathbf{x} \mapsto F(\mathbf{x}).
Formel Kernidee
F(αu+βv)=αF(u)+βF(v)F(\alpha\mathbf{u} + \beta\mathbf{v}) = \alpha F(\mathbf{u}) + \beta F(\mathbf{v})
FF vertauscht mit jeder Linearkombination. Das ist die ganze Definition in einer Zeile.
Merke Schnelltest
F(0)0F(\mathbf{0}) \neq \mathbf{0}FF ist nicht linear. Geht der Nullvektor woandershin, ist nichts mehr zu retten.

5.1 Jede lineare Abbildung ist eine Matrix

Hier eine Frage, die alles vereinfacht: Wenn FF linear ist, wie viel musst du wirklich über FF wissen, um sie vollständig zu kennen? Erstaunlich wenig. Es genügt, zu wissen, wohin FF die Basisvektoren schickt. Warum? Weil jeder Vektor eine Linearkombination der Basisvektoren ist, und Linearität sagt, dass FF mit Linearkombinationen vertauscht. Kennst du die Bilder der Bausteine, kennst du das Bild von allem.

Anschaulich: die Basisvektoren sind die Bausteine des Raums. Lege fest, was FF mit jedem Baustein macht, und FF ist überall festgelegt. Genau das macht eine Matrix möglich. Um aus FF eine Matrix zu bauen, brauchen wir zwei Basen: eine Basis B=(b1,,bn)B = (\mathbf{b}_1, \ldots, \mathbf{b}_n) für den Startraum VV und eine Basis CC für den Zielraum WW.

Den Koordinatenvektor eines Vektors x\mathbf{x} bezüglich der Basis BB schreiben wir [x]B[\mathbf{x}]_B. Das ist die Liste der Gewichte, mit denen man die Basisvektoren von BB kombinieren muss, um x\mathbf{x} zu erhalten. Ist x=x1b1++xnbn\mathbf{x} = x_1\,\mathbf{b}_1 + \cdots + x_n\,\mathbf{b}_n, dann ist [x]B=(x1,,xn)T[\mathbf{x}]_B = (x_1, \ldots, x_n)^\mathsf{T}. Ebenso steht [y]C[\mathbf{y}]_C für die Koordinaten des Bildes y=F(x)\mathbf{y} = F(\mathbf{x}) in der Zielbasis CC.

Die Darstellungsmatrix AA von FF bezüglich BB und CC übersetzt nun Koordinaten in Koordinaten: aus den Start-Koordinaten [x]B[\mathbf{x}]_B macht das Matrixprodukt A[x]BA\,[\mathbf{x}]_B die Ziel-Koordinaten [y]C[\mathbf{y}]_C. So wird aus einer abstrakten Abbildung eine ganz konkrete Matrix, mit der man rechnen kann.

Koordinatenvektoren in Start- und Zielbasis
[x]B=(x1,,xn)T,[y]C=(y1,,yn)T,y=F(x)\begin{aligned} [\mathbf{x}]_B &= (x_1, \ldots, x_n)^\mathsf{T}, \\ [\mathbf{y}]_C &= (y_1, \ldots, y_n)^\mathsf{T}, \qquad \mathbf{y} = F(\mathbf{x}) \end{aligned}
[x]B[\mathbf{x}]_B: Gewichte von x\mathbf{x} in der Basis BB. [y]C[\mathbf{y}]_C: Gewichte des Bildes in der Basis CC.
!!
Darstellungsmatrix: Koordinaten auf Koordinaten
(y1,,yn)T=A(x1,,xn)T,kurz[F(x)]C=A[x]B\begin{aligned} (y_1, \ldots, y_n)^\mathsf{T} &= A \cdot (x_1, \ldots, x_n)^\mathsf{T}, \\ \text{kurz}\quad [\,F(\mathbf{x})\,]_C &= A \cdot [\mathbf{x}]_B \end{aligned}
AA = Darstellungsmatrix von FF bezüglich der Basen BB (Start) und CC (Ziel).

Darstellungsmatrix bestimmen (Ableitungs-Operator)

  1. Schritt 1: Räume und Basen festlegen
    Ohne Basen gibt es keine Matrix. Wir brauchen je eine Basis für Start und Ziel.
    Start V=P2V = P_2 (Polynome bis Grad 2) mit Basis B=(1,x,x2)B = (1, x, x^2). Ziel W=P1W = P_1 (Polynome bis Grad 1) mit Basis C=(1,x)C = (1, x). Die Abbildung ist F:p(x)p(x)+p(x)F: p(x) \mapsto p'(x) + p''(x), also erste plus zweite Ableitung.
    B=(1, x, x2),C=(1, x),F(p(x))=p(x)+p(x)B = (1,\ x,\ x^2), \qquad C = (1,\ x), \qquad F(p(x)) = p'(x) + p''(x)
  2. Schritt 2: jeden Basisvektor abbilden
    Nach dem Kochrezept brauchen wir die Bilder F(b1),F(b2),F(b3)F(\mathbf{b}_1), F(\mathbf{b}_2), F(\mathbf{b}_3) in CC-Koordinaten.
    Für die Konstante 1 sind erste und zweite Ableitung null. Für xx ist x=1x' = 1, x=0x'' = 0. Für x2x^2 ist (x2)=2x(x^2)' = 2x, (x2)=2(x^2)'' = 2, zusammen 2x+22x + 2.
    F(1)=0  [F(b1)]C=(0,0)T;F(x)=1  (1,0)T;F(x2)=2x+2  (2,2)T\begin{aligned} F(1) = 0 \ &\Rightarrow\ [F(\mathbf{b}_1)]_C = (0,0)^\mathsf{T}; \\ F(x) = 1 \ &\Rightarrow\ (1,0)^\mathsf{T}; \\ F(x^2) = 2x+2 \ &\Rightarrow\ (2,2)^\mathsf{T} \end{aligned}
  3. Schritt 3: Spalten zusammensetzen
    Die drei Koordinatenvektoren werden zu den drei Spalten von AA.
    AA ist eine 2×32 \times 3-Matrix: zwei Zeilen, weil CC zwei Elemente hat, drei Spalten, weil BB drei Elemente hat.
    A=(012002)A = \begin{pmatrix} 0 & 1 & 2 \\ 0 & 0 & 2 \end{pmatrix}
  4. Schritt 4: Kontrolle an einem konkreten Polynom
    Ein guter Test: rechne einmal direkt und einmal über die Matrix, beides muss übereinstimmen.
    Nimm p(x)=x2+x+4p(x) = x^2 + x + 4, also [p]B=(4,1,1)T[p]_B = (4,1,1)^\mathsf{T} (Gewichte von 11, xx, x2x^2). Direkt: F(p)=(2x+1)+2=2x+3F(p) = (2x+1) + 2 = 2x+3, also [F(p)]C=(3,2)T[F(p)]_C = (3,2)^\mathsf{T}. Über die Matrix: A(4,1,1)T=(3,2)TA\,(4,1,1)^\mathsf{T} = (3,2)^\mathsf{T}. Passt.
    A(411)=(04+11+2104+01+21)=(32)=[F(p)]C\begin{aligned} A \cdot \begin{pmatrix} 4 \\ 1 \\ 1 \end{pmatrix} &= \begin{pmatrix} 0\cdot4 + 1\cdot1 + 2\cdot1 \\ 0\cdot4 + 0\cdot1 + 2\cdot1 \end{pmatrix} \\ &= \begin{pmatrix} 3 \\ 2 \end{pmatrix} = [F(p)]_C \end{aligned}
Definition Darstellungsmatrix
Matrix AA, die zu FF, einer Basis BB (Start) und CC (Ziel) gehört. Sie übersetzt [x]B[\mathbf{x}]_B in [F(x)]C[F(\mathbf{x})]_C per A[x]BA\,[\mathbf{x}]_B.
Notation Notation: [x]B[\mathbf{x}]_B
Koordinatenvektor von x\mathbf{x} bezüglich der Basis BB, also die Liste der Gewichte in x=x1b1++xnbn\mathbf{x} = x_1\mathbf{b}_1 + \cdots + x_n\mathbf{b}_n. Der Index BB sagt: in welcher Basis gemessen wird.
Formel Übersetzung
[F(x)]C=A[x]B[F(\mathbf{x})]_C = A \cdot [\mathbf{x}]_B
Matrix mal Start-Koordinaten ergibt Ziel-Koordinaten.
Merke Kochrezept Abbildungsmatrix
Jeden Basisvektor abbilden → Ergebnis in Zielkoordinaten → als Spalten nebeneinander. Spalte jj = [F(bj)]C[F(\mathbf{b}_j)]_C.

5.2Kern, Bild, Rang

5.2.1 Kern und Bild

Zwei natürliche Fragen zu jeder Maschine: Welche Inputs verschluckt sie zu null? Und welche Outputs sind überhaupt erreichbar? Die erste Frage führt zum Kern, die zweite zum Bild. Beide gehören zum Standard-Werkzeugkasten, wenn man eine lineare Abbildung verstehen will.

Der Kern Ker(A)\operatorname{Ker}(A) ist die Menge aller Startvektoren, die AA auf den Nullvektor abbildet. Anschaulich sind das die toten Richtungen der Abbildung: alles, was platt auf null gedrückt wird, verschwindet im Kern. Das Bild Im(A)\operatorname{Im}(A) ist die Menge aller Vektoren, die als Ergebnis AxA\,\mathbf{x} wirklich auftreten. Anschaulich ist das die erreichbare Welt: alle möglichen Outputs der Maschine.

Beide hängen direkt mit Gleichungssystemen zusammen. Ein Vektor x\mathbf{x} liegt im Kern genau dann, wenn er das homogene System Ax=0A\,\mathbf{x} = \mathbf{0} löst. Und ein Vektor b\mathbf{b} liegt im Bild genau dann, wenn das System Ax=bA\,\mathbf{x} = \mathbf{b} lösbar ist. Da AxA\,\mathbf{x} eine Linearkombination der Spalten von AA ist (die Spaltensicht aus Kap. 1), ist das Bild genau der von den Spalten aufgespannte Raum.

Kern
Ker(A)={xV:Ax=0}\operatorname{Ker}(A) = \{\, \mathbf{x} \in V : A\,\mathbf{x} = \mathbf{0} \,\}
Alle Vektoren, die auf den Nullvektor abgebildet werden. Lösungsmenge von Ax=0A\mathbf{x} = \mathbf{0}.
Bild
Im(A)={yW:x mit y=Ax}=span{a(1),,a(n)}\begin{aligned} \operatorname{Im}(A) &= \{\, \mathbf{y} \in W : \exists\, \mathbf{x} \text{ mit } \mathbf{y} = A\,\mathbf{x} \,\} \\ &= \operatorname{span}\{\mathbf{a}^{(1)}, \ldots, \mathbf{a}^{(n)}\} \end{aligned}
Alle erreichbaren Bildvektoren, gleich dem Spann der Spalten a(1),,a(n)\mathbf{a}^{(1)}, \ldots, \mathbf{a}^{(n)} von AA.
Bild und Kern als Lösbarkeitsfragen
bIm(A)    Ax=b lo¨sbar,xKer(A)    Ax=0\begin{aligned} \mathbf{b} \in \operatorname{Im}(A) \;&\Leftrightarrow\; A\,\mathbf{x} = \mathbf{b} \text{ lösbar}, \\ \mathbf{x} \in \operatorname{Ker}(A) \;&\Leftrightarrow\; A\,\mathbf{x} = \mathbf{0} \end{aligned}
Bild = welche rechten Seiten lösbar sind. Kern = Lösungen des homogenen Systems.

Kern und Bild sind nicht irgendwelche Mengen, sondern Unterräume: der Kern Ker(A)\operatorname{Ker}(A) ist ein Unterraum des Startraums Rn\mathbb{R}^n, das Bild Im(A)\operatorname{Im}(A) ein Unterraum des Zielraums Rm\mathbb{R}^m. Das ist beruhigend, denn es heisst, sie haben jeweils eine Basis und eine Dimension, mit denen man sauber rechnen kann (Unterraum, Basis und Spann sind in Kap. 4 erklärt).

Kern und Bild sind Unterräume
Ker(A)Rn ist ein Unterraum,Im(A)Rm ist ein Unterraum\begin{aligned} \operatorname{Ker}(A) &\subseteq \mathbb{R}^n \text{ ist ein Unterraum}, \\ \operatorname{Im}(A) &\subseteq \mathbb{R}^m \text{ ist ein Unterraum} \end{aligned}
Kern lebt im Startraum, Bild im Zielraum. Beide sind abgeschlossen unter Addition und Skalierung.

Beispiel A: ein einfacher 1×2-Fall

  1. Die Abbildung und ihre Matrix
    Mit dem kleinstmöglichen Beispiel sieht man Kern und Bild ohne Rechenaufwand.
    F:R2RF: \mathbb{R}^2 \to \mathbb{R}, (x1,x2)Tx1x2(x_1, x_2)^\mathsf{T} \mapsto x_1 - x_2. Die zugehörige Matrix ist eine einzige Zeile.
    F(x1,x2)=x1x2,A=(11)F(x_1, x_2) = x_1 - x_2, \qquad A = \begin{pmatrix} 1 & -1 \end{pmatrix}
  2. Kern: wo wird es null?
    Wir suchen alle (x1,x2)(x_1, x_2) mit x1x2=0x_1 - x_2 = 0.
    Das bedeutet x1=x2x_1 = x_2. Setzt man x1=x2=tx_1 = x_2 = t, durchläuft (t,t)T(t, t)^\mathsf{T} eine ganze Gerade. Der Kern ist also eindimensional, eine Gerade durch den Ursprung.
    Ker(F)={(x1,x2)T:x1=x2}={t(1,1)T:tR}\begin{aligned} \operatorname{Ker}(F) &= \{\, (x_1, x_2)^\mathsf{T} : x_1 = x_2 \,\} \\ &= \{\, t\,(1,1)^\mathsf{T} : t \in \mathbb{R} \,\} \end{aligned}
  3. Bild: was kommt heraus?
    Der Output ist eine einzelne Zahl x1x2x_1 - x_2. Welche Zahlen sind erreichbar?
    Mit passenden x1,x2x_1, x_2 erreicht man jede reelle Zahl. Das Bild ist ganz R\mathbb{R}.
    Im(F)=R\operatorname{Im}(F) = \mathbb{R}

Beispiel B: Kern und Bild via Gauss

  1. Die Matrix
    Bei grösseren Matrizen liest man Kern und Bild nicht mehr ab, sondern bringt AA auf Zeilenstufenform.
    Gegeben ist eine 3×43 \times 4-Matrix. Wir lösen Ax=0A\,\mathbf{x} = \mathbf{0}.
    A=(211040132110)A = \begin{pmatrix} 2 & 1 & 1 & 0 \\ -4 & 0 & 1 & -3 \\ 2 & 1 & 1 & 0 \end{pmatrix}
  2. Schritt 1: Gauss-Elimination
    Zeilenoperationen ändern den Kern nicht, machen ihn aber ablesbar. Zeile II plus 2·Zeile I, Zeile III minus Zeile I.
    Die dritte Zeile fällt weg (sie war eine Kopie der ersten). Es bleiben zwei nichttriviale Zeilen, also zwei Pivots in den Spalten 1 und 2.
    A(211002330000)A \rightsquigarrow \begin{pmatrix} 2 & 1 & 1 & 0 \\ 0 & 2 & 3 & -3 \\ 0 & 0 & 0 & 0 \end{pmatrix}
  3. Schritt 2: freie Parameter wählen
    Die Spalten 3 und 4 haben keinen Pivot, also sind x3x_3 und x4x_4 frei wählbar. Aus ihnen ergeben sich x2x_2 und x1x_1.
    Setze x4=sx_4 = s und x3=tx_3 = t. Rückwärtseinsetzen liefert x2=32(st)x_2 = \tfrac{3}{2}(s - t) und x1=14(t3s)x_1 = \tfrac{1}{4}(t - 3s).
    x4=s,x3=t,x2=32(st),x1=14(t3s)x_4 = s,\quad x_3 = t,\quad x_2 = \tfrac{3}{2}(s - t),\quad x_1 = \tfrac{1}{4}(t - 3s)
  4. Schritt 3: Kernbasis ablesen
    Zwei freie Parameter bedeuten einen zweidimensionalen Kern. Jeder Parameter liefert einen Basisvektor.
    Setze einmal (s,t)=(1,0)(s,t) = (1,0) und einmal (0,1)(0,1), multipliziere zur Lesbarkeit mit 4. So entstehen zwei unabhängige Kernvektoren.
    Ker(A)=span{(3,6,0,4)T, (1,6,4,0)T}\operatorname{Ker}(A) = \operatorname{span}\{\, (-3, 6, 0, 4)^\mathsf{T},\ (1, -6, 4, 0)^\mathsf{T} \,\}
  5. Schritt 4: Bildbasis ablesen (Vorsicht!)
    Die Pivots stehen in den Spalten 1 und 2. Diese Spalten sind linear unabhängig und spannen das Bild auf.
    Wichtig: nimm die Original-Spalten von AA, nicht die der Zeilenstufenform. Also Spalte 1 und Spalte 2 der Ausgangsmatrix.
    Im(A)=span{(2,4,2)T, (1,0,1)T}\operatorname{Im}(A) = \operatorname{span}\{\, (2, -4, 2)^\mathsf{T},\ (1, 0, 1)^\mathsf{T} \,\}
Definition Kern
Ker(A)={x:Ax=0}\operatorname{Ker}(A) = \{\mathbf{x} : A\mathbf{x} = \mathbf{0}\}. Die ‚toten Richtungen', Unterraum des Startraums. Deutsch oft Kern(A)(A) geschrieben.
Definition Bild
Im(A)={Ax}\operatorname{Im}(A) = \{A\mathbf{x}\} = Spann der Spalten. Die ‚erreichbare Welt', Unterraum des Zielraums. Deutsch oft Bild(A)(A).
Notation Notation: Ker(A)\operatorname{Ker}(A), Im(A)\operatorname{Im}(A)
Wir schreiben Ker\operatorname{Ker} (von kernel) und Im\operatorname{Im} (von image). Manche Texte schreiben deutsch Kern(A)(A) und Bild(A)(A), gemeint ist dasselbe.
Merke So findet man sie
Kern: Ax=0A\mathbf{x} = \mathbf{0} per Gauss lösen, freie Parameter geben die Basis. Bild: Pivot-Spalten bestimmen, die Original-Spalten als Basis nehmen.

5.2.2 Der Rang

Frage: Wie viele unabhängige Richtungen überleben die Abbildung? Genau diese Zahl heisst der Rang. Anschaulich ist der Rang die effektive Breite der Maschine, also wie viele Dimensionen am Ausgang wirklich ankommen. Eine Matrix kann viele Spalten haben und trotzdem nur wenige unabhängige Richtungen erzeugen, der Rang misst das.

Definiert ist der Rang als die Dimension des Bildes, rang(A)=dim(Im(A))\operatorname{rang}(A) = \dim(\operatorname{Im}(A)). Das ist sofort plausibel: das Bild ist der Spann der Spalten, und seine Dimension ist die Anzahl unabhängiger Spalten, also die Anzahl der Pivots in der Zeilenstufenform. Bemerkenswert: man erhält denselben Wert, ob man unabhängige Spalten oder unabhängige Zeilen zählt. Deshalb gilt rang(A)=rang(AT)\operatorname{rang}(A) = \operatorname{rang}(A^\mathsf{T}), Zeilenrang gleich Spaltenrang.

Rang
rang(A)=dim(Im(A)),rang(A)=rang(AT)\begin{aligned} \operatorname{rang}(A) &= \dim(\operatorname{Im}(A)), \\ \operatorname{rang}(A) &= \operatorname{rang}(A^\mathsf{T}) \end{aligned}
Anzahl unabhängiger Spalten = Anzahl unabhängiger Zeilen = Anzahl Pivots.

Jetzt kommt die wichtigste Formel des Abschnitts, die Dimensionsformel (auch Rangsatz genannt). Sie verknüpft Kern und Bild: die Dimension des Kerns plus die Dimension des Bildes ist gleich der Anzahl nn der Spalten, also der Dimension des Startraums.

Lies sie als Erhaltungssatz: die nn Input-Dimensionen teilen sich sauber auf. Ein Teil wird ‚verschluckt' (geht in den Kern, also auf null), der Rest ‚überlebt' (landet im Bild). Nichts geht verloren, nichts kommt dazu. Wer also den Kern kennt, kennt sofort den Rang, und umgekehrt.

!!!
Dimensionsformel (Rangsatz)
dim(Ker(A))+dim(Im(A))=n\dim(\operatorname{Ker}(A)) + \dim(\operatorname{Im}(A)) = n
nn = Anzahl Spalten = Dimension des Startraums. Verschluckt (Kern) plus überlebt (Bild) = alles.
Kerndimension über die Transponierte
dim(Ker(A))=dim(Im(AT))\dim(\operatorname{Ker}(A)) = \dim(\operatorname{Im}(A^\mathsf{T}))
Eine weitere Brücke zwischen Kern und Bild über die transponierte Matrix ATA^\mathsf{T}.

Eine kurze Gegenprobe mit Beispiel B aus dem letzten Abschnitt: die 3×43 \times 4-Matrix hatte n=4n = 4 Spalten und einen zweidimensionalen Kern, also dim(Ker)=2\dim(\operatorname{Ker}) = 2. Die Dimensionsformel sagt dim(Im)=42=2\dim(\operatorname{Im}) = 4 - 2 = 2, der Rang ist 2. Und genau zwei Pivot-Spalten hatten wir gefunden. Alles passt zusammen.

Definition Rang
rang(A)=dim(Im(A))\operatorname{rang}(A) = \dim(\operatorname{Im}(A)) = Anzahl unabhängiger Spalten = Anzahl Pivots in der Zeilenstufenform. Es gilt rang(A)=rang(AT)\operatorname{rang}(A) = \operatorname{rang}(A^\mathsf{T}).
Formel Dimensionsformel
dim(Ker(A))+dim(Im(A))=n\dim(\operatorname{Ker}(A)) + \dim(\operatorname{Im}(A)) = n
Rangsatz: verschluckte plus überlebende Dimensionen ergeben die Spaltenzahl nn.
Merke Rang ablesen
Rang = Anzahl Pivots in der Zeilenstufenform. Immer rang(A)min(m,n)\operatorname{rang}(A) \leq \min(m, n).

5.2.3 Zusammengesetzte Abbildungen

Stell dir ein Fliessband mit zwei Stationen vor: zuerst läuft jeder Vektor durch die Maschine FF, dann durch die Maschine GG. Zwei Fragen drängen sich auf: Ist die Gesamtmaschine wieder linear? Und welche Matrix gehört zu ihr? Beide Antworten sind erfreulich klar.

Erstens: Die Zusammensetzung zweier linearer Abbildungen ist wieder linear. Das ist die Grundlage dafür, dass man komplizierte Abbildungen aus einfachen zusammenstückeln darf, ohne die Linearität zu verlieren. Zweitens: Ist F(x)=AxF(\mathbf{x}) = A\,\mathbf{x} (von Rn\mathbb{R}^n nach Rm\mathbb{R}^m) und G(y)=ByG(\mathbf{y}) = B\,\mathbf{y} (von Rm\mathbb{R}^m nach Rp\mathbb{R}^p), so gehört zur Gesamtabbildung das Matrixprodukt BAB\,A.

Achtung auf die Reihenfolge: Wir schreiben die zusammengesetzte Abbildung GFG \circ F, gelesen ‚GG nach FF', und sie wirkt xBAx\mathbf{x} \mapsto B\,A\,\mathbf{x}. Die Matrix, die zuerst angewendet wird (AA, für FF), steht rechts; die zuletzt angewendete (BB, für GG) steht links. Genau wie bei verschachtelten Funktionen f(g(x))f(g(x)), wo gg zuerst dran ist, obwohl es weiter innen steht.

Die beiden Stationen
F:RnRm, xAx;G:RmRp, yByF: \mathbb{R}^n \longrightarrow \mathbb{R}^m,\ \mathbf{x} \mapsto A\,\mathbf{x}; \qquad G: \mathbb{R}^m \longrightarrow \mathbb{R}^p,\ \mathbf{y} \mapsto B\,\mathbf{y}
Hier ist BB die Darstellungsmatrix von GG, nicht eine Basis. Erst FF, dann GG.
!!
Zusammengesetzte Abbildung
GF=H:RnRp,xBAxG \circ F = H: \mathbb{R}^n \longrightarrow \mathbb{R}^p, \qquad \mathbf{x} \longmapsto B\,A\,\mathbf{x}
Reihenfolge: rechts steht die zuerst angewandte Matrix AA, links die zuletzt angewandte BB.

Ein Dimensionscheck macht die Reihenfolge zwingend: AA ist m×nm \times n, BB ist p×mp \times m. Das Produkt BAB\,A passt nur in dieser Reihenfolge zusammen (die ‚innere' Dimension mm muss übereinstimmen) und ergibt eine p×np \times n-Matrix, genau die Form, die von Rn\mathbb{R}^n nach Rp\mathbb{R}^p abbildet. Schriebe man ABA\,B, würden die Dimensionen meist gar nicht passen.

Definition Zusammengesetzte Abbildung
GFG \circ F (‚GG nach FF'): erst FF, dann GG. Ist F=AF = A\,\cdot und G=BG = B\,\cdot, dann GF=(BA)G \circ F = (B\,A)\,\cdot.
Notation Notation: GFG \circ F
Der Kringel \circ heisst ‚nach'. GFG \circ F bedeutet: wende zuerst FF an, dann GG. Achtung, die Leserichtung ist von rechts nach links, wie bei f(g(x))f(g(x)).
Formel Komposition
GF:xBAxG \circ F: \mathbf{x} \longmapsto B\,A\,\mathbf{x}
Zuerst angewandte Matrix steht rechts.

5.3Skalarprodukt und lineare Abbildungen

5.3 Die Transponierte, Orthogonalität und Lösbarkeit

Bisher lebten Kern und Bild getrennt: der Kern im Startraum, das Bild im Zielraum. Wie hängen sie zusammen? Die Brücke ist das Skalarprodukt. Und gleich danach beantworten wir damit eine der wichtigsten Fragen der linearen Algebra: Wann ist ein System Ax=bA\,\mathbf{x} = \mathbf{b} überhaupt lösbar?

Das anschauliche Bild: der Zielraum Rm\mathbb{R}^m zerfällt in zwei zueinander senkrechte Teile. Der eine Teil ist das Bild Im(A)\operatorname{Im}(A), also alles, was AA erreichen kann. Der andere ist der Kern der transponierten Matrix, Ker(AT)\operatorname{Ker}(A^\mathsf{T}), also alles, was das Bild nicht erreicht. Zusammen spannen die beiden den ganzen Rm\mathbb{R}^m auf, und sie stehen senkrecht aufeinander. Was das Bild verfehlt, steht also genau orthogonal dazu.

Der Grund dafür steckt in einer Rechenregel für das Skalarprodukt, der Adjungiertheit. Sie sagt: Man darf die Matrix AA im Skalarprodukt von der einen auf die andere Seite schieben, wenn man sie dabei transponiert. Diese Gleichung ist im Grunde die definierende Eigenschaft der transponierten Matrix.

Bild und Kern der Transponierten spannen den Zielraum auf
Im(A)+Ker(AT)=Rm\operatorname{Im}(A) + \operatorname{Ker}(A^\mathsf{T}) = \mathbb{R}^m
Jeder Vektor des Zielraums zerlegt sich in einen Bild-Anteil und einen dazu senkrechten Anteil.
!!
Adjungiertheit (Verschieben im Skalarprodukt)
Az,y=z,ATyzRn, yRm\langle A\,\mathbf{z},\, \mathbf{y} \rangle = \langle \mathbf{z},\, A^\mathsf{T}\mathbf{y} \rangle \qquad \forall\, \mathbf{z} \in \mathbb{R}^n,\ \mathbf{y} \in \mathbb{R}^m
AA auf die andere Seite schieben macht es zu ATA^\mathsf{T}. Das definiert die Transponierte.
Bild senkrecht zum Kern der Transponierten
Im(A)Ker(AT)\operatorname{Im}(A) \perp \operatorname{Ker}(A^\mathsf{T})
Das Symbol \perp heisst ‚steht senkrecht auf'. Die beiden Räume sind orthogonal zueinander.
Dimensionsbilanz im Zielraum
dim(Im(A))+dim(Ker(AT))=m\dim(\operatorname{Im}(A)) + \dim(\operatorname{Ker}(A^\mathsf{T})) = m
Analog zur Dimensionsformel, aber im Zielraum Rm\mathbb{R}^m: erreichbar plus unerreichbar = alles.

Aus diesem Bild folgt direkt die Fredholm-Alternative, ein Lösbarkeitskriterium. Anschaulich: Ax=bA\,\mathbf{x} = \mathbf{b} ist genau dann lösbar, wenn b\mathbf{b} keine ‚verbotene Komponente' hat, also vollständig im Bild liegt. Und ‚im Bild liegen' heisst nach dem Senkrecht-Bild: b\mathbf{b} steht senkrecht auf allem, was das Bild verfehlt, das heisst senkrecht auf allen Lösungen von ATy=0A^\mathsf{T}\mathbf{y} = \mathbf{0}.

Das ist enorm praktisch: Statt das ganze System Ax=bA\,\mathbf{x} = \mathbf{b} zu lösen, prüft man nur ein paar Skalarprodukte. (Was ein Skalarprodukt ,\langle \cdot, \cdot \rangle und eine Norm genau ist, steht in Kap. 4; hier brauchen wir nur, dass ein Skalarprodukt gleich null genau Orthogonalität bedeutet.)

!!
Fredholm-Alternative (Lösbarkeitskriterium)
Ax=b lo¨sbar    by  fu¨r alle y mit ATy=0A\,\mathbf{x} = \mathbf{b} \text{ lösbar} \;\Longleftrightarrow\; \mathbf{b} \perp \mathbf{y} \ \text{ für alle } \mathbf{y} \text{ mit } A^\mathsf{T}\mathbf{y} = \mathbf{0}
Lösbar genau dann, wenn b\mathbf{b} senkrecht auf jeder Lösung des transponierten homogenen Systems steht.
Definition Adjungiertheit
Az,y=z,ATy\langle A\mathbf{z}, \mathbf{y} \rangle = \langle \mathbf{z}, A^\mathsf{T}\mathbf{y} \rangle. Die transponierte Matrix ATA^\mathsf{T} ist diejenige, die AA im Skalarprodukt auf die andere Seite holt.
Notation Notation: ,\langle \cdot, \cdot \rangle, ATA^\mathsf{T}, \perp
u,v\langle \mathbf{u}, \mathbf{v} \rangle = Skalarprodukt (eine Zahl). ATA^\mathsf{T} = Transponierte von AA (Zeilen und Spalten getauscht). \perp = ‚steht senkrecht auf', gleichbedeutend mit Skalarprodukt null.
Formel Adjungiertheit
Az,y=z,ATy\langle A\mathbf{z}, \mathbf{y} \rangle = \langle \mathbf{z}, A^\mathsf{T}\mathbf{y} \rangle
Verschieben von AA im Skalarprodukt erzeugt ATA^\mathsf{T}.
Merke Fundamentalsatz, Kurzform
Im(A)Ker(AT)\operatorname{Im}(A) \perp \operatorname{Ker}(A^\mathsf{T}), und beide zusammen füllen Rm\mathbb{R}^m. Was das Bild verfehlt, steht senkrecht darauf.
Querverweis Verweise
→ Kap. 4: Skalarprodukt, Norm

5.4Lineare Selbstabbildungen

5.4 Invertierbare Abbildungen und Umkehrabbildung

Eine Selbstabbildung bildet einen Raum auf sich selbst ab, F:VVF: V \to V. Start- und Zielraum sind also gleich. Die zentrale Frage hier: Kann man die Maschine rückwärts laufen lassen und genau den ursprünglichen Input zurückbekommen?

Anschaulich heisst das, FF ist verlustfrei: zu jedem Output gehört genau ein Input, nichts wird vermischt oder plattgedrückt. Wie das Entpacken einer ZIP-Datei, das exakt die Originaldatei zurückgibt. Formal: FF heisst invertierbar, wenn es zu jedem yV\mathbf{y} \in V genau ein xV\mathbf{x} \in V mit F(x)=yF(\mathbf{x}) = \mathbf{y} gibt. Das Zeichen !\exists! steht dabei für ‚es existiert genau ein'.

Ist FF invertierbar, definiert man die Umkehrabbildung F1F^{-1}: sie schickt jeden Output y\mathbf{y} zurück auf seinen eindeutigen Input x\mathbf{x}. Für Matrizen ist die Bedingung handfest: F(x)=AxF(\mathbf{x}) = A\,\mathbf{x} ist genau dann invertierbar, wenn die Matrix AA regulär ist (also eine Inverse A1A^{-1} besitzt). Die Umkehrabbildung ist dann selbst wieder linear, mit Matrix A1A^{-1}.

Invertierbar (Selbstabbildung)
F:VV invertierbar    yV !xV:F(x)=yF: V \longrightarrow V \text{ invertierbar} \;\Longleftrightarrow\; \forall\, \mathbf{y} \in V\ \exists!\, \mathbf{x} \in V: F(\mathbf{x}) = \mathbf{y}
!\exists! heisst ‚es existiert genau ein'. Jeder Output hat genau einen Input.
Umkehrabbildung
F1:VV,yx  mit F(x)=yF^{-1}: V \longrightarrow V, \qquad \mathbf{y} \longmapsto \mathbf{x} \ \text{ mit } F(\mathbf{x}) = \mathbf{y}
Schickt jeden Output zurück auf seinen eindeutigen Input.
!!
Matrixfall: invertierbar = regulär
F(x)=Ax invertierbar    A regula¨r,F1(y)=A1y\begin{aligned} F(\mathbf{x}) = A\,\mathbf{x} \text{ invertierbar} \;&\Longleftrightarrow\; A \text{ regulär}, \\ F^{-1}(\mathbf{y}) &= A^{-1}\mathbf{y} \end{aligned}
F1F^{-1} ist wieder linear, ihre Matrix ist die Inverse A1A^{-1}.
Hin und zurück ergibt die Identität
FF1=F1F=Id,Id:RnRn, xxF \circ F^{-1} = F^{-1} \circ F = \operatorname{Id}, \qquad \operatorname{Id}: \mathbb{R}^n \to \mathbb{R}^n,\ \mathbf{x} \mapsto \mathbf{x}
Id\operatorname{Id} ist die identische Abbildung, die jeden Vektor unverändert lässt.
Definition Invertierbar / Umkehrabbildung
F:VVF: V \to V ist invertierbar, wenn jeder Output genau einen Input hat. Dann gibt es F1F^{-1} mit F1F=IdF^{-1} \circ F = \operatorname{Id}.
Notation Notation: F1F^{-1}, Id\operatorname{Id}, !\exists!
F1F^{-1} = Umkehrabbildung. Id\operatorname{Id} = identische Abbildung (xx\mathbf{x} \mapsto \mathbf{x}). !\exists! = ‚es existiert genau ein'.
Merke Äquivalenzkette
AA regulär ⇔ invertierbar ⇔ det(A)0\det(A) \neq 0 ⇔ voller Rang ⇔ Ker(A)={0}\operatorname{Ker}(A) = \{\mathbf{0}\}.

5.4.1 Koordinatentransformation und Basiswechsel

Hier ist die Frage, um die sich der ganze Abschnitt dreht: Derselbe Vektor, eine andere Basis, wie rechne ich seine Koordinaten um? Und was passiert mit der Matrix einer Abbildung, wenn man die Basis wechselt? Das ist nicht nur Buchhaltung. Die Schwierigkeit eines Problems hängt oft allein von der Wahl der Basis ab. In der richtigen Basis wird aus einer hässlichen Matrix eine Diagonalmatrix, und plötzlich ist alles einfach (genau das ist das Thema von Kap. 6).

Das anschauliche Bild: Ein Basiswechsel ist ein Wechsel der Masseinheit oder der Landkarte. Der Ort, also der Vektor selbst, bleibt liegen, wo er ist. Nur die Zahlen, mit denen wir ihn beschreiben, ändern sich. Die Matrix, die zwischen den beiden Zahlensystemen umrechnet, ist sozusagen der Wechselkurs.

Wir messen denselben Vektor v\mathbf{v} in zwei Basen, BB und BB'. Das liefert zwei Koordinatenvektoren, [v]B[\mathbf{v}]_B und [v]B[\mathbf{v}]_{B'}. Die Übergangsmatrix rechnet den einen in den anderen um. Wir nennen TT die Übergangsmatrix von BB nach BB' und SS die von BB' zurück nach BB. Da Hin- und Rückrechnung sich aufheben, gilt T=S1T = S^{-1}.

Koordinatenvektoren in zwei Basen
[v]B=(v1,,vn)T,[v]B=(v1,,vn)T[\mathbf{v}]_B = (v_1, \ldots, v_n)^\mathsf{T}, \qquad [\mathbf{v}]_{B'} = (v_1', \ldots, v_n')^\mathsf{T}
Derselbe Vektor v\mathbf{v}, zweimal vermessen: einmal in BB, einmal in BB'.
!!
Übergangsmatrix T (von B nach B′)
[v]B=([b1]B  [bn]B)[v]B=T[v]B\begin{aligned} [\mathbf{v}]_{B'} &= \bigl(\,[\mathbf{b}_1]_{B'}\ \cdots\ [\mathbf{b}_n]_{B'}\,\bigr) \cdot [\mathbf{v}]_B \\ &= T \cdot [\mathbf{v}]_B \end{aligned}
Spalten von TT = alte Basisvektoren bj\mathbf{b}_j, ausgedrückt in den neuen Koordinaten BB'.
Übergangsmatrix S (von B′ nach B) und ihr Zusammenhang
[v]B=([b1]B  [bn]B)[v]B=S[v]B,T=S1\begin{aligned} [\mathbf{v}]_B &= \bigl(\,[\mathbf{b}_1']_B\ \cdots\ [\mathbf{b}_n']_B\,\bigr) \cdot [\mathbf{v}]_{B'} \\ &= S \cdot [\mathbf{v}]_{B'}, \qquad T = S^{-1} \end{aligned}
SS rechnet von BB' zurück nach BB. Hin und zurück hebt sich auf: T=S1T = S^{-1}.

Beispiel C: eine Übergangsmatrix aufstellen

  1. Die zwei Basen
    Wir nehmen die einfachste nichttriviale Situation im R2\mathbb{R}^2: Standardbasis und eine gedrehte Basis.
    B=(e1,e2)B = (\mathbf{e}_1, \mathbf{e}_2) ist die Standardbasis. B=(e1,e2)B' = (\mathbf{e}_1', \mathbf{e}_2') mit e1=e1+e2\mathbf{e}_1' = \mathbf{e}_1 + \mathbf{e}_2 und e2=e2e1\mathbf{e}_2' = \mathbf{e}_2 - \mathbf{e}_1.
    e1=e1+e2,e2=e2e1\mathbf{e}_1' = \mathbf{e}_1 + \mathbf{e}_2, \qquad \mathbf{e}_2' = \mathbf{e}_2 - \mathbf{e}_1
  2. Spalten aus den neuen Basisvektoren in B-Koordinaten
    Um von BB' nach BB zu rechnen, schreiben wir jeden BB'-Vektor in BB-Koordinaten als Spalte. Bei der Standardbasis BB ist das direkt ablesbar.
    e1\mathbf{e}_1' hat in der Standardbasis die Koordinaten (1,1)T(1, 1)^\mathsf{T}, e2\mathbf{e}_2' die Koordinaten (1,1)T(-1, 1)^\mathsf{T}. Das sind die beiden Spalten.
    [v]B=([e1]B [e2]B)[v]B=(1111)[v]B\begin{aligned} [\mathbf{v}]_B &= \bigl([\mathbf{e}_1']_B\ [\mathbf{e}_2']_B\bigr) \cdot [\mathbf{v}]_{B'} \\ &= \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix} \cdot [\mathbf{v}]_{B'} \end{aligned}

Soweit der Vektor. Jetzt der spannendere Teil: Wie ändert sich die Darstellungsmatrix einer Abbildung F:VVF: V \to V beim Basiswechsel? Schreiben wir [F]B[F]_B für ihre Matrix in der Basis BB und [F]B[F]_{B'} für die in BB'. Der Zusammenhang ist eine Konjugation: man umrahmt die Matrix mit der Übergangsmatrix und ihrer Inversen.

Lies die Formel von rechts nach links wie einen Arbeitsablauf: Ein Vektor liegt in BB'-Koordinaten vor. Erst rechnet TT ihn nach BB (bzw. das passende Stück), dann wirkt die Abbildung, dann rechnet die Inverse das Ergebnis zurück. Die Abbildung selbst bleibt dieselbe, nur ihre ‚Brille', die Basis, wechselt.

!!!
Basiswechsel der Matrix (Konjugation)
[F]B=T1[F]BT=S[F]BS1,[F]B=T[F]BT1=S1[F]BS\begin{aligned} [F]_B &= T^{-1}\,[F]_{B'}\,T = S\,[F]_{B'}\,S^{-1}, \\ [F]_{B'} &= T\,[F]_B\,T^{-1} = S^{-1}\,[F]_B\,S \end{aligned}
Die Matrix wird mit der Übergangsmatrix umrahmt (konjugiert). Achte genau, welche Matrix links und welche rechts steht.

Beispiel D: eine Matrix in eine neue Basis umrechnen

  1. Gegeben
    Wir nehmen dieselben zwei Basen wie in Beispiel C und eine konkrete Matrix in der Standardbasis.
    B=(e1,e2)B = (\mathbf{e}_1, \mathbf{e}_2), B=(e1+e2, e2e1)B' = (\mathbf{e}_1 + \mathbf{e}_2,\ \mathbf{e}_2 - \mathbf{e}_1), und [F]B[F]_B ist gegeben.
    [F]B=(1234),S=(1111)[F]_B = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}, \qquad S = \begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix}
  2. Konjugationsformel anwenden
    Gesucht ist [F]B[F]_{B'}. Mit SS als Übergang von BB' nach BB ist [F]B=S1[F]BS[F]_{B'} = S^{-1}\,[F]_B\,S.
    Die Inverse von SS ist S1=12(1111)S^{-1} = \tfrac{1}{2}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}. Einsetzen und ausmultiplizieren.
    [F]B=S1[F]BS=12(1111)(1234)(1111)\begin{aligned} [F]_{B'} &= S^{-1}\,[F]_B\,S \\ &= \tfrac{1}{2}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}\begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix} \end{aligned}
  3. Resultat
    Zwei Matrixprodukte nacheinander, dann der Faktor 12\tfrac{1}{2}.
    Die Abbildung sieht in der Basis BB' so aus:
    [F]B=(5120)[F]_{B'} = \begin{pmatrix} 5 & 1 \\ 2 & 0 \end{pmatrix}

Beispiel E: Basiswechselmatrizen verketten

  1. Drei Basen, definiert durch Vektoren
    Oft hat man mehr als zwei Basen und will zwischen beliebigen wechseln. Der Trick: über eine bekannte Zwischenbasis (hier die Standardbasis CC) verketten.
    Basis A=(a1,a2)A = (\mathbf{a}_1, \mathbf{a}_2), Basis B=(b1,b2)B = (\mathbf{b}_1, \mathbf{b}_2), Standardbasis C=(c1,c2)C = (\mathbf{c}_1, \mathbf{c}_2). Wir schreiben TCAT_{CA} für den Übergang von AA nach CC (Ziel CC steht im Index links).
    a1=(1,1)T, a2=(2,3)T;b1=(3,0)T, b2=(2,1)T;c1=(1,0)T, c2=(0,1)T\begin{aligned} \mathbf{a}_1 &= (1,1)^\mathsf{T},\ \mathbf{a}_2 = (2,3)^\mathsf{T}; \\ \mathbf{b}_1 &= (3,0)^\mathsf{T},\ \mathbf{b}_2 = (-2,-1)^\mathsf{T}; \\ \mathbf{c}_1 &= (1,0)^\mathsf{T},\ \mathbf{c}_2 = (0,1)^\mathsf{T} \end{aligned}
  2. Schritt 1: T von A nach C und zurück
    Die a\mathbf{a}-Vektoren sind schon in CC-Koordinaten (Standardbasis) gegeben, also direkt als Spalten. Die Rückrichtung ist die Inverse.
    a1=c1+c2\mathbf{a}_1 = \mathbf{c}_1 + \mathbf{c}_2, a2=2c1+3c2\mathbf{a}_2 = 2\mathbf{c}_1 + 3\mathbf{c}_2. Das gibt TCAT_{CA}; die Inverse TACT_{AC} folgt aus der 2×22 \times 2-Inversenformel (Determinante 32=13 - 2 = 1).
    TCA=(1213),TAC=TCA1=(3211)T_{CA} = \begin{pmatrix} 1 & 2 \\ 1 & 3 \end{pmatrix}, \qquad T_{AC} = T_{CA}^{-1} = \begin{pmatrix} 3 & -2 \\ -1 & 1 \end{pmatrix}
  3. Schritt 2: T von B nach C und zurück
    Genauso für die b\mathbf{b}-Vektoren, die ebenfalls in CC-Koordinaten vorliegen.
    b1=3c1\mathbf{b}_1 = 3\mathbf{c}_1, b2=2c1c2\mathbf{b}_2 = -2\mathbf{c}_1 - \mathbf{c}_2. Das gibt TCBT_{CB} (Determinante 3-3), und die Inverse TBCT_{BC}.
    TCB=(3201),TBC=TCB1=(132301)T_{CB} = \begin{pmatrix} 3 & -2 \\ 0 & -1 \end{pmatrix}, \qquad T_{BC} = T_{CB}^{-1} = \begin{pmatrix} \tfrac{1}{3} & -\tfrac{2}{3} \\ 0 & -1 \end{pmatrix}
  4. Schritt 3: verketten zu T von B nach A
    Jetzt der eigentliche Trick: von BB nach AA geht man über CC. Erst von BB nach CC, dann von CC nach AA.
    Von rechts gelesen: BCB \to C (das ist TCBT_{CB}), dann CAC \to A (das ist TACT_{AC}). Zusammen BAB \to A. Die Indizes ‚fädeln' sich auf: TACTCBT_{AC}\,T_{CB}, das innere CC kürzt sich gedanklich.
    TAB=TACTCB=(3211)(3201)=(9431)\begin{aligned} T_{AB} = T_{AC}\,T_{CB} &= \begin{pmatrix} 3 & -2 \\ -1 & 1 \end{pmatrix}\begin{pmatrix} 3 & -2 \\ 0 & -1 \end{pmatrix} \\ &= \begin{pmatrix} 9 & -4 \\ -3 & 1 \end{pmatrix} \end{aligned}
  5. Schritt 4: die Gegenrichtung und zwei Punkte umrechnen
    Symmetrisch erhält man TBAT_{BA}, und damit kann man Koordinaten konkret umrechnen.
    TBA=TBCTCAT_{BA} = T_{BC}\,T_{CA}. Damit etwa Punkt P=(1,2)CTP = (1,2)^\mathsf{T}_C in die AA-Basis und Punkt Q=(1,1)ATQ = (1,1)^\mathsf{T}_A in die CC-Basis umrechnen (der Index am Vektor sagt, in welcher Basis gemessen wird).
    P=TAC(1,2)CT=(1,1)AT;Q=TCA(1,1)AT=(3,4)CT\begin{aligned} P = T_{AC}\,(1,2)^\mathsf{T}_C &= (-1, 1)^\mathsf{T}_A; \\ Q = T_{CA}\,(1,1)^\mathsf{T}_A &= (3, 4)^\mathsf{T}_C \end{aligned}

Beispiel F: Komplettaufgabe im ℝ³ (das Prüfungsformat)

  1. Die Abbildung
    Das ist die typische Klausuraufgabe: eine 3×33 \times 3-Abbildung, dann Darstellungsmatrix, Basiswechsel, Kern und Bild, alles an einem Stück.
    F:R3R3F: \mathbb{R}^3 \to \mathbb{R}^3 ist komponentenweise gegeben.
    F(x,y,z)=(7x+5y8z,  5x+3y4z,  x3y+8z)TF(x, y, z) = (7x + 5y - 8z,\ \ 5x + 3y - 4z,\ \ -x - 3y + 8z)^\mathsf{T}
  2. Teil a: Darstellungsmatrix in der Standardbasis
    In der Standardbasis E\mathcal{E} liest man die Matrix direkt aus den Koeffizienten ab: Zeile für Zeile die Vorfaktoren.
    Jede Komponente liefert eine Zeile von [F]E[F]_\mathcal{E}.
    [F]E=(758534138)[F]_\mathcal{E} = \begin{pmatrix} 7 & 5 & -8 \\ 5 & 3 & -4 \\ -1 & -3 & 8 \end{pmatrix}
  3. Teil b: Übergangsmatrix T zur neuen Basis und ihre Inverse
    Die neue Basis B\mathcal{B} ist über die Standardbasis definiert, also bilden ihre Vektoren (in E\mathcal{E}-Koordinaten) direkt die Spalten von TT.
    B={e1, e1+e2, e2+e3}\mathcal{B} = \{\mathbf{e}_1,\ \mathbf{e}_1 + \mathbf{e}_2,\ \mathbf{e}_2 + \mathbf{e}_3\}. Die Spalten von TT sind diese drei Vektoren. T1T^{-1} per Gauss-Jordan.
    T=(110011001),T1=(111011001)T = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \\ 0 & 0 & 1 \end{pmatrix}, \qquad T^{-1} = \begin{pmatrix} 1 & -1 & 1 \\ 0 & 1 & -1 \\ 0 & 0 & 1 \end{pmatrix}
  4. Teil c: Darstellungsmatrix in der neuen Basis
    Jetzt die Konjugation: [F]B=T1[F]ET[F]_\mathcal{B} = T^{-1}\,[F]_\mathcal{E}\,T. Hier gehört T1T^{-1} links und TT rechts.
    Zwei Matrixprodukte nacheinander liefern die Matrix von FF in der Basis B\mathcal{B}.
    [F]B=T1[F]ET=(1036126145)[F]_\mathcal{B} = T^{-1}\,[F]_\mathcal{E}\,T = \begin{pmatrix} 1 & 0 & 3 \\ 6 & 12 & -6 \\ -1 & -4 & 5 \end{pmatrix}
  5. Teil d: Kern und Bild via Gauss
    Für Kern und Bild bringt man [F]E[F]_\mathcal{E} auf reduzierte Zeilenstufenform.
    Nach der Elimination bleiben zwei Pivots (Spalten 1, 2), Spalte 3 ist frei. Der Kern ist eine Gerade, das Bild ist von den zwei Pivot-Original-Spalten aufgespannt. Gegenprobe: dimKer+dimIm=1+2=3=n\dim\operatorname{Ker} + \dim\operatorname{Im} = 1 + 2 = 3 = n.
    Ker(F)={t(1,3,1)T},Im(F)=span{(7,5,1)T, (5,3,3)T}\begin{aligned} \operatorname{Ker}(F) &= \{\, t\,(-1, 3, 1)^\mathsf{T} \,\}, \\ \operatorname{Im}(F) &= \operatorname{span}\{(7,5,-1)^\mathsf{T},\ (5,3,-3)^\mathsf{T}\} \end{aligned}

Beispiel G: Basiswechsel im Funktionenraum

  1. Der Raum und die Abbildung
    Zum Abschluss ein Transfer-Beispiel: Basiswechsel funktioniert genauso in Funktionenräumen, nicht nur im Rn\mathbb{R}^n. (Die Quelle nennt diese Abbildung LL statt FF; gemeint ist dasselbe Konzept.)
    VV ist der von B={cos(x),sin(x),1,x,x2}\mathcal{B} = \{\cos(x), \sin(x), 1, x, x^2\} erzeugte Funktionenraum. Die Abbildung ist L:f(x)f(x)+f(x)+f(x)L: f(x) \mapsto f(x) + f'(x) + f''(x).
    B={cos(x), sin(x), 1, x, x2},L(f)=f+f+f\mathcal{B} = \{\cos(x),\ \sin(x),\ 1,\ x,\ x^2\}, \qquad L(f) = f + f' + f''
  2. Schritt 1: jede Basisfunktion abbilden
    Kochrezept wie in 5.1: LL auf jeden Baustein anwenden, Ergebnis in B\mathcal{B}-Koordinaten.
    Für cos(x)\cos(x): cos(x)sin(x)cos(x)=sin(x)\cos(x) - \sin(x) - \cos(x) = -\sin(x). Für sin(x)\sin(x): sin(x)+cos(x)sin(x)=cos(x)\sin(x) + \cos(x) - \sin(x) = \cos(x). Für 11: 11. Für xx: x+1x + 1. Für x2x^2: x2+2x+2x^2 + 2x + 2.
    L(cos(x))=sin(x), L(sin(x))=cos(x),L(1)=1, L(x)=x+1, L(x2)=x2+2x+2\begin{aligned} &L(\cos(x)) = -\sin(x),\ L(\sin(x)) = \cos(x), \\ &L(1) = 1,\ L(x) = x+1,\ L(x^2) = x^2 + 2x + 2 \end{aligned}
  3. Schritt 2: Darstellungsmatrix zusammensetzen
    Jedes Bild in B\mathcal{B}-Koordinaten schreiben und als Spalte einsetzen, fünf Spalten für fünf Basisfunktionen.
    Der obere 2×22 \times 2-Block dreht cos(x)\cos(x) und sin(x)\sin(x) ineinander, der untere Block behandelt 1,x,x21, x, x^2.
    [L]B=(0100010000001120001200001)[L]_\mathcal{B} = \begin{pmatrix} 0 & 1 & 0 & 0 & 0 \\ -1 & 0 & 0 & 0 & 0 \\ 0 & 0 & 1 & 1 & 2 \\ 0 & 0 & 0 & 1 & 2 \\ 0 & 0 & 0 & 0 & 1 \end{pmatrix}
Definition Übergangsmatrix / Basiswechsel
Matrix, die Koordinaten eines Vektors von einer Basis in eine andere umrechnet. Der Vektor bleibt, nur seine Zahlen ändern sich (‚Wechselkurs').
Formel Spaltenregel
TQW=([q1]W  [qn]W)T_{Q \to W} = \bigl([\mathbf{q}_1]_W\ \cdots\ [\mathbf{q}_n]_W\bigr)
Alte Basis QQ in neuen Koordinaten WW als Spalten.
Formel Konjugation der Matrix
[F]B=T1[F]BT[F]_B = T^{-1}\,[F]_{B'}\,T
Dieselbe Abbildung, andere ‚Brille'. T1T^{-1} links, TT rechts.
Notation Notation: TT, SS, [v]B[\mathbf{v}]_B, TCAT_{CA}
TT = Übergang BBB \to B', SS = Übergang BBB' \to B, mit T=S1T = S^{-1}. [v]B[\mathbf{v}]_B = Koordinaten in BB. Index TCAT_{CA} = ‚Ziel CC ← Quelle AA' (Ziel zuerst). Manche Texte schreiben stattdessen TQWT_{Q \to W} (Quelle zuerst); dieselbe Matrix, nur die Index-Reihenfolge ist gegenläufig.
Merke Standardbasis-Trick
Ist eine Basis die Standardbasis, ist eine Richtung direkt ablesbar; die andere ist TWQ=TQW1T_{W \to Q} = T_{Q \to W}^{-1}.

Aufgaben mit Musterlösungen

Übungsaufgaben mit ausführlichen Musterlösungen werden in Kürze ergänzt.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!