“Die Schwierigkeit eines Problems hängt oft nur von der Wahl der Basis ab.”
— Lineare Algebra
Stell dir eine Maschine vor, die Vektoren frisst und Vektoren ausspuckt. Du darfst zwei Dinge mit ihr tun: erst zwei Vektoren mischen (addieren) und dann durch die Maschine schicken, oder erst beide einzeln durch die Maschine schicken und dann das Ergebnis mischen. Eine faire Maschine liefert beide Male dasselbe. Genau diese Fairness ist die Linearität. Und wenn du den Input verdoppelst, verdoppelt sich auch der Output, ohne Überraschung.
Formal: Eine Abbildung schickt jeden Vektor aus einem Vektorraum (dem Start) auf einen Vektor in einem Vektorraum (dem Ziel). Man schreibt , gelesen ‚ bildet nach ab', und , gelesen ‚ wird auf abgebildet'. Hier sind und zwei beliebige Vektorräume (was ein Vektorraum genau ist, steht in Kap. 4).
heisst linear, wenn sie zwei Bedingungen erfüllt. Die erste, die Additivität, sagt: Summen darf man vor oder nach dem Abbilden bilden, das Ergebnis ist gleich. Die zweite, die Homogenität, sagt: einen Streckfaktor darf man vor oder nach dem Abbilden anbringen. Beides zusammen heisst anschaulich: respektiert die zwei Grundoperationen eines Vektorraums, das Addieren und das Skalieren.
In der Praxis prüft man Additivität und Homogenität meist in einem Rutsch. Man fasst sie zur kombinierten Linearitätsbedingung zusammen. Sie ist die Kernidee dieses ganzen Kapitels: vertauscht mit jeder Linearkombination. Anschaulich heisst das, man darf durch eine Summe und an einem Streckfaktor vorbei ‚durchziehen'.
Aus der Homogenität folgt sofort ein nützlicher Spezialfall. Setzt man den Streckfaktor , so steht da . Jede lineare Abbildung schickt den Nullvektor auf den Nullvektor. Das klingt unscheinbar, ist aber der schnellste Linearitäts-Test überhaupt: bildet eine Abbildung nicht auf ab, kann sie unmöglich linear sein.
Die Verschiebung aus Test 3 hat trotzdem einen Namen, weil sie ständig auftaucht (Drehung plus Verschiebung in der Computergrafik, Koordinatenwechsel mit verschobenem Ursprung). Eine Abbildung der Form ‚lineare Abbildung plus festen Vektor' heisst affin linear. Merke dir die Abgrenzung sauber: affin linear ist linear genau dann, wenn der angehängte Vektor der Nullvektor ist. Sobald , ist sie affin, aber nicht mehr linear.
Hier eine Frage, die alles vereinfacht: Wenn linear ist, wie viel musst du wirklich über wissen, um sie vollständig zu kennen? Erstaunlich wenig. Es genügt, zu wissen, wohin die Basisvektoren schickt. Warum? Weil jeder Vektor eine Linearkombination der Basisvektoren ist, und Linearität sagt, dass mit Linearkombinationen vertauscht. Kennst du die Bilder der Bausteine, kennst du das Bild von allem.
Anschaulich: die Basisvektoren sind die Bausteine des Raums. Lege fest, was mit jedem Baustein macht, und ist überall festgelegt. Genau das macht eine Matrix möglich. Um aus eine Matrix zu bauen, brauchen wir zwei Basen: eine Basis für den Startraum und eine Basis für den Zielraum .
Den Koordinatenvektor eines Vektors bezüglich der Basis schreiben wir . Das ist die Liste der Gewichte, mit denen man die Basisvektoren von kombinieren muss, um zu erhalten. Ist , dann ist . Ebenso steht für die Koordinaten des Bildes in der Zielbasis .
Die Darstellungsmatrix von bezüglich und übersetzt nun Koordinaten in Koordinaten: aus den Start-Koordinaten macht das Matrixprodukt die Ziel-Koordinaten . So wird aus einer abstrakten Abbildung eine ganz konkrete Matrix, mit der man rechnen kann.
Zwei natürliche Fragen zu jeder Maschine: Welche Inputs verschluckt sie zu null? Und welche Outputs sind überhaupt erreichbar? Die erste Frage führt zum Kern, die zweite zum Bild. Beide gehören zum Standard-Werkzeugkasten, wenn man eine lineare Abbildung verstehen will.
Der Kern ist die Menge aller Startvektoren, die auf den Nullvektor abbildet. Anschaulich sind das die toten Richtungen der Abbildung: alles, was platt auf null gedrückt wird, verschwindet im Kern. Das Bild ist die Menge aller Vektoren, die als Ergebnis wirklich auftreten. Anschaulich ist das die erreichbare Welt: alle möglichen Outputs der Maschine.
Beide hängen direkt mit Gleichungssystemen zusammen. Ein Vektor liegt im Kern genau dann, wenn er das homogene System löst. Und ein Vektor liegt im Bild genau dann, wenn das System lösbar ist. Da eine Linearkombination der Spalten von ist (die Spaltensicht aus Kap. 1), ist das Bild genau der von den Spalten aufgespannte Raum.
Kern und Bild sind nicht irgendwelche Mengen, sondern Unterräume: der Kern ist ein Unterraum des Startraums , das Bild ein Unterraum des Zielraums . Das ist beruhigend, denn es heisst, sie haben jeweils eine Basis und eine Dimension, mit denen man sauber rechnen kann (Unterraum, Basis und Spann sind in Kap. 4 erklärt).
Frage: Wie viele unabhängige Richtungen überleben die Abbildung? Genau diese Zahl heisst der Rang. Anschaulich ist der Rang die effektive Breite der Maschine, also wie viele Dimensionen am Ausgang wirklich ankommen. Eine Matrix kann viele Spalten haben und trotzdem nur wenige unabhängige Richtungen erzeugen, der Rang misst das.
Definiert ist der Rang als die Dimension des Bildes, . Das ist sofort plausibel: das Bild ist der Spann der Spalten, und seine Dimension ist die Anzahl unabhängiger Spalten, also die Anzahl der Pivots in der Zeilenstufenform. Bemerkenswert: man erhält denselben Wert, ob man unabhängige Spalten oder unabhängige Zeilen zählt. Deshalb gilt , Zeilenrang gleich Spaltenrang.
Jetzt kommt die wichtigste Formel des Abschnitts, die Dimensionsformel (auch Rangsatz genannt). Sie verknüpft Kern und Bild: die Dimension des Kerns plus die Dimension des Bildes ist gleich der Anzahl der Spalten, also der Dimension des Startraums.
Lies sie als Erhaltungssatz: die Input-Dimensionen teilen sich sauber auf. Ein Teil wird ‚verschluckt' (geht in den Kern, also auf null), der Rest ‚überlebt' (landet im Bild). Nichts geht verloren, nichts kommt dazu. Wer also den Kern kennt, kennt sofort den Rang, und umgekehrt.
Eine kurze Gegenprobe mit Beispiel B aus dem letzten Abschnitt: die -Matrix hatte Spalten und einen zweidimensionalen Kern, also . Die Dimensionsformel sagt , der Rang ist 2. Und genau zwei Pivot-Spalten hatten wir gefunden. Alles passt zusammen.
Stell dir ein Fliessband mit zwei Stationen vor: zuerst läuft jeder Vektor durch die Maschine , dann durch die Maschine . Zwei Fragen drängen sich auf: Ist die Gesamtmaschine wieder linear? Und welche Matrix gehört zu ihr? Beide Antworten sind erfreulich klar.
Erstens: Die Zusammensetzung zweier linearer Abbildungen ist wieder linear. Das ist die Grundlage dafür, dass man komplizierte Abbildungen aus einfachen zusammenstückeln darf, ohne die Linearität zu verlieren. Zweitens: Ist (von nach ) und (von nach ), so gehört zur Gesamtabbildung das Matrixprodukt .
Achtung auf die Reihenfolge: Wir schreiben die zusammengesetzte Abbildung , gelesen ‚ nach ', und sie wirkt . Die Matrix, die zuerst angewendet wird (, für ), steht rechts; die zuletzt angewendete (, für ) steht links. Genau wie bei verschachtelten Funktionen , wo zuerst dran ist, obwohl es weiter innen steht.
Ein Dimensionscheck macht die Reihenfolge zwingend: ist , ist . Das Produkt passt nur in dieser Reihenfolge zusammen (die ‚innere' Dimension muss übereinstimmen) und ergibt eine -Matrix, genau die Form, die von nach abbildet. Schriebe man , würden die Dimensionen meist gar nicht passen.
Bisher lebten Kern und Bild getrennt: der Kern im Startraum, das Bild im Zielraum. Wie hängen sie zusammen? Die Brücke ist das Skalarprodukt. Und gleich danach beantworten wir damit eine der wichtigsten Fragen der linearen Algebra: Wann ist ein System überhaupt lösbar?
Das anschauliche Bild: der Zielraum zerfällt in zwei zueinander senkrechte Teile. Der eine Teil ist das Bild , also alles, was erreichen kann. Der andere ist der Kern der transponierten Matrix, , also alles, was das Bild nicht erreicht. Zusammen spannen die beiden den ganzen auf, und sie stehen senkrecht aufeinander. Was das Bild verfehlt, steht also genau orthogonal dazu.
Der Grund dafür steckt in einer Rechenregel für das Skalarprodukt, der Adjungiertheit. Sie sagt: Man darf die Matrix im Skalarprodukt von der einen auf die andere Seite schieben, wenn man sie dabei transponiert. Diese Gleichung ist im Grunde die definierende Eigenschaft der transponierten Matrix.
Aus diesem Bild folgt direkt die Fredholm-Alternative, ein Lösbarkeitskriterium. Anschaulich: ist genau dann lösbar, wenn keine ‚verbotene Komponente' hat, also vollständig im Bild liegt. Und ‚im Bild liegen' heisst nach dem Senkrecht-Bild: steht senkrecht auf allem, was das Bild verfehlt, das heisst senkrecht auf allen Lösungen von .
Das ist enorm praktisch: Statt das ganze System zu lösen, prüft man nur ein paar Skalarprodukte. (Was ein Skalarprodukt und eine Norm genau ist, steht in Kap. 4; hier brauchen wir nur, dass ein Skalarprodukt gleich null genau Orthogonalität bedeutet.)
Eine Selbstabbildung bildet einen Raum auf sich selbst ab, . Start- und Zielraum sind also gleich. Die zentrale Frage hier: Kann man die Maschine rückwärts laufen lassen und genau den ursprünglichen Input zurückbekommen?
Anschaulich heisst das, ist verlustfrei: zu jedem Output gehört genau ein Input, nichts wird vermischt oder plattgedrückt. Wie das Entpacken einer ZIP-Datei, das exakt die Originaldatei zurückgibt. Formal: heisst invertierbar, wenn es zu jedem genau ein mit gibt. Das Zeichen steht dabei für ‚es existiert genau ein'.
Ist invertierbar, definiert man die Umkehrabbildung : sie schickt jeden Output zurück auf seinen eindeutigen Input . Für Matrizen ist die Bedingung handfest: ist genau dann invertierbar, wenn die Matrix regulär ist (also eine Inverse besitzt). Die Umkehrabbildung ist dann selbst wieder linear, mit Matrix .
Hier ist die Frage, um die sich der ganze Abschnitt dreht: Derselbe Vektor, eine andere Basis, wie rechne ich seine Koordinaten um? Und was passiert mit der Matrix einer Abbildung, wenn man die Basis wechselt? Das ist nicht nur Buchhaltung. Die Schwierigkeit eines Problems hängt oft allein von der Wahl der Basis ab. In der richtigen Basis wird aus einer hässlichen Matrix eine Diagonalmatrix, und plötzlich ist alles einfach (genau das ist das Thema von Kap. 6).
Das anschauliche Bild: Ein Basiswechsel ist ein Wechsel der Masseinheit oder der Landkarte. Der Ort, also der Vektor selbst, bleibt liegen, wo er ist. Nur die Zahlen, mit denen wir ihn beschreiben, ändern sich. Die Matrix, die zwischen den beiden Zahlensystemen umrechnet, ist sozusagen der Wechselkurs.
Wir messen denselben Vektor in zwei Basen, und . Das liefert zwei Koordinatenvektoren, und . Die Übergangsmatrix rechnet den einen in den anderen um. Wir nennen die Übergangsmatrix von nach und die von zurück nach . Da Hin- und Rückrechnung sich aufheben, gilt .
Soweit der Vektor. Jetzt der spannendere Teil: Wie ändert sich die Darstellungsmatrix einer Abbildung beim Basiswechsel? Schreiben wir für ihre Matrix in der Basis und für die in . Der Zusammenhang ist eine Konjugation: man umrahmt die Matrix mit der Übergangsmatrix und ihrer Inversen.
Lies die Formel von rechts nach links wie einen Arbeitsablauf: Ein Vektor liegt in -Koordinaten vor. Erst rechnet ihn nach (bzw. das passende Stück), dann wirkt die Abbildung, dann rechnet die Inverse das Ergebnis zurück. Die Abbildung selbst bleibt dieselbe, nur ihre ‚Brille', die Basis, wechselt.
Übungsaufgaben mit ausführlichen Musterlösungen werden in Kürze ergänzt.
Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.