“Suche die Richtungen, in denen sich nichts dreht. Dort wird alles einfach.”
— Sinngemäss, zum Eigenwertproblem
Stell dir eine Matrix als eine Maschine vor, die jeden Pfeil im Raum nimmt und ihn verschiebt: meistens wird der Pfeil dabei gedreht und gestreckt zugleich. Schickst du einen beliebigen Pfeil hinein, zeigt das Ergebnis in eine ganz neue Richtung. Aber es gibt ein paar ausgezeichnete Pfeile, die ihre Richtung behalten: Die Maschine macht sie nur länger oder kürzer (oder spiegelt sie), dreht sie aber nicht aus ihrer Linie heraus. Genau diese besonderen Pfeile heissen Eigenvektoren, und der Streckfaktor heisst Eigenwert.
Mathematisch heisst das: Wir suchen alle Paare aus einer Zahl und einem Vektor , für die dasselbe ist wie der ursprüngliche Vektor mal . Der Eigenvektor wird also nur skaliert. Die Zahl (sprich „Lambda") heisst der zugehörige Eigenwert. Er darf Null sein, negativ sein oder sogar komplex; nur der Eigenvektor darf nicht der Nullvektor sein, denn gilt für jedes und wäre nutzlos.
Wann brauche ich das? Sobald man oft hintereinander anwendet (Übergänge eines Systems über viele Schritte, ), oder eine Schwingung, eine Drehung, eine quadratische Form oder eine Stabilität verstehen will, sucht man zuerst die Eigenrichtungen. In ihnen wird die Matrix zu einer simplen Multiplikation mit einer Zahl, und alles Komplizierte zerfällt in lauter eindimensionale Probleme. Das ist der rote Faden dieses ganzen Kapitels.
Wie findet man die Eigenwerte? Schreibe um zu , also . Dabei ist die Einheitsmatrix, die nötig ist, damit man von der Matrix die Zahl überhaupt abziehen darf (man zieht entlang der Diagonalen ab). Das ist ein homogenes lineares Gleichungssystem. Es hat den Nullvektor immer als triviale Lösung. Eine nichttriviale Lösung existiert genau dann, wenn die Matrix singulär ist, also ihre Determinante verschwindet.
Damit wird die Suche nach Eigenwerten zu einer Determinantengleichung: . Diese Gleichung verbindet das Eigenwertproblem direkt mit der Determinante aus Kapitel 3. Sie heisst charakteristische Gleichung.
Wertet man aus, erhält man ein Polynom in der Variablen . Für eine -Matrix hat es Grad . Man nennt es das charakteristische Polynom . Anschaulich ist es eine einzige Funktion, in der die ganze Eigenwert-Information von steckt: Ihre Nullstellen sind die Eigenwerte. Aus dem Fundamentalsatz der Algebra folgt sofort: Über den komplexen Zahlen hat ein -System mindestens einen und höchstens verschiedene Eigenwerte.
Hat man einen Eigenwert gefunden, setzt man ihn in ein und löst dieses homogene System (mit Gauss). Die nichttrivialen Lösungen sind die Eigenvektoren zu . Sie bilden zusammen mit dem Nullvektor einen Unterraum, den Eigenraum . Den Eigenraum erhält man also als Kern von ; seine Dimension ist die Anzahl freier Parameter, die beim Lösen übrig bleiben.
Jetzt kommt ein feiner, aber prüfungsrelevanter Punkt: Vielfachheit. Ein Eigenwert kann auf zwei verschiedene Weisen „mehrfach" sein. Die algebraische Vielfachheit zählt, wie oft als Nullstelle im charakteristischen Polynom auftritt (steht als Faktor da, hat algebraische Vielfachheit 2). Die geometrische Vielfachheit zählt, wie viele linear unabhängige Eigenvektoren es zu gibt, also , die Zahl der freien Parameter beim Lösen.
Diese beiden Zahlen sind nicht immer gleich, aber es gibt eine feste Ordnung zwischen ihnen: Jeder Eigenwert hat mindestens einen Eigenvektor (geometrisch ), und die geometrische Vielfachheit kann nie grösser sein als die algebraische. Beide bleiben durch begrenzt. Die Summe aller algebraischen Vielfachheiten ist über genau .
Drei weitere Eigenschaften sparen in Prüfungen enorm viel Rechnung, weil sie Eigenwerte ablesbar machen, ohne überhaupt ein Polynom faktorisieren zu müssen:
| Situation | Aussage | Wozu nützlich |
|---|---|---|
| ist Dreiecksmatrix | Eigenwerte = Diagonaleinträge | EW ohne Polynom direkt ablesbar |
| ist EW von | ist EW von | Eigenwerte der Inversen sofort |
| diagonalisierbar | und | Determinante und Spur als Produkt bzw. Summe der EW |
Ein letzter Baustein für später: Eigenvektoren zu verschiedenen Eigenwerten sind automatisch linear unabhängig. Hat eine -Matrix also verschiedene Eigenwerte, so liefert sie sofort linear unabhängige Eigenvektoren, eine ganze Basis aus Eigenrichtungen. Genau das brauchen wir gleich für die Diagonalisierung.
Frage: Was ist die einfachste Matrix, die dasselbe tut wie , nur in einem klügeren Koordinatensystem? Erinnere dich an die Eigenrichtungen aus 6.1.1: In ihnen wirkt wie eine Streckung um eine Zahl. Wenn wir die Eigenvektoren als neue Achsen wählen, wird entlang jeder Achse zu einer reinen Multiplikation, also zu einer Diagonalmatrix. Genau das leistet die Diagonalisierung.
Den Wechsel des Koordinatensystems beschreibt die Ähnlichkeit. Zwei Matrizen und heissen ähnlich, wenn es eine reguläre (invertierbare) Matrix gibt mit . Anschaulich: ist dieselbe lineare Abbildung wie , nur beschrieben in der Basis, deren Spalten in stehen. Ähnliche Matrizen sind im Kern identisch, nur verschieden notiert.
Eine quadratische Matrix heisst diagonalisierbar, wenn sie zu einer Diagonalmatrix ähnlich ist: Es gibt ein reguläres mit . Die entscheidende Frage ist: Wann geht das? Antwort: genau dann, wenn genügend Eigenvektoren besitzt, nämlich linear unabhängige, die zusammen eine Eigenbasis bilden.
Diese Eigenbasis ist die Bauanleitung für : Die Spalten von sind die Eigenvektoren, und die Diagonale von sind die zugehörigen Eigenwerte, in genau derselben Reihenfolge. Steht in Spalte 1 von ein Eigenvektor zu , so muss in der ersten Diagonalposition von auch stehen. Vertauscht man die Reihenfolge in nur einer der beiden Matrizen, stimmt nicht mehr.
Zwei Sprechweisen helfen, Spezialfälle schnell einzuordnen. Eine Matrix heisst einfach, wenn jeder Eigenwert algebraische Vielfachheit 1 hat (also verschiedene Eigenwerte). Sie heisst halbeinfach, wenn bei jedem Eigenwert algebraische und geometrische Vielfachheit übereinstimmen. Jede einfache Matrix ist auch halbeinfach (verschiedene Eigenwerte liefern automatisch genug unabhängige Eigenvektoren), aber nicht umgekehrt.
Und nun der zentrale Satz dieses Abschnitts, eine Kette von Gleichwertigkeiten: Eine Matrix ist halbeinfach sie besitzt eine Eigenbasis sie ist diagonalisierbar. Alle drei Formulierungen meinen dasselbe. In der Praxis prüft man Diagonalisierbarkeit also so: Für jeden Eigenwert nachrechnen, ob geometrische = algebraische Vielfachheit. Stimmt es überall, ist diagonalisierbar; scheitert es an einem einzigen Eigenwert, nicht.
Frage: Was ist so besonders an einer Matrix mit ? Eine symmetrische Matrix ist spiegelsymmetrisch zur Hauptdiagonalen, der Eintrag links unten gleicht dem rechts oben. Solche Matrizen tauchen überall auf, wo es um Längen, Energien, Krümmungen oder quadratische Formen geht (wir treffen sie gleich in 6.3.4 bis 6.3.6 wieder). Und sie haben das schönste denkbare Eigenwertproblem.
Die Analogie dazu: Eine allgemeine diagonalisierbare Matrix dreht und schert ihre Eigenrichtungen schief gegeneinander (denk an ein verzerrtes Koordinatengitter). Eine symmetrische Matrix dagegen besitzt Eigenrichtungen, die paarweise rechtwinklig aufeinander stehen: ein sauberes, rechtwinkliges Achsenkreuz, das man nur drehen, nie verzerren muss. Genau das macht alle Rechnungen leicht.
Der zugehörige Satz (oft Spektralsatz genannt) bündelt fünf Aussagen für symmetrische :
| Eigenschaft | Was sie bedeutet |
|---|---|
| (a) Alle Eigenwerte reell | Kein komplexer Eigenwert, nie. Man rechnet immer in . |
| (b) Orthogonale Eigenvektoren | Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht aufeinander. |
| (c) Halbeinfach | Immer diagonalisierbar, auch bei mehrfachen Eigenwerten. |
| (d) Orthonormalbasis (ONB) | Es existiert eine Eigenbasis aus Vektoren der Länge 1, die paarweise senkrecht sind. |
| (e) Orthogonales | Mit normierten Eigenvektoren als Spalten gilt , also . |
Warum stehen die Eigenvektoren senkrecht? Kurz angedeutet: Für und zwei Eigenpaare , mit gilt . Wegen muss das Skalarprodukt sein, die Vektoren stehen also senkrecht. Diese Orthogonalität ist der Grund, warum bei symmetrischen Matrizen alles so glatt aufgeht.
Drei vollständig durchgerechnete Beispiele zeigen das Vorgehen: Eigenwerte finden, Eigenräume bestimmen, und aufschreiben und prüfen, ob orthogonal gewählt werden kann. Das erste ist bewusst nicht symmetrisch (zum Kontrast), die anderen beiden sind es.
Frage: Du sollst berechnen. Naiv wären das 100 Matrixmultiplikationen, eine Tortur. Geht das schneller? Ja, und der Trick ist die Diagonalisierung. In der Eigenbasis ist diagonal, und eine Diagonalmatrix zu potenzieren heisst einfach, jeden Diagonaleintrag einzeln zu potenzieren. Aus teuren Matrixprodukten werden harmlose Zahlenpotenzen.
Die Idee in Worten: Wechsle ins Eigenkoordinatensystem (dort ist nur ein Strecken mit Zahlen), potenziere die Streckfaktoren, wechsle zurück. Formal nutzt man , woraus sofort folgt, denn beim Ausmultiplizieren von kürzen sich alle inneren weg.
Das vollständige Kochrezept zum Berechnen von (für diagonalisierbares ):
Frage: Was soll hoch eine ganze Matrix überhaupt heissen? Für eine Zahl kennt man . Dieselbe Reihe schreibt man für eine Matrix hin, indem man durch ersetzt und Potenzen von einsetzt. Das Ergebnis ist wieder eine Matrix. Diese Konstruktion ist nicht exotisch: Sie ist die Lösung linearer Differentialgleichungssysteme und taucht in Kapitel 8 und in Analysis wieder auf.
Wie rechnet man aus, ohne eine unendliche Summe von Matrixpotenzen zu bilden? Wieder über die Diagonalisierung. Setzt man in die Reihe ein und zieht und heraus, bleibt in der Mitte die Reihe für angewandt auf jeden Diagonaleintrag. Eine Diagonalmatrix exponenziert man also einfach Eintrag für Eintrag.
Fünf Rechenregeln vereinfachen den Umgang mit . Besonders die zweite ist der eigentliche Grund, warum das Matrixexponential in Differentialgleichungen auftaucht.
Frage: Eine Matrix nimmt einen Vektor und macht ihn länger oder kürzer. Um welchen Faktor höchstens? Diese maximale Verstärkung ist die Matrixnorm. Anschaulich: Schickt man alle Einheitsvektoren (Länge 1) durch , so misst die Länge des längsten herauskommenden Vektors. Sie sagt, wie stark im schlimmsten Fall streckt.
Es gibt mehrere Matrixnormen; welche am leichtesten zu berechnen ist, hängt vom Typ der Matrix ab. Die wichtigste ist die Spektralnorm . Für eine beliebige quadratische Matrix ist sie die Wurzel aus dem grössten Eigenwert von (dieser ist immer reell und nicht-negativ, weil symmetrisch und positiv semidefinit ist).
Für spezielle Matrizen vereinfacht sich das stark. Ist orthogonal, so erhält es alle Längen, also . Ist symmetrisch, so ist und man kann direkt die Eigenwerte von nehmen: . Für die Inverse einer regulären Matrix gilt , mit dem kleinsten Eigenwert von ; bei zusätzlich symmetrischem wird daraus .
Daneben gibt es zwei sehr schnell ablesbare Normen, die gar keine Eigenwerte brauchen: die Spaltensummennorm (grösste Summe der Beträge je Spalte) und die Zeilensummennorm (grösste Summe der Beträge je Zeile). Man bildet für jede Spalte bzw. Zeile die Summe der Beträge und nimmt das Maximum.
| Norm | Formel | Bemerkung |
|---|---|---|
| (allgemein) | , grösster EW von | immer gültig, aber rechenaufwendig |
| (orthogonal) | Längen bleiben erhalten | |
| (symmetrisch) | betragsgrösster Eigenwert von selbst | |
| (regulär) | kleinster EW von | |
| (regulär + sym.) | betragskleinster Eigenwert von | |
| max. Spaltensummennorm | Beträge je Spalte summieren, Maximum | |
| max. Zeilensummennorm | Beträge je Zeile summieren, Maximum |
Frage: Ein Ausdruck wie hat einen lästigen gemischten Term . Solange er da ist, sieht man der Form nicht an, was sie geometrisch beschreibt. Kann man ihn loswerden? Ja, durch eine geschickte Drehung des Koordinatensystems, die Hauptachsentransformation. Anschaulich: Man dreht das Achsenkreuz so, dass es sich an die natürlichen Achsen der Form anlegt; dann verschwinden die Mischterme von selbst.
Zuerst der Rahmen. Eine quadratische Form ordnet jedem Vektor die Zahl zu, mit einer symmetrischen Matrix . Ausgeschrieben ist das : die Diagonaleinträge liefern die reinen Quadrate , die Aussereinträge die gemischten Terme. Dass symmetrisch gewählt wird, ist kein Zufall; nur dann greift der Spektralsatz und wir können orthogonal diagonalisieren.
Eine Vorbemerkung zur verwendeten Drehung: Ist eine orthogonale Matrix, so haben alle ihre Eigenwerte Betrag , und Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht. Das passt genau zur Hauptachsentransformation, denn dort drehen wir mit einem orthogonalen , das Längen erhält. Das Kochrezept lautet:
Frage: Eine Gleichung wie beschreibt eine Kurve in der Ebene. Aber welche, eine Ellipse, eine Hyperbel, eine Parabel? Auf den ersten Blick sieht man es einem wilden Ausdruck mit gemischten und linearen Termen nicht an. Die Antwort liefert die Kombination aus Hauptachsentransformation und Verschiebung.
Die Analogie steckt schon im Namen: Ein Kegelschnitt ist das, was entsteht, wenn man einen Doppelkegel mit einer Ebene schneidet. Je nach Neigung der Ebene bekommt man einen Kreis, eine Ellipse, eine Parabel oder eine Hyperbel. Genau diese wenigen Standardkurven sind alle möglichen Lösungsmengen. Allgemein heisst die Lösungsmenge ein Kegelschnitt bzw. (höherdimensional) eine Quadrik.
Das Vorgehen hat zwei Phasen, und die Reihenfolge ist entscheidend. Erst die Hauptachsentransformation (Drehung, beseitigt den gemischten Term im quadratischen Teil), dann die Translation (Verschiebung durch quadratisches Ergänzen, beseitigt den linearen Term). Am Ende steht eine Normalform, die man direkt mit einer kleinen Tabelle als Kurventyp identifiziert. Welche Tabelle gilt, hängt vom Rang von ab.
| Normalform | Kurventyp |
|---|---|
| Parabel | |
| zwei parallele Geraden | |
| leere Menge |
| Normalform | Kurventyp |
|---|---|
| Ellipse / Kreis | |
| Hyperbel | |
| leere Menge | |
| zwei sich schneidende Geraden | |
| ein Punkt |
Frage: Eine Funktion mehrerer Variablen hat an einer Stelle , also eine waagrechte Tangentialebene. Ist das ein Minimum (eine Talsohle), ein Maximum (ein Gipfel) oder ein Sattelpunkt (in einer Richtung hoch, in einer anderen runter, wie ein Bergpass)? Der Gradient allein verrät es nicht; man muss die Krümmung in alle Richtungen anschauen. Genau hier kommen Eigenwerte ins Spiel.
Die Krümmungsinformation steckt in der Hesse-Matrix, der Matrix aller zweiten partiellen Ableitungen. Sie ist symmetrisch (Satz von Schwarz: die Reihenfolge des Ableitens ist egal), also greift der Spektralsatz. Ihre Eigenwerte sagen, wie sich die Funktion in den Hauptkrümmungsrichtungen verhält: lauter positive Eigenwerte heisst „in jede Richtung nach oben gekrümmt", also eine Talsohle.
Um das Vorzeichenmuster der Eigenwerte kompakt zu fassen, definiert man die Signatur einer symmetrischen Matrix als Tripel : ist die Anzahl der positiven Eigenwerte, die Anzahl der negativen, und die algebraische Vielfachheit des Eigenwerts .
Mit der quadratischen Form lassen sich symmetrische Matrizen nach ihrem Vorzeichenverhalten einteilen. Diese Definitheit ist genau das, was über Minimum, Maximum oder Sattel entscheidet:
| Definitheit | Bedingung an | Eigenwerte |
|---|---|---|
| positiv definit | für alle | alle |
| negativ definit | für alle | alle |
| positiv semidefinit | für alle | alle |
| negativ semidefinit | für alle | alle |
| indefinit | nimmt positive und negative Werte an | positive und negative |
Es gibt auch einen Weg, die Definitheit zu prüfen, ohne die Eigenwerte auszurechnen: das Hurwitz-Kriterium. Man bildet die führenden Hauptminoren, das sind die Determinanten der linken oberen -Teilmatrizen für . Sind sie alle echt positiv, ist positiv definit. Wechseln sie streng das Vorzeichen (für ungerades negativ, für gerades positiv), ist negativ definit. Erfüllen die Hauptminoren keines dieser Muster, hilft das Kriterium nicht direkt, und man bestimmt die Definitheit über die Eigenwerte.
Damit das vollständige Kochrezept für lokale Extrema einer Funktion :
Die Aufgaben zu diesem Kapitel folgen in Kürze.
Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.