Kap. 6: Eigenwertproblem

6.1Definitionen

6.1.1 Eigenwerte und Eigenvektoren

Stell dir eine Matrix $A$ als eine Maschine vor, die jeden Pfeil im Raum nimmt und ihn verschiebt: meistens wird der Pfeil dabei gedreht und gestreckt zugleich. Schickst du einen beliebigen Pfeil hinein, zeigt das Ergebnis $A\mathbf{x}$ in eine ganz neue Richtung. Aber es gibt ein paar ausgezeichnete Pfeile, die ihre Richtung behalten: Die Maschine macht sie nur länger oder kürzer (oder spiegelt sie), dreht sie aber nicht aus ihrer Linie heraus. Genau diese besonderen Pfeile heissen Eigenvektoren, und der Streckfaktor heisst Eigenwert.

Mathematisch heisst das: Wir suchen alle Paare aus einer Zahl $\lambda$ und einem Vektor $\mathbf{x} \neq \mathbf{0}$ , für die $A\mathbf{x}$ dasselbe ist wie der ursprüngliche Vektor mal $\lambda$ . Der Eigenvektor wird also nur skaliert. Die Zahl $\lambda$ (sprich „Lambda") heisst der zugehörige Eigenwert. Er darf Null sein, negativ sein oder sogar komplex; nur der Eigenvektor darf nicht der Nullvektor sein, denn $A\cdot\mathbf{0} = \lambda\cdot\mathbf{0}$ gilt für jedes $\lambda$ und wäre nutzlos.

Wann brauche ich das? Sobald man $A$ oft hintereinander anwendet (Übergänge eines Systems über viele Schritte, $A^k$ ), oder eine Schwingung, eine Drehung, eine quadratische Form oder eine Stabilität verstehen will, sucht man zuerst die Eigenrichtungen. In ihnen wird die Matrix zu einer simplen Multiplikation mit einer Zahl, und alles Komplizierte zerfällt in lauter eindimensionale Probleme. Das ist der rote Faden dieses ganzen Kapitels.

!!!

Eigenwert und Eigenvektor (Definition)

A\mathbf{x} = \lambda\mathbf{x}, \qquad \mathbf{x} \neq \mathbf{0}

λ ∈ ℂ heisst Eigenwert, der Vektor x ≠ 0 heisst Eigenvektor von A.

Wie findet man die Eigenwerte? Schreibe $A\mathbf{x} = \lambda\mathbf{x}$ um zu $A\mathbf{x} - \lambda\mathbf{x} = \mathbf{0}$ , also $(A - \lambda I)\mathbf{x} = \mathbf{0}$ . Dabei ist $I$ die Einheitsmatrix, die nötig ist, damit man von der Matrix $A$ die Zahl $\lambda$ überhaupt abziehen darf (man zieht $\lambda$ entlang der Diagonalen ab). Das ist ein homogenes lineares Gleichungssystem. Es hat den Nullvektor immer als triviale Lösung. Eine nichttriviale Lösung $\mathbf{x} \neq \mathbf{0}$ existiert genau dann, wenn die Matrix $A - \lambda I$ singulär ist, also ihre Determinante verschwindet.

Damit wird die Suche nach Eigenwerten zu einer Determinantengleichung: $\det(A - \lambda I) = 0$ . Diese Gleichung verbindet das Eigenwertproblem direkt mit der Determinante aus Kapitel 3. Sie heisst charakteristische Gleichung.

!!!

Charakteristische Gleichung

\det(A - \lambda I) = 0

Nur für solche λ ist

(A - \lambda I)\mathbf{x} = \mathbf{0}

nichttrivial lösbar, also nur diese λ sind Eigenwerte.

Charakteristisches Polynom

P_A(\lambda) = \det(A - \lambda I)

Polynom vom Grad n in λ. Seine Nullstellen sind genau die Eigenwerte von A.

Wertet man $\det(A - \lambda I)$ aus, erhält man ein Polynom in der Variablen $\lambda$ . Für eine $n \times n$ -Matrix hat es Grad $n$ . Man nennt es das charakteristische Polynom $P_A(\lambda)$ . Anschaulich ist es eine einzige Funktion, in der die ganze Eigenwert-Information von $A$ steckt: Ihre Nullstellen sind die Eigenwerte. Aus dem Fundamentalsatz der Algebra folgt sofort: Über den komplexen Zahlen $\mathbb{C}$ hat ein $n \times n$ -System mindestens einen und höchstens $n$ verschiedene Eigenwerte.

Hat man einen Eigenwert $\lambda$ gefunden, setzt man ihn in $(A - \lambda I)\mathbf{x} = \mathbf{0}$ ein und löst dieses homogene System (mit Gauss). Die nichttrivialen Lösungen sind die Eigenvektoren zu $\lambda$ . Sie bilden zusammen mit dem Nullvektor einen Unterraum, den Eigenraum $E_\lambda$ . Den Eigenraum erhält man also als Kern von $A - \lambda I$ ; seine Dimension ist die Anzahl freier Parameter, die beim Lösen übrig bleiben.

Eigenraum

E_\lambda = \{\, \mathbf{x} \;:\; (A - \lambda I)\mathbf{x} = \mathbf{0} \,\} = \ker(A - \lambda I)

Alle Eigenvektoren zu λ, plus der Nullvektor. Ein Unterraum von ℝⁿ (bzw. ℂⁿ).

Jetzt kommt ein feiner, aber prüfungsrelevanter Punkt: Vielfachheit. Ein Eigenwert kann auf zwei verschiedene Weisen „mehrfach" sein. Die algebraische Vielfachheit zählt, wie oft $\lambda$ als Nullstelle im charakteristischen Polynom auftritt (steht $(\lambda - 3)^2$ als Faktor da, hat $\lambda = 3$ algebraische Vielfachheit 2). Die geometrische Vielfachheit zählt, wie viele linear unabhängige Eigenvektoren es zu $\lambda$ gibt, also $\dim E_\lambda$ , die Zahl der freien Parameter beim Lösen.

Diese beiden Zahlen sind nicht immer gleich, aber es gibt eine feste Ordnung zwischen ihnen: Jeder Eigenwert hat mindestens einen Eigenvektor (geometrisch $\geq 1$ ), und die geometrische Vielfachheit kann nie grösser sein als die algebraische. Beide bleiben durch $n$ begrenzt. Die Summe aller algebraischen Vielfachheiten ist über $\mathbb{C}$ genau $n$ .

Schranken für die Vielfachheiten

\begin{aligned} 1 \;&\le\; \underbrace{\dim E_\lambda}_{\text{geometrisch}} \\ \;&\le\; \underbrace{\text{alg. Vielfachheit von } \lambda}_{\text{im Polynom}} \;\le\; n \end{aligned}

Geometrisch = Anzahl freier Parameter; algebraisch = Nullstellenordnung im charakteristischen Polynom.

Drei weitere Eigenschaften sparen in Prüfungen enorm viel Rechnung, weil sie Eigenwerte ablesbar machen, ohne überhaupt ein Polynom faktorisieren zu müssen:

Situation	Aussage	Wozu nützlich
$A$ ist Dreiecksmatrix	Eigenwerte = Diagonaleinträge	EW ohne Polynom direkt ablesbar
$\lambda$ ist EW von $A$	$\lambda^{-1}$ ist EW von $A^{-1}$	Eigenwerte der Inversen sofort
$A$ diagonalisierbar	$\det(A) = \lambda_1 \cdots \lambda_n$ und $\operatorname{spur}(A) = \lambda_1 + \cdots + \lambda_n$	Determinante und Spur als Produkt bzw. Summe der EW

Nützliche Eigenschaften der Eigenwerte (sparen Rechenarbeit)

Determinante als Produkt der Eigenwerte

\det(A) = \lambda_1 \cdot \lambda_2 \cdots \lambda_n

Mit Vielfachheit gezählt. Folge: A ist genau dann invertierbar, wenn kein Eigenwert 0 ist.

Ein letzter Baustein für später: Eigenvektoren zu verschiedenen Eigenwerten sind automatisch linear unabhängig. Hat eine $n \times n$ -Matrix also $n$ verschiedene Eigenwerte, so liefert sie sofort $n$ linear unabhängige Eigenvektoren, eine ganze Basis aus Eigenrichtungen. Genau das brauchen wir gleich für die Diagonalisierung.

Einstiegsbeispiel: Diagonalmatrix $A = \operatorname{diag}(1,2)$

Schritt 1: charakteristisches Polynom aufstellen

Wir suchen die Eigenwerte, also die Nullstellen von $\det(A - \lambda I)$ .

Für $A = \begin{pmatrix} 1 & 0 \\ 0 & 2 \end{pmatrix}$ ist $A - \lambda I$ wieder diagonal:

$P_A(\lambda) = \det\!\begin{pmatrix} 1-\lambda & 0 \\ 0 & 2-\lambda \end{pmatrix} = (1-\lambda)(2-\lambda)$
Schritt 2: Eigenwerte ablesen

Das Produkt ist genau dann Null, wenn ein Faktor Null ist.

Es gibt zwei einfache Eigenwerte (algebraische Vielfachheit je 1):

$\lambda_1 = 1, \qquad \lambda_2 = 2$
Schritt 3: Eigenraum zu λ₁ = 1

Einsetzen von $\lambda_1 = 1$ in $(A - \lambda I)\mathbf{x} = \mathbf{0}$ und Gauss lösen.

Das System lässt $x_1$ frei und erzwingt $x_2 = 0$ :

$E_1 = \operatorname{span}\left\{ \begin{pmatrix} 1 \\ 0 \end{pmatrix} \right\}$
Schritt 4: Eigenraum zu λ₂ = 2

Dasselbe mit $\lambda_2 = 2$ .

Jetzt ist $x_2$ frei und $x_1 = 0$ . Beide Eigenräume sind eindimensional (geometrische Vielfachheit 1):

$E_2 = \operatorname{span}\left\{ \begin{pmatrix} 0 \\ 1 \end{pmatrix} \right\}$

Beispiel: Dreiecksmatrix, Eigenwerte direkt von der Diagonalen

Schritt 1: Matrix erkennen

Bei einer Dreiecksmatrix steht die Eigenwert-Information schon auf der Diagonalen, das spart das Faktorisieren.

Gegeben ist die untere Dreiecksmatrix

$A = \begin{pmatrix} -6 & 0 & 0 \\ 1 & 2 & 0 \\ 0 & 7 & -3 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

Die Determinante einer Dreiecksmatrix ist das Produkt der Diagonalelemente, also auch hier bei $A - \lambda I$ .

Es ergibt sich ein bereits faktorisiertes Polynom:

$P_A(\lambda) = (\lambda + 6)(2 - \lambda)(3 + \lambda) = 0$
Schritt 3: Eigenwerte ablesen

Jeder Faktor liefert eine Nullstelle.

Drei einfache Eigenwerte (algebraische Vielfachheit je 1):

$\lambda_1 = -6, \qquad \lambda_2 = 2, \qquad \lambda_3 = -3$
Schritt 4: Eigenräume berechnen

Für jeden Eigenwert $(A - \lambda I)\mathbf{x} = \mathbf{0}$ mit Gauss lösen. Jedes System hat genau einen freien Parameter, also geometrische Vielfachheit 1.

Man erhält drei Geraden als Eigenräume:

$\begin{aligned} E_{-6} &= \operatorname{span}\!\left\{ \begin{pmatrix} 24 \\ -3 \\ 7 \end{pmatrix} \right\} \\[4pt] E_{2} &= \operatorname{span}\!\left\{ \begin{pmatrix} 0 \\ 5 \\ 7 \end{pmatrix} \right\} \\[4pt] E_{-3} &= \operatorname{span}\!\left\{ \begin{pmatrix} 0 \\ 0 \\ 1 \end{pmatrix} \right\} \end{aligned}$

Beispiel: doppelter Eigenwert mit vollem Eigenraum

Schritt 1: Aufgabe

Hier prüfen wir, was passiert, wenn ein Eigenwert mehrfach auftritt.

Berechne Eigenwerte und Eigenvektoren samt Vielfachheiten von

$A = \begin{pmatrix} -3 & 4 & -4 \\ 0 & 5 & -8 \\ 0 & 4 & -7 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

Die erste Spalte hat unter der Diagonalen nur Nullen, also nach der ersten Spalte entwickeln.

Es ergibt sich

$P_A(\lambda) = (3 + \lambda)^2 (\lambda - 1) = 0$
Schritt 3: Eigenwerte mit Vielfachheit

Der Faktor $(3+\lambda)^2$ ist doppelt, also hat $\lambda = -3$ algebraische Vielfachheit 2.

Zwei Eigenwerte:

$\begin{aligned} \lambda_1 &= -3 \;\text{(alg. Vielfachheit 2)} \\ \lambda_2 &= 1 \;\text{(alg. Vielfachheit 1)} \end{aligned}$
Schritt 4: Eigenraum zu λ₁ = -3

Einsetzen liefert ein System mit zwei freien Parametern, also geometrische Vielfachheit 2. Hier stimmt sie mit der algebraischen überein.

Der Eigenraum ist eine ganze Ebene:

$E_{-3} = \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} \right\}$
Schritt 5: Eigenraum zu λ₂ = 1

Ein freier Parameter, geometrische Vielfachheit 1.

Eine Gerade:

$E_{1} = \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} \right\}$

Notation Notation: λ

\lambda

(Lambda) ist der Eigenwert, der Streckfaktor entlang einer erhaltenen Richtung. Er darf

0

, negativ oder komplex sein.

Notation Notation: I

I

ist die Einheitsmatrix (Einsen auf der Diagonalen, sonst Nullen). Manche Texte schreiben dafür die Doppelstrich-Eins

\mathbb{1}

; gemeint ist dasselbe.

Definition Eigenwert / Eigenvektor

\lambda

und

\mathbf{x} \neq \mathbf{0}

mit

A\mathbf{x} = \lambda\mathbf{x}

. Der Vektor behält seine Richtung,

A

streckt ihn nur um

\lambda

Notation Notation: $P_A(\lambda)$

P_A(\lambda) = \det(A - \lambda I)

, das charakteristische Polynom. Grad

n

, seine Nullstellen sind die Eigenwerte.

Formel Schlüsselgleichung

\det(A - \lambda I) = 0

Bestimmt alle Eigenwerte. Folgt daraus, dass

(A - \lambda I)\mathbf{x} = \mathbf{0}

nur für singuläres

A - \lambda I

nichttrivial lösbar ist.

Definition Eigenraum $E_\lambda$

E_\lambda = \ker(A - \lambda I)

, alle Eigenvektoren zu

\lambda

plus

\mathbf{0}

. Seine Dimension ist die geometrische Vielfachheit.

Querverweis Die Determinante und der Kern stammen aus Kapitel 3 (Determinanten) und Kapitel 4 (Kern und Bild). Die charakteristische Gleichung baut direkt darauf auf.

6.1.2 Ähnlichkeit und Diagonalisierbarkeit

Frage: Was ist die einfachste Matrix, die dasselbe tut wie $A$ , nur in einem klügeren Koordinatensystem? Erinnere dich an die Eigenrichtungen aus 6.1.1: In ihnen wirkt $A$ wie eine Streckung um eine Zahl. Wenn wir die Eigenvektoren als neue Achsen wählen, wird $A$ entlang jeder Achse zu einer reinen Multiplikation, also zu einer Diagonalmatrix. Genau das leistet die Diagonalisierung.

Den Wechsel des Koordinatensystems beschreibt die Ähnlichkeit. Zwei Matrizen $A$ und $B$ heissen ähnlich, wenn es eine reguläre (invertierbare) Matrix $T$ gibt mit $B = T^{-1}AT$ . Anschaulich: $B$ ist dieselbe lineare Abbildung wie $A$ , nur beschrieben in der Basis, deren Spalten in $T$ stehen. Ähnliche Matrizen sind im Kern identisch, nur verschieden notiert.

Ähnlichkeit

B = T^{-1} A T, \qquad T \text{ regulär}

B ist dieselbe Abbildung wie A, ausgedrückt in der Basis aus den Spalten von T.

Eine quadratische Matrix $A$ heisst diagonalisierbar, wenn sie zu einer Diagonalmatrix ähnlich ist: Es gibt ein reguläres $T$ mit $T^{-1}AT = D = \operatorname{diag}(d_1, \ldots, d_n)$ . Die entscheidende Frage ist: Wann geht das? Antwort: genau dann, wenn $A$ genügend Eigenvektoren besitzt, nämlich $n$ linear unabhängige, die zusammen eine Eigenbasis bilden.

Diese Eigenbasis ist die Bauanleitung für $T$ : Die Spalten von $T$ sind die Eigenvektoren, und die Diagonale von $D$ sind die zugehörigen Eigenwerte, in genau derselben Reihenfolge. Steht in Spalte 1 von $T$ ein Eigenvektor zu $\lambda_1$ , so muss in der ersten Diagonalposition von $D$ auch $\lambda_1$ stehen. Vertauscht man die Reihenfolge in nur einer der beiden Matrizen, stimmt $T^{-1}AT = D$ nicht mehr.

!!!

Diagonalisierung

T^{-1} A T = D = \operatorname{diag}(d_1, d_2, \ldots, d_n)

Spalten von T = Eigenvektoren; Diagonale von D = zugehörige Eigenwerte, gleiche Reihenfolge.

Zwei Sprechweisen helfen, Spezialfälle schnell einzuordnen. Eine Matrix heisst einfach, wenn jeder Eigenwert algebraische Vielfachheit 1 hat (also $n$ verschiedene Eigenwerte). Sie heisst halbeinfach, wenn bei jedem Eigenwert algebraische und geometrische Vielfachheit übereinstimmen. Jede einfache Matrix ist auch halbeinfach (verschiedene Eigenwerte liefern automatisch genug unabhängige Eigenvektoren), aber nicht umgekehrt.

Und nun der zentrale Satz dieses Abschnitts, eine Kette von Gleichwertigkeiten: Eine Matrix ist halbeinfach $\Leftrightarrow$ sie besitzt eine Eigenbasis $\Leftrightarrow$ sie ist diagonalisierbar. Alle drei Formulierungen meinen dasselbe. In der Praxis prüft man Diagonalisierbarkeit also so: Für jeden Eigenwert nachrechnen, ob geometrische = algebraische Vielfachheit. Stimmt es überall, ist $A$ diagonalisierbar; scheitert es an einem einzigen Eigenwert, nicht.

!!!

Kriterium für Diagonalisierbarkeit

\begin{aligned} A \text{ halbeinfach} \;&\Longleftrightarrow\; A \text{ besitzt Eigenbasis} \\ \;&\Longleftrightarrow\; A \text{ diagonalisierbar} \end{aligned}

Praktisch: bei jedem Eigenwert muss geometrische Vielfachheit = algebraische Vielfachheit sein.

Beispiel: diagonalisierbar (zwei verschiedene Eigenwerte)

Schritt 1: Aufgabe

Wir prüfen Diagonalisierbarkeit über das Vielfachheits-Kriterium.

Gegeben

$A = \begin{pmatrix} 1 & -1 \\ 2 & 4 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

$\det(A - \lambda I)$ ausrechnen.

Es ergibt eine quadratische Gleichung, die in zwei verschiedene Linearfaktoren zerfällt:

$P_A(\lambda) = \lambda^2 - 5\lambda + 6 = (\lambda - 2)(\lambda - 3)$
Schritt 3: Eigenwerte

Zwei verschiedene Nullstellen, jede algebraische Vielfachheit 1.

Damit ist $A$ sogar einfach, also auf jeden Fall diagonalisierbar:

$\lambda_1 = 2, \qquad \lambda_2 = 3$
Schritt 4: Eigenräume

Je ein freier Parameter, geometrische Vielfachheit 1 = algebraische Vielfachheit.

Die Eigenräume sind

$E_{2} = \operatorname{span}\!\left\{ \begin{pmatrix} -1 \\ 1 \end{pmatrix} \right\}, \qquad E_{3} = \operatorname{span}\!\left\{ \begin{pmatrix} -1 \\ 2 \end{pmatrix} \right\}$
Schritt 5: Schlussfolgerung

Bei jedem Eigenwert stimmt geometrische = algebraische Vielfachheit.

$A$ ist diagonalisierbar, mit $D = \operatorname{diag}(2,3)$ und $T = \begin{pmatrix} -1 & -1 \\ 1 & 2 \end{pmatrix}$ (Eigenvektoren als Spalten, gleiche Reihenfolge wie $D$ ).

Gegenbeispiel: NICHT diagonalisierbar (zu wenige Eigenvektoren)

Schritt 1: Aufgabe

Dasselbe Kriterium, aber jetzt scheitert es. Dieses Beispiel zeigt, warum man die geometrische Vielfachheit wirklich ausrechnen muss.

Gegeben

$B = \begin{pmatrix} 1 & 1 & 0 \\ 4 & 1 & 4 \\ -2 & -1 & -1 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

Determinante von $B - \lambda I$ .

Es ergibt sich ein doppelter Faktor:

$P_B(\lambda) = -(\lambda - 1)^2 (\lambda + 1)$
Schritt 3: Eigenwerte mit Vielfachheit

Der Faktor $(\lambda - 1)^2$ ist doppelt.

Eigenwerte:

$\begin{aligned} \lambda_1 &= 1 \;\text{(alg. Vielfachheit 2)} \\ \lambda_2 &= -1 \;\text{(alg. Vielfachheit 1)} \end{aligned}$
Schritt 4: Eigenraum zu λ₁ = 1

Jetzt zählt, wie viele freie Parameter herauskommen.

Das System liefert nur einen freien Parameter, also geometrische Vielfachheit 1:

$E_{1} = \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 0 \\ -1 \end{pmatrix} \right\}$
Schritt 5: Schlussfolgerung

Geometrische Vielfachheit (1) $<$ algebraische Vielfachheit (2) bei $\lambda = 1$ .

Es fehlt ein Eigenvektor. $B$ besitzt keine Eigenbasis und ist nicht diagonalisierbar.

Definition Ähnlich

A

und

B

heissen ähnlich, wenn

B = T^{-1}AT

für ein reguläres

T

. Gleiche Eigenwerte, gleiches charakteristisches Polynom.

Notation Notation: D, T

D = \operatorname{diag}(d_1,\ldots,d_n)

ist die Diagonalmatrix der Eigenwerte,

T

die Matrix mit den Eigenvektoren als Spalten (die Transformationsmatrix).

Definition Diagonalisierbar

A

ist zu einer Diagonalmatrix ähnlich:

T^{-1}AT = D

. Gleichbedeutend mit „besitzt eine Eigenbasis" und „ist halbeinfach".

Definition Einfach / halbeinfach
einfach: jeder Eigenwert hat algebraische Vielfachheit 1. halbeinfach: bei jedem Eigenwert ist geometrische = algebraische Vielfachheit. Einfach

\Rightarrow

halbeinfach.

Merke Reihenfolge
Immer dieselbe Reihenfolge in $T$ und $D$ ! Eigenvektor in Spalte

i

von

T

, sein Eigenwert in Position

i

von

D

6.2Eigenwertproblem symmetrischer Matrizen

6.2.1 Der Spektralsatz

Frage: Was ist so besonders an einer Matrix mit $A = A^{\mathsf{T}}$ ? Eine symmetrische Matrix ist spiegelsymmetrisch zur Hauptdiagonalen, der Eintrag links unten gleicht dem rechts oben. Solche Matrizen tauchen überall auf, wo es um Längen, Energien, Krümmungen oder quadratische Formen geht (wir treffen sie gleich in 6.3.4 bis 6.3.6 wieder). Und sie haben das schönste denkbare Eigenwertproblem.

Die Analogie dazu: Eine allgemeine diagonalisierbare Matrix dreht und schert ihre Eigenrichtungen schief gegeneinander (denk an ein verzerrtes Koordinatengitter). Eine symmetrische Matrix dagegen besitzt Eigenrichtungen, die paarweise rechtwinklig aufeinander stehen: ein sauberes, rechtwinkliges Achsenkreuz, das man nur drehen, nie verzerren muss. Genau das macht alle Rechnungen leicht.

Der zugehörige Satz (oft Spektralsatz genannt) bündelt fünf Aussagen für symmetrische $A \in \mathbb{R}^{n \times n}$ :

Eigenschaft	Was sie bedeutet
(a) Alle Eigenwerte reell	Kein komplexer Eigenwert, nie. Man rechnet immer in $\mathbb{R}$ .
(b) Orthogonale Eigenvektoren	Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht aufeinander.
(c) Halbeinfach	Immer diagonalisierbar, auch bei mehrfachen Eigenwerten.
(d) Orthonormalbasis (ONB)	Es existiert eine Eigenbasis aus Vektoren der Länge 1, die paarweise senkrecht sind.
(e) Orthogonales $T$	Mit normierten Eigenvektoren als Spalten gilt $T^{-1} = T^{\mathsf{T}}$ , also $T^{\mathsf{T}} A T = D$ .

Spektralsatz: was eine symmetrische Matrix

A = A^{\mathsf{T}}

garantiert

!!!

Spektralsatz (orthogonale Diagonalisierung)

T^{-1} A T = T^{\mathsf{T}} A T = \operatorname{diag}(d_1, \ldots, d_n), \qquad A = A^{\mathsf{T}}

T

orthogonal, das heisst

T^{-1} = T^{\mathsf{T}}

. Spalten von

T

= normierte, paarweise orthogonale Eigenvektoren.

Warum stehen die Eigenvektoren senkrecht? Kurz angedeutet: Für $A = A^{\mathsf{T}}$ und zwei Eigenpaare $A\mathbf{u} = \lambda\mathbf{u}$ , $A\mathbf{v} = \mu\mathbf{v}$ mit $\lambda \neq \mu$ gilt $\lambda\,\langle \mathbf{u}, \mathbf{v}\rangle = \langle A\mathbf{u}, \mathbf{v}\rangle = \langle \mathbf{u}, A\mathbf{v}\rangle = \mu\,\langle \mathbf{u}, \mathbf{v}\rangle$ . Wegen $\lambda \neq \mu$ muss das Skalarprodukt $\langle \mathbf{u}, \mathbf{v}\rangle = 0$ sein, die Vektoren stehen also senkrecht. Diese Orthogonalität ist der Grund, warum bei symmetrischen Matrizen alles so glatt aufgeht.

Definition Symmetrische Matrix

A = A^{\mathsf{T}}

: spiegelsymmetrisch zur Hauptdiagonalen. Über

\mathbb{R}

sind dann alle Eigenwerte reell.

Definition Orthonormale Eigenbasis
Eine Eigenbasis aus Vektoren der Länge 1, die paarweise senkrecht aufeinander stehen. Für symmetrische

A

existiert sie stets.

Notation Notation: orthogonale Matrix

T

heisst orthogonal, wenn

T^{\mathsf{T}} T = I

, also

T^{-1} = T^{\mathsf{T}}

. Die Spalten bilden eine Orthonormalbasis.

Formel Schlüsselformel

T^{\mathsf{T}} A T = D

Orthogonale Diagonalisierung einer symmetrischen Matrix. Statt

T

zu invertieren, genügt das Transponieren.

Querverweis Das Skalarprodukt

\langle\cdot,\cdot\rangle

und Orthogonalität kommen aus Kapitel 4 (Vektorräume). Symmetrische Matrizen und ihre orthogonale Diagonalisierung sind auch die Grundlage der Singulärwertzerlegung in Kapitel 9.

6.2.2 Durchgerechnete Beispiele

Drei vollständig durchgerechnete Beispiele zeigen das Vorgehen: Eigenwerte finden, Eigenräume bestimmen, $D$ und $T$ aufschreiben und prüfen, ob $T$ orthogonal gewählt werden kann. Das erste ist bewusst nicht symmetrisch (zum Kontrast), die anderen beiden sind es.

Beispiel: nicht-symmetrische 3×3-Matrix diagonalisieren

Schritt 1: Aufgabe

Diagonalisieren, Invertierbarkeit prüfen, klären ob $T$ orthogonal sein kann.

Gegeben

$A = \begin{pmatrix} -3 & 4 & -4 \\ 0 & 5 & -8 \\ 0 & 4 & -7 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

Erste Spalte hat unter der Diagonalen Nullen, also nach Spalte 1 entwickeln.

$P_A(\lambda) = -(\lambda - 1)(\lambda + 3)^2$
Schritt 3: Eigenwerte

Faktor $(\lambda+3)^2$ doppelt.

$\lambda_1 = -3 \;\text{(alg. 2)}, \qquad \lambda_2 = 1 \;\text{(alg. 1)}$
Schritt 4: Eigenräume

Zu $\lambda_1 = -3$ kommen zwei freie Parameter (geometrische Vielfachheit 2 = algebraische), zu $\lambda_2 = 1$ einer. Also diagonalisierbar.

$\begin{aligned} E_{-3} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \begin{pmatrix} 0 \\ 1 \\ 1 \end{pmatrix} \right\} \\[4pt] E_{1} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 2 \\ 1 \end{pmatrix} \right\} \end{aligned}$
Schritt 5: D und T aufschreiben

Eigenwerte in $D$ , zugehörige Eigenvektoren als Spalten von $T$ , gleiche Reihenfolge.

$D = \operatorname{diag}(-3, -3, 1), \qquad T = \begin{pmatrix} 1 & 0 & 1 \\ 0 & 1 & 2 \\ 0 & 1 & 1 \end{pmatrix}$
Schritt 6: invertierbar?

Determinante als Produkt der Eigenwerte (mit Vielfachheit) ist viel schneller als direkte Rechnung.

Kein Eigenwert ist $0$ , also ist $A$ invertierbar:

$\det(A) = \lambda_1^2 \cdot \lambda_2 = (-3)^2 \cdot 1 = 9 \neq 0$
Schritt 7: T orthogonal?

$T$ orthogonal ginge nur bei symmetrischem $A$ .

$A$ ist nicht symmetrisch, und tatsächlich stehen die Spalten von $T$ nicht senkrecht aufeinander. $T$ kann hier nicht orthogonal gewählt werden.

Beispiel: Matrix aus gegebenen Eigenwerten und -vektoren rekonstruieren

Schritt 1: Aufgabe

Hier sind Eigenwerte und Eigenvektoren bekannt und $A$ gesucht, also die Diagonalisierung rückwärts.

Bekannt: $\begin{pmatrix} 1 \\ 2 \\ 3 \end{pmatrix}$ zu $\lambda_1 = 0$ , $\begin{pmatrix} 4 \\ 5 \\ 6 \end{pmatrix}$ zu $\lambda_2 = -3$ , $\begin{pmatrix} 0 \\ 2 \\ 0 \end{pmatrix}$ zu $\lambda_3 = 3$ . Ist $A$ diagonalisierbar, und wie lautet $A$ ?
Schritt 2: Diagonalisierbarkeit

Alle Eigenwerte sind verschieden, also algebraische und geometrische Vielfachheit überall 1.

$A$ ist diagonalisierbar. Aus $T^{-1}AT = D$ folgt umgestellt
Schritt 3: D und T aufschreiben

Eigenwerte in $D$ , Eigenvektoren als Spalten von $T$ , gleiche Reihenfolge.

$A = T D T^{-1}, \qquad D = \operatorname{diag}(0, -3, 3), \qquad T = \begin{pmatrix} 1 & 4 & 0 \\ 2 & 5 & 2 \\ 3 & 6 & 0 \end{pmatrix}$
Schritt 4: T⁻¹ bestimmen

Für $A = T D T^{-1}$ braucht man die Inverse von $T$ . Da $A$ nicht symmetrisch ist, hilft kein Transponieren, man rechnet $T^{-1}$ über Gauss-Jordan.

Man wendet Gauss-Jordan auf $[\,T \mid I\,]$ an, bis links $I$ steht; rechts erscheint dann $T^{-1}$ .
Schritt 5: A ausmultiplizieren

Jetzt $A = T D T^{-1}$ einsetzen.

Das Produkt ergibt

$A = T D T^{-1} = \begin{pmatrix} -6 & 0 & 2 \\ -9 & 3 & 1 \\ -9 & 0 & 3 \end{pmatrix}$

Beispiel: symmetrische 4×4-Matrix, T orthogonal

Schritt 1: Aufgabe

Symmetrische Matrix, also greift der Spektralsatz: $T$ kann orthogonal gewählt werden.

Gegeben (man prüfe $A = A^{\mathsf{T}}$ )

$A = \begin{pmatrix} 2 & 0 & 0 & 1 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 2 & 0 \\ 1 & 0 & 0 & 2 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

Wegen der vielen Nullen zerfällt die Determinante bequem.

$P_A(\lambda) = (2 - \lambda)^2 (3 - \lambda)(1 - \lambda)$
Schritt 3: Eigenwerte

Faktor $(2-\lambda)^2$ doppelt.

$\lambda = 2 \;\text{(alg. 2)}, \qquad \lambda = 3, \qquad \lambda = 1$
Schritt 4: Eigenräume

Zu $\lambda = 2$ zwei freie Parameter (geometrische Vielfachheit 2), zu $\lambda = 3$ und $\lambda = 1$ je einer.

$\begin{aligned} E_{2} &= \operatorname{span}\!\left\{ \mathbf{e}_2, \mathbf{e}_3 \right\} \\[4pt] E_{3} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 0 \\ 0 \\ 1 \end{pmatrix} \right\} \\[4pt] E_{1} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 0 \\ 0 \\ -1 \end{pmatrix} \right\} \end{aligned}$
Schritt 5: D und orthogonales T

Die Eigenvektoren stehen bereits senkrecht; man muss sie nur normieren (die zu $\lambda=3$ und $\lambda=1$ mit $\tfrac{1}{\sqrt{2}}$ ).

Mit $D = \operatorname{diag}(2, 2, 1, 3)$ und normierten Spalten wird $T$ orthogonal, also $T^{-1} = T^{\mathsf{T}}$ :

$T = \begin{pmatrix} 0 & 0 & \tfrac{1}{\sqrt{2}} & \tfrac{1}{\sqrt{2}} \\ 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & -\tfrac{1}{\sqrt{2}} & \tfrac{1}{\sqrt{2}} \end{pmatrix}$

Merke Symmetrisch?
Nur wenn

A = A^{\mathsf{T}}

ist, lässt sich

T

orthogonal wählen (

T^{-1} = T^{\mathsf{T}}

). Bei nicht-symmetrischem

A

braucht man

T^{-1}

über Gauss-Jordan.

Formel Rückwärts-Form

A = T D T^{-1}

Baut

A

aus Eigenwerten (

D

) und Eigenvektoren (

T

) zusammen. Grundlage aller Anwendungen in 6.3.

Notation Notation: eₖ

\mathbf{e}_k

ist der

k

-te Standardbasisvektor (eine

1

an Position

k

, sonst

0

Querverweis Das Gauss-Jordan-Verfahren zur Berechnung von

T^{-1}

und das Gram-Schmidt-Verfahren stammen aus den Kapiteln 1 und 4.

6.3Anwendungen

6.3.1 Potenzen $A^k\mathbf{x}$ effizient berechnen (Kochrezept)

Frage: Du sollst $A^{100}\mathbf{x}$ berechnen. Naiv wären das 100 Matrixmultiplikationen, eine Tortur. Geht das schneller? Ja, und der Trick ist die Diagonalisierung. In der Eigenbasis ist $A$ diagonal, und eine Diagonalmatrix zu potenzieren heisst einfach, jeden Diagonaleintrag einzeln zu potenzieren. Aus $100$ teuren Matrixprodukten werden $n$ harmlose Zahlenpotenzen.

Die Idee in Worten: Wechsle ins Eigenkoordinatensystem (dort ist $A$ nur ein Strecken mit Zahlen), potenziere die Streckfaktoren, wechsle zurück. Formal nutzt man $A = TDT^{-1}$ , woraus sofort $A^k = T D^k T^{-1}$ folgt, denn beim Ausmultiplizieren von $(TDT^{-1})(TDT^{-1})\cdots$ kürzen sich alle inneren $T^{-1}T = I$ weg.

Potenz über Diagonalisierung

A^k = T D^k T^{-1}, \qquad D^k = \operatorname{diag}(d_1^k, d_2^k, \ldots, d_n^k)

Diagonale potenzieren ist trivial. Für symmetrisches

A

gilt

T^{-1} = T^{\mathsf{T}}

, also

A^k = T D^k T^{\mathsf{T}}

Das vollständige Kochrezept zum Berechnen von $\mathbf{y} = A^k\mathbf{x}$ (für diagonalisierbares $A$ ):

Kochrezept: $\mathbf{y} = A^k\mathbf{x}$

Schritt 1: Eigenwertproblem lösen

Wir brauchen die Eigenbasis, in der $A$ diagonal wird.

Bestimme Eigenwerte und Eigenvektoren, also $T$ und $D$ mit

$T^{-1} A T = D$
Schritt 2: Startvektor umrechnen

$\mathbf{x}$ in Eigenkoordinaten ausdrücken.

Löse das lineare Gleichungssystem nach $\mathbf{z}$ :

$T\mathbf{z} = \mathbf{x}$
Schritt 3: in Eigenkoordinaten potenzieren

Hier steckt die ganze Ersparnis: $D^k$ ist nur das Potenzieren der Diagonale.

$\mathbf{w} = D^k \mathbf{z}$
Schritt 4: zurücktransformieren

Vom Eigenkoordinatensystem zurück in die Standardbasis.

$\mathbf{y} = T\mathbf{w}$
Schritt 5: Spezialfall symmetrisch

Bei $A = A^{\mathsf{T}}$ ist $T$ orthogonal, $T^{-1} = T^{\mathsf{T}}$ ist gratis.

Dann braucht man $T^{-1}$ nicht zu invertieren:

$A^k = T D^k T^{\mathsf{T}}$
Schritt 6: Spezialfall nicht symmetrisch

Sonst $T^{-1}$ über Gauss-Jordan.

Allgemein gilt

$A^k = T D^k T^{-1}$

Beispiel: $A^n$ und die Fibonacci-Matrix

Schritt 1: Aufgabe

Diese Matrix erzeugt beim Potenzieren die Fibonacci-Zahlen, ein berühmtes Beispiel.

Berechne $A^n$ für

$A = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix}$
Schritt 2: charakteristisches Polynom

$\det(A - \lambda I)$ .

$P_A(\lambda) = \lambda^2 - \lambda - 1 = 0$
Schritt 3: Eigenwerte (goldener Schnitt)

Mitternachtsformel. Die beiden Werte sind der goldene Schnitt und sein Partner.

$\lambda_{1,2} = \frac{1 \pm \sqrt{5}}{2}$
Schritt 4: Eigenvektoren

Aus $(A - \lambda I)\mathbf{x} = \mathbf{0}$ folgt $x_1 = \lambda\,x_2$ .

Mit $\lambda_1, \lambda_2$ als Streckfaktoren erhält man die Eigenräume

$\begin{aligned} E_{\lambda_1} &= \operatorname{span}\!\left\{ \begin{pmatrix} \lambda_1 \\ 1 \end{pmatrix} \right\} \\[4pt] E_{\lambda_2} &= \operatorname{span}\!\left\{ \begin{pmatrix} \lambda_2 \\ 1 \end{pmatrix} \right\} \end{aligned}$
Schritt 5: D, T und T⁻¹

$A$ ist nicht symmetrisch, also $T^{-1}$ über die $2\times2$ -Formel.

Mit $D = \operatorname{diag}(\lambda_1, \lambda_2)$ und $T = \begin{pmatrix} \lambda_1 & \lambda_2 \\ 1 & 1 \end{pmatrix}$ :

$T^{-1} = \frac{1}{\sqrt{5}} \begin{pmatrix} 1 & -\lambda_2 \\ -1 & \lambda_1 \end{pmatrix}$
Schritt 6: Potenz zusammensetzen

Jetzt $A^n = T D^n T^{-1}$ mit $D^n = \operatorname{diag}(\lambda_1^n, \lambda_2^n)$ .

$A^n = T D^n T^{-1} = T \operatorname{diag}(\lambda_1^n, \lambda_2^n)\, T^{-1}$

Formel Schlüsselformel

A^k = T D^k T^{-1}

Potenz über Diagonalisierung.

D^k

ist nur das Potenzieren der Diagonaleinträge.

Merke Eigenwerte von $A^k$
Sie sind

\lambda_i^k

; die Eigenvektoren bleiben unverändert.

Querverweis Dieselbe Diagonalisierung steckt hinter dem Lösen linearer Differentialgleichungssysteme (Kapitel 8): Dort potenziert man nicht, sondern bildet

e^{tD}

, der nächste Abschnitt 6.3.2 schlägt die Brücke.

6.3.2 Das Matrixexponential $e^A$ berechnen (Kochrezept)

Frage: Was soll $e$ hoch eine ganze Matrix überhaupt heissen? Für eine Zahl $x$ kennt man $e^x = 1 + x + \tfrac{x^2}{2!} + \tfrac{x^3}{3!} + \cdots$ . Dieselbe Reihe schreibt man für eine Matrix hin, indem man $x$ durch $A$ ersetzt und Potenzen von $A$ einsetzt. Das Ergebnis $e^A$ ist wieder eine Matrix. Diese Konstruktion ist nicht exotisch: Sie ist die Lösung linearer Differentialgleichungssysteme $\dot{\mathbf{x}} = A\mathbf{x}$ und taucht in Kapitel 8 und in Analysis wieder auf.

Wie rechnet man $e^A$ aus, ohne eine unendliche Summe von Matrixpotenzen zu bilden? Wieder über die Diagonalisierung. Setzt man $A^n = TD^nT^{-1}$ in die Reihe ein und zieht $T$ und $T^{-1}$ heraus, bleibt in der Mitte die Reihe für $e$ angewandt auf jeden Diagonaleintrag. Eine Diagonalmatrix exponenziert man also einfach Eintrag für Eintrag.

Matrixexponential (Definition)

e^A = \sum_{n=0}^{\infty} \frac{A^n}{n!}

Dieselbe Reihe wie für eˣ, nur mit Matrixpotenzen Aⁿ statt Zahlenpotenzen.

Matrixexponential über Diagonalisierung

\begin{aligned} e^A &= T\, e^{D}\, T^{-1} \\ e^{D} &= \operatorname{diag}\!\left(e^{d_1}, e^{d_2}, \ldots, e^{d_n}\right) \end{aligned}

e^D

exponenziert nur die Diagonale. Für symmetrisches

A

ist

T^{-1} = T^{\mathsf{T}}

Fünf Rechenregeln vereinfachen den Umgang mit $e^A$ . Besonders die zweite ist der eigentliche Grund, warum das Matrixexponential in Differentialgleichungen auftaucht.

Rechenregeln für das Matrixexponential

\begin{aligned} \left(e^{A^{\mathsf{T}}}\right) &= \left(e^{A}\right)^{\mathsf{T}} &\qquad& \frac{d}{dt}\!\left(e^{tA}\right) &= A\, e^{tA} \\ \left(e^{A}\right)^{-1} &= e^{-A} &\qquad& e^{P^{-1} A P} &= P^{-1} e^{A} P \end{aligned}

Die zweite Regel ist der Grund, warum

e^{tA}

lineare Differentialgleichungssysteme löst.

Determinante des Matrixexponentials

\det\!\left(e^{A}\right) = e^{\operatorname{spur}(A)}

spur(A) = Summe der Diagonaleinträge = Summe der Eigenwerte.

Beispiel: $e^A$ einer 2×2-Matrix

Schritt 1: Aufgabe

Volle Rechnung von $e^A$ über die Diagonalisierung.

Gegeben

$A = \begin{pmatrix} 5 & -6 \\ 3 & -4 \end{pmatrix}$
Schritt 2: Eigenwerte

$\det(A - \lambda I)$ faktorisieren.

$P_A(\lambda) = \lambda^2 - \lambda - 2 = (\lambda - 2)(\lambda + 1) \;\Rightarrow\; \lambda_1 = 2,\; \lambda_2 = -1$
Schritt 3: Eigenvektoren

Je $(A - \lambda I)\mathbf{x} = \mathbf{0}$ lösen.

$E_{2} = \operatorname{span}\!\left\{ \begin{pmatrix} 2 \\ 1 \end{pmatrix} \right\}, \qquad E_{-1} = \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 1 \end{pmatrix} \right\}$
Schritt 4: D, T, T⁻¹

$A$ ist nicht symmetrisch, $T^{-1}$ über die $2\times2$ -Formel.

$D = \operatorname{diag}(2, -1), \quad T = \begin{pmatrix} 2 & 1 \\ 1 & 1 \end{pmatrix}, \quad T^{-1} = \begin{pmatrix} 1 & -1 \\ -1 & 2 \end{pmatrix}$
Schritt 5: einsetzen

$e^A = T\, e^D\, T^{-1}$ mit $e^D = \operatorname{diag}(e^2, e^{-1})$ .

Ausmultipliziert ergibt sich

$e^{A} = \begin{pmatrix} 2e^2 - e^{-1} & -2e^2 + 2e^{-1} \\ e^2 - e^{-1} & 2e^{-1} - e^2 \end{pmatrix}$

Beispiel: $\det(e^A)$ ohne $e^A$ auszurechnen

Schritt 1: Aufgabe

Mit der Spur-Regel geht das in zwei Zeilen, ganz ohne das Matrixexponential selbst.

Bestimme $\det(e^A)$ für

$A = \operatorname{diag}(1, 3, 19)$
Schritt 2: Spur

Die Diagonaleinträge sind hier zugleich die Eigenwerte; ihre Summe ist die Spur.

$\operatorname{spur}(A) = \lambda_1 + \lambda_2 + \lambda_3 = 1 + 3 + 19 = 23$
Schritt 3: Regel anwenden

$\det(e^A) = e^{\operatorname{spur}(A)}$ .

$\det\!\left(e^{A}\right) = e^{\operatorname{spur}(A)} = e^{23}$

Notation Notation: $e^A$ , $e^D$

e^A = \sum_n A^n/n!

(Matrix).

e^D = \operatorname{diag}(e^{d_1},\ldots,e^{d_n})

, das Exponential der Diagonale.

Formel Schlüsselformel

e^A = T e^D T^{-1}

Matrixexponential über Diagonalisierung. Mitte:

e

auf jeden Diagonaleintrag.

Notation Notation: spur(A)
Die Spur

\operatorname{spur}(A)

ist die Summe der Diagonaleinträge, gleich der Summe der Eigenwerte (mit Vielfachheit).

Merke Wozu?

\tfrac{d}{dt}\,e^{tA} = A\,e^{tA}

: Darum löst

\mathbf{x}(t) = e^{tA}\mathbf{x}_0

das System

\dot{\mathbf{x}} = A\mathbf{x}

Querverweis Lineare Differentialgleichungssysteme mit konstanten Koeffizienten (Kapitel 8) sowie die DGL-Kapitel der Analysis nutzen

e^{tA}

als Lösungsoperator.

6.3.3 Die Matrixnorm

Frage: Eine Matrix nimmt einen Vektor und macht ihn länger oder kürzer. Um welchen Faktor höchstens? Diese maximale Verstärkung ist die Matrixnorm. Anschaulich: Schickt man alle Einheitsvektoren (Länge 1) durch $A$ , so misst $\lVert A\rVert$ die Länge des längsten herauskommenden Vektors. Sie sagt, wie stark $A$ im schlimmsten Fall streckt.

Es gibt mehrere Matrixnormen; welche am leichtesten zu berechnen ist, hängt vom Typ der Matrix ab. Die wichtigste ist die Spektralnorm $\lVert A\rVert_2$ . Für eine beliebige quadratische Matrix ist sie die Wurzel aus dem grössten Eigenwert von $A^{\mathsf{T}} A$ (dieser ist immer reell und nicht-negativ, weil $A^{\mathsf{T}} A$ symmetrisch und positiv semidefinit ist).

Spektralnorm (allgemein)

\lVert A \rVert_2 = \sqrt{\mu_{\max}}, \qquad \mu_{\max} = \text{grösster Eigenwert von } A^{\mathsf{T}} A

μ steht hier für die Eigenwerte von

A^{\mathsf{T}}A

. Diese sind stets reell und

\geq 0

Für spezielle Matrizen vereinfacht sich das stark. Ist $A$ orthogonal, so erhält es alle Längen, also $\lVert A\rVert_2 = 1$ . Ist $A$ symmetrisch, so ist $A^{\mathsf{T}} A = A^2$ und man kann direkt die Eigenwerte von $A$ nehmen: $\lVert A\rVert_2 = \max_i |\lambda_i|$ . Für die Inverse einer regulären Matrix gilt $\lVert A^{-1}\rVert_2 = 1/\sqrt{\mu_{\min}}$ , mit dem kleinsten Eigenwert von $A^{\mathsf{T}} A$ ; bei zusätzlich symmetrischem $A$ wird daraus $1/\min_i |\lambda_i|$ .

Daneben gibt es zwei sehr schnell ablesbare Normen, die gar keine Eigenwerte brauchen: die Spaltensummennorm $\lVert A\rVert_1$ (grösste Summe der Beträge je Spalte) und die Zeilensummennorm $\lVert A\rVert_\infty$ (grösste Summe der Beträge je Zeile). Man bildet für jede Spalte bzw. Zeile die Summe der Beträge und nimmt das Maximum.

Norm	Formel	Bemerkung
$\lVert A\rVert_2$ (allgemein)	$\sqrt{\mu_{\max}}$ , grösster EW von $A^{\mathsf{T}} A$	immer gültig, aber rechenaufwendig
$\lVert A\rVert_2$ (orthogonal)	$= 1$	Längen bleiben erhalten
$\lVert A\rVert_2$ (symmetrisch)	$\max_i \|\lambda_i\|$	betragsgrösster Eigenwert von $A$ selbst
$\lVert A^{-1}\rVert_2$ (regulär)	$1/\sqrt{\mu_{\min}}$	kleinster EW von $A^{\mathsf{T}} A$
$\lVert A^{-1}\rVert_2$ (regulär + sym.)	$1/\min_i \|\lambda_i\|$	betragskleinster Eigenwert von $A$
$\lVert A\rVert_1$	max. Spaltensummennorm	Beträge je Spalte summieren, Maximum
$\lVert A\rVert_\infty$	max. Zeilensummennorm	Beträge je Zeile summieren, Maximum

Welche Matrixnorm bei welchem Matrixtyp am schnellsten geht

Beispiele: Matrixnormen ablesen

Schritt 1: Spektralnorm einer symmetrischen Diagonalmatrix

Bei symmetrischem $A$ ist $\lVert A\rVert_2 = \max_i|\lambda_i|$ , hier sind die Diagonaleinträge die Eigenwerte.

Für $A = \operatorname{diag}(1, 3, 19)$ :

$\lVert A \rVert_2 = \max_i |\lambda_i| = 19$
Schritt 2: Zeilensummennorm

Beträge je Zeile summieren, Maximum nehmen.

Für $A = \begin{pmatrix} 1 & 2 & 7 & -34 \\ 2 & 3 & 3 & -3 \\ 12 & 4 & 10 & -4 \\ 2 & 2 & 3 & -7 \end{pmatrix}$ ist Zeile 1 am grössten:

$\lVert A \rVert_\infty = |1| + |2| + |7| + |-34| = 44$
Schritt 3: Spaltensummennorm

Beträge je Spalte summieren, Maximum nehmen.

Bei derselben Matrix ist Spalte 4 am grössten:

$\lVert A \rVert_1 = |-34| + |-3| + |-4| + |-7| = 48$

Notation Notation: Matrixnormen

\lVert A\rVert_2

Spektralnorm,

\lVert A\rVert_1

max. Spaltensummennorm,

\lVert A\rVert_\infty

max. Zeilensummennorm.

Notation Notation: μ

\mu_{\max}, \mu_{\min}

sind der grösste bzw. kleinste Eigenwert von

A^{\mathsf{T}} A

(stets reell,

\geq 0

Merke 1 vs ∞

\lVert A\rVert_1

: Spaltensumme (die

1

steht senkrecht).

\lVert A\rVert_\infty

: Zeilensumme (das

\infty

liegt waagrecht).

Querverweis Die Eigenwerte von

A^{\mathsf{T}} A

sind die Quadrate der Singulärwerte; die Spektralnorm ist der grösste Singulärwert. Mehr dazu in Kapitel 9 (Singulärwertzerlegung).

6.3.4 Hauptachsentransformation quadratischer Formen

Frage: Ein Ausdruck wie $q(\mathbf{x}) = x_1^2 + 4x_1 x_2 + 3x_2^2$ hat einen lästigen gemischten Term $x_1 x_2$ . Solange er da ist, sieht man der Form nicht an, was sie geometrisch beschreibt. Kann man ihn loswerden? Ja, durch eine geschickte Drehung des Koordinatensystems, die Hauptachsentransformation. Anschaulich: Man dreht das Achsenkreuz so, dass es sich an die natürlichen Achsen der Form anlegt; dann verschwinden die Mischterme von selbst.

Zuerst der Rahmen. Eine quadratische Form ordnet jedem Vektor $\mathbf{x}$ die Zahl $q_A(\mathbf{x}) = \mathbf{x}^{\mathsf{T}} A \mathbf{x}$ zu, mit einer symmetrischen Matrix $A$ . Ausgeschrieben ist das $\sum_{i,j} a_{ij} x_i x_j$ : die Diagonaleinträge liefern die reinen Quadrate $x_i^2$ , die Aussereinträge die gemischten Terme. Dass $A$ symmetrisch gewählt wird, ist kein Zufall; nur dann greift der Spektralsatz und wir können orthogonal diagonalisieren.

Quadratische Form

\begin{aligned} q_A(\mathbf{x}) &= \langle \mathbf{x}, A\mathbf{x} \rangle = \mathbf{x}^{\mathsf{T}} A \mathbf{x} \\ &= \sum_{i,j=1}^{n} a_{ij}\, x_i\, x_j, \qquad A = A^{\mathsf{T}} \end{aligned}

Diagonale von A: reine Quadrate. Aussereinträge: gemischte Terme.

Ablesen von A aus einer 2D-Form

\mathbf{x}^{\mathsf{T}} A \mathbf{x} = a\,x_1^2 + 2b\,x_1 x_2 + c\,x_2^2 \;\Longrightarrow\; A = \begin{pmatrix} a & b \\ b & c \end{pmatrix}

Halbe des gemischten Koeffizienten auf beide Nebendiagonal-Plätze.

Eine Vorbemerkung zur verwendeten Drehung: Ist $Q$ eine orthogonale Matrix, so haben alle ihre Eigenwerte Betrag $|\lambda| = 1$ , und Eigenvektoren zu verschiedenen Eigenwerten stehen senkrecht. Das passt genau zur Hauptachsentransformation, denn dort drehen wir mit einem orthogonalen $T$ , das Längen erhält. Das Kochrezept lautet:

Kochrezept: Hauptachsentransformation

Schritt 1: Eigenwertproblem lösen

Die Eigenrichtungen von $A$ sind genau die Hauptachsen, in denen die Form rein quadratisch wird.

Bestimme Eigenwerte und Eigenvektoren der symmetrischen Matrix $A$ .
Schritt 2: T orthonormalisieren

Damit die Transformation eine reine Drehung ist (Längen erhalten, $T^{-1} = T^{\mathsf{T}}$ ).

Eigenvektoren normieren, bei mehrfachen Eigenwerten ggf. Gram-Schmidt. Dann gilt

$T^{\mathsf{T}} A T = D$
Schritt 3: Koordinaten wechseln

In die Hauptachsen-Koordinaten $\mathbf{y}$ übergehen.

Setze $\mathbf{y} = T^{\mathsf{T}} \mathbf{x}$ , also $\mathbf{x} = T\mathbf{y}$ :

$\mathbf{y} = T^{\mathsf{T}} \mathbf{x}, \qquad \mathbf{x} = T\mathbf{y}$
Schritt 4: in die Form einsetzen

$\mathbf{x}^{\mathsf{T}} A \mathbf{x} = (T\mathbf{y})^{\mathsf{T}} A (T\mathbf{y}) = \mathbf{y}^{\mathsf{T}} (T^{\mathsf{T}} A T)\mathbf{y} = \mathbf{y}^{\mathsf{T}} D \mathbf{y}$ .

Übrig bleibt eine Summe reiner Quadrate, die Normalform ohne gemischte Terme:

$q_A(\mathbf{x}) = \mathbf{x}^{\mathsf{T}} A \mathbf{x} = \mathbf{y}^{\mathsf{T}} D \mathbf{y} = \sum_{i=1}^{n} d_i\, y_i^2$

Beispiel: Mischterm wegdrehen

Schritt 1: A aus q ablesen

Reine Quadrate auf die Diagonale, halber Mischterm auf die Nebendiagonale.

Für $q(\mathbf{x}) = \tfrac{1}{2}x_1^2 + \sqrt{3}\,x_1 x_2 - \tfrac{1}{2}x_2^2$ ist

$A = \frac{1}{2}\begin{pmatrix} 1 & \sqrt{3} \\ \sqrt{3} & -1 \end{pmatrix}$
Schritt 2: Eigenwerte

$\det(A - \lambda I)$ .

$P_A(\lambda) = \lambda^2 - 1 = (\lambda - 1)(\lambda + 1) \;\Rightarrow\; \lambda_1 = 1,\; \lambda_2 = -1$
Schritt 3: Eigenvektoren, normiert

Sie stehen bereits senkrecht (symmetrisches $A$ ), nur normieren.

$\begin{aligned} E_{1} &= \operatorname{span}\!\left\{ \begin{pmatrix} \sqrt{3} \\ 1 \end{pmatrix} \right\} \\[4pt] E_{-1} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ -\sqrt{3} \end{pmatrix} \right\} \\[4pt] &\quad \text{Normierung } \tfrac{1}{2} \end{aligned}$
Schritt 4: T und Normalform

$T$ orthogonal aus den normierten Eigenvektoren; einsetzen liefert $\mathbf{y}^{\mathsf{T}} D \mathbf{y}$ .

Mit $T = \tfrac{1}{2}\begin{pmatrix} \sqrt{3} & 1 \\ 1 & -\sqrt{3} \end{pmatrix}$ erhält man die Normalform

$q(\mathbf{y}) = y_1^2 - y_2^2$

Notation Notation: $q_A(\mathbf{x})$

q_A(\mathbf{x}) = \mathbf{x}^{\mathsf{T}} A \mathbf{x}

, die quadratische Form zur symmetrischen Matrix

A

\langle\cdot,\cdot\rangle

ist das Standardskalarprodukt.

Definition Normalform
Gestalt

\sum_i d_i y_i^2

ohne gemischte Terme. Man erreicht sie durch die Hauptachsentransformation.

Formel Schlüsselformel

q_A(\mathbf{x}) = \mathbf{y}^{\mathsf{T}} D \mathbf{y} = \sum_i d_i y_i^2

Nach der Drehung

\mathbf{y} = T^{\mathsf{T}}\mathbf{x}

erscheinen die Eigenwerte als Koeffizienten.

Merke Achtung

A

immer symmetrisch wählen: halben gemischten Koeffizienten auf beide Nebendiagonal-Plätze.

Querverweis Das Skalarprodukt stammt aus Kapitel 4 (Vektorräume). Quadratische Formen treten in Analysis bei der Klassifikation von Extrema auf (Hesse-Matrix, siehe 6.3.6).

6.3.5 Kegelschnitte

Frage: Eine Gleichung wie $\mathbf{x}^{\mathsf{T}} A \mathbf{x} + \mathbf{a}^{\mathsf{T}} \mathbf{x} + b = 0$ beschreibt eine Kurve in der Ebene. Aber welche, eine Ellipse, eine Hyperbel, eine Parabel? Auf den ersten Blick sieht man es einem wilden Ausdruck mit gemischten und linearen Termen nicht an. Die Antwort liefert die Kombination aus Hauptachsentransformation und Verschiebung.

Die Analogie steckt schon im Namen: Ein Kegelschnitt ist das, was entsteht, wenn man einen Doppelkegel mit einer Ebene schneidet. Je nach Neigung der Ebene bekommt man einen Kreis, eine Ellipse, eine Parabel oder eine Hyperbel. Genau diese wenigen Standardkurven sind alle möglichen Lösungsmengen. Allgemein heisst die Lösungsmenge $Q = \{\mathbf{x} \in \mathbb{R}^n : \mathbf{x}^{\mathsf{T}} A \mathbf{x} + \mathbf{a}^{\mathsf{T}} \mathbf{x} + b = 0\}$ ein Kegelschnitt bzw. (höherdimensional) eine Quadrik.

Kegelschnitt / Quadrik

\begin{aligned} Q = \left\{\, \mathbf{x} \in \mathbb{R}^n \;:\; \mathbf{x}^{\mathsf{T}} A \mathbf{x} + \mathbf{a}^{\mathsf{T}} \mathbf{x} + b = 0 \,\right\}, \\ \mathbf{a} \in \mathbb{R}^n,\; b \in \mathbb{R} \end{aligned}

Quadratischer Teil

\mathbf{x}^{\mathsf{T}} A\mathbf{x}

, linearer Teil

\mathbf{a}^{\mathsf{T}}\mathbf{x}

, konstanter Teil

b

Das Vorgehen hat zwei Phasen, und die Reihenfolge ist entscheidend. Erst die Hauptachsentransformation (Drehung, beseitigt den gemischten Term im quadratischen Teil), dann die Translation (Verschiebung durch quadratisches Ergänzen, beseitigt den linearen Term). Am Ende steht eine Normalform, die man direkt mit einer kleinen Tabelle als Kurventyp identifiziert. Welche Tabelle gilt, hängt vom Rang von $A$ ab.

Normalform	Kurventyp
$x^2 - c\,y = 0$	Parabel
$x^2 - a^2 = 0$	zwei parallele Geraden
$x^2 + a^2 = 0$	leere Menge

Normalformen bei Rang(A) = 1 (eine der beiden Achsen fehlt im quadratischen Teil)

Normalform	Kurventyp
$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} - 1 = 0$	Ellipse / Kreis
$\dfrac{x^2}{a^2} - \dfrac{y^2}{b^2} - 1 = 0$	Hyperbel
$\dfrac{x^2}{a^2} + \dfrac{y^2}{b^2} + 1 = 0$	leere Menge
$x^2 - b^2 y^2 = 0$	zwei sich schneidende Geraden
$x^2 + b^2 y^2 = 0$	ein Punkt

Normalformen bei Rang(A) = 2 (beide Achsen im quadratischen Teil)

Beispiel: vom Mischterm zur Ellipse

Schritt 1: A ablesen

Reine Quadrate auf die Diagonale, halber Mischterm auf die Nebendiagonale.

Für $q(\mathbf{x}) = 6x_1^2 - 4x_1 x_2 + 3x_2^2$ ist

$A = \begin{pmatrix} 6 & -2 \\ -2 & 3 \end{pmatrix}, \qquad \mathbf{a} = \begin{pmatrix} 4 \\ 8 \end{pmatrix}$
Schritt 2: Eigenwerte

$\det(A - \lambda I)$ .

$P_A(\lambda) = \lambda^2 - 9\lambda + 14 = (\lambda - 2)(\lambda - 7) \;\Rightarrow\; \lambda_1 = 2,\; \lambda_2 = 7$
Schritt 3: Eigenvektoren, normiert

Senkrecht (symmetrisch), nur normieren mit $\tfrac{1}{\sqrt{5}}$ .

$\begin{aligned} E_{2} &= \operatorname{span}\!\left\{ \begin{pmatrix} 1 \\ 2 \end{pmatrix} \right\} \\[4pt] E_{7} &= \operatorname{span}\!\left\{ \begin{pmatrix} -2 \\ 1 \end{pmatrix} \right\} \\[4pt] T &= \frac{1}{\sqrt{5}}\begin{pmatrix} 1 & -2 \\ 2 & 1 \end{pmatrix} \end{aligned}$
Schritt 4: drehen und einsetzen

$\mathbf{x} = T\mathbf{y}$ in $q(\mathbf{x}) + \mathbf{a}^{\mathsf{T}}\mathbf{x}$ einsetzen; der quadratische Teil wird rein, ein linearer Term in $y_1$ bleibt.

Es ergibt sich

$2 y_1^2 + 7 y_2^2 + \frac{20}{\sqrt{5}}\, y_1 = 0$
Schritt 5: quadratisch ergänzen, Translation

Den linearen $y_1$ -Term durch Verschieben beseitigen.

Mit $\mathbf{z} = \mathbf{y} + \begin{pmatrix} \sqrt{5} \\ 0 \end{pmatrix}$ wird daraus die Normalform

$\frac{z_1^2}{5} + \frac{7 z_2^2}{10} = 1$
Schritt 6: Kurventyp bestimmen

Rang $A = 2$ , Form $\tfrac{z_1^2}{a^2} + \tfrac{z_2^2}{b^2} = 1$ , also die obere Tabelle.

Es ist eine Ellipse mit den Halbachsen $\sqrt{5}$ und $\sqrt{10/7}$ .

Definition Kegelschnitt / Quadrik
Lösungsmenge von

\mathbf{x}^{\mathsf{T}} A\mathbf{x} + \mathbf{a}^{\mathsf{T}}\mathbf{x} + b = 0

. In der Ebene: Ellipse, Hyperbel, Parabel und Entartungen.

Notation Notation: a, b, Halbachsen

\mathbf{a} \in \mathbb{R}^n

linearer,

b \in \mathbb{R}

konstanter Koeffizient. In der Normalform sind

a, b

die Halbachsen.

Formel Normalform Ellipse

\frac{z_1^2}{a^2} + \frac{z_2^2}{b^2} = 1

Standardgestalt einer Ellipse mit Halbachsen

a

und

b

nach Drehung und Translation.

Merke Reihenfolge
Zuerst drehen (Hauptachsen), dann verschieben (Translation, quadratisches Ergänzen). Nicht umgekehrt.

Querverweis Der Rang einer Matrix stammt aus Kapitel 1 und 4. Die Drehung ist die Hauptachsentransformation aus Abschnitt 6.3.4.

6.3.6 Lokale Extrema

Frage: Eine Funktion mehrerer Variablen hat an einer Stelle $\operatorname{grad} f = \mathbf{0}$ , also eine waagrechte Tangentialebene. Ist das ein Minimum (eine Talsohle), ein Maximum (ein Gipfel) oder ein Sattelpunkt (in einer Richtung hoch, in einer anderen runter, wie ein Bergpass)? Der Gradient allein verrät es nicht; man muss die Krümmung in alle Richtungen anschauen. Genau hier kommen Eigenwerte ins Spiel.

Die Krümmungsinformation steckt in der Hesse-Matrix, der Matrix aller zweiten partiellen Ableitungen. Sie ist symmetrisch (Satz von Schwarz: die Reihenfolge des Ableitens ist egal), also greift der Spektralsatz. Ihre Eigenwerte sagen, wie sich die Funktion in den Hauptkrümmungsrichtungen verhält: lauter positive Eigenwerte heisst „in jede Richtung nach oben gekrümmt", also eine Talsohle.

Um das Vorzeichenmuster der Eigenwerte kompakt zu fassen, definiert man die Signatur einer symmetrischen Matrix als Tripel $(p, n, z)$ : $p$ ist die Anzahl der positiven Eigenwerte, $n$ die Anzahl der negativen, und $z$ die algebraische Vielfachheit des Eigenwerts $0$ .

Signatur einer symmetrischen Matrix

\operatorname{Signatur}(A) = (p,\, n,\, z)

p = Anzahl positiver EW, n = Anzahl negativer EW, z = algebraische Vielfachheit von λ = 0.

Mit der quadratischen Form $q_A(\mathbf{x}) = \mathbf{x}^{\mathsf{T}} A \mathbf{x}$ lassen sich symmetrische Matrizen nach ihrem Vorzeichenverhalten einteilen. Diese Definitheit ist genau das, was über Minimum, Maximum oder Sattel entscheidet:

Definitheit	Bedingung an $q_A(\mathbf{x})$	Eigenwerte
positiv definit	$q_A(\mathbf{x}) > 0$ für alle $\mathbf{x} \neq \mathbf{0}$	alle $\lambda_i > 0$
negativ definit	$q_A(\mathbf{x}) < 0$ für alle $\mathbf{x} \neq \mathbf{0}$	alle $\lambda_i < 0$
positiv semidefinit	$q_A(\mathbf{x}) \geq 0$ für alle $\mathbf{x}$	alle $\lambda_i \geq 0$
negativ semidefinit	$q_A(\mathbf{x}) \leq 0$ für alle $\mathbf{x}$	alle $\lambda_i \leq 0$
indefinit	$q_A$ nimmt positive und negative Werte an	positive und negative $\lambda_i$

Definitheit der quadratischen Form und Vorzeichen der Eigenwerte (für symmetrisches A)

Es gibt auch einen Weg, die Definitheit zu prüfen, ohne die Eigenwerte auszurechnen: das Hurwitz-Kriterium. Man bildet die führenden Hauptminoren, das sind die Determinanten der linken oberen $i \times i$ -Teilmatrizen für $i = 1, \ldots, n$ . Sind sie alle echt positiv, ist $A$ positiv definit. Wechseln sie streng das Vorzeichen (für ungerades $i$ negativ, für gerades $i$ positiv), ist $A$ negativ definit. Erfüllen die Hauptminoren keines dieser Muster, hilft das Kriterium nicht direkt, und man bestimmt die Definitheit über die Eigenwerte.

Hurwitz-Kriterium (positiv definit)

A = A^{\mathsf{T}} \text{ positiv definit} \;\Longleftrightarrow\; \det\!\begin{pmatrix} a_{11} & \cdots & a_{1i} \\ \vdots & \ddots & \vdots \\ a_{i1} & \cdots & a_{ii} \end{pmatrix} > 0 \quad \text{für alle } i

Alle führenden Hauptminoren > 0. Alternierende Vorzeichen (ungerade i < 0, gerade i > 0): negativ definit.

Damit das vollständige Kochrezept für lokale Extrema einer Funktion $f: \mathbb{R}^n \to \mathbb{R}$ :

Kochrezept: lokale Extrema klassifizieren

Schritt 1: kritische Punkte finden

Ein Extremum oder Sattel kann nur dort liegen, wo die Tangentialebene waagrecht ist.

Löse $\operatorname{grad} f(\mathbf{a}) = \mathbf{0}$ nach den kritischen Punkten $\mathbf{a}$ :

$\operatorname{grad} f(\mathbf{a}) = \mathbf{0}$
Schritt 2: Hesse-Matrix aufstellen

Sie enthält die Krümmung in alle Richtungen, ausgewertet im kritischen Punkt.

Bilde die Matrix der zweiten partiellen Ableitungen:

$H_f(\mathbf{a}) = \left( \frac{\partial^2 f(\mathbf{a})}{\partial x_i\, \partial x_j} \right)_{i,j}$
Schritt 3: Definitheit bestimmen und entscheiden

Vorzeichen der Eigenwerte (oder Hurwitz) klassifizieren den Punkt.

(I) $H_f(\mathbf{a})$ positiv definit $\Rightarrow$ lokales Minimum. (II) negativ definit $\Rightarrow$ lokales Maximum. (III) indefinit $\Rightarrow$ Sattelpunkt.

Beispiel: Signatur und Hesse-Matrix

Schritt 1: Signatur einer 2×2-Matrix

Wir zählen die Vorzeichen der Eigenwerte.

Für $A = \begin{pmatrix} 1 & 1 \\ 1 & 0 \end{pmatrix}$ ist $P_A(\lambda) = \lambda^2 - \lambda - 1 = 0$ , also $\lambda_{1,2} = \tfrac{1 \pm \sqrt{5}}{2}$ . Ein Eigenwert ist positiv, einer negativ:

$\operatorname{Signatur}(A) = (1,\, 1,\, 0)$
Schritt 2: erste Ableitungen einer Funktion

Für die Hesse-Matrix brauchen wir zunächst den Gradienten.

Für $f(x,y) = -12x + 5x^3 - 12y + 3x^2 y + 3xy^2 + 5y^3$ :

$\begin{aligned} \frac{\partial f}{\partial x} &= -12 + 15x^2 + 6xy + 3y^2 \\ \frac{\partial f}{\partial y} &= -12 + 3x^2 + 6xy + 15y^2 \end{aligned}$
Schritt 3: zweite Ableitungen

Sie sind die Einträge der Hesse-Matrix.

$\begin{aligned} \frac{\partial^2 f}{\partial x^2} &= 30x + 6y \\ \frac{\partial^2 f}{\partial x\, \partial y} &= 6x + 6y \\ \frac{\partial^2 f}{\partial y^2} &= 6x + 30y \end{aligned}$
Schritt 4: Hesse-Matrix

Die gemischten zweiten Ableitungen sind gleich (Satz von Schwarz), also ist $H_f$ symmetrisch.

$H_f = \begin{pmatrix} 30x + 6y & 6x + 6y \\ 6x + 6y & 6x + 30y \end{pmatrix}$

Definition Signatur (p, n, z)

p

= Anzahl positiver Eigenwerte,

n

= Anzahl negativer Eigenwerte (nicht die Dimension!),

z

= algebraische Vielfachheit von

\lambda = 0

Definition Hesse-Matrix

H_f(\mathbf{a}) = \big(\partial^2 f(\mathbf{a}) / \partial x_i \partial x_j\big)_{i,j}

, die symmetrische Matrix der zweiten partiellen Ableitungen.

Notation Notation: grad f

\operatorname{grad} f

ist der Gradient (Vektor der ersten partiellen Ableitungen).

\operatorname{grad} f(\mathbf{a}) = \mathbf{0}

markiert einen kritischen Punkt.

Formel Klassifikation

\begin{aligned} H_f \text{ pos. definit} &\Rightarrow \text{Min} \\ \text{neg. definit} &\Rightarrow \text{Max} \\ \text{indefinit} &\Rightarrow \text{Sattel} \end{aligned}

Über die Definitheit der Hesse-Matrix im kritischen Punkt.

Querverweis → Analysis IV.5: Extrema

Querverweis Die führenden Hauptminoren (Determinanten von Teilmatrizen) stammen aus Kapitel 3. Diese Seite liefert die in Analysis IV.5 auf „ein späteres Kapitel" vertagte Klassifikation kritischer Punkte über die Hesse-Matrix.

Aufgaben mit Musterlösungen

Die Aufgaben zu diesem Kapitel folgen in Kürze.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!

6.1Definitionen

6.1.1 Eigenwerte und Eigenvektoren

Einstiegsbeispiel: Diagonalmatrix A=diag⁡(1,2)A = \operatorname{diag}(1,2)A=diag(1,2)

Beispiel: Dreiecksmatrix, Eigenwerte direkt von der Diagonalen

Beispiel: doppelter Eigenwert mit vollem Eigenraum

6.1.2 Ähnlichkeit und Diagonalisierbarkeit

Beispiel: diagonalisierbar (zwei verschiedene Eigenwerte)

Gegenbeispiel: NICHT diagonalisierbar (zu wenige Eigenvektoren)

6.2Eigenwertproblem symmetrischer Matrizen

6.2.1 Der Spektralsatz

6.2.2 Durchgerechnete Beispiele

Beispiel: nicht-symmetrische 3×3-Matrix diagonalisieren

Beispiel: Matrix aus gegebenen Eigenwerten und -vektoren rekonstruieren

Beispiel: symmetrische 4×4-Matrix, T orthogonal

6.3Anwendungen

6.3.1 Potenzen AkxA^k\mathbf{x}Akx effizient berechnen (Kochrezept)

Kochrezept: y=Akx\mathbf{y} = A^k\mathbf{x}y=Akx

Beispiel: AnA^nAn und die Fibonacci-Matrix

6.3.2 Das Matrixexponential eAe^AeA berechnen (Kochrezept)

Beispiel: eAe^AeA einer 2×2-Matrix

Beispiel: det⁡(eA)\det(e^A)det(eA) ohne eAe^AeA auszurechnen

6.3.3 Die Matrixnorm

Beispiele: Matrixnormen ablesen

6.3.4 Hauptachsentransformation quadratischer Formen

Kochrezept: Hauptachsentransformation

Beispiel: Mischterm wegdrehen

6.3.5 Kegelschnitte

Beispiel: vom Mischterm zur Ellipse

6.3.6 Lokale Extrema

Kochrezept: lokale Extrema klassifizieren

Beispiel: Signatur und Hesse-Matrix

Aufgaben mit Musterlösungen

Einstiegsbeispiel: Diagonalmatrix $A = \operatorname{diag}(1,2)$

6.3.1 Potenzen $A^k\mathbf{x}$ effizient berechnen (Kochrezept)

Kochrezept: $\mathbf{y} = A^k\mathbf{x}$

Beispiel: $A^n$ und die Fibonacci-Matrix

6.3.2 Das Matrixexponential $e^A$ berechnen (Kochrezept)

Beispiel: $e^A$ einer 2×2-Matrix

Beispiel: $\det(e^A)$ ohne $e^A$ auszurechnen