Kap. 2: Matrizen — STEM Animations

2.1Was ist eine Matrix?

2.1 Was ist eine Matrix? Zeilen, Spalten, der Eintrag aᵢⱼ

Stell dir eine Tabelle aus Zahlen vor: $m$ Zeilen untereinander, $n$ Spalten nebeneinander. Genau das ist eine Matrix. Wie ein Sitzplan im Kino (Reihe und Platz) oder eine Tabellenkalkulation: jeder Eintrag hat eine feste Adresse aus zwei Zahlen, und mehr braucht es zunächst nicht.

Wir schreiben $A \in \mathbb{R}^{m \times n}$ und meinen damit: $A$ hat $m$ Zeilen und $n$ Spalten, und alle Einträge sind reelle Zahlen. Den Eintrag in Zeile $i$ und Spalte $j$ nennen wir $a_{ij}$ oder gleichbedeutend $(A)_{ij}$ . Die Reihenfolge der Indizes ist nicht verhandelbar: Zeile zuerst, Spalte zuletzt. $a_{23}$ steht also in der zweiten Zeile, dritten Spalte, niemals umgekehrt.

Wann brauchen wir das überhaupt? Eine Matrix ist die kompakte Schreibweise für ein lineares Gleichungssystem $A\mathbf{x} = \mathbf{b}$ und für jede lineare Abbildung (das haben wir in Kap. 1 gesehen). Sobald zwei Matrizen Eintrag für Eintrag übereinstimmen, nennen wir sie gleich. Das ist banal, aber es ist die Grundlage für jedes Gleichsetzen, das später kommt.

Gleichheit zweier Matrizen

A = B \iff (A)_{ij} = (B)_{ij} \quad \text{für alle } i, j

Zwei Matrizen sind genau dann gleich, wenn sie an jeder Stelle denselben Eintrag haben. Setzt gleiches Format voraus.

Notation Notation: aᵢⱼ = (A)ᵢⱼ
Eintrag der Matrix

A

in Zeile $i$ , Spalte $j$ . Beide Schreibweisen meinen dasselbe. Merksatz: Zeile zuerst, Spalte zuletzt.

Definition Matrix
Rechteckige Zahlentabelle

A \in \mathbb{R}^{m \times n}

mit

m

Zeilen und

n

Spalten.

m \times n

heisst das Format der Matrix.

Querverweis Verweise
→ Kap. 1: Matrixform Ax = b
→ Kap. 1: Spaltensicht

2.2Spezielle Matrizen

2.2 Wichtige Spezialfälle: quadratisch, Null, Dreieck, Diagonal, Einheit, Vektoren

Bevor wir rechnen, lohnt es sich, ein paar besonders häufige Matrix-Typen mit Namen zu kennen, so wie man Vokabeln lernt, bevor man Sätze bildet. Jeder dieser Typen taucht später wieder auf, und sobald du den Namen erkennst, weisst du sofort, was die Matrix kann.

Quadratisch: Eine $n \times n$ -Matrix (gleich viele Zeilen wie Spalten) heisst quadratische Matrix. Nur quadratische Matrizen kann man invertieren oder auf Symmetrie prüfen. Nullmatrix $0$ : alle Einträge sind Null ( $a_{ij}=0$ für alle $i,j$ ). Sie ist das neutrale Element der Addition, genau wie die Zahl $0$ .

Dreiecksmatrizen: Eine obere Dreiecksmatrix $R$ hat unterhalb der Diagonale nur Nullen ( $r_{ij}=0$ für $i>j$ ); eine untere Dreiecksmatrix $L$ hat oberhalb der Diagonale nur Nullen ( $l_{ij}=0$ für $i<j$ ). Eselsbrücke: das $R$ (von „rechts/oben") trägt seine Zahlen im oberen Dreieck, das $L$ (von „links/unten") im unteren. Die Buchstaben $R$ und $L$ kommen direkt aus dem Englischen right und left und tauchen bei der LR-Zerlegung in 2.7 wieder auf.

Diagonalmatrix $D$ : nur die Diagonale ist besetzt, alles andere ist Null. Sie ist gleichzeitig obere und untere Dreiecksmatrix. Einheitsmatrix $I_n$ : die Diagonalmatrix mit lauter Einsen auf der Diagonale ( $d_{ij}=1$ für $i=j$ , sonst $0$ ). Sie ist die „ $1$ " der Matrixwelt. Spalten- und Zeilenvektor: eine $n \times 1$ -Matrix (eine Spalte) heisst Spaltenvektor, eine $1 \times n$ -Matrix (eine Zeile) heisst Zeilenvektor. Vektoren sind also nur besonders schmale Matrizen.

Typ	Bedingung	Mini-Beispiel
Quadratisch ( $n \times n$ )	gleich viele Zeilen wie Spalten	$\left(\begin{smallmatrix} 1 & 2 \\ 3 & 4 \end{smallmatrix}\right)$
Nullmatrix $0$	$a_{ij}=0$ für alle $i,j$	$\left(\begin{smallmatrix} 0 & 0 \\ 0 & 0 \end{smallmatrix}\right)$
Obere Dreiecksmatrix $R$	$r_{ij}=0$ für $i>j$	$\left(\begin{smallmatrix} 6 & 7 \\ 0 & 9 \end{smallmatrix}\right)$
Untere Dreiecksmatrix $L$	$l_{ij}=0$ für $i<j$	$\left(\begin{smallmatrix} 1 & 0 \\ 6 & 7 \end{smallmatrix}\right)$
Diagonalmatrix $D$	nur Diagonale besetzt ( $R$ und $L$ )	$\left(\begin{smallmatrix} 2 & 0 \\ 0 & 3 \end{smallmatrix}\right)$
Einheitsmatrix $I_n$	Diagonale $=1$ , sonst $0$	$\left(\begin{smallmatrix} 1 & 0 \\ 0 & 1 \end{smallmatrix}\right)$

Die sechs Standard-Typen auf einen Blick

Dreiecksmatrizen

R: \; r_{ij} = 0 \;\; \forall\, i > j \qquad\qquad L: \; l_{ij} = 0 \;\; \forall\, i < j

R = obere (Nullen unten links), L = untere (Nullen oben rechts) Dreiecksmatrix.

Beispiele: untere und obere Dreiecksmatrix

L = \begin{pmatrix} 1 & 0 & 0 \\ 6 & 7 & 0 \\ 3 & 1 & 4 \end{pmatrix}, \qquad R = \begin{pmatrix} 6 & 7 & 8 \\ 0 & 9 & 2 \\ 0 & 0 & 3 \end{pmatrix}

Links: alle Einträge oberhalb der Diagonale sind 0. Rechts: alle Einträge unterhalb der Diagonale sind 0.

Diagonalmatrix und Einheitsmatrix

D = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{pmatrix}, \qquad I_n = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}

D

ist gleichzeitig obere und untere Dreiecksmatrix.

I_n

ist die Diagonalmatrix mit lauter Einsen.

Spaltenvektor und Zeilenvektor

\mathbf{a} = \begin{pmatrix} 4 \\ 5 \\ 6 \end{pmatrix} \;\; (3 \times 1), \qquad \mathbf{b} = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} \;\; (1 \times 3)

Spaltenvektor: n×1-Matrix. Zeilenvektor: 1×n-Matrix. Beide sind Spezialfälle einer Matrix.

Definition Quadratische Matrix
Matrix mit gleich vielen Zeilen wie Spalten (

n \times n

). Voraussetzung für Inverse, Symmetrie und Determinante.

Definition Dreiecksmatrix
Obere (

R

r_{ij}=0

für

i>j

. Untere (

L

l_{ij}=0

für

i<j

. Die Diagonaleinträge dürfen beliebig sein.

Definition Diagonalmatrix
Nur die Diagonale ist besetzt. Sie ist zugleich obere und untere Dreiecksmatrix.

Notation Notation: Iₙ
Einheitsmatrix der Grösse

n

d_{ij}=1

für

i=j

, sonst

0

. Manche Texte schreiben sie auch als

\mathbb{1}_n

; wir bleiben bei

I_n

Querverweis Verweise
→ 2.7 LR-Zerlegung (L und R)
→ Kap. 1: Zeilenstufenform

2.3Die Transponierte

2.3 Die Transponierte: an der Diagonale spiegeln

Kippe die Matrix entlang ihrer Hauptdiagonale, so dass Zeilen zu Spalten werden und Spalten zu Zeilen. Das Ergebnis ist die Transponierte $A^{\mathsf{T}}$ . Anschaulich: die Diagonale bleibt ein Spiegel stehen, und alles links unten klappt nach rechts oben (und umgekehrt). Transponieren ist also nichts anderes als eine Spiegelung an der Diagonale.

Formal vertauscht das Transponieren die beiden Indizes: $(A^{\mathsf{T}})_{ij} = a_{ji}$ . Der Eintrag, der vorher in Zeile $i$ , Spalte $j$ stand, steht jetzt in Zeile $j$ , Spalte $i$ . Das Format dreht sich entsprechend: aus einer $m \times n$ -Matrix wird eine $n \times m$ -Matrix.

Zwei Spezialfälle bekommen eigene Namen. Gilt $A^{\mathsf{T}} = A$ (die Matrix ist ihr eigenes Spiegelbild), heisst $A$ symmetrisch. Gilt $A^{\mathsf{T}} = -A$ (das Spiegelbild ist das Negative), heisst $A$ antisymmetrisch. Beide Begriffe brauchen wir später bei Spannungstensoren, Skalarprodukten und Eigenwerten immer wieder.

Transponierte: die vier Eigenschaften

\text{(i)}\;\; (A^{\mathsf{T}})_{ij} = a_{ji} \qquad \text{(ii)}\;\; (A^{m \times n})^{\mathsf{T}} = A^{n \times m}

(i) Indizes vertauschen, (ii) Format dreht sich. Lies (i): der ji-Eintrag von A wird zum ij-Eintrag der Transponierten.

Symmetrisch und antisymmetrisch

\begin{aligned} \text{(iii)}\;\; A^{\mathsf{T}} = A &\;\Rightarrow\; A \text{ symmetrisch} \\ \text{(iv)}\;\; A^{\mathsf{T}} = -A &\;\Rightarrow\; A \text{ antisymmetrisch} \end{aligned}

Symmetrisch: gespiegelt bleibt gleich. Antisymmetrisch: gespiegelt wird negativ.

Beispiel: Transponieren (Berechnung)

\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix}^{\mathsf{T}} = \begin{pmatrix} 1 & 4 & 7 \\ 2 & 5 & 8 \\ 3 & 6 & 9 \end{pmatrix}

Die erste Zeile (1, 2, 3) wird zur ersten Spalte. Die Diagonale 1, 5, 9 bleibt unverändert.

Beispiel: eine symmetrische Matrix

\begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 7 & 10 \end{pmatrix}^{\mathsf{T}} = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 7 & 10 \end{pmatrix}

Transponiert ergibt dieselbe Matrix, also ist sie symmetrisch (

A^{\mathsf{T}}=A

Notation Notation: Aᵀ
Transponierte von

A

: Zeilen und Spalten vertauscht,

(A^{\mathsf{T}})_{ij}=a_{ji}

. Manche Texte schreiben sie als

A^{\top}

; wir nutzen durchgehend

A^{\mathsf{T}}

Definition Symmetrisch

A^{\mathsf{T}}=A

. Spiegelbildlich zur Diagonale:

a_{ij}=a_{ji}

. Nur für quadratische Matrizen möglich.

Definition Antisymmetrisch

A^{\mathsf{T}}=-A

. Folge: die Diagonale ist immer Null, da

a_{ii}=-a_{ii}

2.4Rechnen mit Matrizen

2.4.1 Addition von Matrizen

Zwei gleich grosse Matrizen addiert man so simpel, wie man hofft: Feld für Feld. Liegen die Matrizen wie zwei deckungsgleiche Tabellen übereinander, addiert man jede Zelle mit der Zelle direkt darunter. Das Ergebnis heisst Summe $A+B$ .

Damit das überhaupt definiert ist, müssen beide Matrizen dasselbe Format haben: eine $m \times n$ -Matrix plus eine $m \times n$ -Matrix ergibt wieder eine $m \times n$ -Matrix. Eintrag für Eintrag heisst das $(A+B)_{ij} = (A)_{ij} + (B)_{ij}$ .

Addition (elementweise)

(A + B)_{ij} = (A)_{ij} + (B)_{ij}, \qquad (m \times n) + (m \times n) = (m \times n)

Jeder Eintrag der Summe ist die Summe der beiden Einträge an derselben Stelle. Format bleibt erhalten.

Beispiel: Addition zweier 2×3-Matrizen

\begin{aligned} &\begin{pmatrix} 1 & 2 & 0 \\ 6 & 7 & 8 \end{pmatrix} + \begin{pmatrix} 0 & 3 & 1 \\ 2 & 4 & 6 \end{pmatrix} \\ &= \begin{pmatrix} 1 & 5 & 1 \\ 8 & 11 & 14 \end{pmatrix} \end{aligned}

Beispiel: oben links

1+0=1

, daneben

2+3=5

, und so weiter, Zelle für Zelle.

Definition Summe von Matrizen

(A+B)_{ij}=(A)_{ij}+(B)_{ij}

. Nur für Matrizen gleichen Formats definiert; das Format bleibt erhalten.

2.4.2 Multiplikation mit einem Skalar

Eine Matrix mit einer einzelnen Zahl multiplizieren heisst: jeden Eintrag mit dieser Zahl multiplizieren. Die Zahl nennt man Skalar (üblich: $\alpha$ ). Stell dir einen Lautstärkeregler vor, der alle Einträge gleichmässig grösser oder kleiner dreht, die Struktur der Tabelle bleibt, nur die Werte skalieren.

Das Format ändert sich dabei nicht: $\alpha \cdot (m \times n) = (m \times n)$ . Eintrag für Eintrag gilt $\alpha \cdot (A)_{ij} = (\alpha \cdot A)_{ij}$ .

Skalarmultiplikation (elementweise)

\alpha \cdot (A)_{ij} = (\alpha \cdot A)_{ij}, \qquad \alpha \cdot (m \times n) = (m \times n)

Jeder Eintrag wird mit

\alpha

multipliziert. Das Format bleibt gleich.

Beispiel: Skalarmultiplikation

6 \cdot \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} = \begin{pmatrix} 6 & 12 \\ 18 & 24 \end{pmatrix}

Jeder der vier Einträge wird mit 6 multipliziert.

Notation Notation: α (Skalar)

\alpha \in \mathbb{R}

ist eine einzelne Zahl (kein Vektor, keine Matrix).

\alpha \cdot A

streckt jeden Eintrag um den Faktor

\alpha

2.4.3 Matrixmultiplikation: Zeile mal Spalte

Wie multipliziert man zwei Matrizen? Nicht Feld für Feld, das ist die naheliegende, aber falsche Vermutung. Die Regel heisst stattdessen Zeile mal Spalte, und sie ist der wichtigste Handgriff des ganzen Kapitels.

Die Idee in einem Satz: Der Eintrag in Zeile $i$ , Spalte $j$ des Produkts ist das Skalarprodukt aus der $i$ -ten Zeile der linken Matrix und der $j$ -ten Spalte der rechten Matrix. Man läuft also die Zeile $i$ und die Spalte $j$ gleichzeitig ab, multipliziert die jeweils gegenüberliegenden Zahlen und summiert alles auf. Diese eine Summe liefert genau einen Eintrag des Ergebnisses; für jeden weiteren Eintrag nimmt man die passende Zeile und Spalte.

Als Formel sieht das so aus (siehe Schlüsselformel rechts). Der Buchstabe $k$ in der Summe ist nur ein Laufindex: er zählt die gemeinsame „Mitte" ab, über die summiert wird. Welchen Buchstaben man dafür wählt, ist gleichgültig (manche Texte schreiben die Summe mit $j$ statt $k$ ); die Operation ist immer dieselbe. Wichtig ist nur: der erste Index $i$ kommt von der Zeile links, der letzte Index $j$ von der Spalte rechts.

Damit das aufgeht, müssen die Formate verträglich sein. Multipliziert man $(m \times n) \cdot (n \times p)$ , so ergibt das eine $(m \times p)$ -Matrix. Merkbild: die beiden inneren Zahlen ( $n$ und $n$ ) müssen übereinstimmen (sonst „passen Zeile und Spalte nicht aufeinander"), die beiden äusseren Zahlen ( $m$ und $p$ ) ergeben das Format des Resultats.

!!!

Matrixmultiplikation: Eintrag für Eintrag

(A \cdot B)_{ij} = \sum_{k=1}^{n} (A)_{ik} \cdot (B)_{kj}, \qquad (m \times n) \cdot (n \times p) = (m \times p)

Eintrag (i, j) = Skalarprodukt aus Zeile i von A und Spalte j von B. Der Laufindex k summiert über die gemeinsame Dimension n.

Was die Summe für 2×2 konkret bedeutet

\begin{aligned} &\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix} \cdot \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix} \\ &= \begin{pmatrix} a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\ a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \end{pmatrix} \end{aligned}

Oben links: Zeile 1 von A mal Spalte 1 von B. Oben rechts: Zeile 1 mal Spalte 2. Und so weiter.

Beispiel: ein definiertes Produkt (2×3 · 3×2 = 2×2)

\begin{aligned} &\begin{pmatrix} 2 & 3 & 1 \\ -1 & 3 & 2 \end{pmatrix} \cdot \begin{pmatrix} 1 & 5 \\ 6 & 1 \\ -1 & 3 \end{pmatrix} \\ &= \begin{pmatrix} 19 & 16 \\ 15 & 4 \end{pmatrix} \end{aligned}

Innere Zahlen 3 = 3 passen, also definiert. Probe oben links:

2\cdot 1 + 3\cdot 6 + 1\cdot(-1) = 19

Gegenbeispiel: ein nicht definiertes Produkt

\begin{pmatrix} 2 & 3 & 1 \\ -1 & 3 & 2 \end{pmatrix} \cdot \begin{pmatrix} 1 & 5 \\ 6 & 1 \end{pmatrix} \;\; \text{existiert nicht}

Format

2 \times 3

mal

2 \times 2

: die inneren Zahlen

3

und

2

stimmen nicht überein, das Produkt ist undefiniert.

Formel Schlüsselformel

(A \cdot B)_{ij} = \sum_{k=1}^{n} a_{ik}\, b_{kj}

Zeile

i

von

A

mal Spalte

j

von

B

, aufsummiert. Die wichtigste Formel des Kapitels.

Notation Notation: der Laufindex k

k

\sum_{k=1}^{n}

ist nur ein Platzhalter, der über die gemeinsame Dimension summiert. Andere Texte schreiben dieselbe Regel als

c_{ik}=\sum_{j} a_{ij} b_{jk}

; das ist exakt dieselbe Operation.

Merke Verträglichkeit zuerst
Vor jedem Produkt: Spaltenzahl der linken = Zeilenzahl der rechten Matrix? Wenn nicht, existiert das Produkt nicht.

Querverweis Verweise
→ 2.4.4 Rechenregeln (AB ≠ BA)

2.4.4 Rechenregeln

Welche der gewohnten Algebra-Regeln gelten für Matrizen, und welche nicht? Bei Zahlen ist alles harmlos: man darf umstellen, klammern und ausmultiplizieren, wie man will. Bei Matrizen gelten fast alle diese Regeln, mit einer berühmten Ausnahme.

Für Addition und Multiplikation gilt: die Addition ist kommutativ und assoziativ, das Produkt ist assoziativ und distributiv (man darf also ausklammern). Was nicht gilt, ist die Kommutativität des Produkts: im Allgemeinen ist $A \cdot B \neq B \cdot A$ . Diese eine fehlende Regel ist die Quelle der meisten Fehler in Klausuren.

Auch das Transponieren hat seine eigenen Regeln. Summe und Transponieren vertauschen problemlos. Bei einem Produkt aber dreht sich die Reihenfolge: $(A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} \cdot A^{\mathsf{T}}$ . Und die Einheitsmatrix ist ihre eigene Transponierte, $I_n^{\mathsf{T}} = I_n$ .

Rechenregeln für Addition und Multiplikation

\begin{aligned} \text{(i)}\;\; A + B &= B + A \\ \text{(ii)}\;\; A + B + C &= A + (B + C) \\ \text{(iii)}\;\; (A + B) \cdot C &= A \cdot C + B \cdot C \\ \text{(iv)}\;\; (A \cdot B) \cdot C &= A \cdot (B \cdot C) \\ \text{(v)}\;\; \alpha \cdot (A + B) &= \alpha A + \alpha B \\ \text{(vi)}\;\; \alpha(\beta \cdot A) &= (\alpha \cdot \beta) \cdot A \\ \text{(vii)}\;\; \text{im Allgemeinen } &A \cdot B \neq B \cdot A \end{aligned}

(i) kommutativ (Addition), (ii) assoziativ, (iii) distributiv, (iv) assoziativ (Produkt), (v)/(vi) mit Skalaren

\alpha,\beta \in \mathbb{R}

, (vii) das Produkt ist NICHT kommutativ.

Rechenregeln für die Transponierte

\begin{aligned} &\text{(i)}\;\; (A + B)^{\mathsf{T}} = A^{\mathsf{T}} + B^{\mathsf{T}} &\qquad &\text{(ii)}\;\; (A^{\mathsf{T}})^{\mathsf{T}} = A \\ &\text{(iii)}\;\; (A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} \cdot A^{\mathsf{T}} &\qquad &\text{(iv)}\;\; I_n^{\mathsf{T}} = I_n \end{aligned}

Bei (iii) dreht sich die Reihenfolge: erst B transponiert, dann A. Zweimal transponieren (ii) ergibt das Original.

Merke Die eine Ausnahme
kommutativ NEIN (Produkt), assoziativ JA, distributiv JA. Merksatz für das ganze Kapitel.

Merke Reihenfolge dreht

(A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} A^{\mathsf{T}}

. Dasselbe Muster wie bei der Inverse in 2.5 (Socken und Schuhe).

Querverweis Verweise
→ 2.5.2 Rechnen mit Inversen

2.5Die Inverse einer Matrix

2.5.1 Inverse berechnen mit Gauss-Jordan (Kochrezept)

Bei Zahlen ist $\tfrac{1}{3}$ die Inverse von $3$ , denn $3 \cdot \tfrac{1}{3} = 1$ . Bei Matrizen suchen wir das Gegenstück: eine Matrix $A^{-1}$ , die $A$ wieder rückgängig macht, also $A \cdot A^{-1} = I_n$ erfüllt. Anschaulich ist $A^{-1}$ die Matrix, die die Wirkung von $A$ exakt umkehrt, wie eine Rückspultaste.

Eine Matrix, für die so ein $A^{-1}$ existiert, heisst invertierbar (gleichbedeutend: regulär oder nicht singulär). Gibt es keine solche Matrix, heisst $A$ singulär. Wichtig: nur quadratische Matrizen können überhaupt invertierbar sein, und falls die Inverse existiert, ist sie eindeutig bestimmt.

Berechnet wird $A^{-1}$ mit dem Gauss-Jordan-Verfahren, einer Erweiterung der Gauss-Elimination aus Kap. 1. Der Trick (siehe Lösungsweg) lautet: schreibe $A$ und $I_n$ nebeneinander und forme die linke Seite per Zeilenoperationen in $I_n$ um, wobei du jede Operation gleichzeitig auf beiden Seiten ausführst. Wenn links $I_n$ steht, steht rechts $A^{-1}$ .

Definition: invertierbar

A \cdot B = I_n \;\Rightarrow\; B = A^{-1}

A

heisst dann invertierbar (regulär, nicht singulär).

A^{-1}

ist eindeutig. Nur für quadratische Matrizen möglich.

Kochrezept Gauss-Jordan, durchgerechnet an Beispiel 23

Schritt 1: A und Iₙ nebeneinanderschreiben

Wir wollen dieselben Zeilenoperationen, die $A$ in $I_n$ verwandeln, parallel auf $I_n$ wirken lassen. Dafür müssen beide nebeneinanderstehen.

Wir starten mit der zu invertierenden Matrix $A$ und hängen rechts die Einheitsmatrix an:

$\left(\, A \;\mid\; I_n \,\right) = \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ -1 & 4 & 1 & 0 & 1 & 0 \\ 2 & -4 & 1 & 0 & 0 & 1 \end{array}\right)$
Schritt 2: erste Spalte ausräumen (III - 2·I, II + I)

Unter dem ersten Pivot (die $1$ oben links) sollen Nullen entstehen. Dafür ziehen wir passende Vielfache der ersten Zeile von den anderen ab.

Beide Operationen wirken auf beiden Seiten des Strichs gleichzeitig:

$\xrightarrow[\;II + I\;]{\;III - 2I\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 1 & 1 & 1 & 0 \\ 0 & 2 & 1 & -2 & 0 & 1 \end{array}\right)$
Schritt 3: zweite Spalte unter dem Pivot ausräumen (III - 2·II)

Jetzt soll auch unter dem zweiten Pivot eine Null stehen, damit links eine Dreiecksform entsteht.

$\xrightarrow{\;III - 2II\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 1 & 1 & 1 & 0 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)$
Schritt 4: nach oben ausräumen (II + III)

Für $I_n$ links brauchen wir auch über den Pivots Nullen. Wir arbeiten uns von unten nach oben zurück.

$\xrightarrow{\;II + III\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)$
Schritt 5: erste Zeile bereinigen (I + 3·II)

In der ersten Zeile steht in Spalte 2 noch eine $-3$ . Wir addieren das Dreifache der zweiten Zeile, um sie zu tilgen.

$\xrightarrow{\;I + 3II\;} \left(\begin{array}{ccc|ccc} 1 & 0 & 0 & -8 & -3 & 3 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)$
Schritt 6: letzten Pivot auf 1 bringen ((-1)·III)

Der dritte Pivot ist noch $-1$ . Wir multiplizieren die dritte Zeile mit $-1$ , damit links exakt $I_n$ steht.

Sobald links $I_3$ steht, ist die rechte Seite die gesuchte Inverse:

$\xrightarrow{\;(-1)\,III\;} \left(\begin{array}{ccc|ccc} 1 & 0 & 0 & -8 & -3 & 3 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & 1 & 4 & 2 & -1 \end{array}\right) = \left(\, I_n \;\mid\; A^{-1} \,\right)$
Ergebnis

Links steht $I_3$ , also lesen wir rechts die Inverse direkt ab.

$A^{-1} = \begin{pmatrix} -8 & -3 & 3 \\ -3 & -1 & 1 \\ 4 & 2 & -1 \end{pmatrix}$

Kochrezept in Kurzform

\begin{gathered} \left(\, A \;\mid\; I_n \,\right) \\ \xrightarrow{\text{Zeilenoperationen, beidseitig}} \\ \left(\, I_n \;\mid\; A^{-1} \,\right) \end{gathered}

Links

I_n

erzeugen (ZSF, durch Pivots teilen, Zeilen tauschen). Jede Operation gilt gleichzeitig für beide Seiten.

Notation Notation: A⁻¹
Inverse von

A

. Erfüllt

A \cdot A^{-1} = A^{-1} \cdot A = I_n

. Achtung:

A^{-1}

ist nicht „

1

durch

A

", sondern die Umkehr-Matrix.

Definition Invertierbar / singulär
Invertierbar (regulär, nicht singulär):

A^{-1}

existiert. Singulär:

A^{-1}

existiert nicht. Nur quadratische Matrizen kommen in Frage.

Prüfungstipp Prüfungstipp
Bleibt beim Gauss-Jordan links eine Nullzeile, ist

A

singulär, fertig. Gegenprobe:

A \cdot A^{-1} \overset{!}{=} I_n

Querverweis Verweise
→ Kap. 1: Gauss-Elimination
→ 2.8 weitere Beispiele

2.5.2 Rechnen mit Inversen

Ist $A^{-1}$ einmal bekannt, gelten ein paar handliche Regeln, die das weitere Rechnen abkürzen. Sie sind das Gegenstück zu den Transponierten-Regeln aus 2.4.4, und eine davon hat dasselbe „Reihenfolge dreht"-Muster.

Die wichtigste: bei einem Produkt dreht sich beim Invertieren die Reihenfolge um, $(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}$ . Zweimal invertieren bringt das Original zurück, $(A^{-1})^{-1} = A$ . Die Einheitsmatrix ist ihre eigene Inverse, $I_n^{-1} = I_n$ . Und Transponieren und Invertieren vertauschen, $(A^{\mathsf{T}})^{-1} = (A^{-1})^{\mathsf{T}}$ .

Für den Spezialfall $2 \times 2$ gibt es zusätzlich eine direkte Formel, die schneller ist als das ganze Gauss-Jordan-Kochrezept (siehe Ergänzung unten).

Rechnen mit Inversen

\begin{aligned} &\text{(i)}\;\; A^{-1} \cdot A = I_n &\qquad &\text{(ii)}\;\; (A^{-1})^{-1} = A \\ &\text{(iii)}\;\; (A \cdot B)^{-1} = B^{-1} \cdot A^{-1} &\qquad &\text{(iv)}\;\; I_n^{-1} = I_n \\ &\text{(v)}\;\; (A^{\mathsf{T}})^{-1} = (A^{-1})^{\mathsf{T}} & & \end{aligned}

Bei (iii) dreht sich die Reihenfolge (wie bei der Transponierten). (v): transponieren und invertieren darf man vertauschen.

Formel Schlüsselformel

(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}

Beim Invertieren eines Produkts dreht sich die Reihenfolge. Gleiches Muster wie

(A B)^{\mathsf{T}} = B^{\mathsf{T}} A^{\mathsf{T}}

Merke Reihenfolge dreht
Sowohl beim Transponieren als auch beim Invertieren eines Produkts: erst der hintere Faktor. Merksatz „Socken und Schuhe".

Notation Notation: Adjunktenformel (2×2)

\bigl(\begin{smallmatrix} a & b \\ c & d \end{smallmatrix}\bigr)^{-1} = \frac{1}{ad-bc}\bigl(\begin{smallmatrix} d & -b \\ -c & a \end{smallmatrix}\bigr)

. Schneller Spezialfall;

ad-bc

ist die Determinante (späteres Kapitel).

2.5.3 Folgerungen der Invertierbarkeit

Invertierbarkeit, voller Rang und eindeutige Lösbarkeit sind drei Namen für dieselbe Sache. Sobald eine quadratische Matrix invertierbar ist, weisst du sofort, wie sich jedes Gleichungssystem $A\mathbf{x} = \mathbf{b}$ damit verhält, und ebenso, wenn sie es nicht ist. Die folgende Tabelle stellt beide Welten gegenüber.

Ist $A$ invertierbar, so ist $A\mathbf{x} = \mathbf{b}$ für jedes $\mathbf{b}$ lösbar und hat genau eine Lösung (nämlich $\mathbf{x} = A^{-1}\mathbf{b}$ ); das homogene System $A\mathbf{x} = \mathbf{0}$ hat nur die triviale Lösung $\mathbf{x}=\mathbf{0}$ ; und der Rang ist voll, $\operatorname{rang}(A) = n$ . Ist $A$ singulär, kippt jede dieser Aussagen: $A\mathbf{x} = \mathbf{b}$ hat keine oder unendlich viele Lösungen, das homogene System hat unendlich viele Lösungen, und $\operatorname{rang}(A) < n$ . Diese Liste ist Teil der neun Äquivalenzen aus Kap. 1.

Wie sieht man der Matrix den Rang an, wenn sie einen Parameter enthält? Das folgende Beispiel bringt eine parameterabhängige Matrix auf Zeilenstufenform und liest daraus ab, für welche Parameterwerte sie singulär wird.

Eigenschaft	$A$ invertierbar	$A$ singulär
$A\mathbf{x}=\mathbf{b}$	lösbar für jedes $\mathbf{b}$ , genau eine Lösung	keine oder unendlich viele Lösungen
$A\mathbf{x}=\mathbf{0}$	nur triviale Lösung $\mathbf{x}=\mathbf{0}$	unendlich viele Lösungen
Rang	$\operatorname{rang}(A)=n$ (voll)	$\operatorname{rang}(A)<n$

Invertierbar versus singulär (für

A \in \mathbb{R}^{n \times n}

)

Beispiel 24: Singularität und Rang in Abhängigkeit von α, β

Schritt 1: die parameterabhängige Matrix

Wir wollen wissen, für welche Werte der Parameter $\alpha, \beta$ die Matrix singulär wird, also nicht vollen Rang hat.

Gegeben ist

$B = \begin{pmatrix} 1 & 2 & \alpha \\ 2 & \beta & 2\alpha \\ \alpha & 2\alpha & \beta^{2} \end{pmatrix}$
Schritt 2: auf Zeilenstufenform bringen

Singularität liest man am bequemsten an der ZSF ab: $B$ ist genau dann singulär, wenn ein Pivot verschwindet, also eine Nullzeile entsteht.

Mit den Operationen $II - 2\,I$ und $III - \alpha\,I$ ergibt sich

$B \;\xrightarrow[\;III - \alpha I\;]{\;II - 2 I\;}\; \begin{pmatrix} 1 & 2 & \alpha \\ 0 & \beta - 4 & 0 \\ 0 & 0 & (\beta - \alpha)(\beta + \alpha) \end{pmatrix}$
Schritt 3: ablesen, wann B singulär ist

$B$ ist singulär, sobald einer der beiden hinteren Diagonaleinträge Null wird, denn dann fehlt ein Pivot und $\operatorname{rang}(B) < 3$ .

Der Eintrag $\beta - 4$ verschwindet bei $\beta = 4$ ; der Eintrag $(\beta-\alpha)(\beta+\alpha)$ verschwindet bei $\beta = \pm\alpha$ . Also:

$B \text{ singulär} \iff \beta = 4 \;\text{ oder }\; \beta = \pm\alpha$
Schritt 4: den Rang als Fallunterscheidung

Je nachdem, wie viele der hinteren Pivots verschwinden, bleibt $\operatorname{rang}(B)$ bei 1, 2 oder 3.

Auszählen der nicht verschwindenden Pivots liefert

$\operatorname{rang}(B) = \begin{cases} 1, & \beta = 4 \;\wedge\; \alpha = \pm\beta = \pm 4 \\ 2, & \beta = \pm\alpha,\, \beta \neq 4 \;\text{ oder }\; \beta = 4,\, \alpha \neq \pm\beta \\ 3, & \beta \neq \pm\alpha \;\wedge\; \beta \neq 4 \end{cases}$

Merke Drei Namen, eine Sache
invertierbar

\iff \operatorname{rang}(A)=n \iff \det(A) \neq 0

. Die Determinante folgt formal in einem späteren Kapitel.

Querverweis Verweise
→ Kap. 1: Die neun Äquivalenzen
→ Kap. 1: Rang und Pivots
→ Kap. 1: Frobenius-Kriterium

2.6Orthogonale Matrizen

2.6 Orthogonale Matrizen und Drehmatrizen

Stell dir vor, du drehst einen starren Körper im Raum: alle Längen und Winkel bleiben erhalten, nur die Orientierung ändert sich. Genau das tut eine orthogonale Matrix. Sie dreht (und spiegelt) den Raum, ohne ihn zu stauchen oder zu verzerren. Solche Matrizen sind die mathematische Beschreibung von Drehungen.

Definiert ist eine quadratische Matrix als orthogonal über die Bedingung $A^{\mathsf{T}} \cdot A = I_n$ (oft auch $Q^{\mathsf{T}} Q = I$ geschrieben, mit $Q$ als üblichem Buchstaben für orthogonale Matrizen). Aus dieser einen Gleichung folgt sofort das Bequemste an orthogonalen Matrizen: ihre Inverse ist einfach die Transponierte, $A^{-1} = A^{\mathsf{T}}$ . Invertieren wird damit gratis, du musst die Matrix nur kippen.

Drei Eigenschaften fasst die Vorlesung als Theorem zusammen. (i) $A$ ist invertierbar mit $A^{-1} = A^{\mathsf{T}}$ . (ii) Das Produkt zweier orthogonaler Matrizen ist wieder orthogonal (zwei Drehungen hintereinander ergeben eine Drehung). (iii) Die Spalten (und ebenso die Zeilen) sind normiert (jeder hat Betrag $1$ ) und stehen paarweise senkrecht aufeinander (ihr Skalarprodukt ist $0$ ). Die Spalten bilden also eine Orthonormalbasis.

Das Standardbeispiel ist die Drehung um die x-Achse um den Winkel $\alpha$ . Allgemein gibt es im Raum drei Achsen-Drehmatrizen $R_x, R_y, R_z$ und in der Ebene die Drehung $R(\alpha)$ um den Ursprung. Den Winkel nennen wir durchgehend $\alpha$ (manche Texte schreiben $\phi$ oder $\theta$ , das ist dasselbe). Alle vier stehen unten; sie sind das Werkzeug, mit dem man in Grafik, Robotik und Mechanik Objekte dreht.

Definition: orthogonale Matrix

A^{\mathsf{T}} \cdot A = I_n

Auch als

Q^{\mathsf{T}} Q = I

. Aus dieser Bedingung folgt

A^{-1} = A^{\mathsf{T}}

Theorem: Eigenschaften orthogonaler Matrizen

\begin{aligned} &\text{(i)}\;\; A^{-1} = A^{\mathsf{T}} \quad (A \text{ ist invertierbar}) \\ &\text{(ii)}\;\; A, B \text{ orthogonal} \;\Rightarrow\; A \cdot B \text{ orthogonal} \\ &\text{(iii)}\;\; \text{Spalten/Zeilen normiert (Betrag } 1\text{),} \\ &\qquad\;\; \text{paarweise senkrecht (Skalarprodukt } 0\text{)} \end{aligned}

(iii) heisst: die Spalten bilden eine Orthonormalbasis von

\mathbb{R}^n

Drehung um die x-Achse im ℝ³

R_x(\alpha) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & -\sin(\alpha) \\ 0 & \sin(\alpha) & \cos(\alpha) \end{pmatrix}

Die x-Achse bleibt fix (erste Zeile/Spalte ist die Standardbasis), die yz-Ebene dreht sich um den Winkel

\alpha

Drehung in der Ebene und um die y- und z-Achse

\begin{aligned} R(\alpha) &= \begin{pmatrix} \cos(\alpha) & -\sin(\alpha) \\ \sin(\alpha) & \cos(\alpha) \end{pmatrix}, \\ R_y(\alpha) &= \begin{pmatrix} \cos(\alpha) & 0 & \sin(\alpha) \\ 0 & 1 & 0 \\ -\sin(\alpha) & 0 & \cos(\alpha) \end{pmatrix}, \\ R_z(\alpha) &= \begin{pmatrix} \cos(\alpha) & -\sin(\alpha) & 0 \\ \sin(\alpha) & \cos(\alpha) & 0 \\ 0 & 0 & 1 \end{pmatrix} \end{aligned}

R(\alpha)

dreht in der Ebene

\mathbb{R}^2

;

R_y, R_z

drehen um die jeweilige Achse im

\mathbb{R}^3

. Diese drei sind eine Ergänzung; in der Vorlesung erscheint nur

R_x

Wie Rₓ(α) wirkt, und warum sie orthogonal ist

Schritt 1: zwei Testvektoren wählen

Um den Effekt einer Matrix zu verstehen, schaut man, was sie mit den Basisvektoren macht.

Wir nehmen den x-Einheitsvektor und den y-Einheitsvektor:

$\mathbf{a} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \qquad \mathbf{b} = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix}$
Schritt 2: a liegt auf der Drehachse, bleibt fix

$\mathbf{a}$ zeigt entlang der x-Achse, also der Drehachse selbst. Eine Drehung um die x-Achse lässt die x-Achse unberührt.

$\mathbf{a}_{\text{neu}} = R_x(\alpha)\,\mathbf{a} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}$
Schritt 3: b dreht sich in der yz-Ebene

$\mathbf{b}$ steht senkrecht zur Achse, wird also tatsächlich gedreht. Genau hier tauchen $\cos(\alpha)$ und $\sin(\alpha)$ auf.

$\mathbf{b}_{\text{neu}} = R_x(\alpha)\,\mathbf{b} = \begin{pmatrix} 0 \\ \cos(\alpha) \\ \sin(\alpha) \end{pmatrix}$
Schritt 4: Orthogonalität nachrechnen

Laut Definition ist $R_x$ orthogonal, wenn $R_x^{\mathsf{T}} R_x = I_3$ gilt. Das prüfen wir direkt.

Mit $\cos^2(\alpha) + \sin^2(\alpha) = 1$ heben sich die gemischten Terme weg:

$R_x(\alpha)^{\mathsf{T}}\, R_x(\alpha) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & \sin(\alpha) \\ 0 & -\sin(\alpha) & \cos(\alpha) \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & -\sin(\alpha) \\ 0 & \sin(\alpha) & \cos(\alpha) \end{pmatrix} = I_3$

Notation Notation: Q (orthogonal)
Übliches Symbol für eine orthogonale Matrix. Definiert durch

Q^{\mathsf{T}} Q = I_n

. In der Vorlesung heisst sie auch

A

; beides meint dasselbe.

Formel Schlüsselformel

A^{-1} = A^{\mathsf{T}} \quad (A \text{ orthogonal})

Bei orthogonalen Matrizen ist die Inverse einfach die Transponierte.

Merke Spalten = Orthonormalbasis
Die Spalten einer orthogonalen Matrix haben Betrag

1

und stehen paarweise senkrecht. Sie bilden eine Orthonormalbasis von

\mathbb{R}^n

Notation Notation: Drehwinkel α

\alpha

ist der Drehwinkel. Manche Texte schreiben

\phi

oder

\theta

. Trigonometrische Funktionen immer mit Klammern:

\cos(\alpha)

\sin(\alpha)

2.7LR-Zerlegung

2.7.1 LR-Zerlegung: Kochrezept (PA = LR)

Muss man $A\mathbf{x} = \mathbf{b}$ für viele verschiedene rechte Seiten $\mathbf{b}$ lösen, ist es Verschwendung, jedes Mal die ganze Gauss-Elimination neu zu rechnen. Die LR-Zerlegung macht die Elimination ein einziges Mal und verwahrt das Ergebnis so, dass man es für jedes neue $\mathbf{b}$ wiederverwenden kann. Genau dafür ist sie gedacht.

Die Idee: für eine $n \times n$ -Matrix $A$ schreibt man die Beziehung $P A = L R$ . Dabei ist $L$ eine untere Dreiecksmatrix, $R$ eine obere Dreiecksmatrix und $P$ eine Permutationsmatrix, die nur die Zeilenvertauschungen protokolliert. Braucht man keine Vertauschungen, ist $P = I_n$ und es bleibt schlicht $A = L R$ (so kürzt man es oft ab).

Das Kochrezept (siehe Lösungsweg) hat vier Schritte: $I_n$ und $A$ nebeneinanderschreiben, $A$ per Gauss auf Zeilenstufenform bringen, daraus $L$ , $R$ und $P$ ablesen, und schliesslich für ein gegebenes $\mathbf{b}$ erst $L\mathbf{c} = P\mathbf{b}$ vorwärts und dann $R\mathbf{x} = \mathbf{c}$ rückwärts auflösen. Die durchgerechneten Beispiele dazu stehen in 2.8.

Idee der LR-Zerlegung

\begin{aligned} &P A = L R, \\ &L \text{ untere}, \;\; R \text{ obere Dreiecksmatrix}, \\ &P \text{ Permutationsmatrix} \end{aligned}

Ohne Zeilenvertauschungen ist

P = I_n

, also

A = L R

P

speichert nur, welche Zeilen getauscht wurden.

Kochrezept der LR-Zerlegung in vier Schritten

Schritt 1: Iₙ und A nebeneinanderschreiben

$I_n$ links dient als Notizspalte: dort sammeln wir später die Eliminationskoeffizienten (für $L$ ) und die Vertauschungen (für $P$ ).

$\left(\, I_n \,\right)\;\left(\, A \,\right)$
Schritt 2: A per Gauss auf Zeilenstufenform bringen

Die ZSF von $A$ ist genau die obere Dreiecksmatrix $R$ . Beim Eliminieren merken wir uns die verwendeten Koeffizienten.

Wichtig: die Koeffizienten, mit denen die Pivotzeilen multipliziert werden, schreibt man immer als Subtraktion. Statt $II + 2\,I$ also $II - (-2)\,I$ . Zeilen- oder Spaltenvertauschungen führt man an $I_n$ mit.
Schritt 3: L, R und P ablesen

Aus der Rechnung lassen sich die drei Faktoren direkt ablesen, ohne weitere Multiplikation.

$R$ ist die ZSF-Matrix. $L$ hat auf der Diagonale lauter Einsen, und links der Diagonale die Koeffizienten aus Schritt 2. Die vertauschte $I_n$ ist die Permutationsmatrix $P$ .
Schritt 4: für ein gegebenes b zweimal einsetzen

Statt $A\mathbf{x} = \mathbf{b}$ direkt zu lösen, löst man zwei Dreieckssysteme, und Dreieckssysteme löst man bequem durch Einsetzen.

Zuerst $L\mathbf{c} = P\mathbf{b}$ mit Vorwärtseinsetzen (von oben nach unten), das liefert $\mathbf{c}$ . Dann $R\mathbf{x} = \mathbf{c}$ mit Rückwärtseinsetzen (von unten nach oben), das liefert die gesuchte Lösung $\mathbf{x}$ .

$\begin{aligned} L\mathbf{c} &= P\mathbf{b} \;\;\xrightarrow{\text{vorwärts}}\;\; \mathbf{c} \\ R\mathbf{x} &= \mathbf{c} \;\;\xrightarrow{\text{rückwärts}}\;\; \mathbf{x} \end{aligned}$

Notation Notation: L, R, P

L

= untere Dreiecksmatrix (Eliminationskoeffizienten, Diagonale

1

R

= obere Dreiecksmatrix (die ZSF).

P

= Permutationsmatrix (Zeilenvertauschungen).

Formel Schlüsselformel

P A = L R

Ohne Vertauschung

P = I_n

, also

A = L R

. Dann

L\mathbf{c}=P\mathbf{b}

(vorwärts),

R\mathbf{x}=\mathbf{c}

(rückwärts).

Prüfungstipp Prüfungstipp
Koeffizienten als Subtraktion eintragen (

II - (-2)\,I

), sonst stimmt das Vorzeichen in

L

nicht.

Querverweis Verweise
→ 2.8 durchgerechnete Beispiele
→ Kap. 1: Gauss-Elimination

2.8Beispiele

2.8.1 Beispiel: LR-Zerlegung ohne Permutation

Jetzt rechnen wir das Kochrezept aus 2.7 einmal komplett durch, an einem Fall ohne Zeilenvertauschungen (also $P = I_3$ ). Gesucht ist die Lösung von $A\mathbf{x} = \mathbf{b}$ . Achte beim Mitlesen besonders darauf, wie die Eliminationskoeffizienten aus der Reduktion direkt in $L$ landen.

Beispiel 26 (ohne Permutationen), komplett durchgerechnet

Schritt 1: Aufgabe

Wir wollen $A\mathbf{x} = \mathbf{b}$ über die LR-Zerlegung lösen, nicht durch direktes Gauss.

Gegeben sind

$A = \begin{pmatrix} 2 & -1 & -3 \\ 6 & 1 & -10 \\ -2 & -7 & 8 \end{pmatrix}, \qquad \mathbf{b} = \begin{pmatrix} 1 \\ 0 \\ 2 \end{pmatrix}$
Schritt 2: A auf Zeilenstufenform bringen, R ablesen

Die ZSF von $A$ ist $R$ . Die Koeffizienten (immer als Subtraktion) merken wir uns für $L$ .

Mit $III - (-1)\,I$ und $II - 3\,I$ , dann $III - (-2)\,II$ :

$\begin{aligned} &A \;\xrightarrow[\;II - 3I\;]{\;III - (-1)I\;}\; \begin{pmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & -8 & 5 \end{pmatrix} \\ &\;\xrightarrow{\;III - (-2)II\;}\; R = \begin{pmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & 0 & 3 \end{pmatrix} \end{aligned}$
Schritt 3: L aus den Koeffizienten, P = I₃

$L$ hat Diagonale $1$ und trägt links der Diagonale die eben verwendeten Koeffizienten. Da wir nie Zeilen getauscht haben, ist $P$ die Einheitsmatrix.

$L = \begin{pmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ -1 & -2 & 1 \end{pmatrix}, \qquad P = I_3 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}$
Schritt 4: Lc = Pb vorwärts einsetzen

Da $P = I_3$ , ist $P\mathbf{b} = \mathbf{b}$ . Das System $L\mathbf{c} = \mathbf{b}$ ist unten-dreieckig, also von oben nach unten direkt auflösbar.

Aus $\left(\begin{smallmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ -1 & -2 & 1 \end{smallmatrix} \,\middle|\, \begin{smallmatrix} 1 \\ 0 \\ 2 \end{smallmatrix}\right)$ folgt Zeile für Zeile $c_1 = 1$ , $c_2 = -3$ , $c_3 = -3$ :

$\mathbf{c} = \begin{pmatrix} 1 \\ -3 \\ -3 \end{pmatrix}$
Schritt 5: Rx = c rückwärts einsetzen, Lösung

$R\mathbf{x} = \mathbf{c}$ ist oben-dreieckig, also von unten nach oben auflösbar. Das liefert die gesuchte Lösung $\mathbf{x}$ .

Aus $\left(\begin{smallmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & 0 & 3 \end{smallmatrix} \,\middle|\, \begin{smallmatrix} 1 \\ -3 \\ -3 \end{smallmatrix}\right)$ folgt rückwärts $x_3 = -1$ , $x_2 = -1$ , $x_1 = -\tfrac{3}{2}$ :

$\mathbf{x} = \begin{pmatrix} -\tfrac{3}{2} \\ -1 \\ -1 \end{pmatrix}$

Merke Ohne Vertauschung
Hier ist

P = I_3

, also

\mathbf{b}

unverändert. Erst

L\mathbf{c}=\mathbf{b}

(vorwärts), dann

R\mathbf{x}=\mathbf{c}

(rückwärts).

Querverweis Verweise
→ 2.7.1 Kochrezept

2.8.2 Beispiel: LR-Zerlegung mit Permutation

Was passiert, wenn oben links eine $0$ steht? Dann gibt es dort kein Pivot, und wir müssen Zeilen tauschen, bevor wir eliminieren können. Genau dieser Tausch wird in der Permutationsmatrix $P$ festgehalten. Gesucht sind hier $L$ , $R$ und $P$ so, dass $L R = P B$ gilt.

Beispiel 27 (mit Permutationen), durchgerechnet

Schritt 1: Aufgabe

Wir suchen die LR-Zerlegung von $B$ . Schon der erste Blick zeigt das Problem: oben links steht eine $0$ .

Gegeben ist

$B = \begin{pmatrix} 0 & 1 & -3 \\ -3 & 7 & 6 \\ -3 & -2 & -2 \end{pmatrix}$
Schritt 2: Zeilentausch wegen Null-Pivot (I ↔ II)

Mit einer $0$ als Pivot kann man nicht eliminieren. Wir tauschen Zeile I und II, damit oben links ein Eintrag ungleich Null steht. Dieser Tausch wird $P$ .

Danach eliminieren wir mit $III - 1\,I$ und $II - 0\,I$ , schliesslich $III - (-9)\,II$ :

$\begin{aligned} &B \;\xrightarrow{\;I \leftrightarrow II\;}\; \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ -3 & -2 & -2 \end{pmatrix} \\ &\;\xrightarrow[\;II - 0 I\;]{\;III - 1 I\;}\; \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ 0 & -9 & -8 \end{pmatrix} \\ &\;\xrightarrow{\;III - (-9)II\;}\; R = \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ 0 & 0 & -35 \end{pmatrix} \end{aligned}$
Schritt 3: L und P ablesen

$L$ trägt die Eliminationskoeffizienten (als Subtraktion) links der Diagonale; $P$ ist die Einheitsmatrix mit dem durchgeführten Zeilentausch $I \leftrightarrow II$ .

$L = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 1 & -9 & 1 \end{pmatrix}, \qquad P = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}$

Definition Permutationsmatrix

P

entsteht aus

I_n

durch dieselben Zeilenvertauschungen, die man beim Eliminieren braucht. Hält fest, in welcher Reihenfolge die Zeilen stehen.

Merke Null-Pivot
Steht oben links (oder allgemein auf der Pivotposition) eine

0

, muss eine Zeile getauscht werden. Der Tausch wandert in

P

2.8.3 Beispiel: LR-Zerlegung mit Parameter (4×4)

Zum Abschluss zeigen wir, dass das Kochrezept unverändert funktioniert, auch wenn die Matrix einen Parameter $a$ enthält und $4 \times 4$ gross ist. Es ändert sich nichts am Verfahren: Gauss bis zur Zeilenstufenform, Koeffizienten als Subtraktion in $L$ , und ablesen. Berechnet wird die LR-Zerlegung von $A$ .

Beispiel 28 (LR mit Parameter, 4×4), durchgerechnet

Schritt 1: Aufgabe

Wir wollen sehen, dass ein Parameter im Eintrag das Verfahren nicht stört, er wird einfach mitgeführt.

Gegeben ist die $4 \times 4$ -Matrix

$A = \begin{pmatrix} 2 & 1 & -1 & 2 \\ 4 & 7 & -3 & 9 \\ 6 & 8 & -1 & 9 \\ -2 & -11 & 3 - 6a & -6 + 5a \end{pmatrix}$
Schritt 2: auf Zeilenstufenform reduzieren, R ablesen

Wie immer ist die ZSF die obere Dreiecksmatrix $R$ . Der Parameter $a$ läuft durch die Rechnung mit und landet im letzten Pivot.

Mit $III - 3\,I$ , $IV + I$ , $II - 2\,I$ , dann $III - II$ , $IV - (-2)\,II$ , zuletzt $IV - (-2a)\,III$ ergibt sich

$A \;\longrightarrow\; R = \begin{pmatrix} 2 & 1 & -1 & 2 \\ 0 & 5 & -1 & 5 \\ 0 & 0 & 3 & -2 \\ 0 & 0 & 0 & 6 + a \end{pmatrix}$
Schritt 3: L aus den Koeffizienten, P = I₄

$L$ sammelt die Eliminationskoeffizienten (mit dem Parameter $a$ im Eintrag unten); da keine Zeilen getauscht wurden, ist $P$ die Einheitsmatrix.

$L = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 2 & 1 & 0 & 0 \\ 3 & 1 & 1 & 0 \\ -1 & -2 & -2a & 1 \end{pmatrix}, \qquad P = I_4$

Merke Parameter mitführen
Der Parameter

a

wird wie eine normale Zahl behandelt. Er landet im letzten Pivot

6+a

von

R

und im Eintrag

-2a

von

L

Querverweis Verweise
→ 2.5.3 Singularität via Parameter

Aufgaben mit Musterlösungen

Aufgaben mit ausführlichen Musterlösungen folgen. Wir erfinden keine Übungen, sondern übernehmen sie aus dem Übungsmaterial, sobald sie aufbereitet sind.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!

Variablen-Glossar (12 Einträge)

A \in \mathbb{R}^{m \times n}

Matrix mit

m

Zeilen und

n

Spalten, Einträge reell. -

a_{ij} = (A)_{ij}

Eintrag in Zeile

i

, Spalte

j

. Merksatz: Zeile zuerst, Spalte zuletzt. -

I_n

Einheitsmatrix der Grösse

n

: Einsen auf der Diagonale, sonst Null. Die „1" der Matrixwelt. -

0

Nullmatrix: alle Einträge sind Null. -

R \,/\, L

obere (

r_{ij}=0

für

i>j

) bzw. untere (

l_{ij}=0

für

i<j

) Dreiecksmatrix. -

D

Diagonalmatrix: nur die Diagonale ist besetzt. Gleichzeitig obere und untere Dreiecksmatrix. -

A^{\mathsf{T}}

Transponierte: Zeilen und Spalten vertauscht,

(A^{\mathsf{T}})_{ij}=a_{ji}

. Manche Texte schreiben

A^{\top}

. -

A^{-1}

Inverse der quadratischen Matrix

A

A\cdot A^{-1}=I_n

. Existiert nur, wenn

A

invertierbar (regulär) ist. -

Q

übliches Symbol für eine orthogonale Matrix:

Q^{\mathsf{T}}Q=I_n

. Dreht und spiegelt, ohne Längen zu ändern. -

R_x(\alpha)

Drehmatrix um die x-Achse um den Winkel

\alpha

. Analog

R_y(\alpha)

R_z(\alpha)

, und

R(\alpha)

in der Ebene. -

P

Permutationsmatrix: speichert die Zeilenvertauschungen der LR-Zerlegung. Ohne Vertauschung ist

P=I_n

. -

\operatorname{rang}(A)

Rang: Anzahl der Pivots in der Zeilenstufenform (siehe Kap. 1). -