2.1Was ist eine Matrix?

2.1 Was ist eine Matrix? Zeilen, Spalten, der Eintrag aᵢⱼ

Stell dir eine Tabelle aus Zahlen vor: mm Zeilen untereinander, nn Spalten nebeneinander. Genau das ist eine Matrix. Wie ein Sitzplan im Kino (Reihe und Platz) oder eine Tabellenkalkulation: jeder Eintrag hat eine feste Adresse aus zwei Zahlen, und mehr braucht es zunächst nicht.

Wir schreiben ARm×nA \in \mathbb{R}^{m \times n} und meinen damit: AA hat mm Zeilen und nn Spalten, und alle Einträge sind reelle Zahlen. Den Eintrag in Zeile ii und Spalte jj nennen wir aija_{ij} oder gleichbedeutend (A)ij(A)_{ij}. Die Reihenfolge der Indizes ist nicht verhandelbar: Zeile zuerst, Spalte zuletzt. a23a_{23} steht also in der zweiten Zeile, dritten Spalte, niemals umgekehrt.

Wann brauchen wir das überhaupt? Eine Matrix ist die kompakte Schreibweise für ein lineares Gleichungssystem Ax=bA\mathbf{x} = \mathbf{b} und für jede lineare Abbildung (das haben wir in Kap. 1 gesehen). Sobald zwei Matrizen Eintrag für Eintrag übereinstimmen, nennen wir sie gleich. Das ist banal, aber es ist die Grundlage für jedes Gleichsetzen, das später kommt.

Gleichheit zweier Matrizen
A=B    (A)ij=(B)ijfu¨r alle i,jA = B \iff (A)_{ij} = (B)_{ij} \quad \text{für alle } i, j
Zwei Matrizen sind genau dann gleich, wenn sie an jeder Stelle denselben Eintrag haben. Setzt gleiches Format voraus.
Notation Notation: aᵢⱼ = (A)ᵢⱼ
Eintrag der Matrix AA in Zeile ii, Spalte jj. Beide Schreibweisen meinen dasselbe. Merksatz: Zeile zuerst, Spalte zuletzt.
Definition Matrix
Rechteckige Zahlentabelle ARm×nA \in \mathbb{R}^{m \times n} mit mm Zeilen und nn Spalten. m×nm \times n heisst das Format der Matrix.

2.2Spezielle Matrizen

2.2 Wichtige Spezialfälle: quadratisch, Null, Dreieck, Diagonal, Einheit, Vektoren

Bevor wir rechnen, lohnt es sich, ein paar besonders häufige Matrix-Typen mit Namen zu kennen, so wie man Vokabeln lernt, bevor man Sätze bildet. Jeder dieser Typen taucht später wieder auf, und sobald du den Namen erkennst, weisst du sofort, was die Matrix kann.

Quadratisch: Eine n×nn \times n-Matrix (gleich viele Zeilen wie Spalten) heisst quadratische Matrix. Nur quadratische Matrizen kann man invertieren oder auf Symmetrie prüfen. Nullmatrix 00: alle Einträge sind Null (aij=0a_{ij}=0 für alle i,ji,j). Sie ist das neutrale Element der Addition, genau wie die Zahl 00.

Dreiecksmatrizen: Eine obere Dreiecksmatrix RR hat unterhalb der Diagonale nur Nullen (rij=0r_{ij}=0 für i>ji>j); eine untere Dreiecksmatrix LL hat oberhalb der Diagonale nur Nullen (lij=0l_{ij}=0 für i<ji<j). Eselsbrücke: das RR (von „rechts/oben") trägt seine Zahlen im oberen Dreieck, das LL (von „links/unten") im unteren. Die Buchstaben RR und LL kommen direkt aus dem Englischen right und left und tauchen bei der LR-Zerlegung in 2.7 wieder auf.

Diagonalmatrix DD: nur die Diagonale ist besetzt, alles andere ist Null. Sie ist gleichzeitig obere und untere Dreiecksmatrix. Einheitsmatrix InI_n: die Diagonalmatrix mit lauter Einsen auf der Diagonale (dij=1d_{ij}=1 für i=ji=j, sonst 00). Sie ist die „11" der Matrixwelt. Spalten- und Zeilenvektor: eine n×1n \times 1-Matrix (eine Spalte) heisst Spaltenvektor, eine 1×n1 \times n-Matrix (eine Zeile) heisst Zeilenvektor. Vektoren sind also nur besonders schmale Matrizen.

Typ Bedingung Mini-Beispiel
Quadratisch (n×nn \times n) gleich viele Zeilen wie Spalten (1234)\left(\begin{smallmatrix} 1 & 2 \\ 3 & 4 \end{smallmatrix}\right)
Nullmatrix 00 aij=0a_{ij}=0 für alle i,ji,j (0000)\left(\begin{smallmatrix} 0 & 0 \\ 0 & 0 \end{smallmatrix}\right)
Obere Dreiecksmatrix RR rij=0r_{ij}=0 für i>ji>j (6709)\left(\begin{smallmatrix} 6 & 7 \\ 0 & 9 \end{smallmatrix}\right)
Untere Dreiecksmatrix LL lij=0l_{ij}=0 für i<ji<j (1067)\left(\begin{smallmatrix} 1 & 0 \\ 6 & 7 \end{smallmatrix}\right)
Diagonalmatrix DD nur Diagonale besetzt (RR und LL) (2003)\left(\begin{smallmatrix} 2 & 0 \\ 0 & 3 \end{smallmatrix}\right)
Einheitsmatrix InI_n Diagonale =1=1, sonst 00 (1001)\left(\begin{smallmatrix} 1 & 0 \\ 0 & 1 \end{smallmatrix}\right)
Die sechs Standard-Typen auf einen Blick
Dreiecksmatrizen
R:  rij=0    i>jL:  lij=0    i<jR: \; r_{ij} = 0 \;\; \forall\, i > j \qquad\qquad L: \; l_{ij} = 0 \;\; \forall\, i < j
R = obere (Nullen unten links), L = untere (Nullen oben rechts) Dreiecksmatrix.
Beispiele: untere und obere Dreiecksmatrix
L=(100670314),R=(678092003)L = \begin{pmatrix} 1 & 0 & 0 \\ 6 & 7 & 0 \\ 3 & 1 & 4 \end{pmatrix}, \qquad R = \begin{pmatrix} 6 & 7 & 8 \\ 0 & 9 & 2 \\ 0 & 0 & 3 \end{pmatrix}
Links: alle Einträge oberhalb der Diagonale sind 0. Rechts: alle Einträge unterhalb der Diagonale sind 0.
Diagonalmatrix und Einheitsmatrix
D=(100020003),In=(100010001)D = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{pmatrix}, \qquad I_n = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}
DD ist gleichzeitig obere und untere Dreiecksmatrix. InI_n ist die Diagonalmatrix mit lauter Einsen.
Spaltenvektor und Zeilenvektor
a=(456)    (3×1),b=(123)    (1×3)\mathbf{a} = \begin{pmatrix} 4 \\ 5 \\ 6 \end{pmatrix} \;\; (3 \times 1), \qquad \mathbf{b} = \begin{pmatrix} 1 & 2 & 3 \end{pmatrix} \;\; (1 \times 3)
Spaltenvektor: n×1-Matrix. Zeilenvektor: 1×n-Matrix. Beide sind Spezialfälle einer Matrix.
Definition Quadratische Matrix
Matrix mit gleich vielen Zeilen wie Spalten (n×nn \times n). Voraussetzung für Inverse, Symmetrie und Determinante.
Definition Dreiecksmatrix
Obere (RR): rij=0r_{ij}=0 für i>ji>j. Untere (LL): lij=0l_{ij}=0 für i<ji<j. Die Diagonaleinträge dürfen beliebig sein.
Definition Diagonalmatrix
Nur die Diagonale ist besetzt. Sie ist zugleich obere und untere Dreiecksmatrix.
Notation Notation: Iₙ
Einheitsmatrix der Grösse nn. dij=1d_{ij}=1 für i=ji=j, sonst 00. Manche Texte schreiben sie auch als 1n\mathbb{1}_n; wir bleiben bei InI_n.

2.3Die Transponierte

2.3 Die Transponierte: an der Diagonale spiegeln

Kippe die Matrix entlang ihrer Hauptdiagonale, so dass Zeilen zu Spalten werden und Spalten zu Zeilen. Das Ergebnis ist die Transponierte ATA^{\mathsf{T}}. Anschaulich: die Diagonale bleibt ein Spiegel stehen, und alles links unten klappt nach rechts oben (und umgekehrt). Transponieren ist also nichts anderes als eine Spiegelung an der Diagonale.

Formal vertauscht das Transponieren die beiden Indizes: (AT)ij=aji(A^{\mathsf{T}})_{ij} = a_{ji}. Der Eintrag, der vorher in Zeile ii, Spalte jj stand, steht jetzt in Zeile jj, Spalte ii. Das Format dreht sich entsprechend: aus einer m×nm \times n-Matrix wird eine n×mn \times m-Matrix.

Zwei Spezialfälle bekommen eigene Namen. Gilt AT=AA^{\mathsf{T}} = A (die Matrix ist ihr eigenes Spiegelbild), heisst AA symmetrisch. Gilt AT=AA^{\mathsf{T}} = -A (das Spiegelbild ist das Negative), heisst AA antisymmetrisch. Beide Begriffe brauchen wir später bei Spannungstensoren, Skalarprodukten und Eigenwerten immer wieder.

Transponierte: die vier Eigenschaften
(i)    (AT)ij=aji(ii)    (Am×n)T=An×m\text{(i)}\;\; (A^{\mathsf{T}})_{ij} = a_{ji} \qquad \text{(ii)}\;\; (A^{m \times n})^{\mathsf{T}} = A^{n \times m}
(i) Indizes vertauschen, (ii) Format dreht sich. Lies (i): der ji-Eintrag von A wird zum ij-Eintrag der Transponierten.
Symmetrisch und antisymmetrisch
(iii)    AT=A    A symmetrisch(iv)    AT=A    A antisymmetrisch\begin{aligned} \text{(iii)}\;\; A^{\mathsf{T}} = A &\;\Rightarrow\; A \text{ symmetrisch} \\ \text{(iv)}\;\; A^{\mathsf{T}} = -A &\;\Rightarrow\; A \text{ antisymmetrisch} \end{aligned}
Symmetrisch: gespiegelt bleibt gleich. Antisymmetrisch: gespiegelt wird negativ.
Beispiel: Transponieren (Berechnung)
(123456789)T=(147258369)\begin{pmatrix} 1 & 2 & 3 \\ 4 & 5 & 6 \\ 7 & 8 & 9 \end{pmatrix}^{\mathsf{T}} = \begin{pmatrix} 1 & 4 & 7 \\ 2 & 5 & 8 \\ 3 & 6 & 9 \end{pmatrix}
Die erste Zeile (1, 2, 3) wird zur ersten Spalte. Die Diagonale 1, 5, 9 bleibt unverändert.
Beispiel: eine symmetrische Matrix
(1232473710)T=(1232473710)\begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 7 & 10 \end{pmatrix}^{\mathsf{T}} = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 7 \\ 3 & 7 & 10 \end{pmatrix}
Transponiert ergibt dieselbe Matrix, also ist sie symmetrisch (AT=AA^{\mathsf{T}}=A).
Notation Notation: Aᵀ
Transponierte von AA: Zeilen und Spalten vertauscht, (AT)ij=aji(A^{\mathsf{T}})_{ij}=a_{ji}. Manche Texte schreiben sie als AA^{\top}; wir nutzen durchgehend ATA^{\mathsf{T}}.
Definition Symmetrisch
AT=AA^{\mathsf{T}}=A. Spiegelbildlich zur Diagonale: aij=ajia_{ij}=a_{ji}. Nur für quadratische Matrizen möglich.
Definition Antisymmetrisch
AT=AA^{\mathsf{T}}=-A. Folge: die Diagonale ist immer Null, da aii=aiia_{ii}=-a_{ii}.

2.4Rechnen mit Matrizen

2.4.1 Addition von Matrizen

Zwei gleich grosse Matrizen addiert man so simpel, wie man hofft: Feld für Feld. Liegen die Matrizen wie zwei deckungsgleiche Tabellen übereinander, addiert man jede Zelle mit der Zelle direkt darunter. Das Ergebnis heisst Summe A+BA+B.

Damit das überhaupt definiert ist, müssen beide Matrizen dasselbe Format haben: eine m×nm \times n-Matrix plus eine m×nm \times n-Matrix ergibt wieder eine m×nm \times n-Matrix. Eintrag für Eintrag heisst das (A+B)ij=(A)ij+(B)ij(A+B)_{ij} = (A)_{ij} + (B)_{ij}.

Addition (elementweise)
(A+B)ij=(A)ij+(B)ij,(m×n)+(m×n)=(m×n)(A + B)_{ij} = (A)_{ij} + (B)_{ij}, \qquad (m \times n) + (m \times n) = (m \times n)
Jeder Eintrag der Summe ist die Summe der beiden Einträge an derselben Stelle. Format bleibt erhalten.
Beispiel: Addition zweier 2×3-Matrizen
(120678)+(031246)=(15181114)\begin{aligned} &\begin{pmatrix} 1 & 2 & 0 \\ 6 & 7 & 8 \end{pmatrix} + \begin{pmatrix} 0 & 3 & 1 \\ 2 & 4 & 6 \end{pmatrix} \\ &= \begin{pmatrix} 1 & 5 & 1 \\ 8 & 11 & 14 \end{pmatrix} \end{aligned}
Beispiel: oben links 1+0=11+0=1, daneben 2+3=52+3=5, und so weiter, Zelle für Zelle.
Definition Summe von Matrizen
(A+B)ij=(A)ij+(B)ij(A+B)_{ij}=(A)_{ij}+(B)_{ij}. Nur für Matrizen gleichen Formats definiert; das Format bleibt erhalten.

2.4.2 Multiplikation mit einem Skalar

Eine Matrix mit einer einzelnen Zahl multiplizieren heisst: jeden Eintrag mit dieser Zahl multiplizieren. Die Zahl nennt man Skalar (üblich: α\alpha). Stell dir einen Lautstärkeregler vor, der alle Einträge gleichmässig grösser oder kleiner dreht, die Struktur der Tabelle bleibt, nur die Werte skalieren.

Das Format ändert sich dabei nicht: α(m×n)=(m×n)\alpha \cdot (m \times n) = (m \times n). Eintrag für Eintrag gilt α(A)ij=(αA)ij\alpha \cdot (A)_{ij} = (\alpha \cdot A)_{ij}.

Skalarmultiplikation (elementweise)
α(A)ij=(αA)ij,α(m×n)=(m×n)\alpha \cdot (A)_{ij} = (\alpha \cdot A)_{ij}, \qquad \alpha \cdot (m \times n) = (m \times n)
Jeder Eintrag wird mit α\alpha multipliziert. Das Format bleibt gleich.
Beispiel: Skalarmultiplikation
6(1234)=(6121824)6 \cdot \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} = \begin{pmatrix} 6 & 12 \\ 18 & 24 \end{pmatrix}
Jeder der vier Einträge wird mit 6 multipliziert.
Notation Notation: α (Skalar)
αR\alpha \in \mathbb{R} ist eine einzelne Zahl (kein Vektor, keine Matrix). αA\alpha \cdot A streckt jeden Eintrag um den Faktor α\alpha.

2.4.3 Matrixmultiplikation: Zeile mal Spalte

Wie multipliziert man zwei Matrizen? Nicht Feld für Feld, das ist die naheliegende, aber falsche Vermutung. Die Regel heisst stattdessen Zeile mal Spalte, und sie ist der wichtigste Handgriff des ganzen Kapitels.

Die Idee in einem Satz: Der Eintrag in Zeile ii, Spalte jj des Produkts ist das Skalarprodukt aus der ii-ten Zeile der linken Matrix und der jj-ten Spalte der rechten Matrix. Man läuft also die Zeile ii und die Spalte jj gleichzeitig ab, multipliziert die jeweils gegenüberliegenden Zahlen und summiert alles auf. Diese eine Summe liefert genau einen Eintrag des Ergebnisses; für jeden weiteren Eintrag nimmt man die passende Zeile und Spalte.

Als Formel sieht das so aus (siehe Schlüsselformel rechts). Der Buchstabe kk in der Summe ist nur ein Laufindex: er zählt die gemeinsame „Mitte" ab, über die summiert wird. Welchen Buchstaben man dafür wählt, ist gleichgültig (manche Texte schreiben die Summe mit jj statt kk); die Operation ist immer dieselbe. Wichtig ist nur: der erste Index ii kommt von der Zeile links, der letzte Index jj von der Spalte rechts.

Damit das aufgeht, müssen die Formate verträglich sein. Multipliziert man (m×n)(n×p)(m \times n) \cdot (n \times p), so ergibt das eine (m×p)(m \times p)-Matrix. Merkbild: die beiden inneren Zahlen (nn und nn) müssen übereinstimmen (sonst „passen Zeile und Spalte nicht aufeinander"), die beiden äusseren Zahlen (mm und pp) ergeben das Format des Resultats.

!!!
Matrixmultiplikation: Eintrag für Eintrag
(AB)ij=k=1n(A)ik(B)kj,(m×n)(n×p)=(m×p)(A \cdot B)_{ij} = \sum_{k=1}^{n} (A)_{ik} \cdot (B)_{kj}, \qquad (m \times n) \cdot (n \times p) = (m \times p)
Eintrag (i, j) = Skalarprodukt aus Zeile i von A und Spalte j von B. Der Laufindex k summiert über die gemeinsame Dimension n.
Was die Summe für 2×2 konkret bedeutet
(a11a12a21a22)(b11b12b21b22)=(a11b11+a12b21a11b12+a12b22a21b11+a22b21a21b12+a22b22)\begin{aligned} &\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix} \cdot \begin{pmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \end{pmatrix} \\ &= \begin{pmatrix} a_{11}b_{11} + a_{12}b_{21} & a_{11}b_{12} + a_{12}b_{22} \\ a_{21}b_{11} + a_{22}b_{21} & a_{21}b_{12} + a_{22}b_{22} \end{pmatrix} \end{aligned}
Oben links: Zeile 1 von A mal Spalte 1 von B. Oben rechts: Zeile 1 mal Spalte 2. Und so weiter.
Beispiel: ein definiertes Produkt (2×3 · 3×2 = 2×2)
(231132)(156113)=(1916154)\begin{aligned} &\begin{pmatrix} 2 & 3 & 1 \\ -1 & 3 & 2 \end{pmatrix} \cdot \begin{pmatrix} 1 & 5 \\ 6 & 1 \\ -1 & 3 \end{pmatrix} \\ &= \begin{pmatrix} 19 & 16 \\ 15 & 4 \end{pmatrix} \end{aligned}
Innere Zahlen 3 = 3 passen, also definiert. Probe oben links: 21+36+1(1)=192\cdot 1 + 3\cdot 6 + 1\cdot(-1) = 19.
Gegenbeispiel: ein nicht definiertes Produkt
(231132)(1561)    existiert nicht\begin{pmatrix} 2 & 3 & 1 \\ -1 & 3 & 2 \end{pmatrix} \cdot \begin{pmatrix} 1 & 5 \\ 6 & 1 \end{pmatrix} \;\; \text{existiert nicht}
Format 2×32 \times 3 mal 2×22 \times 2: die inneren Zahlen 33 und 22 stimmen nicht überein, das Produkt ist undefiniert.
Formel Schlüsselformel
(AB)ij=k=1naikbkj(A \cdot B)_{ij} = \sum_{k=1}^{n} a_{ik}\, b_{kj}
Zeile ii von AA mal Spalte jj von BB, aufsummiert. Die wichtigste Formel des Kapitels.
Notation Notation: der Laufindex k
kk in k=1n\sum_{k=1}^{n} ist nur ein Platzhalter, der über die gemeinsame Dimension summiert. Andere Texte schreiben dieselbe Regel als cik=jaijbjkc_{ik}=\sum_{j} a_{ij} b_{jk}; das ist exakt dieselbe Operation.
Merke Verträglichkeit zuerst
Vor jedem Produkt: Spaltenzahl der linken = Zeilenzahl der rechten Matrix? Wenn nicht, existiert das Produkt nicht.
Querverweis Verweise
→ 2.4.4 Rechenregeln (AB ≠ BA)

2.4.4 Rechenregeln

Welche der gewohnten Algebra-Regeln gelten für Matrizen, und welche nicht? Bei Zahlen ist alles harmlos: man darf umstellen, klammern und ausmultiplizieren, wie man will. Bei Matrizen gelten fast alle diese Regeln, mit einer berühmten Ausnahme.

Für Addition und Multiplikation gilt: die Addition ist kommutativ und assoziativ, das Produkt ist assoziativ und distributiv (man darf also ausklammern). Was nicht gilt, ist die Kommutativität des Produkts: im Allgemeinen ist ABBAA \cdot B \neq B \cdot A. Diese eine fehlende Regel ist die Quelle der meisten Fehler in Klausuren.

Auch das Transponieren hat seine eigenen Regeln. Summe und Transponieren vertauschen problemlos. Bei einem Produkt aber dreht sich die Reihenfolge: (AB)T=BTAT(A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} \cdot A^{\mathsf{T}}. Und die Einheitsmatrix ist ihre eigene Transponierte, InT=InI_n^{\mathsf{T}} = I_n.

Rechenregeln für Addition und Multiplikation
(i)    A+B=B+A(ii)    A+B+C=A+(B+C)(iii)    (A+B)C=AC+BC(iv)    (AB)C=A(BC)(v)    α(A+B)=αA+αB(vi)    α(βA)=(αβ)A(vii)    im Allgemeinen ABBA\begin{aligned} \text{(i)}\;\; A + B &= B + A \\ \text{(ii)}\;\; A + B + C &= A + (B + C) \\ \text{(iii)}\;\; (A + B) \cdot C &= A \cdot C + B \cdot C \\ \text{(iv)}\;\; (A \cdot B) \cdot C &= A \cdot (B \cdot C) \\ \text{(v)}\;\; \alpha \cdot (A + B) &= \alpha A + \alpha B \\ \text{(vi)}\;\; \alpha(\beta \cdot A) &= (\alpha \cdot \beta) \cdot A \\ \text{(vii)}\;\; \text{im Allgemeinen } &A \cdot B \neq B \cdot A \end{aligned}
(i) kommutativ (Addition), (ii) assoziativ, (iii) distributiv, (iv) assoziativ (Produkt), (v)/(vi) mit Skalaren α,βR\alpha,\beta \in \mathbb{R}, (vii) das Produkt ist NICHT kommutativ.
Rechenregeln für die Transponierte
(i)    (A+B)T=AT+BT(ii)    (AT)T=A(iii)    (AB)T=BTAT(iv)    InT=In\begin{aligned} &\text{(i)}\;\; (A + B)^{\mathsf{T}} = A^{\mathsf{T}} + B^{\mathsf{T}} &\qquad &\text{(ii)}\;\; (A^{\mathsf{T}})^{\mathsf{T}} = A \\ &\text{(iii)}\;\; (A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} \cdot A^{\mathsf{T}} &\qquad &\text{(iv)}\;\; I_n^{\mathsf{T}} = I_n \end{aligned}
Bei (iii) dreht sich die Reihenfolge: erst B transponiert, dann A. Zweimal transponieren (ii) ergibt das Original.
Merke Die eine Ausnahme
kommutativ NEIN (Produkt), assoziativ JA, distributiv JA. Merksatz für das ganze Kapitel.
Merke Reihenfolge dreht
(AB)T=BTAT(A \cdot B)^{\mathsf{T}} = B^{\mathsf{T}} A^{\mathsf{T}}. Dasselbe Muster wie bei der Inverse in 2.5 (Socken und Schuhe).
Querverweis Verweise
→ 2.5.2 Rechnen mit Inversen

2.5Die Inverse einer Matrix

2.5.1 Inverse berechnen mit Gauss-Jordan (Kochrezept)

Bei Zahlen ist 13\tfrac{1}{3} die Inverse von 33, denn 313=13 \cdot \tfrac{1}{3} = 1. Bei Matrizen suchen wir das Gegenstück: eine Matrix A1A^{-1}, die AA wieder rückgängig macht, also AA1=InA \cdot A^{-1} = I_n erfüllt. Anschaulich ist A1A^{-1} die Matrix, die die Wirkung von AA exakt umkehrt, wie eine Rückspultaste.

Eine Matrix, für die so ein A1A^{-1} existiert, heisst invertierbar (gleichbedeutend: regulär oder nicht singulär). Gibt es keine solche Matrix, heisst AA singulär. Wichtig: nur quadratische Matrizen können überhaupt invertierbar sein, und falls die Inverse existiert, ist sie eindeutig bestimmt.

Berechnet wird A1A^{-1} mit dem Gauss-Jordan-Verfahren, einer Erweiterung der Gauss-Elimination aus Kap. 1. Der Trick (siehe Lösungsweg) lautet: schreibe AA und InI_n nebeneinander und forme die linke Seite per Zeilenoperationen in InI_n um, wobei du jede Operation gleichzeitig auf beiden Seiten ausführst. Wenn links InI_n steht, steht rechts A1A^{-1}.

!!
Definition: invertierbar
AB=In    B=A1A \cdot B = I_n \;\Rightarrow\; B = A^{-1}
AA heisst dann invertierbar (regulär, nicht singulär). A1A^{-1} ist eindeutig. Nur für quadratische Matrizen möglich.

Kochrezept Gauss-Jordan, durchgerechnet an Beispiel 23

  1. Schritt 1: A und Iₙ nebeneinanderschreiben
    Wir wollen dieselben Zeilenoperationen, die AA in InI_n verwandeln, parallel auf InI_n wirken lassen. Dafür müssen beide nebeneinanderstehen.
    Wir starten mit der zu invertierenden Matrix AA und hängen rechts die Einheitsmatrix an:
    (A    In)=(130100141010241001)\left(\, A \;\mid\; I_n \,\right) = \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ -1 & 4 & 1 & 0 & 1 & 0 \\ 2 & -4 & 1 & 0 & 0 & 1 \end{array}\right)
  2. Schritt 2: erste Spalte ausräumen (III - 2·I, II + I)
    Unter dem ersten Pivot (die 11 oben links) sollen Nullen entstehen. Dafür ziehen wir passende Vielfache der ersten Zeile von den anderen ab.
    Beide Operationen wirken auf beiden Seiten des Strichs gleichzeitig:
      II+I    III2I  (130100011110021201)\xrightarrow[\;II + I\;]{\;III - 2I\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 1 & 1 & 1 & 0 \\ 0 & 2 & 1 & -2 & 0 & 1 \end{array}\right)
  3. Schritt 3: zweite Spalte unter dem Pivot ausräumen (III - 2·II)
    Jetzt soll auch unter dem zweiten Pivot eine Null stehen, damit links eine Dreiecksform entsteht.
      III2II  (130100011110001421)\xrightarrow{\;III - 2II\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 1 & 1 & 1 & 0 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)
  4. Schritt 4: nach oben ausräumen (II + III)
    Für InI_n links brauchen wir auch über den Pivots Nullen. Wir arbeiten uns von unten nach oben zurück.
      II+III  (130100010311001421)\xrightarrow{\;II + III\;} \left(\begin{array}{ccc|ccc} 1 & -3 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)
  5. Schritt 5: erste Zeile bereinigen (I + 3·II)
    In der ersten Zeile steht in Spalte 2 noch eine 3-3. Wir addieren das Dreifache der zweiten Zeile, um sie zu tilgen.
      I+3II  (100833010311001421)\xrightarrow{\;I + 3II\;} \left(\begin{array}{ccc|ccc} 1 & 0 & 0 & -8 & -3 & 3 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & -1 & -4 & -2 & 1 \end{array}\right)
  6. Schritt 6: letzten Pivot auf 1 bringen ((-1)·III)
    Der dritte Pivot ist noch 1-1. Wir multiplizieren die dritte Zeile mit 1-1, damit links exakt InI_n steht.
    Sobald links I3I_3 steht, ist die rechte Seite die gesuchte Inverse:
      (1)III  (100833010311001421)=(In    A1)\xrightarrow{\;(-1)\,III\;} \left(\begin{array}{ccc|ccc} 1 & 0 & 0 & -8 & -3 & 3 \\ 0 & 1 & 0 & -3 & -1 & 1 \\ 0 & 0 & 1 & 4 & 2 & -1 \end{array}\right) = \left(\, I_n \;\mid\; A^{-1} \,\right)
  7. Ergebnis
    Links steht I3I_3, also lesen wir rechts die Inverse direkt ab.
    A1=(833311421)A^{-1} = \begin{pmatrix} -8 & -3 & 3 \\ -3 & -1 & 1 \\ 4 & 2 & -1 \end{pmatrix}
Kochrezept in Kurzform
(A    In)Zeilenoperationen, beidseitig(In    A1)\begin{gathered} \left(\, A \;\mid\; I_n \,\right) \\ \xrightarrow{\text{Zeilenoperationen, beidseitig}} \\ \left(\, I_n \;\mid\; A^{-1} \,\right) \end{gathered}
Links InI_n erzeugen (ZSF, durch Pivots teilen, Zeilen tauschen). Jede Operation gilt gleichzeitig für beide Seiten.
Notation Notation: A⁻¹
Inverse von AA. Erfüllt AA1=A1A=InA \cdot A^{-1} = A^{-1} \cdot A = I_n. Achtung: A1A^{-1} ist nicht11 durch AA", sondern die Umkehr-Matrix.
Definition Invertierbar / singulär
Invertierbar (regulär, nicht singulär): A1A^{-1} existiert. Singulär: A1A^{-1} existiert nicht. Nur quadratische Matrizen kommen in Frage.
Prüfungstipp Prüfungstipp
Bleibt beim Gauss-Jordan links eine Nullzeile, ist AA singulär, fertig. Gegenprobe: AA1=!InA \cdot A^{-1} \overset{!}{=} I_n.

2.5.2 Rechnen mit Inversen

Ist A1A^{-1} einmal bekannt, gelten ein paar handliche Regeln, die das weitere Rechnen abkürzen. Sie sind das Gegenstück zu den Transponierten-Regeln aus 2.4.4, und eine davon hat dasselbe „Reihenfolge dreht"-Muster.

Die wichtigste: bei einem Produkt dreht sich beim Invertieren die Reihenfolge um, (AB)1=B1A1(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}. Zweimal invertieren bringt das Original zurück, (A1)1=A(A^{-1})^{-1} = A. Die Einheitsmatrix ist ihre eigene Inverse, In1=InI_n^{-1} = I_n. Und Transponieren und Invertieren vertauschen, (AT)1=(A1)T(A^{\mathsf{T}})^{-1} = (A^{-1})^{\mathsf{T}}.

Für den Spezialfall 2×22 \times 2 gibt es zusätzlich eine direkte Formel, die schneller ist als das ganze Gauss-Jordan-Kochrezept (siehe Ergänzung unten).

Rechnen mit Inversen
(i)    A1A=In(ii)    (A1)1=A(iii)    (AB)1=B1A1(iv)    In1=In(v)    (AT)1=(A1)T\begin{aligned} &\text{(i)}\;\; A^{-1} \cdot A = I_n &\qquad &\text{(ii)}\;\; (A^{-1})^{-1} = A \\ &\text{(iii)}\;\; (A \cdot B)^{-1} = B^{-1} \cdot A^{-1} &\qquad &\text{(iv)}\;\; I_n^{-1} = I_n \\ &\text{(v)}\;\; (A^{\mathsf{T}})^{-1} = (A^{-1})^{\mathsf{T}} & & \end{aligned}
Bei (iii) dreht sich die Reihenfolge (wie bei der Transponierten). (v): transponieren und invertieren darf man vertauschen.
Formel Schlüsselformel
(AB)1=B1A1(A \cdot B)^{-1} = B^{-1} \cdot A^{-1}
Beim Invertieren eines Produkts dreht sich die Reihenfolge. Gleiches Muster wie (AB)T=BTAT(A B)^{\mathsf{T}} = B^{\mathsf{T}} A^{\mathsf{T}}.
Merke Reihenfolge dreht
Sowohl beim Transponieren als auch beim Invertieren eines Produkts: erst der hintere Faktor. Merksatz „Socken und Schuhe".
Notation Notation: Adjunktenformel (2×2)
(abcd)1=1adbc(dbca)\bigl(\begin{smallmatrix} a & b \\ c & d \end{smallmatrix}\bigr)^{-1} = \frac{1}{ad-bc}\bigl(\begin{smallmatrix} d & -b \\ -c & a \end{smallmatrix}\bigr). Schneller Spezialfall; adbcad-bc ist die Determinante (späteres Kapitel).

2.5.3 Folgerungen der Invertierbarkeit

Invertierbarkeit, voller Rang und eindeutige Lösbarkeit sind drei Namen für dieselbe Sache. Sobald eine quadratische Matrix invertierbar ist, weisst du sofort, wie sich jedes Gleichungssystem Ax=bA\mathbf{x} = \mathbf{b} damit verhält, und ebenso, wenn sie es nicht ist. Die folgende Tabelle stellt beide Welten gegenüber.

Ist AA invertierbar, so ist Ax=bA\mathbf{x} = \mathbf{b} für jedes b\mathbf{b} lösbar und hat genau eine Lösung (nämlich x=A1b\mathbf{x} = A^{-1}\mathbf{b}); das homogene System Ax=0A\mathbf{x} = \mathbf{0} hat nur die triviale Lösung x=0\mathbf{x}=\mathbf{0}; und der Rang ist voll, rang(A)=n\operatorname{rang}(A) = n. Ist AA singulär, kippt jede dieser Aussagen: Ax=bA\mathbf{x} = \mathbf{b} hat keine oder unendlich viele Lösungen, das homogene System hat unendlich viele Lösungen, und rang(A)<n\operatorname{rang}(A) < n. Diese Liste ist Teil der neun Äquivalenzen aus Kap. 1.

Wie sieht man der Matrix den Rang an, wenn sie einen Parameter enthält? Das folgende Beispiel bringt eine parameterabhängige Matrix auf Zeilenstufenform und liest daraus ab, für welche Parameterwerte sie singulär wird.

Eigenschaft AA invertierbar AA singulär
Ax=bA\mathbf{x}=\mathbf{b} lösbar für jedes b\mathbf{b}, genau eine Lösung keine oder unendlich viele Lösungen
Ax=0A\mathbf{x}=\mathbf{0} nur triviale Lösung x=0\mathbf{x}=\mathbf{0} unendlich viele Lösungen
Rang rang(A)=n\operatorname{rang}(A)=n (voll) rang(A)<n\operatorname{rang}(A)<n
Invertierbar versus singulär (für ARn×nA \in \mathbb{R}^{n \times n})

Beispiel 24: Singularität und Rang in Abhängigkeit von α, β

  1. Schritt 1: die parameterabhängige Matrix
    Wir wollen wissen, für welche Werte der Parameter α,β\alpha, \beta die Matrix singulär wird, also nicht vollen Rang hat.
    Gegeben ist
    B=(12α2β2αα2αβ2)B = \begin{pmatrix} 1 & 2 & \alpha \\ 2 & \beta & 2\alpha \\ \alpha & 2\alpha & \beta^{2} \end{pmatrix}
  2. Schritt 2: auf Zeilenstufenform bringen
    Singularität liest man am bequemsten an der ZSF ab: BB ist genau dann singulär, wenn ein Pivot verschwindet, also eine Nullzeile entsteht.
    Mit den Operationen II2III - 2\,I und IIIαIIII - \alpha\,I ergibt sich
    B    IIIαI    II2I    (12α0β4000(βα)(β+α))B \;\xrightarrow[\;III - \alpha I\;]{\;II - 2 I\;}\; \begin{pmatrix} 1 & 2 & \alpha \\ 0 & \beta - 4 & 0 \\ 0 & 0 & (\beta - \alpha)(\beta + \alpha) \end{pmatrix}
  3. Schritt 3: ablesen, wann B singulär ist
    BB ist singulär, sobald einer der beiden hinteren Diagonaleinträge Null wird, denn dann fehlt ein Pivot und rang(B)<3\operatorname{rang}(B) < 3.
    Der Eintrag β4\beta - 4 verschwindet bei β=4\beta = 4; der Eintrag (βα)(β+α)(\beta-\alpha)(\beta+\alpha) verschwindet bei β=±α\beta = \pm\alpha. Also:
    B singula¨r    β=4   oder   β=±αB \text{ singulär} \iff \beta = 4 \;\text{ oder }\; \beta = \pm\alpha
  4. Schritt 4: den Rang als Fallunterscheidung
    Je nachdem, wie viele der hinteren Pivots verschwinden, bleibt rang(B)\operatorname{rang}(B) bei 1, 2 oder 3.
    Auszählen der nicht verschwindenden Pivots liefert
    rang(B)={1,β=4    α=±β=±42,β=±α,β4   oder   β=4,α±β3,β±α    β4\operatorname{rang}(B) = \begin{cases} 1, & \beta = 4 \;\wedge\; \alpha = \pm\beta = \pm 4 \\ 2, & \beta = \pm\alpha,\, \beta \neq 4 \;\text{ oder }\; \beta = 4,\, \alpha \neq \pm\beta \\ 3, & \beta \neq \pm\alpha \;\wedge\; \beta \neq 4 \end{cases}
Merke Drei Namen, eine Sache
invertierbar     rang(A)=n    det(A)0\iff \operatorname{rang}(A)=n \iff \det(A) \neq 0. Die Determinante folgt formal in einem späteren Kapitel.

2.6Orthogonale Matrizen

2.6 Orthogonale Matrizen und Drehmatrizen

Stell dir vor, du drehst einen starren Körper im Raum: alle Längen und Winkel bleiben erhalten, nur die Orientierung ändert sich. Genau das tut eine orthogonale Matrix. Sie dreht (und spiegelt) den Raum, ohne ihn zu stauchen oder zu verzerren. Solche Matrizen sind die mathematische Beschreibung von Drehungen.

Definiert ist eine quadratische Matrix als orthogonal über die Bedingung ATA=InA^{\mathsf{T}} \cdot A = I_n (oft auch QTQ=IQ^{\mathsf{T}} Q = I geschrieben, mit QQ als üblichem Buchstaben für orthogonale Matrizen). Aus dieser einen Gleichung folgt sofort das Bequemste an orthogonalen Matrizen: ihre Inverse ist einfach die Transponierte, A1=ATA^{-1} = A^{\mathsf{T}}. Invertieren wird damit gratis, du musst die Matrix nur kippen.

Drei Eigenschaften fasst die Vorlesung als Theorem zusammen. (i) AA ist invertierbar mit A1=ATA^{-1} = A^{\mathsf{T}}. (ii) Das Produkt zweier orthogonaler Matrizen ist wieder orthogonal (zwei Drehungen hintereinander ergeben eine Drehung). (iii) Die Spalten (und ebenso die Zeilen) sind normiert (jeder hat Betrag 11) und stehen paarweise senkrecht aufeinander (ihr Skalarprodukt ist 00). Die Spalten bilden also eine Orthonormalbasis.

Das Standardbeispiel ist die Drehung um die x-Achse um den Winkel α\alpha. Allgemein gibt es im Raum drei Achsen-Drehmatrizen Rx,Ry,RzR_x, R_y, R_z und in der Ebene die Drehung R(α)R(\alpha) um den Ursprung. Den Winkel nennen wir durchgehend α\alpha (manche Texte schreiben ϕ\phi oder θ\theta, das ist dasselbe). Alle vier stehen unten; sie sind das Werkzeug, mit dem man in Grafik, Robotik und Mechanik Objekte dreht.

!!
Definition: orthogonale Matrix
ATA=InA^{\mathsf{T}} \cdot A = I_n
Auch als QTQ=IQ^{\mathsf{T}} Q = I. Aus dieser Bedingung folgt A1=ATA^{-1} = A^{\mathsf{T}}.
Theorem: Eigenschaften orthogonaler Matrizen
(i)    A1=AT(A ist invertierbar)(ii)    A,B orthogonal    AB orthogonal(iii)    Spalten/Zeilen normiert (Betrag 1),    paarweise senkrecht (Skalarprodukt 0)\begin{aligned} &\text{(i)}\;\; A^{-1} = A^{\mathsf{T}} \quad (A \text{ ist invertierbar}) \\ &\text{(ii)}\;\; A, B \text{ orthogonal} \;\Rightarrow\; A \cdot B \text{ orthogonal} \\ &\text{(iii)}\;\; \text{Spalten/Zeilen normiert (Betrag } 1\text{),} \\ &\qquad\;\; \text{paarweise senkrecht (Skalarprodukt } 0\text{)} \end{aligned}
(iii) heisst: die Spalten bilden eine Orthonormalbasis von Rn\mathbb{R}^n.
Drehung um die x-Achse im ℝ³
Rx(α)=(1000cos(α)sin(α)0sin(α)cos(α))R_x(\alpha) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & -\sin(\alpha) \\ 0 & \sin(\alpha) & \cos(\alpha) \end{pmatrix}
Die x-Achse bleibt fix (erste Zeile/Spalte ist die Standardbasis), die yz-Ebene dreht sich um den Winkel α\alpha.
Drehung in der Ebene und um die y- und z-Achse
R(α)=(cos(α)sin(α)sin(α)cos(α)),Ry(α)=(cos(α)0sin(α)010sin(α)0cos(α)),Rz(α)=(cos(α)sin(α)0sin(α)cos(α)0001)\begin{aligned} R(\alpha) &= \begin{pmatrix} \cos(\alpha) & -\sin(\alpha) \\ \sin(\alpha) & \cos(\alpha) \end{pmatrix}, \\ R_y(\alpha) &= \begin{pmatrix} \cos(\alpha) & 0 & \sin(\alpha) \\ 0 & 1 & 0 \\ -\sin(\alpha) & 0 & \cos(\alpha) \end{pmatrix}, \\ R_z(\alpha) &= \begin{pmatrix} \cos(\alpha) & -\sin(\alpha) & 0 \\ \sin(\alpha) & \cos(\alpha) & 0 \\ 0 & 0 & 1 \end{pmatrix} \end{aligned}
R(α)R(\alpha) dreht in der Ebene R2\mathbb{R}^2; Ry,RzR_y, R_z drehen um die jeweilige Achse im R3\mathbb{R}^3. Diese drei sind eine Ergänzung; in der Vorlesung erscheint nur RxR_x.

Wie Rₓ(α) wirkt, und warum sie orthogonal ist

  1. Schritt 1: zwei Testvektoren wählen
    Um den Effekt einer Matrix zu verstehen, schaut man, was sie mit den Basisvektoren macht.
    Wir nehmen den x-Einheitsvektor und den y-Einheitsvektor:
    a=(100),b=(010)\mathbf{a} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}, \qquad \mathbf{b} = \begin{pmatrix} 0 \\ 1 \\ 0 \end{pmatrix}
  2. Schritt 2: a liegt auf der Drehachse, bleibt fix
    a\mathbf{a} zeigt entlang der x-Achse, also der Drehachse selbst. Eine Drehung um die x-Achse lässt die x-Achse unberührt.
    aneu=Rx(α)a=(100)\mathbf{a}_{\text{neu}} = R_x(\alpha)\,\mathbf{a} = \begin{pmatrix} 1 \\ 0 \\ 0 \end{pmatrix}
  3. Schritt 3: b dreht sich in der yz-Ebene
    b\mathbf{b} steht senkrecht zur Achse, wird also tatsächlich gedreht. Genau hier tauchen cos(α)\cos(\alpha) und sin(α)\sin(\alpha) auf.
    bneu=Rx(α)b=(0cos(α)sin(α))\mathbf{b}_{\text{neu}} = R_x(\alpha)\,\mathbf{b} = \begin{pmatrix} 0 \\ \cos(\alpha) \\ \sin(\alpha) \end{pmatrix}
  4. Schritt 4: Orthogonalität nachrechnen
    Laut Definition ist RxR_x orthogonal, wenn RxTRx=I3R_x^{\mathsf{T}} R_x = I_3 gilt. Das prüfen wir direkt.
    Mit cos2(α)+sin2(α)=1\cos^2(\alpha) + \sin^2(\alpha) = 1 heben sich die gemischten Terme weg:
    Rx(α)TRx(α)=(1000cos(α)sin(α)0sin(α)cos(α))(1000cos(α)sin(α)0sin(α)cos(α))=I3R_x(\alpha)^{\mathsf{T}}\, R_x(\alpha) = \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & \sin(\alpha) \\ 0 & -\sin(\alpha) & \cos(\alpha) \end{pmatrix} \begin{pmatrix} 1 & 0 & 0 \\ 0 & \cos(\alpha) & -\sin(\alpha) \\ 0 & \sin(\alpha) & \cos(\alpha) \end{pmatrix} = I_3
Notation Notation: Q (orthogonal)
Übliches Symbol für eine orthogonale Matrix. Definiert durch QTQ=InQ^{\mathsf{T}} Q = I_n. In der Vorlesung heisst sie auch AA; beides meint dasselbe.
Formel Schlüsselformel
A1=AT(A orthogonal)A^{-1} = A^{\mathsf{T}} \quad (A \text{ orthogonal})
Bei orthogonalen Matrizen ist die Inverse einfach die Transponierte.
Merke Spalten = Orthonormalbasis
Die Spalten einer orthogonalen Matrix haben Betrag 11 und stehen paarweise senkrecht. Sie bilden eine Orthonormalbasis von Rn\mathbb{R}^n.
Notation Notation: Drehwinkel α
α\alpha ist der Drehwinkel. Manche Texte schreiben ϕ\phi oder θ\theta. Trigonometrische Funktionen immer mit Klammern: cos(α)\cos(\alpha), sin(α)\sin(\alpha).

2.7LR-Zerlegung

2.7.1 LR-Zerlegung: Kochrezept (PA = LR)

Muss man Ax=bA\mathbf{x} = \mathbf{b} für viele verschiedene rechte Seiten b\mathbf{b} lösen, ist es Verschwendung, jedes Mal die ganze Gauss-Elimination neu zu rechnen. Die LR-Zerlegung macht die Elimination ein einziges Mal und verwahrt das Ergebnis so, dass man es für jedes neue b\mathbf{b} wiederverwenden kann. Genau dafür ist sie gedacht.

Die Idee: für eine n×nn \times n-Matrix AA schreibt man die Beziehung PA=LRP A = L R. Dabei ist LL eine untere Dreiecksmatrix, RR eine obere Dreiecksmatrix und PP eine Permutationsmatrix, die nur die Zeilenvertauschungen protokolliert. Braucht man keine Vertauschungen, ist P=InP = I_n und es bleibt schlicht A=LRA = L R (so kürzt man es oft ab).

Das Kochrezept (siehe Lösungsweg) hat vier Schritte: InI_n und AA nebeneinanderschreiben, AA per Gauss auf Zeilenstufenform bringen, daraus LL, RR und PP ablesen, und schliesslich für ein gegebenes b\mathbf{b} erst Lc=PbL\mathbf{c} = P\mathbf{b} vorwärts und dann Rx=cR\mathbf{x} = \mathbf{c} rückwärts auflösen. Die durchgerechneten Beispiele dazu stehen in 2.8.

!!
Idee der LR-Zerlegung
PA=LR,L untere,    R obere Dreiecksmatrix,P Permutationsmatrix\begin{aligned} &P A = L R, \\ &L \text{ untere}, \;\; R \text{ obere Dreiecksmatrix}, \\ &P \text{ Permutationsmatrix} \end{aligned}
Ohne Zeilenvertauschungen ist P=InP = I_n, also A=LRA = L R. PP speichert nur, welche Zeilen getauscht wurden.

Kochrezept der LR-Zerlegung in vier Schritten

  1. Schritt 1: Iₙ und A nebeneinanderschreiben
    InI_n links dient als Notizspalte: dort sammeln wir später die Eliminationskoeffizienten (für LL) und die Vertauschungen (für PP).
    (In)  (A)\left(\, I_n \,\right)\;\left(\, A \,\right)
  2. Schritt 2: A per Gauss auf Zeilenstufenform bringen
    Die ZSF von AA ist genau die obere Dreiecksmatrix RR. Beim Eliminieren merken wir uns die verwendeten Koeffizienten.
    Wichtig: die Koeffizienten, mit denen die Pivotzeilen multipliziert werden, schreibt man immer als Subtraktion. Statt II+2III + 2\,I also II(2)III - (-2)\,I. Zeilen- oder Spaltenvertauschungen führt man an InI_n mit.
  3. Schritt 3: L, R und P ablesen
    Aus der Rechnung lassen sich die drei Faktoren direkt ablesen, ohne weitere Multiplikation.
    RR ist die ZSF-Matrix. LL hat auf der Diagonale lauter Einsen, und links der Diagonale die Koeffizienten aus Schritt 2. Die vertauschte InI_n ist die Permutationsmatrix PP.
  4. Schritt 4: für ein gegebenes b zweimal einsetzen
    Statt Ax=bA\mathbf{x} = \mathbf{b} direkt zu lösen, löst man zwei Dreieckssysteme, und Dreieckssysteme löst man bequem durch Einsetzen.
    Zuerst Lc=PbL\mathbf{c} = P\mathbf{b} mit Vorwärtseinsetzen (von oben nach unten), das liefert c\mathbf{c}. Dann Rx=cR\mathbf{x} = \mathbf{c} mit Rückwärtseinsetzen (von unten nach oben), das liefert die gesuchte Lösung x\mathbf{x}.
    Lc=Pb    vorwa¨rts    cRx=c    ru¨ckwa¨rts    x\begin{aligned} L\mathbf{c} &= P\mathbf{b} \;\;\xrightarrow{\text{vorwärts}}\;\; \mathbf{c} \\ R\mathbf{x} &= \mathbf{c} \;\;\xrightarrow{\text{rückwärts}}\;\; \mathbf{x} \end{aligned}
Notation Notation: L, R, P
LL = untere Dreiecksmatrix (Eliminationskoeffizienten, Diagonale 11). RR = obere Dreiecksmatrix (die ZSF). PP = Permutationsmatrix (Zeilenvertauschungen).
Formel Schlüsselformel
PA=LRP A = L R
Ohne Vertauschung P=InP = I_n, also A=LRA = L R. Dann Lc=PbL\mathbf{c}=P\mathbf{b} (vorwärts), Rx=cR\mathbf{x}=\mathbf{c} (rückwärts).
Prüfungstipp Prüfungstipp
Koeffizienten als Subtraktion eintragen (II(2)III - (-2)\,I), sonst stimmt das Vorzeichen in LL nicht.

2.8Beispiele

2.8.1 Beispiel: LR-Zerlegung ohne Permutation

Jetzt rechnen wir das Kochrezept aus 2.7 einmal komplett durch, an einem Fall ohne Zeilenvertauschungen (also P=I3P = I_3). Gesucht ist die Lösung von Ax=bA\mathbf{x} = \mathbf{b}. Achte beim Mitlesen besonders darauf, wie die Eliminationskoeffizienten aus der Reduktion direkt in LL landen.

Beispiel 26 (ohne Permutationen), komplett durchgerechnet

  1. Schritt 1: Aufgabe
    Wir wollen Ax=bA\mathbf{x} = \mathbf{b} über die LR-Zerlegung lösen, nicht durch direktes Gauss.
    Gegeben sind
    A=(2136110278),b=(102)A = \begin{pmatrix} 2 & -1 & -3 \\ 6 & 1 & -10 \\ -2 & -7 & 8 \end{pmatrix}, \qquad \mathbf{b} = \begin{pmatrix} 1 \\ 0 \\ 2 \end{pmatrix}
  2. Schritt 2: A auf Zeilenstufenform bringen, R ablesen
    Die ZSF von AA ist RR. Die Koeffizienten (immer als Subtraktion) merken wir uns für LL.
    Mit III(1)IIII - (-1)\,I und II3III - 3\,I, dann III(2)IIIII - (-2)\,II:
    A    II3I    III(1)I    (213041085)    III(2)II    R=(213041003)\begin{aligned} &A \;\xrightarrow[\;II - 3I\;]{\;III - (-1)I\;}\; \begin{pmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & -8 & 5 \end{pmatrix} \\ &\;\xrightarrow{\;III - (-2)II\;}\; R = \begin{pmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & 0 & 3 \end{pmatrix} \end{aligned}
  3. Schritt 3: L aus den Koeffizienten, P = I₃
    LL hat Diagonale 11 und trägt links der Diagonale die eben verwendeten Koeffizienten. Da wir nie Zeilen getauscht haben, ist PP die Einheitsmatrix.
    L=(100310121),P=I3=(100010001)L = \begin{pmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ -1 & -2 & 1 \end{pmatrix}, \qquad P = I_3 = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}
  4. Schritt 4: Lc = Pb vorwärts einsetzen
    Da P=I3P = I_3, ist Pb=bP\mathbf{b} = \mathbf{b}. Das System Lc=bL\mathbf{c} = \mathbf{b} ist unten-dreieckig, also von oben nach unten direkt auflösbar.
    Aus (100310121|102)\left(\begin{smallmatrix} 1 & 0 & 0 \\ 3 & 1 & 0 \\ -1 & -2 & 1 \end{smallmatrix} \,\middle|\, \begin{smallmatrix} 1 \\ 0 \\ 2 \end{smallmatrix}\right) folgt Zeile für Zeile c1=1c_1 = 1, c2=3c_2 = -3, c3=3c_3 = -3:
    c=(133)\mathbf{c} = \begin{pmatrix} 1 \\ -3 \\ -3 \end{pmatrix}
  5. Schritt 5: Rx = c rückwärts einsetzen, Lösung
    Rx=cR\mathbf{x} = \mathbf{c} ist oben-dreieckig, also von unten nach oben auflösbar. Das liefert die gesuchte Lösung x\mathbf{x}.
    Aus (213041003|133)\left(\begin{smallmatrix} 2 & -1 & -3 \\ 0 & 4 & -1 \\ 0 & 0 & 3 \end{smallmatrix} \,\middle|\, \begin{smallmatrix} 1 \\ -3 \\ -3 \end{smallmatrix}\right) folgt rückwärts x3=1x_3 = -1, x2=1x_2 = -1, x1=32x_1 = -\tfrac{3}{2}:
    x=(3211)\mathbf{x} = \begin{pmatrix} -\tfrac{3}{2} \\ -1 \\ -1 \end{pmatrix}
Merke Ohne Vertauschung
Hier ist P=I3P = I_3, also b\mathbf{b} unverändert. Erst Lc=bL\mathbf{c}=\mathbf{b} (vorwärts), dann Rx=cR\mathbf{x}=\mathbf{c} (rückwärts).
Querverweis Verweise
→ 2.7.1 Kochrezept

2.8.2 Beispiel: LR-Zerlegung mit Permutation

Was passiert, wenn oben links eine 00 steht? Dann gibt es dort kein Pivot, und wir müssen Zeilen tauschen, bevor wir eliminieren können. Genau dieser Tausch wird in der Permutationsmatrix PP festgehalten. Gesucht sind hier LL, RR und PP so, dass LR=PBL R = P B gilt.

Beispiel 27 (mit Permutationen), durchgerechnet

  1. Schritt 1: Aufgabe
    Wir suchen die LR-Zerlegung von BB. Schon der erste Blick zeigt das Problem: oben links steht eine 00.
    Gegeben ist
    B=(013376322)B = \begin{pmatrix} 0 & 1 & -3 \\ -3 & 7 & 6 \\ -3 & -2 & -2 \end{pmatrix}
  2. Schritt 2: Zeilentausch wegen Null-Pivot (I ↔ II)
    Mit einer 00 als Pivot kann man nicht eliminieren. Wir tauschen Zeile I und II, damit oben links ein Eintrag ungleich Null steht. Dieser Tausch wird PP.
    Danach eliminieren wir mit III1IIII - 1\,I und II0III - 0\,I, schliesslich III(9)IIIII - (-9)\,II:
    B    III    (376013322)    II0I    III1I    (376013098)    III(9)II    R=(3760130035)\begin{aligned} &B \;\xrightarrow{\;I \leftrightarrow II\;}\; \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ -3 & -2 & -2 \end{pmatrix} \\ &\;\xrightarrow[\;II - 0 I\;]{\;III - 1 I\;}\; \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ 0 & -9 & -8 \end{pmatrix} \\ &\;\xrightarrow{\;III - (-9)II\;}\; R = \begin{pmatrix} -3 & 7 & 6 \\ 0 & 1 & -3 \\ 0 & 0 & -35 \end{pmatrix} \end{aligned}
  3. Schritt 3: L und P ablesen
    LL trägt die Eliminationskoeffizienten (als Subtraktion) links der Diagonale; PP ist die Einheitsmatrix mit dem durchgeführten Zeilentausch IIII \leftrightarrow II.
    L=(100010191),P=(010100001)L = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 1 & -9 & 1 \end{pmatrix}, \qquad P = \begin{pmatrix} 0 & 1 & 0 \\ 1 & 0 & 0 \\ 0 & 0 & 1 \end{pmatrix}
Definition Permutationsmatrix
PP entsteht aus InI_n durch dieselben Zeilenvertauschungen, die man beim Eliminieren braucht. Hält fest, in welcher Reihenfolge die Zeilen stehen.
Merke Null-Pivot
Steht oben links (oder allgemein auf der Pivotposition) eine 00, muss eine Zeile getauscht werden. Der Tausch wandert in PP.

2.8.3 Beispiel: LR-Zerlegung mit Parameter (4×4)

Zum Abschluss zeigen wir, dass das Kochrezept unverändert funktioniert, auch wenn die Matrix einen Parameter aa enthält und 4×44 \times 4 gross ist. Es ändert sich nichts am Verfahren: Gauss bis zur Zeilenstufenform, Koeffizienten als Subtraktion in LL, und ablesen. Berechnet wird die LR-Zerlegung von AA.

Beispiel 28 (LR mit Parameter, 4×4), durchgerechnet

  1. Schritt 1: Aufgabe
    Wir wollen sehen, dass ein Parameter im Eintrag das Verfahren nicht stört, er wird einfach mitgeführt.
    Gegeben ist die 4×44 \times 4-Matrix
    A=(21124739681921136a6+5a)A = \begin{pmatrix} 2 & 1 & -1 & 2 \\ 4 & 7 & -3 & 9 \\ 6 & 8 & -1 & 9 \\ -2 & -11 & 3 - 6a & -6 + 5a \end{pmatrix}
  2. Schritt 2: auf Zeilenstufenform reduzieren, R ablesen
    Wie immer ist die ZSF die obere Dreiecksmatrix RR. Der Parameter aa läuft durch die Rechnung mit und landet im letzten Pivot.
    Mit III3IIII - 3\,I, IV+IIV + I, II2III - 2\,I, dann IIIIIIII - II, IV(2)IIIV - (-2)\,II, zuletzt IV(2a)IIIIV - (-2a)\,III ergibt sich
    A    R=(2112051500320006+a)A \;\longrightarrow\; R = \begin{pmatrix} 2 & 1 & -1 & 2 \\ 0 & 5 & -1 & 5 \\ 0 & 0 & 3 & -2 \\ 0 & 0 & 0 & 6 + a \end{pmatrix}
  3. Schritt 3: L aus den Koeffizienten, P = I₄
    LL sammelt die Eliminationskoeffizienten (mit dem Parameter aa im Eintrag unten); da keine Zeilen getauscht wurden, ist PP die Einheitsmatrix.
    L=(100021003110122a1),P=I4L = \begin{pmatrix} 1 & 0 & 0 & 0 \\ 2 & 1 & 0 & 0 \\ 3 & 1 & 1 & 0 \\ -1 & -2 & -2a & 1 \end{pmatrix}, \qquad P = I_4
Merke Parameter mitführen
Der Parameter aa wird wie eine normale Zahl behandelt. Er landet im letzten Pivot 6+a6+a von RR und im Eintrag 2a-2a von LL.

Aufgaben mit Musterlösungen

Aufgaben mit ausführlichen Musterlösungen folgen. Wir erfinden keine Übungen, sondern übernehmen sie aus dem Übungsmaterial, sobald sie aufbereitet sind.

Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.

MerkeErst selbst rechnen, dann Lösung prüfen!
Variablen-Glossar (12 Einträge)
ARm×nA \in \mathbb{R}^{m \times n} Matrix mit mm Zeilen und nn Spalten, Einträge reell. -
aij=(A)ija_{ij} = (A)_{ij} Eintrag in Zeile ii, Spalte jj. Merksatz: Zeile zuerst, Spalte zuletzt. -
InI_n Einheitsmatrix der Grösse nn: Einsen auf der Diagonale, sonst Null. Die „1" der Matrixwelt. -
00 Nullmatrix: alle Einträge sind Null. -
R/LR \,/\, L obere (rij=0r_{ij}=0 für i>ji>j) bzw. untere (lij=0l_{ij}=0 für i<ji<j) Dreiecksmatrix. -
DD Diagonalmatrix: nur die Diagonale ist besetzt. Gleichzeitig obere und untere Dreiecksmatrix. -
ATA^{\mathsf{T}} Transponierte: Zeilen und Spalten vertauscht, (AT)ij=aji(A^{\mathsf{T}})_{ij}=a_{ji}. Manche Texte schreiben AA^{\top}. -
A1A^{-1} Inverse der quadratischen Matrix AA: AA1=InA\cdot A^{-1}=I_n. Existiert nur, wenn AA invertierbar (regulär) ist. -
QQ übliches Symbol für eine orthogonale Matrix: QTQ=InQ^{\mathsf{T}}Q=I_n. Dreht und spiegelt, ohne Längen zu ändern. -
Rx(α)R_x(\alpha) Drehmatrix um die x-Achse um den Winkel α\alpha. Analog Ry(α)R_y(\alpha), Rz(α)R_z(\alpha), und R(α)R(\alpha) in der Ebene. -
PP Permutationsmatrix: speichert die Zeilenvertauschungen der LR-Zerlegung. Ohne Vertauschung ist P=InP=I_n. -
rang(A)\operatorname{rang}(A) Rang: Anzahl der Pivots in der Zeilenstufenform (siehe Kap. 1). -