“Ein Vektor ist nicht, was er ist, sondern was man mit ihm tun darf.”
— frei nach der Idee des abstrakten Vektorraums
Was haben Pfeile in der Ebene, Polynome wie und -Matrizen gemeinsam? Auf den ersten Blick nichts. Doch mit allen dreien darf man dasselbe tun: man kann zwei davon addieren und man kann eins mit einer Zahl strecken. Genau diese zwei Fähigkeiten machen aus einer Menge einen Vektorraum.
Halten wir das anschaulichste Beispiel fest, das du schon kennst: die Ebene . Ein Element ist ein Pfeil vom Ursprung zu einem Punkt . Zwei Pfeile addierst du, indem du sie aneinanderhängst (Spitze an Schaft). Einen Pfeil streckst du, indem du seine Länge mit einer Zahl multiplizierst; ist negativ, dreht er um. Beide Ergebnisse sind wieder Pfeile in der Ebene. Diese Abgeschlossenheit ist der ganze Kern der Idee.
Ein Vektorraum ist also eine Menge von Objekten, die wir Vektoren nennen, zusammen mit zwei Rechenoperationen: einer Addition (kombiniert zwei Vektoren zu einem dritten) und einer Skalarmultiplikation (kombiniert eine Zahl mit einem Vektor). Damit das Rechnen sich vernünftig verhält, müssen diese Operationen acht Regeln erfüllen, die wir gleich anschauen. Die Skalare nehmen wir aus den reellen Zahlen ; allgemein dürfen sie aus einem Körper kommen (etwa oder ). In Worten: ein Vektorraum ist eine Spielwiese, auf der Addieren und Strecken erlaubt sind und nie aus der Wiese hinausführen.
Welche Regeln muss das Addieren und Strecken genau erfüllen? Es sind acht Stück, und keine davon ist überraschend: jede ist eine Rechenregel, die du beim Vektorrechnen längst unbewusst benutzt. Wir gruppieren sie nach den zwei Operationen. Die ersten vier (A1 bis A4) betreffen nur die Addition, die letzten drei (M1 bis M3) die Skalarmultiplikation. Achtung: M2 fasst zwei Distributivgesetze in einer Zeile zusammen, deshalb sind es insgesamt acht Einzelregeln, nicht sieben.
Was ist alles ein Vektorraum? Sobald eine Menge mit sinnvoller Addition und Skalarmultiplikation ausgestattet ist und die acht Axiome erfüllt, ist sie einer. Hier sind die Standardbeispiele, die in jeder Prüfung auftauchen. Verschiedene Sprachen, gleiche Grammatik.
Der wichtigste ist der : alle Spaltenvektoren mit reellen Einträgen. Daneben der mit komplexen Einträgen und der Raum aller reellen -Matrizen (komponentenweise addiert und gestreckt). Spannender wird es bei , dem Raum aller Polynome vom Grad höchstens : zwei Polynome addiert man koeffizientenweise, und mit einer Zahl multiplizieren ändert nichts am Grad. Ein Polynom ist also ein Vektor, sobald man und darauf erklärt.
Funktionen liefern die letzten Beispiele: sind die auf dem Intervall stetigen Funktionen, die zusätzlich einmal stetig differenzierbaren. Auch sie bilden Vektorräume, denn die Summe zweier stetiger Funktionen ist stetig und ein Vielfaches ebenso. Ein Sonderfall: der Raum aller Polynome (ohne Gradschranke) ist unendlichdimensional; er besitzt kein endliches Erzeugendensystem, weil man für beliebig hohe Grade immer neue Bausteine braucht.
| Vektorraum | Elemente | Dimension |
|---|---|---|
| Spaltenvektoren mit reellen Einträgen | ||
| reelle -Matrizen | ||
| Polynome vom Grad | ||
| alle Polynome (jeder Grad) | ||
| stetige Funktionen auf |
Wann ist eine Teilmenge eines Vektorraums selbst wieder ein Vektorraum? Stell dir den vor und darin eine Ebene durch den Ursprung. Addierst du zwei Vektoren aus dieser Ebene, landest du wieder in der Ebene; streckst du einen, ebenso. Die Ebene ist ein Vektorraum im Vektorraum. Eine verschobene Ebene (die nicht durch den Ursprung geht) dagegen nicht: dort führt schon das Verdoppeln eines Vektors hinaus.
Eine nichtleere Teilmenge von heisst Unterraum, falls sie unter beiden Operationen abgeschlossen ist: (a) die Summe zweier Elemente von liegt wieder in , und (b) ein Vielfaches eines Elements von liegt wieder in . Mehr braucht man nicht zu prüfen; die acht Axiome erbt automatisch von . In Worten: ein Unterraum ist eine Teilmenge, aus der man durch Addieren und Strecken nicht herauskommt.
Zwei Folgerungen sind sofort wichtig. Erstens: jeder Unterraum enthält den Nullvektor (setze in (b) den Faktor ). Das liefert einen blitzschnellen Test. Zweitens: und selbst sind immer Unterräume von (die beiden „trivialen" Fälle).
Wenn du zwei Unterräume und desselben hast, wie kombinierst du sie zu einem neuen? Es gibt zwei natürliche Wege, und beide ergeben wieder einen Unterraum.
Der Durchschnitt besteht aus allen Vektoren, die in beiden Räumen liegen. Anschaulich: die gemeinsamen Vektoren. Die Summe besteht aus allen Vektoren, die sich als mit und schreiben lassen. Anschaulich: alles, was man durch Kombinieren je eines Vektors aus jedem Raum erreichen kann.
Vorsicht beim Wort „Summe": ist nicht etwa nur die Vereinigung der beiden Mengen. Die blosse Vereinigung wäre meist gar kein Unterraum (Summen über die Grenze hinweg fehlen). Erst indem man alle Summen zulässt, wird die Menge abgeschlossen und damit ein Unterraum.
Welche Vektoren kannst du aus gegebenen bauen, wenn du nur addieren und strecken darfst? Genau diese Frage beantworten Linearkombination und Span.
Eine Linearkombination der Vektoren ist jeder Vektor der Form mit Skalaren . Du gewichtest also jeden Baustein mit einer Zahl und summierst. Die Menge aller dieser Kombinationen heisst Span (oder lineare Hülle, oder erzeugter Unterraum): . Anschaulich: zwei Richtungspfeile im Raum spannen eine Ebene auf, drei unabhängige spannen den ganzen .
Wie prüft man, ob ein bestimmter Vektor im Span liegt? Man schreibt die als Spalten in eine Matrix und fragt, ob das lineare Gleichungssystem lösbar ist. Hat es eine Lösung , so sind die Komponenten von genau die gesuchten Gewichte, und ist eine Linearkombination der . So wird die Span-Frage zu einer Gauss-Rechnung, die du schon beherrschst.
Wann ist ein Vektor in einer Sammlung überflüssig? Anschaulich dann, wenn er keine neue Richtung beiträgt, weil er sich schon aus den anderen zusammenbauen lässt. In der Ebene heisst linear unabhängig: keine zwei Vektoren zeigen in dieselbe Richtung (keiner ist ein Vielfaches des anderen). Im Raum heisst es: die Vektoren liegen nicht alle in einer gemeinsamen Ebene. Sobald einer „in der Spur" der anderen liegt, sind sie abhängig.
Die saubere Definition macht aus „keine Richtung doppelt" eine Gleichung: heissen linear unabhängig, wenn das homogene System nur die triviale Lösung besitzt. Gibt es eine andere Lösung (mit mindestens einem ), so heissen sie linear abhängig; dann lässt sich ein Vektor durch die anderen ausdrücken. In Worten: unabhängig bedeutet, dass die einzige Art, den Nullvektor zu kombinieren, das Nichtstun ist.
Das verbindet sich direkt mit Kapitel 1: ist mit der Spaltenmatrix . Nur die triviale Lösung bedeutet trivialer Kern, und das bedeutet voller Spaltenrang. So gilt das Rang-Kriterium: (volle Spaltenzahl) ist gleichbedeutend mit linearer Unabhängigkeit der Spalten.
Unabhängigkeit gilt auch für Funktionen als Vektoren. So sind und in linear unabhängig: aus für alle folgt . Dagegen sind , , linear abhängig, denn das Additionstheorem liefert , also ist schon eine Kombination der beiden anderen.
Was ist die kleinste Menge von Vektoren, die einen ganzen Raum aufspannt? Zu wenige Vektoren erreichen nicht alles, zu viele enthalten Überflüssiges. Genau in der Mitte sitzt die Basis.
Ein Erzeugendensystem von ist eine Menge mit ; jeder Vektor lässt sich also aus ihnen kombinieren. Existiert ein endliches Erzeugendensystem, heisst endlichdimensional. Eine Basis ist ein Erzeugendensystem aus linear unabhängigen Vektoren, anschaulich: ein Koordinatensystem mit gerade genug Achsen, keine zu viel, keine zu wenig. Die Anzahl der Basisvektoren heisst Dimension und ist für jeden Raum eindeutig.
Hat die Dimension , so gilt eine handfeste Faustregel: mehr als Vektoren sind immer abhängig; weniger als sind nie erzeugend; und genau Vektoren sind genau dann unabhängig, wenn sie erzeugend sind. In diesem Fall bilden sie eine Basis. Bei Vektoren fallen die beiden Eigenschaften „unabhängig" und „erzeugend" also zusammen, du musst nur eine prüfen.
Für Vektoren fasst man die Lage in der Spaltenmatrix mit Rang zusammen. Die folgende Tabelle fasst das auf einen Blick zusammen.
| Eigenschaft | Bedingung am LGS | Rang |
|---|---|---|
| erzeugend | lösbar für alle | |
| linear unabhängig | nur trivial lösbar | |
| linear abhängig | hat nichttriviale Lösung | |
| Basis | beides zugleich, also |
Wie schreibst du denselben Vektor in einer anderen Basis? Denk an eine Adresse: derselbe Ort hat im einen Stadtplan andere Koordinaten als im anderen. Der Vektor bleibt, die Zahlen ändern sich mit dem gewählten Achsensystem.
Ist eine Basis von , so lässt sich jeder Vektor eindeutig als schreiben. Die eindeutig bestimmten Koeffizienten heissen Koordinaten von bezüglich . Anschaulich sind sie das Rezept: wie viel von jedem Basisvektor man nehmen muss. Man fasst sie zum Koordinatenvektor zusammen. Wichtig: diese Zahlen hängen von der Basiswahl ab, eine andere Basis liefert andere Koordinaten für denselben .
Wie lang ist ein Vektor, und was soll „lang" überhaupt heissen, wenn der Vektor ein Polynom oder eine Funktion ist? Im misst du die Pfeillänge mit Pythagoras. In einem abstrakten Vektorraum verallgemeinert die Norm diese Idee.
Eine Norm auf ist eine Abbildung , die jedem Vektor eine reelle Zahl (seine „Länge") zuordnet und drei Bedingungen erfüllt. (I) Positivität: die Länge ist nie negativ und genau dann null, wenn der Vektor der Nullvektor ist. (II) Homogenität: streckst du den Vektor um den Faktor , skaliert die Länge um . (III) Dreiecksungleichung: die Länge einer Summe ist höchstens die Summe der Längen.
Diese drei Forderungen sind genau das, was man intuitiv von „Länge" erwartet. Nichts kann negativ lang sein, doppelt so weit gestreckt ist doppelt so lang, und der direkte Weg ist nie länger als ein Umweg über einen dritten Punkt. Mehr steckt nicht dahinter.
Es gibt mehr als eine Art, Länge zu messen. Im sind drei Normen besonders gebräuchlich, und sie geben demselben Vektor verschiedene Längen, weil sie verschiedene Fragen beantworten.
Die euklidische Norm (oder -Norm) ist die gewohnte Pythagoras-Länge , die Luftlinie zum Punkt. Die Maximumsnorm (oder -Norm) nimmt einfach den betragsmässig grössten Eintrag, , also den grössten Einzelschritt. Dazwischen liegt die -Norm, die für in die Maximumsnorm übergeht und für die euklidische ist.
Auf endlichdimensionalen Vektorräumen sind all diese Normen äquivalent: zu je zwei Normen und gibt es eine Konstante , sodass . Sie unterscheiden sich also nur um konstante Faktoren; eine Folge, die in einer Norm gegen einen Grenzwert läuft, tut das auch in jeder anderen. (In unendlicher Dimension stimmt das nicht mehr, dort kann die Wahl der Norm alles ändern, dazu gleich.)
Ein Zahlbeispiel: für ist und . Derselbe Vektor, zwei verschiedene Längen, je nach gewählter Norm.
Wie misst man den Abstand zweier Funktionen? Auch Funktionen sind Vektoren (im Raum ), also brauchen sie eine Norm. Es gibt wieder mehrere natürliche Wahlen.
Die Maximumsnorm nimmt den grössten Funktionswert dem Betrag nach, den höchsten Ausschlag der Kurve. Die Integral--Norm mittelt dagegen über das ganze Intervall; sie ist gross, wenn die Funktion insgesamt viel Fläche unter sich hat. Beide messen „Grösse einer Funktion", aber verschieden.
Mit einer Norm wird der Satz „eine Folge nähert sich einem Grenzwert" präzise: eine Folge in konvergiert gegen , wenn der Abstand gegen null geht. Hier zeigt sich, warum die Norm-Wahl in unendlicher Dimension wichtig ist: dieselbe Funktionenfolge kann in der einen Norm konvergieren und in der anderen nicht.
Ein warnendes Beispiel: die Funktionenfolge auf konvergiert in der Maximumsnorm nicht gegen die Nullfunktion. Denn an der Stelle ist stets , also für jedes . Obwohl die Funktionen abseits der Null beliebig klein werden, bleibt die Spitze bei stehen, und die Maximumsnorm sieht genau diese Spitze.
Wie misst man den Winkel zwischen zwei Vektoren, und sogar zwischen zwei Polynomen? Die Norm gibt Längen, aber keine Winkel. Dafür braucht es ein neues Werkzeug: das Skalarprodukt. Es steckt den Winkel zwischen zwei Vektoren in eine einzige Zahl.
Ein Skalarprodukt auf einem reellen Vektorraum ist eine Abbildung , die jedem Paar von Vektoren eine reelle Zahl zuordnet und drei Bedingungen erfüllt: (I) Bilinearität (linear in jedem der beiden Argumente), (II) Symmetrie () und (III) positive Definitheit (, mit Gleichheit nur für ).
Im ist das Standardskalarprodukt die vertraute Komponentensumme . Es hängt mit Längen und Winkel über zusammen, wobei der Winkel zwischen den Vektoren ist. Daraus liest man beides ab: die Längen (über ) und den Winkel. Jedes Skalarprodukt erzeugt nämlich eine eigene Norm, die induzierte Norm . Umgekehrt kommt aber nicht jede Norm von einem Skalarprodukt.
Geht ein Skalarprodukt auch für Matrizen oder Funktionen? Ja, und genau das macht den abstrakten Begriff so nützlich: Winkel und Orthogonalität lassen sich überall erklären, wo man ein Skalarprodukt hat.
Im kann man das Standardprodukt mit einer Matrix verzerren: . Das ist genau dann ein Skalarprodukt, wenn symmetrisch und positiv definit ist (alle Eigenwerte ). Für Funktionen aus definiert das Funktionen-Skalarprodukt einen Winkel zwischen Kurven; man kann es zusätzlich mit einer Gewichtsfunktion versehen, etwa . Und auf dem Matrizenraum liefert die Spur das Spur-Skalarprodukt .
All diese Produkte erfüllen dieselben drei Axiome wie das Standardprodukt; nur die konkrete Rechenvorschrift unterscheidet sich. Damit gelten auch alle Folgesätze (Projektion, Cauchy-Schwarz, Pythagoras, Gram-Schmidt) unverändert in jedem dieser Räume.
Was heisst „senkrecht" im Vektorraum, und wie projiziert man einen Vektor auf einen anderen? Mit dem Skalarprodukt lässt sich beides sauber fassen, und es gelten dieselben Sätze, die du aus der ebenen Geometrie kennst.
Zwei Vektoren heissen orthogonal (Schreibweise ), wenn ihr Skalarprodukt verschwindet: . Die Orthogonalprojektion von auf einen Vektor ist derjenige Vielfache von , der am nächsten kommt: . Sie zerlegt in einen Anteil entlang (das ist ) und einen Rest senkrecht dazu. Genau diese Zerlegung steckt später hinter dem Gram-Schmidt-Verfahren.
Zwei klassische Ungleichungen begleiten das Skalarprodukt. Die Cauchy-Schwarz-Ungleichung beschränkt das Skalarprodukt durch die Längen (sie garantiert, dass wirklich zwischen und liegt). Und der Satz von Pythagoras gilt für orthogonale Vektoren: . Ein Vektor mit Länge heisst Einheitsvektor; jeden Vektor macht man durch Teilen durch seine Länge zu einem solchen.
Warum ist eine Basis aus lauter senkrechten Einheitsvektoren so angenehm? Stell dir kariertes Papier mit quadratischen Einheitskästchen vor, gegenüber einem schiefen, verzerrten Gitter. Auf dem karierten Papier liest man Koordinaten direkt ab; im schiefen Gitter muss man rechnen. Genau diesen Komfort liefert eine Orthonormalbasis.
Eine Orthonormalbasis (ONB) ist eine Basis aus paarweise orthogonalen Einheitsvektoren: je zwei verschiedene stehen senkrecht aufeinander, und jeder hat Länge . Solche Vektoren sind automatisch linear unabhängig und bilden eine Basis. Und zu jeder Basis gibt es eine Orthonormalbasis, die man mit dem Gram-Schmidt-Verfahren (nächster Abschnitt) konstruiert.
Der Hauptvorteil: in einer Orthonormalbasis sind die Koordinaten eines Vektors einfach seine Skalarprodukte mit den Basisvektoren, . Du musst kein lineares Gleichungssystem mehr lösen, um einen Vektor in der Basis darzustellen; ein Skalarprodukt pro Koordinate genügt. Das ist der Grund, warum man Orthonormalbasen überall bevorzugt, von der Fourier-Analysis bis zur Quantenmechanik.
Wie macht man aus irgendeiner Basis eine Orthonormalbasis? Das Gram-Schmidt-Verfahren ist das Rezept dafür. Die Grundidee in einem Satz: nimm der Reihe nach jeden Basisvektor, ziehe seine Schatten (Projektionen) auf alle schon fertigen Einheitsvektoren ab, und normiere den Rest auf Länge .
Das folgende Kochrezept arbeitet die Basis Schritt für Schritt ab. In jedem Schritt entsteht zuerst ein unnormierter Zwischenvektor (wir schreiben ihn mit Tilde, ), der senkrecht auf allen vorherigen steht, und danach der fertige Einheitsvektor .
Wie läuft Gram-Schmidt an echten Zahlen ab? Hier zwei vollständig durchgerechnete Beispiele, eines im mit dem Standardskalarprodukt, eines auf einem Polynomraum mit einem Integral-Skalarprodukt. Beide folgen exakt dem Kochrezept aus dem vorigen Abschnitt; nur die Rechenvorschrift für und ändert sich.
Auch auf dem Matrizenraum läuft das Verfahren identisch, mit dem Spur-Skalarprodukt . Orthonormalisiert man dort die Basis der symmetrischen Matrizen , , , so erhält man , und . Will man diese ONB des Unterraums der symmetrischen Matrizen zu einer ONB des ganzen ergänzen, fügt man eine normierte schiefsymmetrische Matrix hinzu, etwa ; sie steht automatisch senkrecht auf allen symmetrischen Matrizen.
Übungsaufgaben mit ausführlichen Musterlösungen werden hier ergänzt. Bis dahin lohnt es sich, die durchgerechneten Beispiele in den Abschnitten 4.2, 4.4.3 und 4.4.6 selbst nachzurechnen: das Unterraum-Kriterium an einer eigenen Teilmenge prüfen, eine Orthogonalprojektion bilden und eine kleine Basis mit Gram-Schmidt orthonormalisieren.
Die Aufgaben für dieses Kapitel werden in einer zukünftigen Version ergänzt.