Inhalt

18.7 Endlich erzeugte Moduln über Hauptidealringen *

Dieser Abschnitt ist, wie viele der Ergänzungen, etwas knapper geschrieben. Weiter unten finden Sie Literaturverweise, unter anderem für ausführlichere Darstellungen.

18.7.1 Moduln über Ringen

In der Definition eines Vektorraums wird nirgends benötigt, dass der Grundkörper tatsächlich ein Körper (und nicht einfach irgendein kommutativer Ring) ist. Da sich die analog definierten Objekte über beliebigen kommutativen Ringen zum Teil aber sehr anders verhalten als Vektorräume über Körpern, erhalten sie einen eigenen Namen.

Definition 18.75

Sei \(R\) ein kommutativer Ring. Ein \(R\)-Modul (oder: Modul über \(R\)) ist eine abelsche Gruppe \((M, +)\) zusammen mit einer Skalarmultiplikation

\[ \cdot \colon R\times M\to M, \]

so dass die folgenden Bedingungen erfüllt sind:

  1. Es gilt \((ab)m = a(bm)\) für alle \(a,b\in R\), \(m\in M\).

  2. Es gilt \(1\cdot m=m\) für alle \(m\in M\).

  3. Es gelten die Distributivgesetze

    \[ (a+b)m = am+bm,\quad a(m+m^\prime ) = am+am^\prime \quad \text{für alle}\ a,b\in R,\ m, m^\prime \in M. \]

Achtung: Es heißt der Modul (Plural: die Moduln) und das Wort Modul wird auf der ersten Silbe betont! (Also gerade anders als das Modul aus dem Modulhandbuch.)

Man kann auch Moduln über nicht notwendig kommutativen Ringen einführen (genauer unterscheidet man dann zwischen Linksmoduln und Rechtsmoduln). Das wollen wir aber an dieser Stelle nicht tun.

Beispiel 18.76
  1. Ist \(R\) ein Körper, so ist also ein \(R\)-Modul genau dasselbe wie ein \(R\)-Vektorraum.

  2. Sei \(R = \mathbb Z\). Ist \(M\) ein \(\mathbb Z\)-Modul, so ist \(M\) mit der Addition (wie jeder Modul über einem Ring) eine abelsche Gruppe. Ist andererseits \(M\) irgendeine abelsche Gruppe, so gibt es genau eine Möglichkeit, \(M\) mit einer Skalarmultiplikation

    \[ \mathbb Z\times M\to M \]

    zu versehen, so dass \(M\) damit (und mit der vorgegebenen Addition) zu einem \(\mathbb Z\)-Modul wird. In der Tat ergibt sich aus den Distributivgesetzen, dass

    \[ nm = m+\cdots + m \quad (n\ \text{Summanden}) \]

    für \(n\in \mathbb N\) und \(nm = -((-n)m)\) für \(n\in \mathbb Z_{\ge 0}\) gelten muss. Es ist leicht zu sehen, dass diese Vorschriften eine Skalarmultiplikation definieren.

    In diesem Sinne kann man sagen, dass ein \(\mathbb Z\)-Modul genau dasselbe ist wie eine (additiv geschriebene) kommutative Gruppe. (Auch die Begriffe des \(\mathbb Z\)-Modul-Homomorphismus (den wir als nächstes definieren) und des Gruppenhomomorphismus fallen dann zusammen.)

  3. Sei \(K\) ein Körper. Ist \(V\) ein \(K\)-Vektorraum und \(f\colon V\to V\) ein Endomorphismus, so können wir \(V\) wie folgt mit der Struktur eines \(K[X]\)-Moduls versehen: Die Addition ist die Vektorraumaddition, und die Skalarmultiplikation ist gegeben durch

    \[ \cdot \colon K[X] \times V\to V,\quad p\cdot v := p(f)(v). \]

    Insbesondere ist die Skalarmultiplikation mit dem Element \(X\in K[X]\) einfach gegeben durch Anwendung des fixierten Endomorphismus \(f\). Es ist leicht zu überprüfen, dass die Modulaxiome erfüllt sind.

    Ist andererseits \(M\) ein \(K[X]\)-Modul, so ist \(M\) erst recht ein \(K\)-Vektorraum (mit derselben Addition und indem wir die Skalarmultiplikation nur für Elemente aus \(K\) (aufgefasst als konstante Polynome) benutzen). Die Multiplikation mit dem Element \(X\in K[X]\) ist dann ein \(K\)-Vektorraum-Homomorphismus von \(M\).

    In diesem Sinne ist ein \(K[X]\)-Modul »dasselbe« wie ein \(K\)-Vektorraum zusammen mit einem Vektorraumendomorphismus.

    Diese Interpretation von Moduln über dem (Hauptideal-)Ring \(K[X]\) ermöglicht uns, nachdem wir die Theorie von Moduln über Hauptidealringen etwas weiter entwickelt haben werden, einen neuen Zugang zum Satz über die Jordansche Normalform.

Viele der Grundbegriffe der Vektorraumtheorie lassen sich übertragen:

Definition 18.77

Sei \(R\) ein kommutativer Ring und seien \(M\) und \(N\) Moduln über \(R\).

  1. Eine Abbildung \(f\colon M\to N\) heißt \(R\)-Modul-Homomorphismus, wenn \(f\) ein Gruppenhomomorphismus bezüglich der Addition ist und für alle \(a\in R\), \(m\in M\) gilt, dass \(f(am)=af(m)\) ist.

  2. Ein \(R\)-Modul-Isomorphismus ist ein \(R\)-Modul-Homomorphismus, der eine Umkehrabbildung besitzt, die ebenfalls ein \(R\)-Modul-Homomorphismus ist.

Wie im Fall von Vektorräumen überprüft man, dass jeder bijektive \(R\)-Modul-Homomorphismus ein Isomorphismus ist. Wir bezeichnen die Menge aller \(R\)-Modul-Homomorphismen von \(M\) nach \(N\) mit \(\operatorname{Hom}_R(M, N)\). Mit der üblichen Addition und Skalarmultiplikation für Abbildungen ist \(\operatorname{Hom}_R(M, N)\) ein \(R\)-Modul.

Definition 18.78

Seien \(R\) ein kommutativer Ring und \(M\) ein \(R\)-Modul. Eine Teilmenge \(N\subseteq M\) heißt Untermodul, wenn \(N\) eine Untergruppe von \(M\) bezüglich der Addition ist und \(an\in N\) für alle \(a\in R\), \(n\in N\) gilt.

Wie bei Gruppen und Vektorräumen bezeichnen wir mit \(\operatorname{Ker}(f) := f^{-1}(\{ 0\} )\) den Kern und mit \(\Im (f) = f(M)\) das Bild eines Modul-Homomorphismus \(f\colon M\to N\). In beiden Fällen handelt es sich um Untermoduln.

Der Durchschnitt einer Familie von Untermoduln eines Moduls ist wieder ein Untermodul. Damit können wir wie üblich den von einer Teilmenge erzeugten Untermodul definieren.

Definition 18.79

Seien \(R\) ein kommutativer Ring und \(M\) ein \(R\)-Modul.

  1. Ist \(X\subseteq M\) eine Teilmenge, so nennen wir

    \[ \langle X\rangle := \langle X\rangle _R :=\bigcap _{N \supseteq X} N, \]

    wobei der Durchschnitt über alle Untermoduln \(N\subseteq M\) genommen wird, die \(X\) enthalten, den von der Teilmenge \(X\) erzeugten Untermodul von \(M\).

    Dies ist der kleinste Untermodul von \(M\), der die Teilmenge \(X\) enthält.

  2. Der \(R\) Modul \(M\) heißt endlich erzeugt, wenn eine endliche Teilmenge \(X\subseteq M\) existiert mit \(\langle X\rangle _R =M\).

Beispiel 18.80

Sei \(R\) ein kommutativer Ring.

  1. Der Ring \(R\) ist ein \(R\)-Modul, wenn wir als Addition die Ringaddition und als Skalarmultiplikation die Ringmultiplikation verwenden.

  2. Eine Teilmenge \(\mathfrak a\subseteq R\) ist genau dann ein Ideal, wenn \(\mathfrak a\) ein Untermodul des \(R\)-Moduls \(R\) ist.

Bemerkung 18.81 Quotient eines Moduls nach einem Untermodul

Sei \(R\) ein kommutativer Ring. Sei \(M\) ein \(R\)-Modul und \(N\subseteq M\) ein Untermodul. Betrachten wir \(M\) und \(N\) als additive Gruppen, so haben wir den Gruppenquotienten \(\left.M\middle /N\right.\). Mit der folgenden (wohldefinierten!) Skalarmultiplikation können wir diesen zu einem \(R\)-Modul machen:

\[ R\times (\left.M\middle /N\right.)\to (\left.M\middle /N\right.),\quad (a, m+N)\mapsto (am)+N. \]

Die kanonische Projektion \(\pi \colon M\to \left.M\middle /N\right.\) ist dann ein \(R\)-Modul-Homomorphismus mit Kern \(N\). Der Homomorphiesatz gilt analog wie für Gruppen bzw. Vektorräume.

Bemerkung 18.82 Produkt und direkte Summe von Moduln

Seien \(R\) ein Ring, \(I\) eine Menge und \(M_i\), \(i\in I\), Moduln über \(R\). Wie für Vektorräume können wir die direkte Summe bzw. das Produkt der Familie \((M_i)_i\) von \(R\)-Moduln bilden.

  1. Das kartesische Produkt \(\prod _{i\in I} M_i\) ist mit der komponentenweisen Addition und Skalarmultiplikation ein \(R\)-Modul. Dieser \(R\)-Modul erfüllt die universelle Eigenschaft des Produkts, d.h. Morphismen von einem \(R\)-Modul \(N\) in das Produkt \(\prod _{i\in I} M_i\) entsprechen bijektiv Familien \(N\to M_i\) von Homomorphismen:

    \[ \operatorname{Hom}_R(N, \prod _i M_i) \stackrel{\sim }{\smash {\longrightarrow }\rule{0pt}{0.4ex}}\prod _i\operatorname{Hom}_R(N, M_i). \]

    Diese Bijektion ist gegeben durch \(f\mapsto (p_i\circ f)_i\), wobei \(p_j\colon \prod _i M_i\to M_j\) die Projektion auf den \(j\)-ten Faktor bezeichnet.

    Wir schreiben \(M^I := \prod _{i\in I} M\).

  2. Die Teilmenge \(\bigoplus _i M_i\subseteq \prod _i M_i\), die aus allen Elementen des Produkts besteht, in denen höchstens endlich viele Einträge von \(0\) verschieden sind, ist ein Untermodul, der als die direkte Summe der \(M_i\) bezeichnet wird. Zusammen mit den Inklusionen \(\iota _j \colon M_j\to \bigoplus _{i\in I} M_i\), \(m\mapsto (0,\dots , 0, m, 0, \dots , 0)\), erfüllt der \(R\)-Modul \(\bigoplus _i M_i\) die universelle Eigenschaft der direkten Summe, d.h. die Abbildung

    \[ \operatorname{Hom}_R(\bigoplus _i M_i, N)\stackrel{\sim }{\smash {\longrightarrow }\rule{0pt}{0.4ex}}\prod _i\operatorname{Hom}_R(M_i, N),\quad f\mapsto (f\circ \iota _i)_i, \]

    ist für alle \(R\)-Moduln \(N\) bijektiv.

    Wir schreiben \(M^{(I)} := \bigoplus _{i\in I} M\).

Definition 18.83

Sei \(R\) ein kommutativer Ring und sei \(M\) ein \(R\)-Modul. Wir nennen \(M\) einen freien Modul, wenn \(M\) zu einem Modul der Form \(R^{(I)}\) isomorph ist.

Ein wichtiger Spezialfall von freien Moduln sind die endlich erzeugten freien Moduln \(R^n\), \(n\in \mathbb N\).

Wie im Vektorraumfall nennen wir eine Familie \((b_i)_i\) eines \(R\)-Moduls \(M\) eine Basis von \(M\), wenn sich jedes Element von \(m\) mit eindeutig bestimmten Elementen \(a_i\in R\) (von denen höchstens endlich viele \(\ne 0\) sind) als Linearkombination \(m=\sum _i a_ib_i\) darstellen lässt. Die »Standardbasisvektoren« bilden dann eine Basis von \(R^{(I)}\). Daraus schließt man leicht den folgenden Satz.

Satz 18.84

Ein \(R\)-Modul besitzt genau dann eine Basis, wenn er frei ist.

Ist \(R\) ein Körper, so ist jeder \(R\)-Modul frei; dies ist der Satz, dass jeder Vektorraum über einem Körper eine Basis besitzt. (Ist andererseits \(R\) kein Körper, so existiert ein Ideal \(0\ne \mathfrak a\subsetneq R\) und dann ist der \(R\)-Modul \(\left.R\middle /\mathfrak a\right.\) nicht frei.)

Beispiel 18.85

Anders als im Vektorraumfall lässt sich nicht aus jedem Erzeugendensystem eine Basis auswählen: Zum Beispiel gilt für den (freien) \(\mathbb Z\)-Modul \(\mathbb Z\), dass \(\langle 2, 3\rangle = \mathbb Z\), aber \(\langle 2\rangle \ne \mathbb Z\), \(\langle 3\rangle \ne \mathbb Z\) und \(3\cdot 2 - 2\cdot 3 = 0\) ist, die Elemente \(2,3\in \mathbb Z\) sind »linear abhängig«.

Im \(\mathbb Z\)-Modul \(\left.\mathbb Z\middle /2\right.\) ist sogar das Element \(1\) »linear abhängig«, denn es gilt \(2\cdot 1 = 0\) in \(\left.\mathbb Z\middle /2\right.\). Dieser \(\mathbb Z\)-Modul besitzt keine Basis.

Weite Teile der Vektorraumtheorie lassen sich auf freie \(R\)-Moduln verallgemeinern. Wir können \(R\)-Modul-Homomorphismen \(R^n\to R^m\) durch Matrizen in \(M_{m\times n}(R)\) beschreiben. Entsprechend kann man nach Wahl von Basen der freien Moduln \(N\) und \(M\), also von Isomorphismen \(N\cong R^n\), \(M\cong R^m\), Homomorphismen \(N\to M\) durch Matrizen in \(M_{m\times n}(R)\) beschreiben.

Für freie Moduln ist der sogenannte Rang ein guter Ersatz für den Dimensionsbegriff, den wir für Vektorräume haben:

Satz 18.86

Sei \(R\ne 0\) ein kommutativer Ring. Ist \(M\) ein freier \(R\)-Modul, etwa \(M\cong R^{(I)}\), so ist die Kardinalität von \(I\) durch \(M\) eindeutig bestimmt. Man nennt diese den Rang des freien Moduls \(M\).

Beweis

Wir geben den Beweis hier in dem Fall, dass \(M\) endlich erzeugt ist. Siehe Bemerkung 18.87 für den allgemeinen Fall. Es ist leicht zu sehen, dass für endlich erzeugtes \(M\) die Menge \(I\) endlich sein muss. Es bleibt dann zu zeigen, dass ein \(R\)-Modul-Isomorphismus \(R^n\stackrel{\sim }{\smash {\longrightarrow }\rule{0pt}{0.4ex}}R^m\) nur für \(n=m\) existieren kann. Wir nehmen einen solchen Isomorphismus her und stellen ihn durch eine Matrix \(A\in M_{m\times n}(R)\) dar. Es existiert dann ein Umkehrhomomorphismus, den wir durch eine Matrix \(B\in M_{n\times m}(R)\) darstellen können. Es gilt also \(AB = E_m\) (und \(BA=E_n\)).

Sei nun \(\varphi \colon R\to K\) ein Ringhomomorphismus von \(R\) in einen Körper \(K\). Seien \(\varphi (A)\) und \(\varphi (B)\) die Matrizen, die aus \(A\) und \(B\) entstehen, indem wir auf jeden Eintrag \(\varphi \) anwenden. Es gilt dann \(\varphi (A)\varphi (B) = E_m\) und daraus folgt \(m=n\).

Um den Beweis abzuschließen, genügt es nun zu zeigen, dass zu jedem Ring \(R\ne 0\) überhaupt ein Homomorphismus in einen Körper existiert. Ist \(R\) ein Integritätsring, so können wir hier einfach die Einbettung von \(R\) in seinen Quotientenkörper verwenden. Im allgemeinen Fall benutzen wir Satz 18.134, den wir weiter unten beweisen werden.

Für nicht notwendig freie Moduln ist das Problem, einen vernünftigen »Rang« zu definieren, subtiler, und wir wollen dies hier nicht weiter erörtern.

Ein Homomorphismus \(R^n\to R^n\) ist genau dann ein Isomorphismus, wenn die zugehörige Matrix \(A\) invertierbar ist, wenn also \(B\in M_n(R)\) mit \(AB = BA = E_n\) existiert. Das ist genau dann der Fall, wenn die Determinante \(\det (A)\) eine Einheit von \(R\) ist, siehe Korollar 15.73, Ergänzung 15.74. Wir bezeichnen die Gruppe der invertierbaren \((n\times n)\)-Matrizen über \(R\) mit \(GL_n(R)\).

Nicht alle Eigenschaften von Vektorräumen übertragen sich aber auf freie Moduln! Man beachte zum Beispiel, dass im allgemeinen nicht jeder Untermodul eines freien Moduls selbst frei ist! Wenn \(R\) ein Hauptidealring ist, dann ist das aber richtig, und wir werden das für endlich erzeugte freie Moduln weiter unten zeigen (Lemma 18.96).

Bemerkung 18.87

Wie für Vektorräume kann man das Tensorprodukt \(M\otimes _R N\) von \(R\)-Moduln definieren (durch dieselbe universelle Eigenschaft) und konstruieren. Im Kontext von Moduln ist dieser Begriff noch um einiges nützlicher als bei Vektorräumen, wo sich der Gebrauch des Tensorprodukts eigentlich immer vermeiden lässt.

Wie bei Vektorräumen gelten die folgenden Eigenschaften des Tensorprodukts. Die Beweise kann man genau wie im Vektorraumfall führen.

Lemma 18.88

Seien \(R\) ein Ring und \(M\), \(N\), \(M^\prime \), \(M^{\prime \prime }\), \(M_i\), \(i\in I\), Moduln über \(R\). Dann hat man natürliche Isomorphismen

  1. \(M\otimes _RR \cong M\),

  2. \(M\otimes _RN\cong N\otimes _RM\),

  3. \((M\otimes _RM^\prime )\otimes _RM^{\prime \prime } \cong M\otimes _R(M^\prime \otimes _RM^{\prime \prime })\) (und analog für mehr Faktoren – Wir lassen daher die Klammern in solchen Tensorprodukten in der Regel weg. Diese Tensorprodukte erfüllen eine analoge universelle Eigenschaft für multilineare Abbildungen),

  4. \(\operatorname{Hom}_R(M\otimes M^\prime , N) \cong \operatorname{Hom}_R(M, \operatorname{Hom}_R(M^\prime , N))\),

  5. \(\left(\bigoplus _i M_i\right)\otimes _RN \cong \bigoplus _i (M_i\otimes _RN)\).

Wie im Vektorraumfall kann man auch das Tensorprodukt von Homomorphismen bilden.

Ist \(\varphi \colon R\to S\) ein Homomorphismus von kommutativen Ringen und \(M\) ein \(R\)-Modul, so können wir \(S\) als \(R\)-Modul auffassen (mit der Skalarmultiplikation \(r\cdot s:=\varphi (r)s\), wobei rechts die Multiplikation im Ring \(S\) verwendet wird) und das Tensorprodukt \(M\otimes _RS\) bilden. Dies ist ein \(R\)-Modul, den wir mittels

\[ s\cdot (m\otimes t) := m\otimes (st) \]

mit einer Skalarmultiplikation \(S\times (M\otimes _RS)\to M\otimes _RS\) versehen und so mit der Struktur eines \(S\)-Moduls ausstatten können. Wir nennen \(M\otimes _RS\) den \(S\)-Modul, der aus \(M\) durch Erweiterung der Skalare entsteht. Aus einem \(R\)-Modul-Homomorphismus \(f\colon M\to N\) erhalten wir durch \(m\otimes s\mapsto f(m)\otimes s\) einen \(S\)-Modul-Homomorphismus \(f_S\colon M\otimes _RS\to N\otimes _RS\). Diese Konstruktion ist kompatibel mit der Verkettung von Homomorphismen und mit dem üblichen Argument folgt, dass \(f_S\) ein Isomorphismus ist, wenn das für \(f\) gilt. Vergleiche Abschnitt 18.5.3, wo wir die analoge Konstruktion im Fall von Vektorräumen behandelt haben.

Als eine Anwendung können wir damit den Beweis von Satz 18.86 etwas verschlanken und (unter Annahme des Ergebnisses für Vektorräume, das wir in der Linearen Algebra 1 nur für Vektorräume endlicher Dimension bewiesen haben) auf den Fall von Moduln verallgemeinern, die nicht endlich erzeugt sind: Sei \(\varphi \colon R^{(I)}\stackrel{\sim }{\smash {\longrightarrow }\rule{0pt}{0.4ex}}R^{(J)}\) ein Isomorphismus von \(R\)-Moduln. Wir wollen zeigen, dass \(I\) und \(J\) dieselbe Mächtigkeit haben. Sei \(\varphi \colon R\to K\) ein Ringhomomorphismus von \(R\) in einen Körper \(K\); wir haben im Beweis von Satz 18.86 begründet, dass ein solcher Homomorphismus existiert. Dann erhalten wir durch Erweiterung der Skalare und mit Lemma 18.88 (5) einen Isomorphismus

\[ K^{(I)} \cong R^{(I)}\otimes _RK\cong R^{(J)}\otimes _RK \cong K^{(J)} \]

und es folgt aus der Dimensionstheorie für \(K\)-Vektorräume, dass \(I\) und \(J\) dieselbe Mächtigkeit haben.

18.7.2 Endlich erzeugte Moduln über Hauptidealringen

Die Theorie von (endlich erzeugten) Moduln über Hauptidealringen ist zwar schon deutlich komplizierter als die Theorie endlichdimensionaler Vektorräume über einem Körper, aber man kann wesentlich mehr sagen als im Fall eines beliebigen kommutativen Rings. Wir beweisen zunächst verschiedene Versionen des sogenannten Elementarteilersatzes und folgern daraus den »Hauptsatz für endlich erzeugte Moduln über Hauptidealringen«, der die Struktur solcher Moduln sehr präzise beschreibt. Danach diskutieren wir, wie man diese Ergebnisse (für den Hauptidealring \(K[X]\), \(K\) ein Körper) anwenden kann, um Normalformen von Vektorraumendomorphismen zu studieren.

Theorem 18.89 Elementarteilersatz, Matrixversion

Sei \(A\in M_{m\times n}(R)\). Dann existieren \(r \ge 0\), \(a_1,\dots , a_r\in R\setminus \{ 0\} \) und invertierbare Matrizen \(S \in GL_m(R)\), \(T\in GL_n(R)\), so dass

\[ SAT = \begin{pmatrix} \operatorname{diag}(a_1,\dots , a_r) & 0 \\ 0 & 0 \end{pmatrix}\in M_{m\times n}(R) \]

und

\[ a_1\mid a_2\mid \cdots \mid a_r \]

gilt.

Dabei ist \(r\) eindeutig bestimmt (als der Rang von \(A\) über dem Quotientenkörper von \(R\)), und \(a_1,\dots , a_r\) sind eindeutig bestimmt bis auf Assoziiertheit. Die Elemente \(a_i\) heißen die Elementarteiler der Matrix \(A\) (auch wenn sie nur bis auf Assoziiertheit bestimmt sind).

Wir verschieben den Beweis des Theorems auf Abschnitt 18.7.3 und leiten erst einige Folgerungen daraus ab. Das nächste Theorem ist fast nur eine Umformulierung des vorherigen. Wir sehen insbesondere, dass jeder Untermodul eines endlich erzeugten freien \(R\)-Moduls selbst frei ist. Ohne die Voraussetzung, dass \(R\) ein Hauptidealring sei, gilt diese Aussage nicht.

Theorem 18.90 Elementarteilersatz, Untermodulversion

Sei \(M\) ein endlich erzeugter freier \(R\)-Modul und sei \(M^\prime \subseteq M\) ein Untermodul.

Dann existieren eine Basis \(b_1,\dots , b_m\) von \(M\), \(r\ge 0\) und Elemente \(a_1,\dots , a_r\in R\), so dass \(a_1b_1, \dots , a_rb_r\) eine Basis von \(M^\prime \) bilden und so dass

\[ a_1\mid a_2\mid \cdots \mid a_r \]

gilt.

Dabei ist \(r\) eindeutig bestimmt, und \(a_1,\dots , a_r\) sind eindeutig bestimmt bis auf Assoziiertheit. Die Elemente \(a_i\) heißen die Elementarteiler des Untermoduls \(M^\prime \) von \(M\).

Beweis

Weil \(M\) frei und endlich erzeugt ist, existiert ein Isomorphismus \(M\cong R^m\). Wir benutzen diesen, um im folgenden \(M\) und \(R^m\) zu identifizieren.

Wir zeigen in Lemma 18.96 unten, dass \(M^\prime \) endlich erzeugt ist (und auch schon, dass \(M^\prime \) frei ist). Es existieren daher \(n\ge 0\) und ein \(R\)-Modul-Homomorphismus \(R^n \to R^m (=M)\) mit Bild \(M^\prime \). Bezüglich der Standardbasen von \(R^n\) und \(R^m\) können wir diesen Homomorphismus durch eine Matrix \(A\in M_{m\times n}(R)\) beschreiben.

Der Elementarteilersatz in der Form von Theorem 18.89 zeigt, dass invertierbare Matrizen \(S\in GL_m(R)\) und \(T\in GL_n(R)\) und \(a_i\in R\) existieren, so dass \(SAT\) die in Theorem 18.89 angegebene Form hat und die \(a_i\) die dort (und im hier zu beweisenden Theorem) angegebenen Teilbarkeitsbeziehungen erfüllen.

Das Bild von \(SAT\) ist dann der Untermodul \(\langle a_1 e_1,\dots , a_r e_r\rangle \), und ist andererseits gleich \(SM^\prime \). Wir setzen nun \(b_i := S^{-1}e_i\), \(i=1, \dots , m\), und erhalten so eine Basis \(b_1,\dots , b_m\) von \(R^m\) mit \(M^\prime = \langle a_1 b_1,\dots , a_r b_r\rangle \).

Die Eindeutigkeitsaussage kann man aus der Eindeutigkeitsaussage in Theorem 18.91 folgern; wir lassen die Details hier aus.

Theorem 18.91 Hauptsatz über endlich erzeugte Modul über Hauptidealringen

Seien \(R\) ein Hauptidealring und \(M\) ein endlich erzeugter \(R\)-Modul. Dann existieren eindeutig bestimmte Zahlen \(k, r\ge 0\) und eindeutig bestimmte Ideale

\[ R\ne \mathfrak a_1 \supseteq \cdots \supseteq \mathfrak a_k \ne 0 \]

von \(R\), so dass

\[ M \cong R^r \oplus \bigoplus _{i=1}^k \left.R\middle /\mathfrak a_i\right. \]

ist.

Beweis

Weil \(M\) endlich erzeugt ist, existiert ein surjektiver Homomorphismus \(f\colon R^n\to M\) von \(R\)-Moduln. Der Kern \(M^\prime := \operatorname{Ker}(f)\) dieses Homomorphismus ist ein Untermodul des endlich erzeugten freien \(R\)-Moduls \(R^n\) und wir können den Elementarteilersatz in der Form von Theorem 18.90 anwenden. Es existieren folglich eine Basis \(b_1,\dots , b_n\) von \(R^n\), \(s\ge 0\) und \(a_1,\dots , a_s\in R\) mit \(a_i \mid a_{i+1}\) für alle \(i\), so dass \(a_1 b_1,\dots , a_sb_s\) eine Basis von \(\operatorname{Ker}(f)\) ist. Es folgt damit

\[ M \cong \left.R^n\middle /\operatorname{Ker}(f)\right. \cong \bigoplus _{i=1}^s \left.R\middle /(a_i)\right. \oplus R^{n-s}. \]

Ist \(a_i\) eine Einheit von \(R\), so ist \(\left.R\middle /(a_i)\right. = 0\). Diese Summanden können wir in der obigen Darstellung von \(M\) folglich genausogut weglassen. Insgesamt bekommen wir damit eine Darstellung der gewünschten Form.

Um die Eindeutigkeit zu beweisen, muss man noch ein bisschen mehr arbeiten. Wir verschieben den Beweis auf Abschnitt 18.7.4.

Mit dem chinesischen Restsatz, Satz 18.36, können wir die Quotienten \(\left.R\middle /(a_i)\right.\) als direkte Summen von Quotienten von \(R\) nach solchen Idealen zerlegen, die von der Potenz eines Primelements erzeugt werden. Damit erhalten wir das folgende Korollar:

Korollar 18.92

Seien \(R\) ein Hauptidealring und \(M\) ein endlich erzeugter \(R\)-Modul. Dann existieren natürliche Zahlen \(r, l\ge 0\), (nicht notwendig verschiedene) Primelemente \(\pi _1,\dots , \pi _l\) von \(R\) sowie natürliche Zahlen \(n_1, \dots , n_l\), so dass

\[ M \cong R^r \oplus \bigoplus _{i=1}^l \left.R\middle /(\pi _i^{n_i})\right. \]

ist. Dabei sind \(r\) und \(l\) eindeutig bestimmt, und die Paare \((\pi _i, n_i)\) sind eindeutig bestimmt bis auf die Reihenfolge und die Ersetzung der jeweiligen Primelemente durch dazu assoziierte Elemente.

Beweis

Die Existenz dieser Zerlegung folgt, wie schon bemerkt, aus dem chinesischen Restsatz. Die Eindeutigkeit folgt aus der Eindeutigkeitsaussage von Theorem 18.91.

Speziell für den Fall \(R=\mathbb Z\) erhalten wir die Klassifikation der endlich erzeugten abelschen Gruppen (denn wie oben bemerkt, Beispiel 18.76, sind \(\mathbb Z\)-Moduln »dasselbe« wie abelsche Gruppen).

Korollar 18.93 Hauptsatz über endlich erzeugte abelsche Gruppen

Sei \(G\) eine endlich erzeugte abelsche Gruppe.

  1. Es existieren eindeutig bestimmte natürliche Zahlen \(r, k\ge 0\) und \(a_1, \dots , a_k {\gt} 1\) mit \(a_1 \mid a_2\mid \cdots \mid a_k\), so dass

    \[ G\cong \mathbb Z^r\oplus \bigoplus _{i=1}^k \left.\mathbb Z\middle /a_i\right. \]

    ist.

  2. Es existieren natürliche Zahlen \(r, l\ge 0\) und (nicht notwendig verschiedene) Primzahlen \(p_1,\dots , p_l\) und natürliche Zahlen \(n_1,\dots , n_l \ge 1\), so dass

    \[ G\cong \mathbb Z^r\oplus \bigoplus _{i=1}^l \left.\mathbb Z\middle /p_i^{n_i}\right. \]

    ist. Dabei sind \(r\) und \(l\) eindeutig bestimmt und die Paare \((p_i, n_i)\) eindeutig bestimmt bis auf die Reihenfolge.

Die Gruppe \(G\) ist genau dann endlich, wenn \(r=0\) ist.

Korollar 18.94

Sei \(b\in R^n\). Dann sind äquivalent:

  1. Die Einträge von \(b\) haben größten gemeinsamen Teiler \(1\).

  2. Der Vektor \(b\) kann zu einer Basis von \(R^n\) ergänzt werden.

Beweis

Für die Implikation (i) \(\Rightarrow \) (ii) wende den Elementarteilersatz auf den Untermodul \(\langle b\rangle \subseteq R^n\) an. Die andere Implikation ist einfach.

18.7.3 Beweis des Elementarteilersatzes

Wir beginnen mit einigen Vorbereitungen.

Lemma 18.95

Sei \(R\) ein Hauptidealring und sei \(\mathscr M\) eine nicht-leere Menge von Idealen von \(R\). Dann existiert ein Element \(\mathfrak a\in \mathscr M\), das unter allen Idealen in \(\mathscr M\) maximal bezüglich der Inklusion ist.

Beweis

Man kann dieses Lemma formal (mit Hilfe des Lemmas von Zorn) aus Lemma 15.46 folgern. Die Aussage gilt in jedem noetherschen Ring. Andererseits ist jeder Ring, in dem diese Aussage gilt, noethersch, denn eine aufsteigende Kette von Idealen, die ein maximales Element enthält, ist stationär.

Im Fall von Hauptidealringen ist es aber auch leicht, die Aussage direkt (ohne das Zornsche Lemma) zu beweisen. Sei \(\mathscr M\) gegeben, und sei \((a)\in \mathscr M\). Die Ideale in \(R\), die \((a)\) enthalten, sind genau die Ideale, die von Teilern von \(a\) erzeugt werden. Da \(a\) nur endlich viele Teiler hat, gibt es nur endlich viele solche Ideale in \(R\), insbesondere also nur endlich viele Elemente von \(\mathscr M\), die das Ideal \((a)\) enthalten. Es ist klar, dass diese endliche partiell geordnete Menge ein maximales Element enthält, und dies ist gleichzeitig ein maximales Element von \(\mathscr M\).

Sei \(R\) ein Hauptidealring. Ein Untermodul \(I\subseteq R\) ist nichts anderes als ein Ideal, also ein Hauptideal \(I=(a)\). Ist \(I\ne 0\), so ist die Abbildung \(R\to I\), \(x\mapsto xa\), ein \(R\)-Modul-Isomorphismus. Jeder Untermodul von \(R\) ist also frei. Diese Tatsache können wir folgendermaßen verallgemeinern.

Lemma 18.96

Seien \(R\) ein Hauptidealring und \(M\) ein freier \(R\)-Modul. Dann ist jeder Untermodul \(N\subseteq M\) ebenfalls frei und endlich erzeugt.

Beweis

Wir führen Induktion nach \(m:=\operatorname{rg}(M)\). Hat \(M\) Rang \(0\), so ist \(M=0\) und es ist nichts zu zeigen. Sei nun \(M \ne 0\) und sei \(b_1,\dots , b_m\) eine Basis von \(M\). Sei \(p\colon M\to R\) die Projektion auf die \(m\)-te Koordinate bezüglich dieser Basis, d.h. \(p\left(\sum _{i=1}^m a_ib_i \right) = a_m\). Wir setzen

\[ N^\prime = N \cap \langle b_1,\dots , b_{m-1}\rangle = \operatorname{Ker}(p_{|N}),\quad N^{\prime \prime } = p(N). \]

Nach Induktionsvoraussetzung ist \(N^\prime \) als Untermodul des freien \(R\)-Moduls \(\langle b_1,\dots , b_{m-1}\rangle \) vom Rang \(m-1\) ein freier endlich erzeugter \(R\)-Modul. Ebenso ist \(N^{\prime \prime }\) ein freier \(R\)-Modul, denn es handelt sich um einen Untermodul von \(R\), also um ein Hauptideal. Es genügt daher, die folgende Behauptung zu zeigen:

Behauptung. Die \(R\)-Moduln \(N\) und \(N^\prime \oplus N^{\prime \prime }\) sind isomorph.

Begründung. Wenn \(N^{\prime \prime } = 0\) ist, dann gilt \(N\subseteq \ker (p)\), also \(N=N^\prime \) und die Sache ist klar. Andernfalls ist \(N^{\prime \prime }\) frei vom Rang \(1\); sei \(a\in N^{\prime \prime }\) eine Basis. Wir erhalten einen Homomorphismus \(s\colon N^{\prime \prime }\to N\), \(s(xa) = xb_m\) (für \(x\in R\)), für den \(p\circ s = \operatorname{id}_{N^{\prime \prime }}\) gilt.

Wir geben nun zueinander inverse Homomorphismen zwischen \(N\) und \(N^\prime \oplus N^{\prime \prime }\) an. Und zwar definieren wir

\[ N\to N^\prime \oplus N^{\prime \prime },\quad n\mapsto (n - s(p(n)), p(n)), \]

und

\[ N^\prime \oplus N^{\prime \prime } \to N,\quad (n^\prime , n^{\prime \prime })\mapsto n^\prime + s(n^{\prime \prime }). \]

Es ist klar, dass diese Abbildungen linear sind, und man rechnet direkt nach, dass sie zueinander invers sind.

Beweis der Eindeutigkeitsaussage von Theorem 18.89

Es ist klar, dass \(r\) der Rang der Matrix \(A\) (verstanden als Matrix mit Einträgen im Quotientenkörper \(\operatorname{Quot}(R)\) von \(R\)) ist, denn dieser Rang verändert sich nicht bei Multiplikation mit Matrizen in \(GL(R)\subseteq GL(\operatorname{Quot}(R))\).

Wir können außerdem die Produkte \(a_1\cdot \cdots \cdot a_i\) folgendermaßen in Termen der Matrix \(A\) charakterisieren. Daraus folgt, dass diese Produkte – und damit auch die \(a_i\) selbst – durch \(A\) eindeutig bis auf Assoziiertheit bestimmt sind. Dazu verwenden wir die folgende Sprechweise: Ein \(i\)-Minor von \(A\) ist die Determinante einer \((i\times i)\)-Matrix, die aus \(A\) durch Weglassen von \(m-i\) Zeilen und \(n-i\) Spalten entsteht. Die \(1\)-Minoren sind gerade die Einträge von \(A\). Sei \(\mathfrak m_i(A)\subseteq R\) das von allen \(i\)-Minoren von \(A\) erzeugte Ideal.

Behauptung. Seien \(S\), \(T\) und \(a_1,\dots , a_r\) wie in Theorem 18.89 Dann ist das Produkt \(a_1\cdot \cdots \cdot a_i\) (\(i=1,\dots , r\)) ein Erzeuger des Ideals \(\mathfrak m_i(A)\), mit anderen Worten ein größter gemeinsamer Teiler aller \(i\)-Minoren von \(A\).

Begründung. Es ist klar, dass die Aussage für die Matrix \(SAT\) gilt. Es genügt daher zu zeigen, dass für alle \(A\in M_{m\times n}(R)\) und alle invertierbaren Matrizen \(B\in GL_m(R)\), \(C\in GL_n(R)\) gilt:

\[ \mathfrak m_i(BAC) = \mathfrak m_i(A). \]

Weil \(A = B^{-1}(BAC)C^{-1}\) gilt, genügt es aus Symmetriegründen, die Inklusion \(\mathfrak m_i(BAC)\subseteq \mathfrak m_i(A)\) zu zeigen.

Für \(i=1\) ist das klar. Für \(i {\gt} 1\) lässt sich die Aussage auch einigermaßen leicht »nachrechnen«, indem man die Multilinearität der Determinante in Zeilen und Spalten ausnutzt. Für ein systematischeres Argument kann man die gegebenen Matrizen über dem Quotientenkörper von \(R\) betrachten und die Theorie der äußeren Potenzen benutzen (oder diese Theorie auf den Fall von freien \(R\)-Moduln übertragen). Betrachten wir \(A\), \(B\), \(C\) als Darstellungsmatrizen von linearen Abbildungen bezüglich der jeweiligen Standardbasen, und betrachen wir auf \(\bigwedge \nolimits ^i \operatorname{Quot}(R)^m\) und \(\bigwedge \nolimits ^i \operatorname{Quot}(R)^n\) die Basen, die wir mit Satz 18.70 aus den Standardbasen erhalten, so sind die Einträge der Darstellungsmatrizen der Abbildungen \(\bigwedge \nolimits ^i A\), \(\bigwedge \nolimits ^i B\), \(\bigwedge \nolimits ^i C\) gerade die \(i\)-Minoren der Matrizen \(A\), \(B\), \(C\). Aus der Verträglichkeit der äußeren Potenz von Abbildungen mit der Verkettung von Abbildungen folgt

\[ \bigwedge \nolimits ^i B \, \cdot \, \bigwedge \nolimits ^iA\, \cdot \, \bigwedge \nolimits ^i C = \bigwedge \nolimits ^i (BAC), \]

und zwar sowohl im Sinne von Abbildungen (also mit \(\circ \) anstelle von \(\cdot \)) als auch im Sinne von Matrizen. Damit haben wir die Aussage \(\mathfrak m_i(BAC)\subseteq \mathfrak m_i(A)\) für allgemeines \(i\) auf den Fall \(i=1\) zurückgeführt.

Wir erklären für die Existenzaussage jetzt zuerst einen Beweis speziell für euklidische Ringe. Ist \(R\) euklidisch, dann ist der Beweis des Theorems einfacher und man kann ein explizites Verfahren angeben, wie man die Zahlen \(a_i\) bestimmt. Da der Polynomring in einer Unbestimmten über einem Körper euklidisch ist, ist dieser Fall für die Normalformentheorie für Endomorphismen von endlichdimensionalen Vektorräumen, wie sie in Abschnitt 18.7.5 und den folgenden Abschnitten entwickelt wird, ausreichend. Sie können diesen Beweis aber auch überspringen; der Beweis für allgemeine Hauptidealringe ist davon unabhängig.

Beweis der Existenzaussage von Theorem 18.89 für euklidische Ringe

Wir bezeichnen mit \(\delta \) eine Gradfunktion des euklidischen Rings \(R\).

Ist \(A=(a_{ij})_{i,j}\) die Nullmatrix, so ist nichts zu tun, wir nehmen daher \(A\ne 0\) an. Wir schreiben dann

\[ \Delta (A) := \min \{ \delta (a_{ij});\ a_{ij}\ne 0,\ i=1,\dots , m,\ j=1,\dots , n\} . \]

Und zwar kann man in den folgenden Schritten die gegebene Matrix \(A\) auf die Form \(\begin{pmatrix} d & 0 \\ 0 & A^\prime \end{pmatrix}\) für eine Matrix \(A^\prime \in M_{(m-1)\times (n-1)}(R)\) bringen, deren Einträge alle von \(d\) geteilt werden. Alle Schritte entsprechen der Multiplikation mit invertierbaren Matrizen von links und/oder rechts. Jedes Mal, wenn man zu einem vorherigen Schritt zurückspringt, verringert sich die natürliche Zahl \(\Delta (A)\). Das kann daher nur endlich oft geschehen; es ist also sichergestellt, dass der Algorithmus irgendwann abbricht. Ist \(A^\prime \) die Nullmatrix, so sind wir fertig. Ansonsten kann man induktiv fortfahren und \(A^\prime \) nach demselben Verfahren umformen. Die erste Zeile und erste Spalte werden dadurch nicht mehr verändert.

Es sind die folgenden Schritte durchzuführen:

  1. Nach geeigneten Zeilen- und Spaltenvertauschungen können wir \(\Delta (A) = \delta (a_{11})\) annehmen. Wir bringen also einen Eintrag mit minimalen Grad nach oben links.

  2. Wenn die Einträge der ersten Zeile in den Spalten \(2\) bis \(n\) durch \(a_{11}\) teilbar sind, können wir sie durch Addition geeigneter Vielfacher der ersten Spalte auf Null bringen. Gibt es einen Eintrag, der nicht durch \(a_{11}\) teilbar ist, so können wir unter Ausnutzung der Division mit Rest durch Addition eines geeigneten Vielfachen der ersten Spalte zu dieser Spalte einen Eintrag \(a\) produzieren, für den \(\delta (a) {\lt} \delta (a_{11})\) gilt. In diesem Fall springe zurück zu Schritt (1). Nach endlich vielen Schritten erreichen wir so, dass die Einträge der ersten Zeile in den Spalten \({\gt} 1\) gleich Null sind.

    Danach verfahren wir analog, um auch die Einträge der ersten Spalte in den Zeilen \(2\) bis \(m\) auf Null zu bringen. (Analog wie vorher springen wir gegebenenfalls wieder zu Schritt (1) zurück und beginnen, falls nötig, wieder damit, die neu entstandenen Einträge in Zeile \(1\) und Spalten \({\gt} 1\) auf Null zu bringen.)

  3. Nach Abschluss von Schritt (2) haben wir die gegebene Matrix auf die Form \(A_1=\begin{pmatrix} a_{11} & 0 \\ 0 & A^\prime \end{pmatrix}\) gebracht, allerdings sind nicht unbedingt alle Einträge von \(A^\prime \) durch \(a_{11}\) teilbar. Ist das der Fall, so sind wir schon fertig. Andernfalls können wir durch Addition einer geeigneten Zeile zur ersten Zeile einen Eintrag in die erste Zeile bringen, der nicht durch \(a_{11}\) teilbar ist und dann ähnlich wie vorher durch eine geeignete Spaltenumformung einen Eintrag \(a\) mit \(\delta (a) {\lt} \Delta (A_1)\) produzieren. Danach springen wir wieder zu Schritt (1).

Beweis von Theorem 18.89

Wir wissen bereits aus dem Beweis der Eindeutigkeitsaussage, dass der erste Elementarteiler \(a_1\) ein größter gemeinsamer Teiler aller Einträge der Matrix \(A\) sein muss. Ist \(u\) die erste Zeile der gesuchten Matrix \(S\) und \(b\) die erste Spalte von \(T\), so muss \(uAb = d\) gelten, und im ersten Teil des Beweises werden wir Vektoren \(u\) und \(b\) mit diesen Eigenschaften konstruieren. Wir können die zu findenden Matrizen \(S\) und \(T\) als Basiswechselmatrizen betrachten; wir benutzen diese Interpretation und zeigen im zweiten Teil des Beweises, dass \(b\) zu einer Basis von \(R^n\) fortgesetzt werden kann, und dass eine invertierbare Matrix \(S\) mit erster Zeile \(u\) existiert, so dass die Abbildung \(x\mapsto Ax\) bezüglich der entsprechenden Basen durch eine Matrix der angegebenen einfachen Form dargestellt wird.

Wir führen Induktion nach \(n\). Für \(n=0\) ist nichts zu zeigen. (Und das genügt als Induktionsanfang. Aber auch für \(n=1\) ist der Beweis nicht schwierig.) Seien nun \(m, n \ge 1\).

Sei \(\mathfrak a\) das von den Einträgen der Matrix \(A\) erzeugte Ideal in \(R\). Dies ist ein Hauptideal, und ein Element \(a\in R\) ist genau dann ein Erzeuger von \(\mathfrak a\), wenn \(a\) ein größter gemeinsamer Teiler der Einträge von \(A\) ist.

Wir bezeichnen für \(v\in M_{1\times m}(R)\) (in diesem Beweis) das von den Einträgen von \(vA\in M_{1\times n}(R)\) erzeugte Ideal in \(R\) mit \(\langle vA\rangle \). Sei \(u\in M_{1\times m}(R)\) so gewählt, dass das Ideal \(\langle uA\rangle \) unter allen Idealen der Form \(\langle vA\rangle \) (bezüglich der Inklusion) maximal ist, siehe Lemma 18.95.

Sei \(d\in R\) ein Erzeuger des Ideals \(\langle uA\rangle \). Wir können dann \(d=uAb\) für ein \(b\in R^n\) schreiben.

Behauptung. Es gilt \((d) = \mathfrak a\).

Begründung. Es ist klar, dass \(d=uAb\) in \(\mathfrak a\) liegt. Um die andere Inklusion zu zeigen, beobachten wir zuerst, dass wegen der Maximalität von \(\langle uA\rangle \) für alle \(v\in R^m\) und \(c\in R^n\) gilt:

\[ vAc \in \langle vA\rangle \subseteq \langle uA\rangle = (d). \]

Nun bezeichnen wir mit \(e_i^m\) bzw. \(e_j^n\) die Standardbasisvektoren in \(R^m\) bzw. \(R^n\) (mit \(i=1,\dots , m\) bzw. \(j=1,\dots , n\)). Aus der obigen Überlegung erhalten wir (mit \(v=e_i^m\) und \(c=e_j^n\)), dass \(a_{ij} = e_i^m A e_j^n \in (d)\) gilt. Insgesamt folgt \(\mathfrak a\subseteq (d)\) und damit die Gleichheit.

Aus \(vAc\in (d)\) für \(v = e^m_i\), \(i=1,\dots , m\), und \(c=b\) erhalten wir, dass alle Einträge des Vektors \(Ab\) Vielfache von \(d\) sind. Wir können also \(Ab=de\), \(e\in R^n\), schreiben. Es ist dann \(ue=1\). Analog folgt, dass \(uA\) ein Vielfaches von \(d\) ist, wir schreiben \(uA = df\), \(f\in M_{1\times n}(R)\) mit \(fb=1\).

Wir können Elemente aus \(M_{1\times m}(R)\) als lineare Abbildungen \(R^m\to R\) auffassen. Ist \(v\in M_{1\times m}(R)\) und \(x\in R^m\) mit \(vx=1\), so gilt \(R^m = \operatorname{Ker}(v) \oplus \langle x\rangle \). (Es ist klar, dass \(\operatorname{Ker}(v)\cap \langle x\rangle = 0\) ist; außerdem gilt \(w = (w-(vw)x) + (vw)x\in \operatorname{Ker}(v) + \langle x\rangle \) für alle \(w\in R^m\).) Überdies ist \(\operatorname{Ker}(v)\) nach Lemma 18.96 ein endlich erzeugter freier \(R\)-Modul.

Diese Überlegung wenden wir wie folgt an: Wir ergänzen \(e\) durch Vektoren aus \(\operatorname{Ker}(u)\) zu einer Basis von \(R^m\), die wir als die Spalten einer Matrix \(S^\prime \in GL_m(R)\) schreiben. Sei \(S = (S^\prime )^{-1}\). (Dann ist die erste Zeile von \(S\) gerade der Zeilenvektor \(u\).) Ferner ergänzen wir \(b\) durch Vektoren aus \(\operatorname{Ker}(uA)=\operatorname{Ker}(f)\) zu einer Basis von \(R^n\), die wir als die Spalten einer Matrix \(T\in GL_n(R)\) schreiben. Dann ist

\[ SA T = \begin{pmatrix} d & 0 \\ 0 & A^\prime \end{pmatrix} \]

mit \(A^\prime \in M_{(m-1)\times (n-1)}(R)\). Wir setzen \(a_1 := d\).

Nach Induktionsvoraussetzung können wir den Block rechts unten durch Multiplikation mit geeigneten Matrizen von links und rechts auf die gewünschte Form bringen. Aus der oben gezeigten Gleichheit \((d) = \mathfrak a\) folgt, dass alle Einträge von \(A^\prime \) durch \(d\) teilbar sind. Daraus folgt die Teilbarkeitsbeziehung zwischen den Elementarteilern.

18.7.4 Die Eindeutigkeitsaussage in Theorem 18.91

Sei \(R\) ein Hauptidealring. Wir betrachten die Situation von Theorem 18.91 und übernehmen die Notationen von dort.

Wir beginnen damit, die Eindeutigkeit der Zahl \(r\) zu begründen. Diese Zahl misst den »freien Anteil« des Moduls \(M\), und wir wollen Satz 18.86 über den Rang eines freien Moduls anwenden. Dazu müssen wir sozusagen den restlichen Teil »loswerden«. Wir treffen die folgende Definition.

Definition 18.97

Sei \(M\) ein \(R\)-Modul. Dann heißt der Untermodul

\[ \{ m\in M;\ \text{es existiert}\ a\in R\setminus \{ 0\} \ \text{mit}\ am=0 \} \subseteq M \]

der Torsionsuntermodul von \(M\).

Wir sagen, der \(R\)-Modul \(M\) sei torsionsfrei, wenn sein Torsionsuntermodul nur aus dem Nullelement besteht.

Man prüft unmittelbar nach, dass es sich beim Torsionsuntermodul tatsächlich um einen Untermodul von \(M\) handelt. Ist \(M\) ein \(R\)-Modul und \(T\) sein Torsionsuntermodul, so ist der Quotient \(\left.M\middle /T\right.\) torsionsfrei. Jeder freie \(R\)-Modul ist auch torsionsfrei. Aus der Existenzaussage von Theorem 18.91 folgt:

Korollar 18.98

Sei \(M\) ein endlich erzeugter torsionsfreier Modul über dem Hauptidealring \(R\). Dann ist \(M\) frei.

Beweis

Ist

\[ M \cong R^r \oplus \bigoplus _{i=1}^k \left.R\middle /\mathfrak a_i\right. \]

eine Zerlegung wie im Hauptsatz, so ist \(\bigoplus _{i=1}^k \left.R\middle /\mathfrak a_i\right.\) der Torsionsmodul der rechten Seite, also isomorph zum Torsionsuntermodul von \(M\). Dass \(M\) torsionsfrei ist, bedeutet, dass dieser Summand verschwindet, es ist also \(M\cong R^r\) frei.

Beispiel 18.99

Der \(\mathbb Z\)-Modul \(\mathbb Q\) ist torsionsfrei, aber nicht frei (allerdings eben auch nicht endlich erzeugt).

Es folgt nun, dass die Zahl \(r\) in der Zerlegung von Theorem 18.91 eindeutig bestimmt ist als der Rang des freien Moduls, den wir als Quotient von \(M\) nach seinem Torsionsuntermodul erhalten.

Um die Eindeutigkeit der Zahlen \(k\) und \(a_i\), \(i=1,\dots , k\) (mit \(a_1\mid \cdots \mid a_k\)) in der obigen Zerlegung zu zeigen, können wir zum Torsionsuntermodul von \(M\) übergehen und daher annehmen, dass \(r=0\) ist. Es genügt daher, den folgenden Satz zu beweisen:

Satz 18.100

Sei \(R\) ein Hauptidealring und seien \(k, l\ge 0\), \(a_1,\dots , a_k, b_1,\dots , b_l\in R\setminus (R^\times \cup \{ 0\} )\), so dass

\[ M:=\bigoplus _{i=1}^k \left.R\middle /(a_i)\right. \cong \bigoplus _{i=1}^l \left.R\middle /(b_i)\right. \]

und \(a_k\mid \cdots \mid a_1\) und \(b_l\mid \cdots \mid b_1\).

Dann gilt \(k=l\) und \((a_i)=(b_i)\) für alle \(i\), d.h. \(a_i\) und \(b_i\) sind zueinander assoziiert.

Die Nummerierung ist hier entgegengesetzt zu der Nummerierung im Elementarteilersatz (hier wird \(a_{i+1}\, |\, a_i\) vorausgesetzt). Das spielt natürlich für das Ergebnis keine Rolle, ist aber angenehmer im Beweis, weil wir den Vergleich der Elemente \(a_i\) und \(b_i\) mit dem Element beginnen wollen, das von allen anderen geteilt wird und nicht voraussetzen wollen, dass die Zahlen \(k\) und \(l\) gleich sind.

Der Beweis beruht wesentlich auf dem Begriff der Länge eines Moduls, den wir zunächst definieren und dann ein bisschen diskutieren.

Definition 18.101

Seien \(R\) ein Ring und \(M\) ein \(R\)-Modul.

  1. Eine Kette von Untermoduln der Länge \(l\in \mathbb N\) in \(M\) ist eine Kette

    \[ N_0 \subsetneq N_1 \subsetneq \cdots \subsetneq N_l \]

    von echten Inklusionen von Untermoduln von \(M\).

  2. Unter der Länge \(\operatorname{lg}_R(M)\) von \(M\) verstehen wir das Supremum (in \(\mathbb N\cup \{ \infty \} \)) aller Längen von Ketten von Untermoduln in \(M\), also die Länge einer solchen Kette maximaler Länge, oder \(\infty \), wenn es Ketten beliebiger Länge gibt.

Beispiel 18.102
  1. Ist \(M\) ein \(R\)-Modul, so gilt \(M=0\) genau dann, wenn \(\operatorname{lg}_R(M)=0\) ist, denn für \(M\ne 0\) hat man wenigstens die Kette \(0\subsetneq M\) von Untermoduln von \(M\).

  2. Sei \(K\) ein Körper und \(V\) ein \(K\)-Vektorraum. Ist \(V\) endlichdimensional, so ist \(\operatorname{lg}_K(V)=\dim (V)\). Andernfalls ist die Länge von \(V\) als \(K\)-Vektorraum \(=\infty \). In diesem Sinne ist die Länge eine (von mehreren möglichen …) Verallgemeinerung des Dimensionsbegriffs auf den Fall von Moduln über einem Ring. Uns wird sie hier von Nutzen sein, allerdings »funktioniert« der Begriff nicht für alle Moduln über Ringen gleichermaßen gut, wie der nächste Punkt zeigt.

  3. Für den \(\mathbb Z\)-Modul \(\mathbb Z\) gilt \(\operatorname{lg}_{\mathbb Z}(\mathbb Z) = \infty \).

Satz 18.103

Seien \(R\) ein Ring, \(M\) ein \(R\)-Modul und \(N\subseteq M\) ein Untermodul. Dann gilt

\[ \operatorname{lg}_R(M) = \operatorname{lg}_R(N) + \operatorname{lg}_R(\left.M\middle /N\right.) \]

(wobei die Addition in dem Fall, dass \(\infty \) auftritt, in der offensichtlichen Weise zu verstehen ist).

Beweis

Sei \(\pi \colon M\to \left.M\middle /N\right.\) die kanonische Projektion.

Die Abschätzung \(\ge \) ist nicht so schwierig: Ist \(N_0 \subsetneq \cdots \subsetneq N_r\) eine Kette in \(N\) und \(\overline{M}_0 \subsetneq \cdots \subsetneq \overline{M}_s\) eine Kette in \(\left.M\middle /N\right.\), so zeigt man, dass

\[ N_0 \subsetneq \cdots \subsetneq N_r \subseteq \pi ^{-1}(\overline{M}_0) \subsetneq \cdots \subsetneq \pi ^{-1}(\overline{M}_s) \]

eine Kette in \(M\) ist. In der Mitte kann Gleichheit herrschen, nämlich, wenn \(N_r = N\) und \(\overline{M}_0 = 0\) ist. Diese \(r+s+2\) Untermoduln von \(M\) bilden aber eine Kette der Länge mindestens \(r+s\).

Nun zeigen wir, dass auch \(\le \) gilt. Sei dazu

\[ M_0 \subsetneq \cdots \subsetneq M_l \]

eine Kette von Untermoduln in \(M\). Wir erhalten »Ketten«

\[ M_0\cap N \subseteq \cdots \subseteq M_l \cap N \]

in \(N\) und

\[ \pi (M_0) \subseteq \cdots \subseteq \pi (M_l) \]

in \(\left.M\middle /N\right.\), wobei hier aber nicht notwendig strikte Inklusionen vorliegen. Um zu zeigen, dass \(\operatorname{lg}_R(M) \le \operatorname{lg}_R(N) + \operatorname{lg}_R(\left.M\middle /N\right.)\) gilt, genügt es nun zu zeigen, dass jede der strikten Inklusionen \(M_i \subsetneq M_{i+1}\) jedenfalls entweder in der ersten oder in der zweiten dieser beiden Ketten eine strikte Inklusion liefert. Denn dann erhalten wir zusammengenommen (mindestens) \(l\) strikte Inklusionen und daraus die gewünschte Abschätzung. Wir können also den Beweis durch den Beweis der folgenden Behauptung abschließen.

Behauptung. Sind \(M_1 \subseteq M_2\) Untermoduln von \(M\) mit \(M_1\cap N = M_2\cap N\) und \(\pi (M_1) = \pi (M_2)\), so gilt \(M_1 = M_2\).

Begründung. Sei \(m\in M_2\). Dann ist \(\pi (m)\in \pi (M_2) = \pi (M_1)\), etwa \(m = \pi (m_1)\), \(m_1\in M_1\). Wir haben dann \(m-m_1\in N\). Wegen \(M_1\subseteq M_2\) gilt sogar \(m-m_1\in M_2\cap N = M_1\cap N \subseteq M_1\). Daraus folgt \(m\in M_1\). Also gilt \(M_2\subseteq M_1\) und damit die Gleichheit.

Korollar 18.104

Sei \(R\) ein Ring.

  1. Sind \(M\) und \(M^\prime \) Moduln über \(R\), so gilt \(\operatorname{lg}_R(M\oplus M^\prime ) = \operatorname{lg}_R(M) + \operatorname{lg}_r(M^\prime )\).

  2. Ist \(R\) ein Hauptidealring und sind \(\pi _1, \dots , \pi _r\in R\) Primelemente, so gilt \(\operatorname{lg}_R(\left.R\middle /(\pi _1\cdots \pi _r)\right.) = r\)

Beweis

zu (1). Dies folgt aus dem Satz, weil wir \(M\) als Untermodul von \(M\oplus M^\prime \) sehen können und dann \(\left.(M\oplus M^\prime )\middle /M\right.\cong M^\prime \) gilt.

zu (2). Wir führen Induktion nach \(r\). Für \(r=0\) ist nichts zu zeigen (wir verstehen dann \(\pi _1\cdots \pi _r\) als leeres Produkt mit dem Wert \(1\in R\)). Sei nun \(r=1\). Wir betrachten dann ein Primelement \(\pi \in R\) und wollen zeigen, dass der Quotient \(\left.R\middle /(\pi )\right.\) keine \(R\)-Untermoduln außer \(0\) und dem ganzen Modul hat. Sei \(p\colon R\to \left.R\middle /(\pi )\right.\) die kanonische Projektion. Wäre \(0 \ne N \subsetneq \left.R\middle /(\pi )\right.\) ein Untermodul, so wäre \(p^{-1}(N)\) ein Untermodul (also ein Ideal) von \(R\), der das Ideal \((\pi )\) echt enthält und echt in \(R\) enthalten ist. Das ist aber nicht möglich, weil \(\pi \) prim und damit insbesondere irreduzibel ist.

Sei nun \(r {\gt} 1\) und seien \(\pi _1, \dots , \pi _r\in R\) Primelemente. Die kanonische Projektion \(R\to \left.R\middle /(\pi _r)\right.\) induziert eine Surjektion \(\left.R\middle /(\pi _1\cdots \pi _r)\right.\to \left.R\middle /(\pi _r)\right.\), deren Kern isomorph ist zum Quotienten \(\left.R\middle /(\pi _1\cdots \pi _{r-1})\right.\). (Für \(x\in \left.R\middle /(\pi _1\cdots \pi _{r-1})\right.\) ist \(\pi _rx\) im Kern und das induziert den gewünschten Isomorphismus.) Damit folgt die Aussage aus dem Fall \(r=1\) und Satz 18.103.

Beweis von Satz 18.100

Wir zeigen zuerst, dass \((a_i) = (b_i)\) für alle \(i = 1,\dots , \min (k,l)\) gilt. Wäre das nicht der Fall, dann sei \(j\) der kleinste Index mit \((a_j) \ne (b_j)\).

Wir schreiben, wenn \(a\in R\) und \(M\) irgendein \(R\)-Modul ist, \(aM = \{ am; m\in M\} \). Dies ist ein Untermodul von \(M\), nämlich das Bild des Homomorphismus \(M\to M\), \(m\mapsto am\). Es gilt dann

\[ a_j M = \bigoplus _{i=1}^{j-1} \left.R\middle /(a_i)\right. = \bigoplus _{i=1}^{j-1} \left.R\middle /(a_i)\right. \oplus \bigoplus _{i=j}^{l} a_j \left.R\middle /(b_i)\right. \]

Es folgt \(\lg _R(\bigoplus _{i=j}^{l} a_j \left.R\middle /(b_i)\right.) = 0\) und damit \(\bigoplus _{i=j}^{l} a_j \left.R\middle /(b_i)\right. = 0\), d.h. \(b_i\mid a_j\) für \(i=j, \dots , l\) und insbesondere \(b_j\mid a_j\). Aus der analogen Betrachtung für \(b_j M\) folgt aber \(a_j\mid b_j\), so dass wir \((a_j) = (b_j)\) im Widerspruch zur Definition von \(j\) erhalten.

Es bleibt noch zu zeigen, dass \(k=l\) gilt. Sei ohne Einschränkung \(k\le l\) (andernfalls vertauschen wir die Rollen der \(a_i\) und \(b_i\) im folgenden Argument). Dann ist

\[ \operatorname{lg}_R\left(\bigoplus _{i=1}^{k} \left.R\middle /(a_i)\right.\right) = \operatorname{lg}_R\left(\bigoplus _{i=1}^{l} \left.R\middle /(b_i)\right.\right) = \operatorname{lg}_R\left(\bigoplus _{i=1}^{k} \left.R\middle /(a_i)\right.\right) + \operatorname{lg}_R\left(\bigoplus _{i=k+1}^{l} \left.R\middle /(b_i)\right.\right), \]

also \(\operatorname{lg}_R\left(\bigoplus _{i=k+1}^{l} \left.R\middle /(b_i)\right.\right)=0\) und damit \(\bigoplus _{i=k+1}^{l} \left.R\middle /(b_i)\right.=0\), was nur im Fall \(l\le k\) (also wenn die direkte Summe leere Indexmenge hat) möglich ist.

18.7.5 Vektorräume mit Endomorphismen als \(K[X]\)-Moduln

Wir wollen nun die Ergebnisse der vorherigen Abschnitte, insbesondere den Hauptsatz über endlich erzeugte Moduln über Hauptidealringen, benutzen, um einen neuen Zugang zur Normalformentheorie für Endomorphismen von endlichdimensionalen Vektorräumen zu erläutern und insbesondere einen neuen Beweis für den Satz über die Jordansche Normalform zu geben.

Sei \(K\) ein Körper und sei \(R=K[X]\). Wie wir wissen, ist \(R\) ein Hauptidealring. Unser Ansatz beruht auf der Interpretation von \(K[X]\)-Moduln als \(K\)-Vektorräume zusammen mit einem Endomorphismus wie in Beispiel 18.76 (3). Im folgenden schreiben wir oft \(M\) für einen \(K[X]\)-Modul und \(V\), \(f\) für den zugehörigen Vektorraum und Endomorphismus. Als additive Gruppen stimmen \(M\) und \(V\) also überein, und die Multiplikation mit \(X\) auf \(M\) ist der Endomorphismus \(f\) von \(V\).

Wir wollen als nächstes die Beziehung zwischen einigen Begriffen »auf der Vektorraumseite« bzw. »auf der Modulseite« untersuchen.

Lemma 18.105

Sei \(V\) ein \(K\)-Vektorraum mit einem Endomorphismus \(f\) und sei \(M\) der zugehörige \(K[X]\)-Modul. Dann gilt:

  1. Ist \(V\) endlichdimensional, so ist \(M\) endlich erzeugt.

  2. Sei \(M\) endlich erzeugt und

    \[ M \cong K[X]^r \oplus \bigoplus _{i=1}^k \left.K[X]\middle /(a_i)\right. \]

    ein Isomorphismus wie in Theorem 18.91, \(a_i\ne 0\) für alle \(i\). Es ist \(V\) genau dann endlichdimensional als \(K\)-Vektorraum, wenn \(r=0\) gilt.

Beweis

Teil (1) ist klar, weil jedes Erzeugendensystem von \(V\) als \(K\)-Vektorraum erst recht ein Erzeugendensystem von \(M\) als \(K[X]\)-Modul ist. Teil (2) folgt daraus, dass \(K[X]\) als \(K\)-Vektorraum nicht endlichdimensional ist, aber der Quotient \(\left.K[X]\middle /(p)\right.\) für jedes Polynom \(p\ne 0\) endlichdimensional von Dimension \(\deg (p)\) ist, denn die Restklassen der Elemente \(1, X, \dots , X^{\deg (p)-1}\) bilden eine Basis.

In der Modulsprache haben wir die folgende einfache Interpretation des Begriffs des zyklischen Unterraums.

Lemma 18.106

Sei \(V\) ein endlichdimensionaler \(K\)-Vektorraum mit einem Endomorphismus \(f\) und sei \(M\) der zugehörige \(K[X]\)-Modul. Dann sind äquivalent:

  1. Der Vektorraum \(V\) ist \(f\)-zyklisch.

  2. Es existiert ein Polynom \(\pi \in K[X]\) mit \(M\cong \left.K[X]\middle /(\pi )\right.\).

  3. Es existiert \(m\in M\) mit \(\langle m\rangle _{K[X]} = M\), d.h. \(M\) lässt sich als \(K[X]\)-Modul von einem einzigen Element erzeugen.

In diesem Fall ist das in (ii) auftretende Polynom \(\pi \) assoziiert zu \(\operatorname{minpol}_f = \operatorname{charpol}_f\).

Beweis

(i) \(\Rightarrow \) (ii). Sei \(V\) zyklisch, etwa \(V = \langle v, f(v), f^2(v), \dots \rangle \). Dann ist die Abbildung \(K[X]\to V\), \(p\mapsto p(f)(v)\), ein surjektiver \(K[X]\)-Modul-Homomorphismus. Aus dem Homomorphiesatz (und weil \(K[X]\) ein Hauptidealring ist) folgt die Behauptung. Genauer sehen wir, dass der Kern dieses Homomorphismus genau das von \(\operatorname{minpol}_f\) erzeugte Ideal ist. Daraus folgt der Zusatz am Ende des Lemmas (siehe auch Korollar 16.24).

(ii) \(\Rightarrow \) (iii). Der \(K[X]\)-Modul \(\left.K[X]\middle /(\pi )\right.\) wird erzeugt von der Restklasse von \(X\).

(iii) \(\Rightarrow \) (i). Wenn \(M\) als \(K[X]\)-Modul von \(m\) erzeugt wird, dann wird \(M=V\) als \(K\)-Vektorraum von \(m, Xm = f(m), X^2m = f^2(m), \dots \) erzeugt.

18.7.6 Der Satz über die rationale Normalform

Sei \(V\) ein endlichdimensionaler \(K\)-Vektorraum mit einem Endomorphismus \(f\) und sei \(M\) der zugehörige \(K[X]\)-Modul. Aus Korollar 18.92 erhalten wir mit Lemma 18.105 einen Isomorphismus

\[ M \cong \bigoplus _{i=1}^l \left.K[X]\middle /(\pi _i^{n_i})\right. \]

mit irreduziblen Polynomen \(\pi _1,\dots , \pi _l\) und positiven natürlichen Zahlen \(n_i\).

Die direkten Summanden \(\left.K[X]\middle /(\pi _i^{n_i})\right.\) in dieser Zerlegung sind \(K[X]\)-Untermoduln, mit anderen Worten also \(f\)-invariante Untervektorräume. Wir sehen an dieser Stelle (mit Lemma 18.106) schon, dass \(V\) sich als direkte Summe von \(f\)-zyklischen Untervektorräumen schreiben lässt. Um eine darstellende Matrix für \(f\) von möglichst einfacher Form zu finden, betrachten wir die Summanden in der obigen Zerlegung einzeln. Die Elemente \(1, \dots , X^{\deg (p)-1}\) bilden eine Basis von \(\left.K[X]\middle /(p)\right.\) und man rechnet unmittelbar die folgende Aussage nach:

Lemma 18.107

Sei \(p\in K[X]\) normiert. Die darstellende Matrix der Multiplikation mit \(X\) auf dem \(K\)-Vektorraum \(\left.K[X]\middle /(p)\right.\) bezüglich der Basis \(1, X, \dots , X^{\deg (p)-1}\) ist die Begleitmatrix des Polynoms \(p\).

Zusammen mit der Eindeutigkeitsaussage von Korollar 18.92 erhalten wir so einen Beweis des Satzes über die rationale Normalform.

Theorem 18.108 Rationale Normalform

Seien \(K\) ein Körper und \(V\) ein endlichdimensionaler \(K\)-Vektorraum. Sei \(f\in \operatorname{End}_K(V)\), und sei

\[ \operatorname{charpol}_f = \prod _{i=1}^s \pi _i^{n_i} \]

die Zerlegung in ein Produkt normierter irreduzibler Polynome (\(\pi _i\in K[X]\) paarweise verschieden). Dann existieren für jedes \(i\in \{ 1,\dots , s\} \) natürliche Zahlen \(r_{i,1}\ge r_{i,2} \ge \cdots \) mit \(\sum _j r_{i,j} = n_i\) und eine Basis \(\mathscr B\) von \(V\), so dass

\[ M^{\mathscr B}_{\mathscr B}(f) = \operatorname{diag}(A_1, \dots , A_s) \]

eine Diagonal-Blockmatrix ist, und für jedes \(i\) die Matrix \(A_i\in M_{N_i}\), \(N_i:= n_i\deg \pi _i\), selbst eine Diagonal-Blockmatrix ist, die zusammengesetzt ist aus den Begleitmatrizen der Polynome \(\pi _i^{r_{i,1}}\), \(\pi _i^{r_{i, 2}}\), …. Dabei sind die \(\pi _i\) als die normierten irreduziblen Teiler von \(\operatorname{charpol}_f\) bis auf ihre Reihenfolge eindeutig und die Zahlen \(r_{i,j}\) eindeutig bestimmt.

Für alle \(i\) ist \(\pi _i\) ein Teiler von \(\operatorname{minpol}_f\), und \(\pi _i^{r_{i,1}}\) ist die maximale Potenz von \(\pi _i\), die \(\operatorname{minpol}_f\) teilt.

Beweis

Wir fassen die irreduziblen Polynome in der obigen Zerlegung so zusammen, dass wir eine Liste von paarweise verschiedenen Polynomen erhalten und sortieren die auftretenden Exponenten der Größe nach. Es sind dann nur noch die Aussagen über das charakteristische Polynom und das Minimalpolynom zu beweisen, und diese folgen aus Lemma 18.106, wenn man noch beachtet, wie man das charakteristische Polynom und das Minimalpolynom einer Blockdiagonalmatrix aus den charakteristischen Polynomen und Minimalpolynomen der einzelnen Blöcke berechnet.

18.7.7 Ein neuer Beweis des Satzes über die Jordansche Normalform

Sei \(V\) ein endlichdimensionaler \(K\)-Vektorraum mit einem Endomorphismus \(f\) und sei \(M\) der zugehörige \(K[X]\)-Modul. Wie im vorherigen Abschnitt wenden wir Korollar 18.92 an und erhalten einen Isomorphismus

\[ M \cong \bigoplus _{i=1}^l \left.K[X]\middle /(\pi _i^{n_i})\right. \]

mit irreduziblen Polynomen \(\pi _1,\dots , \pi _l\), von denen wir auch voraussetzen wollen, dass sie normiert sind, und positiven natürlichen Zahlen \(n_i\). Wir haben oben gesehen, dass dann

\[ \operatorname{charpol}_f = \prod _{i=1}^l \pi _i^{n_i} \]

gilt. Der Endomorphismus \(f\) ist demnach trigonalisierbar genau dann, wenn alle \(\pi _i\) linear sind, etwa \(\pi _i = X-\lambda _i\). Das folgende Lemma zeigt, dass bezüglich einer geeigneten Basis die Einschränkung von \(f\) auf einen der invarianten Unterräume \(\left.K[X]\middle /((X-\lambda _i)^{n_i})\right.\) durch einen Jordanblock der Größe \(n_i\) zum Eigenwert \(\lambda _i\) dargestellt werden kann.

Lemma 18.109

Die darstellende Matrix der Multiplikation mit \(X\) auf \(\left.K[X]\middle /((X-\lambda )^{n})\right.\) bezüglich der Vektorraumbasis \((X-\lambda )^{n-1}, (X-\lambda )^{n-2}, \dots , (X-\lambda ), 1\) ist der Jordanblock \(J_{n, \lambda }\).

Beweis

Das folgt aus der Gleichheit \(X(X-\lambda )^i = (X-\lambda )^{i+1} + \lambda (X-\lambda )^i\).

Insgesamt erhalten wir so einen neuen Beweis des Satzes über die Jordansche Normalform (Theorem 17.5).