Beweis des Satzes

Der zu beweisende Satz lautet:

6.5.1. Satz über die Umkehrabbildung. Es sei $X$ offen in $E$, $f\in\mathcal C^q(X,F)$ für ein $q\in \mathbb N$. Gilt $$\partial f(x_0)\in \mathcal Lis(E,F)$$ für ein $x_0\in X$, so gibt es eine offene Umgebung $U$ von $x_0$ in $X$ und eine offene Umgebung $V$ von $y_0:=f(x_0)$ mit folgenden Eigenschaften:

  1. Die Abbildung $f\colon U\to V$ ist bijektiv.
  2. Für die Umkehrfunktion $g$ von $f$ gilt $g\in\mathcal C^q(V,E)$ und es gilt $$\partial g(y)=\big(\partial f(g(y))\big)^{-1}.$$

Beweis.

  1. Vereinfachende Vorüberlegungen:
    • Die Formel $\partial g(y)=\big(\partial f(g(y))\big)^{-1}$ folgt sofort aus der Kettenregel, sobald Existenz und Differenzierbarkeit der Umkehrfunktion $g$ bewiesen sind.
    • Ist $A\in \mathcal C^q(F,\tilde{F})$ eine Abbildung, für die es eine Umkehrabbildung $B \in \mathcal C^q(\tilde{F},F)$ gibt, so sei $$\tilde{f}:=A\circ f\in \mathcal C^q(X,\tilde{F}).$$ Ist die Aussage für $\tilde{f}$ bewiesen, so folgt sie für $f$. Sind nämlich $U\subset X$ und $\tilde{V}\subset \tilde{F}$ offene Umgebungen von $x_0$ und $\tilde{f}(x_0)$, und ist $\tilde{f}\colon U\to \tilde{V}$ bijektiv mit Umkehrfunktion $\tilde{g}\in \mathcal C^q(\tilde{V},E),$ so gelten die Gleichungen $$\tilde{g}\circ\tilde{f}=\mathrm{id}_U\quad\text{ und }\quad \tilde{f}\circ\tilde{g}=\mathrm{id}_{\tilde{V}}.$$ Setzen wir $V:=B(\tilde{V})$ und $g:=\tilde{g}\circ A$, so ist wegen der Kettenregel $g\in \mathcal C^q(V,E)$ und wegen $B\circ A=\mathrm{id}_F$ gelten die Gleichungen $$g\circ f=\tilde{g}\circ A\circ f=\tilde{g}\circ\tilde{f}=\mathrm{id}_U\quad\text{ und }\quad f\circ g=(B\circ \tilde{f})\circ(\tilde{g}\circ A)=B\circ\mathrm{id}_{\tilde{V}}\circ A=\mathrm{id}_{V}.$$
    • Wenden wir diese Überlegung an auf die lineare Abbildung $A=\left(\partial f(x_0)\right)^{-1}$, so können wir ohne Beschränkung der Allgemeinheit annehmen, dass gilt $F=E$ und $\partial f(x_0) = \mathrm{id}_E$. Ebenso können wir konstante Abbildungen addieren und folglich ohne wesentliche Einschränkung annehmen $x_0=f(x_0)=0$.
  2. Bestimmung von $U$ und $V$: Wir betrachten die Hilfsfunktion $h=\mathrm{id}_X -f\in\mathcal C^d(X,E)$. Wegen $\partial f(0)=1_E$ gilt $\partial h(0)= 0$. Aufgrund der Stetigkeit von $h$ gibt es ein $r\gt 0$ mit $$\|\partial h(x)\|\lt \frac12, \quad \text{ für alle } x\in \overline{U_{2r}(0)}.$$ Wir setzen $V:= U_r(0)$ und $U:=f^{-1}(V)\cap U_{2r}(0)$. Zu zeigen bleibt, dass $f\colon U\to V$ bijektiv ist. Genauer müssen wir zeigen, dass es zu jedem $y\in U_r(0)$ genau ein $x\in U_{2r}(0)$ gibt mit $f(x)=y$. Hier kommt der Banachsche Fixpunktsatz zum Einsatz: Zu jedem $y\in U_r(0)$ konstruieren wir jeweils eine Kontraktion $h_y\colon U_{2r}(0)\to U_{2r}(0)$, welche den gesuchten Urbildpunkt $f^{-1}(y)$ als Fixpunkt besitzt. Wir setzen dazu $$h_y\colon x\mapsto h(x)+y.$$ Ist $x$ ein Fixpunkt von $h_y$, so gilt offenbar $$x = h_y(x)= x-f(x)+y \;\iff \;f(x)=y.$$ Es bleibt zu zeigen, dass die derart definierten Abbildungen $h_y$ die behaupteten Eigenschaften besitzt. Zuerst einmal liefert eine Anwendung des Mittelwertsatzes die Abschätzung $$\|h(x)\|=\|h(x)-h(0)\|\le \sup_{0\le t\le 1}\|\partial h(tx)\|\,\|x\|\le \frac{\|x\|}2\quad \text{ für alle } x\in \overline{U_{2r}(0)}.$$ Daraus folgen schon die behaupteten Eigenschaften von $h_y$: Für $y\in U_r(0)$ und $x\in U_{2r}(0)$ gilt $$\|h_y(x)\|\le \|h(x)\| +\|y\|\lt r+r=2r.$$ Also ist $h_y$ eine Selbstabbildung von $U_{2r}(0)$. Für $x_1,x_2\in U_{2r}(0)$ und $0\le \tau\le 1$ zeigt die Abschätzung $$\|\tau x_1 +(1-\tau) x_2\|\le \tau \|x_1\|+(1-\tau)\|x_2\|\lt 2r,$$ dass die Strecke zwischen den beiden Punkten ganz in $U_{2r}(0)$ enthalten. Die folglich erlaubte Anwendung des Mittelwertsatzes $$\|h_y(x_1)-h_y(x_2)\|=\|h(x_1)-h(x_2)\|\le \sup_{0\le\tau\le 1}\| \partial h(\tau x_1 +(1-\tau) x_2)\|\,\|x_1-x_2\|\le \frac12\|x_1-x_2\|$$ charakterisiert die Abbildungen $h_y$ als Kontraktionen mit Kontraktionsfaktor $\frac12$.
  3. Stetigkeit der Umkehrfunktion $g$: Sind $x_1=g(y_1),x_2=g(y_2)\in U$ und so gilt \begin{aligned}\|x_1-x_2\|&=\|h(x_1)-h(x_2)+f(x_1)-f(x_2)\|\le \|h(x_1)-h(x_2)\|+\|f(x_1)-f(x_2)\| \\&\le \frac12\|x_1-x_2\|+\|f(x_1)-f(x_2)\|
    \end{aligned} und folglich $$\|g(y_1)-g(y_2)\|\le 2 \|y_1-y_2\|.$$ Das ist die Lipschitz-Stetigkeit von $g$.
  4. Differenzierbarkeit der Umkehrfunktion $g$. Wir zeigen Differenzierbarkeit von $g$ im Punkte $y_1\in V.$ Es sei $x_1=g(y_1).$ Die Ableitung $\partial f(x_1)=1_E-\partial h(x_1)$ ist wegen $\|\partial h(x_1)\|\le \frac12$ in $\mathcal Lis(E,E)$. Für $y\in V$ sei $g(y)=x$. Die Differenzierbarkeit von $f$ stellt für $x\to x_1$ die Gleichung $$f(x)-f(x_1)-\partial f(x_1)(x-x_1)=o(\|x-x_1\|)$$ zur Verfügung. Anwendung von $\left(\partial f(x_1)\right)^{-1}$ auf beide Seiten ergibt $$\left(\partial f(x_1)\right)^{-1}(y-y_1)-\left(g(y)-g(y_1)\right)=\left(\partial f(x_1)\right)^{-1}o(\|x-x_1\|).$$ Setzen wir $\|\left(\partial f(x_1)\right)^{-1}\|=:c$ und benutzen die Lipschitz-Abschätzung $2\|y-y_1\|\ge \|x-x_1\|$, so erhalten wir $$\frac{\|g(y)-g(y_1)-\left(\partial f(x_1)\right)^{-1}(y-y_1)\|}{\|y-y_1\|}\le\frac{2c\|o(\|x-x_1\|)\|}{\|x-x_1\|}.$$ Im Grenzübergang $y\to y_1$ gilt wegen der Stetigkeit von $g$ der Grenzübergang $x\to x_1$. Die obige Abschätzung zeigt Differenzierbarkeit von $g$ in $y_1$ und $\partial g(y_1)=\left(\partial f\left(g(y_1)\right)\right)^{-1}$.
  5. Höhere Ableitungen der Umkehrfunktion $g$: Wir zeigen induktiv $g\in \mathcal C^k(V,E)$ für $k\le q$. Der Induktionsanfang $k=0$ ist bereits erledigt. Für den Induktionsschritt stellen wir die Formel, die uns die Ableitung von $g$ beschreibt, dar als Komposition $$\partial g=\mathrm{inv}\circ \partial f\circ g.$$ Auf diese Zerlegung wenden wir die Kettenregel an. Diese besagt, dass die Abbildung $\partial g$ auf der linken Seite der Gleichung in $\mathcal C^m(V,E)$ liegt, wo $m$ der minimale Grad der jeweiligen stetigen Differenzierbarkeit der Abbildungen auf der rechten Seite der Gleichung ist. Die Abbildung $\mathrm{inv}$ ist nach Satz 6.5.3 unendlich oft differenzierbar. Die zweite Abbildung $\partial f$ in dieser Komposition ist nach Voraussetzung $(q-1)$-mal stetig differenzierbar. Induktiv folgt also für $k\lt q$ die $k$-malige stetige Differenzierbarkeit von $\partial g$, und damit die $(k+1)$-malige Differenzierbarkeit von $g$, aus der $k$-maligen Differenzierbarkeit von $g$. Baron Münchhausen folgend, ziehen wir uns auf diese Weise am eigenen Schopf aus dem Sumpf.

qed

Definition. Es sei $X$ offen in $E$ und $Y$ offen in $F$.

  • Man nennt eine Abbildung $f\colon X\to Y$ einen $\mathcal C^q$-Diffeomorphismus, wenn $f$ bijektiv ist und sowohl $f$ als auch die Umkehrfunktion $g$ jeweils $q$-mal stetig differenzierbar sind. Im Falle $q=0$ spricht man von einem Homöomorphismus. Die Menge aller $\mathcal C^q$-Diffeomorphismen von $X$ nach $X$ wird mit $Diff^q(X,Y)$ bezeichnet.
  • Eine Abbildung $f\colon X\to Y$ heißt lokaler $\mathcal C^q$-Diffeomorphismus, wenn es zu jedem $x\in X$ offene Umgebungen $U\subset X$ und $V\subset Y$ von $x$ und $f(x)$ gibt, so dass die Einschränkung $f|U$ von $f$ auf $U$ in $Diff^q(U,V)$ liegt.

Bemerkungen.

  1. Der Satz über die Umkehrabbildung impliziert, dass für $f\in \mathcal C^q(X,F)$ gilt:$$ f \text{ ist lokaler }\mathcal C^q\text{-Diffeomorphismus } \iff \partial f(x)\in \mathcal Lis(E,F) \text{ für alle } x\in X.$$
  2. Die surjektive, jedoch nicht injektive Abbildung $$\exp\colon \mathbb C \to \mathbb C^*$$ ist ein lokaler $\mathcal C^\infty$-Diffeomorphismus, aber kein Diffeomorphismus.

Unterstützt von Drupal