6.3. Mittelwertsatz

Zuerst einmal formulieren wir einen Mittelwertsatz für vektorwertige Funktionen in einer Variablen.

6.3.1. Satz. Es sei $F$ ein Banachraum, und $f\in \mathcal C([a,b],F)$ sei im offenen Intervall $(a,b)$ differenzierbar. Dann gilt $$\|f(b)-f(a)\|\le \sup_{t\in(a,b)}\|f'(t)\|(b-a).$$

Beweis. Es sei $f'$ beschränkt durch $\|f'(t)\|\lt \beta$ für $t\in (a,b)$. Für fixiertes $\varepsilon\gt 0$ betrachten wir die Menge $$S:=\{\sigma\in [a+\varepsilon,b] \mid \|f(\sigma)-f(a+\varepsilon)\|\le \beta(\sigma-a-\varepsilon)\}.$$ Die Menge $S$ ist aufgrund der Stetigkeit von $f$ abgeschlossen, und sie enthält $a+\varepsilon$, ist also nicht leer. Nach Heine-Borel ist $S$ kompakt und somit gibt es ein maximales Element $s\le b$. Wäre $s\lt b$, so gilt für $t\in (s,b)$ wegen der Dreiecksungleichung $$\|f(t)-f(a+\varepsilon)\|\lt \|f(t)-f(s)\|+\beta(s-a-\varepsilon).$$ Da $f$ auf $[a+\varepsilon,b)$ differenzierbar ist, gilt $$\lim_{t\searrow s}\frac{\|f(t)-f(s)\|}{t-s}=\|f'(s)\|.$$ Wegen der Definition von $\beta$ gibt es also ein $\delta\in (0,b-s)$ mit $$\|f(t)-f(s)\|\le \beta(t-s) \quad \text{für } 0\lt t-s\lt \delta.$$ Eingesetzt in die obige Dreiecksungleichung, erhalten wir $$\|f(t)-f(a+\varepsilon)\|\le \beta(t-a-\varepsilon) \quad \text{für } s\lt t \lt s+\delta,$$ was der Maximalität von $s$ widerspricht. Somit gilt $s=b$ und folglich $$\|f(b)-f(a+\varepsilon)\|\lt \beta(b-a-\varepsilon)$$ für jede obere Schranke $\beta\gt \sup_{t\in (a,b)}\|f'(t)\|$. Es folgt $$\|f(b)-f(a+\varepsilon)\|\le \sup_{t\in (a,b)}\|f'(t)\|(b-a-\varepsilon)$$ für alle $\varepsilon\gt 0$. Wegen der Stetigkeit von $f$ bleibt die Ungleichung im Grenzübergang $\varepsilon\to 0$ erhalten.
qed

6.3.2. Mittelwertsatz. Es sei $F$ ein Banachraum und $f\colon X \to F$ differenzierbar. Dann gilt $$\|f(y)-f(x)\|\le \sup_{0\le t\le 1}\|\partial f(x+t(y-x))\| \|y-x\|,$$ falls $X$ die ganze Strecke zwischen $x$ und $y$ enthält, also $\{x+t(y-x)\mid t\in [0,1]\}\subset X$.

Beweis. Wir setzen $\phi(t):=f(x+t(y-x))$ für $t\in [0,1]$. Gemäß der Kettenregel gilt $$\phi'(t)=\partial f(x+t(y-x))(y-x).$$ Aus dem obigen Satz erhalten wir $$\|f(y)-f(x)\|=\|\phi(1)-\phi(0)\|\le \sup_{t\in[0,1]}\|\phi'(t)\|\le \sup_{0\le t\le 1}\|\partial f(x+t(y-x))\| \|y-x\|.$$ qed

Es folgt ein bereits avisierter Beweis:

6.1.4'. Satz. Es sei $X$ offen in $\mathbb R^n$ und $F$ ein Banachraum. Dann ist $f\colon X\to F$ genau dann stetig differenzierbar, wenn $f$ stetig partiell differenzierbar ist.

Beweis von 6.1.4'. Ist $f$ stetig differenzierbar, so ist nichts zu beweisen. Wir nehmen also an, $f$ sei stetig partiell differenzierbar. Es sei $x\in X$ gegeben und ein $\varepsilon \gt 0$ so klein, dass $U_\varepsilon(x)\subset X$ gilt. Auf $\mathbb R^n$ benutzen wir die $\infty$-Norm. Es sei also $h=(h^1,\ldots,h^n)\in \mathbb R^n$ gegeben mit $|h|_\infty\lt \varepsilon$. Wir setzen $x_0:=x$ und rekursiv $x_k:= x_{k-1}+h^ke_k$. Dann gilt $$f(x+h)-f(x)=\sum_{k=1}^n\left(f(x_k)-f(x_{k-1})\right)$$ und folglich $$f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k =\sum_{k=1}^n \left(f(x_k)-f(x_{k-1})-h^k\partial_k(x)\right).$$ Setzen wir $$\phi(t):=f(x_{k-1}+th^ke_k)-th^k\partial_kf(x),$$ so gilt $$\phi'(t)=\big(\partial_kf(x_{k-1}+th^ke_k)-\partial_kf(x)\big)h^k$$ und vermittels 6.3.1. die Abschätzung \begin{aligned}
\left\|f(x_k)-f(x_{k-1})-h^k\partial_kf(x)\right\| &= \|\phi(1)-\phi(0)\| \\
&\le |h^k|\sup_{t\in [0,1]}\|\partial_kf(x_{k-1}+th^ke_k)-\partial_kf(x)\| \\
&\le |h^k| \sup_{|\gamma|_\infty\le |h|_\infty} \|\partial_k f(x+\gamma)-\partial_k f(x)\|.\end{aligned} Insgesamt erhalten wir, wie bereits im Beweis von 6.1.4, die Abschätzung $$\left\|f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k \right\|
\le |h|_\infty \sum_{k=1}^n \sup_{|\gamma|_\infty\le |h|_\infty} \|\partial_k f(x+\gamma)-\partial_k f(x)\|.$$ Aus der Stetigkeit der partiellen Ableitungen folgt nun $$\lim_{h\to 0}\sum_{k=1}^n \sup_{|\gamma|_\infty\le |h|_\infty} \|\partial_k f(x+\gamma)-\partial_k f(x)\|=0$$ und damit die Differenzierbarkeitsbedingung $$\lim_{h\to 0}\frac{f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k }{|h|_\infty}=0.$$qed

Definition. Ein topologischer Raum $X$ heißt zusammenhängend, falls gilt: Sind $U,V\subset X$ jeweils nicht leere, offene Teilmengen mit $U\cup V=X$, so ist der Durchschnitt $U\cap V$ nicht leer.

6.3.3. Proposition. Ein topologischer Raum ist genau dann zusammenhängend, wenn $X$ die einzige nicht leere Teilmenge von $X$ ist, welche offen und abgeschlossen ist.

Beweis. Ist $U\subset X$ offen und abgeschlossen, so ist auch das Komplement $V=X\setminus U$ offen und abgeschlossen.
qed

6.3.4. Korollar. Es seien $E,F$ Banachräume, $X\subset E$ offen und zusammenhängend. Für eine differenzierbare Funktion $f\colon X\to F$ gelte $\partial f=0$. Dann ist $f$ konstant.

Beweis. Es sei $z\in f(X)$. Die Menge $f^{-1}(z)\subset X$ ist als Urbild einer abgeschlossenen Menge unter der stetigen Abbildung $f$ abgeschlossen. Ist $x\in f^{-1}(z)$, so gibt es eine $\varepsilon$-Umgebung $U_\varepsilon(x)$, die noch ganz in $X$ liegt. Für $y\in U_\varepsilon(x)$ ist die ganze Strecke von $x$ nach $y$ in $U_\varepsilon(x)$ enthalten und damit insbesondere in $X$. Es kann also der Mittelwertsatz 6.3.2. angewandt werden: Das Verschwinden der Ableitung impliziert $\|f(y)-f(x)\|=0$ und damit gilt $U_\varepsilon(x)\subset f^{-1}(z)$. Folglich ist $f^{-1}(z)\subset X$ auch offen. Da $X$ als zusammenhängend vorausgesetzt war, muss gelten $f^{-1}(z)= X$.
qed

6.3.5. Satz. Es sei $(f_k)_{k\in \mathbb N}\in \mathcal C^1(X,F)$ eine Funktionenfolge, sowie $f\colon X\to F$ und $g\colon X\to \mathcal L(E,F)$ Funktionen, so dass gilt:

  1. Die Folge $(f_k)$ konvergiert punktweise gegen $f$.
  2. Die Folge $(\partial f_k)$ konvergiert lokal gleichmäßig gegen $g$.

Dann ist $f\in \mathcal C^1(X,F)$ und es gilt $\partial f=g$. Außerdem konvergiert die Folge $(f_k)$ lokal gleichmäßig gegen $f$.

Beweis. Zu $x\in X$ wählen wir eine $\varepsilon$-Umgebung $U_\varepsilon(x)$, in der die Folge $(\partial f_k)$ gleichmäßig gegen $g$ konvergiert. Es reicht, die Aussagen für eine solche Umgebung zu zeigen. Sei $y \in U_\varepsilon(x)$, so wenden wir den Mittelwertsatz an auf die Funktion $$t\mapsto f_k(x+t(y-x))-t\partial f_k(x)(y-x)$$ und erhalten eine Abschätzung $$\|f_k(y)-f_k(x)-\partial f_k(x)(y-x)\|\le sup_{0\le t\le 1}\|\partial f_k(x+t(y-x))-\partial f_k(x)\|\|y-x\|.$$ Durch Grenzübergang $k\to \infty$ erhalten wir $$
\|f(y)-f(x)-g(x)(y-x)\|\le sup_{0\le t\le 1}\|g(x+t(y-x))-g(x)\|\|y-x\|.$$ Nach Satz 5.5.5. ist $g$ stetig. Also liefert die obige Ungleichung die Differenzierbarkeit von $f$ im Punkte $x$ und die Gleichung $\partial f(x)=g(x)$. Insgesamt erhalten wir $f\in \mathcal C^1(X,F)$. Zum Nachweis der lokal gleichmäßigen Konvergenz der Folge $(f_k)$ wenden wir den Mittelwertsatz an auf die Funktion $$
t\mapsto (f_k-f)(x+t(y-x)).$$ Wir erhalten die Abschätzung \begin{aligned}\|f_k(y)-f(x)\|&\le \|f_k(y)-f(y)-\big(f_k(x)-f(x)\big)\|+\|f_k(x)-f(x)\|\\
&\le \varepsilon \sup_{0\le t\le 1}\| \partial f_k(x+t(y-x)) -\partial f(x-t(y-x))\|+\|f_k(x)-f(x)\|\\
&\le \varepsilon \sup_{y\in U_\varepsilon(x)}\|\partial f_k(y)-g(y)\|+ \|f_k(x)-f(x)\|.\end{aligned} Die rechte Seite der Ungleichungskette ist unabhängig von $y\in U_\varepsilon(x)$ und konvergiert nach Voraussetzung für $k\to \infty$ gegen $0$.
qed

Unterstützt von Drupal