In diesem Kapitel behandeln wir die zentralen Konzepte der Differenzierbarkeit, der Ableitung und der Richtungsableitung. Im folgenden seien $E=(E,\|\,.\,\|)$ und $F=(F,\|\,.\,\|)$ Banachräume über demselben Körper $\mathbb K$, und $X$ eine offene Teilmenge von $E$. Zur Unterscheidung werden manchmal die Normen mit den Räumen, auf denen sie definiert sind, indiziert. So bezeichnet $\mathcal L(E,F)$ den Banachraum der stetigen linearen Abbildungen $A\colon E\to F$, versehen mit der Operatornorm $$\|A\|=\|A\|_{op}:=\sup_{e\in E\setminus \{0\}}\frac{\|A(e)\|_F}{\|e\|_E}=\sup_{e\in E\setminus \{0\}}\frac{\|A(e)\|}{\|e\|}.$$
Definition. Eine Funktion $f\colon X\to F$ heißt in $x_0\in X$ differenzierbar, wenn es eine stetige lineare Abbildung $A_{x_0}\in \mathcal L(E,F)$ gibt mit $$
\lim_{x\to x_0}\frac{f(x)-f(x_0)-A_{x_0}(x-x_0) }{\|x-x_0\|}=0.$$ In diesem Falle wird die lineare Abbildung $A_{x_0}$ mit $Df(x_0)$ oder $f'(x_0)$ oder $\partial f(x_0)$ bezeichnet und heißt Ableitung von $f$ in $x_0$. Ist $f\colon X\to F$ in jedem Punkt $x\in X$ differenzierbar, so heißt $f$ differenzierbar, und die Abbildung $$Df\colon X\to \mathcal L(E,F),\quad x\mapsto Df(x)$$ ist die Ableitung von $f$.
Bemerkungen.
- Die Vorschrift $$r_{x_0}(x):=\frac{f(x)-f(x_0)-A_{x_0}(x-x_0) }{\|x-x_0\|}$$ definiert eine Funktion auf $r_{x_0}\colon X\setminus \{x_0\}\to F$, die genau dann in $x_0$ stetig durch den Nullvektor fortsetzbar ist, wenn $f$ in $x_0$ differenzierbar ist. Insbesondere lässt sich eine in $x_0$ differenzierbare Funktion als Summe $$f(x)=f(x_0)+A_{x_0}(x-x_0)+\|x-x_0\|r_{x_0}(x)$$ in $x_0$ stetiger Funktionen darstellen und ist folglich stetig.
- Ist $f$ in $x_0$ differenzierbar, so ist die lineare Abbildung $A_{x_0}$ eindeutig bestimmt. Denn sei $B\in \mathcal L(E,F)$ und es gelte $$f(x)=f(x_0)+B(x-x_0)+\|x-x_0\|s(x)$$ für eine in $x_0$ stetige Funktion $s:X\to F$ mit $s(x_0)=0$, so können wir beide Darstellungen voneinander subtrahieren und erhalten nach Division durch $\|x-x_0\|$ $$\lim_{x\to x_0}(A_{x_0}-B)\left(\frac{x-x_0}{\|x-x_0\|}\right)=\lim_{x\to x_0}(r_{x_0}-s)(x)=0.$$ Ist $e\in E\setminus\{0\}$ und $x_n:=x_0+\frac{e}n$ für $n\in \mathbb N$, so ist konvergiert die Folge $(x_n)$ gegen $x_0$. Für genügend große $n$ ist $x_n\in X$ und wegen $(x_n-x_0)/\|x_n-x_0\|=e/\|e\|$ gilt dann $$(A_{x_0}-B)e=\|e\|\cdot \lim_{n\to\infty}(A_{x_0}-B)\left( \frac{x_n-x_0}{\|x_n-x_0\|}\right)=0.$$ Es folgt $A_{x_0}=B$.
- Statt differenzierbar sagt man auch total differenzierbar oder Fréchet-differenzierbar.
- Ist $f\colon X\to F$ differenzierbar, und ist die Abbildung $Df\colon X\to \mathcal L(E,F)$ stetig, so heißt $f$ stetig differenzierbar. Wir bezeichnen den Raum der stetig differenzierbaren Funktionen auf $X$ mit Werten in $F$ mit $$\mathcal C^1(X,F):=\{f\colon X\to F\mid f\,\text{ ist stetig differenzierbar} \}.$$
- Der Vektorraum $\mathcal L(E,F)$ für $\mathbb K$-Vektorräume $E$ und $F$ beschreibt wohlgemerkt den Vektorraum der $\mathbb K$-linearen Abbildungen. Im Falle $\mathbb K=\mathbb C$ können wir darüber hinaus die zugrundeliegenden reellen Vektorräume $E_{\mathbb R}, F_{\mathbb R}$ und entsprechend die $\mathbb R$-linearen stetigen Abbildungen $$\mathcal L_{\mathbb R}(E,F):=\mathcal L(E_{\mathbb R}, F_{\mathbb R})\supsetneqq\mathcal L(E,F)$$ betrachten. Wir erhalten entsprechend einen Unterschied zwischen reeller Differenzierbarkeit und komplexer Differenzierbarkeit.
- Im Falle $E=F=\mathbb R$ bekommen wir die gewöhnliche Differenzierbarkeit zurück, weil $$ \lim_{h\to 0}\frac{f(x+h)-f(x)-f'(x)h }{|h|}=0 $$ ist. Hier ist dann $Df(x)$ die lineare Abbildung $h\mapsto f'(x)\cdot h$.
Beispiele.
- Sei $f\in F$ fixiert, so ist die konstante Abbildung $X\to F; x\mapsto f$ stetig differenzierbar und die Ableitung ist die Null-Abbildung.
- Für $A\in \mathcal L(E,F)$ ist die Funktion $A\colon x\mapsto Ax$ stetig differenzierbar und die Ableitung ist gleich $A$.
- Ist $H$ ein Hilbertraum über $\mathbb K$, so ist die Abbildung $b\colon H\to \mathbb K, \, x\mapsto \|x\|^2=\langle x,x\rangle$ reell stetig differenzierbar mit Ableitung $$Db(x)=2\Re \langle x,\,.\,\rangle \quad \text{ für } x\in H.$$ Denn für jede Wahl $x,h \in H$ mit $h\not= 0$ gilt $$\|x+h\|^2=\|x\|^2+\|h\|^2+2\Re\langle x,h\rangle,$$ also $$\lim_{h\to 0}\frac{b(x+h)-b(x)-2\Re\langle x,h\rangle }{\|h\|}=\lim_{h\to 0} \|h\|=0.$$Im Falle $\mathbb K=\mathbb C$ ist die Abbildung $h\mapsto \Re \langle x,h\rangle$ genau dann komplex linear, wenn $x=0$ ist. Die Abbildung $b$ ist folglich nur im Nullpunkt komplex differenzierbar.
- Es sei $V=Mat_{n\times n}(\mathbb K)$ der Vektorraum der $n\times n$-Matrizen mit Einträgen in $\mathbb K$ und $$P\colon V\to V,\quad M\mapsto M^3$$ gegeben durch Matrixmultiplikation. Dann ist $P$ differenzierbar mit Ableitung $$DP(M)\colon X\mapsto XM^2+MXM+M^2X.$$ Denn es gilt $$P(M+X)-P(M)-(XM^2+MXM+M^2X)=X^2M+XMX+MX^2+X^3$$ und wegen der Sub-Multiplikativität der Operatornorm $\|AB\|\le\|A\|\|B\|$ erhalten wir $$\lim_{X\to 0}\frac{\|X^2M+XMX+MX^2+X^3\|}{\|X\|}\le \lim_{X\to 0}\frac{\left(3\|M\|+\|X\|\right)\|X\|^2}{\|X\|}=0.$$ Man beachte, dass die Ableitung von $P$ Werte in dem $n^4$-dimensionalen Vektorraum $\mathcal L(V,V)$ annimmt.