Definition. Es seien $f\colon X\to F$, $x\in X$ und $v\in E$ gegeben. Da $X$ offen ist, gibt es ein $\varepsilon\gt 0$ mit $x+tv\in X$ für $t\in\mathbb K$ mit $|t|\lt \varepsilon$. Ist die Funktion $$U_\varepsilon(0)\to F,\quad t\mapsto f(x+tv)$$ im Punkt $0$ differenzierbar, so heißt ihre Ableitung Richtungsableitung von $f$ an der Stelle $x$ in Richtung $v$, und wird mit $D_vf(x)$ bezeichnet. Es gilt also $$D_vf(x)=\lim_{t\to 0}\frac{f(x+tv)-f(x)}{t}.$$
6.1.1. Proposition. Es sei $f\colon X\to F$ differenzierbar in $x\in X$. Dann existiert zu jedem $v\in E$ die Richtungsableitung $D_vf(x)$ und es gilt $D_vf(x)=f'(x)v$, die Richtungsableitung in $x$ in Richtung $v$ ist also das Bild des Vektors $v$ unter der linearen Abbildung $Df(x)\colon E\to F$.
Beweis. Für $v\in E$ gilt wegen der Linearität von der Ableitung $f'(x)(tv)=tf'(x)v$ und folglich $$
D_v f(x)=\lim_{t\to 0}\frac{f(x+tv)-f(x)}{t}=f'(x)v.
$$qed
Bemerkung. Die Umkehrung der Aussage des Satzes ist nicht richtig. Eine Funktion kann Richtungsableitungen in jeder Richtung besitzen, ohne differenzierbar zu sein. Ein Beispiel ist die Funktion $f\colon \mathbb R^2\to \mathbb R$ mit $$f(x,y):=\begin{cases}\frac{x^2y}{x^2+y^2},&(x,y)\not=(0,0)\\ 0,&(x,y)=(0,0).\end{cases}$$ Für jedes $v=(\xi,\eta)\in \mathbb R^2\setminus \{(0,0)\}$ gilt $$f(tv)=\frac{t^3\xi^2\eta}{t^2(\xi^2+\eta^2)}=tf(v),$$ und folglich $D_vf(0)=f(v)$. Wäre $f$ in $0$ differenzierbar, so wäre die Abbildung $v\mapsto D_vf(0)=f(v)$ linear, was sie aber offenbar nicht ist.
Definition. Es sei $X\subset E=\mathbb R^n$ und $f\colon X\to F$ eine Funktion.
D_{e_k}f(x) = D_k f(x) = \frac{\partial f}{\partial x^k}(x) =\partial_kf(x).
$$
Wir beschreiben die partielle Ableitung in Koordinaten. Der Vektor $x=\sum_{k=1}^n x^ke_k\in X\subset \mathbb R^n$ wird auch als Tupel $(x^1,x^2,\ldots,x^n)$ geschrieben. Die hochgestellten Zahlen sind hier als Indizes zu verstehen, nicht als Potenzen! Um hervorzuheben, dass die Funktion $f$ eine Funktion in den $n$ Variablen $x^1, \ldots, x^n$ ist, schreibt man auch $$f(x)=f(x^1,x^2,\ldots,x^n).$$ Die $k$-te partielle Ableitung an der Stelle $x_0$ ist dann der Grenzwert $$\partial_kf(x_0)=\lim_{t\to 0}\frac{f(x_0^1,\ldots,x_0^{k-1},x_0^k+t,x_0^{k+1},\ldots,x_0^n)-f(x_0)}{t}.$$
6.1.2. Proposition.
Beweis.
- Es ist $h=\sum_{k=1}^n h^ke_k$. Wegen der Linearität der Ableitung $\partial f(x_0)$ gilt folglich $$ \partial f(x_0)h=\sum_{k=1}^nh^k\partial f(x_0)e_k= \sum_{k=1}^n\partial_kf(x_0)h^k.$$
- Eine lineare Abbildung $A=(A^1,\ldots,A^m)\colon E\to \mathbb K^m$ ist genau dann stetig, wenn alle Koordinatenabbildungen $A^1, \ldots, A^m$ als lineare Abbildungen $E\to \mathbb K$ stetig sind. Der Grenzwert $$\lim_{x\to x_0}\frac{f(x)-f(x_0)-\partial f(x_0)(x-x_0) }{\|x-x_0\|}$$ ist genau dann der Nullvektor in $\mathbb K^m$, wenn für jedes $j\le m$ der Grenzwert $$\lim_{x\to x_0}\frac{f^j(x)-f^j(x_0)-\partial f^j(x_0)(x-x_0) }{\|x-x_0\|}$$ die Zahl Null in $\mathbb K$ ist.
qed
Definition. Es sei $X$ offen in $\mathbb R^n$ und $f=(f^1,\ldots,f^m)\colon X\to \mathbb R^m$ sei in $x_0$ partiell differenzierbar. Dann heißt die Matrix \[
\left(\partial_kf^j(x_0)\right)=\left(
\begin{array}{ccc}
\partial_1f^1(x_0) & \ldots & \partial_nf^1(x_0)\\
\vdots&&\vdots\\
\partial_1f^m(x_0) & \ldots & \partial_nf^m(x_0)
\end{array}\right)\] Jacobimatrix oder Funktionalmatrix von $f$ in $x_0$.
6.1.3. Korollar. Ist $X$ offen in $\mathbb R^n$ und $f=(f^1,\ldots,f^m)\colon X\to \mathbb R^m$ in $x_0$ differenzierbar, so ist jede Koordinatenfunktion $f^j$ partiell differenzierbar und die Ableitung von $f$ in $x_0$ wird bezüglich der Standard-Einheitsbasen durch die Jacobimatrix dargestellt.
Wir haben gesehen, dass die Existenz der partiellen Ableitungen einer Funktion noch nicht deren Differenzierbarkeit implizieren. Der nächste Satz liefert ein Kriterium für die Differenzierbarkeit.
6.1.4. Satz. Es sei $X$ offen in $\mathbb R^n$. Dann ist $f\colon X\to \mathbb R^m$ genau dann stetig differenzierbar, wenn $f$ stetig partiell differenzierbar ist.
Im Allgemeinen gelten also die Implikationen:
$f$ stetig ist partiell differenzierbar $\Rightarrow f$ ist differenzierbar $\Rightarrow f$ ist partiell differenzierbar.
Beweis von 6.1.4. Ist $f$ stetig differenzierbar, so ist nichts zu beweisen. Andernfalls reicht es, die Aussage für $m=1$ zu beweisen. Es sei $x\in X$ gegeben und ein $\varepsilon \gt 0$ so klein, dass $U_\varepsilon(x)\subset X$ gilt. Auf $\mathbb R^n$ benutzen wir, der einfacheren Darstellung halber, die $\infty$-Norm. Es sei also $h=(h^1,\ldots,h^n)\in \mathbb R^n$ gegeben mit $|h|_\infty\lt \varepsilon$. Wir setzen $x_0:=x$ und rekursiv $x_k:= x_{k-1}+h^ke_k$. Dann gilt $$f(x+h)-f(x)=\sum_{k=1}^n\left(f(x_k)-f(x_{k-1})\right).$$ Wenden wir den Mittelwertsatz der Differentialrechnung an, so finden sich Werte $0\lt c^k\lt h^k$, so dass mit $y_k:= x_{k-1}+c^ke_k$ gilt $$\frac{f(x_k)-f(x_{k-1})}{h^k}=\partial_k f(y_k).$$ Insgesamt erhalten wir die Darstellung $$f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k =\sum_{k=1}^n h^k \left(\partial_k f(y_k)-\partial_k f(x)\right),$$ aus der sich die Abschätzung $$\left\|f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k \right\|
\le |h|_\infty \sum_{k=1}^n \sup_{|\gamma|_\infty\le |h|_\infty} \|\partial_k f(x+\gamma)-\partial_k f(x)\|$$ ergibt. Aus der Stetigkeit der partiellen Ableitungen folgt nun $$\lim_{h\to 0}\sum_{k=1}^n \sup_{|\gamma|_\infty\le |h|_\infty} \|\partial_k f(x+\gamma)-\partial_k f(x)\|=0$$ und damit die Differenzierbarkeitsbedingung $$\lim_{h\to 0}\frac{f(x+h)-f(x)-\sum_{k=1}^n\partial_kf(x)h^k }{|h|_\infty}=0.$$qed
Mit einer kleinen Variation lässt sich der Satz auf Funktionen mit Werten in Banachräumen verallgemeinern; dazu muss man den Mittelwertsatz der Differentialrechnung, der nur für Funktionen mit Werten in den reellen Zahlen gilt, ersetzen durch einen geeigneten anderen Mittelwertsatz. Wir kommen später darauf zurück. Das Ergebnis nehmen wir aber bereits jetzt zur Kenntnis:
6.1.4'. Satz. Es sei $X$ offen in $\mathbb R^n$ und $F$ ein Banachraum. Dann ist $f\colon X\to F$ genau dann stetig differenzierbar, wenn $f$ stetig partiell differenzierbar ist.