En càlcul infinitesimal , la regla de la cadena és una fórmula per a calcular la derivada de la composició de dues funcions.
De forma intuïtiva, si una variable , y , depèn d'una segona variable, u , i aquesta alhora depèn d'una tercera variable, x , llavors la velocitat de canvi de y respecte de x es pot calcular com la velocitat de canvi de y respecte de u multiplicada per la velocitat de canvi de u respecte de x .
La regla de la cadena diu que, quan es compleixen les condicions adequades, se satisfà que
(
f
∘
g
)
′
(
x
)
=
f
′
(
g
(
x
)
)
g
′
(
x
)
,
{\displaystyle (f\circ g)'(x)=f'(g(x))g'(x),\,}
Això de forma resumida s'escriu
(
f
∘
g
)
′
=
f
′
∘
g
⋅
g
′
{\displaystyle (f\circ g)'=f'\circ g\cdot g'}
.
De forma alternativa, emprant la notació de Leibniz ,
d
f
d
x
=
d
f
d
g
d
g
d
x
.
{\displaystyle {\frac {df}{dx}}={\frac {df}{dg}}{\frac {dg}{dx}}.}
La contrapartida en càlcul integral de la regla de la cadena és la regla de substitució .
La regla de la cadena d'una variable es pot definir de forma més precisa tal com segueix.[ 1] [ 2] Sia f una funció real sobre (a ,b ) que és diferenciable a c ∈ (a ,b ); i g una funció real definida sobre un interval I que conté el rang de f i f (c ) com un punt interior . Si g és derivable a f (c ), llavors
(
f
∘
g
)
(
x
)
{\displaystyle (f\circ g)(x)}
és derivable a x =c , i
(
f
∘
g
)
′
(
c
)
=
f
′
(
g
(
c
)
)
g
′
(
c
)
.
{\displaystyle (f\circ g)'(c)=f'(g(c))g'(c).}
Suposant els cas on, hom està pujant a un cim a una velocitat de 0.5 kilòmetres per hora. La temperatura és més baixa a alçades més grans; Suposant que el ritme a què baixa la temperatura és de 6 °C per kilòmetre. Si es multiplica 6 °C per kilòmetre per 0.5 kilòmetres per hora, s'obté 3 °C per hora. Aquest càlcul és una aplicació típica de la regla de la cadena.
Considerant
f
(
x
)
=
(
x
2
+
1
)
3
{\displaystyle \,f(x)=(x^{2}+1)^{3}}
. Es té
f
(
x
)
=
h
(
g
(
x
)
)
{\displaystyle \,f(x)=h(g(x))}
on
g
(
x
)
=
x
2
+
1
{\displaystyle \,g(x)=x^{2}+1}
i
h
(
x
)
=
x
3
.
{\displaystyle \,h(x)=x^{3}.}
Així doncs,
f
′
(
x
)
{\displaystyle f'(x)\,}
=
h
′
(
g
(
x
)
)
g
′
(
x
)
{\displaystyle =h'(g(x))g'(x)\,}
=
3
(
g
(
x
)
)
2
(
2
x
)
{\displaystyle =3(g(x))^{2}(2x)\,}
=
3
(
x
2
+
1
)
2
(
2
x
)
{\displaystyle =3(x^{2}+1)^{2}(2x)\,}
=
6
x
(
x
2
+
1
)
2
.
{\displaystyle =6x(x^{2}+1)^{2}.\,}
Per a calcular la derivada de la funció trigonomètrica
f
(
x
)
=
sin
(
x
2
)
,
{\displaystyle f(x)=\sin(x^{2}),\,}
Es pot escriure
f
(
x
)
=
h
(
g
(
x
)
)
{\displaystyle f(x)=h(g(x))}
amb
h
(
x
)
=
sin
x
{\displaystyle h(x)=\sin x}
i
g
(
x
)
=
x
2
{\displaystyle g(x)=x^{2}}
.
La regla de la cadena dona
f
′
(
x
)
=
2
x
cos
(
x
2
)
{\displaystyle f'(x)=2x\cos(x^{2})\,}
Donat que
h
′
(
g
(
x
)
)
=
cos
(
x
2
)
{\displaystyle h'(g(x))=\cos(x^{2})}
i
g
′
(
x
)
=
2
x
{\displaystyle g'(x)=2x}
.
Deriveu
arctan
sin
x
{\displaystyle \arctan \,\sin \,x}
, etc.
d
d
x
arctan
x
=
1
1
+
x
2
{\displaystyle {\frac {d}{dx}}\arctan \,x\,=\,{\frac {1}{1+x^{2}}}}
d
d
x
arctan
f
(
x
)
=
f
′
(
x
)
1
+
f
2
(
x
)
{\displaystyle {\frac {d}{dx}}\arctan \,f(x)\,=\,{\frac {f'(x)}{1+f^{2}(x)}}}
d
d
x
arctan
sin
x
=
cos
x
1
+
sin
2
x
{\displaystyle {\frac {d}{dx}}\arctan \,\sin \,x\,=\,{\frac {\cos \,x}{1+\sin ^{2}\,x}}}
Regla de la cadena per a diverses variables
modifica
La regla de la cadena també funciona per a funcions de més d'una variable. Si les funcions
z
=
f
(
x
,
y
)
{\displaystyle z=f(x,y)}
on
x
=
g
(
t
)
{\displaystyle x=g(t)}
i
y
=
h
(
t
)
{\displaystyle y=h(t)}
, i
g
(
t
)
{\displaystyle g(t)}
i
h
(
t
)
{\displaystyle h(t)}
són derivables respecte de
t
{\displaystyle t}
, llavors
d
z
d
t
=
∂
f
∂
x
d
x
d
t
+
∂
f
∂
y
d
y
d
t
{\displaystyle {\ dz \over dt}={\partial f \over \partial x}{dx \over dt}+{\partial f \over \partial y}{dy \over dt}}
Suposant que cada funció de
z
=
f
(
u
,
v
)
{\displaystyle z=f(u,v)}
és una funció de dues variables tal que
u
=
h
(
x
,
y
)
{\displaystyle u=h(x,y)}
and
v
=
g
(
x
,
y
)
{\displaystyle v=g(x,y)}
, i suposant que totes aquestes funcions siguin derivables. Llavors la regla de la cadena adopta la següent forma:
∂
z
∂
x
=
∂
z
∂
u
∂
u
∂
x
+
∂
z
∂
v
∂
v
∂
x
{\displaystyle {\partial z \over \partial x}={\partial z \over \partial u}{\partial u \over \partial x}+{\partial z \over \partial v}{\partial v \over \partial x}}
∂
z
∂
y
=
∂
z
∂
u
∂
u
∂
y
+
∂
z
∂
v
∂
v
∂
y
{\displaystyle {\partial z \over \partial y}={\partial z \over \partial u}{\partial u \over \partial y}+{\partial z \over \partial v}{\partial v \over \partial y}}
Si es considera
r
→
=
(
u
,
v
)
{\displaystyle {\vec {r}}=(u,v)}
com una funció vectorial, es pot emprar la notació vectorial per a escriure l'equivalent de l'anterior escrivint el producte escalar del gradient de f per la derivada parcial de
r
→
{\displaystyle {\vec {r}}}
:
∂
f
∂
x
=
∇
→
f
⋅
∂
r
→
∂
x
{\displaystyle {\frac {\partial f}{\partial x}}={\vec {\nabla }}f\cdot {\frac {\partial {\vec {r}}}{\partial x}}}
De forma més general, per a funcions vectorials de diverses variables, la regla de la cadena diu que el jacobià de la funció compsició és el producte de les matrius Jacobianes de les dues funcions:
∂
(
z
1
,
…
,
z
m
)
∂
(
x
1
,
…
,
x
p
)
=
∂
(
z
1
,
…
,
z
m
)
∂
(
y
1
,
…
,
y
n
)
∂
(
y
1
,
…
,
y
n
)
∂
(
x
1
,
…
,
x
p
)
{\displaystyle {\frac {\partial (z_{1},\ldots ,z_{m})}{\partial (x_{1},\ldots ,x_{p})}}={\frac {\partial (z_{1},\ldots ,z_{m})}{\partial (y_{1},\ldots ,y_{n})}}{\frac {\partial (y_{1},\ldots ,y_{n})}{\partial (x_{1},\ldots ,x_{p})}}}
Demostració de la regla de la cadena
modifica
Sien f i g funcions i sia x un nombre tal que f és derivable al punt g(x) i g és derivable al punt x . Llavors per la definició de derivada,
g
(
x
+
δ
)
−
g
(
x
)
=
δ
g
′
(
x
)
+
ϵ
(
δ
)
δ
{\displaystyle g(x+\delta )-g(x)=\delta g'(x)+\epsilon (\delta )\delta \,}
on
ϵ
(
δ
)
→
0
{\displaystyle \epsilon (\delta )\to 0\,}
quan
δ
→
0.
{\displaystyle \delta \to 0.}
De manera similar,
f
(
g
(
x
)
+
α
)
−
f
(
g
(
x
)
)
=
α
f
′
(
g
(
x
)
)
+
η
(
α
)
α
{\displaystyle f(g(x)+\alpha )-f(g(x))=\alpha f'(g(x))+\eta (\alpha )\alpha \,}
on
η
(
α
)
→
0
{\displaystyle \eta (\alpha )\to 0\,}
quan
α
→
0.
{\displaystyle \alpha \to 0.\,}
Ara
f
(
g
(
x
+
δ
)
)
−
f
(
g
(
x
)
)
{\displaystyle f(g(x+\delta ))-f(g(x))\,}
=
f
(
g
(
x
)
+
δ
g
′
(
x
)
+
ϵ
(
δ
)
δ
)
−
f
(
g
(
x
)
)
{\displaystyle =f(g(x)+\delta g'(x)+\epsilon (\delta )\delta )-f(g(x))\,}
=
α
δ
f
′
(
g
(
x
)
)
+
η
(
α
δ
)
α
δ
{\displaystyle =\alpha _{\delta }f'(g(x))+\eta (\alpha _{\delta })\alpha _{\delta }\,}
on
α
δ
=
δ
g
′
(
x
)
+
ϵ
(
δ
)
δ
{\displaystyle \alpha _{\delta }=\delta g'(x)+\epsilon (\delta )\delta \,}
.
S'observa que
δ
→
0
,
{\displaystyle \delta \to 0,}
α
δ
δ
→
g
′
(
x
)
{\displaystyle {\frac {\alpha _{\delta }}{\delta }}\to g'(x)}
i
α
δ
→
0
{\displaystyle \alpha _{\delta }\to 0}
, Així
η
(
α
δ
)
→
0
{\displaystyle \eta (\alpha _{\delta })\to 0}
. Per tant
f
(
g
(
x
+
δ
)
)
−
f
(
g
(
x
)
)
δ
→
g
′
(
x
)
f
′
(
g
(
x
)
)
quan
δ
→
0.
{\displaystyle {\frac {f(g(x+\delta ))-f(g(x))}{\delta }}\to g'(x)f'(g(x)){\mbox{ quan }}\delta \to 0.}
Tenim una funció
h
(
x
)
=
f
(
g
(
x
)
)
{\displaystyle \,h(x)=f(g(x))}
. Per la definició de derivada tenim que:
h
′
(
a
)
=
lim
x
→
a
f
(
g
(
x
)
)
−
f
(
g
(
a
)
)
x
−
a
{\displaystyle h^{\prime }(a)=\lim _{x\to a}{\frac {f(g(x))-f(g(a))}{x-a}}}
Multiplicant a dalt i a baix per
g
(
x
)
−
g
(
a
)
{\displaystyle g(x)-g(a)\,}
obtenim:
h
′
(
a
)
=
lim
x
→
a
f
(
g
(
x
)
)
−
f
(
g
(
a
)
)
g
(
x
)
−
g
(
a
)
⋅
g
(
x
)
−
g
(
a
)
x
−
a
{\displaystyle h^{\prime }(a)=\lim _{x\to a}{\frac {f(g(x))-f(g(a))}{g(x)-g(a)}}\cdot {\frac {g(x)-g(a)}{x-a}}}
Aplicant la definició de derivada un altre cop, tenim que:
(
f
∘
g
)
′
(
x
)
=
f
′
∘
g
⋅
g
′
=
f
′
(
g
(
x
)
)
⋅
g
′
(
x
)
{\displaystyle (f\circ g)^{\prime }(x)=f^{\prime }\circ g\cdot g^{\prime }=f^{\prime }(g(x))\cdot g^{\prime }(x)}
Generalització de la regla de la cadena
modifica
La regla de la cadena és una propietat fonamental de totes les definicions de derivada i, per tant, és vàlida en contextos molt més generals. Per exemple, si E , F i G són espai de Banach (els quals inclouen l'Espai euclidià ) i f : E → F i g : F → G són funcions, i si x és un element de E tal que f is derivable al punt x i g is derivable al punt f (x ), llavors la derivada (la derivada de Fréchet ) de la funció composta g o f al punt x ve donada per
D
x
(
g
∘
f
)
=
D
f
(
x
)
(
g
)
∘
D
x
(
f
)
.
{\displaystyle {\mbox{D}}_{x}\left(g\circ f\right)={\mbox{D}}_{f\left(x\right)}\left(g\right)\circ {\mbox{D}}_{x}\left(f\right).}
Fixeu-vos que en aquest cas les derivades són aplicacions lineals . No nombres. Si les aplicacions lineals es representen com a matrius (jacobians ), la composició del cantó dret es transforma en una multiplicació de matrius .
Tensors i la regla de la cadena
modifica
Vegeu camp tensorial per a una explicació avançada del paper que juga la regla de la cadena a la natura dels tensors .