主要内容
课程: 多变量微积分 > 单元 2
课程 3: 对向量值函数求导 (文章)多变量链式法则, 简单版本
导数的链规则可以扩展到更高的维度. 在这里我们看到了在相对简单的情况下, 复合函数是一个单变量函数的样子。
我们要做什么
- 已知一个多变量函数
, 和两个单变量函数 和 , 则多变量链式法则是:
更常规的链式法则
正如大家可能想象的那样, 多变量链式法则是单变量微积分链式法则的推论. 单变量链式法则, 说明了如何求两个函数组合的导数:
如果函数 有两个输入变量 , 而不是一个输入变量 会怎样?
在这种情况下, 用标量函数 来组合它是没有意义的. 相反, 假设有两个独立的标量值函数 和 , 将它们作为 的坐标代入. 总体的组合式子将是一个单变量函数, 这个函数只有一个输入值 ,也只有一个输出值 , 如这个图表所示:
关于这个新的单变量函数 的计算,也有一个链式法则, 并且涉及到 的偏导数:
需要注意, 是如下式子的简写
也就是说, 两者都是 的函数, 但 是由中间函数 和 表示的.
这样写, 与单变量导数的类比就更加清晰了.
梯度 扮演了 导数的角色, 向量导数 扮演了 普通导数的角色.
有关链式法则的直觉
一开始, 可以将单变量链式法则看做诸如 一样的组合. 可以这样理解这个组合:
- 首先,
将数轴上的点 映射到数轴上的另一个点 . - 然后
将点 映射到数轴上的另一个点
为了理解 的导数, 就需要理解一个关于 的微小变动, 对最终输出的影响.
让我们深入研究下链式法则, 到底是怎么说的.
- 表达式
代表了, 一个关于 的微小变化,是如何影响中间输出量 的。
- 表达式
代表了一个 的微小变化, 是如何影响到最终输出 的。
- 由于
的小变化而造成的 的总变化, 是这两个影响因素的乘积。
将此直觉扩展到多维度
直觉对于多变量链规则是相似的. 可以把 想成将数轴上的一点对应到 -平面上的一点的映射, 把 想成将该点对应回到数轴上某个位置的映射. 问题是, 一个关于初始输入 的小的变化, 是怎样改变总输出 的?
我们分解一下多变量链式法则的意思, 将它分解为复合函数 和 的形式:
- 表达式
代表了 的一个微小变化, 是如何影响中间变量 的。
- 同样的, 表达式
代表了 的微小变化是如何影响第二个中间变量 的。
- 表达式
代表了对于 -组成部分 关于 的一个微小的变化, 是如何影响输出的,类似的, 表达式 记录了 对于 -组成部分 关于 的一个微小变化,是如何影响输出的。
的微小变化影响 的一种方式是, 先改变 , 然后跟着影响 . 这个效应由乘积 表示。
的变化影响 的另一种方式是, 先改变第二个中间变量 , 这个中间变量跟着影响输出 . 这种效应由乘积 表示.- 将这两个乘积加起来, 就能得到
的总变化.
事实上, 就是这样的! 在特殊值 处的导数, 就是 自变量域的向量:
如果 被解释为这个空间内的一个参数路径, 比如可以想成是一个例子的运动轨迹, 那么在特定时间点 的导数, 就是该粒子在此时刻的速度向量.
在这种解释下, 链式法则告诉我们, 复合函数 是 沿 导数方向的向量导数.
这样就有意义了, 因为根据导数的定义, 对 的一个微小变化 " " ,会产生一个对输出量 的一个微小变化 . 然后方向导数的要点是对输入量 的一个微小变化 会产生一个微小变化 , 正如公式 定义的那样.
例1: 使用或不适用新的链式法则
定义 如下:
定义 如下:
求 的导数.
不用链式法则的解法:
在使用我们新奇工具解决这个问题之前,值得指出的是, 是可以先将该组合, 写成单变量函数 的形式的:
现在可以求普通导数:
但是当然,这个例子的目的, 是让我们了解一下链式法则的感觉.
使用链式法则的解法:
首先, 明确的写出 的组成函数:
根据链式法则,
代入偏导数 以及普通导数 , , 可以得到
为了让所有的式子都用 表示, 代入 和 .
令人欣慰的是,这与不使用链式法则的答案相同。有人会认为, 这种新的链式规则使事情变得不必要地复杂,并且,对于像这样的具体计算,它常常是不需要的。
然而,正如下一个例题所示,这种方法, 对写出未知函数形式的方程是有用的。
例2: 未知函数
假设一个二维区域的温度, 随函数 变化, 并且该函数未知. 你漫步在此区域, 对所到之处的温度采样,并且你的 和 坐标, 是时间的函数, 如下
在测量时, 你发现自己路径上的温度, 从未改变过. 那关于 的偏导数,你能得出什么结论?
总结
- 已知一个多变量函数
, 和两个单变量函数 和 , 则多变量链式法则是: