主要内容
海森矩阵
海森矩阵是一个组织一个函数的所有第二偏导数的矩阵。
背景:
海森矩阵
多变量函数 的”海森矩阵“,不同的作者会写为 ,, ,或者 ,把所有二阶偏导数组织到一个矩阵中:
所以, 这里需要注意两件事:
- 这只对标量值函数有意义。
- 此对象
不是普通矩阵;它是一个矩阵与 函数 作为元素。 换句话说,它的目的是在某个点计算 。
因此,你也许会将这个对象 作为”矩阵“函数调用,是吗?
更重要的是, "海森" 一词有时也指这个矩阵的行列式 而不是矩阵本身。
示例: 计算海森
问题: 计算 在点 的海森:
解析: 最终我们需要 的所有二阶偏导数, 因此, 让我们首先计算这两个偏导数:
有了这些,我们计算所有四个二阶偏导数:
在这种情况下,海森矩阵是一个 矩阵,这些函数作为每一个元素:
我们被要求在点 处对此进行计算,因此我们带入这些值:
现在,问题是有歧义的,因为 "海森" 可以指这个矩阵,也可以指它的行列式。您需要的内容取决于上下文。 例如, 在优化多变量函数时, 有一种叫做 "二阶导数测试" 的东西, 它使用海森行列式。 当海森用于近似函数时, 您只需使用矩阵本身。
如果我们想要的是行列式,下面是我们得到的:
使用
包含多变量函数的所有二阶导数信息,海森矩阵通常起到类似于单变量微积分中的普通二阶导数的作用。最值得注意的是,它出现在这两种情况中:
- 多变量函数的二次近似, 这有点像二阶泰勒展开,但是用于多变量函数。
- 二阶偏导数测试,这有助于您找到多变量函数的最大值/最小值。