080 拉格朗日乘子 Lagrange Multipliers
受约束的最大值和最小值
我们先看一个能够通过消除一个变量求解带约束条件的最小值问题。
例1 求点 在平面 上距离原点最近的点。
解:这个问题本质上就是求解带约束条件 时 的最小值。
由于 有最小值,即函数 的最小值,约束条件不变。如果将 看作自变量那么 可以写作 那么问题就变成了求解 的最小值。那么根据上一小节的理论,最小值出现在满足条件 的点。那么 即 这里忽略使用二阶偏微分证明此时 有最小值。那么 坐标是 因此要求的点是 最小距离是
不过,使用替换法解决带约束的并不能总是成功,需要多次尝试。
例2 求双曲柱面 上距离原点最近的点。
解:柱面如下所示。
我们的目标是在约束 这个条件下求解函数 的最小值。如果将 看作自变量,那么 代入函数 得到 根据上一节的理论,最小值点是临界点 即点 处有最小值。不过当 时,点不在柱面上。
问题出在那里了呢?对 进行一阶偏微分测试点的集合是 平面,同时我们期望这个最小值对应的点就是柱面的最小值出现的点,但是后者的定义域不是整个 平面,不包含 之间的部分。如下图所示。
如果将 看作自变量就能避免这个问题,那么 代入 得到 现在要求 的最小值。这里 的定义域是 平面,与柱面定义域一致,没有上述问题。 最小值出现在 那么 也就是说,距离原点最近的点是 ,距离是 1。从 也能印证这个结论。
解法 2。想象在原点处有一个以原点为圆心的小球,然后膨胀与柱面相切。在接触点,柱面与球面有相同的切平面和法线。如下图所示。
如果令 都为零得到的等高线表示球面和柱面,那么梯度 平行。在任意接触点,能够找一个 (标量)使得 或者 那么有 由于 ,那么为了满足 代入 得到 ,所以 。那么我们要求的点是 这个点满足 ,所以 与之前结论一致。
拉格朗日乘子法
上面的例子使用了拉格朗日乘子法(method of Lagrange multiplier
)。这个方法是说求解带约束条件 时函数 的极值点满足
其中 是标量,称为拉格朗日乘子(Lagrange multiplier
)。
为了证明其正确性,我们先引入下面这个定理。
定理 12 正交梯度定理(The Orthogonal Gradient Theorem
)
假定函数 在某个区域上可微,这个区域上有一光滑曲线 如果 在曲线上的点 处取得极值,那么 在该点处与曲线正交。
证明:曲线上对应的 的值由复合函数 给出,对于 求导是 在某点 处 取得极值,那么 ,因此
丢弃定理 12 中的 项,得到如下结论。
推论
可导函数 在光滑曲线 的某点处取得极值,那么在该点处有 。
定理 12 是拉格朗日乘子的关键。假定 是可微的,点 是曲线 上的一点,在该点处 取得极值。假定在该处 。 在 处取得极值,那么 正交与每一条通过 的曲线的切线。因为 正交与等高线 ,那么 也正交与每一条通过 的曲线的切线。因此 是 与标量 的乘积。
拉格朗日乘子法
假定 可微,当 时 。为了求解 在约束条件 的极值,可以通过解满足下面方程的 得到。 前提是极值存在。
例3 求函数 在椭圆 上的最大值和最小值。
解:约束条件是 求 的极值。
那么求解满足下面方程的 梯度方程是 那么 所以 第一种情况,,那么 ,但是该点不在椭圆上。
如果 ,那么 此时 ,代入约束条件得到 因此 因此函数 在四个点 取得极值,最大值是 ,最小值是 。
解的几何解释:函数 的等高线是双曲线 ,如下图所示。
距离原点越远, 的绝对值越大。给定点 在椭圆 上,这里要求 的极值。哪一个与椭圆相交的双曲线距离原点最远呢?与之相切的那条双曲线。在这些点处,任意正交与双曲线的矢量也正交与椭圆,因此 是 的 倍。比如在点 处有 即 。在点 处 即 。
例4 求函数 在圆 上的最大值与最小值。
解:由梯度方程 得到 方程 隐含了 ,因此 代入约束条件 得到 因此 因此 因此 在点 处取得极值。 最大值是 最小值是 解的几何意义:函数 的等高线是 。如下图所示。
距离原点越远,函数 越大。那么为了求极值,要找到与圆相切的点。在任意切点,正交与直线的矢量也正交与圆,因此 是 的 倍。比如在点 处有 即 。
两个约束条件的拉格朗日乘子
许多应用是要求函数 在两个约束条件下的极值。如果约束条件是 其中 都是可微的,并且 与 不平行。为了求解带两个约束条件时函数 的极值,我们引入两个拉格朗日乘子 。可以通过计算满足下面方程的 找到极值点 。 方程 的几何解释如下。曲面 相交得到光滑曲线 ,如下图所示。
我们要在这条曲线上找到使得 取得极值的点。根据定理 12,在这些点处 正交与 。由于 上的点位于 平面上,因此在这些点处 也正交与 。因此 位于由 确定的平面,即对某些 有 。由于这些点位于两个平面上,因此满足 。
例5 平面 与圆柱 相交得到一个椭圆。如下图所示。求椭圆上距离原点最近和最远的点。
解:要求极值的函数是 约束条件是 由梯度方程 得到 因此 由此可以得到 从 可以推理得到:要么 ,要么 。
将 代入 ,得到两个点 。这两个点位于椭圆上,如上所示。
如果 ,代入 得到 相应的点是 尽管 都是局部最大值所在的点,但是 距离原点更远。
距离原点最近的点是 ,距离是 1。