最优化算法速通 - 凸集和凸函数
几何概念
- 线段:
- 超平面:
, 是法向量, 是截距 , 是平面上一点
- 半空间
- 正半空间
- 负半空间
- 正半空间
- 线性簇: 线性方程组的解集
凸集
- 定义: 任意两点间的线段 (凸组合) 位于集合内
- 空集, 单点集, 线性簇是凸集
- 半正定矩阵集是凸集
- 保凸运算
- 数乘, Minkowoski 和(任意两个不同集的向量相加得到新集合), 交集
- 仿射变换
- 极点: 不能表达成集合内两个点连线段的"内点"
- 邻域, 内点, 开集, 边界, 闭集, 紧集
- 极值原理: 连续函数在紧集上一定能取到闭集
多面体

- 支撑超平面: 经过凸集的边界点, 使凸集完全位于一个半空间内
- 多面体: 可表示为有限个半空间的交集
- 非空有界的多面体:
序列与极限
- 矩阵序列
收敛于 : - 矩阵收敛于零矩阵
矩阵的谱半径小于 1 - 矩阵的幂级数收敛
矩阵收敛于零矩阵 - 矩阵值函数
在某点连续且函数值可逆, 则存在邻域使得 存在且连续
可微性
仿射函数: 存在线性函数
可微性: 理解为对函数仿射逼近 (一阶 Taylor 逼近)
- 一元函数时, 退化为一元函数的导数
- 多元函数时, 退化为多元函数的梯度
列向量 行向量
向量值函数
纵轴(第一维)是因变量, 横轴(第二维)是自变量
Hessian 矩阵: 梯度的 Jacobi 矩阵, 二阶导

链式法则:

注意把向量的形状凑对, 求复合函数的 Jacobi, 只需外层 Jacobi 乘内层 Jacobi
方向导数: 单位方向向量点乘梯度
水平集
- 单值函数在水平
上的水平集(等值线):- 等值线不相交
- 等值线疏密程度刻画函数变化快慢
- 等值线与梯度垂直
- 等值线在极值点附近近似为椭圆

Taylor 展开
可微函数
- 同阶无穷小
: 在原点的某邻域内有界 - 高阶无穷小
:
多元数量值函数的二阶 Taylor 展开 (假设二阶可微)
余项也可以是
中值定理 (类似 Lagrange 中值)


极小点
- 局部极小点: 去心邻域内
- 全局极小点:
- 严格局部极小点: 去心邻域内
- 严格全集极小点
- 可行方向
:
最优性条件
- 一阶必要条件:
- 若
是内点, 则
- 若
- 二阶必要条件:
且- 若
是内点, 则 且 Hessian 矩阵半正定
- 若
- 二阶充分条件:
是内点, 则 且 Hessian 矩阵正定