ZENTHOS Workspace
RAW · · 2026-04-25 · 4 min · #8HKMF6Z

梯度上升和梯度下降

梯度上升与梯度下降本质是同一逻辑的反向应用:前者沿梯度正方向迭代以最大化目标函数,后者沿反方向迭代以最小化。表格从核心目标、数学逻辑、适用场景等六个维度对比,并揭示两者可通过取负相互转化。

以下表格从 核心目标、数学逻辑、适用场景、关键公式、符号含义、收敛方向 6个维度,清晰对比梯度上升与梯度下降,公式中避免竖线冲突,同时补充通俗解释,帮你彻底分清:

对比维度 梯度下降(Gradient Descent) 梯度上升(Gradient Ascent)
核心目标 最小化目标函数(如损失函数Loss、误差函数),找到函数的最小值点 最大化目标函数(如似然函数Likelihood、奖励函数Reward),找到函数的最大值点
数学逻辑 函数梯度(∇f(x))指向“函数值增长最快的方向”,因此沿梯度反方向(-∇f(x))迭代,函数值逐步减小 沿梯度正方向(∇f(x))迭代,函数值逐步增大(直接利用梯度的“增长特性”)
适用场景 1. 监督学习:最小化损失函数(如MSE、交叉熵,用于线性回归、神经网络训练);
2. 强化学习:无模型/有模型中的参数优化(如DQN的网络权重更新)
1. 概率建模:最大化似然函数(如逻辑回归参数估计、贝叶斯模型训练);
2. 强化学习:策略梯度算法(如REINFORCE)最大化累积奖励;
3. 优化问题:直接最大化目标函数(如收益、效用函数)
关键迭代公式 参数更新:\(x_{k+1} = x_k - \eta \cdot \nabla f(x_k)\)
\(x\)为待优化参数,\(k\)为迭代次数)
参数更新:\(x_{k+1} = x_k + \eta \cdot \nabla f(x_k)\)
(与梯度下降仅差“+/-”号)
公式符号含义 - \(\eta\)(学习率/步长):控制每次更新幅度(\(\eta \in [0,1]\));
- \(\nabla f(x_k)\):参数\(x_k\)处的梯度;
- “-”:沿梯度反方向移动
- \(\eta\)(步长):含义与梯度下降一致;
- \(\nabla f(x_k)\):参数\(x_k\)处的梯度;
- “+”:沿梯度正方向移动
收敛方向 逐步靠近函数的局部最小值(凸函数下为全局最小值) 逐步靠近函数的局部最大值(凸函数的对偶问题中为全局最大值)
通俗类比 从山顶往下走,每次沿“最陡的下坡方向”迈一步,直到走到山谷最低点 从山谷往上爬,每次沿“最陡的上坡方向”迈一步,直到走到山顶最高点

核心关联与补充:

  1. 本质是“同一逻辑的反向应用”
    梯度上升和梯度下降没有本质区别,仅目标函数的优化方向相反——将梯度上升的目标函数取负(\(g(x) = -f(x)\)),最大化\(f(x)\)就等价于最小化\(g(x)\),此时梯度上升公式可转化为梯度下降:
    \(x_{k+1} = x_k + \eta \cdot \nabla f(x_k) = x_k - \eta \cdot \nabla (-f(x_k)) = x_k - \eta \cdot \nabla g(x_k)\)
  2. 强化学习中的典型应用

  3. 梯度下降:Q-Learning(表格型无需,但DQN等深度强化学习中,用梯度下降最小化“目标Q值与预测Q值的损失”);

  4. 梯度上升:策略梯度算法(如REINFORCE),直接最大化“策略的累积奖励期望”,参数更新用梯度上升。
  5. 关键注意点

  6. 两者的核心控制变量都是\(\eta\)(步长):\(\eta\)过大会导致震荡不收敛,过小会导致收敛过慢;

  7. 收敛性依赖目标函数特性:凸函数下两者都能找到全局最优,非凸函数可能陷入局部最优(需通过动量、学习率调度等优化)。