dfp算法 - 华诚网

dfp算法

【【技术分享】L-BFGS算法】本文原作者：尹迪，经授权后发布。原文链接： cloud.tencent.com/devel...在优化领域，牛顿法和拟牛顿法是常用的求解极小化问题的方法，但它们各有优劣。牛顿法虽然收敛速度快，但计算复杂，需要求解Hesse矩阵及其逆矩阵；而拟牛顿法通过近似Hesse矩阵...

【技术分享】L-BFGS算法

xiaohua 2024-12-26BFGS dfp算法

本文原作者：尹迪，经授权后发布。

原文链接： cloud.tencent.com/devel...

在优化领域，牛顿法和拟牛顿法是常用的求解极小化问题的方法，但它们各有优劣。牛顿法虽然收敛速度快，但计算复杂，需要求解Hesse矩阵及其逆矩阵；而拟牛顿法通过近似Hesse矩阵的逆矩阵，避免了求解Hesse矩阵的复杂性。本文将详细介绍牛顿法、拟牛顿法，包括DFP算法、BFGS算法以及限制内存BFGS（L-BFGS）算法，并探讨L1正则化与OWL-QN算法。

牛顿法通过Taylor级数展开逼近目标函数，并在当前点进行二阶优化，以求得极小点的估计。然而，当初始点远离极小点时，牛顿法可能不收敛，因此引入阻尼牛顿法，通过增加搜索方向来提高稳定性。

拟牛顿法通过构建不包含二阶导数的矩阵来近似Hesse矩阵的逆矩阵，克服了牛顿法的计算复杂性。其中，DFP算法通过秩1校正策略构造近似矩阵，而BFGS算法进一步优化了DFP算法，使得计算效率更高。

L-BFGS算法针对大规模优化问题，通过限制存储和计算，仅保存最近m次迭代信息，极大地减少了数据存储空间，提高了计算效率。通过重新整理迭代公式，L-BFGS算法在保持收敛性的同时，显著降低了计算复杂性。

在机器学习中，L1正则化被广泛应用，它通过添加L1正则项到损失函数中，限制模型参数，达到特征选择和减少过拟合的效果。为了解决L1正则化项不可微的难题，OWL-QN算法基于L-BFGS算法，采用象限映射和伪梯度函数，实现了解L1正则化优化问题的有效算法。

本文详细探讨了牛顿法、拟牛顿法、L-BFGS算法、L1正则化以及OWL-QN算法的原理、构造和应用，为优化问题的求解提供了丰富的理论基础和实际应用指导。

继续阅读：【技术分享】L-BFGS算法