BFGS

【【技术分享】L-BFGS算法】 本文原作者:尹迪,经授权后发布。原文链接: cloud.tencent.com/devel...在优化领域,牛顿法和拟牛顿法是常用的求解极小化问题的方法,但它们各有优劣。牛顿法虽然收敛速度快,但计算复杂,需要求解Hesse矩阵及其逆矩阵;而拟牛顿法通过近似Hesse矩阵...

【技术分享】L-BFGS算法

本文原作者:尹迪,经授权后发布。

原文链接: cloud.tencent.com/devel...

在优化领域,牛顿法和拟牛顿法是常用的求解极小化问题的方法,但它们各有优劣。牛顿法虽然收敛速度快,但计算复杂,需要求解Hesse矩阵及其逆矩阵;而拟牛顿法通过近似Hesse矩阵的逆矩阵,避免了求解Hesse矩阵的复杂性。本文将详细介绍牛顿法、拟牛顿法,包括DFP算法、BFGS算法以及限制内存BFGS(L-BFGS)算法,并探讨L1正则化与OWL-QN算法。

牛顿法通过Taylor级数展开逼近目标函数,并在当前点进行二阶优化,以求得极小点的估计。然而,当初始点远离极小点时,牛顿法可能不收敛,因此引入阻尼牛顿法,通过增加搜索方向来提高稳定性。

拟牛顿法通过构建不包含二阶导数的矩阵来近似Hesse矩阵的逆矩阵,克服了牛顿法的计算复杂性。其中,DFP算法通过秩1校正策略构造近似矩阵,而BFGS算法进一步优化了DFP算法,使得计算效率更高。

L-BFGS算法针对大规模优化问题,通过限制存储和计算,仅保存最近m次迭代信息,极大地减少了数据存储空间,提高了计算效率。通过重新整理迭代公式,L-BFGS算法在保持收敛性的同时,显著降低了计算复杂性。

在机器学习中,L1正则化被广泛应用,它通过添加L1正则项到损失函数中,限制模型参数,达到特征选择和减少过拟合的效果。为了解决L1正则化项不可微的难题,OWL-QN算法基于L-BFGS算法,采用象限映射和伪梯度函数,实现了解L1正则化优化问题的有效算法。

本文详细探讨了牛顿法、拟牛顿法、L-BFGS算法、L1正则化以及OWL-QN算法的原理、构造和应用,为优化问题的求解提供了丰富的理论基础和实际应用指导。
继续阅读:【技术分享】L-BFGS算法