AI工具导航官网 | 1000+ AI工具导航合，国内外AI工具导航导航大全

XGBoost

词条分类：机器学习最后更新：2025-03-05

词条介绍

简要定义

XGBoost（eXtreme Gradient Boosting）是一种高效且可扩展的梯度提升决策树算法，由陈天奇等人开发，旨在解决梯度提升决策树（GBDT）在大规模数据集上的效率和可扩展性问题。XGBoost 通过优化目标函数、改进计算效率和防止过拟合等方式，显著提升了梯度提升方法的表现。

核心价值

核心技术

目标函数与正则化 ：XGBoost 的目标函数由经验风险和结构风险组成，经验风险是损失函数的累加，结构风险是正则化项，用于控制模型复杂度，防止过拟合。其独特之处在于对损失函数进行了二阶泰勒展开，将目标函数转化为关于当前预测值的加法模型，便于使用决策树进行拟合。
迭代优化过程 ：在每一步迭代中，模型会计算残差的负梯度作为新的学习目标，训练一个决策树来拟合该梯度，并以适当的学习率将新树加入到累加函数中，逐步减小残差，从而提升模型的整体性能。
并行处理机制 ：XGBoost 的并行化主要基于两个核心概念：一个是树节点级别的并行化，另一个是特征级别的并行化。在树节点级别，并行化发生在每一棵树的构建过程中，特别是在寻找最佳分裂点时。XGBoost 可以并行地在不同节点上评估分裂点，利用多线程快速缩小候选集合，从而加速树的生长过程。在特征级别，XGBoost 可以对多个特征同时计算最佳分裂点，这进一步提高了模型训练的效率。

关键特征

应用领域