python_GBDT分析（python gbdt）-eolink官网

python_GBDT分析（python gbdt）

python_GBDT分析

(Gradient Boosting Machines)#### Gradient Boosted Regression Trees (Gradient Boosting Machines)random_state# Gradient Boosted Regression Trees (Gradient Boosting Machines)# GBDT# 在乳腺癌数据集上应用 GradientBoostingClassifier 的示例。默认使用 100 棵树，# 最大深度是 3，学习率为 0.1from sklearn.ensemble import GradientBoostingClassifierX_train, X_test, y_train, y_test = train_test_split( cancer.data, cancer.target, random_state=0)gbrt = GradientBoostingClassifier(random_state=0)gbrt.fit(X_train, y_train)print("Accuracy on training set: {:.3f}".format(gbrt.score(X_train, y_train)))print("Accuracy on test set: {:.3f}".format(gbrt.score(X_test, y_test)))Accuracy on training set: 1.000Accuracy on test set: 0.965# 由于训练集精度达到 100%，所以很可能存在过拟合。为了降低过拟合，我们可以限制最# 大深度来加强预剪枝，也可以降低学习率：gbrt = GradientBoostingClassifier(random_state=0, max_depth=1)gbrt.fit(X_train, y_train)print("Accuracy on training set: {:.3f}".format(gbrt.score(X_train, y_train)))print("Accuracy on test set: {:.3f}".format(gbrt.score(X_test, y_test)))Accuracy on training set: 0.991Accuracy on test set: 0.972gbrt = GradientBoostingClassifier(random_state=0, learning_rate=0.01)gbrt.fit(X_train, y_train)print("Accuracy on training set: {:.3f}".format(gbrt.score(X_train, y_train)))print("Accuracy on test set: {:.3f}".format(gbrt.score(X_test, y_test)))Accuracy on training set: 0.988Accuracy on test set: 0.965# 降低模型复杂度的两种方法都降低了训练集精度，这和预期相同。在这个例子中，减小树# 的最大深度显著提升了模型性能，而降低学习率仅稍稍提高了泛化性能# 对于其他基于决策树的模型，我们也可以将特征重要性可视化，以便更好地理解模型# （图 2-35）。由于我们用到了 100 棵树，所以即使所有树的深度都是 1，查看所有树也是# 不现实的：gbrt = GradientBoostingClassifier(random_state=0, max_depth=1)gbrt.fit(X_train, y_train)plot_feature_importances_cancer(gbrt)

可以看到，梯度提升树的特征重要性与随机森林的特征重要性有些类似，不过梯度提升完全忽略了某些特征。由于梯度提升和随机森林两种方法在类似的数据上表现得都很好，因此一种常用的方法就是先尝试随机森林，它的鲁棒性很好。如果随机森林效果很好，但预测时间太长，或者机器学习模型精度小数点后第二位的提高也很重要，那么切换成梯度提升通常会有用。

Iterator与LIstIterator接口在java中的区别有哪些

299 2022-08-24

python_GBDT分析（python gbdt）

vue项目接口域名动态的获取方法

Iterator与LIstIterator接口在java中的区别有哪些

分析EBS常用接口表

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

遇到百度网址安全中心提醒您该页面可能存在钓鱼欺诈信息

软件接口设计怎么做？前后端分离软件接口设计思路

python_GBDT分析（python gbdt）

微信扫一扫：分享

推荐文章

最近发表

热评文章