初识人工智能(二):机器学习(三):sklearn数据集

网友投稿 365 2022-06-26


1. sklearn数据集

1.1 数据集划分

机器学习一般的数据集会划分为两个部分:

训练数据:用于训练,构建模型

测试数据:在模型检验时使用,用于评估模型是否有效

sklearn数据集划分API:sklearn.model_selection.train_test_split

1.2 sklearn数据集接口介绍

scikit-learn数据集API介绍:

sklearn.datasets

加载获取流行数据集

datasets.load_*()

  获取小规模数据集,数据包含在datasets里

datasets.fetch_*(data_home=None)

  获取大规模数据集,需要从网络上下载,函数的第一个参数是data_home,表示数据集

  下载的目录,默认是 ~/scikit_learn_data/

获取数据集返回的类型:

load*和fetch*返回的数据类型datasets.base.Bunch(字典格式)

data:特征数据数组,是[n_samples * n_features]的二维numpy.ndarray数组

target:标签数组,是n_samples的一维numpy.ndarray数组

DESCR:数据描述

feature_names:特征名,新闻数据,手写数字、回归数据集没有

target_names:标签名,回归数据集没有

1.3 sklearn分类数据集

sklearn.datasets.load_iris():加载并返回鸢尾花数据集。

sklearn.datasets.load_digits():加载并返回数字数据集。

from sklearn.datasets import load_iris

 

li = load_iris()

 

print("获取特征值")

print(li.data)

print("目标值")

print(li.target)

print(li.DESCR)

运行结果:

获取特征值

[[5.1 3.5 1.4 0.2]

[4.9 3. 1.4 0.2]

[4.7 3.2 1.3 0.2]

[4.6 3.1 1.5 0.2]

[5. 3.6 1.4 0.2]

[5.4 3.9 1.7 0.4]

[4.6 3.4 1.4 0.3]

[5. 3.4 1.5 0.2]

[4.4 2.9 1.4 0.2]

[4.9 3.1 1.5 0.1]

[5.4 3.7 1.5 0.2]

[4.8 3.4 1.6 0.2]

[4.8 3. 1.4 0.1]

[4.3 3. 1.1 0.1]

[5.8 4. 1.2 0.2]

[5.7 4.4 1.5 0.4]

[5.4 3.9 1.3 0.4]

[5.1 3.5 1.4 0.3]

[5.7 3.8 1.7 0.3]

[5.1 3.8 1.5 0.3]

[5.4 3.4 1.7 0.2]

[5.1 3.7 1.5 0.4]

[4.6 3.6 1. 0.2]

[5.1 3.3 1.7 0.5]

[4.8 3.4 1.9 0.2]

[5. 3. 1.6 0.2]

[5. 3.4 1.6 0.4]

[5.2 3.5 1.5 0.2]

[5.2 3.4 1.4 0.2]

[4.7 3.2 1.6 0.2]

[4.8 3.1 1.6 0.2]

[5.4 3.4 1.5 0.4]

[5.2 4.1 1.5 0.1]

[5.5 4.2 1.4 0.2]

[4.9 3.1 1.5 0.2]

[5. 3.2 1.2 0.2]

[5.5 3.5 1.3 0.2]

[4.9 3.6 1.4 0.1]

[4.4 3. 1.3 0.2]

[5.1 3.4 1.5 0.2]

[5. 3.5 1.3 0.3]

[4.5 2.3 1.3 0.3]

[4.4 3.2 1.3 0.2]

[5. 3.5 1.6 0.6]

[5.1 3.8 1.9 0.4]

[4.8 3. 1.4 0.3]

[5.1 3.8 1.6 0.2]

[4.6 3.2 1.4 0.2]

[5.3 3.7 1.5

共10页: 上一页12345678910下一页


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:写一个通用的List集合导出excel的通用方法(java将list写入excel)
下一篇:python的缓存机制(python的内存机制)
相关文章

 发表评论

暂时没有评论,来抢沙发吧~