Python用panda读取csv文件1并统计每个积分区间（每5分）人数分布，绘制图形-eolink官网

Python用panda读取csv文件1并统计每个积分区间（每5分）人数分布，绘制图形

panda读取csv文件1并统计每个积分区间（每5分）人数分布，绘制图形

1.读取 CSV文件生成DataFrame

df = pd.read_csv('D:/luohu3.csv')print(df)

2. 数据预处理

data = df.dropna(0) # 删除所有包含空值的行或列print(data.info())

3. 对数据进行离散化处理

通过describe()查看最大值最小值，来确定区间

x = data["积分分值"]print(data.describe()) # 查看最大值与最小值bins = np.arange(90, 126, 5)score_bins = pd.cut(x, bins) # 对数据进行离散化处理print(score_bins)

4. 按积分分割区间进行分组统计

df1 = data.groupby(score_bins)["积分分值"].count()print(df1)

5. 绘制图形

rot=0使横坐标的数据横过来

df1.plot(kind="bar", rot=0) plt.rcParams['font.sans-serif'] = ['Kaiti'] # 用来正常显示中文（黑体）常用字体包括： Kaiti-楷体； FangSong-仿宋； Microsoft YaHei-微软雅黑plt.rcParams['axes.unicode_minus'] = False # 显示负号plt.show()

完整代码：

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 读取 CSV文件生成DataFramedf = pd.read_csv('D:/luohu3.csv')print(df)print(df.info()) # 获取 DataFrame 的摘要print(df.head()) # 根据位置返回对象的前n行信息(默认值为5) ，用于快速测试数据集print(df.describe()) # 生成描述性统计数据，总结数据集分布的集中趋势，分散和形状，不包括 NaN值。# 数据预处理data = df.dropna(0) # 删除所有包含空值的行或列print(data.info())# data = df.drop_duplicates()# print(data.info())x = data["积分分值"]print(data.describe()) # 查看最大值与最小值bins = np.arange(90, 126, 5)score_bins = pd.cut(x, bins) # 对数据进行离散化处理print(score_bins)# 按积分分割区间进行分组统计df1 = data.groupby(score_bins)["积分分值"].count()print(df1)# 绘制图形df1.plot(kind="bar", rot=0)plt.rcParams['font.sans-serif'] = ['Kaiti'] # 用来正常显示中文（黑体）常用字体包括： Kaiti-楷体； FangSong-仿宋； Microsoft YaHei-微软雅黑plt.rcParams['axes.unicode_minus'] = Falseplt.show()

Python接口自动化之文件上传/下载接口怎么实现

300 2022-08-25

Python用panda读取csv文件1并统计每个积分区间（每5分）人数分布，绘制图形

java中的接口是类吗

Spring中的aware接口详情

Python接口自动化之文件上传/下载接口怎么实现

推荐文章

接口调用是什么意思？几种常用接口调用方式

接口设计原则

8款在线 API 接口文档管理工具

api管理系统是什么？

什么是接口调试？接口调试的步骤有哪些？

api 接口管理系统有哪些？

接口测试有几种测试方法

API文档生成工具有哪些？

微服务和api网关区别

交换机配置步骤

最近发表

热评文章

在线接口文档管理工具推荐，支持在线测试，HTTP接口

开源的在线接口文档wiki工具Mindoc的介绍与使

如何优雅的进行接口设计？接口设计的六大原则是什么？

什么是API测试,api检测公司

软件接口设计怎么做？前后端分离软件接口设计思路

接口管理平台推荐，几大接口管理平台总有一款适合你！