python pandas模块操作execl(python入门教程(非常详细))

网友投稿 585 2022-08-28


python pandas模块操作execl(python入门教程(非常详细))

环境要求

需要安装xlrd和pandas和openpyxl

读取数据

import pandas as pd# 默认读取第一个表单df = pd.read_excel('demo.xlsx')data = df.head() # 默认读取前5行数据信息print("获取到的数据:\n%s" % data)

import pandas as pd# 指定读取那个表单df = pd.read_excel('demo.xlsx', sheet_name='Sheet2')data = df.head() # 默认读取前5行数据信息print("获取到的数据:\n%s" % data)

import pandas as pd# 通过表单索引指定读取表单df = pd.read_excel('demo.xlsx', sheet_name=1)# 同时采用多个表单df = pd.read_excel('demo.xlsx', sheet_name=['Sheet1', 'Sheet2'])df = pd.read_excel('demo.xlsx', sheet_name=[0,1])data = df.valuesprint("获取到的数据:\n%s" % data)

操作行列

1.读取指定的单行,数据会存在列表里面

import pandas as pddf = pd.read_excel('demo.xlsx')# 读取第一行数据,注意不含表头data = df.loc[0].valuesprint("获取到的数据:\n%s" % data)

2.读取指定的多行,数据会存在嵌套的列表里面

import pandas as pddf = pd.read_excel('demo.xlsx')data = df.loc[[1,2]].valuesprint("获取到的数据:\n%s" % data)

3.读取指定的行列

import pandas as pddf = pd.read_excel('demo.xlsx')# 读取第1行第2列数据data = df.iloc[1, 2]print("获取到的数据:\n%s" % data)

4.读取指定的多行多列值

import pandas as pddf = pd.read_excel('demo.xlsx')# 读取第1\2行第2\3列数据data = df.loc[[1, 2], ['name', 'data']].valuesprint("获取到的数据:\n%s" % data)

5.获取所有行的指定列

import pandas as pddf = pd.read_excel('demo.xlsx')# 读取第1\2行第2\3列数据data = df.loc[:, ['name', 'data']].valuesprint("获取到的数据:\n%s" % data)

6.获取行号并打印输出

import pandas as pddf = pd.read_excel('demo.xlsx')print(df.index.values)

7.获取列名

import pandas as pddf = pd.read_excel('demo.xlsx')print(df.columns.values)

8.获取指定列的内容

import pandas as pddf = pd.read_excel('demo.xlsx')print(df['data'].values)

9.把数据转换为字典类型

import pandas as pddf = pd.read_excel('demo.xlsx')myList = []for i in df.index.values: rowData = df.loc[i, ['id', 'name', 'data']].to_dict() print(rowData) myList.append(rowData)print(myList)

10.读取全部信息

import pandas as pddf = pd.read_excel('demo.xlsx')data = pd.DataFrame(df)print(data)

11.从demo里读出数据,删除掉不符合要求的行,存入另一个excel

import pandas as pddf = pd.read_excel('demo.xlsx')data = pd.DataFrame(df)for index, row in data.iterrows(): if row[1] != 'haha': data = data.drop(index, axis=0)print(data)data.to_excel('test.xlsx', 'test', index=False)


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:python之在更新pip包管理工具的时候 - 解决 ModuleNotFoundError: No module named 'pip'
下一篇:java中通过行为参数化传递代码方案
相关文章

 发表评论

暂时没有评论,来抢沙发吧~