Pandas read_excel()参数使用详解
1.read_excel函数原型
参数说明:
2.参数使用举例
2.1. io和sheet_name参数
【例1】通过io和sheet_name读取Excel表
records.xlsx内容:
Code:
说明:此处io和sheet_name参数都可以不明确指定,直接使用:
如果records.xlsx文件只有一张表,或者要读取的数据表为第一张表,sheet_name参数可以省略:
2.2. header参数
【例2】通过header参数指定表头位置
records.xlsx内容:
我们在【例1】的基础上为records.xlsx的“Sheet1”表增加了一行表头说明,如果继续使用【例1】的代码,得到的结果是这样的:
这样得到的列标及数据都不是我们想要的,这种情况下就需要通过header参数来指定表头了,注意到表头是在第2行,根据header参数的说明可知,行号是从0开始计算的,所以header参数应该为1.
Code:
2.3. skipfooter参数
【例3】通过skipfooter参数忽略表尾数据
有时我们的数据是从第3方获取到的,往往会在表的末尾添加一行“数据来源:xxx”.如:
这种情况下,可以通过skipfooter参数来忽略该数据。
Code:
【例4】通过index_col参数指定DataFrame index
在【例3】中,查看我们读取得到的DataFrame的索引:
它是一个自动添加的整型索引,但如果现在我想要使用“date”列作为索引,可以通过index_col参数指定:
或者改成这样:
2.5. parse_dates参数
查看【例4】index的参数类型:
发现并不是我们想要的日期类型,而是str。现在我们想把它转换为日期类型,可选的一种方法就是通过parse_dates参数来实现。
【例5】parse_dates参数处理日期
Code:
当parase_date设置为True时,默认将index处理为日期类型。
如果要处理的列不是index列,可以通过parse_dates= "date"来实现。
如果要处理的列包含多个,可以通过parse_dates= [“col1”,“col2”,…]来实现。
2.6. converters参数
在前面几个例子中,我们发现percent列的数据都是xx%这样的表示,且是str类型:
str类型并不是我们所希望的,现在我们希望可以将之转化为float类型,这可以通过converters参数来实现。
【例6】converters参数进行数据类型转换
Code:
2.7. na_values参数
【例7】na_values参数处理na数据
很多时候,并不是所有的数据都是有效数据,例如下表中2014/12/1和2016/6/1两行的数据均为“–”:
这种情况下可以通过na_values参数来处理。
Code
2.8. usecols参数
【例8】 usecols参数选择列
当我们只想处理数据表中的某些指定列时,可以通过usecols参数来指定。例如,我只想处理"date"和"val"两列数据,可以这样通过
来指定。
Code
总结
到此这篇关于python Pandas库read_excel()参数的文章就介绍到这了,更多相关Pandas库read_excel()参数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
您可能感兴趣的文章:pandas read_excel()和to_excel()函数解析pandas中read_excel()函数的基本使用