翼度科技»论坛 编程开发 python 查看内容

pandas如何读取含有中文的excel

4

主题

4

帖子

12

积分

新手上路

Rank: 1

积分
12
pandas读取含有中文的excel

在读取含有中文的 Excel 文件时,需要使用 encoding 参数设置编码方式。
常用的编码方式有 'gbk' 和 'utf-8'。
示例代码:
  1. import pandasas pd

  2. # 读取含有中文的 Excel 文件
  3. df = pd.read_excel('filename.xlsx', encoding='gbk')
复制代码
如果读取过程中出现乱码,可以尝试更换编码方式。

pandas读取excel时遇到的编码问题 unknown_codepage_21010

最近在使用pandas读取不规则excel表时遇到了一种编码问题,自己找了好久资料也是终于综合了一下解决了这种编码异常的问题。  
首先呢,报错会提示 下面这种错误:
  1. unknown encoding: unknown_codepage_21010
复制代码
自己在找资料的时候看到一篇很早在git上发布的一篇文章,意思就是让直接明确将编码设置好,具体可以看一下git链接
https://github.com/okfn/messytables/issues/47
最后呢,自己改了一个源文件里的东西,其实也不知道是不是正确的,但是这个问题却解决了,所以分享出来,也算是为自己记录一下,以防以后再次遇到这个问题,又得找半天。
找到xlrd的__init__.py文件,在 open_workbook 模块中将encoding_override的值明确为"cp1252",其实具体这样做的原因就是将编码明确,使得可以识别这种异常编码。
  1. def open_workbook(filename=None,
  2.                   logfile=sys.stdout,
  3.                   verbosity=0,
  4.                   use_mmap=USE_MMAP,
  5.                   file_contents=None,
  6.                   encoding_override="cp1252",
  7.                   formatting_info=False,
  8.                   on_demand=False,
  9.                   ragged_rows=False):
复制代码
这样问题就成功解决了~

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

来源:https://www.jb51.net/python/316235dvd.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

举报 回复 使用道具