python读文件时UnicodeDecodeError的处理

发布时间:2017-09-07 14:14:13
python读文件时UnicodeDecodeError的处理 python中通过open打开文件后,当文件中有中文fd.readline()时会抛出UnicodeDecodeError的异常。基本上可以确定是读入文件的编码问题。因为读入的文件是用VS来写的C++的代码,,而vs默认保存的编码是gb2312。当将文件编码转换成UTF-8时正常。根本解决方法是将那些VS写的代码统一成UTF-8的编码,但是这部分代码不是我来维护,并且代码还在增加,,其他开发人员通过VS快速的建立C++类,要求他们使用高级保存选项另存为UTF-8貌似还有写难度,只能通过自己来暂时性解决这个问题。

open函数的原型:

通过指定encoding参数来指定打开文件的编码。encoding的值默认是UTF-8,通过fd.encoding可以获得它的值。

如果需要自动获得文件的编码格式需要chardet模块支持才行。

解决方法,默认还是使用utf-8方式来读入文件,当有UnicodeDecodeError异常时,with open(fn, "r") as fd块的会自动把fd关闭,所以,直接在except中使用gbk编码重新打开文件就可以了。

企业建站2800元起,携手武汉肥猫科技,做一个有见地的颜值派!更多优惠请戳:武汉网站建设 http://wuhan.45qun.com