• 售前

  • 售后

热门帖子
入门百科

jupyter读取错误格式文件的办理方案

[复制链接]
姜小黑61 显示全部楼层 发表于 2021-10-26 13:03:50 |阅读模式 打印 上一主题 下一主题
利用pandas读取xml文件报错
  1. “ Unsupported format, or corrupt file: Expected BOF record; found b'<?xml ve' ”
复制代码
办理办法:

转换文件格式,利用excel打开xml文件 选择:文件—>另存为---->弹框

保存以后,再次用pandas读取对应格式的文件读取即可
补充:
在jupyter中读取CSV文件时出现‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte办理方法
导入 import pandas as pd
利用pd.read_csv()读csv文件时,出现如下错误:
  1. UnicodeDecodeError: ‘utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte
复制代码
出现原因:

CSV文件不是UTF-8举行编码,而是用gbk举行编码的。jupyter-notebook利用的Python表明器的体系编码默认利用UTF-8.
办理方式有两种

第一种:

1.找到利用的csv文件--->鼠标右键--->打开方式---->选择记事本
2.打开文件选择“文件”----->"另存为“,我们可以看到默认编码是:ANSI,选择UTF-8重新保存一份,再利用pd.read_csv()打开就不会保存了


第二种:

利用pd.read()读取CSV文件时,举行编码
  1. pd.read(filename,encoding='gbk')
复制代码
比如:

以上为个人经验,渴望能给大家一个参考,也渴望大家多多支持草根技能分享。如有错误或未思量完全的地方,望不吝赐教。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

帖子地址: 

回复

使用道具 举报

分享
推广
火星云矿 | 预约S19Pro,享500抵1000!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

草根技术分享(草根吧)是全球知名中文IT技术交流平台,创建于2021年,包含原创博客、精品问答、职业培训、技术社区、资源下载等产品服务,提供原创、优质、完整内容的专业IT技术开发社区。
  • 官方手机版

  • 微信公众号

  • 商务合作