翼度科技»论坛 编程开发 python 查看内容

pandas读取excel统计空值数量错误的解决方法

6

主题

6

帖子

18

积分

新手上路

Rank: 1

积分
18
问题: pd.read_excel()读取excel数据后,用pd.isnull().sum()统计空值数量不对,代码如下
  1. import pandas as pd

  2. df = pd.read_excel('test.xlsx',dtype=str)
  3. # 剔除空格
  4. df = df.applymap(lambda x : str(x).strip())
  5. print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是0个
复制代码
excel数据长这样,B2是一个空格,希望得到空值为2的结果

问题分析:
读取excel后的df是这样

使用applymap剔除空格后的df是这样

读取excel后的df的值(df.values)

使用applymap剔除空格后的df的值(df.values)

可以看到,在applymap方法处理后
值values的变化:一个空格变成了’’,之前的nan变成了’nan’(这里是字符串nan,当然不为空)
pd.isnull()只会统计NaN的数量,一个是字符串’‘,一个是字符串’nan’,因此都统计不到
解决: 将’'和’nan’全部替换为np.nan,isnull就可以统计到
  1. import numpy as np
  2. import pandas as pd

  3. df = pd.read_excel('test.xlsx',dtype=str)
  4. # 剔除空格
  5. df = df.applymap(lambda x : str(x).strip())
  6. df[df == ''] = np.nan
  7. df[df == 'nan'] = np.nan
  8. print("b列为空的个数为"+ str(pd.isnull(df['b']).sum())) # 打印出来b列中为空的是2个
复制代码
到此这篇关于pandas读取excel统计空值数量错误的解决方法的文章就介绍到这了,更多相关pandas读取excel空值内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!


来源:https://www.jb51.net/python/3191238ds.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具