翼度科技»论坛 编程开发 python 查看内容

pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.

4

主题

4

帖子

12

积分

新手上路

Rank: 1

积分
12
np.nan != np.nan
在计算机中本没有绝对绝对相等的数据,所谓的相等只是精度允许的条件下相等!np.nan 原意为 not a number。
概括:

  • 对某个值是否为nan进行判断,只能用np.isnan(i),绝不可用 i == np.nan 来判断,因为nan具有不等于自身的属性,应该使用np.isnan来测试nan值,如np.isnan(np.nan)将产生True;
  • np.nan非空对象,其类型为基本数据类型float;

np.nan

np.nannot a membernan的含义是“not a number“,它是对array中缺失的数值的占位符type 为 float因为代表缺失的数值,np.nan的type是float可参与计算np.nan的type是float,所以np.nan可参与计算,且占主导地位,也就是算出的值都为np.nan不等于自身如果用np.nan==np.nan,会发现返回的结果为False,如果用np.nan in array,也不能发现array中是否包含np.nannp.isnan判断是否存在np.nannp.nan因为没有等于的概念,所以要判断是否存在np.nan,只可以用np.isnan来判断np.isnan只可以判断数值型如果用np.isnan对其余type的array判断,会报错,np.isnan只可以判断数字型array忽略np.nan的numpy计算nansum()nanmax()nanmin()nanargmax()nanargmin()nan和None

  • python自带的 None ,为 NoneType 类型, 代表空类型,不能参与运算
  • numpy中的 isnan 对应的是 NaN 值,代表“不是数字”,数值类型为 float ,数组中显示为nan,能参与运算,但结果显示为NaN;

None

NoneNoneTypeNone的type为NoneType,是python内置的不可参与计算None不可参与计算,否则报错None is None 或者 None==None这两种方式返回值都是True
pd.isnull 和 pd.isna

pd.isnull pd.isnapd.isnull 和 pd.isna是同一个东西用命令pd.isnull==pd.isna,会发现返回值为TrueNone和np.nan在pandas中都是缺省值None和np.nan都会被pd.isnull或者pd.isna判断为True可以判断List或者单独一个值pd.isnull和pd.isna的判断对象可以为一个值或者一个listpandas中缺省值不参与计算当使用df.min()等计算时,会发现缺省值不参与计算
代码示例

只可以用np.isnan判断array中是否包含np.nan
  1. a = np.array([1,2,3,4,np.nan])
  2. a == np.nan
  3. >>> array([False, False, False, False, False])
  4. np.nan in a
  5. >>> False
  6. np.isnan(a)
  7. >>> array([False, False, False, False,  True])
复制代码
np.nan可参与计算,np.nan占主导地位
  1. a = np.array([1,2,3,4,np.nan])
  2. a.max()
  3. >>> np.nan
  4. a.min()
  5. >>> np.nan
  6. b = np.array([1,np.nan,3,4,5])
  7. a+b
  8. >>> array([ 2., nan,  6.,  8., nan])
复制代码
np.isnan只可以对数值型array判断,当array中其余的元素为字符串是,array会将np.nan转换成’nan’

在pandas中,np.nan和None都被视为缺省值
  1. df = pd.DataFrame({'col1':['a','b','c','d'], 'col2':[1,2,3,4]})
  2. df.loc[1,'col1'] = np.nan
  3. df.loc[2,'col1'] = None
  4. df
  5. >>> col1        col2
  6. 0        a        1
  7. 1        NaN        2
  8. 2        None        3
  9. 3        d        4

  10. pd.isna(df)
  11. >>>        col1        col2
  12. 0        False        False
  13. 1        True        False
  14. 2        True        False
  15. 3        False        False
复制代码
pandas中缺省值不参与计算
  1. df = pd.DataFrame(np.arange(8).reshape(2,4))
  2. df.iloc[0,1] = None
  3. df.iloc[0,2] = np.nan
  4. df
  5. >>> 0        1        2        3
  6. 0        0        NaN        NaN        3
  7. 1        4        5.0        6.0        7

  8. df.min(axis=1)
  9. >>> 0    0.0
  10. 1    4.0
  11. dtype: float64
复制代码
到此这篇关于pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna的文章就介绍到这了,更多相关 np.nan, np.isnan, None, pd.isnull, pd.isna内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

来源:https://www.jb51.net/python/319211rth.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
来自手机

举报 回复 使用道具