翼度科技»论坛 编程开发 python 查看内容

【pandas小技巧】--按类型选择列

7

主题

7

帖子

21

积分

新手上路

Rank: 1

积分
21
本篇介绍的是pandas选择列数据的一个小技巧。
之前已经介绍了很多选择列数据的方式,比如loc,iloc函数,按列名称选择,按条件选择等等。
这次介绍的是按照列的数据类型来选择列,按类型选择列可以帮助你快速选择正确的数据类型,提高数据分析的效率。
1. 类型种类

pandas列的数据类型主要有4大种类:

  • number:数值类型,包括整数和浮点数
  • object:主要是字符串类型
  • catagory:分类类型
  • datetime:日期类型
创建包含上述数据类型的测试数据:
  1. import pandas as pd
  2. df = pd.DataFrame(
  3.     {
  4.         "日期": [
  5.             "2020/04/10",
  6.             "2020/04/11",
  7.             "2021/06/17",
  8.             "2021/06/18",
  9.             "2022/11/22",
  10.             "2022/11/23",
  11.         ],
  12.         "年级": ["初一", "初二", "初一", "初二", "初一", "初二"],
  13.         "学生": ["小红", "小华", "小明", "小李", "小汪", "小郑"],
  14.         "名次": [1, 1, 2, 3, 1, 3],
  15.         "平均成绩": [98.5, 95.5, 92.0, 89.5, 99.0, 87.5],
  16.     },
  17. )
  18. df["日期"] = pd.to_datetime(df["日期"])
  19. df["年级"] = df["年级"].astype("category")
  20. print(df.dtypes)
  21. df
复制代码


2. 选择类型

按列的类型选择用 select_dtypes 函数。
2.1. 选择一个类型

选择一个类型时,用 include 参数指定列名。
  1. df.select_dtypes(include="category")
复制代码

number类型包含 int 和 float。
  1. df.select_dtypes(include="number")
复制代码

也可以指定 int 或 float 选择整数或者浮点数
  1. df.select_dtypes(include="int")
  2. df.select_dtypes(include="float")
复制代码

2.2. 选择多个类型

选择多个类型还是 include 参数,不过传入的值是列表
  1. df.select_dtypes(include=["category", "datetime"])
复制代码

2.3. 指定不选的类型

include参数是指定要选择的类型,如果要选择的类型比较多,我们可以通过exclude参数来设置不需要的类型。
  1. df.select_dtypes(exclude="datetime")
复制代码

exclude 参数也可以传入列表,设置多个不选择的类型。
  1. df.select_dtypes(exclude=["category", "datetime"])
复制代码


来源:https://www.cnblogs.com/wang_yb/p/17591142.html
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具