翼度科技»论坛 编程开发 python 查看内容

Pandas实现重命名列的4种方法

4

主题

4

帖子

12

积分

新手上路

Rank: 1

积分
12
Pandas dataframe现在已经成为主流。大家都在用它进行数据分析、机器学习、数据工程,甚至软件开发。学习重命名列是数据清洗的第一步,而数据清洗是数据分析的核心部分。我们在这篇文章中来教大家重命名单列或多列名称的四种方法。

  • 方法1:使用
    1. rename()
    复制代码
    函数。
  • 方法2:分配新列名列表。
  • 方法3:替换列属性的字符串。
  • 方法4:使用
    1. set_axis()
    复制代码
    函数。

创建Pandas Dataframe

将首先创建一个简单的学生班级成绩字典。它由三列组成:
  1. id
复制代码
  1. name
复制代码
  1. grade
复制代码
,以及五行。
为了将Python字典转换为Pandas Dataframe,将使用
  1. pandas DataFrame()
复制代码
函数,并使用Deepnote(这是一个Jupyter Notebook云端笔记本)显示结果。
  1. <strong>注意:</strong>将多次使用[code]student_dict
复制代码
字典来为每个方法创建Dataframe。[/code]
  1. import pandas as pd

  2. student_dict = {
  3.     "id": [101, 102, 103, 104, 105],
  4.     "name": ["Abid", "Matt", "Karen", "Abhijeet", "Malena"],
  5.     "grade": ["A", "B", "D", "A", "C"],
  6. }

  7. # 将字典转换为Dataframe
  8. student_df_1 = pd.DataFrame(student_dict)
  9. student_df_1
复制代码
idnamegrade0101AbidA1102MattB2103KarenD3104AbhijeetA4105MalenaC
方法一

第一种方法非常简单,使用
  1. pandas
复制代码
  1. rename()
复制代码
函数来重新标记列名。

重命名一个单列

在这个例子中,将使用
  1. .rename()
复制代码
来重命名一个单列。只需要向
  1. columns
复制代码
参数提供一个新、旧列名的字典。
例如:
  1. {"old_column_name" : "new_column_name" }
复制代码

可以看到,已经成功地用
  1. ID
复制代码
替换了
  1. id
复制代码
  1. student_df_1.rename(columns={"id": "ID"}, inplace=True)

  2. student_df_1
复制代码
  1. <strong>注意:</strong>inplace = True意味着正在对Dataframe进行修改。它类似于df = df.rename()。
复制代码
重命名多个列

对于多列,只需提供用逗号(
  1. ,
复制代码
)分隔的新旧列名字典,它就会自动替换列名。
新的列名是
  1. Student_ID
复制代码
  1. First_Name
复制代码
,和
  1. Average_Grade
复制代码
  1. student_df_1.rename(
  2.     columns={"ID": "Student_ID", "name": "First_Name", "grade": "Average_Grade"},
  3.     inplace=True,
  4. )

  5. student_df_1
复制代码


方法二

第二种方法很简单明了。将通过将新名称的列表分配给DataFrame对象的
  1. columns
复制代码
属性来重新命名这些列。
例如,使用字典创建了一个新的DataFrame,并通过向列属性提供一个字符串列表来重命名列。
  1. student_df_2 = pd.DataFrame(student_dict)
  2. student_df_2.columns = ["Student_ID", "First_Name", "Average_Grade"]

  3. student_df_2
复制代码


方法三

第三种方法是Python生态的原生方法,替换
  1. columns
复制代码
属性的字符串。
例如:
  1. df = df.columns.str.replace("old_name", "new_name")
复制代码

已经成功地将列名改为
  1. ID
复制代码
  1. Name
复制代码
  1. Grades
复制代码
  1. student_df_3 = pd.DataFrame(student_dict)

  2. student_df_3.columns = student_df_3.columns.str.replace("id", "ID")
  3. student_df_3.columns = student_df_3.columns.str.replace("name", "Name")
  4. student_df_3.columns = student_df_3.columns.str.replace("grade", "Grades")

  5. student_df_3
复制代码


方法四

在第四种方法中,将使用
  1. set_axis()
复制代码
函数重命名列。需要提供一个新名称的列表,并设置
  1. axis = "columns"
复制代码
来重命名列,而不是索引。
  1. student_df_4 = pd.DataFrame(student_dict)
  2. student_df_4.set_axis(["A", "B", "C"], axis="columns", inplace=True)

  3. student_df_4
复制代码

到此这篇关于Pandas实现重命名列的4种方法的文章就介绍到这了,更多相关Pandas 重命名列内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

来源:https://www.jb51.net/python/319136eod.htm
免责声明:由于采集信息均来自互联网,如果侵犯了您的权益,请联系我们【E-Mail:cb@itdo.tech】 我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x

举报 回复 使用道具