python数据框添加新列_如何在Python中将新列添加到现有数据框?

2022-08-31 11:25:58

数据框是一种二维数据结构,其中数据以表格格式存储,以行和列的形式。

它可以可视化为SQL数据表或excel工作表表示形式。可以使用以下构造函数创建它-pd.Dataframe(data, index, columns, dtype, copy)

可以以不同方式将新列添加到数据框。

让我们看看其中一种方法,通过首先形成一系列数据结构并将其作为附加列传递给现有数据框,来创建新列。

让我们看看实际的代码-

示例import pandas as pd

my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']),

'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd'])}

my_df = pd.DataFrame(my_data)print("数据框为:")

print(my_df)print ("通过将其作为Series结构传递给数据框添加新列:")

my_df['ef']=pd.Series([56, 78, 32],index=['a','b','c'])

print("After adding a new column to the dataframe, :")

print(my_df)

输出结果数据框为:

ab   cd

a  1.0  1

b  8.0  2

c  7.0  0

d  NaN  9

通过将其作为Series结构传递给数据框添加新列:

After adding a new column to the dataframe, :

ab  cd  ef

a  1.0  1   56.0

b  8.0  2  78.0

c  7.0  0  32.0

d  NaN  9  NaN

说明导入所需的库,并为其指定别名,以方便使用。

创建字典数据结构,其中在一个字典中存在一个键值对。

这样,将创建多个词典并将其存储在列表中。

键值对中的“值”实际上是Series数据结构。

索引也是一个自定义的值列表。

该字典随后作为参数传递给存在于“ pandas”库中的“ Dataframe”函数

通过将字典值列表作为参数传递来创建数据框。

将创建另一个新列,并在其中初始化值。

此新列被索引到原始数据帧。

这样,新列将绑定到数据框。

数据框被打印在控制台上。

注意-“ NaN”一词指的是“不是数字”,这意味着特定的[row,col]值没有任何有效的条目。

  • 作者:奔跑吧linux内核
  • 原文链接:https://blog.csdn.net/weixin_42252122/article/details/112989245
    更新时间:2022-08-31 11:25:58