关于pd.read_csv() 读数据的注意事项

2022年8月26日09:14:24

关于pd.read_csv() 读数据的注意事项


实验数据:adult.data

编译环境:pycharm

代码编写:Sublime Text3


import pandas as pd

#加载数据
df = pd.read_csv( '.\\adult.data' )#请将adult.data和当前.py放在同一文件目录之下
print(df)


由于在pd.read_csv( '.\\adult.data' ) 里面的参数,并没有指明header=None,默认就将数据第一行当作数据头了。


import pandas as pd

#加载数据
df = pd.read_csv( '.\\adult.data',header=None)
print(df)


header=None


③增加表头说明

import pandas as pd

names = ['age', 'workclass', 'fnlwgt', 'education', 'educationnum', 'maritalstatus', 'occupation', 'relationship', 'race','sex', 'capitalgain', 'capitalloss', 'hoursperweek', 'nativecountry', 'label']

#加载数据
df = pd.read_csv( '.\\adult.data',header=None, names=names)
print(df)


④保存文件

#预测年收入是否大于50K美元
import pandas as pd
names = ['age', 'workclass', 'final_weight', 'education', 'education_num', 'marital_status', 'occupation', 'relationship', 'race','sex', 'capital_gain', 'capital_loss', 'hours_per_week', 'native_country', 'salary']


#加载数据
df = pd.read_csv( '.\\adult.data',header=None, names=names)#原资料adult.data没有头,现在names加上
df.to_csv("adults.csv",index=0)##不保存行索引

  • 作者:yangbocsu
  • 原文链接:https://yangbocsu.blog.csdn.net/article/details/114665611
    更新时间:2022年8月26日09:14:24 ,共 951 字。