Python Pandas大数据处理

2023年1月1日13:28:14

pandas 处理过大数据时间太长或者没有响应

可以使用chunksize 将数据分段处理并拼接

import pandas as pd
df = pd.DataFrame()
for chunk in pd.read_csv('test.csv', usecold=[0,1], names=['times', 'data'], chunksize=2000000):
    df = df.append(chunk)

chunksize 尽量不要超过1000w数据,超过1000w数据响应时间比200w拼接时间长好几倍

  • 作者:心结.
  • 原文链接:https://blog.csdn.net/Hydra_Zhang/article/details/126597578
    更新时间:2023年1月1日13:28:14 ,共 235 字。