group by函数在使用Python进行分组分析时使用非常频繁,使用group by可以对数据进行简单的分组分析。
一、分组列一列,计算列一列的写法
- 一组分组列,一组计算列,一种计算方式
aggResult =data.groupby(by=['年龄分层'])['年龄'].agg({'人数':numpy.size})
grouped =data.年龄.groupby(data.年龄分层)aggResult = grouped.agg({'人数': numpy.size})
- 一组分组列,一组计算列,多种计算方式
aggResult = data.groupby(by=['class'])['score'].agg({'总分': numpy.sum,'人数': numpy.size,'平值': numpy.mean})
grouped=data.score.groupby(data.class)
aggResult= grouped.agg({'总分': numpy.sum,'人数': numpy.size,'平值': numpy.mean})
二、分组列两列,计算列一列的写法
- 两组分组列,一组计算列,一种计算方式
aggResult = data.groupby(by=['年龄分层'])['年龄','性别'].agg({'人数': numpy.size})
grouped=data.年龄.groupby(data.年龄分层,data.性别)
aggResult= grouped.agg({'人数': numpy.size})