数据透视表
数据透视表是电子表格程序和其他数据分析软件中常见的数据汇总工具。
它根据一个或多个表聚合一张表的数据,将数据在矩形格式中排列,其中一些分组键是沿着行的,另一些是沿着列的。
Python中的pandas透视表是通过groupby工具以及使用分层索引的重塑操作实现的。DataFrame拥有一个pivot_table方法,并且还有一个顶层的pandas.pivot_table函数。
除了为groupby提供一个方便接口,pivot_table还可以添加部分总计,也称为边距。
tips是一个小费数据集
假如此刻要计算一张在行方向上按day和smoker排列的分组平均值(默认的pivot_table聚合操作)的表:
通过传递margins=True来扩充这个表来包含部分总计。这会添加All行和列标签,其中相应的值是单层中所有数据的分组统计值:
如果有空值,可以用fill_value填充:

文章知识点与官方知识档案匹配,可进一步学习相关知识Python入门技能树数据分析CSV文件211347 人正在系统学习中
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!