Python之Pandas库
IT|2023-11-27|Last edited: 2023-12-1|
type
status
date
slug
summary
tags
category
icon
password

pandas库相关

创建或读取一个表格,变量名为df

df.shape显示行数和列数

df.pivot和df.melt重塑


df.pivot透视

  • index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。
  • columns:指定一列的值作为列名,必须传值。
  • values:指定一列作为生成DataFrame对象的值。可以为空。
假设表格如下,类似这种格式的数据在数据库中非常常见
name
month
money
people_one
一月
1000
people_one
二月
2000
people_one
三月
3000
people_two
三月
4000
people_two
一月
5000
然后得到如下表格,更加清晰看出每人在某月的money
month
people_one
people_two
一月
1000.0
5000.0
三月
3000.0
4000.0
二月
2000.0
NaN

df.melt融合

  • 将经过pivot得到的表融合
  • id_vars: 用作索引的变量列。
  • value_vars:要取消透视的列。默认使用所有列。
  • var_name:用于“变量”列的名称。
  • value_name:标量列
  • col_level:可选
结果就是如下表格
month
name
money
一月
people_one
1000.0
三月
people_one
3000.0
二月
people_one
2000.0
一月
people_two
5000.0
三月
people_two
4000.0
二月
people_two
NaN
Flask简单的上传和下载实现Python之多线/进程