Python之Pandas库
type
status
date
slug
summary
tags
category
icon
password
pandas库相关
创建或读取一个表格,变量名为df
df.shape显示行数和列数
df.pivot和df.melt重塑
df.pivot透视
- index:指定一列做为生成DataFrame对象的索引,如果为空则默认为原来的索引。
- columns:指定一列的值作为列名,必须传值。
- values:指定一列作为生成DataFrame对象的值。可以为空。
假设表格如下,类似这种格式的数据在数据库中非常常见
name | month | money |
people_one | 一月 | 1000 |
people_one | 二月 | 2000 |
people_one | 三月 | 3000 |
people_two | 三月 | 4000 |
people_two | 一月 | 5000 |
然后得到如下表格,更加清晰看出每人在某月的money
month | people_one | people_two |
一月 | 1000.0 | 5000.0 |
三月 | 3000.0 | 4000.0 |
二月 | 2000.0 | NaN |
df.melt融合
- 将经过pivot得到的表融合
- id_vars: 用作索引的变量列。
- value_vars:要取消透视的列。默认使用所有列。
- var_name:用于“变量”列的名称。
- value_name:标量列
- col_level:可选
结果就是如下表格
month | name | money |
一月 | people_one | 1000.0 |
三月 | people_one | 3000.0 |
二月 | people_one | 2000.0 |
一月 | people_two | 5000.0 |
三月 | people_two | 4000.0 |
二月 | people_two | NaN |