pandas分类汇总的函数（高效的5个pandas函数你都用过吗）

逗爷 2023-09-12 03:51:03 792

pandas分类汇总的函数（高效的5个pandas函数你都用过吗）DataFrame.explode(self column:Union[str Tuple]) 参数作用：用法：高效的10个Pandas函数，你都用过吗？pandas还有很多让人舒适的用法，这次再为大家介绍5个pandas函数，作为这个系列的第二篇。explode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据，若想要展开成多行进行分析，这时候explode就派上用场，而且只需一行代码，非常节省时间。

❝

文章来源：towardsdatascience
作者：Soner Yıldırım

❞

看标题是否似曾相似？之前为大家介绍过10个高效的pandas函数，颇受欢迎，里面的每一个函数都能帮我们在数据分析过程中节省时间。

高效的10个Pandas函数，你都用过吗？

pandas还有很多让人舒适的用法，这次再为大家介绍5个pandas函数，作为这个系列的第二篇。

1. explode

explode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据，若想要展开成多行进行分析，这时候explode就派上用场，而且只需一行代码，非常节省时间。

用法：

DataFrame.explode(self column:Union[str Tuple])

参数作用：

column ：str或tuple

以下表中第三行、第二列为例，展开[2 3 8]：

#先创建表 id=['a' 'b' 'c'] measurement=[4 6 [2 3 8]] day=[1 1 1] df1=pd.DataFrame({'id':id 'measurement':measurement 'day':day}) df1

pandas分类汇总的函数（高效的5个pandas函数你都用过吗）(1)

使用explode轻松将[2 3 8]转换成多行，且行内其他元素保持不变。

df1.explode('measurement').reset_index(drop=True)

pandas分类汇总的函数（高效的5个pandas函数你都用过吗）(2)

2. Nunique

Nunique用于计算行或列上唯一值的数量，即去重后计数。这个函数在分类问题中非常实用，当不知道某字段中有多少类元素时，Nunique能快速生成结果。

用法：

Series.nunique(dropna=True) #或者 DataFrame.nunique(axis=0 dropna=True)

参数作用：

axis：int型，0代表行，1代表列，默认0；
dropna：bool类型，默认为True，计数中不包括NaN；

先创建一个df：

values_1=np.random.randint(10 size=10) values_2=np.random.randint(10 size=10) years=np.arange(2010 2020) groups=['A' 'A' 'B' 'A' 'B' 'B' 'C' 'A' 'C' 'C'] df=pd.DataFrame({'group':groups 'year':years 'value_1':values_1 'value_2':values_2}) df

pandas分类汇总的函数（高效的5个pandas函数你都用过吗）(3)