pandas处理excel数据循环：pandas处理Excel数据的基本流程

威哥 2023-01-25 15:36:08 102

pandas处理excel数据循环：pandas处理Excel数据的基本流程DataFrame 是 pandas 库中的重要数据类型，可以叫做：数据框，好比放数据的架子，由行和列组成。其实跟Excel工作的表很类似，都是二维的。DataFrame类型从基本流程来看，这个数据处理过程，就是对原数据进行加工，生成新数据的过程。原始Excel文件就像是原材料，生成Excel文件就像是新产品。而pandas中就是这个加工厂，加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。import pandas as pd df = pd.read_excel(io header=0) 常用参数介绍：read_excel()演示

原文 http://www.cnblogs.com/wansq/p/15781104.html

这里所说的 Pandas 并不是大熊猫，而是Python的第三方库。这个库能干嘛呢？它在Python数据分析领域可是无人不知、无人不晓的。可以说是Python世界中的Excel。

pandas库处理数据相比于Excel，有一个极大的优点： 数据和处理逻辑是分离的 。基于这一点，便可以实现Excel数据处理的自动化，对于重复繁琐的数据分析， pandas 一次编写脚本便“终身受益”。反观Excel，遇到重复的任务还得一遍一遍地输入公式、拖动填充柄。

pandas处理Excel数据的基本流程

pandas处理excel数据循环：pandas处理Excel数据的基本流程(1)

pandas处理Excel数据的基本流程

从基本流程来看，这个数据处理过程，就是对原数据进行加工，生成新数据的过程。原始Excel文件就像是原材料，生成Excel文件就像是新产品。而pandas中就是这个加工厂，加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。

实例演示实例需求描述：

pandas处理excel数据循环：pandas处理Excel数据的基本流程(2)

pandas中的常用方法简介一、读取Excel文件

import pandas as pd df = pd.read_excel(io header=0)

常用参数介绍：

io :需要传入Excel文件的路径。该参数没有默认值，不能为空
header :可以指定从Excel中的哪一行开始读取数据。默认为0，从第一行开始。

pandas处理excel数据循环：pandas处理Excel数据的基本流程(3)

read_excel()演示

二、数据处理

DataFrame类型

DataFrame 是 pandas 库中的重要数据类型，可以叫做：数据框，好比放数据的架子，由行和列组成。其实跟Excel工作的表很类似，都是二维的。

pandas处理excel数据循环：pandas处理Excel数据的基本流程(4)

DataFrame结构示意图

pandas处理excel数据循环：pandas处理Excel数据的基本流程(5)

实际DataFrames数据表

筛选

简单的数据筛选，只需要输入列名，也叫“键”

pandas处理excel数据循环：pandas处理Excel数据的基本流程(6)

数据筛选

计算

pandas处理excel数据循环：pandas处理Excel数据的基本流程(7)

计算演示

按照年龄分类：cut()函数

pandas处理excel数据循环：pandas处理Excel数据的基本流程(8)

按年龄分类

三、写入Excel文件

df.to_excel("./生成的Excel文件名.xlsx")

第一个参数：生成的Excel文件路径。
index ：生成的Excel文件中是否需要index列，默认为 True Pandas

网站首页

返回栏目