pandas处理excel数据循环:pandas处理Excel数据的基本流程
pandas处理excel数据循环:pandas处理Excel数据的基本流程DataFrame 是 pandas 库中的重要数据类型,可以叫做:数据框,好比放数据的架子,由行和列组成。其实跟Excel工作的表很类似,都是二维的。DataFrame类型从基本流程来看,这个数据处理过程,就是对原数据进行加工,生成新数据的过程。 原始Excel文件 就像是 原材料 , 生成Excel文件 就像是 新产品 。而pandas中就是这个加工厂,加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。import pandas as pd df = pd.read_excel(io header=0) 常用参数介绍:read_excel()演示
原文 http://www.cnblogs.com/wansq/p/15781104.html
这里所说的 Pandas 并不是大熊猫,而是Python的第三方库。这个库能干嘛呢?它在Python数据分析领域可是无人不知、无人不晓的。可以说是Python世界中的Excel。
pandas库 处理数据相比于Excel,有一个极大的优点: 数据 和 处理逻辑 是分离的 。基于这一点,便可以实现Excel数据处理的自动化,对于重复繁琐的数据分析, pandas 一次编写脚本便“终身受益”。反观Excel,遇到重复的任务还得一遍一遍地输入公式、拖动填充柄。
pandas处理Excel数据的基本流程pandas处理Excel数据的基本流程
从基本流程来看,这个数据处理过程,就是对原数据进行加工,生成新数据的过程。 原始Excel文件 就像是 原材料 , 生成Excel文件 就像是 新产品 。而pandas中就是这个加工厂,加工厂的处理逻辑就是根据具体需求来编写的代码。可以从下面的实例中来理解这过程。
实例演示实例需求描述:import pandas as pd
df = pd.read_excel(io header=0)
常用参数介绍:
- io :需要传入Excel文件的路径。该参数没有默认值,不能为空
- header :可以指定从Excel中的哪一行开始读取数据。默认为0,从第一行开始。
read_excel()演示
二、数据处理DataFrame类型
DataFrame 是 pandas 库中的重要数据类型,可以叫做:数据框,好比放数据的架子,由行和列组成。其实跟Excel工作的表很类似,都是二维的。
DataFrame结构示意图
实际DataFrames数据表
筛选
简单的数据筛选,只需要输入列名,也叫“键”
数据筛选
计算
计算演示
按照年龄分类:cut()函数
按年龄分类
三、写入Excel文件df.to_excel("./生成的Excel文件名.xlsx")
- 第一个参数:生成的Excel文件路径。
- index :生成的Excel文件中是否需要index列,默认为 True Pandas