快捷搜索:  汽车  科技

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 Numpy(提供高性能的矩阵运算)。Pandas 提供了快速,灵活和富有表现力的数据结构,目的是使“关系”或“标记”数据的工作既简单又直观。它旨在成为在 Python 中进行实际数据分析的高级构建块。关于“pandas库函数”Python由荷兰数学和计算机科学研究学会的Guido van Rossum 于1990 年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。Python强大的库函数Python拥有一个庞大,且还在不断拓展的标准库。它可以帮助处理各种工作,包括正则表达式、文档生成、单元测试、线

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(1)

分享兴趣,传播快乐,增长见闻,留下美好!

少年易老学难成,一寸光阴不可轻

浅谈Python及其强大的库函数——pandas(2)

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(2)

关于Python

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(3)

Python由荷兰数学和计算机科学研究学会的Guido van Rossum 于1990 年代初设计,作为一门叫做ABC语言的替代品。Python提供了高效的高级数据结构,还能简单有效地面向对象编程。Python语法和动态类型,以及解释型语言的本质,使它成为多数平台上写脚本和快速开发应用的编程语言,随着版本的不断更新和语言新功能的添加,逐渐被用于独立的、大型项目的开发。

Python强大的库函数

Python拥有一个庞大,且还在不断拓展的标准库。它可以帮助处理各种工作,包括正则表达式、文档生成、单元测试、线程、数据库、网页浏览器、CGI、FTP、电子邮件、XML、XML-RPC、HTML、WAV文件、密码系统、GUI(图形用户界面)、Tk和其他与系统有关的操作。这被称作Python的“功能齐全”理念。除了标准库以外,还有许多其他高质量的库,如wxPython、Twisted和Python图像库等等。

关于“pandas库函数”

Pandas 是一个强大的分析结构化数据的工具集;它的使用基础是 Numpy(提供高性能的矩阵运算)。Pandas 提供了快速,灵活和富有表现力的数据结构,目的是使“关系”或“标记”数据的工作既简单又直观。它旨在成为在 Python 中进行实际数据分析的高级构建块。

Pandas 最核心的就是 Series 和 DataFrame 两个数据结构:

Series 是用于表示一维数据的类,而 DataFrame 可以想象成一个电子表格,它由行名(index)、列名(columns)和数据(values)组成,如下所示:

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(4)

在 Pandas 中,DataFrame 类的列(column)类型是 Series,又可以把 DataFrame 看做Series 的列表(list)。创建方式通常有三种:

(1) 由 Series 作为键值的字典创建;

(2) 由 list 作为键值的字典创建;

(3) 由二维 NumPy ndarray 类型创建

通常我们通过代码:import pandas as pd 来导入 Pandas 库方便使用(不再需要完整使用 Pandas,直接引用 pd 即可)。

Pandas(适合数据可视化):Plot 类

在 Pandas 中,我们有行标签、列标签以及分组信息(可能有)。也就是说,要制作一张完整的图表,原本需要一大堆的 matplotlib 代码,现在只需一两条简洁的语句就可以了。

Pandas 有许多能够利用 DataFrame 对象数据组织特点来创建标准图标的高级绘图方法(这些函数的数量还在不断增加)。

(1)对于 random 函数,主要用于产生随机数;

(2)对于 array 函数,主要用于产生指定的数组类型的数据;

(3)对于 arange 函数,主要用于产生指定的数组类型的数据。

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(5)

运行结果如下:

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(6)

pythonpandas数据基本操作(浅谈Python及其强大的库函数-pandas)(7)

英文翻译

The English translation

Share interests spread happiness increase knowledge leave beauty! Dear this is LearningYard School. Today the editor brings you:

Python and its library functions——Pandas

About the Python

Python was designed in the early 1990s by Guido van Rossum of the Dutch Institute for Mathematical and Computer Science research as an alternative to a language called ABC. Python provides efficient high-level data structures as well as simple and efficient object-oriented programming. Python syntax and dynamic typing as well as the nature of the interpreted language make it a programming language for scripting and rapid application development on most platforms. As versions continue to be updated and new features are added to the language it is increasingly being used for independent large project development.

Python's powerful library functions

Python has a large and growing standard library. It can help with a variety of jobs including regular expressions document generation unit testing threading databases Web browsers CGI FTP E-mail XML XML-RPC HTML WAV files password systems GUIs (graphical user interfaces) Tk and other system-related operations. This is called Python's "full-featured" idea. In addition to the standard library there are many other high-quality libraries such as the wxPython Twisted and Python image libraries to name a few.

About "Pandas"

Pandas is a powerful tool set for analyzing structured data; Its use is based on Numpy which provides high-performance matrix operations. Pandas provides fast flexible and

expressive data structures designed to make the work of "relational" or "tagging" data simple and intuitive. It is intended to be an advanced building block for actual data analysis in Python.

Pandas is the Series and DataFrame data structure for Pandas:

A Series is a class for representing one-dimensional data while a DataFrame can be thought of as a spreadsheet consisting of row names (index) column names (columns) and values as follows: In Pandas the column type of the DataFrame class is Series.

A DataFrame is a list of Series. There are usually three ways to create this :

(1) create a dictionary with Series as the key value;

(2) create a dictionary with list as key;

(3)To import pandas into the library use the following code: "import pandas as pd".

In Pandas we have row tags column tags and grouping information (possibly). In other words one or two simple statements are all it takes to create a complete chart that used to require a bunch of Matplotlib code.

Pandas has a number of high-level drawing methods that take advantage of the data organization features of DataFrame objects to create standard ICONS (the number of functions is growing).

(1) The random function is mainly used to generate random numbers;

(2) For the array function mainly used to generate the specified array type of data;

(3) For the arange function it is mainly used to generate data of the specified array type.

如果您对今天的文章有独特的想法,欢迎给我们留言。

让我们相约明天,祝您今天过得开心快乐!

本文由LearningYard学苑原创,

部分图片、视频素材来源网络,如侵权请沟通。

参考资料:

百度图片(图片)

百度百科(文字)

猜您喜欢: