快捷搜索:  汽车  科技

r语言常用数据处理代码整理(R语言数据处理之Tidyverse)

r语言常用数据处理代码整理(R语言数据处理之Tidyverse)dplyr基本包含了我们整理数据的所有功能,堪比瑞士军刀,这里介绍以下函数: filter: filters out rows according to some conditions (根据条件过滤数据) arrange: reorders rows according to some conditions (根据某一列的数据对行排序) select: selects a subset of columns (只保留部分列的数据) mutate: adds a new column as a function of existing columns (增加新的列) summarise: collapses a data frame to a single row (概述数据的统计特征) group_by: breaks a data frame into groups of rows (

tidyverse的一大亮点就是提供非常优秀的数据清理、整合和可视化的“一站式服务”。

本文介绍工具整体框架:

r语言常用数据处理代码整理(R语言数据处理之Tidyverse)(1)

R语言进行数据科学流程

管道函数 %>%数据整理

tibble格式

dplyr包

dplyr基本包含了我们整理数据的所有功能,堪比瑞士军刀,这里介绍以下函数: filter: filters out rows according to some conditions (根据条件过滤数据) arrange: reorders rows according to some conditions (根据某一列的数据对行排序) select: selects a subset of columns (只保留部分列的数据) mutate: adds a new column as a function of existing columns (增加新的列) summarise: collapses a data frame to a single row (概述数据的统计特征) group_by: breaks a data frame into groups of rows (对数据分组)

tidyr包

tidyr的两个主要函数是 gather()和 spread()。这些函数允许在长数据格式(long data)和宽数据格式(wide data)之间进行转换(功能类似于reshape包,但是比reshape更好用,并且可以用于管道%>%连接)

可视化:ggplot2统计:broom

broom是一个用于数学建模的包,以回归分析为例,R中的各种回归分析往往不会返回一个整齐的data frame结果,而broom 则帮助我们直接将统计结果转化为data frame格式直接将统计结果转化为data frame格式

猜您喜欢: