r函数在python中的运用:数据分析师们看过来
r函数在python中的运用:数据分析师们看过来新的环境,创建好后,就可以激活使用了。激活新环境的方法,可以通过菜单启动,也可以通过控制台启动。菜单启动只需要点击需要启动的环境即可。新建一个虚拟环境conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r/ conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaco
之前将jupyter notebook集成到了Excel环境之中,这次花了一个周末,尝试将R语言也一起纳入到联合环境之中来。
R语言和Python语言一样,都是很优秀的数据分析解释语言。R语言最常用的开发工具是R studio。其实jupyter notebook也支持R语言分析数据。因为之前自己已经搭建了Python在jupyter之中的开发环境,这次打算将R语言也集成过来。如果能实现,今后在不同的环境之中,就不用来回切换。
本节介绍在jupyter notebook环境之中搭建R语言开发环境。在搭建过程之中经历不少波折。相比Python环境搭建,困难要大不少,从内外网查阅不少资料,以下记录下来搭建过程,以免遗忘。
步骤一,设置清华源镜像环境。默认情况下anaconda各版本只默认将Python及主要的包一同打包,R语言环境及必备包并不在默认安装文件之中,需要手动配置R语言环境和安装包。R语言环境及相关必备包文件比较大,安装这些文件前,建议先配置anaconda国内镜像环境,通过配置镜像环境,能够大大增加R环境配置成功率。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/fastai/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --append channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes
配置文件
镜像配置成功后,如果想新建一个同时包含Python和R语言的环境,这里可以选择通过anaconda navigator配置Python和R语言联合分析虚拟环境。配置方法很简单。只需要在界面内,在环境菜单下新建一个新的环境即可。
创建新环境会耗时比较长,需要耐心等待。
新建一个虚拟环境
新的环境,创建好后,就可以激活使用了。激活新环境的方法,可以通过菜单启动,也可以通过控制台启动。菜单启动只需要点击需要启动的环境即可。
启动Python和R语言环境
步骤二,安装R语言基础包环境步骤一介绍了通过GUI工具配置Python和R语言联合开发环境,很多朋友,之前Python开发环境已经配置好了,如果重新配置,又需要花不少精力维护新环境。其实anaconda也支持在已经有的Python环境基础之上,添加R语言环境
这里介绍,将R语言安装到anaconda基础环境之下。只需要在控制台内,输入以下命令,就可以搭建起来R语言开发环境。
conda install -c r r-essentials。
该命令,会自动将R语言基础环境,大多数数据分析工具包,自动安装到基础环境之中。因为需要下载众多工具包,安装过程比较耗时,耐心等待,工具安装好后,就可以使用conda list命令查看R语言安装工具包。相比Python工具包,R语言工具包名称前均有“r-”前缀。
R语言工具包
安装完成后,就可以启动jupyter notebook服务了。启动服务后,就可以,可以发现新建菜单下多了R语言文件菜单了。
R新建菜单
编写好的脚本,在有的场合会报错,可能是当前环境仍然在Python环境下,R环境还未激活。在kernel菜单下,选择R kernel,就能够激活R环境了,如果激活成功,界面右上角就能够看见R logo图标了。
报错
切换kernel
右上角有R语言logo图标
步骤三、安装一些自己可能运用到的包环境。anaconda环境下,Python语言包管理非常方便,可以使用conda 或者pip命令,安装Python包,相比Python语言,R语言,安装包也有两种方式。
方式一,可以使用conda install 命令安装R语言包,安装命令如下,其中r-devtools是包名,这里切换其他的包名,该名称前两个字符是区别Python包前缀,后面名称才是真正的包名。
conda search -c r-devtools
需要注意,conda只能安装部分R语言工具包,一些新的包或者小众化的工具包,不能够通过conda 命令安装,安装包另外一种方式就是使用install.packages包安装命令。
可以在jupyter notebook界面内,直接通过该命令安装包。例如以下命令安装Excel和R语言之间数据互动命令工具包。
url <- "http://www.omegahat.net/R/bin/windows/contrib/3.5.1/RDCOMClient_0.93-0.zip"
url <- "http://www.omegahat.net/R/bin/windows/contrib/4.0/RDCOMClient_0.94-0.zip"
install.packages(url repos = NULL type = "binary")
安装成功后,可以在jupyter环境内直接从Excel表格之中获取数据,到R环境了。
直接获取Excel数据到R环境
例如上图,将左侧数据,通过R命令函数,将数据载入到R环境之中,接下来就能够用R语言分析Excel刚载入的数据了。
后续继续介绍怎样在EFunction插件内,更好利用好R语言分析数据。