零基础如何学习 R 语言?

R提供了很多种功能,而且这些功能通过可选模块的下载和安装来实现的。这些包提供了横跨各种领域的功能,包括分析地理数据、处理蛋白质质谱等。
那什么是包呢?包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。库library中存储了很多包。函数.libPaths()可显示库所在位置,函数library()则可显示库中有哪些包。
R自带了一系列默认包(base、datasets、utils、grDevices、graphics、stats、methods),它们提供了很多种默认函数和数据集。安装好后,它们必须被载入到会话中才能用。命令search()可显示哪些包已加载并可使用。
安装R包
R包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。其实在安装R软件时,R会自动安装一些基础R包,基础R包提供了很多默认函数和数据集,其他大多数R包需要手动安装,例如ggplot2包等。第一次安装一个包,使用命令install.packages()即可。如果不加参数执行install.packages()将显示一个CRAN镜像站点的列表,选择其中一个镜像站点之后,将看到所有可用包的列表,选择其中的一个包即可进行下载和安装。
R包可从三种途径安装。

  1. CRAN

安装R包可以从CRAN上安装,只需在命令行输入代码install. packages(“package_name”)即可。

例如,安装readr包,可以这样输入
Install.packages(“readr”)

  1. Bioconductor

Bioconductor上安装R包。Bioconductor数据库存储了专用于生信领域的R包。在Bioconductor上安装R包可参考其官 的安装方法,操作跟CRAN上类似。

例如从Bioconductor安装用于分析基因组数据的R/Bioconductor包limma,可以输入:
Source(
https://bioconductor.org/biocLite.R
)
biocLite(“limma”)
也可以使用Biocmanager:install(“limma”)这种形式

  1. Github

  1. 使用键盘输入数据
  1. 创建一个空的数据框,其中变量名称和变量模式与理想中的最终数据集一致。
  1. 导入Excel数据

读取一个Excel文件夹的最好方式,就是在Excel中将其导出为一个逗 分隔文件(csv),然后再将其导入R中。在Windows系统里,可用RODBC包来方位Excel文件。
首先,下载并安装RODBC包。
install.packages(“RODBC”)
可使用下面代码导入数据:
library(RODBC)
channel <- odbcConnectExcel (“myfile.xls”)
mydataframe <- sqlFetch(channel, “mysheet”)
odbcClose(channel)
其中,myfile.xls是一个Excel文件,mysheet是要从这个工作簿中读取工作表的名称,channel是一个由odbcConnectExcel()返回的RODBC连接对象,mydataframe是返回的数据框。RODBC也可用于从Access中导入数据。

  1. 导入SPSS数据

SPSS数据集可通过foreign包中的函数read.spss()导入到R中,也可用Hmisc包中的spss.get()函数。函数spss.get()是对read.spss()的一个封装,它可自动设置后者的很多参数。
首先,下载并安装Hmisc包
install.package(“Hmisc”)
然后使用以下代码导入数据:
library(Hmisc)
mydataframe <- spss.get (“mydata.sav”, use.value.labels=TRUE)
这段代码中,mydata.sav是要导入的SPSS数据文件,use.value.labels=TRUE表示让函数将带有值标签的变量导入为R中水平对应相同的因子,mydataframe是导入后的R数据框。

  1. 导入SAS数据
  1. 导入STATA数据

将Stata数据导入R的代码类似于:
Library(foreign)
Mydataframe <- read.dta (“mydata.dta”)
R与数据导出
除了可以把数据导入R中,还可从R中把数据导出,以便保存数据或在外部程序中使用。那怎样从R中导出数据呢?

可用write.table()函数将R对象输出到符 分隔文件中。函数使用方法是:
write.table(x, outfile, sep=delimiter, quote=TRUE, na=”NA”)
其中x是输出对象,outfile是目标文件。例如,
write.table(mydata, “mydata.txt”, sep=”,”)
将mydata数据集输出到当前目录下逗 分隔的mydata.txt文件。用路径将输出文件保存到任何地方。用sep=”t”替换sep=”,”,数据就会保存到制表符分隔的文件中。默认情况下,字符串是放在双引 中,缺失值用NA表示。

  1. Excel表格

xlsx包中的write.xlsx()函数可将R数据框写入到Excel文件中。使用方法是
library(xlsx)
write.xlsx(x, outfile, col.Names=TRUE, row.names=TRUE,
sheetName=”Sheet 1”, append=FALSE)
例如,
library(xlsx)
write.xlsx(mydata, “mydata.xlsx”)
将mydata数据框保存到当前目录下的Excel文件mydata.xlsx的工作表中(默认为Sheet 1)。在这种情况下,数据集的变量名称被作为电子表格头部,行名称会放在电子表格的第一列。函数会覆盖已存在的mydata.xlsx文件。

  1. 统计学程序

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年1月15日
下一篇 2021年1月15日

相关推荐