TCGAbiolinks更新了，轻松下载TCGA改版后的转录组数据

2022年4月2日上午9:10 • 行业观察

if (!requireNamespace("BiocManager", quietly = TRUE))  install.packages("BiocManager")BiocManager::install("remotes")BiocManager::install("BioinformaticsFMRP/TCGAbiolinksGUI.data")BiocManager::install("BioinformaticsFMRP/TCGAbiolinks")BiocManager::install("SummarizedExperiment")

安装好这些包后，需要对代码进行一些修改，例如workflow.type这里需要改为workflow.type=”STAR – Counts”，使用assay函数获取表达矩阵的时候需要设计参数i，也就是选择你要下载的数据格式：

geneexp <- assay(mydata,i = "unstranded")#tpm_unstrand fpkm_unstrand

例如你要下载Counts格式就需要i= “unstranded”，下载tpm格就要i=”tpm_unstrand”，下载fpkm格式就要i=” fpkm_unstrand”。

TCGA改版后最大的好处就是不需要转换id了，可以直接获取具有基因名字的表达矩阵，同时可以直接提取出mRNA矩阵和lncRNA矩阵，可以节省不少时间和精力。

write.table(mRNA,"mRNA.txt",quote = F,sep = "t",row.names = F)

write.table(lncRNA,"lncRNA.txt",quote = F,sep = "t",row.names = F)

这样就可以轻松一步到位获取TCGA数据库的mRNA矩阵和lncRNA矩阵，比使用perl方便多了，不需要安装多余的软件，全程使用R语言。

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

TCGAbiolinks更新了，轻松下载TCGA改版后的转录组数据

相关推荐