高分生信文章不是梦,学会这5个数据库,你以后也是科研界的大佬!

众所周知,医生做科研很难,发SCI更难。基础研究,临床研究与生信研究都属于医生做科研的技能分支。

大部分医生做科研的主线是搞基础研究,通过做实验来产出数据,但是基础研究做的过程很费时间,数据产出的过程需要各种实验技巧,门槛相对较高。

近年来随着高通量测序技术的高速发展,生信研究异军突起,医生可以不再需要科研经费即可快速发文章灌水了,利用别人的数据进行二次挖掘,下载数据分析一遍,出一些花花绿绿的图就可以写文章了,这谁能不爱?

掌握一些生信基础知识,学有余力的小伙伴们再熟练掌握一些R语言的内容就可以实现弯道超车,是不是疯狂心动?

生信研究有套路吗?有!酸菜老师精心归纳了生信文章的四大组成板块:表达差异,功能聚类,交互 络与临床意义,总结为四字真言,即“挑圈联靠”。

简单来说,把公开的高通量数据拿来做二次分析,得到差异表达的分子列表,对其进行功能聚类分析后选出交际花类型的分子,抓住他们就能最有效率的控制整个 络,最后与临床资料相结合,转化成具有临床意义的科研成果。

上面这些步骤即对应了“挑圈联靠”四步走战略。当然这些过程中少不了一些生信技术手段来对数据进行分析,对于医生而言,会熟练掌握R语言就可以摸到天花板了,再往上的Perl,Python倒是大可不必,那又有人问,要是不会编程,计算机不好怎么办?

别慌,今天这就教你如何避开R语言,利用零代码的生信数据库及软件shinyGEO,GSEA, STRING,Cytoscape,GEPIA2,带你“挑、圈、联、靠”一波带走一篇生信文章!

一、“挑”—-表达差异之shinyGEO使用教程

大名鼎鼎的GEO数据库想必大家都有所耳闻,GEO是著名的基因表达综合数据库,并自带GEO2R可以进行差异表达基因的分析,但是单个基因的评估却没有那么简单。

对于没有生物信息学专业知识的人来说,特定GEO数据集的生存分析也无法实现。那这个时候shinyGEO就提供了一种解决办法。

shinyGEO的特点总结如下:

(1)允许用户直接从GEO下载基因表达数据集,提供单基因差异表达和生存分析,并进行可视化作图;

(2)支持可视化图形定制、样本选择、数据导出和R代码生成。

表达差异分析

可视化作图

图形定制

数据导出

R代码生成

生存分析

总的来说,shinyGEO是一个GEO数据库的在线可视化工具,点击操作即可完成对GEO数据基因表达差异分析以及生存曲线绘制。

二、“圈”—-功能聚类之GSEA软件使用教程

说到功能聚类,大家都能想到GO或者KEGG来对分子的功能和通路进行富集。

但是GO和KEGG进行分析的差异基因是通过人为定义的阈值得到的,而这种人为决定的阈值会遗漏掉某些表达差异不显著但有重要生物学意义的基因。

此外,如果上调基因和下调基因分开富集到了同一条通路,那这条通路到底是被激活还是抑制呢?

传统的富集分析只能定位到功能,而GSEA则可以通过预定义的基因集在排序好的基因列表中的分布回答某通路被抑制还是激活。

因此GSEA可以看作是GO和KEGG的补充和进阶,它检测的是基因集而不是单个基因的表达变化,得到更为理想的结果。

GSEA与传统GO、KEGG分析的区别:

(1)输入文件:GSEA是表达矩阵,传统的富集分析是基因名列表;

(2)排序:GSEA分析前需要根据表达量对基因进行排序,传统的GO、KEGG富集分析不需要;

(3)差异分析:GSEA不需要进行差异分析;

(4)目的:传统的富集分析主要关注的差异显著基因的功能,GSEA关注的是某个生物状态下功能基因集的变化。

GSEA简介

GSEA软件的下载和安装

GSEA输入文件的制作

GSEA分析

GSEA分析结果解读

总而言之,GSEA基因富集分析比传统的富集分析能发掘出更多的信息。

三、“联”—-交互 络之STRING数据库+Cytoscape软件

在生信文章中,STRING数据库和Cytoscape可视化软件可谓是一对手拉手的好兄弟。

STRING数据库全称为search tool for the retrieval of interacting genes/proteins,基因/蛋白相互作用检索搜查工具,用来构建蛋白质-蛋白质相互作用 络(PPI 络)。

只有正确地发现和注释细胞中所有功能性的相互作用关系,才能对细胞的功能进行系统层面的学习和理解。

STRING数据库的核心功能包括:

(1)单蛋白检索:通过输入单个蛋白的名称或序列(支持模糊搜索),得到这个蛋白和其他蛋白的互作 络;

(2)多蛋白检索:通过输入多个蛋白的名称或序列,得到输入蛋白间的互作关系 络;

(3)对含有数量值/排序的蛋白进行富集,分析获得这些蛋白显著差异表达的通路,类似GSEA的新增模式。

STRING数据库概览

单蛋白检索:绘制PPI 络

单蛋白检索结果解读

多蛋白检索:绘制PPI 络

多蛋白检索结果解读

实例讲解

与Cytoscape软件联用

含有数量值/排序的蛋白检索

总结,STRING可简单便捷地实现基因的互作关系 络图。

正如前文所述,利用STRING数据库得到的PPI 络可以进一步导入到Cytoscape软件中进行进一步的作图和润色,并可利用一些插件对 络图的节点进行相应的计算。

Cytoscape软件基本介绍

Cytoscape下载与安装

Cytoscape界面介绍

常见插件应用

绘制PPI 络图

筛选Hub基因

绘制ceRNA 络图

总的来说,Cytoscape可简单便捷地实现 络可视化。

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2021年2月10日
下一篇 2021年2月10日

相关推荐