给你一个平台,让你来get一篇10分的SCI

您有大量测序数据却不知道如何解读吗?

您的数据使用过一次是否就完全舍弃了吗?

您面对生信分析众多软件是不是不知从何入手?

小编就给大家安利一个神器—–云生信

美国科学院 (Proceedings of the National Academy of Sciences of the United States of America,简称PNAS)曾于2011年发表非小细胞肺癌成纤维细胞的基因芯片研究。PNAS是世界公认的四大名刊之一(Cell,Nature,Science,PNAS),2014年的影响因子为9.674,该期刊发表的文章可代表某方向研究的一流水平。那么,接下来不要惊讶,使用云生信可以完全模拟该文章的研究思路,是不是很惊喜。

文章出处:Navab R, Strumpf D, Bandarchi B, et al. Prognostic gene-expression signature of carcinoma-associated fibroblasts in non-small cell lung cancer[J]. Proceedings of the National Academy of Sciences, 2011, 108(17): 7160-7165.

该文章使用到的生物信息分析流程图简单概述如下,接下来我们将利用云生信中的分析模块来实现文章的研究思路。

第一步:原始数据及预处理

文章从15个非小细胞肺癌患者中提取出肺癌成纤维细胞和正常成纤维细胞样本,并做了Affymetrix平台下的芯片数据。这个芯片数据如何产生就不在这里描述了(属于生物实验范畴,云生信爱莫能助)。得到的原始数据可以用云生信模块——芯片预处理,见图1。这里就得选用“Affy表达谱芯片数据处理”小工具。

第二步:差异基因筛选

得到芯片数据后,文章利用SAM方法分析肺癌成纤维细胞和正常成纤维细胞的基因表达水平差异,筛选出肺癌成纤维细胞中高表达或者低表达基因(通常称之为差异表达基因)。这一步可以使用云生信平台的“差异基因分析”模块,如图2.1。每个模块均给出详细的使用说明和分析意义,使用非常简单。值得一提的是,Limma也是常被用于计算基因表达水平变化值。图2.2展示输出结果,从表格可以很明显看出哪些基因在癌症样本中的表达水平发生变化。

第三步:差异基因热度图

文章展示的差异基因分析热度图这对云生信来说是小菜一碟,使用模块“热图制作工具”,见图3.1。当然差异基因在样本中的表达值文件在“差异分析”模块中都会直接输出,只要在热图制作工具直接使用就可以了。图3.2是热度图输出结果示例。

第四步:富集分析差异表达基因GO功能和KEGG通路

第五步:生存曲线分析

好了,这篇文章基本生物信息分析思路就完成,云生信平台多个模块的整合使用就可以完成文章的分析。这样看来,生物信息分析也就没有那么难了,后续只需要对分析结果进行阐述,一篇文章就出炉了~~

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2016年10月24日
下一篇 2016年10月25日

相关推荐