这是什么神仙思路?只用GraphPad和GEPIA就搞定6分+纯生信文章

大家好~今天给大家带来一篇肿瘤免疫相关的6分+纯生信文章。为什么选择这篇文章带给大家呢?因为范文不仅用了非常简单的GraphPad Prism作图软件和GEPIA数据库就完成了,并且最重要的是利用了TCGA、GEO以及CCLE三大数据库分析并验证,思路清晰,逻辑链条完整,最关键的临床意义也相当明确。这篇文章2020年3月发表在“Cancers”上,题名为“Metabolic Plasticity in Ovarian Cancer Stem Cells ”,全文共包含8个Figure和5个Table。接下来我们一起挖掘这篇“方法简单,套路神仙”的纯生信文章套路吧~

研究背景

本篇范文研究的疾病——卵巢癌(OvCa)是女性第五大常见癌症。早期诊断为局限性疾病的妇女的五年生存率超过90%,但确诊时为第三期或第四期时,生存率急剧下降。OvCa尽管最初对化疗有反应,但仍有近75%的患者出现化疗抵抗性疾病复发。复发被认为是由于次优切除和残留的具有化学抵抗性的肿瘤细胞的存在,它们具有独特的适应环境、代谢、免疫和药理学提示的能力。

虽然肿瘤干细胞(CSC)克隆可能具有相同的遗传特征,但越来越多的证据表明克隆内存在显著的异质性。活化的CSC亚群可以进行表型转换,进入更增殖的上皮样状态,并伴有代谢向有氧糖酵解、氧合酶、脂肪酸氧化(FAO)和谷氨酰胺分解的转变。

数据解构

“联”——分子相关性分析及互作关系验证

之前有小伙伴问到过关于如何筛选数据集,为什么通过原文中的关键词总是找不到文中应用的数据集呢?今天我来给大家解答一下。在一篇生信文章中,最重要的就是样本信息。数据集千千万,如何选择是关键~

数据集的选择

首先,我们要确定研究的科学问题。疾病一般不会变,都是各位的研究领域,如果发个1-2分的文章灌灌水,那么选择与疾病相关的几个包含正常样本对照的数据集就可以了。那如果想冲一冲上三分五分,选择数据集上我们就要花费很多的精力啦!成年人的世界就是付出的永远比得到的多,磨刀不误砍柴工,哈哈~言归正传,到底如何选择呢?答案就是——大面积撒 ,重点捕捞。重点又来啦!第一步,限定关键词。小编这里建议大家不要过多使用限定词,真的会错过一万年。我们的关键词只要包含“Disease”、“normal”以及我们研究的特殊方向就可以了,比如疾病亚型、相关药物、特定基因、位点突变等。随后我们选择“Homo sapiens”及“Expression profiling by array”,如下图所示:

总之筛选GEO数据集的主要原则有以下几点:

①多个数据集均围绕所要研究的临床问题展开,如样本的分组、分层等保持一致;

②包含比例恰当的疾病样本和正常样本做对照;

③确定样本类型(组织、细胞、外周血等),保证样本同源;

④ 数据平台很关键。如果条件允许,我们尽量选择GPL570等芯片平台,如果多个平台则需要使用R语言去除批间差。

接下来我们进入正题:

第一步:OCSCs标记之间的相关性

第二步:——构建分子交互 络

STRING protein-protein interaction web工具对这些OCSC标记的相互作用进行建模,基于NOTCH1、SOX2、OCT4、NANOG、CD117和CD133之间具有实验证据支持的互作关系预测;发现CD44与耐药标记物ABCB5相关(Fig.1B)。

“靠&圈”——功能富集以及临床变量相关性分析

① CD44的转录本与糖酵解标记之间存在正相关;

② TCGA数据库中分析NOTCH1、CD133、CD44、CD24和ALDH1A1与三羧酸循环(TCA)酶显著正相关;

③ 卵巢癌干细胞中的OXPHOS与OCSCs表面标志物间的相关性分析;

④ OVCAR3-OCSCs在CD36、ACACA、SCD和CPT1A中也显著升高,CD44、CD133和ALDH1A1与脂质代谢酶呈正相关;

⑤ TCGA数据库中OCSC标记物与谷氨酰胺代谢酶之间存在正相关。

并且在“圈”——功能聚类这一层面与其他生信分析中分子的GO/KEGG/GSEA富集分析不同的是,该研究通过细胞表面标记与相互作用的各种酶和复合物的标记进行富集分析,将分子间的互作关系与临床表型相联系。

1

OCSCs标记与糖酵解的相关性

▲ Fig.3 GSE28799和GSE64999中糖酵解标志物的表达。

Table 1.在TCGA和GEPIA诱导的卵巢癌标本中,CSC转录本的表达与葡萄糖转运体转录本以及参与糖酵解的关键酶之间的Pearson相关性研究。红色表示显著正相关,蓝色表示显著负相关。

2

OCSCs标记物与三羧酸(TCA)循环的相关性

我们都知道TCA循环是多种分解代谢和合成代谢途径整合的枢纽,其中就包括了糖酵解、糖异生、线粒体电子传递链、脂肪酸和胆固醇合成以及谷氨酰胺代谢。

▲ Fig.2 TCGA中OCSC标记与TCA酶的相关性研究。

▲ Fig.4 OCSC模型中TCA标记的表达

3

卵巢癌干细胞中的OXPHOS

▲ Fig.5 电子传递链(ETC)复合物在GSE28799和GSE64999中的表达

并且还发现OCSC表面标记之间的相关性和关键酶在两个GEO数据集的OVCAR3-OCSCs模型中存在正相关性的趋势,其中NANOG与ALDH1A1表现出显著相关性。然而,OCSC标记物的转录量与复合物II、III、IV和V的转录量之间存在不一致的正负相关性,CD24和CD44与复合II酶呈阳性但不显著的相关性(Fig.6A-B)。并在TCGA数据库中验证了肿瘤患者的OCSC标记物与酶的转录本的相关性模式(Fig.6C和Table 3)

▲ Table 3 TCGA数据库中CSC转录本的表达与ETC中涉及的关键酶的转录本之间的Pearson相关性

▲ Fig.6 OCSC标记和其他复合物的转录的相关性

4

OCSC标记物与脂代谢的关系

▲ Table 4 TCGA中OCSC标记物与脂质转运体及脂质代谢关键酶的相关性研究

▲ Fig.7 脂质代谢转运蛋白和酶在OCSC模型中的表达

5

▲ Table 5 TCGA中OCSC标记与谷氨酸转运体及谷氨酸/谷氨酰胺代谢关键酶的相关性研究

▲ Fig.8 谷氨酰胺/谷氨酸代谢转运蛋白和酶在OCSC模型中的表达

全文总结

①基因表达谱:选取同时包括了卵巢癌的球状体和母细胞的GSE28799和GSE64999两个数据集;

②OvCa细胞系数据:来自Broad Institute Cancer cell Line Encyclopedia (CCLE) 络平台,并进行了类似的分析。

本篇范文重点在于各种相关性分析,利用的分析方法和工具:

① 采用Holm-Sidak多重t检验分析OCSCs及其亲代细胞中标记物及代谢途径中涉及的酶的差异表达,皮尔逊相关分析法分析对不同群体的OCSC标记与代谢酶转录本的相关性,均采用GraphPad Prism 7.0进行;

② 通过GEPIA进行TCGA数据库种基因间相关性分析,利用Excel制作相关性条形图。

10天领悟3分SCI套路

点击下方

解螺旋服务

免费参加

—END—

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年5月12日
下一篇 2020年5月12日

相关推荐