难以置信!这款无脑计算生存曲线的神器帮助师妹顺利毕业

前不久,作为博士刚毕业、博士后入站的我正在用细胞刮子吭哧吭哧地刮着细胞培养皿里293T细胞时,一个熟悉地声音从身后响起。

“师兄!”

我回头一看,原来是已经毕业了半年的硕士师妹,师妹手里拿着很多水果袋子,她把水果放到我座位这里,说她现在找到的工作特别好,要谢谢我。我客气道,我又没帮上什么忙。

师妹马上说,“要不是师兄半年前告诉我一个计算生存曲线的软件,我现在还在延毕呢。”

师妹这么一说,我突然想起半年前的一件事。

半年前,急着想毕业的师妹的投稿的文章里有个很关键的实验结果很不理想,整天愁眉苦脸的,我这个好事之人就上去询问。原来,师妹的文章里有一张病人的生存曲线图,没有办法得出有差异的结果,而这张图是整篇文章的核心和关键出发点,真是愁煞人了。

我于是看了看师妹的生存曲线结果:

师妹研究的是乳腺癌病人中X gene的表达量和生存预后的关系,从上图可以看到,红线所示X gene高表达病人(552个)和蓝线所示X gene低表达病人(552个)的预后统计学分析可见,p=0.47(上图红圈内),完全没有统计学差异,这个结果几乎宣告了师妹文章的死刑。

我看了这个结果,微微一笑,云淡风轻地告诉了师妹我有办法。接着我就开始了我的表演。

对于计算生存曲线并科学地得出有统计学差异的结果,那就需要一款很有用的软件。

计算生存曲线神器——X-tile software

这是一款耶鲁大学设计的计算生存曲线最佳截断值的软件。

我们首先找到下载地址 站:

https://medicine.yale.edu/lab/rimm/research/software/

点击上图红圈里的下载链接。

然后经过安装后打开软件

出现软件界面。

点击Analyze后,出现操作界面。

选择File,接下来就是打开文件,注意文件需要txt的格式,我这边用师妹的excel文件给大家演示下。

以下是师妹的生存曲线结果在excel里的展示图:

于是得到下面的TXT格式:

然后回到软件里,打开file,找到这个txt文件打开,就看到下面这个操作界面:

然后把点击蓝圈里的X gene 在Marker处load,点击OS.time在Survival Time处load,点击OS在Censor处load。如下图:

然后点左上方“Do”,选择Kaplan-Meier,选择Marker1,然后桌面上就会下面这五个图。下图红框里就是X-gene表达量和病人数的图。(先不管这个图,继续往下读)

师妹刚才的结果得不出结果的主要原因是因为她把病人的表达量高低按照病人人数的一半来划分,具体的说就是1144个病人,师妹按照X gene表达量从大到小排,前552个病人算作高表达组,后552个病人算作低表达组。但是这种均分的做法是否科学值得商榷,而X-tile软件可以用最快的速度找到一个最佳截断值,明确X-gene表达量高还是低的临界值,然后确定病人的数量。

为了找到这个最佳截断值,我们只要点击下图红色箭头所指的地方。

然后奇迹发生了!

各位同志们,看到了没有?

上图红圈里,灰折线代表X-gene高表达组,蓝折线代表X-gene低表达组,两组很明显地分开了,而且p=0.0387(黄圈内显示),有显著统计学差异。绿圈里显示的最佳截断值=0.1,也就是决定基因表达量高低的临界值。而从蓝圈里可见软件分析得到X-gene高表达的病人数是984个,X-gene低表达的病人数是120个。

我把结果在graph-pad软件里展示得到:

这是师妹梦寐以求的结果,我想起来那天我把这张图给师妹看后,师妹的眼睛里面放出了光。

后来师妹还是不放心,又问我这个软件靠不靠谱,review和杂志那边承认不承认,我再次微微一笑,打开了一篇PNSA文章。文章的Supplementary Figure 3里就使用了这个软件。(见下图)

师妹的文章后来很顺利地被接受了,然后顺利拿到学位,找到了一份心仪的工作,也怪不得她要来感谢我。

从此以后,我们课题组里的生存曲线都开始用这个软件,而且还借此筛出来了很多以前忽略的和肿瘤相关的重要基因。

其实X-tile还有很多的功能,我上文介绍的只是冰山一角,以后有时间我再和大家聊聊其他功能,大家也可以自己摸索摸索。

最后衷心希望各位研究生们今年都能顺利毕业!!!

原文链接:https://mp.weixin.qq.com/s/0ltz4K2ATImOVhelNA85ng

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2022年3月20日
下一篇 2022年3月20日

相关推荐