“增强版”列线图——R语言nomogramEx和nomogramFormula软件包介绍 |《临床预测模型构建方法学》图书连载

编者按:临床预测模型作为临床研究的“高阶玩法”,不仅仅是发表高分SCI文章的热门选择,更是改变临床实践的重要途径。随着临床预测模型热度日渐上升,很多团队都在尝试建立各类疾病诊断/治疗的预测模型,但经常遭遇准确性低或应用不便等“拦路虎”。 在此背景下,《临床预测模型构建方法学》应运而生。本书由30余位临床统计高手合力编著而成,是一本拿来即用的“实战指南”。

在本书热销之际,AME科研时间将节选部分精彩篇章以飨读者。今天带来 “增强版”列线图——R语言nomogramEx 和 nomogramFormula 软件包介绍一章。本章提供了一种更加简便而准确的构建临床预测模型的方法。

“增强版”列线图——R语言nomogramEx 和 nomogramFormula 软件包介绍

毕国澍,李润美,梁嘉琪,胡正阳,詹成 ??????????????????????????????

特别是Cox比例风险回归模型的应用,在某种程度上回答了“该患者将存活多久”的问题。但是,仅基于Cox回归模型的结果,临床医生很难准确预测患者的预后。列线图(Nomogram)是统计预测模型的简易可视化图形,有易于使用的图形界面。它已被广泛用于肿瘤预后研究,这主要是因为它能够将复杂的预测公式简化为某个事件(例如死亡或复发)发生概率的数值估计[7-9] 。周支瑞等[3] 详细地总结了列线图的解释和应用,非常适合读者们研习。

其次,考虑到在列线图轴线上刻度的限制,有时人们无法从该数轴获得此点的精确分值以及相应的生存概率,从而限制了列线图解读结果的准确性。再次,我们很难基于列线图自动计算每个患者的总分值和生存概率,尤其是当Cox模型和相应列线图中同时存在多个变量时。因此,我们介绍两个R语言程序包作Nomogram的扩展,即由Du等提出的名为“nomogramEx”包[11] 和Zhang等“nomogramFormula”包[12] 。它们旨在提取多项式方程,并自动计算每个变量的分值以及与总分值相对应的生存概率。在这里,我们提供了一个示例和相应的R代码来解释此函数。我们依旧使用了周支瑞等在文章中提及的乳腺癌患者的数据(案例1)[3] 。步骤见下文(代码由灰色背景标注,结果标记为斜体)。

一、步骤一:安装nomogramEx和nomogramFormula程序包并加载其他必要的帮助程序包

二、步骤二:将“.sav”格式的数据加载到R环境中

三、步骤三:数据预处理

四、步骤四:定义非二分类变量

此处将病理分期和年龄定义为分类变量,以避免上述错误。然后根据要求将变量打包在“rms”包中。

五、步骤五:通过rms包中的cph函数拟合Cox回归模型,并将生存函数对象构建为surv

六、步骤六:基于Cox模型绘制列线图

基于Cox模型绘制列线图,其中通过生存函数计算研究对象在1、3和5年(分别为12、36和60个月)的生存概率。将Lp参数(线性预测)设置为FALSE,以取消创建基于偏回归系数(X beta)所计算数值的轴线。Maxscale表示最大分值(图18-1)。

注:OS表示Overall survival(总体生存率),pgR表示孕激素受体状态。

七、步骤七:计算生存率

通过沿着每个独立变量轴线上的对应点向下作垂线,从而获得各变量所对应的分值。分别为每位患者的各变量分值求和,即可从Total Points轴得到相应时间的生存率。但是,当模型中存在多个变量且患者人数众多时,计算每个患者的总得分和生存率将是一项工程量浩大而繁琐的任务。同时,由于轴上的刻度被划分为每单位5分,也会产生一定的系统误差。在这种情况下,列线图所基于的精确的生存公式,可以作为Cox模型和列线图之间的“桥梁”。程序包“nomogramEx”提供了此功能。

“nomo”表示R中上述列线图对象。“np”是指列线图中的预测次数。我们预测了1年、3年和5年的生存概率,因此np = 3。“digit”定义了小数点后的位数,默认值为9。如果将此参数设置得较大,则预测结果会更精确,但这样设置可能会增加计算所需的时间。

现在,结果中将显示每个变量每个水平的对应分值以及计算1、3和5年总体生存概率的公式。

八、步骤八:计算原始数据中每个患者的总分值和生存概率

此外,借助“nomogramFormula”程序包中的formula_lp函数,我们可自动计算原始数据中每个患者的总分值和生存概率。

现在,在原先的数据框中显示出了患者1、3和5年的总分值和相应的生存概率(由于生存时间的单位设置为月,所以命名为P12、P36和P60)。

九、步骤九:计算C指数(C-Index)并按原文建议绘制校准曲线

绘制的校准曲线如图18-2所示。

图18-2 基于列线图和相应的Cox回归模型的校准曲线

OS表示Overall survival(总体生存率)。

参考文献(向上滑动查看)

[1] Djulbegovic B,Guyatt GH. Progress in evidence-based medicine:a quarter century on[ J]. Lancet,2017,390(10092):415-423.

[2] Reza Soroushmehr SM,Najarian K. Transforming big data into computational models for personalized medicine and health care[ J]. Dialogues Clin Neurosci,2016;18(3):339-343.

[3] Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R[ J]. Ann Transl Med,2019,7(23):796.

[4] Han K,Song K,Choi BW. How to Develop,Validate,and Compare Clinical Prediction Models Involving Radiological Parameters:Study Design and Statistical Methods[ J]. Korean J Radiol,2016,17(3):339-350.

[5] Steyerberg EW,Vergouwe Y. Towards better clinical prediction models:seven steps for development and an ABCD for validation[ J]. Eur Heart J,2014,35(29):1925-1931.

[6] Woodward M,Tunstall-Pedoe H,Peters SA. Graphics and statistics for cardiology:clinical prediction rules[ J]. Heart,2017,103(7):538-545.

[7] Iasonos A,Schrag D,Raj GV. How to build and interpret a nomogram for cancer prognosis[ J]. J Clin Oncol,2008,26(8):1364-1370.

[10] Deng W,Xu T,Xu Y,et al. Survival Patterns for Patients with Resected N2 Non-Small Cell Lung Cancer and Postoperative Radiotherapy:A Prognostic Scoring Model and Heat Map Approach[ J]. J Thorac Oncol,2018,13(12):1968-1974.

[11] Du Z,Hao Y. R package “nomogramEx”[EB/OL]. Available online:https://cran.r-project.org/web/packages/nomogramEx/index.html.

[12] Zhang J,Jin Z. R package “nomogramFormula”[EB/OL]. Available online:https://github.com/yikeshu0611/nomogramFormula.

欲解锁更多精彩内容,并获得书中相关数据及代码,请扫描下方二维码进入微店!

  • 临床预测模型构建方法学
  • 资讯

    AME旗下13本期刊最新影响因子|2021年6月

    b.03. 2022.04.26.02

    点击

    阅读原文

    进入AME微店

    声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

    上一篇 2022年3月26日
    下一篇 2022年3月26日

    相关推荐