该文结合已发表的研究论文,从研究设计、统计分析与结果 告3方面涉及的统计学问题入手,进行逐条解读,以阐明医学论文应达到的统计 告要求。研究设计部分详见:一表总结:医学期刊的统计 告要求。下文主要分享统计分析和结果 告要求。
统计分析
1、缺失值的处理:
缺失值是人群研究中不可避免的问题,其处理方式的差异可能在不同程度上引入偏倚,因此,详细 告数据清理过程中缺失值的处理方法有助于读者对潜在偏倚风险进行评价。
例如,瑞舒伐他汀试验在统计分析部分详细说明了缺失值的填补策略,包括:将二分类结局中的缺失值视为未发生事件;将生物标志物和心电图测量中的缺失值进行多重填补(multiple imputation);为了证明缺失值处理的合理性和填补结果的稳定性,研究还比较了多重填补与完整数据(complete-case)分析的结果。
2、数据的预处理:
实施统计分析之前往往需要将原始数据进行预处理,如:对连续变量进行函数转换使其更接近正态分布,基于原始数据构建衍生变量,将连续变量拆分为分类变量或将分类变量的不同类别进行合并等。医学论文应 告处理原始数据的方法及依据,瑞舒伐他汀试验即在统计分析部分描述了对血液生物标志物的对数转换。
3、变量分布特征描述:
事实上,应根据研究设计类型、统计分析目的和数据特征选择恰当的描述方法。例如,CKB选择采用年龄、性别和地区校正的均值和率来描述人群分布特征,而非简单的 告连续变量的均数和分类变量的构成比。
4、主要分析(primary analysis):
指针对研究结局的统计分析,是研究论文的核心证据。因此,医学论文应详细描述主要分析的实施过程和适用性。
在试验性研究中,应明确统计分析数据集、试验效应指标、相对或绝对风险及其置信区间的计算方法、以及假设检验的方法。
例如,瑞舒伐他汀试验采用意向性分析(intention to treat)数据集,通过计算OR值及其95%CI来评价术后房颤发生风险在试验组与对照组间的差异,置信区间包含1说明研究结果不拒绝原假设,即两组的术后房颤发生风险相等;考虑到重复测量的需要,采用协方差分析比较两组术后6~120 h肌钙蛋白Ⅰ释放曲线下面积的对数,并计算其均值的绝对差异及其95%CI来评价围术期心肌损伤情况在试验组与对照组间的差异,置信区间包含0说明研究结果不拒绝原假设,即两组的围术期心肌损伤情况相同。
例如,CKB采用Cox比例风险回归模型分析水果摄入与心血管事件之间的关联,因变量为心血管事件,包括心血管死亡、主要冠状动脉事件、出血性卒中、缺血性卒中、其他缺血性心脏病和其他脑血管病;
自变量为水果摄入频率,即每天、4~6 d/周、1~3 d/周、每月、极少或从不;分层变量为年龄、性别和地区;同时模型调整了基线的混杂变量;
为了帮助多个暴露类别之间的比较,研究采用浮动绝对风险的方法(floating-absolute-risk method)估计危险比的变异程度,并与传统的不浮动绝对风险的方法进行比较。
5、其他分析:
如果研究在主要分析之外,还进行了其他辅助分析(ancillary analysis),如敏感性分析(sensitivity analysis)或亚组分析(subgroup analysis),应在统计分析部分给予充分说明。
如果是事后分析(post-hoc analysis),应考虑潜在的Ⅰ类错误膨胀问题。例如,瑞舒伐他汀试验在主要分析的基础上,根据基线年龄(≤60岁或>60岁)、性别、他汀用药史(是或否)等变量分亚组比较主要结局指标在试验组与对照组间的差异。但是,由于该亚组分析在研究设计时已预先设定(pre-specify),因此无需对显著性水平进行调整。
6、多重比较:
例如,瑞舒伐他汀试验设置了两个平行的主要结局指标:术后房颤和围术期心肌损伤,原则上应调整显著性水平以控制总体Ⅰ类错误概率。然而,由于研究假设两个主要结局指标同时达到组间差异有统计学意义才算试验阳性,且在估算样本量时已对此给予了充分考虑,因此无需考虑多重检验的问题(without allowance for multiple testing)。
7、Ⅰ类错误概率与统计软件:
医学论文应对统计检验的Ⅰ类错误概率(单/双侧)及统计软件进行说明。例如,两部分数据分别采用SAS 9.3和Stata 13.0软件进行分析,所有检测均为双侧检验,P<0.05为差异有统计学意义。
结果 告
1、研究对象的纳入流程:
医学期刊推荐使用研究对象流程图来描述研究对象的纳入流程、研究实施过程中的失访或无应答、以及最终的统计分析数据集等信息,见图 1。研究对象流程图的展示可以为研究对象是否存在选择偏倚、研究结果的可外推范围等提供重要证据。
图1 瑞舒伐他汀试验的研究对象流程图
注:a患者可能被多种原因排除;b接受手术患者的百分比;所有生化测量的缺失值百分比范围为5.0%~7.5%,除了sCD40L(17.5%)
2、基线数据比较:
表2. 瑞舒伐他汀试验的研究对象基线特征(节选)
3、效应估计与置信区间:
医学论文在 告统计结果时不应仅依赖于P值,还应给出量化的效应估计结果,同时评价其测量误差或不确定性,如 告95%CI(如有必要,可根据显著性水平对置信系数进行调整。因为P值无法反映关于效应大小和估计精度的重要信息,只能说明统计学意义,而损失对临床意义的表达。
SAMPL指南建议研究者给出临床意义的最小界值,以帮助读者根据点估计及置信区间判断研究的临床意义。中华流行病学杂志则提出,当P值小于Ⅰ类错误概率时,应说“组间差异有统计学意义”,而不应说“组间有显著性差异”。例如,CKB在评价研究因素对结局的发生风险时, 告了危险比及其95%CI。
4、结果与方法一一对应:
医学论文应保证研究结果与方法一一对应,如:在方法中介绍了基线的统计描述与组间比较的具体方法,应在结果中对基线数据进行相应的描述与比较;在方法中说明了研究的主要分析方法,应在结果中对主要结局指标的估计或假设检验结果进行 告;在方法中提出了其他分析,包括敏感性分析、亚组分析等,应在结果中罗列出相应内容。
例如,瑞舒伐他汀试验在方法部分说明研究将对主要结局指标、次要结局指标分别进行组间比较,并对主要结局指标进行亚组分析;在结果部分则依次 告了相应结果。
5、伤害:
需要注意的是,无论是试验性研究还是观察性研究,都有可能存在伤害研究对象的风险。医学论文应如实 告研究过程中发生的伤害。
例如,噻托溴铵试验 告了试验组与对照组的不良事件发生情况:除了轻度不良事件(如口咽不适)外,其他不良事件、严重不良事件和死亡发生率的组间差异均无统计学意义。
6、P值的 告规范及保留小数位数:
不同医学期刊对P值的 告规范有不同要求。例如,NEJM规定,除非研究设计需要进行单侧检验,如非劣效性试验,其他 告的P值均应为双侧。P值大于0.01应 告小数点后两位;P值在0.01到0.001之间应 告小数点后三位;P值小于0.001应 告为P<0.001。在分层分析中,只需 告层间比较差异有统计学意义的P值,而不需 告所有层间两两比较的P值。
CMJ(Engl)规定,应使用大写斜体,并 告P值的精确值(如果P值在0.001~0.05之间时)。中华医学杂志规定,应尽可能给出具体的P值。中华流行病学杂志规定,应给出P值的实际数值,并保留3位小数。在使用不等式表示P值时,选用P>0.05、P<0.05和P<0.01即可满足需求,无须细分P<0.001或P<0.000 1。
可以看出,目前医学期刊对P值的 告尚无统一规范,导致一些研究仅给出P值与显著性水平之间的不等关系,而不体现量化的数值(如P>0.05);一些研究则盲目追求P值的精度,而保留不必要的小数位数(如P=0.0357)。
7、统计表规范:
8、统计图规范:
统计表用于展示数据的精确数值,而统计图则提供对数据的全面评估。ICMJE对统计图的要求包括:依照正文的引用顺序连续编码,并确保每张图都在正文中被引用;如果图片已经发表,应获取许可并充分引用;如果存在符 、箭头、数字或字母用于标记图片,需在图例中逐一解释,见图 1。不同杂志还会对图片的格式和大小进行进一步要求。统计图表达方式的创新有助于读者快速掌握研究的核心结果。
9、图表内容不重复:
医学论文的图表内容不应重复,且不应在文中复述图表中的所有数据;应仅强调或总结最重要的结果。
例如,瑞舒伐他汀试验在结果部分依次用图表展示了基线、主要结局指标及亚组分析、共同主要结局指标和次要结局指标的相关内容。
总结
声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!