R 回归 虚拟变量na_【R语言进阶】Logistic回归及哑变量设置

然后,在Rstudio中,输入:

查看数据:

结果解读:

Estimate列表示回归系数,Std.Error表示标准误,z value表示统计量的值,Pr(>|z|)表示p值。 我们可以看到bloodtypeA、bloodtypeB、bloodtypeC的结果,但是没看到bloodtypeO的结果。这是因为R语言logistic回归默认将分类变量的第一个factor设置为参照,通过前面的str(mydata)命令获得的数据集概况,可以看到bloodtype的levels顺序为:O、A、B、AB,所以在此回归模型中bloodtypeO当作参照。

获得OR值:

科研论文通常需要我们提供OR值及其95%可信区间以及p值,虽然这些都得到了,但是貌似整理起来比较麻烦,别急,我们通过命令进行整理。具体而言:先通过broom包中tidy函数把model1的结果变成规范的数据框格式,提取出p值,再把OR值和OR的95%可信区间,组合到一起。

结果解读:

4

第四步 多因素logistic回归

结果输出到excel里:

在G盘的R文件夹中查看生成的多因素logistic回归结果,如图所示:

5

 进阶:哑变量及参照的设置

还有一个重要的问题是如何设置哑变量的参照,本例中我们是以O型为参照,其他各型与它相比。如果我们想把A型设为参照,该如何操作呢p>

我们先看下bloodtype的各level名称的顺序:

 

运行模型

890a55569fa610da1ed69fbfae6901b2.png 关注我的,数据分析都不求人了 不信你试试相关资源:…dummy:虚拟RPM,用于哑的oracle-instantclient软件包-其它代码…

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年10月15日
下一篇 2020年10月15日

相关推荐