R 回归虚拟变量na_【R语言进阶】Logistic回归及哑变量设置

然后，在Rstudio中，输入：

查看数据：

结果解读：

Estimate列表示回归系数，Std.Error表示标准误，z value表示统计量的值，Pr(>|z|)表示p值。我们可以看到bloodtypeA、bloodtypeB、bloodtypeC的结果，但是没看到bloodtypeO的结果。这是因为R语言logistic回归默认将分类变量的第一个factor设置为参照，通过前面的str(mydata)命令获得的数据集概况，可以看到bloodtype的levels顺序为：O、A、B、AB，所以在此回归模型中bloodtypeO当作参照。

获得OR值：

科研论文通常需要我们提供OR值及其95%可信区间以及p值，虽然这些都得到了，但是貌似整理起来比较麻烦，别急，我们通过命令进行整理。具体而言：先通过broom包中tidy函数把model1的结果变成规范的数据框格式，提取出p值，再把OR值和OR的95%可信区间，组合到一起。

结果解读：

第四步多因素logistic回归

结果输出到excel里：

在G盘的R文件夹中查看生成的多因素logistic回归结果，如图所示：

进阶：哑变量及参照的设置

还有一个重要的问题是如何设置哑变量的参照，本例中我们是以O型为参照，其他各型与它相比。如果我们想把A型设为参照，该如何操作呢p>

我们先看下bloodtype的各level名称的顺序：

运行模型

关注我的，数据分析都不求人了不信你试试相关资源：…dummy:虚拟RPM,用于哑的oracle-instantclient软件包-其它代码…

声明：本站部分文章及图片源自用户投稿，如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢！

R 回归 虚拟变量na_【R语言进阶】Logistic回归及哑变量设置

相关推荐

R 回归虚拟变量na_【R语言进阶】Logistic回归及哑变量设置