快捷搜索:  汽车  科技

R语言logistic回归模型:R语言logistic回归一

R语言logistic回归模型:R语言logistic回归一BMI=rnorm(600 mean = 22 sd = 3) edu=sample(1:4 600 replace = T)set.seed(1234)#设置随机种子,保证生成数据一致log_data<- data.frame(Y = sample(0:1 600 replace = T) sex=sample(1:2 600 replace = T)

前言

本文使用随机生成的数据集进行批量单因素logistic回归分析,并提取P<0.05的变量以供后续多因素logistic回归。后续会继续分享一些R语言分析代码,欢迎大家一起讨论学习。

构建数据,Y为因变量,其他为自变量

构建数据

R语言logistic回归模型:R语言logistic回归一(1)

生成随机数据的代码截图

#0.构建数据,Y为因变量,其他为自变量

set.seed(1234)#设置随机种子,保证生成数据一致

log_data<- data.frame(Y = sample(0:1 600 replace = T)

sex=sample(1:2 600 replace = T)

edu=sample(1:4 600 replace = T)

BMI=rnorm(600 mean = 22 sd = 3)

白蛋白=rnorm(600 mean = 35 sd = 6)

随机血糖=rnorm(600 mean = 4.75 sd = 1.2))

描述数据

R语言logistic回归模型:R语言logistic回归一(2)

对生成的数据进行描述

可以看到sex与edu变量显示的“数值型”,因此需要进行一下转化:

数据处理,因子化

R语言logistic回归模型:R语言logistic回归一(3)

因子化

VarsC<-c("Y" "sex" "edu")

for(i in VarsC){

log_data[ i] <- as.factor(log_data[ i])

} # 利用循环因子化

然后我们再描述一下数据:

R语言logistic回归模型:R语言logistic回归一(4)

可以看到sex与edu已经变成分类变量,这样继续进行接下来的分析。

准备进行分析的自变量

varsU<-names(log_data[ 2:6]) # 自变量

批量单因素logistic回归

R语言logistic回归模型:R语言logistic回归一(5)

批量单因素logistic回归 代码截图

Result<-c()

for (i in 1:length(varsU)){

fit<-glm(substitute(Y~x list(x=as.name(varsU[i]))) data=log_data family=binomial())

fitSum<-summary(fit)

result1<-c()

result1<-rbind(result1 fitSum$coef)

OR<-exp(fitSum$coef[ 'Estimate'])

result1<-data.frame(cbind(result1 cbind(OR exp(confint(fit)))))

result1$Characteristics<-varsU[i] #添加变量名

Result<-rbind(Result result1[-1 ])#[-1 ] 删除常数项

}

提取制表变量重命名,提取有意义的变量

R语言logistic回归模型:R语言logistic回归一(6)

Uni_log<-data.frame(Result[ c(1 4:8)]) #提取"P" "OR" "CIlower" "CIupper"和变量名

colnames(Uni_log)[2:5]<-c("P" "OR" "CIlower" "CIupper")#变量重命名

ExtractVar<-unique(Uni_log$Characteristics[Uni_log$"P"<0.05])#提取有意义的变量

查看结果,输出文档

R语言logistic回归模型:R语言logistic回归一(7)

Uni_log

write.csv(Uni_log file="Uni_log.csv")#输出文档

R语言logistic回归模型:R语言logistic回归一(8)

Uni_log结果

R语言logistic回归模型:R语言logistic回归一(9)

输出的csv文件截图,方便制作三线表

猜您喜欢: