简介:用r语言构建随机森林预测模型,筛选预测变量,调整模型参数 所用r包:randomforest、caret 构建初始模型 form_xy <- as.formula( paste0("脑转移~",paste(colnames(train_x),collapse = "+")) ) form_xy #在训练集上构建RF初始模型 set.se…
简介:解决读入外部数据时,由于编码格式问题导致的字符乱码及数据分析报错情况。 所用R包:stringi 变量名格式调整 names(data) <- iconv(names(data), to = "ASCII//TRANSLIT") names(data) <- gsub("\\.", "_", names(data)) names(…
简介:本专题总结了我目前碰到的一些用R代码解决的Excel数据及表格处理中的难点,相比传统excel菜单式操作具有可复现及可批量化的优势。 所用r包:openxlsx、tidyverse、redaxl、rio Excel或wps功能的R语言实现 Excel日期格式 adam <- read.xlsx("xxxxx.xlsx") adam$生日…
简介:利用tidyverse包中的across和map函数及传统的for循环功能,试图实现统计分析中大量重复工作的批量化以及繁杂代码的精简化,目前只汇总了目前所用到的一些批量化程序,进一步汇总有待后续更新。。。 设置变量类型 #批量设置因子型/有序型/字符型/数值型变量 variables <-c("Group.1.vs..2","Group…
简介:gtsummary包可实现快速常用论文表 详细参数设置参考官方网址 Gtsummary 官方网站 基线表 1.t检验 # 补充正态性检验 mytest1 <- function(data, variable, ...) { shapiro.test(data[[variable]])$p.value } mytest2 …