分类: R

26 篇文章

thumbnail
R数据处理(1)–描述和探索
简介:无论进行何种统计分析,数据探索是分析数据前必做的准备工作。可帮助我们确认和发现数据的变量类型,数据中的缺失值、异常值,以此判断数据适合的分析方法及进行对应的数据处理。 所用R包:tidyverse、skimr、DataExplorer、GGally #使用r自带数据集并设定变量类型 library(survival) adam <- l…
thumbnail
R数据分析(3)–随机森林
简介:用r语言构建随机森林预测模型,筛选预测变量,调整模型参数 所用r包:randomforest、caret 构建初始模型 form_xy <- as.formula( paste0("脑转移~",paste(colnames(train_x),collapse = "+")) ) form_xy #在训练集上构建RF初始模型 set.se…
thumbnail
R语言小贴士(3)–Excel文件操作
简介:本专题总结了我目前碰到的一些用R代码解决的Excel数据及表格处理中的难点,相比传统excel菜单式操作具有可复现及可批量化的优势。 所用r包:openxlsx、tidyverse、redaxl、rio Excel或wps功能的R语言实现 Excel日期格式 adam <- read.xlsx("xxxxx.xlsx") adam$生日…
thumbnail
R语言小贴士(2)–批量化
简介:利用tidyverse包中的across和map函数及传统的for循环功能,试图实现统计分析中大量重复工作的批量化以及繁杂代码的精简化,目前只汇总了目前所用到的一些批量化程序,进一步汇总有待后续更新。。。 设置变量类型 #批量设置因子型/有序型/字符型/数值型变量 variables <-c("Group.1.vs..2","Group…
thumbnail
R语言小贴士(1)–gtsummary
简介:gtsummary包可实现快速常用论文表 详细参数设置参考官方网址 Gtsummary 官方网站 基线表tbl_summary 1.t检验 #正态性检验 t1 <- adam %>% select(a1,a3,a4) %>% #选择需要分析的变量 tbl_summary(by = a1, #指定分组变量 missing="ifany",…