thumbnail
R数据处理(4)–正则表达式与字符串处理
简介:汇总了医学数据处理中常用的有关字符串筛,修正,拆分,提取所用代码 R包:tidyverse 正则表达式语法 1.1 特殊字符及其反意 . 匹配任意字符(注意只在同一行中有效如需换行可以用[\s\S]\d \D 匹配数字 匹配非数字\s \S 匹配空白符\w \W 匹配字母,数字,汉字,下划线[a-zA-Z0-9] 匹配数字或字母[a-zA-Z…
thumbnail
R数据处理(3)–数据集操作
简介:简介高效的实现数据集的筛选、转置、合并,解决excel表格操作的痛点 所用r包:tidyverse 1.取数据集子集 select函数筛选列 adam1 <- adam %>% select(1,2) adam1 <- adam %>% select("x","y") adam1 <- adam %>% s…
thumbnail
R数据分析(1)–结构方程模型
简介:r语言结构方程模型,相比amos构建模型更方便,但绘图没有amos自定义程度高。 R包:lavaan 结构方程建模 tidySEM 、lavaanPlot绘图 中介结构方程模型 model <- ' # 潜变量 ability =~ 一关注倾听均分 + 一理解回应均分 + 一反思再现均分 work =~ 四工作条件均分 + 四工作压力均…
thumbnail
R数据分析(2)–孟德尔随机化
简介:批量两样本孟德尔随机化、中介孟德尔随机化及多变量孟德尔随机化代码 确认GWAS网站令牌 Sys.getenv("HOME") #查找根目录,更新apiieugwasr::get_opengwas_jwt() #查看令牌ieugwasr::api_status() #查看api状态 抽取工具变量 # 设定暴露id exposure_datc &…
thumbnail
R数据处理(1)–描述和探索
简介:无论进行何种统计分析,数据探索是分析数据前必做的准备工作。可帮助我们确认和发现数据的变量类型,数据中的缺失值、异常值,以此判断数据适合的分析方法及进行对应的数据处理。 所用R包:tidyverse、skimr、DataExplorer、GGally #使用r自带数据集并设定变量类型 library(survival) adam <- l…
thumbnail
R数据分析(3)–随机森林
简介:用r语言构建随机森林预测模型,筛选预测变量,调整模型参数 所用r包:randomforest、caret 构建初始模型 form_xy <- as.formula( paste0("脑转移~",paste(colnames(train_x),collapse = "+")) ) form_xy #在训练集上构建RF初始模型 set.se…
thumbnail
R语言小贴士(3)–Excel文件操作
简介:本专题总结了我目前碰到的一些用R代码解决的Excel数据及表格处理中的难点,相比传统excel菜单式操作具有可复现及可批量化的优势。 所用r包:openxlsx、tidyverse、redaxl、rio Excel或wps功能的R语言实现 Excel日期格式 adam <- read.xlsx("xxxxx.xlsx") adam$生日…
thumbnail
机器学习系列(4)–决策树与集成学习
1.决策树 注:以下内容来自吴恩达老师的机器学习课程和周志华老师的《机器学习》 1.1决策树原理示例图 1.2纯度和信息增量 我们面临两个问题:1.如何选择分类特则; 2.何时停止分类 为解决以上两个问题,引入概念“纯度”和“信息增量” 1.2.1如何选择分类特则? 信息增量计算示例 1.2.2何时停止分裂 当一个节点100%是一个类时当拆分一个节…
thumbnail
R语言小贴士(2)–批量化
简介:利用tidyverse包中的across和map函数及传统的for循环功能,试图实现统计分析中大量重复工作的批量化以及繁杂代码的精简化,目前只汇总了目前所用到的一些批量化程序,进一步汇总有待后续更新。。。 设置变量类型 #批量设置因子型/有序型/字符型/数值型变量 variables <-c("Group.1.vs..2","Group…