简介:介绍r医学数据分析常用数据插补方法(持续更新ing) 所用R包:mice 多重插补mice包使用详解 library(openxlsx) #读取数据 library(tidyverse)#数据处理 library(mice)#多重插补 #数据处理 data <- read.csv("C:/Users/99405/Desktop/aa.x…
简介:整理了经常使用的医学数据处理分析所用r代码,待更新 系统设置 version #查看rstudio和r的版本 installr::updateR() #更新r版本 .libPaths() #查看和定义r包安装位置 library() #查看当前r版本所有已安装r包和其存储位置 文件读写 #文件目录 file.path(Sys.getenv("…
简介:汇总医学数据处理中所用的数据生成和修改代码 R包:tidyverse 变量类型设置和转换 variables <-c("mage_c2","fage_c2","M_edu","F_edu" ,"M_job" ,"F_job","parity_c2" ,"pcaWI_C3","treat_chris","ac203_c2") adam &…
简介:汇总了医学数据处理中常用的有关字符串筛,修正,拆分,提取所用代码 R包:tidyverse 正则表达式语法 1.1 特殊字符及其反意 . 匹配任意字符(注意只在同一行中有效如需换行可以用[\s\S]\d \D 匹配数字 匹配非数字\s \S 匹配空白符\w \W 匹配字母,数字,汉字,下划线[a-zA-Z0-9] 匹配数字或字母[a-zA-Z…
简介:简介高效的实现数据集的筛选、转置、合并,解决excel表格操作的痛点 所用r包:tidyverse 1.取数据集子集 select函数筛选列 adam1 <- adam %>% select(1,2) adam1 <- adam %>% select("x","y") adam1 <- adam %>% s…
简介:r语言结构方程模型,相比amos构建模型更方便,但绘图没有amos自定义程度高。 R包:lavaan 结构方程建模 tidySEM 、lavaanPlot绘图 中介结构方程模型 model <- ' # 潜变量 ability =~ 一关注倾听均分 + 一理解回应均分 + 一反思再现均分 work =~ 四工作条件均分 + 四工作压力均…
简介:批量两样本孟德尔随机化、中介孟德尔随机化及多变量孟德尔随机化代码 确认GWAS网站令牌 Sys.getenv("HOME") #查找根目录,更新apiieugwasr::get_opengwas_jwt() #查看令牌ieugwasr::api_status() #查看api状态 抽取工具变量 # 设定暴露id exposure_datc &…
简介:无论进行何种统计分析,数据探索是分析数据前必做的准备工作。可帮助我们确认和发现数据的变量类型,数据中的缺失值、异常值,以此判断数据适合的分析方法及进行对应的数据处理。 所用R包:tidyverse、skimr、DataExplorer、GGally #使用r自带数据集并设定变量类型 library(survival) adam <- l…
简介:用r语言构建随机森林预测模型,筛选预测变量,调整模型参数 所用r包:randomforest、caret 构建初始模型 form_xy <- as.formula( paste0("脑转移~",paste(colnames(train_x),collapse = "+")) ) form_xy #在训练集上构建RF初始模型 set.se…
简介:解决读入外部数据时,由于编码格式问题导致的字符乱码及数据分析报错情况。 所用R包:stringi #查找变量 character_columns <- names(data)[sapply(data, function(x) inherits(x, "character"))] #or data %>% select(where…