分类: 数据处理

7 篇文章

thumbnail
R数据处理(7)-LOOKUP查询填补更新
注:本章内容介绍了excel中常用的查询填补法,该方法相较于Excel中的功能更为强大,自定义程度高,可规定按照查询到的值替换原数据或仅替换原数据的缺失值。 数据集比较 #修改数据格式使对应 bcdata <- bcdata %>% mutate(across(all_of(variables),~as.numeric(as.chara…
thumbnail
R数据处理(6)-重复数据的处理
所用r包 library(tidyverse)library(openxlsx) 数据导入和预处理 adam <- read.csv("青春末期随访24.11.12录入完毕数据.csv") #空值转为缺失 adam <- adam %>% mutate(across(everything(),~ifelse(.=="",NA,.)…
thumbnail
R数据处理(2)-缺失数据插补
简介:介绍r医学数据分析常用数据插补方法(持续更新ing) 所用R包:mice 多重插补mice包使用详解 library(openxlsx) #读取数据 library(tidyverse)#数据处理 library(mice)#多重插补 #数据处理 data <- read.csv("C:/Users/99405/Desktop/aa.x…
thumbnail
R数据处理(5)–变量计算
简介:汇总医学数据处理中所用的数据生成和修改代码 R包:tidyverse 变量类型设置和转换 variables <-c("mage_c2","fage_c2","M_edu","F_edu" ,"M_job" ,"F_job","parity_c2" ,"pcaWI_C3","treat_chris","ac203_c2") adam &…
thumbnail
R数据处理(4)–正则表达式与字符串处理
简介:汇总了医学数据处理中常用的有关字符串筛,修正,拆分,提取所用代码 R包:tidyverse 正则表达式语法 1.1 特殊字符及其反意 . 匹配任意字符(注意只在同一行中有效如需换行可以用[\s\S]\d \D 匹配数字 匹配非数字\s \S 匹配空白符\w \W 匹配字母,数字,汉字,下划线[a-zA-Z0-9] 匹配数字或字母[a-zA-Z…
thumbnail
R数据处理(3)–数据集操作
简介:简介高效的实现数据集的筛选、转置、合并,解决excel表格操作的痛点 所用r包:tidyverse 1.取数据集子集 select函数筛选列 adam1 <- adam %>% select(1,2) adam1 <- adam %>% select("x","y") adam1 <- adam %>% s…
thumbnail
R数据处理(1)–描述和探索
简介:无论进行何种统计分析,数据探索是分析数据前必做的准备工作。可帮助我们确认和发现数据的变量类型,数据中的缺失值、异常值,以此判断数据适合的分析方法及进行对应的数据处理。 所用R包:tidyverse、skimr、DataExplorer、GGally #使用r自带数据集并设定变量类型 library(survival) adam <- l…