年度归档: 2024 年

34 篇文章

thumbnail
R语言小贴士(3)–Excel文件操作
简介:本专题总结了我目前碰到的一些用R代码解决的Excel数据及表格处理中的难点,相比传统excel菜单式操作具有可复现及可批量化的优势。 所用r包:openxlsx、tidyverse、redaxl Excel或wps功能的R语言实现 Excel日期格式 adam <- read.xlsx("xxxxx.xlsx") adam$生日 <…
thumbnail
机器学习系列(4)–决策树与集成学习
1.决策树 注:以下内容来自吴恩达老师的机器学习课程和周志华老师的《机器学习》 1.1决策树原理示例图 1.2纯度和信息增量 我们面临两个问题:1.如何选择分类特则; 2.何时停止分类 为解决以上两个问题,引入概念“纯度”和“信息增量” 1.2.1如何选择分类特则? 信息增量计算示例 1.2.2何时停止分裂 当一个节点100%是一个类时当拆分一个节…
thumbnail
R语言小贴士(2)–批量化
简介:利用tidyverse包中的across和map函数及传统的for循环功能,试图实现统计分析中大量重复工作的批量化以及繁杂代码的精简化,目前只汇总了目前所用到的一些批量化程序,进一步汇总有待后续更新。。。 设置变量类型 #批量设置因子型/有序型/字符型/数值型变量 variables <-c("Group.1.vs..2","Group…
thumbnail
R语言小贴士(1)–论文基线表
简介:gtsummary包可实现快速生成论文基线表,并弥补了tableone包不能添加统计量列的痛点 示例语法: library(gtsummary) library(tidyverse) t1 <- adam %>% select(2:78) %>% #选择需要分析的变量 tbl_summary(by = group, #指定分组变量 la…