简介:本专题总结了我目前碰到的一些用R代码解决的Excel数据及表格处理中的难点,相比传统excel菜单式操作具有可复现及可批量化的优势。 所用r包:openxlsx、tidyverse、redaxl、rio Excel或wps功能的R语言实现 Excel日期格式 adam <- read.xlsx("xxxxx.xlsx") adam$生日…
1.决策树 注:以下内容来自吴恩达老师的机器学习课程和周志华老师的《机器学习》 1.1决策树原理示例图 1.2纯度和信息增量 我们面临两个问题:1.如何选择分类特则; 2.何时停止分类 为解决以上两个问题,引入概念“纯度”和“信息增量” 1.2.1如何选择分类特则? 信息增量计算示例 1.2.2何时停止分裂 当一个节点100%是一个类时当拆分一个节…
简介:利用tidyverse包中的across和map函数及传统的for循环功能,试图实现统计分析中大量重复工作的批量化以及繁杂代码的精简化,目前只汇总了目前所用到的一些批量化程序,进一步汇总有待后续更新。。。 设置变量类型 #批量设置因子型/有序型/字符型/数值型变量 variables <-c("Group.1.vs..2","Group…
简介:gtsummary包可实现快速常用论文表 详细参数设置参考官方网址 Gtsummary 官方网站 基线表 1.t检验 #正态性检验 mytest1 <- function(data, variable, ...) { shapiro.test(data[[variable]])$p.value } t1 <- ad…