参考资料:李航《统计学习方法》视频:4.6【习题篇】朴素贝叶斯法:贝叶斯估计_哔哩哔哩_bilibili 生成模型与判别模型 生成模型 判别模型 区分 全概率公式与贝叶斯公式 条件概率 贝叶斯定理 贝叶斯分类 朴素贝叶斯分类器 当每个实例x有n个特征,且每个特征相互独立 分母求和都为p(X=x) ,分子大小代表了y取不同值时的概率,即x的归属 详解…
参考资料:文章内容主要来自吴恩达老师的机器学习课程及周志华老师的《机器学习》,李航老师的《统计学习方法》 参考视频:2.3 感知机——学习算法之对偶形式:算法解说_哔哩哔哩_bilibili 梯度下降 原理 梯度下降法(gradient descent)是一种常用的一阶(first-order)优化方法,是 求解无约束优化问题最简单,最经典的方法之…
注:文章内容主要来自吴恩达老师的机器学习课程和周志华老师的《机器学习》 欠拟合和过拟合 仅使用简单线性回归会导致欠拟合,引入多项式回归当阶数逐渐过大时会导致过拟合 欠拟合导致偏差、方差均增高 过拟合情况下偏差较低,但方差增高 随模型阶数增加,偏差(训练集误差)逐渐降低,方差(测试集误差)先降低达到最低点后逐渐升高 过拟合解决方法 增加样本量;选择合…
简介:介绍r医学数据分析常用数据插补方法(持续更新ing) 所用R包:mice 多重插补mice包使用详解 library(openxlsx) #读取数据 library(tidyverse)#数据处理 library(mice)#多重插补 #数据处理 data <- read.csv("C:/Users/99405/Desktop/aa.x…
简介:整理了经常使用的医学数据处理分析所用r代码,待更新 系统设置 version #查看rstudio和r的版本 installr::updateR() #更新r版本 .libPaths() #查看和定义r包安装位置 library() #查看当前r版本所有已安装r包和其存储位置 文件读写 #文件目录 file.path(Sys.getenv("…
简介:汇总医学数据处理中所用的数据生成和修改代码 R包:tidyverse 变量类型设置和转换 variables <-c("mage_c2","fage_c2","M_edu","F_edu" ,"M_job" ,"F_job","parity_c2" ,"pcaWI_C3","treat_chris","ac203_c2") adam &…
简介:汇总了医学数据处理中常用的有关字符串筛,修正,拆分,提取所用代码 R包:tidyverse 正则表达式语法 1.1 特殊字符及其反意 . 匹配任意字符(注意只在同一行中有效如需换行可以用[\s\S]\d \D 匹配数字 匹配非数字\s \S 匹配空白符\w \W 匹配字母,数字,汉字,下划线[a-zA-Z0-9] 匹配数字或字母[a-zA-Z…
简介:简介高效的实现数据集的筛选、转置、合并,解决excel表格操作的痛点 所用r包:tidyverse 1.取数据集子集 select函数筛选列 adam1 <- adam %>% select(1,2) adam1 <- adam %>% select("x","y") adam1 <- adam %>% s…
简介:r语言结构方程模型,相比amos构建模型更方便,但绘图没有amos自定义程度高。 R包:lavaan 结构方程建模 tidySEM 、lavaanPlot绘图 中介结构方程模型 model <- ' # 潜变量 ability =~ 一关注倾听均分 + 一理解回应均分 + 一反思再现均分 work =~ 四工作条件均分 + 四工作压力均…
简介:批量两样本孟德尔随机化、中介孟德尔随机化及多变量孟德尔随机化代码 确认GWAS网站令牌 Sys.getenv("HOME") #查找根目录,更新apiieugwasr::get_opengwas_jwt() #查看令牌ieugwasr::api_status() #查看api状态 抽取工具变量 # 设定暴露id exposure_datc &…