回归模型系列(1)-Linear regression model

待更新…..

连续型因变量

general linear regression

二分类因变量

logistic regression

Logistic回归:适用于任何二分类结局的建模,特别是稀有事件;也是最常见的二分类模型。

目的是估计结局的优势比 (Odds Ratio, OR)

输出的回归系数是OR的对数,可以解释为结局事件的“发生优势”。当结局发生率较低时,OR接近RR,但当发生率较高时,OR会偏离RR,因此不适合高发生率事件的RR估计。

log-binomial

当结局发生率较高、logistic回归难以解释RR时。log-binomial可以对RR进行估计,从而在二分类结局中实现更直观的风险解释。

目的:Log-binomial回归直接建模二分类结局的相对风险 (RR)。

原理:在log-binomial回归中,结局的发生概率通过log-link函数建模,估计出的参数可以直接解释为相对风险。

优缺点:Log-binomial回归的优势在于它能直接估计RR,因此结果解读直观。但该模型容易出现不收敛问题,特别是在某些样本或数据分布下。

适用情况:在样本量适中、数据分布良好的二分类结局中,log-binomial回归是直接估计RR的理想方法。

Modified Poisson regression

目的:当logistic回归不适用时,通过引入稳健标准误的Poisson回归可以实现对RR的稳健估计。

原理:Poisson回归通常用于计数数据,但可以应用在二分类数据中,通过引入稳健标准误来控制过度离散。其回归参数可以解释为RR的近似值。

优缺点:Poisson回归相对容易收敛,且引入稳健标准误后可以得到相对可靠的RR估计。缺点是Poisson回归并不直接针对二分类数据,因此其效果可能在某些数据分布下不如log-binomial回归。

适用情况:在log-binomial回归不收敛时,修正的Poisson回归是很好的替代方法,因为它相对容易实现且稳健。

罕见离散型变量

PoIsson regression

适合事件计数数据的建模,特别是当数据是泊松分布时。它也可以通过对数链接来估计率比 (Rate Ratio) 或其他相对变化。

negative binomial regression

目的:处理方差大于均值的过度离散计数数据。

原理:负二项回归在Poisson回归的基础上引入了一个额外的分布参数,以允许方差大于均值。它假设数据服从一个负二项分布,通过在Poisson模型中加入一个Gamma分布的随机误差项,来解释额外的变异。

优缺点

  • 负二项回归能够很好地处理具有过度离散的计数数据,并且模型估计较为稳定。
  • 缺点是负二项回归引入了一个额外参数(α\alphaα),增加了模型复杂性。

应用:负二项回归适用于需要明确建模数据生成过程,并且需要更稳定的参数估计的场景。

Quassi-poisson regression

目的:类似Poisson回归,但通过调整标准误来处理过度离散,而不改变Poisson模型的均值结构。

优缺点

  • Quasi-Poisson回归简单而有效,特别是在只需要修正标准误的情况下。它在模型复杂性上较为简单,不引入额外的分布假设。
  • 缺点是无法明确估计超额离散参数(ϕ\phiϕ)的具体来源,也无法提供负二项回归那样的数据生成机制。

应用:Quasi-Poisson回归适合简单的过度离散校正,不需要引入额外分布假设的情况。

暂无评论

发送评论 编辑评论


				
|´・ω・)ノ
ヾ(≧∇≦*)ゝ
(☆ω☆)
(╯‵□′)╯︵┴─┴
 ̄﹃ ̄
(/ω\)
∠( ᐛ 」∠)_
(๑•̀ㅁ•́ฅ)
→_→
୧(๑•̀⌄•́๑)૭
٩(ˊᗜˋ*)و
(ノ°ο°)ノ
(´இ皿இ`)
⌇●﹏●⌇
(ฅ´ω`ฅ)
(╯°A°)╯︵○○○
φ( ̄∇ ̄o)
ヾ(´・ ・`。)ノ"
( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃
(ó﹏ò。)
Σ(っ °Д °;)っ
( ,,´・ω・)ノ"(´っω・`。)
╮(╯▽╰)╭
o(*////▽////*)q
>﹏<
( ๑´•ω•) "(ㆆᴗㆆ)
😂
😀
😅
😊
🙂
🙃
😌
😍
😘
😜
😝
😏
😒
🙄
😳
😡
😔
😫
😱
😭
💩
👻
🙌
🖕
👍
👫
👬
👭
🌚
🌝
🙈
💊
😶
🙏
🍦
🍉
😣
Source: github.com/k4yt3x/flowerhd
颜文字
Emoji
小恐龙
花!
上一篇
下一篇