待更新…..
连续型因变量
general linear regression
二分类因变量
logistic regression
Logistic回归:适用于任何二分类结局的建模,特别是稀有事件;也是最常见的二分类模型。
目的是估计结局的优势比 (Odds Ratio, OR)。
输出的回归系数是OR的对数,可以解释为结局事件的“发生优势”。当结局发生率较低时,OR接近RR,但当发生率较高时,OR会偏离RR,因此不适合高发生率事件的RR估计。
log-binomial
当结局发生率较高、logistic回归难以解释RR时。log-binomial可以对RR进行估计,从而在二分类结局中实现更直观的风险解释。
目的:Log-binomial回归直接建模二分类结局的相对风险 (RR)。
原理:在log-binomial回归中,结局的发生概率通过log-link函数建模,估计出的参数可以直接解释为相对风险。
优缺点:Log-binomial回归的优势在于它能直接估计RR,因此结果解读直观。但该模型容易出现不收敛问题,特别是在某些样本或数据分布下。
适用情况:在样本量适中、数据分布良好的二分类结局中,log-binomial回归是直接估计RR的理想方法。
Modified Poisson regression
目的:当logistic回归不适用时,通过引入稳健标准误的Poisson回归可以实现对RR的稳健估计。
原理:Poisson回归通常用于计数数据,但可以应用在二分类数据中,通过引入稳健标准误来控制过度离散。其回归参数可以解释为RR的近似值。
优缺点:Poisson回归相对容易收敛,且引入稳健标准误后可以得到相对可靠的RR估计。缺点是Poisson回归并不直接针对二分类数据,因此其效果可能在某些数据分布下不如log-binomial回归。
适用情况:在log-binomial回归不收敛时,修正的Poisson回归是很好的替代方法,因为它相对容易实现且稳健。
罕见离散型变量
PoIsson regression
适合事件计数数据的建模,特别是当数据是泊松分布时。它也可以通过对数链接来估计率比 (Rate Ratio) 或其他相对变化。
negative binomial regression
目的:处理方差大于均值的过度离散计数数据。
原理:负二项回归在Poisson回归的基础上引入了一个额外的分布参数,以允许方差大于均值。它假设数据服从一个负二项分布,通过在Poisson模型中加入一个Gamma分布的随机误差项,来解释额外的变异。
优缺点:
- 负二项回归能够很好地处理具有过度离散的计数数据,并且模型估计较为稳定。
- 缺点是负二项回归引入了一个额外参数(α\alphaα),增加了模型复杂性。
应用:负二项回归适用于需要明确建模数据生成过程,并且需要更稳定的参数估计的场景。
Quassi-poisson regression
目的:类似Poisson回归,但通过调整标准误来处理过度离散,而不改变Poisson模型的均值结构。
优缺点:
- Quasi-Poisson回归简单而有效,特别是在只需要修正标准误的情况下。它在模型复杂性上较为简单,不引入额外的分布假设。
- 缺点是无法明确估计超额离散参数(ϕ\phiϕ)的具体来源,也无法提供负二项回归那样的数据生成机制。
应用:Quasi-Poisson回归适合简单的过度离散校正,不需要引入额外分布假设的情况。