本次介绍生存分析中的Cox回归,本篇将专注于实操而非理论,对于生存分析理论有兴趣的读者请自行查阅相关资料。
使用survival包中的lung数据集进行演示,这份数据集包含了肺癌患者的生存信息,其中"time"为生存时间(单位为天),"status"为生存状态,1表示删失,2表示死亡。Cox回归用于探索危险因素,首先需将分类变量转化为因子类型以进行哑变量设置。
为了展示Cox回归的应用,我们选取了"sex"、"age"和"ph.karno"三个变量进行多因素分析。通过结果解读,可以发现与logistic回归类似,每个变量的效应大小由回归系数表示,且Cox回归的C-index值为0.645,表示模型的预测能力。同时,通过似然比检验、Wald检验和Score(logrank)检验,可以评估各变量的显著性。
构建Cox回归模型后,可利用broom包简化结果提取,无需手动处理。使用特定函数即可获取模型详细信息,过程与logistic回归相似。在进行Cox回归时,需满足等比例风险假设,这是Cox模型的基础条件。若违反等比例风险假设,可通过K-M曲线、Schoenfeld残差等方法进行检验。
通过Schoenfeld残差检验,发现"ph.karno"变量不符合等比例风险假设。其他变量如"sex"和"age"的回归系数随时间变化趋势稳定,接近0水平线,与检验结果一致。ggcoxdiagnostics()函数支持多种残差类型,如martingale、deviance、score、dfbetas和scaledsch等,通过调整参数即可获取不同类型的残差信息。
Cox回归计算出的回归系数及其95%可信区间可用于森林图展示,直观呈现各变量的效应大小和不确定性。对于希望定制森林图样式的读者,可参考先前发布的文章,如“画一个好看的森林图”、“用更简单的方式画森林图”和“R语言画森林图系列3!”、“R语言画森林图系列4!”等。
本次内容主要覆盖Cox回归的核心内容,读者在使用过程中如有疑问,可通过加入相关群组或在评论区留言获取帮助。下次将详细介绍时依协变量Cox回归和时依系数Cox回归。
本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。