Cox构建预测模型(3):如何用R语言做cox先单后多回归分析!(附全套代码)... 您所在的位置:网站首页 cox回归分析模型HR Cox构建预测模型(3):如何用R语言做cox先单后多回归分析!(附全套代码)...

Cox构建预测模型(3):如何用R语言做cox先单后多回归分析!(附全套代码)...

2024-06-18 03:01| 来源: 网络整理| 查看: 265

上一篇为大家介绍了预测模型中基线表格的绘制方式,那么在预测模型构建过程中,通过Cox回归来筛选预测因子也是十分关键的。在影响因素研究中,大家较为熟知的筛选方式是先单后多,但是在预测模型文章中,更为常用的筛选方法是逐步回归法。

逐步回归,是通过逐步将自变量输入模型,如果模型具统计学意义,并将其纳入在回归模型中。同时移出不具有统计学意义的变量。最终得到一个自动拟合的回归模型。说到这里大家可能会有点理解了,逐步回归法的目的是构建一个拟合佳的模型,该变量在回归过程中是否具有统计学意义无关,这与先单后多有着本质的区别。

本文将继续以本文将以复现一篇seer公共数据库文章(Q1 IF=5.2)为例,为大家介绍用R语言进行Cox回归筛选变量的方法,同时,介绍一种更加便捷快速完成统计分析的“神器”——风暴统计。

主要内容包括:

一、文献解读

二、利用R语言复现

三、利用在线网站复现

  四、小结 

一、文献解读

案例文献是沈阳医学院公共卫生学院学者基于SEER数据库的一项回顾性研究,旨在建立一个列线图来预测老年恶性骨肿瘤(MBT)患者的总生存期(OS)。

b5e5d0b0b8423847ba88b8de5e811798.png

1. 摘要

背景:恶性骨肿瘤(MBT)是老年患者死亡的原因之一。我们研究的目的是建立一个列线图来预测老年MBT患者的总生存期(OS)。

方法:从SEER数据库下载了2004年至2018年所有老年MBT患者的临床病理数据。他们被随机分配到训练集(70%)和验证集(30%)。采用单因素和多因素Cox回归分析确定老年MBT患者的独立危险因素。基于这些危险因素构建列线图,以预测老年MBT患者的1年,3年和5年OS。然后,利用一致性指数(C指数)、校准曲线和受试者工作曲线下面积(AUC)来评价预测模型的准确性和判别力。决策曲线分析(DCA)用于评估列线图的临床潜在应用价值。根据列线图上的分数,将患者分为高风险组和低风险组。Kaplan-Meier(K-M)曲线用于测试两名患者之间的生存差异。

结果:从SEER数据库下载了2004年至2018年所有老年MBT患者的临床病理数据。他们被随机分配到训练集(70%)和验证集(30%)。采用单因素和多因素Cox回归分析确定老年MBT患者的独立危险因素。基于这些危险因素构建列线图,以预测老年MBT患者的1年,3年和5年OS。然后,利用一致性指数(C指数)、校准曲线和受试者工作曲线下面积(AUC)来评价预测模型的准确性和判别力。决策曲线分析(DCA)用于评估列线图的临床潜在应用价值。根据列线图上的分数,将患者分为高风险组和低风险组。Kaplan-Meier(K-M)曲线用于测试两名患者之间的生存差异。

结论:我们建立了一个新的列线图来预测老年MBT患者的1年,3年,5年的OS。该预测模型可以帮助医生和患者制定治疗计划和后续策略。、

2. 数据介绍

文献共纳入1641名2004-2018诊断的老年MBT患者的临床病理数据。暴露因素包括年龄、种族、性别、诊断年份、组织学类型、分级、分期、原发位置、TNM分期、肿瘤大小、是否化疗、是否放疗及手术方式。

7c6b5348f465bd5fb6e8ad4e135b7453.png

3.研究结果

筛选预测因子只用到训练集数据,通过单因素Cox回归与多因素Cox回归筛选预测变量。这里作者并未使用先单后多或者是逐步回归法筛选预测变量,可能从临床实际考虑的更多。但在实操过程中推荐大家优先考虑逐步回归法进行筛选,这样更有利于构建一个拟合效果好的预测模型。

94eea606bf356f34dcf7c44d523cfd6a.png

21747ccdd5cefdf5d25f9f227eed8153.png

01f4ecfe971c3ca2b8d1e70254090be1.png

二、利用R语言复现

下面我们利用从SEERStat中提取的相关数据进行复现。根据文献中的纳入排除标准,提取涉及的相关数据,最终共纳入1,574名患者(原文献1,641)。介于SEERStat数据库会有更新,因此提取的样本量与原文会有所出入,这里请大家多关注统计方法的运用!本次用到的是R版本是4.3.1。

开始回归分析前需要做好前期工作:①导入数据集;②按照7:3的比例将数据集拆分为训练集train和验证集test;③完成均衡性分析。接着再开展今天的回归分析。(详见下方链接)

如何利用R语言拆分数据集并做均衡性检验

1. 安装加载R包并导入数据

这里绘制均衡性表格,主要用到"autoReg"R包,请注意模型变量的筛选是根据训练集进行的,在进行数据拆分后,需要用训练集来进行Cox回归。

install.packages("autoReg") library("autoReg")

2. Cox回归分析

autoReg包是一款功能强大的R包,可以一步到位实现批量单因素,多因素以及逐步回归法。可以通过调整“threshold= ”来改变限制P值的限制。

#cox回归模型构建 coxmod


【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有