技术领域
[0001] 本发明属于癌症治疗和预后预测技术领域,更具体地说,涉及一种基于微波消融术后患者预后生存的预后方法。
相关背景技术
[0002] 癌症是世界范围内的主要公共卫生问题。肺癌的传统治疗主要包括手术治疗,药物治疗,放化疗。据估计,25%的非小细胞肺癌(NSCLC)患者由于医学合并症而不适合根治性切除,需要替代局部治疗的患者,例如立体定向体部放射治疗(SBRT)、射频消融术(RFA)或微波消融术(MWA)。MWA在肺中具有较高的对流和较低的热沉积效应,可以最大限度地保存正常的肺组织,对于I期非小细胞肺癌,微波消融也是有效的治疗手段。短期内消融术后患者恢复具有显著优势,但是对于微波消融患者的生存,其长期收益的效果却不明确,因此,对于进行微波消融的肺癌患者来说,对于其术后生存分析非常重要。
[0003] 近年来,机器学习(ML)越来越广泛地应用于各个领域,包括建筑、金融和医学等领域,用于预测和从数据中提取信息。在建筑领域,机器学习的创新应用包括能源管理与优化,通过预测能源需求和调整供暖、通风、空调系统实现建筑能效的提升。智能建筑系统设计方面,机器学习在调整建筑系统参数、提高舒适性和可持续性方面发挥关键作用。此外,机器学习也应用于建筑结构健康监测,通过实时分析传感器数据,实现对结构状态的监测和维护的精准管理。在金融领域,机器学习广泛应用于风险评估,通过分析大数据识别潜在风险因素,提高风险管理水平。欺诈检测方面,机器学习技术通过分析交易模式和用户行为,帮助金融机构及时发现并防范欺诈行为。股票市场预测方面,机器学习通过历史数据和实时信息分析,为投资者提供更精准的市场预测和交易策略优化。这些创新应用在建筑和金融领域推动了效率提升和决策准确性的提高。
[0004] 在医学领域,数字化和大数据使得医院能够以电子健康记录的形式收集有关患者的信息。这一数字化浪潮的推动下,人工智能的迅猛进步,尤其是在机器学习和数据挖掘方面的工具,使得医生能够更加迅速地进行决策。通过分析庞大的健康数据,包括生命体征、疾病历史和基因组数据,机器学习能够预测患者未来的健康风险,为医生提供及时的预防建议。实现了更智能化和个性化的医疗实践。
[0005] 因此,亟需一种新的基于微波消融术后患者预后生存的预后方法。
具体实施方式
[0026] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。
[0027] 除非另作定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。
[0028] 实施例1:
[0029] 数据预处理方面,对结构化数据进行了缺失值处理、标准化等预处理步骤,对非结构化数据进行采取NER技术提取重要因子,以更好地融入模型中。数据集划分为训练集和测试集,确保了模型的有效性和泛化性。特征工程方面,针对每个阶段的数据挖掘出与患者预后相关的关键因子。
[0030] 本发明利用构建的时序图模型分别进行建模,即分别使用I、II、III来预测IV,以及结合I+II、I+III、II+III、I+II+III来预测IV。通过创建七个不同的机器学习模型进行十折交叉验证,采用多模型比较的方法,并通过十倍交叉验证和ROC曲线对各模型进行全面评估,为肺癌微波消融全流程的生存预测提供更深入的认知。与单一阶段模型相比,多模型联合预测相对于本发明单一模型预测,能够提供更为优越的综合性能,可能反映了不同阶段信息的协同作用,为提升生存结局预测提供了更为丰富的信息。
[0031] 根据这些因素,本发明将机器学习应用于这七个不同模型进行训练。在训练完成后,优化模型参数以提高性能。这一流程确保了本发明在构建模型时能够充分考虑训练过程中获得的经验和优化结果。
[0032] 表1:预后模型建立
[0033]
[0034] 患者标准:
[0035] 这项单中心回顾性研究包括所有在南通大学附属医院接受微波消融治疗(MWA)的非小细胞肺癌(NSCLC)患者。该研究已获得该机构伦理审查委员会的批准,并遵循《赫尔辛基宣言》进行了方案制定。由于本实施例是回顾性的,因此放弃了获取知情同意书的要求。该研究的纳入标准包括:(a)确诊或疑似NSCLC患者接受MWA治疗;(b)先前或者当前的组织病理学检查确认NSCLC的诊断;(c)不能耐受或拒绝手术的早期患者接受MWA,并充分同意接受MWA而不是其他治疗。排除标准包括:(a)接受RFA治疗的患者;(b)患者没有回诊且失联;
(c)在MWA程序中进行的其他伴随疗法,例如放射性种子植入;(d)数据不完整。本实施例筛选了2013年5月至2023年5月期间在南通大学附属医院接受MWA治疗的确诊或疑似NSCLC患者,并以4:1的比例随机分配到训练队列或验证队列。本实施例共纳入341名患者,排除13个采用RFA进行治疗的患者,30个失访的患者以及17个数据缺失的患者,最后共在模型中纳入
181个患者。将这181个患者根据4:1进行随机筛选,在训练组纳入145个患者,在验证组纳入
36个患者。然后将训练组患者根据时序图选择标准构建七个不同模型(表1),每个模型都进行四种机器学习十折验证(LR,Logistic regression;RF,Random Forest;XGB,Extreme gradient boosting;SVM,Support vector machines.),得到准确度最高的模型后,采用验证集验证模型(图1)。
[0036] NSCLC肿瘤分期是根据国际癌症控制联盟(第8版)的临床TNM分期系统确定的10。所有非小细胞肺癌患者在MWA手术前均接受胸部CT检查,以评估肿瘤的位置、数量和大小。
所有实验室检查均在MWA前4天进行。
[0037] 评估:
[0038] 主要结局指标是患者生存状态以及患者生存时间,定义为从MWA开始到死亡或最后一次随访的间隔。对于随访中死亡的患者,OS计算为从MWA手术到死亡的间隔。对于存活或者失访患者,OS计算为从MWA手术到最后一次随访的间隔。在未死亡或进展的患者中,审查日期被定义为最后的临床评估日期。患者生存状态定义为在2023年5月的定期随访中,此时的患者的生存状态。
[0039] 入组患者的特征列在表1,共纳入181名患者(女性64例,男性177例;平均年龄:54.5岁±34.5岁)。平均随访时间为30.5个月。在基线特征观察到显著差异的因子有年龄、肿瘤分期、患者治疗次数、血清磷、房颤以及患者平均血红蛋白。
[0040] 表2:患者因子选择
[0041] Table 2:Patient demographics and baseline characteristics[0042]
[0043] 预后模型的预测因子:
[0044] 考虑到患有房颤的病人仅有四个(2.2%),因此本发明将房颤排除在外。最后本发明一共在模型中纳入了5个预测因子,并按照他们所在的不同阶段进行分类。阶段I包含的预测因子:年龄和肿瘤分期。阶段II包含的预测因子:平均血红蛋白和血清磷。阶段III包含的预测因子:患者术中穿刺手术次数。所有相关因素以及时间节点在表3中进行了描述。
[0045] 表3:预后模型预测因子表格
[0046]
[0047] 患者特征重要性的排序
[0048] 此外,本发明通过XGB算法构建了特征重要性排序。本发明根据图5选择具有有价值的预测因子。特征的重要性分数反映了其在模型中的重要性和贡献程度。对于排名较高的特征,本发明可以进一步进行深入研究和分析,以获取更多关于它们与目标变量之间关系的信息。此外,排名较低的特征可以被认为对模型结果的影响较小,可以考虑在模型训练或特征选择过程中予以剔除。
[0049] 列线图的开发
[0050] Nomogram(诺模图)是一种图形化工具,用于通过将数学方程转化为简单的图形表示,直观地展示多个因素对目标变量的影响和预测。Nomogram的特点包括可视化因素的影响、因素之间的交互分析,以及方便进行预测和解释。
[0051] 基于上述的四个预测因子,本发明建立了列线图,以预测微波消融术后的总生存期(OS)。根据图6,每位患者可以根据这四个预测因子获得相应的总分,从而实现对结果的准确预测。这种方法提供了一种直观且易于理解的方式,帮助医疗专业人员更好地评估患者的预后情况。
[0052] 在本实施例中,实施步骤包括以下几个方面:
[0053] 1.数据收集和准备:收集患者的临床资料和医学影像数据,包括肿瘤分期、年龄、血液生化指标等,并进行数据清洗和预处理。
[0054] 2.特征选择和提取:根据文献报道和临床经验,选择与患者预后生存相关的特征,并利用统计方法或机器学习算法提取这些特征。
[0055] 3.模型训练和优化:利用训练集数据对预后生存模型进行训练,并通过交叉验证等方法对模型进行优化,以提高预测性能和泛化能力。
[0056] 4.模型评估和验证:使用独立的验证集数据对模型进行评估和验证,评估模型的预测准确性、敏感性和特异性等指标。
[0057] 5.结果解释和应用:根据模型预测结果,为临床医生提供个性化的治疗建议,帮助他们制定更有效的治疗方案,提高患者的生存率和治疗效果。
[0058] 针对不同的临床情况和患者特点,可以调整模型的参数和特征组合,以实现更精准的预测和个性化的治疗策略。在附图中,可以展示模型的整体架构和关键步骤,辅以具体的实施例和相关数据,以支持本发明的技术方案和优势效果。
[0059] 实施例2:
[0060] 本实施例的计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现实施例1的基于微波消融术后患者预后生存的预后方法中的步骤。
[0061] 本实施例的计算机可读存储介质可以是终端的内部存储单元,例如终端的硬盘或内存;本实施例的计算机可读存储介质也可以是所述终端的外部存储设备,例如终端上配备的插接式硬盘,智能存储卡,安全数字卡,闪存卡等;进一步地,计算机可读存储介质还可以既包括终端的内部存储单元也包括外部存储设备。
[0062] 本实施例的计算机可读存储介质用于存储计算机程序以及终端所需的其他程序和数据,计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0063] 实施例3:
[0064] 本实施例的计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1的基于微波消融术后患者预后生存的预后方法中的步骤。
[0065] 本实施例中,处理器可以是中央处理单元,还可以是其他通用处理器、数字信号处理器、专用集成电路、现成可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等;存储器可以包括只读存储器和随机存取存储器,并向处理器提供指令和数据,存储器的一部分还可以包括非易失性随机存取存储器,例如,存储器还可以存储设备类型的信息。
[0066] 本领域内的技术人员应明白,实施例公开的内容可提供为方法、系统、或计算机程序产品。因此,本方案可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本方案可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0067] 本方案是参照根据本方案实施例的方法、和计算机程序产品的流程图和/或方框图来描述的,应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合;可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0068] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0069] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0070] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read‑OnlyMemory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
[0071] 本发明所述实例仅仅是对本发明的优选实施方式进行描述,并非对本发明构思和范围进行限定,在不脱离本发明设计思想的前提下,本领域工程技术人员对本发明的技术方案作出的各种变形和改进,均应落入本发明的保护范围。