技术领域
[0001] 本发明属于医学领域,涉及一种基于PDK1构建的肾透明细胞癌诊断和预后预测系统。
相关背景技术
[0002] 预测模型在医学领域有着至关重要的作用。它能够准确预测疾病发生风险,为早期干预提供有力支持;通过评估治疗效果及预后,为临床决策提供科学依据。同时,还能优化医疗资源分配,提升医疗质量,推动精准医疗发展,进而为患者带来更优质的治疗效果和生活质量。
[0003] 肾透明细胞癌(KIRC)作为肾癌中最具侵袭性且最常见的亚型,其起病隐匿,早期缺乏特异性临床表现。数据显示,约13%‑30%的患者在初诊时已出现转移,而转移性KIRC预后极差,5年生存率仅为8%。当前,KIRC的临床诊断主要依赖影像学检查及病理活检,而其预后预测则多依赖临床病理分期。然而,这些方法存在诸多局限性。例如,超声检查受操作者水平和患者因素影响较大,小病灶难以检出;CT检查存在辐射风险且造影剂可能引发不良反应,同时小病灶定性困难;MRI检查时间长、费用高,且对钙化不敏感。目前,KIRC的临床预后预测缺乏统一精准的指标体系,现有的指标如病理分期等准确性有限,且由于个体差异大,难以准确预测特定患者的发展,对治疗反应的预测也不够精确,进而影响治疗方案的优化选择。综上所述,在临床工作中,目前急需一种更为精准且使用便捷的方法来辅助KIRC的诊断以及预后预测。鉴于此,挖掘更多KIRC早期诊断和预后预测的分子标志物具有重大临床意义。
[0004] 前期,我们对30例KIRC临床样本进行蛋白质组学数据分析,并结合生物信息学方法,发现丙酮酸脱氢酶激酶1(PDK1)在KIRC中呈现显著差异表达。已有研究表明,糖代谢异常与KIRC恶性进展密切相关(AMEMIYAT,SHIBATAK,YAMAGUCHI T,et al.Metabolic Oscillations and Glycolytic Phenotypes ofCancer Cells[J].IJMS,2023,24,11914)。PDK1作为糖酵解过程的关键限速酶,很可能在KIRC的病理进程中发挥重要作用。深入探究PDK1在KIRC中的诊断和预后价值,并构建基于PDK1的诊断和预后预测模型,不仅能为肾癌早期诊断提供新方向,还有望改善患者生存质量,对于大力推动癌症精准医疗的发展具有重要的临床意义。
[0005] 目前临床上尚缺乏灵敏、特异的KIRC诊断和预后预测的生物标记物,亟需一种KIRC诊断和预后预测模型,从而实现KIRC发病高危人群的高效、快速识别,为个体化筛查及治疗制定精准方案,解决当前本领域普通技术人员面临的技术难题。
具体实施方式
[0070] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
[0071] 因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0072] 需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0073] 下面结合实施例对本发明的特征和性能作进一步的详细描述。
[0074] 实施例一
[0075] 本发明较佳实施例提供的一种基于PDK1构建的肾透明细胞癌诊断和预后预测系统,在本实施例中,120例KIRC组织样本收集于新疆医科大学附属肿瘤医院,本研究方案已获得新疆医科大学附属肿瘤医院伦理委员会批准,术前患者及其家属均已签署知情同意书。PDK1抗体购自美国芝加哥Proteintech公司。
[0076] 基于前述样本中PDK1在KIRC中的基因和蛋白表达进行KIRC诊断和预后价值分析以及基于PDK1表达构建的诊断和预后预测模型,步骤如下:
[0077] 步骤1:从TCGA数据库(https://TCGAdata.nci.nih.gov/)中下载613例肾透明细胞癌组织和72例正常组织的PDK1 mRNA表达谱和相应的临床数据,其中537例患者具有完整的临床数据。采用R软件(4.2.1)的“limma”包将数据集中FPKM格式的RNA测序数据统一转换为TPM格式。并剔除信息不完整的病例,最终纳入537例患者的TPM数据进行后续分析。
[0078] 步骤2:进行TCGA‑KIRC中PDK1 mRNA表达差异(N=72;T=530)箱线图分析,PDK1mRNA在正常组织中的表达结果对数值约为2,而在KIRC组织中的表达结果对数值约为4,如图1A所示;可见在绝大多数KIRC患者中PDK1 mRNA在癌组织中的表达水平显著高于癌旁正常组织。
[0079] 步骤3:结合上述分析,PDK1在癌和癌旁组织中显著差异表达,具有潜在的诊断价值,故基于PDK1构建二分类逻辑回归模型,其中疾病状态:1表示患病,0表示正常;参数估计:通过最大似然估计等方法来估计模型中的参数。
[0080] 步骤4:由上述步骤获得诊断模型公式如下:
[0081]
[0082] 式中:p表示预测概率,x为PDK1的表达量。
[0083] 步骤5:利用TCGA‑KIRC数据集做内部验证,本实施例中的ROC曲线选择特异性和灵敏度之和最高的点1.125为PDK1表达高低(H‑score)的临界值,将上述样本中PDK1表达分为高表达和低表达两个等级,在特异性‑1等于0.2时,PDK1的敏感性水平已经超过0.91以上(图2)。
[0084] 步骤6:下载GSE36895和GSE53757数据集用作诊断模型的外部验证集,本模型的外部验证ROC曲线的AUC分别为0.984和0.993(图3‑4),证明模型的区分能力强、泛化能力较好以及具有较高的可靠性和实用性。
[0085] 步骤7:为进一步验证PDK1的蛋白表达情况,收集2011年1月至2015年12月在新疆医科大学附属肿瘤医院泌尿外科手术治疗的肾透明细胞癌患者组织及相应癌旁组织各120例;术前均未接受抗肿瘤治疗或合并其它肿瘤,术后病理报告均为肾透明细胞癌。样本纳入标准:
[0086] (1)明确诊断为肾透明细胞癌的患者;
[0087] (2)所有患者术前未进行化、放疗及靶向治疗;
[0088] (3)术后病理证实为肾透明细胞癌;
[0089] (4)既往无其他或合并其他恶性肿瘤病史;
[0090] (5)具有完整的临床信息
[0091] 120例KIRC组织样本特征如下表1:
[0092] 表1120例肾透明细胞癌患者基本资料表
[0093]
[0094] 将120例KIRC组织制成石蜡切片,通过IHC实验检测PDK1的蛋白表达情况,并利用ImageJ软件对结果进行判读。结果表明,PDKI在癌和癌旁组织中显著差异表达,与数据库分析结果一致,如图5‑图6。
[0095] 图1B为TCGA‑KIRC中PDK1与OS的Kaplan‑Meier(K‑M)生存分析;预后结果显示,KIRC患者中PDK1高表达组(H‑score≥1.125)的总生存期(OS,HR=0.53;P<0.001)显著长于PDK1低表达组(H‑score<1.125)。
[0096] 结合上述预后分析结果,PDK1高表达通常预示KIRC患者预后良好,提示其具有一定的预后价值,基于此,将PDK1联合临床特征构建KIRC预后预测模型,步骤如下:
[0097] 步骤S1:数据预处理:对TCGA‑KIRC队列数据采用小波分析法进行降噪,针对队列中的数据缺失位置进行补全,在此基础上自添加基因类型,并进行位置编码;
[0098] 步骤S2:将PDK1 mRNA数据集按照4:1比例随机划分为训练集和测试集,其中,PDK1mRNA数据集中80%的样本作为训练集,而将剩余的20%作为验证集;
[0099] 步骤S3:首先基于训练集构建多因素回归模型,依据模型中各个变量对结局事件影响程度的高低(即回归系数的大小),为每个影响因素的每个取值水平进行赋分。接着将各个评分相加得到总评分,再通过总评分与结局事件发生概率之间的函数转换关系计算出该个体结局事件的预测概率。最终以列线图的方式展示预测模型;
[0100] 步骤S4:基于测试集,建立目标函数对目标模型进行测试,开展超参数寻优操作,并计算预测精度。
[0101] 步骤S5:当预测精度满足置信区间时,输出预后预测结果,同时以ROC曲线形式对预后输出结果进行验证。最后如图7所示,经COX回归分析筛选出包括患者年龄、临床分期和PDK1表达在内的影响预后的三个独立变量,构建列线图以单独预测KIRC患者的总生存期。R包(survivalROC)用于评估验证集中列线图预后预测的准确性。如图8所示,1、3、5年的AUC面积为0.859、0.791、0.749,显示出模型良好的预后预测准确性。
[0102] 步骤S6:通过步骤3获取120例KIRC样本中PDK1的蛋白表达数据,进而收集这些样本的生存信息,并剔除随访信息缺失的样本,以验证PDK1与KIRC患者预后之间的关系。结果如图9所示,PDK1高表达与预后良好具有相关性,P值为0.00047,这与TCGA数据库的分析结果一致。
[0103] 上述研究表明我们成功构建了基于PDK1的诊断和预后预测模型,该模型显示出较好的预测效能。
[0104] 综上所述,本发明通过对KIRC临床病例的蛋白组学、转录组数据与临床数据的综合分析,筛选出PDK1作为研究靶点,分析PDK1在KIRC诊断和预后预测中的价值。基于PDK1构建的预测模型表现出了良好的预测效能。本发明通过PDK1的表达水平开发的KIRC诊断和预后预测模型能够实现KIRC发病高危人群的高效、快速识别,并为个体化筛查及治疗制定精准方案。
[0105] 值得一提的是,本实施例中样本来源于经新疆医科大学附属肿瘤医院病理明确诊断为KIRC的该院住院患者,术后组织标本由新疆特高发肿瘤生物样本库统一保存,该样本库始建于2010年,于2016年获批科技部人类遗传资源管理行政许可-人类遗传资源保藏审批(国科遗办审字〔2016〕620号),2022年再度获人类遗传资源管理行政许可-人类遗传资源保藏审批(国科遗办审字〔2022〕BC0077号),2023年通过样本库质量达标检查,成为全疆唯一一家通过国家质量达标检查的样本库获得人类遗传资源管理行政许可-人类遗传资源保藏审批(国科遗办审字〔2022〕BC0077号)。蛋白质组学检测由业内知名企业‑杭州景杰生物科技股份有限公司负责实施。因此,检测结果的科学性和可信度强。
[0106] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,任何熟悉本领域的技术人员在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。