首页 / 一种乳腺癌风险评估模型的构建方法及系统

一种乳腺癌风险评估模型的构建方法及系统实质审查 发明

技术领域

[0001] 本发明属于但不限于生物医学领域,尤其涉及一种基于MircoRNA与传统血清标志物联合的乳腺癌风险评估模型的构建方法及系统。

相关背景技术

[0002] 乳腺癌是一种复杂的具有高度异质性的恶性肿瘤。《2022年全国癌症报告》显示,乳腺癌位居女性癌症发病率第一。其中,中国乳腺癌新发病例数约35.7万,居全球第4位。目前女性乳腺癌的发病率和死亡率分别位于我国女性恶性肿瘤的第一位和第四位。随着我国生活方式和社会环境等因素的改变,乳腺癌的发病率呈现逐年增长的趋势,严重威胁女性的身心健康。早期诊断和实时监控是有效预防以及治疗乳腺癌的重要策略,诊断标志物的准确性和灵敏性反应了乳腺癌的病情以及预后效果。因此,寻找和发现高效的诊断方法在乳腺癌早期诊断、靶向治疗以及预后中具有重要意义。
[0003] 临床上对于乳腺癌的诊断方法主要有:临床体格检查、乳腺超声检查、乳房钼靶X射线摄影、核磁共振成像、病理组织学检查等。每种方法均有其优势,灵活使用能够较准确地诊断乳腺癌病情,但也存在一些不足。例如超声检查对于太小的肿块难以识别,且结果易受受检者状态和仪器的影响,容易出现误诊。乳房X射对腺体丰富的乳腺透视效果不佳,且存在一定的辐射副作用。病理组织学检查由于取材较少,难以观察组织结构,且对患者创伤性较大,难以用于临床普查等。传统血清肿瘤标志物检查能快捷地诊断乳腺癌,但其灵敏度和特异性较差,例如CA125不仅在乳腺癌,在子宫肌瘤、卵巢癌等多种癌症血清中均过表达,且其表达水平受其它病变影响,例如慢性盆腔炎、卵巢囊肿、子宫内膜异位症等均导致CA125的升高。因此,多个肿瘤标志物的结合或多种方法的联合使用可弥补因不确定因素或技术问题导致的漏检和误检,并能提高诊断的准确度和灵敏性。
[0004] 微小RNA(miRNA)是一类约为22个核苷酸组成的非编码小RNA,其在细胞内发挥多种重要的调节作用。miRNA可通过外泌体运输进出不同细胞,通过识别同源序列,影响转录、翻译或表观遗传过程而调控基因表达。越来越多的研究证实miRNA在乳腺癌患者中异常表达,参与乳腺癌的发生发展过程。Ibrahim等报道,miR‑132和miR‑212在耐药乳腺癌肿瘤和细胞中普遍过表达,而进一步研究发现,miRNA‑132/‑212可抑制PTEN的表达,激活NF‑κB通路从而上调耐药蛋白BCRP表达水平,下调miR‑132/‑212可提高乳腺癌细胞对多柔比星的敏感性。miR‑21和miR‑210在乳腺癌组织中高表达,并且与淋巴结转移、临床分期四种血清microRNA在乳腺癌中的诊断价值和分化显著相关,miR‑210被认为与乳腺癌患者预后不良有关,是乳腺癌的潜在预后指标。miRNA的优势是易于使用微阵列、深度测序或实时荧光定量PCR(qRT‑PCR)进行检测,并具有高度的组织特异性、稳定性。因此,miRNA可作为为癌症诊治和预后评估的理想靶标。
[0005] 利用疾病特异性表达的多个miRNA构建疾病诊断模型,能够提高疾病诊断的准确性以及判断预后的有效性。许琳等基于miR‑21及miR‑31构建的列线图模型对子痫前期诊断具有较高预测价值,ROC分析显示,其预测效能、敏感度以及特异性均高于外周血可溶性血管内皮生长因子受体/胎盘生长因子。LUO等发现miR‑140‑3p和miR‑3200‑3p在肝细胞癌(HCC)中显著下调,并因此构建了基于这些特异表达miRNA的HCC诊断模型,通过受试者ROC分析发现该模型曲下面积(AUC)0.951,灵敏度90.1%,特异性87.8%,具有较高诊断价值。研究者结合机器和神经网络分析,构建了一种包含miR‑4648、miR‑125b‑1‑3p和miR‑3201的人工神经网络模型用于胰腺癌的早期诊断,具有较高的诊断准确率,且验证组和训练组的AUC值分别为0.935和0.926。miRNA作为生物标志物用于疾病的临床诊断具有显著的准确性和优势,由miRNA构建合适的诊断模型对于疾病的发病机制、药物筛选、个性化治疗等具有潜在价值。

具体实施方式

[0093] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0094] 以下是基于所述方法的两个具体实施例,详细描述了不同实验步骤中的具体操作过程与结果:
[0095] 实施例1:基于miRNA的乳腺癌早期诊断模型的构建
[0096] 1)血清外泌体分离和miRNA筛选:
[0097] 收集健康对照组和未接受治疗的乳腺癌患者血清样本,每组各30例,分别通过超速离心法分离血清中的外泌体。
[0098] 利用IlluminaHiSeqSE50平台对外泌体中的miRNA进行高通量测序,结合文献查阅和数据分析,筛选出显著差异表达的miRNA,其中miR‑548ao‑5p和miR‑4804‑3p显示出显著的诊断潜力。
[0099] 2)血清样本预处理:
[0100] 每个样本取0.5mL血清,在4℃下以3000r/min离心5分钟,去除细胞碎片。
[0101] 上清液分装保存于‑80℃,实验中取200μL解冻处理,加入1mL裂解液,上下颠倒混匀后室温静置5分钟。
[0102] 3)miRNA提取和扩增:
[0103] 加入外参miRNeasy Serum/Plasma Spike‑In Control,每个样本中加入3.5μL含1.6×108copies/μL的外参。
[0104] 通过氯仿处理、无水乙醇沉淀等步骤提取miRNA,使用两步法PCR扩增,按程序95℃预变性30秒,95℃5秒,60℃30秒,进行40个循环。
[0105] 4)Logistics回归分析:
[0106] 将筛选出的miR‑548ao‑5p和miR‑4804‑3p数据引入Logistics回归分析,建立基于miRNA的诊断模型miRNAs panel I。通过对患者结局变量的分析,确定其在模型中的诊断效能。
[0107] 5)模型验证与ROC分析:
[0108] 将模型应用于新采集的20例乳腺癌患者和20例健康对照组样本,进行ROC曲线分析。模型显示灵敏度为85%,特异性为90%,AUC(曲线下面积)为0.92,显示了较高的诊断效能。
[0109] 实施例2:联合miRNA与传统标志物的乳腺癌诊断模型
[0110] 1)miRNA与血清肿瘤标志物结合分析:
[0111] 在实施例1基础上,将miR‑548ao‑5p和miR‑4804‑3p的筛选结果与传统血清肿瘤标志物CA125和CA153相结合。
[0112] 分别使用logistics回归建立两个独立模型:基于miRNA的panel I和基于传统肿瘤标志物的TM panel II。
[0113] 2)联合诊断模型的建立:
[0114] 将miRNAs panel I和TM panel II的结果通过logistics回归组合,构建联合诊断模型miRNAs+TM panel III。通过模型中的回归系数,确定每个标志物在联合诊断模型中的权重。
[0115] 3)验证集数据分析与模型效能比较:
[0116] 使用新采集的40例血清样本(20例乳腺癌患者,20例健康对照)进行模型验证。
[0117] 分别将三种模型用于乳腺癌风险评估,并进行ROC曲线分析。miRNAs panel I显示灵敏度为85%,特异性为90%;TM panel II显示灵敏度为70%,特异性为75%;而联合模型miRNAs+TM panel III的灵敏度提升至92%,特异性达到95%,AUC值为0.96。
[0118] 4)结果分析:
[0119] 实验结果表明,联合miRNA与传统肿瘤标志物的诊断模型显著提高了乳腺癌的诊断效能,尤其在早期患者中的检出率得到了显著提升。
[0120] 如图1所示,本发明实施例提供一种基于MircoRNA与传统血清标志物联合的乳腺癌风险评估模型的构建方法,该方法包括:
[0121] S1:高通量miRNA测序;
[0122] S2:血清miRNA提取;
[0123] S3:组织总RNA提取;
[0124] S4:miRNA逆转录;
[0125] S5:荧光定量PCR;
[0126] S6:风险评估模型建立。
[0127] 所述S1具体包括:
[0128] 将收集到的健康人和未接受治疗的乳腺癌患者血清,通过超速离心法分离血清外泌体,并进一步利用IlluminaHiSeqSE50平台进行高通量miRNA测序,结合文献查阅筛选出具有显著性差异表达的miRNA,并通过对乳腺癌患者的logistics回归以及ROC分析,最终确定miR‑548ao‑5p和miR‑4804‑3p为具有较高诊断效能的miRNA。
[0129] 所述S2具体包括:
[0130] (1)血样标本预处理:收集0.5mL的血清,4℃,3000r/min离心5min,去除细胞碎片,收集上清液,‑80℃的冷藏保存;
[0131] (2)取预处理过的血清标本200μL,冰上解冻后,加入样本5倍体积,即1mL的裂解液,上下颠倒或涡旋匀浆充分混匀,室温15~25℃,静置5min;
[0132] (3)加入外参:3.5μL的miRNeasySerum/PlasmaSpike‑InControl含1.6×108copies/μL。
[0133] (4)加入与血清样本量等体积的氯仿,剧烈震荡15s,室温放置5min,4℃,12000g离心15min。将上层水相转移至新的EP管,加入1.5倍体积的无水乙醇,缓慢混合均匀。然后将全部溶液转移至2mL RneasyMinElute离心柱中,室温,12000g离心1min,弃滤液;
[0134] (5)将700μL Buffer RWT加到离心柱中,室温,12000g离心1min,弃掉滤过液;
[0135] (6)将500μL Buffer RPE加到离心柱中,室温,12000g离心1min,弃掉滤过液;
[0136] (7)将500μL 80%的乙醇加到离心柱中,室温,12000g离心2min,弃滤过液,随后将吸附柱转移至另一新的收集管中;
[0137] (8)用最高转速离心5min,弃收集管;
[0138] (9)将离心柱套入新的1.5mL EP管中,加入14μL RNaseFree H2O,放置5min,以最高转速离心1min洗脱RNA,‑80℃保存。
[0139] 所述S3具体包括:
[0140] (1)细胞裂解液:每10mL的TRK裂解液加入200μL的β‑巯基乙醇;
[0141] (2)工作液Wash Buffer II配制:往母液Wash Buffer II中加入48mL的无水乙醇稀释,颠倒混匀;
[0142] (3)70%乙醇配制:使用分析纯(>99.7%)无水乙醇与DEPC水按照7:3的比例混合均匀;
[0143] (4)组织处理:将浸泡在RNA保护液中的组织置于冰上使用摇床加速解冻,用灭菌镊子将多余的RNA保护液挤掉,并用吸水纸轻轻吸掉表面的液体;称取20‑30mg组织块,剔除脂肪组织于5mL圆底EP管中,用灭菌剪刀将组织块剪碎,加入1.5mL的TRK裂解液,于冰上使用手持匀浆仪对组织块进行匀浆,匀浆需注意每次运行约5秒,一共运行4~5次;静置5min后,吸取上清液到1.5mL的EP管中,室温下2000r/min离心5min;
[0144] (5)转移液体于匀浆柱,室温14000g离心2min,去除不溶解的杂质,收集滤过液;
[0145] (6)加入等体积的70%乙醇,缓慢轻柔地充分混匀。将该混合液转移至RNA结合柱,并置于收集管中,室温,10000g离心1min,弃掉滤过液;
[0146] (7)重复步骤6,直至全部的混合液都结合到RNA结合柱上;
[0147] (8)将500μL RNA Wash BufferⅠ添加到RNA结合柱中,室温10000g离心1min,弃去滤过;
[0148] (9)将500μL RNA Wash Buffer II添加到RNA结合柱中,室温10000g离心1min,弃去滤过液;
[0149] (10)重复步骤9重新洗涤;
[0150] (11)将RNA结合柱套回收集管,室温10000g再次离心2min,以去除残余液体;
[0151] (12)将RNA结合柱套入新的无RNA酶的1.5mL EP管中,在结合柱膜中央滴加30~70μL RNaseFree H2O,室温静置2min。4℃14000g,离心2min,于‑80℃长期保存。
[0152] 所述S4具体包括:
[0153] (1)在冰上配制加尾法逆转录反应液。反应体系如下:
[0154] 2×mRQ Buffer 5μL,RNA sample 0.25‑8μg和3.75μL,mRQ Enzyme 1.25μL,总体积共10μL;
[0155] (2)反应条件:37℃,1h;85℃,5min;
[0156] (3)加入90μL RNase‑Free H2O将得到的cDNA稀释,长期储存于‑20℃。
[0157] 所述S5中,引物序列如下:
[0158] miR‑548ao‑5p:上游引物:5'‑GAAGTAACTACGCTTTTTGCA‑3';
[0159] miR‑4804‑3p:上游引物:5'‑CTTAACCTTGCCCTCGAAAAA‑3';
[0160] U6:上游引物:5’‑GGAACGATACAGAGAAGATTAGC‑3’;下游引物:5’‑TGGAACGCTTCACGAATTTGCG‑3’。
[0161] 所述S5中,两步法PCR扩增标准程序如下:
[0162] 预变性:95℃,30s;扩增:95℃,5s,60℃,30s,共40个循环;熔解曲线:95℃,5s,65℃,1min,95℃,30s,50℃,30s。
[0163] 所述S6具体包括:
[0164] 以训练集中的乳腺癌患者结局变量设为“1”,健康对照组变量设置为“0”,将筛选得到的miRNA分子即miR‑548ao‑5p和miR‑4804‑3p引入logistic回归,根据多变量logistics回归模型的回归系数确定每种miRNA在模型中的权重,建立基于miRNA的乳腺癌诊断模型,命名为miRNAs panelⅠ;随后将筛选出的传统血清肿瘤标志物即CA 125和CA153,引入另一个logistic回归,建立基于传统血清肿瘤标志物的乳腺癌诊断模型,命名为TM panelⅡ,最后将上述miRNAs和血清标志物引入logistic回归组合成联合诊断模型,命名为miRNAs+TM)panelⅢ,由此计算出每个模型个体患病的风险评估值;
[0165] 将验证集以及合集的数据分别导入构建的三种风险评估模型,用以验证模型的准确度和特异性。同时进行ROC曲线以及DAC分析,比较三种模型的诊断效能。
[0166] 本发明实施例提供一种实施所述基于MircoRNA与传统血清标志物联合的乳腺癌风险评估模型的构建系统,该系统包括:
[0167] miRNA测序模块,用于高通量miRNA测序;
[0168] miRNA提取模块,与miRNA测序模块连接,用于血清miRNA提取;
[0169] RNA提取模块,与miRNA提取模块连接,用于组织总RNA提取;
[0170] 逆转录模块,与RNA提取模块连接,用于miRNA逆转录;
[0171] 荧光定量PCR模块,与逆转录模块连接,用于荧光定量PCR模块;
[0172] 模型建立模块,与荧光定量PCR模块连接用于风险评估模型建立。
[0173] 本发明实施例提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1‑8任意一项所述基于MircoRNA与传统血清标志物联合的乳腺癌风险评估模型的构建方法的步骤。
[0174] 本发明通过高通量测序对乳腺癌患者和健康对照者的血清miRNA进行测序,最终筛选出两个在乳腺癌患者血清中显著低表达的miRNA,分别为miR‑548ao‑5p和miR‑4804‑3p。利用logistics回归构建了三种风险评估模型,分别是:基于miRNA的模型miRNAs panel I,基于传统血清肿瘤标志物糖类抗原125(CA125)、糖类抗原153(CA153)的模型TM Panel II,以及联合miRNA和血清肿瘤标志物的模型(miRNAs+TM)panel III。上诉的miRNA的序列及在miRbase数据库的登记号如下:
[0175] 上诉的传统血清肿瘤标志物在NCBI数据库的基因ID如下:
[0176] CA125 Gene ID:94025;CA153 Gene ID:4582
[0177] 本发明提供了血清特异性miRNA在乳腺癌诊断、靶向治疗和预后中的作用,也提供了miRNA联合传统血清标志物在制备乳腺癌诊断试剂盒、乳腺癌药物研发中的应用。
[0178] 本发明采用qRT‑PCR技术检测临床乳腺癌患者和健康对照组血清,通过ROC分析,比较单独miRNA、单独传统血清肿瘤标志物、miRNAs panel I、TM Panel II和(miRNAs+TM)panel III对于乳腺癌诊断的AUC、敏感度、特异性、95%置信区间(95%CI),并分别计算miRNAs panel I、TM Panel II和(miRNAs+TM)panel III的准确度、阳性预测值和阴性预测值。
[0179] 上诉中的临床患者包括训练集(116例乳腺癌患者,68例健康对照)、验证集(53例乳腺癌患者,46例健康对照)以及合集(169例乳腺癌患者,114例健康对照)。
[0180] 本发明根据训练集数据构建风险评估模型,并通过验证集以及合集证明了模型的准确性和特异性。
[0181] 本发明用于乳腺癌判别公式的miRNAs panel I为:
[0182] 风险评分=‑1.568×miR‑548ao表达量1.134×miR‑4804表达量+2.494
[0183] 本发明用于乳腺癌判别公式的TM Panel II为:
[0184] 风险评分=0.15×CA125+0.101×CA1532.70
[0185] 本发明用于乳腺癌判别公式的(miRNAs+TM)panel III为:
[0186] 风险评分=0.123×CA125+0.069×CA1531.173×miR‑548ao表达量1.185×miR‑4804表达
[0187] 本发明比较了单独miRNA、单独传统血清肿瘤标志物、miRNAs panel I、TM Panel II和(miRNAs+TM)panel III在各数据集中的ROC分析,见表1(训练集)、表2(验证集)、表3(合集)。
[0188] 表1.各组风险评估模型在训练集中的ROC分析
[0189]
[0190] 表2.各组风险评估模型在验证集中的ROC分析
[0191]
[0192] 表3.各组风险评估模型在合集中的ROC分析
[0193]
[0194] 通过各组风险评估模型在3个数据集中的ROC分析发现:
[0195] 1、独立的miR‑548ao‑5p或miR‑4804‑3p对乳腺癌具有一定的诊断价值。
[0196] 2、miRNAs panel I风险模型对乳腺癌的诊断效能与miR‑548ao‑5p和miR‑4804‑3p之间无显著差异(p>0.05)。
[0197] 3、miRNAs panel I风险模型对乳腺癌的诊断效能与CA125和CA153相比较更高(P<0.05),并且能有效提高对乳腺癌诊断的敏感度(P<0.05)。
[0198] 4、TM Panel II风险模型对乳腺癌的诊断效能优于CA153(p<0.05),与CA125和miRNAs panel I风险模型之间不存在统计学差异(p>0.05)。然而miRNAs panel I风险模型对乳腺癌诊断的准确度和敏感度均高于TM panel II风险模型(P<0.05),可减少患者漏诊的概率。
[0199] 5、(miRNAs+TM)panel III风险模型对乳腺癌的诊断效能均高于miRNAs panel I、TM Panel II、单个miRNA分子和单个血清肿瘤标志物。
[0200] 6、(miRNAs+TM)panel III风险模型无论在训练集、验证集还是合集中,各参数具有更好的稳定性。
[0201] 本发明发现miR‑548ao‑5p和miR‑4804‑3p在乳腺癌中显著低表达,并验证了独立的miR‑548ao‑5p和miR‑4804‑3p在乳腺癌诊断中具有较高准确性和特异性。
[0202] 本发明提出了具有较高乳腺癌诊断效能的三种风险模型,通过比较发现联合miRNA与传统标志物构建的(miRNAs+TM)panel III风险模型具有更高的敏感度、特异性、准确度和稳定性。
[0203] 进一步地,决策曲线分析(DCA)显示三种模型都能很地实现净临床效益,其中(miRNAs+TM)panel III模型能够使患者净收益最大。
[0204] 图2为miR‑548ao‑5p在各数据集乳腺癌患者和健康对照血清中的相对表达量;
[0205] 图3为miR‑4804‑3p在各数据集乳腺癌患者和健康对照血清中的相对表达量;
[0206] 图4为miR‑548ao‑5p在各数据集中的ROC曲线;
[0207] 图5为miR‑4804‑3p在各数据集中的ROC曲线;
[0208] 图6为CA125和CA153在训练集乳腺癌患者和健康对照血清中的相对表达量;
[0209] 图7为CA125和CA153在各数据集中的ROC曲线;
[0210] 图8为miRNAs panel I风险模型在各数据集中的ROC曲线;
[0211] 图9为TM Panel II风险模型在各数据集中的ROC曲线;
[0212] 图10为(miRNAs+TM)panel III风险模型在各数据集中的ROC曲线;
[0213] 图11为DCA评估三种模型地效益;
[0214] 图12为miR‑548ao‑5p和miR‑4804‑3p分别在肝癌、肺癌、胃癌中与健康对照中的相对表达量。
[0215] 本发明分析了miR‑548ao‑5p和miR‑4804‑3p在肝癌、肺癌、胃癌患者血清中的表达(各组癌症患者均为28例,健康对照为25例),验证了由这两种miRNA组成的风险模型在乳腺癌诊断中的特异性。
[0216] 本发明首次评估了血清miR‑548ao‑5p和miR‑4804‑3p对乳腺癌的诊断价值,并利用miR‑548ao‑5p、miR‑4804‑3p和CA125、CA153构建乳腺癌的联合诊断模型,较好地弥补了miRNAs低特异性和血清传统标志物低敏感度的缺点,为乳腺癌的无创诊断提供新方法。
[0217] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

当前第1页 第1页 第2页 第3页