用于通过深度学习来确定癌症疗法的系统和方法 [0001] 交叉引用 [0002] 本申请要求于2022年2月24日提交的美国临时专利申请号63/313,505的权益,该 申请通过引用整体并入本文。 背景技术 [0003] 前列腺癌是男性癌症死亡的主要原因。然而,用于预测患者结果的国际标准依赖 于非特异性和不敏感的工具,这些工具通常会导致过度治疗或治疗不足。 发明内容 [0004] 确定患者的最佳癌症疗法是一项具有挑战性的任务,其中肿瘤学家必须选择成功 概率最高且毒性概率最小的疗法。疗法选择的困难根源在于癌症表现出的巨大的分子、表 型和预后异质性。本文认识到需要准确的、全球可扩展的工具来支持个性化癌症疗法。 [0005] 放射疗法是用于以治愈意图治疗局限性前列腺癌的常见根治性疗法形式。已证明 当将雄激素剥夺疗法(ADT)添加到放射疗法时,肿瘤学结果得到了改善。然而,有据可查ADT 具有毒性,包括潮热、性欲和勃起功能下降、肌肉质量损失、体脂增加、骨密度降低以及对心脏和大脑健康的潜在有害影响。 [0006] 尽管ADT有好处,但在没有ADT的情况下仅用放射疗法进行治疗的大多数患有局限 性前列腺癌的男性从未出现远处转移。不幸的是,仍然没有预测性生物标志物来识别哪些 男性特别受益于伴随有放射疗法的ADT,并因此目前的指南建议基于使用美国国家综合癌 症网络(NCCN)风险组进行估计的预后来使用ADT。因此,指导ADT与放射疗法一起用于患有 局限性前列腺癌的男性存在大量未满足的需求。 [0007] 因此,本文公开了用于通过处理从对象(例如癌症患者)获得的或从其得到的生物 样本来识别或监测癌症相关状态的方法和系统。可以分析从对象获得的生物样本(例如组 织样本)以预测临床结果(其可以包括例如远处转移、生化复发、死亡、无进展生存期和总体 生存期)。可以分析从对象获得的生物样本以预测对治疗的反应并指导治疗决策。 [0008] 在一方面,本公开提供了一种用于评估对象的癌症的方法,该方法包括:(a)获得 至少包括从对象获得或得到的图像数据的数据集;(b)使用经过训练的算法处理数据集以 将数据集分类为多个类别之中的类别,其中分类包括将图像处理算法应用于图像数据;以 及(c)至少部分地基于将数据集分类为类别来评估癌症,其中评估包括确定预测对用于治 疗对象的癌症的治疗干预的反应的生物标志物。 [0009] 在一些实施方式中,反应包括总体生存期。在一些实施方式中,反应包括无进展生 存期。在一些实施方式中,反应包括死亡率的降低。在一些实施方式中,反应包括前列腺癌 特异性死亡率的降低。在一些实施方式中,反应包括无转移生存期。在一些实施方式中,反 应包括转移的减少。在一些实施方式中,反应包括远处转移的减少。在一些实施方式中,反 应包括在五年时的远处转移的减少。 [0010] 在一些实施方式中,该方法还包括确定对象对生物标志物呈生物标志物阳性还是 生物标志物阴性,其中确定对象呈生物标志物阳性还是生物标志物阴性包括:(i)计算对象 在存在治疗干预的情况下显示反应的第一概率;(ii)计算对象在不存在治疗干预的情况下 显示反应的第二概率;(iii)计算第一概率和第二概率之间的概率增量;以及(iv)将概率增 量与参考标准进行比较。 [0011] 在一些实施方式中,该方法还包括确定对象对生物标志物呈生物标志物阳性还是 生物标志物阴性,其中确定对象呈生物标志物阳性还是生物标志物阴性包括:(i)计算对象 在存在治疗干预的情况下且在存在放射疗法(RT)的情况下显示反应的第一概率;(ii)计算 对象在不存在治疗干预的情况下且在存在放射疗法(RT)的情况下显示反应的第二概率; (iii)计算第一概率和第二概率之间的概率增量;以及(iv)将概率增量与参考标准进行比 较。在一些实施方式中,当概率增量高于参考标准时对象呈生物标志物阳性,并且当概率增 量低于参考标准时对象对生物标志物呈阴性。在一些实施方式中,参考标准至少部分地通 过测量来自多个对象的中位数概率增量来确定。 [0012] 在一些实施方式中,该方法还包括:(i)计算对象在存在治疗干预的情况下且在存 在放射疗法(RT)的情况下显示反应的第一概率;(ii)计算对象在不存在治疗干预的情况下 且在存在放射疗法(RT)的情况下显示反应的第二概率;(iii)计算第一概率和第二概率之 间的概率增量;以及(iv)将概率增量与参考标准进行比较;其中当概率增量高于参考标准 时对象呈生物标志物阳性,并且其中当概率增量低于参考标准时对象对生物标志物呈阴 性。在一些实施方式中,当概率增量高于参考标准时对象呈生物标志物阳性,并且当概率增 量低于参考标准时对象对生物标志物呈阴性。在一些实施方式中,参考标准至少部分地通 过测量来自多个对象的中位数概率增量来确定。 [0013] 在一些实施方式中,生物标志物阳性对象是所述治疗干预的候选者。在一些实施 方式中,该方法还包括用治疗干预治疗对象。在一些实施方式中,治疗干预包括雄激素剥夺 疗法(ADT)。在一些实施方式中,ADT是短期ADT(ST‑ADT)。在一些实施方式中,经过训练的算法是使用自监督学习进行训练的。在一些实施方式中,经过训练的算法包括深度学习算法。 在一些实施方式中,数据集还包括表格数据。在一些实施方式中,经过训练的算法包括处理 图像数据的第一经过训练的算法和处理表格数据的第二经过训练的算法。在一些实施方式 中,经过训练的算法还包括处理第一经过训练的算法和第二经过训练的算法的输出的第三 经过训练的算法。在一些实施方式中,表格数据包括对象的临床数据。在一些实施方式中, 临床数据包括实验室数据、治疗干预或长期结果。在一些实施方式中,癌症包括前列腺癌、 膀胱癌、乳腺癌、胰腺癌或甲状腺癌。在一些实施方式中,癌症包括前列腺癌。在一些实施方式中,图像数据包括数字组织病理学数据。在一些实施方式中,数据包括源自对象的活检样 本的图像。在一些实施方式中,图像是通过对活检样本进行的显微镜检查获取的。在一些实 施方式中,该方法还包括使用图像分割、图像拼接或目标检测算法处理图像数据。在一些实 施方式中,该方法还包括从图像数据中提取特征。 [0014] 本公开的另一方面提供了一种非暂时性计算机可读介质,其包括机器可执行代 码,该机器可执行代码在由一个或多个计算机处理器执行时实现上述或本文其他地方的任 何方法。 [0015] 本公开的另一方面提供了一种系统,该系统包括一个或多个计算机处理器和与其 耦合的计算机存储器。计算机存储器包括机器可执行代码,该机器可执行代码在由一个或 多个计算机处理器执行时实现上述或本文其他地方的任何方法。 [0016] 对于本领域技术人员来说,通过以下详细描述,本公开的附加方面和优点将变得 显而易见,其中仅显示和描述了本公开的说明性实施方式。本公开能够有其他不同的实施 方式,并且其若干细节能够在各个明显的方面进行修改,所有这些都是在不背离本公开的 情况下。因此,附图和描述在本质上应被视为说明性的,而不是限制性的。 [0017] 援引并入 [0018] 本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如 同具体地且单独地指明每个单独的出版物、专利或专利申请通过引用并入本文一样。在通 过引用而并入的出版物和专利或专利申请与说明书包含的公开内容相矛盾的情况下,说明 书旨在取代和/或优先于任何此类矛盾材料。 附图说明 [0019] 本发明的新颖特征在所附权利要求书中详细阐述。通过参考阐述了其中利用了本 发明原理的说明性实施方式的以下详细描述和附图(本文中也称为“图”),将获得对本发明 的特征和优点的更好理解,在附图中: [0020] 图1示出了被编程或以其他方式被配置以实现本文提供的方法的计算机系统。 [0021] 图2A‑图2C显示了多模态深度学习系统和数据集的示例。图2A显示了多模态架构 包括三个部分:用于解析表格临床数据的塔堆栈、用于解析可变数量的数字组织病理学切 片的塔堆栈以及用于合并结果特征并预测二进制结果的第三塔堆栈。图2B显示了图像塔堆 栈的自监督模型的训练。图2C示出了多模态AI(MMAI)系统的示意性表示。图2C中所示的示 例MMAI系统接受表格(例如,临床)数据和图像(例如,组织病理学)数据两者,并且输出表征 对患者的治疗益处的大小的增量评分。 [0022] 图3A‑图3H显示了在试验和结果中将深度学习系统与已建立的临床指南进行比较 的示例。图3A显示了使用时间依赖性接受者操作员特性来报告MMAI(蓝色条)与NCCN(灰色 条)模型的灵敏度和特异性的曲线下面积(AUC)的性能结果。在5年和10年时间点对以下二 进制结果进行比较:远处转移(DM)、生化复发(BCR)、前列腺癌特异性生存期(PCaSS)和总体 生存期(OS)。图3B显示了AI模型相对于NCCN模型在各种结果中的并且按测试集中每次试验 数据的性能被细分的相对改进的汇总表。相对改进由(PAI‑PNCCN)/PNCCN给出,其中P是模 型的性能。图3C显示了消融研究的结果,该结果显示了在连续减少的数据输入集上进行训 练时的模型性能。NCCN表示以下三个变量:组合Gleason、基线psa、t阶段;NCCN+3表示NCCN加:Gleason原发性、Gleason继发性、年龄;路径是指数字化组织病理学图像。图3D‑图3H显示了测试集的各个临床试验子集的性能比较—这五个子集一起构成了图3A中所示的整个 测试集。 [0023] 图4显示了病理学家对SSL组织簇的解释示例。多模态模型中的自监督模型经过训 练,以识别小块组织的增强版是否来自同一原始块,而无需查看临床数据标签。在训练后, 通过此模型馈入10.05M个图像块的数据集中的每个图像块,以提取128维特征向量,并且使 用UMAP算法31对结果向量进行聚类和可视化。然后要求病理学家解释最接近25个簇质心中 的每个簇质心的20个图像块—描述显示在插图旁边。为了清楚起见,我们仅突出显示6个簇 (彩色),并将其余簇显示为灰色。参见图7以获得完整的病理学家注释。 [0024] 图5显示了四个示例患者的图像绗缝(image quilt)的示例。数据集包含具有可变 数量的组织病理学切片的患者。为了使模型的图像输入标准化,对来自每个切片的组织进 行分割,并将所有组织粘贴到51200×51200像素的单个方形图像中,并分成200×200个块, 代表单个患者的所有组织病理学数据。此处显示了来自四个患者的图像绗缝。 [0025] 图6显示了示例图像块的核密度采样示例。棕褐色框指示核检测,其用于计算核密 度。我们根据核密度对输入到自监督训练协议的块进行过采样。每个块根据密度分成十分 位数,并且每个十分位数都进行过采样,以便MMAI模型从每个十分位数中看到相同数量的 总图像。 [0026] 图7显示了病理学家解释的块簇的示例。使用UMAP,从试验RTOG‑9202的所有组织 病理学块的SSL特征中生成25个簇。图像中的每一行对应于簇质心的25个最近邻图像块。这 些已经由病理学家检查,以确定表中列出的簇的人类可解释描述。 [0027] 图8显示了NCCN模型算法的示例。基于规则的算法基于D’Amico风险组对美国国家 癌症中心网络每年发布的指南进行建模。 [0028] 图9是显示来自经处理的临床试验数据的统计数据的表格。前五列列出了每次试 验的统计数据。“组合”列显示了最终数据集的统计数据,其中所有五次试验均用于训练和 验证。***RTOG 9413以2×2的方式对患者进行随机分组,测试激素治疗时间(RT之前与从RT 开始)和场大小(仅前列腺的RT与全盆腔的RT)的影响。使用的新缩写词:无病生存期(DFS)、 无进展生存期(PFS)、前列腺癌特异性死亡率(PCSM)。 [0029] 图10示出了处理临床数据集的CONSORT流程图。ST‑ADT=短期雄激素剥夺疗法;RT =放射疗法。 [0030] 图11示出了使用经过训练的算法确定的各种表格(例如,临床)和图像(例如,组织 病理学)数据特征的相对特征重要性。特征重要性基于每个变量的绝对Shapely值的平均值 来计算,并且跨特征进行归一化。图像重要性测量值为37.3%,其次是Gleason原发性: 35.8%,Gleason继发性:9.0%,组合Gleason:5.6%,T阶段:5.5%,年龄:3.5%,以及基线PSA:3.4%。 [0031] 图12示出了使用经过训练的算法确定的开发群组(左)和验证群组(右)的增量评 分的分布。垂直线表示第67百分位数,该第67百分位数被选为“生物标志物阳性”对象和“生物标志物阴性”对象之间的界线。 [0032] 图13示出了按使用经过训练的算法确定的AI生物标志物子组(“生物标志物阳性” 和“生物标志物阴性”)进行的远处转移的累积发病率曲线。 [0033] 图14示出了跨阳性生物标志物组和阴性生物标志物组的远处转移(DM)和前列腺 癌特异性死亡率(PCSM)的森林图。 [0034] 图15示出了美国国家综合癌症网络(NCCN)低‑中等风险患者子组的阳性生物标志 物组和阴性生物标志物组中的远处转移(DM)和前列腺癌特异性死亡率(PCSM)的森林图。 [0035] 图16示出了按使用经过训练的算法确定的AI生物标志物子组(“生物标志物阳性” 和“生物标志物阴性”)进行的前列腺癌特异性死亡率(PCSM)的累积发病率曲线。 具体实施方式 [0036] 虽然本文已显示和描述了本发明的各种实施方式,但对于本领域技术人员来说将 明显的是,这些实施方式仅以示例的方式提供。在不背离本发明的情况下,本领域技术人员 可以想到许多变化、改变和替换。应理解,可以采用本文所述的本发明实施方式的各种替代 方案。 [0037] 如在说明书和权利要求书中所用,单数形式“一(一个)”、“一种”和“该(所述)”包括复数指代,除非上下文另有明确规定。例如,术语“核酸”包括多个核酸,包括其混合物。 [0038] 如本文所用,术语“对象”通常指具有可测试或可检测遗传信息的实体或介质。对 象可以是人、个体或患者。对象可以是脊椎动物,诸如,举例而言,哺乳动物。哺乳动物的非限制性示例包括人类、猿、农场动物、运动动物、啮齿动物和宠物。对象可以是雄性对象。对象可以是雌性对象。对象可以表现出表明对象健康或生理状态或状况的症状,诸如对象的 癌症相关的健康或生理状态或状况。作为替代方案,对象在这种健康或生理状态或状况方 面可以是无症状的。对象可以被怀疑具有健康或生理状态或状况。对象可以面临发展健康 或生理状态或状况的风险。健康或生理状态可以对应于疾病(例如癌症)。对象可以是被诊 断患有疾病的个体。对象可以是面临患病风险的个体。 [0039] 如本文所用,“癌症的诊断”、“诊断癌症”以及相关或衍生术语包括识别对象的癌症、确定癌症的恶性程度或确定癌症的阶段。 [0040] 如本文所用,“癌症的预后”、“预测癌症”以及相关或衍生术语包括预测患者的临床结果、评估癌症复发的风险、确定治疗方式或确定治疗效果。 [0041] 如本文所用,术语“核酸”通常指任何长度的核苷酸的聚合形式,无论是脱氧核糖 核苷酸(dNTP)还是核糖核苷酸(rNTP),或其类似物。核酸可以具有任何三维结构,并且可以 执行任何已知或未知的功能。核酸的非限制性示例包括脱氧核糖核酸(DNA)、核糖核酸 (RNA)、基因或基因片段的编码区或非编码区、由链接分析定义的位点、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微RNA(miRNA)、核酶、cDNA、重组核酸、分支核酸、质粒、载体、任何序列的分离DNA、任何序列的分离RNA、核酸探针和引物。核酸可以包括一个或多个修饰核苷酸,诸如甲基化核苷酸和核苷酸类似物。 如果存在,可在核酸组装之前或之后对核苷酸结构进行修饰。核酸的核苷酸序列可以被非 核苷酸成分打断。核酸可以在聚合后被进一步修饰,诸如通过与报告剂缀合或键合。 [0042] 如本文所用,术语“靶核酸”通常指起始核酸分子群中的核酸分子,该起始核酸分 子群具有需要确定其存在、量和/或序列或其中一个或多个的变化的核苷酸序列。靶核酸可 以是任何类型的核酸,包括DNA、RNA及其类似物。如本文所用,“靶核糖核酸(RNA)”通常指作为RNA的靶核酸。如本文所用,术语“靶脱氧核糖核酸(DNA)”通常指作为DNA的靶核酸。 [0043] 如本文所用,术语“扩增”通常指增加核酸分子的大小或数量。核酸分子可以是单 链或双链的。扩增可以包括产生核酸分子的一个或多个拷贝或“扩增产物”。扩增可以例如 通过延伸(例如,引物延伸)或连接(ligation)来进行。扩增可以包括进行引物延伸反应以 产生与单链核酸分子互补的链,并且在一些情况下产生该链和/或单链核酸分子的一个或 多个拷贝。术语“DNA扩增”通常指产生DNA分子的一个或多个拷贝或“扩增的DNA产物”。术语“逆转录扩增”通常指通过逆转录酶的作用从核糖核酸(RNA)模板产生脱氧核糖核酸(DNA)。 [0044] 本公开的实施方式 [0045] 尽管前列腺癌很普遍,但准确、灵敏且特异性的前列腺癌诊断仍然难以实现。虽然 前列腺癌通常进展缓慢,且治疗可以治愈,但由于治疗过度和治疗不足的负面影响,前列腺 癌是全球癌症相关残疾的主要原因,并且仍然是男性癌症死亡的主要原因之一。确定前列 腺癌患者的最佳治疗方案是艰巨的医疗任务,其涉及考虑患者的整体健康状况、其癌症特 性、多种可能治疗的副作用、来自涉及具有类似诊断的患者的临床试验的结果数据,以及预 测当前患者的未来预期结果。由于缺乏易于获得的预后工具来更好地对患者进行风险分 层,这一挑战变得更加严峻。 [0046] 人工智能(AI)已经允许从以前无法解释的海量数据集中收集见解。虽然标准风险 分层工具是固定的并且基于少数变量,但AI可以从各种模态下的大量经过最低限度处理的 数据中学习。AI系统可以是成本低廉的、可大规模扩展的,并且通过使用而逐步改进。 [0047] 迫切需要精确、全球可扩展的工具来支持个性化疗法。本文公开的方法和系统通 过使用在前列腺活检的数字组织病理学和临床数据上训练的新型多模态深度学习模型来 预测特定疗法对长期的临床相关结果(例如,远处转移、生化复发、部分缓解、完全缓解、死亡、相对生存期、癌症特异性生存期、无进展生存期、无病生存期、五年生存期和总体生存 期)的影响,证明了前列腺癌疗法个性化。 [0048] 因此,本公开提供了用于通过处理从对象(例如患有或疑似患有前列腺癌的男性 患者)获得的或从其得到的生物样本来识别或监测癌症相关类别和/或状态的方法、系统和 试剂盒。可以分析从对象获得的生物样本(例如前列腺活检样本)以识别癌症相关类别(其 可以包括例如测量癌症相关类别的存在、不存在或定量评估(例如风险、预测结果)、或者测 量预测的或观察到的对治疗干预的反应)。此类对象可以包括具有一个或多个癌症相关类 别的对象和没有癌症相关类别的对象。癌症相关类别或状态可以包括例如癌症阳性、癌症 阴性、癌症阶段、观察到的对癌症治疗(例如,放射疗法、化学疗法、外科手术干预)的反应、观察到的长期结果(例如,疾病转移、生化复发、部分反应、完全反应、相对生存期、癌症特异性生存期、无进展生存期、无病生存期、五年生存期或总体生存期)、预测的对癌症治疗的反应和/或预测的长期结果。 [0049] 测定生物样本 [0050] 生物样本可以从人类对象(例如男性对象)获得或得到。生物样本在处理前可以在 各种储存条件(诸如不同的温度(例如,在室温下、在冷藏或冷冻条件下、在25℃下、在4℃ 下、在‑18℃下、在‑20℃下或在‑80℃下)、不同的悬浮液(例如,福尔马林、EDTA收集管、无细胞RNA收集管或无细胞DNA收集管))下储存。生物样本可以从患有或疑似患有癌症(例如前 列腺癌)的对象获得,或从未患有或未疑似患有癌症的对象获得。 [0051] 生物样本可以用于通过分析生物样本来诊断、检测或识别对象的疾病或者健康或 生理状况。可以分析生物样本或其部分以确定样本对疾病或健康状况(例如前列腺癌)呈阳 性的可能性。替代地或另外地,本文所述的方法可以包括诊断患有疾病或健康状况的对象、 监测对象的疾病或健康状况和/或确定对象对健康疾病/状况的倾向。在一些实施方式中, 生物样本可以用于将样本和/或对象分类为癌症相关类别和/或将对象识别为具有特定的 癌症相关状态。癌症相关类别或状态可以包括诊断(例如对癌症呈阳性或阴性)、特定类型 的癌症(例如前列腺癌)、癌症阶段、预测结果或预后、对一种或多种治疗的预测反应或其任 何组合。 [0052] 任何可测量的物质都可以作为样本的来源。该物质可以是流体,例如生物流体。流 体物质可以包括血液(例如全血、血浆、血清)、脐带血、唾液、尿液、汗液、血清、精液、阴道液、胃液和消化液、脑脊液、胎盘液、腔液、眼液、血清、乳汁、淋巴液或其组合。 [0053] 物质可以是固体,例如生物组织。该物质可以包括正常健康组织。组织可以与各种 类型的器官相关联。器官的非限制性示例可以包括脑、乳房、肝脏、肺、肾、前列腺、卵巢、脾脏、淋巴结(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食道、胃或其组合。 [0054] 该物质可以包括肿瘤。肿瘤可以是良性肿瘤(非癌症)、恶性肿瘤前期、恶性肿瘤 (癌症)或其任何转移。肿瘤和相关联癌症的非限制性示例可以包括:听神经瘤、急性淋巴细 胞白血病、急性髓细胞白血病、腺癌、肾上腺皮质癌、AIDS相关癌症、AIDS相关淋巴瘤、肛门癌、血管肉瘤、阑尾癌、星形细胞瘤、基底细胞癌、胆管癌、膀胱癌、骨癌、脑肿瘤(诸如小脑星形细胞瘤、大脑星形细胞瘤/恶性神经胶质瘤)、室管膜瘤、髓母细胞瘤、幕上原始神经外胚 层肿瘤、视觉通路和下丘脑神经胶质瘤、乳腺癌、支气管腺瘤、伯基特淋巴瘤、原发性不明 癌、中枢神经系统淋巴瘤、支气管癌、小脑星形细胞瘤、宫颈癌、儿童癌症、软骨肉瘤、脊索瘤、绒毛膜癌、慢性淋巴细胞白血病、慢性粒细胞白血病、慢性骨髓增生性疾病、结肠癌、大肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、囊腺癌、促纤维增生性小圆细胞瘤、胚胎癌、内分泌系统癌、子宫内膜癌、内皮肉瘤、室管膜瘤、上皮癌、食道癌、尤文氏肉瘤、纤维肉瘤、生殖细胞肿瘤、胆囊癌、胃癌、胃肠道类癌瘤、胃肠道间质瘤、胃肠道系统癌、泌尿生殖系统癌、神经胶质瘤、毛细胞白血病、头颈癌、心脏癌、血管母细胞瘤、肝细胞(肝)癌、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞癌、卡波西肉瘤、肾癌、喉癌、平滑肌肉瘤、唇和口腔癌、脂肪肉瘤、肝癌、肺癌(例如非小细胞和小细胞肺癌)、肺肿瘤、淋巴管肉瘤、淋巴管内皮肉瘤、淋巴瘤、白血病、巨球蛋白血症、骨恶性纤维组织细胞瘤/骨肉瘤、髓母细胞瘤、髓样癌、黑色素瘤、脑膜瘤、间皮瘤、具有隐匿性原发性的转移性鳞状颈癌、口癌、多发性内分泌肿瘤综合征、骨髓增生异常综合征、髓性白血病、粘液肉瘤、鼻腔和鼻旁窦癌、鼻咽癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、少突神经瘤、口腔癌、口咽癌、骨肉瘤/骨恶性纤维组织细胞瘤、卵巢癌、卵巢上皮癌、卵巢生殖细胞肿瘤、胰腺癌、胰腺癌胰岛细胞、乳头状腺癌、乳头状癌、鼻旁窦和鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、松果体星形细胞瘤、松果体生殖细胞瘤、垂体腺瘤、胸膜肺母细胞瘤、浆细胞肿瘤、原发性中枢神经系统淋巴瘤、前列腺癌、直肠癌、肾细胞癌、肾盂和输尿管移行细胞癌、视网膜母细胞瘤、横纹肌肉瘤、唾液腺癌、肉瘤、皮脂腺癌、精原细胞瘤、皮肤癌、默克尔细胞皮肤癌、小肠癌、软组织肉瘤、鳞状细胞癌、胃癌、汗腺癌、滑膜瘤、T细胞淋巴瘤、睾丸肿瘤、咽喉癌、胸腺瘤、胸腺癌、甲状腺癌、滋养细胞肿瘤(妊娠期)、未知原发部位的癌症、尿道癌、子宫肉瘤、阴道癌、外阴癌、瓦尔登斯特伦巨球蛋白血症、威尔姆斯肿瘤或其组合。肿瘤可以与各种类型的器官相关联。器官的非限制性 示例可以包括脑、乳房、肝脏、肺、肾、前列腺、卵巢、脾脏、淋巴结(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食道、胃或其组合。 [0055] 该物质可以包括正常健康组织或肿瘤组织的混合物。组织可以与各种类型的器官 相关联。器官的非限制性示例可以包括脑、乳房、肝脏、肺、肾、前列腺、卵巢、脾脏、淋巴结(包括扁桃体)、甲状腺、胰腺、心脏、骨骼肌、肠、喉、食道、胃或其组合。在一些实施方式中,组织与对象的前列腺相关联。在生物样本包括细胞和/或组织(例如,活检样本)的情况下, 可以进一步分析或测定生物样本。在一些实施方式中,活检样本可以被固定、处理(例如,脱水)、嵌入、冷冻、染色和/或在显微镜下检查。在一些实施方式中,从处理后的样本生成数字切片。 [0056] 在一些实施方式中,该物质可以包括多种细胞,包括真核细胞、原核细胞、真菌细 胞、心脏细胞、肺细胞、肾细胞、肝细胞、胰腺细胞、生殖细胞、干细胞、诱导性多能干细胞、胃肠道细胞、血细胞、癌细胞、细菌细胞、从人类微生物组样本中分离的细菌细胞以及人类血 液中的循环细胞。在一些实施方式中,该物质可以包括细胞的内容物,诸如,举例而言,单个细胞的内容物或多个细胞的内容物。 [0057] 在一些实施方式中,该物质可以包括一种或多种标记物,其存在或不存在指示某 些现象,诸如疾病、紊乱、感染或环境暴露。标记物可以是例如细胞、小分子、大分子、蛋白质、糖蛋白、碳水化合物、糖、多肽、核酸(例如脱氧核糖核酸(DNA)、核糖核酸(RNA))、无细胞核酸(例如cf‑DNA、cf‑RNA)、脂质、细胞成分或其组合。 [0058] 生物样本可以在对患有癌症的对象进行治疗之前和/或之后采集。生物样本可以 在治疗或治疗方案期间从对象获得。可以从对象获得多个生物样本以监测治疗随时间推移 的效果。生物样本可以从已知或疑似患有癌症(例如前列腺癌)的对象采集。生物样本可以 从出现无法解释的症状(诸如疲劳、恶心、体重减轻、酸痛、虚弱或出血)的对象采集。生物样本可以从出现已解释症状的对象采集。生物样本可以从因诸如家族史、年龄、高血压或高血 压前期、糖尿病或糖尿病前期、超重或肥胖、环境暴露、生活方式风险因素(例如吸烟、饮酒或吸毒)或存在其他风险因素等因素而面临患癌症风险的对象采集。 [0059] 从对象获得生物样本后,可以处理该生物样本以生成指示对象的疾病、病症、癌症 相关类别或健康状态的数据集。例如,可以对组织样本进行组织病理学测定(例如,显微镜 检查,包括数字图像采集,诸如全切片成像)以基于生物样本生成图像数据。替代地,可以对从样本中分离的液体样本或标记物进行测试(例如,临床实验室测试)以生成表格数据。在 一些实施方式中,对样本进行测定以确定一种或多种代谢物(例如,前列腺特异性抗原 (PSA))的存在、不存在或量。 [0060] 数据类型 [0061] 本文所述的方法和系统将一个或多个数据集作为输入。一个或多个数据集可以包 括表格和/或图像数据。表格和/或图像数据可以源自对象的生物样本。在一些实施方式中, 数据不是源自生物样本。 [0062] 数据可以包括从对象的活检中取得的组织样本的图像。图像数据可以通过对活检 样本进行的显微镜检查获取。显微镜检查可以包括光学显微镜检查、虚拟或数字显微镜检 查(诸如全切片成像(WSI))或本领域已知的任何合适的显微镜检查技术。显微镜检查图像 可以经过一个或多个处理步骤,诸如过滤、分割、拼接或目标检测。 [0063] 本文所述的表格数据可以包括与对象的健康状态或状况(例如疾病)相关的任何 非图像数据。表格数据可以包括临床数据,诸如一个或多个时间点的实验室数据(例如前列 腺血清抗原(PSA)水平)、细胞病理学的定性测量(例如Gleason等级、Gleason评分)、结构化 或非结构化健康数据(例如直肠指检结果)、医学成像数据或结果(例如X射线、计算机断层 (CT)扫描、磁共振成像(MRI)扫描、正电子发射断层(PET)扫描或超声检查(诸如经直肠超声 检查结果)的结果)、年龄、病史、先前或当前的癌症状态(例如缓解、转移)或阶段、当前或先前的治疗干预、长期结果和/或美国国家综合癌症网络(NCCN)分类或其组成部分(例如组合 Gleason评分、t阶段、基线PSA)。 [0064] 在一些实施方式中,治疗干预可以包括放射疗法(RT)。在一些实施方式中,治疗干 预可以包括化学疗法。在一些实施方式中,治疗干预可以包括外科手术干预。在一些实施方 式中,治疗干预可以包括免疫疗法。在一些实施方式中,治疗干预可以包括激素疗法。在一 些实施方式中,RT可以包括预先指定使用短期雄激素剥夺疗法(ST‑ADT)的RT。在一些实施 方式中,RT可以包括预先指定使用长期ADT(LT‑ADT)的RT。在一些实施方式中,RT可以包括 预先指定使用剂量递增RT(DE‑RT)的RT。在一些实施方式中,外科手术干预可以包括根治性 前列腺切除术(RP)。在一些实施方式中,治疗干预可以包括本文公开的治疗干预的任何组 合。在一些实施方式中,长期结果可以包括远处转移(DM)。在一些实施方式中,长期结果可 以包括生化复发(BR)。在一些实施方式中,长期结果可以包括部分缓解。在一些实施方式 中,长期结果可以包括完全缓解。在一些实施方式中,长期结果可以包括死亡。在一些实施 方式中,长期结果可以包括相对生存期。在一些实施方式中,长期结果可以包括癌症特异性 生存期。在一些实施方式中,癌症特异性生存期可以包括前列腺癌特异性生存期(PCaSS)。 在一些实施方式中,长期结果可以包括无进展生存期。在一些实施方式中,长期结果可以包 括无病生存期。在一些实施方式中,长期结果可以包括五年生存期。在一些实施方式中,长 期结果可以包括总体生存期(OS)。在一些实施方式中,长期结果可以包括本文公开的长期 结果的任何组合。 [0065] 本文所述的方法和系统中使用的数据可以经过一个或多个处理步骤。在一些实施 方式中,数据(例如,图像数据)经过图像处理、图像分割和/或目标检测过程,如图像处理、图像分割或目标检测算法中编码的那样。图像处理过程可以在下游处理之前对图像进行过 滤、变换、缩放、旋转、镜像、剪切、组合、压缩、分割、拼接、提取特征和/或平滑处理。在一些实施方式中,多个图像(例如,组织病理学切片)被组合以形成图像绗缝。图像绗缝可以转换 为可用于图像数据的下游处理的表示(例如,张量)。图像分割过程可以将图像分割成一个 或多个包含感兴趣的因子或区域的片段。例如,图像分割算法可以处理数字组织病理学切 片以确定与空白区域或伪影完全不同的组织区域。在一些实施方式中,图像分割算法可以 包括机器学习或人工智能算法。在一些实施方式中,图像分割可以先于图像处理。在一些实 施方式中,图像处理可以先于图像分割。目标检测过程可以包括检测靶目标(例如,细胞或 细胞部分,诸如细胞核)的存在或不存在。在一些实施方式中,目标检测可以先于图像处理 和/或图像分割。例如,由图像检测算法发现包含一个或多个感兴趣的目标的图像可以在后 续图像处理步骤中被拼接起来。替代地或另外地,图像处理可以先于目标检测和/或图像分 割。例如,可以处理(例如,过滤)原始图像数据,并且对处理后的图像数据进行目标检测算 法。可以以任何适当的顺序对图像数据进行多个图像处理、图像分割和/或目标检测步骤。 在示例中,对图像数据可选地进行一个或多个图像处理步骤以提高图像质量。然后对处理 后的图像进行图像分割算法以检测感兴趣的区域(例如,一组组织病理学切片中的组织区 域)。然后对感兴趣的区域进行目标检测算法(例如,用于检测组织图像中的细胞核的算 法),并将发现具有至少一个靶目标的区域拼接起来,以产生处理后的图像数据以供下游使 用。 [0066] 在一些实施方式中,数据(例如,表格数据)可以经过一个或多个处理步骤。处理步 骤可以包括但不限于标准化或规范化。一个或多个处理步骤可以例如丢弃包含虚假值或包 含极少观察值的数据。一个或多个处理步骤可以进一步或替代地标准化数据值的编码。取 决于数据集的来源,不同的输入数据集可以具有以不同方式编码的相同参数值。例如, “900”、“900.0”、“904”、“904.0”、“‑1”、“‑1.0”、“无”和“NaN”都可以对“缺失”参数值进行编码。一个或多个处理步骤可以识别相同值的编码变化并标准化数据集以对给定参数值进行 统一编码。因此,处理步骤可以减少输入数据中的不规则性以供下游使用。一个或多个数据 集可以标准化参数值。例如,数值数据可以被缩放、变白、着色、去相关或标准化。例如,数据可以被缩放或移位以位于特定间隔(例如,[0,1]或[‑1,1])中和/或消除相关性。在一些实 施方式中,分类数据可以编码为独热向量。在一些实施方式中,可以将一种或多种不同类型 的表格(例如,数值、分类)数据拼接在一起。在一些实施方式中,数据不经过处理步骤。 [0067] 可以在一个或多个时间点取得数据。在一些实施方式中,可以在初始时间点和稍 后的时间点取得数据。初始时间点和稍后的时间点可以间隔任何适当的时间量,诸如1小 时、1天、1周、2周、3周、4周、6周、12周、4个月、5个月、6个月、7个月、8个月、9个月、10个月、11个月、1年、2年、3年、4年、5年、6年、7年、8年、9年、10年或更长时间。在一些实施方式中,数据来自两个以上的时间点。在一些实施方式中,数据来自3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19、20个或更多个时间点。 [0068] 经过训练的算法 [0069] 在使用一种或多种测定来处理源自对象的一个或多个生物样本以生成一个或多 个指示对象的癌症状态(例如,一个或多个癌症相关类别)的数据集后,可以使用经过训练 的算法处理一个或多个数据集(例如,视觉数据和/或表格数据)以确定对象的癌症状态。例 如,可以使用经过训练的算法以基于图像数据和/或实验室数据确定对象中癌症(例如,前 列腺癌)的存在或不存在。经过训练的算法可以被配置为针对至少约25、至少约50、至少约 100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400、至少约450、至少约500或超过约500个独立样本以至少约50%、至少约55%、至少约60%、至少约65%、至 少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或超过99%的准确度来识别癌症状态。 [0070] 经过训练的算法可以包括无监督机器学习算法。经过训练的算法可以包括监督机 器学习算法。经过训练的算法可以包括分类和回归树(CART)算法。监督机器学习算法可以 包括,例如,随机森林、支持向量机(SVM)、神经网络或深度学习算法。经过训练的算法可以包括自监督机器学习算法。 [0071] 在一些实施方式中,本文所述的方法或系统的机器学习算法利用一个或多个神经 网络。在一些情况下,神经网络是一种可以学习输入数据集和靶数据集之间的关系的计算 系统。神经网络可以是人类神经系统(例如认知系统)的软件表示,旨在捕获人类使用的“学 习”和“概括”能力。在一些实施方式中,机器学习算法包括包含CNN的神经网络。本文所述机器学习算法的结构组件的非限制性示例包括:CNN、循环神经网络、扩张CNN、全连接神经网 络、深度生成模型和玻尔兹曼机。 [0072] 在一些实施方式中,神经网络包括一系列称为“神经元”的层。在一些实施方式中,神经网络包括输入层(数据呈现到该输入层);一个或多个内部和/或“隐藏”层;以及输出 层。神经元可以通过具有权重的连接与其他层中的神经元连接,该权重是控制连接强度的 参数。每层中的神经元数量可以与要解决的问题的复杂性有关。层中所需的最小神经元数 量可以由问题复杂性确定,并且最大数量可以受神经网络的概括能力限制。输入神经元可 以接收呈现的数据,然后通过连接的权重将该数据传输到第一隐藏层,该连接的权重在训 练期间被修改。第一隐藏层可以处理数据并通过第二组加权连接将其结果传输到下一层。 每个后续层可以将来自先前层的结果“汇集”成更复杂的关系。此外,虽然传统软件程序需 要编写特定指令来执行功能,但神经网络是通过使用已知样本集对它们进行训练并允许它 们在训练期间(和训练之后)自我修改以提供所需的输出(诸如输出值)来编程的。在训练 后,当向神经网络呈现新的输入数据时,它被配置为概括在训练期间“学到”的内容,并将从训练中学到的内容应用于新的以前未见过的输入数据,以便生成与该输入相关联的输出。 [0073] 在一些实施方式中,神经网络包括人工神经网络(ANN)。ANN可以是机器学习算法, 其可以被训练以将输入数据集映射到输出数据集,其中ANN包括组织成多层节点的互连节 点组。例如,ANN架构可以至少包括输入层、一个或多个隐藏层,以及输出层。ANN可以包括任何总数量的层和任何数量的隐藏层,其中隐藏层用作可训练的特征提取器,该特征提取器 允许将输入数据集映射到输出值或输出值集。如本文所用,深度学习算法(诸如深度神经网 络(DNN))是包括多个隐藏层(例如两个或更多个隐藏层)的ANN。神经网络的每一层可以包 括多个节点(或“神经元”)。节点接收直接来自输入数据或先前层中的节点的输出的输入, 并执行特定操作,例如求和操作。从输入到节点的连接与权重(或加权因子)相关联。节点可 以将所有输入对及其相关联权重的乘积相加。加权和可以用偏差来抵消。节点或神经元的 输出可以使用阈值或激活函数进行门控。激活函数可以是线性或非线性函数。激活函数可 以是,例如,整流线性单元(ReLU)激活函数、Leaky ReLU激活函数或其他函数,诸如饱和双 曲正切函数、恒等函数、二进制阶跃函数、逻辑函数、反正切函数、软符号函数、参数整流线性单元函数、指数线性单元函数、softplus函数、弯曲恒等函数、软指数函数、正弦函数、 sinc函数、高斯函数或sigmoid函数,或其任何组合。 [0074] 神经网络的权重因子、偏差值和阈值或其他计算参数可以在训练阶段使用一个或 多个训练数据集进行“教导”或“学习”。例如,可以使用来自训练数据集的输入数据和梯度下降或反向传播方法来训练参数,以便ANN计算的输出值与训练数据集中包含的示例一致。 [0075] ANN或DNN的输入层中使用的节点的数量可以为至少约10、50、100、200、300、400、 500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20, 000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000或更多。在其他情况下,输入层中使用的节点的数量可以为至多约100,000、90,000、80,000、70,000、60,000、 50,000、40,000、30,000、20,000、10,000、9000、8000、7000、6000、5000、4000、3000、2000、 1000、900、800、700、600、500、400、300、200、100、50、10或更少。在一些情况下,ANN或DNN中使用的层(包括输入层和输出层)的总数量可以为至少约3、4、5、10、15、20或更多。在其他情况下,层的总数量可以为至多约20、15、10、5、4、3或更少。 [0076] 在一些情况下,ANN或DNN中使用的可学习或可训练参数(例如,加权因子、偏差或 阈值)的总数量可以为至少约10、50、100、200、300、400、500、600、700、800、900、1000、2000、 3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、 70,000、80,000、90,000、100,000或更多。在其他情况下,可学习参数的数量可以为至多约 100,000、90,000、80,000、70,000、60,000、50,000、40,000、30,000、20,000、10,000、9000、 8000、7000、6000、5000、4000、3000、2000、1000、900、800、700、600、500、400、300、200、100、 50、10或更少。 [0077] 在本文所述的机器学习算法的一些实施方式中,机器学习算法包括神经网络,诸 如深度CNN。在其中使用CNN的一些实施方式中,网络由任何数量的卷积层、扩张层或全连接 层构成。在一些实施方式中,卷积层的数量在1‑10之间,并且扩张层的数量在0‑10之间。卷积层(包括输入层和输出层)的总数量可以为至少约1、2、3、4、5、10、15、20或更多,并且扩张层的总数量可以为至少约1、2、3、4、5、10、15、20或更多。卷积层的总数量可以为至多约20、 15、10、5、4、3或更少,并且扩张层的总数量可以为至多约20、15、10、5、4、3或更少。在一些实施方式中,卷积层的数量在1‑10之间,并且全连接层的数量在0‑10之间。卷积层(包括输入层和输出层)的总数量可以为至少约1、2、3、4、5、10、15、20或更多,并且全连接层的总数量可以为至少约1、2、3、4、5、10、15、20或更多。卷积层的总数量可以为至多约20、15、10、5、4、 3、2、1或更少,并且全连接层的总数量可以为至多约20、15、10、5、4、3、2、1或更少。 [0078] 在一些实施方式中,机器学习算法包括神经网络,该神经网络包括CNN、RNN、扩张 CNN、全连接神经网络、深度生成模型和/或深度受限玻尔兹曼机。 [0079] 在一些实施方式中,机器学习算法包括一个或多个CNN。CNN可以是深度和前馈 ANN。CNN可以适用于分析视觉图像。CNN可以包括输入、输出层和多个隐藏层。CNN的隐藏层 可以包括卷积层、池化层、全连接层和归一化层。这些层可以按3个维度(宽度、高度和深度)来组织。 [0080] 卷积层可以对输入应用卷积运算,并将卷积运算的结果传递到下一层。对于处理 图像,卷积运算可以减少自由参数的数量,从而使网络在参数更少的情况下变得更深。在神 经网络中,每个神经元可以从前一层中的一定数量的位置接收输入。在卷积层中,神经元可 以仅从前一层的受限子区域接收输入。卷积层的参数可以包括一组可学习的过滤器(或内 核)。可学习的过滤器可以具有较小的接受场并延伸穿过输入体积的整个深度。在前向传递 期间,每个过滤器可以跨输入体积的宽度和高度进行卷积,计算过滤器条目和输入之间的 点积,并产生该过滤器的二维激活图。因此,网络可以学习当它在输入中的某个空间位置检 测到某些特定类型的特征时激活的过滤器。 [0081] 在一些实施方式中,池化层包括全局池化层。全局池化层可以将一层的神经元簇 的输出组合到下一层中的单个神经元中。例如,最大池化层可以使用来自前一层中的每个 神经元簇的最大值;并且平均池化层可以使用前一层的每个神经元簇的平均值。 [0082] 在一些实施方式中,全连接层将一层中的每个神经元连接到另一层中的每个神经 元。在神经网络中,每个神经元可以从前一层中的一定数量的位置接收输入。在全连接层 中,每个神经元可以从前一层的每个元素接收输入。 [0083] 在一些实施方式中,归一化层是批量归一化层。批量归一化层可以提高神经网络 的性能和稳定性。批量归一化层可以为神经网络中的任何层提供均值/单位方差为零的输 入。使用批量归一化层的优点可以包括更快的经过训练的网络、更高的学习率、更容易初始 化权重、更多可行的激活函数以及更简单的创建深度网络的过程。 [0084] 经过训练的算法可以被配置为接受多个输入变量并基于多个输入变量产生一个 或多个输出值。多个输入变量可以包括指示癌症相关类别的一个或多个数据集。例如,输入 变量可以包括对象的活检样本的显微镜检查图像。多个输入变量还可以包括对象的临床健 康数据。 [0085] 经过训练的算法可以包括分类器,使得一个或多个输出值中的每一个包括固定数 量的可能值中的一个(例如,线性分类器、逻辑回归分类器等),该可能值指示由分类器进行 的对生物样本和/或对象的分类。经过训练的算法可以包括二进制分类器,使得一个或多个 输出值中的每一个包括两个值(例如,{0,1}、{阳性,阴性},或{高风险,低风险})中的一个,该两个值指示由分类器进行的对生物样本和/或对象的分类。经过训练的算法可以是另一 种类型的分类器,使得一个或多个输出值中的每一个包括多于两个值(例如,{0,1,2}、{阳性,阴性或不确定},或{高风险,中等风险,或低风险})中的一个,该两个值指示由分类器进行的对生物样本和/或对象的分类。输出值可以包括描述性标签、数值或其组合。一些输出 值可以包括描述性标签。此类描述性标签可以提供对象的疾病或病症状态的识别或指示, 并且可以包括例如阳性、阴性、高风险、中等风险、低风险或不确定。此类描述性标签可以提供针对对象的癌症相关类别的治疗的识别,并且可以包括例如治疗干预、治疗干预的持续 时间和/或适合治疗被分类为特定癌症相关类别的对象的治疗干预的剂量。 [0086] 一些输出值可以包括数值,诸如二进制值、整数值或连续值。此类二进制输出值可 以包括例如{0,1}、{阳性,阴性}或{高风险,低风险}。此类整数输出值可以包括例如{0,1, 2}。此类连续输出值可以包括例如至少为0且不大于1的概率值。此类连续输出值可以包括 例如至少为0的非归一化概率值。此类连续输出值可以指示对象的癌症相关类别的预后。一 些数值可以映射到描述性标签,例如通过将1映射到“阳性”并将0映射到“阴性”。 [0087] 一些输出值可以基于一个或多个截止值来分配。例如,如果样本指示对象具有至 少50%的概率患有癌症相关状态(例如,癌症的类型或阶段)或属于癌症相关类别,则样本 的二进制分类可以分配输出值“阳性”或1。例如,如果样本指示对象具有小于50%的概率属于癌症相关类别,则样本的二进制分类可以分配输出值“阴性”或0。在这种情况下,使用单个截止值50%以将样本分类为两个可能的二进制输出值中的一个。单个截止值的示例可以 包括约1%、约2%、约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约 45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约 92%、约93%、约94%、约95%、约96%、约97%、约98%和约99%。 [0088] 作为另一个示例,如果样本指示对象至少约50%、至少约55%、至少约60%、至少 约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的属于癌症相关类别(例如,癌症诊断或预后),则样本的分类可以分配输出 值“阳性”或1。如果样本指示对象属于癌症相关类别(例如,长期结果)的概率大于约50%、大于约55%、大于约60%、大于约65%、大于约70%、大于约75%、大于约80%、大于约85%、大于约90%、大于约91%、大于约92%、大于约93%、大于约94%、大于约95%、大于约96%、大于约97%、大于约98%或大于约99%,则样本的分类可以分配输出值“阳性”或1。 [0089] 如果样本指示对象患有癌症相关状态或属于癌症相关类别(例如,针对前列腺癌 为阳性)的概率小于约50%、小于约45%、小于约40%、小于约35%、小于约30%、小于约 25%、小于约20%、小于约15%、小于约10%、小于约9%、小于约8%、小于约7%、小于约 6%、小于约5%、小于约4%、小于约3%、小于约2%或小于约1%,则样本的分类可以分配输出值“阴性”或0。如果样本指示对象患有癌症相关状态(例如,针对前列腺癌)的概率不大于约50%、不大于约45%、不大于约40%、不大于约35%、不大于约30%、不大于约25%、不大于约20%、不大于约15%、不大于约10%、不大于约9%、不大于约8%、不大于约7%、不大于约6%、不大于约5%、不大于约4%、不大于约3%、不大于约2%或不大于约1%,则样本的分类可以分配输出值“阴性”或0。 [0090] 如果样本未被分类为“阳性”、“阴性”、1或0,则样本的分类可以分配输出值“不确定”或2。在这种情况下,使用两个截止值集将样本分类为三个可能的输出值中的一个。截止值集的示例可以包括{1%,99%}、{2%,98%}、{5%,95%}、{10%,90%}、{15%,85%}、{20%,80%}、{25%,75%}、{30%,70%}、{35%,65%}、{40%,60%}和{45%,55%}。类似地,可以使用n个截止值集将样本分类为n+1个可能的输出值中的一个,其中n是任何正整 数。 [0091] 经过训练的算法可以用多个独立训练样本进行训练。每个独立训练样本可以包括 来自对象的生物样本、通过测定生物样本获得的相关联的数据集(如本文其他地方所述)、 来自对象的临床数据以及对应于生物样本和/或对象的一个或多个已知输出值(例如,对象 的癌症相关状态的临床诊断、预后、不存在或治疗效果)。独立训练样本可以包括从多个不 同对象获得或得到的生物样本以及相关联的数据集和输出。独立训练样本可以包括从同一 对象在多个不同时间点(例如,定期,诸如每周、每两周、每月、每年等)获得的生物样本以及相关联的数据集和输出。独立训练样本可以与癌症相关状态的存在相关联(例如,训练样本 包括从已知具有癌症相关状态的多个对象获得或得到的生物样本以及相关联的数据集和 输出)。独立训练样本可以与癌症相关状态的不存在有关联(例如,训练样本包括从已知没 有先前诊断出癌症相关状态或已收到癌症相关状态的阴性检测结果的多个对象获得或得 到的生物样本以及相关联的数据集和输出)。 [0092] 经过训练的算法可以使用至少约5、至少约10、至少约15、至少约20、至少约25、至 少约30、至少约35、至少约40、至少约45、至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400、至少约450或至少约500个独立训练样本进行训 练。独立训练样本可以包括与癌症相关类别的存在相关联的无细胞生物样本和临床数据 和/或与癌症相关类别的不存在相关联的无细胞生物样本和临床数据。经过训练的算法可 以使用不大于约500、不大于约450、不大于约400、不大于约350、不大于约300、不大于约 250、不大于约200、不大于约150、不大于约100或不大于约50个与癌症相关类别的存在相关 联的独立训练样本进行训练。在一些实施方式中,生物样本和/或临床数据独立于用于训练 经过训练的算法的样本。 [0093] 经过训练的算法可以使用第一数量的与癌症相关类别的存在相关联的独立训练 样本和第二数量的与癌症相关类别的不存在相关联的独立训练样本进行训练。第一数量的 与癌症相关类别的存在相关联的独立训练样本可以不大于第二数量的与癌症相关类别的 不存在相关联的独立训练样本。第一数量的与癌症相关类别的存在相关联的独立训练样本 可以等于第二数量的与癌症相关类别的不存在相关联的独立训练样本。第一数量的与癌症 相关类别的存在相关联的独立训练样本可以大于第二数量的与癌症相关类别的不存在相 关联的独立训练样本。 [0094] 可以使用各种损失函数来训练算法。在一些实施方式中,算法可以包括回归损失 函数。在一些实施方式中,算法可以包括逻辑损失函数。在一些实施方式中,算法可以包括 交叉熵损失函数。在一些实施方式中,算法可以包括(例如,负)对数似然损失函数。在一些 实施方式中,算法可以包括负偏对数似然损失。在一些实施方式中,算法可以包括变分损 失。在一些实施方式中,损失函数可以被公式化以优化回归损失、基于证据的下限、最大似 然、Kullback‑Leibler散度,应用了各种分布函数,诸如高斯函数、非高斯函数、高斯函数的混合分布、逻辑函数的混合分布等。 [0095] 在一些实施方式中,以多任务方式训练本文所述的算法。在这种情况下,可以训练 算法以同时执行多个学习任务。在示例中,训练算法以执行第一分类任务(例如,将对象数 据与癌症相关类别相关联)。进一步训练算法以执行第二任务,该第二任务包括将对象数据 与第二癌症相关类别相关联。在一些情况下,进一步训练算法以计算第一分类和第二分类 的似然之间的增量或偏差。第一分类和第二分类可以对应于本文所述的任何癌症相关类 别。第一分类和第二分类可以基于相同的对象数据。替代地,它们可以基于不同的或经过转 换的对象数据。在示例中,第一分类基于与对象接受的一种或多种治疗干预相关联的事实 数据,而第二分类基于与对象可以接受的一种或多种治疗干预相关联的反事实数据。 [0096] 各种优化器可以用于训练神经网络。在一些实施方式中,神经网络可以用Adam优 化器进行训练。在一些实施方式中,神经网络可以用随机梯度下降优化器进行训练。在一些 实施方式中,神经网络可以用主动学习算法进行训练。神经网络可以用各种损失函数进行 训练,可以计算所述各种损失函数的导数以更新神经网络的一个或多个参数。神经网络可 以用超参数搜索算法进行训练。在一些实施方式中,神经网络超参数用高斯过程进行优化。 [0097] 经过训练的算法可以被配置为对于至少约5、至少约10、至少约15、至少约20、至少 约25、至少约30、至少约35、至少约40、至少约45、至少约50、至少约100、至少约150、至少约 200、至少约250、至少约300、至少约350、至少约400、至少约450或至少约500个独立训练样本以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约 80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约 87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约 94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的准确度来识别癌症相关类别。由经过训练的算法来识别癌症相关类别的准确度可以计算为被正确识别 或分类为属于或不属于癌症相关类别的独立测试样本(例如,已知属于癌症相关类别的对 象或具有癌症相关类别的阴性临床测试结果的对象)的百分比。 [0098] 经过训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约 20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约 60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约 83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约 97%、至少约98%、至少约99%或更大的阳性预测值(PPV)来识别癌症相关类别。使用经过 训练的算法来识别癌症相关类别的PPV可以计算为被识别或分类为具有癌症相关类别的无 细胞生物样本的百分比,该无细胞生物样本对应于真正属于癌症相关类别的对象。 [0099] 经过训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约 20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约 60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约 83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约 97%、至少约98%、至少约99%或更大的阴性预测值(NPV)来识别癌症相关类别。使用经过 训练的算法来识别癌症相关类别的NPV可以计算为被识别或分类为不具有癌症相关类别的 对象数据集的百分比,该对象数据集对应于真正不属于癌症相关类别的对象。 [0100] 经过训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约 20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约 60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约 83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约 97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约 99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更高的临床灵敏度来识别癌症相关类别。使用经过训练的算 法来识别癌症相关类别的临床灵敏度可以计算为与癌症相关类别相关联的独立测试样本 (例如,已知属于癌症相关类别的对象)的百分比,该独立测试样本被正确识别或分类为具 有癌症相关类别。 [0101] 经过训练的算法可以被配置为以至少约5%、至少约10%、至少约15%、至少约 20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约 60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约 83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约 90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约 97%、至少约98%、至少约99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约 99.4%、至少约99.5%、至少约99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更高的临床特异性来识别癌症相关类别。使用经过训练的算 法来识别癌症相关类别的临床特异性可以计算为与癌症相关类别的不存在相关联的独立 测试样本(例如,具有癌症相关类别的阴性临床测试结果的对象)的百分比,该独立测试样 本被正确识别或分类为不属于癌症相关类别。 [0102] 经过训练的算法可以被配置为以至少约0.50、至少约0.55、至少约0.60、至少约 0.65、至少约0.70、至少约0.75、至少约0.80、至少约0.81、至少约0.82、至少约0.83、至少约 0.84、至少约0.85、至少约0.86、至少约0.87、至少约0.88、至少约0.89、至少约0.90、至少约 0.91、至少约0.92、至少约0.93、至少约0.94、至少约0.95、至少约0.96、至少约0.97、至少约 0.98、至少约0.99或更大的曲线下面积(AUC)来识别癌症相关类别。AUC可以计算为在将源 自对象的数据集分类为属于或不属于癌症相关类别时与经过训练的算法相关联的接收者 操作特征(ROC)曲线(例如,ROC曲线下面积)的积分。 [0103] 可以调整或调节经过训练的算法,以提高识别癌症相关类别的性能、准确度、PPV、 NPV、临床灵敏度、临床特异性或AUC中的一个或多个。可以通过调整经过训练的算法的参数 (例如,用于对生物样本进行分类的截止值集,如本文其他地方所述,或神经网络的权重)来 调整或调节经过训练的算法。可以在训练过程期间或在训练过程完成后连续调整或调节经 过训练的算法。 [0104] 在对经过训练的算法进行初始训练后,可以将输入子集识别为最有影响力或最重 要的子集,以将其纳入以用于高质量分类。例如,可以将临床数据子集识别为最有影响力或 最重要的子集,以将其纳入以用于高质量分类或识别癌症相关类别(或癌症相关类别的子 类型)。可以基于分类指标对临床数据或其子集进行排序,该分类指标指示每个参数对高质 量分类或识别癌症相关类别(或癌症相关类别的子类型)的影响或重要性。在一些实施方式 中,可以使用此类指标来显著减少可以用于将经过训练的算法训练到所需性能水平(例如 基于所需最小准确度、PPV、NPV、临床敏感性、临床特异性、AUC或其组合)的输入变量(例如预测变量)的数量。例如,如果使用包括几十或几百个输入变量的多个输入变量对经过训练 的算法进行训练导致分类准确度大于99%,则改为仅使用在多个输入变量中不大于约5、不 大于约10、不大于约15、不大于约20、不大于约25、不大于约30、不大于约35、不大于约40、不大于约45、不大于约50或不大于约100个此类最有影响力或最重要的输入变量的选定子集 对经过训练的算法进行训练可以产生降低的但仍然可以接受的分类准确度(例如,至少约 50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约 81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约 88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约 95%、至少约96%、至少约97%、至少约98%或至少约99%)。可以通过对全部多个输入变量进行排序并以最佳分类指标选择预定数量(例如,不大于约5个、不大于约10个、不大于约15 个、不大于约20个、不大于约25个、不大于约30个、不大于约35个、不大于约40个、不大于约 45个、不大于约50个或不大于约100个)的输入变量来选择该子集。 [0105] 本文所述的系统和方法可以使用多于经过训练的算法来确定输出(例如,对象的 癌症相关类别)。系统和方法可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、 19、20或更多种经过训练的算法。多种经过训练的算法中的一种经过训练的算法可以在特 定类型的数据(例如,图像数据或表格数据)上进行训练。替代地,经过训练的算法可以在多 于一种类型的数据上进行训练。一种经过训练的算法的输入可以包括一种或多种其他经过 训练的算法的输出。此外,经过训练的算法可以接收一种或多种经过训练的算法的输出作 为其输入。 [0106] 识别或监测癌症相关类别或状态 [0107] 在使用经过训练的算法处理数据集后,可以在对象中识别或监测癌症相关类别。 识别可以至少部分基于生物样本(例如,活检样本的组织病理学切片)的定量或定性测量、 蛋白质组学数据(包括一组癌症相关联蛋白质的数据集的蛋白质的定量测量)和/或代谢组 数据(包括一组癌症相关联代谢物的定量测量)。 [0108] 癌症相关类别可以表征对象的癌症相关状态。以非限制性示例的方式,癌症相关 状态可以包括对象患有或不患有癌症(例如前列腺癌)、对象处于癌症风险中或处于癌症风 险水平(例如高风险、低风险)、癌症的预测长期结果(例如远处转移、生化复发、部分缓解、完全缓解、总体生存期、癌症特异性生存期、无进展生存期、无病生存期、五年生存期、死 亡)、对治疗干预的反应或接受性,或其任何组合。 [0109] 可以以至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约 75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约 86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约 93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或更高的准确度将对象识别为属于癌症相关类别。由经过训练的算法对个体的癌症相关类别进行 识别的准确度可以计算为被正确识别或分类为属于或不属于癌症相关类别的独立测试样 本(例如,已知属于癌症相关类别的对象或具有与癌症相关类别相对应的阴性临床测试结 果的对象)的百分比。 [0110] 可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约 30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约 70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约 85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约 92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约 99%或更大的阳性预测值(PPV)将对象确定为属于癌症相关类别。使用经过训练的算法来 识别癌症相关类别的PPV可以计算为被识别或分类为属于癌症相关类别的生物样本的百分 比,该生物样本对应于真正属于癌症相关类别的对象。 [0111] 可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约 30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约 70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约 85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约 92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约 99%或更大的阴性预测值(NPV)在对象中识别癌症相关类别。使用经过训练的算法来识别 癌症相关类别的NPV可以计算为被识别或分类为不具有癌症相关类别的生物样本的百分 比,该生物样本对应于真正不具有癌症相关类别的对象。 [0112] 可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约 30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约 70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约 85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约 92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约 99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约 99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更高的临床灵敏度将对象识别为属于癌症相关类别。使用经过训练的算法来识别癌症相关 类别的临床灵敏度可以计算为与属于癌症相关类别相关联的独立测试样本(例如,已知属 于癌症相关类别的对象)的百分比,该独立测试样本被正确识别或分类为属于癌症相关类 别。 [0113] 可以以至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约 30%、至少约35%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约 70%、至少约75%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约 85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约 92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约 99%、至少约99.1%、至少约99.2%、至少约99.3%、至少约99.4%、至少约99.5%、至少约 99.6%、至少约99.7%、至少约99.8%、至少约99.9%、至少约99.99%、至少约99.999%或更高的临床特异性在对象中识别癌症相关类别。使用经过训练的算法来识别癌症相关类别 的临床特异性可以计算为与不属于癌症相关类别相关联的独立测试样本(例如,具有癌症 相关类别的阴性临床测试结果的对象)的百分比,该独立测试样本被正确识别或分类为不 属于癌症相关类别。 [0114] 在对象中识别癌症相关类别后,可以进一步识别癌症相关类别的子类型(例如,从 癌症相关类别的多个子类型中选择)。可以至少部分地基于生物样本(例如,活检样本的组 织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数据集 的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)来确定 癌症相关类别的子类型。例如,可以将对象识别为处于前列腺癌子类型(例如,来自多种前 列腺癌子类型)的风险中。在将对象识别为处于前列腺癌子类型的风险中后,可以至少部分 地基于将对象识别为处于其风险中的前列腺癌子类型来选择针对对象的临床干预。在一些 实施方式中,临床干预选自多种临床干预(例如,临床上被指示为用于不同前列腺癌子类 型)。 [0115] 在将对象识别为属于癌症相关类别后,可以选择性地向对象提供治疗干预(例如, 开具适当的疗程以治疗对象的癌症的类型、子类型或状态)。治疗干预可以包括开具有效剂 量的药物或其他疗法(例如,放射疗法、化学疗法)、手术干预(例如,根治性前列腺切除术)、对癌症相关类别的进一步测试或评估、对癌症相关类别的进一步监测,或其组合。如果对象 目前正在用疗程进行癌症相关类别的治疗,则治疗干预可以包括后续的不同疗程(例如,用 于因当前疗程无效而增加治疗效果)。 [0116] 治疗干预可以包括建议对象进行二次临床测试以确认癌症相关类别的诊断。该二 次临床测试可以包括成像测试、血液测试、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0117] 可以在一段时间内对活检样本的分析(例如,前列腺组织的显微镜检查图像的分 析)、蛋白质组学数据(包括一组癌症相关类别相关联蛋白质的数据集的蛋白质的定量测 量)和/或代谢组数据(包括一组癌症相关类别相关联代谢物的定量测量)进行评估,以监测 患者(例如,患有癌症或有患癌症风险或正在接受癌症治疗的对象)。在这种情况下,患者的 数据集的测量可以在疗程期间变化。例如,由于有效治疗而具有降低的癌症相关类别风险 的患者的数据集的测量可以向健康对象(例如,没有癌症或癌症缓解的对象)的概况或分布 转变。相反,例如,由于无效治疗而具有增加的癌症相关类别风险的患者的数据集的测量可 以向具有更高癌症相关类别风险或更晚期癌症相关类别的对象的概况或分布转变。 [0118] 可以通过监测用于治疗对象的癌症或癌症相关状态的疗程来监测对象的癌症相 关类别。监测可以包括在两个或更多个时间点评估对象的癌症相关类别或状态。评估可以 至少基于在两个或更多个时间点中的每一个时间点确定的生物样本(例如,活检样本的组 织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关蛋白质的数据集的 蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)。 [0119] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数 据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)的 差异可以指示一种或多种临床指征,诸如(i)对象的癌症相关状态的诊断、(ii)对象的癌症 相关状态的预后、(iii)对象的增加的癌症相关状态的风险、(iv)对象的降低的癌症相关状 态的风险、(v)疗程对治疗对象的癌症相关状态的有效性、以及(vi)疗程对治疗对象的癌症 相关状态的无效性。 [0120] 在一些实施方式中,在两个或多个时间点之间确定的生物样本(例如,活检样本的 组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关类别相关联蛋白 质的数据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测 量)的差异可以指示对象的癌症相关状态或类别的诊断。例如,如果在较早时间点未在对象 中检测到癌症相关状态,但在较晚时间点在对象中检测到癌症相关状态,则该差异指示对 象的癌症相关状态的诊断。可以基于对象的癌症相关状态的诊断的这种指示做出临床行动 或决定,诸如,举例而言,为对象开具新的治疗干预。临床行动或决定可以包括建议对象进 行二次临床测试以确认癌症相关类别的诊断。该二次临床测试可以包括成像测试、血液测 试、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0121] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数 据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)的 差异可以指示对象的癌症相关类别的预后。 [0122] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关类别相关联蛋 白质的数据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量 测量)的差异可以指示对象具有增加的癌症相关状态的风险。例如,如果在较早时间点和较 晚时间点两者在对象中均检测到癌症相关状态,并且如果该差异为负差异(例如,生物样本 (例如,活检样本的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相 关类别相关联蛋白质的数据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关 类别相关联代谢物的定量测量)从较早时间点到较晚时间点增加),则该差异可以指示对象 具有增加的癌症相关状态的风险。可以基于增加的癌症相关状态的风险的这种指示做出临 床行动或决定,例如为对象开具新的治疗干预或转换治疗干预(例如,结束当前治疗并开具 新的治疗)。临床行动或决定可以包括建议对象进行二次临床测试以确认癌症相关类别的 风险增加。该二次临床测试可以包括成像测试、血液测试、计算机断层(CT)扫描、磁共振成 像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0123] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数 据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)的 差异可以指示对象具有降低的癌症相关状态的风险。例如,如果在较早时间点和较晚时间 点两者在对象中均检测到癌症相关状态,并且如果差异为正差异(例如,生物样本(例如,活 检样本的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白 质的数据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测 量)从较早时间点到较晚时间点减少),则该差异可以指示对象具有降低的癌症相关状态的 风险。可以基于对象的降低的癌症相关状态的风险的这种指示做出临床行动或决定(例如, 继续或结束当前治疗干预)。临床行动或决定可以包括建议对象进行二次临床测试以确认 癌症相关类别的风险降低。该二次临床测试可以包括成像测试、血液测试、计算机断层(CT) 扫描、磁共振成像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0124] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数 据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)的 差异可以指示疗程对治疗对象的癌症相关状态的有效性。例如,如果在较早时间点在对象 中检测到癌症相关状态,但在较晚时间点未在对象中检测到癌症相关状态,则该差异可以 指示疗程对治疗对象的癌症相关状态的有效性。可以基于疗程对治疗对象的癌症相关状态 的有效性的这种指示做出临床行动或决定,例如继续或结束对对象的当前治疗干预。临床 行动或决定可以包括建议对象进行二次临床测试,以确认疗程对治疗癌症相关类别的有效 性。该二次临床测试可以包括成像测试、血液测试、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0125] 在一些实施方式中,在两个或更多个时间点之间确定的生物样本(例如,活检样本 的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组癌症相关联蛋白质的数 据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联代谢物的定量测量)的 差异可以指示疗程对治疗对象的癌症相关类别的无效性。例如,如果在较早时间点和较晚 时间点两者在对象中均检测到癌症相关状态,并且如果该差异为负差异或零差异(例如,生 物样本(例如,活检样本的组织病理学切片)的定量或定性测量、蛋白质组学数据(包括一组 癌症相关联蛋白质的数据集的蛋白质的定量测量)和/或代谢组数据(包括一组癌症相关联 代谢物的定量测量)从较早时间点到较晚时间点增加或保持在恒定水平),并且如果在较早 时间点指示有效治疗,则该差异可以指示疗程对治疗对象的癌症相关状态的无效性。可以 基于疗程对治疗对象的癌症相关状态的无效性的这种指示做出临床行动或决定,例如,结 束对象的当前治疗干预和/或为对象转换为(例如,开具)不同的新治疗干预。临床行动或决 定可以包括建议对象进行二次临床测试,以确认疗程对治疗癌症相关状态的无效性。该二 次临床测试可以包括成像测试、血液测试、计算机断层(CT)扫描、磁共振成像(MRI)扫描、超声扫描、X射线、正电子发射断层(PET)扫描、PET‑CT扫描、骨扫描、淋巴结活检或其任何组合。 [0126] 预测对治疗干预的反应 [0127] 在使用经过训练的算法处理数据集后,可以在对象中识别或监测癌症相关类别。 识别可以至少部分基于生物样本(例如,活检样本的组织病理学切片)的定量或定性测量、 蛋白质组学数据(包括一组癌症相关联蛋白质的数据集的蛋白质的定量测量)和/或代谢组 数据(包括一组癌症相关联代谢物的定量测量)。在一些情况下,癌症相关类别可以包括预 测的对治疗干预的反应。 [0128] 可以通过处理事实模型中与对象相关联的数据(例如,表格和/或图像数据)来确 定预测的反应。在与对象相关联的事实模型下,数据代表了对象实际接受或未接受的治疗 干预。例如,接受雄激素剥夺疗法(ADT)作为治疗干预(例如,至少部分治疗干预)的患者的 事实模型可以包括对象已经用ADT进行治疗的指示。在另一个示例中,尚未接受ADT作为治 疗干预(例如,至少部分治疗干预)的患者的事实模型可以包括对象尚未接受ADT的指示。除 了在指示与对对象施用的疗法相反的反事实模型下之外,通过再次处理与对象相关联的数 据或其子集,可以进一步确定预测的反应。例如,接受ADT作为治疗干预(例如,至少部分治 疗干预)的患者的反事实模型可以包括对象尚未用ADT进行治疗的指示,而尚未接受ADT作 为治疗干预(例如,至少部分治疗干预)的对象的相应反事实模型可以包括对象确实接受了 ADT的指示。通过处理事实和反事实模型,可以计算出观察到的或预测的治疗干预的益处。 [0129] 根据事实模型和反事实模型预测的预测癌症相关状态(例如,长期结果,诸如远处 转移[DM]或癌症类型特异性死亡率)的可能性的差异可以被描述为增量评分或治疗增量。 [0130] 在一些情况下,本文所述的经过训练的算法可以被配置为通过预测对象的治疗增 量来确定预测的治疗干预的益处。经过训练的算法可以进一步在本文所述的增量损失上进 行训练。增量损失可以表征给定训练对象的预测增量评分和预期增量评分之间的偏差。 [0131] 鉴于它们的治疗类型和长期结果(例如,DM),预期增量评分可以取决于训练对象 的子组。 [0132] 在一些情况下,子组包括未接受治疗干预且未显示癌症相关类别(例如,对DM呈阴 性)的对象。在这种情况下,预期治疗增量为0或接近0,因为对象在不存在治疗干预的情况 下未显示癌症相关类别(例如,对象虽然未接受治疗干预,但未出现如在不存在治疗的情况 下所可能预期的远处转移)。 [0133] 在一些情况下,子组包括未接受治疗干预且显示癌症相关类别(例如,对DM呈阳 性)的对象。在这种情况下,预期治疗增量大于或等于0,因为对象可以从治疗干预中受益 (例如,未接受治疗干预的对象可以从接受治疗干预中受益)。 [0134] 在一些情况下,子组包括接受治疗干预且对癌症相关类别呈阴性的对象。在这种 情况下,预期治疗增量大于0,因为对象在存在治疗干预的情况下对癌症相关类别呈阴性 (例如,接受治疗干预的对象表现出DM减少,表明干预有效)。 [0135] 在一些情况下,子组包括接受治疗干预且对癌症相关类别呈阳性的对象。在这种 情况下,预期治疗增量为0或接近0,因为对象即使在存在治疗干预的情况下也对癌症相关 类别呈阳性(例如,对象虽然接受了治疗干预,但出现DM,表明治疗无效)。在训练期间,当增量评分未落在预期范围内时,模型可能被惩罚。 [0136] 在对算法进行训练之后,经过训练的算法可以用于预测对针对以前未见过的对象 进行的治疗干预的反应。在一些情况下,如果预测对象在存在治疗干预的情况下表现出癌 症相关类别的风险降低,则经过训练的算法可以预测对象对治疗干预表现良好(“阳性”或 “生物标志物阳性”)。如果预测的对象的治疗增量高于截止值,则可以发生将对象分类为生物标志物阳性。截止值可以包括诸如大于约‑0.5、‑0.4、‑0.3、‑0.2、‑0.1、0、0.1、0.2、0.3、 0.4、0.5、0.6、0.7、0.8或0.9的值或者更多值。截止值可以基于对象群体来确定。在示例中,可以基于跨对象群体观察到的治疗增量的分布的百分位数来选择截止值。截止值可以对应 于约第10、第20、第30、第40、第50、第60、第70、第80或第90百分位数或者更多百分位数。截止值可以对应于至少约第10、第20、第30、第40、第50、第60、第70、第80或第90百分位数或者更多百分位数。在一些情况下,截止值可以对应于至多约第90、第80、第70、第60、第50、第 40、第30、第20或第10百分位数或者更少百分位数。在一些情况下,截止值在这些值中的任 何两个值之间。 [0137] 在一些实施方式中,治疗干预可以包括放射疗法(RT)。在一些实施方式中,治疗干 预可以包括化学疗法。在一些实施方式中,治疗干预可以包括外科手术干预。在一些实施方 式中,治疗干预可以包括免疫疗法。在一些实施方式中,治疗干预可以包括激素疗法。在一 些实施方式中,RT可以包括预先指定使用短期雄激素剥夺疗法(ST‑ADT)的RT。在一些实施 方式中,RT可以包括预先指定使用长期ADT(LT‑ADT)的RT。在一些实施方式中,RT可以包括 预先指定使用剂量递增RT(DE‑RT)的RT。在一些实施方式中,外科手术干预可以包括根治性 前列腺切除术(RP)。在一些实施方式中,治疗干预可以包括本文公开的治疗干预的任何组 合。在一些实施方式中,长期结果可以包括远处转移(DM)。在一些实施方式中,长期结果可 以包括生化复发(BR)。在一些实施方式中,长期结果可以包括部分缓解。在一些实施方式 中,长期结果可以包括完全缓解。在一些实施方式中,长期结果可以包括死亡。在一些实施 方式中,长期结果可以包括相对生存期。在一些实施方式中,长期结果可以包括癌症特异性 生存期。在一些实施方式中,癌症特异性生存期可以包括前列腺癌特异性生存期(PCaSS)。 在一些实施方式中,长期结果可以包括无进展生存期。在一些实施方式中,长期结果可以包 括无病生存期。在一些实施方式中,长期结果可以包括五年生存期。在一些实施方式中,长 期结果可以包括总体生存期(OS)。在一些实施方式中,长期结果可以包括本文公开的长期 结果的任何组合。 [0138] 在一些实施方式中,治疗干预包括附加的治疗干预。在示例中,除了放射疗法之 外,治疗干预还包括激素疗法。在一些情况下,激素疗法是雄激素剥夺疗法(ADT)。在一些情况下,ADT是短期ADT(ST‑ADT)。在一些情况下,ADT是长期ADT(LT‑ADT)。 [0139] 在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下表现出DM的风 险降低,则对象可以呈“生物标志物阳性”。在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下表现出BR的风险降低,则对象可以呈生物标志物阳性。在一些实施方式 中,如果预测对象在用治疗干预进行治疗的情况下表现出癌症类型特异性死亡率(诸如前 列腺癌特异性死亡率)的风险降低,则对象可以呈生物标志物阳性。在一些实施方式中,如 果预测对象在用治疗干预进行治疗的情况下表现出死亡的风险降低,则对象可以呈生物标 志物阳性。在一些实施方式中,如果预测对象表现出部分缓解的可能性增加,则对象可以呈 生物标志物阳性。在一些实施方式中,如果预测对象表现出完全缓解的可能性增加,则对象 可以呈生物标志物阳性。在一些实施方式中,如果预测对象表现出总体生存期的可能性增 加,则对象可以呈生物标志物阳性。在一些实施方式中,如果预测对象表现出五年生存期的 可能性增加,则对象可以呈生物标志物阳性。在一些实施方式中,如果预测对象表现出十年 生存期的可能性增加,则对象可以呈生物标志物阳性。在一些实施方式中,如果预测对象表 现出十五年生存期的可能性增加,则对象可以呈生物标志物阳性。 [0140] 在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下不会表现出DM 的风险下降(例如,无变化或风险增加),则对象可以呈“生物标志物阴性”。在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下不会表现出BR的风险降低,则对象可以 呈生物标志物阴性。在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下不 会表现出癌症类型特异性死亡率(诸如前列腺癌特异性死亡率)的风险降低,则对象可以呈 生物标志物阴性。在一些实施方式中,如果预测对象在用治疗干预进行治疗的情况下不会 表现出死亡的风险降低,则对象可以呈生物标志物阴性。在一些实施方式中,如果预测对象 不会表现出部分缓解的可能性增加,则对象可以呈生物标志物阴性。在一些实施方式中,如 果预测对象表现出完全缓解的可能性增加,则对象可以呈生物标志物阴性。在一些实施方 式中,如果预测对象不会表现出总体生存期的可能性增加,则对象可以呈生物标志物阴性。 在一些实施方式中,如果预测对象不会表现出五年生存期的可能性增加,则对象可以呈生 物标志物阴性。在一些实施方式中,如果预测对象不会表现出十年生存期的可能性增加,则 对象可以呈生物标志物阴性。在一些实施方式中,如果预测对象不会表现出十五年生存期 的可能性增加,则对象可以呈生物标志物阴性。 [0141] 输出癌症相关状态的报告 [0142] 在对象中识别癌症相关状态或监测到癌症相关状态风险增加后,可以以电子方式 输出指示(例如,识别或提供指示)对象的癌症相关状态的报告。对象可以不显示癌症相关 状态(例如,没有癌症相关状态(诸如前列腺癌的存在或风险)的症状)。该报告可以呈现在 用户的电子设备的图形用户界面(GUI)上。用户可以是对象、看护者、医生、护士或另一医疗保健工作者。 [0143] 该报告可以包括一个或多个临床指征,诸如(i)对象的癌症相关状态的诊断、(ii) 对象的癌症相关类别的预后、(iii)对象的增加的癌症相关类别的风险、(iv)对象的降低的 癌症相关类别的风险、(v)疗程对治疗对象的癌症相关类别的有效性、(vi)疗程对治疗对象 的癌症相关类别的无效性、以及(vii)癌症相关类别的长期结果。该报告可以包括基于这些 一个或多个临床指征做出的一个或多个临床行动或决定。此类临床行动或决定可以针对治 疗干预或对对象的癌症相关状态的进一步临床评估或测试。 [0144] 例如,对象的癌症相关状态的诊断的临床指征可以伴随为对象开具新的治疗干预 的临床行动。作为另一个示例,对象的增加的癌症相关状态的风险的临床指征可以伴随为 对象开具新的治疗干预或转换治疗干预(例如,结束当前治疗并开具新的治疗)的临床行 动。作为另一个示例,对象的降低的癌症相关状态的风险的临床指征可以伴随为对象继续 或结束当前治疗干预的临床行动。作为另一个示例,疗程对治疗对象的癌症相关状态的有 效性的临床指征可以伴随为对象继续或结束当前治疗干预的临床行动。作为另一个示例, 疗程对治疗对象的癌症相关状态的无效性的临床指征可以伴随为对象结束当前治疗干预 和/或转换为(例如,开具)不同的新治疗干预的临床行动。 [0145] 计算机系统 [0146] 本公开提供了被编程以实现本公开的方法的计算机系统。图1示出了计算机系统 101,其被编程或以其他方式被配置以例如(i)训练和测试经过训练的算法,(ii)使用经过 训练的算法处理图像和/或表格数据以确定对象的癌症相关类别或癌症相关状态,(iii)基 于分类的类别评估对象的癌症,(iv)识别或监测对象的癌症相关类别或状态,并且(v)以电 子方式输出指示对象的癌症相关类别或状态的报告。 [0147] 计算机系统101可以调节本公开的分析、计算和生成的各个方面,诸如,举例而言, (i)训练和测试经过训练的算法,(ii)使用经过训练的算法处理图像和/或表格数据以确定 对象的癌症相关类别或癌症相关状态,(iii)基于分类的类别评估对象的癌症,(iv)识别或 监测对象的癌症相关类别或状态,以及(v)以电子方式输出指示对象的癌症相关类别或状 态的报告。计算机系统101可以是用户的电子设备或者相对于电子设备位于远程的计算机 系统。电子设备可以是移动电子设备。 [0148] 计算机系统101包括中央处理单元(CPU,本文中也称为“处理器”和“计算机处理 器”)105,其可以是单核或多核处理器或者用于并行处理的多个处理器。计算机系统101还 包括存储器或存储器位置110(例如,随机存取存储器、只读存储器、闪速存储器)、电子存储单元115(例如,硬盘)、用于与一个或多个其他系统进行通信的通信接口120(例如,网络适 配器)以及外围设备125(诸如高速缓存、其他存储器、数据储存和/或电子显示适配器)。存 储器110、存储单元115、接口120和外围设备125通过诸如主板等通信总线(实线)与CPU 105 通信。存储单元115可以是用于存储数据的数据存储单元(或数据存储库)。计算机系统101 可以借助于通信接口120可操作地耦合至计算机网络(“网络”)130。网络130可以是因特网、互联网和/或外联网,或者与因特网进行通信的内联网和/或外联网。 [0149] 在一些实施方式中,网络130是电信和/或数据网络。网络130可以包括一个或多个 计算机服务器,该一个或多个计算机服务器可以支持诸如云计算等分布式计算。例如,一个 或多个计算机服务器可以支持网络130(“云”)上的云计算,以执行本公开的分析、计算和生成的各个方面,诸如,举例而言,(i)训练和测试经过训练的算法,(ii)使用经过训练的算法处理数据以确定对象的癌症相关类别,(iii)确定指示对象的癌症相关类别的定量测量, (iv)识别或监测对象的癌症相关类别,以及(v)以电子方式输出指示对象的癌症相关类别 的报告。这种云计算可以由云计算平台(诸如,举例而言,Amazon Web Services(AWS)、 Microsoft Azure、Google Cloud Platform和IBM cloud)提供。在一些实施方式中,网络 130借助于计算机系统101可以实现对等网络,该对等网络可以使得耦合至计算机系统101 的设备能够充当客户端或服务器。 [0150] CPU 105可以包括一个或多个计算机处理器和/或一个或多个图形处理单元 (GPU)。CPU 105可以执行可以在程序或软件中体现的机器可读指令序列。指令可以存储在 诸如存储器110等存储器位置中。可以将指令引导至CPU 105,该指令随后可以对CPU 105进 行编程或以其他方式对CPU 105进行配置以实现本公开的方法。由CPU 105执行的操作的示 例可以包括取指、解码、执行和写回。 [0151] CPU 105可以是诸如集成电路等电路的一部分。可以将系统101的一个或多个其他 组件包括在该电路中。在一些情况下,电路是应用专用集成电路(ASIC)。 [0152] 存储单元115可以存储诸如驱动程序、库和保存的程序等文件。存储单元115可以 存储用户数据,例如用户偏好和用户程序。在一些实施方式中,计算机系统101可以包括一 个或多个附加数据存储单元,该一个或多个附加数据存储单元对于计算机系统101是外部 的,诸如位于通过内联网或因特网与计算机系统101进行通信的远程服务器上。 [0153] 计算机系统101可以通过网络130与一个或多个远程计算机系统通信。例如,计算 机系统101可以与用户的远程计算机系统通信。远程计算机系统的示例包括个人计算机(例 如,便携式PC)、平板计算机或平板PC(例如, iPad、 Galaxy Tab)、电 话、智能电话(例如, iPhone、支持Android的设备、 )或个人数字 助理。用户可以经由网络130访问计算机系统101。 [0154] 可以通过存储在计算机系统101的电子存储位置上(诸如,举例而言,存储器110或 电子存储单元115上)的机器(例如,计算机处理器)可执行代码来实现如本文描述的方法。 机器可执行代码或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器 105执行。在一些实施方式中,代码可以从存储单元115中检索并且存储在存储器110上以供 处理器105随时访问。在一些情况下,可以不包括电子存储单元115,并且将机器可执行指令 存储在存储器110上。 [0155] 代码可以被预编译并配置用于由具有适于执行代码的处理器的机器使用,或者可 以在运行期间被编译。代码可以用编程语言提供,可以选择该编程语言以使代码能够以预 编译或即时编译(as‑compiled)的方式执行。 [0156] 本文提供的系统和方法的实施方式,诸如计算机系统101,可以体现在编程中。该 技术的各个方面可以被认为是“产品”或“制品”,其一般为在一种类型的机器可读介质上携带或体现的机器(或处理器)可执行代码和/或相关数据的形式。机器可执行代码可以存储 在电子存储单元,诸如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。 “存储”型介质可以包括计算机的任何或全部有形存储器、处理器等,或其相关联模块,诸如各种半导体存储器、磁带驱动器或磁盘驱动器,其可以在任何时间为软件编程提供非暂时 性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。例如,这样 的通信可以使软件能够从一台计算机或处理器加载到另一台计算机或处理器中,例如从管 理服务器或主机加载到应用服务器的计算机平台中。因此,可以承载软件元素的另一类型 的介质包括光波、电波和电磁波,诸如跨本地设备之间的物理接口、通过有线和光学陆线网 络以及通过各种空中链路而使用的。携载此类波的物理元件,诸如有线或无线链路、光学链 路等,也可以被视为承载软件的介质。如本文所用,除非仅限于非暂时性有形的“存储”介 质,否则诸如计算机或机器“可读介质”等术语是指参与向处理器提供指令以供执行的任何 介质。 [0157] 因此,诸如计算机可执行代码等机器可读介质可采取多种形式,包括有形存储介 质、载波介质或物理传输介质。非易失性存储介质包括,例如,光盘或磁盘,诸如任何计算机中的任何存储设备等,诸如可用于实现如附图中所示的数据库等。易失性存储介质包括动 态存储器,诸如这样的计算机平台的主存储器。有形传输介质包括同轴缆线、铜线和光纤, 包括构成计算机系统内的总线的线。载波传输介质可以采取电信号或电磁信号或者声波或 光波的形式,诸如在射频(RF)和红外(IR)数据通信期间产生的那些。因此,计算机可读介质 的常见形式包括例如:软盘、柔性盘、硬盘、磁带、任何其他磁性介质、CD‑ROM、DVD或DVD‑ROM、任何其他光学介质、穿孔卡片纸带、任何其他具有孔洞图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH‑EPROM、任何其他存储器芯片或匣盒、传输数据或指令的载波、传输此类载波的电缆或链路,或者计算机可以从中读取编程代码和/或数据的任何其他介质。这些 形式的计算机可读介质中的许多介质可以参与将一个或多个指令的一个或多个序列携载 到处理器以供执行。 [0158] 计算机系统101可以包括电子显示器135或与电子显示器135通信,电子显示器135 包括用户界面(UI)140,用于提供例如(i)指示经过训练的算法的训练和测试的视觉显示、 (ii)指示对象的癌症相关类别的数据的视觉显示、(iii)对象的癌症相关类别的定量测量、 (iv)对对象具有癌症相关类别的识别,或(v)指示对象的癌症相关类别的电子报告。UI的示 例包括但不限于图形用户界面(GUI)和基于网页的用户界面。 [0159] 本公开的方法和系统可以通过一种或多种算法来实现。算法可以在由中央处理单 元205执行时通过软件来实现。该算法可以例如(i)训练和测试经过训练的算法,(ii)使用 经过训练的算法处理图像和/或表格数据以确定对象的癌症相关类别或癌症相关状态, (iii)基于分类的类别评估对象的癌症,(iv)识别或监测对象的癌症相关类别或状态,并且 (v)以电子方式输出指示对象的癌症相关类别或状态的报告。 [0160] 实施例 [0161] 实施例1:通过多模态深度学习实现的前列腺癌疗法个性化 [0162] 本文公开的方法和系统通过使用在前列腺活检的数字组织病理学和临床数据上 训练的新型多模态深度学习模型来预测长期临床相关结果(远处转移、生化复发、前列腺癌 引起的死亡和总体生存期),证明了前列腺癌疗法个性化。本公开的示例系统包括经过训练 的算法,该经过训练的算法使用在数百个临床站点上运行的五个III期随机多国试验的数 据集进行训练和验证。7,957个患者中的5,654个患者(71.1%)可获得临床和组织病理学数 据,其产生了16.1太字节的组织病理学图像,其中对患者进行了10‑20年的随访。与最常用 的风险分层工具(美国国家癌症中心网络(NCCN)风险组)相比,深度学习模型在所有测试结 果中均具有出色的预后和判别性能。这种人工智能系统可以允许肿瘤学家对任何特定患者 的最可能结果进行计算建模,从而确定其最佳治疗。只要配备有数字组织病理学扫描仪和 互联网接入,任何诊所都可以提供此类功能,从而能够以低成本普遍取得重要疗法个性化。 [0163] NCCN风险组基于国际风险分层标准,其在20世纪90年代末制定并且称为D’Amico 风险组。该系统基于直肠指检、血清前列腺特异性抗原(PSA)测量和通过组织病理学评估的 肿瘤等级。这个三层系统继续形成世界各地治疗建议的支柱,但在对患者进行风险分层方 面具有次优的预后和判别性能。这部分地是由于这些模型中核心变量的高度主观和非特异 性性质。例如,Gleason分级是在20世纪60年代制定的,并且仍然具有高度的主观性,即使在专业的泌尿病理学家之中,观察者之间的可重复性也不可接受。最近,基于组织的基因组生 物标志物已显示出改进的预后性能。然而,几乎所有这些测试在预期使用人群的前瞻性随 机临床试验中都缺乏验证,并且由于成本和处理时间的原因,国际上几乎没有采用。因此, 对于改进的用于使前列腺癌的疗法个性化的工具,仍然存在严重的未满足临床需求。 [0164] 从医生级诊断到工作流程优化,人工智能(AI)已在医学的许多应用案例中展现了 非凡的能力,并且随着数字组织病理学在临床上的持续采用,人工智能有潜力支持癌症疗 法。AI已开始在基于组织病理学的预后方面取得进展,例如通过预测短期患者结果或通过 提高基于Gleason的癌症分级对术后手术样本的准确性。虽然标准风险分层工具是固定的, 并且基于少数变量,但AI可以从跨各种模态的大量经过最低限度处理的数据中学习。与基 因组生物标志物相比,AI系统成本低、可扩展性强,并且通过使用逐步改进。此外,任何生物标志物的一个关键挑战是拥有最佳数据来训练和验证相关终点,并且肿瘤学中的一些商业 预后生物标志物可能已经在回顾性便利采样上进行了训练。 [0165] 本文公开的方法和系统可以包括多模态人工智能(MMAI)系统,该系统可以有效克 服局限性前列腺癌中结果预后的未满足需求,从而创建具有全球采用潜力的可推广生物标 志物。使用五个III期随机临床试验的预后生物标志物局限性前列腺癌用于通过利用对数 字组织病理学的多模态深度学习来训练本文所述的算法。 [0166] 从对患有局限性前列腺癌的男性进行的五个大型多国随机III期临床试验(NRG/ RTOG 9202、9408、9413、9910和0126)中生成了独特数据集。所有患者均接受了确定性放射 疗法(RT),其中预先指定使用短期雄激素剥夺疗法(ST‑ADT)、长期ADT(LT‑ADT)和/或剂量 递增RT(DE‑RT)(图9)。在这五个试验中招募的7,957个患者中,有7,752个患者具有完整的 基线临床数据,并且有5,654个患者具有完整的基线和数字组织病理学数据。这代表了来自 16,204个治疗前活检样本的组织病理学切片的16.1TB的组织病理学图像。 [0167] MMAI架构可以获取表格(临床)数据和基于图像(组织病理学)的数据两者,使其特 别适合随机临床试验数据。完整的架构显示在图2A中。数据集中的每个患者都由临床变量 (包括实验室和病理学数据、治疗干预和长期结果)和数字化组织病理学切片(中位数为3.5 个切片)表示。跨两个数据流的联合学习很复杂,并且涉及构建三个独立的深度学习管道— 一个用于图像,一个用于表格数据,第三个用于将它们联合起来。为了一致性,跨试验对数 据进行了标准化。 [0168] 从数量变化的数字化组织病理学切片中有效地学习相关特征涉及几个预处理步 骤来标准化图像,然后进行自监督训练。对于每个患者,其活检切片中的所有组织部分都被 分割出来并组合成跨所有患者宽度和高度固定的单个大的图像,称为图像绗缝(图5)。将H ×W网格覆盖在图像绗缝上,该网格将图像绗缝跨其RGB通道切割成大小为256×256像素的 块。然后使用这些块来训练自监督(SSL)模型以学习对下游AI任务有用的组织病理学特征。 图2B显示了管道的这一部分。一旦训练完成,SSL模型就可以获得图像绗缝的块并为每个块 输出128维向量表示。将所有这些向量以与原始块相同的空间方向拼接起来,产生H×W× 128的张量(特征绗缝),其将最初巨大的图像绗缝压缩为对进一步的下游学习有用的紧凑 的表示。 [0169] SSL是一种可以用于从无注释数据集中学习的方法。典型的ML设置利用监督学习, 其中数据集由数据点(例如图像)和数据标签(例如目标类)组成。相反,在SSL期间,合成的 数据标签从原始数据中提取并用于训练可用于下游任务的通用特征表示。动量对比(一种 获得一组图像块,生成每个块的增强副本,然后训练模型以预测任何两个增强副本是否来 自同一原始块的技术)可以有效地学习医疗任务的特征。结构设置显示在图2B中,其中进一 步的细节在本文其他地方描述。 [0170] 为了将SSL过程引导至可能更有临床用途的块区域,基于核密度对数据集中的块 进行了过采样。使用经过训练以检测核的目标检测模型,可以近似计算每个块中的核数量。 基于此计数将块分成十分位数,并对每个十分位数进行过采样,使得在一个训练时期期间 看到的图像的净数量对于每个十分位数都是相同的。示例图像显示在图6中。 [0171] 本文所述的系统可以从患者级别的注释中学习,而组织病理学切片未被注释。此 外,图像模型的自我监督学习允许其从新的图像数据中学习,而无需任何注释。 [0172] 从表格数据中学习包括两个步骤。首先,跨试验对临床数据进行标准化,并将临床 数据用于通过屏蔽部分数据并训练模型以学习它们,经由自我监督预先训练TabNet架构。 然后,将每个患者的数据通过TabNet馈入以提取特征向量,然后将其与图像管道的输出拼 接起来。然后将拼接的向量通过进一步的神经层馈入,并且模型为当前任务输出二进制结 果。 [0173] SSL模型的内部数据表示显示在图4中。将整个数据集的图像块通过SSL模型馈入, 并为每个块提取模型特征(由模型输出的128维向量)。然后将均匀流形近似和投影算法 (UMAP)应用于这些特征,将它们从128维投影到2维,并将每个块绘制为单独的点。相邻的数 据点表示模型认为相似的图像块。UMAP将特征向量分组为25个簇,其中一些簇以各种颜色 显示。插图显示了在特征空间中靠近簇质心的示例图像块。然后由病理学家解释距离簇质 心最近的20个图像块。示例解释显示在图4中,并且完整解释显示在图7中。尽管从未使用临 床注释进行过训练,但是SSL模型还是学习了人类可解释的图像特征,这些特征指示癌症的 复杂方面,诸如Gleason等级或组织类型。 [0174] 跨四个终点(DM、BCR、PCaSS、OS)和两个时间范围(5年和10年)对六种不同的MMAI 模型进行了训练和测试。考虑到竞争事件,这些模型的性能使用灵敏度和特异性的时间依 赖性接受者操作特性曲线下的面积(AUC)来测量。灵敏度被定义为正确的阳性预测与显示 的阳性事件之比(灵敏度=预测的阳性/阳性的数量),并且特异性被定义为正确的阴性预 测与显示的阴性事件之比(特异性=预测的阴性/阴性的数量)。对于这个指标,0.5表示随 机机会准确度,并且1.0表示完美准确度。 [0175] NCCN模型用作基线比较器,如图8所示。使用三个变量(Gleason评分、肿瘤t阶段和 基线PSA)将患者分组为低风险组、中等风险组和高风险组。 [0176] 结果显示在图3A‑图3H中。针对每个结果和时间点训练了单独的模型。在图3A和图 2D‑图2H中,蓝色条表示在特定任务上训练的MMAI模型的性能,并且灰色条表示相应的NCCN 模型的性能。图2B显示了跨结果和跨来自五次试验的测试集的子集,MMAI相对于NCCN的相 对改进。MMAI模型跨所有测试结果始终优于NCCN模型。AUC的相对改进从11.45%到19.72% 不等。此外,试验子集一致显示出相对于NCCN具有相对改进。 [0177] 为了评估特定于MMAI模型的各种数据组件的效果,进行了消融研究。使用以下数 据设置训练了附加MMAI模型:仅NCCN变量、仅病理学图像、病理学图像+NCCN变量(组合 Gleason评分、t阶段、基线PSA)以及病理学图像+NCCN变量+模型中使用的3个附加变量(年 龄、Gleason原发性、Gleason继发性)。每个附加的数据组件都提高了性能,其中完整设置 (病理学、6个临床变量)产生最佳结果(图2C)。 [0178] 在预测患者的四个关键未来结果(远处转移、生化复发、前列腺癌特异性生存期和 总体生存期)方面,MMAI系统基本上优于编码为模型的NCCN风险分层工具。通过创建同时从 患者获取多种(大小可变的)数据类型以及临床数据的深度学习架构,构建了深度学习系 统,该系统能够推断患者的长期结果,其准确度基本上高于已确立的临床模型。 [0179] 本文描述的方法和系统可以利用来自五个不同的前瞻性的、随机的、多国的试验 的稳健和大规模临床数据,这些试验对跨不同人群的5,654个患者进行了10‑20年的患者随 访。这些预后分类器在大量临床试验数据上的验证(在预期的使用人群中)独特地将这些工 具定位为治疗决策的辅助工具。类似的基于基因组学的测定的关键缺陷是其成本高且周转 时间长;AI工具没有这些限制,这基本上降低了大规模国际采用的障碍。世界上近60%的人 可以访问互联网,但只有约4%(美国人口)可以轻松获得基于基因组学的测定。数字组织病 理学的日益普及,加上互联网连接,可以支持基于AI的预后和预测测试的全球分布,从而能 够以低成本获得关键疗法个性化。 [0180] 方法 [0181] 表格管道。表格临床数据分为数值变量和分类变量。数值变量被白化(均值减法+ 最大归一化)到范围[‑1,1]。分类变量被视为独热向量,该独热向量按照传统的词到向量技 0.56 术嵌入到2‑3维向量中,其维数由公式D=Round(1.6·num_categories )给出。使用将分 类变量和数值变量拼接作为输入的TabNet模型(参数:学习率0.2,具有步进学习率调度器 的Adam优化器,批处理大小为1024,最大50个时期,早期停止耐心为10个时期)。 [0182] 图像管道。ResNet50模型与MoCo‑v2训练协议(参数:学习率=0.03,具有余弦学习 率调度,moco‑t=0.2,多层感知头,批处理大小为256,MoCo‑v2数据增强,200个时期)一起用于训练图2B的系统架构中使用的SSL模型。对于图3A中的每个保持的测试集,仅使用训练 数据的图像来预训练相应的SSL模型。使用本文其他地方描述的核密度采样对某些图像块 进行过采样。一旦完成SSL预训练,所有W×H块就都被馈入到SSL预训练的ResNet50模型中, 以为每个图像绗缝生成W×H×128特征绗缝。用于预测的最终图像模型是具有批标准化和 丢弃的2层CNN模型,该2层CNN模型将特征张量作为输入。最终的CNN模型以32的批处理大 小、150个最大时期以及具有0.01的学习率和步进学习率调度器的Adam优化器进行训练。 [0183] 下游管道。使用联合融合方法以利用来自两种模态(图像和表格特征)的信息。图 像被特征化为特征张量并被馈入到最终图像模型中以产生特征向量,而表格特征分别被馈 入到TabNet模型中以生成另一个特征向量。两个全连接层处理每个管道的拼接特征向量并 输出预测概率。对于缺少组织病理学数据的患者,在拼接之前将基于图像的特征向量归零。 [0184] 数据集准备。使用了来自五个具有里程碑意义的、大规模的、前瞻性的、随机的国 际临床试验的完整的患者级别的基线临床数据、前列腺活检的数字化组织病理学切片和纵 向结果,这些试验包含5,654个患者、16,204个组织病理学切片和10‑20年的中位数患者随 访。这些试验是RTOG 9202、9408、9910、0126和9413(图2C)。这些试验随机分为放射疗法 (RT)和雄激素剥夺疗法(ADT)的各种组合:RT+短期ADT(RTS)、RT+中期ADT(RTM)、RT+长期 ADT(RTL)以及RT的剂量和体积水平(RT+)。由NRG Oncology在两年的时间段内使用Leica Biosystems Aperio AT2数字病理学扫描仪以20倍分辨率对切片进行了数字化。组织病理 学图像被人工检查以确保质量和清晰度。在模型训练之前,针对每个独特患者,将数字切片 转换为200×200块大小的单个图像绗缝。每个临床试验收集略有不同的临床变量。跨所有 试验可用的六个临床变量(组合Gleason、Gleason原发性、Gleason继发性、t阶段、基线PSA、年龄)以及数字组织病理学用于模型训练和验证。 [0185] 组织分割。在10倍放大下将切片切成256×256像素的块后,通过训练ResNet‑18开 发了伪影分类器,以对块是否显示可用组织或者是否显示空白或伪影进行分类。伪影分类 器被训练了25个时期,使用SGD进行优化,其中学习率为0.001。每7个时期学习率降低10%。 手动注释了3661个块(组织与非组织),并在它们中的3366个块上对分类器进行了训练,在 剩余的295个块上实现了97.6%的验证准确度。然后使用该伪影分类器在图像绗缝形成期 间分割组织部分。 [0186] 核密度采样。由于染色强度和染色降解的显著变化,现成的用于核检测和分割的 预训练模型无法准确检测我们大多数切片中的核。为了解决这个问题,使用YOLOv5 (github.com/ultralytics/yolov5)目标检测方法训练了核检测器。 [0187] 为了训练YOLOv5模型,使用QuPath图像分析平台手动标记了34个精心挑选的切片 的代表性样本。首先,使用“简单组织检测”模块对组织进行分割。接下来,使用“分水岭细胞检测”模块对细胞进行分割,并手动调节每个切片的参数。然后,在来自切片中的29个切片 的注释上训练YOLOv5‑Large模型,并在剩余5个切片上对YOLOv5‑Large模型进行评估。在10倍放大下,使用256×256个块对该模型进行训练。 [0188] 模型性能指标。(AUC)对于每个模型和每个结果,考虑到竞争事件,使用R包 timeROC估计时间依赖性接受者操作特性。这是通过在区间[0,1]内扫描阈值t并将模型的 预测定义为 计算的时间依赖性灵敏度和特异性的曲线,其中P是由模型输出的结果 概率。该曲线下面积定义了模型在当前任务上的性能。 [0189] NCCN模型。使用三个临床变量(Gleason、t阶段和基线PSA)将患者分为低风险组、 中等风险组和高风险组,根据图8中的算法对NCCN模型进行编码。 [0190] 实施例2‑用于前列腺癌治疗的预测性AI生物标志物 [0191] 执行了一项研究,以确定用于除了对放射疗法反应之外,还对雄激素剥夺疗法 (ADT)反应的预测性生物标志物。在这项研究中,对五个具有长期随访的国际III期随机试 验进行了获取、数字化、训练和验证,以预测哪些患有局限性前列腺癌的男性从将ADT添加 到放射疗法中获得更大的益处。 [0192] 方法 [0193] 患者和试验。通过NRG Oncology(由美国国家癌症研究所(NCI)资助的美国国家临 床试验网络(NCTN)小组)批准了预先指定的分析计划。如果试验是随机的III期试验,具有 大于8年的中位数随访,在患有局限性前列腺癌的男性中进行,用具有或没有ADT的放射疗 法进行治疗,并且已将组织病理学切片存储在NRG生物库中,则该试验被包括在内。排除了 测试化学疗法的使用的试验。这识别了五个III期随机试验(NRG/RTOG 9202、9408、9413、 9910和0126)[7‑11]。 [0194] 每个试验的细节可以在表1中找到。简言之,NRG/RTOG 9202招募了患有中等风险 和高风险前列腺癌的男性,并将患者随机进行伴随有4个月和24个月的ADT的放射疗法。 NRG/RTOG 9408招募了患有低风险、中等风险和高风险前列腺癌的男性,并将男性随机进行 伴随有或未伴随有4个月的ADT的放射疗法。NRG/RTOG 9413招募了患有中等风险和高风险 前列腺癌的男性,并且是一个2×2因子试验,随机分为4个月的ADT测序和盆腔淋巴结放射 疗法的使用。NRG/RTOG 9910招募了患有中等风险前列腺癌的男性,并将患者随机进行伴随 有4个月和9个月的ADT的放射疗法。NRG/RTOG 0126将中等风险患者随机单独进行低剂量的 放射疗法和高剂量的放射疗法。包括ADT的使用的试验由使用了LHRH激动剂和抗雄激素的 联合雄激素阻断组成。数据(临床或可用组织病理学切片)缺失的患者被排除在所有分析之 外。 [0195] [0196] [0197] [0198] 在一些方面,该实施例描述了预测性生物标志物的开发和验证,该生物标志物可 以识别从在局限性前列腺癌的放射疗法中添加ADT获得的不同益处。定义益处的一个终点 是远处转移的时间,即从随机化的时间直到远处转移的开发或最后一次随访为止所测量的 时间。附加终点包括前列腺癌特异性死亡率(PCSM)、无转移生存期(MFS)和总体生存期 (OS)。 [0199] 组织病理学管道。在没有访问临床结果数据的情况下,来自NRG Oncology Biospecimen Bank的治疗前活检切片被独立数字化。使用Leica Biosystems Aperio AT2 数字病理学扫描仪以20倍的分辨率对切片进行数字化。手动检查组织病理学图像的质量和 清晰度。 [0200] 数字化的组织病理学图像被发送给一组AI科学家以进行特征提取,并且此时对临 床数据一无所知。对于每个独特的患者,他们所有数字切片上的组织被裁剪出来,并粘贴到 大小为51,200×51,200像素的单个图像绗缝中。图像绗缝被分成256×256像素块,每个图 像绗缝产生200×200块。对YOLOv5目标检测模型进行训练,以识别组织病理学图像中的核, 从而计算每个块的核数量,以进行下游训练。 [0201] 使用自监督学习(SSL)在这些图像块上训练了Resnet‑50目标分类模型[16]。在没 有访问任何临床或结果数据的情况下,采用了MoCo‑v2训练协议[17]。跨训练数据集有超过 600万个组织块通过模型馈入超过100次。对核计数较高的图像块进行过采样,以学习显著 的组织病理学特征,以进行下游预测。 [0202] 模型开发和验证。用于模型开发的训练群组包括来自NRG/RTOG 9910和0126的患 者。由于NRM/RTOG 9910和每个都有助于一种感兴趣的治疗类型(分别为RT+ST‑ADT和仅 RT),因此使用逆治疗概率加权(IPTW)来确保两种治疗类型的患者具有可比的选定基线临 床特征(包括年龄、基线PSA、T阶段、Gleason评分和原发性/继发性模式)。然后,模型开发群组按治疗类型被进一步分层,并随机分为分别用于模型训练和超参数调节的训练集(60%) 和调节集(40%)[18,19]。临床数据、图像数据和治疗类型(rx)被用作多模态预测模型架构 的输入(在图2C中示意性地示出)。 [0203] 临床数据预处理。通过神经网络嵌入层馈入分类临床变量(T阶段、Gleason评分和 原发性/继发性Gleason模式)和二进制治疗类型(对仅放射疗法[RT]来说为0,对伴随有ST‑ ADT的RT来说为1),以生成连续的向量嵌入。分组如下:Gleason总数(≤6、7、8,并且≥9),原发性和继发性Gleason模式(≤3、4和5),T阶段(Tx、T0、T1a、T1b、T1c或T1、T2a、T2b、T2c或T2、T3a、T3b、T3c或T3、T4a、T4b、T4)。基于训练数据的平均值和标准偏差对连续临床变量(年龄、基线PSA)进行标准化。 [0204] 图像特征提取模型开发。对于来自患者组织病理学图像的每个块,使用自监督预 训练的Resnet‑50图像特征提取模型来提取128维特征向量,并基于训练数据的平均值和标 准偏差对128维特征向量进行标准化。来自同一患者的所有块水平的特征向量被堆叠以形 成图像特征张量,该图像特征张量被馈入到下游预测模型。 [0205] 逆概率治疗加权。由于开发集包括两个III期随机试验(NRG/RTOG 9910和0126), 因此使用逆治疗概率加权(IPTW)来确保两种治疗类型的患者具有可比的临床基线特征。使 用具有弹性净惩罚的逻辑回归模型来计算倾向评分,其中治疗类型根据患者的年龄、基线 PSA、Gleason评分、Gleason原发性/继发性模式和T阶段变量进行回归。为了减轻大权重带 来的高可变性,IPTW权重基于第1百分位数和第99百分位数进行修剪。 [0206] 下游预测模型开发 [0207] 下游预测模型将图像特征张量、预处理的临床数据和治疗类型(rx)作为每个患者 的输入(图2C)。采用注意多实例学习网络来学习来自患者的每个块的权重。通过取来自同 一患者的所有块的图像向量的加权和,从每个患者的图像特征张量生成单个128维图像向 量,其中权重由注意机制学习。通过联合融合管道进一步处理该单个128维图像向量、预处 理的临床数据和治疗类型的拼接,以有效地学习受益于将ST‑ADT添加到放射疗法的差异治 疗的预测特征编码。 [0208] 多模态预测模型以多任务方式进行训练。第一任务是使用事实rx预测DM的相对风 险(图2C中的“任务1”)。图像、临床和事实rx向量被拼接,并通过几层全连接神经网络馈入以产生每个患者的连续评分(本文中有时称为“事实模型预测评分”),该连续评分估计DM的 相对风险。负对数偏似然被用作第一任务的训练目标,并且事实模型预测评分是估计的相 对对数危险。 [0209] 负对数偏似然损失由模型权重θ参数化,并且用公式表示如下: [0210] [0211] 其中,值Ti、Ei和xi分别为事件时间或最后一次随访的时间、用于是否观察到事件 的指示变量和第i次观察的模型输入。函数fθ表示多模态模型的事实分支,并且fθ(x)是给定输入x的估计相对风险。值NE=1表示具有可观察事件的患者的数量。具有可观察事件的患者 集表示为Ei=1。风险集 是在时间t时仍面临失败风险的患者集。 Breslow的近似值用于处理绑定事件时间。 [0212] 基于第一任务的估计的相对风险,第二任务是预测增量评分,该增量评分被定义 为事实模型预测评分和反事实模型预测评分的差异(图2C中的“任务2”)。为此,通过切换患者的实际rx(接受伴随有短期ADT的RT的患者的RT,并且反之亦然)创建了反事实rx变量。反 事实rx变量通过相同的rx嵌入层馈入,并且与图像和临床向量拼接。然后,拼接的向量通过 相同的全连接神经网络层馈送,产生另一个连续评分(本文中有时称为“反事实模型预测评 分”)。对于仅接受RT的患者,增量将是事实模型预测评分减去反事实预测评分;而对于接受RT+ST‑ADT治疗的患者,增量将是反事实预测评分减去事实模型预测评分。增量表示每个患 者的治疗益处的大小,其中较大的增量表示来自附加ST‑ADT的益处较大,并且反之亦然。 [0213] 对于该预测任务,设计了增量损失并将其用作训练目标。增量损失表征预测增量 评分和预期增量评分之间的偏差。预期增量评分取决于落入基于其治疗类型和DM结果的以 下四个子组之一中的患者:(a)仅接受RT的无转移的患者的子组A;(b)仅接受RT且具有DM的 患者的子组B;(c)接受伴随有ST‑ADT的RT的无转移的患者的子组C;(d)接受伴随有ST‑ADT 的RT且具有DM的患者的子组D。对于子组A,预期增量接近0,因为患者在仅接受RT治疗时没 有DM,并且附加ST‑ADT不会影响他们的DM的风险;对于子组B,预期增量大于或等于0,因为患者可能从附加ST‑ADT治疗中受益δ;对于子组C,预期增量大于0,因为患者在接受附加ST‑ADT时没有DM;最后,预期子组D的增量接近0,因为即使患者接受了附加ST‑ADT治疗,他们也具有DM。在训练期间,当增量评分未落在上述预期范围内时,模型被惩罚。预测任务的训练 目标是使用softplus函数定义的。 [0214] 在训练期间,对来自预后任务和预测任务的两个损失的加权和进行了近似计算, 并且每个数据点都按其IPTW权重进行了加权。一旦模型经过训练,就在开发集中的增量评 分的第67百分位数选择一个截止值,使得验证集中的所有增量评分大于截止值的患者都被 认为呈生物标志物阳性,其中预测了附加ST‑ADT的益处,并且增量评分小于截止值的那些 患者被认为呈生物标志物阴性。基于调节集上生物标志物阳性子组和生物标志物阴性子组 的IPTW加权危险比的最低比率来选择最终模型。 [0215] 多模态预测模型对ADT益处的大小的差异进行了优化,输出了本文上述的连续评 分增量。开发集中的增量评分的第67百分位数被选为截止阈值,因为它使调节集中的生物 标志物子组治疗效果之间的差异最大化,并将产生合理大小的生物标志物子组,以用于临 床应用。增量评分大于截止值的患者被识别为呈生物标志物阳性,并且反之亦然(图9)。在 生物标志物被锁定后,它被提供给独立的生物统计学家,以在NRG/RTOG 9408中对生物标志 物进行临床验证。 [0216] 统计分析 [0217] 对于分类变量,使用在存在低细胞计数的情况下的卡方测试或Fisher精确测试来 报告和比较由生物标志物状态引起的验证群组特征,并且对于连续变量,使用Wilcoxon秩 和测试来报告和比较由生物标志物状态引起的验证群组特征。使用累积发病率函数分析DM 和PCSM的时间,其中将没有相应事件的死亡作为竞争风险。使用Gray测试比较使用和不使 用ST‑ADT进行治疗的患者的结果[20]。还进行了精细和灰色回归,以估计ST‑ADT治疗效果 的子分布危险比(sHR)和95%置信区间(CI)[21]。进行生物标志物‑治疗相互作用的测试, 以估计该预测性生物标志物。将生物标志物阳性子组和生物标志物阴性子组的治疗效果作 为总体验证群组进行类似的评估,以衡量各组之间的相对治疗效果。鉴于观察到非比例危 险,报告十五年的受限平均生存时间以提供替代估计值[10]。 [0218] 基于NCCN风险分层进行探索性子组分析,并且在NCCN低风险和中等风险患者中重 新分析了初步分析。使用R版本3.5.1(R统计计算基金会,奥地利维也纳)进行统计分析。所 有统计测试均为双侧测试,并且小于0.05的p值被认为在统计学上显著。 [0219] 结果 [0220] 患者特性。在五个III期随机试验所招募的7,752个符合条件的患者中,5,825个 (75.1%)患者在NRG Biospecimen Bank具有可用的治疗前活检组织。在这些患者中,5,727 个(98.3%)符合纳入高质量数字病理学数据的条件。在这些患者中,39个具有TURP样本的 患者被进一步排除在验证群组(NRG/RTOG 9048)之外。 [0221] 下游预测模型的开发群组具有2,024个患者,伴随有10.6年的中位数随访,并且1, 050个(52%)患者仅接受放射疗法,并且974个(48%)患者接受伴随有ST‑ADT的RT(表2)。中 位数PSA为9ng/mL(四分位距[IQR],6‑13),87%患有中等风险疾病,并且中位数年龄为71岁(IQR,65‑74)。验证群组(NRG/RTOG 9408)包括1,594个患者,伴随有14.9年的中位数随访,治疗类型均衡(仅RT=806个患者,并且RT加ST‑ADT=788个患者;图10和表3)。中位数PSA为 8ng/mL(IQR,6‑12),56%患有中等风险疾病,并且中位数年龄为71岁(IQR,66‑74)。治疗类型之间的基线特征没有显著差异,并且NRG/RTOG 9408的可评估群组代表已发布的总体试 验群组(表3)。 [0222] 表2.开发群组的患者基线特征 [0223] [0224] 图例:RT=放射疗法;ADT=雄激素剥夺疗法;IQR=四分位距;PSA=前列腺特异性 抗原;ng/mL=纳克每毫升。 [0225] [0226] [0227] [0228] ST‑ADT预测性生物标志物 [0229] 最终锁定的模型包括来自数字病理学切片的128个图像特征和7个临床变量(包括 年龄、组合Gleason评分、原发性和继发性Gleason、PSA、T阶段以及治疗类型(伴随有或未伴随有ST‑ADT的RT))。治疗类型仅用于模型开发。组织病理学图像特征贡献了近40%的模型 预测(图11)。 [0230] 将锁定预测模型应用于验证集,543个患者(34%)为生物标志物阳性(预测从ST‑ ADT受益最多),并且1051个患者(66%)为生物标志物阴性(预测从ST‑ADT受益很少)。当与 患有生物标志物阴性疾病的患者相比时,患有生物标志物阳性疾病的患者具有Gleason评 分7的可能性较低(24%对30%;p=0.02)(表4)。 [0231] 表4.NRG/RTOG 9408中按生物标志物组划分的患者基线特征。 [0232] [0233] [0234] 在整个验证群组中,ST‑ADT显著延长了DM的时间(sHR 0.64,95%CI[0.45‑0.90],p=0.01;图13)。将锁定的AI衍生生物标志物应用于验证集,生物标志物‑治疗相互作用对 DM的时间有显著影响(p相互作用=0.01;图14)。在患有生物标志物阳性疾病的患者中,与 只有放射疗法相比,ST‑ADT的添加显著降低了DM的风险(sHR 0.34,95%CI[0.19‑0.63],p< 0.001)。相比之下,在生物标志物阴性子组中,各组之间没有显著差异(sHR 0.92,95%CI [0.59‑1.43],p=0.71)。在生物标志物阳性患者中,以在随机化后15年时各治疗组之间DM 风险的差异来衡量的ST‑ADT的绝对益处为10.5%(95%CI 5.4%‑15.5%;图13)。相比之 下,在患有生物标志物阴性疾病的患者中,ADT的添加所引起的15年DM风险降低了0.5% (95%CI‑2.8%‑3.7%)。 [0235] 在探索性子集分析中,当将分析仅限于患有低风险和中等风险疾病的患者时,结 果仍然类似。此外,在该子组的患者中观察到DM的类似生物标志物‑治疗相互作用(p相互作 用=0.009;图15)。 [0236] 还评估了次要终点PCSM(图14和图15)。在整个验证群组中,ST‑ADT显著延长了事 件的发生时间(sHR 0.52,95%CI[0.35‑0.78],p=0.001;图15)。与只有放射疗法相比,患有生物标志物阳性疾病的接受ST‑ADT的患者在PCSM方面具有显著的改善(sHR 0.28,95% CI 0.14‑0.57,p<0.001)。相比之下,尽管与生物标志物阳性组相比,生物标志物阴性组大得多,且具有更多的事件,但与只有RT相比,附加的ADT在PCSM方面没有显著改善,sHR 0.74,95%CI 0.45‑1.22,p=0.24。 [0237] AI在肿瘤学中的使用可能仍处于其起步阶段,临床部署有限。在五个III期随机试 验中使用新颖的深度学习方法并利用来自超过5,000多个患者的图像数据,我们成功地训 练和验证了一种预测性生物标志物,以指导在用放射疗法治疗局限性前列腺癌的男性中使 用ADT。这些发现代表了前列腺癌中的长期寻求的里程碑,并且可以用于快速推进这种常见 疾病的精准医疗。 [0238] 在癌症类型中,组织病理学信息可以主要用于诊断和肿瘤分级的目的。在前列腺 癌中,Gleason分级可能具有适度的预后,并且尚未显示用作用于ADT使用的预测性生物标 志物[22]。因此,已经创建了大量基于组织的基因表达、血清和成像生物标志物,以期望满 足这一未满足的需求[12]。虽然一些已证明在风险分层和预后方面有所改善[23],但没有 一个用随机试验验证来显示用作预测性生物标志物。 [0239] 随着患者预后恶化(例如,从NCCN低风险变为高风险),将ADT添加到放射疗法的建 议变强烈。尽管有证据表明NCCN风险组不能预测ADT的益处[5]。在这一点上,该实施例证 明,生物标志物阳性患者和生物标志物阴性患者具有类似的基线PSA、T阶段和NCCN风险组 分布,且Gleason分级差异小。这强化了这样的观点,即肿瘤侵袭性的历史测量似乎与患者 从ADT中获得的不同相对益处相关性最小。 [0240] 尽管Gleason分级有局限性,但组织病理学图像可能具有重要价值。组织病理学图 像中的信息丰富,远远超出了目前的五个等级组。然而,为了利用该信息,本实施例证明,AI可以用于从数字病理学中解锁该大量可量化的数据,而不会将模型仅限于已建立的人类可 解释特征。 [0241] 一般来说,模型可能遇到过拟合和验证失败的可能性的挑战。因此,可能需要独立 验证来证实生物标志物的性能。在预测性生物标志物(其目的是提供关于哪些患者获得更 大或更小的相对益处的信息)的特定情况下,这可以在感兴趣的治疗的随机试验的背景下 进行,以避免各组之间的混淆和偏见。在本文中选择了NRG/RTOG 9408,因为它仍然是已发 布的最大的伴随有或未伴随有ST‑ADT的放射疗法试验,其中进行了非常长期的随访。虽然 在该试验中,ADT对未经选择的患者有明显的益处,但大多数被招募的患者没有可论证的益 处。结果表明,超过60%的在NRG/RTOG 9408中招募的中等风险患者可以避免不必要的用 ADT进行的治疗,并因此避免与ADT相关联的发病率和成本。 [0242] 精心选择DM的时间的主要终点来训练ST‑ADT预测性生物标志物。其他终点(诸如 生物化学复发、无转移生存期(MFS)和OS)都具有临床相关性,但在局限性前列腺癌的背景 下,生物标志物的开发具有显著的局限性。ADT抑制PSA的产生,并因此无论子组如何,ADT都有望延缓生化复发。此外,大多数生化复发事件不会导致转移或死亡[22]。因此,对于生物 标志物训练来说,确定来自ADT的内在肿瘤特异性益处可能是不太理想的终点。 [0243] MFS和OS是用于确定给定疗法净效应的重要终点,并且是临床试验设计的黄金标 准。然而,它们可能是用于开发前列腺癌特异性生物标志物的次优终点。这是因为验证群组 中78%的死亡并非来自前列腺癌,并且MFS终点中只有12%的事件来自转移事件。因此,MFS 和OS的最强预测模型实际上可能是由与非前列腺癌原因(例如,并发症)引起的死亡相关联 的变量驱动的。重要的是,尽管针对DM训练了生物标志物,但它显示了由生物标志物状态 (癌症驱动的终点)引起的ADT对PCSM的明显差异影响。 [0244] 与任何模型一样,通用性可能至关重要。源自数量有限的中心的AI模型和多样性 有限的群组可能会面临挑战。相比之下,NRG/RTOG从主要来自美国和加拿大的学术、社区和 退伍军人事务中心的超过500个中心招募患者,并且很好地体现了少数族裔(验证集中20% 的患者是非裔美国人)。这种重要的现实世界多样性增强了本实施例的结果的通用性。 [0245] 与积极临床使用中的预后和预测性生物标志物类似,本文(例如,在该实施例中) 所述的ST‑ADT预测性生物标志物可以作为从头开始的前瞻性生物标志物专用试验的一部 分进行开发和验证。该方法得到了Simon等人的支持,并且使用伴随有或未伴随有ADT的放 射疗法的随机试验增强了我们工作的可信度和证据水平[24]。在该试验的实施和随访期 间,实际上没有使用先进的分子成像。由于Gleason分级系统的变化而导致的阶段迁移也可 能影响患者在NCCN风险组中的分层。然而,由此引入的任何潜在偏差都可能是随机的且对 两个组都有影响,并且模型的大部分是由原始组织病理学图像驱动的且可能不会受到分级 定义随时间变化的影响。关于其他预后临床病理变量的信息(诸如百分比Gleason模式4或 百分比阳性活检核)不可用。因此,没有进行探索性分析的替代风险分类方案[25,26]。 [0246] 该实施例描述了在III期随机试验中成功开发并独立验证的预测性生物标志物, 以使用新颖的基于AI衍生的数字病理学平台来指导ADT与放射疗法一起在局限性前列腺癌 中使用。使用该生物标志物,大多数患者可能已经安全地避免了与不必要的ADT治疗相关联 的发病率和经济毒性。 [0247] 参考文献。 [0248] 1.Jones,C.U.等人,Adding Short‑Term Androgen Deprivation Therapy to Radiation Therapy in Men With Localized Prostate Cancer:Long‑Term Update of the NRG/RTOG 9408Randomized Clinical Trial,Int.J.Radiat.Oncol.Biol.Phys. (2021)doi:10.1016/j.ijrobp.2021.08.031,其通过引用整体并入本文。 [0249] 2.Pilepich,M.V.等人,Androgen suppression adjuvant to definitive radiotherapy in prostate carcinoma‑‑long‑term results of phase III RTOG 85‑ 31,Int.J.Radiat.Oncol.Biol.Phys.61,1285–1290(2005),其通过引用整体并入本文。 [0250] 3.D’Amico,A.V.、Chen,M.‑H.、Renshaw,A.、Loffredo,M.和Kantoff,P.W.,Long‑term Follow‑up of a Randomized Trial of Radiation With or Without Androgen Deprivation Therapy for Localized Prostate Cancer,JAMA vol.314 1291(2015),其 通过引用整体并入本文。 [0251] 4.Bolla,M.等人,Short Androgen Suppression and Radiation Dose Escalation in Prostate Cancer:12‑Year Results of EORTC Trial 22991in Patients With Localized Intermediate‑Risk Disease,J.Clin.Oncol.39,3022–3033(2021),其通过引用整体并入本文。 [0252] 5.Kishan,A.U.等人,Androgen deprivation therapy use and duration with definitive radiotherapy for localised prostate cancer:an individual patient data meta‑analysis,Lancet Oncol.23,(2022),其通过引用整体并入本文。 [0253] 6.Nguyen,P.L.等人,Adverse effects of androgen deprivation therapy and strategies to mitigate them,Eur.Urol.67,825–836(2015),其通过引用整体并入本文。 [0254] 7.Horwitz,E.M.等人,Ten‑year follow‑up of radiation therapy oncology group protocol 92‑02:a phase III trial of the duration of elective androgen deprivation in locally advanced prostate cancer,J.Clin.Oncol.26,2497–2504 (2008),其通过引用整体并入本文。 [0255] 8.Roach,M.,3rd等人,Phase III trial comparing whole‑pelvic versus prostate‑only radiotherapy and neoadjuvant versus adjuvant combined androgen suppression:Radiation Therapy Oncology Group 9413,J.Clin.Oncol.21,1904–1911 (2003),其通过引用整体并入本文。 [0256] 9.Pisansky,T.M.等人,Duration of androgen suppression before radiotherapy for localized prostate cancer:radiation therapy oncology group randomized clinical trial 9910,J.Clin.Oncol.33,332–339(2015),其通过引用整体并 入本文。 [0257] 10.Jones,C.U.等人,Adding Short‑Term Androgen Deprivation Therapy to Radiation Therapy in Men With Localized Prostate Cancer:Long‑Term Update of the NRG/RTOG 9408Randomized Clinical Trial,Int.J.Radiat.Oncol.Biol.Phys. (2021)doi:10.1016/j.ijrobp.2021.08.031,其通过引用整体并入本文。 [0258] 11.Michalski,J.M.等人,Effect of Standard vs Dose‑Escalated Radiation Therapy for Patients With Intermediate‑Risk Prostate Cancer,JAMA Oncology vol.4e180039(2018),其通过引用整体并入本文。 [0259] 12.Schaeffer,E.等人,NCCN Guidelines Insights:Prostate Cancer,Version 1.2021:Featured Updates to the NCCN Guidelines,J.Natl.Compr.Canc.Netw.19,134– 143(2021),其通过引用整体并入本文。 [0260] 13.Tolkach,Y.、 T.、Toma,M.和Kristiansen,G,High‑accuracy prostate cancer pathology using deep learning,Nature Machine Intelligence 2, 411–418(2020),其通过引用整体并入本文。 [0261] 14.Nagpal,K.等人,Development and Validation of a Deep Learning Algorithm for Gleason Grading ofProstate Cancer From Biopsy Specimens,JAMA Oncol 6,1372–1380(2020),其通过引用整体并入本文。 [0262] 15.Pantanowitz,L.等人,An artificial intelligence algorithm for prostate cancer diagnosis in whole slide images of core needle biopsies:a blinded clinical validation and deployment study,Lancet Digit Health 2,e407– e416(2020),其通过引用整体并入本文。 [0263] 16.He,Kaiming等人,Deep Residual Learning for Image Recognition, 2016IEEE Conference on Computer Vision and Pattern Recognition(CVPR),June 27‑ 30,2016,ieeexplore.ieee.org/document/7780459,其通过引用整体并入本文。 [0264] 17.Chen,X.、Fan,H.、Girshick,R.和He,K.,Improved Baselines with Momentum Contrastive Learning.(2020),其通过引用整体并入本文。 [0265] 18.Hutter,F.、Kotthoff,L.和Vanschoren,J.,Automated Machine Learning: Methods,Systems,Challenges.(Springer,2019),其通过引用整体并入本文。 [0266] 19.Claesen,M.和De Moor,B.,Hyperparameter Search in Machine Learning. (2015)doi:10.48550/arXiv.1502.02127,其通过引用整体并入本文。 [0267] 20.Gray,R.J.,A Class of K‑Sample Tests for Comparing the Cumulative Incidence of a Competing Risk,Ann.Stat.16,1141–1154(1988),其通过引用整体并入 本文。 [0268] 21.Fine,J.P.和Gray,R.J.,A Proportional Hazards Model for the Subdistribution of a Competing Risk,J.Am.Stat.Assoc.94,496–509(1999),其通过引 用整体并入本文。 [0269] 22.Jones,C.U.等人,Radiotherapy and short‑term androgen deprivation for localized prostate cancer,N.Engl.J.Med.365,(2011),其通过引用整体并入本文。 [0270] 23.Spratt,D.E.等人,Development and Validation of a Novel Integrated Clinical‑Genomic Risk Group Classification for Localized Prostate Cancer, J.Clin.Oncol.(2017)doi:10.1200/JCO.2017.74.2940,其通过引用整体并入本文。 [0271] 24.Simon,R.M.、Paik,S.和Hayes,D.F.,Use of archived specimens in evaluation of prognostic and predictive biomarkers,J.Natl.Cancer Inst.101, 1446–1452(2009),其通过引用整体并入本文。 [0272] 25.Cooperberg,M.R.等人,The UCSF Cancer of the Prostate Risk Assessment(CAPRA)Score:a straightforward and reliable preoperative predictor of disease recurrence after radical prostatectomy,J.Urol.173,1938(2005),其通 过引用整体并入本文。 [0273] 26.A New Risk Classification System for Therapeutic Decision Making with Intermediate‑risk Prostate Cancer Patients Undergoing Dose‑escalated External‑beam Radiation Therapy,Eur.Urol.64,895–902(2013),其通过引用整体并入 本文。 [0274] 27.Ilse,M.、Tomczak,J.和Welling,M.,Attention‑based Deep Multiple Instance Learning,in Proceedings of the 35th International Conference on Machine Learning(eds.Dy,J.&Krause,A.)vol.80 2127–2136(PMLR,10‑‑15Jul 2018),其通过引用整体并入本文。 [0275] 28.Austin,P.C.和Stuart,E.A.,Moving towards best practice when using inverse probability of treatment weighting(IPTW)using the propensity score to estimate causal treatment effects in observational studies,Stat.Med.34,3661– 3679(2015),其通过引用整体并入本文。 [0276] 29.Cole,S.R.和Hernán,M.A.,Constructing Inverse Probability Weights for Marginal Structural Models,Am.J.Epidemiol.168,656–664(2008),其通过引用整 体并入本文。 [0277] 30.Lee,B.K.、Lessler,J.和Stuart,E.A.,Weight Trimming and Propensity Score Weighting,PLoS One 6,e18174(2011),其通过引用整体并入本文。 [0278] 31.Katzman,J.L.等人,DeepSurv:personalized treatment recommender system using a Cox proportional hazards deep neural network,BMC Med.Res.Methodol.18,1–12(2018),其通过引用整体并入本文。 [0279] 32.Breslow,N.,Covariance analysis of censored survival data, Biometrics 30,89–99(1974),其通过引用整体并入本文。 [0280] 33.Leen,T.K.、Dietterich,T.G.和Tresp,V.,Advances in Neural Information Processing Systems 13:Proceedings of the 2000Conference.(MIT Press,2001),其通 过引用整体并入本文。 [0281] 34.Shapley,L.S.17,A Value for n‑Person Games,in Contributions to the Theory of Games(AM‑28),Volume II(eds.Kuhn,H.W.&Tucker,A.W.)307–318(Princeton University Press,1953),其通过引用整体并入本文。 [0282] 虽然本文已展示和描述了本发明的优选实施方式,但对于本领域技术人员来说将 明显的是,这些实施方式仅以示例的方式提供。本发明不旨在受到说明书中提供的具体示 例的限制。虽然本发明已参考上述说明书进行了描述,但本文对实施方式的描述和说明并 不意味着以限制的意义来解释。在不背离本发明的情况下,本领域技术人员现在将想到许 多变化、改变和替换。此外,应理解,本发明的所有方面不限于本文所阐述的取决于各种条 件和变量的特定描述、配置或相对比例。应理解,在实践本发明时,可以采用本文所述的本 发明实施方式的各种替代方案。因此,设想了本发明还应涵盖任何此类替代方案、修改、变 化或等效方案。所附权利要求旨在限定本发明的范围,并由此涵盖这些权利要求的范围内 的方法和结构及其等同物。