技术领域
[0001] 本发明涉及生物细胞技术领域,尤其涉及一种评估B细胞对胰腺癌患者预后产生影响的方法及系统。
相关背景技术
[0002] 近年来,逐渐开始探索B细胞对不同肿瘤患者预后产生的影响。在针对胰腺癌患者的研究中,主要通过使用光学显微镜分析B细胞在三级淋巴结构中的功能显著不同于其在基质微环境中功能,得出研究结论。但所得出的研究结果存在矛盾化,一方面认为:B细胞水平的提高及其聚集体的增加与改善的预后有关,另一方面认为:B细胞的显著存在可能通过促进胰腺癌生长而导致更差的预后效果。因此,现有技术缺乏一种关于B细胞对胰腺癌患者预后产生影响的准确评估方法。
具体实施方式
[0028] 为了更好的理解上述技术方案,下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更清楚、透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
[0029] 实施例一请参照图1至图3,本发明提供评估B细胞对胰腺癌患者预后产生影响的方法,包括步骤:
S1、获取手术切除的预设数量的历史PDAC标本,对所述历史PDAC标本进行预处理,得到预处理后的历史PDAC标本,其中预处理包括全组织切片处理和CD20免疫组化染色处理,通过全组织切片扫描技术对预处理后的历史PDAC标本进行扫描,得到历史PDAC标本全组织切片图像,通过图像分割法对所述历史PDAC标本全组织切片图像进行B细胞识别和提取,得到每一个B细胞及每一个B细胞坐标;
在本实施例中,如图2所示,获取手术切除的预设数量的历史PDAC(Pancreatic Ductal Adenocarcinoma,胰腺导管腺癌)标本和其对应的病例数据。其中预设数量为40‑
80,优选的,预设数量为45。病例数据中包括但不限于:胰腺癌患者年龄、胰腺癌患者性别、PDAC切除手术日期、生命结束日期、是否接受过新辅助治疗、是否接受过放射治疗、PN分期和PT分期。
[0030] 其中,预处理包括全组织切片处理和CD20免疫组化染色处理,历史PDAC标本都经过福尔马林固定并石蜡包埋,在进行全组织切片处理时是按照预设厚度进行全组织切片处理,预设厚度为4微米,即,将历史PDAC标本按照4微米厚度进行全组织切片处理,得到所有的历史PDAC切片,对每一片历史PDAC切片进行H&E染色,得到H&E染色后的历史PDAC切片;从H&E 染色后的历史PDAC切片中筛选出包含肿瘤组织及其周围健康组织的代表性的历史PDAC切片,对筛选出的历史PDAC切片进行CD20免疫组化染色处理,得到CD20免疫组化染色后的历史PDAC切片;通过全组织切片扫描技术对CD20免疫组化染色后的历史PDAC切片进行扫描,得到历史PDAC标本全组织切片图像,通过图像分割对历史PDAC标本全组织切片图像进行B细胞识别和提取。其中B细胞具体指:CD20+ B细胞,得到每一个B细胞及每一个B细胞坐标。
[0031] 此时,步骤S1中获取手术切除的预设数量的历史PDAC标本包括:S11、获取所述历史PDAC标本对应的病例数据,根据所述病例数据判断所述历史PDAC标本中是否存在接受过新辅助治疗或放射治疗的历史PDAC标本,若存在,则将接受过新辅助治疗或放射治疗的历史PDAC标本过滤,得到过滤后的历史PDAC标本。
[0032] 在本实施例中,如图2所示,将接受过新辅助治疗或放射治疗的历史PDAC标本进行过滤,得到过滤后的历史PDAC标本。
[0033] 此时,步骤S11中所述得到过滤后的历史PDAC标本包括:S111、从过滤后的历史PDAC标本对应的病例数据中获取PDAC切除手术日期和生命结束日期,计算所述生命结束日期与所述PDAC切除手术日期的日期差值,判断所述日期差值是否低于日期阈值,若是,则将低于日期阈值的历史PDAC标本删除,得到删除后的历史PDAC标本。
[0034] 在本实施例中,如图2所示,在对过滤后的历史PDAC标本进行预处理之前,会计算生命结束日期与PDAC切除手术日期的日期差值,如果日期差值低于日期阈值,其中日期阈值为31天,即,如果日期差值低于31天,则将对应的历史PDAC标本删除,得到删除后的历史PDAC标本,对删除后的历史PDAC标本进行预处理。其中日期阈值可以根据实际情况进行调整。
[0035] 此时,步骤S1中所述通过图像分割法对所述历史PDAC标本全组织切片图像进行B细胞识别和提取,得到每一个B细胞及每一个B细胞坐标包括:S12、对所述历史PDAC标本全组织切片图像进行预设比例的降采样处理,得到降采样处理后的历史PDAC标本全组织切片图像,将降采样处理后的历史PDAC标本全组织切片图像进行预设分辨率的图像切割,得到预设分辨率的图像块;
在本实施例中,如图2所示,预设比例为四分之一,预设分辨率为400*400像素,即,对历史PDAC标本全组织切片图像进行四分之一的降采样处理,得到降采样处理后的历史PDAC标本全组织切片图像,将降采样处理后的历史PDAC标本全组织切片图像进行400*400像素的图像切割,即,将降采样处理后的历史PDAC标本全组织切片图像切割为分辨率为
400*400像素的图像块,并且在进行图像切割时可以采用Groovy脚本实现。其中预设比例和预设分辨率可以根据实际情况进行调整。
[0036] S13、采用无监督分水岭算法对预设分辨率的图像块进行B细胞识别,得到每一个B细胞,并采用QuPath技术对每一个B细胞的坐标进行提取,得到对应的每一个B细胞坐标。
[0037] 在本实施例中,如图2所示,采用无监督分水岭算法进行B细胞识别,并且在识别过程中,通过设置高阈值去除背景噪声和非特异性免疫染色,以得到每一个B细胞,并采用QuPath技术对每一个B细胞的坐标进行提取,得到每一个B细胞坐标。
[0038] S2、基于所有B细胞坐标生成二维投影图,通过空间分析法将所述二维投影图划分为侵袭前沿区、癌症中心区和癌症岛区,分别计算B细胞在所述侵袭前沿区、所述癌症中心区和所述癌症岛区的占用率和分形维数,得到对应的占用指标和分形指标,同时通过聚类分析法计算B细胞在所述侵袭前沿区、所述癌症中心区和所述癌症岛区的聚类密度和覆盖率,得到对应的聚类指标和覆盖指标;此时,步骤S2中所述基于所有B细胞坐标生成二维投影图,通过空间分析法将所述二维投影图划分为侵袭前沿区、癌症中心区和癌症岛区包括:
S21、基于所有B细胞坐标构成局部坐标系,将所述局部坐标系转换为全局坐标系,基于所述全局坐标系生成二维投影图,在二维投影图的生成过程中,通过ASAP软件对整体组织轮廓、癌组织轮廓以及正常组织轮廓的边界进行标注,得到标注后的二维投影图;
在本实施例中,如图2所示,由于是根据预设分辨率的图像块得到的B细胞坐标,因此所有B细胞坐标所构建的坐标体系为局部坐标系,通过现有的坐标转换算法,将局部坐标系转换为全局坐标系,从而根据全局坐标系生成二维投影图,即,构建B细胞地图,在二维投影图的生成过程中,通过ASAP软件对整体组织轮廓、癌组织轮廓以及正常组织轮廓的边界进行标注,得到标注后的二维投影图。
[0039] S22、根据标注后的二维投影图将癌组织轮廓和正常组织轮廓的边界分别向内和向外扩展第一预设长度距离,得到扩展区域,将所述扩展区域作为侵袭前沿区,将所述癌组织轮廓作为癌症中心区,所述侵袭前沿区与所述癌症中心区组成癌症岛区。
[0040] 在本实施例中,如图2所示,由于组织轮廓是一个闭合的形状,因此,将癌组织轮廓直接作为癌症中心区,并且将癌组织轮廓和正常组织轮廓的边界分别向内和向外扩展第一预设长度距离,以得到扩展区域,将该扩展区域作为侵袭前沿区,其中第一预设长度距离为0.5毫米,癌症岛区包括侵袭前沿区和癌症中心区,即,侵袭前沿区和癌症中心区组成癌症岛区,其中,第一预设长度距离可以根据实际情况进行调整。
[0041] 此时,步骤S2中所述分别计算B细胞在所述侵袭前沿区、所述癌症中心区和所述癌症岛区的占用率和分形维数,得到对应的占用指标和分形指标,同时通过聚类分析法计算B细胞在所述侵袭前沿区、所述癌症中心区和所述癌症岛区的聚类密度和覆盖率,得到对应的聚类指标和覆盖指标包括:S23、分别对所述侵袭前沿区、所述癌症中心区和所述癌症岛区进行最小外接矩形生成处理,得到对应的侵袭前沿外接矩形、癌症中心外接矩形和癌症岛外接矩形;
在本实施例中,如图2所示,借助Python的shapely库分别生成侵袭前沿区、癌症中心区和癌症岛区的最小外接矩形,以得到对应的侵袭前沿外接矩形、癌症中心外接矩形和癌症岛外接矩形。
[0042] S24、分别在所述侵袭前沿外接矩形、所述癌症中心外接矩形和所述癌症岛外接矩形内进行预设尺度的正方形网格划分,得到正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形,其中预设尺度包括第一尺度和第二尺度,第一尺度与第二尺度不相同;在本实施例中,如图2所示,在侵袭前沿外接矩形、癌症中心外接矩形和癌症岛外接矩形内分别进行第一尺度和第二尺度的正方形网格划分,以得到不同尺度的正方形网格划分后的侵袭前沿外接矩形、不同尺度的正方形网格划分后的癌症中心外接矩形和不同尺度的正方形网格划分后的癌症岛外接矩形,其中第一尺度为10‑40微米,第二尺度为200‑
600微米,优先的,第一尺度为40微米,第二尺度为600微米,具体地,第一尺度和第二尺度可以根据实际情况进行调整。
[0043] S25、分别计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形的占用率和分析维数,同时通过聚类分析法计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形的聚类密度和覆盖率,得到对应的聚类指标和覆盖指标。
[0044] 此时,步骤S25包括:S251、通过占用率公式分别计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的占用率,得到对应的占用指标,其中占用率公式为:
[0045] 其中,OR表示占用率, 表示B细胞所占的正方形网格的数量, 表示非B细胞所占的正方形网格的数量;
在本实施例中,如图2所示,通过占用率公式分别计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的占用率,即,占用率是通过计算B细胞所占的正方形网格的数量占总的正方形网格的数量的比例得到,将所得到的占用率作为占用指标。
[0046] S252、通过分形维数公式分别计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的分形维数,得到分形指标,其中分形维数公式为:
[0047] 其中,FD表示分形维数,S表示斜率, 表示所有正方形网格的面积,d=2,表示二维平面,A表示常数;在本实施例中,如图2所示,通过分形维数公式分别计算B细胞在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的分形维数,即,分形维数是通过对B细胞的集合进行最小二乘线性回归拟合,并通过拟合直线的斜率得到,将所得到的分形维数作为分形指标,其中,在分形维数公式中,当不同尺度下的组织轮廓具有相似性时,其B细胞分布遵循幂律公式:
= 。
[0048] S253、采用HDBSCAN聚类算法按照预设最小聚类尺度和预设聚类严格度分别对在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形的B细胞进行聚类,得到对应的聚类簇;在本实施例中,如图2所示,预设最小聚类尺度为30,预设聚类严格度为15,采用HDBSCAN聚类算法按照30的最小聚类尺度和15的聚类严格度对在正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形的B细胞进行聚类,得到对应的聚类簇。
[0049] S254、通过聚类密度公式计算聚类簇在对应的正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的聚类密度,得到聚类指标,其中聚类密度公式为:
[0050] 其中, 聚类簇的数量 ,表示聚类簇所在区的面积;
S255、通过覆盖率公式计算聚类簇在对应的正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的覆盖率,得到覆盖指标,其中覆盖率公式为:
[0051] 其中, 表示覆盖率, 表示聚类簇的面积, 表示聚类簇所在区的面积。
[0052] 在本实施例中,如图2所示,通过聚类密度公式和覆盖率公式分别计算聚类簇在对应的正方形网格划分后的侵袭前沿外接矩形、正方形网格划分后的癌症中心外接矩形和正方形网格划分后的癌症岛外接矩形中的聚类密度和覆盖率,从而得到对应的聚类指标和覆盖率指标。
[0053] S3、获取与所述历史PDAC标本全组织切片图像对应的胰腺癌患者生存周期,采用Kaplan–Meier法将所述胰腺癌患者生存周期与所述占用指标、所述分形指标、所述聚类指标以及所述覆盖指标结合进行生存分析,得到生存分析结果,将所述生存分析结果作为B细胞对胰腺癌患者预后产生影响的结果。
[0054] 在本实施例中,如图2所示,获取与历史PDAC标本全组织切片图像对应的胰腺癌患者生存周期,其中胰腺癌患者生存周期指的是:从初次诊断患有PDAC的诊断日期到因任何原因死亡的死亡日期之间的时间周期,采用Kaplan–Meier法将胰腺癌患者生存周期与占用指标、分形指标、聚类指标和覆盖指标结合进行生存分析,从而得到生存分析结果,将生存分析结果作为B细胞对胰腺癌患者预后产生影响的结果。
[0055] 此时,步骤S3中所述采用Kaplan–Meier法将所述胰腺癌患者生存周期与所述占用指标、所述分形指标、所述聚类指标以及所述覆盖指标结合进行生存分析,得到生存分析结果包括:S31、判断所述胰腺癌患者生存周期是否低于周期阈值,若是,则将所述胰腺癌患者生存周期标记为短期,反之,将所述腺癌患者生存周期标记为长期;
S32、将所有标记为短期的腺癌患者生存周期进行汇总,得到短期生存组,将所有标记为长期的腺癌患者生存周期进行汇总,得到长期生存组;
在本实施例中,如图3所示,周期阈值为24个月,将低于周期阈值的胰腺癌患者生存周期标记为短期,将不低于周期阈值的胰腺癌患者生存周期标记为长期,从而将所有标记为短期的腺癌患者生存周期进行汇总,得到短期生存组,将所有标记为长期的腺癌患者生存周期进行汇总,得到长期生存组。
[0056] S33、采用Kaplan–Meier法分别计算所述短期生存组和所述长期生存组的生存概率曲线,并使用log‑rank检验法分别比较在长期生存组的生存概率曲线中占用指标、分形指标、聚类指标和覆盖指标与短期生存组的生存概率曲线中占用指标、分形指标、聚类指标和覆盖指标之间的中位数差异值;S34、当所述中位数差异值超过差异阈值时,得到超过差异阈值的中位数差异值对应的指标对胰腺癌患者预后产生正面影响的生存分析结果,反之,当所述中位数差异值低于差异阈值时,得到低于差异阈值的中位数差异值对应的指标对胰腺癌患者预后产生负面影响的生存分析结果。
[0057] 在本实施例中,如图3所示,采用Kaplan–Meier法分别计算短期生存组和长期生存组的生存概率曲线,并使用log‑rank检验法分别比较在长期生存组的生存概率曲线中占用指标、分形指标、聚类指标和覆盖指标与短期生存组的生存概率曲线中占用指标、分形指标、聚类指标和覆盖指标之间的中位数差异值,即将长期生存组的生存概率曲线中占用指标中位数减去短期生存概率曲线中占用指标中位数,得到占用指标的中位数差异值,将长期生存组的生存概率曲线中分形指标中位数减去短期生存概率曲线中分形指标中位数,得到分形指标的中位数差异值,将长期生存组的生存概率曲线中聚类指标中位数减去短期生存概率曲线中聚类指标中位数,得到聚类指标的中位数差异值,将长期生存组的生存概率曲线中覆盖指标中位数减去短期生存概率曲线中覆盖指标中位数,得到覆盖指标的中位数差异值。如果中位数差异值超过差异阈值,其中,差异阈值为0.05,即,如果中位数差异值超过0.05,则说明超过差异阈值的中位数差异值对应的指标对胰腺癌患者预后产生正面影响,即,得到该指标对胰腺癌患者预后产生正面影响的生存分析结果,反之,如果中位数差异值低于0.05,则说明低于差异阈值的中位数差异值对应的指标对胰腺癌患者预后产生负面影响,即,得到该指标对胰腺癌患者预后产生负面影响的生存分析结果。
[0058] 实施例二请参照图4,本发明提供评估B细胞对胰腺癌患者预后产生影响的系统1,包括存储器3、处理器2及存储在存储器3上并可在处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现实施例一中的步骤。
[0059] 由于本发明上述实施例所描述的系统/装置,为实施本发明上述实施例的方法所采用的系统/装置,故而基于本发明上述实施例所描述的方法,本领域所属技术人员能够了解该系统/装置的具体结构及变形,因而在此不再赘述。凡是本发明上述实施例的方法所采用的系统/装置都属于本发明所欲保护的范围。
[0060] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例,或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0061] 本发明是参照根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。
[0062] 应当注意的是,在权利要求中,不应将位于括号之间的任何附图标记理解成对权利要求的限制。词语“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的词语“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的权利要求中,这些装置中的若干个可以是通过同一个硬件来具体体现。词语第一、第二、第三等的使用,仅是为了表述方便,而不表示任何顺序。可将这些词语理解为部件名称的一部分。
[0063] 此外,需要说明的是,在本说明书的描述中,术语“一个实施例”、“一些实施例”、“实施例”、“示例”、“具体示例”或“一些示例”等的描述,是指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0064] 尽管已描述了本发明的优选实施例,但本领域的技术人员在得知了基本创造性概念后,则可对这些实施例作出另外的变更和修改。所以,权利要求应该解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0065] 显然,本领域的技术人员可以对本发明进行各种修改和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也应该包含这些修改和变型在内。