首页 / 一种胸部CT影像儿童闭塞性细小支气管炎分类方法

一种胸部CT影像儿童闭塞性细小支气管炎分类方法实质审查 发明

技术领域

[0001] 本发明涉及人工智能CT影像分类技术领域,尤其涉及一种胸部CT影像儿童闭塞性细小支气管炎分类方法。

相关背景技术

[0002] 闭塞性细支气管炎(Bronchiolitis Obliterans,BO)是指多种病因导致细支气管损伤后启动了炎症和纤维化过程,从而致管腔部分或完全闭塞所致的慢性气流受限综合征。既往的研究表示,下呼吸道感染、器官移植后的抗宿主反应、结缔组织病、吸入有毒气体以及辐射等被认为在BO的发生中起到了重要的作用。近年来随着医学的不断发展,人们对该病的认识也逐渐提高,在儿童中尤为关注。由于儿童的免疫系统相对较弱,对于疾病的自我调节能力较差,呼吸道发育尚未成熟,进而会对患儿健康和生活质量造成严重的不利影响。其中儿童以呼吸道感染引起的BO最为多见,腺病毒、流感、副流感、麻疹,支原体等病原体常见,COVID‑19和偏肺病毒也有类似的报道。多数BO患儿在感染或其他原因导致气道损伤后出现持续或反复的咳嗽、喘息、呼吸急促、呼吸困难、运动耐受力差等症状,重症患儿可死于呼吸衰竭。如果BO疾病未能及时得到正确诊断和有效治疗,可能会引起气道纤维化和气道阻塞等不可逆变化,严重危及患儿的健康和生活质量。不良的预后往往是由于诊断延迟造成的。因此及早识别BO疾病的症状,并在早期阶段采取有效治疗非常关键。
[0003] 目前BO的诊断主要依赖临床表现、肺功能及高分辨率计算机断层扫描(HRCT)检查,并没有利用人工智能技术进行辅助诊断的先例。BO为不可逆的病理改变,所以早期诊断尤为重要。目前主要临床诊断标准有:(1)发病之前往往有感染或其他原因所致的急性肺损伤;(2)有咳嗽、反复喘息、气促、呼吸困难、运动不耐受;(3)双肺可闻及广泛喘鸣音、爆破音,并持续存在达6周以上,对支气管扩张剂反应差;(4)辅助检查:胸部HRCT显示马赛克灌注征、支气管扩张支气管壁增厚:肺功能显示小气道阻塞性通气功能障碍或混合性通气功能障碍,支气管扩张试验多为阴性;(5)排除其他引起咳喘的疾病,如支气管哮喘支气管肺发育畸形、肺囊性纤维化、免疫缺陷病、肺结核、弥漫性泛细支气管炎、先天性心脏病等;(6)BO确定诊断需病理证实。
[0004] 当前背景技术的BO早期诊断面临着显著的挑战和局限性。由于BO的早期症状常常类似于其他呼吸道感染或慢性呼吸系统疾病,症状对于BO来说并不特异,容易被误解为其他疾病。此外,早期BO患儿的X线检查可能显示正常,或仅显示非特异性的过度充气和气道壁增厚,这使得早期诊断变得困难。高分辨率计算机断层扫描(HRCT)是BO诊断的主要无创性工具,但对低龄儿童来说,特别是呼气相扫描技术的局限性,可能影响到诊断的准确性;并且由于BO患儿的CT影像与非BO患儿的CT影像无明显区别,在空间域下特征极难区分,因此仅依靠CT影像很难确定BO的存在。尽管肺活检被认为是诊断BO的金标准,但在儿童中实施此检查存在显著难度,由于病变部位多呈不均质状分布,临床上较难实施;且气道受累的不均匀分布可能导致取样误差,降低了这一诊断方法的敏感性。因此医生需要对该病的特点有深入了解,结合临床表现、病史、肺功能测试和影像学检查等多方面信息进行全面评估,才能尽早发现和诊断BO,从而采取有效的治疗措施。

具体实施方式

[0024] 如图1所示,首先对训练集数据进行预处理,包括数据清洗和数据像素值归一化。数据清洗即手动删除患儿CT数据中不包含肺部信息的影像数据,以确保模型专注于关键信息,从而提高模型效率和分类准确性。其次针对BO与非BO数据特征难以区分导致严重类别不平衡问题的情况,本发明采用了分组数据分别训练的方式作为有效的应对策略,避免了类别不平衡对训练结果造成的不利影响。然后通过对InceptionV3网络结构进行微调,有效提高了对BO疾病的准确分类能力,为医生提供了更准确和可靠的辅助诊断手段。最后对分组训练结果中表现较好的模型进行了模型集成,以提高整体分类性能,为临床医学诊断提供更可靠的支持。本发明的详细流程图如图2所示。
[0025] 在机器学习中,数据不平衡是一种常见的问题,它会导致模型对于少数类别的预测效果较差。由于实际治疗中,患BO疾病的患儿数量要远小于未患BO疾病的患儿数量,并且本发明所使用的数据集非BO数也占绝大部分,此外BO数据与非BO数据特征差异极小,因此训练存在严重的类别不平衡问题。
[0026] 为解决类别不平衡问题,本发明尝试了多种实验。如过采样和欠采样、合成少数类样本、调整分类器的决策阈值等,但上述方法并不适用于BO数据,以上方法的实验结果均将所有的测试集数据判断为非BO。是因为患BO疾病儿童的CT影像和未患BO疾病儿童的CT影像数据在空间域下特征极难区分,因此一旦存在训练数据集比例不平衡的情况,预测中模型便会倾向于多数类别的数据结果。为解决上述问题,本发明采取控制数据比例的方式。通过严格控制训练集和验证集中BO数据和非BO数据的比例为1:1,即保证每种类别在训练和验证中均占一半,从而避免了类别不平衡问题的产生。
[0027] 由于非BO数据数量占比较大,为学习更多非BO患者数据的信息,本发明采用分组训练的方式。即按照BO数据的数量对非BO数据进行训练集和验证集的随机等量分组,并且对每组数据分别进行训练,进而可以得到若干由相同的BO数据集和不同的非BO数据集训练出的模型,如图3所示。这样做的好处在于,不仅控制了每次训练的数据类别比例,并且充分利用到更多数据信息。实验结果表明,这种方法可以有效地解决类别不平衡问题,并提升模型对于各类别的预测准确率。
[0028] 随着深度学习技术的不断发展,深度神经网络已经成为图像分类任务中的重要工具。然而,设计一个高效且性能优异的深度学习模型并非易事,网络结构的设计和优化对模型的性能有着至关重要的影响。本发明旨在针对InceptionV3网络进行优化设计,希望在提高模型性能和泛化能力的同时,降低过拟合风险。
[0029] InceptionV3网络结构最初是为了应对2012年ILSVRC分类挑战而开发的,默认的InceptionV3包含42层。它在计算机视觉领域具有广泛的应用,能够有效地识别和分类各种复杂的图像。由于ILSVRC数据集包含1000类图像,因此输出层的维度为1x1x1000。由于本发明的数据集需要二进制分类,因此对InceptionV3模型的顶层进行了修改,修改后的网络结构图如图4所示,网络详细修改方案如下:
[0030] 首先,由于InceptionV3网络在图像分类任务上的良好表现,本发明采用不包含顶层的InceptionV3网络作为分类主干网络,并对其顶层结构进行调整以更好地适应BO疾病分类任务需求。
[0031] 其次,为了减少参数数量并增强模型的泛化能力,本发明在InceptionV3网络后引入了全局平均池化层。全局平均池化层可以将整个特征图转化为一个值,从而大大减少了参数数量,同时保留了特征图的重要信息,有助于提高模型的泛化能力。
[0032] 随后,本发明添加了三个密集层,密集层分别有256、128、64个神经元。通过堆叠多个密集层,可以逐渐提取和组合更加抽象的特征信息,使模型能够更好地区分不同类别的目标。在密集层中,本发明使用了ELU激活函数。相较于传统的ReLU激活函数,ELU(Exponential Linear Unit)激活函数具有更加平滑的曲线,在负值区域有非零梯度,有助于缓解梯度消失问题,加速网络收敛速度。因此,本发明将ELU激活函数引入到全连接层中,以增强模型的非线性建模能力,提高分类性能。
[0033] 最后,由于本发明的分类任务是二元的,因此由两个神经元组成本发明的输出层,输出层使用softmax激活函数将图像分为“BO”和“非BO”两类。
[0034] 模型集成作为一种集合多个模型进行决策的方法,可以有效地提高分类准确性并增强模型的泛化能力。因此本发明采用对模型的预测结果进行集成的方法,旨在提高医学影像分类任务的准确性和稳定性。由于分组训练得到的部分模型预测效果不稳定,其对个别测试数据的判断失误较为严重,即个别数据的分类准确率极低,可能会对整体实验的预测结果造成不利影响。因此我们先对分组训练得到的模型进行筛选,留下预测效果较稳定的模型作为集成模型,通过集成它们的预测结果来得出最终的分类决策。在集成实验过程中,本发明对不同模型的预测结果进行平均,并制定了判断最终分类结果的规则:若集成模型对两类预测概率差大于0.3,即对一类的预测概率大于0.65,则认为是正确分类,即保留该预测结果,具体的集成方法及判定规则如图5所示。由于集成模型的分类预测概率间接表示模型对该类别的判断可信度,进而通过设定预测概率阈值的方法,来进一步避免因数据噪声或其他不确定因素导致的错误分类,从而降低潜在的风险,提高模型的稳定性和可靠性。以上集成思想不仅可以让模型更好地捕捉到不同数据分布下的特征信息,也可以减少单个模型预测的随机误差,从而平衡各个模型的优劣,提高整体预测的稳定性和准确性,增强模型的鲁棒性以及提高模型泛化能力。本发明通过实验验证证明,以上集成方法在BO疾病分类任务中取得了较高的准确率,进而证明方法的有效性。
[0035] 本节将主要介绍实验所用数据集,以及本发明所使用的评估标准,并从多个角度评估了本发明的可行性。
[0036] (1)数据集
[0037] 本实验使用的数据集收集于2018年1月1日至2020年12月31日来自合作医院614例腺病毒肺炎患儿的入院时CT影像。614例中,发生BO的有35例,未发生BO的579例。通过电话与生存并出院的614例腺病毒肺炎患儿的父母进行了联系,并就患儿的呼吸道状况进行了为期一年的随访,对于有呼吸道症状(如持续喘息或慢性咳嗽)的儿童建议于该院门诊作进一步的评估,确定是否发生BO。
[0038] CT设备:采用128排CT(Ingenuity Core 128,Philips Medical Systems)和256排螺旋CT机(iCT 256,Philips Medical Systems)。所有患儿均行胸部CT平扫,视野170~250mm,矩阵512×512,胸部扫描范围包括肺尖及肺底。
[0039] 由于BO与非BO数据在空间域下特征很难区分,多次实验表明分类遭受严重的类别不平衡的影响,因此本发明按照BO数据的数量对非BO数据进行等量分组,每组数据进行单独训练,进而控制每次训练数据量平衡。此外本发明按照7:2:1的比例分别将不同组的数据进行训练集、验证集、测试集的划分,并且对训练集和验证集的数据进行数据清洗,将CT数据中不含肺部信息的数据进行手动删除。
[0040] (2)评估标准
[0041] 本发明通过一套评估指标来评估分类效果,其中包括准确率、精确率、召回率、F1值等。这些指标在评估分类模型性能时非常重要,有助于全面了解模型的表现,特别是在处理不平衡数据集或需要权衡精确性和覆盖性时。
[0042] 准确率(Accuracy):正例和负例中预测正确数量占总数量的。
[0043] 精确率(Precision):以预测结果为判断依据,预测为正例的样本中预测正确的比例。
[0044] 召回率(Recall):以实际样本为判断依据,实际为正例的样本中,被预测正确的正例占总实际正例样本的比例。
[0045] F1值(F1‑Score)是中和了精确率和召回率的指标。
[0046] (3)实验结果
[0047] 本发明从不同指标、多个角度验证了BO疾病分类的可行性。
[0048] 将本发明使用的网络结构与其他四种流行的深度学习模型进行了比较:ResNet50、DenseNet121、EfficientNetB0、InceptionV3。本发明采用相同的数据集进行训练,并控制训练集与验证集中BO:非BO的数据量为1:1,同时输入数据的大小也被调整以适配各个网络模型的要求。为近似于实际诊断情况,本发明选取3组BO数据与51组非BO数据进行测试,通过这种设计,本发明旨在评估模型在处理不平衡数据时的性能。由于非BO占比较大,对整体的准确率有极大的影响,所以本发明单独测试了BO数据与非BO数据的准确率。此外精确率、召回率、F1值三个指标均设置average参数为weighted,即为每个类别单独计算指标,然后取加权平均值,权重为每个类别的真实样本数,这种方法考虑了类别不平衡的影响,网络对比结果如表1所示。根据多项关键指标的综合评估,本发明所采用的网络结构在效能上均表现优异,超越了其他四种方法。整体准确率达到了82.216%,分别针对BO与非BO数据进行了单独测试,结果显示经过优化的网络在准确率方面取得了显著提升,分别达到了72.391%和82.805%。针对精确率、召回率和F1值三个指标的测试结果分析表明,该模型在处理不平衡数据集时展现出较好的综合性能。这些结果证实了本发明所采用的网络结构在有效性和优越性方面的优势。通过对比结果可知,通过模型选择和优化,本发明能够提升算法在实际应用中的性能,从而为临床诊断提供更为精确和可靠的支持。
[0049] 表1.网络结构优化结果对比
[0050]
[0051] 为了克服非BO类别数据量远超BO类别的不平衡问题,本发明采取了一种策略,即根据BO类别的样本量对非BO数据集进行分组,并对每组数据分别训练模型。在此过程中,挑选性能表现较优的模型进行集成,以期望通过集成学习进一步提升分类性能。具体来说,在集成阶段,对选定模型的预测结果进行了平均处理,并设定了一个决策阈值:当集成模型对某张图片的类别预测概率超过65%时,本发明将信任该预测结果并将图片归入相应类别;否则,本发明认为该图片的分类结果不够可靠,不将其包含在最终分类结果中,模型集成结果如表2所示。
[0052] 从集成前后的性能对比来看,集成学习显著提升了模型在多个关键性能指标上的表现,实现了整体分类效果的显著改进。尽管集成后模型在BO类别的准确率上(95.475%)略低于模型一(96.296%),但在其他所有评价指标上,包括精确率、召回率和F1值等,都达到了显著提升,整体准确率也达到了91.433%,体现了集成策略在提高模型整体性能方面的有效性。并且所有评估指标都达到了91%以上,这一结果强调了集成学习在处理类别不平衡数据集时的潜力和价值,尤其是在综合考虑多个性能指标以获得更全面性能提升的情境下。
[0053] 表2.模型集成结果对比
[0054]
[0055] 根据所提供的混淆矩阵(见图6),在被纳入最终分类结果的样本中,共有221张属于BO类别,4028张属于非BO类别。其中,模型正确将211张BO数据分类为BO类别,但错误地将10张BO数据误分类为非BO类别。另外,在4028张非BO数据中,模型正确地将3674张非BO数据归类为非BO类别,但误将354张非BO数据错误分类为BO类别。综合整体分类效果来看,这一结果表明了模型在分类任务上取得了良好的表现。通过混淆矩阵的分析,模型对大多数样本进行了正确分类,有效地识别了BO和非BO数据,体现了其在区分不同类别上的有效性和鲁棒性。这种分类效果的显著性也验证了集成学习策略和决策规则的有效性,为后续应用和优化提供了有力的参考依据。
[0056] 为接近实际诊断情况,对测试的3组BO数据和51组非BO数据的结果进行了展示(见表3)。其中患儿CT数据的数量与其年龄有关,分类准确率的高低反映了该患者对应的分类置信度,进而指示了患儿是否患有BO疾病的可能性。即该患儿有更多的图片被分类为某类,则更相信该患儿是否患有BO疾病。通过表3的呈现可以观察到,尽管所有患儿的分类置信度均超过50%,即意味着它们都被正确分类,但也存在个别患儿的分类准确率接近50%,这种情况可能与患儿患病严重程度相关。因此,针对分类正确率较低的患儿,建议医生应重点关注患儿的临床特征,并结合其他诊断手段进行综合判断。
[0057] 表3.患者BO疾病分类结果
[0058]
[0059]
[0060]

当前第1页 第1页 第2页 第3页