首页 / 一种通用心电基座大模型框架构建方法及系统

一种通用心电基座大模型框架构建方法及系统有效专利 发明

技术领域

[0001] 本发明属于心电大模型技术领域,具体涉及一种通用心电基座大模型框架构建方法及系统。

相关背景技术

[0002] 现有的心电图(electrocardiogram,ECG)分析模型多基于传统的深度学习架构,如基于监督学习的多尺度CNN,LSTM,Transformer等。这些模型的训练依赖于大量带标签的心电信号数据,且仅适用于特定的心电任务,而标注大量的心电信号依赖于专业医师,标注过程费时费力,临床心电样本标签获取困难,从而限制了人工智能在心电领域的发展。与之相比,无监督预训练大模型不依赖于数据标签,并且能够广泛适用于多种心电分析任务。
[0003] 无监督预训练大模型可以大体分类为以下两种思路:一是基于对比学习的思想,生成增强数据,并在训练过程中约束正负样本之间的距离实现模型训练,如SimCLR、DINO等。另一种是基于掩码建模的方法,通过对掩码的数据进行恢复实现训练任务,如Bert,Beit等模型。然而,上述模型是为语言或图像设计的,未能充分考虑心电信号的导联特性,因此不能有效地提取心电数据中的信息。这导致了现有无监督预训练大模型无法直接应用于处理心电数据。

具体实施方式

[0059] 下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制;相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
[0060] 第一方面本申请提出了一种通用心电基座大模型框架构建方法,包括以下步骤:
[0061] S100:获取原始ECG信号作为模型输入并基于三种增强策略进行数据增强训练,得到全体增强数据;
[0062] 在一些实施例中,所述获取原始ECG信号作为模型输入并基于三种增强策略进行数据增强训练,得到全体增强数据,包括:
[0063] 获取时间长度为10秒导联数据为12的一维ECG信号作为所述原始ECG信号,将所述原始ECG信号作为模型输入,记作 ,输入尺寸为 ,其中 表示样本数量,4096表示数据长度,12表示导联数据;
[0064] 通过随机裁剪、添加噪声和导联遮挡三种数据增强策略分别对所述原始ECG信号的每个样本进行增强处理,得到对应的增强数据 ;
[0065] 其中,随机裁剪包括:
[0066] 将所述原始ECG信号截断为时间长度不小于2秒的ECG信号;
[0067] 对所述原始ECG信号中剩余时间长度的ECG信号进行置零处理;
[0068] 添加噪声包括:
[0069] 为所述原始ECG信号添加高斯白噪声,所述高斯白噪声大小为0‑24 dB;
[0070] 导联遮挡包括:
[0071] 将所述原始ECG信号的导联数据分别拆分为一个单导联数据和一个三导联数据,其中单导联数据指I导联或II导联,三导联数据指I、II和III导联;
[0072] 将所述增强数据 和模型输入 进行合并得到全体增强数据 。
[0073] 其中,对于导联遮挡举例:原数据是12导联,现在要生成三导联数据,就I、II、III导联数据不变,另外9个导联数据置0;
[0074] 对于随机裁剪举例:输入时间长度为10秒的ECG信号,每个时间点都对应此刻的ECG信号的数值,随机长度截断是指将10秒ECG信号截断为随机时间长度,这个随机长度大于2秒,可以为3秒,此时只保留这三秒的ECG信号的数值,剩余七秒的数值设置为0;
[0075] 数据增强有利于提升模型对于多种时间长度、噪声干扰和多种导联组合的泛化性,增强VQVAE的原理如图2所示。
[0076] S200:通过对所述全体增强数据进行数据重构训练增强VQ‑VAE模型,得到分词器和码本的参数,进而获得原始ECG信号的离散表示;
[0077] 在一些实施例中,所述通过对所述全体增强数据进行数据重构训练增强VQ‑VAE模型,得到分词器和码本的参数,进而获得原始ECG信号的离散表示,包括:
[0078] 通过分词器将增强后的全体数据 压缩为中间表示 ,并将所述中间表示进行向量量化;
[0079] 将向量量化后的每一个所述中间表示与码本进行距离计算,计算与码本中距离最小的向量的索引,构成与模型输入对应的离散表示 。
[0080] 在一些实施例中,还包括在所述增强VQ‑VAE模型中损失函数的基础上,增加样本内部距离损失:
[0081]
[0082] 其中,根据索引从码本中查表,获得最终量化后的表示 ,将其作为增强VQ‑VAE模型生成的输出, 表示均方误差,用于衡量 与全体增强数据之间的差异,sg表示停止梯度,α和β表示超参数, 是原始数据的中间表示, 是增强数据的中间表示,代表码本向量,DIS代表余弦距离。
[0083] 进一步的,在解码过程,根据索引从Codebook(密本)中查表,获得最终量化后的表示 。最后将 输入解码器生成最终的输出 ,分词器由三层卷积核大小分别为3、3、5,步长为2的一维卷积组成,每个卷积层后设置步长为2的平均池化层,解码器由三层卷积核大小为5、3、3,步长为2的一维反卷积组成,每个反卷积层后设置尺度为2的上采样层,为了弱化ECG长度改变、噪声污染和导联缺失对模型的影响,通过在VQVAE损失函数的基础上,增加一个样本内部距离损失,拉近同一样本的不同增强数据特征之间的距离。
[0084] S300:根据原始ECG信号的离散表示构建掩码心电建模任务,根据所述掩码心电建模任务对ECG编码器进行训练,得到心电基座大模型;
[0085] 在一些实施例中,所述根据原始ECG信号的离散表示构建掩码心电建模任务,根据所述掩码心电建模任务对ECG编码器进行训练,得到心电基座大模型,包括:
[0086] 构建ECG块和ECG离散标记,所述ECG块构建包括:将数据长度4096的 一维ECG信号分为64个ECG片段,每个ECG片段的数据长度为64,所述ECG离散标记通过预训练的所述分词器获得,由64个离散的数表示,每个ECG块和每个ECG离散标记相互对应;
[0087] 根据所述ECG块和ECG离散标记构建掩码ECG建模任务:
[0088] 将ECG块展平获得维度大小为768的块嵌入,将其中掩码掉的ECG块替换为掩码嵌入,对于每一个ECG块,生成一个位置编码,其维度和块嵌入相同,将块嵌入和位置编码相加,构成ECG编码器的输入,通过ECG编码器对输入进行编码,通过MLP预测被掩码掉的ECG块对应的离散标记;
[0089] 通过完成所述掩码ECG建模任务得到心电基座大模型。
[0090] 其中,ECG编码器采用的是一维视觉Transformer模型,但做了一些小改动:其块的尺寸不是二维的16x16,而是一维的大小为64,通过上述预训练过程,可以得到一个通用的心电基座大模型,ECG编码器预训练的原理图如图3所示。
[0091] S400:调用下游任务对所述心电基座大模型进行微调,采集ECG信号数据对微调后的心电大模型进行模型验证,保证框架完整性。
[0092] 在一些实施例中,所述调用下游任务对所述心电基座大模型进行微调,采集ECG信号数据对微调后的心电大模型进行模型验证,保证框架完整性,包括设置时间长度判别:
[0093] 筛选出时间长度大于2秒的任意导联ECG信号数据;
[0094] 对筛选后时间长度小于10秒的ECG信号数据进行补零,填充为10秒片段,通过重采样操作将填充后的ECG信号数据转换为4096个数据点;
[0095] 对筛选后时间长度大于10秒的ECG信号数据进行分割截断,并使其以每10秒为一个单位执行一次ECG信号识别并返回结果。
[0096] 在一些实施例中,所述调用下游任务对所述心电基座大模型进行微调,采集ECG信号数据对微调后的心电大模型进行模型验证,保证框架完整性,包括设置导联判别:
[0097] 对于单导联或三导联的ECG信号数据:将其中缺失的导联置零后送入模型;
[0098] 对于标准八导联数据,通过线性运算补充缺失导联后送入模型;
[0099] 其中,主要为了补全III导联、aVR导联、aVL导联和aVF导联这四个导联的数据,具体计算公式为:
[0100] III导联=II导联‑I导联;
[0101] aVR导联=‑(I导联+II导联)/2;
[0102] aVL导联=I导联‑II导联/2;
[0103] aVF导联=II导联‑I导联/2。
[0104] 其中,ECG基座大模型的微调过程仅利用训练好的ECG编码器部分,加上下游任务头实现多重下游任务。而无需再利用分词器和掩码建模步骤,其微调流程如图4所示。
[0105] 具体而言,将微调数据集按时间窗口分块:将长度为4096的一维ECG分为64个ECG片段,每个片段长64,构成ECG块视角。然后将ECG块展平获得维度大小为768的块嵌入,将块嵌入和位置嵌入相加,构成ECG编码器的输入,随后送入编码器,获得ECG特征,最后,通过具体下游任务及其标签对模型进行训练(如分类任务,这里的下游任务头可以采用全连接层,标签为分类的结果)。
[0106] 其中,时间长度小于2秒的数据不符合模型要求,所以需要设置时间长度判别进行筛选,而对小于10秒的数据进行补零,填充为10秒片段,对于大于10秒的数据,对其进行分割截断,每10秒为一个单位执行一次ECG识别并返回结果,例如:筛选出的数据时间长度共3秒,那就补7秒的0,构成10秒的片段,这样就有5000个数据点,然后重采样成4096个数据点;
[0107] 如果筛选出的时间长度共32秒,则0‑10秒执行一次,10‑20秒执行一次,20‑30秒执行一次,最后2秒舍弃。
[0108] 第二方面本身请提出一种通用心电基座大模型框架构建系统,如图5所示,包括模型预训练模块、数据重构模块、心电基座大模型构建模块和微调设置模块;
[0109] 所述模型预训练模块,用于获取原始ECG信号作为模型输入并基于三种增强策略进行数据增强训练,得到全体增强数据;
[0110] 所述数据重构模块,用于通过对所述全体增强数据进行数据重构训练增强VQ‑VAE模型,得到分词器和码本的参数,进而获得原始ECG信号的离散表示;
[0111] 所述心电基座大模型构建模块,用于根据原始ECG信号的离散表示构建掩码心电建模任务,根据所述掩码心电建模任务对ECG编码器进行训练,得到心电基座大模型;
[0112] 所述微调设置模块,用于调用下游任务对所述心电基座大模型进行微调,采集ECG信号数据对微调后的心电大模型进行模型验证,保证框架完整性。
[0113] 第三方面本申请提出一种电子装置,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。
[0114] 第四方面本申请提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述方法的步骤。
[0115] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0116] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0117] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
[0118] 在本公开所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0119] 作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0120] 另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0121] 集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read‑Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0122] 以上仅是本发明优选的实施方式,需指出的是,对于本领域技术人员在不脱离本技术方案的前提下,作出的若干变形和改进的技术方案应同样视为落入本权利要求书要求保护的范围。

当前第1页 第1页 第2页 第3页
相关技术
心电相关技术
方法系统相关技术
孙美琪发明人的其他相关专利技术