技术领域
[0001] 本发明属于信号分析领域,涉及一种基于ECG和PPG信号时域和频域融合分析的呼吸信号估计方法。
相关背景技术
[0002] 呼吸频率(RR)是诊断人体异常健康状态的关键指标,与心率、血压和体温同等重要。呼吸频率在不同领域内都有广泛应用。在医院急诊和临床评估中,RR异常值常被用于识别患者潜在疾病和提示危险情况,如败血症、心脏骤停、过敏反应、肺炎等呼吸系统疾病。在识别心肺骤停的高危患者群体方面,RR的相对变化比血压、脉搏率等生理参数更加明显。另外,在消防、体育健身等特殊领域,RR值还可作为热应力指标,呼吸频率的明显增加是呼吸性碱中毒的明显指标。
[0003] 临床上,呼吸测量的主要方式有基于气体交换的二氧化碳呼气图、肺活量测定法。近些年,基于雷达、红外热成像等非接触式监测方式较为流行。其中,光电容积脉搏波信号(PPG)和心电信号(ECG)以其无创测量、广泛使用,且极易在医疗保健设备上采集等优点,使其成为各种环境中测量呼吸信息的有力候选者。
[0004] ECG和PPG明显受到呼吸调制影响,具体表现在基线漂移(BW)、幅度调制(AM)和频率调制(FM)三方面。这些调节是由与呼吸相关的运动以及呼吸时对胸内压变化的各种反应引起的。因此,利用ECG或PPG信号可以提取呼吸信号或预测呼吸频率。人工智能技术的迅速发展和计算资源的不断提升,深度学习方法在医学领域得到了广泛应用,如基于生理信号的疾病诊断与治疗。同时,越来越多的呼吸信号相关数据在网络上可以公开访问,使基于深度学习方法估计呼吸信号及其频率成为可能。Pongpanut等和Dai等采用基于卷积神经网络(CNN)的架构从降采样后的PPG信号中估计RR。他们的方法通过对降采样后的PPG信号进行特征提取和模式识别,能够有效地估计RR。这种方法具有自动化程度高、鲁棒性好等优点。Rathore等人则提出了一种多任务模型(MRNet)来估计平均RR和瞬时RR。MRNet网络将心电图和加速度计获得的呼吸相关信号作为输入,可同时估计呼吸信号和平均RR,并将其作为输出。
[0005] 呼吸测量的主要方式有基于气体交换的二氧化碳呼气图、肺活量测定法,这些设备大多造价昂贵、操作繁琐,其有创监测方式会对患者造成一定损伤。基于雷达、红外热成像等非接触式监测方式较为流行,但其测量值极易受到外界环境因素干扰。Pongpanut等和Dai等采用的这两种方法需要较大的窗口尺寸(60s,64s)才能取得最佳性能,这非常不利于RR的实时监测。Rathore等人提出的多任务模型(MRNet)在动态数据集上显示出较高准确性。然而,该模型参与训练的只有14位受试者,且未跨受试者进行精度计算,因此其泛化性能无法保证。
具体实施方式
[0046] 需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合,下面将参考附图并结合实施例来详细说明本发明。
[0047] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048] 图1是该方法的流程图;图2是该方法的具体流程图;
[0049] 一种基于ECG和PPG信号时域和频域融合分析的呼吸信号估计方法,包括以下步骤:
[0050] S1:对原始ECG信号与PPG信号分别进预处理,得到预处理后的ECG信号与PPG信号;
[0051] S2:将预处理后的ECG信号与PPG信号单独输入到Embedding层,组合得到高维特征向量;
[0052] S3:所述高维特征向量分别输入到时域模块和频域模块中进行融合分析,得到原始ECG信号与PPG信号的呼吸波形。
[0053] 步骤S1/S2/S3顺序执行;
[0054] ECG和PPG信号中存在大量干扰噪声,包括交流电源造成的工频干扰、肌肉收缩导致的肌电干扰、运动伪影等噪声。本申请首先采用Christina等人提出的模板匹配算法对原始ECG和PPG信号进行质量检测,并过滤掉低质量片段,之后本发明使用了之前提出的方法提取ECG、PPG信号中的相关呼吸信息。
[0055] 图3是S4‑膨胀块的具体结构图;
[0056] 所述时域模块基于改进的U‑Net网络构成,所述改进的U‑Net网络的编码模块和解码模块基于S4‑膨胀块构成;
[0057] 其中S4‑膨胀块,用于捕捉长序列之间的依赖关系;
[0058] 所述编码模块和解码模块由上采样和下采样由重组实现,使用了2个编码模块和解码模块堆叠的结构;
[0059] 上层编码模块、上层解码模块的输入长度分别是下层编码模块、下层解码模块的一半,维度是下层的2倍;
[0060] S4‑膨胀块由S4层和4个平行的膨胀卷积实现,卷积核大小均为1×3,步长均为2,膨胀卷积比率分别为1、2、4和8,4个平行的膨胀卷积捕捉多种尺度的特征信息;
[0061] 随后,特征信息由Leak Relu激活,经过张量拼接后输出,两个编码模块对输入进行2次下采样以产生压缩特征向量;解码器模块利用反卷积层的特征向量进行上采样,得到时域呼吸信号,解码器融合相应层次的编码器的输出,并使用一维反卷积进行上采样操作。
[0062] 所述编码模块和解码模块采用相同的批次归一化、激活函数(参数是0.3的Leak Relu)设置。
[0063] 所述时域模块对高维特征向量处理进行处理的过程如下:
[0064] 本发明使用的改进的U‑Net网络由文献提出,其基于线性状态空间模型(SSM)。在S4中,SSM独立的应用于每个通道(channel);
[0065] 连续状态空间定义了一维输入信号u(t)映射到高维潜在状态x(t),再投影到一维输出信号y(t)的映射关系,如公式1所示。
[0066] x′(t)=Ax(t)+Bu(t)(1a)
[0067] y(t)=Ax(t)+Bu(t)(1b)
[0068] 其中,A,B,C,D可作为深度学习模型的训练参数,并采用双线性离散化方法进行离散化:
[0069] 令 有:
[0070]
[0071]
[0072] 这里 此时深度学习模型具有线性递归(2a)和(2b)和全局卷积(3a)和(3b)两种计算方式。
[0073] 所述频域模块对高维特征向量处理进行处理的过程如下:
[0074] 特征向量输入的时域特征的每个通道q首先经过傅里叶变换转化为频域特征,为减小噪声干扰以及加速模型训练速度,
[0075] 傅里叶变换会得到M个频率分量,从M中挑选M’个频率分量组成Q~,M’<<频率分量个数M;
[0076] 随后,Q~与权重矩阵W点乘形成特征Y~;
[0077] 最后,Y~通过补零填充将维度恢复M*高维特征向量D,再进行逆傅里叶变换;
[0078] 之后采用交叉注意力机制来和捕捉互信信号相关的特征,将编码器模块的输出通过不同的FC转化成交叉注意力机制中的关键值k,Value值,仿真呼吸信号经Embedding层后的作为查询值q;q,k,v首先经过傅里叶变换转换成频域表示Q,K,V,此时它们的频域范围相同;
[0079] 随后Q、K、V分别在频域上进行随机采样,只保留M’个频率分量进行交叉注意力。
[0080] 其中
[0081]
[0082] d为特征嵌入的维度, 表示交叉注意力的输出,随后,C通过Padding对频域进行补全,再通过逆傅里叶变换转化成是与信号,其过程如x式:
[0083] Y=FFT‑1(Padding(C))
[0084] 其中:Padding表示填充,FFT‑1表示反傅里叶变换。
[0085] 图4是频谱增强层示意图。
[0086] 本发明选取了近5年内基于深度学方法在呼吸信号和呼吸频率上最先进模型进行对比,这些模型包括:TransRR、RRWaveNet、ConvMixer、BiLSTM+Atten、BiLSTM、ResNet、RespNet。这里本发明在大多数精度上都是最优的。最后,为评价TR‑FR在实际预测场景下的预测性能,本发明做了dataset‑specific的预测性能对比,即在一个数据集上训练模型,在另外一个数据集上测试模型。结果表明,TR‑FR的性能优于其他模型,能够有效应用于在临床上,对患者的呼吸信号和频率进行精准预测,有辅助诊断作用。
[0087] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。