技术领域
[0001] 本申请涉及智能监测技术领域,且更为具体地,涉及一种基于大数据的合理用药监测系统及方法。
相关背景技术
[0002] 随着医疗技术的进步和药品种类的不断增加,药品使用的复杂性和风险性也在逐渐提高。不合理使用药品可能会导致严重的药物不良反应或者药物之间的相互作用,给患者带来更大的健康风险。因此,加强合理用药监测,规范用药行为,对于保障患者用药安全、提高医疗质量具有重要意义。
[0003] 传统的合理用药监测方法主要依赖于医生的经验和专业知识,通过对患者的病历和用药记录进行人工分析,来判断用药的合理性。然而,这种方法受限于个体的认知能力和知识范围,难以应对复杂多变的用药场景,并且效率低下,难以满足大规模、高效率的医疗需求。因此,期待一种基于大数据的合理用药监测系统及方法。
具体实施方式
[0034] 下面,将结合附图对本申请实施例进行更详细的描述,本申请的上述以及其他目的、特征和优势将变得更加明显。显然,所描述的实施例仅仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
[0035] 如上述背景技术所言,传统的合理用药监测方式过分依赖医生的经验和专业知识,通过人工的方式分析患者的病历和用药记录,以评估用药的合理性。然而,此类方法受制于个人认知能力和医学知识范畴,难以应对复杂且多样的用药情境,同时分析效率较低,无法满足大规模和高效率的医疗需求。针对上述技术问题,本申请的技术构思为采用基于深度学习的人工智能技术对患者的病历和用药记录进行语义分析,提取出患者病历和用药记录之间的语义融合特征,以了解患者的药物反应和治疗效果,并结合患者当前的用药方案,挖掘出以历史用药为背景的当前用药方案语义联合表示,从而智能评判患者的用药合理性。这样,可以实现对用药合理性的自动监测,并有效提高患者用药监测的效率和准确性。
[0036] 图1为根据本申请实施例的基于大数据的合理用药监测系统的框图。图2为根据本申请实施例的基于大数据的合理用药监测系统的架构示意图。如图1和图2所示,根据本申请实施例的基于大数据的合理用药监测系统100,包括:患者治疗信息获取模块110,用于获取患者对象的病历和用药记录;当前用药方案获取模块120,用于获取所述患者对象的当前用药方案;患者用药信息语义理解模块130,用于对所述病历、所述用药记录和所述当前用药方案分别进行语义理解以得到病历语义编码特征向量、用药记录语义编码特征向量和当前用药方案语义编码特征向量;语义特征融合模块140,用于使用病历‑用药语义特征颗粒级动态合成模块对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行处理以得到病历‑用药逐粒度关联融合表示向量;用药合理性分析模块150,用于基于所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量之间的语义关联交互特征,确定监测结果。
[0037] 在上述基于大数据的合理用药监测系统100中,所述患者治疗信息获取模块110和所述当前用药方案获取模块120,用于获取患者对象的病历和用药记录,以及所述患者对象的当前用药方案。应可以理解,病历详细记录了患者的既往病史、诊断、治疗过程、过敏反应、健康状况等信息。而用药记录则提供了患者之前使用的药物的剂量和频率等信息。通过查看病历和用药记录,可以了解患者过往的用药习惯、药物反应和治疗效果,有助于识别潜在的药物相互作用和副作用。同时,结合患者当前的用药方案,通过分析患者的当前用药方案中的药物种类、剂量、给药方式等,以评估当前用药是否与患者之前使用过的药物存在相互作用或禁忌,发现潜在的药物相互作用、剂量变化、不必要的重复用药等问题,有助于识别出可能存在的用药不合理之处,从而准确判断当前用药方案是否与患者的健康状况、疾病类型以及之前的用药记录相适应。
[0038] 在上述基于大数据的合理用药监测系统100中,所述患者用药信息语义理解模块130,用于对所述病历、所述用药记录和所述当前用药方案分别进行语义理解以得到病历语义编码特征向量、用药记录语义编码特征向量和当前用药方案语义编码特征向量。其中,图
3为根据本申请实施例的基于大数据的合理用药监测系统中患者用药信息语义理解模块的框图。如图3所示,所述患者用药信息语义理解模块130,包括:病历语义编码单元131,用于提取所述病历中的文本部分,并使用基于ALBERT模型的语义编码器对所述病历中的文本部分进行语义编码以得到所述病历语义编码特征向量;用药记录语义编码单元132,用于使用所述基于ALBERT模型的语义编码器对所述用药记录进行语义编码以得到所述用药记录语义编码特征向量;当前用药方案语义编码单元133,用于使用所述基于ALBERT模型的语义编码器对所述当前用药方案进行语义编码以得到所述当前用药方案语义编码特征向量。
[0039] 具体地,所述病历语义编码单元131,用于提取所述病历中的文本部分,并使用基于ALBERT模型的语义编码器对所述病历中的文本部分进行语义编码以得到所述病历语义编码特征向量。应可以理解,考虑到病历通常包含了大量的医学术语和复杂的文本描述,为了能够准确理解并提取其中的关键信息,在本申请的技术方案中,首先提取出所述病历的文本部分,并使用基于ALBERT模型的语义编码器对所述病历中的文本部分进行语义编码,以将病历中的文本信息转化为计算机可理解的数值向量。具体而言,ALBERT模型(ALite BERT)是一种基于Transformer的预训练语言模型,其在BERT模型的基础上进行了改进,具有更高的性能和更小的模型尺寸,能够准确地学习和表示文本的语义含义。也就是说,所述基于ALBERT模型的语义编码器基于Transformer架构,利用自注意力机制对所述病历中的文本部分进行语义编码,能够有效捕捉到文本中各个词语之间的全局语义依赖关系,挖掘出病历文本部分的上下文信息和语义关联,并将病历中的复杂医学知识和患者病情等信息转化为计算机可处理的数据形式,从而充分表达病历的语义内容,为后续的用药合理性监测提供有力的支持。
[0040] 具体地,所述用药记录语义编码单元132,用于使用所述基于ALBERT模型的语义编码器对所述用药记录进行语义编码以得到所述用药记录语义编码特征向量。应可以理解,用药记录是评估患者用药合理性的重要参考依据,其包含了患者用药的种类、剂量、时间等关键信息。为了准确捕捉所述用药记录的语义含义,在本申请的技术方案中,使用了相同的基于ALBERT模型的语义编码器对所述用药记录进行语义编码,基于ALBERT模型强大的语义学习和特征表示能力,将所述用药记录中的药物名称、剂量等关键信息转化为数值向量。此外,通过使用与所述病历相同的语义编码方式对所述用药记录进行语义编码,可以确保编码过程的一致性和可比性,以便于病历和用药记录之间的语义关联分析。
[0041] 具体地,所述当前用药方案语义编码单元133,用于使用所述基于ALBERT模型的语义编码器对所述当前用药方案进行语义编码以得到所述当前用药方案语义编码特征向量。应可以理解,当前用药方案是患者当前正在执行的用药计划,其合理性与否直接关系到患者的治疗效果和健康状况。在本申请的技术方案中,通过对所述当前用药方案进行语义编码,以获取其语义含义,可以进一步分析当前用药方案与患者历史用药记录、病历信息之间的语义关联,从而更准确地评估用药合理性。与之前的处理方式类似,同样使用基于ALBERT模型的语义编码器对所述当前用药方案进行语义编码,以充分利用ALBERT模型在语义表示和特征提取方面的优势,挖掘出所述当前用药方案中潜在的药物相互作用、剂量调整、用药时间等关键信息,从而得到当前用药方案语义编码特征向量。
[0042] 在上述基于大数据的合理用药监测系统100中,所述语义特征融合模块140,用于使用病历‑用药语义特征颗粒级动态合成模块对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行处理以得到病历‑用药逐粒度关联融合表示向量。应可以理解,由于患者的病历和用药记录之间存在着密切的联系,病历中的疾病诊断、症状描述等信息会影响用药决策。在本申请的技术方案中,为了更准确地评估用药合理性,需要充分考虑病历和用药记录之间的语义关联和相互影响。因此,进一步引入病历‑用药语义特征颗粒级动态合成模块,对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行联合分析处理。具体而言,所述病历‑用药语义特征颗粒级动态合成模块通过自适应地学习用药记录和病历之间的语义关系,动态地调整所述用药记录语义编码特征向量和所述病历语义编码特征向量之间的融合权重和关联度,对两者进行语义特征颗粒级动态合成,从而捕捉到用药记录与病历之间的语义关联和相互影响,为后续的用药合理性监测提供更加全面和准确的信息。
[0043] 图4为根据本申请实施例的基于大数据的合理用药监测系统中语义特征融合模块的框图。如图4所示,所述语义特征融合模块140,包括:特征合成平衡门限计算单元141,用于计算所述用药记录语义编码特征向量和所述病历语义编码特征向量之间的特征合成平衡门限值;特征逐粒度融合单元142,用于基于所述特征合成平衡门限值,对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行逐粒度融合以得到所述病历‑用药逐粒度关联融合表示向量。
[0044] 具体地,所述特征合成平衡门限计算单元141,用于:将所述用药记录语义编码特征向量和所述病历语义编码特征向量进行级联以得到病历‑用药语义级联特征向量;将所述病历‑用药语义级联特征向量和变换向量进行相乘以得到门限打分系数;将所述门限打分系数和预定偏置参数进行相加以得到偏置门限打分系数;将所述偏置门限打分系数通过sigmoid激活函数以得到所述特征合成平衡门限值。
[0045] 具体地,所述特征逐粒度融合单元142,用于:分别计算所述用药记录语义编码特征向量和所述病历语义编码特征向量的各个特征值的以自然常数为底的指数函数值以得到指数化用药记录语义编码特征向量和指数化病历语义编码特征向量;基于所述特征合成平衡门限值确定第一权重和第二权重,其中,所述第一权重为所述特征合成平衡门限值,所述第二权重为一与所述特征合成平衡门限值的差值;以所述第一权重对所述指数化用药记录语义编码特征向量进行逐位置加权以得到加权用药记录语义编码特征向量,以所述第二权重对所述指数化病历语义编码特征向量进行逐位置加权以得到加权病历语义编码特征向量;对所述加权用药记录语义编码特征向量和所述加权病历语义编码特征向量进行对应元素相加以得到所述病历‑用药逐粒度关联融合表示向量。
[0046] 也就是,所述语义特征融合模块140,用于:以如下颗粒级动态合成公式对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行逐粒度融合以得到所述病历‑用药逐粒度关联融合表示向量,其中,所述颗粒级动态合成公式为:
[0047]
[0048] 其中,v1表示所述用药记录语义编码特征向量,v2表示所述病历语义编码特征向量,vc表示所述病历‑用药逐粒度关联融合表示向量,concat(·,·)表示连接操作,W是变换向量,b是预定偏置参数,sigmoid表示激活函数,t为特征合成平衡门限值,且t∈[0,1]。
[0049] 在上述基于大数据的合理用药监测系统100中,所述用药合理性分析模块150,用于基于所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量之间的语义关联交互特征,确定监测结果。其中,图5为根据本申请实施例的基于大数据的合理用药监测系统中用药合理性分析模块的框图。如图5所示,所述用药合理性分析模块150,包括:语义关联交互编码单元151,用于对所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量进行语义关联交互编码以得到以历史用药为背景的当前用药方案语义联合表示矩阵;分类诊断单元152,用于将所述以历史用药为背景的当前用药方案语义联合表示矩阵通过基于分类器的用药监测器以得到所述监测结果,所述监测结果用于表示是否存在不合理用药。
[0050] 具体地,所述语义关联交互编码单元151,用于对所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量进行语义关联交互编码以得到以历史用药为背景的当前用药方案语义联合表示矩阵。在本申请的一个具体示例中,对所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量进行语义关联交互编码的编码方式是使用基于Clip模型的药物语义关联模块对所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量进行语义关联交互以得到所述以历史用药为背景的当前用药方案语义联合表示矩阵。应可以理解,在上述方案中,为了准确评估当前用药方案的合理性,需要综合考虑患者的历史用药记录、病历信息以及当前用药方案之间的语义关联关系。因此,在本申请的技术方案中,进一步引入基于Clip模型的药物语义关联模块,用于捕捉所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量之间的语义关联和交互信息。具体来说,Clip模型(Contrastive Language‑Image Pre‑training)是一种跨模态预训练模型,可以学习不同模态数据之间的特征对应关系,具有强大的联合编码能力。在本申请的技术方案中,将Clip模型应用于药物语义关联分析中,其通过学习所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量之间的语义关联关系,以实现当前用药方案和历史用药记录、病历信息的交叉理解,从而获得以历史用药为背景的当前用药方案语义联合表示,为后续用药合理性的准确判断提供了有力的支持。
[0051] 具体地,所述分类诊断单元152,用于将所述以历史用药为背景的当前用药方案语义联合表示矩阵通过基于分类器的用药监测器以得到所述监测结果,所述监测结果用于表示是否存在不合理用药。也就是,采用基于分类器的用药监测器来实现对用药合理性的最终评估。具体而言,所述基于分类器的用药监测器是预先训练好的分类模型,其利用训练好的分类算法对输入的所述以历史用药为背景的当前用药方案语义联合表示矩阵进行分析推理,学习到输入数据中的复杂模式和规律,并根据学习到的用药特征模式对用药合理性进行精准判断,从而快速、准确地识别出所述当前用药方案中不合理的用药情况,为医生提供及时的用药建议和风险提示,以保障患者的用药安全和治疗效果。
[0052] 应可以理解,在利用上述神经网络模型之前,需要对其进行训练。也就是说,在本申请的基于大数据的合理用药监测系统中,还包括用于对所述基于ALBERT模型的语义编码器、所述病历‑用药语义特征颗粒级动态合成模块、所述基于Clip模型的药物语义关联模块和所述基于分类器的用药监测器进行训练的训练模块。
[0053] 图6为根据本申请实施例的基于大数据的合理用药监测系统中训练模块的框图。如图6所示,所述训练模块200,包括:训练数据获取单元210,用于获取训练数据,所述训练数据包括患者对象的训练病历、训练用药记录和训练当前用药方案,以及,是否存在不合理用药的真实值;训练病历语义编码单元220,用于提取所述训练病历中的文本部分,并使用所述基于ALBERT模型的语义编码器对所述训练病历中的文本部分进行语义编码以得到训练病历语义编码特征向量;训练用药记录语义编码单元230,用于使用所述基于ALBERT模型的语义编码器对所述训练用药记录进行语义编码以得到训练用药记录语义编码特征向量;
训练数据动态合成单元240,用于使用所述病历‑用药语义特征颗粒级动态合成模块对所述训练用药记录语义编码特征向量和所述训练病历语义编码特征向量进行处理以得到训练病历‑用药逐粒度关联融合表示向量;训练用药方案语义编码单元250,用于使用所述基于ALBERT模型的语义编码器对所述训练当前用药方案进行语义编码以得到训练当前用药方案语义编码特征向量;训练数据关联交互编码单元260,用于使用所述基于Clip模型的药物语义关联模块对所述训练当前用药方案语义编码特征向量和所述训练病历‑用药逐粒度关联融合表示向量进行语义关联交互以得到训练以历史用药为背景的当前用药方案语义联合表示矩阵;分类损失单元270,用于将所述训练以历史用药为背景的当前用药方案语义联合表示矩阵通过所述基于分类器的用药监测器以得到类概率值和分类损失函数值;噪声损失单元280,用于基于所述类概率值,计算噪声损失函数值;模型训练单元290,用于以所述分类损失函数值和所述噪声损失函数值的加权和作为损失函数值对所述基于ALBERT模型的语义编码器、所述病历‑用药语义特征颗粒级动态合成模块、所述基于Clip模型的药物语义关联模块和所述基于分类器的用药监测器进行训练。
[0054] 在本申请的一个优选示例中,在模型训练过程中,在分类损失函数之外,进一步引入噪声损失函数,其中,所述噪声损失函数的计算具体为:获取所述训练以历史用药为背景的当前用药方案语义联合表示矩阵通过分类器得到的类概率值,并计算所述类概率值与一的差值的绝对值以得到概率差值;确定所述训练以历史用药为背景的当前用药方案语义联合表示矩阵作为特征集合的特征均值和特征方差;确定所述训练以历史用药为背景的当前用药方案语义联合表示矩阵中的每个特征值与所述类概率值的第一乘积和所述概率差值与所述特征均值的第二乘积;对所述训练以历史用药为背景的当前用药方案语义联合表示矩阵中的每个特征值对应的所述第一乘积与第二乘积的差值的平方求和并除以所述训练以历史用药为背景的当前用药方案语义联合表示矩阵的尺度以得到相除结果,其中所述训练以历史用药为背景的当前用药方案语义联合表示矩阵的尺度为所述训练以历史用药为背景的当前用药方案语义联合表示矩阵的宽度乘以高度;将所述类概率值和所述概率差值的平方和与所述特征方差相乘后,将所述相除结果减去相乘结果以得到所述噪声损失函数值。
[0055] 这里,针对训练病历和训练用药记录的文本语义颗粒级动态合成表示和训练当前用药方案的编码文本语义表示在全语义特征关联域内,由于不同源文本沿各自语义分布维度下的语义表达差异导致全语义特征关联表示集合的分布外噪声,引起所述训练以历史用药为背景的当前用药方案语义联合表示矩阵整体的类分布噪声,从而影响分类结果的准确性的问题,上述噪声损失函数通过基于所述训练以历史用药为背景的当前用药方案语义联合表示矩阵通过分类器的类概率值和概率差值所表达的类概率分布特性,来设定所述训练以历史用药为背景的当前用药方案语义联合表示矩阵的特征集合的分布外噪声相对于特征集合的伯努利采样实例的近似方差期望特性。
[0056] 由此,通过所述噪声损失函数来基于所述类概率值和所述概率差值表达的类概率分布特性来使用统计噪声分布进行分布特征噪声度量,可以基于所述训练以历史用药为背景的当前用药方案语义联合表示矩阵的每个特征值在分类过程中的类概率分布时针对期望方差的概率交叉随机选择特性,来对可能的采样噪声特征进行退化,从而在模型参数更新过程中实现自监督学习的类分布噪声消减,以改进所述训练以历史用药为背景的当前用药方案语义联合表示矩阵通过基于分类器的用药监测器得到的监测结果的准确性。
[0057] 综上,根据本申请实施例的基于大数据的合理用药监测系统被阐明,其采用基于深度学习的人工智能技术对患者的病历和用药记录进行语义分析,提取出患者病历和用药记录之间的语义融合特征,以了解患者的药物反应和治疗效果,并结合患者当前的用药方案,挖掘出以历史用药为背景的当前用药方案语义联合表示,从而智能评判患者的用药合理性。这样,可以实现对用药合理性的自动监测,并有效提高患者用药监测的效率和准确性。
[0058] 图7为根据本申请实施例的基于大数据的合理用药监测方法的流程图。如图7所示,根据本申请实施例的基于大数据的合理用药监测方法,包括步骤:S1,获取患者对象的病历和用药记录;S2,获取所述患者对象的当前用药方案;S3,对所述病历、所述用药记录和所述当前用药方案分别进行语义理解以得到病历语义编码特征向量、用药记录语义编码特征向量和当前用药方案语义编码特征向量;S4,使用病历‑用药语义特征颗粒级动态合成模块对所述用药记录语义编码特征向量和所述病历语义编码特征向量进行处理以得到病历‑用药逐粒度关联融合表示向量;S5,基于所述当前用药方案语义编码特征向量和所述病历‑用药逐粒度关联融合表示向量之间的语义关联交互特征,确定监测结果。
[0059] 这里,本领域技术人员可以理解,上述基于大数据的合理用药监测方法中的各个步骤的具体操作已经在上面参考图1到图6的基于大数据的合理用药监测系统的描述中得到了详细介绍,并因此,将省略其重复描述。
[0060] 以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,在本发明中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述实施例的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。
[0061] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理子单元,即可以位于一个地方,或者也可以分布到多个网络子单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0062] 对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
[0063] 此外,显然“包括”一词不排除其他子单元或步骤,单数不排除复数。系统权利要求中陈述的多个子单元也可以由一个子单元通过软件或者硬件来实现。
[0064] 最后应说明的是,为了例示和描述的目的已经给出了以上描述。此外,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。