技术领域
[0001] 本申请涉及金融数据处理领域,具体而言,涉及一种金融人工智能管理服务平台及金融业务处理方法。
相关背景技术
[0002] 相关技术中的大模型多为通用型大模型,在金融业务办理场景中,并不能很好的理解用户在办理金融业务时的需求,导致不能引导并协助用户办理所需业务。
[0003] 针对上述的问题,目前尚未提出有效的解决方案。
具体实施方式
[0026] 为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0027] 需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0028] 相关技术中的大模型多为通用型大模型,在金融业务办理场景中,并不能很好的理解用户在办理金融业务时的需求,导致不能引导并协助用户办理所需业务。另外,相关技术中的大模型在使用时存在执行流程复杂,对设备要求高;不适合特定应用场景,无法满足特定用户需求;模型参数过大,对算力要求严苛;应用场景分散且应用功能较为单一等问题。
[0029] 具体地,相关技术中的模型用户在操作时需要多步骤操作,这不仅增加了操作难度,也可能导致效率降低,特别是在需要快速反应的应用场景中,复杂的流程会大大影响使用效果。技术实现可能对执行设备的性能要求非常高,这在一些资源受限的环境中显得尤为突出。例如,在缺乏高性能计算设备的地区,这一点尤其成为限制大模型技术在金融业务领域普及和应用的重要因素。
[0030] 并且相关技术中的大模型在实际应用场景中的适应性较差,无法完全满足用户的具体需求。例如,在某些特定的应用场景中,大模型可能无法有效解决问题,或者其输出结果与实际需求不符。此外,大模型在处理事实性知识时也存在缺乏领域知识和实时知识的问题,导致其在某些情况下提供错误或过时的信息。
[0031] 另外相关技术中所采用的通用大模型的结构非常复杂,使得模型的解释性变得困难,导致模型的计算量增加,影响模型的效率。如果技术采用的模型参数过大,将对算力提出更高要求。这不仅增加了对高性能GPU的需求,还可能因国际环境的紧张而难以获得所需的硬件资源。如果技术基于如LLAMA2或LLAMA3等英文模型构建,其参数优化主要基于英文的数据语料库,可能导致在处理中文问题时存在理解不准确、信息错误、信息缺失或滞后的问题。这种情况在需要高度本地化或文化特定的应用中尤为明显。
[0032] 而且目前在银行等金融相关行业中使用的大模型应用多分布在各行内的不同系统、不同领域,用户在实际使用过程中,往往需要在不同的业务系统之间切换,以充分利用大模型的功能。这反应了银行业大模型应用在集成度与用户体验方面存在的挑战。尽管各系统独立部署大模型有利于针对性地解决特定业务问题,但也可能导致数据孤岛、功能重复建设以及用户操作复杂化。
[0033] 为了解决上述问题,本申请实施例中提供了相关的解决方案,以下详细说明。
[0034] 根据本申请实施例,提供了一种金融人工智能管理服务平台的装置实施例,以及金融业务处理方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0035] 本申请实施例所提供的方法实施例和装置实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现金融人工智能管理服务平台及金融业务处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
[0036] 应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
[0037] 存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的金融业务处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的金融人工智能管理服务平台及金融业务处理方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0038] 传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
[0039] 显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
[0040] 在上述运行环境下,本申请实施例提供了一种金融人工智能管理服务平台,如图2所示,该平台包括:交互模块20,语义分析模块22,检索模块24,模型调度模块26和模型集合28,其中,交互模块20,用于接收用户输入的业务办理文本,并将业务办理文本转发至语义分析模块22,其中,业务办理文本用于指示用户期望办理的金融业务;语义分析模块22,用于采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;
交互模块20,还用于向用户展示语义分析模块22获取的各个备选业务及其描述信息,以及参考数据链接,以及依据用户的选取操作从各个备选业务中确定目标业务;模型调度模块
26,用于依据目标业务从模型集合28中调取与目标业务对应的目标模型来处理目标业务,其中,模型集合28中包括多个不同结构的神经网络模型。
[0041] 在本申请的一些实施例中,语义分析模块22还用于:依据用户通过交互模块20对参考数据链接的修改操作,更新参考数据链接对应的参考数据集合,其中,修改操作包括:增加参考数据链接,删除参考数据链接;指示大语言模型依据更新后的参考数据集合再次对业务办理文本进行处理,得到更新后的备选业务及其描述信息。
[0042] 作为一种可选的实施方式,模型集合28中的各个模型采用以下方式训练:在待训练模型中确定第一类模型参数和第二类模型参数,其中,第一类模型参数的数量大于第二类模型参数的数量;采用线性残差调整的方式对第二类模型参数进行训练,并在训练过程中冻结第一类模型参数;合并第一类模型参数和对第二类模型参数训练后得到的旁路矩阵参数,得到训练完成的模型。
[0043] 具体的,线性残差调整指的是在模型的输出层之前,加入一个或多个线性层(全连接层),这些层可以学习如何将模型的内部表示转换为最终的输出。以下是具体的训练过程:
[0044] 第一步,冻结底层参数:在微调阶段,会冻结预训练模型的底层参数,以防止在新的任务上过度训练而破坏模型在原始任务上学到的知识。
[0045] 第二步,添加线性层:在模型的最后一层或几层之前,添加一个或多个线性层(也称为全连接层),这些层将模型的内部表示映射到所需的输出空间。
[0046] 第三步,训练线性层:在新的任务数据上,只训练这些新增的线性层,而预训练模型的底层参数保持不变。通过这种方式,模型可以快速适应新任务,而无需从头开始训练整个模型。
[0047] 第四步,残差连接: 在某些情况下,线性层可能会与残差连接(Residual Connections)结合使用。残差连接允许原始模型的内部表示直接影响到输出,这有助于缓解梯度消失问题,并允许更深层次的网络训练。
[0048] 第五步,损失函数优化:使用适当的损失函数(如交叉熵损失、均方误差等)来衡量模型在新任务上的表现,并通过反向传播算法来优化线性层的参数。
[0049] 另外,上述旁路矩阵指的是在深度学习网络中,为了增加网络的表达能力或者实现某些特定功能,而添加的额外的权重矩阵,旁路矩阵是一种可以学习或设计的权重矩阵,它可以在网络中创建额外的路径,使得信息在网络中可以有不同的流动方式。
[0050] 在本申请的一些实施例中,语义分析模块22采用大语言模型处理业务办理文本包括:将业务办理文本转换为业务办理文本向量;采用大语言模型在预设向量库中确定与业务办理文本向量匹配的知识向量;采用大语言模型处理业务办理文本向量和与业务办理文本向量匹配的知识向量。
[0051] 作为一种可选的实施方式,模型调度模块26从模型集合28中调取与目标业务对应的目标模型来处理目标业务包括:依据模型集合28中的模型与目标业务之间的相关性,得到第一筛选模型集合28,其中,第一筛选模型集合28中的模型为与目标业务之间的相关性指标符合预设要求的模型;获取第一筛选模型集合28中的各个模型处理目标业务后得到的业务处理结果,再次从各个业务处理结果中筛选得到目标业务处理结果并向用户展示。
[0052] 在本申请的一些实施例中,在对模型集合28中的模型进行筛选时,除了先对模型进行筛选,在对模型结果进行筛选外,还可以采用两阶段排名优化的方式。例如,在用户输入查询指令后,在第一阶段的排序过程中,可以使用简单模型和少量特征快速筛选出相关性在前列的一定数量的结果。之后在第二阶段的排序过程中,还可以使用复杂模型和大量特征进行详细排序,并将排序前列的若干个结果展示给用户。通过这种两阶段的排序策略,可以在保证排序效率的同时,提高排序的准确性和用户满意度。适用于需要处理大量候选结果,同时又要求排序质量的应用场景。
[0053] 在本申请的一些实施例中,模型调度模块26从模型集合28中调取与目标业务对应的目标模型来处理目标业务包括:确定与目标业务对应的任务处理流程,其中,任务处理流程用于指示处理目标业务所需调用的业务系统;通过目标模型依据任务处理流程调用业务系统来处理目标业务。
[0054] 作为一种可选的实施方式,模型调度模块26从模型集合28中调取与目标业务对应的目标模型来处理目标业务包括:向用户展示备选模型集合28以及备选模型集合28中的各个模型的模型描述信息;依据用户的选择操作从备选模型集合28中确定目标模型,并指示目标模型处理用户输入的数据。
[0055] 在本申请的一些实施例中,金融人工智能管理服务平台还包括检索数据库,其中,检索数据库包括金融知识图谱,向量数据库,关系型数据库,互联网知识库。
[0056] 作为一种可选的实施方式,语义分析模块22还用于:从业务办理文本中提取关键词;依据关键词采用倒排索引的方式在检索数据库中确定与关键词对应的文档标识信息;确定各个文档标识信息对应的文档与关键词之间的相关性;依据相关性从文档标识对应的文档中确定目标文档作为大语言模型的参考文档,以及生成相关性最大的文档的文档摘要并通过交互模块20展示给用户。
[0057] 具体的,在本申请实施例所提供的平台中,可以结合正排索引和倒排索引来构建一个高效的知识搜索引擎,结合正排索引和倒排索引,既能够快速定位到包含查询词汇的文档,也能够快速获取文档的详细内容。在检索相关参考文件时,可以对索引进行优化,例如为高频词汇和低频词汇采取不同的索引策略,使用缓存机制加速热词检索。具体搜索流程可以包括如下步骤:
[0058] 第一步,查询解析:用户输入查询后,搜索引擎首先对查询进行解析,比如分词、去除停用词等。
[0059] 第二步,索引查询:使用倒排索引找到所有匹配查询词汇的文档ID。
[0060] 第三步,相关性排序:根据文档与查询的相关性对文档进行排序,相关性通过TF‑IDF(词频‑逆文档频率)、BM25等算法计算。
[0061] 第四步,结果展示: 根据排序结果,展示最相关的文档内容或摘要给用户。
[0062] 在本申请的一些实施例中,当在数据库中搜寻相关资料时,可以采用text2SQL算法将自然语言查询文本转换为SQL查询指令,具体包括以下步骤:
[0063] 第一步,数据预处理,将输入的自然语言查询文本进行分词处理,分解成单词或短语。词性标注:对分词后的每个词进行词性标注,如名词、动词、形容词等。识别文本中的命名实体,如表名、字段名等。对句子进行句法分析,构建句子的依赖树,理解词语之间的关系。
[0064] 第二步,查询意图理解,确定用户的查询意图,比如是查询数据、更新数据还是其他操作。
[0065] 第三步,SQL查询生成,模板匹配:根据逻辑形式选择合适的SQL模板。查询构建:根据逻辑形式和模板,填充具体的表名、字段名、条件等,构建完整的SQL查询语句。
[0066] 在上述运行环境下,本申请实施例还提供了一种金融业务处理方法,适用于图2中的金融人工智能管理服务平台中。如图3所示,该方法包括如下步骤:
[0067] 步骤S302, 接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;
[0068] 在步骤S302所提供的技术方案中,为了解决大模型生成式内容在银行业务场景应用过程中可解释性问题,可以依托向量数据库、知识图谱、分布式大数据等来构筑银行等金融服务商的金融价值矩阵,从而逐步形成覆盖业务营销、操作指引、资产配置、合规安全、财务分析全场景的金融知识图谱。这样在对用户输入的业务办理文本进行语义识别时,可以结合金融知识图谱并通过正排、倒排多种索引融合的知识搜索引擎,为大模型生成内容提供了准确、可靠、有效的知识来源,并在用户交互过程中给出引述来源,让大模型生成内容“言之有理”。另外还可以让大语言模型与外部的实时数据库对接,来提高大模型对新闻媒体数据的实时问答能力。
[0069] 另外,作为一种可选的实施方式,可以构建指标知识领域的专家模型,并让大语言模型与该专家模型连接,解耦底层数据仓库复杂数据结构。从而实现了让大语言模型更精准理解数据的同时避免AI幻觉现象的发生。
[0070] 步骤S304,采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;
[0071] 作为一种可选的实施方式,上述大语言模型还可以以对话交互的方式,提供文案编写、代码生成、知识问答等基础功能,以及RPA任务执行、企业信息查询、系统调用等扩展功能。
[0072] 在本申请的一些实施例中,为了提升大语言模型的安全性和可解释性,可以构建语义向量库,并利用大模型的信息组织和语言生成能力,实现准确、可解释的语义生成,满足银行业务场景对于模型准确性、可解释性的要求,满足银行基于大模型知识应用的需求。
[0073] 另外为了实现高效的知识管理和便捷的检索调用,这些知识在入库前需经历严格的整理与结构化处理。每一条数据都将被仔细分类,按照其内容属性归入相应的主题区域,如宏观经济分析、金融科技动态、个人理财知识等。这样的分区分类不仅有助于提升知识库的系统性,也极大方便了用户在海量信息中迅速定位所需内容。
[0074] 可选的,为了保证知识库的时效性和全面性,还可以采用定时跑批任务自动化录入机制。这种自动化流程能够定期抓取上述各类来源的新鲜资讯,自动完成信息的筛选、格式转换与标准化处理,随后无缝对接至知识库系统内,减少了人工操作的繁琐与延迟,保证了知识库内容的持续更新与扩充。
[0075] 在步骤S304所提供的技术方案中,采用大语言模型处理业务办理文本的步骤包括:将业务办理文本转换为业务办理文本向量;采用大语言模型在预设向量库中确定与业务办理文本向量匹配的知识向量;采用大语言模型处理业务办理文本向量和与业务办理文本向量匹配的知识向量。
[0076] 具体的,在处理业务办理文本时,可以先对文本中的用户问题进行深层次的语义解析与向量化处理。这一过程相当于将自然语言文本转化为机器可理解的数学向量,每个向量代表了问题的语义特征,使机器能够跨越词汇层面理解问题的本质。
[0077] 之后,可以将用户问题的向量与预先构建的庞大知识库中的向量进行高效匹配。这个知识库包含了从各类来源精心整理的结构化与非结构化信息,每一个知识点都经过向量化处理,形成了一个高维空间中的“知识宇宙”。通过计算用户问题向量与库中各知识点向量的相似度,系统快速筛选出最相关的答案候选,实现精准的匹配。
[0078] 作为一种可选的实施方式,为了进一步拓展知识边界,还可以让大语言模型对接互联网上的各类插件与API接口,主动吸纳来自社交媒体、专业论坛、在线课程等更广泛渠道的高质量内容。这不仅极大地丰富了知识库的覆盖面,还促进了跨领域的知识融合。
[0079] 并且为了保障数据的安全性,对于需要调用外部数据的情况,可以对API接口进行筛选,并让大语言模型只和通过筛选的可靠API接口与外部数据进行通信。这些数据可以包括但不限于天气预报、财经资讯、地理信息等。
[0080] 步骤S306,向用户展示各个备选业务及其描述信息,以及参考数据链接;
[0081] 在步骤S306所提供的技术方案中,向用户展示各个备选业务及其描述信息,以及参考数据链接后,金融业务处理方法还包括:依据用户对参考数据链接的修改操作,更新参考数据链接对应的参考数据集合,其中,修改操作包括:增加参考数据链接,删除参考数据链接;指示大语言模型依据更新后的参考数据集合再次对业务办理文本进行处理,得到更新后的备选业务及其描述信息。
[0082] 步骤S308,依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务。
[0083] 在步骤S308所提供的技术方案中,模型集合中的各个模型采用以下方式训练:在待训练模型中确定第一类模型参数和第二类模型参数,其中,第一类模型参数的数量大于第二类模型参数的数量;采用线性残差调整的方式对第二类模型参数进行训练,并在训练过程中冻结第一类模型参数;合并第一类模型参数和对第二类模型参数训练后得到的旁路矩阵参数,得到训练完成的模型。
[0084] 在本申请的一些实施例中,可以采用线性残差调整(LoRA)的方式对各个模型进行微调,实现在保留预训练模型大部分参数不变的基础上,仅针对少量权重进行局部调整。这有助于在不破坏原有模型通用性的同时,强化其对金融场景的适应能力。
[0085] 具体的,在对模型进行训练时,首先采取了冻结预训练模型参数的策略,这意味着模型在微调过程中,其主体部分的参数不会发生显著变化,这样可以保护模型原有的语言理解和生成能力不受损失。在微调训练完成后,将预训练模型原有的参数与经过训练得到的旁路矩阵参数结合起来,实现两者的叠加。采用这种方式训练后的模型在预测和生成金融相关文本内容时,既能充分调动预训练模型的广泛知识储备,又能精确反映金融业务领域的专门知识和实践规则,从而大大提升了模型对于各种复杂金融场景的泛化能力和应用效果。
[0086] 作为一种可选的实施方式,从模型集合中调取与目标业务对应的目标模型来处理目标业务包括:依据模型集合中的模型与目标业务之间的相关性,得到第一筛选模型集合,其中,第一筛选模型集合中的模型为与目标业务之间的相关性指标符合预设要求的模型;获取第一筛选模型集合中的各个模型处理目标业务后得到的业务处理结果,再次从各个业务处理结果中筛选得到目标业务处理结果并向用户展示。
[0087] 在本申请的一些实施例中,从模型集合中调取与目标业务对应的目标模型来处理目标业务的步骤包括:向用户展示备选模型集合以及备选模型集合中的各个模型的模型描述信息;依据用户的选择操作从备选模型集合中确定目标模型,并指示目标模型处理用户输入的数据。
[0088] 具体的,上述模型集合可以被设置为模型应用市场。用户可以根据自身需求灵活选择适合的模型进行交互与应用开发,比如在文本生成、智能问答、自动摘要、创意写作、代码编写、智能客服等领域寻找最匹配的服务模型。
[0089] 另外需要说明的是,也可以采用多个模型协同工作的方式来处理用户期望办理的金融业务或其他需求。例如,通过多模型协同工作,可以在面对复杂问题时,提供多种解决方案供客户选择。每个模型根据其独特的算法和训练数据,对同一问题可能会给出不同的答案。这样,客户可以从多个角度进行比较和选择,找到最符合自己需求的答案。这种多元化的答案选择机制,极大地提高了客户满意度和问题解决的准确性。
[0090] 作为一种可选的实施方式,从模型集合中调取与目标业务对应的目标模型来处理目标业务的步骤包括:确定与目标业务对应的任务处理流程,其中,任务处理流程用于指示处理目标业务所需调用的业务系统;通过目标模型依据任务处理流程调用业务系统来处理目标业务。
[0091] 作为一种可选的实施方式,当大语言模型确认了用户期望办理的业务,也就是对用户的问题完成分发和识别后,可以进一步确定与用户的问题匹配的RPA流程,并激活该流程对应的PRA任务。之后可以调用对应的模型依据PRA任务跨系统完成各项操作,如数据抓取、表单填写、系统间信息同步等。这种能力使得系统能够动态响应用户需求,即时生成或更新信息,大大增强了即时性和效率。
[0092] 在本申请的一些实施例中,可以基于大语言模型的流程编排能力,深度整合插件调用、文件解析、知识库录入、大模型等多项服务来实现流程化、智能化、高效的AI Agent能力。具体的,可以将Agent与知识相连接,同时发展Agent各种技能,理解用户意图、进行任务规划、任务分解,完成各种各样的业务任务。集成BGE、multilingual‑e5‑large等多个向量化模型,可自主构建业务知识库。将业务数据进行沉淀,实现Agent感知和理解的功能。另外对于逻辑复杂的多步骤任务场景,可灵活组装多个节点,有稳定的输出结构,支持重复任务执行。可继承行内现有能力或自主增加能力作为Agent技能,促进基础技能、业务技能的不断沉淀与提升,提高的大模型服务开发效率。
[0093] 在本申请的一些实施例中,办理金融业务的完整流程如图4所示,包括用户输入、意图理解、知识检索、模型输出和界面返回五个步骤。其中,从图4中可以看出,用户输入的内容可以为文本或者语音,其中在输入内容为语音的情况下会先将语音转换为文本后再进行进一步的处理。之后可以使用基于大语言模型的意图引擎基于知识图谱、向量数据库、关系型数据库和互联网知识库等数据源中的数据对用户意图进行理解,并根据理解结果组装提示模板后,由另一个大模型根据提示模板从模型集合中确定对应的模型来处理用户期望处理的金融业务。之后可以将业务处理结果以多种方式向用户展示,如文字输出,语音播报,图标输出等,另外可以将参考数据来源一并展示给用户。当用户认为当前处理结果不是自己期望的结果时,可以通过选择重新生成来重复执行图4所示的业务办理流程。
[0094] 通过采用接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;向用户展示各个备选业务及其描述信息,以及参考数据链接;依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务的方式,通过采用大语言模型依据业务办理文本确定备选业务,并在用户从备选业务中选择了目标业务后调取与目标业务对应的目标模型来处理目标业务,达到了准确确定用户期望办理的金融业务的目的,从而实现了高效引导并协助用户办理所需金融业务的技术效果,进而解决了由于相关技术中不能引导并协助用户办理所需的金融业务导致的业务办理成功率低且耗时过长的技术问题。
[0095] 另外需要说明的是,由于图3中的金融业务处理方法可在图2中所示的金融人工智能管理服务平台中执行,因此对图3中的金融业务处理方法的相关解释说明也适用于图2中所示的金融人工智能管理服务平台中。
[0096] 本申请实施例提供了一种金融业务办理装置,图5是该装置的结构示意图。从图5中可以看出,该装置包括:第一处理模块50,用于接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;第二处理模块52,用于采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;第三处理模块54,用于向用户展示各个备选业务及其描述信息,以及参考数据链接;第四处理模块56,用于依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务。
[0097] 在本申请的一些实施例中,第二处理模块52采用大语言模型处理业务办理文本的步骤包括:将业务办理文本转换为业务办理文本向量;采用大语言模型在预设向量库中确定与业务办理文本向量匹配的知识向量;采用大语言模型处理业务办理文本向量和与业务办理文本向量匹配的知识向量。
[0098] 在本申请的一些实施例中,向用户展示各个备选业务及其描述信息,以及参考数据链接后,第三处理模块54还用于:依据用户对参考数据链接的修改操作,更新参考数据链接对应的参考数据集合,其中,修改操作包括:增加参考数据链接,删除参考数据链接;指示大语言模型依据更新后的参考数据集合再次对业务办理文本进行处理,得到更新后的备选业务及其描述信息。
[0099] 在本申请的一些实施例中,模型集合中的各个模型采用以下方式训练:在待训练模型中确定第一类模型参数和第二类模型参数,其中,第一类模型参数的数量大于第二类模型参数的数量;采用线性残差调整的方式对第二类模型参数进行训练,并在训练过程中冻结第一类模型参数;合并第一类模型参数和对第二类模型参数训练后得到的旁路矩阵参数,得到训练完成的模型。
[0100] 在本申请的一些实施例中,第四处理模块56从模型集合中调取与目标业务对应的目标模型来处理目标业务的步骤包括:依据模型集合中的模型与目标业务之间的相关性,得到第一筛选模型集合,其中,第一筛选模型集合中的模型为与目标业务之间的相关性指标符合预设要求的模型;获取第一筛选模型集合中的各个模型处理目标业务后得到的业务处理结果,再次从各个业务处理结果中筛选得到目标业务处理结果并向用户展示。
[0101] 在本申请的一些实施例中,第四处理模块56从模型集合中调取与目标业务对应的目标模型来处理目标业务的步骤包括:向用户展示备选模型集合以及备选模型集合中的各个模型的模型描述信息;依据用户的选择操作从备选模型集合中确定目标模型,并指示目标模型处理用户输入的数据。
[0102] 在本申请的一些实施例中,第四处理模块56从模型集合中调取与目标业务对应的目标模型来处理目标业务的步骤包括:确定与目标业务对应的任务处理流程,其中,任务处理流程用于指示处理目标业务所需调用的业务系统;通过目标模型依据任务处理流程调用业务系统来处理目标业务。
[0103] 需要说明的是,上述金融业务办理装置中的各个模块可以是程序模块(例如是实现某种特定功能的程序指令集合),也可以是硬件模块,对于后者,其可以表现为以下形式,但不限于此:上述各个模块的表现形式均为一个处理器,或者,上述各个模块的功能通过一个处理器实现。
[0104] 根据本申请实施例,还提供了一种非易失性存储介质,非易失性存储介质中存储有程序,其中,在程序运行时控制非易失性存储介质所在设备执行如下金融业务处理方法:接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;向用户展示各个备选业务及其描述信息,以及参考数据链接;依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务。
[0105] 根据本申请实施例,还提供了一种电子设备,包括:存储器和处理器,处理器用于运行存储在存储器中的程序,其中,程序运行时执行如下金融业务处理方法:接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;向用户展示各个备选业务及其描述信息,以及参考数据链接;依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务。
[0106] 根据本申请实施例,还提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现如下金融业务处理方法:接收用户输入的业务办理文本,其中,业务办理文本用于指示用户期望办理的金融业务;采用大语言模型处理业务办理文本,得到大语言模型依据业务办理文本输出的备选业务,各个备选业务的描述信息,以及大语言模型处理业务办理文本时采用的参考数据链接;向用户展示各个备选业务及其描述信息,以及参考数据链接;依据用户的选取操作从各个备选业务中确定目标业务,并从模型集合中调取与目标业务对应的目标模型来处理目标业务。
[0107] 在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0108] 在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0109] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0110] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0111] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0112] 以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。