首页 / 一种农户项目信息推送方法及系统

一种农户项目信息推送方法及系统实质审查 发明

技术领域

[0001] 本发明属于信息处理技术领域,尤其涉及一种农户项目信息推送方法及系统。

相关背景技术

[0002] 目前项目信息主要分布在不同政府的网站,网络是发布、查看、获取项目信息的最主要途径和手段。但是,由于各种项目策的类型不同、发布时间不同、管理部门不同,导致项目信息非常分散,需要花费大量的时间和精力在各个政府的网站上寻找。
[0003] 目前,可以通过爬虫手段将各个网站的项目信息进行归集,并在归集后供农户进行检索查询,但是在农户与系统进行检索交互的过程中,农户可能在一开始输入过程中就发生了输入不完整或输入错误的现象,后续若直接根据农户的输入进行进行项目信息推送,则可能导致项目信息推送错误。

具体实施方式

[0028] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0029] 请参阅图1,其示出了本申请的一种农户项目信息推送方法的流程图。
[0030] 如图1所示,农户项目信息推送方法具体包括以下步骤:
[0031] 步骤S101,响应于农户的第一操作信息,根据所述第一操作信息爬取至少一个项目文本信息,其中,所述第一操作信息中包含项目文本信息的第一标签。
[0032] 在本步骤中,第一操作信息可以是农户输入的文本信息,该文本信息中包含关键字,还可以是语音信息。例如,农户在系统的搜索栏中输入包含“一村一名大学生工程”的关键词,系统在数据库中查找包含该关键词(一村一名大学生工程)的所有项目文本信息。
[0033] 需要说明的是,响应于农户的第一操作信息,根据第一操作信息采用多个爬虫工具爬取多个网站中的项目文本信息,多个爬虫工具为针对不同网站预先配置的爬虫工具。
[0034] 步骤S102,基于预设的信息分类模型将所述至少一个项目文本信息存储至预先构建的项目信息库中,得到目标项目信息库,其中,所述目标项目信息库中包含不同类别的至少一个目标项目信息子库。
[0035] 在本步骤中,信息分类模型可以是预先根据已标注项目元素分类的项目文本信息,通过对神经网络等模型进行机器学习,训练得到的能够根据未知项目元素分类的项目文本信息,预测其对应的项目元素分类的模型。
[0036] 本发明实施例中提供的项目元素包括但不限于如下几种:主题分类、行业分类、项目层级、项目受众、项目专题。本领域技术人员可根据实际情况具体调整,本发明对此不作限定。例如,对于“项目层级”这个项目元素,可预先配置国家级、省级、地市级、区县级等分类。对于“项目受众”这个政策元素,可预先配置个人和企业两种类型。
[0037] 步骤S103,采用预设的第一抽取规则在各个目标项目信息子库中分别抽取相应的某一第一目标项目信息,并将抽取后的各个所述某一第一目标项目信息经由传输队列上传至第一显示框中。
[0038] 在本步骤中,在某一目标项目信息库中查找是否存在与第一操作信息相对应的至少一个第一目标项目信息;若存在,则基于时间顺序对至少一个第一目标项目信息进行排序,得到与某一目标项目信息库相对应的第一目标项目信息序列;将第一目标项目信息序列中的第一个目标项目信息作为与某一目标项目信息库相对应的某一第一目标项目信息,并在第一目标项目信息序列中去除某一第一目标项目信息,得到更新后的第二目标项目信息序列;若不存在,则基于时间顺序对某一目标项目信息库中的所有目标项目信息进行排序,得到与某一目标项目信息库相对应的第三目标项目信息序列;将第三目标项目信息序列中的第一个目标项目信息作为与某一目标项目信息库相对应的某一第一目标项目信息,并在第三目标项目信息序列中去除某一第一目标项目信息,得到更新后的第四目标项目信息序列。
[0039] 步骤S104,响应于在预设时间段内农户对所述第一显示框的至少一个第二操作信息,并判断所述至少一个第二操作信息中包含的项目文本信息的第二标签是否与所述第一标签一致。
[0040] 在一个具体实施例中,若至少一个第二操作信息中包含的项目文本信息的第二标签与第一标签一致,则直接根据至少一个第二操作信息构建第二长期兴趣标签,以及基于至少一个第二操作信息的数量确定与第二长期兴趣标签相对应的第三权重;根据第二长期兴趣标签的第三权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据至少一个第二目标项目信息对第一显示框进行更新,得到第二显示框。
[0041] 在另一个具体实施例中,若所有第二操作信息中包含的项目文本信息的第二标签均与第一标签不一致,则直接根据至少一个第二操作信息构建第二短期兴趣标签,以及基于至少一个第二操作信息的数量确定与第二短期兴趣标签相对应的第四权重;根据第二短期兴趣标签的第四权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据至少一个第二目标项目信息对第一显示框进行更新,得到第二显示框。
[0042] 需要说明的是,在与第二短期兴趣标签的类型相同的目标项目信息子库中抽取第三数量的第二目标项目信息,其中,所述第三数量为第三权重与第一显示框中所有目标项目信息的数量的乘积。
[0043] 步骤S105,若某一第二操作信息中包含的项目文本信息的第二标签与所述第一标签不一致,则基于所述某一第二操作信息构建短期兴趣标签以及基于所述某一第二操作信息的数量确定与所述短期兴趣标签相对应的第一权重。
[0044] 在本步骤中,若某一第二操作信息中包含的项目文本信息的第二标签与第一标签不一致,则将某一第二操作信息中包含的项目文本信息的第二标签定义为短期兴趣标签,以及在第一显示框中获取与短期兴趣标签相对应的至少一个第一已显示目标项目信息;根据至少一个第一已显示目标项目信息的数量与目标数量的比值确定与短期兴趣标签相对应的第一权重,其中,目标数量为与至少一个第二操作信息相对应的所有目标项目信息的数量。
[0045] 步骤S106,根据其他第二操作信息构建第一长期兴趣标签,以及基于所述其他第二操作信息的数量确定与所述第一长期兴趣标签相对应的第二权重,其中,所述其他第二操作信息为所述至少一个第二操作信息中除去某一第二操作信息的所有第二操作信息。
[0046] 在本步骤中,将其他第二操作信息中包含的项目文本信息的第一标签定义为长期兴趣标签,以及在第一显示框中获取与长期兴趣标签相对应的至少一个第二已显示目标项目信息;根据至少一个第二已显示目标项目信息的数量与目标数量的比值确定与短期兴趣标签相对应的第二权重,其中,目标数量为与至少一个第二操作信息相对应的所有目标项目信息的数量。
[0047] 步骤S107,根据所述短期兴趣标签的第一权重、所述第一长期兴趣标签的第二权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据所述至少一个第二目标项目信息对所述第一显示框进行更新,得到第二显示框。
[0048] 在本步骤中,在与短期兴趣标签的类型相同的目标项目信息子库中抽取第一数量的第二目标项目信息,其中,第一数量为第一权重与第一显示框中所有目标项目信息的数量的乘积。
[0049] 进一步地,获取长期兴趣标签的类型相同的至少一个第一目标项目信息子库,并将各个第一目标项目信息子库中的第二目标项目信息序列进行对齐;采用滑动窗口同时在各个第二目标项目信息序列上滑动,并判断当前滑动窗口中的第一目标项目信息的数量是否大于预设数量阈值,预设数量阈值为第二权重与第一显示框中所有目标项目信息的数量的乘积;若当前滑动窗口中的第一目标项目信息的数量大于预设数量阈值,则在当前滑动窗口中随机抽取等于预设数量阈值的第一目标项目信息;若当前滑动窗口中的第一目标项目信息的数量不大于预设数量阈值,则获取下一滑动窗口中的第一目标项目信息,直至所有滑动窗口中的所有第一目标项目信息的数量大于预设数量阈值;抽取当前滑动窗口中的所有第一目标项目信息,并在下一滑动窗口中随机抽取等于目标数量的第一目标项目信息,目标数量等于预设数量阈值与当前滑动窗口中所有第一目标项目信息的数量的差值。
[0050] 综上,农户与系统交互过程中,农户可能在一开始输入过程中就发生了输入不完整或输入错误的现象,后续若直接根据农户的输入进行进行项目信息推送,则可能导致项目信息推送错误,因此,本申请的方法,通过将第一操作信息包含的第一标签设定为长期兴趣标签,以及将第二操作信息设定为短期兴趣标签,若农户的第一操作信息输入正确,后续操作第二操作信息时,使长期兴趣标签的权重增加,能够较为快速的向农户推送所需的项目信息,若农户的第一操作信息输入不正确或部分存在错误,通过后续操作第二操作信息,使长期兴趣标签的权重减少,能够根据农户的浏览行为,不需要用户直接参与,进而实现向农户推送可能需要的项目信息,并且在基于第一抽取规则更新的目标项目信息序列的基础上,采用第二抽取规则进行再次抽取,使得在整个信息推送过程为一个正反馈的过程,便于对农户进行启发式的不断操作,直至完成爬取的项目信息推送。
[0051] 请参阅图2,其示出了本申请的一种农户项目信息推送系统的结构框图。
[0052] 如图2所示,农户项目信息推送系统200,包括爬取模块210、存储模块220、第一抽取模块230、判断模块240、第一构建模块250、第二构建模块260以及第二抽取模块270。
[0053] 其中,爬取模块210,配置为响应于农户的第一操作信息,根据所述第一操作信息爬取至少一个项目文本信息,其中,所述第一操作信息中包含项目文本信息的第一标签;
[0054] 存储模块220,配置为基于预设的信息分类模型将所述至少一个项目文本信息存储至预先构建的项目信息库中,得到目标项目信息库,其中,所述目标项目信息库中包含不同类别的至少一个目标项目信息子库;
[0055] 第一抽取模块230,配置为采用预设的第一抽取规则在各个目标项目信息子库中分别抽取相应的某一第一目标项目信息,并将抽取后的各个所述某一第一目标项目信息经由传输队列上传至第一显示框中;
[0056] 判断模块240,配置为响应于在预设时间段内农户对所述第一显示框的至少一个第二操作信息,并判断所述至少一个第二操作信息中包含的项目文本信息的第二标签是否与所述第一标签一致;
[0057] 第一构建模块250,配置为若某一第二操作信息中包含的项目文本信息的第二标签与所述第一标签不一致,则基于所述某一第二操作信息构建短期兴趣标签以及基于所述某一第二操作信息的数量确定与所述短期兴趣标签相对应的第一权重;
[0058] 第二构建模块260,配置为根据其他第二操作信息构建长期兴趣标签,以及基于所述其他第二操作信息的数量确定与所述长期兴趣标签相对应的第二权重,其中,所述其他第二操作信息为所述至少一个第二操作信息中除去某一第二操作信息的所有第二操作信息;
[0059] 第二抽取模块270,配置为根据所述短期兴趣标签的第一权重、所述长期兴趣标签的第二权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据所述至少一个第二目标项目信息对所述第一显示框进行更新,得到第二显示框。
[0060] 应当理解,图2中记载的诸模块与参考图1中描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征以及相应的技术效果同样适用于图2中的诸模块,在此不再赘述。
[0061] 在另一些实施例中,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序指令被处理器执行时,使所述处理器执行上述任意方法实施例中的农户项目信息推送方法;
[0062] 作为一种实施方式,本发明的计算机可读存储介质存储有计算机可执行指令,计算机可执行指令设置为:
[0063] 响应于农户的第一操作信息,根据所述第一操作信息爬取至少一个项目文本信息,其中,所述第一操作信息中包含项目文本信息的第一标签;
[0064] 基于预设的信息分类模型将所述至少一个项目文本信息存储至预先构建的项目信息库中,得到目标项目信息库,其中,所述目标项目信息库中包含不同类别的至少一个目标项目信息子库;
[0065] 采用预设的第一抽取规则在各个目标项目信息子库中分别抽取相应的某一第一目标项目信息,并将抽取后的各个所述某一第一目标项目信息经由传输队列上传至第一显示框中;
[0066] 响应于在预设时间段内农户对所述第一显示框的至少一个第二操作信息,并判断所述至少一个第二操作信息中包含的项目文本信息的第二标签是否与所述第一标签一致;
[0067] 若某一第二操作信息中包含的项目文本信息的第二标签与所述第一标签不一致,则基于所述某一第二操作信息构建短期兴趣标签以及基于所述某一第二操作信息的数量确定与所述短期兴趣标签相对应的第一权重;
[0068] 根据其他第二操作信息构建第一长期兴趣标签,以及基于所述其他第二操作信息的数量确定与所述第一长期兴趣标签相对应的第二权重,其中,所述其他第二操作信息为所述至少一个第二操作信息中除去某一第二操作信息的所有第二操作信息;
[0069] 根据所述短期兴趣标签的第一权重、所述第一长期兴趣标签的第二权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据所述至少一个第二目标项目信息对所述第一显示框进行更新,得到第二显示框。
[0070] 计算机可读存储介质可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据农户项目信息推送系统的使用所创建的数据等。此外,计算机可读存储介质可以包括高速随机存取存储器,还可以包括存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,计算机可读存储介质可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至农户项目信息推送系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0071] 图3是本发明实施例提供的电子设备的结构示意图,如图3所示,该设备包括:一个处理器310以及存储器320。电子设备还可以包括:输入装置330和输出装置340。处理器310、存储器320、输入装置330和输出装置340可以通过总线或者其他方式连接,图3中以通过总线连接为例。存储器320为上述的计算机可读存储介质。处理器310通过运行存储在存储器320中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例农户项目信息推送方法。输入装置330可接收输入的数字或字符信息,以及产生与农户项目信息推送系统的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
[0072] 上述电子设备可执行本发明实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例所提供的方法。
[0073] 作为一种实施方式,上述电子设备应用于农户项目信息推送系统中,用于客户端,包括:至少一个处理器;以及,与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够:
[0074] 响应于农户的第一操作信息,根据所述第一操作信息爬取至少一个项目文本信息,其中,所述第一操作信息中包含项目文本信息的第一标签;
[0075] 基于预设的信息分类模型将所述至少一个项目文本信息存储至预先构建的项目信息库中,得到目标项目信息库,其中,所述目标项目信息库中包含不同类别的至少一个目标项目信息子库;
[0076] 采用预设的第一抽取规则在各个目标项目信息子库中分别抽取相应的某一第一目标项目信息,并将抽取后的各个所述某一第一目标项目信息经由传输队列上传至第一显示框中;
[0077] 响应于在预设时间段内农户对所述第一显示框的至少一个第二操作信息,并判断所述至少一个第二操作信息中包含的项目文本信息的第二标签是否与所述第一标签一致;
[0078] 若某一第二操作信息中包含的项目文本信息的第二标签与所述第一标签不一致,则基于所述某一第二操作信息构建短期兴趣标签以及基于所述某一第二操作信息的数量确定与所述短期兴趣标签相对应的第一权重;
[0079] 根据其他第二操作信息构建第一长期兴趣标签,以及基于所述其他第二操作信息的数量确定与所述第一长期兴趣标签相对应的第二权重,其中,所述其他第二操作信息为所述至少一个第二操作信息中除去某一第二操作信息的所有第二操作信息;
[0080] 根据所述短期兴趣标签的第一权重、所述第一长期兴趣标签的第二权重,采用预设的第二抽取规则在各个目标项目信息子库中分别抽取相应的至少一个第二目标项目信息,并根据所述至少一个第二目标项目信息对所述第一显示框进行更新,得到第二显示框。
[0081] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分的方法。
[0082] 最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页 第1页 第2页 第3页