首页 / 检索方法和检索装置

检索方法和检索装置无效专利 发明

技术领域

[0001] 本发明涉及检索技术领域,尤其涉及一种检索方法和检索装置。

相关背景技术

[0002] 目前,用户可以通过导航系统查找与地点相关的各种兴趣点,导航系统将查找到的兴趣点显示给用户,还可以向用户推荐路线,引导用户最终到达兴趣点。在导航系统为用户提供服务时,导航系统通常需要先对关键词进行分词处理,然后将关键词的多个分词与数据库中保存的兴趣点信息进行匹配,从而获得匹配的兴趣点信息作为检索结果返回给用户查看。
[0003] 然而,目前存在的问题是,导航系统采用分词算法对关键词进行分词处理时,一方面容易因为对关键词的分词失误而造成检索失败,无法查询到用户所需要的检索结果,另一方面容易因为对关键词的分词不准确导致检索的范围不全面,检索结果不符合用户的意图,用户使用导航系统的体验不好。

具体实施方式

[0016] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0017] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0018] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0019] 图1是本发明一个实施例的检索方法的流程图。
[0020] 如图1所示,检索方法包括:
[0021] S101,接收用户输入的检索词。
[0022] 具体地,检索词可以是句子,也可以是短语,导航系统接收用户通过触摸屏或者键盘等输入设备输入的检索词。
[0023] S102,根据第一预设方式对检索词进行分词处理,并根据处理后的多个第一分词获取多个第一分词对应的第一检索结果。
[0024] 具体地,导航系统在接收到用户输入的检索词之后,可以按照第一预设方式对检索词进行分词。例如,以用户输入的检索词为“比亚迪股份有限公司”为例,导航系统在将检索词进行分词后,可以得到“比亚迪”、“股份”、“有限”、“公司”四个第一分词。
[0025] 在本发明的一个实施例中,第一预设方式可以是统计分词法,或者是机械分词法,也就是说,导航系统可以根据统计分词法或者是机械分词法对检索词进行分词。具体而言,统计分词法是采用概率统计的方式对现有的兴趣点数据进行统计分析,并根据兴趣点数据中单字前后出现的频率判断关键词是否为一个词组,从而生成兴趣点词典。统计分词法采用正向最大匹配法、逆向最大匹配法或者双向最大匹配法对用户输入的检索词进行分词,其中,正向最大匹配法是将用户输入的检索词与兴趣点词典匹配,匹配长度最大且分词总数最少,即为分词结果。逆向最大匹配法是将用户输入的检索词与兴趣点词典逆向匹配,匹配长度最大且分词总数最少,即为分词结果。而双向最大匹配法是同时采用正向匹配和逆向匹配,匹配长度最大且分词总数最少,即为分词结果。例如,以用户输入的检索词为“比亚迪公司”为例,导航系统在采用统计分词法时,根据统计分析结果,“比”、“亚”、“迪”三个字同时出现的概率最高,因此将“比亚迪”作为一个第一分词,而“公”、“司”两个字同时出现的频率最高,因此将“公司”作为另一个第一分词。
[0026] 机械分词法则采用双向最大匹配法,即将用户输入的检索词与分词词典中的词条进行正向和逆向匹配,选取匹配长度最大的作为一个分词。例如,以用户输入的检索词为“比亚迪公司”为例,分词词典中存在“比亚”、“亚迪”、“比亚迪”、“公司”四个单词,根据最大双向匹配的原则,将“比亚迪”三个字作为一个第一分词,而将“公司”两个字作为另外一个第一分词。
[0027] 应当理解的是,导航系统根据统计分词法或机械分词法对检索词进行分词均可采用现有的方式实现,此处不再复赘。
[0028] 在导航系统获得检索词的多个第一分词之后,导航系统将第一分词与数据库中存储的兴趣点数据进行匹配,其中,导航系统先采用对检索词进行分词处理相同的方式对兴趣点数据进行分词处理,然后再将检索词的第一分词与兴趣点数据的分词进行匹配,从而获得匹配的一个或者多个兴趣点数据,并将匹配的兴趣点数据作为第一检索结果。
[0029] S103,根据第二预设方式对检索词进行分词处理,并根据处理后的多个第二分词获取多个第二分词对应的第二检索结果,其中,第二分词的粒度小于第一分词的粒度。
[0030] 具体地,由于导航系统在按照第一预设方式对检索词进行分词处理时容易出现分词错误或者分词不准确的问题,导致导航系统根据分词获得的检索结果不符合用户的意图或者是检索结果范围不全面的问题,因此导航系统还按照第二预设方式对检索词再进行分词处理,获得与第一分词相比较而言粒度较小的多个第二分词。
[0031] 在本发明的一个实施例中,第二预设方式包括单字分词法。具体而言,单字分词法是指将用户输入的检索词中的每一个单字作为一个分词,例如,以用户输入的检索词为“比亚迪公司”为例,将其拆分为“比”、“亚”、“迪”、“公”、“司”共5个第二分词。
[0032] 在导航系统获得检索词的多个第二分词之后,导航系统将第二分词与数据库中存储的兴趣点数据进行匹配,从而获得匹配的一个或者多个兴趣点数据,并将匹配的兴趣点数据作为第二检索结果。其中,导航系统将第二分词与兴趣点数据的匹配方法和将第一分词与兴趣点数据的匹配方法相同。
[0033] S104,根据第一检索结果和第二检索结果生成检索结果集合,并将检索结果集合返回至用户。
[0034] 具体地,导航系统将通过匹配兴趣点数据获得的第一检索结果和第二检索结果加入至检索结果集合,并将检索结果集合显示给用户查看。
[0035] 本发明实施例的检索方法,导航系统对用户输入的检索词采用不同粒度的两次分词处理,并分别将两次处理获得的分词和兴趣点数据进行匹配,将两次匹配获得的检索结果均返回给用户,从而使得导航系统为用户提供的检索结果更加符合用户的意图,保证了检索结果的全面性。
[0036] 图2是本发明一个具体实施例的检索方法的流程图。
[0037] 如图2所示,检索方法包括:
[0038] S201,接收用户输入的检索词。
[0039] S202,根据第一预设方式对检索词进行分词处理,并根据处理后的多个第一分词获取多个第一分词对应的第一检索结果。
[0040] S203,根据第二预设方式对检索词进行分词处理,并根据处理后的多个第二分词获取多个第二分词对应的第二检索结果,其中,第二分词的粒度小于第一分词的粒度。
[0041] S204,计算第一检索结果和/或第二检索结果的数量,并在第一检索结果和/或第二检索结果的数量达到预设值时,将第一检索结果和/或第二检索结果加入至检索结果集合中,并将检索结果集合返回至用户。
[0042] 具体地,导航系统在根据第一分词和第二分词分别获取第一检索结果和第二检索结果时,可以实时统计第一检索结果和第二检索结果的数量,每当第一检索结果的数量达到预设值时,向用户返回一次第一检索结果。同理,每当第二检索结果的数量达到预设值时,向用户返回一次第二检索结果。其中,预设值可以是导航系统中默认的,也可以是用户根据自身需求在导航系统中设置的。例如,当预设值为5时,导航系统每检索到5个第一检索结果就进行一次返回操作,将这5个第一检索结果加入至检索结果集合中并显示给用户查看。同理,导航系统每检索到5个第二检索结果也进行一次返回操作,将这5个第二检索结果也加入至检索结果集合中并显示给用户查看。由此,导航系统可以将第一检索结果和第二检索结果分批返回给用户,并非是在根据第一分词和第二分词匹配兴趣点数据完成时一次性返回所有的第一检索结果和第二检索结果,避免了导航系统从获取检索词到获取检索结果的间隔时间过长。
[0043] S205,接收用户对检索结果集合中第一检索结果或第二检索结果的操作,并在用户选定第一检索结果或第二检索结果时,结束检索。
[0044] 具体地,导航系统在分批向用户返回第一检索结果和第二检索结果的过程中,如果用户从已返回的第一检索结果和第二检索结果中选定用户后续操作的检索结果,则导航系统在接收到用户的操作后,结束检索,并在检索结束时释放检索所占用的系统资源。
[0045] 本发明实施例的检索方法,导航系统在获取到检索结果时分批将检索结果返回给用户查看,从而可以提高检索结果的返回速度,快速地响应用户的检索操作,防止因检索时间过长导致的系统假死现象,提升了用户体验。
[0046] 在本发明的一个实施例中,导航系统在根据第一分词和第二分词分别与兴趣点数据进行匹配以获取对应的第一检索结果和第二检索结果时,导航系统首先接收用户设定的检索范围,根据用户设定的检索范围内依次遍历兴趣点数据。如果用户未设置检索范围,则导航系统可以根据用户的当前位置判断用户所在的城市,并将用户所在的城市设置为检索范围,在设置的检索范围内依次遍历兴趣点数据。由此,可以为用户提供更加满足用户需求的检索结果,进一步提升用户体验。
[0047] 为了实现上述实施例,本发明还提出一种检索装置。
[0048] 图3是本发明一个实施例的检索装置的结构示意图,如图3所示,检索装置包括:第一接收模块100、第一获取模块200、第二获取模块300和生成模块400。
[0049] 具体地,第一接收模块100用于接收用户输入的检索词。具体而言,检索词可以是句子,也可以是短语,第一接收模块100接收用户通过触摸屏或者键盘等输入设备输入的检索词。
[0050] 第一获取模块200用于根据第一预设方式对检索词进行分词处理,并根据处理后的多个第一分词获取多个第一分词对应的第一检索结果。具体而言,第一接收模块100在接收到用户输入的检索词之后,第一获取模块200可以按照第一预设方式对检索词进行分词。例如,以用户输入的检索词为“比亚迪股份有限公司”为例,导航系统在将检索词进行分词后,可以得到“比亚迪”、“股份”、“有限”、“公司”四个第一分词。
[0051] 在本发明的一个实施例中,第一预设方式可以是统计分词法,或者是机械分词法,也就是说,第一获取模块200可以根据统计分词法或者是机械分词法对检索词进行分词。具体而言,统计分词法是采用概率统计的方式对现有的兴趣点数据进行统计分析,并根据兴趣点数据中单字前后出现的频率判断关键词是否为一个词组,从而生成兴趣点词典。统计分词法采用正向最大匹配法、逆向最大匹配法或者双向最大匹配法对用户输入的检索词进行分词,其中,正向最大匹配法是将用户输入的检索词与兴趣点词典匹配,匹配长度最大且分词总数最少,即为分词结果。逆向最大匹配法是将用户输入的检索词与兴趣点词典逆向匹配,匹配长度最大且分词总数最少,即为分词结果。而双向最大匹配法是同时采用正向匹配和逆向匹配,匹配长度最大且分词总数最少,即为分词结果。例如,以用户输入的检索词为“比亚迪公司”为例,导航系统在采用统计分词法时,根据统计分析结果,“比”、“亚”、“迪”三个字同时出现的概率最高,因此将“比亚迪”作为一个第一分词,而“公”、“司”两个字同时出现的频率最高,因此将“公司”作为另一个第一分词。
[0052] 机械分词法则采用双向最大匹配法,即将用户输入的检索词与分词词典中的词条进行正向和逆向匹配,选取匹配长度最大的作为一个分词。例如,以用户输入的检索词为“比亚迪公司”为例,分词词典中存在“比亚”、“亚迪”、“比亚迪”、“公司”四个单词,根据最大双向匹配的原则,将“比亚迪”三个字作为一个第一分词,而将“公司”两个字作为另外一个第一分词。
[0053] 在第一获取模块200获得检索词的多个第一分词之后,第一获取模块200将第一分词与数据库中存储的兴趣点数据进行匹配,其中,第一获取模块200先采用对检索词进行分词处理相同的方式对兴趣点数据进行分词处理,然后再将检索词的第一分词与兴趣点数据的分词进行匹配,从而获得匹配的一个或者多个兴趣点数据,并将匹配的兴趣点数据作为第一检索结果。
[0054] 第二获取模块300用于根据第二预设方式对检索词进行分词处理,并根据处理后的多个第二分词获取多个第二分词对应的第二检索结果,其中,第二分词的粒度小于第一分词的粒度。具体而言,由于第一获取模块200在按照第一预设方式对检索词进行分词处理时容易出现分词错误或者分词不准确的问题,导致第一获取模块200根据分词获得的检索结果不符合用户的意图或者是检索结果范围不全面的问题,因此第二获取模块300还按照第二预设方式对检索词再进行分词处理,获得与第一分词相比较而言粒度较小的多个第二分词。
[0055] 在本发明的一个实施例中,第二预设方式包括单字分词法。具体而言,单字分词法是指将用户输入的检索词中的每一个单字作为一个分词,例如,以用户输入的检索词为“比亚迪公司”为例,将其拆分为“比”、“亚”、“迪”、“公”、“司”共5个第二分词。
[0056] 在第二获取模块300获得检索词的多个第二分词之后,第二获取模块300将第二分词与数据库中存储的兴趣点数据进行匹配,从而获得匹配的一个或者多个兴趣点数据,并将匹配的兴趣点数据作为第二检索结果。其中,第二获取模块300将第二分词与兴趣点数据的匹配方法和第一获取模块200将第一分词与兴趣点数据的匹配方法相同。
[0057] 生成模块400用于根据第一检索结果和第二检索结果生成检索结果集合,并将检索结果集合返回至用户。具体地,生成模块400将第一获取模块200和第二获取模块300分别通过匹配兴趣点数据获得的第一检索结果和第二检索结果加入至检索结果集合,并将检索结果集合显示给用户查看。
[0058] 本发明实施例的检索装置,对用户输入的检索词采用不同粒度的两次分词处理,并分别将两次处理获得的分词和兴趣点数据进行匹配,将两次匹配获得的检索结果均返回给用户,从而使得导航系统为用户提供的检索结果更加符合用户的意图,保证了检索结果的全面性。
[0059] 图4是本发明一个具体实施例的检索装置的结构示意图,如图4所示,检索装置包括:第一接收模块100、第一获取模块200、第二获取模块300、生成模块400和第二接收模块500。
[0060] 具体地,在本发明的一个实施例中,生成模块400还用于在根据第一分词和第二分词分别获取第一检索结果和第二检索结果时,计算第一检索结果和/或第二检索结果的数量,并在第一检索结果和/或第二检索结果的数量达到预设值时,将第一检索结果和/或第二检索结果加入至检索结果集合中,并将检索结果集合返回至用户。具体而言,第一获取模块200和第二获取模块300在分别根据第一分词和第二分词分别获取第一检索结果和第二检索结果时,生成模块400可以实时统计第一检索结果和第二检索结果的数量,每当第一检索结果的数量达到预设值时,生成模块400向用户返回一次第一检索结果。同理,每当第二检索结果的数量达到预设值时,生成模块400向用户返回一次第二检索结果。其中,预设值可以是导航系统中默认的,也可以是用户根据自身需求在导航系统中设置的。例如,当预设值为5时,生成模块400每检索到5个第一检索结果就进行一次返回操作,将这5个第一检索结果加入至检索结果集合中并显示给用户查看。同理,生成模块400每检索到5个第二检索结果也进行一次返回操作,将这5个第二检索结果也加入至检索结果集合中并显示给用户查看。由此,生成模块400可以将第一检索结果和第二检索结果分批返回给用户,并非是在根据第一分词和第二分词匹配兴趣点数据完成时一次性返回所有的第一检索结果和第二检索结果,避免了导航系统从获取检索词到获取检索结果的间隔时间过长。
[0061] 第二接收模块500用于接收用户对检索结果集合中第一检索结果或第二检索结果的操作,并在用户选定第一检索结果或第二检索结果时,结束检索。具体而言,生成模块400在分批向用户返回第一检索结果和第二检索结果的过程中,如果用户从已返回的第一检索结果和第二检索结果中选定用户后续操作的检索结果,则第二接收模块500在接收到用户的操作后,结束检索,并在检索结束时释放检索所占用的系统资源。
[0062] 本发明实施例的检索装置,在获取到检索结果时分批将检索结果返回给用户查看,从而可以提高检索结果的返回速度,快速地响应用户的检索操作,防止因检索时间过长导致的系统假死现象,提升了用户体验。
[0063] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0064] 在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0065] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0066] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页 第1页 第2页 第3页
相关技术
检索方法相关技术
检索装置相关技术
罗锦文发明人的其他相关专利技术