技术领域
[0001] 本发明涉及大数据的技术领域,特别是涉及一种店铺数据管理方法、装置、设备和存储介质。
相关背景技术
[0002] 现有中,由于店铺可能同时在一个平台或多个平台发布信息,导致店铺的信息分散在全网,在进行店铺信息查找的过程中,需要通过访问o2o平台、地图平台等多个平台,且必须使用该平台提供的搜索、检索工具进行查找,对于操作不熟悉的用户来说,查找满足特定条件的店铺的信息需要花费大量时间;且现有技术中无法统一检索跨平台信息,无法查看关联企业信息等,使得查找到的店铺信息可能不全面。因此,急需采用一种更高效的管理方案实现对跨平台的店铺数据信息进行统一管理,提高获取信息的效率。
具体实施方式
[0038] 下面将结合本发明中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 实施例1
[0040] 参见图1,图1是本发明提供的一种店铺数据管理方法的一种实施例的流程示意图,如图1所示,该方法包括步骤101-步骤104,具体如下:
[0041] 步骤101:获取各个公开平台上目标店铺对应的第一店铺数据,生成第一店铺数据集。
[0042] 本实施例中,通过爬虫技术获取各个公开平台上目标店铺对应的第一店铺数据;其中,目标店铺包括线下店铺和电商网店,且对于目标店铺的类型不同,其获取的第一店铺数据类型也不同;作为本实施例中的一种举例,当目标店铺的类型为线下店铺时,线下店铺对应的第一店铺数据包括但不限于店铺名称、店铺链接、店铺评分、店铺点评、店铺开店时间、店铺地址、店铺的第一企业名称和店铺的第一企业统一社会信用代码;当目标店铺的类型为电商网店时,电商网店对应的第一店铺数据包括但不限于网店名称、网店商品、商品销量、网店商品评价、网店链接、网店评分、网店开店时间、网店标签、网店的第一企业名称和网店的第一企业统一社会信用代码。
[0043] 本实施例中,按预设校验规则对每个公开平台上所述目标店铺对应的第一店铺数据进行统一校验,具体的,对于第一店铺数据中包含的不同类型的字段,设置相应的校验规则,只有当第一店铺数据满足相应的校验规则时,才会对该第一店铺数据进行保存。作为本实施例中的一种举例,对于线下店铺对应的第一店铺数据中的店铺评分,必须为指定范围的数字,如1-100;店铺开店时间必须符合时间格式要求,如年月日。
[0044] 本实施例中,获取的各个公开平台上目标店铺对应的第一店铺数据进行校验,只有满足校验规则的第一店铺数据才会被保存,确保了所采集数据的准确性,同时方便后续对第一店铺数据的统一存储。
[0045] 本实施例中,将满足校验规则后保存的每个公开平台上所述目标店铺对应的第一店铺数据进行整合,生成第一店铺数据集。
[0046] 步骤102:按预设的数据加工规则对所述第一店铺数据集进行加工,生成所述目标店铺对应的高维度数据集。
[0047] 本实施例中,由于目标店铺的类型不同,其对应的第一店铺数据集不同,因此,在按预设的数据加工规则对第一店铺数据集进行加工时,不同的第一店铺数据集对应的预设数据加工规则不同,其生成的目标店铺对应的高维度数据集也不同。
[0048] 作为本实施例中的一种举例,当目标店铺为线下店铺时,其对应的第一店铺数据集包括了每个公开平台的目标店铺的第一店铺数据,其对应的预设加工规则,包括但不限于,获取第一店铺数据集中的评分人数,并对各个公开平台的评分人数进行计算求和,生成线下店铺的总评分人数;根据不同公开平台的评分机制不一样,将第一店铺数据集中的评分转换为10分制,并结合评分人数进行加权,计算出综合评分,生成线下店铺的综合评分;将第一店铺数据集中的评分进行整合,并将评分进行类型划分,划分为差评、中评、好评,并计算出各个评分类型占比及分布,生成线下店铺的评分类型占比及分布;判断第一店铺数据集中目标店铺的店铺名称是否一致,或判断第一店铺数据集中目标店铺进行剔除以分店为后缀的店铺名称”后是否一致,若一致,则继续判断第一店铺数据集中目标店铺的店铺地址,若不一致,则认为是同一品牌下不同地区的分店,从而分析出分店信息,生成线下店铺分店信息。因此,基于预设数据加工规则生成的目标店铺对应的高维度数据集包括但不限于总评分人数、综合评分、评分类型占比及分布和分店信息。
[0049] 作为本实施例中的一种举例,当目标店铺为电商网店时,其对应的第一店铺数据集包括了每个公开平台的目标店铺的第一店铺数据,其对应的预设加工规则,包括但不限于,采集第一店铺数据集中的电商网店的商品信息,根据商品信息分析其所属类目,并选取销量占比超过特定阈值的商品类目,如销量占比10%的商品类目,作为电商网店的主要经营类目,生成电商网店对应的经营类型;根据采集到第一店铺数据集中的网店评分,通过加权细分评分来计算综合评分,生成电商网店综合评分;根据通过分析第一店铺数据集中的网店商品评价,计算综合好评率,生成电商网店的综合好评率;通过综合计算第一店铺数据集中的商品销量,计算得出累计销量,生成网店的累计销量;通过计算第一店铺数据集中有销量的商品占比,生成电商网店的动销率。因此,基于预设数据加工规则生成的目标店铺对应的高维度数据集包括但不限于经营类型、综合评分、综合好评率、累计销量和动销率。
[0050] 本实施例中,对于获取的各个公开平台目标店铺的第一数据集进行对应数据加工,生成高维度信息,解决现有中存在同一目标店铺可能同时在多个平台发布信息,造成获取的数据冗杂的问题,方便后续用户对店铺信息的查看。
[0051] 步骤103:整合所述第一店铺数据集和所述高维度数据集,得到所述目标店铺的第二店铺数据集。
[0052] 本实施例中,将步骤101中获取的集成了各个公开平台上目标店铺对应的第一店铺数据的第一店铺数据集,和步骤102中对第一店铺数据集进行数据加工后生成的高维度数据集进行集合,保证了目标电路数据的完整性。
[0053] 步骤104:根据所述第一店铺数据,获取所述目标店铺对应的目标企业,并将所述目标店铺与所述目标企业进行关联,以使所述第二店铺数据集与所述目标企业进行信息挂接。
[0054] 本实施例中,根据目标店铺对应的第一店铺数据,具体的,根据第一店铺数据中的第一企业名称和第一企业统一社会信用代码;将第一企业名称与当前工商库中的第二企业名称进行匹配,若第一企业名称与当前工商库中的第二企业名称相同,则认为匹配成功,若第一企业名称与当前工商库中的第二企业名称不相同,则将所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码进行匹配,若所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码相同,则认为匹配成功,否则匹配失败。
[0055] 作为本实施例中的一种优选方案,当第一企业名称与当前工商库中的第二企业名称进行匹配,且匹配失败时,除了将所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码进行匹配,还可通过获取第一企业名称的曾用名,将曾用名与当前工商库中的第二企业名称进行匹配。
[0056] 本实施例中,对于第一店铺数据中的第一企业名称和第一企业统一社会信用代码,除了可以从各个公开平台直接获取外,还可通过获取目标店铺的营业执照或经营许可证等图片信息,通过OCR文字识别方法来识别出图片中的企业信息,间接获取企业名称和统一社会信用代码信息。
[0057] 本实施例中,根据匹配结果,获取所述目标店铺对应的目标企业,并将目标店铺与匹配到的目标企业进行关联,以使将第二店铺数据集挂接在目标企业下。
[0058] 本实施例中,获取与目标企业关联的所有目标店铺,并将目标企业下所有目标店铺对应的第二店铺数据集进行聚合,方便后续对于各个企业中的目标店铺数据的管理,同时方便用户查看。
[0059] 本实施例中,还通过大数据可视化技术将步骤101中获取的集成了各个公开平台上目标店铺对应的第一店铺数据的第一店铺数据集、步骤102中对第一店铺数据集进行数据加工后生成的高维度数据集、本步骤104中目标店铺与匹配到的目标企业的关联关系和目标企业下所有目标店铺对应的第二店铺数据集的挂接关系进行显示,并基于显示界面提供的关键词检索、常规维度筛选、加工维度信息查看、高级筛选等产品应用,使得用户能跨平台实时检索并查看相关目标店铺的店铺数据。
[0060] 参见图2,图2是本发明提供的一种店铺数据管理装置的一种实施例的结构示意图,如图2所示,该结构包括数据获取模块201、数据加工模块202、整合模块203和关联模块204,具体如下:
[0061] 数据获取模块201用于获取各个公开平台上目标店铺对应的第一店铺数据,生成第一店铺数据集。
[0062] 本实施例中,通过爬虫技术获取各个公开平台上目标店铺对应的第一店铺数据;其中,目标店铺包括线下店铺和电商网店,且对于目标店铺的类型不同,其获取的第一店铺数据类型也不同;作为本实施例中的一种举例,当目标店铺的类型为线下店铺时,线下店铺对应的第一店铺数据包括但不限于店铺名称、店铺链接、店铺评分、店铺点评、店铺开店时间、店铺地址、店铺的第一企业名称和店铺的第一企业统一社会信用代码;当目标店铺的类型为电商网店时,电商网店对应的第一店铺数据包括但不限于网店名称、网店商品、商品销量、网店商品评价、网店链接、网店评分、网店开店时间、网店标签、网店的第一企业名称和网店的第一企业统一社会信用代码。
[0063] 本实施例中,按预设校验规则对每个公开平台上所述目标店铺对应的第一店铺数据进行统一校验,具体的,对于第一店铺数据中包含的不同类型的字段,设置相应的校验规则,只有当第一店铺数据满足相应的校验规则时,才会对该第一店铺数据进行保存。作为本实施例中的一种举例,对于线下店铺对应的第一店铺数据中的店铺评分,必须为指定范围的数字,如1-100;店铺开店时间必须符合时间格式要求,如年月日。
[0064] 本实施例中,获取的各个公开平台上目标店铺对应的第一店铺数据进行校验,只有满足校验规则的第一店铺数据才会被保存,确保了所采集数据的准确性,同时方便后续对第一店铺数据的统一存储。
[0065] 本实施例中,将满足校验规则后保存的每个公开平台上所述目标店铺对应的第一店铺数据进行整合,生成第一店铺数据集。
[0066] 数据加工模块202用于按预设的数据加工规则对所述第一店铺数据集进行加工,生成所述目标店铺对应的高维度数据集。
[0067] 本实施例中,由于目标店铺的类型不同,其对应的第一店铺数据集不同,因此,在按预设的数据加工规则对第一店铺数据集进行加工时,不同的第一店铺数据集对应的预设数据加工规则不同,其生成的目标店铺对应的高维度数据集也不同。
[0068] 作为本实施例中的一种举例,当目标店铺为线下店铺时,其对应的第一店铺数据集包括了每个公开平台的目标店铺的第一店铺数据,其对应的预设加工规则,包括但不限于,获取第一店铺数据集中的评分人数,并对各个公开平台的评分人数进行计算求和,生成线下店铺的总评分人数;根据不同公开平台的评分机制不一样,将第一店铺数据集中的评分转换为10分制,并结合评分人数进行加权,计算出综合评分,生成线下店铺的综合评分;将第一店铺数据集中的评分进行整合,并将评分进行类型划分,划分为差评、中评、好评,并计算出各个评分类型占比及分布,生成线下店铺的评分类型占比及分布;判断第一店铺数据集中目标店铺的店铺名称是否一致,或判断第一店铺数据集中目标店铺进行剔除以分店为后缀的店铺名称”后是否一致,若一致,则继续判断第一店铺数据集中目标店铺的店铺地址,若不一致,则认为是同一品牌下不同地区的分店,从而分析出分店信息,生成线下店铺分店信息。因此,基于预设数据加工规则生成的目标店铺对应的高维度数据集包括但不限于总评分人数、综合评分、评分类型占比及分布和分店信息。
[0069] 作为本实施例中的一种举例,当目标店铺为电商网店时,其对应的第一店铺数据集包括了每个公开平台的目标店铺的第一店铺数据,其对应的预设加工规则,包括但不限于,采集第一店铺数据集中的电商网店的商品信息,根据商品信息分析其所属类目,并选取销量占比超过特定阈值的商品类目,如销量占比10%的商品类目,作为电商网店的主要经营类目,生成电商网店对应的经营类型;根据采集到第一店铺数据集中的网店评分,通过加权细分评分来计算综合评分,生成电商网店综合评分;根据通过分析第一店铺数据集中的网店商品评价,计算综合好评率,生成电商网店的综合好评率;通过综合计算第一店铺数据集中的商品销量,计算得出累计销量,生成网店的累计销量;通过计算第一店铺数据集中有销量的商品占比,生成电商网店的动销率。因此,基于预设数据加工规则生成的目标店铺对应的高维度数据集包括但不限于经营类型、综合评分、综合好评率、累计销量和动销率。
[0070] 本实施例中,对于获取的各个公开平台目标店铺的第一数据集进行对应数据加工,生成高维度信息,解决现有中存在同一目标店铺可能同时在多个平台发布信息,造成获取的数据冗杂的问题,方便后续用户对店铺信息的查看。
[0071] 整合模块203用于整合所述第一店铺数据集和所述高维度数据集,得到所述目标店铺的第二店铺数据集。
[0072] 本实施例中,将数据获取模块201中获取的集成了各个公开平台上目标店铺对应的第一店铺数据的第一店铺数据集,和数据加工模块202中对第一店铺数据集进行数据加工后生成的高维度数据集进行集合,保证了目标电路数据的完整性。
[0073] 关联模块204用于根据所述第一店铺数据,获取所述目标店铺对应的目标企业,并将所述目标店铺与所述目标企业进行关联,以使所述第二店铺数据集与所述目标企业进行信息挂接。
[0074] 本实施例中,根据目标店铺对应的第一店铺数据,具体的,根据第一店铺数据中的第一企业名称和第一企业统一社会信用代码;将第一企业名称与当前工商库中的第二企业名称进行匹配,若第一企业名称与当前工商库中的第二企业名称相同,则认为匹配成功,若第一企业名称与当前工商库中的第二企业名称不相同,则将所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码进行匹配,若所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码相同,则认为匹配成功,否则匹配失败。
[0075] 作为本实施例中的一种优选方案,当第一企业名称与当前工商库中的第二企业名称进行匹配,且匹配失败时,除了将所述第一企业统一社会信用代码与当前工商库中的第二企业统一社会信用代码进行匹配,还可通过获取第一企业名称的曾用名,将曾用名与当前工商库中的第二企业名称进行匹配。
[0076] 本实施例中,对于第一店铺数据中的第一企业名称和第一企业统一社会信用代码,除了可以从各个公开平台直接获取外,还可通过获取目标店铺的营业执照或经营许可证等图片信息,通过OCR文字识别方法来识别出图片中的企业信息,间接获取企业名称和统一社会信用代码信息。
[0077] 本实施例中,根据匹配结果,获取所述目标店铺对应的目标企业,并将目标店铺与匹配到的目标企业进行关联,以使将第二店铺数据集挂接在目标企业下。
[0078] 本实施例中,还提供了聚合模块,用于获取与目标企业关联的所有目标店铺,并将目标企业下所有目标店铺对应的第二店铺数据集进行聚合,方便后续对于各个企业中的目标店铺数据的管理,同时方便用户查看。
[0079] 本实施例中,还通过大数据可视化技术将数据获取模块201中获取的集成了各个公开平台上目标店铺对应的第一店铺数据的第一店铺数据集、数据加工模块202中对第一店铺数据集进行数据加工后生成的高维度数据集、关联模块204中目标店铺与匹配到的目标企业的关联关系和目标企业下所有目标店铺对应的第二店铺数据集的挂接关系进行显示,并基于显示界面提供的关键词检索、常规维度筛选、加工维度信息查看、高级筛选等产品应用,使得用户能跨平台实时检索并查看相关目标店铺的店铺数据。
[0080] 本实施例中,还提供了一种店铺数据管理的设备,包括处理器、存储器以及存储在存储器中且被配置为由处理器执行的计算机程序,处理器执行计算机程序时实现上述的店铺数据管理方法。
[0081] 本发明实施例中,还提供了一种计算机可读存储介质,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行上述的店铺数据管理方法。
[0082] 示例性的,所述计算机程序可以被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在店铺数据管理的设备中的执行过程。
[0083] 所述店铺数据管理的设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述店铺数据管理的设备可包括,但不仅限于,处理器、存储器、显示器。本领域技术人员可以理解,上述部件仅仅是店铺数据管理的设备的示例,并不构成对店铺数据管理的设备的限定,可以包括比所述部件更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述店铺数据管理的设备还可以包括输入输出设备、网络接入设备、总线等。
[0084] 所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述店铺数据管理的设备的控制中心,利用各种接口和线路连接整个所述店铺数据管理的设备的各个部分。
[0085] 所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述店铺数据管理的设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、文字转换功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、文字消息数据等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
[0086] 其中,所述店铺数据管理的设备集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一个计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0087] 本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0088] 综上,本发明提供的一种店铺数据管理方法、装置、设备和存储介质,通过获取各个公开平台上目标店铺对应的第一店铺数据,生成第一店铺数据集;按预设的数据加工规则对第一店铺数据集进行加工,生成目标店铺对应的高维度数据集;整合第一店铺数据集和高维度数据集,得到目标店铺的第二店铺数据集;根据第一店铺数据,获取目标店铺对应的目标企业,并将目标店铺与目标企业进行关联,以使第二店铺数据集与目标企业进行信息挂接。与现有技术相比,本发明通过将获取的各公开平台的目标店铺的店铺数据进行加工和信息挂接,实现对店铺数据的跨平台管理,降低了跨平台店铺数据获取的难度,提高了数据获取的效率。
[0089] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。