技术领域
[0001] 本实用新型涉及校验设备领域,具体涉及一种新闻类内容校验系统。
相关背景技术
[0002] 新闻具有事实性、时效性、信息量大等特点。构建反映新闻所报道真实世界的新闻事实与新闻知识库,需要采用合适的建模工具和能反映新闻特点的库结构,同时对数据的存储、检索也有很高的效率要求。传统上,知识库的构建包括基于规则的系统、基于框架的系统,不灵活且扩展困难,难以建模纷繁复杂的食物之间关系,需要寻求新的建模工具,并设计面向新闻领域的库结构。目前市场上已有多种不同的新闻内容校验系统或者方法,但是现有的方法识别准确度不高,且无法综合利用知识图谱进行识别。实用新型内容
[0003] 针对现有技术的不足,本实用新型提出了一种新闻类内容校验系统。
[0004] 本实用新型的目的可以通过以下技术方案实现:
[0005] 一种新闻类内容校验系统,包括:数据采集模块、知识提取模块、数据整合模块与整理模块;
[0006] 所述数据采集模块用于收集所述新闻类内容,所述知识提取模块与所述数据采集模块电性连接,所述知识提取模块将所述新闻类内容转化为知识图谱,所述数据整合模块将所述新闻类内容中的结构化数据整合为知识图谱,所述数据整合模块、所述知识提取模均与所述整理模块电性连接;所述整理模块对所述知识图谱进行实体对齐、质量评估后,输出至应用服务。
[0007] 进一步地,所述数据整合模块与外部的第三方数据库电性连接。
[0008] 进一步地,所述数据采集模块采集所述新闻类内容中的半结构化数据与非结构化数据。
[0009] 进一步地,所述知识提取模块包括:实体提取、关系抽取与属性抽取。
[0010] 进一步地,所述整理模块与属性校正模块电性连接,将所述整理模块的实体对齐的知识图谱进行属性校正。
[0011] 本实用新型的有益效果:
[0012] 通过对大量文本素材的读取与识别,本实用新型的技术方案可构建一个足够大的数据库,通过此数据库构建的知识图谱可用于内容自动生成领域的基础素材,可用于未来使用人工智能进行文章写作方面的研究工作。
[0013] 通过对大量新闻的读取与识别,本实用新型的技术方案构建的数据库可用于未来新闻媒体单位在进行新闻写作时进行参考的素材。
[0014] 通过对大量信息的获取,将这些信息构建成一个足够庞大的数据库,未来可用于相关方面大数据分析的一个能够随时进行参考,可信度足够高,参考成本较低的可靠数据来源。
[0015] 本实用新型的技术方案可用于大型公众平台对自媒体文章发表之前的机器审核,借此将相关虚假信息扼杀在传播源头之中,从而使公众对未来文章的可信度能够有进一步的提升,减少虚假新闻带来的潜在的经济损失与平台的可信度损失的风险。
具体实施方式
[0018] 下面将结合本实用新型实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本实用新型保护的范围。
[0019] 在本实用新型的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本实用新型和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本实用新型的限制。
[0020] 如图1所示,一种新闻类内容校验系统,包括:数据采集模块、知识提取模块、数据整合模块与整理模块;
[0021] 所述数据采集模块用于收集所述新闻类内容,所述知识提取模块与所述数据采集模块电性连接,所述知识提取模块将所述新闻类内容转化为知识图谱,所述数据整合模块将所述新闻类内容中的结构化数据整合为知识图谱,所述数据整合模块、所述知识提取模均与所述整理模块电性连接;所述整理模块对所述知识图谱进行实体对齐、质量评估后,输出至应用服务。
[0022] 进一步地,所述数据整合模块与外部的第三方数据库电性连接。
[0023] 进一步地,所述数据采集模块采集所述新闻类内容中的半结构化数据与非结构化数据。
[0024] 进一步地,所述知识提取模块包括:实体提取、关系抽取与属性抽取。
[0025] 进一步地,所述整理模块与属性校正模块电性连接,将所述整理模块的实体对齐的知识图谱进行属性校正。
[0026] 综上所述,通过对大量文本素材的读取与识别,本实用新型的技术方案可构建一个足够大的数据库,通过此数据库构建的知识图谱可用于内容自动生成领域的基础素材,可用于未来使用人工智能进行文章写作方面的研究工作。
[0027] 通过对大量新闻的读取与识别,本实用新型的技术方案构建的数据库可用于未来新闻媒体单位在进行新闻写作时进行参考的素材。
[0028] 通过对大量信息的获取,将这些信息构建成一个足够庞大的数据库,未来可用于相关方面大数据分析的一个能够随时进行参考,可信度足够高,参考成本较低的可靠数据来源。
[0029] 本实用新型的技术方案可用于大型公众平台对自媒体文章发表之前的机器审核,借此将相关虚假信息扼杀在传播源头之中,从而使公众对未来文章的可信度能够有进一步的提升,减少虚假新闻带来的潜在的经济损失与平台的可信度损失的风险。
[0030] 在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本实用新型的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0031] 以上显示和描述了本实用新型的基本原理、主要特征和本实用新型的优点。本行业的技术人员应该了解,本实用新型不受上述实施例的限制,上述实施例和说明书中描述的只是说明本实用新型的原理,在不脱离本实用新型精神和范围的前提下,本实用新型还会有各种变化和改进,这些变化和改进都落入要求保护的本实用新型范围内。