技术领域
[0001] 本发明涉及舆情监测技术领域,具体为一种舆情监测方法和舆情监测系统。
相关背景技术
[0002] 随着互联网技术的发展,网络成为了生活中必不可缺的一环,在工作之余,民众经常会在网络上发表各自言论对当前热点进行品论。
[0003] 民众的评论内容大部分是含有正能量的,但是,还有少部分的言论是反向的,不符合法律和公序良俗的。
[0004] 根据相关的法律,对违反法律和公序良俗的不良言论需要承担相应的法律后果,而被侵害人或执法部门难以获取证据对实施侵害者进行制裁。
[0005] 现有的舆论监测方法多为直接通过关键词进行监测,不能对关键词进行分析,从而导致工作量大。
[0006] 可见,亟需一种舆情监测方法和舆情监测系统,用来对网络舆论进行监测,从而收集证据和停止侵害。
具体实施方式
[0067] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0068] 具体实施方式一
[0069] 本实施方式为一种舆情监测方法的实施方式。
[0070] 请参阅图1‑8,一种舆情监测方法,包括以下步骤:
[0071] S1、通过系统接入到互联网网络中,使用程序语言获取各平台热搜的排名榜内容,通过在各平台热搜中获取关键词信息,以实现在舆论的集中点来监测舆论的方向,避免平台监测效果一般,而全平台监测的话系统压力太大,监测过程中所需要的线程过多导致运行速度缓慢,获取热搜排行榜的数量控制在五十条以内,排行过低的内容被关注量不大,舆论量不大,不会造成严重的社会影响;
[0072] S2、对获取的热搜排名榜内容进行关键词获取,因为热搜榜中的内容是国民的关注点,舆论容易在热搜中发酵而导致舆论风向偏移,并对关键词进行储存,建立关键词词库;
[0073] S3、通过关键词的内容使用程序语言遍历热搜内容和评论内容,并获取内容中的敏感词汇,对敏感词汇进行存储,上面所提到的程序语言优先选择python语言,因为python语言具有很好的网络爬虫模块,在搭建系统的时候,能够减少开发成本,且通过爬虫程序能够有效的获取需要的数据;
[0074] S4、对获取的敏感词汇的前后文字进行获取,获得完整的语句和完整的段落语句,以方便对敏感词在语句中所表达的含有进行甄别;
[0075] S5、分别对含有敏感词的语句和段落进行含义甄别,从而获取反向的言论语句,并对反向言论内容进行保存;
[0076] S6、当判断出反向舆论后,系统与各平台联动,对反向舆论进行预先处理并向有关部门报备;
[0077] S7、等待有关部分的信息反馈,并对反馈的内容和反向舆论的内容进行长时间的最终保存,与作为最终的证据使用。
[0078] 通过上述技术方案,井系统接入互联网网络,并读取各个平台热搜的排行榜来获取关键词建立关键词词库,并通过关键词来进行进一步的检索获取敏感词,因为舆论的集中点多集中在热点中,从而减少系统所运行的负担,提升系统的运行速度,相对与单平台检索具有范围广的特点,相对与全网检索具有速度快的特点,达到了监测范围广监测速度快的效果;
[0079] 通过设置敏感词,并通过编程中的正则表达式来获取舆论中的完整语句和完整段落,根据完整的语句和完整的段落的结合进行判断,以提升判断甄别非正常舆论的准确性,如果单独通过敏感词直接断定舆论的非正常太过片面,达到了准确定位非正常言论的效果;
[0080] 通过对非正常言论进行多渠道的预先处理,从而能够有效的避免舆论的扩散和预先获取言论者的详细信息,当有关部分对言论进行定性后,在进行最终处理,且对严重违法信息的发布者,能够将获取到的详细信息反馈至有关部门,达到了避免舆论扩散且容易定位的效果。
[0081] 具体的,所述步骤S2包括以下步骤:
[0082] 1>整合个平台热搜中词组所出现的次数;
[0083] 2>根据词组所出现的重复数量进行排序,从而区分出热度排序;
[0084] 3>对排序后的关键词进行存储,以便于后续程序进行调用。
[0085] 通过上述技术方案,将平台热搜中的词组按照热度进行排序,在进行后续的敏感词提取的时候,系统根据热度的排名分配检索资源,因为舆论的量和热度是成正比的,侧重系统资源的分配能够更快的实现舆论监测的效果,如果不进行资源分布的话,系统线程会平均分配,部分线程拥堵部分线程闲置的问题。
[0086] 具体的,所述步骤S3包括以下步骤:
[0087] 1>获取官方新闻的信息,并确定官方信息的导向;
[0088] 2>根据官方信息的导向来设置方向的舆论词汇;
[0089] 3>在现有舆论中提取带有反向舆论的信息;
[0090] 4>对反向舆论信息进行保存。
[0091] 通过上述技术方案,以官方信息为参考点,从而能够判断当前舆论信息是表扬性质的还是批判性质的,只有了解了信息所要表达的主体意思,才能对舆论信息进行评判甄别,避免系统发生误判。
[0092] 具体的,所述步骤S3包括以下步骤:
[0093] 1>根据公序良俗的要求设置敏感词汇;
[0094] 2>对根据公序良俗的要求设置敏感词汇进行反向设置舆论词汇;
[0095] 3>在现有舆论中提取带有反向舆论的信息;
[0096] 4>对反向舆论信息进行保存。
[0097] 通过上述技术方案,将公序良俗的内容作为舆论监测敏感词,从而使违背公序良俗的信息能够被监测到,在法律规定的范围内还能能够对道德成面的舆论进行甄别。
[0098] 具体的,所述步骤S4包括以下步骤:
[0099] 设置正则表达式规则,从而能够根据规则获取指定的文字段;
[0100] 获取的文字段为敏感词当前所在的完整语句;
[0101] 获取的文字段为敏感词当前所在的完整段落。
[0102] 通过上述技术方案,只针对敏感词进行监测的话,很容易造成信息内容的误判,因为,语言的表达方式还有褒贬、倒装句等表达方式,当敏感词处于整句话中的时候,也有可能带有正面的意义,同理,一句话在一个段落中,根据前后言的不同会产生不同的含义,因此,需要提出更加完整的语句进行判断甄别。
[0103] 具体的,所述步骤S5包括以下步骤:
[0104] 1>对敏感词所在的语句含义进行判断;
[0105] 2>对敏感词所在的整个段落含义进行判断;
[0106] 3>判断语句和段落时候含有反向的语义和不利于传播的舆论;
[0107] 4>对所判断的语义进行最终甄别。
[0108] 通过上述技术方案,将敏感词放置在语句中和段落中进行反复的组合,从而能够提升AI的判断能力,以获得更好的监测效果,减少复审人员的工作量。
[0109] 具体的,所述判断包括以下步骤:
[0110] 1>单独判断敏感词所在语句的含义:
[0111] 2>摒弃正向或无意义的评论,记录非正常言论;
[0112] 3>单独判断敏感词所在段落的含义;
[0113] 4>摒弃正向或无意义的评论,记录非正常言论;
[0114] 5>将语句中的非正常言论和段落中的非正常言论再次进行
[0115] 对组合;
[0116] 6>判断最后组合的言论含义;
[0117] 7>最后组合的言论正向或无意义摒弃,最后组合的非正常进行记录并保存信息。
[0118] 通过上述技术方案,对敏感词进行反复的对比确认,筛选出正真还有敌意的内容,因为很多舆论者会跟随性的进行言论,正真刻意进行违规或违法言论的人是少部分的,多次判断甄别能够在大量的信息中精准的进行定位,以减少信息量,方便复审人员进行人工甄别,为后续的追责提供有效的证据。
[0119] 具体的,所述步骤S6包括以下分项:
[0120] 1>进行预先禁言处理;
[0121] 2>获取非正常评论者的网络IP地址并进行记录;
[0122] 3>通过系统弹框或信息提示进行警告。
[0123] 通过上述技术方案,使用预处理的方式进行处理,从而能够快速的杜绝舆论的扩散发酵,并对言论者进行轻微且可撤销的处罚来提醒言论者,当人员复查后,确定违法行为再进行后续的处理,而复查人员复查后确定属于系统误判的话,能够通过撤销操作来解除对言论者的处罚,使处罚的结果具有弹性可逆,减少损失和挽回成本。
[0124] 具体的,获取非正常评论者的网络IP地址,通过IP地址反推至运行商,根据运营商的登记信息获取言论者准确信息,当言论者存在严重违法行为时,公安机关能够准确定位非法者。
[0125] 通过上述技术方案,获取网络IP地址是为了对非正常舆论者进行监控,一旦发现非正常舆论者的违法言论实时成立的话,有关部门能够通过IP地址来确定运营商,而运营商能够根据所分配的IP地址精确到网络注册人的信息,从而节省处罚犯罪的成本。
[0126] 具体实施方式二
[0127] 本实施方式为一种用于舆情监测方法的监测系统的实施方式。
[0128] 一种用于舆情监测方法的监测系统,包括中央处理器、网络接入模块、逻辑模块和信息存储设备,所述中央处理器通过多线程同时协调网络接入模块、逻辑判断模块和信息存储设备;
[0129] 所述网络接入模块包括互联网网关和互联网交换机,所述互联网网关用于对本地网络进行保护,而互联交换机用于进行信息交互;
[0130] 所述逻辑判断模块为还有正则表达式程序和判断程序的AI模块;
[0131] 所述信息存储设备为存储硬盘。
[0132] 在使用时,通过接入互联网网络,并读取各个平台热搜的排行榜来获取关键词建立关键词词库,并通过关键词来进行进一步的检索获取敏感词,因为舆论的集中点多集中在热点中,从而减少系统所运行的负担,提升系统的运行速度,相对与单平台检索具有范围广的特点,相对与全网检索具有速度快的特点,达到了监测范围广监测速度快的效果;
[0133] 通过设置敏感词,并通过编程中的正则表达式来获取舆论中的完整语句和完整段落,根据完整的语句和完整的段落的结合进行判断,以提升判断甄别非正常舆论的准确性,如果单独通过敏感词直接断定舆论的非正常太过片面,达到了准确定位非正常言论的效果;
[0134] 通过对非正常言论进行多渠道的预先处理,从而能够有效的避免舆论的扩散和预先获取言论者的详细信息,当有关部分对言论进行定性后,在进行最终处理,且对严重违法信息的发布者,能够将获取到的详细信息反馈至有关部门,达到了避免舆论扩散且容易定位的效果。
[0135] 尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。