首页 / 一种文本报告自动生成方法及系统

一种文本报告自动生成方法及系统实质审查 发明

技术领域

[0001] 本申请涉及一种文本报告自动生成方法及系统。

相关背景技术

[0002] 在数据处理过程中,报告是最常见的展示形式。现在的报告多是采用模板类型的设置模式。但是现在的自动化报告的信息获取的精准度比较差,在生成报告时,容易发生数据获取上的错误,另外则是在数据发生错误时,现有的模板无法起到预检测作用,而且现有的模板是一种固定模板,在出现额外的有效数据时,也无法体现在报告当中,这实际上缩减了模板自身的有效性和可拓展性。

具体实施方式

[0051] 为能清楚说明本方案的技术特点,下面通过具体实施方式,对本申请进行详细阐述。
[0052] 在第一个实施例中,如图1所示,一种文本报告自动生成方法,包括如下步骤:
[0053] S101获取报告模板和原始数据;\
[0054] 所述报告模板包括Api参数和SQL参数;所述Api参数包括参数类型、参数名称、参数描述、访问地址;所述SQL参数包括数据库信息、数据库地址、用户名、密码及查询语句。
[0055] 所述Api参数采用占位符的方式在报告模板中形成可变参数;所述SQL参数用于与Api参数配合,根据Api参数从原始数据当中得到有效内容
[0056] S102根据报告模板所需内容从原始数据当中提取有效内容;
[0057] 在对于原始数据进行有效内容的提取时,若无法得到有效内容,则对于原始数据的整体进行检索分析,得到与报告模板当中所需内容接近的内容作为次有效内容,对次有效内容进行解构得到解构内容,并将解构内容作为有效替代内容。
[0058] 所述次有效内容按照如下方式进行分析得到:
[0059] 获取报告模板对于所需内容的要求;
[0060] 提取报告模板对于所需内容的要求中的关键词;
[0061] 拓展关键词得到关键词组;
[0062] 以该关键词组作为匹配要素,在原始数据当中进行匹配检索,得到匹配度超过匹配阈值的检索对象,将检索对象综合得到次有效内容;
[0063] 所述检索对象以段落为提取起止点。
[0064] 所述解构内容按照如下方式得到:
[0065] 将检索对象按照匹配度从高到低进行排序;
[0066] 将检索对象中有效信息按照匹配度的排序进行汇总,若从次级的检索对象得到的有效信息低于有效阈值,则停止进行解构内容的汇总;
[0067] 按照匹配度最高的检索对象作为解构内容进行拓展描述,作为在不存在有效内容情况下的有效替代内容。S103得到有效替代内容之后,将有效替代内容的构成形式作为备用模板写入到报告模板当中
[0068] 备用模板用于在原有报告模板无法得到对应的有效内容时,采用备用模板的要求再次进行有效内容的获取,若能够得到有效内容,则进入到下一部分有效内容的获取,若无法得到有效内容,则再进行有效替代内容的获取。
[0069] S104将有效内容、有效替代内容补充到报告模板当中形成报告。
[0070] S105将报告进行图片化和附加水印。
[0071] 包括如下步骤:
[0072] 将报告转化为报告图片;
[0073] 在报告图片上设置水印。
[0074] 按照如下方式在图片上设置水印:
[0075] S1获取报告图片的溯源信息;
[0076] 所述溯源信息包括单位名称、用户、主机MAC、报告图片的形成时间;
[0077] S2将溯源信息转化为第一隐形水印,基于报告图片将第一隐形水印融入到报告图片当中得到溯源图片;
[0078] 将溯源信息经国密SM4加密算法转换为第一隐形水印;溯源信息按照如下方式得到第一隐形水印并将第一隐形水印与报告图片复合得到溯源图片:
[0079] 确定第一隐形水印的位置,将第一隐形水印中的字符排列为方形设置的第一字符块,然后将第一字符块进行图片化处理,使得第一字符块中的线条宽度所占的像素数不少于10个;
[0080] 获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,将第一字符块铺满报告图片,然后得到溯源图片。
[0081] 溯源信息按照如下方式得到:
[0082] 对比溯源图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息。
[0083] S3获取浏览的客户端信息;
[0084] 所述客户端信息包括系统用户名、客户端IP、浏览时间;
[0085] S4将客户端信息转化为第二隐形水印,基于报告图片和第一隐形水印将第二隐形水印融入到报告图片当中得到档案图片。
[0086] 将客户端信息经RSA算法转化为第二隐形水印。客户端信息按照如下方式得到第二隐形水印并将第二隐形水印与报告图片复合得到档案图片:
[0087] 将第二隐形水印中的字符排列为条形设置的第二字符块,然后将第二字符块进行图片化处理,使得第二字符块中的线条宽度所占的像素数不少于2个;
[0088] 获取第一字符块,将第二字符块中的线条部分按照第一字符块的线条长度切割后与第一字符块进行复合;
[0089] 获取报告图片的像素值,并将该像素值的R或G或B上检测到有第一字符块的线条的位置加1,然后对比加1前后颜色变化,若观测颜色变化超过变化阈值,所述变化阈值为像素颜色对应光波长的变化5%,则恢复原值,然后得到档案图片;若检测到具有第一字符块线条的同时,还具有第二字符块线条,像素值则保持不变。
[0090] 对于附加第一隐形水印和第二隐形水印的图片,所述档案信息和溯源信息按照如下方式得到:
[0091] 对比档案图片和报告图片得到图片上像素的变化,并提取加1的像素的位置,得到带有第一字符块的灰度图片,然后将灰度图片进行文字提取得到第一隐形水印,然后经国密SM4加密算法得到溯源信息;将第一字符块上线条位置的文字进行文字提取得到第二隐形水印,并通过RSA算法得到客户端信息。
[0092] 在第二实施例中,如图2所示,一种文本报告自动生成系统,包括如下模块:
[0093] 拓展模块201,用于获取报告模板和原始数据;
[0094] 内容提取模块202,用于根据报告模板所需内容从原始数据当中提取有效内容;
[0095] 报告生成模块203,用于将有效内容补充到报告模板当中形成报告。
[0096] 模板补充模块204,用于将有效替代内容的构成形式作为备用模板写入到报告模板当中。
[0097] 以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页 第1页 第2页 第3页
相关技术
文本报告相关技术
方法系统相关技术
刘凡发明人的其他相关专利技术