技术领域
[0001] 本申请涉及数据处理技术领域,具体而言,涉及一种文档的密点标注方法及装置、文档的密点标注系统。
相关背景技术
[0002] 相关技术中,通过手工密点标注或者插件技术对待处理文档进行密点标注;采用手工密点标注,要求定密人员熟练掌握相关的定密依据,定密事项和相关密点,并且定密质量高度依赖于定密人员的业务能力,因此,存在密点标注的效率较低,规范性差的问题;采用插件技术进行密点标注,需要将用于密点标注的插件嵌入相关软件中,但是部分软件不支持插件嵌入,因此,无法应用于全场景,功能覆盖不全面的问题。
[0003] 针对上述的问题,目前尚未提出有效的解决方案。
具体实施方式
[0024] 为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
[0025] 需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026] 为了更好地理解本申请实施例,以下将本申请实施例中涉及的技术术语解释如下:
[0027] 密点标注:本申请实施例中的密点标注技术应用于文档,用于将文档中的密点数据标注出来,其中,密点数据可以是预先定义的关键信息。
[0028] 流式文件格式:格式为可编辑的文档格式的文件,例如文本文档格式(txt)、电子表格格式(excel)和演示文稿格式(ppt)。
[0029] 版式文件格式:格式为不能直接编辑的文档格式的文件,转换为流式文件格式以后可以编辑,例如,开放版式文件(Open Fixed‑layout Documents,OFD)、跨操作系统平台的文件格式(Portable Document Format,PDF)。
[0030] 在相关技术中,通过手工密点标注对文档进行密点标注,存在效率低规范性差的问题,利用插件技术对文档进行密点标注,需要将实现密点标注功能的实现模块嵌入到相关办公软件中,通过相关宿主软件接口提取文档文本,通过程序扫描密点数据,实现手工或自动标注,但是当文档处理软件不支持插件嵌入时,无法实现密点标注功能,因此,存在功能覆盖不全面,无法应用于全场景的问题。为了解决该问题,本申请实施例中提供了相关的解决方案,以下详细说明。
[0031] 根据本申请实施例,提供了一种密点标注的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0032] 本申请实施例所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现文档的密点标注方法的计算机终端的硬件结构框图。如图1所示,计算机终端10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
[0033] 应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
[0034] 存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的文档的密点标注方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的文档的密点标注方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0035] 传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
[0036] 显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10的用户界面进行交互。
[0037] 本申请实施例提供了一种可以运行在上述运行环境中运行的文档的密点标注方法,图2是根据本申请实施例提供文档的密点的标注方法的流程图,如图2所示,该方法包括如下步骤:
[0038] 步骤S202,独立运行的密点标注进程获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式。
[0039] 由于本申请实施例提供的密点标注的方法独立运行,无需嵌入处理文档的软件,因此本申请实施提供的密点标注的方法不受文档的格式的限制,可应用于文本格式(txt)、word文档格式(doc、docx)、金山文档格式(wps)、演示文稿格式(ppt)以及跨操作系统平台的文件格式(PDF)、开放版式文件格式(OFD)等各种格式的文档;在步骤S202中,运行密点标注的方法的终端设备获取待进行密点标注的(目标)文档。
[0040] 步骤S204,从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言XML格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码Unicode格式。
[0041] 在步骤S204中,将待进行密点标注的(目标)文档中记载的全部数据(即目标数据)读取出来,读取出的全部数据包括文档中实际记载的数据(即内容数据)和用于描述文档记载数据的记载形式的样式数据,例如,文档中记载的数据的字体、颜色、字号、字形等均是样式数据;其中,不同格式的目标数据采用不同的提取方法,如果待进行密点标注的(目标)文档的格式为流式文件格式(以docx、xlsx、pptx结尾的文件),则在提取(目标)数据时,按照可扩展标记语言(XML)格式解析(目标)文档包含的每个元数据文件,提取(目标)文档中包含的文本的相关数据、表格的相关数据和图像(形)的相关数据为目标数据;如果待进行密点标注的(目标)文档的格式为版式文件格式(pdf、ofd类文件),则在提取(目标)数据时,对(目标)文档的文件体,交叉引用表和文件尾的数据内容进行解析后提取所需的文本,表格,图片及其格式信息作为目标数据;如果待进行密点标注的(目标)文档的格式为txt文本类文件,则在提取(目标)数据时,直接按文本模式逐字节读取并统一转换为Unicode格式。
[0042] 步骤S206,将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口API将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据。
[0043] 在步骤S206中,将步骤S204中从目标文档中提取/读取出的全部数据展示在可视化密点编辑器的交互界面,由于不同格式的目标文档中的样式数据的格式不同,为了保证可视化密点编辑器能够知晓从不同目标文档中提取到的目标数据以何种形式展示,在从目标文档中提取全部数据后,在可视化密点编辑器的交互界面展示目标文档的内容数据之前,将从目标文档中提取到的样式数据转换为可视化密点编辑器支持的语言数据(即目标语言数据),其中,目标语言数据的格式与样式数据的转换前的格式不同,可视化密点编辑器能够解析转换为目标语言数据的样式数据,以知晓内容数据以何种方式展示。在对样式数据进行转换后,将转换后的样式数据和与样式数据在同一个目标文档的、且未经转换的内容数据存储到数据结构中,运行密点标注方法的进程通过应用程序编程接口(Application Programming Interface,API)将数据结构传输到可视化密点编辑器中,可视化密点编辑器解析数据结构中的样式数据后,按照样式数据记载的展示方式将数据结构中的内容数据展示在可视化密点编辑器的交互界面。
[0044] 可选地,在交互界面中展示目标数据,包括:获取目标数据的标识信息,其中,标识信息至少包括:目标数据中各个字符的段落序号;依据各个字符的段落序号从小到大的顺序对目标数据中的字符进行排列,得到排列结果;将排列结果展示在交互界面,其中,排列结果展示在交互界面时对应的图像与目标图像相同,目标图像为在任意界面中打开目标文档时显示的图像。
[0045] 将从待进行密点标注的(目标)文档中读取出的全部数据展示在可视化密点编辑器的交互界面时呈现的图像与在任意一个界面打开目标文档中呈现的(目标)图像相同,这是为了保证后续将标注后的数据输入(目标)文档进行替换时出现数据替换错误的情况。为了保证全部数据展示在交互界面时呈现的图像与在任意一个界面打开目标文档中呈现的(目标)图像相同,在本实施例中,在交互界面中展示读取到的全部数据之前,首先获取目标数据的标识信息,即读取标记在每个字符上的段落序号,按照段落序号从小到大的顺序将读取到的全部数据排列多个段落,例如将段落序号为1的字符排列在第一段,段落序号为2的字符排列在第二段等;最终,将按照段落序号排列后的全部数据展示在可视化密点编辑器的交互界面。
[0046] 根据本申请一个可选的实施例,在存在段落序号相同的多个字符的情况下,密点标注的方法还包括:获取段落序号相同的多个字符中每个字符的位置序号,其中,每个字符的位置序号用于指示每个字符在同一段落中的位置;依据每个字符的位置序号从小到大的顺序将段落序号相同的多个字符进行排列。
[0047] 在本实施例中,如果在上一实施例中按照段落序号对读取到的全部数据进行排列时,存在段落序号相同的多个字符,则获取标注在每个字符上的、用于指示每个字符在段落中的位置的(位置)序号;接下来,对于同一段落的多个字符,按照每个字符的位置序号从小到大的顺序进行排列,例如对于段落序号为1,位置序号为3的字符、段落序号为1,位置序号为4的字符,在第一段中,将位置序号为4的字符排列在位置序号为3的字符的后边。
[0048] 步骤S208,响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
[0049] 在步骤S208中,交互界面中除了能够展示从文档中读取出的全部数据以外,还展示密点标注功能按钮,用户通过点击交互界面中的密点标注功能按钮可以进行密点标注模式的切换,其中,可视化密点编辑器默认处于自动密点标注模式。在可视化密点编辑器处于自动密点标注模式的情况下,交互界面打开的同时,密点标注功能按钮相当于被点击了一次,因此,交互界面在打开的同时相当于接收到了指示开始密点标注的指令(即第一触发指令),在检测到第一触发指令后,交互界面自动对读取到的全部数据执行密点标注,其中,交互界面在对读取到的全部数据执行密点标注时,是根据与其对应的存储设备中存储的密点配置信息来判断对读取到的全部数据中的哪些数据进行密点标注的;上述与交互界面对应的存储设备可以是存储器、存储硬盘或者与交互页面之间能够进行数据传输的其它存储设备。最终,可视化密点编辑器将完成密点标注操作后的数据(即密点标注数据)写回到数据之前所在的(目标)文档中。
[0050] 可选地,依据密点配置信息对目标数据进行密点标注,其中,密点配置信息,包括:标注格式、定密事项和密点数据,其中,密点数据指示需要进行密点标注的数据,定密事项用于指示密点数据对应的数据类型,标注格式用于指示数据类型对应的标注方式,其中,不同的数据类型对应不同的标注方式。
[0051] 如上一实施例提到的,交互页面在对读取到的全部数据执行密点标注时,是根据其对应的存储设备中存储的密点配置信息来判断对读取到的全部数据中的哪些数据进行密点标注的;其中,密点配置信息包括:预先设定的密点数据,例如,涉及证件号码的数据;用于指示密点数据的数据类型的定密事项,以及,用于指示不同数据类型对应的标注方式的标注格式;其中,标注格式、定密事项、密点数据之间存在包含/对应的关系,即交互页面在读取到的全部数据中检测到与密点数据相同的数据后,在定密事项中查询这个数据属于哪一数据类型;进一步的,在根据定密事项确定数据类型后,在定密事项中查询数据类型对应的标注方式,其中,数据类型包括:文字、数字、符号等,标注方式包括:改变格式(如加粗/倾斜)、突出显示(标黄或者标记为其它颜色、添加括号/下划线)。举例来说,交互页面在读取到的全部数据中检测到与预先定义的密点数据相同的数据为“1”;接下来,交互页面根据标注格式确定数据“1”的数据类型为数字,进一步地,交互界面根据标注格式确定数据类型“数字”的标注方式为突出显示,则交互页面在进行密点标注时会将数据“1”以突出显示的方式进行密点标注。
[0052] 根据本申请一个可选的实施例,依据密点配置信息对目标数据进行密点标注,包括:扫描目标数据,得到扫描结果;在扫描结果指示目标数据中存在有效数据的情况下,依据定密事项确定每个有效数据所属的数据类型,依据标注格式根据每个有效数据所属的数据类型确定每个有效数据对应的标注方式,其中,有效数据是与密点数据相同的数据;采用每个有效数据对应的标注方式对每个有效数据进行密点标注,其中,密点标注后的有效数据在交互界面中的显示方式与除有效数据以外的其它数据在交互界面中的显示方式不同。
[0053] 在本实施例中,交互页面在根据密点配置信息对读取到的全部数据(即目标数据)进行密点标注时,执行以下步骤:首先,对读取到的全部数据进行扫描,在扫描到与密点数据相同的数据(即有效数据)后,依据定密事项确定有效数据的数据类型;进一步地依据标注格式确定有效数据所属的数据类型对应的标注方式;交互界面通过上述步骤对读取到的全部数据中的全部有效数据执行上述步骤,最终,对读取到的全部数据中的全部有效数据都以其对应的标注方式进行密点标注。需要说明的是,密点标注的目的是将文档中的密点数据(即有效数据)都能够更容易被看见,因此,密点标注后的数据在交互界面中的显示方式与未进行密点标注的数据在交互界面中的显示方式应是不同的,例如,密点数据是“20”,属于数字类型,且数字类型对应的标注方式为加粗,则密点标注后的“20”是进行了加粗的,而其它未进行密点标注数据则没有加粗。
[0054] 根据本申请另一个可选的实施例,在依据密点配置信息对目标数据进行密点标注后,包括:响应于交互界面检测到的第二触发指令,将交互界面提供的密点标注功能由自动模式切换为手动模式,其中,第二触发指令是在交互界面执行完成第一触发指令对应的操作之后生成的;在手动模式下,依据目标对象在交互界面中输入的操作信息对目标数据进行密点标注。
[0055] 如上述实施例提及的,交互页面在打开时默认处于自动密点标注模式,而交互页面中包含用于切换密点标注模式的密点标注功能按钮,因此,在交互页面执行自动标注程序完毕后(即以及密点配置信息对目标数据进行密点标注后),如果交互页面再次检测到用户按下密点标注功能按钮生成的(第二触发指令),交互页面将密点标注模式由自动模式切换为手动模式,当密点标注模式切换为手动模式之后,交互页面会依据用户输入的操作信息对交互界面中显示的数据进行密点标注,实现手工调整的功能。需要说明的是,由于交互页面在打开时默认处于自动密点标注模式,相当于密点标注功能按钮已经被按下一次,交互界面已经检测到一次(第一)触发指令,因此,当用户再次按下密点标注功能按钮来切换密点标注模式时,交互界面检测到(第二)触发指令一定是在交互界面响应于第一触发指令,并执行完毕自动密点标注之后发生的。
[0056] 根据本申请一些可选的实施例,将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,包括:将密点标注后的有效数据输入到目标文档,并将目标文档中的有效数据替换为密点标注后的有效数据。
[0057] 在一些实施例中,交互界面将密点标注后的有效数据输入到原文档(即步骤S202中待进行密点标注的文档)中,利用密点标注后的有效数据替换密点标注前的有效数据,更新目标文档,完成了目标文档的密点数据的标注。
[0058] 通过上述步骤,可以实现利用独立运行在终端的密点标注方法对各种格式的文档进行密点标注,不受文档格式的限制,实现了密点标注功能的全场景覆盖,提高了密点标注的效率,同时,提高了定密工作的规范化和精准化。
[0059] 图3是根据本申请实施例提供的一种文档的密点标注系统的结构图,如图3所示,密点标注系统,包括:内容提取模块30和密点标注模块32,其中,内容提取模块30用于获取目标文档,从目标文档中提取目标数据,将目标数据传输到密点标注模块32,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言XML格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码Unicode格式;密点标注模块32,用于接收目标数据,将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口API将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;密点标注模块32,还用于响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
[0060] 密点标注系统在对待进行密点标注的文档(即目标)文档进行密点标注时,通过内容提取模块30读取目标文档中记载的全部数据(即目标数据),并将读取到的目标数据传输到密点标注模块32,由密点标注模块32在交互界面中对接收到的全部数据(机目标数据)进行密点标注,其中,密点标注模块32同时实现标注功能和更新功能,密点标注模块32在接收到内容提取模块30传输的目标数据后,优先执行标注功能:根据与密点标注模块32对应的交互界面通信连接的存储设备中存储的密点配置信息中的密点数据在目标数据中扫描与密点数据相同的有效数据,依据存储设备中存储的密点配置信息中的定密事项确定各个有效数据所属的数据类型,并进一步地依据存储设备中存储的密点配置信息中的标注格式根据各个有效数据所属的数据类型确定各个有效数据的标注方式,最终根据各个有效数据对应的标注方式对各个数据进行有效标注,完成标注功能。密点标注模块32在执行标注功能完毕后,将密点标注后的有效数据输入到目标文档中利用密点标注后的有效数据替换文档中进行密点标注前的有效数据,完成更新功能,完成目标文档的密点标注。
[0061] 图4是根据本申请实施例提供的一种文档的密点标注装置的结构图,文档的密点标注装置用于运行文档的密点标注方法,密点标注方法运行在独立的进程中,如图4所示,密点标注的装置包括:获取模块40,用于获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;读取模块42,用于从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言XML格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码Unicode格式;处理模块44,用于将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口API将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;标注模块46,用于响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
[0062] 图5是密点标注的装置的工作流程图,如图5所示,密点标注的装置在工作时,通过获取模块40获取待进行密点标注的文档(即目标文档),通过读取模块42读取获取模块40获取的目标文档中的全部数据(即目标数据);以及通过处理模块44将从目标文档中读取出的全部数据中的样式数据转换为可视化密点编辑器支持解析的(目标)语言格数据;处理模块44将转换后的样式数据和未经转换的内容数据存储在一个数据结构中后,通过API将数据结构发送到可视化密点编辑器中,在可视化密点编辑器的交互界面上展示内容数据;当内容数据展示在交互界面中时,调用标注模块46对交互界面中展示的内容数据进行密点标,并最终将密点标注后的数据传输回目标文档,替换与密点标注的数据相同,但没有进行密点标注的数据。
[0063] 需要说明的是,图4所示实施例的优选实施方式可以参见图2所示实施例的相关描述,此处不再赘述。
[0064] 本申请实施例还提供了一种非易失性存储介质,非易失性存储介质中存储有计算机程序,其中,在非易失性存储介质所在设备通过运行计算机程序执行以上的密点标注的方法。
[0065] 上述非易失性存储介质用于存储执行以下功能的程序:密点标注方法运行在独立且运行有可视化密点编辑器的进程中,包括:获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言XML格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码Unicode格式;将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口API将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
[0066] 本申请实施例还提供了一种电子设备,包括存储器和处理器,存储器中存储有计算机程序,处理器被设置为通过计算机程序执行以上的密点标注的方法。
[0067] 上述电子设备中的处理器用于运行执行以下功能的程序:密点标注方法运行在独立且运行有可视化密点编辑器的进程中,包括:获取目标文档,其中,目标文档为待进行密点标注的文档,目标文档的格式为格式集合中的任意一种格式,格式集合至少包括:流式文件格式、版式文件格式和文本类txt格式;从目标文档中提取目标数据,其中,目标数据为目标文档中记载的全部数据,目标数据包括内容数据和样式数据,在目标文档的格式为流式文件格式的情况下,从目标文档中提取目标数据包括:按照可扩展标记语言XML格式解析目标文档中的每个元数据文件,得到目标数据,在目标文档的格式为版式文件格式的情况下,从目标文档中提取目标数据包括:对目标文档中的文件头、文件体、交叉引用表和文件尾进行解析,得到目标数据,在目标文档的格式为txt格式的情况下,从目标文档中提取目标数据包括:逐字节读取目标文档中的数据,将读取到的目标文档中的数据统一转换为统一码Unicode格式;将从不同格式的目标文档中提取得到的样式数据转换为目标语言数据,并将目标语言数据与内容数据存储到数据结构,调用应用程序编程接口API将数据结构传输到可视化密点编辑器,并在可视化密点编辑器的交互界面按照样式数据展示内容数据,其中,目标语言数据为可视化密点编辑器能够解析的数据;响应于交互界面检测到的第一触发指令,依据密点配置信息对目标数据进行密点标注,得到密点标注数据,并将密点标注数据的内容数据和密点标注数据的样式数据回写到目标文档,其中,密点配置信息存储在交互界面对应的存储设备中。
[0068] 本申请实施例还提供了一种计算机程序产品,包括计算机指令,计算机指令被处理器执行时实现以上的文档的密点标注方法的步骤。
[0069] 需要说明的是,上述密点标注的装置中的各个模块可以是程序模块(例如是实现某种特定功能的程序指令集合),也可以是硬件模块,对于后者,其可以表现为以下形式,但不限于此:上述各个模块的表现形式均为一个处理器,或者,上述各个模块的功能通过一个处理器实现。
[0070] 上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
[0071] 在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0072] 在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0073] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0074] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0075] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read‑Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0076] 以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。