技术领域
[0001] 本发明涉及电数字数据处理技术领域,尤其涉及一种古籍文本三维扫描数据安全录入方法、装置及设备。
相关背景技术
[0002] 随着数字技术的深度渗透与融合,古籍保护的数字化转型步入新阶段。古籍作为时间的见证者,其蕴含的丰富知识亟待通过现代科技手段进行深度挖掘与广泛传播。三维扫描技术以其高精度、非接触性的优势,在古籍文本的数字化采集中展现出巨大潜力。故研究一种专门针对古籍文本的三维扫描数据安全录入方法显得尤为重要。该方法旨在通过优化扫描算法、强化数据处理能力,并结合严格的数据校验机制,实现从扫描到录入的全程安全保障。装置与设备则需针对古籍的特殊性进行设计,确保在保护古籍原貌的同时,高效完成数字化工作,为古籍的永续传承贡献力量。
[0003] 现有的古籍文本数据安全录入方法通过集成先进的图像处理与人工智能识别技术,利用高分辨率三维扫描仪,对古籍进行非接触式、无损的全方位扫描,获取古籍的三维形态与细节纹理,通过复杂的图像预处理算法,去除扫描过程中的噪声与干扰,增强文本图像的清晰度与对比度。并且引入深度学习模型对古籍文字进行自动识别与转录,该模型经过大量古籍文献数据训练,能够准确识别各种复杂字体与排版格式,甚至对于模糊、残缺的文字也能进行一定程度的修复与推断。同时,为确保数据安全,整个录入过程采用加密传输与存储技术,防止数据泄露与篡改,为古籍文献的数字化保护与传承提供了坚实的技术支撑。
[0004] 例如公告号为:CN116206069B的发明专利公告的三维扫描中的图像数据处理方法、装置和三维扫描仪,包括:获取被扫描物体的原始标记点图像,对原始标记点图像进行计算,得到标记点库;获取被扫描物体的原始二维表面图像,确定原始二维表面图像的被关注区域,得到候选二维表面图像,并实时对若干帧候选二维表面图像中的标记点和激光线进行识别,得到标记点数据和激光线数据;将识别到的标记点数据与标记点库中的标记点数据进行匹配,以更新识别到的标记点数据,结合更新后的标记点数据和所述激光线数据进行三维重建,得到三维表面数据。
[0005] 例如公开号为:CN114882179A的专利申请公开的一种文物三维数字采集方法及装置,包括:获取三维扫描技术对目标文物进行扫描的三维成像数据,并标记所述三维成像数据中覆盖物的三维区域;基于录入的土质参数、文物材质参数、以及出土时间确定与所述三维区域匹配的至少一个覆盖特征对象;调取与出土时间匹配的文物形态特征,并根据文物形态特征、覆盖特征对象预测三维区域中的隐藏物信息;构建三维成像数据与隐藏物信息匹配的文物三维数据,并进行输出。
[0006] 但本申请在实现本申请实施例中发明技术方案的过程中,发现上述技术至少存在如下技术问题:
[0007] 现有技术中,传统的古籍文本三维扫描数据录入方法往往受限于扫描设备的精度、古籍纸张的透光性及特殊装帧形式的复杂性,导致扫描过程中易产生数据失真、遗漏或拼接误差,并且后期处理过程繁琐,依赖人工校正,存在古籍文本数据的录入准确性低的问题。
具体实施方式
[0029] 本申请实施例通过提供一种古籍文本三维扫描数据安全录入方法、装置及设备,解决了现有技术中古籍文本数据的录入准确性低的问题,通过获取古籍文本的扫描过程参数和初始三维成像数据,然后根据获取的扫描过程参数对古籍文本进行验证得到古籍文本扫描验证指数,并根据古籍文本扫描验证指数获取古籍文本的三维成像数据,最后对三维成像数据进行三维重建得到古籍文本三维成像模型,并录入至古籍文本数据库中,实现了古籍文本数据的录入准确性的提高。
[0030] 本申请实施例中的技术方案为解决上述古籍文本数据的录入准确性低的问题,总体思路如下:
[0031] 通过对获取的古籍文本进行验证得到古籍文本扫描验证指数,并根据古籍文本扫描验证指数获取古籍文本的三维成像数据,然后进行三维重建得到古籍文本三维成像模型,最后录入至古籍文本数据库中,提高了古籍文本数据的录入准确性。
[0032] 为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0033] 如图1所示,为本申请实施例提供的一种古籍文本三维扫描数据安全录入的方法流程图,该方法应用于一种古籍文本三维扫描数据安全录入装置中,该方法包括以下步骤:S1,获取古籍文本的扫描过程参数和初始三维成像数据,扫描过程参数包括设备性能参数、操作质量参数和扫描环境参数,扫描过程参数用于描述三维扫描设备的扫描过程,初始三维成像数据为利用三维扫描设备对古籍文本进行扫描过程中,设备捕捉并记录下的古籍文本表面的三维信息;S2,根据获取的扫描过程参数对古籍文本进行验证得到古籍文本扫描验证指数,并根据古籍文本扫描验证指数获取古籍文本的三维成像数据,古籍文本扫描验证指数用于描述古籍文本在扫描过程中的扫描质量达标情况,三维成像数据为扫描验证后扫描质量达标的初始三维成像数据;S3,对三维成像数据进行三维重建得到古籍文本三维成像模型,并录入至古籍文本数据库中,三维重建用于将三维成像数据转换为古籍文本三维成像模型,古籍文本三维成像模型用于虚拟三维展示古籍文本,古籍文本数据库用于存储古籍文本三维成像模型。
[0034] 在本实施例中,三维扫描设备捕捉并记录下的古籍文本表面的三维信息,通常包括古籍的几何形状、理、颜色等,并以数字化的形式存储;三维扫描设备通过发射光线(激光或结构光)并捕捉其反射回来的信号,从而计算出古籍文本表面的每一个点的三维坐标,同时,设备还会记录每个点的颜色和纹理信息,以生成更加真实的三维模型;三维重建是用于将三维成像数据转换为三维模型的过程,在这个过程中,计算机算法会分析扫描得到的三维成像数据,并根据这些数据构建出古籍文本的三维模型,这个模型不仅包含了古籍文本的几何形状,还包含其表面的纹理、颜色等详细信息,从而实现对古籍文本的虚拟三维展示;实现了古籍文本数据的录入准确性的提高。
[0035] 进一步的,古籍文本扫描验证指数的获取方法为:根据获取的扫描过程参数得到古籍文本的扫描过程指数,扫描过程指数包括设备性能指数、操作质量指数和扫描环境指数,设备性能指数用于描述三维扫描设备的性能情况,操作质量指数用于描述扫描过程中的操作质量情况,扫描环境指数用于描述古籍文本在扫描过程中的扫描环境符合情况;从预设数据库中获取扫描过程指数对应的参考值和参考偏差,同时获取验证修正因子,并结合扫描过程指数得到古籍文本对应的古籍文本扫描验证指数,验证修正因子包括设备性能因子、操作质量因子和扫描环境因子,设备性能因子为设备性能指数的修正因子,操作质量因子为操作质量指数的修正因子,扫描环境因子为扫描环境指数的修正因子。
[0036] 其中,设备性能因子从预设数据库中获得。在一个具体的实施例中,根据历史设备性能指数与古籍文本扫描验证指数之间的关系构建设备性能指数与其对应的修正因子的映射集,并将实时的设备性能指数值输入映射集得到对应的设备性能因子。
[0037] 操作质量因子从预设数据库中获得。在一个具体的实施例中,根据历史操作质量指数与古籍文本扫描验证指数之间的关系构建操作质量指数与其对应的修正因子的映射集,并将实时的操作质量指数值输入映射集得到对应的操作质量因子。
[0038] 扫描环境因子从预设数据库中获得。在一个具体的实施例中,根据历史扫描环境指数与古籍文本扫描验证指数之间的关系构建扫描环境指数与其对应的修正因子的映射集,并将实时的扫描环境指数值输入映射集得到对应的扫描环境因子。
[0039] 在本实施例中,设备性能指数的参考值、操作质量指数的参考值和扫描环境指数的参考值均为预设人员根据古籍文本的实际情况进行设定;设备性能指数的参考偏差为预设人员通过标准偏差计算公式对古籍文本的历史设备性能指数进行统计后表示,操作质量指数的参考偏差为预设人员通过标准偏差计算公式对古籍文本的历史操作质量指数进行统计后表示,扫描环境指数的参考偏差为预设人员通过标准偏差计算公式对古籍文本的历史扫描环境指数进行统计后表示;标准偏差计算公式为: 其中,S为参考偏差值,r为数据的编号,r=1,2,...,k,k为数据的总数量,xr为第r个数据的数据值,为该数据的平均值;实现了古籍文本在扫描过程中的扫描质量达标情况的数值化,进一步提高了古籍文本数据的录入准确性。
[0040] 进一步的,古籍文本扫描验证指数采用以下公式计算:
[0041]
[0042] 式中,m表示古籍文本的编号,m=1,2,...,M,M为古籍文本的总数量,YZm为第m个古籍文本对应的古籍文本扫描验证指数,XNm为第m个古籍文本的设备性能指数,XN0为设备性能指数的参考值,ΔXN为设备性能指数的参考偏差,CZm为第m个古籍文本的操作质量指数,CZ0为操作质量指数的参考值,ΔCZ为操作质量指数的参考偏差,SMm为第m个古籍文本的扫描环境指数,SM0为扫描环境指数的参考值,ΔSM为扫描环境指数的参考偏差,a1为设备性能因子,a2为操作质量因子,a3为扫描环境因子。
[0043] 在本实施例中,本实施例算法结合古籍文本的设备性能指数、操作质量指数和扫描环境指数,综合分析得到古籍文本扫描验证指数,设备性能指数是古籍文本扫描验证指数的重要基础,高性能的三维扫描设备能够提供更精确、更清晰的扫描图像,减少扫描过程中的误差和失真,从而提高古籍文本扫描验证指数;操作质量指数反映了扫描过程中操作人员的技能水平、操作规范性和细致程度,良好的操作质量能够确保扫描过程的顺利进行,减少人为因素导致的扫描误差和图像质量问题;适宜的扫描环境能够减少环境因素对扫描图像质量的干扰,提高扫描的稳定性和可靠性,故扫描环境指数也是影响古籍文本扫描验证指数的重要因素之一;表明古籍文本在扫描过程中的扫描质量达标情况,因此通过建立数学形式进行精准地分析;实现了古籍文本在扫描过程中的扫描质量达标情况的更精确评估,进一步提高了古籍文本数据的录入准确性。
[0044] 进一步的,设备性能指数的获取方法如下:从古籍文本的设备性能参数中提取出三维扫描设备对应的设备性能指标,设备性能指标包括设备扫描精度、设备扫描分辨率和光源稳定性分数,根据设备扫描精度与参考设备扫描精度获取设备扫描精度分数,根据设备扫描分辨率与参考设备扫描分辨率获取设备扫描分辨率分数,光源稳定性分数为预设专业人员对三维扫描设备输出光线的稳定程度进行打分后的平均值,设备扫描精度分数为设备扫描精度和参考设备扫描精度的差值,设备扫描分辨率分数为设备扫描分辨率和参考设备扫描分辨率的差值;获取三维扫描设备的镜头模糊分数,同时从预设数据库中获取三维扫描设备对应的设备性能权重,结合获取的设备性能指标得到古籍文本的设备性能指数,镜头模糊分数为有损区域面积与镜头区域面积的比值,设备性能权重包括第一设备权重、第二设备权重、第三设备权重和第四设备权重,有损区域表示镜头区域中污渍破损区域的面积,第一设备权重用于描述设备扫描精度相对于设备性能指数的影响程度,第二设备权重用于描述设备扫描分辨率相对于设备性能指数的影响程度,第三设备权重用于描述光源稳定性分数相对于设备性能指数的影响程度,第四设备权重用于描述镜头模糊分数相对于设备性能指数的影响程度。′
[0045] 其中,设备扫描精度分数的表达式为: 其中,α m为第m个古籍文本的设备扫描精度, 为第m个古籍文本的参考设备扫描精度;设备扫描分辨率分数的表′达式为: 其中,βm为第m个古籍文本的设备扫描分辨率, 为第m个古籍文本的参考设备扫描分辨率。
[0046] 需要理解的是,参考设备扫描精度通过对古籍文本的设备扫描精度进行统计后取平均值表示,参考设备扫描分辨率通过对古籍文本的设备扫描分辨率进行统计后取平均值表示。
[0047] 在本实施例中,第一设备权重从预设数据库中获得。在一个具体的实施例中,根据历史设备扫描精度与设备性能指数之间的关系构建设备扫描精度与其对应的权重因子的映射集,并将实时的设备扫描精度值输入映射集得到对应的第一设备权重。
[0048] 第二设备权重从预设数据库中获得。在一个具体的实施例中,根据历史设备扫描分辨率与古籍文本扫描验证指数之间的关系构建设备扫描分辨率与其对应的权重因子的映射集,并将实时的设备扫描分辨率值输入映射集得到对应的第二设备权重。
[0049] 第三设备权重从预设数据库中获得。在一个具体的实施例中,根据历史光源稳定性分数与古籍文本扫描验证指数之间的关系构建光源稳定性分数与其对应的权重因子的映射集,并将实时的光源稳定性分数值输入映射集得到对应的第三设备权重;第四设备权重从预设数据库中获得。在一个具体的实施例中,根据历史镜头模糊分数与古籍文本扫描验证指数之间的关系构建镜头模糊分数与其对应的权重因子的映射集,并将实时的镜头模糊分数值输入映射集得到对应的第四设备权重;实现了三维扫描设备的性能情况的数值化,进一步提高了古籍文本数据的录入准确性。
[0050] 进一步的,设备性能指数采用以下公式计算:
[0051]
[0052] 式中,e为自然常数,n表示预设专业人员的编号,n=1,2,...,N,N为预设专业人员的总数量,αm为第m个古籍文本的设备扫描精度分数,Δαm为第m个古籍文本的设备扫描精度参考偏差,βm为第m个古籍文本的设备扫描分辨率分数,Δβm为第m个古籍文本的设备扫描分辨率参考偏差, 为第m个古籍文本的光源稳定性分数,Sm为第m个古籍文本的镜头模糊分数,b1为第一设备权重,b2为第二设备权重,b3为第三设备权重,b4为第四设备权重。
[0053] 在本实施例中,精度表示观测值与真值的接近程度,代表测量尺寸的准确性;分辨率表示还原几何特征的精细程度,即设备能够捕捉到的最小细节尺寸;精度和分辨率均为扫描过程前,根据古籍文本的实际情况设置的数据,若古籍文本损坏程度越大,精度和分辨率就越大;光源稳定性分数:衡量光源输出稳定性的指标,稳定性越高,光源的波动越小,对扫描结果的影响也越小;镜头模糊分数用于评估镜头成像清晰度的指标,数值越低表示镜头成像越清晰;本实施例算法结合古籍文本的设备扫描精度、设备扫描分辨率、光源稳定性分数和镜头模糊分数,综合分析得到设备性能指数,高精度往往要求高分辨率的支持,因为高分辨率能够捕捉更多的细节信息,从而提高测量的准确性;光源稳定性对三维扫描至关重要,因为光源的波动可能导致扫描结果的不一致性和误差,因此,高光源稳定性分数是三维扫描设备性能优越的重要标志之一;镜头模糊直接影响扫描结果的质量。如果镜头模糊分数较高,说明镜头成像不清晰,可能导致扫描结果中的几何特征失真或缺失,因此,低镜头模糊分数是确保三维扫描设备性能优越的重要因素之一;表明三维扫描设备的性能情况,因此通过建立数学形式进行精准地分析;实现了三维扫描设备的性能情况的更精确评估,进一步提高了古籍文本数据的录入准确性。
[0054] 需要理解的是,设备扫描精度参考偏差通过标准偏差计算公式对古籍文本的设备扫描精度进行统计后表示,设备扫描分辨率参考偏差通过标准偏差计算公式对古籍文本的设备扫描分辨率进行统计后表示;标准偏差计算公式为: 其中,S为参考偏差值,r为数据的编号,r=1,2,...,k,k为数据的总数量,xr为第r个数据的数据值,为该数据的平均值。
[0055] 进一步的,操作质量指数的获取方法如下:从操作质量参数中获取三维扫描设备对应的操作质量指标,并根据操作质量指标和对应的参考数据得到操作质量系数,操作质量指标包括扫描距离和扫描速度,操作质量系数包括扫描距离系数和扫描速度系数;扫描距离系数为扫描距离和参考扫描距离的差值,扫描速度系数为扫描速度和参考扫描速度的差值;从数据库中获取三维扫描设备对应的操作权重,并结合得到的操作质量系数获取古籍文本的操作质量指数,操作权重包括第一操作权重和第二操作权重,第一操作权重用于描述扫描距离系数相对于操作质量指数的影响程度,第二操作权重用于描述扫描速度系数相对于操作质量指数的影响程度。
[0056] 在本实施例中,操作质量指数采用以下公式计算:
[0057]
[0058] 式中,e为自然常数,Xm为第m个古籍文本的扫描距离系数,ΔX为扫描距离参考偏差,Vm为第m个古籍文本的扫描速度系数,ΔV为扫描速度参考偏差,c1为第一操作权重,c2为第二操作权重。
[0059] 其中,第一操作权重从预设数据库中获得。在一个具体的实施例中,根据历史扫描距离系数与操作质量指数之间的关系构建扫描距离系数与其对应的权重因子的映射集,并将实时的扫描距离系数值输入映射集得到对应的第一操作权重。
[0060] 第二操作权重从预设数据库中获得。在一个具体的实施例中,根据历史扫描速度系数与操作质量指数之间的关系构建扫描速度系数与其对应的权重因子的映射集,并将实时的扫描速度系数值输入映射集得到对应的第二操作权重。′
[0061] 需要理解的是,扫描距离系数的表达式为: 其中,X m为第m个古籍文本的扫描距离, 为第m个古籍文本的参考扫描距离;扫描速度系数的表达式为:′
其中,Vm为第m个古籍文本的扫描速度, 为第m个古籍文本的参考扫描
速度。
[0062] 需要理解的是,参考扫描距离通过对古籍文本的扫描距离进行统计后取平均值表示,参考扫描速度通过对古籍文本的扫描速度进行统计后取平均值表示;扫描距离参考偏差通过标准偏差计算公式对古籍文本的扫描距离进行统计后表示,扫描速度参考偏差通过标准偏差计算公式对古籍文本的扫描速度进行统计后表示;标准偏差计算公式为:其中,S为参考偏差值,r为数据的编号,r=1,2,...,k,k为数据的总数量,xr为第r个数据的数据值,为该数据的平均值。
[0063] 具体的,本实施例算法结合古籍文本的扫描距离系数和扫描速度系数,综合分析得到操作质量指数,扫描距离是影响扫描图像分辨率和景深的重要因素,一般来说,工作距离越远,景深越大,但分辨率可能会下降,因为电子束在更长的距离上扩散,导致图像模糊,反之,工作距离越近,分辨率越高,但景深减小,可能导致图像中不同层面的细节难以同时清晰呈现;适当的扫描距离有助于保持图像的清晰度,过近或过远的距离都可能导致图像模糊或失真,从而降低操作质量指数;扫描速度越快,虽然可以提高扫描效率,但可能会导致噪声增加,因为电子束在样品上的停留时间减少,信号采集不够充分,这会影响图像的清晰度和分辨率,从而降低操作质量指数;另一方面,扫描速度越慢,虽然可以减小噪声,提高图像质量,但电子束对样品的损伤也会增加,特别是对于不导电样品,可能会产生更严重的充电效应,因此,在操作质量指数中,也需要考虑扫描速度对样品损伤的影响;表明扫描过程中的操作质量情况,因此通过建立数学形式进行精准地分析;令次扫描距离系数令次扫描速度系数 则操作质量指数的公式可简化为 如图2所示,为本申请实施例提供的操作质量指数的
变化统计图,由图可知,次扫描距离系数和次扫描速度系数与操作质量指数均成正相关,当次扫描距离系数越大,操作质量指数越大,扫描过程中的操作质量情况越好,当次扫描速度系数越大,操作质量指数也越大,扫描过程中的操作质量情况也越好;实现了扫描过程中的操作质量情况的数值化,进一步提高了古籍文本数据的录入准确性。
[0064] 进一步的,扫描环境指数的获取方法如下:从古籍文本的扫描环境参数中获取古籍文本扫描过程中的扫描环境指标,并根据扫描环境指标和对应的参考数据得到扫描环境系数,扫描环境指标包括光照均匀度、扫描环境温度和扫描环境湿度,扫描环境系数包括扫描环境温度系数和扫描环境湿度系数;扫描环境温度系数为扫描环境温度和参考扫描环境温度的差值,扫描环境湿度系数为扫描环境湿度和参考扫描环境湿度的差值;从预设数据库中获取古籍文本扫描过程中的环境权重,并结合获取的光照均匀度和扫描环境系数得到古籍文本的扫描环境指数,环境权重包括第一环境权重、第二环境权重和第三环境权重,第一环境权重用于描述光照均匀度相对于扫描环境指数的影响程度,第二环境权重用于描述扫描环境温度系数相对于扫描环境指数的影响程度,第三环境权重用于描述扫描环境湿度系数相对于扫描环境指数的影响程度。
[0065] 在本实施例中,扫描环境指数采用以下公式计算:
[0066]
[0067] 式中,Am为第m个古籍文本的光照均匀度, 为第m个古籍文本的表面最小照′度, 为第m个古籍文本的平均照度,T m为第m个古籍文本的扫描环境温度系数,ΔTm为第′
m个古籍文本的扫描环境温度参考偏差,Cm为第m个古籍文本的扫描环境湿度系数,ΔCm为第m个古籍文本的扫描环境湿度参考偏差,d1为第一环境权重,d2为第二环境权重,d3为第三环境权重。
[0068] 其中,第一环境权重从预设数据库中获得。在一个具体的实施例中,根据历史光照均匀度与扫描环境指数之间的关系构建光照均匀度与其对应的权重因子的映射集,并将实时的光照均匀度值输入映射集得到对应的第一环境权重。
[0069] 第二环境权重从预设数据库中获得。在一个具体的实施例中,根据历史扫描环境温度系数与扫描环境指数之间的关系构建扫描环境温度系数与其对应的权重因子的映射集,并将实时的扫描环境温度系数值输入映射集得到对应的第二环境权重。
[0070] 第三环境权重从预设数据库中获得。在一个具体的实施例中,根据历史扫描环境湿度系数与扫描环境指数之间的关系构建扫描环境湿度系数与其对应的权重因子的映射集,并将实时的扫描环境湿度系数值输入映射集得到对应的第三环境权重。
[0071] 需要理解的是,扫描环境温度系数的表达式为: 其中,Tm为第m个古籍文本的扫描环境温度, 为第m个古籍文本的参考扫描环境温度;扫描环境湿度系数的表达式为: 其中,Cm为第m个古籍文本的扫描环境湿度, 为第m个古籍文本的参考扫描环境湿度。
[0072] 需要理解的是,参考扫描环境温度通过对古籍文本的扫描环境温度进行统计后取平均值表示,参考扫描环境湿度通过对古籍文本的扫描环境湿度进行统计后取平均值表示;扫描环境温度参考偏差通过标准偏差计算公式对古籍文本的扫描环境温度进行统计后表示,扫描环境湿度参考偏差通过标准偏差计算公式对古籍文本的扫描环境湿度进行统计后表示;标准偏差计算公式为: 其中,S为参考偏差值,r为数据的编号,r=1,2,...,k,k为数据的总数量,xr为第r个数据的数据值,为该数据的平均值[0073] 具体的,表面最小照度是指扫描区域内古籍文本表面所接收到的最小光照强度,它对于扫描图像的质量至关重要,因为足够的光照强度能够确保文本细节被清晰捕捉,减少阴影和反光现象;扫描环境温度是指扫描设备所处环境的温度,温度的变化可能对扫描设备和古籍文本产生不利影响,如热胀冷缩导致设备精度下降,或温度过高引起古籍纸张变形等;扫描环境湿度是指扫描区域内空气的潮湿程度,湿度过高可能导致古籍文本受潮发霉,湿度过低则可能引起纸张干裂变形;本实施例算法结合古籍文本的表面最小照度、扫描环境温度系数和扫描环境湿度系数,综合分析得到扫描环境指数,较高的表面最小照度通常意味着更好的光照条件,有利于提升扫描图像的质量,从而提高扫描环境指数;超出适宜范围的温度可能会降低扫描图像的质量(如产生热噪声或图像扭曲),从而降低扫描环境指数;湿度过高或过低都可能导致扫描图像出现质量问题(如模糊、色彩失真等),从而降低扫描环境指数;表明古籍文本在扫描过程中的扫描环境符合情况,因此通过建立数学形式进行精准地分析;实现了古籍文本在扫描过程中的扫描环境符合情况的数值化,进一步提高了古籍文本数据的录入准确性。
[0074] 进一步的,录入至古籍文本数据库中,还包括录入安全性分析,具体步骤如下:根据古籍文本三维成像模型的录入过程中的录入数据获取古籍文本的录入安全性指标,录入安全性指标包括数据录入率、数据正确率和数据缺失率,数据录入率为录入古籍文本数据库的古籍文本三维成像模型的数据与总数据的比值,录入数据表示录入至古籍文本数据库中的古籍文本三维成像模型的数据,数据正确率为录入古籍文本数据库的古籍文本三维成像模型的数据的正确比例,数据缺失率为录入古籍文本数据库的古籍文本三维成像模型的数据的缺失比例;判断获取的数据缺失率是否大于数据缺失率的有效最大值,若获取的数据缺失率大于数据缺失率的有效最大值,则录入安全性指数为0,否则根据获取的录入安全性指标得到古籍文本的录入安全性指数,录入安全性指数用于描述古籍文本三维成像模型录入至古籍文本数据库的录入安全性,数据缺失率的有效最大值由预设人员根据历史数据缺失率的平均值进行设定,一般取0.3,可根据实际情况调整。
[0075] 在本实施例中,录入安全性指数采用以下公式计算:
[0076]
[0077] 式中,m表示古籍文本的编号,m=1,2,...,M,M为古籍文本的总数量,AQm为第m个古籍文本的录入安全性指数,θm为第m个古籍文本的数据录入率,Zm为第m个古籍文本的数据正确率,Qm为第m个古籍文本的数据缺失率,τ为数据缺失率的有效最大值。
[0078] 其中,数据录入率是指单位时间内成功录入数据库的数据量占总应录入数据量的比例,数据正确率是指已录入数据中正确无误的数据所占的比例,数据缺失率是指应录入但未能录入数据库的数据量占总应录入数据量的比例;本实施例算法结合古籍文本的数据录入率、数据正确率和数据缺失率,综合分析得到录入安全性指数,高录入率不一定意味着高正确率,因为快速录入可能增加错误的风险,在实际操作中,通过优化录入流程和采用自动化校验工具,可以在保证录入效率的同时提高数据正确率;数据录入率的提升有助于降低数据缺失率,因为更多的数据被成功录入意味着更少的数据被遗漏,仅仅提高录入率并不能完全解决数据缺失问题,还需要关注录入过程中的各个环节,确保数据的完整性和准确性;数据正确率的提高通常意味着数据缺失率的降低,因为高正确率的数据录入过程更有可能减少错误和遗漏;表明古籍文本三维成像模型录入至古籍文本数据库的录入安全性,因此通过建立数学形式进行精准地分析。
[0079] 具体的,当数据缺失率大于数据缺失率的有效最大值时,由于古籍文本三维成像模型录入的缺失率过高导致录入安全性指数为0;当数据缺失率不大于数据缺失率的有效最大值时,令次数据缺失率 则录入安全性指数的公式可简化为:AQm=log2′[θm*(Zm+Qm)+1],故录入安全性指数的变化统计表如表1所示:
[0080] 表1录入安全性指数的变化统计表
[0081]
[0082] 由公式可知,数据录入率、数据正确率和次数据缺失率与录入安全性指数均成数学关系中的正相关,但从上表来看,录入安全性指数不能通过单个数据直接获取,需要通过对数据录入率、数据正确率和次数据缺失率进行综合分析得到,例如,第一组数据的数据正确率小于第四组数据中的数据正确率,但是最终得到的录入安全性指数要大于第四组,因为数据录入率和次数据缺失率也存在影响,故需进行综合分析;实现了古籍文本三维成像模型录入至古籍文本数据库的录入安全性的数值化,进一步提高了古籍文本数据的录入准确性。
[0083] 本申请实施例提供的采用一种古籍文本三维扫描数据安全录入方法的装置包括:激光测距测速仪、光度仪、温湿度测量仪和存储器;激光测距测速仪用于测量古籍文本扫描过程中的扫描距离和扫描速度;光度仪用于测量古籍文本的表面最小照度和平均照度;温湿度测量仪用于测量古籍文本的扫描环境温度和扫描环境湿度;存储器用于存储获取的扫描过程参数。
[0084] 在本实施例中,激光测距测速仪结合了激光测距和测速技术,能够同时测量古籍文本与三维扫描设备之间的距离以及三维扫描设备的移动速度,工作原理为通过发射激光束并测量激光束从发射到反射回来的时间差来计算距离,同时结合时间差和距离变化来计算速度;实现了古籍文本三维扫描数据安全录入的装置化,进一步提高了古籍文本数据的录入准确性。
[0085] 本申请实施例提供的一种电子设备,其特征在于,电子设备包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当计算机程序指令被处理器执行时,触发电子设备执行一种古籍文本三维扫描数据安全录入方法。
[0086] 在本实施例中,实现了古籍文本三维扫描数据安全录入的设备化,进一步提高了古籍文本数据的录入准确性。
[0087] 综上所述,本申请实施例通过获取古籍文本的扫描过程参数和初始三维成像数据,然后对古籍文本进行验证得到古籍文本扫描验证指数,并根据古籍文本扫描验证指数获取古籍文本的三维成像数据,最后对三维成像数据进行三维重建得到古籍文本三维成像模型,并录入至古籍文本数据库中,进而实现了古籍文本数据的录入准确性的提高,有效解决了现有技术中古籍文本数据的录入准确性低的问题。
[0088] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD‑ROM、光学存储器等)上实施的计算机程序产品的形式。
[0089] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0090] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0091] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0092] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0093] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。