首页 / 一种汉字书写数字人生成方法和系统

一种汉字书写数字人生成方法和系统实质审查 发明

技术领域

[0001] 本发明涉及数据人技术领域,特别涉及一种汉字书写数字人生成方法和系统。

相关背景技术

[0002] 目前,汉字数字化书写领域主要是以工具或机械手臂来实现,不能体现书写过程中人的主导作用,缺乏汉字书写中人的数字人模型形象。数字化书写软件系统也通常仅关注数字、汉字形状生成,却忽略了模拟真实人类书写的个性化、流畅性等特征,导致生成结果缺乏数字人的独特表现。其次,现有系统演示不够生动,缺少足够的动态展示和生动感,影响了用户对数字书写过程的直观理解。此外,汉字生成模型在追求字形准确性的同时,艺术性和可控性不足,难以达到人类书写的艺术水平,用户交互体验也存在问题,缺乏实时反馈和个性化调整的功能,降低了用户的参与感和创造性。

具体实施方式

[0021] 以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。
[0022] 可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。
[0023] 请参考图1,本发明公开了一种汉字书写数字人生成方法和系统,其中所述方法主要包括如下步骤:1、构建汉字结构特征数据库;2构建数字人手写动作姿态模型数据库;3、对汉字结构特征的定位;4、构建协同算法调用汉字结构特征和数字人手写动作姿态数据。本发明通过上述方法可以实现数字人对真实书写状态的模拟,从而提供了个性化话的数字人汉字手写模拟展示,提高汉字手写指导的趣味性。上述数字人虚拟形象生动地展示了数字书写的过程,增加了教学的趣味性和易理解性,对学习者的学习兴趣和效果产生积极影响。本发明中所述系统还提供实时反馈与调整功能,帮助用户更好地掌握数字书写,提高准确性和用户体验。支持多样的数字人虚拟形象和风格选择,使用户可以体验不同的书写风格,促进了数字书写的多样性。
[0024] 具体而言,由于传统的汉字是以字库的方式进行编码存储,字库中的每个汉字只具备字形名称与编码两种属性,并不包含汉字书写属性,因此本发明需要对现有汉字结构进行抽象用于构建所述汉字结构特征数据库,所述汉字结构特征数据库的构建方法主要包括:从现有的编码汉字系统中进行结构抽象,从现有编码汉字中抽象得到结构特征点,并获取每一个结构特征点的位置信息。其中抽象的所述汉字结构特征点包括但不仅限于始结点、驻点和尾结点。其中每个汉字包括至少一个上述结构特征点,将每个汉字的自身结构特征点保存。
[0025] 本发明中采用包括但不仅限于3DsMax、ImageWare等三维建模软件构建所述数字人,并进一步利用所述建模软件构建毛笔模型,其中所述数字人和毛笔模型根据现实生活中毛笔的手写姿势构建,其中所述数字人和毛笔三维模型的构建方法具体包括:预先确定手写姿势,其中所述手写姿势包括但不仅限于落笔姿势、运笔姿势和抬笔姿势,其中所述落笔姿势可以根据落笔的力道分为轻落笔姿势、中等落笔姿势和重落笔姿势,由于不同力道的落笔姿势在现实中会导致毛笔的形态和手势发生一定变化,比如重落笔姿势会使得毛笔形态发生较大的变化以及手势下压较大的姿态,而轻落笔姿势使得毛笔形态发生较小的变化以及手势下压较小的姿态。本发明中根据落笔力道轻重分别构建不同形态的数字人手势形态和毛笔形态。同理所述抬笔姿势也可以根据日常手写姿势进行毛笔模型和数字人姿势模型的调整。本发明中所述运笔姿势可以根据需要手写的字的结构特征点进行毛笔形态模型和数字人手写姿态模型构建。比如要手写的文字结构是“一”,则通过上述汉字结构抽象可以得到该“横”的结构特征点包括一个始结点和一个尾结点,其中所述始节点作为落笔点姿态,尾节点作为抬笔点姿态,且落笔点和抬笔点之间动作连续。此时针对该横“一”配置有对应的落笔姿态和抬笔姿态。当要手写的文字结构为横勾“乛”,此时抽象的汉字结构特征点为一个始结点和一个驻点,其中所述始结点为落笔点姿势,驻点为运笔点姿势,其中所述驻点的运笔点姿势被配置为勾动作姿态模型。本发明中还针对所述数字人模型配置取笔动作姿态,用于初始状态的数字人区笔操作。
[0026] 在本发明其中一个较佳实施例中,针对上述不同文字的汉字结构特征进行定位所配置的计算程序算法包括:通过初始化方法接受一个参数`hanzi_structure_library`,该参数表示汉字结构特征库,其中包含了汉字结构特征与定位信息的映射。接下来,类提供了一个`generate_hanzi_position`方法,该方法接受一个编码的汉字(`encoded_hanzi`)作为输入,调用`extract_structure_from_encoded_hanzi`方法将编码汉字抽象成结构特征,然后在汉字结构特征数据库中查找对应的定位信息(`hanzi_position`)。如果找到了对应的定位信息,该信息将被返回;否则,抛出一个值错误。最后,类还包含了一个占位的`extract_structure_from_encoded_hanzi`方法,需要根据具体情况来实现,其作用是从编码汉字中抽象出汉字的结构特征。
[0027] 进一步的,本发明针对上述数字人配置取笔姿势、写笔姿势和抬笔姿势分别配置对应的程序参数,其中取笔姿势`take_pen_pose`、写字姿势`write_pose`和抬笔姿势``lift_pen_pose ,其中所述写字姿势`write_pose`包括了落笔姿势和不同的运笔姿势,本发明在上述数字人姿势三个程序参数的基础上根据实际的数字人姿态模型构建增加姿势类型数量,本发明对此不再详细赘述。针对上述三个数字人姿势参数,每个姿势可以被认定为类的属性,而为了执行每个姿势,本发明中所述类提供了三个方法:`perform_take_pen_pose`、`perform_write_pose`和`perform_lift_pen_pose`。这些方法的实现目前包含简单的答应语句,用于模拟执行相应的姿势动作。本发明上述三个方法可以通过构建类的接口获取对应对象得到。
[0028] 本发明中所述汉字结构特征协同算法调用对应数字人的手写动作姿势的具体方法包括:定义了一个名为`HanziGenerationAlgorithm`的类,其目的是实现汉字生成与数字人动作协同生成的算法。该类通过初始化方法接受两个关键对象:`hanzi_locator`(汉字生成定位类的对象)和`digital_human_handwriting_pose`(数字人手写姿势类的对象)。这两个对象分别代表了汉字生成的定位信息和数字人手写时的姿势动作,所述姿势动作包括数字人手形态和毛笔形态。算法提供了一个方法`generate_hanzi_with_actions`,该方法接受一个编码的汉字作为输入。首先,通过调用`hanzi_locator`的`generate_hanzi_position`方法,获取编码汉字的定位信息。接着,通过调用`digital_human_handwriting_pose`对象的三个方法`perform_take_pen_pose`、`perform_write_pose`和`perform_lift_pen_pose`,模拟执行数字人手写时的取笔、写字和抬笔动作。最后,根据获取的定位信息,可以调用`generate_hanzi_from_position`方法进行实际的汉字生成操作。这个方法内部的实现是一个占位方法,需要根据具体的汉字生成算法和定位信息来进行填充。其中所述算法通过协同汉字生成定位和数字人手写动作,模拟了数字人在生成汉字时的实际动作过程。上述类提供了一个框架,可以在实际应用中根据手写姿势的类型进行对应数字人姿势进一步扩展,以适应更复杂的汉字生成和手写模拟场景。
[0029] 本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线段、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线段的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线段、电线段、光缆、RF等等,或者上述的任意合适的组合。
[0030] 附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0031] 本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。

当前第1页 第1页 第2页 第3页
相关技术
数字生成相关技术
方法系统相关技术
罗欣发明人的其他相关专利技术