首页 / 一种有限存储物联网终端汉字显示方法、系统及电子设备

一种有限存储物联网终端汉字显示方法、系统及电子设备实质审查 发明

技术领域

[0001] 本发明涉及汉字信息处理技术领域,特别是涉及一种有限存储物联网终端汉字显示方法、系统及电子设备。

相关背景技术

[0002] 有限存储物联网终端是指为了降低功耗、节约成本、提高效率而设计的一种特殊终端设备,这种设备通内存通常比较小,不能容纳汉字字库文件,给汉字的存储和显示带来了诸多不便。
[0003] 目前,包括物联网终端在内的计算机终端的汉字都是以字库的形式存储在特定字形库中,通常情况下,这些字形库的容量都在几M左右,每一种字库只能显示一种特定的字形,如黑体字库、宋体字库等等,这对于有限存储物联网终端的几十K和几百K的存储器来讲,显然是不可以实现的,因此,现在通用的方法是从字形库中选取有限个字进行定制,这样既不方便,又非常麻烦。
[0004] 即使是高精度汉字的显示,也会面临同样的问题。为了提高汉字的显示精度,需要不断的增加存储容量,相对于更高精度显示的汉字来讲,高精度显示终端的存储资源在一定条件下都是有限的存储。因此,不论是低功耗、内存小的物联网终端,还是大功耗、大内存的物联网终端,都有可能达到最大存储的边界,因此,对有限存储的物联网终端汉字显示方法的研究都有重要的价值。
[0005] 在冯诺依曼计算机体系结构中,不论对计算单元或存储部件本身的性能提升,还是对存储与计算的协同优化,都要涉及大容量的数据存储与高精度的协同计算技术,这给电路设计、制造工艺和芯片架构等方面的提出了严重的挑战。在申请号为201210165401.3的专利中,用汉字结构与风格进行分离的方法解决了汉字字形的设计与生成效率问题。具体思路是将汉字的结构与风格进行云端存储,根据应用的需求,在汉字显示精度要求不高的情况下,用笔元表示的汉字结构来表示汉字,在汉字显示精度要求较高的情况下可以结合汉字的风格的生成方法生成高精度的汉字,但是如何在有限存储物联网终端方便高效地生成显示的汉字,是亟需解决的一个问题。

具体实施方式

[0054] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055] 本发明的目的是提供一种有限存储物联网终端汉字显示方法、系统及电子设备,能够提高有限存储物联网终端汉字显示的便利性。
[0056] 图2为有限存储物联网终端低精度汉字显示结构原理图,如图2所示。汉字的显示包括汉字结构的显示与汉字风格的显示。
[0057] 其中,对于汉字结构,字符是信息表示的基本元素,汉字是一种比较特殊的字符,一般是由基本笔画按照一定的空间关系和构字规范构成偏旁部首,再进一步由偏旁部首根据一定的间架结构布局构成汉字字符,因此,汉字是一种具有层次结构的字符,层结构是汉字的一个基本特征。比较简单的字符的结构化层次表示如图3所示,相对复杂的字符的结构化表示如图4所示。从图3和图4中可以看出,无论是简单汉字还是复杂汉字,汉字均可以表示成结构形式,并且将结构分解之后,所有的汉字都源于有限的几个笔画结构。
[0058] 对于汉字的风格,汉字的风格是汉字书写和形成过程中表现出来的个体特色和特征的概况,结构相同的汉字可以有不同的风格。汉字风格主要是通过笔画的风格、偏旁和部首的风格来体现。具体包括笔画风格‑结构风格和汉字的风格‑形态风格。
[0059] (1)笔画风格‑结构风格。
[0060] 即使是同一字体的标准字形,同一类型的笔画在不同的汉字中可以有不同的风格表现,将这种形态上的区别称为汉字的结构风格,特别对于标准的印刷字体,这一现象也非常普遍。如图5所示,同属于一种笔画,在不同的偏旁组合中,都存在一些细微的变化。
[0061] (2)汉字的风格‑形态风格。
[0062] 汉字的结构相同,但有不同的形态,将这种形态上的区别称为汉字的形态风格,汉字的风格表示十分丰富,目前印刷汉字字体的不同,主要通过诸如黑体、宋体和楷体等不同的风格来体现。
[0063] 为了将汉字结构风格与形态风格进行机器生成,在申请号为201210165401.3的专利中进行了笔元分解与描述,但为了能更好的进行结构与风格的计算,本发明提出了笔元矩阵及其加、减运算、变换和取模运算等汉字结构的计算方法,同时对于汉字的生成风格也作了认真的分析。
[0064] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
[0065] 实施例一
[0066] 如图1所示,本发明提供了一种有限存储物联网终端汉字显示方法,所述显示方法包括:
[0067] 步骤S1:构建笔画汉字系统;所述笔画汉字系统包括标准汉字系统中各汉字的汉字特征矩阵;所述汉字特征矩阵为汉字的特征点的编码。
[0068] 所述构建笔画汉字系统的具体过程包括:
[0069] 步骤S11:根据汉字字形库,确定所述标准汉字系统中各汉字的笔画结构。
[0070] 步骤S12:根据所述笔画结构,确定笔元矩阵。
[0071] S12具体包括:
[0072] 步骤S121:确定所述笔画结构中的各个笔段。
[0073] 步骤S122:根据多个所述笔段的书写顺序,确定所述笔元矩阵;所述笔元矩阵是由各笔段的起点(始结点)、驻点(停顿点)和终点(尾结点)组成的。
[0074] 为了区别,将传统的汉字系统称为编码汉字系统,和传统的一字一码的编码汉字系统相比,笔画汉字系统是一种基于汉字结构描述而定义的汉字系统,系统中汉字由特征点与笔元进行描述,笔元结构可以由始结点、驻点和尾结点组成。在实际应用中,需要将标准汉字系统中的汉字通过申请号为201210165401.3和202111041957.7的专利中的方法来建立由汉字特征点与笔元描述的笔画汉字系统,存储在云端服务器。如图11所示。
[0075] 笔元的矩阵表示就是笔元矩阵。例如,直线笔元是最基本的笔元,它由一个始点S(x1,y1)和一个终点E(x2,y2)组成,它的笔元矩阵为:
[0076] 笔元矩阵的计算包括加运算、减运算、变换运算和取模运算等四种基本运算。
[0077] (1)笔元矩阵的加运算可以表示始点与终点的各特征点的增量计算。
[0078] 一个始点S1(x1,y1)和一个终点E1(x2,y2)组成的笔元与另一个笔元的始点S2(x3,y3)和一个终点E2(x4,y4)的增量计算用加 号表示,是笔元增量计算。可以表示为:
[0079]
[0080]
[0081] 这里的符号 表示一种广义的加法,目的是实现笔元中的两个端点即使不是同一个点也可以实现近似的加连接,例如,“啊”字就可以表示为“口”与“阿”的加运算。
[0082] 应该注意的是,手写汉字“口”有多种形态,各个笔画的连接处不一定是一个固定的点,但为了方便计算,本发明将组成“口”字的笔画在语义上都视为可以连接的笔画。
[0083] (2)笔元矩阵的减运算可以表示始点与终点的各笔元特征点的减量计算。
[0084] 一个始点S1(x1,y1)、一个驻点z1(x2,y2)和一个尾结点E1(x3,y3)组成的笔元的减量操作,就是笔元矩阵的减运算。可以表示为:
[0085]
[0086] 特别地:
[0087]
[0088] 这里的符号 表示一种广义的减法。
[0089] (3)笔元矩阵的变换运算,可以表示为任一常量与笔元矩阵的积计算。一个始点S1(x1,y1)和一个终点E1(x1,y1)组成的A倍变换运算可以表示常量A与笔元矩阵的各分量的乘积:
[0090] [S1(x1,y1),E1(x1,y1)]×A=[S(A×x2,A×y2),E(A×x2,A×y2)]。
[0091] (4)笔元矩阵的取模运算。用笔元两个特征点的距离代表笔元矩阵的模,笔元矩阵的取模运算就是计算两个特征点的距离。一个始点S1(x1,y1)和一个终点E1(x1,y1)组成的笔元矩阵,它的模是:
[0092] |[S1(x1,y1),E1(x2,y1)]|=Sqrt[(x2‑x1)2‑(y2‑y1)2]。
[0093] 步骤S13:根据所述笔元矩阵,确定所述标准汉字系统中各汉字的特征矩阵。
[0094] S13具体包括:
[0095] 步骤S131:根据所述标准汉字系统中各汉字的多个所述笔画结构书写顺序,确定所述笔元矩阵的排列顺序。
[0096] 步骤S132:根据笔元矩阵的排列顺序,得到标准汉字系统中各汉字的特征点的编码,并将特征点的编码作为所述确定所述标准汉字系统中各汉字的特征矩阵。
[0097] 在实际应用中,由于汉字的笔元矩阵表示了形成汉字的特征点信息,因此,也可以将组成汉字的全部或部分笔元矩阵称为汉字的特征矩阵。
[0098] 如图6所示,在64×64的米字格中汉字啊的偏旁两个口,有相同的结构,但有不同的形态(风格),从结构上看,“口”的笔元为四个,则偏旁“口”的特征矩阵可以表示为:
[0099]
[0100] 其中,(1)式与(2)式称为汉字特征矩阵符号表达式,(3)式与(4)式称为汉字矩阵融合表达式。融合表达式是将符号表达式中可以合并的点进行合并后的结果。(5)式是事实上由四个坐标点成的“口”字表达式,称为汉字矩阵的语义表达式。特别地,口字形的第三笔是一横,由于始点在语义上要重合第一笔的终点,因此,如果有必要,也要对第三笔横的终点进行融合校正,从而组成一个封闭的“口”字形。用具体的数值来表示,可以表示为:
[0101]
[0102] 对于“口”字的第一笔竖的始点(‑13,‑10)和第二笔横折的始点(‑12,‑10),在语义上是重合的,第一笔竖的终点(‑13,10)与第三笔横的始点(‑12,7)在语义上也是重合的,所示,尽管在书写时可以有若干个像素的差别,但都可以近似的用一个点来表示,但在书写时可以不完全重合。最后进行融合校正后得到的2x4矩阵就是“口”字形的语义矩阵。
[0103] 汉字特征矩阵的表示是汉字结构和风格变换的基础,将汉字所有笔元矩阵模定义为汉字特征矩阵的模。即汉字特征矩阵的模是汉字所有笔元矩阵模的和,可以表示为:
[0104]
[0105] 其中,Si表示第i个笔元的开始点,ei表示第i个笔元的结束点。
[0106] 基于笔元矩阵的加运算、减运算、变换运算和取模运算等四种基本运算可以实现汉字结构的生成与变换。
[0107] 以“啊”为例,笔元矩阵的加减运算应用如图9所示。
[0108] 从左到右是“啊”字每次减去一个笔元后的汉字结构生成字形示意图。同样,从右到左可以看成是“啊”字每次增加一个笔元的加运算。
[0109] 变换运算和取模运算主要应用于多个笔元之间的运算,如图10所示是汉字“城”的变换示意图。
[0110] 作为一个具体地实施方式,构建笔画汉字系统可以包括以下步骤:
[0111] 第一,提取汉字的骨架,第二,在汉字骨架上标记特征点,第三,将特征点俩俩连续组成笔元,第四,将笔元组成的汉字执照笔画的映射关系进行存储,第五,按照字序将所有的这些汉字组成的文档定义为笔画汉字库,第五,将基于这一笔画汉字库独立使用,形成一种新的笔画汉字系统。
[0112] 步骤S2:获取待显示汉字和所述待显示汉字的汉字结构及风格索引表;所述汉字结构及风格索引表是以笔画和所述笔画的风格构建的二维表。
[0113] 在实际应用中,汉字的输入过程也是结构及风格的转换过程,根据检索到的汉字信息查询笔画汉字系统中的汉字结构特征,建立云端汉字结构及风格索引表。
[0114] 具体地,风格索引表是一个二维表,将平时的不同汉字字体表示一维风格,如宋体字风格,楷字体风格等等,另一维说明是哪一个笔画,如横、竖等,这样就组织了每个云端汉字的字体和笔画表,每个汉字对应不同的二维值,形成对应汉字的风格索引表。
[0115] 步骤S3:从所述笔画汉字系统中查找所述待显示汉字的汉字特征矩阵。
[0116] 在实际应用中,基于云端汉字结构及风格索引表客户端通过NB/4G/5G/WIIFI等方式的通讯请求,调用存储在云端服务器中的汉字特征矩阵,在有限存储计算终端上进行增量式的汉字结构生成。
[0117] 步骤S4:根据所述待显示汉字的汉字特征矩阵,应用增量式汉字结构生成方法,生成所述待显示汉字的结构。
[0118] S4具体包括:
[0119] 步骤S41:根据所述待显示汉字的汉字特征矩阵,确定所述待显示汉字的特征点的编码在所述待显示汉字的结构中的书写顺序。
[0120] 步骤S42:根据所述书写顺序,对每一个所述特征点的编码进行排序,得到每一个所述特征点的编码的序号。
[0121] 步骤S43:在当前序号的所述特征点的编码对应的所述待显示汉字的结构生成后,继续所述当前序号加一后的所述特征点的编码对应的所述待显示汉字的结构生成。
[0122] 步骤S44:当最后序号的所述特征点的编码对应的所述待显示汉字的结构生成后,得到所述待显示汉字的结构。
[0123] 在实际应用中,增量式的汉字结构生成也称为汉字结构生长模型,是基于汉字的特征矩阵依次生成汉字的笔元、笔画、偏旁或整字的绘图过程。这个步骤分两部分,一是笔元生长,二是笔画生成。笔元生长计算是小于或等于笔元矩阵模长的时的笔元增量计算,首先设定单位笔元的模长为L,在终端上进行笔元生长的条件是:
[0124] While(i<=|[SE]|){
[0125] S1E1=S1E1+L
[0126] }
[0127] 其中,SE是一个开始点为S,结束为E的笔画,I是计数器,S1E1是从s开始的第一个笔元,笔元生长是从这个笔元开始,每次增加一个单位笔元的长度L,直到笔画结束端为止。
[0128] 完成一个完整的笔画后,通过通讯网络在服务器端并行设定启动笔画的校验,以保证生成的笔画结构的准确性。笔画校验是生成一个笔画后为了保证其正确性,生成后还要和汉字的结构与风格索引表进行比较后再输出。
[0129] 笔画生成生长计算是小于或等于汉字特征矩阵的模时的汉字笔画增量计算,直到完成一个完整的汉字后,通过通讯网络在服务器端并行设定启动汉字的校验,检验以保证生成的汉字结构的准确性。笔画校验是检测笔画生成质量,汉字检验是全部笔画组成的汉字生成后通过结束触发指令启动校验功能,校验的结果是有没有错误发生,如有,再进行二次生成。通过汉字检验后,汉字结构生成完成。
[0130] 步骤S5:根据所述待显示汉字的汉字结构及风格索引表,确定所述待显示汉字的各笔画的风格。
[0131] 步骤S6:根据所述待显示汉字的各笔画的风格,按照预设规则,对所述待显示汉字的结构中各笔画进行调整,生成有限存储物联网终端汉字。
[0132] 具体地,所述预设规则包括对所述待显示汉字的结构的预设特征点进行平移变换。
[0133] 在实际应用中,低精度汉字的风格是没有更多笔画修饰的简单的汉字风格,由于内存受限,显示分辨率也受艰,通过网络通讯技术,用同步并行的云端协同计算方法就显得非常必要。用同步并行的云端协同是指通过云端发送相关指令来实现终端大规模汉字风格的变换。
[0134] 在汉字风格中的计算包括局部计算和整体计算两种类型,其中局部计算是笔画风格生成,整体风格计算是汉字整体风格的生成。
[0135] (1)汉字整体风格的生成。
[0136] 整体计算是组成汉字结构的全部特征点和笔元向量的计算。例如,平移变换,设vi(xi,yi),i∈{1,2,3,…}表示汉字的特征点,如果执行汉字结构的整体平移计算,则可以定义如下的平移计算的矩阵表达式来实现:
[0137]
[0138] 其中,Tx和Ty分别表示在x和y方向上的移动量。整体变换效果如图7所示。
[0139] (2)汉字结构的局部计算。
[0140] 局部平移变换效果如图8所示,局部变换是让结构中的一个或某几个特征向量发生改变而进行的计算。例如,在平移变换中,仅对笔元的部分驻点或结点进行平移变换。则变换的表达式为:
[0141]
[0142] 本发明通过局部计算得到笔画风格,整体风格计算得到汉字整体风格,从而得到在有限存储物联网终端的汉字显示。
[0143] 实施例二
[0144] 为了执行上述实施例一对应的方法,以实现相应的功能和技术效果,下面提供一种有限存储物联网终端汉字显示系统,所述显示系统包括:
[0145] 构建模块,用于构建笔画汉字系统;所述笔画汉字系统包括标准汉字系统中各汉字的汉字特征矩阵;所述汉字特征矩阵为汉字的特征点的编码。
[0146] 获取模块,用于获取待显示汉字和所述待显示汉字的汉字结构及风格索引表;所述汉字结构及风格索引表是以笔画和所述笔画的风格构建的二维表。
[0147] 查找模块,用于从所述笔画汉字系统中查找所述待显示汉字的汉字特征矩阵。
[0148] 生成模块,用于根据所述待显示汉字的汉字特征矩阵,应用增量式汉字结构生成方法,生成所述待显示汉字的结构。
[0149] 风格确定模块,用于根据所述待显示汉字的汉字结构及风格索引表,确定所述待显示汉字的各笔画的风格。
[0150] 调整模块,用于根据所述待显示汉字的各笔画的风格,按照预设规则,对所述待显示汉字的结构中各笔画进行调整,生成有限存储物联网终端汉字。
[0151] 实施例三
[0152] 本发明实施例提供一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行计算机程序以使电子设备执行实施例一的有限存储物联网终端汉字显示方法。
[0153] 可选地,上述电子设备可以是服务器。
[0154] 另外,本发明实施例还提供一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现实施例一的有限存储物联网终端汉字显示方法。
[0155] 本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
[0156] 本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页 第1页 第2页 第3页