首页 / 一种翻译方法及翻译机

一种翻译方法及翻译机有效专利 发明

技术领域

[0001] 本发明属于软件开发技术领域,尤其涉及一种翻译方法及翻译机。

相关背景技术

[0002] 随着经济全球化的发展,人们的生活水平越来越高,出国旅行的人越来越多,国际交流的场景越来越频繁发生,多语言翻译产品已形成了一个庞大的市场。
[0003] 现有技术中,当使用翻译产品进行语音翻译时,需要用户先设置好翻译方式,然后才能按照用户设置好的翻译方式,对用户输入的语音进行翻译,翻译效率低。因此,现有技术中通过人工设置翻译方式,然后翻译语音的方式存在翻译效率较低的问题。

具体实施方式

[0022] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
[0023] 为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
[0024] 图1是本发明一实施例提供的翻译方法的实现流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。本发明实施例的执行主体可以是翻译机。
[0025] 如图1所示,该方法可以包括以下步骤:
[0026] 步骤S101:获取待翻译的音频数据和目标翻译语种。
[0027] 在本实施例中,翻译机包括多个麦克风,其采用矩阵式多麦克风设计,能够拾取到来自多个方向的声音,提高了拾取的音频数据的音质,相应地提高了后续的翻译效果。
[0028] 在本实施例中,待翻译的音频数据包括用户输入的语音和背景音,用户输入的语音为用户想要进行翻译的语音。
[0029] 在一个实施例中,目标翻译语种表示最终译出语种。
[0030] 在一个实施例中,用户可以预先在翻译机设置目标翻译语种,也可以是由翻译机自己设置的,即定期统计每种语种的使用频率,使用频率为每月每个语种被作为目标翻译语种的次数,然后将使用频率最高的语种作为目标翻译语种。
[0031] 步骤S102:将音频数据转换成文字,并对转换后的文字进行语义校准。
[0032] 在本实施例中,基于降噪算法,对音频数据进行降噪处理,消除音频数据包含的背景噪音,尽可能保留用户输入的语音,从而为语音识别提供高品质的音频数据。
[0033] 在本实施例中,采用语音识别算法,对进行降噪处理后的音频数据进行语音识别,将用户输入的语音转换成文字,从而实现了在没有网络的情况下,仍可以进行语音识别。
[0034] 在一个实施例中,在有网络的情况下,还可以将该进行降噪处理后的音频数据上传至云服务器,云服务器对该音频数据进行在线转换,并反馈至翻译机,从而使音频数据能够快速精准地被转换为文字。
[0035] 在本发明的一个实施例中,步骤S102包括:
[0036] 1)获取位置信息,并获取位置信息对应的当地特色关键字。
[0037] 2)分析待翻译的音频数据,得到对应的语气类型。
[0038] 3)提取待翻译的音频数据的背景音,并分析背景音得到对应的场景类型。
[0039] 4)将当地特色关键字、语气类型、场景类型和转换后的文字输入至预设训练后的神经网络模型中,得到校准后的文字。
[0040] 在本实施例中,翻译机还包括基站定位模块。
[0041] 在本实施例中,通过基站定位模块获取到当前位置信息,获取该当前位置信息对应的当地特色关键字,当地特色关键字包括特产名称和旅游景点等,例如,当前位置信息为广州,则当地特色关键字包括广州塔。
[0042] 在一个实施例中,获取训练数据,采用训练数据对标准神经网络模型进行训练,得到训练后的神经网络模型。
[0043] 其中,训练数据包括训练关键字、训练语气类型、训练场景类型和文本数据。
[0044] 在本实施例中,将当地特色关键字、语气类型、场景类型和转换后的文字输入至预设训练后的神经网络模型中,以转换后的文字为基准,通过当地特色关键字、语气类型和场景类型对转换后的文字进行二次校准,例如,用户在韩国首尔询问当地人“昌德宫怎么走?”由于一些原因,例如,用户发音不标准,翻译机转换后的文字有可能是“常德公怎么走”,这句话在国语中是同音字,但是翻译成外语很可能就会出现歧义,这个时候需要根据当前位置信息、语气类型和场景类型分析对转换后的文字进行校准,还原出用户的需求是询问怎么去昌德宫,从而矫正语音转出的文字,使被译语音对应的转换文字更接近场景意境,使翻译更加精准、人性化。
[0045] 在本发明的一个实施例中,所述分析待翻译的音频数据,得到对应的语气类型,包括:
[0046] 1)提取待翻译的音频数据的声音特征信息。
[0047] 2)获取声音特征信息对应的语气类型。
[0048] 在本实施例中,声音特征信息包括分贝值和/或音调等。
[0049] 在本实施例中,提取待翻译的音频数据中的用户的语音的分贝值,从预存的语气类型表中,获取该分贝值对应的语气类型。
[0050] 在本实施例,还可以结合音调一起判断语气类型,从预存的表中,获取该分贝值和该音调对应的语气类型。
[0051] 其中,语气类型包括陈述语气、疑问语气和感叹语气。
[0052] 在本实施例很难过,不同的语气类型所对应的声音的分贝值和音调不同。
[0053] 在本发明的一个实施例中,所述分析背景音得到对应的场景类型,包括:
[0054] 1)获取背景音中包含的声音类型。
[0055] 2)查找声音类型对应的场景类型。
[0056] 在本实施例中,声音类型包括车声、人声和风声等,场景类型包括商场、马路、卧室和马路等。
[0057] 在本实施例中,通过语音识别技术,识别背景音包含的声音类型,并在预存场景类型表中获取该背景音包含的声音类型对应的场景类型,例如,该背景音包含的声音类型为车声,则判定出场景类型为马路。
[0058] 在本实施例中,还可以结合一段时间内的位置变化信息一起判断场景类型。
[0059] 步骤S103:获取当前网络信息,并根据当前网络信息选取翻译方式。
[0060] 在本发明的一个实施例中,网络信息包括网络连接类型和网络剩余流量,翻译方式包括在线翻译方式和离线翻译方式。
[0061] 在本实施例中,网络连接类型包括WIFI(WIreless-FIdelity,无线保真)类型和数据网络类型。
[0062] 其中,数据网络包括4G网络。
[0063] 步骤S104:按照选取的翻译方式对校准后的文字进行翻译,得到目标翻译语种的文字和/或语音。
[0064] 在本实施例中,翻译机还包括显示屏和扬声器。
[0065] 在本实施例中,若选取的翻译方式为在线翻译方式,则对校准后的文字进行在线翻译,若选取的翻译方式为离线翻译方式,则对校准后的文字进行自离线翻译,得到翻译后的文字和/或语音,翻译后的文字和/或语音的语种为目标翻译语种。通过显示屏显示该翻译后的文字,并通过扬声器播放该翻译后的语音。
[0066] 在一个实施例中,还可以获取当前位置信息对应的常用语种,将校准后的文字分别翻译成常用语种对应的翻译结果,例如,获取当前位置信息的常用语种为英语和汉语,对校准后的文字进行翻译,得到语种为英语的翻译结果以及语种为汉语的翻译结果,翻译结果包括文字和/或语音,用户可以根据需要选取其它语种对应的翻译结果。
[0067] 在本实施例中,获取待翻译的音频数据和目标翻译语种,将该音频数据转换为文字,并对转换后的文字进行语义校准,提高被译语音转文字的精确度,并获取当前网络信息,根据当前网络信息自动选取合适的翻译方式,无需人工选取翻译方式,按照选取的翻译方式翻译校准后的文字,得到翻译结果,即得到语种为目标语种的文字和/或语音,减少用户的操作步骤,提高了翻译效率,用户体验高。
[0068] 图2是本发明一实施例提供的图1中步骤S103的实现流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。
[0069] 如图2所示,该方法可以包括以下步骤:
[0070] 步骤S201:若当前网络信息中的网络连接类型为无网络连接,则选取离线翻译方式。
[0071] 在本实施例中,若当前无网络连接,则直接离线翻译校准后的文字,即选择离线翻译方式。
[0072] 步骤S202:若当前网络信息中的网络连接类型为WIFI类型,则选取在线翻译方式。
[0073] 在本实施例中,检测当前网络信息中的网络连接类型是否为WIFI类型,若当前网络信息中的网络连接类型为WIFI类型,则无需检测网络剩余流量,直接在线翻译校准后的文字,即选取在线翻译方式。
[0074] 步骤S203:若当前网络信息中的网络连接类型为数据网络类型,则检测网络剩余流量是否低于预设流量阈值。
[0075] 在本实施例中,检测当前网络信息中的网络连接类型是否为数据网络类型,若为数据网络类型,则检测网络剩余流量是否低于预设流量阈值。
[0076] 步骤S204:若网络剩余流量小于预设流量阈值,则选取离线翻译方式。
[0077] 在本实施例中,当检测到网络剩余流量小于预设流量阈值时,表示当前流量剩余不足,为了避免出现流量使用过多造成扣费的问题,对校准后的文字进行离线翻译,即选取离线翻译方式。
[0078] 其中,离线翻译方式为将校准后的文字输入至预先安装的离线翻译引擎,离线翻译引擎进行自动翻译。
[0079] 步骤S205:若网络剩余流量大于或等于预设流量阈值,则选取在线翻译方式。
[0080] 在本实施例中,当网络剩余流量大于或等于预设流量阈值时,表示声音流量比较多,用户可以进行使用,则在线翻译校准后的文字,即选取在线翻译方式。
[0081] 其中,在线翻译方式为将该校准后的文字上传至云服务器,云服务器进行在线翻译,并将翻译结果反馈至翻译机。
[0082] 在本实施例中,获取当前网络信息,并根据当前网络信息选取最优翻译方式,即进行离线翻译还是进行在线翻译,保证翻译速度和精准度。
[0083] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0084] 图3是本发明一实施例提供的翻译机100的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。
[0085] 所述翻译机100包括:
[0086] 翻译信息获取模块110,用于获取待翻译的音频数据和目标翻译语种。
[0087] 音频处理模块120,用于将音频数据转换成文字,并对转换后的文字进行语义校准。
[0088] 网络信息获取模块130,用于获取当前网络信息,并根据所述当前网络信息选取翻译方式。
[0089] 翻译处理模块140,用于按照选取的翻译方式对校准后的文字进行翻译,得到目标翻译语种的文字和/或语音。
[0090] 在本发明的一个实施例中,音频处理模块包括:
[0091] 位置获取单元,用于获取位置信息,并获取所述位置信息对应的当地特色关键字;
[0092] 语气类型获取单元,用于分析所述待翻译的音频数据,得到对应的语气类型;
[0093] 场景类型获取单元,用于提取所述待翻译的音频数据的背景音,并分析所述背景音得到对应的场景类型;
[0094] 校准处理单元,用于将所述当地特色关键字、所述语气类型、所述场景类型和所述转换后的文字输入至预设训练后的神经网络模型中,得到校准后的文字。
[0095] 在本发明的一个实施例中,语气类型获取单元包括:
[0096] 声音特征提取子单元,用于提取所述待翻译的音频数据的声音特征信息。
[0097] 语气类型获取子单元,用于获取所述声音特征信息对应的语气类型。
[0098] 在本发明的一个实施例中,场景类型获取单元包括:
[0099] 声音类型获取子单元,用于获取所述背景音中包含的声音类型;
[0100] 场景类型获取子单元,用于查找所述声音类型对应的场景类型。
[0101] 在本发明的一个实施例中,网络信息包括网络连接类型和网络剩余流量,所述翻译方式包括在线翻译方式和离线翻译方式。
[0102] 图4是本发明一实施例提供的网络信息获取模块130的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。
[0103] 所述网络信息获取模块130包括:
[0104] 第一离线翻译单元131,用于若所述当前网络信息中的网络连接类型为无网络连接,则选取离线翻译方式;
[0105] 第一在线翻译单元132,用于若所述当前网络信息中的网络连接类型为WIFI类型,则选取在线翻译方式;
[0106] 流量检测单元133,用于若所述当前网络信息中的网络连接类型为数据网络类型,则检测所述网络剩余流量是否低于预设流量阈值;
[0107] 第二离线翻译单元134,用于若所述网络剩余流量小于预设流量阈值,则选取离线翻译方式;
[0108] 第二在线翻译单元135,用于若所述网络剩余流量大于或等于预设流量阈值,则选取在线翻译方式。
[0109] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述翻译机的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0110] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0111] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0112] 在本申请所提供的实施例中,应该理解到,所揭露的翻译机,可以通过其它的方式实现。例如,以上所描述的翻译机实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0113] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0114] 另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0115] 所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。
[0116] 以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

当前第1页 第1页 第2页 第3页
相关技术
翻译方法相关技术
翻译机相关技术
张中月发明人的其他相关专利技术