WO2021077659A1

WO2021077659A1 - 一种信息交互的实时翻译方法、介质及终端

Info

Publication number: WO2021077659A1
Application number: PCT/CN2020/078880
Authority: WO
Inventors: 肖明; 李凌志; 陆伟峰; 刘世超; 陈勇; 杨里
Original assignee: 深圳传音控股股份有限公司
Priority date: 2019-10-21
Filing date: 2020-03-11
Publication date: 2021-04-29
Also published as: CN110765787A

Abstract

一种移动终端信息交互的实时翻译方法、介质及终端，通过在接收信息时，识别该信息的语音种类后，对该信息进行翻译成第二语言，从而，可以使用户在接收到信息的第一时间即时、便捷地获取该信息的内容，大大提高了用户的使用体验。

Description

一种信息交互的实时翻译方法、介质及终端

本申请要求于2019年10月21日提交中国专利局、申请号为CN201910999224.0、发明名称为“一种信息交互的实时翻译方法、介质及终端”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及信息交互的技术领域，尤其涉及一种信息交互的实时翻译方法、介质及终端。

背景技术

随着科技的发展，半导体工业的不断进步，通讯类工具，如手机等迭代更新的速度不断提高，特别是在移动终端概念的提出，使得通讯类工具进入飞速发展时代，除了高便捷、高清晰度的通信功能外，移动终端还成为了支付工具、交通指南工具、生活指南工具、工作学习工具等等，使得用户对移动终端的依赖性不断提高，越来越多的不同种类和用途的应用程序被开发出来并装载应用于移动终端中，给人们的生活带来极大的便利。

同时，随着科技、文化全球化的发展，人们通过移动终端接收的信息也不仅限于同一个地区或者国家，但是移动终端的使用者不可能均能识别这些地区或者国家的语言，这就给用户的信息获取或者多地区或者国家的用户之间的信息交互造成了障碍。目前，市场上也推出了多种基于移动终端的翻译工具，用户可以将接收到的信息复制粘贴到该翻译工具中，进行翻译。但是这种方式需要用户主动截取信息进行翻译，使得信息获取的步骤繁琐且不及时，影响用户的使用体验。

发明概述

技术问题

问题的解决方案

技术解决方案

为解决上述问题，本申请提出一种移动终端信息交互的实时翻译方法、介质及终端，本申请通过在接收信息时，识别该信息的语音种类后，根据预设规则对该信息进行翻译成第二语言，从而，可以使用户在接收到信息的第一时间即时、便捷地获取该信息的内容，大大提高了用户的使用体验。

具体地，本申请的一方面在于，提供一种信息交互的实时翻译方法，其应用于一移动终端，且包括以下步骤：接收第一信息；识别所述第一信息；将所述第一信息翻译成第二语言；使用所述第二语言展示所述第一信息。

优选地，上述实施翻译方法中，允许预设所述第二语言。

优选地，上述实施翻译方法中，将所述第一信息翻译成第二语言的方法包括，将一包含该第一信息及第二语言的翻译请求发送至服务器，以使得所述服务器根据所述第二语言将所述第一信息翻译为所述第二信息，接收所述第二信息。

优选地，上述实施翻译方法中，将所述第一信息翻译成第二语言的方法包括，启动所述移动终端中的翻译程序，所述翻译程序将所述第一信息翻译为所述第二信息。

本申请的另一方面，还在于提供一种信息交互的实时翻译方法，其包括以下步骤，接收第一信息，识别所述第一信息的语言种类，读取系统语言种类，比较所述第一信息的语言种类及所述系统语言种类，当所述第一信息的语言种类与所述系统语言种类不同时，按照所述系统语言种类翻译所述第一信息获得第二信息，展示所述第二信息。

优选地，上述实时翻译方法中，读取系统语言种类的步骤包括，获取当前设定的国家或地区或系统语言信息，根据所述国家或地区或系统语言信息判断所述系统语言种类。

优选地，上述实时翻译方法中，读取系统语言种类的步骤包括，获取当前文字信息的显示语言，识别所述显示语言的语言种类，将所述显示语言的语言种类作为所述系统语言种类。

优选地，上述实时翻译方法中，所述第一信息或第二信息包括以下至少一种语音信息、图片信息、视频信息和/或文字信息。

优选地，上述实时翻译方法中，所述第一信息及第二信息为语音信息，按照所述系统语言翻译所述第一信息获得第二信息的步骤包括，将所述第一信息转换为第一文字信息，将所述第一文字信息翻译为第二文字信息，将所述第二文字信息转换为第二信息。

优选地，上述实时翻译方法中，按照所述系统语言翻译所述第一信息获得第二信息的步骤包括，将一包含所述第一信息及所述系统语言种类的翻译请求发送至服务器，以使得所述服务器将所述第一信息翻译为所述第二信息，接收所述第二信息。

优选地，上述实时翻译方法中，按照所述系统语言翻译所述第一信息获得第二信息的步骤包括，启动移动终端中的翻译程序，所述翻译程序将所述第一信息翻译为所述第二信息。

优选地，上述实时翻译方法中，还包括，捕获反馈信息，识别所述反馈信息的语言种类，将所述反馈信息的语言种类与所述第一信息的语言种类进行比较，当所述反馈信息的语言种类与所述第一信息的语言种类不同时，按照所述第一信息的语言种类翻译所述反馈信息，获得第三信息，向外发送所述第三信息。

本申请的另一方面，还在于提供一种移动终端，其包括：显示器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如上所述的信息交互的实时翻译方法中的步骤。

本申请的另一方面，还在于一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有移动终端信息交互的实时翻译程序，所述实时翻译程序被处理器执行时实现如上所述的信息交互的实时翻译方法的步骤。

发明的有益效果

有益效果

与现有技术相比较，本申请的优势在于：

1)能够在接收到信息的第一时间对信息进行翻译，使得用户可以在第一时间便捷地获取信息的内容；

2)进一步地，还可以对用户欲答复其接收到的信息的反馈信息进行翻译，将反馈信息翻译成接收到的信息的语言种类，再发送出去，给该反馈信息的接收方也带去了极大的阅读便利，大大提高了信息交互的效率。

对附图的简要说明

附图说明

图1为符合本申请一优选实施例的信息交互的实时翻译方法的流程示意图；

图2为符合本申请一优选实施例的信息交互的实时翻译方法的流程示意图；

图3为符合本申请另一优选实施例的信息交互的实施翻译方法的流程示意图。

发明实施例

本发明的实施方式

下面结合附图及具体实施例，详细阐述本申请的优势。

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在......时”或“当......时”或“响应于确定”。

在后续的描述中，使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本申请的说明，其本身并没有特定的意义。因此，“模块”与“部件”可以混合地使用。

参阅图1，其为一符合本申请一优选实施例的信息交互的实时翻译方法的流程示意图。从图中可以看出，本实施例所提出的实时翻译方法包括以下步骤：

S001：接收第一信息；

这里的第一信息可以是指向移动终端中所装载的任意应用程序的任意信息，例如可以是电话通话中接收到的实时语音信息，可以是微信类的聊天消息，可以是应用程序更新的提示消息，可以是今日头条等的新闻消息，还可以是天气预报等的通知类消息。

S002：识别所述第一信息；

这里的识别第一信息可以理解为，将该第一信息转换为计算机可读的语言，从而获取该第一信息的信息内容。

S003：根据预设规则将所述第一信息翻译成第二语言；

优选地，根据预设规则该将第一信息翻译成第二语言的方法包括但不限于，可以是将一包含该第一信息及第二语言的翻译请求发送至服务器；服务器解析并根据该翻译请求对第一信息进行翻译，获得一语言种类为第二语言的第二信息，并将该第二信息反馈回移动终端。

优选地，该将第一信息翻译成第二语言的方法还包括但不限于，在收到第一信息这一事件的触发下，移动终端自带的或者装载于移动终端的第三方的具有翻译功能的应用程序，将第一信息输入至该应用程序中，同时输入作为目标翻译语音的第二语言的信息，那么该应用程序可以将第一信息转换为第二语言下的第二信息，并输出。

所述预设规则可以是移动终端或者是接收端的所处的地理位置、系统语言、用户设置中的任意一种。

S004：使用所述第二语言展示所述第一信息。

优选地，所述第一信息包括语音信息、图片信息、音频信息、视频信息和/或文字信息。

优选地，当第一信息是图片信息的，则，在原图片信息中，利用转换为第二语言类型的文字信息替换原图片信息中的文字信息形成仍是图片信息的第二信息，并显示该图片信息；

优选地，当第一信息是语音信息的，则获取第一信息中的音色特征，将第一信息中根据音频信息转换的文字信息翻译成第二语言类型的文字信息后，利用该音色特征将该第二语言类型的文字信息合成为一语音信息作为第二信息，并播放该音频信息。

优选地，当第一信息是视频信息的，若该视频信息中包含语音信息，则获取第一信息中的音色特征，将第一信息中根据音频转换的文字信息翻译成第二语言类型的文字信息后，利用该音色特征将该第二语言类型的文字信息合成为一语音信息替换原视频信息中的语音信息；若该视频信息中包含文字信息的，将该文字信息翻译为第二语言类型下的文字信息，并利用该文字信息替换原视频信息中的文字信息。播放替换其中的文字或者音频信息后获得的视频信息。

基于上述实施例的，符合本申请的另一优选实施例中，允许预设所述第二语言。其方法可以是，在终端的设置模式下，从系统提供的语言类型中选择一语言种类中作为第二语言，或者，在终端的设置模式下，输入一语言种类作为第二语言。参阅图2，其为一符合本申请另一优选实施例的信息交互的实时翻译方法的流程示意图。从图中可以看出，本实施例所提出的实时翻译方法包括以下步骤：

S100：接收第一信息；

S200：识别所述第一信息的语言种类；

优选地，该第一信息包括但不限于是语音信息、图片信息、音频信息、视频信息和/或文字信息等。

那么优选地，识别第一信息的语言种类的方法对应地可以是，应用基于卷积神经网络的光学字符识别的方法识别文字信息或者图片信息中的文字信息，再从获取的文字信息中提取字符特征，根据提取的字符特征判断该文字信息所属的语言种类；或者是将视频信息解析为每一帧的状态，应用基于卷积神经网络的光学字符识别的方法逐一识别每一帧的图片信息中的，再从获取的文字信息中提取字符特征，根据提取的字符特征判断该文字信息所属的语言种类；

优选地，识别第一信息的语言种类的方法对应地可以是，识别语音信息中的音频信息，将该音频信息转换为文字信息，再从获取的文字信息中提取字符特征，根据提取的字符特征判断该文字信息所属的语言种类；或者是从视频信息中提取其中的音频信息，将该音频信息转换为文字信息，再从获取的文字信息中提取字符特征，根据提取的字符特征判断该文字信息所属的语言种类；

优选地，还可以是直接读取语音信息或者从视频信息中所提取的音频信息中的音频特征，根据该音频特征直接判断这些语音信息所属的语言种类。

S300：读取系统语言种类；

本实施例中，进一步地，还应当读取移动终端的系统所被设置的显示或者使用语言的语言种类。

那么优选地，读取系统语言种类的方法包括但不限于，从移动终端的系统信息中获取当前所设定的国家或者地区或者系统语言信息，此时，如果获取的是所设定的国家或者地区信息，则将该国家或者地区的官方语言作为当前的系统语言种类，当获取的是设定的系统语言信息时，则可直接根据该系统语言信息获知当前的系统语言种类。

优选地，读取系统语言种类的方法还可以包括但不限于，直接读取移动终端当前在如桌面布局中、各种菜单中或者其他应用中所应用的显示语言，应用基于卷积神经网络的光学字符识别的方法识别这些显示语言中的文字信息，再从获取的文字信息中提取字符特征，根据提取的字符特征判断该文字信息所属的语言种类；

S400：比较所述第一信息的语言种类及所述系统语言种类；

将所获取的第一信息的语言种类与系统语言种类进行比较。

S500：当所述第一信息的语言种类与所述系统语言种类不同时，按照所述系统语言种类翻译所述第一信息获得第二信息；

当比较结果为第一信息的语言种类与系统语言种类不同时，则将第一信息转换为系统语言种类下的第二信息。

优选地，该将第一信息转换为系统语言种类下的第二信息的方法包括但不限于，可以是将一包含该第一信息及目标语言种类的翻译请求发送至服务器，其中的目标语言种类为所获取的系统语言种类；服务器解析并根据该翻译请求对第一信息进行翻译，获得一语言种类为系统语言种类的第二信息，并将该第二信息反馈回移动终端。

优选地，该将第一信息转换为系统语言种类下的第二信息的方法还包括但不限于，在第一信息的语言种类与系统语言种类不同这一事件的触发下，移动终端自带的或者装载于移动终端的第三方的具有翻译功能的应用程序，将第一信息输入至该应用程序中，同时输入作为目标翻译语音的系统语言种类信息，那么该应用程序可以将第一信息转换为系统语言种类下的第二信息，并输出。

S600：展示所述第二信息。

优选地，当第一信息是文字信息时，则在原消息中，利用获得的第二信息替换第一信息，直接以该第二信息显示。

优选地，当第一信息是图片信息时，则，在原图片信息中，利用转换为系统语言类型的文字信息替换原图片信息中的文字信息形成仍是图片信息的第二信息，并显示第二信息；

优选地，当第一信息是语音信息时，则获取第一信息中的音色特征，将第一信息中根据音频信息转换的文字信息翻译成系统语言类型的文字信息后，利用该音色特征将该系统语言类型的文字信息合成为一语音信息作为第二信息，并播放第二信息。

优选地，当第一信息是视频信息的，若该视频信息中包含语音信息，则获取第一信息中的音色特征，将第一信息中根据音频转换的文字信息翻译成系统语言类型的文字信息后，利用该音色特征将该系统语言类型的文字信息合成为一语音信息替换原视频信息中的语音信息；若该视频信息中包含文字信息的，将该文字信息翻译为系统语言类型下的文字信息，并利用该文字信息替换原视频信息中的文字信息。播放替换其中的文字或者音频信息后获得的视频信息。

参阅图3，基于上述实施例的，符合本申请的另一优选实施例中，还可以对移动终端待反馈出去的反馈信息提供翻译操作，使得移动终端可以直接向接收该反馈信息的终端反馈其用户可以直接阅读的信息，从而提高了接收反馈信息的终端的便利性，实现在无需接收反馈信息的终端同样具备本申请中的实时翻译方法，仍可享受本申请的实时翻译方法所带来的便利性。具体包括以下步骤：

S110：捕获反馈信息；

当识别到移动终端针对所接收到的第一信息生成了一反馈信息，缓存该反馈信息；

S210：识别所述反馈信息的语言种类；

同样地，应当首先识别该反馈信息的语言种类。优选地，该反馈信息包括但不限于是语音信息、图片信息、音频信息、视频信息和/或文字信息等。

S310：将所述反馈信息的语言种类与所述第一信息的语言种类进行比较；

S410：当所述反馈信息的语言种类与所述第一信息的语言种类不同时，按照所述第一信息的语言种类翻译所述反馈信息，获得第三信息；

S510：向外发送所述第三信息。

进一步地，基于上述实施例的，符合本申请的另一优选实施例中，当所述反馈信息为音频信息或者所述反馈信息中包括音频信息时，还包括，获取所述反馈信息中的音色特征并缓存，当获取第三信息后，采用所述音色特征向外发送所述第三信息。

那么基于本实施例的一个具体的实施例可以是：用户A利用M语言通过其终端a向使用N语言的用户B的终端b拨打一电话，用户B接通该电话后，终端b接收到终端a发送的语音信息，终端b在接收到终端a的语音信息的事件的触发下，启动识别程序，将该语音信息转换文字信息，识别该文字信息的语言类型为M语言，同时提取该语音信息的音色特征存储；终端b还会获取终端b的系统语言类型N语言，并比对M语言及N语言，识别语言类型不同后；终端b在接收到的语音信息不是系统默认语言的事件的触发下，启动翻译程序，将由该语音信息转换得到的文字信息翻译为N语音的文字信息，终端b通过存储的音色特征播放该N语言的语音信息，从而，用户B接听到的则为N语言的语音信息，可以即时地了解到用户A欲表达的意思。

随后，当用户B通过终端b生成一向终端a发送的反馈语音信息时，终端b在该事件的触发下，将该反馈语音信息转换为文字信息，并获取该反馈语音信息中的音色特征，还获取该文字信息的语言类型与其所对应的终端a发出的语音信息的语言类型进行比较；当该文字信息的语言类型不是终端a发出的语音信息的语言类型M语言时，终端b在该事件的触发下，启动翻译程序，将该文字信息翻译成M语言；随后将M语言的文字信息再次转换为存储的音色特征的语音信息发送至用户A的终端a。从而，用户A接听到的则为M语言的语音信息，可以即时地了解到用户B欲表达的意思。

工业实用性

综上所述，本申请能够在接收到信息的第一时间对信息进行翻译，使得用户可以在第一时间便捷地获取信息的内容；进一步地，还可以对用户欲答复其接收到的信息的反馈信息进行翻译，将反馈信息翻译成接收到的信息的语言种类，再发送出去，给该反馈信息的接收方也带去了极大的阅读便利，大大提高了信息交互的效率。

以上对本申请的具体实施例进行了详细描述，但其只是作为范例，本申请并不限制于以上描述的具体实施例。对于本领域技术人员而言，任何对本申请进行的等同修改和替代也都在本申请的范畴之中。因此，在不脱离本申请的精神和范围下所作的均等变换和修改，都应涵盖在本申请的范围内。

Claims

一种信息交互的实时翻译方法，应用于一移动终端，其中，包括以下步骤，

接收第一信息；

识别所述第一信息；

根据预设规则将所述第一信息翻译成第二语言；

使用所述第二语言展示所述第一信息。
如权利要求1所述的实时翻译方法，其中，

允许预设所述第二语言。
如权利要求1所述的实时翻译方法，其中，

将所述第一信息翻译成第二语言的方法包括，

将一包含该第一信息及第二语言的翻译请求发送至服务器，以使得所述服务器根据所述第二语言将所述第一信息翻译为所述第二信息，

接收所述第二信息。
如权利要求1所述的实时翻译的方法，其中，

将所述第一信息翻译成第二语言的方法包括，

启动所述移动终端中的翻译程序，

所述翻译程序将所述第一信息翻译为所述第二信息。
一种信息交互的实时翻译方法，其中，包括以下步骤，

接收第一信息，

识别所述第一信息的语言种类，

读取系统语言种类，

比较所述第一信息的语言种类及所述系统语言种类，

当所述第一信息的语言种类与所述系统语言种类不同时，按照所述系统语言种类翻译所述第一信息获得第二信息，

展示所述第二信息。
如权利要求5所述的实时翻译方法，其中，

读取系统语言种类的步骤包括，

获取当前设定的国家或地区或系统语言信息，

根据所述国家或地区或系统语言信息判断所述系统语言种类。
如权利要求6所述的实时翻译方法，其中，

读取系统语言种类的步骤包括，

获取当前文字信息的显示语言，

识别所述显示语言的语言种类，

将所述显示语言的语言种类作为所述系统语言种类。
如权利要求6所述的实时翻译方法，其中，

所述第一信息或第二信息包括以下至少一种：语音信息、图片信息、音频信息、视频信息、文字信息。
如权利要求6所述的实时翻译方法，其中，

按照所述系统语言翻译所述第一信息获得第二信息的步骤包括，将一包含所述第一信息及所述系统语言种类的翻译请求发送至服务器，以使得所述服务器将所述第一信息翻译为所述第二信息；接收所述第二信息。
如权利要求6所述的实时翻译方法，其中，

按照所述系统语言翻译所述第一信息获得第二信息的步骤包括，启动移动终端中的翻译程序，

所述翻译程序将所述第一信息翻译为所述第二信息。
如权利要求6所述的实时翻译方法，其中，还包括，

捕获反馈信息，

识别所述反馈信息的语言种类，

将所述反馈信息的语言种类与所述第一信息的语言种类进行比较，

当所述反馈信息的语言种类与所述第一信息的语言种类不同时，按照所述第一信息的语言种类翻译所述反馈信息，获得第三信息，

向外发送所述第三信息。
一种移动终端，其中，包括：显示器、处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现如权利要求1-11中任一项所述的信息交互的实时翻译方法中的步骤。
一种计算机可读存储介质，其中，所述计算机可读存储介质上存储有移动终端信息交互的实时翻译程序，所述实时翻译程序被处理器执行时实现如权利要求1-11中任一项所述的信息交互的实时翻译方法的步骤。