CN109086276A - 数据翻译方法、装置、终端及存储介质 - Google Patents

数据翻译方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN109086276A
CN109086276A CN201810982566.7A CN201810982566A CN109086276A CN 109086276 A CN109086276 A CN 109086276A CN 201810982566 A CN201810982566 A CN 201810982566A CN 109086276 A CN109086276 A CN 109086276A
Authority
CN
China
Prior art keywords
data
text
voice data
destination application
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810982566.7A
Other languages
English (en)
Other versions
CN109086276B (zh
Inventor
李鸿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201810982566.7A priority Critical patent/CN109086276B/zh
Publication of CN109086276A publication Critical patent/CN109086276A/zh
Application granted granted Critical
Publication of CN109086276B publication Critical patent/CN109086276B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Human Computer Interaction (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种数据翻译方法、装置、终端及存储介质,属于终端技术领域。所述方法包括:在目标应用程序前台运行时接收到通话请求,将接收到通话请求时已采集到的语音数据保存为第一语音数据,前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度,若第一语音数据的语义完整度符合预置条件,则后台通过目标应用程序翻译第一语音数据。本申请实施例通过语音数据的采集过程被突然的通话请求中断,终端仍然可以继续语音数据的翻译任务,避免了相关技术中语音数据的采集过程被通话请求中断导致翻译任务失败的情况,提高了翻译效率。

Description

数据翻译方法、装置、终端及存储介质
技术领域
本申请实施例涉及终端技术领域,特别涉及一种数据翻译方法、装置、终端及存储介质。
背景技术
终端中通常安装有具有翻译功能的应用程序,该应用程序可以将输入的一种语言类型的数据翻译为另一种语言类型的数据。
相关技术中,终端在应用程序的翻译界面上采集用户输入的待翻译的语音数据,在语音数据的采集过程中若接收到来电请求,则终端将翻译界面切换显示为该来电请求对应的来电界面,同时结束对待翻译的语音数据的翻译。
发明内容
本申请实施例提供了一种数据翻译方法、装置、终端及存储介质,可以用于解决在采集待翻译的语音数据的过程中若接收到通话请求则直接中断采集和翻译导致翻译任务失败的问题。技术方案如下:
根据本申请实施例的第一方面,提供了一种数据翻译方法,所述方法包括:
在目标应用程序前台运行时接收到通话请求,所述目标应用程序用于对录入的语音数据进行翻译;
将接收到所述通话请求时已采集到的语音数据保存为第一语音数据;
前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序分析所述第一语音数据的语义完整度;
若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据。
根据本申请实施例的第二方面,提供了一种数据翻译装置,所述装置包括:
接收模块,用于在目标应用程序前台运行时接收到通话请求,所述目标应用程序用于对录入的语音数据进行翻译;
存储模块,用于将接收到所述通话请求时已采集到的语音数据保存为第一语音数据;
分析模块,用于前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序分析所述第一语音数据的语义完整度;
翻译模块,用于若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据。
根据本申请实施例的第三方面,提供了一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令,所述指令由所述处理器加载并执行以实现如本申请第一方面及其可选实施例任一所述的数据翻译方法。
根据本申请实施例的第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现如本申请第一方面及其可选实施例任一所述的数据翻译方法。
本申请实施例提供的技术方案带来的有益效果至少包括:
通过在目标应用程序前台运行时接收到通话请求,将接收到通话请求时已采集到的语音数据保存为第一语音数据,前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度,若第一语音数据的语义完整度符合预置条件,则后台通过目标应用程序翻译第一语音数据;使得语音数据的采集过程被突然的通话请求中断,终端仍然可以继续语音数据的翻译任务,避免了相关技术中语音数据的采集过程被通话请求中断导致翻译任务失败的情况,提高了翻译效率。
附图说明
图1是本申请一个示例性实施例所提供的终端的结构示意图;
图2是本申请一个示例性实施例提供的数据翻译方法的流程图;
图3是本申请另一个示例性实施例提供的数据翻译方法的流程图;
图4是本申请另一个示例性实施例提供的数据翻译方法涉及的界面示意图;
图5是本申请另一个示例性实施例提供的数据翻译方法的流程图;
图6是本申请另一个示例性实施例提供的数据翻译方法的流程图;
图7是本申请一个实施例提供的数据翻译装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本申请的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本申请中的具体含义。此外,在本申请的描述中,除非另有说明,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
在对本申请实施例进行解释说明之前,先对本申请实施例的应用场景进行说明。图1示出了本申请一个示例性实施例所提供的终端的结构示意图。
该终端100是安装有目标应用程序的电子设备。该目标应用程序是具有翻译功能的应用程序。
目标应用程序是系统程序或者第三方应用程序。其中,第三方应用程序是除了用户和操作系统之外的第三方制作的应用程序。
该目标应用程序可以用于将输入的第一语言类型的数据翻译为第二语言类型的数据。该数据可以是文本数据,也可以是语音数据。
在本实施例中,目标应用程序用于将输入的第一语言类型的语音数据翻译为第二语言类型的文本数据。
该终端100是具有通讯功能的电子设备。比如,该终端为手机。
可选的,该终端100中包括:处理器120和存储器140。
处理器120可以包括一个或者多个处理核心。处理器120利用各种接口和线路连接整个终端100内的各个部分,通过运行或执行存储在存储器140内的指令、程序、代码集或指令集,以及调用存储在存储器140内的数据,执行终端100的各种功能和处理数据。可选的,处理器120可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable LogicArray,PLA)中的至少一种硬件形式来实现。处理器120可集成中央处理器(CentralProcessing Unit,CPU)、图像处理器(Graphics Processing Unit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器120中,单独通过一块芯片进行实现。
存储器140可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-Only Memory)。可选的,该存储器140包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器140可用于存储指令、程序、代码、代码集或指令集。存储器140可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等;存储数据区可存储下面各个方法实施例中涉及到的数据等。
请参考图2,其示出了本申请一个示例性实施例提供的数据翻译方法的流程图。本实施例以该数据翻译方法应用于图1所示出的终端中来举例说明。该数据翻译方法包括:
步骤201,在目标应用程序前台运行时接收到通话请求,目标应用程序用于对录入的语音数据进行翻译。
可选的,在目标应用程序前台运行时,在目标应用程序的翻译界面上,采集录入的语音数据。在语音数据的采集过程中,当终端接收到通话请求时中断语音数据的采集过程。
目标应用程序的翻译界面是目标应用程序中与翻译有关的应用界面。
可选的,当目标应用程序的翻译界面处于前台运行时,终端显示目标应用程序的翻译界面,当终端启动语音采集功能时,开始采集录入的待翻译的语音数据。
可选的,当终端接收到通话请求时,在翻译界面上显示该通话请求对应的悬浮窗口,该悬浮窗口中包括接听选项和挂断选项,接听选项用于指示接收该通话请求,挂断选项用于指示拒绝该通话请求。
其中,通话请求包括语音通话请求和/或视频通话请求。
步骤202,将接收到通话请求时已采集到的语音数据保存为第一语音数据。
当终端接收到通话请求时中断语音数据的采集过程,终端将接收到通话请求时已采集到的语音数据保存为第一语音数据。
第一语音数据为语音数据的开始采集时刻到通话请求的接收时刻之间采集到的语音数据。
步骤203,前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度。
终端前台运行通话请求对应的通话程序的同时,后台通过目标应用程序分析第一语音数据的语义完整度。
可选的,第一语音数据对应的语义完整度为第一语音数据的语义结构的完整程度。当第一语音数据的语义完整度等于完整阈值时用于指示第一语音数据的语义是完整的;当第一语音数据的语义完整度小于完整阈值时用于指示第一语音数据的语义是不完整的。
终端前台运行通话请求对应的通话程序,包括:终端拒绝该通话请求,或者,终端接收该通话请求并建立通话连接,在一段时间后断开该通话连接。
终端在前台运行通话请求对应的通话程序的过程中,根据已采集到的第一语音数据继续翻译任务,即后台通过目标应用程序分析第一语音数据的语义完整度。
步骤204,若第一语音数据的语义完整度符合预置条件,则后台通过目标应用程序翻译第一语音数据。
可选的,预置条件为终端默认设置,或者是用户自定义设置的。
若第一语音数据的语义完整度符合预置条件,则终端后台通过目标应用程序将第一语音数据翻译为文本翻译数据。
可选的,当第一语音数据为语义不完整的第一语言类型的语音数据时,文本翻译数据包括第二文本数据和/或第三文本数据,第二文本数据为语义完整的第一语言类型的文本数据,第三文本数据为语义完整的第二语言类型的文本数据。
其中,第一语言类型不同于第二语言类型,第一语言类型和第二语言类型是终端默认设置的,或者是用户自定义设置的。本实施例对此不加以限定。
通常,默认的第一语言类型为中文,默认的第二语言类型为英文。
综上所述,本实施例通过在目标应用程序前台运行时接收到通话请求,将接收到通话请求时已采集到的语音数据保存为第一语音数据,前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度,若第一语音数据的语义完整度符合预置条件,则后台通过目标应用程序翻译第一语音数据;使得语音数据的采集过程被突然的通话请求中断,终端仍然可以继续语音数据的翻译任务,避免了相关技术中语音数据的采集过程被通话请求中断导致翻译任务失败的情况,提高了翻译效率。
请参考图3,其示出了本申请一个示例性实施例提供的数据翻译方法的流程图。本实施例以该信息提示方法应用于图1所示出的终端中来举例说明。该信息提示方法包括:
步骤301,在目标应用程序前台运行时接收到通话请求,目标应用程序用于对录入的语音数据进行翻译。
可选的,在目标应用程序前台运行时在目标应用程序的翻译界面上,采集录入的语音数据。
可选的,目标应用程序的翻译界面上包括语音输入入口。语音输入入口是用于启动语音采集功能的可操作控件。示意性的,快速访问入口的类型包括按钮、可操控的条目、滑块中的至少一种。
在一种可能的实现方式中,n个语音类型的语音数据对应同一个语音输入入口。在终端显示目标应用程序的翻译界面之后,当终端获取到对应于翻译界面的语音输入入口的第一触发操作时,启动语音采集功能,即开始采集录入的语音数据。
可选的,第一触发操作是用于触发启动语音采集功能的用户操作。示意性的,第一触发操作包括点击操作、滑动操作、按压操作、长按操作中的任意一种或多种的组合。
在另一种可能的实现方式中,n个语音类型的语音数据各自对应一个语音输入入口。终端显示目标应用程序的翻译界面,该翻译界面包括第一语言类型对应的第一语音输入入口和第二语言类型对应的第二音输入入口。当终端获取到对应于翻译界面的第一语音输入入口的第一触发操作时,启动语音采集功能,即开始采集录入的第一语言类型的语音数据。当终端获取到对应于翻译界面的第二语音输入入口的第一触发操作时,启动语音采集功能,即开始采集录入的第二语言类型的语音数据。
其中,第一语言类型不同于第二语言类型。在本申请实施例中,仅以第一语言类型为待翻译的语言类型,第二语言类型为翻译后的语言类型,即目标应用程序用于将第一语言类型的语音数据翻译为第二语言类型的文本数据为例进行说明。
可选的,终端在接收到通话请求时,在翻译界面上叠加显示该通话请求对应的悬浮窗口,该悬浮窗口中包括接听选项和挂断选项,接听选项用于指示接收该通话请求,挂断选项用于指示拒绝该通话请求。该悬浮窗口中还包括通话请求的发起方的名称、手机号、地理位置中的至少一种。
步骤302,将接收到通话请求时已采集到的语音数据保存为第一语音数据。
在终端采集语音数据的过程中,若接收到通话请求则中断语音数据的采集过程,终端将已采集到的语音数据保存为第一语音数据。
步骤303,前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度。
可选的,终端前台运行通话请求对应的通话程序,并后台通过目标应用程序将第一语音数据通过语音识别算法识别为第一文本数据;对第一文本数据进行语义分析得到语义完整度。其中,语义完整度为第一语音数据的语义结构的完整程度。
可选的,终端对第一文本数据进行语义分析得到语义完整度,包括:终端获取语义分析模型,根据第一文本数据采用语义分析模型得到语义完整度。其中,语义分析模型是采用样本文本数据对神经网络进行训练得到的模型。
示意性的,终端从第一文本数据提取目标文本特征,将目标文本特征输入至语义分析模型得到语义完整度。
需要说明的是,终端根据第一文本数据采用语义分析模型得到语义完整度,可类比参考下述实施例中终端根据第一文本数据采用文本预测模型得到文本标识的过程,在此不再赘述。
当第一语音数据的语义完整度等于完整阈值时用于指示该语言数据的语义是完整的;当第一语音数据的语义完整度小于完整阈值用于指示该语言数据的语义是不完整的。下面仅以第一语音数据的语义完整度小于完整阈值即第一语音数据为待翻译的语义不完整的语音数据为例进行说明。
步骤304,判断语义完整度是否大于预测阈值。
终端判断第一语音数据对应的语义完整度是否大于预测阈值。
其中,第一语音数据为语义完整度小于或者等于完整阈值的语音数据。预测阈值小于完整阈值。
若语义完整度大于预测阈值则指示第一语音数据的有效信息足够,终端能够根据第一语音数据预测出文本翻译数据,执行步骤305;若语义完整度小于或者等于预测阈值则指示第一语音数据的有效信息太少,终端根据第一语音数据预测出的文本翻译数据的准确性较低,执行步骤307。
步骤305,若第一语音数据的语义完整度大于预测阈值,则后台通过目标应用程序对第一语音数据进行翻译得到文本翻译数据。
可选的,当第一语音数据对应的语义完整度小于完整阈值且大于预测阈值时,后台通过目标应用程序对第一语音数据进行翻译得到文本翻译数据。
可选的,若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序获取与第一文本数据对应的语义完整的第二文本数据,完整阈值为语义完整时对应的阈值;对第二文本数据进行翻译得到第三文本数据;将第二文本数据和第三文本数据确定为文本翻译数据。
其中,第一语音数据、第一文本数据、第二文本数据均为第一语言类型的数据,第三文本数据为第二语言类型的数据。
在一种可能的实现方式中,若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序根据第一文本数据采用文本预测模型得到文本标识,文本预测模型是采用样本文本数据对神经网络进行训练得到的模型;根据预设对应关系将与文本标识对应的文本数据确定为第二文本数据,预设对应关系包括文本标识与文本数据之间的对应关系。
可选的,文本预测模型包括卷积神经网络(Convolutional Neural Network,CNN)模型、深度神经网络(Deep Neural Network,DNN)模型、循环神经网络(Recurrent NeuralNetworks,RNN)模型、嵌入(embedding)模型、梯度提升决策树(Gradient BoostingDecision Tree,GBDT)模型、逻辑回归(Logistic Regression,LR)模型中的至少一种。
可选的,若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序从第一文本数据中提取目标文本特征;将目标文本特征输入至文本预测模型得到文本标识。
其中,文本预测模型是根据至少一组样本数据组训练得到的,每组样本数据组包括:样本文本数据和正确的样本文本标识。
需要说明的是,文本预测模型是预先训练好的模型,文本预测模型的训练过程可参考下面实施例中的相关描述,在此先不介绍。
步骤306,当目标应用程序恢复前台运行时,在目标应用程序的当前界面上以文本形式和/或语音形式提示文本翻译数据。
可选的,当目标应用程序从后台运行重新切换为前台运行时,在目标应用程序的当前界面上以文本形式和/或语音形式提示文本翻译数据。
该文本翻译数据包括第二文本数据和第三文本数据。第二文本数据为预测的语义完整的第一语言类型的文本数据,第三文本数据为翻译后的语义完整的第二语言类型的文本数据。
可选的,在通话请求结束后,当终端检测到目标应用程序的翻译界面再次处于前台运行时,在翻译界面上显示文本翻译数据和/或以语音形式播放该文本翻译数据。
通话请求结束的情况包括:该通话请求被拒绝,或者,通话请求被接收并建立通话连接,在一段时间后该通话连接被断开。
步骤307,若语义完整度小于或者等于预测阈值,则删除已存储的第一语音数据。
当语义完整度小于或者等于预测阈值时,用于指示该第一语音数据的有效信息太少,终端根据第一语音数据预测出的文本翻译数据的准确性较低,删除已存储的第一语音数据,中断对第一语音数据的翻译。
步骤308,当目标应用程序恢复前台运行时,在目标应用程序的当前界面上显示提示信息,提示信息用于指示重新录入语音数据。
可选的,当目标应用程序从后台运行重新切换为前台运行时,终端在目标应用程序的当前界面上显示用于指示重新录入语音数据的提示信息。示意性的,当前界面为翻译界面。
可选的,当通话请求结束且目标应用程序的翻译界面处于前台运行时,终端在翻译界面上以弹出框的形式显示用于指示重新录入语音数据的提示信息。
在一个示意性的例子中,如图4所示,终端显示应用程序A的翻译界面41,该翻译界面41包括中文的语音输入入口42和英文的语音输入入口43,当终端接收到对应于语音输入入口42的按压操作时,开始采集录入的语音数据。在采集语音的过程中终端接收到来电请求,中断该语言数据的采集过程,将已采集到的语音数据确定为第一语音数据,并对第一语音数据进行存储。终端在翻译界面41上叠加显示该来电请求对应的悬浮窗口44,该悬浮窗口44中显示有通话请求的发起方的名称“小欧”、手机号“1363251XXXX”、地理位置“广东深圳”、接听选项45和挂断选项46。在终端接收到对应于接听选项45的点击操作,对该通话请求进行处理的同时,终端将第一语音数据通过语音识别算法识别为第一文本数据“请问卢浮”,获取第一文本数据的语义完整度,当语义完整度大于预测阈值时终端获取与第一文本数据“请问卢浮”对应的语义完整的第二文本数据47“请问卢浮宫怎么走?”,对第二文本数据47进行翻译得到第三文本数据48“How can I get to the Louvre?”。当通话请求结束且翻译界面41再次处于前台运行时,在翻译界面上显示第二文本数据47“请问卢浮宫怎么走?”和第三文本数据48“How can I get to the Louvre?”。
综上所述,本实施例还通过若第一语音数据的语义完整度大于预测阈值,则后台通过目标应用程序对第一语音数据进行翻译得到文本翻译数据,避免了当语义完整度小于或者等于预测阈值即第一语音数据的有效信息太少时终端根据第一语音数据预测出的文本翻译数据的准确性较低的情况,提高了翻译得到的文本翻译数据的准确性。
需要说明的是,在终端获取文本预测模型之前,终端需要对样本文本数据进行训练得到文本预测模型。
可选的,文本预测模型的训练过程包括:终端获取训练样本集,训练样本集包括至少一组样本数据组;根据至少一组样本数据组,采用误差反向传播算法对原始参数模型进行训练得到文本预测模型。
其中,每组样本数据组包括:样本文本数据和正确的样本文本标识。
示意性的,终端根据至少一组样本数据组,采用误差反向传播算法对原始参数模型进行训练得到文本预测模型,包括但不限于以下几个步骤,请参考图5:
步骤501,对于至少一组样本数据组中的每组样本数据组,从样本文本数据中提取样本文本特征。
终端根据样本文本数据,采用文本特征提取算法提取样本文本特征。
可选的,文本特征提取算法包括词频-逆向文件频率((term frequency–inversedocument frequency,TF-IDF)算法和用来产生词向量的相关模型(word to vector,Word2Vec)算法中的一种。
步骤502,将样本文本特征输入原始参数模型,得到训练结果。
终端将样本文本特征输入原始参数模型,得到训练结果。
可选的,原始参数模型是根据神经网络模型建立的,比如:原始参数模型是根据CNN模型、DNN模型和RNN模型中的一种建立的。
示意性的,对于每组样本数据组,终端创建该组样本数据组对应的输入输出对,输入输出对的输入参数为该组样本数据组中的样本文本特征,输出参数为该组样本数据组中的样本文本标识;终端将输入参数输入预测模型,得到训练结果。
比如,样本文本特征为“样本文本特征1”,样本文本标识为“样本文本标识1”,终端创建的输入输出对为:(样本文本特征1)->(样本文本标识1);其中,(样本文本特征1)为输入参数,(样本文本标识1)为输出参数。
可选的,输入输出对通过特征向量表示。
步骤503,将训练结果与样本文本标识进行比较,得到计算损失,计算损失用于指示训练结果与样本文本标识之间的误差。
可选的,计算损失通过交叉熵(cross-entropy)来表示,
可选的,终端通过下述公式计算得到计算损失H(p,q):
其中,p(x)和q(x)是长度相等的离散分布向量,p(x)表示表示训练结果;q(x)表示输出参数;x为训练结果或输出参数中的一个向量。
步骤504,根据至少一组样本数据组各自对应的计算损失,采用误差反向传播算法训练得到文本预测模型。
可选的,终端通过反向传播算法根据计算损失确定文本预测模型的梯度方向,从文本预测模型的输出层逐层向前更新文本预测模型中的模型参数。
基于上述训练得到文本预测模型,在一种可能的实现方式中,上述步骤305包括但不限于以下几个步骤,如图6所示。
步骤601,当语义完整度大于预测阈值时,从第一文本数据中提取目标文本特征。
可选的,若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序从第一文本数据中提取目标文本特征。
可选的,终端根据第一文本数据采用文本特征提取算法提取目标文本特征。示意性的,文本特征提取算法为TF-IDF算法。
步骤602,将目标文本特征输入至文本预测模型得到文本标识。
其中,文本预测模型是根据至少一组样本数据组训练得到的,每组样本数据组包括:样本文本数据和正确的样本文本标识。
终端将目标文本特征输入至文本预测模型得到文本标识,该文本标识用于唯一指示第二文本数据。
步骤603,根据预设对应关系将与文本标识对应的文本数据确定为第二文本数据,预设对应关系包括文本标识与文本数据之间的对应关系。
在一种可能的实现方式中,终端中存储有预设对应关系。终端根据预设对应关系获取与文本标识对应的文本数据,将与文本标识对应的文本数据确定为第二文本数据。
在另一种可能的实现方式中,服务器中存储有预设对应关系。终端向服务器发送携带有文本标识的查询请求,对应的,服务器接收该查询请求,从查询请求中获取文本标识,根据预设对应关系获取与文本标识对应的文本数据,将与文本标识对应的文本数据反馈至终端,对应的,终端接收服务器反馈的文本数据,将反馈的文本数据确定为第二文本数据。
综上所述,本申请实施例还通过若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序从第一文本数据中提取目标文本特征,将目标文本特征输入至文本预测模型得到文本标识,根据预设对应关系将与文本标识对应的文本数据确定为第二文本数据;使得终端能够根据第一文本数据采用文本预测模型预测出语义完整的第二文本数据,提高了预测出的第二文本数据的准确性。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图7,其示出了本申请一个实施例提供的数据翻译装置的结构示意图。该数据翻译装置可以通过专用硬件电路,或者,软硬件的结合实现成为图1中的终端的全部或一部分,该数据翻译装置包括:接收模块710、存储模块720、分析模块730和翻译模块740。
接收模块710,用于在目标应用程序前台运行时接收到通话请求,目标应用程序用于对录入的语音数据进行翻译;
存储模块720,用于将接收到通话请求时已采集到的语音数据保存为第一语音数据;
分析模块730,用于前台运行通话请求对应的通话程序,并后台通过目标应用程序分析第一语音数据的语义完整度;
翻译模块740,用于若第一语音数据的语义完整度符合预置条件,则后台通过目标应用程序翻译第一语音数据。
可选的,语义完整度为第一语音数据的语义结构的完整程度;翻译模块740,还用于若第一语音数据的语义完整度大于预测阈值,则后台通过目标应用程序对第一语音数据进行翻译得到文本翻译数据。
可选的,分析模块730,还用于前台运行通话请求对应的通话程序,并后台通过目标应用程序将第一语音数据通过语音识别算法识别为第一文本数据;
对第一文本数据进行语义分析得到语义完整度;
翻译模块740,还用于若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序获取与第一文本数据对应的语义完整的第二文本数据,完整阈值为语义完整时对应的阈值;
对第二文本数据进行翻译得到第三文本数据;
将第二文本数据和第三文本数据确定为文本翻译数据;
其中,第一语音数据、第一文本数据、第二文本数据均为第一语言类型的数据,第三文本数据为第二语言类型的数据。
可选的,翻译模块740,还用于若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序根据第一文本数据采用文本预测模型得到文本标识,文本预测模型是采用样本文本数据对神经网络进行训练得到的模型;
根据预设对应关系将与文本标识对应的文本数据确定为第二文本数据,预设对应关系包括文本标识与文本数据之间的对应关系。
可选的,翻译模块740,还用于若第一语音数据的语义完整度大于预测阈值且小于完整阈值,则后台通过目标应用程序从第一文本数据中提取目标文本特征;
将目标文本特征输入至文本预测模型得到文本标识;
其中,文本预测模型是根据至少一组样本数据组训练得到的,每组样本数据组包括:样本文本数据和正确的样本文本标识。
可选的,该装置还包括:训练模块。该训练模块,用于获取训练样本集,训练样本集包括至少一组样本数据组;
根据至少一组样本数据组,采用误差反向传播算法对原始参数模型进行训练得到文本预测模型。
可选的,该训练模块,还用于对于至少一组样本数据组中的每组样本数据组,从样本文本数据中提取样本文本特征;
将样本文本特征输入原始参数模型,得到训练结果;
将训练结果与样本文本标识进行比较,得到计算损失,计算损失用于指示训练结果与样本文本标识之间的误差;
根据至少一组样本数据组各自对应的计算损失,采用误差反向传播算法训练得到文本预测模型。
可选的,该装置还包括:提示模块。该提示模块,用于当目标应用程序恢复前台运行时,在目标应用程序的当前界面上以文本形式和/或语音形式提示文本翻译数据。
相关细节可结合参考图2至图6所示的方法实施例。其中,接收模块710还用于实现上述方法实施例中其他任意隐含或公开的与接收步骤相关的功能;存储模块720还用于实现上述方法实施例中其他任意隐含或公开的与存储步骤相关的功能;分析模块730还用于实现上述方法实施例中其他任意隐含或公开的与分析步骤相关的功能;翻译模块740还用于实现上述方法实施例中其他任意隐含或公开的与翻译步骤相关的功能。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本申请还提供一种计算机可读介质,其上存储有程序指令,程序指令被处理器执行时实现上述各个方法实施例提供的数据翻译方法。
本申请还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各个实施例所述的数据翻译方法。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的数据翻译方法中全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (11)

1.一种数据翻译方法,其特征在于,所述方法包括:
在目标应用程序前台运行时接收到通话请求,所述目标应用程序用于对录入的语音数据进行翻译;
将接收到所述通话请求时已采集到的语音数据保存为第一语音数据;
前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序分析所述第一语音数据的语义完整度;
若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据。
2.根据权利要求1所述的方法,其特征在于,所述语义完整度为所述第一语音数据的语义结构的完整程度;
所述若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据,包括:
若所述第一语音数据的语义完整度大于预测阈值,则后台通过所述目标应用程序对所述第一语音数据进行翻译得到文本翻译数据。
3.根据权利要求2所述的方法,其特征在于,所述前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序分析所述第一语音数据的语义完整度,包括:
前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序将所述第一语音数据通过语音识别算法识别为第一文本数据;
对所述第一文本数据进行语义分析得到所述语义完整度;
所述若所述第一语音数据的语义完整度大于预测阈值,则后台通过所述目标应用程序对所述第一语音数据进行翻译得到文本翻译数据,包括:
若所述第一语音数据的语义完整度大于所述预测阈值且小于完整阈值,则后台通过所述目标应用程序获取与所述第一文本数据对应的语义完整的第二文本数据,所述完整阈值为语义完整时对应的阈值;
对所述第二文本数据进行翻译得到所述第三文本数据;
将所述第二文本数据和所述第三文本数据确定为所述文本翻译数据;
其中,所述第一语音数据、所述第一文本数据、所述第二文本数据均为第一语言类型的数据,所述第三文本数据为第二语言类型的数据。
4.根据权利要求3所述的方法,其特征在于,所述若所述第一语音数据的语义完整度大于所述预测阈值且小于完整阈值,则后台通过所述目标应用程序获取与所述第一文本数据对应的语义完整的第二文本数据,包括:
若所述第一语音数据的语义完整度大于所述预测阈值且小于所述完整阈值,则后台通过所述目标应用程序根据所述第一文本数据采用文本预测模型得到文本标识,所述文本预测模型是采用样本文本数据对神经网络进行训练得到的模型;
根据预设对应关系将与所述文本标识对应的文本数据确定为第二文本数据,所述预设对应关系包括所述文本标识与所述文本数据之间的对应关系。
5.根据权利要求4所述的方法,其特征在于,所述若所述第一语音数据的语义完整度大于所述预测阈值且小于所述完整阈值,则后台通过所述目标应用程序根据所述第一文本数据采用文本预测模型得到文本标识,包括:
若所述第一语音数据的语义完整度大于所述预测阈值且小于所述完整阈值,则后台通过所述目标应用程序从所述第一文本数据中提取目标文本特征;
将所述目标文本特征输入至所述文本预测模型得到所述文本标识;
其中,所述文本预测模型是根据至少一组样本数据组训练得到的,每组所述样本数据组包括:样本文本数据和正确的样本文本标识。
6.根据权利要求4所述的方法,其特征在于,所述方法,还包括:
获取训练样本集,训练样本集包括所述至少一组样本数据组;
根据所述至少一组样本数据组,采用误差反向传播算法对原始参数模型进行训练得到所述文本预测模型。
7.根据权利要求6所述的方法,其特征在于,所述根据所述至少一组样本数据组,采用误差反向传播算法对原始参数模型进行训练得到所述文本预测模型,包括:
对于所述至少一组样本数据组中的每组样本数据组,从所述样本文本数据中提取样本文本特征;
将所述样本文本特征输入所述原始参数模型,得到训练结果;
将所述训练结果与所述样本文本标识进行比较,得到计算损失,所述计算损失用于指示所述训练结果与所述样本文本标识之间的误差;
根据所述至少一组样本数据组各自对应的计算损失,采用所述误差反向传播算法训练得到所述文本预测模型。
8.根据权利要求2所述的方法,其特征在于,所述若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据之后,还包括:
当所述目标应用程序恢复前台运行时,在所述目标应用程序的当前界面上以文本形式和/或语音形式提示所述文本翻译数据。
9.一种数据翻译装置,其特征在于,所述装置包括:
接收模块,用于在目标应用程序前台运行时接收到通话请求,所述目标应用程序用于对录入的语音数据进行翻译;
存储模块,用于将接收到所述通话请求时已采集到的语音数据保存为第一语音数据;
分析模块,用于前台运行所述通话请求对应的通话程序,并后台通过所述目标应用程序分析所述第一语音数据的语义完整度;
翻译模块,用于若所述第一语音数据的语义完整度符合预置条件,则后台通过所述目标应用程序翻译所述第一语音数据。
10.一种终端,其特征在于,所述终端包括处理器、与所述处理器相连的存储器,以及存储在所述存储器上的程序指令,所述处理器执行所述程序指令时实现如权利要求1至8任一所述的数据翻译方法。
11.一种计算机可读存储介质,其特征在于,其上存储有程序指令,所述程序指令被处理器执行时实现如权利要求1至8任一所述的数据翻译方法。
CN201810982566.7A 2018-08-27 2018-08-27 数据翻译方法、装置、终端及存储介质 Active CN109086276B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810982566.7A CN109086276B (zh) 2018-08-27 2018-08-27 数据翻译方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810982566.7A CN109086276B (zh) 2018-08-27 2018-08-27 数据翻译方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN109086276A true CN109086276A (zh) 2018-12-25
CN109086276B CN109086276B (zh) 2022-12-06

Family

ID=64794680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810982566.7A Active CN109086276B (zh) 2018-08-27 2018-08-27 数据翻译方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN109086276B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931510A (zh) * 2019-04-25 2020-11-13 广东小天才科技有限公司 一种基于神经网络的意图识别方法及装置、终端设备
WO2020231209A1 (en) * 2019-05-14 2020-11-19 Samsung Electronics Co., Ltd. Method, apparatus, electronic device, and computer readable storage medium for voice translation
CN112700769A (zh) * 2020-12-26 2021-04-23 科大讯飞股份有限公司 一种语义理解方法、装置、设备以及计算机可读存储介质
CN112735417A (zh) * 2020-12-29 2021-04-30 科大讯飞股份有限公司 语音翻译方法、电子设备、计算机可读存储介质
CN113593553A (zh) * 2021-07-12 2021-11-02 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN116092496A (zh) * 2022-12-05 2023-05-09 湖北微模式科技发展有限公司 一种话术表达完整性判别的方法与系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070113740A (ko) * 2006-05-26 2007-11-29 에스케이 텔레콤주식회사 번역 서비스 제공 시스템 및 그 방법
CN101154221A (zh) * 2006-09-28 2008-04-02 株式会社东芝 执行输入语音翻译处理的装置
CN105430208A (zh) * 2015-10-23 2016-03-23 小米科技有限责任公司 语音会话方法、装置及终端设备
CN107770387A (zh) * 2017-10-31 2018-03-06 珠海市魅族科技有限公司 通信控制方法、装置、计算机装置及计算机可读存储介质
CN108196814A (zh) * 2017-12-28 2018-06-22 广东欧珀移动通信有限公司 语音输入方法及相关产品

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070113740A (ko) * 2006-05-26 2007-11-29 에스케이 텔레콤주식회사 번역 서비스 제공 시스템 및 그 방법
CN101154221A (zh) * 2006-09-28 2008-04-02 株式会社东芝 执行输入语音翻译处理的装置
CN105430208A (zh) * 2015-10-23 2016-03-23 小米科技有限责任公司 语音会话方法、装置及终端设备
CN107770387A (zh) * 2017-10-31 2018-03-06 珠海市魅族科技有限公司 通信控制方法、装置、计算机装置及计算机可读存储介质
CN108196814A (zh) * 2017-12-28 2018-06-22 广东欧珀移动通信有限公司 语音输入方法及相关产品

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111931510A (zh) * 2019-04-25 2020-11-13 广东小天才科技有限公司 一种基于神经网络的意图识别方法及装置、终端设备
WO2020231209A1 (en) * 2019-05-14 2020-11-19 Samsung Electronics Co., Ltd. Method, apparatus, electronic device, and computer readable storage medium for voice translation
US11404044B2 (en) 2019-05-14 2022-08-02 Samsung Electronics Co., Ltd. Method, apparatus, electronic device, and computer readable storage medium for voice translation
CN112700769A (zh) * 2020-12-26 2021-04-23 科大讯飞股份有限公司 一种语义理解方法、装置、设备以及计算机可读存储介质
CN112735417A (zh) * 2020-12-29 2021-04-30 科大讯飞股份有限公司 语音翻译方法、电子设备、计算机可读存储介质
CN112735417B (zh) * 2020-12-29 2024-04-26 中国科学技术大学 语音翻译方法、电子设备、计算机可读存储介质
CN113593553A (zh) * 2021-07-12 2021-11-02 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN113593553B (zh) * 2021-07-12 2022-05-24 深圳市明源云客电子商务有限公司 语音识别方法、装置、语音管理服务器以及存储介质
CN116092496A (zh) * 2022-12-05 2023-05-09 湖北微模式科技发展有限公司 一种话术表达完整性判别的方法与系统
CN116092496B (zh) * 2022-12-05 2023-10-17 湖北微模式科技发展有限公司 一种话术表达完整性判别的方法与系统

Also Published As

Publication number Publication date
CN109086276B (zh) 2022-12-06

Similar Documents

Publication Publication Date Title
CN109086276A (zh) 数据翻译方法、装置、终端及存储介质
US11138903B2 (en) Method, apparatus, device and system for sign language translation
CN108682420B (zh) 一种音视频通话方言识别方法及终端设备
JP6968908B2 (ja) コンテキスト取得方法及びコンテキスト取得デバイス
CN111261162B (zh) 语音识别方法、语音识别装置及存储介质
CN104808794A (zh) 一种唇语输入方法和系统
CN107609092A (zh) 智能应答方法和装置
CN103458056A (zh) 自动外呼系统基于自动分类技术的语音意图判定方法
CN108074571A (zh) 增强现实设备的语音控制方法、系统及存储介质
CN108920640A (zh) 基于语音交互的上下文获取方法及设备
JP2022125222A (ja) 情報処理システム、情報処理方法および情報処理装置
CN108897517B (zh) 一种信息处理方法及电子设备
CN108318042A (zh) 导航模式切换方法、装置、终端及存储介质
CN111413877A (zh) 控制家电设备的方法及装置
CN111368145A (zh) 一种知识图谱的创建方法、创建系统及终端设备
CN110349577B (zh) 人机交互方法、装置、存储介质及电子设备
CN113948090B (zh) 语音检测方法、会话记录产品及计算机存储介质
CN108597499B (zh) 语音处理方法以及语音处理装置
CN115390678B (zh) 虚拟人交互方法、装置、电子设备及存储介质
CN107196979A (zh) 基于语音识别的叫号预提醒系统
CN111985250A (zh) 模型训练方法、装置、系统及计算机可读存储介质
CN115312028A (zh) 语音识别方法、装置、计算机可读存储介质及计算机设备
CN115146633A (zh) 一种关键词识别方法、装置、电子设备及存储介质
CN113413590A (zh) 一种信息验证方法、装置、计算机设备及存储介质
CN113674745A (zh) 语音识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant