CN112329484A - 自然语言的翻译方法及装置 - Google Patents
自然语言的翻译方法及装置 Download PDFInfo
- Publication number
- CN112329484A CN112329484A CN202011230136.3A CN202011230136A CN112329484A CN 112329484 A CN112329484 A CN 112329484A CN 202011230136 A CN202011230136 A CN 202011230136A CN 112329484 A CN112329484 A CN 112329484A
- Authority
- CN
- China
- Prior art keywords
- text
- language
- translation
- natural language
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 128
- 238000000034 method Methods 0.000 title claims abstract description 81
- 238000012545 processing Methods 0.000 claims description 46
- 238000004891 communication Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 10
- 230000001788 irregular Effects 0.000 claims description 8
- 238000009432 framing Methods 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 abstract description 22
- 238000013461 design Methods 0.000 description 32
- 230000006870 function Effects 0.000 description 21
- 230000015572 biosynthetic process Effects 0.000 description 11
- 238000003786 synthesis reaction Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 9
- 238000004590 computer program Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 241001672694 Citrus reticulata Species 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 235000009508 confectionery Nutrition 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种自然语言的翻译方法及装置,涉及计算机技术领域,可以解决目前自然语言翻译技术效率低下的问题,该方法包括:获取用于表征源语言的第一文本;根据翻译模型将第一文本翻译为第二文本;根据第二文本,确定目标语言;其中,源语言与目标语言对应不同的语种。
Description
技术领域
本发明涉及计算机技术领域,尤其是涉及一种自然语言的翻译方法及装置。
背景技术
随着全球化的发展,不同语种的人之间的交往日益增多,为实现无障碍交流,自然语言翻译技术应运而生。目前的自然语言翻译技术一般包括两种方法:一种是提前针对于不同的语种间的相互翻译编译源程序,这种方法使得对于每两种不同语种间的翻译均需要编译源程序;另一种则是提前针对于各种不同语种分别生成一个动态链接库(dynamiclink library,简称DLL),在翻译某种自然语言时,需要调用对应语言的DLL,这种方法需要为每种语种开发DLL。由此可见,上述两种自然语言翻译技术不仅增加了程序开发者的工作量,且效率低下,不利于自然语言翻译技术的进步。
发明内容
本申请的目的在于提供一种自然语言的翻译方法及装置,可以解决目前自然语言翻译技术效率低下的问题。
第一方面,本申请实施例提供了一种自然语言的翻译方法及装置,该方法包括:自然语言的翻译方法及装置获取用于表征源语言的第一文本;然后,根据翻译模型将所述第一文本翻译为第二文本;最后,根据所述第二文本,确定目标语言;其中,所述源语言与所述目标语言对应不同的语种。
基于第一方面,自然语言的翻译方法及装置通过将获取用于表征源语言的第一文本根据翻译模型翻译为第二文本,最终根据第二文本,确定目标语言,即自然语言的翻译方法及装置通过将源语言转化为自然语言的翻译系统可以识别的第一文本,并将第一文本翻译为第二文本,最后再根据第二文本通过语音合成技术将翻译后的第二文本转化为语音,反馈至客户,从而实现了快速识别和准确翻译,并且该自然语言的翻译方法不仅大大减小了程序开发者的工作量,而且还提高了自然语言翻译技术的效率。
一种可能的设计中,所述获取用于表征源语言的第一文本,包括:计算所述源语言的声学参数,得到第一特征序列;根据所述第一特征序列与模型库中与所述第一特征序列的相似度最高的序列模板得到所述第一文本。
一种可能的设计中,在计算所述源语言的声学参数,得到第一特征序列之前,所述方法还包括:对所述源语言进行预处理,确定有效范围内的源语言;所述预处理包括去噪、预加重、分帧以及加窗。
基于该可能的设计,通过对源语言进行预处理,即进行去噪、预加重、分帧以及加窗的工作,可以过滤掉其中不重要的信息以及背景噪声,从而使得确定的有效范围内的源语言更加清楚明晰。
一种可能的设计中,所述根据翻译模型将所述第一文本翻译为第二文本,包括:对所述第一文本进行处理,得到所述第一文本的源句意;将所述第一文本的源句意翻译为第二文本。
基于该可能的设计,通过对第一文本进行处理,即对第一文本的词法、语法、语义和句法进行分析,得到第一文本的源句意,从而在后续的翻译中,能够使得翻译的结果更加准确。
一种可能的设计中,所述根据所述第二文本,确定目标语言,包括:根据所述第二文本,确定第二文本模板;所述第二文本模板为去除所述第二文本中不规范的字符后的文本。
基于该可能的设计,在将第二文本中不规范的字符过滤之后,能够使得合成的语音更加准确,以得到更好的翻译效果。
一种可能的设计中,所述根据所述第二文本,确定目标语言,还包括:根据所述第二文本模板,确定所述第二文本模板的读音;根据所述第二文本模板的读音,确定所述目标语言。
一种可能的设计中,所述根据所述第二文本,确定目标语言,还包括:根据所述第二文本模板的读音,确定所述第二文本模板的读音的语音音段特征;根据所述第二文本模板的读音以及所述语音音段特征,确定所述目标语言。
基于该可能的设计,由于本申请是根据第二文本模板的读音以及语音音段特征合成最终的目标语言的语音,从而使最终合成的目标语言的语音能够准确表达语义,听起来更加自然。
第二方面,提供了一种自然语言的翻译装置,自然语言的翻译装置可以实现上述第一方面或者第一方面可能的设计中自然语言的翻译装置所执行的功能,所述功能可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个上述功能相应的模块。如,收发模块和处理模块。收发模块用于获取表征源语言的第一文本;处理模块用于根据翻译模型将所述第一文本翻译为第二文本;处理模块用于根据所述第二文本,确定目标语言;其中,所述源语言与所述目标语言对应不同的语种。
一种可能的设计中,所述处理模块具体用于:计算所述源语言的声学参数,得到第一特征序列;根据所述第一特征序列与模型库中与所述第一特征序列的相似度最高的序列模板,得到所述第一文本。
一种可能的设计中,在所述计算所述源语言的声学参数,得到第一特征序列之前,所述处理模块还用于:对所述源语言进行预处理,确定有效范围内的源语言;所述预处理包括去噪、预加重、分帧以及加窗。
一种可能的设计中,所述处理模块具体用于:对所述第一文本进行处理,得到所述第一文本的源句意;将所述第一文本的源句意翻译为第二文本。
一种可能的设计中,所述处理模块具体用于:根据所述第二文本,确定第二文本模板;所述第二文本模板为去除所述第二文本中不规范的字符后的文本。
一种可能的设计中,所述处理模块还用于:根据所述第二文本模板,确定所述第二文本模板的读音;根据所述第二文本模板的读音,确定所述目标语言。
一种可能的设计中,所述处理模块还用于:根据所述第二文本模板的读音,确定所述第二文本模板的读音的语音音段特征;根据所述第二文本模板的读音以及所述语音音段特征,确定所述目标语言。
第三方面,提供了一种自然语言的翻译装置,该自然语言的翻译装置可以为自然语言的翻译装置或者自然语言的翻译装置中的芯片或者片上系统。该自然语言的翻译装置可以实现上述各方面或者各可能的设计中自然语言的翻译装置所执行的功能,所述功能可以通过硬件和软件实现。
一种可能的设计中,该自然语言的翻译装置可以包括:处理器、收发器、通信线路和存储器;处理器与所述存储器通过通信线路连接。收发器和处理器可以用于支持自然语言的翻译装置执行上述第一方面或者第一方面的任一种可能的设计中所涉及的功能。例如,收发器用于获取表征源语言的第一文本;处理器用于根据翻译模型将所述第一文本翻译为第二文本;处理器用于根据所述第二文本,确定目标语言;其中,所述源语言与所述目标语言对应不同的语种。其中,存储器用于存储计算机执行指令。当该终端设备运行时,收发器和处理器执行存储器存储的计算机执行指令,以使该自然语言的翻译装置执行如上述第一方面或者第一方面的任一种可能的设计所述的自然语言的翻译方法。
第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令或程序,当计算机指令或程序在计算机上运行时,使得计算机执行如第一方面或者第一方面的任一可能的设计所述的终端的运动轨迹的确定方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如第一方面或者第一方面的任一可能的设计所述的终端的运动轨迹的确定方法。
附图说明
图1为本发明实施例提供的一种自然语言的翻译系统的示意图;
图2为本发明实施例提供的一种自然语言的翻译方法的流程图;
图3为本发明实施例提供的一种自然语言的翻译方法的流程图;
图4为本发明实施例提供的一种自然语言的翻译方法的流程图;
图5为本发明实施例提供的一种自然语言的翻译方法的流程图;
图6为本发明实施例提供的一种自然语言的翻译方法的流程图;
图7为本发明实施例提供的一种自然语言的翻译方法的流程图;
图8为本发明实施例提供的一种自然语言的翻译装置的结构示意图;
图9为本发明实施例提供的一种自然语言的翻译装置的组成结构图。
具体实施方式
下面结合说明书附图对本申请实施例的实施方式进行详细描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书以及附图中的术语“第一”和“第二”等是用于区别不同的对象,或者用于区别对同一对象的不同处理,而不是用于描述对象的特定顺序。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,本申请实施例中,“示例性地”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。
在本申请的描述中,除非另有说明,“多个”的含义是指两个或两个以上。
随着全球化的发展,不同语种间人们的交往日益增多,为实现无障碍交流,语言翻译技术应运而生。但是由于自然语言的翻译技术限制了人们之间的交流方式,人们希望通过对话就可以进行交流,因而便携式自然语言的翻译装置的研制成为一种新的技术潮流。例如嵌入式自然语言的翻译技术就是以嵌入式系统为平台,将自然语言的翻译技术与语言识别、语言合成技术相结合,共同开发出来的自然语言的翻译系统。
自然语言的翻译系统涉及多种学科和技术,如声学、语言学、语言识别、语言合成以及通讯技术等。若自然语言的翻译系统开发成熟并应用于人们生活的话,会引起社会的巨大变革,人们无论何时何地,只要有自然语言翻译装置,就可以无障碍进行交流,获取自己所需要的信息。
然而,目前的自然语言翻译技术一般包括两种方法:一种是提前针对于不同的语种间的相互翻译编译源程序,这种方法使得对于每两种不同语种间的翻译均需要编译源程序;另一种则是提前针对于各种不同语种分别生成一个动态链接库(dynamic linklibrary,简称DLL),在翻译某种自然语言时,需要调用对应语言的DLL,这种方法需要为每种语种开发DLL。由此可见,上述两种自然语言翻译技术不仅增加了程序开发者的工作量,且效率低下,不利于自然语言翻译技术的进步。
基于上述问题,本申请实施例提供的一种自然语言的翻译方法,通过将获取用于表征源语言的第一文本根据翻译模型翻译为第二文本,最终根据第二文本,确定目标语言,实现了快速识别和准确翻译,并且不仅大大减小了程序开发者的工作量,而且还提高了自然语言翻译技术的效率。
下面结合说明书附图对本申请实施例提供的自然语言的翻译方法进行详细描述。
图1为本申请实施例提供的一种自然语言翻译系统的示意图,该自然语言翻译系统包括自然语言识别、自然语言翻译以及自然语言合成,通过自然语言识别、自然语言翻译以及自然语言合成能够实现快速识别和准确翻译。
下面以图1为例,对本申请实施例提供的自然语言的翻译方法进行描述。
图2为本申请实施例提供的一种自然语言的翻译方法的流程图,如图2所示,该方法包括:
步骤101、获取用于表征源语言的第一文本。
需要说明的是,在步骤101之前,该自然语言的翻译方法还包括采集源语言,具体实现时,例如可以采用麦克风采集源语言。该源语言可以为待翻译为目标语言的语言。
示例性的,用户在某个会议上使用中文发言,则该用户的中文发言为源语言。在此基础上,可以根据用户的需要,将该中文发言翻译为目标语言。例如翻译为英语、法语、韩语等。一般情况下,源语言与目标语言对应不同的语种。
例如,源语言为中文,目标语言为英文;或者,源语言为英文,目标语言为中文。又例如,源语言为韩语,目标语言为法语;或者,源语言为法语,目标语言为韩语。又例如,源语言为德语,目标语言为日语;或者,源语言为日语,目标语言为德语。
需要说明的是,第一文本为自然语言的翻译系统可以识别的语言。具体的,根据上述的举例说明,源语言为用户在会议上的发言,即源语言为用户可以识别的语言模式,而第一文本则为将源语言转化为自然语言的翻译系统可以识别的语言模式。
具体的,如图3和图4所示,获取用于表征源语言的第一文本,包括:
步骤1011、对源语言进行预处理,确定有效范围内的源语言;预处理包括去噪、预加重、分帧以及加窗。
示例性的,当源语言为用户发言时的语音时,对该段语音进行预处理,判定用户发言时所说的该段语音的起点和终点,即过滤掉其中不重要的信息以及背景噪声。
本申请实施例中,对源语言进行预处理,即进行去噪、预加重、分帧以及加窗后,可以过滤掉其中不重要的信息以及背景噪声,使得确定的有效范围内的源语言更加清楚明晰。
步骤1012、计算源语言的声学参数,得到第一特征序列。
一般情况下,声学参数例如可以为幅度、能量、过零率、线性预测系数(linearprediction coefficient,LPC)、LPC倒谱系数(linear prediction cepstralcoefficients,LPCC)、线谱对参数(line spectrum pair,LSP)、短时频谱和Mel频谱倒谱系数(Mel frequency cepstral coefficient,MFCC)。例如,可以采用模拟信号处理技术和数字信号处理技术计算源语言的声学参数。
示例性的,第一特征序列例如可以包括源语言的语音特征和声学特征。语音特征例如可以包括音色特征和风格特征,音色特征例如为:男声、女生、童声等;风格特征用于表征一个人的说话风格、说话特点或者语言表现力,例如沧桑型声音、甜美型声音、萝莉型声音等。声学特征例如为用户说话时的语调变化、语速等。
在一种可能的示例中,自然语言的翻译方法还包括:降低第一特征序列的维度。
具体的,降低第一特征序列的维度指的是降低第一特征序列中的特征的数量,即通过数学变换(例如主成分分析法、线性判别法)将第一特征序列中的多个特征结合,这样一来,在计算源语言的声学参数时,可以使算法运算更快,效果更好。
步骤1013、根据第一特征序列与模型库中与第一特征序列的相似度最高的序列模板,得到第一文本。
具体的,将第一特征序列依次与模型库中的每个序列模板进行对比,将相似度最高的序列模板作为源语言的识别结果输出,即得到第一文本。需要说明的是,模型库中的序列模板为预先存储在自然语言翻译系统中。例如,通过采集用户训练时的源语言,并对采集到的源语言进行处理以及特征提取、特征分类,再进行模型训练,得到序列模板,然后建立模型库。
步骤201、根据翻译模型将第一文本翻译为第二文本。
示例性的,翻译模型可以为基于规则的翻译方法、或者为基于语料库的翻译方法。具体的,基于规则的翻译方法是指从由语言学家编写的规则中学习知识,对源语言的词法、语法、语义和句法进行分析,从而将第一文本翻译为第二文本。基于语料库的翻译方法利用语料库训练直接得到相应的语句规则,从而将第一文本翻译为第二文本。应当理解的是,第二文本为将第一文本翻译后的自然语言的翻译系统可以识别的语言模式。
在一种可能的示例中,如图5所示,根据翻译模型将第一文本翻译为第二文本,包括:
步骤2011、对第一文本进行处理,得到第一文本的源句意。
具体的,可以采用基于规则的翻译方法,对第一文本的词法、语法、语义和句法进行分析,得到第一文本的源句意,从而使得翻译的结果更加准确。
步骤2012、将第一文本的源句意翻译为第二文本。
示例性的,可以采用基于规则的翻译方法将第一文本的源句意翻译为第二文本;也可以采用基于语料库的翻译方法将第一文本的源句意翻译为第二文本;还可以采用基于规则的翻译方法和基于语料库的翻译方法将第一文本的源句意翻译为第二文本。
本申请中,通过采用基于规则的翻译方法和基于语料库的翻译方法将第一文本翻译为第二文本,可以使得翻译更加准确,以达到更好的翻译效果。
步骤301、根据第二文本,确定目标语言。
具体的,通过语音合成技术,将第二文本生成为自然语言的语音,反馈给用户。例如可以通过音响等设备反馈给用户。
在一种可能的示例中,如图6和图7所示,根据第二文本,确定目标语言,包括:
步骤3011、根据第二文本,确定第二文本模板;第二文本模板为去除第二文本中不规范的字符后的文本。
示例性的,对第二文本进行分析,例如可以将第二文本中的信息与自然语言翻译系统中的语言模板进行对比,找出第二文本中可能存在的拼写错误,将出现的不规范或无法发音的字符过滤掉。
需要说明的是,语言模板为预先存储在自然语言翻译系统中的模板,语言模板包括不同语种,以及不同语种中所需要的词、或短语,以及这些词或短语的标准发音。例如语言模板包括中文时,词或短语的标准发音则为中文的普通话。
基于上述,对第二文本进行分析后得到第二文本模板,第二文本模板为去除第二文本中不规范的字符后的文本,从而能够使合成的目标语言更加准确。
步骤3012、根据第二文本模板,确定第二文本模板的读音。
示例性的,通过将第二文本模板与语言模板进行对比,分析第二文本模板中的词或短语的边界,确定第二文本模板的读音。与此同时,还可以分析第二文本模板中出现的数字、姓氏、特殊字符以及各种多音字的读音方式。
步骤3013、根据第二文本模板的读音,确定第二文本模板的读音的语音音段特征。
需要说明的是,语音音段特征包括基频、音长、音强等。
示例性的,通过将第二文本模板的读音与自然语言翻译系统中的语言数据库进行对比。语言数据库为预先存储在自然语言翻译系统中的数据库,语言数据库包括基频、音长、音强等的特征,从而根据语言数据库分析得到第二文本模板的读音的语音音段特征。
步骤3014、根据第二文本模板的读音以及语音音段特征,确定目标语言。
具体的,将处理好的第二文本模板的读音以及语言音段特征从语音合成库中提取,利用特定的语音合成技术合成出符合要求的语音,通过音响等设备反馈给用户。由于本申请是根据第二文本模板的读音以及语音音段特征合成最终的目标语言的语音,从而使最终合成的目标语言的语音能够准确表达语义,听起来更加自然。
需要说明的是,本申请中采用的语音合成技术可以参考相关技术中的语音合成技术,此处不再一一赘述。
上述主要从设备之间交互的角度对本申请实施例提供的方案进行了介绍。可以理解的是,各个设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对各个设备进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。或者采用硬件的形成和软件功能模块的形式实现,硬件由微处理器和外围接口电路组成,软件由实时操作系统和在其上运行的应用软件构成,软件和硬件之间由中间层(boardsupport package,BPS,板极支持包)连接。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图8示出了一种自然语言的翻译装置400,自然语言的翻译装置400可以包括收发模块401和处理模块402。示例性的,自然语言的翻译装置400可以是自然语言翻译装置,也可以是应用于自然语言翻译装置中的芯片或者其他具有上述自然语言翻译装置功能的组合器件、部件等。当自然语言的翻译装置400是自然语言翻译装置时,收发模块401可以是收发器,收发器可以包括天线和射频电路等,处理模块402可以是处理器(或者,处理电路),例如基带处理器,基带处理器中可以包括一个或多个CPU。当自然语言翻译装置是具有上述自然语言翻译装置功能的组合器件、部件时,收发模块401可以是射频单元,处理模块402可以是处理器(或者,处理电路),例如基带处理器。当自然语言翻译装置400是芯片系统时,收发模块401可以是芯片(例如基带芯片)的输入输出接口,处理模块402可以是芯片系统的处理器(或者,处理电路),可以包括一个或多个中央处理单元。应理解,本申请实施例中的收发模块401可以由收发器或收发器相关电路组件实现,处理模块402可以由处理器或处理器相关电路组件(或者,称为处理电路)实现。
例如,收发模块401可以用于执行图2-图7所示的实施例中由终端设备所执行的全部收发操作,和/或用于支持本文所描述的技术的其它过程。处理模块402可以用于执行图2-图7所示的实施例中由终端设备所执行的除了收发操作之外的全部操作,和/或用于支持本文所描述的技术的其它过程。
具体的,收发模块401,用于获取用于表征源语言的第一文本。
处理模块402,用于根据翻译模型将第一文本翻译为第二文本。
处理模块402,用于根据第二文本,确定目标语言;其中,源语言与目标语言对应不同的语种。
一种可能的设计中,处理模块402具体用于对所述源语言进行预处理,确定有效范围内的源语言;所述预处理包括去噪、预加重、分帧以及加窗。
一种可能的设计中,处理模块402还用于计算源语言的声学参数,得到第一特征序列;处理模块402用于根据第一特征序列与模型库中与第一特征序列的相似度最高的序列模板,得到第一文本。
一种可能的设计中,处理模块402还用于对第一文本进行处理,得到第一文本的源句意;处理模块402还用于将第一文本的源句意翻译为第二文本。
一种可能的设计中,处理模块402还用于根据第二文本,确定第二文本模板;第二文本模板为去除第二文本中不规范的字符后的文本。
一种可能的设计中,处理模块402还用于根据第二文本模板,确定第二文本模板的读音;处理模块402还用于根据第二文本模板的读音,确定目标语言。
一种可能的设计中,处理模块402还用于根据第二文本模板的读音,确定第二文本模板的读音的语音音段特征;处理模块402还用于根据第二文本模板的读音以及语音音段特征,确定目标语言。
作为又一种可实现方式,当收发模块401采用收发器实现、处理模块402采用处理器实现时,如图9所示,自然语言的翻译装置400可以包括至少一个处理器501、收发器502、通信线路503和存储器504。
其中,处理器501,存储器504以及收发器502之间可以通过通信线路503连接。
处理器501是中央处理器(central processing unit,CPU)、通用处理器网络处理器(network processor,NP)、数字信号处理器(digital signal processing,DSP)、微处理器、微控制器、可编程逻辑器件(programmable logic device,PLD)或它们的任意组合。处理器201还可以是其它具有处理功能的装置,例如电路、器件或软件模块,不予限制。
收发器502,用于与其他设备或其它通信网络进行通信。该其它通信网络可以为以太网,无线接入网(radio access network,RAN),无线局域网(wireless local areanetworks,WLAN)等。收发器502可以是模块、电路、收发器或者任何能够实现通信的装置。
通信线路503,用于在自然语言的翻译装置所包括的各部件之间传送信息。
存储器504,用于存储指令。其中,指令可以是计算机程序。
其中,存储器504可以是只读存储器(read-only memory,ROM)或可存储静态信息和/或指令的其他类型的静态存储设备,也可以是随机存取存储器(random accessmemory,RAM)或可存储信息和/或指令的其他类型的动态存储设备,还可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compact disc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或其他磁存储设备等,不予限制。
需要指出的是,存储器504可以独立于处理器501存在,也可以和处理器501集成在一起。存储器504可以用于存储指令或者程序代码或者一些数据等。存储器504可以位于自然语言的翻译装置400内,也可以位于自然语言的翻译装置400外,本申请实施例不予限制。处理器501,用于执行存储器504中存储的指令,以实现本申请下述实施例提供的自然语言的翻译方法。
在一种示例中,处理器501可以包括一个或多个CPU,例如图9中的CPU0和CPU1。
作为一种可选的实现方式,自然语言的翻译装置400包括多个处理器,例如,除图9中的处理器501之外,还可以包括处理器507。
作为一种可选的实现方式,收发器502可以包括接收单元实现接收功能,以及发送单元实现发送功能。
作为一种可选的实现方式,自然语言的翻译装置400还包括输出设备505和输入设备506。示例性地,输入设备506是键盘、鼠标、麦克风或操作杆等设备,输出设备505是显示屏、扬声器(speaker)等设备。
此外,本申请的各实施例之间涉及的动作、术语等均可以相互参考,不予限制。本申请的实施例中各个设备之间交互的消息名称或消息中的参数名称等只是一个示例,具体实现中也可以采用其他的名称,不予限制。
本申请实施例还提供了一种计算机可读存储介质。上述方法实施例中的全部或者部分流程可以由计算机程序来指令相关的硬件完成,该程序可存储于上述计算机可读存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。计算机可读存储介质可以是前述任一实施例的终端(包括数据发送端和/或数据接收端)的内部存储单元,例如终端的硬盘或内存。上述计算机可读存储介质也可以是上述终端的外部存储设备,例如上述终端上配备的插接式硬盘,智能存储卡(smart media card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,上述计算机可读存储介质还可以既包括上述终端的内部存储单元也包括外部存储设备。上述计算机可读存储介质用于存储上述计算机程序以及上述终端所需的其他程序和数据。上述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种自然语言的翻译方法,其特征在于,包括:
获取用于表征源语言的第一文本;
根据翻译模型将所述第一文本翻译为第二文本;
根据所述第二文本,确定目标语言;其中,所述源语言与所述目标语言对应不同的语种。
2.根据权利要求1所述的方法,其特征在于,所述获取用于表征源语言的第一文本,包括:
计算所述源语言的声学参数,得到第一特征序列;
根据所述第一特征序列与模型库中与所述第一特征序列的相似度最高的序列模板,得到所述第一文本。
3.根据权利要求2所述的方法,其特征在于,在所述计算所述源语言的声学参数,得到第一特征序列之前,所述方法还包括:
对所述源语言进行预处理,确定有效范围内的源语言;所述预处理包括去噪、预加重、分帧以及加窗。
4.根据权利要求1所述的方法,其特征在于,所述根据翻译模型将所述第一文本翻译为第二文本,包括:
对所述第一文本进行处理,得到所述第一文本的源句意;
将所述第一文本的源句意翻译为第二文本。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第二文本,确定目标语言,包括:
根据所述第二文本,确定第二文本模板;所述第二文本模板为去除所述第二文本中不规范的字符后的文本。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第二文本,确定目标语言,还包括:
根据所述第二文本模板,确定所述第二文本模板的读音;
根据所述第二文本模板的读音,确定所述目标语言。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二文本,确定目标语言,还包括:
根据所述第二文本模板的读音,确定所述第二文本模板的读音的语音音段特征;
根据所述第二文本模板的读音以及所述语音音段特征,确定所述目标语言。
8.一种自然语言的翻译装置,其特征在于,包括:
收发模块;用于获取用于表征源语言的第一文本;
处理模块;用于根据翻译模型将所述第一文本翻译为第二文本;
所述处理模块;用于根据所述第二文本,确定目标语言;其中,所述源语言与所述目标语言对应不同的语种。
9.一种自然语言的翻译装置,其特征在于,包括:处理器、收发器、通信线路和存储器;所述存储器用于存储计算机执行指令,所述处理器与所述存储器通过所述通信线路连接;
当所述自然语言的翻译装置运行时,处理器执行所述存储器存储的所述计算机执行指令,以使所述自然语言的翻译装置执行如权利要求1-7任意一项所述的自然语言的翻译方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令或程序,当计算机指令或程序在计算机上运行时,使得计算机执行如权利要求1-7任一项所述的自然语言的翻译方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011230136.3A CN112329484A (zh) | 2020-11-06 | 2020-11-06 | 自然语言的翻译方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011230136.3A CN112329484A (zh) | 2020-11-06 | 2020-11-06 | 自然语言的翻译方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112329484A true CN112329484A (zh) | 2021-02-05 |
Family
ID=74316350
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011230136.3A Pending CN112329484A (zh) | 2020-11-06 | 2020-11-06 | 自然语言的翻译方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112329484A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115437620A (zh) * | 2022-11-09 | 2022-12-06 | 广东省科技基础条件平台中心 | 一种自然语言编程方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102237083A (zh) * | 2010-04-23 | 2011-11-09 | 广东外语外贸大学 | 一种基于WinCE平台的便携式口语翻译系统及其语言识别方法 |
CN110175335A (zh) * | 2019-05-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
CN110415684A (zh) * | 2019-08-05 | 2019-11-05 | 安徽赛福贝特信息技术有限公司 | 一种人工智能语音识别系统 |
CN110428805A (zh) * | 2019-09-04 | 2019-11-08 | 福建省立医院 | 非普通话与普通话互译方法、装置和设备 |
CN110705317A (zh) * | 2019-08-28 | 2020-01-17 | 科大讯飞股份有限公司 | 翻译方法及相关装置 |
CN111243590A (zh) * | 2020-01-17 | 2020-06-05 | 中国平安人寿保险股份有限公司 | 一种会议记录的生成方法及设备 |
CN111326157A (zh) * | 2020-01-20 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 文本生成方法、装置、电子设备和计算机可读介质 |
-
2020
- 2020-11-06 CN CN202011230136.3A patent/CN112329484A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102237083A (zh) * | 2010-04-23 | 2011-11-09 | 广东外语外贸大学 | 一种基于WinCE平台的便携式口语翻译系统及其语言识别方法 |
CN110175335A (zh) * | 2019-05-08 | 2019-08-27 | 北京百度网讯科技有限公司 | 翻译模型的训练方法和装置 |
CN110415684A (zh) * | 2019-08-05 | 2019-11-05 | 安徽赛福贝特信息技术有限公司 | 一种人工智能语音识别系统 |
CN110705317A (zh) * | 2019-08-28 | 2020-01-17 | 科大讯飞股份有限公司 | 翻译方法及相关装置 |
CN110428805A (zh) * | 2019-09-04 | 2019-11-08 | 福建省立医院 | 非普通话与普通话互译方法、装置和设备 |
CN111243590A (zh) * | 2020-01-17 | 2020-06-05 | 中国平安人寿保险股份有限公司 | 一种会议记录的生成方法及设备 |
CN111326157A (zh) * | 2020-01-20 | 2020-06-23 | 北京字节跳动网络技术有限公司 | 文本生成方法、装置、电子设备和计算机可读介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115437620A (zh) * | 2022-11-09 | 2022-12-06 | 广东省科技基础条件平台中心 | 一种自然语言编程方法、装置、设备及存储介质 |
CN115437620B (zh) * | 2022-11-09 | 2023-03-28 | 广东省科技基础条件平台中心 | 一种自然语言编程方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108428446B (zh) | 语音识别方法和装置 | |
CN108766414B (zh) | 用于语音翻译的方法、装置、设备和计算机可读存储介质 | |
US11450313B2 (en) | Determining phonetic relationships | |
US8571849B2 (en) | System and method for enriching spoken language translation with prosodic information | |
Klatt | Review of the ARPA speech understanding project | |
EP1557821B1 (en) | Segmental tonal modeling for tonal languages | |
WO2019056500A1 (zh) | 电子装置、语音合成方法和计算机可读存储介质 | |
JP2017027044A (ja) | 音響点数を計算する装置及び方法、音声を認識する装置及び方法並びに電子装置 | |
JP2001101187A (ja) | 翻訳装置および翻訳方法、並びに記録媒体 | |
JP2004287444A (ja) | 多言語テキスト音声変換システムのためのフロントエンドアーキテクチャ | |
WO2020098269A1 (zh) | 一种语音合成方法及语音合成装置 | |
JP2001282282A (ja) | 音声情報処理方法および装置および記憶媒体 | |
JP6875819B2 (ja) | 音響モデル入力データの正規化装置及び方法と、音声認識装置 | |
CN114330371A (zh) | 基于提示学习的会话意图识别方法、装置和电子设备 | |
CN110335608A (zh) | 声纹验证方法、装置、设备及存储介质 | |
US20210090557A1 (en) | Dialogue system, dialogue processing method, translating apparatus, and method of translation | |
US20080120108A1 (en) | Multi-space distribution for pattern recognition based on mixed continuous and discrete observations | |
CN113393830B (zh) | 混合声学模型训练及歌词时间戳生成方法、设备、介质 | |
CN112329484A (zh) | 自然语言的翻译方法及装置 | |
CN116580698A (zh) | 基于人工智能的语音合成方法、装置、计算机设备及介质 | |
CN116343747A (zh) | 语音合成方法、语音合成装置、电子设备及存储介质 | |
CN111916062A (zh) | 语音识别方法、装置和系统 | |
CN113436617B (zh) | 语音断句方法、装置、计算机设备及存储介质 | |
CN113539239B (zh) | 语音转换方法、装置、存储介质及电子设备 | |
CN116052655A (zh) | 音频处理方法、装置、电子设备和可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210205 |