CN108628839A - 一种使用卷积神经网络算法翻译普通话和西班牙语的方法 - Google Patents

一种使用卷积神经网络算法翻译普通话和西班牙语的方法 Download PDF

Info

Publication number
CN108628839A
CN108628839A CN201710172498.3A CN201710172498A CN108628839A CN 108628839 A CN108628839 A CN 108628839A CN 201710172498 A CN201710172498 A CN 201710172498A CN 108628839 A CN108628839 A CN 108628839A
Authority
CN
China
Prior art keywords
spanish
component
mandarin
translation
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710172498.3A
Other languages
English (en)
Inventor
邱念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Original Culture Development Co Ltd
Original Assignee
Hunan Original Culture Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Original Culture Development Co Ltd filed Critical Hunan Original Culture Development Co Ltd
Priority to CN201710172498.3A priority Critical patent/CN108628839A/zh
Publication of CN108628839A publication Critical patent/CN108628839A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Abstract

本发明公开了一种使用卷积神经网络算法翻译普通话和西班牙语的方法,包括七个部件构成:1)云端大数据中心不小于100TB的存储空间、2)普通话语音大数据库、3)西班牙语语音大数据库、4)汉语语法及普通话发音规则数据库、5)西班牙语语法及西班牙语发音规则数据库、6)云计算中心搭载的卷积神经网络算法模块、7)语音输入与输出设备;通过上述部件,特别是核心部件6),本发明能够替代翻译人员,对普通话和西班牙语进行同传翻译,且翻译准确率高、翻译质量稳定、翻译费用低,可替代汉语和西班牙语的翻译人员开展工作。

Description

一种使用卷积神经网络算法翻译普通话和西班牙语的方法
技术领域
本发明涉及卷积神经网络算法应用于翻译的领域,特别是涉及一种使用卷积神经网络算法翻译普通话和西班牙语的方法。
背景技术
随着国际化进程的加快,同传翻译的需求日益增多,而现有的同传翻译是由人来完成,专业的同传翻译人员劳动强度大,翻译准确度易受到个人身体因素的影响,在国际会议中,如果会议的持续时间长,翻译人员的体力和精力不断透支后,将会因疲劳使得翻译的准确度下降;在个人出国旅游时,由于专业的同传翻译薪资水平高,一般普通群众较难以接受携带翻译人员出行。
发明内容
本发明主要解决的技术问题是提供一种使用卷积神经网络算法翻译普通话和西班牙语的方法,能够替代高薪资的西班牙语高级同传翻译,为用户提供不会因为翻译时间长而因疲劳导致的翻译错误。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种使用卷积神经网络算法翻译普通话和西班牙语的方法,其特征在于,包括:1)云端大数据中心不小于100TB的存储空间、2)普通话语音大数据库、3)西班牙语语音大数据库、4)汉语语法及普通话发音规则数据库、5)西班牙语语法及西班牙语发音规则数据库、6)云计算中心搭载的卷积神经网络算法模块、7)语音输入与输出设备,七个部件构成;在用于翻译的核心部件卷积神经网络算法模块中输入与翻译普通话和西班牙语相关的大数据信息,并进行卷积法的深度学习,以达到能够对用户发出的普通话或西班牙语进行翻译的功能。
卷积神经网络算法对普通话和西班牙语翻译大数据的深度学习,具体的步骤为:
步骤1、依据大数据中心存储的音频数据,将其转化为声波图片数据;
步骤2、将大数据中心的声波图片数据依据分类,分别输入卷积神经网络模块进行对普通话和西班牙语翻译大数据的训练;
步骤3、对输入的声波大数据信息进行卷积:用一个可训练的滤波器fx去卷积一个输入的音频声波图像(在C1层是输入图像,之后的卷积层输入则是前一层的卷积特征图),通过一个激活函数(一般使用的是Sigmoid函数),然后加一个偏置bx,得到卷积层Cx。具体运算如下式,式中Mj是输入特征图的值
子采样的过程包括:每邻域的m个像素(m是人为设定)求和变为一个像素,然后通过标量Wx+1加权,再增加偏置bx+1,然后通过激活函数Sigmoid产生特征映射图;从一个平面到下一个平面的映射可以看作是作卷积运算,S层可看作是模糊滤波器,起到了二次特征提取的作用;隐层与隐层之间的空间分辨率递减,而每层所含的平面数递增,这样可用于检测更多的特征信息;对于子采样层来说,有N个输入特征图,就有N个输出特征图,只是每个特征图的的尺寸得到了相应的改变,具体运算如下式,式中down()表示下采样函数
卷积神经网络翻译普通话和西班牙语的过程为两个步骤4个阶段:
步骤一:向前传播过程
阶段1、从样本集中读取(X,Y),将X输入网络;
阶段2、计算相应的实际输出Op,在此阶段,信息从输入层经过逐层变换,传送到输出层,输入与每层的权值矩阵点乘,得到输出结果:
Op=Fn(…( F2 ( F1 (XpW(1) ) W(2) )…)W(n)
步骤二:向后传播阶段
阶段3、计算实际输出和理想输出的差
阶段4、按极小误差发反向传播调整权值矩阵。

Claims (9)

1.一种使用卷积神经网络算法翻译普通话和西班牙语的方法,其特征在于,包括以下7个部件构成:
1)云端大数据中心不小于100TB的存储空间;
2)普通话语音大数据库;
3)西班牙语语音大数据库;
4)汉语语法及普通话发音规则数据库;
5)西班牙语语法及西班牙语发音规则数据库;
6)云计算中心搭载的卷积神经网络算法模块;
7)语音输入与输出设备。
2.根据权利要求1所述的部件1)其特征是:大数据中心的存储空间在一个分区下分为若干个文件夹,以文件夹的形式对所存储的大数据进行分类管理。
3.根据权利要求1所述的部件2)其特征是普通话语音大数据至少需包括两个组成部分:第一组成部分是,不少于100部具有剧情的普通话发音的电影对白音频;第二组成部分是,找不低于100个男性和不低于100个女性人员,让其用普通话说相同内容的一句话,且每人需分别说不少于10000句不同的普通话,并录制音频,记录对应的汉语和西班牙语文字,一并输入部件2)的大数据库进行储存。
4.根据权利要求1所述的部件3)其特征是西班牙语大数据库至少需包括两个组成部分:第一组成部分是,不少于100部具有剧情的西班牙语发音的电影对白音频;第二组成部分是,找不低于100个男性和不低于100个女性人员,让其用西班牙语说相同内容的一句话,且每人需分别说不少于10000句不同的西班牙语,并录制音频,记录对应的西班牙语和汉字,一并输入部件3)的大数据库进行储存。
5.根据权利要求1所述的部件4)和部件5)均需分别录入部件1)的下的不同文件夹内的大数据库进行存储。
6.根据权利要求1所述的部件6)是本发明的翻译关键部件,需要在部件6)中分别输入部件1)内存储的部件2)、3)、4)、5)内的大数据信息,并进行卷积神经网络算法对翻译普通话和西班牙语的深度学习后,才能发挥翻译的作用。
7.根据权利要求6所述的卷积神经网络算法对普通话和西班牙语翻译大数据的深度学习,具体的步骤为:
步骤1、依据大数据中心存储的音频数据,将其转化为声波图片数据;
步骤2、将大数据中心的声波图片数据依据分类,分别输入卷积神经网络模块进行对普通话和西班牙语翻译大数据的训练;
步骤3、对输入的声波大数据信息进行卷积:用一个可训练的滤波器fx去卷积一个输入的音频声波图像(在C1层是输入图像,之后的卷积层输入则是前一层的卷积特征图),通过一个激活函数(一般使用的是Sigmoid函数),然后加一个偏置bx,得到卷积层Cx。
8.具体运算如下式,式中Mj是输入特征图的值
子采样的过程包括:每邻域的m个像素(m是人为设定)求和变为一个像素,然后通过标量Wx+1加权,再增加偏置bx+1,然后通过激活函数Sigmoid产生特征映射图;从一个平面到下一个平面的映射可以看作是作卷积运算,S层可看作是模糊滤波器,起到了二次特征提取的作用;隐层与隐层之间的空间分辨率递减,而每层所含的平面数递增,这样可用于检测更多的特征信息;对于子采样层来说,有N个输入特征图,就有N个输出特征图,只是每个特征图的的尺寸得到了相应的改变,具体运算如下式,式中down()表示下采样函数
根据权利要求6所述的部件3),卷积神经网络翻译普通话和西班牙语的特征在于卷积神经网络翻译的过程为两个步骤4个阶段:
步骤一:向前传播过程
阶段1、从样本集中读取(X,Y),将X输入网络;
阶段2、计算相应的实际输出Op,在此阶段,信息从输入层经过逐层变换,传送到输出层,输入与每层的权值矩阵点乘,得到输出结果:
Op=Fn(…( F2 ( F1 (XpW(1) ) W(2) )…)W(n)
步骤二:向后传播阶段
阶段3、计算实际输出和理想输出的差值
阶段4、按极小误差发反向传播调整权值矩阵。
9.根据权利要求1所述的部件7),其特征是用于采集用户发出的普通话或西班牙语声音数据,将该数据通过互联网传输至云计算中心搭载并训练好的卷积神经网络算法翻译模块中,由该模块同步将语音翻译成西班牙语与普通话后,经互联网传回给部件7),再由部件7)的语音输出设备传输给用户,达到翻译的目的。
CN201710172498.3A 2017-03-22 2017-03-22 一种使用卷积神经网络算法翻译普通话和西班牙语的方法 Pending CN108628839A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710172498.3A CN108628839A (zh) 2017-03-22 2017-03-22 一种使用卷积神经网络算法翻译普通话和西班牙语的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710172498.3A CN108628839A (zh) 2017-03-22 2017-03-22 一种使用卷积神经网络算法翻译普通话和西班牙语的方法

Publications (1)

Publication Number Publication Date
CN108628839A true CN108628839A (zh) 2018-10-09

Family

ID=63706915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710172498.3A Pending CN108628839A (zh) 2017-03-22 2017-03-22 一种使用卷积神经网络算法翻译普通话和西班牙语的方法

Country Status (1)

Country Link
CN (1) CN108628839A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811284A (zh) * 2012-06-26 2012-12-05 深圳市金立通信设备有限公司 一种语音输入自动翻译为目标语言的方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102811284A (zh) * 2012-06-26 2012-12-05 深圳市金立通信设备有限公司 一种语音输入自动翻译为目标语言的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
FANDONG MENG ET AL: "Encoding Source Language with Convolutional Neural Network for Machine Translation", 《PROCEEDINGS OF THE 53RD ANNUAL MEETING OF THE ASSOCIATION FOR COMPUTATIONAL LINGUISTICS AND THE 7TH INTERNATIONAL JOINT CONFERENCE ON NATURAL LANGUAGE PROCESSING》 *

Similar Documents

Publication Publication Date Title
CN108737667B (zh) 语音质检方法、装置、计算机设备及存储介质
WO2022083083A1 (zh) 一种声音变换系统以及声音变换系统的训练方法
CN105185372B (zh) 个性化多声学模型的训练方法、语音合成方法及装置
CN111276120B (zh) 语音合成方法、装置和计算机可读存储介质
CN110223705A (zh) 语音转换方法、装置、设备及可读存储介质
CN108847249A (zh) 声音转换优化方法和系统
CN101064104B (zh) 基于语音转换的情感语音生成方法
CN110136693A (zh) 用于使用少量样本进行神经话音克隆的系统和方法
CN107657017A (zh) 用于提供语音服务的方法和装置
CN111433847B (zh) 语音转换的方法及训练方法、智能装置和存储介质
Kelly et al. Deep neural network based forensic automatic speaker recognition in VOCALISE using x-vectors
CN105261355A (zh) 一种语音合成方法和装置
CN110148400A (zh) 发音类型的识别方法、模型的训练方法、装置及设备
CN109887484A (zh) 一种基于对偶学习的语音识别与语音合成方法及装置
CN109637551A (zh) 语音转换方法、装置、设备及存储介质
CN107767879A (zh) 基于音色的音频转换方法及装置
CN110060691B (zh) 基于i向量和VARSGAN的多对多语音转换方法
CN115206293B (zh) 一种基于预训练的多任务空管语音识别方法及装置
CN107871496A (zh) 语音识别方法和装置
CN111445903B (zh) 企业名称识别方法及装置
CN112562648A (zh) 基于元学习的自适应语音识别方法、装置、设备及介质
CN107705782A (zh) 用于确定音素发音时长的方法和装置
CN111986661A (zh) 复杂环境下基于语音增强的深度神经网络语音识别方法
CN112509550A (zh) 语音合成模型训练方法、语音合成方法、装置及电子设备
JP2022158735A (ja) 学習装置、学習方法、学習プログラム、探索装置、探索方法及び探索プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181009