CN108628843A - 基于rbh神经网络模型翻译粤语口音和德语的app - Google Patents

基于rbh神经网络模型翻译粤语口音和德语的app Download PDF

Info

Publication number
CN108628843A
CN108628843A CN201710173285.2A CN201710173285A CN108628843A CN 108628843 A CN108628843 A CN 108628843A CN 201710173285 A CN201710173285 A CN 201710173285A CN 108628843 A CN108628843 A CN 108628843A
Authority
CN
China
Prior art keywords
rbh
german
neural network
guangdong language
network models
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710173285.2A
Other languages
English (en)
Inventor
邱念
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan Original Culture Development Co Ltd
Original Assignee
Hunan Original Culture Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan Original Culture Development Co Ltd filed Critical Hunan Original Culture Development Co Ltd
Priority to CN201710173285.2A priority Critical patent/CN108628843A/zh
Publication of CN108628843A publication Critical patent/CN108628843A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种基于RBH神经网络模型翻译粤语口音和德语的APP,包括:1)搭载在云计算中心的RBH神经网络模型、2)存放在云存储空间内的粤语与德语相关的大数据库、3)用户端手机APP,三个模块构成,通过上述模块,能够使RBH神经网络翻译模型代替专业的高级翻译人员迅速高效低价的为用户提供粤语口音与德语之间的同传翻译,而用户感知不到庞大的云计算中心进行复杂翻译计算的机器设备,只需要使用自己智能手机里的APP即可替代以往费时费力费钱聘请高级法语翻译才能起到的作用。

Description

基于RBH神经网络模型翻译粤语口音和德语的APP
技术领域
本发明涉及RBH神经网络算法与手机APP技术相结合的领域,特别是涉及基于RBH神经网络模型翻译粤语口音和德语的APP。
背景技术
随着国际化进程的加快,中法交流的日益频繁,翻译的需求随之增多,而现有的翻译是由人来完成,专业的同传翻译人员劳动强度大,翻译准确度易受到个人身体因素的影响,在国际会议中,如果会议的持续时间长,翻译人员的体力和精力不断透支后,将会因疲劳使得翻译的准确度下降;在个人出国旅游时,由于专业的同传翻译薪资水平高,一般普通群众较难以接受携带翻译人员出行;对于粤语口音较重,且普通话发音不标准的人,在翻译其语句时,若翻译人员为国外不懂粤语口音的人员,则极易产生错误从而造成损失。
发明内容
本发明主要解决的技术问题是提供一种基于RBH神经网络模型翻译粤语口音和德语的APP,能够替代高薪资的高级同传翻译,为用户提供不会因为翻译时间长而因疲劳导致的翻译错误,RBH神经网络翻译模型不仅翻译速度快,且能够识别用户的粤语口音,特别适用与大型国际会议的翻译需求,且其在用户端采用APP的形式,省去了国际会议室布置同传箱的空间和聘请同传翻译人员的成本;当用户出国旅行时,仅需携带随身手机即可达到翻译目的,本发明具备方便快捷、操作简单、性能稳定、成本低廉的特点。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于,包括:1)搭载在云计算中心的RBH神经网络模型、2)存放在云存储空间内的粤语与德语相关的大数据库、3)用户端手机APP,三个模块构成;为了使人工智能翻译粤语口音和德语的速度更快,以满足语速较快环境下的同传翻译需求,RBH神经网络模型起到了关键性的作用。
RBH神经网络翻译模型的训练方法包括如下步骤:
步骤一、在云计算中心将:粤语口音大数据和德语音频大数据录入,汉语语法和德语语法数据录入,中文与德语词典录入,行业专有名称数据录入;
步骤二、在云计算中心对RBH神经网络模型的输入层与隐含层进行数据建模,RBF神经 网络是一种三层前向网络,通过输入层空间到隐含层空间的非线性变换以及隐含层空间到 输出层空间的线性变换,实现输入层空间到输出层空间的映射。这两个层间变换参数的学 习可以分别进行,使得RBF神经网络的学习速度较快且可避免局部极小问题;RBF(Radial Basis Function,径向基函数)是翻译数据沿径向对称的标量函数,通常定义为空间中点 到某一中心之间欧氏距离的单调函数,最常用的径向基函数是高斯函数,形式为:
其中为函数中心向量,为宽度向量。高斯函数的作用域表现出局部性,即当远离时函数取值较小;RBF神经网络的结构从左至右分为三层,依次是输入层、隐含层和输出 层;
步骤三、将搭载了粤语口音与德语翻译大数据库的RBH神经网络模型进行训练,其训练方法和公式为:
步骤四:训练完成后,随机输入100组粤语口音发音的汉语和德语声音信息,通过录入RBH神经网络系统进行翻译,再人为测定其翻译准确率,若同传准确率高于75%且翻译速度无需等待,则RHB神经网络翻译模型训练成功;若低于该值,则重复步骤三,直至测试值达标为止。
具体实施例
实施例1:在一场耗时达5小时的长时间国际会议上,发言者语速较快,且中方发言人带有粤语口音,德方派出的中文同传翻译人员,对粤语口音了解有限,且经过长时间注意力高度集中的同传翻译后,随着疲劳,导致翻译准确率逐步下降;此时,中方派出的RBH神经网络模型用机器对粤语口音和德语进行同传翻译,机器不知疲倦,始终能够将翻译准确率维持在稳定的高水平位置上,工作能力优于人类翻译人员。

Claims (6)

1.基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于,包括:1)搭载在云计算中心的RBH神经网络模型、2)存放在云存储空间内的粤语与德语相关的大数据库、3)用户端手机APP,三个模块构成。
2.根据权利要求1所述的基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于:模块2)的大数据库是根据不同类别的粤语和德语翻译数据进行分类存储的,其中包括:粤语口音的音频大数据库、德语的音频大数据库、汉语语法及发音规则数据库、德语语法及发音规则数据库、不少于10个行业的行业专有名词数据库、不少于100部具有上下文情节的粤语发音的电影音频大数据库、不少于100部具有上下文情节的德语发音的电影音频大数据库。
3.根据权利要求1所述的基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于:进行翻译的主体部分为部件1),RBH神经网络模型能够翻译粤语发音和德语发音的音频的前提是,需要将翻译大数据库内的数据分别输入RBH神经网络模型中,通过RBH神经网络系统对粤语口音和德语翻译大数据的深度学习,且经测试达到翻译的准确率后,采用将APP与云计算中心的RBH神经网络算法相连接,为用户提供粤语和德语的翻译服务。
4.根据权利要求1所述的基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于:RBF神经网络的学习分成两阶段,自组织学习阶段和监督学习阶段。
5.在自组织学习阶段获取隐含层中心,在监督学习阶段获取隐含层到输出层之间的权值,各部分参数都可以快速学习,因此翻译的速度较快该方法对翻译速度要求高的同传翻译。
6.根据权利要求1所述的基于RBH神经网络模型翻译粤语口音和德语的APP,其特征在于包括如步骤:
步骤一、在云计算中心将:粤语口音大数据和德语音频大数据录入,汉语语法和德语语法数据录入,中文与德语词典录入,行业专有名称数据录入;
步骤二、在云计算中心对RBH神经网络模型的输入层与隐含层进行数据建模,RBF神经 网络是一种三层前向网络,通过输入层空间到隐含层空间的非线性变换以及隐含层空间到 输出层空间的线性变换,实现输入层空间到输出层空间的映射;这两个层间变换参数的学 习可以分别进行,使得RBF神经网络的学习速度较快且可避免局部极小问题;RBF(Radial Basis Function,径向基函数)是翻译数据沿径向对称的标量函数,通常定义为空间中点 到某一中心之间欧氏距离的单调函数,最常用的径向基函数是高斯函数,形式为:
其中为函数中心向量,为宽度向量;高斯函数的作用域表现出局部性,即当远离时函数取值较小;RBF神经网络的结构从左至右分为三层,依次是输入层、隐含层和输出 层;
步骤三、将搭载了粤语口音与德语翻译大数据库的RBH神经网络模型进行训练,其训练方法和公式为:
步骤四:训练完成后,随机输入100组粤语口音发音的汉语和德语声音信息,通过录入RBH神经网络系统进行翻译,再人为测定其翻译准确率,若交传准确率高于95%,同传准确率高于75%,且同传翻译速度为实时无需等待,则RHB神经网络翻译模型训练成功;若低于该值,则重复步骤三,直至测试值达标为止。
CN201710173285.2A 2017-03-22 2017-03-22 基于rbh神经网络模型翻译粤语口音和德语的app Pending CN108628843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710173285.2A CN108628843A (zh) 2017-03-22 2017-03-22 基于rbh神经网络模型翻译粤语口音和德语的app

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710173285.2A CN108628843A (zh) 2017-03-22 2017-03-22 基于rbh神经网络模型翻译粤语口音和德语的app

Publications (1)

Publication Number Publication Date
CN108628843A true CN108628843A (zh) 2018-10-09

Family

ID=63707147

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710173285.2A Pending CN108628843A (zh) 2017-03-22 2017-03-22 基于rbh神经网络模型翻译粤语口音和德语的app

Country Status (1)

Country Link
CN (1) CN108628843A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068998A (zh) * 2015-07-29 2015-11-18 百度在线网络技术(北京)有限公司 基于神经网络模型的翻译方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105068998A (zh) * 2015-07-29 2015-11-18 百度在线网络技术(北京)有限公司 基于神经网络模型的翻译方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
唐开元 等: "《高等内燃机学》", 31 August 2008, 北京:国防工业出版社 *

Similar Documents

Publication Publication Date Title
CN107818164A (zh) 一种智能问答方法及其系统
CN108170749A (zh) 基于人工智能的对话方法、装置及计算机可读介质
De Vries et al. A smartphone-based ASR data collection tool for under-resourced languages
CN107423284B (zh) 融合中文单词内部结构信息的句子表示的构建方法及系统
CN109408526A (zh) Sql语句生成方法、装置、计算机设备及存储介质
Lu et al. Combining a vector space representation of linguistic context with a deep neural network for text-to-speech synthesis
CN106547735A (zh) 基于深度学习的上下文感知的动态词或字向量的构建及使用方法
CN109523989A (zh) 语音合成方法、语音合成装置、存储介质及电子设备
CN108255805A (zh) 舆情分析方法及装置、存储介质、电子设备
CN107492382A (zh) 基于神经网络的声纹信息提取方法及装置
CN109271493A (zh) 一种语言文本处理方法、装置和存储介质
CN110364171A (zh) 一种语音识别方法、语音识别系统及存储介质
CN107103903A (zh) 基于人工智能的声学模型训练方法、装置及存储介质
Peng et al. A Study on Fine-Tuning wav2vec2. 0 Model for the Task of Mispronunciation Detection and Diagnosis.
CN110348535A (zh) 一种视觉问答模型训练方法及装置
CN106156003A (zh) 一种问答系统中的问句理解方法
CN107577662A (zh) 面向中文文本的语义理解系统及方法
CN109887484A (zh) 一种基于对偶学习的语音识别与语音合成方法及装置
CN110427625A (zh) 语句补全方法、装置、介质及对话处理系统
CN106297773A (zh) 一种神经网络声学模型训练方法
CN105723362A (zh) 自然表达处理方法、处理及回应方法、设备及系统
CN107679225B (zh) 一种基于关键词的回复生成方法
CN107526720A (zh) 意思生成方法、意思生成装置以及程序
CN105261358A (zh) 用于语音识别的n元文法模型构造方法及语音识别系统
CN109800307A (zh) 产品评价的分析方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181009