CN106919560A - 一种语音翻译系统 - Google Patents

一种语音翻译系统 Download PDF

Info

Publication number
CN106919560A
CN106919560A CN201710085367.1A CN201710085367A CN106919560A CN 106919560 A CN106919560 A CN 106919560A CN 201710085367 A CN201710085367 A CN 201710085367A CN 106919560 A CN106919560 A CN 106919560A
Authority
CN
China
Prior art keywords
module
translation
text
processing module
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710085367.1A
Other languages
English (en)
Inventor
吴双竞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Golden Cat Digital Technology Co Ltd
Original Assignee
Anhui Golden Cat Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Golden Cat Digital Technology Co Ltd filed Critical Anhui Golden Cat Digital Technology Co Ltd
Priority to CN201710085367.1A priority Critical patent/CN106919560A/zh
Publication of CN106919560A publication Critical patent/CN106919560A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/005Language recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种语音翻译系统,通过讯飞语音平台和文本翻译的巧妙结合,实现了语音到语音的在线实时翻译,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块、语音播放模块;语音接收模块负责接收语音,首端处理模块负责初步处理并调用讯飞接口将语音转化为文字,文本翻译模块将文字信息翻译为目标语言的文字信息,尾端处理模块负责调用讯飞接口将文本信息转换为语音信息,语音播放模块负责将翻译后的语音播放出来。本发明不需要人工介入,可以实时在线完成翻译。

Description

一种语音翻译系统
技术领域
本发明涉及计算机技术领域,特别是涉及一种语音翻译系统。
背景技术
语言和文字是人类交流的主要手段和最重要的工具。语言的障碍一直是人们交流中的最大困难。快速准确的将一种自然语言转换为另一种自然语言一直是人类的梦想。但是因为人工翻译需要深厚的语言功底和丰富的专业知识,培养一个专业的翻译人员需要经过多年的训练。随着世界各地联系的增加,需要翻译的内容爆炸性增长,单纯的人工翻译已经无法满足社会的需要。为了满足沟通和交流的需要,人类不断寻找代替和辅助人工翻译的方法,在计算机出现之前就已经有了使用机器装置来代替人类进行翻译工作的设想。自计算机诞生之日起,机器翻译也随之发展起来。经过几十年的发展,机器翻译无论是理论还是技术都取得了巨大的进步,但是不可否认现有的机器翻译系统的译文质量仍然无法满足实用的需要。
机器翻译给出的译文和实用的译文中间还有很大一段差距,很少有人直接采用机器翻译的结果,而主要是把机器翻译的译文作为一种参考,再通过人工修改获得满意的译文。对输入机器翻译系统的原文进行译前处理,可以使机器翻译质量有所提高,但是这样一来又需要培养熟悉机器翻译工作原理的翻译人员。作为人工智能技术的一个分支,在有真正意义上的自主思考的人工智能出现前,单纯的机器翻译已经很难做出突破性的进展。翻译记忆技术是计算机辅助翻译技术之一,其工作原理为:用户利用已有的原文和译文,建立起一个或多个翻译记忆库,在翻译过程中,系统将自动搜索翻译记忆库中相同或相似的翻译资源(如句子、段落),给出参考译文,使用户避免无谓的重复劳动,只需专注于新内容的翻译。翻译记忆库同时在后台不断学习和自动储存新的翻译译文,,扩大记忆量。应用翻译记忆软件可以有效地提高翻译人员的工作效率和译文质量。
网上现有的在线翻译服务网站往往缺乏高质量的专业翻译引擎的支持,译文质量低下,使得大众对在线翻译甚至机器翻译技术产生误解。
发明内容
本发明的目的是提供一种语音翻译系统,实现在线的语音到语音翻译。
本发明的目的可以通过以下技术方案实现:
一种语音翻译系统,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块和语音播放模块;
所述的语音接收模块,用于接收语音,并进行初步的降噪处理,然后将处理后的语音数据交给首端处理模块;
所述的首端处理模块,将从语音接收模块得到的语音数据进一步处理并转成指定格式,通过调用讯飞语音转文本接口,将语音信息转换成文本信息,并将得到的文本信息传送给文本翻译模块;
所述的文本翻译模块,将从首端处理模块获取的文本信息翻译成目标语言的文本信息,并将翻译后的文本信息交给尾端处理模块;
所述的尾端处理模块,从文本翻译模块获取翻译后的文本,然后通过调用讯飞文本转语音接口,将文本信息转为语音信息,然后将语音数据处理并格式化成指定格式后送给语音播放模块;
所述的语音播放模块,其特征在于将从尾端处理模块获取的语音数据播放出来。
本发明的有益效果:
本发明所提供的一种语音翻译系统,通过讯飞语音平台和文本翻译的巧妙结合,实现了语音到语音的在线实时翻译,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块、语音播放模块;语音接收模块负责接收语音,首端处理模块负责初步处理并调用讯飞接口将语音转化为文字,文本翻译模块将文字信息翻译为目标语言的文字信息,尾端处理模块负责调用讯飞接口将文本信息转换为语音信息,语音播放模块负责将翻译后的语音播放出来。本发明不需要人工介入,可以实时在线完成翻译。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明的示意图;
具体实施方式
本发明的核心是提供一种语音翻译系统。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种语音翻译系统,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块和语音播放模块。
所述的语音接收模块,其特征在于用于接收语音,并进行初步的降噪处理,然后将处理后的语音数据交给首端处理模块。
所述的首端处理模块,其特征在于将从语音接收模块得到的语音数据进一步处理并转成指定格式,通过调用讯飞语音转文本接口,将语音信息转换成文本信息,并将得到的文本信息传送给文本翻译模块。
所述的文本翻译模块,其特征在于将从首端处理模块获取的文本信息翻译成目标语言的文本信息,并将翻译后的文本信息交给尾端处理模块。
所述的尾端处理模块,其特征在于从文本翻译模块获取翻译后的文本,然后通过调用讯飞文本转语音接口,将文本信息转为语音信息,然后将语音数据处理并格式化成指定格式后送给语音播放模块。
所述的语音播放模块,其特征在于将从尾端处理模块获取的语音数据播放出来。
本发明所提供的一种语音翻译系统,通过讯飞语音平台和文本翻译的巧妙结合,实现了语音到语音的在线实时翻译,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块、语音播放模块;语音接收模块负责接收语音,首端处理模块负责初步处理并调用讯飞接口将语音转化为文字,文本翻译模块将文字信息翻译为目标语言的文字信息,尾端处理模块负责调用讯飞接口将文本信息转换为语音信息,语音播放模块负责将翻译后的语音播放出来。本发明不需要人工介入,可以实时在线完成翻译。
为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然,在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。
以上所描述的装置实施方式仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施方式方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上内容仅仅是对本发明结构所作的举例和说明,所属本技术领域的技术人员对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (1)

1.一种语音翻译系统,其特征在于,包括语音接收模块、首端处理模块、文本翻译模块、尾端处理模块和语音播放模块;
所述的语音接收模块,用于接收语音,并进行初步的降噪处理,然后将处理后的语音数据交给首端处理模块;
所述的首端处理模块,将从语音接收模块得到的语音数据进一步处理并转成指定格式,通过调用讯飞语音转文本接口,将语音信息转换成文本信息,并将得到的文本信息传送给文本翻译模块;
所述的文本翻译模块,将从首端处理模块获取的文本信息翻译成目标语言的文本信息,并将翻译后的文本信息交给尾端处理模块;
所述的尾端处理模块,从文本翻译模块获取翻译后的文本,然后通过调用讯飞文本转语音接口,将文本信息转为语音信息,然后将语音数据处理并格式化成指定格式后送给语音播放模块;
所述的语音播放模块,其特征在于将从尾端处理模块获取的语音数据播放出来。
CN201710085367.1A 2017-02-17 2017-02-17 一种语音翻译系统 Pending CN106919560A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710085367.1A CN106919560A (zh) 2017-02-17 2017-02-17 一种语音翻译系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710085367.1A CN106919560A (zh) 2017-02-17 2017-02-17 一种语音翻译系统

Publications (1)

Publication Number Publication Date
CN106919560A true CN106919560A (zh) 2017-07-04

Family

ID=59454164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710085367.1A Pending CN106919560A (zh) 2017-02-17 2017-02-17 一种语音翻译系统

Country Status (1)

Country Link
CN (1) CN106919560A (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176965A (zh) * 2011-12-21 2013-06-26 上海博路信息技术有限公司 一种基于语音识别的翻译辅助系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103176965A (zh) * 2011-12-21 2013-06-26 上海博路信息技术有限公司 一种基于语音识别的翻译辅助系统

Similar Documents

Publication Publication Date Title
KR102484967B1 (ko) 음성 전환 방법, 장치 및 전자 기기
CN106328126B (zh) 远场语音识别处理方法及装置
US11769482B2 (en) Method and apparatus of synthesizing speech, method and apparatus of training speech synthesis model, electronic device, and storage medium
CN106486125A (zh) 一种基于语音识别技术的同声传译系统
US20230039789A1 (en) Method and apparatus for processing virtual video livestreaming, storage medium and electronic device
CN104252861A (zh) 视频语音转换方法、装置和服务器
CN110543645A (zh) 机器学习模型训练方法、介质、装置和计算设备
CN110705317B (zh) 翻译方法及相关装置
CN108491421A (zh) 一种生成问答的方法、装置、设备和计算存储介质
CN105551493A (zh) 儿童语音机器人数据处理方法、装置及儿童语音机器人
WO2021223618A1 (zh) 基于focalgan的短文本自动生成方法、装置、设备及存储介质
CN102629936A (zh) 一种移动终端处理文本的方法、相关设备及系统
CN106332394A (zh) 一种灯光随特定音乐互动的方法及系统
CN106412032A (zh) 一种远程音频文字转换传输方法及系统
CN105573994B (zh) 基于句法骨架的统计机器翻译系统
CN110032355A (zh) 语音播放方法、装置、终端设备及计算机存储介质
CN106570565A (zh) 一种面向大数据的深度学习方法及系统
KR20190005103A (ko) 전자기기의 웨이크업 방법, 장치, 디바이스 및 컴퓨터 가독 기억매체
KR101426214B1 (ko) 텍스트 대 스피치 변환을 위한 방법 및 시스템
CN101763756A (zh) 基于网络的交互式智能外语听写训练系统和方法
CN109782997A (zh) 一种数据处理方法、装置及存储介质
JP7375089B2 (ja) 音声応答速度確定方法、装置、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラム
CN111191472A (zh) 一种教学辅助翻译学习系统和方法
CN205451551U (zh) 一种语音识别驱动的增强现实人机交互视频语言学习系统
CN110534114A (zh) 一种在网页上翻译语音文件时先识别再翻译的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170704