CN108899018A - 自动翻译装置及方法 - Google Patents
自动翻译装置及方法 Download PDFInfo
- Publication number
- CN108899018A CN108899018A CN201810432318.5A CN201810432318A CN108899018A CN 108899018 A CN108899018 A CN 108899018A CN 201810432318 A CN201810432318 A CN 201810432318A CN 108899018 A CN108899018 A CN 108899018A
- Authority
- CN
- China
- Prior art keywords
- voice messaging
- voice
- languages
- sound pick
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 81
- 238000000034 method Methods 0.000 title claims abstract description 18
- 230000000712 assembly Effects 0.000 claims abstract description 27
- 238000000429 assembly Methods 0.000 claims abstract description 27
- 230000003321 amplification Effects 0.000 claims description 60
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 60
- 238000006243 chemical reaction Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 24
- 238000001514 detection method Methods 0.000 claims description 9
- 230000002618 waking effect Effects 0.000 claims description 3
- 230000006870 function Effects 0.000 abstract description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000009434 installation Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Machine Translation (AREA)
Abstract
本发明涉及一种自动翻译装置及方法,所述装置包括拾音器组件、控制器组件以及主处理器组件,拾音器组件包括用于采集第一语音信息的第一拾音器和用于采集第二语音信息的第二拾音器,控制器组件用于接收并比较第一语音信息和第二语音信息的语音幅值大小,并控制语音幅值较大的一路语音信息输出;主处理器组件与拾音器组件连接以接收语音信息,并将该语音信息在对应第一语音信息的第一语种和对应第二语音信息的第二语种之间相互翻译生成翻译信息。本发明实施例通过比较第一语音信息和第二语音信息以区分是哪一方在讲话,实现语种自动识别和自动翻译功能,省去人工设置和按键翻译的操作,提高用户体验。
Description
技术领域
本发明涉及翻译机技术领域,特别涉及一种自动翻译装置及方法。
背景技术
随着国际贸易以及地球村的发展,跨国之间或者跨语言之间的交流也日益频繁,当交流的双方不懂彼此之间的语言时,往往需要借助翻译机来进行交流,但是,现在市面上的智能翻译机需要先通过按键来设置翻译语种,并且由于语音识别比较难识别混合语种,故需按住各自一方的翻译键来讲话并启动对应的语种翻译功能,因此当两人交谈时需要两人轮流伸手按住各自一方的翻译键讲话,翻译键可能在主机上也可能在耳机或其它可穿戴设备上,在沟通交流时需要不断的进行按键操作,这个操作很不人性化,用户体验较差。
发明内容
本发明要解决的技术问题在于针对上述现有技术中的不足之处,提供一种自动翻译装置及方法。
本发明解决技术问题采用的技术手段是提供一种自动翻译装置,包括:
拾音器组件,包括反向安装的第一拾音器和第二拾音器,所述第一拾音器用于采集第一语音信息,所述第二拾音器用于采集第二语音信息;
控制器组件,与所述第一拾音器和第二拾音器连接,用于接收并比较所述第一语音信息和第二语音信息的语音幅值大小,并控制所述拾音器组件输出语音幅值较大的一路语音信息;
主处理器组件,与所述拾音器组件连接,用于接收所述拾音器组件输出的所述语音幅值较大的一路语音信息,并根据预确定的第一语种和第二语种,对所述语音幅值较大的一路语音信息进行翻译,生成翻译信息,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
进一步地,还包括:
翻译输出组件,与所述主处理器组件连接,用于输出所述翻译信息,所述翻译信息至少包括翻译语音信息以及翻译文字信息中的一种。
进一步地,所述第一拾音器和第二拾音器采用单指向性拾音器。
进一步地,所述拾音器组件还包括第一放大滤波单元以及第二放大滤波单元,所述第一放大滤波单元连接至所述第一拾音器的输出端,用于接收所述第一语音信息并经过放大滤波处理后进行输出;所述第二放大滤波单元连接至所述第二拾音器的输出端,用于接收所述第二语音信息并经过放大滤波处理后进行输出。
进一步地,还包括:
模数转换组件,与所述第一放大滤波单元和第二放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息和第二语音信息,并分别将所述第一语音信息和第二语音信息转换为第一数字语音信号和第二数字语音信号;所述模数转换组件还与所述控制器组件和主处理器组件连接,用于接收并根据所述控制器组件输出的控制信号输出所述第一数字语音信号或第二数字语音信号至所述主处理器组件。
进一步地,所述模数转换组件包括第一模数转换单元和第二模数转换单元,所述第一模数转换单元与所述第一放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息并转换为第一数字语音信号;所述第二模数转换单元与所述第二放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第二语音信息并转换为第二数字语音信号。
进一步地,所述控制器组件包括比较单元以及与所述比较单元连接的控制单元,所述比较单元与所述第一放大滤波单元和第二放大滤波单元连接,用于比较所述第一语音信息和第二语音信息的语音幅值大小并输出比较信号;所述控制单元与所述第一模数转换单元和第二模数转换单元连接,用于根据所述比较信号控制所述第一模数转换单元和第二模式转换单元中语音幅值较大的输出数字语音信号至所述主处理器组件。
另一方面,本发明还提供一种自动翻译方法,应用于如上述的自动翻译装置中,包括:
获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息;
判断所述第一语音信息的语音幅值是否大于所述第二语音信息的语音幅值;
若是,则将所述第一语音信息由第一语种翻译为第二语种生成第一翻译信息,否则将所述第二语音信息由第二语种翻译为第一语种生成第二翻译信息,其中,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
进一步地,所述获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息的步骤之前,包括:
获取第一用户输入的第一唤醒语音信息以及第二用户输入的第二唤醒语音信息;
根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种。
进一步地,所述根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种的步骤,包括:
判断所述第一唤醒语音信息和第二唤醒语音信息的语音幅值是否大于预设静音检测门限值;
若是,则获取所述第一唤醒语音信息中的第一语种唤醒词和第二唤醒语音信息中的第二语种唤醒词;
根据所述预设语音库获取与所述第一唤醒词匹配的第一语种以及与所述第二唤醒词匹配的第二语种。
采用上述技术方案,本发明至少具有以下有益效果:本发明实施例通过拾音器组件设有反向安装的第一拾音器和第二拾音器,从而分别采集第一语音信息和第二语音信息,当第一用户正对第一拾音器而第二用户正对第二拾音器进行讲话时,所述第一拾音器采集到的第一用户的声音信号的语音幅值会大于第二拾音器采集的第一用户的声音信号的语音幅值,同理,所述第二拾音器采集到的第二用户的声音信号的语音幅值会大于第一拾音器采集的第二用户的声音信号的语音幅值,控制器组件通过判断第一语音信息和第二语音信息的语音幅值大小,从而确定正在讲话的是第一用户还是第二用户,若是第一用户正在讲话,则所述第一语音信息的语音幅值大于第二语音信息的语音幅值,此时,控制器组件控制拾音器组件将第一语音信息发送至主处理器组件,所述主处理器组件接收所述第一语音信息并将该第一语音信息由第一语种翻译成第二语种生成翻译信息;若是第二用户正在讲话,则所述第二语音信息的语音幅值大于第一语音信息的语音幅值,此时控制器组件控制拾音器组件将第二语音信息发送至主处理器组件,所述主处理器组件接收所述第二语音信息并将该第二语音信息由第二语种翻译成第一语种生成翻译信息,其中第一语种和第二语种分别对应第一语音信息和第二语音信息,通过根据两路拾音器接收的声音大小自动进行翻译,减少了人工设置的步骤,提高用户体验。
附图说明
图1是本发明自动翻译装置一个实施例的结构示意图。
图2是本发明自动翻译装置另一个实施例结构示意图。
图3是本发明自动翻译装置一个实施例的电路结构示意图。
图4是本发明自动翻译装置另一个实施例的电路结构示意图。
图5是本发明自动翻译装置一个实施例的软件工作流程示意图。
图6是本发明自动翻译方法一个实施例的流程方框示意图。
图7是本发明自动翻译方法另一个实施例的流程方框示意图。
图8是本发明自动翻译方法一个实施例步骤S5的具体流程方框示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1至图5,本发明提供一种技术方案:一种自动翻译装置,包括:
拾音器组件1,包括反向安装的第一拾音器11和第二拾音器12,所述第一拾音器11用于采集第一语音信息,所述第二拾音器12用于采集第二语音信息;
控制器组件2,与所述第一拾音器11和第二拾音器连接12,用于接收并比较所述第一语音信息和第二语音信息的语音幅值大小,并控制所述拾音器组件1输出语音幅值较大的一路语音信息;
主处理器组件3,与所述拾音器组件1连接,用于接收所述拾音器组件1输出的所述语音幅值较大的一路语音信息,并根据预确定的第一语种和第二语种,对所述语音幅值较大的一路语音信息进行翻译,生成翻译信息,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
在一个实施例中,以用户包括第一用户和第二用户为例,所述第一语种和第二语种分别对应第一用户和第二用户的语言,在进行对话之前,第一用户和第二用户可以分别输入自己的语种,当然,在进行沟通交流之前,第一用户和第二用户还可以分别正对第一拾音器11和第二拾音器12讲出对应自己语种的语种唤醒词,本发明自动翻译装置可以通过预设的离线语音库,分别识别到对应第一拾音器11的第一语种以及对应第二拾音器12的第二语种,从而预确定出第一语种和第二语种。具体地,以第一用户的第一语种为汉语而第二用户的第二语种为英语为例,所述第一拾音器11和第二拾音器12彼此反向安装,从而使得在不同方向上所述第一拾音器11和第二拾音器12采集到的声音信号的语音幅值不同,所述第一用户正对所述第一拾音器11,所述第二用户正对所述第二拾音器12。
当所述第一用户进行讲话时,所述第一拾音器11和第二拾音器12均会采集到所述第一用户的声音信号,所述第一拾音器11采集到的声音信号为第一语音信息,所述第二拾音器12采集到的声音信号为第二语音信息,而由于第一用户正对所述第一拾音器11,使得所述第一拾音器11采集到的第一语音信息的语音幅值大于所述第二拾音器12采集到的第二语音信息的语音幅值,控制器组件2对所述第一语音信息的语音幅值和第二语音信息的语音幅值进行比较,并将语音幅值较大的第一语音信息发送至主处理器组件,主处理器组件接收第一拾音器11发送的所述第一语音信息,从而将所述第一语音信息由汉语翻译成英语生成翻译信息。
同理,当所述第二用户进行讲话时,所述第一拾音器11和第二拾音器12均会采集到所述第二用户的声音信号,所述第一拾音器11采集到的声音信号为第一语音信息,所述第二拾音器12采集到的声音信号为第二语音信息,而由于第二用户正对所述第二拾音器12,使得所述第一拾音器11采集到的第一语音信息的语音幅值小于所述第二拾音器12采集到的第二语音信息的语音幅值,控制器组件2对所述第一语音信息的语音幅值和第二语音信息的语音幅值进行比较,并将语音幅值较大的第二语音信息发送至主处理器组件,主处理器组件接收第二拾音器11发送的所述第二语音信息,从而将所述第二语音信息由英语翻译成汉语生成翻译信息,在第一用户和第二用户进行对话交流时,能自动识别用户的语种以及需要翻译的语种并进行翻译,不需要第一用户和第二用户轮流伸手按住各自一方的翻译键进行讲话,减少用户的操作,提高用户体验。
本实施例通过拾音器组件1设有反向安装的第一拾音器11和第二拾音器12,从而分别采集第一语音信息和第二语音信息,当第一用户正对第一拾音器11而第二用户正对第二拾音器12进行讲话时,所述第一拾音器11采集到的第一用户的声音信号的语音幅值会大于第二拾音器12采集的第一用户的声音信号的语音幅值,同理,所述第二拾音器12采集到的第二用户的声音信号的语音幅值会大于第一拾音器11采集的第二用户的声音信号的语音幅值,控制器组件2通过判断第一语音信息和第二语音信息的语音幅值大小,从而确定正在讲话的是第一用户还是第二用户,若是第一用户正在讲话,则所述第一语音信息的语音幅值大于第二语音信息的语音幅值,此时,控制器组件2控制拾音器组件1将第一语音信息发送至主处理器组件3,所述主处理器组件3接收所述第一语音信息并将该第一语音信息由第一语种翻译成第二语种生成翻译信息;若是第二用户正在讲话,则所述第二语音信息的语音幅值大于第一语音信息的语音幅值,此时控制器组件2控制拾音器组件1将第二语音信息发送至主处理器组件3,所述主处理器组件3接收所述第二语音信息并将该第二语音信息由第二语种翻译成第一语种生成翻译信息,其中第一语种和第二语种分别对应第一语音信息和第二语音信息,通过根据两路拾音器接收的声音大小自动进行翻译,减少了人工设置的步骤,提高用户体验。
在一个可选实施例中,本发明自动翻译装置还包括:
翻译输出组件4,所述翻译输出组件4与所述主处理器组件3连接,用于输出所述翻译信息,所述翻译信息至少包括翻译语音信息以及翻译文字信息中的一种。
在实施时,所述翻译输出组件4包括扬声器,通过扬声器播放所述翻译语音信息,以第一用户的第一语种为日语而第二用户的第二语种为马来语为例,第一用户正对第一拾音器11进行讲话时,控制器组件2控制拾音器组件1输出第一语音信息至主处理器组件3,主处理器组件3将第一语音信息由日语翻译成马来语生成翻译信息,最后通过扬声器播放翻译信息中的翻译语音信息,第二用户正对第二拾音器12进行讲话时,控制器组件2控制拾音器组件1输出第二语音信息至主处理器组件3,主处理器组件3将第二语音信息由马来语翻译成日语生成翻译信息,最后通过扬声器播放翻译信息中的翻译语音信息,第二用户即可与第一用户进行沟通交流。
当然,所述翻译输出组件4还可以设计有显示屏,显示屏能显示所述翻译文字信息,当所述扬声器出现故障而不工作时,第一用户和第二用户还可以通过显示屏进行沟通交流,提高用户体验。
在一个可选实施例中,所述第一拾音器11和第二拾音器12采用单指向性拾音器。
拾音器又称监听头,监听拾音器是用来采集现场环境声音再传送到后端设备的一个器件,它是由咪头(麦克风)和音频放大电路构成。拾音器一般分为数字拾音器和模拟拾音器,数字拾音器就是通过数字信号处理系统将模拟的音频信号转换成数字信号并进行相应的数字信号处理的声音传感设备。
在实施时,所述第一拾音器11和第二拾音器12均采用单指向性拾音器,且所述第一拾音器11和第二拾音器12彼此反向安装,在单指向性拾音器正对方向的灵敏度最高,而单指向性拾音器后背方向的灵敏度最低,具体地,单指向性拾音器接收到的正对着的声音信号要大于背对着单指向性拾音器的声音信号,以第一用户正对第一拾音器11而第二用户正对第二拾音器11为例,此时,第一用户背对第二拾音器12而第二用户背对第一拾音器11,若第一用户讲话,所述第一拾音器11和第二拾音器12均能接收到第一用户的声音信息,但是第一拾音器11接收到第一用户的声音信息的语音幅值要大于第二拾音器接收到第一用户的声音信息的语音幅值,控制器组件2对第一拾音器11采集的第一语音信息和第二拾音器12采集的第二语音信息的语音幅值进行比较,从而控制语音幅值较大的一路拾音器输出语音信息至主处理器组件3,主处理器组件判断该语音信息是从那一路拾音器发出的,从而确定该语音信息对应的语种以及需要翻译的语种,进而能实现自动识别语种并进行自动翻译功能,节省用户的操作流程,方便用户使用。
在一个可选实施例中,所述拾音器组件1还包括第一放大滤波单元13以及第二放大滤波单元14,所述第一放大滤波单元13连接至所述第一拾音器11的输出端,用于接收所述第一语音信息,并将所述第一语音信息经过放大滤波处理后进行输出;所述第二放大滤波单元14连接至所述第二拾音器12的输出端,用于接收所述第二语音信息,并将所述第二语音信息经过放大滤波处理后进行输出。
本实施例通过设有第一放大滤波单元13和第二放大滤波单元14,以分别对第一拾音器11和第二拾音器12采集的第一语音信息和第二语音信息进行放大滤波处理,最后在控制器组件2的控制下输出至主处理器组件3,具体地,当第二用户讲话时,所述第二拾音器12采集到的第二语音信息的语音幅值大于第一拾音器11采集的第一语音信息的语音幅值,控制器组件2经过比较所述第一语音信息和第二语音信息的语音幅值后,控制拾音器组件1输出第二语音信息至主处理器组件3进行翻译生成翻译信息,最后由翻译输出组件4进行播放,实现语种自动识别和翻译功能,而且语音信息经过放大滤波处理后能有效去除语音信息中的杂音以及干扰信息,提高语音识别以及语种识别的准确度。
在一个可选实施例中,本发明自动翻译装置还包括:
模数转换组件5,与所述第一放大滤波单元13和第二放大滤波单元14连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息和第二语音信息,并分别将所述第一语音信息和第二语音信息转换为第一数字语音信号和第二数字语音信号;所述模数转换组件4还与所述控制器组件2和主处理器组件3连接,用于接收并根据所述控制器组件2输出的控制信号输出所述第一数字语音信号或第二数字语音信号至所述主处理器组件3。
在实施时,拾音器通过一般的模拟电路放大麦克风采集到的声音,然后通过模数转换组件5进行模数转换后输出至主处理器3进行翻译,能有效提高识别语音信息的准确度,提高产品质量。
在一个实施例中,所述模数转换组件5包括第一模数转换单元51和第二模数转换单元52,所述第一模数转换单元51与所述第一放大滤波单元13连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息,并将所述第一语音信息转换为第一数字语音信号;所述第二模数转换单元52与所述第二放大滤波单元14连接,用于接收经过放大滤波处理后进行输出的所述第二语音信息,并将所述第二语音信息转换为第二数字语音信号。
具体地,所述第一模数转换单元51与第一放大滤波单元13和控制器组件2连接,所述第二模数转换单元52与第二放大滤波单元14和主控制器组件2连接,控制器组件2接收到第一语音信息和第二语音信息后,对第一语音信息和第二语音信息进行语音幅值比较,判断哪一路语音信息的语音幅值信号较大,然后控制模数转换组件5输出经过模数转换后的语音幅值较大的一路语音信息至主处理器组件3,最后由主处理器组件3进行翻译生成翻译信息。
具体地,当第一用户正对第一拾音器11讲话时,第一拾音器11采集的第一语音信息要比第二拾音器12采集的第二语音信息的语音信号大很多,第一语音信息经过第一放大滤波处理单元13进行放大滤波处理,然后发送至第一模数转换单元51将经过放大滤波处理后的第一语音信息转换为第一数字语音信息,而第二语音信息经过第二放大滤波处理单元14进行放大滤波处理,然后发送至第二模数转换单元52将经过放大滤波处理后第二语音信息转换为第二数字语音信息,同时,放大滤波后的语音信息通过控制器组件2进行语音幅值比较,判断第一语音信息和第二语音信息中那一路语音信息的信号较大,从而确定那一路的数字语音信息的信号较大,然后控制信号较大的一路数字语音信息输出至主处理器组件3,主处理器组件3根据输出该数字语音信息的模数转换单元,即可知道该数字语音信息对应的语种以及需要进行翻译的语种;以第一用户对应的语种为X而第二用户对应的语种为Y为例,用户可以操作装置中对应的APP应用对应选择第一拾音器11对应语种X而第二拾音器12对应语种Y,系统自动将此次翻译的语种设为X与Y互译,由于第一用户正对第一拾音器11,所以当第一用户讲话时,第一语音信息会被发送至主处理器组件3,主处理器组件3即可将第一语音信息由X翻译为Y,同理,当第二用户讲话时,主处理器组件3即可将第二语音信息由Y翻译为X,能自动识别用户的语种并自动进行翻译。
当然,以第一用户对应的语种为X而第二用户对应的语种为Y为例,第一用户正对第一拾音器11讲出第一语种唤醒词而第二用户正对第二拾音器12讲出第二语种唤醒词,主处理器组件3即可根据所述第一语种唤醒词和第二语种唤醒词确定第一用户对应语种X而第二用户对应语种Y,系统自动将此次翻译的语种设为X与Y互译,由于第一用户正对第一拾音器11,所以当第一用户讲话时,第一语音信息会被发送至主处理器组件3,主处理器组件3即可将第一语音信息由X翻译为Y,同理,当第二用户讲话时,主处理器组件3即可将第二语音信息由Y翻译为X,能自动识别用户的语种并自动进行翻译。
在一个可选实施例中,所述控制器组件2包括比较单元21以及与所述比较单元21连接的控制单元22,所述比较单元21与所述第一放大滤波单元13和第二放大滤波单元14连接,用于比较所述第一语音信息和第二语音信息的语音幅值大小并输出比较信号至控制单元22;所述控制单元22与所述第一模数转换单元51和第二模数转换单元52连接,用于根据所述比较信号控制所述第一模数转换单元51和第二模数转换单元52中语音幅值较大的输出数字语音信号至所述主处理器组件3。
在实施时,当本发明自动翻译装置放置于第一用户和第二用户中间时,所述第一拾音器11和第二拾音器12分别正对第一用户和第二用户,第一用户正对第一拾音器11讲出对应第一语种的语种唤醒词,第一拾音器11和第二拾音器12均会接收到该语种唤醒词,但是由于第一拾音器11采集到的第一语音信息的信号较大,从而确定第一拾音器11对应的是第一语种,同理,第二用户正对第二拾音器12讲出对应第二语种的语种唤醒词,第一拾音器11和第二拾音器12均会接收到该语音唤醒词,但是由于第二拾音器12采集到的第二语音信息的信号较大,从而确定第二拾音器12对应的是第二语种。
在具体实施时,还可以通过在系统中设置静音检测门限,当检测到第一用户的第一语音信息的语音信号幅度超过静音检测门限时,如果系统识别到第一语音信息为第一语种的语种唤醒词,则判断此时信号较大的第一语音信息对应第一语种,同样地,当第二语音信息的语音信号幅度超过静音检测门限时,如果系统识别到第二语音信息为第二语种的语种唤醒词,则判断此时信号较大的第二语音信息对应第二语种,系统自动将此次翻译的语种设为第一语种和第二语种互译,并且将第一语音信息为第一语种翻译为第二语种,第二语音信息为第二语种翻译为第一语种,并自动启动对应的翻译功能。
当第一用户正对第一拾音器11讲话时,第一语音信息经过第一放大滤波处理单元13进行放大滤波后发送至第一模数转换单元51转换为第一数字语音信息,而第二语音信息经过第二放大滤波处理单元14进行放大滤波后发送至第二模数转换单元52转换为第二数字语音信息,同时,第一放大滤波单元13和第二放大滤波单元14与比较单元21连接,比较单元21接收经过放大滤波处理后的第一语音信息和第二语音信息并进行比较,判断哪一方的信号较大,并通过控制单元22控制信号较大的一方的数字语音信息传输给主处理器组件3进行处理。
在具体实施时,当翻译输出时,主处理器组件3还可以输出信号至控制单元22以通过控制单元22控制模数转换组件5停止转换,使讲话与翻译输出为半双工状态,避免相互影响。
在另一个可选实施例中,所述模数转换组件5还可以设计成只有第一模数转换单元51,所述第一模数转换单元51与控制单元22以及主处理器组件3连接,控制单元22与第一放大滤波单元13和第二放大滤波单元14连接,第一语音信息和第二语音信息经过放大滤波和幅度比较后,控制单元22控制第一放大滤波单元13和第二放大滤波单元14中语音信息幅度较大的一路语音信息传输给第一模数转换单元51进行模数转换,同时控制单元22输出一高低电平信号至主处理器组件3,以通知主处理器组件3正在接收的是哪一方的语音信号,使得主处理器组件3可以确定该语音信号是第一语音信号还是第二语音信号,从而实现语种自动识别及翻译功能,降低成本投入。当然,主处理器组件3还可以输出信号至控制单元22,通过控制单元22控制第一模数转换单元51停止转换,使讲话与翻译输出为半双工状态,避免相互影响。
另一方面,如图6所示,本发明还提供一种自动翻译方法,应用于如上述的自动翻译装置中,包括:
步骤S1,获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息;
步骤S2,判断所述第一语音信息的语音幅值是否大于所述第二语音信息的语音幅值;
步骤S3,若是,则将所述第一语音信息由第一语种翻译为第二语种生成第一翻译信息,否则将所述第二语音信息由第二语种翻译为第一语种生成第二翻译信息,其中,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
在实施时,所述第一拾音器和第二拾音器采用单指向性拾音器并彼此反向安装,通过获取第一语音信息和第二语音信息,并判断第一语音信息的语音幅值是否大于第二语音信息的语音幅值,若是,则判断第一用户在讲话,由于第一用户对应第一语种而第二用户对应第二语种,则可以将第一语音信息由第一语种向第二语种进行翻译生成第一翻译信息,同理,若第一语音信息的语音幅值小于第二语音信息的语音幅值,则判断第二用户在讲话,将第二语音信息由第二语种向第一语种进行翻译生成第二翻译信息,实现第一语种和第二语种之间的互译功能,其中,第一语种和第二语音分别由第一用户和第二用户通过翻译机进行选择。
本实施例通过采用两路单指向性拾音器分别接收交谈双方的语音,由于一方讲话时,正对讲话者的拾音器输出的信号要大于另一个拾音器输出的信号,通过比较器比较很容易区分是哪一方在讲话,不易误动作,并仅将讲话一方的语音信息发送至主处理器组件进行翻译处理,单指向性拾音器还有助于降低周围噪声的影响,提高翻译准确度以及翻译输出效果,提高用户体验。
在一个实施例中,如图7所示,所述获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息的步骤之前,包括:
步骤S4,获取第一用户输入的第一唤醒语音信息以及第二用户输入的第二唤醒语音信息;
步骤S5,根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种。
在实施时,在正式进行对话交谈之前,用户可以通过讲出语种唤醒词来设置各自的语种,具体地,第一用户正对第一拾音器讲出对应第一语种的语种唤醒词,第一拾音器采集第一用户的第一唤醒语音信息,然后根据第一唤醒语音信息和预设语音库获取第一用户的第一语种,同理,第二用户正对第二拾音器讲出对应第二语种的语种唤醒词,第二拾音器采集第二用户的第二唤醒语音信息,然后根据第二唤醒语音信息和预设语音库获取第二用户的第二语种,即可进行接下来的沟通交谈步骤,从讲话双方的第一唤醒语音信息和第二唤醒语音信息中的语种唤醒词,即可自动判断讲话双方各自的语种以及需要翻译的语种,从而省去了人工设置各自语种和按键翻译的繁琐操作,提高用户体验。
在一个可选实施例中,如图8所示,所述根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种的步骤,包括:
步骤S51,判断所述第一唤醒语音信息和第二唤醒语音信息的语音幅值是否大于预设静音检测门限值;
步骤S52,若是,则获取所述第一唤醒语音信息中的第一语种唤醒词和第二唤醒语音信息中的第二语种唤醒词;
步骤S53,根据所述预设语音库获取与所述第一唤醒词匹配的第一语种以及与所述第二唤醒词匹配的第二语种。
在实施时,通过设置预设静音检测(VAD)门限值,当分别由第一拾音器和第二拾音器采集到的第一唤醒语音信息和第二唤醒语音信息的语音幅值超过预设静音检测门限值时,系统才会进行语种识别,另外,分别由第一拾音器和第二拾音器采集到的第一语音信息和第二语音信息的语音幅值超过预设静音检测门限值时,系统才会进行翻译功能,避免因用户的喘息声或者周围环境声音而造成的误操作,提高语音识别以及语种识别的准确度。
如图5所示,图5是本发明自动翻译装置的工作流程示意图,翻译机先启动进行初始化,此时第一用户讲第一语种的语音唤醒词,通过判断该语音唤醒词的语音幅度是否超过VAD门限,若是,则与预设语音库中的预设唤醒词进行对比,判断该语音唤醒词是否与第一语种的预设唤醒词匹配,若是,则判断第一用户对应第一语种并进行提示,如果该语音唤醒词的语音幅度没有超过VAD门限或者该语音唤醒词与预设语音库中的所有预设唤醒词均不匹配,则再次采集第一用户的第一语音信息并进行VAD门限和唤醒词匹配,直至确定第一用户对应的第一语种。
然后获取第二用户讲的第二语种的语音唤醒词,并判断该语音唤醒词的语音幅度是否超过VAD门限,若是,则与预设语音库中的预设唤醒词进行对比,判断该语音唤醒词是否与第二语种的预设唤醒词匹配,若是,则判断第二用户对应第二语种,如果该语音唤醒词的语音幅度没有超过VAD门限或者该语音唤醒词与预设语音库中的所有预设唤醒词均不匹配,则再次采集第二用户的第二语音信息并进行VAD门限和唤醒词匹配,直至确定第二用户对应的第二语种。
激活第一语种与第二语种的互译功能并进行提示,具体地,可以通过语音提示第一用户对应第一语种、第二用户对应第二语种,并语音提示进行第一语种和第二语种互译功能;然后开始第一用户的第一语音信息由第一语种翻译为第二语种,第二用户的第二语音信息由第二语种翻译为第一语种的自动翻译功能。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种自动翻译装置,其特征在于,包括:
拾音器组件,包括反向安装的第一拾音器和第二拾音器,所述第一拾音器用于采集第一语音信息,所述第二拾音器用于采集第二语音信息;
控制器组件,与所述第一拾音器和第二拾音器连接,用于接收并比较所述第一语音信息和第二语音信息的语音幅值大小,并控制所述拾音器组件输出语音幅值较大的一路语音信息;
主处理器组件,与所述拾音器组件连接,用于接收所述拾音器组件输出的所述语音幅值较大的一路语音信息,并根据预确定的第一语种和第二语种,对所述语音幅值较大的一路语音信息进行翻译,生成翻译信息,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
2.根据权利要求1所述的自动翻译装置,其特征在于,还包括:
翻译输出组件,与所述主处理器组件连接,用于输出所述翻译信息,所述翻译信息至少包括翻译语音信息以及翻译文字信息中的一种。
3.根据权利要求1所述的自动翻译装置,其特征在于:所述第一拾音器和第二拾音器采用单指向性拾音器。
4.根据权利要求1至3任一项所述的自动翻译装置,其特征在于:所述拾音器组件还包括第一放大滤波单元以及第二放大滤波单元,所述第一放大滤波单元连接至所述第一拾音器的输出端,用于接收所述第一语音信息并经过放大滤波处理后进行输出;所述第二放大滤波单元连接至所述第二拾音器的输出端,用于接收所述第二语音信息并经过放大滤波处理后进行输出。
5.根据权利要求4所述的自动翻译装置,其特征在于,还包括:
模数转换组件,与所述第一放大滤波单元和第二放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息和第二语音信息,并分别将所述第一语音信息和第二语音信息转换为第一数字语音信号和第二数字语音信号;所述模数转换组件还与所述控制器组件和主处理器组件连接,用于接收并根据所述控制器组件输出的控制信号输出所述第一数字语音信号或第二数字语音信号至所述主处理器组件。
6.根据权利要求5所述的自动翻译装置,其特征在于:所述模数转换组件包括第一模数转换单元和第二模数转换单元,所述第一模数转换单元与所述第一放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第一语音信息并转换为第一数字语音信号;所述第二模数转换单元与所述第二放大滤波单元连接,用于接收经过放大滤波处理后进行输出的所述第二语音信息并转换为第二数字语音信号。
7.根据权利要求6所述的自动翻译装置,其特征在于:所述控制器组件包括比较单元以及与所述比较单元连接的控制单元,所述比较单元与所述第一放大滤波单元和第二放大滤波单元连接,用于比较所述第一语音信息和第二语音信息的语音幅值大小并输出比较信号;所述控制单元与所述第一模数转换单元和第二模数转换单元连接,用于根据所述比较信号控制所述第一模数转换单元和第二模式转换单元中语音幅值较大的输出数字语音信号至所述主处理器组件。
8.一种自动翻译方法,应用于如权利要求1至7中任一项所述的自动翻译装置中,其特征在于,包括:
获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息;
判断所述第一语音信息的语音幅值是否大于所述第二语音信息的语音幅值;
若是,则将所述第一语音信息由第一语种翻译为第二语种生成第一翻译信息,否则将所述第二语音信息由第二语种翻译为第一语种生成第二翻译信息,其中,所述第一语种和第二语种分别对应第一语音信息和第二语音信息。
9.根据权利要求8所述的自动翻译方法,其特征在于,所述获取第一拾音器采集的第一语音信息以及第二拾音器采集的第二语音信息的步骤之前,包括:
获取第一用户输入的第一唤醒语音信息以及第二用户输入的第二唤醒语音信息;
根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种。
10.根据权利要求9所述的自动翻译方法,其特征在于,所述根据预设语音库获取对应所述第一唤醒语音信息的第一语种和对应所述第二唤醒语音信息的第二语种的步骤,包括:
判断所述第一唤醒语音信息和第二唤醒语音信息的语音幅值是否大于预设静音检测门限值;
若是,则获取所述第一唤醒语音信息中的第一语种唤醒词和第二唤醒语音信息中的第二语种唤醒词;
根据所述预设语音库获取与所述第一唤醒词匹配的第一语种以及与所述第二唤醒词匹配的第二语种。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810432318.5A CN108899018A (zh) | 2018-05-08 | 2018-05-08 | 自动翻译装置及方法 |
PCT/CN2019/073534 WO2019214299A1 (zh) | 2018-05-08 | 2019-01-28 | 自动翻译装置、方法及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810432318.5A CN108899018A (zh) | 2018-05-08 | 2018-05-08 | 自动翻译装置及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108899018A true CN108899018A (zh) | 2018-11-27 |
Family
ID=64343828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810432318.5A Pending CN108899018A (zh) | 2018-05-08 | 2018-05-08 | 自动翻译装置及方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108899018A (zh) |
WO (1) | WO2019214299A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019214299A1 (zh) * | 2018-05-08 | 2019-11-14 | 深圳市沃特沃德股份有限公司 | 自动翻译装置、方法及计算机设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10116093A (ja) * | 1996-10-09 | 1998-05-06 | Nec Corp | 音声認識装置 |
CN202772966U (zh) * | 2012-09-03 | 2013-03-06 | 上海三旗通信科技股份有限公司 | 全球无障碍交流手机 |
CN103970734A (zh) * | 2014-05-21 | 2014-08-06 | 刘业兴 | 一种交互式多语种自动翻译终端及其实现方法 |
CN105825853A (zh) * | 2015-01-07 | 2016-08-03 | 中兴通讯股份有限公司 | 语音识别设备语音切换方法及装置 |
CN107247711A (zh) * | 2017-06-28 | 2017-10-13 | 努比亚技术有限公司 | 一种双向翻译方法、移动终端以及计算机可读存储介质 |
CN107766333A (zh) * | 2016-08-22 | 2018-03-06 | 万德洪 | 一种智能翻译设备、系统及方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2965136B1 (fr) * | 2010-09-21 | 2012-09-21 | Joel Pedre | Traducteur verbal integre a ërception d'interlocuteur integree |
CN205121555U (zh) * | 2015-07-06 | 2016-03-30 | 北京市振隆科技股份有限公司 | 交互式多语种自动翻译终端 |
CN106131292B (zh) * | 2016-06-03 | 2020-06-30 | 浙江云澎科技有限公司 | 设置终端唤醒的方法、唤醒方法及对应的系统 |
CN106486125A (zh) * | 2016-09-29 | 2017-03-08 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的同声传译系统 |
CN106940997B (zh) * | 2017-03-20 | 2020-04-28 | 海信集团有限公司 | 一种向语音识别系统发送语音信号的方法和装置 |
CN108899018A (zh) * | 2018-05-08 | 2018-11-27 | 深圳市沃特沃德股份有限公司 | 自动翻译装置及方法 |
-
2018
- 2018-05-08 CN CN201810432318.5A patent/CN108899018A/zh active Pending
-
2019
- 2019-01-28 WO PCT/CN2019/073534 patent/WO2019214299A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10116093A (ja) * | 1996-10-09 | 1998-05-06 | Nec Corp | 音声認識装置 |
CN202772966U (zh) * | 2012-09-03 | 2013-03-06 | 上海三旗通信科技股份有限公司 | 全球无障碍交流手机 |
CN103970734A (zh) * | 2014-05-21 | 2014-08-06 | 刘业兴 | 一种交互式多语种自动翻译终端及其实现方法 |
CN105825853A (zh) * | 2015-01-07 | 2016-08-03 | 中兴通讯股份有限公司 | 语音识别设备语音切换方法及装置 |
CN107766333A (zh) * | 2016-08-22 | 2018-03-06 | 万德洪 | 一种智能翻译设备、系统及方法 |
CN107247711A (zh) * | 2017-06-28 | 2017-10-13 | 努比亚技术有限公司 | 一种双向翻译方法、移动终端以及计算机可读存储介质 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019214299A1 (zh) * | 2018-05-08 | 2019-11-14 | 深圳市沃特沃德股份有限公司 | 自动翻译装置、方法及计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019214299A1 (zh) | 2019-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2018137704A1 (zh) | 一种基于麦克风阵列的拾音方法及系统 | |
EP3185521B1 (en) | Voice wake-up method and device | |
CN110244833B (zh) | 麦克风组件 | |
DE112015004522T5 (de) | Akustische Vorrichtung mit niedrigem Leistungsverbrauch und Verfahren für den Betrieb | |
US10001829B2 (en) | Electronic device comprising a wake up module distinct from a core domain | |
CN106910500A (zh) | 对带麦克风阵列的设备进行语音控制的方法及设备 | |
US20070057798A1 (en) | Vocalife line: a voice-operated device and system for saving lives in medical emergency | |
CN108877805A (zh) | 语音处理模组和具有语音功能的终端 | |
CN105719644A (zh) | 一种自适应调整语音识别率的方法及装置 | |
TWI588821B (zh) | 機器人自身音源消除系統 | |
CN108899018A (zh) | 自动翻译装置及方法 | |
CN104780483A (zh) | 具有语音激活检测的麦克风 | |
US20200202851A1 (en) | Speech recognition device and system | |
CN111128164A (zh) | 一种语音采集和识别的控制系统及其实现方法 | |
US20190327555A1 (en) | Audio pickup and play circuit and system, and method for switching audio pickup and play | |
CN111383632B (zh) | 电子设备 | |
CN211957118U (zh) | 一种语音采集和识别的控制系统 | |
CN101964834A (zh) | 具有助听功能的移动通讯装置及其实现耳机助听的方法 | |
CN211267078U (zh) | 一种降低t-box与车机共用麦克风干扰噪声的电路 | |
CN103152686A (zh) | 一种可定制功能模式的数字助听器及其实现方法 | |
CN113990311A (zh) | 语音采集装置、控制器、控制方法及语音采集控制系统 | |
CN112885323A (zh) | 音频信息处理方法、装置及电子设备 | |
CN105516493A (zh) | 一种移动终端及其闹钟控制方法 | |
CN108877788B (zh) | 具有语音唤醒功能的电子装置及其操作方法 | |
RU218617U1 (ru) | Интеллектуальное высокопроизводительное устройство распознавания речи для глухих и слепоглухих, содержащее микрофоны |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181127 |