CN206505410U - 一种实时语音互译装置 - Google Patents
一种实时语音互译装置 Download PDFInfo
- Publication number
- CN206505410U CN206505410U CN201720081852.7U CN201720081852U CN206505410U CN 206505410 U CN206505410 U CN 206505410U CN 201720081852 U CN201720081852 U CN 201720081852U CN 206505410 U CN206505410 U CN 206505410U
- Authority
- CN
- China
- Prior art keywords
- languages
- module
- speaker
- translation
- converted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
Abstract
本实用新型公开了一种实时语音互译装置,包括:生物特征识别模块,用于采集及识别说话者的生物特征,判定说话者所说语种;两个语音识别处理模块,分别对所述生物特征识别模块判定的甲语种进行识别,并转换成甲语种文字,输送给相应的翻译模块;两个翻译模块,分别将一语种文字翻译成另一语种文字,并转换成相应种语音信号,发送给播放单元进行播放。还提供另一种实时语音互译装置,采用重力传感器检测装置的倾斜角度,判定说话者及其所说语种,从而进行相应的翻译处理。采用本实用新型提供的装置便于使用,用户体验更佳。
Description
技术领域
本实用新型涉及信息通信技术领域,具体涉及一种实时语音互译装置。
背景技术
随着全球一体化进程的推进,国际经济贸易活动更加活跃,另外,跨境旅游的人数也逐年增加,据官方统计,2015年中国出境旅游人数达1.17亿人次,同比增长9.8%,同年,中国大陆接待入境旅游人数1.33亿人次,且均呈现快速增长的态势。世界不同地区、不同种族的人们之间相互交流也日益频繁,由于语言不通,通常需要翻译才能顺畅交流,或者借助电子词典等随身设备进行沟通,但是,通过查词典来完成翻译,效率低、节奏慢,导致沟通不顺畅,对于一些外语水平不高或外语口语不够熟练的人群带来了困难和不便,因此,迫切需要一种便于随身携带的具有语音互译功能的设备,来帮助解决不同语言的人员之间的沟通交流问题。
到目前为止,仍然缺乏一种有效的用户语音通信时现场完成实时语音互译的解决方案,让用户通信中说出的语音让对方听到或收到的是自己选定地语种声音,基于INTERNET的即时通信(IM),PSTN公共电话网,其它无线移动电话网(GSM,CDMA,3G,SMS等通信方式)的多语种语音,文字的即时互译系统,语音识别引擎,语音合成引擎,语音通道,翻译引擎,结合了Internet、语音CODEC、视频CODEC、TCP/IP、数据库技术和软件技术的Internet即时互译系统也有出现,但不能满足现场实时互译的需求。许多企业和个人越来越多地认识到国际交流及个性化服务的重要性,语音识别(ASR)技术,语音合成(TTS)技术也越来越成熟;即时互译,语音CODEC、无线通信技术也发展到实用阶段;互译系统正是适应这种应用需求和技术进步而提出的一种应用系统,但目前市场上仍然未出现相应的能够满足需求的产品。
由于旅行到异国他乡,到了原移动通信运营商的服务范围之外,需要接入当地运营商的无线通信网络,因此,还有要求这种提供实时互译功能的产品能方便地接入当地运营商的网络。
设计一种能够自动识别语种的实时互译设备,将更为便于使用,给用 户以更好的体验。
实用新型内容
有鉴于此,本实用新型的一个目的是提供一种实时语音互译装置,可识别当前说话者所说的语种
本实用新型提供的一种实时语音互译装置,包括:
生物特征识别模块,用于采集及识别说话者的生物特征,判定说话者所说语种;
第一语音识别处理模块,对所述生物特征识别模块判定的甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述生物特征识别模块判定的乙语种进行识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
更适宜地,生物特征为指纹,生物特征识别模块为指纹识别器;所述指纹识别器采集说话者的指纹并保存,当该说话者再次操作时,则判断采用相应的语种进行处理。
更适宜地,生物特征为声纹,生物特征识别模块为声纹识别器;
声纹识别器采集说话者的声纹并保存,当该说话者再次说话时,采集该说话者的声纹与所保存的声纹进行比对,则判断采用相应的语种进行处理。
本实用新型还提供一种实现实时语音互译的装置,包括:
重力传感器模块,用于检测装置的倾斜角度,判定说话者及其所说语种;
第一语音识别处理模块,对所述重力传感器模块判定的说话者及其所说甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语 种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述重力传感器模块判定的说话者及其所说乙语种进行识别,,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
当开始触发语音采集时,所述重力传感器模块检测装置的倾斜角度,倾斜角度在第一预定范围内,则判断输入语种为甲语种;倾斜角度在第二预定范围内,则判断输入语种为乙语种。
本实用新型提供的上述装置,通过采用生物特征识别模块,采集及识别说话者的生物特征,判定说话者所说语种;或者通过采用重力传感器模块,检测装置的倾斜角度,判定说话者及其所说语种。更为便于使用,用户体验更佳。
为了上述以及相关的目的,一个或多个实施例包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明某些示例性方面,并且其指示的仅仅是各个实施例的原则可以利用的各种方式中的一些方式。其它的益处和新颖性特征将随着下面的详细说明结合附图考虑而变得明显,所公开的实施例是要包括所有这些方面以及它们的等同。
附图说明
附图用来提供对本实用新型的进一步理解,并且构成说明书的一部分,与本实用新型的实施例一起用于解释本实用新型,并不构成对本实用新型的限制。在附图中:
图1本实用新型实施例一提供的一种实时语音互译装置示意图;
图2本实用新型实施例二提供的一种实时语音互译装置示意图。
具体实施方式
以下描述和附图充分地示出本实用新型的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。一些实施方 案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本实用新型的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同。
本实用新型是在申请人之前提出的实时语音互译装置,专利申请号分别为CN201621166271.5、CN201621166275.3和CN201621173006.X的实现实时互译的装置的基础上进行的改进。
这些实时语音互译装置,可以独立工作,直接采集语音,识别翻译后,直接播放。分别说甲乙两种语音的人可通过一台装置实现实时语音互译。为了能识别判断当前说话者的语种,而自动触发调用相应的功能软件程序模块,实现实时互译。
实施例一
参照图1,本实用新型提供了一种实时语音互译装置100,包括:
生物特征识别模块110,用于采集及识别说话者的生物特征,判定说话者所说语种;
第一语音识别处理模块120,对所述生物特征识别模块判定的甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块130,将所述甲语种文字翻译成乙语种文字,并转换成乙语种语音信号,发送给播放单元进行播放;
第二语音识别处理模块140,对所述生物特征识别模块判定的乙语种进行识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块150,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
所述生物特征包括指纹、声纹、虹膜。
生物识别技术(Biometric Identification Technology)是指利用人体生物特征进行身份认证的一种技术。更具体一点,生物特征识别技术就是通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份的鉴定。
生物识别系统是对生物特征进行取样,提取其唯一的特征并且转化成数字代码,并进一步将这些代码组合而成的特征模板。人们同识别系统交 互进行身份认证时,识别系统获取其特征并与数据可中的特征模板进行比对,以确定是否匹配,从而决定接受或拒绝该人。
在目前的研究与应用领域中,生物特征识别主要关系到计算机视觉、图象处理与模式识别、计算机听觉、语音处理、多传感器技术、虚拟现实、计算机图形学、可视化技术、计算机辅助设计、智能机器人感知系统等其他相关的研究。已被用于生物识别的生物特征有手形、指纹、脸形、虹膜等。
虹膜识别,个体的虹膜结构独一无二、不具遗传性(使即使是同卵双胞胎虹膜也各不相同),并且自童年以后,便基本不再变化,使得其非常适合应用于生物识别。有统计表明,到目前为止,虹膜识别的错误率是各种生物特征识别中最低的。
若所述生物特征为指纹,所述生物特征识别模块为指纹识别器;
所述指纹识别器采集说话者的指纹并保存,当该说话者再次操作时,则判断采用相应的语种进行处理。
指纹识别技术把一个人同他的指纹对应起来,通过比较他的指纹和预先保存的指纹进行比较,就可以验证他的真实身份。每个人(包括指纹在内)皮肤纹路在图案、断点和交叉点上各不相同,也就是说,是唯一的,并且终生不变。依靠这种唯一性和稳定性,可进行指纹识别。指纹识别技术主要涉及四个功能:读取指纹图像、提取特征、保存数据和比对。
若所述生物特征为声纹,所述生物特征识别模块为声纹识别器;
所述声纹识别器采集说话者的声纹并保存,当该说话者再次说话时,采集该说话者的声纹与所保存的声纹进行比对,则判断采用相应的语种进行处理。
所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。
人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官--舌、牙齿、喉头、肺、鼻腔在尺寸和形态方面每个人的差异很大,所以任何两个人的声纹图谱都有差异。每个人 的语音声学特征既有相对稳定性,尽管每个人的发音器官都不尽相同,在一般情况下,人们仍能区别不同的人的声音或判断是否是同一人的声音。
声纹识别,每个人说话的语调,频率等都是不同的,这种表征不同人声音特征的信息,即声纹,通过声纹,识别不同的说话人,绑定对应的语种。
实施例二
参照图2本实用新型还提供另一种实现实时语音互译的装置200,包括:
重力传感器模块210,用于检测装置的倾斜角度,判定说话者及其所说语种;
第一语音识别处理模块220,对所述重力传感器模块判定的说话者及其所说甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块230,将所述甲语种文字翻译成乙语种文字,并转换成乙语种语音信号,发送给播放单元进行播放;
第二语音识别处理模块240,对所述重力传感器模块判定的说话者及其所说乙语种进行识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块250,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
当开始触发语音采集时,所述重力传感器模块检测装置的倾斜角度,倾斜角度在第一预定范围内,则判断输入语种为甲语种;倾斜角度在第二预定范围内,则判断输入语种为乙语种。
优选地,设定第一预定范围为20°–80°;
优选地,设定第二预定范围为100°–160°。
重力感应器,又称重力传感器,新型属传感器技术,它采用弹性敏感元件制成悬臂式位移器,与采用弹性敏感元件制成的储能弹簧来驱动电触点,完成从重力变化到电信号的转换。目前绝大多数中高端智能手机和平板电脑内置了重力传感器。
重力传感器是将运动或重力转换为电信号的传感器,主要用于倾斜角、惯性力、冲击及震动等参数的测量。简单地举例,如本来把手机拿在手里 是竖着的,将它转90度,横过来,它的页面就跟随你的重心自动反应过来,也就是说页面也转了90度。
重力传感器的倾角原理如下:
首先,建立各个坐标系,①水平坐标系(X、Y、Z)②参考平台坐标系(X1、Y1、Z1):OY1Z1w为平台面,在舰艇静止时处于水平状态,当存在舰艇摇摆时,与水平面存在ψ、θ的夹角,水平坐标系经先纵摇ψ角,后横摇θ角得到。③平台坐标系(X2、Y2、Z2):两个相互正交的传感器轴线确定的被测平台平面及其垂线确定的坐标系,和参考平台坐标系存在rψ、rθ的夹角,参考平台坐标系经先纵摇rψ角,后横摇rθ得到。平台参考系的Y2轴和参考平台坐标系的Y1轴相对于水平面的夹角之差为平台与参考平台水平度的纵向倾角yψ;平台参考系X2轴和参考平台坐标系的X1轴相对于水平面的夹角之差为平台与参考平台水平度的横向倾角yθ。
重力传感器的测角原理
重力传感器是将运动或重力转换为电信号的传感器,主要用于倾斜角、惯性力、冲击及震动等参数的测量。在测量平台倾斜角时,将重力传感器垂直放置于在所测平台上,重力传感器的敏感轴应与倾斜平台的轴向一致,在水平状态下应与水平面平行,其中α为平台沿某一方向的倾斜角。重力传感器的质量块由于受到重力加速度g在倾斜方向上的分量的作用产生偏移,使重力传感器的输出电压发生变化。若重力传感器在水平状态下的输出为0V,倾角为α时的输出为αV,且在1g加速度作用下的输出为V,则有:
0V=V/g×sinα×1g+Vα
即:α=arcsin[(Vα-V0)/V]
利用上式可以方便求得平面某一方向上的倾斜角。如果将两个重力传感器正交放置在平台中心,则平台在x方向上倾斜角xα和平台在y方向上倾斜角yα为:
xα=x arcsin[(Vα-V0)/V],yα=y arcsin[(Vα-V0)/V]
根据这两个方向上的倾斜角可以确定出平台的横向倾角和纵向倾角。
综上所述,本实用新型提供的上述装置,通过采用生物特征识别模块,采集及识别说话者的生物特征,判定说话者所说语种;或者通过采用重力 传感器模块,检测装置的倾斜角度,判定说话者及其所说语种。更为便于使用,用户体验更佳。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
Claims (7)
1.一种实时语音互译装置,其特征在于,包括:
生物特征识别模块,用于采集及识别说话者的生物特征,判定说话者所说语种;
第一语音识别处理模块,对所述生物特征识别模块判定的甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述生物特征识别模块判定的乙语种进行识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
2.如权利要求1所述的装置,其特征在于,所述生物特征包括指纹、声纹、虹膜。
3.如权利要求1所述的装置,其特征在于,所述生物特征为指纹,所述生物特征识别模块为指纹识别器;
所述指纹识别器采集说话者的指纹并保存,当该说话者再次操作时,则判断采用相应的语种进行处理。
4.如权利要求1所述的装置,其特征在于,所述生物特征为声纹,所述生物特征识别模块为声纹识别器;
所述声纹识别器采集说话者的声纹并保存,当该说话者再次说话时,采集该说话者的声纹与所保存的声纹进行比对,则判断采用相应的语种进行处理。
5.一种实现实时语音互译的装置,其特征在于,包括:
重力传感器模块,用于检测装置的倾斜角度,判定说话者及其所说语种;
第一语音识别处理模块,对所述重力传感器模块判定的说话者及其所说甲语种进行识别,并转换成甲语种文字,输送给第一翻译模块;
第一翻译模块,将所述甲语种文字翻译成乙语种文字,并转换成乙语种语音信号,发送给播放单元进行播放;
第二语音识别处理模块,对所述重力传感器模块判定的说话者及其所说乙语种进行识别,并转换成乙语种文字,输送给第二翻译模块;
第二翻译模块,将所述乙语种文字翻译成甲语种文字,并转换成甲语种语音信号,发送给播放单元进行播放。
6.如权利要求5所述的装置,其特征在于,
当开始触发语音采集时,所述重力传感器模块检测装置的倾斜角度,倾斜角度在第一预定范围内,则判断输入语种为甲语种;倾斜角度在第二预定范围内,则判断输入语种为乙语种。
7.如权利要求6所述的装置,其特征在于,
所述第一预定范围为20°–80°;或/和
所述第二预定范围为100°–160°。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201720081852.7U CN206505410U (zh) | 2017-01-20 | 2017-01-20 | 一种实时语音互译装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201720081852.7U CN206505410U (zh) | 2017-01-20 | 2017-01-20 | 一种实时语音互译装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN206505410U true CN206505410U (zh) | 2017-09-19 |
Family
ID=59833088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201720081852.7U Active CN206505410U (zh) | 2017-01-20 | 2017-01-20 | 一种实时语音互译装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN206505410U (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315740A (zh) * | 2017-01-20 | 2017-11-03 | 北京分音塔科技有限公司 | 一种实时语音互译装置 |
CN107632983A (zh) * | 2017-10-27 | 2018-01-26 | 姜俊 | 一种文字翻译装置及方法 |
CN109359307A (zh) * | 2018-10-17 | 2019-02-19 | 深圳市沃特沃德股份有限公司 | 自动识别语种的翻译方法、装置及设备 |
CN111428517A (zh) * | 2020-03-24 | 2020-07-17 | 南京工程学院 | 一种便携式智能指向型翻译装置 |
CN112309370A (zh) * | 2020-11-02 | 2021-02-02 | 北京分音塔科技有限公司 | 语音翻译方法、装置及设备、翻译机 |
-
2017
- 2017-01-20 CN CN201720081852.7U patent/CN206505410U/zh active Active
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107315740A (zh) * | 2017-01-20 | 2017-11-03 | 北京分音塔科技有限公司 | 一种实时语音互译装置 |
CN107632983A (zh) * | 2017-10-27 | 2018-01-26 | 姜俊 | 一种文字翻译装置及方法 |
CN109359307A (zh) * | 2018-10-17 | 2019-02-19 | 深圳市沃特沃德股份有限公司 | 自动识别语种的翻译方法、装置及设备 |
CN111428517A (zh) * | 2020-03-24 | 2020-07-17 | 南京工程学院 | 一种便携式智能指向型翻译装置 |
CN112309370A (zh) * | 2020-11-02 | 2021-02-02 | 北京分音塔科技有限公司 | 语音翻译方法、装置及设备、翻译机 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN206505410U (zh) | 一种实时语音互译装置 | |
CN106251874B (zh) | 一种语音门禁和安静环境监控方法及系统 | |
CN106157956A (zh) | 语音识别的方法及装置 | |
CN107918771A (zh) | 人物识别方法和佩戴式人物识别系统 | |
CN110070065A (zh) | 基于视觉以及语音智能的手语系统以及通讯方法 | |
CN107257996A (zh) | 环境敏感自动语音识别的方法和系统 | |
CN107678550A (zh) | 一种基于数据手套的手语手势识别系统 | |
CN104811559B (zh) | 降噪方法、通信方法及移动终端 | |
CN107705251A (zh) | 图片拼接方法、移动终端及计算机可读存储介质 | |
CN103544724A (zh) | 一种利用增强现实与卡片识别技术在移动智能终端实现虚拟动漫角色的系统及方法 | |
CN107221330A (zh) | 标点添加方法和装置、用于标点添加的装置 | |
CN107526437A (zh) | 一种基于音频多普勒特征量化的手势识别方法 | |
CN107808423A (zh) | 一种基于服务机器人的员工考勤签到系统与实现方法 | |
CN106341539A (zh) | 恶意来电者声纹的自动取证方法、装置和移动终端 | |
CN206003392U (zh) | 一种聋哑人社交手套 | |
CN113099031B (zh) | 声音录制方法及相关设备 | |
WO2022199500A1 (zh) | 一种模型训练方法、场景识别方法及相关设备 | |
CN107845386A (zh) | 声音信号处理方法、移动终端和服务器 | |
CN107875625A (zh) | 一种基于语音的象棋对弈装置 | |
CN109063624A (zh) | 信息处理方法、系统、电子设备和计算机可读存储介质 | |
CN109785846A (zh) | 单声道的语音数据的角色识别方法及装置 | |
WO2022072752A1 (en) | Voice user interface using non-linguistic input | |
CN104754112A (zh) | 用户信息获取方法及移动终端 | |
CN110012172A (zh) | 一种来电处理方法及终端设备 | |
CN109391842A (zh) | 一种配音方法、移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder |
Address after: Room 409, 4th floor, Block C, Zhizhong Street, Zhongguancun, 45 Chengfu Road, Haidian District, Beijing, 100089 Patentee after: Beijing branch Tower Technology Co., Ltd. Address before: 100084 C112, Zhongguancun Zhijiao Street, 45 Chengfu Road, Haidian District, Beijing Patentee before: Beijing branch Tower Technology Co., Ltd. |
|
CP02 | Change in the address of a patent holder |