CN110211583A - 一种基于智能线控的语音交互方法以及语音交互设备 - Google Patents
一种基于智能线控的语音交互方法以及语音交互设备 Download PDFInfo
- Publication number
- CN110211583A CN110211583A CN201910470407.3A CN201910470407A CN110211583A CN 110211583 A CN110211583 A CN 110211583A CN 201910470407 A CN201910470407 A CN 201910470407A CN 110211583 A CN110211583 A CN 110211583A
- Authority
- CN
- China
- Prior art keywords
- voice
- interactive
- smart machine
- audio
- traffic control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000012545 processing Methods 0.000 claims abstract description 28
- 239000000284 extract Substances 0.000 claims abstract description 11
- 230000009467 reduction Effects 0.000 claims abstract description 5
- 230000002787 reinforcement Effects 0.000 claims abstract description 4
- 239000010410 layer Substances 0.000 claims description 30
- 229920000297 Rayon Polymers 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 13
- 238000007789 sealing Methods 0.000 claims description 13
- 230000035939 shock Effects 0.000 claims description 11
- 229920000079 Memory foam Polymers 0.000 claims description 8
- 239000008210 memory foam Substances 0.000 claims description 8
- 239000002344 surface layer Substances 0.000 claims description 8
- 229920003023 plastic Polymers 0.000 claims description 6
- 239000004033 plastic Substances 0.000 claims description 6
- 230000002618 waking effect Effects 0.000 claims description 6
- 238000001035 drying Methods 0.000 claims description 5
- 229920001971 elastomer Polymers 0.000 claims description 5
- 239000011241 protective layer Substances 0.000 claims description 5
- 230000002745 absorbent Effects 0.000 claims description 3
- 239000002250 absorbent Substances 0.000 claims description 3
- 238000013475 authorization Methods 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims 1
- 230000006870 function Effects 0.000 abstract description 19
- 230000008569 process Effects 0.000 abstract description 6
- 238000002224 dissection Methods 0.000 abstract description 5
- 230000003993 interaction Effects 0.000 abstract description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000002708 enhancing effect Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005266 casting Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011049 filling Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
Abstract
本发明实施例公开了一种基于智能线控的语音交互方法以及语音交互设备,包括如下步骤:唤醒语音交互设备,实时采集语音信息;使用音频前端处理模块对采集到的语音信息进行语音匹配处理和降噪加强处理;将语音指令传输至智能设备进行实时语音识别和语义解析处理,分解提取语音指令信息,响应指令打开对应应用程序;通过蓝牙或者FM发射接收模块接收智能设备的音频数据,再将音频数据发射传输到蓝牙或者FM收音设备中进行播放;本方案可应用在智能设备的充电线中,使传统充电线具有智能语音交互和控制功能,彻底解放双手,能给开车或者工作中的用户带来极大的便利及安全性,能满足多种应用场景需要。
Description
技术领域
本发明实施例涉及语音交互技术领域,具体涉及一种基于智能线控的语音交互方法以及语音交互设备。
背景技术
21世纪是人类全面进入信息化社会的世纪,伴随网络技术的发展和作为通讯工具手机的普及,智能手机已成为继网络之后的第五媒体,并在人们生活中发挥越来越重要的作用,手机已经成为我们生活中不可缺少的工具,给我们提供了许多资讯,朋友之间的沟通也带来了许多方便。
当然与智能手机总会自带充电线,顾名思义,充电线是传输电流的电线,通常电流传输的方式是点对点传输。电源线按照用途可以分为AC交流电源线及DC直流电源线,通常AC电源线是通过电压较高的交流电的线材,然而一般的设备充电线只有基本的充电功能,不具有线控和其它智能化功能,无法与手机等设备进行功能性互动,相对来说,功能单一、结构简单,没有其它额外功能,在开车或者双手无法操作手机时,无法智能操控手机响应相关的指令。
发明内容
为此,本发明实施例提供一种基于智能线控的语音交互方法以及语音交互设备,采用在充电线上增加智能语音交互系统,以解决现有技术中在双手无法操作手机时,不能智能化操控手机应用的问题。
为了实现上述目的,本发明的实施方式提供如下技术方案:一种基于智能线控的语音交互方法,包括如下步骤:
步骤100、唤醒语音交互设备,利用多麦克风采音模块实时采集语音信息;
步骤200、使用音频前端处理模块对采集到的语音信息进行语音匹配处理和降噪加强处理;
步骤300、实时将处理后的语音信息传输到智能设备,智能设备通过语音识别和语义解析处理,分解提取语音指令信息,并响应语音指令匹配打开智能设备配套的应用程序。
作为本发明的一种优选方案,在步骤100之前,需要先设置智能设备中应用程序隐私等级,具体步骤为:
在智能设备中授权语音交互可以打开的应用程序;
对已授权应用程序根据实际使用设置隐私等级;
对设置完成隐私等级应用程序中的数据进行单独加密。
作为本发明的一种优选方案,在所述步骤100中,唤醒语音交互设备的方式包括多麦克风采音模块采集语音唤醒和触发线控按钮模块的开关按钮,所述触发按钮唤醒和语音唤醒独立工作。
作为本发明的一种优选方案,在步骤200中,语音匹配处理是指对比采集语音信息与音频特征,具体步骤为:
步骤201、预录用户的语音信息,并提取保存用户的音频信息;
步骤202、提取采集语音信息的音频特征,与预保存的用户音频特征对比;
步骤203、当相同音频特征的占比超过设定值时,则可以打开所有授权的应用程序;
步骤204、当相同音频特征的占比低于设定值时,则打开低隐私等级的应用程序,不能打开高隐私等级的应用程序。
作为本发明的一种优选方案,在所述步骤300中,采集语音指令可通过双模蓝牙模块、wifi无线传输单元或有线传输单元实时传输到智能设备。
作为本发明的一种优选方案,还包括使用语音指令打开智能设备中的音频形式应用程序时,可通过智能设备直接进行播放,也可通过线控设备中的蓝牙或FM发射接收模块接收智能设备的音频数据,再将音频数据发射传输到蓝牙或FM收音设备播放。
本发明还提供了一种基于智能线控的语音交互设备,包括安装在充电线上且内装语音交互系统的承载外壳,以及设置在承载外壳两侧边的弹性胶块,所述承载外壳两侧边的中心位置设有光滑转动空腔栓,所述弹性胶块的中心位置设有柱形内凹槽,所述柱形内凹槽的内壁上设有耐磨贴片,所述光滑转动空腔栓安插在耐磨贴片内并绕耐磨贴片旋转,所述弹性胶块的外侧边设有用于包裹充电线的柔性橡胶防护段,所述承载外壳上还设有音频采集孔区,所述弹性胶块的厚度略大于承载外壳的厚度0.5-1cm。
作为本发明的一种优选方案,所述承载外壳从内到外依次设有记忆海绵层、弹性减震层、硬质塑料层和防水表层,所述弹性减震层的内侧还设有吸水干燥层,所述弹性减震层的内壁上设有若干均匀分布的连接弹簧,所述记忆海绵层的表面设有若干均匀分布的弹簧挂钩,所述防水表层的外表面涂覆有耐磨保护层。
作为本发明的一种优选方案,所述承载外壳在音频采集孔区的内壁上设有二次止水交互网,所述二次止水交互网之间设有若干均匀分布的传音孔。
作为本发明的一种优选方案,所述音频采集孔区包括多麦克风采音模块、音频前端处理模块、音频前端处理模块、双模蓝牙模块、FM发射接收模块和线控按钮模块。
本发明的实施方式具有如下优点:
(1)本发明应用在智能设备的充电线中,使传统充电线具有智能语音交互和控制功能,彻底解放双手,能给开车或者工作中的用户带来极大的便利及安全性,能满足多种应用场景需要,本语音交互系统在使用时,可通过充电线进行供电,不必另外添加支撑电源,因此使用更加方便简便;
(2)本发明可根据用户自己的需求,个性化的设置应用程序的隐私等级,只有用户自己可以打开隐私等级比较高的应用程序,其他人只能打开隐私等级比较低的应用程序,提高语音交互系统在使用时的安全稳定性。
(3)本发明的语音交互设备密封性好,使用灵活性高,方便在驾驶过程中使用,同时防水防震性能强,提高使用寿命。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。
图1为本发明实施方式中的语音交互方法结构流程图;
图2为本发明实施方式中的语音交互设备整体结构示意图;
图3为本发明实施方式中的承载外壳侧剖结构示意图;
图4为本发明实施方式中的二次止水交互网结构示意图。
图中:
1-承载外壳;2-弹性胶块;3-光滑转动空腔栓;4-柱形内凹槽;5-耐磨贴片;6-柔性橡胶防护段;7-音频采集孔区;8-二次止水交互网;9-传音孔;
101-记忆海绵层;102-弹性减震层;103-硬质塑料层;104-防水表层;105-吸水干燥层;106-连接弹簧;107-弹簧挂钩;108-耐磨保护层。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1
如图1所示,本发明提供了一种基于智能线控的语音交互方法,作为本发明的特征点之一,智能设备的传统充电线只有基本的充电功能,不具有线控和其它智能化功能,无法与手机等设备进行功能性互动,相对来说功能单一,在本实施方式可应用在智能设备的充电线中,使传统充电线具有智能语音交互和控制功能,彻底解放双手,能给开车或者工作中的用户带来极大的便利及安全性,能满足多种应用场景需要,本语音交互系统在使用时,可通过充电线进行供电,不必另外添加支撑电源,因此使用更加方便简便。
该语音交互方法具体包括如下步骤:
步骤100、唤醒语音交互设备,利用多麦克风采音模块实时采集语音信息。
在本实施方式中唤醒语音交互设备的方式包括多麦克风采音模块采集语音唤醒和触发线控按钮模块的开关按钮,所述触发按钮唤醒和语音唤醒独立工作。
也就是说,本实施方式唤醒语音交互设备的方式可以通过语音唤醒和触发线控按钮模块两种方式,触发按钮唤醒和语音唤醒独立工作,也就是说任一种唤醒方式均可完全实现唤醒本实施方式的线控设备工作。
在步骤100之前,首先要设置智能设备中的应用程序隐私等级,智能语音交互系统通常用来控制打开智能设备的应用程序,现有的智能设备,例如手机或平板电脑均设置解锁密码或解锁指纹,来提高智能设备的隐私性和使用安全性,而本应用的语音交互系统属于外来控制产品,因此为了提高语音交互系统在使用时的安全稳定性,特对应用程序设置隐私等级,确保只有智能设备的拥有者才能打开特定的应用程序。
作为本发明的特征点之二,设置应用程序隐私等级的具体步骤为:
A1、在智能设备中授权语音交互可以打开的应用程序。
在本实施方式中,智能设备中授权的应用程序一般为:音乐播放器、电话、音量调节、地图导航器、浏览器、系统设置、发送信息、查询天气等基础信息,也就是说用户通过语音交互系统可打开智能设备的上述基础应用程序,因此可在忙乱期解放双手,提高智能设备使用的便利性。
A2、对已授权应用程序根据实际使用设置隐私等级。
用户可根据自己的需求个性化的设置应用程序的隐私等级,比如说用户认为打电话或者发信息所需的隐私安全性比较高,因此可将增加对应的应用程序隐私等级,用户认为播放音乐和视频的隐私安全性比较低,可将降低对应的应用程序隐私等级。
在本实施方式中,应用程序的隐私等级可以分为高等和低等,高等隐私等级的应用程序只有用户自己可以打开,低等隐私等级的应用程序则只要发出语音指令就可以打开,并且如果某一个应用程序没有设置隐私等级的话,则默认该应用程序对应的隐私等级为低等。
A3、对设置完成隐私等级应用程序中的数据进行单独加密。
在将应用程序进行一一设置隐私等级后,需要对所有应用程序中的特定数据进行加密,比如说将手机相册内的某一张图片进行特定加密,在播放图片时,可自动跳过该图片不显示。
需要说明的是,本实施方式加密数据的隐私等级最高,也就是说不管是用户或者其他人均不予以显示该数据。
另外需要补充说明的是,本实施方式采用多个麦克风采集语音信息,可对采集到的语音信息进行实时校正,因此提高语音交互系统的控制精确性。
步骤200、使用音频前端处理模块对采集到的语音信息进行语音匹配处理和降噪加强处理。
音频前端处理模块对采集的语音信息进行处理,保证支持远场采音,已经对音频信息降噪增强、回声消除和波束形成等处理功能,提高语音信息采集的准确性,从而提高整个语音交互过程的准确性。
在此步骤200中,语音匹配的作用是提高语音交互系统在使用时的安全性,保护用户的个人隐私,将采集语音信息与设备主人的音频特征对比,来配比判断发出语音指令的是否为设备主人,对应打开不同隐私等级的应用程序。
作为本发明的特征点之三,对比采集语音信息与音频特征的步骤具体为:
步骤201、预录用户的语音信息,并提取保存用户的音频信息;
步骤202、提取采集语音信息的音频特征,与预保存的用户音频特征对比;
步骤203、当相同音频特征的占比超过设定值时,则通过语音交互系统可以打开所有授权的应用程序;
步骤204、当相同音频特征的占比低于设定值时,则通过语音交互系统可以打开低隐私等级的应用程序,不能打开高隐私等级的应用程序。
在所述步骤203和步骤204中,均不能打开应用程序中单独加密的数据。
因此通过上述处理,将上述设置的应用程序隐私等级应用在此步骤中,可避免任何人均打开设备应用程序,可起到防盗防窃功能。
步骤300、实时将处理后的语音信息传输到智能设备,智能设备通过语音识别和语义解析处理,分解提取语音指令信息,并响应语音指令匹配打开智能设备配套的应用程序。
本发明中的智能线控设备将语音指令传输到智能设备后,智能设备对指令识别解析后,可打开语音查询地图导航、查找联系人、拨打电话、打开应用、查找附近(美食、加油站、酒店、商场、银行、医院、景点等)、系统设置控制、搜索播放音乐、播报和发送微信信息;也可查询天气、航班、百科等基础信息。
在打开对应应用程序时,根据设置完成的应用程序隐私等级和语音信息特征匹配,将限制用户对加密应用的打开,打开语音指令信息对应的加密应用程序。
在此步骤中,首先将采集的语音指令信息通过双模蓝牙模块、wifi无线传输单元或有线传输单元实时传输到智能设备(如智能手机、平板等),语音指令信息对应打开智能设备配套的应用程序,然后将处理结果反馈给用户,实现智能化语音交互功能。
由于本线控设备应用的范围很广,可在任何环境条件中使用,因此有可能造成信息采集提取不完善的问题,可能需要多次语音采集和语音提取认证才能打开相应的程序,影响使用体验。
作为本发明的特征点之四,本发明利用多个麦克风共同采集语音信息指令,通过多个麦克风信息的相互校正,可提高语音采集的准确性,提取多个麦克风采集的语音信息指令具体步骤为:
多个麦克风同时工作,共同采集语音信息;
将每个麦克风采集的语音信息进行单字解析,标注多条语音信息中存在差异的单字;
提取差异单字信息中的元音和辅音字母,统计相同元音字母或辅音字母的个数;
将相同数量比较多的元音字母,以及单字前后的其他语音信息作为第一特征信息,将相同数量比较少的元音字母,以及单字前后的其他语音信息作为第二特征信息。
当用户向语音交互系统发出一段语音信息后,多个麦克风同时采集该指令,先对语音信息进行音频降噪增强、回声消除和波束形成等音频前端处理功能;然后每个麦克风采集到的语音信息可能存在差异,对于存在差异的字体,则不再以文字本身传输,而是以元音和辅音字母传输;最后将将采集到的音频指令信息传输到智能设备配套的应用程序,对比语音信息指令与实际应用程序中的信息,从而响应准确的语音指令,或者提醒用户进行再次说明。
下面将举例说明多个麦克风共同采集语音信息并提取指令的实现方式,用于发出“给王星打电话”的语音信息,多个麦克风在采集语音信息时,可能会采集到“Wang Xing”或者“Wang Xin”等存在差异的信息,语音识别器将每个麦克风的语音信息分解为一系列的元音和辅音字母,统计“Wang Xing”或者“Wang Xin”出现的次数,选择出现次数比较多的元音和辅音字母作为特征信息,因此在打开电话应用程序时,查找电话薄里面对应的第一特征信息,当第一特征信息查找不到时,则使用第一特征信息查找,当第二特征信息查找不到时,依次使用第三特征信息,第四特征信息对应查找,当所有信息均查到不到是,则提醒用户再次发出语音指令。
利用多麦克风收集语音信息并单字解析,每个麦克风收集的语音信息,找出存在差异的地方,并统计相同差异的个数,按照个数从大到小的方式进行特征查找,如果利用单个麦克风则无法进行信息特征的匹配校正,降低语音交互的准确有效性,因此降低使用体验。
本实施方式使用统计差异单字中具有相同元音字母或辅音字母的个数,通过使用统计学的方式,可提高识别差异单字的准确性,因此提高语音交互的准确有效性,改善用户的使用体验。
在根据语音指令,打开智能设备配套的应用程序时,如果处理结果是图像部分,则可在智能设备显示屏上直接展示,若处理结果反馈是音频形式,可通过智能设备直接进行播放,也可通过智能设备蓝牙回传音频数据到线控设备中,线控设备再通过FM射频传输到FM收音设备中进行播放,如车载音响、收音机等。
实施例2
基于上述基于智能线控的语音交互方法,本发明还提供了一种基于智能线控的语音交互系统,该系统具体包括权限划定模块、多麦克风采音模块、音频前端处理模块、语义解析处理模块、指令响应模块、双模蓝牙模块、FM发射接收模块和线控按钮模块,权限划定模块主要用于授权智能设备中可以利用语音交互系统打开的应用程序,并且设置已授权的应用程序隐私等级,并对应用程序进行加密。
多麦克风采音模块用于唤醒语音交互设备,并实时采集语音信息,同时线控按钮模块也可用于唤醒语音交互设备,同时线控按钮模块上的按钮也具有其他功能,例如音乐播放/暂停、电话接听/挂断和音量调节等。
音频前端处理模块,用于对采集的语音信息过滤处理,支持远场采音和音频降噪增强、回声消除和波束形成等音频前端处理功能。
语义解析处理模块提取语音指令信息,采集的语音信息与设备主人预录的音频特征对比。
指令响应模块将采集到的音频指令信息通过双模蓝牙模块传输到智能设备配套的应用程序,限制用户打开划分隐私等级的应用程序。
语音指令的处理结果为打开图像应用,则可在智能设备显示屏上直接展示;若处理结果反馈是打开音频应用,可通过智能设备直接进行播放,也可打开智能设备的蓝牙,通过蓝牙将音频数据回传至线控设备中的FM发射接收模块的FM接收单元,线控设备再通过FM发射接收模块的FM发射单元传输到FM收音设备中进行播放,如车载音响、收音机等。
实施例3
如图2至图4所示,为了细述该语音交互系统产品的安装方式,本发明还提供了一种基于智能线控的语音交互设备,包括安装在充电线上且内装语音交互系统的承载外壳1,以及设置在承载外壳1两侧边的弹性胶块2,所述承载外壳1两侧边的中心位置设有光滑转动空腔栓3,所述弹性胶块2的中心位置设有柱形内凹槽4,所述柱形内凹槽4的内壁上设有耐磨贴片5,所述光滑转动空腔栓3安插在耐磨贴片5内并绕耐磨贴片5旋转,弹性胶块2的厚度略大于承载外壳1的厚度0.5-1cm。。
在本实施方式中,语音交互系统集成在承载外壳1内部,承载外壳1在使用时,可通过光滑转动空腔栓3绕着弹性胶块2的耐磨贴片5旋转,由于语音交互设备安装在充电线上,不便更换调整承载外壳1的方向位置,而本实施方式中的承载外壳1可旋转,因此在使用时可任意变换位置。
另外需要说明的是,光滑转动空腔栓3为一段直径大,一段直径小的形状,因此在使用时,将直径大的光滑转动空腔栓3安插在柱形内凹槽4转动,柱形内凹槽4端口的直径与光滑转动空腔栓3的小直径相同,可有效的避免承载外壳1脱落。
弹性胶块2的厚度比承载外壳1的厚度大,而且弹性胶块2包裹在承载外壳1的两端,因此如果充电线在跌落时,弹性胶块2可保护承载外壳1不受损坏。
弹性胶块2的外侧边设有用于包裹充电线的柔性橡胶防护段6,所述承载外壳1上还设有音频采集孔区7,充电线穿过弹性胶块2和承载外壳1,柔性橡胶防护段6可防止充电线与弹性胶块2的连接处弯折断裂,并且充电线可为语音交互系统提供电源,也就是说语音交互系统在充电线连接电源时使用,充电线一方面可对智能设备进行正常充电操作,另一方面可对语音交互系统进行供电操作。
音频采集孔区7主要便于语音交互系统的麦克风收集语音信息,承载外壳1整体为密封结构,音频采集孔区7作为承载外壳1上唯一的通孔,因此为了避免音频采集孔区7内浸水,需要在音频采集孔区7上增加防水机构。
作为本发明的特征点之五,承载外壳1在音频采集孔区7的内壁上设有二次止水交互网8,所述二次止水交互网8之间设有若干均匀分布的传音孔9。
二次止水交互网8具体为呈网状分布的通水膨胀止水条,网状的通水膨胀止水条内设置的传音孔9,不妨碍正常的语音收集功能,当二次止水交互网8接触水分之后,则会急速碰撞,将传音孔9封闭,因此可避免水分进入承载外壳1内损坏系统,同时通水膨胀止水条在干燥之后,可恢复至原状,同样不妨碍正常的语音收集功能。
承载外壳1从内到外依次设有记忆海绵层101、弹性减震层102、硬质塑料层103和防水表层104,所述弹性减震层102的内侧还设有吸水干燥层105,所述弹性减震层102的内壁上设有若干均匀分布的连接弹簧106,所述记忆海绵层101的表面设有若干均匀分布的弹簧挂钩107,所述防水表层104的外表面涂覆有耐磨保护层108。
记忆海绵层101和弹性减震层102均提供减震功能,防止在碰撞时,内部语音交互系统发生损坏,防水表层104和耐磨保护层108均是为了保护硬质塑料层103不受损坏,同时将水分及时从防水表层104滑落,因此防止水分在硬质塑料层103上堆积,从而提高硬质塑料层103表面的干燥性。
虽然,上文中已经用一般性说明及具体实施例对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
Claims (10)
1.一种基于智能线控的语音交互方法,其特征在于,包括如下步骤:
步骤100、唤醒语音交互设备,利用多麦克风采音模块实时采集语音信息;
步骤200、使用音频前端处理模块对采集到的语音信息进行语音匹配处理和降噪加强处理;
步骤300、实时将处理后的语音信息传输到智能设备,智能设备通过语音识别和语义解析处理,分解提取语音指令信息,并响应语音指令匹配打开智能设备配套的应用程序。
2.根据权利要求1所述的一种基于智能线控的语音交互方法,其特征在于,在步骤100之前,需要先设置智能设备中应用程序隐私等级,具体步骤为:
在智能设备中授权语音交互可以打开的应用程序;
对已授权应用程序根据实际使用设置隐私等级;
对设置完成隐私等级应用程序中的数据进行单独加密。
3.根据权利要求1所述的一种基于智能线控的语音交互方法,其特征在于:在所述步骤100中,唤醒语音交互设备的方式包括多麦克风采音模块采集语音唤醒和触发线控按钮模块的开关按钮,所述触发按钮唤醒和语音唤醒独立工作。
4.根据权利要求1所述的一种基于智能线控的语音交互方法,其特征在于,在步骤200中,语音匹配处理是指对比采集语音信息与音频特征,具体步骤为:
步骤201、预录用户的语音信息,并提取保存用户的音频信息;
步骤202、提取采集语音信息的音频特征,与预保存的用户音频特征对比;
步骤203、当相同音频特征的占比超过设定值时,则可以打开所有授权的应用程序;
步骤204、当相同音频特征的占比低于设定值时,则打开低隐私等级的应用程序,不能打开高隐私等级的应用程序。
5.根据权利要求1所述的一种基于智能线控的语音交互方法,其特征在于,在所述步骤300中,采集语音指令可通过双模蓝牙模块、wifi无线传输单元或有线传输单元实时传输到智能设备。
6.根据权利要求1所述的一种基于智能线控的语音交互方法,其特征在于:还包括使用语音指令打开智能设备中的音频形式应用程序时,可通过智能设备直接进行播放,也可通过线控设备中的蓝牙或FM发射接收模块接收智能设备的音频数据,再将音频数据发射传输到蓝牙或FM收音设备播放。
7.一种基于智能线控的语音交互设备,其特征在于:包括安装在充电线上且内装语音交互系统的承载外壳(1),以及设置在承载外壳(1)两侧边的弹性胶块(2),所述承载外壳(1)两侧边的中心位置设有光滑转动空腔栓(3),所述弹性胶块(2)的中心位置设有柱形内凹槽(4),所述柱形内凹槽(4)的内壁上设有耐磨贴片(5),所述光滑转动空腔栓(3)安插在耐磨贴片(5)内并绕耐磨贴片(5)旋转,所述弹性胶块(2)的外侧边设有用于包裹充电线的柔性橡胶防护段(6),所述承载外壳(1)上还设有音频采集孔区(7),所述弹性胶块(2)的厚度略大于承载外壳(1)的厚度0.5-1cm。
8.根据权利要求7所述的一种基于智能线控的语音交互设备,其特征在于:所述承载外壳(1)从内到外依次设有记忆海绵层(101)、弹性减震层(102)、硬质塑料层(103)和防水表层(104),所述弹性减震层(102)的内侧还设有吸水干燥层(105),所述弹性减震层(102)的内壁上设有若干均匀分布的连接弹簧(106),所述记忆海绵层(101)的表面设有若干均匀分布的弹簧挂钩(107),所述防水表层(104)的外表面涂覆有耐磨保护层(108)。
9.根据权利要求7所述的一种基于智能线控的语音交互设备,其特征在于:所述承载外壳(1)在音频采集孔区(7)的内壁上设有二次止水交互网(8),所述二次止水交互网(8)之间设有若干均匀分布的传音孔(9)。
10.根据权利要求7所述的一种基于智能线控的语音交互设备,其特征在于:所述音频采集孔区(7)包括多麦克风采音模块、音频前端处理模块、双模蓝牙模块、FM发射接收模块和线控按钮模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910470407.3A CN110211583B (zh) | 2019-05-31 | 2019-05-31 | 一种基于智能线控的语音交互方法以及语音交互设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910470407.3A CN110211583B (zh) | 2019-05-31 | 2019-05-31 | 一种基于智能线控的语音交互方法以及语音交互设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110211583A true CN110211583A (zh) | 2019-09-06 |
CN110211583B CN110211583B (zh) | 2021-07-16 |
Family
ID=67789946
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910470407.3A Active CN110211583B (zh) | 2019-05-31 | 2019-05-31 | 一种基于智能线控的语音交互方法以及语音交互设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110211583B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648682A (zh) * | 2019-10-25 | 2020-01-03 | 无锡吉兴汽车声学部件科技有限公司 | 一种车内语音增强器、语音增强系统及增强方法 |
CN111128149A (zh) * | 2019-11-20 | 2020-05-08 | 北京小米移动软件有限公司 | 语音采集控制装置及方法 |
CN112530429A (zh) * | 2020-11-30 | 2021-03-19 | 昌飞 | 一种带ai语音识别系统的超声波流量计 |
CN113539252A (zh) * | 2020-04-22 | 2021-10-22 | 庄连豪 | 无障碍智能语音系统及其控制方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001011848A1 (en) * | 1999-08-09 | 2001-02-15 | Nisshin (S) Enterprises | Carrier for a mobile phone |
CN102742297A (zh) * | 2009-05-11 | 2012-10-17 | 史蒂芬·Y·彭 | 减少纠缠的耳机和方法 |
CN103813334A (zh) * | 2014-02-24 | 2014-05-21 | 宇龙计算机通信科技(深圳)有限公司 | 权限控制方法和权限控制装置 |
CN205544350U (zh) * | 2016-01-11 | 2016-08-31 | 深圳市亚冠电子有限公司 | 车载智能充电器及车载语音信息推送装置 |
CN206055117U (zh) * | 2016-08-22 | 2017-03-29 | 昆山泓杰电子股份有限公司 | 桌上用显示器支架 |
CN207069539U (zh) * | 2017-07-20 | 2018-03-02 | 江西斯耐尔电力科技有限公司 | 一种新型电缆管封堵器 |
CN108521494A (zh) * | 2018-04-10 | 2018-09-11 | Oppo广东移动通信有限公司 | 终端控制方法和装置、可读存储介质、终端 |
CN207910964U (zh) * | 2018-03-06 | 2018-09-25 | 郑州正浩电子工程有限公司 | 一种具有减震结构的麦克风 |
CN208445634U (zh) * | 2018-04-09 | 2019-01-29 | 科大讯飞股份有限公司 | 数据线以及语音交互系统 |
-
2019
- 2019-05-31 CN CN201910470407.3A patent/CN110211583B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2001011848A1 (en) * | 1999-08-09 | 2001-02-15 | Nisshin (S) Enterprises | Carrier for a mobile phone |
CN102742297A (zh) * | 2009-05-11 | 2012-10-17 | 史蒂芬·Y·彭 | 减少纠缠的耳机和方法 |
CN103813334A (zh) * | 2014-02-24 | 2014-05-21 | 宇龙计算机通信科技(深圳)有限公司 | 权限控制方法和权限控制装置 |
CN205544350U (zh) * | 2016-01-11 | 2016-08-31 | 深圳市亚冠电子有限公司 | 车载智能充电器及车载语音信息推送装置 |
CN206055117U (zh) * | 2016-08-22 | 2017-03-29 | 昆山泓杰电子股份有限公司 | 桌上用显示器支架 |
CN207069539U (zh) * | 2017-07-20 | 2018-03-02 | 江西斯耐尔电力科技有限公司 | 一种新型电缆管封堵器 |
CN207910964U (zh) * | 2018-03-06 | 2018-09-25 | 郑州正浩电子工程有限公司 | 一种具有减震结构的麦克风 |
CN208445634U (zh) * | 2018-04-09 | 2019-01-29 | 科大讯飞股份有限公司 | 数据线以及语音交互系统 |
CN108521494A (zh) * | 2018-04-10 | 2018-09-11 | Oppo广东移动通信有限公司 | 终端控制方法和装置、可读存储介质、终端 |
Non-Patent Citations (1)
Title |
---|
王德生: "全球智能穿戴设备发展现状与趋势", 《竞争情报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110648682A (zh) * | 2019-10-25 | 2020-01-03 | 无锡吉兴汽车声学部件科技有限公司 | 一种车内语音增强器、语音增强系统及增强方法 |
WO2021078046A1 (zh) * | 2019-10-25 | 2021-04-29 | 无锡吉兴汽车声学部件科技有限公司 | 车内语音增强器、车内语音增强系统及车内语音增强方法 |
CN111128149A (zh) * | 2019-11-20 | 2020-05-08 | 北京小米移动软件有限公司 | 语音采集控制装置及方法 |
CN111128149B (zh) * | 2019-11-20 | 2022-11-11 | 北京小米移动软件有限公司 | 语音采集控制装置及方法 |
CN113539252A (zh) * | 2020-04-22 | 2021-10-22 | 庄连豪 | 无障碍智能语音系统及其控制方法 |
CN112530429A (zh) * | 2020-11-30 | 2021-03-19 | 昌飞 | 一种带ai语音识别系统的超声波流量计 |
Also Published As
Publication number | Publication date |
---|---|
CN110211583B (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110211583A (zh) | 一种基于智能线控的语音交互方法以及语音交互设备 | |
CN208507180U (zh) | 一种便携式智能语音交互控制设备 | |
CN208689384U (zh) | 一种带具有语音交互功能耳机的智能手表 | |
CN108564949A (zh) | 一种tws耳机、腕带式ai语音交互装置及系统 | |
CN110381282A (zh) | 一种应用于电子设备的视频通话的显示方法及相关装置 | |
CN110138959A (zh) | 显示人机交互指令的提示的方法及电子设备 | |
CN103280011A (zh) | 楼宇门禁安全管理系统 | |
CN106790938A (zh) | 一种基于人工智能的人机交互车载系统 | |
CN110198362A (zh) | 一种在联系人中添加智能家居设备的方法及系统 | |
CN207053716U (zh) | 一种耳机 | |
CN110022401A (zh) | 一种控制参数设置方法、终端及计算机可读存储介质 | |
CN107919124A (zh) | 设备唤醒方法及装置 | |
CN107666536A (zh) | 一种寻找终端的方法和装置、一种用于寻找终端的装置 | |
CN110442394A (zh) | 一种应用控制方法及移动终端 | |
CN110491387A (zh) | 一种基于多个终端的交互服务实现方法和系统 | |
CN109145552A (zh) | 信息加密方法及终端设备 | |
CN109981904A (zh) | 一种音量控制方法及终端设备 | |
CN110111795A (zh) | 一种语音处理方法及终端设备 | |
CN110060062A (zh) | 一种可穿戴设备丢失后的信息交流方法、可穿戴设备及存储介质 | |
CN109547722A (zh) | 执法记录方法、存储介质、控制装置及执法记录仪 | |
CN111341317B (zh) | 唤醒音频数据的评价方法、装置、电子设备及介质 | |
CN110098851A (zh) | 一种语音控制方法、可穿戴设备和计算机可读存储介质 | |
CN108391328A (zh) | 具备5g无线宽带路由器功能的5g固定通话设备 | |
CN203289519U (zh) | 耳戴式移动通信设备 | |
CN110213442A (zh) | 语音播放方法、终端及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |