CN108597536A - 一种基于声音信息定位的交互系统 - Google Patents
一种基于声音信息定位的交互系统 Download PDFInfo
- Publication number
- CN108597536A CN108597536A CN201810228883.XA CN201810228883A CN108597536A CN 108597536 A CN108597536 A CN 108597536A CN 201810228883 A CN201810228883 A CN 201810228883A CN 108597536 A CN108597536 A CN 108597536A
- Authority
- CN
- China
- Prior art keywords
- sound
- module
- user
- system based
- interactive system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01S—RADIO DIRECTION-FINDING; RADIO NAVIGATION; DETERMINING DISTANCE OR VELOCITY BY USE OF RADIO WAVES; LOCATING OR PRESENCE-DETECTING BY USE OF THE REFLECTION OR RERADIATION OF RADIO WAVES; ANALOGOUS ARRANGEMENTS USING OTHER WAVES
- G01S5/00—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations
- G01S5/18—Position-fixing by co-ordinating two or more direction or position line determinations; Position-fixing by co-ordinating two or more distance determinations using ultrasonic, sonic, or infrasonic waves
- G01S5/30—Determining absolute distances from a plurality of spaced points of known location
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Abstract
本发明公开了一种基于声音信息定位的交互系统,包括音响,所述音响内设有声场定位模块、声源识别判定模块、声源定位模块、异常声音修正模块、智能控制模块。与现有技术相比,本发明的优点在于:本发明优化了智能化音响的交互,以智能音响为基础载体,实现了所有智能化设备的整体控制,解决了语音过程中很多误操作的问题,语音控制更加方便易懂,交互起来更为流畅,具有很好的用户体验。
Description
技术领域
本发明涉及一种智能音响设备,尤其涉及一种基于声音信息定位的交互系统。
背景技术
目前的音响设备大都只具有播放功能,交互方式只局限于用户与音响之间的单线信号传输,如蓝牙、射频信号、wifi信号,交互方式单一,功能局限,跟不上智能化设备的发展。而且语音控制的交互系统中,由于没有精准的场景定位、以及声源定位,以及智能化设备的分布定位,很难实现精准化的控制。例如在场景内有多个电灯,在发出同样的“开灯”语音指令时,系统如何快速准确的识别你想要开的某一盏灯,有可能只要开客厅灯,结果所有的灯都打开了,目前的技术还未实现具体化的分类操作控制。而且目前的交互方式只能单线控制,当有两个用户同时发出指令时,只会执行一个指令,用户体验感差。目前的智能化设备只能以统一的语言指令,如英语或普通话,由于地方的差异,方言、吐字的方式不一,造成不会通用的语言的用户无法得到很好的体验,而且智能化设备的名字日新月异,一个智能化设备可能有多个名称,造成指令输出不正确,用户也无法得到很好的用户体验。
因为音响设备本身具有成熟音响模块,其语音录入与播出技术更为成熟,具有作为语音控制的智能化交互设备的核心设备的巨大优势。
发明内容
本发明的目的就在于提供一种解决上述问题,基于声音信息定位的交互系统。
为了实现上述目的,本发明采用的技术方案是:一种基于声音信息定位的交互系统,包括音响,所述音响内设有声场定位模块、声源识别判定模块、声源定位模块、异常声音修正模块、智能控制模块,
所述声场定位模块通过播放测试音波,准确的测量出室内空间大小,建三维立体空间图形,并储存记录下来;
所述声源定位模块,判定声源的发生位置距离,并通过声场定位模块模拟的声场环境进行校正,利用定位算法与声场的比较校正,准确判定声源的发声位置;
所述声源识别判定模块,提前录取用户的声音,解析出用户的声纹的特定性,作为判定识别用户的依据;
所述异常声音修正模块,对发出的异常声音进行修订,去除用户声纹中的异常杂音;
所述声源识别判定模块,准确识别用户的定位位置信息和声源指令,并将指令信息与位置信息发送至智能设备进行智能化控制;
所述智能控制模块,根据准确的定位位置信息和声源指令,准确判定离用户距离最近以及描述最为贴近的智能化设备。
作为优选,所述声源识别判定模块存储多个用户的声纹特性,并分别建立单独的信息采集输送通道,实现多通道同时驱动控制。
作为优选,所述声场定位模块,建三维立体空间图形内含有智能化设备的位置信息。
作为优选,还包括编辑模块,用户可对三维立体空间图形内的智能化设备进行手动标识并绑定声音指令。
作为优选,所述智能控制模块处理时,当声源指令中有明显的定位信息时,优先选择开启具有明确定位信息的智能化设备。
作为优选,所述声源识别判定模块内还设有声音AI学习模块,人工智能学习新的技术名词,以便发出准确的声源指令。
作为优选,若实施场景为多个房间的室内,则在各房间内均设有声场定位模块和声源定位模块,以便对整屋智能化设备进行驱动控制。
作为优选,系统定期通过声场定位模块进行场景扫描,并校正智能设备的位置信息。
作为优选,系统初始化分为出厂格式化和保留场景信息的用户信息初始化。
与现有技术相比,本发明的优点在于:本发明优化了智能化音响的交互,以智能音响为基础载体,实现了所有智能化设备的整体控制,解决了语音过程中很多误操作的问题,语音控制更加方便易懂,交互起来更为流畅,具有很好的用户体验。
具体实施方式
下面将对本发明作进一步说明。
实施例1:一种基于声音信息定位的交互系统,包括音响,以音响为基础,利用音响成熟的技术,避免在其他智能设备中增设昂贵的音响设备,且从基础上解决语音收录不清楚的问题,所述音响内设有声场定位模块、声源识别判定模块、声源定位模块、异常声音修正模块、智能控制模块,
所述声场定位模块利用音响的声音播放装置,播放测试音波,利用声场准确的测量出室内空间大小,建三维立体空间图形,并储存记录下来;所述声场定位模块,建三维立体空间图形内含有智能化设备的位置信息;
所述声源定位模块,判定声源的发生位置距离,并通过声场定位模块模拟的声场环境进行校正,利用定位算法与声场的比较校正,准确判定声源的发声位置,通过声源定位模块与声场定位模块能准确定位声源发生用户的准确位置,以便进行精准化的控制;
所述声源识别判定模块,提前录取用户的声音,解析出用户的声纹的特定性,作为判定识别用户的依据,实现指令输入权限的限定,避免误操作,同时声纹特性具有标识性,用户只需要直接语音指令,即可激活指令操作,无需先输入唤醒口令,如苹果手机“嘿SIRI”唤醒口令;尤其说明,语音指令可设定为简短的指令激活,当用户说的一段话语中含有该指令文字,指令也无法激活。避免误说话造成指令误操作,给予用户更好的用户体验。
所述异常声音修正模块,对发出的异常声音进行修订,用于去除用户语音中的异常杂音,用于去除外界杂音造成的语音误操作,使语音指令更精准,用户体验感更好;
所述声源识别判定模块,准确识别用户的定位位置信息和声源指令,并将指令信息与位置信息发送至智能设备进行智能化控制,声源识别判定模块进行声源语音指令的准确判定后发送至指定的智能设备进行控制;
所述智能控制模块,根据准确的定位位置信息和声源指令,准确判定离用户距离最近以及描述最为贴近的智能化设备,智能控制模准确找到用户指定的智能化设备的种类后,只向离用户最近的一台设备发出控制指令,以此解决指令发出指向不明确的问题。
所述声源识别判定模块存储多个用户的声纹特性,并分别建立单独的信息采集输送通道,实现多通道同时驱动控制,实现多通道控制,多个用户可同时发出不同的语音指令,能同时进行不同的语音指令操作,多人使用,提高用户体验感。
还包括编辑模块,用户可对三维立体空间图形内的智能化设备进行手动标识并绑定声音指令,用户可根据自己习惯需求自定义指令。
所述智能控制模块处理时,当声源指令中有明显的定位信息时,优先选择开启具有明确定位信息的智能化设备,明显的定位信息包括:厨房、客厅、餐厅、前、后、左、右等,以及一些特定词语,如所有、全部、左边、右边等,以及结合信息,如厨房全部灯、客厅部分灯等。通过以上处理,站在客厅,及要求卧室的全部或部分灯光开启,或以用户所站位置为基准,要求前面一排的灯开启,或后面一排的灯开启,实现精准化、随意化、人性化的精准且明确化的控制。
所述声源识别判定模块内还设有声音AI学习模块,能人工智能学习新的技术名词,以便发出准确的声源指令,AI学习模块能智能学习,找到新的名词归类,准确识别智能化设备名称,同时能实现语言的多样性,解决地方方言等语言不统一的问题,即使采用地方方言也能实现准确的指令控制,在用户语音指令不标准,但指令开启正确时,学习并记录该指令。大大提高了用户的使用舒适度。
若实施场景为多个房间的室内,则在各房间内均设有声场定位模块和声源定位模块,以便对整屋智能化设备进行驱动控制,方便每个方便的场景扫描以及声源定位,在任意房间内均可进行所有指令的控制。
系统定期通过声场定位模块进行场景扫描,并校正智能设备的位置信息,在更新、添置新的智能化设备时,及时记录备案,自动更新添置到三维立体空间图形中。
系统初始化分为出厂格式化和保留场景信息的用户信息初始化,出厂格式化所有信息恢复出厂设置,用户信息初始化,保留场景信息,用户信息初始化,在场景不变化时,格式化用户信息,方便设置新的用户信息,减少重置时间。以上对本发明所提供的一种基于声音信息定位的交互系统进行了详尽介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,对本发明的变更和改进将是可能的,而不会超出附加权利要求所规定的构思和范围,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (9)
1.一种基于声音信息定位的交互系统,包括音响,其特征在于:所述音响内设有声场定位模块、声源识别判定模块、声源定位模块、异常声音修正模块、智能控制模块,
所述声场定位模块通过播放测试音波,准确的测量出室内空间大小,建三维立体空间图形,并储存记录下来;
所述声源定位模块,判定声源的发生位置距离,并通过声场定位模块模拟的声场环境进行校正,利用定位算法与声场的比较校正,准确判定声源的发声位置;
所述声源识别判定模块,提前录取用户的声音,解析出用户的声纹的特定性,作为判定识别用户的依据;
所述异常声音修正模块,对发出的异常声音进行修订,去除用户声纹中的异常杂音;
所述声源识别判定模块,准确识别用户的定位位置信息和声源指令,并将指令信息与位置信息发送至智能设备进行智能化控制;
所述智能控制模块,根据准确的定位位置信息和声源指令,准确判定离用户距离最近以及描述最为贴近的智能化设备。
2.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:所述声源识别判定模块存储多个用户的声纹特性,并分别建立单独的信息采集输送通道,实现多通道同时驱动控制。
3.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:所述声场定位模块,建三维立体空间图形内含有智能化设备的位置信息。
4.根据权利要求3所述的一种基于声音信息定位的交互系统,其特征在于:还包括编辑模块,用户可对三维立体空间图形内的智能化设备进行手动标识并绑定声音指令。
5.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:所述智能控制模块处理时,当声源指令中有明显的定位信息时,优先选择开启具有明确定位信息的智能化设备。
6.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:所述声源识别判定模块内还设有声音AI学习模块,人工智能学习新的技术名词。
7.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:若实施场景为多个房间的室内,则在各房间内均设有声场定位模块和声源定位模块。
8.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:系统定期通过声场定位模块进行场景扫描,并校正智能设备的位置信息。
9.根据权利要求1所述的一种基于声音信息定位的交互系统,其特征在于:系统初始化分为出厂格式化和保留场景信息的用户信息初始化。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810228883.XA CN108597536A (zh) | 2018-03-20 | 2018-03-20 | 一种基于声音信息定位的交互系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810228883.XA CN108597536A (zh) | 2018-03-20 | 2018-03-20 | 一种基于声音信息定位的交互系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108597536A true CN108597536A (zh) | 2018-09-28 |
Family
ID=63626753
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810228883.XA Pending CN108597536A (zh) | 2018-03-20 | 2018-03-20 | 一种基于声音信息定位的交互系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108597536A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120215537A1 (en) * | 2011-02-17 | 2012-08-23 | Yoshihiro Igarashi | Sound Recognition Operation Apparatus and Sound Recognition Operation Method |
CN103716747A (zh) * | 2012-10-02 | 2014-04-09 | 索尼公司 | 声音处理设备及方法,程序和记录介质 |
WO2015059764A1 (ja) * | 2013-10-22 | 2015-04-30 | 三菱電機株式会社 | ナビゲーション用サーバ、ナビゲーションシステムおよびナビゲーション方法 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
CN106054131A (zh) * | 2016-05-10 | 2016-10-26 | 北京地平线信息技术有限公司 | 声源定位系统和方法 |
CN106782563A (zh) * | 2016-12-28 | 2017-05-31 | 上海百芝龙网络科技有限公司 | 一种智能家居语音交互系统 |
CN105280183B (zh) * | 2015-09-10 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 语音交互方法和系统 |
CN107452386A (zh) * | 2017-08-16 | 2017-12-08 | 联想(北京)有限公司 | 一种语音数据处理方法和系统 |
CN107527615A (zh) * | 2017-09-13 | 2017-12-29 | 联想(北京)有限公司 | 信息处理方法、装置、设备、系统及服务器 |
-
2018
- 2018-03-20 CN CN201810228883.XA patent/CN108597536A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120215537A1 (en) * | 2011-02-17 | 2012-08-23 | Yoshihiro Igarashi | Sound Recognition Operation Apparatus and Sound Recognition Operation Method |
CN103716747A (zh) * | 2012-10-02 | 2014-04-09 | 索尼公司 | 声音处理设备及方法,程序和记录介质 |
WO2015059764A1 (ja) * | 2013-10-22 | 2015-04-30 | 三菱電機株式会社 | ナビゲーション用サーバ、ナビゲーションシステムおよびナビゲーション方法 |
CN105206275A (zh) * | 2015-08-31 | 2015-12-30 | 小米科技有限责任公司 | 一种设备控制方法、装置及终端 |
CN105280183B (zh) * | 2015-09-10 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 语音交互方法和系统 |
CN106054131A (zh) * | 2016-05-10 | 2016-10-26 | 北京地平线信息技术有限公司 | 声源定位系统和方法 |
CN106782563A (zh) * | 2016-12-28 | 2017-05-31 | 上海百芝龙网络科技有限公司 | 一种智能家居语音交互系统 |
CN107452386A (zh) * | 2017-08-16 | 2017-12-08 | 联想(北京)有限公司 | 一种语音数据处理方法和系统 |
CN107527615A (zh) * | 2017-09-13 | 2017-12-29 | 联想(北京)有限公司 | 信息处理方法、装置、设备、系统及服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105794231B (zh) | 免提波束方向图配置 | |
US9584942B2 (en) | Determination of head-related transfer function data from user vocalization perception | |
CN104394491B (zh) | 一种智能耳机、云服务器以及音量调节方法和系统 | |
CN109246515B (zh) | 一种可提升个性化音质功能的智能耳机及方法 | |
US20230410813A1 (en) | Voice assistant persistence across multiple network microphone devices | |
US20210280172A1 (en) | Voice Response Method and Device, and Smart Device | |
WO2019134473A1 (zh) | 语音识别系统、方法和装置 | |
WO2015108794A1 (en) | Dynamic calibration of an audio system | |
TW201820315A (zh) | 改良型音訊耳機裝置及其聲音播放方法、電腦程式 | |
CN105276751B (zh) | 语音播放方法及系统 | |
CN109473095A (zh) | 一种智能家居控制系统及控制方法 | |
CN110049428A (zh) | 用于实现多声道环绕立体声播放的方法、播放设备及系统 | |
CN106792365B (zh) | 一种音频播放方法及装置 | |
CN103491406A (zh) | 一种基于语音识别的android智能电视系统 | |
CN106033676A (zh) | 音频播放控制方法和装置、电子设备 | |
CN106981289A (zh) | 一种识别模型训练方法及系统以及智能终端 | |
CN107948623A (zh) | 投影仪及其音乐关联信息显示方法 | |
CN110347365A (zh) | 自动调节播报音量的方法和装置及声音播报设备 | |
CN111412587B (zh) | 空调器的语音处理方法、装置、空调器和存储介质 | |
CN108870650A (zh) | 一种空调及一种空调的控制方法 | |
CN108597536A (zh) | 一种基于声音信息定位的交互系统 | |
US20240112675A1 (en) | Multi-device output management based on speech characteristics | |
CN110505553A (zh) | 车内音箱喇叭播放方法及播放装置 | |
CN201196877Y (zh) | 声控式家庭音响 | |
KR20110134119A (ko) | 외국어 학습을 위한 자청 학습 방법 및 학습기 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180928 |
|
RJ01 | Rejection of invention patent application after publication |