CN104484151A - 声控系统、设备及方法 - Google Patents
声控系统、设备及方法 Download PDFInfo
- Publication number
- CN104484151A CN104484151A CN201410841708.XA CN201410841708A CN104484151A CN 104484151 A CN104484151 A CN 104484151A CN 201410841708 A CN201410841708 A CN 201410841708A CN 104484151 A CN104484151 A CN 104484151A
- Authority
- CN
- China
- Prior art keywords
- acoustic control
- equipment
- video signals
- digital audio
- main equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000004044 response Effects 0.000 claims abstract description 41
- 230000005236 sound signal Effects 0.000 claims abstract description 39
- 230000005540 biological transmission Effects 0.000 claims description 77
- 230000006698 induction Effects 0.000 claims description 55
- 238000012546 transfer Methods 0.000 claims description 18
- 230000008859 change Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 description 18
- 230000032683 aging Effects 0.000 description 11
- 230000008569 process Effects 0.000 description 6
- 238000005265 energy consumption Methods 0.000 description 5
- 230000008054 signal transmission Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013144 data compression Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000004378 air conditioning Methods 0.000 description 1
- 239000003990 capacitor Substances 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Selective Calling Equipment (AREA)
Abstract
一种声控系统、设备及方法,所述声控系统包括:声控主设备、声控从设备及云端语义解析器,其中:所述声控从设备,适于与所述声控主设备建立无线连接,采集模拟音频信号并转变为数字音频信号,并通过所述无线连接传输至所述声控主设备;所述声控主设备,适于与所述声控从设备建立无线连接;通过所述无线连接接收所述数字音频信号,并发送至所述云端语义解析器,接收所述云端语义解析器发送的控制指令,并根据所述控制指令,作出对应的响应操作;所述云端语义解析器,适于搜索词库以解析所述数字音频信号,并将解析完成的控制指令发送至所述声控主设备。所述声控系统、设备及方法可以提高声控时效性及语义识别率。
Description
技术领域
本发明涉及声控技术领域,尤其涉及一种声控系统、设备及方法。
背景技术
随着多媒体技术的迅猛发展,家庭多媒体设备的功能越来越多,这些设备的遥控装置被设计成拥有很多按键,且这些按键与所述家庭多媒体设备所支持的功能一一对应,因而每个多媒体设备都需要定制一个遥控装置。由于每个遥控器的按键众多,各个遥控器上按键位置不同,因而会给用户的使用带来诸多不便。
针对这一问题,目前,一些多媒体设备将声控功能加入到遥控装置,简化了控制难度。例如,通过蓝牙声控点播系统在进行音视频节目的点播时取代手动控制,可以大大减少按键操作的复杂性,使点播活动变得更加方便易用。具体而言,通过语音采集并对采集到的语音进行滤波等预处理,然后通过蓝牙模块进行传输至数字信号处理器,由所述数字信号处理器进行语音辨识操作,如果识别正确,则播放所点播的节目。
然而,目前的声控系统在时效性的要求下,存在语义识别率低的问题。
发明内容
本发明实施例解决的问题是在保证时效性的情况下,如何提高声控系统的语义识别率。
为解决上述问题,本发明实施例提供了一种声控系统,其特征在于,包括:声控主设备、声控从设备及云端语义解析器,其中:
所述声控从设备,适于与所述声控主设备建立无线连接,采集模拟音频信号并转变为数字音频信号,并通过所述无线连接传输至所述声控主设备;
所述声控主设备,适于与所述声控从设备建立无线连接;通过所述无线连接接收所述数字音频信号,并发送至所述云端语义解析器,接收所述云端语义解析器发送的控制指令,并根据所述控制指令,作出对应的响应操作;
所述云端语义解析器,适于搜索词库以解析所述数字音频信号,并将解析完成的控制指令发送至所述声控主设备。
可选的,所述声控从设备适于在启动音频采集的条件满足时,采集所述模拟音频信号。
可选的,所述声控从设备包括:
音频采集单元,适于在接收到启动采集的指令时,采集模拟音频信号并将其转变为数字音频信号;
感应触发单元,适于感应所述启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元发送启动采集的指令;
第一连接传输单元,适于向所述声控主设备发送无线连接请求,与所述声控主设备建立无线连接,将所述音频采集单元输出的数字音频信号通过所述无线连接发送至所述声控主设备。
可选的,所述感应触发单元包括以下至少一种:
接触式感应触发单元,适于在感应到预设的按键被按下时,向所述音频采集单元发送启动采集的指令;
接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元发送启动采集的指令。
可选的,所述声控从设备还包括:按键检测单元,适于检测预设的按键组合是否被按下,并在预设的按键组合被按下时将相应信号传输至所述第一连接传输单元;
所述第一连接传输单元在所述预设的按键组合被按下后,开始扫描无线主机,向扫描到的无线主机发送无线连接请求。
可选的,所述声控主设备包括:第二连接传输单元和声控响应单元,其中:
所述第二连接传输单元,适于接收所述第一连接传输单元发送的无线连接请求,与所述声控从设备建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器,接收所述云端语义解析器解析完成的控制指令并传输至声控响应单元;
所述声控响应单元,适于根据所述第二连接传输单元传输的控制指令,完成相应的响应操作。
可选的,所述声控从设备适于将所述数字音频信号以非压缩编码格式通过所述无线连接传输至所述声控主设备。
可选的,所述云端语义解析器包括:词库、传输单元和解析单元,其中:
词库,适于存储数字音频信号与控制指令的对应关系;
传输单元,适于接收所述声控主设备传输的数字音频信号,并将所述解析单元解析得到的控制指令发送至所述声控主设备;
解析单元,适于将所述传输单元接收到的数字音频信号与所述词库进行匹配,解析得到相应的控制指令,并将解析得到的控制指令发送至所述传输单元。
可选的,所述云端语义解析器还包括:更新单元,适于更新所述词库。
为解决上述问题,本发明实施例还提供了一种声控设备,所述声控设备包括:
音频采集单元,适于采集模拟音频信号并将其转变为数字音频信号;
第一连接传输单元,适于发送无线连接请求,建立无线连接,将所述音频采集单元输出的数字音频信号通过所述无线连接发送出去。
可选,所述声控设备还包括:感应触发单元,适于感应启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元发送启动采集的指令;
所述音频采集单元适于在接收到所述启动采集的指令时,执行所述采集模拟音频信号并将其转变为数字音频信号的操作。
可选的,所述感应触发单元包括以下至少一种:
接触式感应触发单元,适于在感应到预设的按键被按下时,向所述音频采集单元发送启动采集的指令;
接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元发送启动采集的指令。
可选的,所述声控设备还包括按键检测单元,适于检测按键的状态,并由所述第一连接传输单元通过所述无线连接传输出去。
可选的,所述按键检测单元还适于检测预设的组合按键是否被按下,并在预设的按键组合被按下时传输至所述第一连接传输单元;
所述第一连接传输单元在所述预设的按键组合被按下后,开始扫描声控主设备,向扫描到的声控主设备发送无线连接请求。
可选的,所述第一连接传输单元适于将所述数字音频信号以非压缩编码格式通过所述无线连接发送出去。
为解决上述问题,本发明实施例还提供了另一种声控设备,所述声控设备包括:第二连接传输单元和声控响应单元,其中:
第二连接传输单元,适于接收无线连接请求,建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器,接收所述云端语义解析器解析完成的控制指令并传输至所述声控响应单元;
所述声控响应单元,适于根据所述第二连接传输单元传输的控制指令,执行相应的响应操作。
为解决上述问题,本发明实施例还提供了一种声控方法,所述声控方法包括:
由所述声控从设备采集模拟音频信号并转变为数字音频信号,并通过与声控主设备之间所建立的无线连接将所述数字音频信号传输至所述声控主设备;
由所述声控主设备接收所述数字音频信号并传输至所述云端语义解析器;
由所述云端语义解析器搜索词库以解析所述数字音频信号,并将解析完成的控制指令传输至所述声控主设备;
所述声控主设备根据所述控制指令,作出对应的响应操作。
可选的,所述声控主设备根据所述控制指令,作出对应的响应操作,包括以下任意一种:
开机;
关机;
打开或关闭所述声控主设备的相应功能;
通过所述声控主设备控制与所述声控主设备连接的其他设备。
可选的,所述声控从设备在检测到预设的启动音频采集的条件满足时,执行所述采集模拟音频信号的操作。
可选的,所述预设的启动音频采集的条件,包括以下至少一种:
预设的按键被按下;
感应元件与被感应物体之间的距离小于预设的距离。
可选的,所述在声控主设备和声控从设备之间建立无线连接,包括:
声控从设备启动无线从机模式,扫描无线主机设备,对扫描到的无线主机发送无线连接建立请求;
启动了无线主机模式的声控主设备在检测到声控从设备的无线连接建立请求后,与所述声控从设备建立无线连接,并发送无线连接状态信息。
可选的,在预设的组合按键被按下时,声控从设备启动无线从机模式,扫描无线主机设备。
可选的,所述将所述数字音频信号传输至所述声控主设备,包括:
将所述数字音频信号以非压缩编码格式传输至所述声控主设备。
可选的,所述声控方法还包括:所述云端语义解析器更新所述词库。
本发明实施例还提供了另一种声控方法,其特征在于,包括:
通过与声控从设备之间的无线连接接收数字音频信号,所述数字音频信号为所述声控从设备采集得到的模拟音频信号转换而成;
将所述数字音频信号发送至云端语义解析器;
接收所述云端语义解析器解析完成的控制指令,并根据所述控制指令,执行相应的响应操作。
可选的,所述根据所述控制指令,执行相应的响应操作,包括以下至少一种:
开机;
关机;
打开或关闭相应功能;
控制其他设备。
与现有技术相比,本发明实施例的技术方案具有以下优点:
由声控从设备采集模拟音频信号并转变为数字音频信号,并通过声控主设备和声控从设备之间所建立的无线连接传输数字音频信号,并由云端语义解析器对所述数字音频信号进行解析,并根据解析完成的指令作出对应的响应操作,从而实现声控。这一过程中,通过无线连接传输数字音频信号,可以保证信号传输的时效性,而且,由于云端语义解析器可以具有更强大的数据处理能力,更完善的词库,因而可以在较短的时间内,解析出数字音频信号所对应的各种可能的控制指令,因而在保证时效性的情况下,可以提高语义识别率。
进一步地,在启动音频采集的条件满足时,声控从设备再采集所述模拟音频信号,可以避免误触发,并节约系统能耗。
进一步地,通过非压缩编码方式直接传输所述数字音频信号,无须压缩及解压缩处理,故可以进一步节约处理时间,并可以避免数据压缩对信号质量的影响,因而可以在进一步提高其时效性及语义识别率。
此外,云端语义解析器的词库可以及时进行更新,故可以根据用户的需要不断地更新词库,满足用户的个性化需求。
进一步地,通过所述声控系统可以控制声控主设备开机、关机、打开或关闭相应功能,或者控制与所述声控主设备连接的其他设备,可以控制多种设备及功能,因而具有广泛的适用范围,故可以替代手动控制,用户无须熟悉、辨别或记忆键盘输入复杂的功能、符号和位置,故可以给用户带来极大方便。
附图说明
图1是本发明实施例中一种声控系统的结构示意图;
图2是本发明实施例中一种声控设备的结构示意图;
图3是本发明实施例中另一种声控设备的结构示意图;
图4是本发明实施例中一种声控方法的流程图;
图5是本发明实施例中另一种声控方法的流程图。
具体实施方式
如前所述,本地化的声控系统存在语义识别率低的问题。
为解决上述问题,本发明实施例通过声控主设备和声控从设备之间所建立的无线连接传输数字音频信号,并由云端语义解析器对所述数字音频信号进行解析,并根据解析完成的指令作出对应的响应操作,从而实现声控。这一过程中,通过无线连接传输数字音频信号,可以保证信号传输的时效性,而且,由于云端语义解析器可以具有更强大的数据处理能力,更完善的词库,因而可以在较短的时间内,解析出数字音频信号所对应的各种可能的控制指令,因而在保证时效性的情况下,可以提高语义识别率。
为使本发明实施例的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。
参照图1所示的声控系统的结构示意图,在本发明一实施例中,声控系统包括:声控主设备1、声控从设备2及云端语义解析器3,其中:
所述声控从设备2,适于与所述声控主设备1建立无线连接,采集模拟音频信号并转变为数字音频信号,并通过所述无线连接传输至所述声控主设备1;
所述声控主设备1,适于与所述声控从设备2建立无线连接;通过所述无线连接接收所述数字音频信号,并发送至所述云端语义解析器13,接收所述云端语义解析器3发送的控制指令,并根据所述控制指令,作出对应的响应操作;
所述云端语义解析器3,适于搜索词库以解析所述数字音频信号,并将解析完成的控制指令发送至所述声控主设备1。
在具体实施中,声控主设备1可以通过网关将所述数字音频信号传输至云端语义解析器3。
需要说明的是,无线连接允许无线网络中的设备无须通过热点和路由器即可以点对点形式相互直接连接,并传输数据或共享应用。并且,本发明实施例中的无线连接可以支持一对一直连,也可以实现多台设备同时连接,例如,一个声控主设备可以同时或先后与多个声控从设备建立无线连接。在具体实施中,无线标准可以支持所有的WiFi设备,从11a/b/g至11n,不同标准的WiFi设备之间也可以直接互联。无线设备可以以点对点形式互联。
在具体实施中,为了避免数据压缩过程对所述数字音频信号的质量造成影响,所述声控从设备2可以将所述数字音频信号以非压缩编码格式通过所述无线连接传输至所述声控主设备。
在本发明一实施例中,声控主设备1与声控从设备2之间通过WiFi-Direct连接传输所述数字音频信号。
可以理解的是,在本发明其他实施例中,还可以采用其他的无线连接方式将所述数字音频信号从所述声控从设备2传输至所述声控主设备1,例如通过蓝牙、RF4CE或ZigBee等,只要其传输速率能够满足声控系统对时效性的要求即可。
在具体实施中,所述声控主设备1与声控从设备2可以采用如下方式建立无线连接:所述声控从设备2可以启动无线主机模式,扫描无线主机,向扫描到的无线主机发送无线连接建立请求,启动了无线主机模式的声控主设备1在检测到声控从设备的无线连接建立请求后,建立无线连接,之后可以发送无线连接状态信息给声控从设备2。
采用上述声控系统,由于声控主设备1和声控从设备2之间采用无线连接传输数字音频信号,可以保证信号传输的时效性,由于云端语义解析器可以具有更强大的数据处理能力,更完善的词库,因而可以在较短的时间内,解析出数字音频信号所对应的各种可能的控制指令,因而在保证时效性的情况下,可以提高语义识别率。
在具体实施中,为了避免误操作,所述声控从设备2可以在启动音频采集的条件满足时,采集所述模拟音频信号。
在本发明一实施例中,参照图1,所述声控从设备2可以包括如下组成部分:
音频采集单元21,适于在接收到启动采集的指令时,采集模拟音频信号并将其转变为数字音频信号;
感应触发单元22,适于感应所述启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元21发送启动采集的指令;
第一连接传输单元23,适于向所述声控主设备1发送无线连接请求,与所述声控主设备1建立无线连接,将所述音频采集单元21输出的数字音频信号通过所述无线连接发送至所述声控主设备1。
在具体实施中,所述感应触发单元22可以有多种实现方式,例如:所述感应触发单元22可以为接触式感应触发单元,接近式感应触发单元,还可以为其他形式的感应触发单元。
在本发明实施例中,接触式感应触发单元可以为按键检测单元,也可以为电阻式感应单元或者其他形式的接触式感应触发单元。其中,按键检测单元适于在所述无线连接建立后感应到预设的按键被按下时,向所述音频采集单元21发送启动采集的指令。电阻式感应单元如电阻式触摸屏适于在所述无线连接建立后检测到所述电阻式触摸屏上预设区域上的电阻发生变化时,向所述音频采集单元21发送启动采集的指令。
在本发明另一实施例中,所述感应触发单元22包括:接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元21发送启动采集的指令。
在具体实施中,所述接近式感应触发单元也可以采用多种形式,所述接近式感应触发单元可以为红外感应式触发单元或电容感应式触发单元。在本发明一实施例中,所述接近式感应触发单元包括电容式感应触发单元,适于在感应到电容大于预设值时,向所述音频采集单元发送启动采集的指令。
从上述实施例可以看出,通过感应触发单元22在检测到所述音频采集单元21启动采集的条件满足时,触发所述音频采集单元21启动采集,可以节约系统能耗,避免误触发。可以理解的是,在本发明其他实施例中,所述声控从设备2也可以不包含感应触发单元22,在所述声控从设备2启动后,所述音频采集单元21采集模拟音频信号并将其转变为数字音频信号,并通过所述第一连接传输单元23实时将所述音频采集单元21输出的数字音频信号通过所述无线连接发送至所述声控主设备1即可。
在具体实施中,所述声控从设备2还可包括按键检测单元24,适于检测按键的状态,并由所述第一连接传输单元23通过所述无线连接传输至所述声控主设备。
在具体实施中,所述按键检测单元24还可用于检测预设的组合按键是否被按下,并在预设的按键组合被按下时将相应信号传输至所述第一连接传输单元23;相应地,所述第一连接传输单元23在所述预设的按键组合被按下后,开始扫描无线主机,向扫描到的无线主机发送无线连接请求。
在具体实施中,所述按键检测单元24可与感应触发单元中的按键检测单元共用。
在具体实施中,所述声控从设备2可以是遥控器、手机等手持终端等。
参照图1,在本发明一实施例中,所述声控主设备1可以包括:第二连接传输单元11和声控响应单元12,其中:
所述第二连接传输单元11,适于接收所述第一连接传输单元23发送的无线连接请求,与所述声控从设备2建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器3,接收所述云端语义解析器3解析完成的控制指令并传输至声控响应单元12;
所述声控响应单元12,适于根据所述第二连接传输单元11传输的控制指令,完成相应的响应操作。
在具体实施中,可以设置不同的声控指令进行多种控制操作。例如,在本发明实施例,所述声控设备根据相应的控制指令,可以进行如下操作:声控主设备的开机、关机、打开或关闭声控主设备中的相应功能(例如播放指定的音视频),对与所述声控主设备相连的其他设备的控制等其中一种或多种。
通过所述声控系统可以控制声控主设备1开机、关机、打开或关闭相应功能,或者控制与所述声控主设备1连接的其他设备,可以控制多种设备及功能,因而具有广泛的适用范围,故可以替代手动控制,用户无须熟悉、辨别或记忆键盘输入复杂的功能、符号和位置,故可以给用户带来极大方便。
在具体实施中,所述声控主设备1的适用范围相当广泛,例如可以是电视、音响、空调、电饭煲等烹调用具、冰箱、便携式终端如笔记本、车载设备等等。
参照图1,在具体实施中,所述云端语义解析器3可以包括词库31、传输单元32和解析单元33,其中:
词库31,适于存储数字音频信号与控制指令的对应关系;
传输单元32,适于接收所述声控主设备1传输的数字音频信号,并将所述解析单元33解析得到的控制指令发送至所述声控主设备1;
解析单元33,适于将所述传输单元32接收到的数字音频信号与所述词库31进行匹配,解析得到相应的控制指令,并将解析得到的控制指令发送至所述传输单元32。
在具体实施中,所述词库31可以存储不同语言种类的控制指令与相应操作之间的对应关系,为了满足用户的个性化需求,还可以存储不同方言的控制指令与相应操作之间的对应关系。
所述解析单元33可以对所述数字音频信号中的信息进行并行处理,以快速准确地识别所述数字音频信号对应的控制指令。
在具体实施中,为了满足用户的个性化需求,提高语义识别能力,所述云端语义解析器3还可包括:更新单元34,适于更新所述词库。在具体实施中,可以对词库中的语言种类、不同的方言、网络热点词汇、以及具体用户的个性化语音、语调特点对所述词库进行不断更新,从而可以不断提高声控系统的语义识别能力,增加声控系统可控制功能。
本发明实施例还提供了相应的声控设备,参照图2,在本发明一实施例中,声控设备20包括:音频采集单元201、感应触发单元202、第一连接传输单元203,其中:
音频采集单元201,适于在接收到启动采集的指令时,采集模拟音频信号并将其转变为数字音频信号;
感应触发单元202,适于感应启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元201发送启动采集的指令;
第一连接传输单元203,适于发送无线连接请求,建立无线连接,将所述音频采集单元输出的数字音频信号通过所述无线连接发送出去。
在具体实施中,为了进一步提高语义识别的时效性并避免由于压缩对信号质量的影响,提高语义识别率,所述第一连接传输单元可以将所述数字音频信号以非压缩编码格式通过所述无线连接发送出去。
在具体实施中,所述感应触发单元202可以为接触式感应触发单元,也可以为接近式感应触发单元,还可以为其他形式的感应触发单元。
在本发明一实施例中,所述感应触发单元202包括:接触式感应触发单元,适于在感应到预设的按键被按下时,向所述音频采集单元发送启动采集的指令。
在具体实施中,所述接触式感应单元可以为按键检测单元,也可以为电阻式触摸屏或者其他形式的接触式感应触发单元。其中,按键检测单元适于在所述无线连接建立后感应到预设的按键被按下时,向所述音频采集单元21发送启动采集的指令。电阻式感应单元如电阻式触摸屏适于在所述无线连接建立后检测到所述电阻式触摸屏上预设区域上的电阻发生变化时,向所述音频采集单元21发送启动采集的指令。
在本发明另一实施例中,所述感应触发单元202包括:接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元201发送启动采集的指令。
在本发明一实施例中,所述接近式感应触发单元202包括电容式感应触发单元,适于在感应到电容大于预设值时,向所述音频采集单元发送启动采集的指令。
在本发明另一实施例中,所述接近式感应触发单元202包括红外感应触发单元,适于当感应到与物体之间的距离小于预设的距离时,向所述音频采集单元201发送启动采集的指令。
可以理解的是,在具体实施中,所述声控设备还可以同时包含接触式感应触发单元和接近式感应触发单元,也可以包含其他形式的感应触发单元,以确定是否启动音频采集。
从上述实施例可以看出,通过感应触发单元202在检测到所述音频采集单元201启动采集的条件满足时,触发所述音频采集单元201启动采集,可以节约系统能耗,避免误触发。可以理解的是,在本发明其他实施例中,所述声控设备20也可以不包含感应触发单元202。
参照图2,在具体实施中,声控设备20还可包括按键检测单元204,适于检测按键的状态,并由所述第一连接传输单元通过所述无线连接传输出去。在具体实施中,所述按键检测单元204还适于检测预设的组合按键是否被按下,并在预设的按键组合被按下时传输至所述第一连接传输单元203。相应地,所述第一连接传输单元203在所述预设的按键组合被按下后,开始扫描无线主机,向扫描到的无线主机发送无线连接请求。
在具体实施中,所述按键检测单元204可与感应触发单元202中的按键检测单元共用。
本发明实施例还提供了另一种声控设备,参照图3,在本发明一实施例中,声控设备30包括:第二连接传输单元301和声控响应单元302,其中:
第二连接传输单元301,适于接收无线连接请求,建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器3,接收所述云端语义解析器3解析完成的控制指令并传输至所述声控响应单元302;
所述声控响应单元302,适于根据所述第二连接传输单元301传输的控制指令,执行相应的响应操作。
本发明实施例还提供了与上述声控设备相应的声控方法,为使本领域技术人员更好地理解和实现本发明,以下参照附图,通过具体实施例进行详细说明。
S41,在声控主设备和声控从设备之间建立无线连接。
在具体实施中,可以采用如下方式在所述在声控主设备和声控从设备之间建立无线连接:声控从设备启动无线从机模式,扫描无线主机设备,对扫描到的无线主机发送无线连接建立请求;启动了无线主机模式的声控主设备在检测到声控从设备的无线连接建立请求后,与所述声控从设备建立无线连接,并发送无线连接状态信息。
在具体实施中,为节省系统能耗,声控从设备可以在预设的组合按键被按下时,启动无线从机模式,扫描无线主机设备。
S42,由所述声控从设备采集模拟音频信号并转变为数字音频信号。
在具体实施中,所述声控从设备在检测到预设的启动音频采集的条件满足时,再采集模拟音频信号。在本发明一实施例中,所述预设的启动音频采集的条件,可以是预设的按键被按下。在本发明另一实施例中,可以是在感应元件与被感应物体之间的距离小于预设的距离。在本发明又一实施例中,可以是预设的按键被按下,或者是感应元件在检测到与被感应物体之间的距离小于预设的距离时均可启动音频采集。可以理解的是,在具体实施中,根据需要,还可以设置其他的启动音频采集的条件。
通过预先设置启动音频采集的条件,在预设的启动音频采集的条件满足时再采集模拟音频信号,可以节约系统能耗。
S43,通过所述无线连接将所述数字音频信号传输至所述声控主设备。
S44,由所述声控主设备接收所述数字音频信号并传输至所述云端语义解析器。
在具体实施中,可以通过网关将所述数字音频信号传输至云端语义解析器。
S45,由所述云端语义解析器解析所述数字音频信号。
在具体实施中,所述云端语义解析器可以通过搜索词库,查找所述数字音频信号对应的控制指令,完成对所述数字音频信号的解析。
S46,将解析完成的控制指令传输至所述声控主设备。
S47,所述声控主设备根据所述控制指令,作出对应的响应操作。
在具体实施中,可以设置不同的声控指令进行多种控制操作。例如,在本发明实施例,所述声控设备根据相应的控制指令,可以进行如下操作:声控主设备的开机、关机、打开或关闭声控主设备中的相应功能,对与所述声控主设备相连的其他设备的控制等其中一种或多种。
参照图5,本发明实施例还提供了另一种声控方法,具体步骤如下:
S51,通过与声控从设备之间的无线连接接收数字音频信号,所述数字音频信号为所述声控从设备采集得到的模拟音频信号转换而成;
在具体实施中,可以在接收到来自声控从设备的无线连接请求时,与所述声控从设备建立无线连接。
S52,将所述数字音频信号发送至云端语义解析器;
在具体实施中,可以通过网关将所述数字音频信号传输至云端语义解析器。
S53,接收所述云端语义解析器解析完成的控制指令,并根据所述控制指令,执行相应的响应操作。
在具体实施中,所述根据所述控制指令,执行相应的响应操作,可以有多种执行方式。例如,根据具体的控制指令,可以相应地执行开机、关机、打开或关闭相应的功能(如播放指定的音视频)、或者控制相连的其他设备等其中至少一种操作。
通过所述声控系统可以控制声控主设备开机、关机、打开或关闭相应功能,或者控制与所述声控主设备连接的其他设备,可以控制多种设备及功能,因而具有广泛的适用范围,故可以替代手动控制,用户无须熟悉、辨别或记忆键盘输入复杂的功能、符号和位置,故可以给用户带来极大方便。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
Claims (26)
1.一种声控系统,其特征在于,包括:声控主设备、声控从设备及云端语义解析器,其中:
所述声控从设备,适于与所述声控主设备建立无线连接,采集模拟音频信号并转变为数字音频信号,并通过所述无线连接传输至所述声控主设备;
所述声控主设备,适于与所述声控从设备建立无线连接;通过所述无线连接接收所述数字音频信号,并发送至所述云端语义解析器,接收所述云端语义解析器发送的控制指令,并根据所述控制指令,作出对应的响应操作;
所述云端语义解析器,适于搜索词库以解析所述数字音频信号,并将解析完成的控制指令发送至所述声控主设备。
2.如权利要求1所述的声控系统,其特征在于,所述声控从设备适于在启动音频采集的条件满足时,采集所述模拟音频信号。
3.如权利要求2所述的声控系统,其特征在于,所述声控从设备包括:
音频采集单元,适于在接收到启动采集的指令时,采集模拟音频信号并将其转变为数字音频信号;
感应触发单元,适于感应所述启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元发送启动采集的指令;
第一连接传输单元,适于向所述声控主设备发送无线连接请求,与所述声控主设备建立无线连接,将所述音频采集单元输出的数字音频信号通过所述无线连接发送至所述声控主设备。
4.如权利要求3所述的声控系统,其特征在于,所述感应触发单元包括以下至少一种:
接触式感应触发单元,适于在感应到预设的按键被按下时,向所述音频采集单元发送启动采集的指令;
接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元发送启动采集的指令。
5.如权利要求3所述的声控系统,其特征在于,所述声控从设备还包括:按键检测单元,适于检测预设的按键组合是否被按下,并在预设的按键组合被按下时将相应信号传输至所述第一连接传输单元;
所述第一连接传输单元在所述预设的按键组合被按下后,开始扫描无线主机,向扫描到的无线主机发送无线连接请求。
6.如权利要求3所述的声控系统,其特征在于,所述声控主设备包括:第二连接传输单元和声控响应单元,其中:
所述第二连接传输单元,适于接收所述第一连接传输单元发送的无线连接请求,与所述声控从设备建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器,接收所述云端语义解析器解析完成的控制指令并传输至声控响应单元;
所述声控响应单元,适于根据所述第二连接传输单元传输的控制指令,完成相应的响应操作。
7.如权利要求1所述的声控系统,其特征在于,所述声控从设备适于将所述数字音频信号以非压缩编码格式通过所述无线连接传输至所述声控主设备。
8.如权利要求1所述的声控系统,其特征在于,所述云端语义解析器包括:词库、传输单元和解析单元,其中:
词库,适于存储数字音频信号与控制指令的对应关系;
传输单元,适于接收所述声控主设备传输的数字音频信号,并将所述解析单元解析得到的控制指令发送至所述声控主设备;
解析单元,适于将所述传输单元接收到的数字音频信号与所述词库进行匹配,解析得到相应的控制指令,并将解析得到的控制指令发送至所述传输单元。
9.如权利要求8所述的声控系统,其特征在于,所述云端语义解析器还包括:更新单元,适于更新所述词库。
10.一种声控设备,其特征在于,包括:
音频采集单元,适于采集模拟音频信号并将其转变为数字音频信号;
第一连接传输单元,适于发送无线连接请求,建立无线连接,将所述音频采集单元输出的数字音频信号通过所述无线连接发送出去。
11.如权利要求10所述的声控设备,其特征在于,还包括:感应触发单元,适于感应启动音频采集的条件是否满足,并在所述启动音频采集的条件满足时,向所述音频采集单元发送启动采集的指令;
所述音频采集单元适于在接收到所述启动采集的指令时,执行所述采集模拟音频信号并将其转变为数字音频信号的操作。
12.如权利要求11所述的声控设备,其特征在于,所述感应触发单元包括以下至少一种:
接触式感应触发单元,适于在感应到预设的按键被按下时,向所述音频采集单元发送启动采集的指令;
接近式感应触发单元,适于在感应到与物体之间的距离小于预设的距离时,向所述音频采集单元发送启动采集的指令。
13.如权利要求10所述的声控设备,其特征在于,还包括按键检测单元,适于检测按键的状态,并由所述第一连接传输单元通过所述无线连接传输出去。
14.如权利要求13所述的声控设备,其特征在于,所述按键检测单元还适于检测预设的组合按键是否被按下,并在预设的按键组合被按下时传输至所述第一连接传输单元;
所述第一连接传输单元在所述预设的按键组合被按下后,开始扫描声控主设备,向扫描到的声控主设备发送无线连接请求。
15.如权利要求10-14任一项所述的声控设备,其特征在于,所述第一连接传输单元适于将所述数字音频信号以非压缩编码格式通过所述无线连接发送出去。
16.一种声控设备,其特征在于,包括:第二连接传输单元和声控响应单元,其中:
第二连接传输单元,适于接收无线连接请求,建立无线连接,将通过所述无线连接接收到的数字音频信号发送至云端语义解析器,接收所述云端语义解析器解析完成的控制指令并传输至所述声控响应单元;
所述声控响应单元,适于根据所述第二连接传输单元传输的控制指令,执行相应的响应操作。
17.一种声控方法,其特征在于,包括:
由所述声控从设备采集模拟音频信号并转变为数字音频信号,并通过与声控主设备之间所建立的无线连接将所述数字音频信号传输至所述声控主设备;由所述声控主设备接收所述数字音频信号并传输至所述云端语义解析器;
由所述云端语义解析器搜索词库以解析所述数字音频信号,并将解析完成的控制指令传输至所述声控主设备;
所述声控主设备根据所述控制指令,作出对应的响应操作。
18.如权利要求17所述的声控方法,其特征在于,所述声控主设备根据所述控制指令,作出对应的响应操作,包括以下任意一种:
开机;
关机;
打开或关闭所述声控主设备的相应功能;
通过所述声控主设备控制与所述声控主设备连接的其他设备。
19.如权利要求17所述的声控方法,其特征在于,所述声控从设备在检测到预设的启动音频采集的条件满足时,执行所述采集模拟音频信号的操作。
20.如权利要求19所述的声控方法,其特征在于,所述预设的启动音频采集的条件,包括以下至少一种:
预设的按键被按下;
感应元件与被感应物体之间的距离小于预设的距离。
21.如权利要求17所述的声控方法,其特征在于,所述在声控主设备和声控从设备之间建立无线连接,包括:
声控从设备启动无线从机模式,扫描无线主机设备,对扫描到的无线主机发送无线连接建立请求;
启动了无线主机模式的声控主设备在检测到声控从设备的无线连接建立请求后,与所述声控从设备建立无线连接,并发送无线连接状态信息。
22.如权利要求21所述的声控方法,其特征在于,在预设的组合按键被按下时,声控从设备启动无线从机模式,扫描无线主机设备。
23.如权利要求17所述的声控方法,其特征在于,所述将所述数字音频信号传输至所述声控主设备,包括:
将所述数字音频信号以非压缩编码格式传输至所述声控主设备。
24.如权利要求17-23任一项所述的声控方法,其特征在于,还包括:
所述云端语义解析器更新所述词库。
25.一种声控方法,其特征在于,包括:
通过与声控从设备之间的无线连接接收数字音频信号,所述数字音频信号为所述声控从设备采集得到的模拟音频信号转换而成;
将所述数字音频信号发送至云端语义解析器;
接收所述云端语义解析器解析完成的控制指令,并根据所述控制指令,执行相应的响应操作。
26.如权利要求25所述的声控方法,其特征在于,所述根据所述控制指令,执行相应的响应操作,包括以下至少一种:
开机;
关机;
打开或关闭相应功能;
控制其他设备。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410841708.XA CN104484151A (zh) | 2014-12-30 | 2014-12-30 | 声控系统、设备及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410841708.XA CN104484151A (zh) | 2014-12-30 | 2014-12-30 | 声控系统、设备及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104484151A true CN104484151A (zh) | 2015-04-01 |
Family
ID=52758699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410841708.XA Pending CN104484151A (zh) | 2014-12-30 | 2014-12-30 | 声控系统、设备及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104484151A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303644A (zh) * | 2016-09-08 | 2017-01-04 | 康佳集团股份有限公司 | 一种语音遥控器及其语音采集的方法、系统 |
CN106875946A (zh) * | 2017-03-14 | 2017-06-20 | 巨数创新(深圳)科技有限公司 | 语音控制交互系统 |
CN107039041A (zh) * | 2017-03-24 | 2017-08-11 | 广东美的制冷设备有限公司 | 语音扩展的方法与语音助手 |
CN109949793A (zh) * | 2019-03-06 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN110164436A (zh) * | 2019-05-22 | 2019-08-23 | 深圳市智乐创科技有限公司 | 便携式多点智能语音控制家居的系统及方法 |
CN113314113A (zh) * | 2021-05-19 | 2021-08-27 | 广州大学 | 一种智能插座控制方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060047513A1 (en) * | 2004-09-02 | 2006-03-02 | Inventec Multimedia & Telecom Corporation | Voice-activated remote control system and method |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
CN102881286A (zh) * | 2012-09-12 | 2013-01-16 | 康佳集团股份有限公司 | 智能遥控系统及其控制方法 |
CN103489447A (zh) * | 2012-06-13 | 2014-01-01 | 华为技术有限公司 | 遥控器的语音输入方法、遥控器和多媒体终端系统 |
-
2014
- 2014-12-30 CN CN201410841708.XA patent/CN104484151A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060047513A1 (en) * | 2004-09-02 | 2006-03-02 | Inventec Multimedia & Telecom Corporation | Voice-activated remote control system and method |
CN102196207A (zh) * | 2011-05-12 | 2011-09-21 | 深圳市子栋科技有限公司 | 语音控制电视机的方法、装置和系统 |
CN103489447A (zh) * | 2012-06-13 | 2014-01-01 | 华为技术有限公司 | 遥控器的语音输入方法、遥控器和多媒体终端系统 |
CN102881286A (zh) * | 2012-09-12 | 2013-01-16 | 康佳集团股份有限公司 | 智能遥控系统及其控制方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106303644A (zh) * | 2016-09-08 | 2017-01-04 | 康佳集团股份有限公司 | 一种语音遥控器及其语音采集的方法、系统 |
CN106303644B (zh) * | 2016-09-08 | 2020-03-31 | 康佳集团股份有限公司 | 一种语音遥控器及其语音采集的方法、系统 |
CN106875946A (zh) * | 2017-03-14 | 2017-06-20 | 巨数创新(深圳)科技有限公司 | 语音控制交互系统 |
CN107039041A (zh) * | 2017-03-24 | 2017-08-11 | 广东美的制冷设备有限公司 | 语音扩展的方法与语音助手 |
CN109949793A (zh) * | 2019-03-06 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 用于输出信息的方法和装置 |
CN110164436A (zh) * | 2019-05-22 | 2019-08-23 | 深圳市智乐创科技有限公司 | 便携式多点智能语音控制家居的系统及方法 |
CN113314113A (zh) * | 2021-05-19 | 2021-08-27 | 广州大学 | 一种智能插座控制方法、装置、设备及存储介质 |
CN113314113B (zh) * | 2021-05-19 | 2023-11-28 | 广州大学 | 一种智能插座控制方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104484151A (zh) | 声控系统、设备及方法 | |
US11114099B2 (en) | Method of providing voice command and electronic device supporting the same | |
CN102196207B (zh) | 语音控制电视机的方法、装置和系统 | |
US20190068574A1 (en) | Method, device, and system establishing a wireless communication channel between electronic devices | |
US20140122075A1 (en) | Voice recognition apparatus and voice recognition method thereof | |
TWI512489B (zh) | Multi-screen interactive method, center equipment, terminal equipment and systems | |
CN105340011A (zh) | 链接设备的无线控制 | |
CN107977562B (zh) | 身份识别方法、识别终端及存储介质 | |
CN103609038A (zh) | 无线局域通信方法和支持该方法的终端 | |
CN107993672B (zh) | 频带扩展方法及装置 | |
JP2018510407A (ja) | 問答情報の処理方法、装置、記憶媒体及び装置 | |
KR20160025301A (ko) | 음성 인식이 가능한 디스플레이 장치 및 방법 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN107229618B (zh) | 一种显示页面的方法及装置 | |
WO2019233316A1 (zh) | 数据处理方法、装置、移动终端以及存储介质 | |
CN104978956A (zh) | 语音控制方法和系统 | |
CN109286832A (zh) | 实现语音操控的方法、装置及机顶盒和计算机可读存储介质 | |
CN103995833A (zh) | 一种共享配置信息的方法及装置 | |
WO2019101099A1 (zh) | 视频节目识别方法、设备、终端、系统和存储介质 | |
CN110765786B (zh) | 翻译系统、耳机翻译方法及翻译设备 | |
CN105975220B (zh) | 一种语音打印辅助设备及语音打印系统 | |
CN110600045A (zh) | 声音转换方法及相关产品 | |
CN105741841A (zh) | 语音控制方法及电子设备 | |
CN107483993A (zh) | 电视的语音输入方法、电视和计算机可读存储介质 | |
CN110381341B (zh) | 一种数据处理方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150401 |