CN109473097A - 一种智能语音设备及其控制方法 - Google Patents
一种智能语音设备及其控制方法 Download PDFInfo
- Publication number
- CN109473097A CN109473097A CN201710803817.6A CN201710803817A CN109473097A CN 109473097 A CN109473097 A CN 109473097A CN 201710803817 A CN201710803817 A CN 201710803817A CN 109473097 A CN109473097 A CN 109473097A
- Authority
- CN
- China
- Prior art keywords
- signal
- main control
- movable
- movable part
- voice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000006854 communication Effects 0.000 claims abstract description 105
- 238000004891 communication Methods 0.000 claims abstract description 104
- 238000001514 detection method Methods 0.000 claims abstract description 49
- 230000005236 sound signal Effects 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 23
- 238000000926 separation method Methods 0.000 claims description 17
- 230000009467 reduction Effects 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000004590 computer program Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R27/00—Public address systems
- H04R27/04—Electric megaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/021—Services related to particular areas, e.g. point of interest [POI] services, venue services or geofences
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明实施例实公开了一种智能语音设备及其控制方法,该装置包括能够与智能语音设备在物理结构上结合或脱离的活动部件,设置在活动部件上的与主控单元连接的活动麦克风和微型扬声器;如果主控单元判断出活动部件脱离智能语音设备,且检测到与通讯客户端处于通讯状态,将活动麦克风采集的语音信号发送给通讯客户端,将通讯客户端发送的音频信号发送给扬声器;如果主控单元判断出活动部件与智能语音设备处于脱离状态,且检测到切换检测电路生成的切换信号,将接收到的音频信号发送给微型扬声器。在本发明实施例中,当拿起活动部件使其脱离智能语音设备时,通过活动麦克风和微型扬声器进行通话,以保证通话时的私密性,使用时更加方便智能。
Description
技术领域
本发明实施例涉及语音控制技术领域,尤其涉及一种智能语音设备及其控制方法。
背景技术
随着科学技术的发展,智能家居可以通过语音进行控制,从而使得操作更加方便快捷。智能语音设备是指能够进行人机语音交互的设备,是智能家居中的重要组成部分,例如通过语音控制的智能音响、智能电视、智能空调等电器设备。
中国专利CN105163059A公布了一种基于智能家居设备的视频通话方法,该方法包括手持智能终端通过连接视频播放设备和视频采集设备实现视频通话。该手持智能终端可以是手机,但是在视频通话的过程中,用户想停止外放语音时,只能将视频播放设备设置为静音模式,此时则无法得知通话对方发送的语音内容,所以在语音通话或视频通话方面,智能家居还未能完全地体现出其方便智能的特性。
并且,目前的语音通话和视频通话大多都比较依赖于手机、平板电脑等。实现通话必须先打开相应的APP,操作比较繁琐。
发明内容
本发明实施例提供了一种智能语音设备及其控制方法,以提供一种更加方便智能的通话设备和方法。
本发明实施例提供了一种智能语音设备,包括用于拾取语音信号的矩阵麦克风和播放音频信号的扬声器,连接所述矩阵麦克风的音频处理单元,连接所述音频处理单元的语音识别单元,以及连接所述扬声器和所述语音识别单元的主控单元,其特征在于,还包括设置在所述主控单元和通讯客户端之间的第一通信单元,能够与所述智能语音设备在物理结构上结合或脱离的活动部件,设置在所述活动部件上的活动麦克风、微型扬声器和切换检测电路,与所述主控单元连接的第一状态检测电路,设置在所述主控单元和所述扬声器之间的第一开关电路,以及连接所述主控单元的开关控制电路;
所述活动麦克风、所述微型扬声器和所述切换检测电路通过第二通信单元连接所述主控单元;所述开关控制电路连接所述第一开关电路;
其中:
如果所述主控单元通过所述第一状态检测电路的检测信号,判断出所述活动部件与所述智能语音设备处于脱离状态,且检测到所述第一通信单元与所述通讯客户端处于通讯状态,将所述活动麦克风采集的语音信号发送给所述第一通信单元,将所述第一通信单元接收到的音频信号发送给所述扬声器;
如果所述主控单元判断出所述活动部件与所述智能语音设备处于脱离状态,且检测到所述切换检测电路生成的切换信号,将接收到的音频信号通过所述第二通信单元发送给所述微型扬声器,并向所述开关控制电路发送关闭所述第一开关电路的第一指令信号。
进一步地,所述切换检测电路包括用于检测所述微型扬声器的预设范围内是否有目标物的距离传感器,或者用于检测所述活动部件是否发生倒置的陀螺仪传感器,或者设置在所述活动部件上的切换开关。
进一步地,所述第一状态检测电路包括用于检测所述活动部件是否与所述智能语音设备处于脱离状态的检测开关和传感器。
进一步地,还包括设置在所述活动部件上的第二状态检测电路和设置在所述主控单元和所述第二通信单元之间的缓存器;所述第二状态检测电路连接所述第二通信单元;其中:
如果所述主控单元判断出所述活动部件与所述智能语音设备处于脱离状态,且检测到所述切换检测电路生成的切换信号,向所述开关控制电路发送关闭所述第一开关电路的第一指令信号,并将接收到的音频信号保存至所述缓存器中;
如果通过所述第二状态检测电路的检测信号,判断出所述微型扬声器处于信号输出状态,向所述缓存器发送将缓存的音频信号发送给所述第二通信单元的第二指令信号。
进一步地,当所述主控单元判断出所述活动部件与所述智能语音设备处于相互结合的状态,向所述开关控制电路发送开启所述第一开关电路的第三指令信号。
进一步地,如果所述主控单元判断出所述活动部件与所述智能语音设备处于脱离状态,向所述音频处理单元发送将所述活动麦克风拾取的语音信号确定为待识别的目标信号的第四指令信号,以及,
所述音频处理单元,根据所述第四指令信号,判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,将所述目标信号发送给语音识别单元;如果否,对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值,并将降噪处理后的目标信号发送给所述语音识别单元;
所述语音识别单元,将所述目标信号解析为控制指令,并将所述控制指令发送给所述主控单元;
如果所述主控单元检测到所述控制指令为建立通信连接的控制指令,向所述第一通信单元发送与相应的通讯客户端建立通讯连接的第六指令信号。
本发明实施例还提供了一种智能语音设备的控制方法,所述智能语音设备包括用于拾取语音信号的矩阵麦克风,播放音频信号的扬声器,能够与所述智能语音设备在物理结构上结合或脱离的活动部件,以及设置在所述活动部件上的活动麦克风和微型扬声器;所述方法包括:
建立与通讯客户端之间的通讯连接;
如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风采集的语音信号发送给所述通讯客户端,将所述通讯客户端发送的音频信号发送给所述扬声器;
如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,将所述通讯客户端发送的音频信号发送给所述微型扬声器,并断开所述扬声器的信号输入通道。
进一步地,生成所述切换信号的步骤包括:
如果所述微型扬声器的预设范围内有目标物,则生成所述切换信号;或者,
如果所述活动部件发生倒置,则生成所述切换信号;或者,
如果所述活动部件上的切换开关处于开启状态,则生成切换信号。
进一步地,该方法还包括:
如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,断开所述扬声器的信号输入通道,并缓存接收到的音频信号;
如果所述微型扬声器处于信号输出状态,将缓存的音频信号发送给所述微型扬声器。
进一步地,建立与通讯客户端之间的通讯连接的步骤,包括:
如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风拾取的语音信号确定为待识别的目标信号;
判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,转最后一步;否则转下一步;
对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值;
将所述信噪比大于或等于第一阈值的目标信号进行语音识别,并得到控制指令;
如果所述控制指令为建立通讯连接的控制指令,与相应的通讯客户端建立通讯连接。
本发明实施例提供的一种智能语音设备及其控制方法可以实现,当所述活动部件与智能语音设备相结合时,可以通过矩阵麦克风进行拾音,并通过扬声器扩音,在语音通话时,用户不用手持麦克风,可以在房间内随意走动;当接听私密电话时,可以拿起活动部件使其脱离智能语音设备,此时通过微型扬声器发声,只有人耳靠近微型扬声器时,才可以听清通话内容,以保证语音通话时的私密性,使用时更加方便智能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种智能语音设备的结构框图;
图2为本发明实施例提供的一种智能语音设备的控制方法的流程图;
图3为本发明实施例提供的另一种智能语音设备的控制方法的流程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参见图1,为本发明实施例提供的一种智能语音设备1,包括用于拾取语音信号的矩阵麦克风101和播放音频信号的扬声器102,连接所述矩阵麦克风101的音频处理单元103,连接所述音频处理单元103的语音识别单元104,以及连接所述扬声器102和所述语音识别单元104的主控单元105,其特征在于,还包括设置在所述主控单元105和通讯客户端2之间的第一通信单元106,能够与所述智能语音设备1在物理结构上结合或脱离的活动部件3,设置在所述活动部件3上的活动麦克风301、微型扬声器302和切换检测电路303,与所述主控单元105连接的第一状态检测电路107,设置在所述主控单元105和所述扬声器102之间的第一开关电路108,以及连接所述主控单元105的开关控制电路109;
所述活动麦克风301、所述微型扬声器302和所述切换检测电路303通过第二通信单元110连接所述主控单元105;所述开关控制电路109连接所述第一开关电路108。
智能语音设备1可以通过语音控制与通讯客户端2进行通讯连接。例如发送“接通XXX”时,主控单元105可以搜索欲连接的通信客户端的IP号,进而向通讯客户端2发送连接请求,对方通讯客户端2应答以后,建立通讯连接。
需要说明的是,本发明实施例中的智能语音设备1,还可以用于对其他受控设备进行控制,例如电视机、空调、照明灯等。
在语音控制通讯连接的过程中,可以通过矩阵麦克风101拾取语音信号,也可以通过活动部件3上的活动麦克风301进行语音拾音。通过活动麦克风301进行语音控制的方式如下。
如果所述主控单元105判断出所述活动部件3与所述智能语音设备1处于脱离状态,向所述音频处理单元103发送将所述活动麦克风301拾取的语音信号确定为待识别的目标信号的第四指令信号,以及,
所述音频处理单元103,根据所述第四指令信号,判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,将所述目标信号发送给语音识别单元104;如果否,对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值,并将降噪处理后的目标信号发送给所述语音识别单元104;
所述语音识别单元104,将所述目标信号解析为控制指令,并将所述控制指令发送给所述主控单元105;
如果所述主控单元105检测到所述控制指令为建立通信连接的控制指令,向所述第一通信单元106发送与相应的通讯客户端2建立通讯连接的第六指令信号。
由于活动麦克风301设置在活动部件3上,所以用户可以拿起活动部件3,近距离对活动麦克风301发送语音信号,即使环境比较嘈杂,也能够得到清晰的语音信号。一般情况下,通过活动麦克风301拾取的语音信号的信噪比都较大,可以直接进行语音识别,语音控制更加简单而且准确。
通过活动部件3上的活动麦克风301进行近距离拾音,克服了矩阵麦克风101拾音不准,语音控制不稳定的问题。
如果所述主控单元105通过所述第一状态检测电路107的检测信号,判断出所述活动部件3与所述智能语音设备1处于脱离状态,且检测到所述第一通信单元106与所述通讯客户端2处于通讯状态,将所述活动麦克风301采集的语音信号发送给所述第一通信单元106,将所述第一通信单元106接收到的音频信号发送给所述扬声器102。
当活动部件3与智能语音设备1在物理结构上相互结合时,可以通过固定在智能语音设备1上的矩阵麦克风101拾取语音信号,通过扬声器102播放音频信号,实现通话。当活动部件3脱离智能语音设备1时,可以关闭矩阵麦克风101,通过活动麦克风301近距离拾取语音信号,防止矩阵麦克风101拾取其他有干扰的环境语音信号。
所述第一状态检测电路107可以包括用于检测所述活动部件3是否与所述智能语音设备1处于脱离状态的检测开关。
活动部件3与智能语音设备1课可以通过插头和插孔进行连接,该插孔内可以设置检测开关。当插头插入或拔出插孔时,打开或关闭检测开关,从而检测到活动部件3与智能语音设备1的物理连接状态。
活动麦克风301与微型扬声器302可以通过有线或无线通信方式进行连接,当通过无线通信方式进行连接时,检测开关可以与第二通信单元110的电源控制开关联动或直接作为第二通信单元110的电源控制开关,如果活动部件3脱离,第二通信单元110的电源接通,否则断开。
第一状态检测电路107中还可以包括用于检测所述活动部件3是否与所述智能语音设备1处于脱离状态的传感器。该传感器可以包括距离传感器、红外传感器和压力传感器。该传感器设置在智能语音设备1上且结合时与活动部件3接触的部位上。
如果所述主控单元105判断出所述活动部件3与所述智能语音设备1处于脱离状态,且检测到所述切换检测电路303生成的切换信号,将接收到的音频信号通过所述第二通信单元110发送给所述微型扬声器302,并向所述开关控制电路109发送关闭所述第一开关电路108的第一指令信号。
所述切换检测电路303包括用于检测所述微型扬声器302的预设范围内是否有目标物的距离传感器,或者用于检测所述活动部件3是否发生倒置的陀螺仪传感器,或者设置在所述活动部件3上的切换开关。
活动麦克风301和微型扬声器302分别设置在活动部件3的上下端,如果用户想接打私密电话,可以将活动部件3上的微型扬声器302贴近人耳,当微型扬声器302上的距离传感器感应到有目标物靠近时,将接收到的音频信号通过所述第二通信单元110发送给所述微型扬声器302;或者倒置活动部件3,使微型扬声器302位于所述活动麦克风301的上面,通过陀螺仪传感器控制将接收到的音频信号通过所述第二通信单元110发送给所述微型扬声器302;或者通过手动开启活动部件3上的切换开关,从而控制将接收到的音频信号通过所述第二通信单元110发送给所述微型扬声器302。
在本发明实施例中,将音频信号切换至微型扬声器302的方式还可以通过以下方式。
智能语音设备1还包括设置在所述活动部件3上的第二状态检测电路304和设置在所述主控单元105和所述第二通信单元110之间的缓存器;所述第二状态检测电路304连接所述第二通信单元110;其中:
如果所述主控单元105判断出所述活动部件3与所述智能语音设备1处于脱离状态,且检测到所述切换检测电路303生成的切换信号,向所述开关控制电路109发送关闭所述第一开关电路108的第一指令信号,并将接收到的音频信号保存至所述缓存器中。
如果通过所述第二状态检测电路304的检测信号,判断出所述微型扬声器302处于信号输出状态,向所述缓存器发送将缓存的音频信号发送给所述第二通信单元110的第二指令信号。
在该将音频信号切换至微型扬声器302的方式中,切换检测电路303可以包括陀螺仪传感器,第二状态检测电路304可以为距离传感器。当通过陀螺仪传感器检测到活动部件3发生倒置时,断开扬声器102的信号输入通道,并将实时接收到的音频信号保存至缓存器中。当距离传感器检测到有目标物接近微型扬声器302时,再将保存至缓存器中的音频信号发送给微型扬声器302,从而避免用户在拿起活动部件3贴近耳朵的过程中,遗漏对方讲话的内容。
当所述主控单元105判断出所述活动部件3与所述智能语音设备1处于相互结合的状态,向所述开关控制电路109发送开启所述第一开关电路108的第三指令信号。
当用户欲将音频信号进行外放时,可以将活动部件3插入智能语音设备1中,从而接通扬声器102的信号输入通道。
需要说明的是,本发明实施例不仅适用于语音通话的场景,还适用于视频通话或者播放音乐的场景。
本发明实施例可以实现,当所述活动部件与智能语音设备相结合时,可以通过矩阵麦克风进行拾音,并通过扬声器扩音,在语音通话时,用户不用手持麦克风,可以在房间内随意走动;当接听私密电话时,可以拿起活动部件使其脱离智能语音设备,此时通过微型扬声器发声,只有人耳靠近微型扬声器时,才可以听清通话内容,以保证语音通话时的私密性,使用时更加方便智能。
参见图2,为本发明实施例提供的一种智能语音设备的控制方法,所述智能语音设备包括用于拾取语音信号的矩阵麦克风,播放音频信号的扬声器,能够与所述智能语音设备在物理结构上结合或脱离的活动部件,以及设置在所述活动部件上的活动麦克风和微型扬声器;所述方法包括:
步骤21,建立与通讯客户端之间的通讯连接。
建立与通讯客户端之间的通讯连接可以通过语音控制的方式。在语音控制的过程中,可以通过矩阵麦克风拾取语音信号,也可以通过活动部件上的活动麦克风进行语音拾音。通过活动麦克风进行语音控制的步骤,具体可以包括:
步骤211,如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风拾取的语音信号确定为待识别的目标信号。
步骤212,判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,转最后一步;否则转下一步。
步骤213,对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值。
步骤214,将所述信噪比大于或等于第一阈值的目标信号进行语音识别,并得到控制指令。
步骤215,如果所述控制指令为建立通讯连接的控制指令,与相应的通讯客户端建立通讯连接。
当所述活动部件与所述智能语音设备相互结合时,可以通过矩阵麦克风拾音,扬声器播放音频信号,实现通话。当环境比较嘈杂,矩阵麦克风无法拾取清晰的语音信号时,可以通过活动麦克风进行近距离拾音。通过活动麦克风进行近距离拾音的方法如下。
步骤22,如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风采集的语音信号发送给所述通讯客户端,将所述通讯客户端发送的音频信号发送给所述扬声器。
当所述活动部件与所述智能语音设备处于脱离状态时,可以断开矩阵麦克风的信号输入通道。
在通话过程中可以手持活动麦克风进行通话,从而能够拾取较清晰的语音信号。
步骤23,如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,将所述通讯客户端发送的音频信号发送给所述微型扬声器,并断开所述扬声器的信号输入通道。
在本发明实施例中,生成所述切换信号的步骤包括:
如果所述微型扬声器的预设范围内有目标物,则生成所述切换信号;或者,
如果所述活动部件发生倒置,则生成所述切换信号;或者,
如果所述活动部件上的切换开关处于开启状态,则生成切换信号。
本发明实施例可以实现,当所述活动部件与智能语音设备相结合时,可以通过矩阵麦克风进行拾音,并通过扬声器扩音,在语音通话时,用户不用手持麦克风,可以在房间内随意走动;当接听私密电话时,可以拿起活动部件使其脱离智能语音设备,此时通过微型扬声器发声,只有人耳靠近微型扬声器时,才可以听清通话内容,以保证语音通话时的私密性,使用时更加方便智能。
参见图3,为本发明实施例提供的另一种智能语音设备的控制方法的流程图,所述智能语音设备包括用于拾取语音信号的矩阵麦克风,播放音频信号的扬声器,能够与所述智能语音设备在物理结构上结合或脱离的活动部件,以及设置在所述活动部件上的活动麦克风和微型扬声器;所述方法包括:
步骤31,建立与通讯客户端之间的通讯连接。
步骤32,如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,断开所述扬声器的信号输入通道,并缓存接收到的音频信号。
步骤33,如果所述微型扬声器处于信号输出状态,将缓存的音频信号发送给所述微型扬声器。
本发明实施例可以实现,当活动部件与智能语音设备相结合时,可以通过矩阵麦克风进行拾音,并通过扬声器扩音,在语音通话时,用户不用手持麦克风,可以在房间内随意走动;当接听私密电话时,可以拿起活动部件使其脱离智能语音设备,此时通过微型扬声器发声,只有人耳靠近微型扬声器时,才可以听清通话内容,以保证语音通话时的私密性,使用时更加方便智能。
对于方法实施例而言,由于方法实施例与图1所示的实施例基本相似,所以描述的比较简单,相关之处参见图1所示的实施例的部分说明即可。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以生成一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令生成用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令生成包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以生成计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种智能语音设备及其控制方法,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (10)
1.一种智能语音设备(1),包括用于拾取语音信号的矩阵麦克风(101)和播放音频信号的扬声器(102),连接所述矩阵麦克风(101)的音频处理单元(103),连接所述音频处理单元(103)的语音识别单元(104),以及连接所述扬声器(102)和所述语音识别单元(104)的主控单元(105),其特征在于,还包括设置在所述主控单元(105)和通讯客户端(2)之间的第一通信单元(106),能够与所述智能语音设备(1)在物理结构上结合或脱离的活动部件(3),设置在所述活动部件(3)上的活动麦克风(301)、微型扬声器(302)和切换检测电路(303),与所述主控单元(105)连接的第一状态检测电路(107),设置在所述主控单元(105)和所述扬声器(102)之间的第一开关电路(108),以及连接所述主控单元(105)的开关控制电路(109);
所述活动麦克风(301)、所述微型扬声器(302)和所述切换检测电路(303)通过第二通信单元(110)连接所述主控单元(105);所述开关控制电路(109)连接所述第一开关电路(108);
其中:
如果所述主控单元(105)通过所述第一状态检测电路(107)的检测信号,判断出所述活动部件(3)与所述智能语音设备(1)处于脱离状态,且检测到所述第一通信单元(106)与所述通讯客户端(2)处于通讯状态,将所述活动麦克风(301)采集的语音信号发送给所述第一通信单元(106),将所述第一通信单元(106)接收到的音频信号发送给所述扬声器(102);
如果所述主控单元(105)判断出所述活动部件(3)与所述智能语音设备(1)处于脱离状态,且检测到所述切换检测电路(303)生成的切换信号,将接收到的音频信号通过所述第二通信单元(110)发送给所述微型扬声器(302),并向所述开关控制电路(109)发送关闭所述第一开关电路(108)的第一指令信号。
2.如权利要求1所述的智能语音设备,其特征在于,所述切换检测电路(303)包括用于检测所述微型扬声器(302)的预设范围内是否有目标物的距离传感器,或者用于检测所述活动部件(3)是否发生倒置的陀螺仪传感器,或者设置在所述活动部件(3)上的切换开关。
3.如权利要求1所述的智能语音设备(1),其特征在于,所述第一状态检测电路(107)包括用于检测所述活动部件(3)是否与所述智能语音设备(1)处于脱离状态的检测开关和传感器。
4.如权利要求1所述的智能语音设备,其特征在于,还包括设置在所述活动部件(3)上的第二状态检测电路(304)和设置在所述主控单元(105)和所述第二通信单元(110)之间的缓存器;所述第二状态检测电路(304)连接所述第二通信单元(110);其中:
如果所述主控单元(105)判断出所述活动部件(3)与所述智能语音设备(1)处于脱离状态,且检测到所述切换检测电路(303)生成的切换信号,向所述开关控制电路(109)发送关闭所述第一开关电路(108)的第一指令信号,并将接收到的音频信号保存至所述缓存器中;
如果通过所述第二状态检测电路(304)的检测信号,判断出所述微型扬声器(302)处于信号输出状态,向所述缓存器发送将缓存的音频信号发送给所述第二通信单元(110)的第二指令信号。
5.如权利要求1所述的智能语音设备,其特征在于,当所述主控单元(105)判断出所述活动部件(3)与所述智能语音设备(1)处于相互结合的状态,向所述开关控制电路(109)发送开启所述第一开关电路(108)的第三指令信号。
6.如权利要求1所述的智能语音设备,其特征在于,如果所述主控单元(105)判断出所述活动部件(3)与所述智能语音设备(1)处于脱离状态,向所述音频处理单元(103)发送将所述活动麦克风(301)拾取的语音信号确定为待识别的目标信号的第四指令信号,以及,
所述音频处理单元(103),根据所述第四指令信号,判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,将所述目标信号发送给语音识别单元(104);如果否,对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值,并将降噪处理后的目标信号发送给所述语音识别单元(104);
所述语音识别单元(104),将所述目标信号解析为控制指令,并将所述控制指令发送给所述主控单元(105);
如果所述主控单元(105)检测到所述控制指令为建立通信连接的控制指令,向所述第一通信单元(106)发送与相应的通讯客户端(2)建立通讯连接的第六指令信号。
7.一种智能语音设备的控制方法,其特征在于,所述智能语音设备包括用于拾取语音信号的矩阵麦克风,播放音频信号的扬声器,能够与所述智能语音设备在物理结构上结合或脱离的活动部件,以及设置在所述活动部件上的活动麦克风和微型扬声器;所述方法包括:
建立与通讯客户端之间的通讯连接;
如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风采集的语音信号发送给所述通讯客户端,将所述通讯客户端发送的音频信号发送给所述扬声器;
如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,将所述通讯客户端发送的音频信号发送给所述微型扬声器,并断开所述扬声器的信号输入通道。
8.如权利要求7所述的方法,其特征在于,生成所述切换信号的步骤包括:
如果所述微型扬声器的预设范围内有目标物,则生成所述切换信号;或者,
如果所述活动部件发生倒置,则生成所述切换信号;或者,
如果所述活动部件上的切换开关处于开启状态,则生成切换信号。
9.如权利要求7所述的方法,其特征在于,还包括:
如果所述活动部件与所述智能语音设备处于脱离状态,且检测到切换信号,断开所述扬声器的信号输入通道,并缓存接收到的音频信号;
如果所述微型扬声器处于信号输出状态,将缓存的音频信号发送给所述微型扬声器。
10.如权利要求7所述的方法,其特征在于,建立与通讯客户端之间的通讯连接的步骤,包括:
如果所述活动部件与所述智能语音设备处于脱离状态,将所述活动麦克风拾取的语音信号确定为待识别的目标信号;
判断所述目标信号的信噪比是否大于或等于第一阈值,如果是,转最后一步;否则转下一步;
对所述目标信号进行降噪处理,使所述信噪比大于或等于第一阈值;
将所述信噪比大于或等于第一阈值的目标信号进行语音识别,并得到控制指令;
如果所述控制指令为建立通讯连接的控制指令,与相应的通讯客户端建立通讯连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710803817.6A CN109473097B (zh) | 2017-09-08 | 2017-09-08 | 一种智能语音设备及其控制方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710803817.6A CN109473097B (zh) | 2017-09-08 | 2017-09-08 | 一种智能语音设备及其控制方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109473097A true CN109473097A (zh) | 2019-03-15 |
CN109473097B CN109473097B (zh) | 2021-08-10 |
Family
ID=65657729
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710803817.6A Active CN109473097B (zh) | 2017-09-08 | 2017-09-08 | 一种智能语音设备及其控制方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109473097B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232919A (zh) * | 2019-06-19 | 2019-09-13 | 北京智合大方科技有限公司 | 实时语音流提取与语音识别系统及方法 |
CN111681646A (zh) * | 2020-07-17 | 2020-09-18 | 成都三零凯天通信实业有限公司 | 端到端架构的通用场景中文普通话语音识别方法 |
US10932074B2 (en) | 2019-06-28 | 2021-02-23 | Compal Electronics, Inc. | Detachable smart speaker system and control method thereof |
CN113316047A (zh) * | 2021-04-16 | 2021-08-27 | 杭州涂鸦信息技术有限公司 | 一种拾音设备 |
CN113875213A (zh) * | 2019-07-30 | 2021-12-31 | 惠普发展公司,有限责任合伙企业 | 声音处理逻辑连接 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103209246A (zh) * | 2012-01-16 | 2013-07-17 | 三星电子(中国)研发中心 | 一种通过蓝牙耳机控制手持设备的方法及手持设备 |
CN103248991A (zh) * | 2013-04-13 | 2013-08-14 | 东莞市美之尊电子科技有限公司 | 一种蓝牙音箱系统及其工作方法 |
US20160253998A1 (en) * | 2015-02-26 | 2016-09-01 | Motorola Mobility Llc | Method and Apparatus for Voice Control User Interface with Discreet Operating Mode |
CN106254586A (zh) * | 2016-08-26 | 2016-12-21 | 北京小米移动软件有限公司 | 终端听筒、终端及终端语音传送的方法 |
CN107135438A (zh) * | 2017-05-03 | 2017-09-05 | 北京数科技有限公司 | 一种设备控制方法、装置及系统 |
-
2017
- 2017-09-08 CN CN201710803817.6A patent/CN109473097B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103209246A (zh) * | 2012-01-16 | 2013-07-17 | 三星电子(中国)研发中心 | 一种通过蓝牙耳机控制手持设备的方法及手持设备 |
CN103248991A (zh) * | 2013-04-13 | 2013-08-14 | 东莞市美之尊电子科技有限公司 | 一种蓝牙音箱系统及其工作方法 |
US20160253998A1 (en) * | 2015-02-26 | 2016-09-01 | Motorola Mobility Llc | Method and Apparatus for Voice Control User Interface with Discreet Operating Mode |
CN106254586A (zh) * | 2016-08-26 | 2016-12-21 | 北京小米移动软件有限公司 | 终端听筒、终端及终端语音传送的方法 |
CN107135438A (zh) * | 2017-05-03 | 2017-09-05 | 北京数科技有限公司 | 一种设备控制方法、装置及系统 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232919A (zh) * | 2019-06-19 | 2019-09-13 | 北京智合大方科技有限公司 | 实时语音流提取与语音识别系统及方法 |
US10932074B2 (en) | 2019-06-28 | 2021-02-23 | Compal Electronics, Inc. | Detachable smart speaker system and control method thereof |
TWI752328B (zh) * | 2019-06-28 | 2022-01-11 | 仁寶電腦工業股份有限公司 | 可拆式智慧音箱系統及其控制方法 |
CN113875213A (zh) * | 2019-07-30 | 2021-12-31 | 惠普发展公司,有限责任合伙企业 | 声音处理逻辑连接 |
US11928385B2 (en) | 2019-07-30 | 2024-03-12 | Hewlett-Packard Development Company, L.P. | Sound processing logic connections |
CN111681646A (zh) * | 2020-07-17 | 2020-09-18 | 成都三零凯天通信实业有限公司 | 端到端架构的通用场景中文普通话语音识别方法 |
CN113316047A (zh) * | 2021-04-16 | 2021-08-27 | 杭州涂鸦信息技术有限公司 | 一种拾音设备 |
CN113316047B (zh) * | 2021-04-16 | 2023-04-14 | 杭州涂鸦信息技术有限公司 | 一种拾音设备 |
Also Published As
Publication number | Publication date |
---|---|
CN109473097B (zh) | 2021-08-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109473097B (zh) | 一种智能语音设备及其控制方法 | |
US11570292B1 (en) | Providing hands-free service to multiple devices | |
CN109473095B (zh) | 一种智能家居控制系统及控制方法 | |
CN108399917B (zh) | 语音处理方法、设备和计算机可读存储介质 | |
JP6489563B2 (ja) | 音量調節方法、システム、デバイス及びプログラム | |
CN108428452B (zh) | 终端支架和远场语音交互系统 | |
CN105159672B (zh) | 远程协助方法和客户端 | |
CN108337362A (zh) | 语音交互方法、装置、设备和存储介质 | |
CN107978316A (zh) | 控制终端的方法及装置 | |
CN105262452A (zh) | 音量调整方法、装置及终端 | |
CN105794186A (zh) | 控制应用程序的方法、装置和电子设备 | |
CN112806067B (zh) | 语音切换方法、电子设备及系统 | |
CN107846516B (zh) | 一种通话场景提示方法及移动终端 | |
CN104539871B (zh) | 多媒体通话方法及装置 | |
CN104636110A (zh) | 控制音量的方法及装置 | |
TW201246899A (en) | Handling a voice communication request | |
CN106357883A (zh) | 音频播放的方法及装置、播放系统 | |
CN104112459A (zh) | 播放音频数据的方法和装置 | |
US20170160710A1 (en) | Voice control type bath system and operating method thereof | |
US20120287283A1 (en) | Electronic device with voice prompt function and voice prompt method | |
WO2018120487A1 (zh) | 一种切换通话模式的方法和终端 | |
CN105141880A (zh) | 呼叫应答方法及装置 | |
WO2016157993A1 (ja) | 情報処理装置、情報処理方法およびプログラム | |
CN106604151A (zh) | 视频聊天方法及装置 | |
CN109473096B (zh) | 一种智能语音设备及其控制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100101 Room 101, 1st floor, block C, building 21, 2 Wanhong West Street, xibajianfang, dongzhimenwai, Chaoyang District, Beijing Applicant after: Beijing Junlin Technology Co.,Ltd. Address before: 100107 commercial building 03, floor 3, block C, tianlangyuan, Chaoyang District, Beijing (No. 1336, Fengshou incubator) Applicant before: BEIJING JUNLIN TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |