CN110136716B - 一种语音交互处理方法及语音交互设备 - Google Patents
一种语音交互处理方法及语音交互设备 Download PDFInfo
- Publication number
- CN110136716B CN110136716B CN201910422875.3A CN201910422875A CN110136716B CN 110136716 B CN110136716 B CN 110136716B CN 201910422875 A CN201910422875 A CN 201910422875A CN 110136716 B CN110136716 B CN 110136716B
- Authority
- CN
- China
- Prior art keywords
- voice
- processing system
- voice interaction
- person
- timing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 144
- 238000003672 processing method Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 188
- 238000000034 method Methods 0.000 claims abstract description 46
- 238000012544 monitoring process Methods 0.000 claims description 52
- 230000008859 change Effects 0.000 claims description 7
- 230000010287 polarization Effects 0.000 claims description 5
- 230000008569 process Effects 0.000 description 14
- 238000001514 detection method Methods 0.000 description 8
- 230000007613 environmental effect Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 4
- 230000005855 radiation Effects 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000001965 increasing effect Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000002618 waking effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000013078 crystal Substances 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 241000592183 Eidolon Species 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 244000062793 Sorghum vulgare Species 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 235000019713 millet Nutrition 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000523 sample Substances 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01V—GEOPHYSICS; GRAVITATIONAL MEASUREMENTS; DETECTING MASSES OR OBJECTS; TAGS
- G01V8/00—Prospecting or detecting by optical means
- G01V8/10—Detecting, e.g. by using light barriers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Geophysics (AREA)
- General Life Sciences & Earth Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Selective Calling Equipment (AREA)
- Electric Clocks (AREA)
Abstract
本发明提供了一种语音交互处理方法及语音交互设备,该方法包括:在监测到唤醒操作时启动语音处理系统;在语音处理系统启动期间,利用人体红外传感器实时监测语音交互适用范围内是否有人;在监测到连续预设时长内无人时关闭语音处理系统;在拾取到语音交互适用范围内的一有效语音时,判断语音处理系统是否启动,若是,将有效语音发送给语音处理系统以作处理,否则判断有效语音是否涉及到唤醒词,未涉及到唤醒词时结束。通过实时判定语音交互设备附近是否有人,来实时更新时间延迟的计时起始时间,从而使得用户只要未长时间离开设备即可无需重复唤醒,用户离开后相关实现组件关闭。因此,本方案能够准确的满足用户的需要。
Description
技术领域
本发明涉及智能家电技术领域,特别涉及一种语音交互处理方法及语音交互设备。
背景技术
人机语音智能交互近几年来发展飞速,像小米音响、叮咚音响、天猫精灵等市场销量大幅度增长,语音交互已经成为智能化的一个重要方向。但在人机语音交互的过程中,每次交互之前先要用唤醒词唤醒才能进行人机对话,使得交换体验不高。
目前,可采用时间延迟以解决上述问题,即唤醒之后的固定时间内不需要重复唤醒。
但是,时间延迟的方式仍然无法准确的满足用户的需要。比如设定时间5分钟,5分钟之后用户仍然需要重新唤醒,从而不适用于需长时间语音交互的场景。再比如,设定一较长时间,一旦用户离开,相关实现组件仍处于激活备用状态,造成不必要的资源浪费。
发明内容
本发明提供了一种语音交互处理方法及语音交互设备,能够准确的满足用户的需要。
为了达到上述目的,本发明是通过如下技术方案实现的:
一方面,本发明提供了一种语音交互处理方法,包括:
在监测到外部针对语音交互设备的唤醒操作时,启动语音处理系统;
在所述语音处理系统启动期间,利用人体红外传感器,实时监测所述语音交互设备的语音交互适用范围内是否有人;
在监测到连续预设时长内无人时,关闭所述语音处理系统;
在拾取到所述语音交互适用范围内的一有效语音时,判断所述语音处理系统是否启动,若是,将所述有效语音发送给所述语音处理系统以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束当前流程。
进一步地,所述在监测到外部针对语音交互设备的唤醒操作时,包括:拾取到一涉及到至少一个唤醒词的有效语音时,或,在监测到外部针对所述语音交互设备的开机或重启操作时。
进一步地,在所述启动语音处理系统时,进一步包括:以当前时间为计时起始时间,开始计时;
在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内有人时,实时将所述计时起始时间更新为当前时间;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
进一步地,在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内从有人变为无人时,开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,结束计时;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
另一方面,本发明提供了一种语音交互设备,包括:语音处理系统、中央处理器、监控模块、人体红外传感器、语音拾取模块;
其中,所述语音处理系统,用于处理所述中央处理器发来的每一个有效语音;
所述中央处理器,用于在监测到外部针对语音交互设备的唤醒操作时,启动所述语音处理系统;在接收到所述语音拾取模块发来的一有效语音时,判断所述语音处理系统是否启动,若是,将所述有效语音发送给所述语音处理系统以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束;
所述监控模块,用于在所述语音处理系统启动期间,利用所述人体红外传感器,实时监测所述语音交互设备的语音交互适用范围内是否有人;在监测到连续预设时长内无人时,通知所述中央处理器关闭所述语音处理系统;
所述语音拾取模块,用于在拾取到所述语音交互适用范围内的一有效语音时,将所述有效语音发送给所述中央处理器。
进一步地,所述中央处理器,用于在接收到所述语音拾取模块发来的一涉及到至少一个唤醒词的有效语音时,或,在监测到外部针对所述语音交互设备的开机或重启操作时,启动语音处理系统。
进一步地,该语音交互设备还包括:计时器;
所述计时器,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器关闭所述语音处理系统;
所述中央处理器,用于在所述启动语音处理系统时,触发所述计时器开始计时;
所述监控模块,用于在监测到所述语音交互适用范围内有人时,实时触发所述计时器重新开始计时。
进一步地,该语音交互设备还包括:计时器;
所述计时器,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器关闭所述语音处理系统;
所述监控模块,用于在监测到所述语音交互适用范围内从有人变为无人时,触发所述计时器开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,触发所述计时器结束计时。
进一步地,所述人体红外传感器包括:菲涅尔透镜、相串联或相并联有2个热释电器件的电路、控制模块;
其中,所述2个热释电器件的电极化方向相反;
所述菲涅尔透镜,用于所述语音交互适用范围内有人时,将人体发射的红外线增强后聚集到所述热释电器件上;
所述热释电器件,用于在聚集有红外线使得温度发生变化时,向外释放电荷;
所述控制模块,用于在检测到所述电路中有电流通过时,向所述监控模块输出所述语音交互适用范围内有人的通知信号。
进一步地,所述语音处理系统,用于在接收到所述中央处理器发来的一有效语音时,将所述有效语音发送给外部的云端处理器;根据所述云端处理器返回的语音识别结果,执行相应设备控制操作。
本发明提供了一种语音交互处理方法及语音交互设备,该方法包括:在监测到唤醒操作时启动语音处理系统;在语音处理系统启动期间,利用人体红外传感器实时监测语音交互适用范围内是否有人;在监测到连续预设时长内无人时关闭语音处理系统;在拾取到语音交互适用范围内的一有效语音时,判断语音处理系统是否启动,若是,将有效语音发送给语音处理系统以作处理,否则判断有效语音是否涉及到唤醒词,未涉及到唤醒词时结束。通过实时判定语音交互设备附近是否有人,来实时更新时间延迟的计时起始时间,从而使得用户只要未长时间离开设备即可无需重复唤醒,用户离开后相关实现组件关闭。因此,本发明能够准确的满足用户的需要。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例提供的一种语音交互处理方法的流程图;
图2是本发明一实施例提供的另一种语音交互处理方法的流程图;
图3是本发明一实施例提供的一种语音交互设备的示意图;
图4是本发明一实施例提供的另一种语音交互设备的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种语音交互处理方法,可以包括以下步骤:
步骤101:在监测到外部针对语音交互设备的唤醒操作时,启动语音处理系统。
步骤102:在所述语音处理系统启动期间,利用人体红外传感器,实时监测所述语音交互设备的语音交互适用范围内是否有人。
步骤103:在监测到连续预设时长内无人时,关闭所述语音处理系统。
步骤104:在拾取到所述语音交互适用范围内的一有效语音时,判断所述语音处理系统是否启动,若是,将所述有效语音发送给所述语音处理系统以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束当前流程。
本发明实施例提供了一种语音交互处理方法,该方法包括:在监测到唤醒操作时启动语音处理系统;在语音处理系统启动期间,利用人体红外传感器实时监测语音交互适用范围内是否有人;在监测到连续预设时长内无人时关闭语音处理系统;在拾取到语音交互适用范围内的一有效语音时,判断语音处理系统是否启动,若是,将有效语音发送给语音处理系统以作处理,否则判断有效语音是否涉及到唤醒词,未涉及到唤醒词时结束。通过实时判定语音交互设备附近是否有人,来实时更新时间延迟的计时起始时间,从而使得用户只要未长时间离开设备即可无需重复唤醒,用户离开后相关实现组件关闭。因此,本发明实施例能够准确的满足用户的需要。
请参考步骤101,用户为了能够与语音交互设备实现语音交互,至少需首次执行唤醒操作,以启动语音处理系统。
请参考步骤104,语音处理系统被启动后,一旦用户发出有效语音,语音处理系统即可实时处理这一语音,进而执行相应的控制指令,从而完成用户对设备的语音控制。
本发明实施例中的语音,即可以为用户所说出的任意一个字词或语句的发音。本发明实施例中的有效语音,可以理解为用于控制语音交互设备的语音,而非环境噪音等。比如,语音交互设备为智能音箱时,用户可以发出关机、增大或降低音量、播放某一歌曲等控制类语音。
对应地,语音处理系统被关闭后,即便用户发出非唤醒类有效语音,语音处理系统也会视为无效语音而不做任何处理。除非用户再次执行唤醒操作,以再次启动语音处理系统。
请参考步骤103,语音处理系统启动后并非一直处于备用状态,而是可以在认为用户离开一定时间后自动关闭,以免造成资源浪费。而用户是否离开,请参考步骤102,可利用人体红外传感器以进行实时监测。
请参考步骤102,在语音处理系统启动期间才执行监测操作,即每次唤醒后才执行监测,唤醒终止后即可停止监测。
详细地,人体通常有恒定的体温,一般在37度,故会发出特定波长的红外线,比如10um左右的红外线,被动式红外探头就是靠探测人体发射的10um左右的红外线而进行工作的。
当一些晶体受热时,在晶体两端将会产生数量相等而符号相反的电荷。这种由于热变化而产生的电极化现象称为热释电效应。如此,人体红外传感器中的红外感应源,即可在接收到人体红外辐射温度发生变化时失去电荷平衡,向外释放电荷,后续电路经检测处理后就能产生报警信号。从而,可得到是否有人的监测结果。
当然,语音处理系统关闭后,用户若需语音控制设备,需再次输出唤醒词,以再次启动语音处理系统。虽然此时语音处理系统已关闭,即不再处理未含唤醒词的语音,但始终会处理含唤醒词的语音。
综上所述,本发明实施例采用红外热释电技术与时间延迟相结合的方式,通过人体红外检测来判断用户是否仍然处于语音交互的适用范围,若在,则不需要重新唤醒。如人已经离去,则关闭相关组件,从而很好地解决了语音人机交互过程中的重复唤醒问题。
在本发明一个实施例中,所述在监测到外部针对语音交互设备的唤醒操作时,包括:拾取到一涉及到至少一个唤醒词的有效语音时,或,在监测到外部针对所述语音交互设备的开机或重启操作时。
本发明实施例中,用户开机或重启时,或者用户开机或重启后说出唤醒词时,均可被认为是执行了唤醒操作,从而可开启语音处理系统。
详细地,对于语音中是否有唤醒词的判断,既可以在设备端直接执行,也可以发送给外部的统一执行单元进行执行,并获知执行结果。
当然,在本发明其他实施例中,语音交互设备上还可以设置有专用的唤醒功能按键,用户触发该按键时,也可认为用户执行了唤醒操作。
基于上述内容,上述步骤104中,若判断结果为涉及到唤醒词,说明语音处理系统当前未开启,但也相当于监测到了外部针对语音交互设备的唤醒操作。如此,一方面可将有效语音发送给语音处理系统以作处理,另一方面,对应于步骤101,由于监测到了外部针对语音交互设备的唤醒操作,故可再次启动语音处理系统。
因此,在本发明一个实施例中,上述步骤104中,进一步包括:判断结果为涉及到唤醒词时,将所述有效语音发送给所述语音处理系统以作处理,并执行所述启动语音处理系统。
本发明实施例中,若用户发出一语音时,语音处理系统关闭,即不能直接处理该语音,可初步认为其为一无效语音。但考虑到仍存在用户再次唤醒语音处理系统的可能,故为保证用户的正常语音控制操作,可先判断该语音中是否有唤醒词,若有则处理语音并再次唤醒语音处理系统。否则,请参考上述步骤104,即可确定其为一无效语音,并结束。
综上所述,本发明实施例只需要唤醒一次即可进行连续语音交互,极大的改善了人机交互的体验。
请参考上述步骤102和步骤103,可根据是否有人的实时监测情况,以按需关闭语音处理系统。具体地,至少可以通过下述任一实现方式得以实现:
方式1:监测到有人就开始计时,并不断更新计时起始时间;
方式2:监测到无人就开始计时,并按需停止计时和再次开始计时。
详细地,对应于上述方式1:
在本发明一个实施例中,在所述启动语音处理系统时,进一步包括:以当前时间为计时起始时间,开始计时;
在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内有人时,实时将所述计时起始时间更新为当前时间;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
请参考步骤102,可利用人体红外传感器,实时监测是否有人进入语音交互设备的语音交互适用范围内,即实时监测用户是否在设备附近,每得到一个监测结果,且监测结果为有人时,即可根据当前的时间对计时操作的计时起始时间进行更新。如此,用户在设备附近时,会实时不断的更新计时起始时间。
举例来说,假设用户于12:00:00执行唤醒操作,故可以记录计时起始时间为12:00:00。若用户在停留3min后离开,则记录的计时起始时间会从12:00:00开始不断更新,直至更新至12:03:00,并保持在12:03:00。若用户1min后再次来到设备附近,假设上述时间阈值为5min,即用户回来时仍在计时过程中,即仍位于语音处理系统启动期间,故用户回来后,记录的计时起始时间会从12:03:00更新至当前时间,即更新到12:04:00。若用户在停留10min后外出,则记录的计时起始时间会从12:04:00开始不断更新,直至更新至12:14:00,并保持在12:14:00。由于用户外出,故计时过程会在12:19:00结束,从而可停止计时并关闭语音处理系统。可知,在12:00:00至12:19:00期间,语音处理系统始终处于开启状态。
可以看出,语音处理系统并没有在12:00:00被首次唤醒后5min内即关闭,故在语音处理系统开启期间,用户无需说出唤醒词即可语音控制设备,且语音处理系统也并没有在用户外出后一直开启备用,而是按需及时关闭。
可见,本发明实施例可以准确的满足用户的需要,来开启和关闭语音处理系统,只要单次离开时长未达到预设的时间阈值,用户即可长时间直接语音控制设备,而无需重复说出唤醒词。
详细地,对应于上述方式2:
在本发明一个实施例中,在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内从有人变为无人时,开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,结束计时;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
请参考步骤102,可利用人体红外传感器,实时监测是否有人进入语音交互设备的语音交互适用范围内,即实时监测用户是否在设备附近。监测到从有人变为无人时开始计时,监测到从无人变为有人时结束计时。
举例来说,假设用户于12:00:00执行唤醒操作,并在停留3min后离开,则从12:03:00开始计时。若用户1min后再次来到设备附近,假设上述时间阈值为5min,即用户回来时仍在计时过程中,即仍位于语音处理系统启动期间,故用户回来后停止计时。若用户在停留10min后外出,则从12:14:00开始计时。由于用户外出,故计时过程会在12:19:00结束,从而可停止计时并关闭语音处理系统。可知,在12:00:00至12:19:00期间,语音处理系统始终处于开启状态。
可以看出,语音处理系统并没有在12:00:00被首次唤醒后5min内即关闭,故在语音处理系统开启期间,用户无需说出唤醒词即可语音控制设备,且语音处理系统也并没有在用户外出后一直开启备用,而是按需及时关闭。
可见,本发明实施例可以准确的满足用户的需要,来开启和关闭语音处理系统,只要单次离开时长未达到预设的时间阈值,用户即可长时间直接语音控制设备,而无需重复说出唤醒词。
如图2所示,本发明一个实施例提供了另一种语音交互处理方法,该方法以智能音箱为例,并对应于上述方式1,具体包括以下步骤:
步骤201:智能音箱中的中央处理器监测到开机操作。
步骤202:中央处理器启动语音处理系统,并以当前时间为计时起始时间,开始计时,并执行步骤203、步骤204和步骤210。
用户开机,唤醒语音处理系统。此时,用户无需说出唤醒词,即可语音控制智能音箱。
步骤203:智能音箱在语音处理系统启动期间,利用人体红外传感器,实时监测智能音箱的语音交互适用范围内是否有人,若是,实时将计时起始时间更新为当前时间,并结束当前流程,否则,结束当前流程。
用户始终未远离时,会不断监测到有人,故会不断更新计时起始时间。
用户离开时,会监测到无人,故不再更新计时起始时间,即保持上一次更新出的计时起始时间。即以当前最后一次更新的计时起始时间,来判断何时关闭语音处理系统。
步骤204:智能音箱中的语音拾取模块拾取到语音交互适用范围内的一有效语音。
步骤205:中央处理器判断语音处理系统是否启动,若是,执行步骤206,否则,执行步骤209。
步骤206:中央处理器将有效语音发送给语音处理系统。
步骤207:语音处理系统将有效语音发送给外部的云端处理器。
步骤208:语音处理系统根据云端处理器返回的语音识别结果,执行相应设备控制操作,并结束当前流程。
步骤209:中央处理器判断有效语音是否涉及到至少一个预设的唤醒词,若是,执行步骤202和步骤206,否则,结束当前流程。
步骤210:中央处理器在监测到计时持续时长达到5min时,关闭语音处理系统并停止计时。
如图3所示,本发明一个实施例提供了一种语音交互设备,可以包括:语音处理系统301、中央处理器302、监控模块303、人体红外传感器304、语音拾取模块305;
其中,所述语音处理系统301,用于处理所述中央处理器302发来的每一个有效语音;
所述中央处理器302,用于在监测到外部针对语音交互设备的唤醒操作时,启动所述语音处理系统301;在接收到所述语音拾取模块305发来的一有效语音时,判断所述语音处理系统301是否启动,若是,将所述有效语音发送给所述语音处理系统301以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束;
所述监控模块303,用于在所述语音处理系统301启动期间,利用所述人体红外传感器304,实时监测所述语音交互设备的语音交互适用范围内是否有人;在监测到连续预设时长内无人时,通知所述中央处理器302关闭所述语音处理系统301;
所述语音拾取模块305,用于在拾取到所述语音交互适用范围内的一有效语音时,将所述有效语音发送给所述中央处理器302。
详细地,语音拾取模块可以包括有麦克风、数模转换单元、降噪单元等。其中,麦克风可用于拾取音频信号,数模转换单元可以将音频信号转换为数字信号,降噪单元可以对音频信号执行降噪处理。
在本发明一个实施例中,这一语音交互设备可以为智能音箱。
除了如上所述的语音处理系统、中央处理器、监控模块、语音拾取模块、人体红外传感器之外,智能音箱还可以包括WIFI模组、音频功率放大模块、扬声器等。其中,WiFi模块可支持智能音箱与云端服务器间的WiFi通信连接,音频功率放大模块可用于将待播放的音频信号放大,扬声器用于播放歌曲、录音等。
当然,在本发明其他实施例中,语音交互设备也可以为其他具有语音交互功能的智能设备,如智能空调、智能冰箱等。
在本发明一个实施例中,所述中央处理器302,用于在接收到所述语音拾取模块305发来的一涉及到至少一个唤醒词的有效语音时,或,在监测到外部针对所述语音交互设备的开机或重启操作时,启动语音处理系统301。
在本发明一个实施例中,对应于上述方式1,请参考图4,该语音交互设备还包括:计时器401;
所述计时器401,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器302关闭所述语音处理系统301;
所述中央处理器302,用于在所述启动语音处理系统301时,触发所述计时器401开始计时;
所述监控模块303,用于在监测到所述语音交互适用范围内有人时,实时触发所述计时器401重新开始计时。
在本发明一个实施例中,对应于上述方式2,请参考图4,该语音交互设备还包括:计时器401;
所述计时器401,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器302关闭所述语音处理系统301;
所述监控模块303,用于在监测到所述语音交互适用范围内从有人变为无人时,触发所述计时器401开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,触发所述计时器401结束计时。
在本发明一个实施例中,请参考图4,所述人体红外传感器304包括:菲涅尔透镜3041、相串联或相并联有2个热释电器件3042的电路3043、控制模块3044;
其中,所述2个热释电器件3042的电极化方向相反;
所述菲涅尔透镜3041,用于所述语音交互适用范围内有人时,将人体发射的红外线增强后聚集到所述热释电器件3042上;
所述热释电器件3042,用于在聚集有红外线使得温度发生变化时,向外释放电荷;
所述控制模块3044,用于在检测到所述电路3043中有电流通过时,向所述监控模块303输出所述语音交互适用范围内有人的通知信号。
详细地,人体发射的10um左右的红外线通过菲泥尔滤光片增强后聚集到红外感应源上。
本发明实施例中的红外感应源为热释电器件,这种元件在接收到人体红外辐射温度发生变化时就会失去电荷平衡,向外释放电荷,后续电路经检测处理后就能产生报警信号。
详细地,菲涅耳透镜分为折射式和反射式两种形式,其作用一是聚焦作用,将热释的红外信号折射(或反射)在红外感应源上;二是将检测区内分为若干个明区和暗区,使进入检测区的移动物体能以温度变化的形式在红外感应源上产生变化热释红外信号,这样红外感应源就能产生变化电信号。而检测区中的一些环境物品,即便能发射10um左右的红外线,但由于通常为静止物品,故通常不会产生变化电信号。如此,红外感应源的灵敏度大大增加。
此外,本发明实施例中,制成的两个电极化方向正好相反,环境背景辐射对两个热释元件几乎具有相同的作用,使其产生释电效应相互抵消,于是探测器无信号输出。而一旦有人侵入探测区域内,人体红外辐射通过部分镜面聚焦,并被热释电器件接收,但是两片热释电器件接收到的热量不同,热释电也不同,不能抵消,经信号处理而报警。
综上所述,本发明实施例可以大大降低环境物品对是否有人这一监测结果的干扰,使环境的干扰受到明显的控制作用。
详细地,菲涅尔透镜根据性能要求不同,具有不同的焦距,或称感应距离,从而产生不同的监控视场,视场越多,控制越严密。本发明实施例中,监控视场可设置为语音识别的范围,比如可以为5m。
在本发明一个实施例中,所述语音处理系统301,用于在接收到所述中央处理器302发来的一有效语音时,将所述有效语音发送给外部的云端处理器;根据所述云端处理器返回的语音识别结果,执行相应设备控制操作。
本发明实施例中,若语音处理系统开启,则无论拾取到的有效语音是否带有唤醒词,无论是有效的控制类语音还是无效的用户对话等,均可将语音发送给统一的云端处理器进行语音识别。当然,若为控制类语音,云端处理器返回的语音识别结果中会存在有相应的控制命令,语音处理系统会执行这一控制命令,且控制命令的执行结果是与用户发出有效语音的初衷相一致的。
上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
综上所述,本发明的实施例具有至少如下有益效果:
1、本发明实施例中,在监测到唤醒操作时启动语音处理系统;在语音处理系统启动期间,利用人体红外传感器实时监测语音交互适用范围内是否有人;在监测到连续预设时长内无人时关闭语音处理系统;在拾取到语音交互适用范围内的一有效语音时,判断语音处理系统是否启动,若是,将有效语音发送给语音处理系统以作处理,否则判断有效语音是否涉及到唤醒词,未涉及到唤醒词时结束。通过实时判定语音交互设备附近是否有人,来实时更新时间延迟的计时起始时间,从而使得用户只要未长时间离开设备即可无需重复唤醒,用户离开后相关实现组件关闭。因此,本发明实施例能够准确的满足用户的需要。
2、本发明实施例中,采用红外热释电技术与时间延迟相结合的方式,通过人体红外检测来判断用户是否仍然处于语音交互的适用范围,若在,则不需要重新唤醒。如人已经离去,则关闭相关组件,从而很好地解决了语音人机交互过程中的重复唤醒问题。
3、本发明实施例中,只需要唤醒一次即可进行连续语音交互,极大的改善了人机交互的体验。
4、本发明实施例中,可以大大降低环境物品对是否有人这一监测结果的干扰,使环境的干扰受到明显的控制作用。
需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个······”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (8)
1.一种语音交互处理方法,其特征在于,包括:
在监测到外部针对语音交互设备的唤醒操作时,启动语音处理系统;
在所述语音处理系统启动期间,利用人体红外传感器,实时监测所述语音交互设备的语音交互适用范围内是否有人;
在监测到连续预设时长内无人时,关闭所述语音处理系统;
在拾取到所述语音交互适用范围内的一有效语音时,判断所述语音处理系统是否启动,若是,将所述有效语音发送给所述语音处理系统以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束当前流程,判断结果为涉及到唤醒词时,将所述有效语音发送给所述语音处理系统以作处理,并再次启动所述语音处理系统;
所述在监测到外部针对语音交互设备的唤醒操作时,包括:在监测到外部针对所述语音交互设备的开机或重启操作时。
2.根据权利要求1所述的方法,其特征在于,
在所述启动语音处理系统时,进一步包括:以当前时间为计时起始时间,开始计时;
在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内有人时,实时将所述计时起始时间更新为当前时间;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
3.根据权利要求1所述的方法,其特征在于,
在所述实时监测所述语音交互设备的语音交互适用范围内是否有人之后,进一步包括:在监测到所述语音交互适用范围内从有人变为无人时,开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,结束计时;
所述在监测到连续预设时长内无人时,包括:在监测到计时持续时长达到预设的时间阈值时;
在所述关闭所述语音处理系统时,进一步包括:停止计时。
4.一种语音交互设备,其特征在于,包括:语音处理系统、中央处理器、监控模块、人体红外传感器、语音拾取模块;
其中,所述语音处理系统,用于处理所述中央处理器发来的每一个有效语音;
所述中央处理器,用于在监测到外部针对语音交互设备的唤醒操作时,启动所述语音处理系统;在接收到所述语音拾取模块发来的一有效语音时,判断所述语音处理系统是否启动,若是,将所述有效语音发送给所述语音处理系统以作处理,否则,进一步判断所述有效语音是否涉及到至少一个预设的唤醒词,判断结果为未涉及到唤醒词时,结束,判断结果为涉及到唤醒词时,将所述有效语音发送给所述语音处理系统以作处理,并再次启动所述语音处理系统;
所述监控模块,用于在所述语音处理系统启动期间,利用所述人体红外传感器,实时监测所述语音交互设备的语音交互适用范围内是否有人;在监测到连续预设时长内无人时,通知所述中央处理器关闭所述语音处理系统;
所述语音拾取模块,用于在拾取到所述语音交互适用范围内的一有效语音时,将所述有效语音发送给所述中央处理器;
所述中央处理器,用于在监测到外部针对所述语音交互设备的开机或重启操作时,启动语音处理系统。
5.根据权利要求4所述的语音交互设备,其特征在于,
还包括:计时器;
所述计时器,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器关闭所述语音处理系统;
所述中央处理器,用于在所述启动语音处理系统时,触发所述计时器开始计时;
所述监控模块,用于在监测到所述语音交互适用范围内有人时,实时触发所述计时器重新开始计时。
6.根据权利要求4所述的语音交互设备,其特征在于,
还包括:计时器;
所述计时器,用于在监测到计时持续时长达到预设的时间阈值时,停止计时,并通知所述中央处理器关闭所述语音处理系统;
所述监控模块,用于在监测到所述语音交互适用范围内从有人变为无人时,触发所述计时器开始计时;以及,在监测到所述语音交互适用范围内从无人变为有人时,触发所述计时器结束计时。
7.根据权利要求4所述的语音交互设备,其特征在于,
所述人体红外传感器包括:菲涅尔透镜、相串联或相并联有2个热释电器件的电路、控制模块;
其中,所述2个热释电器件的电极化方向相反;
所述菲涅尔透镜,用于所述语音交互适用范围内有人时,将人体发射的红外线增强后聚集到所述热释电器件上;
所述热释电器件,用于在聚集有红外线使得温度发生变化时,向外释放电荷;
所述控制模块,用于在检测到所述电路中有电流通过时,向所述监控模块输出所述语音交互适用范围内有人的通知信号。
8.根据权利要求4至7中任一所述的语音交互设备,其特征在于,
所述语音处理系统,用于在接收到所述中央处理器发来的一有效语音时,将所述有效语音发送给外部的云端处理器;根据所述云端处理器返回的语音识别结果,执行相应设备控制操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910422875.3A CN110136716B (zh) | 2019-05-21 | 2019-05-21 | 一种语音交互处理方法及语音交互设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910422875.3A CN110136716B (zh) | 2019-05-21 | 2019-05-21 | 一种语音交互处理方法及语音交互设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110136716A CN110136716A (zh) | 2019-08-16 |
CN110136716B true CN110136716B (zh) | 2021-11-23 |
Family
ID=67571759
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910422875.3A Active CN110136716B (zh) | 2019-05-21 | 2019-05-21 | 一种语音交互处理方法及语音交互设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110136716B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110647732B (zh) * | 2019-09-16 | 2022-02-25 | 云从科技集团股份有限公司 | 一种基于生物识别特征的语音交互方法、系统、介质和设备 |
CN110673723A (zh) * | 2019-09-16 | 2020-01-10 | 广州云从信息科技有限公司 | 基于生物识别特征的语音交互方法、系统、介质和设备 |
CN114745578A (zh) * | 2020-12-24 | 2022-07-12 | 惠州视维新技术有限公司 | 电视机控制方法、装置、电视机及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9330561B2 (en) * | 2013-03-04 | 2016-05-03 | Hello Inc. | Remote communication systems and methods for communicating with a building gateway control to control building systems and elements |
CN107993656A (zh) * | 2017-12-06 | 2018-05-04 | 海信(山东)空调有限公司 | 语音识别功能唤醒方法和装置 |
CN108320742A (zh) * | 2018-01-31 | 2018-07-24 | 广东美的制冷设备有限公司 | 语音交互方法、智能设备及存储介质 |
CN108831451A (zh) * | 2018-03-30 | 2018-11-16 | 广东思派康电子科技有限公司 | 一种计算机可读存储介质及应用该介质的语音识别音箱 |
KR20190006465A (ko) * | 2017-07-10 | 2019-01-18 | 강영모 | Iot 기반의 음성인식 가스안전 차단시스템 |
CN109584878A (zh) * | 2019-01-14 | 2019-04-05 | 广东小天才科技有限公司 | 一种语音唤醒方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN201680551U (zh) * | 2010-05-26 | 2010-12-22 | 洛阳同翔电子科技有限公司 | 一种节能限温无线智能空调控制器 |
-
2019
- 2019-05-21 CN CN201910422875.3A patent/CN110136716B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9330561B2 (en) * | 2013-03-04 | 2016-05-03 | Hello Inc. | Remote communication systems and methods for communicating with a building gateway control to control building systems and elements |
KR20190006465A (ko) * | 2017-07-10 | 2019-01-18 | 강영모 | Iot 기반의 음성인식 가스안전 차단시스템 |
CN107993656A (zh) * | 2017-12-06 | 2018-05-04 | 海信(山东)空调有限公司 | 语音识别功能唤醒方法和装置 |
CN108320742A (zh) * | 2018-01-31 | 2018-07-24 | 广东美的制冷设备有限公司 | 语音交互方法、智能设备及存储介质 |
CN108831451A (zh) * | 2018-03-30 | 2018-11-16 | 广东思派康电子科技有限公司 | 一种计算机可读存储介质及应用该介质的语音识别音箱 |
CN109584878A (zh) * | 2019-01-14 | 2019-04-05 | 广东小天才科技有限公司 | 一种语音唤醒方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110136716A (zh) | 2019-08-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110136716B (zh) | 一种语音交互处理方法及语音交互设备 | |
WO2019007245A1 (zh) | 一种处理方法、控制方法、识别方法及其装置和电子设备 | |
CN105912092B (zh) | 人机交互中的语音唤醒方法及语音识别装置 | |
EP3754652B1 (en) | Method and apparatus for adjusting detection threshold for activating voice assistant function | |
JP6343099B2 (ja) | Mcuチップのウェイクアップ方法及び装置 | |
KR101641174B1 (ko) | 셧다운 상태에서의 알람의 구현방법, 이동 단말기, 프로그램 및 기록매체 | |
CN107277672B (zh) | 一种支持唤醒模式自动切换的方法和装置 | |
CN108806673B (zh) | 一种智能设备控制方法、装置及智能设备 | |
CN106331857A (zh) | 一种智能电视自动控制方法及其系统 | |
CN104347072A (zh) | 遥控器控制的方法、装置和遥控器 | |
WO2020224346A1 (zh) | 控制装置及其操作方法,和语音交互装置及其操作方法 | |
EP3443440B1 (en) | Waking computing devices based on ambient noise | |
WO2015131550A1 (zh) | 一种控制播放器进入睡眠模式的方法、装置及终端设备 | |
WO2020003851A1 (ja) | 音声処理装置、音声処理方法及び記録媒体 | |
CN103901782A (zh) | 一种声控方法、电子设备及声控装置 | |
WO2020087895A1 (zh) | 语音交互处理方法及装置 | |
WO2019227370A1 (zh) | 一种多语音助手控制方法、装置、系统及计算机可读存储介质 | |
TW201732497A (zh) | 麥克風裝置 | |
CN114373462A (zh) | 语音交互设备及其控制方法、控制装置 | |
CN110933345A (zh) | 一种降低电视待机功耗的方法、电视机及存储介质 | |
CN111862965A (zh) | 唤醒处理方法、装置、智能音箱及电子设备 | |
WO2021180162A1 (zh) | 功耗控制、模式配置与vad方法、设备及存储介质 | |
WO2023222104A1 (zh) | 一种设备控制的方法和装置 | |
WO2020119810A1 (zh) | 一种电子设备控制系统和方法 | |
CN107463384A (zh) | 一种移动设备及开关机方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |