CN113450791A - 一种语音设备控制方法、装置、存储介质及语音设备 - Google Patents
一种语音设备控制方法、装置、存储介质及语音设备 Download PDFInfo
- Publication number
- CN113450791A CN113450791A CN202110468478.7A CN202110468478A CN113450791A CN 113450791 A CN113450791 A CN 113450791A CN 202110468478 A CN202110468478 A CN 202110468478A CN 113450791 A CN113450791 A CN 113450791A
- Authority
- CN
- China
- Prior art keywords
- voice
- information
- equipment
- instruction
- command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000004891 communication Methods 0.000 claims abstract description 183
- 230000004044 response Effects 0.000 claims abstract description 112
- 210000005069 ears Anatomy 0.000 claims abstract description 35
- 238000012545 processing Methods 0.000 claims description 50
- 230000001755 vocal effect Effects 0.000 claims description 18
- 238000004590 computer program Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 5
- 230000003993 interaction Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B11/00—Transmission systems employing sonic, ultrasonic or infrasonic waves
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/225—Feedback of the input speech
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/02—Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明提供一种语音设备控制方法、装置、存储介质及语音设备,方法包括:当所属语音设备接收到语音信息时,判断接收到的语音信息是第一人声语音指令或者语音响应信息;若判断是第一人声语音指令,则判断是否是控制所属语音设备的语音指令;若判断是控制所属语音设备的语音指令,则播报语音响应信息,并发出通知第一人声语音指令已被响应的第一声波信息或第一通信信息;若判断不是控制所属语音设备的语音指令,则不响应第一人声语音指令,并发出转发第一人声语音指令的第二声波信息或第二通信信息;第一声波信息和第二声波信息的频率不在人耳能够听到的频率范围内。本发明能避免语音设备语音播报时,其它语音设备被误控制或误唤醒造成相互干扰。
Description
技术领域
本发明涉及控制领域,尤其涉及一种语音设备控制方法、装置、存储介质及语音设备。
背景技术
语音识别、语音交互等技术已应用在多个领域,对于搭载了语音识别系统的设备一般在收到语音信号时会被唤醒后对语音信号进行响应并进行语音播报。对于同一区域内或多个相邻区域内的多个语音识别设备,可能出现同时被语音信号唤醒并进行语音播报的情况,而在一般的应用场景中,用户显然只会对一个语音识别设备进行唤醒,并且多个语音识别设备同时唤醒并播报语音,会导致多个语音识别设备之间相互干扰的问题。例如,一个语音识别设备响应所述语音信号后播报的声音可能会被另一个靠近播报语音的设备而远离人的语音识别设备接收并响应,反之亦然,即产生相互干扰的问题。
发明内容
本发明的主要目的在于克服上述相关技术的缺陷,提供一种语音设备控制方法、装置、存储介质及语音设备,以解决相关技术中对于同一区域内或相邻区域内的两个以上语音识别设备,可能出现同时被语音信号唤醒并进行语音播报响应的情况导致两个以上语音识别设备之间相互干扰的问题。
本发明一方面提供了一种语音设备控制方法,包括:当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息;若判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令;若判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令,并发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息;若判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令,并发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息;其中,所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。
可选地,所述第一声波信息、第一通信信息、第二声波信息和/或第一通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述设备信息,包括:设备地址和/或类型;其中,所述第二声波信息或第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
可选地,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。
可选地,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息的频率不在人耳能够听到的频率范围内;所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发出设备接收到的所述第二人声语音指令已被响应;若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令;若接收到所述第三声波信息,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息;所述第三声波信息或第三通信信息,包括:将接收到所述第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。
可选地,还包括:若判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息;和/或,当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令;若判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,并发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息;若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息或第四通信信息;其中,所述第四声波信息、第四通信信息、第五声波信息和/或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
本发明另一方面提供了一种语音设备控制装置,包括:第一判断单元,用于当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息;第二判断单元,用于若所述第一判断单元判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令;语音响应单元,用于若所述第二判断单元判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令;若所述第二判断单元判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令;信息发出单元,用于若所述第二判断单元判断所述第一人声语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息;若所述第二判断单元判断所述第一人声语音指令不是控制所属语音设备的语音指令,则发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息;其中,所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。
可选地,所述第一声波信息、第一通信信息、第二声波信息和/或第一通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述设备信息,包括:设备地址和/或类型;其中,所述第二声波信息或第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
可选地,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。
可选地,所述第一判断单元,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息或第三通信信息的频率不在人耳能够听到的频率范围内;所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发出设备接收到的所述第二人声语音指令已被响应;若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令;若接收到所述第三声波信息,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息;所述第三声波信息,包括:将接收到所述第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。
可选地,还包括:所述语音响应单元,还用于:若所述第一判断单元判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息;和/或,第三判断单元,用于当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令;所述语音响应单元,还用于:若所述第三判断单元判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令;所述信息发出单元,还用于:若所述第三判断单元判断所述第三语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息;若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息;其中,所述第四声波信息、第四通信信息、第五声波信息和/或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
本发明又一方面提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明再一方面提供了一种语音设备,包括前述任一所述的语音设备控制装置。
根据本发明的技术方案,在响应人声语音指令播报语音响应时,增加一段人耳频段之外的包含特征信息的声波,进而提醒其他的语音设备,此为播报语音而不是人声控制指令,以此来避免语音识别设备进行语音播报时,可能被其它语音设备误控制/唤醒,而造成相互干扰的问题;通过增加人耳频段之外的包含特征信息的声波的方式,语音设备通过解析该声波信息中的三个重要特征,可以在有语音设备发出该特征声波之后,在语音设备之间进行转发,进而可以将人声语音指令可以传送到用户想要响应的语音设备上,进而实现远程控制该语音设备。在不增加任何成本的情况下,可以利用各个语音设备作为中继,解决多语音设备情况下,部分语音设备距离人太远无法响应的问题。此方法既节省成本,又能避免语音设备播报语音对用户造成的困扰,还可以进行远距离语音识别。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明提供的语音设备控制方法的一实施例的方法示意图;
图2是本发明的场景示意图;
图3示出了解决所属语音设备被其他语音设备误唤醒或误控制的问题的具体实施方式的示意图;
图4是本发明提供的语音设备控制方法的另一实施例的方法示意图;
图5示出了解决因用户距离语音设备较远导致语音设备识别不到语音指令的问题的具体实施方式的示意图;
图6是本发明提供的语音设备的控制方法的一具体实施例的方法示意图;
图7是本发明提供的语音设备控制装置的一实施例的结构框图;
图8是本发明提供的语音设备控制装置的另一实施例的结构框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明具体实施例及相应的附图对本发明技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图2所示,人在靠近语音设备1时,说一些通用指令,如“开机”,语音设备1接收到了语音指令,语音设备2在离人较远处,没有接收到人的语音指令,但是当语音设备1播报“已开机时”,可能会被语音设备2捕获,并响应,导致语音设备2被误控制或误唤醒。
图1是本发明提供的语音设备控制方法的一实施例的方法示意图。所述语音设备包括能够与用户进行语音交互的设备,例如为具有语音交互功能的电器,例如空调、洗衣机、冰箱等。
如图1所示,根据本发明的一个实施例,所述语音设备控制方法至少包括步骤S110、步骤S120、步骤S130和步骤S140。
步骤S110,当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息。
所属语音设备即所述控制方法的实施设备。具体地,在所属语音设备接收范围内,若用户发出人声语音指令或者其他语音设备播放语音响应信息时,则所属语音设备能够接收到用户发出的人声语音指令或其他语音设备播放的语音响应信息。当所属语音设备接收到语音信息时,所述语音信息有可能是用户发出的人声语音指令或者其他语音设备播放的语音响应信息,则需要判断接收到的所述语音信息是第一人声语音指令还是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息。
在一些具体实施方式中,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息的频率不在人耳能够听到的频率范围内,所述第三通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发送设备接收到的所述第二人声语音指令已被响应;所述第三声波信息或第三通信信息具体可以包括:将第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。其中,当其他设备接收到第三声波信息或第三通信信息,对所述第三声波信息或第三通信信息进行解析,得到所述第二语音指令以及第二特征信息,根据所述第二特征信息中的已响应所述第二人声语音指令的语音设备的设备信息不为空,确定所述第三声波信息或第三通信信息中的第二语音指令对应的第二人声语音指令已被响应,则若接收到所述第二人声语音指令,则不会响应。将第二人声语音指令进行预设处理具体可以包括:将所述第二人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令。若接收到所述第三声波信息或第三通信信息,且对所述第三声波信息或第三通信信息进行解析,得到所述第二语音指令以及第二特征信息,并判断所述第二特征信息中的所述已响应所述第二人声语音指令的语音设备的设备信息不为空,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,其中,接收到所述第二人声语音指令的语音设备,若判断所述第二人声语音指令是控制自身的语音指令,则响应该第二人声语音指令播报相应的语音响应信息以响应所述第二人声语音指令,并发出用于通知其他语音设备所述第二人声语音指令已被响应的第三声波信息或第三通信信息。
步骤S120,若判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令。
具体地,可以通过所述第一人声语音指令的声源距离所属语音设备的远近和/或所述第一人声语音指令与所属语音设备的控制关键词(例如唤醒词)的匹配程度判断所述第一人声语音指令是否是控制所属语音设备的指令。例如,若所述声源(例如发出所述第一人声语音指令的人)距离所属语音设备的距离在预设距离范围内,且所述第一人声语音指令与所属语音设备的控制关键词的匹配程度达到预设匹配度阈值,确定所述第一人声语音指令是控制所属语音设备的语音指令;若所述声源(例如发出所述第一人声语音指令的人)距离所属语音设备的距离不在预设距离范围内,和/或所述第一人声语音指令与所属语音设备的控制关键词的匹配程度未达到预设匹配度阈值,则确定所述第一人声语音指令不是控制所属语音设备的语音指令。
步骤S130,若判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令,并发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息。
步骤S140,若判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令,并发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息。
所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。例如,人耳能识别的声波频率范围为20-20000Hz,如果播报该频段以外的声波,人耳是听不到的,但是语音接收设备可以接收并识别该声波信号。所述第一通信信息和所述第二通信信息包括通过无线信号或有线信号发送的信息,人耳也无法听到,但是语音设备可以接收到。
具体地,所述第一声波信息和/或所述第二声波信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。可选地,所述设备信息,包括:设备地址和/或类型。其中,所述第二声波信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
类似地,所述第一通信信息和/或所述第二通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。可选地,所述设备信息,包括:设备地址和/或类型。其中,所述第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
当接收到的语音信息为人声语音指令时,即第一人声语音指令,判断识别第一人声语音指令是否是控制所属语音设备的语音指令,若判断是控制所属语音设备的语音唤醒指令,则响应该人声语音指令,例如若识别该人声语音指令为语音唤醒指令,则播报语音响应信息,例如“您有什么吩咐”,若识别该人声语音指令为语音控制指令,则根据该控制指令执行相应的控制操作并播报语音响应信息,即应答语音,例如“已开机”。在响应该人声语音指令播放语音响应信息时,还向周围播报通知其他语音设备所述人声语音指令已被响应的第一声波信息,或者向周围发送通知其他语音设备所述人声语音指令已被响应的第一通信信息,从而通知其他语音设备不要响应。所述第一声波信息中包括:将所述第一人声语音指令进行预设处理后得到的语音指令以及特征信息,所述特征信息包括已响应所述第一人声语音指令的语音设备的设备信息,即所属语音设备的设备信息(例如包括设备地址和/或类型),以及转发目标语音设备的设备信息,转发目标语音设备,即下一个能接收到所述第一声波信息的语音设备。例如,接收到该第一声波信息或第一通信信息的语音设备,对所述第一声波信息或第一通信信息进行解析,得到所述第一语音指令以及第一特征信息,根据其中的转发目标语音设备的设备信息判断自己不是转发目标语音设备,则不进行处理,即不对所述第一声波信息或第一通信信息进行解析。
在一些具体实施方式中,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
其他设备在接收到所属语音设备播报的语音响应信息以及所述第一声波信息或所述第一通信信息之后,分析出该语音响应信息不是人声语音指令,并判断所述第一声波信息中已响应所述第一人声语音指令的语音设备的设备信息不为空,则认为第一人声语音指令已经被相应的语音设备响应过,则不会响应该语音响应信息,即不会被唤醒也不会执行相应的控制指令。当其他设备接收到第一声波信息或第一通信信息,对所述第一声波信息或第一通信信息进行解析,得到所述第一语音指令以及第一特征信息,根据所述第一声波信息或第一通信信息中的所述第一特征信息中的已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息不为空,则确定所述第一声波信息或第一通信信息中的第一语音指令对应的第一人声语音指令已被响应,则若接收到所述第一人声语音指令,则不会响应。
当所属语音设备接收到的语音信息为人声语音指令(第一人声语音指令)时,判断识别该人声语音指令是否是控制所属语音设备的语音指令,若识别该人声语音指令不是控制所属语音设备的语音指令,则不响应所述该人声语音指令,并播放向其他语音设备转发所述第一人声语音指令的第二声波信息,或者发出向其他语音设备转发所述第一人声语音指令的第二通信信息,从而将所述第一人声语音指令通过所述第二声波信息转发给其他语音设备。所述第二声波信息或第二通信信息中包括:将所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息。所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述特征信息中的所述已响应所述第一人声语音指令的语音设备的设备信息为空(例如设备地址和类似为空)。
其他设备在接收到所属语音设备发出的所述第二声波信息或第二通信信息之后,分析出该语音响应信息不是人声语音指令,并对所述第二声波信息或第二通信信息进行解析,得到所述第一语音指令以及第一特征信息,判断所述第一特征信息中已响应所述第一人声语音指令的语音设备的设备信息为空,则认为第一人声语音指令未被相应的语音设备响应过,则识别所述第二声波信息或第二通信信息中包含的将所述第一人声语音指令进行预设处理后得到的第一语音指令是否为控制其自身的语音指令(例如,通过语音指令本身的内容来识别,例如通过唤醒词的匹配程度或者自身的设备类型来判断是否为控制其自身的语音指令),若识别第一语音指令是控制其自身的语音指令,则响应所述第一语音指令,并播报用于通知其他语音设备所述第一人声语音指令已被响应的第六声波信息或第六通信信息。若识别第一语音指令不是控制其自身的语音指令,则转发所述第二声波信息或第二通信信息。
所述第六声波信息的频率不在人耳能够听到的频率范围内。所述第六声波信息或第六通信信息包括:将所述第一人声语音指令进行预设处理后得到的第四语音指令以及第四特征信息。所述第四特征信息包括该语音设备的设备信息(例如包括设备地址和/或类型),即所述已响应所述人声语音指令的语音设备的设备信息,以通知其他语音设备不要响应该设备播报的应答语音,而所述第四特征信息中转发目标语音设备的设备信息为空,即不需要继续转发。在一些具体实施方式中,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
进一步地,若判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息。也就是说,若判断接收到的所述语音信息是其他语音设备发出的用于响应其接收到的第二人声语音指令的语音响应信息,说明第二人声语音指令已被响应,则不需要响应所述语音响应信息。
根据本发明上述实施例,能够解决所属语音设备被其他语音设备误唤醒或误控制的问题。图3示出了解决所属语音设备被其他语音设备误唤醒或误控制的问题的具体实施方式的示意图。
如图3所示,用户在语音设备接收范围内发出人声语音指令,附近的语音设备识别到该语音信号并确认是控制其的语音指令后,响应该人声语音指令,并朝周围播报已经响应该语音指令的信息,且该语音信息增加一段人耳频段之外的包含特征信息的声波,要求其它语音设备不要响应,其他语音设备如果接收到播报语音信息时,检测到人耳频段之外的包含特征信息的声波信息,分析出该播报语音信息不是人声语音指令,并判断已响应设备地址和类型不为空,则认为该语音指令已经有语音设备响应过,则其他语音设备不被唤醒且不响应该语音指令。
图4是本发明提供的语音设备控制方法的另一实施例的方法示意图。
如图4所示,根据本发明的另一个实施例,所述语音设备控制方法还包括步骤S150、步骤S160和步骤S170。
步骤S150,当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息中的第三语音指令是否是控制所属语音设备的语音指令。
步骤S160,若判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,并发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息。
步骤S170,若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息或第四通信信息。
具体地,所述第四声波信息或第四通信信息是其他语音设备在接收到第三人声语音指令时,判断所述第三人声语音指令不是控制其自身的语音指令,而发出的用于向其他语音设备转发所述第三人声语音指令的声波信息。所述第四声波信息的频率不在人耳能够听到的频率范围内,所述第四通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第四声波信息或第四通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。在一些具体实施方式中,将所述第三人声语音指令进行预设处理,包括:将所述第三人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。
当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则确定所述第四声波信息或第四通信信息是其他语音设备发出的用于转发所述接收到的第三人声语音指令的声波信息或通信信息,则对所述第四声波信息或第四通信信息进行解析,得到所述第三语音指令以及第三特征信息,判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令。若判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,并播放用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息。若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备继续转发所述第四声波信息或第四通信信息。
所述第五声波信息的频率不在人耳能够听到的频率范围内。所述第五通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第五声波信息或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
根据本发明上述实施例,能够解决用户距离语音设备较远,语音设备识别不到语音指令时,语音设备不响应的情况的问题。图5示出了解决因用户距离语音设备较远导致语音设备识别不到语音指令的问题的具体实施方式的示意图。
如图5所示,用户在语音设备接收范围内发出人声语音指令,附近能够接收到该语音指令的语音设备识别到该人声语音指令,但确认不是控制其自身的语音指令后,不播放人耳频段内的语音信息,播报人耳频段之外的包含特征信息的声波(只是转发,其它语音设备可以响应),此时特征信息中已响应设备类型和地址为空,转发目标设备地址和类型为其他语音设备的地址和类型;转发目标设备即下一个能接收到这个包含特征信息的声波的语音设备。其他语音设备,若接收到语音播放信息时,判断是否是控制其自身的语音指令。如果(通过判断特征信息中的已经过频率处理的语音指令)是控制其自身的语音指令,则响应该语音指令(此时已响应设备地址和类型不为空),并朝周围播报已经响应该语音指令的信息,且该语音信息增加一段人耳频段之外的包含特征信息的声波(即要求其它语音设备不要响应),如果不是控制其自身的语音指令(此时已响应设备地址和类型为空,转发目标设备地址和类型为其他语音设备的地址和类型),则继续转发。
为清楚说明本发明技术方案,下面再以一个具体实施例对本发明提供的语音设备的控制方法的执行流程进行描述。
图6是本发明提供的语音设备的控制方法的一具体实施例的方法示意图。如图6所示,用户在语音设备接收范围内发出人声语音指令,附能接收该语音指令的语音设备接收该语音指令将该语音指令进行频率处理,并且判断当前语音设备是否响应该语音指令,解析语音信号并行车已调频声波信息中的单个主要特征信息;其他的语音设备收到该声波信息,根据声波中三个主要特征信息判断是否响应该语音信号还是继续转发。
图7是本发明提供的语音设备控制装置的一实施例的结构框图。
所述语音设备包括能够与用户进行语音交互的设备,例如为具有语音交互功能的电器,例如空调、洗衣机、冰箱等。
如图7所示,所述语音设备控制装置100包括:第一判断单元110、第二判断单元120、语音响应单元130和信息发出单元140。
第一判断单元110用于当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息。
所属语音设备即所述控制装置的实施设备。具体地,在所属语音设备接收范围内,若用户发出人声语音指令或者其他语音设备播放的语音响应信息时,则所属语音设备能够接收到用户发出的人声语音指令或其他语音设备播放的语音响应信息。当所属语音设备接收到语音信息时,所述语音信息有可能是用户发出的人声语音指令或者其他语音设备播放的语音响应信息,则需要判断接收到的所述语音信息是第一人声语音指令还是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息。
在一些具体实施方式中,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息的频率不在人耳能够听到的频率范围内,所述第三通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发送设备接收到的所述第二人声语音指令已被响应;所述第三声波信息或第三通信信息具体可以包括:将第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。其中,当其他设备接收到第三声波信息或第三通信信息,对所述第三声波信息或第三通信信息进行解析,得到所述第二语音指令以及第二特征信息,根据所述第二特征信息中的已响应所述第二人声语音指令的语音设备的设备信息不为空,确定所述第三声波信息或第三通信信息中的第二语音指令对应的第二人声语音指令已被响应,则若接收到所述第二人声语音指令,则不会响应。将第二人声语音指令进行预设处理具体可以包括:将所述第二人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令。若接收到所述第三声波信息或第三通信信息,且对所述第三声波信息或第三通信信息进行解析,得到所述第二语音指令以及第二特征信息,并判断所述第二特征信息中的所述已响应所述第二人声语音指令的语音设备的设备信息不为空,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,其中,接收到所述第二人声语音指令的语音设备,若判断所述第二人声语音指令是控制自身的语音指令,则响应该第二人声语音指令播报相应的语音响应信息以响应所述第二人声语音指令,并发出用于通知其他语音设备所述第二人声语音指令已被响应的第三声波信息或第三通信信息。
第二判断单元120用于若所述第一判断单元110判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令。
具体地,可以通过所述第一人声语音指令的声源距离所属语音设备的远近和/或所述第一人声语音指令与所属语音设备的控制关键词(例如唤醒词)的匹配程度判断所述第一人声语音指令是否是控制所属语音设备的指令。例如,若所述声源(例如发出所述第一人声语音指令的人)距离所属语音设备的距离在预设距离范围内,且所述第一人声语音指令与所属语音设备的控制关键词的匹配程度达到预设匹配度阈值,确定所述第一人声语音指令是控制所属语音设备的语音指令;若所述声源(例如发出所述第一人声语音指令的人)距离所属语音设备的距离不在预设距离范围内,和/或所述第一人声语音指令与所属语音设备的控制关键词的匹配程度未达到预设匹配度阈值,则确定所述第一人声语音指令不是控制所属语音设备的语音指令。
语音响应单元130用于若所述第二判断单元120判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令;若所述第二判断单元120判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令。
信息发出单元140用于若所述第二判断单元120判断所述第一人声语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息;若所述第二判断单元120判断所述第一人声语音指令不是控制所属语音设备的语音指令,则发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息。
所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。例如,人耳能识别的声波频率范围为20-20000Hz,如果播报该频段以外的声波,人耳是听不到的,但是语音接收设备可以接收并识别该声波信号。所述第一通信信息和所述第二通信信息包括通过无线信号或有线信号发送的信息,人耳也无法听到,但是语音设备可以接收到。
具体地,所述第一声波信息和/或所述第二声波信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。可选地,所述设备信息,包括:设备地址和/或类型。其中,所述第二声波信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
类似地,所述第一通信信息和/或所述第二通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。可选地,所述设备信息,包括:设备地址和/或类型。其中,所述第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
当接收到的语音信息为人声语音指令时,即第一人声语音指令,判断识别第一人声语音指令是否是控制所属语音设备的语音指令,若判断是控制所属语音设备的语音唤醒指令,则响应该人声语音指令,例如若识别该人声语音指令为语音唤醒指令,则播报语音响应信息,例如“您有什么吩咐”,若识别该人声语音指令为语音控制指令,则根据该控制指令执行相应的控制操作并播报语音响应信息,即应答语音,例如“已开机”。在响应该人声语音指令播放语音响应信息时,还向周围播报通知其他语音设备所述人声语音指令已被响应的第一声波信息,或者向周围发送通知其他语音设备所述人声语音指令已被响应的第一通信信息,从而通知其他语音设备不要响应。所述第一声波信息中包括:将所述第一人声语音指令进行预设处理后得到的语音指令以及特征信息,所述特征信息包括已响应所述第一人声语音指令的语音设备的设备信息,即所属语音设备的设备信息(例如包括设备地址和/或类型),以及转发目标语音设备的设备信息,转发目标语音设备,即下一个能接收到所述第一声波信息的语音设备。例如,接收到该第一声波信息或第一通信信息的语音设备,对所述第一声波信息或第一通信信息进行解析,得到所述第一语音指令以及第一特征信息,根据其中的转发目标语音设备的设备信息判断自己不是转发目标语音设备,则不进行处理,即不对所述第一声波信息或第一通信信息进行解析。
在一些具体实施方式中,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
其他设备在接收到所属语音设备播报的语音响应信息以及所述第一声波信息或所述第一通信信息之后,分析出该语音响应信息不是人声语音指令,并判断所述第一声波信息中已响应所述第一人声语音指令的语音设备的设备信息不为空,则认为第一人声语音指令已经被相应的语音设备响应过,则不会响应该语音响应信息,即不会被唤醒也不会执行相应的控制指令。当其他设备接收到第一声波信息或第一通信信息,对所述第一声波信息或第一通信信息进行解析,得到所述第一语音指令以及第一特征信息,根据所述第一声波信息或第一通信信息中的所述第一特征信息中的已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息不为空,则确定所述第一声波信息或第一通信信息中的第一语音指令对应的第一人声语音指令已被响应,则若接收到所述第一人声语音指令,则不会响应。
当所属语音设备接收到的语音信息为人声语音指令(第一人声语音指令)时,判断识别该人声语音指令是否是控制所属语音设备的语音指令,若识别该人声语音指令不是控制所属语音设备的语音指令,则不响应所述该人声语音指令,并播放向其他语音设备转发所述第一人声语音指令的第二声波信息,或者发出向其他语音设备转发所述第一人声语音指令的第二通信信息,从而将所述第一人声语音指令通过所述第二声波信息转发给其他语音设备。所述第二声波信息或第二通信信息中包括:将所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息。所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述特征信息中的所述已响应所述第一人声语音指令的语音设备的设备信息为空(例如设备地址和类似为空)。
其他设备在接收到所属语音设备发出的所述第二声波信息或第二通信信息之后,分析出该语音响应信息不是人声语音指令,并对所述第二声波信息或第二通信信息进行解析,得到所述第一语音指令以及第一特征信息,判断所述第一特征信息中已响应所述第一人声语音指令的语音设备的设备信息为空,则认为第一人声语音指令未被相应的语音设备响应过,则识别所述第二声波信息或第二通信信息中包含的将所述第一人声语音指令进行预设处理后得到的第一语音指令是否为控制其自身的语音指令(例如,通过语音指令本身的内容来识别,例如通过唤醒词的匹配程度或者自身的设备类型来判断是否为控制其自身的语音指令),若识别第一语音指令是控制其自身的语音指令,则响应所述第一语音指令,并播报用于通知其他语音设备所述第一人声语音指令已被响应的第六声波信息或第六通信信息。若识别第一语音指令不是控制其自身的语音指令,则转发所述第二声波信息或第二通信信息。
所述第六声波信息的频率不在人耳能够听到的频率范围内。所述第六声波信息或第六通信信息包括:将所述第一人声语音指令进行预设处理后得到的第四语音指令以及第四特征信息。所述第四特征信息包括该语音设备的设备信息(例如包括设备地址和/或类型),即所述已响应所述人声语音指令的语音设备的设备信息,以通知其他语音设备不要响应该设备播报的应答语音,而所述第四特征信息中转发目标语音设备的设备信息为空,即不需要继续转发。在一些具体实施方式中,将所述第一人声语音指令进行预设处理,包括:将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。进行该频率处理(预设处理)的作用是为了避免其他的语音设备收到所属语音设备语音播报的语音响应信息造成误响应。
进一步地,所述语音响应单元,还用于:若所述第一判断单元判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息。也就是说,若判断接收到的所述语音信息是其他语音设备发出的用于响应其接收到的第二人声语音指令的语音响应信息,说明第二人声语音指令已被响应,则不需要响应所述语音响应信息。
图8是本发明提供的语音设备控制装置的另一实施例的结构框图。如图8所示,所述语音设备控制装置100还包括:第三判断单元150。
第三判断单元150用于当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令。所述语音响应单元130还用于:若所述第三判断单元150判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,所述信息发出单元140还用于:所述第三判断单元150判断所述第三语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息;若所述第三判断单元150判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息或第四通信信息。
具体地,所述第四声波信息或第四通信信息是其他语音设备在接收到第三人声语音指令时,判断所述第三人声语音指令不是控制其自身的语音指令,而发出的用于向其他语音设备转发所述第三人声语音指令的声波信息。所述第四声波信息的频率不在人耳能够听到的频率范围内,所述第四通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第四声波信息或第四通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。在一些具体实施方式中,将所述第三人声语音指令进行预设处理,包括:将所述第三人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。即,将声音的频率降低或者升高到人耳听不到的频率范围,例如超声波或者次声波。
当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则确定所述第四声波信息或第四通信信息是其他语音设备发出的用于转发所述接收到的第三人声语音指令的声波信息或通信信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令。
若判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,并播放用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息。若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备继续转发所述第四声波信息或第四通信信息。
所述第五声波信息的频率不在人耳能够听到的频率范围内。所述第五通信信息包括通过无线信号或有线信号发送的信息,从而,人耳听不到该声波信息或通信信息。所述第五声波信息或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
本发明还提供对应于所述语音设备的控制方法的一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现前述任一所述方法的步骤。
本发明还提供对应于所述语音设备的控制方法的一种语音设备,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现前述任一所述方法的步骤。
本发明还提供对应于所述语音设备的控制装置的一种语音设备,包括前述任一所述的语音设备的控制装置。
据此,本发明提供的方案,在响应人声语音指令播报语音响应时,增加一段人耳频段之外的包含特征信息的声波,进而提醒其他的语音设备,此为播报语音而不是人声控制指令,以此来解决相关技术中语音识别设备进行语音播报时,可能被其它语音设备误控制/唤醒,而造成相互干扰的问题;通过增加人耳频段之外的包含特征信息的声波的方式,语音设备通过解析该声波信息中的三个重要特征,可以在有语音设备发出该特征声波之后,在语音设备之间进行转发,进而可以将人声语音指令可以传送到用户想要响应的语音设备上,进而实现远程控制该语音设备。在不增加任何成本的情况下,可以利用各个语音设备作为中继,解决多语音设备情况下,部分语音设备距离人太远无法响应的问题。此方法既节省成本,又能避免语音设备播报语音对用户造成的困扰,还可以进行远距离语音识别。
本文中所描述的功能可在硬件、由处理器执行的软件、固件或其任何组合中实施。如果在由处理器执行的软件中实施,那么可将功能作为一或多个指令或代码存储于计算机可读媒体上或经由计算机可读媒体予以传输。其它实例及实施方案在本发明及所附权利要求书的范围及精神内。举例来说,归因于软件的性质,上文所描述的功能可使用由处理器、硬件、固件、硬连线或这些中的任何者的组合执行的软件实施。此外,各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为控制装置的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (12)
1.一种语音设备控制方法,其特征在于,包括:
当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息;
若判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令;
若判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令,并发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息;
若判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令,并发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息;
其中,所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。
2.根据权利要求1所述的方法,其特征在于,
所述第一声波信息、第一通信信息、第二声波信息和/或第一通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述设备信息,包括:设备地址和/或类型;
其中,所述第二声波信息或第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
3.根据权利要求2所述的方法,其特征在于,将所述第一人声语音指令进行预设处理,包括:
将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。
4.根据权利要求1-3任一项所述的方法,其特征在于,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:
判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息的频率不在人耳能够听到的频率范围内;所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发出设备接收到的所述第二人声语音指令已被响应;
若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令;若接收到所述第三声波信息,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息;
所述第三声波信息或第三通信信息,包括:将接收到所述第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
若判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息;
和/或,
当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令;
若判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令,并发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息;
若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息;
其中,所述第四声波信息、第四通信信息、第五声波信息和/或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
6.一种语音设备控制装置,其特征在于,包括:
第一判断单元,用于当所属语音设备接收到语音信息时,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息;
第二判断单元,用于若所述第一判断单元判断所述语音信息是第一人声语音指令,则判断所述第一人声语音指令是否是控制所属语音设备的语音指令;
语音响应单元,用于若所述第二判断单元判断所述第一人声语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第一人声语音指令;若所述第二判断单元判断所述第一人声语音指令不是控制所属语音设备的语音指令,则不响应所述第一人声语音指令;
信息发出单元,用于若所述第二判断单元判断所述第一人声语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第一人声语音指令已被响应的第一声波信息或第一通信信息;
若所述第二判断单元判断所述第一人声语音指令不是控制所属语音设备的语音指令,则发出用于向其他语音设备转发所述第一人声语音指令的第二声波信息或第二通信信息;
其中,所述第一声波信息和所述第二声波信息的频率不在人耳能够听到的频率范围内。
7.根据权利要求6所述的装置,其特征在于,
所述第一声波信息、第一通信信息、第二声波信息和/或第一通信信息,包括:将所属语音设备接收到所述第一人声语音指令进行预设处理后得到的第一语音指令以及第一特征信息;所述第一特征信息,包括:已响应所述第一人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述设备信息,包括:设备地址和/或类型;
其中,所述第二声波信息或第二通信信息中,所述已响应所述第一人声语音指令的语音设备的设备信息为空。
8.根据权利要求7所述的装置,其特征在于,将所述第一人声语音指令进行预设处理,包括:
将所述第一人声语音指令的声音频率降低或升高到预设频率范围,所述预设频率范围包括人耳听不到的频率范围。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述第一判断单元,判断接收到的所述语音信息是第一人声语音指令或者其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息,包括:
判断接收到所述语音信息时是否接收到第三声波信息或第三通信信息,其中,所述第三声波信息或第三通信信息的频率不在人耳能够听到的频率范围内;所述第三声波信息或第三通信信息用于通知其他设备所述第三声波信息或第三通信信息的发出设备接收到的所述第二人声语音指令已被响应;
若未接收到所述第三声波信息或第三通信信息,则确定接收到的所述语音信息是第一人声语音指令;若接收到所述第三声波信息,则确定接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令语音响应信息;
所述第三声波信息,包括:将接收到所述第二人声语音指令进行预设处理后得到的第二语音指令以及第二特征信息;所述第二特征信息,包括:已响应所述第二人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息。
10.根据权利要求6-9任一项所述的装置,其特征在于,还包括:
所述语音响应单元,还用于:若所述第一判断单元判断接收到的所述语音信息是其他语音设备播放的用于响应其接收到的第二人声语音指令的语音响应信息,则不响应所述语音响应信息;
和/或,
第三判断单元,用于当所属语音设备接收到第四声波信息或第四通信信息时,若未接收到语音信息,则判断所述第四声波信息或第四通信信息中的第三语音指令是否是控制所属语音设备的语音指令;
所述语音响应单元,还用于:若所述第三判断单元判断所述第三语音指令是控制所属语音设备的语音指令,则播报相应的语音响应信息以响应所述第三语音指令;所述信息发出单元,还用于:若所述第三判断单元判断所述第三语音指令是控制所属语音设备的语音指令,则发出用于通知其他语音设备所述第三语音指令已被响应的第五声波信息或第五通信信息;若判断所述第三语音指令不是控制所属语音设备的语音指令,则向其他语音设备转发所述第四声波信息或第四通信信息;
其中,所述第四声波信息、第四通信信息、第五声波信息和/或第五通信信息,包括:将第三人声语音指令进行预设处理后得到的第三语音指令以及第三特征信息;所述第三特征信息,包括:已响应所述第三人声语音指令的语音设备的设备信息和转发目标语音设备的设备信息;所述第五声波信息或第五通信信息中,所述已响应所述第三人声语音指令的语音设备的设备信息为所属语音设备的设备信息。
11.一种存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时实现权利要求1-5任一所述方法的步骤。
12.一种语音设备,其特征在于,包括处理器、存储器以及存储在存储器上可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-5任一所述方法的步骤,或者包括如权利要求6-10任一所述的语音设备控制装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110468478.7A CN113450791B (zh) | 2021-04-28 | 2021-04-28 | 一种语音设备控制方法、装置、存储介质及语音设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110468478.7A CN113450791B (zh) | 2021-04-28 | 2021-04-28 | 一种语音设备控制方法、装置、存储介质及语音设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113450791A true CN113450791A (zh) | 2021-09-28 |
CN113450791B CN113450791B (zh) | 2023-08-04 |
Family
ID=77809735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110468478.7A Active CN113450791B (zh) | 2021-04-28 | 2021-04-28 | 一种语音设备控制方法、装置、存储介质及语音设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113450791B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469040A (zh) * | 2015-08-19 | 2017-03-01 | 华为终端(东莞)有限公司 | 通信方法、服务器及设备 |
US20190341049A1 (en) * | 2018-08-31 | 2019-11-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | Voice Smart Device Wake-Up Method, Apparatus, Device and Storage Medium |
CN110556115A (zh) * | 2019-09-10 | 2019-12-10 | 深圳创维-Rgb电子有限公司 | 基于多控制终端的iot设备控制方法、控制终端及存储介质 |
CN110660390A (zh) * | 2019-09-17 | 2020-01-07 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、智能设备及计算机可读存储介质 |
CN110808886A (zh) * | 2019-10-18 | 2020-02-18 | 珠海格力电器股份有限公司 | 一种语音设备的控制方法、装置、存储介质及语音设备 |
WO2020215741A1 (zh) * | 2019-04-26 | 2020-10-29 | 广东美的白色家电技术创新中心有限公司 | 语音识别设备及其唤醒响应方法、计算机存储介质 |
CN112164398A (zh) * | 2020-11-05 | 2021-01-01 | 佛山市顺德区美的电子科技有限公司 | 语音设备及其唤醒方法、装置以及存储介质 |
-
2021
- 2021-04-28 CN CN202110468478.7A patent/CN113450791B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106469040A (zh) * | 2015-08-19 | 2017-03-01 | 华为终端(东莞)有限公司 | 通信方法、服务器及设备 |
US20190341049A1 (en) * | 2018-08-31 | 2019-11-07 | Baidu Online Network Technology (Beijing) Co., Ltd. | Voice Smart Device Wake-Up Method, Apparatus, Device and Storage Medium |
WO2020215741A1 (zh) * | 2019-04-26 | 2020-10-29 | 广东美的白色家电技术创新中心有限公司 | 语音识别设备及其唤醒响应方法、计算机存储介质 |
CN110556115A (zh) * | 2019-09-10 | 2019-12-10 | 深圳创维-Rgb电子有限公司 | 基于多控制终端的iot设备控制方法、控制终端及存储介质 |
CN110660390A (zh) * | 2019-09-17 | 2020-01-07 | 百度在线网络技术(北京)有限公司 | 智能设备唤醒方法、智能设备及计算机可读存储介质 |
CN110808886A (zh) * | 2019-10-18 | 2020-02-18 | 珠海格力电器股份有限公司 | 一种语音设备的控制方法、装置、存储介质及语音设备 |
CN112164398A (zh) * | 2020-11-05 | 2021-01-01 | 佛山市顺德区美的电子科技有限公司 | 语音设备及其唤醒方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113450791B (zh) | 2023-08-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106910500B (zh) | 对带麦克风阵列的设备进行语音控制的方法及设备 | |
CN107450390B (zh) | 一种智能家电控制装置、控制方法及控制系统 | |
CN107146614B (zh) | 一种语音信号处理方法、装置及电子设备 | |
CN106898348B (zh) | 一种出声设备的去混响控制方法和装置 | |
CN109445739B (zh) | 音频播放方法、装置、电子设备及计算机可读介质 | |
CN107528755A (zh) | 智能设备的控制方法、装置、设备和存储介质 | |
WO2018207118A1 (en) | Computerized device with voice command input capability | |
CN107765891B (zh) | 一种麦克风的控制方法及麦克风 | |
CN107995360B (zh) | 通话处理方法及相关产品 | |
CN110808886A (zh) | 一种语音设备的控制方法、装置、存储介质及语音设备 | |
CN110767225B (zh) | 一种语音交互方法、装置及系统 | |
CN105580389A (zh) | 具有分类器的助听器 | |
CN105430191B (zh) | 音量的调节处理方法及装置 | |
CN111510814A (zh) | 降噪模式控制方法、装置、电子设备及存储介质 | |
CN109450747B (zh) | 一种唤醒智能家居设备的方法、装置及计算机存储介质 | |
CN111161714A (zh) | 一种语音信息处理方法、电子设备及存储介质 | |
CN110751948A (zh) | 一种语音识别方法、装置、存储介质及语音设备 | |
CN109379490B (zh) | 音频播放方法、装置、电子设备及计算机可读介质 | |
US20210407532A1 (en) | Apparatus and method for operating wearable device | |
CN103747511A (zh) | 信息播报方法和系统 | |
CN105299828A (zh) | 一种噪声处理方法及系统、空调 | |
CN113593544A (zh) | 设备的控制方法和装置、存储介质及电子装置 | |
KR20220020871A (ko) | 데이터 송신 단말, 데이터 송수신 시스템 및 데이터 송신 방법 | |
CN107134282A (zh) | 一种声音信号侦测反馈设备及其实现方法 | |
CN111862965A (zh) | 唤醒处理方法、装置、智能音箱及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |