CN114708863A - 智能音箱的唤醒方法 - Google Patents
智能音箱的唤醒方法 Download PDFInfo
- Publication number
- CN114708863A CN114708863A CN202210343482.5A CN202210343482A CN114708863A CN 114708863 A CN114708863 A CN 114708863A CN 202210343482 A CN202210343482 A CN 202210343482A CN 114708863 A CN114708863 A CN 114708863A
- Authority
- CN
- China
- Prior art keywords
- sound box
- administrator
- mode
- intelligent sound
- awakening
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000004044 response Effects 0.000 claims abstract description 40
- 230000002618 waking effect Effects 0.000 claims abstract description 30
- 238000012795 verification Methods 0.000 claims description 9
- 238000004891 communication Methods 0.000 claims description 3
- 230000009471 action Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000000739 chaotic effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/02—Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/08—Network architectures or network communication protocols for network security for authentication of entities
- H04L63/0861—Network architectures or network communication protocols for network security for authentication of entities using biometrical features, e.g. fingerprint, retina-scan
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72412—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72415—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories for remote control of appliances
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/02—Casings; Cabinets ; Supports therefor; Mountings therein
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Hardware Design (AREA)
- Biomedical Technology (AREA)
- Computational Linguistics (AREA)
- Telephone Function (AREA)
Abstract
本申请公开了一种智能音箱的唤醒方法,包括以下步骤:接收唤醒请求:智能音箱检测来自用户的唤醒请求;确定工作模式:所述智能音箱根据唤醒请求类型进入对应的工作模式,所述唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,所述工作模式至少包括与所述管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;执行语音指令:所述智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。本申请的智能音箱的唤醒方法,唤醒方式简单、安全,在唤醒的时刻起,智能音箱即可进入不同的工作模式,从而避免智能音箱响应紊乱的问题出现,提高智能音箱的使用体验。
Description
技术领域
本发明涉及智能音箱技术领域,特别涉及一种智能音箱的唤醒方法。
背景技术
智能设备的应用,对于人们的生活、工作产生了重大而意义。如智能音箱,已经跳出了传统音箱的范畴,其不单单具有传统音箱的语音播放功能,还能够与智能家居联动进行家具控制,以及能够与使用者进行语音交互以辅助使用者进行工作、学习等。
现有的智能音箱响应的方式,大多是采用声纹特征提取并识别后响应对应的动作指令,该种方式,从安全性上来说,任何一个人都能够采用唤醒指令进行智能音箱的唤醒,从智能音箱对于工作、生活上的帮助而言,当所有人都能够通过唤醒指令对智能音箱进行任意控制时,智能音箱所执行的动作、播放的内容、交互的内容均会出现杂乱、繁琐甚至出现误导用户、家居控制紊乱等问题,必须对智能音箱的权限型工作进行制定,以避免智能音箱对用户的语音指令响应混乱的问题出现,从而提高智能音箱对于使用环境和用户的存在意义。因此,对于智能音箱的唤醒方法需要特别涉及,以确保智能音箱的稳定运行。
发明内容
本申请的目的在于提供一种智能音箱的唤醒方法,以解决背景技术中提出的现有的智能音箱存在对用户的语音指令响应混乱的问题。
为实现上述目的,本申请提供如下技术方案:一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
确定工作模式:所述智能音箱根据唤醒请求类型进入对应的工作模式,所述唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,所述工作模式至少包括与所述管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:所述智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
基于上述的智能音箱的唤醒方法,智能音箱根据来自用户的唤醒请求类型进入不同的工作模式,从而响应唤醒指令,通过该种方法,管理员唤醒指令的下发,使智能音箱响应管理员身份对智能音箱作出的一系列包括唤醒的指令,公共用户唤醒指令的下发,使智能音箱响应所有用户对智能音箱作出的一系列包括唤醒的指令,进而,使智能音箱能够对不同用户进行针对性地响应,借由对不同工作模式的设置,例如,管理员操作模式下具有对应于管理员身份的人员即满足管理员唤醒指令的人能够通过智能音箱进行家居控制等需要单一选择进行确定的动作控制,以避免如因人多口杂导致的智能家居频繁切换工作状态和形态的问题出现,还例如,公共用户操作模式下所有用户均能够通过智能音箱进行语音播放、游戏互动等常规性动作的控制,从而实现不同的用户群体对智能音箱进行不同的控制,即智能音箱能够在对应的工作模式下响应针对性的用户群体下发的控制指令,使智能音箱在唤醒的那一刻开始,成为家庭、生活、工作上的可靠的助手身份,避免智能音箱对用户的语音指令响应混乱的问题出现,提高智能音箱对于使用者的实用意义。
作为优选,在确定工作模式之前,该方法还包括:预设所述智能音箱的工作模式,具体包括以下步骤:
S1:将所述智能音箱与对应的APP或管理网站进行互联;
S2:通过所述APP或管理网站对所述智能音箱的模式内容进行设定,所述模式内容包括管理员模式内容和/或公共用户模式内容;
S3:在所述模式内容对应的控制指令中,录入对应的唤醒请求类型。
基于上述的预设智能音箱的工作模式,用户能够对智能音箱的工作模式进行设置,进而根据需要对智能音箱的响应方式进行设定,确保智能音箱针对性响应的可靠性和明确性。
作为优选,在对所述管理员模式内容进行设定时,该方法还包括:
S3-1:提取所述管理员模式内容中的管理员唤醒指令的声纹特征;
S3-2:将提取到的所述管理员唤醒指令对应的声纹特征与所述管理员唤醒指令绑定,将绑定后的内容作为所述管理员操作模式唤醒的第一秘钥。
作为优选,在将绑定后的内容作为所述管理员操作模式唤醒的第一秘钥后,该方法还包括:
S3-3:在所述APP或管理网站上发出采集所述管理员操作模式对应的管理员人脸特征的请求;
S3-4:用户同意所述APP或管理网站上发出的采集请求后,所述APP或管理网站通过所述智能音箱上配置的硬件摄像头对管理员人员进行人脸特征采集;
S3-4:将采集到的人脸特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第二秘钥。
通过对第一秘钥、第二秘钥的设置,提高管理员唤醒指令的针对性,确保具有管理员身份的人员才能够使用管理员唤醒指令唤醒智能音箱,进一步确保智能音箱针对性响应的可靠性和明确性。
作为优选,在录入对应的唤醒请求类型后,该方法还包括:
S4:在所述APP或管理网站上设置所述管理员操作模式对应的唤醒要求,所述唤醒要求包括所述第一秘钥验证通过、所述第二秘钥验证通过、所述第一秘钥和所述第二秘钥均验证通过中的一种或多种。
进一步地,通过唤醒要求的设定,严格管理员操作模式唤醒的要求,确保只有真正具有预设的管理员身份的人员才能够通过管理员唤醒指令唤醒智能音箱,进而避免智能音箱错误响应唤醒的问题出现,提高智能音箱针对性响应的可靠性。
作为优选,所述智能音箱根据唤醒请求类型进入对应的工作模式具体包括:所述智能音箱根据来自用户的唤醒请求验证该唤醒请求是否满足所述管理员操作模式的唤醒要求,当满足所述管理员操作模式的唤醒要求时,所述智能音箱进入管理员操作模式并响应用户的唤醒请求后唤醒,当不满足所述管理员操作模式的唤醒要求时,所述智能音箱进入公共用户操作模式或待机。
作为优选,在所述公共用户操作模式和所述管理员操作模式下,该方法还包括响应用户的唤醒请求后唤醒,或所述智能音箱与移动设备连接后,接收来自所述移动设备的唤醒请求并唤醒。
基于上述,智能音箱能够通过响应唤醒请求唤醒的方式唤醒,也能够通过智能音箱与移动设备连接后接收来自移动设备的唤醒请求的方式唤醒,实现通过移动设备控制智能音箱的功能,远程控制智能音箱的功能,方便用户使用。
作为优选,在所述公共用户操作模式下,在接收来自所述移动设备的唤醒请求并唤醒时,该方法还包括:
T1:所述移动设备通过近场通信NFC、蓝牙、紫蜂、无线保真Wi-Fi中的任意一种与所述智能音箱近距离连接,或所述移动设备通过所述智能音箱对应的操作APP与所述智能音箱连接;
T2:所述智能音箱根据响应优先级对唤醒请求进行执行,所述响应优先级包括优先响应来自所述移动设备下发的唤醒请求或优先响应捕捉到的用户发出的包含所述公共用户唤醒指令的语音唤醒请求。
进一步地,在公共用户操作模式下,用户能够通过移动设备对智能音箱下发唤醒指令,从而避免嘈杂的环境中智能音箱无法清楚地捕捉公共用户唤醒指令的情况出现,或者也可以是通过捕捉到包含所述公共用户唤醒指令的语音唤醒请求响应唤醒,提高智能音箱唤醒的可靠度。
作为优选,在确定工作模式之前,该方法还包括:预设所述智能音箱的工作模式,具体包括以下步骤:
D1:将所述智能音箱与对应的APP或管理网站进行互联;
D2:通过所述APP或管理网站对所述智能音箱的模式内容进行设定,所述模式内容包括管理员模式内容和/或公共用户模式内容;
D3:在对所述公共用户模式内容进行设定时,在所述APP或管理网站上设置所述公共用户操作模式下的响应优先级;
D4:在所述模式内容对应的控制指令中,录入对应的唤醒请求类型。
进一步地,通过公共用户操作模式下的响应优先级的设置,能够精准的响应想要使用智能音箱的用户的唤醒请求,提高用户使用体验。
作为优选,所述执行语音指令还包括所述智能音箱在所述管理员操作模式下响应用户的语音指令切换为所述公共用户操作模式。
进一步地,在管理员操作模式下进行公共用户操作模式的切换,方便了具有管理员身份的用户对智能音箱的管理,同时,方便了具有管理员身份的用户为不具有管理员身份的用户开放智能音箱使用的权限,提高智能音箱唤醒的人性化管理。
本申请的智能音箱的唤醒方法,唤醒方式简单、安全,在唤醒的时刻起,智能音箱即可进入不同的工作模式,从而避免智能音箱响应紊乱的问题出现,提高智能音箱的使用体验。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例1中智能音箱的唤醒方法的示意图;
图2为本申请实施例2中智能音箱的唤醒方法的示意图;
图3为本申请实施例3中智能音箱的唤醒方法的示意图;
图4为本申请实施例5中智能音箱的唤醒方法的示意图;
图5为本申请实施例6中智能音箱的唤醒方法的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:如图1所示的一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
确定工作模式:智能音箱根据唤醒请求类型进入对应的工作模式,唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,工作模式至少包括与管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
在本实施例中,工作模式的设置,可以是在出厂设置时,通过智能音箱的开发平台对智能音箱作出的初始设定。简单来说,管理员操作模式可以是通过管理员唤醒指令唤醒智能音箱且智能音箱进入该模式,对应的,管理员操作模式下可以通过智能音箱播放在合法范围内的被限制的内容,该部分被限制的内容可以是如不利于儿童成长的歌曲、广播信息等,例如包括暴力活动的新闻内容、歌曲内容,含有不文明用词的歌曲内容、广播内容等,管理员操作模式下还可以支持用户通过智能音箱对智能家居进行操控。而公共用户操作模式可以是通过公共用户唤醒指令唤醒智能音箱且智能音箱进入该模式,对应的,公共用户操作模式下可以通过智能音箱播放儿童歌曲、广播内容、游戏互动等内容。通过不同的唤醒请求类型唤醒智能音箱后,智能音箱进入不同的工作模式,管理员唤醒指令的下发,使智能音箱响应管理员身份对智能音箱作出的一系列包括唤醒的指令,公共用户唤醒指令的下发,使智能音箱响应所有用户对智能音箱作出的一系列包括唤醒的指令,进而,使智能音箱能够对不同用户进行针对性地响应。借由对不同工作模式的设置,例如,管理员操作模式下具有对应于管理员身份的人员即满足管理员唤醒指令的人能够通过智能音箱进行家居控制等需要单一选择进行确定的动作控制,以避免如因人多口杂导致的智能家居频繁切换工作状态和形态的问题出现,还例如,公共用户操作模式下所有用户均能够通过智能音箱进行语音播放、游戏互动等常规性动作的控制,从而实现不同的用户群体对智能音箱进行不同的控制,即智能音箱能够在对应的工作模式下响应针对性的用户群体下发的控制指令,使智能音箱在唤醒的那一刻开始,成为家庭、生活、工作上的可靠的助手身份,避免智能音箱对用户的语音指令响应混乱的问题出现,提高智能音箱对于使用者的实用意义。
实施例2:在一种实施方式中,如图2所示的一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
预设智能音箱的工作模式;
确定工作模式:智能音箱根据唤醒请求类型进入对应的工作模式,唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,工作模式至少包括与管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
其中,预设智能音箱的工作模式,具体包括以下步骤:
S1:将智能音箱与对应的APP或管理网站进行互联;
S2:通过APP或管理网站对智能音箱的模式内容进行设定,模式内容包括管理员模式内容和/或公共用户模式内容;
S3:在模式内容对应的控制指令中,录入对应的唤醒请求类型。
APP或管理网站可以是通过智能音箱的开发平台搭建的客户端软件,用户能够通过APP或管理网站对智能音箱进行设置,一般的,如智能音箱的命名、唤醒词设置、闹钟、音乐渠道平台的账号绑定、智能音箱系统版本的更新等,均能够通过APP或管理网站进行操作。通过本实施例中预设智能音箱的工作模式的方式,实现用户能够通过APP或管理网站自定义地对智能音箱的工作模式进行设置,进而根据需要对智能音箱的响应方式进行设定,确保智能音箱针对性响应的可靠性和明确性。
在本实施例中,在对管理员模式内容进行设定时,该方法还包括:
S3-1:提取管理员模式内容中的管理员唤醒指令的声纹特征;
S3-2:将提取到的管理员唤醒指令对应的声纹特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第一秘钥。
在将绑定后的内容作为管理员操作模式唤醒的第一秘钥后,该方法还包括:
S3-3:在APP或管理网站上发出采集管理员操作模式对应的管理员人脸特征的请求;
S3-4:用户同意APP或管理网站上发出的采集请求后,APP或管理网站通过智能音箱上配置的硬件摄像头对管理员人员进行人脸特征采集;
S3-4:将采集到的人脸特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第二秘钥。
由于管理员唤醒指令一般为较为简单的语音指令,从根本上来说,其可以只是与公共用户唤醒指令不同的语音内容,延续现有市场上智能音箱的唤醒词命名习惯,例如管理员唤醒指令的语音内容为:小A小A,公共用户唤醒指令的语音内容为:小B小B,因此,为了确保是具有管理员身份的人员进行智能音箱的唤醒,因此,可以通过对第一秘钥、第二秘钥的设置,提高管理员唤醒指令的针对性,从而确保具有管理员身份的人员才能够使用管理员唤醒指令唤醒智能音箱,进一步确保智能音箱针对性响应的可靠性和明确性。
实施例3:如图3所示的一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
预设智能音箱的工作模式;
确定工作模式:智能音箱根据唤醒请求类型进入对应的工作模式,唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,工作模式至少包括与管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
预设智能音箱的工作模式,具体包括:
S1:将智能音箱与对应的APP或管理网站进行互联;
S2:通过APP或管理网站对智能音箱的模式内容进行设定,模式内容包括管理员模式内容和/或公共用户模式内容;
S3:在模式内容对应的控制指令中,录入对应的唤醒请求类型;其中,在对管理员模式内容进行设定时,还包括:S3-1:提取管理员模式内容中的管理员唤醒指令的声纹特征;S3-2:将提取到的管理员唤醒指令对应的声纹特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第一秘钥;在将绑定后的内容作为管理员操作模式唤醒的第一秘钥后,还包括:S3-3:在APP或管理网站上发出采集管理员操作模式对应的管理员人脸特征的请求;S3-4:用户同意APP或管理网站上发出的采集请求后,APP或管理网站通过智能音箱上配置的硬件摄像头对管理员人员进行人脸特征采集;S3-4:将采集到的人脸特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第二秘钥;
S4:在APP或管理网站上设置管理员操作模式对应的唤醒要求,唤醒要求包括第一秘钥验证通过、第二秘钥验证通过、第一秘钥和第二秘钥均验证通过中的一种或多种。
通过唤醒要求的设定,严格管理员操作模式唤醒的要求,一方面能够确保只有真正具有预设的管理员身份的人员才能够通过管理员唤醒指令唤醒智能音箱,进而避免智能音箱错误响应唤醒的问题出现,提高智能音箱针对性响应的可靠性。另一方面,在使用过程中,用户随身佩戴的饰品、服装以及用户由于感冒等引起的嗓音变化,均可能对智能音箱的唤醒请求识别造成影响,因此,通过唤醒要求的设定,还能够提高智能音箱对于唤醒请求的识别效果和效率,进而提高用户使用体验。
实施例4:与实施例3不同的是,智能音箱根据唤醒请求类型进入对应的工作模式具体包括:智能音箱根据来自用户的唤醒请求验证该唤醒请求是否满足管理员操作模式的唤醒要求,当满足管理员操作模式的唤醒要求时,智能音箱进入管理员操作模式并响应用户的唤醒请求后唤醒,当不满足管理员操作模式的唤醒要求时,智能音箱进入公共用户操作模式或待机。
实施例5:在本实施例中,如图4所示的一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
预设智能音箱的工作模式;
确定工作模式:智能音箱根据唤醒请求类型进入对应的工作模式,唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,工作模式至少包括与管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;在公共用户操作模式和管理员操作模式下,该方法还包括响应用户的唤醒请求后唤醒,或智能音箱与移动设备连接后,接收来自移动设备的唤醒请求并唤醒;
执行语音指令:智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
本实施例的智能音箱能够通过响应唤醒请求唤醒的方式唤醒,也能够通过智能音箱与移动设备连接后接收来自移动设备的唤醒请求的方式唤醒,实现通过移动设备控制智能音箱的功能,远程控制智能音箱的功能,方便用户使用。
具体来说,在公共用户操作模式下,在接收来自移动设备的唤醒请求并唤醒时具体包括:
T1:移动设备通过近场通信NFC、蓝牙、紫蜂、无线保真Wi-Fi中的任意一种与智能音箱近距离连接,或移动设备通过智能音箱对应的操作APP与智能音箱连接,需要说明的是,移动设备可以是能够与智能音箱互联的手机、平板电脑、智能手表、智能手环等;
T2:智能音箱根据响应优先级对唤醒请求进行执行,响应优先级包括优先响应来自移动设备下发的唤醒请求或优先响应捕捉到的用户发出的包含公共用户唤醒指令的语音唤醒请求。
在公共用户操作模式下,用户能够通过移动设备对智能音箱下发唤醒指令,从而避免嘈杂的环境中智能音箱无法清楚地捕捉公共用户唤醒指令的情况出现,或者也可以是通过捕捉到包含公共用户唤醒指令的语音唤醒请求响应唤醒,提高智能音箱唤醒的可靠度。
进一步地,预设智能音箱的工作模式,具体包括以下步骤:
D1:将智能音箱与对应的APP或管理网站进行互联;
D2:通过APP或管理网站对智能音箱的模式内容进行设定,模式内容包括管理员模式内容和/或公共用户模式内容;
D3:在对公共用户模式内容进行设定时,在APP或管理网站上设置公共用户操作模式下的响应优先级;
D4:在模式内容对应的控制指令中,录入对应的唤醒请求类型。
本实施例通过公共用户操作模式下的响应优先级的设置,能够精准的响应想要使用智能音箱的用户的唤醒请求,提高用户使用体验。
实施例6:如图5所示的一种智能音箱的唤醒方法,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
确定工作模式:智能音箱根据唤醒请求类型进入对应的工作模式,唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,工作模式至少包括与管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:智能音箱在当前工作模式的权限下对应执行来自用户的语音指令;智能音箱在管理员操作模式下响应用户的语音指令切换为公共用户操作模式。
本实施例的智能音箱能够在管理员操作模式下进行公共用户操作模式的切换,方便了具有管理员身份的用户对智能音箱的管理,同时,方便了具有管理员身份的用户为不具有管理员身份的用户开放智能音箱使用的权限,提高智能音箱唤醒的人性化管理。
还需要说明的是,本申请中没详细描述结构的部件、模块以及机构均为通用标准件或本领域技术人员知晓的部件,其结构和原理都为本技术人员均可通过技术手册得知或通过常规实验方法获知。术语“包括”意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种智能音箱的唤醒方法,其特征在于,包括以下步骤:
接收唤醒请求:智能音箱检测来自用户的唤醒请求;
确定工作模式:所述智能音箱根据唤醒请求类型进入对应的工作模式,所述唤醒请求类型至少包括管理员唤醒指令、公共用户唤醒指令,所述工作模式至少包括与所述管理员唤醒指令相对应的管理员操作模式、公共用户操作模式;
执行语音指令:所述智能音箱在当前工作模式的权限下对应执行来自用户的语音指令。
2.根据权利要求1所述的智能音箱的唤醒方法,其特征在于,在确定工作模式之前,该方法还包括:预设所述智能音箱的工作模式,具体包括以下步骤:
S1:将所述智能音箱与对应的APP或管理网站进行互联;
S2:通过所述APP或管理网站对所述智能音箱的模式内容进行设定,所述模式内容包括管理员模式内容和/或公共用户模式内容;
S3:在所述模式内容对应的控制指令中,录入对应的唤醒请求类型。
3.根据权利要求2所述的智能音箱的唤醒方法,其特征在于,在对所述管理员模式内容进行设定时,该方法还包括:
S3-1:提取所述管理员模式内容中的管理员唤醒指令的声纹特征;
S3-2:将提取到的所述管理员唤醒指令对应的声纹特征与所述管理员唤醒指令绑定,将绑定后的内容作为所述管理员操作模式唤醒的第一秘钥。
4.根据权利要求3所述的智能音箱的唤醒方法,其特征在于,在将绑定后的内容作为所述管理员操作模式唤醒的第一秘钥后,该方法还包括:
S3-3:在所述APP或管理网站上发出采集所述管理员操作模式对应的管理员人脸特征的请求;
S3-4:用户同意所述APP或管理网站上发出的采集请求后,所述APP或管理网站通过所述智能音箱上配置的硬件摄像头对管理员人员进行人脸特征采集;
S3-4:将采集到的人脸特征与管理员唤醒指令绑定,将绑定后的内容作为管理员操作模式唤醒的第二秘钥。
5.根据权利要求4所述的智能音箱的唤醒方法,其特征在于,在录入对应的唤醒请求类型后,该方法还包括:
S4:在所述APP或管理网站上设置所述管理员操作模式对应的唤醒要求,所述唤醒要求包括所述第一秘钥验证通过、所述第二秘钥验证通过、所述第一秘钥和所述第二秘钥均验证通过中的一种或多种。
6.根据权利要求5所述的智能音箱的唤醒方法,其特征在于,所述智能音箱根据唤醒请求类型进入对应的工作模式具体包括:所述智能音箱根据来自用户的唤醒请求验证该唤醒请求是否满足所述管理员操作模式的唤醒要求,当满足所述管理员操作模式的唤醒要求时,所述智能音箱进入管理员操作模式并响应用户的唤醒请求后唤醒,当不满足所述管理员操作模式的唤醒要求时,所述智能音箱进入公共用户操作模式或待机。
7.根据权利要求1所述的智能音箱的唤醒方法,其特征在于,在所述公共用户操作模式和所述管理员操作模式下,该方法还包括响应用户的唤醒请求后唤醒,或所述智能音箱与移动设备连接后,接收来自所述移动设备的唤醒请求并唤醒。
8.根据权利要求7所述的智能音箱的唤醒方法,其特征在于,在所述公共用户操作模式下,在接收来自所述移动设备的唤醒请求并唤醒时,该方法还包括:
T1:所述移动设备通过近场通信NFC、蓝牙、紫蜂、无线保真Wi-Fi中的任意一种与所述智能音箱近距离连接,或所述移动设备通过所述智能音箱对应的操作APP与所述智能音箱连接;
T2:所述智能音箱根据响应优先级对唤醒请求进行执行,所述响应优先级包括优先响应来自所述移动设备下发的唤醒请求或优先响应捕捉到的用户发出的包含所述公共用户唤醒指令的语音唤醒请求。
9.根据权利要求7所述的智能音箱的唤醒方法,其特征在于,在确定工作模式之前,该方法还包括:预设所述智能音箱的工作模式,具体包括以下步骤:
D1:将所述智能音箱与对应的APP或管理网站进行互联;
D2:通过所述APP或管理网站对所述智能音箱的模式内容进行设定,所述模式内容包括管理员模式内容和/或公共用户模式内容;
D3:在对所述公共用户模式内容进行设定时,在所述APP或管理网站上设置所述公共用户操作模式下的响应优先级;
D4:在所述模式内容对应的控制指令中,录入对应的唤醒请求类型。
10.根据权利要求1所述的智能音箱的唤醒方法,其特征在于,所述执行语音指令还包括所述智能音箱在所述管理员操作模式下响应用户的语音指令切换为所述公共用户操作模式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210343482.5A CN114708863A (zh) | 2022-03-31 | 2022-03-31 | 智能音箱的唤醒方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210343482.5A CN114708863A (zh) | 2022-03-31 | 2022-03-31 | 智能音箱的唤醒方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114708863A true CN114708863A (zh) | 2022-07-05 |
Family
ID=82171861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210343482.5A Pending CN114708863A (zh) | 2022-03-31 | 2022-03-31 | 智能音箱的唤醒方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114708863A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117894321A (zh) * | 2024-03-15 | 2024-04-16 | 富迪科技(南京)有限公司 | 一种语音交互方法、语音交互提示系统、装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108962260A (zh) * | 2018-06-25 | 2018-12-07 | 福来宝电子(深圳)有限公司 | 一种多人命令语音识别方法、系统及存储介质 |
WO2018232148A1 (en) * | 2017-06-16 | 2018-12-20 | Alibaba Group Holding Limited | Voice identification feature optimization and dynamic registration methods, client, and server |
CN110310636A (zh) * | 2019-06-24 | 2019-10-08 | 歌尔股份有限公司 | 交互控制方法、装置、设备及音频设备 |
CN110517686A (zh) * | 2019-09-26 | 2019-11-29 | 合肥飞尔智能科技有限公司 | 智能音箱端语音开通应用的方法及系统 |
US20190371327A1 (en) * | 2018-06-04 | 2019-12-05 | Disruptel, Inc. | Systems and methods for operating an output device |
CN111354357A (zh) * | 2018-12-24 | 2020-06-30 | 中移(杭州)信息技术有限公司 | 一种音频资源播放的方法、装置、电子设备及存储介质 |
-
2022
- 2022-03-31 CN CN202210343482.5A patent/CN114708863A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018232148A1 (en) * | 2017-06-16 | 2018-12-20 | Alibaba Group Holding Limited | Voice identification feature optimization and dynamic registration methods, client, and server |
US20190371327A1 (en) * | 2018-06-04 | 2019-12-05 | Disruptel, Inc. | Systems and methods for operating an output device |
CN108962260A (zh) * | 2018-06-25 | 2018-12-07 | 福来宝电子(深圳)有限公司 | 一种多人命令语音识别方法、系统及存储介质 |
CN111354357A (zh) * | 2018-12-24 | 2020-06-30 | 中移(杭州)信息技术有限公司 | 一种音频资源播放的方法、装置、电子设备及存储介质 |
CN110310636A (zh) * | 2019-06-24 | 2019-10-08 | 歌尔股份有限公司 | 交互控制方法、装置、设备及音频设备 |
CN110517686A (zh) * | 2019-09-26 | 2019-11-29 | 合肥飞尔智能科技有限公司 | 智能音箱端语音开通应用的方法及系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117894321A (zh) * | 2024-03-15 | 2024-04-16 | 富迪科技(南京)有限公司 | 一种语音交互方法、语音交互提示系统、装置 |
CN117894321B (zh) * | 2024-03-15 | 2024-05-17 | 富迪科技(南京)有限公司 | 一种语音交互方法、语音交互提示系统、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107144819B (zh) | 一种声源定位方法、装置及电子设备 | |
WO2019104698A1 (zh) | 信息处理方法及装置、多媒体设备及存储介质 | |
CN103634770B (zh) | 基于智能手机的一键求助与信息管理平台及其实现方法 | |
CN103729193A (zh) | 一种人机交互方法及装置 | |
CN109085885A (zh) | 智能戒指 | |
CN107004412A (zh) | 用于监听设备的设备仲裁 | |
CN106648524A (zh) | 一种音频播放方法及音频播放设备 | |
CN104168263B (zh) | 一种服务器及其闹钟实现方法 | |
CN104852957A (zh) | 面向物联网应用的智能家居服务系统 | |
WO2018099000A1 (zh) | 语音输入的处理方法、终端和网络服务器 | |
CN109672724B (zh) | 信息推送方法、装置及设备 | |
CN109446031B (zh) | 终端设备的管控方法、终端及可读存储介质 | |
CN108376067A (zh) | 一种应用操作方法及其设备、存储介质、终端 | |
CN109859757A (zh) | 一种语音设备控制方法、装置和终端 | |
CN110046486A (zh) | 智能交互设备管控方法、系统以及控制器和介质 | |
CN107666536A (zh) | 一种寻找终端的方法和装置、一种用于寻找终端的装置 | |
CN114708863A (zh) | 智能音箱的唤醒方法 | |
CN109364477A (zh) | 基于语音控制进行打麻将游戏的方法及装置 | |
CN104873062A (zh) | 一种具有语音控制功能的水杯 | |
CN110164436A (zh) | 便携式多点智能语音控制家居的系统及方法 | |
EP4383020A1 (en) | Smart home control method | |
CN106303015A (zh) | 一种通信消息的处理方法及装置、终端设备 | |
CN103645690A (zh) | 一种语音控制数字家庭智能盒的方法 | |
CN108279605B (zh) | 酒店客房控制方法、客房控制装置及客房操作设备 | |
WO2016052520A1 (ja) | 対話装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |