CN111145749B - 一种控制方法及控制装置 - Google Patents

一种控制方法及控制装置 Download PDF

Info

Publication number
CN111145749B
CN111145749B CN201911409838.5A CN201911409838A CN111145749B CN 111145749 B CN111145749 B CN 111145749B CN 201911409838 A CN201911409838 A CN 201911409838A CN 111145749 B CN111145749 B CN 111145749B
Authority
CN
China
Prior art keywords
user
voice information
mode
users
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911409838.5A
Other languages
English (en)
Other versions
CN111145749A (zh
Inventor
蒋伟
肖颖
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201911409838.5A priority Critical patent/CN111145749B/zh
Publication of CN111145749A publication Critical patent/CN111145749A/zh
Application granted granted Critical
Publication of CN111145749B publication Critical patent/CN111145749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies
    • G10L17/14Use of phonemic categorisation or speech recognition prior to speaker recognition or verification
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本申请实施例提供了一种控制方法及控制装置,所述控制方法包括:识别电子设备所处空间环境内至少一用户的语音信息;在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。本申请实施例的控制方法可灵活识别环境中第一用户满足条件的语音信息,并根据该语音信息控制电子设备以不响应其他用户的语音信息的模式运行,使第一用户在使用电子设备时不被打扰,提高使用体验。

Description

一种控制方法及控制装置
技术领域
本申请实施例涉及智能设备领域,特别涉及一种控制方法及控制装置。
背景技术
目前的智能设备,例如智能音箱都是基于用户跟智能音箱上的智能语音助理进行对话的方式来进行交互的。任何人只要说出可以被语音助理识别的关键词,就可以跟智能音箱进行交互。因此导致当一用户正在使用智能音箱时,若其他用户在此时对该智能音箱进行交互并输入了语音指令,此时智能音箱就会响应该用户,而不再继续为前一用户服务,为前一用户带来困扰。
发明内容
本申请实施例提供了一种控制方法,包括:
识别电子设备所处空间环境内至少一用户的语音信息;
在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;
其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。
作为优选,检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第一内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息中包含第一内容,确定满足条件。
作为优选,还包括:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
至少基于所述语音信息识别所述多个用户的标识信息以将所述多个用户中满足第一条件的用户的语音信息确定为所述第一用户的语音信息;或,
在所述多个用户的语音信息的获得时刻不同的情况下,按照时间顺序将所述多个用户的语音信息中获得时刻最早的语音信息确定为所述第一用户的语音信息;
在所述多个用户的语音信息的获得时刻相同的情况下,识别所述多个用户的标识信息,以至少基于所述标识信息将所述多个用户中优先级最高的用户的语音信息确定为所述第一用户的语音信息。
作为优选,检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第二内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定的第一用户的语音信息中包含第二内容,确定满足条件。
作为优选,还包括:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
在所述多个用户的语音信息的获得时刻相同、且所述多个用户均属于满足第二条件的用户的情况下,对所述多个用户的语音内容按照预设评价体系进行评价,以确定评价结果符合第一阈值的用户的语音信息确定为所述第一用户的语音信息;
在所述多个用户的语音信息的获得时刻相同、且所述多个用户部分属于满足第二条件的用户的情况下,对满足第二条件的用户的语音内容按照预设评价体系进行评价、识别满足第一条件的用户的标识信息,以基于评价结果和所述标识信息将符合第三条件的用户的语音信息确定为所述第一用户的语音信息,其中,所述第三条件与所述标识信息和评价结果之间的折算方式有关。
作为优选,还包括:
满足第四条件,控制所述电子设备从所述第二模式切换至所述第一模式或不同于所述第一模式的第三模式;
其中,所述第四条件至少与所述电子设备的运行时间或接收到的信息有关。
作为优选,控制所述电子设备从所述第二模式切换至所述第一模式,包括:
识别到第一用户的语音信息中包含第三内容,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到第一用户作用于所述电子设备的至少一满足条件的操作,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到所述电子设备在所述第二模式下的第一运行时长符合第二阈值,控制所述电子设备从所述第二模式切换至所述第一模式。
作为优选,控制所述电子设备从所述第二模式切换至不同于所述第一模式的第三模式,包括:
识别到第二用户的语音信息中包含第一内容、且所述第二用户的优先级高于所述第一用户,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述电子设备在所述第二模式下的第一运行时长符合第三阈值,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第一用户的行为参数满足第五条件,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第二用户作用于所述电子设备的行为参数满足第六条件,控制所述电子设备从所述第二模式切换至所述第三模式。
作为优选,还包括:
检测到电子设备在所述第二模式和所述第三模式下的第二运行时长符合第四阈值,控制所述电子设备从当前模式切换至所述第一模式。
本申请实施例同时提供一种控制装置,包括:
识别模块,其用于识别电子设备所处空间环境内至少一用户的语音信息;
控制模块,其用于在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。
本申请实施例还同时提供一种电子设备,包括存储器、处理器及存储于所述存储器并可在所述处理器上运行的控制程序,所述控制程序被所述处理器执行时实现以下操作:
识别电子设备所处空间环境内至少一用户的语音信息;
在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。
本申请实施例还同时提供一种计算机可读存储介质,存储有计算机可执行指令,所述指令被执行时用于实现上文所述的控制方法。
基于上述实施例的公开可以获知,本申请实施例具备的有益效果包括基于该控制方法可控制电子设备识别出其所处的空间环境中满足条件的语音信息,并基于该语音信息确定第一用户的身份,之后控制电子设备为该第一用户运行第二模式(独占模式),使在该第二模式下,电子设备的语音引擎只听从并响应于第一用户,而不响应其他用户的语音信息,保证第一用户可不被打扰地使用电子设备,提高用户的使用体验。
附图说明
图1为本申请实施例中的控制方法的流程图。
图2为本申请另一实施例中的控制方法的流程图。
图3为本申请另一实施例中的控制方法的流程图。
图4为本申请实施例中的控制装置的结构框图。
图5为本申请实施例中的电子设备的结构框图。
附图标记:
1-识别模块;2-控制模块;3-存储器;4-处理器
具体实施方式
下面,结合附图对本申请的具体实施例进行详细的描述,但不作为本申请的限定。
应理解的是,可以对此处公开的实施例做出各种修改。因此,下述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本公开的具体实施例;然而,应当理解,所公开的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
下面,结合附图详细的说明本申请实施例。
如图1所示,本申请实施例提供一种控制方法,包括:
S101:识别电子设备所处空间环境内至少一用户的语音信息;
S201:在至少一用户中的第一用户的语音信息满足条件的情况下,控制电子设备从当前的第一模式切换至不同于第一模式的第二模式;
其中,在第二模式下电子设备的语音引擎不响应除第一用户之外的其他用户的语音信息。
例如,该方法应用于一智能电子设备中,该电子设备可为智能音箱、智能电视、智能门锁、智能机器人以及其他可进行语音交互的智能电器等。当电子设备所处的空间环境内出现至少一个用户输出的语音信息时,如在电子设备所在的房间内,可能有多个用户,当其中一个或所有用户说话时,电子设备会采集该房间内的用户输出的语音信息,然后对该语音信息进行识别,例如声纹识别、对语音内容的识别等,然后基于所有识别结果确定满足条件的识别结果。该条件例如可为识别结果中具有特定内容或关键词,如电子设备的唤醒指令或进入第二模式(独占模式)的关键词,或者用户与电子设备预先设定好的自定义指令,或者唤醒指令与自定义指令的集合等等,再或者,用户预先在电子设备中拟定好程序,使电子设备一旦基于识别结果识别出该用户身份,便确定该识别结果满足条件,如电子设备基于识别结果中的声纹特征确定出该语音信息为第一用户输出,便确定该识别结果满足条件,或者说该语音信息满足条件,待电子设备确定满足条件的语音信息后,便控制系统由第一模式切换为不同于该第一模式的第二模式,在该第二模式运行下的电子设备,其语音引擎可仅听命于第一用户,也即,在该模式运行下,电子设备的语音引擎仅响应第一用户的指令,而不响应其他用户输入的语音指令。例如,语音引擎完全不识别其他用户的语音信息,该效果可结合其他采集设备等一同达到,如结合摄像头,使摄像头追踪第一用户,当第一用户的口型改变,确定为输出语音信息时,语音引擎才会识别设备采集到的该语音信息,而若摄像头并未采集到用户口型改变时,语音引擎是不会识别采集到的环境中的音频信息的;再或者,语音引擎识别电子设备采集到的语音信息,但是其并不会交由语音识别引擎进行识别,或者即使识别也不会将识别出的内容发送给例如语音搜索引擎、语音输出引擎等进行响应操作,使其对该语音信息进行搜索或输出,也即,禁止电子设备对该语音信息做出响应。
由本申请的上述公开可知,本申请实施例具备的有益效果包括基于该控制方法可控制电子设备识别出其所处的空间环境中满足条件的语音信息,并基于该语音信息确定第一用户的身份,之后控制电子设备为该第一用户运行第二模式,使在该第二模式下,电子设备的语音引擎只听从并响应于第一用户,而不响应其他用户的语音信息,基于此来实现第一用户对电子设备的“独占访问模式”,保证第一用户可不被打扰地使用电子设备,提高用户的使用体验。
进一步地,本实施例中,步骤S201具体包括:
S2011:若电子设备检测到空间环境只存在第一用户、且识别到第一用户的语音信息中包含第一内容,确定满足条件;或,
S2012:检测到空间环境存在多个用户、且按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息中包含第一内容,确定满足条件。
例如,电子设备通过摄像头采集该空间环境内的图像,如对电子设备控制摄像头对其所处的房间的内部空间进行拍照,电子设备通过对拍摄的图片进行人脸识别等来确定当前环境存在的用户数量,或者电子设备可通过语音引擎对获得的语音信息进行声纹识别等来确定空间环境内用户的数量。倘若,通过检测,确定该空间环境内仅有第一用户存在,且基于采集到的语音信息的识别结果确定该语音信息中包含第一内容如预先设定的进行模式切换的关键词或预设音量、频率的语音时,则可确定该语音信息满足条件。如第一用户为预先通过电子设备的身份认证的用户,为电子设备的授权用户,通过该身份认证的用户可具有电子设备的使用权,控制权,同时通过身份认证的用户与电子设备间建立了协议,相当于建立了独一无二的交互协议,并定义电子设备一旦确定语音信息符合该交互协议后,便将使用权及控制权交由该用户。该交互协议可以包括上述的第一内容,也即,第一内容实际上可以是表明用户身份的内容,其可为指令信息,也可为声纹信息,还可以是每一用户对应的关键词等具体不定,只要能够表征用户身份即可。当电子设备基于该第一内容确定该用户身份为预先通过身份认证的用户的身份,即为授权用户时,则确定该语音信息满足条件。同理,若电子设备通过检测确定空间环境中包含多个用户时,可按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息中包含第一内容,则确定该第一用户的语音信息满足条件。其中,筛选策略即可认为是电子设备基于语音信息的识别结果以及预先存储的经过身份认证的用户的相关信息来确定出已经经过身份认证的用户的策略,也可为在前者基础上还具有确定具有经过身份认证的用户的语音信息中是否包含特定内容,如上文所述的交互协议中相关交互指令的策略。
具体地,本申请实施例中还包括:按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息;其中,
S2012:按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息,包括:
S2013:至少基于语音信息识别多个用户的标识信息,以将多个用户中满足第一条件的用户的语音信息确定为第一用户的语音信息;或,
S2014:在多个用户的语音信息的获得时刻不同的情况下,按照时间顺序将多个用户的语音信息中获得时刻最早的语音信息确定为第一用户的语音信息;或
S2015:在多个用户的语音信息的获得时刻相同的情况下,识别多个用户的标识信息,以至少基于标识信息将多个用户中优先级最高的用户的语音信息确定为第一用户的语音信息。
实施例一,如电子设备基于语音信息识别出多个用户的声纹信息,该声纹信息即可表征用户的标识信息,或者电子设备同时基于摄像头采集到的图像,通过对图像进行扫描识别确定图像中出现的用户的人脸信息,身高信息,肢体特征信息等生物特征信息来确定该标识信息。接着系统基于该标识信息将多个用户中满足第一条件的用户的语音信息确定为第一用户的语音信息,即确定为需要响应的用户的语音信息,该第一用户如上文所述可为预先已经通过身份认证,电子设备存储有其身份信息的用户,为电子设备的授权用户。而第一条件则可为用于确定第一用户为授权用户的身份识别条件,具体可为声纹信息等生物特征信息与存储的信息匹配,或语音信息中具有上文所述的特定的交互指令(如关键词或特定内容),电子设备基于该特定的交互指令可确定第一用户身份。
实施例二,若电子设备基于语音信息确定出多个用户中至少两个用户为授权用户时,则可根据获得该至少两个授权用户的语音信息的时间顺序确定出获得时刻最早或某一预定时刻的语音信息,并将对应该语音信息的用户认定为第一用户。
实施例三,若电子设备基于语音信息,图像信息等确定出的表征用户身份的标识信息而确定出该多个用户中至少两个用户为授权用户时,若电子设备经确定该至少两个授权用户的语音信息的接收时间为相同时,则可根据预存储的授权用户优先级来确定该两个授权用户的身份的优先级关系,将优先级等级相较更高的授权用户确定为第一用户,并将其语音信息确定为第一用户的语音信息。
进一步地,本实施例中的还包括:
S2016:电子设备在检测到空间环境只存在第一用户、且识别到第一用户的语音信息中包含第二内容,确定满足条件;或,
S2017:检测到空间环境存在多个用户、且按照确定的筛选策略从多个用户的语音信息中确定的第一用户的语音信息中包含第二内容,确定满足条件。
也即,结合前文所述的检测手段,如声纹识别,图像识别等,若电子设备基于该手段检测到其所在的空间环境中只存在授权用户--第一用户,且通过识别该第一用户的语音信息确定其信息中包含第二内容时,则确定其满足条件。或者当电子设备确定空间环境中具有多个用户,但经确定的筛选策略自该多个用户中确定出授权用户—第一用户后,又确定出该第一用户的语音信息中包含第二内容时,则确定该语音信息满足条件。其中,第二内容为与第一内容不同的内容,也即,当语音信息包含第二内容时,则可确定该语音信息满足第二条件。具体地,该第二内容不一定是特定交互指令,其可以是一请求内容,但该请求内容的实际内容优先级高于预设的关键词或特定内容,也即,电子设备内可预先存储有关于请求内容的优先级关系,例如若请求内容涉及工作,如电话会议,视频会议,欲与第二用户进行通话,或请求内容涉及敏感字段,如求助,救命等时,则表征用户当前处于紧急状态,该请求内容的优先级等级较高,那么此时即使语音信息中不具有特定的交互指令,电子设备也认定该语音信息满足条件。
进一步地,本实施例中的方法还包括:按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息;其中,
按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息,包括:
S2019:在多个用户的语音信息的获得时刻相同、且多个用户均属于满足第二条件的用户的情况下,对多个用户的语音内容按照预设评价体系进行评价,以确定评价结果符合第一阈值的用户的语音信息确定为第一用户的语音信息;或
S2020:在多个用户的语音信息的获得时刻相同、且多个用户部分属于满足第二条件的用户的情况下,对满足第二条件的用户的语音内容按照预设评价体系进行评价、识别满足第一条件的用户的标识信息,以基于评价结果和标识信息将符合第三条件的用户的语音信息确定为第一用户的语音信息,其中,第三条件与标识信息和评价结果之间的折算方式有关。
具体地,例如电子设备内预设有评价体系,该评价体系用于评价获得的语音信息中关于请求内容的重要程度,同时该评价体系内具有多个阈值,每个阈值范围代表一种重要程度等级,如第一阈值代表请求内容十分重要,第二阈值代表请求内容一般重要,第三阈值代表请求内容不重要,每个阈值内可包含多个表征请求内容涉及的事件名称,该评价体系可基于语音信息的语音、语义的识别结果确定请求内容中涉及的事件名称,然后根据该名称与各个阈值进行匹配,最终确定该事件的重要程度等级,如通话、视频会议、求助等事件的重要程度等级最高,而搜索视频、音乐等事件的重要程度等级最低。应用时,当电子设备通过筛选策略确定多个用户的语音信息的获得时刻相同,且均具有第二内容,确定满足第二条件的情况下,电子设备便可控制评价体系对语音信息中的第二内容进行评价,确定其所属阈值,然后基于阈值表征的事件重要等级来确定第一用户的语音信息。
而若仅凭借评价结果不能确定第一用户时,可通过语音信息识别确定出包含第一内容(如前文所述的特定的交互指令,已授权的用户的声纹信息等)的用户的用于确定用户身份标识信息,然后基于评价结果以及该标识信息进行拟合计算,以确定出满足第三条件的用户的语音信息,并定义该用户的语音信息即为第一用户的语音信息。其中,该第三条件与标识信息和评价结果之间的这算方式有关,例如,标识信息表征用户A为第一用户,而评价结果表征用户B为第一用户,此时电子设备便可根据预先确定的折算系数来对标识信息和评价结果进行折算,以基于折算结果自用户A和用户B中确定出第一用户,其中第三条件可以是两个不同的分别表征用户A为第一用户和用户B为第一用户的阈值范围,若折算结果的概率值在该标识用户A为第一用户的阈值范围内,则确定用户A为第一用户,其语音信息确定为第一用户的语音信息。当然,第三条件并不仅为上述阈值形式,还可为其他形式,例如第三条件为概率曲线,折算结果也可以概率曲线的形式表现,电子设备基于两概率曲线的相似度来确定是否满足第三条件等。
进一步地,如图2所示,本实施例中的方法还包括:
S301:满足第四条件,控制电子设备从第二模式切换至第一模式或不同于第一模式的第三模式;
其中,第四条件至少与电子设备的运行时间或接收到的信息有关。
例如,电子设备可通过检测电子设备以第二模式运行的时间,确定该运行时间是否超出预设的第二模式单次运行时间的上限,若是,则确定电子设备当前的运行参数满足第四条件。或者,若电子设备接收到了第一用户表示结束运行第二模式的指令,如语音指令、动作指令,包括姿态变化产生的指令、作用于电子设备上的实际操作指令,如点击表征结束或退出第二模式的虚拟/真实按键,再或是,接收到了优先级等级高于第一用户的第二用户的启用指令时,如第二用户向电子设备输出语音指令,或电子设备通过采集第二用户的语音信息确定第二用户的语音信息包含了优先等级更高的第二内容时,倘若当下第一用户对电子设备的使用为娱乐时,电子设备则可确定第二用户的指令与电子设备当前的运行参数满足第四条件,此时,电子设备便可从第二模式切换至初始的第一模式,即正常使用模式,而非“独占”使用模式,或者直接运行第三模式,该第三模式可实现电子设备不经第一模式的过渡而直接切换至对应第二用户的“独占”模式,即将控制权交由第二用户,电子设备仅响应第二用户指令的第二模式。
其中,本实施例中控制电子设备从第二模式切换至第一模式,包括:
S3011:识别到第一用户的语音信息中包含第三内容,控制电子设备从第二模式切换至第一模式;或,
S3012:检测到第一用户作用于电子设备的至少一满足条件的操作,控制电子设备从第二模式切换至第一模式;或,
S3013:检测到电子设备在第二模式下的第一运行时长符合第二阈值,控制电子设备从第二模式切换至第一模式。
具体地,例如,本实施例中的电子设备采集第一用户的语音信息,并对其进行识别,若识别到第一用户的语音信息中包含表征关闭第二模式的内容时,则控制系统从第二模式切换至第一模式,其中,表征关闭第二模式的内容可为预先确定的关闭指令,电子设备基于该关闭指令确定第一用户的意图,并响应第一用户;或者
电子设备检测到第一用户作用于电子设备的至少一满足条件的操作时,如上文所述,可以是第一用户输入的动作指令,如打个响指,或者是第一用户对着电子设备做出双臂交叉的X型动作时,或者第一用户直接作用于电子设备产生实际操作指令,如点击表征结束或退出第二模式的虚拟/真实按键等,若电子设备检测到有上述操作内容时,则可确定该操作内容满足条件,控制系统结束第二模式并切换至第一模式;再或者
电子设备检测到第二模式的本次运行时长满足第二阈值,即达到单次使用时长的上限时,则可控制电子设备从第二模式切换至第一模式。
进一步地,本实施例中控制电子设备从第二模式切换至不同于第一模式的第三模式,包括:
S3014:识别到第二用户的语音信息中包含第一内容、且第二用户的优先级高于第一用户,控制电子设备从第二模式切换至第三模式;或,
S3015:识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且电子设备在第二模式下的第一运行时长符合第三阈值,控制电子设备从第二模式切换至第三模式;或,
S3016:识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且第一用户的行为参数满足第五条件,控制电子设备从第二模式切换至第三模式;或,
S3017:识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且第二用户作用于电子设备的行为参数满足第六条件,控制电子设备从第二模式切换至第三模式。
例如,实施例一,如前文所述,本实施例中若电子设备识别到第二用户的语音信息中包含第一内容,如特定的交互指令等,同时基于语音信息确定出第二用户身份后,确定第二用户的身份的优先级高于第一用户时,则控制电子设备从第二模式切换至第三模式,使电子设备将第二模式的控制权交由第二用户;或者
实施例二,识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且电子设备在第二模式下的第一运行时长符合第三阈值,控制电子设备从第二模式切换至第三模式,即,电子设备在实施例一的基础上同时确定第一用户对电子设备的第二模式的单次使用时长到达限值时,则直接切换第二模式为第三模式;或者
电子设备在实施例一的基础上还同时确定第一用户的行为参数满足第五条件时,控制电子设备从第二模式切换至第三模式。该第五条件表明,第一用户此时也许并未专注于电子设备为其提供的服务,如通过摄像头采集的图像,电子设备发现第一用户此时可能正在睡觉,或者正在专注于使用其他电子设备时,则可确定第一用户的行为参数满足第五条件,此时,电子设备便可切换模式为第三模式,将第二模式的控制权交由第二用户;再或者
电子设备在实施例一的基础上还同时确定第二用户作用于电子设备的行为参数满足第六条件,如第二用户点击了电子设备上设置的用于结束当前的第二模式的虚拟/真实按键,或点击了切换第二模式为第三模式的虚拟/真实按键时,则确定第二用户的行为参数满足第六条件,此时电子设备切换第二模式为第三模式,将第二模式的控制权交由第二用户。
进一步地,如图3所示,本实施例中的方法还包括:
S401:检测到电子设备在第二模式和第三模式下的第二运行时长符合第四阈值,控制电子设备从当前模式切换至第一模式。
也即,若检测到电子设备在一时间段内第二模式和第三模式的累计使用时长、连续使用时长满足第四阈值,即到达限值时,如电子设备在同一天,或同一天的早上8点到中午12点的时间段内,第二模式和第三模式的累计使用时长,连续使用时长到达限值时,则控制电子设备从当前模式切换至第一模式。另外,当用户关闭电子设备后,又再次启动电子设备时,电子设备可默认直接运行第一模式,并不延续关机前运行的第二模式,当然,用户也可进行自定义设置,使电子设备再次启动运行时延续关机前的运行模式。
其中,上述控制方法的执行主体可为电子设备自身,也可为其他与电子设备可进行通信交互的电子设备,具体不唯一。
如图4所示,本申请实施例同时提供一种控制装置,包括:
识别模块1,其用于识别电子设备所处空间环境内至少一用户的语音信息;
控制模块2,其用于在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。
例如,该方法应用于一智能电子设备中,该电子设备可为智能音箱、智能电视、智能门锁、智能机器人以及其他可进行语音交互的智能电器等。当电子设备所处的空间环境内出现至少一个用户输出的语音信息时,如在电子设备所在的房间内,可能有多个用户,当其中一个或所有用户说话时,电子设备会采集该房间内的用户输出的语音信息,然后发送给识别模块1,(该识别模块1可为语音识别器、语音引擎等)或者控制装置内具有用于采集电子设备所处空间环境内至少一用户的语音信息的采集模块,由采集模块采集语音信息并发送给识别模块1,由其对该语音信息进行识别,例如声纹识别、对语音内容的识别等,然后由控制模块2基于所有识别结果确定满足条件的识别结果。该条件例如可为识别结果中具有特定内容或关键词,如电子设备的唤醒指令或进入第二模式(独占模式)的关键词,或者用户与电子设备预先设定好的自定义指令,或者唤醒指令与自定义指令的集合等等,再或者,用户预先在控制模块2中拟定好程序,使控制模块2一旦基于识别结果识别出该用户身份,便确定该识别结果满足条件,如控制模块2基于识别结果中的声纹特征确定出该语音信息为第一用户输出,便确定该识别结果满足条件,或者说该语音信息满足条件,待控制模块2确定满足条件的语音信息后,便控制系统由第一模式切换为不同于该第一模式的第二模式,在该第二模式运行下的电子设备,其语音引擎可仅听命于第一用户,也即,在该模式运行下,电子设备的语音引擎仅响应第一用户的指令,而不响应其他用户输入的语音指令。例如,语音引擎完全不识别其他用户的语音信息,该效果可结合其他采集设备等一同达到,如结合摄像头,使摄像头追踪第一用户,当第一用户的口型改变,确定为输出语音信息时,语音引擎才会识别电子设备采集到的该语音信息,而若摄像头并未采集到用户口型改变时,语音引擎是不会识别采集到的环境中的音频信息的;再或者,语音引擎识别电子设备或控制装置的采集模块采集到的语音信息,但是其并不会交由语音识别引擎进行识别,或者即使识别也不会将识别出内容发送给例如语音搜索引擎、语音输出引擎等进行响应操作,使其对该语音信息进行搜索或输出,也即,禁止控制模块2控制电子设备对该语音信息做出响应。
由本申请的上述公开可知,本申请实施例具备的有益效果包括控制装置基于该控制方法可控制电子设备识别出其所处的空间环境中满足条件的语音信息,并基于该语音信息确定第一用户的身份,之后控制电子设备为该第一用户运行第二模式,使在该第二模式下,电子设备的语音引擎只听从并响应于第一用户,而不响应其他用户的语音信息,基于此来实现第一用户对电子设备的“独占访问模式”,保证第一用户可不被打扰地使用电子设备,提高用户的使用体验。
进一步地,本实施例中,若控制模块2检测到空间环境只存在第一用户、且识别到第一用户的语音信息中包含第一内容,确定满足条件;或,
检测到空间环境存在多个用户、且按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息中包含第一内容,确定满足条件。
例如,控制模块2通过摄像头采集该空间环境内的图像,如对控制模块2控制摄像头对其所处的房间的内部空间进行拍照,控制模块2通过对拍摄的图片进行人脸识别等来确定当前环境存在的用户数量,或者控制模块2可通过语音引擎对获得的语音信息进行声纹识别等来确定空间环境内用户的数量。倘若,通过检测,确定该空间环境内仅有第一用户存在,且基于采集到的语音信息的识别结果确定该语音信息中包含第一内容如预先设定的进行模式切换的关键词或预设音量、频率的语音时,则可确定该语音信息满足条件。如第一用户为预先通过控制模块2的身份认证的用户,为控制模块2的授权用户,通过该身份认证的用户可具有控制模块2的使用权,控制权,同时通过身份认证的用户与控制模块2间建立了协议,相当于建立了独一无二的交互协议,并定义控制模块2一旦确定语音信息符合该交互协议后,便将使用权及控制权交由该用户。该交互协议可以包括上述的第一内容,,也即,第一内容实际上可以是表明用户身份的内容,其可为指令信息,也可为声纹信息,还可以是每一用户对应的关键词等具体不定,只要能够表征用户身份即可。当控制模块2基于该第一内容确定该用户身份为预先通过身份认证的用户的身份,即为授权用户时,则确定该语音信息满足条件。同理,若控制模块2通过检测确定空间环境中包含多个用户时,可按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息中包含第一内容,则确定该第一用户的语音信息满足条件。其中,筛选策略即可认为是控制模块2基于语音信息的识别结果以及预先存储的经过身份认证的用户的相关信息来确定出已经经过身份认证的用户的策略,也可为在前者基础上还具有确定具有经过身份认证的用户的语音信息中是否包含特定内容,如上文所述的交互协议中相关交互指令的策略。
具体地,本申请实施例中控制模块2还配置为:按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息;其中,
按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息,包括:
至少基于语音信息识别多个用户的标识信息,以将多个用户中满足第一条件的用户的语音信息确定为第一用户的语音信息;或,
在多个用户的语音信息的获得时刻不同的情况下,按照时间顺序将多个用户的语音信息中获得时刻最早的语音信息确定为第一用户的语音信息;
在多个用户的语音信息的获得时刻相同的情况下,识别多个用户的标识信息,以至少基于标识信息将多个用户中优先级最高的用户的语音信息确定为第一用户的语音信息。
实施例一,如控制模块2基于语音信息识别出多个用户的声纹信息,该声纹信息即可表征用户的标识信息,或者控制模块2同时基于摄像头采集到的图像,通过对图像进行扫描识别确定图像中出现的用户的人脸信息,身高信息,肢体特征信息等生物特征信息来确定该标识信息。接着系统基于该标识信息将多个用户中满足第一条件的用户的语音信息确定为第一用户的语音信息,即确定为需要响应的用户的语音信息,该第一用户如上文所述可为预先已经通过身份认证,控制模块2存储有其身份信息的用户,为控制模块2的授权用户。而第一条件则可为用于确定第一用户为授权用户的身份识别条件,具体可为声纹信息等生物特征信息与存储的信息匹配,或语音信息中具有上文所述的特定的交互指令(如关键词或特定内容),控制模块2基于该特定的交互指令可确定第一用户身份。
实施例二,若控制模块2基于语音信息确定出多个用户中至少两个用户为授权用户时,则可根据获得该至少两个授权用户的语音信息的时间顺序确定出获得时刻最早或某一预定时刻的语音信息,并将对应该语音信息的用户认定为第一用户。
实施例三,若控制模块2基于语音信息,图像信息等确定出的表征用户身份的标识信息而确定出该多个用户中至少两个用户为授权用户时,若控制模块2经确定该至少两个授权用户的语音信息的接收时间为相同时,则可根据预存储的授权用户优先级来确定该两个授权用户的身份的优先级关系,将优先级等级相较更高的授权用户确定为第一用户,并将其语音信息确定为第一用户的语音信息。
进一步地,本实施例中控制模块2在检测到空间环境只存在第一用户、且识别到第一用户的语音信息中包含第二内容,确定满足条件;或,
检测到空间环境存在多个用户、且按照确定的筛选策略从多个用户的语音信息中确定的第一用户的语音信息中包含第二内容,确定满足条件。
也即,结合前文所述的检测手段,如声纹识别,图像识别等,若控制模块2基于该手段检测到其所在的空间环境中只存在授权用户--第一用户,且通过识别该第一用户的语音信息确定其信息中包含第二内容时,则确定其满足条件。或者当控制模块2确定空间环境中具有多个用户,但经确定的筛选策略自该多个用户中确定出授权用户—第一用户后,又确定出该第一用户的语音信息中包含第二内容时,则确定该语音信息满足条件。其中,第二内容为与第一内容不同的内容,也即,当语音信息包含第二内容时,则可确定该语音信息满足第二条件。具体地,该第二内容不一定是特定交互指令,其可以是一请求内容,但该请求内容的实际内容优先级于预设的关键词或特定内容,也即,控制模块2内可预先存储有关于请求内容的优先级关系,例如若请求内容涉及工作,如电话会议,视频会议,欲与第二用户进行通话,或请求内容涉及敏感字段,如求助,救命等时,则表征用户当前处于紧急状态,该请求内容的优先级等级较高,那么此时即使语音信息中不具有特定的交互指令,控制模块2也认定该语音信息满足条件。
进一步地,本实施例中的控制模块2还配置为:按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息;其中,
按照确定的筛选策略从多个用户的语音信息中确定第一用户的语音信息,包括:
在多个用户的语音信息的获得时刻相同、且多个用户均属于满足第二条件的用户的情况下,对多个用户的语音内容按照预设评价体系进行评价,以确定评价结果符合第一阈值的用户的语音信息确定为第一用户的语音信息;
在多个用户的语音信息的获得时刻相同、且多个用户部分属于满足第二条件的用户的情况下,对满足第二条件的用户的语音内容按照预设评价体系进行评价、识别满足第一条件的用户的标识信息,以基于评价结果和标识信息将符合第三条件的用户的语音信息确定为第一用户的语音信息,其中,第三条件与标识信息和评价结果之间的折算方式有关。
具体地,例如控制模块2内预设有评价体系,该评价体系用于评价获得的语音信息中关于请求内容的重要程度,同时该评价体系内具有多个阈值,每个阈值范围代表一种重要程度等级,如第一阈值代表请求内容十分重要,第二阈值代表请求内容一般重要,第三阈值代表请求内容不重要,每个阈值内可包含多个表征请求内容涉及的事件名称,该评价体系可基于语音信息的语音、语义的识别结果确定请求内容中涉及的事件名称,然后根据该名称与各个阈值进行匹配,最终确定该事件的重要程度等级,如通话、视频会议、求助等事件的重要程度等级最高,而搜索视频、音乐等事件的重要程度等级最低。应用时,当控制模块2通过筛选策略确定多个用户的语音信息的获得时刻相同,且均具有第二内容,满足第二条件的情况下,控制模块2便可控制评价体系对语音信息中的第二内容进行评价,确定其所属阈值,然后基于阈值表征的事件重要等级来确定第一用户的语音信息。
而若仅凭借评价结果不能确定第一用户时,可通过语音信息识别确定出包含第一内容(如前文所述的特定的交互指令,已授权的用户的声纹信息等)的用户的用于确定用户身份标识信息,然后基于评价结果以及该标识信息进行拟合计算,以确定出满足第三条件的用户的语音信息,并定义该用户的语音信息即为第一用户的语音信息。其中,该第三条件与标识信息和评价结果之间的这算方式有关,例如,标识信息表征用户A为第一用户,而评价结果表征用户B为第一用户,此时控制模块2便可根据预先确定的折算系数来对标识信息和评价结果进行折算,以基于折算结果自用户A和用户B中确定出第一用户,其中第三条件可以是两个不同的分别表征用户A为第一用户和用户B为第一用户的阈值范围,若折算结果的概率值在该标识用户A为第一用户的阈值范围内,则确定用户A为第一用户,其语音信息确定为第一用户的语音信息。当然,第三条件并不仅为上述阈值形式,还可为其他形式,例如第三条件为概率曲线,折算结果也可以概率曲线的形式表现,控制模块2基于两概率曲线的相似度来确定是否满足第三条件等。
进一步地,本实施例中的控制模块2还配置为:
满足第四条件,控制电子设备从第二模式切换至第一模式或不同于第一模式的第三模式;
其中,第四条件至少与电子设备的运行时间或接收到的信息有关。
例如,控制模块2可通过检测电子设备以第二模式运行的时间,确定该运行时间是否超出预设的第二模式单次运行时间的上限,若是,则确定电子设备当前的运行参数满足第四条件。或者,若控制模块2接收到了第一用户表示结束运行第二模式的指令,如语音指令、动作指令,包括姿态变化产生的指令、作用于电子设备上的实际操作指令,如点击表征结束或退出第二模式的虚拟/真实按键,再或是,接收到了优先级等级高于第一用户的第二用户的启用指令时,如第二用户向电子设备输出语音指令,或电子设备通过采集第二用户的语音信息确定第二用户的语音信息包含了优先等级更高的第二内容时,倘若当下第一用户对电子设备的使用为娱乐时,控制模块2则可确定第二用户的指令与电子设备当前的运行参数满足第四条件,此时,控制模块2便可从第二模式切换至初始的第一模式,即正常使用模式,而非“独占”使用模式,或者直接运行第三模式,该第三模式可实现电子设备不经第一模式的过渡而直接切换至对应第二用户的“独占”模式,即将控制权交由第二用户,控制电子设备仅响应第二用户指令的第二模式。
其中,本实施例中控制电子设备从第二模式切换至第一模式,包括:
识别到第一用户的语音信息中包含第三内容,控制电子设备从第二模式切换至第一模式;或,
检测到第一用户作用于电子设备的至少一满足条件的操作,控制电子设备从第二模式切换至第一模式;或,
检测到电子设备在第二模式下的第一运行时长符合第二阈值,控制电子设备从第二模式切换至第一模式。
具体地,例如,本实施例中的控制模块2采集第一用户的语音信息,并对其进行识别,若识别到第一用户的语音信息中包含表征关闭第二模式的内容时,则控制系统从第二模式切换至第一模式,其中,表征关闭第二模式的内容可为预先确定的关闭指令,控制模块2基于该关闭指令确定第一用户的意图,并响应第一用户;或者
控制模块2检测到第一用户作用于电子设备的至少一满足条件的操作时,如上文所述,可以是第一用户输入的动作指令,如打个响指,或者是第一用户对着电子设备做出双臂交叉的X型动作时,或者第一用户直接作用于电子设备产生实际操作指令,如点击表征结束或退出第二模式的虚拟/真实按键等,若控制模块2检测到有上述操作内容时,则可确定该操作内容满足条件,控制系统结束第二模式并切换至第一模式;再或者
控制模块2检测到第二模式的本次运行时长满足第二阈值,即达到单次使用时长的上限时,则可控制电子设备从第二模式切换至第一模式。
进一步地,本实施例中控制模块2控制电子设备从第二模式切换至不同于第一模式的第三模式,包括:
识别到第二用户的语音信息中包含第一内容、且第二用户的优先级高于第一用户,控制电子设备从第二模式切换至第三模式;或,
识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且电子设备在第二模式下的第一运行时长符合第三阈值,控制电子设备从第二模式切换至第三模式;或,
识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且第一用户的行为参数满足第五条件,控制电子设备从第二模式切换至第三模式;或,
识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且第二用户作用于电子设备的行为参数满足第六条件,控制电子设备从第二模式切换至第三模式。
例如,实施例一,如前文所述,本实施例中若控制模块2识别到第二用户的语音信息中包含第一内容,如特定的交互指令等,同时基于语音信息确定出第二用户身份后,确定第二用户的身份的优先级高于第一用户时,则控制电子设备从第二模式切换至第三模式,使电子设备将第二模式的控制权交由第二用户;或者
实施例二,识别到第二用户的语音信息中包含第一内容、第二用户的优先级高于第一用户、且电子设备在第二模式下的第一运行时长符合第三阈值,控制电子设备从第二模式切换至第三模式,即,控制模块2在实施例一的基础上同时确定第一用户对电子设备的第二模式的单次使用时长到达限值时,则直接切换第二模式为第三模式;或者
控制模块2在实施例一的基础上还同时确定第一用户的行为参数满足第五条件时,控制电子设备从第二模式切换至第三模式。该第五条件表明,第一用户此时也许并未专注于电子设备为其提供的服务,如通过摄像头采集的图像,控制模块2发现第一用户此时可能正在睡觉,或者正在专注于使用其他电子设备时,则可确定第一用户的行为参数满足第五条件,此时,控制模块2便可切换模式为第三模式,将第二模式的控制权交由第二用户;再或者
控制模块2在实施例一的基础上还同时确定第二用户作用于电子设备的行为参数满足第六条件,如第二用户点击了电子设备上设置的用于结束当前的第二模式的虚拟/真实按键,或点击了切换第二模式为第三模式的虚拟/真实按键时,则确定第二用户的行为参数满足第六条件,此时控制模块2控制电子设备切换第二模式为第三模式,将第二模式的控制权交由第二用户。
进一步地,本实施例中的控制模块2还配置为:
检测到电子设备在第二模式和第三模式下的第二运行时长符合第四阈值,控制电子设备从当前模式切换至第一模式。
也即,若控制模块2检测到电子设备在一时间段内第二模式和第三模式的累计使用时长、连续使用时长满足第四阈值,即到达限值时,如电子设备在同一天,或同一天的早上8点到中午12点的时间段内,第二模式和第三模式的累计使用时长,连续使用时长到达限值时,则控制电子设备从当前模式切换至第一模式。另外,当用户关闭电子设备后,又再次启动电子设备时,控制模块2可控制电子设备可默认直接运行第一模式,并不延续关机前运行的第二模式,当然,用户也可进行自定义设置,使控制模块2控制电子设备再次启动运行时延续关机前的运行模式。
如图5所示,本申请实施例还同时一种电子设备,包括存储器3、处理器4及存储于存储器并可在处理器上运行的控制程序,该控制程序被处理器执行时实现以下操作::
识别电子设备所处空间环境内至少一用户的语音信息;该语音识别器例如可为语音引擎;
在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第一内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息中包含第一内容,确定满足条件。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
至少基于所述语音信息识别所述多个用户的标识信息,以将所述多个用户中满足第一条件的用户的语音信息确定为所述第一用户的语音信息;或,
在所述多个用户的语音信息的获得时刻不同的情况下,按照时间顺序将所述多个用户的语音信息中获得时刻最早的语音信息确定为所述第一用户的语音信息;
在所述多个用户的语音信息的获得时刻相同的情况下,识别所述多个用户的标识信息,以至少基于所述标识信息将所述多个用户中优先级最高的用户的语音信息确定为所述第一用户的语音信息。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:
检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第二内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定的第一用户的语音信息中包含第二内容,确定满足条件。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
在所述多个用户的语音信息的获得时刻相同、且所述多个用户均属于满足第二条件的用户的情况下,对所述多个用户的语音内容按照预设评价体系进行评价,以确定评价结果符合第一阈值的用户的语音信息确定为所述第一用户的语音信息;
在所述多个用户的语音信息的获得时刻相同、且所述多个用户部分属于满足第二条件的用户的情况下,对满足第二条件的用户的语音内容按照预设评价体系进行评价、识别满足第一条件的用户的标识信息,以基于评价结果和所述标识信息将符合第三条件的用户的语音信息确定为所述第一用户的语音信息,其中,所述第三条件与所述标识信息和评价结果之间的折算方式有关。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:
满足第四条件,控制所述电子设备从所述第二模式切换至所述第一模式或不同于所述第一模式的第三模式;
其中,所述第四条件至少与所述电子设备的运行时间或接收到的信息有关。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:
识别到第一用户的语音信息中包含第三内容,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到第一用户作用于所述电子设备的至少一满足条件的操作,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到所述电子设备在所述第二模式下的第一运行时长符合第二阈值,控制所述电子设备从所述第二模式切换至所述第一模式。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:
识别到第二用户的语音信息中包含第一内容、且所述第二用户的优先级高于所述第一用户,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述电子设备在所述第二模式下的第一运行时长符合第三阈值,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第一用户的行为参数满足第五条件,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第二用户作用于所述电子设备的行为参数满足第六条件,控制所述电子设备从所述第二模式切换至所述第三模式。
进一步地,所述控制程序被所述处理器4执行时还实现以下操作:
检测到电子设备在所述第二模式和所述第三模式下的第二运行时长符合第四阈值,控制所述电子设备从当前模式切换至所述第一模式。进一步地,本申请实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述指令被执行时用于实现上文所述的控制方法。
具体地,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现本实施例的控制方法。
本实施例计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。

Claims (10)

1.一种控制方法,包括:
识别电子设备所处空间环境内至少一用户的语音信息;
在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;
其中,在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息;
所述方法还包括以下至少之一:
检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含目标内容,确定满足条件;
检测到所述空间环境存在多个用户、且从所述多个用户的语音信息中确定第一用户的语音信息中包含目标内容,确定满足条件;
其中,所述目标内容包括唤醒指令、用于进行模式切换的关键词、表明用户身份的自定义指令、用于进行模式切换的音频参数、请求内容中的至少之一;所述请求内容的优先级高于预设的关键词或特定内容。
2.根据权利要求1所述的方法,检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第一内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息中包含第一内容,确定满足条件。
3.根据权利要求2所述的方法,还包括:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
至少基于所述语音信息识别所述多个用户的标识信息,以将所述多个用户中满足第一条件的用户的语音信息确定为所述第一用户的语音信息;或,
在所述多个用户中至少两个用户为授权用户的语音信息的获得时刻不同的情况下,按照时间顺序将所述多个用户的语音信息中获得时刻最早的语音信息确定为所述第一用户的语音信息;或
在所述多个用户中至少两个用户为授权用户的语音信息的获得时刻相同的情况下,识别所述多个用户的标识信息,以至少基于所述标识信息将所述多个用户中优先级最高的用户的语音信息确定为所述第一用户的语音信息。
4.根据权利要求1所述的方法,检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含第二内容,确定满足条件;或,
检测到所述空间环境存在多个用户、且按照确定的筛选策略从所述多个用户的语音信息中确定的第一用户的语音信息中包含第二内容,确定满足条件。
5.根据权利要求4所述的方法,还包括:按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息;其中,
所述按照确定的筛选策略从所述多个用户的语音信息中确定第一用户的语音信息,包括:
在所述多个用户的语音信息的获得时刻相同、且所述多个用户均属于满足第二条件的用户的情况下,对所述多个用户的语音内容按照预设评价体系进行评价,以确定评价结果符合第一阈值的用户的语音信息确定为所述第一用户的语音信息;或
在所述多个用户的语音信息的获得时刻相同、且所述多个用户部分属于满足第二条件的用户的情况下,对满足第二条件的用户的语音内容按照预设评价体系进行评价、识别满足第一条件的用户的标识信息,以基于评价结果和所述标识信息将符合第三条件的用户的语音信息确定为所述第一用户的语音信息,其中,所述第三条件与所述标识信息和评价结果之间的折算方式有关。
6.根据权利要求1至5任一项所述的方法,还包括:
满足第四条件,控制所述电子设备从所述第二模式切换至所述第一模式或不同于所述第一模式的第三模式;
其中,所述第四条件至少与所述电子设备的运行时间或接收到的信息有关。
7.根据权利要求6所述的方法,控制所述电子设备从所述第二模式切换至所述第一模式,包括:
识别到第一用户的语音信息中包含第三内容,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到第一用户作用于所述电子设备的至少一满足条件的操作,控制所述电子设备从所述第二模式切换至所述第一模式;或,
检测到所述电子设备在所述第二模式下的第一运行时长符合第二阈值,控制所述电子设备从所述第二模式切换至所述第一模式。
8.根据权利要求6所述的方法,控制所述电子设备从所述第二模式切换至不同于所述第一模式的第三模式,包括:
识别到第二用户的语音信息中包含第一内容、且所述第二用户的优先级高于所述第一用户,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述电子设备在所述第二模式下的第一运行时长符合第三阈值,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第一用户的行为参数满足第五条件,控制所述电子设备从所述第二模式切换至所述第三模式;或,
识别到第二用户的语音信息中包含第一内容、所述第二用户的优先级高于所述第一用户、且所述第二用户作用于所述电子设备的行为参数满足第六条件,控制所述电子设备从所述第二模式切换至所述第三模式。
9.根据权利要求7或8所述的方法,还包括:
检测到电子设备在所述第二模式和所述第三模式下的第二运行时长符合第四阈值,控制所述电子设备从当前模式切换至所述第一模式。
10.一种控制装置,包括:
识别模块,其用于识别电子设备所处空间环境内至少一用户的语音信息;
控制模块,其用于在所述至少一用户中的第一用户的语音信息满足条件的情况下,控制所述电子设备从当前的第一模式切换至不同于所述第一模式的第二模式;其中,
在所述第二模式下所述电子设备的语音引擎不响应除所述第一用户之外的其他用户的语音信息;
所述装置还包括以下至少之一:
检测到所述空间环境只存在第一用户、且识别到所述第一用户的语音信息中包含目标内容,确定满足条件;
检测到所述空间环境存在多个用户、且从所述多个用户的语音信息中确定第一用户的语音信息中包含目标内容,确定满足条件;
其中,所述目标内容包括唤醒指令、用于进行模式切换的关键词、表明用户身份的自定义指令、用于进行模式切换的音频参数、请求内容中的至少之一;所述请求内容的优先级高于预设的关键词或特定内容。
CN201911409838.5A 2019-12-31 2019-12-31 一种控制方法及控制装置 Active CN111145749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911409838.5A CN111145749B (zh) 2019-12-31 2019-12-31 一种控制方法及控制装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911409838.5A CN111145749B (zh) 2019-12-31 2019-12-31 一种控制方法及控制装置

Publications (2)

Publication Number Publication Date
CN111145749A CN111145749A (zh) 2020-05-12
CN111145749B true CN111145749B (zh) 2023-05-02

Family

ID=70522479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911409838.5A Active CN111145749B (zh) 2019-12-31 2019-12-31 一种控制方法及控制装置

Country Status (1)

Country Link
CN (1) CN111145749B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111787387A (zh) * 2020-06-30 2020-10-16 百度在线网络技术(北京)有限公司 内容显示方法、装置、设备以及存储介质
CN111983984B (zh) * 2020-08-19 2022-05-17 安徽鸿程光电有限公司 控制权分配方法、装置、设备和介质
CN112863511A (zh) * 2021-01-15 2021-05-28 北京小米松果电子有限公司 信号处理方法、装置以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN107180632A (zh) * 2017-06-19 2017-09-19 微鲸科技有限公司 语音控制方法、装置及可读存储介质
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN107863104A (zh) * 2017-11-17 2018-03-30 出门问问信息科技有限公司 一种语音控制方法及装置
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及系统
CN109920436A (zh) * 2019-01-28 2019-06-21 武汉恩特拉信息技术有限公司 一种提供辅助服务的装置及方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8682667B2 (en) * 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
KR102421669B1 (ko) * 2017-06-13 2022-07-15 구글 엘엘씨 미등록 리소스를 사용한 오디오-기반의 네트워크 세션 수립

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105895096A (zh) * 2016-03-30 2016-08-24 乐视控股(北京)有限公司 一种身份识别与语音交互操作的方法及装置
CN107180632A (zh) * 2017-06-19 2017-09-19 微鲸科技有限公司 语音控制方法、装置及可读存储介质
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN107863104A (zh) * 2017-11-17 2018-03-30 出门问问信息科技有限公司 一种语音控制方法及装置
CN109410952A (zh) * 2018-10-26 2019-03-01 北京蓦然认知科技有限公司 一种语音唤醒方法、装置及系统
CN109920436A (zh) * 2019-01-28 2019-06-21 武汉恩特拉信息技术有限公司 一种提供辅助服务的装置及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Interactive Voice Response Server Voice Network Administration Using Hidden Markov Model Speech Recognition System;Mohamed Hamidi;《2018 Second World Conference on Smart Trends in Systems, Security and Sustainability (WorldS4)》;20190131;全文 *
面向老年人的智能音箱语音交互设计研究;贾国忠;《中国优秀硕士学位论文全文数据库》;20190115(第1期);全文 *

Also Published As

Publication number Publication date
CN111145749A (zh) 2020-05-12

Similar Documents

Publication Publication Date Title
CN111145749B (zh) 一种控制方法及控制装置
CN110100447B (zh) 信息处理方法及装置、多媒体设备及存储介质
US11238142B2 (en) Enrollment with an automated assistant
US20210326421A1 (en) Passive and continuous multi-speaker voice biometrics
US20170186428A1 (en) Control method, controller, and non-transitory recording medium
CN106295299A (zh) 一种智能机器人的用户注册方法和装置
CN110047487A (zh) 车载语音设备的唤醒方法、装置、车辆以及机器可读介质
CN112037799B (zh) 语音中断处理方法、装置、计算机设备和存储介质
CN111752523A (zh) 人机交互方法、装置、计算机设备和存储介质
US10984795B2 (en) Electronic apparatus and operation method thereof
CN110970022B (zh) 一种终端控制方法、装置、设备以及可读介质
CN110544468B (zh) 应用唤醒方法、装置、存储介质及电子设备
KR101995443B1 (ko) 화자 검증 방법 및 음성인식 시스템
CN113473199B (zh) 基于麦克风的设备控制方法及装置
KR20190119521A (ko) 전자 장치 및 그 동작 방법
JP6616182B2 (ja) 話者認識装置、判別値生成方法及びプログラム
KR101933822B1 (ko) 얼굴인식 기반 지능형 스피커, 이를 이용한 능동적인 대화 제공 방법 및 이를 수행하기 위한 기록매체
CN112738344B (zh) 一种识别用户身份的方法、装置、存储介质及电子设备
CN110197663A (zh) 一种控制方法、装置及电子设备
JP2023552855A (ja) 話者依存フォローアップアクションおよびウォームワード
Alam et al. An efficient reliability estimation technique for audio-visual person identification
Ramli et al. A multibiometric speaker authentication system with SVM audio reliability indicator
CN114639379A (zh) 智能电器的交互方法、装置、计算机设备及介质
CN116312558A (zh) 语音交互的处理方法和装置、存储介质及电子装置
CN115312057A (zh) 会议交互方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant