CN107180632A - 语音控制方法、装置及可读存储介质 - Google Patents

语音控制方法、装置及可读存储介质 Download PDF

Info

Publication number
CN107180632A
CN107180632A CN201710462434.7A CN201710462434A CN107180632A CN 107180632 A CN107180632 A CN 107180632A CN 201710462434 A CN201710462434 A CN 201710462434A CN 107180632 A CN107180632 A CN 107180632A
Authority
CN
China
Prior art keywords
vocal print
control
print
input voice
voice information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710462434.7A
Other languages
English (en)
Inventor
陈凌奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Whaley Technology Co Ltd
Original Assignee
Whaley Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Whaley Technology Co Ltd filed Critical Whaley Technology Co Ltd
Priority to CN201710462434.7A priority Critical patent/CN107180632A/zh
Publication of CN107180632A publication Critical patent/CN107180632A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明提供一种语音控制方法、装置及可读存储介质。所述方法包括:获得至少一个输入语音信息,对至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。将各个输入语音信息对应的声纹与当前控制权声纹进行匹配。当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过控制指令对所述智能设备进行控制。由此,本方案能够识别出与控制权声纹相匹配的声纹,并提取该声纹对应的语音作为控制指令,而丢弃其他用户的语音及环境噪音,解决了多用户远场语音控制互相干扰的问题,具有良好的用户体验。

Description

语音控制方法、装置及可读存储介质
技术领域
本发明涉及语音控制技术领域,具体而言,涉及一种语音控制方法、装置及可读存储介质。
背景技术
随着科技的不断发展,传统的按键遥控逐渐被其他更加智能的遥控方式所取代,比如,语音遥控。
在现有技术中,语音遥控主要有两种方式,一种方式是采用语音遥控器近距离采集用户的语音信息,再将语音信息转化为控制指令,进而控制设备完成用户指定的操作。然而,该种方法需要具有语音采集、识别功能的语音遥控器辅助实现,设备成本投入高。另一种方式是采用远场语音遥控,在该种方式下,语音输入模块集成在设备端,语音遥控器可以省去。然而该方法存在的问题是:当多个用户同时发声时,会形成互相干扰,无法得到准确的控制指令,用户体验感较低。
发明内容
为了克服现有技术中的上述不足,本发明提供一种语音控制方法、装置及可读存储介质,其能够解决多用户远场语音控制互相干扰的问题,具有良好的用户体验。
本发明的第一目的在于提供一种语音控制方法,应用于智能设备,所述方法包括:
获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹;
将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹;
当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
本发明的第二目的在于提供一种语音控制装置,应用于智能设备,所述装置包括:
获取模块,用于获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹;
匹配模块,用于将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹;
控制模块,用于当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
本发明的第三目的在于提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在智能设备执行上述的语音控制方法。
相对于现有技术而言,本发明具有以下有益效果:
本发明提供一种语音控制方法、装置及可读存储介质。所述方法应用于智能设备,所述方法包括:获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹。当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。由此,能够识别出与控制权声纹相匹配的声纹,并提取该声纹对应的语音作为控制指令,而丢弃其他用户的语音及环境噪音,解决了多用户远场语音控制互相干扰的问题,具有良好的用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明较佳实施例提供的智能设备的方框示意图。
图2是本发明第一实施例提供的语音控制方法的步骤流程图之一。
图3是本发明第一实施例提供的语音控制方法的步骤流程图之二。
图4是本发明第一实施例提供的图3所示的步骤S110的子步骤流程图。
图5是本发明第一实施例提供的图3所示的步骤S150的子步骤流程图。
图6是在当前控制权声纹设置为多个时,图2所示的步骤S170的子步骤流程图。
图7是本发明第二实施例提供的语音控制装置的功能模块框图。
图标:100-智能设备;110-存储器;120-处理器;130-网络模块;140-语音采集器;200-语音控制装置;210-注册模块;220-获取模块;230-声纹检测模块;240-控制权检测模块;250-变更模块;260-匹配模块;270-控制模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本发明较佳实施例提供的智能设备100的方框示意图。所述智能设备100包括存储器110、语音控制装置200、处理器120、网络模块130及语音采集器140。
在本实施例中,所述智能设备100可以是,但不限于,智能电视、智能机器人、个人电脑、平板电脑等。
所述存储器110、处理器120、网络模块130及语音采集器140相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通信总线或信号线实现电性连接。存储器110中存储有语音控制装置200,所述语音控制装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器110中的软件功能模块,所述处理器120通过运行存储在存储器110内的软件程序以及模块,从而执行各种功能应用以及数据处理。
其中,所述存储器110可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。其中,存储器110用于存储程序,所述处理器120在接收到执行指令后,执行所述程序。进一步地,上述存储器110内的软件程序以及模块还可包括操作系统,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通信,从而提供其他软件组件的运行环境。
所述处理器120可以是一种集成电路芯片,具有信号的处理能力。上述的处理器120可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述网络模块130用于通过网络建立智能设备100与其他外部设备之间的通信连接。
所述语音采集器140用于对用户语音进行采集,并对用户语音进行简单处理(比如,将语音信号转换为电信号)后发送给处理器120。所述语音采集器140可以是,但不限于,麦克风、传声器等可对语音信息进行采集的器件设备。
可以理解,图1所述的结构仅为示意,智能设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
第一实施例
请参照图2,图2是本发明第一实施例提供的语音控制方法的步骤流程图之一。所述方法应用于智能设备100。下面对语音控制方法具体流程进行详细阐述。
步骤S120,获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。
在本实施例中,所述语音采集器140对至少一个用户的语音进行采集,并将用户声音信号转化为电信号发送给处理器120进行处理。所述处理器120基于电信号获得用户的输入语音信息,对至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。
声纹(Voiceprint)具有特定性及稳定性的特点。无论是故意模仿别人的声音和语气,还是耳语轻声讲话,每个人的声纹特征是不相同的,具有特定性。并且,成年以后,人的声音可保持长期相对稳定不变,具有稳定性。基于声纹的这两个特征,可根据声纹识别用户身份。由此,可通过设定控制权声纹的方式,让智能设备100在嘈杂环境下排除干扰,只听从控制权声纹对应的用户的指令。
步骤S160,将各个输入语音信息对应的声纹与当前控制权声纹进行匹配。
在本实施例中,所述当前控制权声纹是指当前能对智能设备100进行语音控制的用户所对应的声纹。
在本实施例中,智能设备100将各个输入语音信息对应的声纹分别与当前控制权声纹进行比对,得到声纹匹配率。将声纹匹配率与一预设匹配率阈值进行比较。将声纹匹配率不小于所述预设匹配率阈值的声纹判定为与当前控制权声纹匹配。
在本实施例中,所述智能设备100进行声纹比对的方式包括,但不限于,智能设备100提取各个输入语音信息对应声纹的声纹特征点,分别将所述声纹特征点与当前控制权声纹的声纹特征点进行比对,得到声纹匹配率。
在本实施例中,所述预设匹配率阈值可根据实际需求和/或实验测试进行设定。例如,经过实验测试将预设匹配率阈值设定为98%,则声纹匹配率不小于98%的声纹可判定为与当前控制权声纹匹配。
在本实施例中,当存在匹配声纹时,执行步骤S170。
步骤S170,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备100进行控制。
在本实施例中,只有存在匹配声纹时,智能设备100才会对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令执行相关操作。比如,对于智能电视,可进行节目选择、音量调节等操作。对于智能机器人,可进行前进、后退等操作。
在本实施例中,对于没有语音控制权的用户们而言,说话、聊天都不会影响当前拥有语音控制权的用户对智能设备100的控制。当然,当前拥有语音控制权的用户也可主动放弃语音控制权,此时,智能设备100将不接收语音控制,直到下一次用户请求语音控制权。这样所有用户都可以放心聊天而不用担心发出的语音会影响智能设备100。
请参照图3,图3是本发明第一实施例提供的语音控制方法的步骤流程图之二。所述方法还包括:步骤S110,对声纹进行注册。
请参照图4,图4是本发明第一实施例提供的图3所示的步骤S110的子步骤流程图。所述步骤S110包括:子步骤S111及子步骤S112。
子步骤S111,获取待注册语音信息,对所述待注册语音信息进行处理得到对应的声纹。
在本实施例中,在初始启动智能设备100时,所述智能设备100可获取多个用户的语音得到多个待注册语音信息。智能设备100对所述多个待注册语音信息进行处理得到对应的声纹。
子步骤S112,根据得到的声纹配置声纹注册信息,并将声纹注册信息存储于声纹数据库中。
在本实施例中,智能设备100根据得到的声纹为每个用户配置对应声纹注册信息,并将声纹注册信息存储于声纹数据库中。其中,所述声纹注册信息包括:声纹、声纹对应的用户名及声纹权限级别。
在本实施例中,所述声纹权限级别声纹及声纹对应的用户名可由用户自行设定,智能设备100可通过获取用户的设定结果进行声纹注册信息配置。所述智能设备100也可根据用户注册的顺序默认设定所述声纹权限级别声纹及声纹对应的用户名。
请再次参阅图3,所述方法还包括:步骤S130,对获得的至少一个输入语音信息对应的声纹进行检测,检测是否存在未注册的声纹。
在本实施例中,所述智能设备100会对获得的至少一个输入语音信息对应的声纹进行检测,检测至少一个输入语音信息对应的声纹是否注册。当检测的声纹中存在未注册的声纹时,执行步骤S135,否则执行步骤S140。
步骤S135,对未注册的声纹进行注册,并将注册后得到的声纹注册信息保存在所述声纹数据库中。
在本实施例中,智能设备100根据未注册的声纹为未注册的声纹对应的用户配置声纹注册信息(包括:声纹、声纹对应的用户名及声纹权限级别等信息),并将注册后得到的声纹注册信息保存在所述声纹数据库中。
请再次参阅图3,所述方法还包括:步骤S140,检测是否存在控制权更换请求。
在本实施例中,当存在控制权更换请求时,执行步骤S150,否则执行步骤S160。
在本实施例中,所述检测是否存在控制权更换请求的方式包括:
1、检测至少一个输入语音信息中是否存在预设暗语。
在本实施例中,所述预设暗语可以是预先设定的特殊语音,比如“请求控制权”这5个字。当智能设备100检测到至少一个输入语音信息中存在所述预设暗语时,则表明有用户请求拥有语音控制权。所述智能设备100可将发出带有所述预设暗语的输入语音信息的用户对应的声纹标注为待更换控制权声纹。
2、检测已注册的声纹中是否有声纹被选中作为待更换控制权声纹。
在本实施例中,用户也可调出控制权选择界面,通过在已注册的声纹列表中选取声纹的方式请求拥有语音控制权。智能设备100可将被选中声纹作为待更换控制权声纹。
其中,用户选择声纹的方式包括,但不限于,通过按键或触屏遥控设备选择声纹、通过智能设备100上的按键或触屏选择声纹等方式。
3、检测当前拥有语音控制权的用户是否通过输入控制权变更的语音信息请求控制权变更。
在本实施例中,智能设备100在检测到当前拥有语音控制权的用户在输入语音信息中包含了请求控制权变更的相关信息时,智能设备100对所述输入语音信息进行处理得到控制权变更指令,并根据该指令进行控制权变更操作。
在本实施例中,上述三种方式仅是对检测是否存在控制权更换请求的举例说明,还可包括其他方式,上述三种方式并不对检测是否存在控制权更换请求的方式造成限定。
在本实施例中,当智能设备100检测到存在控制权更换请求时,执行步骤S150。
步骤S150,进行控制权的声纹更换检测,并根据检查结果对所述控制权进行变更。
请参照图5,图5是本发明第一实施例提供的图3所示的步骤S150的子步骤流程图。所述步骤S150包括:子步骤S151、子步骤S152、子步骤S153、子步骤S154及子步骤S155。
子步骤S151,获取待更换控制权声纹的声纹权限级别及当前控制权声纹的声纹权限级别。
在本实施例中,所述智能设备100可从声纹数据库中获取待更换控制权声纹的声纹权限级别及当前控制权声纹的声纹权限级别。
子步骤S152,将待更换控制权声纹的声纹权限级别与当前控制权声纹的声纹权限级别进行比较,判断待更换控制权声纹的声纹权限级别是否不低于当前控制权声纹的声纹权限级别。
在本实施例中,若待更换控制权声纹的声纹权限级别不低于当前控制权声纹的声纹权限级别,则执行子步骤S153。若待更换控制权声纹的声纹权限级别低于当前控制权声纹的声纹权限级别,则执行子步骤S154。
子步骤S153,进行控制权声纹变更,将所述待更换控制权声纹作为当前控制权声纹,并对变更后的当前控制权声纹进行保存。
在本实施例中,若待更换控制权声纹的声纹权限级别不低于当前控制权声纹的声纹权限级别,则表明所述待更换控制权声纹对应的用户可抢占语音控制权。所述智能设备100会进行控制权声纹变更,将所述待更换控制权声纹作为当前控制权声纹,并对变更后的当前控制权声纹进行保存。
子步骤S154,发出让位询问通知,询问当前控制权声纹对应的用户是否同意让位。
在本实施例中,若待更换控制权声纹的声纹权限级别低于当前控制权声纹的声纹权限级别,所述智能设备100会发出让位询问通知,以询问当前控制权声纹对应的用户是否同意让位。
在本实施例中,所述智能设备100发出让位询问通知的方式包括,但不限于,启动询问通知窗口界面、进行询问通知语音提示等。
在本实施例中,当智能设备100接收到用户同意让位的反馈信息时,跳转到上述子步骤S153,执行子步骤S153。
在本实施例中,当智能设备100接收到用户不同意让位的反馈信息时,执行子步骤S155。
子步骤S155,不进行控制权声纹变更。
在本实施例中,上述步骤S150可以发生在任何阶段,当智能设备100接收到控制权更换的请求时,即可执行步骤S150。
在本实施例中,拥有语音控制权的用户可一直保持拥有语音控制权,防止控制权声纹随意更换。例如,当家长不在家时,家长可以通过掌握语音控制权而阻止孩童使用智能电视。
除此以外,拥有语音控制权的用户也可对拥有语音控制权的有效时间进行设定。例如,设定有效时间为3小时,则智能设备100启动运行3小时后,该用户的语音控制权自动失效。或者在所述智能设备100关闭时,语音控制权自动失效。
在本实施例中,所述当前控制权声纹可只设置一个,也可设置多个。当所述当前控制权声纹设置多个时,上述步骤S170可包括:子步骤S171及子步骤S172。
请参照图6,图6是在当前控制权声纹设置为多个时,图2所示的步骤S170的子步骤流程图。
子步骤S171,检测得到的多个匹配声纹的声纹权限级别。
在本实施例中,在当前控制权声纹设置为多个时,智能设备100执行步骤S160,将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,可能得到多个匹配声纹。此时,所述智能设备100会检测得到的多个匹配声纹的声纹权限级别。
子步骤S172,将声纹权限级别最高的匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备100进行控制。
在本实施例中,所述智能设备100会根据声纹权限级别的检测结果,从所述多个匹配声纹中选取声纹权限级别最高的匹配声纹,将语音控制权赋予该匹配声纹对应的用户。所述智能设备100对该匹配声纹对应的输入语音信息进行处理得到控制指令,并根据所述控制指令完成用户指定的操作。
第二实施例
请参照图7,图7是本发明第二实施例提供的语音控制装置200的功能模块框图。所述装置应用于与智能设备100。所述装置包括:获取模块220、匹配模块260及控制模块270。
获取模块220,用于获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。
在本实施例中,所述获取模块220用于执行图2中的步骤S120,关于所述获取模块220的具体描述可以参照步骤S120的描述。
匹配模块260,用于将各个输入语音信息对应的声纹与当前控制权声纹进行匹配。其中,所述当前控制权声纹是指当前能对智能设备100进行语音控制的用户所对应的声纹。
在本实施例中,所述匹配模块260用于执行图2中的步骤S160,关于所述匹配模块260的具体描述可以参照步骤S160的描述。
控制模块270,用于当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备100进行控制。
在本实施例中,所述控制模块270用于执行图2中的步骤S170,关于所述控制模块270的具体描述可以参照步骤S170的描述。
请再次参照图7,所述装置还包括:注册模块210、声纹检测模块230、控制权检测模块240及变更模块250。
注册模块210,用于对声纹进行注册。
在本实施例中,所述注册模块210用于执行图3中的步骤S110,关于所述注册模块210的具体描述可以参照步骤S110的描述。
声纹检测模块230,用于对获得的至少一个输入语音信息对应的声纹进行检测。
在本实施例中,所述声纹检测模块230用于执行图3中的步骤S130,关于所述声纹检测模块230的具体描述可以参照步骤S130的描述。
所述注册模块210,还用于当检测的声纹中存在未注册的声纹时,对未注册的声纹进行注册,并将注册后得到的声纹注册信息保存在所述声纹数据库中。
在本实施例中,所述注册模块210还用于执行图3中的步骤S135,关于所述注册模块210的具体描述可以参照步骤S135的描述。
控制权检测模块240,用于检测是否存在控制权更换请求。
在本实施例中,所述控制权检测模块240用于执行图3中的步骤S140,关于所述控制权检测模块240的具体描述可以参照步骤S140的描述。
变更模块250,用于当检测到存在控制权更换请求时,进行控制权的声纹更换检测,并根据检查结果对所述控制权进行变更。
在本实施例中,所述变更模块250用于执行图3中的步骤S150,关于所述变更模块250的具体描述可以参照步骤S150的描述。
综上所述,本发明提供一种语音控制方法、装置及可读存储介质。所述方法应用于智能设备,所述方法包括:获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹。将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹。当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
由此,能够识别出与控制权声纹相匹配的声纹,并提取该声纹对应的语音作为控制指令,而丢弃其他用户的语音及环境噪音,解决了多用户远场语音控制互相干扰的问题,具有良好的用户体验。并且可对控制权声纹的有效时间进行灵活设定,满足用户更多的需求。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种语音控制方法,应用于智能设备,其特征在于,所述方法包括:
获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹;
将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹;
当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对声纹进行注册;
所述对声纹进行注册的步骤包括:
获取待注册语音信息,对所述待注册语音信息进行处理得到对应的声纹;
根据得到的声纹配置声纹注册信息,并将声纹注册信息存储于声纹数据库中,其中,所述声纹注册信息包括:声纹、声纹对应的用户名及声纹权限级别。
3.根据权利要求2所述的方法,其特征在于,在将各个输入语音信息对应的声纹与预先存储的当前控制权声纹进行匹配的步骤之前,所述方法还包括:
检测是否存在控制权更换请求;
当检测到存在控制权更换请求时,进行控制权的声纹更换检测,并根据检查结果对所述控制权进行变更。
4.根据权利要求3所述的方法,其特征在于,所述检测是否存在控制权更换请求的方式包括:
检测至少一个输入语音信息中是否存在预设暗语,其中,所述预设暗语对应的输入语音信息的声纹为待更换控制权声纹;或者
检测已注册的声纹中是否有声纹被选中作为待更换控制权声纹。
5.根据权利要求4所述的方法,其特征在于,所述进行控制权的声纹更换检测,并根据检查结果对所述控制权进行变更的步骤包括:
获取待更换控制权声纹的声纹权限级别及当前控制权声纹的声纹权限级别;
将待更换控制权声纹的声纹权限级别与当前控制权声纹的声纹权限级别进行比较;
若待更换控制权声纹的声纹权限级别不低于当前控制权声纹的声纹权限级别,则进行控制权声纹变更,将所述待更换控制权声纹作为当前控制权声纹,并对变更后的当前控制权声纹进行保存;
若待更换控制权声纹的声纹权限级别低于当前控制权声纹的声纹权限级别,则发出让位询问通知,询问当前控制权声纹对应的用户是否同意让位;
当检测到同意让位的反馈信息时,进行控制权声纹变更,将所述待更换控制权声纹作为当前控制权声纹,并对变更后的当前控制权声纹进行保存;
当检测到不同意让位的反馈信息时,不进行控制权声纹变更。
6.根据权利要求2-5任意一项所述的方法,其特征在于,所述方法还包括:
对获得的至少一个输入语音信息对应的声纹进行检测;
当检测的声纹中存在未注册的声纹时,对未注册的声纹进行注册,并将注册后得到的声纹注册信息保存在所述声纹数据库中。
7.根据权利要求6所述的方法,其特征在于,所述将各个输入语音信息对应的声纹与预先存储的当前控制权声纹进行匹配的步骤包括:
将各个输入语音信息对应的声纹分别与当前控制权声纹进行比对,得到声纹匹配率;
将声纹匹配率与一预设匹配率阈值进行比较;
将声纹匹配率不小于所述预设匹配率阈值的声纹判定为与当前控制权声纹匹配。
8.根据权利要求2所述的方法,其特征在于,当所述当前控制权声纹为多个时,所述对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制的步骤包括:
检测得到的多个匹配声纹的声纹权限级别;
将声纹权限级别最高的匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
9.一种语音控制装置,应用于智能设备,其特征在于,所述装置包括:
获取模块,用于获得至少一个输入语音信息,对所述至少一个输入语音信息进行处理得到各个输入语音信息对应的声纹;
匹配模块,用于将各个输入语音信息对应的声纹与当前控制权声纹进行匹配,其中,所述当前控制权声纹是指当前能对智能设备进行语音控制的用户所对应的声纹;
控制模块,用于当存在匹配声纹时,对匹配声纹对应的输入语音信息进行处理得到控制指令,并通过所述控制指令对所述智能设备进行控制。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
注册模块,用于对声纹进行注册;
所述注册模块对声纹进行注册的方式包括:
获取待注册语音信息,对所述待注册语音信息进行处理得到对应的声纹;
根据得到的声纹配置声纹注册信息,并将声纹注册信息存储于声纹数据库中,其中,所述声纹注册信息包括:声纹、声纹对应的用户名及声纹权限级别。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
控制权检测模块,用于检测是否存在控制权更换请求;
变更模块,用于当检测到存在控制权更换请求时,进行控制权的声纹更换检测,并根据检查结果对所述控制权进行变更。
12.根据权利要求10-11任意一项所述的装置,其特征在于,所述装置还包括:
声纹检测模块,用于对获得的至少一个输入语音信息对应的声纹进行检测;
所述注册模块,还用于当检测的声纹中存在未注册的声纹时,对未注册的声纹进行注册,并将注册后得到的声纹注册信息保存在所述声纹数据库中。
13.一种可读存储介质,所述可读存储介质包括计算机程序,其特征在于:
所述计算机程序运行时控制所述可读存储介质所在智能设备执行权利要求1-8中任意一项所述的语音控制方法。
CN201710462434.7A 2017-06-19 2017-06-19 语音控制方法、装置及可读存储介质 Pending CN107180632A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710462434.7A CN107180632A (zh) 2017-06-19 2017-06-19 语音控制方法、装置及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710462434.7A CN107180632A (zh) 2017-06-19 2017-06-19 语音控制方法、装置及可读存储介质

Publications (1)

Publication Number Publication Date
CN107180632A true CN107180632A (zh) 2017-09-19

Family

ID=59836435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710462434.7A Pending CN107180632A (zh) 2017-06-19 2017-06-19 语音控制方法、装置及可读存储介质

Country Status (1)

Country Link
CN (1) CN107180632A (zh)

Cited By (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN107909997A (zh) * 2017-09-29 2018-04-13 威创集团股份有限公司 一种拼接墙控制方法及系统
CN108053828A (zh) * 2017-12-25 2018-05-18 无锡小天鹅股份有限公司 确定控制指令的方法、装置和家用电器
CN108159702A (zh) * 2017-12-06 2018-06-15 广东欧珀移动通信有限公司 基于多人语音游戏处理方法和装置
CN108181899A (zh) * 2017-12-14 2018-06-19 北京汽车集团有限公司 控制车辆行驶的方法、装置及存储介质
CN108231082A (zh) * 2017-12-29 2018-06-29 广州势必可赢网络科技有限公司 一种自学习声纹识别的更新方法和装置
CN108597526A (zh) * 2018-03-28 2018-09-28 上海与德科技有限公司 一种权限确认方法、装置、存储介质及智能音箱
CN108711428A (zh) * 2018-05-30 2018-10-26 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN108806678A (zh) * 2018-05-18 2018-11-13 出门问问信息科技有限公司 设备的语音唤醒方法及装置
CN108881649A (zh) * 2018-06-08 2018-11-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108924343A (zh) * 2018-06-19 2018-11-30 Oppo广东移动通信有限公司 电子设备控制方法、装置、存储介质及电子设备
CN109343481A (zh) * 2018-09-26 2019-02-15 珠海格力电器股份有限公司 一种控制设备的方法与设备
CN109448716A (zh) * 2018-12-06 2019-03-08 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
CN109473110A (zh) * 2018-12-29 2019-03-15 深圳市慧声信息科技有限公司 一种防止语音交互设备被误唤醒的方法、装置、系统及使用方法
CN109727601A (zh) * 2018-12-24 2019-05-07 联想(北京)有限公司 一种信息处理方法及装置
CN109841218A (zh) * 2019-01-31 2019-06-04 北京声智科技有限公司 一种针对远场环境的声纹注册方法及装置
WO2019137066A1 (zh) * 2018-01-15 2019-07-18 格力电器(武汉)有限公司 电器控制方法及装置
CN110047493A (zh) * 2019-03-13 2019-07-23 深圳市酷开网络科技有限公司 基于声纹识别优先级的控制方法、装置及存储介质
CN110134022A (zh) * 2019-05-10 2019-08-16 平安科技(深圳)有限公司 智能家居设备的声音控制方法、装置、及电子装置
CN110570850A (zh) * 2019-07-30 2019-12-13 珠海格力电器股份有限公司 语音控制方法、装置、计算机设备和存储介质
CN110720123A (zh) * 2018-10-31 2020-01-21 深圳市大疆创新科技有限公司 一种移动平台的控制方法及控制设备
CN110767237A (zh) * 2019-10-25 2020-02-07 深圳市声扬科技有限公司 一种语音传输方法、装置、第一对讲机和系统
CN110970034A (zh) * 2019-12-06 2020-04-07 中国银行股份有限公司 一种会议配套设备的控制方法及装置
CN111128195A (zh) * 2019-11-29 2020-05-08 合肥讯飞读写科技有限公司 智能演示器的声纹控制方法、智能演示器和设备
CN111128145A (zh) * 2018-10-31 2020-05-08 佳能株式会社 电子设备、控制方法和存储介质
CN111145749A (zh) * 2019-12-31 2020-05-12 联想(北京)有限公司 一种控制方法及控制装置
CN111623474A (zh) * 2020-04-22 2020-09-04 梅州市青塘实业有限公司 空调的智能控制方法、装置、智能空调及存储介质
CN111816164A (zh) * 2019-04-05 2020-10-23 三星电子株式会社 用于语音识别的方法及设备
CN111916052A (zh) * 2020-07-30 2020-11-10 北京声智科技有限公司 一种语音合成方法及装置
CN112071306A (zh) * 2020-08-26 2020-12-11 吴义魁 语音控制方法、系统、可读存储介质及网关设备
CN112382299A (zh) * 2020-11-18 2021-02-19 江西台德智慧科技有限公司 一种智能眼镜的语音交互方法、语音交互系统及智能眼镜
CN114446299A (zh) * 2022-01-24 2022-05-06 珠海格力电器股份有限公司 家居设备的控制方法、控制装置、存储介质及电子装置
WO2023274028A1 (zh) * 2021-07-01 2023-01-05 汉王科技股份有限公司 声纹锁控制方法、装置、电子设备
US12073825B2 (en) 2019-04-05 2024-08-27 Samsung Electronics Co., Ltd. Method and apparatus for speech recognition

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282254A (zh) * 2007-04-02 2008-10-08 华为技术有限公司 家庭网络设备管理方法、系统及装置
US20100086108A1 (en) * 2008-10-06 2010-04-08 International Business Machines Corporation Method and system for using conversational biometrics and speaker identification/verification to filter voice streams
CN102945669A (zh) * 2012-11-14 2013-02-27 四川长虹电器股份有限公司 一种家电设备语音控制方法
CN104049721A (zh) * 2013-03-11 2014-09-17 联想(北京)有限公司 信息处理方法及电子设备
CN104283745A (zh) * 2014-09-12 2015-01-14 小米科技有限责任公司 控制智能家居设备的方法、装置和系统
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统
CN105223913A (zh) * 2014-06-30 2016-01-06 青岛海尔智能家电科技有限公司 用于设备控制的方法及装置
CN105527852A (zh) * 2015-12-11 2016-04-27 四川长虹电器股份有限公司 一种控制智能家居系统的方法和控制器
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
CN105592264A (zh) * 2015-12-17 2016-05-18 北京大学深圳研究生院 一种语音控制拍照软件

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101282254A (zh) * 2007-04-02 2008-10-08 华为技术有限公司 家庭网络设备管理方法、系统及装置
US20100086108A1 (en) * 2008-10-06 2010-04-08 International Business Machines Corporation Method and system for using conversational biometrics and speaker identification/verification to filter voice streams
CN102945669A (zh) * 2012-11-14 2013-02-27 四川长虹电器股份有限公司 一种家电设备语音控制方法
CN104049721A (zh) * 2013-03-11 2014-09-17 联想(北京)有限公司 信息处理方法及电子设备
CN104978958A (zh) * 2014-04-14 2015-10-14 美的集团股份有限公司 语音控制方法和系统
CN105223913A (zh) * 2014-06-30 2016-01-06 青岛海尔智能家电科技有限公司 用于设备控制的方法及装置
CN104283745A (zh) * 2014-09-12 2015-01-14 小米科技有限责任公司 控制智能家居设备的方法、装置和系统
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
CN105527852A (zh) * 2015-12-11 2016-04-27 四川长虹电器股份有限公司 一种控制智能家居系统的方法和控制器
CN105592264A (zh) * 2015-12-17 2016-05-18 北京大学深圳研究生院 一种语音控制拍照软件

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909997A (zh) * 2017-09-29 2018-04-13 威创集团股份有限公司 一种拼接墙控制方法及系统
WO2019075794A1 (zh) * 2017-10-17 2019-04-25 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN107767875A (zh) * 2017-10-17 2018-03-06 深圳市沃特沃德股份有限公司 语音控制方法、装置和终端设备
CN108159702A (zh) * 2017-12-06 2018-06-15 广东欧珀移动通信有限公司 基于多人语音游戏处理方法和装置
CN107863098A (zh) * 2017-12-07 2018-03-30 广州市艾涛普电子有限公司 一种语音识别控制方法和装置
CN108181899A (zh) * 2017-12-14 2018-06-19 北京汽车集团有限公司 控制车辆行驶的方法、装置及存储介质
CN108053828A (zh) * 2017-12-25 2018-05-18 无锡小天鹅股份有限公司 确定控制指令的方法、装置和家用电器
CN108231082A (zh) * 2017-12-29 2018-06-29 广州势必可赢网络科技有限公司 一种自学习声纹识别的更新方法和装置
WO2019137066A1 (zh) * 2018-01-15 2019-07-18 格力电器(武汉)有限公司 电器控制方法及装置
CN108597526A (zh) * 2018-03-28 2018-09-28 上海与德科技有限公司 一种权限确认方法、装置、存储介质及智能音箱
CN108806678A (zh) * 2018-05-18 2018-11-13 出门问问信息科技有限公司 设备的语音唤醒方法及装置
CN108711428A (zh) * 2018-05-30 2018-10-26 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN108711428B (zh) * 2018-05-30 2021-05-25 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN108881649A (zh) * 2018-06-08 2018-11-23 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108881649B (zh) * 2018-06-08 2020-11-13 百度在线网络技术(北京)有限公司 用于提供语音服务的方法和装置
CN108924343A (zh) * 2018-06-19 2018-11-30 Oppo广东移动通信有限公司 电子设备控制方法、装置、存储介质及电子设备
CN109343481A (zh) * 2018-09-26 2019-02-15 珠海格力电器股份有限公司 一种控制设备的方法与设备
CN111128145A (zh) * 2018-10-31 2020-05-08 佳能株式会社 电子设备、控制方法和存储介质
CN111128145B (zh) * 2018-10-31 2024-05-21 佳能株式会社 电子设备、控制方法和存储介质
CN110720123A (zh) * 2018-10-31 2020-01-21 深圳市大疆创新科技有限公司 一种移动平台的控制方法及控制设备
CN109448716A (zh) * 2018-12-06 2019-03-08 珠海格力电器股份有限公司 一种语音控制方法、装置、存储介质及空调
CN109727601A (zh) * 2018-12-24 2019-05-07 联想(北京)有限公司 一种信息处理方法及装置
CN109473110A (zh) * 2018-12-29 2019-03-15 深圳市慧声信息科技有限公司 一种防止语音交互设备被误唤醒的方法、装置、系统及使用方法
CN109841218B (zh) * 2019-01-31 2020-10-27 北京声智科技有限公司 一种针对远场环境的声纹注册方法及装置
CN109841218A (zh) * 2019-01-31 2019-06-04 北京声智科技有限公司 一种针对远场环境的声纹注册方法及装置
CN110047493A (zh) * 2019-03-13 2019-07-23 深圳市酷开网络科技有限公司 基于声纹识别优先级的控制方法、装置及存储介质
CN111816164A (zh) * 2019-04-05 2020-10-23 三星电子株式会社 用于语音识别的方法及设备
US12073825B2 (en) 2019-04-05 2024-08-27 Samsung Electronics Co., Ltd. Method and apparatus for speech recognition
CN110134022A (zh) * 2019-05-10 2019-08-16 平安科技(深圳)有限公司 智能家居设备的声音控制方法、装置、及电子装置
CN110570850A (zh) * 2019-07-30 2019-12-13 珠海格力电器股份有限公司 语音控制方法、装置、计算机设备和存储介质
CN110767237A (zh) * 2019-10-25 2020-02-07 深圳市声扬科技有限公司 一种语音传输方法、装置、第一对讲机和系统
CN111128195A (zh) * 2019-11-29 2020-05-08 合肥讯飞读写科技有限公司 智能演示器的声纹控制方法、智能演示器和设备
CN110970034A (zh) * 2019-12-06 2020-04-07 中国银行股份有限公司 一种会议配套设备的控制方法及装置
CN111145749A (zh) * 2019-12-31 2020-05-12 联想(北京)有限公司 一种控制方法及控制装置
CN111145749B (zh) * 2019-12-31 2023-05-02 联想(北京)有限公司 一种控制方法及控制装置
CN111623474A (zh) * 2020-04-22 2020-09-04 梅州市青塘实业有限公司 空调的智能控制方法、装置、智能空调及存储介质
CN111916052B (zh) * 2020-07-30 2021-04-27 北京声智科技有限公司 一种语音合成方法及装置
CN111916052A (zh) * 2020-07-30 2020-11-10 北京声智科技有限公司 一种语音合成方法及装置
CN112071306A (zh) * 2020-08-26 2020-12-11 吴义魁 语音控制方法、系统、可读存储介质及网关设备
CN112382299A (zh) * 2020-11-18 2021-02-19 江西台德智慧科技有限公司 一种智能眼镜的语音交互方法、语音交互系统及智能眼镜
WO2023274028A1 (zh) * 2021-07-01 2023-01-05 汉王科技股份有限公司 声纹锁控制方法、装置、电子设备
CN114446299A (zh) * 2022-01-24 2022-05-06 珠海格力电器股份有限公司 家居设备的控制方法、控制装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN107180632A (zh) 语音控制方法、装置及可读存储介质
CN105446159A (zh) 智能家居系统及其数据处理方法
CN111433736A (zh) 机器控制系统、机器控制方法、以及程序
US7620547B2 (en) Spoken man-machine interface with speaker identification
WO2015096515A1 (en) Identity authentication method, apparatus, and system
CN108389580B (zh) 家用电器及其语音识别方法、服务器
CN105490890A (zh) 智能家庭终端及其控制方法
CN110401662A (zh) 一种工控设备指纹识别方法、存储介质
CN113055206B (zh) 基于意图的网络的业务配置方法、装置以及存储介质
CN110288995B (zh) 基于语音识别的交互方法、装置、存储介质和电子设备
CN102890776A (zh) 通过面部表情调取表情图释的方法
KR101999657B1 (ko) 챗봇을 이용한 사용자 케어 시스템
CN109545213A (zh) 设备控制方法、装置、存储介质及空调
CN108470568A (zh) 智能设备控制方法及装置、存储介质、电子设备
CN108881649B (zh) 用于提供语音服务的方法和装置
CN112735414B (zh) 一种在线离线双模语音控制方法、系统以及存储介质
CN101276586A (zh) 语音控制装置及方法
CN108304155A (zh) 一种人机交互控制方法
CN106656985B (zh) 一种备份账号登录方法、装置及系统
CN108932947B (zh) 语音控制方法及家电设备
CN109308898B (zh) 一种方言语音识别方法、装置、终端及其存储介质
CN107133530A (zh) 一种账户管理方法、共用设备及计算机可读存储介质
CN103297530B (zh) 一种控制智能家居设备的方法
CN110047486A (zh) 语音控制方法、装置、服务器、系统及存储介质
CN109361641A (zh) 一种异构终端加入场景的方法、存储介质及应用服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170919