CN111179924A - 一种基于模式切换的唤醒性能优化的方法及系统 - Google Patents

一种基于模式切换的唤醒性能优化的方法及系统 Download PDF

Info

Publication number
CN111179924A
CN111179924A CN201911180738.XA CN201911180738A CN111179924A CN 111179924 A CN111179924 A CN 111179924A CN 201911180738 A CN201911180738 A CN 201911180738A CN 111179924 A CN111179924 A CN 111179924A
Authority
CN
China
Prior art keywords
awakening
mode
threshold
awakened
equipment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911180738.XA
Other languages
English (en)
Other versions
CN111179924B (zh
Inventor
陈晓松
尚金龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911180738.XA priority Critical patent/CN111179924B/zh
Publication of CN111179924A publication Critical patent/CN111179924A/zh
Application granted granted Critical
Publication of CN111179924B publication Critical patent/CN111179924B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/4401Bootstrapping
    • G06F9/4418Suspend and resume; Hibernate and awake
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Security & Cryptography (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)

Abstract

本发明公开了一种基于模式切换的唤醒性能优化的方法及系统,所述方法包括:获取唤醒词;根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;确定与二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。采用本发明公开的方案相对于单一的普通唤醒模式,增加二次唤醒模式提高了唤醒率,增加深度睡眠模式降低了误唤醒率,能够满足用户日益严苛的性能指标。

Description

一种基于模式切换的唤醒性能优化的方法及系统
技术领域
本发明涉及语音识别技术领域,特别涉及一种基于模式切换的唤醒性能优化的方法及系统。
背景技术
唤醒率和误唤醒率是语音识别产品的两个重要指标,这两个指标都和“唤醒阈值”直接相关。通常的实现方式是,针对特定的唤醒词,根据实验结果,选择一个固定的参考唤醒阈值。基于这个阈值对待唤醒设备的识别结果做如下分类:若识别结果的置信度大于阈值,则认为是有效唤醒,否则认为是无效唤醒。
目前,对有效唤醒和无效唤醒的判别方式,完全依赖基于算法层面的实验得到的单一的参考阈值,且只有对应此参考阈值的普通唤醒模式,单一参考阈值选取的太大,则会导致唤醒率下降,反之选择的太小,则会导致误唤醒升高,无法满足用户日益严苛的性能指标。
发明内容
本发明提供一种基于模式切换的唤醒性能优化的方法,用以提高唤醒率,降低误唤醒率。
本发明提供一种基于模式切换的唤醒性能优化的方法,包括:
获取唤醒词;
根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。
在一个实施例中,所述获取唤醒词,包括:
将预设关键词设置为所述唤醒词;
获取包含所述关键词的语音流;
检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
在一个实施例中,所述确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,包括:
获取唤醒率和误唤醒率的测试数据集;
根据所述测试数据集获取ROC曲线;
根据所述ROC曲线确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
在一个实施例中,所述根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述二次唤醒模式、深度睡眠模式和所述普通唤醒模式之间进行转换,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
在一个实施例中,所述根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述二次唤醒模式、深度睡眠模式和所述普通唤醒模式之间进行转换,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
本发明实施例提供的一种基于模式切换的唤醒性能优化的方法,具有以下有益效果:相对于单一的普通唤醒模式,增加二次唤醒模式提高了唤醒率,增加深度睡眠模式降低了误唤醒率,能够满足用户日益严苛的性能指标。
本发明还一种基于模式切换的唤醒性能优化的系统,包括:
获取模块,用于获取唤醒词;
设置模块,用于根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
确定模块,用于确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
转换模块,用于根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。
在一个实施例中,所述获取模块,包括:
设置子模块,用于将预设关键词设置为所述唤醒词;
第一获取子模块,用于获取包含所述关键词的语音流;
检测及提取子模块,用于检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
在一个实施例中,所述确定模块,包括:
第二获取子模块,用于获取唤醒率和误唤醒率的测试数据集;
第三获取子模块,用于根据所述测试数据集获取ROC曲线;
确定子模块,用于根据所述ROC曲线确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
在一个实施例中,所述转换模块,包括:
第一转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
第二转换子模块,用于当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
第三转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
在一个实施例中,所述转换模块,包括:
第四转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
第五转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
第六转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
本发明实施例提供的一种基于模式切换的唤醒性能优化的系统,具有以下有益效果:相对于单一的普通唤醒模式,增加二次唤醒模式提高了唤醒率,增加深度睡眠模式降低了误唤醒率,能够满足用户日益严苛的性能指标。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明一实施例中一种基于模式切换的唤醒性能优化的方法的流程图;
图2为本发明一实施例中一种基于模式切换的唤醒性能优化的方法的流程图;
图3为本发明一实施例中一种基于模式切换的唤醒性能优化的系统的框图;
图4为本发明一实施例中一种基于模式切换的唤醒性能优化的系统的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
图1为本发明一实施例中一种基于模式切换的唤醒性能优化的方法的流程图,如图1所示,该方法可被实施为以下步骤S11-S14:
在步骤S11中,获取唤醒词;
在步骤S12中,根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
在步骤S13中,确定与二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
在步骤S14中,根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。
上述技术方案的工作原理为:获取用户的唤醒词,根据应用场景设置待唤醒设备的唤醒模式,确定与二次唤醒模式对应的二次阈值、与深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,根据唤醒词、二次阈值、睡眠阈值和标准阈值控制待唤醒设备在三种模式之间进行转换。
上述技术方案的有益效果为:根据应用场景设置待唤醒设备的二次唤醒模式、深度睡眠模式和普通唤醒模式,并且确定与二次唤醒模式、深度睡眠模式和普通唤醒模式分别对应的唤醒阈值二次阈值、睡眠阈值和标准阈值,根据唤醒词和上述三个唤醒阈值进行二次唤醒模式、深度睡眠模式和普通唤醒模式之间的切换,相对于单一的普通唤醒模式,增加二次唤醒模式提高了唤醒率,增加深度睡眠模式降低了误唤醒率,能够满足用户日益严苛的性能指标。
在一个实施例中,上述步骤S12可被实施为如下步骤S21-S23:
在步骤S21中,将预设关键词设置为所述唤醒词;
在步骤S22中,获取包含所述关键词的语音流;
在步骤S23中,检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
例如,用户可以设置关键词为“你好,小度”、“你好,华为”、“叮咚叮咚”等。
上述技术方案的工作原理为:通过提取检测的语音流中的关键词信息,得到唤醒词。
上述技术方案的有益效果在于:能够根据用户的需求进行唤醒词的设置。
在一个实施例中,上述步骤S13可被实施为如下步骤,包括:
获取唤醒率和误唤醒率的测试数据集;
根据所述测试数据集获取ROC曲线;
根据所述ROC曲线确定与二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
其中,ROC曲线为接受者操作特性曲线,又称“感受性曲线”;二次阈值、标准阈值、睡眠阈值分别用Th1、Th2、Th3表示,Th1对应误唤醒率一般为0.1次/小时左右,能够满足语音识别产品基本要求;Th2对应误唤醒率一般为0.04次/小时左右,属于较高指标;Th3对应误唤醒率一般为0.02次/小时左右,属于极高指标。
上述技术方案的工作原理为:根据唤醒率和误唤醒率的测试数据集获取ROC曲线,根据ROC曲线确定二次阈值、睡眠阈值和标准阈值。
上述技术方案的有益效果在于:确定的二次阈值、睡眠阈值和标准阈值准确性高,避免了因唤醒阈值过高或过低引起的唤醒率下降和误唤醒率升高。
在一个实施例中,上述步骤S14可被实施为如下步骤,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
其中,第一预设时间可以是一分钟,待唤醒设备持续第一预设时间未识别到唤醒词,即待唤醒设备处于待机状态持续第一预设时间。
上述技术方案的工作原理及有益效果为:根据待唤醒设备识别到唤醒词的置信度及未识别到唤醒词持续的时间进行模式之间的转换,节省待唤醒设备的用电量。
在一个实施例中,上述步骤S14可被实施为如下步骤,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
其中,第二预设时间可以为一分钟,待唤醒设备持续第二预设时间未识别到所述唤醒词,即待唤醒设备处于待机时间一分钟,二次唤醒模式转换为普通唤醒模式的情况还可以是预设时间(如5s)超时到期。
上述技术方案的工作原理及有益效果为:根据待唤醒设备识别到唤醒词的置信度及未识别到唤醒词持续的时间进行模式之间的转换,能够根据用户的需求切换模式,并且节省电量的使用。
图3为本发明一实施例中一种基于模式切换的唤醒性能优化的系统的框图,如图3所示,该系统可包括如下模块:
获取模块31,用于获取唤醒词;
设置模块32,用于根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
确定模块33,用于确定与二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
转换模块34,用于根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。
在一个实施例中,如图4所示,获取模块31,包括:
设置子模块41,用于将预设关键词设置为所述唤醒词;
第一获取子模块42,用于获取包含所述关键词的语音流;
检测及提取子模块43,用于检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
在一个实施例中,确定模块,包括:
第二获取子模块,用于获取唤醒率和误唤醒率的测试数据集;
第三获取子模块,用于根据所述测试数据集获取ROC曲线;
确定子模块,用于根据所述ROC曲线确定与二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
在一个实施例中,转换模块,包括:
第一转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
第二转换子模块,用于当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
第三转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
在一个实施例中,转换模块,包括:
第四转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
第五转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
第六转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的系统。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种基于模式切换的唤醒性能优化的方法,其特征在于,包括:
获取唤醒词;
根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述二次唤醒模式、深度睡眠模式和所述普通唤醒模式之间进行转换。
2.如权利要求1所述的方法,其特征在于,所述获取唤醒词,包括:
将预设关键词设置为所述唤醒词;
获取包含所述关键词的语音流;
检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
3.如权利要求1所述的方法,其特征在于,所述确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,包括:
获取唤醒率和误唤醒率的测试数据集;
根据所述测试数据集获取ROC曲线;
根据所述ROC曲线确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
4.如权利要求1所述的方法,其特征在于,所述根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述二次唤醒模式、深度睡眠模式和所述普通唤醒模式之间进行转换,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
5.如权利要求1所述的方法,其特征在于,所述根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述二次唤醒模式、深度睡眠模式和所述普通唤醒模式之间进行转换,包括:
所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
6.一种基于模式切换的唤醒性能优化的系统,其特征在于,包括:
获取模块,用于获取唤醒词;
设置模块,用于根据应用场景设置待唤醒设备的唤醒模式,所述唤醒模式包括二次唤醒模式、深度睡眠模式和普通唤醒模式;
确定模块,用于确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值;
转换模块,用于根据所述唤醒词、二次阈值、睡眠阈值和所述标准阈值控制所述待唤醒设备在所述三种模式之间进行转换。
7.如权利要求6所述的系统,其特征在于,所述获取模块,包括:
设置子模块,用于将预设关键词设置为所述唤醒词;
第一获取子模块,用于获取包含所述关键词的语音流;
检测及提取子模块,用于检测所述语音流中的关键词信息,提取出所述关键词,以得到所述唤醒词。
8.如权利要求6所述的系统,其特征在于,所述确定模块,包括:
第二获取子模块,用于获取唤醒率和误唤醒率的测试数据集;
第三获取子模块,用于根据所述测试数据集获取ROC曲线;
确定子模块,用于根据所述ROC曲线确定与所述二次唤醒模式对应的二次阈值、与所述深度睡眠模式对应的睡眠阈值、与普通唤醒模式对应的标准阈值,其中,所述二次阈值小于所述标准阈值,所述标准阈值小于所述睡眠阈值。
9.如权利要求6所述的系统,其特征在于,所述转换模块,包括:
第一转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的置信度位于所述二次阈值和所述标准阈值之间时,所述待唤醒设备由所述普通唤醒模式转换为所述二次唤醒模式;
第二转换子模块,用于当所述待唤醒设备持续第一预设时间未识别到所述唤醒词时,所述待唤醒设备由所述二次唤醒模式转换为所述深度睡眠模式;
第三转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述睡眠阈值时,所述待唤醒设备被唤醒,即所述待唤醒设备由深度睡眠模式转换为所述普通睡眠模式。
10.如权利要求6所述的系统,其特征在于,所述转换模块,包括:
第四转换子模块,用于所述待唤醒设备处于所述普通唤醒模式下,当所述待唤醒设备持续第二预设时间未识别到所述唤醒词时,所述待唤醒设备由所述普通唤醒模式转换为所述深度睡眠模式;
第五转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度位于所述二次阈值和所述睡眠阈值之间时,所述待唤醒设备由深度睡眠模式转换为所述二次唤醒模式;
第六转换子模块,用于当所述待唤醒设备识别到所述唤醒词,且识别所述唤醒词对应的所述置信度高于所述二次阈值时,所述待唤醒设备由所述二次唤醒模式转换为所述普通唤醒模式。
CN201911180738.XA 2019-11-27 2019-11-27 一种基于模式切换的唤醒性能优化的方法及系统 Active CN111179924B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911180738.XA CN111179924B (zh) 2019-11-27 2019-11-27 一种基于模式切换的唤醒性能优化的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911180738.XA CN111179924B (zh) 2019-11-27 2019-11-27 一种基于模式切换的唤醒性能优化的方法及系统

Publications (2)

Publication Number Publication Date
CN111179924A true CN111179924A (zh) 2020-05-19
CN111179924B CN111179924B (zh) 2022-06-24

Family

ID=70657108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911180738.XA Active CN111179924B (zh) 2019-11-27 2019-11-27 一种基于模式切换的唤醒性能优化的方法及系统

Country Status (1)

Country Link
CN (1) CN111179924B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470657A (zh) * 2021-05-18 2021-10-01 翱捷科技(深圳)有限公司 一种语音唤醒阈值调整方法及系统
CN113834192A (zh) * 2021-09-18 2021-12-24 珠海格力电器股份有限公司 空调中语音识别装置状态调整方法和空调

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983186A (en) * 1995-08-21 1999-11-09 Seiko Epson Corporation Voice-activated interactive speech recognition device and method
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
US20190005953A1 (en) * 2017-06-29 2019-01-03 Amazon Technologies, Inc. Hands free always on near field wakeword solution
CN109346071A (zh) * 2018-09-26 2019-02-15 出门问问信息科技有限公司 唤醒处理方法、装置及电子设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5983186A (en) * 1995-08-21 1999-11-09 Seiko Epson Corporation Voice-activated interactive speech recognition device and method
CN105575395A (zh) * 2014-10-14 2016-05-11 中兴通讯股份有限公司 语音唤醒方法及装置、终端及其处理方法
US20190005953A1 (en) * 2017-06-29 2019-01-03 Amazon Technologies, Inc. Hands free always on near field wakeword solution
CN109346071A (zh) * 2018-09-26 2019-02-15 出门问问信息科技有限公司 唤醒处理方法、装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113470657A (zh) * 2021-05-18 2021-10-01 翱捷科技(深圳)有限公司 一种语音唤醒阈值调整方法及系统
CN113470657B (zh) * 2021-05-18 2023-12-01 翱捷科技(深圳)有限公司 一种语音唤醒阈值调整方法及系统
CN113834192A (zh) * 2021-09-18 2021-12-24 珠海格力电器股份有限公司 空调中语音识别装置状态调整方法和空调

Also Published As

Publication number Publication date
CN111179924B (zh) 2022-06-24

Similar Documents

Publication Publication Date Title
EP3522153B1 (en) Voice control system, wakeup method and wakeup apparatus therefor, electrical appliance and co-processor
US8972252B2 (en) Signal processing apparatus having voice activity detection unit and related signal processing methods
CN109346071A (zh) 唤醒处理方法、装置及电子设备
CN110265036A (zh) 语音唤醒方法、系统、电子设备及计算机可读存储介质
CN110424831B (zh) 低功耗智能门锁
CN104683598A (zh) 接近传感器阈值调节方法、装置及智能设备
CN111179924B (zh) 一种基于模式切换的唤醒性能优化的方法及系统
CN111199733A (zh) 多级识别语音唤醒方法及装置、计算机存储介质及设备
CN108509225B (zh) 一种信息处理方法及电子设备
CN111192590B (zh) 语音唤醒方法、装置、设备及存储介质
CN107103906A (zh) 一种唤醒智能设备进行语音识别的方法、智能设备和介质
US20200234707A1 (en) Voice interaction processing method and apparatus
CN111128155B (zh) 一种智能设备的唤醒方法、装置、设备及介质
CN112233676B (zh) 智能设备唤醒方法、装置、电子设备及存储介质
CN111028831B (zh) 一种语音唤醒方法及装置
CN108806678A (zh) 设备的语音唤醒方法及装置
CN111954868A (zh) 一种多语音助手控制方法、装置、系统及计算机可读存储介质
CN110956968A (zh) 语音唤醒以及触发语音唤醒功能的方法及装置、终端设备
CN116386676B (zh) 语音唤醒方法、语音唤醒装置及存储介质
CN116705033A (zh) 用于无线智能音频设备的片上系统和无线处理方法
CN111383633A (zh) 语音识别连续性控制方法、装置、智能终端及存储介质
CN113889109A (zh) 语音唤醒模式的调节方法、存储介质及电子设备
CN110600060B (zh) 一种硬件音频主动探测hvad系统
CN105718019B (zh) 一种信息处理方法及电子设备
CN205545492U (zh) 一种移动终端

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant