CN111081251A - 语音唤醒方法及装置 - Google Patents

语音唤醒方法及装置 Download PDF

Info

Publication number
CN111081251A
CN111081251A CN201911180720.XA CN201911180720A CN111081251A CN 111081251 A CN111081251 A CN 111081251A CN 201911180720 A CN201911180720 A CN 201911180720A CN 111081251 A CN111081251 A CN 111081251A
Authority
CN
China
Prior art keywords
awakening
voice
recognition result
recognition
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911180720.XA
Other languages
English (en)
Other versions
CN111081251B (zh
Inventor
陈晓松
许东星
俞华伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911180720.XA priority Critical patent/CN111081251B/zh
Publication of CN111081251A publication Critical patent/CN111081251A/zh
Application granted granted Critical
Publication of CN111081251B publication Critical patent/CN111081251B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Electric Clocks (AREA)

Abstract

本发明是关于语音唤醒方法及装置。该方法包括:确定语音唤醒阈值;接收输入的当前唤醒语音;首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;根据判断结果,唤醒目标设备。通过本发明的技术方案,可尽量利用较少次数的语音唤醒识别操作即可确认是否接收到了有效唤醒操作,进而减少唤醒延时,提高唤醒效率,进而提高用户的唤醒体验。

Description

语音唤醒方法及装置
技术领域
本发明涉及语音技术领域,尤其涉及语音唤醒方法及装置。
背景技术
目前,很多设备都支持语音识别功能,用户可通过语音对设备进行唤醒,但相关技术中在确定是否为有效唤醒时,需要通过多次语音识别才能确认是否为有效唤醒,如此,就存在较长的唤醒延时,如存在300毫秒以上的延时,这将大大影响设备唤醒效率以及严重影响用户体验。
发明内容
本发明实施例提供了语音唤醒方法及装置。所述技术方案如下:
根据本发明实施例的第一方面,提供一种语音唤醒方法,包括:
确定语音唤醒阈值;
接收输入的当前唤醒语音;
首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
根据判断结果,唤醒目标设备。
在一个实施例中,所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
在一个实施例中,所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
根据所述再次唤醒识别结果,唤醒所述目标设备。
在一个实施例中,所述根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒,包括:
当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
根据本发明实施例的第二方面,提供一种语音唤醒装置,包括:
确定模块,用于确定语音唤醒阈值;
接收模块,用于接收输入的当前唤醒语音;
语音识别模块,用于首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
判断模块,用于根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
唤醒模块,用于根据判断结果,唤醒目标设备。
在一个实施例中,所述唤醒模块包括:
第一唤醒子模块,用于当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
在一个实施例中,所述唤醒模块包括:
语音识别子模块,用于当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
确定子模块,用于当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
第二唤醒子模块,用于根据所述再次唤醒识别结果,唤醒所述目标设备。
在一个实施例中,所述判断模块包括:
第一判定子模块,用于当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
第二判定子模块,用于当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
本发明的实施例提供的技术方案可以包括以下有益效果:
在接收到当前唤醒语音时,可对当前唤醒语音进行首次语音识别,然后获得首次唤醒识别结果以及首次唤醒识别结果的置信度,进而根据置信度和语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒,进而根据判断结果,唤醒目标设备,从而可尽量利用较少次数的语音唤醒识别操作即可确认是否接收到了有效唤醒操作,进而减少唤醒延时,提高唤醒效率,进而提高用户的唤醒体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1是根据一示例性实施例示出的一种语音唤醒方法的流程图。
图2是根据一示例性实施例示出的一种语音唤醒装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
为了解决上述技术问题,本发明实施例提供了一种语音唤醒方法,该方法可用于语音唤醒程序、系统或装置中,且该方法对应的执行主体可以是终端或服务器,如图1所示,该方法包括步骤S101至步骤S103:
在步骤S101中,确定语音唤醒阈值;
在步骤S102中,接收输入的当前唤醒语音;
在步骤S103中,首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
在步骤S104中,根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
在步骤S105中,根据判断结果,唤醒目标设备。
在接收到当前唤醒语音时,可对当前唤醒语音进行首次语音识别,然后获得首次唤醒识别结果以及首次唤醒识别结果的置信度,进而根据置信度和语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒,进而根据判断结果,唤醒目标设备,从而可尽量利用较少次数的语音唤醒识别操作即可确认是否接收到了有效唤醒操作,进而减少唤醒延时,提高唤醒效率,进而提高用户的唤醒体验。
在一个实施例中,所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
在确定首次唤醒识别结果为有效唤醒时,可立即唤醒所述目标设备,以减少语音唤醒次数,从而避免每次都需要多次语音识别才能确认是否为有效唤醒,如此有利于提高唤醒效率,进而提高用户的唤醒体验。
在一个实施例中,所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
当然,再次进行语音识别可以是第2次、第3次等多次语音识别。
当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
再次唤醒识别结果的置信度大于所述语音唤醒阈值指的是第i次语音识别的置信度大于该语音唤醒阈值,i为大于或等于2的正整数。
根据所述再次唤醒识别结果,唤醒所述目标设备。
当首次唤醒识别结果为无效唤醒时,说明初步判断的是不进行语音唤醒,但还有可能是误判,所以,可对当前唤醒语音再次进行语音识别,以获得再次唤醒识别结果以及该再次唤醒识别结果的置信度,然后若再次唤醒识别结果的置信度大于所述语音唤醒阈值,则说明之前是误判,因而,可确定再次唤醒识别结果为有效唤醒,从而根据所述再次唤醒识别结果,自动唤醒所述目标设备,这样可在尽可能减少唤醒延时的基础上,自动唤醒目标设备,且能尽可能确保目标设备的唤醒正确率。
在一个实施例中,所述根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒,包括:
当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
当该置信度大于语音唤醒阈值时,说明本次的语音识别正确率较高,因而,可确定首次唤醒识别结果为有效唤醒;而当置信度小于或等于所述语音唤醒阈值时,说明本次的语音识别正确率较低,则可确定首次唤醒识别结果为无效唤醒,即不能依据本次唤醒识别结果立即唤醒目标设备。
最后,需要明确的是:本领域技术人员可根据实际需求,将上述多个实施例进行自由组合。
对应本发明实施例提供的上述语音唤醒方法,本发明实施例还提供一种语音唤醒装置,如图2所示,该装置包括:
确定模块201,用于确定语音唤醒阈值;
接收模块202,用于接收输入的当前唤醒语音;
语音识别模块203,用于首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
判断模块204,用于根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
唤醒模块205,用于根据判断结果,唤醒目标设备。
在一个实施例中,所述唤醒模块包括:
第一唤醒子模块,用于当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
在一个实施例中,所述唤醒模块包括:
语音识别子模块,用于当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
确定子模块,用于当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
第二唤醒子模块,用于根据所述再次唤醒识别结果,唤醒所述目标设备。
在一个实施例中,所述判断模块包括:
第一判定子模块,用于当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
第二判定子模块,用于当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (8)

1.一种语音唤醒方法,其特征在于,包括:
确定语音唤醒阈值;
接收输入的当前唤醒语音;
首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
根据判断结果,唤醒目标设备。
2.根据权利要求1所述的方法,其特征在于,
所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
3.根据权利要求1所述的方法,其特征在于,
所述根据判断结果,唤醒目标设备,包括:
当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
根据所述再次唤醒识别结果,唤醒所述目标设备。
4.根据权利要求1至3中任一项所述的方法,其特征在于,
所述根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒,包括:
当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
5.一种语音唤醒装置,其特征在于,包括:
确定模块,用于确定语音唤醒阈值;
接收模块,用于接收输入的当前唤醒语音;
语音识别模块,用于首次对所述当前唤醒语音进行语音识别,获得首次唤醒识别结果以及所述首次唤醒识别结果的置信度;
判断模块,用于根据所述置信度和所述语音唤醒阈值,判断所述首次唤醒识别结果是否为有效唤醒;
唤醒模块,用于根据判断结果,唤醒目标设备。
6.根据权利要求5所述的装置,其特征在于,
所述唤醒模块包括:
第一唤醒子模块,用于当所述首次唤醒识别结果为有效唤醒时,唤醒所述目标设备。
7.根据权利要求5所述的装置,其特征在于,
所述唤醒模块包括:
语音识别子模块,用于当所述首次唤醒识别结果为无效唤醒时,对所述当前唤醒语音再次进行语音识别,获得再次唤醒识别结果以及所述再次唤醒识别结果的置信度;
确定子模块,用于当所述再次唤醒识别结果的置信度大于所述语音唤醒阈值时,确定所述再次唤醒识别结果为有效唤醒;
第二唤醒子模块,用于根据所述再次唤醒识别结果,唤醒所述目标设备。
8.根据权利要求5至7中任一项所述的装置,其特征在于,
所述判断模块包括:
第一判定子模块,用于当所述置信度大于所述语音唤醒阈值时,判定所述首次唤醒识别结果为有效唤醒;
第二判定子模块,用于当所述置信度小于或等于所述语音唤醒阈值时,判定所述首次唤醒识别结果为无效唤醒。
CN201911180720.XA 2019-11-27 2019-11-27 语音唤醒方法及装置 Active CN111081251B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911180720.XA CN111081251B (zh) 2019-11-27 2019-11-27 语音唤醒方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911180720.XA CN111081251B (zh) 2019-11-27 2019-11-27 语音唤醒方法及装置

Publications (2)

Publication Number Publication Date
CN111081251A true CN111081251A (zh) 2020-04-28
CN111081251B CN111081251B (zh) 2022-03-04

Family

ID=70311750

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911180720.XA Active CN111081251B (zh) 2019-11-27 2019-11-27 语音唤醒方法及装置

Country Status (1)

Country Link
CN (1) CN111081251B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951793A (zh) * 2020-08-13 2020-11-17 北京声智科技有限公司 唤醒词识别的方法、装置及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN105702253A (zh) * 2016-01-07 2016-06-22 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106297777A (zh) * 2016-08-11 2017-01-04 广州视源电子科技股份有限公司 一种唤醒语音服务的方法和装置
CN107622770A (zh) * 2017-09-30 2018-01-23 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
CN108335696A (zh) * 2018-02-09 2018-07-27 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN109346071A (zh) * 2018-09-26 2019-02-15 出门问问信息科技有限公司 唤醒处理方法、装置及电子设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105654949A (zh) * 2016-01-07 2016-06-08 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN105702253A (zh) * 2016-01-07 2016-06-22 北京云知声信息技术有限公司 一种语音唤醒方法及装置
CN106297777A (zh) * 2016-08-11 2017-01-04 广州视源电子科技股份有限公司 一种唤醒语音服务的方法和装置
CN107622770A (zh) * 2017-09-30 2018-01-23 百度在线网络技术(北京)有限公司 语音唤醒方法及装置
CN108335696A (zh) * 2018-02-09 2018-07-27 百度在线网络技术(北京)有限公司 语音唤醒方法和装置
CN109346071A (zh) * 2018-09-26 2019-02-15 出门问问信息科技有限公司 唤醒处理方法、装置及电子设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111951793A (zh) * 2020-08-13 2020-11-17 北京声智科技有限公司 唤醒词识别的方法、装置及存储介质
CN111951793B (zh) * 2020-08-13 2021-08-24 北京声智科技有限公司 唤醒词识别的方法、装置及存储介质

Also Published As

Publication number Publication date
CN111081251B (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN106782536B (zh) 一种语音唤醒方法及装置
CN105654949B (zh) 一种语音唤醒方法及装置
CN108564951B (zh) 智能降低语音控制设备误唤醒概率的方法
CN109473092B (zh) 一种语音端点检测方法及装置
CN103632667A (zh) 声学模型优化方法、装置及语音唤醒方法、装置和终端
CN111091813B (zh) 语音唤醒模型更新及唤醒方法、系统、装置、设备及介质
CN110290280B (zh) 一种终端状态的识别方法、装置及存储介质
CN105702253A (zh) 一种语音唤醒方法及装置
CN111968644B (zh) 智能设备唤醒方法、装置及电子设备
CN110634468B (zh) 语音唤醒方法、装置、设备及计算机可读存储介质
CN111599371A (zh) 语音增加方法、系统、装置及存储介质
CN110277092A (zh) 一种语音播报方法、装置、电子设备及可读存储介质
CN105529030A (zh) 语音识别处理方法和装置
CN111161728B (zh) 一种智能设备的唤醒方法、装置、设备及介质
US9177552B2 (en) Method and apparatus for setting selected recognition parameters to minimize an application cost function
CN104078045A (zh) 一种识别的方法及电子设备
CN111081251B (zh) 语音唤醒方法及装置
CN111128155A (zh) 一种智能设备的唤醒方法、装置、设备及介质
CN113873003B (zh) 物联网中存储端和通信端之间的数据传输控制方法及系统
CN113129878A (zh) 声控方法及终端装置
CN114333017A (zh) 一种动态拾音方法、装置、电子设备及存储介质
CN111124512B (zh) 智能设备的唤醒方法、装置、设备和介质
CN112908330B (zh) 终端设备的语音唤醒方法、装置及计算机可读存储介质
CN113808585A (zh) 耳机唤醒方法、装置、设备以及存储介质
CN114399992A (zh) 语音指令响应方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant