CN111128171A - 一种基于语音识别的设置方法及装置 - Google Patents

一种基于语音识别的设置方法及装置 Download PDF

Info

Publication number
CN111128171A
CN111128171A CN201911410717.2A CN201911410717A CN111128171A CN 111128171 A CN111128171 A CN 111128171A CN 201911410717 A CN201911410717 A CN 201911410717A CN 111128171 A CN111128171 A CN 111128171A
Authority
CN
China
Prior art keywords
awakening
preset
word
grammar
awakening word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911410717.2A
Other languages
English (en)
Inventor
钱志扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unisound Intelligent Technology Co Ltd
Original Assignee
Unisound Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Unisound Intelligent Technology Co Ltd filed Critical Unisound Intelligent Technology Co Ltd
Priority to CN201911410717.2A priority Critical patent/CN111128171A/zh
Publication of CN111128171A publication Critical patent/CN111128171A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

本发明公开了一种基于语音识别的设置方法及装置,包括:获取每个预设场景下的第一唤醒词和第一非唤醒词;对每个预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个预设场景下的第一唤醒词和第一非唤醒词的发音不同;将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。通过本发明使得用户可在不同的场景的使用不同的第一唤醒词和第一非唤醒词解锁语音设备,并且对上述第一唤醒词和第一非唤醒词做处理以保证在同一预设场景下不会出现误解锁或者无法解锁的现象,提高了额稳定性,增强了用户的体验感。

Description

一种基于语音识别的设置方法及装置
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于语音识别的设置方法及装置。
背景技术
语音唤醒是指用户通过说出唤醒词来唤醒电子语音设备,使电子语音设备进入到等待语音指令的状态,或者使电子语音设备直接执行预定的语音指令,现有技术中种语音识别的唤醒词及非唤醒词的设置方法需要保证能够识别大量的语音识别命令。这一般会用到多个识别语法,不同的识别语法之间允许有发音重叠的唤醒词和非唤醒词,同一个语法内不允许有发音相近的唤醒词和命令词;同一个语法内,在设置唤醒词、非唤醒词时,需要保证各个词条的发音差异较大、词条音素易于识别。从而提高所有指令的识别准确率。这种方法存在以下缺点:由于要保持唤醒词和非唤醒词的词条发音差异较大,所以用户为了方便一般都只设置一种唤醒词,但是在一些特定的场景中,用户说出其他非唤醒词时语音设备还是保持休眠状态,无法立即为用户服务,影响了用户的体验感。
发明内容
针对上述所显示出来的问题,本方法基于获取每个预设场景下的唤醒词和非唤醒词,将获取的唤醒词和非唤醒词做调整处理以使得二者在同一场景下的的发音不同,然后将二者设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中进而来唤醒语音设备。
一种基于语音识别的设置方法,包括:
获取每个预设场景下的第一唤醒词和第一非唤醒词;
对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同;
将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
优选的,所述获取每个预设场景下的第一唤醒词和第一非唤醒词,包括:
统计与所述语音识别相关联的所有预设场景;
采集每个所述预设场景内的第一唤醒词和第一非唤醒词;
其中,所述第一非唤醒词包括在多个所述预设场景内的对话内容中的关键词。
优选的,所述对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同,包括:
确认每个所述预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
若是,输出第二唤醒词和第二非唤醒词;
否则,修改所述第一唤醒词和第一非唤醒词直到满足所述预设条件,并输出满足所述预设条件的第二唤醒词和第二非唤醒词;
确认所述第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
若是,则输出第三唤醒词和第三非唤醒词;
否则,修改所述第二唤醒词和第二非唤醒词直到发音序列分数不小于所述预设分数,并输出不小于所述预设分数的第三唤醒词和第三非唤醒词;
保存输出的所述第三唤醒词和第三非唤醒词。
优选的,在所述将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,所述设置方法还包括:
启动语音设备,并根据所述语音设备预先设置好的预设状态,设置所述语音设备在预设场景中对应的识别语法;
当所述语音设备状态为休眠状态时,设置的所述识别语法为所述预设语法中的默认唤醒语法;
当所述语音设备状态为场景休眠状态时,设置的所述识别语法为所述预设语法中的场景唤醒语法;
当所述语音设备状态为唤醒状态时,设置的所述识别语法为所述预设语法中的默认识别语法。
优选的,所述将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中,包括:
将所述第三唤醒词输入到所述默认唤醒语法中,将所述第三非唤醒词输入到所述场景唤醒语法中,同时将所述第三唤醒词和第三非唤醒词输入到所述默认识别语法中;
当接收到用户发出的语音信息时,当接收到用户发出的语音信息时,控制所述语音设备处于休眠状态,并启动所述默认唤醒语法;
基于所述默认唤醒语法,确认所述语音信息是否为所述第三唤醒词;
若是,转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备;
否则,转换到所述场景唤醒语法,确认所述语音信息是否为所述第三非唤醒词;
若所述语音信息为所述第三非唤醒词,则转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备;
否则,转换到所述默认唤醒语法继续保持所述休眠状态,直到激活所述语音设备为止。
一种基于语音识别的设置装置,该装置包括:
获取模块,用于获取每个预设场景下的第一唤醒词和第一非唤醒词;
处理模块,用于对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同;
设置模块,用于将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
优选的,所述获取模块,包括:
统计子模块,用于统计与所述语音识别相关联的所有预设场景;
采集子模块,用于采集每个所述预设场景内的第一唤醒词和第一非唤醒词;
其中,所述第一非唤醒词包括在多个所述预设场景内的对话内容中的关键词。
优选的,所述处理模块,包括:
第一确认子模块,用于确认每个所述预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
第一输出子模块,用于输出所述第一确认子模块确认的满足所述预设条件的第二唤醒词和第二非唤醒词;
第一修改子模块,用于修改所述确认子模块确认的不满足所述预设条件的第一唤醒词和第一非唤醒词直到满足所述预设条件,并输出满足所述预设条件的第二唤醒词和第二非唤醒词;
第二确认子模块,用于确认所述第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
第二输出子模块,用于输出所述第二确认子模块确认的满足发音序列分数不小于所述预设分数的第三唤醒词和第三非唤醒词;
第二修改子模块,用于修改所述第二确认子模块确认的不满足发音序列分数不小于所述预设分数的第二唤醒词和第二非唤醒词直到发音序列分数不小于所述预设分数,并输出不小于所述预设分数的第三唤醒词和第三非唤醒词;
保存子模块,用于保存输出的所述第三唤醒词和第三非唤醒词。
优选的,所述设置模块在将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,还用于:
启动语音设备,并根据所述语音设备预先设置好的预设状态,设置所述语音设备在预设场景中对应的识别语法;
当所述语音设备状态为休眠状态时,设置的所述识别语法为所述预设语法中的默认唤醒语法;
当所述语音设备状态为场景休眠状态时,设置的所述识别语法为所述预设语法中的场景唤醒语法;
当所述语音设备状态为唤醒状态时,设置的所述识别语法为所述预设语法中的默认识别语法。
优选的,所述设置模块,包括:
输入子模块,用于将所述第三唤醒词输入到所述默认唤醒语法中,将所述第三非唤醒词输入到所述场景唤醒语法中,同时将所述第三唤醒词和第三非唤醒词输入到所述默认识别语法中;
启动子模块,用于当接收到用户发出的语音信息时,控制所述语音设备处于休眠状态,并启动所述默认唤醒语法;
第三确认子模块,用于基于默认唤醒语法,确认所述语音信息是否为所述第三唤醒词;
第一转换子模块,用于当所述第三确认子模块确认所述语音信息为所述第三唤醒词时,转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备,否则,转换到所述场景唤醒语法中确认所述语音信息是否为所述第三非唤醒词;
第二转换子模块,用于确认所述语音信息为所述第三非唤醒词时,转换到所述默认识别语法进行识别,识别成功后激活所述语音设备;否则,转换到所述默认唤醒语法继续保持所述休眠状态,直到激活所述语音设备为止。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中,
图1为本发明所提供的一种基于语音识别的设置方法的工作流程图;
图2为本发明所提供的一种基于语音识别的设置方法的另一工作流程图;
图3为本发明所提供的一种基于语音识别的设置方法的工作流程截图;
图4为本发明所提供的一种基于语音识别的设置装置的结构图;
图5为本发明所提供的一种基于语音识别的设置装置的另一结构图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
语音唤醒是指用户通过说出唤醒词来唤醒电子语音设备,使电子语音设备进入到等待语音指令的状态,或者使电子语音设备直接执行预定的语音指令,现有技术中种语音识别的唤醒词及非唤醒词的设置方法需要保证能够识别大量的语音识别命令。这一般会用到多个识别语法,不同的识别语法之间允许有发音重叠的唤醒词和非唤醒词,同一个语法内不允许有发音相近的唤醒词和命令词;同一个语法内,在设置唤醒词、非唤醒词时,需要保证各个词条的发音差异较大、词条音素易于识别。从而提高所有指令的识别准确率。这种方法存在以下缺点:由于要保持唤醒词和非唤醒词的词条发音差异较大,所以用户为了方便一般都只设置一种唤醒词,但是在一些特定的场景中,用户说出其他非唤醒词时语音设备还是保持休眠状态,无法立即为用户服务,影响了用户的体验感。为了解决上述问题,本实施例公开了一种基于获取每个预设场景下的唤醒词和非唤醒词,将获取的唤醒词和非唤醒词做调整处理以使得二者在同一场景下的的发音不同,然后将二者设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中进而来唤醒语音设备的设置方法。
一种基于语音识别的设置方法,如图1所示,包括:
步骤S101、获取每个预设场景下的第一唤醒词和第一非唤醒词;
步骤S102、对每个预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个预设场景下的第一唤醒词和第一非唤醒词的发音不同;
步骤S103、将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
上述技术方案的工作原理为:获取每个预设场景下的第一唤醒词和第一非唤醒词并对它们进行调整处理,使得同个预设场景下的第一唤醒词和第一非唤醒词的发音不同,将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
上述技术方案的有益效果为:通过将每个预设场景下的第一唤醒词和第一非唤醒词进行调整处理,并且设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中可以使得用户可在不同的场景的使用不同的第一唤醒词和第一非唤醒词解锁语音设备,并且对上述第一唤醒词和第一非唤醒词做处理以保证在同一预设场景下不会出现误解锁或者无法解锁的现象,提高了额稳定性,增强了用户的体验感。
在一个实施例中,如图2所示,获取每个预设场景下的第一唤醒词和第一非唤醒词,包括:
步骤S201、统计与语音识别相关联的所有预设场景;
步骤S202、采集每个预设场景内的第一唤醒词和第一非唤醒词;
其中,第一非唤醒词包括在多个所述预设场景内的对话内容中的关键词。
上述技术方案的有益效果为:通过统计所有的预设场景以应对在不同的外部环境下都可以实现唤醒,提高了唤醒语音设备的概率。
在一个实施例中,对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个预设场景下的第一唤醒词和第一非唤醒词的发音不同,包括:
确认每个预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
若是,输出第二唤醒词和第二非唤醒词;
否则,修改第一唤醒词和第一非唤醒词直到满足预设条件,并输出满足预设条件的第二唤醒词和第二非唤醒词;
确认第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
若是,则输出第三唤醒词和第三非唤醒词;
否则,修改第二唤醒词和第二非唤醒词直到发音序列分数不小于预设分数,并输出不小于预设分数的第三唤醒词和第三非唤醒词;
保存输出的第三唤醒词和第三非唤醒词;
特别的,上述第一唤醒词和第一非唤醒词包括所有采集的唤醒词和非唤醒词,第二唤醒词和第二非唤醒词是在第一唤醒词和第一非唤醒词的基础上经过筛选和修改而得到的,第二唤醒词和第二非唤醒词的数量可以等同于全部第一唤醒词和第一非唤醒词的数量,也可以等同于部分第一唤醒词和第一非唤醒词,取决于用户是否愿意修改词条。同理,第三唤醒词和第三非唤醒词是在第二唤醒词和第二非唤醒词的技术上筛选和修改得到的,其数量可以是全部的第二唤醒词和非唤醒词的数量,也可以是部分的第二唤醒词和第二非唤醒词。
上述预设条件为:(1)采集目标必须最少包含三个中文汉字,最多包含五个汉字。(2)可以不包含英文单词,最多一个英文单词。即同时满足上述预设条件的唤醒词和非唤醒词才能作为第二唤醒词和第二非唤醒词输出,上述发音序列分数的打分流程具体可以为:将第二唤醒词和第二非唤醒词解析为声母加韵母的发音序列,设定每个词条和其他词条的发音序列不能完全相同,预定第二唤醒词和第二非唤醒词的每个词条的初始分数为10分,上述词条可以为两个字、三个字或者四个字,若发现两个词条中出现声母或者韵母叠音的情况,每个词条扣除4分,若词条中出现了闭口音,扣除2分,若词条中出现英文单词,扣除2分,根据上述条件计算第二唤醒词和第二非唤醒词每个词条的整体分时,上述预设分数可以为6分,即第二唤醒词和第二非唤醒词语音序列的分数必须大于等于6分才可以作为第三唤醒词输出。
上述技术方案的有益效果为:通过两次筛选和修改使用户设置发音不同的唤醒词和非唤醒词,可以使用多种唤醒词来解锁语音设备,同时也避免出现误唤醒的现象。
在一个实施例中,在将调整处理后的第一唤醒词和第一非唤醒词设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,设置方法还包括:
启动语音设备,并根据语音设备预先设置好的预设状态,设置语音设备在预设场景中对应的识别语法;
当语音设备状态为休眠状态时,设置的识别语法为预设语法中的默认唤醒语法;
当语音设备状态为场景休眠状态时,设置的识别语法为预设语法中的场景唤醒语法;
当语音设备状态为唤醒状态时,设置的识别语法为预设语法中的默认识别语法。
上述技术方案的有益效果为:根据语音设备状态的不同来设置不同的唤醒语法和识别语法,可以针对用户所处场景的不同来自由切换唤醒语法,进而避免了用户唤醒语音设备的单一性,使得用户在不同的场景下可以使用不同的唤醒词来解锁语音设备,进一步地提高了用户的体验感。
在一个实施例中,将调整处理后的第一唤醒词和第一非唤醒词设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中,包括:
将第三唤醒词输入到默认唤醒语法中,将第三非唤醒词输入到场景唤醒语法中,同时将第三唤醒词和第三非唤醒词输入到默认识别语法中;
当接收到用户发出的语音信息时,控制语音设备处于休眠状态,并启动默认唤醒语法;
基于所述默认唤醒语法,确认语音信息是否为第三唤醒词;
若是,转换到默认识别语法中进行识别,识别成功后激活语音设备;
否则,转换到场景唤醒语法中确认语音信息是否为第三非唤醒词;
若语音信息为第三非唤醒词,则转换到默认识别语法中进行识别,识别成功后激活所述语音设备;
否则,转换到默认唤醒语法继续保持休眠状态,直到激活语音设备为止;
在本实施例中,假设用户处于开车状态,此时想听歌放松一下,但是他设置的唤醒词为“你好,小芳”,非唤醒词为“放音乐”,用户随口一说放音乐,此时默认唤醒语法识别到用户发出的语音信息为非唤醒词,然后转到场景唤醒语法中中确定用户的语音信息为非唤醒词为“放音乐”,再转到默认识别语法中解锁语音设备并且执行对应的音乐播放功能。
上述技术方案的有益效果为:在用户发出声音信息时,可以对上述语音信息使用不同的语法进行识别进而确定用户发出的语音信息是否为唤醒词和非唤醒词,避免了现有技术中由于用户设置唤醒词单一的情况语音设备对非唤醒词不予感应一直保持休眠状态的情况,提高了实时性。
在一个实施例中,如图3所示,包括:
1.评估和统计语音识别涉及到的场景,比如中央控制语音设备会涉及到音箱、购物、家电等等场景。分别汇总各个场景下的唤醒词和非唤醒词;
2.分别对各个场景下的唤醒词和非唤醒词发音的音素进行评估,调整发音相似的唤醒词或者非唤醒词,使得每一个唤醒词和非唤醒词发音尽可能不同;调整方法如下:
a)录入所有的唤醒词和非唤醒词,词条的规则必须满足以下形式:
i.最少包含三个中文汉字,最多包含五个汉字;
ii.可以不包含英文单词,最多一个英文单词;
如果有词条不满足上述规则,建议修改此词条,否则进入步骤b;
b)解析所有的中文词条的发音,组织成声母+韵母(不论声调,以下均是)的序列,词条必须满足以下形式:
i.根据以下规则对词条打分,每个词条初始10分,如果出现词发音重叠的情况,扣4分(如:你ni 3好hao 3尼ni 2浩hao 4);发音中包含闭口音,扣2分;另外词条包含英文单词,扣2分,6分及格,词条打分结果必须大于等于6分;
ii.每个词条的发音序列和其他词条不完全重复;
如果有词条不满足上述规则,建议修改此词条。否则进入步骤3。
3.设置各个状态之间可以自由切换的唤醒词、非唤醒词,并设置到语法中;图3中描述了6种状态转换,分别设置这6种状态转换对应的唤醒词和非唤醒词。
上述技术方案的工作原理和有益效果为:本方法将唤醒词、非唤醒词对应的语法很好的区分开,从而可以保证设置唤醒词时,能够获取较高质量的发音词条,为语音识别带来显著的提升,从而大幅降低误唤醒、误识别的概率。
本实施例还提供了一种基于语音识别的设置装置,如图4所示,该装置包括:
获取模块401,用于获取每个预设场景下的第一唤醒词和第一非唤醒词;
处理模块402,用于对每个预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个预设场景下的第一唤醒词和第一非唤醒词的发音不同;
设置模块403,用于将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
在一个实施例中,获取模块,包括:
统计子模块,用于统计与语音识别相关联的所有预设场景;
采集子模块,用于采集每个预设场景内的第一唤醒词和第一非唤醒词;
其中,第一非唤醒词包括在多个预设场景内的对话内容中的关键词。
在一个实施例中,处理模块,包括:
第一确认子模块,用于确认每个预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
第一输出子模块,用于输出第一确认子模块确认的满足预设条件的第二唤醒词和第二非唤醒词;
第一修改子模块,用于修改确认子模块确认的不满足预设条件的第一唤醒词和第一非唤醒词直到满足预设条件,并输出满足预设条件的第二唤醒词和第二非唤醒词;
第二确认子模块,用于确认第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
第二输出子模块,用于输出第二确认子模块确认的满足发音序列分数不小于预设分数的第三唤醒词和第三非唤醒词;
第二修改子模块,用于修改第二确认子模块确认的不满足发音序列分数不小于预设分数的第二唤醒词和第二非唤醒词直到发音序列分数不小于预设分数,并输出不小于预设分数的第三唤醒词和第三非唤醒词;
保存子模块,用于保存输出的第三唤醒词和第三非唤醒词。
在一个实施例中,设置模块在将调整处理后的第一唤醒词和第一非唤醒词设置到对应的预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,还用于:
启动语音设备,并根据所述语音设备预先设置好的预设状态,设置所述语音设备在预设场景中对应的识别语法;
当语音设备状态为休眠状态时,设置的识别语法为预设语法中的默认唤醒语法;
当语音设备状态为场景休眠状态时,设置的识别语法为预设语法中的场景唤醒语法;
当语音设备状态为唤醒状态时,设置的识别语法为预设语法中的默认识别语法。
在一个实施例中,如图5所示,设置模块,包括:
输入子模块4031,用于将第三唤醒词输入到默认唤醒语法中,将第三非唤醒词输入到场景唤醒语法中,同时将第三唤醒词和第三非唤醒词输入到默认识别语法中;
启动子模块4032,用于当接收到用户发出的语音信息时,控制语音设备处于休眠状态,并启动默认唤醒语法;
第三确认子模块4033,基于默认唤醒语法,确认语音信息是否为第三唤醒词;
第一转换子模块4034,用于当第三确认子模块确认语音信息为第三唤醒词时,转换到默认识别语法中进行识别,识别成功后激活语音设备,否则,转换到场景唤醒语法中确认语音信息是否为第三非唤醒词;
第二转换子模块4035,用于确认语音信息为第三非唤醒词时,转换到默认识别语法进行识别,识别成功后激活所述语音设备;否则,转换到默认唤醒语法继续保持休眠状态,直到激活语音设备为止。
本领域技术人员应当理解的是,本发明中的第一、第二指的是不同应用阶段而已。
本领域技术用户员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于语音识别的设置方法,其特征在于,包括:
获取每个预设场景下的第一唤醒词和第一非唤醒词;
对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同;
将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
2.根据权利要求1所述的设置方法,其特征在于,所述获取每个预设场景下的第一唤醒词和第一非唤醒词,包括:
统计与所述语音识别相关联的所有预设场景;
采集每个所述预设场景内的第一唤醒词和第一非唤醒词;
其中,所述第一非唤醒词包括在多个所述预设场景内的对话内容中的关键词。
3.根据权利要求1所述的设置方法,其特征在于,所述对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同,包括:
确认每个所述预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
若是,输出第二唤醒词和第二非唤醒词;
否则,修改所述第一唤醒词和第一非唤醒词直到满足所述预设条件,并输出满足所述预设条件的第二唤醒词和第二非唤醒词;
确认所述第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
若是,则输出第三唤醒词和第三非唤醒词;
否则,修改所述第二唤醒词和第二非唤醒词直到发音序列分数不小于所述预设分数,并输出不小于所述预设分数的第三唤醒词和第三非唤醒词;
保存输出的所述第三唤醒词和第三非唤醒词。
4.根据权利要求1所述的设置方法,其特征在于,在所述将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,所述设置方法还包括:
启动语音设备,并根据所述语音设备预先设置好的预设状态,设置所述语音设备在预设场景中对应的识别语法;
当所述预设状态为休眠状态时,设置的所述识别语法为所述预设语法中的默认唤醒语法;
当所述预设状态为场景休眠状态时,设置的所述识别语法为所述预设语法中的场景唤醒语法;
当所述预设状态为唤醒状态时,设置的所述识别语法为所述预设语法中的默认识别语法。
5.根据权利要求3述的设置方法,其特征在于,所述将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中,包括:
将所述第三唤醒词输入到所述默认唤醒语法中,将所述第三非唤醒词输入到所述场景唤醒语法中,同时将所述第三唤醒词和第三非唤醒词输入到所述默认识别语法中;
当接收到用户发出的语音信息时,控制所述语音设备处于休眠状态,并启动所述默认唤醒语法;
基于所述默认唤醒语法,确认所述语音信息是否为所述第三唤醒词;
若是,转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备;
否则,转换到所述场景唤醒语法,确认所述语音信息是否为所述第三非唤醒词;
若所述语音信息为所述第三非唤醒词,则转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备;
否则,转换到所述默认唤醒语法继续保持所述休眠状态,直到激活所述语音设备为止。
6.一种基于语音识别的设置装置,其特征在于,该装置包括:
获取模块,用于获取每个预设场景下的第一唤醒词和第一非唤醒词;
处理模块,用于对每个所述预设场景下的第一唤醒词和第一非唤醒词进行调整处理,使得同个所述预设场景下的第一唤醒词和第一非唤醒词的发音不同;
设置模块,用于将调整处理后的第一唤醒词和第一非唤醒词,设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中。
7.根据权利要求6所述的设置装置,其特征在于,所述获取模块,包括:
统计子模块,用于统计与所述语音识别相关联的所有预设场景;
采集子模块,用于采集每个所述预设场景内的第一唤醒词和第一非唤醒词;
其中,所述第一非唤醒词包括在多个所述预设场景内的对话内容中的关键词。
8.根据权利要求6所述的设置装置,其特征在于,所述处理模块,包括:
第一确认子模块,用于确认每个所述预设场景下的所述第一唤醒词和第一非唤醒词是否满足预设条件;
第一输出子模块,用于输出所述第一确认子模块确认的满足所述预设条件的第二唤醒词和第二非唤醒词;
第一修改子模块,用于修改所述确认子模块确认的不满足所述预设条件的第一唤醒词和第一非唤醒词直到满足所述预设条件,并输出满足所述预设条件的第二唤醒词和第二非唤醒词;
第二确认子模块,用于确认所述第二唤醒词和第二非唤醒词的发音序列分数是否不小于预设分数;
第二输出子模块,用于输出所述第二确认子模块确认的满足发音序列分数不小于所述预设分数的第三唤醒词和第三非唤醒词;
第二修改子模块,用于修改所述第二确认子模块确认的不满足发音序列分数不小于所述预设分数的第二唤醒词和第二非唤醒词直到发音序列分数不小于所述预设分数,并输出不小于所述预设分数的第三唤醒词和第三非唤醒词;
保存子模块,用于保存输出的所述第三唤醒词和第三非唤醒词。
9.根据权利要求6所述的设置装置,其特征在于,所述设置模块在将调整处理后的第一唤醒词和第一非唤醒词设置到对应的所述预设场景下的可自由切换的预设数目个预设状态对应的预设语法中之前,还用于:
启动语音设备,并根据所述语音设备预先设置好的预设状态,设置所述语音设备在预设场景中对应的识别语法;
当所述语音设备状态为休眠状态时,设置的所述识别语法为所述预设语法中的默认唤醒语法;
当所述语音设备状态为场景休眠状态时,设置的所述识别语法为所述预设语法中的场景唤醒语法;
当所述语音设备状态为唤醒状态时,设置的所述识别语法为所述预设语法中的默认识别语法。
10.根据权利要求8所述的设置装置,其特征在于,所述设置模块,包括:
输入子模块,用于将所述第三唤醒词输入到所述默认唤醒语法中,将所述第三非唤醒词输入到所述场景唤醒语法中,同时将所述第三唤醒词和第三非唤醒词输入到所述默认识别语法中;
启动子模块,用于当接收到用户发出的语音信息时,控制所述语音设备处于休眠状态,并启动所述默认唤醒语法;
第三确认子模块,用于基于所述默认唤醒语法,确认所述语音信息是否为所述第三唤醒词;
第一转换子模块,用于当所述第三确认子模块确认所述语音信息为所述第三唤醒词时,转换到所述默认识别语法中进行识别,识别成功后激活所述语音设备,否则,转换到所述场景唤醒语法中确认所述语音信息是否为所述第三非唤醒词;
第二转换子模块,用于确认所述语音信息为所述第三非唤醒词时,转换到所述默认识别语法进行识别,识别成功后激活所述语音设备;否则,转换到所述默认唤醒语法继续保持所述休眠状态,直到激活所述语音设备为止。
CN201911410717.2A 2019-12-31 2019-12-31 一种基于语音识别的设置方法及装置 Pending CN111128171A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911410717.2A CN111128171A (zh) 2019-12-31 2019-12-31 一种基于语音识别的设置方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911410717.2A CN111128171A (zh) 2019-12-31 2019-12-31 一种基于语音识别的设置方法及装置

Publications (1)

Publication Number Publication Date
CN111128171A true CN111128171A (zh) 2020-05-08

Family

ID=70506368

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911410717.2A Pending CN111128171A (zh) 2019-12-31 2019-12-31 一种基于语音识别的设置方法及装置

Country Status (1)

Country Link
CN (1) CN111128171A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527236A (zh) * 2020-12-23 2021-03-19 北京梧桐车联科技有限责任公司 语音模式控制方法、装置和存储介质
CN113571042A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 一种用于车载式语音识别系统

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332265A (zh) * 2011-06-20 2012-01-25 浙江吉利汽车研究院有限公司 一种提高汽车声控系统语音识别率的方法
CN103292437A (zh) * 2013-06-17 2013-09-11 广东美的制冷设备有限公司 语音交互式空调器及其控制方法
CN106847273A (zh) * 2016-12-23 2017-06-13 北京云知声信息技术有限公司 语音识别的唤醒词选择方法及装置
CN108536668A (zh) * 2018-02-26 2018-09-14 科大讯飞股份有限公司 唤醒词评估方法及装置、存储介质、电子设备
CN109036428A (zh) * 2018-10-31 2018-12-18 广东小天才科技有限公司 一种语音唤醒设备、方法及计算机可读存储介质
CN109493849A (zh) * 2018-12-29 2019-03-19 联想(北京)有限公司 语音唤醒方法、装置及电子设备
CN109545207A (zh) * 2018-11-16 2019-03-29 广东小天才科技有限公司 一种语音唤醒方法及装置
CN110047487A (zh) * 2019-06-05 2019-07-23 广州小鹏汽车科技有限公司 车载语音设备的唤醒方法、装置、车辆以及机器可读介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102332265A (zh) * 2011-06-20 2012-01-25 浙江吉利汽车研究院有限公司 一种提高汽车声控系统语音识别率的方法
CN103292437A (zh) * 2013-06-17 2013-09-11 广东美的制冷设备有限公司 语音交互式空调器及其控制方法
CN106847273A (zh) * 2016-12-23 2017-06-13 北京云知声信息技术有限公司 语音识别的唤醒词选择方法及装置
CN108536668A (zh) * 2018-02-26 2018-09-14 科大讯飞股份有限公司 唤醒词评估方法及装置、存储介质、电子设备
CN109036428A (zh) * 2018-10-31 2018-12-18 广东小天才科技有限公司 一种语音唤醒设备、方法及计算机可读存储介质
CN109545207A (zh) * 2018-11-16 2019-03-29 广东小天才科技有限公司 一种语音唤醒方法及装置
CN109493849A (zh) * 2018-12-29 2019-03-19 联想(北京)有限公司 语音唤醒方法、装置及电子设备
CN110047487A (zh) * 2019-06-05 2019-07-23 广州小鹏汽车科技有限公司 车载语音设备的唤醒方法、装置、车辆以及机器可读介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112527236A (zh) * 2020-12-23 2021-03-19 北京梧桐车联科技有限责任公司 语音模式控制方法、装置和存储介质
CN113571042A (zh) * 2021-07-22 2021-10-29 成都航盛智行科技有限公司 一种用于车载式语音识别系统
CN113571042B (zh) * 2021-07-22 2023-12-01 成都航盛智行科技有限公司 一种用于车载式语音识别系统

Similar Documents

Publication Publication Date Title
US11720326B2 (en) Audio output control
US11657804B2 (en) Wake word detection modeling
US11605374B2 (en) Method and device for providing voice recognition service
US11061644B2 (en) Maintaining context for voice processes
US9972318B1 (en) Interpreting voice commands
US11232808B2 (en) Adjusting speed of human speech playback
US11551685B2 (en) Device-directed utterance detection
US9015048B2 (en) Incremental speech recognition for dialog systems
US11184412B1 (en) Modifying constraint-based communication sessions
CN109584860B (zh) 一种语音唤醒词定义方法和系统
US8600749B2 (en) System and method for training adaptation-specific acoustic models for automatic speech recognition
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
WO2020098756A1 (zh) 一种基于情感的语音交互方法、存储介质及终端设备
US11579841B1 (en) Task resumption in a natural understanding system
WO2021169711A1 (zh) 指令执行方法、装置、存储介质及电子设备
CN111128171A (zh) 一种基于语音识别的设置方法及装置
WO2022271435A1 (en) Interactive content output
CN113611316A (zh) 人机交互方法、装置、设备以及存储介质
JP2002215187A (ja) 音声認識方法及びその装置
CN110099295A (zh) 电视机语音控制方法、装置、设备及存储介质
JP4798039B2 (ja) 音声対話装置および方法
US11914923B1 (en) Computer system-based pausing and resuming of natural language conversations
WO2023107244A1 (en) Multiple wakeword detection
US12001260B1 (en) Preventing inadvertent wake in a speech-controlled device
JP2011175304A (ja) 音声対話装置および方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200508