CN109003607B - 语音识别方法、装置、存储介质及电子设备 - Google Patents

语音识别方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN109003607B
CN109003607B CN201810764411.6A CN201810764411A CN109003607B CN 109003607 B CN109003607 B CN 109003607B CN 201810764411 A CN201810764411 A CN 201810764411A CN 109003607 B CN109003607 B CN 109003607B
Authority
CN
China
Prior art keywords
voice recognition
matching degree
degree threshold
threshold
recognition matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810764411.6A
Other languages
English (en)
Other versions
CN109003607A (zh
Inventor
陈岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201810764411.6A priority Critical patent/CN109003607B/zh
Publication of CN109003607A publication Critical patent/CN109003607A/zh
Application granted granted Critical
Publication of CN109003607B publication Critical patent/CN109003607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72451User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to schedules, e.g. using calendar applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • H04M1/72457User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions according to geographic location
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephone Function (AREA)
  • Navigation (AREA)

Abstract

本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,所述语音识别方法包括:接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。所述语音识别方法中,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。

Description

语音识别方法、装置、存储介质及电子设备
技术领域
本申请涉及语音识别技术领域,特别涉及一种语音识别方法、装置、存储介质及电子设备。
背景技术
随着电子技术的快速发展,诸如智能手机等电子设备的功能越来越丰富。例如,用户可以通过语音对电子设备进行控制,以执行电子设备的各种功能。
用户对电子设备进行语音控制时,电子设备首先需要对用户的语音进行识别。而在用户频繁使用语音控制功能的场合,电子设备每次都进行同样的语音识别,会导致语音识别的效率降低。
发明内容
本申请实施例提供一种语音识别方法、装置、存储介质及电子设备,可以提高电子设备进行语音识别时的效率。
本申请实施例提供一种语音识别方法,包括:
接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;
将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
本申请实施例还提供一种语音识别装置,包括:
第一获取模块,用于在接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
第二获取模块,用于根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;
匹配模块,用于将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
执行模块,用于当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述语音识别方法。
本申请实施例还提供一种电子设备,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行上述语音识别方法。
本申请实施例还提供一种电子设备,包括处理器以及与所述处理器电性连接的麦克风,其中:
所述麦克风,用于接收用户输入的语音信息;
所述处理器,用于:
获取所述电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;
将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
本申请实施例提供的语音识别方法,包括:接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。所述语音识别方法中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,电子设备获取到的语音识别匹配度阈值可以是不同的。因此,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为用户对电子设备进行语音控制的示意图。
图2为本申请实施例提供的语音识别方法的第一种流程示意图。
图3为本申请实施例提供的语音识别方法的第二种流程示意图。
图4为本申请实施例提供的语音识别方法的第三种流程示意图。
图5为本申请实施例提供的语音识别方法的第四种流程示意图。
图6为本申请实施例提供的语音识别装置的结构示意图。
图7为本申请实施例提供的语音识别装置的另一结构示意图。
图8为本申请实施例提供的电子设备的结构示意图。
图9为本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
本申请的说明书和权利要求书以及上述附图中的术语“第一”、“第二”、“第三”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应当理解,这样描述的对象在适当情况下可以互换。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。例如,包含了一系列步骤的过程、方法或包含了一系列模块或单元的装置、电子设备、系统不必限于清楚地列出的那些步骤或模块或单元,还可以包括没有清楚地列出的步骤或模块或单元,也可以包括对于这些过程、方法、装置、电子设备或系统固有的其它步骤或模块或单元。
参考图1,图1为用户对电子设备进行语音控制的示意图。其中,用户输出一段语音,电子设备采集用户的语音信息。随后,电子设备将采集到的语音信息与电子设备中存储的语音识别模型进行比较。当语音信息与语音识别模型吻合时,电子设备从语音信息中识别出控制指令。随后,电子设备执行与所述控制指令对应的操作,例如亮屏、开启应用、退出应用、锁屏等操作,从而实现用户对电子设备的语音控制。
本申请实施例提供一种语音识别方法,所述语音识别方法可以应用于电子设备中。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备等。
如图2所示,所述语音识别方法,可以包括以下步骤:
110,接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长。
电子设备开启语音识别功能后,电子设备可以持续采集用户的语音信息。例如,电子设备中可以设置有麦克风,电子设备可以通过麦克风采集用户输入的语音信息。其中,用户的语音信息为用户向电子设备输入的一段语句。所述语音信息用于对电子设备进行语音控制。所述语音信息中可以包括一个或多个指令,例如“锁屏”、“增大音量”等指令。
电子设备每次语音识别成功后,可以记录进行语音识别的时间。例如,电子设备可以通过日志的方式记录每次成功进行语音识别时的时间。
当电子设备接收到用户输入的语音信息时,电子设备可以获取前次语音识别成功的时刻。其中,电子设备前次语音识别成功指的是电子设备距离当前时刻最近的一次成功进行语音识别。
电子设备可以获取当前的时刻,并根据当前时刻与电子设备前次语音识别成功的时刻计算所述前次语音识别成功的时刻距离当前时刻之间的时长。例如,电子设备计算得到的时长可以为30min(分钟)。
120,根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
电子设备中可以预先设置时长与语音识别匹配度阈值之间的对应关系。其中,所述时长表示电子设备前次语音识别成功的时刻与当前进行语音识别的时刻之间的时长。
所述语音识别匹配度阈值表示语音信息与语音识别模型匹配成功或者匹配失败之间的分界线。当语音信息与电子设备中预先设置的语音识别模型之间的匹配度大于语音识别匹配度阈值时,表示所述语音信息与所述语音识别模型匹配成功,也即语音识别成功。当语音信息与电子设备中预先设置的语音识别模型之间的匹配度小于或等于语音识别匹配度阈值时,表示所述语音信息与所述语音识别模型匹配失败,也即语音识别失败。
由于用户在频繁使用电子设备的语音识别功能时,也即用户使用电子设备的语音识别功能的频率较高时,电子设备相邻两次语音识别之间的时间间隔较短。此时,电子设备每次都需要进行同样的语音识别,导致耗费较多的时间。
而当用户使用电子设备的语音识别功能的频率较低时,电子设备相邻两次语音识别之间的时间间隔较长。此时,电子设备进行语音识别时,更多地需要保证语音识别的准确性。
因此,在上述对应关系中,所述时长越长时,所述时长对应的语音识别匹配度阈值越大;所述时长越短时,所述时长对应的语音识别匹配度阈值越小。
电子设备获取到前次语音识别成功的时刻距离当前时刻之间的时长后,即可根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
130,将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度。
电子设备可以将接收到的语音信息与电子设备中预先设置的语音识别模型进行匹配,以得到所述语音信息与所述语音识别模型之间的匹配度。其中,匹配度表示所述语音信息与所述语音识别模型之间的相似程度或吻合程度。
其中,所述预设语音识别模型可以为用户首次启用电子设备的语音识别功能时,电子设备采集用户的训练语音信息,并根据所述训练语音信息生成的语音识别模型。
140,当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
电子设备得到所述语音信息与所述预设语音识别模型之间的语音识别匹配度后,可以将所述语音识别匹配度与所述语音识别匹配度阈值进行比较,以判断所述语音识别匹配度与所述语音识别匹配度阈值之间的大小关系。
当所述语音识别匹配度大于所述语音识别匹配度阈值时,表示所述语音信息与所述预设语音识别模型匹配成功。随后,电子设备可以对所述语音信息进行进一步分析,以获取所述语音信息中包含的控制指令,并执行与所述指令对应的操作,例如控制电子设备锁屏、控制电子设备增大音量等。
当所述语音识别匹配度不大于所述语音识别匹配度阈值时,表示所述语音信息与所述预设语音识别模型匹配失败。此时,电子设备可以拒绝对所述语音信息进行响应。
本申请实施例中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,电子设备获取到的语音识别匹配度阈值可以是不同的。因此,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
在一些实施例中,如图3所示,步骤120、根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值,包括以下步骤:
121,判断所述时长是否小于预设时长阈值;
122,若所述时长小于所述预设时长阈值,则获取第一语音识别匹配度阈值;若所述时长不小于所述预设时长阈值,则获取第二语音识别匹配度阈值。
其中,电子设备中可以预先设置一个预设时长阈值。所述预设时长阈值为一个时长值。例如,所述预设时长阈值可以为30min(分钟)。
电子设备获取到前次语音识别成功的时刻距离当前时刻之间的时长后,可以将获取到的时长与所述预设时长阈值进行比较,以判断所述时长是否小于预设时长阈值。
若所述时长小于所述预设时长阈值,说明电子设备前次语音识别成功的时刻距离当前时刻较近,也即电子设备进行语音识别的频率较高。此时,电子设备获取第一语音识别匹配度阈值。所述第一语音识别匹配度阈值可以为预先设置在电子设备中的一个数值。所述第一语音识别匹配度阈值较小,例如所述第一语音识别匹配度阈值可以为80%。
若所述时长不小于所述预设时长阈值,说明电子设备前次语音识别成功的时刻距离当前时刻较远,也即电子设备进行语音识别的频率较低。此时,电子设备获取第二语音识别匹配度阈值。所述第二语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。其中,所述第二语音识别匹配度阈值较大,所述第二语音识别匹配度阈值大于所述第一语音识别匹配度阈值。例如所述第二语音识别匹配度阈值可以为90%。
在一些实施例中,如图4所示,步骤120、根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值,包括以下步骤:
123,确定所述时长所处的时长区间;
124,根据所述时长区间以及时长区间与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
其中,电子设备中可以针对时长预先设置多个时长区间。例如,电子设备中可以设置以下多个时长区间(时长单位为min):(0,20]、(20,40]、(40,60]等。此外,电子设备中还可以为每个时长区间预先设置一个对应的语音识别匹配度阈值,以形成时长区间与语音识别匹配度阈值之间的对应关系。例如,时长区间与语音识别匹配度阈值之间的对应关系可以为如表1所示:
表1
时长区间(单位min) 语音识别匹配度阈值
(0,20] 70%
(20,40] 80%
(40,60] 90%
…… ……
电子设备获取到前次语音识别成功的时刻距离当前时刻之间的时长后,可以确定所述时长所处的时长区间,随后根据所述时长区间以及时长区间与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
例如,电子设备获取到的时长为30min,则所述时长所处的时长区间为(20,40]。随后,电子设备可以获取到对应的语音识别匹配度阈值为80%。
在一些实施例中,如图5所示,步骤120、根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值之前,还包括以下步骤:
150,判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
步骤120、根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值,包括以下步骤:
125,根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
电子设备中设置有定位系统。例如,电子设备可以包括GPS(GlobalPositioningSystem,全球定位系统)、BDS(BeiDou Navigation Satellite System,北斗卫星导航系统)等定位系统。
电子设备接收到用户输入的语音信息时,可以通过定位系统获取当前自身所处的第一地理位置。
此外,电子设备每次语音识别成功后,可以记录进行语音识别时电子设备所处的地理位置。例如,电子设备可以通过日志的方式记录每次成功进行语音识别时所处的地理位置。
电子设备接收到用户输入的语音信息时,可以通过记录的数据获取前次语音识别成功时所处的地理位置。电子设备前次语音识别成功时所处的地理位置为第二地理位置。
其中,所述第一地理位置、第二地理位置均可以包括地理位置的坐标信息或者地理位置的区域信息等。地理位置的坐标信息例如可以包括地理位置的经度、纬度等信息。地理位置的区域信息例如可以包括地理位置所处的街道、小区、超市、地铁站等信息。
随后,电子设备可以将所述第一地理位置与所述第二地理位置进行比较,以判断所述第一地理位置与所述第二地理位置是否相同,以得到判断结果。其中,所述判断结果可以包括所述第一地理位置与所述第二地理位置相同、所述第一地理位置与所述第二地理位置不同。
此外,电子设备中可以预先设置时长、判断结果与语音识别匹配度阈值之间的对应关系。其中,所述时长与电子设备前次语音识别成功的时刻距离当前时刻之间的时长对应,所述判断结果与所述第一地理位置与所述第二地理位置是否相同的判断结果对应。
电子设备可以根据前次语音识别成功的时刻距离当前时刻之间的时长、所述第一地理位置与所述第二地理位置是否相同的判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
在一些实施例中,步骤125、根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值,包括以下步骤:
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值。
其中,电子设备可以将所述时长与预设时长进行比较,以判断所述时长是否小于所述预设时长。
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,说明电子设备进行语音识别的频率较高,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比未发生改变。此时,电子设备获取第三语音识别匹配度阈值。所述第三语音识别匹配度阈值为设置在电子设备中的一个数值。所述第三语音识别匹配度阈值较小。例如,所述第三语音识别匹配度阈值可以为65%。
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,说明电子设备进行语音识别的频率较高,但电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比发生了改变。此时,电子设备获取第四语音识别匹配度阈值。所述第四语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值。例如,所述第四语音识别匹配度阈值可以为75%。
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,说明电子设备进行语音识别的频率较低,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比未发生改变。此时,电子设备获取第五语音识别匹配度阈值。所述第五语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值。例如,所述第五语音识别匹配度阈值可以为85%。其中,所述第五语音识别匹配度阈值与所述第四语音识别匹配度阈值可以相同,也可以不同。
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,说明电子设备进行语音识别的频率较低,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比发生了改变。此时,电子设备获取第六语音识别匹配度阈值。所述第六语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值。
具体实施时,本申请不受所描述的各个步骤的执行顺序的限制,在不产生冲突的情况下,某些步骤还可以采用其它顺序进行或者同时进行。
由上可知,本申请实施例提供的语音识别方法,包括:接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。所述语音识别方法中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,电子设备获取到的语音识别匹配度阈值可以是不同的。因此,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
本申请实施例还提供一种语音识别装置,所述语音识别装置可以集成在电子设备中。所述电子设备可以是智能手机、平板电脑、游戏设备、AR(Augmented Reality,增强现实)设备、数据存储装置、音频播放装置、视频播放装置、笔记本电脑、桌面计算设备等。
如图6所示,语音识别装置200可以包括:第一获取模块201、第二获取模块202、匹配模块203、执行模块204。
第一获取模块201,用于在接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长。
电子设备开启语音识别功能后,电子设备可以持续采集用户的语音信息。例如,电子设备中可以设置有麦克风,电子设备可以通过麦克风采集用户输入的语音信息。其中,用户的语音信息为用户向电子设备输入的一段语句。所述语音信息用于对电子设备进行语音控制。所述语音信息中可以包括一个或多个指令,例如“锁屏”、“增大音量”等指令。
电子设备每次语音识别成功后,可以记录进行语音识别的时间。例如,电子设备可以通过日志的方式记录每次成功进行语音识别时的时间。
当电子设备接收到用户输入的语音信息时,第一获取模块201可以获取电子设备前次语音识别成功的时刻。其中,电子设备前次语音识别成功指的是电子设备距离当前时刻最近的一次成功进行语音识别。
第一获取模块201还可以获取当前的时刻,并根据当前时刻与电子设备前次语音识别成功的时刻计算所述前次语音识别成功的时刻距离当前时刻之间的时长。例如,第一获取模块201计算得到的时长可以为30min(分钟)。
第二获取模块202,用于根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
电子设备中可以预先设置时长与语音识别匹配度阈值之间的对应关系。其中,所述时长表示电子设备前次语音识别成功的时刻与当前进行语音识别的时刻之间的时长。
所述语音识别匹配度阈值表示语音信息与语音识别模型匹配成功或者匹配失败之间的分界线。当语音信息与电子设备中预先设置的语音识别模型之间的匹配度大于语音识别匹配度阈值时,表示所述语音信息与所述语音识别模型匹配成功,也即语音识别成功。当语音信息与电子设备中预先设置的语音识别模型之间的匹配度小于或等于语音识别匹配度阈值时,表示所述语音信息与所述语音识别模型匹配失败,也即语音识别失败。
由于用户在频繁使用电子设备的语音识别功能时,也即用户使用电子设备的语音识别功能的频率较高时,电子设备相邻两次语音识别之间的时间间隔较短。此时,电子设备每次都需要进行同样的语音识别,导致耗费较多的时间。
而当用户使用电子设备的语音识别功能的频率较低时,电子设备相邻两次语音识别之间的时间间隔较长。此时,电子设备进行语音识别时,更多地需要保证语音识别的准确性。
因此,在上述对应关系中,所述时长越长时,所述时长对应的语音识别匹配度阈值越大;所述时长越短时,所述时长对应的语音识别匹配度阈值越小。
第一获取模块201获取到前次语音识别成功的时刻距离当前时刻之间的时长后,第二获取模块202即可根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
匹配模块203,用于将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度。
匹配模块203可以将接收到的语音信息与电子设备中预先设置的语音识别模型进行匹配,以得到所述语音信息与所述语音识别模型之间的匹配度。其中,匹配度表示所述语音信息与所述语音识别模型之间的相似程度或吻合程度。
其中,所述预设语音识别模型可以为用户首次启用电子设备的语音识别功能时,电子设备采集用户的训练语音信息,并根据所述训练语音信息生成的语音识别模型。
执行模块204,用于当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
匹配模块203得到所述语音信息与所述预设语音识别模型之间的语音识别匹配度后,执行模块204可以将所述语音识别匹配度与所述语音识别匹配度阈值进行比较,以判断所述语音识别匹配度与所述语音识别匹配度阈值之间的大小关系。
当所述语音识别匹配度大于所述语音识别匹配度阈值时,表示所述语音信息与所述预设语音识别模型匹配成功。随后,执行模块204可以对所述语音信息进行进一步分析,以获取所述语音信息中包含的控制指令,并执行与所述指令对应的操作,例如控制电子设备锁屏、控制电子设备增大音量等。
当所述语音识别匹配度不大于所述语音识别匹配度阈值时,表示所述语音信息与所述预设语音识别模型匹配失败。此时,执行模块204可以拒绝对所述语音信息进行响应。
本申请实施例中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,电子设备获取到的语音识别匹配度阈值可以是不同的。因此,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
在一些实施例中,第二获取模块202用于执行以下步骤:
判断所述时长是否小于预设时长阈值;
若所述时长小于所述预设时长阈值,则获取第一语音识别匹配度阈值;若所述时长不小于所述预设时长阈值,则获取第二语音识别匹配度阈值。
其中,电子设备中可以预先设置一个预设时长阈值。所述预设时长阈值为一个时长值。例如,所述预设时长阈值可以为30min(分钟)。
第一获取模块201获取到前次语音识别成功的时刻距离当前时刻之间的时长后,第二获取模块202可以将获取到的时长与所述预设时长阈值进行比较,以判断所述时长是否小于预设时长阈值。
若所述时长小于所述预设时长阈值,说明电子设备前次语音识别成功的时刻距离当前时刻较近,也即电子设备进行语音识别的频率较高。此时,第二获取模块202获取第一语音识别匹配度阈值。所述第一语音识别匹配度阈值可以为预先设置在电子设备中的一个数值。所述第一语音识别匹配度阈值较小,例如所述第一语音识别匹配度阈值可以为80%。
若所述时长不小于所述预设时长阈值,说明电子设备前次语音识别成功的时刻距离当前时刻较远,也即电子设备进行语音识别的频率较低。此时,第二获取模块202获取第二语音识别匹配度阈值。所述第二语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。其中,所述第二语音识别匹配度阈值较大,所述第二语音识别匹配度阈值大于所述第一语音识别匹配度阈值。例如所述第二语音识别匹配度阈值可以为90%。
在一些实施例中,第二获取模块202用于执行以下步骤:
确定所述时长所处的时长区间;
根据所述时长区间以及时长区间与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
其中,电子设备中可以针对时长预先设置多个时长区间。例如,电子设备中可以设置以下多个时长区间(时长单位为min):(0,20]、(20,40]、(40,60]等。此外,电子设备中还可以为每个时长区间预先设置一个对应的语音识别匹配度阈值,以形成时长区间与语音识别匹配度阈值之间的对应关系。例如,时长区间与语音识别匹配度阈值之间的对应关系可以为如表2所示:
表2
Figure BDA0001728681430000141
Figure BDA0001728681430000151
第一获取模块201获取到前次语音识别成功的时刻距离当前时刻之间的时长后,第二获取模块202可以确定所述时长所处的时长区间,随后根据所述时长区间以及时长区间与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
例如,第一获取模块201获取到的时长为30min,则所述时长所处的时长区间为(20,40]。随后,第二获取模块202可以获取到对应的语音识别匹配度阈值为80%。
在一些实施例中,如图7所示,语音识别装置200还包括判断模块205,所述判断模块205用于执行以下步骤:
判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
所述第二获取模块202用于执行以下步骤:
根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
电子设备中设置有定位系统。例如,电子设备可以包括GPS(GlobalPositioningSystem,全球定位系统)、BDS(BeiDou Navigation Satellite System,北斗卫星导航系统)等定位系统。
当电子设备接收到用户输入的语音信息时,判断模块205可以通过定位系统获取当前自身所处的第一地理位置。
此外,电子设备每次语音识别成功后,可以记录进行语音识别时电子设备所处的地理位置。例如,电子设备可以通过日志的方式记录每次成功进行语音识别时所处的地理位置。
电子设备接收到用户输入的语音信息时,判断模块205可以通过电子设备记录的数据获取前次语音识别成功时所处的地理位置。电子设备前次语音识别成功时所处的地理位置为第二地理位置。
其中,所述第一地理位置、第二地理位置均可以包括地理位置的坐标信息或者地理位置的区域信息等。地理位置的坐标信息例如可以包括地理位置的经度、纬度等信息。地理位置的区域信息例如可以包括地理位置所处的街道、小区、超市、地铁站等信息。
随后,判断模块205可以将所述第一地理位置与所述第二地理位置进行比较,以判断所述第一地理位置与所述第二地理位置是否相同,以得到判断结果。其中,所述判断结果可以包括所述第一地理位置与所述第二地理位置相同、所述第一地理位置与所述第二地理位置不同。
此外,电子设备中可以预先设置时长、判断结果与语音识别匹配度阈值之间的对应关系。其中,所述时长与电子设备前次语音识别成功的时刻距离当前时刻之间的时长对应,所述判断结果与所述第一地理位置与所述第二地理位置是否相同的判断结果对应。
第二获取模块202可以根据前次语音识别成功的时刻距离当前时刻之间的时长、所述第一地理位置与所述第二地理位置是否相同的判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
在一些实施例中,根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值时,第二获取模块202用于执行以下步骤:
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值。
其中,第二获取模块202可以将所述时长与预设时长进行比较,以判断所述时长是否小于所述预设时长。
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,说明电子设备进行语音识别的频率较高,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比未发生改变。此时,第二获取模块202获取第三语音识别匹配度阈值。所述第三语音识别匹配度阈值为设置在电子设备中的一个数值。所述第三语音识别匹配度阈值较小。例如,所述第三语音识别匹配度阈值可以为65%。
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,说明电子设备进行语音识别的频率较高,但电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比发生了改变。此时,第二获取模块202获取第四语音识别匹配度阈值。所述第四语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值。例如,所述第四语音识别匹配度阈值可以为75%。
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,说明电子设备进行语音识别的频率较低,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比未发生改变。此时,第二获取模块202获取第五语音识别匹配度阈值。所述第五语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值。例如,所述第五语音识别匹配度阈值可以为85%。其中,所述第五语音识别匹配度阈值与所述第四语音识别匹配度阈值可以相同,也可以不同。
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,说明电子设备进行语音识别的频率较低,并且电子设备当前所处的地理位置与前次语音识别成功时所处的地理位置相比发生了改变。此时,第二获取模块202获取第六语音识别匹配度阈值。所述第六语音识别匹配度阈值也可以为预先设置在电子设备中的一个数值。所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值。
具体实施时,以上各个模块可以作为独立的实体来实现,也可以进行任意组合,作为同一或若干个实体来实现。
由上可知,本申请实施例提供的语音识别装置200中,当接收到用户输入的语音信息时,第一获取模块201获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;第二获取模块202根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;匹配模块203将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行模块204执行所述语音信息中的指令对应的操作。所述语音识别装置中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,获取到的语音识别匹配度阈值可以是不同的。因此,可以根据电子设备进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
本申请实施例还提供一种电子设备。所述电子设备可以是智能手机、平板电脑等设备。如图8所示,电子设备300包括处理器301和存储器302。其中,处理器301与存储器302电性连接。
处理器301是电子设备300的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或调用存储在存储器302内的计算机程序,以及调用存储在存储器302内的数据,执行电子设备的各种功能和处理数据,从而对电子设备进行整体监控。
在本实施例中,电子设备300中的处理器301会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器302中,并由处理器301来运行存储在存储器302中的计算机程序,从而实现各种功能:
接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;
将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。
在一些实施例中,根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值时,处理器301执行以下步骤:
判断所述时长是否小于预设时长阈值;
若所述时长小于所述预设时长阈值,则获取第一语音识别匹配度阈值;
若所述时长不小于所述预设时长阈值,则获取第二语音识别匹配度阈值,所述第二语音识别匹配度阈值大于所述第一语音识别匹配度阈值。
在一些实施例中,根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值时,处理器301执行以下步骤:
确定所述时长所处的时长区间;
根据所述时长区间以及时长区间与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
在一些实施例中,根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值之前,处理器301还执行以下步骤:
判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值时,处理器301执行以下步骤:
根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值。
在一些实施例中,根据所述时长、所述判断结果以及时长、判断结果与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值时,处理器301执行以下步骤:
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值,所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值,所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值,所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值。
存储器302可用于存储计算机程序和数据。存储器302存储的计算机程序中包含有可在处理器中执行的指令。计算机程序可以组成各种功能模块。处理器301通过调用存储在存储器302的计算机程序,从而执行各种功能应用以及数据处理。
在一些实施例中,如图9所示,电子设备300还包括:射频电路303、显示屏304、控制电路305、输入单元306、音频电路307、传感器308以及电源309。其中,处理器301分别与射频电路303、显示屏304、控制电路305、输入单元306、音频电路307、传感器308以及电源309电性连接。
射频电路303用于收发射频信号,以通过无线通信与网络设备或其他电子设备进行通信。
显示屏304可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图像、文本、图标、视频和其任意组合来构成。
控制电路305与显示屏304电性连接,用于控制显示屏304显示信息。
输入单元306可用于接收输入的数字、字符信息或用户特征信息(例如指纹),以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。其中,输入单元306可以包括指纹识别模组。
音频电路307可通过扬声器、传声器提供用户与电子设备之间的音频接口。其中,音频电路307包括麦克风。所述麦克风与所述处理器301电性连接。所述麦克风用于接收用户输入的语音信息。
传感器308用于采集外部环境信息。传感器308可以包括环境亮度传感器、加速度传感器、陀螺仪等传感器中的一种或多种。
电源309用于给电子设备300的各个部件供电。在一些实施例中,电源309可以通过电源管理系统与处理器301逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图9中未示出,电子设备300还可以包括摄像头、蓝牙模块等,在此不再赘述。
由上可知,本申请实施例提供了一种电子设备,所述电子设备执行以下步骤:接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;根据所述时长以及时长与语音识别匹配度阈值之间的对应关系获取语音识别匹配度阈值;将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作。所述电子设备中,当电子设备前次语音识别成功的时刻距离当前时刻之间的时长不同时,也即电子设备进行语音识别的频率不同时,电子设备获取到的语音识别匹配度阈值可以是不同的。因此,电子设备可以根据进行语音识别的频率来动态调整语音识别匹配度阈值,可以减少识别失败的次数,节省电子设备在进行语音识别时耗费的时间,从而可以提高电子设备进行语音识别时的效率。
本申请实施例还提供一种存储介质,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,所述计算机执行上述任一实施例所述的语音识别方法。
需要说明的是,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过计算机程序来指令相关的硬件来完成,所述计算机程序可以存储于计算机可读存储介质中,所述存储介质可以包括但不限于:只读存储器(ROM,Read OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上对本申请实施例所提供的语音识别方法、装置、存储介质及电子设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (5)

1.一种语音识别方法,其特征在于,包括:
接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值,所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值,所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值,所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值;
将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作,所述语音识别匹配度阈值为所述第三语音识别匹配度阈值、所述第四语音识别匹配度阈值、所述第五语音识别匹配度阈值、所述第六语音识别匹配度阈值中的一个。
2.一种语音识别装置,其特征在于,包括:
第一获取模块,用于在接收到用户输入的语音信息时,获取电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
第二获取模块,用于:
判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值,所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值,所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值,所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值;
匹配模块,用于将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
执行模块,用于当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作,所述语音识别匹配度阈值为所述第三语音识别匹配度阈值、所述第四语音识别匹配度阈值、所述第五语音识别匹配度阈值、所述第六语音识别匹配度阈值中的一个。
3.一种存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行权利要求1所述的语音识别方法。
4.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器通过调用所述存储器中存储的所述计算机程序,用于执行权利要求1所述的语音识别方法。
5.一种电子设备,其特征在于,所述电子设备包括处理器以及与所述处理器电性连接的麦克风,其中:
所述麦克风,用于接收用户输入的语音信息;
所述处理器,用于:
获取所述电子设备前次语音识别成功的时刻距离当前时刻之间的时长;
判断所述电子设备当前所处的第一地理位置与所述前次语音识别成功时所处的第二地理位置是否相同,以得到判断结果;
当所述时长小于预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第三语音识别匹配度阈值;
当所述时长小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第四语音识别匹配度阈值,所述第四语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置相同时,获取第五语音识别匹配度阈值,所述第五语音识别匹配度阈值大于所述第三语音识别匹配度阈值;
当所述时长不小于所述预设时长阈值,并且所述判断结果为所述第一地理位置与所述第二地理位置不同时,获取第六语音识别匹配度阈值,所述第六语音识别匹配度阈值大于所述第四语音识别匹配度阈值,并且所述第六语音识别匹配度阈值大于所述第五语音识别匹配度阈值;
将所述语音信息与预设语音识别模型进行匹配,以得到语音识别匹配度;
当所述语音识别匹配度大于所述语音识别匹配度阈值时,执行所述语音信息中的指令对应的操作,所述语音识别匹配度阈值为所述第三语音识别匹配度阈值、所述第四语音识别匹配度阈值、所述第五语音识别匹配度阈值、所述第六语音识别匹配度阈值中的一个。
CN201810764411.6A 2018-07-12 2018-07-12 语音识别方法、装置、存储介质及电子设备 Active CN109003607B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810764411.6A CN109003607B (zh) 2018-07-12 2018-07-12 语音识别方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810764411.6A CN109003607B (zh) 2018-07-12 2018-07-12 语音识别方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN109003607A CN109003607A (zh) 2018-12-14
CN109003607B true CN109003607B (zh) 2021-06-01

Family

ID=64599116

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810764411.6A Active CN109003607B (zh) 2018-07-12 2018-07-12 语音识别方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN109003607B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109524001A (zh) * 2018-12-28 2019-03-26 北京金山安全软件有限公司 一种信息处理方法、装置及儿童穿戴设备
CN110211605A (zh) * 2019-05-24 2019-09-06 珠海多士科技有限公司 智能设备语音灵敏度调节方法、装置、设备和存储介质
CN110602391B (zh) * 2019-08-30 2021-08-24 Oppo广东移动通信有限公司 拍照控制方法、装置、存储介质及电子设备
CN110971763B (zh) * 2019-12-10 2021-01-26 Oppo广东移动通信有限公司 到站提醒方法、装置、存储介质及电子设备

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316649A (zh) * 2017-05-15 2017-11-03 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805110B2 (en) * 2008-08-19 2014-08-12 Digimarc Corporation Methods and systems for content processing
CN103578468B (zh) * 2012-08-01 2017-06-27 联想(北京)有限公司 一种语音识别中置信度阈值的调整方法及电子设备
CN103971680B (zh) * 2013-01-24 2018-06-05 华为终端(东莞)有限公司 一种语音识别的方法、装置
CN105788598B (zh) * 2014-12-19 2019-12-24 联想(北京)有限公司 一种语音处理方法和电子设备
CN205486116U (zh) * 2015-12-28 2016-08-17 深圳市亚略特生物识别科技有限公司 基于生物识别的移动终端
US10186255B2 (en) * 2016-01-16 2019-01-22 Genesys Telecommunications Laboratories, Inc. Language model customization in speech recognition for speech analytics
CN107742516B (zh) * 2017-09-29 2020-11-17 上海望潮数据科技有限公司 智能识别方法、机器人及计算机可读存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107316649A (zh) * 2017-05-15 2017-11-03 百度在线网络技术(北京)有限公司 基于人工智能的语音识别方法及装置

Also Published As

Publication number Publication date
CN109003607A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
CN109003607B (zh) 语音识别方法、装置、存储介质及电子设备
CN111476306B (zh) 基于人工智能的物体检测方法、装置、设备及存储介质
CN108922520B (zh) 语音识别方法、装置、存储介质及电子设备
US8521681B2 (en) Apparatus and method for recognizing a context of an object
CN110471858B (zh) 应用程序测试方法、装置及存储介质
CN111933112B (zh) 唤醒语音确定方法、装置、设备及介质
EP3001414A1 (en) Method and apparatus for executing voice command in electronic device
CN106203235B (zh) 活体鉴别方法和装置
CN108810280B (zh) 语音采集频率的处理方法、装置、存储介质及电子设备
CN111063342A (zh) 语音识别方法、装置、计算机设备及存储介质
CN110827824B (zh) 语音处理方法、装置、存储介质及电子设备
CN108922531B (zh) 槽位识别方法、装置、电子设备及存储介质
CN111339737B (zh) 实体链接方法、装置、设备及存储介质
CN108600559B (zh) 静音模式的控制方法、装置、存储介质及电子设备
CN110858479B (zh) 语音识别模型更新方法、装置、存储介质及电子设备
CN110248401B (zh) WiFi的扫描控制方法、装置、存储介质及移动终端
CN108052506B (zh) 自然语言处理方法、装置、存储介质及电子设备
CN113220590A (zh) 语音交互应用的自动化测试方法、装置、设备及介质
CN113225624A (zh) 一种语音识别耗时确定方法和装置
CN108920065B (zh) 分屏窗口调节方法、装置、存储介质及电子设备
CN109064720B (zh) 位置提示方法、装置、存储介质及电子设备
CN107154996B (zh) 来电拦截方法、装置、存储介质及终端
CN113744736B (zh) 命令词识别方法、装置、电子设备及存储介质
CN112116908B (zh) 唤醒音频确定方法、装置、设备及存储介质
CN112632222B (zh) 一种终端设备和确定数据所属领域的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant