CN109741749A - 一种语音识别的方法和终端设备 - Google Patents

一种语音识别的方法和终端设备 Download PDF

Info

Publication number
CN109741749A
CN109741749A CN201810354965.9A CN201810354965A CN109741749A CN 109741749 A CN109741749 A CN 109741749A CN 201810354965 A CN201810354965 A CN 201810354965A CN 109741749 A CN109741749 A CN 109741749A
Authority
CN
China
Prior art keywords
set text
target voice
similarity
text
pronunciation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810354965.9A
Other languages
English (en)
Other versions
CN109741749B (zh
Inventor
罗永浩
罗海涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201810354965.9A priority Critical patent/CN109741749B/zh
Publication of CN109741749A publication Critical patent/CN109741749A/zh
Application granted granted Critical
Publication of CN109741749B publication Critical patent/CN109741749B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明公开了一种语音识别的方法和终端设备,所述方法应用于终端设备,所述终端设备保存有第一预设文本,所述方法包括:接收语音数据,所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。由此可见,利用本申请实施例提供的方法和终端设备,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。

Description

一种语音识别的方法和终端设备
技术领域
本发明涉及领域互联网领域,特别是涉及一种语音识别的方法和终端设备。
背景技术
随着互联网技术的发展,语音识别技术的应用也越来越广泛。许多智能设备尤其是智能移动终端上都安装有语音识别引擎,语音识别引擎可以用于将用户输入的语音转换成文本。
但是,由于许多文字的读音相似甚至是相同,语音识别引擎在将用户输入的目标语音转换成目标文本时,可能会将目标语音识别成与目标文本读音相同或相似的文本,例如,将“Mac”识别为“Mike”或者“麦克”。从而导致语音识别的准确率不高。
因此,需要提供一种语音识别的方法和终端设备,能够提高语音识别的准确率。
发明内容
为了解决上述问题,本发明实施例提供一种语音识别的方法和终端设备。
本发明实施例提供一种语音识别的方法,应用于终端设备,所述终端设备保存有第一预设文本,包括:
接收语音数据;所述语音数据包括目标语音;
比较所述第一预设文本的读音和所述目标语音;
若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
可选的,所述方法还包括:
将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;
接收服务器发送的第二预设文本;
保存所述第二预设文本。
可选的,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述方法还包括:
比较所述第二预设文本的读音和所述目标语音;
相应的,若所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值,将所述目标语音识别为所述第二预设文本。
可选的,所述将所述目标语音识别为所述第一预设文本,包括:
比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;
若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
可选的,若所述第一相似度小于所述第二相似度,所述方法还包括:
判断所述第二相似度是否大于或者等于第三阈值;
当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。
可选的,所述第二预设文本包括:
与所述第一预设文本具有内容相关性的文本,和/或,
与所述第一预设文本具有语义相关性的文本。
本发明实施例提供一种设备,包括:
第一接收单元,用于接收语音数据;所述语音数据包括目标语音;
比较单元,用于比较所述第一预设文本的读音和所述目标语音;
识别单元,用于若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
可选的,所述终端设备还包括:
发送单元,用于将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;
第二接收单元,用于接收服务器发送的第二预设文本;
保存单元,用于保存所述第二预设文本。
可选的,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述比较单元,还用于:
比较所述第二预设文本的读音和所述目标语音;
相应的,所述识别单元用于:当所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值时,将所述目标语音识别为所述第二预设文本。
可选的,所述识别单元,具体用于:
比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;
若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
可选的,若所述第一相似度小于所述第二相似度,所述比较单元620还用于:
判断所述第二相似度是否大于或者等于第三阈值;
相应的,所述识别单元还用于,当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。
可选的,所述第二预设文本包括:
与所述第一预设文本具有内容相关性的文本,和/或,
与所述第一预设文本具有语义相关性的文本。
与现有技术相比,本发明实施例具有以下优点:
本发明实施例提供一种语音识别的方法和终端设备,所述方法应用于终端设备,所述终端设备保存有第一预设文本,所述方法包括:接收语音数据,所述语音数据包括目标语音;比较所述第一预设文本的读音和所述目标语音;若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。由此可见,利用本申请实施例提供的方法和终端设备,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音识别方法的流程示意图;
图2为本发明实施例提供的又一种语音识别方法的流程示意图;
图3为本发明实施例提供的一种结合第一预设文本和第二预设文本识别目标语音的流程示意图;
图4为本发明实施例提供的又一种结合第一预设文本和第二预设文本识别目标语音的流程示意图;
图5为本发明实施例提供的一种语音识别的信令交互图;
图6为本发明实施例提供的终端设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图,详细说明本发明的各种非限制性实施方式。
方法实施例
参见图1,该图为本发明实施例提供的一种语音识别方法的流程示意图。
本发明实施例提供的语音识别方法,应用于终端设备。所述终端设备例如可以是笔记本电脑、台式计算机等终端设备,所述终端设备也可以是手机、平板电脑等移动终端设备,本发明实施例不具体限定所述终端设备。
在本实施例中,所述方法例如可以通过如下步骤S101-S103实现。
S101:接收语音数据,所述语音数据包括目标语音。
需要说明的是,在本发明实施例中,所述语音数据可以是用户通过麦克风输入的语音数据。也就是说,终端设备可以通过麦克风接收所述语音数据。
需要说明的是,本发明实施例不具体限定所述语音数据。所述语音数据可以包括一个或多个句子,也可以包括一个或多个词语。
相应的,所述目标语音为所述语音数据的部分或全部内容。目标语音可以为对所述语音数据进行拆分所获得的。例如,所述语音数据包括一个句子,所述目标语音为对该句子进行拆分获得的词语所对应的语音。又如,所述语音数据包括一个词语,所述目标语音为该一个词语对应的语音。
S102:比较第一预设文本的读音和所述目标语音。
需要说明的是,所述终端设备保存有第一预设文本。本发明实施例不具体限定所述第一预设文本,所述第一预设文本可以包括一个或多个字符。所述第一预设文本可以为英文字符,也可以为中文字符,还可以为其它字符。例如,第一预设字符可以为字符“iPhone”;又如,第一预设字符可以为字符“坚果”。
需要说明的是,所述第一预设文本可以是终端设备基于用户触发的操作指令保存的。用户可以设置终端设备保存用户使用频率较高的文本。
需要说明的是,在实际应用中,所述第一预设文本可能包括多种读音。例如,所述第一预设文本为“朝阳”,第一预设文本包括“chao(一声)yang(二声)”和“zhao(一声)yang(二声)”两种读音。
在本发明实施例中,若第一预设文本的读音包括第一读音和第二读音,则比较第一预设文本的读音和所述目标语音时,可以将所述第一语音和所述第二语音分别与所述目标语音进行比较。
S103:若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
需要说明的是,本发明实施例不具体限定所述第一阈值,第一阈值可以根据实际情况具体设置,作为一种示例,所述第一阈值可以为0.9。
在本发明实施例中,当第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值时,可以认为所述目标语音即为所述第一预设文本对应的语音。
需要说明的是,当所述第一预设文本的读音包括第一读音和第二读音时,若所述第一读音和所述目标语音的相似度大于或者等于第一阈值时,将所述目标语音识别为第一预设文本;或者,若所述第二读音和所述目标语音的相似度大于或者等于第一阈值时,将所述目标语音识别为第一预设文本。
也就是说,第一读音和第二读音中任意一个读音和所述目标语音的相似度大于或者等于第一阈值时,可以将所述目标语音识别为第一预设文本。
由此可见,利用本申请实施例提供的方法,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。
如前文所述,所述第一预设文本可能是用户使用频率较高的文本,第一预设文本出现在所述目标语音中的可能性比较大,鉴于此,与第一预设文本相关的文本在所述目标语音中出现的可能性也可能比较大,鉴于此,在本发明实施例中,所述终端设备还可以保存与所述第一预设文本相关的第二预设文本。
具体地,在本发明实施例的一个实例中,所述语音识别的方法还可以包括如下步骤S201-S203。
S201:将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本。
需要说明的是,在本发明实施例中,所述终端设备可以利用网络将所述第一预设文本发送给服务器。
本发明实施例不具体限定所述服务器。所述服务器上保存有大量的文本信息,因此,所述服务器接收到终端设备发送的第一预设文本之后,可以根据所述第一预设文本查找到与所述第一预设文本相关的第二预设文本。
需要说明的是,在本发明实施例中,所述第二预设文本可以是与所述第一预设文本具有内容相关性的文本,和/或,所述第二预设文本可以是与所述第一预设文本具有语义相关性的文本。
需要说明的是,所述第一预设文本与所述第二预设文本具有内容相关性,是指,由所述第一预设文本直接或者间接获得的内容中,包括第二预设文本。例如,第一预设文本为“iPhone”,第二预设文本可以为“Steve Jobs”、“Mac”、“itune”中的任意一个或多个。
第二预设文本为所述第一预设文本与所述第二预设文本具有语义相关性,是指,所述第一预设文本与第二预设文本在语义上具有一定的关系。例如,第一预设文本可以为“安装”,第二预设文本可以为“软件”;又如,第一预设文本可以为“坚果”,第二预设文本可以为“手机”。
S202:接收服务器发送的第二预设文本。
S203:保存所述第二预设文本。
可以理解的是,终端设备保存第二预设文本之后,即可结合第一预设文本和第二预设文本识别所述目标语音。
需要说明的是,结合第一预设文本和第二预设文本识别所述目标语音,可以有多种实现方式。以下结合附图对结合第一预设文本和第二预设文本识别所述目标语音的具体实现方式进行介绍。
参见图3,该图为本发明实施例提供的一种识别目标语音的方法流程示意图。本发明实施例提供的方法,可以通过如下步骤S301-S304实现。
S301:比较所述第一预设文本的发音和所述目标语音。若所述第一预设文本的发音和所述目标文本的相似度小于第一阈值,执行步骤S302,否则,执行步骤S304。
需要说明的是,步骤S301的具体实现与步骤S102的具体实现类似,具体内容可以参考步骤S102中相关内容的描述,此处不再赘述。
S302:比较所述第二预设文本的发音和所述目标语音。
需要说明的是,步骤S302的具体实现与步骤S102的具体实现类似,只是步骤S102中,是比较所述第一预设文本的发音和所述目标语音,而步骤S302中是比较所述第二预设文本的发音和所述目标语音。因此步骤S302的具体描述可以参考步骤S102的相关描述,此处不再赘述。
S303:若所述第二预设文本的发音和所述目标语音的相似度大于或者等于第二阈值,将所述目标语音识别为所述第二预设文本。
需要说明的是,本发明实施例不具体限定所述第二阈值,第二阈值可以根据实际情况确定。例如,第二阈值可以为0.9。
S304:将所述目标语音识别为所述第一预设文本。
关于步骤S301至步骤S304,需要说明的是,考虑到第一预设文本是用户自主定义的,因此,第一预设文本出现在目标语音中的可能性更大,因此,在识别目标语音时,优先将所述第一预设文本的读音与所述目标语音进行比较,若第一预设文本的读音与所述目标语音的相似度低于第一阈值,再将所述第二预设文本的读音与所述目标语音进行比较,以确定是否可以将所述目标语音识别为所述第二预设文本。
参见图4,该图为本发明实施例提供的另一种识别目标语音的方法流程示意图。本发明实施例提供的方法,可以通过如下步骤S401-S404实现。
S401:比较所述第一预设文本的读音和所述目标语音;比较所述第二预设文本的读音和所述目标语音。
S402:当所述第一相似度大于或者等于第一阈值时,判断第一相似度和第二相似度的大小关系,若所述第一相似度大于或者等于第二相似度,执行步骤S404,若所述第一相似度小于所述第二相似度,执行步骤S403。
需要说明的是,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
S403:判断所述第二相似度是否大于或者等于第三阈值,当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。
需要说明的是,与所述第一阈值和所述第二阈值类似,本发明实施例也不具体限定所述第三阈值,第三阈值可以根据实际情况确定。
S404:将所述目标语音识别为所述第一预设文本。
关于步骤S401至步骤S404,需要说明的是,在识别目标语音时,将所述目标语音分别与所述第一预设文本的读音以及所述第二预设文本的读音比较,当第一相似度大于或者等于第二相似度,并且第一相似度大于第一阈值时,将所述目标语音识别为所述第一预设文本。若第一相似度大于第一阈值,且第一相似度小于第二相似度,则根据第二相似度与所述第三阈值的大小关系,以确定是否可以将所述目标语音识别为所述第二预设文本。
以上介绍了本发明实施例提供语音识别的方法,以下结合具体场景对该方法进行介绍。
在该场景中,所述终端设备为移动终端,移动终端上安装有可以将语音识别为文本的语音识别引擎。移动终端上安装有应用程序,该应用程序可以调用所述语音识别引擎,移动终端上可以包括语音服务,语音服务也可以看成一个应用程序,语音服务可以和应用程序、语音识别引擎以及服务器进行数据交互。其中,第一阈值为0.9。以下结合图5对该场景下的语音识别方法进行介绍。
参见图5,该图为本发明实施例提供的一种语音识别的信令交互图。本发明实施例提供的语音识别方法,可以通过如下步骤S501-S511实现。
S501:响应于用户触发的设置请求,生成设置请求指令。
需要说明的是,本发明实施例不具体限定所述设置请求指令的具体格式,所述设置请求指令的具体格式可以根据实际情况确定。
S502:应用程序将设置请求指令发送给语音服务,设置请求指令中携带第一预设文本。
S503:语音服务解析所述设置请求指令,获得第一预设文本。
S504:语音服务将第一预设文本发送给服务器。
S505:服务器查找与第一预设文本相关的第二预设文本。
S506:服务器将第二预设文本发送给语音服务。
S507:语音服务将第一预设文本和第二预设文本发送给语音识别引擎。
需要说明的是,语音服务可以将第一预设文本和第二预设文本同时发送给语音识别引擎。语音服务也可以在步骤S503获得第一预设文本之后,先将所述第一预设文本发送给语音识别引擎,然后在步骤S506之后将所述第二预设文本发送给语音识别引擎,本发明实施例对此不做限定。
S508:语音识别引擎保存第一预设文本和第二预设文本。
S509:应用程序获取语音数据,语音数据中包括目标语音。
S510:应用程序将语音数据发送给语音识别引擎。
S511:语音识别引擎确定第一预设文本的读音和目标语音的相似度为0.95,将目标语音识别为第一预设文本。
由于第一预设文本的读音和目标语音的相似度大于第一阈值,故而所述目标语音识别为第一预设文本。
需要说明的是,进一步地,所述语音识别引擎可以将对所述语音数据的识别结果发送给语音服务,由语音服务将所述识别结果发送给应用程序,应用程序可以将所述识别结果显示在所述移动终端的显示屏上。
设备实施例
基于以上方法实施例提供的语音识别的方法,本发明实施例还提供一种终端设备。
参见图6,该图为本发明实施例提供的一种终端设备的结构示意图。所述终端设备600例如可以具体包括:第一接收单元610、比较单元620和识别单元630。
第一接收单元610,用于接收语音数据;所述语音数据包括目标语音;
比较单元620,用于比较所述第一预设文本的读音和所述目标语音;
识别单元630,用于若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
可选的,所述终端设备还包括:
发送单元,用于将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;
第二接收单元,用于接收服务器发送的第二预设文本;
保存单元,用于保存所述第二预设文本。
可选的,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述比较单元620,还用于:
比较所述第二预设文本的读音和所述目标语音;
相应的,所述识别单元630用于:当所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值时,将所述目标语音识别为所述第二预设文本。
可选的,所述识别单元630,具体用于:
比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;
若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
可选的,若所述第一相似度小于所述第二相似度,所述比较单元620还用于:
判断所述第二相似度是否大于或者等于第三阈值;
相应的,所述识别单元630还用于,当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。
可选的,所述第二预设文本包括:
与所述第一预设文本具有内容相关性的文本,和/或,
与所述第一预设文本具有语义相关性的文本。
关于所述终端设备600的各单元的具体实现可以参考以上方法实施例中相关内容的描述,此处不再赘述。
由此可见,利用本申请实施例提供的终端设备,由于终端设备中保存有第一预设文本,当所述目标语音与第一预设文本的读音相似度比较高时,终端设备可以自动将目标文本识别为第一预设文本,而不会识别为与第一预设文本读音相同或相似的其它文本,从而提高了语音识别的准确率。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种语音识别的方法,其特征在于,应用于终端设备,所述终端设备保存有第一预设文本,包括:
接收语音数据;所述语音数据包括目标语音;
比较所述第一预设文本的读音和所述目标语音;
若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;
接收服务器发送的第二预设文本;
保存所述第二预设文本。
3.根据权利要求2所述的方法,其特征在于,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述方法还包括:
比较所述第二预设文本的读音和所述目标语音;
相应的,若所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值,将所述目标语音识别为所述第二预设文本。
4.根据权利要求2所述的方法,其特征在于,所述将所述目标语音识别为所述第一预设文本,包括:
比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;
若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
5.根据权利要求4所述的方法,其特征在于,若所述第一相似度小于所述第二相似度,所述方法还包括:
判断所述第二相似度是否大于或者等于第三阈值;
当所述第二相似度大于或者等于第三阈值时,将所述目标语音识别为所述第二预设文本。
6.根据权利要求2-5任意一项所述的方法,其特征在于,所述第二预设文本包括:
与所述第一预设文本具有内容相关性的文本,和/或,
与所述第一预设文本具有语义相关性的文本。
7.一种终端设备,其特征在于,所述终端设备保存有第一预设文本,包括:
第一接收单元,用于接收语音数据;所述语音数据包括目标语音;
比较单元,用于比较所述第一预设文本的读音和所述目标语音;
识别单元,用于若所述第一预设文本的读音和所述目标语音的相似度大于或者等于第一阈值,将所述目标语音识别为所述第一预设文本。
8.根据权利要求7所述的终端设备,其特征在于,所述终端设备还包括:
发送单元,用于将所述第一预设文本发送给服务器,以便于服务器查找与所述第一预设文本相关的第二预设文本;
第二接收单元,用于接收服务器发送的第二预设文本;
保存单元,用于保存所述第二预设文本。
9.根据权利要求8所述的终端设备,其特征在于,若所述第一预设文本的读音和所述目标语音的相似度小于第一阈值,所述比较单元,还用于:
比较所述第二预设文本的读音和所述目标语音;
相应的,所述识别单元用于:当所述第二预设文本的读音和所述目标语音的相似度大于或者等于第二阈值时,将所述目标语音识别为所述第二预设文本。
10.根据权利要求8所述的终端设备,其特征在于,所述识别单元,具体用于:
比较所述第二预设文本的读音和所述目标语音,确定所述第二预设文本的读音和所述目标语音的相似度;
若第一相似度大于或者等于第二相似度,将所述目标语音识别为所述第一预设文本;其中,所述第一相似度为所述第一预设文本的读音和所述目标语音的相似度;所述第二相似度为所述第二预设文本的读音和所述目标语音的相似度。
CN201810354965.9A 2018-04-19 2018-04-19 一种语音识别的方法和终端设备 Active CN109741749B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810354965.9A CN109741749B (zh) 2018-04-19 2018-04-19 一种语音识别的方法和终端设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810354965.9A CN109741749B (zh) 2018-04-19 2018-04-19 一种语音识别的方法和终端设备

Publications (2)

Publication Number Publication Date
CN109741749A true CN109741749A (zh) 2019-05-10
CN109741749B CN109741749B (zh) 2020-03-27

Family

ID=66354289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810354965.9A Active CN109741749B (zh) 2018-04-19 2018-04-19 一种语音识别的方法和终端设备

Country Status (1)

Country Link
CN (1) CN109741749B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110718210A (zh) * 2019-09-25 2020-01-21 北京字节跳动网络技术有限公司 一种英文错误发音的识别方法、装置、介质和电子设备
CN111354345A (zh) * 2020-03-11 2020-06-30 北京字节跳动网络技术有限公司 生成语音模型和语音识别的方法、装置、设备以及介质
CN113068058A (zh) * 2021-03-19 2021-07-02 安徽宝信信息科技有限公司 一种基于语音识别及转写技术的实时字幕上屏直播系统
CN113241061A (zh) * 2021-05-17 2021-08-10 北京字跳网络技术有限公司 语音识别结果的处理方法、装置、电子设备和存储介质

Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0856836A2 (en) * 1997-01-29 1998-08-05 Nec Corporation Speaker recognition device
CN1421846A (zh) * 2001-11-28 2003-06-04 财团法人工业技术研究院 语音识别系统
CN1692399A (zh) * 2002-12-20 2005-11-02 索尼电子公司 用于显示文本的终端设备和服务器
CN101727900A (zh) * 2009-11-24 2010-06-09 北京中星微电子有限公司 一种用户发音检测方法及设备
CN102968992A (zh) * 2012-11-26 2013-03-13 北京奇虎科技有限公司 用于浏览器的语音识别处理方法和浏览器
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN103956169A (zh) * 2014-04-17 2014-07-30 北京搜狗科技发展有限公司 一种语音输入方法、装置和系统
CN104238991A (zh) * 2013-06-21 2014-12-24 腾讯科技(深圳)有限公司 语音输入匹配方法及装置
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105489220A (zh) * 2015-11-26 2016-04-13 小米科技有限责任公司 语音识别方法及装置
CN105654955A (zh) * 2016-03-18 2016-06-08 华为技术有限公司 语音识别方法及装置
CN105868322A (zh) * 2016-03-26 2016-08-17 深圳市金立通信设备有限公司 一种输入方法及终端
CN106101789A (zh) * 2016-07-06 2016-11-09 深圳Tcl数字技术有限公司 终端的语音交互方法及装置
CN106297799A (zh) * 2016-08-09 2017-01-04 乐视控股(北京)有限公司 语音识别处理方法及装置
CN106815593A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 中文文本相似度的确定方法和装置
US9728188B1 (en) * 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
CN107180634A (zh) * 2017-06-22 2017-09-19 海信集团有限公司 一种语音交互文本的业务定位方法、装置和终端设备
CN107301865A (zh) * 2017-06-22 2017-10-27 海信集团有限公司 一种用于语音输入中确定交互文本的方法和装置
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置

Patent Citations (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0856836A2 (en) * 1997-01-29 1998-08-05 Nec Corporation Speaker recognition device
CN1421846A (zh) * 2001-11-28 2003-06-04 财团法人工业技术研究院 语音识别系统
CN1692399A (zh) * 2002-12-20 2005-11-02 索尼电子公司 用于显示文本的终端设备和服务器
CN101727900A (zh) * 2009-11-24 2010-06-09 北京中星微电子有限公司 一种用户发音检测方法及设备
CN102968992A (zh) * 2012-11-26 2013-03-13 北京奇虎科技有限公司 用于浏览器的语音识别处理方法和浏览器
CN103000173A (zh) * 2012-12-11 2013-03-27 优视科技有限公司 一种语音交互方法及装置
CN104238991A (zh) * 2013-06-21 2014-12-24 腾讯科技(深圳)有限公司 语音输入匹配方法及装置
CN104794122A (zh) * 2014-01-20 2015-07-22 腾讯科技(北京)有限公司 一种位置信息推荐方法、装置和系统
CN103956169A (zh) * 2014-04-17 2014-07-30 北京搜狗科技发展有限公司 一种语音输入方法、装置和系统
CN105489220A (zh) * 2015-11-26 2016-04-13 小米科技有限责任公司 语音识别方法及装置
CN106815593A (zh) * 2015-11-27 2017-06-09 北京国双科技有限公司 中文文本相似度的确定方法和装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105654955A (zh) * 2016-03-18 2016-06-08 华为技术有限公司 语音识别方法及装置
CN105868322A (zh) * 2016-03-26 2016-08-17 深圳市金立通信设备有限公司 一种输入方法及终端
US9728188B1 (en) * 2016-06-28 2017-08-08 Amazon Technologies, Inc. Methods and devices for ignoring similar audio being received by a system
CN106101789A (zh) * 2016-07-06 2016-11-09 深圳Tcl数字技术有限公司 终端的语音交互方法及装置
CN106297799A (zh) * 2016-08-09 2017-01-04 乐视控股(北京)有限公司 语音识别处理方法及装置
CN107659847A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 语音互动方法和装置
CN107180634A (zh) * 2017-06-22 2017-09-19 海信集团有限公司 一种语音交互文本的业务定位方法、装置和终端设备
CN107301865A (zh) * 2017-06-22 2017-10-27 海信集团有限公司 一种用于语音输入中确定交互文本的方法和装置

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110718210A (zh) * 2019-09-25 2020-01-21 北京字节跳动网络技术有限公司 一种英文错误发音的识别方法、装置、介质和电子设备
CN110718210B (zh) * 2019-09-25 2022-06-07 北京字节跳动网络技术有限公司 一种英文错误发音的识别方法、装置、介质和电子设备
CN111354345A (zh) * 2020-03-11 2020-06-30 北京字节跳动网络技术有限公司 生成语音模型和语音识别的方法、装置、设备以及介质
CN113068058A (zh) * 2021-03-19 2021-07-02 安徽宝信信息科技有限公司 一种基于语音识别及转写技术的实时字幕上屏直播系统
CN113241061A (zh) * 2021-05-17 2021-08-10 北京字跳网络技术有限公司 语音识别结果的处理方法、装置、电子设备和存储介质
CN113241061B (zh) * 2021-05-17 2023-03-10 北京字跳网络技术有限公司 语音识别结果的处理方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN109741749B (zh) 2020-03-27

Similar Documents

Publication Publication Date Title
AU2017202111B2 (en) Speech recognition and translation terminal, method, and computer readable medium
CN109741749A (zh) 一种语音识别的方法和终端设备
EP3905057A1 (en) Online document sharing method and apparatus, electronic device, and storage medium
KR102490776B1 (ko) 디지털 개인 비서 내에서 헤드리스로 작업을 완료하기 위한 기법
US20190081914A1 (en) Method and apparatus for generating candidate reply message
US10811005B2 (en) Adapting voice input processing based on voice input characteristics
CN104951546B (zh) 在即时通信软件中订阅消息的方法和装置
US8239202B2 (en) System and method for audibly outputting text messages
KR102046486B1 (ko) 정보 입력 방법
US20180211668A1 (en) Reduced latency speech recognition system using multiple recognizers
KR102144868B1 (ko) 통화 기록 제공 장치 및 방법
JP6625772B2 (ja) 検索方法及びそれを用いた電子機器
KR20150077580A (ko) 음성 인식 기반 서비스 제공 방법 및 그 장치
CN110992955A (zh) 一种智能设备的语音操作方法、装置、设备及存储介质
JP6689953B2 (ja) 通訳サービスシステム、通訳サービス方法及び通訳サービスプログラム
CN109741750A (zh) 一种语音识别的方法、文件处理方法及终端设备
CN113053362A (zh) 语音识别的方法、装置、设备和计算机可读介质
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
CN112700770A (zh) 语音控制方法、音箱设备、计算设备和存储介质
US20240104005A1 (en) Method for testing application
JP6760566B2 (ja) 端末装置、翻訳方法、及び、翻訳プログラム
CN113421565A (zh) 搜索方法、装置、电子设备以及存储介质
KR20210116223A (ko) 인공지능 기반의 가상상담 서비스 장치 및 방법
CN104243666B (zh) 语言处理方法及装置
JP2021144172A (ja) 音声処理システム、音声処理方法、及び音声処理プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant