CN107895572A - 一种语音识别训练方法及系统 - Google Patents

一种语音识别训练方法及系统 Download PDF

Info

Publication number
CN107895572A
CN107895572A CN201610875636.XA CN201610875636A CN107895572A CN 107895572 A CN107895572 A CN 107895572A CN 201610875636 A CN201610875636 A CN 201610875636A CN 107895572 A CN107895572 A CN 107895572A
Authority
CN
China
Prior art keywords
driver
result
speech recognition
speech
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201610875636.XA
Other languages
English (en)
Inventor
蔡海洋
钟东
俞松耀
宋卫峰
张欣凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fafa Automobile China Co ltd
Original Assignee
Faraday Beijing Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Faraday Beijing Network Technology Co Ltd filed Critical Faraday Beijing Network Technology Co Ltd
Priority to CN201610875636.XA priority Critical patent/CN107895572A/zh
Publication of CN107895572A publication Critical patent/CN107895572A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Abstract

本发明提供一种语音识别训练方法及系统,用以解决现有技术中车机场景下的一些不利情况会降低车机的语音识别准确率的问题。所述语音识别训练方法包括:车机接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;获得所述驾驶员对所述语音识别结果的反馈信息;根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。

Description

一种语音识别训练方法及系统
技术领域
本发明实施例涉及计算机网络技术领域,尤其涉及一种语音识别训练方法及系统。
背景技术
随着计算机技术和互联网技术的发展,很多传统设备的智能化程度得到了提高。比如,车辆中的车机,传统的车机一般用于显示行车相关的信号,以及提供诸如本地音乐播放等一些简单的附加功能,而现在的车机则具备很多智能功能,比如,导航、自动驾驶、网络多媒体播放等,为驾驶员提供了便利。
进一步地,一些车机还支持语音识别功能,则驾驶员可以通过下达语音指令,来使用这些车机上的智能功能。
在现有技术中,车机上的语音识别功能对应的语料库一般比较小,而车机对应的行车环境比较复杂(比如,车速不同、是否开窗、路况不同、是否下雨等),不同的驾驶员语言习惯不同(比如,语速快慢不同、语调高低不同、口音不同),等等。
上述的这些不利情况会降低车机场景下的语音识别准确率。
发明内容
本发明实施例提供一种语音识别训练方法及系统,用以解决现有技术中车机场景下的一些不利情况会降低车机的语音识别准确率的问题。
本发明实施例提供的一种语音识别训练方法,包括:
车机接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;
响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;
获得所述驾驶员对所述语音识别结果的反馈信息;
根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
本发明实施例提供的一种语音识别训练系统,所述语音识别训练系统位于车机,包括:
接收模块,接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;
识别模块,响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;
获得模块,获得所述驾驶员对所述语音识别结果的反馈信息;
确定模块,根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
本发明实施例提供的语音识别训练方法及系统,使得驾驶员可以对车机的语音识别功能进行个性化训练,个性化训练可以扩充语音识别功能对应的语料库,经过所述个性化训练的语音识别功能可以更好地适应于复杂的行车环境,也可以更好地适应于不同驾驶员的不同语言习惯,因此,有利于提高车机场景下的语音识别准确率,可以部分或全部地解决现有技术中的问题。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音识别训练方法的流程示意图;
图2本发明实施例提供的一种实际应用场景下,采集语音数据的流程示意图;
图3为本发明实施例提供的图1中语音识别训练方法的一种详细流程图;
图4为本发明实施例提供的对应于图1的一种语音识别训练系统的结构示意图;
图5a为本发明实施例提供的一种实际应用场景下展示了语音识别训练结果的车机界面示意图;
图5b为本发明实施例提供的驾驶员A正在点击选择图5a中的第二个候选结果的车机界面示意图;
图5c为本发明实施例提供的驾驶员A点击选择图5a中的第二个候选结果后车机开始导航的界面示意图;
图5d为本发明实施例提供的驾驶员A在训练后就相同语音内容再次进行语音识别的一种车机界面示意图;
图5e为本发明实施例提供的驾驶员A在训练后就相同语音内容再次进行语音识别的另一种车机界面示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的方案不仅可以适用于车机场景,同样也适用于应用了语音识别功能的其他场景,比如,手机场景(语音输入、语音控制等)等。
在车机场景下,由于存在背景技术中提到的一些特殊情况,包括但不限于:车机上的语音识别功能对应的语料库一般比较小,而车机对应的行车环境比较复杂,不同的驾驶员语言习惯不同等。因此,更能突出本发明的方案的优势,以下主要基于车机场景,对本发明的方案进行说明。
本发明的核心思想是:可以采集用户的语音数据并以此为依据对用户进行识别,而且还给用户提供自主训练语音识别功能的便利途径,从而使得语音识别功能能够适应于具体的用户和/或具体的环境,而不是向现有技术那样强迫用户去适应语音识别功能,不仅如此,这种训练可以是个性化的,即使语音识别功能所处载体有多个用户,各用户也可以相对独立地分别对语音识别功能进行训练,从而可以进一步地提高语音识别功能的适用性和可靠性。
在车机场景下,所述载体可以是车机,所述用户可以为驾驶员,所述环境可以是行车环境。
图1为本发明实施例提供的一种语音识别训练方法的流程示意图。从程序的角度而言,该流程的执行主体可以是搭载于设备上的应用,或者设备的操作系统,所述应用和/或所述操作系统中可以包含用于具体执行该流程的语音识别训练系统;从设备的角度而言,该流程的执行主体可以是终端或服务器等。
所述终端可以是移动终端,比如,车机、手机、平板电脑、车机、笔记本电脑、智能可穿戴设备(如智能手表、智能手环)等;所述终端也可以是非移动终端,比如,个人计算机(PC)、大中型计算机、计算机集群等;所述服务器可以是位于网络端与所述终端相连接,并可以为所述终端提供服务的设备,比如云端语音识别引擎等。
为了便于描述,以下各实施例主要以车机(可以包括直接位于车辆上的本地部分,当存在网络端部分时,还可以进一步地包括网络端部分)作为执行主体。
图1中的流程可以包括以下步骤:
S101:车机接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达。
在本发明实施例中,所述车机支持语音识别功能,针对所述车机的语音识别训练的流程可以是:在驾驶员正常使用语音识别功能的过程中共同进行的,也即,在使用过程中顺便训练;或者,在驾驶员正常使用语音识别功能的过程之外独立进行的,也即,使用与训练分开进行。前一种方式的优点是便于驾驶员在识别结果出错时实时地进行训练以纠正;后一种方式的优点是对驾驶员正常使用语音识别的过程干扰少。
在本发明实施例中,驾驶员可以通过对车机进行相应的硬件操作或软件操作,下达语音识别训练指令。其中,所述硬件操作包括但不限于:接触触摸屏、按下实体按钮等。所述软件操作包括但不限于:点击虚拟按钮控件、滑动虚拟滑块控件等。
另外,当车机的语音识别功能处于开启状态时,驾驶员也可以直接通过语音来下达语音识别训练指令,在采用上述第一种方式的情况下,用于下达语音识别训练指令的语音内容可以不限,只要驾驶员发声即可以表示当前正在使用并训练语音识别功能,在采用上述第二种方式的情况下,用于下达语音识别训练指令的语音内容一般可以是预先在车机上设定的特殊语句,诸如“开始训练”等。
在本发明实施例中,所述车机对应的驾驶员指:该车机所处车辆的驾驶员。同一车辆的驾驶员可以只有一个,也可以有多个。需要说明的是,在实际应用中,由于车机的语音识别功能也并非只有驾驶员使用,乘客也可能使用,比如,私家车的驾驶员的家人可能会通过语音来点播车机上的视频等,因此,也可以由所述车机对应的乘客来下达语音识别训练指令,在这种情况下,可以将本发明的方案中的驾驶员替换为乘客即可,以下不再赘述。
S102:响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果。
在本发明实施例中,可以预先采集所述驾驶员的语音数据并进行相应处理(这个过程既可以包含本发明的训练过程,也可以与训练过程相对独立),则在执行步骤S102时可以所述语音数据为依据,对所述驾驶员进行语音识别,有利于提高识别准确率。
当然,可以不预先采集所述驾驶员的语音数据,而是直接以预定的语料库为依据,对所述驾驶员进行语音识别,在识别过程中实时地进行训练,等等。
在本发明实施例中,所述语音识别结果可以只包含一个确定的结果,也可以包括多个不确定的结果,为了便于描述,将这些结果统称为:候选结果。一般地,若语音识别结果包含多个不确定的结果,所述多个不确定的结果也是有优先级顺序的,车机可以默认将优先级最高的结果选中,或者等待用户选中一个结果,进而将选中的结果作为确定的结果。
在本发明实施例中,对所述驾驶员的当前语音的识别过程中通常有行车环境噪音的干扰,驾驶员可以在不同的行车环境下,对内容相同的语音进行语音识别训练,进而有利于提高车机在复杂的行车环境下的语音识别准确率。
S103:获得所述驾驶员对所述语音识别结果的反馈信息。
在本发明实施例中,可以将语音识别结果展示(比如语音输入的情况),或者,将语音识别结果直接应用在后续动作中(比如,语音控制的情况),而不展示给用户。
进一步地,驾驶员根据展示的语音识别结果,或者根据语音识别结果所导致的后续动作,可以确定语音识别结果是否准确,进而可以给出相应的反馈信息。
S104:根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
在本发明实施例中,所述反馈信息的形式可以有多种。
比如,若驾驶员确定语音识别结果不准确(可以包括语音识别结果所导致的后续操作不符合用户预期、各候选结果中没有准确结果、虽然有准确结果但是优先级并非最高这三种情况)。
对于第一、二种情况,驾驶员可以自行输入准确结果作为反馈信息,对于第三种情况,驾驶员可以在各候选结果中选中准确结果作为反馈信息。则可以确定反馈信息及其对应的步骤S102中所识别的语音(即为驾驶员新提供的个性化语料)为:所述当前语音对应的语音识别训练结果。
另外,驾驶员也可以不亲自确定准确结果,而是只发出用于表明语音识别结果不准确的反馈信息,则车机可以根据该反馈信息重新进行语音识别,如此反复,直至得到准确的语音识别结果,作为所述当前语音对应的语音识别训练结果。
又比如,若驾驶员确定语音识别结果准确,可以不做诸如输入结果或选中结果等特殊操作,这也可以视为一种反馈信息,车机在一定时间内未检测到所述特殊操作,则可以认为接收到该反馈信息。则可以确定语音识别结果及其对应的步骤S102中所识别的语音为:所述当前语音对应的语音识别训练结果。
若语音识别结果不准确,车机在确定语音识别训练结果后,可以根据语音识别训练结果,对语音识别功能进行相应的修正(比如,更新语料库、调整语音识别算法参数等),以便于下次对驾驶员相同内容的语音进行识别时,可以提高识别准确率。
例如,下次对驾驶员相同内容的语音进行识别时,具体可以将步骤S102中所识别的语音与所述相同内容的语音进行模式匹配,若匹配成功,可以直接从步骤S104的语音识别训练结果中获得比较准确的识别结果。
通过图1中的方法,使得驾驶员可以对车机的语音识别功能进行个性化训练,个性化训练可以扩充语音识别功能对应的语料库,经过所述个性化训练的语音识别功能可以更好地适应于复杂的行车环境,也可以更好地适应于不同驾驶员的不同语言习惯,因此,有利于提高车机场景下的语音识别准确率,可以部分或全部地解决现有技术中的问题。
基于图1中的方法,本发明实施例还提供了该方法的一些具体实施方案,以及扩展方案,下面进行说明。
在本发明实施例中,如前所述,对于步骤S101,接收到语音识别训练指令前,还可以执行:所述车机采集所述驾驶员的语音数据;将所述驾驶员的语音数据上传至网络端和/或保存于本地。
进一步地,采集所述驾驶员的语音数据一般是有选择性地,这种选择通常是以一个预定的语料库作为基准进行的。在这种情况下,所述车机采集所述驾驶员的语音数据,具体可以包括:所述车机从网络端的语料库获得语料;根据所述语料,采集所述驾驶员的语音数据。当前,在实际应用中,也可以不限于已有的语料库,而是可以由所述驾驶员主动对语料进行扩充,提供更多的语音数据,如此更有利于提高个性化识别准确率。
更进一步的,在预先采集了所述驾驶员的语音数据的情况下,对于步骤S102,对所述驾驶员的当前语音进行识别,具体包括:根据所述语音数据,对所述驾驶员的当前语音进行识别。
为了便于理解,本发明实施例提供了一种实际应用场景下,采集语音数据的流程示意图,如图2所示。
图2中的流程可以包括以下步骤:
S201:从云端的语料库下载语料。
S202:根据下载的语料逐条采集驾驶员的语音数据。
S203:将采集到的驾驶员的语音数据上传到云端的语音识别引擎或保存在本地。
在实际应用中,对于步骤S104,所确定的所述当前语音对应的语音识别训练结果也未必准确,为此,还可以允许驾驶员对语音识别训练结果进一步地进行测试,在测试通过后,再根据语音识别训练结果修正语音识别功能,否则,可以重新进行训练,或者重新确定语音识别训练结果,从而有利于提高后续修正的可靠性。
在本发明实施例中,基于上一段中的考虑,对于步骤S104,确定所述当前语音对应的语音识别训练结果后,还可以执行:所述车机接收到针对所述训练结果的测试指令;响应于所述测试指令,根据所述训练结果,对所述驾驶员的当前语音进行识别,得到测试结果;在接收到所述驾驶员对所述测试结果的确认指令后,根据所述测试结果确定语音识别标准结果。其中,所述语音识别标准结果可以是所述测试结果以及对应的语音。
进而,可以用语音识别标准结果对语音识别功能进行修正,以作为以后对该驾驶员语音识别的依据。
测试指令的下达方式可以与训练指令的下达方式类似,不再赘述。在测试过程中,所识别的语音可以是步骤S102中识别的语音,也可以是驾驶员重新发出的、与步骤S102中识别的语音至少部分内容相同的语音。
在本发明实施例中,前面已经提到,图1中的训练可以是个性化的训练,个性化可以体现在可以有不同的驾驶员分别对同一个车机进行训练,如此可以实现:对于同样内容的不同语音(分别来自不同的驾驶员),可以训练得到同样的语音识别训练结果,从而有利于减少不同驾驶员的不同语言习惯对识别准确率的影响。
相应地,车机进行语音识别时也可以针对不同的驾驶员差异化地进行识别,为了便于车机区别不同的驾驶员,可以让不同的驾驶员采用不同的个人账号信息登录车机后再使用语音识别功能。具体地,对于步骤S101,所述车机对应的驾驶员可以有一名或多名,车机接收到语音识别训练指令前,还可以执行:所述车机接收到所述一名或多名中的一名驾驶员基于其个人账号信息的登录请求;在对该个人账号信息验证成功后,使该驾驶员处于已登录状态。
进一步地,对于步骤S102,对所述驾驶员的当前语音进行识别,具体可以包括:确定与所述处于已登录状态的该驾驶员匹配的识别模式;采用确定的所述识别模式,对该驾驶员的当前语音进行识别。车机的语音识别功能可以包含多种识别模式,不同的驾驶员可以分别对应于不同的识别模式。每种识别模式可以反映其对应的驾驶员对语音识别功能的训练历史数据,因此,采用与当前驾驶员匹配的识别模式进行语音识别的话,有利于提高识别准确率。
更进一步地,对于步骤S104,根据所述反馈信息,确定所述当前语音对应的语音识别训练结果后,还可以执行:根据所述语音识别训练结果,对该驾驶员匹配的识别模式进行修正。
该修正即为前面提到的对语音识别功能的修正,进一步地该修正后续可以仅作用于对该驾驶员的语音识别过程,而若包括该驾驶员在内的多个驾驶员匹配于相同的识别模式,则该修正后续可以均作用于对所述多个驾驶员的语音识别过程。
另外,对于步骤S103,如前所述,所述语音识别结果可以包含一个或多个候选结果,则获得所述驾驶员对所述语音识别结果的反馈信息,具体可以包括:展示所述一个或多个候选结果;获得所述驾驶员在展示的所述一个或多个候选结果中所选择的候选结果作为所述驾驶员对所述语音识别结果的反馈信息,或者,获得所述驾驶员所输入的所述一个或多个候选结果以外的反馈信息。
基于上述说明,本发明实施例还提供了图1中语音识别训练方法的一种实施过程图,如图3所示。
S301:驾驶员使用个人账号信息登录车机的语音识别训练系统。
S302:驾驶员向语音识别训练系统下达语音识别训练指令,开始进行语音识别训练。
S303:语音识别训练系统采用匹配于驾驶员的语音识别模式,对所述驾驶员的当前语音进行识别,得到包含多个候选结果的语音识别结果,并展示给驾驶员。
S304:驾驶员若确定语音识别结果中未包含准确结果,则手动输入准确结果,若确定语音识别结果中包含准确结果但优先级并非最高,则选择准确结果。
S305:驾驶员在语音识别训练系统将准确结果记录为语音识别训练结果后,下达针对语音识别训练结果的测试指令。
S306:语音识别训练系统根据训练结果,驾驶员相同内容的语音进行识别,得到测试结果。
S307:驾驶员若对测试结果满意,则下达对测试结果的确认指令。
S308:语音识别训练系统响应于确认指令,根据测试结果或语音识别训练结果,对驾驶员的语音识别模式进行持久化修正。
以上为本发明实施例提供的语音识别训练方法,基于同样的思路,本发明实施例还提供相应的系统,如图4所示。
图4为本发明实施例提供的对应于图1的一种语音识别训练系统的结构示意图,所述语音识别训练系统位于车机,包括:
接收模块401,接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;
识别模块402,响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;
获得模块403,获得所述驾驶员对所述语音识别结果的反馈信息;
确定模块404,根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
可选地,所述系统还包括:
采集模块405,在所述接收模块401接收到语音识别训练指令前,采集所述驾驶员的语音数据;将所述驾驶员的语音数据上传至网络端和/或保存于本地。
可选地,所述采集模块405采集所述驾驶员的语音数据,具体包括:
所述采集模块405从网络端的语料库获得语料,根据所述语料,采集所述驾驶员的语音数据。
可选地,所述识别模块402对所述驾驶员的当前语音进行识别,具体包括:
所述识别模块402根据所述语音数据,对所述驾驶员的当前语音进行识别。
可选地,所述系统还包括:
测试模块406,在所述确定模块404确定所述当前语音对应的语音识别训练结果后,接收到针对所述训练结果的测试指令,响应于所述测试指令,根据所述训练结果,对所述驾驶员的当前语音进行识别,得到测试结果,在接收到所述驾驶员对所述测试结果的确认指令后,根据所述测试结果确定语音识别标准结果。
可选地,所述车机对应的驾驶员有一名或多名;
所述系统还包括:
登录模块407,在所述接收模块401接收到语音识别训练指令前,接收到所述一名或多名中的一名驾驶员基于其个人账号信息的登录请求,在对该个人账号信息验证成功后,使该驾驶员处于已登录状态。
可选地,所述识别模块402对所述驾驶员的当前语音进行识别,具体包括:
所述识别模块402确定与所述处于已登录状态的该驾驶员匹配的识别模式,采用确定的所述识别模式,对该驾驶员的当前语音进行识别。
可选地,所述语音识别结果包含一个或多个候选结果,所述获得模块403获得所述驾驶员对所述语音识别结果的反馈信息,具体包括:
所述获得模块403展示所述一个或多个候选结果;
获得所述驾驶员在展示的所述一个或多个候选结果中所选择的候选结果作为所述驾驶员对所述语音识别结果的反馈信息,或者,获得所述驾驶员所输入的所述一个或多个候选结果以外的反馈信息。
可选地,所述系统还包括:
修正模块408,在所述确定模块根据所述反馈信息,确定所述当前语音对应的语音识别训练结果后,根据所述语音识别训练结果,对该驾驶员匹配的识别模式进行修正。
通过本发明实施例提供的语音识别训练系统,使得驾驶员可以对车机的语音识别功能进行个性化训练,个性化训练可以扩充语音识别功能对应的语料库,经过所述个性化训练的语音识别功能可以更好地适应于复杂的行车环境,也可以更好地适应于不同驾驶员的不同语言习惯,因此,有利于提高车机场景下的语音识别准确率,可以部分或全部地解决现有技术中的问题。
以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
为了便于理解,本发明实施例还提供了一种实际应用场景下的语音识别训练方法的实施过程。
在该实际应用场景下,驾驶员A家里有一辆车,该车的车机系统中设定有对应的三名驾驶员,驾驶员A、驾驶员B和驾驶员C,车机系统(包含有本发明实施例提供的语音识别训练系统)分别记录了每个驾驶员的个性化数据,至少包括每个驾驶员匹配的语音识别模式,还可以包括诸如每个后视镜调节参数、座椅调节参数、音响基本设置等其他数据。
假定在某个时刻,驾驶员A作为该车的当前驾驶员,驾驶员A可以用自己的个人账号信息登录车机系统(若驾驶员A之前已处于登录状态,则可以省略登录步骤),驾驶员A已处于登录状态期间,若对车机的语音识别结果准确率不满意,可以随时通过语音识别训练系统进行个性化语音识别训练,训练完成后,语音识别训练系统还可以进一步地对得到的语音识别训练结果进行测试,若驾驶员A对测试结果满意,则可以将语音识别训练结果作为语音识别标准结果,并对自身匹配的语音识别模式进行相应地修正,以便于下次使用。
当然,驾驶员A也可以在正常使用车机的语音识别功能的过程中,同步地进行语音识别训练。
例如,驾驶员A发出语音“导航到五棵松”(根据上述步骤S101中的说明,该语音也可以视为语音识别训练指令),车机通过对该语音进行识别,得到并展示包含多个候选结果的语音识别结果,假定这多个候选结果分别为:01、“导航到六棵松”;02、“导航到五棵松”;03、“导航到七棵松”;04、“导航到八棵松”,其中,各候选结果优先级顺序依次降低。
若驾驶员A不选择,也即,驾驶员A的反馈信息表明优先级最高的候选结果为准确结果。则车机默认按照优先级最高的候选结果“导航到六棵松”执行后续导航动作。
若驾驶员A选择了第二个候选结果“导航到五棵松”,也即,驾驶员A的反馈信息表明优先级最高的候选结果为不准确结果,且该反馈信息表明准确结果为第二个候选结果。则车机可以记录驾驶员A的选择(可以通过对驾驶员A匹配的语音识别模式进行修正实现),下次在此识别驾驶员A的语音“导航到五棵松”,可以直接给出识别结果“导航到五棵松”,或者仍给出包括“导航到五棵松”在内的多个候选结果,且候选结果“导航到五棵松”的优先级最高。
以上是以驾驶员A作为该车的当前驾驶员为例进行说明的,驾驶员B或驾驶员C同理,不同之处在于登录的个人账号信息不同,匹配的语音识别模式可以不同。
本发明实施例还提供了上例的一些效果示意图,如图5a~5e所示,在图5a~5e中,驾驶员A已经处于登录状态。
图5a为本发明实施例提供的一种实际应用场景下展示了语音识别训练结果的车机界面示意图,是驾驶员A发出的语音“导航到五棵松”所对应的语音识别训练结果。
图5b为本发明实施例提供的驾驶员A正在点击选择图5a中的第二个候选结果的车机界面示意图。
图5c为本发明实施例提供的驾驶员A点击选择图5a中的第二个候选结果后车机开始导航的界面示意图。可以看到,车机是按照驾驶员A所选择的候选结果进行导航的。
图5d为本发明实施例提供的驾驶员A在训练后就相同语音内容“导航到五棵松”再次进行语音识别的一种车机界面示意图。在图5d的情况下,车机直接展示了准确的语音识别结果。
图5e为本发明实施例提供的驾驶员A在训练后就相同语音内容再次进行语音识别的另一种车机界面示意图。在图5d的情况下,车机仍然展示了多个候选结果,且优先级最高的候选结果是准确的语音识别结果。
需要说明的是,图5a~5e中的车机样式和车机界面内容仅是示例,是为了帮助理解本发明的方案,而并非是对本发明的方案的限定。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (18)

1.一种语音识别训练方法,其特征在于,包括:
车机接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;
响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;
获得所述驾驶员对所述语音识别结果的反馈信息;
根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
2.根据权利要求1所述的方法,其特征在于,接收到语音识别训练指令前,所述方法还包括:
所述车机采集所述驾驶员的语音数据;
将所述驾驶员的语音数据上传至网络端和/或保存于本地。
3.根据权利要求2所述的方法,所述车机采集所述驾驶员的语音数据,具体包括:
所述车机从网络端的语料库获得语料;
根据所述语料,采集所述驾驶员的语音数据。
4.根据权利要求2所述的方法,其特征在于,对所述驾驶员的当前语音进行识别,具体包括:
根据所述语音数据,对所述驾驶员的当前语音进行识别。
5.根据权利要求1所述的方法,其特征在于,确定所述当前语音对应的语音识别训练结果后,所述方法还包括:
所述车机接收到针对所述训练结果的测试指令;
响应于所述测试指令,根据所述训练结果,对所述驾驶员的当前语音进行识别,得到测试结果;
在接收到所述驾驶员对所述测试结果的确认指令后,根据所述测试结果确定语音识别标准结果。
6.根据权利要求1所述的方法,其特征在于,所述车机对应的驾驶员有一名或多名;
车机接收到语音识别训练指令前,所述方法还包括:
所述车机接收到所述一名或多名中的一名驾驶员基于其个人账号信息的登录请求;
在对该个人账号信息验证成功后,使该驾驶员处于已登录状态。
7.根据权利要求6所述的方法,其特征在于,对所述驾驶员的当前语音进行识别,具体包括:
确定与所述处于已登录状态的该驾驶员匹配的识别模式;
采用确定的所述识别模式,对该驾驶员的当前语音进行识别。
8.根据权利要求1~7任一项所述的方法,其特征在于,所述语音识别结果包含一个或多个候选结果;
获得所述驾驶员对所述语音识别结果的反馈信息,具体包括:
展示所述一个或多个候选结果;
获得所述驾驶员在展示的所述一个或多个候选结果中所选择的候选结果作为所述驾驶员对所述语音识别结果的反馈信息,或者,获得所述驾驶员所输入的所述一个或多个候选结果以外的反馈信息。
9.根据权利要求7所述的方法,其特征在于,根据所述反馈信息,确定所述当前语音对应的语音识别训练结果后,所述方法还包括:
根据所述语音识别训练结果,对该驾驶员匹配的识别模式进行修正。
10.一种语音识别训练系统,其特征在于,所述语音识别训练系统位于车机,包括:
接收模块,接收到语音识别训练指令,所述训练指令由所述车机对应的驾驶员下达;
识别模块,响应于所述训练指令,对所述驾驶员的当前语音进行识别,得到语音识别结果;
获得模块,获得所述驾驶员对所述语音识别结果的反馈信息;
确定模块,根据所述反馈信息,确定所述当前语音对应的语音识别训练结果。
11.根据权利要求10所述的系统,其特征在于,所述系统还包括:
采集模块,在所述接收模块接收到语音识别训练指令前,采集所述驾驶员的语音数据,将所述驾驶员的语音数据上传至网络端和/或保存于本地。
12.根据权利要求11所述的系统,其特征在于,所述采集模块采集所述驾驶员的语音数据,具体包括:
所述采集模块从网络端的语料库获得语料,根据所述语料,采集所述驾驶员的语音数据。
13.根据权利要求11所述的系统,其特征在于,所述识别模块对所述驾驶员的当前语音进行识别,具体包括:
所述识别模块根据所述语音数据,对所述驾驶员的当前语音进行识别。
14.根据权利要求10所述的系统,其特征在于,所述系统还包括:
测试模块,在所述确定模块确定所述当前语音对应的音识别训练语结果后,接收到针对所述训练结果的测试指令,响应于所述测试指令,根据所述训练结果,对所述驾驶员的当前语音进行识别,得到测试结果,在接收到所述驾驶员对所述测试结果的确认指令后,根据所述测试结果确定语音识别标准结果。
15.根据权利要求10所述的系统,其特征在于,所述车机对应的驾驶员有一名或多名;
所述系统还包括:
登录模块,在所述接收模块接收到语音识别训练指令前,接收到所述一名或多名中的一名驾驶员基于其个人账号信息的登录请求,在对该个人账号信息验证成功后,使该驾驶员处于已登录状态。
16.根据权利要求15所述的系统,其特征在于,所述识别模块对所述驾驶员的当前语音进行识别,具体包括:
所述识别模块确定与所述处于已登录状态的该驾驶员匹配的识别模式,采用确定的所述识别模式,对该驾驶员的当前语音进行识别。
17.根据权利要求10~16任一项所述的系统,其特征在于,所述语音识别结果包含一个或多个候选结果,所述获得模块获得所述驾驶员对所述语音识别结果的反馈信息,具体包括:
所述获得模块展示所述一个或多个候选结果;
获得所述驾驶员在展示的所述一个或多个候选结果中所选择的候选结果作为所述驾驶员对所述语音识别结果的反馈信息,或者,获得所述驾驶员所输入的所述一个或多个候选结果以外的反馈信息。
18.根据权利要求16所述的系统,其特征在于,所述系统还包括:
修正模块,在所述确定模块根据所述反馈信息,确定所述当前语音对应的语音识别训练结果后,根据所述语音识别训练结果,对该驾驶员匹配的识别模式进行修正。
CN201610875636.XA 2016-09-30 2016-09-30 一种语音识别训练方法及系统 Withdrawn CN107895572A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610875636.XA CN107895572A (zh) 2016-09-30 2016-09-30 一种语音识别训练方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610875636.XA CN107895572A (zh) 2016-09-30 2016-09-30 一种语音识别训练方法及系统

Publications (1)

Publication Number Publication Date
CN107895572A true CN107895572A (zh) 2018-04-10

Family

ID=61802494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610875636.XA Withdrawn CN107895572A (zh) 2016-09-30 2016-09-30 一种语音识别训练方法及系统

Country Status (1)

Country Link
CN (1) CN107895572A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109448726A (zh) * 2019-01-14 2019-03-08 李庆湧 一种语音控制准确率的调整方法及系统
CN110126725A (zh) * 2019-05-22 2019-08-16 广州小鹏汽车科技有限公司 车辆仪表盘指示灯的提示方法、装置及车辆
CN110473543A (zh) * 2019-09-25 2019-11-19 北京蓦然认知科技有限公司 一种语音识别方法、装置
CN110675871A (zh) * 2019-09-25 2020-01-10 北京蓦然认知科技有限公司 一种语音识别方法及装置
CN111800228A (zh) * 2020-07-09 2020-10-20 武汉普西芯电子技术有限责任公司 一种车联网信息处理系统
WO2021134551A1 (zh) * 2019-12-31 2021-07-08 李庆远 多个机器翻译输出的人类合并和训练
WO2021179144A1 (zh) * 2020-03-09 2021-09-16 华为技术有限公司 一种车机系统登录方法及相关装置
CN113453135A (zh) * 2020-03-24 2021-09-28 钉钉控股(开曼)有限公司 智能音箱优化方法及测试方法、装置、设备和存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543076A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 用于语音输入法的语音训练方法及相应的系统
CN104123936A (zh) * 2013-04-25 2014-10-29 伊莱比特汽车公司 对话系统自动训练方法、对话系统及用于车辆的控制装置
CN104538032A (zh) * 2014-12-19 2015-04-22 中国科学院计算技术研究所 一种融合用户反馈的汉语语音识别方法及系统
CN104795065A (zh) * 2015-04-30 2015-07-22 北京车音网科技有限公司 一种提高语音识别率的方法和电子设备
CN104882142A (zh) * 2015-04-30 2015-09-02 大连楼兰科技股份有限公司 基于obd接口的车载设备的语音控制方法及装置
CN105006229A (zh) * 2014-04-24 2015-10-28 福特全球技术公司 用于包括车辆更新的额外车辆语音识别训练的方法和设备
CN105306648A (zh) * 2014-07-17 2016-02-03 福特全球技术公司 具有学习能力的基于车辆状态的免提电话自适应降噪
CN105869634A (zh) * 2016-03-31 2016-08-17 重庆大学 一种基于领域的带反馈语音识别后文本纠错方法及系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102543076A (zh) * 2011-01-04 2012-07-04 中国移动通信集团公司 用于语音输入法的语音训练方法及相应的系统
CN104123936A (zh) * 2013-04-25 2014-10-29 伊莱比特汽车公司 对话系统自动训练方法、对话系统及用于车辆的控制装置
CN105006229A (zh) * 2014-04-24 2015-10-28 福特全球技术公司 用于包括车辆更新的额外车辆语音识别训练的方法和设备
CN105306648A (zh) * 2014-07-17 2016-02-03 福特全球技术公司 具有学习能力的基于车辆状态的免提电话自适应降噪
CN104538032A (zh) * 2014-12-19 2015-04-22 中国科学院计算技术研究所 一种融合用户反馈的汉语语音识别方法及系统
CN104795065A (zh) * 2015-04-30 2015-07-22 北京车音网科技有限公司 一种提高语音识别率的方法和电子设备
CN104882142A (zh) * 2015-04-30 2015-09-02 大连楼兰科技股份有限公司 基于obd接口的车载设备的语音控制方法及装置
CN105869634A (zh) * 2016-03-31 2016-08-17 重庆大学 一种基于领域的带反馈语音识别后文本纠错方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109448726A (zh) * 2019-01-14 2019-03-08 李庆湧 一种语音控制准确率的调整方法及系统
CN110126725A (zh) * 2019-05-22 2019-08-16 广州小鹏汽车科技有限公司 车辆仪表盘指示灯的提示方法、装置及车辆
CN110473543A (zh) * 2019-09-25 2019-11-19 北京蓦然认知科技有限公司 一种语音识别方法、装置
CN110675871A (zh) * 2019-09-25 2020-01-10 北京蓦然认知科技有限公司 一种语音识别方法及装置
WO2021134551A1 (zh) * 2019-12-31 2021-07-08 李庆远 多个机器翻译输出的人类合并和训练
WO2021179144A1 (zh) * 2020-03-09 2021-09-16 华为技术有限公司 一种车机系统登录方法及相关装置
CN113453135A (zh) * 2020-03-24 2021-09-28 钉钉控股(开曼)有限公司 智能音箱优化方法及测试方法、装置、设备和存储介质
CN111800228A (zh) * 2020-07-09 2020-10-20 武汉普西芯电子技术有限责任公司 一种车联网信息处理系统

Similar Documents

Publication Publication Date Title
CN107895572A (zh) 一种语音识别训练方法及系统
CN105989841B (zh) 车载语音控制方法及装置
US10913463B2 (en) Gesture based control of autonomous vehicles
CN110465947B (zh) 多模态融合人机交互方法、装置、存储介质、终端及系统
CN105225660B (zh) 语音系统的适应方法和系统
CN111026873B (zh) 无人车及其导航方法、装置
US20190114937A1 (en) Grouping users by problematic objectives
CN110737339B (zh) 基于深度学习的视觉—触觉交互模型构建方法
CN109102802A (zh) 用于处理用户话语的系统
CN105915831A (zh) 声音记录装置以及声音记录方法
WO2013059726A1 (en) Systems, devices and methods for list display and management
CN107077380A (zh) 用于模块仲裁的方法和装置
CN111339302A (zh) 训练要素分类模型的方法和装置
US20230108256A1 (en) Conversational artificial intelligence system in a virtual reality space
US20130325483A1 (en) Dialogue models for vehicle occupants
CN105955459A (zh) 一种控制车载电子设备的方法及设备
US10541884B2 (en) Simulating a user score from input objectives
CN108805035A (zh) 基于手势识别的教学互动方法以及装置
Bonial et al. Laying down the yellow brick road: Development of a wizard-of-oz interface for collecting human-robot dialogue
CN108009076A (zh) 车载用户界面的评估及优化方法
CN109637525A (zh) 用于生成车载声学模型的方法和装置
JP6281202B2 (ja) 応答制御システム、およびセンター
CN114327185A (zh) 一种车机屏幕控制方法、装置、介质及电子设备
CN106372203A (zh) 一种智能终端的信息响应方法、装置和智能终端
CN106782546A (zh) 语音识别方法与装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100025 8 floor 909, 105 building 3, Yao Yuan Road, Chaoyang District, Beijing.

Applicant after: Lexus Automobile (Beijing) Co.,Ltd.

Address before: 100026 8 floor 909, 105 building 3, Yao Yuan Road, Chaoyang District, Beijing.

Applicant before: FARADAY (BEIJING) NETWORK TECHNOLOGY Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20180927

Address after: 511458 9, Nansha District Beach Road, Guangzhou, Guangdong, 9

Applicant after: Evergrande Faraday Future Smart Car (Guangdong) Co.,Ltd.

Address before: 100025 8 floor 909, 105 building 3, Yao Yuan Road, Chaoyang District, Beijing.

Applicant before: Lexus Automobile (Beijing) Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190401

Address after: 100015 Building No. 7, 74, Jiuxianqiao North Road, Chaoyang District, Beijing, 001

Applicant after: FAFA Automobile (China) Co.,Ltd.

Address before: 511458 9, Nansha District Beach Road, Guangzhou, Guangdong, 9

Applicant before: Evergrande Faraday Future Smart Car (Guangdong) Co.,Ltd.

WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20180410