CN110136700A - 一种语音信息处理方法及装置 - Google Patents

一种语音信息处理方法及装置 Download PDF

Info

Publication number
CN110136700A
CN110136700A CN201910198311.6A CN201910198311A CN110136700A CN 110136700 A CN110136700 A CN 110136700A CN 201910198311 A CN201910198311 A CN 201910198311A CN 110136700 A CN110136700 A CN 110136700A
Authority
CN
China
Prior art keywords
voice messaging
target
semantic
target user
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910198311.6A
Other languages
English (en)
Other versions
CN110136700B (zh
Inventor
杨竞喆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ecarx Hubei Tech Co Ltd
Original Assignee
Hubei Ecarx Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Ecarx Technology Co Ltd filed Critical Hubei Ecarx Technology Co Ltd
Priority to CN201910198311.6A priority Critical patent/CN110136700B/zh
Publication of CN110136700A publication Critical patent/CN110136700A/zh
Application granted granted Critical
Publication of CN110136700B publication Critical patent/CN110136700B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling

Abstract

本发明公开了一种语音信息处理方法及装置,其中,语音信息处理方法包括:获取目标用户的语音信息;基于目标用户语义库对所述语音信息进行第一语义匹配;当第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的目标用户的同义语音信息;基于目标用户语义库对同义语音信息进行第二语义匹配;当第二语义匹配的结果为匹配成功时,获取与同义语音信息相匹配的目标语义;将语音信息、同义语音信息以及目标语义的对应关系存储至目标用户语义库中。本发明在目标用户的实际语音交互过程中建立了与目标用户的说话习惯相匹配的目标用户语义库,进而降低了交互难度,提高了交互效率和交互结果的准确性,提升了用户体验效果。

Description

一种语音信息处理方法及装置
技术领域
本发明涉及自然语言处理技术领域,特别涉及一种语音信息处理方法及装置。
背景技术
随着人工智能技术的快速发展,人们越来越多地使用智能设备获取各种智能化服务,如智能设备可以通过语音交互的方式获取用户输入的语音信息,通过对语音信息进行识别处理得到对应的识别文本,再对该识别文本进行语义理解处理得到对应的语义理解结果,并将该语义理解结果反馈给用户,从而使得用户轻轻松松的获得所需要的信息。
在实现本发明的过程中,发明人发现现有技术中至少存在以下缺陷:
相关技术中,智能设备所支持的语义都是通过对大量用户的语音交互数据进行学习后,预先定义好的通用语义。在实际使用中,用户必须输入智能设备通用语义中指定的语音信息,才能获得与该语音信息对应的目标语义,从而存在交互过程难度高,反馈的交互结果准确性低以及交互效率低的问题,降低了用户的体验效果。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种语音信息处理方法及装置。所述技术方案如下:
一方面,提供了一种语音信息处理方法,所述方法包括:
获取目标用户的语音信息;
基于目标用户语义库对所述语音信息进行第一语义匹配;
当所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息;
基于目标用户语义库对所述同义语音信息进行第二语义匹配;
当所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义;
将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
进一步的,所述将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中包括:
建立所述语音信息、同义语音信息以及所述目标语义的对应关系;
将所述对应关系标识为待确认;
将所述标识为待确认的对应关系存储至所述目标用户语义库中。
进一步的,所述基于目标用户语义库对所述语音信息进行第一语义匹配包括:
根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义;
当未查找到所述语音信息对应的目标语义时,确定所述第一语义匹配的结果为未匹配成功。
进一步的,所述方法还包括:
当查找到所述语音信息对应的目标语义时,判断包含所述语音信息以及目标语义的目标对应关系是否为待确认;
若所述目标对应关系为待确认,则获取所述目标对应关系中的同义语音信息;
将所述同义语音信息反馈给所述目标用户,以使得所述目标用户根据所述同义语音信息对所述目标对应关系进行确认;
根据确认的结果,确定所述第一语义匹配的结果是否匹配成功。
进一步的,所述根据确认的结果,确定所述第一语义匹配的结果是否匹配成功包括:
当所述确认的结果为确认同意时,确定所述第一语义匹配的结果为匹配成功;
当所述确认的结果为确认不同意时,确定所述第一语义匹配的结果为未匹配成功。
进一步的,在所述第一语义匹配的结果为匹配成功之后,所述方法还包括:
取消所述目标对应关系的待确认标识。
进一步的,所述方法还包括:
若所述目标对应关系为非待确认,则基于所述目标对应关系获取与所述语音信息对应的目标语义;
向所述目标用户反馈所述目标语义;
当获取到所述目标用户反馈的不同意所述目标语义的信息时,确定所述第一语义匹配的结果为未匹配成功。
进一步的,在获取与所述语音信息相对应的所述目标用户的同义语音信息之前,所述方法还包括:
向所述目标用户反馈提示信息;所述提示信息用于提示所述目标用户输入所述语音信息的同义语音信息。
进一步的,所述方法还包括:
当所述第二语义匹配的结果为未匹配成功时,获取所述第二语义匹配执行的总次数;
判断所述总次数是否达到预设次数阈值;
在判断的结果为否时,执行所述获取与所述语音信息相对应的所述目标用户的同义语音信息,基于目标用户语义库对所述同义语音信息进行第二语义匹配的步骤。
进一步的,所述方法还包括:
在判断的结果为是时,向所述目标用户进行语音指令提示。
另一方面,提供了一种语音信息处理装置,所述装置包括:
第一获取模块,用于获取目标用户的语音信息;
第一匹配模块,用于基于目标用户语义库对所述语音信息进行第一语义匹配;
第二获取模块,用于在所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息;
第二匹配模块,用于基于目标用户语义库对所述同义语音信息进行第二语义匹配;
第三获取模块,用于在所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义;
存储模块,用于将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
另一方面,提供了一种电子设备,包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述的语音信息处理方法。
本发明实施例提供的技术方案带来的有益效果是:
本发明实施例通过获取目标用户的语音信息,基于目标用户语义库对该语音信息进行第一语义匹配,当第一语义匹配失败时,获取与所述语音信息相对应的目标用户的同义语音信息,对该同义语音信息进行第二语义匹配,当第二语义匹配成功时,获取匹配的目标语义,并将语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中,从而在目标用户的实际语音交互过程中建立了与目标用户的语言习惯相匹配的目标用户语义库,进而使得基于该目标用户语义库得到的交互结果的准确性高,降低了交互难度,提高了交互效率,从而提升了用户体验效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种应用环境的示意图;
图2是本发明实施例提供的一种语音信息处理方法的流程示意图;
图3是本发明实施例提供的将语音信息、同义语音信息以及目标语义的对应关系存储至目标用户语义库中的方法流程示意图;
图4是本发明实施例提供的基于目标用户语义库对所述语音信息进行第一语义匹配的一种方法流程示意图;
图5是本发明实施例提供的基于目标用户语义库对所述语音信息进行第一语义匹配的另一种方法流程示意图;
图6是本发明实施例提供的另一种语音信息处理方法的流程示意图;
图7是本发明实施例提供的另一种语音信息处理方法的流程示意图;
图8是本发明实施例提供的另一种语音信息处理方法的流程示意图;
图9是本发明实施例提供的一种语音信息处理装置的结构示意图;
图10是本发明实施例提供的存储模块的一种结构示意图;
图11是本发明实施例提供的第一匹配模块的一种结构示意图;
图12是本发明实施例提供的第一匹配模块的另一种结构示意图;
图13是本发明实施例提供的另一种语音信息处理装置的结构示意图;
图14是本发明实施例提供的另一种语音信息处理装置的结构示意图;
图15是本发明实施例提供的一种电子设备的硬件结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
应理解的,本发明实施例的语音信息处理方法可应用于本发明实施例的语音信息处理装置,该语音信息处理装置可配置于电子设备中,其中,该电子设备可以是智能终端或者服务器。所述智能终端可以是手机、平板电脑、掌上电脑及车载终端等具有各种操作系统的硬件设备;所述服务器可以是一台独立的服务器,也可以是由多台服务器组成的服务器集群。
以所述电子设备为车载终端为例,图1为本发明实施例提供的一种应用环境的示意图,该应用环境中包括车载终端110和车辆120,该车载终端110设置在车辆120的内部。具体的,车载终端110可以嵌入在车辆120的前置面板中并与车辆120的内部结构构成流线型的整体,节省车辆120的内部空间。当然,车载终端110也可以以平板电脑的方式实施并通过固定装置(如吸盘等)固定于车辆120的前窗部位,车载终端110的高度可以通过调节固定装置的安装高度等方式实现以便于用户观看智能终端110的屏幕。
请参考图2,其所示为本发明实施例提供的一种语音信息处理方法的流程示意图。需要说明的是,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的系统或电子产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。具体的如图2所示,所述方法包括:
S201,获取目标用户的语音信息。
具体的,目标用户在与智能终端进语音交互时,智能终端可以接收目标用户输入的语音信息,从而获取目标用户的语音信息。当然,智能终端也可以将该语音信息发送给服务器,相应的,服务器获取目标用户的语音信息。
实际应用中,智能设备在进行语音交互之前可以获取目标用户的标识信息,该标识信息用于智能设备唯一标识一个用户,通过目标用户的标识信息可以建立与目标用户的语音交互。
S203,基于目标用户语义库对所述语音信息进行第一语义匹配。
在本说明书实施例中,目标用户语义库为与目标用户的标识信息相对应的语义库,可以基于目标用户的标识信息查找到对应的目标用户语义库,该目标用户语义库中包括根据目标用户的语言习惯形成的语音信息与语义的对应关系,所述语义为对语音信息进行理解而得到的用户意图。由于不同用户的语言习惯不同,因此,不同用户的用户语义库中语音信息与语义的对应关系存在差异,即同样的语音信息在不同用户的用户语义库中可能对应于不同的语义。
具体的,所述基于目标用户语义库对所述语音信息进行第一语义匹配可以包括:
根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义,当未查找到所述语音信息对应的目标语义时,可以确定所述第一语义匹配的结果为未匹配成功。
S205,当所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息。
具体的,当第一语义匹配的结果为未匹配成功即匹配失败时,可以向目标用户反馈提示信息,该提示信息用于提示所述目标用户输入所述语音信息的同义语音信息,该同义语音信息与所述语音信息体现所述目标用户的相同意图,即同义语音信息是与语音信息的用户意图相同,但是表达方式或者描述方式不同。当目标用户根据提示信息输入同义语音信息后,即可获取到与所述语音信息相对应的目标用户的同义语音信息。
S207,基于目标用户语义库对所述同义语音信息进行第二语义匹配。
具体的,所述基于目标用户语义库对所述语音信息进行第二语义匹配可以包括:根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义,当查找到所述语音信息对应的目标语义时,可以确定第二语义匹配的结果为匹配成功。
S209,当所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义。
S211,将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
应理解的,所述对应关系中包括语音信息的数据、同义语音信息的数据、目标语义的数据,以及这三者之间的映射关系。
由以上本说明书实施例提供的技术方案可见,本说明书实施例在目标用户的实际语音交互过程中建立了与目标用户的语言习惯相匹配的目标用户语义库,进而使得基于该目标用户语义库得到的交互结果的准确性更高,降低了交互难度,提高了交互效率,从而提升了用户体验效果。
在实际应用中,上一次语音交互过程中存储的语音信息、同义语音信息以及所述目标语义的对应关系在下一次相同的语音信息输入时可能并不是目标用户想要的,如果在下一次语音交互时,直接基于上一次存储的语音信息、同义语音信息以及所述目标语义的对应关系向目标用户反馈所述语音信息对应的语义,将导致反馈的语义与目标用户的真实意图不符。
基于此,在本说明书实施例中,所述将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中可以包括图3所示的步骤:
S301,建立所述语音信息、同义语音信息以及所述目标语义的对应关系。
S303,将所述对应关系标识为待确认。
S305,将所述标识为待确认的对应关系存储至所述目标用户语义库中。
应理解的,所述将标识为待确认的对应关系存储至目标用户语义库中包含将语音信息的数据、同义语音信息的数据和目标语义的数据存储至目标用户语义库中,以及同时存储这三者的对应关系。
相应的,所述基于目标用户语义库对所述语音信息进行第一语义匹配可以采用图4所示的方法,该方法可以包括:
S401,根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义。
S403,当查找到所述语音信息对应的目标语义时,判断包含所述语音信息以及目标语义的目标对应关系是否为待确认。
具体的,当查找到的包含所述语音信息以及目标语义的目标对应关系存在待确认标识时,可以确定该目标对应关系为待确认;反之,若该目标对应关系没有待确认标识,则可以确定该目标对应关系为已确认,即该目标对应关系中的语音信息与目标语义的对应已经得到目标用户的认可。
S405,若所述目标对应关系为待确认,则获取所述目标对应关系中的同义语音信息。
S407,将所述同义语音信息反馈给所述目标用户,以使得所述目标用户根据所述同义语音信息对所述目标对应关系进行确认。
在本说明书实施例中,通过将目标对应关系中的同义语音信息反馈给目标用户,可以让目标用户确认本次输入的语音信息是否为上述同义语音信息所对应的语义,即目标用户可以根据同义语音信息对所述目标对应关系进行确认。
S409,根据确认的结果,确定所述第一语义匹配的结果是否匹配成功。
具体的,当接收的目标用户确认的结果为确认同意时,表明目标用户认可目标对应关系,此时可以确定第一语义匹配的结果为匹配成功,可以获取目标对应关系中的目标语义,并向所述目标用户反馈该目标语义。
在本说明书实施例中,当根据目标用户确认的结果,确定第一语义匹配的结果为匹配成功之后,还可以取消所述目标对应关系的待确认标识。
实际应用中,还可以考虑目标对应关系被目标用户确认为同意的次数,设定一个目标对应关系被目标用户确认为同意的次数阈值,在取消所述目标对应关系的待确认标识之前还可以判断目标对应关系被目标用户确认为同意的次数是否达到次数阈值,若达到次数阈值,则执行取消目标对应关系的待确认标识;反之,若未达到次数阈值,则保留目标对应关系的待确认标识,在后续接收到目标用户输入的目标对应关系中的语音信息时,继续执行步骤401至步骤409,直至目标对应关系被目标用户确认为同意的次数达到次数阈值。通过增加对目标对应关系被目标用户确认为同意的次数的判断步骤,可以使得目标用户语义库中的对应关系更加符合目标用户的语言习惯,有利于提高反馈语义的准确性。
具体的,当接收的目标用户确认的结果为确认不同意时,表明目标用户本次输入的语音信息并不适用目标对应关系,因此可以确定第一语义匹配的结果为未匹配成功,即匹配失败。
下面以智能语音助理与目标用户的交互为应用场景来说明本说明书实施例的上述技术方案。
目标用户:“小家伙给我把地图开开吧。”(目标用户第一次输入该语音信息)
智能语音助理:“这句话我不太懂,请您换个措辞试试吧。”(第一语义匹配的结果为匹配失败,向目标用户反馈提示信息)
目标用户:“打开地图。”(同义语音信息)
智能语音助理:“好的,为您打开地图。”(第二语义匹配的结果为匹配成功,获取并反馈目标语义)
在上述交互过程中,智能设备会建立语音信息、同义语音信息以及目标语义的对应关系,并将该对应关系标识为待确认存储在目标用户语义库中。
目标用户:“小家伙给我把地图开开吧。”(用户再次输入该语音信息)
智能语音助理:“您是想打开地图吗?”(在目标用户语义库中查找到上述存储的标识为待确认的对应关系,将该对应关系中的同义语音信息反馈给目标用户)
目标用户:“没错。”/“不是。”(目标用户对上述对应关系进行确认)
智能语音助理:“好的,为您打开地图。”/“您是需要什么帮助呢?”(根据确认的确认结果,确定第一语义匹配的结果)
进一步的,在一些实施例中,如图5所示,所述基于目标用户语义库对所述语音信息进行第一语义匹配还可以包括:
S411,若所述目标对应关系为非待确认,则获取所述目标对应关系中的目标语义。
S413,向所述目标用户反馈所述目标语义。
具体的,可以根据目标语义生成交互结果,向目标用户反馈该交互结果。例如,智能设备可以将交互结果以语音播报的方式向目标用户反馈,当然还可以通过其他方式进行反馈,本发明对此不作限定。
S415,当获取到所述目标用户反馈的不同意所述目标语义的信息时,确定所述第一语义匹配的结果为未匹配成功。
具体的,目标用户在获取到反馈的目标语义时,可能会觉得该目标语义不是其想要的,此时,目标用户可以反馈不同意所述目标语义的信息,例如,目标用户可以通过输入语音信息“我不是这个意思”来进行反馈。相应的,当获取到目标用户反馈的不同意所述目标语义的信息时,可以确定所述第一语义匹配的结果为匹配失败。
下面以智能语音助理与目标用户的交互为应用场景来说明图5的方法实施例所对应的技术方案。
目标用户:“我想唱歌。”(用户第一次输入该语音信息)
智能语音助理:“好的,为您打开卡拉OK应用。”(查找到已认可的对应关系,获取对应关系中的目标语义,将该目标语义反馈给目标用户)
目标用户:“我不是这个意思,我想搜一下附近的KTV。”(目标用户不同意反馈的目标语义,输入同义语音信息)
智能语音助理:“为您找到如下KTV,请选择。”(第二语义匹配的结果为匹配成功,获取并反馈目标语义)
在上述交互过程中,智能设备会建立语音信息、同义语音信息以及目标语义的对应关系,并将该对应关系标识为待确认存储在目标用户语义库中。
目标用户:“我想唱歌。”(用户再次输入该语音信息)
智能语音助理:“您是想搜一下附近的KTV?”(在目标用户语义库中查找到上述存储的标识为待确认的对应关系,将该对应关系中的同义语音信息反馈给目标用户)
目标用户:“没错。”/“不是。”(目标用户对上述对应关系进行确认)
可见,在本说明书实施例中通过目标用户反馈的不同意所述目标语义的信息来确定第一语义匹配的结果为匹配失败,从而可以对目标用户语义库中已经被目标用户认可的对应关系进行修改,进而使得反馈的语义更加符合用户的真正意图,提高用户体验效果。
在本说明书实施例中,当步骤S207的第二语义匹配的结果为未匹配成功时,可以继续执行获取与所述语音信息相对应的所述目标用户的同义语音信息,基于目标用户语义库对所述同义语音信息进行第二语义匹配的步骤,直至第二语义匹配的结果为匹配成功。然而,在实际应用中,当连续多次第二语义匹配的结果均为未匹配成功时,若继续进行同义语音信息的获取以及第二语义匹配,会影响到用户的体验效果。
基于此,在一些实施例中,如图6所示,在步骤S207之后,所述方法还可以包括:
S213,当所述第二语义匹配的结果为未匹配成功时,获取所述第二语义匹配执行的总次数。
具体的,在基于目标用户语义库对同义语音信息进行第二语义匹配时,可以记录第二语义匹配的次数。当在目标用户语义库中未查找到包含所述同义语音信息的目标语义时,可以确定所述第二语义匹配的结果为匹配失败,此时,可以获取记录的第二语义匹配执行的总次数。
S215,判断所述总次数是否达到预设次数阈值。
具体的,预设次数阈值可以根据需要进行设置,例如可以设置为2次,5次等。
在判断的结果为否时,执行所述获取与所述语音信息相对应的所述目标用户的同义语音信息,基于目标用户语义库对所述同义语音信息进行第二语义匹配的步骤。
具体的,当判断的结果为第二语义匹配执行的总次数未达到预设次数阈值时,可以继续执行获取与所述语音信息相对应的所述目标用户的同义语音信息,基于目标用户语义库对所述同义语音信息进行第二语义匹配的步骤。
进一步的,在另一些实施例中,如图7所示,还可以包括步骤S217,在判断的结果为是时,向所述目标用户进行语音指令提示。
具体的,语音指令提示可以为向目标用户反馈无法理解目标用户的输入,让目标用户查看目标用户语义库中目前已有的对应关系,进而获取支持的语音信息输入。当然,在向目标用户进行语音指令提示后,还可以根据语音指令提示的内容向目标用户展示交互界面,以在交互界面显示按照预设规则排列的目标用户语义库中已有的对应关系。
请参阅图8,其所示为本发明实施例提供的另一种语音信息处理方法的流程示意图。在该实施例中,目标用户语义库可以包括通用语义库和自学习语义库。
其中,通用语义库为根据大量用户的语音交互数据形成的包含语音信息与语义的对应关系库。一般通用语义库的建立过程,首先需要收集大量用户的语音交互数据,通过对收集的大量用户的语音交互数据进行学习处理后,再根据处理得到的数据建立通用语义库。
自学习语义库为在目标用户的实际交互过程中,根据目标用户的语音交互数据形成的包含语音信息与语义的对应关系库,是能够体现目标用户语言习惯的、动态的个人定制语义库。相应的,在将所述标识为待确认的对应关系存储至所述目标用户语义库中时,可以将所述标识为待确认的对应关系存储在自学习语义库中。如图8所示,该方法可以包括:
S801,获取目标用户的语音信息。
S803,根据自学习语义库中的对应关系查找所述语音信息对应的目标语义,若查找到所述语音信息对应的目标语义,则执行步骤S819;若未查找到所述语音信息对应的目标语义,则执行步骤805。
S805,根据通用语义库中的对应关系查找所述语音信息对应的目标语义,若查找到所述语音信息对应的目标语义,则执行步骤S831;若未查找到所述语音信息对应的目标语义,则执行步骤S807至步骤S811。
S807,向目标用户反馈提示信息,所述提示信息用于提示目标用户输入所述语音信息的同义语音信息。
S809,获取目标用户的同义语音信息。
S811,根据通用语义库中的对应关系查找所述同义语音信息对应的目标语义,若查找到所述同义语音信息对应的目标语义,则执行步骤S813至步骤S817;若未查找到所述同义语音信息对应的目标语义,则执行步骤S825至步骤S827。
S813,获取与所述同义语音信息相匹配的目标语义,并执行步骤S831。
S815,建立所述语音信息、同义语音信息以及所述目标语义的对应关系,并将所述对应关系标识为待确认。
S817,将标识为待确认的所述语音信息、同义语音信息以及所述目标语义的对应关系存储至自学习语义库中。
S819,判断包含所述语音信息以及目标语义的目标对应关系是否为待确认,在判断的结果为是时,执行步骤S821;在判断的结果为否时,执行步骤S831。
S821,获取所述目标对应关系中的同义语音信息,将该同义语音信息反馈给目标用户,以使得所述目标用户根据所述同义语音信息对所述目标对应关系进行确认。在所述确认的结果为确认同意时,执行步骤S823;在所述确认的结果为确认不同意时,执行步骤S807。
S823,取消所述目标对应关系的待确认标识,并执行步骤S831。
S825,向目标用户反馈提示信息,所述提示信息用于提示目标用户输入所述语音信息的同义语音信息。
S827,根据通用语义库中的对应关系查找所述同义语音信息对应的目标语义,若查找到所述同义语音信息对应的目标语义,则执行步骤S813至步骤S817;若未查找到所述同义语音信息对应的目标语义,则执行步骤S829。
S829,向所述目标用户进行语音指令提示,并展示语音帮助界面。
S831,向目标用户反馈所述目标语义。
具体的,图8所示方法实施例中的各个步骤的详细内容可以参见前述图1至图7所示方法实施例的相对应部分的内容,在此不再赘述。
在本说明书实施例中,目标用户语义库包括自学习语义库和通用语义库,并将目标用户实际交互过程中建立的语音信息、同义语音信息以及目标语义的对应关系存储在自学习语义库,从而方便目标用户针对自学习语义库的更改操作,例如,在接收到目标用户对自学习语义库清空的指令时,可以将该自学习语义库进行清空。
此外,本说明书实施例在目标用户的实际语音交互过程中建立了与目标用户的语言习惯相匹配的自学习语义库,进而使得基于该自学习语义库得到的交互结果的准确性更高,降低了交互难度,提高了交互效率,提升了用户体验效果。
与上述几种实施例提供的语音信息处理方法相对应,本发明实施例还提供一种语音信息处理装置,由于本发明实施例提供的语音信息处理装置与上述几种实施例提供的语音信息处理方法相对应,因此前述语音信息处理方法的实施方式也适用于本实施例提供的语音信息处理装置,在本实施例中不再详细描述。
请参阅图9,其所示为本发明实施例提供的一种语音信息处理装置的结构示意图,如图9所示,该装置可以包括:第一获取模块910,第一匹配模块920,第二获取模块930,第二匹配模块940,第三获取模块950以及存储模块960,其中,
第一获取模块910,可以用于获取目标用户的语音信息;
第一匹配模块920,可以用于基于目标用户语义库对所述语音信息进行第一语义匹配;
第二获取模块930,可以用于在所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息;
第二匹配模块940,可以用于基于目标用户语义库对所述同义语音信息进行第二语义匹配;
第三获取模块950,可以用于在所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义;
存储模块960,可以用于将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
可选的,如图10所示,存储模块960可以包括:
建立模块9610,可以用于建立所述语音信息、同义语音信息以及所述目标语义的对应关系;
标识模块9620,可以用于将所述对应关系标识为待确认;
存储子模块9630,可以用于将所述标识为待确认的对应关系存储至所述目标用户语义库中。
可选的,如图11所示,所述第一匹配模块920可以包括:
查找模块9210,可以用于根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义;
第一确定模块9220,可以用于在未查找到所述语音信息对应的目标语义时,确定所述第一语义匹配的结果为未匹配成功;
第一判断模块9230,可以用于在查找到所述语音信息对应的目标语义,判断包含所述语音信息以及目标语义的目标对应关系是否为待确认;
第四获取模块9240,可以用于在所述目标对应关系为待确认时,获取所述目标对应关系中的同义语音信息;
第一反馈模块9250,可以用于将所述同义语音信息反馈给所述目标用户,以使得所述目标用户根据所述同义语音信息对所述目标对应关系进行确认;
第二确定模块9260,可以用于根据所述确认的结果,确定所述第一语义匹配的结果是否匹配成功。
可选的,所述第二确定模块9260,具体可以用于:当所述确认的结果为确认同意时,确定所述第一语义匹配的结果为匹配成功;当所述确认的结果为确认不同意时,确定所述第一语义匹配的结果为未匹配成功。
可选的,所述第一匹配模块920,还可以包括:
取消模块9200,可以用于在所述第二确定模块9260的输出为第一语义匹配的结果为匹配成功时,取消所述目标对应关系的待确认标识。
可选的,如图12所示,所述第一匹配模块920,还可以包括:
第五获取模块9270,可以用于在所述目标对应关系为非待确认时,基于所述目标对应关系获取与所述语音信息对应的目标语义;
第二反馈模块9280,可以用于向所述目标用户反馈所述目标语义;
第三确定模块9290,可以用于在获取到所述目标用户反馈的不同意所述目标语义的信息时,确定所述第一语义匹配的结果为未匹配成功。
在一具体实施方式中,如图13提供的另一种语音信息处理装置的结构示意图,所述装置还可以包括:
第三反馈模块970,可以用于向所述目标用户反馈提示信息;所述提示信息用于提示所述目标用户输入所述语音信息的同义语音信息。
在另一具体实施方式中,如图14提供的另一种语音信息处理装置的结构示意图,所述装置还可以包括:
第六获取模块1410,可以用于在所述第二语义匹配的结果为未匹配成功时,获取所述第二语义匹配执行的总次数;
第二判断模块1420,可以用于判断所述总次数是否达到预设次数阈值;
可选的,如图14所示,所述装置还可以包括:
指令提示模块1430,可以用于在所述总次数达到预设次数阈值时,向所述目标用户进行语音指令提示。
由以上方案可知,本发明实施例提供的语音信息处理装置,可以在目标用户的实际语音交互过程中建立与目标用户的语言习惯相匹配的目标用户语义库,进而使得基于该目标用户语义库得到的交互结果的准确性更高,降低了交互难度,提高了交互效率,从而提升了用户体验效果。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
本发明实施例还提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述的语音信息处理方法。
请参阅图15,其所示为本发明实施例提供的一种电子设备的硬件结构示意图,该电子设备可以是诸如PC(PersonalComputer,个人计算机)、手机、PDA(平板电脑)、车载终端等终端设备,也可以是诸如应用服务器、集群服务器等服务设备。请参见图15,该电子设备的内部结构可包括但不限于:处理器、网络接口及存储器。其中,电子设备内的处理器、网络接口及存储器可通过总线或其他方式连接,在本说明书实施例所示图15中以通过总线连接为例。
其中,处理器(或称CPU(Central Processing Unit,中央处理器))是电子设备的计算核心以及控制核心。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI、移动通信接口等)。存储器(Memory)是电子设备中的记忆设备,用于存放程序和数据。可以理解的是,此处的存储器可以是高速RAM存储设备,也可以是非不稳定的存储设备(non-volatile memory),例如至少一个磁盘存储设备;可选的还可以是至少一个位于远离前述处理器的存储装置。存储器提供存储空间,该存储空间存储了电子设备的操作系统,可包括但不限于:Windows系统(一种操作系统),Linux(一种操作系统),Android(安卓,一种移动操作系统)系统、IOS(一种移动操作系统)系统等等,本发明对此并不作限定;并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。在本说明书实施例中,处理器加载并执行存储器中存放的一条或一条以上指令,以实现上述方法实施例提供的语音信息处理方法。
本发明的实施例还提供了一种存储介质,所述存储介质可设置于所述电子设备之中以保存用于实现方法实施例中的一种语音信息处理方法相关的至少一条指令、至少一段程序、代码集或指令集,该至少一条指令、该至少一段程序、该代码集或指令集可由电子设备的处理器加载并执行以实现上述方法实施例提供的语音信息处理方法。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者装置中还存在另外的相同要素。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种语音信息处理方法,其特征在于,所述方法包括:
获取目标用户的语音信息;
基于目标用户语义库对所述语音信息进行第一语义匹配;
当所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息;
基于目标用户语义库对所述同义语音信息进行第二语义匹配;
当所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义;
将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
2.根据权利要求1所述的语音信息处理方法,其特征在于,所述将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中包括:
建立所述语音信息、同义语音信息以及所述目标语义的对应关系;
将所述对应关系标识为待确认;
将所述标识为待确认的对应关系存储至所述目标用户语义库中。
3.根据权利要求2所述的语音信息处理方法,其特征在于,所述基于目标用户语义库对所述语音信息进行第一语义匹配包括:
根据所述目标用户语义库中的对应关系查找所述语音信息对应的目标语义;
当未查找到所述语音信息对应的目标语义时,确定所述第一语义匹配的结果为未匹配成功。
4.根据权利要求3所述的语音信息处理方法,其特征在于,所述方法还包括:
当查找到所述语音信息对应的目标语义时,判断包含所述语音信息以及目标语义的目标对应关系是否为待确认;
若所述目标对应关系为待确认,则获取所述目标对应关系中的同义语音信息;
将所述同义语音信息反馈给所述目标用户,以使得所述目标用户根据所述同义语音信息对所述目标对应关系进行确认;
根据确认的结果,确定所述第一语义匹配的结果是否匹配成功。
5.根据权利要求4所述的语音信息处理方法,其特征在于,所述根据确认的结果,确定所述第一语义匹配的结果是否匹配成功包括:
当所述确认的结果为确认同意时,确定所述第一语义匹配的结果为匹配成功;
当所述确认的结果为确认不同意时,确定所述第一语义匹配的结果为未匹配成功。
6.根据权利要求5所述的语音信息处理方法,其特征在于,在所述第一语义匹配的结果为匹配成功之后,所述方法还包括:
取消所述目标对应关系的待确认标识。
7.根据权利要求4所述的语音信息处理方法,其特征在于,所述方法还包括:
若所述目标对应关系为非待确认,则基于所述目标对应关系获取与所述语音信息对应的目标语义;
向所述目标用户反馈所述目标语义;
当获取到所述目标用户反馈的不同意所述目标语义的信息时,确定所述第一语义匹配的结果为未匹配成功。
8.根据权利要求1所述的语音信息处理方法,其特征在于,在获取与所述语音信息相对应的所述目标用户的同义语音信息之前,所述方法还包括:
向所述目标用户反馈提示信息;所述提示信息用于提示所述目标用户输入所述语音信息的同义语音信息。
9.根据权利要求1所述的语音信息处理方法,其特征在于,所述方法还包括:
当所述第二语义匹配的结果为未匹配成功时,获取所述第二语义匹配执行的总次数;
判断所述总次数是否达到预设次数阈值;
在判断的结果为否时,执行所述获取与所述语音信息相对应的所述目标用户的同义语音信息,基于目标用户语义库对所述同义语音信息进行第二语义匹配的步骤。
10.一种语音处理装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标用户的语音信息;
第一匹配模块,用于基于目标用户语义库对所述语音信息进行第一语义匹配;
第二获取模块,用于在所述第一语义匹配的结果为未匹配成功时,获取与所述语音信息相对应的所述目标用户的同义语音信息;
第二匹配模块,用于基于目标用户语义库对所述同义语音信息进行第二语义匹配;
第三获取模块,用于在所述第二语义匹配的结果为匹配成功时,获取与所述同义语音信息相匹配的目标语义;
存储模块,用于将所述语音信息、同义语音信息以及所述目标语义的对应关系存储至所述目标用户语义库中。
CN201910198311.6A 2019-03-15 2019-03-15 一种语音信息处理方法及装置 Active CN110136700B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910198311.6A CN110136700B (zh) 2019-03-15 2019-03-15 一种语音信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910198311.6A CN110136700B (zh) 2019-03-15 2019-03-15 一种语音信息处理方法及装置

Publications (2)

Publication Number Publication Date
CN110136700A true CN110136700A (zh) 2019-08-16
CN110136700B CN110136700B (zh) 2021-04-20

Family

ID=67568814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910198311.6A Active CN110136700B (zh) 2019-03-15 2019-03-15 一种语音信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN110136700B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933107A (zh) * 2020-09-04 2020-11-13 珠海格力电器股份有限公司 语音识别方法、装置、存储介质和处理器
CN112669840A (zh) * 2020-12-17 2021-04-16 北京梧桐车联科技有限责任公司 一种语音处理方法、装置、设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040209653A1 (en) * 2003-04-15 2004-10-21 General Motors Corporation Incorporating customer defined digit substitutes into standard wireless voice activated dialing processes
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102968409A (zh) * 2012-11-23 2013-03-13 海信集团有限公司 智能人机交互语义分析方法及交互系统
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN106782526A (zh) * 2016-12-12 2017-05-31 深圳Tcl数字技术有限公司 语音控制方法和装置
US20180144744A1 (en) * 2016-11-22 2018-05-24 Salesforce.Com, Inc. Controlling a user interface console using speech recognition
CN108074577A (zh) * 2016-11-09 2018-05-25 上海诺悦智能科技有限公司 身份认证方法及身份认证系统
CN108170034A (zh) * 2017-12-29 2018-06-15 上海器魂智能科技有限公司 智能设备控制方法、装置、计算机设备和储存介质
CN108447478A (zh) * 2018-01-31 2018-08-24 捷开通讯(深圳)有限公司 一种终端设备的语音控制方法、终端设备及装置
CN108777142A (zh) * 2018-06-05 2018-11-09 上海木木机器人技术有限公司 一种基于机场环境的语音交互识别方法及语音交互机器人

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040209653A1 (en) * 2003-04-15 2004-10-21 General Motors Corporation Incorporating customer defined digit substitutes into standard wireless voice activated dialing processes
CN102779509A (zh) * 2011-05-11 2012-11-14 联想(北京)有限公司 语音处理设备和语音处理方法
CN102968409A (zh) * 2012-11-23 2013-03-13 海信集团有限公司 智能人机交互语义分析方法及交互系统
CN104715752A (zh) * 2015-04-09 2015-06-17 刘文军 语音识别方法、装置及系统
CN105791931A (zh) * 2016-02-26 2016-07-20 深圳Tcl数字技术有限公司 智能电视及其语音控制方法
CN108074577A (zh) * 2016-11-09 2018-05-25 上海诺悦智能科技有限公司 身份认证方法及身份认证系统
US20180144744A1 (en) * 2016-11-22 2018-05-24 Salesforce.Com, Inc. Controlling a user interface console using speech recognition
CN106782526A (zh) * 2016-12-12 2017-05-31 深圳Tcl数字技术有限公司 语音控制方法和装置
CN108170034A (zh) * 2017-12-29 2018-06-15 上海器魂智能科技有限公司 智能设备控制方法、装置、计算机设备和储存介质
CN108447478A (zh) * 2018-01-31 2018-08-24 捷开通讯(深圳)有限公司 一种终端设备的语音控制方法、终端设备及装置
CN108777142A (zh) * 2018-06-05 2018-11-09 上海木木机器人技术有限公司 一种基于机场环境的语音交互识别方法及语音交互机器人

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ER SCHOTTER: ""synonyms provide semantic preview benefit in English"", 《JOURNAL OF MEMORY AND LANGUAGE》 *
宋明虎: ""电力行业电话电话客服语音情感识别"", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933107A (zh) * 2020-09-04 2020-11-13 珠海格力电器股份有限公司 语音识别方法、装置、存储介质和处理器
CN112669840A (zh) * 2020-12-17 2021-04-16 北京梧桐车联科技有限责任公司 一种语音处理方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN110136700B (zh) 2021-04-20

Similar Documents

Publication Publication Date Title
US11561763B2 (en) Electronic device for processing multi-modal input, method for processing multi-modal input and server for processing multi-modal input
US10440167B2 (en) Electronic device and method of executing function of electronic device
US11670302B2 (en) Voice processing method and electronic device supporting the same
KR102414122B1 (ko) 사용자 발화를 처리하는 전자 장치 및 그 동작 방법
US20190311036A1 (en) System and method for chatbot conversation construction and management
US10593322B2 (en) Electronic device and method for controlling the same
US11217244B2 (en) System for processing user voice utterance and method for operating same
CN107111475A (zh) 管理用于输入理解确定的用户交互
CN109522538A (zh) 表格内容的自动分列方法、装置、设备及存储介质
CN110797022B (zh) 一种应用控制方法、装置、终端和服务器
CN108139862A (zh) 多窗口键盘
CN107533542A (zh) 用于理解不完整的自然语言查询的方法
CN105320726A (zh) 降低对手动开始/结束点和触发短语的需求
EP3603040B1 (en) Electronic device and method of executing function of electronic device
US11150870B2 (en) Method for providing natural language expression and electronic device supporting same
KR102472010B1 (ko) 전자 장치 및 전자 장치의 기능 실행 방법
CN111261161A (zh) 一种语音识别方法、装置及存储介质
US20210151052A1 (en) System for processing user utterance and control method thereof
KR20190090424A (ko) 사용자 발화 응답 방법 및 이를 지원하는 전자 장치
CN109448727A (zh) 语音交互方法以及装置
CN110136700A (zh) 一种语音信息处理方法及装置
CN108447478A (zh) 一种终端设备的语音控制方法、终端设备及装置
CN110308886A (zh) 提供与个性化任务相关联的声音命令服务的系统和方法
CN110399474A (zh) 一种智能对话方法、装置、设备及存储介质
CN106126748B (zh) 歌词匹配的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220331

Address after: 430051 No. b1336, chuanggu startup area, taizihu cultural Digital Creative Industry Park, No. 18, Shenlong Avenue, Wuhan Economic and Technological Development Zone, Wuhan, Hubei Province

Patentee after: Yikatong (Hubei) Technology Co.,Ltd.

Address before: No.c101, chuanggu start up zone, taizihu cultural Digital Industrial Park, No.18 Shenlong Avenue, Wuhan Economic and Technological Development Zone, Hubei Province

Patentee before: HUBEI ECARX TECHNOLOGY Co.,Ltd.