CN104469029B - 通过语音进行查号的方法及装置 - Google Patents
通过语音进行查号的方法及装置 Download PDFInfo
- Publication number
- CN104469029B CN104469029B CN201410674306.5A CN201410674306A CN104469029B CN 104469029 B CN104469029 B CN 104469029B CN 201410674306 A CN201410674306 A CN 201410674306A CN 104469029 B CN104469029 B CN 104469029B
- Authority
- CN
- China
- Prior art keywords
- directory enquiry
- intended
- voice
- user
- enquiry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Abstract
本发明公开了一种通过语音进行查号的方法,包括:接收用户输入的语音信息;对语音信息进行文字转写以生成文字信息;对文字信息进行语义解析以生成初始查号意图;根据预设的单位索引模型和初始查号意图生成最终查号意图;以及根据最终查号意图查找预先建立的号码存储库以获取对应的号码,并将号码反馈至用户。本发明实施例的方法实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。本发明还公开了一种通过语音进行查号的装置。
Description
技术领域
本发明涉及人工智能技术和电信领域普遍使用的电话查号领域,尤其涉及一种通过语音进行查号的方法及装置。
背景技术
随着人工智能技术的不断发展,人们对方便快捷、高效准确的智能服务的需求越来越强烈。自然语音作为人类交流的最方便、最自然的方式,已经逐渐成为智能服务领域主流的人机交互方式。以电信领域的电话查号平台为例,采用的都是人工方式,即查询人拨打电信服务商提供的查号号码,转到人工接线员,人工接线员根据描述,采用人工经验以得到查询人想要查询的单位(或商家等)名称,通过输入单位(或商家等)名称从预先构建的号码数据库中搜索以得到对应的号码,并将该号码告知查询人。
但是,上述的查询方法存在以下问题:
1)电话领域非自助查号,需要人工应答,增加人工成本;
2)人工应答,存在忙时等待问题,影响用户体验;
3)单位名称是一个先验知识,需要接线员了解相关背景知识才能提升搜索的准确性。
因此,如何在查号服务领域实现智能化的交互查号方法已成为亟待解决的问题。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种通过语音进行查号的方法。该方法实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。
本发明的第二个目的在于提出一种通过语音进行查号的装置。
为了实现上述目的,本发明第一方面实施例的通过语音进行查号的方法,包括:接收用户输入的语音信息;对所述语音信息进行文字转写以生成文字信息;对所述文字信息进行语义解析以生成初始查号意图;根据预设的单位索引模型和所述初始查号意图生成最终查号意图;以及根据所述最终查号意图查找预先建立的号码存储库以获取对应的号码,并将所述号码反馈至所述用户。
根据本发明实施例的通过语音进行查号的方法,可先接收用户输入的语音信息,之后可对该语音信息进行文字转写以生成文字信息,并对文字信息进行语义解析以生成初始查号意图,并根据预设的单位索引模型和初始查询意图生成最终查号意图,以及根据最终查号意图查找预先建立的号码存储库以获取对应的号码,并将号码反馈至用户,实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。
为了实现上述目的,本发明第二方面实施例的通过语音进行查号的装置,包括:接收模块,用于接收用户输入的语音信息;第一生成模块,用于对所述语音信息进行文字转写以生成文字信息;第二生成模块,用于对所述文字信息进行语义解析以生成初始查号意图;第三生成模块,用于根据预设的单位索引模型和所述初始查号意图生成最终查号意图;查询模块,用于根据所述最终查号意图查找预先建立的号码存储库以获取对应的号码;以及反馈模块,用于将所述号码反馈至所述用户。
根据本发明实施例的通过语音进行查号的装置,可通过接收模块接收用户输入的语音信息,第一生成模块对语音信息进行文字转写以生成文字信息,第二生成模块对文字信息进行语义解析以生成初始查号意图,第三生成模块根据预设的单位索引模型和初始查号意图生成最终查号意图,查询模块根据最终查号意图查找预先建立的号码存储库以获取对应的号码,反馈模块将号码反馈至用户,实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的通过语音进行查号的方法的流程图;
图2是根据本发明另一个实施例的通过语音进行查号的方法的流程图;
图3是根据本发明一个实施例的通过语音进行查号的装置的结构示意图;
图4是根据本发明另一个实施例的通过语音进行查号的装置的结构示意图;以及
图5是根据本发明一个实施例的第三生成模块的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的通过语音进行查号的方法及装置。
图1是根据本发明一个实施例的通过语音进行查号的方法的流程图。如图1所示,该通过语音进行查号的方法可以包括:
S101,接收用户输入的语音信息。
其中,在本发明的实施例中,语音信息可包括自然语音和/或录音。具体而言,在本发明的实施例中,用户可以单独采用自然语音或录音文件中的一种进行语音信息的输入,还可以采用自然语音和录音文件混合进行语音信息的输入。
S102,对语音信息进行文字转写以生成文字信息。
具体地,可通过现有的语音识别技术对语音信息进行文字转写以生成文字信息。应当理解,语音识别技术为现有技术,通过现有的语音识别技术将语音信息转换为文字信息的过程在此不再赘述。
S103,对文字信息进行语义解析以生成初始查号意图。
进一步的,在本发明的一个实施例中,在对文字信息进行语义解析之后,该通过语音进行查号的方法还可包括:根据语义解析结果确定语音信息是否属于查号需求;如果确定语音信息属于查号需求,则生成初始查号意图。在本发明的实施例中,如果确定语音信息不属于查号需求,则可确定该语音信息为非查号需求,例如,非查号需求可包括但不限于问候语、无意义需求、航班预订等,并可根据不同的非查号需求的类型给出对应的响应措施,其中,本发明针对根据不同的非查号需求的类型给出对应的响应措施的具体实现过程不做限定。由此,可以过滤出真实的查号需求,从而防止需求场景类型判断错误而导致的语义解析错误。
举例而言,在本发明的实施例中,可以采用例如基于文法规则网络对文字信息进行语义解析以生成初始查号意图。其中,可以理解,在查号需求和问候语、无意义需求、航班预订等预先设定的非查号需求的语义场景下,可对应多种文法规则网络,即不同语句形式对应不同的文法规则网络。此外,在本发明的实施例中,文法规则网络可优选采用基于ABNF(Augmented Backus-Naur Form,扩展巴克斯范式)文法规则编译成的WFST(WeightedFinite State Transducer,加权有限状态机)网络。具体地,语义解析可以是对文字信息通过动态规划算法,对文法规则网络进行路径匹配解析,并通过回溯匹配路径,得到相应的语义信息。应当理解,对于同时匹配若干路径的,取得分最高的一条路径作为语义解析结果。
在转换的文字信息经过语义解析之后,且确定语音信息为查号需求时,可从所得到的语义解析结果中提取:本查号语义场景中的关键信息槽、关键信息槽的数目,以生成初始查号意图。例如,用户输入的语音转换的文本为“我想查询亳州路的老乡鸡”,在查号这个场景中语义解析得到两个关键信息槽:查询初始意图“老乡鸡”和地标位置“亳州路”,所含关键信息槽的数目为两个,单位商家名称“老乡鸡”作为查询初始意图,“亳州路”作为地标位置信息。
S104,根据预设的单位索引模型和初始查号意图生成最终查号意图。
具体地,可将初始查号意图中的关键信息槽和关键信息槽的数目输入到预设的单位索引模型中,得到最终查号意图,具体的实现方式可参照后续实施例。其中,在本发明的实施例中,预设的单位索引模型可为预先基于Lucene(一套用于全文检索和搜寻的开源程式库)多域存储数据和倒排索引技术进行创建的单位索引模型。
S105,根据最终查号意图查找预先建立的号码存储库以获取对应的号码,并将号码反馈至用户。
举例而言,假设用户输入的语音信息的最终查号意图为“查询毫州路的老乡鸡的电话号码”,可先根据商家名称“老乡鸡”在预先建立的号码存储库中进行查找,以找到“老乡鸡”商家在号码存储库中的存储位置,并根据地标位置信息“毫州路”来获取用户需求查询的哪个地方(或哪个分店)的“老乡鸡”商的电话号码。
具体而言,在本发明的实施例中,可通过语音播放形式和/或短信形式将获取到的号码反馈至用户。也就是说,可将查询的号码通过在标准语音对话流程用语音合成的方式播报给用户;和/或,将查询的号码通过短信的方式发送到用户接入的移动终端,由此,为用户提供更加快速、便捷的接收方式。
根据本发明实施例的通过语音进行查号的方法,可先接收用户输入的语音信息,之后可对该语音信息进行文字转写以生成文字信息,并对文字信息进行语义解析以生成初始查号意图,并根据预设的单位索引模型和初始查询意图生成最终查号意图,以及根据最终查号意图查找预先建立的号码存储库以获取对应的号码,并将号码反馈至用户,实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。
图2是根据本发明另一个实施例的通过语音进行查号的方法的流程图。
为了能够有效地提高语音查询结果的正确性,在本发明的实施例中,可先根据初始查号意图在预设的单位索引模型进行检索,之后可将检索结果与初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图,以及根据用户针对至少一个相似查号意图的确定结果作为最终查号意图。具体地,如图2所示,该通过语音进行查号的方法可以包括:
S201,接收用户输入的语音信息。
S202,对语音信息进行文字转写以生成文字信息。
S203,对文字信息进行语义解析以生成初始查号意图。
S204,根据初始查号意图在预设的单位索引模型中进行检索。
具体地,可通过Learning to rank(基于机器学习的排序方法)技术根据初始查号意图在预设的单位索引模型中进行查询结果的检索。
S205,将检索结果与初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图。
具体地,在根据初始查号意图在预设的单位索引模型中进行检索之后,可将检索结果与初始查号意图进行相似度匹配打分,并根据降序排序的顺序对相似度打分后的检索结果进行排序,得到排序后的检索结果,然后,根据排序后的检索结果和预设的相似度匹配条件进行比对,得到满足预设的相似度匹配条件的至少一个检索结果,并将其作为至少一个相似查号意图。
举例而言,在本发明的实施例中,假设至少一个相似查号意图为一个精确查号意图或3个相似查号意图,其中,在本发明的实施例中,满足预设的相似度匹配条件的至少一个相似查号意图的获取过程可为:当排序次序为第一的检索结果的相似度程度(即排名最高的第一个的分数)超过第一预设阀值,且该排序次序为第一的检索结果的相似度程度与排序次序为第二的检索结果的相似度程序的差值(即排名最高的第一个的分数与第二个的分数差距)也超过预设分数差阀值时,输出该检索结果,并将其作为唯一精确查号意图;当排名前三不符合上述唯一精确查号意图的条件,且排名前三的分数均超过第二预设阈值时,输出三个相似查号意图,其中,第二预设阀值小于第二预设阀值。例如,设置第一预设阈值为99.99%,第二预设阈值为70%,分数差阈值为5%,检索后,存在有三种情况:
其一:当排名第一的检索结果超过第一预设阈值99.99%时,与排名第二分数差大于分数差阈值5%时,得到唯一的精确查号意图;
其二:不满足上述条件时,当排名前三的分数均高于第二预设阈值70%时,得到三个相似查号意图;
其三:不满足上述两种条件时,将表示检索失败,即得不到查号意图。
S206,将至少一个相似查号意图反馈至用户,以使用户对至少一个相似查号意图进行确认。
具体而言,在本发明的实施例中,可通过语音播放形式和/或文字形式将至少一个相似查号意图反馈至用户,由用户针对至少一个相似查号意图进行确认以得到用户输入语音的最终查号意图。
S207,根据用户的确认指令将至少一个相似查号意图的其中一个相似查号意图作为最终查号意图。
具体地,在将上述输出的精确查号意图或者相似查号意图通过标准语音对话流程和/或文字形式反馈给用户之后,可根据用户针对精确查号意图或者相似查号意图的确认,以得到最终的真实查号意图。需要说明的是,在本发明的实施例中,当用户不确认时表示获取到的意图与用户期望不符,即查询失败,可由用户选择重新查询或挂机处理。
S208,根据最终查号意图查找预先建立的号码存储库以获取对应的号码,并将号码反馈至用户。
根据本发明实施例的通过语音进行查号的方法,可先根据初始查号意图在预设的单位索引模型中进行检索,之后可将检索结果与初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图,并将至少一个相似查号意图反馈至用户,以使用户对至少一个相似查号意图进行确认,以及根据用户的确认指令将至少一个相似查号意图的其中一个相似查号意图作为最终查号意图,即通过将检索结果与初始查号意图进行相似度匹配,并通过将满足相似度匹配条件的检索结果反馈至用户,经过用户确认后作为最终查号意图,提高了查号意图的准确率,从而保证了语音查询结果的正确性。
为了实现上述实施例,本发明还提出了一种通过语音进行查号的装置。
图3是根据本发明一个实施例的通过语音进行查号的装置的结构示意图。如图3所示,该通过语音进行查号的装置可以包括:接收模块10、第一生成模块20、第二生成模块30、第三生成模块40、查询模块50和反馈模块60。
具体地,接收模块10可用于接收用户输入的语音信息。其中,在本发明的实施例中,语音信息可包括自然语音和/或录音。具体而言,在本发明的实施例中,用户可以单独采用自然语音或录音文件中的一种进行语音信息的输入,还可以采用自然语音和录音文件混合进行语音信息的输入。
第一生成模块20可用于对语音信息进行文字转写以生成文字信息。更具体地,第一生成模块20可通过现有的语音识别技术对语音信息进行文字转写以生成文字信息。应当理解,语音识别技术为现有技术,通过现有的语音识别技术将语音信息转换为文字信息的过程在此不再赘述。
第二生成模块30可用于对文字信息进行语义解析以生成初始查号意图。
进一步的,在本发明的一个实施例中,如图4所示,该通过语音进行查号的装置还可以包括确定模块70。确定模块70可用于在对文字信息进行语义解析之后,根据语义解析结果确定语音信息是否属于查号需求。在本发明的实施例中,第二生成模块30还可用于在确定模块确定语音信息属于查号需求时,生成初始查号意图。在本发明的实施例中,如果确定语音信息不属于查号需求,则可确定该语音信息为非查号需求,例如,非查号需求可包括但不限于问候语、无意义需求、航班预订等,并可根据不同的非查号需求的类型给出对应的响应措施,其中,本发明针对根据不同的非查号需求的类型给出对应的响应措施的具体实现过程不做限定。由此,可以过滤出真实的查号需求,从而防止需求场景类型判断错误而导致的语义解析错误。
举例而言,在本发明的实施例中,第二生成模块30可以采用例如基于文法规则网络对文字信息进行语义解析以生成初始查号意图。其中,可以理解,在查号需求和问候语、无意义需求、航班预订等预先设定的非查号需求的语义场景下,可对应多种文法规则网络,即不同语句形式对应不同的文法规则网络。此外,在本发明的实施例中,文法规则网络可优选采用基于ABNF(Augmented Backus-Naur Form,扩展巴克斯范式)文法规则编译成的WFST(Weighted Finite State Transducer,加权有限状态机)网络。具体地,语义解析可以是对文字信息通过动态规划算法,对文法规则网络进行路径匹配解析,并通过回溯匹配路径,得到相应的语义信息。应当理解,对于同时匹配若干路径的,取得分最高的一条路径作为语义解析结果。
在转换的文字信息经过语义解析之后,且确定语音信息为查号需求时,第二生成模块30可从所得到的语义解析结果中提取:本查号语义场景中的关键信息槽、关键信息槽的数目,以生成初始查号意图。例如,用户输入的语音转换的文本为“我想查询亳州路的老乡鸡”,在查号这个场景中语义解析得到两个关键信息槽:查询初始意图“老乡鸡”和地标位置“亳州路”,所含关键信息槽的数目为两个,单位商家名称“老乡鸡”作为查询初始意图,“亳州路”作为地标位置信息。
第三生成模块40可用于根据预设的单位索引模型和初始查号意图生成最终查号意图。更具体地,第三生成模块40可将初始查号意图中的关键信息槽和关键信息槽的数目输入到预设的单位索引模型中,得到最终查号意图。其中,在本发明的实施例中,预设的单位索引模型可为预先基于Lucene多域存储数据和倒排索引技术进行创建的单位索引模型。
具体而言,为了能够有效地提高语音查询结果的正确性,在本发明的实施例中,如图5所示,该第三生成模块40可包括检索单元41、相似度匹配单元42、反馈单元43和生成单元44。
具体地,检索单元41可用于根据初始查号意图在预设的单位索引模型进行检索。更具体地,检索单元41可通过Learning to rank技术根据初始查号意图在预设的单位索引模型中进行查询结果的检索。
相似度匹配单元42可用于将检索结果与初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图。更具体地,在检索单元41根据初始查号意图在预设的单位索引模型中进行检索之后,相似度匹配单元42可将检索结果与初始查号意图进行相似度匹配打分,并根据降序排序的顺序对相似度打分后的检索结果进行排序,得到排序后的检索结果,然后,根据排序后的检索结果和预设的相似度匹配条件进行比对,得到满足预设的相似度匹配条件的至少一个检索结果,并将其作为至少一个相似查号意图。
举例而言,在本发明的实施例中,假设至少一个相似查号意图为一个精确查号意图或3个相似查号意图,其中,在本发明的实施例中,满足预设的相似度匹配条件的至少一个相似查号意图的获取过程可为:当排序次序为第一的检索结果的相似度程度(即排名最高的第一个的分数)超过第一预设阀值,且该排序次序为第一的检索结果的相似度程度与排序次序为第二的检索结果的相似度程序的差值(即排名最高的第一个的分数与第二个的分数差距)也超过预设分数差阀值时,输出该检索结果,并将其作为唯一精确查号意图;当排名前三不符合上述唯一精确查号意图的条件,且排名前三的分数均超过第二预设阈值时,输出三个相似查号意图,其中,第二预设阀值小于第二预设阀值。例如,设置第一预设阈值为99.99%,第二预设阈值为70%,分数差阈值为5%,检索后,存在有三种情况:
其一:当排名第一的检索结果超过第一预设阈值99.99%时,与排名第二分数差大于分数差阈值5%时,得到唯一的精确查号意图;
其二:不满足上述条件时,当排名前三的分数均高于第二预设阈值70%时,得到三个相似查号意图;
其三:不满足上述两种条件时,将表示检索失败,即得不到查号意图。
反馈单元43可用于将至少一个相似查号意图反馈至用户,以使用户对至少一个相似查号意图进行确认。更具体地,在本发明的实施例中,反馈单元43可通过语音播放形式和/或文字形式将至少一个相似查号意图反馈至用户,由用户针对至少一个相似查号意图进行确认以得到用户输入语音的最终查号意图。
生成单元44可用于根据用户的确认指令将至少一个相似查号意图的其中一个相似查号意图作为最终查号意图。更具体地,在反馈单元43将上述输出的精确查号意图或者相似查号意图通过标准语音对话流程和/或文字形式反馈给用户之后,生成单元44可根据用户针对精确查号意图或者相似查号意图的确认,以得到最终的真实查号意图。需要说明的是,在本发明的实施例中,当用户不确认时表示获取到的意图与用户期望不符,即查询失败,可由用户选择重新查询或挂机处理。
由此,通过将检索结果与初始查号意图进行相似度匹配,并通过将满足相似度匹配条件的检索结果反馈至用户,经过用户确认后作为最终查号意图,提高了查号意图的准确率,从而保证了语音查询结果的正确性。
查询模块50可用于根据最终查号意图查找预先建立的号码存储库以获取对应的号码。举例而言,假设用户输入的语音信息的最终查号意图为“查询毫州路的老乡鸡的电话号码”,查询模块50可先根据商家名称“老乡鸡”在预先建立的号码存储库中进行查找,以找到“老乡鸡”商家在号码存储库中的存储位置,并根据地标位置信息“毫州路”来获取用户需求查询的哪个地方(或哪个分店)的“老乡鸡”商的电话号码。
反馈模块60可用于将号码反馈至用户。具体而言,在本发明的实施例中,反馈模块60可通过语音播放形式和/或短信形式将获取到的号码反馈至用户。也就是说,可将查询的号码通过在标准语音对话流程用语音合成的方式播报给用户;和/或,将查询的号码通过短信的方式发送到用户接入的移动终端,由此,为用户提供更加快速、便捷的接收方式。
根据本发明实施例的通过语音进行查号的装置,可通过接收模块接收用户输入的语音信息,第一生成模块对语音信息进行文字转写以生成文字信息,第二生成模块对文字信息进行语义解析以生成初始查号意图,第三生成模块根据预设的单位索引模型和初始查号意图生成最终查号意图,查询模块根据最终查号意图查找预先建立的号码存储库以获取对应的号码,反馈模块将号码反馈至用户,实现了语音自助查号功能,并且在整个语音查号过程中,无需等待人工接线员,节省了人工成本和用户的等待时间,提高了电话查号的效率,提升了用户体验。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (10)
1.一种通过语音进行查号的方法,其特征在于,包括以下步骤:
接收用户输入的语音信息;
对所述语音信息进行文字转写以生成文字信息;
对所述文字信息进行语义解析以生成初始查号意图;其中,根据语义解析结果确定语音信息是否属于查号需求;如果确定所述语音信息属于所述查号需求,则生成所述初始查号意图;如果确定所述语音信息不属于所述查号需求,则确定所述语音信息为非查号需求;
根据预设的单位索引模型和所述初始查号意图生成最终查号意图;以及
根据所述最终查号意图查找预先建立的号码存储库以获取对应的号码,并将所述号码反馈至所述用户。
2.根据权利要求1所述的通过语音进行查号的方法,其特征在于,所述根据预设的单位索引模型和所述初始查号意图生成最终查号意图具体包括:
根据所述初始查号意图在所述预设的单位索引模型中进行检索;
将检索结果与所述初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图;
将所述至少一个相似查号意图反馈至所述用户,以使所述用户对所述至少一个相似查号意图进行确认;以及
根据所述用户的确认指令将所述至少一个相似查号意图的其中一个相似查号意图作为最终查号意图。
3.根据权利要求2所述的通过语音进行查号的方法,其特征在于,所述将所述至少一个相似查号意图反馈至所述用户具体包括:
通过语音播放形式和/或文字形式将所述至少一个相似查号意图反馈至所述用户。
4.根据权利要求1所述的通过语音进行查号的方法,其特征在于,所述将所述号码反馈至所述用户具体包括:
通过语音播放形式和/或短信形式将所述号码反馈至所述用户。
5.根据权利要求1所述的通过语音进行查号的方法,其特征在于,所述语音信息包括自然语音和/或录音。
6.一种通过语音进行查号的装置,其特征在于,包括:
接收模块,用于接收用户输入的语音信息;
第一生成模块,用于对所述语音信息进行文字转写以生成文字信息;
第二生成模块,用于对所述文字信息进行语义解析以生成初始查号意图;其中,根据语义解析结果确定语音信息是否属于查号需求;如果确定所述语音信息属于所述查号需求,则生成所述初始查号意图;如果确定所述语音信息不属于所述查号需求,则确定所述语音信息为非查号需求;
第三生成模块,用于根据预设的单位索引模型和所述初始查号意图生成最终查号意图;
查询模块,用于根据所述最终查号意图查找预先建立的号码存储库以获取对应的号码;以及
反馈模块,用于将所述号码反馈至所述用户。
7.根据权利要求6所述的通过语音进行查号的装置,其特征在于,所述第三生成模块包括:
检索单元,用于根据所述初始查号意图在所述预设的单位索引模型中进行检索;
相似度匹配单元,用于将检索结果与所述初始查号意图进行相似度匹配,并将满足预设的相似度匹配条件的至少一个检索结果作为至少一个相似查号意图;
反馈单元,用于将所述至少一个相似查号意图反馈至所述用户,以使所述用户对所述至少一个相似查号意图进行确认;以及
生成单元,用于根据所述用户的确认指令将所述至少一个相似查号意图的其中一个相似查号意图作为最终查号意图。
8.根据权利要求7所述的通过语音进行查号的装置,其特征在于,所述反馈单元具体用于:
通过语音播放形式和/或文字形式将所述至少一个相似查号意图反馈至所述用户。
9.根据权利要求6所述的通过语音进行查号的装置,其特征在于,所述反馈模块具体用于:
通过语音播放形式和/或短信形式将所述号码反馈至所述用户。
10.根据权利要求6所述的通过语音进行查号的装置,其特征在于,所述语音信息包括自然语音和/或录音。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410674306.5A CN104469029B (zh) | 2014-11-21 | 2014-11-21 | 通过语音进行查号的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410674306.5A CN104469029B (zh) | 2014-11-21 | 2014-11-21 | 通过语音进行查号的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104469029A CN104469029A (zh) | 2015-03-25 |
CN104469029B true CN104469029B (zh) | 2017-11-07 |
Family
ID=52914363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410674306.5A Active CN104469029B (zh) | 2014-11-21 | 2014-11-21 | 通过语音进行查号的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104469029B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105141787A (zh) * | 2015-08-14 | 2015-12-09 | 上海银天下科技有限公司 | 服务录音的合规检查方法及装置 |
CN105045919B (zh) * | 2015-08-24 | 2019-08-16 | 北京云知声信息技术有限公司 | 一种信息输出方法及装置 |
CN107015964B (zh) * | 2017-03-22 | 2021-10-19 | 北京光年无限科技有限公司 | 面向智能机器人开发的自定义意图实现方法及装置 |
CN108848276A (zh) * | 2018-07-30 | 2018-11-20 | 携程旅游信息技术(上海)有限公司 | 电话号码可用性检测方法、系统、设备及存储介质 |
CN112185384A (zh) * | 2020-09-30 | 2021-01-05 | 北京搜狗科技发展有限公司 | 一种查账方法、装置和耳机 |
CN112489643A (zh) * | 2020-10-27 | 2021-03-12 | 广东美的白色家电技术创新中心有限公司 | 转换方法、转换表的生成方法、装置及计算机存储介质 |
CN113095852A (zh) * | 2021-04-06 | 2021-07-09 | 江苏号百信息服务有限公司 | 一种通过智能语音进行自助分发和服务系统 |
CN113271383A (zh) * | 2021-05-12 | 2021-08-17 | 思必驰科技股份有限公司 | 语音查号方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101431573A (zh) * | 2007-11-08 | 2009-05-13 | 上海赢思软件技术有限公司 | 通过人机交互技术实现自动客户服务的方法和设备 |
TW200933391A (en) * | 2008-01-24 | 2009-08-01 | Delta Electronics Inc | Network information search method applying speech recognition and sysrem thereof |
CN102236686A (zh) * | 2010-05-07 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 语音分段式歌曲检索方法 |
CN102708863A (zh) * | 2011-03-28 | 2012-10-03 | 德信互动科技(北京)有限公司 | 语音对话设备、系统、及语音对话实现方法 |
CN103020047A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
US8650031B1 (en) * | 2011-07-31 | 2014-02-11 | Nuance Communications, Inc. | Accuracy improvement of spoken queries transcription using co-occurrence information |
-
2014
- 2014-11-21 CN CN201410674306.5A patent/CN104469029B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101431573A (zh) * | 2007-11-08 | 2009-05-13 | 上海赢思软件技术有限公司 | 通过人机交互技术实现自动客户服务的方法和设备 |
TW200933391A (en) * | 2008-01-24 | 2009-08-01 | Delta Electronics Inc | Network information search method applying speech recognition and sysrem thereof |
CN102236686A (zh) * | 2010-05-07 | 2011-11-09 | 盛乐信息技术(上海)有限公司 | 语音分段式歌曲检索方法 |
CN102708863A (zh) * | 2011-03-28 | 2012-10-03 | 德信互动科技(北京)有限公司 | 语音对话设备、系统、及语音对话实现方法 |
US8650031B1 (en) * | 2011-07-31 | 2014-02-11 | Nuance Communications, Inc. | Accuracy improvement of spoken queries transcription using co-occurrence information |
CN103020047A (zh) * | 2012-12-31 | 2013-04-03 | 威盛电子股份有限公司 | 修正语音应答的方法及自然语言对话系统 |
Also Published As
Publication number | Publication date |
---|---|
CN104469029A (zh) | 2015-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104469029B (zh) | 通过语音进行查号的方法及装置 | |
CN110377716B (zh) | 对话的交互方法、装置及计算机可读存储介质 | |
CN101030368B (zh) | 在保持情感的同时跨通道进行通信的方法和系统 | |
CN104078044B (zh) | 移动终端及其录音搜索的方法和装置 | |
CN109063221A (zh) | 基于混合策略的查询意图识别方法和装置 | |
US20130054609A1 (en) | Accessing Anchors in Voice Site Content | |
CN106571139B (zh) | 基于人工智能的语音搜索结果处理方法及装置 | |
CN110853626B (zh) | 基于双向注意力神经网络的对话理解方法、装置及设备 | |
CN111695345B (zh) | 文本中实体识别方法、以及装置 | |
CN107609186A (zh) | 信息处理方法及装置、终端设备及计算机可读存储介质 | |
JP5774459B2 (ja) | 談話要約テンプレート作成システムおよび談話要約テンプレート作成プログラム | |
CN104239459A (zh) | 语音搜索方法、装置和系统 | |
CN103077714A (zh) | 信息的识别方法和装置 | |
CN105117387B (zh) | 一种智能机器人交互系统 | |
CN105095186A (zh) | 语义解析方法和装置 | |
CN106802885A (zh) | 一种会议纪要自动记录方法、装置和电子设备 | |
CN103593412B (zh) | 一种基于树形结构问题的应答方法及系统 | |
CN107273359A (zh) | 一种文本相似度确定方法 | |
CN104462600A (zh) | 实现来电原因自动分类的方法及装置 | |
CN107680588A (zh) | 智能语音导航方法、装置及存储介质 | |
CN109670033A (zh) | 内容的检索方法、装置、设备及存储介质 | |
CN106205613B (zh) | 一种导航语音识别方法及系统 | |
CN106844341A (zh) | 基于人工智能的新闻摘要提取方法及装置 | |
CN109992671A (zh) | 意图识别方法、装置、设备及存储介质 | |
CN107209757A (zh) | 自然语言理解缓存器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |