CN109727594B - 语音处理方法及装置 - Google Patents
语音处理方法及装置 Download PDFInfo
- Publication number
- CN109727594B CN109727594B CN201811620321.6A CN201811620321A CN109727594B CN 109727594 B CN109727594 B CN 109727594B CN 201811620321 A CN201811620321 A CN 201811620321A CN 109727594 B CN109727594 B CN 109727594B
- Authority
- CN
- China
- Prior art keywords
- text data
- matching
- matcher
- core
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明提供了一种语音处理方法及装置,通过获取用户输入的语音数据以及用户位置信息,识别语音数据的内容,获得文本数据,对文本数据分词处理识别核心关键词,将核心关键词依次输入到各匹配器分别进行匹配,得到匹配文本数据,依据匹配文本数据从预先设置的知识库中,分别获取核心文本数据,计算匹配文本数据与匹配文本数据对应的核心文本数据的匹配度,并获取最高匹配度对应的核心文本数据,在知识库中,查询最高匹配度对应的核心文本数据以及用户位置信息对应的操作,并输出操作结果;缓解了现有技术中存在的无法准确理解客户的信息,无法给客户准确的信息反馈及客户体验度差的技术问题,提高了信息反馈的准确度及客户的体验度。
Description
技术领域
本发明涉及语音识别处理的技术领域,尤其是涉及一种语音处理方法及装置。
背景技术
聊天机器人是一个用来模拟人类对话或聊天的程序,常作为在线客服的一种辅助沟通手段,目前比较知名的聊天机器人有京东的jimi,阿里的小蜜,小艾机器人等,可以实现单轮和多轮交互等场景。
现有技术中,聊天机器人语义识别算法较为单一,对于近似业务场景无法准确区分,同时对于顾客出现多关键词命中情况时无法区别顾客实际意图,例如,顾客输入:我要下个保洁的订单,不,帮我下个保姆的订单吧,这种情况下,由于包含有保洁、保姆等多个关键词,使得聊天机器人无法准确识别客户的实际需求。进一步的,目前针对物业行业的聊天机器人较少,而通用的聊天机器人不适用于物业行业,因为物业行业中不同地区的信息的差别很大,例如,在同一个城市中不同的小区的物业费不一样,停水停电的通知也不同,因此,物业行业的聊天机器人的信息需要定位社区维度,而将通用的聊天机器人应用在物业行业会无法准确理解顾客的信息,也无法给客户准确的信息反馈,致使客户的体验度差。
发明内容
有鉴于此,本发明的目的在于提供一种语音处理方法及装置,以缓解现有技术中存在的将通用的聊天机器人应用在物业行业时造成的无法准确理解顾客的信息,也无法给客户准确的信息反馈,致使客户的体验度差的技术问题。
第一方面,本发明实施例提供了一种语音处理方法,所述方法用于物业行业服务器中,所述方法包括:
获取用户输入的语音数据以及用户位置信息,识别所述语音数据的内容,获得文本数据;
将所述文本数据进行分词处理,识别所述文本数据中的核心关键词;
将所述核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据;
依据各所述匹配器输出的所述匹配文本数据,从预先设置的知识库中,分别获取与各所述匹配文本数据相匹配的核心文本数据,计算所述匹配文本数据与所述匹配文本数据对应的所述核心文本数据的匹配度;
从计算得到的所述匹配度中,获取最高匹配度对应的所述核心文本数据,在所述知识库中,查询所述最高匹配度对应的所述核心文本数据以及所述用户位置信息对应的操作,并输出操作结果。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,所述将所述文本数据进行分词处理,识别所述文本数据中的核心关键词,包括:
将所述文本数据输入到提前设置好的包括语法结构关系的分词库中进行识别,得到所述文本数据的核心关键词。
结合第一方面,本发明实施例提供了第一方面的第二种可能的实施方式,其中,所述匹配器组包括:核心目的匹配器、关键词匹配器以及全句文本匹配器。
结合第一方面第二种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,所述匹配器为所述核心目的匹配器,将所述核心关键词依次输入到预先设置的所述匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,包括:
将所述核心关键词输入到所述核心目的匹配器,所述核心目的匹配器中设置有匹配规则,通过所述核心目的匹配器的匹配规则对所述文本数据进行处理,获取所述核心关键词对应的匹配文本数据;
所述匹配规则包括:提取文本数据的动宾关系、提取文本数据的兼语、去除提取文本数据的停用词。
结合第一方面第二种可能的实施方式,本发明实施例提供了第一方面的第四种可能的实施方式,其中,所述匹配器为所述关键词匹配器,将所述核心关键词依次输入到预先设置的所述匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,包括:
将所述核心关键词输入到所述关键词匹配器,获取所述核心关键词对应的匹配文本数据。
结合第一方面第二种可能的实施方式,本发明实施例提供了第一方面的第五种可能的实施方式,其中,所述匹配器为全句文本匹配器,将所述核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,包括:
将所述核心关键词输入到所述全句文本匹配器,所述全句文本匹配器中设置有匹配规则,通过全句文本匹配器的匹配规则对所述文本数据进行处理,获取所述核心关键词对应的匹配文本数据;
所述全句文本匹配器的匹配规则包括:将文本数据进行分词处理,对文本数据中的词语重新排序,使排序后的文本数据符合语法结构。
结合第一方面,本发明实施例提供了第一方面的第六种可能的实施方式,其中,当各所述匹配器输出的匹配文本数据为空,所述方法还包括:
将所述用户输入的语音数据转换为拼音数据;
利用预设的拼音匹配算法,从所述知识库中,获取与所述拼音数据匹配度最高的核心文本数据,并将所述匹配度作为所述匹配文本数据与所述核心文本数据的匹配度。
结合第一方面,本发明实施例提供了第一方面的第七种可能的实施方式,其中,当各所述匹配器输出的匹配文本数据为空,所述方法还包括:
将所述用户输入的语音数据转换为拼音数据;
利用预设的拼音匹配算法,从所述知识库中,获取匹配度前序前n位对应的核心文本数据,n为自然数;
将获取到的n个所述核心文本数据输出,以供用户选择确认;
获取用户确认的所述核心文本数据,并将所述核心文本数据对应的匹配度作为所述匹配文本数据与所述核心文本数据的匹配度。
结合第一方面至第一方面第七种可能的实施方式,本发明实施例提供了第一方面的第八种可能的实施方式,其中,所述输出操作结果,包括:
调用APP界面、回答生活类问题及返回无匹配结果。
第二方面,本发明实施例还提供一种语音处理装置,包括:
文本数据获取模块,用于获取用户输入的语音数据以及用户位置信息,识别所述语音数据的内容,获得文本数据;
识别模块,用于将所述文本数据进行分词处理,识别所述文本数据中的核心关键词;
匹配模块,用于将所述核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据;
匹配度计算模块,用于依据各所述匹配器输出的所述匹配文本数据,从预先设置的知识库中,分别获取与各所述匹配文本数据相匹配的核心文本数据,计算所述匹配文本数据与所述匹配文本数据对应的所述核心文本数据的匹配度;
操作结果获取模块,用于从计算得到的匹配度中,获取最高匹配度对应的核心文本数据,在所述知识库中,查询所述最高匹配度对应的所述核心文本数据以及所述用户位置信息对应的操作,并输出操作结果。
本发明实施例带来了以下有益效果:本发明实施例提供的语音处理方法及装置,通过获取用户输入的语音数据以及用户位置信息,识别语音数据的内容,获得文本数据;将文本数据进行分词处理,识别文本数据中的核心关键词;将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据;依据各匹配器输出的匹配文本数据,从预先设置的知识库中,分别获取与各匹配文本数据相匹配的核心文本数据,计算匹配文本数据与匹配文本数据对应的核心文本数据的匹配度;从计算得到的所述匹配度中,获取最高匹配度对应的核心文本数据,在知识库中,查询最高匹配度对应的核心文本数据以及用户位置信息对应的操作,并输出操作结果,缓解了现有技术中存在的将通用的聊天机器人应用在物业行业时造成的无法准确理解客户的信息,无法给客户准确的信息反馈,致使客户体验度差的技术问题,提高了信息反馈的准确度及客户的体验度。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种语音处理方法的流程图;
图2为本发明实施例提供的一种拼音匹配算法的流程图;
图3为本发明实施例提供的另一种拼音匹配算法的流程图;
图4为本发明实施例提供的一种语音处理装置的结构框图。
图标:201-文本数据获取模块;202-识别模块;203-匹配模块;204-匹配度计算模块;205-操作结果获取模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前聊天机器人语义识别算法较为单一,对于近似业务场景无法准确区分,同时对于顾客出现多关键词命中情况时无法区别顾客实际意图。进一步的,目前针对物业行业的聊天机器人较少,而通用的聊天机器人不适用于物业行业,因为物业行业中不同地区的信息的差别很大,例如,在同一个城市中不同的小区的物业费不一样,停水停电的通知也不同,因此,物业行业的聊天机器人的信息需要定位社区维度,而将通用的聊天机器人应用在物业行业会无法准确理解顾客的信息,也无法给客户准确的信息反馈,致使客户的体验度差,基于此,本发明实施例提供的一种语音处理方法及装置,可以应用在物业行业,能够理解客户的信息,并根据理解的客户信息给客户准确的反馈,提高了客户的体验度。
为便于对本实施例进行理解,首先对本发明实施例所公开的一种语音处理方法进行详细介绍。
实施例一:
本发明实施例提供了一种语音处理方法,该方法用于物业行业服务器中,如图1所示,图中示出的是一种语音处理方法的流程图,该方法包括以下步骤:
步骤S101:获取用户输入的语音数据以及用户位置信息,识别语音数据的内容,获得文本数据;
在本发明实施例中,服务器获取用户输入的语音数据,通过语音识别软件识别获取到的语音数据,并将识别到的数据转换成文本数据,同时,服务器在获取语音数据时,同时定位用户的位置信息,确定用户所处的城市及小区。
步骤S102:将文本数据进行分词处理,识别文本数据中的核心关键词;
在本发明实施例中,依据句子的语法结构关系,例如,主谓关系、动宾关系、兼语、修正关系等,对文本数据进行分词处理,得到核心关键词。作为一可选实施例,将文本数据输入到提前设置好的包括语法结构关系的分词库中进行识别,得到文本数据的核心关键词。
步骤S103:将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据;
本申请实施例中,作为一可选实施例,匹配器组包括:核心目的匹配器、关键词匹配器以及全句文本匹配器。
本申请实施例中,作为一可选实施例,匹配器组中的匹配器为核心目的匹配器,将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据,包括:
将核心关键词输入到核心目的匹配器,获取核心关键词对应的匹配文本数据。
本申请实施例中,核心目的匹配器中设置有匹配规则,作为一可选实施例,该匹配规则包括但不限于:提取文本数据的动宾关系、提取文本数据的兼语、去除提取文本数据的停用词等,通过匹配规则对文本数据进行处理,得到核心文本数据。
本申请实施例中,作为一可选实施例,匹配器组中的匹配器为关键词匹配器,将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据,包括:
将核心关键词输入到关键词匹配器,获取核心关键词对应的匹配文本数据。
本申请实施例中,作为一可选实施例,匹配器组中的匹配器为全句文本匹配器,将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据,包括:
将核心关键词输入到全句文本匹配器,获取核心关键词对应的匹配文本数据。
本申请实施例中,全句文本匹配器中设置有匹配规则,作为一可选实施例,该匹配规则包括但不限于:将文本数据分词处理,对文本数据中的词语重新排序,使排序后的文本数据符合语法结构,通过匹配规则对文本数据进行处理,得到核心文本数据。
步骤S104:依据各匹配器输出的匹配文本数据,从预先设置的知识库中,分别获取与各匹配文本数据相匹配的核心文本数据,计算匹配文本数据与该匹配文本数据对应的核心文本数据的匹配度;
本申请实施例中,在获取各匹配器输出的匹配文本数据后,将获取的匹配文本数据与知识库进行匹配,得到与该匹配文本数据相匹配的核心文本数据,然后,利用文本相似度匹配算法计算该匹配文本数据与该核心文本数据之间的匹配度。例如,文本数据为:我需要打扫卫生的阿姨清理房屋,经过分词处理以及与核心目的匹配器进行匹配处理后,得到的匹配文本数据为:需要阿姨清理房屋,将提取出的匹配文本数据输入到知识库中进行匹配,得到的核心文本数据为:我要&清理房屋,其中,清理房屋为知识库中与匹配文本数据相匹配的关键词,我要为知识库中相匹配的关键词对应的范式。
本申请实施例中,计算核心文本数据与匹配文本数据之间的匹配度,即计算“需要阿姨清理房屋”与“我要&清理房屋”之间的匹配度,这样,通过将核心关键词输入至核心目的匹配器进行匹配,依据匹配得到的匹配文本数据进行知识库匹配,可以提升文本数据匹配的精度;进一步的,通过核心目的匹配器匹配后,可以有效去除文本数据中的干扰词组,避免文本数据中出现多关键词导致的无法准确识别出客户实际需求的情形。例如,若文本数据为:我要下个保洁的订单,不,帮我下个保姆的订单吧,该文本数据中包含有保洁、保姆等多个关键词,其中,保洁为干扰词组,后续进行匹配时,无法准确识别客户实际只需要保姆的需求。而本申请实施例中,通过将文本数据分词后输入到核心目的匹配器中,核心目的匹配器根据相应的匹配规则将停用词之前的数据去除,即将文本数据中“我要下个保洁的订单”的内容去除,再对去除干扰内容的文本数据进行处理,提取出匹配文本数据,即下个保姆的订单,从而去除了文本数据中的干扰词组,能够准确识别出客户的实际需求,减小了匹配的误差,提高了匹配数据的准确度。
本申请实施例中,由于用户输入的语音数据中可能存在杂音或者口音等问题,在语音转换成文字的过程中可能会出现转换不清楚的地方,例如,标准输入是:我的千丁劵,由于获取到的语音数据存在口音的问题,识别模块可能会识别为:我的签订券儿。因此,将错误识别的文本数据进行分词并匹配器匹配后,可能获取不到该文本数据的匹配文本数据,从而也就无法通过知识库计算匹配度,因而,作为一可选实施例,如图2所示,图中示出的是一种拼音匹配算法的流程图,若各匹配器输出的匹配文本数据为空,该方法还包括:
步骤S1041,将用户输入的语音数据转换为拼音数据;
步骤S1042,利用预设的拼音匹配算法,从知识库中,获取与拼音数据匹配度最高的核心文本数据,并将该匹配度作为匹配文本数据与核心文本数据的匹配度。
本申请实施例中,若各匹配器输出的匹配文本数据为空,即没有获取到文本数据的匹配文本数据,使用拼音匹配的方法对文本数据进行校正,并依据校正后的文本数据重新定位匹配文本数据。作为一可选实施例,将用户输入的语音数据或将分词后的文本数据转换成拼音数据,利用拼音匹配算法,将拼音数据与知识库中的关键词进行对比,获取知识库中各关键词与拼音数据的匹配度,将最高匹配度对应的关键词作为核心文本数据以及匹配文本数据。
作为另一可选实施例,如图3所示,图中示出的是另一种拼音匹配算法的流程图,若各匹配器输出的匹配文本数据为空,该方法还包括:
步骤S1043,将用户输入的语音数据转换为拼音数据;
步骤S1044,利用预设的拼音匹配算法,从所述知识库中,获取匹配度前序前n位对应的核心文本数据,n位自然数;
步骤S1045,将获取到的n个核心文本数据输出,以供用户选择确认;
步骤S1046,获取用户确认的核心文本数据,并将核心文本数据对应的匹配度作为匹配文本数据与核心文本数据的匹配度。
在本发明实施例中,可以将匹配度前序前n位对应的关键词输出以供用户选择确认,其中,n位自然数。例如,当获取到的拼音数据为我的签订券儿的拼音时,经过拼音匹配算法以及知识库匹配校正后,返回到输出端的结果为:“您说的是不是千丁券”,如果用户确认,用千丁券替代文本数据中的签订券儿。
作为再一可选实施例,在形成新的文本数据后,可以对新的文本数据进行分词并执行后续相应处理。
步骤S105:从计算得到的匹配度中,获取最高匹配度对应的核心文本数据,在所述知识库中,查询所述最高匹配度对应的核心文本数据以及所述用户位置信息对应的操作,并输出操作结果。
本申请实施例中,每一匹配器输出的匹配文本数据匹配知识库中的一核心文本数据,对应有一匹配度,选取最高匹配度对应的核心文本数据,依据该选取的核心文本数据与获取的用户位置信息进行操作。
本申请实施例中,作为一可选实施例,知识库中的各关键词即核心文本数据映射相应的标签。例如,知识库中,通过预先获取大量的物业行业常用词即关键词,将获取到的常用词按标签分类,例如,标签可以为报市、服务、维修等,每个标签下对应一定数量的常用词,每一标签对应一范式。例如,在服务标签下,包含关键词保姆、保洁,对应的范式有我需要、帮我找、找一个等;在维修的标签下,包含关键词电视、电脑、洗衣机、空调、微波炉等,对应的范式有我要修、帮我修、我想修、需要维修、找人维修、坏了等;在报市的标签下,包含关键词房价、物业费、水费、电费等,对应的范式有我想知道、我想了解、了解一下等。
本申请实施例中,在匹配文本数据匹配过程中,将范式与关键词对应可得到核心文本数据,例如,我需要保姆、帮我找一个保姆等,不同的标签,可以对应相同的范式,也可以对应不同的范式。
本申请实施例中,作为一可选实施例,为标签下的每一关键词和对应的范式,结合位置信息创建对应的具体操作,即根据具体的问题创建具体的答案。例如,服务标签下,对于关键词保姆,依据不同的地理位置,分别创建对应的保姆服务操作界面,例如,分别创建朝阳区保姆服务操作界面、海淀区保姆服务操作界面、西城区保姆服务操作界面等,在每一保姆服务操作界面中,有详细的保姆信息。再例如,在报市的标签下,若关键词和范式为我想了解水费,则根据不同的城市、不同的社区创建不同的答案。
本申请实施例中,作为一可选实施例,具体操作包括:调用APP界面、回答生活类问题及返回无匹配结果,具体的,关于调用APP界面,例如,若最高匹配度对应的核心文本数据为:我需要打扫卫生的阿姨,则调用知识库中的保洁APP界面,进入用户位置信息对应的保洁服务操作界面;若最高匹配度对应的核心文本数据为:我想知道社区新闻,则调用知识库中的社区新闻APP界面,进入用户位置信息对应的社区新闻界面;对于回答生活类问题,例如,最高匹配度对应的核心文本数据为:物业费为多少?根据获取到的用户位置信息输出与用户位置信息相匹配的固定答案,例如,若定位用户位置信息在北京A小区,则输出5元/每平米,若定位用户位置信息在重庆B小区,则输出3元/每平米;返回无匹配结果是指匹配结果失败,例如,对于前述若匹配器组没有任何匹配输出,则输出内容为没有找到相关内容,请重新输入。
本发明实施例提供的语音处理方法,通过获取用户输入的语音数据以及用户位置信息,识别语音数据的内容,获得文本数据;将文本数据进行分词处理,识别文本数据中的核心关键词;将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据;依据各匹配器输出的匹配文本数据,从预先设置的知识库中,分别获取与各匹配文本数据相匹配的核心文本数据,计算匹配文本数据与匹配文本数据对应的核心文本数据的匹配度;从计算得到的所述匹配度中,获取最高匹配度对应的核心文本数据,在知识库中,查询最高匹配度对应的核心文本数据以及用户位置信息对应的操作,并输出操作结果;本发明实施例提供的语音处理方法能够去除了文本数据中的干扰词组,进而能够准确识别出客户的实际需求,减小了匹配的误差,提高了匹配数据的准确度,缓解了现有技术中存在的将通用的聊天机器人应用在物业行业时造成的无法准确理解客户的信息,无法给客户准确的信息反馈,致使客户体验度差的技术问题,提高了信息反馈的准确度及客户的体验度。
实施例二:
在上述实施例的基础上,本发明实施例还提供了一种语音处理装置,如图4所示的是一种语音处理装置的结构框图,该装置包括如下模块:
文本数据获取模块201,用于获取用户输入的语音数据以及用户位置信息,识别语音数据的内容,获得文本数据;
识别模块202,用于将文本数据进行分词处理,识别文本数据中的核心关键词;
匹配模块203,用于将核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各匹配器输出的匹配文本数据;
匹配度计算模块204,用于依据各匹配器输出的匹配文本数据,从预先设置的知识库中,分别获取与各匹配文本数据相匹配的核心文本数据,计算匹配文本数据与匹配文本数据对应的核心文本数据的匹配度;
操作结果获取模块205,用于从计算得到的匹配度中,获取最高匹配度对应的核心文本数据,在知识库中,查询最高匹配度对应的核心文本数据以及用户位置信息对应的操作,并输出操作结果。
进一步的,本发明实施例提供的语音处理装置中,识别模块202包括:
识别单元,用于将文本数据输入到提前设置好的包括语法结构关系的分词库中进行识别,得到文本数据的核心关键词。
进一步的,本发明实施例提供的语音处理装置中,匹配模块203包括:
核心目的匹配器匹配单元,用于将核心关键词输入到核心目的匹配器,核心目的匹配器中设置有匹配规则,通过核心目的匹配器的匹配规则对文本数据进行处理,获取核心关键词对应的匹配文本数据。
关键词匹配器匹配单元,用于将核心关键词输入到关键词匹配器,获取核心关键词对应的匹配文本数据。
全句文本匹配器匹配单元,用于将核心关键词输入到全句文本匹配器,全句文本匹配器中设置有匹配规则,通过全句文本匹配器的匹配规则对文本数据进行处理,获取核心关键词对应的匹配文本数据。
进一步的,本发明实施例提供的语音处理装置中,所述装置包括:
第一拼音转换单元,用于将用户输入的语音数据转换为拼音数据;
第一拼音匹配单元,用于利用预设的拼音匹配算法,从知识库中,获取与拼音数据匹配度最高的核心文本数据,并将匹配度作为匹配文本数据与核心文本数据的匹配度。
作为一可选实施例,所述装置还可以包括:
第二拼音转换单元,用于将用户输入的语音数据转换为拼音数据;
第二拼音匹配单元,用于利用预设的拼音匹配算法,从所述知识库中,获取匹配度前序前n位对应的核心文本数据,n位自然数;
客户确认单元,用于将获取到的n个核心文本数据输出,以供用户选择确认;
核心文本数据确认单元,用于获取用户确认的核心文本数据,并将核心文本数据对应的匹配度作为匹配文本数据与所述核心文本数据的匹配度。
本发明实施例提供的语音处理装置,与上述实施例提供的语音处理方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (5)
1.一种语音处理方法,其特征在于,所述方法用于物业行业服务器中,所述方法包括:
获取用户输入的语音数据以及用户位置信息,识别所述语音数据的内容,获得文本数据;
将所述文本数据输入到提前设置好的包括语法结构关系的分词库中进行识别,得到所述文本数据的核心关键词;
将所述核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,所述匹配器组包括:核心目的匹配器、关键词匹配器以及全句文本匹配器;
所述将所述核心关键词依次输入到预先设置的所述匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,包括以下几种方式:
方式一:所述匹配器为所述核心目的匹配器,将所述核心关键词输入到所述核心目的匹配器,所述核心目的匹配器中设置有匹配规则,通过所述核心目的匹配器的匹配规则对所述文本数据进行处理,获取所述核心关键词对应的匹配文本数据;所述匹配规则包括:提取文本数据的动宾关系、提取文本数据的兼语、去除提取文本数据的停用词;
方式二:所述匹配器为所述关键词匹配器,将所述核心关键词输入到所述关键词匹配器,获取所述核心关键词对应的匹配文本数据;
方式三:所述匹配器为所述全句文本匹配器,将所述核心关键词输入到所述全句文本匹配器,所述全句文本匹配器中设置有匹配规则,通过全句文本匹配器的匹配规则对所述文本数据进行处理,获取所述核心关键词对应的匹配文本数据;所述全句文本匹配器的匹配规则包括:将文本数据进行分词处理,对文本数据中的词语重新排序,使排序后的文本数据符合语法结构;
依据各所述匹配器输出的所述匹配文本数据,从预先设置的知识库中,分别获取与各所述匹配文本数据相匹配的核心文本数据,计算所述匹配文本数据与所述匹配文本数据对应的所述核心文本数据的匹配度;
从计算得到的所述匹配度中,获取最高匹配度对应的所述核心文本数据,在所述知识库中,查询所述最高匹配度对应的所述核心文本数据以及所述用户位置信息对应的操作,并输出操作结果。
2.根据权利要求1所述的方法,其特征在于,当各所述匹配器输出的匹配文本数据为空,所述方法还包括:
将所述用户输入的语音数据转换为拼音数据;
利用预设的拼音匹配算法,从所述知识库中,获取与所述拼音数据匹配度最高的核心文本数据,并将所述匹配度作为所述匹配文本数据与所述核心文本数据的匹配度。
3.根据权利要求1所述的方法,其特征在于,当各所述匹配器输出的匹配文本数据为空,所述方法还包括:
将所述用户输入的语音数据转换为拼音数据;
利用预设的拼音匹配算法,从所述知识库中,获取匹配度前序前n位对应的核心文本数据,n为自然数;
将获取到的n个所述核心文本数据输出,以供用户选择确认;
获取用户确认的所述核心文本数据,并将所述核心文本数据对应的匹配度作为所述匹配文本数据与所述核心文本数据的匹配度。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述输出操作结果,包括:
调用APP界面、回答生活类问题及返回无匹配结果。
5.一种语音处理装置,其特征在于,所述装置包括:
文本数据获取模块,用于获取用户输入的语音数据以及用户位置信息,识别所述语音数据的内容,获得文本数据;
识别模块,用于将所述文本数据输入到提前设置好的包括语法结构关系的分词库中进行识别,得到所述文本数据的核心关键词;
匹配模块,用于将所述核心关键词依次输入到预先设置的匹配器组中的各匹配器分别进行匹配,获取各所述匹配器输出的匹配文本数据,所述匹配器组包括:核心目的匹配器、关键词匹配器以及全句文本匹配器;
所述匹配模块,包括:
核心目的匹配器匹配单元,用于将核心关键词输入到核心目的匹配器,核心目的匹配器中设置有匹配规则,通过核心目的匹配器的匹配规则对文本数据进行处理,获取核心关键词对应的匹配文本数据;所述匹配规则包括:提取文本数据的动宾关系、提取文本数据的兼语、去除提取文本数据的停用词;
关键词匹配器匹配单元,用于将所述核心关键词输入到所述关键词匹配器,获取所述核心关键词对应的匹配文本数据;
全句文本匹配器匹配单元,用于将所述核心关键词输入到所述全句文本匹配器,所述全句文本匹配器中设置有匹配规则,通过全句文本匹配器的匹配规则对所述文本数据进行处理,获取所述核心关键词对应的匹配文本数据;所述全句文本匹配器的匹配规则包括:将文本数据进行分词处理,对文本数据中的词语重新排序,使排序后的文本数据符合语法结构;
匹配度计算模块,用于依据各所述匹配器输出的所述匹配文本数据,从预先设置的知识库中,分别获取与各所述匹配文本数据相匹配的核心文本数据,计算所述匹配文本数据与所述匹配文本数据对应的所述核心文本数据的匹配度;
操作结果获取模块,用于从计算得到的匹配度中,获取最高匹配度对应的核心文本数据,在所述知识库中,查询所述最高匹配度对应的所述核心文本数据以及所述用户位置信息对应的操作,并输出操作结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811620321.6A CN109727594B (zh) | 2018-12-27 | 2018-12-27 | 语音处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811620321.6A CN109727594B (zh) | 2018-12-27 | 2018-12-27 | 语音处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109727594A CN109727594A (zh) | 2019-05-07 |
CN109727594B true CN109727594B (zh) | 2021-04-09 |
Family
ID=66296610
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811620321.6A Active CN109727594B (zh) | 2018-12-27 | 2018-12-27 | 语音处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109727594B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110334183B (zh) * | 2019-07-02 | 2021-07-27 | 思必驰科技股份有限公司 | 使用任意文本词库的方法及装置 |
CN111192584A (zh) * | 2019-12-11 | 2020-05-22 | 秒针信息技术有限公司 | 单据核销方法及系统 |
CN113538048B (zh) * | 2021-07-12 | 2022-10-14 | 深圳市明源云客电子商务有限公司 | 需求信息获得方法、装置、终端设备以及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838713A (zh) * | 2014-03-27 | 2014-06-04 | 王峥嵘 | 一种基于正则表达式的语义分析方法 |
CN105320758A (zh) * | 2015-10-19 | 2016-02-10 | 深圳市新科聚合网络技术有限公司 | 搜索服务平台及其搜索服务的方法 |
CN107301865A (zh) * | 2017-06-22 | 2017-10-27 | 海信集团有限公司 | 一种用于语音输入中确定交互文本的方法和装置 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN107688667A (zh) * | 2017-09-30 | 2018-02-13 | 平安科技(深圳)有限公司 | 智能机器人客服方法、电子装置及计算机可读存储介质 |
CN107766511A (zh) * | 2017-10-23 | 2018-03-06 | 深圳市前海众兴电子商务有限公司 | 智能问答方法、终端及存储介质 |
CN108256009A (zh) * | 2018-01-03 | 2018-07-06 | 国网江苏省电力有限公司电力科学研究院 | 一种提高电力智能应答机器人回答准确率的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101641572B1 (ko) * | 2015-01-19 | 2016-07-21 | 주식회사 엔씨소프트 | 상황 및 선호도 기반 대화 스티커 순위 결정 방법 및 컴퓨터 프로그램 |
-
2018
- 2018-12-27 CN CN201811620321.6A patent/CN109727594B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103838713A (zh) * | 2014-03-27 | 2014-06-04 | 王峥嵘 | 一种基于正则表达式的语义分析方法 |
CN105320758A (zh) * | 2015-10-19 | 2016-02-10 | 深圳市新科聚合网络技术有限公司 | 搜索服务平台及其搜索服务的方法 |
CN107315766A (zh) * | 2017-05-16 | 2017-11-03 | 广东电网有限责任公司江门供电局 | 一种集合智能与人工问答的语音问答方法及其装置 |
CN107301865A (zh) * | 2017-06-22 | 2017-10-27 | 海信集团有限公司 | 一种用于语音输入中确定交互文本的方法和装置 |
CN107688667A (zh) * | 2017-09-30 | 2018-02-13 | 平安科技(深圳)有限公司 | 智能机器人客服方法、电子装置及计算机可读存储介质 |
CN107766511A (zh) * | 2017-10-23 | 2018-03-06 | 深圳市前海众兴电子商务有限公司 | 智能问答方法、终端及存储介质 |
CN108256009A (zh) * | 2018-01-03 | 2018-07-06 | 国网江苏省电力有限公司电力科学研究院 | 一种提高电力智能应答机器人回答准确率的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109727594A (zh) | 2019-05-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555095B (zh) | 人机对话方法和装置 | |
CN110266899B (zh) | 客户意图的识别方法和客服系统 | |
CN109727594B (zh) | 语音处理方法及装置 | |
CN110162780B (zh) | 用户意图的识别方法和装置 | |
CN111310440B (zh) | 文本的纠错方法、装置和系统 | |
CN110266900B (zh) | 客户意图的识别方法、装置及客服系统 | |
CN110765759A (zh) | 意图识别方法及装置 | |
CN113326702B (zh) | 语义识别方法、装置、电子设备及存储介质 | |
CN112527986A (zh) | 多轮对话文本生成方法、装置、设备及存储介质 | |
CN111144118B (zh) | 口语化文本中命名实体的识别方法、系统、设备和介质 | |
CN111813923A (zh) | 文本摘要方法、电子设备及存储介质 | |
CN112363903A (zh) | 故障报告生成方法、装置、电子设备和计算机可读介质 | |
CN110750626B (zh) | 一种基于场景的任务驱动的多轮对话方法及系统 | |
CN114492396A (zh) | 用于汽车专有名词的文本错误纠正方法及可读存储介质 | |
CN113553431A (zh) | 用户标签提取方法、装置、设备及介质 | |
CN115691503A (zh) | 语音识别方法、装置、电子设备和存储介质 | |
CN106776542A (zh) | 用户反馈信息的关键词处理方法、装置及服务器 | |
CN110866394A (zh) | 公司名称识别方法及装置、计算机设备及可读存储介质 | |
CN109961320A (zh) | 一种基于计算机网络开发运营意见反馈收集系统 | |
CN115660083A (zh) | 面向传输网故障的知识图谱的构建、问答方法及设备 | |
CN114528851A (zh) | 回复语句确定方法、装置、电子设备和存储介质 | |
CN110826330B (zh) | 人名识别方法及装置、计算机设备及可读存储介质 | |
CN110083807B (zh) | 合同的修改影响自动预测方法、装置、介质及电子设备 | |
KR20220139626A (ko) | 인공신경망 기반 오픈소스 한국어 이해 파이프라인 최적화 장치 및 방법 | |
CN112632241A (zh) | 智能会话的方法、装置、设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |