CN104375847A - 识别业务类型的方法及装置 - Google Patents

识别业务类型的方法及装置 Download PDF

Info

Publication number
CN104375847A
CN104375847A CN201310354245.XA CN201310354245A CN104375847A CN 104375847 A CN104375847 A CN 104375847A CN 201310354245 A CN201310354245 A CN 201310354245A CN 104375847 A CN104375847 A CN 104375847A
Authority
CN
China
Prior art keywords
service
type
information
probability distribution
language block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310354245.XA
Other languages
English (en)
Other versions
CN104375847B (zh
Inventor
贾江涛
顾翀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201310354245.XA priority Critical patent/CN104375847B/zh
Publication of CN104375847A publication Critical patent/CN104375847A/zh
Application granted granted Critical
Publication of CN104375847B publication Critical patent/CN104375847B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本发明公开了一种识别业务类型的方法,涉及数据处理领域,通过从用户输入的业务信息中提取一个或多个目标语块共现信息,并通过在预先配置的概率分布信息中查找所述目标语块共现信息在各个业务类型中的概率分布,并计算各业务类型下的所述一个或多个目标语块共现信息的概率分布之和,根据计算结果来判断用户所期望的目标业务类型;并在确定用户期望的目标业务类型后,即可为用户提供相应服务。本发明主要应用于呼叫应答服务等相关流程中。

Description

识别业务类型的方法及装置
技术领域
本发明涉及数据处理领域,尤其涉及一种识别业务类型的方法及装置。
背景技术
呼叫中心(英文Call Center或Call Centre)也叫客户服务中心之类的,早期的呼叫中心就是些热线电话、咨询电话,由受过训练的话务员专门接听处理来电客户的各类问题如咨询、投诉、建议。现代呼叫中心已经涉及到了计算机(软硬件)技术、Internet技术、计算机电话集成技术(CTI)、数据仓库(商业智能BI)技术、客户关系管理(CRM)技术、交换机(PBX)通讯技术、企业ERP技术和企业管理、项目管理、团队管理等诸多方面的内容。它已经成为一个统一、高效的服务工作平台,它将企业内分属各职能部门集中在一个统一的对外联系的窗口,集中化地安置坐席,采用统一的标准服务模式,为用户提供系统化、智能化、人性化的服务。呼叫中心已经成为与企业连为一体的一个完整的综合信息服务系统,是现代企业运营不可或缺的一部分,同时也成为企业间竞争的有力工具。
交互式语音应答(Interactive Voice Response,IVR)为呼叫中心主要使用的技术之一,其功能主要是利用自助语音提示,引导用户选择服务内容和输入服务所需的数据,并接受用户在电话拨号键盘多次交互输入的信息,实现对计算机数据库等信息资料的交互式访问。例如,当客户拨打移动服务电话时,首先接入IVR系统,在确认用户信息后,根据IVR给出的指引信息,用户选择对应的功能键,经过几次选择之后到达所需要的服务菜单。
在实现交互式语音应答的过程中,发明人发现现有技术中至少存在如下问题:用户与IVR系统需要完成多次交互,增加了交互次数,影响了处理效率。
发明内容
本发明的实施例提供一种识别业务类型的方法及装置,能够减少用户与客户服务器的交互次数,提高交互效率。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本发明实施例提供了一种识别业务类型的方法,其特征在于,包括:获取用户输入的业务信息;提取所述业务信息中的一个或多个目标语块共现信息;根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信息在每一种业务类型中的概率分布;根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
结合第一方面,在第一种可能的实现方式中,所述计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,在概率分布信息中查找各目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及到的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述根据计算结果,确定所述业务信息所请求的目标业务类型,具体包括:选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
结合第一方面、第一方面的第一种可能或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述概率分布信息中还记录有每种业务类型的加权值,所述加权值是历史上被所有用户请求过的业务类型中每种业务类型所占的比率;则所述根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:在计算每个指定业务类型下各目标语块共现信息的概率分布之和时,获取该业务类型的加权值,并将该业务类型下各目标语块共现信息的概率分布相加的结果与加权值作乘积运算,得到每个指定业务类型下各目标语块共现信息的概率分布之和。
结合第一方面、第一方面的第一种可能、第一方面的第二种可能或第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述提取所述业务信息中的一个或多个目标语块共现信息,具体包括:将所述业务信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。
结合第一方面、第一方面的第一种可能、第一方面的第二种可能、第一方面的第三种可能或第一方面的第四种可能的实现方式,在第五种可能的实现方式中,所述提取所述业务信息中的语块共现信息,具体包括:将所述业务信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;并根据语块集合中的各语块的特征标签,从上述选取的语块中筛选出核心词语;根据筛选到的每个核心词语,以及,与所述各核心词语属于同一信息片段的语块,分别生成语块共现信息。
结合第一方面、第一方面的第一种可能、第一方面的第二种可能、第一方面的第三种可能或第一方面的第四种可能的实现方式,在第六种可能的实现方式中,所述根据确定的目标业务类型提供对应所述业务信息的业务服务,还包括:接收到用户返回的信息,服务器在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
结合第一方面的第六种可能的实现方式,在第七种可能的实现方式中,在所述为用户提供人工坐席服务或者IVR服务之后,还包括:服务器从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;服务器从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;服务器对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;服务器为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布的值是根据计算出的目标业务类型的概率分布之和与用户所选择的业务类型的概率分布之和两者计算得到;并将所述新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。
结合第一方面或结合第一方面的上述几种可能的实现方式的,在第八种可能的实现方式中,所述根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布,具体包括:在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为当前所查找的目标语块共现信息在各业务类型中的概率分布。
第二方面,本发明实施例提供了一种识别业务类型的装置,包括:通信单元,用于获取用户输入的业务信息;语块共现信息提取单元,用于提取所述业务信息中的一个或多个目标语块共现信息;查找单元,用于根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;计算单元,用于根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;服务单元,用于根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
结合第二方面,在第一种可能的实现方式中,所述计算单元,具体用于依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,在概率分布信息中查找目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。
结合第二方面的第一种可能的实现方式,在第二种可能的实现方式中,所述服务单元还包括:第一反馈单元,用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,第二反馈单元,用于根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
结合第二方面、第二方面的第一种可能或第二方面的第二种可能的实现方式,在第三种可能的实现方式种,所述服务单元还包括:第三反馈模块,接收到用户返回的信息,在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,所述服务单元还包括:第五提取模块,从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;并从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;分词模块,用于对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;最适概率计算模块,为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;更新模块,用于将新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。
结合第二方面或第二方面的以上几种可能的实现方式,在第五种可能的实现方式中,所述查找单元还包括:第一匹配单元,用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息在各业务类型中的概率分布。
本发明实施例提供了一种识别业务类型的方法及装置,通过从用户输入的业务信息中提取目标语块共现信息,并计算提取到的目标语块共现信息在各个业务类型中的概率分布之和,并结合概率分布之和的结果来判断用户期望的目标业务类型,在判断出用户所期望的目标业务类型后,即可为用户提供相应服务,从而实现了用户仅输入业务信息后即可等待业务响应,相比于现有技术中的IVR机制,本发明的操作更为简单和高效。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种识别业务类型的方法流程图;
图2为本发明实施例提供的另一种识别业务类型的方法流程图;
图3为本发明实施例提供的另一种识别业务类型的方法流程图;
图4为本发明实施例提供的另一种识别业务类型的方法流程图;
图5为本发明实施例提供的另一种识别业务类型的方法流程图;
图6为本发明实施例提供的一种识别业务类型的装置组成框图;
图7为本发明实施例提供的另一种识别业务类型的装置组成框图;
图8为本发明实施例提供的另一种识别业务类型的装置组成框图;
图9为本发明实施例提供的另一种识别业务类型的装置组成框图;
图10为本发明实施例提供的另一种识别业务类型的装置组成框图;
图11为本发明实施例提供的另一种识别业务类型的装置组成框图;
图12为本发明实施例提供的另一种识别业务类型的装置组成框图;
图13为本发明实施例提供的另一种识别业务类型的装置组成框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种识别业务类型的方法,图1是其流程示意图,包括:
101、获取用户输入的业务信息。
其中,业务信息可以是用户提供的文本信息,或者是由用户提供的语音信息转化而成的文本信息。其接收输入的对象可以是手机、个人电脑或其他通用的输入设备。
特别说明的是,本发明实施例使用的文本信息通常情况下需要标点符号或空格等标识信息作为分隔符,用以区分不同的信息片段,例如句子或段落。
102、提取所述业务信息中的一个或多个目标语块共现信息。
其中,“语块共现信息”是指由两个或多个语块之间的相关性组合起来的对象;所述目标语块共现信息用于限定是从用户所输入的业务信息中提取的,用于与概率分布信息中的语块共现信息区别称呼,如:目标业务类型和概率分布信息中的业务类型之间的关系;所述目标语块共现信息可以由核心词语组成,也可以由语块组成,还可以由核心词语和语块共同组成。其中,核心词语可以理解为有指定特征标签的语块。
在本发明中,特征标签包括下面所描述的一种或者多种标签:1)特定词性的语块标签,如:“取消套餐中”的“取消”是分配有动词词性的语块标签;“查询话费”中的“查询”也是分配有动词词性的语块标签;2)特定业务类型名称的标签,如:“我的神州行…”中的“神州行”是分配有业务类型名称的标签,类似的业务类型名称还有“3G”、“全球通”、“人工服务”等等;3)特定业务类型涉及的数值类型的标签,如:96元套餐中的“96”是分配有数值类型的标签,类似的还有300M的上网流量套餐中的“300M”。
其中,所述语块可以是由字和字共同组成的短语,还可以是由字和词共同组成的短语,还可以是由词和词共同组成的短语。确定业务信息中语块共现信息的方法在后面的实施例中详述。
103、根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布。
其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信息在每一种业务类型中的概率分布。
具体的,所述概率分布可以是通过已收集的所有语块共现信息在不同业务类型中分布情况预先统计得到的。该概率分布信息是由服务器计算生成的或者是在服务器中保存有的,具体的所述概率分布信息在执行步骤101之前就由用户输入,并存储在服务器中;也可以是由服务器根据历史数据临时计算出来的;还可以是由服务器根据历史数据临时计算出来的,并进一步由服务器在运行的过程中周期性的来更新和维护的。所述概率分布信息可以是数据结构模型,并以文本格式或者HTML格式存储于服务器中。本领域技术人员根据已公开的内容,容易想到现有的其它存储格式也能被运用到本发明中。103步骤的具体实现,参见后续详细说明。
104、根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和。
其中,每个指定业务类型下各目标语块共现信息的概率分布之和是指:服务器先指定一种业务类型,然后对各目标语块共现信息在该业务类型下的概率分布求和;完成步骤104后,用户输入的业务信息对应于每个指定的业务类型都会有相应的一个概率分布之和的值。
105、根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
本发明实施例提供了一种识别业务类型的方法,通过从用户输入的业务信息中提取目标语块共现信息,并计算提取到的目标语块共现信息在各个业务类型中的概率分布之和,并结合对应不同业务类型获得的概率分布之和来判断用户期望的目标业务类型,相比于现有技术中的IVR机制,操作更为简单和高效。
在步骤101至105基础上,在本发明实施例的另一种可选的实施方式中,针对步骤102的如何实现目标语块共现信息的提取,具体提供了三种不同的实现方式,下面将针对三种不同的实现方式分别作具体描述。
实现方式一,如流程图2所示,包括:
A1021、对用户提供的业务信息进行分词处理和词性标注处理。
分词处理指的是将一个文本序列切分成一个一个单独的词;词性标注处理指对每一个词附上相应的词性。在本发明实施例中分词处理和词性标注处理都可以参照业内通用实现方式,本发明实施例在此不做特别限定。现有的分词处理方法包括:最小匹配算法(Minimum Matching)、正向(逆向)最大匹配法(Maximum Matching)、逐字匹配算法、神经网络法、联想一回溯法、基于N至最短路径分词算法等等。
A1022、从所述业务信息中选取指定特征标签的语块作为核心词语。
本发明实施例中提到的指定特征标签的词语可以是动词、动词短语或者是业务名词等等,例如,提供、调整、降低和服务都是业务信息中动词特征标签的语块。
A1023、根据选取的每个核心词语,分别生成目标语块共现信息。
在本实施例中,每个目标语块共现信息由一个核心词语组成,其表示形式可以为“(核心词语)”,例如:(服务)和(拨打)。
在本实现方式中,由于用户在输入业务信息之前,服务器是有可能通过用户拨打的服务电话的号码信息知道用户所需的业务类型的范围,例如:用户拨打101901可能就是跟查询话费有关。在这种情况下,服务器只需要提取到和查询话费相关的业务名词的核心词语就可以确定业务类型了。此时,服务器就可以仅提取核心词语来确定业务类型,从而尽可能减少数据处理量。
实现方式二,如流程图3所示,包括:
B1021、将所述业务信息划分为至少一个信息片段。
其中,此处描述信息片段可以为一个句子或多个句子形成的一段话。具体实现方法可以通过业务信息中的标点符号进行划分,例如分号或句号等,或者通过特殊标记来对进行划分,例如空格等。
B1022、从所述划分出的信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。
其中,所述语块集合可以是由管理员单独输入的。所述语块集合的更新方式可以是管理员手动的增加、删除或者修改;还可以是在每次由服务器确认出目标业务类型并非是用户所需要的时,服务器进一步采用分词处理和词性划分的方式,获取更多的语块来扩展当前的语块集,其具体实现方式将在后面描述。
优选的,语块集合中的语块会比概率分布信息中记录的构成历史语块共现信息的语块对象更丰富,这是为了在后续服务器针对某个业务信息确定目标业务类型出错时或者说并非用户所需要的业务类型时,提供动态调整所需的备选语块共现信息,其方法将在后面实施方式中具体描述。
B1023、根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。
在本实施例中,每个目标语块共现信息由一个或多个语块组成,并且在同一个目标语块共现信息中,其包括的所有语块必须属于同一个信息片段,即,语块属于同一句话或同一段话,才能构成一个语块共现信息。语块表示形式可以为“(语块1、语块2、……)”,例如,(5元流量包)、(5元流量包、50元流量包)等。
用户在输入业务信息之前,有可能已经告知服务器其大体的业务类型的方向。在这种情况下,服务器只需要提取到语块就可以确定业务类型了,此时,服务器可以仅提取语块而不需要进一步提取核心词语来确定业务类型,从而尽可能减少数据处理量。
相比实现方式一,方式二的处理速度更快。这是因为方式一需要对整个业务信息进行分词处理和词性标注处理,相当于从业务信息的最原始数据开始处理,因此,其处理的数据量较大而全面;方式二则是基于语块集合的基础上来查找得到的,通过查找过程能够过滤掉不少没有价值的语块,执行效率更高。
实现方式三,如流程图4所示,包括:
C1021、将所述业务信息划分为至少一个信息片段。
C1022、从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。具体方式与A1022相同。
C1023、并根据语块集中的各语块的特征标签,从上述选取的语块中筛选出核心词语。
C1024、根据筛选出的每个核心词语,以及,与核心词语属于同一信息片段的语块,分别生成目标语块共现信息。
在本实施方式中,目标语块共现信息的表示形式可以为“(核心词语、语块1、语块2、……)”,例如,在核心词语为“申请”,语块包括:“5元流量包”和“50元流量包”时,则目标语块共现信息可以表示为(申请、5元流量包)和(申请、5元流量包、50元流量包)。
需要说明的是,若同一个信息片段中有多个核心词语时,要基于每个核心词语为中心独立生成相应的目标语块共现信息。
在本实施例中,确保了将用户输入的业务信息中,能够体现对所需要的业务类型的意图的相关的语块和核心词语都提取到,从而保证确定出来的目标业务类型更有可能是用户所需要的。
进一步的,由于一个语块共现信息中出现的语块大体相同但是顺序不同时,其在业务信息中所要表示的意图基本上还是相同的。因此,当语块共现信息中包括至少两个语块时,按照预设排列规则,将获取自所述语块共现信息中的所有语块进行有序排列。而预设排列规则可以为首字的笔画数由少到多,拼音首字母的由a到z等,本发明实施例对排列规则不做过多的限定。经过语块的排序,可以减少现有技术中服务器用来维护相同意图、不同顺序的语块共现信息所消耗的存储空间。
进一步的,结合具体的概率分布信息,详细的描述步骤103的具体实现,包括:
在所述概率分布信息中记录有的语块共现信息中分别查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为当前所查找的目标语块共现信息在各业务类型中的概率分布。
可选的,在概率分布信息中未查找到某个目标语块共现信息时,可以直接为该目标语块共现信息在各业务类型中的概率分布分配零值。
可选的,在概率分布信息中未查找到某个目标语块共现信息时,将该目标语块共现信息保存到临时存储区中作为备选语块共现信息。并在后续确认反馈给用户的目标业务类型并非用户所需的业务类型时,调取临时存储区中的该备选语块共现信息,服务器给予所述备选语块共现信息在用户所需的业务类型下的最低概率分布,并将所述备选语块共现信息更新到概率分布信息中;优选的,在服务器的事件记录簿中记录该概率分布信息的更新,以便管理员进行维护。所述最低概率分布是根据计算出的目标业务类型的概率分布之和的值与最终用户所选择的业务类型的概率分布之和的值,两个值的差值计算得到,具体为:保证最低概率分布比上述两个概率分布之和的值之间的差值大;优选的,最低概率分布比所述差值大上一个概率分布的最小单位值即可。通过该可选方案,就能在识别业务信息得出的目标业务类型并非用户所需要的业务类型时,动态的调整服务器所能识别出的目标业务类型的结果倾向;以便后续遇到相似的业务信息时,服务器能够正确的识别出用户所需的业务类型。
在步骤103中已经介绍了概率分布信息的产生的阶段和存储形式等,下面将对应概率分布信息中如何计算得到各语块共现信息的概率分布实现,做具体的描述:
首先,确定一种业务类型,以及,获取历史上使用过归属于该业务类型的相关业务信息,例如:曾经人工坐席接收到的来自用户请求相关业务类型时,用户使用过的业务信息;还可以是IVR自身针对不同业务类型使用过的相关提示信息(即本发明的业务信息);还可以是运营商自己模拟定义的用户可能用于咨询该业务类型时可能使用的一些描述语句(即本发明的业务信息);等等。
然后,从历史使用过的相关业务信息中提取语块共现信息,所述提取语块共现信息方式可以是和本发明中使用相同的方式。再参照下述第一公式计算每个语块共现信息的概率分布:
接着,通过相同的方式完成每个语块共现信息在其他业务类型中的概率分布。
其中,第一公式中的分子,是指服务器记录有的历史上各用户输入的,用于请求第一公式中“该业务类型”的一个或者多个业务信息中,包含有第一公式中“该语块共现信息”的个数;第一公式中的分母,则是指服务器记录有的历史上各用户输入的,用于请求第一公式中“该业务类型”的一个或者多个业务信息中,包含的所有语块共现信息的总数。因此,语块共现信息在各业务类型中的概率分布可以是零值或者非零值。
可选的,还可以采用第二公式来替代第一公式,计算每个语块共现信息的概率分布:
其中,第二公式的分子,是指服务器记录有的历史上各用户输入的,用于请求第二公式中“该业务类型”的一个或者多个业务信息中,包含有第一公式中“该语块共现信息”的业务信息条数;第二公式中的分母,则是指服务器记录有的历史上各用户输入的,用于请求第二公式中“该业务类型”的一个或者多个业务信息的总条数。因此,语块共现信息在各业务类型中的概率分布可以是零值或者非零值。
进一步的,为适应不同的实现方式,本发明实施例在此为步骤104的实现提供了两种不同的方式,包括:
第一种,依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和。
第二种,在概率分布信息中查找目标语块共现信息过程中,记录所述业务信息中目标语块共现信息所涉及的业务类型;遍历记录下来的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和。
第一种方式适合于服务器自身所拥有的业务类型数量较少的情况下,较第二种方式优势在于,可以避免第二种方式中额外的为记录所涉及的业务类型所分配的资源;而第二种方式则适用于概率分布信息中记录的业务类型数量较多的情况下;在某种极端的情况下,例如:在概率分布中查找目标语块共现信息所得到的语块共现信息只在2个业务类型中拥有概率分布,而概率分布信息中记录的业务类型总数是10个时,此时,按照第二种方式需要计算的在业务类型中的概率分布之和总共就需要2次,而按照第一种方式则会需要进行10次;因此,第二种方式更能适应业务规模的变化,可以将计算复杂度控制在最小范围内。
在本发明实施例步骤104基础上,进一步结合信令流程图5,对其如何完成依次遍历每个业务类型,计算各目标语块共现信息在每个业务类型中概率分布之和做具体描述,其流程如下:
1041、服务器判断是否遍历完所有指定的业务类型。判断结果为还没有检索完指定的所有业务类型时进入步骤1042;判断结果为已经检索完指定的所有业务类型是进入步骤1044。
在本步骤中,被检索的业务类型可以是上述实施例中提到的为步骤104的实现提供的两种不同方式,在此不再赘述。
1042、获取下一个业务类型。
以检索对象是概率分布信息中记录的各个业务类型为例,获取下一个业务类型具体实现是:按照概率分布信息中记录的业务类型顺序从零开始计算,因此,首先会获取到第一业务类型;并在后续经由步骤1044循环执行本步骤1043时,按照顺序获取第一业务类型后续的其他业务类型。
1044、获取各个目标语块共现信息在该业务类型下的概率分布,并对各目标语块共现信息对应的概率分布求和,记录求和结果并返回1042。
1045、计算完目标语块共现信息在每个指定的业务类型中的概率分布之和,然后进入步骤105。
优选的,在计算概率分布之和时,针对每一种业务类型还可以增加一个加权值;则所述根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:在计算每个指定业务类型下各目标语块共现信息的概率分布之和时,获取该业务类型的加权值,并将该业务类型下各目标语块共现信息的概率分布相加的结果与加权值作乘积运算,得到每个指定业务类型下各目标语块共现信息的概率分布之和。
某个业务类型的加权值是指,历史中被访问的诸多业务类型中该业务类型被访问的概率值,其计算公式如下面的第三计算公式所示:
进一步的,为适应不同的业务需求,本发明实施例在此为步骤105的实现提供了两种不同的方式,包括:
第一种方式:选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型。
执行第一种方式的目的在于优先选择对应所述概率分布之和最大的业务类型作为与用户当前期望最接近的业务类型,从而尽可能提供足够快的意图识别。
第二种方式:根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
在第二种方式中,通知用户的方法可以是语音在线通知或者是短信离线通知等。
执行第二种方式的目的在于将最有可能是用户所需求的业务类型提供给用户进行选择,使得用户可以自主选择业务类型,准确性较高。
基于上述描述,本发明实施例在此举例详细说明以上流程。
例如,获取到的用户输入的业务信息为“我的动感地带申请5元叠加包,不小心操作为50元叠加包,导致本月会收取费用,如何处理”。这些信息可以是用户的语音信息,也可以是用户通过短信等方式输入的文本信息,若是语音信息则需要使用业内通用的语音文本转化进行处理,若是文本信息则直接进行后续处理。
本实施例中,存储于服务器中的语块集合的内容举例如下:
特殊标记 语块
动词短语(Verb Phrase,VP) 申请
VP 操作
VP 导致
VP 收取
VP 处理
名词短语(Noun Phrase,NP) 动感地带
NP 百宝箱
NP至D 5元叠加包
NP至D 50元叠加包
NP至D 费用
语块集合包含“百宝箱、动感地带、5元叠加包、50元叠加包、费用、申请、操作…”等语块。本实施例采用上述三种实现方式中的第三种,其过程具体如下:
将所述业务信息划分为至少一个信息片段。对于用户输入的业务信息“我的动感地带申请5元叠加包,不小心操作为50元叠加包,导致本月会收取费用,如何处理”,依据标点符号分为以下信息片段:“我的动感地带申请5元叠加包”、“不小心操作为50元叠加包”、“导致本月会收取费用”和“如何处理”。
从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。下面将以实现方式二中描述的“选取的方式”结合本实施例中的业务信息做具体的陈述。
针对第一个信息片段“我的动感地带申请5元叠加包”进行语块选取。首先,在语块集合“百宝箱、动感地带、5元叠加包、本地通话费、标准全球通、标准神州行;申请、操作、导致、收取、处理…”中检索所述第一个信息片段的第一个字“我”,获取到对应“我”在语块集合中的第一子集的元素个数为0,表明服务器所维护的语块集合中,各语块的构成都不包含“我”这个字。
然后,检索第二个字“的”,其第一子集的元素个数也为0;直到检索到“动”时依次确认到“动感地带”的子集元素个数为1,于是获取遍历的历史记录中最邻近末尾的子集,且该子集内元素为1的语块,即“动感地带”便是选取出的同时满足在业务信息中和语块集中存在的语块。
接着,通过相同的查找过程依次选取出业务信息和语块集同时存在的语块“申请”、“5元叠加包”、“操作”、“50元叠加包”、“导致”、“收取”和“费用”。
并根据语块集中的各语块的特征标签,从上述选取的语块中筛选出核心词语“申请”、“操作”、“导致”和“收取”。在本实施例中,所述特征标签表现为特定的词性和业务相关的名词短语。
从上述处理结果中,并以每个标点符号划分的句子为分界,提取到如下语块共现信息:
(申请,5元叠加包,动感地带)
(操作,50元叠加包)
(导致,费用)
(收取,费用)
(处理)
根据在本发明具体实现的过程中所积累的历史数据,在“数据流量相关问题的服务”业务类型流程中,各语块共现信息的概率分布如下:
P(申请,5元叠加包,动感地带)=0.0002
P(操作,50元叠加包)=0.00021
P(导致,费用)=0.00012
P(收取,费用)=0.00002
在“充值相关问题的服务”的业务类型流程中,各语块共现信息的概率分布如下:
P(申请,5原叠加包,动感地带)=0
P(操作,50原叠加包)=0
P(导致,费用)=0.00008
P(收取,费用)=0.00002
在“手机阅读的服务”的业务类型流程中,各语块共现信息的概率分布如下:
P(申请,5原叠加包,动感地带)=0
P(操作,50原叠加包)=0
P(导致,费用)=0.000122
P(收取,费用)=0.000021
各语块共现信息中属于“数据流量相关问题的服务”的业务类型的概率分布之和为:
P(申请,5元叠加包,动感地带)+P(操作,50元叠加包)+P(导致,费用)+P(收取,费用)
=0.0002+0.00021+0.00012+0.00002
=0.00055
各语块共现信息中属于“充值相关问题的服务”的业务类型的概率分布之和为:
P(导致,费用)+P(收取,费用)
=0.00008+0.00002
=0.0001
各语块共现信息中属于“手机阅读的服务”的业务类型的概率分布之和为:
P(导致,费用)+P(收取,费用)
=0.000122+0.000021
=0.000143
各语块共现信息中属于“数据流量相关问题的服务”的概率分布之和约为0.00055,在对应各业务类型的概率分布之和中最高,我们可以得出“数据流量相关问题的服务”概率分布之和最高,用户的目标业务类型为:数据流量相关问题的服务。
在确定出用户的目标业务类型后,服务器就可以根据“数据流量相关问题的业务类型”为用户进行服务。
本发明的各实施例中,确定所述业务信息所请求的目标业务类型的实施方式,进一步包括:当接收到用户返回的信息,服务器在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时;所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
优选的,本发明在上述通过服务器为用户提供人工坐席服务或者互动式语音应答服务IVR之后,进一步服务器还要结合所述用户通过人工坐席或者IVR找到的所需要的业务类型,重新识别该用户的业务信息中的语块共现信息,更新所述概率分布信息。
所述重新识别该用户的业务信息中的语块共现信息,更新所述概率分布信息具体包括以下几种方式:
方式一:
服务器从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;
服务器从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;
服务器对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;
服务器为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;以及将新构造的语块共现信息和其在所述用户选择的业务类型下的概率分布,更新到所述概率分布信息中,并在事件记录簿中记录该更新,以便管理员进行维护。
方式二:
服务器确认从该用户输入的业务信息中选取的语块共现信息中,哪些语块共现信息在当前用户所需要的业务类型中的概率分布为零。将上述语块共现信息在对应所述用户所需的业务类型中分配以最低概率分布,并将其更新到所述概率分布信息中;所述最低概率分布以确保重新计算结果,能够保证计算结果得到的目标业务类型是用户所需要的业务类型最好,具体的,其重新计算的目标业务类型与排名第二的业务类型差值保证在概率分布的最小单位即可。并将上述重新分配了概率分布的语块共现信息更新所述概率分布信息中。其中,当确认的所述语块共现信息个数为多个时,则将上述目标业务类型与排名第二的业务类型两者间的概率分布之和的值之间的差值平分给所述多个语块共现信息。
优选的,在事件记录簿中记录该概率分布信息中的更新,以便管理员进行维护。
本方式二中,利用的是当前用户所需要的业务类型中的概率分布为零的语块共现信息;可选的,还可以直接用之前可选方案中已经保存在临时存储区中的备选语块共现信息;其分配最低概率分布方法和方式二中相同,在此不再赘述。
方式三:
服务器直接将该业务信息和识别得到目标业务类型的历史记录发给服务器上的工作人员,并由工作人员进行人工识别和完成针对概率分布信息的更新;在本实施方式中,目标业务类型特指由服务器识别得出的业务类型,而用户所需的业务类型或者用户选择的业务类型则特指用户真正想要的业务类型。
本领域技术人员可以根据上面已经公开的所述的三种不同的方式,将其做简单的结合实现。通过上述三种方式,使得服务器实现了一种动态调整在识别业务信息的纠错能力;其中,方式一能够更深入的识别用户的业务信息,但对服务器自身语块识别能力要求较高,因为服务器要重新进行分词处理和词性定义;方式一更适合于与步骤102细化的后两种方式结合。方式二能够将更新错误风险最大化的平摊给各语块共现信息,从而保证在没有管理员介入的情况下,服务器能拥有较高的稳定性。
在结合本实施例的可选方案中,为了更精确的达到所述确定的目标业务类型就是用户所需要的业务类型,为本实施例中计算各业务类型的概率分布之和的方法中增加如步骤1045中优选方案中使用的加权值,所述加权值是业务类型间的概率分布关系。
不妨设“数据流量相关问题的服务”、“充值相关问题的服务”、“手机阅读的服务”的加权值为0.21,0.33,0.15,则:
各语块共现信息中属于“数据流量相关问题的服务”的业务类型的概率分布之和为:
(P(申请,5元叠加包,动感地带)+P(操作,50元叠加包)+P(导致,费用)+P(收取,费用))*数据流量相关问题的服务相应的加权值
=(0.0002+0.00021+0.00012+0.00002)*0.21
=0.00055*0.21
=0.0001155
各语块共现信息中属于“充值相关问题的服务”的业务类型的概率分布之和为:
(P(导致,费用)+P(收取,费用))*充值相关问题的服务相应的加权值
=(0.00008+0.00002)*0.33
=0.0001*0.33
=0.000033
各语块共现信息中属于“手机阅读的服务”的业务类型的概率分布之和为:
(P(导致,费用)+P(收取,费用))*手机阅读的服务相应的加权值
=(0.000122+0.000021)*0.15
=0.000143*0.15
=0.00002145
各语块共现信息中属于“数据流量相关问题的服务”的概率分布之和约为0.0001155,在对应各业务类型的概率分布之和中最高,我们可以得出“数据流量相关问题的服务”概率分布之和最高,用户的目标业务类型为:数据流量相关问题的服务。
本实施例在增加了各业务类型间的概率分布的加权值之后,从另一个角度来说为计算各业务类型下的各语块共现信息的概率分布之和增加了一层参考维度,使得最终的结果更符合历史规律,达到更高的精确度的要求。
本发明实施例还提供了一种识别业务类型的装置,可用于实现前述如图1至图5所示的方法流程。如图6所示,包括:
通信单元21,用于获取用户输入的业务信息。
语块共现信息提取单元22,用于根据所述通信单元21获取的业务信息,提取所述业务信息中的一个或多个目标语块共现信息。
其中,语块共现信息由一个或多个的核心词语组成,也可以由一个或多个的语块组成,也可以由一个或多个的核心词语和语块共同组成。
所述语块是由字和字共同组成的短语,也可以由字和词共同组成的短语,也可以由词和词共同组成的短语。
查找单元23,用于根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布。
所述概率分布信息可以是通过用户输入的;也可以是由服务器开始运行时根据历史数据临时计算出来的;还可以是由服务器开始运行时根据历史数据临时计算出来的,并进一步由服务器在运行的过程中周期性更新和维护该概率分布信息。所述概率分布信息可以是数据结构模型,并以文本格式或者HTML格式存储于服务器中。本发明中使用的概率分布信息可以是在每次服务器启动时根据历史数据计算得到,或者直接通过记录的数据结构中读取。
计算单元24,用于根据查找单元23得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息在的概率分布之和。
服务单元25,用于根据计算单元24得到的计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务
可选的是,所述服务单元25具体用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
可选的是,如图7所示,所述语块共现信息提取单元22包括:
分词处理模块220,用于对用户提供的业务信息进行分词处理和词性标注处理。
第一提取模块221,用于从所述业务信息中提取指定特征标签的词语作为核心词语。
第一生成模块222,用于根据所述第一提取模块221提取到的每个核心词语,分别生成目标语块共现信息。
可选的是,如图8所示,所述语块共现信息提取单元22包括:
第一划分模块223,用于将所述业务信息划分为至少一个信息片段。
第二提取模块224,用于从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。
第二生成模块225,用于根据所述第二提取模块224提取的从所述第一划分单元223划分的同一个信息片段中提取到的语块,生成目标语块共现信息。
可选的是,如图9所示,所述语块共现信息提取单元22包括:
第二划分模块226,用于将所述业务信息划分为至少一个信息片段。
第四提取模块227,用于从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块。
第三提取模块228,用于根据语块集中的各语块的特征标签,从上述选取的语块中筛选出核心词语。
第三生成模块229,用于根据所述第三提取模块228筛选出的每个核心词语,以及,第四提取模块227提取到的与核心词语属于所述第二划分模块226划分的同一信息片段的语块,分别生成目标语块共现信息。
进一步的,当所述语块共现信息中包括至少两个语块时,所述语块共现信息提取单元22还用于按照预设排列规则,将所述语块共现信息中的所有语块进行有序排列。
可选的是,如图10所示,所述查找单元23具体用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息在各业务类型中的概率分布。可选的,在概率分布信息中未查找到某个目标语块共现信息时,可以直接为该目标语块共现信息在各业务类型中的概率分布分配零值。
可选的是,如图11所示,所述服务单元25还包括:
第一反馈模块251,用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型。
或者是,所述服务单元25还包括:
第二反馈模块252,用于根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
通常情况下第一反馈模块251和第二反馈模块252在一个实现本发明的方案中是二选一的,但是,在可选的方案中第一反馈模块251和第二反馈模块252又是可以共同组成一个方案来实现的,例如:
服务器预先设定了一个距离阈值。按照计算结果值排序,得到结果值排名前两名的第一业务类型的概率分布之和的结果和第二业务类型的概率分布之和的结果,比较两者结果的差值;当差值小于阈值时,按照顺序选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型;当距离大于阈值时,选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型。优选的,该阈值可以根据实验的经验获得。
可选的是,如图12所示,所述服务单元25还包括:
第三反馈模块253,用于接收到用户返回的信息,在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时;所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
可选的是,如图12所示,所述服务单元25除包括第三反馈模块253外,还可以进一步包括:
第五提取模块254,用于从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;并从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;
分词模块255,用于对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;
最适概率计算模块256,为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;
更新模块257,用于将新构造的语块共现信息和其在所述所需的业务类型下的概率分布,更新到所述概率分布信息中;并在事件记录簿中记录该更新,以便管理员进行维护。
本发明实施例提供了一种识别业务类型的装置,通过从用户输入的业务信息中提取语块共现信息,并计算提取到的语块共现信息在各个业务类型中的概率分布,并结合概率分布来判断用户实际期望的目标业务类型,在确定用户需要的目标业务类型后,即可为用户提供相应服务,相比于现有技术中的IVR机制,操作更为简单和高效。
本发明实施例还提供了一种识别业务类型的装置,如图13所示,包括处理器31和存储器32。所述存储器32被配置有程序代码,所述处理器31用于调用所述程序代码用以实现如图1至图5所示的方法流程。所有元器件均可使用总线进行通信。
其中,所述处理器31,获取用户输入的业务信息;提取所述业务信息中的一个或多个目标语块共现信息;其中,目标语块共现信息是由一个或多个的核心词语组成,也可以由一个或多个的语块组成,也可以由一个或多个的核心词语和语块共同组成;根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;其中,所述概率分布信息中记录有各种语块共现信息和各种业务类型,以及所述各种语块共现信息在每一种业务类型中的概率分布;根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;根据所述计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
所述存储器32用于存储预先配置的概率分布信息和所述业务信息。
所述处理器31还用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息在各业务类型中的概率分布。
所述处理器31还用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
所述处理器31还用于将所述业务信息划分为至少一个信息片段;从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;根据从同一个信息片段中选取出来的语块,生成一个目标语块共现信息。
所述处理器31还用于将所述业务信息划分为至少一个信息片段;从所述信息片段中,提取指定词性的词语作为核心词语;从所述信息片段中,选取在所述业务信息以及语块集合中同时存在的语块;根据提取到的每个核心词语,以及,与所述各核心词语属于同一信息片段的语块,分别生成目标语块共现信息。
所述存储器32,还用于存储语块集合。
所述处理器31还用于接收到用户返回的信息,所述信息包含所述确定的目标业务类型不符合用户的需求时;所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
其中,当所述语块共现信息中包括至少两个语块时,所述处理器31需要按照预设排列规则,将所述语块共现信息中的所有语块进行有序排列。
本发明实施例提供了一种识别业务类型的装置,通过从用户输入的业务信息中提取目标语块共现信息,并计算提取到的目标语块共现信息在各个业务类型中的概率分布,并结合概率分布来判断用户实际期望的目标业务类型,在确定用户需要的目标业务类型后,即可为用户提供相应服务,相比于现有技术中的IVR机制,操作更为简单和高效。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (15)

1.一种识别业务类型的方法,其特征在于,包括:
获取用户输入的业务信息;
提取所述业务信息中的一个或多个目标语块共现信息;
根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;其中,所述概率分布信息中记录有各语块共现信息和各种业务类型,以及所述各语块共现信息在每一种业务类型中的概率分布;
根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;
根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
2.根据权利要求1所述的方法,其特征在于,所述计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:
依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,
在概率分布信息中查找各目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及到的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。
3.根据权利要求2所述的方法,其特征在于,所述根据计算结果,确定所述业务信息所请求的目标业务类型,具体包括:
选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,
根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序中选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述概率分布信息中还记录有每种业务类型的加权值,所述加权值是历史上被所有用户请求过的业务类型中每种业务类型所占的比率;则所述根据得到的所述目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和,具体包括:
在计算每个指定业务类型下各目标语块共现信息的概率分布之和时,获取该业务类型的加权值,并将该业务类型下各目标语块共现信息的概率分布相加的结果与加权值作乘积运算,得到每个指定业务类型下各目标语块共现信息的概率分布之和。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述提取所述业务信息中的一个或多个目标语块共现信息,具体包括:
将所述业务信息划分为至少一个信息片段;
从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;
根据从同一个信息片段中选取出来的语块,生成目标语块共现信息。
6.根据权利要求1至4任意一项所述的方法,其特征在于,所述提取所述业务信息中的语块共现信息,具体包括:
将所述业务信息划分为至少一个信息片段;
从所述信息片段中,选取在所述信息片段以及语块集合中同时存在的语块;
并根据语块集合中的各语块的特征标签,从上述选取的语块中筛选出核心词语;
根据筛选到的每个核心词语,以及,与所述各核心词语属于同一信息片段的语块,分别生成语块共现信息。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述根据确定的目标业务类型提供对应所述业务信息的业务服务,还包括:
接收到用户返回的信息,服务器在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
8.根据权利要求9所述的方法,其特征在于,在所述为用户提供人工坐席服务或者IVR服务之后,还包括:
服务器从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;
服务器从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;
服务器对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;
服务器为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布的值是根据计算出的目标业务类型的概率分布之和与用户所选择的业务类型的概率分布之和两者计算得到;
并将所述新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。
9.根据权利要求1至8任意一项所述的方法,其特征在于,所述根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布,具体包括:
在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;
并将查找到的相应语块共现信息在各业务类型中的概率分布,作为当前所查找的目标语块共现信息在各业务类型中的概率分布。
10.一种识别业务类型的装置,其特征在于,包括:
通信单元,用于获取用户输入的业务信息;
语块共现信息提取单元,用于提取所述业务信息中的一个或多个目标语块共现信息;
查找单元,用于根据预先配置的概率分布信息,得到所述各目标语块共现信息在各业务类型中的概率分布;
计算单元,用于根据所述得到的目标语块共现信息在各业务类型中的概率分布,计算每个指定业务类型下各目标语块共现信息的概率分布之和;
服务单元,用于根据计算结果,确定所述业务信息所请求的目标业务类型,并根据确定的目标业务类型提供对应所述业务信息的业务服务。
11.根据权利要求10所述的装置,其特征在于,
所述计算单元,具体用于依次遍历概率分布信息中记录有的各个业务类型,并对于遍历到的每个业务类型,计算各目标语块共现信息在该业务类型中的概率分布之和;或者,
在概率分布信息中查找目标语块共现信息过程中,记录所述业务信息中各目标语块共现信息所涉及的一个或多个业务类型;遍历记录下来的每个业务类型,并计算在该业务类型下各目标语块共现信息的概率分布之和。
12.根据权利要求11所述的装置,其特征在于,所述服务单元还包括:
第一反馈单元,用于选择对应所述计算结果的值最大的业务类型,作为所述业务信息所请求的目标业务类型;或者,
第二反馈单元,用于根据所述计算结果,按照计算结果的值由大到小的顺序排列,从排列顺序选取至少一个业务类型,并将选取的至少一个业务类型通知给用户;接收用户从被通知的至少一个业务类型中选择的目标业务类型。
13.根据权利要求10至12任意一项所述的装置,其特征在于,所述服务单元还包括:
第三反馈模块,接收到用户返回的信息,在根据所述用户返回的信息确定所述确定的目标业务类型不符合用户的需求时,所述服务器为用户提供人工坐席服务或者互动式语音应答服务IVR,以便所述用户找到所需要的业务类型。
14.根据权利要求13所述的装置,其特征在于,所述服务单元还包括:
第五提取模块,从人工坐席服务或者IVR服务中获取最终由所述用户选择的业务类型;并从所述业务信息的一个或多个语块共现信息中,确认在最终用户所选择的业务类型中存在有概率分布的语块共现信息;
分词模块,用于对所述用户输入的业务信息进行分词处理和词性定义处理,并基于所述语块共现信息中语块的词性构造新的语块共现信息;
最适概率计算模块,为新构造的一个或多个语块共现信息分配最低概率分布;所述最低概率分布根据计算出的目标业务类型的概率分布之和与最终用户所选择的业务类型的概率分布之和计算得到;
更新模块,用于将新构造的语块共现信息和所述新构造的语块共现信息在所述用户所选择的业务类型下的概率分布,更新到所述概率分布信息中。
15.根据权利要求10至14任意一项所述的装置,其特征在于,所述查找单元还包括:
第一匹配单元,用于在所述概率分布信息中记录有的语块共现信息中查找每个目标语块共现信息;并将查找到的相应语块共现信息在各业务类型中的概率分布,作为所述某个目标语块共现信息在各业务类型中的概率分布。
CN201310354245.XA 2013-08-14 2013-08-14 识别业务类型的方法及装置 Active CN104375847B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310354245.XA CN104375847B (zh) 2013-08-14 2013-08-14 识别业务类型的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310354245.XA CN104375847B (zh) 2013-08-14 2013-08-14 识别业务类型的方法及装置

Publications (2)

Publication Number Publication Date
CN104375847A true CN104375847A (zh) 2015-02-25
CN104375847B CN104375847B (zh) 2017-12-05

Family

ID=52554788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310354245.XA Active CN104375847B (zh) 2013-08-14 2013-08-14 识别业务类型的方法及装置

Country Status (1)

Country Link
CN (1) CN104375847B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104994214A (zh) * 2015-05-04 2015-10-21 上海智臻网络科技有限公司 一种向通话中的用户提供语音反馈信息的方法和装置
CN106486120A (zh) * 2016-10-21 2017-03-08 上海智臻智能网络科技股份有限公司 交互式语音应答方法及应答系统
WO2018086489A1 (zh) * 2016-11-14 2018-05-17 阿里巴巴集团控股有限公司 来电处理方法、装置及终端
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质
CN109040489A (zh) * 2018-08-02 2018-12-18 中国联合网络通信集团有限公司 电信客服的分配方法和装置
WO2019019778A1 (zh) * 2017-07-25 2019-01-31 平安科技(深圳)有限公司 通话数据处理方法、装置、存储介质和计算机设备
CN109739961A (zh) * 2018-12-24 2019-05-10 科大讯飞股份有限公司 一种人机语言交互方法及装置
CN111046145A (zh) * 2019-12-23 2020-04-21 支付宝(杭州)信息技术有限公司 交互意图路径的挖掘方法以及装置
CN111241232A (zh) * 2018-11-29 2020-06-05 北京京东尚科信息技术有限公司 业务服务的处理方法、装置、服务平台及存储介质
CN111432081A (zh) * 2020-03-31 2020-07-17 中国银行股份有限公司 交互式语音应答菜单的推荐方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101201835A (zh) * 2007-12-21 2008-06-18 四川大学 应急联动警情自动分类系统
US7478092B2 (en) * 2005-07-21 2009-01-13 International Business Machines Corporation Key term extraction
CN102693244A (zh) * 2011-03-23 2012-09-26 日电(中国)有限公司 用于识别非结构化文本中的信息的方法和装置
CN102737045A (zh) * 2011-04-08 2012-10-17 北京百度网讯科技有限公司 一种相关度计算方法和装置
CN103049548A (zh) * 2012-12-27 2013-04-17 安徽科大讯飞信息科技股份有限公司 电子渠道应用上的faq识别系统及方法
CN103092875A (zh) * 2011-11-04 2013-05-08 中国移动通信集团贵州有限公司 一种基于文本的搜索方法及搜索装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7478092B2 (en) * 2005-07-21 2009-01-13 International Business Machines Corporation Key term extraction
CN101201835A (zh) * 2007-12-21 2008-06-18 四川大学 应急联动警情自动分类系统
CN102693244A (zh) * 2011-03-23 2012-09-26 日电(中国)有限公司 用于识别非结构化文本中的信息的方法和装置
CN102737045A (zh) * 2011-04-08 2012-10-17 北京百度网讯科技有限公司 一种相关度计算方法和装置
CN103092875A (zh) * 2011-11-04 2013-05-08 中国移动通信集团贵州有限公司 一种基于文本的搜索方法及搜索装置
CN103049548A (zh) * 2012-12-27 2013-04-17 安徽科大讯飞信息科技股份有限公司 电子渠道应用上的faq识别系统及方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10115391B2 (en) 2015-05-04 2018-10-30 Shanghai Robot Technology Co., Ltd. Method and apparatus for providing voice feedback information to user in call
US10783874B2 (en) 2015-05-04 2020-09-22 Shanghai Xiaoi Robot Technology Co., Ltd. Method and apparatus for providing voice feedback information to user in call
CN104994214A (zh) * 2015-05-04 2015-10-21 上海智臻网络科技有限公司 一种向通话中的用户提供语音反馈信息的方法和装置
CN104994214B (zh) * 2015-05-04 2018-06-05 上海智臻智能网络科技股份有限公司 一种向通话中的用户提供语音反馈信息的方法和装置
CN106486120B (zh) * 2016-10-21 2019-11-12 上海智臻智能网络科技股份有限公司 交互式语音应答方法及应答系统
CN106486120A (zh) * 2016-10-21 2017-03-08 上海智臻智能网络科技股份有限公司 交互式语音应答方法及应答系统
WO2018086489A1 (zh) * 2016-11-14 2018-05-17 阿里巴巴集团控股有限公司 来电处理方法、装置及终端
WO2019019778A1 (zh) * 2017-07-25 2019-01-31 平安科技(深圳)有限公司 通话数据处理方法、装置、存储介质和计算机设备
CN108595431A (zh) * 2018-04-28 2018-09-28 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质
CN108595431B (zh) * 2018-04-28 2020-09-25 海信集团有限公司 语音交互文本纠错方法、装置、终端及存储介质
CN109040489A (zh) * 2018-08-02 2018-12-18 中国联合网络通信集团有限公司 电信客服的分配方法和装置
CN109040489B (zh) * 2018-08-02 2021-01-26 中国联合网络通信集团有限公司 电信客服的分配方法和装置
CN111241232B (zh) * 2018-11-29 2024-03-08 北京京东尚科信息技术有限公司 业务服务的处理方法、装置、服务平台及存储介质
CN111241232A (zh) * 2018-11-29 2020-06-05 北京京东尚科信息技术有限公司 业务服务的处理方法、装置、服务平台及存储介质
CN109739961A (zh) * 2018-12-24 2019-05-10 科大讯飞股份有限公司 一种人机语言交互方法及装置
CN111046145B (zh) * 2019-12-23 2023-10-27 支付宝(杭州)信息技术有限公司 交互意图路径的挖掘方法以及装置
CN111046145A (zh) * 2019-12-23 2020-04-21 支付宝(杭州)信息技术有限公司 交互意图路径的挖掘方法以及装置
CN111432081A (zh) * 2020-03-31 2020-07-17 中国银行股份有限公司 交互式语音应答菜单的推荐方法及装置

Also Published As

Publication number Publication date
CN104375847B (zh) 2017-12-05

Similar Documents

Publication Publication Date Title
CN104375847A (zh) 识别业务类型的方法及装置
US11025775B2 (en) Dialogue flow optimization and personalization
US10430158B2 (en) Voice recognition keyword user interface
US10382623B2 (en) Data-driven dialogue enabled self-help systems
US11036767B2 (en) System and method for providing database abstraction and data linkage
KR100739348B1 (ko) 키워드 별로 사용자의 전문가 지수를 산정하는 방법 및상기 방법을 수행하는 시스템
CN101287040B (zh) 基于发送方与接收方之间的交互历史和上下文的动作预测
CN107180029A (zh) 一种基于咨询业务的信息处理方法及装置
US6370523B1 (en) System and methods for determining a desired listing using an intersection of coverage areas and a search region
CN101398810B (zh) 自适应服务选择设备及其方法,查询系统及其方法
US9621725B2 (en) Method and apparatus for analyzing leakage from chat to voice
CN102880649A (zh) 一种个性化信息处理方法和系统
CN109446305A (zh) 智能旅游客服系统的构建方法以及系统
CN113127506B (zh) 目标查询语句的构建方法、装置、存储介质和电子装置
CN106294520A (zh) 使用从文档提取的信息来标识关系
US20210182709A1 (en) Method and system for extracting contextual information from a knowledge base
CN101202792B (zh) 基于发送方与接收方之间的关系处理消息的方法和装置
CN112487810A (zh) 一种智能客服服务方法、装置、设备及存储介质
CN106202038A (zh) 基于迭代的同义词挖掘方法及装置
US20230185639A1 (en) Mapping application programming interface schemas with semantic representations
CA3116106C (en) Data-driven dialogue enabled self-help systems
CN115617973B (zh) 一种基于智能数据处理的信息获取方法
CN115509497A (zh) 基于脚本语言的可视化业务规则引擎构建方法
CN113778799A (zh) 基于流程节点的埋点配置方法、装置、设备及介质
CN113507541A (zh) 来电意图展示方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant