一种语音识别系统的优化方法及装置
技术领域
本发明涉及语音识别技术领域,更具体的说是涉及一种语音识别系统的优化方法及装置。
背景技术
在语音识别技术中,最核心的衡量指标就是识别率,识别率反映了整个产品、整个系统的核心竞争力。通常某个产品推出之前就已经对识别率进行过测试,使其识别率达到理论上可用或者理想的效果,然而,在实际的应用过程中,单独的产品由于受到实际环境的影响,通常都需要将整个系统进行优化,由此,才能使得产品和系统的识别率达到理想的水平。
目前,在优化过程中,首先是对现有的识别率进行统计,然后分析识别率和识别率相关的信息,根据分析结论对缺陷目标进行优化,最后测试验证优化效果。
现有的优化过程一般是以人为主观体验进行优化,或者定期收集用户说法,遵循优化流程来进行优化。在简单的语音识别系统下,这种优化方法是可行的,但是一旦涉及较复杂的系统,例如包含多个交互场景、多个影响因素、多个评价指标,或者与其它产品集成相关的系统时,现有的方法就不可行。在复杂系统下,影响识别率的因素很多,如地区、业务、信道等,因此,现有的方法难以分析全面、以及准确定位,进而给出的优化建议。
发明内容
有鉴于此,本发明的目的是要解决现有的优化技术难以分析全面以及准确定位的问题。
本发明实施例提供一种语音识别系统的优化方法,技术方案如下:
一种语音识别系统的优化方法,包括:
构建模型,所述模型包括通话层、导航层以及交互层,其中,所述通话层与所述导航层相互关联,所述导航层与所述交互层相互关联;
根据所述模型,通过特定的模型处理运算得到用于多维度多指标分析的事实表;
根据所述事实表,利用联机分析处理OLAP计算评价系统能力的各指标,并定位出拉低指标的异常因素;
去除所述异常因素以优化系统。
优选的,多维度多指标分析的事实表包括交互层事实表、导航层事实表、通话层事实表;所述根据所述模型,通过特定的模型处理运算得到用于多维度多指标分析的事实表,包括:
根据所述交互层的交互层事实表信息,对所述交互层基表信息进行计算、判断,生成交互层事实表,所述交互层基表信息包括统计信息、标记信息和维度信息;
根据导航层事实表信息,对所述导航层的导航层基表信息和所述交互层事实表进行统计、计算、判断,生成导航层事实表;
根据通话层事实表信息,对所述通话层基表信息和所述导航层事实表进行统计、计算、判断,生成通话层事实表。
优选的,根据所述事实表,利用联机分析处理OLAP计算评价系统能力的各指标,并定位拉低指标的异常因素,包括:
分析通话层的指标,得到未达理想状态的指标或指标集合,并利用OLAP,得到通话层的异常指标和异常维度,所述通话层的异常指标为所述通话层未达理想状态的指标,所述通话层的异常维度为影响所述通话层未达理想状态的维度;
根据通话层异常指标和异常维度,分析导航层的相关指标和维度,利用OLAP,得到导航层的异常指标和异常维度,所述导航层的异常指标为所述导航层未达理想状态的指标,所述导航层的异常维度为影响所述导航层未达理想状态的维度;
根据导航层异常指标和异常维度,分析交互层相关指标和维度,利用OLAP,得到交互层的异常指标和异常维度,所述交互层的异常指标为所述交互层未达理想状态的指标,所述交互层的异常维度为影响所述交互层未达理想状态的维度。
优选的,所述通话层的一次通话包括多次导航,所述导航层的一次导航包含多次交互。
优选的,所述通话层与所述导航层通过通话号相互关联,所述导航层与所述交互层通过会话号相互关联。
本发明实施例还提供一种语音识别系统的优化装置,包括:
模型构建单元,用于构建模型,所述模型包括通话层、导航层以及交互层,其中,所述通话层与所述导航层相互关联,所述导航层与所述交互层相互关联;
事实表生成单元,用于根据所述模型,通过特定的模型处理运算得到用于多维度多指标分析的事实表;
异常因素定位单元,用于根据所述事实表,利用联机分析处理OLAP计算评价系统能力的各指标,并定位出拉低指标的异常因素;
优化单元,用于去除所述异常因素以优化系统。
优选的,多维度多指标分析的事实表包括交互层事实表、导航层事实表、通话层事实表;
所述事实表生成单元,包括:
交互层事实表生成单元,用于根据所述交互层的交互层事实表信息,对所述交互层基表信息进行计算、判断,生成交互层事实表,所述交互层基表信息包括统计信息、标记信息和维度信息;
导航层事实表生成单元,用于根据导航层事实表信息,对所述导航层的导航层基表信息和所述交互层事实表进行统计、计算、判断,生成导航层事实表;
通话层事实表生成单元,用于根据通话层事实表信息,对所述通话层基表信息和所述导航层事实表进行统计、计算、判断,生成通话层事实表。
优选的,所述异常因素定位单元,包括:
通话层异常因素定位单元,用于分析通话层的指标,得到未达理想状态的指标或指标集合,并利用OLAP,得到通话层的异常指标和异常维度,所述通话层的异常指标为所述通话层未达理想状态的指标,所述通话层的异常维度为影响所述通话层未达理想状态的维度;
导航层异常因素定位单元,用于根据通话层异常指标和异常维度,分析导航层的相关指标和维度,利用OLAP,得到导航层的异常指标和异常维度,所述导航层的异常指标为所述导航层未达理想状态的指标,所述导航层的异常维度为影响所述导航层未达理想状态的维度;
交互层异常因素定位单元,用于根据导航层异常指标和异常维度,分析交互层相关指标和维度,利用OLAP,得到交互层的异常指标和异常维度,所述交互层的异常指标为所述交互层未达理想状态的指标,所述交互层的异常维度为影响所述交互层未达理想状态的维度。
优选的,所述通话层的一次通话包括多次导航,所述导航层的一次导航包含多次交互。
优选的,所述通话层与所述导航层通过通话号相互关联,所述导航层与所述交互层通过会话号相互关联。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明的词语联想方法,至少具有下列优点:
本发明通过引入模型,充分利用了机器进行自动化运算,并且能够利用已有的成熟的数据库分析方法进行分析,极大的节省了人力,还克服了人工主观体验、测试在复杂系统下效率低、覆盖不全和定位模糊的缺陷。并且分析模型、运行程式、分析工具等可以方便的推广,在不同的项目中迅速部署,复制应用,极大的减少了优化成本。
附图说明
图1为本发明实施例提供的语音识别系统的优化方法的一种流程示意图;
图2为本发明实施例提供的实施例一中步骤120的一种流程示意图;
图3为本发明实施例提供的实施例一中步骤130的一种流程示意图;
图4为本发明实施例提供的语音识别系统的优化装置的一种结构示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的(名称)其具体实施方式、步骤、结构、特征及其功效详细说明。
实施例一
参见图1,本发明实施例提供一种语音识别系统的优化方法,包括:
步骤110:构建模型,模型包括通话层、导航层以及交互层。
其中,通话层与导航层相互关联,导航层与交互层相互关联。
模型主要以通话层、导航层和交互层三个层次组成,层次或层次之间使用通话号或会话号来标识和关联。进一步的,通话层与导航层通过通话号相互关联,导航层与交互层通过会话号相互关联。优化方法是在模型基础上建立的“多维度”和“多指标”的分析方法,各维度具有向下继承性,各指标具有向上聚变性。
通话层的一次通话包括多次导航,所述导航层的一次导航包含多次交互。通话层是指用户的一次通话,从拨通电话到挂断电话。通话层的一次通话可以包含多次导航。通话层的数据记录可以包括通话号、入口、出口、地区、号码、等级、开始时间、结束时间和导航次数。
导航层是指用户的一次业务需求,从主菜单节点到某个叶子节点。导航层的一次导航可以包含多次交互。导航层的数据记录可以包括通话号、开始时间、结束时间、开始会话号、结束会话号、入口、出口、会话次数。
交互层是指用户的一次语音交互,从播放提示音的时间到返回识别结果时间。交互层包含三方面数据:流程日志数据、呼叫日志数据以及标注数据。其中:流程日志数据可以包括记录会话号、节点名称、节点类型、播放提示音时间、提示音名称、语法名称、获取结果时间、交互结果、结果类型;呼叫日志数据可以包括记录会话号、开始时间、结束时间、RAW音频名称、UTT音频名称、语法名称、识别文本、识别语义、输入模式、识别模式、置信度、用户打断、BOS时间、EOS时间;人工标注数据可以包括记录会话号、UTT音频名称、标注文本、标注语义、标注模式、错误描述。
步骤120:根据模型,通过特定的模型处理运算得到用于多维度多指标分析的事实表。
步骤130:根据所述事实表,利用联机分析处理OLAP计算评价系统能力的各指标,并定位出拉低指标的异常因素。
事实表具有OLAP(On-LineTransactionProcessing,联机事务处理系统)技术的多维度多指标特点,整个表格信息犹如一个立方体,维度包括地区、入口、时间等、指标包括识别率、成功率、导航次数、交互次数、交互时长等。利用目前已有的OLAP工具,或者同类的数据库分析方法,对各个指标进行统计、监控,进而分析并找出缺陷的原因来针对性的进行优化。
步骤140:去除所述异常因素以优化系统。
本发明通过引入模型,充分利用了机器进行自动化运算,并且能够利用已有的成熟的数据库分析方法进行分析,极大的节省了人力,还克服了人工主观体验、测试在复杂系统下效率低、覆盖不全和定位模糊的缺陷。并且分析模型、运行程式、分析工具等可以方便的推广,在不同的项目中迅速部署,复制应用,极大的减少了优化成本。
实施例二
本发明实施例提供上述步骤120的一种具体实现方法,其中多维度多指标分析的事实表包括交互层事实表、导航层事实表、通话层事实表。方法可以包括以下步骤:
步骤121:根据所述交互层的交互层事实表信息,对所述交互层基表信息进行计算、判断,生成交互层事实表,所述交互层基表信息包括统计信息、标记信息和维度信息。
如,交互层事实表信息中有“是否帮助”的标记信息,“交互识别结果为‘帮助’时其为真,否则为假”,当某交互识别结果为“帮助”时,则生成的交互层事实表对应记录中“是否帮助”的标记信息为真。又如,交互层事实表信息中有“交互时长”的统计信息,表示“交互结束时间减去交互开始时间”,通过相应的计算可以得到“交互时长”信息。再如,交互层事实表信息中有“业务”的维度信息,表示为“取交互结果的业务标注内容”,当某交互的业务标注为“查询话费”时,则生成的交互层事实表对应记录中“业务”维度信息为“查询话费”。
步骤122:根据导航层事实表信息,对所述导航层的导航层基表信息和所述交互层事实表进行统计、计算、判断,生成导航层事实表。
可有以下三类:
1、统计信息向上聚变,根据,利用导航层基表和交互层事实表,统计该导航关联的各次交互的数据,聚变为导航层事实表的统计信息。
例如,导航层事实表中有“交互次数”的统计信息,其为“统计该次导航对应的交互数”,而某导航有三次交互,则生成的导航层事实表对应记录中“交互次数”的值为“3”。
2、标记信息向上聚变,根据,利用导航层基表和交互层事实表,对该导航关联的各次交互的标记序列进行判断,聚变为导航层事实表的标记信息。
例如,导航层事实表中有“是否导航成功”的标记信息,其为“交互中有业务子节点交互,且该次交互成功”,而某导航中有符合该的交互,则生成的导航层事实表对应记录中“是否导航成功”的标记信息为真。
3、维度信息生成,根据相应,利用导航层基表和交互层事实表,对该导航关联的各次交互的信息进行统计、计算、判断而生成。
例如,导航层事实表中有“导航出口”的维度信息,其为“取导航最后一次交互的识别结果所属分类,分类有业务成功、帮助、转人工、拒识转按键等”,而某导航中最后一次交互的识别结果所属分类为“转人工”,则生成的导航层事实表对应记录中“导航出口”的维度信息为“转人工”
步骤123:根据通话层事实表信息,对所述通话层基表信息和所述导航层事实表进行统计、计算、判断,生成通话层事实表。
可有以下三类:
1、统计信息向上聚变,根据,利用通话层基表和导航层事实表,统计该通话关联的各次导航的数据,聚变为通话层事实表的统计信息,与导航层事实表类似,不赘述。
2、标记信息向上聚变,根据,利用通话层基表和导航层事实表,对该通话关联的各次导航的标记序列进行判断,聚变为通话层事实表的标记信息,与导航层事实表类似,不赘述。
3、维度信息生成,根据相应,利用通话层基表和导航层事实表,对该通话关联的各次导航的信息进行统计、计算或判断而生成,与导航层事实表类似,不赘述。
统计信息和标记信息是指标计算的原始数据,通过以上步骤就得到用于多维度多指标分析的事实表。
实施例三
参见图3,
本发明实施例提供上述步骤130的一种具体实现方法,可以包括以下步骤:
步骤131:分析通话层的指标,得到未达理想状态的指标或指标集合,并利用OLAP,如利用OLAP的切片、切块、钻取、旋转等技术手段,得到通话层的异常指标和异常维度,所述通话层的异常指标为所述通话层未达理想状态的指标,所述通话层的异常维度为影响所述通话层未达理想状态的维度。
步骤132:根据通话层异常指标和异常维度,分析导航层的相关指标和维度,利用OLAP,如利用OLAP的切片、切块、钻取、旋转等技术手段,得到导航层的异常指标和异常维度,所述导航层的异常指标为所述导航层未达理想状态的指标,所述导航层的异常维度为影响所述导航层未达理想状态的维度。
步骤133:根据导航层异常指标和异常维度,分析交互层相关指标和维度,利用OLAP,如利用OLAP的切片、切块、钻取、旋转等技术手段,得到交互层的异常指标和异常维度,所述交互层的异常指标为所述交互层未达理想状态的指标,所述交互层的异常维度为影响所述交互层未达理想状态的维度。实施例四、
参见图4,与上述发明实施例对应,本发明实施例提供一种语音识别系统的优化装置,包括:
一种语音识别系统的优化装置,包括:
模型构建单元U110,用于构建模型,所述模型包括通话层、导航层以及交互层,其中,所述通话层与所述导航层相互关联,所述导航层与所述交互层相互关联;
事实表生成单元U120,用于根据所述模型,通过特定的模型处理运算得到用于多维度多指标分析的事实表;
异常因素定位单元U130,用于根据所述事实表,利用联机分析处理OLAP计算评价系统能力的各指标,并定位出拉低指标的异常因素;
优化单元U140,用于去除所述异常因素以优化系统。
优选的,在本发明的其他实施例中,多维度多指标分析的事实表包括交互层事实表、导航层事实表、通话层事实表;
所述事实表生成单元,包括:
交互层事实表生成单元,用于根据所述交互层的交互层事实表信息,对所述交互层基表信息进行计算、判断,生成交互层事实表,所述交互层基表信息包括统计信息、标记信息和维度信息;
导航层事实表生成单元,用于根据导航层事实表信息,对所述导航层的导航层基表信息和所述交互层事实表进行统计、计算、判断,生成导航层事实表;
通话层事实表生成单元,用于根据通话层事实表信息,对所述通话层基表信息和所述导航层事实表进行统计、计算、判断,生成通话层事实表。
优选的,在本发明的其他实施例中,所述异常因素定位单元,包括:
通话层异常因素定位单元,用于分析通话层的指标,得到未达理想状态的指标或指标集合,并利用OLAP,得到通话层的异常指标和异常维度,所述通话层的异常指标为所述通话层未达理想状态的指标,所述通话层的异常维度为影响所述通话层未达理想状态的维度;
导航层异常因素定位单元,用于根据通话层异常指标和异常维度,分析导航层的相关指标和维度,利用OLAP,得到导航层的异常指标和异常维度,所述导航层的异常指标为所述导航层未达理想状态的指标,所述导航层的异常维度为影响所述导航层未达理想状态的维度;
交互层异常因素定位单元,用于根据导航层异常指标和异常维度,分析交互层相关指标和维度,利用OLAP,得到交互层的异常指标和异常维度,所述交互层的异常指标为所述交互层未达理想状态的指标,所述交互层的异常维度为影响所述交互层未达理想状态的维度。
优选的,在本发明的其他实施例中,所述通话层的一次通话包括多次导航,所述导航层的一次导航包含多次交互。
优选的,在本发明的其他实施例中,所述通话层与所述导航层通过通话号相互关联,所述导航层与所述交互层通过会话号相互关联。
虽然本发明已以较佳实施例揭露如上,然并非用以限定本发明实施的范围,依据本发明的权利要求书及说明内容所作的简单的等效变化与修饰,仍属于本发明技术方案的范围内。