CN106710591A

CN106710591A - 用于电力终端的语音客服系统

Info

Publication number: CN106710591A
Application number: CN201611147435.4A
Authority: CN
Inventors: 刘清蝉; 赵永辉; 黄衍玺; 李仕林; 张建伟; 杨昊; 杨明
Original assignee: Electric Power Research Institute of Yunnan Power System Ltd
Current assignee: Electric Power Research Institute of Yunnan Power System Ltd
Priority date: 2016-12-13
Filing date: 2016-12-13
Publication date: 2017-05-24

Abstract

本发明公开了一种用于电力终端的语音客服系统，包括接线员语音训练装置，接线员语音训练装置包括语音训练器、语音识别器、识别后处理器和模拟机服务器，语音训练器对接线员输入的语音进行训练，建立个人声学模型；语音识别器基于个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息；识别后处理器将文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息；模拟机服务器对XML形式的文本信息进行指令分析和应答。本发明的语音客服系统通过建立个人声学模型，利用个人声学模型识别接线员的指令语音，对指令语音进行纠错和规范，提高系统服务质量。

Description

用于电力终端的语音客服系统

技术领域

本发明涉及语音训练和语音识别技术领域，尤其涉及一种用于电力终端的语音客服系统。

背景技术

如今，电力客服运行系统为广大的电力用户提供了许多便利。2002年以来，全国统一的特服号“95598”服务全国电力用户，24小时全天候受理电力故障报修、用电业务咨询、供电服务质量投诉、用电业务申请、电费业务查询和发布计划检修停电预报。95598呼叫中心具备上万路进线，每小时接听能力达到几十万次，为全国电力客户提供各种电力服务。

对于电力客服运行系统而言，目前主要是靠接线员人工接听电力用户来电，根据与电力用户通话交流给予用户帮助和服务。

在电力客服运行系统中，接线员对于维持电力客服的正常运行至关重要。在实际工作中，接线员的工作任务往往异常繁重。接线员和用户的理解难免会出现偏差，一旦发生错误，其后果往往是严重的。目前接线员的语音通话的训练不足，导致系统服务质量下降。

发明内容

为克服现有技术中存在的问题，本发明提供一种可用于电力终端的语音客服系统，具有接线员语音训练装置，该接线员语音训练装置能为接线员提供语音训练，通过语音训练建立接线员的个人声学模型，利用个人声学模型识别接线员的指令语音，并且对识别后的指令语音进行纠错和规范，来提高语音识别的正确率，从而提高系统服务质量。

根据本发明的实施例的第一方面，提供了一种用于电力终端的语音客服系统，包括：接线员语音训练装置，接线员语音训练装置包括语音训练器、语音识别器、识别后处理器和模拟机服务器，其中，语音训练器与语音识别器连接，语音训练器用于通过对接线员输入的语音进行训练，建立个人声学模型；语音识别器与识别后处理器连接，语音识别器用于基于个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息；识别后处理器与语音训练器和模拟机服务器连接，识别后处理器用于将文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息；模拟机服务器用于对XML形式的文本信息进行指令分析和应答。

根据本发明的一个实施例，模拟机服务器包括语音生成器，用于根据XML形式的文本信息生成语音提示来应答。

根据本发明的一个实施例，语音训练器通过对接线员输入的语音进行训练以提取声学特征信息、获取统计信息，生成具有个人语音特征的个人声学模型。

根据本发明的一个实施例，语音训练器包括专用名词语音训练模块、数字语音训练模块、字母语音训练模块，专用名词语音训练模块、数字语音训练模块和字母语音训练模块分别通过对接线员输入的专用名词语音、数字语音和字母语音进行训练，生成具有个人语音特征的专用名词声学模型、数字声学模型和字母声学模型。

根据本发明的一个实施例，语音识别器包括特殊发音识别模块，用于基于专用名词声学模型、数字声学模型和字母声学模型，来识别接线员输入的指令语音中的专用名词语音、数字语音和字母语音。

根据本发明的一个实施例，接线员语音训练装置还包括语音信息采集器和存储缓冲区，语音信息采集器与语音训练器连接，语音信息采集器还与语音识别器连接，用于采集接线员要输入语音训练器或语音识别器的语音，按照预定的采样率、单/立体声道、单位比特数将语音处理成语音信息并将语音信息保存在存储缓冲区内。

根据本发明的一个实施例，预定的采样率为16KHz，单位比特数为16比特，存储缓冲区的大小为6400字节。

根据本发明的一个实施例，接线员语音训练装置还包括语音模型配置器，语音模型配置器与语音训练器连接，语音模型配置器用于设计和配置不同客服阶段的语音模型文法，以供语音训练器选择语音模型文法进行加载，进行不同客服阶段的训练。

根据本发明的一个实施例，接线员语音训练装置还包括初始化信息配置器，初始化信息配置器与语音识别器连接，初始化信息配置器用于为语音识别器配置初始化信息，初始化信息包括输入输出初始化信息、发音字典、个人声学模型和/或运行初始化信息。

根据本发明的一个实施例，用于电力终端的语音客服系统还可以包括客服语音生成装置，用于生成播放给电力用户的客服语音。

由上可见，本发明实施例提供了一种用于电力终端的语音客服系统，包括：接线员语音训练装置，接线员语音训练装置包括语音训练器、语音识别器、识别后处理器和模拟机服务器，其中，语音训练器与语音识别器连接，语音训练器用于通过对接线员输入的语音进行训练，建立个人声学模型；语音识别器与识别后处理器连接，语音识别器用于基于个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息；识别后处理器与语音训练器和模拟机服务器连接，用于将文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息；模拟机服务器用于对XML形式的文本信息进行指令分析和应答。由此可知，本发明的用于电力终端的语音客服系统具有接线员语音训练装置，该接线员语音训练装置能为接线员提供语音训练，通过语音训练建立接线员的个人声学模型，利用个人声学模型识别接线员的指令语音，并且对识别后的指令语音进行纠错和规范，来提高语音识别的正确率，从而提高系统服务质量。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明的一个实施例的用于电力终端的语音客服系统的结构示意框图。

图2是根据本发明的一个实施例的描述接线员训练装置进行指令语音识别的工作原理图。

图3是根据本发明的一个实施例的接线员训练装置的工作流程图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据本发明的一个实施例的用于电力终端的语音客服系统的结构示意框图。语音客服系统可以集成在电力终端(例如，智能电能表)上，为电力用户提供更优质的服务。如图1所示，用于电力终端的语音客服系统包括接线员语音训练装置。接线员语音训练装置的目的在于，为电力语音客服系统的接线员提供日常语音学习和训练，以便提高接线员在实际工作时的服务质量。根据本发明的一个实施例，语音训练装置为接线员提供语音训练，通过语音训练建立个人声学模型，利用个人声学模型识别接线员的指令语音，并将个人声学模型与识别的指令语音进行动态匹配容错处理，以纠正和规范接线员的指令语音，后续对指令进行分析和应答。如图1所示，接线员语音训练装置可以包括语音训练器1、语音识别器2、识别后处理器3和模拟机服务器4。语音训练器1与语音识别器2连接，语音识别器2与识别后处理器3连接，识别后处理器3与语音训练器1和模拟机服务器4连接。语音训练器1通过对接线员输入的语音进行训练，建立个人声学模型。语音识别器2基于个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息。识别后处理器3将文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息。模拟机服务器4对XML形式的文本信息进行指令分析和应答。

根据本发明的一个实施例，接线员可以通过麦克风输入语音。接线员可以通过语音训练器1训练个人特色的声学模型。训练后，语音识别器2可以使用接线员的个人声学模型进行语音识别。关于训练，可以根据实际情况设定个人声学模型训练和建立计划。个人声学模型训练和建立计划可以特别包括指令语音训练计划。在指令语音训练计划下，接线员可以逐步训练，熟练掌握指令语音的发音规范和发布流程。通过个人声学模型训练和建立计划，接线员可以建立具备个人特色的个人声学模型。个人声学模型为后续的接线员语音识别提供识别基础，基于接线员自己的个人特色的个人声学模型来识别接线员自己的语音，可以大大提高语音识别率。根据本发明的实施例，经过训练的声学模型的识别效果明显比未训练时的识别率要高。

根据本发明的一个实施例，语音训练器1可以通过对接线员输入的语音进行训练以提取声学特征信息、获取统计信息，生成具有个人语音特征的个人声学模型。在电力客服领域，服务内容经常会涉及到专用名词、地址、数字等重要的信息。因此，根据本发明的一个实施例，语音训练器1可以包括专用名词语音训练模块、数字语音训练模块、字母语音训练模块(未示出)，专用名词语音训练模块、数字语音训练模块和字母语音训练模块分别通过对接线员输入的指令语音中的专用名词语音、数字语音和字母语音进行训练，生成具有个人语音特征的专用名词声学模型、数字声学模型和字母声学模型。相应地，根据本发明的一个实施例，语音识别器2可以包括特殊发音识别模块，特殊发音识别模块根据上述的数字声学模型、字母声学模型和专用名词声学模型，识别接线员输入的指令语音中的数字特殊发音、字母特殊发音和专用名词发音，以便提高识别正确率和效率。

如上所述，语音训练器1通过对接线员输入的语音进行训练，建立个人声学模型。语音识别器2基于个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息。具体地，文本信息可以是字符串形式。识别后处理器3将文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息。具体地，识别后处理器3主要是将识别出的字符串形式的文本信息进行解析重组(例如，将信息中的公司名、业务编号等具有特定含义的单词替换成相应的数字或字母形式)，基于个人声学模型对解析重组后的文本信息进行动态匹配容错处理后，输出XML形式的文本信息，交给模拟机服务器4进行指令的分析、应答等处理。

如上所述，语音客服系统经过训练后对指令语音的语音识别效率和正确率可以大大提高，再通过动态容错匹配处理可以进一步有效地提高语音识别正确率。根据本发明的一个实施例，为了更进一步提高语音识别正确率，可以采用鼠标/键盘辅助输入来进一步提高识别效率。

模拟机服务器4通过对XML形式的文本信息进行指令分析和应答，来为接线员模拟日常的指令发布环境。根据本发明的一个实施例，模拟机服务器4的指令应答可以是回馈给接线员语音提示，例如，类似于日常电力服务中电力终端上提示电力用户操作的语音提示。为了回馈给接线员语音提示，如图1所示，模拟机服务器4可以包括语音生成器41，用于根据所述XML形式的文本信息生成语音提示来应答。生成的语音提示可以播放给接线员，接线员可以及时地获知语音指令发布是否正确，进而获知自己的语音指令发音是否正确，以达到语音指令训练和学习的目的。根据本发明的一个实施例，用于电力终端的语音客服系统还可以包括客服语音生成装置，生成播放给电力用户的客服语音。

根据本发明的一个实施例，如图1所示，用于电力终端的语音客服系统还可以包括语音信息采集器5和存储缓冲区(未示出)，语音信息采集器5可以与语音训练器1和语音识别器2连接。语音信息采集器5采集接线员要输入语音训练器1或语音识别器2的语音，按照预定的采样率、单/立体声道、单位比特数将语音处理成语音信息并将语音信息保存在存储缓冲区内。根据本发明的一个实施例，预定的采样率可以为16KHz，单位比特数可以为16比特，存储缓冲区的大小可以为6400字节。

根据本发明的一个实施例，如图1所示，接线员语音训练装置还可以包括初始化信息配置器6，初始化信息配置器6与语音识别器2连接，初始化信息配置器6为语音识别器2配置初始化信息，初始化信息可以包括输入输出初始化信息、发音字典、声学模型和/或运行初始化信息等。

根据本发明的一个实施例，用于电力终端的语音客服系统还可以包括语音模型配置器7，语音模型配置器7可以与语音训练器1连接，语音模型配置器7用于设计和配置不同客服阶段的语音模型文法，以供语音训练器1选择语音模型文法进行加载，完成不同客服阶段的训练。

根据本发明的一个实施例，接线员通过指令语音来发布指令，以进行管制，涵盖了维护、报警、收费、投诉等等多个不同业务管制场景。下面结合图2描述接线员语音训练装置进行指令语音识别的工作原理图。

根据本发明的一个实施例，如图2所示，可以采用Sphinx-4语音识别引擎来配置语音识别器2，Sphinx-4语音识别引擎利用基于深度学习和隐马尔可夫模型的语音识别技术来实施语音识别。当接线员选择指令语音识别时，语音客服系统启动时需要完成一系列的初始化操作，主要包括麦克风和耳机的检测，训练计划的选择，语音识别引擎初始化的连接等。尤其地，在Sphinx-4语音识别引擎开始工作前，要对Sphinx-4语音识别引擎实施初始化，具体地，为Sphinx-4语音识别引擎加载初始化配置信息，配置语音模型，选择声学模型，主要实现识别引擎初始化时，输入输出、发音字典、声学模型和系统运行等配置信息的设计、管理、分析、动态加载及处理。初始化完成后，接线员可以自由控制麦克风的打开和关闭，通过麦克风输入指令语音。语音信息采集器采集指令语音，输出语音信息到Sphinx-4语音识别引擎。此时，Sphinx-4语音识别引擎接收并识别语音信息，输出字符串形式的指令文本信息。识别后处理器3将识别后的文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息，交给模拟机服务器4进行指令的分析、应答等处理。模拟机服务器4可以生成语音提示来应答，接线员收到语音提示，可以及时地了解自己训练的效果，做到取长补短，提高日常服务质量。

图3是根据本发明的一个实施例的语音训练装置的工作流程图。

如图3所示，系统启动后，接线员以自己注册的账号、密码或游客的身份登陆接线员语音训练装置的系统，此时，接线员可以选择语音训练或指令语音识别。如果接线员首次使用语音训练装置的系统，建议先完成语音训练以获得具有个人语音特征的声学模型，再选择指令语音识别。如果接线员非首次登陆，可以二次训练声学模型，也可以直接进行语音识别。

如果接线员选择语音训练，系统启动时将完成一系列的初始化操作，包括语音训练计划的选择、声学模型更新过程中数据的重置等。语音训练初始化完成后，系统会自动显示语音训练的内容并加载上次训练的记录，接线员依据系统的提示决定是否继续上次的训练，之后通过麦克风录入具有个人特色的语音信息。录用过程中，为便于语音录入错误信息后的调整，每次麦克风录入一句话长度的语音信息。当前语句录入完成后，接线员可以选择当前训练语句的重新录音、暂停当前录音或结束训练。训练结束后，会根据麦克风采集的多条语音信息提取声学特征文件、获取统计信息并最终生成具有个人语音特征的新的声学模型，此时，整个语音训练过程完成，同时新的声学模型将作为指令语音识别的资源文件，存放在存储缓冲区中的系统资源文件夹下。

训练过程如下：接线员首先根据本次训练的需要，选择具体的训练内容，例如，指令训练、专用名词训练、数字训练或字母训练，然后，点击开始当前指令录音按钮，接线员将当前行的内容按照发音要求通过麦克风语音录入，再点击当前指令录音完毕按钮，这样，该行的语音信息录入完成。接线员可以自己决定本次训练语句的数量，也可以重新录入之前一行的语音信息。最后，接线员点击声学模型更新按钮，系统将自动完成声学模型的训练和更新。

如果接线员选择语音识别，系统启动时也需要完成一系列的初始化操作，主要包括麦克风和耳机的检测，训练计划的选择，语音识别引擎初始化的连接等。初始化完成后，接线员可以自由控制麦克风的打开和关闭。空管模拟训练过程中，接线员打开麦克风语音输入一条完整的指令后，关闭麦克风。此时，系统调用语音识别引擎Sphinx-4接收并识别语音，并输出文本信息。之后，识别后处理器3对识别后的文本信息进行符合模拟机服务器4处理所需格式的替换处理，最后，对替换后的文本信息进行合法性的判断，即，将替换后的文本信息与个人声学模型进行动态匹配容错处理，输出XML形式的文本信息。之后，模拟机服务器4将XML形式的文本信息按照JavaCC编写的词法和语法规则解析成结构化的指令，以便模拟机服务器4对指令进行应答。至此，一次完整的人机模拟陆空通话的过程完成，而对于判断不合法的，则会要求接线员重新发布指令语音。

综上所述，本发明的用于电力终端的语音客服系统具有接线员语音训练装置，该接线员语音训练装置能为接线员提供语音训练，通过语音训练建立接线员的个人声学模型，利用个人声学模型识别接线员的指令语音，并且对识别后的指令语音进行纠错和规范，来提高语音识别的正确率，从而提高系统服务质量。

本领域技术人员在考虑说明书及实践这里发明的公开后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

Claims

1.一种用于电力终端的语音客服系统，其特征在于，包括：接线员语音训练装置，所述接线员语音训练装置包括语音训练器、语音识别器、识别后处理器和模拟机服务器，其中，

所述语音训练器与语音识别器连接，用于通过对接线员输入的语音进行训练，建立个人声学模型；

所述语音识别器与所述识别后处理器连接，用于基于所述个人声学模型，对接线员输入的指令语音进行识别，将识别的结果输出为文本信息；

所述识别后处理器与所述语音训练器和所述模拟机服务器连接，用于将所述文本信息与所述个人声学模型进行动态匹配容错处理，输出XML形式的文本信息；

所述模拟机服务器用于对所述XML形式的文本信息进行指令分析和应答。

2.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述模拟机服务器包括语音生成器，用于根据所述XML形式的文本信息生成语音提示来应答。

3.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述语音训练器通过对接线员输入的语音进行训练以提取声学特征信息、获取统计信息，生成具有个人语音特征的个人声学模型。

4.根据权利要求3所述的用于电力终端的语音客服系统，其特征在于，所述语音训练器包括专用名词语音训练模块、数字语音训练模块、字母语音训练模块，所述专用名词语音训练模块、所述数字语音训练模块和所述字母语音训练模块分别通过对接线员输入的专用名词语音、数字语音和字母语音进行训练，生成具有个人语音特征的专用名词声学模型、数字声学模型和字母声学模型。

5.根据权利要求4所述的用于电力终端的语音客服系统，其特征在于，所述语音识别器包括特殊发音识别模块，用于基于所述专用名词声学模型、所述数字声学模型和所述字母声学模型，来识别接线员输入的指令语音中的专用名词语音、数字语音和字母语音。

6.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述接线员语音训练装置还包括语音信息采集器和存储缓冲区，所述语音信息采集器与所述语音训练器连接，所述语音信息采集器还与所述语音识别器连接，所述语音信息采集器用于采集接线员要输入所述语音训练器或所述语音识别器的语音，按照预定的采样率、单/立体声道、单位比特数将语音处理为语音信息，并将所述语音信息保存在所述存储缓冲区内。

7.根据权利要求6所述的用于电力终端的语音客服系统，其特征在于，所述预定的采样率为16KHz，所述单位比特数为16比特，所述存储缓冲区的大小为6400字节。

8.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述接线员语音训练装置还包括语音模型配置器，所述语音模型配置器与所述语音训练器连接，所述语音模型配置器用于设计和配置不同客服阶段的语音模型文法，以供所述语音训练器选择语音模型文法进行加载，完成不同客服阶段的训练。

9.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述接线员语音训练装置还包括初始化信息配置器，所述初始化信息配置器与所述语音识别器连接，所述初始化信息配置器用于为所述语音识别器配置初始化信息，所述初始化信息包括输入输出初始化信息、发音字典、个人声学模型和/或运行初始化信息。

10.根据权利要求1所述的用于电力终端的语音客服系统，其特征在于，所述语音客服系统还包括客服语音生成装置，用于生成播放给电力用户的客服语音。