CN111090730A

CN111090730A - 智能语音调度系统及方法

Info

Publication number: CN111090730A
Application number: CN201911314418.9A
Authority: CN
Inventors: 刘伟; 徐欢; 王海燕; 周嫣媛
Original assignee: Zhongke Shuzhi Beijing Technology Co Ltd
Current assignee: Zhongke Shuzhi Beijing Technology Co Ltd
Priority date: 2019-12-05
Filing date: 2019-12-19
Publication date: 2020-05-01

Abstract

本发明公开了一种智能语音调度系统及方法，包括：知识库，所述知识库构建将依赖于自然语言处理的多个基础组件；智能检索单元，通过智能检索技术，将大量规程文本进行规范化管理；态势感知单元，基于总线感知；服务总线，分为数据服务总线和企业服务总线；任务管理单元，基于人工设定，按照特定时间、周期执行的任务；对话机器人，包括、对话状态维护模块和生成系统决策模块负责整个调度个模块的调用和总枢纽的作用；智能语音单元，主要包括语音识别模块和语音合成模块。本发明提高了调度员工作效率。

Description

智能语音调度系统及方法

技术领域

本发明涉及智能语音调度系统及方法，特别是一种智能语音调度助手。

背景技术

随着经济水平进一步增长，工业企业生产负荷需求不断提升，工业现场日趋复杂，需要各级调度人员对生产过程的统一协调分析和控制。而传统调控运行面临的问题是：调控运行规程及预案在线化、知识化不够。调控系统人机交互方式单一，效率低下，仍然以鼠标、键盘为主，缺少语音、触摸等交互方式。调控系统存在大量的历史数据，缺乏知识化工具，难以充分利用。

现有系统以监视、分析为主，决策、执行等环节更依赖调控人员的经验。传统的调控控制管理软件中，每个界面与界面是独立分开的，只能展示很少的一部分内容，这些不同页面及不同部分是孤立独自分开的，基本上没有自动化程度。调度人员工作效率低；人工成本高；同时调度系统中的事故不能得到很好地检测、预防和处理，导致经济效益低。另一方面：人工智能技术的快速发展：智能语音交互、自然语言处理等一系列人工智能技术在国内外取得了重大理论创新与应用突破，为解决调控运行领域的部分问题提供了有益的借鉴和参考。

发明内容

针对现有技术的缺陷，本发明提供了一种智能语音调度助手。

一种智能语音调度助手，包括：知识库，所述知识库构建将依赖于自然语言处理的多个基础组件，包括中文分词，词性标注，句法依存和语义角色标注模块，知识库的调用主要通过多轮对话以及文本搜索引擎的方式实现的方式实现；智能检索单元，智能检索单元，基于ElasticSearch定制的知识搜索引擎，通过智能检索技术，将大量规程文本进行规范化管理，并能通过关键字搜索、语义搜索快速定位相关内容，为业务人员后续操作提供指导和辅助；态势感知单元，基于总线感知，实现对于不同来源、不同类型的关键数据进行采集、监控和管理；服务总线，分为数据服务总线和企业服务总线，数据服务总线：制定企业数据服务接口，把将web端的数据、数据库、API接口数据收集统一管理，以服务的形式开放使用，实现数据和服务的解耦；企业服务总线：将各应用服务器上的各种服务连接到服务总线上，支持分布式的存储及分布式的处理、异步处理，从而实现服务集成与服务统一管理；任务管理单元，命令下达：基于调度员口头下达的命令而得到；感知推送：通过态势感知功能自动监测异常，依赖业务规则库实现自动判断，生成动态任务；周期定时任务执行：基于人工设定，按照特定时间、周期执行的任务；对话机器人，包括对话状态维护模块和生成系统决策模块，负责整个调度个模块的调用和总枢纽的作用，按照对话的轮次分为单轮对话机器人和多轮对话机器人；智能语音单元，包括语音识别模块和语音合成模块。

本发明的有益效果是：提高了调度员工作效率，减少操作误判，降低调规的学习成本；知识库达到，高效，快速，随时响应的效果，并且针对用户输入的关键信息，提供多种可靠的相关流程，以及原调度相关文本供工作人员使用，大大提高了工作人员维护效率。降低不符合规范操作的风险，减少调规学习和查询的成本。形成了一体化，智能化的调规助手功能。

附图说明

图1是本发明语音调度助手的系统结构示意图；

图2是本发明语音调度助手的运行流程图；

图3是本发明句法依存分析的示意图；

图4是索引与文档关系图；

图5是查询流程图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图对本发明的具体实施方式做详细的说明，使本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按比例绘制附图，重点在于示出本发明的主旨。

参阅图1与图2，本发明的智能语音调度助手通过语音指令、人工操作、告警事故等途径感知信息，并与场景特征值匹配形成具体任务，由任务管理编排出任务优先级，调控人员针对任务进行方案检索。运用知识库引擎检索出处置流程模板，并结合数据服务取得设备的状态参数，通过多轮对话进行分支判断，为调控人员的后续处置提供决策支撑，下面对其中的各个组成部分分别做详细介绍。

(一)知识库

知识库，包括问答库、业务规则库和资料库，从普通问答和业务交互等多方面为用户提供支撑；通过服务总线实现各类数据、服务的汇聚，能够支撑复杂事件的处置，实现任务自动执行。通过智能语音支持多通道交互。

其中问答库包括通用语料库和定制语料库，是实现参观讲解、智能问答、任务交互等场景的基础。通用语料库基于历史积累+爬虫获取的语料形成并不断完善；定制语料库支持包括单轮问答、多轮问答和流程问答的定制管理。

业务规则库是支撑起整个调度业务的基础。资料库是调度领域汇中的一些特有的信息库，工作人员在事先将该资料导入到资料库中；调度流程库是调控流程自动化的基础，一方面可以基于NLP实现流程抽取，另一方面可以通过流程设计工具支持人工编辑。无论是知识抽取得到的流程，还是通过流程编辑工具生成的流程，都统一通过流程执行引擎对外提供服务，为用户的操作和决策提供支撑。流程接口管理：基于数据服务总线和企业服务总线，实现对流程库中各类节点进行相应的接口管理和配置，为后续操作导航的智能执行提供支撑。业务规则库，是态势感知的基础，通过设定一定的规则，用于应对态势感知获取到的信息，根据该规则库设定的规则作出判断，然后去选择自动执行还是推送给调度员执行，以及如何执行。

知识库构建将依赖于自然语言处理的多个基础组件，包括中文分词，词性标注，句法依存和语义角色标注模块。知识库的调用主要通过多轮对话以及文本搜索引擎的方式实现的方式实现。

中文分词模块

中文分词模块，用于为后续的语义分析提供特征，并通过专业词库重新训练实现分词的定制化。中文分词(Word Segmentation,WS)指的是将汉字序列切分成词序列。因为在汉语中，词是承载语义的最基本的单元，并且不同与英语等类似语言，句子并没有使用空格进行自然分隔，对中文文本进行分词就成了初步语义识别的必要步骤。分词是信息检索、文本分类、情感分析等多项中文自然语言处理任务的基础。例如：

公司总经理李某某调研上海分公司时提出，支持上海积极探索新机制。

正确分词结果为：公司/总经理/李某某/调研/上海/分公司/时/提出/，/支持/上海/积极/探索/新/机制/。

具体分词步骤如下：

S11：使用BMES标注体系对任务进行建模及对数据的重新标注处理。详细的标注体系介绍请参考。

S12：使用针对任务的特征提取方法，对句子中每一个标注单元的相应窗口信息利用特征模板进行特征抽取。

S13：使用passive aggressive感知器算法对句子序列每个位置的预测出各个标签的概率分部。

S14：使用维特比算法解码出最可能的序列标注结果。

增量训练优化，目标是使用户在无法获得足够多的训练数据的情况下，可以在已发布的模型的基础上使用少量自有数据训练更优的模型。其可以实现增量训练的同时，保持基本模型不变。保持基本模型带来的好处是在个性化地分词时基本模型不需要反复加载与释放，从而提高训练性能。

训练算法如下：

将总数据集(D＝{(x₁，y₁)，...，(x_n，y_n)})拆分成两份D＝{D₁，D₂}，D1＝{(x₁，y₁)，...，(x_m，y_m)}，D2＝{(x_m+1，y_m+1)，...，(x_n，y_n)}。(x，y)表示特征空间，w表示参数向量，W表示累计参数向量，参数向量的更新时间t，上角标表示向量的维度，例如t^k。下角标表示样本，例如(x_k，y_k)表示第k个样本。

词性标注模块

词性标注模块用于给后续语义任务提供必要的分析特征。词性标注(Part-of-speech Tagging，POS)是给句子中每个词一个词性类别的任务，词性将作为后续其它各项任务的重要特征模块，也可以根据词性来对部分词级别分析进行筛选。这里的词性类别可能是名词、动词、形容词或其他。下面的句子是一个词性标注的例子。其中，v代表动词、n代表名词、c代表连词、d代表副词、wp代表标点符号。词性标注表如下所示。

公司/ni总经理/n李某某/nh调研/v上海/ns分公司/ns时/n提出/v，/wp支持/v上海/ns积极/a探索/v新/a机制/n。/wp。

具体标注步骤如下：

S21：使用BIOES标注体系对任务进行建模及对数据的重新标注处理；

S22：使用针对任务的特征提取方法，对句子中每一个词的相应窗口信息利用特征模板进行特征抽取；

S23：使用passive aggressive感知器算法对句子序列每个位置的预测出各个标签的概率分部；

S24：使用维特比算法解码出最可能的序列标注结果。

句法依存分析模块

句法依存模块基于转移的依存分析方法，旨在预测从初始到某种结束状态的过渡序列，这个过程可以生成一个目标句法依存分析树，基于从状态中提取的特征输入分类器来预测正确的转移。

如图3所示，分析采用弧标准系统(NIVRE，2004)。状态c＝(s，b，A)由堆栈s、缓冲区b和依存弧集合A组成。一个句子w₁，...，w_n的初始化状态是s＝[ROOT]，b＝[w₁，...，w_n]，

如果缓冲区为空，堆栈包含单个节点ROOT且解析树由A_c给出，则状态c为终止状态。s_i(i＝1，2，...)表示堆栈中第i个的顶部元素，b_i(i＝1，2，...)表示缓冲区中第i个元素，弧标准系统定义了三种类型的转移：

LETF-ARC(l)：当|s|≥2时，添加弧s₁→s₂标记为l，并从堆栈中删除s₂。

RIGHT-ARC(l)：当|s|≥2时，添加弧s₂→s₁标记为l，并从堆栈中删除s₁。

SHIFT：当|b|≥1，把b₁从缓冲区移到堆栈中。

在标记的解析版本中，总共有|T|＝2N_t+1个转移，其中N_t是不同弧标签的数目。

语义角色标注模块

语义角色标注(Semantic Role Labeling,SRL)是一种浅层的语义分析技术，标注句子中某些短语为给定谓词的论元(语义角色)，如施事、受事、时间和地点等。其能够对问答系统、信息抽取和机器翻译等应用产生推动作用。

本发明在语义角色标注模块的模型训练过程中，除了使用预训练好的词向量以外，还使用了随机初始化的词向量表示，随机初始化的词向量将与模型参数同时训练，这样就可以得到针对语义角色标注任务的词的向量表示。预训练好词向量之后，根据预训练词向量的词表V1和训练集中的词表V2构建了两个查找表(Lookup Table)L1和L2，每个词在构造其词向量表示时都要查找两个表，从L1中得到其预训练的词向量，从L2中得到其针对当前任务的词向量，并拼接得到其最终表示。在参数更新阶段仅跟新针对该任务随机初始化的查找表L2，而不更新L1表。通过这样的设置，更新的查找表L2可以在训练语料的领域上得到更好的效果。同时L1表中预训练的词向量使得在领域外的语义角色标注任务上利用预训练词向量的语义信息和词相关性，得到一个较好性能，从而提高了模型的范化能力。

(二)智能检索单元

智能检索单元，基于ElasticSearch定制的知识搜索引擎，通过智能检索技术，将大量规程文本进行规范化管理，并能通过关键字搜索、语义搜索快速定位相关内容，为业务人员后续操作提供指导和辅助。在调规检索部分，在搜索引擎提供的搜索框中输入想要查询的关键词，底层利用倒排索引的方法查找出相关的材料。用于建立行业企业百科或者行业百科。

参阅图4与图5，智能检索主要包括倒排索引和查询，其中倒排索引包含三部分：不同的索引词(index term)组成的索引表，称为“词典”；每个索引词出现过的文档集合；索引词和文档之间的关系。查询主要包括查询分词、查询扩展和结果排序，查询分词：使用语义分析模块的分词技术进行分词；查询扩展：结合系统的实体对分词的结果进行纠错补全；结果排序：首先进行第一轮的Top-k选取再对Top-k结果进行第二轮的精确重排序。

(三)态势感知单元

态势感知单元，基于数据总线、服务总线，对传感器数据、视频数据、消息队列、各种通用关系型数据库、业务系统接口、web端数据等进行统一的监控和管理，并基于复杂事件处置引擎，为复杂事件的触发、监控、处置等提供方案和自动操作。基于总线感知，实现对于不同来源、不同类型的关键数据进行采集、监控和管理。

(四)服务总线

服务总线，分为数据服务总线和企业服务总线。数据服务总线：制定企业数据服务接口，把将web端的数据、数据库、API接口数据等收集统一管理，以服务的形式开放使用，实现数据和服务的解耦。企业服务总线：将各应用服务器上的各种服务连接到服务总线上，支持分布式的存储及分布式的处理、异步处理。从而实现服务集成与服务统一管理。

(五)任务管理单元

任务管理单元，调度助手的核心是帮主调度员实现任务管理，调度助手机器人获取到的任务包括三种：命令下达：基于调度员口头下达的命令而得到；感知推送：通过态势感知功能自动监测异常，依赖业务规则库实现自动判断，生成动态任务；周期定时任务执行：基于人工设定，按照特定时间、周期执行的任务。比如每12小时检查一下天气情况，然后将数据记录下来。

(六)对话机器人

对话机器人，包括对话状态维护模块和生成系统决策模块，负责整个调度个模块的调用和总枢纽的作用。对话机器人，按照对话的轮次分为单轮对话机器人和多轮对话机器人；根据任务形式区分：日常聊天机器人、知识型机器人和任务型机器人。日常聊天机器人：对应通用知识库，按照通用语料，通用问法，通用答案来回答。知识型机器人：针对于某一行业领域，建立行业知识库来支撑知识型机器人。任务型机器人是按照调度员的命令去执行任务的机器人。

对话状态维护模块，作用：维护&更新对话状态

t+1时刻的对话状态st+1，依赖于之前时刻t的状态st，和之前时刻t的系统行为at，以及当前时刻t+1对应的用户行为ot+1。可以写成st+1←st+at+ot+1这个可以采用规则匹配，预设置对话树，有限状态机等方法来实现。

生成系统决策模块，作用：为智能语音系统选择最合适的＂回复＂动作。

根据DST中的对话状态(DS)，产生系统行为(dialog act)，决定下一步做什么.下一步做什么可以是回复用户某段话，也可以是给其他程序传递某个指令.这个可以通过机器学习，深度学习，强化学习等方法来实现。多轮对话管理最常见的是采用语义槽填充的原则作为控制，例如：在一个订机票的例子中，智能语音系统引导用户多轮交互，直到从和用户的对话中提取出＂出发地＂＂目的地＂＂出发时间＂等语义槽，然后展示符合要求的机票信息。语义槽可以分为平级槽和依赖槽，平级槽就像上面的订机票的例子中＂出发地＂＂目的地＂＂出发时间＂等几个语义槽，他们在对话过程中，获取顺序是平级的。

(七)智能语音单元

智能语音单元，主要包括语音识别和语音合成功能，支持手机、PC、surface等多种终端，支持windows、Ubuntu、centos、凝思、安卓等多种操作系统，支持音频流和端点检测。语音合成引擎：采用目前世界先进的数据驱动技术，利用精心设计的语音语料库进行声学模型和文本处理模型的训练，得到的模型深度挖掘了自然语音、语言的特性，从而能够合成清晰、自然、亲切的语音，接近真人发音。语音识别，语音识别功能可以实现成语音到文字的转换，语音输入设备可以是手机、PAD、麦克风阵列等等，同时可以根据业务指定通用或者合适的领域引擎，广泛应用于各类需要语音实现人机交互的场景。

同时智能语音单元基于云和客户端相结合的服务框架，将原有、传统的一对一进行的语音交互，扩展为一对多的形式，在多人需要参与语音交互的情况下，不需要再逐一为每人的设备安装部署语音服务，大大减轻了实施和运维的工作量，同时也避免了资源的浪费。

本发明集成了：大数据技术(数据收集、数据清洗、数据分析)，人工智能技术(机器学习、深度学习、自然语言处理)，物联网技术，语音声学分析、声道分析等技术。

本发明应用场景包括：①监控巡视：全面巡视，对所有监控站点进行的巡视，包括运行方式、设备运行状态、设备挂牌情况、设备异常信号、设备信号屏蔽信息、系统电压运行水平、告警信号及辅助综合监控系统告警信号。正常监视，对当前电网运行方式及变电站设备进行实时监视，及时确认监控信息，并按照本规程要求进行处置。特殊监视，在特定情况下，监控员采取增加监视频度、定期查阅相关数据及对相关设备或变电站进行固定画面监视等监视措施，开展事故预想及各项应急准备工作。②事件处置场景：辅助事件处置，机器人感知电网事件，结合调度规程知识进行辅助处置，包含异常处理、事故处置、风险预控等。异常处理，感知到电网发生一般异常，对信息分类并记录，提供处置方案，通知运行人员检查。事故处置：感知事故跳闸，调用自动化分析软件及云平台获取相关信息，判断潮流情况并辅助提供调整方案，通过与调控人员交互，形成事故处置流程。风险预控：通过云平台感知外部环境变化信息，包含山火、雷电等，判断影响范围并反馈调度员进行预警。③知识问答场景：具有多轮对话的语音交互功能，能够进行单位介绍、知识搜索、数据分析、自动构图等功能。单位介绍：实现调度业务知识的语音问答，单位整体信息的综合介绍；知识搜索：实现数据查询、知识搜索，并提供查询结果的可视化展示；数据分析：实现数据预处理、统计计算、挖掘分析及多维度可视化展示；自动构图：实现自动生成接线图，提供丰富配置模板。④辅助运行值班场景：辅助调控人员进行值班，包括拟票操作、日内计划调整、语音记录、监控巡视等。拟票操作：捆绑申请单，辅助生成指令操作票；日内计划调整：国分省日内计划一体化协同修改，同步分解并下发到各分部及省调；语音记录：记录调度电话、调控员语言等信息，形成日志。

需要说明的是，上述实施例属于优选实施例，所涉及的模块并不一定是本申请所必须的。本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。对于本申请的装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上对本申请进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种智能语音调度助手，其特征在于，包括：

知识库，所述知识库构建将依赖于自然语言处理的多个基础组件，包括中文分词，词性标注，句法依存和语义角色标注模块，知识库的调用主要通过多轮对话以及文本搜索引擎的方式实现；

智能检索单元，智能检索单元，基于ElasticSearch定制的知识搜索引擎，通过智能检索技术，将大量规程文本进行规范化管理，并能通过关键字搜索、语义搜索快速定位相关内容，为业务人员后续操作提供指导和辅助；

态势感知单元，基于总线感知，实现对于不同来源、不同类型的关键数据进行采集、监控和管理；

服务总线，分为数据服务总线和企业服务总线，数据服务总线：制定企业数据服务接口，把将web端的数据、数据库、API接口数据收集统一管理，以服务的形式开放使用，实现数据和服务的解耦；企业服务总线：将各应用服务器上的各种服务连接到服务总线上，支持分布式的存储及分布式的处理、异步处理，从而实现服务集成与服务统一管理；

任务管理单元，命令下达：基于调度员口头下达的命令而得到；感知推送：通过态势感知功能自动监测异常，依赖业务规则库实现自动判断，生成动态任务；周期定时任务执行：基于人工设定，按照特定时间、周期执行的任务；

对话机器人，包括对话状态维护模块和生成系统决策模块，负责整个调度个模块的调用和总枢纽的作用，按照对话的轮次分为单轮对话机器人和多轮对话机器人；

智能语音单元，包括语音识别模块和语音合成模块。

2.根据权利要求1所述的智能语音调度助手，其特征在于，所述中文分词模块，用于为后续的语义分析提供特征，并通过专业词库重新训练实现分词的定制化，具体分词步骤如下：

S11：使用BMES标注体系对任务进行建模及对数据的重新标注处理；

S12：使用针对任务的特征提取方法，对句子中每一个标注单元的相应窗口信息利用特征模板进行特征抽取；

S13：使用passive aggressive感知器算法对句子序列每个位置的预测出各个标签的概率分部；

S14：使用维特比算法解码出最可能的序列标注结果。

3.根据权利要求2所述的智能语音调度助手，其特征在于，还包括增量训练优化，训练算法如下：

将总数据集(D＝{(x₁，y₁)，...，(x_n，y_n)})拆分成两份D＝{D₁，D₂}，D₁＝{(x₁，y₁)，...，(x_m，y_m)}，D₂＝{(x_m+1，y_m+1)，...，(x_n，y_n)}，(x，y)表示特征空间，w表示参数向量，W表示累计参数向量，参数向量的更新时间t，上角标表示向量的维度，下角标表示样本；

4.根据权利要求1所述的智能语音调度助手，其特征在于，所述词性标注模块用于给后续语义任务提供必要的分析特征，具体标注步骤如下：

S24：使用维特比算法解码出最可能的序列标注结果。

5.根据权利要求1所述的智能语音调度助手，其特征在于，所述句法依存分析模块采用弧标准系统，具体分析过程如下：

状态c＝(s，b，A)由堆栈s、缓冲区b和依存弧集合A组成，一个句子w₁，...，w_n的初始化状态是s＝[ROOT]，b＝[w₁，...，w_n]，

LEFT-ARC(l)：当|s|≥2时，添加弧s₁→s₂标记为l，并从堆栈中删除s₂；

RIGHT-ARC(l)：当|s|≥2时，添加弧s₂→s₁标记为l，并从堆栈中删除s₁；

SHIFT：当|b|≥1，把b₁从缓冲区移到堆栈中。

6.根据权利要求1所述的智能语音调度助手，其特征在于，所述语义角色标注模块的模型训练过程中，除了使用预训练好的词向量以外，还使用了随机初始化的词向量表示，随机初始化的词向量将与模型参数同时训练，以得到针对语义角色标注任务的词的向量表示，预训练好词向量之后，根据预训练词向量的词表V1和训练集中的词表V2构建了两个查找表(Lookup Table)L1和L2，每个词在构造其词向量表示时都要查找两个表，从L1中得到其预训练的词向量，从L2中得到其针对当前任务的词向量，并拼接得到其最终表示。

7.根据权利要求1所述的智能语音调度助手，其特征在于，智能检索主要包括倒排索引和查询，其中倒排索引包含三部分：不同的索引词(index term)组成的索引表，称为“词典”；每个索引词出现过的文档集合；索引词和文档之间的关系；查询主要包括查询分词、查询扩展和结果排序，查询分词：使用语义分析模块的分词技术进行分词；查询扩展：结合系统的实体对分词的结果进行纠错补全；结果排序：首先进行第一轮的Top-k选取再对Top-k结果进行第二轮的精确重排序。

8.根据权利要求1所述的智能语音调度助手，其特征在于，对话状态维护模块，用于维护和更新对话状态，具体过程包括：t+1时刻的对话状态st+1，依赖于之前时刻t的状态st，和之前时刻t的系统行为at，以及当前时刻t+1对应的用户行为ot+1，可以写成st+1←st+at+ot+1。

9.根据权利要求1所述的智能语音调度助手，其特征在于，生成系统决策模块，根据DST中的对话状态，产生系统行为，决定下一步做什么.下一步做什么可以是回复用户某段话，也可以是给其他程序传递某个指令。

10.根据权利要求1所述的智能语音调度助手，其特征在于，知识库，包括问答库、业务规则库和资料库，其中问答库包括通用语料库和定制语料库，通用语料库基于历史积累+爬虫获取的语料形成并不断完善；定制语料库支持包括单轮问答、多轮问答和流程问答的定制管理。