CN111241124B

CN111241124B - 一种需求模型构建方法、装置、电子设备和介质

Info

Publication number: CN111241124B
Application number: CN202010015505.0A
Authority: CN
Inventors: 马东民; 徐犇; 遇越; 李秀健
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd; Shanghai Xiaodu Technology Co Ltd
Current assignee: Baidu Online Network Technology Beijing Co Ltd; Shanghai Xiaodu Technology Co Ltd
Priority date: 2020-01-07
Filing date: 2020-01-07
Publication date: 2023-10-03
Anticipated expiration: 2040-01-07
Also published as: CN111241124A

Abstract

本申请实施例公开了一种需求模型构建方法、装置、电子设备和介质，涉及自然语言处理技术领域。具体实现方案为：依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展；依据同义扩展结果，以及所述样本需求的标注，构建需求模型。通过本申请实施例的技术方案，能够准确解析用户的需求，且人力成本低。

Description

一种需求模型构建方法、装置、电子设备和介质

技术领域

本申请涉及计算机技术，具体涉及自然语言处理技术，尤其涉及一种需求模型构建方法、装置、电子设备和介质。

背景技术

为了便于对用户的需求(query)进行理解和应答，目前需要将用户的query分配给程序员进行开发，而此过程不仅需要占用大量的人力，而且存在样本不足效果难以保证的缺陷。

发明内容

本申请实施例提供一种需求模型构建方法、装置、电子设备和介质，能够丰富样本且人力成本低，同时能够准确解析用户的需求。

第一方面，本申请实施例公开了一种需求模型构建方法，该方法包括：

依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展；

依据同义扩展结果，以及所述样本需求的标注，构建需求模型。

上述申请中的一个实施例具有如下优点或有益效果：在样本需求缺乏的场景下，通过充分利用谓词搭配语料库和同义片段改写库等中的至少一个自动对标注的样本需求进行同义扩展，不仅能够丰富样本需求，而且人力成本低；同时基于构建的需求模型能够快速解析用户的需求，为快速准确解析用户需求提供了一种新思路。

可选的，依据谓词搭配语料库，对标注的样本需求进行同义扩展，包括：

将所述样本需求中的谓词，与谓词搭配语料库中候选谓词进行匹配；

依据匹配结果，对所述样本需求中的谓词搭配进行同义扩展。

上述可选方式具有如下优点或有益效果：通过引入谓词搭配语料库对样本需求中的谓词搭配进行同义扩展，丰富了样本，增加了方案的灵活度。

可选的，依据同义片段改写库，对标注的样本需求进行同义扩展，包括：

从所述样本需求中抽取至少两个连续片段；

依据同义片段改写库，对所述至少两个连续片段进行同义扩展。

上述可选方式具有如下优点或有益效果：通过引入同义片段改写库对样本需求中的连续片段进行同义扩展，为丰富样本提供了一种可选方式。

可选的，依据同义扩展结果，以及所述样本需求的标注，构建需求模型，包括：

对同义扩展结果中的同义片段进行组合，得到所述样本需求的候选需求；

对所述候选需求进行过滤；

依据过滤后的候选需求，所述样本需求，以及所述样本需求的标注，构建所述需求模型中的需求词典。

上述可选方式具有如下优点或有益效果：通过采用组合方式，对同义扩展结果中的同义片段进行组合可得到多个与样本需求同义的候选需求，即丰富了样本；之后，可根据过滤后的候选需求、样本需求以及样本需求的标注一同构建需求词典，以便后续基于需求词典快速解析用户的需求。

依据所述样本需求的标注中的槽位，以及同义扩展结果中的同义片段，对所述样本需求的原句式进行变化，得到新句式；

依据所述原句式，所述新句式，以及所述同义扩展结果中的同义片段，构建所述需求模型中的树形词典。

上述可选方式具有如下优点或有益效果：通过根据样本需求的标注中的槽位以及同义扩展结果中的同义片段，对样本需求的原句式进行变化，从句式角度丰富了样本，进而需求模型中的树形词典可解析用户不同句式的需求，进一步提升了用户的满意度。

可选的，构建需求模型之后，还包括：

获取用户的目标需求；

利用所述需求模型对所述目标需求进行解析，得到所述目标需求的解析结果。

可选的，利用所述需求模型对所述目标需求进行解析，得到所述目标需求的解析结果，包括：

利用所述需求模型中的需求词典对所述目标需求进行解析，得到所述目标需求的第一解析结果；

利用所述需求模型中的树形词典对所述目标需求进行解析，得到所述目标需求的第二解析结果；

依据所述第一解析结果和所述第二解析结果，确定所述目标需求的解析结果。

上述可选方式具有如下优点或有益效果：通过综合分析采用需求模型中的需求词典和树形词典分别对用户的目标需求进行解析的解析结果，在保证能够解析用户的需求的同时，进一步增加了解析结果的准确度。

第二方面，本申请实施例公开了一种需求模型构建装置，该装置包括：

同义扩展模块，用于依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展；

需求模型构建模块，用于依据同义扩展结果，以及所述样本需求的标注，构建需求模型。

第三方面，本申请实施例还公开了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行如本申请任一实施例所述的需求模型构建方法。

第四方面，本申请实施例还公开了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行如本申请任一实施例所述的需求模型构建方法。

上述申请中的一个实施例具有如下优点或有益效果：在样本需求缺乏的场景下，通过充分利用谓词搭配语料库和同义片段改写库中的至少一个自动对标注的样本需求进行同义扩展，不仅能够丰富样本需求，而且人力成本低；同时基于构建的需求模型能够快速解析用户的需求，为快速准确解析用户需求提供了一种新思路。

上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。

附图说明

附图用于更好地理解本方案，不构成对本申请的限定。其中：

图1是根据本申请第一实施例提供的一种需求模型构建方法的流程图；

图2A是根据本申请第二实施例提供的一种需求模型构建方法的流程图；

图2B是根据本申请第二实施例提供的一种需求模型构建原理框图；

图2C是根据本申请第二实施例提供的另一种需求模型构建方法的流程图；

图3是根据本申请第三实施例提供的一种需求模型构建方法的流程图；

图4是根据本申请第四实施例提供的一种需求模型构建装置的结构示意图；

图5是用来实现本申请实施例的需求模型构建方法的电子设备的框图。

具体实施方式

以下结合附图对本申请的示范性实施例做出说明，其中包括本申请实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本申请的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

第一实施例

图1是根据本申请第一实施例提供的一种需求模型构建方法的流程图，本实施例可适用于如何解析用户的需求的情况，尤其适用于在样本缺乏即少样本的场景下，如何能够低成本且高效解析用户的需求。该方法可以由需求模型构建装置来执行，该装置可以采用软件和/或硬件的方式实现，并可集成于承载需求模型构建功能的计算设备上，例如服务器等。如图1所示，本实施例提供的需求模型构建方法可以包括：

S110、依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展。

其中，样本需求即用于进行模型训练的用户的需求。进一步的，本实施例中的样本需求可以包括用户的不同类型的需求。可选的，可向用户提供可视化的数据标注界面，进而用户可通过可视化的数据标注界面提交样本需求，并输入相关标注。其中，样本需求的标注可以包括但不限于领域(domain)、意图/目的(intent)、以及槽位(slot)等信息。例如，样本需求可以为“打开灯”，标注可以为：domain＝智能家居；intent＝开关操作；slots：操作类型＝打开，设备＝灯。又如，样本需求可以为“我想听周杰伦的歌”，标注可以为：domain＝音乐；intent＝音乐播放；slots：歌手＝周杰伦。

本实施例中，在样本缺乏的场景下，可以通过充分利用谓词搭配语料库和同义片段改写库中的至少一个自动对每一个标注的样本需求进行同义扩展，以丰富样本。其中，同义片段改写库是根据已有的同义片段词典、英汉词典以及汉语词典等所构建的便于查询的同义片段库。谓词搭配语料库是基于FIR(Functional Intent Representation，函数式意图表示)知识库所构建的“谓词+搭配”和/或“搭配+谓词”模式的语料库，例如，搭配(如：giveme给我/请给我/请帮我)+谓词(如：打开/播放)；进一步的，谓词搭配语料库中的语料可以以Key-Value键值对的形式存储，例如谓词为关键词(Key)，谓词所对应的不同搭配为(Value)。

可选的，依据谓词搭配语料库，对标注的样本需求进行同义扩展可以是：将样本需求中的谓词，与谓词搭配语料库中候选谓词进行匹配；依据匹配结果，对样本需求中的谓词搭配进行同义扩展。具体的，对于每一个样本需求，可以先从该样本需求中识别出谓词，之后可以将识别出的谓词作为索引词，在谓词搭配语料中进行查询；若谓词搭配语料库中存在与该样本需求中的谓词相匹配的候选谓词，则依据该候选谓词所关联的搭配对该样本需求中的谓词搭配进行同义扩展，即将该候选谓词所关联的搭配作为该样本需求中的谓词搭配的同义片段。例如，样本需求为“我想听周杰伦的歌”，该样本需求中的谓词为“听”，谓词搭配语料库中“听”所关联的搭配包括“我想”、“我要”、以及“给我”等，进而可以将“给我听”以及“给我听”作为该样本需求中的“我想听”的同义片段。

可选的，依据同义片段改写库，对标注的样本需求进行同义扩展可以是：从样本需求中抽取至少两个连续片段；依据同义片段改写库，对至少两个连续片段进行同义扩展。具体的，对于每一个样本需求，可以从该样本需求中抽取多个连续片段，例如样本需求为“打开灯”，连续片段可以包括打开、开灯、灯以及打开灯等；之后，对于所抽取的每一个连续片段，可以通过同义片段改写库进行改写查询，得到该连续片段的多个同义片段。可选的，此处可以为所得到的每个同义片段设置置信阈值，用于后续优化模型过程中自动调整。

进一步的，还可以依据用户的搜索日志，对标注的样本需求进行同义扩展。例如，可以基于dumi-log从用户的搜索日志中挖掘与样本需求具有相同语义的需求，作为该样本需求的同义需求等。本实施例引入用户的搜索日志对样本需求进行同义扩展，不仅能够丰富样本，而且加入用户习惯用语，为后续解析用户的需求奠定了基础。

此外，还可以基于word embedding对样本需求进行同义扩展等，本实施例对此不做限定。

需要说明的是，在样本缺乏的场景下，目前对于每一用户的新需求均需要特定的程序员进行开发，而此过程涉及程序员进行表述泛化的操作，该操作需要占用人力，且依赖程序员知识存储量等使样本需求泛化效果难以保证，进而在开发完上线后对用户需求的解析效果难以保证。而本实施例通过充分利用谓词搭配语料库和同义片段改写库等中的至少一个自动对标注的样本需求进行同义扩展，不仅能够丰富样本，而且人力成本低，同时丰富的样本为后续准确解析用户的需求奠定了基础。

S120、依据同义扩展结果，以及样本需求的标注，构建需求模型。

本实施例中，同义扩展结果中可以包括同义片段，还可以包括同义需求等。进而可以根据同义扩展结果中的同义片段和同义需求，以及样本需求的标注构建需求模型。例如，可以按照样本需求的句式，对同义扩展结果中的同义片段进行组合，得到多个候选需求；将多个候选需求中符合汉语语言要求以及句义与样本需求相同的需求选出，将选出的候选需求、样本需求的同义需求、以及样本需求的标注关联，即可得到一个包括需求和标注等的需求模型。

进一步的，在构建需求模型之后，可以对所构建的需求模型进行优化。具体的，可以采用大量线上随机抽样数据即大量需求，在需求模型中进行查找召回(可选的，对于每一个需求，可以召回与该需求相似度最大的样本需求，以及该样本需求的标注)；之后将召回结果提供给用户，并获取用户对样本需求的标注的修改；进而依据修改标注的样本需求重新进行训练，调整参数(包括调整同义片段的置信阈值)，多次重复上述过程，以优化需求模型。

本实施例，在构建需求模型之后，可以采用所构建的需求模型对用户提供的新需求进行解析。进一步的，构建需求模型之后，还可以包括：获取用户的目标需求，利用需求模型对目标需求进行解析，得到目标需求的解析结果。例如，目标需求为“开灯”，在需求模型中进行查找确定该模型中的需求“打开灯”与目标需求“开灯”相似度最大，此时可以将需求“打开灯”以及该需求的标注召回，并可以将该需求的标注作为目标需求的解析结果。

本申请实施例提供的技术方案，在样本缺乏的场景下，通过充分利用谓词搭配语料库和同义片段改写库中的至少一个自动对标注的样本需求进行同义扩展，不仅能够丰富样本，而且人力成本低；同时基于构建的需求模型能够快速解析用户的需求，为快速准确解析用户需求提供了一种新思路。

第二实施例

图2A是根据本申请第二实施例提供的一种需求模型构建方法的流程图，图2B是根据本申请第二实施例提供的一种需求模型构建原理框图；本实施例在上述实施例的基础上，进一步对依据同义扩展结果以及样本需求的标注，构建需求模型进行解释说明。如图2A和2B所示，本实施例提供的一种需求模型构建方法可以包括：

S210、依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展。

S220、对同义扩展结果中的同义片段进行组合，得到样本需求的候选需求。

本实施例中，对于每一样本需求，可以对采用S210进行同义扩展得到的同义扩展结果中的同义片段进行分组，即将相同语义的同义片段视为一组；之后每次从不同组中各选择一个同义片段按同义片段在该样本需求中的位置进行组合，即可得到该样本需求的多个候选需求。

S230、对候选需求进行过滤。

可选的，在得到样本需求的多个候选需求之后，可以采用语言模型，将候选需求中不通顺的候选需求滤除。

S240、依据过滤后的候选需求，样本需求，以及样本需求的标注，构建需求模型中的需求词典。

本实施例中，对于每一样本需求，由于该样本需求与过滤后的该样本需求的多个候选需求是相同语义的一类需求，如样本需求为“打开灯”，过滤后的该样本需求的候选需求可以包括“开开灯”、“开灯”、“给我开灯”、以及“请给我开灯”等，进而可以将该样本需求的标注作为过滤后的该样本需求的多个候选需求的标注。

具体的，对于每一样本需求，可以将该样本需求、过滤后的该样本需求的多个候选需求、以及该样本需求的标注关联存储，以得到需求模型中的需求词典。

为了进一步丰富样本，进一步的，对于每一样本需求，可以将该样本需求、过滤后的该样本需求的多个候选需求、基于dumi-log从用户的搜索日志中所挖掘的同义需求、以及该样本需求的标注关联存储，以得到需求模型中的需求词典。

本申请实施例提供的技术方案，通过采用组合方式，对同义扩展结果中的同义片段进行组合可得到多个与样本需求同义的候选需求，即丰富了样本；之后，可根据过滤后的候选需求、样本需求以及样本需求的标注一同构建需求词典，以便后续基于需求词典快速解析用户的需求。

可选的，图2C是根据本申请第二实施例提供的另一种需求模型构建方法的流程图，本实施例在上述实施例的基础上，又进一步对依据同义扩展结果以及样本需求的标注，构建需求模型进行解释说明。如图2C和2B所示，本实施例提供的另一种需求模型构建方法可以包括：

S250、依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展。

S260、依据样本需求的标注中的槽位，以及同义扩展结果中的同义片段，对样本需求的原句式进行变化，得到新句式。

本实施例中，新句式即为与样本需求的原句式不同的句式。可选的，对于每一样本需求，可以依据该样本需求的标注中的槽位，确定该样本需求的原句式；同时，可以对采用S210进行同义扩展得到的同义扩展结果中的同义片段进行分组，即将相同语义的同义片段归为一组，并依据该样本需求的标注中的槽位确定每组的槽位；之后可以基于FIR知识库，依据每组的槽位对样本需求的原句式进行变化，即可得到新句式。

例如，样本需求可以为“打开灯”，该样本需求中的槽位slots：操作类型＝打开，设备＝灯；用A表示操作类型，B表示设备，则该样本需求的原句式可以表示为A+B。开、打开、开开、给我打开以及帮我开开等的槽位为操作类型A，灯的槽位为设备B(可以理解的是，基于FIR知识库中丰富的知识，槽位为设备的一组中不仅可以包括灯，还可以包括电视、洗衣机以及电脑等)，进而基于FIR知识库，依据每组的槽位对该样本需求的原句式进行变化，可得到新句式如B+A(如灯开开)等。

S270、依据原句式，新句式，以及同义扩展结果中的同义片段，构建需求模型中的树形词典。

本实施例中，树形词典又可称为FIR词典，基于树形词典能够将用户的需求解析为树形结构，进一步的，基于树形词典中的句式配置信息能够将用户的需求解析为树形结构。

可选的，可以依据原句式产生原句式配置信息，依据新句式产生新句式配置信息；同时依据同义扩展结果中的同义片段以及FIR知识库，可得到多个包括具体内容的槽位(如操作类型包括开、打开、开开、给我打开以及帮我开开等)；之后可以依据原句式配置信息、新句式配置信息以及包括具体内容的各个槽位，构建需求模型中的树形词典。

本申请实施例提供的技术方案，通过根据样本需求的标注中的槽位以及同义扩展结果中的同义片段，对样本需求的原句式进行变化，从句式角度丰富了样本，进而需求模型中的树形词典可解析用户不同句式的需求，进一步提升了用户的满意度。

需要说明的是，本实施例中构建需求模型中的需求词典的过程，和构建需求模型中的树形词典的过程可并行独立执行，且需求模型中的也可只包括需求词典和树形词典中的一种，为了能够解析用户的各种需求，优选的需求模型中可同时包括需求词典和树形词典。

结合图2B，进一步的，在构建需求模型中的需求词典和树形词典之后，可以并行对构建的需求词典和树形词典进行优化。具体的，可以采用大量线上随机抽样数据即大量需求，同时在需求词典和树形词典中进行查找召回，之后可以将需求词典和树形词典的召回结果进行合并，并将合并的结果提供给用户，并获取用户对样本需求的标注的修改；进而依据修改标注的样本需求重新进行训练，调整参数(包括调整同义片段的置信阈值)，多次重复上述过程，以优化需求模型中的需求词典和树形词典。可选的，对需求词典和树形词典的召回结果进行合并可以是，在需求词典和树形词典均能够解析同一需求时，可以默认召回需求词典的解析结果，即可设置需求词典的解析结果的优先级高于树形词典的解析结果的优先级。

进一步的，本实施例在对需求模型中的需求词典和树形词典进行迭代优化的过程中，还可以基于召回结果做回溯分析，即可根据召回结果快速定位导致该结果与用户需求不符的原因。例如，用户的需求是“打开电视”，而从模型中召回的需求为“关闭电视”，则可以定位到在同义扩展阶段有误，此时可以调整预先设定的置信阈值。

此外，本实施例还可支持用户根据实际场景灵活设置过滤条件来干预召回结果，以满足不同场景的需求。例如，用户可以通过提供过滤条件来干预哪些结果不应召回。

第三实施例

图3是根据本申请第三实施例提供的一种需求模型构建方法的流程图，本实施例在上述实施例的基础上，增加了利用所构建的需求模型进行解析用户需求的过程。如图3所示，本实施例提供的需求模型构建方法可以包括：

S310、依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展。

S320、依据同义扩展结果，以及样本需求的标注，构建需求模型。

S330、获取用户的目标需求。

S340、利用需求模型中的需求词典对目标需求进行解析，得到目标需求的第一解析结果。

具体的，可以对目标需求进行切词，之后依据切词结果在需求词典中进行检索，将检索结果中与目标需求相似度最大的需求以及该需求的标注召回，将召回的该需求的标注作为目标需求的第一解析结果。

可选的，利用需求模型中的需求词典对目标需求进行解析，得到目标需求的第一解析结果可以包括下述过程：

A、依据目标需求在需求模型中的需求词典中进行检索，并按照字面相似度、拼音相似度以及编辑距离中的至少一个对检索结果进行排序；

本实施例中，字面相似度可用于表征两个需求之间的汉字的重合程度，即可表征两个需求之间相同汉字的个数；可以将两个需求之间相同汉字的个数与两个需求的总字数(相同汉字算一个)之比作为两个需求之间的字面相似度。例如，需求A为“打开灯”，需求B为“灯打开”，需求A和需求B的字面相似度为3/3＝1。又如需求C为“开灯”，需求A和需求C的字面相似度为2/3。

编辑距离是指两个字串之间，由一个转成另一个所需的最少编辑操作次数；可选的，编辑距离越小，两个串的相似程度越大。例如，需求B为“灯打开”，需求D为“灯开开”，则需求B与需求D之间的编辑距离为1。为了避免歧义，本实施例引入拼音相似度，拼音相似度可用于表征两个需求之间语音的相似程度。

可选的，可以对目标需求进行切词，并依据切词结果在需求词典中进行检索；之后可以按照目标需求与检索结果中每个需求的字面相似度对检索结果进行排序；还可以按照目标需求与检索结果中每个需求的拼音相似度对检索结果进行排序；或者按照目标需求与检索结果中每个需求的编辑距离对检索结果进行排序。

为了使最终召回的结果更准确，优选的，对于检索结果中的每个需求，可以计算该需求与目标需求的字面相似度、拼音相似度以及编辑距离，之后可以将预先设定的字面相似度、拼音相似度以及编辑距离这三个维度的权重，分别与所计算的字面相似度、拼音相似度以及编辑距离相乘并将相乘结果做求和运算，进而将求和运算结果作为该需求与目标需求的最终相似度；之后可以按照目标需求与检索结果中每个需求的最终相似度对检索结果进行排序。例如，可以按照降序方式对检索结果进行排序。

进一步的，还可以结合字面相似度、拼音相似度以及编辑距离三个维度采用其他方式对检索结果进行排序，本实施例对此不做限定。

B、依据排序结果，从检索结果中选择目标需求的关联需求；

本实施例中，目标需求的关联需求即为需求词典中与目标需求相似度最大的需求。可选的，可以将检索结果中排序最前的需求作为目标需求的关联需求。

C、将关联需求的标注，作为目标需求的第一解析结果。

具体的，可以将关联需求的标注作为目标需求的第一解析结果。例如，目标需求为“开灯”，检索结果中排序最前的需求为“打开灯”，则可以将“打开灯”的标注作为“开灯”的第一解析结果，为：domain＝智能家居；intent＝开关操作；slots：操作类型＝打开，设备＝灯。

示例性的，在选出关联需求之后，可以判断关联需求的最终相似度是否等于或大于设定阈值，若所选出的关联需求的最终相似度小于设定阈值，则目标需求的第一解析结果可以为空。

S350、利用需求模型中的树形词典对目标需求进行解析，得到目标需求的第二解析结果。

其中，目标需求的第二解析结果与目标需求的第一解析结果的形式相同。具体的，可以利用树形词典对目标需求进行解析，得到目标需求的树形结构；对树形结构进行格式转化，即可得到目标需求的第二解析结果。

可选的，利用需求模型中的树形词典对目标需求进行解析，得到目标需求的第二解析结果可以包括下述过程：

A、依据目标需求在需求模型中的树形词典中进行查找，确定目标需求中片段的标签；

可选的，可以依据目标需求在树形词典中进行查找；若不存在相匹配的结果，则目标需求的第二解析结果为空；在存在相匹配结果的情况下，可以将树形词典中相匹配的片段的槽位作为目标需求中片段的标签。例如，目标需求为“灯开下”，树形词典中存储有槽位为操作类型的具体内容(如开、打开、开下、开开、给我打开以及帮我开开等)，以及存储有槽位为设备的具体内容(如灯、电视、洗衣机以及电脑等)；进而可以确定目标需求中灯的标签为设备，开下的标签为操作类型。

B、依据目标需求中片段的标签，确定目标需求的句式；

具体的，在确定目标需求中每个片段的标签之后，可以根据目标需求中每个片段的标签，确定目标需求的句式。例如，目标需求为“灯开下”，目标需求中灯的标签为设备，开下的标签为操作类型，则可以确定目标需求的句式为设备+操作类型。若用A表示操作类型，B表示设备，则目标需求的句式可以表示为B+A。

C、将树形词典中与目标需求的句式相同的句式，作为目标句式；

具体的，在确定目标需求的句式之后，可以将树形词典中与目标需求的句式相同的句式作为目标句式。进一步的，若树形词典中不存在与目标需求的句式相同的句式，则目标需求的第二解析结果为空。

D、采用目标句式关联的配置信息对目标需求进行解析，得到目标需求的第二解析结果。

具体的，可以采用目标句式关联的配置信息对目标需求进行解析，可以得到目标需求的树形结构；之后采用设定的格式转化方式，对目标需求的树形结构进行格式转化，即可得到目标需求的第二解析结果。

S360、依据第一解析结果和第二解析结果，确定目标需求的解析结果。

可选的，在得到目标需求的第一解析结果和第二解析结果，且两者均不为空的情况下，可以依据预先设定的树形词典和需求词典解析结果的优先级，从第一解析结果和第二解析结果中确定目标需求的解析结果。例如需求词典的解析结果的优先级高于树形词典的解析结果的优先级，进而可以将第一解析结果作为目标需求的解析结果。

可选的，若目标需求的第一解析结果和第二解析结果中任意一个为空，则可以直接将不为空的如第一解析结果作为目标需求的解析结果。

本申请实施例提供的技术方案，通过综合分析采用需求模型中的需求词典和树形词典分别对用户的目标需求进行解析的解析结果，在保证能够解析用户的需求的同时，进一步增加了解析结果的准确度。

第四实施例

图4是本申请第四实施例提供的一种需求模型构建装置的结构示意图，该装置可配置于承载需求模型构建功能的计算设备中，该装置可执行本申请任意实施例所提供的需求模型构建方法，具备执行方法相应的功能模块和有益效果。如图4所示，该装置可以包括：

同义扩展模块410，用于依据谓词搭配语料库和同义片段改写库中的至少一个，对标注的样本需求进行同义扩展；

需求模型构建模块420，用于依据同义扩展结果，以及样本需求的标注，构建需求模型。

示例性的，同义扩展模块410在用于根据谓词搭配语料库，对标注的样本需求进行同义扩展时，具体可以用于：

将样本需求中的谓词，与谓词搭配语料库中候选谓词进行匹配；

依据匹配结果，对样本需求中的谓词搭配进行同义扩展。

示例性的，同义扩展模块410在用于依据同义片段改写库，对标注的样本需求进行同义扩展时，具体可以用于：

从样本需求中抽取至少两个连续片段；

依据同义片段改写库，对至少两个连续片段进行同义扩展。

示例性的，需求模型构建模块420可以包括需求词典构建单元，该单元具体可以用于：

对同义扩展结果中的同义片段进行组合，得到样本需求的候选需求；

对候选需求进行过滤；

依据过滤后的候选需求，样本需求，以及样本需求的标注，构建所述需求模型中的需求词典。

示例性的，需求模型构建模块420可以包括树形词典构建单元，该单元具体可以用于：

依据样本需求的标注中的槽位，以及同义扩展结果中的同义片段，对样本需求的原句式进行变化，得到新句式；

依据原句式，新句式，以及同义扩展结果中的同义片段，构建需求模型中的树形词典。

示例性的，上述装置还可以包括：

目标需求获取模块，用于构建需求模型之后，获取用户的目标需求；

解析结果确定模块，用于利用需求模型对目标需求进行解析，得到目标需求的解析结果。

示例性的，解析结果确定模块可以包括：

第一解析结果确定单元，用于利用需求模型中的需求词典对目标需求进行解析，得到目标需求的第一解析结果；

第二解析结果确定单元，用于利用需求模型中的树形词典对目标需求进行解析，得到目标需求的第二解析结果；

目标解析结果确定单元，用于依据第一解析结果和第二解析结果，确定目标需求的解析结果。

示例性的，第一解析结果确定单元具体可以用于：

依据目标需求在需求模型中的需求词典中进行检索，并按照字面相似度、拼音相似度以及编辑距离中的至少一个对检索结果进行排序；

依据排序结果，从检索结果中选择目标需求的关联需求；

将关联需求的标注，作为目标需求的第一解析结果。

示例性的，第二解析结果确定单元具体可以用于：

依据目标需求在需求模型中的树形词典中进行查找，确定目标需求中片段的标签；

依据目标需求中片段的标签，确定目标需求的句式；

将树形词典中与所述目标需求的句式相同的句式，作为目标句式；

采用目标句式关联的配置信息对目标需求进行解析，得到目标需求的第二解析结果。

根据本申请的实施例，本申请还提供了一种电子设备和一种可读存储介质。

如图5所示，是根据本申请实施例的需求模型构建方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本申请的实现。

如图5所示，该电子设备包括：一个或多个处理器501、存储器502，以及用于连接各部件的接口，包括高速接口和低速接口。各个部件利用不同的总线互相连接，并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理，包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如，耦合至接口的显示设备)上显示GUI(Graphical User Interface，GUI)的图形信息的指令。在其它实施方式中，若需要，可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样，可以连接多个电子设备，各个设备提供部分必要的操作，例如，作为服务器阵列、一组刀片式服务器、或者多处理器系统。图5中以一个处理器501为例。

存储器502即为本申请所提供的非瞬时计算机可读存储介质。其中，所述存储器存储有可由至少一个处理器执行的指令，以使所述至少一个处理器执行本申请所提供的需求模型构建方法。本申请的非瞬时计算机可读存储介质存储计算机指令，该计算机指令用于使计算机执行本申请所提供的需求模型构建方法。

存储器502作为一种非瞬时计算机可读存储介质，可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块，如本申请实施例中的需求模型构建方法对应的程序指令/模块，例如，附图4所示的同义扩展模块410和需求模型构建模块420。处理器501通过运行存储在存储器502中的非瞬时软件程序、指令以及模块，从而执行服务器的各种功能应用以及数据处理，即实现上述方法实施例中的需求模型构建方法。

存储器502可以包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需要的应用程序；存储数据区可存储根据用来实现需求模型构建方法的电子设备的使用所创建的数据等。此外，存储器502可以包括高速随机存取存储器，还可以包括非瞬时存储器，例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中，存储器502可选包括相对于处理器501远程设置的存储器，这些远程存储器可以通过网络连接至用来实现需求模型构建方法的电子设备。上述网络的实例包括但不限于互联网、企业内部网、区块链网络、局域网、移动通信网及其组合。

用来实现需求模型构建方法的电子设备还可以包括：输入装置503和输出装置504。处理器501、存储器502、输入装置503和输出装置504可以通过总线或者其他方式连接，图5中以通过总线连接为例。

输入装置503可接收输入的数字或字符信息，以及产生与用来实现需求模型构建方法的电子设备的用户设置以及功能控制有关的键信号输入，例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置504可以包括显示设备、辅助照明装置和触觉反馈装置等，其中，辅助照明装置例如发光二极管(Light Emitting Diode，LED)，触觉反馈装置例如振动电机等。该显示设备可以包括但不限于，液晶显示器(Liquid Crystal Display，LCD)、LED显示器和等离子体显示器。在一些实施方式中，显示设备可以是触摸屏。

此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用专用集成电路(Application Specific Integrated Circuit，ASIC)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

这些计算程序也称作程序、软件、软件应用、或者代码，包括可编程处理器的机器指令，并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的，术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置，例如，磁盘、光盘、存储器、可编程逻辑装置(Programmable Logic Device，PLD)，包括，接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置，例如，阴极射线管(Cathode Ray Tube，CRT)或者LCD监视器；以及键盘和指向装置，例如，鼠标或者轨迹球，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈例如，视觉反馈、听觉反馈、或者触觉反馈；并且可以用任何形式，包括声输入、语音输入或者、触觉输入，来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统例如，作为数据服务器；或者实施在包括中间件部件的计算系统例如，应用服务器；或者实施在包括前端部件的计算系统例如具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互，或者实施在包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信，例如，通信网络，来将系统的部件相互连接。通信网络的示例包括：局域网(Local Area Network，LAN)、广域网(Wide Area Network，WAN)、区块链网络和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

根据本申请实施例的技术方案，在样本缺乏的场景下，通过充分利用谓词搭配语料库和同义片段改写库中的至少一个自动对标注的样本需求进行同义扩展，不仅能够丰富样本，而且人力成本低；同时基于构建的需求模型能够快速解析用户的需求，为快速准确解析用户需求提供了一种新思路。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本申请公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本申请保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等，均应包含在本申请保护范围之内。

Claims

1.一种需求模型构建方法，其特征在于，包括：

依据同义扩展结果，以及所述样本需求的标注，构建需求模型；

其中，构建需求模型之后，还包括：

获取用户的目标需求；

利用所述需求模型对所述目标需求进行解析，得到所述目标需求的解析结果；

其中，利用所述需求模型对所述目标需求进行解析，得到所述目标需求的解析结果，包括：

依据所述第一解析结果和所述第二解析结果，确定所述目标需求的解析结果；

依据所述目标需求在所述需求模型中的需求词典中进行检索，并按照字面相似度、拼音相似度以及编辑距离中的至少一个对检索结果进行排序；

依据排序结果，从所述检索结果中选择所述目标需求的关联需求；

将所述关联需求的标注，作为所述目标需求的第一解析结果。

2.根据权利要求1所述的方法，其特征在于，依据谓词搭配语料库，对标注的样本需求进行同义扩展，包括：

3.根据权利要求1所述的方法，其特征在于，依据同义片段改写库，对标注的样本需求进行同义扩展，包括：

从所述样本需求中抽取至少两个连续片段；

4.根据权利要求1所述的方法，其特征在于，依据同义扩展结果，以及所述样本需求的标注，构建需求模型，包括：

对所述候选需求进行过滤；

5.根据权利要求1所述的方法，其特征在于，依据同义扩展结果，以及所述样本需求的标注，构建需求模型，包括：

6.根据权利要求1所述的方法，其特征在于，利用所述需求模型对所述目标需求进行解析，得到所述目标需求的解析结果，包括：

依据所述目标需求在所述需求模型中的树形词典中进行查找，确定所述目标需求中片段的标签；

依据所述目标需求中片段的标签，确定所述目标需求的句式；

将所述树形词典中与所述目标需求的句式相同的句式，作为目标句式；

采用所述目标句式关联的配置信息对所述目标需求进行解析，得到所述目标需求的第二解析结果。

7.一种需求模型构建装置，其特征在于，包括：

需求模型构建模块，用于依据同义扩展结果，以及所述样本需求的标注，构建需求模型；

上述装置还包括：

解析结果确定模块，用于利用需求模型对目标需求进行解析，得到目标需求的解析结果；

解析结果确定模块包括：

目标解析结果确定单元，用于依据第一解析结果和第二解析结果，确定目标需求的解析结果；

第一解析结果确定单元具体用于：

解析结果确定模块包括第一解析结果确定单元，具体用于：

依据排序结果，从检索结果中选择目标需求的关联需求；

将关联需求的标注，作为目标需求的第一解析结果。

8.一种电子设备，其特征在于，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-6中任一项所述的需求模型构建方法。

9.一种存储有计算机指令的非瞬时计算机可读存储介质，其特征在于，所述计算机指令用于使所述计算机执行权利要求1-6中任一项所述的需求模型构建方法。