CN109815333B

CN109815333B - 信息获取方法、装置、计算机设备和存储介质

Info

Publication number: CN109815333B
Application number: CN201910031536.2A
Authority: CN
Inventors: 李成; 曾俊杰; 张良杰
Original assignee: Kingdee Software China Co Ltd
Current assignee: Kingdee Software China Co Ltd
Priority date: 2019-01-14
Filing date: 2019-01-14
Publication date: 2021-05-28
Anticipated expiration: 2039-01-14
Also published as: CN109815333A

Abstract

本申请涉及一种信息获取方法、装置、计算机设备和存储介质。方法包括：获取待处理语句；提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系；将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配；根据与第二依存关系相匹配的匹配关键词的第一依存关系和第一分类标签得到目标信息。上述信息获取方法、装置、计算机设备和存储介质能够提高获取的信息的准确性。

Description

信息获取方法、装置、计算机设备和存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种信息获取方法、装置、计算机设备和存储介质。

背景技术

随着计算机技术和互联网的发展，自然语言理解作为人工智能方面的重要任务之一，在越来越多的方面扮演重要角色。对自然语言的理解是从自然语言中提取有效信息的关键手段，关系到人工智能后续对有效信息的处理。

然而，由于自然语言的表达方式多种多样，在传统的自然语言理解的方法中，往往不能对自然语言提取到关键的信息或者正确的信息，造成了对自然语言的理解不准确，存在准确性较低的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高准确性的信息获取方法、装置、计算机设备和存储介质。

一种信息获取方法，所述方法包括：

获取待处理语句；

提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，其中，所述第一依存关系用于表示所述待处理语句中包含的关键词之间的联系；

将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；

将与所述数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将所述匹配关键词的第一依存关系与所述第二分类标签对应的第二依存关系进行匹配；

根据与所述第二依存关系相匹配的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息。

在其中一个实施例中，所述提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，包括：

对所述待处理语句进行依存句法分析，提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系；

通过词分类器得到各个所述关键词的第一分类标签。

在其中一个实施例中，所述根据词分类器得到各个所述关键词的第一分类标签之前，还包括：

获取训练语句，并将所述训练语句进行分词得到所述训练语句中的训练词；

通过深度神经网络对各个所述训练词进行计算得到矢量词，并根据各个所述矢量词建立词分类器。

在其中一个实施例中，所述将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配之前，还包括：

根据预先训练的意图分类器对所述待处理语句进行意图分析，得到待处理语句的目标意图；

获取所述目标意图对应的参考语句；

提取所述参考语句中的参考词，并得到各个所述参考词的第二分类标签以及第二分类标签对应的第二依存关系。

在其中一个实施例中，所述根据与所述第二依存关系相匹配的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息，包括：

根据与所述第二依存关系的匹配度大于或等于匹配度阈值的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息。

在其中一个实施例中，所述第一依存关系中包含关键词和对应的指向关键词，所述第二依存关系中包含参考词和对应的指向参考词；

所述根据与所述第二依存关系的匹配度大于或等于匹配度阈值的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息，包括：

获取与所述第二依存关系的匹配度大于或等于匹配度阈值的所述匹配关键词的第一依存关系作为目标依存关系，并将与所述目标依存关系的匹配度大于或等于所述匹配度阈值的第二依存关系作为参考依存关系；

根据所述目标依存关系中的指向关键词的词性与所述参考依存关系中的指向参考词的词性，以及所述第一分类标签获取目标信息。

在其中一个实施例中，所述根据所述目标依存关系中的指向关键词的词性与所述参考依存关系中的指向参考词的词性，以及所述第一分类标签获取目标信息，包括：

将所述目标依存关系中的指向关键词的词性与所述参考依存关系中的指向参考词的词性进行匹配；

将与所述指向参考词的词性相匹配的所述指向关键词作为目标关键词；

根据所述目标关键词和所述第一分类标签得到目标信息。

一种信息获取装置，所述装置包括：

待处理语句获取模块，用于获取待处理语句；

关键词提取模块，用于提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，其中，所述第一依存关系用于表示所述待处理语句中包含的关键词之间的联系；

分类标签匹配模块，用于将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；

依存关系匹配模块，用于将与所述数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将所述匹配关键词的第一依存关系与所述第二分类标签对应的第二依存关系进行匹配；

目标信息获取模块，用于根据与所述第二依存关系相匹配的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述信息获取方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述信息获取方法的步骤。

上述信息获取方法、装置、计算机设备和存储介质，提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，用户预先将需要获取的信息对应的第二依存关系、第一分类标签和关键词添加在数据库中，当获取到与数据库中的第二分类标签相匹配的第一分类标签对应的匹配关键词，并且该匹配关键词的第一依存关系与数据库中的第二依存关系相匹配时，可以获取到与匹配关键词具有依存关系的目标信息，得到的目标信息不仅包含用户需要的匹配关键词的第一分类标签，还根据各个关键词的依存关系进行分析，更加提高了信息获取的准确性。

附图说明

图1为一个实施例中信息获取方法的应用环境图；

图2为一个实施例中信息获取方法的流程示意图；

图3为另一个实施例中信息获取步骤的流程示意图；

图4为另一个实施例中信息获取步骤的流程示意图；

图5为另一个实施例中信息获取步骤的流程示意图；

图6为一个实施例中信息获取装置的结构框图；

图7为另一个实施例中信息获取装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

在传统的自然语言的处理方法中，当自然语言中存在多个相关度较高的关键词时，对多个相关度较高的关键词进行处理不能得到更加详细的信息，从而影响了从自然语言中提取特定的目标信息的准确度。本申请实施例提供的信息获取方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。用户在终端102输入待处理语句，服务器104通过网络获取待处理语句；提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系；将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配；根据与第二依存关系相匹配的第一依存关系得到目标信息。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种信息获取方法，包括以下步骤：

步骤202，获取待处理语句。

其中，待处理语句可以是中文语句、也可以是英文语句，还可以是其他的文字形式记录的语句，不限于此。

具体地，待处理语句可以通过用户实时输入的语句进行获取，也可以通过检测到数据库中存储的文档，识别文档中的内容进行提取待处理语句，还可以通过识别网页中的内容，从而获取待处理语句，不限于此。

步骤204，提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系。

分类标签指的是用于表示关键词信息类别的标签。第一分类标签指的是表示待处理语句中的关键词信息类别的标签。如关键词“去”的第一分类标签可以为“前往类”，关键词“到”的第一分类标签也可以为“前往类”，关键词“明天”的第一分类标签可以为“时间类”。可以对待处理语句进行处理，提取待处理语句中的各个关键词，并且得到各个关键词之间的第一依存关系和第一分类标签。

例如，获取的待处理语句为“明天我们去北京旅游。”，可以提取到各个关键词为“明天”、“我们”、“去”、“北京”和“旅游”，并得到的各个关键词的第一依存关系，如关键词“明天”的第一依存关系有“明天-定中关系-去”，关键词“去”的第一依存关系有“我们-主谓关系-去”、“明天-定中关系-去”等。其中，定中关系指的是定语与谓语的联系。并且同时得到各个关键词的第一分类标签，如“我们”的第一分类标签可以为“主要人物类”，“北京”的第一分类标签可以为“地点类”等。

步骤206，将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配。

第二分类标签指的是用户需要获取的信息所对应的关键词的标签。在进行信息获取的过程之前，用户可以预先将需要获取的信息对应的第二分类标签添加到数据库。例如，用户需要获取待处理语句中前往的时间信息，可以预先在数据库中添加第二分类标签“前往类”，则将待处理语句中各个关键词的第一分类标签与数据库中的第二分类标签进行匹配，可以匹配到与“前往类”相匹配的关键词，从而可以得到待处理语句中前往的时间信息。

可选地，在数据库中添加第二分类标签后，也可以添加第二分类标签对应的关键词，将待处理语句中各个关键词逐一与数据库中的关键词进行匹配。

步骤208，将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配。

当待处理语句中的关键词所对应的第一分类标签与数据库中的第二分类标签相匹配时，表示该关键词是用户需要获取的信息所对应的关键词，将该关键词作为匹配关键词。

在用户预先将第二分类标签添加到数据库后，可以添加第二分类标签对应的关键词和该关键词的第二依存关系。在获取到匹配关键词后，将匹配关键词的第一依存关系与第二分类标签对应的关键词的第二依存关系进行匹配。

可选地，第一依存关系与第二依存关系的匹配可以是严格匹配，也可以相似匹配。严格匹配指的是当第一依存关系与第二依存关系完全一致时相匹配，当第一依存关系与第二依存关系不完全一致时不匹配。相似匹配指的是当第一依存关系与第二依存关系的匹配度大于或等于匹配度阈值时相匹配，当第一依存关系与第二依存关系的匹配度小于或等于匹配度阈值时不匹配。

步骤210，根据与第二依存关系相匹配的匹配关键词的第一依存关系和第一分类标签得到目标信息。

当匹配关键词的第一依存关系与第二依存关系相匹配时，表示匹配关键词所对应的信息为用户需要的信息，并且根据各个关键词的第一分类标签，可以得到目标信息。

例如，关键词“明天”的第一分类标签为“时间类”，匹配关键词“去”的第一依存关系为“明天-定中关系-去”，与第二依存关系“时间类-定中关系-前往类”相匹配，可以得到待处理语句中的目标信息为“明天为前往的时间”。

又如，当待处理语句为“我们明天出发，后天回来。”，关键词“明天”的第一分类标签为“时间类”，关键词“出发”的第一分类标签为“前往类”，关键词“后天”的第一分类标签为“时间类”，关键词“回来”的第一分类标签为“回归类”，关键词“出发”的第一依存关系为“明天-定中关系-出发”，关键词“回来”的第一依存关系为“后天-定中关系-回来”。

当数据库中的第二分类标签为“回归类”，第二依存关系为“时间-定中关系-回归类”，则可以获取待处理语句中的匹配关键词为“回来”，匹配关键词“回来”的第一依存关系“后天-定中关系-回来”和第二依存关系“时间-定中关系-回归类”相匹配，可以得到待处理语句中的目标信息为“后天为回归的时间”。

当数据库中的第二分类标签为“前往类”和“回归类”，第二依存关系为“时间-定中关系-前往类”和“时间-定中关系-回归类”，则最终可以得到待处理语句中的目标信息为“明天为前往的时间，后天为回归的时间”。

在本实施例中，提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，用户预先将需要获取的信息对应的第二依存关系、第一分类标签和关键词添加在数据库中，当获取到与数据库中的第二分类标签相匹配的第一分类标签对应的匹配关键词，并且该匹配关键词的第一依存关系与数据库中的第二依存关系相匹配时，可以获取到与匹配关键词具有依存关系的目标信息，得到的目标信息不仅包含用户需要的匹配关键词的第一分类标签，还根据各个关键词的依存关系进行分析，更加提高了信息获取的准确性。

在一个实施例中，提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，包括：对待处理语句进行依存句法分析，提取待处理语句中的关键词，并得到各个关键词的第一依存关系；通过词分类器得到各个关键词的第一分类标签。

依存句法分析用于对待处理语句进行分析，捕捉句子内部各个关键词之间的修饰或搭配关系，从而刻画句子的句法和语义结构。通过依存句法分析对待处理语句进行分词，得到各个关键词，也可以对待处理语句中的各个关键词进行分析，得到各个关键词的词性和第一依存关系。

词分类器用于对词语进行分类。可以预先创建词分类器，也可以对词分类器进行训练，从而可以对词语进行更准确地分类。通过此分类器对各个关键词进行分类，可以得到各个关键词的对应的第一分类标签。

例如，通过词分类器对关键词“去”进行分类可以得到第一分类标签“前往类”，对关键词“看一下”进行分类可以得到第一分类标签“查询类”。

在对待处理语句进行依存句法分析，并且通过词分类器进行处理后，可以得到各个关键词的信息序列：关键词+第一分类标签+词性+依存关系。如关键词“明天”的信息序列为：明天+时间类+时间名词+明天-定中关系-去，关键词“我们”的信息序列为：我们+主要人物类+代词+我们-主谓关系-去。

在本实施例中，对待处理语句进行依存句法分析，可以得到各个关键词以及各个关键词的第一依存关系，通过词分类器可以得到各个关键词的第一分类标签，更加提高了信息提取的准确性。

在一个实施例中，根据词分类器得到各个关键词的第一分类标签之前，还包括：获取训练语句，并将训练语句进行分词得到训练语句中的训练词；通过深度神经网络对各个训练词进行计算得到矢量词，并根据各个矢量词建立词分类器。

训练语句指的是用于创建和训练词分类器的语句。深度神经网络(Deep NeuralNetwork)指的是一种用于识别语句的网络。矢量词指的是一种具有方向的多维度词语。

可以理解的是，为了得到更加分类更加准确的词分类器，一般需要获取大量的训练语句，并通过对大量的训练语句进行分词得到大量的训练词。通过深度神经网络可以对大量的训练词进行计算得到训练词对应的矢量词，通过矢量词建立词分类器。建立词分类器后，可以继续获取训练语句对该词分类器进行训练，获取分类更加准确的词分类器。

进一步地，可以利用连续词袋模型、跳词模型、Transformer等方法创建和训练深度神经网络，该深度神经网络用于计算各个关键词对应的矢量词。再利用Softmax(归一化指数)函数、LDA(Latent Dirichlet Allocation，文档主题生成模型)、Negative Sample、SVM(Support Vector Machine，支持向量机)等方法对矢量词进行分类训练，从而可以创建并训练词分类器。

在本实施例中，通过深度神经网络对训练语句中的训练词进行计算得到矢量词，并根据各个矢量词建立词分类器，可以提高待处理语句中关键词的第一分类标签的准确性。

在一个实施例中，将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配之前，还包括：

步骤302，根据预先训练的意图分类器对待处理语句进行意图分析，得到待处理语句的目标意图。

意图分类器用于对待处理语句的意图进行分类。目标意图指的待处理语句所要表达的意图。例如，通过意图分类器对待处理语句“明天我们去北京旅游”的意图进行分类，可以得到该待处理语句的目标意图为“旅游”。

意图分类器可以预先进行训练。可以通过文本分布式语义表达向量将训练语句加载到网络中，然后使用Softmax分类器对该训练语句进行意图分类。其中，文本分布式语义表达向量指的是对文本的一种表达方式，文本分布式语义表达向量可以通过CBOW、Skipgram、Glove、BiLSTM(双向长短期记忆网络)、Elmo、Transformer、BERT等其中的一种或多种方法训练得到。

例如，将待处理语句“明天我们去北京旅游”进行分词后得到五个关键词分别为“明天”、“我们”、“去”、“北京”和“旅游”，通过深度神经网络计算得到每个关键词对应的矢量词。根据预先训练的意图分类器将各个矢量词进行叠加运算，得到该待处理语句的文本向量，通过全连接层接入Softmax对该文本向量进行分类可以得到该待处理语句的目标意图为“旅游”。

步骤304，获取目标意图对应的参考语句。

获取待处理语句的目标意图后，可以获取意图与该目标意图一致或者相关度较高的参考语句。

步骤306，提取参考语句中的参考词，并得到各个参考词的第二分类标签以及第二分类标签对应的第二依存关系。

通过对参考语句进行依存句法分析可以提取参考语句中的各个参考词、各个参考词的词性以及各个参考词的第二依存关系。通过词分类器可以得到参考语句中的各个参考词的第二分类标签。其中，各个参考词的第二分类标签与各个参考词的第二依存关系存在对应关系。

在将参考语句中的各个参考词、各个参考词的第二分类标签以及第二依存关系添加到数据库中后，用户可以对该数据库中的数据进行维护，也就是可以对数据库中的数据进行添加、查询、删除、修改等操作。

可以理解的是，获取到待处理语句的目标意图后，可以获取与该待处理语句的目标意图对应的参考语句。参考语句的意图与待处理语句的目标意图一致或相关度较高，将待处理语句与数据库中参考语句的各个参考词的第二分类标签、第二依存关系、词性等属性进行比较，从而可以从待处理语句中获取更加准确的目标信息。

在一个实施例中，根据与第二依存关系相匹配的匹配关键词的第一依存关系得到目标信息，包括：根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息。

用户可以预先设置匹配度阈值。当匹配度阈值为100％时，则表示严格匹配。当匹配度阈值小于100％时，则表示相似匹配。可以根据第二依存关系和匹配关键词的第一依存关系，计算得到匹配度。

例如，当匹配度阈值为100％时，当计算得到第二依存关系和匹配关键词的第一依存关系的匹配度小于100％时，则第二依存关系和匹配关键词的第一依存关系不匹配。当计算得到第二依存关系和匹配关键词的第一依存关系的匹配度为100％时，也就是第二依存关系和匹配关键词的第一依存关系完全一致，如第二依存关系“明天-定中关系-去”和匹配关键词“去”的第一依存关系“明天-定中关系-去”，则第二依存关系和匹配关键词“去”的第一依存关系相匹配。

又如，匹配关键词“去”的第一依存关系为“明天-定中关系-去”，第二依存关系为“时间名词-定中关系-前往类”，当匹配度阈值为80％时。当计算得到第二依存关系和匹配关键词“去”的第一依存关系的匹配度为85％时，85％大于80％，则第二依存关系和匹配关键词“去”的第一依存关系相匹配。

可以理解的是，严格匹配正确率较高，但是较为死板，需要的第二依存关系数量较多；相似匹配允许待处理语句与参考语句之间的冗余，需要的第二依存关系较少，但正确率会受到算法和匹配度阈值取值的影响，正确率较低。

在本实施例中，通过设置匹配度阈值，根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息，平衡了数据库中添加在数据库中的第二依存关系的数量和匹配正确率之间的关系。

在一个实施例中，第一依存关系中包含关键词和对应的指向关键词，第二依存关系中包含参考词和对应的指向参考词；

根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息，包括：

步骤402，获取与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系作为目标依存关系，并将与目标依存关系的匹配度大于或等于匹配度阈值的第二依存关系作为参考依存关系。

在第一依存关系中，包含关键词和对应的指向关键词，以及关键词与对应的指向关键词之间的依存关系。例如，第一依存关系“明天-定中关系-去”中，关键词指的是“去”，指向关键词指的是“明天”，关键词“去”与对应的指向关键词“明天”之间的依存关系为定中关系，并且关键词“去”指向关键词“明天”，即指向关键词“明天”依存于关键词“去”。

相应地，在第二依存关系中，包含参考词和对应的指向参考词，以及参考词与对应的指向参考词之间的依存关系。

步骤404，根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息。

词性指的是词语的属性类别，如“明天”的词性为“时间名词”，“去”的词性为“谓语动词”，“北京”的词性为“地点名词”。

在获取目标依存关系与参考依存关系之后，根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性和第一分类标签获取目标信息。

例如，当待处理语句为“我们明天去北京。”，匹配关键词为“北京”，目标依存关系为“去-动宾关系-北京”，参考依存关系为“到-定中关系-地点”，并且指向关键词“去”的词性为“谓语动词”，指向参考词“到”为“谓语动词”。其中，动宾关系指的是指的是谓语和宾语的关系。因此，指向关键词“去”的词性与指向参考词的词性一致，并且根据“去”的第一分类标签为“前往类”，则可以得到待处理语句中的目标信息为“前往的地点是北京”。

在本实施例中，将匹配关键词的第一依存关系和第二依存关系进行匹配后，得到目标依存关系和参考依存关系，根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息，可以得到更加准确的目标信息。

在一个实施例中，根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息，包括：

步骤502，将目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性进行匹配。

可选地，词性的匹配可以是严格匹配，也可以是相似匹配。例如，当目标依存关系中的指向关键词的词性“去”与参考依存关系中的指向参考词“到”的词性都为“谓语动词”时，则词性的匹配为严格匹配时“去”和“到”词性相匹配。当目标依存关系中的指向关键词的词性为“时间名词”，参考依存关系中的指向参考词的词性为“地点名词”，则可以预设匹配度阈值，当词性“时间名词”与词性“地点名词”之间的匹配度，当匹配度大于匹配度阈值时，目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性相匹配。

步骤504，将与指向参考词的词性相匹配的指向关键词作为目标关键词。

步骤506，根据目标关键词和第一分类标签得到目标信息。

当匹配词关键词的第一依存关系和第二依存关系相匹配时，得到目标依存关系和参考依存关系，将与指向参考词的词性相匹配的指向关键词作为目标关键词，根据目标关键词和第一分类标签得到目标信息，提高了获取的目标信息的准确性。

应该理解的是，虽然图2-5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-5中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种信息获取装置，包括：待处理语句获取模块602、关键词提取模块604、分类标签匹配模块606、依存关系匹配模块608和目标信息获取模块610，其中：

待处理语句获取模块602，用于获取待处理语句。

关键词提取模块604，用于提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系。

分类标签匹配模块606，用于将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配。

依存关系匹配模块608，用于将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配。

目标信息获取模块610，用于根据与第二依存关系相匹配的匹配关键词的第一依存关系和第一分类标签得到目标信息。

上述信息获取装置，提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，用户预先将需要获取的信息对应的第二依存关系、第一分类标签和关键词添加在数据库中，当获取到与数据库中的第二分类标签相匹配的第一分类标签对应的匹配关键词，并且该匹配关键词的第一依存关系与数据库中的第二依存关系相匹配时，可以获取到与匹配关键词具有依存关系的目标信息，得到的目标信息不仅包含用户需要的匹配关键词的第一分类标签，还根据各个关键词的依存关系进行分析，更加提高了信息获取的准确性。

在一个实施例中，如图7所示，提供了一种信息获取装置，包括：待处理语句获取模块702、词分类器建立模块704、关键词提取模块706、目标意图获取模块708、分类标签匹配模块710、依存关系匹配模块712和目标信息获取模块714，其中：

待处理语句获取模块702，用于获取待处理语句。

词分类器建立模块704，用于获取训练语句，并将训练语句进行分词得到训练语句中的训练词；通过深度神经网络对各个训练词进行计算得到矢量词，并根据各个矢量词建立词分类器。

关键词提取模块706，用于提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系。

目标意图获取模块708，用于根据预先训练的意图分类器对待处理语句进行意图分析，得到待处理语句的目标意图；获取目标意图对应的参考语句；提取参考语句中的参考词，并得到各个参考词的第二分类标签以及第二分类标签对应的第二依存关系。

分类标签匹配模块710，用于将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配。

依存关系匹配模块712，用于将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配。

目标信息获取模块714，用于根据与第二依存关系相匹配的匹配关键词的第一依存关系和第一分类标签得到目标信息。

上述信息获取装置，提取待处理语句中的关键词，并得到各个关键词的第一依存关系，通过词分类器对关键词进行分类得到第一分类标签，用户预先获取待处理语句的目标意图，将目标意图对应的第二依存关系、第一分类标签和关键词添加在数据库中，当获取到与数据库中的第二分类标签相匹配的第一分类标签对应的匹配关键词，并且该匹配关键词的第一依存关系与数据库中的第二依存关系相匹配时，可以获取到与匹配关键词具有依存关系的目标信息，得到的目标信息不仅包含在目标意图下用户需要的匹配关键词的第一分类标签，还根据各个关键词的依存关系进行分析，更加提高了信息获取的准确性。

在一个实施例中，上述关键词提取模块706还用于对待处理语句进行依存句法分析，提取待处理语句中的关键词，并得到各个关键词的第一依存关系；通过词分类器得到各个关键词的第一分类标签。

在一个实施例中，上述目标信息获取模块714还用于根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息。

在一个实施例中，上述目标信息获取模块714还用于获取与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系作为目标依存关系，并将与目标依存关系的匹配度大于或等于匹配度阈值的第二依存关系作为参考依存关系；根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息。

在一个实施例中，上述目标信息获取模块714还用于将目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性进行匹配；将与指向参考词的词性相匹配的指向关键词作为目标关键词；根据目标关键词和第一分类标签得到目标信息。

关于信息获取装置的具体限定可以参见上文中对于信息获取方法的限定，在此不再赘述。上述信息获取装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种信息获取方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取待处理语句；提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系；将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配；根据与第二依存关系相匹配的匹配关键词所对应的第一依存关系和第一分类标签得到目标信息。

在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：对待处理语句进行依存句法分析，提取待处理语句中的关键词，并得到各个关键词的第一依存关系；通过词分类器得到各个关键词的第一分类标签。

在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：获取训练语句，并将训练语句进行分词得到训练语句中的训练词；通过深度神经网络对各个训练词进行计算得到矢量词，并根据各个矢量词建立词分类器。

在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：根据预先训练的意图分类器对待处理语句进行意图分析，得到待处理语句的目标意图；获取目标意图对应的参考语句；提取参考语句中的参考词，并得到各个参考词的第二分类标签以及第二分类标签对应的第二依存关系。

在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息。

在其中一个实施例中，第一依存关系中包含关键词和对应的指向关键词，第二依存关系中包含参考词和对应的指向参考词；处理器执行计算机程序时还实现以下步骤：获取与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系作为目标依存关系，并将与目标依存关系的匹配度大于或等于匹配度阈值的第二依存关系作为参考依存关系；根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息。

在其中一个实施例中，处理器执行计算机程序时还实现以下步骤：将目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性进行匹配；将与指向参考词的词性相匹配的指向关键词作为目标关键词；根据目标关键词和第一分类标签得到目标信息。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取待处理语句；提取待处理语句中的关键词，并得到各个关键词的第一依存关系和第一分类标签，其中，第一依存关系用于表示待处理语句中包含的关键词之间的联系；将待处理语句中各个关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；将与数据库中的第二分类标签相匹配的第一分类标签所对应的关键词作为匹配关键词，并将匹配关键词的第一依存关系与第二分类标签对应的第二依存关系进行匹配；根据与第二依存关系相匹配的匹配关键词所对应的第一依存关系和第一分类标签得到目标信息。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：对待处理语句进行依存句法分析，提取待处理语句中的关键词，并得到各个关键词的第一依存关系；通过词分类器得到各个关键词的第一分类标签。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：获取训练语句，并将训练语句进行分词得到训练语句中的训练词；通过深度神经网络对各个训练词进行计算得到矢量词，并根据各个矢量词建立词分类器。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据预先训练的意图分类器对待处理语句进行意图分析，得到待处理语句的目标意图；获取目标意图对应的参考语句；提取参考语句中的参考词，并得到各个参考词的第二分类标签以及第二分类标签对应的第二依存关系。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：根据与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系和第一分类标签得到目标信息。

在一个实施例中，第一依存关系中包含关键词和对应的指向关键词，第二依存关系中包含参考词和对应的指向参考词；计算机程序被处理器执行时还实现以下步骤：获取与第二依存关系的匹配度大于或等于匹配度阈值的匹配关键词的第一依存关系作为目标依存关系，并将与目标依存关系的匹配度大于或等于匹配度阈值的第二依存关系作为参考依存关系；根据目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性，以及第一分类标签获取目标信息。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：将目标依存关系中的指向关键词的词性与参考依存关系中的指向参考词的词性进行匹配；将与指向参考词的词性相匹配的指向关键词作为目标关键词；根据目标关键词和第一分类标签得到目标信息。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种信息获取方法，所述方法包括：

获取待处理语句；

提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，其中，所述第一依存关系用于表示所述待处理语句中包含的关键词之间的联系；所述第一分类标签表示所述关键词内容的信息类别的标签；

将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；所述第二分类标签指的是用户需要获取的信息所对应的关键词的标签；

根据与所述第二依存关系相匹配的所述匹配关键词所对应的第一依存关系和所述第一分类标签得到目标信息。

2.根据权利要求1所述的方法，其特征在于，所述提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，包括：

通过词分类器得到各个所述关键词的第一分类标签。

3.根据权利要求2所述的方法，其特征在于，所述根据词分类器得到各个所述关键词的第一分类标签之前，还包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配之前，还包括：

获取所述目标意图对应的参考语句；

5.根据权利要求1至4任一项所述的方法，其特征在于，所述根据与所述第二依存关系相匹配的所述匹配关键词的第一依存关系和所述第一分类标签得到目标信息，包括：

6.根据权利要求5所述的方法，其特征在于，所述第一依存关系中包含关键词和对应的指向关键词，所述第二依存关系中包含参考词和对应的指向参考词；

7.根据权利要求6所述的方法，其特征在于，所述根据所述目标依存关系中的指向关键词的词性与所述参考依存关系中的指向参考词的词性，以及所述第一分类标签获取目标信息，包括：

根据所述目标关键词和所述第一分类标签得到目标信息。

8.一种信息获取装置，其特征在于，所述装置包括：

待处理语句获取模块，用于获取待处理语句；

关键词提取模块，用于提取所述待处理语句中的关键词，并得到各个所述关键词的第一依存关系和第一分类标签，其中，所述第一依存关系用于表示所述待处理语句中包含的关键词之间的联系；所述第一分类标签表示所述关键词内容的信息类别的标签；

分类标签匹配模块，用于将所述待处理语句中各个所述关键词的第一分类标签逐一与数据库中的第二分类标签进行匹配；所述第二分类标签指的是用户需要获取的信息所对应的关键词的标签；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。