CN108763221B

CN108763221B - 一种属性名表征方法及装置

Info

Publication number: CN108763221B
Application number: CN201810638378.2A
Authority: CN
Inventors: 李锐; 刘权; 陈志刚
Original assignee: iFlytek Co Ltd
Current assignee: iFlytek Co Ltd
Priority date: 2018-06-20
Filing date: 2018-06-20
Publication date: 2022-05-17
Anticipated expiration: 2038-06-20
Also published as: CN108763221A

Abstract

本申请公开了一种属性名表征方法及装置，该方法包括：预先构建一属性名表征模型，该属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量，在实际使用时，可以利用该属性名表征模型，对待表征的目标属性名进行向量表征，得到对应于目标属性名的表征向量。在本申请中，由于含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，当模型构建时考虑了属性值信息时，该属性名表征模型可以使含义相同或相近的目标属性名对应于相同或相近的表征向量。

Description

一种属性名表征方法及装置

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种属性名表征方法及装置。

背景技术

百科实体指的是一种结构化的文档中的词条名称，比如百度百科、搜狗百科、维基百科等热门知识共享网站上的词条名称，百科实体的属性名是指每个词条页面下具有结构化数据的信息框(infobox)中的属性名称。

对属性名进行合理有效的向量化表征，能方便利用属性名对百科中的实体进行识别并区分各种类型的实体，比如人名、地名、组织名等类型。而对这些实体进行准确区分，有助于进一步从百科中挖掘出更丰富的信息(比如实体关系、语义关系等)进行知识问答，在进行知识问答时，属性名的分类非常重要。

然而，当采用现有方法对属性名进行向量化表征时，一般将属性名作为一个词，并生成该词的词向量，然后利用该词向量得到属性名的表征向量。但是，这种方法很难基于表征向量，将含义相同或相近的属性名分到同一类，例如，属性名“原居住地”与“籍贯”，属于在含义上相同或相近的词，但以词向量为基础对二者进行向量化表征后，很难基于得到的表征向量，将二者作为相同或相近的词。

发明内容

本申请实施例的主要目的在于提供一种属性名表征方法及装置，能够使含义相同或相近的属性名分到同一类。

本申请实施例提供了一种属性名表征方法，包括：

获取待表征的目标属性名；

利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量；其中，所述属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量。

可选的，所述属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值。

可选的，按照下述方式训练得到所述属性名表征模型：

利用所述属性集合中的全部或部分样本属性对，对初始构建的属性名表征模型与属性值表征模型进行联合训练，得到训练结束后的属性名表征模型。

可选的，所述对初始构建的属性名表征模型与属性值表征模型进行联合训练，包括：

从所述属性集合中依次获取样本属性对，将当前获取的样本属性对作为训练样本；

将所述训练样本中的样本属性名，作为当前的属性名表征模型的输入；

将所述训练样本中的样本属性值，作为当前的属性值表征模型的输入；

根据所述属性名表征模型与所述属性值表征模型输出的语义信息，预测所述训练样本中的样本属性名与样本属性值是否匹配，得到预测匹配结果；

根据所述训练样本的预测匹配结果与实际匹配结果，更新所述属性名表征模型与所述属性值表征模型的模型参数，直到满足训练结束条件为止。

可选的，所述根据所述属性名表征模型与所述属性值表征模型输出的语义信息，预测所述训练样本中的样本属性名与样本属性值是否匹配，包括：

根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度；

根据所述相关度，预测所述训练样本中的样本属性名与样本属性值是否匹配。

可选的，所述根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度，包括：

若所述属性名表征模型与所述属性值表征模型为双向神经网络模型，则获取所述属性名表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息，并获取所述属性值表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息；

根据获取的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度。

可选的，若所述属性名表征模型为双向神经网络模型，则所述目标属性名的表征向量为所述属性名表征模型的最后一个前向隐层输出的语义信息。

本申请实施例还提供了一种属性名表征装置，包括：

属性名获取单元，用于获取待表征的目标属性名；

向量表征单元，用于利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量；其中，所述属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量。

可选的，所述装置还包括：

模型训练单元，用于利用所述属性集合中的全部或部分样本属性对，对初始构建的属性名表征模型与属性值表征模型进行联合训练，得到训练结束后的属性名表征模型。

可选的，所述模型训练单元包括：

样本获取子单元，用于从所述属性集合中依次获取样本属性对，将当前获取的样本属性对作为训练样本；

样本输入子单元，用于将所述训练样本中的样本属性名，作为当前的属性名表征模型的输入；将所述训练样本中的样本属性值，作为当前的属性值表征模型的输入；

匹配预测子单元，用于根据所述属性名表征模型与所述属性值表征模型输出的语义信息，预测所述训练样本中的样本属性名与样本属性值是否匹配，得到预测匹配结果；

参数更新子单元，用于根据所述训练样本的预测匹配结果与实际匹配结果，更新所述属性名表征模型与所述属性值表征模型的模型参数，直到满足训练结束条件为止。

可选的，所述匹配预测子单元包括：

相关度确定子单元，用于根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度；

结果预测子单元，用于根据所述相关度，预测所述训练样本中的样本属性名与样本属性值是否匹配。

可选的，所述相关度确定子单元包括：

语义信息获取子单元，用于若所述属性名表征模型与所述属性值表征模型为双向神经网络模型，则获取所述属性名表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息，并获取所述属性值表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息；

样本相关度确定子单元，用于根据获取的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度。

本申请实施例还提供了一种属性名表征装置，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行上述属性名表征方法中的任意一种实现方式。

本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述属性名表征方法中的任意一种实现方式。

本申请实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述属性名表征方法中的任意一种实现方式。

本申请实施例提供了一种属性名表征方法及装置，预先构建一属性名表征模型，该属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量，并且，属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值；在实际使用时，可以利用该属性名表征模型，对待表征的目标属性名进行向量表征，得到对应于目标属性名的表征向量。在本实施例中，由于含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，当模型构建时考虑了属性值信息时，该属性名表征模型可以使含义相同或相近的目标属性名对应于相同或相近的表征向量。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种属性名表征方法的流程示意图；

图2为本申请实施例提供的百度百科词条的页面信息分布示意图；

图3为本申请实施例提供的属性名与属性值的示意图；

图4为本申请实施例提供的属性名表征模型的训练方法的流程示意图；

图5为本申请实施例提供的双网络架构示意图；

图6为本申请实施例提供的属性名表征模型的示意图；

图7为本申请实施例提供的一种属性名表征装置的组成示意图；

图8为本申请实施例提供的一种属性名表征装置的硬件结构示意图。

具体实施方式

实际应用中，对属性名进行合理有效的向量化表征，能方便利用属性名对百科中的实体进行识别并区分各种类型的实体，比如人名、地名、组织名等类型。而对这些实体进行准确区分，有助于进一步从百科中挖掘出更丰富的信息(比如实体关系、语义关系等)用于知识问答等实际场景。在进行知识问答时，属性名的分类非常重要，这是因为，同一个属性名可以使用不同表达方式，为了找到答案，需要预先将含义相同或相近的属性名分到同一类，以覆盖更多用户的说法，例如，假设属性名“出生地”和“籍贯”被分到同一类，当有用户提问“齐白石的籍贯在哪”，便可以通过“出生地”找到答案，即“湖南长沙府湘潭”。

然而，当采用现有方法对属性名进行向量化表征时，一般将属性名作为一个词，并生成该词的词向量，然后利用该词向量得到属性名的表征向量，但是，这种方法很难基于表征向量，将含义相同或相近的属性名分到同一类，从而无法用于知识问答等实际场景。

为了解决上述缺陷，本申请实施例提供了一种属性名表征方法，在该方法中，预先构建一种完全无监督的属性名表征模型，由于含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，构建属性名表征模型时考虑了属性值信息，故而，在利用属性名表征模型对属性名进行向量化表征时，可以使含义相同或相近的属性名具有相同或相似的表征向量，从而可以将具有相同或相似表征向量的属性名分到同一类，即，实现了将含义相同或相近的属性名分到同一类的目的。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

第一实施例

参见图1，为本实施例提供的一种属性名表征方法的流程示意图，该方法包括以下步骤：

S101：获取待表征的目标属性名。

在本实施例中，将需要进行向量表征的属性名定义为目标属性名，该目标属性名可以是实体属性名、或其它类型的属性名。

为便于对实体属性名进行理解，现举例说明：

如图2所示的百度百科词条的页面信息分布示意图，图2为通过“百度”网站搜索实体名“齐白石”得到的部分页面信息，该页面的信息框(Infobox)中包含与“齐白石”相关的属性名和属性值。例如，“中文名”为属性名，该属性名的属性值为“齐白石”；又例如，“出生地”为属性名，该属性名的属性值为“湖南长沙府湘潭”，如图3所示。

S102：利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量。

在本实施例中，需要预先构建一属性名表征模型，当需要对目标属性名进行向量表征时，便可以将目标属性名作为该属性名表征模型的输入，使属性名表征模型对目标属性名进行向量表征，从而得到目标属性名的表征向量。

为了构建属性名表征模型，需要收集大量的样本属性对，以形成属性集合，该属性集合包括多组正确匹配的样本属性对，该样本属性对包括样本属性名与样本属性值。其中，关于正确匹配的样本属性对，可以是百科词条信息框中的属性名-属性值对，比如图3所示的相互对应的属性名-属性值对，如“中文名”-“齐白石”。

其中，为了收集正确匹配的样本属性对，可以预先收集大量的百科词条数据，并从中解析出每个实体页面中的信息框，比如图2所示的信息框，信息框中包含相应实体的属性名-属性值对。具体解析时，可以采用现有或未来出现的解析方法，例如，假设某实体页面属于超级文本标记语言(HyperText Markup Language，简称HTML)页面，对于描述HTML页面的HTML文档，可以根据HTML文档中的标签来解析HTML文档，以从HTML文档中解析出信息框所在标签的开始位置和结束位置，从而得到信息框中各个属性名-属性值对的标签(比如属性名的标签为<dt class＝"basicInfo-item name">)，进而通过这些标签信息收集到信息框中的属性名-属性值对。

当收集形成上述属性集合后，便可以利用属性集合中的样本属性对训练得到属性名表征模型，并且，该属性名表征模型能够使含义相同或相近的属性名对应于相同或相近的表征向量。因此，对于具有相同或相近含义的不同目标属性名，当利用属性名表征模型对这些目标属性名进行向量表征时，这些目标属性名会对应相同或相近的表征向量。

具体来讲，考虑到含义相同或相近的属性名，通常会对应相同或相近的属性值，从这一点出发，在构建属性名表征模型时，应考虑属性值的信息，也就是说，使初始构建的属性名表征模型，不断地自行学习出具有相同或相近属性值的属性名的语义表征，模型在自学习的过程中会不断调整模型参数，基于上述对属性名和属性值的联合学习结果，属性名表征模型能够使含义相同或相近含义的属性名具有相同或相近的表征向量。

举例说明，如表1所示所示的属性名-属性值对应关系：

属性名(prop-name)	属性值(prop-value)
		出生地	江苏、南京
籍贯	江苏、南京
		原籍	河北、石家庄

其中，在人物实体A的页面下，其信息框中的“出生地”为“江苏、南京”；在人物实体B的页面下，其信息框中的“籍贯”为“江苏、南京”；在人物实体C的页面下，其信息框中的“原籍”也为“河北、石家庄”。可见，由于“出生地”、“籍贯”、“原籍”属于含义相同或相近的属性名，使得“江苏、南京”、“江苏、南京”、“河北、石家庄”在类型上相同或相近，故而，通过属性名表征模型对“出生地”、“籍贯”、“原籍”进行向量表征后，这三者的表征向量在特征空间中应该靠的比较相近，即这三者具有相同或相近的表征向量。

综上，本实施例提供的一种属性名表征方法，预先构建一属性名表征模型，该属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量，并且，属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值；在实际使用时，可以利用该属性名表征模型，对待表征的目标属性名进行向量表征，得到对应于目标属性名的表征向量。在本实施例中，由于含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，当模型构建时考虑了属性值信息时，该属性名表征模型可以使含义相同或相近的目标属性名对应于相同或相近的表征向量。

第二实施例

需要说明的是，本实施例将对如何构建属性名表征模型进行具体介绍。

在本实施例中，第一实施例中提及的属性集合中还可以包括多组错误匹配的样本属性对，关于错误匹配的样本属性对，可以是某属性名与其它属性名对应的属性值形成的属性名-属性值对，比如图3所示的非相互对应的属性名-属性值对，如“祖籍”-“中国”。

在构建属性名表征模型时，可以按照下述方式训练得到属性名表征模型：利用所述属性集合中的全部或部分样本属性对，对初始构建的属性名表征模型与属性值表征模型进行联合训练，得到训练结束后的属性名表征模型。具体来讲，可以先构建一个经参数初始化的属性名表征模型以及一个经参数初始化的属性值表征模型，然后对该属性名表征模型以及属性值表征模型进行联合训练，在训练过程中，依次从属性集合中获取一样本属性对，并对每一样本属性对的匹配结果进行预测，之后，根据预测匹配结果与预先标记的实际匹配结果之间的差异，对该属性名表征模型以及属性值表征模型进行多轮的参数更新，当模型的参数变化量小于预设阈值或训练轮数满足预设条件时，便可以结束训练，从而得到可以使含义相同或相近含义的属性名对应于相同或相近的表征向量的属性名表征模型。

在本实施例的一种实现方式中，如图4所示，可以按照下述方式训练得到所述属性名表征模型，包括以下步骤：

S401：从所述属性集合中获取一组样本属性对，作为训练样本。

可以从属性集合中随机获取一组样本属性对，或者按照属性对的编码顺序，从属性集合中获取一组样本属性对，将本次获取的样本属性对作为本轮的训练样本。

S402：将所述训练样本中的样本属性名，作为当前的属性名表征模型的输入；将所述训练样本中的样本属性值，作为当前的属性值表征模型的输入。

在本实施例中，可以预先构建一个与属性名相关的网络模型，称为属性名表征模型，同时，可以预先构建一个与属性值相关的网络模型，称为属性值表征模型，这两个网络模型的参数是不共享的。其中，属性名表征模型和属性值表征模型可以是双向神经网络模型，具体可以是双向长短期记忆网络(Long Short-Term Memory，简称LSTM)模型，比如图5所示的双网络架构示意图，这两个网络模型可以分别对属性名和属性值的语义信息进行双向表征。

需要说明的是，通过循环执行本实施例的各个步骤，可以对属性名表征模型和属性值表征模型进行多轮训练，以不断调整二者的模型参数，训练结果是期望根据属性名表征模型与属性值表征模型的输出信息，能够对不同属性对实际具有的正确匹配关系或错误匹配关系进行准确识别。

在进行本轮训练时，将训练样本中的样本属性名p和样本属性值q，分别输入到属性名表征模型和属性值表征模型。在本实施例的一种实现方式中，本步骤S402具体可以包括：将训练样本中的样本属性值的各个单字的字向量，作为当前的属性值表征模型的输入，将训练样本中的样本属性名的各个单字的字向量，作为当前的属性名表征模型的输入。

在本实现方式中，对于训练样本中的样本属性名p，可以将该样本属性名p以字为单位进行切分，从而得到样本属性名p中的每个单字，然后对每个单字进行向量化，得到每个单字的字向量；同样地，对于训练样本中的样本属性值q，可以将该样本属性值q以字为单位进行切分，从而得到样本属性值q中的每个单字，然后对每个单字进行向量化，得到每个单字的字向量。例如，当样本属性名p为“出生地”、样本属性值q为“江苏、南京”时，进行单字切分后，分别得到样本属性名p中的各个单字，即“出”、“生”、“地”，以及，得到样本属性值q的各个单字，即“江”、“苏”、“南”、“京”；然后，对各个单字进行向量化，需要说明的是，本实施例可以采用现有的或未来出现的任意一种向量化方法对单字进行向量化。

S403：根据所述属性名表征模型与所述属性值表征模型输出的语义信息，预测所述训练样本中的样本属性名与样本属性值是否匹配，得到预测匹配结果。

在本实施例中，可以进一步对属性名表征模型与属性值表征模型输出的语义信息进行处理，得到表征样本属性名p与样本属性值q是否匹配的匹配信息，基于该匹配信息确定样本属性名p与样本属性值q是否匹配，从而得到预测匹配结果。需要说明的是，由于已经预先对样本属性名p与样本属性值q的实际匹配结果进行了标记，即二者可能是正确匹配的样本属性对、也可能是错误匹配的样本属性对，因此，当该预测匹配结果与预先标记的匹配结果不同时，说明该预测匹配结果是错误的预测结果，反之则是正确的预测结果。

在本实施例的一种实现方式中，本步骤S403具体可以包括：根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度；根据所述相关度，预测所述训练样本中的样本属性名与样本属性值是否匹配。

在本实现方式中，若样本属性名p与样本属性值q被预先标记为正确匹配的样本属性对，则通常情况下，样本属性名p与样本属性值q的相关度值比较高，反之，若样本属性名p与样本属性值q被预先标记为错误匹配的样本属性对，则通常情况下，样本属性名p与样本属性值q的相关度值比较低，因此，可以预先设置一个相关度阈值，当确定样本属性名p与样本属性值q的相关度值大于该相关度阈值时，则预测样本属性名p与样本属性值q是匹配的，否则认为是不匹配的。

在上述实现方式中的“根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度”，具体可以包括步骤A-B：

步骤A：若所述属性名表征模型与所述属性值表征模型为双向神经网络模型，则获取所述属性名表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息，并获取所述属性值表征模型的最后一个前向隐层和最后一个后向隐层输出的语义信息。

为便于理解，可以将样本属性名p的各个单字用{x₁,x₂,…,x_m}表示，其中，x₁,x₂,…,x_m依次表示样本属性名p的第1个单字、第2个单字…第m个单字。

如图5所示，假设属性名表征模型是具有双向LSTM的模型，pi表示样本属性名p中第i个单字的字向量，其中，i＝1、2…m，m表示样本属性名p中的单字总数。可以将各个单字的字向量输入至双向LSTM，由于双向LSTM包括前向LSTM和后向LSTM，前向LSTM会顺序读入样本属性名p中各个单字的字向量，从而产生前向隐层序列

其中，

表示样本属性名p的前向信息，后向LSTM会逆序读入样本属性名p的各个单字的字向量，从而产生后向隐层序列

其中，

表示样本属性名p的后向信息。

同样地，可以将样本属性值q的各个单字用{x₁,x₂,…,x_n}表示，其中，x₁,x₂,…,x_n依次表示样本属性名p的第1个单字、第2个单字…第n个单字。

如图5所示，假设属性值表征模型是具有双向LSTM的模型，pi表示样本属性值q中第i个单字的字向量，其中，i＝1、2…n，n表示样本属性值q中的单字总数。可以将各个单字的字向量输入至双向LSTM，由于双向LSTM包括前向LSTM和后向LSTM，前向LSTM会顺序读入样本属性值q中各个单字的字向量，从而产生前向隐层序列

其中，

表示样本属性值q的前向信息，后向LSTM会逆序读入样本属性值q的各个单字的字向量，从而产生后向隐层序列

其中，

表示样本属性值q的后向信息。

可见，通过双向LSTM，便可以得到关于样本属性名p的最后一个前向隐层表示

以及最后一个后向隐层表示

可以将二者作为属性名表征模型输出的语义信息；同样地，可以得到关于样本属性值q的最后一个前向隐层表示

以及最后一个后向隐层表示

可以将二者作为属性值表征模型输出的语义信息。

步骤B：根据获取的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度。

如图5所示，可以将属性名表征模型的最后一个后向隐层表示

以及属性值表征模型的最后一个后向隐层表示

进行“+”操作，即，将

与

的向量进行拼接，得到前向向量h_α：

可以将属性名表征模型的最后一个前向隐层表示

以及属性值表征模型的最后一个前向隐层表示

进行“*”操作，得到后向向量h_β：

最后，将前向向量h_α与后向向量h_β进行拼接，得到相关度表征向量h：

h＝[h_α，h_β]

可见，可以利用相关度表征向量h，来表示样本属性名p与样本属性值q的相关度。

接下来，如图5所示，将上述相关度向量h输入至一个全连接层，该全连接层的输出结果，即为样本属性名p与样本属性值q是否配对正确，输出结果可以使用0/1表示，其中，0代表样本属性名p与样本属性值q配对错误(即不匹配)，1表示样本属性名p与样本属性值q配对正确(即匹配)。

S404：根据所述训练样本的预测匹配结果与实际匹配结果，更新所述属性名表征模型与所述属性值表征模型的模型参数。

关于样本属性名p与样本属性值q的匹配情况，通过步骤S403具有一个预测匹配结果，还具有一个预先标记的实际匹配结果，当这两个匹配结果存在差异时，可以对属性名表征模型与属性值表征模型进行参数更新，作为一种示例，可以根据上述步骤B计算得到的相关度大小(比如相关度表征向量h)进行模型参数更新。

S405：判断所述属性名表征模型与所述属性值表征模型是否满足训练结束条件；若是，则结束训练；若否，则执行步骤S406。

在本实施例中，当属性名表征模型与所述属性值表征模型的参数变化量小于预设阈值或训练轮数满足预设条件时，便可以结束训练，从而训练得到最终的属性名表征模型。可以理解的是，在实际使用过程中，即在对不同目标属性名进行向量表征后，还可以基于向量表征结果，对属性名表征模型进一步进行参数更新，以使属性名表征模型能够在更大程度上使含义相同或相近的属性名对应于相同或相近的表征向量，即，使属性名表征模型输出的表征向量的准确率更高。

需要说明的是，属性名表征模型输出的是样本属性名的语义信息，即输出的是样本属性名的表征向量，属性值表征模型输出的是样本属性值的语义信息，即输出的是样本属性值的表征向量。考虑到含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，对于相同或相近的样本属性值，属性值表征模型会对应输出相同或相近的表征向量，在模型训练时，为了能够正确预测样本属性名与样本属性值之间的匹配情况，故而，对于相同或相近的样本属性名，属性名表征模型也应输出相同或相近的表征向量。这样，当训练结束后，属性名表征模型便可以作为属性名表征模型，用于使含义相同或相近的属性名对应于相同或相近的表征向量。

在本实施例的一种实现方式中，若所述属性名表征模型为双向神经网络模型，则所述目标属性名的表征向量为所述属性名表征模型的最后一个前向隐层输出的语义信息。在本实现方式中，当将第一实施例中的目标属性名输入到属性名表征模型后，属性名表征模型的最后一个前向隐层输出的语义信息，实际上是目标属性名的表征向量，如图5所示，若属性名表征模型是具有双向LSTM的属性名表征模型，也即图6所示的网络模型，可以将前向LSTM的最后一个前向隐层输出的表征向量，作为目标属性名的表征向量。

S406：从所述属性集合中获取下一组样本属性对，作为所述训练样本，继续执行步骤S402。

若没有达到模型训练结束条件，则继续从属性集合中获取下一组样本属性对。具体获取时，可以从未获取过的样本属性对中随机获取一组样本属性对，作为下一轮的训练样本；或者，基于样本属性对的编码顺序，从未获取过的样本属性对中获取下一组样本属性对，作为下一轮的训练样本。然后，继续执行步骤S402以开始下一轮的模型训练。

综上，在构建属性名表征模型时，对于属性集合中的全部或部分样本属性对，可以根据各个样本属性对的预测匹配结果与实际匹配结果，训练得到属性名表征模型，具体可以利用属性名表征模型以及属性值表征模型进行联合训练，从而训练得到最终的属性名表征模型。在本实施例中，由于含义相同或相近的属性名，通常会对应相同或相近的属性值，因此，当模型构建时考虑了属性值信息时，该属性名表征模型可以使含义相同或相近的目标属性名对应于相同或相近的表征向量。

第三实施例

本实施例将对一种属性名表征装置进行介绍，相关内容请参见上述方法实施例。

参见图7，为本实施例提供的一种属性名表征装置的组成示意图，该属性名表征装置700包括：

属性名获取单元701，用于获取待表征的目标属性名；

向量表征单元702，用于利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量；其中，所述属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量。

在本实施例的一种实现方式中，所述属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值。

在本实施例的一种实现方式中，所述装置700还包括：

在本实施例的一种实现方式中，所述模型训练单元包括：

在本实施例的一种实现方式中，所述匹配预测子单元包括：

在本实施例的一种实现方式中，所述相关度确定子单元包括：

在本实施例的一种实现方式中，若所述属性名表征模型为双向神经网络模型，则所述目标属性名的表征向量为所述属性名表征模型的最后一个前向隐层输出的语义信息。

第四实施例

本实施例将对另一种一种属性名表征装置进行介绍，相关内容请参见上述方法实施例。

参见图8，为本实施例提供的一种属性名表征装置的硬件结构示意图，所述语音意图识别装置800包括存储器801和接收器802，以及分别与所述存储器801和所述接收器802连接的处理器803，所述存储器801用于存储一组程序指令，所述处理器803用于调用所述存储器801存储的程序指令执行如下操作：

获取待表征的目标属性名；

在本实施例的一种实现方式中，所述处理器803还用于调用所述存储器801存储的程序指令执行如下操作：

在一些实施方式中，所述处理器803可以为中央处理器(Central ProcessingUnit，CPU)，所述存储器801可以为随机存取存储器(Random Access Memory，RAM)类型的内部存储器，所述接收器802可以包含普通物理接口，所述物理接口可以为以太(Ethernet)接口或异步传输模式(Asynchronous Transfer Mode，ATM)接口。所述处理器803、接收器802和存储器801可以集成为一个或多个独立的电路或硬件，如：专用集成电路(ApplicationSpecific Integrated Circuit，ASIC)。

进一步地，本实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行上述属性名表征方法中的任意一种实现方式。

进一步地，本实施例还提供了一种计算机程序产品，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行上述属性名表征方法中的任意一种实现方式。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到上述实施例方法中的全部或部分步骤可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者诸如媒体网关等网络通信设备，等等)执行本申请各个实施例或者实施例的某些部分所述的方法。

需要说明的是，本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下，在其它实施例中实现。因此，本申请将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims

1.一种属性名表征方法，其特征在于，包括：

获取待表征的目标属性名；

利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量；

其中，所述属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量；所述预先构建的属性名表征模型的训练过程为：对初始构建的属性名表征模型与属性值表征模型输出的语义信息进行处理，得到表征样本属性名与样本属性值是否匹配的预测匹配结果，根据所述预测匹配结果与实际匹配结果，更新所述属性名表征模型与所述属性值表征模型的模型参数，直到满足训练结束条件为止。

2.根据权利要求1所述的属性名表征方法，其特征在于，所述属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值。

3.根据权利要求2所述的属性名表征方法，其特征在于，按照下述方式训练得到所述属性名表征模型：

4.根据权利要求3所述的属性名表征方法，其特征在于，所述对初始构建的属性名表征模型与属性值表征模型进行联合训练，包括：

5.根据权利要求4所述的属性名表征方法，其特征在于，所述根据所述属性名表征模型与所述属性值表征模型输出的语义信息，预测所述训练样本中的样本属性名与样本属性值是否匹配，包括：

6.根据权利要求5所述的属性名表征方法，其特征在于，所述根据所述属性名表征模型与所述属性值表征模型输出的语义信息，确定所述训练样本中的样本属性名与样本属性值的相关度，包括：

7.根据权利要求1至6任一项所述的属性名表征方法，其特征在于，若所述属性名表征模型为双向神经网络模型，则所述目标属性名的表征向量为所述属性名表征模型的最后一个前向隐层输出的语义信息。

8.一种属性名表征装置，其特征在于，包括：

属性名获取单元，用于获取待表征的目标属性名；

向量表征单元，用于利用预先构建的属性名表征模型，对所述目标属性名进行向量表征，得到对应于所述目标属性名的表征向量；其中，所述属性名表征模型用于使含义相同或相近的属性名对应于相同或相近的表征向量；所述预先构建的属性名表征模型的训练过程为：对初始构建的属性名表征模型与属性值表征模型输出的语义信息进行处理，得到表征样本属性名与样本属性值是否匹配的预测匹配结果，根据所述预测匹配结果与实际匹配结果，更新所述属性名表征模型与所述属性值表征模型的模型参数，直到满足训练结束条件为止。

9.根据权利要求8所述的属性名表征装置，其特征在于，所述属性名表征模型是利用属性集合中的样本属性对训练而成的，所述属性集合包括多组正确匹配的样本属性对，所述样本属性对包括样本属性名与样本属性值。

10.根据权利要求9所述的属性名表征装置，其特征在于，所述装置还包括：

11.根据权利要求10所述的属性名表征装置，其特征在于，所述模型训练单元包括：

12.根据权利要求11所述的属性名表征装置，其特征在于，所述匹配预测子单元包括：

13.根据权利要求12所述的属性名表征装置，其特征在于，所述相关度确定子单元包括：

14.根据权利要求8至13任一项所述的属性名表征装置，其特征在于，若所述属性名表征模型为双向神经网络模型，则所述目标属性名的表征向量为所述属性名表征模型的最后一个前向隐层输出的语义信息。

15.一种属性名表征装置，其特征在于，包括：处理器、存储器、系统总线；

所述处理器以及所述存储器通过所述系统总线相连；

所述存储器用于存储一个或多个程序，所述一个或多个程序包括指令，所述指令当被所述处理器执行时使所述处理器执行权利要求1-7任一项所述的属性名表征方法。

16.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备执行权利要求1-7任一项所述的属性名表征方法。

17.一种计算机程序产品，其特征在于，所述计算机程序产品在终端设备上运行时，使得所述终端设备执行权利要求1-7任一项所述的属性名表征方法。