CN109189930A

CN109189930A - 文本特征提取及提取模型优化方法以及介质、装置和设备

Info

Publication number: CN109189930A
Application number: CN201811018106.9A
Authority: CN
Inventors: 方正; 周森; 朱浩齐; 杨卫强; 林洋港; 李净
Original assignee: Netease Hangzhou Network Co Ltd
Current assignee: Hangzhou Netease Zhiqi Technology Co Ltd
Priority date: 2018-09-01
Filing date: 2018-09-01
Publication date: 2019-01-11
Anticipated expiration: 2038-09-01
Also published as: CN109189930B

Abstract

本发明提供了一种文本特征提取模型的优化方法和文本特征提取方法以及介质、装置和计算设备。该文本特征提取模型的优化方法包括以下步骤：获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。本发明提高了文本语义分析和分类等应用任务的准确率和精准度。

Description

文本特征提取及提取模型优化方法以及介质、装置和设备

技术领域

本发明的实施方式涉及信息处理技术领域，更具体地，本发明的实施方式涉及文本特征提取及提取模型优化方法以及介质、装置和设备。

背景技术

本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

目前深度学习的技术方法已经广泛应用到图像、文本处理的各个领域，其中以自编码器、卷积神经网络、循环神经网络、长短期记忆网络为代表的深度学习技术因为非常良好的特征学习能力，被学术界和工业界广泛运用于图像分类、文本语义检测的实际项目中。然而传统的自编码器特征学习技术，忽视了实际数据的多视角特征，只能针对单一的特征进行网络训练和特征学习，因此忽视了数据多视角特征中大量有用的结构化信息。这些多视角特征，各自都携带了数据某一方面的信息特征，比如文本的词性特征具有表示词语词性搭配的规律信息，TF-IDF(term frequency-inverse document frequency，词频-逆文本频率指数)特征中具有文本中词的重要性的权重信息，判断联系方式存在与否的布尔特征隐含了文本内容的广告推广和邀约意图。这些含有不同方面信息的特征，相互之间具有信息补充的作用，能够更好、更全面地表示一条数据，从而能够帮助后续的文本语义分析分类等应用任务。而传统的自编码器技术只能对特征单个做处理，没有充分考虑文本数据中的多视角特征的关联辅助信息和差异性信息，只能对多视角特征做简单的向量连接作为输入，这样就丢失了很多数据内在的结构信息，因此存在很大的局限性，用传统自编码器技术融合得到的特征，不能充分利用数据的多视角特征结构来帮助后续的分类、聚类等机器学习任务。

而现有的其他一些相似应用的多视角特征融合技术也存在各自一些缺点。

Ye在2015年提出了ODAE(Orthogonal Denoising Autoencoders，正交去早自动编码器)方法，这种技术方法的只适用于特征之间有更多的独立正交结构信息的场景，在训练中强制性地将网络中的一部分系数置为零，而没有考虑并丢失了多视角特征之间的辅助结构信息，因此在多数应用场景下学习得到的特征并非是最优的。Wang提出了针对跨数据域迁移学习多视角特征融合的Coupled Marginalized Auto-encoders(耦合边缘化自动编码器)技术，该方法忽视了各个多视角特征之间的联系，也没有处理多视角特征在编码网络编码时的特征差异带来的不一致性，而且模型学习得到的特征表示也不具备非负性所具有可解释性。

现有文献中的许多多视角特征学习方法都是基于矩阵分解技术，或者特征子空间学习技术。Gao等人提出了通过联合非负矩阵分解的多视图聚类技术用来融合多视角特征。该技术充分利用了非负矩阵分解中数据矩阵和特征矩阵非负可解释的优势，通过各个视角数据矩阵的分解共享统一的数据低维空间矩阵，来进一步挖掘多视角特征之间的相关信息。然而该技术缺少对学习得到的特征做有力的低秩结构约束，在多个矩阵分解过程中容易受多视角特征各自带来的不一致性噪声的干扰，结果得到特征中不可避免地含有噪声和错误。Zhang等人提出了LT-MSC(Low-rank tensor constrained multiview subspaceclustering，低秩张量约束多视图子空间聚类)的针对多视角特征的低秩子空间学习技术，该方法很好的挖掘和利用了多视角特征之间的结构，提升了融合后的特征的表示能力。然而该技术方法，没有利用自编码器的编码网络来消除不同特征之间的差异性，训练学习得到的特征也缺乏非负可解释性。此外该方法只能以直推式的形式批量训练得到需要的数据特征，不能在新数据到来的时候，直接用模型参数归纳式地得到数据融合后的特征。

发明内容

为此，非常需要一种改进的文本特征提取方法，以至少能够结合数据多视角特征中大量有用的结构化信息来进行文本特征的提取。

在本上下文中，本发明的实施方式期望提供一种文本特征提取及提取模型优化方法以及介质、装置和设备。

在本发明实施方式的第一方面中，提供了一种文本特征提取模型的优化方法，包括：获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

在本发明的第一个实施例中，该方法包括以下步骤：根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的网络属性信息；其中，所述网络属性信息包括：编码网络参数值、编码网络偏置项参数值和解码网络参数值。

在本发明的第二实施例中，该方法还包括以下步骤：根据所述文本数据的第二特征矩阵对所述文本特征提取模型网络参数信息进行更新。

在本发明的第三个实施例中，该方法还包括以下步骤：根据所述第二特征矩阵得到解码网络参数重建误差函数；判断所述解码网络参数重建误差函数是否收敛。

在本发明的第四个实施例中，该方法还包括以下：当所述解码网络参数重建误差函数收敛或迭代次数大于或等于第一阈值时，根据所述第二特征矩阵得到整体重建误差函数，判断所述整体重建误差函数是否收敛。

在本发明实施方式的第二方面中，提供了一种计算机可读存储介质，存储有程序代码，所述程序代码当被处理器执行时，实现上述文本特征提取模型的优化方法。

在本发明实施方式的第三方面中，提供了一种计算设备，包括处理器和存储有程序代码的存储介质，所述程序代码当被处理器执行时，实现上述文本特征提取模型的优化方法。

在本发明实施方式的第四方面中，提供了一种文本特征提取方法，包括：获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；根据所述第二特征矩阵提取所述文本数据的文本特征。

在本发明的第二实施例中，该方法还包括以下步骤：根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的编码网络参数值；根据各个所述视角分别对应的第一特征矩阵和所述编码网络参数值得到各个所述视角分别对应的编码网络偏置项参数值。

在本发明的第三个实施例中，该方法还包括以下步骤：根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的解码网络参数值。

在本发明实施方式的第五方面中，提供了一种计算机可读存储介质，存储有程序代码，所述程序代码当被处理器执行时，实现上述文本特征提取方法。

在本发明实施方式的第六方面中，提供了一种计算设备，包括处理器和存储有程序代码的存储介质，所述程序代码当被处理器执行时，实现上述文本特征提取方法。

在本发明实施方式的第七个方面中，提供了一种文本特征提取模型的优化装置，包括：特征矩阵获取模块，被配置为获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；多视角特征融合模块，被配置为根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；优化数据输出模块，被配置为当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

在本发明实施方式的第八个方面中，提供了一种文本特征提取装置，包括：特征矩阵获取模块，被配置为获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；多视角特征融合模块，被配置为根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；特征提取模块，被配置为根据所述第二特征矩阵提取所述文本数据的文本特征。

根据本发明实施方式的文本特征提取模型的优化方法和文本特征提取方法，可以充分利用多视角特征各自所携带的信息特征，信息之间相互补充，融合得到的最终特征能够更好、更全面地表示一条数据，提高文本语义分析和分类等应用任务的准确率和精准度，为用户带来了更好的体验。

附图说明

通过参考附图阅读下文的详细描述，本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中，以示例性而非限制性的方式示出了本发明的若干实施方式，其中：

图1示意性地示出了根据本发明实施方式的文本特征提取模型的优化方法；

图2示意性地示出了根据本发明另一实施方式的文本特征提取模型的优化方法；

图3示意性地示出了根据本发明又一实施方式的文本特征提取模型的优化方法；

图4示意性地示出了根据本发明实施方式的文本特征提取方法；

图5示意性地示出了根据本发明另一实施方式的文本特征提取方法；

图6为根据本发明实施方式的文本特征提取方法的一个具体实施例；

图7为发明实施方式的文本特征提取方法应用于多视角自编码网络的一个具体实施例；

图8示意性地示出了根据本发明实施方式的计算机可读存储介质；

图9示意性地示出了根据本发明实施方式的文本特征提取模型的优化装置；

图10示意性地示出了根据本发明实施方式的计算设备；

在附图中，相同或对应的标号表示相同或对应的部分。

具体实施方式

下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解，给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明，而并非以任何方式限制本发明的范围。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

本领域技术人员知道，本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此，本公开可以具体实现为以下形式，即：完全的硬件、完全的软件(包括固件、驻留软件、微代码等)，或者硬件和软件结合的形式。

根据本发明的实施方式，提出了一种文本特征提取及提取模型优化方法以及介质、装置和设备。

在本文中，需要理解的是，附图中的任何元素数量均用于示例而非限制，以及任何命名都仅用于区分，而不具有任何限制含义。

下面参考本发明的若干代表性实施方式，详细阐释本发明的原理和精神。

发明概述

在多视角特征的信息融合过程中，本发明通过约束学习得到的特征具有非负性结构，使得特征更具有自然解释性和可加性，更加适合于分类任务的模型计算。此外，本发明通过低秩结构化来约束学习得到的新的特征矩阵，过滤掉多视角特征中携带的差异性噪声，保留了各个视角特征中一致性的信息分量，使得最终得到的特征更优质，更能准确地表达语义信息，从而使得语义分析和分类任务的结果更准确。

因此，根据本发明实施方式的文本特征提取模型的优化方法和文本特征提取方法，可以充分利用多视角特征各自所携带的信息特征，信息之间相互补充，融合得到的最终特征能够更好、更全面地表示一条数据，提高文本语义分析和分类等应用任务的准确率和精准度，为用户带来了更好的体验。

应用场景总览

本申请以图1所示的流程优化文本特征提取模型，然后输出文本特征提取模型优化后的各个视角分别对应的网络属性信息，以及输出第二特征矩阵作为文本特征提取模型优化后的网络数据矩阵。

本申请以图4所示的流程提取文本数据里的多视角特征，然后将这些多视角特征进行融合，输出融合后的文本特征。

在介绍了本发明的基本原理之后，下面具体介绍本发明的各种非限制性实施方式。

示例性方法

下面结合图1-3的应用场景以及图4-5的应用场景来描述根据本发明示例性实施方式的用于文本特征提取的方法。需要注意的是，上述应用场景仅是为了便于理解本发明的精神和原理而示出，本发明的实施方式在此方面不受任何限制。相反，本发明的实施方式可以应用于适用的任何场景。

如图1所示为根据本申请的实施方式的文本特征提取模型的优化方法，包括以下步骤：

S101：获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；

S102：根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；

S103：当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

作为一种可选的实施方式，当只有一个具有多视角特征的文本数据时，获取该文本数据各个视角下的特征向量作为第一特征矩阵，当有多个具有多视角特征的文本数据时，将每个文本数据在该视角下的特征向量堆叠起来作为文本数据在该视角下对应的第一特征矩阵。作为一种可选的实施方式，获取具有多视角特征的文本数据的各个视角分别对应的第一特征矩阵，并对文本特征提取模型进行初始化，包括获取网络数据矩阵V′和网络参数信息，其中网络参数信息包括中间辅助变量矩阵G和E，并初始化G＝V′，E＝G-V′。

如图2所示为根据本发明另一实施方式的文本特征提取模型的优化方法。其中，包括以下步骤：

S111：根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的网络属性信息。

其中，在步骤S111中，网络属性信息可以包括编码网络参数值、编码网络偏置项参数值和解码网络参数值。可以根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的编码网络参数值，作为一种可选的实施方式，各个视角分别对应的编码网络参数是基于各个视角分别对应的第一矩阵根据以下公式得到：

其中，W^v表示编码网络参数，v表示视角的编号，取v＝1、2、3...n，λ为权重系数，取λ＝0.5，表示d_v阶单位矩阵，X^v表示各个视角分别对应的第一特征矩阵，X^vT表示各个视角分别对应的第一特征矩阵的转置矩阵，Π为特征中心化转换的矩阵运算算子，V′表示网络数据矩阵。

可以根据各个视角分别对应的第一特征矩阵和编码网络参数值得到各个视角分别对应的编码网络偏置项参数值，作为一种可选的实施方式，各个视角分别对应的编码网络参数是基于各个视角分别对应的第一矩阵根据以下公式得到：

可以根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的解码网络参数值，作为一种可选的实施方式，各个视角分别对应的解码网络参数是基于各个视角分别对应的第一矩阵根据以下公式得到：

其中，Q^v表示解码网络参数，X^vT表示各个视角分别对应的第一特征矩阵的转置矩阵，V′表示网络数据矩阵，V′^T表示网络数据矩阵的转置矩阵，其中，表示矩阵运算中的哈达玛积，即对应位置的矩阵元素相乘。

作为一种可选的实施方式，可以根据各个视角分别对应的编码网络参数值、编码网络偏置项参数值和解码网络参数值将各个视角分别对应的第一特征矩阵进行融合，根据公式

计算得到文本数据的第二特征矩阵V，其中，v表示视角的编号，取v＝1、2、3...n，X^v表示各个视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M-＝(|M|-M)/2，表示第二参数，M⁺＝(|M|+M)/2，M＝G-E，表示第三参数，表示第四参数，表示第五参数。

如图3所示为根据本发明又一实施方式的文本特征提取模型的优化方法，其中，包括以下步骤：

S121：根据所述文本数据的第二特征矩阵对所述文本特征提取模型网络参数信息进行更新；

其中，根据文本数据的第二特征矩阵对文本特征提取模型网络参数信息进行更新，作为一种可选的实施方式，包括以下步骤：

对矩阵V+E进行矩阵奇异值分解得到U、S和P三个矩阵，对矩阵S的每个元素S_ij进行算子操作，得到矩阵T，其中，算子操作方法如下：

其中，矩阵T的每个元素T_ij＝t_∈[S_ij]，∈为经验参数，一般取∈＝0.1。

根据如下公式更新中间辅助变量G：G＝UTP^T。

根据如下公式更新矩阵E：E＝E+V-G。

根据如下公式更新变量其中根据如下公式计算其中的变量：

文本特征提取模型优化后的各个视角分别对应的网络属性信息，以及输出第二特征矩阵作为文本特征提取模型优化后的网络数据矩阵包括步骤：根据第二特征矩阵得到解码网络参数重建误差函数；判断解码网络参数重建误差函数是否收敛。

其中，解码网络参数重建误差函数由以下公式计算：

其中，表示第一参数，v表示视角的编号，取v＝1、2、3...n，X^vT表示各个视角分别对应的第一特征矩阵的转置矩阵，Q^v表示解码网络参数，V表示第二特征矩阵，V^T表示第二特征矩阵的转置矩阵，Δ^v表示第六参数，λ为权重系数，取λ＝0.5，Π为特征中心化转换的矩阵运算算子，X^v表示各个视角分别对应的第一特征矩阵，表示d_v阶单位矩阵，表示矩阵||X^vT-Q^vV^T||的Frobenius范数，Tr(V^TΔ^vV)表示矩阵(V^TΔ^vV)的迹，b^vT表示编码网络偏置项参数矩阵的转置矩阵。

当解码网络参数重建误差函数不收敛或迭代次数小于第一阈值时，返回到以下步骤：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的解码网络参数值；

当解码网络参数重建误差函数收敛或迭代次数大于或等于第一阈值时，根据第二特征矩阵得到整体重建误差函数，判断整体重建误差函数是否收敛。

其中，判断整体重建误差函数是否收敛包括以下步骤：当整体重建误差函数不收敛或迭代次数小于第二阈值时，返回到以下步骤：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的编码网络参数值；当整体重建误差函数收敛或迭代次数大于或等于第二阈值时，则优化结束，输出文本特征提取模型优化后的各个视角分别对应的网络属性信息，以及输出第二特征矩阵作为文本特征提取模型优化后的网络数据矩阵。

其中，整体重建误差函数由以下公式计算：

其中，W^v表示编码网络参数，1_n表示元素全为1的n维向量，b^v表示编码网络偏置项参数。

如图4所示为根据本发明实施方式的文本特征提取方法，包括以下步骤：

S201：获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；

S202：根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；

S203：根据所述第二特征矩阵提取所述文本数据的文本特征。

作为一种可选的实施方式，当只有一个具有多视角特征的文本数据时，获取该文本数据各个视角下的特征向量作为第一特征矩阵，当有多个具有多视角特征的文本数据时，将每个文本数据在该视角下的特征向量堆叠起来作为文本数据在该视角下对应的第一特征矩阵。

作为一种可选的实施方式，获取具有多视角特征的文本数据的各个视角分别对应的第一特征矩阵，并对文本特征提取模型进行初始化，包括获取网络数据矩阵V′和网络参数信息，其中网络参数信息包括中间辅助变量矩阵G和E，并初始化G＝V′，E＝G-V′。

如图6所示为根据本发明实施方式的文本特征提取方法的一个具体实施例，提取文本数据各个视角下的特征所对应的第一特征矩阵，文本数据各个视角下的特征例如可以是词性特征、联系方式特征和关键词的TF-IDF特征等，将该第一特征矩阵输入自编码器进行特征融合提取得到融合提取后的新特征。

如图7所示为发明实施方式的文本特征提取方法应用于多视角自编码网络的一个具体实施例，将各个视角分别对应的第一特征矩阵先进行特征中心化转换器的特征中心化转换，根据各个视角分别对应的网络属性信息将各个视角分别对应的第一特征矩阵进行融合，根据融合后的特征重建各个视角分别对应的特征。如图5所示为根据本发明另一实施方式的文本特征提取方法。其中，包括以下步骤：

S211：根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的网络属性信息。

S203：当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

其中，在步骤S211中，网络属性信息可以包括编码网络参数值、编码网络偏置项参数值和解码网络参数值。

可以根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的编码网络参数值，作为一种可选的实施方式，各个视角分别对应的编码网络参数是基于各个视角分别对应的第一矩阵根据以下公式得到：

其中，Q^v表示解码网络参数，X^vT表示各个视角分别对应的第一特征矩阵的转置矩阵，V′表示网络数据矩阵，V′^T表示网络数据矩阵的转置矩阵。

计算得到文本数据的第二特征矩阵V，其中，v表示视角的编号，取v＝1、2、3...n，X^v表示各个视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M^-＝(|M|-M)/2，表示第二参数，M⁺＝(|M|+M)/2，表示第三参数，表示第四参数，表示第五参数。

示例性介质

在介绍了本发明示例性实施方式的方法之后，接下来，参考图8对本发明示例性实施方式的、用于文本特征提取及提取模型优化方法以及介质、装置和设备进行说明。

在一些可能的实施方式中，本发明的各个方面还可以实现为一种存储有程序产品的计算机可读存储介质，当程序产品在终端设备上运行时，所述程序代码用于使所述终端设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的文本特征提取模型的优化和/或文本特征提取的步骤。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或可读存储介质。可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件或者上述的任意合适的组合。

如图8所示，描述了根据本发明的实施方式的文本特征提取模型的优化和/或文本特征提取的程序产品800。其可以采用便携式紧凑盘只读存储器(CD-ROM)，并且包括程序代码，可以在终端设备，例如个人电脑上运行。然而，本发明的程序产品不限于此，在本文件中，可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或器件使用或者与其结合使用。

可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了可读程序代码。这种传播的数据信号可以采用多种形式，包括——但不限于——电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质，该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于——无线、有线、光缆、RF等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码，所述程序设计语言包括面向对象的程序设计语言——例如Java、C++等，还包括常规的过程式程序设计语言——诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中，远程计算设备可以通过任意种类的网络——包括局域网或广域网——连接到用户计算设备，或者，可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

示例性装置

在介绍了本发明示例性实施方式的介质之后，接下来，参考图9对本发明示例性实施方式的、用于文本特征提取模型的优化装置进行说明。

如图9所示为根据本发明实施方式的文本特征提取模型的优化装置，包括：特征矩阵获取模块901，被配置为获取具有多视角特征的文本数据的各个视角分别对应的第一特征矩阵；多视角特征融合模块902，被配置为根据各个视角分别对应的网络属性信息将各个视角分别对应的第一特征矩阵进行融合，得到文本数据的第二特征矩阵；优化数据输出模块903，被配置为当第二特征矩阵满足预定条件时，输出文本特征提取模型优化后的各个视角分别对应的网络属性信息，以及输出第二特征矩阵作为文本特征提取模型优化后的网络数据矩阵。

多视角特征融合模块902还包括网络属性信息获取单元，网络属性信息获取单元被配置为：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的网络属性信息；其中，网络属性信息包括：编码网络参数值、编码网络偏置项参数值和解码网络参数值。

网络属性信息获取单元还被配置为：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的编码网络参数值；根据各个视角分别对应的第一特征矩阵和编码网络参数值得到各个视角分别对应的编码网络偏置项参数值。

网络属性信息获取单元还被配置为，基于各个视角分别对应的第一矩阵根据以下公式得到各个视角分别对应的编码网络参数：

网络属性信息获取单元还被配置为，基于各个视角分别对应的第一矩阵和编码网络参数根据以下公式得到各个视角分别对应的编码网络偏置项参数值：

b^v＝(V′-ΠX^vW^v)^T1_n

其中，b^v表示编码网络偏置项参数，1_n表示元素全为1的n维向量，V′表示网络数据矩阵，Π为特征中心化转换的矩阵运算算子，X^v表示各个视角分别对应的第一特征矩阵，W^v表示编码网络参数。

网络属性信息获取单元还被配置为：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的解码网络参数值。

网络属性信息获取单元还被配置为，基于各个视角分别对应的第一矩阵根据以下公式得到各个视角分别对应的解码网络参数：

多视角特征融合模块902还被配置为：根据各个视角分别对应的编码网络参数值、编码网络偏置项参数值和解码网络参数值将各个视角分别对应的第一特征矩阵进行融合，根据公式

计算得到文本数据的第二特征矩阵V，其中，v表示视角的编号，取v＝1、2、3...n，X^v表示各个视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M-＝(|M|-M)/2，表示第二参数，M⁺＝(|M|+M)/2，表示第三参数，表示第四参数，表示第五参数。

优化数据输出模块903还被配置为：根据文本数据的第二特征矩阵对文本特征提取模型网络参数信息进行更新。

优化数据输出模块903还被配置为：根据第二特征矩阵得到解码网络参数重建误差函数；判断解码网络参数重建误差函数是否收敛。

优化数据输出模块903还被配置为：当解码网络参数重建误差函数不收敛或迭代次数小于第一阈值时，返回到以下步骤：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的解码网络参数值；当解码网络参数重建误差函数收敛或迭代次数大于或等于第一阈值时，根据第二特征矩阵得到整体重建误差函数，判断整体重建误差函数是否收敛。

解码网络参数重建误差函数由以下公式计算：

优化数据输出模块903还被配置为：当整体重建误差函数不收敛或迭代次数小于第二阈值时，返回到以下步骤：根据各个视角分别对应的第一特征矩阵得到各个视角分别对应的编码网络参数值；当整体重建误差函数收敛或迭代次数大于或等于第二阈值时，则优化结束，输出文本特征提取模型优化后的各个视角分别对应的网络属性信息，以及输出第二特征矩阵作为文本特征提取模型优化后的网络数据矩阵。

整体重建误差函数由以下公式计算：

根据本发明实施方式的文本特征提取的装置，包括：特征矩阵获取模块，被配置为获取具有多视角特征的文本数据的各个视角分别对应的第一特征矩阵；多视角特征融合模块，被配置为根据各个视角分别对应的网络属性信息将各个视角分别对应的第一特征矩阵进行融合，得到文本数据的第二特征矩阵；特征提取模块，被配置为根据第二特征矩阵提取文本数据的文本特征。

示例性计算设备

在介绍了本发明示例性实施方式的方法和介质之后，接下来，参考图10对本发明示例性实施方式的、用于文本特征提取模型的优化和/或文本特征提取的计算设备进行说明。

所属技术领域的技术人员能够理解，本发明的各个方面可以实现为系统、方法或程序产品。因此，本发明的各个方面可以具体实现为以下形式，即：完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等)，或硬件和软件方面结合的实施方式，这里可以统称为“电路”、“模块”或“系统”。

在一些可能的实施方式中，根据本发明的文本特征提取模型的优化和/或文本特征提取的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中，所述存储器存储有程序代码，当所述程序代码被所述处理器执行时，使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的文本特征提取模型的优化和/或文本特征提取的步骤。

下面参考图10来描述根据本发明的这种实施方式的文本特征提取模型的优化和/或文本特征提取的计算设备1000。图10显示的文本特征提取模型的优化和/或文本特征提取的计算设备1000仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图10所示，文本特征提取模型的优化和/或文本特征提取的计算设备1000以通用计算设备的形式表现。文本特征提取模型的优化和/或文本特征提取的计算设备1000的组件可以包括但不限于：上述至少一个处理器1010、上述至少一个存储器1020、连接不同系统组件(包括处理器1010和存储器1020)的总线1030。

总线1030表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构中的任意总线结构的局域总线。

存储器1020可以包括易失性存储器形式的可读介质，例如随机存取存储器(RAM)1021和/或高速缓存存储器1022，还可以进一步包括只读存储器1023。

存储器1020还可以包括具有一组(至少一个)程序模块1024的程序/实用工具1021，这样的程序模块包括但不限于：操作系统、一个或多个应用程序、其它程序模块以及程序数据，这些实例中的每一个或者某种组合中可能包括网络环境的实现。

文本特征提取模型的优化和/或文本特征提取的计算设备1000也可以与一个或多个外部设备1040(例如键盘、指向设备、蓝牙设备等)通信，还可与一个或多个使得用户能与该文本特征提取模型的优化和/或文本特征提取的计算设备1000交互的设备通信，和/或与使得该文本特征提取模型的优化和/或文本特征提取的计算设备1000与一个或多个其他计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口1050进行。并且，文本特征提取模型的优化和/或文本特征提取的计算设备还可以通过网络适配器1060与一个或多个网路(例如局域网，广域网等)通信。如图所示，网络适配器1060通过总线与文本特征提取模型的优化和/或文本特征提取的计算设备1000的其他模块通信。应当明白，尽管图中未示出，可以结合文本特征提取模型的优化和/或文本特征提取的计算设备使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

此外，尽管在附图中以特定顺序描述了本发明方法的操作，但是，这并非要求或者暗示必须按照该特定顺序来执行这些操作，或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地，可以省略某些步骤，将多个步骤合并为一个步骤执行，和/或将一个步骤分解为多个步骤执行。

虽然已经参考若干具体实施方式描述了本发明的精神和原理，但是应该理解，本发明并不限于所公开的具体实施方式，对各方面的划分也不意味着这些方面中的特征不能组合以进行受益，这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

根据以上实施方式的说明，本申请提供了如下技术方案：

方案1.一种文本特征提取模型的优化方法，包括以下步骤：

获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；

根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；

当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

方案2.根据方案1所述的方法，其中，在所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵之前还包括步骤：

根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的网络属性信息；

其中，所述网络属性信息包括：编码网络参数值、编码网络偏置项参数值和解码网络参数值。

方案3.根据方案2所述的方法，其中，所述根据各个所述视角分别对应的第一特征矩阵得到所述各个所述视角分别对应的网络属性信息，具体包括以下步骤：

根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的编码网络参数值；

根据各个所述视角分别对应的第一特征矩阵和所述编码网络参数值得到各个所述视角分别对应的编码网络偏置项参数值。

方案4.根据方案2所述的方法，其中，各个所述视角分别对应的所述编码网络参数是基于各个所述视角分别对应的第一矩阵根据以下公式得到：

其中，W^v表示编码网络参数，v表示所述视角的编号，取v＝1、2、3...n，λ为权重系数，取λ＝0.5，表示d_v阶单位矩阵，X^v表示各个所述视角分别对应的第一特征矩阵，X^vT表示各个所述视角分别对应的第一特征矩阵的转置矩阵，Π为特征中心化转换的矩阵运算算子，V′表示所述网络数据矩阵。

方案5.根据方案2所述的方法，其中，各个所述视角分别对应的所述编码网络偏置项参数值是基于各个所述视角分别对应的第一矩阵和所述编码网络参数根据以下公式得到：

b^v＝(V′-ΠX^vW^v)^T1_n

其中，b^v表示编码网络偏置项参数，1_n表示元素全为1的n维向量，V′表示所述网络数据矩阵，Π为特征中心化转换的矩阵运算算子，X^v表示各个所述视角分别对应的第一特征矩阵，W^v表示编码网络参数。

方案6.根据方案3所述的方法，其中，在所述根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的编码网络偏置项参数值之后还包括步骤：

根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的解码网络参数值。

方案7.根据方案6所述的方法，其中，各个所述视角分别对应的解码网络参数是基于各个所述视角分别对应的第一矩阵根据以下公式得到：

其中，Q^v表示解码网络参数，X^vT表示各个所述视角分别对应的第一特征矩阵的转置矩阵，V′表示所述网络数据矩阵，V′^T表示所述网络数据矩阵的转置矩阵。

方案8.根据方案1所述的方法，其中，所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵包括：

根据各个所述视角分别对应的编码网络参数值、编码网络偏置项参数值和解码网络参数值将各个所述视角分别对应的第一特征矩阵进行融合，根据公式

计算得到所述文本数据的第二特征矩阵V，其中，v表示所述视角的编号，取v＝1、2、3...n，X^v表示各个所述视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示所述网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M-＝(|M|-M)/2，表示第二参数，M⁺＝(|M|+M)/2，表示第三参数，表示第四参数，表示第五参数。

方案9.根据方案1所述的方法，其中，在所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵之后还包括步骤：

根据所述文本数据的第二特征矩阵对所述文本特征提取模型网络参数信息进行更新。

方案10.根据方案1所述的方法，在输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息之前包括步骤：

根据所述第二特征矩阵得到解码网络参数重建误差函数；

判断所述解码网络参数重建误差函数是否收敛。

方案11.根据方案10所述的方法，其中，所述判断所述解码网络参数重建误差函数是否收敛包括以下步骤：

当所述解码网络参数重建误差函数不收敛或迭代次数小于第一阈值时，返回到以下步骤：根据各个所述视角分别对应的第一特征矩阵得到所述各个所述视角分别对应的解码网络参数值；

当所述解码网络参数重建误差函数收敛或迭代次数大于或等于第一阈值时，根据所述第二特征矩阵得到整体重建误差函数，判断所述整体重建误差函数是否收敛。

方案12.根据方案10所述的方法，其中，所述解码网络参数重建误差函数由以下公式计算：

其中，表示第一参数，v表示所述视角的编号，取v＝1、2、3...n，X^vT表示各个所述视角分别对应的第一特征矩阵的转置矩阵，Q^v表示解码网络参数，V表示所述第二特征矩阵，V^T表示所述第二特征矩阵的转置矩阵，Δ^v表示第六参数，λ为权重系数，取λ＝0.5，Π为特征中心化转换的矩阵运算算子，X^v表示各个所述视角分别对应的第一特征矩阵，表示d_v阶单位矩阵，表示矩阵||X^vT-Q^vV^T||的Frobenius范数，Tr(V^TΔ^vV)表示矩阵(V^TΔ^vV)的迹，b^vT表示编码网络偏置项参数矩阵的转置矩阵。

方案13.根据方案11所述的方法，其中，所述判断所述整体重建误差函数是否收敛包括以下步骤：

当所述整体重建误差函数不收敛或迭代次数小于第二阈值时，返回到以下步骤：根据各个所述视角分别对应的第一特征矩阵得到所述各个所述视角分别对应的编码网络参数值；

当所述整体重建误差函数收敛或迭代次数大于或等于第二阈值时，则优化结束，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

方案14.根据方案11或13所述的方法，其中，所述整体重建误差函数由以下公式计算：

方案15.一种文本特征提取方法，包括以下步骤：

根据所述第二特征矩阵提取所述文本数据的文本特征。

方案16.根据方案15所述的方法，其中，在所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵之前还包括步骤：

方案17.根据方案16所述的方法，其中，所述根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的网络属性信息，具体包括以下步骤：

方案18.根据方案16所述的方法，其中，各个所述视角分别对应的所述编码网络参数是基于各个所述视角分别对应的第一矩阵根据以下公式得到：

方案19.根据方案17所述的方法，其中，各个所述视角分别对应的所述编码网络偏置项参数值是基于各个所述视角分别对应的第一矩阵和所述编码网络参数根据以下公式得到：

b^v＝(V′-ΠX^vW^v)^T1_n

方案20.根据方案17所述的方法，其中，在所述根据各个所述视角分别对应的第一特征矩阵得到各个所述视角分别对应的编码网络偏置项参数值之后还包括步骤：

方案21.根据方案20所述的方法，其中，各个所述视角分别对应的解码网络参数是基于各个所述视角分别对应的第一矩阵根据以下公式得到：

方案22.根据方案16所述的方法，其中，所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵包括：

计算，得到所述文本数据的第二特征矩阵，其中，v表示所述视角的编号，取v＝1、2、3...n，X^v表示各个所述视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示所述网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M-＝(|M|-M)/2，表示第二参数，M+＝(|M|+M)/2，表示第三参数，表示第四参数，表示第五参数。

方案23.一种计算机可读存储介质，存储有程序代码，所述程序代码当被处理器执行时，实现如方案1-14之一所述的方法。

方案24.一种计算设备，包括处理器和存储有程序代码的存储介质，所述程序代码当被处理器执行时，实现如方案1-14之一所述的方法。

方案25.一种计算机可读存储介质，存储有程序代码，所述程序代码当被处理器执行时，实现如方案15-22之一所述的方法。

方案26.一种计算设备，包括处理器和存储有程序代码的存储介质，所述程序代码当被处理器执行时，实现如方案15-22之一所述的方法。

方案27.一种文本特征提取模型的优化装置，包括：

特征矩阵获取模块，被配置为获取具有多视角特征的文本数据的各个所述视角分别对应的第一特征矩阵；

多视角特征融合模块，被配置为根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵；

优化数据输出模块，被配置为当所述第二特征矩阵满足预定条件时，输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息，以及输出所述第二特征矩阵作为所述文本特征提取模型优化后的网络数据矩阵。

方案28.根据方案27所述的装置，其中，所述多视角特征融合模块还包括网络属性信息获取单元，所述网络属性信息获取单元被配置为：

方案29.根据方案28所述的装置，其中，所述网络属性信息获取单元还被配置为：

方案30.根据方案28所述的装置，其中，所述网络属性信息获取单元还被配置为，基于各个所述视角分别对应的第一矩阵根据以下公式得到各个所述视角分别对应的所述编码网络参数：

方案31.根据方案28所述的装置，其中，所述网络属性信息获取单元还被配置为，基于各个所述视角分别对应的第一矩阵和所述编码网络参数根据以下公式得到各个所述视角分别对应的所述编码网络偏置项参数值：

b^v＝(V′-ΠX^vW^v)^T1_n

方案32.根据方案29所述的装置，其中，所述网络属性信息获取单元还被配置为：

方案33.根据方案32所述的装置，其中，所述网络属性信息获取单元还被配置为，基于各个所述视角分别对应的第一矩阵根据以下公式得到各个所述视角分别对应的解码网络参数：

方案34.根据方案27所述的装置，其中，所述多视角特征融合模块还被配置为：

方案35.根据方案27所述的装置，其中，所述优化数据输出模块还被配置为：

方案36.根据方案27所述的装置，所述优化数据输出模块还被配置为：

根据所述第二特征矩阵得到解码网络参数重建误差函数；

判断所述解码网络参数重建误差函数是否收敛。

方案37.根据方案37所述的装置，其中，所述优化数据输出模块还被配置为：

方案38.根据方案36所述的装置，其中，所述解码网络参数重建误差函数由以下公式计算：

方案39.根据方案37所述的装置，其中，所述优化数据输出模块还被配置为：

方案40.根据方案37或39所述的装置，其中，所述整体重建误差函数由以下公式计算：

方案41.一种文本特征提取装置，包括：

特征提取模块，被配置为根据所述第二特征矩阵提取所述文本数据的文本特征。

Claims

1.一种文本特征提取模型的优化方法，包括以下步骤：

2.根据权利要求1所述的方法，其中，在所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵之前还包括步骤：

3.根据权利要求1所述的方法，其中，所述根据各个所述视角分别对应的网络属性信息将各个所述视角分别对应的第一特征矩阵进行融合，得到所述文本数据的第二特征矩阵包括：

计算得到所述文本数据的第二特征矩阵V，其中，v表示所述视角的编号，取v＝1、2、3...n，X^v表示各个所述视角分别对应的第一特征矩阵，Q^v表示解码网络参数，Q^vT表示解码网络参数的转置矩阵，V′表示所述网络数据矩阵，表示第一参数，ρ为经验参数，取ρ＝0.5，M^-＝(|M|-M)/2，表示第二参数，M⁺＝(|M|+M)/2，表示第三参数，表示第四参数，表示第五参数。

4.根据权利要求1所述的方法，在输出所述文本特征提取模型优化后的各个所述视角分别对应的网络属性信息之前包括步骤：

根据所述第二特征矩阵得到解码网络参数重建误差函数；

判断所述解码网络参数重建误差函数是否收敛。

5.根据权利要求4所述的方法，其中，所述判断所述解码网络参数重建误差函数是否收敛包括以下步骤：

6.一种文本特征提取方法，包括以下步骤：

根据所述第二特征矩阵提取所述文本数据的文本特征。

7.一种计算机可读存储介质，存储有程序代码，所述程序代码当被处理器执行时，实现如权利要求1-6之一所述的方法。

8.一种计算设备，包括处理器和存储有程序代码的存储介质，所述程序代码当被处理器执行时，实现如权利要求1-6之一所述的方法。

9.一种文本特征提取模型的优化装置，包括：

10.一种文本特征提取装置，包括：