CN111930964A

CN111930964A - 内容处理方法、装置、设备及存储介质

Info

Publication number: CN111930964A
Application number: CN202010983488.XA
Authority: CN
Inventors: 张子恒; 刘华罗; 刘博�; 向玥佳; 陈曦
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2020-09-17
Filing date: 2020-09-17
Publication date: 2020-11-13
Anticipated expiration: 2040-09-17
Also published as: CN111930964B

Abstract

本申请公开了一种内容处理方法、装置、设备及存储介质，属于人工智能技术领域。本申请实施例，引入了图像数据，而不是局限于实体的名称，能够对实体更形象、更准确地进行表征，以根据图像数据得到的实体特征进行匹配，也能提高匹配结果的准确性，进而提高内容处理的准确性，相较于简单地基于实体名称进行匹配的方式，考虑的因素更全面，以更直观、更形象的数据为准进行特征表达，能够大大减小错误率，提高准确性。

Description

内容处理方法、装置、设备及存储介质

技术领域

本申请涉及人工智能技术领域，特别涉及一种内容处理方法、装置、设备及存储介质。

背景技术

随着人工智能技术的发展，通过设备自动对待处理内容进行处理，将待处理内容中一些内容用已知内容来替代，从而统一对同一事物的表达，规范化语言表达，从而代替人工翻译操作，能够有效提高处理效率。

目前，内容处理方法通常是从待处理内容中提取出实体的名称，将其转为词向量与候选实体的词向量进行相似度计算，将待处理内容中实体更换为相似度最大的候选实体。

这种方法中实体名称转成的词向量并不能很好的表征该实体，简单地针对实体的名称进行实体匹配，错误率比较高，准确性较差。

发明内容

本申请实施例提供了一种内容处理方法、装置、设备及存储介质，能够提高内容处理的准确性。下面对本申请实施例提供的内容处理方法、装置、设备及存储介质进行介绍。

一方面，提供了一种内容处理方法，所述方法包括：

从待处理内容中，获取目标实体数据，所述目标实体数据包括目标实体对应的图像数据；

对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的图像特征；

基于所述图像特征，获取所述目标实体的实体特征；

对所述目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定所述目标实体对应的目标候选实体；

根据所述目标实体对应的目标候选实体，对所述待处理内容进行更新。

在一种可能实现方式中，所述内容处理模型的训练过程包括：

获取样本实体数据，所述样本实体数据对应有标注数据，所述标注数据为所述样本实体数据中样本实体对应的目标候选实体；

将所述样本实体数据输入初始内容处理模型中，由所述初始内容处理模型对所述样本实体进行特征提取，得到所述样本实体的实体特征，将所述样本实体的实体特征与至少两个候选实体的实体特征进行匹配，输出所述样本实体对应的预测候选实体；

基于所述样本实体对应的预测候选实体和目标候选实体，对所述初始内容处理模型的模型参数进行更新，直至符合目标条件时停止，得到内容处理模型。

在一种可能实现方式中，所述根据所述目标实体数据，获取所述目标实体的名称特征、关系特征或文本特征中的至少一项，包括下述至少一项：

对所述目标实体数据中所述目标实体的名称进行嵌入处理，得到所述名称对应的词向量，将所述词向量作为所述名称特征；

所述目标实体与所述待处理内容中其他实体之间的关系信息，对所述目标实体进行嵌入处理，得到所述目标实体的特征向量，将所述特征向量作为所述关系特征；

根据所述目标实体数据的文本属性信息进行嵌入处理，得到所述文本属性信息的特征向量，将所述特征向量作为所述文本特征。

在一种可能实现方式中，所述方法还包括：

根据所述目标实体对应的目标候选实体，执行所述目标候选实体对应的目标功能。

一方面，提供了一种内容处理装置，所述装置包括：

获取模块，用于从待处理内容中，获取目标实体数据，所述目标实体数据包括目标实体对应的图像数据；

提取模块，用于对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的图像特征；

所述获取模块，还用于基于所述图像特征，获取所述目标实体的实体特征；

匹配模块，用于对所述目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定所述目标实体对应的目标候选实体；

更新模块，用于根据所述目标实体对应的目标候选实体，对所述待处理内容进行更新。

在一种可能实现方式中，所述目标实体数据还包括所述目标实体的名称、所述目标实体与所述待处理内容中其他实体之间的关系信息或文本属性信息的至少一项；

所述获取模块还用于根据所述目标实体数据，获取所述目标实体的名称特征、关系特征或文本特征中的至少一项；

对所述名称特征、关系特征或文本特征中的至少一项以及所述图像特征进行加权，获取所述目标实体的实体特征。

在一种可能实现方式中，所述匹配模块用于基于所述目标实体的实体特征和所述至少两个候选实体的实体特征，对所述目标实体进行分类，得到分类结果，所述分类结果用于指示所述目标实体对应的目标候选实体。

在一种可能实现方式中，所述匹配模块用于将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入级联的至少一个分类器中，由所述级联的至少一个分类器对所述目标实体进行分类，得到分类结果。

在一种可能实现方式中，分类器的数量为至少两个；至少两个分类器串联；

所述匹配模块用于：

将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入至少两个分类器中，由所述至少两个分类器中前一个分类器对所述目标实体进行分类，基于分类结果，从所述至少两个候选实体的实体特征中筛选部分实体特征输入后一个分类器，将最后一个分类器的目标分类结果作为所述目标实体的分类结果。

在一种可能实现方式中，所述匹配模块用于：

将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入第一分类器中，由所述第一分类器对所述目标实体进行分类，得到第一分类结果；

根据所述第一分类结果，将所述目标实体的实体特征与所述第一分类结果对应的至少两个候选实体的实体特征输入第二分类器中，由所述第二分类器对所述目标实体进行分类，得到第二分类结果；

继续基于所述至少两个分类器中其他分类器根据所述第二分类器的第二分类结果进行分类，将所述至少两个分类器中最后一个分类器的目标分类结果作为所述目标实体的分类结果。

在一种可能实现方式中，所述至少一个分类器的训练过程包括：

获取样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征，一个样本实体对应一个目标候选实体；

基于所述至少一个分类器，对所述样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征进行分类，确定样本实体对应的预测候选实体，在分类过程中，每个分类器的输入基于前一个分类器的分类结果中候选实体与目标候选实体的分类结果筛选得到；

基于预测候选实体与目标候选实体，对至少一个分类器的模型参数进行更新。

在一种可能实现方式中，所述至少一个分类器的数量为至少两个，所述基于所述至少一个分类器，对所述样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征进行分类，确定样本实体对应的预测候选实体，在分类过程中，每个分类器的输入基于前一个分类器的分类结果中候选实体与目标候选实体的分类结果筛选得到，包括：

根据所述样本实体的实体特征与至少两个候选实体的实体特征的相似度，从至少两个候选实体中筛选出第一数量的第一候选实体，所述第一候选实体与样本实体的相似度大于或等于目标候选实体与样本实体的相似度；

将第一候选实体的实体特征和样本实体的实体特征输入第一分类器中，由所述第一分类器分别输出每个第一候选实体的第一分类结果；

从第一候选实体中筛选出第二候选实体，所述第二候选实体为第一分类结果中概率大于或等于目标候选实体的概率的第一候选实体；

将第二候选实体输入第二分类器，由所述第二分类器分别输出每个第二候选实体的第二分类结果；

继续进行筛选和分类步骤，将最后一个分类器的输出作为预测候选实体。

在一种可能实现方式中，所述装置用于将所述待处理内容输入内容处理模型中，由所述内容处理模型执行所述目标实体数据获取、特征提取、实体特征匹配的步骤，输出目标实体对应的目标候选实体。

在一种可能实现方式中，所述初始内容处理模型包括至少一个分类器；

所述将所述样本实体的实体特征与至少两个候选实体的实体特征进行匹配，输出所述样本实体对应的预测候选实体，包括：

获取所述目标实体的实体特征与所述至少两个候选实体的实体特征的相似度；

将所述至少两个候选实体中，获取第一候选实体，所述第一候选实体对应的所述相似度大于或等于所述目标候选实体对应的目标相似度；

将所述目标实体的实体特征与所述第一候选实体的实体特征输入所述至少一个分类器中，由所述至少一个分类器基于输入的实体特征对所述目标实体进行分类，确定所述目标实体对应的预测候选实体。

在一种可能实现方式中，所述获取模块用于：

对待处理内容进行实体识别，得到所述待处理内容中至少一个实体；

将所述至少一个实体中任一实体确定为所述目标实体，将所述待处理内容中所述目标实体关联的数据作为所述待识别的实体数据。

在一种可能实现方式中，所述待处理内容为第一知识图谱，所述至少两个候选实体为第二知识图谱中的实体，所述知识图谱包括至少两个实体的实体数据；

所述获取模块用于从所述第一知识图谱中提取目标实体的实体数据作为所述目标实体数据。

在一种可能实现方式中，所述更新模块用于执行下述任一项：

将所述实体数据中所述目标实体替换为所述目标实体对应的候选实体；

将所述目标实体对应的候选实体的实体数据添加至所述待处理内容中，将所述候选实体作为所述待处理内容中的一个实体，为所述目标实体和所述候选实体建立关联关系；

将所述目标实体对应的候选实体的实体数据添加至所述目标实体数据中，将所述目标实体对应的候选实体作为所述目标实体的名称。

一方面，提供了一种电子设备，所述电子设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述至少一条程序代码由所述一个或多个处理器加载并执行以实现上述内容处理方法的各种可选实现方式。

一方面，提供了一种计算机可读存储介质，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现上述内容处理方法的各种可选实现方式。

一个方面，提供了一种计算机程序产品或计算机程序，所述计算机程序产品或所述计算机程序包括一条或多条程序代码，所述一条或多条程序代码存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码，所述一个或多个处理器执行所述一条或多条程序代码，使得电子设备能够执行上述任一种可能实施方式的内容处理方法。

本申请实施例，引入了图像数据，而不是局限于实体的名称，能够对实体更形象、更准确地进行表征，以根据图像数据得到的实体特征进行匹配，也能提高匹配结果的准确性，进而提高内容处理的准确性，相较于简单地基于实体名称进行匹配的方式，考虑的因素更全面，以更直观、更形象的数据为准进行特征表达，能够大大减小错误率，提高准确性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还能够根据这些附图获得其他的附图。

图1是本申请实施例提供的一种内容处理方法的实施环境的示意图；

图2是本申请实施例提供的一种内容处理方法应用于医疗场景的示意图；

图3是本申请实施例提供的一种内容处理方法的流程图；

图4是本申请实施例提供的一种内容处理方法的流程图；

图5是本申请实施例提供的一种内容处理模型的结构示意图；

图6是本申请实施例提供的一种内容处理装置的结构示意图；

图7是本申请实施例提供的一种终端的结构框图；

图8是本申请实施例提供的一种服务器的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

本申请中术语“第一”“第二”等字样用于对作用和功能基本相同的相同项或相似项进行区分，应理解，“第一”、“第二”、“第n”之间不具有逻辑或时序上的依赖关系，也不对数量和执行顺序进行限定。还应理解，尽管以下描述使用术语第一、第二等来描述各种元素，但这些元素不应受术语的限制。这些术语只是用于将一元素与另一元素区别分开。例如，在不脱离各种所述示例的范围的情况下，第一图像能够被称为第二图像，并且类似地，第二图像能够被称为第一图像。第一图像和第二图像都能够是图像，并且在某些情况下，能够是单独且不同的图像。

本申请中术语“至少一个”的含义是指一个或多个，本申请中术语“多个”的含义是指两个或两个以上，例如，多个数据包是指两个或两个以上的数据包。

应理解，在本文中对各种所述示例的描述中所使用的术语只是为了描述特定示例，而并非旨在进行限制。如在对各种所述示例的描述和所附权利要求书中所使用的那样，单数形式“一个(“a”“an”)”和“该”旨在也包括复数形式，除非上下文另外明确地指示。

还应理解，本文中所使用的术语“ 和/或”是指并且涵盖相关联的所列出的项目中的一个或多个项目的任何和全部可能的组合。术语“和/或”，是一种描述关联对象的关联关系，表示能够存在三种关系，例如，A和/或B，能够表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本申请中的字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，在本申请的各个实施例中，各个过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

还应理解，根据A确定B并不意味着仅仅根据A确定B，还能够根据A和/或其它信息确定B。

还应理解，术语“包括”(也称“Includes”、“Including”、“Comprises”和/或“Comprising”)当在本说明书中使用时指定存在所陈述的特征、整数、步骤、操作、元素、和/或部件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元素、部件、和/或其分组。

还应理解，术语“如果”可被解释为意指“当 ...时”(“when”或“upon”)或“响应于确定”或“响应于检测到”。类似地，根据上下文，短语“如果确定 ...”或“如果检测到[所陈述的条件或事件]”可被解释为意指“在确定 ...时”或“响应于确定 ...”或“在检测到[所陈述的条件或事件] 时”或“响应于检测到[所陈述的条件或事件]”。

下面对本申请涉及到的名词进行说明。

实体是指客观存在并相互区别的事物。比如“狗”，“猫”，“风扇”，“苹果”等。对于同一事物，我们有时会通过多种表达方式来对其进行描述。其中，有些表达方式是规范表达，有些表达方式则偏口语化。例如，对于腹痛这种症状，用户也可能会用肚子疼、肚子痛、腹部疼等表达表示。因而不同的实体可能对应现实世界中的同一事物。

针对这一现象，我们可以对待处理内容中实体与候选实体匹配，可以确定出两个实体是否对应同一事物，从而实现对待处理内容中的实体进行识别，进而对其进行处理，这样可以将统一对同一事物的表达，或者将未知的内容用已知的内容表达出来。该将实体与候选实体匹配的过程是实体匹配过程，也可以称为实体对齐。

实体对齐（entity alignment）：也被称作实体匹配（entity matching）是指对于异构数据源知识图谱中的各个实体，通过机器学习模型算法找出属于现实世界中的同一实体，比如中文百度百科中的“姚明”和英文维基百科里的“Ming Yao”就是语义上等价的。

知识图谱（Knowledge Graph，KG）：知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合，并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。上述实体是知识图谱的基本单元，是文本中承载信息的重要语言单位。知识图谱中实体作为节点，节点之间的连接用于表示实体之间的关系。

本申请实施例中，可基于人工智能技术，用样本数据对内容处理模型进行训练，基于训练好的内容处理模型执行内容处理方法。下面针对人工智能技术进行解释说明。

人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision，CV)计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术，还包括常见的人脸识别、指纹识别等生物特征识别技术。

自然语言处理(Nature Language processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此，这一领域的研究将涉及自然语言，即人们日常使用的语言，所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、示教学习等技术。

云技术（Cloud technology）基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称，可以组成资源池，按需所用，灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源，如视频网站、图片类网站和更多的门户网站。伴随着互联网行业的高度发展和应用，将来每个物品都有可能存在自己的识别标志，都需要传输到后台系统进行逻辑处理，不同程度级别的数据将会分开处理，各类行业数据皆需要强大的系统后盾支撑，只能通过云计算来实现。

在一些实施例中，本申请涉及云技术中的云计算和人工智能云服务。下面对二者进行解释说明。

云计算(cloud computing)是一种计算模式，它将计算任务分布在大量计算机构成的资源池上，使各种应用系统能够根据需要获取计算力、存储空间和信息服务。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的，并且可以随时获取，按需使用，随时扩展，按使用付费。作为云计算的基础能力提供商，会建立云计算资源池(简称云平台，一般称为IaaS(Infrastructure as a Service，基础设施即服务)平台，在资源池中部署多种类型的虚拟资源，供外部客户选择使用。云计算资源池中主要包括：计算设备(为虚拟化机器，包含操作系统)、存储设备、网络设备。按照逻辑功能划分，在IaaS（Infrastructure as a Service，基础设施即服务）层上可以部署PaaS(Platform as aService，平台即服务)层，PaaS层之上再部署SaaS (Software as a Service，软件即服务)层，也可以直接将SaaS部署在IaaS上。PaaS为软件运行的平台，如数据库、web容器等。SaaS为各式各样的业务软件，如web门户网站、短信群发器等。一般来说，SaaS和PaaS相对于IaaS是上层。

所谓人工智能云服务，一般也被称作是AIaaS（AI as a Service，中文为“AI即服务”）。这是目前主流的一种人工智能平台的服务方式，具体来说AIaaS平台会把几类常见的AI服务进行拆分，并在云端提供独立或者打包的服务。这种服务模式类似于开了一个AI主题商城：所有的开发者都可以通过API接口的方式来接入使用平台提供的一种或者是多种人工智能服务，部分资深的开发者还可以使用平台提供的AI框架和AI基础设施来部署和运维自已专属的云人工智能服务。

随着人工智能技术研究和进步，人工智能技术在多个领域展开研究和应用，例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等，相信随着技术的发展，人工智能技术将在更多的领域得到应用，并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的计算机视觉、自然语言处理、机器学习等技术，具体通过如下实施例进行说明。

下面对本申请的实施环境进行说明。

图1是本申请实施例提供的一种内容处理方法的实施环境的示意图。该实施环境包括终端101，或者该实施环境包括终端101和内容处理平台102。终端101通过无线网络或有线网络与内容处理平台102相连。

终端101能够是智能手机、游戏主机、台式计算机、平板电脑、电子书阅读器、MP3（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3）播放器或MP4（Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4）播放器，膝上型便携计算机，智能机器人，医疗设备中的至少一种。终端101安装和运行有支持内容处理的应用程序，例如，该应用程序能够是系统应用、即时通讯应用、医疗咨询应用、医疗通讯应用、新闻推送应用、购物应用、在线视频应用、社交应用。

示例性地，该终端101能够具有内容获取功能和内容处理功能，能够对获取到的内容进行处理，并根据处理结果执行相应的功能。该终端101能够独立完成该工作，也能够通过内容处理平台102为其提供数据服务。本申请实施例对此不作限定。

内容处理平台102包括一台服务器、多台服务器、云计算平台和虚拟化中心中的至少一种。内容处理平台102用于为内容处理的应用程序提供后台服务。可选地，内容处理平台102承担主要处理工作，终端101承担次要处理工作；或者，内容处理平台102承担次要处理工作，终端101承担主要处理工作；或者，内容处理平台102或终端101分别能够单独承担处理工作。或者，内容处理平台102和终端101两者之间采用分布式计算架构进行协同计算。

可选地，该内容处理平台102包括至少一台服务器1021以及数据库1022，该数据库1022用于存储数据，在本申请实施例中，该数据库1022中能够存储有样本实体数据，为至少一台服务器1021提供数据服务。

服务器能够是独立的物理服务器，也能够是多个物理服务器构成的服务器集群或者分布式系统，还能够是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端能够是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

本领域技术人员能够知晓，上述终端101、服务器1021的数量能够更多或更少。比如上述终端101、服务器1021能够仅为一个，或者上述终端101、服务器1021为几十个或几百个，或者更多数量，本申请实施例对终端或服务器的数量和设备类型不加以限定。

本申请实施例提供的内容处理方法应用于多种场景，下面提供一种可能的应用场景——医疗应用场景，如图2所示，用户可以在自己的终端上输入自己的病情，在此称之为主诉，该主诉是指患者对自己病情的描述，该主诉即为待处理内容，患者还可以上传或拍摄有关药品或者医疗设备的图像数据，该图像数据即为该待处理内容。上传至内容处理系统后，内容处理系统能够通过本申请提供的内容处理方法，将患者提供的待处理内容中不太规范或者不清楚的病情、药品、医疗器械与规范化实体（也即是后续的候选实体）进行匹配，确定专业术语来进行替换，得到专业术语的内容，以此来提供给医师，由医师为患者进行诊治。

图3是本申请实施例提供的一种内容处理方法的流程图，该方法应用于电子设备中，该电子设备为终端或服务器，参见图3，以该方法应用于终端为例，该方法包括以下步骤。

201、电子设备从待处理内容中，获取目标实体数据，该目标实体数据包括目标实体对应的图像数据。

该待处理内容中可以包括至少一个实体的实体数据，实体的数量可以为一个，也可以为多个。该目标实体可以为该至少一个实体中的任一个。如果实体的数量为多个，电子设备也可以依次将每个实体作为目标实体执行内容处理方法。

该目标实体数据包括图像数据。该图像数据可以为静态图像，也可以为动态图像，还可以为视频、短视频等。对于一个事物，在对其进行表述时可以采用文字表述，也可以采用图像的方式表述，这样对于一个实体可能会存在图像数据。例如，“苹果”会有一张图像或视频。又例如，某种药品可能会有一张外包装的图像或包含多帧的视频。这些图像数据在一定程度上也是可以帮忙对实体进行表征的，而且一个事物两个不同名称的实体可能会有相同的图像信息，在本申请实施例中，则引入图像数据来帮助进行实体对齐，从而能够有效提高实体对齐的准确性和可靠性。

当然，该目标实体数据还可以包括其他数据，电子设备也可以参考实体的其他数据来对实体进行表征，进而提高实体对齐的准确性和可靠性。

202、电子设备对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的图像特征。

电子设备获取到图像特征后，能够参考图像特征，以及其他特征来得到该目标实体的实体特征。新引入了该图像特征，能够更形象的对目标实体进行表征。

电子设备获取到目标实体数据后，能够从中提取到目标实体的实体特征。特征是指一事物异于其他事物的特点。该实体特征即是指该实体异于其他实体的特点。通过特征图提取步骤，以实体特征来对目标实体进行表征，然后电子设备可以基于该实体特征与候选实体的实体特征进行对比，判断二者是否对应同一事物。该实体特征即作为了判断目标实体和候选实体是否对应同一事物的依据。

可以理解地，同一事物的不同实体尽管在名称上可能有一些差异，但是差异一般较小，且可能对应相似度很高，或者相同的图像数据，二者的实体特征则比较相近。通过对目标实体数据进行特征提取，可以突出该目标实体的特点，从而能够准确地确定出实体是否对齐。

203、电子设备基于所述图像特征，获取所述目标实体的实体特征。

204、电子设备对该目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定该目标实体对应的目标候选实体。

候选实体用于与其他实体进行匹配。电子设备通过实体特征匹配的方式，对目标实体与候选实体进行匹配，确定二者是否对应真实世界中同一事物。

例如，在一些场景中，该候选实体可以作为一种标准，电子设备可以将待处理内容中的实体与候选实体对齐，将其更新为候选实体，这样对实体进行统一。例如，候选实体为一些专业术语或者规范化表述。如果待处理内容包括口语化的表述，或者一些不明确的表述，可以通过实体对齐，将那些表述替换为候选实体，这样表述方式则统一，更专业，更规范。

又例如，在一些场景中，上述待处理内容为一个知识图谱，该候选实体位于另一个知识图谱中。电子设备可以通过对两个知识图谱中的实体进行特征提取，得到实体特征，通过匹配步骤，确定两个知识图谱中实体之间的对应关系。

205、电子设备根据该目标实体对应的目标候选实体，对该待处理内容进行更新。

电子设备在确定了目标实体对应的目标候选实体后，能够对待处理内容进行更新，以使用目标候选实体对待处理内容中的目标实体进行更换，或者将目标候选实体加入到目标实体的解释中，又或者该待处理内容为知识图谱，将目标候选实体添加到知识图谱中，从而能够对该知识图谱进行扩充。如果候选实体也是一个知识图谱中的实体，通过内容处理方法能够将两个知识图谱融合。

图4是本申请实施例提供的一种内容处理方法的流程图，参见图4，该方法包括以下步骤。

301、电子设备获取待处理内容。

在本申请实施例中，电子设备能够获取待处理内容，对待处理内容中的实体，确定与候选实体的对应关系，进而对待处理内容进行更新，以候选实体对待处理内容中的实体进行统一，又或者以候选实体对待处理内容进行扩充。

其中，该待处理内容可能以不同形式的存在，电子设备获取该待处理内容的方式则不同。下面提供两种情况。

情况一：该待处理内容为采集或接收到的一段需要处理的内容，该内容可以包括图像数据，也可以包括文本数据等。

在该情况一中，电子设备可提供内容处理服务。用户在该电子设备上操作输入待处理内容，该待处理内容也可以通过其他电子设备发送至该电子设备，该电子设备则可以获取该待处理内容，对其进行内容处理。

例如，在医疗场景中，用户可以在自己的终端上输入自己的病情，在此称之为主诉，该主诉是指患者对自己病情的描述，通常是口语化或者未标准化的一段话。该主诉即为待处理内容。当然，患者还可以上传或拍摄有关药品或者医疗器械的图像数据，该图像数据即为该待处理内容。通过本申请提供的内容处理方法，即可将患者提供的待处理内容中不太规范或者不清楚的病情、药品、医疗器械与规范化实体（也即是后续的候选实体）进行匹配，确定专业术语来进行替换。

情况二：该待处理内容为第一知识图谱，该至少两个候选实体为第二知识图谱中的实体，该知识图谱包括至少两个实体的实体数据。

在该情况二中，电子设备可以获取两个知识图谱，对两个知识图谱中的实体进行对齐，来确定两个知识图谱中实体之间的对应关系。

上述仅提供了两种可能的情况，该待处理内容还可以通过其他方式获取得到，本申请实施例对此不作限定。

302、电子设备从待处理内容中，获取目标实体数据，该目标实体数据包括目标实体对应的图像数据，以及该目标实体的名称、该目标实体与该待处理内容中其他实体之间的关系信息或文本属性信息的至少一项。

该待处理内容的获取方式不同时，对待处理内容的处理需求可能不相同，待处理内容中目标实体的目标实体数据的存在方式也可能不同，因而电子设备获取目标实体数据的方式也可能不同。

与步骤301中两种获取待处理内容的情况对应，该步骤302中，获取目标实体数据的方式也包括下述两种情况。

情况A：对应上述步骤301中的情况一，电子设备对待处理内容进行实体识别，得到该待处理内容中至少一个实体，将该至少一个实体中任一实体确定为该目标实体，将该待处理内容中该目标实体关联的数据作为该待识别的实体数据。

在该情况A中，电子设备可以获取到待处理内容后，可以先通过实体识别确定出该待处理内容包括哪些实体，然后可以将任一个实体确定为目标实体进行实体匹配。在对该任一实体匹配结束，还可以再将剩下的实体中任一个实体确定为目标实体，再进行实体匹配。

情况B：在上述步骤301中的情况二，电子设备从该第一知识图谱中提取目标实体的实体数据作为该目标实体数据。

在该情况B中，电子设备可以对两个知识图谱进行实体对齐，因而，电子设备可以将其中一个知识图谱中的任一实体作为目标实体，将另一个知识图谱中的实体作为候选实体。在对该任一实体进行实体匹配后，可以再将该知识图谱中剩下的实体中任一个实体确定为目标实体，再进行实体匹配。

对于目标实体数据，该目标实体数据中包括多种数据。其中，该目标实体数据中包括图像数据。另外，该目标实体数据还包括名称、关系信息或文本属性信息中的至少一项，也即是，该目标实体数据还包括名称、关系信息或文本属性信息中的一项，或者目标实体数据还包括三种数据中的任两项，或该目标实体数据还包括三种数据。

在一个具体示例中，该目标实体数据包括目标实体的名称、关系信息、文本属性信息和图像数据。

上述步骤302仅以该目标实体数据包括多种数据为例进行说明，该目标实体数据还可以仅包括图像数据，本申请实施例对目标实体数据的具体内容不做限定。

303、电子设备对该目标实体数据中图像数据进行特征提取，得到该目标实体的图像特征。

电子设备获取到目标实体的目标实体数据后，可以对其进行特征提取，得到实体特征。由于该目标实体数据包括多种数据，则电子设备可以分别对每种数据进行特征提取，得到对应的特征。

在该步骤303中，电子设备对图像数据进行特征提取，得到图像特征。下述步骤304中，电子设备针对其他种数据进行特征提取，得到其他特征。需要说明的是，该步骤303和步骤304的执行顺序任意，电子设备可以先执行步骤303，再执行步骤304。电子设备也可以先执行步骤304，再执行步骤303。电子设备还可以同时执行步骤303和步骤304，本申请实施例对两个步骤的执行顺序不作限定。

在一种可能实现方式中，图像数据不同于文本数据，直接进行特征提取步骤得到的特征在形式表达上可能与文本数据的特征不同。为了能够更好的综合多种数据的特征，电子设备可以先对图像数据进行特征提取，再将其映射到一定的特征空间上，以和其他特征的形式表达上保持一致。具体的，电子设备可以对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的第一图像特征，根据目标映射关系，将所述第一图像特征映射为目标长度的第二图像特征，将所述第二图像特征作为所述目标实体的实体特征。例如，该第一图像特征可以为特征图，通过映射，能够将其映射为目标长度的特征向量。

在一个具体示例中，电子设备能够采用深度残差网络（Deep residual network，ResNet）模型中的特征提取网络进行特征提取，再采用全连接层进行映射。

304、电子设备根据该目标实体数据，获取该目标实体的名称特征、关系特征或文本特征中的至少一项。

对于不同的数据，电子设备可以采用相应的特征提取方式，提取相应的特征。具体的，电子设备可以执行下述步骤中至少一项。

步骤一、对所述目标实体数据中所述目标实体的名称进行嵌入处理，得到所述名称对应的词向量，将所述词向量作为所述名称特征。

在一个具体示例中，电子设备可以基于word2vec模型执行该嵌入处理步骤，得到词向量。例如，对于实体h，其名称的嵌入（embedding）计算公式为φ(name(h))，其中name(h)提取出实体名称。

步骤二、所述目标实体与所述待处理内容中其他实体之间的关系信息，对所述目标实体进行嵌入处理，得到所述目标实体的特征向量，将所述特征向量作为所述关系特征。

在一个具体示例中，电子设备可以基于TransE模型执行该嵌入处理步骤，得到关系特征的特征向量。例如，在对齐知识图谱中的实体关系进行建模时，我们采用了TransE模型，TransE模型认为一个正确的三元组需要在嵌入空间（embedding space）里面满足h+r=t，并且错误的三元组不应该满足上述公式。因此，对于知识图谱中的<h，r，t>输入三元组，TransE模型会计算其embedding的合理性数值f（h，r，t）= -||h+r-t||。然后通过知识图谱中的正确三元组和采样的错误三元组来学习整个知识图谱中实体和关系的embedding。

步骤三、根据所述目标实体数据的文本属性信息进行嵌入处理，得到所述文本属性信息的特征向量，将所述特征向量作为所述文本特征。

在一个具体示例中，电子设备可以基于CNN模型执行该嵌入处理步骤，得到文本属性信息的特征向量。例如，对于实体文字属性来说，属性名称a和属性值v需要联合embedding，在模型中是采用了一个卷积神经网络进行建模CNN（a;v）=σ(vec(<a;v>*Ω))W)，基于CNN模型，对于知识图谱中的实体属性，我们也可以计算得到一个合理性数值f（h，a，v）= -||h- CNN（a;v）||。

305、电子设备对该名称特征、关系特征或文本特征中的至少一项以及该图像特征进行加权，获取该目标实体的实体特征。

电子设备基于多种数据，获取到多种特征，电子设备可以综合多种特征得到实体特征，在匹配时以综合的实体特征进行匹配。这样该实体特征综合了多种信息，从多个视角来对实体进行了表征，因而，该实体特征更全面、更准确，基于该实体特征匹配的结果也即更加准确。

具体的，每种特征可以对应有各自的权重，电子设备可以获取每种特征与各自权重的乘积，再进行求和，得到目标实体的实体特征。例如，每种特征均以特征向量的形式表示，该每种特征的特征向量的长度相同，均为目标长度。如果每种特征的权重均为1，电子设备可以将每种特征的特征向量相加，得到实体特征的特征向量，该特征向量的长度也是目标长度。如果多种特征的权重相同，电子设备可以将多种特征的特征向量进行平均，得到实体特征的特征向量，每种特征的权重可以由相关技术人员根据需求进行设置，本申请实施例对此不作限定。

在一个具体的实施例中，该目标实体数据包括目标实体的名称、关系信息、文本属性信息和图像数据，每种数据的特征的权重相同。在另一个具体的实施例中，该目标实体数据包括目标实体的名称、关系信息、文本属性信息和图像数据，文本属性信息和图像数据对应的权重相同，名称、关系信息对应的权重相同，且为文本属性信息对应权重的二倍。电子设备可以先将文本属性信息和图像数据的特征进行求和，再与名称、关系信息对应的特征进行平均。

需要说明的是，步骤303至步骤305为根据该目标实体数据，对该目标实体进行特征提取，得到该目标实体的实体特征的过程，上述仅以目标实体数据包括多种数据为例进行说明，其中，电子设备分别对所述目标实体数据中所述目标实体的名称、所述目标实体与所述待处理内容中其他实体之间的关系信息或文本属性信息的至少一项进行嵌入处理，得到目标长度的名称特征、关系特征或文本特征中的至少一项，然后综合多种特征时，对于图像特征，电子设备先获取到特征图形式的第一图像特征，后对其进行了转化，得到形式与其他特征一致的第二图像特征。具体地，电子设备对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的第一图像特征，根据目标映射关系，将所述第一图像特征映射为目标长度的第二图像特征，将所述第二图像特征作为所述目标实体的图像特征。

该目标实体数据包括的数据种类可以由相关技术人员根据需求进行设置，本申请实施例对此不作限定。上述过程也即是：电子设备可以对该目标实体数据中图像数据进行特征提取，得到该目标实体的图像特征，基于该图像特征，获取该目标实体的实体特征。其中，基于图像特征，获取实体特征时，还考虑了其他种数据的特征。可选地，如果该目标实体数据仅包括图像数据，则电子设备可以直接将该图像特征作为该实体特征。

306、电子设备对该目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定该目标实体对应的目标候选实体。

电子设备提取到目标实体的实体特征后，可以获取至少两个候选实体的实体特征，将目标实体的实体特征与至少两个候选实体的实体特征进行匹配。

该至少两个候选实体的实体特征可以通过不同的方式获取得到。在一种可能实现方式中，电子设备也可以执行与上述步骤303至步骤305同理的步骤，基于至少两个候选实体的实体数据，对至少两个候选实体进行特征提取，得到该至少两个候选实体的实体特征。在另一种可能实现方式中，该至少两个候选实体的实体特征也可以预先提取并存储于该电子设备中，电子设备在执行步骤306时，可以从存储信息中提取该至少两个候选实体的实体特征。本申请实施例对具体采用哪种方式不作限定。

在一种可能实现方式中，该匹配过程可以理解为对目标实体的分类过程，该分类过程是指确定该目标实体对应哪一个候选实体。具体地，电子设备可以基于该目标实体的实体特征和该至少两个候选实体的实体特征，对该目标实体进行分类，得到分类结果，该分类结果用于指示该目标实体对应的目标候选实体。

在该实现方式中，可以将目标实体与每个候选实体作为一对实体，该分类过程则可以对每一对实体是否对齐进行分类，分类结果则可以包括两种：对齐和不对齐。

在一种可能实现方式中，该分类过程可以通过分类器实现，该分类器的数量可以为至少一个。具体的，该步骤306中，电子设备可以将该目标实体的实体特征和该至少两个候选实体的实体特征输入至少一个分类器中，由该至少一个分类器对该目标实体进行分类，得到分类结果。

如果该分类器的数量为一个，电子设备可以直接以该分类器对目标实体进行分类，将分类结果中与目标实体最匹配的候选实体作为目标候选实体。例如，该分类结果中每个候选实体均对应一个概率，电子设备可以将概率最大的候选实体确定为目标候选实体。

如果该分类器的数量为多个，也即是至少两个，多个分类器可以有不同的连接方式。在一种可能实现方式中，该至少两个分类器串联，也即是，后一个分类器的输入为上一个分类器的输出。至少两个分类器两两相邻。

其中，该至少一个分类器可以级联，该步骤306中，电子设备可以将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入级联的至少一个分类器中，由所述级联的至少一个分类器对所述目标实体进行分类，得到分类结果。

在一些实施例中，分类器的数量为至少两个，至少两个分类器串联。则该至少两个分类器在对实体特征进行分类时，后一个分类器能够在前一个分类器分类后再进行分类，因而，可以设置一个筛选过程，后一个分类器的输入能够基于前一个分类器的分类结果对候选实体进行筛选，这样减少后面的分类器分类的数据量，且通过多个分类器逐步地、递进式地进行分类，能够大大提高最终分类结果的准确性。

在该实施例中，电子设备将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入至少两个分类器中，由所述至少两个分类器中前一个分类器对所述目标实体进行分类，基于分类结果，从所述至少两个候选实体的实体特征中筛选部分实体特征输入后一个分类器，将最后一个分类器的目标分类结果作为所述目标实体的分类结果。

在一种可能实现方式中，上述分类过程则可以为：电子设备将该目标实体的实体特征和该至少两个候选实体的实体特征输入第一分类器中，由该第一分类器对该目标实体进行分类，得到第一分类结果。电子设备根据该第一分类结果，将该目标实体的实体特征与该第一分类结果对应的至少两个候选实体的实体特征输入第二分类器中，由该第二分类器对该目标实体进行分类，得到第二分类结果。电子设备继续基于该至少两个分类器中其他分类器根据该第二分类器的第二分类结果进行分类，将该至少两个分类器中最后一个分类器的目标分类结果作为该目标实体的分类结果。

其中，该第一分类结果对应的至少两个候选实体的实体特征则是基于第一分类结果筛选出来得到的。通过多个分类器进行多步筛选，最终确定出一个分类结果，也即是目标分类结果。

上述已经对分类器串联的情况进行了说明，至少两个分类器还可以采用并联的方式，这样电子设备能够分别通过至少两个分类器进行分类，得到多个分类结果，然后再对多个分类结果进行加权，得到最终的分类结果。本申请实施例对至少两个分类器的连接方式不作限定。

在一种可能实现方式中，上述内容处理方法可以通过内容处理模型实现，该内容处理模型用于对待处理内容中实体与候选实体对齐。具体地，电子设备可以将该待处理内容输入内容处理模型中，由该内容处理模型执行该目标实体数据获取、特征提取、实体特征匹配的步骤，输出目标实体对应的目标候选实体。也即是，电子设备可以在步骤301之后将待处理内容输入内容处理模型中，由内容处理模型执行步骤302至步骤306。

其中，该内容处理模型可以基于样本实体数据训练得到，样本实体数据对应有标注数据，来指示该样本实体数据正确的、真实地对应候选实体中的哪一个候选实体。具体地，该内容处理模型的训练过程可以通过下述步骤A至步骤C实现。

步骤A、电子设备获取样本实体数据，该样本实体数据对应有标注数据，该标注数据为该样本实体数据中样本实体对应的目标候选实体。

步骤B、电子设备将该样本实体数据输入初始内容处理模型中，由该初始内容处理模型对该样本实体进行特征提取，得到该样本实体的实体特征，将该样本实体的实体特征与至少两个候选实体的实体特征进行匹配，输出该样本实体对应的预测候选实体。

步骤C、电子设备基于该样本实体对应的预测候选实体和目标候选实体，对该初始内容处理模型的模型参数进行更新，直至符合目标条件时停止，得到内容处理模型。

在一种可能实现方式中，上述步骤B中，电子设备进行特征提取步骤可以通过特征提取网络实现。

在一个具体的可能实施例中，该特征提取网络可以包括多个分支，每个分支用于对目标实体数据中的一种数据进行特征提取，得到一种特征。例如，以目标实体数据包括目标实体的名称、关系信息、文本属性信息、图像数据四种数据为例，该特征提取网络包括四个分支：第一分支、第二分支、第三分支、第四分支。第一分支能够对目标实体的名称进行特征提取，得到名称特征。第二分支能够根据目标实体与其他实体之间的关系信息，对目标实体进行特征提取，得到关系特征。第三分支能够对目标实体的文本属性信息进行特征提取，得到文本特征。第四分支能够对图像数据进行特征提取，得到图像特征。电子设备可以融合该四个分支的结果，将四种特征加权得到最终的实体特征，以该实体特征进行匹配步骤。

上述样本实体的实体特征与候选实体的实体特征匹配的过程可以理解为对目标实体的分类过程，该分类过程能够通过分类器实现。在一种可能实现方式中，该初始内容处理模型包括至少一个分类器。上述步骤B中，初始内容处理模型提取到实体特征后，能够将样本实体的实体特征与至少两个候选实体的实体特征输入至少一个分类器中进行分类。

在一种可能实现方式中，电子设备在将多个实体的实体特征输入分类器之前，可以根据目标实体的实体特征与候选实体的实体特征之间的相似度进行一步筛选，以减少输入分类器的数据量，这样分类器能够对筛选出的实体进行实体特征匹配的步骤，计算量大大减少，能够有效提高内容处理效率。

在该实现方式中，电子设备获取该目标实体的实体特征与该至少两个候选实体的实体特征的相似度，将该至少两个候选实体中，获取第一候选实体，该第一候选实体对应的该相似度大于或等于该目标候选实体对应的目标相似度，将该目标实体的实体特征与该第一候选实体的实体特征输入该至少一个分类器中，由该至少一个分类器基于输入的实体特征对该目标实体进行分类，确定该目标实体对应的预测候选实体。

上述分类过程中，电子设备基于多个分类器进行分类时，能够每次分类后进行筛选，再进行分类。具体地，电子设备将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入至少两个分类器中，由所述至少两个分类器中前一个分类器对所述目标实体进行分类，基于分类结果，从所述至少两个候选实体的实体特征中筛选部分实体特征输入后一个分类器，将最后一个分类器的目标分类结果作为所述目标实体的分类结果。

相应地，对于分类器的训练过程，在一个示例中，电子设备可以获取样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征，一个样本实体对应一个目标候选实体，基于所述至少一个分类器，对所述样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征进行分类，确定样本实体对应的预测候选实体，在分类过程中，每个分类器的输入基于前一个分类器的分类结果中候选实体与目标候选实体的分类结果筛选得到，基于预测候选实体与目标候选实体，对至少一个分类器的模型参数进行更新。

在至少一个分类器的数量为至少两个时，电子设备在对多个分类器训练时能够根据前一个分类器的分类结果对候选实体筛选后再输入下一个分类器，具体地，电子设备可以根据所述样本实体的实体特征与至少两个候选实体的实体特征的相似度，从至少两个候选实体中筛选出第一数量的第一候选实体，所述第一候选实体与样本实体的相似度大于或等于目标候选实体与样本实体的相似度。电子设备将第一候选实体的实体特征和样本实体的实体特征输入第一分类器中，由所述第一分类器分别输出每个第一候选实体的第一分类结果，电子设备从第一候选实体中筛选出第二候选实体，所述第二候选实体为第一分类结果中概率大于或等于目标候选实体的概率的第一候选实体，将第二候选实体输入第二分类器，由所述第二分类器分别输出每个第二候选实体的第二分类结果，继续进行筛选和分类步骤，将最后一个分类器的输出作为预测候选实体。

通过相似度的获取过程，电子设备可以先对候选实体进行初步了解，以减少输入分类器的候选实体的实体特征的数量，进而减少计算量，提高运算效率。后续电子设备又通过分类器的分类结果，将分类结果中比所标注的目标候选实体对应概率要大的候选实体以及目标候选实体本身作为下一个分类器的输入。通过多个分类器逐步的分类，最终我们希望通过模型参数调整使得模型进行分类时，得到的分类结果中该目标候选实体的概率均是最大，这样该多个分类器的分类准确率比较高，通过训练好的多个分类器对目标实体进行分类时则能够得到更准确的结果。

例如，在一个具体示例中，在对两个知识图谱（KG1和KG2）中的实体对齐的场景中，该分类器的数量为三个，也可以称之为三个级的分类器。在此将该三个分类器分别称为：一级分类器、二级分类器和三级分类器。如图5所示，三个分类器分别为：一级分类器403、二级分类器404和三级分类器405。电子设备可以先提取KG1中目标实体的实体特征，得到实体1嵌入（Entity1 Embedding）401，也即是目标实体的实体特征401，以及提取KG2中候选实体的实体特征，得到实体1嵌入至实体N嵌入（Entity1 Embedding至EntityNEmbedding）402，也即是N个候选实体的实体特征402，然后电子设备可以确定KG1中目标实体的实体特征与候选实体的实体特征之间的相似度，按照相似度从大到小进行排序，获取前n1（Top n1）个候选实体的实体特征。其中，Top n1的截止点N是gt（ground truth）所在的位置。gt也即是指正确的标注数据，也即是该目标实体真正匹配的目标实体。电子设备可以将Top n1个候选实体的实体特征402与目标实体的实体特征401输入一级分类器403中，一级分类器403能够分类并输出分类结果。电子设备基于分类结果中概率对上述前n1个候选实体的实体特征进行排序，通过重采样406得到前n2（Top n2）个候选实体的实体特征输入二级分类器404中，将确定与目标实体对齐的候选实体的实体特征和目标实体的实体特征再输入二级分类器404中，再次进行分类。其中，Top n2个候选实体包括概率比目标实体的概率大的候选实体以及目标实体本身。以此类推，电子设备再排序，重采样407前n3个候选实体的实体特征输入三级分类器405中，也即是将二级分类器404输出的对齐的候选实体和目标实体的实体特征输入三级分类器405中，将三级分类器405确定出的候选实体确定为目标候选实体。上述分类过程是将KG1的实体1嵌入与KG2中每个候选实体嵌入作为一对进行分类，通过分类确定二者是否对齐，输出的结果包括两种：对齐408和不对齐409。通过三个级的分类器，逐步对目标实体与候选实体进行分类，通过多次分类，能够保证最终分类结果的准确性，进而提高内容处理的准确性。

如果该分类器的数量为多个，每个分类器还可以对应一个损失函数，也即是，步骤C中，电子设备会针对每个分类器，获取损失值，综合多个损失值，获取综合损失值，基于综合损失值，对模型参数进行调整。又或者，根据每个损失值对每个分类器的模型参数进行调整。该目标条件可以为综合损失值收敛或者每个分类器对应的损失值收敛，当然，该目标条件还可以为其他条件，例如，迭代次数达到目标次数，本申请实施例对此不作限定。

307、电子设备根据该目标实体对应的目标候选实体，对该待处理内容进行更新。

电子设备确定了目标实体对应的目标候选实体后，也即是确定该目标实体和目标候选实体对应真实世界中同一事物后，可以以目标候选实体对待处理内容进行更新。

电子设备对待处理内容的更新方式可以包括多种，相关技术人员或用户可以根据需求进行设置，本申请实施例对此不作限定。下面提供三种可能的更新方式，本申请实施例可以采用任一种方式实现更新步骤。

方式一、电子设备将该实体数据中该目标实体替换为该目标实体对应的候选实体。

在该方式一中，电子设备可以通过候选实体来替换目标实体，将目标实体统一为候选实体，例如，以专业术语来替换口语表述，将待处理内容转化为一种专业表述，或者统一一种表述方式，对待处理内容进行处理，将其转化为这种表述方式的表达，从而能够快速了解该待处理内容。

方式二、电子设备将该目标实体对应的候选实体的实体数据添加至该待处理内容中，将该候选实体作为该待处理内容中的一个实体，为该目标实体和该候选实体建立关联关系。

在该方式二中，电子设备可以将候选实体加入待处理内容中，将其融合到待处理内容中，与目标实体关联，以扩充待处理内容，将候选实体融进该待处理内容中。例如，电子设备可以通过该内容处理方法，将KG1和KG2合并，得到一个综合的KG。

方式三、电子设备将该目标实体对应的候选实体的实体数据添加至该目标实体数据中，将该目标实体对应的候选实体作为该目标实体的名称。

在该方式三中，电子设备可以确定待处理内容中每个目标实体的其它表述，以此来增加对待处理内容中实体的解释，提高待处理内容的信息量和可理解性。

在一种可能实现方式中，电子设备通过上述步骤301至步骤305，能够获取到实体的实体特征，该实体特征能够更准确地表征实体，通过该实体特征，还能够为其他下游业务提供服务。例如，链接预测、实体分类、实体解析、问答系统、关系抽取、系统推荐等。

在一种可能实现方式中，该实体匹配也可以应用于其他业务场景中。每个候选实体可以对应于不同的目标功能，电子设备也可以在步骤306之后，匹配到目标候选实体后，能够根据该目标实体对应的目标候选实体，执行该目标候选实体对应的目标功能。

上述所有可选技术方案，能够采用任意结合形成本申请的可选实施例，在此不再一一赘述。

图6是本申请实施例提供的一种内容处理装置的结构示意图，参见图6，该装置包括：

获取模块501，用于从待处理内容中，获取目标实体数据，所述目标实体数据包括目标实体对应的图像数据；

提取模块502，用于对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的图像特征；

所述获取模块501，还用于基于所述图像特征，获取所述目标实体的实体特征；

匹配模块503，用于对所述目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定所述目标实体对应的目标候选实体；

更新模块504，用于根据所述目标实体对应的目标候选实体，对所述待处理内容进行更新。

所述获取模块501还用于根据所述目标实体数据，获取所述目标实体的名称特征、关系特征或文本特征中的至少一项；

在一种可能实现方式中，所述匹配模块503用于基于所述目标实体的实体特征和所述至少两个候选实体的实体特征，对所述目标实体进行分类，得到分类结果，所述分类结果用于指示所述目标实体对应的目标候选实体。

在一种可能实现方式中，所述匹配模块503用于将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入级联的至少一个分类器中，由所述级联的至少一个分类器对所述目标实体进行分类，得到分类结果。

所述匹配模块503用于：

在一种可能实现方式中，所述匹配模块503用于：

在一种可能实现方式中，所述获取模块501用于：

所述获取模块501用于从所述第一知识图谱中提取目标实体的实体数据作为所述目标实体数据。

在一种可能实现方式中，所述更新模块504用于执行下述任一项：

本申请实施例提供的装置，引入了图像数据，而不是局限于实体的名称，能够对实体更形象、更准确地进行表征，以根据图像数据得到的实体特征进行匹配，也能提高匹配结果的准确性，进而提高内容处理的准确性，相较于简单地基于实体名称进行匹配的方式，考虑的因素更全面，以更直观、更形象的数据为准进行特征表达，能够大大减小错误率，提高准确性。

需要说明的是：上述实施例提供的内容处理装置在进行内容处理时，仅以上述各功能模块的划分进行举例说明，实际应用中，能够根据需要而将上述功能分配由不同的功能模块完成，即将内容处理装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的内容处理装置与内容处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

上述方法实施例中的电子设备能够实现为终端。例如，图7是本申请实施例提供的一种终端的结构框图。该终端600可以是便携式移动终端，比如：智能手机、平板电脑、MP3（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3）播放器、MP4（Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4）播放器、笔记本电脑或台式电脑。终端600还可能被称为用户设备、便携式终端、膝上型终端、台式终端等其他名称。

通常，终端600包括有：处理器601和存储器602。

处理器601可以包括一个或多个处理核心，比如4核心处理器、8核心处理器等。处理器601可以采用DSP（Digital Signal Processing，数字信号处理）、FPGA（Field－Programmable Gate Array，现场可编程门阵列）、PLA（Programmable Logic Array，可编程逻辑阵列）中的至少一种硬件形式来实现。处理器601也可以包括主处理器和协处理器，主处理器是用于对在唤醒状态下的数据进行处理的处理器，也称CPU（Central ProcessingUnit，中央处理器）；协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中，处理器601可以集成有GPU（Graphics Processing Unit，图像处理器）， GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中，处理器601还可以包括AI（Artificial Intelligence，人工智能）处理器，该AI处理器用于处理有关机器学习的计算操作。

存储器602可以包括一个或多个计算机可读存储介质，该计算机可读存储介质可以是非暂态的。存储器602还可包括高速随机存取存储器，以及非易失性存储器，比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中，存储器602中的非暂态的计算机可读存储介质用于存储至少一个指令，该至少一个指令用于被处理器601所执行以实现本申请中方法实施例提供的内容处理方法。

在一些实施例中，终端600还可选包括有：外围设备接口603和至少一个外围设备。处理器601、存储器602和外围设备接口603之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口603相连。具体地，外围设备包括：射频电路604、显示屏605、摄像头组件606、音频电路607、定位组件608和电源609中的至少一种。

外围设备接口603可被用于将I/O（Input /Output，输入/输出）相关的至少一个外围设备连接到处理器601和存储器602。在一些实施例中，处理器601、存储器602和外围设备接口603被集成在同一芯片或电路板上；在一些其他实施例中，处理器601、存储器602和外围设备接口603中的任意一个或两个可以在单独的芯片或电路板上实现，本实施例对此不加以限定。

射频电路604用于接收和发射RF（Radio Frequency，射频）信号，也称电磁信号。射频电路604通过电磁信号与通信网络以及其他通信设备进行通信。射频电路604将电信号转换为电磁信号进行发送，或者，将接收到的电磁信号转换为电信号。可选地，射频电路604包括：天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路604可以通过至少一种无线通信协议来与其它终端进行通信。该无线通信协议包括但不限于：万维网、城域网、内联网、各代移动通信网络（2G、3G、4G及5G）、无线局域网和/或WiFi(Wireless Fidelity，无线保真）网络。在一些实施例中，射频电路604还可以包括NFC（Near Field Communication，近距离无线通信）有关的电路，本申请对此不加以限定。

显示屏605用于显示UI（User Interface，用户界面）。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏605是触摸显示屏时，显示屏605还具有采集在显示屏605的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器601进行处理。此时，显示屏605还可以用于提供虚拟按钮和/或虚拟键盘，也称软按钮和/或软键盘。在一些实施例中，显示屏605可以为一个，设置在终端600的前面板；在另一些实施例中，显示屏605可以为至少两个，分别设置在终端600的不同表面或呈折叠设计；在另一些实施例中，显示屏605可以是柔性显示屏，设置在终端600的弯曲表面上或折叠面上。甚至，显示屏605还可以设置成非矩形的不规则图形，也即异形屏。显示屏605可以采用LCD(Liquid Crystal Display，液晶显示屏)、OLED(Organic Light-Emitting Diode，有机发光二极管)等材质制备。

摄像头组件606用于采集图像或视频。可选地，摄像头组件606包括前置摄像头和后置摄像头。通常，前置摄像头设置在终端的前面板，后置摄像头设置在终端的背面。在一些实施例中，后置摄像头为至少两个，分别为主摄像头、景深摄像头、广角摄像头、长焦摄像头中的任意一种，以实现主摄像头和景深摄像头融合实现背景虚化功能、主摄像头和广角摄像头融合实现全景拍摄以及VR（Virtual Reality，虚拟现实）拍摄功能或者其它融合拍摄功能。在一些实施例中，摄像头组件606还可以包括闪光灯。闪光灯可以是单色温闪光灯，也可以是双色温闪光灯。双色温闪光灯是指暖光闪光灯和冷光闪光灯的组合，可以用于不同色温下的光线补偿。

音频电路607可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波，并将声波转换为电信号输入至处理器601进行处理，或者输入至射频电路604以实现语音通信。出于立体声采集或降噪的目的，麦克风可以为多个，分别设置在终端600的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器601或射频电路604的电信号转换为声波。扬声器可以是传统的薄膜扬声器，也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时，不仅可以将电信号转换为人类可听见的声波，也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中，音频电路607还可以包括耳机插孔。

定位组件608用于定位终端600的当前地理位置，以实现导航或LBS（LocationBased Service，基于位置的服务）。定位组件608可以是基于美国的GPS（GlobalPositioning System，全球定位系统）、中国的北斗系统或俄罗斯的伽利略系统的定位组件。

电源609用于为终端600中的各个组件进行供电。电源609可以是交流电、直流电、一次性电池或可充电电池。当电源609包括可充电电池时，该可充电电池可以是有线充电电池或无线充电电池。有线充电电池是通过有线线路充电的电池，无线充电电池是通过无线线圈充电的电池。该可充电电池还可以用于支持快充技术。

在一些实施例中，终端600还包括有一个或多个传感器610。该一个或多个传感器610包括但不限于：加速度传感器611、陀螺仪传感器612、压力传感器613、指纹传感器614、光学传感器615以及接近传感器616。

加速度传感器611可以检测以终端600建立的坐标系的三个坐标轴上的加速度大小。比如，加速度传感器611可以用于检测重力加速度在三个坐标轴上的分量。处理器601可以根据加速度传感器611采集的重力加速度信号，控制显示屏605以横向视图或纵向视图进行用户界面的显示。加速度传感器611还可以用于游戏或者用户的运动数据的采集。

陀螺仪传感器612可以检测终端600的机体方向及转动角度，陀螺仪传感器612可以与加速度传感器611协同采集用户对终端600的3D动作。处理器601根据陀螺仪传感器612采集的数据，可以实现如下功能：动作感应（比如根据用户的倾斜操作来改变UI）、拍摄时的图像稳定、游戏控制以及惯性导航。

压力传感器613可以设置在终端600的侧边框和/或显示屏605的下层。当压力传感器613设置在终端600的侧边框时，可以检测用户对终端600的握持信号，由处理器601根据压力传感器613采集的握持信号进行左右手识别或快捷操作。当压力传感器613设置在显示屏605的下层时，由处理器601根据用户对显示屏605的压力操作，实现对UI界面上的可操作性控件进行控制。可操作性控件包括按钮控件、滚动条控件、图标控件、菜单控件中的至少一种。

指纹传感器614用于采集用户的指纹，由处理器601根据指纹传感器614采集到的指纹识别用户的身份，或者，由指纹传感器614根据采集到的指纹识别用户的身份。在识别出用户的身份为可信身份时，由处理器601授权该用户执行相关的敏感操作，该敏感操作包括解锁屏幕、查看加密信息、下载软件、支付及更改设置等。指纹传感器614可以被设置在终端600的正面、背面或侧面。当终端600上设置有物理按键或厂商Logo时，指纹传感器614可以与物理按键或厂商Logo集成在一起。

光学传感器615用于采集环境光强度。在一个实施例中，处理器601可以根据光学传感器615采集的环境光强度，控制显示屏605的显示亮度。具体地，当环境光强度较高时，调高显示屏605的显示亮度；当环境光强度较低时，调低显示屏605的显示亮度。在另一个实施例中，处理器601还可以根据光学传感器615采集的环境光强度，动态调整摄像头组件606的拍摄参数。

接近传感器616，也称距离传感器，通常设置在终端600的前面板。接近传感器616用于采集用户与终端600的正面之间的距离。在一个实施例中，当接近传感器616检测到用户与终端600的正面之间的距离逐渐变小时，由处理器601控制显示屏605从亮屏状态切换为息屏状态；当接近传感器616检测到用户与终端600的正面之间的距离逐渐变大时，由处理器601控制显示屏605从息屏状态切换为亮屏状态。

本领域技术人员可以理解，图7中示出的结构并不构成对终端600的限定，可以包括比图示更多或更少的组件，或者组合某些组件，或者采用不同的组件布置。

上述方法实施例中的电子设备能够实现为服务器。例如，图8是本申请实施例提供的一种服务器的结构示意图，该服务器700可因配置或性能不同而产生比较大的差异，能够包括一个或一个以上处理器（Central Processing Units，CPU）701和一个或一个以上的存储器702，其中，所述存储器702中存储有至少一条程序代码，所述至少一条程序代码由所述处理器701加载并执行以实现上述各个方法实施例提供的内容处理方法。当然，该服务器还能够具有有线或无线网络接口以及输入输出接口等部件，以便进行输入输出，该服务器还能够包括其他用于实现设备功能的部件，在此不做赘述。

在示例性实施例中，还提供了一种计算机可读存储介质，例如包括至少一条程序代码的存储器，上述至少一条程序代码由可由处理器执行以完成上述实施例中的内容处理方法。例如，计算机可读存储介质能够是只读存储器（Read-Only Memory，简称：ROM）、随机存取存储器（Random Access Memory，简称：RAM）、只读光盘（Compact Disc Read-OnlyMemory，简称：CD-ROM）、磁带、软盘和光数据存储设备等。

在示例性实施例中，还提供一种计算机程序产品或计算机程序，所述计算机程序产品或所述计算机程序包括一条或多条程序代码，所述一条或多条程序代码存储在计算机可读存储介质中。电子设备的一个或多个处理器能够从计算机可读存储介质中读取所述一条或多条程序代码，所述一个或多个处理器执行所述一条或多条程序代码，使得电子设备能够执行上述内容处理方法。

应理解，在本申请的各种实施例中，上述各过程的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

应理解，根据A确定B并不意味着仅仅根据A确定B，还能够根据A和/或其它信息确定B。

本领域普通技术人员能够理解实现上述实施例的全部或部分步骤能够通过硬件来完成，也能够通过程序来指令相关的硬件完成，该程序能够存储于一种计算机可读存储介质中，上述提到的存储介质能够是只读存储器，磁盘或光盘等。

以上描述仅为本申请的可选实施例，并不用以限制本申请，凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种内容处理方法，其特征在于，所述方法包括：

基于所述图像特征，获取所述目标实体的实体特征；

2.根据权利要求1所述的方法，其特征在于，所述目标实体数据还包括所述目标实体的名称、所述目标实体与所述待处理内容中其他实体之间的关系信息或文本属性信息的至少一项；

所述方法还包括：

根据所述目标实体数据，获取所述目标实体的名称特征、关系特征或文本特征中的至少一项；

所述基于所述图像特征，获取所述目标实体的实体特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述根据所述目标实体数据，获取所述目标实体的名称特征、关系特征或文本特征中的至少一项，包括：

分别对所述目标实体数据中所述目标实体的名称、所述目标实体与所述待处理内容中其他实体之间的关系信息或文本属性信息的至少一项进行嵌入处理，得到目标长度的名称特征、关系特征或文本特征中的至少一项；

所述对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的图像特征，包括：

对所述目标实体数据中图像数据进行特征提取，得到所述目标实体的第一图像特征；

根据目标映射关系，将所述第一图像特征映射为目标长度的第二图像特征，将所述第二图像特征作为所述目标实体的图像特征。

4.根据权利要求1所述的方法，其特征在于，所述对所述目标实体的实体特征与至少两个候选实体的实体特征进行匹配，确定所述目标实体对应的目标候选实体，包括：

将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入级联的至少一个分类器中，由所述级联的至少一个分类器对所述目标实体进行分类，得到分类结果。

5.根据权利要求4所述的方法，其特征在于，分类器的数量为至少两个；至少两个分类器串联；

所述将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入至少一个分类器中，由所述至少一个分类器对所述目标实体进行分类，得到分类结果，包括：

6.根据权利要求5所述的方法，其特征在于，所述将所述目标实体的实体特征和所述至少两个候选实体的实体特征输入至少两个分类器中，由所述至少两个分类器中前一个分类器对所述目标实体进行分类，基于分类结果，从所述至少两个候选实体的实体特征中筛选部分实体特征输入后一个分类器，将最后一个分类器的目标分类结果作为所述目标实体的分类结果，包括：

7.根据权利要求5所述的方法，其特征在于，所述至少一个分类器的训练过程包括：

8.根据权利要求7所述的方法，其特征在于，所述至少一个分类器的数量为至少两个，所述基于所述至少一个分类器，对所述样本实体数据中样本实体的实体特征以及至少两个候选实体的实体特征进行分类，确定样本实体对应的预测候选实体，在分类过程中，每个分类器的输入基于前一个分类器的分类结果中候选实体与目标候选实体的分类结果筛选得到，包括：

9.根据权利要求1所述的方法，其特征在于，所述从待处理内容中，获取目标实体数据，包括：

10.根据权利要求1所述的方法，其特征在于，所述待处理内容为第一知识图谱，所述至少两个候选实体为第二知识图谱中的实体，所述知识图谱包括至少两个实体的实体数据；

所述从待处理内容中，获取目标实体数据，包括：

从所述第一知识图谱中提取目标实体的实体数据作为所述目标实体数据。

11.根据权利要求1所述的方法，其特征在于，所述根据所述目标实体对应的候选实体，对所述待处理内容进行更新，包括下述任一项：

12.根据权利要求1所述的方法，其特征在于，所述方法包括：

将所述待处理内容输入内容处理模型中，由所述内容处理模型执行所述目标实体数据获取、特征提取、实体特征匹配的步骤，输出目标实体对应的目标候选实体。

13.一种内容处理装置，其特征在于，所述装置包括：

14.一种电子设备，其特征在于，所述电子设备包括一个或多个处理器和一个或多个存储器，所述一个或多个存储器中存储有至少一条程序代码，所述至少一条程序代码由所述一个或多个处理器加载并执行以实现如权利要求1至权利要求12任一项所述的内容处理方法。

15.一种计算机可读存储介质，其特征在于，所述存储介质中存储有至少一条程序代码，所述至少一条程序代码由处理器加载并执行以实现如权利要求1至权利要求12任一项所述的内容处理方法。