CN113254683A - 数据处理方法及装置、标签识别方法及装置 - Google Patents
数据处理方法及装置、标签识别方法及装置 Download PDFInfo
- Publication number
- CN113254683A CN113254683A CN202010082545.7A CN202010082545A CN113254683A CN 113254683 A CN113254683 A CN 113254683A CN 202010082545 A CN202010082545 A CN 202010082545A CN 113254683 A CN113254683 A CN 113254683A
- Authority
- CN
- China
- Prior art keywords
- video
- label
- knowledge graph
- identified
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000003672 processing method Methods 0.000 title claims abstract description 35
- 238000010801 machine learning Methods 0.000 claims abstract description 35
- 238000003860 storage Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 19
- 238000012552 review Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 21
- 238000004891 communication Methods 0.000 description 8
- 238000012550 audit Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 4
- 238000010276 construction Methods 0.000 description 4
- 239000004984 smart glass Substances 0.000 description 4
- 230000003321 amplification Effects 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000009795 derivation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012015 optical character recognition Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000002537 cosmetic Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/45—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供数据处理方法及装置、标签识别方法及装置,其中,所述数据处理方法包括获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;将标签知识图谱、关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签,并将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱,以此扩充关系知识图谱和重构关系知识图谱的结构,此外,所述数据处理方法还可以通过多模态、知识图谱等技术提高待识别数据的标签识别精确度和召回率。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种数据处理方法。本说明书一个或者多个实施例同时涉及一种标签识别方法,一种视频审核方法,一种视频搜索方法,一种数据处理装置,一种标签识别装置,一种视频审核装置,一种视频搜索装置,四种计算设备,以及四种计算机可读存储介质。
背景技术
目前为了方便对视频进行理解,一般会为视频设置各种标签以方便对视频的理解以及基于标签对视频进行后续业务的处理。
发明内容
有鉴于此,本说明书施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种标签识别方法,一种视频审核方法,一种视频搜索方法,一种数据处理装置,一种标签识别装置,一种视频审核装置,一种视频搜索装置,四种计算设备,以及四种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种数据处理方法,包括:
获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
根据本说明书实施例的第二方面,提供了一种标签识别方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
根据本说明书实施例的第三方面,提供了一种视频审核方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收业务方针对视频业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
根据本说明书实施例的第四方面,提供了一种视频搜索方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
根据本说明书实施例的第五方面,提供了一种数据处理装置,包括:
待识别数据获取模块,被配置为获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
目标标签获得模块,被配置为将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
知识图谱更新模块,被配置为将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
根据本说明书实施例的第六方面,提供了一种标签识别装置,包括:
待识别视频获取模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
根据本说明书实施例的第七方面,提供了一种视频审核装置,包括:
视频标签设置模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
审核策略接收模块,被配置为接收用户上传的针对视频业务的业务审核策略;
审核结果确定模块,被配置为将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
根据本说明书实施例的第八方面,提供了一种视频搜索装置,包括:
初始标签设置模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
视频目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
搜索请求接收模块,被配置为接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
目标视频确定模块,被配置为基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
根据本说明书实施例的第九方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
根据本说明书实施例的第十方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
根据本说明书实施例的第十一方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户上传的针对视频业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
根据本说明书实施例的第十二方面,提供了一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
根据本说明书实施例的第十三方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述数据处理方法的步骤。
根据本说明书实施例的第十四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述标签识别方法的步骤。
根据本说明书实施例的第十五方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述视频审核方法的步骤。
根据本说明书实施例的第十六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述视频搜索方法的步骤。
本说明书一个实施例实现了数据处理方法及装置、标签识别方法及装置,其中,所述数据处理方法包括获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签,并将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱,以此扩充知识图谱和重构知识图谱的结构,此外,所述数据处理方法还可以通过多模态、知识图谱等技术提高待识别数据的标签识别精确度和召回率。
附图说明
图1是本说明书一个实施例提供的一种数据处理方法的应用场景示例性流程图;
图2是本说明书一个实施例提供的一种数据处理方法的流程图;
图3是本说明书一个实施例提供的一种标签识别方法的流程图;
图4是本说明书一个实施例提供的一种标签识别方法的处理流程图;
图5是本说明书一个实施例提供的一种视频审核方法的流程图;
图6是本说明书一个实施例提供的一种视频搜索方法的流程图;
图7是本说明书一个实施例提供的一种数据处理装置的结构示意图;
图8是本说明书一个实施例提供的一种标签识别装置的结构示意图;
图9是本说明书一个实施例提供的一种视频审核装置的结构示意图;
图10是本说明书一个实施例提供的一种视频搜索装置的结构示意图;
图11是本说明书一个实施例提供的第一种计算设备的结构框图;
图12是本说明书一个实施例提供的第二种计算设备的结构框图;
图13是本说明书一个实施例提供的第三种计算设备的结构框图;
图14是本说明书一个实施例提供的第四种计算设备的结构框图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
知识图谱:Knowledge Graph,用来描述真实世界中存在的各种实体和概念,以及它们之间的关系;本说明书实施例中,在视频分析中,标签作为实体,知识图谱构建了标签之间的关系,并通过一些已有的和标签具有强相关关系的知识实体衍生出一个多维的知识网络,通过相关关系建立各个实体之间的连接,从而可以通过一个输入实体衍生出各种各样的准确信息。例如对于标签中的节目类,输入一个固定的节目会衍生出一些原生的知识,如节目的导演、出品单位、国家、语言、生产年代等信息。
多模态:MultiModal,是多媒体中对信息的各种表示方式,如图像、文本、语音等。
图卷积网络:英文全称:Graph Convolutional Network,英文简称:GCN,通常用于提取知识图谱的空间特征。
在本说明书中,提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种标签识别方法,一种视频审核方法,一种视频搜索方法,一种数据处理装置,一种标签识别装置,一种视频审核装置,一种视频搜索装置,四种计算设备,以及四种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
参见图1,图1对本说明书一个实施例提供的一种数据处理方法的应用场景的进行示例性说明。
应用场景中包括终端和服务器。
具体的,用户或业务方通过终端向服务器发送需要进行目标标签识别的待识别视频;
服务器在接收到该待识别视频之后,将该待识别视频拆分为图像、文本以及音频等多模态数据,并分别对图像、文本以及音频等多模态数据进行解析,根据解析结果为图像数据设置对应的图像标签,为文本数据设置对应的文本标签,为音频数据设置对应的音频标签,而图像标签、文本标签以及音频标签组成待识别视频的初始标签序列;
然后将该初始标签序列,以及预先构建的标签知识图谱、关系知识图谱输入至图卷积网络模型中,经过图卷积网络模型的预测,获得待识别视频的目标标签列表;
最后将该目标标签列表中的标签作为关系知识图谱的实体回流至该关系知识图谱中,进行该关系知识图谱的重建,以此来扩充该关系知识图谱和重构该关系知识图谱的结构;具体处理过程可参见图2。
参见图2,图2示出了根据本说明书一个实施例提供的一种数据处理方法的流程图,包括步骤202至步骤206。
步骤202:获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据。
具体的,获取待识别数据之后,会对获取的待识别数据进行解析,且根据解析结果为所述待识别数据设置对应的初始标签。
在所述待识别数据包括图像数据的情况下,对该图像数据进行解析,以获取该图像数据中的图像特征,基于该图像特征为该图像数据设置对应的初始标签,例如图像数据为拍摄的小狗的图片,那么对该图像数据进行解析之后,获取该图像数据中的图像特征为“白色”、“狗”,此时就可以以“白色”、“狗”作为该图像数据的初始标签。
在所述待识别数据包括文本数据的情况下,对该文本数据进行解析,以获取该文本数据中的文本特征,基于该文本特征为该文本数据设置对应的初始标签,例如文本数据为电视剧介绍,那么对该文本数据进行解析之后,获取该文本数据中的文本特征为该电视剧介绍中的电视剧名称、主演以及电视剧放映时间等,此时就可以以具体的电视剧名称、主演以及电视剧放映时间等作为该文本数据的初始标签。
在所述待识别数据包括音频数据的情况下,对该音频数据进行解析,以获取该音频数据中的音频特征,基于该音频特征为该音频数据设置对应的初始标签,例如音频数据为一段电影台词,那么对该音频数据进行解析之后,获取该音频数据中的音频特征为该台词中包含的人物名称以及该人物所进行的事件,此时就可以以具体的人物名称以及该人物所进行的事件作为该音频数据的初始标签。
在所述待识别数据包括视频数据的情况下,可以先将该视频数据拆分为文本、图像以及音频数据,然后分别参照上述方式分别对文本、图像以及音频数据进行解析,以获取文本数据中的文本特征、图像数据中的图像特征以及音频数据中的音频特征,并基于文本特征、图像特征以及音频特征为该视频数据设置初始标签。
步骤204:将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签。
具体的,所述知识图谱包括标签知识图谱和/或关系知识图谱,其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
具体实施时,在所述知识图谱包括标签知识图谱的情况下,
所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述标签知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签。
在所述知识图谱包括关系知识图谱的情况下,所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签。
在所述知识图谱包括标签知识图谱和关系知识图谱的情况下,
所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述标签知识图谱、所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签。
而在实际使用中,为了得到待识别数据较为准确的目标标签,一般会采用将所述标签知识图谱、所述关系知识图谱以及所述初始标签同时输入至机器学习模型中,得到所述待识别数据的目标标签的方式。
具体的,获取的历史标签包括利用已有的数据收集的标签,例如已有的数据中存在标签“游行”、“示威”、“暴利”,通过该已有的数据中存在的标签可以得出标签“游行”、“示威”、“暴利”之间存在关联关系,那么则可以以标签“游行”、“示威”、“暴利”为实体以及标签“游行”、“示威”、“暴利”的关系构建标签知识图谱,例如利用已有的数据收集标签作为实体E1的集合,利用收集的标签之间的关系作为关系R1的集合,有序三元组集合为T1,构建得到的标签知识图谱记为LG=(E1,R1,T1)。
构建标签知识图谱的同时,基于所述历史标签构建关系知识图谱,具体的,将每个历史标签作为实体,遍历预设网站,获取该预设网站中与该实体关联的目标实体,通过该历史标签与遍历预设网站获得的目标实体之间的关联关系构建关系知识图谱;沿用上例,利用已有的世界知识,从各个历史标签实体E1出发,构建大型关系知识图谱,并将构建的关系知识图谱记为KG=(E2,R2,T2),其中,E2为标签实体的集合,R2为关系集合,T2为有序三元组集合。
具体实施时,已有的世界知识可以理解为通过预设网站可以获取到的现有的任何知识,以预设网站为某检索网站为例,已有的世界知识为将历史标签实体E1为检索词遍历该检索网站获取到的任意内容均为已有的世界知识;例如历史标签实体E1为明星a,将明星a为检索词遍历该检索网站获取到的该明星a的个人简介(姓名、身高、体重、星座以及出生年月等)即为已有的世界知识,而该明星a的个人简介中的姓名、身高、体重、星座以及出生年月等即可作为通过历史标签遍历预设网站获取到的实体。
实际应用中,基于历史标签、通过所述历史标签获取的预设网站中的实体以及历史标签与获取的实体之间的关系可以构建一个涉及范围较广的大型关系知识图谱。
此外,实际应用中,所述机器学习模型包括图卷积网络模型,图卷积网络模型GCN能够处理具有广义拓扑图结构的数据,并深入发掘其特征和规律;GCN可以在节点之间进行信息传递,其核心思想是通过节点之间的信息传播来更新节点的表示,本说明书实施例中,节点可以理解为标签或实体。
本说明书实施例中,基于标签知识图谱中的历史标签、关系知识图谱中的历史标签、通过历史标签获得的实体以及待识别数据的初始标签使用GCN来建立多个标签之间的相关性,并由此作为输入,经过GCN的预测,得到待识别数据的新的标签列表,即预测后的准确的目标标签。
举例说明,待识别数据的初始标签为“暴力”、“枪支”、“游戏”,在将该初始标签、标签知识图谱、关系知识图谱输入GCN,经过GCN的预测后得到待识别数据的目标标签为“暴力”、“枪支”、“游行”。
实际使用中,为了保证系统的运行效率,可以对知识图谱实现量级构建或裁剪,例如某具体应用场景中,系统设定得到待识别数据的目标标签的返回速度较短,那么此时则可以对基于获取的历史标签构建的知识图谱进行裁剪,以降低该知识图谱的数据量,提高待识别数据的目标标签的返回速度;或者在进行数据处理之前,基于不同的运行速度设置不同数据量级的知识图谱,在具体使用时,基于实际的运行速度选择不同量级的知识图谱,以实现定制化,极大的提高系统运行效率。
在本说明书另一实施例中,在得到所述待识别数据的目标标签之后,可以基于所述目标标签为所述待识别数据生成对应的文本摘要;例如待识别数据为一篇文章,得到的该文章的目标标签可以为经过自然语言处理后的该文章每一段内容的关键意图,然后将该文章的目标标签进行组合后,可以形成该文章的文本摘要;例如一篇论文,通过上述目标标签的获取方式得到目标标签后,将目标标签进行组合后,即可得到该论文的包含“论文的作者、创作时间以及核心内容等”的文本摘要;若所述待识别数据为一段视频时,得到的该视频的目标标签可以为经过视频处理方法处理后的该视频的关键帧的人物、动作、发生事项等,然后将该视频的目标标签进行组合后,则可以形成该视频的文字介绍,例如一段球赛,通过上述目标标签的获取方式得到目标标签后,将目标标签进行组合后,即可得到该球赛视频的包含“参与人物、打球动作、比赛成绩等”关键内容的文字介绍。
相应的,若待识别数据为图像或音频的情况下,均可以以上述方式为待识别数据生成相应的文本摘要,以提升用户体验,在此不再赘述。
步骤206:将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱。
具体的,在所述知识图谱包括标签知识图谱的情况下,所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述标签知识图谱的实体添加至所述标签知识图谱,实现对所述标签知识图谱的更新,以获得更新后的标签知识图谱。
其中,将所述目标标签作为所述标签知识图谱的实体添加至所述标签知识图谱,实现对所述标签知识图谱的更新,可以理解为将目标标签作为标签知识图谱的实体,基于该目标标签之间的关联关系更新该标签知识图谱。
实际应用中,在对标签知识图谱更新后,在对下一个待识别数据进行目标标签识别时,则将下一个待识别数据的初始标签以及更新后的标签知识图谱输入至GCN中,经过GCN的预测后得到下一个待识别数据的目标标签,通过更新后的标签知识图谱,GCN可以实现对下一待识别数据的目标标签更为准确和丰富的预测。
而在所述知识图谱包括关系知识图谱的情况下,所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
在所述知识图谱包括标签知识图谱和关系知识图谱的情况下,所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
其中,将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,可以理解为将目标标签作为关系知识图谱的实体,基于该目标标签遍历预设网站获取与该目标标签存在关联关系的其他实体(衍生的标签),实现对标签的衍生扩增,并基于该目标标签与其他实体的关联关系更新关系知识图谱,进行关系知识图谱的重建,以获得更新后的结构发生更新的关系知识图谱。
实际应用中,在对关系知识图谱更新后,在对下一个待识别数据进行目标标签识别时,则将下一个待识别数据的初始标签、标签知识图谱以及更新后的关系知识图谱输入至GCN中,经过GCN的预测后得到下一个待识别数据的目标标签,通过衍生扩增后的关系知识图谱,GCN可以实现对下一待识别数据的目标标签更为准确和丰富的预测。
本说明书另一实施例中,该数据处理方法针对业务的具体应用时,还可以加入业务的业务方的黑白名单,参考业务方的黑白名单中的标签实现对标签的过滤和加权,使得预测得到的待识别数据的目标标签更加符合业务方的需求,提升业务方的使用体验。
本说明书实施例中,所述数据处理方法通过多模态技术、知识图谱技术等对待识别数据分析的结果进行标签的衍生学习、多模态融合等策略,提高目标标签的识别精度和召回率。
本说明书另一实施例中,还可以将待识别数据中包含的品牌作为待识别数据的目标标签输出,具体如下所述:
所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的识别标签;
对所述待识别数据进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别数据对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别数据的目标标签。
其中,预设品牌标签库中包括但不限于品牌图片、品牌logo以及品牌名称等。
具体的,对待识别数据进行解析,可以理解为对图像、文本、音频和/或视频数据进行解析,例如通过OCR(Optical Character Recognition,光学字符识别)识别出人物图像中人物的动作、物品图像以及物品logo等,又或者是通过自然语言处理基础分析出文本中的人物名字、事项以及物品品牌名称等。
举例说明,若待识别数据为一位女性化妆的图像,对该图像进行解析,则得到的解析结果为该图像中每一个物体的图像,例如该女性的图像,所有化妆品(例如该女性的口红)的图像,将该解析结果与预设品牌标签库中的品牌图片进行匹配,若匹配,则确定该品牌图片对应的品牌名称,然后将该品牌名称作为该待识别数据的品牌标签。
实际应用中,若待识别数据为视频:电视剧剧集,识别出该电视剧剧集中的品牌标签,可以统计该电视剧剧集中所有的品牌的数量以及品牌名,后续可以通过该品牌的数量以及品牌名核算该电视剧中基于品牌的收益。
参见图3和图4,图3示出了根据本说明书一个实施例提供的一种标签识别方法的流程图,包括步骤302至步骤304;图4示出了根据本说明书一实施例提供的一种标签识别方法的处理流程图。
步骤302:获取待识别视频,且为所述待识别视频设置对应的初始标签。
其中,所述待识别视频包括但不限于广告类、美食类、科普类、体育类、自媒体类、情景剧类等任意类型、任意长短的视频。
具体实施时,在获取待识别视频后,需要为所述待识别视频设置对应的初始标签。
具体的,所述获取待识别视频之后,还包括:
将所述待识别视频拆分为图像数据、文本数据和音频数据,并分别对所述图像数据、所述文本数据和所述音频数据进行解析。
其中,对所述图像数据、所述文本数据和所述音频数据进行解析的具体过程可以参见上述数据处理方法中对图像、文本以及音频数据的解析方式,在此不再赘述。
具体的,所述为所述待识别视频设置对应的初始标签包括:
基于对所述图像数据、所述文本数据和所述音频数据的解析结果为所述待识别视频设置对应的初始标签。
参见上述数据处理方法中的实施例可知,所述图像数据、所述文本数据和所述音频数据的解析结果即为解析得到的所述图像数据的图像特征、所述文本数据的文本特征和所述音频数据的音频特征;基于对所述图像数据、所述文本数据和所述音频数据的解析结果为所述待识别视频设置对应的初始标签,即为基于所述图像特征、所述文本特征和所述音频特征为所述待识别视频设置对应的初始标签。
步骤304:将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签遍历预设网站获取的该预设网站中的实体与所述历史标签之间的关系构建。
其中,图卷积网络模型的功能与上述实施例的数据处理方法中的图卷积网络模型的功能相同,并且标签知识图谱的构建以及关系知识图谱的构建也可参照上述实施例的数据处理方法中对标签知识图谱以及关系知识图谱的构建过程,在此不再赘述。
本说明书另一实施例中,所述得到所述待识别视频的目标标签之后,还包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
本说明书实施例中,基于待识别视频的初始标签、标签知识图谱、关系知识图谱使用GCN来建模标签之间的相关性,并由上述作为输入,经过GCN的预测,得到待识别视频的新的标签,即目标标签;然后将目标标签作为所述关系知识图谱的实体回流至所述关系知识图谱,对关系知识图谱中的标签实体进行衍生扩增后,进行关系知识图谱的重建,以此来扩充关系知识图谱和重构该关系知识图谱的结构,使得下一个待识别视频通过本说明书实施例提供的标签识别方法进行标签识别时,可以基于更新后的结构更加丰富的关系知识图谱实现目标标签的更精确识别。
本说明书另一实施例中,所述获取待识别视频,且为所述待识别视频设置对应的初始标签之后,还包括:
接收用户上传的针对业务的业务标签列表,其中,所述业务标签列表包括业务黑名单标签列表和业务白名单标签列表。
本说明书实施例中,所述业务黑名单标签列表中存放业务在实际应用时需要过滤掉的标签,所述业务白名单标签列表中存放业务在实际应用时想要保留的标签;所述用户包括但不限于个人用户、公司或组织机构。
具体实施时,所述标签识别方法应用在具体的业务场景下时,需要将待识别视频与具体业务需求进行结合后,实现对待识别视频的目标标签的获取。
具体的,所述接收用户上传的针对业务的业务标签列表之后,还包括:
将所述标签知识图谱、所述关系知识图谱、所述业务标签列表以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
具体实施时,参见图4,首先获取待识别视频,对获取的待识别视频进行预处理,将待识别视频拆分为图像数据、文本数据以及音频数据三个模态,然后对待识别视频的图像数据、文本数据以及音频数据三个模态进行标签识别,获得一个预测标签(即由图像数据的图像标签、文本数据的文本标签以及音频数据的音频标签组合得到的初始标签列表);
然后利用已有的数据收集标签(历史标签)作为实体以及利用标签之间的关系构建有序三元组集合,得到标签知识图谱(图4中的标签图谱);基于历史标签以及将各个历史标签作为实体,通过利用已有的世界知识遍历预设网站获取该预设网站中的关联实体,构建关系知识图谱(图4中的知识图谱);
再接收用户上传的针对业务的业务黑名单标签列表和业务白名单标签列表;
最后将待识别视频的预测标签、标签知识图谱、关系知识图谱以及业务黑/白名单标签列表(图4中的标签黑/白名单)输入至图卷积网络模型中,经过图卷积网络模型的预测,得到所述待识别视频的目标标签(图4中的标签1、标签2以及标签3)。
实际应用中,在基于上述方式获得所述待识别视频的目标标签后,还需要将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
本说明书实施例提供的所述标签识别方法通过将待识别视频拆分为图像、文本、语音等多模态数据、利用构建的异质动态的标签知识图谱和静态的关系知识图谱,结合用户输入的黑白名单列表,通过图卷积网络模型对输入的图像、文本、语音等多模态数据的初始标签进行预测,实现对初始标签的校对和排序,得到目标标签,并基于目标标签对关系知识图谱进行动态更新,同时还可以借助静态的关系知识图谱对标签进行衍生扩增,其中标签知识图谱的异质体现在获取的历史的不同的标签维度上,动态是体现在将GCN中,用户输入的黑白名单列表会对基础的标签知识图谱进行动态调整。
此外,本说明书实施例提供的标签识别方法主要为了解决现有的视频结构化识别系统的正确、标准标签的输出问题,利用和用户交互明确业务的黑白名单,以及利用图像、文本、语音等多种模态、知识图谱等通过GCN进行后融合策略进行高精度标签的识别,并结合知识图谱做标签后处理和标签衍生,标签的召回和精度提升,标签数量增加,而且支持用户对白名单的标签的权重自适应地调节,支持对黑名单进行屏蔽。
例如用户在某个业务场景下,希望得到某个标签,而该标签本身权重较低,那么在进行具体业务处理中,用户可以将该标签存放在业务白名单标签列表中,使得该标签在GCN中处理时,增加该标签的权重,实现对该标签的召回。
本说明书另一实施例中,在得到待识别视频的目标标签之后,可以基于准确的目标标签进行任意一个具体场景业务的处理。
具体的,所述得到所述待识别视频的目标标签之后,还包括:
接收用户上传的针对业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述业务的审核结果。
其中,,每个业务均有其对应的一套业务审核策略,同一待识别视频的目标标签应用于不同的业务中审核结果会不相同。例如业务1的业务规则策略规定待识别视频的目标标签中不可以出现枪支,那么在待识别视频的目标标签中包含枪支的情况下,则不符合业务1的业务需求,即待识别视频在业务1中不能通过审核;而在业务2中,业务规则策略中没有对枪支的限定,则待识别视频的目标标签在包含枪支的情况下,也是符合业务2的业务需求,即待识别视频在业务2中可以通过审核。
具体的,将所述目标标签与所述业务审核策略进行匹配的过程,即是对比所述目标标签被不被包含在业务审核策略中,若是被包含在业务审核策略中,则业务审核不通过,例如待识别视频不可以播放等;若是不被包含在业务审核策略中,则业务审核通过,例如待识别视频可以播放等。
本说明书实施例的标签识别方法基于比较精确的目标标签获得待识别视频在某个业务的审核结果,可以极大的提高业务的审核准确度,提升用户体验。
此外,本说明书中另一实施例中,所述得到所述待识别视频的目标标签之后,还包括:
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
具体的,所述搜索请求中携带所述目标视频的视频标签,若所述目标标签与所述视频标签匹配,则说明目标标签对应的待识别视频为目标视频;若所述目标标签为所述视频标签的子集,也可以说明目标标签对应的待识别视频为目标视频。
此外,在其他可实现的应用场景中,基于待识别视频的目标标签还可以实现视频剪辑、视频封面的生成等,例如获取多个目标标签中包含明星a的待识别视频,为该明星a做一个视频剪辑等。
本说明书实施例的标签识别方法基于比较精确的目标标签可以实现后续对目标视频的搜索、应用于视频剪辑以及视频封面生成等场景中,提升用户体验。
本说明书另一实施例中,所述将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签包括:
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的识别标签;
对所述待识别视频进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别视频对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别视频的目标标签。
将所述待识别视频中包含的品牌作为待识别视频的目标标签进行输出,可以使得待识别视频后续可以基于该品牌标签做其他处理,以使得该标签识别方法得到扩展,具体可参见上述实施例,在此不再赘述。
参见图5,图5示出了本说明书一个实施例提供的一种视频审核方法的流程图,具体步骤包括步骤502至步骤508。
步骤502:获取待识别视频,且为所述待识别视频设置对应的初始标签。
步骤504:将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
步骤506:接收业务方针对视频业务的业务审核策略。
步骤508:将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
具体的,所述视频审核方法的具体实现方式可以参见将上述实施例的标签识别方法应用在视频审核场景中的具体处理过程,在此不再赘述。
本说明书提供的视频审核方法基于比较精确的目标标签获得待识别视频在某个业务的审核结果,可以极大的提高业务的审核准确度,提升用户体验。
参见图6,图6示出了本说明书一个实施例提供的一种视频搜索方法的流程图,具体步骤包括步骤602至步骤608。
步骤602:获取待识别视频,且为所述待识别视频设置对应的初始标签。
步骤604:将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
步骤606:接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签。
步骤608:基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
具体的,所述视频搜索方法的具体实现方式可以参见将上述实施例的标签识别方法应用在视频搜索场景中的具体处理过程,在此不再赘述。
本说明书实施例的标签识别方法基于比较精确的目标标签可以实现后续对目标视频的搜索,提升用户体验。
与上述方法实施例相对应,本说明书还提供了一种数据处理装置实施例,图7示出了本说明书一个实施例提供的一种数据处理装置的结构示意图。如图7所示,该装置包括:
待识别数据获取模块702,被配置为获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
目标标签获得模块704,被配置为将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
知识图谱更新模块706,被配置为将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
可选的,所述知识图谱包括标签知识图谱,其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建;
相应的,所述目标标签获得模块704,进一步被配置为:
将所述标签知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述知识图谱更新模块706,进一步被配置为:
将所述目标标签作为所述标签知识图谱的实体添加至所述标签知识图谱,实现对所述标签知识图谱的更新,以获得更新后的标签知识图谱。
可选的,所述知识图谱包括关系知识图谱,其中,所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
相应的,所述目标标签获得模块704,进一步被配置为:
将所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述知识图谱更新模块706,进一步被配置为:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
可选的,所述知识图谱包括标签知识图谱和关系知识图谱,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
相应的,所述目标标签获得模块704,进一步被配置为:
将所述标签知识图谱、所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述知识图谱更新模块706,进一步被配置为:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
可选的,所述目标标签获得模块704,进一步被配置为:
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的识别标签;
对所述待识别数据进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别数据对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别数据的目标标签。
可选的,所述机器学习模型包括图卷积网络模型。
上述为本实施例的一种数据处理装置的示意性方案。需要说明的是,该数据处理装置的技术方案与上述的数据处理方法的技术方案属于同一构思,数据处理装置的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了一种标签识别装置实施例,图8示出了本说明书一个实施例提供的一种标签识别装置的结构示意图。如图8所示,该装置包括:
待识别视频获取模块802,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块804,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
可选的,所述装置,还包括:
解析模块,被配置为将所述待识别视频拆分为图像数据、文本数据和音频数据,并分别对所述图像数据、所述文本数据和所述音频数据进行解析。
可选的,所述待识别视频获取模块802,进一步被配置为:
基于对所述图像数据、所述文本数据和所述音频数据的解析结果为所述待识别视频设置对应的初始标签。
可选的,所述装置,还包括:
知识图谱更新模块,被配置为将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
可选的,所述装置,还包括:
业务标签列表接收模块,被配置为接收用户上传的针对业务的业务标签列表,其中,所述业务标签列表包括业务黑名单标签列表和业务白名单标签列表。
可选的,所述装置,还包括:
视频目标标签获得模块,被配置为将所述标签知识图谱、所述关系知识图谱、所述业务标签列表以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
可选的,所述装置,还包括:
策略接收模块,被配置为接收用户上传的针对业务的业务审核策略;
审核结果确定模块,被配置为将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述业务的审核结果。
可选的,所述装置,还包括:
搜索请求接收模块,被配置为接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
目标视频确定模块,被配置为基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
可选的,所述目标标签确定模块804,进一步被配置为:
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的识别标签;
对所述待识别视频进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别视频对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别视频的目标标签。
上述为本实施例的一种标签识别装置的示意性方案。需要说明的是,该标签识别装置的技术方案与上述的标签识别方法的技术方案属于同一构思,标签识别装置的技术方案未详细描述的细节内容,均可以参见上述标签识别方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了一种视频审核装置实施例,图9示出了本说明书一个实施例提供的一种视频审核装置的结构示意图。如图9所示,该装置包括:
视频标签设置模块902,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块904,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
审核策略接收模块906,被配置为接收用户上传的针对视频业务的业务审核策略;
审核结果确定模块908,被配置为将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
上述为本实施例的一种视频审核装置的示意性方案。需要说明的是,该视频审核装置的技术方案与上述的视频审核方法的技术方案属于同一构思,视频审核装置的技术方案未详细描述的细节内容,均可以参见上述视频审核方法的技术方案的描述。
与上述方法实施例相对应,本说明书还提供了一种视频搜索装置实施例,图10示出了本说明书一个实施例提供的一种视频搜索装置的结构示意图。如图10所示,该装置包括:
初始标签设置模块1002,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
视频目标标签确定模块1004,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
搜索请求接收模块1006,被配置为接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
目标视频确定模块1008,被配置为基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
上述为本实施例的一种视频搜索装置的示意性方案。需要说明的是,该视频搜索装置的技术方案与上述的视频搜索方法的技术方案属于同一构思,视频搜索装置的技术方案未详细描述的细节内容,均可以参见上述视频搜索方法的技术方案的描述。
图11示出了根据本说明书一个实施例提供的第一种计算设备1100的结构框图。该计算设备1100的部件包括但不限于存储器1110和处理器1120。处理器1120与存储器1110通过总线1130相连接,数据库1150用于保存数据。
计算设备1100还包括接入设备1140,接入设备1140使得计算设备1100能够经由一个或多个网络1160通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备1140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备1100的上述部件以及图11中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图11所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备1100还可以是移动式或静止式的服务器。
其中,处理器1120用于执行如下计算机可执行指令:
获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的数据处理方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
图12示出了根据本说明书一个实施例提供的第二种计算设备1200的结构框图。该计算设备1200的部件包括但不限于存储器1210和处理器1220。处理器1220与存储器1210通过总线1230相连接,数据库1250用于保存数据。
计算设备1200还包括接入设备1240,接入设备1240使得计算设备1200能够经由一个或多个网络1260通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备1240可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备1200的上述部件以及图12中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图12所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1200可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备1200还可以是移动式或静止式的服务器。
其中,处理器1220用于执行如下计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的标签识别方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述标签识别方法的技术方案的描述。
图13示出了根据本说明书一个实施例提供的第三种计算设备1300的结构框图。该计算设备1300的部件包括但不限于存储器1310和处理器1320。处理器1320与存储器1310通过总线1330相连接,数据库1350用于保存数据。
计算设备1300还包括接入设备1340,接入设备1340使得计算设备1300能够经由一个或多个网络1360通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备1340可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备1300的上述部件以及图13中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图13所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1300可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备1300还可以是移动式或静止式的服务器。
其中,处理器1320用于执行如下计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收业务方针对视频业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的视频审核方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述视频审核方法的技术方案的描述。
图14示出了根据本说明书一个实施例提供的第四种计算设备1400的结构框图。该计算设备1400的部件包括但不限于存储器1410和处理器1420。处理器1420与存储器1410通过总线1430相连接,数据库1450用于保存数据。
计算设备1400还包括接入设备1440,接入设备1440使得计算设备1400能够经由一个或多个网络1460通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备1440可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
在本说明书的一个实施例中,计算设备1400的上述部件以及图14中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图14所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
计算设备1400可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备1400还可以是移动式或静止式的服务器。
其中,处理器1420用于执行如下计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的视频搜索方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述视频搜索方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述数据处理方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的数据处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述数据处理方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述标签识别方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的标签识别方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述标签识别方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述视频审核方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的视频审核方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述视频审核方法的技术方案的描述。
本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现所述视频搜索方法的步骤。
上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的视频搜索方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述视频搜索方法的技术方案的描述。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书实施例并不受所描述的动作顺序的限制,因为依据本说明书实施例,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书实施例所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书实施例的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书实施例的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
Claims (29)
1.一种数据处理方法,包括:
获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱。
2.根据权利要求1所述的数据处理方法,所述知识图谱包括标签知识图谱,其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建;
相应的,所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述标签知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述标签知识图谱的实体添加至所述标签知识图谱,实现对所述标签知识图谱的更新,以获得更新后的标签知识图谱。
3.根据权利要求1所述的数据处理方法,所述知识图谱包括关系知识图谱,其中,所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
相应的,所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
4.根据权利要求1所述的数据处理方法,所述知识图谱包括标签知识图谱和关系知识图谱,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
相应的,所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将所述标签知识图谱、所述关系知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
所述将所述目标标签作为所述知识图谱的实体添加至所述知识图谱,实现对所述知识图谱的更新,以获得更新后的知识图谱包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
5.根据权利要求1所述的数据处理方法,所述将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签包括:
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的识别标签;
对所述待识别数据进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别数据对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别数据的目标标签。
6.根据权利要求1-5任意一项所述的数据处理方法,所述机器学习模型包括图卷积网络模型。
7.一种标签识别方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
8.根据权利要求7所述的标签识别方法,所述获取待识别视频之后,还包括:
将所述待识别视频拆分为图像数据、文本数据和音频数据,并分别对所述图像数据、所述文本数据和所述音频数据进行解析。
9.根据权利要求8所述的标签识别方法,所述为所述待识别视频设置对应的初始标签包括:
基于对所述图像数据、所述文本数据和所述音频数据的解析结果为所述待识别视频设置对应的初始标签。
10.根据权利要求7所述的标签识别方法,所述得到所述待识别视频的目标标签之后,还包括:
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
11.根据权利要求7所述的标签识别方法,所述获取待识别视频,且为所述待识别视频设置对应的初始标签之后,还包括:
接收用户上传的针对业务的业务标签列表,其中,所述业务标签列表包括业务黑名单标签列表和业务白名单标签列表。
12.根据权利要求11所述的标签识别方法,所述接收用户上传的针对业务的业务标签列表之后,还包括:
将所述标签知识图谱、所述关系知识图谱、所述业务标签列表以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签。
13.根据权利要求7所述的标签识别方法,所述得到所述待识别视频的目标标签之后,还包括:
接收用户上传的针对业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述业务的审核结果。
14.根据权利要求7所述的标签识别方法,所述得到所述待识别视频的目标标签之后,还包括:
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
15.根据权利要求7所述的标签识别方法,所述将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签包括:
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的识别标签;
对所述待识别视频进行解析,将解析结果与预设品牌标签库中的品牌标签进行匹配,并基于匹配结果确定所述待识别视频对应的品牌标签;
将所述识别标签和所述品牌标签进行组合,形成所述待识别视频的目标标签。
16.一种视频审核方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收业务方针对视频业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
17.一种视频搜索方法,包括:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
18.一种数据处理装置,包括:
待识别数据获取模块,被配置为获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
目标标签获得模块,被配置为将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
知识图谱更新模块,被配置为将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
19.一种标签识别装置,包括:
待识别视频获取模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
20.一种视频审核装置,包括:
视频标签设置模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
审核策略接收模块,被配置为接收用户上传的针对视频业务的业务审核策略;
审核结果确定模块,被配置为将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
21.一种视频搜索装置,包括:
初始标签设置模块,被配置为获取待识别视频,且为所述待识别视频设置对应的初始标签;
视频目标标签确定模块,被配置为将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
搜索请求接收模块,被配置为接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
目标视频确定模块,被配置为基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
22.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别数据以及所述待识别数据对应的初始标签,其中,所述待识别数据包括图像、文本、音频和/或视频数据;
将基于获取的历史标签构建的知识图谱以及所述初始标签输入至机器学习模型中,得到所述待识别数据的目标标签;
将所述目标标签作为所述关系知识图谱的实体添加至所述关系知识图谱,实现对所述关系知识图谱的更新,以获得更新后的关系知识图谱。
23.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建。
24.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户上传的针对视频业务的业务审核策略;
将所述目标标签与所述业务审核策略进行匹配,基于匹配结果确定所述视频业务的审核结果。
25.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取待识别视频,且为所述待识别视频设置对应的初始标签;
将标签知识图谱、关系知识图谱以及所述初始标签输入至图卷积网络模型中,得到所述待识别视频的目标标签,
其中,所述标签知识图谱基于获取的历史标签以及所述历史标签之间的关系构建,
所述关系知识图谱基于通过所述历史标签获取的预设网站中的实体与所述历史标签之间的关系构建;
接收用户针对目标视频的搜索请求,其中,所述搜索请求中携带所述目标视频的视频标签;
基于所述目标视频的视频标签与所述目标标签的关联关系确定所述目标视频。
26.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至6任意一项所述数据处理方法的步骤。
27.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求7至15任意一项所述标签识别方法的步骤。
28.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求16所述视频审核方法的步骤。
29.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求17所述视频搜索方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082545.7A CN113254683B (zh) | 2020-02-07 | 2020-02-07 | 数据处理方法及装置、标签识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010082545.7A CN113254683B (zh) | 2020-02-07 | 2020-02-07 | 数据处理方法及装置、标签识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254683A true CN113254683A (zh) | 2021-08-13 |
CN113254683B CN113254683B (zh) | 2024-04-16 |
Family
ID=77219444
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010082545.7A Active CN113254683B (zh) | 2020-02-07 | 2020-02-07 | 数据处理方法及装置、标签识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254683B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114282073A (zh) * | 2022-03-02 | 2022-04-05 | 支付宝(杭州)信息技术有限公司 | 数据存储方法及装置、数据读取方法及装置 |
CN114615090A (zh) * | 2022-05-10 | 2022-06-10 | 富算科技(上海)有限公司 | 基于跨域标签传播的数据处理方法及系统、设备及介质 |
CN114707005A (zh) * | 2022-06-02 | 2022-07-05 | 浙江建木智能系统有限公司 | 一种舰船装备的知识图谱构建方法和系统 |
CN114817757A (zh) * | 2022-04-02 | 2022-07-29 | 广州大学 | 基于图卷积网络的跨社交网络虚拟身份关联方法 |
CN117371533A (zh) * | 2023-11-01 | 2024-01-09 | 深圳市马博士网络科技有限公司 | 一种生成数据标签规则的方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
CN110019560A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团上海有限公司 | 一种基于知识图谱的查询方法及装置 |
US20190370398A1 (en) * | 2018-06-01 | 2019-12-05 | SayMosaic Inc. | Method and apparatus for searching historical data |
WO2019233421A1 (zh) * | 2018-06-04 | 2019-12-12 | 京东数字科技控股有限公司 | 图像处理方法及装置、电子设备、存储介质 |
-
2020
- 2020-02-07 CN CN202010082545.7A patent/CN113254683B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019560A (zh) * | 2017-12-28 | 2019-07-16 | 中国移动通信集团上海有限公司 | 一种基于知识图谱的查询方法及装置 |
US20190370398A1 (en) * | 2018-06-01 | 2019-12-05 | SayMosaic Inc. | Method and apparatus for searching historical data |
WO2019233421A1 (zh) * | 2018-06-04 | 2019-12-12 | 京东数字科技控股有限公司 | 图像处理方法及装置、电子设备、存储介质 |
CN109635171A (zh) * | 2018-12-13 | 2019-04-16 | 成都索贝数码科技股份有限公司 | 一种新闻节目智能标签的融合推理系统和方法 |
Non-Patent Citations (2)
Title |
---|
MEILIAN LU: "LPANNI: Overlapping Community Detection Using Label Propagation in Large-Scale Complex Networks", IEEE * |
朱木易洁;鲍秉坤;徐常胜;: "知识图谱发展与构建的研究进展", 南京信息工程大学学报(自然科学版), no. 06 * |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114282073A (zh) * | 2022-03-02 | 2022-04-05 | 支付宝(杭州)信息技术有限公司 | 数据存储方法及装置、数据读取方法及装置 |
CN114282073B (zh) * | 2022-03-02 | 2022-07-15 | 支付宝(杭州)信息技术有限公司 | 数据存储方法及装置、数据读取方法及装置 |
CN114817757A (zh) * | 2022-04-02 | 2022-07-29 | 广州大学 | 基于图卷积网络的跨社交网络虚拟身份关联方法 |
CN114615090A (zh) * | 2022-05-10 | 2022-06-10 | 富算科技(上海)有限公司 | 基于跨域标签传播的数据处理方法及系统、设备及介质 |
CN114707005A (zh) * | 2022-06-02 | 2022-07-05 | 浙江建木智能系统有限公司 | 一种舰船装备的知识图谱构建方法和系统 |
CN114707005B (zh) * | 2022-06-02 | 2022-10-25 | 浙江建木智能系统有限公司 | 一种舰船装备的知识图谱构建方法和系统 |
CN117371533A (zh) * | 2023-11-01 | 2024-01-09 | 深圳市马博士网络科技有限公司 | 一种生成数据标签规则的方法及装置 |
CN117371533B (zh) * | 2023-11-01 | 2024-05-24 | 深圳市马博士网络科技有限公司 | 一种生成数据标签规则的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113254683B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113254683A (zh) | 数据处理方法及装置、标签识别方法及装置 | |
CN104735468B (zh) | 一种基于语义分析将图像合成新视频的方法及系统 | |
EP3992924A1 (en) | Machine learning based media content annotation | |
CN112037792B (zh) | 一种语音识别方法、装置、电子设备及存储介质 | |
CN112884005B (zh) | 一种基于sptag及卷积神经网的图像检索方法及装置 | |
CN111368141B (zh) | 视频标签的扩展方法、装置、计算机设备和存储介质 | |
US20210200802A1 (en) | Method and apparatus for video searches and index construction | |
CN112584062B (zh) | 背景音频构建方法及装置 | |
CN113987274A (zh) | 视频语义表示方法、装置、电子设备和存储介质 | |
CN109241299A (zh) | 多媒体资源搜索方法、装置、存储介质及设备 | |
CN110347869B (zh) | 一种视频生成方法、装置、电子设备及存储介质 | |
CN114510564A (zh) | 视频知识图谱生成方法及装置 | |
CN110351183B (zh) | 即时通讯中的资源收藏方法以及装置 | |
CN107369450A (zh) | 收录方法和收录装置 | |
CN114245206B (zh) | 视频处理方法及装置 | |
CN112148962A (zh) | 用于推送信息的方法和装置 | |
CN111222011B (zh) | 一种视频向量确定方法和装置 | |
CN115866348A (zh) | 基于二维码的数据处理方法、装置及系统 | |
KR20220152453A (ko) | 일기 컨텐츠 시스템 및 제공 방법 | |
CN112287173A (zh) | 用于生成信息的方法和装置 | |
CN110659382A (zh) | 基于异构信息网络表示学习技术的混合音乐推荐方法 | |
CN113365091B (zh) | 直播间礼物赠送方法及装置 | |
CN114328990B (zh) | 图像完整性识别方法、装置、计算机设备和存储介质 | |
CN110837579B (zh) | 视频分类方法、装置、计算机以及可读存储介质 | |
CN114329063B (zh) | 视频片段检测方法、装置以及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |