CN116701706B - 一种基于人工智能的数据处理方法、装置、设备及介质 - Google Patents
一种基于人工智能的数据处理方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116701706B CN116701706B CN202310942069.5A CN202310942069A CN116701706B CN 116701706 B CN116701706 B CN 116701706B CN 202310942069 A CN202310942069 A CN 202310942069A CN 116701706 B CN116701706 B CN 116701706B
- Authority
- CN
- China
- Prior art keywords
- data
- attention
- attribute information
- node
- candidate data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 title claims abstract description 36
- 238000003672 processing method Methods 0.000 title abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 146
- 238000000034 method Methods 0.000 claims abstract description 96
- 230000002776 aggregation Effects 0.000 claims abstract description 62
- 238000004220 aggregation Methods 0.000 claims abstract description 62
- 238000012216 screening Methods 0.000 claims abstract description 43
- 238000006116 polymerization reaction Methods 0.000 claims abstract description 9
- 238000011156 evaluation Methods 0.000 claims description 91
- 238000000605 extraction Methods 0.000 claims description 55
- 238000001914 filtration Methods 0.000 claims description 38
- 239000000203 mixture Substances 0.000 claims description 31
- 230000008569 process Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 17
- 238000010276 construction Methods 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 10
- 238000012163 sequencing technique Methods 0.000 claims description 9
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 238000005516 engineering process Methods 0.000 description 20
- 238000013528 artificial neural network Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 230000007246 mechanism Effects 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000013135 deep learning Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 125000005842 heteroatom Chemical group 0.000 description 3
- 238000000059 patterning Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000000547 structure data Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
- G06F16/739—Presentation of query results in form of a video summary, e.g. the video summary being a video sequence, a composite still image or having synthesized frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/75—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
- G06V10/765—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects using rules for classification or partitioning the feature space
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例公开了一种基于人工智能的数据处理方法、装置、设备及介质,包括:对业务数据进行筛选处理,得到N个候选数据;N个候选数据包括候选数据i;从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建目标异构图;对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。采用本申请实施例,可以提高数据匹配的准确度以及效率。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种基于人工智能的数据处理方法、装置、设备及介质。
背景技术
在传统数据匹配场景中,往往采用人工指定的规则或角度,需要花费大量的时间,根据人工经验,对业务数据中的每个候选数据进行数据匹配,从而严重影响了数据匹配的效率。此外,由于人为主观因素的影响,不同的识别对象针对同一业务数据所选择的最终的关键数据可能存在不同,比如,在对包括多个视频帧的某一视频数据进行封面选图时,识别对象A认为该视频数据中的某一视频帧(例如,视频帧a)与该视频数据具备匹配关系,可以作为该视频数据的封面数据,而识别对象B认为该视频数据中的另一视频帧(例如,视频帧b)与该视频数据具备匹配关系,可以作为该视频数据的封面数据,这样将导致不同识别对象的识别结果存在不一致的情况,以至于降低了数据匹配的准确度。
发明内容
本申请实施例提供一种基于人工智能的数据处理方法、装置、设备及介质,可以提高数据匹配的准确度以及效率。
本申请实施例一方面提供一种基于人工智能的数据处理方法,包括:
对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;N个候选数据包括候选数据i;i为小于或者等于N的正整数;业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;
从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图;
对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;
在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
本申请实施例一方面提供一种基于人工智能的数据处理装置,包括:
数据筛选模块,用于对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;N个候选数据包括候选数据i;i为小于或者等于N的正整数;业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;
构建模块,用于从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图;
卷积处理模块,用于对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;
聚合处理模块,用于在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
其中,业务数据包括A个子数据;A为大于N的正整数;
该数据筛选模块包括:
第一筛选单元,用于对A个子数据进行筛选处理,将筛选处理后的子数据作为初始集合;
聚类处理单元,用于基于业务数据对应的聚类数量B,对初始集合中的子数据进行聚类处理,得到B个子集合;B为小于或者等于A的正整数;
择优单元,用于从B个子集合中确定待择优集合,分别确定待择优集合中的每个子数据的基础质量分数,从待择优集合中选择具有最高基础质量分数的子数据作为候选数据,直到得到B个子集合分别对应的候选数据;
第二筛选单元,用于若B大于N,则基于B个候选数据中的每个候选数据的基础质量分数,从B个候选数据中筛选出N个候选数据。
其中,业务数据为视频数据;A个子数据中的每个子数据均为视频数据中的视频帧;
该第一筛选单元包括:
规则获取子单元,用于获取与视频数据相关联的抽帧规则;
抽帧子单元,用于基于视频数据的播放时长以及抽帧规则,对A个视频帧进行抽帧处理,得到视频帧集合;
分析子单元,用于对视频帧集合中的每个视频帧进行图片评估维度分析,得到视频帧集合中的每个视频帧在C个图片评估维度下分别对应的评估参数;C为正整数;
过滤子单元,用于基于C个评估参数,对视频帧集合进行过滤,将过滤后的视频帧集合确定为初始集合。
其中,抽帧规则包括播放时长阈值;
该抽帧子单元还具体用于:
若视频数据的播放时长未达到播放时长阈值,则基于抽帧规则中的抽帧频率阈值,对A个视频帧进行抽帧处理,得到视频帧集合;
若视频数据的播放时长达到播放时长阈值,则基于抽帧规则中的抽帧数量阈值,对A个视频帧进行抽帧处理,得到视频帧集合。
其中,该过滤子单元还具体用于:
若C大于1,则从C个评估参数中,获取初始评估参数;
基于视频帧集合中的每个视频帧在初始评估参数下的评估值,对视频帧集合中的视频帧进行排序处理,得到初始排序结果,从初始排序结果中,按序获取与过滤阈值相匹配的视频帧,作为中间集合;
将C个评估参数中除初始评估参数之外的(C-1)个评估参数,确定为剩余评估参数;
基于剩余评估参数,对中间集合进行过滤,将过滤后的中间集合确定为初始集合。
其中,M个属性信息包括时序信息和语义信息;目标异构图为时序异构图或语义异构图;时序异构图是在将N个候选数据分别对应的时序信息作为节点时所构建得到的;语义异构图是在将N个候选数据分别对应的语义信息作为节点时所构建得到的。
其中,该卷积处理模块包括:
初始特征获取单元,用于获取目标异构图中的每个节点对应的初始节点特征;
邻居节点确定单元,用于在目标异构图中,将候选数据i对应的节点作为目标节点,确定目标节点的邻居节点集合;邻居节点集合包括H个邻居节点;H为正整数;
聚合处理单元,用于对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,该聚合处理单元包括:
模型调用子单元,用于调用用于进行特征聚合的异构图模型;异构图模型包括目标异构图对应的第一注意力层;第一注意力层包括X个注意力子层;X为正整数;X个注意力子层包括注意力子层Lx;x为小于或者等于X的正整数;
聚合处理子单元,用于基于注意力子层Lx的可学习参数,对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,确定目标节点在注意力子层Lx的注意力子特征;
拼接处理子单元,用于在得到X个注意力子特征时,对X个注意力子特征进行拼接处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,H个邻居节点包括邻居节点Nj;j为小于或者等于H的正整数;
该聚合处理子单元还具体用于:
基于目标节点的初始节点特征、H个邻居节点的初始节点特征以及注意力子层Lx的可学习参数,对目标节点和邻居节点Nj进行相关性学习,得到与注意力子层Lx相关联的注意力权重αij;注意力权重αij用于指示邻居节点Nj与目标节点之间的相关性;
将注意力权重αij、邻居节点Nj的初始节点特征以及注意力子层Lx的可学习参数之间的乘积,确定为邻居节点Nj对应的相关性特征;
在得到H个邻居节点分别对应的相关性特征时,对H个相关性特征进行聚合处理,得到目标节点在注意力子层Lx的注意力子特征。
其中,候选数据i在目标属性信息下对应的注意力特征是基于异构图模型中的第一注意力层,对目标异构图进行异构图卷积处理后所得到的;异构图模型包括第二注意力层;
该聚合处理模块包括:
特征输入单元,用于在得到候选数据i在M个属性信息下分别对应的注意力特征时,将M个注意力特征输入至第二注意力层;M个注意力特征包括属性信息p对应的注意力特征Ep;属性信息p属于M个属性信息;p为小于或者等于M的正整数;
第一确定单元,用于基于第二注意力层中的网络参数以及注意力特征Ep,确定注意力特征Ep对应的属性权重参数βp;
第二确定单元,用于将注意力特征Ep以及属性权重参数βp的乘积确定为属性信息p对应的待聚合特征;
求和处理单元,用于在得到M个属性信息分别对应的待聚合特征时,对M个待聚合特征进行求和处理,得到候选数据i对应的聚合特征Zi。
其中,该装置还包括:
概率确定模块,用于在得到每个候选数据分别对应的聚合特征时,基于用于确定关键数据的分类识别层以及N个聚合特征,分别确定每个候选数据对应的概率参数;
策略获取模块,用于获取针对业务数据的数据选择策略;数据选择策略包括概率参数阈值;
第一确定模块,用于在N个候选数据中,将概率参数达到概率参数阈值的候选数据确定为第一待筛选数据;
第二确定模块,用于若第一待筛选数据的数量为一个,则将第一待筛选数据确定为与业务数据具备匹配关系的关键数据。
其中,该装置还包括:
第三确定模块,用于若第一待筛选数据的数量为至少两个,且数据选择策略包括指定类别,则从至少两个第一待筛选数据中,获取与指定类别相匹配的第一待筛选数据,将获取到的第一待筛选数据确定为第二待筛选数据;
第四确定模块,用于在第二待筛选数据的数量为至少两个时,从至少两个第二待筛选数据中确定具有最高概率参数的第二待筛选数据,将具有最高概率参数的第二待筛选数据作为与业务数据具备匹配关系的关键数据。
本申请一方面提供了一种计算机设备,包括:处理器、存储器、网络接口;
处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,存储器用于存储计算机程序,处理器用于调用计算机程序,以使得计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行本申请实施例提供的方法。
本申请实施例一方面提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中;计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备执行本申请实施例中的方法。
在本申请实施例中,为了后续数据匹配的合理度,计算机设备在获取到业务数据时,需要对业务数据进行筛选处理,得到N个候选数据。其中,N个候选数据包括候选数据i;i为小于或者等于N的正整数;这里的N为大于1的正整数。由于业务数据包括M个特征维度互不相同的属性信息,因此,该计算机设备可以从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图,进而对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;M为大于1的正整数。然后,该计算机设备在得到候选数据i在M个属性信息下分别对应的注意力特征时,可以对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi。由此可见,本申请实施例提供的这种数据匹配方法无需人工参与,而是可以利用图建模的概念定义,通过对构建的目标异构图进行异构图卷积处理,以准确表征每个候选数据的语义信息以及在图结构中的节点结构信息和节点属性信息,使得计算机设备能够获取业务数据的全局信息以及综合学习各候选数据之间的关系,从而提升数据表征的准确度。由于聚合特征Zi可以用于确定将候选数据i作为关键数据的概率参数,且这里的关键数据是指与业务数据具备匹配关系的数据,因此,聚合特征Zi越准确,该计算机设备确定的候选数据i的概率参数越准确,这样有利于后续能够从N个候选数据中,选择出最合适最具代表性的关键数据,从而有效提升数据匹配的效率以及准确度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种网络架构的结构示意图;
图2是本申请实施例提供的一种基于图建模对候选数据进行表征的场景示意图;
图3是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图一;
图4是本申请实施例提供的一种针对视频帧的节点表征示意图;
图5是本申请实施例提供的一种通过异构图模型确定概率参数的场景示意图;
图6是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图二;
图7是本申请实施例提供的一种基于人工智能的数据处理装置的结构示意图一;
图8是本申请实施例提供的一种基于人工智能的数据处理装置的结构示意图二;
图9是本申请实施例提供的一种计算机设备的示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,本申请实施例中的提供了一种基于人工智能的数据处理方法,可以通过利用图建模的概念定义,学习每个候选数据在业务数据中的代表性(也可以理解为重要程度),即通过事先训练好的异构图模型,对每个候选数据进行更加精准的特征表示。
其中,所谓人工智能(Artificial Intelligence,简称AI)是利用数字计算机或者数字计算机控制的计算模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
其中,计算机视觉技术(Computer Vision,简称CV)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。大模型技术为计算机视觉技术发展带来重要变革,swin-transformer,ViT,V-MOE,MAE等视觉领域的预训练模型经过微调(fine tune)可以快速、广泛适用于下游具体任务。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
其中,深度学习中的图神经网络(Graph Neural Networks,简称GNN)是一种利用深度学习模型对图结构数据进行特征挖掘和提取的算法,即基于图建模的神经网络。图(Graph)是指由节点和边两部分所组成的一种网络结构数据。其中,本申请实施例可以将节点含义不同或边含义不同的图称之为异构图,将在目标属性信息下所构建的异构图称之为目标异构图,且将对目标异构图中的节点进行特征聚合的图神经网络称之为异构图模型。
该异构图模型可以包括图注意力网络(Graph Attention Network,简称GAT),这里的图注意力网络是一种将注意力机制应用到图网络的经典图神经网络算法。深度学习中的注意力机制(Attention Mechanism)是一种模仿人类视觉和认知系统的方法,它允许神经网络在处理输入数据时集中注意力于相关的部分。通过引入注意力机制,神经网络能够自动地学习并选择性地关注输入中的重要信息,提高模型的性能和泛化能力。例如,一种基于多头注意力机制的模型(例如,Transformer)是一种由自注意力网络(self-Attenion)和前馈神经网络(Feed Forward Neural Network)组成的网络结构,广泛应用于NLP领域,并越来越多地被用于CV领域。
本申请实施例提供的方案涉及人工智能的深度学习等技术,具体通过如下实施例进行说明:
请参见图1,图1是本申请实施例提供的一种网络架构的结构示意图。如图1所示,该网络架构可以包括服务器10F和终端设备集群。该终端设备集群可以包括一个或者多个终端设备,这里将不对终端设备的数量进行限制。如图1所示,该终端设备集群具体可以包括终端设备100a、终端设备100b、终端设备100c、…、终端设备100n。如图1所示,终端设备100a、终端设备100b、终端设备100c、…、终端设备100n可以分别与上述服务器10F进行网络连接,以便于每个终端设备可以通过该网络连接与服务器10F进行数据交互。其中,这里的网络连接不限定连接方式,可以通过有线通信方式进行直接或间接地连接,也可以通过无线通信方式进行直接或间接地连接,还可以通过其他方式,本申请在此不做限制。
其中,该终端设备集群中的每个终端设备均可以包括:智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表、车载终端、智能电视等具有数据处理功能的智能终端。应当理解,如图1所示的终端设备集群中的每个终端设备均可以安装有应用客户端,当该应用客户端运行于各终端设备中时,可以分别与上述图1所示的服务器10F之间进行数据交互。其中,该应用客户端可以包括社交客户端、多媒体客户端(例如,视频客户端)、娱乐客户端(例如,游戏客户端)、信息流客户端、教育客户端、直播客户端等应用客户端。其中,该应用客户端可以为独立的客户端,也可以为集成在某客户端(例如,社交客户端、教育客户端以及多媒体客户端等)中的嵌入式子客户端,在此不做限定。
如图1所示,本申请实施例中的服务器10F可以为该应用客户端对应的服务器。该服务器10F可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。其中,本申请实施例将不对服务器的数量进行限制。
为便于理解,本申请实施例可以在图1所示的多个终端设备中选择一个终端设备作为业务终端设备。例如,本申请实施例可以将图1所示的终端设备100a作为业务终端设备,该业务终端设备中可以集成有应用客户端。此时,该业务终端设备可以通过该应用客户端对应的业务数据平台与服务器10F之间实现数据交互。其中,这里的应用客户端可以运行有异构图模型,该异构图模型中的图注意力网络可以用于对某种属性信息下的异构图的节点特征进行更新,即每个节点均可以通过聚合其邻居节点(以边相连的一跳邻居称为邻居节点)的初始节点特征,来更新自己的特征。
在本申请实施例中,具有数据匹配功能的计算机设备可以为服务器,也可以为图1所示的终端设备集群中的任意一个终端设备,例如,终端设备100a,这里将不对计算机设备的具体形式进行限定。为便于理解,本申请实施例中的计算机设备可以以服务器(例如,图1所示的服务器10F)为例,用以阐述该计算机设备基于图建模,从业务数据中确定与业务数据具备匹配关系的数据(即关键数据)的具体实施方式。
其中,在业务数据为视频数据时,该计算机设备所确定的关键数据可以为基于异构图模型,从视频数据中所选择出的封面数据。在业务数据为文本数据时,该计算机设备所确定的关键数据可以为基于异构图模型,从文本数据中所选择的文本标题或者文本摘要。当然,本申请实施例提供的这种数据匹配方法还可以应用在其他数据匹配场景中,这里将不对其进行一一举例。
应当理解,为了合理控制候选数据,服务器10F在获取到待匹配的业务数据时,可以对业务数据进行筛选处理,得到N个候选数据,这样不仅有效降低不合格数据(例如,低质量视频帧或低质量文本)被选作候选数据的可能性,还由于候选数据的数量降低,提高了后续数据匹配效率。其中,这里的N个候选数据可以包括候选数据i;i为小于或者等于N的正整数;N为大于1的正整数。
为了能够更加精准的获取业务数据的全局信息以及综合学习各候选数据之间的关系,该计算机设备可以针对业务数据的M个特征维度互不相同的属性信息,分别构建业务数据对应的M个异构图,进而通过对这M个异构图中的每个异构图分别进行异构图卷积处理,以得到候选数据i在M个属性信息下分别对应的注意力特征,M为大于1的正整数。
其中,一个异构图是在将N个候选数据分别对应的同一个属性信息作为节点时所构建得到的。比如,这M个异构图可以包括时序异构图和语义异构图。该时序异构图是在将N个候选数据分别对应的时序信息作为节点时所构建得到的;该语义异构图是在将N个候选数据分别对应的语义信息作为节点时所构建得到的。
进一步地,该计算机设备可以对M个注意力特征进行聚合处理,进而使得聚合处理后所得到的聚合特征Zi能够表征候选数据i在各个图结构中的节点结构信息和节点属性信息。其中,由于聚合特征Zi可以用于确定将候选数据i作为关键数据的概率参数,因此,聚合特征Zi越准确,该计算机设备确定的候选数据i的概率参数越准确,这样有利于后续能够从N个候选数据中,选择出最合适最具代表性的关键数据,从而有效提升数据匹配的效率以及准确度。
为便于理解,进一步地,请参见图2,图2是本申请实施例提供的一种基于图建模对候选数据进行表征的场景示意图。如图2所示,本申请实施例中的计算机设备可以为上述图1所示的终端设备集群中的任意一个终端设备,例如,终端设备100a,该计算机设备也可以为上述图1所示的服务器10F,这里将不对计算机设备进行限定。
其中,图2所示的数据20S可以为需要提取关键数据的业务数据,该业务数据可以为单模态的多媒体数据(例如,视频数据或文本数据),还可以为包括多种模态的多媒体数据(例如,包括图片和文本的新闻数据),这里将不对其进行限定。为便于阐述,本申请实施例中的数据20S可以以视频数据为例,用以阐述对视频数据进行封面选图的具体实施方式。
该计算机设备在获取到数据20S时,需要对数据20S进行筛选处理,以便于得到N个候选数据。其中,这里的N为大于1的正整数。这N个候选数据可以是计算机设备对数据20S进行抽取处理、过滤处理以及聚类择优处理后所得到的,一个候选数据对应一个聚类类别。这种筛选处理方式不仅可以过滤掉低质量的候选数据,还可以有效确保候选数据的多样性,以便于后续提升关键数据的准确度和效率。如图2所示,这N个候选数据具体可以包括子数据1、子数据2、…、子数据N。
其中,这里的业务数据可以包括M个特征维度互不相同的属性信息,M为大于1的正整数。比如,在数据20S为视频数据时,这M个属性信息中可以包括属性信息1(例如,时序信息)、属性信息2(例如,语义信息)、属性信息3(例如,纹理信息)、…、属性信息M(例如,热度信息)。该时序信息可以为视频帧的播放时间戳;语义信息可以为视频帧的图片语义特征;纹理信息可以为视频帧的图片纹理特征;热度信息可以为视频帧的热度参数,该热度参数是由观看对象(例如,用户)针对视频帧中的角色进行互动所生成的互动参数(例如,评论数、阅览量、点赞数、弹幕数等)所确定的。
然后,该计算机设备可以从M个属性信息中获取任意一个属性信息作为目标属性信息,并将N个候选数据分别对应的目标属性信息作为节点,以构建数据20S对应的目标异构图,进而可以对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征。其中,这里的候选数据i是指N个候选数据中的第i个候选数据;i为小于或者等于N的正整数。
如图2所示,若目标属性信息为属性信息1,则该计算机设备可以将N个候选数据分别对应的属性信息1作为节点,构建区域Q1所示的异构图,进而通过对区域Q1所示的异构图进行异构图卷积处理,以得到候选数据i在属性信息1下对应的注意力特征21Ei。
若目标属性信息为属性信息2,则该计算机设备可以将N个候选数据分别对应的属性信息2作为节点,构建区域Q2所示的异构图,进而通过对区域Q2所示的异构图进行异构图卷积处理,以得到候选数据i在属性信息2下对应的注意力特征22Ei。
以此类推,若目标属性信息为属性信息M,则该计算机设备可以将N个候选数据分别对应的属性信息M作为节点,构建区域Q3所示的异构图,进而通过对区域Q3所示的异构图进行异构图卷积处理,以得到候选数据i在属性信息M下对应的注意力特征23Ei。
在得到候选数据i在M个属性信息下分别对应的注意力特征时,该计算机设备可以对这M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi。由于聚合特征Zi可以用于确定将候选数据i作为关键数据的概率参数,因此,聚合特征Zi越准确,该计算机设备确定的候选数据i的概率参数越准确,这样有利于后续能够从N个候选数据中,选择出最合适最具代表性的关键数据,从而有效提升数据匹配的效率以及准确度。
在本申请实施例中,计算机设备可以将数据20S定义为异构图,将各视频帧的目标属性信息定义为异构图上的节点,通过对异构图进行异构图卷积处理,来学习各个视频帧在视频数据的某一维度信息中的代表性(也可以理解为重要程度),使得计算机设备能够获取到视频数据的全局信息并综合学习帧与帧之间的关系。对于某一视频帧而言,可能因为视频内容变化(例如,其前一帧或后一帧的内容发生改变)而产生不同的评价分数。
此外,由于本申请实例可以同时定义多种含义的视频帧间关系建模异构图算法,对不同的关系进行挖掘,以提供更多维度的学习信息,这样在后续对M个维度信息下的注意力特征进行聚合处理时,能够更加准确的对数据20S中的每一候选数据进行特征表示,从而可以提升网络的效果。
其中,计算机设备利用图建模的概念定义,通过对构建的M个目标异构图分别进行异构图卷积处理,以准确表征每个候选数据的数据特征(例如,聚合特征)的具体实现方式可以参见下述图3-图6所对应的实施例。
进一步地,请参见图3,图3是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图一。如图3所示,该方法可以由具备数据匹配功能的计算机设备执行,该计算机设备可以为终端设备(例如,上述图1所示的终端设备集群中的任意一个终端设备,例如,具备模型应用功能的终端设备100a),也可以为服务器(例如,上述图1所示的服务器10F),在此不做限定。为便于理解,本申请实施例以该方法由具备数据匹配功能的服务器执行为例进行说明,该方法至少可以包括以下步骤S101-步骤S104:
步骤S101,对业务数据进行筛选处理,得到N个候选数据。
具体地,在业务数据包括A个子数据时,该计算机设备可以对A个子数据进行筛选处理,将筛选处理后的子数据作为初始集合,进而可以基于业务数据对应的聚类数量B,对初始集合中的子数据进行聚类处理,得到B个子集合。然后,该计算机设备可以从B个子集合中确定待择优集合,分别确定待择优集合中的每个子数据的基础质量分数,从待择优集合中选择具有最高基础质量分数的子数据作为候选数据,直到得到B个子集合分别对应的候选数据。若B等于N,则该计算机设备可以将这B个子集合分别对应的候选数据,确定为N个候选数据。可选的,若B大于N,则该计算机设备可以基于B个候选数据中的每个候选数据的基础质量分数,从B个候选数据中筛选出N个候选数据。其中,这里的N为大于1的正整数;A为大于N的正整数;B为小于或者等于A的正整数。
其中,这里的业务数据是指需要提取关键数据的业务数据,该业务数据可以为单模态的多媒体数据(例如,视频数据或文本数据),还可以为包括多种模态的多媒体数据(例如,包括图片和文本的新闻数据),这里将不对其进行限定。
在业务数据为视频数据时,该业务数据包括的A个子数据中的每个子数据均为该视频数据中的视频帧。此时,该计算机设备可以获取与视频数据相关联的抽帧规则,进而可以基于视频数据的播放时长以及抽帧规则,对A个视频帧进行抽帧处理,得到视频帧集合。
其中,这里的抽帧规则可以包括播放时长阈值(例如,1分钟)。比如,若视频数据的播放时长未达到播放时长阈值,则该计算机设备可以基于抽帧规则中的抽帧频率阈值(例如,1fps,即每秒抽帧频率为1帧),对A个视频帧进行抽帧处理,得到视频帧集合。可选的,若视频数据的播放时长达到播放时长阈值,则该计算机设备可以基于抽帧规则中的抽帧数量阈值(例如,60帧),对A个视频帧进行抽帧处理,得到视频帧集合。比如,在视频数据的播放时长超过一分钟时,这里的视频帧集合可以为该计算机设备从A个视频帧中均匀采样60帧后所得到的,也可以为计算机设备按照每个视频帧的帧类型(例如,IBP帧),从A个视频帧中抽取60帧后所得到的,还可以为计算机设备从A个视频帧中等间隔抽取60帧后所得到的。当然,该视频帧集合还可以是计算机设备选用播放数据更好的若干片段进行抽帧后所得到的,这里将不对抽帧方式进行限定。
由于视频帧集合中包括的帧数最多,因此可采用轻量算法对视频帧集合进行过滤处理,以得到待聚类的集合(即初始集合),这样将可以在聚类之前,初步过滤出超低质画面,从而可以有效避免将超低质画面单立一类而选入候选帧。比如,该计算机设备可以对视频帧集合中的每个视频帧进行图片评估维度分析(即基于传统图像算子进行基础分析),得到视频帧集合中的每个视频帧在C个图片评估维度下分别对应的评估参数;C为正整数。进一步地,该计算机设备可以基于C个评估参数,对视频帧集合进行过滤,将过滤后的视频帧集合确定为初始集合。
其中,若C等于1,则该计算机设备可以直接基于这个评估参数,对视频集合进行过滤,且将过滤后的视频帧集合确定为初始集合。比如,若视频帧集合中的视频帧的数量为60,则该计算机设备可以获取这60个视频帧在该评估参数下的评估值(即评分),进而可以基于这60个评估值,对60个视频帧进行排序处理,进而可以从排序结果中,按序获取与过滤阈值(例如,90%)相匹配的视频帧,即获取排序靠前的54个视频帧作为初始集合,即留用评分为前90%的视频帧。
可选的,若C大于1,则该计算机设备可以从C个评估参数中,获取初始评估参数,基于视频帧集合中的每个视频帧在初始评估参数下的评估值,进而可以对视频帧集合中的视频帧进行排序处理,得到初始排序结果,从初始排序结果中,按序获取与过滤阈值相匹配的视频帧,作为中间集合。然后,该计算机设备可以将C个评估参数中除初始评估参数之外的(C-1)个评估参数,确定为剩余评估参数,并基于剩余评估参数,对中间集合进行过滤,将过滤后的中间集合确定为初始集合。
比如,这里的C个评估参数可以以3个为例,具体可以包括图片锐度、图片明度、图片熵。图片锐度是图像质量中最重要的指标,它反映了图像系统中成像细节的多少,图片锐度是由不同色调或颜色的区域之间的边界来定义的,其计算方式可以为对第一算子结果(即对视频帧进行横向边缘检测所得到的算子结果)和第二算子结果(即对视频帧进行纵向边缘检测得到的算子结果)进行求和处理;图片明度用于表示图片的明暗分布,在图片中它是唯一控制细节的元素(比如黑白照片没有任何色相和饱和度的变化,只有明暗差异构成了图像),同时,它也控制了整体的画风,其计算方式是对视频帧中的所有像素点的灰度求平均值;图像熵用于代表图片携带的信息,其计算方式为图像灰度级集合的比特平均数,单位比特/像素,也描述了图像信源的平均信息量,其中,图片携带的信息量越大图片质量越好。
然后,该计算机设备可以从图片锐度、图片明度以及图片熵中,随机选择一个评估参数(例如,图片明度)作为初始评估参数,进而可以基于视频帧集合中的每个视频帧在该评估参数下的评估值,对A个视频帧进行排序处理,得到初始排序结果。进一步地,该计算机设备可以从初始排序结果中,按序获取与过滤阈值(即第一过滤阈值,例如,90%)相匹配的视频帧作为中间集合(例如,第一中间集合)。其中,在视频帧集合中的视频帧数量为60时,该第一中间集合可以包括54个视频帧,即这54个视频帧中的每个视频帧均属于视频帧集合中评分为前90%的视频帧。
这时,该计算机设备可以将这3个评估参数中除初始评估参数之外的2个评估参数,确定为剩余评估参数(例如,图片锐度和图片熵)。该计算机设备可以继续从剩余评估参数中随机选择一个评估参数(例如,图片锐度)作为第一评估参数,进而可以基于第一中间集合中的每个视频帧在该第一评估参数下的评估值,对第一中间集合中的每个视频帧进行排序处理,得到第一排序结果。然后,该计算机设备可以从第一排序结果中,按序获取与过滤阈值(即第二过滤阈值,例如,85%)相匹配的视频帧作为中间集合(例如,第二中间集合)。其中,该第二中间集合可以包括45个视频帧,即这45个视频帧中的每个视频帧均属于第一中间集合中评分为前90%的视频帧。
同理,该计算机设备可以这3个评估参数中除已过滤评估参数(初始评估参数以及第一评估参数)之外的评估参数,继续确定为剩余评估参数。该计算机设备可以将剩余评估参数中的这个评估参数(例如,图片熵)作为第二评估参数,进而可以基于第二中间集合中的每个视频帧在该第二评估参数下的评估值,对第二中间集合中的每个视频帧进行排序处理,得到第二排序结果。然后,该计算机设备可以从第二排序结果中,按序获取与过滤阈值(即第三过滤阈值,例如,90%)相匹配的视频帧作为中间集合(例如,第三中间集合)。其中,该第三中间集合可以包括40个视频帧,即这40个视频帧中的每个视频帧均属于第二中间集合中评分为前90%的视频帧。由于此时这C个评估参数中的每个评估参数均参与过滤,即剩余评估参数已为空,因此,该计算机设备可以将第三中间集合确定为初始集合。其中,第一过滤阈值、第二过滤阈值以及第三过滤阈值均可以根据实际业务需求进行动态调整,这里将不对其进行限定。
在得到初始集合后,该计算机设备可以对初始集合进行聚类择优处理,以得到N个候选数据。比如,该计算机设备可以通过用于对图片进行特征提取的图片编码器,分别获取初始集合中的每个视频帧的视频表征向量,进而可以基于视频数据对应的聚类数量B以及初始集合中的每个视频帧的视频表征向量,对初始集合中的视频帧进行聚类处理,得到B个聚类类别分别对应的子集合。其中,这里的视频表征向量可以为基于图片编码器,对视频帧进行编码处理后所得到的向量(例如,图片语义特征或图片纹理特征)。其中,为了保留对视频场景的筛选余地,这里的聚类数量B可以设置为出图数(关键数据对应的数量,即在发起封面选图时所指定要求的选图数量)的2倍,且B小于或者等于异构图模型所允许的节点最大数量(例如,32)。其中,这里的聚类处理方式包括但不限于划分式聚类方法、基于密度的聚类方式、层次化聚类方法等。
然后,该计算机设备可以从这B个子集合中确定出待择优集合,分别确定待择优集合中的每个视频帧的基础质量分数。其中,这里的基础质量分数可以为上述C个评估维度中的任意一种评估维度下的评估值,也可以为另一种用于类内择优的评估维度(例如,图片静止度)下的评估值,这里将不对其进行限定。
具体地,图片静止度的计算方式可以参见公式(1):
其中,Pi用于表示视频数据中的第i个视频帧;Pi+1用于表示第i个视频帧的后一个视频帧;Pi-1用于表示第i个视频帧的前一个视频帧;a用于表示第i个视频帧的宽,b用于表示第i个视频帧的高。
进一步地,该计算机设备可以从待择优集合中,选择具有最高基础质量分数的视频帧作为候选数据,直到得到B个子集合分别对应的候选数据,基于B个候选数据,确定用于进行图构建的N个候选数据。比如,若B大于N,则该计算机设备可以基于B个候选数据分别对应的基础质量分数,对这B个候选数据进行排序处理,进而可以从排序处理后的排序结果中,按序获取排序靠前的N个候选数据。
可选的,在业务数据为文本数据时,该业务数据包括的A个子数据中的每个子数据均为该文本数据中的句子文本。此时,该计算机设备可以获取与文本数据相关联的筛选规则以及文本数据的段落格式,对A个句子文本进行筛选处理,将筛选处理后的句子文本作为句子集合。比如,若该筛选规则用于指示抽取段落首句和段落尾句,则该计算机设备可以基于文本数据的段落格式,分别从文本数据的每段文本中获取2个句子文本,得到句子集合。然后,该计算机设备可以从句子集合中获取异常句子(例如,重复句子或低质量句子),基于该异常句子,对句子集合进行过滤处理,进而可以将过滤处理后的句子集合确定为初始集合。
进一步地,该计算机设备可以对初始集合进行聚类择优处理,以得到N个候选数据。比如,该计算机设备可以通过用于对文本进行特征提取的文本编码器,分别获取初始集合中的每个句子文本的句子表征向量,进而可以基于文本数据对应的聚类数量B以及初始集合中的句子文本的句子表征向量,对初始集合中的句子文本进行聚类处理,得到B个聚类类别分别对应的子集合。其中,这里的聚类处理方式包括但不限于划分式聚类方法、基于密度的聚类方式、层次化聚类方法等。
此时,该计算机设备可以从这B个子集合中确定出待择优集合,分别确定待择优集合中的每个句子文本的基础质量分数。其中,该基础质量分数可以为连贯性(coherence)、流畅性(fluency)或一致性(consistency)等多种评估维度中的任意一个评估维度下对应的评估值,这里将不对其进行限定。然后,该计算机设备可以从待择优集合中,选择具有最高基础质量分数的句子文本作为候选数据,直到得到B个子集合分别对应的候选数据,进而可以基于B个候选数据,确定用于进行图构建的N个候选数据。
可选的,在业务数据为包括多种模态的多媒体数据(例如,包括图片和文本的新闻数据)时,该计算机设备可以基于关键数据所对应的模态,对业务数据进行筛选处理后所得到的。比如,若关键数据为文本标题或者文本摘要,则意味着这里的关键数据所对应的模态为文本模态,此时,该计算机设备可以从包括多种模态的多媒体数据中获取属于文本模态的文本数据,进而可以基于获取到的文本数据,确定N个候选数据。若关键数据为封面数据,则意味着这里的关键数据为图片模态,此时,该计算机设备可以从包括多种模态的多媒体数据中获取属于图片模态的图片数据,进而可以基于获取到的图片数据,确定N个候选数据。
基于此,在业务数据为单模态的多媒体数据时,这里的N个候选数据可以是计算机设备对业务数据进行抽取处理、过滤处理以及聚类择优处理后所得到的,一个候选数据对应一个聚类类别。可选的,在业务数据为包括多种模态的多媒体数据时,这里的N个候选数据可以为该计算机设备基于关键数据所对应的模态,对业务数据进行筛选处理后所得到的。其中,N个候选数据可以包括候选数据i;i为小于或者等于N的正整数,且业务数据可以包括M个特征维度互不相同的属性信息;M为大于1的正整数。
步骤S102,从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图。
其中,这里的M个属性信息可以包括时序信息和语义信息;该目标异构图为时序异构图或语义异构图;时序异构图是在将N个候选数据分别对应的时序信息作为节点时所构建得到的;语义异构图是在将N个候选数据分别对应的语义信息作为节点时所构建得到的。
在业务数据为文本数据时,若目标属性信息为时序信息(即句子文本的出现次序),则该计算机设备可以将这N个候选数据中的每个候选数据(即句子文本)在文本数据中的出现次序作为节点。然后,该计算机设备可以针对时序信息的第一构建规则,将次序间隔小于次序间隔阈值(例如,5句)的两个候选数据对应的节点进行连接,从而得到时序异构图。其中,时序异构图中的边可以称之为时序相近边。
若目标属性信息为语义信息(即句子文本的文本语义特征),则该计算机设备可以将这N个候选数据中的每个候选数据(即句子文本)对应的文本语义特征作为节点。然后,该计算机设备可以针对语义信息的第二构建规则,将特征相似度小于相似度阈值(例如,0.7)的两个候选数据对应的节点进行连接,从而得到语义异构图。其中,语义异构图中的边可以称之为语义相近边。
可选的,在业务数据为视频数据时,该计算机设备基于M个属性信息所确定的M个异构图可以包括时序异构图和语义异构图。其中,时序异构图是在将N个候选数据分别对应的时序信息(例如,播放时间戳)作为节点时所构建得到的;语义异构图是在将N个候选数据分别对应的语义信息(例如,图片语义特征)作为节点时所构建得到的。其中,该计算机设备针对视频数据所构建的时序异构图和语义异构图可以参见上述针对文本数据的异构图构建方式,这里将不对其进行赘述。当然,为了获取更多维度的信息,这M个异构图中还可以包括纹理异构图和热度异构图,其中,这里的纹理异构图是在将N个候选数据分别对应的纹理信息(例如,图片纹理特征)作为节点时所构建得到的;这里的热度异构图是在将N个候选数据分别对应的热度信息(例如,热度参数)作为节点时所构建得到的。
为便于理解,进一步地,请参见图4,图4是本申请实施例提供的一种针对视频帧的节点表征示意图。如图4所示,该计算机设备针对业务数据(例如,视频数据)进行筛选处理后所得到的候选数据的数量可以为N个,N为大于1的正整数。为便于阐述,本申请实施例可以以5个为例,这5个候选数据具体可以包括视频帧1、视频帧2、视频帧3、视频帧4以及视频帧5。
如图4所示,这里的图片编码器40W可以为用于对某一视频帧的语义信息进行提取的模型。该图片编码器40W可以为CLIP(Contrastive Language-Image Pre-Training)模型中的图片编码器。CLIP模型是一种基于对比学习的大规模图文预模型,且CLIP模型的文本编码器和图片编码器都是基于transformer结构。可以理解的是,CLIP模型是当前较为先进的跨模态特征提取方法,其将文本与图像映射到同一个共享的特征空间中,从而可以计算不同模态下数据间的相似度。相较于当前其他方法所使用的底层图片纹理特征相比,采用CLIP预训练模型中的图片编码器能提取包含高层语义信息的图像特征,因此也可以认为经过了CLIP图片编码器后,其图片表征即包含该图片的语义信息。
应当理解,计算机设备可以从业务数据的M个属性信息中目标属性信息,若这里的目标属性信息为语义信息(即图片语义特征),则该计算机设备可以通过图4所示的图片编码器40W,对这5个视频帧中的每个视频帧分别进行特征提取,以得到每个视频帧对应的图片语义特征。比如,对于任意一个视频帧(例如,视频帧1)而言,该计算机设备可以将视频帧1输入至图片编码器40W,通过该图片编码器40W对视频帧1的语义信息进行提取,从而可以得到该视频帧1对应的图片语义特征h1。同理,该计算机设备可以得到视频帧2对应的图片语义特征h2、视频帧3对应的图片语义特征h3、视频帧4对应的图片语义特征h4、视频帧5对应的图片语义特征h5。
然后,该计算机设备可以将这5个图片语义特征分别作为用于构建异构图的节点。由于针对语义信息的构建规则指示需要将特征相似度小于相似度阈值(例如,0.7)的两个节点进行连接,因此,该计算机设备可以确定任意两个节点之间的特征相似度(例如,图片语义特征的cos距离)。
如图4所示,对于视频帧1对应的节点(例如,节点N1)而言,该计算机设备可以分别确定节点N1与视频帧2对应的节点(例如,节点N2)的特征相似度(例如,相似度R12)、节点N1与视频帧3对应的节点(例如,节点N3)的特征相似度(例如,相似度R13)、节点N1与视频帧4对应的节点(例如,节点N4)的特征相似度(例如,相似度R14)、节点N1与视频帧5对应的节点(例如,节点N5)的特征相似度(例如,相似度R15)。若相似度R12与相似度R13均小于相似度阈值,因此,该计算机设备可以确定与节点N1具有连接关系的节点为节点N2和节点N3,进而可以将节点N1与节点N2进行连接,将节点N1与节点N3进行连接。
然后,该计算机设备需要进一步确定节点N2与除节点N1之外的其他3个节点之间的特征相似度,进而基于针对语义信息的构建规则,确定与节点N2相连的剩余节点为节点N3、节点N4和节点N5,此时,该计算机设备可以将节点N2与节点N3进行连接,将节点N2与节点N4进行连接,将节点N2与节点N5进行连接。
依次类推,该计算机设备可以分别确定与节点N3相连的剩余节点、与节点N4相连的剩余节点以及与节点N5相连的剩余节点,在将其依次连接完成后,得到目标异构图(即区域4Q所示的语义异构图)。
步骤S103,对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征。
具体地,该计算机设备可以获取目标异构图中的每个节点对应的初始节点特征,进而在目标异构图中,将候选数据i对应的节点作为目标节点,并确定目标节点的邻居节点集合。其中,这里的邻居节点集合可以包括H个邻居节点;H为正整数。进一步地,该计算机设备可以对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,本申请实施例中可以通过调用异构图模型,对每个异构图中的各节点分别进行特征聚合。这里的异构图模型可以为一种将图注意力网络应用于异构图的图神经网络算法(例如,Heterogeneous Graph Attention Network,简称HAN)。对于同一个节点而言,不同的GAT更新的节点表示,也需要聚合然后统一更新出一个节点表示。此处聚合方式使用与GAT层相似的注意力机制,为了与GAT中计算节点级别的注意力层区分开,本申请实施例可以将用于聚合注意力特征的注意力层称之为语义级别的注意力层。
换言之,这里的HAN可以是一个两层的attention架构,分别包括节点级别的注意力层和语义级别的注意力层。为便于阐述,本申请实施例可以将节点级别的注意力层称之为第一注意力层,将语义级别的注意力层称之为第二注意力层。其中,由于本申请实施例构建了M个属性信息分别对应的异构图,为了提高特征提取效率,该异构图模型可以包括M个第一注意力层。比如,若M个属性信息分别对应的异构图中包括时序信息对应的时序异构图和语义信息对应的语义异构图,则该异构图模型中可以包括两个第一注意力层,一个用于对时序异构图进行异构图卷积处理,一个用于对语义异构图进行异构图卷积处理。
其中,目标异构图对应的第一注意力层中可以包括X个注意力子层,X为正整数;这X个注意力子层包括注意力子层Lx;x为小于或者等于X的正整数。具体地,该计算机设备通过目标异构图对应的第一注意力层,对目标异构图进行异构图卷积处理的方式可以参见下述公式(2)-公式(4):
其中,hi可以用于表示目标异构图中的候选数据i对应的节点(例如,节点Ni)的初始节点特征,hj可以用于表示节点Ni的某一邻居节点(例如,邻居节点Nj)的初始节点特征;∨j∈N(i),N(i)用于表示节点Ni的邻居节点集合;W表示映射函数,将不同类型的节点表示映射到同一特征空间下;a用于表示另一映射函数,映射成唯一的分数;αij为邻居节点Nj针对节点Ni的注意力权重,用于表示节点Ni和邻居节点Nj之间的相关性;
其中,X用于表示该目标异构图对应的第一注意力层所包括的注意力子层的数量,X为正整数;x可以用于表示第x个注意力子层(即注意力子层Lx);可以用于表示与注意力子层Lx相关联的注意力权重;Wx用于表示注意力子层Lx的可学习参数;σ(•)用于表示激活函数;/>用于表示节点Ni在注意力子层Lx所提取的注意力子特征(即单头注意力信息);Ei可以用于表示候选数据i在目标属性信息下对应的注意力特征。
可以理解的是,在将目标异构图输入至目标异构图对应的第一注意力层时,该计算机设备可以基于注意力子层Lx的可学习参数,对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,确定目标节点在注意力子层Lx的注意力子特征。在得到H个邻居节点分别对应的相关性特征时,该计算机设备可以基于上述公式(3),对H个相关性特征进行聚合处理,得到目标节点在注意力子层Lx的注意力子特征。
其中,这里的H个邻居节点包括邻居节点Nj;j为小于或者等于H的正整数。比如,该计算机设备基于上述公式(2)、目标节点的初始节点特征、H个邻居节点的初始节点特征以及注意力子层Lx的可学习参数,对目标节点和邻居节点Nj进行相关性学习,得到与注意力子层Lx相关联的注意力权重αij。进一步地,该计算机设备可以基于上述公式(3),将注意力权重αij、邻居节点Nj的初始节点特征以及注意力子层Lx的可学习参数之间的乘积,确定为邻居节点Nj对应的相关性特征。
在确定目标节点在X个注意力子层分别对应的注意力子特征时,该计算机设备可以基于上述公式(4),对这X个注意力子特征进行拼接处理,以得到候选数据i在目标属性信息下对应的注意力特征,这样将可以将多个单头注意力信息聚合到一起,以丰富模型能力。
步骤S104,在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi。
其中,候选数据i在目标属性信息下对应的注意力特征是基于异构图模型中的第一注意力层,对目标异构图进行异构图卷积处理后所得到的;异构图模型包括第二注意力层。在得到候选数据i在M个属性信息下分别对应的注意力特征时,该计算机设备可以将M个注意力特征输入至第二注意力层。其中,这里的M个注意力特征包括属性信息p对应的注意力特征Ep,属性信息p属于M个属性信息;p为小于或者等于M的正整数。进一步地,该计算机设备可以基于第二注意力层中的网络参数以及注意力特征Ep,确定注意力特征Ep对应的属性权重参数βp,然后,将注意力特征Ep以及属性权重参数βp的乘积确定为属性信息p对应的待聚合特征。在得到M个属性信息分别对应的待聚合特征时,该计算机设备可以对M个待聚合特征进行求和处理,得到候选数据i对应的聚合特征Zi。其中,这里的聚合特征Zi可以用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
具体地,该计算机设备通过第二注意力层,对M个注意力特征进行聚合处理的方式可以参见下述公式(5)-公式(7):
其中,这里的q可以用于表示语义级别的attention向量,w是权值矩阵,b是偏置向量;p用于表示M个属性信息中的任意一个属性信息;Ep用于表示候选数据i在属性信息p下对应的注意力特征;βp用于表示注意力特征Ep对应的属性权重参数;Fp用于表示属性信息p对应的待聚合特征。
为便于理解,进一步地,请参见图5,图5是本申请实施例提供的一种通过异构图模型确定概率参数的场景示意图。如图5所示,本申请实施例中的异构图模型5W可以为计算机设备针对业务数据(例如,视频数据)所获取到的异构图模型。该计算机设备可以针对业务数据的M个属性信息,分别构建每个属性信息对应的异构图。为便于理解,这里的M可以以2个为例,具体可以包括时序信息对应的时序异构图(例如,区域5Q1所示的异构图)和语义信息对应的语义异构图(例如,区域5Q2所示的异构图)。其中,这里的时序异构图可以由节点与时序相近边组成,这里的语义异构图可以由节点与语义相近边组成。
基于此,该异构图模型5W中可以包括2个第一注意力层(例如,注意力层51L1和注意力层51L2)、一个第二注意力层(例如,注意力层52L)以及一个分类识别层(例如,分类识别层53L)。其中,注意力层51L1可以用于对时序异构图进行异构图卷积处理,注意力层51L2用于对语义异构图进行异构图卷积处理;注意力层52L可以用于对两个注意力特征进行聚合处理;分类识别层53L可以用于识别任意一个候选数据(例如,视频帧)的概率参数。
如图5所示,在计算机设备确定某一候选数据(例如,候选数据i)的最终节点特征时,该计算机设备可以先在区域5Q1所示的异构图中,确定候选数据i对应的节点Ni(即第一目标节点),以及第一目标节点的邻居节点集合(即第一邻居节点集合),进而可以通过注意力层51L1以及上述公式(2)-公式(4),对第一目标节点的初始节点特征(例如,图片语义特征)以及第一邻居节点集合中的每个邻居节点的初始节点特征进行聚合处理,得到候选数据i在时序信息下对应的注意力特征(例如,图5所示的注意力特征51Ei)。其中,该图片语义特征可以为通过CLIP模型中的图片编码器(例如,图4所示的图片编码器40W)所提取的图像特征,其特征维度可以为1024维。
然后,该计算机设备可以参见注意力特征21Ei的特征表示方法,在区域5Q2所示的异构图中,确定候选数据i对应的节点Ni(即第二目标节点),以及第二目标节点的邻居节点集合(即第二邻居节点集合),进而可以通过注意力层51L2以及上述公式(2)-公式(4),对第二目标节点的初始节点特征(例如,播放时间戳对应的特征)以及H个邻居节点的初始节点特征进行聚合处理,得到候选数据i在语义信息下对应的注意力特征(例如,图5所示的注意力特征52Ei)。
然后,该计算机设备可以将注意力特征51Ei和注意力特征52Ei输入至注意力层52L,进而可以通过注意力层52L,对两个注意力特征进行聚合处理。比如,该计算机设备可以基于注意力层52L中的网络参数、注意力特征51Ei以及上述公式(5)-(6),确定注意力特征51Ei对应的属性权重参数,然后,将注意力特征51Ei以及注意力特征51Ei对应的属性权重参数的乘积确定为候选数据i在时序信息下对应的待聚合特征F1。同理,该计算机设备可以基于注意力层52L中的网络参数、注意力特征52Ei以及上述公式(5)-(6),确定注意力特征52Ei对应的属性权重参数,然后,将注意力特征52Ei以及注意力特征52Ei对应的属性权重参数的乘积确定为候选数据i在语义信息下对应的待聚合特征F2。
然后,该计算机设备可以基于上述公式(7),对待聚合特征F1和待聚合特征F2进行求和处理,得到候选数据i对应的聚合特征50Zi。进一步地,该计算机设备可以将聚合特征50Zi输入至分类识别层53L,通过分类识别层53L对候选数据i进行特征匹配,以确定候选数据i对应的概率参数yi。比如,在业务数据为视频数据时,该候选数据i的概率参数yi可以用于在指示候选数据i被选作封面数据的可能性。
换言之,图5所示的异构图模型5W的输入可以为N个候选数据在各维度信息下的初始节点特征,输出为N维结果。每个维度的数值代表对应候选帧适合作为封面图的概率参数。由此可见,本申请实施例利用图建模的概念定义从视频数据中选取封面图的问题,利用图神经网络的相关理论学习视频中语义最合适最具代表性视频帧作为该视频数据的封面图,在保证效果的同时简化封面图的机器选取流程。此外,本申请实施例所使用的数据均为线上真实数据,涵盖复杂多样的业务场景,简单有效地解决复杂主观的选图问题。
在本申请实施例中,利用图建模的概念定义,通过对构建的目标异构图进行异构图卷积处理,以准确表征每个候选数据的语义信息以及在图结构中的节点结构信息和节点属性信息,使得计算机设备能够获取业务数据的全局信息以及综合学习各候选数据之间的关系,从而提升数据表征的准确度。由于聚合特征Zi可以用于确定将候选数据i作为关键数据的概率参数,且这里的关键数据是指与业务数据具备匹配关系的数据,因此,聚合特征Zi越准确,该计算机设备确定的候选数据i的概率参数越准确,这样有利于后续能够从N个候选数据中,选择出最合适最具代表性的关键数据,从而有效提升数据匹配的效率以及准确度。
进一步地,请参见图6,图6是本申请实施例提供的一种基于人工智能的数据处理方法的流程示意图二。如图6所示,该方法可以由具备数据匹配功能的计算机设备执行,该计算机设备可以为终端设备(例如,上述图1所示的终端设备集群中的任意一个终端设备,例如,具备模型应用功能的终端设备100a),也可以为服务器(例如,上述图1所示的服务器10F),在此不做限定。为便于理解,本申请实施例以该方法由具备数据匹配功能的服务器执行为例进行说明,该方法至少可以包括以下步骤S201-步骤S206:
步骤S201,对业务数据进行筛选处理,得到N个候选数据。
步骤S202,从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图。
步骤S203,对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征。
步骤S204,在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi。
其中,该步骤S201-步骤S204的具体实施方式可参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再继续进行赘述。
步骤S205,在得到每个候选数据分别对应的聚合特征时,基于N个聚合特征,对N个候选数据分别进行特征匹配,得到每个候选数据对应的概率参数。
具体地,在得到每个候选数据分别对应的聚合特征时,该计算机设备可以通过用于确定关键数据的分类识别层(例如,上述图5所示的分类识别层53L)以及N个聚合特征,对每个候选数据分别进行特征匹配,以得到每个候选数据对应的概率参数。
比如,若业务数据对应的候选数据为32个,则该计算机设备在将32个聚合特征输入至分类识别层之后,可以得到32维的数组,该数组中的一个维度用于代表一个节点对应的候选数据的概率参数,即该候选数据作为封面数据的概率。其取值范围可以为[0,1]。
步骤S206,基于针对业务数据的数据选择策略以及N个概率参数,从N个候选数据中确定与数据选择策略相匹配的关键数据。
其中,这里的数据选择策略可以根据业务数据对应的实际业务情况,进行适应性的调整。比如,该数据选择策略可以用于指示选择出具有最高概率参数的候选数据,也可以用于指示选择出概率参数达到概率参数阈值(例如,0.7)的候选数据,还可以用于选择出与指定类别相匹配的候选数据,这里将不对数据选择策略进行限定。
应当理解,本申请实施例可以用于在线视频的视频封面图选取流程。通过本发明选出的优质图片,也可以用于图片素材库的建立。根据视频内容有针对性地调整图片选取权重及方式,更贴近业务实际需求,后续也可利用同样思路进行千人千面图片的封面图多样化选择。例如,在业务数据为视频数据,且数据选择策略用于指示选择出概率参数达到概率参数阈值的候选数据时,该计算机设备可以在N个候选数据中,将概率参数达到概率参数阈值的候选数据确定为第一待筛选数据。若第一待筛选数据的数量为一个,则该计算机设备可以直接将第一待筛选数据确定为与业务数据具备匹配关系的关键数据(即封面数据)。可选的,若第一待筛选数据的数量为至少两个,则该计算机设备可以将这至少两个的第一待筛选数据一并作为与业务数据具备匹配关系的关键数据(例如,动态展示的封面数据)。
当然,若数据选择策略包括指定类别(例如,包括业务角色A的视频帧),且第一待筛选数据的数量为至少两个,则该计算机设备可以从至少两个第一待筛选数据中,获取与指定类别相匹配的第一待筛选数据,进而可以将获取到的第一待筛选数据确定为第二待筛选数据。可以理解的是,若第二待筛选数据的数量为一个,则该计算机设备直接将该第二待筛选数据确定为与业务数据具备匹配关系的关键数据。可选的,在第二待筛选数据的数量为至少两个,且关键数据的出图数为一个时,该计算机设备可以从至少两个第二待筛选数据中,确定具有最高概率参数的第二待筛选数据,进而可以将具有最高概率参数的第二待筛选数据,作为与业务数据具备匹配关系的关键数据。
在本申请实施例中,在业务数据为视频数据,且关键数据为针对业务数据所选择的封面数据时,该计算机设备执行的数据处理过程具体可以包括以下3个阶段,其中,第一阶段为视频筛选聚类阶段,该计算机设备在执行上述步骤S201时,能够在线解码抽取视频帧,同时输出重要度信息并利用传统图像基础算子计算出图像基础特征分数,以作为策略打分的一部分信息;第二阶段为模型分析阶段,通过执行上述步骤S202-步骤S204,利用多任务的图注意力网络同时输出各帧的代表性打分预测;第三阶段为策略阶段,基于前序预测得到的概率参数,确定与业务数据具备匹配关系的视频帧作为关键数据。基于此,本本申请实施例通过提出图建模的方式来看待视频选图问题,并设计出一套完备且高效的算法用于判定视频各帧的分数,即可单独作为视频选图依据,也可结合业务实际需求增删分析模块用于业务侧视频封面图选取,为封面图、海报图等图片素材的最终生成打下基础。在后续验证中,本申请实施例提供的这种选图方法在某一评估参数(例如,Normalize DiscountedCumulative Gain,简称ndcg)上的数值较高(例如,达到0.75),其中,ndcg是一种对搜索引擎排序进行度量的有效性方法,此处用作图片排序评价度量方法,这意味着选图效果得到了明显提升,可进一步提高图片的吸引力,从而有效提升阅览用户针对视频数据的点击率(Click-Through-Rate,简称CTR)。
进一步地,请参见图7,图7是本申请实施例提供的一种基于人工智能的数据处理装置的结构示意图一。如图7所示,该基于人工智能的数据处理装置1可以包括:数据筛选模块100,构建模块200,卷积处理模块300以及聚合处理模块400。
该数据筛选模块100,用于对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;N个候选数据包括候选数据i;i为小于或者等于N的正整数;业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;
该构建模块200,用于从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图;
该卷积处理模块300,用于对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;
该聚合处理模块400,用于在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
其中,该数据筛选模块100,构建模块200,卷积处理模块300以及聚合处理模块400的具体实现方式可以参见上述图3所对应实施例中对步骤S101-步骤S104的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图8,图8是本申请实施例提供的一种基于人工智能的数据处理装置的结构示意图二。如图8所示,该基于人工智能的数据处理装置2可以包括:数据筛选模块11,构建模块12,卷积处理模块13,聚合处理模块14,概率确定模块15,策略获取模块16,第一确定模块17,第二确定模块18,第三确定模块19以及第四确定模块20。
该数据筛选模块11,用于对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;N个候选数据包括候选数据i;i为小于或者等于N的正整数;业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;
其中,业务数据包括A个子数据;A为大于N的正整数;
该数据筛选模块11包括:第一筛选单元111,聚类处理单元112,择优单元113以及第二筛选单元114。
该第一筛选单元111,用于对A个子数据进行筛选处理,将筛选处理后的子数据作为初始集合;
其中,业务数据为视频数据;A个子数据中的每个子数据均为视频数据中的视频帧;
该第一筛选单元111包括:规则获取子单元1111,抽帧子单元1112,分析子单元1113以及过滤子单元1114。
该规则获取子单元1111,用于获取与视频数据相关联的抽帧规则;
该抽帧子单元1112,用于基于视频数据的播放时长以及抽帧规则,对A个视频帧进行抽帧处理,得到视频帧集合。
其中,抽帧规则包括播放时长阈值;
该抽帧子单元1112还具体用于:
若视频数据的播放时长未达到播放时长阈值,则基于抽帧规则中的抽帧频率阈值,对A个视频帧进行抽帧处理,得到视频帧集合;
若视频数据的播放时长达到播放时长阈值,则基于抽帧规则中的抽帧数量阈值,对A个视频帧进行抽帧处理,得到视频帧集合。
该分析子单元1113,用于对视频帧集合中的每个视频帧进行图片评估维度分析,得到视频帧集合中的每个视频帧在C个图片评估维度下分别对应的评估参数;C为正整数;
该过滤子单元1114,用于基于C个评估参数,对视频帧集合进行过滤,将过滤后的视频帧集合确定为初始集合。
其中,该过滤子单元1114还具体用于:
若C大于1,则从C个评估参数中,获取初始评估参数;
基于视频帧集合中的每个视频帧在初始评估参数下的评估值,对视频帧集合中的视频帧进行排序处理,得到初始排序结果,从初始排序结果中,按序获取与过滤阈值相匹配的视频帧,作为中间集合;
将C个评估参数中除初始评估参数之外的(C-1)个评估参数,确定为剩余评估参数;
基于剩余评估参数,对中间集合进行过滤,将过滤后的中间集合确定为初始集合。
其中,该规则获取子单元1111,抽帧子单元1112,分析子单元1113以及过滤子单元1114的具体实现方式可以参见上述图3所对应实施例中对视频数据进行抽帧处理的描述,这里将不再继续进行赘述。
该聚类处理单元112,用于基于业务数据对应的聚类数量B,对初始集合中的子数据进行聚类处理,得到B个子集合;B为小于或者等于A的正整数;
该择优单元113,用于从B个子集合中确定待择优集合,分别确定待择优集合中的每个子数据的基础质量分数,从待择优集合中选择具有最高基础质量分数的子数据作为候选数据,直到得到B个子集合分别对应的候选数据;
该第二筛选单元114,用于若B大于N,则基于B个候选数据中的每个候选数据的基础质量分数,从B个候选数据中筛选出N个候选数据。
其中,该第一筛选单元111,聚类处理单元112,择优单元113以及第二筛选单元114的具体实现方式可以参见上述图3所对应实施例中对步骤S101的描述,这里将不再继续进行赘述。
该构建模块12,用于从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图。
其中,M个属性信息包括时序信息和语义信息;目标异构图为时序异构图或语义异构图;时序异构图是在将N个候选数据分别对应的时序信息作为节点时所构建得到的;语义异构图是在将N个候选数据分别对应的语义信息作为节点时所构建得到的。
该卷积处理模块13,用于对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,该卷积处理模块13包括:初始特征获取单元131,邻居节点确定单元132以及聚合处理单元133。
该初始特征获取单元131,用于获取目标异构图中的每个节点对应的初始节点特征;
该邻居节点确定单元132,用于在目标异构图中,将候选数据i对应的节点作为目标节点,确定目标节点的邻居节点集合;邻居节点集合包括H个邻居节点;H为正整数;
该聚合处理单元133,用于对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,该聚合处理单元133包括:模型调用子单元1331,聚合处理子单元1332以及拼接处理子单元1333。
该模型调用子单元1331,用于调用用于进行特征聚合的异构图模型;异构图模型包括目标异构图对应的第一注意力层;第一注意力层包括X个注意力子层;X为正整数;X个注意力子层包括注意力子层Lx;x为小于或者等于X的正整数;
该聚合处理子单元1332,用于基于注意力子层Lx的可学习参数,对目标节点的初始节点特征以及H个邻居节点的初始节点特征进行聚合处理,确定目标节点在注意力子层Lx的注意力子特征。
其中,H个邻居节点包括邻居节点Nj;j为小于或者等于H的正整数;
该聚合处理子单元1332还具体用于:
基于目标节点的初始节点特征、H个邻居节点的初始节点特征以及注意力子层Lx的可学习参数,对目标节点和邻居节点Nj进行相关性学习,得到与注意力子层Lx相关联的注意力权重αij;注意力权重αij用于指示邻居节点Nj与目标节点之间的相关性;
将注意力权重αij、邻居节点Nj的初始节点特征以及注意力子层Lx的可学习参数之间的乘积,确定为邻居节点Nj对应的相关性特征;
在得到H个邻居节点分别对应的相关性特征时,对H个相关性特征进行聚合处理,得到目标节点在注意力子层Lx的注意力子特征。
该拼接处理子单元1333,用于在得到X个注意力子特征时,对X个注意力子特征进行拼接处理,得到候选数据i在目标属性信息下对应的注意力特征。
其中,该模型调用子单元1331,聚合处理子单元1332以及拼接处理子单元1333的具体实现方式可以参见上述图3所对应实施例中对注意力特征的描述,这里将不再继续进行赘述。
其中,该初始特征获取单元131,邻居节点确定单元132以及聚合处理单元133的具体实现方式可以参见上述图3所对应实施例中对步骤S103的描述,这里将不再继续进行赘述。
该聚合处理模块14,用于在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
其中,候选数据i在目标属性信息下对应的注意力特征是基于异构图模型中的第一注意力层,对目标异构图进行异构图卷积处理后所得到的;异构图模型包括第二注意力层;
该聚合处理模块14包括:特征输入单元141,第一确定单元142,第二确定单元143以及求和处理单元144。
该特征输入单元141,用于在得到候选数据i在M个属性信息下分别对应的注意力特征时,将M个注意力特征输入至第二注意力层;M个注意力特征包括属性信息p对应的注意力特征Ep;属性信息p属于M个属性信息;p为小于或者等于M的正整数;
该第一确定单元142,用于基于第二注意力层中的网络参数以及注意力特征Ep,确定注意力特征Ep对应的属性权重参数βp;
该第二确定单元143,用于将注意力特征Ep以及属性权重参数βp的乘积确定为属性信息p对应的待聚合特征;
该求和处理单元144,用于在得到M个属性信息分别对应的待聚合特征时,对M个待聚合特征进行求和处理,得到候选数据i对应的聚合特征Zi。
其中,该特征输入单元141,第一确定单元142,第二确定单元143以及求和处理单元144的具体实现方式可以参见上述图3所对应实施例中对步骤S104的描述,这里将不再继续进行赘述。
该概率确定模块15,用于在得到每个候选数据分别对应的聚合特征时,基于用于确定关键数据的分类识别层以及N个聚合特征,分别确定每个候选数据对应的概率参数;
该策略获取模块16,用于获取针对业务数据的数据选择策略;数据选择策略包括概率参数阈值;
该第一确定模块17,用于在N个候选数据中,将概率参数达到概率参数阈值的候选数据确定为第一待筛选数据;
该第二确定模块18,用于若第一待筛选数据的数量为一个,则将第一待筛选数据确定为与业务数据具备匹配关系的关键数据。
该第三确定模块19,用于若第一待筛选数据的数量为至少两个,且数据选择策略包括指定类别,则从至少两个第一待筛选数据中,获取与指定类别相匹配的第一待筛选数据,将获取到的第一待筛选数据确定为第二待筛选数据;
该第四确定模块20,用于在第二待筛选数据的数量为至少两个时,从至少两个第二待筛选数据中确定具有最高概率参数的第二待筛选数据,将具有最高概率参数的第二待筛选数据作为与业务数据具备匹配关系的关键数据。
其中,该数据筛选模块11,构建模块12,卷积处理模块13,聚合处理模块14,概率确定模块15,策略获取模块16,第一确定模块17,第二确定模块18,第三确定模块19以及第四确定模块20的具体实现方式可以参见上述图3所对应实施例中对步骤S101-步骤S104以及图6所对应实施例中对步骤S201-步骤S206的描述,这里将不再继续进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
进一步地,请参见图9,图9是本申请实施例提供的一种计算机设备的示意图。如图9所示,该计算机设备1000可以包括:至少一个处理器1001,例如,CPU,至少一个网络接口1004,存储器1005,至少一个通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。网络接口1004可选地可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1005可选地还可以是至少一个位于远离前述处理器1001的存储装置。如图9所示,作为一种计算机存储介质的存储器1005可以包括操作系统、网络通信模块、用户接口模块以及设备控制应用程序。其中,在一些实施例中,该计算机设备还可以包括图9所示的用户接口1003,比如,若该计算机设备为图1所示的具有数据匹配功能的终端设备(例如,终端设备100a),则该计算机设备还可以包括该用户接口1003,其中,该用户接口1003可以包括显示屏(Display)、键盘(Keyboard)等。
在图9所示的计算机设备1000中,网络接口1004主要用于进行网络通信;而用户接口1003主要用于为用户提供输入的接口;而处理器1001可以用于调用存储器1005中存储的设备控制应用程序,以实现:
对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;N个候选数据包括候选数据i;i为小于或者等于N的正整数;业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;
从M个属性信息中获取目标属性信息,将N个候选数据分别对应的目标属性信息作为节点,构建业务数据对应的目标异构图;
对目标异构图进行异构图卷积处理,得到候选数据i在目标属性信息下对应的注意力特征;
在得到候选数据i在M个属性信息下分别对应的注意力特征时,对M个注意力特征进行聚合处理,得到候选数据i对应的聚合特征Zi;聚合特征Zi用于确定将候选数据i作为关键数据的概率参数;关键数据是指与业务数据具备匹配关系的数据。
应当理解,本申请实施例中所描述的计算机设备1000可执行前文图3和图6所对应实施例中对该基于人工智能的数据处理方法的描述,也可执行前文图7所对应实施例中对该基于人工智能的数据处理装置1和图8所对应实施例中对该基于人工智能的数据处理装置2的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时实现图3和图6中各个步骤所提供的基于人工智能的数据处理方法,具体可参见图3以及图6各个步骤所提供的实现方式,在此不再赘述。
计算机可读存储介质可以是前述任一实施例提供的数据传输装置或者计算机设备的内部存储单元,例如计算机设备的硬盘或内存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(smartmedia card,SMC),安全数字(secure digital,SD)卡,闪存卡(flash card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机程序,处理器执行该计算机程序,使得该计算机设备可执行前文各实施例中对数据处理方法或装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同对象,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包括。例如包括了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。
Claims (14)
1.一种基于人工智能的数据处理方法,其特征在于,包括:
对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;所述N个候选数据包括候选数据i;i为小于或者等于N的正整数;所述业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;所述业务数据的数据类型包括视频类型;
从M个属性信息中获取目标属性信息,将所述N个候选数据分别对应的目标属性信息作为节点,构建所述业务数据对应的目标异构图;
对所述目标异构图进行异构图卷积处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征;所述候选数据i在所述目标属性信息下对应的注意力特征是基于异构图模型中的第一注意力层,对所述目标异构图进行异构图卷积处理后所得到的;所述异构图模型包括第二注意力层;
在得到所述候选数据i在所述M个属性信息下分别对应的注意力特征时,将M个注意力特征输入至所述第二注意力层;所述M个注意力特征包括属性信息p对应的注意力特征Ep;所述属性信息p属于所述M个属性信息;p为小于或者等于M的正整数;
基于所述第二注意力层中的网络参数以及所述注意力特征Ep,确定所述注意力特征Ep对应的属性权重参数βp;
将所述注意力特征Ep以及所述属性权重参数βp的乘积确定为所述属性信息p对应的待聚合特征;
在得到M个属性信息分别对应的待聚合特征时,对M个待聚合特征进行求和处理,得到所述候选数据i对应的聚合特征Zi;所述聚合特征Zi用于确定将所述候选数据i作为关键数据的概率参数;所述关键数据是指与所述业务数据具备匹配关系的数据。
2.根据权利要求1所述的方法,其特征在于,所述业务数据包括A个子数据;A为大于N的正整数;
所述对业务数据进行筛选处理,得到N个候选数据,包括:
对所述A个子数据进行筛选处理,将筛选处理后的子数据作为初始集合;
基于所述业务数据对应的聚类数量B,对所述初始集合中的子数据进行聚类处理,得到B个子集合;B为小于或者等于A的正整数;
从所述B个子集合中确定待择优集合,分别确定所述待择优集合中的每个子数据的基础质量分数,从所述待择优集合中选择具有最高基础质量分数的子数据作为候选数据,直到得到所述B个子集合分别对应的候选数据;
若B大于N,则基于B个候选数据中的每个候选数据的基础质量分数,从所述B个候选数据中筛选出N个候选数据。
3.根据权利要求2所述的方法,其特征在于,所述业务数据为视频数据;所述A个子数据中的每个子数据均为所述视频数据中的视频帧;
所述对所述A个子数据进行筛选处理,将筛选处理后的子数据作为初始集合,包括:
获取与所述视频数据相关联的抽帧规则;
基于所述视频数据的播放时长以及所述抽帧规则,对A个视频帧进行抽帧处理,得到视频帧集合;
对所述视频帧集合中的每个视频帧进行图片评估维度分析,得到所述视频帧集合中的每个视频帧在C个图片评估维度下分别对应的评估参数;C为正整数;
基于C个评估参数,对所述视频帧集合进行过滤,将过滤后的视频帧集合确定为初始集合。
4.根据权利要求3所述的方法,其特征在于,所述抽帧规则包括播放时长阈值;
所述基于所述视频数据的播放时长以及所述抽帧规则,对A个视频帧进行抽帧处理,得到视频帧集合,包括:
若所述视频数据的播放时长未达到所述播放时长阈值,则基于所述抽帧规则中的抽帧频率阈值,对A个视频帧进行抽帧处理,得到视频帧集合;
若所述视频数据的播放时长达到所述播放时长阈值,则基于所述抽帧规则中的抽帧数量阈值,对A个视频帧进行抽帧处理,得到视频帧集合。
5.根据权利要求3所述的方法,其特征在于,所述基于C个评估参数,对所述视频帧集合进行过滤,将过滤后的视频帧集合确定为初始集合,包括:
若C大于1,则从所述C个评估参数中,获取初始评估参数;
基于所述视频帧集合中的每个视频帧在所述初始评估参数下的评估值,对所述视频帧集合中的视频帧进行排序处理,得到初始排序结果,从所述初始排序结果中,按序获取与过滤阈值相匹配的视频帧,作为中间集合;
将所述C个评估参数中除所述初始评估参数之外的(C-1)个评估参数,确定为剩余评估参数;
基于所述剩余评估参数,对所述中间集合进行过滤,将过滤后的中间集合确定为初始集合。
6.根据权利要求1所述的方法,其特征在于,所述M个属性信息包括时序信息和语义信息;所述目标异构图为时序异构图或语义异构图;所述时序异构图是在将所述N个候选数据分别对应的时序信息作为节点时所构建得到的;所述语义异构图是在将所述N个候选数据分别对应的语义信息作为节点时所构建得到的。
7.根据权利要求1所述的方法,其特征在于,所述对所述目标异构图进行异构图卷积处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征,包括:
获取所述目标异构图中的每个节点对应的初始节点特征;
在所述目标异构图中,将所述候选数据i对应的节点作为目标节点,确定所述目标节点的邻居节点集合;所述邻居节点集合包括H个邻居节点;H为正整数;
对所述目标节点的初始节点特征以及所述H个邻居节点的初始节点特征进行聚合处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征。
8.根据权利要求7所述的方法,其特征在于,所述对所述目标节点的初始节点特征以及所述H个邻居节点的初始节点特征进行聚合处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征,包括:
调用用于进行特征聚合的异构图模型;所述异构图模型包括所述目标异构图对应的第一注意力层;所述第一注意力层包括X个注意力子层;X为正整数;所述X个注意力子层包括注意力子层Lx;x为小于或者等于X的正整数;
基于所述注意力子层Lx的可学习参数,对所述目标节点的初始节点特征以及所述H个邻居节点的初始节点特征进行聚合处理,确定所述目标节点在所述注意力子层Lx的注意力子特征;
在得到X个注意力子特征时,对所述X个注意力子特征进行拼接处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征。
9.根据权利要求8所述的方法,其特征在于,所述H个邻居节点包括邻居节点Nj;j为小于或者等于H的正整数;
所述基于所述注意力子层Lx的可学习参数,对所述目标节点的初始节点特征以及所述H个邻居节点的初始节点特征进行聚合处理,确定所述目标节点在所述注意力子层Lx的注意力子特征,包括:
基于所述目标节点的初始节点特征、所述H个邻居节点的初始节点特征以及所述注意力子层Lx的可学习参数,对所述目标节点和所述邻居节点Nj进行相关性学习,得到与所述注意力子层Lx相关联的注意力权重αij;所述注意力权重αij用于指示所述邻居节点Nj与所述目标节点之间的相关性;
将所述注意力权重αij、所述邻居节点Nj的初始节点特征以及所述注意力子层Lx的可学习参数之间的乘积,确定为所述邻居节点Nj对应的相关性特征;
在得到H个邻居节点分别对应的相关性特征时,对H个相关性特征进行聚合处理,得到所述目标节点在所述注意力子层Lx的注意力子特征。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在得到每个候选数据分别对应的聚合特征时,基于用于确定关键数据的分类识别层以及N个聚合特征,分别确定每个候选数据对应的概率参数;
获取针对所述业务数据的数据选择策略;所述数据选择策略包括概率参数阈值;
在N个候选数据中,将概率参数达到概率参数阈值的候选数据确定为第一待筛选数据;
若所述第一待筛选数据的数量为一个,则将所述第一待筛选数据确定为与所述业务数据具备匹配关系的关键数据。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
若所述第一待筛选数据的数量为至少两个,且所述数据选择策略包括指定类别,则从至少两个第一待筛选数据中,获取与所述指定类别相匹配的第一待筛选数据,将获取到的第一待筛选数据确定为第二待筛选数据;
在所述第二待筛选数据的数量为至少两个时,从至少两个第二待筛选数据中确定具有最高概率参数的第二待筛选数据,将所述具有最高概率参数的第二待筛选数据作为与所述业务数据具备匹配关系的关键数据。
12.一种基于人工智能的数据处理装置,其特征在于,包括:
数据筛选模块,用于对业务数据进行筛选处理,得到N个候选数据;N为大于1的正整数;所述N个候选数据包括候选数据i;i为小于或者等于N的正整数;所述业务数据包括M个特征维度互不相同的属性信息;M为大于1的正整数;所述业务数据的数据类型包括视频类型;
构建模块,用于从M个属性信息中获取目标属性信息,将所述N个候选数据分别对应的目标属性信息作为节点,构建所述业务数据对应的目标异构图;
卷积处理模块,用于对所述目标异构图进行异构图卷积处理,得到所述候选数据i在所述目标属性信息下对应的注意力特征;所述候选数据i在所述目标属性信息下对应的注意力特征是基于异构图模型中的第一注意力层,对所述目标异构图进行异构图卷积处理后所得到的;所述异构图模型包括第二注意力层;
聚合处理模块,用于在得到所述候选数据i在所述M个属性信息下分别对应的注意力特征时,将M个注意力特征输入至所述第二注意力层;所述M个注意力特征包括属性信息p对应的注意力特征Ep;所述属性信息p属于所述M个属性信息;p为小于或者等于M的正整数;
所述聚合处理模块,还用于基于所述第二注意力层中的网络参数以及所述注意力特征Ep,确定所述注意力特征Ep对应的属性权重参数βp;
所述聚合处理模块,还用于将所述注意力特征Ep以及所述属性权重参数βp的乘积确定为所述属性信息p对应的待聚合特征;
所述聚合处理模块,还用于在得到M个属性信息分别对应的待聚合特征时,对M个待聚合特征进行求和处理,得到所述候选数据i对应的聚合特征Zi;所述聚合特征Zi用于确定将所述候选数据i作为关键数据的概率参数;所述关键数据是指与所述业务数据具备匹配关系的数据。
13.一种计算机设备,其特征在于,包括:处理器和存储器以及网络接口;
所述处理器与所述存储器、所述网络接口相连,其中,所述网络接口用于提供数据通信功能,所述存储器用于存储计算机程序,所述处理器用于调用所述计算机程序,以使得所述计算机设备执行权利要求1至11任一项所述的方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1至11任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310942069.5A CN116701706B (zh) | 2023-07-29 | 2023-07-29 | 一种基于人工智能的数据处理方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310942069.5A CN116701706B (zh) | 2023-07-29 | 2023-07-29 | 一种基于人工智能的数据处理方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116701706A CN116701706A (zh) | 2023-09-05 |
CN116701706B true CN116701706B (zh) | 2023-09-29 |
Family
ID=87829556
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310942069.5A Active CN116701706B (zh) | 2023-07-29 | 2023-07-29 | 一种基于人工智能的数据处理方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116701706B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117555695B (zh) * | 2024-01-10 | 2024-05-14 | 深圳本贸科技股份有限公司 | 一种基于并行计算实现异构计算的优化方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062314A (zh) * | 2019-12-13 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 图像选取方法、装置、计算机可读存储介质及电子设备 |
CN113361928A (zh) * | 2021-06-07 | 2021-09-07 | 南京大学 | 一种基于异构图注意力网络的众包任务推荐方法 |
CN114238750A (zh) * | 2021-11-18 | 2022-03-25 | 浙江工业大学 | 基于异构网络信息嵌入模型的交互可视推荐方法 |
CN115391665A (zh) * | 2022-09-23 | 2022-11-25 | 北京奇艺世纪科技有限公司 | 视频推荐方法、装置、电子设备及存储介质 |
CN115511501A (zh) * | 2021-06-03 | 2022-12-23 | 腾讯云计算(北京)有限责任公司 | 一种数据处理方法、计算机设备以及可读存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220226994A1 (en) * | 2020-07-20 | 2022-07-21 | Georgia Tech Research Corporation | Heterogeneous graph attention networks for scalable multi-robot scheduling |
CN113254803B (zh) * | 2021-06-24 | 2021-10-22 | 暨南大学 | 一种基于多特征异质图神经网络的社交推荐方法 |
-
2023
- 2023-07-29 CN CN202310942069.5A patent/CN116701706B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111062314A (zh) * | 2019-12-13 | 2020-04-24 | 腾讯科技(深圳)有限公司 | 图像选取方法、装置、计算机可读存储介质及电子设备 |
CN115511501A (zh) * | 2021-06-03 | 2022-12-23 | 腾讯云计算(北京)有限责任公司 | 一种数据处理方法、计算机设备以及可读存储介质 |
CN113361928A (zh) * | 2021-06-07 | 2021-09-07 | 南京大学 | 一种基于异构图注意力网络的众包任务推荐方法 |
CN114238750A (zh) * | 2021-11-18 | 2022-03-25 | 浙江工业大学 | 基于异构网络信息嵌入模型的交互可视推荐方法 |
CN115391665A (zh) * | 2022-09-23 | 2022-11-25 | 北京奇艺世纪科技有限公司 | 视频推荐方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN116701706A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kucer et al. | Leveraging expert feature knowledge for predicting image aesthetics | |
EP4002161A1 (en) | Image retrieval method and apparatus, storage medium, and device | |
CN113395578B (zh) | 一种提取视频主题文本的方法、装置、设备及存储介质 | |
US20230353828A1 (en) | Model-based data processing method and apparatus | |
Yan et al. | Multi-scale deep relational reasoning for facial kinship verification | |
CN111783712A (zh) | 一种视频处理方法、装置、设备及介质 | |
CN113761253A (zh) | 视频标签确定方法、装置、设备及存储介质 | |
CN113590854A (zh) | 一种数据处理方法、设备以及计算机可读存储介质 | |
CN115131698B (zh) | 视频属性确定方法、装置、设备及存储介质 | |
CN116701706B (zh) | 一种基于人工智能的数据处理方法、装置、设备及介质 | |
CN116935170B (zh) | 视频处理模型的处理方法、装置、计算机设备和存储介质 | |
CN114282059A (zh) | 视频检索的方法、装置、设备及存储介质 | |
Zhang et al. | Online modeling of esthetic communities using deep perception graph analytics | |
CN115424056A (zh) | 模型训练方法和装置、图像分类方法、设备和介质 | |
CN113821678B (zh) | 视频封面的确定方法及装置 | |
CN114330514A (zh) | 一种基于深度特征与梯度信息的数据重建方法及系统 | |
CN115130493A (zh) | 基于图像识别的面部形变推荐方法、装置、设备和介质 | |
CN111783734B (zh) | 原版视频识别方法及装置 | |
CN113592765A (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111191059B (zh) | 图像处理方法、装置、计算机存储介质及电子设备 | |
CN113762041A (zh) | 视频分类方法、装置、计算机设备和存储介质 | |
Wang et al. | MetaScleraSeg: an effective meta-learning framework for generalized sclera segmentation | |
CN116958729A (zh) | 对象分类模型的训练、对象分类方法、装置及存储介质 | |
CN113822293A (zh) | 用于图数据的模型处理方法、装置、设备及存储介质 | |
Zhang et al. | Neighboring Algorithm for Visual Semantic Analysis toward GAN‐Generated Pictures |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40091962 Country of ref document: HK |