CN117932497B - 一种模型确定方法和相关装置 - Google Patents
一种模型确定方法和相关装置 Download PDFInfo
- Publication number
- CN117932497B CN117932497B CN202410314286.4A CN202410314286A CN117932497B CN 117932497 B CN117932497 B CN 117932497B CN 202410314286 A CN202410314286 A CN 202410314286A CN 117932497 B CN117932497 B CN 117932497B
- Authority
- CN
- China
- Prior art keywords
- model
- classification
- content
- sample
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 173
- 238000013145 classification model Methods 0.000 claims abstract description 606
- 230000004927 fusion Effects 0.000 claims abstract description 172
- 238000012549 training Methods 0.000 claims abstract description 110
- 230000008569 process Effects 0.000 claims abstract description 89
- 230000006978 adaptation Effects 0.000 claims description 196
- 238000012545 processing Methods 0.000 claims description 26
- 238000010606 normalization Methods 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 16
- 230000010354 integration Effects 0.000 abstract description 9
- 238000000605 extraction Methods 0.000 description 30
- 230000006870 function Effects 0.000 description 30
- 235000019580 granularity Nutrition 0.000 description 27
- 238000005516 engineering process Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000009826 distribution Methods 0.000 description 16
- 238000013473 artificial intelligence Methods 0.000 description 15
- 238000004422 calculation algorithm Methods 0.000 description 15
- 230000000694 effects Effects 0.000 description 9
- 238000010801 machine learning Methods 0.000 description 8
- 235000019587 texture Nutrition 0.000 description 8
- 230000008859 change Effects 0.000 description 7
- 238000013527 convolutional neural network Methods 0.000 description 6
- 238000002156 mixing Methods 0.000 description 6
- 238000012952 Resampling Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 241000282326 Felis catus Species 0.000 description 2
- 230000004931 aggregating effect Effects 0.000 description 2
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 210000000887 face Anatomy 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种模型确定方法和相关装置,该方法首先根据分类场景下的内容样本,通过N个基础分类模型分别获取具有样本标签的内容样本的样本特征,N>1。然后通过基础分类模型的模型分类权重和样本特征生成内容样本的融合特征,模型分类权重由初始设置子模型确定。由初始分类子模型确定融合特征对应的预测结果,根据预测结果和样本标签的差异,训练初始分类子模型和初始设置子模型得到分类子模型和设置子模型,根据N个基础分类模型、分类子模型和设置子模型生成用于内容分类目标的集成模型。能够在模型训练过程中不需要调整基础分类模型的模型参数,以较小的训练代价有效提升了针对内容分类目标的模型集成效率。
Description
技术领域
本申请涉及数据处理领域,特别是涉及一种模型确定方法和相关装置。
背景技术
当前对于内容的分类需求日渐复杂,单模型分类难以应对复杂多变的内容分类需求,因此多模型混合共同执行内容分类的方式日渐普遍。
在相关技术中,在对多模型进行混合的过程中,需要通过训练过程确定最终混合的集成模型。
在训练过程中涉及到对各个模型进行内部参数调整,训练过程的复杂度高,参数调整的难度大,大大增加了生成集成模型的成本。
发明内容
为了解决上述技术问题,本申请提供了一种模型确定方法和相关装置,能够在模型训练过程中不需要调整基础分类模型的模型参数,以较小的训练代价有效提升了针对内容分类目标的模型集成效率。
本申请实施例公开了如下技术方案:
一方面,本申请实施例提供了一种模型确定方法,所述方法包括:
根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征,所述内容样本具有与所述分类场景的内容分类目标相关的样本标签,N>1;
根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,所述模型分类权重是通过初始设置子模型确定的,用于标识所对应基础分类模型对所述内容分类目标的影响程度;
通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型,所述初始分类子模型是根据所述内容分类目标确定的;
根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,所述集成模型用于对所述分类场景下的内容进行基于所述内容分类目标的分类服务。
另一方面,本申请实施例提供了一种模型确定装置,所述装置包括:获取模块、第一生成模块、训练模块和第二生成模块;
所述获取模块,用于根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征,所述内容样本具有与所述分类场景的内容分类目标相关的样本标签,N>1;
所述第一生成模块,用于根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,所述模型分类权重是通过初始设置子模型确定的,用于标识所对应基础分类模型对所述内容分类目标的影响程度;
所述训练模块,用于通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型,所述初始分类子模型是根据所述内容分类目标确定的;
所述第二生成模块,用于根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,所述集成模型用于对所述分类场景下的内容进行基于所述内容分类目标的分类服务。
又一方面,本申请实施例提供了一种计算机设备,计算机设备包括处理器以及存储器:
存储器用于存储计算机程序;
处理器用于根据计算机程序执行以上方面所述的方法。
又一方面。本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质用于存储计算机程序,计算机程序用于执行以上方面所述的方法。
又一方面,本申请实施例提供了一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得计算机设备执行以上方面所述的方法。
由上述技术方案可以看出,为了能够准确高效的将N个基础分类模型集成为分类场景下的内容分类目标提供服务,将以N个基础分类模型为基础来训练初始设置子模型和初始分类子模型。针对分类场景下的内容样本,通过N个基础分类模型分别获取同一个内容样本的样本特征,并通过初始设置子模型确定N个基础分类模型的模型分类权重,以此标识出各个基础分类模型对内容分类目标的影响程度。基于样本特征和模型分类权重生成融合特征,在模型分类权重的指导下,相对于对内容分类目标影响小的样本特征,融合特征中包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。在模型训练时,基于预测结果和样本标签的差异会调整初始设置子模型和初始分类子模型的模型参数,使得初始设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而给出更为准确的模型分类权重,并使得初始分类子模型可基于更准确的融合特征确定出预测结果。由于整个模型训练过程中并不需要调整基础分类模型的模型参数,较小的训练代价有效提升了针对内容分类目标的模型集成效率,且能够尽可能的利用到N个基础分类模型的功能,有效保证了集成模型的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种模型确定的场景示意图;
图2为本申请实施例提供的一种内容审核场景下的示意图;
图3为本申请实施例提供的一种模型确定方法的流程图;
图4为本申请实施例提供的一种模型确定的方法的示意图;
图5为本申请实施例提供的一种集成模型的应用示意图;
图6为本申请实施例提供的一种随机重复采样的示意图;
图7为本申请实施例提供的一种集成模型的训练示意图;
图8为本申请实施例提供的一种模型确定装置的装置示意图;
图9为本申请实施例提供的一种终端设备的结构图;
图10为本申请实施例提供的一种服务器的结构图。
具体实施方式
下面结合附图,对本申请的实施例进行描述。
在内容分类的应用场景下,内容的分类需求日渐复杂,涉及到的分类任务多且分类场景复杂,同时对于分类的时效性提出了更高的要求。单一模型进行内容的分类已经不足以满足分类需求,当前相关技术中往往采用多模型混合共同进行内容的分类过程,举例来说可以包括:Stacking算法(集成学习算法),Boosting算法(监督的分类学习算法),Adaboost算法(自适应增强学习算法)以及Bagging算法(Bootstrap aggregating,引导聚集算法)。在对上述算法中涉及的多模型进行混合的过程中,需要通过训练过程确定最终混合的集成模型。相关技术中的多模型混合过程中需要对各个模型进行模型内部参数调整,训练的复杂度高,且生成集成模型的成本很大。
为此本申请实施例提供了一种模型确定方法和相关装置,通过初始设置子模型确定出各个基础分类模型的模型分类权重,在生成集成模型的过程中通过对各个基础分类模型进行权重的分配能够适应不同的内容分类目标,不需要对基础分类模型进行训练以及内部参数的调整,能够在一定程度上降低模型集成过程的复杂度,降低模型集成的成本。
本申请实施例所提供的模型确定方法可以通过计算机设备实施,该计算机设备可以是终端设备或服务器,其中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云计算服务的云服务器。终端设备包括但不限于手机、电脑、智能语音交互设备、智能家电、车载终端、飞行器等。终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
首先对本申请下文的实施例中可能涉及的若干个名词术语进行解释。
多专家模型(Mixture of expert,MoE)是一种机器学习模型,用于处理复杂的非线性关系。它将一组基础分类模型组合在一起,以形成一个更强大的模型。每个基础分类模型都对于内容样本进行处理的过程中,根据模型的功能不同对于内容样本进行提取得到的样本特征的侧重不同。将各个基础分类模型输出的样本特征进行融合生成融合特征。这种融合过程可以通过加权平均或其他方法完成。
集成学习(Ensemble Learning):集成学习是指使用多种兼容的学习算法/模型(即基础分类模型、分类子模型等)来执行单个任务(如:内容分类)的技术,目的是为了得到更佳的预测结果。相关技术中集成学习的主要方法可归类为三大类:堆叠算法(Stacking)、提升算法(Boosting)和引导聚集算法(Bootstrap aggregating,Bagging算法)。在本申请实施例中,采用的集成学习指的是将N个基础分类模型、分类子模型和设置子模型生成集成模型,用于对分类场景下的内容进行基于内容分类目标的分类服务。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟随和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
本申请实施例提供的方案涉及人工智能的计算机视觉技术、语音处理技术、自然语言处理技术等,例如在图像分类场景、语音分类场景、文字内容分类场景下对场景中的内容样本和待识别内容进行识别。本申请实施例提供的方案还涉及人工智能的机器学习,例如通过机器学习的方式训练初始设置子模型、初始分类子模型等。具体通过如下实施例进行说明:
图1为本申请实施例提供的一种模型确定的场景示意图,其中前述的计算机设备为服务器。
在对内容进行分类的过程中,服务器会获取内容样本,在内容样本中包括与分类场景的内容分类目标相关的样本标签。将内容样本输入各个基础分类模型中,通过基础分类模型获取到内容样本的样本特征。由初始设置子模型确定出各个基础分类模型的模型分类权重,根据模型分类权重以及内容样本的样本特征生成内容样本的融合特征。通过初始分类子模型确定出内容样本的融合特征对应的融合特征的预测结果。
根据该融合特征的预测结果和内容样本的样本标签可以确定出两者之间的差异,基于该差异对初始分类子模型以及初始设置子模型进行模型训练,得到设置子模型和分类子模型。最后根据基础分类模型、设置子模型以及分类子模型生成集成模型,该集成模型即可用于对内容进行分类。
其中初始设置子模型用于确定基础分类模型的权重,同时在模型训练过程中会对初始设置子模型进行训练,通过训练过程能够使得训练完成的设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而给出更为准确的模型分类权重分配给对应的基础分类模型。训练过程中涉及的基础分类模型的模型参数是固定的,即并不对基础分类模型进行内部参数调整,较小的训练代价有效提升了针对内容分类目标的模型集成效率,且能够尽可能的利用到各个基础分类模型的功能,有效保证了集成模型的准确性。
本申请实施例中提出的一种模型确定方法可以应用于内容审核的应用场景中,生成的集成模型即可用于对内容审核。图2为本申请实施例提供的一种内容审核场景下的示意图,如图2所示,当需要进行内容审核时,需要将待审核内容输入内容审核系统(即集成模型)中,由内容审核系统中的分类子模型对待审核内容进行分类得到正常内容和违规内容。图3为本申请实施例提供的一种模型确定方法的流程图,该方法可以由计算机设备执行,在本实施例中,以该计算机设备是服务器为例进行说明。
所述方法包括:
S201:根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征,N>1。
内容样本指的是在该分类场景下生成的,或者相关的,且进行了相关标签标注的内容,该内容样本标注有与分类场景的内容分类目标相关的样本标签,内容样本的形式与分类场景相关,例如可以为图片、视频、文本以及语音中的一种或多种。样本标签用于指示该内容样本对应内容分类目标的分类结果,内容分类目标用于指示在分类场景下对内容样本进行特定分类的要求和方向。
样本特征是根据内容样本提取得到的,用于通过计算机理解的方式描述内容样本的信息,由于样本特征中携带哪些信息与提取该样本特征的分类模型的分类需求相关,故同一个内容样本被不同基础分类模型提取得到的样本特征可以不同。
根据基础分类模型的功能不同,对应的从内容样本中提取到的样本特征的侧重也不相同。因此针对同一内容样本经过不同的基础分类模型得到的样本特征会有差异。举例来说,假设基础分类模型包括图像分类模型以及音频分类模型,那么当内容样本为视频时,图像分类模型针对该视频提取到的样本特征为图像特征,而音频分类模型针对该视频提取到的样本特征为音频特征。
在确定基础分类模型时可以结合内容分类目标进行,使得确定出的N个基础分类模型能够尽量贴合内容分类目标对应的特定的分类要求。上述提到基础分类模型由于功能不同对应提取出的样本特征的侧重也不同,因此针对同一内容样本来说,存在部分基础分类模型所提取到的样本特征能够更加贴合内容分类目标对应的分类要求(也可以理解为更有利于实现内容分类目标的分类要求),而部分基础分类模型相较来说提取到的样本特征与内容分类目标贴合性较差的情况,即不同的基础分类模型提取到的样本特征与内容分类目标之间的适配程度存在差异。
上述提到的基础分类模型指的是具有分类能力的、已完成训练的模型,在进行分类过程中会对内容样本进行特征提取得到样本特征。由于在当前的内容分类场景较为复杂,单一基础分类模型不足以完成对于内容的准确高效的分类,因此在本申请实施例中提出使用多个已经训练完成的基础分类模型共同实现对于内容的分类,而非重新训练全新的模型用于内容分类,由此能够降低训练难度以及成本。即在本申请实施例中对于内容样本可以同时采用N个基础分类模型获取内容样本的样本特征,不同基础分类模型针对同一内容样本获取到的样本特征对于内容分类目标的影响不同。原因在于不同的基础分类模型实现的具体分类功能不同,由于分类功能不同将会导致基础分类模型在提取特征时的侧重不同,最终提取到的特征也具有差异。
需要说明的是,在本申请实施例中基础分类模型主要起到的作用为针对获取到的内容样本进行特征提取,并不一定需要得到最终的分类结果。也就是说,在本申请实施例中主要应用的是基础分类模型的特征提取功能,而并不太关注于基础分类模型的分类功能。
举例来说,当内容分类目标为识别视频中的违规内容时,由于视频中可以包括有:图像信息、文字信息以及音频信息,故对应确定出的基础分类模型可以为:图像分类模型、文本分类模型以及音频分类模型。由于对识别视频违规内容时更加倾向于对视频的画面内容进行识别,因此图像分类模型对应提取出的图像特征,将更有利于内容分类目标的实现。而文本分类模型以及音频分类模型虽然也能够实现针对视频进行特征提取,得到对应的文本特征以及音频特征。但是相较于图像特征来说,文本特征以及音频特征对于内容分类目标的实现影响较小。
S202:根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征。
模型分类权重是由初始设置子模型为基础分类模型确定的,模型分类权重将会影响到基础分类模型获取到的样本特征,在生成融合特征时所占的比重。当基础分类模型对应的模型分类权重大时,其对应的获取到的样本特征将对融合特征产生较大的影响;当基础分类模型对应的模型分类权重小时,其对应的获取到的样本特征将对融合特征产生较小的影响。当基础分类模型获取的样本特征与内容分类目标的适配程度较高时(适配程度高意味着与内容分类目标的相关性强),可以选择由初始设置子模型为该基础分类模型确定出更高的模型分类权重。如此可以使得在生成融合特征的过程中该基础分类模型对应的样本特征在融合特征中占比更高,也就能够让融合特征中与内容分类目标相关的实质性内容更加丰富,进而提高后续进行内容分类的预测结果的准确性。
融合特征指的是将各个基础分类模型获取到的样本特征进行融合得到的结果,融合的方式可以为将各个特征向量与对应的权重进行加权求和得到融合特征;或者训练得到多层感知机模型(Multilayer Perceptron,MLP),基于MLP模型对样本特征进行融合。
融合特征的生成过程涉及到两个元素,其中一个是基础分类模型的模型分类权重,另一个是基础分类模型获取到的样本特征。样本特征的模型分类权重与样本特征之间是一一对应的,其中单独一个基础分类模型的模型分类权重将与该基础分类模型对应的样本特征结合,生成一个用于生成融合特征的特征数据。融合特征可以理解为是多个前述特征数据的组合。举例来说,假设存在基础分类模型A和基础分类模型B,基础分类模型A对应的获取到样本特征A以及模型分类权重A,基础分类模型B对应的获取到样本特征B以及模型分类权重B。那么在生成融合特征时,样本特征A和模型分类权重A将会构成特征数据A,样本特征B和模型分类权重B将会构成特征数据B。在生成融合特征时将会把特征数据A与特征数据B组合得到融合特征。
通过上述的表述可以看出,在生成融合特征的过程中,基础分类模型仅需提供特征提取的结果,而并不需要基础分类模型针对内容样本的最终分类结果。也就是说可以采用基础分类模型对内容样本进行特征提取的中间结果即可实现融合特征的生成,能够使得生成融合特征的过程更加简单,并非要直到基础分类模型确定出分类结果后才能进行,降低了训练过程的训练代价,能够有助于提高生成集成模型的效率。
在本申请实施例中会对初始设置子模型进行训练,以使其能够为基础分类模型分配更加准确的模型分类权重。可以将初始设置子模型的训练过程分为两个阶段,其中一个阶段指的是未进行梯度回传,初始设置子模型的参数未进行调整的阶段,可以称为训练平稳阶段;另一个阶段指的是完成梯度回传,根据损失函数对初始设置子模型进行参数调整的阶段,可以称为训练调整阶段。
由于模型分类权重由初始设置子模型进行确定,且在本申请实施例中并不对基础分类模型本身进行训练,也就不涉及对基础分类模型的模型参数的调整。那么当初始设置子模型的模型内部参数发生变化时,对应的为基础分类模型确定出的模型分类权重也会随之变化。也就是说,在训练调整阶段,由于初始设置子模型的变化将会导致模型分类权重的变化。
当处于训练平稳阶段时,在根据初始训练子模型确定基础分类模型的模型分类权重时,可以根据不同的分配粒度进行。具体的,可以包括①粗分配粒度;②细分配粒度。
针对第一种粗分配粒度的确定方式,在这种方式下,训练平稳阶段不会对初始设置子模型的模型参数进行调整,且基础分类模型本身不进行参数调整,若分类场景以及内容分类目标均保持不变,那么针对基础分类模型的模型分类权重不会随着内容样本的变化而随之变化。即在这种模型分类权重的确定方式下,不考虑内容样本的差异性,而是根据初始设置子模型自身的模型参数情况,为各个基础分类模型分配固定的模型分类权重。
针对第二种粗分配粒度的确定方式,在这种情况下,在初始设置子模型进行基础分类模型进行模型分类权重的确定时,更加关注于内容样本的差异性。也就是说初始设置子模型会倾向于结合内容样本的不同,适应性的调整各个基础分类模型的模型分类权重。即在这种模型分类权重的确定方式下,会充分考虑内容样本的差异性,结合内容样本的类型、内容的不同对基础分类模型进行模型分类权重的调整。举例来说,假设存在图片类型的内容样本以及文字类型的内容样本,同时存在三个基础分类模型,分别为基础分类模型1以及基础分类模型2。当内容样本为图片类型时,初始设置子模型为基础分类模型1以及基础分类模型2确定的模型分类权重分别为0.6和0.4。当内容样本为文字类型时,初始设置子模型为基础分类模型1以及基础分类模型2确定的模型分类权重会分别调整为0.3和0.7。
根据前述提到的由初始设置子模型为基础分类模型确定出的模型分类权重,可以确定出各个基础分类模型对内容分类目标的影响程度。样本特征是由各个基础分类模型从内容样本中获取到的,根据模型分类权重以及样本特征可以生成融合特征。举例来说,假设基础分类模型包括:基础分类模型1、基础分类模型2及基础分类模型3,初始设置子模型确定出的基础分类模型1的模型分类权重为0.2,基础分类模型2的模型分类权重为0.5,基础分类模型3的模型分类权重为0.3。上述基础分类模型针对内容样本获取到的样本特征分别为样本特征1、样本特征2以及样本特征3,那么生成的该内容样本的融合特征可以表示为0.2*样本特征1+0.5*样本特征2+0.3*样本特征3。
S203:通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型。
初始分类子模型用于结合融合特征对内容样本进行分类,初始分类子模型得到的预测结果即为针对内容分类目标特定的分类要求得到的分类结果。同时初始分类子模型仅需要执行分类操作,而不需要进行特征提取,也就不需要配置特征提取的结构层,因此初始分类子模型的构造较为简单,在基于预测结果和样本标签的差异,对初始分类子模型进行训练时的训练代价低。
样本标签用于指示该内容样本对应内容分类目标的分类结果,初始分类子模型确定的融合特征对应的预测结果指的是,初始分类子模型根据融合特征进行分类获取到对应内容分类目标的分类结果。通过样本标签与预测结果之间的差异,可以指示出预测结果是否准确。根据预测结果和样本标签的差异会调整初始设置子模型和初始分类子模型的模型参数,使得初始设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而给出更为准确的模型分类权重,并使得初始分类子模型可基于更准确的融合特征确定出预测结果。
假设内容分类目标为判断内容样本中是否存在违规语句,样本标签可以用于指示该内容样本是否具有违规语句。通过初始分类子模型可以确定出融合特征对应的预测结果,预测结果可以为内容样本具有违规语句或内容样本不具有违规语句。
通过初始分类子模型可以确定出上述融合特征对应的预测结果,根据预测结果以及样本标签的差异对初始分类子模型以及初始设置子模型进行模型训练,通过模型训练过程对初始设置子模型和初始分类子模型的模型参数进行调整,以使初始设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而提高为基础分类模型确定模型分类权重的准确性,并使得初始分类子模型可基于融合特征更准确地确定出预测结果。
S204:根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型。
集成模型用于对分类场景下的内容进行基于内容分类目标的分类服务。在本申请实施例中集成模型包括基础分类模型、训练完成的分类子模型和设置子模型。通过前述针对初始设置子模型和初始分类子模型的训练过程使得生成的分类子模型以及设置子模型具备了较为准确的确定出基础分类模型的模型分配权重的能力,以及较为准确的确定出融合特征的预测结果的能力,能够在一定程度上保证由基础分类模型、分类子模型和设置子模型组成的集成模型具备较好的内容分类能力。
图4为本申请实施例提供的一种模型确定的方法的示意图,如图4所示,图中的X指的是分类场景下的内容样本,在内容样本中携带有样本标签,图中包括初始风格决策模块(Gate),该初始风格决策模块可以为一个简单的门控决策网络,如Resnet50。通过该初始风格决策模块可以为各个基础分类模型确定风格适配权重,在图中用αi表示(i用于表示不同的基础分类模型),此时αi= Gate(Xi)。在图中还包括初始特征决策模块,该初始特征决策模块可以为一个简单的专家权重决策网络,如MLP模型。通过该初始特征决策模块可以为各个基础分类模型确定特征适配权重,在图中用βi表示,此时βi= MLP(fi)。
图4中的γi指的是各个基础分类模型对应的模型分类权重,如图所示,γi=αi+βi。其中θi和fi分别为各个基础分类模型的不同中间层获取到的内容样本的样本特征,根据基础分类模型的模型分类权重和获取到的样本特征生成内容样本的融合特征(在图4中的Fusion融合模块处进行),融合特征可以表示为F=sum(γi,fi)。使用初始分类子模型确定融合特征对应的预测结果Y,基于预测结果Y与样本标签之间的差异,对初始设置子模型(由初始风格决策模块和初始特征决策模块组成)以及初始分类子模型使用交叉熵损失函数进行梯度反传进行训练。具体的交叉熵损失函数可以表示为,其中p和q分别用于表示不同的概率分布。
需要说明的是,在本申请实施例中的融合模块可以是简单的线性层,也可以是复杂的CNN(Convolutional Neural Networks,卷积神经网络),或者Transformer结构。初始分类子模型和初始设置子模型可以是各种MLP、CNN结构,也可以是各种Transformer结构。基础分类模型可以是各种网络结构和各种训练超参数、训练数据集、训练任务上得到的专家模型。
由上述技术方案可以看出,为了能够准确高效的将N个基础分类模型进行集成来为分类场景下的内容分类目标提供服务,将以N个基础分类模型为基础来训练初始设置子模型和初始分类子模型。针对分类场景下的内容样本,通过N个基础分类模型分别获取同一个内容样本的样本特征,并通过初始设置子模型确定N个基础分类模型的模型分类权重,以此标识出各个基础分类模型对内容分类目标的影响程度。基于样本特征和模型分类权重生成融合特征,在模型分类权重的指导下,相对于对内容分类目标影响小的样本特征,融合特征中包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。在模型训练时,基于预测结果和样本标签的差异会调整初始设置子模型和初始分类子模型的模型参数,使得初始设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而给出更为准确的模型分类权重,并使得初始分类子模型可基于更准确的融合特征确定出预测结果。由于整个模型训练过程中并不需要调整基础分类模型的模型参数,较小的训练代价有效提升了针对内容分类目标的模型集成效率,且能够尽可能的利用到N个基础分类模型的功能,有效保证了集成模型的准确性。
在前述对初始设置子模型在对模型分类权重的确定方法的介绍中提到,进行模型分类权重时可以包括两种确定方式,其中一种方法为根据粗分配粒度确定,另一种方法为根据细分配粒度确定。其中根据粗分配粒度确定的方法更加关注于初始设置子模型自身的性能,而根据内容样本确定的方法更加关注于细分配粒度自身的差异性。下面将针对模型训练过程中的第j个内容样本,N个所述基础分类模型中第i个基础分类模型的模型分类权重的方法进行具体介绍。
在一种可能的实现方式中,具体的确定方法为:根据第j个内容样本,通过初始设置子模型确定第i个基础分类模型的第j个模型分类权重。
第j个模型分类权重用于标识在对第j个内容样本进行基于内容分类目标的分类预测时,第i个基础分类模型对内容分类目标的影响程度。可以看出上述确定方法是一种根据内容样本确定的方法,也就是说需要结合内容样本的情况确定出基础分类模型的模型分类权重。在这种确定方式下,随着内容样本的不同,对应的初始设置子模型确定出的各个基础分类模型的模型分类权重将可能存在较大差异。
针对内容样本来说,不同的内容样本之间往往可以存在较大的差异,比如同样都是图片类型的内容样本,两个内容样本之间可能会存在色彩或者纹理等的差异,如同样都是图片类型的内容样本,黑白图片和彩色图片之间的色彩差异就非常显著了。假设存在2个基础分类模型,分别为基础分类模型1和基础分类模型2。其中基础分类模型1针对黑白图片进行特征提取的效果较好,基础分类模型2针对彩色图片进行特征提取的效果较好。也就是说,基础分类模型1针对黑白图片这类的内容样本的适配程度更高,基础分类模型2针对彩色图片这类的内容样本的适配程度更高。
通过上述描述可以看出,内容样本本身是具备多样性的,而单一的基础分类模型并不足以对全部内容样本均起到很好的特征提取作用,如前述基础分类模型1是更加倾向于处理黑白图片的,那么当基础分类模型1在面对彩色图片时,对应提取到的样本特征准确性和有效性都会有所下降,也就是说单独的基础分类模型在面对差异化的内容样本时,可实现的特征提取功能具有局限性。因此,在面多众多类型的内容样本时,在本申请实施例中希望根据不同内容样本的单独特性,结合各个基础分类模型的功能倾向,通过为各个基础分类模型分配模型分类权重的方式,使得最终生成的集成模型能够对于差异化的内容样本均实现有效的分类。
针对不同的基础分类模型,由于各个基础分类模型实现的功能不同,因此提取出的样本特征的侧重不同,举例来说,有的基础分类模型倾向于提取内容样本中的色彩信息,有的基础分类模型倾向于提取内容样本中的纹理信息。在确定模型分类权重的过程中,初始设置子模型一方面要考虑基础分类模型对内容分类目标的影响程度,另一方面还要考虑基础分类模型对于内容样本的适配程度,基础分类模型对于内容样本的适配程度与基础分类模型对内容分类目标的影响程度息息相关,当基础分类模型对于内容样本的适配程度高时,对应的基础分类模型对内容分类目标的影响程度也大。
当内容分类目标为识别图片中是否存在猫时,对应内容样本为各种类型的图片,举例来说,在内容样本中可以同时包括黑白图片以及彩色图片。那么针对于内容样本差异性较大的情况下,单一的基础分类模型无法单独解决内容分类的功能。因此可以通过设置N个基础分类模型,并为各个基础分类模型进行模型分类权重的确定。通过这种集成多个基础分类模型并为涉及到的基础分类模型进行模型分类权重的确定,能够克服单一基础分类模型对内容样本进行分类的局限性。同时针对内容样本的实际情况为基础分类模型进行模型分类权重的确定,充分考虑到了内容样本的差异性,能够使得提取出的样本特征与内容分类目标的适配程度更高。
继续参照上述例子,初始设置子模型在进行训练的过程中,会学习到各个基础分类模型的功能,以及对应提取出的样本特征与内容分类目标之间的适配程度,进而实现为各个基础分类模型提供更为准确的模型分类权重。继续以上述例子进行说明,假设内容分类目标为识别图片中是否存在猫,当输入的内容样本为黑白图片时,基础分类模型1对于该内容样本的适配程度更高,提取出的样本特征更加准确。而当输入的内容样本为彩色图片时,基础分类模型2对于该内容样本的适配程度更高,提取出的样本特征更加准确。
因此,在初始设置子模型为基础分类模型确定模型分类权重时,会根据学习到的基础分类模型的功能,并结合内容样本的差异以及内容样本与基础分类模型之间的适配程度进行。当内容样本为黑白图片时,初始设置子模型将会为基础分类模型1分配相较基础分类模型2来说更高的模型分类权重;而当内容样本为彩色图片时,初始设置子模型将会为基础分类模型2分配相较于基础分类模型1来说更高的模型分类权重。更加通俗的来讲,即当输入的内容样本不同时,针对同一个基础分类模型,初始设置子模型将会为该基础分类模型分配不同的模型分类权重,不同的模型分类权重可以体现出基础分类模型针对不同内容样本的适配程度。
当与内容样本的适配程度高的基础分类模型对应提取出的样本特征,所具有的模型分类权重越高时,意味着在后续生成融合特征时,在融合特征内部包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。
通过前述例子可以看出动态确定的方法更加关注于内容样本自身的差异性,会根据内容样本的差异对涉及到的基础分类模型进行模型分类权重的调整,这种调整方式能够使得与内容样本适配程度更高的基础分类模型具备更高的模型分类权重,也就会使得后续生成的融合特征中包含更多的对内容分类目标影响大的样本特征。
需要说明的是,在本申请实施例中针对模型分类权重进行确定时以下两种确定方式:①根据粗分配粒度确定;②根据细分配粒度确定均可。两者的区别在于,使用根据粗分配粒度确定的方式对于初始设置子模型来说确定模型分类权重的工作量较小,可以在一定程度上节约算力资源,而根据细分配粒度确定的方式相比根据粗分配粒度确定的方式来说,对于内容样本的差异性适应性更强。
通过上述提出的根据细分配粒度进行模型分类权重的确定的方法,初始设置子模型能够根据训练过程中学习到的各个基础分类模型与内容分类目标的关联关系,结合基础分类模型的功能侧重与内容分类目标的适配程度,以及基础分类模型与内容样本之间的适配程度,对基础分类模型进行模型分类权重的确定。以实现贴合内容样本的差异性对各个基础分类模型进行模型分类权重的适应性确定,为各个基础分类模型分配更加合理的模型分类权重。这样的模型分类权重的调整方式是更细粒度的,也更具有适应性。
前述对于模型分类权重的确定方式进行了具体的介绍,下面对于模型分类权重可能具备的类型进行具体说明。
前述第j个模型分类权重包括风格适配权重或特征适配权重中的至少一个。其中风格适配权重用于标识在内容分类目标下,针对第j个内容样本的内容风格,第i个基础分类模型处理第j个内容样本的适配程度。特征适配权重用于标识在内容分类目标下,第i个基础分类模型处理第j个内容样本的样本特征的适配程度。在对基础分类模型进行模型分类权重的确定时,可以仅为基础分类模型确定风格适配权重或特征适配权重,还可以为基础分类模型同时设置风格适配权重以及特征适配权重,在此不做限定。
可以看出风格适配权重更加针对于内容样本本身,而特征适配权重更加针对于内容样本的样本特征。在进行风格适配权重以及特征适配权重的确定时可以采取前述提到的根据粗分配粒度确定和根据内容样本确定中的一种或多种方式进行。也即可以使用根据粗分配粒度确定或根据细分配粒度确定方式进行风格适配权重以及特征适配权重的确定;还可以使用根据细分配粒度确定的方式进行风格适配权重的确定,同时采用根据粗分配粒度确定的方式进行特征适配权重的确定,具体的确定方式在此不作限定。
上述风格适配权重针对的是低维度的特征的适配性,这里的低维度的特征指的就是内容样本本身,这是一种较为初级的适配性的考虑,即考虑基础分类模型与内容样本本身的适配性,确定风格适配权重的目的在于确定出基础分类模型对于内容样本进行特征提取的适配程度。
特征适配权重针对的是高维度的特征的适配性,这里的高维度的特征指的是内容样本的样本特征,这是一种深度较高的适配性考虑,即考虑基础分类模型与处理的内容样本的样本特征之间的适配性,确定特征适配权重的目的在于确定出基础分类模型获取到的样本特征,对于实现内容分类目标来说质量的高低。
其中风格适配权重针对的是内容样本的内容风格与基础分类模型的适配性,举例来说,内容样本的内容风格指的是内容样本中的内容呈现的特点,针对不同的内容样本,对应的内容呈现出的特点不同。而基础分类模型之间具备的功能不同,因此相同的基础分类模型对于不同的内容样本的内容风格具有不同的适配程度。举例来说,假设基础分类模型1倾向于针对彩色图片进行处理,而基础分类模型2倾向于针对黑白图片进行处理。那么意味着当基础训练模型1和基础训练模型2同时对黑白图片进行特征提取时,由于基础分类模型2对于黑白图片这一内容风格的适配程度更高,使得基础分类模型2的特征提取效果将会更好。而当基础训练模型1和基础训练模型2同时对彩色图片进行特征提取时,由于基础分类模型1对于彩色图片这一内容风格的适配程度更高,使得基础分类模型1的特征提取效果将会更好。
特征适配权重针对的是在内容分类目标下,基础分类模型处理样本特征的适配程度。可以用于标识基础分类模型对内容样本进行特征提取得到的样本特征的质量的高低。质量的高低的确定与内容分类目标的适配程度相关,当获取到的样本特征与内容分类目标的适配程度高时,意味着该样本特征对应的基础分类模型能够提取到较高质量的样本特征,也就能够反映出该基础分类模型对于处理样本特征的适配程度高。
特征适配权重针对的是在内容分类目标下,基础分类模型处理样本特征的适配程度。内容分类目标举例来说可以为:判断内容样本中的内容合规性,判断内容样本的类型等。样本特征是由基础分类模型获取到的,针对不同的基础分类模型获取到的样本特征不同,当基础分类模型为图像分类模型时获取到的样本特征为图像特征,当基础分类模型为文字分类模型时获取到的样本特征为文字特征,当基础分类模型为色彩分类模型时获取到的样本特征为颜色特征。当内容分类目标为判断内容样本中的内容合规性时,更倾向于获取文字或图像类型的样本特征(即文字特征或图像特征)。色彩分类模型对于处理文字或图像类型的样本特征来说适配程度较差,因此对应的特征适配权重较低。
通过针对内容样本本身以及内容样本对应的样本特征分别确定不同的权重,可以体现出基础分类模型针对不同的数据源进行处理时对于特征提取的侧重不同,在不同类型的模型分类权重的指导下,能够使得最终生成的融合特征包含更多的对内容分类目标影响大的样本特征,以使初始分类子模块在对融合特征进行分类时,有效数据的占比更大。
前述提到模型分类权重可以包括风格适配权重或特征适配权重中的至少一个,其中风格适配权重针对于基础分类模型处理内容样本的适配程度。该风格适配权重的设置与内容样本的内容风格有关,具体的内容风格可以理解为是内容样本的样本类型。如文字类型的内容样本与处理文字的基础分类模型之间的适配程度较高,对应的风格适配权重也更好。当第j个模型分类权重包括风格适配权重时,初始设置子模型包括初始风格决策模块。
在一种可能的实现方式中,确定风格适配权重的方法为:根据第j个内容样本,通过初始风格决策模块确定第i个基础分类模型的风格适配权重。
具体来说,当需要为基础分类模型设置风格适配权重时,可以通过初始风格决策模型实现。初始风格决策模块会根据内容样本的内容风格不同,对应确定出各个基础分类模型的风格适配权重。也即采用的是前述根据内容样本确定的方法,针对内容样本的不同对各个基础分类模型的风格适配权重进行针对性调整。在本申请实施例中初始风格决策模块可以为门控决策网络,如Resnet50等。
在本申请实施例中,初始风格决策模块可以不需要得知样本特征的提取情况就预先进行风格适配权重的确定,在生成的集成模型中,初始风格决策模块可以位于中间层(即对内容样本进行特征提取的层)之前,也可以位于中间层之后且在融合层(即对样本特征进行融合的层)之前。需要说明的是初始风格决策模型确定风格适配权重的时机与初始风格决策模型在集成模型中的所处位置无关,只与融合特征生成的时机有一定关系,具体的关系表现在风格适配权重的确定要发生在对样本特征进行特征融合之前。
值得注意的是,风格适配权重的确定可以发生在获取到内容样本的时候,且使用各个基础分类模型对内容样本进行特征提取的阶段。即当获取到内容样本时,就会确定出内容样本的内容风格,并根据内容样本的内容风格对应确定出各个基础分类模型的风格适配权重。风格适配权重的确定过程可以理解为是一种权重预分配的过程。该风格适配权重可以并不影响各个基础分类模型针对内容样本进行特征提取得到样本特征的过程,而是仅在后续的融合特征的过程中,调整对内容分类目标影响大的样本特征在融合特征中所占的比重(一般期望提高该比重)。由于风格适配权重不会影响到各个基础分类模型针对内容样本进行特征提取得到样本特征的过程,使得获取的样本特征能够充分的体现出对应的基础分类模型的特征提取的倾向性,有利于对基础分类模型针对不同的内容样本的样本特征获取情况进行充分掌握,以便为各个基础分类模型适应性分配权重。
前述提到风格适配权重的确定的时机,可以发生在获取内容样本之后,经过各个基础分类模型的特征提取得到样本特征之前,且可以不直接应用于基础分类模型对内容样本进行特征提取的过程中,如此能够使得各个基础分类模型充分暴露出自身对于提取的样本特征的倾向性(样本特征的提取情况与实现内容分类目标具有关联关系),以便初始设置子模型能够充分学习到基础分类模型与内容分类目标之间的关联关系,从而更加准确的确定出各个基础分类模型的权重。
通过上述对初始风格决策模块进行的说明,能够明确出初始风格决策模型在集成模型中所处的位置可以是较为灵活的,同时初始风格决策模块在确定风格适配权重时,对于集成模型内部的运行情况具有较小的依赖性,只要获取到内容样本即可完成风格适配权重的确定,并不依赖于集成模型中间的特征提取过程。对风格适配权重的确定方式简单且对于发生时机具有较小的限制。
前述提到模型分类权重可以包括风格适配权重或特征适配权重中的至少一个,其中特征适配权重针对于内容分类目标下,基础分类模型处理内容样本样本特征的适配程度。该特征适配权重的设置与内容样本的样本特征有关,因此设置特征适配权重的过程可以发生在内容样本输入N个基础分类模型,且各个基础分类模型针对内容样本进行特征提取的过程中。具体的,当第j个模型分类权重包括特征适配权重时,初始设置子模型包括初始特征决策模块。在一种可能的实现方式中,确定特征适配权重的方法可以为:首先获取第i个基础分类模型对第j个内容样本提取的样本特征,然后根据第j个内容样本的样本特征,通过初始特征决策模块确定第i个基础分类模型的特征适配权重。
在内容样本输入各个基础分类模型后,基础分类模型的中间层会对内容样本进行样本特征的提取,中间层的数量一般为多个,前一中间层提取到并输出的样本特征将会作为后一中间层的输入数据,后一中间层将会根据前一中间层提取到的样本特征的情况继续进行特征提取。
上述提到的“获取第i个基础分类模型对第j个内容样本提取的样本特征”,这里获取到的样本特征可以为基础分类模型在进行样本特征的提取的中间结果,还可以为基础分类模型的全部中间层完成样本特征提取得到的最终结果,在此不做限定。在本申请实施例中,初始特征决策模块可以为MLP模型或是其他模型,在此不作限定。
特征适配权重用于指示在内容分类目标下,各个基础分类模型处理内容样本的样本特征的适配程度。当基础分类模型获取到内容样本的样本特征时,即可根据该样本特征,结合内容分类目标,确定出该基础分类模型提取到的样本特征与内容分类目标之间的适配程度。
在本申请实施例中,确定特征适配权重的时机可以发生在任意一次基础分类模型完成对内容样本的特征提取之后。原因在于初始特征决策模型需要根据基础分类模型对内容样本进行特征提取得到的样本特征,进行特征适配权重的确定。也就是说,在本申请实施例中,初始特征决策模块可以位于任意一个中间层(即对内容样本进行特征提取的层)之后。需要说明的是初始特征决策模块确定特征适配权重的时机与初始特征决策模块在集成模型中的所处位置有关,原因在于不同的中间层对内容样本进行特征提取得到的样本特征之间存在差异。同时初始特征决策模块确定特征适配权重的时机还与融合特征生成的时机有一定关系,具体的关系表现在特征适配权重的确定也要发生在对样本特征进行特征融合之前。
特征适配权重的设置将会影响到不同的基础分类模型提取到的样本特征在生成的融合特征中的占比,特征适配权重越高,对应的基础分类模型提取到的样本特征在融合特征中的占比越高,而占比越高对于最终的预测结果的影响越大。因此在特征适配权重的设置过程中,期望将相对于内容分类目标影响大的样本特征赋予更高的权重,如此能够使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。
通过上述提供的一种特征适配权重的确定方法,在基础分类模型获取到内容样本并提取出内容样本的样本特征时,对各个基础分类模型的特征适配权重进行确定。确定过程中结合内容分类目标作为参考因素,以实现为对内容分类目标影响较大的样本特征对应的基础分类模型被确定出更高的特征适配权重。如此该基础分类模型提取到的,对内容分类目标影响大的样本特征能够在生成的融合特征中显著化,进而提高预测结果的准确性。
前述针对模型分类权重的介绍中提到,模型分类权重可以包括风格适配权重以及特征适配权重中的至少一个。也就是说存在模型分类权重中同时包括风格适配权重以及特征适配权重的情况,在这种情况下意味着需要同时考虑基础分类模型与内容样本之间的适配程度,以及内容分类模型与内容样本的样本特征之间的适配程度。
在一种可能的实现方式中,模型分类权重的确定方法为:当第j个模型分类权重包括风格适配权重和特征适配权重时,第j个模型分类权重是根据风格适配权重和特征适配权重之和确定的。
风格适配权重针对的是内容样本的内容风格与基础分类模型的适配程度,即基础分类模型是否适应于处理该内容风格(或者说是内容特点)的内容样本。
特征适配权重针对的是在内容分类目标下,基础分类模型处理样本特征的适配程度,即基础分类模型对内容样本进行特征提取的结果(即样本特征)的质量高低。
当模型分类权重中既包括风格适配权重,又包括特征适配权重时,能够同时确定内容样本的内容风格与基础分类模型之间的适配性(即基础分类模型是否适应于对该内容风格的内容样本进行处理),以及基础分类模型处理内容样本的样本特征之间的适配性(即基础分类模型对内容样本进行特征提取的结果的优劣)。也就是说同时考虑基础分类模型对内容样本进行处理的适应性,以及基础分类模型对内容样本进行特征提取的效果,从开始处理到结果产生均进行适应程度的确定。
通过初始设置子模型进行风格适配权重的确定,能够根据内容样本与基础分类模型的适配程度,为各个基础分类模型分配合理的权重,以使得与内容样本适配程度更高的基础分类模型被确定为更高的风格适配权重,进而保证经过基础分类模型获取到的内容样本的样本特征有效性更高。
通过初始设置子模型进行特征适配权重的确定,能够根据基础分类模型获取到的内容样本的样本特征与内容分类目标之间的适配程度,为基础分类模型确定合理的权重,以使得与内容分类目标适配程度更高的基础分类模型被确定为更高的特征适配权重,进而保证生成的融合特征中,与内容分类目标适配程度更高的基础分类模型对应生成的样本特征占有更高的比重,即在融合特征中,包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。
上述风格适配权重以及特征适配权重均为针对基础分类模型进行确定的,且上述两个权重均是标识基础分类模型的适配程度,因此两者能够被使用。当同时对基础分类模型进行风格适配权重以及特征适配权重的确定时,意味着对基础分类模型在对内容样本进行特征提取的过程中考虑的适配性信息更加丰富。通过两重适配程度的考虑,可以使得最终生成的融合特征中,与实现内容分类目标的适配程度更高的样本特征占据更大的比例,进而能够在一定程度上保证对于内容样本的预测结果更加准确。
模型分类权重的作用是标识出各个基础分类模型对内容分类目标的影响程度,模型分类权重越大对应的基础分类模型对内容分类目标的影响程度越大,也就表示该基础分类模型获取到的样本特征将在融合特征中占有较高的比重。将风格适配权重以及特征适配权重组合作为模型分类权重,可以在确定基础分类模型对内容分类目标的影响程度时,不但考虑基础分类模型对于内容样本的适配程度,同时考虑基础分类模型对内容样本的样本特征的适配程度。
基础分类模型对于内容样本的适配程度将影响到对内容样本进行特征提取得到的样本特征,不同的基础分类模型得到的样本特征侧重不同,有的偏向于提取色彩特征,有的偏向于提取纹理特征。通过确定风格适配权重可以标识出基础分类模型处理内容样本的适配程度,当内容样本为音频时,侧重于提取图像特征的基础分类模型与该内容样本的适配程度较低,对应确定的风格适配权重也就低。根据基础分类模型对于内容样本的样本特征的适配程度确定样本特征在生成的融合特征中的占比,也就是根据特征适配权重确定样本特征在生成的融合特征中的占比。这样能够通过特征适配权重使得与内容分类目标关联性更强的样本特征能够在融合特征中占有较大的比例,也就有助于提高预测结果的准确性。
当模型分类权重包括风格适配权重和特征适配权重时,可以将风格适配权重和所述特征适配权重之和确定为模型分类权重。若风格适配权重表示为α,特征适配权重表示为β,那么模型分类权重γ可以表示为γ=α+β。当然,除了将风格适配权重以及特征适配权重直接加和确定出模型分类权重之外,还可以为风格适配权重以及特征适配权重分配权重,将风格适配权重以及特征适配权重加权求和确定出模型分类权重。
通过将风格适配权重以及特征适配权重结合作为模型分类权重,能够充分考虑内容样本本身以及内容样本的样本特征,各自与内容分类目标间的适配程度。使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。
在本申请实施例中,针对分类场景下的内容样本,需要通过N个基础分类模型分别获取同一个内容样本的样本特征,并通过初始设置子模型确定出前述N个基础分类模型的模型分类权重,以该模型分类权重标识出各个基础分类模型对内容分类目标的影响程度。若基础分类模型对于内容分类目标的影响程度较低时,意味着该基础分类模型与内容分类目标的适配性较低,对应提取的样本特征与内容分类目标的相关性差。因此,在一种可能的实现方式中,将对该基础分类模型进行移除,以降低对初始设置子模型进行训练的过程的计算量。针对N个基础分类模型中的第i个基础分类模型,具体的移除方法为:确定第i个基础分类模型在模型训练过程中,被初始设置子模型确定的模型分类权重集合;若根据模型分类权重集合中的模型分类权重确定不满足融合条件,在模型训练的过程中移除第i个基础分类模型。
前述提到了对初始分类子模型和初始设置子模型进行训练,且训练过程可以分为两个阶段,其中一个为训练平稳阶段,另一个阶段为训练调整阶段。在训练调整阶段会对初始设置子模型的模型参数进行调整,而模型参数的调整会影响到初始设置子模型为基础分类模型确定的模型分类权重。训练过程模型参数动态变化,对应的确定的模型分类权重也会或多或少存在差异,各个确定出的模型分类权重可以确定为模型分类权重集合。当针对第i个基础分类模型时,由于初始设置子模型的模型参数变化,对应确定出的第i个基础分类模型的各个模型分类权重将组合成模型分类权重集合。
而在训练平稳阶段,不会对初始设置子模型进行模型参数的调整,此时初始训练子模型确定基础分类模型的模型分类权重时,可以通过以下两种方式进行:①粗分配粒度;②细分配粒度。
在粗分配粒度的方式下,若分类场景以及内容分类目标均保持不变,那么针对基础分类模型的模型分类权重不会随着内容样本的变化而随之变化。因此,若不对初始设置子模型进行模型参数的调整,那么对应于为初始分类模型分类的模型分类权重将为固定值,最终确定的模型分类权重集合中的各个模型分类权重的取值一致。当针对第i个基础分类模型时,在粗分配粒度的方式下,第i个基础分类模型对应的模型分类权重集合中的各个模型分类权重取值一致。假设为第i个基础分类模型分配的模型分类权重为模型分类权重1,那么对应的模型分类权重集合为[模型分类权重1,模型分类权重1,模型分类权重1……]。
在细分配粒度下,初始设置子模型进行基础分类模型进行模型分类权重的确定时,更加关注于内容样本的差异性。将结合内容样本的不同适应性的调整各个基础分类模型对应的模型分类权重,因此根据输入基础分类模型中的内容样本的不同,对应的初始设置子模型为各个基础分类模型确定的模型分类权重各不相同,各个确定出的模型分类权重可以确定为模型分类权重集合。当针对第i个基础分类模型时,在细分配粒度的方式下,根据内容样本不同,对应组成的模型分类权重集合中的各个模型分类权重将或多或少存在差异。举例来说,内容样本输入基础分类模型的顺序依次为:内容样本1、内容样本2和内容样本3。内容样本1对应模型分类权重1,内容样本2对应模型分类权重2,内容样本3对应模型分类权重3。那么对应确定出的模型分类权重集合为[模型分类权重1,模型分类权重2,模型分类权重3]。
通过上述确定出的模型分类权重集合,对模型分类权重集合中的模型分类权重进行分析,若判断出不符合融合条件时,那么就会在模型训练的过程中将该模型分类权重集合对应的第i个基础分类模型进行移除。具体的融合条件可以为设置模型分类权重的阈值,当模型分类权重集合中的模型分类权重小于该阈值的数量达到数量阈值时,或者小于该阈值的模型分类权重连续出现的次数达到次数阈值时,确定为不符合融合条件。该融合条件设置的目的是为了筛选出在模型训练过程中,被初始设置子模型多次或者连续多次确定为较低模型分类权重的基础分类模型。通过前述的描述可知,初始设置子模型确定基础分类模型的模型分类权重,以此来标识对应的基础分类模型对内容分类目标的影响程度。若为基础分类模型确定的模型分类权重持续或者多次处于较低状态,那么意味着该基础分类模型对于内容分类目标的影响程度较小,即该基础分类模型获取的样本特征对内容分类目标影响小,该样本特征并非是与内容分类目标具有强相关性的实质性内容。故这种基础分类模型并不能对实现内容分类目标起到重要作用,在训练过程中可以将其进行移除,以降低模型训练的过程中的计算量,节约算力资源。
举例来说,假设阈值为0.4,数量阈值为3个,若第i个基础分类模型对应的模型分类权重集合为[0.1,0.4,0.5,0.3,0.2],可以判断出该模型分类权重集合中的模型分类权重不满足融合条件,因此需要将该第i个基础分类模型进行移除,在后续的模型训练过程中,将不会为该第i个基础分类模型进行模型分类权重的确定。
又一示例性的,假设阈值为0.4,次数阈值为3次,若第i个基础分类模型对应的模型分类权重集合为[0.1,0.3,0.2,0.5,0.4],可以判断出该模型分类权重集合中的模型分类权重不满足融合条件,同样需要将该第i个基础分类模型进行移除,在后续的模型训练过程中,不会为该第i个基础分类模型进行模型分类权重的确定。
再一示例性的,假设存在两个基础分类模型,分别为基础分类模型1和基础分类模型2。其中基础分类模型1针对黑白图片进行特征提取的效果较好,基础分类模型2针对彩色图片进行特征提取的效果较好。也就是说,基础分类模型1针对黑白图片这类的内容样本的适配程度更高,基础分类模型2针对彩色图片这类的内容样本的适配程度更高。当内容分类目标为识别图片中是否存在某个特定物体时,若输入的内容样本大部分为黑白图片,初始设置子模型将会为基础分类模型1确定较高的模型分类权重,为基础分类模型2确定较低的模型分类权重。基础分类模型1对应的模型分类权重集合1中大部分模型分类权重将大于模型分类权重的阈值,基础分类模型2对应的模型分类权重集合2中大部分模型分类权重将小于模型分类权重的阈值(基础分类模型2不符合融合条件),因此会将基础分类模型2进行移除。
通过上述提供的一种移除基础分类模型的方法,能够结合一段时间内的针对基础分类模型的连续的模型分类权重确定情况,确定该基础分类模型是否与实现内容分类目标具有强相关关系。通过将与实现内容分类目标不具有强相关关系的基础分类模型进行移除,能够避免初始设置子模型在模型训练过程中,持续为此类基础分类模型进行模型分配权重的确定,以降低训练过程中的计算量,提高训练效率。
前述提到了在训练过程中,将不符合内容分类目标的要求的基础分类模型进行移除,前述S204中提到“根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型”,在生成用于内容分类目标的集成模型中,亦不再考虑被移除的基础分类模型,如此能够使得在集成模型应用的过程中,避免无效的基础分类模型在分类场景下,进行基于内容分类目标的分类服务中影响分类效率。因此,在一种可能的实现方式下,具体的生成集成模型的方法为:首先将N个基础分类模型中除了被移除模型之外的确定为目标基础分类模型,然后根据目标基础分类模型、分类子模型和设置子模型,生成用于内容分类目标的集成模型。
前述被移除模型为在模型训练的过程中基于融合条件被移除的基础分类模型,目标基础分类模型指的是N个基础分类模型剔除掉被移除模型后剩余的基础分类模型,也是符合融合条件的基础分类模型。目标基础分类模型对应获取到的样本特征对内容分类目标影响大,将目标基础分类模型、分类子模型和设置子模型,生成用于内容分类目标的集成模型。如此,能够使得基于样本特征和模型分类权重生成的融合特征,在模型分类权重的指导下,融合特征中包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。
由于将不符合融合条件的基础分类模型进行移除,在生成的集成模型中不会包含不符合融合条件的基础分类模型。那么在使用集成模型进行基于内容分类目标的分类服务时,不再引入不适合内容分类目标的基础分类模型,在融合特征中包含的样本特征将为对内容分类目标影响大的样本特征,也就是说融合特征中为内容分类目标相关的实质性内容,如此能够提升预测结果的准确性,也就能提高基于内容分类目标的分类服务的效率。
举例来说,当内容分类目标为识别图片中是否存在某个特定物体时,若存在基础分类模型1(倾向于处理黑白图片)和基础分类模型2(倾向于处理彩色图片),当内容样本大部分为黑白图片时,基础分类模型2将在模型训练过程中由于不符合融合条件而被移除,即基础分类模型2为被移除模型。此时基础分类模型1被确定为目标基础分类模型。将会根据目标基础分类模型(即基础分类模型1)、分类子模型以及设置子模型生成用于内容分类目标的集成模型,以对分类场景下的内容进行基于内容分类目标的分类服务。
通过上述提供的一种生成集成模型的方法,将N个基础分类模型中除了被移除模型之外的确定为目标基础分类模型,并基于目标基础分类模型生成用于内容分类目标的集成模型。能够使得生成的集成模型中不会引入不符合内容分类目标要求的基础分类模型,如此有利于提高在利用集成模型进行分类服务时的分类效率。
前述S202中提到“根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征”,针对不同的基础分类模型,初始设置子模型确定的模型分类权重会存在或大或小的差异,有时不同的基础分类模型对应的模型分类权重之间的大小差异可能会跨越数量级。前述提到模型分类权重用于标识各个基础分类模型对内容分类目标的影响程度。模型分类权重大的基础分类模型获取的样本特征将在融合特征中占据较高的比重,模型分类权重小的基础分类模型获取的样本特征将在融合特征中占据较小的比重。那么当模型分类权重之间的取值情况差异较大时,将会导致部分样本特征在融合特征中过度显著化,不利于在融合特征中将各个样本特征的内容进行广泛体现。因此,在一种可能的实现方式中,对基础分类模型的模型分类权重进行统一的归一化处理,缩小各个模型分类权重的差异。具体的生成融合特征的方法为:首先将N个基础分类模型的模型分类权重进行统一的归一化处理,得到N个基础分类模型分别对应的归一化权重。然后根据N个基础分类模型分别对应的归一化权重和样本特征生成内容样本的融合特征。
前述提到的统一的归一化处理,可以理解为将N个基础分类模型各自对应的模型分类权重的取值限定在同一数量级,使得各个模型分类权重之间具有可比性,缩小各个模型分类权重的差异。在本申请实施例中,在对模型分类权重进行归一化处理时,可以将各个模型分类权重处理为[0,1]之间的数值。
举例来说,假设存在3个基础分类模型,分别为基础分类模型1,基础分类模型2和基础分类模型3。其中基础分类模型1对应的模型分类权重为1.8,基础分类模型2对应的模型分类权重为0.9,基础分类模型3对应的模型分类权重为18。在对各个模型分类权重进行归一化处理后,得到的基础分类模型1对应的归一化权重为0.1,基础分类模型2对应的归一化权重为0.5,基础分类模型3对应的归一化权重为1。如此各个基础分类模型对应的归一化权重处于同一数量级,在根据归一化权重和样本特征生成内容样本的融合特征时,各个基础分类模型对应的样本特征都将在融合特征中进行体现。
更进一步的,除了将各个模型分类权重处理为[0,1]之间的数值之外,还可以使得处理后得到的各个归一化权重相加之和为1。举例来说,假设存在4个基础分类模型,分别为基础分类模型1,基础分类模型2,基础分类模型3和基础分类模型4,各个基础分类模型各自对应一个模型分类权重。在进行归一化处理后得到的基础分类模型1对应的归一化权重1为0.3,基础分类模型2对应的归一化权重2为0.2,基础分类模型3对应的归一化权重3为0.4,基础分类模型4对应的归一化权重4为0.1。如此,归一化权重1,归一化权重2,归一化权重3和归一化权重4之间的和为1。
在确定出各个基础分类模型对应的归一化权重后,会根据各个基础分类模型分别对应的归一化权重和样本特征生成内容样本的融合特征。样本特征的归一化权重与样本特征之间是一一对应的,其中单独一个基础分类模型的归一化权重将与该基础分类模型对应的归一化权重结合,生成一个用于生成融合特征的特征数据。而融合特征可以理解为是多个前述特征数据的组合。举例来说,假设存在基础分类模型A和基础分类模型B,基础分类模型A对应的获取到样本特征A以及归一化权重A,基础分类模型B对应的获取到样本特征B以及归一化权重B。那么在生成融合特征时,样本特征A和归一化权重A将会构成特征数据A,样本特征B和归一化权重B将会构成特征数据B。在生成融合特征时将会把特征数据A与特征数据B组合得到融合特征。假设归一化权重为γ,样本特征为f,那么将归一化权重与对应的样本特征加权求和后得到对应的融合特征F,其中F=sun(γi,fi),i用于标识基础分类模型。
特征数据可以由样本特征与归一化权重相乘得到,继续参照上述例子,假设在进行归一化处理后得到的基础分类模型1对应的归一化权重1为0.3,基础分类模型2对应的归一化权重2为0.2,基础分类模型3对应的归一化权重3为0.4,基础分类模型4对应的归一化权重4为0.1。且前述各个基础分类模型对应获取的样本特征分别为样本特征1,样本特征2,样本特征3和样本特征4。那么生成的该内容样本对应的融合特征为0.3*样本特征1+0.2*样本特征2+0.4*样本特征3+0.1*样本特征4。
通过上述提供的一种生成融合特征的方法,在生成融合特征那个之前,对各个基础分类模型的模型分类权重进行统一的归一化处理,能够使得模型分类权重的取值限定在同一数量级,缩小各个模型分类权重的差异,避免部分样本特征在融合特征中过度显著化,使得在融合特征中将各个样本特征的内容进行广泛体现。
前述根据基础分类模型的功能不同,对应的从内容样本中提取到的样本特征的侧重也各不相同。因此,在本申请实施例中,为了保证生成的融合特征中对于内容分类目标影响大的样本特征的多样性,期望基础分类模型彼此之间具备差异性,以便融合特征中能够具备多样化的不同侧重角度的样本特征。因此,在一种可能的实现方式中,基础分类模型的选取方式为:N个基础分类模型在分类领域和分类类别上至少有一项不同。
当基础分类模型之间存在分类领域或者分类类别的不同时,针对同一内容样本获取到的样本特征的侧重也不相同。在确定基础分类模型时还需要考虑内容分类目标,选取的基础分类模型需要与内容分类目标具有相关性。
举例来说,当内容分类目标为识别视频中的违规内容时,由于视频中可以包括:图像信息、文字信息以及音频信息等,因此结合内容分类目标确定出的基础分类模型可以为:图像分类模型、文本分类模型以及音频分类模型。前述三种基础分类模型可以理解为是分类领域不同,它们各自为图像分类领域、文字分类领域以及音频分类领域。其中,图像分类模型用于对视频帧进行图像信息的提取,文本分类模型用于对视频帧进行文本信息的提取,而音频分类模型用于对视频中的音频信息进行提取。文本分类模型获取出的样本特征可以用于确定视频中的文本信息中是否具备违规内容,图像分类模型获取出的样本特征可以用于确定视频中的图像信息中是否具备违规内容,音频分类模型获取出的样本特征可以用于确定视频中的音频信息中是否具备违规内容。
又一示例性的,当内容分类目标为识别图片中的特定物品时,此时内容样本为图片,由于图片中可以包括纹理信息以及色彩信息等。因此结合内容分类目标确定出的基础分类模型可以为:纹理分类模型以及色彩分类模型。前述两种基础分类模型可以理解为是分类类别不同,纹理分类模型主要是用于提取图片中的纹理特征,而色彩分类模型用于提取图片中的色彩特征。纹理分类模型和色彩分类模型获取的样本特征均可以用于确定图片中是否具备特定物品。
在对基础分类模型进行选取时,通过确定不同分类领域或者不同分类类别的基础分类模型,能够使得由基础分类模型获取到样本特征具有差异性。可以涵盖不同类型角度的与内容分类目标相关的样本特征,也即不同的基础分类模型将对应不同的分类需求,那么当基础分类模型之间存在差异时,对应的同一个内容样本被不同基础分类模型提取得到的样本特征不同。当生成融合特征时会结合各个基础分类模型获取到的样本特征进行融合得到,那么由于基础分类模型具有多样性,对应的样本特征也就具有多样性,如此在生成的融合特征中将具有针对同一内容样本的不同角度的样本特征,有利于在一定程度上保证根据融合特征确定出的预测结果的准确性。
通过上述提供的基础分类模型的选取方式,能够保证各个基础分类模型之间具有差异性,进而使得获取的样本特征之间具有差异性,具体的差异性体现在分类角度或者说是分类侧重的不同。如此可以保证生成的融合特征中具备多种不同类型的针对同一内容样本的样本特征,有利于从不同角度对内容样本的分类结果进行预测,提高最终确定出的预测结果的准确性。
在前述S201中提到“根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征”,通过之前的描述可知,在本申请实施例中,基础分类模型主要起到的作用为针对获取到的内容样本进行特征提取,并不一定需要得到最终的分类结果。而特征提取是由基础分类模型中的中间层执行的,通过中间层即可获取到内容样本的样本特征。因此,在一种可能的实现方式中,获取样本特征的方法为:根据分类场景下的内容样本,通过N个基础分类模型的中间层获取对应的输出数据作为内容样本的样本特征。
在内容样本输入各个基础分类模型后,基础分类模型的中间层会对内容样本进行样本特征的提取,中间层的数量一般为多个,前一中间层提取到并输出的样本特征(即输出数据)将会作为后一中间层的输入数据,后一中间层将会根据前一中间层提取到的样本特征的情况继续进行特征提取。
上述提到的“通过N个所述基础分类模型分别获取所述内容样本的样本特征”,这里获取到的样本特征可以为各个基础分类模型在进行样本特征的提取的中间结果。也就是说,样本特征可以为前述N个基础分类模型各自对应的任意一个中间层的输出数据。
通过上述提供的获取样本特征的方法,将基础分类模型的中间层获取到的对应的输出数据作为内容样本的样本特征。能够降低样本特征的获取难度,提高获取样本特征的效率。且无需基础分类模型的最终分类结果,仅使用基础分类模型的中间层的特征提取功能,应用到的模型结构简单,有利于提高后续生成融合特征并结合融合特征确定预测结果的效率。
在前面的描述中对集成模型的生成过程进行了详尽的阐述,当完成集成模型的生成后,需要将集成模型应用至分类场景下,以对该分类场景下的内容进行基于内容分类目标的分类服务。因此,在一种可能的实现方式中,具体的集成模型的应用过程为:
A1:获取所述分类场景下的待分类内容。
上述提到的待分类内容可以理解为是内容样本,具体来说指的是在该分类场景下生成的或者相关的内容。待分类内容与分类场景有相关关系,举例来说,假设分类场景为视频分类场景,那么对应的待分类内容则为视频内容。
A2:通过所述集成模型中的所述设置子模型,确定所述集成模型中基础分类模型分别对应的模型分类权重。
设置子模型为训练完成的初始设置子模型,该设置子模型用于确定出各个基础分类模型对应的模型分类权重,其中,该设置子模型已经具备较高的为基础分类模型确定模型分类权重的准确性,能够为各个基础分类模型结合内容分类目标进行模型分类权重的较为准确的确定。
A3:通过所述集成模型,根据所述集成模型中基础分类模型分别对应的模型分类权重和所述待分类内容的内容特征,生成所述待分类内容的融合特征。
待分类内容的内容特征指的是由集成模型中的基础分类模型获取到的内容特征,融合特征的生成涉及到两个元素,其中一个是基础分类模型对应的模型分类权重,另一个是基础分类模型从待分类内容中获取到的内容特征。基础分类模型的模型分类权重与获取到的内容特征之间是一一对应的,单独一个基础分类模型的模型分类权重与对应的内容特征结合得到一个用于生成融合特征的特征数据,各个基础分类模型的特征数据的组合即可生成融合数据。
举例来说,假设存在基础分类模型A和基础分类模型B,基础分类模型A对应的获取到内容特征A以及模型分类权重A,基础分类模型B对应的获取到内容特征B以及模型分类权重B。那么在生成融合特征时,内容特征A和模型分类权重A将会构成内容特征A,内容特征B和模型分类权重B将会构成内容特征B。在生成融合特征时将会把内容特征A与内容特征B组合得到融合特征。
A4:根据所述待分类内容的融合特征,通过所述集成模型中的所述分类子模型确定所述待分类内容的内容分类结果。
集成模型中的分类子模型用于结合生成的待分类内容的融合特征,对待分类内容进行分类。分类子模型得到的内容分类结果即为结合内容分类目标特定的分类要求得到的分类结果。
需要说明的是分类子模型仅需针对待分类内容的融合特征进行分类操作,而不需要进行特征提取等操作,因此分类子模型的结构较为简单,使用过程中不会过多浪费算力资源。
图5为本申请实施例提供的一种集成模型的应用示意图,如图5所示,在对图像内容进行审核的分类场景下,待分类内容可以为视频、动图或者图像,对于视频和动图需要进行间隔抽帧,得到视频帧和动图的图像帧。然后将视频帧、动图的图像帧以及图像进行长图切分得到图像序列,将该图像序列作为待分类内容输入集成模型中,由集成模型中的设置子模型确定出集成模型中的基础分类模型分别对应的模型分类权重。具体的模型分类权重(图中的γi)可以包括风格适配权重和特征适配权重,其中风格适配权重在图中用αi表示,特征适配权重用βi表示,i代表不同的基础分类模型。由图可知,模型分类权重γi可以表示为γi=αi+βi。
在图5中的θi和fi用于表示基础分类模型的两个中间层各自获取到的待分类内容的内容特征。其中θi可以视为基础分类模型中的前一中间层提取到的内容特征,fi则视为基础分类模型中相对θi的后一中间层提取到的内容特征。基于集成模型中基础分类模型分别对应的模型分类权重,以及基础分类模型的任一中间层获取的待分类内容的内容特征,生成待分类内容的融合特征(在图中的Fusion融合模块处进行)。通过分类子模型对待分类内容的融合特征进行提取可以确定待分类内容的内容分类结果,即确定出审核的图像内容中是否存在违规内容。
需要说明的是,在本申请实施例中集成模型的融合模块可以是简单的线性层,也可以是复杂的CNN,或者Transformer结构。分类子模型和设置子模型可以是各种MLP、CNN结构,也可以是各种Transformer结构。基础分类模型可以是各种网络结构和各种训练超参数、训练数据集、训练任务上得到的专家模型。
通过上述提供的集成模型的应用方法,能够利用设置子模型确定出基础分类模型对应的模型分类权重,根据基础分类模型对应的模型分类权重以及中间层获取到的待分类内容的内容特征,生成待分类内容的融合特征。在获取待分类内容的内容特征时仅涉及基础分类模型的中间层,获取难度低,有利于提高获取效率。同时当获取到待分类内容的融合特征,通过集成模型中的分类子模型确定待分类内容的内容分类结果,分类子模型仅具有分类功能,模型结构简单,不会过多的浪费算力资源,也能够提高获得内容分类结果的效率。
为了进一步使得集成模型能够提高内容分类的准确性,可以对集成模型进行训练,训练过程需要准备大量的含有样本标签的内容样本。在对集成模型训练的过程中可以采用有放回的随机重复采样(bootstrap)方法。图6为本申请实施例提供的一种随机重复采样的示意图,如图6所示,该方法具体为首先获取内容样本,基于内容样本生成不同的随机重复采样样本,将各个随机重复采样样本输入到集成模型中,最终得到分类结果。
图7为本申请实施例提供的一种集成模型的训练示意图,如图7所示,为了应对复杂的分类场景,同时降低标注成本,还可以采用无标签内容样本进行集成模型的训练。具体的训练方式可以包括两种:
1. 半监督训练
使用标签内容样本训练初始集成模型,然后用初始集成模型对无标签内容样本进行预测打标签,最后混合有无标注内容样本(即伪标签内容样本)共同进行训练。
2. 无监督预训练
除了使用监督的方式利用无标注数据,还可以采用无监督的方式得到一个业务场景适配的预训练集成模型,提升集成模型的最终训练效果。
在前述图1-7所对应的实施例的基础上,图8为本申请实施例提供的一种模型确定装置的装置示意图,模型确定装置800包括:获取模块801、第一生成模块802、训练模块803和第二生成模块804;
所述获取模块801,用于根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征,所述内容样本具有与所述分类场景的内容分类目标相关的样本标签,N>1;
所述第一生成模块802,用于根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,所述模型分类权重是通过初始设置子模型确定的,用于标识所对应基础分类模型对所述内容分类目标的影响程度;
所述训练模块803,用于通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型,所述初始分类子模型是根据所述内容分类目标确定的;
所述第二生成模块804,用于根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,所述集成模型用于对所述分类场景下的内容进行基于所述内容分类目标的分类服务。
在一种可能的实现方式中,针对模型训练过程中的第j个内容样本,N个所述基础分类模型中第i个基础分类模型的模型分类权重,所述第一生成模块802具体用于:
根据所述第j个内容样本,通过所述初始设置子模型确定所述第i个基础分类模型的第j个模型分类权重,所述第j个模型分类权重用于标识在对所述第j个内容样本进行基于所述内容分类目标的分类预测时,所述第i个基础分类模型对所述内容分类目标的影响程度。
在一种可能的实现方式中,所述第一生成模块802中涉及的所述第j个模型分类权重包括风格适配权重或特征适配权重中的至少一个,所述风格适配权重用于标识在所述内容分类目标下,针对所述第j个内容样本的内容风格,所述第i个基础分类模型处理所述第j个内容样本的适配程度;
所述特征适配权重用于标识在所述内容分类目标下,所述第i个基础分类模型处理所述第j个内容样本的样本特征的适配程度。
在一种可能的实现方式中,当所述第j个模型分类权重包括风格适配权重时,所述初始设置子模型包括初始风格决策模块,所述第一生成模块802具体用于:
根据所述第j个内容样本,通过所述初始风格决策模块确定所述第i个基础分类模型的所述风格适配权重。
在一种可能的实现方式中,当所述第j个模型分类权重包括特征适配权重时,所述初始设置子模型包括初始特征决策模块,所述第一生成模块802具体用于:
获取所述第i个基础分类模型对所述第j个内容样本提取的样本特征;
根据所述第j个内容样本的样本特征,通过所述初始特征决策模块确定所述第i个基础分类模型的所述特征适配权重。
在一种可能的实现方式中,所述第一生成模块802具体用于:
当所述第j个模型分类权重包括所述风格适配权重和所述特征适配权重时,所述第j个模型分类权重是根据所述风格适配权重和所述特征适配权重之和确定的。
在一种可能的实现方式中,针对N个所述基础分类模型中的第i个基础分类模型,所述装置用于:
确定所述第i个基础分类模型在模型训练的过程中,被所述初始设置子模型确定的模型分类权重集合;
若根据所述模型分类权重集合中的模型分类权重确定不满足融合条件,在所述模型训练的过程中移除所述第i个基础分类模型。
在一种可能的实现方式中,所述第二生成模块804具体用于:
将N个所述基础分类模型中除了被移除模型之外的确定为目标基础分类模型,所述被移除模型为在所述模型训练的过程中基于所述融合条件被移除的基础分类模型;
根据所述目标基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型。
在一种可能的实现方式中,所述第一生成模块802具体用于:
将N个所述基础分类模型的模型分类权重进行统一的归一化处理,得到N个所述基础分类模型分别对应的归一化权重;
根据N个所述基础分类模型分别对应的归一化权重和样本特征生成所述内容样本的融合特征。
在一种可能的实现方式中,所述装置中的N个所述基础分类模型在分类领域和分类类别上至少有一项不同。
在一种可能的实现方式中,所述装置具体用于:
获取所述分类场景下的待分类内容;
通过所述集成模型中的所述设置子模型,确定所述集成模型中基础分类模型分别对应的模型分类权重;
通过所述集成模型,根据所述集成模型中基础分类模型分别对应的模型分类权重和所述待分类内容的内容特征,生成所述待分类内容的融合特征;
根据所述待分类内容的融合特征,通过所述集成模型中的所述分类子模型确定所述待分类内容的内容分类结果。
在一种可能的实现方式中,所述获取模块801具体用于:
根据所述分类场景下的所述内容样本,通过N个所述基础分类模型的中间层获取对应的输出数据作为所述内容样本的所述样本特征。
通过上述提供的一种模型确定装置,为了能够准确高效的将N个基础分类模型集成为分类场景下的内容分类目标提供服务,将以N个基础分类模型为基础来训练初始设置子模型和初始分类子模型。针对分类场景下的内容样本,通过N个基础分类模型分别获取同一个内容样本的样本特征,并通过初始设置子模型确定N个基础分类模型的模型分类权重,以此标识出各个基础分类模型对内容分类目标的影响程度。基于样本特征和模型分类权重生成融合特征,在模型分类权重的指导下,相对于对内容分类目标影响小的样本特征,融合特征中包含更多的对内容分类目标影响大的样本特征,使得初始分类子模型在基于融合特征进行预测时,融合特征中与内容分类目标相关的实质性内容更为丰富,有助于提升预测结果的准确性。在模型训练时,基于预测结果和样本标签的差异会调整初始设置子模型和初始分类子模型的模型参数,使得初始设置子模型自适应的学习到各个基础分类模型与内容分类目标的关联关系,从而给出更为准确的模型分类权重,并使得初始分类子模型可基于更准确的融合特征确定出预测结果。由于整个模型训练过程中并不需要调整基础分类模型的模型参数,较小的训练代价有效提升了针对内容分类目标的模型集成效率,且能够尽可能的利用到N个基础分类模型的功能,有效保证了集成模型的准确性。
本申请实施例还提供了一种计算机设备,包括终端设备或服务器,前述的模型确定装置可以配置在该计算机设备中。下面结合附图对该计算机设备进行介绍。
若该计算机设备为终端设备,请参见图9所示,本申请实施例提供了一种终端设备,以终端设备为手机为例:
图9示出的是与本申请实施例提供的手机的部分结构的框图。参考图9,手机包括:射频(Radio Frequency,简称RF)电路1410、存储器1420、输入单元1430、显示单元1440、传感器1450、音频电路1460、无线保真(简称WiFi)模块1470、处理器1480、以及电源1490等部件。本领域技术人员可以理解,图9中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图9对手机的各个构成部件进行具体的介绍:
RF电路1410可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1480处理;另外,将设计上行的数据发送给基站。
存储器1420可用于存储软件程序以及模块,处理器1480通过运行存储在存储器1420的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器1420可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1420可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1430可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元1430可包括触控面板1431以及其他输入设备1432。
显示单元1440可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元1440可包括显示面板1441。
手机还可包括至少一种传感器1450,比如光传感器、运动传感器以及其他传感器。
音频电路1460、扬声器1461,传声器1462可提供用户与手机之间的音频接口。
WiFi属于短距离无线传输技术,手机通过WiFi模块1470可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。
处理器1480是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器1420内的软件程序和/或模块,以及调用存储在存储器1420内的数据,执行手机的各种功能和处理数据。
手机还包括给各个部件供电的电源1490(比如电池)。
在本实施例中,该终端设备所包括的处理器1480还用于执行本申请各实施例方法中的步骤。
若计算机设备为服务器,本申请实施例还提供一种服务器,请参见图10所示,图10为本申请实施例提供的服务器1500的结构图,服务器1500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(Central Processing Units,简称CPU)1522(例如,一个或一个以上处理器)和存储器1532,一个或一个以上存储应用程序1542或数据1544的存储介质1530(例如一个或一个以上海量存储设备)。其中,存储器1532和存储介质1530可以是短暂存储或持久存储。存储在存储介质1530的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器1522可以设置为与存储介质1530通信,在服务器1500上执行存储介质1530中的一系列指令操作。
服务器1500还可以包括一个或一个以上电源1526,一个或一个以上有线或无线网络接口1550,一个或一个以上输入输出接口1558,和/或,一个或一个以上操作系统1541,例如Windows ServerTM,Mac OS XTM,UnixTM, LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于图10所示的服务器结构。
另外,本申请实施例还提供了一种存储介质,所述存储介质用于存储计算机程序,所述计算机程序用于执行上述实施例提供的方法。
本申请实施例还提供了一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得计算机设备执行上述实施例提供的方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质可以是下述介质中的至少一种:只读存储器(英文:Read-only Memory,缩写:ROM)、RAM、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请实施例中,术语“模块”或“单元”是指有预定功能的计算机程序或计算机程序的一部分,并与其他相关部分一起工作以实现预定目标,并且可以通过使用软件、硬件(如处理电路或存储器)或其组合来全部或部分实现。同样的,一个处理器(或多个处理器或存储器)可以用来实现一个或多个模块或单元。此外,每个模块或单元都可以是包含该模块或单元功能的整体模块或单元的一部分。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。而且本申请在上述各方面提供的实现方式的基础上,还可以进行进一步组合以提供更多实现方式。因此,本申请的保护范围应该以权利要求的保护范围为准。
Claims (23)
1.一种模型确定方法,其特征在于,所述方法包括:
根据分类场景下的内容样本,通过N个基础分类模型分别获取所述内容样本的样本特征;所述内容样本具有与所述分类场景的内容分类目标相关的样本标签,N>1;所述内容样本包括图片、视频、文本及语音中的一种或者多种;
根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,所述模型分类权重是通过初始设置子模型确定的,用于标识所对应基础分类模型对所述内容分类目标的影响程度;
通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型;所述初始分类子模型是根据所述内容分类目标确定的,所述初始分类子模型用于结合所述融合特征对所述内容样本进行分类;
根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,所述集成模型用于对所述分类场景下的内容进行基于所述内容分类目标的分类服务;
针对模型训练过程中的第j个内容样本,N个所述基础分类模型中第i个基础分类模型的模型分类权重通过如下方式确定:
根据所述第j个内容样本,通过所述初始设置子模型确定所述第i个基础分类模型的第j个模型分类权重,所述第j个模型分类权重用于标识在对所述第j个内容样本进行基于所述内容分类目标的分类预测时,所述第i个基础分类模型对所述内容分类目标的影响程度;
所述第j个模型分类权重包括风格适配权重或特征适配权重中的至少一个,所述风格适配权重用于标识在所述内容分类目标下,针对所述第j个内容样本的内容风格,所述第i个基础分类模型处理所述第j个内容样本的适配程度;
所述特征适配权重用于标识在所述内容分类目标下,所述第i个基础分类模型处理所述第j个内容样本的样本特征的适配程度。
2.根据权利要求1所述的方法,其特征在于,当所述第j个模型分类权重包括风格适配权重时,所述初始设置子模型包括初始风格决策模块,所述根据所述第j个内容样本,通过所述初始设置子模型确定所述第i个基础分类模型的第j个模型分类权重,包括:
根据所述第j个内容样本,通过所述初始风格决策模块确定所述第i个基础分类模型的所述风格适配权重。
3.根据权利要求1所述的方法,其特征在于,当所述第j个模型分类权重包括特征适配权重时,所述初始设置子模型包括初始特征决策模块,所述根据所述第j个内容样本,通过所述初始设置子模型确定所述第i个基础分类模型的第j个模型分类权重,包括:
获取所述第i个基础分类模型对所述第j个内容样本提取的样本特征;
根据所述第j个内容样本的样本特征,通过所述初始特征决策模块确定所述第i个基础分类模型的所述特征适配权重。
4.根据权利要求1所述的方法,其特征在于,当所述第j个模型分类权重包括所述风格适配权重和所述特征适配权重时,所述第j个模型分类权重是根据所述风格适配权重和所述特征适配权重之和确定的。
5.根据权利要求1所述的方法,其特征在于,针对N个所述基础分类模型中的第i个基础分类模型,所述方法还包括:
确定所述第i个基础分类模型在模型训练的过程中,被所述初始设置子模型确定的模型分类权重集合;
若根据所述模型分类权重集合中的模型分类权重确定不满足融合条件,在所述模型训练的过程中移除所述第i个基础分类模型。
6.根据权利要求5所述的方法,其特征在于,所述根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,包括:
将N个所述基础分类模型中除了被移除模型之外的确定为目标基础分类模型,所述被移除模型为在所述模型训练的过程中基于所述融合条件被移除的基础分类模型;
根据所述目标基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型。
7.根据权利要求1-6任意一项所述的方法,其特征在于,所述根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,包括:
将N个所述基础分类模型的模型分类权重进行统一的归一化处理,得到N个所述基础分类模型分别对应的归一化权重;
根据N个所述基础分类模型分别对应的归一化权重和样本特征生成所述内容样本的融合特征。
8.根据权利要求1-6任意一项所述的方法,其特征在于,N个所述基础分类模型在分类领域和分类类别上至少有一项不同。
9.根据权利要求1-6任意一项所述的方法,其特征在于,所述方法还包括:
获取所述分类场景下的待分类内容;
通过所述集成模型中的所述设置子模型,确定所述集成模型中基础分类模型分别对应的模型分类权重;
通过所述集成模型,根据所述集成模型中基础分类模型分别对应的模型分类权重和所述待分类内容的内容特征,生成所述待分类内容的融合特征;
根据所述待分类内容的融合特征,通过所述集成模型中的所述分类子模型确定所述待分类内容的内容分类结果。
10.根据权利要求1所述的方法,其特征在于,所述根据分类场景下的内容样本,通过N个所述基础分类模型分别获取所述内容样本的样本特征,包括:
根据所述分类场景下的所述内容样本,通过N个所述基础分类模型的中间层获取对应的输出数据作为所述内容样本的所述样本特征。
11.一种模型确定装置,其特征在于,所述装置包括:获取模块、第一生成模块、训练模块和第二生成模块;
所述获取模块,用于根据分类场景下的内容样本,通过N个基础分类模型分别获取所述内容样本的样本特征;所述内容样本具有与所述分类场景的内容分类目标相关的样本标签,N>1;所述内容样本包括图片、视频、文本及语音中的一种或者多种;
所述第一生成模块,用于根据N个所述基础分类模型的模型分类权重和样本特征生成所述内容样本的融合特征,所述模型分类权重是通过初始设置子模型确定的,用于标识所对应基础分类模型对所述内容分类目标的影响程度;
所述训练模块,用于通过初始分类子模型确定所述融合特征对应的预测结果,并基于所述预测结果和所述样本标签的差异,对所述初始分类子模型和所述初始设置子模型进行模型训练,得到分类子模型和设置子模型;所述初始分类子模型是根据所述内容分类目标确定的,所述初始分类子模型用于结合所述融合特征对所述内容样本进行分类;
所述第二生成模块,用于根据N个所述基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型,所述集成模型用于对所述分类场景下的内容进行基于所述内容分类目标的分类服务;
针对模型训练过程中的第j个内容样本,N个所述基础分类模型中第i个基础分类模型的模型分类权重,所述第一生成模块具体用于:
根据所述第j个内容样本,通过所述初始设置子模型确定所述第i个基础分类模型的第j个模型分类权重,所述第j个模型分类权重用于标识在对所述第j个内容样本进行基于所述内容分类目标的分类预测时,所述第i个基础分类模型对所述内容分类目标的影响程度;
所述第一生成模块中涉及的所述第j个模型分类权重包括风格适配权重或特征适配权重中的至少一个,所述风格适配权重用于标识在所述内容分类目标下,针对所述第j个内容样本的内容风格,所述第i个基础分类模型处理所述第j个内容样本的适配程度;
所述特征适配权重用于标识在所述内容分类目标下,所述第i个基础分类模型处理所述第j个内容样本的样本特征的适配程度。
12.根据权利要求11所述的装置,其特征在于,当所述第j个模型分类权重包括风格适配权重时,所述初始设置子模型包括初始风格决策模块,所述第一生成模块具体用于:
根据所述第j个内容样本,通过所述初始风格决策模块确定所述第i个基础分类模型的所述风格适配权重。
13.根据权利要求11所述的装置,其特征在于,当所述第j个模型分类权重包括特征适配权重时,所述初始设置子模型包括初始特征决策模块,所述第一生成模块具体用于:
获取所述第i个基础分类模型对所述第j个内容样本提取的样本特征;
根据所述第j个内容样本的样本特征,通过所述初始特征决策模块确定所述第i个基础分类模型的所述特征适配权重。
14.根据权利要求11所述的装置,其特征在于,所述第一生成模块具体用于:
当所述第j个模型分类权重包括所述风格适配权重和所述特征适配权重时,所述第j个模型分类权重是根据所述风格适配权重和所述特征适配权重之和确定的。
15.根据权利要求11所述的装置,其特征在于,针对N个所述基础分类模型中的第i个基础分类模型,所述装置用于:
确定所述第i个基础分类模型在模型训练的过程中,被所述初始设置子模型确定的模型分类权重集合;
若根据所述模型分类权重集合中的模型分类权重确定不满足融合条件,在所述模型训练的过程中移除所述第i个基础分类模型。
16.根据权利要求15所述的装置,其特征在于,所述第二生成模块具体用于:
将N个所述基础分类模型中除了被移除模型之外的确定为目标基础分类模型,所述被移除模型为在所述模型训练的过程中基于所述融合条件被移除的基础分类模型;
根据所述目标基础分类模型、所述分类子模型和所述设置子模型,生成用于所述内容分类目标的集成模型。
17.根据权利要求11-16任意一项所述的装置,其特征在于,所述第一生成模块具体用于:
将N个所述基础分类模型的模型分类权重进行统一的归一化处理,得到N个所述基础分类模型分别对应的归一化权重;
根据N个所述基础分类模型分别对应的归一化权重和样本特征生成所述内容样本的融合特征。
18.根据权利要求11-16任意一项所述的装置,其特征在于,所述装置中的N个所述基础分类模型在分类领域和分类类别上至少有一项不同。
19.根据权利要求11-16任意一项所述的装置,其特征在于,所述装置具体用于:
获取所述分类场景下的待分类内容;
通过所述集成模型中的所述设置子模型,确定所述集成模型中基础分类模型分别对应的模型分类权重;
通过所述集成模型,根据所述集成模型中基础分类模型分别对应的模型分类权重和所述待分类内容的内容特征,生成所述待分类内容的融合特征;
根据所述待分类内容的融合特征,通过所述集成模型中的所述分类子模型确定所述待分类内容的内容分类结果。
20.根据权利要求11所述的装置,其特征在于,所述获取模块具体用于:
根据所述分类场景下的所述内容样本,通过N个所述基础分类模型的中间层获取对应的输出数据作为所述内容样本的所述样本特征。
21.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于根据所述计算机程序执行权利要求1-10中任意一项所述的方法。
22.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序在被计算机设备执行时实现执行权利要求1-10中任意一项所述的方法。
23.一种包括计算机程序的计算机程序产品,当其在计算机设备上运行时,使得所述计算机设备执行权利要求1-10中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410314286.4A CN117932497B (zh) | 2024-03-19 | 2024-03-19 | 一种模型确定方法和相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410314286.4A CN117932497B (zh) | 2024-03-19 | 2024-03-19 | 一种模型确定方法和相关装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117932497A CN117932497A (zh) | 2024-04-26 |
CN117932497B true CN117932497B (zh) | 2024-06-25 |
Family
ID=90754079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410314286.4A Active CN117932497B (zh) | 2024-03-19 | 2024-03-19 | 一种模型确定方法和相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117932497B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114241234A (zh) * | 2021-12-01 | 2022-03-25 | 海南神灯网络技术有限公司 | 细粒度图像分类方法、装置、设备及介质 |
CN117216542A (zh) * | 2023-05-19 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 一种模型训练方法和相关装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111104514B (zh) * | 2019-12-23 | 2023-04-25 | 北京百度网讯科技有限公司 | 文档标签模型的训练方法及装置 |
CN115601629A (zh) * | 2022-10-31 | 2023-01-13 | 杭州网易智企科技有限公司(Cn) | 模型训练方法、图像识别方法、介质、装置和计算设备 |
CN117235633A (zh) * | 2023-09-13 | 2023-12-15 | 中国平安财产保险股份有限公司 | 机构分类方法、装置、计算机设备及存储介质 |
-
2024
- 2024-03-19 CN CN202410314286.4A patent/CN117932497B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114241234A (zh) * | 2021-12-01 | 2022-03-25 | 海南神灯网络技术有限公司 | 细粒度图像分类方法、装置、设备及介质 |
CN117216542A (zh) * | 2023-05-19 | 2023-12-12 | 腾讯科技(深圳)有限公司 | 一种模型训练方法和相关装置 |
Also Published As
Publication number | Publication date |
---|---|
CN117932497A (zh) | 2024-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112131978B (zh) | 一种视频分类方法、装置、电子设备和存储介质 | |
US11741711B2 (en) | Video classification method and server | |
WO2020177673A1 (zh) | 一种视频序列选择的方法、计算机设备及存储介质 | |
WO2021238722A1 (zh) | 资源推送方法、装置、设备及存储介质 | |
CN111930992A (zh) | 神经网络训练方法、装置及电子设备 | |
CN111709497B (zh) | 一种信息处理方法、装置及计算机可读存储介质 | |
EP3886037B1 (en) | Image processing apparatus and method for style transformation | |
CN111368101B (zh) | 多媒体资源信息的展示方法、装置、设备以及存储介质 | |
CN113254684B (zh) | 一种内容时效的确定方法、相关装置、设备以及存储介质 | |
CN113807399A (zh) | 一种神经网络训练方法、检测方法以及装置 | |
Mahmood et al. | Mobile cloud based-framework for sports applications | |
CN112418302A (zh) | 一种任务预测方法及装置 | |
CN114610677B (zh) | 一种转换模型的确定方法和相关装置 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
CN115905613A (zh) | 音视频多任务学习、评估方法、计算机设备及介质 | |
CN114611692A (zh) | 模型训练方法、电子设备以及存储介质 | |
Jiang et al. | Cross-level reinforced attention network for person re-identification | |
CN118038125A (zh) | 一种多模态信息打标方法、装置、设备、存储介质及产品 | |
CN117312630A (zh) | 推荐信息的获取方法、模型训练方法、装置、电子设备及存储介质 | |
CN113515994A (zh) | 视频特征提取方法、装置、设备以及存储介质 | |
CN117350366A (zh) | 一种网络模型构建方法以及相关设备 | |
CN117932497B (zh) | 一种模型确定方法和相关装置 | |
CN116956996A (zh) | 数据处理方法、装置、介质及设备 | |
CN114282606A (zh) | 对象识别方法、装置、计算机可读存储介质及计算机设备 | |
CN113704544A (zh) | 一种视频分类方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |