CN114936327B - 元素识别模型的获取方法、装置、计算机设备和存储介质 - Google Patents
元素识别模型的获取方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN114936327B CN114936327B CN202210865805.7A CN202210865805A CN114936327B CN 114936327 B CN114936327 B CN 114936327B CN 202210865805 A CN202210865805 A CN 202210865805A CN 114936327 B CN114936327 B CN 114936327B
- Authority
- CN
- China
- Prior art keywords
- value
- sample data
- prediction probability
- predicted
- pooling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 99
- 238000003860 storage Methods 0.000 title claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 150
- 238000012549 training Methods 0.000 claims abstract description 65
- 238000004590 computer program Methods 0.000 claims abstract description 20
- 238000011176 pooling Methods 0.000 claims description 155
- 230000008569 process Effects 0.000 claims description 38
- 230000000873 masking effect Effects 0.000 claims description 34
- 238000012163 sequencing technique Methods 0.000 claims description 16
- 230000036961 partial effect Effects 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 18
- 238000013473 artificial intelligence Methods 0.000 abstract description 13
- 239000000523 sample Substances 0.000 description 211
- 230000006870 function Effects 0.000 description 31
- 230000011218 segmentation Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 19
- 230000004913 activation Effects 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 12
- 239000000463 material Substances 0.000 description 12
- 239000013598 vector Substances 0.000 description 9
- 238000000605 extraction Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 241000282414 Homo sapiens Species 0.000 description 3
- 230000006399 behavior Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 210000005036 nerve Anatomy 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
- Traffic Control Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及一种元素识别模型的获取方法、装置、计算机设备、存储介质和计算机程序产品,本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。所述方法包括:获取样本数据,以及样本数据的真实元素标签;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值;根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率;根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型。采用本方法能够提升训练效率以及可靠性。
Description
技术领域
本申请涉及互联网应用技术领域,特别是涉及一种元素识别模型的获取方法、装置、计算机设备和存储介质。
背景技术
近些年来互联网发展迅速,用户会花费大量的时间接收互联网信息,得益于此,推荐信息也取得了长足的发展,然而素材视频往往包含一些特定元素,例如填充形式以及转场等,那么识别素材中的元素标签既可以用于推荐信息的推送,也可以用于推荐信息的创意,因此对推荐信息中所包括的元素标签进行识别十分重要。而素材视频中的一个样本可能包含多个标签,而不同标签之间会因为训练样本分布和学习难度不同存在标签挤压的情况,因此可能出现预测分数很高但错误的情况,并且过拟合情况也是需要考虑的问题。
发明人发现,对推荐信息中所包括的元素标签进行识别的通常做法是,使用图像分类网络提取图像特征后直接加多标签分类支路,通过二分类交叉熵计算分类损失以得到多标签分类的解说。然而,在实际业务场景,不同标签的数据集质量不同以及不同标签对数据的要求不同,并且由于数据分布存在差异导致模型训练可能产生较多分高错误,分高错误会影响模型的表征能力,因此模型在训练时某个标签的预测分数较高但属于错误情况,往往通过损失加权等方法进行改善,但这依赖于人工观察与调整,从而导致元素识别模型训练的效率低下以及可靠性不高的问题。因此,如何提升元素识别模型训练的效率以及可靠性亟需解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提升训练效率以及可靠性的元素识别模型的获取方法、装置、计算机设备和存储介质。
第一方面,本申请提供了一种元素识别模型的获取方法。所述方法包括:
获取样本数据,以及样本数据的真实元素标签;
基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;
根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
在其中一个实施例中,对第一预测值进行掩码处理,获取样本数据的第二预测值,包括:
对样本数据的类型属于各元素标签的预测值进行排序,得到各预测值的排序结果;
根据各预测值的排序结果,对各预测值进行掩码处理;
基于进行掩码处理后的各预测值,获得第二预测值。
在其中一个实施例中,根据各预测值的排序结果,对各预测值进行掩码处理,包括:
根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预设数量;
对各待掩码值进行掩码处理。
在其中一个实施例中,根据各预测值的排序结果,对各预测值进行掩码处理,包括:
根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预测值的数量的预设比例;
对各待掩码值进行掩码处理。
在其中一个实施例中,初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;
基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,包括:
通过特征处理层提取样本数据的数据特征;
通过第一池化层对数据特征进行第一池化处理,并基于第一池化处理后的数据特征,获取第一预测值;
通过二次学习模块对第一预测值进行掩码处理,获取第二预测值。
在其中一个实施例中,根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型,包括:
根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值;
根据第二预测概率与各真实元素标签,计算得到样本数据的第二损失值,第一损失值与第二损失值的损失类型不同;
基于第一损失值与第二损失值,更新初始元素识别模型的模型参数。
在其中一个实施例中,根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值,包括:
对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理,维度调整处理后的第一预测概率的维度,与维度调整处理后的各真实元素标签的维度一致;
根据维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签,计算得到第一损失值。
在其中一个实施例中,初始元素识别模型还包括第二池化层;
方法还包括:
通过第二池化层对数据特征进行第二池化处理,并基于第二池化处理后的数据特征,获取样本数据的第三预测概率,第一池化处理与第二池化处理的池化类型不同;
基于第一损失值与第二损失值,更新初始元素识别模型的模型参数,包括:
根据第三预测概率与各真实元素标签,计算得到样本数据的第三损失值;
基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数。
在其中一个实施例中,初始元素识别模型还包括丢弃层;
基于第二池化处理后的数据特征,获取样本数据的第三预测概率,包括:
通过丢弃层对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
在其中一个实施例中,初始元素识别模型还包括对比正则模块;
基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数,包括:
通过对比正则模块根据第二预测概率与第三预测概率,计算得到样本数据的第四损失值;
基于第一损失值、第二损失值、第三损失值、以及第四损失值,更新初始元素识别模型的模型参数。
在其中一个实施例中,基于初始元素识别模型获得元素识别模型,包括:
基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。
第二方面,本申请还提供了一种元素识别模型的获取装置。所述装置包括:
获取模块,用于获取样本数据,以及样本数据的真实元素标签;并基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;并根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
模型训练模块,用于根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取样本数据,以及样本数据的真实元素标签;
基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;
根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取样本数据,以及样本数据的真实元素标签;
基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;
根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取样本数据,以及样本数据的真实元素标签;
基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;
根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
上述元素识别模型的获取方法、装置、计算机设备、存储介质和计算机程序产品,获取样本数据,以及样本数据的真实元素标签;基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。对第一预测值进行掩码处理,并且对掩码处理得到的第二预测值进行二次学习,通过二次学习避免分高错误,保证元素识别模型训练的可靠性,并且在训练过程中不需要手工筛选特征,从而提升元素识别模型训练的效率。
附图说明
图1为一个实施例中元素识别模型的获取方法的应用环境图;
图2为一个实施例中元素识别模型的获取方法的流程示意图;
图3为一个实施例中样本数据的实施例示意图;
图4为一个实施例中获取样本数据的第二预测值的部分流程示意图;
图5为一个实施例中对各预测值进行掩码处理的部分流程示意图;
图6为一个实施例中初始元素识别模型的模型结构示意图;
图7为另一个实施例中获取样本数据的第二预测值的部分流程示意图;
图8为一个实施例中更新初始元素识别模型的模型参数的流程示意图;
图9为一个实施例中计算第一损失值的实施例示意图;
图10为一个实施例中计算得到第一损失值以及第二损失值的流程示意图;
图11为一个实施例中计算得到第一损失值的流程示意图;
图12为一个实施例中拉直处理的流程示意图;
图13为另一个实施例中初始元素识别模型的模型结构示意图;
图14为一个实施例中元素识别模型的获取方法的部分流程示意图;
图15为又一个实施例中初始元素识别模型的模型结构示意图;
图16为一个实施例中获取样本数据的第三预测概率的部分流程示意图;
图17为再一个实施例中初始元素识别模型的模型结构示意图;
图18为另一个实施例中更新初始元素识别模型的模型参数的流程示意图;
图19为一个实施例中基于初始元素识别模型获得元素识别模型的流程示意图;
图20为一个实施例中元素识别模型的获取方法的完整流程示意图;
图21为一个实施例中元素识别模型的获取装置的结构框图;
图22为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
以及自动驾驶技术通常包括高精地图、环境感知、行为决策、路径规划、运动控制等技术,自定驾驶技术有着广泛的应用前景。随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
基于此,本申请实施例提供的方案涉及人工智能的机器学习技术,具体通过如下实施例进行说明:
本申请实施例提供的元素识别模型的获取方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。
具体地,以应用于服务器104作为示例进行说明,那么服务器104可以从数据存储系统中获取样本数据,以及样本数据的真实元素标签,然后服务器104基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值,再基于激活函数根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,基于此,服务器104根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,该元素识别模型用于识别数据的元素标签。
其次,以应用于具有高算力的终端102作为示例进行说明,那么终端102可以通过与服务器104之间的通信获取样本数据,以及样本数据的真实元素标签,然后终端102基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值,再基于激活函数根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,基于此,终端102根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备、飞行器等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。且本申请实施例可应用于各种场景,包括但不限于云技术、人工智能、智慧交通、辅助驾驶等。
进一步地,下面将介绍本申请实施例具体应用于对推荐信息所用素材的元素标签进行识别的场景。具体地,通过本申请实施例所提供的元素识别模型的获取方法,所得到的元素识别模型能够识别虚拟产品、转场以及推广页等出现在推荐信息的素材中的具有推广或具有页面拓展性的元素标签。
例如,在推荐信息推送过程中,推荐信息推送主上传推荐信息和推荐信息落地页后,通过训练得到的元素识别模型对推荐信息分析识别,以得到推荐信息中素材对应的元素标签。基于此,通过训练得到的元素识别模型对用户浏览推荐信息或点击推荐信息的历史行为信息进行元素识别,可以得到用户感兴趣的元素标签,因此,在推荐信息所包括的素材对应的元素标签命中用户感兴趣的元素标签,可以在该用户的推荐信息推送库中对所命中的元素标签进行加权处理,以便于后续向用户更多推荐所包括的素材类型属于此类元素标签的推荐信息。
其次,在推荐信息制作过程中,由于推荐信息往往由多幕场景构成,因此,通过训练得到的元素识别模型基于不同维度对场景构成对应的元素标签进行识别拆分,相同的元素标签的素材可以在推荐信息制作过程中进行扩充替换。例如,元素识别模型识别到推广页,那么在制作推荐信息时,可以基于需求将元素标签命中推广页的素材替换调整为元素标签为推广页的其他素材。应理解,前述示例介绍仅用于对本申请实施例具体应用场景进行介绍,不应该理解为限定。
在一个实施例中,如图2所示,提供了一种元素识别模型的获取方法,以该方法应用于图1中的服务器104为例进行说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤202,获取样本数据,以及样本数据的真实元素标签。
其中,样本数据包括但不限于图像数据、文本数据或视频数据,且每个样本数据中具体包括至少一种样本素材。因此,真实元素标签具体用于描述样本数据中样本素材的类型。例如,以应用于对推荐信息所用素材的元素标签进行识别的场景作为示例,如图3所示出的样本数据具体为图像数据,且样本数据3包括样本素材302、样本素材304以及样本素材306,且样本素材302具体为虚拟产品,而样本素材304以及样本素材306具体为推广页,因此样本数据302的真实元素标签可以包括虚拟产品以及推广页。
具体地,服务器首先获取样本数据,样本数据可以为从数据库下载的多个样本数据,也可以为通过终端上传的样本数据,此处不做限定。其次,在获取样本数据时,还能够获取样本数据的真实元素标签,该真实元素标签是对样本数据进行人工标注得到的。
步骤204,基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值。
其中,第一预测值(logits)包括样本数据的类型属于各元素标签的预测值,例如,具体元素标签包括元素标签A1、元素标签A2以及元素标签A3,那么第一预测值包括样本数据的类型属于元素标签A1的预测值,样本数据的类型属于元素标签A2的预测值,以及样本数据的类型属于元素标签A3的预测值。
其次,掩码(Mask)处理具体为:对样本数据的类型属于各元素标签的预测值中的部分预测值进行mask,被mask的部分预测值可以为数值较高的预测值,或者,数值较低的预测值,或者低于预设数值的预测值,此处不做限定。因此,第二预测值具体为对第一预测值进行掩码处理后的预测值,第二预测值中也包括样本数据的类型属于元素标签的预测值,但第二预测值中的预测值数量小于第一预测值中的预测值数量。
具体地,服务器将样本数据作为初始元素识别模型的输入,初始元素识别模型能够由此获取样本数据的类型属于各元素标签的预测值。并且从样本数据的类型属于各元素标签的预测值中选择需要进行掩码的预测值,再具体对需要进行掩码的预测值进行掩码处理,以获取样本数据的第二预测值。例如,服务器所获取样本数据的第一预测值包括:样本数据的类型属于元素标签A1的预测值,样本数据的类型属于元素标签A2的预测值,以及样本数据的类型属于元素标签A3的预测值,而经过掩码处理后,样本数据的第二预测值包括样本数据的类型属于元素标签A1的预测值,以及样本数据的类型属于元素标签A3的预测值,即服务器具体对样本数据的类型属于元素标签A2的预测值进行掩码处理。
应理解,初始元素识别模型可以为已训练的元素识别模型。
步骤206,根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率。
其中,第一预测概率包括样本数据的类型属于各元素标签的预测概率,例如,具体元素标签包括元素标签A1、元素标签A2以及元素标签A3,那么第一预测概率包括样本数据的类型属于元素标签A1的预测概率,样本数据的类型属于元素标签A2的预测概率,以及样本数据的类型属于元素标签A3的预测概率。
具体地,服务器基于激活函数对第一预测值进行激活处理后得到第一预测概率,同理,服务器基于激活函数对第二预测值进行激活处理后得到第二预测概率,且第二预测概率中也包括样本数据的类型属于元素标签的预测概率,但第二预测概率中的预测概率数量小于第一预测概率中的预测概率数量。
步骤208,根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
具体地,服务器根据第一预测概率与各真实元素标签计算损失,并根据第二预测概率与各真实元素标签计算损失,通过前述计算得到的两个损失值对初始元素识别模型的模型参数进行更新,具体地,服务器根据两个损失值判断初始元素识别模型的损失函数是否达到收敛条件,若未达到收敛条件,则利用前述两个损失值更新初始元素识别模型的模型参数。
基于此,直至初始元素识别模型的损失函数达到收敛条件,则根据最后一次对模型参数进行更新后获得的模型参数获得元素识别模型,从而在实际应用中通过训练得到的元素识别模型识别数据的元素标签。
前述损失函数的收敛条件可以为损失函数的值小于或等于第一预设阈值,作为示例,例如第一预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值。也可以为损失函数的相邻两次的值的差值小于或等于第二预设阈值,第二阈值的取值可以与阈值的取值相同或不同,作为示例,例如第二预设阈值的取值可以为0.005、0.01、0.02或其它趋近于0的数值等。也可以为初始元素识别模型的模型参数更新此处达到更新迭代阈值等,在实际应用中,还可以采用其它收敛条件等,此处不做限定。
上述元素识别模型的获取方法中,对第一预测值进行掩码处理,并且对掩码处理得到的第二预测值进行二次学习,通过二次学习避免分高错误,保证元素识别模型训练的可靠性,并且在训练过程中不需要手工筛选特征,从而提升元素识别模型训练的效率。
在一个实施例中,如图4所示,步骤204中,对第一预测值进行掩码处理,获取样本数据的第二预测值,具体包括:
步骤402,对样本数据的类型属于各元素标签的预测值进行排序,得到各预测值的排序结果。
其中,各预测值的排序结果具体为:各预测值基于预测值的概率数值从高到低依次排序的结果,或,各预测值基于预测值的概率数值从低到高依次排序的结果,前述预测值的大小能够反映样本数据的类型与元素标签的相似性。
具体地,服务器基于各预测值的概率数值,对样本数据的类型属于各元素标签的预测值进行排序,以得到各预测值的排序结果。以基于预测值的概率数值从高到低依次排序为例,若第一预测值包括样本数据的类型属于元素标签A1的预测值,样本数据的类型属于元素标签A2的预测值,以及样本数据的类型属于元素标签A3的预测值,且属于元素标签A1的预测值为70,属于元素标签A2的预测值为20,以及属于元素标签A3的预测值为80。因此,各预测值的排序结果具体为:属于元素标签A3的预测值、属于元素标签A1的预测值,以及属于元素标签A2的预测值。
步骤404,根据各预测值的排序结果,对各预测值进行掩码处理。
具体地,服务器根据步骤402所得到的排序结果,基于需求对各预测值进行掩码处理。通过前述实施例可知,掩码处理具体为:对样本数据的类型属于各元素标签的预测值中的部分预测值进行mask。
步骤406,基于进行掩码处理后的各预测值,获得第二预测值。
具体地,服务器通过步骤406可以得到进行掩码处理后的各预测值,由此能够获得第二预测值。例如,以被mask的部分预测值为低于预设数值的预测值,且预设数值为50为例,若各预测值的排序结果具体为:属于元素标签A3的预测值(80),属于元素标签A1的预测值(70),以及属于元素标签A2的预测值(20),那么可以确定要对属于元素标签A2的预测值进行掩码处理,那么掩码处理后的可以得到属于元素标签A1的预测值以及属于元素标签A3的预测值,服务器由此获取第二预测值,且第二预测值具体包括属于元素标签A1的预测值以及属于元素标签A3的预测值。
本实施例中,各预测值的排序结果能够准确描述各预测值具体的概率数值,而各预测值的大小能够反映样本数据的类型与元素标签的相似性,因此基于排序结果进行掩码操作,能够避免引入过多冗余参数,在降低第二预测值数据量的基础上,还能够提升所得到的第二预测值的可靠性,从而在提升元素识别模型训练的效率的基础上,还能够保证元素识别模型训练的可靠性。
前面描述掩码(Mask)处理具体为:对样本数据的类型属于各元素标签的预测值中的部分预测值进行mask,下面将提供具体确定部分预测值的方法。在一个实施例中,如图5所示,步骤404,根据各预测值的排序结果,对各预测值进行掩码处理,包括:
步骤5021,根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预设数量。
其中,各预测值的排序结果具体为:各预测值基于预测值的值数值从高到低依次排序的结果。其次,待掩码值为需要被mask的预测值,即第二预测值中不存在待掩码值。
具体地,服务器具体根据各预测值基于预测值的值数值从高到低依次排序的结果,将排序靠后的预测值确定为待掩码值,该待掩码值的数量为预设数量。或者说,服务器具体根据各预测值基于预测值的值数值从高到低依次排序的结果,将排序靠前的预测值确定为不掩码值,剩下的预测值均为待掩码值。
例如,样本数据的类型属于各元素标签的预测值具体包括预测值1至预测值15,且预设数量具体为5,那么基于预测值1至预测值15的值数值从高到低依次排序,并且将排序靠后的5个预测值确定为待掩码值。
在另一个实施例中,步骤5022,根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预测值的数量的预设比例。
其中,各预测值的排序结果具体为:各预测值基于预测值的值数值从高到低依次排序的结果。
具体地,服务器具体根据各预测值基于预测值的值数值从高到低依次排序的结
果,将排序靠后的预测值确定为待掩码值,此时待掩码值的数量为预测值的数量的预设比
例。例如,待掩码值的数量与预测值的数量之间的预设比例为1:4,因此第一预测值中包括
20个预测值时,可以确定需要确定5()个待掩码值,由此,服务器将20个预测值中
值数值靠后的5个预测值,确定为待掩码值。
应理解,在实际应用中,也可以先从各预测值中确定不进行掩码的预测值,再将剩下的预测值确定为待掩码值。以及可以采用其他确定待掩码值的方法,此处不进行穷举。
步骤504,对各待掩码值进行掩码处理。
具体地,服务器对各待掩码值进行掩码处理,由此可以得到不包括各待掩码值的第二预测值。
本实施例中,通过各预测值基于预测值的具体数值从高到低依次排序的结果,对排序靠后的预测值进行掩码处理,在避免引入过多冗余参数的基础上保证可靠数据的保存,从而在降低第二预测值数据量的基础上,还能够提升所得到的第二预测值的可靠性。基于此,在提升元素识别模型训练的效率的基础上,还能够保证元素识别模型训练的可靠性。
在一个实施例中,如图6所示,初始元素识别模型600包括特征处理层601、第一池化层602以及二次学习模块603。基于图6所示出的初始元素识别模型,如图7所示,步骤204,基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,包括:
步骤702,通过特征处理层提取样本数据的数据特征。
其中,在样本数据为视频数据的情况下,由于视频数据通常由多个图像帧组成,此时数据特征包括组成视频数据的各图像帧对应的特征。
具体地,服务器将样本数据作为初始元素识别模型600的输入,然后具体通过初始
元素识别模型600中的特征处理层601提取样本数据的数据特征。在实际应用中,由于大迁
移模型(BiT,Big Transfer)是一组经过预先训练的模型,在通过大量通用数据进行预训练
的情况下,BiT的表征能力通过预先训练的优化可以得到大幅度提升,因此在样本数据具体
为图像数据或视频数据的情况下,那么特征处理层601具体为BiT。例如,样本数据为视频数
据的情况下,服务器先对样本数据进行切帧处理,得到多个图像帧,然后通过特征处理层
601(即BiT)对每一图像帧进行特征提取,由此产生各图像帧对应的(特征),而样本
数据的数据特征包括各图像帧对应的。
应理解,在实际应用中,除BiT外还可以使用不同的图像深度模型,例如视觉迁移模型(ViT,Vision Transformer)以及复合模型缩放(Efficient Net)等,此处不做限定。
步骤704,通过第一池化层对数据特征进行第一池化处理,并基于第一池化处理后的数据特征,获取第一预测值。
其中,第一池化层可以为最大池化(max-pooling)层,因此第一池化处理可以为最大池化处理。其次,第一池化层也可以为平均池化(mean-pooling)层,因此第一池化处理可以为平均池化处理。
具体地,服务器将通过特征处理层601向第一池化层602输入所提取的样本数据的数据特征,然后通过第一池化层602对数据特征进行第一池化处理,从而得到第一池化处理后的数据特征,并基于第一池化处理后的数据特征产生第一预测值。
优选地,考虑到特征提取的误差:邻域大小受限造成的估计值方差增大,因此第一池化层602具体为平均池化层。
应理解,在实际应用中,考虑到样本数据的数据特征存在耦合度太高,从而导致进行预测得到第一预测值不够准确可靠性情况,因此还可以在第一池化层602与二次学习模块603之间加入丢弃层(Dropout),然后服务器通过丢弃层对第一池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第一预测值。通过Dropout可以强迫一个神经单元,和随机挑选出来的其他神经单元共同工作,消除减弱了神经元节点间的联合适应性,增强了泛化能力。
步骤706,通过二次学习模块对第一预测值进行掩码处理,获取第二预测值。
具体地,二次学习模块的目的在于通过数据量更少的类别,或数据量更少的特征进行学习,以获得更好的准确性。基于此,服务器具体通过二次学习模块603对步骤704所获取的第一预测值进行掩码处理,以输出第二预测值。具体掩码处理的方式与前述实施例类似,此处不再赘述。
本实施例中,特征处理层能够更为准确高效的提取样本数据的数据特征,在保证样本数据中的重要特征被保留下来的基础上,避免冗余特征与保证模型的训练效率,并且考虑在特征提取过程中邻域大小受限造成的估计值方差增大的误差,具体通过平均池化层减小前述误差,更多的样本数据的信息,提升第一池化处理后的数据特征的数据可靠性以及完成度,基于此所得到的第一预测值具有更好的可靠性以及准确度,以提升本方案的可靠性以及准确度。
在一个实施例中,如图8所示,步骤206中,根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,具体包括:
步骤802,根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值。
其中,第一损失值用于描述第一预测概率与各真实元素标签之间的差异。
具体地,服务器根据第一预测概率与各真实元素标签,具体计算第一预测概率与各真实元素标签之间的差异,以得到样本数据的第一损失值。计算第一预测概率与各真实元素标签之间的差异可以为:计算第一预测概率与各真实元素标签之间的Lovasz损失,Lovasz损失具体是对图像语义分割指标IoU进行优化的一个损失,即具体图像语义分割损失是对IoU进行优化,而IoU的计算和F值的计算具有等效性,因此第一预测概率与各真实元素标签之间的Lovasz损失具体为对F值进行优化。
为便于理解,图9所示,图9中(1)图示出的是A区域以及B区域,A区域可以为图像语
义分割任务中的真实范围(即各真实元素标签),B区域可以为图像语义分割任务中的预测
范围(即第一预测概率),且A区域以及B区域之间存在交集(即),以及A区域以及B区域
之间存在并集(即),交集()为各真实元素标签与第一预测概率之间相似度大于
相似度阈值的区域范围,并集(即)为各真实元素标签与第一预测概率之间相似度小
于相似度阈值的区域范围,因此基于公式902可知,Lovasz损失是对IoU进行优化。
其次,F值具体为F-Measure为精确率(Precision)和召回率(Recall)的加权调和平均,而图9中(2)图示出的是FP区域、FN区域以及TP区域,且FP区域与TP区域可以组成图像语义分割任务中的真实范围(即各真实元素标签),FN区域与TP区域可以组成图像语义分割任务中的预测范围(即第一预测概率),且TP区域具体为各真实元素标签与第一预测概率之间相似度大于相似度阈值的区域范围,与前述类似,FP区域与TP区域为各真实元素标签与第一预测概率之间相似度小于相似度阈值的区域范围,因此基于公式904可知,公式902中优化IoU可以等效为优化F值。
步骤804,根据第二预测概率与各真实元素标签,计算得到样本数据的第二损失值,第一损失值与第二损失值的损失类型不同。
其中,第二损失值用于描述第二预测概率与各真实元素标签之间的差异,且第一损失值与第二损失值的损失类型不同。例如,第一损失值的具体损失类型为Lovasz损失,那么第二损失值的损失类型可以为二分类交叉熵(BCE,Binary Cross Entropy)损失。应理解,前述示例仅用于理解本方案,第一损失值与第二损失值的具体损失类型此处不做限定,只要第一损失值与第二损失值的损失类型不同即可。
具体地,服务器根据第二预测概率与各真实元素标签,具体计算第二预测概率与各真实元素标签之间的差异,以得到样本数据的第二损失值。计算第二预测概率与各真实元素标签之间的差异可以为:计算第二预测概率与各真实元素标签之间的BCE损失。
为了便于理解,如图10所示,先通过第一池化层对数据特征进行第一池化处理,得到第一池化处理后的数据特征1001,再基于第一池化处理后的数据特征1001,获取第一预测值1002,并对第一预测值1002进行掩码处理,以得到第二预测概值1003,再基于激活函数对第一预测值1002进行激活处理得到第一预测概率1004,同理。基于激活函数对第二预测概值1003进行激活处理得到第二预测概率1005。基于此,计算第一预测概率1004与真实元素标签1006的第一损失值1007,以及计算第二预测概率1005与真实元素标签1006的第二损失值1008。
步骤806,基于第一损失值与第二损失值,更新初始元素识别模型的模型参数。
具体地,服务器根据第一损失值与第二损失值判断初始元素识别模型的损失函数是否达到收敛条件,若未达到收敛条件,则利用第一损失值与第二损失值更新初始元素识别模型的模型参数。基于此,直至初始元素识别模型的损失函数达到收敛条件,则根据最后一次对模型参数进行更新后获得的模型参数获得元素识别模型,从而在实际应用中通过训练得到的元素识别模型识别数据的元素标签。
本实施例中,通过考虑第一预测概率与各真实元素标签之间的差异,以及第二预测概率与各真实元素标签之间的差异,以通过二次学习避免分高错误,进一步地保证进行元素识别模型训练的可靠性。
在一个实施例中,如图11所示,步骤802,根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值,包括:
步骤1102,对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理,维度调整处理后的第一预测概率的维度,与维度调整处理后的各真实元素标签的维度一致。
其中,维度调整处理后的第一预测概率的维度为一维,且维度调整处理后的各真实元素标签的维度为一维。
具体地,通过前述示例可知,计算第一预测概率与各真实元素标签之间的差异可以为:计算第一预测概率与各真实元素标签之间的Lovasz损失,Lovasz损失具体是对图像语义分割指标IoU进行优化的一个损失,即具体图像语义分割损失是对IoU进行优化,而图像语义分割最后输出的预测概率和真实元素标签都是二维二进制映射(binary map)的形式,为了保证引入图像语义分割损失的计算可行性,需要保证预测概率的维度和真实元素标签的维度一致。
基于此,服务器对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理。若维度为一维,那么维度调整处理具体为拉直处理,以使得维度调整处理后的第一预测概率为一维向量,以及维度调整处理后的多标签分类为一维向量,以保证形式一致性,因此服务器能够在计算得到第一损失值时具体使用图像语义分割损失。
为便于理解拉直处理,如图12所示,先对图像数据1202进行图像语义分割,以识别出图像数据1202的具体内容,如图像数据1202中包括“鸟”以及背景,由此得到图像语义分割后的图像数据1204,图像语义分割后的图像数据1204包括“鸟”以及为黑色的背景,然后基于图像语义分割后的图像数据1204,得到二进制映射形式的向量1206,对二进制映射形式的向量1206进行拉直处理,即可得到拉直处理后的向量1208,且拉直处理后的向量1208具体为一维向量。
步骤1104,根据维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签,计算得到第一损失值。
具体地,服务器通过前述类似方式,计算维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签之间的差异(Lovasz损失),从而得到第一损失值,此处不再赘述。
本实施例中,通过对第一预测概率以及各真实元素标签进行维度调整处理,保证能够通过维度一致的概率以及标签计算图像语义分割损失,以保证方案的可行性。其次,引入图像语义分割损失能够进一步地改善多标签预测效果,即通过发掘图像语义分割和多标签分类任务的相似性,对分高错误有一定的改善作用,且对F值有针对性优化作用,进一步地保证第一损失值的可靠性以及准确度,从而进一步地提升了模型训练的可靠性以及准确度。
在一个实施例中,如图13所示,初始元素识别模型600还包括第二池化层1302。基于此,如图14所示,元素识别模型的获取的方法还包括:
步骤1402,通过第二池化层对数据特征进行第二池化处理,并基于第二池化处理后的数据特征,获取样本数据的第三预测概率,第一池化处理与第二池化处理的池化类型不同。
其中,第一池化处理与第二池化处理的池化类型不同,例如,第二池化层为最大池化层,因此第二池化处理为最大池化处理,此时前述第一池化处理可以为平均池化处理或全局池化(global pooling)处理等不同于第二池化处理的池化类型的池化方式即可。
具体地,基于图13的示例可知,服务器将通过特征处理层601向第二池化层1302输入所提取的样本数据的数据特征,然后通过第二池化层1302对数据特征进行第二池化处理,从而得到第二池化处理后的数据特征,并基于第二池化处理后的数据特征产生第三概率值,再基于激活函数对第三概率值进行激活处理得到第三预测概率。
优选地,考虑到特征提取的误差:卷积层参数误差造成估计均值的偏移,因此第二池化层1302具体为最大池化层。
步骤806,基于第一损失值与第二损失值,更新初始元素识别模型的模型参数,包括:
步骤1404,根据第三预测概率与各真实元素标签,计算得到样本数据的第三损失值。
其中,第三损失值用于描述第三预测概率与各真实元素标签之间的差异,且第三损失值的损失类型与第一损失值的损失类型相同。例如,第一损失值的具体损失类型为Lovasz损失,那么第三损失值的损失类型也为Lovasz损失。应理解,前述示例仅用于理解本方案,第一损失值与第三损失值的具体损失类型此处不做限定,只要第一损失值与第三损失值的损失类型相同即可。
具体地,服务器根据第三预测概率与各真实元素标签,具体计算第三预测概率与各真实元素标签之间的差异,以得到样本数据的第三损失值。计算第三预测概率与各真实元素标签之间的差异可以为:计算第三预测概率与各真实元素标签之间的Lovasz损失,Lovasz损失具体是对图像语义分割指标IoU进行优化的一个损失,即具体图像语义分割损失是对IoU进行优化,而IoU的计算和F值的计算具有等效性,因此第三预测概率与各真实元素标签之间的Lovasz损失具体为对F值进行优化。具体与前述实施例类似,此处不再赘述。
步骤1406,基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数。
具体地,服务器根据第一损失值、第二损失值以及第三损失值判断初始元素识别模型的损失函数是否达到收敛条件,若未达到收敛条件,则利用第一损失值、第二损失值以及第三损失值更新初始元素识别模型的模型参数。基于此,直至初始元素识别模型的损失函数达到收敛条件,则根据最后一次对模型参数进行更新后获得的模型参数获得元素识别模型,从而在实际应用中通过训练得到的元素识别模型识别数据的元素标签。
本实施例中,不但考虑第一预测概率与各真实元素标签之间的差异,以及第二预测概率与各真实元素标签之间的差异,从而通过二次学习避免分高错误。还进一步地使用不同池化处理方法进行降维,即使用两个分类支路来近似集成学习,从而产生具有不同泛化能力的预测概率,在保证模型训练可靠性的基础上,增加训练得到元素识别模型的泛化能力。
在一个实施例中,如图15所示,初始元素识别模型600还包括丢弃层1502。基于此,如图16所示,步骤1402中,基于第二池化处理后的数据特征,获取样本数据的第三预测概率,具体包括:
步骤1602,通过丢弃层对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
具体地,考虑到样本数据的数据特征存在耦合度太高,从而导致进行预测得到第三预测概率不够准确可靠性情况,因此还可以在第二池化层1302后加入丢弃层(Dropout)1502。基于此,服务器通过丢弃层1502对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三概率值,再基于激活函数对第三概率值进行激活处理得到第三预测概率。
应理解,通过前述实施例可知,也可以在第一池化层602与二次学习模块603之间加入丢弃层(Dropout),然后服务器通过丢弃层对第一池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第一预测值,再基于激活函数对第一概率值进行激活处理得到第一预测概率。那么具体训练过程中,第一池化层602与二次学习模块603之间的丢弃层的dropout比率,与第二池化层1302后的丢弃层1502的dropout比率不同,能够进一步地提升模型泛化能力。
其次,本实施例描述引入了不同的池化处理方式以及不同的dropout比率,而在实际应用中,具体训练过程中还可以引入不同的噪声,比如:不同的数据增强、特征增强等,此处不进行详细描述。
本实施例中,增加丢弃层可以强迫一个神经单元,和随机挑选出来的其他神经单元共同工作,消除减弱了神经元节点间的联合适应性,进一步地增强训练得到的元素识别模型的泛化能力。
在一个实施例中,如图17所示,初始元素识别模型600还包括对比正则模块1702。基于此,如图18所述,步骤1406,基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数,包括:
步骤1802,通过对比正则模块根据第二预测概率与第三预测概率,计算得到样本数据的第四损失值。
其中,第四损失值用于描述第二预测概率与第三预测概率之间的差异。
具体地,服务器通过对比正则模块1702计算第二预测概率与第三预测概率之间的差异,以得到样本数据的第四损失值。由于第二预测概率与第三预测概率是通过不同的池化方式进行处理后的得到预测概率,为减少引入扰动对模型收敛性的影响,计算第二预测概率与第三预测概率之间的差异具体为使用相对熵(KL,Kullback-Leibler divergence)散度作为约束损失,KL散度用于度量第二预测概率与第三预测概率的相似程度,或者说度量第二预测概率与第三预测概率的相近程度。
基于此,由图17可知,第二池化层1302为最大池化层,且第一池化层602为平均池化层时,由于最大池化相较于平均池化对数据主体特征有更强的关注性,且通过前述实施例可知,丢弃层不同的dropout比率也具有不同泛化能力,因此需要对两个分类支路的预测概率结果进行约束。公式(1)为使用KL散度作为约束损失(即第四损失):
应理解,在实际应用中,还可以欧式距离以及余弦相似度等度量方法作为第四损失,此处不做限定。
步骤1804,基于第一损失值、第二损失值、第三损失值、以及第四损失值,更新初始元素识别模型的模型参数。
具体地,服务器根据一损失值、第二损失值、第三损失值、以及第四损失值判断初始元素识别模型的损失函数是否达到收敛条件,若未达到收敛条件,则利用一损失值、第二损失值、第三损失值、以及第四损失值更新初始元素识别模型的模型参数。基于此,直至初始元素识别模型的损失函数达到收敛条件,则根据最后一次对模型参数进行更新后获得的模型参数获得元素识别模型,从而在实际应用中通过训练得到的元素识别模型识别数据的元素标签。
本实施例中,不但考虑第一预测概率与各真实元素标签之间的差异,以及第二预测概率与各真实元素标签之间的差异,从而通过二次学习避免分高错误。还进一步地使用不同池化处理方法进行降维,即使用两个分类支路来近似集成学习,从而产生具有不同泛化能力的预测概率,在保证模型训练可靠性的基础上,增加训练得到元素识别模型的泛化能力。并且通过对比正则模块还需要对两个分类支路的预测概率进行约束,避免了集成学习和对比学习中多个模型引入的成倍的参数增长,以最简洁的形式完成了对比正则的效果,也就是保证模型训练结果准确度的基础上,还能够保证模型训练的效率。
在一个实施例中,如图19所示,在步骤206中,基于初始元素识别模型获得元素识别模型,具体包括:
步骤1902,基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。
其中,元素识别模型包括特征处理层、第一池化层以及二次学习模块,即元素识别模型以掩码处理后得到第二预测值,并基于激活函数对第二预测值进行激活处理得到第二预测概率,将第二预测概率作为预测结果。
具体地,由于初始元素识别模型包括特征处理层、第一池化层、第二池化层、二次学习模块、丢弃层以及正则对比模块等,而在实际元素识别过程中,元素识别模型具体需要包括特征处理层、第一池化层以及二次学习模块即可。具体处理可以为选择初始元素识别模型中的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。或丢弃初始元素识别模型中其他模块以及处理层以生成元素识别模型,此处不做限定。
基于此,识别数据的元素标签的具体过程为:获取待识别数据,然后通过特征处理层提取待识别数据的数据特征,并通过第一池化层对待识别数据的数据特征进行第一池化处理,并基于第一池化处理后的待识别数据的数据特征,获取待识别数据的第一预测值,再通过二次学习模块对第一预测值进行掩码处理,获取待识别数据的第二预测值,再基于激活函数对第二预测值进行激活处理得到第二预测概率,最后将待识别数据的第二预测概率确定为待识别数据的预测结果。
本实施例中,通过简化元素识别模型的模型结果,以提升元素识别效率。并且在具体元素识别过程中能够基于初始元素识别模型所学习的数据信息,也能够保证准确度。
基于前述实施例,下面将详细描述元素识别模型的完整训练流程,如图20所示,提供了一种元素识别模型的获取方法,以该方法应用于图1中的服务器104为例进行说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。且初始元素识别模型的结构如图17所示,本实施例中,该方法包括以下步骤:
步骤2001,获取样本数据,以及样本数据的真实元素标签。
其中,样本数据包括但不限于图像数据、文本数据或视频数据,且每个样本数据中具体包括至少一种样本素材。因此,真实元素标签具体用于描述样本数据中样本素材的类型。
具体地,服务器首先获取样本数据,样本数据可以为从数据库下载的多个样本数据,也可以为通过终端上传的样本数据,此处不做限定。其次,在获取样本数据时,还能够获取样本数据的真实元素标签,该真实元素标签是对样本数据进行人工标注得到的。
步骤2002,通过特征处理层提取样本数据的数据特征。
其中,在样本数据为视频数据的情况下,由于视频数据通常由多个图像帧组成,此时数据特征包括组成视频数据的各图像帧对应的特征。
具体地,服务器将样本数据作为初始元素识别模型600的输入,然后具体通过初始元素识别模型600中的特征处理层601提取样本数据的数据特征。
步骤2003,通过第一池化层对数据特征进行第一池化处理,并基于第一池化处理后的数据特征,获取第一预测值。
具体地,服务器将通过特征处理层601向第一池化层602输入所提取的样本数据的数据特征,然后通过第一池化层602对数据特征进行第一池化处理,从而得到第一池化处理后的数据特征,并基于第一池化处理后的数据特征产生第一预测值。
优选地,考虑到特征提取的误差:邻域大小受限造成的估计值方差增大,因此第一池化层602具体为平均池化层。
步骤2004,通过二次学习模块对第一预测值进行掩码处理,获取第二预测值。
具体地,二次学习模块的目的在于通过数据量更少的类别,或数据量更少的特征进行学习,以获得更好的准确性。基于此,服务器具体通过二次学习模块603对步骤2003所获取的第一预测值进行掩码处理,以输出第二预测值。
步骤2005,根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率。
其中,第一预测概率包括样本数据的类型属于各元素标签的预测概率。
具体地,服务器基于激活函数对第一预测值进行激活处理后得到第一预测概率,同理,服务器基于激活函数对第二预测值进行激活处理后得到第二预测概率,且第二预测概率中也包括样本数据的类型属于元素标签的预测概率,但第二预测概率中的预测概率数量小于第一预测概率中的预测概率数量。
步骤2006,对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理。
具体地,服务器对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理。若维度为一维,那么维度调整处理具体为拉直处理,以使得维度调整处理后的第一预测概率为一维向量,以及维度调整处理后的多标签分类为一维向量,以保证形式一致性,因此服务器能够在计算得到第一损失值时具体使用图像语义分割损失。
步骤2007,根据维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签,计算得到第一损失值。
其中,第一损失值用于描述第一预测概率与各真实元素标签之间的差异。
具体地,服务器根据第一预测概率与各真实元素标签,具体计算第一预测概率与各真实元素标签之间的差异,以得到样本数据的第一损失值。计算第一预测概率与各真实元素标签之间的差异可以为:计算第一预测概率与各真实元素标签之间的Lovasz损失,Lovasz损失具体是对图像语义分割指标IoU进行优化的一个损失,即具体图像语义分割损失是对IoU进行优化,而IoU的计算和F值的计算具有等效性,因此第一预测概率与各真实元素标签之间的Lovasz损失具体为对F值进行优化。
步骤2008,根据第二预测概率与各真实元素标签,计算得到样本数据的第二损失值。
其中,第二损失值用于描述第二预测概率与各真实元素标签之间的差异,且第一损失值与第二损失值的损失类型不同。例如,第一损失值的具体损失类型为Lovasz损失,那么第二损失值的损失类型可以为二分类交叉熵(BCE,Binary Cross Entropy)损失。
具体地,服务器根据第二预测概率与各真实元素标签,具体计算第二预测概率与各真实元素标签之间的差异,以得到样本数据的第二损失值。计算第二预测概率与各真实元素标签之间的差异可以为:计算第二预测概率与各真实元素标签之间的BCE损失。
步骤2009,通过第二池化层对数据特征进行第二池化处理,并通过丢弃层对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
其中,第一池化处理与第二池化处理的池化类型不同。
具体地,考虑到样本数据的数据特征存在耦合度太高,从而导致进行预测得到第三预测概率不够准确可靠性情况,因此服务器将通过特征处理层601向第二池化层1302输入所提取的样本数据的数据特征,然后通过第二池化层1302对数据特征进行第二池化处理,从而得到第二池化处理后的数据特征,并通过丢弃层1502对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
优选地,考虑到特征提取的误差:卷积层参数误差造成估计均值的偏移,因此第二池化层1302具体为最大池化层。
步骤2010,根据第三预测概率与各真实元素标签,计算得到样本数据的第三损失值。
其中,第三损失值用于描述第三预测概率与各真实元素标签之间的差异,且第三损失值的损失类型与第一损失值的损失类型相同。
具体地,服务器根据第三预测概率与各真实元素标签,具体计算第三预测概率与各真实元素标签之间的差异,以得到样本数据的第三损失值。计算第三预测概率与各真实元素标签之间的差异可以为:计算第三预测概率与各真实元素标签之间的Lovasz损失,Lovasz损失具体是对图像语义分割指标IoU进行优化的一个损失,即具体图像语义分割损失是对IoU进行优化,而IoU的计算和F值的计算具有等效性,因此第三预测概率与各真实元素标签之间的Lovasz损失具体为对F值进行优化。具体与前述实施例类似,此处不再赘述。
步骤2011,通过对比正则模块根据第二预测概率与第三预测概率,计算得到样本数据的第四损失值。
其中,第四损失值用于描述第二预测概率与第三预测概率之间的差异。
具体地,服务器通过对比正则模块1702计算第二预测概率与第三预测概率之间的差异,以得到样本数据的第四损失值。由于第二预测概率与第三预测概率是通过不同的池化方式进行处理后的得到预测概率,为减少引入扰动对模型收敛性的影响,计算第二预测概率与第三预测概率之间的差异具体为使用KL散度作为约束损失,KL散度用于度量第二预测概率与第三预测概率的相似程度,或者说度量第二预测概率与第三预测概率的相近程度。
应理解,在实际应用中,还可以欧式距离以及余弦相似度等度量方法作为第四损失,此处不做限定。
步骤2012,基于第一损失值、第二损失值、第三损失值、以及第四损失值,更新初始元素识别模型的模型参数。
具体地,服务器根据一损失值、第二损失值、第三损失值、以及第四损失值判断初始元素识别模型的损失函数是否达到收敛条件,若未达到收敛条件,则利用一损失值、第二损失值、第三损失值、以及第四损失值更新初始元素识别模型的模型参数。
步骤2013,在模型训练结束时,基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。
具体地,初始元素识别模型的损失函数达到收敛条件,则根据最后一次对模型参数进行更新后获得的模型参数获得元素识别模型,且服务器基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。因此,在实际应用中,元素识别模型包括特征处理层、第一池化层以及二次学习模块,即元素识别模型以掩码处理后得到第二预测值,并基于激活函数对第二预测值进行激活处理得到第二预测概率,将第二预测概率作为预测结果。
应理解,图20所示出的流程中各步骤的具体实施方式,与前述实施例中所描述的具体实施方式类似,此处不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的元素识别模型的获取方法的元素识别模型的获取装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个元素识别模型的获取装置实施例中的具体限定可以参见上文中对于元素识别模型的获取方法的限定,在此不再赘述。
在一个实施例中,如图21所示,提供了一种元素识别模型的获取装置,包括:获取模块2102和模型训练模块2104,其中:
获取模块2102,用于获取样本数据,以及样本数据的真实元素标签;并基于样本数据,通过初始元素识别模型获取样本数据的第一预测值,并对第一预测值进行掩码处理,获取样本数据的第二预测值,第一预测值包括样本数据的类型属于各元素标签的预测值;并根据第一预测值得到第一预测概率,并根据第二预测值得到第二预测概率,第一预测概率包括样本数据的类型属于各元素标签的预测概率;
模型训练模块2104,用于根据第一预测概率与各真实元素标签,以及第二预测概率与各真实元素标签,更新初始元素识别模型的模型参数,并在模型训练结束时,基于初始元素识别模型获得元素识别模型,元素识别模型用于识别数据的元素标签。
在一个实施例中,获取模块2102,还用于对样本数据的类型属于各元素标签的预测值进行排序,得到各预测值的排序结果;并根据各预测值的排序结果,对各预测值进行掩码处理;并基于进行掩码处理后的各预测值,获得第二预测值。
在一个实施例中,获取模块2102,还用于根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预设数量;并对各待掩码值进行掩码处理。
在一个实施例中,获取模块2102,还用于根据各预测值的排序结果,将排序靠后的预测值确定为待掩码值,待掩码值的数量为预测值的数量的预设比例;并对各待掩码值进行掩码处理。
在一个实施例中,初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;
获取模块2102,还用于通过特征处理层提取样本数据的数据特征;并通过第一池化层对数据特征进行第一池化处理,并基于第一池化处理后的数据特征,获取第一预测值;并通过二次学习模块对第一预测值进行掩码处理,获取第二预测值。
在一个实施例中,模型训练模块2104,还用于根据第一预测概率与各真实元素标签,计算得到样本数据的第一损失值;并根据第二预测概率与各真实元素标签,计算得到样本数据的第二损失值,第一损失值与第二损失值的损失类型不同;并基于第一损失值与第二损失值,更新初始元素识别模型的模型参数。
在一个实施例中,模型训练模块2104,还用于对第一预测概率进行维度调整处理,以及对各真实元素标签进行维度调整处理,维度调整处理后的第一预测概率的维度,与维度调整处理后的各真实元素标签的维度一致;并根据维度调整处理后的第一预测概率,与维度调整处理后的各真实元素标签,计算得到第一损失值。
在一个实施例中,初始元素识别模型还包括第二池化层;
模型训练模块2104,还用于通过第二池化层对数据特征进行第二池化处理,并基于第二池化处理后的数据特征,获取样本数据的第三预测概率,第一池化处理与第二池化处理的池化类型不同;并根据第三预测概率与各真实元素标签,计算得到样本数据的第三损失值;并基于第一损失值、第二损失值以及第三损失值,更新初始元素识别模型的模型参数。
在一个实施例中,初始元素识别模型还包括丢弃层;
模型训练模块2104,还用于通过丢弃层对第二池化处理后的数据特征进行丢弃处理,并基于丢弃处理后的数据特征,获取第三预测概率。
在一个实施例中,初始元素识别模型还包括对比正则模块;
模型训练模块2104,还用于通过对比正则模块根据第二预测概率与第三预测概率,计算得到样本数据的第四损失值;并基于第一损失值、第二损失值、第三损失值、以及第四损失值,更新初始元素识别模型的模型参数。
在一个实施例中,模型训练模块2104,还用于基于初始元素识别模型所包括的特征处理层、第一池化层以及二次学习模块,构建元素识别模型。
上述元素识别模型的获取装置中的各模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图22所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储样本数据,以及样本数据的真实元素标签等模型训练的相关数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种元素识别模型的获取方法。
本领域技术人员可以理解,图22中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (20)
1.一种元素识别模型的获取方法,其特征在于,所述方法包括:
获取样本数据,以及所述样本数据的真实元素标签;
基于所述样本数据,通过初始元素识别模型获取所述样本数据的第一预测值,并对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,所述第一预测值包括所述样本数据的类型属于各元素标签的预测值,所述掩码处理为:对所述样本数据的类型属于各元素标签的预测值中的部分预测值进行掩码;
根据所述第一预测值得到第一预测概率,并根据所述第二预测值得到第二预测概率,所述第一预测概率包括所述样本数据的类型属于各元素标签的预测概率;
根据所述第一预测概率与各所述真实元素标签,计算得到所述样本数据的第一损失值,并根据所述第二预测概率与各所述真实元素标签,计算得到所述样本数据的第二损失值,所述第一损失值与所述第二损失值的损失类型不同;
基于所述第一损失值与所述第二损失值,更新所述初始元素识别模型的模型参数,并在模型训练结束时,基于所述初始元素识别模型获得元素识别模型,所述元素识别模型用于识别数据的元素标签。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,包括:
对所述样本数据的类型属于各元素标签的预测值进行排序,得到各所述预测值的排序结果;
根据各所述预测值的排序结果,对各所述预测值进行掩码处理;
基于进行掩码处理后的各所述预测值,获得所述第二预测值。
3.根据权利要求2所述的方法,其特征在于,所述根据各所述预测值的排序结果,对各所述预测值进行掩码处理,包括:
根据各所述预测值的排序结果,将排序靠后的所述预测值确定为待掩码值,所述待掩码值的数量为预设数量或者所述预测值的数量的预设比例;
对各所述待掩码值进行掩码处理。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;
所述基于所述样本数据,通过初始元素识别模型获取所述样本数据的第一预测值,并对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,包括:
通过所述特征处理层提取所述样本数据的数据特征;
通过所述第一池化层对所述数据特征进行第一池化处理,并基于第一池化处理后的所述数据特征,获取所述第一预测值;
通过所述二次学习模块对所述第一预测值进行掩码处理,获取所述第二预测值。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一预测概率与各所述真实元素标签,计算得到所述样本数据的第一损失值,包括:
对所述第一预测概率进行维度调整处理,以及对各所述真实元素标签进行维度调整处理,维度调整处理后的所述第一预测概率的维度,与维度调整处理后的各所述真实元素标签的维度一致;
根据维度调整处理后的所述第一预测概率,与维度调整处理后的各所述真实元素标签,计算得到所述第一损失值。
6.根据权利要求5所述的方法,其特征在于,所述初始元素识别模型还包括第二池化层;
所述方法还包括:
通过所述第二池化层对所述数据特征进行第二池化处理,并基于第二池化处理后的所述数据特征,获取所述样本数据的第三预测概率,所述第一池化处理与第二池化处理的池化类型不同;
所述基于所述第一损失值与所述第二损失值,更新所述初始元素识别模型的模型参数,包括:
根据所述第三预测概率与各所述真实元素标签,计算得到所述样本数据的第三损失值;
基于所述第一损失值、所述第二损失值以及所述第三损失值,更新所述初始元素识别模型的模型参数。
7.根据权利要求6所述的方法,其特征在于,所述初始元素识别模型还包括丢弃层;
所述基于第二池化处理后的所述数据特征,获取所述样本数据的第三预测概率,包括:
通过所述丢弃层对所述第二池化处理后的所述数据特征进行丢弃处理,并基于丢弃处理后的所述数据特征,获取所述第三预测概率。
8.根据权利要求6所述的方法,其特征在于,所述初始元素识别模型还包括对比正则模块;
所述基于所述第一损失值、所述第二损失值以及所述第三损失值,更新所述初始元素识别模型的模型参数,包括:
通过所述对比正则模块根据所述第二预测概率与所述第三预测概率,计算得到所述样本数据的第四损失值;
基于所述第一损失值、所述第二损失值、所述第三损失值、以及所述第四损失值,更新所述初始元素识别模型的模型参数。
9.根据权利要求4所述的方法,其特征在于,基于所述初始元素识别模型获得元素识别模型,包括:
基于所述初始元素识别模型所包括的所述特征处理层、所述第一池化层以及所述二次学习模块,构建所述元素识别模型。
10.一种元素识别模型的获取装置,其特征在于,所述装置包括:
获取模块,用于获取样本数据,以及所述样本数据的真实元素标签;并基于所述样本数据,通过初始元素识别模型获取所述样本数据的第一预测值,并对所述第一预测值进行掩码处理,获取所述样本数据的第二预测值,所述第一预测值包括所述样本数据的类型属于各元素标签的预测值;并根据所述第一预测值得到第一预测概率,并根据所述第二预测值得到第二预测概率,所述第一预测概率包括所述样本数据的类型属于各元素标签的预测概率,所述掩码处理为:对所述样本数据的类型属于各元素标签的预测值中的部分预测值进行掩码;
模型训练模块,用于根据所述第一预测概率与各所述真实元素标签,计算得到所述样本数据的第一损失值,并根据所述第二预测概率与各所述真实元素标签,计算得到所述样本数据的第二损失值,所述第一损失值与所述第二损失值的损失类型不同;并基于所述第一损失值与所述第二损失值,更新所述初始元素识别模型的模型参数,并在模型训练结束时,基于所述初始元素识别模型获得元素识别模型,所述元素识别模型用于识别数据的元素标签。
11.根据权利要求10所述的元素识别模型的获取装置,其特征在于,所述获取模块,还用于对所述样本数据的类型属于各元素标签的预测值进行排序,得到各所述预测值的排序结果;并根据各所述预测值的排序结果,对各所述预测值进行掩码处理;并基于进行掩码处理后的各所述预测值,获得所述第二预测值。
12.根据权利要求11所述的元素识别模型的获取装置,其特征在于,所述获取模块,还用于根据各所述预测值的排序结果,将排序靠后的所述预测值确定为待掩码值,所述待掩码值的数量为预设数量或者所述预测值的数量的预设比例;并对各所述待掩码值进行掩码处理。
13.根据权利要求10至12任一项所述的元素识别模型的获取装置,其特征在于,所述初始元素识别模型包括特征处理层、第一池化层以及二次学习模块;
所述获取模块,还用于通过所述特征处理层提取所述样本数据的数据特征;并通过所述第一池化层对所述数据特征进行第一池化处理,并基于第一池化处理后的所述数据特征,获取所述第一预测值;并通过所述二次学习模块对所述第一预测值进行掩码处理,获取所述第二预测值。
14.根据权利要求13所述的元素识别模型的获取装置,其特征在于,所述模型训练模块,还用于对所述第一预测概率进行维度调整处理,以及对各所述真实元素标签进行维度调整处理,维度调整处理后的所述第一预测概率的维度,与维度调整处理后的各所述真实元素标签的维度一致;并根据维度调整处理后的所述第一预测概率,与维度调整处理后的各所述真实元素标签,计算得到所述第一损失值。
15.根据权利要求14所述的元素识别模型的获取装置,其特征在于,所述初始元素识别模型还包括第二池化层;
所述获取模块,还用于通过所述第二池化层对所述数据特征进行第二池化处理,并基于第二池化处理后的所述数据特征,获取所述样本数据的第三预测概率,所述第一池化处理与第二池化处理的池化类型不同;
所述模型训练模块,还用于根据所述第三预测概率与各所述真实元素标签,计算得到所述样本数据的第三损失值;并基于所述第一损失值、所述第二损失值以及所述第三损失值,更新所述初始元素识别模型的模型参数。
16.根据权利要求15所述的元素识别模型的获取装置,其特征在于,所述初始元素识别模型还包括丢弃层;
所述获取模块,还用于通过所述丢弃层对所述第二池化处理后的所述数据特征进行丢弃处理,并基于丢弃处理后的所述数据特征,获取所述第三预测概率。
17.根据权利要求15所述的元素识别模型的获取装置,其特征在于,所述初始元素识别模型还包括对比正则模块;
所述模型训练模块,还用于通过所述对比正则模块根据所述第二预测概率与所述第三预测概率,计算得到所述样本数据的第四损失值;并基于所述第一损失值、所述第二损失值、所述第三损失值、以及所述第四损失值,更新所述初始元素识别模型的模型参数。
18.根据权利要求13所述的元素识别模型的获取装置,其特征在于,所述模型训练模块,还用于基于所述初始元素识别模型所包括的所述特征处理层、所述第一池化层以及所述二次学习模块,构建所述元素识别模型。
19.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
20.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210865805.7A CN114936327B (zh) | 2022-07-22 | 2022-07-22 | 元素识别模型的获取方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210865805.7A CN114936327B (zh) | 2022-07-22 | 2022-07-22 | 元素识别模型的获取方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114936327A CN114936327A (zh) | 2022-08-23 |
CN114936327B true CN114936327B (zh) | 2022-10-28 |
Family
ID=82867929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210865805.7A Active CN114936327B (zh) | 2022-07-22 | 2022-07-22 | 元素识别模型的获取方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114936327B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118332609B (zh) * | 2024-06-13 | 2024-09-06 | 北京金钻芯科技有限公司 | 基于数据库的风险数据分析方法、系统以及设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966517A (zh) * | 2021-04-30 | 2021-06-15 | 平安科技(深圳)有限公司 | 命名实体识别模型的训练方法、装置、设备及介质 |
CN113434688A (zh) * | 2021-08-23 | 2021-09-24 | 南京擎盾信息科技有限公司 | 用于舆情分类模型训练的数据处理方法和装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210141150A (ko) * | 2020-05-15 | 2021-11-23 | 삼성에스디에스 주식회사 | 이미지 분류 모델을 이용한 이미지 분석 방법 및 장치 |
CN111667011B (zh) * | 2020-06-08 | 2023-07-14 | 平安科技(深圳)有限公司 | 损伤检测模型训练、车损检测方法、装置、设备及介质 |
CN112069795B (zh) * | 2020-08-28 | 2023-05-30 | 平安科技(深圳)有限公司 | 基于掩码语言模型的语料检测方法、装置、设备及介质 |
CN112183673A (zh) * | 2020-11-06 | 2021-01-05 | 携程计算机技术(上海)有限公司 | 天气时段分类方法、系统、设备及存储介质 |
CN112949772A (zh) * | 2021-04-12 | 2021-06-11 | 中国科学院自动化研究所 | 基于影像组学的胃癌多维特征提取与分析系统 |
CN113139592A (zh) * | 2021-04-14 | 2021-07-20 | 中国地质大学(武汉) | 基于深度残差U-Net的月球陨石坑识别方法、设备及存储介质 |
CN114357152A (zh) * | 2021-09-03 | 2022-04-15 | 北京大学 | 信息处理方法、装置、计算机可读存储介质和计算机设备 |
-
2022
- 2022-07-22 CN CN202210865805.7A patent/CN114936327B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112966517A (zh) * | 2021-04-30 | 2021-06-15 | 平安科技(深圳)有限公司 | 命名实体识别模型的训练方法、装置、设备及介质 |
CN113434688A (zh) * | 2021-08-23 | 2021-09-24 | 南京擎盾信息科技有限公司 | 用于舆情分类模型训练的数据处理方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN114936327A (zh) | 2022-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110866140B (zh) | 图像特征提取模型训练方法、图像搜索方法及计算机设备 | |
CN112084331A (zh) | 文本处理、模型训练方法、装置、计算机设备和存储介质 | |
CN111444344B (zh) | 实体分类方法、装置、计算机设备和存储介质 | |
CN112819023B (zh) | 样本集的获取方法、装置、计算机设备和存储介质 | |
CN111667022A (zh) | 用户数据处理方法、装置、计算机设备和存储介质 | |
CN112417289B (zh) | 一种基于深度聚类的资讯信息智能推荐方法 | |
CN112200266B (zh) | 基于图结构数据的网络训练方法、装置以及节点分类方法 | |
CN114358188A (zh) | 特征提取模型处理、样本检索方法、装置和计算机设备 | |
CN116664719B (zh) | 一种图像重绘模型训练方法、图像重绘方法及装置 | |
CN110993037A (zh) | 一种基于多视图分类模型的蛋白质活性预测装置 | |
CN114358109A (zh) | 特征提取模型训练、样本检索方法、装置和计算机设备 | |
CN113705596A (zh) | 图像识别方法、装置、计算机设备和存储介质 | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN111325766A (zh) | 三维边缘检测方法、装置、存储介质和计算机设备 | |
CN113761291A (zh) | 标签分类的处理方法和装置 | |
CN115344698A (zh) | 标签处理方法、装置、计算机设备、存储介质和程序产品 | |
CN114332893A (zh) | 表格结构识别方法、装置、计算机设备和存储介质 | |
CN112148994A (zh) | 信息推送效果评估方法、装置、电子设备及存储介质 | |
CN114936327B (zh) | 元素识别模型的获取方法、装置、计算机设备和存储介质 | |
CN115457332A (zh) | 基于图卷积神经网络和类激活映射的图像多标签分类方法 | |
CN111309923A (zh) | 对象向量确定、模型训练方法、装置、设备和存储介质 | |
CN114329004A (zh) | 数字指纹生成、数据推送方法、装置和存储介质 | |
CN116702784A (zh) | 实体链接方法、装置、计算机设备和存储介质 | |
CN114329065A (zh) | 视频标签预测模型的处理方法、视频标签预测方法和装置 | |
CN116150462A (zh) | 针对目标对象的向量构建方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |