CN113850779A - 一种基于变分多实例图像识别的二手手机自动评级算法 - Google Patents

一种基于变分多实例图像识别的二手手机自动评级算法 Download PDF

Info

Publication number
CN113850779A
CN113850779A CN202111124439.1A CN202111124439A CN113850779A CN 113850779 A CN113850779 A CN 113850779A CN 202111124439 A CN202111124439 A CN 202111124439A CN 113850779 A CN113850779 A CN 113850779A
Authority
CN
China
Prior art keywords
mobile phone
rating
instance
image
semantic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111124439.1A
Other languages
English (en)
Inventor
林乐新
周超
张康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shanhui Technology Co ltd
Original Assignee
Shenzhen Shanhui Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shanhui Technology Co ltd filed Critical Shenzhen Shanhui Technology Co ltd
Priority to CN202111124439.1A priority Critical patent/CN113850779A/zh
Publication of CN113850779A publication Critical patent/CN113850779A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明属于二手手机自动评级技术领域,尤其为一种基于变分多实例图像识别的二手手机自动评级算法,具体包含获取手机的外观图片数据,并进行预处理;将图像底库中相应的图片使用特征抽取器得到其特征;收集手机其他模态的特征;将步骤二获得的图片embedding特征和步骤三的特征一起输入模型,使用语义空间约束器计算出评级分数,在测试时,分数高的Top1结果将会作为手机的最终评级;使用端到端的多样性语义学习框架,不需要多阶段处理和人工设计规则就可以得到有效的手机评级结果;使用手机元属性引导的变分自编码器建模多样性语义分布,可以有效克服传统方法只能学习从输入到输出的单点映射,从而获得属性特征与外观图像特征更多样的语义表示。

Description

一种基于变分多实例图像识别的二手手机自动评级算法
技术领域
本发明属于二手手机自动评级技术领域,具体涉及一种基于变分多实例图像识别的二手手机自动评级算法。
背景技术
在一些线上软件的二手设备回收产品中,对设备进行评估定级应用广泛,它可以帮助用户快速了解手机的成色情况,成为影响用户出价的最重要因素,手机评级的业界主要做法是,由业务人员对手机各项功能进行检测后根据业务经验给出综合评级,其主要的缺点是由于业务人员的经验和判别尺度相差很大,导致评级结果存在较大偏差;同时,从检测项结果到评级,是由一个复杂的人工规则决定,可维护性较差,尤其是当多种功能故障同时出问题时,组合特征的人工规则制定变得困难。
对于二手手机回收类产品来说,机器评级的准确率是影响用户使用体验的核心因素,评级不仅可以给回收厂商提供最重要的定价依据,也是用户选择手机时的重要参考因子,准确的评级可以方便用户快速做出决定,我们认为,在用户提供清晰机况下,手机的评级应该有一个合理的值,越资深的专家认定的评级会越具有公允性,难点在于如何通过算法和系统工程,将专家们的经验知识转化成一个不需要人工深度参与的自动评级专家系统。
传统的二手手机评级一般有以下方法:
1.最常使用的方式是根据人工经验,对评级的影响因子进行权重分析,得到评级的多项式打分公式或者与/或条件表达式,根据手机的检测项判断其评级。
2.与方案1类似,主要区别为采用机器学习算法对手机外观图片进行图片分类。通常采用2阶段框架,即先识别出图片的检测项分类,再用人工规则组合的评级规则,得到手机的最终评级。
3.由业务专家完成外观损伤检测项的评定,获得手机的综合检测项特征,然后输入到一个机器学习分类算法中,例如GBDT,DNN,SVM等,从而得到最终评级。
现有技术的缺点:
1.传统的基于人工专家+复杂规则系统的方法拥有较高的准确率,但是它们只能对主要的机型和主要的损伤情况进行归纳和拟合,而对于中长尾的手机及检测组合无法进行较合理的设计,使得该方案的可扩展性较差;
2.传统的图像识别方案设计多阶段的分类,可以使返回解释性较强的中间结果,但是这种方法易受每一阶段性能的影响,使得准确率大大下降,从而影响用户体验;
3.传统的二手手机评级框架使用除了图片外的各种其他手机信息可以极大的补充手机的特征,但往往需要人工设计大量的规则,费时费力浪费资源,且这些辅助信息获取时存在较大的人工偏差,会限制此类方法的应用场景。
发明内容
为解决现有技术中存在的上述问题,本发明提供了一种基于变分多实例图像识别的二手手机自动评级算法,具有操作方便、适应能力强、适用范围广泛、学习更加敏感以及分类效果更好的特点。
为实现上述目的,本发明提供如下技术方案:一种基于变分多实例图像识别的二手手机自动评级算法,利用语义特征投影器提取图像特征并投影到语义空间中,利用跨模态特征生成器通过学习一对一的分布以产生多个实例,并执行跨模态多实例图,利用语义空间约束器设计多种损失函数来约束跨模态语义空间,使得属性特征和图像特征可以对齐,具体包含如下方法:
步骤一:获取手机的外观图片数据,并进行预处理;
步骤二:将图像底库中相应的图片使用特征抽取器得到其特征;
步骤三:收集手机其他模态的特征;
步骤四:将步骤二获得的图片embedding特征和步骤三的特征一起输入模型,使用语义空间约束器计算出评级分数,用于优化模型的训练,在测试时,分数高的Top1结果将会作为手机的最终评级。
作为本发明的一种优选技术方案,所述步骤一中,预处理包括但不限于去掉模糊不清的图片、图片裁剪以及亮度调整。
作为本发明的一种优选技术方案,所述步骤三中,其他模态的特征包括但不限于二手手机的机型、二手手机的使用年限以及维修情况。
作为本发明的一种优选技术方案,所述跨模态特征生成器为跨模态多样性生成器,其利用变分自编码器来建模完整的图片视觉语义概念,其最大化隐变量z与其后验分布的变分下界:
Figure BDA0003278193410000035
其中,fv,ft分别是图像和手机属性的特征。
作为本发明的一种优选技术方案,所述语义空间约束器含有多个损失函数以优化语义空间的学习,具体包括标签分类损失函数、多实例三元组损失函数和距离惩罚损失函数,多实例三元组损失基于图匹配分数:
Figure BDA0003278193410000031
Figure BDA0003278193410000032
其中,
Figure BDA0003278193410000033
Figure BDA0003278193410000034
为元属性特征和图像的多样性特征。
与现有技术相比,本发明的有益效果是:
(1)使用端到端的多样性语义学习框架,不需要多阶段处理和人工设计规则就可以得到有效的手机评级结果;
(2)使用手机元属性引导的变分自编码器建模多样性语义分布,可以有效克服传统方法只能学习从输入到输出的单点映射,从而获得属性特征与外观图像特征更多样的语义表示;
(3)使用跨模态多实例图优化不同模态下的多样性特征,可以有效解决不同模态多样性特征的匹配问题;
(4)使用距离感知的多实例学习惩罚函数优化语义空间学习,能够使对负样本的学习更加的敏感,得到更好的分类效果。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明的算法流程示意图;
图2为本发明的模型架构示意图:
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1和图2,本发明提供以下技术方案:一种基于变分多实例图像识别的二手手机自动评级算法,利用语义特征投影器提取图像特征并投影到语义空间中,利用跨模态特征生成器通过学习一对一的分布以产生多个实例,并执行跨模态多实例图,利用语义空间约束器设计多种损失函数来约束跨模态语义空间,使得属性特征和图像特征可以对齐,具体包含如下方法:
步骤一:获取手机的外观图片数据,并进行预处理,预处理包括但不限于去掉模糊不清的图片、图片裁剪以及亮度调整;
步骤二:将图像底库中相应的图片使用特征抽取器得到其特征,其他模态的特征包括但不限于二手手机的机型、二手手机的使用年限以及维修情况;
步骤三:收集手机其他模态的特征;
步骤四:将步骤二获得的图片embedding特征和步骤三的特征一起输入模型,使用语义空间约束器计算出评级分数,用于优化模型的训练,在测试时,分数高的Top1结果将会作为手机的最终评级。
具体的,根据附图1和附图2所示,本实施例中,跨模态特征生成器为跨模态多样性生成器,其利用变分自编码器来建模完整的图片视觉语义概念,具体来说,其最大化隐变量z与其后验分布的变分下界:
Figure BDA0003278193410000051
其中,fv,ft分别是图像和手机属性的特征,通过计算分布的KL散度和特征的重构损失优化变分自编码器,其中手机特征将作为条件约束后验分布,可以使其学习到与手机元属性空间更相关的表示,然后从得到的分布中采样得到的多个Z便可以自然的表示语义空间中的多样性语义,通过这种策略使得手机属性特征端和图像端都能以多个特征表示其多样的语义,从而克服单点嵌入的缺点。
然后该生成器将这个任务抽象为多实例学习,该任务十分适合多实例学习的原因在于,手机元属性和图像的多语义中,只要有某一对语义实例是匹配的,那么两者将会是匹配的,即被认为是正例包对,这对于用户的手机评级诉求来说,只要有某个语义是对应了用户期待,那么应该被呈现给用户预期的评级,该生成器使用模态内实例图和模态间实例图这两方面来优化多样性表示,一方面模态内实例图可以挖掘实例概念间的关系和减少冗余,同时模态间实例图负责完成跨模态对齐,模态内实例图和模态间实例图节点的优化都为如下逻辑:
Figure BDA0003278193410000061
Figure BDA0003278193410000062
其中,
Figure BDA0003278193410000063
是采样得到的多样性语义特征,每个特征都从邻居节点聚合特征,然后更新自己的特征,通过这种消息传播机制,可以让实例之间的多样性语义得到充分的优化。
具体的,根据附图1和附图2所示,本实施例中,语义空间约束器含有多个损失函数以优化语义空间的学习,具体包括标签分类损失函数、多实例三元组损失函数和距离惩罚损失函数,标签分类损失是多模态检索中常用的损失函数,其额外使用一个分类器以区别元属性特征和图像以使学习到的多样性特征是语义可分的,多实例三元组损失基于图匹配分数:
Figure BDA0003278193410000064
Figure BDA0003278193410000065
其中,
Figure BDA0003278193410000066
Figure BDA0003278193410000067
为元属性特征和图像的多样性特征,按照多实例学习的思路计算距离的最小值作为图匹配分数,然后使正例包对(t,v+)和负例包(t,v-)对离得越远越好;距离惩罚损失则是为了优化三元组损失函数在多样性检索中的鲁棒性,因为现有三元组损失并没有对负例包有区别能力,即默认为它们是一致的且应该与正例包越远越好,而实际上在多样性较强的数据集中,负例图片之间的差异非常大,距离惩罚能够使模型学习到负例之间的差异性性,即负例们的匹配分数也应该反应它们的距离差异,具体来说,其计算匹配分数S(t,v)与负例先验排名dist之间的KL散度:
Ldis=KL(dist(t,v)||S(t,v))
模型训练时,将使用以上多个损失函数训练网络参数使其收敛,其中,λ1,λ2和λ3是平衡各个损失函数的参数:
L=Llabel1Lquav2Lmil3Ldis
测试时将使用跨模态匹配分数作为手机元属性特征和图像之间的相似度分数,然后计算Top1排序返回给用户,这种端到端的模型可以直接得到手机评级给用户,而不需要其他的额外处理和人工规则。
(1)跨模态多样性生成器算法部分,可将变分自编码器改为其他方法,包括多头注意力机制、主题模型等;
(2)语义空间约束器算法部分,可将增加其他的损失函数,或者直接用注意力机制或神经网络计算特征的匹配分数以代替图匹配方案;
(3)应用场景的扩展,本方案可以扩展到任何需要图像+元数据分类的场景中,如视频分类等。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于变分多实例图像识别的二手手机自动评级算法,其特征在于,利用语义特征投影器提取图像特征并投影到语义空间中,利用跨模态特征生成器通过学习一对一的分布以产生多个实例,并执行跨模态多实例图,利用语义空间约束器设计多种损失函数来约束跨模态语义空间,使得属性特征和图像特征可以对齐,具体包含如下方法:
步骤一:获取手机的外观图片数据,并进行预处理;
步骤二:将图像底库中相应的图片使用特征抽取器得到其特征;
步骤三:收集手机其他模态的特征;
步骤四:将步骤二获得的图片embedding特征和步骤三的特征一起输入模型,使用语义空间约束器计算出评级分数,用于优化模型的训练,在测试时,分数高的Top1结果将会作为手机的最终评级。
2.根据权利要求1所述的一种基于变分多实例图像识别的二手手机自动评级算法,其特征在于:所述步骤一中,预处理包括但不限于去掉模糊不清的图片、图片裁剪以及亮度调整。
3.根据权利要求1所述的一种基于变分多实例图像识别的二手手机自动评级算法,其特征在于:所述步骤三中,其他模态的特征包括但不限于二手手机的机型、二手手机的使用年限以及维修情况。
4.根据权利要求1所述的一种基于变分多实例图像识别的二手手机自动评级算法,其特征在于:所述跨模态特征生成器为跨模态多样性生成器,其利用变分自编码器来建模完整的图片视觉语义概念,其最大化隐变量z与其后验分布的变分下界:
Figure FDA0003278193400000011
其中,fv,ft分别是图像和手机属性的特征。
5.根据权利要求1所述的一种基于变分多实例图像识别的二手手机自动评级算法,其特征在于:所述语义空间约束器含有多个损失函数以优化语义空间的学习,具体包括标签分类损失函数、多实例三元组损失函数和距离惩罚损失函数,多实例三元组损失基于图匹配分数:
Figure FDA0003278193400000021
Figure FDA0003278193400000022
其中,
Figure FDA0003278193400000023
Figure FDA0003278193400000024
为元属性特征和图像的多样性特征。
CN202111124439.1A 2021-09-24 2021-09-24 一种基于变分多实例图像识别的二手手机自动评级算法 Pending CN113850779A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111124439.1A CN113850779A (zh) 2021-09-24 2021-09-24 一种基于变分多实例图像识别的二手手机自动评级算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111124439.1A CN113850779A (zh) 2021-09-24 2021-09-24 一种基于变分多实例图像识别的二手手机自动评级算法

Publications (1)

Publication Number Publication Date
CN113850779A true CN113850779A (zh) 2021-12-28

Family

ID=78979739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111124439.1A Pending CN113850779A (zh) 2021-09-24 2021-09-24 一种基于变分多实例图像识别的二手手机自动评级算法

Country Status (1)

Country Link
CN (1) CN113850779A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681428A (zh) * 2023-08-03 2023-09-01 天津奇立软件技术有限公司 电子设备的智能回收管理系统及方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080027917A1 (en) * 2006-07-31 2008-01-31 Siemens Corporate Research, Inc. Scalable Semantic Image Search
CN105488226A (zh) * 2015-12-31 2016-04-13 苏州和云观博数字科技有限公司 数字博物馆观览系统
US20200097868A1 (en) * 2018-09-24 2020-03-26 International Business Machines Corporation Enhanced consistency in geological risk assessment through continuous machine learning
CN111590611A (zh) * 2020-05-25 2020-08-28 北京具身智能科技有限公司 一种基于多模态主动感知的物品分类回收方法
US20200357143A1 (en) * 2019-05-09 2020-11-12 Sri International Semantically-aware image-based visual localization
US10891539B1 (en) * 2017-10-31 2021-01-12 STA Group, Inc. Evaluating content on social media networks
CN112487822A (zh) * 2020-11-04 2021-03-12 杭州电子科技大学 一种基于深度学习的跨模态检索方法
CN112651493A (zh) * 2021-01-12 2021-04-13 南京三百云信息科技有限公司 基于联合训练模型的事故车判别方法和装置
CN113052005A (zh) * 2021-02-08 2021-06-29 湖南工业大学 一种用于家居服务的垃圾分拣方法和垃圾分拣装置
CN113191375A (zh) * 2021-06-09 2021-07-30 北京理工大学 一种基于联合嵌入的文本到多对象图像生成方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080027917A1 (en) * 2006-07-31 2008-01-31 Siemens Corporate Research, Inc. Scalable Semantic Image Search
CN105488226A (zh) * 2015-12-31 2016-04-13 苏州和云观博数字科技有限公司 数字博物馆观览系统
US10891539B1 (en) * 2017-10-31 2021-01-12 STA Group, Inc. Evaluating content on social media networks
US20200097868A1 (en) * 2018-09-24 2020-03-26 International Business Machines Corporation Enhanced consistency in geological risk assessment through continuous machine learning
US20200357143A1 (en) * 2019-05-09 2020-11-12 Sri International Semantically-aware image-based visual localization
CN111590611A (zh) * 2020-05-25 2020-08-28 北京具身智能科技有限公司 一种基于多模态主动感知的物品分类回收方法
CN112487822A (zh) * 2020-11-04 2021-03-12 杭州电子科技大学 一种基于深度学习的跨模态检索方法
CN112651493A (zh) * 2021-01-12 2021-04-13 南京三百云信息科技有限公司 基于联合训练模型的事故车判别方法和装置
CN113052005A (zh) * 2021-02-08 2021-06-29 湖南工业大学 一种用于家居服务的垃圾分拣方法和垃圾分拣装置
CN113191375A (zh) * 2021-06-09 2021-07-30 北京理工大学 一种基于联合嵌入的文本到多对象图像生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YE ZHU 等: "Learning Audio-Visual Correlations From Variational Cross-Modal Generation", 《ICASSP 2021 - 2021 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》, 13 May 2021 (2021-05-13) *
林克正 等: "语义自编码结合关系网络的零样本图像识别算法", 《模式识别与人工智能》, vol. 32, no. 3, 31 March 2019 (2019-03-31) *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116681428A (zh) * 2023-08-03 2023-09-01 天津奇立软件技术有限公司 电子设备的智能回收管理系统及方法
CN116681428B (zh) * 2023-08-03 2023-09-29 天津奇立软件技术有限公司 电子设备的智能回收管理系统及方法

Similar Documents

Publication Publication Date Title
CN111858954B (zh) 面向任务的文本生成图像网络模型
CN107861972B (zh) 一种用户录入商品信息后显示商品全结果的方法及设备
Mittal et al. Blind image quality assessment without human training using latent quality factors
CN111026914B (zh) 视频摘要模型的训练方法、视频摘要生成方法及装置
EP2568429A1 (en) Method and system for pushing individual advertisement based on user interest learning
CN111738251A (zh) 一种融合语言模型的光学字符识别方法、装置和电子设备
Ding et al. Inferring social relations from visual concepts
CN112131347A (zh) 一种基于多模态融合的假新闻检测方法
CN111462162B (zh) 一种特定类别图片的前景分割算法
KR20200075114A (ko) 이미지와 텍스트간 유사도 매칭 시스템 및 방법
CN107169417A (zh) 基于多核增强和显著性融合的rgbd图像协同显著性检测方法
CN113657115B (zh) 一种基于讽刺识别和细粒度特征融合的多模态蒙古文情感分析方法
CN110413825B (zh) 面向时尚电商的街拍推荐系统
CN111143617A (zh) 一种图片或视频文本描述自动生成方法及系统
CN116704085B (zh) 虚拟形象生成方法、装置、电子设备和存储介质
CN111694959A (zh) 基于面部表情和文本信息的网络舆情多模态情感识别方法及系统
Long et al. Towards fine-grained open zero-shot learning: Inferring unseen visual features from attributes
CN113850779A (zh) 一种基于变分多实例图像识别的二手手机自动评级算法
CN110097603B (zh) 一种时尚图像主色调解析方法
CN111383081A (zh) 一种服装搭配的智能推荐方法
CN117151826B (zh) 多模态电商商品对齐方法、装置、电子设备及存储介质
Wang Classification and identification of garment images based on deep learning
Bianco et al. Aesthetics assessment of images containing faces
CN110135769A (zh) 货品属性填充方法及装置、存储介质及电子终端
CN111223014B (zh) 一种从大量细分教学内容在线生成细分场景教学课程的方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination