CN111783813B - 图像的评估方法、训练图像模型方法、装置、设备和介质 - Google Patents
图像的评估方法、训练图像模型方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN111783813B CN111783813B CN201911141261.4A CN201911141261A CN111783813B CN 111783813 B CN111783813 B CN 111783813B CN 201911141261 A CN201911141261 A CN 201911141261A CN 111783813 B CN111783813 B CN 111783813B
- Authority
- CN
- China
- Prior art keywords
- image
- classification
- complete
- complete article
- training model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012549 training Methods 0.000 title claims abstract description 180
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000011156 evaluation Methods 0.000 title claims abstract description 24
- 239000013598 vector Substances 0.000 claims abstract description 56
- 238000011176 pooling Methods 0.000 claims description 41
- 230000006870 function Effects 0.000 claims description 31
- 238000004590 computer program Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 26
- 239000011159 matrix material Substances 0.000 description 19
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000005406 washing Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 239000000428 dust Substances 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了图像的评估方法、训练图像模型方法、装置、设备和介质,涉及计算机技术领域。该方法的一具体实施方式包括:获取待评估图像,所述待评估图像是红绿蓝三通道图像;在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数。该实施方式能够准确辨别图像中物品的完整程度。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种图像的评估方法、训练图像模型方法、装置、设备和计算机可读介质。
背景技术
随着人工智能的不断发展,使用计算机生成生动的物品广告或宣传海报已经成为可能。在每件物品的介绍页面中,都会包含一张或多张物品介绍图像。如果能自动生成上述图像,将大大减少人力和时间成本。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
在上述广告或海报的自动生成过程中,图像中物品完整程度影响最终的生成效果。因此,存在难以辨别图像中物品完整程度的技术问题。
发明内容
有鉴于此,本发明实施例提供一种图像的评估方法、装置、设备和计算机可读介质,能够准确辨别图像中物品的完整程度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种图像的评估方法,包括:
获取待评估图像,所述待评估图像是红绿蓝三通道图像;
在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数。
所述分类识别模型包括:
顺序连接的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第一全连接层、第二全连接层和第三全连接层,所述第三全连接层的维度等于待评估图像类别数量。
所述第一卷积层的卷积核数量是5;所述第二卷积层的卷积核数量是5;
所述第一最大池化层的池化核数量是2,所述第二最大池化层的池化核数量是2。
所述方法还包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
将所述完整物品图像输入分类训练模型中,获取所述分类训练模型输出向量;
根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照对数损失函数计算所述完整物品图像的损失值;
所述损失值小于预设损失值,则将所述分类训练模型作为所述分类识别模型;
所述损失值大于或等于预设损失值,则将所述完整物品图像再次输入所述分类训练模型。
所述方法还包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
在包括所述完整物品图像的集合中,随机选择完整物品图像输入分类训练模型,获取所述分类训练模型输出向量;
按照对数损失函数确定梯度方向,在所述梯度方向上以预设学习率训练所述分类训练模型,并根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照所述对数损失函数计算所述完整物品图像的损失值;
所述完整物品图像的损失值小于预设损失值,则再次随机选择完整物品图像输入所述分类训练模型;
所述完整物品图像的损失值大于或等于预设损失值,则将所述完整物品图像再次输入所述分类训练模型。
根据本发明实施例的第二方面,提供了一种训练图像模型方法,包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
将所述完整物品图像输入分类训练模型中,获取所述分类训练模型输出向量;
根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照对数损失函数计算所述完整物品图像的损失值;
基于所述损失值训练所述分类训练模型,将完成训练的分类训练模型作为分类识别模型。
根据本发明实施例的第三方面,提供了一种图像的评估装置,包括:
获取模块,用于获取待评估图像,所述待评估图像是红绿蓝三通道图像;
输入模块,在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
评估模块,获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数。
所述分类识别模型包括:
顺序连接的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第一全连接层、第二全连接层和第三全连接层,所述第三全连接层的维度等于待评估图像类别数量。
所述第一卷积层的卷积核数量是5;所述第二卷积层的卷积核数量是5;
所述第一最大池化层的池化核数量是2,所述第二最大池化层的池化核数量是2。
根据本发明实施例的第四方面,提供了一种训练图像模型装置,包括:
获取模块,用于获取待评估图像,所述待评估图像是红绿蓝三通道图像;
输入模块,在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
评估模块,获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数。
根据本发明实施例的第五方面,提供了一种图像的评估电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上述的方法。
根据本发明实施例的第六方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述的方法。
上述发明中的一个实施例具有如下优点或有益效果:因为获取待评估图像,待评估图像是红绿蓝三通道图像;在由完整物品图像训练得到的分类识别模型中,输入待评估图像,获取分类识别模型输出向量中待评估图像所属类别的元素,基于上述元素,得到待评估图像的物品完整程度分数。分类识别模型是由完整物品图像训练得到的,对于完整物品图像具有较高的识别度,以物品完整程度分数衡量待评估图像包括物品的完整性。因此能够准确辨别图像中物品的完整程度。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的图像的评估方法的主要流程的示意图;
图2是根据本发明实施例的分类识别模型的结构示意图;
图3是根据本发明实施例的训练分类训练模型的流程示意图;
图4是根据本发明实施例的以完整物品图像训练分类训练模型的示意图;
图5是根据本发明实施例的另一个训练分类训练模型的流程示意图;
图6是根据本发明实施例的待评估图像的物品完整程度分数的示意图;
图7是根据本发明实施例的训练图像模型方法的主要流程的示意图;
图8是根据本发明实施例的图像的评估装置的主要结构的示意图;
图9是根据本发明实施例的训练图像模型装置的主要结构的示意图;
图10是本发明实施例可以应用于其中的示例性系统架构图;
图11是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
以某网站展示的家电类物品为例,每件物品的展示图中可能包含物品的整体图,局部图和拆解图等。如果随机挑选上述图像生成物品宣传图,很大程度上会因为图像内容缺失,而影响最终的展示效果。如何挑选合适的展示图像,需要判断图像中包含物品的完整度。因此,存在难以辨别图像中物品完整程度的技术问题。
为了解决难以辨别图像中物品完整程度的技术问题,可以采用以下本发明实施例中的技术方案。
参见图1,图1是根据本发明实施例的图像的评估方法主要流程的示意图,在由完整物品图像训练得到的分类识别模型中,输入待评估图像,进而获知该待评估图像的物品完整程度分数。如图1所示,具体包括以下步骤:
S101、获取待评估图像,待评估图像是红绿蓝三通道图像。
在本发明实施例中,待评估图像中包括物品图像,作为一个示例,物品可以是手机等商品。待评估图像中物品,可以是物品整体图、物品局部图或物品拆解图。
显然,物品整体图包括物品完整的图像,物品局部图包括物品的部分图像,并不包括物品完整图像。物品拆解图包括拆解后物品的图像,可能并不包括物品完整图像。
示例性的,可以从存储待评估图像的服务器获取待评估图像,或是拍摄得到待评估图像。
需要说明的是,待评估图像是红绿蓝(RGB)三通道图像。彩色图像采用RGB三个通道合成彩色图像,所以可称之为三通道图像。
S102、在由完整物品图像训练得到的分类识别模型中,输入待评估图像。
在本发明实施例中,分类识别模型是由完整物品图像训练得到的。下面结合附图,首先说明训练得到分类识别模型的具体过程。
参见图2,图2是根据本发明实施例的分类识别模型的结构示意图,具体包括:两个卷积层,第一卷积层和第二卷积层;两个最大池化层,第一最大池化层和第二最大池化层;三个全连接层,第一全连接层,第二全连接层和第三全连接层。
卷积层由若干卷积单元组成。卷积运算的目的是提取输入图像的不同特征。
最大池化层可以将输入图像划分为若干个矩形区域,对每个区域输出最大值。
全连接层的每一个结点都与上一层的所有结点相连,用来将提取到的特征综合起来。
在上述分类识别模型结构的基础上,可以基于完整物品图像进行训练。在本发明实施例中,将进行训练的模型称为分类训练模型。分类训练模型完成训练后,即可以作为分类识别模型。分类识别模型用于识别待评估图像的物品完整程度。
可以理解的是,分类训练模型的结构与分类识别模型的结构相同,同样也包括两个卷积层,两个最大池化层和三个全连接层。
参见图3,图3是根据本发明实施例的训练分类训练模型的流程示意图,具体包括以下步骤:
S301、按照完整物品图像所包含物品类别,标记完整物品图像所属类别。
在本发明实施例中,分类识别模型的作用在于待评估图像所包括物品的完整程度。为了提高评估的准确性,则需要将包括完整物品图像作为训练图像。
完整物品图像中物品可以属于一个物品类别,则将该物品类别作为完整物品图像所属类别。作为一个示例,完整物品图像A中包括一台电视机的完整图像,则完整物品图像A所属类别为电视机。作为另一个示例,完整物品图像B中包括一台洗衣机的完整图像,则完整物品图像B所属类别为洗衣机。
也就是说,对于不同的类别,采用包括该类别物品的完整图像作为训练图像。训练得到的分类识别模型,则可以识别包括该类别物品图像的物品完整程度。
类别可以是按照物品功能、作用等预先设置的分类方式。
S302、将完整物品图像输入分类训练模型中,获取分类训练模型输出向量。
可以将完整物品图像作为训练图像,输入分类训练模型中。示例性,可以按照完整物品图像所属分类,依序将不同类别的完整物品图像作为训练图像。
作为一个示例,完整物品图像矩阵为3*32*32,由于完整物品图像是RGB三通道图像,则维数为3维。完整物品图像矩阵的行数与列数均等于32。
参见图4,图4是根据本发明实施例的以完整物品图像训练分类训练模型的示意图。
预设类别包括以下五种:空调;冰箱;洗衣机;电视;吸尘器。
完整物品图像包括冰箱,则该完整物品图像所属类别为冰箱。完整物品图像矩阵为3*32*32。
将完整物品图像输入第一卷积层。在本发明实施例中,经过多次训练获知第一卷积层的卷积核数量是5的情况下,可以准确评估物品完整程度分数,则可以将第一卷积层的卷积核设置为5。
第一卷积层的输出矩阵为:6*28*28。第一卷积层的输出矩阵,输入第一最大池化层。在本发明实施例中,经过多次训练获知第一最大池化层的池化核数量是2的情况下,可以准确评估物品完整程度分数,则可以将第一最大池化层的池化核设置为2。
第一最大池化层的输出矩阵为:6*14*14。第一最大池化层的输出矩阵,输入第二卷积层。在本发明实施例中,经过多次训练获知第二卷积层的卷积核数量是5的情况下,可以准确评估物品完整程度分数,则可以将第二卷积层的卷积核设置为5。
第二卷积层的输出矩阵为:16*10*10。第二卷积层的输出矩阵,输入第二最大池化层。在本发明实施例中,经过多次训练获知第二最大池化层的池化核数量是2的情况下,可以准确评估物品完整程度分数,则可以将第二最大池化层的池化核设置为2。
第二最大池化层的输出矩阵为:16*5*5。第二最大池化层是输出矩阵,输入第一全连接层。第一全连接层将3维矩阵转换为1维矩阵,则三维矩阵对应16*5*5=400个节点,即将400个节点与120个节点建立全连接。
第一全连接层的输出矩阵为:120*1。第一全连接层的输出矩阵,输入第二全连接层。第二全连接层,将120个节点与84个节点建立全连接。
第二全连接层的输出矩阵为:84*1。第二全连接层的输出矩阵,输入第三全连接层。第三连接层,将84个节点与5个节点建立全连接。
第三全连接层的输出矩阵为:5*1,即:(0.1,1.5,0.3,0.2,0.6)。
其中,分类训练模型输出向量为:(0.1,1.5,0.3,0.2,0.6)。需要说明的是,第一全连接层输出向量的长度:120;第二全连接层输出向量的长度:84;以及第三全连接层输出向量的长度:5。都是预先设置的参数,第三全连接层输出向量的维度等于待评估图像类别数量。
在上述图4实施例中,预设类别五种,则将第三全连接层输出向量的长度设置为5。
S303、根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值。
在图4中分类训练模型输出向量为:(0.1,1.5,0.3,0.2,0.6)。上述5个参数分别与空调,冰箱,洗衣机,电视,吸尘器相对应。每个参数代表类别分数。由于完整物品图像所属类别是冰箱,则完整物品图像的元素是:1.5。
在本发明实施例中,采用对数损失函数评估分类训练模型。对数损失函数主要在逻辑回归中使用,样本预测值和实际值的误差符合高斯分布,使用极大似然估计的方法,取对数得到损失函数。
参见公式(1),其中为对数损失函数:
其中,x表示第三全连接层输出的某一个元素,x|cls为正确类别编号对应的元素。j为第三全连接层输出元素的标号,j的取值范围大于等0,且小于等于第三全连接层输出元素数量。
作为一个示例,图4中第三全连接层输出向量为:(0.1,1.5,0.3,0.2,0.6),由于完整物品图像所属类别是冰箱,则完整物品图像的元素是:1.5。按照公式(2)计算该完整物品图像的损失值。
进而计算该完整物品图像的损失值等于-log(0.2544)=0.5944。
S304、完整物品图像的损失值小于预设损失值,则分类训练模型作为分类识别模型。
在本发明实施例中,可以预先设置损失值,以确定是否结束训练分类训练模型。其中,完整物品图像的损失值小于预设损失值,即损失值收敛到预设损失值,则说明可以结束训练分类训练模型,将该分类训练模型作为分类识别模型。示例性的,预设损失值等于10-5。
S305、完整物品图像的损失值大于或等于预设损失值,则将完整物品图像再次输入分类训练模型。
对于完整物品图像的损失值大于或等于预设损失值,即损失值未收敛到预设损失值,则说明需要继续训练分类训练模型,则将完整物品图像再次输入分类训练模型。
示例性的,预设损失值等于10-5。由于该完整物品图像的损失值=0.5944大于10-5,则将该完整物品图像再次输入分类训练模型。
可以理解的是,由于分类训练模型需要识别多种类别的完整物品图像。需要以多种类别的完整物品图像训练分类训练模型。
参见图5,图5是根据本发明实施例的另一个训练分类训练模型的流程示意图,对于分类训练模型的优化,还可以采用随机梯度下降的方式。具体包括:
S501、按照完整物品图像所包含物品类别,标记完整物品图像所属类别。
S501的方案与S401的方案相同,其目的均是标记完整物品图像所属类型。
S502、在包括完整物品图像的集合中,随机选择完整物品图像输入分类训练模型,获取分类训练模型输出向量。
完整物品图像可以存储于集合中。其中,完整物品图像分别属于不同的分类。如:完整物品图像1属于冰箱;完整物品图像2属于台灯。
在包括完整物品图像的集合中,随机选择完整物品图像输入分类训练模型。也就是说,输入分类训练模型中的完整物品图像,并不会按照预设规律输入,而是随机选择的完整物品图像。类似于图4中的实施例,获取分类训练模型输出向量。
S503、按照对数损失函数确定梯度方向,在梯度方向上以预设学习率训练分类训练模型,并根据分类训练模型输出向量中述完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值。
为了提高训练分类训练模型的速度,可以在梯度方向上以预设学习率训练分类训练模型。其中,梯度方向是由对数损失函数所确定。
作为一个示例,梯度方向可以通过对对数损失函数求导获得。学习率在梯度下降的过程中更新权重时的超参数。在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数,而不是通过训练得到的参数数据。
学习率越低,损失值的变化速度就越慢,需要花费过多的时间来收敛。而学习率过高容易发生梯度爆炸,损失值振动幅度较大却无法收敛到预设损失值,分类训练模型难以收敛。在本发明实施例中,经多次试验可以预设学习率为0.001。
S504、完整物品图像的损失值小于预设损失值,则再次随机选择完整物品图像输入分类训练模型;
完整物品图像的损失值小于预设损失值,即损失值收敛到预设损失值,则可以再次随机选择完整物品图像输入分类训练模型,以训练该分类训练模型。而当所有完整物品图像均已作为训练图像,训练分类训练模型,且每个完整物品图像的损失值小于预设损失值,该将该分类训练模型作为分类识别模型。
S505、完整物品图像的损失值大于或等于预设损失值,则将完整物品图像再次输入分类训练模型。
对于损失值大于或等于预设损失值,即损失值未收敛到预设损失值,则说明需要继续训练分类训练模型,则将完整物品图像再次输入分类训练模型。
在上述实施例中,对于分类训练模型的优化,在梯度方向以预设学习率训练分类训练模型,能够加快训练速度。
图2至图5涉及的技术方案是训练得到分类识别模型。可以将待评估图像输入分类识别模型,以获知待评估图像的物品完整程度分数。
S103、获取分类识别模型输出向量中待评估图像所属类别的元素,基于上述元素,评估待评估图像的物品完整程度分数。
将待评估图像输入分类识别模型后,分类识别输出向量。输出向量是一维向量,其长度是待评估图像类别数量。作为一个示例,待评估图像类别数量为5,即有5种待评估图像类别,则输出向量的长度是5,包括5个元素。
获取分类识别模型输出向量中待评估图像所属类别的元素。基于上述获取的元素,就可以评估待评估图像的物品完整程度分数。
作为一个示例,分类识别模型输出向量包括(A1,A2,A3,A4),其中待评估图像所属类别的元素为A1,则可以将上述输出向量做归一化处理,待评估图像的物品完整程度分数等于归一化处理后的A1。
参见图6,图6是根据本发明实施例的待评估图像的物品完整程度分数的示意图。图6中包括3张待评估图像,即左待评估图像,中待评估图像和右待评估图像。
分别将上述3张待评估图像输入分类识别模型中,进而可以基于分类识别模型输出向量评估该待评估图像的物品完整程度分数。
左待评估图像的物品完整程度分数是1,中待评估图像的物品完整程度分数是0.98,以及右待评估图像的物品完整程度分数使0.18。从物品完整程度分数,能够准确辨别图像中物品的完整程度。
参见图7,图7是根据本发明实施例的训练图像模型方法的主要流程的示意图,具体包括:
可以理解的是,图7中的技术方案与图3中的技术方案一致。图7步骤中的具体内容,可以参见图3中各步骤。
S701、按照完整物品图像所包含物品类别,标记完整物品图像所属类别。
S702、将完整物品图像输入分类训练模型中,获取分类训练模型输出向量。
S703、根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值。
S704、基于损失值训练分类训练模型,将完成训练的分类训练模型作为分类识别模型。
图8是根据本发明实施例的图像的评估装置的主要结构的示意图,图像的评估装置可以实现图像的评估方法,如图8所示,图像的评估装置具体包括:
获取模块801,用于获取待评估图像,待评估图像是红绿蓝三通道图像。
输入模块802,在由完整物品图像训练得到的分类识别模型中,输入待评估图像。
评估模块803,获取分类识别模型输出向量中待评估图像所属类别的元素,基于元素,评估待评估图像的物品完整程度分数。
在本发明的一个实施例中,分类识别模型包括:
顺序连接的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第一全连接层、第二全连接层和第三全连接层,第三全连接层的维度等于待评估图像类别数量。
在本发明的一个实施例中,第一卷积层的卷积核数量是5;第二卷积层的卷积核数量是5;
第一最大池化层的池化核数量是2,第二最大池化层的池化核数量是2。
在本发明的一个实施例中,还包括训练模块804,具体用于按照完整物品图像所包含物品类别,标记完整物品图像所属类别;
将完整物品图像输入分类训练模型中,获取分类训练模型输出向量;
根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值;
损失值小于预设损失值,则将分类训练模型作为分类识别模型;
损失值大于或等于预设损失值,则将完整物品图像再次输入分类训练模型。
在本发明的一个实施例中,训练模块804,具体用于按照完整物品图像所包含物品类别,标记完整物品图像所属类别;
在包括完整物品图像的集合中,随机选择完整物品图像输入分类训练模型,获取分类训练模型输出向量;
按照对数损失函数确定梯度方向,在梯度方向上以预设学习率训练分类训练模型,并根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值;
完整物品图像的损失值小于预设损失值,则再次随机选择完整物品图像输入分类训练模型;
完整物品图像的损失值大于或等于预设损失值,则将完整物品图像再次输入分类训练模型。
参见图9,图9是根据本发明实施例的训练图像模型装置的主要结构的示意图,训练图像模型装置可以实现训练图像模型方法,如图9所示,训练图像模型装置具体包括:
标记模块901,用于按照完整物品图像所包含物品类别,标记完整物品图像所属类别;
输出模块902,用于将完整物品图像输入分类训练模型中,获取分类训练模型输出向量;
计算模块903,用于根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值;
控制模块904,用于基于损失值训练分类训练模型,将完成训练的分类训练模型作为分类识别模型。
图10示出了可以应用本发明实施例的图像的评估方法或图像的评估装置的示例性系统架构1000。
如图10所示,系统架构1000可以包括终端设备1001、1002、1003,网络1004和服务器1005。网络1004用以在终端设备1001、1002、1003和服务器1005之间提供通信链路的介质。网络1004可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备1001、1002、1003通过网络1004与服务器1005交互,以接收或发送消息等。终端设备1001、1002、1003上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备1001、1002、1003可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器1005可以是提供各种服务的服务器,例如对用户利用终端设备1001、1002、1003所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的图像的评估方法一般由服务器1005执行,相应地,图像的评估装置一般设置于服务器1005中。
应该理解,图10中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图11,其示出了适于用来实现本发明实施例的终端设备的计算机系统1100的结构示意图。图11示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理单元(CPU)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统1100操作所需的各种程序和数据。CPU 1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:
获取待评估图像,所述待评估图像是红绿蓝三通道图像;
在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数。
根据本发明实施例的技术方案,因为获取待评估图像,待评估图像是红绿蓝三通道图像;在由完整物品图像训练得到的分类识别模型中,输入待评估图像,获取分类识别模型输出向量中待评估图像所属类别的元素,基于上述元素,得到待评估图像的物品完整程度分数。分类识别模型是由完整物品图像训练得到的,对于完整物品图像具有较高的识别度,以物品完整程度分数衡量待评估图像包括物品的完整性。因此能够准确辨别图像中物品的完整程度。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (9)
1.一种图像的评估方法,其特征在于,包括:
获取待评估图像,所述待评估图像是红绿蓝三通道图像;
在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数;
所述方法还包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
将所述完整物品图像输入分类训练模型中,获取所述分类训练模型输出向量;
根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照对数损失函数计算所述完整物品图像的损失值;
所述损失值小于预设损失值,则将所述分类训练模型作为所述分类识别模型;
所述损失值大于或等于预设损失值,则将所述完整物品图像再次输入所述分类训练模型。
2.根据权利要求1所述图像的评估方法,其特征在于,所述分类识别模型包括:
顺序连接的第一卷积层、第一最大池化层、第二卷积层、第二最大池化层、第一全连接层、第二全连接层和第三全连接层,所述第三全连接层的维度等于待评估图像类别数量。
3.根据权利要求2所述图像的评估方法,其特征在于,所述第一卷积层的卷积核数量是5;所述第二卷积层的卷积核数量是5;
所述第一最大池化层的池化核数量是2,所述第二最大池化层的池化核数量是2。
4.根据权利要求1所述图像的评估方法,其特征在于,所述方法还包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
在包括所述完整物品图像的集合中,随机选择完整物品图像输入分类训练模型,获取所述分类训练模型输出向量;
按照对数损失函数确定梯度方向,在所述梯度方向上以预设学习率训练所述分类训练模型,并根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照所述对数损失函数计算所述完整物品图像的损失值;
所述完整物品图像的损失值小于预设损失值,则再次随机选择完整物品图像输入所述分类训练模型;
所述完整物品图像的损失值大于或等于预设损失值,则将所述完整物品图像再次输入所述分类训练模型。
5.一种训练图像模型方法,其特征在于,包括:
按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
将所述完整物品图像输入分类训练模型中,获取所述分类训练模型输出向量;
根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照对数损失函数计算所述完整物品图像的损失值;
基于所述损失值训练所述分类训练模型,将完成训练的分类训练模型作为分类识别模型。
6.一种图像的评估装置,其特征在于,包括:
获取模块,用于获取待评估图像,所述待评估图像是红绿蓝三通道图像;
输入模块,在由完整物品图像训练得到的分类识别模型中,输入所述待评估图像;
评估模块,获取所述分类识别模型输出向量中所述待评估图像所属类别的元素,基于所述元素,评估所述待评估图像的物品完整程度分数训练模块,具体用于按照完整物品图像所包含物品类别,标记完整物品图像所属类别;
将完整物品图像输入分类训练模型中,获取分类训练模型输出向量;
根据分类训练模型输出向量中完整物品图像所属类别的元素,按照对数损失函数计算完整物品图像的损失值;
损失值小于预设损失值,则将分类训练模型作为分类识别模型;
损失值大于或等于预设损失值,则将完整物品图像再次输入分类训练模型。
7.一种训练图像模型装置,其特征在于,包括:
标记模块,用于按照完整物品图像所包含物品类别,标记所述完整物品图像所属类别;
输出模块,用于将所述完整物品图像输入分类训练模型中,获取所述分类训练模型输出向量;
计算模块,用于根据所述分类训练模型输出向量中所述完整物品图像所属类别的元素,按照对数损失函数计算所述完整物品图像的损失值;
控制模块,用于基于所述损失值训练所述分类训练模型,将完成训练的分类训练模型作为分类识别模型。
8.一种图像的评估电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1- 5中任一所述的方法。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911141261.4A CN111783813B (zh) | 2019-11-20 | 2019-11-20 | 图像的评估方法、训练图像模型方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911141261.4A CN111783813B (zh) | 2019-11-20 | 2019-11-20 | 图像的评估方法、训练图像模型方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111783813A CN111783813A (zh) | 2020-10-16 |
CN111783813B true CN111783813B (zh) | 2024-04-09 |
Family
ID=72755772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911141261.4A Active CN111783813B (zh) | 2019-11-20 | 2019-11-20 | 图像的评估方法、训练图像模型方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111783813B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018013982A1 (en) * | 2016-07-14 | 2018-01-18 | Google Llc | Classifying images using machine learning models |
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
CN108319972A (zh) * | 2018-01-18 | 2018-07-24 | 南京师范大学 | 一种针对图像语义分割的端到端差异网络学习方法 |
WO2018197585A1 (en) * | 2017-04-26 | 2018-11-01 | Skansense S.L.U. | Identifying targets within images |
CN109191453A (zh) * | 2018-09-14 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 用于生成图像类别检测模型的方法和装置 |
-
2019
- 2019-11-20 CN CN201911141261.4A patent/CN111783813B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018013982A1 (en) * | 2016-07-14 | 2018-01-18 | Google Llc | Classifying images using machine learning models |
WO2018120740A1 (zh) * | 2016-12-29 | 2018-07-05 | 深圳光启合众科技有限公司 | 图片分类方法和装置、机器人 |
WO2018197585A1 (en) * | 2017-04-26 | 2018-11-01 | Skansense S.L.U. | Identifying targets within images |
CN108319972A (zh) * | 2018-01-18 | 2018-07-24 | 南京师范大学 | 一种针对图像语义分割的端到端差异网络学习方法 |
CN109191453A (zh) * | 2018-09-14 | 2019-01-11 | 北京字节跳动网络技术有限公司 | 用于生成图像类别检测模型的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111783813A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108304435B (zh) | 信息推荐方法、装置、计算机设备及存储介质 | |
CN108307240B (zh) | 视频推荐方法和装置 | |
CN109919244B (zh) | 用于生成场景识别模型的方法和装置 | |
CN109947989B (zh) | 用于处理视频的方法和装置 | |
CN109961032B (zh) | 用于生成分类模型的方法和装置 | |
CN108629224A (zh) | 信息呈现方法和装置 | |
CN109344762B (zh) | 图像处理方法和装置 | |
CN108960316A (zh) | 用于生成模型的方法和装置 | |
CN108830329A (zh) | 图片处理方法和装置 | |
CN109377508B (zh) | 图像处理方法和装置 | |
CN111709398A (zh) | 一种图像识别的方法、图像识别模型的训练方法及装置 | |
CN111695041B (zh) | 用于推荐信息的方法和装置 | |
CN110929785A (zh) | 数据分类方法、装置、终端设备及可读存储介质 | |
EP4113376A1 (en) | Image classification model training method and apparatus, computer device, and storage medium | |
CN113450167A (zh) | 一种商品推荐方法和装置 | |
CN108595448A (zh) | 信息推送方法和装置 | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN113657087A (zh) | 信息的匹配方法及装置 | |
CN112766284A (zh) | 图像识别方法和装置、存储介质和电子设备 | |
CN109377284B (zh) | 用于推送信息的方法和电子设备 | |
CN107968743A (zh) | 推送信息的方法和装置 | |
US20230281696A1 (en) | Method and apparatus for detecting false transaction order | |
CN112749323A (zh) | 一种构建用户画像的方法和装置 | |
CN112348615B (zh) | 用于审核信息的方法和装置 | |
CN110413869B (zh) | 用于推送信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |