CN110851635A - 图片推送方法、装置、服务器和非易失性存储介质 - Google Patents
图片推送方法、装置、服务器和非易失性存储介质 Download PDFInfo
- Publication number
- CN110851635A CN110851635A CN201910939259.5A CN201910939259A CN110851635A CN 110851635 A CN110851635 A CN 110851635A CN 201910939259 A CN201910939259 A CN 201910939259A CN 110851635 A CN110851635 A CN 110851635A
- Authority
- CN
- China
- Prior art keywords
- picture
- pushed
- categories
- pictures
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 65
- 238000002372 labelling Methods 0.000 claims abstract description 35
- 238000012549 training Methods 0.000 claims abstract description 19
- 230000001537 neural effect Effects 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 19
- 235000013305 food Nutrition 0.000 claims description 13
- 210000005036 nerve Anatomy 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 7
- 238000013528 artificial neural network Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 3
- 238000011156 evaluation Methods 0.000 abstract description 4
- 230000010365 information processing Effects 0.000 abstract description 2
- 239000010410 layer Substances 0.000 description 32
- 230000003796 beauty Effects 0.000 description 14
- 230000009286 beneficial effect Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000002349 favourable effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 239000004278 EU approved seasoning Substances 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 235000011194 food seasoning agent Nutrition 0.000 description 1
- 235000021156 lunch Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 235000012054 meals Nutrition 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 235000021110 pickles Nutrition 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/535—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例涉及信息处理技术领域,公开了一种图片推送方法、装置、服务器和非易失性存储介质。上述图片推送方法包括:根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片,可以描述图片模棱两可的情况,提高对图片的评估的准确性。
Description
技术领域
本发明涉及信息处理技术领域,特别涉及一种图片推送方法、装置、服务器和非易失性存储介质。
背景技术
目前,外卖平台推荐系统经过多年发展,日趋成熟,推荐产品形式多样化且多以商户为主体,朝着实现所见即所得的方向发展。所见即所得旨在通过向用户推送真实的商品图片来吸引用户点击下单,提高外卖平台的用户粘性。
然而,发明人发现相关技术中至少存在以下问题:图片评估的传统做法是将图片划分为二分类,即非美即丑两种类别,忽略了图片模棱两可的情况,基于传统做法,对图片的评估不准确,向用户推送的图片难以清楚、准确的展示图片中的商品的相关信息,对用户的吸引力较低。
发明内容
本发明实施方式的目的在于提供一种图片推送方法,可以描述图片模棱两可的情况,使得对图片的评估更准确,向用户推送的图片能够清楚、准确的展示图片中的商品的相关信息,对用户的吸引力较高。
为解决上述技术问题,本发明的实施方式提供了一种图片推送方法,包括:根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
本发明的实施方式还提供了一种图片推送装置,包括:预估模块,用于根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;打分模块,用于根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;推送模块,用于根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
本发明的实施方式还提供了一种服务器,包括存储器和处理器,存储器存储计算机程序,处理器运行程序时执行上述图片推送方法。
本发明的实施方式还提供了一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行如上所述的图片推送方法。
本发明实施方式相对于现有技术而言,主要区别及其效果在于:根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,至少两个标注信息对应的图片种类数为至少三个类别,有利于准确快速的预估各待推送图片分属至少三个类别的类别概率,而且由于卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,即训练卷积神经网络模型的数据来源于被标注的图片的真实数据,参考价值高,可使得预估的类别概率更加准确、可靠。另外,图片具有至少两个标注,使得可以充分利用标注信息从而将图片的类别扩展为至少三种,避免图片被划分为非美即丑的类别,有利于描述图片模棱两可的状态。根据各待推送图片分属至少三个类别的类别概率,对各待推送图片进行打分,由于考虑到图片模棱两可的状态对应的类别,使得对图片的打分更加准确,从而使得对图片的评估更加准确。根据各待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片,使得用户可以看到对其吸引力较高的推送图片,即能够通过推送的图片清楚、准确的看出图片中想要展示的商品的相关信息,有利于提高用户体验。
另外,所述卷积神经网络模型包括神经单元和全连接层,所述根据用于预估类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率,包括:利用所述神经单元提取各所述待推送图片的特征;将提取的所述特征输入所述全连接层后,利用softmax函数输出预估的各所述待推送图片分属所述至少三个类别的类别概率。相关技术中通常通过人工提取图片特征的方法,人工提取往往仅关注图片的一些表层、局部特征,不能全面的描述图片信息。本发明实施方式中,利用卷积神经网络模型的神经单元能够较为全面地提取与图片相关的底层以及高层抽象特征,从而使得通过全连接层以及softmax函数后输出的类别概率更加准确。
另外,所述卷积神经网络模型具体为残差神经网络ResNet模型;所述利用所述神经单元提取各所述待推送图片的特征,具体为:利用所述ResNet模型的残差神经单元提取各所述待推送图片的特征。通过ResNet模型的残差神经单元,有利于更全面地提取图片相关的底层以及高层抽象特征。
另外,所述ResNet模型具体为:50层的残差神经网络模型,有利于更全面、准确地提取图片相关的底层以及高层抽象特征。
另外,所述根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分,包括:根据各所述待推送图片分属所述至少三个类别的类别概率和预设的所述至少三个类别分别对应的类别分数,对各待推送图片进行打分,使得可以给出连续的分数来量化不同图片的美感程度,进一步提高对图片的美感评估的准确性。
另外,具体通过以下公式对各待推送图片进行打分:
yi=arg(pi)+1
其中,所述pi为预估的待推送图片属于第i种类别的类别概率,0≤i≤N-1,N≥3,所述yi为所述第i种类别对应的类别分数,所述N为所述至少两人的标注信息对应的图片种类数,所述arg(pi)为用于提取所述i的函数,所述score为所述待推送图片的分数。本发明实施方式提供了一种具体的打分公式,使得可以更加方便准确的为各待推送图片进行打分,从而可以利用图片的分数,对图片是否能清楚完整的展示商品进行准确的衡量。
附图说明
图1是根据本发明第一实施方式中的图片推送方法的流程图;
图2是根据本发明第二实施方式中的图片推送方法的流程图;
图3是根据本发明第三实施方式中的图片推送装置示意图;
图4是根据本发明第四实施方式提供的服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
本发明的第一实施方式涉及一种图片推送方法,应用于服务器,服务器向用户对应的终端推送图片,其中,终端可以为手机、电脑等。比如,服务器推送的图片可以为外卖平台上的美食图片,服务器对各待推送的美食图片进行评估后,将能够真实、全面的反映美食信息的美食图片推送至用户使用的手机,使得用户在外卖平台上可以通过浏览的美食图片,了解到美食的相关信息,如食材、色泽、用量、外形等信息。可以理解的是,向用户展示的美食图片越真实、越能反映美食的特点,对用户的吸引力越大,用户点击该美食图片的可能性也就较大。下面对本实施方式的图片推送方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
本实施方式的图片推送方法的流程图可以如图1所示,该方法包括:
步骤S101,根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率。
其中,卷积神经网络模型预先根据若干携带有至少两人的标注信息的图片数据训练得到,至少两人的标注信息对应的图片种类数为至少三个类别。在标注时,可以主要考虑以下几个方面:图片是否为非实物图片(漫画、菜单海报拍摄),图片是否为手机拍摄且过于草率,图片中器皿是否过于简陋,图片中食材是否难以辨识,图片中是否无单独成餐的商品(如调味料、餐饮店罐装饮料、米饭、小菜、餐盒、纯标语、二维码等),图片中商品主体位置是否太靠上或太靠下,左右是否留白,图片是否模糊或变形,水印、标语过多等等。每张图片由至少两个人标注,标注的信息可以为是或者否。可以理解的是,如果每张图片由两个人标注,那么每张图片共有三种可能的情况:2个是、1个是、2个否,对应的类别可以为:丑、一般、美三类。如果每张图片由三个人标注,那么每张图片共有四种可能的情况:3个是、2个是、2个否、3个否,对应的类别可以为:丑、较丑、较美、美四类。上述方式有效的避免了传统做法中将图片规整为二分类,即非美即丑两种类别。需要说明的是,本实施方式中,只是为方便理解介绍了两人标注和三人标注的类别情况,但在具体实现中,并不以此为限。需要说明的是,上述关于图片的标注只是以通过人标注为例,在具体实现中还可以通过预先配置好的设备、机器人等自动化装置实现对图片的标注,然而本实施方式对此不做具体限定。
具体的说,服务器可以利用训练好的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率。在一个例子中,待推送图片可以为用于吸引用户购买美食的美食图片,比如外卖平台上的美食图片。服务器可以获取美食图片的rgb三通道数据矩阵,将美食图片的rgb三通道数据矩阵作为卷积神经网络模型的输入,使得卷积神经网络模型可以输出该美食图片分属至少三个类别的类别概率。
在一个例子中,训练卷积神经网络模型时,每张图片携带有两个标注信息,则训练好的卷积神经网络模型可以输出美食图片分属三个类别的类别概率,即美食图片分别属于丑、一般、美这三个类别的类别概率。
在另一个例子中,训练卷积神经网络模型时,每张图片携带有三个标注信息,则训练好的卷积神经网络模型可以输出美食图片分属四个类别的类别概率,即美食图片分别属于丑、较丑、较美、美这四个类别的类别概率。
步骤S102,根据各待推送图片分属至少三个类别的类别概率,对各待推送图片进行打分。
具体的说,可以预先设置至少三个类别分别对应的类别分数,可以理解的是,表征美感程度越高的类别预设的类别分数越高。比如,丑、较丑、较美、美这四个类别的类别分数依次增大。服务器可以根据各待推送图片分属至少三个类别的类别概率和预设的至少三个类别分别对应的类别分数,对各待推送图片进行打分。比如,将各类别概率看作是各类别的分布权重,通过加权求和来得出最后的美食图片的得分,即待推送图片的最后得分可以为各类别的类别概率与各类别的类别分数的乘积之和。
在一个例子中,可以通过如下公式对各待推送图片进行打分:
yi=arg(pi)+1
其中,pi为预估的待推送图片属于第i种类别的类别概率,0≤i≤N-1,N≥3,N为至少两人的标注信息对应的图片种类数。假设N=3,即图片种类数可以分为3种,3种类别可以分别为:丑、一般、美。具体的,p0为预估的待推送图片属于第0种类别的类别概率,可以表示预估的待推送图片属于“丑”这一类别的类别概率,p1为预估的待推送图片属于第1种类别的类别概率,可以表示预估的待推送图片属于“一般”这一类别的类别概率,p2为预估的待推送图片属于第2种类别的类别概率,可以表示预估的待推送图片属于“美”这一类别的类别概率。也就是说,p0、p1、p2可以分别表示待推送图片属于丑、一般、美的类别概率。另外,上述公式中yi为第i种类别对应的类别分数,arg(pi)为用于提取i的函数,score为待推送图片的分数。需要说明的是,通常在具体实现中,类别概率值的下标是从0开始的,因此,可以利用arg函数提取概率值对应的下标,该下标需加1来达到类别分数从1开始而不是从0开始的目的。可以理解的是,本示例中,预先设置的至少三个类别分别对应的类别分数可以从1开始随着美感程度的增加而增加,比如丑、较丑、较美、美这四个类别的类别分数依次为1、2、3、4。需要说明的是,本实施方式中,四个类别的类别分数只是以1、2、3、4为例,但在具体实现中并不以此为限。
步骤S103,根据各待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
其中,预设阈值可以根据实际需要进行设置,对此本实施方式不做具体限定。
在一个例子中,服务器可以将每张待推送图片的分数均与预设阈值进行比较,将分数大于预设阈值的待推送图片推送至用户对应的终端。
在另一个例子中,服务器还可以根据每张待推送图片的分数对各待推送图片进行排序,分数高的排在前,然后,将排在前N位的待推送图片推送至用户对应的终端。其中,N为自然数,可以根据实际需要设置其大小,对此本实施方式不做具体限定。
以外卖平台的美食图片推送场景为例,假设训练卷积神经网络模型时每张图片携带有三个标注信息,则卷积神经网络模型输出的类别概率包括丑、较丑、较美、美四个类别的类别概率。服务器通过训练得到的卷积神经网络模型,预估外卖平台上待推送的各美食图片分属丑、较丑、较美、美四个类别的类别概率。假设预设的丑、较丑、较美、美四个类别的类别分数分别为1、2、3、4,则待推送的美食图片的最终得分为:四个类别的类别概率分别与四个类别的类别分数的乘积之和。最后,服务器将各待推送图片的分数与预设阈值对比,将分数大于预设阈值的美食图片推送至用户的手机,使得用户浏览的外卖平台上推送的美食图片均为能够全面、真实的反映美食特点的且美感程度较高的美食图片,有利于吸引用户点击下单。
需要说明的是,本实施方式中的上述各示例均为为方便理解进行的举例说明,并不对本发明的技术方案构成限定。
与现有技术相比,本实施方式中,根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,至少两个标注信息对应的图片种类数为至少三个类别,有利于准确快速的预估各待推送图片分属至少三个类别的类别概率,而且由于卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,即训练卷积神经网络模型的数据来源于被标注的图片的真实数据,参考价值高,可使得预估的类别概率更加准确、可靠。另外,图片具有至少两个标注,使得可以充分利用标注信息从而将图片的类别扩展为至少三种,避免图片被划分为非美即丑的类别,有利于描述图片模棱两可的状态。根据各待推送图片分属至少三个类别的类别概率,对各待推送图片进行打分,由于考虑到图片模棱两可的状态对应的类别,使得对图片的打分更加准确,从而对图片的美感程度进行准确的衡量。根据各待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片,使得用户可以看到对其吸引力较高的推送图片,即能够通过推送的图片清楚、准确的看出图片中想要展示的商品的相关信息,有利于提高用户体验。
本发明的第二实施方式涉及一种图片推送方法,如图2所示,包括:
步骤S201,利用卷积神经网络模型的神经单元提取各待推送图片的美感特征。
具体的说,卷积神经网络模型包括神经单元和全连接层。本实施方式中,可以利用神经单元提取各待推送图片的特征,其中,图片的特征可以包括清晰度、形变系数、景深、纹理、颜色对比度、饱和度等。
在一个例子中,卷积神经网络模型可以为残差神经网络ResNet模型,提取美感特征时,可以利用ResNet模型的残差神经单元提取待推送图片的特征,该方法提取的特征可以较为全面描述待推送图片的特征。
在一个例子中,ResNet模型可以为50层的ResNet模型,表示为ResNet-50模型。ResNet-50模型可以通过层层残差神经单元提取待推送图片的特征,使得提取的特征更加全面、准确。
步骤S202,将提取的美感特征输入全连接层后,利用softmax函数输出预估的各待推送图片分属至少三个类别的类别概率。
具体的说,可以将神经单元提取的各待推送图片的特征输入全连接层后,再利用softmax函数输出预估的各待推送图片分属至少三个类别的类别概率。其中,softmax函数的输出可以代表图片的类别分布概率,即有k个可能结果的概率分布,本实施方式中k大于或等于3。
在一个例子中,softmax函数的输出可以为图片分属于丑、较丑、较美、美四个类别的类别概率,具体的,可以通过如以公式输出待推送图片分属4个类别的类别概率:
p=Softmax(fc(ResNet50(input)))
其中,p=[p0,p1,p2,p3],分别表示丑、较丑、较美、美四个类别的类别概率,input表示输入的待推送图片的rgb三通道数据矩阵,ResNet50(input)表示ResNet-50模型的残差神经单元提取的特征,fc(ResNet50(input))表示提取的特征通过ResNet-50模型的全连接层(fully connected layer,简称fc)后的输出,Softmax(fc(ResNet50(input)))表示softmax函数的输出的图片分属于丑、较丑、较美、美四个类别的类别概率。
步骤S203,根据各待推送图片分属至少三个类别的类别概率,对各待推送图片进行打分。
步骤S204,根据各待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
需要说明的是,步骤S203至步骤S204分别与第一实施方式中步骤S102至步骤S103大致相同,为避免重复,在此不再一一赘述。
本实施方式中,利用卷积神经网络模型的神经单元能够较为全面地提取与图片相关的底层以及高层抽象特征,从而使得通过全连接层以及softmax函数后输出的类别概率更加准确。另外,卷积神经网络模型可以为ResNet模型,通过ResNet模型的残差神经单元,有利于更全面地提取图片相关的底层以及高层抽象特征。而且,ResNet模型还可以为50层的ResNet模型,有利于更全面、准确地提取图片相关的底层以及高层抽象特征。
上面各种方法的步骤划分,只是为了描述清楚,实现时可以合并为一个步骤或者对某些步骤进行拆分,分解为多个步骤,只要包括相同的逻辑关系,都在本专利的保护范围内;对算法中或者流程中添加无关紧要的修改或者引入无关紧要的设计,但不改变其算法和流程的核心设计都在该专利的保护范围内。
本发明的第三实施方式涉及一种图片推送装置,如图3所示,该装置包括:预估模块301,用于根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;打分模块302,用于根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;推送模块303,用于根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
在一个例子中,所述卷积神经网络模型包括神经单元和全连接层,所述根据用于预估类别概率的卷积神经网络模型,预估模块301预估各待推送图片分属至少三个类别的类别概率,包括:利用所述神经单元提取各所述待推送图片的特征;将提取的所述特征输入所述全连接层后,利用softmax函数输出预估的各所述待推送图片分属所述至少三个类别的类别概率。
在一个例子中,所述卷积神经网络模型具体为残差神经网络ResNet模型;所述预估模块301利用所述神经单元提取各所述待推送图片的特征,具体为:利用所述ResNet模型的残差神经单元提取各所述待推送图片的特征。
在一个例子中,所述ResNet模型具体为:50层的残差神经网络模型。
在一个例子中,打分模块302根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分,包括:根据各所述待推送图片分属所述至少三个类别的类别概率和预设的所述至少三个类别分别对应的类别分数,对各待推送图片进行打分。
在一个例子中,打分模块302具体通过以下公式对各待推送图片进行打分:
yi=arg(pi)+1
其中,所述pi为预估的待推送图片属于第i种类别的类别概率,0≤i≤N-1,N≥3,所述yi为所述第i种类别对应的类别分数,所述N为所述至少两人的标注信息对应的图片种类数,所述arg(pi)为用于提取所述i的函数,所述score为所述待推送图片的分数。
在一个例子中,所述待推送图片为用于吸引用户购买美食的美食图片。
与现有技术相比,本实施方式中,预估模块根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,至少两个标注信息对应的图片种类数为至少三个类别,有利于准确快速的预估各待推送图片分属至少三个类别的类别概率,而且由于卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,即训练卷积神经网络模型的数据来源于被标注的图片的真实数据,参考价值高,可使得预估的类别概率更加准确、可靠。另外,图片具有至少两个标注,使得可以充分利用标注信息从而将图片的类别扩展为至少三种,避免图片被划分为非美即丑的类别,有利于描述图片模棱两可的状态。打分模块根据各待推送图片分属至少三个类别的类别概率,对各待推送图片进行打分,由于考虑到图片模棱两可的状态对应的类别,使得对图片的打分更加准确,从而对图片的美感程度进行准确的衡量。推送模块根据各待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片,使得用户可以看到对其吸引力较高的推送图片,即能够通过推送的图片清楚、准确的看出图片中想要展示的商品的相关信息。
不难发现,本实施方式为与第一、二实施方式相对应的装置实施例,本实施方式可与第一、二实施方式互相配合实施。第一、二实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在第一、二实施方式中。
值得一提的是,本实施方式中所涉及到的各模块均为逻辑模块,在实际应用中,一个逻辑单元可以是一个物理单元,也可以是一个物理单元的一部分,还可以以多个物理单元的组合实现。此外,为了突出本发明的创新部分,本实施方式中并没有将与解决本发明所提出的技术问题关系不太密切的单元引入,但这并不表明本实施方式中不存在其它的单元。
本发明的第四实施方式涉及一种服务器,如图4所示,该服务器包括:至少一个处理器401;以及,与至少一个处理器401通信连接的存储器402;以及,与扫描装置通信连接的通信组件403,通信组件403在处理器401的控制下接收和发送数据;其中,存储器402存储有可被至少一个处理器401执行的指令,指令被至少一个处理器401执行以实现:
根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
具体地,该服务器包括:一个或多个处理器401以及存储器402,图4中以一个处理器401为例。处理器401、存储器402可以通过总线或者其他方式连接,图4中以通过总线连接为例。存储器402作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。处理器401通过运行存储在存储器402中的非易失性软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述图片推送方法。
存储器402可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储选项列表等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施方式中,存储器402可选包括相对于处理器401远程设置的存储器402,这些远程存储器402可以通过网络连接至外接设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
一个或者多个模块存储在存储器402中,当被一个或者多个处理器401执行时,执行上述任意方法实施方式中的图片推送方法。
上述产品可执行本申请实施方式所提供的方法,具备执行方法相应的功能模块和有益效果,未在本实施方式中详尽描述的技术细节,可参见本申请实施方式所提供的方法。
本发明的第五实施方式涉及一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行上述部分或全部的方法实施例。
即,本领域技术人员可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
本申请实施例提供了A1.一种图片推送方法,包括:
根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
A2.根据A1所述的图片推送方法,所述卷积神经网络模型包括神经单元和全连接层,所述根据用于预估类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率,包括:
利用所述神经单元提取各所述待推送图片的特征;
将提取的所述特征输入所述全连接层后,利用softmax函数输出预估的各所述待推送图片分属所述至少三个类别的类别概率。
A3.根据A2所述的图片推送方法,所述卷积神经网络模型具体为残差神经网络ResNet模型;所述利用所述神经单元提取各所述待推送图片的特征,具体为:
利用所述ResNet模型的残差神经单元提取各所述待推送图片的特征。
A4.根据A3所述的图片推送方法,所述ResNet模型具体为:50层的残差神经网络模型。
A5.根据A1所述的图片推送方法,所述根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分,包括:
根据各所述待推送图片分属所述至少三个类别的类别概率和预设的所述至少三个类别分别对应的类别分数,对各待推送图片进行打分。
A6.根据A5所述的图片推送方法,具体通过以下公式对各待推送图片进行打分:
yi=arg(pi)+1
其中,所述pi为预估的待推送图片属于第i种类别的类别概率,0≤i≤N-1,N≥3,所述yi为所述第i种类别对应的类别分数,所述N为所述至少两人的标注信息对应的图片种类数,所述arg(pi)为用于提取所述i的函数,所述score为所述待推送图片的分数。
A7.根据A1至A6任一项所述的图片推送方法,所述待推送图片为用于吸引用户购买美食的美食图片。
本申请实施例还提供了B1.一种图片推送装置,包括:
预估模块,用于根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
打分模块,用于根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
推送模块,用于根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
本申请实施例还提供了C1.一种服务器,包括存储器和处理器,存储器存储计算机程序,处理器运行程序时执行:
根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
C2.根据C1所述的服务器,所述卷积神经网络模型包括神经单元和全连接层,所述根据用于预估类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率,包括:
利用所述神经单元提取各所述待推送图片的特征;
将提取的所述特征输入所述全连接层后,利用softmax函数输出预估的各所述待推送图片分属所述至少三个类别的类别概率。
C3.根据C2所述的服务器,所述卷积神经网络模型具体为残差神经网络ResNet模型;所述利用所述神经单元提取各所述待推送图片的特征,具体为:
利用所述ResNet模型的残差神经单元提取各所述待推送图片的特征。
C4.根据C3所述的服务器,所述ResNet模型具体为:50层的残差神经网络模型。
C5.根据C1所述的服务器,所述根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分,包括:
根据各所述待推送图片分属所述至少三个类别的类别概率和预设的所述至少三个类别分别对应的类别分数,对各待推送图片进行打分。
C6.根据C5所述的服务器,具体通过以下公式对各待推送图片进行打分:
yi=arg(pi)+1
其中,所述pi为预估的待推送图片属于第i种类别的类别概率,0≤i≤N-1,N≥3,所述yi为所述第i种类别对应的类别分数,所述N为所述至少两人的标注信息对应的图片种类数,所述arg(pi)为用于提取所述i的函数,所述score为所述待推送图片的分数。
C7.根据C1至C6中任一项所述的服务器,所述待推送图片为用于吸引用户购买美食的美食图片。
本申请实施例还提供了D1.一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行A1至A7中任一项所述的图片推送方法。
Claims (10)
1.一种图片推送方法,其特征在于,包括:
根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
2.根据权利要求1所述的图片推送方法,其特征在于,所述卷积神经网络模型包括神经单元和全连接层,所述根据用于预估类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率,包括:
利用所述神经单元提取各所述待推送图片的特征;
将提取的所述特征输入所述全连接层后,利用softmax函数输出预估的各所述待推送图片分属所述至少三个类别的类别概率。
3.根据权利要求2所述的图片推送方法,其特征在于,所述卷积神经网络模型具体为残差神经网络ResNet模型;所述利用所述神经单元提取各所述待推送图片的特征,具体为:
利用所述ResNet模型的残差神经单元提取各所述待推送图片的特征。
4.根据权利要求3所述的图片推送方法,其特征在于,所述ResNet模型具体为:50层的残差神经网络模型。
5.根据权利要求1所述的图片推送方法,其特征在于,所述根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分,包括:
根据各所述待推送图片分属所述至少三个类别的类别概率和预设的所述至少三个类别分别对应的类别分数,对各待推送图片进行打分。
7.根据权利要求1至6任一项所述的图片推送方法,其特征在于,所述待推送图片为用于吸引用户购买美食的美食图片。
8.一种图片推送装置,其特征在于,包括:
预估模块,用于根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据训练得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
打分模块,用于根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
推送模块,用于根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
9.一种服务器,包括存储器和处理器,存储器存储计算机程序,处理器运行程序时执行:
根据用于预估不同类别的类别概率的卷积神经网络模型,预估各待推送图片分属至少三个类别的类别概率;其中,所述卷积神经网络模型预先根据若干携带有至少两个标注信息的图片数据得到,所述至少两个标注信息对应的图片种类数为至少三个类别;
根据各所述待推送图片分属所述至少三个类别的类别概率,对各所述待推送图片进行打分;
根据各所述待推送图片的分数,向用户对应的终端推送分数大于预设阈值的待推送图片。
10.一种非易失性存储介质,用于存储计算机可读程序,所述计算机可读程序用于供计算机执行如权利要求1至7中任一项所述的图片推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910939259.5A CN110851635A (zh) | 2019-09-30 | 2019-09-30 | 图片推送方法、装置、服务器和非易失性存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910939259.5A CN110851635A (zh) | 2019-09-30 | 2019-09-30 | 图片推送方法、装置、服务器和非易失性存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110851635A true CN110851635A (zh) | 2020-02-28 |
Family
ID=69596253
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910939259.5A Pending CN110851635A (zh) | 2019-09-30 | 2019-09-30 | 图片推送方法、装置、服务器和非易失性存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110851635A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401428A (zh) * | 2020-03-12 | 2020-07-10 | Oppo广东移动通信有限公司 | 一种图像分类方法、装置、电子设备和存储介质 |
CN113907762A (zh) * | 2021-10-18 | 2022-01-11 | 浙江好络维医疗技术有限公司 | 一种可穿戴设备上的ecg信号的干扰波识别方法 |
CN116150420A (zh) * | 2023-04-23 | 2023-05-23 | 北京微应软件科技有限公司 | 一种图片任务推送结果的评估方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742107A (zh) * | 2017-10-20 | 2018-02-27 | 北京达佳互联信息技术有限公司 | 人脸图像分类方法、装置及服务器 |
CN108647696A (zh) * | 2018-05-08 | 2018-10-12 | 北京三快在线科技有限公司 | 图片颜值确定方法及装置、电子设备、存储介质 |
CN110069651A (zh) * | 2017-10-23 | 2019-07-30 | 腾讯科技(北京)有限公司 | 图片筛选方法及装置、存储介质 |
-
2019
- 2019-09-30 CN CN201910939259.5A patent/CN110851635A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107742107A (zh) * | 2017-10-20 | 2018-02-27 | 北京达佳互联信息技术有限公司 | 人脸图像分类方法、装置及服务器 |
CN110069651A (zh) * | 2017-10-23 | 2019-07-30 | 腾讯科技(北京)有限公司 | 图片筛选方法及装置、存储介质 |
CN108647696A (zh) * | 2018-05-08 | 2018-10-12 | 北京三快在线科技有限公司 | 图片颜值确定方法及装置、电子设备、存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111401428A (zh) * | 2020-03-12 | 2020-07-10 | Oppo广东移动通信有限公司 | 一种图像分类方法、装置、电子设备和存储介质 |
CN113907762A (zh) * | 2021-10-18 | 2022-01-11 | 浙江好络维医疗技术有限公司 | 一种可穿戴设备上的ecg信号的干扰波识别方法 |
CN116150420A (zh) * | 2023-04-23 | 2023-05-23 | 北京微应软件科技有限公司 | 一种图片任务推送结果的评估方法和系统 |
CN116150420B (zh) * | 2023-04-23 | 2023-08-11 | 北京微应软件科技有限公司 | 一种图片任务推送结果的评估方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110909176B (zh) | 数据推荐方法、装置、计算机设备以及存储介质 | |
CN110737783B (zh) | 一种推荐多媒体内容的方法、装置及计算设备 | |
CN110851635A (zh) | 图片推送方法、装置、服务器和非易失性存储介质 | |
US11544510B2 (en) | System and method for multi-modal image classification | |
CN111784455A (zh) | 一种物品推荐方法及推荐设备 | |
WO2019144892A1 (zh) | 数据处理方法、装置、存储介质和电子装置 | |
CN107784372B (zh) | 目标对象属性的预测方法、装置和系统 | |
US20130346182A1 (en) | Multimedia features for click prediction of new advertisements | |
CN111144933B (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
US20180012251A1 (en) | Systems and methods for an attention-based framework for click through rate (ctr) estimation between query and bidwords | |
CN117350825B (zh) | 基于大语言模型的导购方法和系统 | |
CN112287238B (zh) | 用户特征的确定方法和装置、存储介质及电子设备 | |
CN112068962B (zh) | 一种基于深度学习的云渲染资源兑换方法 | |
CN110223358A (zh) | 可视图案设计方法、训练方法、装置、系统及存储介质 | |
CN111259257A (zh) | 一种信息展示方法、系统、装置、电子设备及存储介质 | |
CN111159242B (zh) | 一种基于边缘计算的客户端重排序方法及系统 | |
CN116401420A (zh) | 基于多模态特征融合的搜索方法、装置、介质及设备 | |
Magassouba et al. | Predicting and attending to damaging collisions for placing everyday objects in photo-realistic simulations | |
CN111522979A (zh) | 图片排序推荐方法、装置、电子设备、存储介质 | |
CN114862480A (zh) | 广告投放定向方法及其装置、设备、介质、产品 | |
CN117391776B (zh) | 广告投放方法及装置、电子设备、存储介质 | |
CN117271818B (zh) | 视觉问答方法、系统、电子设备及存储介质 | |
CN110458602A (zh) | 商品推荐方法、装置、电子设备及存储介质 | |
Zhang et al. | Understanding and predicting cross-cultural food preferences with online recipe images | |
CN112949501B (zh) | 一种从示教视频学习物体的可供性方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200228 |