CN109801138A - 商品图片的搜索方法及装置 - Google Patents
商品图片的搜索方法及装置 Download PDFInfo
- Publication number
- CN109801138A CN109801138A CN201910053686.3A CN201910053686A CN109801138A CN 109801138 A CN109801138 A CN 109801138A CN 201910053686 A CN201910053686 A CN 201910053686A CN 109801138 A CN109801138 A CN 109801138A
- Authority
- CN
- China
- Prior art keywords
- commodity picture
- commodity
- picture
- information
- end article
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种商品图片的搜索方法及装置,方法包括:接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。本发明除根据目标商品搜索词本身进行搜索,还基于目标店铺信息的本身,对商品图片进行限定,以保障得到的商品图片更满足用户所属店铺本身的需求。
Description
技术领域
本发明涉及软件领域,具体涉及一种商品图片的搜索方法及装置。
背景技术
互联网+时代,使得人们的生活变得越来越便捷和高效,购票、出行、找房、订餐等服务均可以通过APP应用轻松实现。互联网本地生活领域的发展,扩大了传统行业的服务半径,提高了传统行业的效能,节约了成本。在将传统行业提供的服务由APP应用实现时,需要对各种数据进行数字化、标准化处理,以完成将商家的商品信息录入至APP应用中,以提供APP应用服务。
商品信息以菜品为例,其信息包括但不局限于菜名、价格、规格、口味、图片等。其中图片是一个必不可少,同时又是比较难获得的信息。由于菜品图片的拍照成本相对较高,特别是高质量的菜品图片。而且对于商家而言,短期内对所有的菜品进行拍照得到菜品照片也有一定的难度,因此,急需一种根据菜品名称直接获取到对应的菜品图片的方法。现有的搜索技术中,搜索引擎可以根据菜品名称搜索图片,但是对于商家而言,搜索得到的菜品图片会长期展示在APP应用上,方便消费者浏览,以吸引消费者。这对得到的图片本身的质量、与菜品名称的匹配度、图片是否适用于当前菜品等方面都提出了更高的要求,而现有搜索技术仅能提供搜索图片,而对得到的图片质量无法保障。进一步,由于图片可以被不同商家的用户使用,但当同一图片重复被多个不同商家的用户使用时,无法突出各个商家的商品特色,影响消费者对商品的印象,无法更好的吸引消费者。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的商品图片的搜索方法及装置。
根据本发明的一个方面,提供了一种商品图片的搜索方法,其包括:
接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,目标店铺信息为根据用户登录信息得到的其所属的店铺信息;根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。
可选地,方法还包括:建立商品图片库;
其中,商品图片库的建立过程包括:收集多个商品图片以及对应的商品图片信息;其中,商品图片信息至少包含商品名称;将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中,并建立商品图片与商品名称的对应关系;根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。
可选地,商品图片信息还包含:商品类别信息、所属店铺类别信息和/或审核标记信息。
可选地,商品图片库的建立过程还包括:根据各个商品图片的被搜索情况,更新各个商品图片的被搜索总次数;根据各个商品图片的被使用情况,更新各个商品图片的被使用总次数。
可选地,在将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中之前,商品图片库的建立过程还包括:对商品名称进行标准化处理;其中,标准化处理包括:去除非商品属性字符和/或去除规格信息。
可选地,商品图片信息还包含:商品图片特征信息;收集多个商品图片以及对应的商品图片信息进一步包括:对商品图片进行特征分析,得到商品图片特征信息;其中,商品图片特征信息包括:图片清晰度、图片大小、是否存在非商品干扰因子、是否非商品类图片、是否店铺门面图片、是否二维码图片和/或是否非法图片。
可选地,在将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中之前,商品图片库的建立过程还包括:过滤商品图片特征信息低于预设图片标准的商品图片。
可选地,在将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中之前,商品图片库的建立过程还包括:判断收集的多个商品图片中是否存在多个相同的商品图片,或者判断收集的多个商品图片中的一个或多个与商品图片库中已存储的商品图片是否相同;若是,对相同的商品图片进行去重,并将相同的商品图片对应的商品名称进行聚合处理,更新去重处理后的商品图片的商品名称。
可选地,商品图片库的建立过程还包括:为商品名称建立倒排索引。
可选地,根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合进一步包括:根据目标店铺信息获取目标店铺类别;将目标商品搜索词与商品图片库中各个商品图片的商品名称进行匹配,获取相匹配的商品名称对应的所有商品图片作为候选商品图片集合;从候选商品图片集合中去除商品图片的所属店铺类别信息与目标店铺类别不匹配的商品图片,得到商品图片集合。
可选地,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数具体为:根据目标店铺位置确定目标店铺所在区域值,其中,目标店铺所在区域值具体为目标店铺位置的geohash值;预设区域范围具体为依据目标店铺位置的geohash值所指定的区域范围;根据商品图片集合中各商品图片被使用位置的geohash值以及每个被使用位置对应的被使用次数,确定商品图片集合中各商品图片在预设区域范围内的被使用次数;根据商品图片集合中各商品图片在预设区域范围内的被使用次数对各商品图片由少到多排序。
可选地,预设排序因子还包括:商品名称与目标商品搜索词的匹配度;和/或,商品类别信息与目标店铺的商品类别信息的匹配度;和/或,所属店铺类别信息与目标店铺类别的匹配度;和/或,审核标记信息。
可选地,预设排序因子还包括:商品图片的被使用总次数和/或商品图片的被搜索总次数。
可选地,预设排序因子还包括:根据预设图片质量规则得到商品图片特征信息对应的分值。
可选地,方法还包括:
将历史目标商品搜索词对应被使用次数非零的商品图片作为正样本,同一历史目标商品搜索词对应的被搜索次数非零且被使用次数为零的商品图片作为负样本,输入至待训练模型中进行训练,得到商品图片分值预测模型;将商品图片集合的各商品图片输入至商品图片分值预测模型中,得到各商品图片分值;
预设排序因子还包括:各商品图片分值。
可选地,方法还包括:利用下述公式计算得到商品图片业务分值:S=w1*Sm+w2*(1-Sg)其中,S为商品图片业务分值,Sm为利用商品图片分值预测模型得到的商品图片分值,Sg为商品图片在预设区域范围内的被使用次数归一化处理得到的分值,w1和w2为预设加权值;
预设排序因子还包括:商品图片业务分值。
可选地,预设排序因子还包括:按照预设白名单中对目标商品搜索词指定的预设商品图片排序。
可选地,在根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合之前,方法还包括:检测目标商品搜索词是否存在预设错误黑名单中,若是,对目标商品搜索词进行纠错处理。
可选地,若商品图片集合中商品图片的数量低于预设结果阈值,方法还包括:对目标商品搜索词进行纠错处理;根据纠错处理后的目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
可选地,纠错处理具体为:将目标商品搜索词与预设商品库中的商品词进行比较,获取关联度高于预设关联阈值的商品词集合;对商品词集合进行排序,将目标商品搜索词替换为排序在前的一个或多个商品词。
可选地,在根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合之前,方法还包括:对目标商品搜索词进行过滤处理;其中,过滤处理具体为:对目标商品搜索词进行切词处理,并根据切词后得到的各分词的属性信息,去除目标商品搜索词中与商品属性关联度低于预设阈值的各分词;和/或,去除目标商品搜索词中的停用词。
根据本发明的另一方面,提供了一种商品图片的搜索装置,其包括:接收模块,适于接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,目标店铺信息为根据用户登录信息得到的其所属的店铺信息;查找模块,适于根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;排序模块,适于根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。
可选地,装置还包括:建立模块,适于建立商品图片库;
建立模块进一步适于:收集多个商品图片以及对应的商品图片信息;其中,商品图片信息至少包含商品名称;将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中,并建立商品图片与商品名称的对应关系;根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。
可选地,商品图片信息还包含:商品类别信息、所属店铺类别信息和/或审核标记信息。
可选地,建立模块进一步适于:根据各个商品图片的被搜索情况,更新各个商品图片的被搜索总次数;根据各个商品图片的被使用情况,更新各个商品图片的被使用总次数。
可选地,建立模块进一步适于:对商品名称进行标准化处理;其中,标准化处理包括:去除非商品属性字符和/或去除规格信息。
可选地,商品图片信息还包含:商品图片特征信息;
建立模块进一步适于:对商品图片进行特征分析,得到商品图片特征信息;其中,商品图片特征信息包括:图片清晰度、图片大小、是否存在非商品干扰因子、是否非商品类图片、是否店铺门面图片、是否二维码图片和/或是否非法图片。
可选地,建立模块进一步适于:过滤商品图片特征信息低于预设图片标准的商品图片。
可选地,建立模块进一步适于:判断收集的多个商品图片中是否存在多个相同的商品图片,或者判断收集的多个商品图片中的一个或多个与商品图片库中已存储的商品图片是否相同;若是,对相同的商品图片进行去重,并将相同的商品图片对应的商品名称进行聚合处理,更新去重处理后的商品图片的商品名称。
可选地,建立模块进一步适于:为商品名称建立倒排索引。
可选地,查找模块进一步适于:根据目标店铺信息获取目标店铺类别;将目标商品搜索词与商品图片库中各个商品图片的商品名称进行匹配,获取相匹配的商品名称对应的所有商品图片作为候选商品图片集合;从候选商品图片集合中去除商品图片的所属店铺类别信息与目标店铺类别不匹配的商品图片,得到商品图片集合。
可选地,排序模块进一步适于:根据目标店铺位置确定目标店铺所在区域值,其中,目标店铺所在区域值具体为目标店铺位置的geohash值;预设区域范围具体为依据目标店铺位置的geohash值所指定的区域范围;根据商品图片集合中各商品图片被使用位置的geohash值以及每个被使用位置对应的被使用次数,确定商品图片集合中各商品图片在预设区域范围内的被使用次数;根据商品图片集合中各商品图片在预设区域范围内的被使用次数对各商品图片由少到多排序。
可选地,预设排序因子还包括:商品名称与目标商品搜索词的匹配度;和/或,商品类别信息与目标店铺的商品类别信息的匹配度;和/或,所属店铺类别信息与目标店铺类别的匹配度;和/或,审核标记信息。
可选地,预设排序因子还包括:商品图片的被使用总次数和/或商品图片的被搜索总次数。
可选地,预设排序因子还包括:根据预设图片质量规则得到商品图片特征信息对应的分值。
可选地,装置还包括:训练模块,适于将历史目标商品搜索词对应被使用次数非零的商品图片作为正样本,同一历史目标商品搜索词对应的被搜索次数非零且被使用次数为零的商品图片作为负样本,输入至待训练模型中进行训练,得到商品图片分值预测模型;商品图片分值模块,适于将商品图片集合的各商品图片输入至商品图片分值预测模型中,得到各商品图片分值;
预设排序因子还包括:各商品图片分值。
可选地,装置还包括:商品图片业务分值模块,适于利用下述公式计算得到商品图片业务分值:S=w1*Sm+w2*(1-Sg)其中,S为商品图片业务分值,Sm为利用商品图片分值预测模型得到的商品图片分值,Sg为商品图片在预设区域范围内的被使用次数归一化处理得到的分值,w1和w2为预设加权值;
预设排序因子还包括:商品图片业务分值。
可选地,预设排序因子还包括:按照预设白名单中对目标商品搜索词指定的预设商品图片排序。
可选地,装置还包括:查错模块,适于检测目标商品搜索词是否存在预设错误黑名单中,若是,对目标商品搜索词进行纠错处理。
可选地,装置还包括:再查找模块,适于若商品图片集合中商品图片的数量低于预设结果阈值,对目标商品搜索词进行纠错处理;根据纠错处理后的目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
可选地,纠错处理具体为:将目标商品搜索词与预设商品库中的商品词进行比较,获取关联度高于预设关联阈值的商品词集合;对商品词集合进行排序,将目标商品搜索词替换为排序在前的一个或多个商品词。
可选地,装置还包括:过滤模块,适于对目标商品搜索词进行过滤处理;其中,过滤处理具体为:对目标商品搜索词进行切词处理,并根据切词后得到的各分词的属性信息,去除目标商品搜索词中与商品属性关联度低于预设阈值的各分词;和/或,去除目标商品搜索词中的停用词。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行上述商品图片的搜索方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述商品图片的搜索方法对应的操作。
根据本发明提供的商品图片的搜索方法及装置,接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,目标店铺信息为根据用户登录信息得到的其所属的店铺信息;根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。本发明除根据目标商品搜索词本身进行搜索外,还基于目标店铺信息的本身,对商品图片进行了限定,以保障得到的商品图片更满足用户所属店铺本身的需求。同时,对商品图片集合进行排序处理,保障返回给用户高质量更符合用户需求的商品图片。进一步,本发明中预设排序因子基于商品图片集合中各商品图片在预设区域范围内的被使用次数,以减少商品图片在一个区域内分布密度过密的情况。同时,避免因用户选取其他店铺已使用的相同的商品图片而导致消费者在多个店铺均浏览到相同的商品图片,降低对消费者的吸引力等问题。通过排序处理,可以帮助用户更好地选取商品图片,以突出店铺特色,更好地帮助店铺吸引消费者。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的商品图片的搜索方法的流程图;
图2示出了根据本发明一个实施例的商品图片库的建立方法的流程图;
图3示出了商品图片库中存储的数据结构示意图;
图4示出了根据本发明另一个实施例的商品图片的搜索方法的流程图;
图5示出了根据本发明一个实施例的商品图片的搜索装置的功能框图;
图6示出了根据本发明一个实施例的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的商品图片的搜索方法的流程图。如图1所示,商品图片的搜索方法具体包括如下步骤:
步骤S101,接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求。
本实施例中为方便用户搜索商品图片,还可以提供给用户搜索界面,方便用户在搜索界面中直接输入目标商品搜索词进行搜索。接收用户在输入目标商品搜索词后发起的商品图片搜索请求,其中,商品图片搜索请求包含目标商品搜索词,以及目标店铺信息。目标店铺信息是根据用户登录信息得到的其所属的店铺信息。当用户登录时,根据其登录信息如登录id等可以关联到所属的店铺,进而可以获取到该目标店铺的位置、目标店铺类别等目标店铺信息。
步骤S102,根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
直接根据目标商品搜索词可以从预先收集的商品图片库中查找匹配的商品图片集合,具体的,商品图片库中保存有商品图片以及商品名称等信息,将目标商品搜索词与商品图片库中各个商品图片的商品名称进行匹配。匹配时,可以对目标商品搜索词进行切词处理,得到多个分词。查找商品图片库中各商品名称是否包含多个分词,若是,则商品名称与目标商品搜索词匹配,获取到对应的商品图片等,得到商品图片集合。以上为举例说明,具体实施时,可根据实际情况进行查找匹配,此处不做限定。
进一步,在实际应用中,考虑到不同店铺的类别不同,如超市类店铺,其商品图片应为带有外包装袋样式的图片;餐饮类店铺,其商品图片应为真实的成品图片;如目标商品搜索词为酸辣粉,对应的超市类店铺,其需要找到的商品图片为酸辣粉包装袋图片;对应的餐饮类店铺,其需要找到的商品图片为做好的酸辣粉成品图片。基于上述问题,在根据目标商品搜索词获取到的商品图片集合,作为候选商品图片集合的同时,从候选商品图片集合中再去除商品图片的所属店铺类别信息与目标店铺类别不匹配的商品图片,综合上述处理得到商品图片集合。即商品图片库中除商品图片、商品图片名称等信息外,还存储了商品图片对应的所属店铺类别信息。根据目标店铺信息确定目标店铺类别,从候选商品图片集合中将商品图片的所属店铺类别信息与目标店铺类别不匹配的商品图片去除,使得到的商品图片集合更切合目标店铺信息,保障得到的商品图片更符合用户的查找需求。
步骤S103,根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片。
在得到商品图片集合后,可以将商品图片集合中的商品图片返回给用户,供用户选取。为帮助用户更好的选取商品图片,本实施例还对商品图片集合中的商品图片进行了排序处理。其中,排序处理时根据预设排序因子进行排序,以便将更优质、更符合用户需求的商品图片返回给用户。在本实施例中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,所述预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。当在预设区域范围内商品图片被使用多次时,即多个位于预设区域范围内的店铺均使用相同的商品图片,相同的商品图片无法突出店铺间商品的不同特色,降低了对消费者的吸引力。考虑到上述问题,依据目标店铺信息确定目标店铺位置,再根据目标店铺位置指定一个预设区域范围,如预设区域范围以目标店铺位置为中心,包括其周围XX公里等。根据商品图片集合中各商品图片在预设区域范围内的被使用次数,从少到多排序。对于商品图片集合中的各商品图片,可以先判断商品图片的被使用位置是否处于预设区域范围内,若处于预设区域范围内时,获取商品图片处于预设区域范围内的被使用位置对应的被使用次数作为商品图片在预设区域范围内的被使用次数(若存在商品图片多个处于预设区域范围内的被使用位置,则计算得到多个处于预设区域范围内的被使用位置对应的被使用次数之和);若商品图片的被使用位置均不处于预设区域范围内时,则商品图片在预设区域范围内的被使用次数为0。再按照得到的商品图片在预设区域范围内的被使用次数从少到多进行排序,避免用户选取的目标商品图片已经在预设区域范围内(即目标店铺附近的其他店铺)被多次使用。通过减少商品图片在邻近店铺间多次被使用的次数,提高商品图片在目标店铺对消费者的吸引力,更好的吸引消费者到店消费。
进一步,在排序处理后,可以将排序在前的预设数量的商品图片返回给用户,如将排序在前的20张商品图片返回给用户,用户可以从返回的这些商品图片中选取并使用所需的目标商品图片。对于排序在后的商品图片,考虑用户从中选取目标商品图片的可能性较低,不返回这些商品图片,也可以节省流量。
根据本发明提供的商品图片的搜索方法,接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,目标店铺信息为根据用户登录信息得到的其所属的店铺信息;根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。本发明除根据目标商品搜索词本身进行搜索外,还基于目标店铺信息的本身,对商品图片进行了限定,以保障得到的商品图片更满足用户所属店铺本身的需求。同时,对商品图片集合进行排序处理,保障返回给用户高质量更符合用户需求的商品图片。进一步,本发明中预设排序因子基于商品图片集合中各商品图片在预设区域范围内的被使用次数,以减少商品图片在一个区域内分布密度过密的情况。同时,避免因用户选取其他店铺已使用的相同的商品图片而导致消费者在多个店铺均浏览到相同的商品图片,降低对消费者的吸引力等问题。通过排序处理,可以帮助用户更好地选取商品图片,以突出店铺特色,更好地帮助店铺吸引消费者。
图2示出了根据本发明一个实施例的商品图片库的建立方法的流程图。如图2所示,商品图片库的建立方法具体如下:
步骤S201,收集多个商品图片以及对应的商品图片信息。
商品图片库中存储了多个商品图片,以及商品图片对应的商品名称等信息,方便在搜索时从商品图片库中查找到所需的商品图片。在建立商品图片库时,需要先收集多个商品图片以及对应的商品图片信息,商品图片信息至少包含商品名称。其中,收集到的商品图片和商品名称相互对应。商品图片以及商品图片信息的收集可以利用大数据或第三方平台许可获取。
进一步,收集到的商品图片信息还包含了如商品类别信息、所属店铺类别信息、审核标记信息等。其中,商品类别信息、所属店铺类别信息可以在收集商品图片时,获取商品图片对应的商品所属的类别信息、商品图片对应的商品所属店铺的类别信息得到。审核标记信息可以在收集商品图片时,获取该商品图片是否存在被人工审核或电子审核的审核标记,或者,审核标记信息可以在收集到商品图片后,对商品图片再进行人工审核或电子审核后,当商品图片通过审核时,设置其审核标记信息;当商品图片未被审核时,暂不设置其审核标记信息。当商品图片审核未通过时,过滤该商品图片。
进一步,商品图片信息还包含了商品图片特征信息。通过对收集到的商品图片进行特征分析,得到商品图片特征信息。其中,商品图片特征信息包括如图片清晰度、图片大小、是否存在非商品干扰因子、是否非商品类图片、是否店铺门面图片、是否二维码图片、是否非法图片等多维度信息。图片清晰度、图片大小(图片像素数、图片本身大小、图片中白色部分占比多少)等信息可以通过对商品图片本身进行图像处理得到;非商品干扰因子包括如店铺logo、水印、图片装饰等与商品无关的图片信息,通过对商品图片进行识别分析可以确定其是否存在非商品干扰因子;是否非商品类图片标明了商品图片中是否包含商品元素,通过商品图片识别结果确定;非法图片包括如涉黄图片、传销图片等非法图片,是否非法图片、是否店铺门面图片、是否二维码图片等信息可以根据对商品图片识别结果确定。商品图片特征信息可以利用现有的图片识别技术对商品图片进行识别后确定。商品图片特征信息从多个维度记录了商品图片本身的质量,方便后续根据商品图片特征信息返回给用户高质量的商品图片。
步骤S202,将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中,并建立商品图片与商品名称的对应关系。
在收集到多个商品图片以及对应的商品图片信息后,将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中,并建立商品图片与商品名称的对应关系。在保存时商品图片,可以将商品图片上传至服务器中,为其建立唯一的商品图片标识,根据商品图片标识建立商品图片与商品名称的对应关系。如商品图片标识A对应商品名称AA。在根据目标商品搜索词以及目标店铺信息,获取到匹配的商品名称后,根据商品图片与商品名称的对应关系,得到商品图片标识,根据商品图片标识获取对应的商品图片。
可选地,在将商品图片以及对应的商品图片信息保存至商品图片库前,还可以对商品名称先进行标准化处理。标准化处理包括如去除非商品属性字符、去除规格信息等,以便在搜索商品图片时,根据标准化的商品名称可以更快速的查找到对应的商品图片。如商品名称为张二哥家的麻辣烫,其中,“麻辣烫”足以明确标记一个商品名称,“张二哥家的”这些字符不具有商品属性,仅是对商品的修饰,将其去除后,得到的商品名称更标准。或者如大份水煮鱼、小份水煮鱼等这些包含规格信息的商品名称,去除其中“大份”、“小份”等规格信息,可以得到标准化的商品名称。
可选地,在获取到商品图片特征信息后,可以根据商品图片特征信息,过滤商品图片特征信息低于预设图片标准的商品图片,这些商品图片不能较好的满足目标店铺对所需商品图片的展示要求,因此不对其进行存储。如商品图片特征信息中图片大小的白色部分占比超过80%,商品图片实际显示商品部分过小,过滤该商品图片,不将其保存在商品图片库中。过滤时如将非商品类图片、店铺门面图片、二维码图片、非法图片等进行过滤。具体过滤时预设图片标准根据实施情况设置,此处仅为举例说明,不做限定。
可选地,还可以判断收集的多个商品图片中是否存在多个相同的商品图片,或者判断收集的多个商品图片中的一个或多个与商品图片库中已存储的商品图片是否相同;若是,对相同的商品图片进行去重,并将相同的商品图片对应的商品名称进行聚合处理,更新去重处理后的商品图片的商品名称。判断商品图片是否相同时,可以通过判断多个商品图片MD5值是否相同判断,或者判断多个商品图片的图片指纹是否相同等方法,确定多个商品图片是否相同。若收集的多个商品图片相同时,去除相同的多个商品图片,可以仅保存一个商品图片,将多个商品图片对应的商品名称聚合在一起,作为该商品图片的商品名称,即一个商品图片对应一个商品名称,该商品名称为聚合处理后的商品名称。聚合处理时,多个商品名称中间可以通过预设符号进行连接,如聚合处理后的商品名称为“番茄炒蛋;番茄炒鸡蛋;西红柿炒蛋;西红柿炒鸡蛋”。商品图片库可以多次收集、存储商品图片,当判断本次收集的多个商品图片中的一个或多个与商品图片库中已存储的商品图片相同时,可以将相同商品图片对应的多个商品名称进行聚合处理,利用聚合处理后的商品名称更新商品图片库中已存储的商品图片对应的商品名称。
为方便后续搜索,还可以为商品名称建立倒排索引,便于快速与目标商品搜索词进行匹配。匹配时,商品名称需全部包含目标商品搜索词切词处理得到的各个分词。
步骤S203,根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。
在存储商品图片以及对应的商品信息后,当各个商品图片被用户选取使用后,还需要根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。如商品图片A被使用后,根据使用该商品图片A的目标店铺信息所确定的目标店铺位置A1,更新商品图片A的被使用位置为A1。当商品图片A再次被使用,根据使用该商品图片A的目标店铺信息所确定的目标店铺位置A2,更新商品图片的多个被使用位置为A1、A2。商品图片的多个被使用位置记录了使用该商品图片的各个目标店铺位置。在更新商品图片的被使用位置的同时,还需要更新每个被使用位置对应的被使用次数。如统计商品图片A在被使用位置A1处被使用的次数为3次,商品图片A在被使用位置A2处被使用的次数为4次,更新得到商品图片A被使用位置A1,被使用次数3;被使用位置A2,被使用次数4。进一步,目标店铺位置一般采用经纬度数据记录,当商品图片被多个目标店铺使用时,商品图片被使用位置需要记录多个目标店铺位置的经纬度数据,使得商品图片的被使用位置记录数据量过大。优选的,根据目标店铺位置的经纬度数据,换算得到一个n位字符串编码的geohash值。其中,geohash值表示的是一个矩形区域,其覆盖目标店铺位置。不同位数的字符串编码长度,表示不同的矩形区域范围,字符串编码长度越长,表示的矩形区域范围越精确,具体字符串编码长度根据实施情况设置。geohash值表示的矩形区域内覆盖的目标店铺位置(各目标店铺位置的经纬度数据)都共享相同的geohash值。利用geohash值可以降低商品图片被使用位置所存储的数据量。对于商品图片每个被使用位置对应的被使用次数,可以统计geohash值所覆盖的使用商品图片的各目标店铺的数量,得到对应的被使用次数。如商品图片被100个目标店铺使用,其中60个目标店铺位置的经纬度数据对应的geohash值为wx4er,40个目标店铺位置的经纬度数据对应的geohash值为wx4dp,商品图片的多个被使用位置以及每个被使用位置对应的被使用次数可以表示为“wx4er:60,wx4dp:40”,从而大大降低了存储数据量。
可选地,本实施例还包括如下步骤:
步骤S204,根据各个商品图片的被搜索情况,更新各个商品图片的被搜索总次数。
步骤S205,根据各个商品图片的被使用情况,更新各个商品图片的被使用总次数。
商品图片被搜索到,即该商品图片被返回给用户,此时,更新商品图片的被搜索总次数,在原被搜索总次数上进行加一处理。当商品图片被用户选取并使用时,更新商品图片的被使用总次数,在原被使用总次数上进行加一处理。商品图片的被搜索总次数与被使用总次数不一定相等,当商品图片的被搜索总次数等于被使用总次数时,说明该商品图片被搜索使用率较高,该商品图片为高质量商品图片。
进一步,商品图片库中存储的数据结构可以参照图3所示,包括本实施例中所涉及的各字段,各字段的具体描述见本实施例,在此不再赘述。
根据本发明提供的商品图片库的建立方法,收集多个商品图片以及对应的商品图片信息,在商品图片库中存储商品图片,并建立商品图片与商品名称的对应关系。进一步,对收集到的商品图片以及商品图片信息进行处理,在保障商品图片库中存储高质量商品图片的同时,为后续商品图片的搜索、排序做好数据准备,更好的满足用户对商品图片的需求。
图4示出了根据本发明另一个实施例的商品图片的搜索方法的流程图。如图4所示,商品图片的搜索方法具体包括如下步骤:
步骤S401,接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求。
该步骤参照图1实施例中的步骤S101的描述,在此不再赘述。
步骤S402,对商品图片搜索请求进行处理。
用户在输入目标商品搜索词时,考虑到可能存在用户输入错误、目标商品搜索词不规范等问题,会使得搜索得到的商品图片不能满足用户需求,用户需要重新输入等操作,造成用户操作繁琐等问题。因此,本实施例在接收到商品图片搜索请求后,先对商品图片搜索请求进行处理,确定用户搜索意图,以便更好的根据商品图片搜索请求进行搜索。对商品图片搜索请求进行处理包括如对目标商品搜索词进行错误检测、改写等处理,使得处理后的目标商品搜索词可以一次即可准确地搜索到用户所需的商品图片。这些处理对于用户而言是透明不可见的。
具体的,对商品图片搜索请求进行处理包括如:检测目标商品搜索词是否存在预设错误黑名单中。预设错误黑名单包括了预先收集的各种错误搜索词(常见的用户输入错别字等),若目标商品搜索词存在预设错误黑名单中,需要对目标商品搜索词进行纠错处理。若预设错误黑名单中还包括了错误搜索词对应的正确搜索词,可以直接用正确搜索词替换目标商品搜索词完成纠错处理。若预设错误黑名单中没有包括错误搜索词对应的正确搜索词,则利用预设商品库所预先收集的商品词,将目标商品搜索词与预设商品库中的商品词进行比较,获取关联度高于预设关联阈值的商品词集合。如目标商品搜索词为番茄炒单,其存在预设错误黑名单中,对“番茄炒单”进行语义、语音等多方面分析,从预设商品库中找到与其存在同语音、语义相近的商品词集合,包括:“番茄炒蛋”、“番茄炒鸡蛋”、“西红柿炒蛋”、“西红柿炒鸡蛋”。根据商品词集合中各个商品词与目标商品搜索词的关联度(如从语义方面进行分析得到关联度),对商品词集合进行排序,可以将目标商品搜索词替换为排序在先的一个或多个商品词。将目标商品搜索词替换为“番茄炒蛋”,或者,将目标商品搜索词替换为“番茄炒蛋”、“番茄炒鸡蛋”、“西红柿炒蛋”、“西红柿炒鸡蛋”,其中多个商品词之间按照或逻辑相连,方便后续根据替换后的目标商品搜索词进行查找匹配。
进一步,对商品图片搜索请求进行处理还包括如对目标商品搜索词进行过滤处理。过滤处理具体为:对目标商品搜索词进行切词处理,并根据切词后得到的各分词的属性信息(可以根据切词后各分词的语义确定各分词的属性信息;或根据各分词查找预设的分词字典,若分词不存在分词字典中,则分词不属于商品属性等。)去除目标商品搜索词中与商品属性关联度低于预设阈值的各分词。如目标商品搜索词为好吃的番茄炒蛋,对目标商品搜索词进行切词处理后,得到“好吃的”、“番茄”、“炒”、“蛋”各分词。“好吃的”分词不属于商品属性,是一个形容词,与商品属性关联度较低。直接使用该目标商品搜索词会导致搜索到的商品图片过少甚至无法得到商品图片。因此,去除目标商品搜索词中与商品属性关联度低于预设阈值的各分词,可以得到目标商品搜索词中必须的关键词,根据过滤后的目标商品搜索词进行搜索,保障得到商品图片更满足用户需求。进一步,过滤处理还包括,在对目标商品搜索词进行切词处理后,去除其中的停用词。停用词可以查询切词处理后的各分词是否存在预设停用词表中,若存在,则分词为停用词,过滤对应的分词。
步骤S403,根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
该步骤参照图1实施例中的步骤S102的描述,在此不再赘述。
可选地,在得到商品图片集合后,若判断商品图片集合中商品图片的数量低于预设结果阈值,如从商品图片库中没有得到匹配的商品图片集合,或商品图片集合中商品图片的数量小于5等,无法满足用户对商品图片的需求,需要对目标商品搜索词进行纠错处理。此处,纠错处理需要对目标商品搜索词进行替换,具体的纠错处理可以参照步骤S402中的描述。再根据纠错处理后的目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合,以保障得到的商品图片集合中商品图片的数量达到预设结果阈值,返回给用户较多的商品图片,供用户从中选取并使用。
步骤S404,根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片。
预设排序因子商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。由于目标店铺信息或商品图片被使用位置采用经纬度信息记录会导致数据库存储数据量过大,以及比较时需要比较的数据量也过大。因此,本实施例中商品图片被使用位置采用geohash值记录。在进行排序时,可以先依据目标店铺信息所确定的目标店铺位置确定其对应的geohash值,预设区域范围为依据目标店铺位置的geohash值所指定的区域范围,如以目标店铺位置对应的geohash值为中心,包括其周围多个geohash值在内的范围。对于商品图片集合中的各商品图片,根据商品图片集合中各商品图片被使用位置的geohash值以及每个被使用位置对应的被使用次数,确定商品图片集合中各商品图片在预设区域范围内的被使用次数。具体的,先判断商品图片的被使用位置的geohash值是否处于预设区域范围内,若处于预设区域范围内时,获取商品图片处于预设区域范围内的被使用位置geohash值对应的被使用次数作为商品图片在预设区域范围内的被使用次数(若存在商品图片多个处于预设区域范围内的被使用位置的geohash值,则计算得到多个处于预设区域范围内的被使用位置的geohash值对应的被使用次数之和);若商品图片的被使用位置的geohash值均不处于预设区域范围内时,则商品图片在预设区域范围内的被使用次数为0。再按照得到的商品图片在预设区域范围内的被使用次数从少到多进行排序,供用户优先选取预设区域范围内被使用次数较少的商品图片。
可选地,预设排序因子还包括:商品名称与目标商品搜索词的匹配度;和/或,商品类别信息与目标店铺的商品类别信息的匹配度;和/或,所属店铺类别信息与目标店铺类别的匹配度;和/或,审核标记信息等。商品名称与目标商品搜索词的匹配度高即说明商品名称与目标商品搜索词阐述的商品是否为同一商品,匹配低说明商品名称与目标商品搜索词阐述的商品为不同商品,将匹配度高的商品图片排在前面,将匹配度低的商品图片排在后面。计算商品名称与目标商品搜索词的匹配度包括如下:通过对商品名称进行切词处理和对目标商品搜索词进行切词处理,分别得到商品名称的各分词和目标商品搜索词的各分词。判断商品名称的各分词和目标商品搜索词的各分词中能够突出商品特色的分词是否一致,如商品名称为番茄鸡蛋汤,突出其商品特色的分词为“汤”,目标商品搜索词为鸡蛋汤,突出其商品特色的分词为“汤”,两者一致。统计商品名称的各分词和目标商品搜索词的各分词中相同分词的数量、不同分词的数量、计算商品名称和目标商品搜索词的杰卡德相似度等,确定商品名称与目标商品搜索词的匹配度。以上为举例说明,实施时可根据具体需求利用现有技术确定商品名称与目标商品搜索词的匹配度。根据目标店铺信息确定目标店铺的商品类别信息,按照商品类别信息与目标店铺的商品类别信息的匹配度高低进行排序,将匹配度高的商品图片排在前面,将匹配度低的商品图片排在后面。以上预设排序因子保障用户可以选取到更切合目标商品搜索词和目标店铺信息的商品图片。对于审核标记信息,将具有审核标记信息的商品图片排在前面,即通过审核的商品图片排在前面,将未经审核的商品图片排在后面,保障用户选取到审核合格的商品图片。
可选地,预设排序因子还包括:商品图片的被使用总次数和/或商品图片的被搜索总次数。商品图片的被使用总次数越高,说明商品图片的质量越高。商品图片被搜索总次数高,但商品图片的被使用总次数低,即商品图片被搜索使用率低时,说明商品图片的质量较低。根据商品图片的被使用总次数和商品图片的被搜索总次数,可以计算得到商品图片被搜索使用率,基于商品图片被搜索使用率、商品图片的被使用总次数,优先将商品图片被搜索使用率高、商品图片的被使用总次数高的商品图片排在前面,即将高质量的商品图片排在前面,以供用户选取。
可选地,预设排序因子还包括:根据预设图片质量规则得到商品图片特征信息对应的分值。按照商品图片库中各商品图片的商品图片特征信息,根据预设图片质量规则对应的设置分值。如图片清晰度高则分值较高;图片大小中图片像素数多、图片本身大、图片中白色部分占比少(能够突出商品)则分值较高;存在非商品干扰因子则分值较低等。根据预设图片质量规则可以得到商品图片特征信息对应的分值,根据各商品图片特征信息对应的分值从高到低排序,将商品图片特征信息分值高的商品图片排在前面,商品图片特征信息分值低的商品图片排在后面。
可选地,预设排序因子还包括:各商品图片分值。对于各商品图片分值可以利用商品图片分值预测模型得到。商品图片分值预测模型的训练过程具体为:将历史目标商品搜索词对应被使用次数非零的商品图片作为正样本,同一历史目标商品搜索词对应的被搜索次数非零且被使用次数为零的商品图片作为负样本,输入至待训练模型中进行训练,得到商品图片分值预测模型。如将历史目标商品搜索词对应搜索到的商品图片集合中,被用户选取并使用的目标商品图片作为正样本,被搜索但未被用户选取并使用的商品图片作为负样本,输入至待训练模型中进行训练,得到商品图片分值预测模型。待训练模型可以使用如逻辑回归模型、梯度提升决策树模型等模型,此处不做限定。在得到商品图片分值预测模型后,将本次商品图片集合的各商品图片的信息如图片特征信息等数据输入至商品图片分值预测模型中,得到各商品图片分值。按照各商品图片分值可以从高到低排序,将分值高的商品图片排在前面,分值低的商品图片排在后面,以供用户选取到分值高的商品图片。
可选地,预设排序因子还包括:商品图片业务分值。可以利用下述公式计算得到商品图片业务分值:S=w1*Sm+w2*(1-Sg)。其中,S为商品图片业务分值,Sm为利用商品图片分值预测模型得到的商品图片分值,Sg为商品图片在预设区域范围内的被使用次数归一化处理得到的分值,w1和w2为预设加权值。归一化处理得到的Sg的值范围在0-1之间,具体的,如按照每个被使用位置对应的被使用次数的最大值进行归一化处理,Sg=各个商品图片在预设区域范围内的被使用次数/商品图片集合中商品图片在预设区域范围内的被使用次数的最大值。如为避免用户选取在预设区域范围内的被使用次数较多的商品图片(即用户选取到目标店铺位置附近已经被其他店铺所多次使用的商品图片),可以利用Sg以及对应的预设加权值w2干预商品图片业务分值,降低预设区域范围内的被使用次数较多的商品图片的商品图片业务分值,使其排在后面,避免对用户再一次选取并使用。商品图片业务分值中的预设加权值w1和w2可以根据具体业务,实时调整。即商品图片集合排序除受基于商品图片本身利用商品图片分值预测模型得到的商品图片分值影响外,还从用户的目标店铺信息出发,结合商品图片在预设区域范围内的被使用次数综合考量,保障返回的商品图片更符合业务需求。
可选地,预设排序因子还包括:按照预设白名单中对目标商品搜索词指定的预设商品图片排序。预设白名单满足了用户个性化的需求,用户可以根据个性化需求,设置预设白名单,对一些目标商品搜索词指定要返回的预设商品图片集合以及商品图片集合中的排序。当目标商品搜索词包含在预设白名单中时,按照预设白名单中指定的预设商品图片顺序返回给用户。
预设排序因子可以包括以上一个或多个,根据实施情况具体选取合适的预设排序因子进行排序,此处不做限定。
根据本发明提供的商品图片的搜索方法,对商品图片搜索请求先进行处理,避免因目标商品搜索词不规范等导致用户需要重新进行商品图片搜索请求等繁琐操作。根据预设排序因子从多个维度考虑对商品图片集合中的商品图片进行排序处理,以便返回给用户高质量、更满足用户需求、符合业务规则的商品图片。
图5示出了根据本发明一个实施例的商品图片的搜索装置的功能框图。如图5所示,商品图片的搜索装置包括如下模块:
接收模块501适于:接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,目标店铺信息为根据用户登录信息得到的其所属的店铺信息。
查找模块502适于:根据目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
排序模块503适于:根据预设排序因子对商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。
可选地,装置还包括:建立模块504。建立模块504适于:建立商品图片库。建立模块504进一步适于:收集多个商品图片以及对应的商品图片信息;其中,商品图片信息至少包含商品名称;将收集的多个商品图片以及对应的商品图片信息保存至商品图片库中,并建立商品图片与商品名称的对应关系;根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。
可选地,建立模块504进一步适于:根据各个商品图片的被搜索情况,更新各个商品图片的被搜索总次数;根据各个商品图片的被使用情况,更新各个商品图片的被使用总次数。
可选地,建立模块504进一步适于:对商品名称进行标准化处理;其中,标准化处理包括:去除非商品属性字符和/或去除规格信息。
可选地,建立模块504进一步适于:对商品图片进行特征分析,得到商品图片特征信息;其中,商品图片特征信息包括:图片清晰度、图片大小、是否存在非商品干扰因子、是否非商品类图片、是否店铺门面图片、是否二维码图片和/或是否非法图片。
可选地,建立模块504进一步适于:过滤商品图片特征信息低于预设图片标准的商品图片。
可选地,建立模块504进一步适于:判断收集的多个商品图片中是否存在多个相同的商品图片,或者判断收集的多个商品图片中的一个或多个与商品图片库中已存储的商品图片是否相同;若是,对相同的商品图片进行去重,并将相同的商品图片对应的商品名称进行聚合处理,更新去重处理后的商品图片的商品名称。
可选地,建立模块504进一步适于:为商品名称建立倒排索引。
可选地,查找模块502进一步适于:根据目标店铺信息获取目标店铺类别;将目标商品搜索词与商品图片库中各个商品图片的商品名称进行匹配,获取相匹配的商品名称对应的所有商品图片作为候选商品图片集合;从候选商品图片集合中去除商品图片的所属店铺类别信息与目标店铺类别不匹配的商品图片,得到商品图片集合。
可选地,排序模块503进一步适于:根据目标店铺位置确定目标店铺所在区域值,其中,目标店铺所在区域值具体为目标店铺位置的geohash值;预设区域范围具体为依据目标店铺位置的geohash值所指定的区域范围。根据商品图片集合中各商品图片被使用位置的geohash值以及每个被使用位置对应的被使用次数,确定商品图片集合中各商品图片在预设区域范围内的被使用次数;根据商品图片集合中各商品图片在预设区域范围内的被使用次数对各商品图片由少到多排序。
可选地,预设排序因子还包括:商品名称与目标商品搜索词的匹配度;和/或,商品类别信息与目标店铺的商品类别信息的匹配度;和/或,所属店铺类别信息与目标店铺类别的匹配度;和/或,审核标记信息。
可选地,预设排序因子还包括:商品图片的被使用总次数和/或商品图片的被搜索总次数。
可选地,预设排序因子还包括:根据预设图片质量规则得到商品图片特征信息对应的分值。
可选地,装置还包括:训练模块505和商品图片分值模块506。
训练模块505适于:将历史目标商品搜索词对应被使用次数非零的商品图片作为正样本,同一历史目标商品搜索词对应的被搜索次数非零且被使用次数为零的商品图片作为负样本,输入至待训练模型中进行训练,得到商品图片分值预测模型。
商品图片分值模块506适于:将商品图片集合的各商品图片输入至商品图片分值预测模型中,得到各商品图片分值。
预设排序因子还包括:各商品图片分值。
可选地,装置还包括:商品图片业务分值模块507。
商品图片业务分值模块507适于:利用下述公式计算得到商品图片业务分值:S=w1*Sm+w2*(1-Sg)其中,S为商品图片业务分值,Sm为利用商品图片分值预测模型得到的商品图片分值,Sg为商品图片在预设区域范围内的被使用次数归一化处理得到的分值,w1和w2为预设加权值。
预设排序因子还包括:商品图片业务分值。
可选地,预设排序因子还包括:按照预设白名单中对目标商品搜索词指定的预设商品图片排序。
可选地,装置还包括:查错模块508。查错模块508适于:检测目标商品搜索词是否存在预设错误黑名单中,若是,对目标商品搜索词进行纠错处理。
可选地,装置还包括:再查找模块509。再查找模块509适于:若商品图片集合中商品图片的数量低于预设结果阈值,对目标商品搜索词进行纠错处理;根据纠错处理后的目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合。
可选地,装置还包括:过滤模块510。过滤模块510适于:对目标商品搜索词进行过滤处理;其中,过滤处理具体为:对目标商品搜索词进行切词处理,并根据切词后得到的各分词的属性信息,去除目标商品搜索词中与商品属性关联度低于预设阈值的各分词;和/或,去除目标商品搜索词中的停用词。
以上各模块的描述参照方法实施例中对应的描述,在此不再赘述。
本申请还提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的商品图片的搜索方法。
图6示出了根据本发明一个实施例的一种电子设备的结构示意图,本发明具体实施例并不对电子设备的具体实现做限定。
如图6所示,该电子设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:
处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。
通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器602,用于执行程序610,具体可以执行上述商品图片的搜索方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行上述任意方法实施例中的商品图片的搜索方法。程序610中各步骤的具体实现可以参见上述商品图片的搜索实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的商品图片的搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (10)
1.一种商品图片的搜索方法,其包括:
接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,所述目标店铺信息为根据用户登录信息得到的其所属的店铺信息;
根据所述目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;
根据预设排序因子对所述商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,所述预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,所述预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。
2.根据权利要求1所述的方法,其中,所述方法还包括:建立所述商品图片库;
其中,所述商品图片库的建立过程包括:
收集多个商品图片以及对应的商品图片信息;其中,所述商品图片信息至少包含商品名称;
将收集的多个商品图片以及对应的商品图片信息保存至所述商品图片库中,并建立所述商品图片与所述商品名称的对应关系;
根据各个商品图片的被使用情况,更新各个商品图片的多个被使用位置以及每个被使用位置对应的被使用次数。
3.根据权利要求2所述的方法,其中,所述商品图片信息还包含:商品类别信息、所属店铺类别信息和/或审核标记信息。
4.根据权利要求2所述的方法,其中,所述商品图片库的建立过程还包括:
根据各个商品图片的被搜索情况,更新各个商品图片的被搜索总次数;根据各个商品图片的被使用情况,更新各个商品图片的被使用总次数。
5.根据权利要求2所述的方法,其中,在所述将收集的多个商品图片以及对应的商品图片信息保存至所述商品图片库中之前,所述商品图片库的建立过程还包括:
对所述商品名称进行标准化处理;其中,所述标准化处理包括:去除非商品属性字符和/或去除规格信息。
6.根据权利要求2所述的方法,其中,所述商品图片信息还包含:商品图片特征信息;
所述收集多个商品图片以及对应的商品图片信息进一步包括:
对所述商品图片进行特征分析,得到商品图片特征信息;其中,所述商品图片特征信息包括:图片清晰度、图片大小、是否存在非商品干扰因子、是否非商品类图片、是否店铺门面图片、是否二维码图片和/或是否非法图片。
7.根据权利要求6所述的方法,其中,在所述将收集的多个商品图片以及对应的商品图片信息保存至所述商品图片库中之前,所述商品图片库的建立过程还包括:
过滤所述商品图片特征信息低于预设图片标准的商品图片。
8.一种商品图片的搜索装置,其包括:
接收模块,适于接收包含目标商品搜索词和目标店铺信息的商品图片搜索请求;其中,所述目标店铺信息为根据用户登录信息得到的其所属的店铺信息;
查找模块,适于根据所述目标商品搜索词以及目标店铺信息,从商品图片库中查找匹配的商品图片集合;
排序模块,适于根据预设排序因子对所述商品图片集合中的商品图片进行排序处理,返回排序后的商品图片,以供用户从中选取并使用目标商品图片;其中,所述预设排序因子包括商品图片集合中各商品图片在预设区域范围内的被使用次数,所述预设区域范围为依据目标店铺信息所确定的目标店铺位置所指定的区域范围。
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的商品图片的搜索方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的商品图片的搜索方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910053686.3A CN109801138A (zh) | 2019-01-21 | 2019-01-21 | 商品图片的搜索方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910053686.3A CN109801138A (zh) | 2019-01-21 | 2019-01-21 | 商品图片的搜索方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109801138A true CN109801138A (zh) | 2019-05-24 |
Family
ID=66559884
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910053686.3A Pending CN109801138A (zh) | 2019-01-21 | 2019-01-21 | 商品图片的搜索方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109801138A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619093A (zh) * | 2019-09-02 | 2019-12-27 | 北京字节跳动网络技术有限公司 | 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质 |
CN112966681A (zh) * | 2021-04-12 | 2021-06-15 | 深圳市秦丝科技有限公司 | 商品拍照智能识别建档检索的方法、设备及存储介质 |
CN112990994A (zh) * | 2019-12-12 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 对象展示的方法、装置、存储介质及电子设备 |
CN113112335A (zh) * | 2021-05-08 | 2021-07-13 | 拉扎斯网络科技(上海)有限公司 | 店铺的商品信息处理方法、装置及计算机设备 |
CN113112336A (zh) * | 2021-05-10 | 2021-07-13 | 拉扎斯网络科技(上海)有限公司 | 商品信息处理方法、装置及计算机设备 |
CN116628049A (zh) * | 2023-07-21 | 2023-08-22 | 深圳市秦丝科技有限公司 | 一种基于大数据的信息系统维护管理系统及方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799818A (zh) * | 2009-12-15 | 2010-08-11 | 北京乐途游网络科技有限责任公司 | 一种基于网民地域位置展示产品数据的方法及系统 |
CN101847161A (zh) * | 2010-06-02 | 2010-09-29 | 苏州搜图网络技术有限公司 | 搜索网页的方法和建立数据库的方法 |
CN102930058A (zh) * | 2012-11-21 | 2013-02-13 | 北京奇虎科技有限公司 | 一种在浏览器的地址栏中实现搜索的方法和装置 |
CN103425664A (zh) * | 2012-05-16 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种对实体数据单元进行搜索、显示的方法和设备 |
CN103914533A (zh) * | 2014-03-31 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 推广搜索结果的展现方法和装置 |
CN105930422A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 搜索响应方法、装置及系统 |
WO2017090764A1 (ja) * | 2015-11-27 | 2017-06-01 | インフィニティー株式会社 | 商品/サービスの購入支援方法及びシステム並びにプログラム |
CN107369075A (zh) * | 2017-07-26 | 2017-11-21 | 万帮充电设备有限公司 | 商品的展示方法、装置和电子设备 |
CN108345686A (zh) * | 2018-03-08 | 2018-07-31 | 广州赫炎大数据科技有限公司 | 一种基于搜索引擎技术的数据分析方法及系统 |
CN108804466A (zh) * | 2017-05-04 | 2018-11-13 | 北京京东世纪贸易有限公司 | 服饰商品在线搭配的方法和装置 |
CN109063033A (zh) * | 2018-07-16 | 2018-12-21 | 佛山市影腾科技有限公司 | 一种搜索应用程序的方法、装置及终端 |
CN109145212A (zh) * | 2018-08-22 | 2019-01-04 | 北京奇虎科技有限公司 | 一种推荐内容的提供方法和装置 |
-
2019
- 2019-01-21 CN CN201910053686.3A patent/CN109801138A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799818A (zh) * | 2009-12-15 | 2010-08-11 | 北京乐途游网络科技有限责任公司 | 一种基于网民地域位置展示产品数据的方法及系统 |
CN101847161A (zh) * | 2010-06-02 | 2010-09-29 | 苏州搜图网络技术有限公司 | 搜索网页的方法和建立数据库的方法 |
CN103425664A (zh) * | 2012-05-16 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种对实体数据单元进行搜索、显示的方法和设备 |
CN102930058A (zh) * | 2012-11-21 | 2013-02-13 | 北京奇虎科技有限公司 | 一种在浏览器的地址栏中实现搜索的方法和装置 |
CN103914533A (zh) * | 2014-03-31 | 2014-07-09 | 百度在线网络技术(北京)有限公司 | 推广搜索结果的展现方法和装置 |
WO2017090764A1 (ja) * | 2015-11-27 | 2017-06-01 | インフィニティー株式会社 | 商品/サービスの購入支援方法及びシステム並びにプログラム |
CN105930422A (zh) * | 2016-04-18 | 2016-09-07 | 乐视控股(北京)有限公司 | 搜索响应方法、装置及系统 |
CN108804466A (zh) * | 2017-05-04 | 2018-11-13 | 北京京东世纪贸易有限公司 | 服饰商品在线搭配的方法和装置 |
CN107369075A (zh) * | 2017-07-26 | 2017-11-21 | 万帮充电设备有限公司 | 商品的展示方法、装置和电子设备 |
CN108345686A (zh) * | 2018-03-08 | 2018-07-31 | 广州赫炎大数据科技有限公司 | 一种基于搜索引擎技术的数据分析方法及系统 |
CN109063033A (zh) * | 2018-07-16 | 2018-12-21 | 佛山市影腾科技有限公司 | 一种搜索应用程序的方法、装置及终端 |
CN109145212A (zh) * | 2018-08-22 | 2019-01-04 | 北京奇虎科技有限公司 | 一种推荐内容的提供方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619093A (zh) * | 2019-09-02 | 2019-12-27 | 北京字节跳动网络技术有限公司 | 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质 |
CN110619093B (zh) * | 2019-09-02 | 2022-10-18 | 北京字节跳动网络技术有限公司 | 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质 |
CN112990994A (zh) * | 2019-12-12 | 2021-06-18 | 北京沃东天骏信息技术有限公司 | 对象展示的方法、装置、存储介质及电子设备 |
CN112966681A (zh) * | 2021-04-12 | 2021-06-15 | 深圳市秦丝科技有限公司 | 商品拍照智能识别建档检索的方法、设备及存储介质 |
CN113112335A (zh) * | 2021-05-08 | 2021-07-13 | 拉扎斯网络科技(上海)有限公司 | 店铺的商品信息处理方法、装置及计算机设备 |
CN113112336A (zh) * | 2021-05-10 | 2021-07-13 | 拉扎斯网络科技(上海)有限公司 | 商品信息处理方法、装置及计算机设备 |
CN116628049A (zh) * | 2023-07-21 | 2023-08-22 | 深圳市秦丝科技有限公司 | 一种基于大数据的信息系统维护管理系统及方法 |
CN116628049B (zh) * | 2023-07-21 | 2023-12-15 | 深圳市秦丝科技有限公司 | 一种基于大数据的信息系统维护管理系统及方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109801138A (zh) | 商品图片的搜索方法及装置 | |
Aguilar et al. | Grab, pay, and eat: Semantic food detection for smart restaurants | |
CN107992583B (zh) | 信息推送方法及信息推送装置、设备和存储介质 | |
CN108734184B (zh) | 一种对敏感图像进行分析的方法及装置 | |
CN109376731A (zh) | 一种文字识别方法和装置 | |
US8587604B1 (en) | Interactive color palettes for color-aware search | |
CN109643318B (zh) | 商标图像的基于内容的搜索和检索 | |
Rich et al. | Towards bottom-up analysis of social food | |
CN108038161A (zh) | 基于相册的信息推荐方法、装置及计算设备 | |
CN105404627B (zh) | 一种用于确定搜索结果的方法与设备 | |
EP1271361A1 (fr) | Procédé de création automatique d'une base de données images interrogeable par son contenu sémantique | |
CN109409964B (zh) | 优质品牌的识别方法及装置 | |
CN108734159B (zh) | 一种图像中敏感信息的检测方法及系统 | |
CN108491388A (zh) | 数据集获取方法、分类方法、装置、设备及存储介质 | |
CN110851571B (zh) | 数据处理方法、装置、电子设备及计算机可读存储介质 | |
CN114494837A (zh) | 一种渔业资源的密度智能识别方法及系统 | |
CN110209659A (zh) | 一种简历过滤方法、系统和计算机可读存储介质 | |
CN109241455B (zh) | 一种推荐对象的展示方法及装置 | |
CN108241649A (zh) | 基于知识图谱的搜索方法及装置 | |
CN110264379A (zh) | 超范围经营的检查方法及装置 | |
CN110610169A (zh) | 图片标注方法和装置、存储介质及电子装置 | |
CN109815379A (zh) | 一种针对内容的智能搜索推荐方法、存储介质及终端 | |
CN103617262B (zh) | 图片内容属性识别方法和系统 | |
CN103617261B (zh) | 图片内容属性识别方法和系统 | |
CN110134812A (zh) | 一种人脸搜索方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190524 |