CN112036521A - 信息一致性检测方法、装置、设备及存储介质 - Google Patents

信息一致性检测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN112036521A
CN112036521A CN202011235827.2A CN202011235827A CN112036521A CN 112036521 A CN112036521 A CN 112036521A CN 202011235827 A CN202011235827 A CN 202011235827A CN 112036521 A CN112036521 A CN 112036521A
Authority
CN
China
Prior art keywords
color
article
color value
keyword
description information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011235827.2A
Other languages
English (en)
Other versions
CN112036521B (zh
Inventor
左佳伟
石凡
王林芳
梅涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202011235827.2A priority Critical patent/CN112036521B/zh
Publication of CN112036521A publication Critical patent/CN112036521A/zh
Application granted granted Critical
Publication of CN112036521B publication Critical patent/CN112036521B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0641Shopping interfaces
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种信息一致性检测方法、装置、设备及存储介质,通过在物品描述页面中通过目标检测方法确定出目标物品图片,然后对目标物品图片进行关键颜色提取,得到目标物品图片的第一颜色色值,针对物品图片对应的物品描述信息进行文本识别,确定物品描述信息第二颜色色值,基于第一颜色色值和第二颜色色值,计算色值差,若色值差不小于色值阈值,则物品图片与物品描述信息不一致,若色值差小于色值阈值,则物品图片与物品描述信息一致。可以高效准确的对物品描述信息进行检测。

Description

信息一致性检测方法、装置、设备及存储介质
技术领域
本发明实施例涉及图片处理技术领域,尤其涉及一种信息一致性检测方法、装置、设备及存储介质。
背景技术
当前,进行商品图片颜色和物品描述信息描述是否一致的审核任务主要通过人工审核的方式,审核人员需要人工浏览商品图以及对应的文本(如商品描述和商品标题)并作出判断。人工审核的主要缺点包括:
1、审核速度慢:人工审核需仔细查看商品图片和阅读商品标题、描述,审核一件商品需要花费较长的时间;
2、审核效率难以满足电商商品更新速度:电商平台每天有千万数量级别的商品上架下架,更新频率高,更新数量大,人工审核的方式难以满足需求,而抽检的方式又不能很好地保证准确率。
发明内容
有鉴于此,本发明实施例提供的一种信息一致性检测方法、装置、设备及存储介质,可以高效准确的对物品描述信息进行检测。
本发明实施例提供了一种信息一致性检测方法,包括:
在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片;
对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值;
在所述物品描述页面中,确定出所述物品图片对应的物品描述信息;
针对物品描述页面中的物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词;
基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值;
基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果。
上述方案中,所述在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片,包括:
在所述物品描述页面中,基于目标检测算法对所述物品图片进行处理,获取所述物品图片中包括了目标物品的目标框图;
基于分割模型对所述目标框图进行图像分割处理,确定所述目标框图中的所述目标物品图片。
上述方案中,所述对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值,包括:
将所述目标物品图片上的像素点从第一色值空间转换到第二色值空间,计算得到像素点对应的基础像素色值;
基于所述基础像素色值,将所述目标物品图片上的总像素点按照预定的像素色值范围划分为多个像素单元;
计算获取所述多个像素单元中的每一个像素单元中心像素点的第一颜色色值。
上述方案中,所述计算获取所述像素单元中心像素点的第一颜色色值之后,所述方法还包括:
计算获取所述多个像素单元内的每一个像素单元的所述像素点的个数占所述目标物品图片上所述总像素点个数的权重。
上述方案中,所述针对物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词,包括:
将所述物品描述信息输入所述分词模型,基于所述分词模型将所述物品描述信息分成多个关键词;
基于所述多个关键词中的每一个关键词在颜色关键词库中检索出所述物品描述信息对应的颜色关键词。
上述方案中,所述分词模型的分词结构包括了所述颜色关键词库内的所述基础颜色关键词。
上述方案中,所述基于所述关键词在颜色关键词库中检索出所述物品描述信息对应的颜色关键词,包括:
基于所述关键词在颜色关键词库中检索出所述物品描述信息对应的基础颜色关键词;
若所述物品描述信息对应的所述基础颜色关键词的个数大于1,则确定字符数最多的所述基础颜色关键词为颜色关键词;
若所述物品描述信息对应的所述基础颜色关键词的个数不大于1,则确定所述基础颜色关键词为颜色关键词。
上述方案中,所述基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值,包括:
基于所述颜色关键词库检索,获取所述颜色关键词对应的目标颜色色值,并将所述目标颜色色值转换到第二色值空间得到所述第二颜色色值。
上述方案中,所述基于所述第一颜色色值和所述第二颜色色值,确定所述目标物品图片和所述物品描述信息的检测结果,包括:
基于所述第一颜色色值、所述第二颜色色值及所述权重计算色值差;
若所述色值差小于色值阈值,则所述目标物品图片和所述物品描述信息一致;若所述色值差不小于色值阈值,则所述目标物品图片和所述物品描述信息不一致。
还提供了一种信息一致性检测装置,包括:
图片处理单元,用于在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片;对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值;
信息处理单元,用于针对物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词;基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值;
数据处理单元,用于基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果。
还提供了一种信息一致性检测设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的步骤。
还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
本发明实施例中,通过在物品描述页面中通过目标检测方法对物品图片进行图像分割,确定出目标物品图片,然后对目标物品图片进行关键颜色提取,得到目标物品图片的第一颜色色值,然后针对物品图片对应的物品描述信息进行文本识别,确定物品描述信息的颜色关键词,在颜色关键词库中基于颜色关键词确定颜色关键词对应的第二颜色色值,基于第一颜色色值和第二颜色色值,计算色值差,若色值差大于色值阈值,则物品图片与物品描述信息不一致,若色值差不大于色值阈值,则物品图片与物品描述信息一致。通过在物品描述页面快速大量的获取物品图片和物品描述信息,进而将物品图片的第一颜色色值和物品描述信息的第二颜色色值进行计算对比,可以快速高效的检测出物品图片是否与物品描述信息一致。
附图说明
图1为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图2为本发明公开实施例提供的信息一致性检测方法的一个可选的效果示意图;
图3为本发明公开实施例提供的信息一致性检测方法的一个可选的效果示意图;
图4为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图5为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图6为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图7为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图8为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图;
图9为本发明公开实施例提供的信息一致性检测装置的结构示意图;
图10为本发明公开实施例提供的信息一致性检测设备的一种硬件实体示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和实施例对本发明的技术方案进一步详细阐述,所描述的实施例不应视为对本发明的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
如果发明文件中出现“第一/第二”的类似描述则增加以下的说明,在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本发明实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本发明实施例的目的,不是旨在限制本发明。
图1为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,将结合图1示出的步骤进行说明。
S01,在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片。
在本发明公开实施例中,物品描述页面中包括了物品图片和物品描述信息。其中,物品描述信息是对物品图片中物品的信息描述。物品图片中的目标物品可以为一件商品,如衣服、汽车、鞋子、手机等商品。物品图片中的目标物品还可以为场景图片或者自然景观图片中的一栋楼、一条路、一辆公交车等日常生活中的具有颜色特征的实体目标。
在本发明公开实施例中,信息一致性检测装置通过目标检测方法获取物品描述页面中的物品图片。结合图2,在本发明公开实施例中。物品图片可以为物品图片1,其中物品图片1中的目标物品为模特身上穿着的外套。在本发明公开实施例中,外套的颜色为雾霾蓝。物品描述信息为物品图片1一侧的四组对目标物品的描述信息。信息一致性检测装置获取到物品图片1和物品图片1对应四组物品描述信息。其中,四组物品描述信息中只有物品描述信息S2与物品图片1是正确的对应关系,即物品描述信息S2准确的描述了物品图片1中外套的颜色。其余三组物品描述信息与物品图片1是错误的对应关系,即其余三组物品描述信息对图片1中的外套颜色分别做出了错误的描述。信息一致性检测装置需要对物品图片1和四组物品描述信息分别进行检测,依次检测出四组物品描述信息是否对物品图片1中的外套颜色做出了准确的描述。也就是检测出四组物品描述信息的描述是否对应物品图片1中的目标。
结合图3,在本发明公开实施例中。信息一致性检测装置可以同时连接物品终端1、物品终端2和物品终端3。其中,物品终端1的物品为衣服,物品终端2的物品为汽车,物品终端3的物品为手机。物品终端1中的物品图片2的目标物品为黄色外套,与物品图片2对应的物品描述信息2为:橘色短款外套。物品终端2中的物品图片3的目标物品为白色汽车,与物品图片3对应的物品描述信息3为:银色小汽车。物品终端3中的物品图片4的目标物品为银色手机,与物品图片4对应的物品描述信息4为:银色智能手机。物品终端1将包括了物品图片2和物品描述信息2的数据包1发送给信息一致性检测装置。信息一致性检测装置对物品图片1和物品描述信息1检测之后,物品图片2和物品描述信息2的对应关系错误,信息一致性检测装置则不会发送数据包1给商品平台进行展示销售。物品终端2将包括了物品图片3和物品描述信息3的数据包2发送给信息一致性检测装置。信息一致性检测装置对物品图片3和物品描述信息3检测之后,物品图片3和物品描述信息3的对应关系错误,信息一致性检测装置则不会发送数据包2给物品平台进行展示销售。物品终端3将包括了物品图片4和物品描述信息4的数据包3发送给信息一致性检测装置。信息一致性检测装置对物品图片4和物品描述信息4检测之后,物品图片4和物品描述信息4的对应关系正确,信息一致性检测装置则会发送数据包3给物品平台进行展示销售。其中,物品平台将数据包3中的物品图片4和物品描述信息4分别展示在客户终端的显示区域。方便消费者对物品终端3中的物品进行了解。
S02,对目标物品图片进行关键颜色提取,得到目标物品图片的第一颜色色值。
在本发明公开实施例中,信息一致性检测装置在物品描述页面中获取到了物品图片。信息一致性检测装置首先需要将物品图片中的目标物品图片筛选出来,并提取目标物品图片中的第一颜色色值。
其中,信息一致性检测装置可以通过目标检测模型,如实时快速目标检测模型(You Only Look Once,YOLO)或者单机多卡目标检测算法(Single Shot MultiBoxDetector,SSD)将物品图片中的目标物品图片标注出来。信息一致性检测装置然后通过图像分割技术再过滤掉目标物品图片上的背景信息,将目标物品图片转换到LAB色值空间上。信息一致性检测装置基于目标物品图片上的像素点将目标物品图片划分成若干个像素色值相近的像素单元,信息一致性检测装置再计算出每个像素单元中心的色值作为第一颜色色值。
在本发明公开实施例中,物品图片可以为一个银白色手机的图片,信息一致性检测装置将物品图片中的手机图像标注出来。信息一致性检测装置然后再过滤掉手机图像上的背景信息,将手机图像转换到LAB色值空间上。信息一致性检测装置基于手机图像上的像素点将手机图像划分成若干个像素色值相近的像素单元,信息一致性检测装置再计算出每个像素单元中心的色值作为第一颜色色值(Lx,Ax,Bx)。其中,Lx代表每个像素单元中心的色值在LAB色值空间的明度,Ax代表每个像素单元中心的色值在LAB色值空间的红绿色差,Bx代表每个像素单元中心的色值在LAB色值空间的蓝黄色差。
S03,在物品描述页面中,确定出物品图片对应的物品描述信息。
在本发明公开实施例中,信息一致性检测装置获取物品图片的同时也获取到了与物品图片对应的物品描述信息。信息一致性检测装置可以通过目标检测模型或者人工标定的方法获取物品描述页面中的物品描述信息。其中物品描述信息包括了物品图片中的目标物品类别描述、目标物品尺寸描述、目标物品功能描述和目标物品颜色描述。
在本发明公开实施例中,物品描述信息可以通过人工编辑生成或者通过智能识别方法生成物品图片对应的物品描述信息。
在本发明公开实施例中,物品描述信息可以为“高端智能5G银白色手机”,其中,“高端智能5G银白色手机”可以分成多个关键词,例如“高端”,“智能”,“5G”,“银白色”,“手机”。
S04,针对物品描述页面中的物品描述信息进行文本识别,确定物品描述信息的颜色关键词。
在本发明公开实施例中,对应物品图片的物品描述信息的数量可以为1个也可以为多个。当物品描述信息的数量为1个的时候,信息一致性检测装置将物品描述信息输入预先设置的分词模型中,分词模型将物品描述信息划分成多个关键词。当物品描述信息的数量为多个的时候信息一致性检测装置将物品描述信息依次输入预先设置的分词模型中,分词模型依次将物品描述信息划分成多个关键词。其中关键词可以包括目标物品的尺寸关键词、目标物品的功能关键词、目标物品的颜色关键词和目标物品的材质关键词等。信息一致性检测装置基于每一个关键词在预先设置的颜色关键词库中进行检索,查找出物品描述信息对应的颜色关键词。
在本发明公开实施例中,当信息一致性检测装置不能在颜色关键词库中找到物品描述信息对应的颜色关键词时,信息一致性检测装置将物品描述信息中描述颜色的关键词,例如“银白色”更新至颜色关键词库中,扩充了颜色关键词库的词汇量。
S05,基于颜色关键词,确定颜色关键词对应的第二颜色色值。
在本发明公开实施例中,信息一致性检测装置需要预先设置颜色关键词库,颜色关键词库包括了基础颜色关键词和对应的颜色色值。
在本发明公开实施例中,颜色关键词库对应每一个色系设置了多个不同的描述颜色的基础关键词。例如颜色关键词库可以针对红色系设置“桃红”、“粉红”、“深红”和“橘红色”。在本发明公开实施例中,基础颜色关键词对应的颜色色值可以包括基础颜色关键词在RGB色值空间的颜色色值、基础颜色关键词在HSV色值空间的颜色色值和基础颜色关键词在LAB色值空间的颜色色值。
例如,一个物品描述信息为:“高端智能5G银白色手机”。信息一致性检测装置将物品描述信息出入分词模型后可以输出5个关键词包括:“高端”,“智能”,“5G”,“银白色”,“手机”。信息一致性检测装置针对这5个关键词在颜色关键词库中进行检索,该5个关键词中只包括了“银白色”一个描述颜色的关键词,所以信息一致性检测装置可以在颜色关键词库中检索出对应“银白色”的颜色关键词“银白色”。并在颜色关键词库中查找出该颜色关键词“银白色”对应的目标颜色色值,将颜色关键词“银白色”对应的目标颜色色值转换到LAB色值空间得到第二颜色色值(Ly,Ay,By)。
S06,基于第一颜色色值和第二颜色色值,确定物品描述信息的检测结果。
在本发明公开实施例中,信息一致性检测装置通过将第一颜色色值和第二颜色色值进行对比计算,计算获取第一颜色色值和第二颜色色值之间的色值差,通过色值差和色值阈值判断物品图片是否与物品描述信息一致。在本发明公开实施例中,信息一致性检测装置将在S02中获取到的第一颜色色值和中获取到的第二颜色色值进行加权计算,计算得到了一个色值差。
在本发明公开实施例中,第一颜色色值可以为RGB色值空间的颜色色值或者HSV色值空间的颜色色值或者LAB色值空间的颜色色值。第二颜色色值可以为RGB色值空间的颜色色值或者HSV色值空间的颜色色值或者LAB色值空间的颜色色值。
在本申请实施例中,第一颜色色值可以为(Lx,Ax,Bx),第二颜色色值可以为(Ly,Ay,By),色值差M可以为信息一致性检测装置通过CIEDE-2000计算公式计算获取到的第一颜色色值和第二颜色色值之间的色值差。
在本发明公开实施例中可以采用国际颜色组织提出的色差计算标准CIEDE-2000计算公式进行计算色值差。在本发明实施例中,将色值差M与色值阈值N进行对比,其中,色值阈值N可以是一个固定的常数。若色值差M小于色值阈值N时,则说明S02中的颜色关键词“银白色”对应的物品描述信息 “高端智能5G银白色手机”与目标物品图片是正确的对应关系,该目标物品图片与物品描述信息一致。若色值差M不小于色值阈值N时,则说明S02中的颜色关键词“银白色”对应的物品描述信息 “高端智能5G银白色手机”与目标物品图片是错误的对应关系,该物品图片与物品描述信息不一致。
本发明实施例中,通过在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片,然后对目标物品图片进行关键颜色提取,得到目标物品图片的第一颜色色值;针对物品描述信息进行文本识别,确定物品描述信息的颜色关键词,基于颜色关键词,确定颜色关键词对应的第二颜色色值;基于第一颜色色值和第二颜色色值,确定物品描述信息的检测结果。通过信息一致性检测装置在物品描述页面直接获取物品图片和物品描述信息,可以实现大量快速的获取物品图片和物品描述信息,进而通过信息一致性检测装置可以对物品描述信息进行快速准确的检测。
在一些实施例中,参见图4,图4为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图1示出的S01-S02可以通过S101至S105实现,将结合各步骤进行说明。
S101,在物品描述页面中,基于目标检测算法对物品图片进行处理,获取物品图片中包括了目标物品的目标框图。
在本发明公开实施例中,信息一致性检测装置在物品描述页面中通过目标检测算法对物品图片进行处理,信息一致性检测装置对物品图片进行处理之后可以得到一个包括了目标物品的目标框图。在本发明公开实施例中,信息一致性检测装置可以通过实时快速目标检测模型或者单机多卡目标检测算法将物品图片中的目标物品标注出来形成目标框图。
在本发明公开实施例中,目标框图可以为一个包括了目标物品和少量背景信息的框图。在本发明公开实施例中,物品图片可以包括:商品的展示图、街景图、风景图、建筑物图、人像图等。其中,目标物品可以包括:手机、电脑、衣服、汽车、人脸、动物、建筑物、植物等。
S102,基于分割模型对目标框图进行图像分割处理,确定目标框图中的目标物品图片。
在本发明公开实施例中,信息一致性检测装置获取到了目标框图之后还需要裁切出目标物品区域的图像,信息一致性检测装置通过语义分割模型对目标框图进行图像分割处理,过滤了目标框图中不包括目标物品的背景信息。信息一致性检测装置对目标框图进行细分处理之后可以得到一个只包括目标的目标物品图片。
在本发明公开实施例中,信息一致性检测装置可以通过全卷积网络模型(FullyConvolutional Networks,FCN)或者图像分割网络模型(A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation,SegNet)获取物品图片中的目标物品图片。
在本发明公开实施例中,目标物品图片为只包括了目标物品的图片,目标物品图片上的总像素点为目标物品的全量像素点。其中,目标物品的颜色可以包括多种颜色,信息一致性检测装置处理目标框图得到目标物品图片的同时也对目标物品图片上的每一个像素点进行识别标注。
结合图2,在本发明公开实施例中,信息一致性检测装置对物品图片1的目标框图进行细分处理之后可以得到一个只包括雾霾蓝外套的目标物品图片。
S103,将目标物品图片上的像素点从第一色值空间转换到第二色值空间,计算得到像素点对应的基础像素色值。
在本发明实施例中,信息一致性检测装置通过将目标物品图片上的像素点的色值从第一色值空间计算转化为二维色值,再结合目标物品图片上的像素点的亮度转换到第二色值空间。
在本发明实施例中,第一色值空间可以为RGB色值空间,第二色值空间可以为LAB色值空间。
在本发明公开实施例中,通过S102不仅获取到了目标物品图片,而且还可以识别出目标物品图片上的每一个像素点。由于目标物品图片上的像素点的色值处于第一色值空间,也就是RGB色值空间。信息一致性检测装置将S102中的只包括雾霾蓝外套的目标物品图片上的每一个像素点转换到第二色值空间上,也就是LAB色值空间上,方便信息一致性检测装置对目标物品图片上的像素点进行计算。信息一致性检测装置可以计算出每一个像素点在LAB色值空间上的基础像素色值。
S104,基于基础像素色值,将目标物品图片上的总像素点按照预定的像素色值范围划分为多个像素单元。
在本发明公开实施例中,目标物品图片上的总像素点包括了若干个像素。其中,目标物品图片上的每一个像素点的基础像素色值差距有大有小。
在本发明公开实施例中,信息一致性检测装置可以将目标物品图片上的总像素点按照像素值相近的原则划分成若干个像素单元。一个像素单元内的像素点的色值在一个色值范围内。
在本发明公开实施例中,信息一致性检测装置可以根据每个像素点的基础像素色值之间的欧式距离,将总像素点按照一定的欧氏距离阈值划分成了m个像素单元。在本公开实施例中可以将S102中的只包括雾霾蓝外套的目标物品图片上的像素划分成了m个像素单元。其中, m可以为任何正整数。
S105,计算获取多个像素单元中的每一个像素单元的中心像素点的第一颜色色值。
在本发明实施例中,像素单元包括了多个像素点。其中,像素单元中心位置的像素点的像素值最接近本像素单元的多个像素点的平均像素值。
在本发明实施例中,信息一致性检测装置利用算法可以计算出像素单元内中心像素点的色值,中心像素点的色值就是第一颜色色值。
在本发明公开实施例中,信息一致性检测装置基于LAB色值空间计算出雾霾蓝外套的目标物品图片上每个像素单元中心的第一颜色色值(L3,A3,B3)。
在一些实施例中,参见图4,图4为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图4示出的S105之后还包括S106,将结合各步骤进行说明。
S106,计算获取多个像素单元内的每一个像素单元的像素点的个数占目标物品图片上总像素点个数的权重。
在本发明公开实施例中,又由于目标物品图片经过S102图像分割处理之后可以得到目标物品图片上的总像素点的个数及每个像素单元内的像素点的个数。信息一致性检测装置计算出每个像素单元内的像素点的个数占目标物品图片上的总像素点的个数的权重。在本发明公开实施例中,由于目标物品图片上的颜色可能包括多种,因此计算出每个像素单元内的像素点的个数占目标物品图片上的总像素点的个数的权重可以方便计算出更为准确的色值差。
在本发明公开实施例中,例如,目标物品图片上包括的总像素点的个数为10亿个,信息一致性检测装置可以将目标物品图片上的总像素点划分为一百万个像素单元。每个像素单元内的像素点的个数可以不同,一百万个像素单元内的像素点个数的总和等于目标物品图片上总像素点的个数。
在一些实施例中,参见图5,图5为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图1示出的S04-S05可以通过S21-S23实现,将结合各步骤进行说明。
S21,将物品描述信息输入分词模型,基于分词模型将物品描述信息分成多个关键词。
在本发明公开实施例中,信息一致性检测装置首先需要构建颜色关键词库,颜色关键词库包括了全量的基础颜色关键词,及基础颜色关键词对应的颜色色值,其中信息一致性检测装置可以通过颜色关键词库找出颜色关键词对应的目标颜色色值。信息一致性检测装置构建完成颜色关键词库之后,信息一致性检测装置将颜色关键词库存储在信息一致性检测装置的数据库中。
示例性的,信息一致性检测装置构建的颜色关键词库可以为表1所示:
表1
Figure 659893DEST_PATH_IMAGE001
在本发明公开实施例中,信息一致性检测装置构建完成颜色关键词库之后,还需要将构建的颜色词库中的基础颜色关键词添加进分词模型中,方便信息一致性检测装置后续对物品描述信息分词更加准确。在本发明公开实施例中,分词模型可以将一个物品描述信息拆分成若干个关键词,常用的分词模型包括基于词典的分词方法(字符串匹配模型、机械分词模型),基于统计的分词方法(无字典分词模型)、基于规则的分词模型和基于字标注的分词模型。
在本发明公开实施例中,信息一致性检测装置获取物品图片1的同时也获取到了与物品图片对应的4组物品描述信息。
信息一致性检测装置将物品描述信息S1“棉服女短款冬装韩版甜美学生修身加厚小个子棉衣外套杏色”输入分词模型,可以得到12个关键词:“棉服”,“女短款”,“冬装”,“韩版”,“甜美”,“学生”,“修身”,“加厚”,“小个子”,“棉衣”,“外套”,“杏色”。
信息一致性检测装置将物品描述信息S2“棉服女短款冬装韩版甜美学生修身加厚小个子棉衣外套雾霾蓝”输入分词模型,可以得到12个关键词:“棉服”,“女短款”,“冬装”,“韩版”,“甜美”,“学生”,“修身”,“加厚”,“小个子”,“棉衣”,“外套”,“雾霾蓝”。
信息一致性检测装置将物品描述信息S3“棉服女短款冬装韩版甜美学生修身加厚小个子棉衣外套酒红色”输入分词模型,可以得到12个关键词:“棉服”,“女短款”,“冬装”,“韩版”,“甜美”,“学生”,“修身”,“加厚”,“小个子”,“棉衣”,“外套”,“酒红色”。
信息一致性检测装置将物品描述信息S4“棉服女短款冬装韩版甜美学生修身加厚小个子棉衣外套绿色”输入分词模型,可以得到12个关键词:“棉服”,“女短款”,“冬装”,“韩版”,“甜美”,“学生”,“修身”,“加厚”,“小个子”,“棉衣”,“外套”,“绿色”。
S22,基于多个关键词中的每一个关键词在颜色关键词库中检索出物品描述信息对应的颜色关键词。
在本发明公开实施例中,信息一致性检测装置将物品描述信息对应的每一个关键词与颜色关键词库,也就是表一进行对比检索可以查找到一个或者多个关键词与颜色关键词库中的一个或者多个基础颜色关键词对应。
在本发明公开实施例中,物品描述信息包括了对目标物品的功能描述信息或者材质描述信息或者型号描述信息或者尺寸描述信息。关键词包括了物品描述信息中对目标物品的尺寸描述关键词、对目标物品的材质描述关键词、对目标物品的颜色描述关键词和对目标物品的型号描述关键词。
在本发明公开实施例中,信息一致性检测装置基于关键词在颜色关键词库中进行检索查找到描述目标物品颜色的关键词对应的基础颜色关键词。该基础颜色关键词就是物品描述信息对应的颜色关键词。
例如,关键词“杏色”和颜色关键词库中的基础颜色关键词“杏色”对应。则“杏色”就是物品描述信息对应的颜色关键词。
在一些实施例中,参见图6,图6为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图5示出的S22可以通过S201-S202实现,将结合各步骤进行说明。
S201,基于多个关键词中的每一个关键词在颜色关键词库中检索出物品描述信息对应的基础颜色关键词。
在本发明实施例中,由于颜色关键词库中包含的是具体的基础颜色颜色与颜色色值的对应关系。信息一致性检测装置在获取了关键词之后,就可以根据每一个关键词从颜色关键词库中检索出与每一个关键词对应的基础颜色关键词,即该物品描述信息对应的基础颜色关键词。
需要说明的是,由于颜色关键词库中包含的与关键词匹配的颜色可能有多个,因此,基础颜色关键词可能有多个。
在本发明的实施例中,同一个色系对应的具体的颜色可能是多个,关键词在本发明实施例中可能是一个色系对应的词,但是在颜色关键词库中该色系对应的颜色就有很多个了,因此,才可能出现关键词对应多个基础颜色关键词的现象。
在本发明公开实施例中,信息一致性检测装置将物品描述信息S1的12个关键词与表一进行对比检索可以查找到只有一个关键词与颜色关键词库中的一个基础颜色关键词对应。即关键词“杏色”和颜色关键词库中的基础颜色关键词“杏色”对应。则“杏色”就是物品描述信息S1对应的颜色关键词。
在本发明公开实施例中,信息一致性检测装置将物品描述信息S2的12个关键词与表一进行对比检索可以查找到只有一个关键词与颜色关键词库中的三个基础颜色关键词对应。由于颜色关键词库中的三个基础颜色关键词“雾霾蓝”、“深蓝”和“蓝”和物品描述信息S2的关键词“雾霾蓝”属于同一色系。所以关键词“雾霾蓝”和颜色关键词库中的基础颜色关键词“雾霾蓝”、“深蓝”和“蓝”对应。则“雾霾蓝”、“深蓝”和“蓝”就是物品描述信息S2对应的颜色关键词。
在本发明公开实施例中,信息一致性检测装置将物品描述信息S3的12个关键词与表一进行对比检索可以查找到只有一个关键词与颜色关键词库中的两个基础颜色关键词对应。即关键词“酒红色”和颜色关键词库中的基础颜色关键词“酒红色”和“红色”对应。则“酒红色”和“红色”就是物品描述信息S3对应的颜色关键词。
在本发明公开实施例中,信息一致性检测装置将物品描述信息S3的12个关键词与表一进行对比检索可以查找到只有一个关键词与颜色关键词库中的两个基础颜色关键词对应。即关键词“绿色”和颜色关键词库中的基础颜色关键词“橄榄绿”和“绿色”对应。则“橄榄绿”和“绿色”就是物品描述信息S4对应的颜色关键词。
S202,若物品描述信息对应的基础颜色关键词的个数大于1,则确定字符数最多的基础颜色关键词为颜色关键词。
在本发明公开实施例中,物品描述信息的关键词可以对应多个基础颜色关键词。其中,多个基础颜色关键词中包括了一个与物品描述信息的关键词最为接近的颜色关键词。在本发明公开实施例中,当物品描述信息的关键词对应多个基础颜色关键词时,基础颜色关键词字符数越多则对颜色的描述越详细,所以取字符数最多的基础颜色关键词为颜色关键词。在本发明公开实施例中,字符数包括了基础颜色关键词组成的字的个数。
在本发明公开实施例中,由于物品描述信息S2的关键词“雾霾蓝”和颜色关键词库中的三个基础颜色关键词 “雾霾蓝”、“深蓝”和“蓝”对应,则确定关键词对应的字符数最多的基础颜色关键词为颜色关键词,也就是确定字符数最多的基础颜色关键词“雾霾蓝”为物品描述信息S2的颜色关键词。
在本发明公开实施例中,由于物品描述信息S3的关键词“酒红色”和颜色关键词库中的两个基础颜色关键词 “酒红色”和“红色”对应,则确定关键词对应的字符数最多的基础颜色关键词为颜色关键词,也就是确定字符数最多的基础颜色关键词“酒红色”为物品描述信息S3的颜色关键词。
在本发明公开实施例中,由于物品描述信息S4的关键词“绿色”和颜色关键词库中的两个基础颜色关键词 “橄榄绿”和“绿色”对应,则确定关键词对应的字符数最多的基础颜色关键词为颜色关键词,也就是确定字符数最多的颜色关键词“橄榄绿”为物品描述信息S4的颜色关键词。
在一些实施例中,参见图7,图7为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图6示出的S202可以通过S203实现,将结合各步骤进行说明。
S203,若物品描述信息对应的基础颜色关键词的个数不大于1,则确定基础颜色关键词为颜色关键词。
在本发明公开实施例中,当物品描述信息的关键词对应一个基础颜色关键词时,则说明该基础颜色关键词就是对关键词的颜色描述最详细的基础颜色关键词,就取该基础颜色关键词为颜色关键词。
在本发明公开实施例中,当物品描述信息的关键词不对应任何一个基础颜色关键词时,则说明颜色关键词库中的基础颜色关键词的信息量不全,将物品描述信息中描述颜色的关键词添加进颜色关键词库中,扩充了颜色关键词库的词汇量。
在本发明公开实施例中,由于物品描述信息S1的关键词“杏色”和颜色关键词库中的一个基础颜色关键词“杏色”对应,则确定关键词对应的基础颜色关键词为物品描述信息S1颜色关键词,也就是“杏色”为物品描述信息S1的颜色关键词。
S23,基于颜色关键词库检索,获取颜色关键词对应的目标颜色色值,并将目标颜色色值转换到第二色值空间得到第二颜色色值。
在本发明是公开实施例中,颜色关键词库中每一个基础颜色关键词对应了一个颜色色值。信息一致性检测装置获取到了一个基础颜色关键词作为颜色关键词,可以在颜色关键词库中查找出该颜色关键词对应的颜色色值作为目标颜色色值。由于在本发明实施例中,颜色关键词对应的目标颜色色值是根据第一色值空间计算得到的色值,所以信息一致性检测装置还需要将目标颜色色值转换到第二色值空间中,计算得到第二颜色色值。
在本发明公开实施例中,第一色值空间包括RGB色值空间,第二色值空间包括LAB色值空间。
在本发明公开实施例中,信息一致性检测装置根据物品描述信息S1的颜色关键词“杏色”在颜色关键词库中可以查找出物品描述信息S1的颜色关键词“杏色”的目标颜色色值(L8,A8,Y8),信息一致性检测装置再将颜色关键词“杏色”的目标颜色色值(L8,A8,Y8)转换到LAB色值空间得到颜色关键词“杏色”的第二颜色色值(L8,A8,B8)。其中,目标颜色色值(L8,A8,Y8)中的L8代表了颜色关键词“杏色”在RGB色值空间的红色色值,A8代表了颜色关键词“杏色”在RGB色值空间的绿色色值,B8代表了颜色关键词“杏色”在RGB色值空间的蓝色色值。第二颜色色值(L8,A8,B8)中的L8代表了颜色关键词“杏色”在LAB色值空间的明度,A8代表了颜色关键词“杏色”在LAB色值空间的红绿色差,B8代表了颜色关键词“杏色”在LAB色值空间的蓝黄色差。后述的目标颜色色值和第二颜色色值与本实施例中的解释相同,在此不一一赘述。
在本发明公开实施例中,信息一致性检测装置根据物品描述信息S2的颜色关键词“雾霾蓝”在颜色关键词库中可以查找出物品描述信息S2的颜色关键词“雾霾蓝”的目标颜色色值(L1,A1,Y1),信息一致性检测装置再将颜色关键词“雾霾蓝”的目标颜色色值(L1,A1,Y1)转换到LAB色值空间得到颜色关键词“雾霾蓝”的第二颜色色值(L1,A1,B1)。
在本发明公开实施例中,信息一致性检测装置根据物品描述信息S3的颜色关键词“酒红色”在颜色关键词库中可以查找出物品描述信息S3的颜色关键词“酒红色”的目标颜色色值(L4,A4,Y4),信息一致性检测装置再将颜色关键词“酒红色”的RGB色值(L4,A4,Y4)转换到LAB色值空间得到颜色关键词“酒红色”的第二颜色色值(L4,A4,B4)。
在本发明公开实施例中,信息一致性检测装置根据物品描述信息S3的颜色关键词“橄榄绿”在颜色关键词库中可以查找出物品描述信息S3的颜色关键词“橄榄绿”的目标颜色色值(L6,A6,Y4),信息一致性检测装置再将颜色关键词“橄榄绿”的目标颜色色值(L6,A6,Y6)转换到LAB色值空间得到颜色关键词“橄榄绿”的第二颜色色值(L6,A6,B6)。
在一些实施例中,参见图4,图4为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图1示出的S05可以通过S107-S108实现,将结合各步骤进行说明。
S107,基于第一颜色色值、第二颜色色值及权重计算色值差。
在本发明公开实施例中,信息一致性检测装置获取第一颜色色值、第二颜色色值和目标物品图片每个像素单元内的像素点的个数占目标物品图片上的总像素点的个数的权重。信息一致性检测装置可以基于所述权重计算出第一颜色色值和第二颜色色值之间的色值差。
在本发明公开实施例中,色值差描述的是目标物品图片的一个像素单元中心的第一颜色色值与物品描述信息对应的第二颜色色值的亮度差、红绿色值差和黄色色值差。
在本发明公开实施例中,信息一致性检测装置通过S105获取到了目标物品图片每个像素单元中心的第一颜色色值(L3,A3,B3),信息一致性检测装置通过S23获取到了与目标物品图片对应的物品描述信息S1的第二颜色色值(L8,A8,B8)、物品描述信息S2的第二颜色色值(L1,A1,B1)、物品描述信息S3的第二颜色色值(L4,A4,B4)和物品描述信息S4的第二颜色色值(L6,A6,B6)。同时还计算出了目标物品图片每个像素单元内的像素点的个数占目标物品图片上的总像素点的个数的权重W。可以使用公式(1)计算得到目标物品图片的第一颜色色值分别与四组物品描述信息的第二颜色色值的色值差,公式(1)为:
Figure 842613DEST_PATH_IMAGE002
其中,n为物品描述信息S1或者物品描述信息S2或者物品描述信息S3或者物品描述信息S4的第二颜色色值的数量,m为目标物品图片第一颜色色值的数量,w为雾霾蓝外套的第一颜色色值所在的像素单元内的像素点的个数占目标物品图片上的总像素点的个数的权重,i为第i组物品描述信息,j为第j个像素单元,ciede为国际颜色组织提出的色差计算标准CIEDE-2000计算公式。在本发明公开实施例中,信息一致性检测装置将目标物品图片上的若干个第一颜色色值和目标物品图片对应的任何一组的物品描述信息的第二颜色色值进行加权平均运算,同时融合色差计算标准CIEDE-2000计算公式,可以计算得到目标物品图片与任何一组物品描述信息的色值差M。
S108,若色值差小于色值阈值,则目标物品图片和物品描述信息一致。
在本发明公开实施例中,色值差代表了目标物品图片的第一颜色色值和物品描述信息的第二颜色色值之间的色值差。由于目标物品图片上的像素点分布不均匀或者目标物品图片包括了多种颜色色值的原因,目标物品图片的第一颜色色值可以与第二颜色色值存在一定的误差。所以信息一致性检测装置需要预先确定一个色值阈值,若色值差小于色值阈值,则说明第一颜色色值和第二颜色色值相差较小,目标物品图片和物品描述信息一致,人眼很难分辨出目标物品图片的颜色和物品描述信息描述的颜色之间的差别。
在本发明公开实施例中,色值阈值可以为一个预先设定的数值,色值阈值用于判定目标物品图片和物品描述信息是否一致。
在本发明公开实施例中,信息一致性检测装置将计算获取到的物品描述信息S1或者物品描述信息S2或者物品描述信息S3或者物品描述信息S4与目标物品图片的色值差M与色值阈值N进行对比。若色值差M小于色值阈值N时,则目标物品图片与对应的物品描述信息S1或者物品描述信息S2或者物品描述信息S3或者物品描述信息S4一致。
在一些实施例中,参见图8,图8为本发明公开实施例提供的信息一致性检测方法的一个可选的流程示意图,图4示出的S108可以通过S109实现,将结合各步骤进行说明。
S109,若色值差不小于色值阈值,则目标物品图片和物品描述信息不一致。
在本发明公开实施例中,色值差代表了目标物品图片的第一颜色色值和物品描述信息的第二颜色色值之间的色值差。由于目标物品图片上的像素点分布不均匀或者目标物品图片包括了多种颜色色值的原因,目标物品图片的第一颜色色值可以与第二颜色色值存在一定的误差。所以信息一致性检测装置需要预先确定一个色值阈值,若色值差不小于色值阈值,则说明第一颜色色值和第二颜色色值相差较大,目标物品图片和物品描述信息不一致,人眼易分辨出目标物品图片的颜色和物品描述信息描述的颜色之间的差别。
在本发明公开实施例中,色值阈值可以为一个预先设定的数值,色值阈值用于判定目标物品图片和物品描述信息是否一致。
在本发明公开实施例中,信息一致性检测装置将计算获取到的物品描述信息S1或者物品描述信息S2或者物品描述信息S3或者物品描述信息S4与目标物品图片的色值差M与色值阈值N进行对比。若色值差M不小于色值阈值N,则物品图片1与对应的物品描述信息S1或者物品描述信息S2或者物品描述信息S3或者物品描述信息S4不一致。
本发明公开实施例通过获取目标物品图片,及目标物品图片对应的四组物品描述信息,提取所述目标物品图片的第一颜色色值并计算出第一颜色色值对应像素单元内像素点的权重;获取物品描述信息中的颜色关键词,查找颜色关键词对应的第二颜色色值,基于第一颜色色值、权重和第二颜色色值计算色值差,若色值差小于色值阈值,则目标物品图片和物品描述信息一致;若色值差不小于色值阈值,则目标物品图片和物品描述信息不一致。通过信息一致性检测装置可以快速大量的在物品描述页面获取物品描述信息和物品图片,进行高效准确的检测出物品图片与物品描述信息是否一致。
请参阅图9,为本发明公开实施例提供的信息一致性检测装置的结构示意图。
在本发明公开实施例中,信息一致性检测装置10,包括:图片处理单元11、信息处理单元12和数据处理单元13。
图片处理单元11,用于在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片;对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值;
具体的,在本发明实施例中,图像处理单元11在所述物品描述页面中,基于目标检测算法对所述物品图片进行处理,获取所述物品图片中包括了目标物品的目标框图,图像处理单元11基于分割模型对所述目标框图进行图像分割处理,确定所述目标框图中的所述目标物品图片。图像处理单元11将所述目标物品图片上的像素点从第一色值空间转换到第二色值空间,计算得到像素点对应的基础像素色值,基于所述基础像素色值,将所述目标物品图片上的总像素点按照预定的像素色值范围划分为多个像素单元,图像处理单元11计算获取所述多个像素单元中心像素点的第一颜色色值。
信息处理单元12,用于针对物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词;基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值;
具体的,在本发明实施例中,信息处理单元12将所述物品描述信息输入分词模型,基于所述分词模型将所述物品描述信息分成多个关键词,基于所述关键词在颜色关键词库中检索出所述物品描述信息对应的基础颜色关键词,若所述物品描述信息对应的所述基础颜色关键词的个数大于1,则确定字符数最多的所述基础颜色关键词为颜色关键词;若所述物品描述信息对应的所述基础颜色关键词的个数不大于1,则确定所述基础颜色关键词为颜色关键词。信息处理单元12基于所述颜色关键词库检索,获取所述颜色关键词对应的目标颜色色值,并将所述目标颜色色值转换到第二色值空间得到所述第二颜色色值。
数据处理单元13,用于基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果。
具体的,在本发明实施例中,数据处理单元13基于所述第一颜色色值、所述第二颜色色值及所述权重计算色值差;若所述色值差小于色值阈值,则数据处理单元13反馈目标物品图片和所述物品描述信息一致;若所述色值差不小于色值阈值,则数据处理单元13反馈目标物品图片和所述物品描述信息不一致。
本发明公开实施例通过图片处理单元在物品描述页面中处理得到目标物品图片,提取目标物品图片的第一颜色色值;通过信息处理单元获取物品描述信息中的颜色关键词,查找颜色关键词对应的第二颜色色值,数据处理单元基于第一颜色色值和第二颜色色值计算色值差,确定所述物品描述信息的检测结果。信息一致性检测装置替代人工检测具有检测效率高,成本低,出错率低的优点。
需要说明的是,本发明实施例中,如果以软件功能模块的形式实现上述的集群构建及订阅信息处理方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台信息一致性检测设备800(可以是个人计算机等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本发明实施例不限制于任何特定的硬件和软件结合。
对应地,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法中的步骤。
对应地,本发明实施例提供一种信息一致性检测设备800,包括存储器802和处理器801,所述存储器802存储有可在处理器801上运行的计算机程序,所述处理器801执行所述程序时实现上述方法中的步骤。
这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本发明存储介质和设备实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
需要说明的是,图10为本发明公开实施例提供的信息一致性检测设备800的一种硬件实体示意图,如图10所示,该信息一致性检测设备800的硬件实体包括:处理器801和存储器802,其中;
处理器801通常控制服务节点800的总体操作。
存储器802配置为存储由处理器801可执行的指令和应用,还可以缓存待处理器801以及信息一致性检测设备800中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(FLASH)或随机访问存储器(RandomAccess Memory,RAM)实现。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(Read Only Memory,ROM)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (12)

1.一种信息一致性检测方法,其特征在于,包括:
在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片;
对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值;
在所述物品描述页面中,确定出所述物品图片对应的物品描述信息;
针对物品描述页面中的物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词;
基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值;
基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果。
2.根据权利要求1所述的信息一致性检测方法,其特征在于,所述在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片,包括:
在所述物品描述页面中,基于目标检测算法对所述物品图片进行处理,获取所述物品图片中包括了目标物品的目标框图;
基于分割模型对所述目标框图进行图像分割处理,确定所述目标框图中的所述目标物品图片。
3.根据权利要求2所述的信息一致性检测方法,其特征在于,所述对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值,包括:
将所述目标物品图片上的像素点从第一色值空间转换到第二色值空间,计算得到像素点对应的基础像素色值;
基于所述基础像素色值,将所述目标物品图片上的总像素点按照预定的像素色值范围划分为多个像素单元;
计算获取所述多个像素单元中的每一个像素单元的中心像素点的第一颜色色值。
4.根据权利要求3所述的信息一致性检测方法,其特征在于,所述计算获取所述像素单元中心像素点的第一颜色色值之后,所述方法还包括:
计算获取所述多个像素单元内每一个像素单元的所述像素点的个数占所述目标物品图片上所述总像素点个数的权重。
5.根据权利要求1所述的信息一致性检测方法,其特征在于,所述针对物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词,包括:
将所述物品描述信息输入分词模型,基于所述分词模型将所述物品描述信息分成多个关键词;
基于所述多个关键词中的每一个关键词在颜色关键词库中检索出所述物品描述信息对应的颜色关键词。
6.根据权利要求5所述的信息一致性检测方法,其特征在于,所述分词模型的分词结构包括了所述颜色关键词库内的基础颜色关键词。
7.根据权利要求6所述的信息一致性检测方法,其特征在于,所述基于所述多个关键词中的每一个关键词在颜色关键词库中检索出所述物品描述信息对应的颜色关键词,包括:
基于所述多个关键词中的所述每一个关键词在颜色关键词库中检索出所述物品描述信息对应的所述基础颜色关键词;
若所述物品描述信息对应的所述基础颜色关键词的个数大于1,则确定字符数最多的所述基础颜色关键词为颜色关键词;
若所述物品描述信息对应的所述基础颜色关键词的个数不大于1,则确定所述基础颜色关键词为颜色关键词。
8.根据权利要求7所述的信息一致性检测方法,其特征在于,所述基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值,包括:
基于所述颜色关键词库检索,获取所述颜色关键词对应的目标颜色色值,并将所述目标颜色色值转换到第二色值空间得到所述第二颜色色值。
9.根据权利要求4所述的信息一致性检测方法,其特征在于,所述基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果,包括:
基于所述第一颜色色值、所述第二颜色色值及所述权重计算色值差;
若所述色值差小于色值阈值,则所述物品描述信息的检测结果为所述目标物品图片和所述物品描述信息一致;
若所述色值差不小于色值阈值,则所述物品描述信息的检测结果为所述目标物品图片和所述物品描述信息不一致。
10.一种信息一致性检测装置,其特征在于,包括:
图片处理单元,用于在物品描述页面中,针对物品图片进行图像分割,确定出目标物品图片;对所述目标物品图片进行关键颜色提取,得到所述目标物品图片的第一颜色色值;
信息处理单元,用于针对物品描述信息进行文本识别,确定所述物品描述信息的颜色关键词;基于所述颜色关键词,确定所述颜色关键词对应的第二颜色色值;
数据处理单元,用于基于所述第一颜色色值和所述第二颜色色值,确定所述物品描述信息的检测结果。
11.一种信息一致性检测设备,其特征在于,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1至9任一项所述方法中的步骤。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至9任一项所述方法中的步骤。
CN202011235827.2A 2020-11-09 2020-11-09 信息一致性检测方法、装置、设备及存储介质 Active CN112036521B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011235827.2A CN112036521B (zh) 2020-11-09 2020-11-09 信息一致性检测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011235827.2A CN112036521B (zh) 2020-11-09 2020-11-09 信息一致性检测方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN112036521A true CN112036521A (zh) 2020-12-04
CN112036521B CN112036521B (zh) 2021-10-01

Family

ID=73572789

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011235827.2A Active CN112036521B (zh) 2020-11-09 2020-11-09 信息一致性检测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112036521B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251850A (ja) * 2008-04-04 2009-10-29 Albert:Kk 類似画像検索を用いた商品推薦システム
CN103198408A (zh) * 2011-11-21 2013-07-10 日立民用电子株式会社 商品购入装置以及信息处理方法
CN105740269A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 对颜色进行标注的方法和装置
CN107748973A (zh) * 2017-09-29 2018-03-02 时瑞科技(深圳)有限公司 商品识别系统及自动识别售卖或入库方法
CN109359644A (zh) * 2018-08-28 2019-02-19 东软集团股份有限公司 文字图像一致性比对方法、装置、存储介质和电子设备
CN109583909A (zh) * 2018-10-26 2019-04-05 深圳壹账通智能科技有限公司 基于图像识别的房屋信息甄别方法、装置、设备及介质
CN110147814A (zh) * 2019-04-04 2019-08-20 北京奇艺世纪科技有限公司 一致性检测方法、装置、终端设备及计算机可读存储介质
CN110619103A (zh) * 2019-09-18 2019-12-27 珠海格力电器股份有限公司 网页图文检测方法、装置及存储介质
CN110851605A (zh) * 2019-11-14 2020-02-28 携程计算机技术(上海)有限公司 Ota酒店的图文信息匹配的检测方法、系统及电子设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251850A (ja) * 2008-04-04 2009-10-29 Albert:Kk 類似画像検索を用いた商品推薦システム
CN103198408A (zh) * 2011-11-21 2013-07-10 日立民用电子株式会社 商品购入装置以及信息处理方法
CN105740269A (zh) * 2014-12-10 2016-07-06 阿里巴巴集团控股有限公司 对颜色进行标注的方法和装置
CN107748973A (zh) * 2017-09-29 2018-03-02 时瑞科技(深圳)有限公司 商品识别系统及自动识别售卖或入库方法
CN109359644A (zh) * 2018-08-28 2019-02-19 东软集团股份有限公司 文字图像一致性比对方法、装置、存储介质和电子设备
CN109583909A (zh) * 2018-10-26 2019-04-05 深圳壹账通智能科技有限公司 基于图像识别的房屋信息甄别方法、装置、设备及介质
CN110147814A (zh) * 2019-04-04 2019-08-20 北京奇艺世纪科技有限公司 一致性检测方法、装置、终端设备及计算机可读存储介质
CN110619103A (zh) * 2019-09-18 2019-12-27 珠海格力电器股份有限公司 网页图文检测方法、装置及存储介质
CN110851605A (zh) * 2019-11-14 2020-02-28 携程计算机技术(上海)有限公司 Ota酒店的图文信息匹配的检测方法、系统及电子设备

Also Published As

Publication number Publication date
CN112036521B (zh) 2021-10-01

Similar Documents

Publication Publication Date Title
US10242396B2 (en) Automatic color palette based recommendations for affiliated colors
US20210182333A1 (en) Correlating image annotations with foreground features
CN103678335B (zh) 商品标识标签的方法、装置及商品导航的方法
US9460518B2 (en) Visual clothing retrieval
CN106933867B (zh) 一种图像查询方法和装置
WO2015200523A1 (en) Automatic color palette based recommendations
CN107291825A (zh) 一种视频中同款商品的检索方法和系统
US9251395B1 (en) Providing resources to users in a social network system
TW201227535A (en) Semantic parsing of objects in video
KR101835333B1 (ko) 얼굴 인식 서비스 제공 방법
US11475500B2 (en) Device and method for item recommendation based on visual elements
CN102567543A (zh) 一种服装图片的搜索方法和装置
CN114332680A (zh) 图像处理、视频搜索方法、装置、计算机设备和存储介质
WO2016139964A1 (ja) 注目領域抽出装置および注目領域抽出方法
CN116580257A (zh) 特征融合模型训练及样本检索方法、装置和计算机设备
CN111767420A (zh) 一种生成服饰搭配数据的方法和装置
CN107315984B (zh) 一种行人检索的方法及装置
CN114898349A (zh) 目标商品识别方法及其装置、设备、介质、产品
CN115293332A (zh) 一种图神经网络的训练方法、装置、设备及存储介质
CN112036521B (zh) 信息一致性检测方法、装置、设备及存储介质
CN110674388A (zh) 推送项目的配图方法、装置、存储介质和终端设备
CN115936805A (zh) 商品推荐方法及其装置、设备、介质
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备
CN112650869B (zh) 图像检索重排序方法、装置、电子设备及存储介质
JPH11219365A (ja) 画像検索装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant