CN114357178A - 商品标签信息的处理方法、装置、存储介质及系统 - Google Patents
商品标签信息的处理方法、装置、存储介质及系统 Download PDFInfo
- Publication number
- CN114357178A CN114357178A CN202111495803.5A CN202111495803A CN114357178A CN 114357178 A CN114357178 A CN 114357178A CN 202111495803 A CN202111495803 A CN 202111495803A CN 114357178 A CN114357178 A CN 114357178A
- Authority
- CN
- China
- Prior art keywords
- commodity
- label information
- auditing
- knowledge
- entity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种商品标签信息的处理方法、装置、存储介质及系统。其中,该方法包括:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。本发明解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
Description
技术领域
本发明涉及人工智能领域,具体而言,涉及一种商品标签信息的处理方法、装置、存储介质及系统。
背景技术
一直以来,食品安全问题都是相关部门和民众重点关注的问题之一,相关监管力度大,力求严守食品安全底线。在食品安全问题中,食品标签是最直观反映食品状态也是出错概率最高的食品安全风险,对此,本领域的技术人员不断探求各种精准高效的可用于食品安全监管的商品标签审核方案。
对于商品标签中的标签说明、商品成分等审核要素,商品标签审核过程包含了一系列复杂的审核与计算逻辑。现有方案中,商品标签的审核过程包括:获取待审核的商品样本;采用文本分类模型或者人工对商品进行分类,人工标注分类结果;将不同类别的商品分配给不同领域的专家进行商品标签的人工审核;对审核结果进行校对和归档。
然而,这种方法的缺陷在于:海量商品的分类审核过程对技术人员专业性要求极高;复杂的审核流程导致审核实效性差;审核过程高度依赖人工,成本高、灵活性和通用性低。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种商品标签信息的处理方法、装置、存储介质及系统,以至少解决现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
根据本发明实施例的一个方面,提供了一种商品标签信息的处理方法,包括:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
根据本发明实施例的另一方面,还提供了一种商品标签信息的处理方法,包括:接收来自于客户端的待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析以得到商品标签信息,利用知识图谱将商品标签信息转化为待审核知识实体,对商品标签信息进行分类以得到目标商品类别,以及基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果;将审核结果反馈至客户端。
根据本发明实施例的另一方面,通过电子装置提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一商品标签信息审核场景,图形用户界面包括:商品类别选择子界面、知识图谱选择子界面和审核结果显示子界面,还提供了一种商品标签信息的处理方法,包括:响应对商品类别选择子界面执行的第一触控操作,获取目标商品的商品标签信息,并对商品标签信息进行分类,得到目标商品类别;响应对知识图谱选择子界面执行的第二触控操作,确定待使用的知识图谱,并利用知识图谱将商品标签信息转化为待审核知识实体;响应对审核结果显示子界面执行的第三触控操作,基于目标商品类别对应的规则引擎对待审核知识实体进行审核,显示商品标签信息的审核结果。
根据本发明实施例的另一方面,还提供了一种商品标签信息的处理装置,包括:获取模块,用于获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;解析模块,用于对待处理图像进行解析,得到商品标签信息;转化模块,用于利用知识图谱将商品标签信息转化为待审核知识实体;分类模块,用于对商品标签信息进行分类,得到目标商品类别;审核模块,用于基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
根据本发明实施例的另一方面,还提供了一种存储介质,上述存储介质包括存储的程序,其中,在上述程序运行时控制上述存储介质所在设备执行任意一项上述的商品标签信息的处理方法。
根据本发明实施例的另一方面,还提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行任意一项上述的商品标签信息的处理方法。
根据本发明实施例的另一方面,还提供了一种商品标签信息的处理系统,包括:处理器;以及存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
在本发明实施例中,获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;采用对待处理图像进行解析的方法,得到商品标签信息;并利用知识图谱将商品标签信息转化为待审核知识实体;通过对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
容易注意到的是,通过本发明实施例,从知识图谱的角度出发,探索基于知识图谱的自动化标签审核方案。对于给定的商品,通过智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑,从而自动得到商品标签审核结果。
由此,本发明实施例达到了对海量商品标签进行精准分类、自动审核的目的,从而实现了为商品标签审核人员打破知识壁垒、提升商品标签审核效率、降低商品标签审核成本的技术效果,进而解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了一种用于实现商品标签信息的处理方法的计算机终端(或移动设备)的硬件结构框图;
图2是根据本发明实施例的一种商品标签信息的处理方法的流程图;
图3是根据本发明实施例的一种可选的食品标签信息的处理过程的示意图;
图4是根据本发明实施例的一种可选的构建食品安全知识图谱过程的示意图;
图5是根据本发明实施例的一种可选的食品分类器的结构的示意图;
图6是根据本发明实施例的一种可选的食品分类模型的训练过程的示意图;
图7是根据本发明实施例的一种可选的利用规则引擎进行食品标签审核的过程的示意图;
图8是根据本发明实施例的一种可选的配料表审核过程的示意图;
图9是根据本发明实施例的一种可选的食品配料表审核过程的示意图;
图10是根据本发明实施例的一种可选的食品标签审核过程的示意图;
图11是根据本发明实施例的一种可选的商品标签信息的处理方法的流程图;
图12是根据本发明实施例的一种在云端服务器进行商品标签信息的处理的示意图;
图13是根据本发明实施例的一种可选的商品标签信息的处理方法的流程图;
图14是根据本发明实施例的一种商品标签信息的处理装置的结构示意图;
图15是根据本发明实施例的一种可选的商品标签信息的处理装置的结构示意图;
图16是根据本发明实施例的另一种计算机终端的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本发明实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
标签审核:指对商品的包装和标签中的内容要素进行合规审核,其中,内容要素包括:文字描述、配料表、营养成分表、生成日期等。
带入原则:商品制作过程中,往往会带入其他商品,例如,制作面包时可能会带入肉松。此时,在商品标签审核的过程中,对商品原有组成成分和带入成分的审核原则叫做带入原则。仍然例如,由于面粉和糖是面包的组成成分,面粉和糖的使用应当遵循面包的相关规定,而肉松中的各组成成分的使用则应当遵循肉松的相关规定,而不是面包的使用规定。
食品添加剂:食品添加剂是为改善食品色、香、味等品质,以及为防腐和加工工艺的需要而加入食品中的人工合成或者天然物质。每种添加剂都有明确的使用范围和用量要求,并且在不同食品国标类别下,使用添加剂的要求也不同。
营养强化剂:指为提高食品营养价值,而加入食品中的一种或多种营养素或者某些天然食品。每种营养强化剂都有明确的使用范围和用量要求,并且在不同食品国标类别下,使用营养强化剂的要求也不同。
配料表:指商品的原料构成,通常为一段文本,列出食品中的主要成分,且所列食品中主要成分的顺序和格式需要符合相关标准的要求。
营养成分表:包括营养名称和量化的信息,以表格的形式展示,且表格中所列各营养名称的列出顺序、格式和量化值需要符合相关标准的要求。
实施例1
根据本发明实施例,还提供了一种商品标签信息的处理方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本发明实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。图1示出了一种用于实现商品标签信息的处理方法的计算机终端(或移动设备)的硬件结构框图。如图1所示,计算机终端10(或移动设备10)可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为BUS总线的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路在本文中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算机终端10(或移动设备)中的其他元件中的任意一个内。如本发明实施例中所涉及到的,该数据处理电路作为一种处理器控制(例如与接口连接的可变电阻终端路径的选择)。
存储器104可用于存储应用软件的软件程序以及模块,如本发明实施例中的商品标签信息的处理方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的应用程序的漏洞检测方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算机终端10(或移动设备)的用户界面进行交互。
此处需要说明的是,在一些可选实施例中,上述图1所示的计算机设备(或移动设备)可以包括硬件元件(包括电路)、软件元件(包括存储在计算机可读介质上的计算机代码)、或硬件元件和软件元件两者的结合。应当指出的是,图1仅为特定具体实例的一个实例,并且旨在示出可存在于上述计算机设备(或移动设备)中的部件的类型。
在上述运行环境下,本发明提供了如图2所示的一种商品标签信息的处理方法。图2是根据本发明实施例的一种商品标签信息的处理方法的流程图,如图2所示,该商品标签信息的处理方法包括:
步骤S202,获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;
步骤S204,对待处理图像进行解析,得到商品标签信息;
步骤S206,利用知识图谱将商品标签信息转化为待审核知识实体;
步骤S208,对商品标签信息进行分类,得到目标商品类别;
步骤S210,基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
上述待处理图像可以是包括待处理的目标商品的商品标签信息的图像,其中,该目标商品的商品标签信息可以包括:商品名、商标、产地、生产商、经销商、配料表、营养成分表、联系方式、质量体系认证标识等。对该待处理图像进行解析,可以得到该商品标签信息。
上述知识图谱是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系。知识图谱通过对错综复杂的文档的数据进行有效的加工、处理和整合,得到简单、清晰的“实体、关系、实体”三元组,最后通过聚合大量的知识,实现对知识的快速响应和推理。知识图谱因其强大的语义处理能力与开放互联能力,被广泛地应用于智能搜索、智能问答、个性化推荐、情报分析和反欺诈等领域。
根据上述目标商品的商品标签信息,利用知识图谱,可以得到与该目标商品对应的待审核的知识实体。需要说明的是,实体是指语句中出现的客观世界中存在的,并可以相互区别的对象或概念。
上述商品类别是指商场提供给消费者的相关商品群。特别地,我国零售企业对商品类别的分类有两种基本方法:
第一,按照消费者的需求及特征划分。例如,按消费者的衣、食、住、用、行划分,有食品类、服装类、鞋帽类、日用品类、家具类、家用电器类、纺织品类、五金电料类、厨具类等;再例如,按照消费者的需要层次划分,有基本生活品类、享受品类和发展品类等;又例如,按照消费者购买行为划分,有日用品类、选购品类和特殊品类;又例如,按照消费者的差异分有老年人用品类、中年用品类、青年用品类、儿童及婴儿用品类;女士用品类、男士用品类等。
第二,按照商场经营管理商品的角度划分。例如,按经营重要程度划分,可分为主营商品、一般商品类和辅助商品类;再例如,按商品销售的顺畅程度划分,有畅销商品类、平销商品类、滞销商品类和冷背商品类;又例如,按商品质量及价格划分,有高档商品类、中档商品类和低档商品类。
通过对上述目标商品对应的商品标签信息进行分类,可以实现对该目标商品的分类,得到该目标商品所属的目标商品类别。
上述规则引擎是指是一种嵌入在应用程序中的组件,该规则引擎用于实现将任务决策从应用程序代码中分离,并使用预定义的语义模块编写任务决策。规则引擎具有灵活性高、复杂度低、可重用性高和容易掌控的优势。常用的规则引擎是Drools开源规则引擎,将输入数据或事实(Fact)对象与规则条件进行匹配,并根据匹配结果决定如何执行规则。
上述审核结果可以包括:该目标商品的商品标签中是否存在错别字、文字描述是否合规、商品组成成分是否合规等。上述目标商品的目标商品类别对应的规则引擎,可以对上述待审核知识实体进行审核,进而得到该目标商品的商品标签信息的审核结果。
容易注意到的是,通过本发明实施例,从知识图谱的角度出发,探索基于知识图谱的自动化标签审核方案。对于给定的商品,通过智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑,从而自动得到商品标签审核结果。
由此,本发明实施例达到了对海量商品标签进行精准分类、自动审核的目的,从而实现了为商品标签审核人员打破知识壁垒、提升商品标签审核效率、降低商品标签审核成本的技术效果,进而解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
可选地,本发明所提供的上述商品标签信息的处理方法可以但不限于应用于食品安全监管等实际应用场景,例如,在食品安全中台中,通过本发明所提供的商品标签信息的处理方法中的审核逻辑,可以测算食品是否存在非法添加、虚假宣传等问题。本发明所提供的商品标签信息的处理方法可以为线上商品提供品质管理的重要依据,及时发现风险,并据此督促商家自查整改,进而保护商家和消费者的合法权益,营造良好的营商环境。
在一种可选的实施例中,在步骤S204中,对待处理图像进行解析,得到商品标签信息,包括如下方法步骤:
步骤S241,对待处理图像进行字符识别,得到目标文本;
步骤S242,对目标文本进行结构化处理,得到商品标签信息。
上述目标文本可以是上述待处理图像中的文本信息,对该待处理图像进行字符识别,可以得到该目标文本。对该目标文本进行结构化处理,可以的到该待处理图像包括的上述商品标签信息。
可选地,上述字符识别可以是光学字符识别(Optical Character Recognition,简称OCR)。OCR是指对包含文本资料的图像文件进行分析识别处理,获取文字及版面信息的技术。
图3是根据本发明实施例的一种可选的食品标签信息的处理过程的示意图,如图3所示,对待审核的食品标签进行标签要素解析,该解析过程可以包括:对该待审核的食品标签图像进行光学字符识别,得到该待审核的食品标签中的文字及版面文本信息,记为;对该文本信息进行归一化处理,即对文本中的错别字、别名、符号等进行修正和归一;对该文字及版面信息进行结构化处理,得到商品名、配料表、带入表等商品标签信息。
仍然如图3所示。商品标签信息中还包括:基于待审核的食品对应的食品数据,通过国标对齐操作,得到的该待审核的商品对应的国标类别和带入类别。
在一种可选的实施例中,在步骤S206中,利用知识图谱将商品标签信息转化为待审核知识实体,包括如下方法步骤:
步骤S261,通过实体链接,将商品标签信息链接至知识图谱中对应的待审核知识实体。
上述实体链接是指将自然语言文本中出现的实体提及(Entity mention)关联到对应知识图谱的实体上去的任务,例如,标准数据库、知识库、地名词典中对应条目的链接。通过该实体链接,可以将上述商品标签信息链接至知识图谱中对应的待审核知识实体。
仍然如图3所示,在对食品标签进行审核之前,应当由食品安全国家标准相关文件进行食品安全知识图谱构建,其中,食品安全国家标准相关文件可以包括《GB 2760食品安全国家标准食品添加剂使用标准》、《GB 14880食品安全国家标准食品营养强化剂使用标准》等标准文件;构建得到的食品安全知识图谱包括项目知识库和规则知识库。
可选地,对上述标准文件《GB 2760食品安全国家标准食品添加剂使用标准》和《GB14880食品安全国家标准食品营养强化剂使用标准》进行解析,可以得到上述项目知识库,该项目知识库中可以包括:添加剂、营养强化剂,酶制剂、加工助剂、香精香料、食用菌等项目。
可选地,对上述标准文件《GB 2760食品安全国家标准食品添加剂使用标准》和《GB14880食品安全国家标准食品营养强化剂使用标准》进行解析,可以得到上述规则知识库,该规则知识库可以包括:各类食物的审核逻辑、各类食物中各类组成成分的含量规定等。
需要说明的是,食品安全知识图谱中的数据以知识实体的方式存储,该知识实体是指由该待审核的目标商品对应的待审核的商品标签信息得到的数据个体。
具体地,图4是根据本发明实施例的一种可选的构建食品安全知识图谱过程的示意图,如图4所示,基于待审核的食品标签中的食品信息,首先对该食品信息进行错别字识别(包括修正、归一);同时对该待审核的食品标签中的食品数据进行词表扩充,其中词表扩充包括:对该食品数据进行数据处理、新词发现和实体识别;可以得到该食品信息对应的歧义词表、映射表和同义词表。
仍然如图4所示,选取训练集用于构建上述食品安全知识图谱;基于该训练集,进行实体消歧,其中实体消歧的操作如下:对该训练集进行分词,得到对应的词集合;根据该词集合进行实体识别,得到对应的实体集合;对该实体集合进行特征抽取,得到对应的实体特征。将基于该训练集的实体消歧操作与上述待审核的食品标签对应的歧义词表相结合,可以得到实体消歧链接。
仍然如图4所示,由上述映射表和同义词表,可以得到无歧义实体链接。通过上述实体消歧链接和该无歧义实体链接,可以得到上述食品安全知识图谱。其中,该食品安全知识图谱可以包括:食品知识库、配料知识库和添加剂知识库。
需要说明的是,上述词表构建的关键是通过新词发现和实体识别的方法不断对已有词表进行扩充,从而保证实体的召回率,即保证最终使用上述食品安全知识图谱时,从对应的知识库中检索出的相关信息量。上述实体链接包括歧义实体链接和非歧义实体链接,其中,歧义实体链接用于通过实体特征选择和排序的方式,从歧义词表中筛选得到候选知识实体;非歧义实体链接用于通过阿霍-科拉西克自动机(Aho-Corasick automaton,简称AC自动机)将同义词表与映射表相匹配,得到实体名称的映射关系,从而将该实体链接到知识库中,即得到对应的知识实体。
在一种可选的实施例中,在步骤S208中,对商品标签信息进行分类,得到目标商品类别,包括如下方法步骤:
步骤S281,利用商品分类模型对商品标签信息进行分析,确定目标商品类别,其中,商品分类模型使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:样本商品的名称信息和样本商品的配料信息,目标商品类别包括:商品国标类别。
上述商品分类模型可以由多组数据通过机器学习训练得到,其中,该多组数据中的每组数据均包括:选作样本的商品对应的名称信息和配料信息。利用机器学习训练得到的该商品分类模型,可以确定上述目标商品的目标商品类别。该目标商品类别可以包括:商品国标类别(由相关国家标准相关文件确定的商品类别)。
食品标签审核中的食品分类是关键环节,根据食品分类所得的目标食品类别可以准确找到该食品对应的审核逻辑和依据。然而,现有食品类目非常多,而且技术人员标注食品类目需要很强专业性,导致食品标注成本高,因此,本发明实施例采用半监督学习和监督学习迭代训练的方式来训练得到食品分类模型。
图5是根据本发明实施例的一种可选的食品分类器的结构的示意图,如图5所示,基于转换编码器的双向编码表示(Bidirectional Encoder Representation fromTransformer,简称Bert)模型利用转换编码器编码双向上下文信息,并采用多任务模型考虑不同粒度的语义信息,即分别适用掩码语言模型(Masked Language Model)和下一句预测(Next Sentence Prediction)两种方法捕捉词语和句子级别的特征描述。本发明实施例中选用强力优化的BERT(A robustly Optimized BERT,简称RoBERTa)模型作为食品分类器,该模型的输入为食品名称和配料两部分文本的拼接。
图6是根据本发明实施例的一种可选的食品分类模型的训练过程的示意图,如图6所示,在食品分类模型的训练过程中,半监督学习包括:根据已有的标注数据,从无监督数据中召回相似样本作为半监督数据,其中,召回操作可以是匹配、聚类、相似检索等;通过实体替换和转义生成对抗网络,使用该对抗网络对已有的标注数据进行数据增强,并将该数据增强的结果并入半监督数据;通过半监督数据训练得到弱标签模型。
仍然如图6所示,在食品分类模型的训练过程中,监督学习包括:根据已有的标注数据,进行类别平衡的上采样,得到采样后的标注数据;根据该采样后的标注数据,在上述弱标签模型的基础上再次训练,得到监督学习模型;从无监督数据中重新随机采样,得到部分食品数据;将该部分食品数据通过监督学习模型处理得到食品国标类别预测结果;将该预测结果交由专业技术人员进行人工校验,得到新的标注数据。
仍然如图6所示,在食品分类模型的训练过程中,还包括如下方法步骤:监督学习得到的新的标注数据可以并入原有标注数据中,重复进行上述半监督学习和监督学习过程,直到监督学习模型对食品国标类别的预测结果是稳定而收敛的,此时,可以将该监督学习模型作为食品分类模型,进而完成食品标签审核。
在一种可选的实施例中,商品标签信息的处理方法还包括如下方法步骤:
步骤S212,对目标商品关联的目标类型文件进行解析,得到审核规则;
步骤S214,将审核规则导入知识图谱,并转化为规则文件;
步骤S216,通过实体链接将规则文件与知识图谱进行知识匹配,得到知识匹配结果;
步骤S218,基于知识匹配结果构建规则引擎。
上述目标类型文件可以是与上述目标商品相关的国家标准文件、相关社会公告等文件,该目标类型文件包括对该目标商品的多个约束,即可以用于审核该目标商品是否合规的多个审核规则。对该目标商品关联的该目标类型文件进行解析,可以得到上述审核规则。
将上述对该目标商品关联的该目标类型文件进行解析得到的审核规则导入知识图谱,并将该审核规则转化为是规则文件。通过上述实体链接,可以将该规则文件与知识图谱进行知识匹配,进而得到知识匹配结果。基于该知识匹配结果,可以构建上述规则引擎。
可选地,在对待审核的商品标签进行结构化处理,并完成商品分类之后,商品的合规审核通过规则引擎来实现。与将审核逻辑代码固化在服务接口中相比,使用规则引擎进行合规审核具有更高的灵活性和扩展性。规则引擎通过配置规则文件来实现审核逻辑,这种方式可以实现逻辑数据化,从而节省人工成本。同时,规则引擎还可以通过统一的规则接口调整规则库来适配新的服务需求。
图7是根据本发明实施例的一种可选的利用规则引擎进行食品标签审核的过程的示意图,如图7所示,对部分食品安全的相关数据进行解析,可以生成用于食品标签审核的审核规则,其中,部分食品安全的相关数据可以是食品伙伴网中的数据、食品安全国家标准文件和部分实际数据;解析过程可以是人工解析;生成的审核规则可以包括编辑规则、测试规则和删除规则。
具体地,上述审核规则包括:实体部分和逻辑部分。如下表1所示,通过解析食品安全国家标准文件可以产生规则:实体“滑石粉”只能在“凉果类(食品分类号为04.01.02.08.02)”和“话化类(食品分类号为04.01.02.08.04)”食品中使用,且使用量不超过20.0g/kg。)
表1
具体地,上述规则生产的过程包括:从食品安全国家标准文件和相关公告中自动解析审核规则;将自动解析的该审核规则交由专业技术人员根据人工经验增加审核规则。将经过规则生产得到的审核规则加入食品安全知识图谱中,同时将该审核规则转化为Drools格式的规则文件,用于在Drools规则引擎中进行规则推理。
需要说明的是,上述Drools规则引擎基于面向对象系统的RETE(ReteOO)算法进行了增强和优化,该Drools规则引擎用于将实体与规则进行匹配,以推断相应的结果。
仍然如图7所示,对上述规则生产得到的上述审核规则进行规则配置,得到对应的规则库和规则引擎,其中,规则库中包括多个上述审核规则;规则引擎中包括接口管理、规则管理、规则匹配和规则查询功能。
具体地,上述规则匹配功能包括:将上述实体链接得到的待审核食品的知识实体、食品国标类别与上述审核规则的知识部分进行匹配,即知识匹配;根据该知识匹配的结果,在上述规则库中进行检索,得到对应的审核规则集合。
仍然如图7所示,根据上述经知识匹配的知识实体、食品国标类别和上述审核规则集合,使用Drools规则引擎分析得到该待审核食品标签的审核结果和错误提示。该审核结果和错误提示可以反馈给食品合规服务模块,用于上述食品安全知识图谱的更新。
在一种可选的实施例中,在步骤S242中,对目标文本进行结构化处理,得到商品标签信息,包括如下方法步骤:
步骤S2421,对目标文本进行结构化处理,得到商品配料树。
上述结构化处理可以是通过模板和规则匹配算法的过程,可以得到目标商品的商品标签信息中的配料信息,进而得到商品配料树。该商品配料树是由该目标商品的商品配料信息组成的树,其中,树是一种数据结构,是由有限个节点组成的一个有层次关系的集合,有限个节点中每个节点有零个或多个子节点,没有父节点的节点称为根节点,每一个非根节点有且只有一个父节点,除了根节点外每个子节点可以分为多个不想交的子树。
仍然以对食品标签进行审核为例,对由该待审核的食品标签图像得到的食品文本信息进行结构化处理,该结构化处理还包括:识别该待审核的食品标签的配料表中包含的带入逻辑,如果该食品包含带入成分,则对该食品的食品标签的审核应当遵循带入原则。通过上述结构化处理,可以得到该待审核食品标签对应的食品配料树。特别地,该食品配料树可用于递归计算。
在一种可选的实施例中,在步骤S261中,通过实体链接,将商品标签信息链接至待审核知识实体,包括如下方法步骤:
步骤S2611,通过实体链接,将商品配料树的节点链接至待审核配料成分实体。
通过上述实体链接方法,可以将上述商配料树的节点链接到对应的待审核配料成分实体。
仍然以对食品标签进行审核为例,通过上述实体链接,可以将待审核的食品标签对应的食品标签信息链接至食品安全知识图谱中对应的待审核的配料成分实体。该待审核的配料成分实体是指由该待审核的食品标签信息得到的配料成分数据。
在一种可选的实施例中,在步骤S210中,利用规则引擎对待审核知识实体进行审核,得到审核结果,包括如下方法步骤:
步骤S2101,从商品配料树的根节点开始,利用规则引擎对商品配料树的节点对应的待审核配料成分实体进行递归审核,得到审核结果。
从上述商品配料树的根节点开始,对该商品配料树的所有节点进行遍历审核,其中,对每个节点的审核包括:利用上述规则引擎对商品配料树的该节点对应的待审核配料成分实体进行递归审核。该递归审核可以是审核程序调用自身实现部分审核过程的多次重复审核,可以减少程序的代码量。通过上述对商品配料树的每个节点对应的待审核配料成分实体进行递归审核,可以得到对应的审核结果,该审核结果可以包括:该目标商品的商品标签中是否存在错别字、文字描述是否合规、商品组成成分是否合规等。
仍然以对食品标签进行审核为例,上述食品配料树包含多个节点,其中,每个节点对应一种该待审核食品标签中的配料成分,该配料成分对应食品安全知识图谱中的一个配料成分实体。从该食品配料树的根节点开始,对该食品配料树的每次节点进行遍历审核,其中,对每个节点的审核包括:利用Drools规则引擎对该节点在食品安全知识图谱中对应的待审核配料成分实体进行递归审核,得到该待审核配料成分的审核结果。
在一种可选的实施例中,在步骤S242中,对目标文本进行结构化处理,得到商品标签信息,包括如下方法步骤:
步骤S2422,对目标文本进行结构化处理,得到商品营养成分表。
上述结构化处理可以是通过模板和规则匹配算法的过程,可以得到目标商品的商品标签信息中的营养成分信息,进而得到商品营养成分表。该商品营养成分表可以是指标有商品营养成分名称、含量和占营养素参考值(Nutrient Reference Values,简称NRV)的百分比的规范性表格。其中,NRV是商品营养标签上比较营养成分含量多少的参考标准,是消费者选择商品时的一种营养参照尺度。
仍然以对食品标签进行审核为例,对由该待审核的食品标签图像得到的食品文本信息进行结构化处理,该结构化处理还包括:识别该待审核的食品标签中的表格结构,获取该表格内容。通过上述结构化处理,可以得到该待审核食品标签对应的食品营养成分表。
在一种可选的实施例中,在步骤S261中,通过实体链接,将商品标签信息链接至待审核知识实体,包括如下方法步骤:
步骤S2612,通过实体链接,将商品营养成分表链接至待审核营养成分实体。
通过上述实体链接方法,可以将上述商配料树的节点链接到对应的待审核配料成分实体。
仍然以对食品标签进行审核为例,通过上述实体链接,可以将待审核的食品标签对应的食品营养成分表链接至食品安全知识图谱中对应的待审核的营养成分实体。该待审核的营养成分实体是指由该待审核的食品标签信息得到的营养成分数据。
在一种可选的实施例中,在步骤S210中,利用规则引擎对待审核知识实体进行审核,得到审核结果,包括如下方法步骤:
步骤S2102,利用规则引擎对待审核营养成分实体进行审核,得到审核结果,其中,规则引擎包括:多元审核要素,多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
上述多元审核要素可以包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。其中,计算含量值为计算目标成分在该目标商品中的含量占比;修约间隔又称修约区间或化整间隔,是确定修约保留位数的一种方式,修约间隔一经确定,修约值记为该修约间隔的整数倍。利用包含该多元审核要素的规则引擎对待审核营养成分实体进行审核,可以得到上述审核结果。
仍然以对食品标签进行审核为例,对待审核食品标签进行审核的Drools规则引擎可以包括文本描述审核,其中,文本描述审核包括广告法审核和声称审核。广告法审核的步骤如下:识别该待审核的食品标签信息的文本描述中的极限词(如“国内第一”);将该极限词与《中华人民共和国广告法》的解析结果进行匹配;判断该待审核食品标签中的文本描述是否违反《中华人民共和国广告法》。声称审核的步骤如下:识别该待审核的食品标签信息的文本描述中的特定声称(如“富含多种维生素”);将该特定声称与该待审核的食品标签信息中的营养成分表和配料表进行比对;判断该待审核食品标签中的特定声称是否属实。
仍然以对食品标签进行审核为例,对待审核食品标签进行审核的Drools规则引擎可以包括配料表审核。图8是根据本发明实施例的一种可选的配料表审核过程的示意图,如图8所示,根据待审核的食品标签信息中的食品名称和由配料表中得到的带入组分,可以进行国标对齐操作,得到对应的国标类别;根据该待审核的食品标签信息中的添加剂,可以实体链接至食品安全知识图谱中的知识实体,并将由食品安全国家标准文件解析得到的审核规则作为判定逻辑,判断该添加剂在上述目标食品类别中的使用是否合规。
具体地,图9是根据本发明实施例的一种可选的食品配料表审核过程的示意图,如图9所示,对该待审核的食品标签中的配料表进行审核包括:预处理、国标对齐和规则引擎推理。其中,预处理包括:根据输入的待审核食品信息,解析得到该待审核食品的配料树。国标对齐包括:食品国标类别对齐和添加剂标对齐,即通过食品分类模型得到配料树中每个非叶子节点的食品国标类别。规则引擎推理包括:通过实体链接将配料树的节点转换为食品安全知识图谱中的知识实体;从配料树的根节点开始递归审核配料树中的每个配料成分,从而判断该待审核的食品是合规商品还是风险商品。
仍然如图9所示,对待审核的食品标签进行预处理后,如果成功解析得到了该待审核的食品标签中的配料表,则进入国标对齐;否则,将该待审核的食品标签交由专业技术人员进行人工审核。
仍然如图9所示,判断待审核食品标签合规的条件为:配料树对应的所有配料知识实体均在由食品安全国家标准文件解析得到的白名单中,或者不全在上述白名单中但全部符合对应的食品大类配料使用标准,或者上述配料知识实体不全符合对应的食品大类配料使用标准但配料遍历全部大类合规,或者上述配料知识实体不全符合对应的食品大类配料使用标准、配料遍历不全大类合规但存在带入组分且包含带入组分的配料遍历全部合规。否则,判断该待审核食品标签不合规,该待审核食品为风险食品。
仍然以对食品标签进行审核为例,对待审核食品标签进行审核的Drools规则引擎可以包括多元审核要素,其中,多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
图10是根据本发明实施例的一种可选的食品标签审核过程的示意图,如图10所示,根据上述多元审核要素进行审核包括如下方法步骤:获取待审核的食品标签图像,利用OCR识别方法得到该待审核的食品标签中包含的营养成分表、文本描述和配料表;对上述营养成分表、文本描述和配料表进行预处理,其中,预处理包括元素归一、错别字识别和对配料表的单位转换;对上述预处理结果进行逐项审核,其中,逐项审核包括:修约间隔判定、NVR计算、计算含量值并进行含量声称审核;对上述逐项审核的结果进行整体审核,其中,整体审核包括:核心营养素缺失审核、元素排列顺序审核。
仍然如图10所示,上述预处理和逐项审核得到的结果可以包括:是否存在错别字、是否存在单位错误、是否存在含量错误、是否存在修约错误、是否存在NVR错误、是否存在声称不符。同时,上述预处理和逐项审核还可以得到各审核项对应的参考值和声称建议。上述整体审核得到的结果可以包括:是否存在核心营养素缺失、是否存在元素排雷顺序错误。
本发明其中一实施例还提供了一种商品标签信息的处理方法,该商品标签信息的处理方法在云端服务器上运行,图11是根据本发明实施例的一种可选的商品标签信息的处理方法的流程图,如图11所示,该商品标签信息的处理方法,包括:
步骤S1102,接收来自于客户端的待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;
步骤S1104,对待处理图像进行解析以得到商品标签信息,利用知识图谱将商品标签信息转化为待审核知识实体,对商品标签信息进行分类以得到目标商品类别,以及基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果;
步骤S1106,将审核结果反馈至客户端。
可选地,图12是根据本发明实施例的一种在云端服务器进行商品标签信息的处理的示意图,如图12所示,客户端将待处理图像上传至云端服务器,中,待处理图像的显示内容包括:目标商品的商品标签信息;云端服务器对待处理图像进行解析以得到商品标签信息,利用知识图谱将商品标签信息转化为待审核知识实体,对商品标签信息进行分类以得到目标商品类别,以及基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。然后,云端服务器会向上述客户端反馈处理结果,最终的处理结果会通过客户端的图形用户界面展现给用户。
需要说明的是,本发明实施例所提供的上述商品标签信息的处理方法,可以但不限于适用于食品安全监管等实际应用场景,通过SaaS服务端和客户端进行交互的方式,采用智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑的方式,自动得到商品标签审核结果,并将返回的商品标签审核结果通过客户端提供给用户。
在上述运行环境下,本发明提供了如图13所示的一种商品标签信息的处理方法。图13是根据本发明实施例的一种可选的商品标签信息的处理方法的流程图,如图13所示,通过电子装置提供一图形用户界面,图形用户界面所显示的内容至少部分地包含一商品标签信息审核场景,图形用户界面包括:商品类别选择子界面、知识图谱选择子界面和审核结果显示子界面,该商品标签信息的处理方法包括:
步骤S1302,响应对商品类别选择子界面执行的第一触控操作,获取目标商品的商品标签信息,并对商品标签信息进行分类,得到目标商品类别;
步骤S1304,响应对知识图谱选择子界面执行的第二触控操作,确定待使用的知识图谱,并利用知识图谱将商品标签信息转化为待审核知识实体;
步骤S1306,响应对审核结果显示子界面执行的第三触控操作,基于目标商品类别对应的规则引擎对待审核知识实体进行审核,显示商品标签信息的审核结果。
在上述可选的实施例中,用户可以通过电子装置展示的图形用户界面内容,至少部分地获得上述商品标签信息审核场景。该图形用户界面可以显示上述商品类别选择子界面、上述知识图谱选择子界面和上述审核结果显示子界面。
可选地,在上述图形用户界面中,用户可以对图形用户界面内展示的商品类别选择子界面进行第一触控操作,即用户通过触控该图形用户界面中展示的多个商品类别中的部分商品类别,以确定目标商品,获取目标商品的商品标签信息,并对商品标签信息进行分类,进而得到目标商品类别。
可选地,在上述图形用户界面中,用户还可以对用户界面内展示的知识图谱选择子界面进行第二触控操作,即用户通过触控该图形用户界面中展示的多个知识图谱中的部分知识图谱,以确定待使用的知识图谱,并利用该待使用的知识图谱将上述商品标签信息转化为待审核知识实体。
可选地,在上述图形用户界面中,用户还可以对用户界面内展示的审核结果显示子界面进行第三触控操作,即用户可以通过触控该图形用户界面中的审核按钮,以确定上述目标商品类别对应的待使用的规则引擎,并基于该规则引擎对上述待审核知识实体进行审核,进而将得到的商品标签信息的审核结果显示在上述图形用户界面上。
特别地,上述触控操作是指用户用手指接触上述终端设备的显示屏并控制该终端设备的操作,该触控操作可以包括单点触控、多点触控,其中,每个触控点的触控操作可以包括点击、长按、重按、划动等。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述商品标签信息的处理方法的装置实施例,图14是根据本发明实施例的一种商品标签信息的处理装置的结构示意图,如图14所示,该装置包括:获取模块141、解析模块142、转化模块143、分类模块144、审核模块145,其中,
获取模块141,用于获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;解析模块142,用于对待处理图像进行解析,得到商品标签信息;转化模块143,用于利用知识图谱将商品标签信息转化为待审核知识实体;分类模块144,用于对商品标签信息进行分类,得到目标商品类别;审核模块145,用于基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
可选地,解析模块142,还用于:对待处理图像进行字符识别,得到目标文本;对目标文本进行结构化处理,得到商品标签信息。
可选地,转化模块143,还用于:通过实体链接,将商品标签信息链接至知识图谱中对应的待审核知识实体。
可选地,分类模块144,还用于:利用商品分类模型对商品标签信息进行分析,确定目标商品类别,其中,商品分类模型使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:样本商品的名称信息和样本商品的配料信息,目标商品类别包括:商品国标类别。。
可选地,图15是根据本发明实施例的一种可选的商品标签信息的处理装置的结构示意图,如图15所示,该装置除包括图14所示的所有模块外,还包括:
处理模块146,用于对目标商品关联的目标类型文件进行解析,得到审核规则;,将审核规则导入知识图谱,并转化为规则文件;通过实体链接将规则文件与知识图谱进行知识匹配,得到知识匹配结果;基于知识匹配结果构建规则引擎。
可选地,解析模块142,还用于:对目标文本进行结构化处理,得到商品配料树。
可选地,转化模块143,还用于:通过实体链接,将商品配料树的节点链接至待审核配料成分实体。
可选地,审核模块145,还用于:从商品配料树的根节点开始,利用规则引擎对商品配料树的节点对应的待审核配料成分实体进行递归审核,得到审核结果。
可选地,解析模块142,还用于:对目标文本进行结构化处理,得到商品营养成分表。
可选地,转化模块143,还用于:通过实体链接,将商品营养成分表链接至待审核营养成分实体。
可选地,审核模块145,还用于:利用规则引擎对待审核营养成分实体进行审核,得到审核结果,其中,规则引擎包括:多元审核要素,多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
此处需要说明的是,上述获取模块141、解析模块142、转化模块143、分类模块144、审核模块145对应于实施例1中的步骤S202至步骤S210,五个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例一所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例一提供的计算机终端10中。
在本发明实施例中,获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;采用对待处理图像进行解析的方法,得到商品标签信息;并利用知识图谱将商品标签信息转化为待审核知识实体;通过对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
容易注意到的是,通过本发明实施例,从知识图谱的角度出发,探索基于知识图谱的自动化标签审核方案。对于给定的商品,通过智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑,从而自动得到商品标签审核结果。
由此,本发明实施例达到了对海量商品标签进行精准分类、自动审核的目的,从而实现了为商品标签审核人员打破知识壁垒、提升商品标签审核效率、降低商品标签审核成本的技术效果,进而解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例3
根据本发明实施例,还提供了一种电子装置的实施例,该电子装置可以是计算装置群中的任意一个计算装置。该电子装置包括:处理器和存储器,其中:存储器,与上述处理器连接,用于为上述处理器提供处理以下处理步骤的指令:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
在本发明实施例中,获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;采用对待处理图像进行解析的方法,得到商品标签信息;并利用知识图谱将商品标签信息转化为待审核知识实体;通过对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
容易注意到的是,通过本发明实施例,从知识图谱的角度出发,探索基于知识图谱的自动化标签审核方案。对于给定的商品,通过智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑,从而自动得到商品标签审核结果。
由此,本发明实施例达到了对海量商品标签进行精准分类、自动审核的目的,从而实现了为商品标签审核人员打破知识壁垒、提升商品标签审核效率、降低商品标签审核成本的技术效果,进而解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
需要说明的是,本实施例的优选实施方式可以参见实施例1中的相关描述,此处不再赘述。
实施例4
本发明的实施例可以提供一种计算机终端,该计算机终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述计算机终端也可以替换为移动终端等终端设备。
可选地,在本实施例中,上述计算机终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
在本实施例中,上述计算机终端可以执行应用程序的漏洞检测方法中以下步骤的程序代码:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
可选地,图16是根据本发明实施例的另一种计算机终端的结构框图,如图16所示,该计算机终端可以包括:一个或多个(图中仅示出一个)处理器122、存储器124、以及外设接口126。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的安全漏洞检测方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的系统漏洞攻击的检测方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
可选地,上述处理器还可以执行如下步骤的程序代码:对待处理图像进行字符识别,得到目标文本;对目标文本进行结构化处理,得到商品标签信息。
可选地,上述处理器还可以执行如下步骤的程序代码:通过实体链接,将商品标签信息链接至知识图谱中对应的待审核知识实体。
可选地,上述处理器还可以执行如下步骤的程序代码:利用商品分类模型对商品标签信息进行分析,确定目标商品类别,其中,商品分类模型使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:样本商品的名称信息和样本商品的配料信息,目标商品类别包括:商品国标类别。。
可选地,上述处理器还可以执行如下步骤的程序代码:对目标商品关联的目标类型文件进行解析,得到审核规则;将审核规则导入知识图谱,并转化为规则文件;通过实体链接将规则文件与知识图谱进行知识匹配,得到知识匹配结果;基于知识匹配结果构建规则引擎。
可选地,上述处理器还可以执行如下步骤的程序代码:对目标文本进行结构化处理,得到商品配料树。
可选地,上述处理器还可以执行如下步骤的程序代码:通过实体链接,将商品配料树的节点链接至待审核配料成分实体。
可选地,上述处理器还可以执行如下步骤的程序代码:从商品配料树的根节点开始,利用规则引擎对商品配料树的节点对应的待审核配料成分实体进行递归审核,得到审核结果。
可选地,上述处理器还可以执行如下步骤的程序代码:对目标文本进行结构化处理,得到商品营养成分表。
可选地,上述处理器还可以执行如下步骤的程序代码:通过实体链接,将商品营养成分表链接至待审核营养成分实体。
可选地,上述处理器还可以执行如下步骤的程序代码:利用规则引擎对待审核营养成分实体进行审核,得到审核结果,其中,规则引擎包括:多元审核要素,多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:接收来自于客户端的待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析以得到商品标签信息,利用知识图谱将商品标签信息转化为待审核知识实体,对商品标签信息进行分类以得到目标商品类别,以及基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果;将审核结果反馈至客户端。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:响应对商品类别选择子界面执行的第一触控操作,获取目标商品的商品标签信息,并对商品标签信息进行分类,得到目标商品类别;响应对知识图谱选择子界面执行的第二触控操作,确定待使用的知识图谱,并利用知识图谱将商品标签信息转化为待审核知识实体;响应对审核结果显示子界面执行的第三触控操作,基于目标商品类别对应的规则引擎对待审核知识实体进行审核,显示商品标签信息的审核结果。
在本发明实施例中,获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;采用对待处理图像进行解析的方法,得到商品标签信息;并利用知识图谱将商品标签信息转化为待审核知识实体;通过对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
容易注意到的是,通过本发明实施例,从知识图谱的角度出发,探索基于知识图谱的自动化标签审核方案。对于给定的商品,通过智能识别算法判断目标商品类别和商品包含的审核实体,并通规则引擎整合海量的标签审核逻辑,从而自动得到商品标签审核结果。
由此,本发明实施例达到了对海量商品标签进行精准分类、自动审核的目的,从而实现了为商品标签审核人员打破知识壁垒、提升商品标签审核效率、降低商品标签审核成本的技术效果,进而解决了现有技术中由于商品标签审核依赖专业技术人员且审核流程复杂,导致商品标签审核成本高、效率低、灵活性和通用性差的技术问题。
本领域普通技术人员可以理解,图16所示的结构仅为示意,计算机终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(MobileInternet Devices,MID)、PAD等终端设备。图16其并不对上述电子装置的结构造成限定。例如,计算机终端还可包括比图16中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图16所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
根据本发明实施例,还提供了一种存储介质的实施例。可选地,在本实施例中,上述存储介质可以用于保存上述实施例1所提供的商品标签信息的处理方法所执行的程序代码。
可选地,在本实施例中,上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:获取待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析,得到商品标签信息;利用知识图谱将商品标签信息转化为待审核知识实体;对商品标签信息进行分类,得到目标商品类别;基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对待处理图像进行字符识别,得到目标文本;对目标文本进行结构化处理,得到商品标签信息。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过实体链接,将商品标签信息链接至知识图谱中对应的待审核知识实体。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:利用商品分类模型对商品标签信息进行分析,确定目标商品类别,其中,商品分类模型使用多组数据通过机器学习训练得到,多组数据中的每组数据均包括:样本商品的名称信息和样本商品的配料信息,目标商品类别包括:商品国标类别。。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对目标商品关联的目标类型文件进行解析,得到审核规则;将审核规则导入知识图谱,并转化为规则文件;通过实体链接将规则文件与知识图谱进行知识匹配,得到知识匹配结果;基于知识匹配结果构建规则引擎。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对目标文本进行结构化处理,得到商品配料树。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过实体链接,将商品配料树的节点链接至待审核配料成分实体。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:从商品配料树的根节点开始,利用规则引擎对商品配料树的节点对应的待审核配料成分实体进行递归审核,得到审核结果。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:对目标文本进行结构化处理,得到商品营养成分表。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:通过实体链接,将商品营养成分表链接至待审核营养成分实体。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:利用规则引擎对待审核营养成分实体进行审核,得到审核结果,其中,规则引擎包括:多元审核要素,多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:接收来自于客户端的待处理图像,其中,待处理图像的显示内容包括:目标商品的商品标签信息;对待处理图像进行解析以得到商品标签信息,利用知识图谱将商品标签信息转化为待审核知识实体,对商品标签信息进行分类以得到目标商品类别,以及基于目标商品类别对应的规则引擎对待审核知识实体进行审核,得到商品标签信息的审核结果;将审核结果反馈至客户端。
可选地,在本实施例中,存储介质被设置为存储用于执行以下步骤的程序代码:响应对商品类别选择子界面执行的第一触控操作,获取目标商品的商品标签信息,并对商品标签信息进行分类,得到目标商品类别;响应对知识图谱选择子界面执行的第二触控操作,确定待使用的知识图谱,并利用知识图谱将商品标签信息转化为待审核知识实体;响应对审核结果显示子界面执行的第三触控操作,基于目标商品类别对应的规则引擎对待审核知识实体进行审核,显示商品标签信息的审核结果。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本发明所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (17)
1.一种商品标签信息的处理方法,其特征在于,包括:
获取待处理图像,其中,所述待处理图像的显示内容包括:目标商品的商品标签信息;
对所述待处理图像进行解析,得到所述商品标签信息;
利用知识图谱将所述商品标签信息转化为待审核知识实体;
对所述商品标签信息进行分类,得到目标商品类别;
基于所述目标商品类别对应的规则引擎对所述待审核知识实体进行审核,得到所述商品标签信息的审核结果。
2.根据权利要求1所述的商品标签信息的处理方法,其特征在于,对所述待处理图像进行解析,得到所述商品标签信息包括:
对所述待处理图像进行字符识别,得到目标文本;
对所述目标文本进行结构化处理,得到所述商品标签信息。
3.根据权利要求1所述的商品标签信息的处理方法,其特征在于,利用知识图谱将所述商品标签信息转化为待审核知识实体包括:
通过实体链接,将所述商品标签信息链接至所述知识图谱中对应的所述待审核知识实体。
4.根据权利要求1所述的商品标签信息的处理方法,其特征在于,对所述商品标签信息进行分类,得到所述目标商品类别包括:
利用商品分类模型对所述商品标签信息进行分析,确定所述目标商品类别,其中,所述商品分类模型使用多组数据通过机器学习训练得到,所述多组数据中的每组数据均包括:样本商品的名称信息和样本商品的配料信息,所述目标商品类别包括:商品国标类别。
5.根据权利要求1所述的商品标签信息的处理方法,其特征在于,所述商品标签信息的处理方法还包括:
对所述目标商品关联的目标类型文件进行解析,得到审核规则;
将所述审核规则导入所述知识图谱,并转化为规则文件;
通过实体链接将所述规则文件与所述知识图谱进行知识匹配,得到知识匹配结果;
基于所述知识匹配结果构建所述规则引擎。
6.根据权利要求3所述的商品标签信息的处理方法,其特征在于,对所述目标文本进行结构化处理,得到所述商品标签信息包括:
对所述目标文本进行结构化处理,得到商品配料树。
7.根据权利要求6所述的商品标签信息的处理方法,其特征在于,通过所述实体链接,将所述商品标签信息链接至所述待审核知识实体包括:
通过所述实体链接,将所述商品配料树的节点链接至待审核配料成分实体。
8.根据权利要求7所述的商品标签信息的处理方法,其特征在于,利用所述规则引擎对所述待审核知识实体进行审核,得到所述审核结果包括:
从所述商品配料树的根节点开始,利用所述规则引擎对所述商品配料树的节点对应的待审核配料成分实体进行递归审核,得到所述审核结果。
9.根据权利要求3所述的商品标签信息的处理方法,其特征在于,对所述目标文本进行结构化处理,得到所述商品标签信息包括:
对所述目标文本进行结构化处理,得到商品营养成分表。
10.根据权利要求9所述的商品标签信息的处理方法,其特征在于,通过所述实体链接,将所述商品标签信息链接至所述待审核知识实体包括:
通过所述实体链接,将所述商品营养成分表链接至待审核营养成分实体。
11.根据权利要求10所述的商品标签信息的处理方法,其特征在于,利用所述规则引擎对所述待审核知识实体进行审核,得到所述审核结果包括:
利用所述规则引擎对所述待审核营养成分实体进行审核,得到所述审核结果,其中,所述规则引擎包括:多元审核要素,所述多元审核要素包括:计算含量值审核要素、修约间隔审核要素、营养素参考值要素。
12.一种商品标签信息的处理方法,其特征在于,包括:
接收来自于客户端的待处理图像,其中,所述待处理图像的显示内容包括:目标商品的商品标签信息;
对所述待处理图像进行解析以得到所述商品标签信息,利用知识图谱将所述商品标签信息转化为待审核知识实体,对所述商品标签信息进行分类以得到目标商品类别,以及基于所述目标商品类别对应的规则引擎对所述待审核知识实体进行审核,得到所述商品标签信息的审核结果;
将所述审核结果反馈至所述客户端。
13.一种商品标签信息的处理方法,其特征在于,通过电子装置提供一图形用户界面,所述图形用户界面所显示的内容至少部分地包含一商品标签信息审核场景,所述图形用户界面包括:商品类别选择子界面、知识图谱选择子界面和审核结果显示子界面,所述方法包括:
响应对所述商品类别选择子界面执行的第一触控操作,获取目标商品的商品标签信息,并对所述商品标签信息进行分类,得到目标商品类别;
响应对所述知识图谱选择子界面执行的第二触控操作,确定待使用的知识图谱,并利用所述知识图谱将所述商品标签信息转化为待审核知识实体;
响应对所述审核结果显示子界面执行的第三触控操作,基于所述目标商品类别对应的规则引擎对所述待审核知识实体进行审核,显示所述商品标签信息的审核结果。
14.一种商品标签信息的处理装置,其特征在于,包括:
获取模块,用于获取待处理图像,其中,所述待处理图像的显示内容包括:目标商品的商品标签信息;
解析模块,用于对所述待处理图像进行解析,得到所述商品标签信息;
转化模块,用于利用知识图谱将所述商品标签信息转化为待审核知识实体;
分类模块,用于对所述商品标签信息进行分类,得到目标商品类别;
审核模块,用于基于所述目标商品类别对应的规则引擎对所述待审核知识实体进行审核,得到所述商品标签信息的审核结果。
15.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至13中任意一项所述的商品标签信息的处理方法。
16.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至13中任意一项所述的商品标签信息的处理方法。
17.一种商品标签信息的处理系统,其特征在于,包括:
处理器;以及
存储器,与所述处理器连接,用于为所述处理器提供处理以下处理步骤的指令:
步骤1,获取待处理图像,其中,所述待处理图像的显示内容包括:目标商品的商品标签信息;
步骤2,对所述待处理图像进行解析,得到所述商品标签信息;
步骤3,利用知识图谱将所述商品标签信息转化为待审核知识实体;
步骤4,对所述商品标签信息进行分类,得到目标商品类别;
步骤5,基于所述目标商品类别对应的规则引擎对所述待审核知识实体进行审核,得到所述商品标签信息的审核结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111495803.5A CN114357178A (zh) | 2021-12-08 | 2021-12-08 | 商品标签信息的处理方法、装置、存储介质及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111495803.5A CN114357178A (zh) | 2021-12-08 | 2021-12-08 | 商品标签信息的处理方法、装置、存储介质及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114357178A true CN114357178A (zh) | 2022-04-15 |
Family
ID=81097232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111495803.5A Pending CN114357178A (zh) | 2021-12-08 | 2021-12-08 | 商品标签信息的处理方法、装置、存储介质及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114357178A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375195A (zh) * | 2022-10-24 | 2022-11-22 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心、浙江省物品编码中心) | 针对食品添加剂的预警方法、装置、电子设备及存储介质 |
-
2021
- 2021-12-08 CN CN202111495803.5A patent/CN114357178A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115375195A (zh) * | 2022-10-24 | 2022-11-22 | 浙江省标准化研究院(金砖国家标准化(浙江)研究中心、浙江省物品编码中心) | 针对食品添加剂的预警方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107833082B (zh) | 一种商品图片的推荐方法和装置 | |
US20180053234A1 (en) | Description information generation and presentation systems, methods, and devices | |
CN103718212A (zh) | 颜色确定装置、颜色确定系统、颜色确定方法、信息记录介质和程序 | |
CN108446931B (zh) | 一种服装企业管理系统和基于该系统的试穿反馈方法 | |
US20230214895A1 (en) | Methods and systems for product discovery in user generated content | |
KR102142126B1 (ko) | 계층적 카테고리 군집 기반 장바구니 상품 추천 방법 | |
US20200226168A1 (en) | Methods and systems for optimizing display of user content | |
CN108319888B (zh) | 视频类型的识别方法及装置、计算机终端 | |
CN110858353A (zh) | 获取案件裁判结果的方法和系统 | |
US20230030560A1 (en) | Methods and systems for tagged image generation | |
CN112069315A (zh) | 提取文本多维度信息方法、装置、服务器及存储介质 | |
CN114357178A (zh) | 商品标签信息的处理方法、装置、存储介质及系统 | |
CN109829033B (zh) | 数据展示方法和终端设备 | |
Lo et al. | An emperical study on application of big data analytics to automate service desk business process | |
US20230015090A1 (en) | Systems and Methods for Dynamically Classifying Products and Assessing Applicability of Product Regulations | |
KR102404247B1 (ko) | 고객 관리 시스템 | |
CN111125351B (zh) | 商情简报生成方法及装置、电子设备及存储介质 | |
CN116127184A (zh) | 产品的推荐方法及装置、非易失性存储介质、电子设备 | |
CN114996579A (zh) | 信息推送方法、装置、电子设备和计算机可读介质 | |
CN113837836A (zh) | 模型推荐方法、装置、设备及存储介质 | |
KR20220118703A (ko) | 머신러닝 기반 온라인 쇼핑 리뷰 감정 예측 시스템 및 방법 | |
CN111192112A (zh) | 一种多平台的交互方法和装置 | |
CN112257439A (zh) | 一种通过舆情数据挖掘热度词根的方法和装置 | |
CN112906367A (zh) | 消费者文本的信息提取结构,标注方法和识别方法 | |
US20200226167A1 (en) | Methods and systems for dynamic content provisioning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40071598 Country of ref document: HK |