CN115293861A - 一种商品识别方法、装置、电子设备及存储介质 - Google Patents
一种商品识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115293861A CN115293861A CN202211226918.9A CN202211226918A CN115293861A CN 115293861 A CN115293861 A CN 115293861A CN 202211226918 A CN202211226918 A CN 202211226918A CN 115293861 A CN115293861 A CN 115293861A
- Authority
- CN
- China
- Prior art keywords
- target
- commodity
- probability
- node
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000007689 inspection Methods 0.000 claims description 40
- 238000005070 sampling Methods 0.000 claims description 32
- 230000007704 transition Effects 0.000 claims description 27
- 238000013016 damping Methods 0.000 claims description 24
- 230000002159 abnormal effect Effects 0.000 claims description 23
- 230000015654 memory Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 17
- 230000000007 visual effect Effects 0.000 claims description 14
- 238000012546 transfer Methods 0.000 claims description 13
- 238000005295 random walk Methods 0.000 claims description 10
- 238000007499 fusion processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000009792 diffusion process Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
- G06Q30/0643—Graphical representation of items or shoppers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
Abstract
本申请涉及计算机技术领域,提供了一种商品识别方法、装置、电子设备及存储介质,包括通过基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图,以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率,针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率,基于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据,根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果。基于本申请实施例可以降低抽检的成本,而且可以提高抽检的效率。
Description
技术领域
本发明涉及计算机技术领域,尤其涉及一种商品识别方法、装置、电子设备及存储介质。
背景技术
在商品异常销售的历史案件中,存在部分商家销售异常商品,导致店铺被销售平台处罚或者冻结。如果类似案件批量出现,将会产生不可控的风险。不仅影响支付合规性,还影响基于商品结算信息提供的金融服务,产生大额逾期或者坏账。现有技术主要是通过敏感词的方式识别异常商品,但在售假场景中对抗频繁,敏感词变化很快,很多敏感词会隐藏在图片当中,导致单纯基于敏感词识别异常商品的准确性不高。此外,由于存在大量的形似商品,现有识别方法计算效率低,难以满足快速识别可疑商品的业务响应需求。并且,从商品到店铺、商家的综合管控能力较弱,往往只能识别局部的合规性问题,无法关联到全局进行根治。
发明内容
为了解决现有识别方法准确性低、识别效率低且无法关联全局进行管理问题,本申请提供了一种商品识别方法、装置、电子设备及存储介质:
根据本申请的第一方面,提供了一种商品识别方法,包括:
基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;目标有向图中的节点表征候选商品,目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;
以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率;剩余节点集合是目标有向图中除起点之外的多个节点;
针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率;随机抽检概率是目标有向图中节点总数量的倒数,转移抽检概率是自剩余节点随机游走至节点的转移概率的和值;
基于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;目标商品对应的节点的目标抽检概率大于预设概率阈值;
根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果;识别结果表征商品是否为合格商品。
根据本申请的第二方面,提供了一种商品识别装置,包括:
获取模块,用于基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;目标有向图中的节点表征候选商品,目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;
随机游走模块,用于以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率;剩余节点集合是目标有向图中除起点之外的多个节点;
第一确定模块,用于针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率;随机抽检概率是目标有向图中节点总数量的倒数,转移抽检概率是自剩余节点随机游走至节点的转移概率的和值;
第二确定模块,用于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;目标商品对应的节点的目标抽检概率大于预设概率阈值;
识别模块,用于根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果;识别结果表征商品是否为合格商品。
进一步地,商品识别装置还包括:
第一更新模块,用于在根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果之后,若目标商品为异常商品,从目标商品的关联业务数据中确定目标商品的关联店铺和关联商家;
对关联店铺的风险程度和关联商家的风险等级进行更新处理,得到更新处理结果。
进一步地,商品识别装置还包括:
第二更新模块,用于若目标商品为异常商品,将目标有向图中每个节点对应的候选商品确定为异常商品。
进一步地,第一确定模块,用于针对目标有向图中的每个节点,将节点的第一阻尼因子和随机抽检概率的乘积确定为节点的第一目标抽检子概率;第一阻尼因子表征抽检剩余节点对应的商品时,节点对应的商品不被抽检的概率;
将节点的第二阻尼因子和转移抽检概率的乘积确定为节点的第二目标抽检子概率;第二阻尼因子表征剩余节点对应的商品被抽检的概率,第一阻尼因子和第二阻尼因子的和值为1;
将第一目标抽检子概率和第二目标抽检子概率的和值确定为节点的目标抽检概率。
进一步地,识别模块,用于从关联业务数据中提取目标商品的交易次数特征、评论文本特征、品牌相似度特征和视觉特征;
对交易次数特征、评论文本特征、品牌相似度特征和视觉特征进行融合处理,基于融合处理的结果进行识别处理得到目标商品的识别结果。
进一步地,获取模块,用于从业务订单、物流订单、展示页面和评论信息中提取商品集合和每个商品的关联业务数据,构建待监控数据库;
当监测到待监控数据库出现名称聚类和/或商标变异时,将名称聚类和/或商标变异的商品确定候选商品集合;
基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图。
根据本申请的第三方面,提供了一种电子设备,电子设备包括处理器和存储器,存储器中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现本申请第一方面的商品识别方法。
根据本申请的第四方面,提供了一种计算机存储介质,存储介质中存储有至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现本申请第一方面的商品识别方法。
根据本申请的第五方面,提供了一种计算机程序产品,计算机程序产品包括至少一条指令或至少一段程序,至少一条指令或至少一段程序由处理器加载并执行以实现本申请第一方面的商品识别方法。
本申请实施例提供的一种商品识别方法、装置、电子设备及存储介质,具有如下技术效果:
通过基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;目标有向图中的节点表征候选商品,目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率;剩余节点集合是目标有向图中除起点之外的多个节点;针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率;随机抽检概率是目标有向图中节点总数量的倒数,转移抽检概率是自剩余节点随机游走至节点的转移概率的和值;基于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;目标商品对应的节点的目标抽检概率大于预设概率阈值;根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果;识别结果表征商品是否为合格商品。基于本申请实施例可以降低抽检的成本,而且可以提高抽检的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1是本申请实施例提供的一种应用环境的示意图;
图2是本申请实施例提供的一种商品识别方法的流程示意图;
图3是本申请实施例提供的一种商品识别的示意图;
图4是本申请实施例提供的一种商品识别装置的结构示意图;
图5是本申请实施例提供的一种用于实现本申请实施例所提供的商品识别方法的电子设备的硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施例作进一步地详细描述。显然,所描述的实施例仅仅是本申请一个实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
此处所称的“实施例”是指可包含于本申请至少一个实现方式中的特定特征、结构或特性。在本申请实施例的描述中,需要理解的是,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”和“第三”等的特征可以明示或者隐含的包括一个或者更多个该特征。而且,术语“第一”、“第二”和“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请实施例能够以除了在这里图示或描述以外的顺序实施。此外,术语“包括”、“具有”和“为”以及他们的任何变形,意图在于覆盖不排他的包含。
可以理解的是,在本申请的具体实施方式中,涉及到商品信息数据等相关的数据,当本申请以上实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
请参阅图1,图1是本申请实施例提供的一种应用环境的示意图,该应用环境中可以包括终端10和服务器20。终端10与服务器20可以通过有线或无线通信方式进行直接或间接地连接。
在一些可能的实施例中,终端10可以向服务器20发送商品信息数据。服务器可以提供商品识别服务,通过随机游走确定商品被抽检的概率,使得从相似商品中选取具有代表性的商家进行异常识别。
终端10可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。
服务器20可以是独立的物理服务器,也可以是多个物理服务器构成的服务集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)以及大数据和人工智能平台等基础云计算服务的云服务器。其中,服务器可以包括有网络通信单元、处理器和存储器等等。
在一些可能的实施方式中,终端10和服务器20均可以是区块链系统中的节点设备,能够将获取到以及生成的信息共享给区块链系统中的其他节点设备,实现多个节点设备之间的信息共享。区块链系统中的多个节点设备可以配置有同一条区块链,该区块链由多个区块组成,并且前后相邻的区块具有关联关系,使得任一区块中的数据被篡改时都能通过下一区块检测到,从而能够避免区块链中的数据被篡改,保证区块链中数据的安全性和可靠性。
下面介绍本申请一种商品识别方法的具体实施例,图2是本申请实施例提供的一种商品识别方法的流程示意图。本说明书提供了如实施例或流程图所示的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多执行顺序中的一种方式,不代表唯一的执行顺序,在实际执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
具体如图2所示,该商品识别方法可以包括:
S201:基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图。
本申请实施例中,目标有向图中的节点可以表征候选商品,目标有向图中的有向边可以表征所连接的两个候选商品的部分关联业务数据相同。可选地,目标有向图可以定义为G(V,E),其中,V可以表示节点,E可以表示有向边。例如,甲商品的商家与乙商品的商家相同,那么可以采用节点1来表征甲商品,采用节点2来表征乙商品,采用从甲指向乙的有向线段表征甲商品和乙商品具有相同的关联业务数据。
在一些可能的实施方式中,可以从业务订单、物流订单、展示页面和评论信息中提取商品集合和商品集合中每个商品的关联业务数据,构建待监控数据库。当监测到待监控数据库出现名称聚类和/或商标变异时,将名称聚类和/或商标变异的商品确定为候选商品集合,并基于候选商品集合和候选商品集合中每个候选商品的关联业务数据,构建目标有向图。其中,名称聚类可以是指基于语义相似性算法将超过一定数量的商品名称归类为一个类别,商标变异可以是指与主流品牌商品相似的商标。例如,通过改变主流品牌中任意一个字的得到的品牌。
在实际应用中,可以从商品异常销售的历史案件和新增案件即不同的数据源中获取商品信息。比如从交易订单、物流订单、店铺展示页面以及用户评论页面中提取商品的品牌信息、店铺信息、商家信息、价格信息、评论信息以及风险信息,并维护至商品知识库。其中,风险信息可以包括敏感词和历史违规记录信息。例如,可以利用文字识别算法(Opticalcharacter recognition,OCR)、图像识别算法、语音识别算法和语义识别算法从数据源中提取商品的品牌信息、店铺信息、商家信息、价格信息、评论信息以及风险信息,并维护至商品知识库。在商品知识库的基础上,根据业务监控触发的名称聚类、商标变异预警,可以进入商品层进行识别。
S203:以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率。
本申请实施例中,剩余节点集合可以是目标有向图中除起点之外的多个节点。
在一些可能的实施方式中,针对目标有向图中的任意一个节点,可以将该节点作为起点V0,假设t1时刻可以随机游走至节点Vt1,t2时刻可以随机游走至节点Vt2,则可以认为从起点V0随机游走至剩余节点Vt1的转移概率为1/d(Vt1),从起点V0随机游走至剩余节点Vt2的转移概率为1/d(Vt2)。其中,d(Vt1)可以表示节点Vt1的度,d(Vt2)可以表示节点Vt2的度。因此,从节点i随机游走至节点j的转移概率可以采用如下公式确定:
其中,d(i)可以表示节点i的度,(i,j)∈E可以表示节点i与节点j之间存在有向边。
下面举例说明从起点随机游走至剩余节点的转移概率。假设,节点1与节点2之间具有从节点1指向节点2的有向边,节点1与节点3之间具有从节点1指向节点3的有向边,节点3与节点4之间具有从节点3指向节点4的有向边,那么从节点1随机游走至节点2的转移概率为1/2,从节点1随机游走至节点3的转移概率为1/2,从节点1随机游走至节点4的转移概率为0。在商品识别层,可以通过抽检模型拉取所有候选商品的关联业务数据,对相似商品进行抽检,定性扩散,可以解决逐一识别相似商品计算成本高、效率低的问题。利用随机游走算法抽检商品,不仅可以降低抽检的成本,而且提高抽检的效率。
S205:针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率。
本申请实施例中,随机抽检概率可以是目标有向图中节点总数量的倒数,即对于一个目标有向图而言,每个节点的随机抽检概率相等,都是1/N,N可以表示目标有向图中节点总数量。转移抽检概率可以是自剩余节点随机游走至节点的转移概率的和值。
在一些可能的实施方式中,针对目标有向图中的每个节点,可以将节点的第一阻尼因子和随机抽检概率的乘积确定为节点的第一目标抽检子概率,并可以将节点的第二阻尼因子和转移抽检概率的乘积确定为节点的第二目标抽检子概率。其中,第一阻尼因子可以表征抽检剩余节点对应的商品是,节点对应的商品不被抽检的概率,第二阻尼因子可以表征剩余节点对应的商品被抽检的概率,第一阻尼因子和第二阻尼因子的和值为1。然后可以将第一目标抽检子概率和第二目标抽检子概率的和值确定为节点的目标抽检概率。
在实际应用时,抽检模型抽检一个商品时存在两种选择,一种是选择当前商品作为抽检商品,另一种是抽检其他商品作为抽检商品。假设选择当前商品作为抽检商品的概率为p,那么抽检其他商品的概率为1-p。若抽检模型抽检其他商品,则会以均匀分布的形式随机抽检当前商品所指向的其他商品。经过若干次迭代后,每个商品被抽检的概率最终会收敛至某一值,具体公式如下:
其中,PR(i)可以表示第i个商品被抽检的概率,p可以表示选择当前商品作为抽检商品的概率,其具体数值可以是随机设置的每个商品被抽检的初始概率,N可以表示所有商品的总数量,in(i)可以表示指向第i个商品的商品集合,out(j)可以表示商品j指向其他商品的商品集合。
S207:基于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据。
本申请实施例中,目标商品对应的节点的目标抽检概率大于预设概率阈值。
在一些可能的实施方式中,在确定每个节点的目标抽检概率之后,可以对每个节点的目标抽检概率进行排序得到节点序列{V1,V2,V3,...,Vn},然后可以选择目标抽检概率大于预设概率阈值η的节点,并将节点对应的候选商品作为目标商品,得到目标商品集合,即最终抽检的商品。同时可以获取目标商品集合中每个目标商品的品牌信息、店铺信息、商家信息、价格信息、评论信息以及风险信息等关联业务数据。
S209:根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果。
本申请实施例中,识别结果可以表征商品是否为合格商品。
在一些可能的实施方式中,可以从关联业务数据中提取目标商品的交易次数特征、评论文本特征、品牌相似度特征和视觉特征。其中,视觉特征可以是商品的外观颜色、形状、印花等。然后可以对交易次数特征、评论文本特征、品牌相似度特征和视觉特征进行融合处理,并基于融合处理的结果进行识别处理得到目标商品的识别结果。通过从多维度提取商品特征对商品进行识别,可以提高异常商品的识别准确率。
实际应用时,可以预先从多个维度提取样本商品的交易次数特征、评论文本特征、品牌相似度特征以及视觉特征,融合处理后来训练一个假货甄别模型。在训练假货甄别模型的过程中,可以将样本商品的关联业务数据和类别标识label输入至假货甄别模型。从商品交易维度,可以提取商品的交易次数特征d,从用户评价维度,可以利用预训练的语言表征模型(Bidirectional Encoder Representation from Transformers,BERT)提取商品评论的文本特征c,从品牌相似度维度,可以提取商品所涉及的品牌与其他品牌的品牌相似度特征s,从视觉特征维度,可以利用卷积神经网络(Faster Region Convolutional NeuralNetwork,Faster RCNN)提取展示页面中目标商品的视觉特征v。然后可以将交易次数特征d、文本特征c、品牌相似度特征s和视觉特征v进行融合,得到最终的预测分类特征。具体可以采用如下公式:
其中,wd可以表示交易次数特征权重,wc可以表示文本特征权重,ws可以表示品牌相似度特征权重,wv可以表示视觉特征权重,α可以表示截距,ơ可以表示激活函数Sigmoid,g可以表示预测分类特征。
然后可以将预测分类特征g和分类标识label输入至支持向量机中进行训练,得到融合多维度特征的假货甄别模型。
在对目标商品进行识别时,可以将目标商品的关联业务数据输入至假货甄别模型,判断其是否为合格商品。
在一些可能的实施方式中,若得到目标商品的识别结果为异常商品,可以将目标有向图中每个节点对应的候选商品确定为异常商品,也可以将目标有向图中的部分节点对应的候选商品确定为异常商品。还可以将目标有向图中每个节点的关联业务数据输入至假货甄别模型,确定每个节点对应的商品是为合格商品。
图3是本申请实施例提供的一种商品识别的示意图。由于商品与其关联的店铺、商家构成一个覆盖全商品的商家全景图,因此可以通过商家全景图扩散相关店铺和商家,判断店铺层的风险程度和商家层的风险等级。在一些可能的实施方式中,对于定性的目标商品,可以通过商家全景视图扩散至所有相关店铺和商家,进行店铺层和商家层的风险程度和风险等级的识别。若得到目标商品的识别结果为异常商品,可以从目标商品的关联业务数据中确定目标商品的关联店铺和关联商家,并对关联店铺的风险程度和关联商家的风险等级进行更新处理,得到更新处理结果。例如,可以增加关联店铺的风险程度以及提高关联商家的风险等级,在店铺的风险程度和关联商家的风险等级超过预先设定的程度值和风险等级时,可以发出相应的预警提示。进一步地,可以依据商品层、店铺层、商家层的风险程度、风险等级以及定性分析,综合指定风险策略。例如,可以指定风控兜底策略,若商品、店铺、商家存在异常情况,可以将涉及的商品识别为异常商品,并且,通过商家全景视图从商品层扩散至相关的店铺层和商家层,可以进行整体的风险管控,实现多维立体的风险管理。
采用本申请实施例提供的商品识别方法,在商品识别层,可以通抽检模型拉取所有候选商品的关联业务信息,对相似商品进行抽检,定性扩散,可以解决逐一识别相似商品计算成本高、效率低的问题。利用随机游走算法抽检商品,不仅可以降低抽检的成本,而且提高抽检的效率。通过从多维度提取商品特征对商品进行识别,可以提高异常商品的识别准确率。通过商家全景视图从商品层扩散至相关的店铺层和商家层,可以进行整体的风险管控,实现多维立体的风险管理。
本申请实施例还提供的一种商品识别装置,图4是本申请实施例提供的一种商品识别装置的结构示意图,如图4所示,该商品识别装置可以包括:
获取模块401,用于基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;目标有向图中的节点表征候选商品,目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;
随机游走模块403,用于以目标有向图中的每个节点为起点,确定自起点随机游走至剩余节点集合中每个剩余节点的转移概率;剩余节点集合是目标有向图中除起点之外的多个节点;
第一确定模块405,用于针对目标有向图中的每个节点,根据随机抽检概率和每个节点的转移抽检概率,确定每个节点的目标抽检概率;随机抽检概率是目标有向图中节点总数量的倒数,转移抽检概率是自剩余节点随机游走至节点的转移概率的和值;
第二确定模块407,用于每个节点的目标抽检概率从候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;目标商品对应的节点的目标抽检概率大于预设概率阈值;
识别模块409,用于根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果;识别结果表征商品是否为合格商品。
在一些可能的实施方式中,商品识别装置还包括:
第一更新模块,用于在根据目标商品的关联业务数据对目标商品进行识别处理,得到识别结果之后,若目标商品为异常商品,从目标商品的关联业务数据中确定目标商品的关联店铺和关联商家;
对关联店铺的风险程度和关联商家的风险等级进行更新处理,得到更新处理结果。
在一些可能的实施方式中,商品识别装置还包括:
第二更新模块,用于若目标商品为异常商品,将目标有向图中每个节点对应的候选商品确定为异常商品。
在一些可能的实施方式中,第一确定模块,用于针对目标有向图中的每个节点,将节点的第一阻尼因子和随机抽检概率的乘积确定为节点的第一目标抽检子概率;第一阻尼因子表征抽检剩余节点对应的商品时,节点对应的商品不被抽检的概率;
将节点的第二阻尼因子和转移抽检概率的乘积确定为节点的第二目标抽检子概率;第二阻尼因子表征剩余节点对应的商品被抽检的概率,第一阻尼因子和第二阻尼因子的和值为1;
将第一目标抽检子概率和第二目标抽检子概率的和值确定为节点的目标抽检概率。
在一些可能的实施方式中,识别模块,用于从关联业务数据中提取目标商品的交易次数特征、评论文本特征、品牌相似度特征和视觉特征;
对交易次数特征、评论文本特征、品牌相似度特征和视觉特征进行融合处理,基于融合处理的结果进行识别处理得到目标商品的识别结果。
在一些可能的实施方式中,获取模块,用于从业务订单、物流订单、展示页面和评论信息中提取商品集合和每个商品的关联业务数据,构建待监控数据库;
当监测到待监控数据库出现名称聚类和/或商标变异时,将名称聚类和/或商标变异的商品确定候选商品集合;
基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图。
本申请实施例中的装置与方法实施例基于同样的申请构思。
本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,该存储器中存储有至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现如上述方法实施例所提供的商品识别方法。
图5是本申请实施例提供的一种用于实现本申请实施例所提供的商品识别方法的电子设备的硬件结构示意图,电子设备可以参与构成或者包含本申请实施例所提供的商品识别装置。如图5所示,电子设备可以包括一个或者多个(图中采用501a、501b 来示出)处理器501(处理器501可以包括但不限于微处理器501MCU或可编程逻辑器件FPGA等处理装置)、用于存储数据的存储器503、以及用于通信功能的传输装置505。除此以外,还可以包括:显示器、输入/输出接口(I/O接口)、通用串行总线(USB)端口(可以作为I/O接口的端口中的一个端口被包括)、网络接口和/或电源。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子设备的结构造成限定。例如,电子设备还可以包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
应当注意到的是上述一个或多个处理器501和/或其他数据处理电路在本申请中通常可以被称为“数据处理电路”。该数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立处理模块,或全部或部分的结合到电子设备(或移动设备)中的其他元件中的任意一个内。如本申请实施例中所涉及到的,该数据处理电路作为一种处理器501控制(例如与接口连接的可变电阻终端路径的选择)。
存储器503可用于存储应用软件的软件程序以及模块,如本申请实施例中的商品识别方法对应的程序指令/数据存储装置,处理器501通过运行存储在存储器503内的软件程序以及模块,从未执行各功能应用以及数据处理,即实现上述的一种商品识别方法。存储器503可包括高速随机存储其,还可包括非易失性随机存储器503,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器503。在一些可能的实施例中,存储器503可以进一步包括相对于处理远程设置的存储器503,这些远程存储器503可以通过网络连接值电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置505用于经由一个网络接收或者发送数据。上述的网络具体实例可以包括电子设备的通信供应商提供的无线网络。在一个实例中,传输装置505包括一个网络适配器(NetworkInterfaceController,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置505可以为射频(RadioFrequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LED),该液晶显示器可使得用户能够与电子设备(或移动设备)的用户界面进行交互。
本申请实施例提供了一种计算机可读存储介质,该存储介质可设置于电子设备之中以保存用于实现方法实施例中一种商品识别方法相关的至少一条指令或至少一段程序,该至少一条指令或该至少一段程序由该处理器加载并执行以实现上述方法实施例提供的商品识别方法。
可选地,在本实施例中,上述存储介质可以位于计算机网络的多个网络服务器中的至少一个网络服务器。可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
需要说明的是:上述本申请实施例的先后顺序仅仅为了描述,不代表实施例的优劣,且上述本说明书对特定的实施例进行了描述,其他实施例也在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或者步骤可以按照不同的实施例中的顺序来执行并且能够实现预期的结果。另外,在附图中描绘的过程不一定要求示出特定顺序或者而连接顺序才能够实现期望的结果,在某些实施方式中,多任务并行处理也是可以的或者可能是有利的。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的均为与其他实施例的不同之处。尤其,对于装置和电子设备的实施例而言,由于其基于相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
Claims (10)
1.一种商品识别方法,其特征在于,包括:
基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;所述目标有向图中的节点表征候选商品,所述目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;
以所述目标有向图中的每个节点为起点,确定自所述起点随机游走至剩余节点集合中每个剩余节点的转移概率;所述剩余节点集合是所述目标有向图中除所述起点之外的多个节点;
针对所述目标有向图中的每个节点,根据随机抽检概率和所述每个节点的转移抽检概率,确定所述每个节点的目标抽检概率;所述随机抽检概率是所述目标有向图中节点总数量的倒数,所述转移抽检概率是自所述剩余节点随机游走至所述节点的转移概率的和值;
基于所述每个节点的目标抽检概率从所述候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;所述目标商品对应的节点的目标抽检概率大于预设概率阈值;
根据所述目标商品的关联业务数据对所述目标商品进行识别处理,得到识别结果;所述识别结果表征所述商品是否为合格商品。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标商品的关联业务数据对所述目标商品进行识别处理,得到识别结果之后,还包括:
若所述目标商品为异常商品,从所述目标商品的所述关联业务数据中确定所述目标商品的关联店铺和关联商家;
对所述关联店铺的风险程度和所述关联商家的风险等级进行更新处理,得到更新处理结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标商品的关联业务数据对所述目标商品进行识别处理,得到识别结果之后,还包括:
若所述目标商品为异常商品,将所述目标有向图中每个节点对应的候选商品确定为异常商品。
4.根据权利要求1所述的方法,其特征在于,所述根据随机抽检概率和所述每个节点的转移抽检概率,确定所述每个节点的目标抽检概率,包括:
针对所述目标有向图中的每个节点,将所述节点的第一阻尼因子和所述随机抽检概率的乘积确定为所述节点的第一目标抽检子概率;所述第一阻尼因子表征抽检所述剩余节点对应的商品时,所述节点对应的商品不被抽检的概率;
将所述节点的第二阻尼因子和所述转移抽检概率的乘积确定为所述节点的第二目标抽检子概率;所述第二阻尼因子表征所述剩余节点对应的商品被抽检的概率,所述第一阻尼因子和所述第二阻尼因子的和值为1;
将所述第一目标抽检子概率和所述第二目标抽检子概率的和值确定为所述节点的目标抽检概率。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标商品的关联业务数据对所述目标商品进行识别处理,得到识别结果,包括:
从所述关联业务数据中提取所述目标商品的交易次数特征、评论文本特征、品牌相似度特征和视觉特征;
对所述交易次数特征、所述评论文本特征、所述品牌相似度特征和所述视觉特征进行融合处理,基于融合处理的结果进行识别处理得到所述目标商品的所述识别结果。
6.根据权利要求1所述的方法,其特征在于,所述基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图,还包括:
从业务订单、物流订单、展示页面和评论信息中提取商品集合和每个商品的关联业务数据,构建待监控数据库;
当监测到所述待监控数据库出现名称聚类和/或商标变异时,将所述名称聚类和/或商标变异的商品确定所述候选商品集合;
基于所述候选商品集合和每个所述候选商品的关联业务数据,构建所述目标有向图。
7.一种商品识别装置,其特征在于,包括:
获取模块,用于基于候选商品集合和每个候选商品的关联业务数据,构建目标有向图;所述目标有向图中的节点表征候选商品,所述目标有向图中的有向边表征所连接的两个候选商品的部分关联业务数据相同;
随机游走模块,用于以所述目标有向图中的每个节点为起点,确定自所述起点随机游走至剩余节点集合中每个剩余节点的转移概率;所述剩余节点集合是所述目标有向图中除所述起点之外的多个节点;
第一确定模块,用于针对所述目标有向图中的每个节点,根据随机抽检概率和所述每个节点的转移抽检概率,确定所述每个节点的目标抽检概率;所述随机抽检概率是所述目标有向图中节点总数量的倒数,所述转移抽检概率是自所述剩余节点随机游走至所述节点的转移概率的和值;
第二确定模块,用于所述每个节点的目标抽检概率从所述候选商品集合中确定目标商品集合以及每个目标商品的关联业务数据;所述目标商品对应的节点的目标抽检概率大于预设概率阈值;
识别模块,用于根据所述目标商品的关联业务数据对所述目标商品进行识别处理,得到识别结果;所述识别结果表征所述商品是否为合格商品。
8.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处理器加载并执行以实现如权利要求1-6任一项所述的商品识别方法。
9.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一条指令或至少一段程序,所述至少一条指令或至少一段程序由处理器加载并执行以实现如权利要求1-6任一项所述的商品识别方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品包括至少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由处理器加载并执行以实现如权利要求1-6任一项所述的商品识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226918.9A CN115293861A (zh) | 2022-10-09 | 2022-10-09 | 一种商品识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211226918.9A CN115293861A (zh) | 2022-10-09 | 2022-10-09 | 一种商品识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115293861A true CN115293861A (zh) | 2022-11-04 |
Family
ID=83834466
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211226918.9A Pending CN115293861A (zh) | 2022-10-09 | 2022-10-09 | 一种商品识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115293861A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140317736A1 (en) * | 2013-04-23 | 2014-10-23 | Telefonica Digital Espana, S.L.U. | Method and system for detecting fake accounts in online social networks |
CN108805583A (zh) * | 2018-05-18 | 2018-11-13 | 连连银通电子支付有限公司 | 基于地址映射的电商欺诈检测方法、装置、设备及介质 |
CN110009486A (zh) * | 2019-04-09 | 2019-07-12 | 连连银通电子支付有限公司 | 一种欺诈检测的方法、系统、设备及计算机可读存储介质 |
CN110609869A (zh) * | 2019-09-10 | 2019-12-24 | 连连银通电子支付有限公司 | 一种基于区块链的数据存储方法、相关设备及存储介质 |
CN111143575A (zh) * | 2019-12-06 | 2020-05-12 | 苏宁云计算有限公司 | 一种店铺商品结构的优化方法及系统 |
CN112989169A (zh) * | 2021-02-23 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 目标对象识别方法、信息推荐方法、装置、设备及介质 |
WO2021232856A1 (zh) * | 2020-05-21 | 2021-11-25 | 中国标准化研究院 | 基于大数据的网销商品检验抽样方法 |
CN114116799A (zh) * | 2021-11-23 | 2022-03-01 | 河北航天信息技术有限公司 | 异常交易环路的识别方法、装置、终端及存储介质 |
US20220092608A1 (en) * | 2020-09-22 | 2022-03-24 | Ebay Inc. | Counterfeit item detection system |
CN114255050A (zh) * | 2021-12-21 | 2022-03-29 | 上海淇玥信息技术有限公司 | 一种识别业务异常用户的方法、装置和电子设备 |
CN115082153A (zh) * | 2022-06-22 | 2022-09-20 | 上海识致信息科技有限责任公司 | 一种商家质量评价方法、装置、电子设备及存储介质 |
-
2022
- 2022-10-09 CN CN202211226918.9A patent/CN115293861A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140317736A1 (en) * | 2013-04-23 | 2014-10-23 | Telefonica Digital Espana, S.L.U. | Method and system for detecting fake accounts in online social networks |
CN108805583A (zh) * | 2018-05-18 | 2018-11-13 | 连连银通电子支付有限公司 | 基于地址映射的电商欺诈检测方法、装置、设备及介质 |
CN110009486A (zh) * | 2019-04-09 | 2019-07-12 | 连连银通电子支付有限公司 | 一种欺诈检测的方法、系统、设备及计算机可读存储介质 |
CN110609869A (zh) * | 2019-09-10 | 2019-12-24 | 连连银通电子支付有限公司 | 一种基于区块链的数据存储方法、相关设备及存储介质 |
CN111143575A (zh) * | 2019-12-06 | 2020-05-12 | 苏宁云计算有限公司 | 一种店铺商品结构的优化方法及系统 |
WO2021232856A1 (zh) * | 2020-05-21 | 2021-11-25 | 中国标准化研究院 | 基于大数据的网销商品检验抽样方法 |
US20220092608A1 (en) * | 2020-09-22 | 2022-03-24 | Ebay Inc. | Counterfeit item detection system |
CN112989169A (zh) * | 2021-02-23 | 2021-06-18 | 腾讯科技(深圳)有限公司 | 目标对象识别方法、信息推荐方法、装置、设备及介质 |
CN114116799A (zh) * | 2021-11-23 | 2022-03-01 | 河北航天信息技术有限公司 | 异常交易环路的识别方法、装置、终端及存储介质 |
CN114255050A (zh) * | 2021-12-21 | 2022-03-29 | 上海淇玥信息技术有限公司 | 一种识别业务异常用户的方法、装置和电子设备 |
CN115082153A (zh) * | 2022-06-22 | 2022-09-20 | 上海识致信息科技有限责任公司 | 一种商家质量评价方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
贾统等: "基于日志数据的分布式软件系统故障诊断综述", 《软件学报》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109360089B (zh) | 贷款风险预测方法及装置 | |
KR102099561B1 (ko) | 기계학습 기반 고도화된 매칭 알고리즘을 포함한 섬유제품 검색 서비스 제공 시스템 | |
CN109118316B (zh) | 线上店铺真实性的识别方法和装置 | |
CN108961019B (zh) | 一种用户账户的检测方法和装置 | |
EP3289487B1 (en) | Computer-implemented methods of website analysis | |
CN108241867B (zh) | 一种分类方法及装置 | |
CN107016398A (zh) | 数据处理方法及装置 | |
CN111415167B (zh) | 网络欺诈交易检测方法及装置、计算机存储介质和终端 | |
CN111582932A (zh) | 场景间信息推送方法、装置、计算机设备及存储介质 | |
CN113095408A (zh) | 风险的确定方法、装置和服务器 | |
Zandian et al. | Feature extraction method based on social network analysis | |
CN114692593B (zh) | 一种网络信息安全监测预警方法 | |
CN116307671A (zh) | 风险预警方法、装置、计算机设备、存储介质 | |
CN114297505A (zh) | 推荐系统及推荐方法、设备、计算机可读介质 | |
CN114202336A (zh) | 一种金融场景下的风险行为监测方法及系统 | |
CN114691932A (zh) | 用于生成合成数据的系统、方法和计算机程序产品 | |
CN115204881A (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN113569162A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN111784053A (zh) | 交易风险检测方法、设备及可读存储介质 | |
CN111091409A (zh) | 客户标签的确定方法、装置和服务器 | |
CN110309373B (zh) | 信息处理方法及装置 | |
CN115293861A (zh) | 一种商品识别方法、装置、电子设备及存储介质 | |
CN113869904B (zh) | 可疑数据识别方法、装置、电子设备、介质和计算机程序 | |
Deepa et al. | Survey paper for credit card fraud detection using data mining techniques | |
CN111611981A (zh) | 信息识别方法和装置及信息识别神经网络训练方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221104 |