CN110443663A - 信息处理方法、装置及计算设备 - Google Patents

信息处理方法、装置及计算设备 Download PDF

Info

Publication number
CN110443663A
CN110443663A CN201810416053.XA CN201810416053A CN110443663A CN 110443663 A CN110443663 A CN 110443663A CN 201810416053 A CN201810416053 A CN 201810416053A CN 110443663 A CN110443663 A CN 110443663A
Authority
CN
China
Prior art keywords
identified
similarity
attribute
data
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810416053.XA
Other languages
English (en)
Inventor
瞿春燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201810416053.XA priority Critical patent/CN110443663A/zh
Publication of CN110443663A publication Critical patent/CN110443663A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0627Directed, with specific intent or strategy using item specifications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy
    • G06Q30/0629Directed, with specific intent or strategy for generating comparisons

Landscapes

  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种信息处理方法、装置及计算设备,其中,所述方法包括:针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。本申请实施例提供的技术方案提高识别效率以及识别准确性。

Description

信息处理方法、装置及计算设备
技术领域
本申请实施例涉及计算机应用技术领域,尤其涉及一种信息处理方法、装置及计算设备。
背景技术
随着互联网技术以及电子技术的发展,通过网上交易获取各种产品的便携方式逐渐渗透到日常生活中。
由于实际应用中,产品提供方可能不止在一个网上交易平台提供其产品的销售,为了方便对产品提供方销售行为的管理,为产品提供方提供更好的交易环境等,在某些应用场景下,就需要获知在不同网上交易平台中是否存在相同的产品提供方。
现有技术中,只能人工根据各个网上交易平台提供的网页数据中来获取不同产品提供方的相关信息,再结合自身经验来识别是否为同一个产品提供方,这种方式不仅效率较低且识别结果因人而异,导致结果不够准确。
发明内容
本申请实施例提供一种信息处理方法、装置及计算设备,用以解决现有技术中识别效率低、识别准确性低的技术问题。
第一方面,本申请实施例中提供了一种信息处理方法,包括:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
第二方面,本申请实施例中提供了一种信息处理方法,包括:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;
输出所述业务提示信息。
第三方面,本申请实施例中提供了一种信息处理方法,包括:
针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
第四方面,本申请实施例中提供了一种信息处理装置,包括:
数据提取模块,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
第五方面,本申请实施例中提供了一种信息处理装置,包括:
数据提取模块,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第一业务提示模块,用于如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;输出所述业务提示信息。
第六方面,本申请实施例中提供了一种信息处理装置,包括:
数据提取模块,用于针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第二业务提示模块,用于如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
第七方面,本申请实施例中提供了一种计算设备,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
第八方面,本申请实施例中提供了一种计算设备,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;
输出所述业务提示信息。
第九方面,本申请实施例中提供了一种计算设备,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
本申请实施例中,针对至少一个特征属性,可以分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;基于所述至少一个特征相似度,确定所述第一待识别对象与所述第二待识别对象是否满足相似要求。本申请实施例中基于不同特征属性,自动实现了对任意两个待识别对象的识别,无需人工执行,从而提高了识别效率以及识别准确性。
本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请提供的一种信息处理方法一个实施例的流程图;
图2示出了本申请提供的一种信息处理方法又一个实施例的流程图;
图3示出了本申请提供的一种信息处理方法又一个实施例的流程图;
图4示出了本申请实施例的一种信息处理方法又一个实施例的流程图;
图5示出了本申请实施例的一种信息处理方法又一个实施例的流程图;
图6示出了本申请提供的一种信息处理装置一个实施例的结构示意图;
图7示出了本申请提供的一种信息处理装置又一个实施例的结构示意图;
图8示出了本申请提供的一种计算设备一个实施例的结构示意图;
图9示出了本申请提供的一种信息处理装置又一个实施例的结构示意图;
图10示出了本申请提供的一种计算设备又一个实施例的结构示意图;
图11示出了本申请提供的一种信息处理装置又一个实施例的结构示意图;
图12示出了本申请提供的一种计算设备又一个实施例的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在本申请的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。
本申请实施例的技术方案主要应用于对待识别对象进行相同或者相似判断的场景中,其中,待识别对象可以是指产品提供方或者产品,在网上交易场景中,产品提供方即是指商家,产品即是指商品。
在网上交易场景中,同一网上交易平台或者不同网上交易平台中,可能存在相同或相似的商品或商家店铺等,基于相同或相似的商品或商家店铺,可以提供更好的交易环境,例如同一商家通常会在不同网上交易平台上开设店铺,通过相同店铺的判断,可以帮助商家对比自家店铺在其他网上交易平台上的销售业绩,调整经营策略等,比如如果销售情况不如其他网上交易平台,则可以相应制定改善措施,以提高销售业绩;此外,平台通过同一商家在其它网上交易平台上的销售情况,还可以确定同一商家在不同网上交易平台的经营状态和采取的经营策略,从而可以据此对网上交易平台进行改进等等。
由于现有技术中,对两个待识别对象是否相同或相似的判断均是人工凭经验执行的,需要人工搜集待识别对象的相关信息再进行比对,而往往需要进行相同或相似判断的待识别对象非常多,例如网上交易场景中,商家数量成千上万,人工识别非常耗时且主观因素较大,导致识别结果不准确。
为了提高识别效率以及识别准确性,发明人经过一系列研究提出了本申请的技术方案,在本申请实施例中,针对至少一个特征属性,可以分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;基于所述至少一个特征相似度,确定所述第一待识别对象与所述第二待识别对象是否满足相似要求。本申请实施例中针对不同特征属性,自动实现了对任意两个待识别对象的识别,无需人工执行,从而提高了识别效率以及识别准确性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例提供的一种信息处理方法一个实施例的流程图,该方法可以包括以下几个步骤:
101:针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据。
每一个待识别对象可以具有一个或多个特征属性,可以利用至少一个特征属性来表示一个待识别对象,作为待识别对象的对象画像。
其中,第一待识别对象以及第二待识别对象可以为任意两个待识别对象,为了方便描述上的区分,分别命名为第一待识别对象以及第二待识别对象,需要说明的是,“第一”、“第二”并不表示具有其它含义。
其中,待识别对象可以是指产品或者产品提供方。在网上交易场景中,产品提供方也即是指商家,产品也即是指商品。
若待识别对象为产品提供方,该至少一个特征属性可以至少包括三个类别:提供方属性、产品属性和/或业务属性;
其中,所述提供方属性包括提供方名称和/或提供方位置;
所述产品属性包括产品描述信息、产品价格和/或产品销量排名;
所述业务属性包括经营类别、经营品牌和/或总销量。
若待识别对象为产品时,该至少一个特征属性例如可以包括产品价格、产品名称和/或产品销量等。
102:基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度。
针对该至少一个特征属性中的任一个特征属性,基于所述第一待识别对象以及所述第二待识别对象各自对应该任一个特征属性的属性数据,可以计算获得所述第一待识别对象以及所述第二待识别对象针对该任一个特征属性的特性相似度,进而针对该至少一个特征属性,即可以获得至少一个特征相似度。
其中,为了提高计算精确度,基于属性数据计算特征相似度时,可以对属性数据进行清洗,例如去除冗余信息,如标点符号等等。
103:基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
基于该至少一个特征相似度,即可以识别第一待识别对象与第二待识别对象是否满足相似要求。
其中,该相似要求可以根据实际应用情况进行设定,以确定两个待识别对象是否相同或者相似,在下面实施例中会详细进行介绍。
本实施例中,无需人工进行识别,即可以自动实现对任意两个待识别对象是否满足相似要求进行识别,从而可以提高识别效率以及识别准确性。
在某些实施例中,所述针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据包括:
针对至少一个特征属性,从基于第一网络平台爬取的网页数据中提取第一待识别对象对应的属性数据,以及从基于第二网络平台爬取的网页数据中提取第二待识别对象对应的特征数据。
第一网络平台以及第二网络平台例如可以均为网上交易平台,从而采用本申请实施例的技术方案中,可以从任意两个网络平台中确定相同的待识别对象。
属性数据可以从网络平台提供的网页中爬取获得,从而无需人工搜集数据,以可以保证识别效率。
作为一种可选方式,基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求可以包括:
识别每一个特性相似度是否均大于各自对应的相似阈值,如果是,则可以确定第一待识别对象与第二待识别对象满足相似要求,否则可以确定第一待识别对象与第二待识别对象不满足相似要求。
作为另一种可选方式,基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求可以是:
基于所述至少一个特征相似度,计算综合相似度;
基于所述综合相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
例如可以是综合相似度大于综合阈值时,则可以确定第一待识别对象与第二待识别对象满足相似要求,否则可以确定第一待识别对象与第二待识别对象不满足相似要求。
在某些实施例中,所述基于所述至少一个特征相似度,计算综合相似度可以包括:
分别确定所述至少一个特征属性的权重系数;
基于所述权重系数加权处理所述至少一个特征相似度,获得综合相似度;
其中,每一个特征属性的权重系数用以表示每一个特征属性对于待识别对象的重要程度。
其中,加权处理可以是指加权求和或者加权平均等。
例如,假设至少一个特征属性包括A、B、C、D,各自对应的权重系数分别为a、b、c、d。则综合相似度可以为a*A+b*B+c*C+d*D,或者可以为 (a*A+b*B+c*C+d*D)/(a+b+c+d)。
此外,作为又一种可选方式,可以利用机器学习算法训练分类模型,以利用分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
因此,基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求可以是:
基于至少一个特征相似度,利用预先训练的分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
具体的,参见图2,示出了本申请实施例提供的一种信息处理方法又一个实施例的流程图,该方法可以包括以下几个步骤:
201:针对至少一个特征属性,分别提取满足相似要求的任意两个样本对象各自对应的属性数据。
202:基于所述任意两个样本对象各自对应所述至少一个特征属性的属性数据,计算所述任意两个样本对象的至少一个特征相似度;
203:将所述任意两个样本对象的至少一个特征相似度作为训练样本,训练获得所述分类模型。
将任意两个样本对象的至少一个特征相似度作为输入特征、是否满足相似要求作为输出结果,从而即可以获得该分类模型。
需要说明的是,步骤201~步骤203的操作可以预先执行。
该分类模型可以为SVM(Support Vector Machine,支持向量机)、朴素贝叶斯、随机森林、GBDT(Gradient Boost Decision Tree,梯度提升决策树) 等算法模型。
204:针对该至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据。
205:基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度。
206:基于至少一个特征相似度,利用所述分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
将该至少一个特征相似度输入该分类模型,根据分类模型的输出结果即可以确定第一待识别对象与所述第二待识别对象是否满足相似要求。
本实施例利用分类模型实现了自动数据分析以及识别,实现了对任意两个待识别对象是否满足相似要求的有效识别,且在短时间内容可以处理大量的待识别对象,且相较于人工经验识别更加客观,提高了识别准确度以及识别效率。
其中,由于对于同一个特征属性,其对应的数据描述方式可能会有多种,例如特征属性为产品提供方的提供方名称,在实际应用中也即是指店铺名称,“李三专营店”以及“李三专卖店”,两种描述方式虽然不同,但是可能是指同一个店铺。
因此,在某些实施例中,所述基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度可以包括:
针对任一特征属性,分别确定所述第一待识别对象对应的属性数据以及所述第二待识别对象对应的属性数据各自所属的数据集合;其中,每一数据集合保存同一特征属性对应的不同描述方式的属性数据;
将第一待识别对象对应的属性数据映射为其所属数据集合对应的转换数据,以及将第二待识别对象对应的属性数据映射为其所属数据集合对应的转换数据;
基于所述第一待识别对象对应的转换数据以及所述第二待识别对象对应的转换数据,计算所述第一待识别对象以及所述第二待识别对象对应所述任一特征属性的特征相似度。
也即首先将属性数据进行归一化,从而可以方便进行特征相似度的计算。
其中,同一特征属性对应的数据集合可以预先设置。
例如,同一提供方名称对应的数据集合中可以保存不同描述方式的属性数据。每一个数据集合中保存的属性数据都用来表示同一个提供方名称,每一个数据集合对应的转换数据例如可以采用数字标记,如阿拉伯数字等,不同数据集合对应的转换数据不同。
由上文描述可知,如果待识别对象为产品提供方;所述至少一个特征属性可以至少包括提供方名称、提供方位置、产品描述信息、产品价格、产品销量排名、经营类别、经营品牌和/或总销量。
因此,在某些实施例中,所述基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据,计算所述第一待识别对象与所述第二待识别对象的名称相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应提供方位置的属性数据,计算所述第一待识别对象与所述第二待识别对象的位置相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象与所述第二待识别对象的描述相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象与所述第二待识别对象的价格相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象与所述第二待识别对象的排名相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象与所述第二待识别对象的类别相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象与所述第二待识别对象的品牌相似度;
和/或,
基于所述第一待识别对象以及所述第二待识别对象各自对应总销量的属性数据,计算所述第一待识别对象与所述第二待识别对象的销量相似度。
可选地,名称相似度的计算可以有多种可能的实现方式,作为一种可能的实现方式,提供方名称对应的属性数据为字符串数据,因此名称相似度可以通过计算字符串相似度获得:
也即基于所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据,计算所述第一待识别对象与所述第二待识别对象的名称相似度可以包括:
计算所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据的字符串相似度;
将所述字符串相似度作为所述第一待识别对象与所述第二待识别对象的名称相似度。
例如可以采用“最长公共子串”的计算方式,比较连续字符相等的个数,根据个数多少来确定名称相似度;
或者可以采用如下字符串计算公式计算获得:
其中,simi表示名称相似度,s1以及s2分别为第一待识别对象以及第二待识别对象对应提供方名称的属性数据,len()用于计算属性数据的字符串长度,d为两个提供方名称的字符串编辑距离。
其中,字符串编辑距离是指由一个提供方名称转成另一个提供方名称所需的最少编辑操作次数,编辑操作可以包括:将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个提供方名称的字符串相似度越大。
此外,提供方名称对应的属性数据也可能包括冗余信息,例如“+”以及“()”中等符号,因此可以首先将所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据删除冗余信息,再据此计算所述第一待识别对象与所述第二待识别对象的名称相似度。
可选地,位置相似度的计算可以有多种可能的实现方式,作为一种可能的实现方式:可以根据第一待识别对象对应提供方位置的属性数据以及第二待识别对象对应提供方位置的属性数据是否相同的识别结果,计算获得位置相似度。例如如果相同,位置相似度可以直接为第一预设数值,比如1,如果不同,位置相似度可以直接为第二预设数值,比如0,其中第一预设数值大于第二预设数值。
可选地,基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象与所述第二待识别对象的描述相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象提供的任一产品的产品描述信息,与所述第二待识别对象提供的任一产品的产品描述信息的描述子相似度,以获得至少一个描述子相似度;
基于所述至少一个描述子相似度,计算获得描述相似度。
利用可以将至少一个描述子相似度的平均值或者和值,作为描述相似度。
描述子相似度的计算可以有多种可能的实现方式,产品描述信息例如可以是指产品名称或者包括产品名称在内的产品介绍信息等。
作为一种可选方式,可以从第一待识别对象提供的任一产品的产品描述信息对应的属性数据中提取第一关键词,以及从第一待识别对象提供的任一产品的产品描述信息对应的属性数据中提取第二关键词;
计算第一关键词以及第二关键词的字符串相似度,并作为所述第一待识别对象提供任一产品与所述第二待识别对象提供的任一产品的描述子相似度。
其中,关键词的提取可以采用TF-IDF(term frequency-inverse documentfrequency,词频-逆向文件频率)算法等实现。
其中,可选地,所述基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象与所述第二待识别对象的价格相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象提供的任一产品的产品价格,与所述第二待识别对象提供的任一产品的产品价格的价格子相似度,以获得至少一个价格子相似度;
基于所述至少一个价格子相似度,计算获得价格相似度。
可以将至少一个价格子相似度的和值或者平均值作为价格相似度。
价格子相似度的计算例如可以是基于第一待识别对象提供的任一产品的产品价格对应的属性数据以及第二待识别对象提供的任一产品的产品价格的对应的属性数据是否相同的识别结果,计算获得价格子相似度。例如如果相同,价格子相似度可以直接为第三预设数值,比如1,如果不同,价格子相似度可以直接为第四预设数值,比如0,其中第三预设数值大于第四预设数值。
可选地,所述基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象与所述第二待识别对象的排名相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象提供的任一产品的产品销量排名,与所述第二待识别对象提供的任一产品的产品销量排名的排名子相似度,以获得至少一个排名子相似度;
基于所述至少一个排名子相似度,计算获得排名相似度。
可以将至少一个排名子相似度的和值或者平均值作为排名相似度。
其中,排名子相似度可以根据所述第一待识别对象提供的任一产品的产品销量排名与第二待识别对象提供的任一产品的产品销量排名的排名差值大小确定,例如如果排名差值大于第一差值,则可以设定排名子相似度为第五预设数值,如果排名差值小于第二差值,则可以设定排名子相似度为第六预设数值等。其中,第二差值小于或等于第一差值,第二预设数值小于第六预设数值。
其中,第一待识别对象中每一个产品的产品销量排名也即是指将第一待识别对象提供的各个产品按照产品销量进行排名获得。
第二待识别对象中每一个产品的产品销量排名也即是指将第二待识别对象提供的各个产品按照产品销量进行排名获得。
可选地,由于每一个待识别对象的经营类别可能包括多个;
因此,所述基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象与所述第二待识别对象的类别相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象的任一经营类别与所述第二待识别对象的任一经营类别的类别子相似度,以获得至少一个类别子相似度;
基于所述至少一个类别子相似度,计算获得类别相似度。
可以将至少一个类别子相似度的和值或者平均值作为类别相似度。
可选地,由于每一个待识别对象的经营品牌可能包括多个;
因此,基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象与所述第二待识别对象的品牌相似度可以包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象的任一经营品牌与所述第二待识别对象的任一经营品牌的品牌子相似度,以获得至少一个类别子相似度;
基于所述至少一个品牌子相似度,计算获得品牌相似度。
可以将至少一个品牌子相似度的和值或者平均值作为品牌相似度。
其中,经营类别以及经营品牌对应的属性数据通常也为比较短的字符串数据,经营类别例如可以是指“生活电器”类、“智能家居类”等等。经营品牌例如可以是指“耐克”、“阿迪达斯”等等。
类别相似度以及品牌相似度的计算也可以采用字符串相似度的计算方式计算获得,在此不再赘述。
可选地,销量相似度的计算例如可以根据第一待识别对象的总销量与第二待识别对象的总销量的销量差值大小确定,例如如果销量差值大于第三差值,则可以设销量相似度为第七预设数值,如果销量差值小于第四差值,则可以设定销量相似度为第八预设数值等。其中,第三差值小于或等于第四差值,第七预设数值小于第八预设数值。当然,也可以设定更多的阈值对销量差值进行比对,以使得销量相似度更为精细。
需要说明的是,上述以提供方名称、提供方位置、产品描述信息、产品价格、产品销量排名、经营类别、经营品牌以及总销量为例,对特征相似度的计算进行的说明,本领域技术人员可以理解的,该至少一个特征属性可以不仅包括上述几种,上述几种特征属性仅是举例说明,而不应作为对本发明技术方案的限定。
由上文描述可知,如果待识别对象为产品;所述至少一个特征属性可以至少产品名称、产品价格和/或产品销量等等。
基于产品名称对应的属性数据,可以计算获得第一待识别对象以及第二待识别的第一特征相似度;其中第一特征相似度可以通过计算产品名称的字符串相似度获得;
基于产品价格对应的属性数据,可以计算获得第一待识别对象以及第二待识别对象的第二特征相似度;其中第二特征相似度例如可以根据第一待识别对象与第二待识别对象的价格差值确定,如果价格差值大于第一价格阈值,则可以确定第二相似度为第一相似数值,如果价格差值小于第二价格阈值,则可以确定第二相似度为第二相似数值等等;
基于产品销量,可以计算获得第一待识别对象以及第二待识别对象的第三特征相似度;其中第三特征相似度可以根据第一待识别对象与第二待识别对象的销量差值确定,如果销量差值大于第一销量阈值,则可以确定第三相似度为第三相似数值,如果销量差值小于第二销量阈值,则可以确定第三相似度为第四相似数值等等;
当然,上述仅是以产品名称、产品价格以及产品销量为例进行的说明,本领域技术人员可以理解的,该至少一个特征属性可以不仅包括上述几种,上述几种特征属性仅是举例说明,而不应作为对本发明技术方案的限定。
在一个实际应用中,待识别对象即可以具体是指网上交易平台中的产品提供方,产品提供方提供产品即在网上交易平台中进行销售,下面以待识别对象为产品提供方为例,对本申请实施例的技术方案进行详细描述。
图3为本申请实施例提供的一种信息处理方法又一个实施例的流程图,该方法可以包括以下几个步骤:
301:针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据。
可选地,可以从基于第一网络平台爬取的网页数据中提取第一产品提供方对应的属性数据,以及从基于第二网络平台爬取的网页数据中提取第二产品提供方对应的属性数据。
该至少一个特征属性即可以包括提供方名、提供方位置、产品描述信息、产品价格、产品销量排名、经营类别、经营品牌和/或总销量等。
302:针对任一特征属性,分别确定所述第一产品提供方对应的属性数据以及所述第二产品提供方对应的属性数据各自所属的数据集合。
其中,每一数据集合保存同一特征属性对应的不同描述方式的属性数据;
303:将第一产品提供方对应的属性数据映射为其所属数据集合对应的转换数据,以及将第二产品提供方对应的属性数据映射为其所属数据集合对应的转换数据。
304:基于所述第一产品提供方对应的转换数据以及所述第二产品提供方对应的转换数据,计算所述第一产品提供方以及所述第二产品提供方对应所述任一特征属性的特征相似度。
对每一个特征属性均按照步骤302~步骤304的操作执行,即可以获得至少一个特征相似度。
其中,转换数据与该数据集合保存的属性数据的数据格式可以相同,
例如对于同一提供方名称对应的数据集合中保存的属性数据假设包括“XX专营店”、“XX专卖店”、“XX旗舰店”等,则其对应的转换数据例如可以为“XX专卖店”等,也即通过数据集合可以将“专营店”、“专卖店”以及“旗舰店”等均映射为“专卖店”。
当然,如果不存在任一特征属性对应的数据集合,则可以直接基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度。
其中,对于不同特征属性的特征相似度的计算方式可以参见上述实施例中所述,在此不再赘述。
305:基于至少一个特征相似度,利用预先训练的分类模型识别所述第一产品提供方与所述第二产品提供方是否满足相似要求。
可选地,该分类模型即预先按照如下方式训练获得:
针对所述至少一个特征属性,分别获取满足相似要求的任意两个样本产品提供方各自对应的属性数据;
基于所述任意两个样本产品提供方各自对应所述至少一个特征属性的属性数据,计算所述任意两个样本产品提供方的至少一个特征相似度;
将所述任意两个样本产品提供方的至少一个特征相似度作为训练样本,训练获得所述分类模型。
通过本申请实施例,可以有效、快速、准确的识别任意两个产品提供方是否相同或者相似,无需人工执行,从而提高了识别效率以及识别准确性。
本申请实施例中,通过对第一待识别对象与第二待识别对象是否满足相似要求进行识别,基于识别结果在实际应用中可以有多种应用。例如第一待识别对象与第二待识别对象为产品提供方时,如果按照本申请实施例的技术方案确定来自不同网络平台的两个产品提供方相同时,根据两个产品提供方在各自网络平台中的业务相关数据,例如“产品销售总量”,“销量最高产品”、“销量最高产品品牌”或“销量最高产品类目”,即可以确定两个产品提供方的业务差距,从而可以帮助两个产品提供方改善经营策略,或者快速确定热销商品并上架销售等等;或者通过对第一网络平台中的第一待识别对象与第二网络平台中的第二待识别对象进行相似识别,如果第二网络平台中不存在与第一待识别对象满足相似要求的任意待识别对象,则可以提示第二网络平台开设该第一待识别对象,在实际应用中,可以实现引进优质商家的目的,吸引消费者,提升平台竞争力。
下面结合基于识别结果的实际应用对本申请实施例的技术方案进行介绍。
图4为本申请实施例提供的一种信息处理方法又一个实施例的流程图,该方法可以包括以下几个步骤:
401:针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据。
402:基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度。
403:基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
需要说明的,步骤401~步骤403的操作可以参见上述实施例中所述,在此不再重复赘述。
404:如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息。
可选地,该业务相关数据可以包括业务销量数据等。
例如,在实际应用中,该业务相关数据可以包括产品销售总量数据、销量最高产品、销量最高产品品牌或者销量最高产品类目等。
405:输出所述业务提示信息。
其中,所述业务提示信息可以用于提示用户所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据。从而方便用户基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,确定第一待识别对象与第二待识别对象的业务差距,从而可以制定业务策略。
在一个实际应用中,该第一待识别对象可以为来自第一网络平台的产品提供方,第二待识别对象可以为来自第二网络平台的产品提供方,该第一网络平台以及第二网络平台可以为不同的网上交易平台,第一待识别对象与第二待识别对象也即为同一经营者在不同网上交易平台中经营的店铺,通过输出业务提示信息,可以方便经营者了解其在不同网上交易平台中经营的店铺的业务差距,从而方便制定相应经营策略,例如可以基于业务较好的店铺的业务数据,调整业务较差的店铺的业务状态。
在某些实施例中,所述如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,输出业务提示信息包括:
如果所述第一待识别对象与所述第二待识别对象满足相似要求,比较所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据;
根据比较结果生成业务提示信息。
该业务提示信息中即可以包括该比较结果,从而可以方便了解第一待识别对象与第二待识别对象的业务差距,从而可以制定业务策略。
可选地,所述根据比较结果生成业务提示信息可以包括:
如果所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据的比较结果满足提示要求,生成业务提示信息。
例如该提示要求可以是所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据的数据差值超出预设数值。
例如业务相关数据为产品总销量数据时,可以在两个待识别对象的产品总销量数据相差较大时,生成业务提示信息,该业务提示信息中既可以包括所述第一待识别对象的业务相关数据、所述第二识别对象的业务相关数据以及所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据的差值,从而可以方便用户了解第一待识别对象与第二待识别对象的业务差距,从而可以制定业务策略。
可选地,所述输出所述业务提示信息可以包括:
向所述第一待识别对象对应客户端输出所述业务提示信息。
图5为本申请实施例提供的一种信息处理方法又一个实施例的流程图,该方法可以包括以下几个步骤:
501:针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据。
可选地,可以从基于第一网络平台爬取的网页数据中提取第一产品提供方对应的属性数据,以及从基于第二网络平台爬取的网页数据中提取第二产品提供方对应的属性数据。
502:基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度。
503:基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
需要说明的,步骤401~步骤403的操作可以参见上述实施例中所述,在此不再重复赘述。
504:如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
该对象提示信息可以提示用户在第二网络平台中增加该第一待识别对象。该对象提示信息可以包括该第一待识别对象的对象信息,例如待识别对象为产品提供方时,该对象信息可以包括提供方名称、经营产品、经营品牌等等。
在一个实际应用中,该第一网络平台以及第二网络平台可以为不同的网上交易平台,该第一待识别对象可以为来自第一网络平台的任一产品提供方,第二待识别对象可以为来自第二网络平台的任一产品提供方,如果确定第二网络平台中不存在与第一待识别对象满足相似要求的任意待识别对象,该对象提示信息可以提示用户在第二网络平台开设该第一待识别对象。可选地,该用户可以是指第一待识别对象的经营者,第一待识别对象为经营者在第一网络平台中开设的店铺,从而可以提示经营者在第二网络平台中开设同样店铺;当然,该用户也可以是指第二网络平台的维护人员,从而维护人员可以根据对象提示信息向该第一待识别对象的经营者进行平台推广,以招揽第一待识别对象的经营者在第二网络平台中开设店铺。
在某些实施例中,所述如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息可以包括:
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,判断所述第一待识别对象的业务相关数据是否满足业绩要求;
如果所述第一待识别对象的业务相关数据是否满足业绩要求,输出对象提示信息。
也即如果第一待识别对象的业务相关数据满足业绩要求时,在输出对象提示信息,以向第二网络平台推荐该第一待识别对象。
其中,业务相关数据例如可以是产品总销量数据,业绩要求可以为产品总销量数据大于预设数值等。
此外,输出对象提示信息可以是指通过显示设备输出对象提示信息,以向第二网络平台对应的用户展示所述对象提示信息等。
当然,也可以通过邮件、即时通信、短信等方式将对象提示信息推送至相应用户等。
图6为本申请实施例提供的一种信息处理装置一个实施例的结构示意图,该装置可以包括:
数据提取模块601,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块602,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块603,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
其中,作为一种可选方式,所述识别模块可以具体用于基于至少一个特征相似度,利用预先训练的分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
该分类模型预先训练获得,因此作为又一个实施例,如图7中所示,与图6所示的信息处理装置不同之处在于,该装置还可以包括:
样本获取模块701,用于针对所述至少一个特征属性,分别获取满足相似要求的任意两个样本对象各自对应的属性数据;
样本计算模块702,用于基于所述任意两个样本对象各自对应所述至少一个特征属性的属性数据,计算所述任意两个样本对象的至少一个特征相似度;
模型训练模块703,用于将所述任意两个样本对象的至少一个特征相似度作为训练样本,训练获得所述分类模型。
该识别模块603也即基于至少一个特征相似度,利用所述分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
作为另一种可选方式,所述识别模块可以具体用于:
分别确定所述至少一个特征属性的权重系数;
基于所述权重系数加权处理所述至少一个特征相似度,获得综合相似度;
基于所述综合相似度,识别所述第一待识别对象以及所述第二待识别对象是否满足相似要求。
在某些实施例中,所述计算模块可以具体用于:
针对任一特征属性,分别确定所述第一待识别对象对应的属性数据以及所述第二待识别对象对应的属性数据各自所属的数据集合;其中,每一数据集合保存同一特征属性对应的不同描述方式的属性数据;
将第一待识别对象对应的属性数据映射为其所属数据集合对应的转换数据,以及将第二待识别对象对应的属性数据映射为其所属数据集合对应的转换数据;
基于所述第一待识别对象对应的转换数据以及所述第二待识别对象对应的转换数据,计算所述第一待识别对象以及所述第二待识别对象对应所述任一特征属性的特征相似度。
在某些实施例中,所述数据提取模块可以具体用于:
针对至少一个特征属性,从基于第一网络平台爬取的网页数据中提取第一待识别对象对应的属性数据,以及从基于第二网络平台爬取的网页数据中提取第二待识别对象对应的属性数据。
在某些实施例中,待识别对象为产品提供方;所述至少一个特征属性至少包括提供方名、提供方位置、产品描述信息、产品价格、产品销量排名、经营类别、经营品牌和/或总销量。
所述计算模块可以包括:
名称相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据,计算所述第一待识别对象与所述第二待识别对象的名称相似度;
位置相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应提供方位置的属性数据,计算所述第一待识别对象与所述第二待识别对象的位置相似度;
描述相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象与所述第二待识别对象的描述相似度;
价格相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象与所述第二待识别对象的价格相似度;
排名相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象与所述第二待识别对象的排名相似度;
类别相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象与所述第二待识别对象的类别相似度;
品牌相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象与所述第二待识别对象的品牌相似度;
和/或,
销量相似度计算单元,用于基于所述第一待识别对象以及所述第二待识别对象各自对应总销量的属性数据,计算所述第一待识别对象与所述第二待识别对象的销量相似度。
其中,可选地,所述描述相似度计算单元可以具体用于:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象提供的任一产品的产品描述信息,与所述第二待识别对象提供的任一产品的产品描述信息的描述子相似度,以获得至少一个描述子相似度;
基于所述至少一个描述子相似度,计算获得描述相似度;
可选地,所述价格相似度计算单元可以具体用于:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象提供的任一产品的产品价格与所述第二待识别对象提供的任一产品的产品价格的价格子相似度,以获得至少一个价格子相似度;
基于所述至少一个价格子相似度,计算获得价格相似度;
可选地,所述排名相似度计算单元可以具体用于:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象提供的任一产品的产品销量排名,与所述第二待识别对象提供的任一产品的产品销量排名的排名子相似度,以获得至少一个排名子相似度;
基于所述至少一个排名子相似度,计算获得排名相似度;
所述类别相似度计算单元可以具体用于:
基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象的任一经营类别与所述第二待识别对象的任一经营类别的类别子相似度,以获得至少一个类别子相似度;
基于所述至少一个类别子相似度,计算获得类别相似度;
所述品牌相似度计算单元可以具体用于:
基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象的任一经营品牌与所述第二待识别对象的任一经营品牌的品牌子相似度,以获得至少一个品牌子相似度;
基于所述至少一个品牌子相似度,计算获得品牌相似度。
对于上述实施例中的信息处理装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
在一个可能的设计中,图6或图7所述实施例的信息处理装置可以实现为一计算设备,如8图中所示,该计算设备可以包括存储组件801以及处理组件802;
所述存储组件801存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件802调用执行。
所述处理组件802可以用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
其中,处理组件802可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
存储组件801被配置为存储各种类型的数据以支持在XX设备的操作。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
当然,计算设备必然还可以包括其他部件,例如输入/输出接口、通信组件等。
输入/输出接口为处理组件和外围接口模块之间提供接口,上述外围接口模块可以是输出设备、输入设备等。
通信组件被配置为便于计算设备和其他设备之间有线或无线方式的通信等。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现上述图1~图3任一实施例所述的信息处理方法。
图9为本申请实施例提供的一种信息处理装置又一个实施例的结构示意图,该装置可以包括:
数据提取模块901,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块902,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块903,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第一业务提示模块904,用于如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;输出所述业务提示信息。
在某些实施例中,所述第一业务提示模块如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息可以具体是:如果所述第一待识别对象与所述第二待识别对象满足相似要求,比较所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据;根据比较结果生成业务提示信息。
可选地,所述第一业务提示模块根据比较结果生成业务提示信息可以具体是如果所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据的比较结果满足提示要求,生成业务提示信息。
在某些实施例中,所述第一业务提示模块输出所述业务提示信息可以具体向所述第一待识别对象对应客户端输出所述业务提示信息。
在一个可能的设计中,图9所述实施例的信息处理装置可以实现为一计算设备,如10图中所示,该计算设备可以包括存储组件1001以及处理组件 1002;
所述存储组件1001存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件1002调用执行。
所述处理组件1002可以用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;
输出所述业务提示信息。
其中,处理组件1002可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
存储组件1001被配置为存储各种类型的数据以支持在XX设备的操作。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现上述图4所示实施例所述的信息处理方法。
图11为本申请实施例提供的一种信息处理装置又一个实施例的结构示意图,该装置可以包括:
数据提取模块1101,用于针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
计算模块1102,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块1103,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第二业务提示模块1104,用于如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
在某些实施例中,所述第二业务提示模块如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息可以具体是如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,判断所述第一待识别对象的业务相关数据是否满足业绩要求;如果所述第一待识别对象的业务相关数据是否满足业绩要求,输出对象提示信息。
在一个可能的设计中,图11所述实施例的信息处理装置可以实现为一计算设备,如12图中所示,该计算设备可以包括存储组件1201以及处理组件 1202;
所述存储组件1201存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件1202调用执行。
所述处理组件1202可以用于:
针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
其中,处理组件1202可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
存储组件1201被配置为存储各种类型的数据以支持在XX设备的操作。存储器可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被计算机执行时可以实现上述图5所示实施例所述的信息处理方法。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (21)

1.一种信息处理方法,其特征在于,包括:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
2.根据权利要求1所述的方法,其特征在于,所述基于至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求包括:
基于至少一个特征相似度,利用预先训练的分类模型识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
3.根据权利要求2所述的方法,其特征在于,所述分类模型按照如下方式预先训练获得:
针对所述至少一个特征属性,分别获取满足相似要求的任意两个样本对象各自对应的属性数据;
基于所述任意两个样本对象各自对应所述至少一个特征属性的属性数据,计算所述任意两个样本对象的至少一个特征相似度;
将所述任意两个样本对象的至少一个特征相似度作为训练样本,训练获得所述分类模型。
4.根据权利要求1所述的方法,其特征在于,所述基于至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求包括:
分别确定所述至少一个特征属性的权重系数;
基于所述权重系数加权处理所述至少一个特征相似度,获得综合相似度;
基于所述综合相似度,识别所述第一待识别对象以及所述第二待识别对象是否满足相似要求。
5.根据权利要求1所述的方法,其特征在于,所述基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度包括:
针对任一特征属性,分别确定所述第一待识别对象对应的属性数据以及所述第二待识别对象对应的属性数据各自所属的数据集合;其中,每一数据集合保存同一特征属性对应的不同描述方式的属性数据;
将第一待识别对象对应的属性数据映射为其所属数据集合对应的转换数据,以及将第二待识别对象对应的属性数据映射为其所属数据集合对应的转换数据;
基于所述第一待识别对象对应的转换数据以及所述第二待识别对象对应的转换数据,计算所述第一待识别对象以及所述第二待识别对象对应所述任一特征属性的特征相似度。
6.根据权利要求1所述的方法,其特征在于,所述针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据包括:
针对至少一个特征属性,从基于第一网络平台爬取的网页数据中提取第一待识别对象对应的属性数据,以及从基于第二网络平台爬取的网页数据中提取第二待识别对象对应的属性数据。
7.根据权利要求1所述的方法,其特征在于,待识别对象为产品提供方;所述至少一个特征属性至少包括提供方名称、提供方位置、产品描述信息、产品价格、产品销量排名、经营类别、经营品牌和/或总销量。
8.根据权利要求1所述的方法,其特征在于,所述基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应提供方名称的属性数据,计算所述第一待识别对象与所述第二待识别对象的名称相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应提供方位置的属性数据,计算所述第一待识别对象与所述第二待识别对象的位置相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象与所述第二待识别对象的描述相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象与所述第二待识别对象的价格相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象与所述第二待识别对象的排名相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象与所述第二待识别对象的类别相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象与所述第二待识别对象的品牌相似度;
和/或,
基于所述第一待识别对象以及所述第二待识别对象各自对应总销量的属性数据,计算所述第一待识别对象与所述第二待识别对象的销量相似度。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象与所述第二待识别对象的描述相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品描述信息的属性数据,计算所述第一待识别对象提供的任一产品的产品描述信息,与所述第二待识别对象提供的任一产品的产品描述信息的描述子相似度,以获得至少一个描述子相似度;
基于所述至少一个描述子相似度,计算获得描述相似度;
所述基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象与所述第二待识别对象的价格相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品价格的属性数据,计算所述第一待识别对象提供的任一产品的产品价格与所述第二待识别对象提供的任一产品的产品价格的价格子相似度,以获得至少一个价格子相似度;
基于所述至少一个价格子相似度,计算获得价格相似度;
所述基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象与所述第二待识别对象的排名相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应产品销量排名的属性数据,计算所述第一待识别对象提供的任一产品的产品销量排名,与所述第二待识别对象提供的任一产品的产品销量排名的排名子相似度,以获得至少一个排名子相似度;
基于所述至少一个排名子相似度,计算获得排名相似度;
所述基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象与所述第二待识别对象的类别相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应经营类别的属性数据,计算所述第一待识别对象的任一经营类别与所述第二待识别对象的任一经营类别的类别子相似度,以获得至少一个类别子相似度;
基于所述至少一个类别子相似度,计算获得类别相似度;
基于所述第一待识别对象以及所述第二待识别对象各自对应经营品牌的属性数据,计算所述第一待识别对象与所述第二待识别对象的品牌相似度包括:
基于所述第一待识别对象以及所述第二待识别对象各自对应经验品牌的属性数据,计算所述第一待识别对象的任一经营品牌与所述第二待识别对象的任一经营品牌的品牌子相似度,以获得至少一个品牌子相似度;
基于所述至少一个品牌子相似度,计算获得品牌相似度。
10.一种信息处理方法,其特征在于,包括:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;
输出所述业务提示信息。
11.根据权利要求10所述的方法,其特征在于,所述如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,输出业务提示信息包括:
如果所述第一待识别对象与所述第二待识别对象满足相似要求,比较所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据;
根据比较结果生成业务提示信息。
12.根据权利要求10所述的方法,其特征在于,所述输出所述业务提示信息包括:
向所述第一待识别对象对应客户端输出所述业务提示信息。
13.根据权利要求11所述的方法,其特征在于,所述根据比较结果生成业务提示信息包括:
如果所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据的比较结果满足提示要求,生成业务提示信息。
14.一种信息处理方法,其特征在于,包括:
针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
15.根据权利要求14所述的方法,其特征在于,所述如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息包括:
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,判断所述第一待识别对象的业务相关数据是否满足业绩要求;
如果所述第一待识别对象的业务相关数据是否满足业绩要求,输出对象提示信息。
16.一种信息处理装置,其特征在于,包括:
数据提取模块,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
17.一种信息处理装置,其特征在于,包括:
数据提取模块,用于针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第一业务提示模块,用于如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;输出所述业务提示信息。
18.一种信息处理装置,其特征在于,包括:
数据提取模块,用于针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
计算模块,用于基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
识别模块,用于基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
第二业务提示模块,用于如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
19.一种计算设备,其特征在于,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求。
20.一种计算设备,其特征在于,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,分别获取第一待识别对象以及第二待识别对象各自对应的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第一待识别对象与所述第二待识别对象满足相似要求,基于所述第一待识别对象的业务相关数据以及所述第二识别对象的业务相关数据,生成业务提示信息;
输出所述业务提示信息。
21.一种计算设备,其特征在于,包括存储组件以及处理组件;
所述存储组件存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理组件调用执行;
所述处理组件用于:
针对至少一个特征属性,从第一网络平台获取第一待识别对象的属性数据以及从第二网络平台获取第二待识别对象的属性数据;
基于所述第一待识别对象以及所述第二待识别对象各自对应所述至少一个特征属性的属性数据,计算所述第一待识别对象与所述第二待识别对象的至少一个特征相似度;
基于所述至少一个特征相似度,识别所述第一待识别对象与所述第二待识别对象是否满足相似要求;
如果所述第二网络平台中不存在与所述第一待识别对象满足相似要求的任意待识别对象,输出对象提示信息。
CN201810416053.XA 2018-05-03 2018-05-03 信息处理方法、装置及计算设备 Pending CN110443663A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810416053.XA CN110443663A (zh) 2018-05-03 2018-05-03 信息处理方法、装置及计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810416053.XA CN110443663A (zh) 2018-05-03 2018-05-03 信息处理方法、装置及计算设备

Publications (1)

Publication Number Publication Date
CN110443663A true CN110443663A (zh) 2019-11-12

Family

ID=68427819

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810416053.XA Pending CN110443663A (zh) 2018-05-03 2018-05-03 信息处理方法、装置及计算设备

Country Status (1)

Country Link
CN (1) CN110443663A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930826A (zh) * 2020-07-16 2020-11-13 深圳市富途网络科技有限公司 软件界面的订单生成方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740380A (zh) * 2016-01-27 2016-07-06 北京邮电大学 数据融合方法及系统
CN106981005A (zh) * 2017-02-14 2017-07-25 玖壹富瑞(北京)科技有限公司 一种用于电子商务平台的数据采集系统
US20170236183A1 (en) * 2016-02-11 2017-08-17 Ebay Inc. System and method for detecting visually similar items
CN107451881A (zh) * 2017-06-22 2017-12-08 北京小度信息科技有限公司 信息获取方法及装置
CN107644364A (zh) * 2017-09-18 2018-01-30 北京京东尚科信息技术有限公司 对象过滤方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740380A (zh) * 2016-01-27 2016-07-06 北京邮电大学 数据融合方法及系统
US20170236183A1 (en) * 2016-02-11 2017-08-17 Ebay Inc. System and method for detecting visually similar items
CN106981005A (zh) * 2017-02-14 2017-07-25 玖壹富瑞(北京)科技有限公司 一种用于电子商务平台的数据采集系统
CN107451881A (zh) * 2017-06-22 2017-12-08 北京小度信息科技有限公司 信息获取方法及装置
CN107644364A (zh) * 2017-09-18 2018-01-30 北京京东尚科信息技术有限公司 对象过滤方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111930826A (zh) * 2020-07-16 2020-11-13 深圳市富途网络科技有限公司 软件界面的订单生成方法及系统

Similar Documents

Publication Publication Date Title
CN110060090A (zh) 推荐商品组合的方法、装置、电子设备及可读存储介质
CN107918905A (zh) 异常交易识别方法、装置及服务器
CN108960992A (zh) 一种信息推荐方法以及相关设备
CN107590688A (zh) 目标客户的识别方法及终端设备
CN108389073A (zh) 商品售价的自动计算方法及系统、电子设备及存储介质
CN110163647A (zh) 一种数据处理方法及装置
CN107730311A (zh) 一种推荐信息的推送方法、装置及服务器
CN109840730B (zh) 用于数据预测的方法及装置
CN107808314B (zh) 用户推荐方法及装置
CN112288517A (zh) 结合rpa与ai的商品推荐方法和装置
CN107093091B (zh) 一种数据处理方法和装置
CN112232915A (zh) 结合rpa与ai的商品推荐方法和装置
CN108021708A (zh) 内容推荐方法、装置与计算机可读存储介质
KR102109338B1 (ko) 고객 맞춤형 의류 분석 및 추천 시스템
CN109272009A (zh) 一种基于大数据分析的人群画像提取方法及装置
CN112232880A (zh) 结合rpa与ai的商品推荐方法和装置
CN110322093A (zh) 信息处理方法、信息显示方法、装置及计算设备
CN115391669B (zh) 一种智能推荐方法、装置、电子设备
CN110134783A (zh) 个性化推荐的方法、装置、设备和介质
CN107016398A (zh) 数据处理方法及装置
CN111192161A (zh) 电力市场交易对象推荐方法、装置
CN109063120A (zh) 一种基于聚类的协同过滤推荐方法和装置
CN110427545B (zh) 一种信息推送方法及系统
CN107016583A (zh) 数据处理方法及装置
US20210090105A1 (en) Technology opportunity mapping

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20191112