CN103942698A - 一种产品信息对比方法及装置 - Google Patents

一种产品信息对比方法及装置 Download PDF

Info

Publication number
CN103942698A
CN103942698A CN201410161959.3A CN201410161959A CN103942698A CN 103942698 A CN103942698 A CN 103942698A CN 201410161959 A CN201410161959 A CN 201410161959A CN 103942698 A CN103942698 A CN 103942698A
Authority
CN
China
Prior art keywords
data
server
target
product
data acquisition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410161959.3A
Other languages
English (en)
Inventor
才连杰
申芙蓉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING LIANJIA ZHONGYING NETWORK TECHNOLOGY CO., LTD.
Original Assignee
Beijing Connection Time-Space Network Communication Facilities Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Connection Time-Space Network Communication Facilities Co Ltd filed Critical Beijing Connection Time-Space Network Communication Facilities Co Ltd
Priority to CN201410161959.3A priority Critical patent/CN103942698A/zh
Publication of CN103942698A publication Critical patent/CN103942698A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种产品信息的比对方法及装置,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该方法包括:获取目标产品标识,并在所述第一服务器中获取与所述目标产品标识对应的第一数据集合,依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器,并获取所述第二服务器中与所述目标产品标识对应的第二数据集合,依据预设比对规则,比对所述第一数据集合与所述第二数据集合,获得两者之间的不同数据。应用本申请提供的方法,从技术的角度实现了对产品信息的比对,从而有效地提高了人工进行产品信息对比的效率。

Description

一种产品信息对比方法及装置
技术领域
本申请涉及网络访问技术领域,尤其是一种产品信息对比方法及装置。
背景技术
当今,随着电子商务的发展,已经有越来越多的供应商将产品在网站上进行展示,以供消费者浏览及购买。所述产品网站营销模式中,网站服务器需要预先存储有产品信息。用户发送某一产品的查询请求后,需要在多个网站服务器上查找与该产品相对应的产品信息,查询效率较低。
因此,可设置备份服务器,该备份服务器上存储有多个网站服务器上的所有产品的产品信息。当接收到用户的查询请求时,在该备份服务器上进行产品信息的查询可有效提高信息获取效率。备份服务器可以有效解决产品信息获取效率低的问题,然而为了实现上述目的,同时还需要保证备份服务器上的产品信息与所述各个网站服务器上的产品信息具有一致性,因此需要将备份服务器上的产品信息与所述各个网站服务器上的产品信息进行对比。
目前,主要依赖人工进行产品数据的对比,还没有形成一种对产品信息进行比对的技术方案。
发明内容
有鉴于此,本申请提供了一种产品信息对比方法及装置,用以解决现有技术中还没有形成一种对产品信息进行比对的方案的技术问题。本申请提供的技术方案如下:
一种产品信息对比方法,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该方法包括:
步骤A:获取目标产品标识;
步骤B:在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据;
步骤C:依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器;
步骤D:获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据;
步骤E:依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
上述方法,优选的,所述步骤A包括:
接收用户输入的目标产品标识;
或,
接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
上述方法,优选的,所述步骤B中获取到的第一数据集合中包含有与所述目标产品标识对应的第二服务器标识;
其中,所述步骤C包括:
依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识;
将查找到的所述服务器标识确定为第二服务器。
上述方法,优选的,预先设置有与所述第二服务器对应的至少一个目标属性数据标识;
其中,所述步骤E包括:
步骤E1:在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据;
步骤E2:依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
上述方法,优选的,所述步骤E2中的预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应;
其中,所述步骤E2包括:
分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型;
依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法;
依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
本申请还提供了一种产品信息对比装置,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该装置包括:
模块A,用于获取目标产品标识;
模块B,用于在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据;
模块C,用于依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器;
模块D,用于获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据;
模块E,用于依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
上述装置,优选的,所述模块A包括:第一获取子模块及第二获取子模块;
第一获取子模块,用于接收用户输入的目标产品标识;
第二获取子模块,用于接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
上述装置,优选的,所述模块B获取到的第一数据集合中包含有与所述目标产品标识对应的第二服务器标识;
其中,所述模块C包括:
服务器标识查找子模块,用于依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识;
第二服务器确定子模块,用于将查找到的所述服务器标识确定为第二服务器。
上述装置,优选的,还包括:
模块F,用于预先设置与所述第二服务器对应的至少一个目标属性数据标识;
其中,所述模块E包括:
模块E1,用于在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据;
模块E2,用于依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
上述装置,优选的,所述模块E2依据的预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应;
其中,所述模块E2包括:
目标数据类型确定子模块,用于分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型;
目标比对算法确定子模块,用于依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法;
目标属性数据区分子模块,用于依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
由以上的技术方案可知,本申请提供了一种产品信息的比对方法及装置,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该方法包括获取目标产品标识,并在所述第一服务器中获取与所述目标产品标识对应的第一数据集合,依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器,并获取所述第二服务器中与所述目标产品标识对应的第二数据集合,依据预设比对规则,比对所述第一数据集合与所述第二数据集合,获得两者之间的不同数据,从而从技术的角度实现了对产品信息的比对,有效地提高了人工进行产品信息对比的效率。
附图说明
图1为本申请提供的一种产品信息对比方法实施例一的流程图;
图2为本申请提供的一种产品信息对比方法实施例二的流程图;
图3为本申请提供的一种产品信息对比方法实施例三的流程图;
图4为本申请提供的一种产品信息对比方法实施例四的部分流程图;
图5为本申请提供的一种产品信息对比装置实施例一的结构示意图;
图6为本申请提供的一种产品信息对比装置实施例二的结构示意图;
图7为本申请提供的一种产品信息对比装置实施例三的结构示意图;
图8为本申请提供的一种产品信息对比装置实施例四的部分结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
方法实施例一:
请参阅图1,其示出了本申请提供的一种产品信息对比方法实施例一的流程图,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施例可以包括:
步骤101:获取目标产品标识。
其中,所述目标产品标识用来对产品进行标识,各个产品网站上展示的各个产品均具有唯一的标识,例如,39019432101,是当当网进行展示的一个鞋子产品。
步骤102:在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
其中,所述获取过程可以是:依据预设网址生成规则,将所述目标产品标识生成第一网址,其中,所述第一网址是所述第一服务器的标识;向所述第一网址发送数据请求,触发所述第一网址对应的第一服务器返回第一数据集合。所述第一数据集合可以是第一服务器生成的与该产品标识对应的html源代码,该源代码中包含有产品的各项属性数据,例如名称、供应商、详情文字、图片说明、库存量等。
需要说明的是,所述第一服务器即是包含有各个网站服务器上各个产品信息的备份服务器,该第一服务器是可以确定的,因此,所述预设网址生成规则中包含有所述第一服务器的名称,并且包含有产品标识。
例如,第一服务器为uni2uni(联嘉云集团)服务器,所述预设网址生成规则为http://product.uni2uni.com/产品标识.shtml。进一步的,若所述目标产品标识为39019432101,则所述第一网址为http://product.uni2uni.com/39019432101.shtml。
步骤103:依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器。
其中,所述各个第二服务器为展示产品信息的各个网站服务器。所述目标产品标识是唯一的,其所述对应的第二服务器也是唯一的,且产品标识与第二服务器之间具有预先设置的对应关系。依据所述对应关系,确定与步骤101中获取到的产品标识对应的第二服务器,例如,所述目标产品标识为39019432101,与该产品标识对应的第二服务器为当当网服务器。
步骤104:获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
其中,所述获取第二数据集合的过程,可以是向所述第二服务器发送网页请求,其中,所述网页请求中包含有产品标识,触发所述第二服务器返回与所述目标产品标识对应的第二数据集合,其中,所述第二数据集合为网页源代码,例如html源码。另外,所述获取第二数据集合的过程,还可以是,利用所述第二服务器提供的web接口,即向所述web接口发送与所述web接口对应的http请求,触发所述web接口返回第二数据集合。当然,还可以是两种方式的结合。
步骤105:依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
需要说明的是,该实施例一的步骤101、步骤102、步骤103、步骤104及步骤105分别与权利要求1中的步骤A、步骤B、步骤C、步骤D及步骤E相对应。
需要说明的是,所述比对过程,可以是将第一数据集合作为标准,判断第二数据集合中的属性数据比所述第一数据集合中的属性数据多出或缺少的数据;也可以是将所述第二数据集合作为标准,判断第一数据集合中的属性数据比所述第二数据集合中的属性数据多出或缺少的数据。
其中,所述预设比对规则,可以是将所述第一数据集合与所述第二数据集合进行整体对比,还可以是在所述两个数据集合中获取某部分目标数据进行比对。或者,所述预设比对规则,可以是将数据进行类型划分,依据数据类型分别进行对比。
由以上的技术方案可知,本实施例提供了一种产品信息的比对方法,该方法应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该方法包括获取目标产品标识,并在所述第一服务器中获取与所述目标产品标识对应的第一数据集合,依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器,并获取所述第二服务器中与所述目标产品标识对应的第二数据集合,依据预设比对规则,比对所述第一数据集合与所述第二数据集合,获得两者之间的不同数据,从而从技术的角度实现了对产品信息的比对,有效地提高了人工进行产品信息对比的效率。
另外,人工进行产品信息的对比效率较低,花费的时间较长,则对比的产品数量较少,而本申请实施例能实现装置自动对产品信息对比,效率高,比对的产品数量大,产品覆盖度高。
需要说明的是,上述方法实施例一中的步骤101获取目标产品标识可以通过以下方式实现:
接收用户输入的目标产品标识;
或,
接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
其中,所述关键字可以为产品的种类信息,例如,鞋子、衣服。所述搜索引擎可以返回JSON对象的数据,所述JSON对象中可以包含有至少一个列表,所述列表中包含有网站服务器中存储的与所述关键字对应的产品的产品标识,从所述JSON对象中提取产品标识。
方法实施例二:
上述方法实施例一中的第一数据集合中包含有与步骤101获取到的产品标识对应的第二服务器标识,请参阅图2,其示出了本申请提供的一种产品信息对比方法实施例二的流程图,本实施例应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施可以包括:
步骤201:获取目标产品标识。
步骤202:在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
步骤203:依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识。
其中,所述第一数据集合为第一服务器返回的网页源代码,例如,html源代码,所述网页源代码中包含有与产品标识对应的第二服务器标识。所述第一数据集合中包含有与步骤101获取到的产品标识对应的第二服务器标识,例如,所述目标产品标识为39019432101,与所述目标产品标识对应的第二服务器标识为当当网服务器。利用正则表达式,在所述网页源代码中查找第二服务器标识。
步骤204:将查找到的所述服务器标识确定为第二服务器。
步骤205:获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
步骤206:依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
其中,本实施例中的步骤201、步骤202、步骤205及步骤206分别与方法实施例一中步骤101、步骤102、步骤104及步骤105相同,在此不做赘述。
方法实施例三:
预先设置有与所述第二服务器对应的至少一个目标属性数据标识,具体的,可以是预先设置与第二服务器对应的配置文件,所述配置文件中包含有与第二服务器对应的至少一个目标属性数据标识,请参见图3,其示出了本申请提供的一种产品信息对比方法实施例三的流程图,本实施例应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施可以包括:
步骤301:获取目标产品标识。
步骤302:在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
步骤303:依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器。
步骤304:获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
步骤305:在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据。
其中,所述配置文件中包含有与所述第二服务器对应的目标属性数据标识,例如,所述第二服务器为当当网服务器,与当当网服务器对应的目标属性数据标识为产品名称、供应商名称、文字说明、产品图片、库存量、价格。
对所述目标属性数据标识及对应的第一目标属性数据进行举例。例如,产品名称为:特步沙滩休闲鞋,供应商为:当当网,文字说明为:品牌xtep/特步沙滩休闲鞋轻松体验一夏天的凉爽,产品图片为:9张(具体图片略)北京库存量:有货,北京价格39。
依据所述目标属性数据标识,提取所述第一目标属性数据及所述第二目标属性数据为所述目标属性数据标识对应的数据值。例如,目标属性数据标识为产品名称,第一目标属性数据为:特步沙滩休闲鞋,第二目标属性数据为:特步轻松休闲凉拖。
步骤306:依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
其中,所述预设比对规则为,将同一目标属性数据标识对应的第一目标属性数据与第二目标属性数据进行对比,例如,目标属性数据标识为价格,第一目标属性数据为39,第二目标属性数据为35,将39与35对比。
需要说明的是,所述第一目标属性数据与所述第二目标属性数据可以是一个,也可以是多个,具体情况由与第二服务器对应的配置文件中包含的目标属性数据标识的个数决定。另外,需要说明的是,该实施例三中的步骤305及步骤306分别与权利要求4中的步骤E1及E2相对应。
方法实施例四:
所述预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应,请参阅图4,其示出了本申请提供的一种产品信息对比方法实施例四的部分流程图,上述方法实施例三的步骤306可以通过以下步骤实现:
步骤401:分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型。
其中,所述数据类型例如字符串数据、数值数据、图片数据。所述比对算法与数据类型对应,例如,字符串数据、数值数据直接进行内容对比,图片数据需要利用MD5算法(Message-Digest Algorithm5,信息-摘要算法5)计算图片的MD5值,两张图片的MD5值不同,可以获知图片存在不同。
其中,所述第一目标属性数据及所述第二目标属性数据具有各自对应的目标数据类型,例如,产品名称、供应商名称、文字说明为字符串数据类型;产品图片为图片数据类型;库存量、价格为数值数据类型。
步骤402:依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法。
例如,产品名称为字符串数据类型,与字符串数据类型对应的目标比对算法为内容对比,则将产品名称直接进行内容对比。
步骤403:依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
其中,所述不同数据可以包括:不同的目标属性数据标识及其对应的第一目标属性数据及第二目标属性数据,例如,北京价格、39、35;还可以包括多出或缺少的内容,例如,产品图片多出两张,且将所述两张图片进行显示。
装置实施例一:
请参阅图5,其示出了本申请提供的一种产品信息对比装置实施例一的结构示意图,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施例可以包括:产品标识获取模块501、第一集合获取模块502、第二服务器确定模块503、第二集合获取模块504及产品信息比对模块505。其中:
所述产品标识获取模块501,用于获取目标产品标识。
其中,所述目标产品标识用来对产品进行标识,各个产品网站上展示的各个产品均具有唯一的标识,例如,39019432101,是当当网进行展示的一个鞋子产品。
所述第一集合获取模块502,用于在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
其中,所述第一集合获取模块502获取过程可以是:依据预设网址生成规则,将所述目标产品标识生成第一网址,其中,所述第一网址是所述第一服务器的标识;向所述第一网址发送数据请求,触发所述第一网址对应的第一服务器返回第一数据集合。所述第一数据集合可以是第一服务器生成的与该产品标识对应的html源代码,该源代码中包含有产品的各项属性数据,例如名称、供应商、详情文字、图片说明、库存量等。
需要说明的是,本装置实施例应用于第一服务器,是指,本装置实施例可以与所述第一服务器相连,用于将所述第一服务器中存储的产品信息与所述第二服务器上存储的产品信息进行比对。第一服务器即是包含有各个网站服务器上各个产品信息的备份服务器,该第一服务器是可以确定的,因此,所述预设网址生成规则中包含有所述第一服务器的名称,并且包含有产品标识。
例如,第一服务器为uni2uni(联嘉云集团)服务器,所述预设网址生成规则为http://product.uni2uni.com/产品标识.shtml。进一步的,若所述目标产品标识为39019432101,则所述第一网址为http://product.uni2uni.com/39019432101.shtml。
所述第二服务器确定模块503,用于依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器。
其中,所述各个第二服务器为展示产品信息的各个网站服务器。所述目标产品标识是唯一的,其所述对应的第二服务器也是唯一的,且产品标识与第二服务器之间具有预先设置的对应关系。所述第二服务器确定模块503依据所述对应关系,确定与产品标识获取模块501获取到的产品标识对应的第二服务器,例如,所述目标产品标识为39019432101,与该产品标识对应的第二服务器为当当网服务器。
所述第二集合获取模块504,用于获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
其中,所述第二集合获取模块504获取第二数据集合的过程,可以是向所述第二服务器发送网页请求,其中,所述网页请求中包含有产品标识,触发所述第二服务器返回与所述目标产品标识对应的第二数据集合,其中,所述第二数据集合为网页源代码,例如html源码。另外,所述获取第二数据集合的过程,还可以是,利用所述第二服务器提供的web接口,即向所述web接口发送与所述web接口对应的http请求,触发所述web接口返回第二数据集合。当然,还可以是两种方式的结合。
所述产品信息比对模块505,用于依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
需要说明的是,所述产品信息比对模块505比对过程,可以是将第一数据集合作为标准,判断第二数据集合中的属性数据比所述第一数据集合中的属性数据多出或缺少的数据;也可以是将所述第二数据集合作为标准,判断第一数据集合中的属性数据比所述第二数据集合中的属性数据多出或缺少的数据。
其中,所述预设比对规则,可以是将所述第一数据集合与所述第二数据集合进行整体对比,还可以是在所述两个数据集合中获取某部分目标数据进行比对。或者,所述预设比对规则,可以是将数据进行类型划分,依据数据类型分别进行对比。
需要说明的是,本装置实施例一中的模块501、模块502、模块503、模块504及模块501分别权利要求6中的模块A、模块B、模块C、模块D及模块E相对应。
由以上的技术方案可知,本装置实施例一提供了一种产品信息的比对装置,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该装置通过获取目标产品标识,并在所述第一服务器中获取与所述目标产品标识对应的第一数据集合,依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器,并获取所述第二服务器中与所述目标产品标识对应的第二数据集合,依据预设比对规则,比对所述第一数据集合与所述第二数据集合,获得两者之间的不同数据,从而从技术的角度实现了对产品信息的比对,有效地提高了人工进行产品信息对比的效率。
另外,人工进行产品信息的对比效率较低,花费的时间较长,则对比的产品数量较少,而本申请实施例能实现装置自动对产品信息对比,效率高,比对的产品数量大,产品覆盖度高。
需要说明的是,上述装置实施例一中的产品标识获取模块501可以通过以下方式实现:第一获取子模块及第二获取子模块。其中:
所述第一获取子模块,用于接收用户输入的目标产品标识;
所述第二获取子模块,用于接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
其中,所述关键字可以为产品的种类信息,例如,鞋子、衣服。所述搜索引擎可以返回JSON对象的数据,所述JSON对象中可以包含有至少一个列表,所述列表中包含有网站服务器中存储的与所述关键字对应的产品的产品标识,从所述JSON对象中提取产品标识。
需要说明的是,所述第一获取子模块与所述第二获取子模块并非同时执行工作,可以是某一个子模块单独执行获取目标产品标识。
装置实施例二:
上述装置实施例一中第一集合获取模块获取到的第一数据集合中包含有与所述目标产品标识对应的第二服务器标识,请参阅图6,其示出了本申请提供的一种产品信息对比装置实施例二的结构示意图图,本实施例应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施可以包括:产品标识获取模块601、第一集合获取模块602、服务器标识查找子模块603、第二服务器确定子模块604、第二集合获取模块605及产品信息比对模块606。
所述产品标识获取模块601,用于获取目标产品标识。
所述第一集合获取模块602,用于在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
所述服务器标识查找子模块603,用于依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识。
其中,所述第一数据集合为第一服务器返回的网页源代码,例如,html源代码,所述网页源代码中包含有与产品标识对应的第二服务器标识。所述第一数据集合中包含有与产品标识获取模块601获取到的产品标识对应的第二服务器标识,例如,所述目标产品标识为39019432101,与所述目标产品标识对应的第二服务器标识为当当网服务器。所述服务器标识查找子模块603利用正则表达式,在所述网页源代码中查找第二服务器标识。
所述第二服务器确定子模块604,用于将查找到的所述服务器标识确定为第二服务器。
所述第二集合获取模块605,用于获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
所述产品信息比对模块606,用于依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
其中,本实施例中的模块601、模块602、模块605及模块606分别与装置实施例一中模块501、模块502、模块504及模块505相同,在此不做赘述。
装置实施例三:
请参见图7,在上述装置实施例一的基础上,还可以包括目标属性数据设置模块701,用于预先设置有与所述第二服务器对应的至少一个目标属性数据标识,具体的,可以是目标属性数据设置模块701预先设置与第二服务器对应的配置文件,所述配置文件中包含有与第二服务器对应的至少一个目标属性数据标识,如图7所示,其示出了本申请提供的一种产品信息对比装置实施例三的结构示意图,本实施例应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,本实施可以包括:产品标识获取模块702、第一集合获取模块703、第二服务器确定模块704、第二集合获取模块705、目标属性数据提取子模块706及目标属性数据比对子模块707。其中:
所述产品标识获取模块702,用于获取目标产品标识。
所述第一集合获取模块703,用于在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据。
所述第二服务器确定模块704,用于依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器。
所述第二集合获取模块705,用于获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据。
所述目标属性数据提取子模块706,用于在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据。
其中,所述目标属性数据设置模块701可以设置配置文件,所述配置文件中包含有与所述第二服务器对应的目标属性数据标识,例如,所述第二服务器为当当网服务器,与当当网服务器对应的目标属性数据标识为产品名称、供应商名称、文字说明、产品图片、库存量、价格。
对所述目标属性数据标识及对应的第一目标属性数据进行举例。例如,产品名称为:特步沙滩休闲鞋,供应商为:当当网,文字说明为:品牌xtep/特步沙滩休闲鞋轻松体验一夏天的凉爽,产品图片为:9张(具体图片略)北京库存量:有货,北京价格39。
所述目标属性数据提取子模块706依据所述目标属性数据标识,提取所述第一目标属性数据及所述第二目标属性数据为所述目标属性数据标识对应的数据值。例如,目标属性数据标识为产品名称,第一目标属性数据为:特步沙滩休闲鞋,第二目标属性数据为:特步轻松休闲凉拖。
所述目标属性数据比对子模块707,用于依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
其中,所述预设比对规则为,将同一目标属性数据标识对应的第一目标属性数据与第二目标属性数据进行对比,例如,目标属性数据标识为价格,第一目标属性数据为39,第二目标属性数据为35,将39与35对比。
需要说明的是,所述第一目标属性数据与所述第二目标属性数据可以是一个,也可以是多个,具体情况由与第二服务器对应的配置文件中包含的目标属性数据标识的个数决定。
需要说明的是,本装置实施例三中的模块701与权利要求9中的模块F相对应;且模块706及模块707分别与该权利要求9中的模块E1及E2相对应。
装置实施例四:
所述目标属性数据比对子模块依据的预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应,请参阅图8,其示出了本申请提供的一种产品信息对比装置实施例四的部分结构示意图,上述装置实施例三的目标属性数据比对子模块707可以通过以下方式实现:目标数据类型确定子模块801、目标比对算法确定子模块802及目标属性数据区分子模块803。其中:
所述目标数据类型确定子模块801,用于分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型。
其中,所述数据类型例如字符串数据、数值数据、图片数据。所述比对算法与数据类型对应,例如,字符串数据、数值数据直接进行内容对比,图片数据需要利用MD5算法(Message-Digest Algorithm5,信息-摘要算法5)计算图片的MD5值,两张图片的MD5值不同,可以获知图片存在不同。
其中,所述第一目标属性数据及所述第二目标属性数据具有各自对应的目标数据类型,例如,产品名称、供应商名称、文字说明为字符串数据类型;产品图片为图片数据类型;库存量、价格为数值数据类型。
所述目标比对算法确定子模块802,用于依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法。
例如,产品名称为字符串数据类型,与字符串数据类型对应的目标比对算法为内容对比,则将产品名称直接进行内容对比。
所述目标属性数据区分子模块803,用于依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
其中,所述不同数据可以包括:不同的目标属性数据标识及其对应的第一目标属性数据及第二目标属性数据,例如,北京价格、39、35;还可以包括多出或缺少的内容,例如,产品图片多出两张,且将所述两张图片进行显示。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种产品信息对比方法,其特征在于,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该方法包括:
步骤A:获取目标产品标识;
步骤B:在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据;
步骤C:依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器;
步骤D:获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据;
步骤E:依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
2.根据权利要求1所述的方法,其特征在于,所述步骤A包括:
接收用户输入的目标产品标识;
或,
接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
3.根据权利要求1所述的方法,其特征在于,所述步骤B中获取到的第一数据集合中包含有与所述目标产品标识对应的第二服务器标识;
其中,所述步骤C包括:
依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识;
将查找到的所述服务器标识确定为第二服务器。
4.根据权利要求1所述的方法,其特征在于,预先设置有与所述第二服务器对应的至少一个目标属性数据标识;
其中,所述步骤E包括:
步骤E1:在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据;
步骤E2:依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
5.根据权利要求4所述的方法,其特征在于,所述步骤E2中的预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应;
其中,所述步骤E2包括:
分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型;
依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法;
依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
6.一种产品信息对比装置,其特征在于,应用于第一服务器,所述第一服务器中存储有多个第一数据集合,各个所述第一数据集合分别与一产品标识对应,该装置包括:
模块A,用于获取目标产品标识;
模块B,用于在所述第一服务器中获取与所述目标产品标识对应的第一数据集合;其中,所述第一数据集合中包含有与所述目标产品标识对应的产品的至少一项第一属性数据;
模块C,用于依据预设的产品标识与第二服务器的对应关系,确定与所述目标产品标识对应的第二服务器;
模块D,用于获取所述第二服务器中与所述目标产品标识对应的第二数据集合;其中,所述第二数据集合中包含有与所述目标产品标识对应的产品的至少一项第二属性数据;
模块E,用于依据预设比对规则,比对所述第一数据集合与所述第二数据集合,从而获得两者之间的不同数据。
7.根据权利要求6所述的装置,其特征在于,所述模块A包括:第一获取子模块及第二获取子模块;
第一获取子模块,用于接收用户输入的目标产品标识;
第二获取子模块,用于接收用户输入的关键字,调用搜索引擎接口,触发所述搜索引擎查找并返回与所述关键字对应的目标产品标识,接收所述搜索引擎返回的产品标识。
8.根据权利要求6所述的装置,其特征在于,所述模块B获取到的第一数据集合中包含有与所述目标产品标识对应的第二服务器标识;
其中,所述模块C包括:
服务器标识查找子模块,用于依据正则表达式,在所述第一数据集合中查找与所述目标产品标识对应的服务器标识;
第二服务器确定子模块,用于将查找到的所述服务器标识确定为第二服务器。
9.根据权利要求6所述的装置,其特征在于,还包括:
模块F,用于预先设置与所述第二服务器对应的至少一个目标属性数据标识;
其中,所述模块E包括:
模块E1,用于在所述第一数据集合提取与所述目标属性数据标识对应的第一目标属性数据,并在所述第二数据集合中提取与所述目标属性数据标识对应的第二目标属性数据;
模块E2,用于依据预设比对规则,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
10.根据权利要求9所述的装置,其特征在于,所述模块E2依据的预设对比规则中包含有至少一个比对算法,所述比对算法与数据类型相对应;
其中,所述模块E2包括:
目标数据类型确定子模块,用于分别确定所述第一目标属性数据及所述第二目标属性数据的目标数据类型;
目标比对算法确定子模块,用于依据比对算法与数据类型的对应关系,确定所述目标数据类型对应的目标比对算法;
目标属性数据区分子模块,用于依据所述目标比对算法,比对所述第一目标属性数据与所述第二目标属性数据,从而获得所述第一数据集合与所述第二数据集合之间的不同数据。
CN201410161959.3A 2014-04-22 2014-04-22 一种产品信息对比方法及装置 Pending CN103942698A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410161959.3A CN103942698A (zh) 2014-04-22 2014-04-22 一种产品信息对比方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410161959.3A CN103942698A (zh) 2014-04-22 2014-04-22 一种产品信息对比方法及装置

Publications (1)

Publication Number Publication Date
CN103942698A true CN103942698A (zh) 2014-07-23

Family

ID=51190355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410161959.3A Pending CN103942698A (zh) 2014-04-22 2014-04-22 一种产品信息对比方法及装置

Country Status (1)

Country Link
CN (1) CN103942698A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105635257A (zh) * 2015-12-24 2016-06-01 福建天泉教育科技有限公司 自动检测数据更新的方法及系统
CN105843972A (zh) * 2016-06-13 2016-08-10 北京京东尚科信息技术有限公司 产品属性信息的比对方法及装置
CN107798616A (zh) * 2017-03-14 2018-03-13 平安科技(深圳)有限公司 一种产品差异信息显示方法和装置
CN108021952A (zh) * 2017-12-29 2018-05-11 广州品唯软件有限公司 一种多格式文本对比方法及装置
CN114004583A (zh) * 2021-10-18 2022-02-01 苏州浪潮智能科技有限公司 部件信息处理方法、装置、计算机设备和存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006535A1 (en) * 2007-06-29 2009-01-01 Symantec Corporation Techniques For Performing Intelligent Content Indexing
CN101667179A (zh) * 2008-09-03 2010-03-10 华为技术有限公司 移动搜索方法及其系统、搜索服务器同步搜索能力的方法
CN102857570A (zh) * 2012-09-13 2013-01-02 清华大学 文件的云同步方法及云存储服务器
CN102968415A (zh) * 2011-08-31 2013-03-13 阿里巴巴集团控股有限公司 移动搜索方法及装置
CN103049525A (zh) * 2012-12-20 2013-04-17 北京百度网讯科技有限公司 一种用于提供对象相关信息的方法和装置
CN103365893A (zh) * 2012-03-31 2013-10-23 百度在线网络技术(北京)有限公司 一种用于实现搜索用户的个体信息的方法和设备
CN103389985A (zh) * 2012-05-08 2013-11-13 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法和设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090006535A1 (en) * 2007-06-29 2009-01-01 Symantec Corporation Techniques For Performing Intelligent Content Indexing
CN101667179A (zh) * 2008-09-03 2010-03-10 华为技术有限公司 移动搜索方法及其系统、搜索服务器同步搜索能力的方法
CN102968415A (zh) * 2011-08-31 2013-03-13 阿里巴巴集团控股有限公司 移动搜索方法及装置
CN103365893A (zh) * 2012-03-31 2013-10-23 百度在线网络技术(北京)有限公司 一种用于实现搜索用户的个体信息的方法和设备
CN103389985A (zh) * 2012-05-08 2013-11-13 百度在线网络技术(北京)有限公司 一种用于提供搜索结果的方法和设备
CN102857570A (zh) * 2012-09-13 2013-01-02 清华大学 文件的云同步方法及云存储服务器
CN103049525A (zh) * 2012-12-20 2013-04-17 北京百度网讯科技有限公司 一种用于提供对象相关信息的方法和装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105635257A (zh) * 2015-12-24 2016-06-01 福建天泉教育科技有限公司 自动检测数据更新的方法及系统
CN105843972A (zh) * 2016-06-13 2016-08-10 北京京东尚科信息技术有限公司 产品属性信息的比对方法及装置
CN105843972B (zh) * 2016-06-13 2020-05-01 北京京东尚科信息技术有限公司 产品属性信息的比对方法及装置
CN107798616A (zh) * 2017-03-14 2018-03-13 平安科技(深圳)有限公司 一种产品差异信息显示方法和装置
CN108021952A (zh) * 2017-12-29 2018-05-11 广州品唯软件有限公司 一种多格式文本对比方法及装置
CN114004583A (zh) * 2021-10-18 2022-02-01 苏州浪潮智能科技有限公司 部件信息处理方法、装置、计算机设备和存储介质
CN114004583B (zh) * 2021-10-18 2024-01-16 苏州浪潮智能科技有限公司 部件信息处理方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
TWI616834B (zh) Network product recommendation method and device
JP6301958B2 (ja) 検索語句を構成し、広告を配信し、製品情報を検索するための方法および装置
TWI787196B (zh) 業務對象屬性標識的生成方法、裝置和系統
US9171088B2 (en) Mining for product classification structures for internet-based product searching
CN103942698A (zh) 一种产品信息对比方法及装置
US20140025533A1 (en) Method and Apparatus of Recommending Clothing Products
US11561988B2 (en) Systems and methods for harvesting data associated with fraudulent content in a networked environment
TW201322021A (zh) 圖片搜索方法以及圖片搜索裝置
CN103970850B (zh) 网站信息推荐方法和系统
CN103955543A (zh) 基于多模态的服装图像检索方法
US20160092553A1 (en) Methods and apparatuses of generating and using a structured label
CN107944035A (zh) 一种融合视觉特征和用户评分的图像推荐方法
CN106156157B (zh) 一种电子图书导航系统和方法
CN105447708A (zh) 一种信息提供方法及装置
CN103064903A (zh) 图片检索方法和装置
CN103942257A (zh) 一种视频搜索的方法与装置
CN103678628B (zh) 信息推送方法及系统
CN104462429A (zh) 数据库查询语句的生成方法及装置
CN105468649A (zh) 一种待展示对象匹配的判断方法及其装置
CN105760387B (zh) 提供业务对象库存信息的方法及装置
CN104636368A (zh) 数据检索方法、装置及服务器
CN106557489B (zh) 一种基于移动终端的服饰搜索方法
CN105868299A (zh) 一种数据搜索方法和装置
KR101660984B1 (ko) 이미지 데이터에 대응하는 정보 제공 방법 및 시스템
CN106355095B (zh) 利用模糊理论对欺诈网页识别的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: BEIJING LIANJIA ZHONGYING NETWORK TECHNOLOGY CO.,

Free format text: FORMER OWNER: NETWORK COMMUNICATIONS EQUIPMENT CO., LTD., BEIJING UNISPACE

Effective date: 20141102

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 100029 CHAOYANG, BEIJING TO: 100022 CHAOYANG, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20141102

Address after: 100022 Beijing City, Chaoyang District No. 39 East Third Ring Road, North SOHO office building A Room 302

Applicant after: BEIJING LIANJIA ZHONGYING NETWORK TECHNOLOGY CO., LTD.

Address before: 100029, E, room 705, block 6, North Fourth Ring Road, Chaoyang District, Beijing

Applicant before: Beijing connection time-space network communication facilities company limited

RJ01 Rejection of invention patent application after publication

Application publication date: 20140723

RJ01 Rejection of invention patent application after publication