CN103839178A - 一种获得商品质量信息的方法及系统 - Google Patents

一种获得商品质量信息的方法及系统 Download PDF

Info

Publication number
CN103839178A
CN103839178A CN201410073741.2A CN201410073741A CN103839178A CN 103839178 A CN103839178 A CN 103839178A CN 201410073741 A CN201410073741 A CN 201410073741A CN 103839178 A CN103839178 A CN 103839178A
Authority
CN
China
Prior art keywords
network address
commodity
information
module
quality score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410073741.2A
Other languages
English (en)
Inventor
危文
黄小源
韦成双
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Juntian Electronic Technology Co Ltd
Original Assignee
Zhuhai Juntian Electronic Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Juntian Electronic Technology Co Ltd filed Critical Zhuhai Juntian Electronic Technology Co Ltd
Priority to CN201410073741.2A priority Critical patent/CN103839178A/zh
Publication of CN103839178A publication Critical patent/CN103839178A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供的一种获得商品质量信息的方法及系统,可以自动监控浏览器中的行为事件并将用户所访问的商品网址发送到网络侧设备中进行信息爬取和质量评分,因此可以及时得到用户所要访问的商品网址的质量得分,也更具有针对性。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。本发明可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。

Description

一种获得商品质量信息的方法及系统
技术领域
本发明涉及商品质量信息确定技术领域,特别是涉及一种获得商品质量信息的方法及系统。
背景技术
随着电商产业的发展,通过网络购物已经成为一种十分普遍的现象。但是消费者在通过网络进行购物时,无法在购买前接触到真实商品,仅能通过图片、描述等了解商品质量。这就导致了网络购物中出现了大量假冒伪劣商品,侵害了消费者的权益。
为了帮助消费者了解商品质量,现有技术通过销量统计、好评统计等方式向消费者展示商品的销售情况及评价情况。但是这种方式较为繁琐,需要用户进行操作切换到特定区域,甚至切换到另一界面中才能获悉。同时,用户无法通过销量统计、好评统计等方式直观的了解到该商品的质量,对商品质量展示的直观性较差。
发明内容
本发明实施例的目的在于提供一种获得商品质量信息的方法及系统,以实现方便和直观的为消费者提供商品质量信息的目的。
为达到上述目的,本发明实施例公开了一种获得商品质量信息的方法,应用于用户侧设备中,所述方法包括:
监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
将所述商品网址发送到网络侧设备中;
接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
输出所述质量得分。
优选的,在将所述商品网址发送到网络侧设备中后,所述方法还包括:
接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
输出所接收的信息。
优选的,所述用户侧设备的浏览器中包括有用户行为获取模块,所述监控浏览器中的行为事件,包括:
使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址。
一种获得商品质量信息的方法,应用于网络侧设备中,所述方法包括:
接收用户侧设备发送的用户所访问的商品网址;
判断是否存在所述商品网址所对应的质量得分,如果是,将所述质量得分返回给所述用户侧设备,否则,爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
优选的,在对所述评分进行数学运算得到所述商品网址所对应的质量得分后,所述方法还包括:
对应存储所述商品网址及所述质量得分。
优选的,在爬取所述商品网址所对应的商品信息和/或卖家信息前,所述方法还包括:
在不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再爬取所述商品网址所对应的商品信息和/或卖家信息。
优选的,所述对所述评分进行数学运算得到所述商品网址所对应的质量得分,包括:
确定所述商品网址所对应的商品的类别;
获得与所述类别对应的数学运算模型;
使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
一种获得商品质量信息的系统,应用于用户侧设备中,所述系统包括:网址获取模块、网址发送模块、得分接收模块和得分输出模块,
所述网址获取模块,用于监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
所述网址发送模块,用于将所述商品网址发送到网络侧设备中;
所述得分接收模块,用于接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
所述得分输出模块,用于输出所述质量得分。
优选的,所述系统还包括:信息接收模块和信息输出模块,
所述信息接收模块,用于在所述网址发送模块将所述商品网址发送到网络侧设备中后,接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
所述信息输出模块,用于输出所接收的信息。
优选的,所述用户侧设备的浏览器中包括有用户行为获取模块,所述网址获取模块包括:判断子模块和获得子模块,
所述判断子模块,用于使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址,如果是,触发所述获得子模块;
所述获得子模块,用于获得用户所访问的商品网址。
一种获得商品质量信息的系统,应用于网络侧设备中,所述系统包括:网址接收模块、存在判断模块、得分返回模块和商品评分模块,
所述网址接收模块,用于接收用户侧设备发送的用户所访问的商品网址;
所述存在判断模块,用于判断是否存在所述商品网址所对应的质量得分,如果是,触发所述得分返回模块,否则触发所述商品评分模块;
所述得分返回模块,用于将所述质量得分返回给所述用户侧设备;
所述商品评分模块,用于爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
优选的,所述系统还包括:得分存储模块,用于在所述商品评分模块对所述评分进行数学运算得到所述商品网址所对应的质量得分后,对应存储所述商品网址及所述质量得分。
优选的,所述系统还包括:爬取判断模块,用于在所述商品评分模块爬取所述商品网址所对应的商品信息和/或卖家信息前,在不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再触发所述商品评分模块爬取所述商品网址所对应的商品信息和/或卖家信息。
优选的,所述商品评分模块包括:类别子模块、模型子模块和运算子模块,
所述类别子模块,用于确定所述商品网址所对应的商品的类别;
所述模型子模块,用于获得与所述类别对应的数学运算模型;
所述运算子模块,用于使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
本发明实施例提供的一种获得商品质量信息的方法及系统,可以自动监控浏览器中的行为事件并将用户所访问的商品网址发送到网络侧设备中进行信息爬取和质量评分,因此可以及时得到用户所要访问的商品网址的质量得分,也更具有针对性。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。本发明可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种获得商品质量信息的方法的流程图;
图2为本发明实施例提供的另一种获得商品质量信息的方法的流程图;
图3为本发明实施例提供的一种获得商品质量信息的系统的结构示意图;
图4为本发明实施例提供的另一种获得商品质量信息的系统的结构示意图;
图5为本发明实施例提供的另一种获得商品质量信息的方法的流程图;
图6为本发明实施例提供的另一种获得商品质量信息的系统的结构示意图;
图7为本发明实施例提供的一种商品质量信息输出界面。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了两种获得商品质量信息的方法,一种应用于用户侧设备中,如电脑、手机等,一种应用于网络侧设备中,如服务器等。下面首先对应用于用户侧设备的方案进行说明。
如图1所示,本发明实施例提供了一种获得商品质量信息的方法,应用于用户侧设备中,该方法可以包括:
S100、监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
具体的,所述用户侧设备的浏览器中可以包括有行为事件获取模块,具体的,该行为事件获取模块可以为动态链接库(DLL,Dynamic LinkLibrary)文件,如kswbc.dll。用户侧设备的浏览器中包括有行为事件获取模块时,步骤S100中监控用户行为信息,可以包括:
使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址。
浏览器辅助对象(BHO,Browser Helper Object)是微软公司推出的作为浏览器对第三方程序员开放交互接口的业界标准,通过简单的代码就可以进入浏览器领域的“交互接口”。通过这个接口,程序员可以编写代码获取和控制浏览器的行为。
具体的,用户侧设备中可以存储有商品网址对比库,将购物网站的商品网址的前缀部分进行保存,例如京东商城中某商品所在网址为:http://item.jd.com/987237.html,另一商品所在网址为http://item.jd.com/548350.html,则可以看出,京东商城的商品网址的前缀部分为http://item.jd.com。当然,在实际应用中,可以保存http://item.jd.com或item.jd.com。对于淘宝网而言,商品网址的前缀部分可以为http://item.taobao.com,或item.taobao.com。进一步,将用户所要访问的网址与商品网址对比库中保存的网址进行对比,如果用户所要访问的网址与商品网址对比库中保存的网址相匹配,则可以确定用户所要访问的网址是否为商品网址,例如用户所要访问的网址为http://item.jd.com/717929.html,则可以确定该网址为商品网址。
Internet Explorer浏览器为Win32程序,借助于BHO,我们可以将行为事件获取模块设置在浏览器中,这个对象在每次启动时都要加载。这样,对象会在与浏览器相同的上下文中运行,并能对可用的窗口和模块执行任何行动,例如:后退GoBack、前进GoForward、文件完成DocumentComplete等。另外,BHO能够存取浏览器的菜单与工具栏并能做出修改,还能够产生新窗口来显示当前网页的一些额外信息,还能够安装钩子以监控一些消息和动作。对于谷歌浏览器等非IE内核浏览器,可以通过浏览器插件将行为事件获取模块设置在浏览器中。
利用BHO技术,我们得以将行为事件获取模块注入到IE内核浏览器中,浏览器每次启动时都会自动加载该行为事件获取模块。通过该模块,我们可以对网购行为事件进行监控,如用户正在访问的URL、鼠标点击事件等。通过行为事件获取模块,我们得以对浏览器的页面内容进行获取,如用户所在网购页面的卖家昵称、商品标题等。因此,在本发明其他实施例中,当所述行为事件为用户访问商品网址时,步骤S100还可以同时获得用户所访问的商品网址所对应的页面中的商品信息,该商品信息可以包括卖家名称信息和/或商品名称信息。
S200、将所述商品网址发送到网络侧设备中;
步骤S200也可以同时将所获得的商品信息发送到网络侧设备中,以使网络侧设备根据该商品信息确定所述商品网址对应的商品的类型,例如根据卖家名称信息爱家家居旗舰店,及商品名称信息精品布艺沙发确定商品网址对应的商品类型为家具中的沙发。
S300、接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
其中,商品信息可以包括:宝贝详情、价格、评价等,卖家信息包括:保障金、退款率、好评率、认证情况等。
可以理解的是,步骤S200可以在确定用户所要访问的网址为商品网址时将该商品网址发送到网络侧设备中,以使网络侧设备爬取该网址中的信息并进行评分,得到该商品网址对应的质量得分。
由于本发明可以自动监控浏览器中的行为事件并将用户所访问的商品网址发送到网络侧设备中进行信息爬取和质量评分,因此可以及时得到用户所要访问的商品网址的质量得分,也更具有针对性。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。
S400、输出所述质量得分。
具体的,通过弹窗、弹泡等方式将该质量得分在显示屏等显示设备上输出,也可以生成包括该质量得分的质量报告以输出该质量得分。可选的,该质量得分在浏览器界面或安全软件(如新毒霸)的界面中输出。
当然,还可以根据质量得分确定商品质量并输出该商品质量,例如根据质量得分与预设得分区间的关系确定该质量得分对应的质量等级。可选的,质量等级可以包括:质量较好、质量一般、质量较差等。
本发明实施例提供的一种获得商品质量信息的方法,可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。
其中,步骤S400可以具体包括:
当监控浏览器中的行为事件为用户购买该商品网址所对应的商品时,输出所述质量得分。
一般情况下,用户会浏览多个商品网址来从多个商品中选择所需购买的商品,因此并不是所有用户访问的商品网址中的商品都会被用户所购买,因此当监控浏览器中的行为事件为用户购买该商品网址所对应的商品时输出所述质量得分可以避免过多输出质量得分给用户带来干扰。
在图1所示实施例的基础上,如图2所示,本发明实施例提供的另一种获得商品质量信息的方法中,在步骤S200后,该方法还可以包括:
S500、接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
S600、输出所接收的信息。
具体的,步骤S600可以在步骤S400后执行,也可以在步骤S400前执行,也可以与步骤S400同时执行。步骤S600可以在用户发出信息观看指令后执行。
有些情况下,用户还希望看到得出该质量得分的依据信息,因此,可以将网络侧设备返回的商品信息和/或卖家信息进行输出,例如卖家信誉、商品退货次数等。
在本发明其他实施例中,用户侧设备还可以接收网络侧设备返回的对商品信息和/或卖家信息进行统计后返回的统计信息,并输出该统计信息。例如:网络侧设备通过爬取商品网址所对应的商品信息,爬取到该商品网址所对应的商品的好评个数为80个,中评个数为15个,差评个数为5个,则进行统计后,可以确定差评率为5%。
在本发明其他实施例中,用户侧设备还可以接收网络侧设备返回的对商品信息和/或卖家信息,然后对接收的信息进行统计后和/或计算,并输出统计结果和/或计算结果,如图7所示对曝光次数、退款率、差评进行统计后输出统计结果。
与图1所示实施例相对应,本发明提供了一种获得商品质量信息的系统,应用于用户侧设备中,如图3所示,该系统可以包括:网址获取模块100、网址发送模块200、得分接收模块300和得分输出模块400,
所述网址获取模块100,用于监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
其中,用户侧设备的浏览器中可以包括有用户行为获取模块,所述网址获取模块100可以包括:判断子模块和获得子模块,
所述判断子模块,用于使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址,如果是,触发所述获得子模块;
所述获得子模块,用于获得用户所访问的商品网址。
浏览器辅助对象(BHO,Browser Helper Object)是微软公司推出的作为浏览器对第三方程序员开放交互接口的业界标准,通过简单的代码就可以进入浏览器领域的“交互接口”。通过这个接口,程序员可以编写代码获取和控制浏览器的行为。
所述网址发送模块200,用于将所述商品网址发送到网络侧设备中;
所述得分接收模块300,用于接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
其中,商品信息可以包括:宝贝详情、价格、评价等,卖家信息包括:保障金、退款率、好评率、认证情况等。
由于本发明可以自动监控浏览器中的行为事件并将用户所访问的商品网址发送到网络侧设备中进行信息爬取和质量评分,因此可以及时得到用户所要访问的商品网址的质量得分,也更具有针对性。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。
所述得分输出模块400,用于输出所述质量得分。
具体的,通过弹窗、弹泡等方式将该质量得分在显示屏等显示设备上输出,也可以生成包括该质量得分的质量报告以输出该质量得分。可选的,该质量得分在浏览器界面或安全软件(如新毒霸)的界面中输出。
本发明实施例提供的一种获得商品质量信息的系统,可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。
在图3所示实施例的基础上,如图4所示,本发明实施例提供的另一种获得商品质量信息的系统还可以包括:信息接收模块500和信息输出模块600,
所述信息接收模块500,用于在所述网址发送模块将所述商品网址发送到网络侧设备中后,接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
所述信息输出模块600,用于输出所接收的信息。
有些情况下,用户还希望看到得出该质量得分的依据信息,因此,可以将网络侧设备返回的商品信息和/或卖家信息进行输出,例如卖家信誉、商品退货次数等。
在本发明其他实施例中,用户侧设备还可以接收网络侧设备返回的对商品信息和/或卖家信息进行统计后返回的统计信息,并输出该统计信息。例如:网络侧设备通过爬取商品网址所对应的商品信息,爬取到该商品网址所对应的商品的好评个数为80个,中评个数为15个,差评个数为5个,则进行统计后,可以确定差评率为5%。
以上各模块的具体执行过程请参见图1及图2所示实施例部分。
下面说明本发明实施例提供的应用于网络侧设备的一种获得商品质量信息的方法,如图5所示,该方法可以包括:
S001、接收用户侧设备发送的用户所访问的商品网址;
S002、判断是否存在所述商品网址所对应的质量得分,如果是,执行步骤S003,否则执行步骤S004;
S003、将所述质量得分返回给所述用户侧设备。
S004、爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
其中,商品信息可以包括:宝贝名称、宝贝价格、宝贝促销价、宝贝销量、宝贝详情、宝贝评价条数、卖家名、卖家信誉页URL中的任意个。
卖家信息可以包括:店铺信用、店铺半年内动态评分、店铺30天内服务情况、卖家信用评价展示、好评率中的任意个。
本发明实施例提供的一种获得商品质量信息的方法,可以对用户所访问的商品网址对应的商品信息和/或卖家信息进行爬取并评分,从而计算得到该商品网址对应的商品得分。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。本发明可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。
可选的,在步骤S004对所述评分进行数学运算得到所述商品网址所对应的质量得分后,图5所示方法还可以包括:
对应存储所述商品网址及所述质量得分。
可以理解的是,网络侧设备在每一次爬取商品网址的信息并评分得到质量得分后,就可以对应存储所爬取过的商品网址及该商品网址的质量得分。这样,当网络侧设备中存在与用户侧设备发送的用户所访问的商品网址对应的质量得分时,说明该商品网址已被爬取过,可以不再进行爬取,直接将与之对应的质量得分返回给用户侧设备即可。如果不存在,则该商品网址可能未被爬取过,或,该商品网址被爬取过,但由于该商品网址对应的商品已下架等原因,该商品网址所对应的质量得分被删除。如果即不存在该商品网址对应的质量得分,该商品网址又未被爬取过,则可以爬取该商品网址的信息。如果不存在该商品网址对应的质量得分,但该商品网址被爬取过,则可以不再爬取该商品网址的信息。
因此,在步骤S004爬取所述商品网址所对应的商品信息和/或卖家信息前,图5所示方法还可以包括:
在步骤S002判断不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再执行步骤S004爬取所述商品网址所对应的商品信息和/或卖家信息。
具体的,可以使用网络爬虫爬取商品网址对应的信息。网络爬虫是一个自动提取网页信息的程序,为用户提供定向信息,是搜索引擎的重要组成部分,网络爬虫可以从一个或者多个初始URL开始,爬取初始网页上面的信息和URL列表,不断将爬取到新的URL添加到待爬取队列中。从1994年世界上第一个网络检索工具Web Crawler问世,爬虫技术不断发展,爬虫技术发展到了一个比较成熟的阶段,传统的网络爬虫技术主要应用于抓取静态Web网页,随着AJAX/Web2.0的流行,如何抓取AJAX等动态页面成了搜索引擎急需解决的问题,因为AJAX颠覆了传统的纯HTTP请求/响应协议机制,如果搜索引擎依旧采用“爬”的机制,是无法抓取到AJAX页面的有效数据的。目前较流行的搜索引擎有百度、Google、Yahoo等,应该使用新型爬虫来应对web2.0网页给爬虫所带来的挑战。爬虫分为聚集爬虫和通用爬虫,聚焦爬虫是一个自动下载网页的程序,它根据既定的抓取目标,有选择的访问万维网上的网页与相关的链接,获取所需要的信息。聚焦爬虫并不追求大的覆盖,而将目标定为抓取与某一特定主题内容相关的网页,为面向主题的用户查询准备数据资源。通用爬虫不分主题根据网络爬虫的控制策略随机分配爬取任务,通用爬虫直接不存在主题方面的通讯和合作,目标是尽可能多的搜集质量好的页面对页面的内容没有要求,包含所有方面。优选的,本发明使用聚焦爬虫进行信息爬取,下载商品网址对应的网页源代码。
可选的,由于网络侧设备可以连接多个用户侧设备,因此网络侧设备所要爬取的商品网址可能很多,因此,为了避免同时爬取多个商品网址造成网络侧设备运行负担过大,可以使用队列方式,对多个商品网址进行依次爬取。
具体的,卖家信息从商品网址中爬取,当然,卖家信息也可以进一步从卖家信息网址中爬取,例如从店铺信誉页中爬取。一般情况下,商品网址中存在少量的卖家信息,为了获得更多的卖家信息以确定该卖家所售卖的该商品的质量得分,可以进一步根据存在于该商品网址所对应的页面源代码中的卖家信息网址对详细的卖家信息进行爬取。由于一个卖家一般售卖多个商品,因此在爬取商品信息及卖家信息网址后,可以判断是否爬取过该卖家信息网址,或判断在当前时刻所在的预设时间段内是否爬取过该卖家信息网址,如果是,则直接使用之前所爬取的卖家信息进行评分,否则再爬取该卖家信息网址。
在爬取商品信息和/或卖家信息后,可以对所爬取的信息进行存储,例如存储在数据库中,然后通过预先建立的数学运算模型进行评分和计算,并最终得到质量得分。具体的,由于不同商品具有不同的特点,例如电子产品的退换货率较高的原因中概率最大的为:电子产品的质量较差,而对服装而言,其退换货率较高的最大原因可能并不是其质量较差,而是顾客试穿后觉得不好看、尺码不对等;因此,不同的商品可以有不同的数学运算模型。
在本发明其他实施例中,步骤S004对所述评分进行数学运算得到所述商品网址所对应的质量得分,可以包括:
确定所述商品网址所对应的商品的类别;
获得与所述类别对应的数学运算模型;
使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
如果对每一种商品都设定一个数学运算模型,那么前期工作量太大,因此可以根据商品类别进行区分,例如将各商品分类如下:家用电器、服饰鞋帽、个护化妆、运动健康、电脑办公、图书音像等。优选的,可以通过所爬取的商品信息确定该商品的类别,例如商品名称、商品分类等。
下面公开一种实际应用中的评分方法,如表1所示,根据该评分方法可以确定对应的数学运算模型。
表1、淘宝话费充值品类评分方法
Figure BDA0000471392080000141
Figure BDA0000471392080000151
优选的,网络侧设备可以使用自动鉴定器对所爬取的信息进行评分,对所述评分进行数学运算。为了防止自动鉴定器同时鉴定多个商品导致出现瘫痪,同样可以设置任务队列,使自动鉴定器依次从待鉴定队列取任务,完成打分鉴定。自动鉴定器可以由python脚本实现,集成具备分布式的、容错的实时计算STORM系统,利用STORM实时计算和分布式的特性,部署自动鉴定器集群。使用STORM系统和自动鉴定器集群,能够在短时间内完成对大量鉴定任务的鉴定,每天能处理上百万商品鉴定任务,对于鉴定任务能够做到及时鉴定,具备较高的实时性的稳定性。
与图5所示实施例相对应,本发明还提供了一种获得商品质量信息的系统,应用于网络侧设备中,如图6所示,该系统可以包括:网址接收模块001、存在判断模块002、得分返回模块003和商品评分模块004,
所述网址接收模块001,用于接收用户侧设备发送的用户所访问的商品网址;
所述存在判断模块002,用于判断是否存在所述商品网址所对应的质量得分,如果是,触发所述得分返回模块003,否则触发所述商品评分模块004;
所述得分返回模块003,用于将所述质量得分返回给所述用户侧设备;
所述商品评分模块004,用于爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
其中,商品信息可以包括:宝贝名称、宝贝价格、宝贝促销价、宝贝销量、宝贝详情、宝贝评价条数、卖家名、卖家信誉页URL中的任意个。
卖家信息可以包括:店铺信用、店铺半年内动态评分、店铺30天内服务情况、卖家信用评价展示、好评率中的任意个。
本发明实施例提供的一种获得商品质量信息的系统,可以对用户所访问的商品网址对应的商品信息和/或卖家信息进行爬取并评分,从而计算得到该商品网址对应的商品得分。由于不需要用户进行操作来切换到相应界面观看商品信息,因此操作简便。本发明可以输出商品质量得分,相比于通过好评情况、销售情况向消费者展示商品质量的方式而言更加直接。
由于不同商品具有不同的特点,例如电子产品的退换货率较高的原因中概率最大的为:电子产品的质量较差,而对服装而言,其退换货率较高的最大原因可能并不是其质量较差,而是顾客试穿后觉得不好看、尺码不对等;因此,不同的商品可以有不同的数学运算模型。
可选的,商品评分模块004可以包括:类别子模块、模型子模块和运算子模块,
所述类别子模块,用于确定所述商品网址所对应的商品的类别;
所述模型子模块,用于获得与所述类别对应的数学运算模型;
所述运算子模块,用于使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
在本发明其他实施例中,图6所示系统还可以包括:得分存储模块,用于在所述商品评分模块对所述评分进行数学运算得到所述商品网址所对应的质量得分后,对应存储所述商品网址及所述质量得分。
可以理解的是,网络侧设备在每一次爬取商品网址的信息并评分得到质量得分后,就可以对应存储所爬取过的商品网址及该商品网址的质量得分。这样,当网络侧设备中存在与用户侧设备发送的用户所访问的商品网址对应的质量得分时,说明该商品网址已被爬取过,可以不再进行爬取,直接将与之对应的质量得分返回给用户侧设备即可。如果不存在,则该商品网址可能未被爬取过,或,该商品网址被爬取过,但由于该商品网址对应的商品已下架等原因,该商品网址所对应的质量得分被删除。如果即不存在该商品网址对应的质量得分,该商品网址又未被爬取过,则可以爬取该商品网址的信息。如果不存在该商品网址对应的质量得分,但该商品网址被爬取过,则可以不再爬取该商品网址的信息。
在本发明其他实施例中,图6所示系统还可以包括:爬取判断模块,用于在所述商品评分模块004爬取所述商品网址所对应的商品信息和/或卖家信息前,在不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再触发所述商品评分模块004爬取所述商品网址所对应的商品信息和/或卖家信息。
以上各模块请参见方法实施例部分,不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (14)

1.一种获得商品质量信息的方法,其特征在于,应用于用户侧设备中,所述方法包括:
监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
将所述商品网址发送到网络侧设备中;
接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
输出所述质量得分。
2.根据权利要求1所述的方法,其特征在于,在将所述商品网址发送到网络侧设备中后,所述方法还包括:
接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
输出所接收的信息。
3.根据权利要求1或2所述的方法,其特征在于,所述用户侧设备的浏览器中包括有用户行为获取模块,所述监控浏览器中的行为事件,包括:
使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址。
4.一种获得商品质量信息的方法,其特征在于,应用于网络侧设备中,所述方法包括:
接收用户侧设备发送的用户所访问的商品网址;
判断是否存在所述商品网址所对应的质量得分,如果是,将所述质量得分返回给所述用户侧设备,否则,爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
5.根据权利要求4所述的方法,其特征在于,在对所述评分进行数学运算得到所述商品网址所对应的质量得分后,所述方法还包括:
对应存储所述商品网址及所述质量得分。
6.根据权利要求4或5所述的方法,其特征在于,在爬取所述商品网址所对应的商品信息和/或卖家信息前,所述方法还包括:
在不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再爬取所述商品网址所对应的商品信息和/或卖家信息。
7.根据权利要求4或5所述的方法,其特征在于,所述对所述评分进行数学运算得到所述商品网址所对应的质量得分,包括:
确定所述商品网址所对应的商品的类别;
获得与所述类别对应的数学运算模型;
使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
8.一种获得商品质量信息的系统,其特征在于,应用于用户侧设备中,所述系统包括:网址获取模块、网址发送模块、得分接收模块和得分输出模块,
所述网址获取模块,用于监控浏览器中的行为事件,当所述行为事件为用户访问商品网址时,获得用户所访问的商品网址;
所述网址发送模块,用于将所述商品网址发送到网络侧设备中;
所述得分接收模块,用于接收所述网络侧设备返回的与所述商品网址对应的质量得分,其中,所述质量得分是所述网络侧设备在爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算后得到的;
所述得分输出模块,用于输出所述质量得分。
9.根据权利要求8所述的系统,其特征在于,所述系统还包括:信息接收模块和信息输出模块,
所述信息接收模块,用于在所述网址发送模块将所述商品网址发送到网络侧设备中后,接收所述网络侧设备返回的所述商品网址所对应的商品信息和/或卖家信息;
所述信息输出模块,用于输出所接收的信息。
10.根据权利要求8或9所述的系统,其特征在于,所述用户侧设备的浏览器中包括有用户行为获取模块,所述网址获取模块包括:判断子模块和获得子模块,
所述判断子模块,用于使用所述行为事件获取模块通过浏览器辅助对象获得浏览器中的行为事件并判断所获得的行为事件是否为用户访问商品网址,如果是,触发所述获得子模块;
所述获得子模块,用于获得用户所访问的商品网址。
11.一种获得商品质量信息的系统,其特征在于,应用于网络侧设备中,所述系统包括:网址接收模块、存在判断模块、得分返回模块和商品评分模块,
所述网址接收模块,用于接收用户侧设备发送的用户所访问的商品网址;
所述存在判断模块,用于判断是否存在所述商品网址所对应的质量得分,如果是,触发所述得分返回模块,否则触发所述商品评分模块;
所述得分返回模块,用于将所述质量得分返回给所述用户侧设备;
所述商品评分模块,用于爬取所述商品网址所对应的商品信息和/或卖家信息并对所爬取的信息进行评分,对所述评分进行数学运算得到所述商品网址所对应的质量得分,将所得到的质量得分返回给所述用户侧设备以使所述用户侧设备输出所述质量得分。
12.根据权利要求11所述的系统,其特征在于,所述系统还包括:得分存储模块,用于在所述商品评分模块对所述评分进行数学运算得到所述商品网址所对应的质量得分后,对应存储所述商品网址及所述质量得分。
13.根据权利要求11或12所述的系统,其特征在于,所述系统还包括:爬取判断模块,用于在所述商品评分模块爬取所述商品网址所对应的商品信息和/或卖家信息前,在不存在所述商品网址所对应的质量得分时,判断是否爬取过所述商品网址,如果否,再触发所述商品评分模块爬取所述商品网址所对应的商品信息和/或卖家信息。
14.根据权利要求11或12所述的系统,其特征在于,所述商品评分模块包括:类别子模块、模型子模块和运算子模块,
所述类别子模块,用于确定所述商品网址所对应的商品的类别;
所述模型子模块,用于获得与所述类别对应的数学运算模型;
所述运算子模块,用于使用所述数学运算模型对所述评分进行数学运算,得到所述商品网址所对应的质量得分。
CN201410073741.2A 2014-02-28 2014-02-28 一种获得商品质量信息的方法及系统 Pending CN103839178A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410073741.2A CN103839178A (zh) 2014-02-28 2014-02-28 一种获得商品质量信息的方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410073741.2A CN103839178A (zh) 2014-02-28 2014-02-28 一种获得商品质量信息的方法及系统

Publications (1)

Publication Number Publication Date
CN103839178A true CN103839178A (zh) 2014-06-04

Family

ID=50802650

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410073741.2A Pending CN103839178A (zh) 2014-02-28 2014-02-28 一种获得商品质量信息的方法及系统

Country Status (1)

Country Link
CN (1) CN103839178A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105405044A (zh) * 2015-12-07 2016-03-16 青岛海尔滚筒洗衣机有限公司 一种使用洗衣机快速购物的方法及洗衣机
WO2017028735A1 (zh) * 2015-08-20 2017-02-23 阿里巴巴集团控股有限公司 选择及推荐展示对象的方法及装置
CN106844371A (zh) * 2015-12-03 2017-06-13 阿里巴巴集团控股有限公司 搜索优化方法和装置
CN109426978A (zh) * 2017-08-29 2019-03-05 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN110135859A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 商品质量监控方法以及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077139A (ja) * 2006-09-19 2008-04-03 Fujitsu Ltd 店舗情報提供装置、店舗情報提供方法、および店舗情報提供プログラム
CN102663019A (zh) * 2012-03-21 2012-09-12 北京英孚斯迈特信息技术有限公司 一种即时推荐系统
CN103150662A (zh) * 2013-02-07 2013-06-12 珠海市君天电子科技有限公司 一种鉴定淘宝网虚假商品广告的方法
CN103606097A (zh) * 2013-11-21 2014-02-26 复旦大学 一种基于可信度评价的产品信息推荐方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008077139A (ja) * 2006-09-19 2008-04-03 Fujitsu Ltd 店舗情報提供装置、店舗情報提供方法、および店舗情報提供プログラム
CN102663019A (zh) * 2012-03-21 2012-09-12 北京英孚斯迈特信息技术有限公司 一种即时推荐系统
CN103150662A (zh) * 2013-02-07 2013-06-12 珠海市君天电子科技有限公司 一种鉴定淘宝网虚假商品广告的方法
CN103606097A (zh) * 2013-11-21 2014-02-26 复旦大学 一种基于可信度评价的产品信息推荐方法及系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017028735A1 (zh) * 2015-08-20 2017-02-23 阿里巴巴集团控股有限公司 选择及推荐展示对象的方法及装置
CN106844371A (zh) * 2015-12-03 2017-06-13 阿里巴巴集团控股有限公司 搜索优化方法和装置
CN106844371B (zh) * 2015-12-03 2020-09-08 阿里巴巴集团控股有限公司 搜索优化方法和装置
CN105405044A (zh) * 2015-12-07 2016-03-16 青岛海尔滚筒洗衣机有限公司 一种使用洗衣机快速购物的方法及洗衣机
CN105405044B (zh) * 2015-12-07 2021-06-01 重庆海尔滚筒洗衣机有限公司 一种使用洗衣机快速购物的方法及洗衣机
CN109426978A (zh) * 2017-08-29 2019-03-05 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN110135859A (zh) * 2019-04-16 2019-08-16 深圳壹账通智能科技有限公司 商品质量监控方法以及系统

Similar Documents

Publication Publication Date Title
US8224823B1 (en) Browsing history restoration
US8532372B2 (en) System and method for matching color swatches
CN110245069B (zh) 页面版本的测试方法和装置、页面的展示方法和装置
CN101996203A (zh) 一种过滤网页信息的方法和系统
CN103034680B (zh) 针对终端设备的数据交互方法及装置
US9390189B2 (en) Method and system for providing object information on the internet
CN104054040A (zh) 使用振动在移动设备的显示器上模拟触摸纹理
CN103839178A (zh) 一种获得商品质量信息的方法及系统
CN106327257A (zh) 一种电子订单的管理方法及系统
CN103020128B (zh) 与终端设备交互数据的方法与装置
CN111582973A (zh) 一种商品推荐数据生成方法、装置及系统
CN103703483A (zh) 信息提供装置、信息提供方法、信息提供程序、信息显示程序以及存储信息提供程序的计算机可读取的记录介质
CN107172217B (zh) 互动购物方法及系统
CN105488072B (zh) 一种目标库中目标对象选定方法、装置及系统
CN105450460B (zh) 网络操作记录方法及系统
CN103227791B (zh) 一种无线数据采集的方法及装置
CN105528446A (zh) 满足延伸产品需求的摘要生成方法及装置
KR20160108731A (ko) 온라인 쇼핑몰 어플리케이션을 생성하고 온라인 쇼핑몰 어플리케이션의 접속 정보를 분석하는 방법 및 장치
CN110569416B (zh) 基于数据爬取的app控件的处理方法及相关产品
CN108765044B (zh) 商品信息的同步方法、终端及计算机可读存储介质
CN103745390A (zh) 第三方网购商品差评方法及装置
CN104050174B (zh) 一种个性化页面生成方法及装置
CN101268461A (zh) 用于将信息从信息服务器传输给客户端的方法
CN104063115B (zh) 一种信息处理方法及电子设备
CN104424293A (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140604