CN103577988B - 一种识别特定用户的方法和装置 - Google Patents

一种识别特定用户的方法和装置 Download PDF

Info

Publication number
CN103577988B
CN103577988B CN201210258891.1A CN201210258891A CN103577988B CN 103577988 B CN103577988 B CN 103577988B CN 201210258891 A CN201210258891 A CN 201210258891A CN 103577988 B CN103577988 B CN 103577988B
Authority
CN
China
Prior art keywords
evaluation information
transaction
evaluation
user
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210258891.1A
Other languages
English (en)
Other versions
CN103577988A (zh
Inventor
陈春明
王正刚
许亮
吴云崇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201210258891.1A priority Critical patent/CN103577988B/zh
Publication of CN103577988A publication Critical patent/CN103577988A/zh
Application granted granted Critical
Publication of CN103577988B publication Critical patent/CN103577988B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种识别特定用户的方法和装置,其中所述方法包括:从交易平台中提取交易评价信息的样本;从所述交易评价信息的样本中筛选出聚类用的交易评价信息;从所述聚类用的交易评价信息中提取评价用户作为候选用户;按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合;统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。本申请可以用来提高卖家信用的真实有效性,提高搜索准确性,并减轻服务器的负担,减少网络资源的占用。

Description

一种识别特定用户的方法和装置
技术领域
本申请涉及电子交易平台数据处理的技术领域,特别是涉及一种特定用户的方法和一种识别特定用户的装置。
背景技术
电子商务(Electronic Commerce,EC)是指在全球各地广泛的商业贸易活动中,在因特网开放的网络环境下,基于网络通讯技术,买卖双方可不谋面地进行各种商贸活动,实现消费者的网上购物、商户之间的网上交易和在线电子支付,以及各种商务活动、交易活动、金融活动和相关的综合服务活动的一种新型的商业运营模式。电子商务涵盖的范围很广,一般可分为企业对企业(Business-to-Business,B2B)、企业对消费者(Business-to-Customer,B2C)或消费者对消费者(Customer-to-Customer,C2C)等模式。近几年来,国内电子商务迅速发展,各种B2B、C2C、B2C模式的电子商务网站(俗称购物网站),如淘宝网、当当网、卓越亚马逊、拍拍网、京东商城等,已被网民认可和接受。
为了帮助广大消费者对网上卖家提供的商品和服务进行甄别,目前的电子商务平台一般都会提供交易评价的功能,对商品和服务的质量以直观的方式,允许购买以后的买家进行打分,或者留下具体的文字、图片的描述,从而帮助更多的买家进行购买时的参考决策。例如,当买家与卖家完成一笔交易后,买家按照评价系统提供的“好评”、“中评”与“差评”的参数选项,选择其中一个评价参数,并给出相应的说明。或如,买家按照电子商务网站中设置的评价参数选项,比如,商品质量、卖家服务态度、物流速度等,选择其相应级别进行打分,根据分数对应到关联的“好评”、“中评”或“差评”的评价参数,并给出相应说明。
电子商务平台作为充分竞争的网上交易平台,大量的卖家之间存在着良性和非良性的竞争关系。在非良性的竞争关系中,表现之一就是在购买对方的商品和服务以后进行评价时对卖家进行恶意诋毁。目前我国的网上交易并未实行对买家、卖家的实名制,因此买家的评价过程和内容,对于电子商务平台本身是不可控的。一些买家利用这一特点,对购买以后的商品或者服务做出恶意诋毁的评价,混淆消费者的判断,目前的电子商务平台只能引导买家自行注意鉴别,但买家自行鉴别的困难巨大。同时,现在的网上交易中还存在一种特定用户——职业差评师,即通过购买由竞争对手指定的电子商务平台卖家的商品或者服务,购买结束以后,恶意诋毁所购买的商品或者服务质量,以达到打击竞争对手并且个人从中牟利的买家用户。一些职业差评师买家在评价时往往附上图片、详细的文字描述,更增加了买家识别上的难度。职业差评师的存在,不仅严重干扰的网络秩序,还会影响卖家信用的真实性,而卖家信用往往是电子商务网站搜索排序的重要参数,虚假的卖家信用导致优质的搜索结果的排序降低,相应的劣质的搜索结果排序上升,这将严重影响到搜索结果的准确性,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。
因此,目前需要本领域技术人员迫切解决的一个技术问题就是:提出一种识别特定用户及其评价信息的机制,用以提高卖家信用的真实有效性,提高搜索准确性,并减轻服务器的负担,减少网络资源的占用。
发明内容
本申请的目的是提供一种识别特定用户的方法和装置,用以打击网络犯罪,维护网络交易的秩序,提高卖家信用的真实有效性,提高搜索准确性,并减轻服务器的负担,减少网络资源的占用。
为了解决上述问题,本申请实施例公开了一种识别特定用户的方法,包括:
从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
从所述聚类用的交易评价信息中提取评价用户作为候选用户;
按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
优选地,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤包括:
若所述评价信息为中评或差评,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
若所述评价信息中的交易评分值低于第二阈值,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
若所述评价信息中的评价内容包括预置的差评关键词,则将该条交易评价信息提取为聚类用的交易评价信息。
优选地,所述交易信息中包括商品信息,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤还包括:
根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
若存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息,则去除该条交易评价信息。
优选地,所述的方法还包括:
提取所述特定用户的特征,训练生成特定用户的评定指标。
优选地,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
优选地,所述的方法还包括:
当获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;
若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
优选地,所述的方法还包括:
提取所述特定用户生成黑名单。
优选地,所述的方法还包括:
当获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;
若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
本申请实施例还公开了一种识别特定用户的装置,包括:
样本采集模块,用于从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
数据清洗模块,用于从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
用户提取模块,用于从所述聚类用的交易评价信息中提取评价用户作为候选用户;
组织模块,用于按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
识别模块,用于统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
优选地,所述数据清洗模块包括:
第一提取子模块,用于在所述评价信息为中评或差评时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第二提取子模块,用于在所述评价信息中的交易评分值低于第二阈值时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第三提取子模块,用于在所述评价信息中的评价内容包括预置的差评关键词时,将该条交易评价信息提取为聚类用的交易评价信息。
优选地,所述交易信息中包括商品信息,所述数据清洗模块还包括:
第一计算子模块,用于根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
第二计算子模块,用于根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
去除子模块,用于在存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息时,去除该条交易评价信息。
优选地,所述的装置还包括:
聚类建模模块,用于提取所述特定用户的特征,训练生成特定用户的评定指标。
优选地,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
优选地,所述的装置还包括:
第一用户识别处理模块,用于在获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
优选地,所述的装置还包括:
黑名单创建模块,用于提取所述特定用户生成黑名单。
优选地,所述的装置还包括:
第二用户识别处理模块,用于在获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
与现有技术相比,本申请包括以下优点:
本申请针对所有的成功交易进行评价信息取样,能够在全局角度,即在交易平台所有交易的角度,而不是某一件商品交易的角度,方便地对职业差评师进行识别,具体通过交易平台的开放接口获取到全网的交易评价信息后,对交易评价信息进行数据清洗,然后通过聚类模型,从买家中筛选出职业差评师,并把此模型应用于更广泛的买家对象,建立起长效机制,有效打击了职业差评师的网络犯罪行为,维护网上交易的健康秩序;并且保证卖家信用的真实有效性,还原了商品的真实信息,使好的交易信息能在用户搜索时正常出现在搜索结果的前列,减少用户反复搜索的时间,从而减轻服务器的负担,减少网络资源的占用。
附图说明
图1是本申请的一种识别特定用户的方法实施例1的步骤流程图;
图2是本申请的一种识别特定用户的方法实施例2的步骤流程图;
图3是本申请的一种识别特定用户的方法实施例3的步骤流程图;
图4是本申请实施例应用在交易平台搜索中的步骤流程图;
图5是本申请的一种识别特定用户的装置实施例的结构框图。
具体实施方式
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。
一般而言,职业差评师的活动流程为:获取由团伙主使指定购买的目标对象,购买商品,等待收货,收到货物完成以后,对购买的对象做出差评。评价完成以后,得到团伙主使分配的报酬。在目前没有采用实名制的交易平台中,职业差评师的存在,不仅严重干扰的网络秩序,还会影响卖家信用的真实性,还将进一步影响到搜索结果的准确性,例如,一些好的交易信息会受到说明栏中说明信息的影响,基于其所获得的差评,不会与好评的交易信息一同排在搜索结果的前列,导致用户需要时间和精力去分辨,甚至需要重新搜索等,这不但加重了访问服务器的负担,而且浪费了网络资源。
针对上述问题,本申请发明人提出本申请实施例的核心构思之一在于,针对所有的成功交易进行评价信息取样,能够在全局角度,即在交易平台所有交易的角度,而不是某一件商品交易的角度,方便地对职业差评师进行识别,具体通过交易平台的开放接口获取到全网的交易评价信息后,对交易评价信息进行数据清洗,然后通过聚类模型,从买家中筛选出职业差评师,并把此模型应用于更广泛的买家对象,建立起长效机制,有效打击了职业差评师的网络犯罪行为,维护网上交易的健康秩序;并且保证卖家信用的真实有效性,还原了商品的真实信息,使好的交易信息能在用户搜索时正常出现在搜索结果的前列,减少用户反复搜索的时间,从而减轻服务器的负担,减少网络资源的占用。
参照图1,其示出了本申请的一种识别特定用户及其评价信息的方法实施例1的步骤流程图,具体可以包括如下步骤:
步骤101,从交易平台中提取交易评价信息的样本;
其中,所述交易评价信息包括交易信息,及其对应的评价用户和评价信息;
在具体实现中,可以在交易平台提供有开放接口(应用程序接口API)的情况下,通过该开放接口获取到交易评价信息的样本;在交易平台没有提供开放接口的情况下,则可以采用网页爬虫的方式获取到交易评价信息的样本。
为提升数据处理速度,减少资源耗费,所述交易评价信息可以只取预设时间段内的交易评价信息,比如,某交易平台中最近半年内的交易评价信息。获取到所述交易评价信息的样本后,可以进行存储,例如,放入某云服务器的存储数据库,或放入交易平台服务器中等。
作为本申请实施例具体应用的一种示例,所述交易信息可以包括商品ID,商品价格,商品类目等信息,评价用户可以包括用户ID,用户昵称,用户注册时间和注册地,用户收货地址等信息,评价信息可以包括好评、中评、差评、商品与描述相符度、卖家的服务态度、卖家发货的速度、物流发货的速度、交易的具体评论、评论是否推荐到社区、评价时间等信息。
例如,从交易平台中提取的一条交易评价信息样本如下表所示:
步骤102,从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
本步骤旨在对交易评价信息的样本进行数据清洗,从中筛选出对构建聚类模型有用的交易评价信息(聚类用的交易评价信息)。
作为本申请实施例具体应用的一种示例,所述步骤102可以包括如下子步骤:
子步骤S11,若所述评价信息为中评或差评,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
子步骤S12,若所述评价信息中的交易评分值低于第二阈值,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
子步骤S13,若所述评价信息中的评价内容包括预置的差评关键词,则将该条交易评价信息提取为聚类用的交易评价信息。
例如,在交易评价信息的样本中,筛选出符合如下条件的评价信息:
1)评价信息为中评或差评;
2)评价信息中提供的各项打分,如商品与描述相符的打分、卖家服务态度的打分、卖家发货速度的打分和/或物流发货速度的打分为3分(第二阈值)和3分以下(总分为5分);
3)评价信息中的内容描述中包含对商品和服务进行诋毁的关键词,如差,不好等。
本步骤数据清洗的过程还可以采用各种方式,在本申请的一种优选实施例中,所述步骤102还可以包括如下子步骤:
子步骤S21,根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;
作为本申请实施例具体应用的一种示例,所述差评规则可以包括:
评价信息为中评或差评;
和/或,评价信息中的交易评分值低于第二阈值;
和/或,评价信息中的评价内容包括预置的差评关键词。
子步骤S22,根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
在本申请实施例具体应用的一种示例中,评价用户的分散度可以用来衡量一件商品的中评或差评主要来自于什么样的买家,这些买家是否经常给别的卖家这种评价,以及,这些评价是否仅针对个别卖家。分散度可以由两部分组成:中评和差评在该买家所有交易中的占比(Rbad),以及,中评和差评在卖家上分布的情况(用信息熵表示,Sbad)。分散度越大则表示该买家越倾向于差评买家(职业差评师)。
具体而言,评价用户的分散度可以采用如下公式计算:
D=Rbad*Sbad;
例如,一个买家有100笔交易,10次差评,分别是由不同的10个卖家发起的交易,则D=0.1*1=0.1;如果10次差评给了1个卖家,则D=0;
当然,上述买家分散度的计算方法仅仅用作示例,本领域技术人员根据实际情况采用任一种计算方法都是可行的,本申请对此不作限制。
子步骤S23,若存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息,则去除该条交易评价信息。
本实施例用于从交易评价信息的样本中去除劣质商品的交易评价信息。衡量劣质商品的标准即,是不是差评占比较大(差评占比大于第三阈值,如60%),并且,给出差评的评价用户分散度比较大(评价用户的分散度高于第四阈值,如30%),若是,则去除这种劣质商品的交易评价信息。
当然,上述筛选聚类用的交易评价信息的方式仅仅用作示例,本领域技术人员根据实际情况采用任一种筛选方式都是可行的,例如,获取卖家的资质等级,对于资质优良,买家评价较好的大卖家,对其交易评价信息就进行保留。本申请实施例对此不作限制。
步骤103,从所述聚类用的交易评价信息中提取评价用户作为候选用户;
步骤104,按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合;
其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
本步骤即数据聚类的过程,基于候选用户,分别在所述交易评价信息的样本中和所述聚类用的交易评价信息中,提取对应的评价信息的关联,形成对应的第一评价信息集合和第二评价信息集合。
步骤105,统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
例如,经过上述数据清洗和数据聚类处理,可以获知某评价用户在过去半年的交易中,所做出的差评的比例大小,若该评价用户做出差评的比例超过第四阈值,如60%,即可判定为职业差评师。
参照图2,其示出了本申请的一种识别特定用户的方法实施例2步骤流程图,具体可以包括如下步骤:
步骤201,从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
步骤202,从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
步骤203,从所述聚类用的交易评价信息中提取评价用户作为候选用户;
步骤204,按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合;
其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
步骤205,统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
步骤206,提取所述特定用户的特征,训练生成特定用户的评定指标;
在具体应用中,所述步骤205可以生成职业差评师的聚类模型,并将此聚类模型应用于更广泛的买家对象,从而建立起长效机制。
作为本申请实施例具体应用的一种示例,所述特定用户的特征可以包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息等。
在实际中,可以通过K-Means(一种硬聚类算法)等聚类方法,来抓取各个相互独立但同时又最具有人群区分度的指标.
例如,将特定用户的特征进行聚类,得到25个类,然后对这25个类进行归类,得到5个类(不同的操作手法会被归为一个大类),分别为:正常的买家类,恶意差评类,恶意投诉类,恶意拍下类,炒信类。以恶意差评类为例,这个买家群体主要是寻找一些对好评比较敏感的卖家,购买商品后差评,然后要挟卖家补偿,达到目的后,再改评价为好评。这个恶意差评类中一个子类的买家特征(特定用户的评定指标)包括:
1)商品价格低8元以下;
2)卖家星级1钻到5钻;
3)中差评比率>20%;
4)中差评中,改好评比率>50%;
5)商品包邮或者货到付款。
当然,上述聚类的方法仅仅用作示例,本领域技术人员根据实际情况采用任一种提取所述特定用户的特征,训练生成特定用户的评定指标的方法都是可行的,本申请对此无需加以限制。
步骤207,当获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;
步骤208,若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
当完成上述聚类模型的构建后,可以将此评价用户识别模型应用于交易平台的评价监控体系中。在实际中,还可以根据业务需求,定期更新所述用户识别模型。
参照图3,其示出了本申请的一种识别特定用户的方法实施例3步骤流程图,具体可以包括如下步骤:
步骤301,从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
步骤302,从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
步骤303,从所述聚类用的交易评价信息中提取评价用户作为候选用户;
步骤304,按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合;
其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
步骤305,统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。
步骤306,提取所述特定用户生成黑名单;
步骤307,当获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;
步骤308,若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
在交易平台的搜索机制中,为进一步提高搜索结果的合理性和准确性,交易评价信息所起的作用不可忽视,从用户角度而言,往往也希望对于好评较多的搜索结果数据,其搜索排序靠前,对于差评较多的搜索结果数据会,其搜索排序靠后,以节约用户查找有效数据的时间。然而,职业差评师以及各种通过虚假交易专门做出好评等各类恶意用户的存在严重干扰了这种搜索机制的可行性和有效性。本申请实施例可以针对这种情况,识别恶意用户所作用过的搜索结果数据,将恶意用户所作用过的搜索结果数据按照恶意用户的类型进行排序调整,使考虑交易评价信息的搜索机制具有完全的可行性和有效性。例如,对于一些本身很好的商品信息,不会受到职业差评师所作差评的影响,使其可以排在搜索结果的前列;对于一些本身有问题的商品信息,不会受到其通过虚假交易获得各种假好评的的影响,使其排在搜索结果的后面;从而不需要用户花时间和精力去分辨,不需要用户重新搜索,也不会使用户掉入陷阱,对于面向众多用户提供服务的交易平台服务器而言,不但可以大大节省服务器的负担,也可节省服务器与客户端的通信资源及网络资源。
具体而言,参照图4,其示出了将本申请实施例应用在交易平台搜索中的实现方法的步骤流程图,具体可以包括如下步骤:
步骤401,预置特定用户信息库,所述特定用户信息库包括多条特定用户的信息;
其中,所述特定用户的信息可以采用如图1所示的实施例获得。
步骤402,接收用户提交的搜索请求;
步骤403,依据所述搜索请求在交易平台的数据库中查找匹配的搜索结果数据;
步骤404,提取各条搜索结果数据的评价信息;
步骤405,判断所述评价信息中是否包括特定用户的信息;若是,则执行步骤406;
步骤406,调整该条搜索结果数据在所有搜索结果数据中的排序;
步骤407,将调整排序后的搜索结果数据返回给用户。
在具体实现中,若所述评价信息中没有特定用户的信息,可以直接采用原有的搜索结果排序机制,而不对其在整体搜索结果数据中的排序做出调整。
作为本申请实施例具体应用的一种示例,当所述特定用户为职业差评师时,一旦发现某条搜索结果的评价信息中包括职业差评师的信息,则可以将所述用户信息对应搜索结果数据在所有搜索结果数据中的排序调整得更为靠前;作为本申请实施例具体应用的另一种示例,当所述特定用户为专门进行虚假交易并做出好评以提升卖家等级的用户时,一旦发现某条搜索结果的评价信息中包括此类恶意用户的信息,则可以将所述用户信息对应搜索结果数据在所有搜索结果数据中的排序调整得更为靠后。当然,所述调整搜索结果排序的方法可以采用现有技术中的任一种方法,例如,通过调整各条搜索结果权重的方式等等,本申请对此不作限制。
需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
参照图5,示出了本申请的一种识别特定用户的装置实施例的结构框图,具体可以包括如下模块:
样本采集模块501,用于从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
数据清洗模块502,用于从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
用户提取模块503,用于从所述聚类用的交易评价信息中提取评价用户作为候选用户;
组织模块504,用于按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
识别模块505,用于统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户。在本申请的一种优选实施例中,所述数据清洗模块502可以包括如下子模块:
第一提取子模块,用于在所述评价信息为中评或差评时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第二提取子模块,用于在所述评价信息中的交易评分值低于第二阈值时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第三提取子模块,用于在所述评价信息中的评价内容包括预置的差评关键词时,将该条交易评价信息提取为聚类用的交易评价信息。
更为优选的是,所述交易信息中可以包括商品信息,所述数据清洗模块402可以包括如下子模块:
第一计算子模块,用于根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
第二计算子模块,用于根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
去除子模块,用于在存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息时,去除该条交易评价信息。
在本申请的一种优选实施例中,所述的装置还可以包括以下模块:
聚类建模模块,用于提取所述特定用户的特征,训练生成特定用户的评定指标。
在具体实现中,所述特定用户的特征可以包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
在这种情况下,所述的装置还可以包括以下模块:
第一用户识别处理模块,用于在获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
在本申请的一种优选实施例中,所述的装置还可以包括以下模块:
黑名单创建模块,用于提取所述特定用户生成黑名单。
在这种情况下,所述的装置还可以包括以下模块:
第二用户识别处理模块,用于在获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
本说明书中的每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种识别网上交易中特定用户的方法和一种识别网上交易中特定用户的装置进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (14)

1.一种识别特定用户的方法,其特征在于,包括:
从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
从所述聚类用的交易评价信息中提取评价用户作为候选用户;
按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户;
其中,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤包括:
若所述评价信息为中评或差评,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
若所述评价信息中的交易评分值低于第二阈值,则将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
若所述评价信息中的评价内容包括预置的差评关键词,则将该条交易评价信息提取为聚类用的交易评价信息。
2.根据权利要求1所述的方法,其特征在于,所述交易信息中包括商品信息,所述从交易评价信息的样本中筛选出聚类用的交易评价信息的步骤还包括:
根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
若存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息,则去除该条交易评价信息。
3.根据权利要求1或2所述的方法,其特征在于,还包括:
提取所述特定用户的特征,训练生成特定用户的评定指标。
4.根据权利要求3所述的方法,其特征在于,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
5.根据权利要求4所述的方法,其特征在于,还包括:
当获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;
若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
6.根据权利要求1或2所述的方法,其特征在于,还包括:
提取所述特定用户生成黑名单。
7.根据权利要求6所述的方法,其特征在于,还包括:
当获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;
若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
8.一种识别网上交易中特定用户的装置,其特征在于,包括:
样本采集模块,用于从交易平台中提取交易评价信息的样本,所述交易评价信息包括交易信息及对应的评价用户和评价信息;
数据清洗模块,用于从所述交易评价信息的样本中筛选出聚类用的交易评价信息;
用户提取模块,用于从所述聚类用的交易评价信息中提取评价用户作为候选用户;
组织模块,用于按各候选用户分别组织对应的第一评价信息集合和第二评价信息集合,其中,所述第一评价信息集合为各候选用户在所述交易评价信息的样本中对应的评价信息集合;所述第二评价信息集合为各候选用户在聚类用的交易评价信息中对应的评价信息集合;
识别模块,用于统计所述第二评价信息集合在第一评价信息集合中的占比,若超过第一阈值,则判定为特定用户;
其中,所述数据清洗模块包括:
第一提取子模块,用于在所述评价信息为中评或差评时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第二提取子模块,用于在所述评价信息中的交易评分值低于第二阈值时,将该条交易评价信息提取为聚类用的交易评价信息;
和/或,
第三提取子模块,用于在所述评价信息中的评价内容包括预置的差评关键词时,将该条交易评价信息提取为聚类用的交易评价信息。
9.根据权利要求8所述的装置,其特征在于,所述交易信息中包括商品信息,所述数据清洗模块还包括:
第一计算子模块,用于根据商品信息组织对应的评价信息,统计差评占比,所述差评占比为满足差评规则的评价信息,在该交易信息对应的所有评价信息中所占的比例;其中,所述差评规则包括:评价信息为中评或差评;和/或,评价信息中的交易评分值低于第二阈值;和/或,评价信息中的评价内容包括预置的差评关键词;
第二计算子模块,用于根据所述商品信息组织对应的评价用户,计算评价用户的分散度;
去除子模块,用于在存在所述差评占比大于第三阈值,并且,所述评价用户的分散度高于第四阈值的交易评价信息时,去除该条交易评价信息。
10.根据权利要求8或9所述的装置,其特征在于,还包括:
聚类建模模块,用于提取所述特定用户的特征,训练生成特定用户的评定指标。
11.根据权利要求10所述的装置,其特征在于,所述特定用户的特征包括评价用户的注册时间长短,购买商品的类目分布,确认收货与作为评价的时间间隔,评价内容,和/或,在交易平台的活动行为信息。
12.根据权利要求11所述的装置,其特征在于,还包括:
第一用户识别处理模块,用于在获得新的交易评价信息时,按照所述评定指标判定当前交易评价信息中的评价用户是否为特定用户;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
13.根据权利要求8或9所述的装置,其特征在于,还包括:
黑名单创建模块,用于提取所述特定用户生成黑名单。
14.根据权利要求13所述的装置,其特征在于,还包括:
第二用户识别处理模块,用于在获得新的交易评价信息时,提取当前交易评价信息中的评价用户,判断所述评价用户是否在黑名单中;若是,则屏蔽或删除所述特定用户的评价信息,或者,降低所述特定用户的评价信息的权重。
CN201210258891.1A 2012-07-24 2012-07-24 一种识别特定用户的方法和装置 Active CN103577988B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210258891.1A CN103577988B (zh) 2012-07-24 2012-07-24 一种识别特定用户的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210258891.1A CN103577988B (zh) 2012-07-24 2012-07-24 一种识别特定用户的方法和装置

Publications (2)

Publication Number Publication Date
CN103577988A CN103577988A (zh) 2014-02-12
CN103577988B true CN103577988B (zh) 2017-08-04

Family

ID=50049725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210258891.1A Active CN103577988B (zh) 2012-07-24 2012-07-24 一种识别特定用户的方法和装置

Country Status (1)

Country Link
CN (1) CN103577988B (zh)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933570A (zh) * 2014-03-20 2015-09-23 阿里巴巴集团控股有限公司 用户侦测方法及装置
CN105281971A (zh) * 2014-07-23 2016-01-27 江苏威盾网络科技有限公司 一种基于可信度的网络账号异常检测方法
CN104281665B (zh) * 2014-09-25 2018-05-25 北京百度网讯科技有限公司 一种用于确定评论的有效性的方法与装置
CN104462333B (zh) * 2014-12-03 2017-08-25 上海同刚网络科技有限公司 购物搜索推荐与告警方法和系统
CN106161360B (zh) * 2015-04-02 2019-09-20 阿里巴巴集团控股有限公司 用户注册方法及装置
CN106294355A (zh) * 2015-05-14 2017-01-04 阿里巴巴集团控股有限公司 一种业务对象属性的确定方法及设备
CN105373584A (zh) * 2015-10-14 2016-03-02 北京乐动卓越科技有限公司 用户标签管理方法、用户确定方法和云端服务器
CN106991425B (zh) * 2016-01-21 2020-10-02 阿里巴巴集团控股有限公司 商品交易质量的检测方法和装置
CN107169768B (zh) * 2016-03-07 2021-07-27 阿里巴巴集团控股有限公司 异常交易数据的获取方法和装置
CN107274042A (zh) * 2016-04-06 2017-10-20 阿里巴巴集团控股有限公司 一种业务参与对象的风险识别方法及装置
CN105955990A (zh) * 2016-04-15 2016-09-21 北京理工大学 一种兼顾多样性和有效性的评论排序和筛选方法
CN107643974B (zh) * 2016-07-20 2021-03-02 阿里巴巴集团控股有限公司 一种召回信息的发送方法和装置
TWI639129B (zh) 2016-07-28 2018-10-21 劉經文 社群互動之信用評等及媒合之方法及系統
CN108335109A (zh) * 2017-01-17 2018-07-27 百度在线网络技术(北京)有限公司 点评系统的管理方法及装置
CN107656918B (zh) * 2017-05-10 2019-07-05 平安科技(深圳)有限公司 获取目标用户的方法及装置
CN107391545B (zh) * 2017-05-25 2020-09-18 阿里巴巴集团控股有限公司 一种对用户进行分类的方法、输入方法及装置
CN109426978A (zh) * 2017-08-29 2019-03-05 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN107679887A (zh) * 2017-08-31 2018-02-09 北京三快在线科技有限公司 一种商户评分的处理方法和装置
CN109961309B (zh) * 2017-12-25 2021-09-28 网智天元科技集团股份有限公司 业务推荐方法和系统
CN109064192A (zh) * 2018-07-16 2018-12-21 深圳市丰巢科技有限公司 根据消费者信用等级对商品评价举报的处理方法及系统
CN109003181B (zh) * 2018-08-17 2022-05-13 腾讯科技(深圳)有限公司 可疑用户确定方法、装置、设备和计算机可读存储介质
CN109325697A (zh) * 2018-09-29 2019-02-12 深圳市领秀航者互联网股份有限公司 产品的评价邀请方法、系统及计算机可读存储介质
CN110288431A (zh) * 2019-06-11 2019-09-27 达疆网络科技(上海)有限公司 一种根据用户差评情况识别恶意用户的方法
CN113436712B (zh) * 2021-06-08 2024-01-09 四川临丰医疗科技有限公司 一种用于智慧医疗云服务平台的评价管理系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661487A (zh) * 2008-08-27 2010-03-03 国际商业机器公司 对信息项进行搜索的方法和系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101661487A (zh) * 2008-08-27 2010-03-03 国际商业机器公司 对信息项进行搜索的方法和系统

Also Published As

Publication number Publication date
CN103577988A (zh) 2014-02-12

Similar Documents

Publication Publication Date Title
CN103577988B (zh) 一种识别特定用户的方法和装置
CN110009372B (zh) 一种用户风险识别方法和装置
CN107146089B (zh) 一种刷单识别方法及装置,电子设备
CN102841946B (zh) 商品数据检索排序及商品推荐方法和系统
TWI512653B (zh) Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance
JP5456412B2 (ja) コミュニティに基づく広告語あいまいさ除去システム及び方法
CN109711955B (zh) 基于当前订单的差评预警方法、系统、黑名单库建立方法
CN110647590A (zh) 一种目标社群数据的识别方法及相关装置
CN108038696B (zh) 基于设备标识码和社交群组信息的刷单检测方法及系统
CN107239891A (zh) 一种基于大数据的招投标审核方法
CN108573432B (zh) 用于电子商务的交易监管系统和方法
CN107330445A (zh) 用户属性的预测方法和装置
CN102956009A (zh) 一种基于用户行为的电子商务信息推荐方法与装置
CN108648038B (zh) 一种基于子图挖掘的信用炒作与恶意评价识别方法
CN106886518A (zh) 一种微博账号分类的方法
CN103310353B (zh) 一种抗攻击的数据过滤优化系统和方法
Elshaar et al. Semi-supervised classification of fraud data in commercial auctions
CN106910101A (zh) 群体虚假交易识别方法及装置
WO2017092601A1 (zh) 数据处理方法及装置
CN112613953A (zh) 一种商品选品方法、系统及计算机可读存储介质
CN103309885B (zh) 一种在电子交易平台中识别特征用户的方法及装置和搜索方法及装置
Wu et al. Application of machine learning to identify Counterfeit Website
Fire et al. Large-Scale Shill Bidder Detection in E-commerce
CN107515928A (zh) 一种判断资产价格走势的方法、装置、服务器、存储介质
CN109544299A (zh) 基于交易保障平台的买家身份评级方法、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20191210

Address after: P.O. Box 31119, grand exhibition hall, hibiscus street, 802 West Bay Road, Grand Cayman, Cayman Islands

Patentee after: Innovative advanced technology Co., Ltd

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Co., Ltd.

TR01 Transfer of patent right