CN103136250A - 信息更换识别方法、装置以及信息搜索方法、系统 - Google Patents

信息更换识别方法、装置以及信息搜索方法、系统 Download PDF

Info

Publication number
CN103136250A
CN103136250A CN2011103883135A CN201110388313A CN103136250A CN 103136250 A CN103136250 A CN 103136250A CN 2011103883135 A CN2011103883135 A CN 2011103883135A CN 201110388313 A CN201110388313 A CN 201110388313A CN 103136250 A CN103136250 A CN 103136250A
Authority
CN
China
Prior art keywords
information
current
similarity
historical
exhibition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011103883135A
Other languages
English (en)
Other versions
CN103136250B (zh
Inventor
张霄
潘健民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110388313.5A priority Critical patent/CN103136250B/zh
Publication of CN103136250A publication Critical patent/CN103136250A/zh
Priority to HK13108669.8A priority patent/HK1181494A1/zh
Application granted granted Critical
Publication of CN103136250B publication Critical patent/CN103136250B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种信息更换识别方法、装置以及信息搜索方法、系统,该方法包括:获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;根据得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;将得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。本发明提高了识别信息更换时的识别准确性。

Description

信息更换识别方法、装置以及信息搜索方法、系统
技术领域
本申请涉及网络技术领域,尤指一种信息更换识别方法、装置以及信息搜索方法、系统。
背景技术
随着互联网的飞速发展,电子商务也得到蓬勃发展,网上购物逐渐成为主流购物方式之一。电子商务为买家提供了方便快捷的购物方式,买家足不出户就能购买到全国各地甚至国外的商品,但这种购物方式存在一些潜在的不安全因素。
在虚拟的网络中买家很容易被一些表面的假象所欺骗,卖家为了获得更多的利益,会想方设法增加自己的商品在搜索中展现的机会,因而产生了一种新的作弊方式“商品偷换”。所谓商品偷换是指卖家销售A商品时,会积累销量、评价等信息;当买家开始销售B商品时,在网页上将A商品的部分信息偷换成B商品的信息,这样B商品就继承了A商品原有的信息,例如销量、评价等信息。买家在页面上看到的销量、评价等信息,可能并不属于现在展示出来的B商品,而买家却误认为是B商品的销量、评价,从而有可能选择B商品,这就提高了B商品的访问量和成交量。由于B商品使用的是A商品积累的销量、评价等信息,而非自身积累的销量、评价等信息,因此,这对其他卖家和买家会产生不良影响,例如在对销量进行排序的情况下,B商品就会排在比较靠前的位置,这影响到其他卖家的排序位置,严重影响电子商务公平公正的原则;并且还会误导买家的购物意向,损害买家利益。
在现有技术中商品偷换识别方法是,通过分析商品的当前展示信息的当前类目和在设定时间内商品的每个历史交易信息的历史类目是否一致,将计算出的商品的当前展示信息的当前价格和在设定时间内该商品的每个历史交易信息的历史价格的差异,来确定是否发生了商品偷换。例如,若当前类目与历史类目一致,如果当前价格是历史价格的5倍时,会认为商品偷换的可能性比较大。
现有技术中商品偷换识别方法考虑的商品特征信息过于简单,尤其是仅仅根据当前类目与商品类目是否一致,以及当前价格与历史价格的倍数关系进行判断,而该倍数关系不能全面反应商品价格的变化量,例如:0.1元的纽扣与0.05元的纽扣相差2倍,两者的区别不是很大,商品偷换的可能性不是很大;1000元的沙发和2000元的沙发同样是相差2倍,两者的区别比较大,商品偷换的可能性就很大,但是采用现有技术的方案对于纽扣和沙发的判断结果是一样的,识别商品偷换的准确性比较低。
因此,现有技术中,在识别商品偷换时考虑的商品的特征信息太简单,识别准确性较低,不能准确、有效的识别出被偷换的商品信息,进而影响了提供的商品信息的准确性和有效性。
发明内容
本申请实施例提供一种信息更换识别方法、装置以及信息搜索方法、系统,用以解决现有技术中在识别商品偷换时存在的识别准确性较低,导致提供的商品的展示信息的准确性和有效性较低的问题。
一种信息更换识别方法,包括:
获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;
根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;
根据得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;
将得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。
一种信息搜索方法,包括:
根据用户输入的搜索信息,获取与所述搜索信息匹配的当前展示信息;
针对获取的当前展示信息,根据上述的信息更换识别方法判断所述展示信息相对于所述历史展示信息是否发生了信息更换;
返回相对于历史展示信息没有发生信息更换的当前展示信息。
一种信息更换识别装置,包括:
特征信息获取单元,用于获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;
维度相似度获取单元,用于根据所述特征信息获取单元获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;
综合相似度获取单元,用于根据所述维度相似度获取单元得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;
信息更换识别单元,用于将所述综合相似度获取单元得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。
一种信息搜索系统,包括:
获取模块,用于根据用户输入的搜索信息,获取与所述搜索信息匹配的当前展示信息;
上述的信息更换识别装置,用于针对获取的当前展示信息,判断所述展示信息相对于所述历史展示信息是否发生了信息更换;
返回模块,用于返回相对于历史展示信息没有发生信息更换的当前展示信息。
本申请有益效果如下:
本申请实施例提供了信息更换识别方法、装置以及信息搜索方法、系统,信息更换识别方法获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;根据得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;将得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。该方案不仅要得到至少两个维度的相似度,还要进一步根据得到的至少两个维度的当前特征信息和历史特征信息的相似度得到综合相似度,再将该综合相似度与设定的相似度阈值进行比较确定当前展示信息相对于历史展示信息是否发生了信息更换;相对于现有技术仅仅根据商品当前类目、历史类目是否变化和当前价格、历史价格的倍数来识别商品是否发生了更换的方法,该方案在识别信息更换时不仅考虑的维度更多,而且会考虑这些维度的综合因素,及不仅计算每个维度的相似度,还要综合多个维度的相似度得到综合相似度,从而使得信息更换识别更准确、有效,提高了识别信息更换时的识别准确性,进而能够提供给用户更准确、有效的展示信息进行选择,减少用户搜索匹配操作的复杂度,节约系统资源,使用户能够尽快获取到合适的展示信息。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中信息更换识别方法的流程图;
图2为本申请实施例中优选的信息更换识别方法的流程图;
图3为本申请实施例中信息更换识别装置的结构示意图;
图4为本申请实施例中信息搜索系统的结构示意图;
图5为本申请实施例中信息搜索方法的流程图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了解决现有技术中在识别商品偷换时存在的识别准确性较低,导致提供的商品的展示信息的准确性和有效性较低的问题,本申请实施例提供的一种信息更换识别方法,其流程如图1所示,执行步骤如下:
步骤S101:获取当前展示信息的至少两个维度的当前特征信息,以及获取当前展示信息的历史展示信息的至少两个维度的历史特征信息。
当前展示信息可以是网页上针对某个具体商品的展示出来的信息,例如,运动鞋、钟表等等商品,当前展示信息可以包括多个维度的当前特征信息,例如当前价格信息、当前标题信息、当前类目信息等等。而网页上的商品之前发生交易操作时展示的信息则是该商品的历史展示信息,当前展示信息的历史展示信息也可以有包括多个维度的历史特征信息,例如,历史价格信息、历史标题信息、历史类目信息等等。在本实施例中,首先在当前展示信息中获取至少两个维度的当前特征信息,然后在当前展示信息的历史展示信息中,获取与当前展示信息相同维度的历史特征信息,再根据获取的至少两个维度的当前特征信息和历史特征信息来识别是否发生了信息更换,进而就可以确定是否发生了商品更换。
步骤S102:根据获取的至少两个维度的当前特征信息和历史特征信息,分别得到至少两个维度的当前特征信息和历史特征信息的相似度。
针对获取的每个维度的当前特征信息和历史特征信息,得到该维度的当前特征信息和历史特征信息的相似度,例如:根据当前标题信息和历史标题信息,就可以得到当前标题信息和历史标题信息的相似度;根据当前价格信息和历史价格信息,就可以得到当前价格信息和历史价格信息的相似度。
步骤S103:根据得到的至少两个维度的相似度,确定当前展示信息与历史展示信息的综合相似度。
综合考虑得到的各个维度的当前特征信息和历史特征信息的相似度,得到当前展示信息与历史展示信息的综合相似度。
步骤S104:将得到的综合相似度与设定的相似度阈值进行比较,确定当前展示信息相对于历史展示信息是否发生了信息更换。
可以根据实际的需要或者根据大量的统计结果等情况,预先设定一个相似度阈值,将得到的当前展示信息与历史展示信息的综合相似度值与设定的相似度阈值进行比较,当上述综合相似度大于设定的相似度阈值时,确定当前展示信息相对于历史展示信息发生了信息更换;或者当上述综合相似度小于设定的相似度阈值时,确定当前展示信息相对于历史展示信息发生了信息更换。
具体的,上述步骤S102中的根据获取的当前特征信息和历史特征信息的类型不同,得到所获取的维度的当前特征信息和历史特征信息的相似度的方法也不相同,下面针对当前特征信息和历史特征信息的三种类型,介绍三种得到所获取的维度的当前特征信息和历史特征信息的相似度的方法:
第一种:当获取的当前特征信息和历史特征信息是类别属性信息时,判断获取的当前特征信息与历史特征信息是否相同;若是,获取的当前特征信息和历史特征信息的相似度为第一相似度值;否则,获取的当前特征信息和历史特征信息的相似度为第二相似度值。
当获取的当前展示信息的一个或几个维度的当前特征信息和该当前展示信息的历史展示信息的相同维度的历史特征信息是类别属性信息时,就可以通过判断相同维度的当前特征信息和历史特征信息是否相同来确定该维度的当前特征信息和历史特征信息的相似度值,如果判断结果为相同,给予第一相似度值;如果判断结果为不相同,给予第二相似度值。第一相似度值和第二相似度值是根据实际的需要或者大量的统计结果得到的数值,可以取0-1之间的任意数值,例如第一相似度值设置为0.9,第二相似度值设置为0.8,当然也可以设定为其他范围内的数值。
商品的当前展示信息可以包括当前一级类目信息、当前虚拟实体类目信息、当前叶子类目信息等等多个维度的当前特征信息,其中,一级类目是最大的类目,可以是服装、鞋、家电等等类目;虚拟实体类目是指商品是虚拟的还是实体的,例如充值卡是虚拟类的,而服装就是实体类的;叶子类目是相对于一级类目来说是较小的类目,一级类目下可以包括多个叶子类目,例如一级类目服装下可以包括男装、女装、童装等等叶子类目。
当前一级类目信息和历史一级类目信息是类别属性信息,通过判断当前一级类目信息和历史一级类目信息是否相同直接给予当前一级类目信息和历史一级类目信息的相似度值,例如,当判断结果为相同时,该当前一级类目信息和历史一级类目信息的相似度为0.9,当判断结果为不相同时,该当前一级类目信息和历史一级类目信息的相似度为0.8;当前虚拟实体类目信息和历史虚拟实体类目信息是类别属性信息,通过当前虚拟实体类目信息和历史虚拟实体类目信息是否相同直接给予当前虚拟实体类目信息和历史虚拟实体类目信息的相似度值,例如,当判断结果为相同时,该当前虚拟实体类目信息和历史虚拟实体类目信息的相似度为0.9,当判断结果为不相同时,该当前虚拟实体类目信息和历史虚拟实体类目信息的相似度为0.8;当前叶子类目信息和历史叶子类目信息是类别属性信息,通过判断当前叶子类目信息和历史叶子类目信息是否相同直接给予叶子类目维度的相似度值,例如,当判断结果为相同时,该当前叶子类目信息和历史叶子类目信息的相似度为0.9,当判断结果为不相同时,该当前叶子类目信息和历史叶子类目信息的相似度为0.8。
上述针对不同的判断结果给出的相似度值仅为示例说明,并不局限于该数值。针对上述三个维度的当前特征信息和历史特征信息相同的情况,可以给予三个维度的当前特征信息和历史特征信息的相似度同一个相似度值,也可以分别给予不同的相似度值;同样的,针对上述三个维度的当前特征信息和历史特征信息不相同的情况,可以给予三个维度的当前特征信息和历史特征信息的相似度同一个相似度值,也可以分别给予不同的相似度值。
第二种:当获取的当前特征信息和历史特征信息是文本描述信息时,预处理获取的当前特征信息和历史特征信息,得到当前特征信息长度、历史特征信息长度以及预处理后的当前特征信息和历史特征信息的公共字串长度;根据得到的当前特征信息长度、历史特征信息长度和公共字串长度,得到当前特征信息和历史特征信息的相似度。
当获取的当前展示信息的一个或几个维度的当前特征信息和该当前展示信息的历史展示信息的相同维度的历史特征信息是文本描述信息时,就可以通过预处理该维度的当前特征信息和历史特征信息,根据预处理后的该维度的当前特征信息和历史特征信息,确定当前特征信息和历史特征信息的相似度值。下面以获取的是当前展示信息的当前标题信息和当前展示信息的历史特征信息的历史标题信息为例,介绍计算当前标题信息和历史标题信息的相似度的过程。
较优的,当获取的当前特征信息和历史特征信息是标题信息时,上述根据得到的当前特征信息长度、历史特征信息长度和公共字串长度,得到当前特征信息和历史特征信息的相似度,具体包括:
采用下列公式计算得到当前标题信息和历史标题信息的相似度:
Figure BDA0000113848400000081
其中,La表示预处理后的当前标题信息长度;Lb表示预处理后的历史标题信息长度;Cab表示预处理后的当前标题信息和历史标题信息的公共字串长度。
下面详细介绍当前标题信息和历史标题信息的相似度的计算过程:
首先,对当前标题信息和历史标题信息进行预处理。在电子商务中较理想的情况是:一个当前展示信息的当前标题信息,是对当前展示信息最简洁、全面、概括性的描述,下面以商品的标题信息为例进行说明。但是在现实中,由于各卖家的语言表达水平不同,对商品的标题信息的认识不同,导致标题信息会出现各类冗余信息,严重影响了当前标题信息和历史标题信息的相似度比较。所以当前标题信息和历史标题信息预处理的好坏直接影响了当前标题信息和历史标题信息的相似度计算的精准度。
本申请中采用的预处理步骤包括分词、去停用词、去重、排序,下面详细介绍每个步骤。分词就是以词作为最小的过滤单元切分当前标题信息和历史标题信息,并对切分之后的词进行词性标注;去停用词主要是去除当前标题信息和历史标题信息中的那些与该商品本身无关的词,例如邮费介绍(如:江浙沪包邮,全国包邮等)、促销词(如:买一送一,满百包邮等)、表示时间的词(如:2011年,9月,十一,五一)等;去重就是对于在当前标题信息和历史标题信息中重复出现多次的词,只保留一个,重复的词给当前标题信息和历史标题信息造成冗余,不利于当前标题信息和历史标题信息的相似度计算;排序就是对当前标题信息和历史标题信息进行去停用词、去重处理后得到的词进行排序,由于在电子商务商品的当前展示信息中,标题信息是非常重要的特征信息,而卖家描述商品的当前标题信息和历史标题信息不一定是连贯的、主谓宾完整的语句,有时卖家通过使用大量的词组、短语组合形成一个当前标题信息和历史标题信息,使用的这些短语、词组之间相对位置较为灵活,顺序、倒序含义基本一致,例如:“圆领红色T恤”与“红色T恤圆领”的含义是一致的,因此,在当前标题信息和历史标题信息的预处理过程中排序是非常重要的。
其次,进行当前标题信息和历史标题信息的相似度计算。计算当前标题信息和历史标题信息的相似度的方法有很多中,在本实施例中采用最大公共字串方法来计算当前标题信息和历史标题信息的相似度。
以字为单位计算预处理后的当前标题信息和历史标题信息的公共字串长度,也就是计算预处理后的当前标题信息和历史标题信息共同包含的相同的字的个数,如果预处理后的当前标题信息和历史标题信息包含英文单词,该英文单词作为一个字,这是因为整体英文单词才能表达一个意思,这与中文是不同的,在中文中单个字通常也可以表达一个很明确的意思:例如“汽车”、“车”的意思是很明确的。
假设La表示预处理后的当前标题信息长度;Lb表示预处理后的历史标题信息长度;Cab表示预处理后的当前标题信息和历史标题信息的公共字串长度,那么,当前标题信息和历史标题信息的相似度可以采用公式
Figure BDA0000113848400000101
计算得到,该当前标题信息和历史标题信息的相似度是最大公共字串与当前标题信息和历史标题信息的占比的平均值。
第三种:当获取的当前特征信息和历史特征信息是数字描述信息时,在当前展示信息的当前特征信息与历史展示信息的历史特征信息的差值,以及当前展示信息的当前特征信息分别与当前展示信息的其他选定历史展示信息的历史特征信息的差值中,取出最大差值;根据预设的权重、当前特征信息与历史特征信息的差值和取出的最大差值,得到当前特征信息与所述历史特征信息的相似度。
当获取的当前展示信息的一个或几个维度的当前特征信息和该当前展示信息的历史展示信息的相同维度的历史特征信息是数字描述信息时,就可以处理该维度的当前特征信息和历史特征信息,根据处理后的该维度的当前特征信息和历史特征信息来确定该维度的当前特征信息和历史特征信息的相似度值。下面以获取的当前特征信息和历史特征信息是价格信息为例介绍计算当前价格信息和历史价格信息的相似度的过程。
较优的,当获取的当前特征信息和历史特征信息是价格信息时,上述根据预设的权重、当前特征信息与历史特征信息的差值和取出的最大差值,得到当前特征信息与选择的一个历史特征信息的相似度,具体包括:
采用公式计算当前价格信息和选择的一个历史价格信息的相似度:
P ab = w × ( P a - P b ) max ( P a - P b , P a - P c , P a - P d . . . . . . ) ; 其中,Pa表示的当前价格信息a;Pb表示选择的一个历史价格信息b;Pab表示当前价格信息和选择的一个历史价格信息的相似度;max(Pa-Pb,Pa-Pc,Pa-Pd......)表示在当前展示信息中的当前价格信息与选择的一个历史展示信息的历史价格信息的差值,以及当前展示信息中的当前价格信息分别与当前展示信息的其他选定历史展示信息中的历史价格信息的差值中的最大差值;w表示设定的权重,x=|Pa-Pb|,当x≤20时;w=x/40;当20<x<400时,w=0.5+x/800;当x≥400时,w=1。
下面详细介绍当前价格信息和历史价格信息的相似度的计算过程。
当前价格信息和历史价格信息的相似度较容易理解为倍数的关系,但是,增加的倍数或者减少的倍数在很多情况下不能明确的说明当前价格信息和历史价格信息的变化量。例如:0.05元的纽扣与0.1元纽扣相差0.05元,是两倍的关系;同样是两倍关系的1000元的沙发和2000元的沙发相差1000元,因此单纯的像现有技术一样通过倍数来反映当前价格信息和历史价格信息的相似度是非常不准确的,所以本申请使用上述公式来计算当前价格信息和历史价格信息的相似度。
具体的,上述步骤S103中的根据得到的至少两个维度的相似度,确定当前展示信息与历史展示信息的综合相似度,具体包括:
将得到的各个维度的当前特征信息和历史特征信息的相似度相乘得到当前展示信息与历史展示信息的综合相似度;或者根据得到的各个维度的当前特征信息和历史特征信息的相似度和各个维度的权重,得到当前展示信息与历史展示信息的综合相似度。
根据得到的各个维度的当前特征信息和历史特征信息的相似度,有多种方法可以计算当前展示信息与历史展示信息的综合相似度,下面列举两种方法:一种是将各个维度的当前特征信息和历史特征信息的相似度相乘,得到当展示信息与历史展示信息的综合相似度;另一种是首先计算每个维度的当前特征信息和历史特征信息的相似度和该维度的权重的乘积,然后再将每个维度的当前特征信息和历史特征信息的相似度和该维度的权重的乘积相加,得到当前特征信息与历史特征信息的综合相似度。
较优的,本申请的信息更换识别方法,还包括:获取当前展示信息的选定维度的当前特征信息,以及获取当前展示信息的历史展示信息的选定维度的历史特征信息;判断该选定维度的当前特征信息与历史特征信息是否相同,若相同,确定当前展示信息相对于所述历史展示信息没有发生信息更换;若不相同,再执行步骤S101中的获取当前展示信息的至少两个维度的当前特征信息,以及获取当前展示信息的历史展示信息的至少两个维度的历史特征信息;其中,至少两个维度为除该选定维度外的至少两个维度。
可以直接判断选定维度的当前特征信息和历史特征信息的结果是否相同,当判断结果为相同时,也就是说该选定维度的当前特征信息和历史特征信息相同时,确定当前展示信息相对于历史展示信息没有发生信息更换。当判断结果为不相同时,也就是说该选定维度的当前特征信息和历史特征信息不同时,再执行步骤S101,进行后续的步骤。
该选定维度可以是主图URL等等,若当前展示信息的当前主图URL信息和当前展示信息的历史展示信息的历史主图URL信息相同时,确定当前展示信息和历史展示信息没有发生信息更换,也就是说没有发生商品更换;若当前展示信息的当前主图URL信息和当前展示信息的历史展示信息的历史主图URL信息不相同时,再获取当前展示信息的其他维度的当前特征信息和当前展示信息的历史展示信息的相同维度的历史特征信息,然后计算各个维度的当前特征信息和当前展示信息的相似度,根据各个维度的当前特征信息和当前展示信息的相似度得到当前展示信息和历史展示信息的综合相似度,将该综合相似度和设定的相似度阈值进行比较再确定当前展示信息和历史展示信息是否发生了信息更换。
具体的,当当前展示信息的历史展示信息有多个时,相应的,可以分别得到当前展示信息与多个历史展示信息的综合相似度。
上述步骤S104中的将得到的综合相似度与设定的相似度阈值进行比较,确定当前展示信息相对于历史展示信息是否发生了信息更换,具体包括:根据设定的综合相似度选取规则,在得到的当前展示信息与多个历史信息的综合相似度中选取一个综合相似度;将选取的综合相似度与设定的相似度阈值进行比较,确定当前展示信息相对于历史展示信息是否发生了信息更换。
同一个当前展示信息可以有多个历史展示信息,例如:对应于商品的当前展示信息,在一段时间内可能会发生多次交易,每次交易都会记录一个历史展示信息。可以分别计算当前展示信息与一段时间内的所有历史展示信息的综合相似度,也可以计算当前展示信息与一段时间内的一些历史展示信息的综合相似度,这样都会得到多个综合相似度。
设定综合相似度选取规则,例如:选取多个综合相似度中最小的或者最大的与设定的相似度阈值进行比较,或者取所有综合相似度的平均值与设定的相似度阈值进行比较,来确定当前展示信息相对于历史展示信息是否发生了信息更换。
下面以一个具体的实施例来说明本申请中的信息更换识别方法的详细流程,如图2所示,具体步骤如下:
步骤S201:获取当前展示信息的选定维度的当前特征信息,以及获取当前展示信息的历史展示信息的选定维度的历史特征信息。
选定的维度可以是主图URL等等其他维度,只要能根据该选定维度的当前特征信息和历史特征信息是否相同,确定当前展示信息相对于当前展示信息的历史特征信息没有发生信息更换即可。选定维度可以是一个也可以是多个,当选定维度是多个时,可以依次判断,也可以分别判断后再综合考虑。本实施例中以选定维度为一个为例进行说明。
步骤S202:判断该选定维度的当前特征信息与历史特征信息是否相同,若相同,执行步骤S223;若不相同,执行步骤S203。
当选定维度的当前特征信息与历史特征信息相同时,即可确定当前展示信息相对于该当前展示信息的历史展示信息没有发生信息更换,也就确定了商品没有发生更换。
步骤S203:获取当前展示信息的除选定维度外的五个维度的当前特征信息,以及获取当前展示信息的历史展示信息的相同维度的历史特征信息。
获取当前展示信息的出选定维度外的至少两个维度的当前特征信息,以及获取该当前展示信息的历史展示信息的相同维度的历史特征信息。在本实施例中,以获取一级类目、虚拟实体类目、叶子类目、标题、价格这五个维度为例进行说明,当然也可以选取其他维度。下面详细介绍通过这五个维度的当前特征信息和历史特征信息来识别是否发生了信息更换的过程。
步骤S204:计算当前标题和历史标题的相似度、当前价格和历史价格的相似度。
可以采用本申请中的当前标题信息和历史标题信息的相似度计算公式来计算当前标题信息和历史标题信息的相似度,假设结果为S1,采用本申请中的当前价格信息和历史价格信息的相似度的计算公式计算当前价格信息和历史价格信息的相似度,假设结果为S2
步骤S205:判断一级类目是否发生变化,即当前展示信息的一级类目与历史展示信息的一级类目是否相同,若相同,执行步骤S206;否则,执行步骤S214。
步骤S206:确定一级类目这个维度的相似度为第一相似度值。
即当前展示信息的一级类目与历史展示信息的一级类目的相似度为第一相似度值,假设为S3
步骤S207:判断虚拟实体类目是否发生变化,即判断当前展示信息的虚拟实体类目信息与历史展示信息的虚拟实体类目信息是否相同。若相同,执行步骤S208;否则,执行步骤S211。
步骤S208:确定虚拟实体类目这个维度的相似度为第一相似度值。
即当前展示信息的虚拟实体类目与历史展示信息的虚拟实体类目的相似度为第一相似度值,为S3
步骤S209:根据标题的相似度、价格的相似度、一级类目的相似度、虚拟实体类目的相似度得到综合相似度。
即根据当前标题信息与历史标题信息的相似度、当前价格信息与历史价格信息的相似度、当前一级类目信息与历史一级类目信息的相似度、当前虚拟实体类目与历史虚拟实体类目的相似度,得到当前展示信息与历史展示信息的综合相似度。可以直接将上述四个维度的相似度相乘得到综合相似度,即Score=S1*S2*S3*S3;也可以将每个维度的相似度与该维度的权重相乘,再将四个乘积相加得到综合相似度值,即Score=S1*W1+S2*W2+S3*W3+S3*W4,假设标题的权重为W1,价格的权重为W2,一级类目的权重为W3,虚拟实体类目的权重为W4。这里仅仅列举了两种得到综合相似度的方法,还有其他计算方法在这里不再赘述。
步骤S210:判断得到的综合相似度Score是否小于设定的第一相似度阈值。若是,执行步骤S222;否则,执行步骤S223。
步骤S211:确定虚拟实体类目这个维度的相似度为第二相似度值。
即当前展示信息的虚拟实体类目与历史展示信息的虚拟实体类目的相似度为第一相似度值,假设为S4
步骤S212:根据标题的相似度、价格的相似度、一级类目的相似度、虚拟实体类目的相似度得到综合相似度。
即根据当前标题信息与历史标题信息的相似度、当前价格信息与历史价格信息的相似度、当前一级类目信息与历史一级类目信息的相似度、当前虚拟实体类目与历史虚拟实体类目的相似度,得到当前展示信息与历史展示信息的综合相似度,可以直接将上述四个维度的相似度相乘得到综合相似度,即Score=S1*S2*S3*S4;也可以将每个维度的相似度与该维度的权重相乘,再将四个乘积相加得到综合相似度,即Score=S1*W1+S2*W2+S3*W3+S4*W4
步骤S213:判断得到的综合相似度Score是否小于设定的第二相似度阈值,若是执行步骤S222;否则,执行步骤S223。
步骤S214:确定一级类目这个维度的相似度为第二相似度值。
即当前展示信息的一级类目与历史展示信息的一级类目的相似度值为第二相似度值S4
步骤S215:判断叶子类目是否发生变化,即判断当前展示信息的叶子类目信息与历史展示信息的叶子类目信息是否相同,若相同,执行步骤S216;否则,执行步骤S219。
步骤S216:确定叶子类目这个维度的相似度为第一相似度值。
即当前展示信息的叶子类目与历史展示信息的叶子类目的相似度为第一相似度值S3
步骤S217:根据标题的相似度、价格的相似度、一级类目的相似度、叶子类目的相似度得到综合相似度。
即根据当前标题信息与历史标题信息的相似度、当前价格信息与历史价格信息的相似度、当前一级类目信息与历史一级类目信息的相似度、当前叶子类目信息与历史叶子类目信息的相似度,得到当前展示信息与历史展示信息的综合相似度,可以直接将上述四个维度的相似度相乘得到综合相似度,即Score=S1*S2*S4*S3;也可以将每个维度的相似度与该维度的权重相乘,再将四个乘积相加得到综合相似度值,即Score=S1*W1+S2*W2+S4*W3+S3*W5,假设叶子类目的权重为W5
步骤S218:判断得到的综合相似度Score是否小于设定的第三相似度阈值,若是执行步骤S222;否则,执行步骤S223。
步骤S219:确定叶子类目这个维度的相似度为第二相似度值。
即当前展示信息的叶子类目与历史展示信息的叶子类目的相似度为第二相似度值,为S4
步骤S220:根据标题的相似度、价格的相似度、一级类目的相似度、叶子类目的相似度得到综合相似度。
即根据当前标题信息与历史标题信息的相似度、当前价格信息与历史价格信息的相似度、当前一级类目信息与历史一级类目信息的相似度、当前叶子类目与历史叶子类目的相似度,得到当前展示信息与历史展示信息的综合相似度,可以直接将上述四个维度的相似度相乘得到综合相似度,即Score=S1*S2*S4*S4;也可以将每个维度的相似度与该维度的权重相乘,再将四个乘积相加得到综合相似度值,即Score=S1*W1+S2*W2+S4*W4+S4*W5
步骤S221:判断得到的综合相似度Score是否小于设定的第四相似度阈值,若是执行步骤S222;否则,执行步骤S223。
步骤S222:确定当前展示信息相对于历史展示信息发生了信息更换。
步骤S223:确定当前展示信息相对于历史展示信息没有发生信息更换。
上述对于一级类目、虚拟实体类目、叶子类目的判断顺序是:首先判断一级类目是否变话,如果一级类目变化了,再判断虚拟实体类目是否变化;如果一级类目没有发生变化,则判断叶子类目是否发生变化。本实施例仅仅给出一个示例,当然也可以依据实际需要改变对于三个维度的判断顺序,以便后续得到更好的综合相似度值,进而能够准确判断当前展示信息与历史展示信息是否发生了信息更换。在上述实施例中给出的优选方式是根据前一个维度的判断结果选择后一个维度,当然实际操作中也可以根据需要任意选择至少两个维度。
上述步骤中的第一相似度阈值、第二相似度阈值、第三相似度阈值、第四相似度阈值可以根据实际的需要设定,也可以根据大量统计结果来设定,然后将得到的Score与设定的相似度阈值进行比较,当Score小于设定的相似度阈值时,即可认定当前展示信息相对于历史展示信息发生了信息更换,也就是说网页上的商品信息发生了偷换,然后可以对该商品信息进行降权处理或者召回该商品信息;当Score不小于设定的相似度阈值时,即可认定当前展示信息相对于历史展示信息没有发生信息更换。
该方案不仅要得到至少两个维度的相似度,还要进一步根据得到的至少两个维度的当前特征信息和历史特征信息的相似度得到综合相似度,再将该综合相似度与设定的相似度阈值进行比较确定当前展示信息相对于历史展示信息是否发生了信息更换;相对于现有技术仅仅根据商品当前类目、历史类目是否变化和当前价格、历史价格的倍数来识别商品是否发生了更换的方法,该方案在识别信息更换时不仅考虑的维度更多,而且会考虑这些维度的综合因素,及不仅计算每个维度的相似度,还要综合多个维度的相似度得到综合相似度,从而使得信息更换识别更准确、有效,提高了识别信息更换时的识别准确性。
基于统一发明构思,本申请实施例提供一种信息更换识别装置,该信息更换识别装置可以设置在用于识别信息是否更换的网络设备中,该装置的结构如图3所示,包括:
特征信息获取单元10,用于获取当前展示信息的至少两个维度的当前特征信息,以及获取当前展示信息的历史展示信息的至少两个维度的历史特征信息。
维度相似度获取单元20,用于根据特征信息获取单元10获取的至少两个维度的当前特征信息和历史特征信息,分别得到至少两个维度的当前特征信息和历史特征信息的相似度.
综合相似度获取单元30,用于根据维度相似度获取单元20得到的至少两个维度的相似度,确定当前展示信息与历史展示信息的综合相似度。
信息更换识别单元40,用于将综合相似度获取单元30得到的综合相似度与设定的相似度阈值进行比较,确定当前展示信息相对于历史展示信息是否发生了信息更换。
具体的,上述维度相似度获取单元20,具体用于:当特征信息获取单元10获取的当前特征信息和历史特征信息是类别属性信息时,判断获取的当前特征信息与历史特征信息是否相同;若是,当前特征信息和历史特征信息的相似度为第一相似度值;否则,当前特征信息和历史特征信息的相似度为第二相似度值。
具体的,上述维度相似度获取单元20,具体用于:当特征信息获取单元10获取的当前特征信息和历史特征信息是文本描述信息时,预处理获取的当前特征信息和历史特征信息,得到当前特征信息长度、历史特征信息长度以及预处理后的当前特征信息和历史特征信息的公共字串长度;根据得到的当前特征信息长度、历史特征信息长度和公共字串长度,得到当前特征信息和历史特征信息的相似度。
较优的,上述维度相似度获取单元20,具体用于当特征信息获取单元10获取的当前特征信息和历史特征信息是标题信息时,采用下列公式计算得到当前标题信息和历史标题信息的相似度:
Figure BDA0000113848400000191
其中,La表示预处理后的当前标题信息长度;Lb表示预处理后的历史标题信息长度;Cab表示预处理后的当前标题信息和历史标题信息的公共字串长度。
具体的,上述维度相似度获取单元20,具体用于:当特征信息获取单元10获取的当前特征信息和历史特征信息是数字描述信息时,在当前展示信息的当前特征信息与历史展示信息的历史特征信息的差值,以及当前展示信息的当前特征信息分别与当前展示信息的其他选定历史展示信息的历史特征信息的差值中,取出最大差值;根据预设的权重、当前特征信息与历史特征信息的差值和取出的最大差值,得到当前特征信息与历史特征信息的相似度。
较优的,上述维度相似度获取单元20,具体用于当特征信息获取单元10获取的当前特征信息和历史特征信息是价格信息时,采用下列公式计算得到当前价格信息和历史价格信息的相似度: P ab = w × ( P a - P b ) max ( P a - P b , P a - P c , P a - P d . . . . . . ) ; 其中,Pa表示的当前价格信息a;Pb表示选择的一个历史价格信息b;Pab表示当前价格信息和选择的一个历史价格信息的相似度;max(Pa-Pb,Pa-Pc,Pa-Pd......)表示在当前展示信息中的当前价格信息与选择的一个历史展示信息的历史价格信息的差值,以及当前展示信息中的当前价格信息分别与当前展示信息的其他选定历史展示信息中的历史价格信息的差值中的最大差值;w表示设定的权重。
具体的,上述综合相似度获取单元30,具体用于:将得到的各个维度的当前特征信息和历史特征信息的相似度相乘得到当前展示信息与历史展示信息的综合相似度;或者根据得到的各个维度的当前特征信息和历史特征信息的相似度和各个维度的权重得到当前展示信息与历史展示信息的综合相似度。
较优的,上述特征信息获取单元10,还用于获取当前展示信息的选定维度的当前特征信息,以及获取当前展示信息的历史展示信息的选定维度的历史特征信息。
上述信息更换识别单元40,还用于判断选定维度的当前特征信息与历史特征信息是否相同;若选定维度的当前特征信息与历史特征信息相同,确定当前展示信息相对于历史展示信息没有发生信息更换;若选定维度的当前特征信息与历史特征信息不相同,再执行获取当前展示信息的至少两个维度的当前特征信息,以及获取当前展示信息的历史展示信息的至少两个维度的历史特征信息;其中,至少两个维度为除选定维度外的至少两个维度。
较优的,上述综合相似度获取单元30,还用于当特征信息获取单元10获取的当前展示信息的历史展示信息有多个时,相应的,分别得到所述当前展示信息与多个历史展示信息的综合相似度。
上述信息更换识别单元40,具体用于根据设定的综合相似度选取规则,在得到的当前展示信息与多个历史信息的综合相似度中选取一个综合相似度;将选取的综合相似度与设定的相似度阈值进行比较,确定当前展示信息相对于历史展示信息是否发生了信息更换。
基于同一发明构思,本申请实施例提供一种信息搜索方法,通过如图4所示的信息搜索系统实现,该信息搜索系统包括:
获取模块1,用于根据用户输入的搜索信息,获取与搜索信息匹配的当前展示信息;
如图3所述的信息更换识别装置2,用于针对获取的当前展示信息,判断展示信息相对于所述历史展示信息是否发生了信息更换;
返回模块3,用于返回相对于历史展示信息没有发生信息更换的当前展示信息。
获取模块1和返回模块3可以设置在客户端中,该客户端可以将获得的用户输入的搜索信息提供给信息更换识别装置1,以及将信息更换识别装置1确定的相对于历史展示信息没有发生信息更换的当前展示信息提供给用户。
信息更换识别装置1,用于根据用户输入的搜索信息,获取与搜索信息匹配的当前展示信息,判断展示信息相对于历史展示信息是否发生了信息更换。
当信息更换识别装置1用于电子商务网站时,展示信息为卖家发布的商品广告信息。
上述信息搜索方法的具体步骤如图5所示,具体包括:
步骤S51:获取用户输入的搜索信息。
当用户需要在网上购物意向或者想浏览某一类商品时,会在网站上输入搜索信息,该搜索信息表明了用户的搜索意图,信息更换识别装置可以获取用户输入的搜索信息。
步骤S52:获取与用户输入的搜索信息匹配的当前展示信息。
信息更换识别装置可以获取与用户输入的搜索信息匹配的当前展示信息,当然信息更换识别装置需要从这些当前展示信息进行甄别,从中选取符合条件的提供给用户。
步骤S53:针对获取的当前展示信息,判断该展示信息相对于历史展示信息是否发生了信息更换,若是,执行步骤S55;否则,执行步骤S54。
可以采用步骤S101-步骤S104中的方法对于信息更换识别装置获取的当前展示信息进行判断,当然也可以采用其他方法进行判断。
步骤S54:召回该当前展示信息。
对于已经发生了信息更换的当前展示信息,由信息更换识别装置通知电子商务网站,然后由电子商务网站对发生了信息更换的当前展示信息进行召回以及相应的处理。
步骤S55:返回相对于历史展示信息没有发生信息更换的当前展示信息。
信息更换识别装置将没有发生信息更换的当前展示信息提供给用户,可按照销量多少、评价等级的高低等等进行排序后提供给用户,当然也可以采用其他的方式提供给用户,在这里不再赘述。
采用该方法能够搜索到更加准确有效的展示信息,减少用户搜索匹配操作的复杂度,节约系统资源,使用户能够尽快获取到合适的展示信息。
上述说明示出并描述了本申请的优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (12)

1.一种信息更换识别方法,其特征在于,包括:
获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;
根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;
根据得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;
将得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。
2.如权利要求1所述的方法,其特征在于,所述根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度,具体包括:
当获取的当前特征信息和历史特征信息是类别属性信息时,判断获取的所述当前特征信息与历史特征信息是否相同;
若是,所述当前特征信息和历史特征信息的相似度为第一相似度值;
否则,所述当前特征信息和历史特征信息的相似度为第二相似度值。
3.如权利要求1所述的方法,其特征在于,所述根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度,具体包括:
当获取的当前特征信息和历史特征信息是文本描述信息时,预处理获取的所述当前特征信息和历史特征信息,得到当前特征信息长度、历史特征信息长度以及预处理后的当前特征信息和历史特征信息的公共字串长度;
根据得到的当前特征信息长度、历史特征信息长度和所述公共字串长度,得到所述当前特征信息和历史特征信息的相似度。
4.如权利要求3所述的方法,其特征在于,当获取的当前特征信息和历史特征信息是标题信息时,所述根据得到的当前特征信息长度、历史特征信息长度和所述公共字串长度,得到所述当前特征信息和历史特征信息的相似度,具体包括:
采用下列公式计算得到当前标题信息和历史标题信息的相似度:
S ab = ( C ab L a + C ab L b ) / 2 ;
其中,La表示预处理后的当前标题信息长度;Lb表示预处理后的历史标题信息长度;Cab表示预处理后的所述当前标题信息和历史标题信息的公共字串长度。
5.如权利要求1所述的方法,其特征在于,所述根据获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息相似度,具体包括:
当获取的当前特征信息和历史特征信息是数字描述信息时,在当前展示信息的当前特征信息与所述历史展示信息的历史特征信息的差值,以及所述当前展示信息的当前特征信息分别与所述当前展示信息的其他选定历史展示信息的历史特征信息的差值中,取出最大差值;
根据预设的权重、所述当前特征信息与所述历史特征信息的差值和取出的最大差值,得到所述当前特征信息与所述历史特征信息的相似度。
6.如权利要求5所述的方法,其特征在于,当获取的当前特征信息和历史特征信息是价格信息时,所述根据预设的权重、所述当前特征信息与所述历史特征信息的差值和取出的最大差值,得到所述当前特征信息和所述历史特征信息的相似度,具体包括:
采用下列公式计算得到当前价格信息和历史价格信息的相似度:
P ab = w × ( P a - P b ) max ( P a - P b , P a - P c , P a - P d . . . . . . ) ;
其中,Pa表示的当前价格信息a;Pb表示历史价格信息b;Pab表示当前价格信息和历史价格信息的相似度;max(Pa-Pb,Pa-Pc,Pa-Pd......)表示在当前展示信息中的当前价格信息与所述历史展示信息的历史价格信息的差值,以及当前展示信息中的当前价格信息分别与当前展示信息的其他选定历史展示信息中的历史价格信息的差值中的最大差值;w表示设定的权重。
7.如权利要求1所述的方法,其特征在于,所述根据得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度,具体包括:
将得到的各个维度的当前特征信息和历史特征信息的相似度相乘得到所述当前展示信息与所述历史展示信息的综合相似度;或者
根据得到的各个维度的当前特征信息和历史特征信息的相似度和各个维度的权重得到所述当前展示信息与所述历史展示信息的综合相似度。
8.如权利要求1所述的方法,其特征在于,还包括:
获取所述当前展示信息的选定维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的选定维度的历史特征信息;
判断所述选定维度的当前特征信息与历史特征信息是否相同;
若所述选定维度的当前特征信息与历史特征信息相同,确定所述当前展示信息相对于所述历史展示信息没有发生信息更换;
若所述选定维度的当前特征信息与历史特征信息不相同,再执行所述获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的至少两个维度的历史特征信息;其中,所述至少两个维度为除所述选定维度外的至少两个维度。
9.如权利要求1-8任一所述的方法,其特征在于,当所述当前展示信息的历史展示信息有多个时,相应的,分别得到所述当前展示信息与多个所述历史展示信息的综合相似度;
所述将得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换,具体包括:
根据设定的综合相似度选取规则,在得到的所述当前展示信息与多个所述历史信息的综合相似度中选取一个综合相似度;
将选取的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。
10.一种信息搜索方法,其特征在于,包括:
根据用户输入的搜索信息,获取与所述搜索信息匹配的当前展示信息;
针对获取的当前展示信息,根据权利要求1-9任一所述的信息更换识别方法判断所述展示信息相对于所述历史展示信息是否发生了信息更换;
返回相对于历史展示信息没有发生信息更换的当前展示信息。
11.一种信息更换识别装置,其特征在于,包括:
特征信息获取单元,用于获取当前展示信息的至少两个维度的当前特征信息,以及获取所述当前展示信息的历史展示信息的所述至少两个维度的历史特征信息;
维度相似度获取单元,用于根据所述特征信息获取单元获取的所述至少两个维度的当前特征信息和历史特征信息,分别得到所述至少两个维度的当前特征信息和历史特征信息的相似度;
综合相似度获取单元,用于根据所述维度相似度获取单元得到的所述至少两个维度的相似度,确定所述当前展示信息与所述历史展示信息的综合相似度;
信息更换识别单元,用于将所述综合相似度获取单元得到的综合相似度与设定的相似度阈值进行比较,确定所述当前展示信息相对于所述历史展示信息是否发生了信息更换。
12.一种信息搜索系统,其特征在于,包括:
获取模块,用于根据用户输入的搜索信息,获取与所述搜索信息匹配的当前展示信息;
权利要求11所述的信息更换识别装置,用于针对获取的当前展示信息,判断所述展示信息相对于所述历史展示信息是否发生了信息更换;
返回模块,用于返回相对于历史展示信息没有发生信息更换的当前展示信息。
CN201110388313.5A 2011-11-29 2011-11-29 信息更换识别方法、装置以及信息搜索方法、系统 Active CN103136250B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110388313.5A CN103136250B (zh) 2011-11-29 2011-11-29 信息更换识别方法、装置以及信息搜索方法、系统
HK13108669.8A HK1181494A1 (zh) 2011-11-29 2013-07-24 信息更換識別方法、裝置以及信息搜索方法、系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110388313.5A CN103136250B (zh) 2011-11-29 2011-11-29 信息更换识别方法、装置以及信息搜索方法、系统

Publications (2)

Publication Number Publication Date
CN103136250A true CN103136250A (zh) 2013-06-05
CN103136250B CN103136250B (zh) 2016-01-06

Family

ID=48496084

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110388313.5A Active CN103136250B (zh) 2011-11-29 2011-11-29 信息更换识别方法、装置以及信息搜索方法、系统

Country Status (2)

Country Link
CN (1) CN103136250B (zh)
HK (1) HK1181494A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503641A (zh) * 2016-10-18 2017-03-15 上海众恒信息产业股份有限公司 辅助决策分析系统及分析方法
CN108509458A (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 一种业务对象识别方法及装置
WO2019052384A1 (zh) * 2017-09-15 2019-03-21 阿里巴巴集团控股有限公司 信息展示方法及装置
CN110321931A (zh) * 2019-06-05 2019-10-11 上海易点时空网络有限公司 原创内容仲裁方法及装置
CN110490713A (zh) * 2019-08-22 2019-11-22 行吟信息科技(上海)有限公司 一种商品信息创建方法及装置
CN110546028A (zh) * 2017-02-03 2019-12-06 宾利汽车有限公司 再生制动系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及系统
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN101350032A (zh) * 2008-09-23 2009-01-21 胡辉 判断网页内容是否相同的方法
CN101636735A (zh) * 2007-01-22 2010-01-27 申韩进 网站集成搜索的设备和方法
CN102222093A (zh) * 2011-06-09 2011-10-19 中国工程物理研究院计算机应用研究所 一种获取字符串最长公共子串的方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101636735A (zh) * 2007-01-22 2010-01-27 申韩进 网站集成搜索的设备和方法
CN101093510A (zh) * 2007-07-25 2007-12-26 北京搜狗科技发展有限公司 一种针对网页作弊的反作弊方法及系统
CN101281598A (zh) * 2008-05-23 2008-10-08 清华大学 基于多部件多特征融合的人脸识别方法
CN101350032A (zh) * 2008-09-23 2009-01-21 胡辉 判断网页内容是否相同的方法
CN102222093A (zh) * 2011-06-09 2011-10-19 中国工程物理研究院计算机应用研究所 一种获取字符串最长公共子串的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
田学东等: "基于多特征模糊模式识别的公式符号关系判定", 《计算机工程与应用(2009年)》, vol. 45, no. 5, 11 February 2009 (2009-02-11), pages 186 - 188 *
黄如锦等: "基于多特征的AdaBoost行人检测算法", 《吉林大学学报(理学版)》, vol. 48, no. 3, 26 May 2010 (2010-05-26), pages 449 - 455 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503641A (zh) * 2016-10-18 2017-03-15 上海众恒信息产业股份有限公司 辅助决策分析系统及分析方法
CN106503641B (zh) * 2016-10-18 2019-06-07 上海众恒信息产业股份有限公司 辅助决策分析系统及分析方法
CN110546028A (zh) * 2017-02-03 2019-12-06 宾利汽车有限公司 再生制动系统
CN108509458A (zh) * 2017-02-28 2018-09-07 阿里巴巴集团控股有限公司 一种业务对象识别方法及装置
WO2019052384A1 (zh) * 2017-09-15 2019-03-21 阿里巴巴集团控股有限公司 信息展示方法及装置
CN110321931A (zh) * 2019-06-05 2019-10-11 上海易点时空网络有限公司 原创内容仲裁方法及装置
CN110490713A (zh) * 2019-08-22 2019-11-22 行吟信息科技(上海)有限公司 一种商品信息创建方法及装置

Also Published As

Publication number Publication date
CN103136250B (zh) 2016-01-06
HK1181494A1 (zh) 2013-11-08

Similar Documents

Publication Publication Date Title
US10748164B2 (en) Analyzing sentiment in product reviews
Chen et al. Sequential search with refinement: Model and application with click-stream data
Wang et al. A path-constrained framework for discriminating substitutable and complementary products in e-commerce
CN108121737B (zh) 一种业务对象属性标识的生成方法、装置和系统
CN103092877B (zh) 一种关键词推荐方法和装置
CN103914492B (zh) 查询词融合方法、商品信息发布方法和搜索方法及系统
CN103778214B (zh) 一种基于用户评论的商品属性聚类方法
TWI615724B (zh) 基於電子資訊的關鍵字提取的資訊推送、搜尋方法及裝置
CN100517304C (zh) 结果页分类方法
TWI512653B (zh) Information providing method and apparatus, method and apparatus for determining the degree of comprehensive relevance
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
CN103136250B (zh) 信息更换识别方法、装置以及信息搜索方法、系统
CN105574216A (zh) 基于概率模型和用户行为分析的个性化推荐方法、系统
CN104239338A (zh) 信息推荐方法及装置
CN105989004A (zh) 一种信息投放的预处理方法和装置
CN108596695B (zh) 实体推送方法及系统
CN107632984A (zh) 一种聚类数据表的展现方法、装置和系统
CN101331475A (zh) 在线商业意图的自动检测
EP2721563A2 (en) Recommending supplemental products based on pay-for-performance information
EP2907052A1 (en) Method and system for search query recommendation
CN104679771A (zh) 一种个性化数据搜索方法和装置
CN105468649B (zh) 一种待展示对象匹配的判断方法及其装置
CN107679103B (zh) 用于实体的属性分析方法及系统
CN104252456A (zh) 一种权重估计方法、装置及系统
CN103425680A (zh) 页面展示广告的选取方法和系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1181494

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1181494

Country of ref document: HK