CN103136257B - 信息提供方法及其装置 - Google Patents

信息提供方法及其装置 Download PDF

Info

Publication number
CN103136257B
CN103136257B CN201110390649.5A CN201110390649A CN103136257B CN 103136257 B CN103136257 B CN 103136257B CN 201110390649 A CN201110390649 A CN 201110390649A CN 103136257 B CN103136257 B CN 103136257B
Authority
CN
China
Prior art keywords
information
exhibition
relevant information
association
alternative relevant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201110390649.5A
Other languages
English (en)
Other versions
CN103136257A (zh
Inventor
钟灵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110390649.5A priority Critical patent/CN103136257B/zh
Publication of CN103136257A publication Critical patent/CN103136257A/zh
Application granted granted Critical
Publication of CN103136257B publication Critical patent/CN103136257B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种信息提供方法及其装置,该方法包括:根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。该方法使得搜索匹配出来的展示信息与用户输入的搜索词的匹配度更高,能够获取更准确、可用的展示信息。

Description

信息提供方法及其装置
技术领域
本申请涉及网络技术领域,尤指一种信息提供方法及其装置。
背景技术
目前,很多购物网站的服务器都提供了商品展示信息搜索功能,用户输入搜索词Query,该Query可以包括关键字、类目、属性等等信息,同时也可以包括价格、卖家所在地等信息;服务器根据用户输入的Query找出相关词集合,服务器找出的相关词都是竞价词,所谓竞价词是指当卖家要推广商品时,需要对某些查询词出价,被出价的词称为竞价词。例如:卖家要推广连衣裙,那么可能对“连衣裙”、“连衣裙正品”等等类似的查询词出价,那么,“连衣裙”、“连衣裙正品”等词就是竞价词;服务器检索相关词集合中的相关词对应的商品展示信息或广告信息,选出需要的商品展示信息或广告信息,并对选出的商品展示信息或广告信息排序后展现给用户。
在现有方法中,服务器确定相关词时,仅仅考虑了相关词与用户输入的搜索词的相关性,这导致选取的相关词集合可能不是最优的,使得服务器检索到的商品展示信息或者广告信息可能不是与用户输入的搜索词最匹配的展示信息或广告信息,最终展现给用户的商品展示信息或广告信息可能不是用户所需要的,这导致搜索匹配的准确性和可用性差。用户为了获取所需要的展示信息可能需要重搜索获取,这增加了展示信息搜索匹配的复杂性和服务器的负担。因此,现有技术由于不能够给出较优的相关词集合,导致不能提供给用户较优的商品展示信息或广告信息。
发明内容
本申请实施例提供一种信息提供方法及其装置,用以解决现有技术中存在的由于不能给出较优的相关词集合,导致提供的展示信息的准确性和可用性差,与用户输入的搜索词匹配度低的问题。
一种信息提供方法,包括:
根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;
确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;
根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。
一种信息提供装置,包括:
备选相关信息获取单元,用于根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;
相关度获取单元,用于确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;
相关信息获取单元,用于根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。
本申请有益效果如下:
本申请实施例提供的信息提供方法及其装置,该方法根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。该方案在备选相关信息中选取相关信息时,不仅考虑备选相关信息与搜索信息的相关度,还要考虑备选相关信息与所关联的展示信息的相关度,这就保证了选取的相关信息与所关联的展示信息有很好的相关性,排除了选取的相关信息与所关联的展示信息相关性不好的备选相关信息,使得搜索匹配出来的展示信息与用户输入的搜索词的匹配度更高,能够获取更准确、可用的展示信息,可以保证提供给用户更好的可选取的展示信息集合,从而保证了提供给用户更好的展示信息,供用户进行选择,这增加了搜索的准确性和可用性,降低了展示信息搜索匹配的复杂性和服务器的负担。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例中信息提供系统的结构示意图;
图2为本申请实施例中信息提供方法的流程图;
图3为本申请实施例中信息提供装置的结构示意图。
具体实施方式
为了使本申请所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图和实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
为了解决现有技术中存在的由于不能给出较优的相关词集合,导致提供的展示信息的准确性和可用性差,与用户输入的搜索词匹配度低问题,本申请实施例提供的一种信息提供方法,通过如图1所示的信息提供系统实现,该信息提供系统包括信息提供服务器1和客户端2。其中:
客户端2,用于将获得的用户输入的搜索信息提供给信息提供服务器1,以及将信息提供服务器1提供的展示信息展示给用户。
信息提供服务器1根据获取的用户输入的搜索信息,查询预先建立的关联信息库,获得与搜索信息关联的至少一个备选相关信息;确定搜索信息与获得的每个备选相关信息的相关度,以及备选相关信息与所关联的展示信息的相关度;根据确定的搜索信息与每个备选相关信息的相关度和每个备选相关信息与所关联的展示信息的相关度,从备选相关信息中确定搜索信息的相关信息,从确定的相关信息关联的展示信息中选取展示信息提供给用户。
当信息提供服务器1用于电子商务网站时,备选相关信息是卖家为了推广商品信息而出价的词,也就是竞价词;与备选相关信息关联的展示信息也就是与竞价词关联的商品广告信息。
例如,一个卖家要推广连衣裙,如果该卖家对“连衣裙”、“连衣裙正品”等与连衣裙相关的词出价,那么,“连衣裙”、“连衣裙正品”等这些被出价的词就称为竞价词;如果卖家对“裤子”、“卫衣”等与连衣裙无关的竞价词出价,“裤子”、“卫衣”等被出价的竞价词就称为乱买词。
上述信息提供方法的流程如图2所示,包括如下步骤:
S11:根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与用户的搜索信息关联的至少一个备选相关信息。
用户可以使用客户端输入搜索信息,一般作为浏览方的用户可以通过输入搜索信息的方式查找自己感兴趣的信息,服务器侧根据浏览方用户输入的搜索信息查找用户关心的展示信息,并通过客户端提供给用户。
当服务器侧获取用户输入的搜索信息后,根据用户输入的搜索信息查询预先建立的关联信息库,获得与用户输入的搜索信息关联的至少一个相关信息作为备选相关信息。其中,关联信息库是根据多个用户的历史搜索信息及其与展示信息之间的关系预先建立,存储的是搜索信息以及与该搜索信息关联的信息。每当用户输入搜索信息时,可以在关联信息库中直接查询该搜索信息,就可以获得与该搜索信息关联的相关信息了,将查找到的该搜索信息关联的全部信息或者部分信息作为该搜索信息的备选相关信息。
S12:确定用户的搜索信息与获得的每个备选相关信息的相关度,以及每个备选相关信息与所关联的展示信息的相关度。
根据用户的搜索信息与获取的每个备选相关信息,计算用户的搜索信息与每个备选相关信息的相关度。由于每个备选相关信息都有与其关联的展示信息,在电子商务网站中就是每个竞价词都有与其关联的商品广告信息,由于乱买词的存在,就使得竞价词与所关联的商品的广告信息的相关度不是很高。所以在本申请中,除了要考虑用户的搜索信息与每个备选相关信息的相关度,还要考虑备选相关信息与关联的展示信息的相关度,也就是与商品广告信息的相关度,这就保证了最终能够提供给用户的更好的展示信息。
S13:根据确定的用户的搜索信息与每个备选相关信息的相关度和每个备选相关信息与所关联的展示信息的相关度,从备选相关信息中确定搜索信息的相关信息。
在确定出用户的搜索信息与每个备选相关信息的相关度,以及每个备选相关信息与所关联的展示信息的相关度之后,就可以从备选相关信息中选取用户的搜索信息的相关信息了。
S14:从确定的相关信息关联的展示信息中选取展示信息提供给用户。
在确定出用户的搜索信息的相关信息之后,就可以从用户的搜索信息的相关信息关联的展示信息中,选取需要的展示信息提供给客户端,客户端将该展示信息展示给用户,这就完成了用户搜索的过程。
该方案在备选相关信息中选取相关信息时,不仅考虑备选相关信息与搜索信息的相关度,还要考虑备选相关信息与所关联的展示信息的相关度,这就保证了选取的相关信息与所关联的展示信息有很好的相关性,排除了选取的相关信息与所关联的展示信息相关性不好的备选相关信息,使得搜索匹配出来的展示信息与用户输入的搜索词的匹配度更高,能够获取更准确、可用的展示信息,可以保证提供给用户更好的可选取的展示信息集合,从而保证了提供给用户更好的展示信息,供用户进行选择。
下面进一步详细描述上述各个步骤。
具体的,上述S11中建立关联信息库的过程,可以有多种方式,下面以三种方式为例进行说明:
第一种方式:获取用户的搜索信息,提取搜索信息中设定数目的属性特征的组合;在数据库中查询存储的所述设定数目的属性特征的组合出现的次数,并根据次数大小对搜索信息中设定数目的属性特征的组合排序;获取搜索信息中设定数目的属性特征的组合排序中设定位置的组合作为搜索信息的关联信息。其中,数据库中存储有从用户的历史搜索信息和信息提供者提供的展示信息中提取的设定数目的属性特征的组合,以及每个组合出现的次数。
用户的搜索信息中可以包括关键词、类目和属性等等,属性可以包括商品品牌、型号、颜色、价格、产地等等特征。用户的历史搜索信息是指在搜索日志中存储的以往多个或者一个用户的搜索信息。从用户的历史搜索信息和信息提供者提供的展示信息中提取设定数目的属性特征的组合,以及每个组合出现的次数,其中,可以从信息提供者提供的展示信息的标题或者描述信息等等信息中提取设定数目的属性特征的组合。当设定数目为3的时候,可以提取“品牌、型号、颜色”这3个属性特征的各种组合,也可以提取“品牌、价格、产地”这3个属性特征的组合,也就是从所有属性的集合中获取3个属性特征的所有组合,并记录每种组合出现的次数;当设定数目为2时,从所有属性的集合中获取2个属性特征的所有组合,并记录每种组合出现的次数;当设定数目为2和3时,获取的组合包括上述的设定数目为2时的所有组合和设定数目为3时的所有组合,以及每种组合出现的次数。设定数目可以依据实际情况进行设定,这里仅仅以设定数目为2和3为例进行说明,设定数目取其他一个值或多个值的情况也是一样的,在这里不再赘述。
可以用一个数据库来存储从用户的历史搜索信息和信息提供者提供的展示信息中提取的设定数目的属性特征的组合,以及每个组合出现的次数。当用户提供搜索信息时,就可以依据实际情况从搜索信息中提取设定数目的组合,在数据库中查询每种组合出现的次数,并按照每种组合出现的次数的大小对各种组合进行排序,然后选取序列中的设定位置的组合作为用户提供的搜索信息的关联信息,例如,可以取序列中的前5个或者前10个组合作为用户搜索信息的关联信息,当然也可以取中间的5个或10个组合,这里仅仅以示例进行说明。
第二种方式:获取用户的历史搜索信息以及用户点击的历史搜索信息对应的展示信息,得到两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数;根据两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数,得到两个历史搜索信息的相关度;当两个历史搜索信息的相关度大于设定的相关度阈值,确定两个历史搜索信息为关联信息。
在搜索日志中,记录了电子商务网站根据用户提供的历史搜索信息给出的包含若干展示信息的搜索结果,以及用户点击的展示信息。针对一个历史搜索信息,获取用户点击的展示信息;选取两个历史搜索信息,获取用户点击的相同展示信息的个数以及用户点击的展示信息的总数,根据相同展示信息的个数以及展示信息的总数得到两个历史搜索信息的相关度。将两个历史搜索信息的相关度与设定的相关度阈值比较,当大于设定的相关度阈值时,确定两个历史搜索信息为关联信息。针对所有的历史搜索信息都可以选取两个计算出相关度,并根据相关度与设定阈值比较的结果,确定两个历史搜索信息是否是关联信息,并将关联信息存储在关联信息库中,以备查询使用。其中,相关度阈值可以依据实际的需要进行设定,如果对两个历史搜索信息的相关度要求比较高,就可以将相关度阈值设定的大一些;反之,可以设定的小一些。
例如,用户点击了历史搜索信息A对应的展示信息1、2、5,另一用户点击了历史搜索信息B对应的展示信息1、5、7,那么两个用户都点击了1、5这两个展示信息,两个用户点击了展示信息1、2、5、7共四个展示信息,那么,A、B的相关度为用户点击的相同展示信息的个数以及用户点击的展示信息的总数的比值,也就是2/4=0.5,即A、B的相关度为0.5。假设设定的相关度阈值为0.4,那么A、B的相关度大于设定的相关度阈值,A、B可以确定为关联信息。
第三种方式:获取用户的历史搜索信息,确定用户的选定的历史搜索信息与其他历史搜索信息共同出现的次数,得到选定的历史搜索信息与其他历史搜索信息共同出现的概率;确定与选定的历史搜索信息共同出现的概率超过设定的阈值的其他历史搜索信息为选定的历史搜索信息的关联信息。
例如:用户1输入历史搜索信息a、b;用户2输入历史搜索信息a、b、c;用户3输入历史搜索信息a、c、d;可见,与历史搜索信息a共现频率较高的历史搜索信息是b、c,因此,历史搜索信息b、c可以确定为历史搜索信息a的关联信息,并存储在关联信息库中。
上述介绍了S10中的建立关联信息库的三种方法,可以依据实际的情况或需要采用上述三种方式之一或组合来挖掘关联信息,然后建立关联信息库。下面详细介绍S12中的搜索信息与备选相关信息的相关度,以及备选相关信息与所关联的展示信息的相关度。
具体的,上述S12中确定搜索信息与获得的每个备选相关信息的相关度,具体包括:针对每个备选相关信息,提取搜索信息与该备选相关信息的特征;根据提取的搜索信息与该备选相关信息的特征,得到搜索信息与该备选相关信息在每个特征上的特征值;根据得到的搜索信息与该备选相关信息在每个特征上的特征值,得到搜索信息与该备选相关信息的相关度。
在确定搜索信息与备选相关信息的相关度时,可以通过训练模型计算得到。下面详细介绍获取训练模型,以及使用训练模型得到搜索信息与备选相关信息的相关度的过程:
第一步,确定已计算出相关度的两个历史搜索信息作为训练样本,选择设定数量的训练样本。
可以通过获取搜索日志中的历史搜索信息,采用现有技术中的SimRank算法或者CosRank算法得到两个历史搜索信息的相关度。
第二步,针对选择的每个训练样本,根据设定的每个特征,确定该训练样本中的搜索信息和备选相关信息在每个特征上的特征分数,将已计算出的该训练样本中的搜索信息和备选相关信息的相关度确定为目标值,将确定的该训练样本中的搜索信息和备选相关信息每个特征上的特征分数确定为输入参数值。
例如,可以提取历史搜索信息的关键词、类目、用户点击历史搜索信息对应的展示信息等等特征,下面仅以提取的搜索信息的关键词、类目和用户点击历史搜索信息对应的展示信息这三个特征为例进行说明,当然并不仅仅局限于这三个特征。
根据两个历史搜索信息的关键词,得到两个历史搜索信息的编辑距离,例如,历史搜索信息A的关键词为abc,历史搜索信息B的关键词为ab,那么需要将历史搜索信息A的中的去掉才能够得到历史搜索信息B的关键词,那么A、B的编辑距离为1。
根据上述两个历史搜索信息的类目,得到两个历史搜索信息的类目相似度,当然也可以根据两个历史搜索信息的预测类目,得到两个历史搜索信息的类目相似度。
根据用户点击上述两个历史搜索信息对应的共同展示信息,以及用户点击上述两个历史搜索信息对应的展示信息的总数,得到两个历史搜索信息的点击共现相似度。具体方法可以通过建立关联信息库中的第二种方法中的举例进行说明。
第三步,根据针对每个训练样本确定的目标值和输入参数值,采用设定的算法进行回归运算,得到相关度计算模型。
继续沿用上例,根据上述两个历史搜索信息的编辑距离、类目相似度和点击共现相似度,以及在第一步中计算出来的两个历史搜索信息的相关度,采用支持向量机(SVM)算法进行回归运算,也可以采用评定模型(Logit)算法进行回归运算,当然也可以采用其他回归算法进行回归运算,得到相关度计算模型。
第四步,针对获取的每个备选相关信息,提取搜索信息与该备选相关信息的特征;根据提取的搜索信息与该备选相关信息的特征,得到搜索信息与该备选相关信息在每个特征上的特征值;根据得到的搜索信息与该备选相关信息在每个特征上的特征值,以及相关度计算模型,得到搜索信息与该备选相关信息的相关度。
具体的,上述S12确定备选相关信息与所关联的展示信息的相关度,具体包括:针对每个备选相关信息,获取与该备选相关信息关联的展示信息;针对与该备选相关信息关联的每个展示信息,获取该备选相关信息与一个展示信息的特征;根据获取的该备选相关信息与同一个展示信息的每个特征,得到该备选相关信息与同一个展示信息在每个特征上的特征值;根据得到的该备选相关信息与同一个展示信息在每个特征上的特征值,得到该备选相关信息与同一个展示信息的相关度。
在确定备选相关信息与展示信息的相关度时,也可以通过训练模型计算得到。下面详细介绍获取训练模型以及使用训练模型得到备选相关信息与展示信息的相关度的过程:
第一步,选取设定数目的备选相关信息和所关联的展示信息,确定已计算出相关度的备选相关信息和所关联的展示信息作为训练样本,选择设定数量的训练样本。
在电子商务网站中,可以选取10000组竞价词和商品的广告信息为例进行说明,这里仅仅是以10000组为例进行说明,可以依据实际情况和需求进行选取,人工标注选取的竞价词和商品广告信息的相关度。
第二步,针对选择的每个训练样本,根据设定的每个特征,确定该训练样本中的搜索信息和展示信息在每个特征上的特征分数,将已计算出的该训练样本中的搜索信息和展示信息的相关度确定为目标值,将确定的该训练样本中的搜索信息和展示信息每个特征上的特征分数确定为输入参数值。
例如,可以提取备选相关信息和展示信息的类目,以及展示信息的标题等等特征,下面仅以提取备选相关信息和展示信息的类目,备选相关信息是否在展示信息的标题中,以及备选相关信息中的词是否在展示信息的标题中这三个特征为例进行说明,当然并不仅仅局限于这三个特征。
根据备选相关信息和展示信息的类目,得到备选相关信息和展示信息的类目相似度,当然也可以根据备选相关信息和展示信息的预测类目,得到备选相关信息和展示信息的类目相似度。例如,对于备选相关信息,点击搜索信息对应的类目1的展示信息的概率是0.5,点击类目2的展示信息的概率是0.3,点击类目3的展示信息的概率是0.2;假设与备选相关信息关联的展示信息的预测类目为类目1,概率为1,那么,备选相关信息和展示信息的预测类目相似度为0.5*1=0.5。
判断备选相关信息是否在展示信息的标题中,以及备选相关信息中的词是否在展示信息的标题中,并相应的结果给予相应的分值,即可得到相应的特征值。
第三步,根据针对每个训练样本确定的目标值和输入参数值,采用设定的算法进行回归运算,得到相关度计算模型。
继续沿用上例,根据上述备选相关信息和展示信息的类目相似度、备选相关信息是否在展示信息的标题中的分值、备选相关信息中的词是否在展示信息的标题的分值、以及在第一步中计算出来的备选相关信息和展示信息的相关度,可以采Loglinear算法进行回归运算,当然也可以采用其他回归算法进行回归运算,得到备选相关信息和展示信息的相关度计算模型。
第四步,针对获取的备选相关信息和展示信息,提取该备选相关信息与展示信息的特征;根据提取的该备选相关信息与展示信息的特征,得到该备选相关信息与展示信息在每个特征上的特征值;根据得到的该备选相关信息与展示信息在每个特征上的特征值,以及在第三步中得到的备选相关信息与展示信息相似度计算模型,得到该备选相关信息与展示信息的相关度。
具体的,上述S13中从备选相关信息中确定搜索信息的相关信息的过程,具体包括:从获取的备选相关信息中获取包含设定数目的备选相关信息的信息子集;针对每个信息子集,获取该信息子集中包含的每个备选相关信息关联的展示信息;针对每个展示信息,确定该展示信息与所关联的备选相关信息的相关度,以及与该展示信息关联的备选相关信息与搜索信息的相关度,得到该展示信息与所关联的每个备选相关信息的相关度与每个备选相关信息与搜索信息的相关度的乘积;将得到的乘积的最大值作为该展示信息的权重参数;将各个展示信息的权重参数作为该信息子集的总相关度;将总相关度最高的信息子集包含的备选相关信息作为搜索信息的相关信息。
下面以获取的备选相关信息共有100个,最终需要的搜索信息的相关信息为10个为例进行说明,当然备选相关信息的个数和搜索信息的个数并不仅仅局限于示例中的100和10,也可以是其他数目。
从100个备选相关信息组成的集合Q中获取包含10个备选相关信息的所有子集,针对其中的一个子集P,获取该子集中包含的10个备选相关信息所关联的所有展示信息。针对每个展示信息t,采用上述搜索信息与展示信息的相关度计算模型以及备选相关信息和展示信息的相关度计算模型,得到该展示信息t与所关联的备选相关信息qi的相关度Sim(q,qi),以及与该展示信息t关联的备选相关信息qi与搜索信息q的相关度Sim(qi,t),得到该展示信息t与所关联的每个备选相关信息qi的相关度Sim(q,qi)与每个备选相关信息qi与搜索信息q的相关度Sim(qi,t)的乘积Sim(q,qi)*Sim(qi,t),该展示信息与每个关联的备选相关信息都会得到这样的一个乘积,在得到的该展示信息与所有关联的备选相关信息的乘积中选取最大值,将该值作为该展示信息的权重参数 其中,Bid(t)表示展示信息t对应的备选相关信息的集合;将各个展示信息的权重参数作为该信息子集的总相关度 其中A表示P关联的所有的展示信息的集合;将总相关度最高的信息子集包含的备选相关信息作为搜索信息的相关信息,即选取满足公式 AgrMax P Σ t ∈ A Max q i ∈ Bid ( t ) sim ( q , q i ) * sim ( q i , t ) 的信息子集中的备选相关信息作为搜索信息的相关信息。
基于同一发明构思,本申请实施例还提供的一种信息提供装置,该装置可以设置在如图1所示的信息提供系统中的信息提供服务器中,该装置的结构如图3所示,包括:备选相关信息获取单元10、相关度获取单元20和相关信息获取单元30。
其中,上述备选相关信息获取单元10,用于根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与搜索信息关联的至少一个备选相关信息。
上述相关度获取单元20,用于确定搜索信息与获得的每个备选相关信息的相关度,以及备选相关信息与所关联的展示信息的相关度。
上述相关信息获取单元30,用于根据确定的搜索信息与每个备选相关信息的相关度和每个备选相关信息与所关联的展示信息的相关度,从备选相关信息中确定搜索信息的相关信息,从确定的相关信息关联的展示信息中选取展示信息提供给用户。
具体的,上述备选相关信息获取单元10,具体用于采用以下内容之一或组合建立关联信息库:
获取用户的搜索信息,提取搜索信息中设定数目的属性特征的组合;在数据库中查询存储的设定数目的属性特征的组合出现的次数,并根据次数大小对搜索信息中设定数目的属性特征的组合排序;获取搜索信息中设定数目的属性特征的组合排序中设定位置的组合作为搜索信息的关联信息;数据库中存储有从用户的历史搜索信息和信息提供者提供的展示信息中提取的设定数目的属性特征的组合,以及每个组合出现的次数;
获取用户的历史搜索信息以及用户点击的历史搜索信息对应的展示信息,得到两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数;根据两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数,得到两个历史搜索信息的相关度;当相关度大于设定的相关度阈值,确定两个历史搜索信息为关联信息;
获取用户的历史搜索信息,确定用户的选定的历史搜索信息与其他历史搜索信息共同出现的次数,得到选定的历史搜索信息与其他历史搜索信息共同出现的概率;确定与选定的历史搜索信息共同出现的概率超过设定的阈值的其他历史搜索信息为选定的历史搜索信息的关联信息。
具体的,上述述相关度获取单元20,具体用于:针对每个备选相关信息,提取搜索信息与备选相关信息的特征;根据提取的搜索信息与备选相关信息的特征,得到搜索信息与备选相关信息在每个特征上的特征值;根据得到的搜索信息与备选相关信息在每个特征上的特征值,得到搜索信息与备选相关信息的相关度。
具体的,上述相关度获取单元20,具体用于:针对每个备选相关信息,获取与备选相关信息关联的展示信息;针对与备选相关信息关联的每个展示信息,获取备选相关信息与展示信息的特征;根据获取的备选相关信息与展示信息的每个特征,得到备选相关信息与展示信息在每个特征上的特征值;根据得到的备选相关信息与展示信息在每个特征上的特征值,得到备选相关信息与展示信息的相关度。
具体的,上述相关信息获取单元30,具体用于:从获取的备选相关信息中获取包含设定数目的备选相关信息的信息子集;针对每个信息子集,获取信息子集中包含的每个备选相关信息关联的展示信息;针对每个展示信息,确定展示信息与所关联的备选相关信息的相关度,以及与展示信息关联的备选相关信息与搜索信息的相关度,得到展示信息与所关联的每个备选相关信息的相关度与每个备选相关信息与搜索信息的相关度的乘积;将得到的乘积的最大值作为展示信息的权重参数;将各个展示信息的权重参数作为信息子集的总相关度;将总相关度最高的信息子集包含的备选相关信息作为搜索信息的相关信息。
上述说明示出并描述了本申请的优选实施例,但如前所述,应当理解本申请并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本申请的精神和范围,则都应在本申请所附权利要求的保护范围内。

Claims (10)

1.一种信息提供方法,其特征在于,包括:
根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;
确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;
根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。
2.如权利要求1所述的方法,其特征在于,建立关联信息库的过程,具体包括以下内容之一或组合:
获取用户的搜索信息,提取所述搜索信息中设定数目的属性特征的组合;在数据库中查询存储的所述设定数目的属性特征的组合出现的次数,并根据次数大小对所述搜索信息中设定数目的属性特征的组合排序;获取所述搜索信息中设定数目的属性特征的组合排序中设定位置的组合作为所述搜索信息的关联信息;所述数据库中存储有从用户的历史搜索信息和信息提供者提供的展示信息中提取的设定数目的属性特征的组合,以及每个组合出现的次数;
获取用户的历史搜索信息以及用户点击的历史搜索信息对应的展示信息,得到两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数;根据两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数,得到两个历史搜索信息的相关度;当所述相关度大于设定的相关度阈值,确定两个历史搜索信息为关联信息;
获取用户的历史搜索信息,确定用户的选定的历史搜索信息与其他历史搜索信息共同出现的次数,得到所述选定的历史搜索信息与其他历史搜索信息共同出现的概率;确定与所述选定的历史搜索信息共同出现的概率超过设定的阈值的其他历史搜索信息为所述选定的历史搜索信息的关联信息。
3.如权利要求1所述的方法,其特征在于,所述确定所述搜索信息与获得的每个所述备选相关信息的相关度,具体包括:
针对每个备选相关信息,提取所述搜索信息与所述备选相关信息的特征;
根据提取的所述搜索信息与所述备选相关信息的特征,得到所述搜索信息与所述备选相关信息在每个特征上的特征值;
根据得到的所述搜索信息与所述备选相关信息在每个特征上的特征值,得到所述搜索信息与所述备选相关信息的相关度。
4.如权利要求1所述的方法,其特征在于,所述确定所述备选相关信息与所关联的展示信息的相关度,具体包括:
针对每个备选相关信息,获取与所述备选相关信息关联的展示信息;
针对与所述备选相关信息关联的每个展示信息,获取所述备选相关信息与所述展示信息的特征;
根据获取的所述备选相关信息与所述展示信息的每个特征,得到所述备选相关信息与所述展示信息在每个特征上的特征值;
根据得到的所述备选相关信息与所述展示信息在每个特征上的特征值,得到所述备选相关信息与所述展示信息的相关度。
5.如权利要求1-4任一所述的方法,其特征在于,所述从所述备选相关信息中确定所述搜索信息的相关信息的过程,具体包括:
从获取的所述备选相关信息中获取包含设定数目的备选相关信息的信息子集;
针对每个信息子集,获取所述信息子集中包含的每个备选相关信息关联的展示信息;
针对每个展示信息,确定所述展示信息与所关联的备选相关信息的相关度,以及与所述展示信息关联的备选相关信息与所述搜索信息的相关度,得到所述展示信息与所关联的每个备选相关信息的相关度与每个备选相关信息与所述搜索信息的相关度的乘积;将得到的乘积的最大值作为所述展示信息的权重参数;
将各个展示信息的权重参数作为所述信息子集的总相关度;
将总相关度最高的信息子集包含的备选相关信息作为所述搜索信息的相关信息。
6.一种信息提供装置,其特征在于,包括:
备选相关信息获取单元,用于根据获取的用户的搜索信息,查询预先建立的关联信息库,获得与所述搜索信息关联的至少一个备选相关信息;
相关度获取单元,用于确定所述搜索信息与获得的每个所述备选相关信息的相关度,以及所述备选相关信息与所关联的展示信息的相关度;
相关信息获取单元,用于根据确定的所述搜索信息与每个所述备选相关信息的相关度和每个所述备选相关信息与所关联的展示信息的相关度,从所述备选相关信息中确定所述搜索信息的相关信息,从确定的所述相关信息关联的展示信息中选取展示信息提供给用户。
7.如权利要求6所述的装置,其特征在于,所述备选相关信息获取单元,具体用于采用以下内容之一或组合建立关联信息库:
获取用户的搜索信息,提取所述搜索信息中设定数目的属性特征的组合;在数据库中查询存储的所述设定数目的属性特征的组合出现的次数,并根据次数大小对所述搜索信息中设定数目的属性特征的组合排序;获取所述搜索信息中设定数目的属性特征的组合排序中设定位置的组合作为所述搜索信息的关联信息;所述数据库中存储有从用户的历史搜索信息和信息提供者提供的展示信息中提取的设定数目的属性特征的组合,以及每个组合出现的次数;
获取用户的历史搜索信息以及用户点击的历史搜索信息对应的展示信息,得到两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数;根据两个历史搜索信息对应的用户点击的展示信息的总数和用户点击的相同展示信息的个数,得到两个历史搜索信息的相关度;当所述相关度大于设定的相关度阈值,确定两个历史搜索信息为关联信息;
获取用户的历史搜索信息,确定用户的选定的历史搜索信息与其他历史搜索信息共同出现的次数,得到所述选定的历史搜索信息与其他历史搜索信息共同出现的概率;确定与所述选定的历史搜索信息共同出现的概率超过设定的阈值的其他历史搜索信息为所述选定的历史搜索信息的关联信息。
8.如权利要求6所述的装置,其特征在于,所述相关度获取单元,具体用于:
针对每个备选相关信息,提取所述搜索信息与所述备选相关信息的特征;
根据提取的所述搜索信息与所述备选相关信息的特征,得到所述搜索信息与所述备选相关信息在每个特征上的特征值;
根据得到的所述搜索信息与所述备选相关信息在每个特征上的特征值,得到所述搜索信息与所述备选相关信息的相关度。
9.如权利要求6所述的装置,其特征在于,所述相关度获取单元,具体用于:
针对每个备选相关信息,获取与所述备选相关信息关联的展示信息;
针对与所述备选相关信息关联的每个展示信息,获取所述备选相关信息与所述展示信息的特征;
根据获取的所述备选相关信息与所述展示信息的每个特征,得到所述备选相关信息与所述展示信息在每个特征上的特征值;
根据得到的所述备选相关信息与所述展示信息在每个特征上的特征值,得到所述备选相关信息与所述展示信息的相关度。
10.如权利要求6-9任一所述的装置,其特征在于,所述相关信息获取单元,具体用于:
从获取的所述备选相关信息中获取包含设定数目的备选相关信息的信息子集;
针对每个信息子集,获取所述信息子集中包含的每个备选相关信息关联的展示信息;
针对每个展示信息,确定所述展示信息与所关联的备选相关信息的相关度,以及与所述展示信息关联的备选相关信息与所述搜索信息的相关度,得到所述展示信息与所关联的每个备选相关信息的相关度与每个备选相关信息与所述搜索信息的相关度的乘积;将得到的乘积的最大值作为所述展示信息的权重参数;
将各个展示信息的权重参数作为所述信息子集的总相关度;
将总相关度最高的信息子集包含的备选相关信息作为所述搜索信息的相关信息。
CN201110390649.5A 2011-11-30 2011-11-30 信息提供方法及其装置 Active CN103136257B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110390649.5A CN103136257B (zh) 2011-11-30 2011-11-30 信息提供方法及其装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110390649.5A CN103136257B (zh) 2011-11-30 2011-11-30 信息提供方法及其装置

Publications (2)

Publication Number Publication Date
CN103136257A CN103136257A (zh) 2013-06-05
CN103136257B true CN103136257B (zh) 2016-09-28

Family

ID=48496091

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110390649.5A Active CN103136257B (zh) 2011-11-30 2011-11-30 信息提供方法及其装置

Country Status (1)

Country Link
CN (1) CN103136257B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103631863B (zh) * 2013-10-31 2017-06-23 百度在线网络技术(北京)有限公司 一种用于确定呈现信息间相似度信息的方法与设备
CN104750762A (zh) * 2013-12-31 2015-07-01 华为技术有限公司 一种信息检索方法及装置
CN104699832B (zh) * 2015-03-31 2019-04-12 北京奇艺世纪科技有限公司 一种相关信息确定方法及装置
CN104933172A (zh) * 2015-06-30 2015-09-23 百度在线网络技术(北京)有限公司 一种基于用户搜索行为的信息推送方法和装置
CN105808685B (zh) 2016-03-02 2021-09-28 腾讯科技(深圳)有限公司 推广信息的推送方法及装置
CN105956189B (zh) * 2016-06-08 2020-01-07 北京百度网讯科技有限公司 基于人工智能的信息推荐方法和装置
CN108255893B (zh) * 2016-12-29 2021-03-30 北京国双科技有限公司 个性化对象推荐方法和装置
CN107103490B (zh) * 2017-04-11 2021-07-09 华为机器有限公司 一种数据处理方法、网络服务器及终端
CN107526800B (zh) * 2017-08-20 2019-03-26 平安科技(深圳)有限公司 信息推荐的装置、方法及计算机可读存储介质
CN107908648A (zh) * 2017-09-30 2018-04-13 广东工业大学 信息搜索方法及装置、计算机存储介质及设备
CN110795534A (zh) * 2019-10-28 2020-02-14 维沃移动通信有限公司 信息搜索方法及移动终端

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178707A (zh) * 2006-11-08 2008-05-14 许丰 多维搜索方法与软件
CN101655876A (zh) * 2009-09-17 2010-02-24 广东国笔科技股份有限公司 一种基于语义分析的智能检索系统及方法
CN101814085A (zh) * 2010-02-04 2010-08-25 林培光 基于wdb特征和用户查询请求的web数据库选择方法
CN101952825A (zh) * 2008-02-20 2011-01-19 松下电器产业株式会社 对话式节目检索装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9552420B2 (en) * 2005-10-04 2017-01-24 Thomson Reuters Global Resources Feature engineering and user behavior analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101178707A (zh) * 2006-11-08 2008-05-14 许丰 多维搜索方法与软件
CN101952825A (zh) * 2008-02-20 2011-01-19 松下电器产业株式会社 对话式节目检索装置
CN101655876A (zh) * 2009-09-17 2010-02-24 广东国笔科技股份有限公司 一种基于语义分析的智能检索系统及方法
CN101814085A (zh) * 2010-02-04 2010-08-25 林培光 基于wdb特征和用户查询请求的web数据库选择方法

Also Published As

Publication number Publication date
CN103136257A (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
CN103136257B (zh) 信息提供方法及其装置
JP5507154B2 (ja) 社会的インデックス付けを用いて、トピックに基づいて広告ターゲットを拡大させるシステム及び方法
US8631003B2 (en) Query identification and association
US10303807B2 (en) Information retrieval from a collection of information objects tagged with hierarchical keywords
US11687968B1 (en) Serving advertisements based on partial queries
US8886636B2 (en) Context transfer in search advertising
JP5141994B2 (ja) 検索関連性を改善するための評価基準の使用
US20010044837A1 (en) Methods and systems for searching an information directory
US20070255693A1 (en) User interface method and system for incrementally searching and selecting content items and for presenting advertising in response to search activities
US9727906B1 (en) Generating item clusters based on aggregated search history data
US20070226202A1 (en) Generating keywords
CN102456057B (zh) 基于网上交易平台的检索方法、装置和服务器
CN103123632B (zh) 搜索中心词确定方法及装置、搜索方法及搜索设备
US20200380047A1 (en) Computer implemented system and methods for implementing a search engine access point enhanced for suggested listing navigation
KR101818717B1 (ko) 컨셉 키워드 확장 데이터 셋을 이용한 검색방법, 장치 및 컴퓨터로 판독 가능한 기록매체
CN102129431A (zh) 应用于网上交易平台的检索方法和系统
CN104239390A (zh) 一种基于改进型协同过滤算法的音频推荐方法
CN104504134A (zh) 推广信息属性数据的获取方法和装置
WO2015059836A1 (ja) 検索システム、検索条件設定装置、検索条件設定装置の制御方法、プログラム、及び情報記憶媒体
US20130085867A1 (en) Niche Keyword Recommendation
US7716209B1 (en) Automated advertisement publisher identification and selection
US8510289B1 (en) Systems and methods for detecting commercial queries
Yang et al. Intelligent infomediary for web financial information
CN112256952A (zh) 基于图数据库技术满足电商场景化搜索的方法
Indartoyo et al. A consumer behaviour investigation in search engine utilization through behavioural segmentation approach

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1181488

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1181488

Country of ref document: HK