CN102214169A - 关键词信息与目标信息的提供方法及装置 - Google Patents

关键词信息与目标信息的提供方法及装置 Download PDF

Info

Publication number
CN102214169A
CN102214169A CN2010101398501A CN201010139850A CN102214169A CN 102214169 A CN102214169 A CN 102214169A CN 2010101398501 A CN2010101398501 A CN 2010101398501A CN 201010139850 A CN201010139850 A CN 201010139850A CN 102214169 A CN102214169 A CN 102214169A
Authority
CN
China
Prior art keywords
key word
information
target information
word information
correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010101398501A
Other languages
English (en)
Other versions
CN102214169B (zh
Inventor
董静
郭宁
夏超伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201010139850.1A priority Critical patent/CN102214169B/zh
Publication of CN102214169A publication Critical patent/CN102214169A/zh
Application granted granted Critical
Publication of CN102214169B publication Critical patent/CN102214169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种关键词信息的提供方法与装置,以解决无法根据用户提供的关键词信息向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度低的关键词信息的问题。方法包括:获得第一关键词信息;获得存储的包括第一关键词信息在内的关键词信息集合以及根据集合中的各个关键词信息所分别选取的第一目标信息;针对任一第一目标信息,获得存储的根据集合中的各个关键词信息分别选取了该目标信息的第一次数;根据第一次数,按照预定的第一相关度确定方式,确定第一关键词信息与集合中各个关键词信息间的第一相关度;根据第一相关度,从集合中选取第二关键词信息提供给用户。本发明实施例还提供一种目标信息的提供方法及装置。

Description

关键词信息与目标信息的提供方法及装置
技术领域
本申请涉及信息搜索技术领域,尤其涉及一种关键词信息的提供方法及装置以及一种目标信息提供方法及装置。
背景技术
随着互联网的普及和信息的发展,信息系统在为用户提供越来越多可供选择的目标信息的同时,也会存在着使用户迷失在大量目标信息中而无法顺利找到自己需要的目标信息的弊端。而目标信息推荐系统是一种直接与用户进行交互,并完成向用户推荐目标信息的一个系统,比如,电子商务推荐系统就是一种目标信息推荐系统,其可以模拟商店销售人员向用户提供商品信息(这里的商品信息就是目标信息的一种)推荐的系统,它能够帮助用户找到所需的商品信息,从而顺利完成商品的购买过程。在日趋激烈的竞争环境下,目标信息推荐系统能有效保留用户、防止用户流失,扩展了信息系统的功能性。
目前,目标信息推荐系统已逐渐成为信息IT技术的一个重要研究内容,得到越了来越多研究者的关注,但在众多研究者的努力完善下,目标信息推荐系统仍然存在着一些缺陷。以基于语义分析的目标信息推荐系统为例,该目标信息推荐系统的实现原理是根据文本信息(比如用户输入的用于查找目标信息的关键词信息)的匹配程度进行推荐,即,根据用户输入的关键词信息所包括的字符与所要查找的目标信息所包括的字符之间的比对结果进行推荐,比如,用户提供的关键词信息为“毛披肩”,通过字符之间的比对,则该系统可能为用户推荐与“毛披肩”较为匹配的另一关键词信息“羊毛披肩”,但当用户输入的关键词信息为“番茄”时,由于番茄和西红柿的字符组成不同,该系统针对两个字符组成完全不匹配的文本无法进行推荐,因此即使“番茄”与“西红柿”这两个关键词信息所描述的对象是同一事物,则目标信息推荐系统也无法根据“番茄”来向用户推荐“西红柿”。
由此可见,现有技术中的目标信息推荐系统存在的缺陷在于:当目标信息推荐系统在获得用户提供的一个关键词信息后,目标信息推荐系统无法根据该关键词信息,向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度不高的关键词信息。
发明内容
本申请实施例提供一种关键词信息的提供方法与装置,用以解决现有技术中存在的当目标信息推荐系统在获得用户提供的一个关键词信息后,目标信息推荐系统无法根据该关键词信息,向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度不高的关键词信息的问题。
此外,本申请实施例还提供了一种目标信息的提供方法与装置。
本申请实施例采用以下技术方案:
一种关键词信息提供方法,包括:
获得用户提供的用于查找目标信息的第一关键词信息;并获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;针对所述第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;根据所述第一次数,按照预定的第一相关度确定方式,分别确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度;并根据确定的第一相关度,从所述集合中选取第二关键词信息提供给用户。
较佳地,根据所述第一次数,按照预定的第一相关度确定方式,分别确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度具体包括:从所述集合中选取关键词信息,并确定所述第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;从所述第一目标信息中,确定用户根据所述第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对;根据所述第一次数,确定根据关键词信息对中的任意一个关键词信息选取目标信息对中的任意一个目标信息的第二次数;根据所述第二次数,确定用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,并确定用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性的第二指标值;以及根据所述第一指标值和第二指标值,确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度。
较佳地,上述方法中可以按照笛卡尔积,确定所述第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;以及按照笛卡尔积,确定所述第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对。
较佳地,可以根据所述第二次数,按照下述公式,确定所述第一指标值ina,b
in a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) A i , j , a , b ′
其中,A′ijab=max(min(Aia,Ajb),min(Aib,Aja)),A′ijab为所述第二次数,Ai,a表示用户根据第一关键词信息qi选取了目标信息oa的所述第一次数,Ai,b表示用户根据qi选取了目标信息ob的所述第一次数,Aj,a表示用户根据所述集合中的任一关键词信息qj选取了oa的所述第一次数,Aj,b表示用户根据qj选取了ob的所述第一次数;以及根据所述第二次数A′ijab,按照公式
Figure GSA00000054024000032
确定所述第二指标值outi,j
较佳地,可以根据第一指标值ina,b和第二指标值outi,j,按照下述方程组,确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度:
x i , j = Σ ∀ a , b : ( q i , q j ) → ( o a , o b ) y a , b in a , b
y a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) x i , j out i , j
其中,xi,j为第一关键词信息qi与所述集合中的任一关键词信息qj之间的所述第一相关度,ya,b为目标信息oa与目标信息ob之间的相关度。
较佳地,上述方法还可以包括:确定用户从第一关键词信息和第二关键词信息中选取并输入到目标信息推荐系统中的关键词信息;获得用户从与输入的所述关键词信息相匹配的各个目标信息中选取的第二目标信息;分别确定第二目标信息与各个第一目标信息之间的第二相关度;根据确定的第二相关度,从所述第一目标信息中选取第三目标信息提供给用户。
较佳地,分别确定第二目标信息与各个第一目标信息之间的第二相关度具体包括:根据所述第一指标值和第二指标值,确定所述第二目标信息与各个第一目标信息之间的第二相关度。
一种目标信息提供方法,包括:获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;获得预先存储的所有用户提供过的包括所述关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;针对所述第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的次数;根据所述次数,按照预定的相关度确定方式,分别确定所述第二目标信息与各个第一目标信息之间的相关度;并根据确定的相关度,从第一目标信息中选取目标信息提供给用户。
一种关键词信息提供装置,包括:第一获得单元,用于获得用户提供的用于查找目标信息的第一关键词信息;第二获得单元,用于获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;次数获得单元,用于针对第二获得单元获得的第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;相关度确定单元,用于根据次数获得单元获得的所述第一次数,按照预定的第一相关度确定方式,分别确定第一获得单元获得的第一关键词信息与所述集合中的各个关键词信息之间的第一相关度;提供单元,用于根据相关度确定单元确定的第一相关度,从第二获得单元获得的集合中选取第二关键词信息提供给用户。
一种目标信息提供装置,包括:第一获得单元,用于获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;第二获得单元,用于获得预先存储的所有用户提供过的包括所述关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;次数获得单元,用于针对第二获得单元获得的第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;相关度确定单元,用于根据次数获得单元获得的第一次数,按照预定的相关度确定方式,分别确定第一获得单元获得的第二目标信息与各个第一目标信息之间的相关度;并提供单元,用于根据相关度确定单元确定的相关度,从第二获得单元获得的第一目标信息中选取目标信息提供给用户。
本申请的有益效果如下:由于本申请实施例提供的该关键词信息的提供方法能够依据关键词信息之间以及目标信息之间的相互关联关系来向用户提供关键词信息,而并非只依据关键词信息之间在语义上的联系来提供关键词信息,因此能够解决现有技术中存在的当目标信息推荐系统在获得用户提供的一个关键词信息后,目标信息推荐系统无法根据该关键词信息,向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度不高的关键词信息的问题。将本申请实施例提供的该方法与现有技术中的基于语义分析的目标信息推荐系统等相结合,能够增强目标信息推荐系统的功能性,从而大大提升用户的使用体验。
附图说明
图1为本申请实施例提供的一种关键词信息的提供方法的具体流程示意图;
图2为本申请实施例中向用户推荐目标信息的具体流程示意图;
图3为本申请实施例提供的一种目标信息的提供方法的具体流程示意图;
图4a为本申请实施例提供的方案在实际中的应用流程示意图;
图4b为本申请实施例中的一个有向二分图的具体结构示意图;
图4c为本申请实施例中的扩展后的有向二分图的具体结构示意图;
图5为本申请实施例提供的一种关键词信息的提供装置的具体结构示意图;
图6为本申请实施例提供的一种目标信息的提供装置的具体结构示意图。
具体实施方式
本申请实施例考虑到目标信息推荐系统在运行中记录了大量的与用户行为相关的数据,其中包括了用户在输入关键词信息后对输入的关键词信息匹配的目标信息的点击行为数据等,而这些点击行为数据会隐式地反映了关键词信息与关键词信息之间以及目标信息与目标信息之间潜在的相关度,因此,本申请实施例针对这些点击行为数据所包含的相关度信息的特点,提供了一种利用关键词信息之间的相关度进行关键词信息推荐的方案。在本申请实施例提供的方案中,在用户输入某一关键词信息后,针对该关键词信息,可以推荐一个或若干个相关度较大的其他关键词信息以供用户选择。具体地,本申请实施例提供的该方案的具体实施过程如下:
本申请实施例首先提供一种关键词信息提供方法,用以解决现有技术存在的当目标信息推荐系统在获得用户提供的一个关键词信息后,目标信息推荐系统无法根据该关键词信息,向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度不高的关键词信息的问题,该方法的具体流程示意图如图1所示,包括以下步骤:
步骤11,获得用户提供的用于查找目标信息的第一关键词信息,用户可以通过向目标信息推荐系统输入第一关键词信息的方式提供第一关键词信息,也可以是通过点击该系统显示给用户的关键词信息而向该系统提供第一关键词,以背景技术部分举的例子为例,比如用户此时提供的第一关键词信息为“番茄”;
步骤12,分别确定第一关键词信息与预先存储的包括第一关键词信息在内的关键词信息集合中的各个关键词信息之间的第一相关度,在本申请实施例提供的该方法中,需要预先对关键词信息进行存储,其中,预先存储的上述集合中的关键词信息可以为所有的用户提供过的关键词信息,也可以为从所有的用户提供过的关键词信息中指定的一部分关键词信息,比如,一旦用户向目标信息推荐系统输入了关键词信息,就对用户输入的该关键词信息进行存储,而存储关键词信息的存储空间可以是目标信息推荐系统的存储空间,也可以是专门为存储关键词信息而设置的独立于目标信息推荐系统外的存储空间,关键词信息的存储格式可以采用现有技术中的已有的任意的信息存储格式,具体地,可以采用如下表3所示的方式对包括第一关键词信息在内的关键词信息集合中的各个关键词信息进行存储,同时,还可以对根据关键词信息所选取的目标信息进行存储,以及对根据关键词信息选取目标信息的次数进行存储,需要说明的是,为了节省存储空间,可以分别为各个关键词信息赋予不同的标识,以标示不同的关键词信息,同时也可以分别为各个目标信息赋予不同的标识,以标示不同的目标信息:
表3:
关键词信息   目标信息   (相应的选取)次数
 番茄(可分配标识001)   **牌番茄酱、番茄种子、...   3、10、...
 番茄种子(可分配标识002)   番茄种子、**牌番茄种子、...   12、15、...
 番茄牌(可分配标识003)   番茄牌服饰、...   18、...
 红番茄(可分配标识004)   红番茄服饰、...   11、...
 西红柿(可分配标识005)  西红柿薯片、西红柿味薯片、番茄种子、...   9、8、3、...
 西红柿味(可分配标识006)  西红柿味薯片、西红柿薯片、...   12、10、...
 ...  ...
此外,确定第一关键词信息“番茄”与预先存储的各个关键词信息之间的相关度的方法可以采用多种方式,比如,可以通过下述方式确定第一相关度:
首先,获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合(如表1中第一列所包含的关键词信息构成的集合即为该关键词信息集合),并获得根据该集合中的各个关键词信息所分别选取的第一目标信息(表1中第二列所包含的各个目标信息即为第一目标信息);
然后,针对第一目标信息中的任一目标信息,获得预先存储的根据集合中的各个关键词信息分别选取了该目标信息的第一次数,例如,若当前目标信息推荐系统中存储的集合包含10个关键词信息,而根据该10个关键词信息,用户实现了对10个目标信息的选取,则针对用户选取的任一目标信息“**牌番茄酱”,可以获得预先存储的所有用户根据存储的关键词信息“番茄”对该“**牌番茄酱”进行了选取的次数,如表1所示,比如当前有3个用户以“番茄”作为关键词信息输入到目标信息推荐系统时,分别都对“**牌番茄酱”进行了1次选取,则上述第一次数就为3次;
最后,根据第一次数,按照预定的第一相关度确定方式,分别确定第一关键词信息与集合中的各个关键词信息之间的第一相关度,比如,在本申请实施例中,可以但不限于采用如下所述的步骤确定第一相关度:
首先,从预先存储的关键词信息集合中选取关键词信息,并确定第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对,例如,可以按照每次选取1个关键词信息与第一关键词信息按照组合的方式构成关键词信息对的方法,直至从上述集合中依次选取到预订数目(或集合所包含的全部)的关键词信息,以表1为例,假设用户当前提供的关键词信息为“番茄”,则可以从关键词信息集合中选取“番茄种子”,并按照组合的方式,构成3组关键词信息对,分别为“番茄,番茄”、“番茄,番茄种子”以及“番茄种子,番茄种子”,此外,也可以按照每次选取2个(或3个,可视具体情况而定)关键词信息与第一关键词信息按照组合的方式构成关键词信息对的方法,直至从上述集合中依次选取到预订数目(或集合所包含的全部)的关键词信息,同时,还需要从第一目标信息中,确定用户根据第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对,这里,目标信息对中所包含的目标信息的个数也可视不同情况设定不同的值,假设目标信息对中包含2个目标信息,则由“番茄种子”和“番茄牌服饰”按照组合方式构成的目标信息对分别为“番茄种子,番茄种子”、“番茄种子,番茄牌服饰”以及“番茄牌服饰,番茄牌服饰”;
然后,根据第一次数,确定根据关键词信息对中的任意一个关键词信息选取目标信息对中的任意一个目标信息的第二次数,并根据第二次数,确定用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,并确定用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性的第二指标值,具体地,针对用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,假设用以衡量用户根据关键词信息对“番茄,番茄”选取目标信息对“**牌番茄种子,**牌番茄种子”的选取倾向的第一指标值被确定为10,而根据关键词信息对“番茄种子,番茄种子”选取目标信息对“**牌番茄种子,**牌番茄种子”的选取倾向的第一指标值被确定为12,则说明用户根据关键词信息对“番茄种子,番茄种子”来选取目标信息对“**牌番茄种子,**牌番茄种子”的选取倾向大于用户根据关键词信息对“番茄,番茄”来选取目标信息对“**牌番茄种子,**牌番茄种子”的选取倾向,即用户根据关键词信息对“番茄种子,番茄种子”,更愿意选取目标信息“**牌番茄种子,**牌番茄种子”,同理,假设用以衡量用户在选取目标信息对“番茄种子、番茄牌服饰”时以关键词信息对“番茄种子、番茄牌”作为选取依据的可能性的第二指标值为12,而用以衡量用户在选取目标信息对“番茄种子、番茄牌服饰”时以关键词信息对“番茄牌、番茄牌”作为选取依据的可能性的第二指标值为18,则说明用户在选取目标信息对“番茄种子、番茄牌服饰”更可能是以“番茄牌、番茄牌”这一关键词信息对作为选取依据的,可见,第一指标值能够反映出关键词信息与目标信息之间的联系,而第二指标值则能够反映出关键词信息对之间的联系,在本申请实施例中,关于该第一指标值和第二指标值的具体描述可以参见后续基于超链接分析的主题搜索算法——HITS算法实现本申请实施例提供的该方法的详细流程;
最后,根据第一指标值和第二指标值,就可以确定出第一关键词信息与上述集合中的各个关键词信息之间的第一相关度;
在本申请实施例中,上述确定第一相关度的过程可以但不限于采用现有技术中的基于超链接分析的主题搜索算法——HITS算法来实现,由于基于HITS算法确定关键词信息之间相关度的具体流程将在后续的一个具体实施例中进行介绍,因此在此不再赘述;
步骤13,根据确定的第一相关度,从上述关键词信息集合中选取第二关键词信息,比如,可以选取与第一关键词信息之间的第一相关度大于预定第一阈值的第二关键词信息,这里的第一阈值可以根据实际需求进行调整,由于在步骤12中已分别确定出了第一关键词信息与预先存储的各个关键词信息之间的第一相关度,因此,在本步骤13中,可以对应于第一相关度由大至小的顺序,对存储的各个关键词信息进行对应排列,并按照第一相关度由大至小的顺序,对应选取预定个数的大于预定第一阈值的关键词信息,并将选取的关键词信息作为第二关键词信息,或者,也可以直接选取与第一关键词信息之间的第一相关度最大的关键词信息作为第二关键词信息,或者,还可以将与第一关键词信息之间的第一相关度大于预定第一阈值的所有关键词信息都选取作为第二关键词信息,按照本申请实施例提供的该方法,由于考虑到了不同关键词信息之间的相关度,因此能够将与第一关键词信息“番茄”之间的第一相关度大于预定第一阈值的第二关键词为“西红柿”选取出来作为第二关键词信息;
步骤14,将选取的第二关键词信息提供给用户,这里的用户可以是当前提供第一关键词信息的用户,也可以是后续再次提供第一关键词信息的用户。
比如,当用户在使用目标信息推荐系统时,当用户在将第一关键词信息“番茄”输入到该系统时,系统就可以采用上述步骤11~14,确定出与“番茄”相关度较大的另一关键词信息“西红柿”,并将“西红柿”作为推荐的关键词信息而提供给用户。由此可见,采用本申请实施例提供的该方法,能够根据用户提供的关键词信息,为用户推荐与该关键词信息指示同一事物且相关度较大的其他关键词信息,因此有效地解决了现有技术存在的当目标信息推荐系统在获得用户提供的一个关键词信息后,目标信息推荐系统无法根据该关键词信息,向用户推荐虽然与该关键词信息描述同一事物但却与该关键词信息的字符组成匹配程度不高的关键词信息的问题,将本申请实施例提供的该方法与现有技术中的基于语义分析的目标信息推荐系统等相结合,能够增强目标信息推荐系统的功能性,从而大大提升用户的使用体验。
本申请实施例提供的该方案可以应用到向用户提供目标信息的过程中,具体地,在上述步骤14中将第二关键词信息提供给提供第一关键词信息的用户后,还可以进一步包括如图2所示的用于向用户推荐目标信息的步骤:
步骤21,确定用户从第一关键词信息和第二关键词信息中选取并输入到目标信息推荐系统中的关键词信息,根据如图1所示的方案,由于此时用户有多个关键词信息可供选取,因此,需要确定用户到底选取了哪个关键词信息,仍然以用户输入的第一关键词为“番茄”为例,假设用户选取了第一关键词信息“番茄”为输入到目标信息推荐系统中的关键词信息;
步骤22,获得用户从与输入的关键词信息相匹配的各个目标信息中选取的第二目标信息,该步骤与现有技术类似,即确定用户从与输入的关键词信息“番茄”相匹配的目标信息中点击了哪个第二目标信息,比如,这里的第二目标信息可以为“**牌番茄酱”;
步骤23,分别确定第二目标信息与各个第一目标信息之间的第二相关度,在确定第二相关度时,与确定第一相关度的方式类似,本申请实施例中也可以根据步骤12中所述的第一指标值和第二指标值来确定第二目标信息与各个第一目标信息之间的第二相关度;
步骤24,根据确定的第二相关度,从第一目标信息中选取第三目标信息,比如,可以从第一目标信息中选取与第二目标信息之间的第二相关度大于预定第二阈值的第三目标信息,比如,假设第一目标信息包含有“**牌番茄酱”、“西红柿口味薯条”、“番茄沙拉”、“茄子酱”、“雪茄”......等多个目标信息,而从中确定出的与第二目标信息“**牌番茄酱”的第二相关度大于第二阈值的第三目标信息为“**牌番茄酱”、“西红柿口味薯条”和“番茄沙拉”;
步骤25,将选取的第三目标信息提供给提供第一关键词信息的用户,比如,在提供目标信息时,可以选择将“西红柿口味薯条”和“番茄沙拉”这两种目标信息都提供给用户(由于“**牌番茄酱”与第二目标信息一致,因此可以不用再提供给用户了),也可以选择将两者中的一个提供给用户,从而使得用户能够浏览到自身希望购买的商品,进一步提高了用户的使用体验。
本申请实施例提供的该方案充分地挖掘利用了点击数据(即根据关键词信息选取目标信息的相关数据)所蕴涵的深度信息,扩展了关键词信息及目标信息的推荐范围,同时,本申请实施例提供的该方案可以是一种“离线”方案,即只需要用户输入一个关键词信息即可,而无需用户与目标信息推荐系统之间过多的信息交互,从而与现有技术相比,本申请实施例提供的该方案不会增加额外网络传输量,避免了在关键词信息推荐过程中给用户带来额外的计算开销。
此外,本申请实施例还提供了一种目标信息提供方法,用以解决现有技术中存在的当目标信息推荐系统在向用户推荐目标信息时,无法根据用户选取的一个目标信息,向用户推荐虽然与该目标信息描述同一事物但却与该目标信息的内容匹配程度不高的目标信息的问题,该方法的具体流程示意图如图3所示,包括以下步骤:
步骤31,获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;
步骤32,获得预先存储的所有用户提供过的包括上述关键词信息在内的关键词信息集合,并获得根据集合中的各个关键词信息所分别选取的第一目标信息;
步骤33,针对第一目标信息中的任一目标信息,获得预先存储的根据存储的关键词信息集合中的各个关键词信息分别选取了该目标信息的次数,例如,若当前目标信息推荐系统中存储了10个关键词信息,而根据该10个关键词信息,用户实现了对10个目标信息(这里的10个目标信息即为上述第一目标信息,一般地,第二目标信息也包含在这里的第一目标信息中,但也有可能第二目标信息没有包含在第一目标信息中)的选取,则针对用户选取的任一目标信息“**牌番茄酱”,可以获得预先存储的所有用户根据存储的关键词信息“番茄”对该“**牌番茄酱”进行了选取的次数,比如有3个用户以“番茄”作为关键词信息输入到目标信息推荐系统时,分别对该“**牌番茄酱”进行了1次选取,则根据“番茄”选取了“**牌番茄酱”的次数就为3次,若用户当前选取的第二目标信息没有包含在第一目标信息中,则与第二目标信息相对应的次数就为0;
步骤34,根据步骤33中获得的次数,按照预定的相关度确定方式,分别确定第二目标信息与各个第一目标信息之间的相关度,其中,这里的相关度的确定方法与步骤23中确定第二相关度的方法类似,在此不再赘述;
步骤35,根据确定的相关度,从第一目标信息中选取目标信息,比如,可以从第一目标信息中选取与第二目标信息之间的相关度大于预定阈值的目标信息,也可以从第一目标信息中选取预定个数的与第二目标信息之间的相关度大于预定阈值的目标信息,还可以从第一目标信息中选取与第二目标信息之间的相关度最大的目标信息;
步骤36,将选取的目标信息提供给用户。
以下以HITS算法为例,详细介绍本申请实施例提供的该关键词信息提供方案在实际中的应用流程,该应用流程的具体示意图如图4a所示,包括以下步骤:
步骤41,获得用户向目标信息推荐系统中输入的第一关键词信息qi
步骤42,获得预先存储的所有用户提供过的包括qi在内的关键词信息集合,并获得根据该集合中的各个关键词信息所分别选取的第一目标信息,具体地,在本申请实施例中,在用户向目标信息推荐系统中输入关键词信息前,可以利用目标信息推荐系统空闲的存储空间,对用户向目标信息推荐系统中输入过的关键词信息以及用户根据输入过的关键词信息所选取的目标信息进行记录,形成由关键词信息与目标信息构成的数据对应关系,记关键词信息构成的集合为Q,目标信息构成的集合为O,同时形成Q→O的有向二分图(如图4b所示,即为一个有向二分图的具体结构示意图),记为G=(Q∪O,Q→O),其中Q∪O表示有向二分图的结点集合,Q→O表示二分有向图的边集合,边集合记录了如下的点击关系:若任意用户在输入关键词信息qj后对目标信息oa进行了浏览,那么,在Q→O就存在一对数据(qj,oa)∈Q→O,记A为“点击矩阵”;
步骤43,针对第一目标信息中的任一目标信息,获得预先存储的根据关键词信息集合中的各个关键词信息分别选取了该目标信息的第一次数,比如,该预先存储的次数可以由形如Aja的形式进行描述,其表示所有用户根据第j个关键词信息对第a个目标信息进行了点击的次数(即第一次数),即记录了所有用户在输入了关键词信息qj后点击了目标信息oa的总次数,以图4b为例,由q1指向o1的箭头表示用户在输入了关键词信息q1后,点击了目标信息o1,同理,由q2指向o1的箭头表示用户在输入了关键词信息q2后,点击了目标信息o1,以此类推;
步骤44,根据上述第一次数,按照预定的第一相关度确定方式,分别确定第一关键词信息qi与关键词信息集合中的各个关键词信息之间的第一相关度,其中,第一相关度的可以按照下述的HITS算法来确定:
首先,将步骤42中形成的有向二分图进行扩展,形成新的有向二分图G’={Q’∪O’,Q’→O’}(G’的具体实例请参见附图4c),比较图4b中的有向二分图和图4c中的有向二分图可知,图4b中的有向二分图能够表现出一个关键词信息与根据该关键词信息选取的目标信息之间的联系,而图4c中所展示的扩展后的有向二分图能够表现由两个关键词信息构成的“关键词信息对”与由两个目标信息构成的“目标信息对”之间的联系,该扩展后的有向二分图形成了新的四维点击矩阵,其中,将G扩展为G’时所采用的扩展规则如下:
Q’=Q×Q,即Q’为Q和Q的笛卡儿积,
Figure GSA00000054024000151
若qi,qj∈Q,则有(qi,qj)∈Q’;
O’=O×O,即O’为O和O的笛卡儿积;
Figure GSA00000054024000152
若,oa,ob∈O,则有(oa,ob)∈O’;
Figure GSA00000054024000153
若(qi,oa)∈Q→O且(qj,ob)∈Q→O,或qj,oa)∈Q→O且qi,ob)∈Q→O,则((qi,qj),(oa,ob))∈Q’→O’,亦可表示为(qi,qj)→(oa,ob);
需要说明的是,本申请实施例中将图4b中有向二分图扩展为如图4c所示的有向二分图,是为了形象地展示关键词对与目标信息对之间的对应关系,如果不考虑算法的复杂度,也可以以三个关键词信息作为关键词信息对,而相应地以三个目标信息作为目标信息对,此外,图4c中的关键词信息对与目标信息对之间的箭头则用以形象地表示关键词信息对与目标信息对之间的权重,比如,关键词信息对(q1,q1)与目标信息对(o1,o2)之间的箭头就是表示(q1,q1)与(o1,o2)之间的权值,该权值的物理含义可以解释为用户根据关键词信息对中的任意一个关键词信息对目标信息对中的任意一个目标信息进行了选取的次数,这里的权重即为本申请实施例所提到的“第二次数”,在本申请实施例中,若以A’表示权值,则A’最佳的计算公式可以如下式[1]所示:
A′ijab=max(min(Aia,Ajb),min(Aib,Aja))    [1]
该公式中各项的物理含义可以解释如下:
min(Aia,Ajb)为用户根据关键词信息qi对目标信息oa进行了选取的次数以及根据关键词信息qj对目标信息ob进行了选取的次数这两者中的最小次数,这个最小次数可以反映出用户根据关键词qi与qj分别对目标信息oa、ob进行对应选取时的一种选取倾向,该选取倾向也可以由max(Aia,Ajb)来进行表示,但由于利用max(Aia,Ajb)来反映该选取倾向时,同一用户根据同一关键词信息对同一目标信息进行了多次选取的行为会对该max(Aia,Ajb)的值影响较大,可能导致max(Aia,Ajb)的运算结果不能精确反映用户的选取倾向,因此,本申请实施例中,还是优先采用min(Aia,Ajb)这样的方式来进行计算,同理,min(Aib,Aja)为用户根据关键词信息qi对目标信息ob进行了选取的次数以及根据关键词信息qj对目标信息oa进行了选取的次数这两者中的最小次数,其反映出用户根据关键词qi与qj分别对目标信息ob、oa进行对应选取时的一种选取倾向,而A′ijab的含义则在于从min(Aia,Ajb)与min(Aib,Aja)所分别反映出的选取倾向中选取最能代表用户普遍的选取倾向的一个值,即选取min(Aia,Ajb)与min(Aib,Aja)中最大的一个值。
此外,还可以如下式所示的公式来计算A’:
A′ijab=min(max(Aia,Ajb),max(Aib,Aja))
在计算出关键词信息对与目标信息对之间的权值后,可以以二维向量X作为指示关键词信息之间相关度的向量,从而X描述的是Q’中关键词信息对的相关度,即若(qi,qj)∈Q’,则xi,j表示qi与qj的相关度,xi,j的计算方式如下式[2]所示,其中,分母为零的一项可看做无效而不带入加法计算:
x i , j = Σ ∀ a , b : ( q i , q j ) → ( o a , o b ) y a , b in a , b - - - [ 2 ]
其中,ina,b表示所有指向结点(oa,ob)的边的权值之和,其计算方式如下式[3]所示,ina,b用以衡量用户根据各个关键词信息对选取任一目标信息对的选取倾向,即实施例所述的第一指标值:
in a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) A i , j , a , b ′ - - - [ 3 ]
以附图4b为例,假设根据关键词信息q1选取了目标信息o1的次数为3次,即A1,1=3,而根据关键词信息q2选取了目标信息o1的次数为5次,即A2,1=5,根据关键词信息q2选取了目标信息o2的次数为7次,即A2,2=7,则有如下表2所示的关系:
表2:
  i,j,a,b   Ai,a的值   Aj,b的值   Ai,b的值   Aj,a的值
  1,1,1,1   A1,1=3   A1,1=3   A1,1=3   A1,1=3
  1,1,1,2   A1,1=3   A1,2=0   A1,2=0   A1,1=3
  1,1,2,2   A1,2=0   A1,2=0   A1,2=0   A1,2=0
  1,2,1,1   A1,1=3   A2,1=5   A1,1=3   A2,1=5
  1,2,1,2   A1,1=3   A2,2=7   A1,2=0   A2,1=5
  1,2,2,2   A1,2=0   A2,2=7   A1,2=0   A2,2=7
  2,2,1,1   A2,1=5   A2,1=5   A2,1=5   A2,1=5
  2,2,1,2   A2,1=5   A2,2=7   A2,2=7   A2,1=5
  2,2,2,2   A2,2=7   A2,2=7   A2,2=7   A2,2=7
以附图4c为例,根据上表2和公式[1],可计算得到如下表3所示的各个A’i,j,a,b的值:
表3:
  i,j,a,b   A’i,j,a,b的值
  1,1,1,1   A’1,1,1,1=3
  1,1,1,2   A’1,1,1,2=0
  1,1,2,2   A’1,1,2,2=0
  1,2,1,1   A’1,2,1,1=3
  1,2,1,2   A’1,2,1,2=3
  1,2,2,2   A’1,2,2,2=0
  2,2,1,1   A’2,2,1,1=5
  2,2,1,2   A’2,2,1,2=5
  2,2,2,2   A’2,2,2,2=7
由上表3中的值以及公式[3]可知,in1,1=A’1,1,1,1+A’1,2,1,1+A’2,2,1,1=3+3+5=11;in1,2=A’1,1,1,2+A’1,2,1,2+A’2,2,1,2=0+3+5=8;in2,2=A’1,1,2,2+A’1,2,2,2+A’2,2,2,2=0+0+7=7。
对应于二维向量X,在本申请实施例中,可以以二维向量Y作为指示目标信息之间相关度的向量,从而Y描述的是O’中目标信息对的相关度(需要说明的是,可以将上述X、Y均设置为单位矩阵),即若(oa,ob)∈O’,则ya,b表示oa与ob之间的相关度,ya,b的计算方式如下式[4]所示:
y a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) x i , j out i , j - - - [ 4 ]
其中,outi,j表示结点(qi,qj)指向其余所有结点的边的权值之和,其计算方式如下式[5]所示,outi,j用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性,即实施例所述的第二指标值:
out i , j = Σ ∀ a , b : ( q i , q j ) → ( o a , o b ) A i , j , a , b ′ - - - [ 5 ]
同样以上表3为例,由该表3中的值以及公式[5],可以计算出outi,j的值:
out1,1=A’1,1,1,1+A’1,1,1,2+A’1,1,2,2=3+0+0=3;out1,2=A’1,2,1,1+A’1,2,1,2+A’1,2,2,2=3+3+0=6;
out2,2=A’2,2,1,1+A’2,2,1,2+A’2,2,2,2=5+5+7=17,进一步地,通过上式[2]、[4]构成的方程组,就能够确定出第一关键词信息qi与关键词信息qj之间的第一相关度;
步骤45,在按照上述步骤分别确定出第一关键词信息qi与关键词信息集合中的各个关键词信息qj之间的第一相关度后,就能够根据确定的该第一相关度,从关键词信息集合中选取一个或多个与用户输入的该关键词信息qi相关度较大的其他关键词信息并推荐给用户,需要说明的是,在采用上述公式[1]~[5]计算关键词信息之间的相关度以及目标信息之间的相关度时,每次依照上述公式[2]、[4]将X,Y迭代过一遍后,可以对计算得到的xi,j和ya,b进行归一化处理,归一化方式可以采用下式[6]、[7],其中,x’i,j为对xi,j进行归一化处理后得到的结果,而y’a,b为对ya,b进行归一化处理后得到的结果:
x i , j ′ = x i , j Σx - - - [ 6 ]
y a , b ′ = y a , b Σy - - - [ 7 ]
利用上述公式[1]~[7]进行迭代计算至满足收敛条件或迭代计算至预定次数(比如20次)后,可以按照x值由大至小的顺序对Q’中的结点进行降序排列,并从排列好的节点中按照由前至后的选取顺序选取占所有关键词信息对10%的关键词信息对,例如,若当前选取到了(q1,q2),且(q1,q2)中的q1=“番茄”,q2=“西红柿”,且用户当前是将“番茄”作为其输入的关键词信息,那么“西红柿”就可以作为提供给用户的关键词信息而推荐给用户,反之亦然;同理,还可以按照y由大至小的顺序值的大小对O’中的结点进行降序排列,并从排列好的节点中按照由前至后的选取顺序选取占所有目标信息对的10%的目标信息对,例如,若当前选取到了(o1,o1),且(o1,o1)中的o1=“西红柿种子”,o2=“番茄种子”,则当用户将“西红柿种子”作为其浏览点击的目标信息时,那么也可以将“番茄种子”这一目标信息推荐给用户,反之亦然。
需要说明的是,上述收敛条件可以由下式[8]定义:
∑xk-xk-1≤εx且∑yk-yk-1≤εy    [8]
其中xk表示迭代k次后用于指示关键词信息之间相关度的向量,而yk表示迭代k次后用于指示目标信息之间相关度的向量,εx和εy可根据实际情况进行设置,在本申请实施例中,可以将εx和εy均设置为1e-8。
以上是本申请实施例提供的一种关键词信息提供方法在实际中的应用流程,采用本申请实施例提供的该方案,能够充分利用关键词信息与关键词信息之间以及目标信息与目标信息之间潜在的相关度,有效扩展为用户推荐的关键词信息的范围,大大改善了用户的使用体验。
需要说明的是,本申请实施例仅以HITS算法为例来对本申请实施例提供的方案的应用流程进行了详细描述,然而在具体应用中,采用现有技术提供的其他用于计算相关度大小的算法计算关键词信息(目标信息)之间的相关度,并按照本申请实施例提供的方案实现向用户提供关键词信息(目标信息)的方案均在本申请的保护范围之内。
相应地,本申请实施例还提供了一种提供关键词信息的装置,该装置的具体结构示意图如图5所示,包括以下功能单元:
第一获得单元51,用于获得用户提供的用于查找目标信息的第一关键词信息;
第二获得单元52,用于获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合,并获得根据关键词信息集合中的各个关键词信息所分别选取的第一目标信息;
次数获得单元53,用于针对第二获得单元52获得的第一目标信息中的任一目标信息,获得预先存储的根据关键词信息集合中的各个关键词信息分别选取了该目标信息的第一次数;
相关度确定单元54,用于根据次数获得单元53获得的第一次数,按照预定的第一相关度确定方式,分别确定第一获得单元51获得的第一关键词信息与第二获得单元52获得的关键词信息集合中的各个关键词信息之间的第一相关度;
提供单元55,用于根据相关度确定单元54确定的第一相关度,从第二获得单元52获得的集合中选取第二关键词信息提供给用户。
针对上述相关度确定单元54功能的一种实现方式,本申请实施例中,还可以将相关度确定单元54进一步划分为以下功能模块,包括:
关键词信息对确定模块,用于从关键词信息集合中选取关键词信息,并确定第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;目标信息对确定模块,用于从第一目标信息中,确定用户根据第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对;第二次数确定模块,用于根据第一次数,确定根据关键词信息对确定模块确定的关键词信息对中的任意一个关键词信息选取目标信息对确定模块确定的目标信息对中的任意一个目标信息的第二次数;指标值确定模块,用于根据第二次数确定模块确定的第二次数,确定用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,并确定用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性的第二指标值;第一相关度确定模块,用于根据指标值确定模块确定的第一指标值和第二指标值,确定第一关键词信息与关键词信息集合中的各个关键词信息之间的第一相关度。
进一步地,本申请实施例提供的该装置在向用户提供关键词信息后,还能进一步根据用户选取的目标信息,向用户提供与选取的目标信息具有一定相关度的目标信息,为了实现这一功能,本申请实施例提供的该装置还可以进一步包括:关键词信息确定单元,用于确定用户从第一获得单元51获得的第一关键词信息和提供单元55提供的第二关键词信息中选取并输入到目标信息推荐系统中的关键词信息;第二目标信息获得单元,用于获得用户从与关键词信息确定单元确定的关键词信息相匹配的各个目标信息中选取的第二目标信息;第二相关度确定单元,用于分别确定第二目标信息获得单元获得的第二目标信息与各个第一目标信息之间的第二相关度;目标信息提供单元,用于根据第二相关度确定单元确定的第二相关度,从第一目标信息中选取第三目标信息提供给用户,其中,上述第二相关度确定单元在确定第二相关度时,可以但不限于是根据第一指标值和第二指标值来第二目标信息与各个第一目标信息之间的第二相关度的。
此外,本申请实施例还提供一种目标信息提供装置,用以解决现有技术中存在的当目标信息推荐系统在向用户推荐目标信息时,无法根据用户选取的一个目标信息,向用户推荐虽然与该目标信息描述同一事物但却与该目标信息的字符组成匹配程度不高的目标信息的问题,该装置的具体结构示意图如图6所示,包括以下功能单元:
第一获得单元61,用于获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;
第二获得单元62,用于获得预先存储的所有用户提供过的包括用户输入到目标信息推荐系统中的关键词信息在内的关键词信息集合,并获得根据关键词信息集合中的各个关键词信息所分别选取的第一目标信息;
次数获得单元63,用于针对第二获得单元62获得的第一目标信息中的任一目标信息,获得预先存储的根据关键词信息集合中的各个关键词信息分别选取了该目标信息的第一次数;
相关度确定单元64,用于根据次数获得单元63获得的第一次数,按照预定的相关度确定方式,分别确定第一获得单元61获得的第二目标信息与各个第一目标信息之间的相关度;
提供单元65,用于根据相关度确定单元64确定的相关度,从第二获得单元62获得的第一目标信息中选取目标信息提供给用户。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种关键词信息提供方法,其特征在于,包括:
获得用户提供的用于查找目标信息的第一关键词信息;并
获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;
针对所述第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;
根据所述第一次数,按照预定的第一相关度确定方式,分别确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度;并
根据确定的第一相关度,从所述集合中选取第二关键词信息提供给用户。
2.如权利要求1所述的方法,其特征在于,根据所述第一次数,按照预定的第一相关度确定方式,分别确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度具体包括:
从所述集合中选取关键词信息,并确定所述第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;
从所述第一目标信息中,确定用户根据所述第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对;
根据所述第一次数,确定根据关键词信息对中的任意一个关键词信息选取目标信息对中的任意一个目标信息的第二次数;
根据所述第二次数,确定用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,并确定用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性的第二指标值;以及
根据所述第一指标值和第二指标值,确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度。
3.如权利要求2所述的方法,其特征在于,按照笛卡尔积,确定所述第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;以及
按照笛卡尔积,确定所述第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对。
4.如权利要求2所述的方法,其特征在于,根据所述第二次数,按照下述公式,确定所述第一指标值ina,b
in a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) A i , j , a , b ′
其中,A′ijab=max(min(Aia,Ajb),min(Aib,Aja)),A′ijab为所述第二次数,Ai,a表示用户根据第一关键词信息qi选取了目标信息oa的所述第一次数,Ai,b表示用户根据qi选取了目标信息ob的所述第一次数,Aj,a表示用户根据所述集合中的任一关键词信息qj选取了oa的所述第一次数,Aj,b表示用户根据qj选取了ob的所述第一次数;以及
根据所述第二次数A′ijab,按照公式
Figure FSA00000054023900022
确定所述第二指标值outi,j
5.如权利要求4所述的方法,其特征在于,根据所述第一指标值ina,b和第二指标值outi,j,按照下述方程组,确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度:
x i , j = Σ ∀ a , b : ( q i , q j ) → ( o a , o b ) y a , b in a , b
y a , b = Σ ∀ i , j : ( q i , q j ) → ( o a , o b ) x i , j out i , j
其中,xi,j为第一关键词信息qi与所述集合中的任一关键词信息qj之间的所述第一相关度,ya,b为目标信息oa与目标信息ob之间的相关度。
6.如权利要求1所述的方法,其特征在于,还包括:
确定用户从第一关键词信息和第二关键词信息中选取并输入到目标信息推荐系统中的关键词信息;
获得用户从与输入的所述关键词信息相匹配的各个目标信息中选取的第二目标信息;
分别确定第二目标信息与各个第一目标信息之间的第二相关度;
根据确定的第二相关度,从所述第一目标信息中选取第三目标信息提供给用户。
7.如权利要求3所述的方法,其特征在于,分别确定第二目标信息与各个第一目标信息之间的第二相关度具体包括:
根据所述第一指标值和第二指标值,确定所述第二目标信息与各个第一目标信息之间的第二相关度。
8.一种目标信息提供方法,其特征在于,包括:
获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;
获得预先存储的所有用户提供过的包括所述关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;
针对所述第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的次数;
根据所述次数,按照预定的相关度确定方式,分别确定所述第二目标信息与各个第一目标信息之间的相关度;并
根据确定的相关度,从第一目标信息中选取目标信息提供给用户。
9.一种关键词信息提供装置,其特征在于,包括:
第一获得单元,用于获得用户提供的用于查找目标信息的第一关键词信息;
第二获得单元,用于获得预先存储的所有用户提供过的包括第一关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;
次数获得单元,用于针对第二获得单元获得的第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;
相关度确定单元,用于根据次数获得单元获得的所述第一次数,按照预定的第一相关度确定方式,分别确定第一获得单元获得的第一关键词信息与所述集合中的各个关键词信息之间的第一相关度;
提供单元,用于根据相关度确定单元确定的第一相关度,从第二获得单元获得的集合中选取第二关键词信息提供给用户。
10.如权利要求9所述的装置,其特征在于,所述相关度确定单元具体包括:
关键词信息对确定模块,用于从所述集合中选取关键词信息,并确定所述第一关键词信息与选取的关键词信息按照组合的方式所构成的关键词信息对;
目标信息对确定模块,用于从所述第一目标信息中,确定用户根据所述第一关键词信息与选取的关键词信息所分别选取的目标信息按照组合的方式所构成的目标信息对;
第二次数确定模块,用于根据所述第一次数,确定根据关键词信息对确定模块确定的关键词信息对中的任意一个关键词信息选取目标信息对确定模块确定的目标信息对中的任意一个目标信息的第二次数;
指标值确定模块,用于根据第二次数确定模块确定的第二次数,确定用以衡量根据各个关键词信息对选取任一目标信息对的选取倾向的第一指标值,并确定用以衡量用户在选取各个目标信息对时以任一关键词信息对作为选取依据的可能性的第二指标值;
第一相关度确定模块,用于根据指标值确定模块确定的第一指标值和第二指标值,确定所述第一关键词信息与所述集合中的各个关键词信息之间的第一相关度。
11.如权利要求9所述的装置,其特征在于,还包括:
关键词信息确定单元,用于确定用户从第一获得单元获得的第一关键词信息和提供单元提供的第二关键词信息中选取并输入到目标信息推荐系统中的关键词信息;
第二目标信息获得单元,用于获得用户从与关键词信息确定单元确定的关键词信息相匹配的各个目标信息中选取的第二目标信息;
第二相关度确定单元,用于分别确定第二目标信息获得单元获得的第二目标信息与各个第一目标信息之间的第二相关度;
目标信息提供单元,用于根据第二相关度确定单元确定的第二相关度,从所述第一目标信息中选取第三目标信息提供给用户。
12.如权利要求11所述的装置,其特征在于,所述第二相关度确定单元具体用于根据所述第一指标值和第二指标值,确定第二目标信息获得单元获得的第二目标信息与各个第一目标信息之间的第二相关度。
13.一种目标信息提供装置,其特征在于,包括:
第一获得单元,用于获得用户从与输入到目标信息推荐系统中的关键词信息相匹配的各个目标信息中选取的第二目标信息;
第二获得单元,用于获得预先存储的所有用户提供过的包括所述关键词信息在内的关键词信息集合,并获得根据所述集合中的各个关键词信息所分别选取的第一目标信息;
次数获得单元,用于针对第二获得单元获得的第一目标信息中的任一目标信息,获得预先存储的根据所述集合中的各个关键词信息分别选取了该目标信息的第一次数;
相关度确定单元,用于根据次数获得单元获得的第一次数,按照预定的相关度确定方式,分别确定第一获得单元获得的第二目标信息与各个第一目标信息之间的相关度;并
提供单元,用于根据相关度确定单元确定的相关度,从第二获得单元获得的第一目标信息中选取目标信息提供给用户。
CN201010139850.1A 2010-04-02 2010-04-02 关键词信息与目标信息的提供方法及装置 Active CN102214169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010139850.1A CN102214169B (zh) 2010-04-02 2010-04-02 关键词信息与目标信息的提供方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010139850.1A CN102214169B (zh) 2010-04-02 2010-04-02 关键词信息与目标信息的提供方法及装置

Publications (2)

Publication Number Publication Date
CN102214169A true CN102214169A (zh) 2011-10-12
CN102214169B CN102214169B (zh) 2017-11-24

Family

ID=44745484

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010139850.1A Active CN102214169B (zh) 2010-04-02 2010-04-02 关键词信息与目标信息的提供方法及装置

Country Status (1)

Country Link
CN (1) CN102214169B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN103106212A (zh) * 2011-11-14 2013-05-15 中国移动通信集团广西有限公司 信息搜索方法及装置
CN103136213A (zh) * 2011-11-23 2013-06-05 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103164447A (zh) * 2011-12-14 2013-06-19 阿里巴巴集团控股有限公司 一种搜索目标信息的方法及装置
CN103559284A (zh) * 2013-11-07 2014-02-05 北京国双科技有限公司 网页关键词的拓词方法和装置
CN103593371A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
CN104615626A (zh) * 2013-11-05 2015-05-13 英奇达资讯股份有限公司 推荐浏览物件的方法
CN103577432B (zh) * 2012-07-26 2017-07-14 阿里巴巴集团控股有限公司 一种商品信息搜索方法和系统
CN107483595A (zh) * 2017-08-23 2017-12-15 北京百度网讯科技有限公司 信息推送方法和装置
CN109213937A (zh) * 2018-11-29 2019-01-15 深圳爱问科技股份有限公司 智能搜索方法及装置
CN111104026A (zh) * 2019-08-02 2020-05-05 广州三星通信技术研究有限公司 推荐服务的方法和设备
CN113282807A (zh) * 2021-06-29 2021-08-20 中国平安人寿保险股份有限公司 基于二部图的关键词扩展方法、装置、设备及介质
CN114398514A (zh) * 2021-12-24 2022-04-26 北京达佳互联信息技术有限公司 一种视频展示方法、装置及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109144954B (zh) * 2018-09-18 2021-03-16 北京字节跳动网络技术有限公司 编辑文档的资源推荐方法、装置及电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1667615A (zh) * 2004-03-09 2005-09-14 微软公司 用户意向的发现
CN1755685A (zh) * 2004-09-30 2006-04-05 微软公司 查询图
US7581237B1 (en) * 2000-10-30 2009-08-25 Pace Plc Method and apparatus for generating television program recommendations based on prior queries
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7581237B1 (en) * 2000-10-30 2009-08-25 Pace Plc Method and apparatus for generating television program recommendations based on prior queries
CN1667615A (zh) * 2004-03-09 2005-09-14 微软公司 用户意向的发现
CN1755685A (zh) * 2004-09-30 2006-04-05 微软公司 查询图
CN101650731A (zh) * 2009-08-31 2010-02-17 浙江大学 基于用户反馈的赞助搜索广告的建议关键词生成方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
IOANNIS ANTONELLIS 等: "Simrank++: query rewriting through link analysis of the click graph", 《PROCEEDINGS OF THE VLDB ENDOWMENT》 *
王继民 等: "搜索引擎用户点击行为分析", 《情报学报》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103106212A (zh) * 2011-11-14 2013-05-15 中国移动通信集团广西有限公司 信息搜索方法及装置
CN103106212B (zh) * 2011-11-14 2016-12-07 中国移动通信集团广西有限公司 信息搜索方法及装置
CN103136213B (zh) * 2011-11-23 2017-04-12 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103136213A (zh) * 2011-11-23 2013-06-05 阿里巴巴集团控股有限公司 一种提供相关词的方法及装置
CN103164447A (zh) * 2011-12-14 2013-06-19 阿里巴巴集团控股有限公司 一种搜索目标信息的方法及装置
CN103164447B (zh) * 2011-12-14 2016-03-30 阿里巴巴集团控股有限公司 一种搜索目标信息的方法及装置
CN102542489B (zh) * 2011-12-27 2018-05-04 北京京东尚科信息技术有限公司 一种基于用户兴趣关联的推荐方法
CN102542489A (zh) * 2011-12-27 2012-07-04 纽海信息技术(上海)有限公司 一种基于用户兴趣关联的推荐方法
CN103577432B (zh) * 2012-07-26 2017-07-14 阿里巴巴集团控股有限公司 一种商品信息搜索方法和系统
CN103593371A (zh) * 2012-08-16 2014-02-19 腾讯科技(深圳)有限公司 推荐搜索关键词的方法和装置
CN104615626A (zh) * 2013-11-05 2015-05-13 英奇达资讯股份有限公司 推荐浏览物件的方法
CN103559284B (zh) * 2013-11-07 2017-08-01 北京国双科技有限公司 网页关键词的拓词方法和装置
CN103559284A (zh) * 2013-11-07 2014-02-05 北京国双科技有限公司 网页关键词的拓词方法和装置
CN107483595A (zh) * 2017-08-23 2017-12-15 北京百度网讯科技有限公司 信息推送方法和装置
CN107483595B (zh) * 2017-08-23 2023-11-21 北京百度网讯科技有限公司 信息推送方法和装置
CN109213937A (zh) * 2018-11-29 2019-01-15 深圳爱问科技股份有限公司 智能搜索方法及装置
CN109213937B (zh) * 2018-11-29 2020-07-24 深圳爱问科技股份有限公司 智能搜索方法及装置
CN111104026A (zh) * 2019-08-02 2020-05-05 广州三星通信技术研究有限公司 推荐服务的方法和设备
CN113282807A (zh) * 2021-06-29 2021-08-20 中国平安人寿保险股份有限公司 基于二部图的关键词扩展方法、装置、设备及介质
CN113282807B (zh) * 2021-06-29 2022-09-02 中国平安人寿保险股份有限公司 基于二部图的关键词扩展方法、装置、设备及介质
CN114398514A (zh) * 2021-12-24 2022-04-26 北京达佳互联信息技术有限公司 一种视频展示方法、装置及电子设备
CN114398514B (zh) * 2021-12-24 2022-11-22 北京达佳互联信息技术有限公司 一种视频展示方法、装置及电子设备

Also Published As

Publication number Publication date
CN102214169B (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN102214169A (zh) 关键词信息与目标信息的提供方法及装置
CN103678672B (zh) 一种信息推荐方法
TWI787196B (zh) 業務對象屬性標識的生成方法、裝置和系統
CN103729359B (zh) 一种推荐搜索词的方法及系统
CN109062994A (zh) 推荐方法、装置、计算机设备和存储介质
CN104252456B (zh) 一种权重估计方法、装置及系统
CN103902545B (zh) 一种类目路径识别方法及系统
CN106251174A (zh) 信息推荐方法及装置
CN106295832A (zh) 产品信息推送方法及装置
CN113641920B (zh) 基于社区发现和图神经网络的商品个性化推荐方法及系统
Lin et al. A two-phase approach to mine short-period high-utility itemsets in transactional databases
CN106446189A (zh) 一种资讯推荐方法及系统
CN104111941A (zh) 信息展示的方法及设备
CN104615779A (zh) 一种Web文本个性化推荐方法
CN109711887A (zh) 商城推荐列表的生成方法、装置、电子设备及计算机介质
CN103942193B (zh) 一种信息推送的方法及装置
CN109410001B (zh) 一种商品推荐方法、系统、电子设备和存储介质
CN108073667A (zh) 产生用户浏览属性的方法、以及非暂存计算机可读介质
CN103365842B (zh) 一种页面浏览推荐方法及装置
CN109064293A (zh) 商品推荐方法、装置、计算机设备及存储介质
CN108733705A (zh) 一种高效用序列模式挖掘方法及装置
CN110175192A (zh) 一种基于主题序列模式的旅游产品推荐方法
Shrivastava et al. Product recommendations using textual similarity based learning models
CN110020171A (zh) 数据处理方法、装置、设备及计算机可读存储介质
CN106156113A (zh) 一种视频推荐的方法、系统及电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1160245

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1160245

Country of ref document: HK