CN102737038A - 关联度确定方法及装置、信息提供方法及装置 - Google Patents

关联度确定方法及装置、信息提供方法及装置 Download PDF

Info

Publication number
CN102737038A
CN102737038A CN2011100865370A CN201110086537A CN102737038A CN 102737038 A CN102737038 A CN 102737038A CN 2011100865370 A CN2011100865370 A CN 2011100865370A CN 201110086537 A CN201110086537 A CN 201110086537A CN 102737038 A CN102737038 A CN 102737038A
Authority
CN
China
Prior art keywords
key word
searching key
information
click
association
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2011100865370A
Other languages
English (en)
Other versions
CN102737038B (zh
Inventor
郭瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201110086537.0A priority Critical patent/CN102737038B/zh
Publication of CN102737038A publication Critical patent/CN102737038A/zh
Priority to HK12111535.5A priority patent/HK1170820A1/zh
Application granted granted Critical
Publication of CN102737038B publication Critical patent/CN102737038B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种关联度确定方法及装置、信息提供方法及装置,关联度确定方法包括下述步骤:获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;根据获得的各搜索关键词,构造各搜索关键词对;在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;针对选择出的每个搜索关键词对,分别执行:针对该搜索关键词对包含的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。采用本申请技术方案,解决了现有技术中存在的为用户提供的信息不准确、不全面的问题。

Description

关联度确定方法及装置、信息提供方法及装置
技术领域
本申请涉及互联网信息处理技术领域,尤其涉及一种关联度确定方法及装置、信息提供方法及装置。
背景技术
随着互联网技术的不断发展,越来越多的信息资源选择网络作为传播的载体。为了使用户能够在海量的互联网信息中获取所需要的信息,大多数网站都为用户提供信息搜索服务。用户需要搜索某信息时,可以在网站中输入与用户搜索意图相对应的搜索关键词,该网站查找与该搜索关键词相关的信息,然后将查找到的信息提供给用户,便于用户在海量的互联网信息中顺利找到自己需要的信息。
电子商务网站就是一种能够为用户提供信息搜索服务的网站,电子商务网站为用户提供了能够在网上实现交易的商品,用户利用电子商务网站的搜索系统来搜索想要购买的商品,利用电子商务网站的资金结算系统来购买商品,电子商务网站通过物流配送系统将用户购买的商品配送给用户,这极大提高了用户购物的便利性。在电子商务网站中,用户搜索的信息一般为网站所提供的商品的商品信息,例如用户想要搜索的商品为帽子,而且颜色为单一颜色,即为纯色,那么用户可以在电子商务网站中输入搜索关键词“纯色帽子”,电子商务网站在所有商品中,查找与该搜索关键词“纯色帽子”相关的商品,然后将查找到的商品的商品信息提供给用户,其中商品的商品信息可以为该商品的页面链接。
现有技术中,不同的用户在搜索相同的信息时,虽然搜索意图相同,但是输入的搜索关键词可能不同,那么网站根据不同的搜索关键词搜索到的信息可能不同,搜索到的信息的数量也可能相差较大,根据某些用户输入的搜索关键词搜索到的信息的数量非常多,而根据其他用户输入的搜索关键词搜索到的信息的数量非常少,或者根本没有搜索到相关的信息。例如用户A和用户B都想要在电子商务网站中搜索商品“白色的连衣裙”,即用户A和用户B的搜索意图相同,用户A输入的搜索关键词为“白色连衣裙”,用户B输入的搜索关键词为“白色的连身的裙子”,电子商务网站根据用户A输入的搜索关键词“白色连衣裙”搜索到的非常多的商品信息,那么用户A就可以在搜索到的商品信息中找到自己想要的商品,而电子商务网站根据用户B输入的搜索关键词“白色的连身的裙子”并未搜到相关的商品信息,那么用户B就无法通过电子商务网站的搜索服务来找到自己想要的商品。
由此可见,现有技术中,若具有相同搜索意图的不同用户在搜索信息时,输入不同的搜索关键词,那么根据不同的搜索关键词搜索到的信息不相同,搜索到的信息的数量可能相差很大,从而导致为某些用户提供的信息不准确、不全面,用户无法根据搜索到的信息查找到自己所需要的信息。
发明内容
本申请实施例提供一种关联度确定方法及装置、信息提供方法及装置,用以解决现有技术中存在的为用户提供的信息不准确、不全面的问题。
本申请实施例技术方案如下:
一种关联度确定方法,该方法包括步骤:获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;针对选择出的每个搜索关键词对,分别执行:针对该搜索关键词对包含的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
一种关联度确定装置,包括:日志记录获得单元,用于获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;关键词对构造单元,用于根据关键词获得单元获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;关键词对选择单元,用于在关键词对构造单元构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;权重值获得单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;关联度确定单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别根据权重值获得单元获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
一种信息提供方法,该方法包括步骤:获得输入的当前搜索关键词后,查找该当前搜索关键词对应的各信息;在判断出查找到的信息的数量不大于第一规定阈值时,确定该当前搜索关键词对应的各补充搜索关键词;分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度;在确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;提供根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息。
一种信息提供装置,包括:关键词获得单元,用于获得输入的当前搜索关键词;第一信息查找单元,用于查找关键词获得单元获得的该当前搜索关键词对应的各信息;信息数量判断单元,用于判断第一信息查找单元查找到的信息的数量是否小于第一规定阈值;关键词确定单元,用于在信息数量判断单元的判断结果为否时,确定该当前搜索关键词对应的各补充搜索关键词;关联度确定单元,用于分别确定该当前搜索关键词与关键词确定单元确定出的每个补充搜索关键词之间的关联度;关键词选择单元,用于在关键词确定单元确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;第二信息查找单元,用于针对关键词选择单元选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;信息提供单元,用于提供所述第一信息查找单元查找到的各信息以及第二信息查找单元查找到的各信息。
本申请实施例技术方案中,首先获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息,根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对,针对选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值,然后根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度,两个搜索关键词之间的关联度可以表征这两个搜索关键词的搜索意图之间的相似性,后续当获得用户输入的当前搜索关键词后,先查找该当前搜索关键词对应的各信息,如果查找到的信息的数量不大于第一规定阈值,则可以进行补充搜索,先确定该当前搜索关键词对应的各补充搜索关键词,再分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词,针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息,最后在向用户提供信息时,将根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息提供给用户。由上可见,本申请实施例中,由于预先确定了各搜索关键词之间的关联度,因此后续在根据用户输入的当前搜索关键词搜索到的信息的数量过少时,可以根据预先确定的关联度来选择进行补充搜索的补充搜索关键词,然后根据选择的补充搜索关键词搜索相关信息,那么向用户提供的信息就不再只是根据当前搜索关键词搜索到的少量的信息,还有根据选择的补充搜索关键词搜索到的信息,从而有效地提高了向用户提供信息的准确性和全面性,用户可以根据搜索到的信息顺利查找到自己所需要的信息,提高了用户的查询效率。
附图说明
图1为本申请实施例一中,关联度确定方法流程示意图;
图2为本申请实施例二中,信息提供方法流程示意图;
图3为本申请实施例三中,关联度确定装置结构示意图;
图4为本申请实施例四中,信息提供装置结构示意图。
具体实施方式
下面结合各个附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细地阐述。
本申请实施例包括确定搜索关键词之间的关联度的线下处理过程,以及根据确定出的关联度为用户提供信息的线上处理过程,下面分别介绍两个处理过程。
实施例一
本申请实施例一提供了一种关联度确定方法,如图1所示,其具体处理过程如下:
步骤11,获得规定时间段内的日志记录,所述日志记录包含各搜索关键词及对应的点击信息;
用户在网站中搜索信息时,会输入搜索关键词,并确认搜索。网站根据输入的该搜索关键词搜索相关的信息,并将搜索到的信息以搜索结果列表的形式提供给用户,用户可以通过点击搜索结果列表中的信息来确认是否为自身想要查找的信息。本申请实施例一提出,网站可以将用户的搜索和点击行为记录在日志记录中,具体为:用户输入搜索关键词并确认搜索,网站根据该搜索关键词进行信息搜索后,为用户提供搜索结果列表,若用户点击了搜索结果列表中的某个信息,则该信息即为点击信息,网站将用户输入的搜索关键词与该点击信息对应记录在日志记录中。
此外,日志记录中还包含每个点击信息在对应的搜索关键词下的点击权重值,点击权重值可以为点击信息在对应的搜索关键词下的点击行为的次数。若根据搜索关键词A搜索到的信息中,共有100个用户点击了200次点击信息1,则此时点击信息1在搜索关键词A下的点击行为的次数为200,那么点击信息1在搜索关键词A下的点击权重值为200。较佳地,可能存在一个用户多次点击一个点击信息的情况,为了提高点击权重值的准确性,本申请实施例一提出,点击信息的点击权重值还可以是点击信息在对应的搜索关键词下的点击行为所属用户的数量。若根据搜索关键词A搜索到的信息中,共有100个用户点击了200次点击信息1,则此时点击信息1在搜索关键词A下的点击行为所属用户的数量为100,那么点击信息1在搜索关键词A下的点击权重值为100。
本申请实施例一中的日志记录的格式可以但不限于如表1所示:
表1:
Figure BDA0000054201070000061
本申请实施例一提出首先获得规定时间段内的日志记录,例如定时获得日志记录,定时的周期可以设置为一天、一周或一个月等,因此就能够定时的获得对应周期内的日志记录,然后根据获得的日志记录确定该规定时间段内的搜索关键词及对应的点击信息。
步骤12,根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;
若步骤11获得了3个搜索关键词,分别为搜索关键词A、搜索关键词B和搜索关键词C,那么根据这3个搜索关键词,就可以构造出3个搜索关键词对,分别为:
搜索关键词对AB{搜索关键词A,搜索关键词B};
搜索关键词对AC{搜索关键词A,搜索关键词C};
搜索关键词对BC{搜索关键词B,搜索关键词C}。
步骤13,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;
本申请实施例一提出,可以针对构造的每个搜索关键词对,分别确定该搜索关键词对中的两个搜索关键词之间的关联度,那么此时构造的每个搜索关键词对均为满足预设条件的搜索关键词对。
较佳地,由于每个点击信息只对应一个类目信息,每个搜索关键词对应的各点击信息一般对应相同的类目信息,因此为了节省确定关联度时的处理资源,本申请实施例二提出先确定每个搜索关键词对应的类目信息,然后在构造的所有搜索关键词对中,选择出包含的两个搜索关键词对应同一类目信息的搜索关键词对,选择出的搜索关键词对即为满足预设条件的搜索关键词对,其中,在确定每个搜索关键词对应的类目信息时,首先针对获得的每个搜索关键词,分别获得所述规定时间段内该搜索关键词对应的各点击信息,然后将获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息,例如,搜索关键词A对应点击信息1和点击信息2,点击信息1和点击信息2均对应类目信息x,搜索关键词C对应点击信息5、点击信息6和点击信息7,点击信息5、点击信息6和点击信息7均对应类目信息y,则搜索关键词A对应的类目信息为类目信息x,搜索关键词C对应的类目信息为类目信息y。
本申请实施例一中,类目信息、搜索关键词、点击信息和点击权重值之间的对应关系可以但不限于如表2所示:
表2:
Figure BDA0000054201070000081
步骤14,针对选择出的每个搜索关键词对包含的每个搜索关键词,分别获得该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;
可以从表1所示的日志记录中获得每个点击信息在对应的搜索关键词下的点击权重值,例如点击信息1在搜索关键词A下的点击权重值为WA1
步骤15,针对选择出的每个搜索关键词对,根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
本申请实施例一中,针对选择出的每个搜索关键词对,可以根据步骤14获得的所有点击权重值来确定该搜索关键词对包含的两个搜索关键词之间的关联度。例如,搜索关键词对AC中,搜索关键词A对应的点击信息为点击信息1和点击信息2,针对搜索关键词A获得的点击权重值包含:点击信息1在搜索关键词A下的点击权重值WA1、以及点击信息2在搜索关键词A下的点击权重值WA2;搜索关键词C对应的点击信息为点击信息5、点击信息6和点击信息7,针对搜索关键词C获得的点击权重值包含:点击信息5在搜索关键词C下的点击权重值WC5、点击信息6在搜索关键词C下的点击权重值WC6以及点击信息7在搜索关键词C下的点击权重值WC7,可以直接根据获得的WA1、WA2、WC5、WC6和WC7来确定搜索关键词A和搜索关键词C之间的关联度。
较佳地,由于用户对信息的点击存在随意性,因此为了节省确定关联度时的处理资源,本申请实施例二提出在每个搜索关键词对应的点击信息中先剔除一些点击权重值过小的点击信息,然后根据余下的点击信息的点击权重值来确定关联度,具体为:
针对选择出的每个搜索关键词对,分别在该搜索关键词对包含的每个搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息,然后根据选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
本申请实施例一中,可以但不限于通过下述方式确定搜索关键词对包含的两个搜索关键词之间的关联度:
G AB = ( Σ i = 1 n W Ai ) × ( Σ j = 1 m W Bj ) Σ i = 1 n W Ai 2 × Σ j = 1 m W Bj 2
其中,GAB为搜索关键词对AB中包含的搜索关键词A和搜索关键词B之间的关联度;
n为所述规定时间段内,搜索关键词A对应的点击信息的数量;
m为所述规定时间段内,搜索关键词B对应的点击信息的数量;
WAi为所述规定时间段内,搜索关键词A对应的第i个点击信息在搜索关键词A下的点击权重值,其中,1≤i≤n;
WBj为所述规定时间段内,搜索关键词B对应的第j个点击信息在搜索关键词B下的点击权重值,其中1≤i≤m。
例如,所述规定时间段内,搜索关键词A对应的点击信息的数量为2个,分别为点击信息1和点击信息2,即n为2,搜索关键词B对应的点击信息的数量为2个,分别为点击信息3和点击信息4,即m为2,搜索关键词A对应的点击信息1在搜索关键词A下的点击权重值为100,即WA1=100,搜索关键词A对应的点击信息2在搜索关键词A下的点击权重值为150,即WA2=150,搜索关键词B对应的点击信息3在搜索关键词B下的点击权重值为200,即WB3=200,搜索关键词B对应的点击信息4在搜索关键词B下的点击权重值为250,即WB4=250,那么搜索关键词A和搜索关键词B之间的关联度为:
G AB = ( 100 + 150 ) × ( 200 + 250 ) 100 2 + 150 2 × 200 2 + 250 2
本申请实施例一中,在确定出搜索关键词对包含的两个搜索关键词之间的关联度后,可以但不限于以表3所示的格式进行存储。
表3:
  搜索关键词对   搜索关键词   搜索关键词   关联度
  搜索关键词对AB   搜索关键词A   搜索关键词B   GAB
  搜索关键词对AC   搜索关键词A   搜索关键词C   GAC
  搜索关键词对BC   搜索关键词B   搜索关键词C   GBC
实施例二
本申请实施例二提供了一种信息提供方法,如图2所示,其具体处理过程如下:
步骤21,获得输入的当前搜索关键词后,查找该当前搜索关键词对应的各信息;
其中,根据搜索关键词查找相关信息的具体处理过程与现有技术一致,这里不再赘述。
步骤22,在判断出查找到的信息的数量不大于第一规定阈值时,确定该当前搜索关键词对应的各补充搜索关键词;
若本申请实施例一的步骤13中,构造的每个搜索关键词对均为满足预设条件的搜索关键词对,那么在确定当前搜索关键词对应的各补充搜索关键词时,在规定时间段内的所有搜索关键词中,将除该当前搜索关键词之外的所有搜索关键词均确定为补充搜索关键词。
若本申请实施例一的步骤13中,包含的两个搜索关键词对应同一类目信息的搜索关键词对为满足预设条件的搜索关键词对,那么在确定当前搜索关键词对应的各补充搜索关键词时,首先在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词,然后将选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
若查找到的信息的数量不大于第一规定阈值,则说明该当前搜索关键词对应的信息非常少,此时就需要进行补充搜索,其中,第一规定阈值可以根据实际情况进行设置。
步骤23,分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度;
当前搜索关键词和每个补充搜索关键词分别组成一个搜索关键词对,由于本申请实施例一中的步骤15已经确定出了各搜索关键词对包含的两个搜索关键词之间的关联度,如表3所示,因此步骤23可以直接从表3中获得当前搜索关键词与每个补充搜索关键词之间的关联度,例如当前搜索关键词为搜索关键词A,补充搜索关键词为搜索关键词B,则由表3可知,搜索关键词A和搜索关键词B之间的关联度为GAB
步骤24,在确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;
在进行补充搜索时,需要尽量选取与当前搜索关键词的搜索意图相近的补充搜索关键词进行补充搜索,因此当前搜索关键词与进行补充搜索的补充搜索关键词之间的关联度不能太小,此时,上述预设条件可以但不限于为:
关联度不小于第二规定阈值,或按照关联度由大到小的顺序排序后的前规定数目个关联度。
其中第二规定阈值和规定数目可以根据实际情况进行设置。
步骤25,针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;
若确定出了进行补充搜索的补充搜索关键词,则针对确定出的每个补充搜索关键词分别进行信息搜索,搜索到的信息用来对根据当前搜索关键词搜索到的信息进行补充。
步骤26,提供根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息。
本申请实施例中,若根据当前搜索关键词查找到10个信息,而根据选择出的各补充搜索关键词查找到100个信息,则向用户提供信息时,不再只提供根据当前搜索关键词查找到的10个信息,而是将根据当前搜索关键词查找到的10个信息提供给用户的同时,还将根据选择出的各补充搜索关键词查找到100个信息也一并提供给用户。
本申请实施例中,为用户提供搜索服务的网站可以但不限于为电子商务网站,搜索到的信息可以但不限于为电子商务网站为用户提供的商品的商品信息,例如商品的页面链接等。
由上述处理过程可知,本申请实施例技术方案中,首先获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息,根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对,针对选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值,然后根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度,两个搜索关键词之间的关联度可以表征这两个搜索关键词的搜索意图之间的相似性,后续当获得用户输入的当前搜索关键词后,先查找该当前搜索关键词对应的各信息,如果查找到的信息的数量不大于第一规定阈值,则可以进行补充搜索,先确定该当前搜索关键词对应的各补充搜索关键词,再分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词,针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息,最后在向用户提供信息时,将根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息提供给用户。由上可见,本申请实施例中,由于预先确定了各搜索关键词之间的关联度,因此后续在根据用户输入的当前搜索关键词搜索到的信息的数量过少时,可以根据预先确定的关联度来选择进行补充搜索的补充搜索关键词,然后根据选择的补充搜索关键词搜索相关信息,那么向用户提供的信息就不再只是根据当前搜索关键词搜索到的少量的信息,还有根据选择的补充搜索关键词搜索到的信息,从而有效地提高了向用户提供信息的准确性和全面性,用户可以根据搜索到的信息顺利查找到自己所需要的信息,提高了用户的查询效率。
实施例三
与本申请实施例一提出的关联度确定方法对应,本申请实施例三提出一种关联度确定装置,其结构如图3所示,包括日志记录获得单元31、关键词对构造单元32、关键词对选择单元33、权重值获得单元34和关联度确定单元35,其中:
日志记录获得单元31,用于获得规定时间段内的各搜索关键词;
关键词对构造单元32,用于根据日志记录获得单元31获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;
关键词对选择单元33,用于在关键词对构造单元32构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;
权重值获得单元34,用于针对关键词对选择单元33选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;
关联度确定单元35,用于针对关键词对选择单元33选择出的每个搜索关键词对,分别根据权重值获得单元34获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
较佳地,所述关键词对选择单元33具体包括点击信息获得子单元、类目信息确定子单元和关键词对确定子单元,其中:
点击信息获得子单元,用于针对日志记录获得单元31获得的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的各点击信息;
类目信息确定子单元,用于针对日志记录获得单元31获得的每个搜索关键词,将点击信息获得子单元获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息;
关键词对确定子单元,用于将包含的两个搜索关键词均对应同一类目信息的搜索关键词对,确定为满足预设条件的搜索关键词对。
较佳地,所述关联度确定单元35具体包括点击信息选择子单元和关联度确定子单元,其中:
点击信息选择子单元,用于针对关键词对选择单元33选择出的每个搜索关键词对,分别在该搜索关键词对包含的每个搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息;
关联度确定子单元,用于针对关键词对选择单元33选择出的每个搜索关键词对,根据点击信息选择子单元选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
实施例四
与本申请实施例二提出的信息提供方法对应,本申请实施例三提出一种信息提供装置,其结构如图4所示,包括关键词获得单元41、第一信息查找单元42、信息数量判断单元43、关键词确定单元44、关联度确定单元45、关键词选择单元46、第二信息查找单元47和信息提供单元48,其中:
关键词获得单元41,用于获得输入的当前搜索关键词;
第一信息查找单元42,用于查找关键词获得单元41获得的该当前搜索关键词对应的各信息;
信息数量判断单元43,用于判断第一信息查找单元42查找到的信息的数量是否小于第一规定阈值;
关键词确定单元44,用于在信息数量判断单元43的判断结果为否时,确定该当前搜索关键词对应的各补充搜索关键词;
关联度确定单元45,用于分别确定该当前搜索关键词与关键词确定单元确定出的每个补充搜索关键词之间的关联度;
关键词选择单元46,用于在关键词确定单元44确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;
第二信息查找单元47,用于针对关键词选择单元46选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;
信息提供单元48,用于提供所述第一信息查找单元42查找到的各信息以及第二信息查找单元47查找到的各信息。
较佳地,所述关键词确定单元44具体包括关键词选择子单元和关键词确定子单元,其中:
关键词选择子单元,用于在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词;
关键词确定子单元,用于将关键词选择子单元选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
本领域的技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、装置(设备)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (13)

1.一种关联度确定方法,其特征在于,包括:
获得日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;
根据获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;
在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;
针对选择出的每个搜索关键词对,分别执行:
针对该搜索关键词对包含的每个搜索关键词,分别获得该搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;
根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
2.如权利要求1所述的关联度确定方法,其特征在于,点击信息在该搜索关键词下的点击权重值为:
点击信息在该搜索关键词下的点击行为的次数;或
点击信息在该搜索关键词下的点击行为所属用户的数量。
3.如权利要求1所述的关联度确定方法,其特征在于,在构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对,具体包括:
针对获得的每个搜索关键词,分别执行:
获得所述规定时间段内,该搜索关键词对应的各点击信息;
将获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息;
将包含的两个搜索关键词均对应同一类目信息的搜索关键词对,确定为满足预设条件的搜索关键词对。
4.如权利要求1所述的关联度确定方法,其特征在于,根据获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度,具体包括:
针对该搜索关键词对包含的每个搜索关键词,分别在该搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息;
根据选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
5.如权利要求1所述的关联度确定方法,其特征在于,通过下述方式确定搜索关键词对包含的两个搜索关键词之间的关联度:
G AB = ( Σ i = 1 n W Ai ) × ( Σ j = 1 m W Bj ) Σ i = 1 n W Ai 2 × Σ j = 1 m W Bj 2
其中,GAB为搜索关键词对AB中包含的搜索关键词A和搜索关键词B之间的关联度;
n为所述规定时间段内,搜索关键词A对应的点击信息的数量;
m为所述规定时间段内,搜索关键词B对应的点击信息的数量;
WAi为所述规定时间段内,搜索关键词A对应的第i个点击信息在搜索关键词A下的点击权重值,其中,1≤i≤n;
WBj为所述规定时间段内,搜索关键词B对应的第j个点击信息在搜索关键词B下的点击权重值,其中1≤i≤m。
6.一种关联度确定装置,其特征在于,包括:
日志记录获得单元,用于获得规定时间段内的日志记录,所述日志记录中包含各搜索关键词及对应的点击信息;
关键词对构造单元,用于根据日志记录获得单元获得的各搜索关键词,构造各搜索关键词对,每个搜索关键词对中包含两个搜索关键词;
关键词对选择单元,用于在关键词对构造单元构造的各搜索关键词对中,选择出满足预设条件的搜索关键词对;
权重值获得单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别获得所述规定时间段内,该搜索关键词对包含的每个搜索关键词对应的每个点击信息在该搜索关键词下的点击权重值;
关联度确定单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别根据权重值获得单元获得的各点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
7.如权利要求6所述的关联度确定装置,其特征在于,所述关键词对选择单元具体包括:
点击信息获得子单元,用于针对日志记录获得单元获得的每个搜索关键词,分别获得所述规定时间段内,该搜索关键词对应的各点击信息;
类目信息确定子单元,用于针对日志记录获得单元获得的每个搜索关键词,将点击信息获得子单元获得的各点击信息对应的类目信息,确定为该搜索关键词对应的类目信息;
关键词对确定子单元,用于将包含的两个搜索关键词均对应同一类目信息的搜索关键词对,确定为满足预设条件的搜索关键词对。
8.如权利要求6所述的关联度确定装置,其特征在于,所述关联度确定单元具体包括:
点击信息选择子单元,用于针对关键词对选择单元选择出的每个搜索关键词对,分别在该搜索关键词对包含的每个搜索关键词对应的各点击信息中,选择出在该搜索关键词下的点击权重值不小于规定阈值的点击信息;
关联度确定子单元,用于针对关键词对选择单元选择出的每个搜索关键词对,根据点击信息选择子单元选择出的各点击信息的点击权重值,确定该搜索关键词对包含的两个搜索关键词之间的关联度。
9.一种信息提供方法,其特征在于,包括:
获得输入的当前搜索关键词后,查找该当前搜索关键词对应的各信息;
在判断出查找到的信息的数量不大于第一规定阈值时,确定该当前搜索关键词对应的各补充搜索关键词;
分别确定该当前搜索关键词与每个补充搜索关键词之间的关联度;
在确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;
针对选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;
提供根据该当前搜索关键词查找到的各信息以及根据选择出的各补充搜索关键词查找到的各信息。
10.如权利要求9所述的信息提供方法,其特征在于,确定该当前搜索关键词对应的各补充搜索关键词,具体包括:
在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词;
将选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
11.如权利要求9所述的信息提供方法,其特征在于,所述预设条件为:
关联度不小于第二规定阈值;或
按照关联度由大到小的顺序排序后的前规定数目个关联度。
12.一种信息提供装置,其特征在于,包括:
关键词获得单元,用于获得输入的当前搜索关键词;
第一信息查找单元,用于查找关键词获得单元获得的该当前搜索关键词对应的各信息;
信息数量判断单元,用于判断第一信息查找单元查找到的信息的数量是否小于第一规定阈值;
关键词确定单元,用于在信息数量判断单元的判断结果为否时,确定该当前搜索关键词对应的各补充搜索关键词;
关联度确定单元,用于分别确定该当前搜索关键词与关键词确定单元确定出的每个补充搜索关键词之间的关联度;
关键词选择单元,用于在关键词确定单元确定出的各补充搜索关键词中,选择出与该当前搜索关键词之间的关联度满足预设条件的各补充搜索关键词;
第二信息查找单元,用于针对关键词选择单元选择出的每个补充搜索关键词,分别查找该补充搜索关键词对应的各信息;
信息提供单元,用于提供所述第一信息查找单元查找到的各信息以及第二信息查找单元查找到的各信息。
13.如权利要求12所述的信息提供装置,其特征在于,所述关键词确定单元具体包括:
关键词选择子单元,用于在规定时间段内的各搜索关键词中,选择出与该当前搜索关键词对应相同类目信息的各搜索关键词;
关键词确定子单元,用于将关键词选择子单元选择出的各搜索关键词,确定为该当前搜索关键词对应的各补充搜索关键词。
CN201110086537.0A 2011-04-07 2011-04-07 关联度确定方法及装置、信息提供方法及装置 Expired - Fee Related CN102737038B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201110086537.0A CN102737038B (zh) 2011-04-07 2011-04-07 关联度确定方法及装置、信息提供方法及装置
HK12111535.5A HK1170820A1 (zh) 2011-04-07 2012-11-14 關聯度確定方法及裝置、信息提供方法及裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110086537.0A CN102737038B (zh) 2011-04-07 2011-04-07 关联度确定方法及装置、信息提供方法及装置

Publications (2)

Publication Number Publication Date
CN102737038A true CN102737038A (zh) 2012-10-17
CN102737038B CN102737038B (zh) 2015-09-23

Family

ID=46992558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110086537.0A Expired - Fee Related CN102737038B (zh) 2011-04-07 2011-04-07 关联度确定方法及装置、信息提供方法及装置

Country Status (2)

Country Link
CN (1) CN102737038B (zh)
HK (1) HK1170820A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258025A (zh) * 2013-05-08 2013-08-21 百度在线网络技术(北京)有限公司 生成共现关键词的方法、提供关联搜索词的方法以及系统
CN103744954A (zh) * 2014-01-06 2014-04-23 同济大学 一种词关联网模型的构建方法及其构建器
CN104391958A (zh) * 2014-11-28 2015-03-04 北京国双科技有限公司 网页搜索关键词的相关性检测方法及装置
CN106547922A (zh) * 2016-12-07 2017-03-29 广州优视网络科技有限公司 一种应用程序的排序方法、装置及服务器
CN108228837A (zh) * 2018-01-04 2018-06-29 北京百悟科技有限公司 客户挖掘处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030088641A1 (en) * 2001-11-02 2003-05-08 Toshiba Tec Kabushiki Kaisha Technical support system
US20030163462A1 (en) * 2002-02-22 2003-08-28 International Business Machines Corporation System and method for determining numerical representations for categorical data fields and data processing system
CN101038596A (zh) * 2007-04-29 2007-09-19 北京搜狗科技发展有限公司 一种网站分类方法及系统
CN101140587A (zh) * 2007-10-15 2008-03-12 深圳市迅雷网络技术有限公司 一种搜索方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030088641A1 (en) * 2001-11-02 2003-05-08 Toshiba Tec Kabushiki Kaisha Technical support system
US20030163462A1 (en) * 2002-02-22 2003-08-28 International Business Machines Corporation System and method for determining numerical representations for categorical data fields and data processing system
CN101038596A (zh) * 2007-04-29 2007-09-19 北京搜狗科技发展有限公司 一种网站分类方法及系统
CN101140587A (zh) * 2007-10-15 2008-03-12 深圳市迅雷网络技术有限公司 一种搜索方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103258025A (zh) * 2013-05-08 2013-08-21 百度在线网络技术(北京)有限公司 生成共现关键词的方法、提供关联搜索词的方法以及系统
CN103258025B (zh) * 2013-05-08 2016-08-31 百度在线网络技术(北京)有限公司 生成共现关键词的方法、提供关联搜索词的方法以及系统
CN103744954A (zh) * 2014-01-06 2014-04-23 同济大学 一种词关联网模型的构建方法及其构建器
CN103744954B (zh) * 2014-01-06 2017-02-01 同济大学 一种词关联网模型的构建方法及其构建器
CN104391958A (zh) * 2014-11-28 2015-03-04 北京国双科技有限公司 网页搜索关键词的相关性检测方法及装置
CN104391958B (zh) * 2014-11-28 2018-06-26 北京国双科技有限公司 网页搜索关键词的相关性检测方法及装置
CN106547922A (zh) * 2016-12-07 2017-03-29 广州优视网络科技有限公司 一种应用程序的排序方法、装置及服务器
CN106547922B (zh) * 2016-12-07 2020-08-25 阿里巴巴(中国)有限公司 一种应用程序的排序方法、装置及服务器
CN108228837A (zh) * 2018-01-04 2018-06-29 北京百悟科技有限公司 客户挖掘处理方法及装置

Also Published As

Publication number Publication date
HK1170820A1 (zh) 2013-03-08
CN102737038B (zh) 2015-09-23

Similar Documents

Publication Publication Date Title
US11100178B2 (en) Method and device for pushing information
CN102456058A (zh) 类目信息提供方法及装置
US20190018900A1 (en) Method and Apparatus for Displaying Search Results
CN102841904B (zh) 一种搜索方法及设备
CN102402757A (zh) 信息提供方法及装置、综合关联度确定方法及装置
US20140025533A1 (en) Method and Apparatus of Recommending Clothing Products
CN103544623A (zh) 一种基于用户偏好特征建模的Web 服务推荐方法
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
CN102479366A (zh) 一种商品推荐方法及系统
CN106296059A (zh) 派送网点确定方法及设备
CN104182392B (zh) 服务推荐处理的方法和装置
CN104102648A (zh) 基于用户行为数据的兴趣推荐方法及装置
CN105005582A (zh) 多媒体信息的推荐方法及装置
TW201237665A (en) Determining preferred categories based on user access attribute values
CN103345698A (zh) 电子商务环境下基于云计算处理模式的个性化推荐方法
CN105574025A (zh) 用于计算排序分及建立模型的方法、装置及商品推荐系统
TWI539306B (zh) Information delivery method, processing server and merge server
CN105701108A (zh) 一种信息推荐方法、装置及服务器
CN105205188A (zh) 采购物料供应商的推荐方法及推荐装置
CN102737038A (zh) 关联度确定方法及装置、信息提供方法及装置
US20240119047A1 (en) Answer facts from structured content
CN103064852A (zh) 网站统计信息处理方法及系统
CN104077407A (zh) 一种智能数据搜索系统及方法
CN103699603A (zh) 一种基于用户行为的信息推荐方法和系统
CN103365928A (zh) 一种信息推荐方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1170820

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1170820

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150923

CF01 Termination of patent right due to non-payment of annual fee