CN104462556A - 问答页面相关问题推荐方法和装置 - Google Patents
问答页面相关问题推荐方法和装置 Download PDFInfo
- Publication number
- CN104462556A CN104462556A CN201410830054.0A CN201410830054A CN104462556A CN 104462556 A CN104462556 A CN 104462556A CN 201410830054 A CN201410830054 A CN 201410830054A CN 104462556 A CN104462556 A CN 104462556A
- Authority
- CN
- China
- Prior art keywords
- relevant issues
- relevant
- inquiry request
- question
- click
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/955—Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明问答页面相关问题推荐方法和装置提供了一种根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;根据选定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重;根据所述点击权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。该方法能够获取到与第一用户输入的问题相关度更好地相关问题,使获取的相关问题与用户真正想要获得的问题答案之间的匹配度更好。
Description
技术领域
本发明涉及网络搜索技术领域,特别是涉及一种搜索过程中的问答页面相关问题推荐方法和装置。
背景技术
随着互联网技术的发展,互联网数据早已呈现爆炸性增长的趋势,人们对知识的需求越来越渴望,越来越多的人们开始使用搜索引擎搜索来满足对未知知识的查询与搜索。大型搜索引擎(比如谷歌google、360、百度等)可以很方便快捷的提供相关问答的搜索。其中相关问答搜索是指用户输入一个问题,搜索引擎检索与该问题相对应的答案。在不同的问答知识页面,不仅提供了针对用户输入的问题进行回答的相关答复内容,还提供了与当前问答页面的用户输入问题相关的问题链接,供用户参考使用,方便用户在进行问答搜索时从不同角度综合得到该问题的解决答案。
例如:当前问答页面的搜索问题为:“感冒咳嗽怎么办?”在当前问答页面为用户推荐的相关问题可以包括:“感冒怎么办?”,“感冒咳嗽流鼻涕怎么办?”,“小孩感冒咳嗽怎么办?”,等等。
现有技术中获取相关问题时,一般是根据用户输入的搜索词作为核心词来进行获取的,这种方式比较简单直接,但获取到的相关问题与用户输入的问题的相关度并不是很好,往往不能很好地满足用户的需求,也就是说,其所获取的相关问题与用户真正想要获得的问题答案之间的匹配度比较差,导致问答页面问题检索的准确性比较差,与用户需求的贴合性比较差,不能解决用户想在当前问答页面查看与所检索的问题更贴近的、更吻合的问题答案的检索匹配需求。
因此,如何获取更合适的相关问题推荐给用户,成为问答页面相关问题获取推荐过程中亟待解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索过程中的问答页面相关问题推荐方法和相应的问答页面相关问题推荐装置。
本发明提供一种问答页面相关问题推荐方法,包括:
根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
根据选定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重;
根据所述点击权重对获取的相关问题进行排序;
根据所述相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。
在一些可选的实施例中,根据设定时间段内用户的搜索行为日志,确定获取的所述相关问题的点击权重,包括:
根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组;其中,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题;
在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重;
获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
在一些可选的实施例中,根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组,包括:
根据所述相关问题对应的查询请求串,得到各查询请求串的点击特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中Ti表示一个相关问题。
在一些可选的实施例中,计算组中各相关问题与组中其他相关问题的相关点击权重,包括:
利用如下公式计算组中各相关问题与组中其他相关问题的相关点击权重W:
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+1的概率。
在一些可选的实施例中,点击特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数等。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,例如增加常量或变量或系数等方式,依然落在本发明的保护范围之内。
本发明提供还一种问答页面相关问题推荐装置,包括:
问题获取模块,用于根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
权重确定模块,用于根据选定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重;
排序推荐模块,用于根据所述点击权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。
在一些可选的实施例中,所述权重确定模块,具体包括:
问题分组器,用于根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组;其中,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题;
相关权重计算器,用于在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重;
点击权重计算器,用于获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
在一些可选的实施例中,所述问题分组器,具体用于:
根据所述相关问题对应的查询请求串,得到每个查询请求串的点击特征向量{T1、T2、……、Tn},实现对获取的相关问题进行分组;其中Ti表示一个相关问题。
在一些可选的实施例中,所述相关权重计算器,具体用于:
利用如下公式计算组中各相关问题与组中其他相关问题的相关点击权重W:
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+1的概率。
在一些可选的实施例中,所述问题分组器,具体用于:
得到的点击特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数等。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,例如增加常量或变量或系数等方式,依然落在本发明的保护范围之内。
本发明实施例提供的问答页面相关问题推荐方法,当需要为输入搜索词的第一用户获取相关问题生成问答页面时,根据一段时间内的若干第二用户的搜索行为日志确定获取的相关问题的点击权重,根据点击权重获取较佳的相关问题,从而获取到与第一用户输入的问题相关度更好地相关问题,使获取的相关问题与用户真正想要获得的问题答案之间的匹配度更好,能够更好地满足用户需求,使用户在问答页面上查看到与所检索的问题更贴近的、更吻合的问题答案。
进一步地,本发明实施例提供的问答页面相关问题推荐方法,能够根据不同的查询请求串,按照分组计算各相关问题的相关点击权重,从而获取到各相关问题的点击权重,实现基于若干第二用户对各相关问题的搜索点击行为,来衡量获取的各相关问题对用户需求的满足匹配度高低,从而达到了获取匹配度更好的相关问题的目的。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一中问答页面相关问题推荐方法的流程图;
图2是本发明实施例二中问答页面相关问题推荐方法的流程图;
图3是本发明实施例中实现问答页面相关问题推荐的系统环境示意图;
图4是本发明实施例中问答页面相关问题推荐装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的获取到的相关问题与用户输入的问题的相关度并不是很好,往往不能很好地满足用户的需求的问题,本发明实施例提供一种问答页面相关问题推荐方法,通过对若干历史用户的搜索行为进行分析,获取到与用户真正想要获得的问题答案匹配度更好地相关问题。
实施例一
本发明实施例一提供一种问答页面相关问题推荐方法,该方法流程如图1所示,包括如下步骤:
步骤S101:根据来自第一用户的搜索词,获取数据库中与来自第一用户的搜索词相关的至少一个相关问题。
第一用户输入搜索词进行问答检索,生成问答页面时,生成的问答页面中包括但不限于问答页面的标题、至少一个问题答案,至少一个相关问题。在获取到第一用户输入的搜索词后,从数据库中获取若干相关问题,这些相关问题为数据库中第二用户搜索点击的问答页面中的问答问题或问答页面中的相关问题。
其中,第一用户是指当前用户,第二用户是指历史用户。
步骤S102:根据选定时间段内第二用户的搜索行为日志,确定获取的相关问题的点击权重。
从数据库中获取上述步骤S101中获取到的相关问题对应的第二用户的搜索行为日志。对搜索行为日志进行分析,确定相关问题的点击权重。确定击权重的过程中,可以对获取的相关问题,计算彼此之间的相关点击权重,根据计算出来的相关点击权重,对同一相关问题的相关点击权重进行加权处理,得到各相关问题的点击权重。
优选的,也可以根据设定的分组条件对获取的相关问题进行分组,在各个相关问题分组中,分别计算各相关问题与组中其他相关问题的相关点击权重,然后综合各组的计算结果,对各组中出现的同一相关问题的相关点击权重进行加权处理,得到各相关问题的点击权重。
下面的实施例二中,以根据查询请求串进行分组为例,说明相关问题的点击权重的确定过程。
步骤S103:根据确定出的相关问题的点击权重对获取的相关问题进行排序。
根据确定出的各相关问题的点击权重,对各相关问题进行排序。比如可以按照点击权重从高到低的顺序进行排序。对相关问题进行排序时,可以对获取所有的相关问题一起进行排序,也可以按照不同的查询请求串在各查询串分组中分别排序,或者按照其他的规则排序。
步骤S104:根据获取的相关问题的排序结果,确定推荐给第一用户的相关问题。
根据对相关问题的排序结果,按照设定的推荐规则,选择相关问题推荐给第一用户。比如,将获取所有的相关问题中点击权重最高的设定数量的相关问题推荐给第一用户;或者在各查询请求串对应的相关问题中分别获取设定数量的相关问题推荐给第一用户。
实施例二
本发明实施例二提供一种问答页面相关问题推荐方法,该方法流程如图2所示,包括如下步骤:
步骤S201:根据来自第一用户的搜索词,获取数据库中与来自第一用户的搜索词相关的至少一个相关问题。
例如:第一用户输入搜索词“孩子感冒怎么办?”,根据该搜索词生成对应的问答页面,生成的问答页面上有问答页面的标题,至少一个问题答案,至少一个相关问题。比如:相关问题可以是“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”、“宝宝感冒咳嗽怎么办”“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“宝宝感冒鼻塞怎么办”、“儿童感冒咳嗽怎么办”、“儿童感冒鼻塞怎么办”、“儿童感冒发烧怎么办”等等。
这些相关问题为数据库中存储的历史用户曾经搜索过的问答页面上的问答问题或问答页面上的相关问题。
步骤S202:根据获取的相关问题对应的查询请求串,对获取的相关问题进行分组。
对获取的相关问题进行分组时,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题。
可选的,根据获取的相关问题对应的查询请求串,得到各查询请求串的点击特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中Ti表示一个相关问题。从而实现对获取的相关问题进行分组。
其中,点击特征向量中的元素Ti的属性包括下列参数中的至少一个:问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数等。
沿用上边的例子,对上边获取到的各相关问题进行分组如下:
“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”对应的查询请求串为“小儿感冒”,归为一组。
“宝宝感冒咳嗽怎么办”、“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“宝宝感冒鼻塞怎么办”对应的查询请求串为“宝宝感冒”,归为一组;
“儿童感冒咳嗽怎么办”、“儿童感冒鼻塞怎么办”、“儿童感冒发烧怎么办”对应的查询请求串为“儿童感冒”,归为一组;
“小儿感冒咳嗽怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”,“宝宝感冒咳嗽怎么办”,“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“儿童感冒咳嗽怎么办”对应的查询请求串为“感冒咳嗽”,归为一组;
“小儿感冒发烧怎么办?”、“小儿感冒发烧怎么办?”、“儿童感冒发烧怎么办”对应的查询请求串为“感冒发烧”,归为一组;
“小儿感冒鼻塞怎么办?”、“宝宝感冒鼻塞怎么办”、“儿童感冒鼻塞怎么办”对应的查询请求串为“感冒鼻噻”,归为一组;
……
以此类推,对所有获取的相关问题进行分组,实现将查询请求串相同的相关问题归为一组。
步骤S203:在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重。
根据上述生成的各查询请求串的点击特征向量{T1、T2、……、Ti、Ti+1、……、Tn},利用如下公式计算组中各相关问题Ti与组中其他相关问题Ti+1的相关点击权重W(Ti,Ti+I):
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+I的概率。
当然,也可以计算组中各相关问题Ti与组中其他相关问题Ti-I的相关点击权重W。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,例如增加常量或变量或系数等方式,依然落在本发明的保护范围之内。
沿用上边的例子,针对每个分组,分别计算每个相关问题与组中其他相关问题的,例如,针对查询请求串为“小儿感冒”的相关问题分组,分别计算“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”与组中其他相关问题的相关点击权重。其他相关问题分组也同样进行计算。
步骤S204:获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
上边计算出各相关问题分组中的各相关问题的相关点击权重后,将各相关问题分组中相同的相关问题提取出来,例如,对于“小儿感冒咳嗽怎么办?”这个相关问题,在查询请求串为“小儿感冒”的相关问题分组和在查询请求串为“感冒咳嗽”的相关问题分组中计算得到的相关点击权重进行加权。
可选的,可以把同一相关问题在不同相关问题分组中计算得到的相关点击权重直接进行相加,也可以分别乘上相应的权重系数后在进行相加,也可以通过其它的加权规则进行加权处理。
步骤S205:根据确定出的相关问题的点击权重对获取的相关问题进行排序。
沿用上边的例子,以获取所有的相关问题一起进行排序为例,按照点击权重从高到低的顺序进行排序,得到排序结果如下:
“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“宝宝感冒咳嗽怎么办”“儿童感冒发烧怎么办”、“宝宝感冒咳嗽流鼻涕怎么办”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”、“宝宝感冒咳嗽用什么药比较好呢?”、“宝宝感冒鼻塞怎么办”、“儿童感冒咳嗽怎么办”、“儿童感冒鼻塞怎么办”。
步骤S206:根据获取的相关问题的排序结果,确定推荐给第一用户的相关问题。
根据排序结果,将点击权重最高的前几个问题作为相关问题推荐给第一用户,加入到根据用户输入的搜索词生成的问答页面中。
例如:将“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“宝宝感冒咳嗽怎么办”“儿童感冒发烧怎么办”、“宝宝感冒咳嗽流鼻涕怎么办”作为相关问题加入到问答页面中。
上述方法,根据数据库中的历史数据,分析历史用户点击各个相关问题的搜索点击行为,确定相关问题的点击权重参数,从而确定向用户推荐相关问题的推荐优先级,从而获取到与用户输入的搜索词匹配度更高的相关问题,在当前问答页面为用户提供与用户需求的贴合性更好、更符合用户需求的相关问题,提高问答页面问题检索的准确性。
针对本发明实施例提供的问答页面相关问题推荐方法,实现问答页面相关问题推荐的系统环境示意如图3所示。该系统包括数据库,存储若干第二用户(历史用户)的相关问题,问答页面问题推荐装置能够获取第一用户输入的搜索词,并更具搜索词从数据库获取若干历史用户搜索点击过的相关问题及相关问题的历史数据,通过对历史数据的分析处理,实现获取更优的相关问题推荐给第一用户。
基于同一发明构思,本发明实施例还提供一种问答页面相关问题推荐装置,该装置的结构如图4所示,包括:问题获取模块401、权重确定模块402和排序推荐模块403。
问题获取模块401,用于根据来自第一用户的搜索词,获取数据库中与搜索词相关的至少一个相关问题.
权重确定模块402,用于根据选定时间段内第二用户的搜索行为日志,确定获取的相关问题的点击权重。
排序推荐模块403,用于根据确定出的点击权重对获取的相关问题进行排序;根据获取的相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。
优选的,上述权重确定模块402,具体包括:问题分组器4021、相关权重计算器4022和点击权重计算器4023。
问题分组器4021,用于根据获取的相关问题对应的查询请求串,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题。
相关权重计算器4022,用于在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重。
点击权重计算器4023,用于获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
优选的,上述问题分组器4021,具体用于根据获取的相关问题对应的查询请求串,得到每个查询请求串的点击特征向量{T1、T2、……、Tn},实现对获取的相关问题进行分组;其中Ti表示一个相关问题。
优选的,上述相关权重计算器4022,具体用于利用如下公式计算组中各相关问题与组中其他相关问题的相关点击权重W:
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+1的概率。
优选的,上述问题分组器4021,具体用于得到的点击特征向量中的元素Ti的属性包括下列参数中的至少一个:问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数等。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,例如增加常量或变量或系数等方式,依然落在本发明的保护范围之内。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的问答页面相关问题推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。
Claims (10)
1.一种问答页面相关问题推荐方法,包括:
根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
根据选定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重;
根据所述点击权重对获取的相关问题进行排序;
根据所述相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。
2.根据权利要求1所述的方法,其中,根据设定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重,包括:
根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组;其中,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题;
在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重;
获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
3.根据权利要求1-2任一项所述的方法,其中,根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组,包括:
根据所述相关问题对应的查询请求串,得到各查询请求串的点击特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中Ti表示一个相关问题。
4.根据权利要求1-3任一项所述的方法,其中,计算组中各相关问题与组中其他相关问题的相关点击权重,包括:
利用如下公式计算组中各相关问题与组中其他相关问题的相关点击权重W:
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+1的概率。
5.根据权利要求1-4任一项所述的方法,其中,点击特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数。
6.一种问答页面相关问题推荐装置,包括:
问题获取模块,用于根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
权重确定模块,用于根据选定时间段内第二用户的搜索行为日志,确定获取的所述相关问题的点击权重;
排序推荐模块,用于根据所述点击权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面推荐给第一用户的相关问题。
7.根据权利要求6所述的装置,其中,所述权重确定模块,具体包括:
问题分组器,用于根据所述相关问题对应的查询请求串,对获取的所述相关问题进行分组;其中,每个相关问题分组中包括一个查询请求串对应的部分或全部相关问题;
相关权重计算器,用于在各相关问题分组中,计算组中各相关问题与组中其他相关问题的相关点击权重;
点击权重计算器,用于获取同一相关问题在各相关问题分组中计算得到的相关点击权重,将获取到的相关点击权重进行加权,得到获取的各相关问题的点击权重。
8.根据权利要求6-7任一项所述的装置,其中,所述问题分组器,具体用于:
根据所述相关问题对应的查询请求串,得到每个查询请求串的点击特征向量{T1、T2、……、Tn},实现对获取的相关问题进行分组;其中Ti表示一个相关问题。
9.根据权利要求6-8任一项所述的装置,其中,所述相关权重计算器,具体用于:
利用如下公式计算组中各相关问题与组中其他相关问题的相关点击权重W:
W=P((Ti)|查询请求串)*P((Ti+I)|查询请求串)
其中,Ti表示一个相关问题;
Ti+I表示点击特征向量中包括的其他问答问题;
P((Ti)|查询请求串)表示使用查询请求串时得到Ti的概率;
P((Ti+I)|查询请求串)表示使用查询请求串时得到Ti+1的概率。
10.根据权利要求6-9任一项所述的装置,其中,所述问题分组器,具体用于:
得到的点击特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、展示次数、被点击次数。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410830054.0A CN104462556B (zh) | 2014-12-25 | 2014-12-25 | 问答页面相关问题推荐方法和装置 |
PCT/CN2015/095853 WO2016101765A1 (zh) | 2014-12-25 | 2015-11-27 | 问答页面相关问题推荐方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410830054.0A CN104462556B (zh) | 2014-12-25 | 2014-12-25 | 问答页面相关问题推荐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104462556A true CN104462556A (zh) | 2015-03-25 |
CN104462556B CN104462556B (zh) | 2018-02-23 |
Family
ID=52908591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410830054.0A Expired - Fee Related CN104462556B (zh) | 2014-12-25 | 2014-12-25 | 问答页面相关问题推荐方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104462556B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016101765A1 (zh) * | 2014-12-25 | 2016-06-30 | 北京奇虎科技有限公司 | 问答页面相关问题推荐方法及装置 |
CN106469173A (zh) * | 2015-08-19 | 2017-03-01 | 武汉市尺度网络科技有限公司 | 一种问题优先级别权重确定方法、装置、系统及服务器 |
WO2017202138A1 (zh) * | 2016-05-26 | 2017-11-30 | 北京搜狗科技发展有限公司 | 基于搜索引擎的信息处理方法和装置 |
CN110019750A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 呈现两个以上标准文本问题的方法和装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
EP2192503A1 (en) * | 2008-11-21 | 2010-06-02 | BRITISH TELECOMMUNICATIONS public limited company | Optimised tag based searching |
CN102053983A (zh) * | 2009-11-02 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种垂直搜索的查询方法、系统和装置 |
CN103106275A (zh) * | 2013-02-08 | 2013-05-15 | 西北工业大学 | 基于特征分布信息的文本分类特征筛选方法 |
CN103970796A (zh) * | 2013-02-04 | 2014-08-06 | 深圳市世纪光速信息技术有限公司 | 查询偏好排序方法和装置 |
-
2014
- 2014-12-25 CN CN201410830054.0A patent/CN104462556B/zh not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2192503A1 (en) * | 2008-11-21 | 2010-06-02 | BRITISH TELECOMMUNICATIONS public limited company | Optimised tag based searching |
CN101464897A (zh) * | 2009-01-12 | 2009-06-24 | 阿里巴巴集团控股有限公司 | 一种词匹配及信息查询方法及装置 |
CN102053983A (zh) * | 2009-11-02 | 2011-05-11 | 阿里巴巴集团控股有限公司 | 一种垂直搜索的查询方法、系统和装置 |
CN103970796A (zh) * | 2013-02-04 | 2014-08-06 | 深圳市世纪光速信息技术有限公司 | 查询偏好排序方法和装置 |
CN103106275A (zh) * | 2013-02-08 | 2013-05-15 | 西北工业大学 | 基于特征分布信息的文本分类特征筛选方法 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016101765A1 (zh) * | 2014-12-25 | 2016-06-30 | 北京奇虎科技有限公司 | 问答页面相关问题推荐方法及装置 |
CN106469173A (zh) * | 2015-08-19 | 2017-03-01 | 武汉市尺度网络科技有限公司 | 一种问题优先级别权重确定方法、装置、系统及服务器 |
CN106469173B (zh) * | 2015-08-19 | 2019-05-03 | 武汉市尺度网络科技有限公司 | 一种问题优先级别权重确定方法、装置、系统及服务器 |
WO2017202138A1 (zh) * | 2016-05-26 | 2017-11-30 | 北京搜狗科技发展有限公司 | 基于搜索引擎的信息处理方法和装置 |
CN110019750A (zh) * | 2019-01-04 | 2019-07-16 | 阿里巴巴集团控股有限公司 | 呈现两个以上标准文本问题的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN104462556B (zh) | 2018-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102174717B1 (ko) | 사용자 구매 기준 및 상품 리뷰 기반 상품 추천 시스템 및 방법 | |
US8214361B1 (en) | Organizing search results in a topic hierarchy | |
US10515374B2 (en) | Keyword generation method and apparatus | |
CN104462553A (zh) | 问答页面相关问题推荐方法及装置 | |
CN104933100B (zh) | 关键词推荐方法和装置 | |
CN104462554A (zh) | 问答页面相关问题推荐方法和装置 | |
CN108345702A (zh) | 实体推荐方法和装置 | |
CN109389442A (zh) | 商品推荐方法及装置、存储介质及电子终端 | |
CN106251174A (zh) | 信息推荐方法及装置 | |
CN116244418B (zh) | 问题解答方法、装置、电子设备及计算机可读存储介质 | |
CN103562916A (zh) | 混合与迭代关键词以及类别搜索技术 | |
WO2007064874A2 (en) | Method and apparatus for representing text using search engine, document collection, and hierarchal taxonomy | |
CN103970796A (zh) | 查询偏好排序方法和装置 | |
KR102371437B1 (ko) | 엔티티를 추천하는 방법과 장치, 전자기기 및 컴퓨터 판독가능 매체 | |
CN103984705B (zh) | 一种搜索结果的展示方法、装置和系统 | |
CN104268230B (zh) | 一种基于异质图随机游走的中文微博客观点探测方法 | |
US8918416B1 (en) | Classifying queries | |
Makvana et al. | A novel approach to personalize web search through user profiling and query reformulation | |
CN102200975A (zh) | 一种利用语义分析的垂直搜索引擎系统与方法 | |
CN103559313B (zh) | 搜索方法及装置 | |
US11789946B2 (en) | Answer facts from structured content | |
CN104067273A (zh) | 将搜索结果分组为简档页面 | |
CN104615723B (zh) | 查询词权重值的确定方法和装置 | |
CN104462556A (zh) | 问答页面相关问题推荐方法和装置 | |
Moya et al. | Integrating web feed opinions into a corporate data warehouse |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20180223 Termination date: 20211225 |
|
CF01 | Termination of patent right due to non-payment of annual fee |