CN104462554A - 问答页面相关问题推荐方法和装置 - Google Patents

问答页面相关问题推荐方法和装置 Download PDF

Info

Publication number
CN104462554A
CN104462554A CN201410828977.2A CN201410828977A CN104462554A CN 104462554 A CN104462554 A CN 104462554A CN 201410828977 A CN201410828977 A CN 201410828977A CN 104462554 A CN104462554 A CN 104462554A
Authority
CN
China
Prior art keywords
relevant issues
relevant
user
weight
browse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410828977.2A
Other languages
English (en)
Other versions
CN104462554B (zh
Inventor
沈亮
周伟
梁任鹏
项碧波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201410828977.2A priority Critical patent/CN104462554B/zh
Publication of CN104462554A publication Critical patent/CN104462554A/zh
Priority to PCT/CN2015/095853 priority patent/WO2016101765A1/zh
Application granted granted Critical
Publication of CN104462554B publication Critical patent/CN104462554B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种问答页面相关问题推荐方法,包括:根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重;根据所述浏览权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。该方法能够获取到与第一用户输入的问题相关度更好地相关问题,使获取的相关问题与用户真正想要获得的问题答案之间的匹配度更好。

Description

问答页面相关问题推荐方法和装置
技术领域
本发明涉及网络搜索技术领域,特别是涉及一种搜索过程中的问答页面相关问题推荐方法和装置。
背景技术
随着互联网技术的发展,互联网数据早已呈现爆炸性增长的趋势,人们对知识的需求越来越渴望,越来越多的人们开始使用搜索引擎搜索来满足对未知知识的查询与搜索。大型搜索引擎(比如谷歌google、360、百度等)可以很方便快捷的提供相关问答的搜索。其中相关问答搜索是指用户输入一个问题,搜索引擎检索与该问题相对应的答案。在不同的问答知识页面,不仅提供了针对用户输入的问题进行回答的相关答复内容,还提供了与当前问答页面的用户输入问题相关的问题链接,供用户参考使用,方便用户在进行问答搜索时从不同角度综合得到该问题的解决答案。
例如:当前问答页面的搜索问题为:“感冒咳嗽怎么办?”在当前问答页面为用户推荐的相关问题可以包括:“感冒怎么办?”,“感冒咳嗽流鼻涕怎么办?”,“小孩感冒咳嗽怎么办?”,等等。
现有技术中获取相关问题时,一般是根据用户输入的搜索词作为核心词来进行获取的,这种方式比较简单直接,但获取到的相关问题与用户输入的问题的相关度并不是很好,往往不能很好地满足用户的需求,也就是说,其所获取的相关问题与用户真正想要获得的问题答案之间的匹配度比较差,导致问答页面问题检索的准确性比较差,与用户需求的贴合性比较差,不能解决用户想在当前问答页面查看与所检索的问题更贴近的、更吻合的问题答案的检索匹配需求。
因此,如何获取更合适的相关问题推荐给用户,成为问答页面相关问题获取推荐过程中亟待解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的搜索过程中的问答页面相关问题推荐方法和相应的搜索过程中的问答页面相关问题推荐装置。
本发明提供一种问答页面相关问题推荐方法,包括:
根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重;
根据所述浏览权重对获取的相关问题进行排序;
根据所述相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
在一些可选的实施例中,根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重,包括:
根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题;
在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重;
获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
在一些可选的实施例中,根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组,包括:
根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中,Ti表示一个相关问题。
在一些可选的实施例中,计算组中各相关问题与组中其它相关问题的相关浏览权重,包括:
在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;
根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;
在各会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
在一些可选的实施例中,其中,浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间。
本发明提供还一种问答页面相关问题推荐装置,包括:
问题获取模块,用于根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
权重确定模块,根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重;
排序推荐模块,用于根据所述浏览权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
在一些可选的实施例中,所述权重确定模块,具体包括:
问题分组器,用于根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题;
相关权重计算器,用于在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重;
浏览权重计算器,用于获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
在一些可选的实施例中,所述问题分组器,具体用于:
根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},实现对获取的相关问题进行分组;其中,Ti表示一个相关问题。
在一些可选的实施例中,所述相关权重计算器,具体用于:
在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;
根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;
在每个会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
在一些可选的实施例中,所述问题分组器,具体用于:
得到的浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间。
本发明实施例提供的问答页面相关问题推荐方法,当需要为输入搜索词的第一用户获取相关问题生成问答页面时,根据一段时间内的若干第二用户的浏览行为日志确定获取的相关问题的浏览权重,根据浏览权重获取较佳的相关问题,从而获取到与第一用户输入的问题相关度更好地相关问题,使获取的相关问题与用户真正想要获得的问题答案之间的匹配度更好,能够更好地满足用户需求,使用户在问答页面上查看到与所检索的问题更贴近的、更吻合的问题答案。
进一步地,本发明实施例提供的问答页面相关问题推荐方法,能够根据不同的浏览用户,按照分组计算各相关问题的相关浏览权重,从而获取到各相关问题的浏览权重,实现基于若干第二用户对各相关问题的浏览行为,来衡量获取的各相关问题对用户需求的满足匹配度高低,从而达到了获取匹配度更好的相关问题的目的。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
根据下文结合附图对本发明具体实施例的详细描述,本领域技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例一中问答页面相关问题推荐方法的流程图;
图2是本发明实施例二中问答页面相关问题推荐方法的流程图;
图3是本发明实施例中实现问答页面相关问题推荐的系统环境示意图;
图4是本发明实施例中问答页面相关问题推荐装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的获取到的相关问题与用户输入的问题的相关度并不是很好,往往不能很好地满足用户的需求的问题,本发明实施例提供一种问答页面相关问题推荐方法,通过对若干历史用户的浏览行为进行分析,获取到与用户真正想要获得的问题答案匹配度更好地相关问题。
实施例一
本发明实施例一提供一种问答页面相关问题推荐方法,该方法流程如图1所示,包括如下步骤:
步骤S101:根据来自第一用户的搜索词,获取数据库中与来自第一用户的搜索词相关的至少一个相关问题。
第一用户输入搜索词进行问答检索,生成问答页面时,生成的问答页面中包括但不限于问答页面的标题、至少一个问题答案,至少一个相关问题。在获取到第一用户输入的搜索词后,从数据库中获取若干相关问题,这些相关问题为数据库中第二用户浏览的问答页面中的问答问题或问答页面中的相关问题。
其中,第一用户是指当前用户,第二用户是指历史用户。
步骤S102:根据选定时间段内第二用户的浏览行为日志,确定获取的相关问题的浏览权重。
从数据库中获取上述步骤S101中获取到的相关问题对应的第二用户的浏览行为日志。对浏览行为日志进行分析,确定相关问题的浏览权重。确定浏览权重的过程中,可以对获取的相关问题,计算彼此之间的相关浏览权重,根据计算出来的相关浏览权重,对同一相关问题的相关浏览权重进行加权处理,得到各相关问题的浏览权重。
优选的,也可以根据设定的分组条件对获取的相关问题进行分组,在各个相关问题分组中,分别计算各相关问题与组中其他相关问题的相关浏览权重,然后综合各组的计算结果,对各组中出现的同一相关问题的相关浏览权重进行加权处理,得到各相关问题的浏览权重。
下面的实施例二中,以根据浏览用户进行分组为例,说明相关问题的浏览权重的确定过程。
步骤S103:根据确定的浏览权重对获取的相关问题进行排序。
根据确定出的各相关问题的浏览权重,对各相关问题进行排序。比如可以按照浏览权重从高到低的顺序进行排序。对相关问题进行排序时,可以对获取所有的相关问题一起进行排序,也可以按照不同的浏览用户在个浏览用户分组中分别排序,或者按照其他的规则排序。
步骤S104:根据获取的相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
根据对相关问题的排序结果,按照设定的推荐规则,选择相关问题推荐给用户。比如,将获取所有的相关问题中浏览权重最高的设定数量的相关问题推荐给用户;或者在各浏览用户对应的相关问题中分别获取设定数量的相关问题推荐给第一用户。
实施例二
本发明实施例二提供一种问答页面相关问题推荐方法,该方法流程如图2所示,包括如下步骤:
步骤S201:根据来自第一用户的搜索词,获取数据库中与来自第一用户的搜索词相关的至少一个相关问题。
例如:第一用户输入搜索词“孩子感冒怎么办?”,根据该搜索词生成对应的问答页面,生成的问答页面上有问答页面的标题,至少一个问题答案,至少一个相关问题。比如:相关问题可以是“小儿感冒咳嗽怎么办?”、“小儿感冒发烧怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”、“宝宝感冒咳嗽怎么办”“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“宝宝感冒鼻塞怎么办”、“儿童感冒咳嗽怎么办”、“儿童感冒鼻塞怎么办”、“儿童感冒发烧怎么办”等等。
这些相关问题为数据库中存储的历史用户曾经浏览过的问答页面上的问答问题或问答页面上的相关问题。
步骤S202:根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组。
对获取的相关问题进行分组时,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题。
可选的,根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中,Ti表示一个相关问题。
其中,浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间等。
沿用上边的例子,对上边获取到的各相关问题进行分组如下:
“小儿感冒咳嗽怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“宝宝感冒咳嗽怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“儿童感冒咳嗽怎么办”被同一个浏览用户浏览过,归为一组。
“小儿感冒发烧怎么办?”、“儿童感冒发烧怎么办”、“小儿感冒鼻塞怎么办?”、“宝宝感冒鼻塞怎么办”、“儿童感冒鼻塞怎么办”被同一个浏览用户浏览过,归为一组。
“小儿感冒鼻塞怎么办?”、“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒鼻塞怎么办”、“儿童感冒鼻塞怎么办”被同一个浏览用户浏览过,归为一组。
……
以此类推,对所有获取的相关问题进行分组,实现将被同一用户浏览过的相关问题归为一组。
步骤S203:在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
根据上述各浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},利用如下公式计算每个相关问题与组中其它相关问题的相关浏览权重W(Ti,Ti+1):
log(a1/(|Time(i)–Time(i+1)|+a2))
其中,Time(i)一个问答问题的用户浏览时间;
Time(i+1)为组中其它问答问题的用户浏览时间;
a1,a2为经验值常数。
当然,也可以计算组中各相关问题Ti与组中其他相关问题Ti-1的相关浏览权重W。
需要说明的是,上述各个公式并不是实现本发明的唯一公式,仅作为实施例的一种实现方式。技术人员可以根据业务需要对公式做适当变形,例如增加常量或变量或系数等方式,依然落在本发明的保护范围之内。
沿用上边的例子,针对每个分组,分别计算每个相关问题与组中其他相关问题的,例如,针对浏览用户相同的第一个相关问题分组,分别计算“小儿感冒咳嗽怎么办?”、“小儿感冒咳嗽用什么药比较好呢?”、“宝宝感冒咳嗽怎么办”、“宝宝感冒咳嗽用什么药比较好呢?”、“儿童感冒咳嗽怎么办”与组中其他相关问题的相关浏览权重。其他相关问题分组也同样进行计算。
进一步可选的,计算组中各相关问题与组中其它相关问题的相关浏览权重,包括:在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;在各会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
也就是说,对于浏览用户相同的相关问题分组中的用户,可以进一步根据浏览时间划分出不同的会话组(session),同一会话组中的相关问题的浏览时间差小于等于某个设定的时间阈值。可以根据浏览用户的浏览特征向量进行session划分。在同一session内,计算相关问题的浏览权重。
步骤S204:获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
上边计算出各相关问题分组中的各相关问题的相关浏览权重后,将各相关问题分组中相同的相关问题提取出来,例如,对于“小儿感冒鼻塞怎么办?”这个相关问题,在浏览用户相同的第一个相关问题分组和第三个相关问题中计算得到的相关浏览权重进行加权。
可选的,可以把同一相关问题在不同相关问题分组中计算得到的相关浏览权重直接进行相加,也可以分别乘上相应的权重系数后在进行相加,也可以通过其它的加权规则进行加权处理。
步骤S205:根据确定出的相关问题的浏览权重对获取的相关问题进行排序。
沿用上边的例子,以获取所有的相关问题一起进行排序为例,按照浏览权重从高到低的顺序进行排序,得到排序结果如下:
“小儿感冒发烧怎么办?”、“小儿感冒咳嗽怎么办?”、“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽怎么办”“儿童感冒发烧怎么办”、“小儿感冒咳嗽用什么药比较好呢?”、“小儿感冒鼻塞怎么办?”、“宝宝感冒咳嗽用什么药比较好呢?”、“宝宝感冒鼻塞怎么办”、“儿童感冒咳嗽怎么办”、“儿童感冒鼻塞怎么办”。
步骤S206:根据获取的相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
根据排序结果,将浏览权重最高的前几个问题作为相关问题推荐给第一用户,加入到根据用户输入的搜索词生成的问答页面中。
例如:将“小儿感冒发烧怎么办?”、“小儿感冒咳嗽怎么办?”、“宝宝感冒咳嗽流鼻涕怎么办”、“宝宝感冒咳嗽怎么办”“儿童感冒发烧怎么办”作为相关问题加入到问答页面中。
上述方法,根据数据库中的历史数据,分析历史用户浏览各个相关问题的浏览行为,确定相关问题的浏览权重参数,从而确定向用户推荐相关问题的推荐优先级,从而获取到与用户输入的搜索词匹配度更高的相关问题,在当前问答页面为用户提供与用户需求的贴合性更好、更符合用户需求的相关问题,提高问答页面问题检索的准确性。
针对本发明实施例提供的问答页面相关问题推荐方法,实现问答页面相关问题推荐的系统环境示意如图3所示。该系统包括数据库,存储若干第二用户(历史用户)的相关问题,问答页面问题推荐装置能够获取第一用户输入的搜索词,并根据搜索词从数据库获取若干历史用户浏览过的相关问题及相关问题的历史数据,通过对历史数据的分析处理,实现获取更优的相关问题推荐给第一用户。
基于同一发明构思,本发明实施例还提供一种问答页面相关问题推荐装置,该装置的结构如图4所示,包括:问题获取模块401、权重确定模块402和排序推荐模块403。
问题获取模块401,用于根据来自第一用户的搜索词,获取数据库中与搜索词相关的至少一个相关问题.
权重确定模块402,根据选定时间段内第二用户的浏览行为日志,确定获取的相关问题的浏览权重。
排序推荐模块403,用于根据确定出的浏览权重对获取的相关问题进行排序;根据获取的相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
优选的,上述权重确定模块402,具体包括:问题分组器4021、相关权重计算器4022和浏览权重计算器4023。
问题分组器4021,用于根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题。
相关权重计算器4022,用于在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
浏览权重计算器4023,用于获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
优选的,上述问题分组器4021,具体用于根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},实现对获取的相关问题进行分组;其中,Ti表示一个相关问题。
优选的,上述相关权重计算器4022,具体用于在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;在每个会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
优选的,上述问题分组器4021,具体用于得到的浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间等。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的问答页面相关问题推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认定为覆盖了所有这些其他变型或修改。

Claims (10)

1.一种问答页面相关问题推荐方法,包括:
根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重;
根据所述浏览权重对获取的相关问题进行排序;
根据所述相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
2.根据权利要求1所述的方法,其中,根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重,包括:
根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题;
在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重;
获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
3.根据权利要求1-2任一项所述的方法,其中,根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组,包括:
根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},其中,Ti表示一个相关问题。
4.根据权利要求1-3任一项所述的方法,其中,计算组中各相关问题与组中其它相关问题的相关浏览权重,包括:
在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;
根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;
在各会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
5.根据权利要求1-4任一项所述的方法,其中,浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间。
6.一种问答页面相关问题推荐装置,包括:
问题获取模块,用于根据来自第一用户的搜索词,获取数据库中与所述搜索词相关的至少一个相关问题;
权重确定模块,根据选定时间段内第二用户的浏览行为日志,确定获取的所述相关问题的浏览权重;
排序推荐模块,用于根据所述浏览权重对获取的相关问题进行排序;根据所述相关问题的排序结果,确定问答页面中推荐给第一用户的相关问题。
7.根据权利要求6所述的装置,其中,所述权重确定模块,具体包括:
问题分组器,用于根据浏览所述相关问题的浏览用户,对获取的相关问题进行分组;其中,每个相关问题分组中包括一个浏览用户对应的部分或者全部相关问题;
相关权重计算器,用于在各相关问题分组中,计算组中各相关问题与组中其它相关问题的相关浏览权重;
浏览权重计算器,用于获取同一相关问题在各相关问题分组中计算得到的相关浏览权重,将获取到的相关浏览权重进行加权,得到获取的各相关问题的浏览权重。
8.根据权利要求6-7任一项所述的装置,其中,所述问题分组器,具体用于:
根据选定时间段内的浏览行为日志,得到每个浏览用户的浏览特征向量{T1、T2、……、Ti、Ti+1、……、Tn},实现对获取的相关问题进行分组;其中,Ti表示一个相关问题。
9.根据权利要求6-8任一项所述的装置,其中,所述相关权重计算器,具体用于:
在各相关问题分组中,根据浏览用户浏览各相关问题的浏览时间对该相关问题分组中的所有相关问题进行排序;
根据排序结果中,划分浏览时间间隔小于预设的时间间隔阈值的相关问题至同一会话组;
在每个会话组中,计算组中各相关问题与组中其它相关问题的相关浏览权重。
10.根据权利要求6-9任一项所述的装置,其中,所述问题分组器,具体用于:
得到的浏览特征向量中的元素Ti的属性包括下列参数中的至少一个:
问答页面的生成时间、答案数、好评数、差评数、问答长度、用户浏览时间、用户停留时间。
CN201410828977.2A 2014-12-25 2014-12-25 问答页面相关问题推荐方法和装置 Expired - Fee Related CN104462554B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201410828977.2A CN104462554B (zh) 2014-12-25 2014-12-25 问答页面相关问题推荐方法和装置
PCT/CN2015/095853 WO2016101765A1 (zh) 2014-12-25 2015-11-27 问答页面相关问题推荐方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410828977.2A CN104462554B (zh) 2014-12-25 2014-12-25 问答页面相关问题推荐方法和装置

Publications (2)

Publication Number Publication Date
CN104462554A true CN104462554A (zh) 2015-03-25
CN104462554B CN104462554B (zh) 2019-03-08

Family

ID=52908589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410828977.2A Expired - Fee Related CN104462554B (zh) 2014-12-25 2014-12-25 问答页面相关问题推荐方法和装置

Country Status (1)

Country Link
CN (1) CN104462554B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016101765A1 (zh) * 2014-12-25 2016-06-30 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN105893523A (zh) * 2016-03-31 2016-08-24 华东师范大学 利用答案相关性排序的评估度量来计算问题相似度的方法
WO2017202138A1 (zh) * 2016-05-26 2017-11-30 北京搜狗科技发展有限公司 基于搜索引擎的信息处理方法和装置
CN107506367A (zh) * 2017-07-03 2017-12-22 阿里巴巴集团控股有限公司 确定应用展示内容的方法、装置及服务器
CN109815324A (zh) * 2019-01-10 2019-05-28 平安科技(深圳)有限公司 校园信息的查询方法、装置、计算机设备和存储介质
CN109829048A (zh) * 2019-01-23 2019-05-31 平安科技(深圳)有限公司 电子装置、访谈辅助方法和计算机可读存储介质
CN110134945A (zh) * 2019-04-15 2019-08-16 平安科技(深圳)有限公司 习题考点识别方法、装置、设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101556603A (zh) * 2009-05-06 2009-10-14 北京航空航天大学 一种用于对检索结果重新排序的协同检索方法
EP2192503A1 (en) * 2008-11-21 2010-06-02 BRITISH TELECOMMUNICATIONS public limited company Optimised tag based searching
CN102053983A (zh) * 2009-11-02 2011-05-11 阿里巴巴集团控股有限公司 一种垂直搜索的查询方法、系统和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2192503A1 (en) * 2008-11-21 2010-06-02 BRITISH TELECOMMUNICATIONS public limited company Optimised tag based searching
CN101556603A (zh) * 2009-05-06 2009-10-14 北京航空航天大学 一种用于对检索结果重新排序的协同检索方法
CN102053983A (zh) * 2009-11-02 2011-05-11 阿里巴巴集团控股有限公司 一种垂直搜索的查询方法、系统和装置

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016101765A1 (zh) * 2014-12-25 2016-06-30 北京奇虎科技有限公司 问答页面相关问题推荐方法及装置
CN105893523A (zh) * 2016-03-31 2016-08-24 华东师范大学 利用答案相关性排序的评估度量来计算问题相似度的方法
CN105893523B (zh) * 2016-03-31 2019-05-17 华东师范大学 利用答案相关性排序的评估度量来计算问题相似度的方法
WO2017202138A1 (zh) * 2016-05-26 2017-11-30 北京搜狗科技发展有限公司 基于搜索引擎的信息处理方法和装置
CN107506367A (zh) * 2017-07-03 2017-12-22 阿里巴巴集团控股有限公司 确定应用展示内容的方法、装置及服务器
CN107506367B (zh) * 2017-07-03 2021-12-24 创新先进技术有限公司 确定应用展示内容的方法、装置及服务器
CN109815324A (zh) * 2019-01-10 2019-05-28 平安科技(深圳)有限公司 校园信息的查询方法、装置、计算机设备和存储介质
CN109829048A (zh) * 2019-01-23 2019-05-31 平安科技(深圳)有限公司 电子装置、访谈辅助方法和计算机可读存储介质
CN109829048B (zh) * 2019-01-23 2023-06-23 平安科技(深圳)有限公司 电子装置、访谈辅助方法和计算机可读存储介质
CN110134945A (zh) * 2019-04-15 2019-08-16 平安科技(深圳)有限公司 习题考点识别方法、装置、设备和存储介质
CN110134945B (zh) * 2019-04-15 2024-04-23 平安科技(深圳)有限公司 习题考点识别方法、装置、设备和存储介质

Also Published As

Publication number Publication date
CN104462554B (zh) 2019-03-08

Similar Documents

Publication Publication Date Title
CN104462554A (zh) 问答页面相关问题推荐方法和装置
CN104462553A (zh) 问答页面相关问题推荐方法及装置
CN106339383B (zh) 一种搜索排序方法及系统
CN103870507B (zh) 一种基于类目的搜索方法和装置
US9201964B2 (en) Identifying related entities
CN104573054A (zh) 一种信息推送方法和设备
CN105956148A (zh) 资源信息的推荐方法和装置
CN107193883B (zh) 一种数据处理方法和系统
Makvana et al. A novel approach to personalize web search through user profiling and query reformulation
KR102371437B1 (ko) 엔티티를 추천하는 방법과 장치, 전자기기 및 컴퓨터 판독가능 매체
CN105786838A (zh) 一种信息匹配处理方法和装置
CN104965918B (zh) 一种基于查询关键词的搜索方法和装置
US8918416B1 (en) Classifying queries
CN107861981A (zh) 一种数据处理方法及装置
CN102169566A (zh) 在陌生领域中生成推荐项目的方法和装置
Kumar et al. Technical job recommendation system using APIs and web crawling
US20240119047A1 (en) Answer facts from structured content
CN110111167A (zh) 一种确定推荐对象的方法和装置
CN104462556A (zh) 问答页面相关问题推荐方法和装置
CN103744970A (zh) 一种确定图片的主题词的方法及装置
CN101639856B (zh) 检测互联网信息传播的网页关联评价装置
CN110675205B (zh) 基于应用的竞品分析方法、装置及存储介质
CN108256018A (zh) 一种物品推荐方法及装置
Wang et al. Evaluating similarity measures for dataset search
CN104994431B (zh) 一种网站视频关注度的处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20190308

Termination date: 20211225

CF01 Termination of patent right due to non-payment of annual fee