CN109408726A - 问答网站中问题回答者推荐方法 - Google Patents
问答网站中问题回答者推荐方法 Download PDFInfo
- Publication number
- CN109408726A CN109408726A CN201811333596.1A CN201811333596A CN109408726A CN 109408726 A CN109408726 A CN 109408726A CN 201811333596 A CN201811333596 A CN 201811333596A CN 109408726 A CN109408726 A CN 109408726A
- Authority
- CN
- China
- Prior art keywords
- user
- question
- answer
- corporations
- quizmaster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种问答网站中问题回答者推荐方法,具有如下步骤:推荐系统接收提问者信息以及问题信息,提取问答网站的数据;构建用户间关系的网络图;将网络图利用Weighted LeaderRank算法得出用户排名;对所有用户形成一个社团分类;根据用户排名和社团分类,确定出每个社团中的用户排名;根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户,由其来解答问题,然后将答案反馈给提问者用户。本发明通过对提问者进行社团划分,然后推荐给与其相同社团的用户,能够缩短问题解决的时间,提高问题回答的准确性和质量,促进技术性问答网站中问题的解决。
Description
技术领域
本发明涉及互联网内容推荐,具体地说是一种问答网站中问题回答者推荐方法。
背景技术
这几年,人们越来越关注流行疾病以及信息等在复杂网络中的传播,研究人员希望可以找到减缓传播速度的方法以及寻找出传播速度快的原因。其实有很多因素对传播的速度以及广度造成影响,而传播者的影响力也是其中一项重要的因素。所以,如果我们可以在传播力度大,也就是说在影响力大的节点上进行免疫可以有效的控制疾病的传播。同时,识别影响力度大的传播者的意义可以推广到很多方面,例如寻找影响力大的领导人员,对于科学家,运动员以及出版物的排名。但是就目前而言,识别出影响力的传播者是一项很大的挑战。
我们以Stack Overflow网站作为案例,这是一个面向程序员的问答网站。尤其从2008年开始,这个网站因为其丰富的功能集而迅速的普及:用户既可以提出问题,也可以回答问题,同时也能对问题进行编辑,对答案进行投票,对答案和问题发表自己的言论。我们就是要通过排序算法来对所有用户进行排序,并且通过相关问题的划分确定小规模的社团,以此来实现对问题的推送。在问题的解决方面,我们更希望有针对的对问题进行推送,从而更好更快地解决问题。然后就目前而言,现存的方法并没有对Stack Overflow的用户进行分析和应用,所以我们提出解决问题推送问题的方法。
以往Stack Overflow的用户被视为具有相同的能力,但是很明显这种认定并不合理,提出问题和回答问题的用户的经验、能力以及对于问题的认知程度往往具有很大的差异。因为大部分的问题提出都是为了得到合适的答案,所以作为回答者的用户在网站上的作用就非常大。一般情况下,一个经常在线活跃的用户对问答网站的贡献程度要比一个常年不在线的用户高,一个开发经验丰富的用户的贡献也应该比普通的用户大。
为了给问答网站的知识社区推荐相关的问答文档,以及为问题推荐高质量的回答或者进行相应的补充,文献[Duen-Ren Liu,Chun-Kai Huang,Yu-HsuanChen:RecommendingQA Documents for Communities of Question-AnsweringWebsites.ACIIDS(2)2013:139-147]提出的方法思路如下:1、通过考虑QA收集因素来生成社团主题的概况。收集因素包括:社团成员在收集和回答QA时的信誉、特定主题以往收集的QA文档的推荐分数和QA的收集时间。2、基于问题相似性、答案新颖性和答案相关性来预测QA的互补分数。3、提出了基于质量保证的补充方法和基于主题的补充方法。该方法在综合考虑了主题和三个收集因子以后比其它传统方法效果要更好。
上述方法解决的是类似Yahoo!知识社区的问答推荐以及补充,但是对于像StackOverflow这种解决技术性问题的网站,还没有问题推荐方法得以有效应用;而且社区分类以及社团间问题的推送与传统的知识社区不一样,所以需要对用户进行排名,挖掘出隐藏的优秀人员,同时对问题进行分类以便于同一类别的问题进行分类处理,进而相应的技术问题能够尽早的解决,提高用户的满意度。
发明内容
针对上述问题,提出一种问答网站中问题回答者推荐方法。该方法将用户的能力、开发经验、影响等因素量化从而通过活跃度来排序。对问答网站来说,本发明也可以为平台的用户进行等级评定从而对活跃度高的用户进行必要的激励,也会相应的促进问题的解决效率。利用涉及到的帖子所涵盖的关键词进行社团划分,可以优先把问题推荐给与他/她同一个社团的用户,从而加快问题的解决速度。
本发明采用的技术手段如下:
一种问答网站中问题回答者推荐方法,具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名;
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户。
所述步骤S5的具体步骤如下:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并规定wgi等于i节点的入度,且wig=1,从其他节点指向根节点的值恒等于1;
用以下公式进行计算,得到每个节点的得分:该计算是一个迭代过程,最终得到每个节点的稳定分数值,
根据节点的得分(分数),得出用户排名。
α为大于0的一个阈值,根据情况来定。
本发明通过对提问者进行社团划分,然后推荐给与其相同社团的用户,能够缩短问题解决的时间,提高问题回答的准确性和质量,促进技术性问答网站中问题的解决。
基于上述理由本发明可在互联网内容推荐等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的具体实施方式中问答网站中问题回答者推荐方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种问答网站中问题回答者推荐方法,具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并设定wgi等于i节点的入度,且wig=1;
用以下公式进行计算,得到每个节点的得分:
根据节点的得分,得出用户排名。
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户,α为大于0的一个阈值;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (3)
1.一种问答网站中问题回答者推荐方法,其特征在于具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名;
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户。
2.根据权利要求1所述的问答网站中问题回答者推荐方法,其特征在于:所述步骤S5的具体步骤如下:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并设定wgi等于i节点的入度,且wig=1;
用以下公式进行计算,得到每个节点的得分:
根据节点的得分,得出用户排名。
3.根据权利要求1所述的问答网站中问题回答者推荐方法,其特征在于:α为大于0的一个阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811333596.1A CN109408726B (zh) | 2018-11-09 | 2018-11-09 | 问答网站中问题回答者推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811333596.1A CN109408726B (zh) | 2018-11-09 | 2018-11-09 | 问答网站中问题回答者推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109408726A true CN109408726A (zh) | 2019-03-01 |
CN109408726B CN109408726B (zh) | 2022-02-08 |
Family
ID=65472798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811333596.1A Active CN109408726B (zh) | 2018-11-09 | 2018-11-09 | 问答网站中问题回答者推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109408726B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110111010A (zh) * | 2019-05-10 | 2019-08-09 | 山东大学 | 一种基于众智网络的问答任务分配方法及系统 |
CN110297987A (zh) * | 2019-07-02 | 2019-10-01 | 武汉斗鱼网络科技有限公司 | 一种帖子推荐方法、装置、设备和存储介质 |
CN111833676A (zh) * | 2020-08-05 | 2020-10-27 | 北京育宝科技有限公司 | 一种交互式学习辅助方法、装置和系统 |
CN112801745A (zh) * | 2021-02-02 | 2021-05-14 | 李海涛 | 基于大数据平台的在线评论有效性的推荐方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060277165A1 (en) * | 2005-06-03 | 2006-12-07 | Fuji Xerox Co., Ltd. | Question answering system, data search method, and computer program |
US20130171605A1 (en) * | 2011-12-30 | 2013-07-04 | China Mobile Communications Corporation | Method and system for determining answerer |
US20140067944A1 (en) * | 2012-09-06 | 2014-03-06 | Todd Christopher Jackson | Group recommendations based on answered questions in a social networking system |
CN108021616A (zh) * | 2017-11-06 | 2018-05-11 | 大连理工大学 | 一种基于循环神经网络的社区问答专家推荐方法 |
-
2018
- 2018-11-09 CN CN201811333596.1A patent/CN109408726B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060277165A1 (en) * | 2005-06-03 | 2006-12-07 | Fuji Xerox Co., Ltd. | Question answering system, data search method, and computer program |
US20130171605A1 (en) * | 2011-12-30 | 2013-07-04 | China Mobile Communications Corporation | Method and system for determining answerer |
US20140067944A1 (en) * | 2012-09-06 | 2014-03-06 | Todd Christopher Jackson | Group recommendations based on answered questions in a social networking system |
CN108021616A (zh) * | 2017-11-06 | 2018-05-11 | 大连理工大学 | 一种基于循环神经网络的社区问答专家推荐方法 |
Non-Patent Citations (2)
Title |
---|
ZHOU ZHAO 等: ""Expert Finding for Question Answering via Graph Regularized Matrix Completion"", 《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING 》 * |
刚家泰 等: ""合著者网络中的网络排名算法"", 《辽宁工程技术大学学报(自然科学版)》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110111010A (zh) * | 2019-05-10 | 2019-08-09 | 山东大学 | 一种基于众智网络的问答任务分配方法及系统 |
CN110297987A (zh) * | 2019-07-02 | 2019-10-01 | 武汉斗鱼网络科技有限公司 | 一种帖子推荐方法、装置、设备和存储介质 |
CN111833676A (zh) * | 2020-08-05 | 2020-10-27 | 北京育宝科技有限公司 | 一种交互式学习辅助方法、装置和系统 |
CN112801745A (zh) * | 2021-02-02 | 2021-05-14 | 李海涛 | 基于大数据平台的在线评论有效性的推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109408726B (zh) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10795919B2 (en) | Assisted knowledge discovery and publication system and method | |
CN109408726A (zh) | 问答网站中问题回答者推荐方法 | |
Adamic et al. | Friends and neighbors on the web | |
Garimella et al. | Demographic-aware word associations | |
Venkataramani et al. | Discovery of technical expertise from open source code repositories | |
CN102609433A (zh) | 基于用户日志进行查询推荐的方法及系统 | |
CN104572982B (zh) | 基于问题引导的个性化推荐方法及系统 | |
CN110083696A (zh) | 基于元结构技术的全局引文推荐方法、推荐系统 | |
CN111309936A (zh) | 一种电影用户画像的构建方法 | |
Van Rijen et al. | A Data-Driven Approach for Measuring the Severity of the Signs of Depression using Reddit Posts. | |
CN101799814B (zh) | 自由分类标签类聚成网状分类结构的方法 | |
An et al. | A heuristic approach on metadata recommendation for search engine optimization | |
Jiang et al. | Structurizing misinformation stories via rationalizing fact-checks | |
Blooma et al. | Research issues in community based question answering | |
Sheeba et al. | A fuzzy logic based on sentiment classification | |
CN111680505B (zh) | 一种Markdown特征感知的无监督关键词提取方法 | |
Itani | Sentiment analysis and resources for informal Arabic text on social media | |
Cuong et al. | A framework for paper submission recommendation system | |
CN109213852B (zh) | 一种旅游目的地图片推荐方法 | |
CN114357290B (zh) | 一种多视角社交媒体用户立场检测方法与装置 | |
Kumar et al. | A survey on popular recommender systems | |
CN113537593B (zh) | 预测议员投票倾向的方法及其装置 | |
Chaa et al. | New technique to deal with verbose queries in social book search | |
Kacprzak et al. | Metasets and opinion mining in new decision support system | |
CN114328865A (zh) | 一种改进的TextRank多特征融合教育资源关键词提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |