CN109408726B - 问答网站中问题回答者推荐方法 - Google Patents

问答网站中问题回答者推荐方法 Download PDF

Info

Publication number
CN109408726B
CN109408726B CN201811333596.1A CN201811333596A CN109408726B CN 109408726 B CN109408726 B CN 109408726B CN 201811333596 A CN201811333596 A CN 201811333596A CN 109408726 B CN109408726 B CN 109408726B
Authority
CN
China
Prior art keywords
question
user
community
users
questioner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811333596.1A
Other languages
English (en)
Other versions
CN109408726A (zh
Inventor
李辉
李霄
魏苗苗
张佳丽
陈荣
郭世凯
唐文君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian Maritime University
Original Assignee
Dalian Maritime University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian Maritime University filed Critical Dalian Maritime University
Priority to CN201811333596.1A priority Critical patent/CN109408726B/zh
Publication of CN109408726A publication Critical patent/CN109408726A/zh
Application granted granted Critical
Publication of CN109408726B publication Critical patent/CN109408726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种问答网站中问题回答者推荐方法,具有如下步骤:推荐系统接收提问者信息以及问题信息,提取问答网站的数据;构建用户间关系的网络图;将网络图利用Weighted LeaderRank算法得出用户排名;对所有用户形成一个社团分类;根据用户排名和社团分类,确定出每个社团中的用户排名;根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户,由其来解答问题,然后将答案反馈给提问者用户。本发明通过对提问者进行社团划分,然后推荐给与其相同社团的用户,能够缩短问题解决的时间,提高问题回答的准确性和质量,促进技术性问答网站中问题的解决。

Description

问答网站中问题回答者推荐方法
技术领域
本发明涉及互联网内容推荐,具体地说是一种问答网站中问题回答者推荐方法。
背景技术
这几年,人们越来越关注流行疾病以及信息等在复杂网络中的传播,研究人员希望可以找到减缓传播速度的方法以及寻找出传播速度快的原因。其实有很多因素对传播的速度以及广度造成影响,而传播者的影响力也是其中一项重要的因素。所以,如果我们可以在传播力度大,也就是说在影响力大的节点上进行免疫可以有效的控制疾病的传播。同时,识别影响力度大的传播者的意义可以推广到很多方面,例如寻找影响力大的领导人员,对于科学家,运动员以及出版物的排名。但是就目前而言,识别出影响力的传播者是一项很大的挑战。
我们以Stack Overflow网站作为案例,这是一个面向程序员的问答网站。尤其从2008年开始,这个网站因为其丰富的功能集而迅速的普及:用户既可以提出问题,也可以回答问题,同时也能对问题进行编辑,对答案进行投票,对答案和问题发表自己的言论。我们就是要通过排序算法来对所有用户进行排序,并且通过相关问题的划分确定小规模的社团,以此来实现对问题的推送。在问题的解决方面,我们更希望有针对的对问题进行推送,从而更好更快地解决问题。然后就目前而言,现存的方法并没有对Stack Overflow的用户进行分析和应用,所以我们提出解决问题推送问题的方法。
以往Stack Overflow的用户被视为具有相同的能力,但是很明显这种认定并不合理,提出问题和回答问题的用户的经验、能力以及对于问题的认知程度往往具有很大的差异。因为大部分的问题提出都是为了得到合适的答案,所以作为回答者的用户在网站上的作用就非常大。一般情况下,一个经常在线活跃的用户对问答网站的贡献程度要比一个常年不在线的用户高,一个开发经验丰富的用户的贡献也应该比普通的用户大。
为了给问答网站的知识社区推荐相关的问答文档,以及为问题推荐高质量的回答或者进行相应的补充,文献[Duen-Ren Liu,Chun-Kai Huang,Yu-HsuanChen:RecommendingQA Documents for Communities of Question-AnsweringWebsites.ACIIDS(2)2013:139-147]提出的方法思路如下:1、通过考虑QA收集因素来生成社团主题的概况。收集因素包括:社团成员在收集和回答QA时的信誉、特定主题以往收集的QA文档的推荐分数和QA的收集时间。2、基于问题相似性、答案新颖性和答案相关性来预测QA的互补分数。3、提出了基于质量保证的补充方法和基于主题的补充方法。该方法在综合考虑了主题和三个收集因子以后比其它传统方法效果要更好。
上述方法解决的是类似Yahoo!知识社区的问答推荐以及补充,但是对于像StackOverflow这种解决技术性问题的网站,还没有问题推荐方法得以有效应用;而且社区分类以及社团间问题的推送与传统的知识社区不一样,所以需要对用户进行排名,挖掘出隐藏的优秀人员,同时对问题进行分类以便于同一类别的问题进行分类处理,进而相应的技术问题能够尽早的解决,提高用户的满意度。
发明内容
针对上述问题,提出一种问答网站中问题回答者推荐方法。该方法将用户的能力、开发经验、影响等因素量化从而通过活跃度来排序。对问答网站来说,本发明也可以为平台的用户进行等级评定从而对活跃度高的用户进行必要的激励,也会相应的促进问题的解决效率。利用涉及到的帖子所涵盖的关键词进行社团划分,可以优先把问题推荐给与他/她同一个社团的用户,从而加快问题的解决速度。
本发明采用的技术手段如下:
一种问答网站中问题回答者推荐方法,具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名;
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户。
所述步骤S5的具体步骤如下:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并规定wgi等于i节点的入度,且wig=1,从其他节点指向根节点的值恒等于1;
用以下公式进行计算,得到每个节点的得分:该计算是一个迭代过程,最终得到每个节点的稳定分数值,
Figure BDA0001860641710000031
根据节点的得分(分数),得出用户排名。
α为大于0的一个阈值,根据情况来定。
本发明通过对提问者进行社团划分,然后推荐给与其相同社团的用户,能够缩短问题解决的时间,提高问题回答的准确性和质量,促进技术性问答网站中问题的解决。
基于上述理由本发明可在互联网内容推荐等领域广泛推广。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的具体实施方式中问答网站中问题回答者推荐方法的流程图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,一种问答网站中问题回答者推荐方法,具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并设定wgi等于i节点的入度,且wig=1;
用以下公式进行计算,得到每个节点的得分:
Figure BDA0001860641710000051
根据节点的得分,得出用户排名。
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户,α为大于0的一个阈值;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (2)

1.一种问答网站中问题回答者推荐方法,其特征在于具有如下步骤:
S1、提问者用户提出问题并且将提问者信息以及问题信息提交到推荐系统;
S2、推荐系统接收提问者信息以及问题信息;
S3、推荐系统提取问答网站的数据,问答网站的数据包括用户的id,问题id,问题得分,问题关键词,问题的回答者id,问题回答者的回答得分,问题的回答时间;
S4、根据用户之间的回答与提问之间的关系,构建用户间关系的网络图,所述网络图通过以下方式构成:如果用户i回答了用户j的问题,或者用户i评论了用户j,则定义用户i到用户j是有边的,且用户i到用户j边之间的权重等于用户i对用户j的评论数和回答数之和;
S5、将所述网络图利用Weighted LeaderRank算法得出用户排名;
S6、根据所述问题信息中包含的关键词信息,将关键词的信息赋值给用户,形成用户之间的关键词共现网络;
利用模块化方法来划分社团;
对所有用户形成一个社团分类;
S7、根据步骤S5得到的用户排名和步骤S6得到的社团分类,确定出每个社团中的用户排名;
S8、根据提问者用户在问答网站中的id在推荐系统中确认所属社团,并且推荐给该社团中活跃度为α以上的用户;
S9、由该社团中活跃度为α以上的用户来解答问题,然后将答案反馈给提问者用户;
所述步骤S5的具体步骤如下:
假定在包括n个节点和m条边的原始连通图中,引入一个根节点;
创建从根节点指向其他节点的边和其他节点指向根节点的边,则得到包括n+1个节点和m+2n条边的新连通图;
用aij来表示新连通图中的n+1维矩阵中的元素,wij表示aij的权重系数,如果从i到j有边,则aij=1,那么,wij=1,如果从i到j无边,则aij=0,那么wij=0;
设引入的根节点为g,并设定wgi等于i节点的入度,且wig=1;
用以下公式进行计算,得到每个节点在t时刻的得分:
Figure FDA0003205328260000021
根据节点的得分,得出用户排名。
2.根据权利要求1所述的问答网站中问题回答者推荐方法,其特征在于:α为大于0的一个阈值。
CN201811333596.1A 2018-11-09 2018-11-09 问答网站中问题回答者推荐方法 Active CN109408726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811333596.1A CN109408726B (zh) 2018-11-09 2018-11-09 问答网站中问题回答者推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811333596.1A CN109408726B (zh) 2018-11-09 2018-11-09 问答网站中问题回答者推荐方法

Publications (2)

Publication Number Publication Date
CN109408726A CN109408726A (zh) 2019-03-01
CN109408726B true CN109408726B (zh) 2022-02-08

Family

ID=65472798

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811333596.1A Active CN109408726B (zh) 2018-11-09 2018-11-09 问答网站中问题回答者推荐方法

Country Status (1)

Country Link
CN (1) CN109408726B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110111010B (zh) * 2019-05-10 2020-07-03 山东大学 一种基于众智网络的问答任务分配方法及系统
CN110297987A (zh) * 2019-07-02 2019-10-01 武汉斗鱼网络科技有限公司 一种帖子推荐方法、装置、设备和存储介质
CN111833676A (zh) * 2020-08-05 2020-10-27 北京育宝科技有限公司 一种交互式学习辅助方法、装置和系统
CN112801745A (zh) * 2021-02-02 2021-05-14 李海涛 基于大数据平台的在线评论有效性的推荐方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021616A (zh) * 2017-11-06 2018-05-11 大连理工大学 一种基于循环神经网络的社区问答专家推荐方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4654776B2 (ja) * 2005-06-03 2011-03-23 富士ゼロックス株式会社 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム
US20130171605A1 (en) * 2011-12-30 2013-07-04 China Mobile Communications Corporation Method and system for determining answerer
US9177347B2 (en) * 2012-09-06 2015-11-03 Facebook, Inc. Group recommendations based on answered questions in a social networking system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021616A (zh) * 2017-11-06 2018-05-11 大连理工大学 一种基于循环神经网络的社区问答专家推荐方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Expert Finding for Question Answering via Graph Regularized Matrix Completion";Zhou Zhao 等;《IEEE Transactions on Knowledge and Data Engineering 》;20140924;第993-1004页 *
"合著者网络中的网络排名算法";刚家泰 等;《辽宁工程技术大学学报(自然科学版)》;20140915;第1293-1296页 *

Also Published As

Publication number Publication date
CN109408726A (zh) 2019-03-01

Similar Documents

Publication Publication Date Title
CN109408726B (zh) 问答网站中问题回答者推荐方法
Salloum et al. Mining social media text: extracting knowledge from Facebook
US10795919B2 (en) Assisted knowledge discovery and publication system and method
CN110046240B (zh) 结合关键词检索与孪生神经网络的目标领域问答推送方法
Burel et al. Automatic identification of best answers in online enquiry communities
CN106980692A (zh) 一种基于微博特定事件的影响力计算方法
KR101543780B1 (ko) 동적 사용자 프로필 및 소셜 네트워크 신뢰성을 이용한 전문가 검색 시스템 및 방법
CN104376010B (zh) 用户推荐方法和装置
DE212010000172U1 (de) Soziale Suchmaschine
Lops et al. Leveraging the linkedin social network data for extracting content-based user profiles
Furini et al. TSentiment: On gamifying Twitter sentiment analysis
CN107122455A (zh) 一种基于微博的网络用户增强表示方法
KR20150096295A (ko) 문답 데이터베이스 구축 시스템 및 방법, 그리고 이를 이용한 검색 시스템 및 방법
CN106934071A (zh) 基于异构信息网络和贝叶斯个性化排序的推荐方法及装置
CN113761383B (zh) 一种基于统一用户行为建模的搜索和推荐融合系统
CN112149422B (zh) 一种基于自然语言的企业新闻动态监测方法
Kuo et al. Integrated microblog sentiment analysis from users’ social interaction patterns and textual opinions
US11934977B2 (en) Dynamic and continuous onboarding of service providers in an online expert marketplace
KR101780237B1 (ko) 온라인 상에 공개된 질의응답 데이터를 기초로 한 사용자 질의에 대한 응답 방법 및 장치
CN105528419B (zh) 一种考虑用户‑作者关系建模的个性化搜索方法
Wang et al. A big data analysis of social media coverage of athlete protests
Qaisar et al. Twitter’s role in inter media agenda setting on political issues of Pakistan
CN106874260A (zh) 一种基于用户词典的网络社交文本大数据处理方法及系统
Wasim et al. Extracting and modeling user interests based on social media
JP2007041700A (ja) トピック抽出装置、トピック抽出方法、トピック抽出プログラム、および、記憶媒体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant