CN110111010B - 一种基于众智网络的问答任务分配方法及系统 - Google Patents

一种基于众智网络的问答任务分配方法及系统 Download PDF

Info

Publication number
CN110111010B
CN110111010B CN201910390185.4A CN201910390185A CN110111010B CN 110111010 B CN110111010 B CN 110111010B CN 201910390185 A CN201910390185 A CN 201910390185A CN 110111010 B CN110111010 B CN 110111010B
Authority
CN
China
Prior art keywords
user
degree
authority
high interest
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910390185.4A
Other languages
English (en)
Other versions
CN110111010A (zh
Inventor
刘磊
张小丽
郭伟
鹿旭东
杨哲
崔立真
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong University
Original Assignee
Shandong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong University filed Critical Shandong University
Priority to CN201910390185.4A priority Critical patent/CN110111010B/zh
Publication of CN110111010A publication Critical patent/CN110111010A/zh
Application granted granted Critical
Publication of CN110111010B publication Critical patent/CN110111010B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • G06Q10/063112Skill-based matching of a person or a group to a task

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于众智网络的问答任务分配方法及系统,该方法包括以下步骤:获取用户发布的待解决新问题;搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,获得兴趣度高的用户;采用改进的PageRank算法,计算兴趣度高的用户的权威度;计算兴趣度高的用户的最近活跃度和情感倾向性;根据得到的兴趣度高的用户权威度、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待解决新问题分配给匹配度高的用户。本发明使得最合适的问题能够推送到最合适的用户来解答,有效缓解在线问答平台中提问者被动等待用户回答且得不到满意回答的情况。

Description

一种基于众智网络的问答任务分配方法及系统
技术领域
本公开涉及众智网络任务分配技术领域,具体为一种基于众智网络的问答任务分配方法及系统。
背景技术
互联网、云计算、众智科学的兴起使得用户能充分发挥个体和群体的智慧,挖掘其潜能,有效解决计算机或人类单独难以解决的复杂问题。随着在线问答的行业的兴起,各种在线问答平台为用户学习提供了便利。众智科学与工程和在线问答结合,将能够充分利用广大用户的智慧,帮助用户解答问题。
众智科学与工程以万物互联的未来网络化产业运作体系和社会治理的需求为背景,以众智网络系统为对象,以解决未来网络化产业运作体系和社会治理的基本问题为出发点,综合运用系统论、信息论、控制论、计算机科学与工程、管理学、经济学、社会学、心理学等多学科知识,通过物联网、云计算、大数据、人工智能等新技术和手段,探索大规模在线互联环境下信息物理社会三元融合系统群体智能活动的基本原理和规律,进而建立相关方法和工具,充分发挥人类个体和群体的智慧,挖掘其潜能,有效推进新型的网络化产业运作体系及社会运行管理方式建设进程。
在众智网络中,将物理空间的自然人、企业、政府部门等机构、各类智能装备与物品等众多智能主体,连同他们各自意识空间的思想,借助网络和数据,统一映射到信息空间中各自的镜像,称这些众多智能主体的映射为信息空间的智能数体。
智能数体分为“我是谁”、“我的供给”、“我的需求”和“我的空间”四部分,将问答映射到众智网络的信息空间,用户即为智能数体,用户发布问题即为提出“我的需求”,用户回答问题的能力即为“我的供给”,所以问答环节映射到众智网络的信息空间即为供需匹配。
发明人在研发过程中发现,现有的问答任务分配方法对用户问题和资源的供需匹配的效率低,存在一定误差,在线问答平台中提问者被动等待用户回答且得不到满意回答。
发明内容
为了克服上述现有技术的不足,本公开提供了一种基于众智网络的问答任务分配方法及系统,使得最合适的问题能够推送到最合适的用户来解答,有效缓解在线问答平台中提问者被动等待用户回答且得不到满意回答的情况。
本公开提出的一种基于众智网络的问答任务分配方法的技术方案是:
一种基于众智网络的问答任务分配方法,该方法包括以下步骤:
获取用户发布的待解决新问题;
搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,获得兴趣度高的用户;
采用改进的PageRank算法,计算兴趣度高的用户的权威度;
计算兴趣度高的用户的最近活跃度和情感倾向性;
根据得到的兴趣度高的用户权威度、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待解决新问题分配给匹配度高的用户。
作为本公开的进一步限定,所述兴趣度高的用户的获得方法具体为:
采用众智网络搜索用户历史提出的问题及回答过的问题答案;
采用BTM主题模型生成语料库中所有词对,计算每个词对的联合概率,将所有词对的联合概率相乘,得到整个语料库的概率;
将用户历史提出的问题题目及回答过的问题题目构成文档,从文档中提取出词对,利用整个语料库中生成的词对学习文档中所有词对的主题,得到用户的主题分布;
计算用户主题与新问题的距离,将最近距离对应的用户为兴趣度高的用户。
作为本公开的进一步限定,所述兴趣度高的用户的权威度的计算方法为:
在PageRank算法的基础上,构建用户之间问答关系图;
计算在各个主题下用户间权威值转移概率,利用在各个主题下用户间权威值转移概率,计算在各个主题下兴趣度高的用户的权威度;
利用在各个主题下兴趣度高的用户的权威度和新问题与各个主题之间的距离,计算兴趣度高的用户对新问题的权威度。
作为本公开的进一步限定,所述兴趣度高的用户的最近活跃度的计算方法为:
根据兴趣度高的用户历史回答时间与新问题发布时间的时间间隔,计算兴趣度高的用户最近活跃度,并对兴趣度高的用户最近活跃度进行归一化处理。
作为本公开的进一步限定,所述兴趣度高的用户的情感倾向性的计算方法为:
获取兴趣度高的用户得到的历史评价,将其作为待分析文本,并抽取待分析文本中所有评价词;
选择基准词,基于任意每个评价词与基准词的点互信息,计算每个评价词的语义倾向性;
将所有评价词的语义倾向性求和并取平均,得到句子的平均语义倾向性,即为兴趣度高的用户的情感倾向性。
作为本公开的进一步限定,所述兴趣度高的用户匹配度的计算方法为:
将得到的兴趣度高的用户权威度、最近活跃度和情感倾向性相乘,得到兴趣度高的用户匹配度。
本公开提出的一种基于众智网络的问答任务分配系统的技术方案是:
一种基于众智网络的问答任务分配系统,该系统包括:
问题获取模块,用于获取用户发布的待解决新问题;
兴趣度分析模块,用于搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,获得兴趣度高的用户;
权威性分析模块,用于采用改进的PageRank算法,计算兴趣度高的用户的权威度;
权威性均衡模块,用于计算兴趣度高的用户的最近活跃度和情感倾向性;
分析匹配模块,用于根据得到的兴趣度高的用户权威度、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待解决新问题分配给匹配度高的用户。
本公开提出的一种计算机可读存储介质的技术方案是:
一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时实现如上所述的基于众智网络的问答任务分配方法中的步骤。
本公开提出的一种计算机设备的技术方案是:
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如上所述的基于众智网络的问答任务分配方法中的步骤。
通过上述技术方案,本公开的有益效果是:
(1)本公开改进了传统的PageRank算法,传统的PageRank算法仅根据用户之间的链接数量来确定用户的权重,存在主题偏移的问题,本发明引入权威值转移概率,考虑具有问答关系的用户之间的权威值转移概率以及新问题与主题之间的距离因素;并引入用户的最近活跃度和情感倾向性来均衡权威度的权重,避免权威性带来的偏差。
(2)本公开结合用户的兴趣度、权威性、最近活跃度以及情感倾向性,为用户推荐最合适的答题者,确保任务合理分配。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本申请,并不构成对本公开的不当限定。
图1是实施例一基于众智网络的问答任务分配方法的流程图;
图2是实施例二基于众智网络的问答任务分配系统的结构图。
具体实施方式
下面结合附图与实施例对本公开作进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本公开提供进一步的说明。除非另有指明,本公开使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例一
为了高效、精准地实现用户问题和资源的供需匹配,有效缓解在线问答平台中提问者被动等待用户回答且得不到满意回答的情况,本实施例提供了一种基于众智网络的问答任务分配方法,通过众智网络智能搜索到的用户进行建模,并引用一种主动匹配机制,使得最合适的问题能够推送到最合适的用户来解答。
请参阅附图1,所述基于众智网络的问答任务分配方法包括以下步骤:
S101,获取用户发布的待解决新问题。
S102,搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,距离近的用户对新问题的兴趣度高,从而筛选出兴趣度高的用户。
具体地,通过众智网络搜索用户历史提出的问题和问题答案,采用BTM主题模型对语料库、用户历史回答过的问题答案及历史提出的问题进行建模,得到用户文档集合的主题概率分布,即用户的兴趣主题分布,计算用户的兴趣主题与新问题的距离,根据用户的兴趣主题与待解决新问题的距离,获得用户对新问题的兴趣度,距离近的用户对新问题的兴趣度高,从而得到兴趣度高的用户。
具体地,所述步骤102的具体实现方式如下:
S1021,在整个语料库上进行建模,采用BTM主题模型生成语料库中所有词对b,计算每个词对b的联合概率。
具体地,所述采用BTM主题模型生成语料库中词对b的具体实现过程如下:
从词对对应的多项分布θ中抽取一个主题z;从抽取的主题z所对应的多项分布
Figure BDA0002056233950000071
中抽取构成词对b的两个单词ωi,ωj;重复迭代此过程,直至生成短文本语料库中所有的词对。
所述词对b的联合概率计算公式为:
P(b)=∑zP(z)P(ωi|z)P(ωj|z)=∑zθzφi|zφj|z;(1)
其中,θz为主题Z的多项分布;φi|z为单词ωi的多项分布;φj|z为单词ωj的多项分布。
S1022,在用户历史回答过的问题答案及历史提出的问题进行建模,将用户历史回复和提问的问题题目构成文档,采用BTM主题模型生成文档中所有词对,计算文档的主题概率分布,即用户的兴趣主题分布。
具体地,将用户历史回答的所有问题的题目和历史提出的问题的题目构成一个文档,从文档中提取出词对,利用整个语料库中生成的词对来学习文档中短文本的主题,即对用户的历史回复和提问的问题题目的文档中所有词对建模,假设文档的主题概率等于从这个文档中生成的词对的主题概率期望值:
P(z|d)=∑bP(z|b)P(b|d);(2)
在(2)式中,根据BTM的参数估计,通过贝叶斯公式得到P(z|b)为:
Figure BDA0002056233950000072
在(2)式中,将文档d中词对的经验分布作为P(b|d)的估计值:
Figure BDA0002056233950000073
在(4)式中,nd(b)表示文档d中词对b出现的次数。
S1023,采用欧氏距离计算用户的兴趣主题与新问题q的距离D(ui,q),距离近的用户对新问题的兴趣度高,从而得到的最高的兴趣度Dmax(ui,q),该最高的兴趣度Dmax(ui,q)对应的用户为兴趣度高的用户。
本实施例获得兴趣度高的用户,缩小计算范围,提高效率,因为只有对新问题兴趣度高的用户才有可能回答该待解决新问题,筛选出兴趣度高的用户后,计算他们的权威性、情感倾向性以及最近活跃度,并进行后续的匹配。
S103,计算兴趣度高的用户的权威性。
具体地,采用基于主题的PageRank算法,引入兴趣主题分布因素来对PageRank算法进行改进,计算兴趣度高的用户的权威度。
具体地,所述步骤103的具体实现方式如下:
S1031:构建用户之间问答关系。
在PageRank算法的基础上,构建一个用户问答关系图G=(U,E),U代表问答的用户集合,E代表用户之间的问答关系,箭头由提问者指向回答者,其中,ui∈U表示为一个用户,eij∈E表示用户ui到用户uj之间的问答交互关系,公式如下:
Figure BDA0002056233950000081
其中,PR(ui)代表用户ui的PR值,d代表阻尼系数,取值范围是0<d<1;PR(uj)代表链接到用户ui的用户uj的PR值;C(Tj)代表用户uj链出的网页数量。
S1032:计算用户间权威值转移概率以及兴趣度高的用户在各个主题下的权威度。
具体地,引入兴趣主题分布因素来改进PageRank算法,则在主题z下,提问者ui向回答者uj的权威值转移概率计算公式:
Figure BDA0002056233950000091
其中,lij表示用户uj回答用户ui的问题的个数,Dz(ui,uj)表示在主题z下,用户ui和用户uj主题相似度。则在主题z下,用户ui的权威度为:
Figure BDA0002056233950000092
其中,Authz(ui)表示用户ui在主题z的权威度,N表示用户总数。
S1033,利用兴趣度高的用户在各个主题下的权威度,计算兴趣度高的用户对新问题的权威度。
具体地,兴趣度高的用户ui对新问题q的权威度为:
Figure BDA0002056233950000093
其中,Auth(ui,q)表示用户ui对新问题q的权威度,Dz(q,z)表示新问题q到主题z的距离。
本实施例改进传统的PageRank算法,引入具有问答关系的用户之间的权威值转移概率以及新问题与主题之间的距离两个因素,对用户的权威性进行评价,均衡权威性可能带来的偏差。
S104,对兴趣度高的用户的最近活跃度和情感倾向性进行分析计算。
具体地,所述步骤104的具体实现方式如下:
S1041,根据兴趣度高的用户历史回答时间与新问题的时间间隔,计算兴趣度高的用户最近活跃度。
具体地,所述兴趣度高的用户ui的最近活跃度计算公式如下:
Figure BDA0002056233950000094
其中,tq表示新问题发布时间,t表示兴趣度高的用户ui最近活跃时间。
将AC(ui)映射到[0,1]区间,得到兴趣度高的用户ui的最近活跃度,计算公式如下:
Figure BDA0002056233950000101
其中,maxAC(u′)表示最近最活跃的用户的活跃度。
S1042,根据兴趣度高的用户获得的历史评价,计算其他用户对其的情感倾向性,值越大,情感倾向性越高,反之,情感倾向性越低。
具体地,所述步骤1042中,根据兴趣度高的用户获得的历史评价,计算其他用户对其的情感倾向性,具体实现过程如下:
首先,将兴趣度高的用户ui被回复文本作为待分析文本,抽取待分析文本的评价词W。
在本实施例中,所述待分析文本的评价词W的抽取方式采用词性标注算法,主要是将形容词和副词作为评价词。
其次,选择“好”和“坏”作为基准词,对于兴趣度高的用户ui,每个评价词wj∈W,基于点互信息计算其语义倾向性:
SO(ui)=PMI(wj,好)-PMI(wj,坏);(11)
在式(11)中,点互信息为:
Figure BDA0002056233950000102
在式(12)中,P(word1&word2)表示word1和word2同时出现的概率,P(wordj)表示词wordj单独出现的概率。
最后,计算句子的平均语义倾向性。
具体地,句子的平均语义倾向性的计算公式如下:
Figure BDA0002056233950000111
其中,SO(ui)为评价词wj的语义倾向性。
如果ZSO(ui)>0,表示情感极性为正面。反之,如果ZSO(ui)<0,表示句子情感极性为负面。
本实施例引入用户的最近活跃度和情感倾向性来均衡权威度的权重,避免权威性带来的偏差。
S105,根据得到的兴趣度高的用户权威性、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度。
具体地,所述兴趣度高的用户匹配度的具体计算公式如下:
MV(ui)=Auth(ui,q)×ZAC(ui)×ωZSO(ui)(14)
其中,Auth(ui,q)为;ZAC(ui)为;ZSO(ui)为;ω为调节情感倾向性的重要程度。
S106,将待解决新问题分配给匹配度高的用户进行解答,将解答结果反馈给提出新问题的用户。
本实施例提出的基于众智网络的问答任务分配方法,通过众智网络智能搜索到的用户进行建模,并引用一种主动匹配机制,使得最合适的问题能够推送到最合适的用户来解答,有效缓解在线问答平台中提问者被动等待用户回答且得不到满意回答的情况,实现了高效、精准地实现用户问题和资源的供需匹配。
实施例二
本实施例提供一种基于众智网络的问答任务分配系统,请参阅附图2,该系统包括问题获取模块201、兴趣度分析模块202、权威性分析模块203、权威性均衡模块204及分析匹配模块205。
具体地,所述问题获取模块201,用于获取用户发布的待解决新问题。
所述兴趣度分析模块202,用于搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,距离近的用户对新问题的兴趣度高,从而筛选出兴趣度高的用户。
所述权威性分析模块203,用于基于兴趣度分析模块中分析出的兴趣度高的用户,采用改进的PageRank算法进行用户与新问题之间权威性分析。
所述权威性均衡模块204,用于基于兴趣度分析模块中分析出的兴趣度高的用户,计算兴趣度高的用户的最近活跃度和情感倾向性。
所述分析匹配模块205,用于根据得到的兴趣度高的用户权威性、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待新问题发送给匹配度高的用户进行解答,将解答结果反馈给用户。
在本实施例中,所述兴趣度分析模块202具体用于:
通过众智网络搜索用户历史提出的问题和问题答案,采用BTM主题模型对语料库、用户历史回答过的问题答案及历史提出的问题进行建模,得到用户文档集合的主题概率分布,即用户的兴趣主题分布,计算用户的兴趣主题与新问题的距离,根据用户的兴趣主题与待解决新问题的距离,获得用户对新问题的兴趣度,距离近的用户对新问题的兴趣度高,从而得到兴趣度高的用户。
在本实施例中,所述权威性分析模块203具体用于:
在PageRank算法的基础上,构建一个用户问答关系图G=(U,E),U代表问答的用户集合,E代表用户之间的问答关系;
计算用户间权威值转移概率以及兴趣度高的用户在各个主题下的权威度;
利用兴趣度高的用户在各个主题下的权威度,计算兴趣度高的用户对新问题的权威度。
在本实施例中,所述权威性均衡模块204具体用于:
根据兴趣度高的用户历史回答时间与新问题的时间间隔,计算兴趣度高的用户最近活跃度;
根据兴趣度高的用户获得的历史评价,计算其他用户对其的情感倾向性,值越大,情感倾向性越高,反之,情感倾向性越低。
本实施例提出的基于众智网络的问答任务分配系统还包括用户管理模块,所述用户管理模块主要用于维护用户的基本信息和操作行为等,并且从数据库中提取这些信息用以构建用户模型,计算用户的权重,以此模型来表征其兴趣、偏好等。
本实施例提出的基于众智网络的问答任务分配系统,通过兴趣度分析模块采用众智网络智能搜索到的用户进行建模,并采用分析匹配模块,使得最合适的问题能够推送到最合适的用户来解答,有效缓解在线问答平台中提问者被动等待用户回答且得不到满意回答的情况,实现了高效、精准地实现用户问题和资源的供需匹配。
实施例三
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如图1所示的基于众智网络的问答任务分配方法中的步骤。
实施例四
本实施例提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如图1所示的基于众智网络的问答任务分配中的步骤。
本领域内的技术人员应明白,本公开的实施例可提供为方法、系统、或计算机程序产品。因此,本公开可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本公开是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims (8)

1.一种基于网络的问答任务分配方法,其特征是,包括以下步骤:
获取用户发布的待解决新问题;
搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,距离近的用户对新问题的兴趣度高,得到的最高的兴趣度,获得该最高的兴趣度对应的用户为兴趣度高的用户;
计算兴趣度高的用户的权威度;
计算兴趣度高的用户的最近活跃度和情感倾向性;
根据得到的兴趣度高的用户权威度、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待解决新问题分配给匹配度高的用户;
用户匹配度的具体计算公式如下:
MV(ui)=Auth(ui,q)×ZAC(ui)×ωZSO(ui);
其中,Auth(ui,q)表示用户ui对新问题q的权威度;ω为调节情感倾向性的重要程度;所述兴趣度高的用户的权威度的计算方法为:
构建用户之间问答关系图;
计算在各个主题下用户间权威值转移概率,利用在各个主题下用户间权威值转移概率,计算在各个主题下兴趣度高的用户的权威度;具体为:
在主题z下,提问者ui向回答者uj的权威值转移概率计算公式:
Figure FDA0002474347540000011
其中,lij表示用户uj回答用户ui的问题的个数,Dz(ui,uj)表示在主题z下,用户ui和用户uj主题相似度;
在主题z下,用户ui的权威度为:
Figure FDA0002474347540000021
其中,Authz(ui)表示用户ui在主题z的权威度,N表示用户总数,d代表阻尼系数;
利用在各个主题下兴趣度高的用户的权威度和新问题与各个主题之间的距离,计算兴趣度高的用户对新问题的权威度;具体为:
兴趣度高的用户ui对新问题q的权威度为:
Figure FDA0002474347540000022
其中,Auth(ui,q)表示用户ui对新问题q的权威度,Dz(q,z)表示新问题q到主题z的距离。
2.根据权利要求1所述的基于网络的问答任务分配方法,其特征是,所述兴趣度高的用户的获得方法具体为:
通过众智网络搜索用户历史提出的问题及回答过的问题答案;
采用BTM主题模型生成语料库中所有词对,计算每个词对的联合概率;
将用户历史提出的问题题目及回答过的问题题目构成文档,从文档中提取出词对,利用整个语料库中生成的词对学习文档中所有词对的主题,得到用户的主题分布;
采用欧氏距离计算用户的兴趣主题与新问题q的距离D(ui,q),距离近的用户对新问题的兴趣度高,从而得到的最高的兴趣度Dmax(ui,q),该最高的兴趣度Dmax(ui,q)对应的用户为兴趣度高的用户。
3.根据权利要求1所述的基于网络的问答任务分配方法,其特征是,所述兴趣度高的用户的最近活跃度的计算方法为:
根据兴趣度高的用户历史回答时间与新问题发布时间的时间间隔,计算兴趣度高的用户最近活跃度,并对兴趣度高的用户最近活跃度进行归一化处理。
4.根据权利要求1所述的基于网络的问答任务分配方法,其特征是,所述兴趣度高的用户的情感倾向性的计算方法为:
获取兴趣度高的用户得到的历史评价,将其作为待分析文本,并抽取待分析文本中所有评价词;
选择基准词,基于任意每个评价词与基准词的点互信息,计算每个评价词的语义倾向性;
将所有评价词的语义倾向性求和并取平均,得到句子的平均语义倾向性,即为兴趣度高的用户的情感倾向性。
5.根据权利要求1所述的基于网络的问答任务分配方法,其特征是,所述兴趣度高的用户匹配度的计算方法为:
将得到的兴趣度高的用户权威度、最近活跃度和情感倾向性相乘,得到兴趣度高的用户匹配度。
6.一种基于网络的问答任务分配系统,其特征是,包括:
问题获取模块,用于获取用户发布的待解决新问题;
兴趣度分析模块,用于搜索用户历史提出的问题及问题答案,挖掘用户的主题分布,计算用户主题与新问题的距离,距离近的用户对新问题的兴趣度高,得到的最高的兴趣度,获得该最高的兴趣度对应的用户为兴趣度高的用户;
权威性分析模块,计算兴趣度高的用户的权威度;
权威性均衡模块,用于计算兴趣度高的用户的最近活跃度和情感倾向性;
分析匹配模块,用于根据得到的兴趣度高的用户权威度、最近活跃度和情感倾向性,计算兴趣度高的用户匹配度,将待解决新问题分配给匹配度高的用户;
用户匹配度的具体计算公式如下:
MV(ui)=Auth(ui,q)×ZAC(ui)×ωZSO(ui);
其中,Auth(ui,q)表示用户ui对新问题q的权威度;ω为调节情感倾向性的重要程度;
所述权威性分析模块具体用于:
构建用户之间问答关系图;
计算在各个主题下用户间权威值转移概率,利用在各个主题下用户间权威值转移概率,计算在各个主题下兴趣度高的用户的权威度;具体为:
在主题z下,提问者ui向回答者uj的权威值转移概率计算公式:
Figure FDA0002474347540000041
其中,lij表示用户uj回答用户ui的问题的个数,Dz(ui,uj)表示在主题z下,用户ui和用户uj主题相似度;
在主题z下,用户ui的权威度为:
Figure FDA0002474347540000042
其中,Authz(ui)表示用户ui在主题z的权威度,N表示用户总数,d代表阻尼系数;
利用在各个主题下兴趣度高的用户的权威度和新问题与各个主题之间的距离,计算兴趣度高的用户对新问题的权威度;具体为:
兴趣度高的用户ui对新问题q的权威度为:
Figure FDA0002474347540000043
其中,Auth(ui,q)表示用户ui对新问题q的权威度,Dz(q,z)表示新问题q到主题z的距离。
7.一种计算机可读存储介质,其上存储有计算机程序,其特征是,该程序被处理器执行时实现如权利要求1-5中任一项所述的基于网络的问答任务分配方法中的步骤。
8.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征是,所述处理器执行所述程序时实现如权利要求1-5中任一项所述的基于网络的问答任务分配方法中的步骤。
CN201910390185.4A 2019-05-10 2019-05-10 一种基于众智网络的问答任务分配方法及系统 Active CN110111010B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910390185.4A CN110111010B (zh) 2019-05-10 2019-05-10 一种基于众智网络的问答任务分配方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910390185.4A CN110111010B (zh) 2019-05-10 2019-05-10 一种基于众智网络的问答任务分配方法及系统

Publications (2)

Publication Number Publication Date
CN110111010A CN110111010A (zh) 2019-08-09
CN110111010B true CN110111010B (zh) 2020-07-03

Family

ID=67489335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910390185.4A Active CN110111010B (zh) 2019-05-10 2019-05-10 一种基于众智网络的问答任务分配方法及系统

Country Status (1)

Country Link
CN (1) CN110111010B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490444A (zh) * 2019-08-13 2019-11-22 新华智云科技有限公司 标注任务分配方法、装置、系统及存储介质
CN110910180B (zh) * 2019-12-02 2021-02-26 北京嘀嘀无限科技发展有限公司 信息推送方法、装置、电子设备和存储介质
CN111667200B (zh) * 2020-07-09 2023-09-19 腾讯科技(深圳)有限公司 一种权威度确定方法、装置、设备及存储介质
CN112765326B (zh) * 2021-01-27 2023-04-21 西安电子科技大学 一种问答社区专家推荐方法、系统及应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104572734B (zh) * 2013-10-23 2019-04-30 腾讯科技(深圳)有限公司 问题推荐方法、装置及系统
CN107562836B (zh) * 2017-06-07 2020-10-30 北京航空航天大学 基于主题模型和机器学习的回答者推荐方法
CN109408726B (zh) * 2018-11-09 2022-02-08 大连海事大学 问答网站中问题回答者推荐方法

Also Published As

Publication number Publication date
CN110111010A (zh) 2019-08-09

Similar Documents

Publication Publication Date Title
CN110111010B (zh) 一种基于众智网络的问答任务分配方法及系统
García et al. An architecture for making recommendations to courseware authors using association rule mining and collaborative filtering
Hasibuan et al. Model Detecting Learning Styles with Artificial Neural Network.
US10102503B2 (en) Scalable response prediction using personalized recommendation models
US9262725B2 (en) Mental modeling for modifying expert model
CN107169043A (zh) 一种基于标准答案的知识点自动提取方法及系统
CN110321421B (zh) 用于网站知识社区系统的专家推荐方法及计算机存储介质
Wang et al. Attention-based CNN for personalized course recommendations for MOOC learners
Marin Vargas et al. Verbal communication in robotics: a study on salient terms, research fields and trends in the last decades based on a computational linguistic analysis
CN113821527A (zh) 哈希码的生成方法、装置、计算机设备及存储介质
Dhoolia et al. A cognitive system for business and technical support: A case study
Zhang et al. Using large-scale heterogeneous graph representation learning for code review recommendations at microsoft
Srba et al. Encouragement of collaborative learning based on dynamic groups
CN115934899A (zh) 一种it行业简历推荐方法、装置、电子设备及储存介质
Lee et al. Coherence analysis of research and education using topic modeling
KR20200109704A (ko) 논문심사 스케줄별 논문지도 콘텐츠를 제공하는 논문 컨설팅 서비스 제공 시스템
CN115795007A (zh) 智能问答方法、智能问答装置、电子设备及存储介质
Vitoria et al. A review of mathematical modelling in educational research in Indonesia
Boeva et al. Identifying a group of subject experts using formal concept analysis
Tennakoon et al. An interactive application for university students to reduce the industry-academia skill gap in the software engineering field
Hanini et al. Text Modeling in Adaptive Educational Chat Room
de Almeida Lima et al. Educational Data Mining: A Hybrid Approach to Predicting Academic Performance of Students.
Alahmed et al. “How Does ChatGPT Work” Examining Functionality To The Creative AI CHATGPT on X's (Twitter) Platform
Oreški et al. Assessment and comparison of meta-features for educational chatbots data and survey data
Toba et al. Groups Allocation Based on Sentiment-Epistemic Analysis in Online Learning Environment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant