CN106446287A - 面向众包场景问答系统答案聚合方法和系统 - Google Patents

面向众包场景问答系统答案聚合方法和系统 Download PDF

Info

Publication number
CN106446287A
CN106446287A CN201610982584.6A CN201610982584A CN106446287A CN 106446287 A CN106446287 A CN 106446287A CN 201610982584 A CN201610982584 A CN 201610982584A CN 106446287 A CN106446287 A CN 106446287A
Authority
CN
China
Prior art keywords
answer
text
similar
rent
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610982584.6A
Other languages
English (en)
Inventor
宋美娜
鄂海红
郑聪
宋俊德
王子慧
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN201610982584.6A priority Critical patent/CN106446287A/zh
Publication of CN106446287A publication Critical patent/CN106446287A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种面向众包场景问答系统答案聚合方法和系统,该方法包括:获取针对指定问题的多条答复文本,其中,每条答复文本中包括其它用户的支持票和反对票;对答复文本进行文本分析主题和关键词,进而生成向量集;对所有向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票;向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。本发明具有如下优点:向提问者提供答案的分类和与之对应的支持票和反对票的统计结果,省去了提问者大量阅读意思相近答案的冗余时间,为提问者呈现更具普遍性的舆论支持度情况,能够帮助用户更加高效地做出自己的判断和决策。

Description

面向众包场景问答系统答案聚合方法和系统
技术领域
本发明涉及文本处理技术领域,具体涉及一种面向众包场景问答系统答案聚合方法和系统。
背景技术
当前,针对众包的解决问题的方法得到了广泛的应用。大量有困难需要解决或有问题需要回答的人会到采取了众包模式的Web网站上把问题抛出,由分布于世界各地、自愿解决该困难或问题的工人(worker)有偿或无偿地共同提出解决问题的对策,供提问者参考。
问答系统是信息检索系统的一种高级形式,它能用准确、简洁的自然语言回答用户用自然语言提出的问题,常见的问答系统有知乎、百度知道、北邮人论坛等。
由于提供答案的工人具备不同的能力和可靠性,所以,在众包场景中,一个重要的挑战就是:如何确保问题解决方案的质量。目前,多数众包类网站采用最普遍的方法就是多数投票,即不论是对于封闭式问题还是开放性问题,系统判定得票数最多的答案为最佳的解决方案或将该方案的排名提前。这种多数投票机制的一个重大弊端是,如果问题具有较强的迷惑性或者某一给出错误答案的工人具备较大的社会影响力进而引发巨大的导向性,那么错误的答案易占据绝大多数,从而对提问者造成一定程度的误导。为了避免多数投票的弊端,一些网站或研究人员认为不能给所有的票赋予同样的权重,同时应该对每一个工人和问题进行独立建模,通过利用EM算法等启发式算法反复迭代运算,直至计算出最终答案。但众所周知,类似EM算法的启发式算法计算复杂度较高,当网站规模较大,问题以及回答问题的工人都达到一定规模时,EM算法的时间复杂度将是无法接受的。
众包场景下的问答系统还存在一个比较明显的问题:某个热门问题或话题性问题的答案数量可能巨大,少则数十条,多则成百上千条,且其中很可能包含大量主题相似的回答,如果提问者逐条阅读,这将浪费大量时间,如何最大限度节约提问者阅读答案的时间也是一个重要的问题。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的一个目的在于提出一种面向众包场景问答系统答案聚合方法,对众多答案进行聚合、排序,复杂度低,方便提问者阅读并迅速了解答案主题。
为了实现上述目的,本发明的实施例公开了一种面向众包场景问答系统答案聚合方法,包括以下步骤:S1:获取针对指定问题的多条答复文本,其中,每条所述答复文本中包括其它用户的支持票和反对票;S2:对每条所述答复文本进行文本分析得到所述答复文本的主题和关键词,根据所述答复文本的主题和关键词生成与所述答复文本对应的向量集;S3:对所述多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票;S4:向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
根据本发明实施例的面向众包场景问答系统答案聚合方法,针对提出问题的所有答案进行分析聚合得到多个分类结果和针对每个分类结果的支持票和反对票的统计结果,进而向提问者提供答案的分类和与之对应的支持票和反对票的统计结果,省去了提问者大量阅读意思相近答案的冗余时间,为提问者呈现更具普遍性的舆论支持度情况,能够帮助用户更加高效地做出自己的判断和决策。
另外,根据本发明上述实施例的面向众包场景问答系统答案聚合方法,还可以具有如下附加的技术特征:
进一步地,使用LDA模型进行文本分析。
进一步地,使用非参数贝叶斯模型中的印度自助餐过程对所有向量集进行聚类。
为此,本发明的另一个目的在于提出一种面向众包场景问答系统答案聚合系统,对众多答案进行聚合、排序,复杂度低,方便提问者阅读并迅速了解答案主题。
为了实现上述目的,本发明的实施例公开了一种面向众包场景问答系统答案聚合系统,包括:信息采集模块,用于获取针对指定问题的多条答复文本,其中,每条所述答复文本中包括其它用户的支持票和反对票;文本分析模块,用于对每条所述答复文本进行文本分析得到所述答复文本的主题和关键词,根据所述答复文本的主题和关键词生成与所述答复文本对应的向量集;聚类模块,用于对所述多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票;以及结果显示模块,用于向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
根据本发明实施例的面向众包场景问答系统答案聚合系统,针对提出问题的所有答案进行分析聚合得到多个分类结果和针对每个分类结果的支持票和反对票的统计结果,进而向提问者提供答案的分类和与之对应的支持票和反对票的统计结果,省去了提问者大量阅读意思相近答案的冗余时间,为提问者呈现更具普遍性的舆论支持度情况,能够帮助用户更加高效的做出自己的判断和决策。
另外,根据本发明上述实施例的面向众包场景问答系统答案聚合系统,还可以具有如下附加的技术特征:
进一步地,所述文本分析模块使用LDA模型进行文本分析。
进一步地,所述聚类模块使用非参数贝叶斯模型中的印度自助餐过程对所有向量集进行聚类。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点,从下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本发明实施例的面向众包场景问答系统答案聚合方法的流程图;
图2是本发明实施例的面向众包场景问答系统答案聚合系统的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
参照下面的描述和附图,将清楚本发明的实施例的这些和其他方面。在这些描述和附图中,具体公开了本发明的实施例中的一些特定实施方式,来表示实施本发明的实施例的原理的一些方式,但是应当理解,本发明的实施例的范围不受此限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
以下结合附图描述本发明。
图1是本发明实施例的面向众包场景问答系统答案聚合方法的流程图。如图1所示,一种面向众包场景问答系统答案聚合方法,包括以下步骤:
S1:获取针对指定问题的多条答复文本。其中,每条答复文本中包括其它用户的支持票和反对票。
具体地,提问者登录到网站,并在特定页面完成提问内容,这里特指问答类的开放性问题,不包含设计方案征集等其他类型的开放性问题。网站接收到用户提出的问题后,发布到网站首页或者所有对回答问题感兴趣的人都能看到的页面,等候对这个问题了解并感兴趣的人进行作答。
对于回答问题的第一个人,在答案文本框中输入完成相应的问题答案后,点击确定,答案即可显示到该条提问下面,并在该条答案旁边显示支持或反对的按钮。对于后续回答问题的人,既可以通过答案文本框输入自己的看法,也可以阅读之前的答案,直接点击支持或者反对来表达自己的意见。网站根据一定的规则决定何时收集答案作为答复文本。
S2:对每条答复文本进行文本分析得到答复文本的主题和关键词,根据答复文本的主题和关键词生成与答复文本对应的向量集。
具体地,网站根据指定规则对答案集进行文本分析。文本分析是对文本的表示及其特征项的选取,它把从文本中抽取出的特征词进行量化来表示文本信息。
LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,认为一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语”这样一个过程得到。文档到主题服从多项式分布,主题到词服从多项式分布。LDA是一种非监督机器学习技术,可以用来识别大规模文档集(document collection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bag of words)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为易于建模的数字信息。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。
在本发明的一个实施例中,使用LDA算法对每个问题对应的答案集进行文本分析,由于文本分析既可以得出每条文本对应的主题概率分布和每个主题下属包含的关键词,所以当文本分析结束后,可以将每条文本答案量化为一个高维向量,并且可以知道每条答案包含主题下的关键词有哪些,从而对每条复杂的文本内容既进行了数据量化又进行了关键词概括。
S3:对多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票。
具体地,对于通过LDA分析得到的高维向量进行聚类。在本发明的一个实施例中,使用非参数贝叶斯模型中的印度自助餐进行聚类。使用印度自助餐过程时,不需事先指定聚类类别数量,完成印度自助餐过程中一些模型参数设定后,即可对LDA分析得到的向量集进行聚类,聚类完成后可以确定哪些答案内容是相似的,同时也可以知道最终答案被聚合成了几类。在聚类完成后,相似的答案被归为同一类。同时,对相似答案的同意票和反对票分别加和。
S4:向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
具体地,网站在向用户展现答案时,同类答案便可以只向用户展示其中的一个或几个。统计某一类答案共计有多少同意票和反对票。
本发明实施例的面向众包场景问答系统答案聚合方法,向提问者提供答案的分类和与之对应的支持票和反对票的统计结果,既节约了用户阅读相似答案的多余时间,也帮助用户了解对于自己提出的问题,所有的答案大致可以浓缩为哪几个类别,且每个类别在大众中的支持度和反对度分别是怎样的。此外,还可以简要向提问人展示该类问题包含了哪些热门关键词,可以方便用户快速了解某一类答案表达了怎样的核心内容。
图2是本发明一个实施例的面向众包场景问答系统答案聚合系统的结构框图。如图2所示,一种面向众包场景问答系统答案聚合系统,包括:信息采集模块210、文本分析模块220、聚类模块230和结果显示模块240。
其中,信息采集模块210用于获取针对指定问题的多条答复文本,其中,每条答复文本中包括其它用户的支持票和反对票。文本分析模块220用于对每条答复文本进行文本分析得到答复文本的主题和关键词,根据答复文本的主题和关键词生成与答复文本对应的向量集。聚类模块230用于对多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票。结果显示模块240用于向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
在本发明的一个实施例中,文本分析模块220使用LDA模型进行文本分析。
在本发明的一个实施例中,聚类模块230使用非参数贝叶斯模型中的印度自助餐过程对所有向量集进行聚类。
需要说明的是,本发明实施例的面向众包场景问答系统答案聚合系统的具体实施方式和本发明实施例的面向众包场景问答系统答案聚合方法的具体实施方式类似,具体参见方法部分的描述,为了减少冗余,此处不做赘述。
另外,本发明实施例的面向众包场景问答系统答案聚合方法和系统的其它构成以及作用,对于本领域的技术人员而言都是已知的,为了减少冗余,不做赘述。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下,可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

Claims (6)

1.一种面向众包场景问答系统答案聚合方法,其特征在于,包括以下步骤:
S1:获取针对指定问题的多条答复文本,其中,每条所述答复文本中包括其它用户的支持票和反对票;
S2:对每条所述答复文本进行文本分析得到所述答复文本的主题和关键词,根据所述答复文本的主题和关键词生成与所述答复文本对应的向量集;
S3:对所述多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票;
S4:向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
2.根据权利要求1所述的面向众包场景问答系统答案聚合方法,其特征在于,使用LDA模型进行文本分析。
3.根据权利要求1所述的面向众包场景问答系统答案聚合方法,其特征在于,使用非参数贝叶斯模型中的印度自助餐过程对所有向量集进行聚类。
4.一种面向众包场景问答系统答案聚合系统,其特征在于,包括:
信息采集模块,用于获取针对指定问题的多条答复文本,其中,每条所述答复文本中包括其它用户的支持票和反对票;
文本分析模块,用于对每条所述答复文本进行文本分析得到所述答复文本的主题和关键词,根据所述答复文本的主题和关键词生成与所述答复文本对应的向量集;
聚类模块,用于对所述多条答复文本对应的多条向量集进行聚类,将所有相似答复合并为同一类,对每类相似答复统计支持票和反对票;以及
结果显示模块,用于向提问者提供每类相似答复中预定数量的答复和每类相似答复的支持票和反对票的统计结果。
5.根据权利要求4所述的面向众包场景问答系统答案聚合系统,其特征在于,所述文本分析模块使用LDA模型进行文本分析。
6.根据权利要求5所述的面向众包场景问答系统答案聚合系统,其特征在于,所述聚类模块使用非参数贝叶斯模型中的印度自助餐过程对所有向量集进行聚类。
CN201610982584.6A 2016-11-08 2016-11-08 面向众包场景问答系统答案聚合方法和系统 Pending CN106446287A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610982584.6A CN106446287A (zh) 2016-11-08 2016-11-08 面向众包场景问答系统答案聚合方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610982584.6A CN106446287A (zh) 2016-11-08 2016-11-08 面向众包场景问答系统答案聚合方法和系统

Publications (1)

Publication Number Publication Date
CN106446287A true CN106446287A (zh) 2017-02-22

Family

ID=58208702

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610982584.6A Pending CN106446287A (zh) 2016-11-08 2016-11-08 面向众包场景问答系统答案聚合方法和系统

Country Status (1)

Country Link
CN (1) CN106446287A (zh)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108390A (zh) * 2017-11-15 2018-06-01 北京达佳互联信息技术有限公司 数据分发方法和装置
CN108197202A (zh) * 2017-12-28 2018-06-22 百度在线网络技术(北京)有限公司 众包任务的数据校验方法、装置、服务器及存储介质
CN108596800A (zh) * 2018-04-13 2018-09-28 北京交通大学 一种基于贝叶斯的开放性答案决策方法
CN109460502A (zh) * 2018-09-14 2019-03-12 广州神马移动信息科技有限公司 答案聚类方法及其装置、电子设备、计算机可读介质
CN109471943A (zh) * 2018-11-12 2019-03-15 平安科技(深圳)有限公司 一种基于数据处理的众包任务答案确定方法及相关设备
CN109815317A (zh) * 2018-12-13 2019-05-28 重庆德塔蔓灵科技有限公司 一种排序学习方法、系统、计算机可读存储介质及设备
CN109902756A (zh) * 2019-03-07 2019-06-18 重庆恢恢信息技术有限公司 一种基于主动学习的众包机制辅助排序方法和系统
CN111223031A (zh) * 2019-06-17 2020-06-02 苏州信度投资管理有限公司 一种选择决策参考软件系统
CN111382144A (zh) * 2018-12-27 2020-07-07 阿里巴巴集团控股有限公司 信息处理方法及装置、存储介质及处理器
CN111694941A (zh) * 2020-05-22 2020-09-22 腾讯科技(深圳)有限公司 一种回复信息确定方法、装置、存储介质及电子设备
CN112101419A (zh) * 2020-08-17 2020-12-18 清华大学 基于众包的高效分类系统及其创建、使用方法
RU2744032C2 (ru) * 2019-04-15 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения результата выполнения задачи в краудсорсинговой среде
CN113836275A (zh) * 2020-06-08 2021-12-24 菜鸟智能物流控股有限公司 对话模型建立方法及装置
US11386299B2 (en) 2018-11-16 2022-07-12 Yandex Europe Ag Method of completing a task
US11416773B2 (en) 2019-05-27 2022-08-16 Yandex Europe Ag Method and system for determining result for task executed in crowd-sourced environment
US11475387B2 (en) 2019-09-09 2022-10-18 Yandex Europe Ag Method and system for determining productivity rate of user in computer-implemented crowd-sourced environment
US11481650B2 (en) 2019-11-05 2022-10-25 Yandex Europe Ag Method and system for selecting label from plurality of labels for task in crowd-sourced environment
US11727329B2 (en) 2020-02-14 2023-08-15 Yandex Europe Ag Method and system for receiving label for digital task executed within crowd-sourced environment

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111408A1 (en) * 2001-01-18 2004-06-10 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
CN1790332A (zh) * 2005-12-28 2006-06-21 刘文印 一种问题答案的阅读浏览显示方法及其系统
CN106021388A (zh) * 2016-05-11 2016-10-12 华南理工大学 基于lda主题聚类的微信公众号的分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111408A1 (en) * 2001-01-18 2004-06-10 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
CN1790332A (zh) * 2005-12-28 2006-06-21 刘文印 一种问题答案的阅读浏览显示方法及其系统
CN106021388A (zh) * 2016-05-11 2016-10-12 华南理工大学 基于lda主题聚类的微信公众号的分类方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋万鹏: "短文本相似度计算在用户交互式问答系统中的应用", 《中国博士学位论文全文数据库 信息科技辑》 *

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108390B (zh) * 2017-11-15 2019-02-19 北京达佳互联信息技术有限公司 数据分发方法和装置
CN108108390A (zh) * 2017-11-15 2018-06-01 北京达佳互联信息技术有限公司 数据分发方法和装置
CN108197202A (zh) * 2017-12-28 2018-06-22 百度在线网络技术(北京)有限公司 众包任务的数据校验方法、装置、服务器及存储介质
CN108596800A (zh) * 2018-04-13 2018-09-28 北京交通大学 一种基于贝叶斯的开放性答案决策方法
CN108596800B (zh) * 2018-04-13 2022-05-13 北京交通大学 一种基于贝叶斯的开放性答案决策方法
CN109460502A (zh) * 2018-09-14 2019-03-12 广州神马移动信息科技有限公司 答案聚类方法及其装置、电子设备、计算机可读介质
CN109471943A (zh) * 2018-11-12 2019-03-15 平安科技(深圳)有限公司 一种基于数据处理的众包任务答案确定方法及相关设备
CN109471943B (zh) * 2018-11-12 2024-06-07 平安科技(深圳)有限公司 一种基于数据处理的众包任务答案确定方法及相关设备
US11386299B2 (en) 2018-11-16 2022-07-12 Yandex Europe Ag Method of completing a task
CN109815317A (zh) * 2018-12-13 2019-05-28 重庆德塔蔓灵科技有限公司 一种排序学习方法、系统、计算机可读存储介质及设备
CN111382144B (zh) * 2018-12-27 2023-05-02 阿里巴巴集团控股有限公司 信息处理方法及装置、存储介质及处理器
CN111382144A (zh) * 2018-12-27 2020-07-07 阿里巴巴集团控股有限公司 信息处理方法及装置、存储介质及处理器
CN109902756A (zh) * 2019-03-07 2019-06-18 重庆恢恢信息技术有限公司 一种基于主动学习的众包机制辅助排序方法和系统
RU2744032C2 (ru) * 2019-04-15 2021-03-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и система для определения результата выполнения задачи в краудсорсинговой среде
US11727336B2 (en) 2019-04-15 2023-08-15 Yandex Europe Ag Method and system for determining result for task executed in crowd-sourced environment
US11416773B2 (en) 2019-05-27 2022-08-16 Yandex Europe Ag Method and system for determining result for task executed in crowd-sourced environment
CN111223031A (zh) * 2019-06-17 2020-06-02 苏州信度投资管理有限公司 一种选择决策参考软件系统
US11475387B2 (en) 2019-09-09 2022-10-18 Yandex Europe Ag Method and system for determining productivity rate of user in computer-implemented crowd-sourced environment
US11481650B2 (en) 2019-11-05 2022-10-25 Yandex Europe Ag Method and system for selecting label from plurality of labels for task in crowd-sourced environment
US11727329B2 (en) 2020-02-14 2023-08-15 Yandex Europe Ag Method and system for receiving label for digital task executed within crowd-sourced environment
CN111694941A (zh) * 2020-05-22 2020-09-22 腾讯科技(深圳)有限公司 一种回复信息确定方法、装置、存储介质及电子设备
CN111694941B (zh) * 2020-05-22 2024-01-05 腾讯科技(深圳)有限公司 一种回复信息确定方法、装置、存储介质及电子设备
CN113836275A (zh) * 2020-06-08 2021-12-24 菜鸟智能物流控股有限公司 对话模型建立方法及装置
CN113836275B (zh) * 2020-06-08 2023-09-05 菜鸟智能物流控股有限公司 对话模型建立方法、装置、非易失性存储介质和电子装置
CN112101419A (zh) * 2020-08-17 2020-12-18 清华大学 基于众包的高效分类系统及其创建、使用方法

Similar Documents

Publication Publication Date Title
CN106446287A (zh) 面向众包场景问答系统答案聚合方法和系统
CN109325165B (zh) 网络舆情分析方法、装置及存储介质
Bansal et al. On predicting elections with hybrid topic based sentiment analysis of tweets
CN104820629B (zh) 一种智能的舆情突发事件应急处理系统及方法
CN109829166B (zh) 基于字符级卷积神经网络的民宿顾客意见挖掘方法
Feduhko Development of a software for computer-linguistic verification of socio-demographic profile of web-community member
CN106570109B (zh) 一种通过文本分析自动生成题库知识点的方法
Monroe The five Vs of big data political science introduction to the virtual issue on big data in political science political analysis
CN105843897A (zh) 一种面向垂直领域的智能问答系统
CN113312461A (zh) 基于自然语言处理的智能问答方法、装置、设备及介质
WO2021019831A1 (ja) 管理システム及び管理方法
CN109977291A (zh) 基于物理知识图谱的检索方法、装置、设备及存储介质
CN110598070A (zh) 应用类型识别方法及装置、服务器及存储介质
Dong et al. Micro-blog social moods and Chinese stock market: The influence of emotional valence and arousal on Shanghai Composite Index volume
CN109255012A (zh) 一种机器阅读理解的实现方法以及装置
Cao et al. Topics and trends of the on-line public concerns based on Tianya forum
CN114037545A (zh) 客户推荐方法、装置、设备及存储介质
CN103810170B (zh) 交流平台文本分类方法及装置
CN113887930A (zh) 问答机器人健康度评估方法、装置、设备及存储介质
CN112348417A (zh) 一种基于主成分分析算法的营销价值评估方法及装置
CN113762703A (zh) 确定企业画像的方法和装置、计算设备和存储介质
Tian et al. Research on e-learner personality grouping based on fuzzy clustering analysis
CN114064893A (zh) 一种异常数据审核方法、装置、设备及存储介质
da Rocha et al. A text as unique as a fingerprint: Text analysis and authorship recognition in a Virtual Learning Environment of the Unified Health System in Brazil
CN113935880A (zh) 政策推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170222