CN103226566A - 用于优化小组的系统和方法 - Google Patents

用于优化小组的系统和方法 Download PDF

Info

Publication number
CN103226566A
CN103226566A CN2013100377588A CN201310037758A CN103226566A CN 103226566 A CN103226566 A CN 103226566A CN 2013100377588 A CN2013100377588 A CN 2013100377588A CN 201310037758 A CN201310037758 A CN 201310037758A CN 103226566 A CN103226566 A CN 103226566A
Authority
CN
China
Prior art keywords
group
analyst
tendency
cluster
fundamental analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013100377588A
Other languages
English (en)
Other versions
CN103226566B (zh
Inventor
A·K·巴戈曼
P·K·波诺蒂瑞斯
B·M·格雷厄姆
R·R·文恩三世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN103226566A publication Critical patent/CN103226566A/zh
Application granted granted Critical
Publication of CN103226566B publication Critical patent/CN103226566B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • G06N5/046Forward inferencing; Production systems
    • G06N5/047Pattern matching networks; Rete networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开内容涉及用于优化用于解决问题的小组的系统和方法。该系统包括:小组构建系统,用于从分析者的数据库构建基本分析小组以解决输入问题,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;以及,问题分析系统,收集来自在浸入式环境内操作的基本分析小组的传感器数据,其中,所述问题分析系统包括用于评估所述传感器数据以识别来自基本分析小组的倾向状况的系统,以及包括用于响应于检测到的倾向状况来改变所述浸入式环境中的变量的系统。

Description

用于优化小组的系统和方法
技术领域
本发明涉及组建用于解决问题的小组,并且更特别地,涉及组建用于解决在考虑个体和群体倾向(bias)的浸入式环境内的问题的小组的系统和方法。
背景技术
用于解决问题的小组的选择充满了任意数量的可能问题。个体和群体容易受到所有类型的倾向的影响,所述倾向可能将小组引导到不正确的结论。此外,基于小组的结果可能取决于成员被浸入在其中的环境的类型。
浸入式环境、社会决定制定以及人与系统之间的交互产生用于开发预测性和规定性模型的数据。在交集处是分析学、社会心理学以及浸入式技术。在社会互动范式的上下文内浸入式环境的使用使得能够实现许多想法的智慧,例如,通过遵循Condorcet陪审团原理(jurytheorem)。Condorcet的陪审团原理是与个体的给定群体得到正确决定的相对概率有关的原理。
阻止知识结茧、信息倾泻、决定对立以及对过早假设的依附是数据分析的核心组成部分。数据产生更多数据的加速数据雪崩(avalanche)保持将信息转换成供并行分析消耗的知识的需要。这样的群体、群或小组工作搜寻(work sourcing)产生用于聚合模糊社会决定的初期形式(precursor)。社会或群体动态产生模糊决定或有效误差,所述模糊决定或有效误差随着较高层群体聚合较低层群体的决定而被放大,直至根(root)分析完成。预测性社会决定分析通过推荐小组、社会范式以及浸入式环境来减少小组有效误差,从而对于正确的小组决定最大化个体分析。
发明内容
在第一个方面中,本发明提供了一种用于优化用于解决问题的小组的系统,包括:小组构建系统,用于从分析者的数据库构建基本分析小组以解决输入问题,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;以及问题分析系统,收集来自在浸入式环境内操作的基本分析小组的传感器数据,其中,所述问题分析系统包括用于评估所述传感器数据以识别来自基本分析小组的倾向状况的系统,以及包括用于响应于检测到的倾向状况来改变所述浸入式环境中的变量的系统。
在第二个方面中,本发明提供了一种保存在计算机可读存储介质上的程序产品,所述程序产品用于优化用于解决问题的小组,包括:被配置为从分析者的数据库构建基本分析小组以解决输入问题的程序代码,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;以及被配置为收集来自在浸入式环境内操作的基本分析小组的传感器数据的程序代码,包括被配置为评估所述传感器数据以识别来自基本分析小组的倾向状况的程序代码,以及被配置为响应于检测到的倾向状况来改变所述浸入式环境中的变量的程序代码。
在第三个方面中,本发明提供了一种用于优化用于解决问题的小组的方法,包括:从分析者的数据库构建基本分析小组以解决输入问题,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;收集来自在浸入式环境内操作的基本分析小组的传感器数据;评估所述传感器数据以识别来自基本分析小组的倾向状况;以及响应于检测到的倾向状况来改变所述浸入式环境中的变量。
附图说明
从以下结合附图进行的对于本发明的不同方面的详细描述中,将更容易理解本发明的这些和其他特征。
图1描绘了根据本发明实施例的问题解决系统的系统概况。
图2描绘了根据本发明实施例的小组构建系统。
图3描绘了根据本发明实施例的问题分析系统。
图4描绘了根据本发明实施例的与层次聚类(hierarchicalclustering)算法相关联的树状图。
图5描绘了与图4的树状图相关联的成团(agglomeration)进度表。
图6描绘了根据本发明实施例的贝叶斯信念(Bayesian Belief)网络分类器。
图7描绘了根据本发明实施例的混淆(confusion)矩阵。
这些附图仅仅是示意性的图示,并不意欲描述本发明的具体参数。这些附图意欲仅仅描绘本发明的典型实施例,由此不应该被视为对本发明的范围进行限制。在附图中,同样的附图标记表示同样的元件。
具体实施方式
图1描绘了如下系统的大体概况,该系统用于实施基于输入问题18得出答案24的方法。所提供的计算机系统10包括:(1)小组构建系统12,用于从分析者16的数据库组建基本分析小组20以解决问题18;(2)问题分析系统14,对于基本分析小组20管理问题解决过程(即,分析);以及(3)倾向分类系统15,用于识别和分类可用于促进小组构建系统12和问题分析系统14的倾向。在这里描述的一个说明性实施例中,倾向分类系统15使用游戏环境17来识别、分类和管理倾向。
一旦被组建,基本分析小组20就被分配任务以通过在一个或多个浸入式环境22内进行工作来提供问题18的解决方案24。正如更详细描述的那样,浸入式环境22可被问题分析系统14控制。说明性的浸入式环境22可以例如包括虚拟空间、物理空间、计算机网络、游戏环境等等。
图2描绘了小组构建系统12的更详细视图。小组构建系统12的中心是内核(kernel)函数30,内核函数30分析并聚类来自分析者16的数据库的分析者。分析者16通常对于输入问题14被特征化为属于两种个性类型(特异性(specificity)31和敏感性(sensitivity)33)之一。以特异性为特征的分析者16通常不太可能给出假正类(falsepositive),例如,它们不太可能不正确地回答“是”。相反,以敏感性为特征的分析者16通常不太可能给出假负类(false negative),例如,它们不太可能不正确地回答“否”。小组构建系统12试图将高度特异的一组分析者与高度敏感的一组分析者进行组合。内核函数30可以例如利用基于嗜同性(homophilic)的建模来聚类具有共同特性的分析者16。
敏感性和特异性是在统计学中也被称为分类函数的二元分类测试的性能的统计测量。敏感性(在一些领域中也被称为回覆率)测量本身被正确识别的实际正类的比例(例如,被正确识别为具有症状的生病的人的百分比)。特异性测量被正确识别的负类的比例(例如,被正确识别为没有症状的健康的人的百分比)。
在一个说明性实施例中,内核函数30读入:(1)描述问题14的问题向量;以及(2)描述分析者16的属性向量集合。所有属性向量在相应的成员内,
Figure BDA00002798860400041
属性向量由
Figure BDA00002798860400042
定义。属性可以包括描述相关联的分析者16的任何事物,例如,教育水平、工作经验、内向性格评级、集群性等等。
问题向量pk描述来自预定分类系统的分析主题,以使
Figure BDA00002798860400043
第一函数fm提供成员标准化分数,而第二函数
Figure BDA000027988604000411
使得能够实现问题向量标准化。将维度数据投影到改变的维度空间上的参数内核将数据导航(vectors)到类似的稀疏群体中。函数
Figure BDA00002798860400044
通过权重
Figure BDA00002798860400045
创建输入向量
Figure BDA00002798860400046
与输出向量
Figure BDA00002798860400047
的映射。训练阶段选择使实际分类误差最小化的
Figure BDA00002798860400048
函数g是针对特征向量pk和ui的内核函数30,使得 g ( < u &RightArrow; i , p &RightArrow; k > , w &RightArrow; ) &DoubleLeftRightArrow; g ( S &RightArrow; , w &RightArrow; ) = S &RightArrow; f .
Sp = TN TN + FP
Se = TP TP + FN
其中Sp是特异性,Se是敏感性,TN是真负类的数量,TP是真正类的数量,以及FN是假负类的数量。
内核函数30的输出是两种类型的聚类,即特异聚类32和敏感聚类34。然后,小组组建器36利用对来自每个聚类类型的一个或多个聚类进行组合的层次聚类算法35来构建得到的基本分析小组20。
层次聚类算法35是由要处理的数据的结构以及关于应该如何处理这些数据的行为所定义的。根据该数据结构,分类器遵循严格的分类方法。在第一级,分类器可以是排他的或重叠的。如果每一个对象属于一个分类,那么分类是排他的。然而,如果聚类集合不是不相交的,那么分类器变成重叠的。聚类创建过程是内在或外在的。如果仅仅使用邻近或特征矩阵来学习数据内的分类,那么算法被认为是内在的。然而,数据标签或目标指示外在测量将产生聚类。内在通常被称为无监督的学习,而外在是与有监督的学习同义的。对于外在和内在算法的分类方法内的第三种划分包括层次的和分区的(partitional)。层次聚类是一串分区,其中每一层或层次等级是一个分区。
在数据结构决定之后,分类算法具有针对处理数据的若干种不同行为。在任何分类算法内,可以在任何迭代处选择任何数量的特征。单元的(monothetic)算法每次将使用一个数据特征。可替代地,在分类期间使用所有数据特征被称为多元的(polythetic)。数据特征处理有助于引导算法决定合并或拆分分类或聚类。分类拆分被称为划分的(divisive),而合并被称为成团的。如果所有数据开始于一个分类内,那么方法将最不相关的数据划分到单独的分类中。然而,成团行为初始化每个数据对象的聚类,并将类似的对象合并到分类中。当新分类形成时,空间的中心可以在所有数据元素已被分组之后被更新(并行),或者在单个数据元素已被分组之后被更新(串行)。
给定分析者用户数据的结构和形式通过一系列浸入式环境的基本分析小组20的希望输出提供足够的限制来选择模式识别算法的行为和形式。为了实现基本分析小组
Figure BDA00002798860400052
的动态构造以及一系列浸入式上下文选择,以下的算法是恰当的:
Figure BDA00002798860400061
Figure BDA00002798860400062
内的所有成员m根据准则
Figure BDA00002798860400063
被选择,其中
Figure BDA00002798860400064
是基本小组。然而,基本小组是在所有m个成员如表A所示的算法中描述的那样被划分地聚类之后所创建的。
Figure BDA00002798860400065
表A
给定变量Ht或“同质性阈值”,当个体与聚类之间的所有测量全都小于或等于该阈值时,成团聚类将退出。实际上,Ht限制聚类并定义退出准则。图4和5分别示出了相关联的树状图以及相关联的成团进度表。
得到的基本分析小组20遵从Condorcet陪审团原理的证据如下。在内核函数g的应用之后,从给定聚类Cl选择的成员具有大于一半的可能性正确回答问题的概率为100%。
Figure BDA00002798860400071
m个成员将从群集cl的M个可能成员被选择(其中每个成员m可能具有或可能不具有比给定问题集合的一半多的正确决定md)的概率是 f ( m ; M cl , p ) = Pr ( X = m ) = M cl m &CenterDot; ( p ) m &CenterDot; ( 1 - p ) M cl - m . 由于所有成员M都被保证具有正确决定,因此,被减小到
Figure BDA00002798860400074
以表示只有一个结果的可能性。
此外,从多个小组选择的所有成员具有由内核函数g以及划分层次聚类算法产生的c的概率通过如下给出
Pr ( ( &Sigma; m = 0 Cl X m ) = t ) = &Pi; m = 0 Cl Pr ( X m = m ) .
实际上,
f ( m , M cl , p ) = Pr ( X = m ) limp &RightArrow; P [ m d > 50 % ] = M cl m &CenterDot; ( p ) m &CenterDot; ( 1 - p ) M cl - m ; M cl = m &DoubleLeftRightArrow; m m &CenterDot; ( p ) m &CenterDot; ( 1 - p ) m - m
其中 lim x &RightArrow; 1 ( 1 - x ) 0 = 1 并且 lim x &RightArrow; 1 ( x ) n = 1 , 使得 m m &CenterDot; ( p ) m &CenterDot; ( 1 - p ) m - m = 100 % .
由于所有被选择的成员被保证具有P[md>50%],那么从多个小组选择的所有成员具有作为P[md>50%]的概率 Pr ( ( &Sigma; m = 0 Cl X m ) = t ) = &Pi; m = 0 Cl Pr ( X m = m ) = 100 % . 这样,通过内核和层次方法,结果被保证遵从Condorcet陪审团原理。
图3提供了与浸入式环境50交互的问题分析系统14的更详细实施例,在浸入式环境50内基本分析小组20操作来解决问题18。问题分析系统14可以包括用于提供平台的协作系统40,在所述平台内成员54分析并解决问题18。协作系统40可以例如包括中心服务器,中心服务器例如管理如下处理,所述处理包括向各个成员54分配任务和时间表、提供允许成员54经由网络相互通信的通信设施、在每个成员在其中操作的虚拟世界内提供空间等等。
在解决问题18中,基本分析小组20被置于一个或多个浸入式环境50中。浸入式环境50可以包括分析小组20的成员54在其中可以操作的任何类型的环境,例如:诸如虚拟宇宙之类的虚拟环境;诸如房间、一个或多个工作站之类的物理空间;网格或云计算环境;游戏环境、其组合等等。另外,虽然仅示出了单个浸入式环境50,但是应该理解的是,可以利用多个/不同类型的浸入式环境50,即,一些成员54可以在第一类型的浸入式环境50中,而其他成员54可以在第二类型的浸入式环境50中。
无论类型或数量,每个浸入式环境50包含一组变量52,变量52控制浸入式环境50的方面。举例来说,在诸如房间之类的物理空间中,变量52可以包括温度、湿度、照明、音乐、家具位置等等。在虚拟空间中,变量52可以包括虚拟位置、诸如颜色之类的呈现要素、化身外观、声音级别、3D效果等等。
另外,在每个浸入式环境50内,通过一个或多个个体倾向传感器56来监视每个成员,并且通过一个或多个群体倾向传感器来监视整个小组20。个体倾向传感器56被用于测量可能指示个体的一些倾向的个体成员的方面。个体倾向传感器56可以例如测量呼吸、心率、疲劳度、焦虑度、移动等等。群体倾向传感器58被用于测量可能指示群体倾向的整个小组20的方面。群体倾向传感器58可以例如测量整个小组20的音量、小组20朝着解决方案工作的速度等等。
来自个体倾向传感器56和群体倾向传感器58的数据被馈送到问题分析系统14中,在问题分析系统14中倾向传感器分析系统42对数据进行分析,并确定是否存在个体倾向状况43或群体倾向状况44。例如,与少量其他成员参与某项任务的第一成员的心率有可能异常地增大。基于第一成员的先前训练和分析输入,这可能被已知为导致对于第一成员的部分做出的倾向性决定。在另一例子中,整个小组20有可能参与到关于特定点的热烈和大声的讨论中,这可能被已知为导致由整个小组做出的倾向性决定。
个体倾向的说明性类型包括例如确认倾向、基本归因误差、盲点倾向、代表性倾向、锚定倾向以及计划倾向。说明性的群体倾向包括例如信息结茧、群体极端性、信息倾泻以及过早假设。
为了处理倾向状况43、44,浸入式环境控制系统46可以改变浸入式环境内的变量。例如,如果给定成员54的个体倾向状况43由于例如高度焦虑而被发布,那么可以调整该给定成员54的物理空间中的温度或照明。此外,如果群体倾向状况44基于热烈且大声的讨论而被发布,那么可以利用中断该讨论的变量52,例如,化身可以被临时传送到不同的区域以工作于问题的不同部分。
串行的浸入式上下文映射48可以被用于评估在不同类型的浸入式环境内发生的行为。例如,小组20可以被浸入在镜像、虚拟、物理或电话环境中的一个环境中。不同类型的倾向可以取决于正被利用的浸入式环境50的一个或多个类型来不同地呈现它们自身。
回过来参考图1,倾向分类系统15提供了评估和理解个体成员54以及整个小组20的倾向所需要的先验训练。基本分析小组20
Figure BDA00002798860400091
最初通过来自聚类Cl的m个成员创建。每个小组具有在空间上选择的浸入式环境。这样,决定做出的上下文在来自不同小组的群体成员之间不同。尽管对于浸入式环0类型的异质性趋势,但是所有成员的分析会话应该保持同质性。通过扩展,分析会话A由一系列事件{A1,A2…At…At+1}构成,每个事件通过浸入式环境上下文定义。
内来自特定Cl的成员的数量或
Figure BDA00002798860400098
的直方图被创建。针对附着于聚类的浸入式环境偏好的离散(descretized)At的数量来确定等级相称选择
Figure BDA00002798860400093
&alpha; cl t = | m cl | | T a f | ; 0 &le; &alpha; cl t &le; 1
对于给定小组的环境的数量通过
Figure BDA00002798860400095
被计算。完整可能事件路径是
Figure BDA00002798860400096
其中从一个事件到另一个事件的转变是浸入式环境上下文内的变化。
通过训练,与社会决定做出理论相关的泊松分布模型指导转变状态的选择。
f ( k ; &lambda; ) &lambda; k e - &lambda; k !
在一种方法中,倾向可以在游戏环境内被识别、分类和管理。在模式识别内,诸如回归器、分类器或密度估计器之类的方法根据一组变量提供预测。特别地,分类器将数据群体或向量数据分离到有区别的空间中。地面实况或被标记数据提供支持有监督学习方法的目标。可替代地,诸如聚类技术之类的无监督学习基于内在特征将数据分段。在浸入式环境的上下文内,每个游戏被训练为诸如如图6所示那样的贝叶斯信念网络分类器。
游戏倾向分类器训练阶段根据认知倾向启发情景(elicitationscenario)产生贝叶斯信念网络。认知要求情景(solicitation scenarios)集合中的每一个可以被编码成游戏状态,使得每个节点Ni(其中i∈{0,1,...,∞})代表行动状态,而边缘Eij(其中i,j∈{0,1,...,∞})是从Ni到Nj的转变或决定。所有节点和边缘的集合创建游戏情景,其中并且g∈{0,1,…,∞}n∈{1,2,3,4,5,6}m∈{0,1,…,∞}。每个n代表以下认知倾向之一:确认、锚定、表示、计划、盲点以及归因倾向,而g是游戏标识符并且m是情景枚举。每个情景Sgmn被编码成游戏g。
当用户在训练期间完成Sgmn时,给定倾向指示符的目标指变量,针对倾向n的游戏g的信念网络m的概率表被学习。倾向的概率通过联合概率被给出。
P(Bn,Ni...Ni+1...Ni+1+l)
每个节点Ni将具有针对P(Ni+1|Ni)的条件概率表。联合分布概率使用以下标准被计算
P ( B n , N i , . . . N i + 1 . . . N i + 1 + l ) = P ( B n ) &Pi; i = 1 i P ( N i | Parents ( N i ) ) .
换句话说,证据的累积提供被断言假设已发生的概率。
针对给定倾向的证据通过训练会话被收集。网络的拓扑或结构是通过认知启发模型先验定义的。每个启发模型针对由Sgmn定义的特定故事板提供事件序列。当用户运行游戏内的情景时,在每个决定点处收集数据。数据的潜在处理提供证据的直方图累积,以便完成每个条件概率表。
在完成情景并且记录用户的状态路径之后,向玩家呈现调查。每个玩家完成对于每个情景的调查。从调查获取的数据被用于产生针对采样Ds的标签Ln以及通过拓扑网络的行动路径。
Ds={Ln,Ni...Ni+1...Ni+1+l}
在训练阶段之后,将在剩余的测试数据Ds上测试每个底层模型。数据被分层到n个被标记的群体。每个数据群体产生如图7所示的混淆矩阵,使得每个游戏的特异性
Sp = TN TN + FP
以及敏感性
Se = TP TP + FN
被计算。
真正类率
Figure BDA00002798860400113
以及假正类率
Figure BDA00002798860400114
被绘制,以产生接收者操作特性(Receiver Operating Characteristic)曲线。ROC曲线可以用于比较分类器。曲线下的面积产生针对分类器的质量的近似值。积分
auc = &Integral; 0 1 ROC ( x )
提供曲线下的面积。然而,该结果并未顾及偏斜。取而代之,马修斯相关系数(MCC)提供[-1,1]中的数值。
MCC = TP * TN - FP * FN ( TP + FP ) ( TP + FN ) ( TN + FP ) ( TN + FN )
MMC与具有χ2=(|MCC|)2*o的卡方(Chi-Square)统计相关,其中o是观测结果的总数。卡方值表提供针对分类器的显著性概率。MCC和显著性值都针对特定倾向分类产生偏好游戏的有序列表。
普遍的游戏建模
通用贝叶斯网络分类器(GBNC)对于引出倾向的情景Sgmn建模。条件概率表根据分层的训练Ds被构造,而网络的拓扑通过认知被设计。具有知识累积的频率论方法提供经验概率。分割定理(d-separation)的马尔科夫属性(Markov property)使得能够实现概率的计算。根节点是倾向的在先概率或分类。6个倾向中的每一个针对每一个游戏保持GBNC。GBNC的总数是GBNC#=6*G#,其中G#是游戏的数量。
当用户运行与倾向最相关的游戏时,特定情景被编造脚本。针对AP的在线分类针对所有GNCC#被产生。
AP={Ni...Ni+1...Ni+1+l}
如果由用户产生的行动路径被分类到在所学习的阈值α之上的不同倾向中,那么游戏改变。可替代地,如果分类概率低于所要求的退出准则,那么运行针对相同倾向启发的另一个脚本。倾向脚本的类型被运行直到用户参与度降低。如果在会话α的结尾还没有被超出,那么用户没有显现出倾向,或者用户已通过先前的游戏学习到了缓解倾向。
在对于正确倾向分类超过了α时,游戏向用户警告倾向并建议未来的避免行动。通过游戏强化学习,用户理解如何识别倾向。此外,避免动作建议为用户提供了用于在未来的情景中缓解倾向的范例。
个性化的游戏建模
已知被训练的GBNC的阈值α的四舍五入(short round),将在每个游戏的开端开始学习。倾向启发脚本调用动作路径AP。出于校准的目的通过每个GNBC来对AP进行分类。短期调查从用户检索隐藏的认知信息,以确定恰当倾向Sgmn是否已发生以及到什么幅度β。接受阈值α通过如下被计算
α=P(Bn,Ni...Ni+1...Ni+1+l)*
当概率高于α时,倾向Bn发生。
玩家的参与对于游戏的教学使用是非常重要的。GNBC模型构建的自然扩展是沿着信念网络的边缘产生参与模型。当用户沿着边缘Ei+1,i+1+l从Ni+1移动到Ni+1+l时,针对反应时间的高斯模型产生密度估计器。GNBC包含
GNBC={N∪E∪B}
熟知的正态分布
f ( x ) = 1 2 &pi; &sigma; 2 e ( x - &mu; ) 2 2 &sigma; 2
是边缘模型的基础。根据z评分(z-score)形式
Figure BDA00002798860400122
的异常值检测来确定获得反应时间的概率。如果z评分在静态上是低的(t(z)≤5%),那么游戏改变诸如颜色和声音之类的进行中的(in-play)特性,以重新获得关注。如果游戏特性方面的变化没有改善下一z评分,那么情景被切换。之后,如果z评分仍未改善,则整个游戏被切换。
在大量的针对娱乐目的的游戏和严肃游戏中存在大量的时机来使用优化的小组构建。通过针对游戏的基于游戏来报告最优小组的能力,组织被给予机会来使得系统能够基于可计量的技能集来向人们提供建议,所述技能集基于人们如何在虚拟环境中互动。这可能是关键的例子是供应链游戏或想要对于特定计划确定最佳小组的游戏。这可能是可应用的例子将是想要训练智能分析者如何识别和缓解认知倾向的IARPA游戏。然后,该游戏可以向小组建议分析者,该分析者被指定来基于它们的分析技能集一起工作。
对于所有类型的单玩家或多玩家的不同游戏,适应性的游戏玩法是非常重要的。该方法导致更引人入胜体验、复杂的游戏,所述游戏可以基于迄今为止已经完成的内容以及玩家在游戏事件中如何反应来动态建议游戏玩法的等级。该方法可以被用在FPS游戏、角色扮演游戏、模拟游戏等等中,并且是一种真正跨风格的功能。
所属技术领域的技术人员知道,本发明可以实现为系统、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:可以是完全的硬件、也可以是完全的软件(包括固件、驻留软件、微代码等),还可以是硬件和软件结合的形式,本文一般称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,这些计算机程序指令通过计算机或其它可编程数据处理装置执行,产生了实现流程图和/或框图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能使得计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令就产生出一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品(manufacture)。
也可以把计算机程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其它可编程装置上执行的指令能够提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
这里使用的术语仅仅是为了描述特定实施例,而不意欲对本发明进行限制。除非在上下文中明确指示,否则这里使用的单数形式“一”、“一个”以及“该”意欲同样包含复数形式。还应该理解的是,本说明书中使用的术语“包括”和/或“包含”表示所陈述的特征、整体、步骤、操作、元件和/或组件的存在,但并不排除一个或其他的特征、整体、步骤、操作、元件、组件和/或其群体的存在或添加。
以下权利要求中的所有装置或步骤加功能元件的相应结构、材料、操作以及等价物意欲包含与具体要求保护的其他要求保护的元件相结合来执行功能的任何结构、材料或操作。关于本发明的描述是出于说明和描述目的给出的,但是并意欲是穷尽性的或将本发明限制到所公开的形式。对本领域技术人员来说,在不脱离本发明的范围和精神的情况下,很多的修改和变更将是明显的。实施例被选择和描述以最佳地解释本发明的原理和实际应用,并使本领域的其他普通技术人员能够针对具有与所考虑的特定使用相适合的各种修改方式的各种实施例来理解本发明。

Claims (14)

1.一种用于优化用于解决问题的小组的系统,包括:
小组构建系统,用于从分析者的数据库构建基本分析小组以解决输入问题,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;以及
问题分析系统,收集来自在浸入式环境内操作的基本分析小组的传感器数据,其中,所述问题分析系统包括用于评估所述传感器数据以识别来自基本分析小组的倾向状况的系统,以及包括用于响应于检测到的倾向状况来改变所述浸入式环境中的变量的系统。
2.根据权利要求1所述的系统,其中,所述分析者的数据库中的每一个分析者通过属性向量表示。
3.根据权利要求1所述的系统,其中,所述输入问题通过问题向量表示。
4.根据权利要求1所述的系统,其中,所述小组构建系统包括使用嗜同性建模来对分析者进行聚类的内核函数。
5.根据权利要求1所述的系统,其中,分析者聚类是根据Condorcet陪审团原理使用层次聚类算法组合的。
6.根据权利要求1所述的系统,还包括倾向分类系统,所述倾向分类系统在游戏环境内识别、分类和管理倾向。
7.根据权利要求1所述的系统,其中,所述传感器数据是从个体倾向传感器和群体倾向传感器收集的。
8.一种用于优化用于解决问题的小组的方法,包括:
从分析者的数据库构建基本分析小组以解决输入问题,其中,所述基本分析小组包括至少一个用特异性表征的分析者聚类以及至少一个用敏感性表征的分析者聚类;
收集来自在浸入式环境内操作的基本分析小组的传感器数据;
评估所述传感器数据以识别来自基本分析小组的倾向状况;以及
响应于检测到的倾向状况来改变所述浸入式环境中的变量。
9.根据权利要求8所述的方法,其中,所述分析者的数据库中的每一个分析者通过属性向量表示。
10.根据权利要求8所述的方法,其中,所述输入问题通过问题向量表示。
11.根据权利要求8所述的方法,其中,构建基本分析小组包括利用使用嗜同性建模来对分析者进行聚类的内核函数。
12.根据权利要求8所述的方法,其中,分析者聚类是根据Condorcet陪审团原理使用层次聚类算法组合的。
13.根据权利要求8所述的方法,还包括识别、分类和管理倾向的游戏环境。
14.根据权利要求8所述的方法,其中,所述传感器数据是从个体倾向传感器和群体倾向传感器收集的。
CN201310037758.8A 2012-01-31 2013-01-31 用于优化小组的系统和方法 Active CN103226566B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US13/362,632 2012-01-31
US13/362,632 US8712945B2 (en) 2012-01-31 2012-01-31 System and method for optimizing teams

Publications (2)

Publication Number Publication Date
CN103226566A true CN103226566A (zh) 2013-07-31
CN103226566B CN103226566B (zh) 2016-06-08

Family

ID=48837013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310037758.8A Active CN103226566B (zh) 2012-01-31 2013-01-31 用于优化小组的系统和方法

Country Status (2)

Country Link
US (3) US8712945B2 (zh)
CN (1) CN103226566B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110546619A (zh) * 2017-04-24 2019-12-06 微软技术许可有限责任公司 源自监测系统的警报的机器学习决策指导

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8712945B2 (en) * 2012-01-31 2014-04-29 International Business Machines Corporation System and method for optimizing teams
US9582767B2 (en) * 2012-05-16 2017-02-28 Excalibur Ip, Llc Media recommendation using internet media stream modeling
US9342790B1 (en) 2015-01-07 2016-05-17 International Business Machines Corporation Cohort half life forecasting combination from a confident jury
CA2979193C (en) * 2015-03-11 2021-09-14 Siemens Industry, Inc. Diagnostics in building automation
US10339502B2 (en) * 2015-04-06 2019-07-02 Adp, Llc Skill analyzer
US10839310B2 (en) 2016-07-15 2020-11-17 Google Llc Selecting content items using reinforcement learning
US11200377B2 (en) * 2017-04-27 2021-12-14 Micro Focus Llc Cluster model to predict build failure
US10713283B2 (en) * 2017-05-15 2020-07-14 Microsoft Technology Licensing, Llc Data set identification from attribute clusters
US11645288B2 (en) * 2017-11-03 2023-05-09 International Business Machines Corporation Reassigning gamer clusters based on engagement
US10620694B2 (en) 2017-11-28 2020-04-14 International Business Machines Corporation Adaptive digital environments
CN111161443A (zh) * 2019-01-17 2020-05-15 浙江诸暨美数信息科技有限公司 一种基于历史数据的巡逻路径设置方法
CN109933537B (zh) * 2019-03-29 2021-07-27 腾讯科技(深圳)有限公司 一种卡顿检测方法、相关装置、设备及计算机可读介质
US11416743B2 (en) 2019-04-25 2022-08-16 International Business Machines Corporation Swarm fair deep reinforcement learning
US11176368B2 (en) 2019-06-13 2021-11-16 International Business Machines Corporation Visually focused first-person neural network interpretation
US11934969B2 (en) 2019-10-01 2024-03-19 International Business Machines Corporation Bias identification in cognitive computing systems
US11475331B2 (en) 2020-06-25 2022-10-18 International Business Machines Corporation Bias source identification and de-biasing of a dataset
US12061583B1 (en) * 2020-09-29 2024-08-13 Amazon Technologies, Inc. Systems for processing data using stages
US11614795B2 (en) 2020-12-11 2023-03-28 International Business Machines Corporation Co-evolved user experience orchestrator
CN112651626B (zh) * 2020-12-24 2023-05-26 北京童阅童享科技有限公司 一种绘本阅读课程教学云系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164443A1 (en) * 2007-12-19 2009-06-25 Ramos Jo A Database performance mining
CN102072747A (zh) * 2011-01-27 2011-05-25 华中科技大学 基于热工参数场监测的建筑群能耗监测系统及其方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090043621A1 (en) 2007-08-09 2009-02-12 David Kershaw System and Method of Team Performance Management Software
US8712945B2 (en) * 2012-01-31 2014-04-29 International Business Machines Corporation System and method for optimizing teams

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090164443A1 (en) * 2007-12-19 2009-06-25 Ramos Jo A Database performance mining
CN102072747A (zh) * 2011-01-27 2011-05-25 华中科技大学 基于热工参数场监测的建筑群能耗监测系统及其方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
EX THEN: "Lecture: Condorcet’s Theorem", 《HTTP://WWW.STAT.BERKELEY.EDU/~MOSSEL/TEACH/SOCIALCHOICENETWORKS10/SCRIBEAUG31.PDF》 *
刘建伟 等: "基于抽样的多模态分布聚类算法研究", 《计算机工程》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110546619A (zh) * 2017-04-24 2019-12-06 微软技术许可有限责任公司 源自监测系统的警报的机器学习决策指导
CN110546619B (zh) * 2017-04-24 2023-09-12 微软技术许可有限责任公司 自动确定检测到的问题是否是bug的方法、系统和介质
US11809304B2 (en) 2017-04-24 2023-11-07 Microsoft Technology Licensing, Llc Machine learned decision guidance for alerts originating from monitoring systems

Also Published As

Publication number Publication date
US20130198122A1 (en) 2013-08-01
US10304003B2 (en) 2019-05-28
CN103226566B (zh) 2016-06-08
US9430741B2 (en) 2016-08-30
US20140108310A1 (en) 2014-04-17
US20160307111A1 (en) 2016-10-20
US8712945B2 (en) 2014-04-29

Similar Documents

Publication Publication Date Title
CN103226566A (zh) 用于优化小组的系统和方法
Galván et al. Neuroevolution in deep neural networks: Current trends and future challenges
Sahakyan et al. Explainable artificial intelligence for tabular data: A survey
Xia et al. Complete random forest based class noise filtering learning for improving the generalizability of classifiers
Azmi et al. Interpretable regularized class association rules algorithm for classification in a categorical data space
Wang et al. Novel evolutionary algorithms for supervised classification problems: an experimental study
Özbakır et al. Exploring comprehensible classification rules from trained neural networks integrated with a time-varying binary particle swarm optimizer
Baykasoğlu et al. Improving fuzzy c-means clustering via quantum-enhanced weighted superposition attraction algorithm
Feng et al. Genetic algorithm-based optimization of deep neural network ensemble
Fong et al. Gesture recognition from data streams of human motion sensor using accelerated PSO swarm search feature selection algorithm
Escobar et al. Process-Monitoring-for-Quality—A Model Selection Criterion for Genetic Programming
Kuo et al. Application of genetic algorithm-based intuitionistic fuzzy neural network to medical cost forecasting for acute hepatitis patients in emergency room
Bolat et al. A comprehensive comparison of machine learning algorithms on diagnosing asthma disease and COPD
Alexiadis et al. A Sensor-Independent Multimodal Fusion Scheme for Human Activity Recognition
Jabeen et al. Two layered Genetic Programming for mixed-attribute data classification
Alves et al. Specialized MLP classifiers to support the isolation of patients suspected of pulmonary tuberculosis
Christodoulou et al. Improving the performance of classification models with fuzzy cognitive maps
Shaheen et al. Autonomic workload performance modeling for large-scale databases and data warehouses through deep belief network with data augmentation using conditional generative adversarial networks
Yang et al. Data-driven hierarchical classifiers based on Choquet integral
Berchtold et al. Using a context quality measure for improving smart appliances
Bülbül Performance of different membership functions in stress classification with fuzzy logic
CN110033862A (zh) 一种基于加权有向图的中医量化诊断系统及存储介质
Srinivasan et al. A supervised learning model to identify the star potential of a basketball player
Li et al. A comparative study on machine classification model in lung cancer cases analysis
Zivkovic et al. Hybrid CNN and XGBoost model tuned by modified arithmetic optimization algorithm for COVID-19 early diagnostics from x-ray images. Electronics 2022 11: 3798

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant