CN102163304A - 带有优化的域间信息质量评定的协作联网的方法和系统 - Google Patents

带有优化的域间信息质量评定的协作联网的方法和系统 Download PDF

Info

Publication number
CN102163304A
CN102163304A CN2011100402097A CN201110040209A CN102163304A CN 102163304 A CN102163304 A CN 102163304A CN 2011100402097 A CN2011100402097 A CN 2011100402097A CN 201110040209 A CN201110040209 A CN 201110040209A CN 102163304 A CN102163304 A CN 102163304A
Authority
CN
China
Prior art keywords
territory
entity
value
prestige
incident
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011100402097A
Other languages
English (en)
Inventor
P·杜布
R·哈因
M·R·纳菲德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN102163304A publication Critical patent/CN102163304A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/16Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Computer Hardware Design (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computing Systems (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及一种带有优化的域间信息质量评定的协作联网的方法和系统。一种用于实施域间信息质量评定的方法包括:通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系。所述方法还包括:根据所述关联特征向多对域分配反映关系密切性的值。所述方法还包括:根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉。所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力。所述方法还包括:根据所述评估计算表示所述实体相对于该域的信誉的值以及将表示所述信誉的值分配给所述实体。

Description

带有优化的域间信息质量评定的协作联网的方法和系统
技术领域
本发明一般地涉及基于网络的信息分析和优化过程,更具体地说,涉及使用网络社区提供的域间信息质量评估优化的协作联网。
背景技术
通过诸如Web 2.0之类的技术实现的协作网络应用为一些电子商务和社交网站带来了众包(也称为“群体智慧”)的概念。Web 2.0是一种流行度不断增加的Web应用类型,其主要的与众不同之处在于使得网络用户能够贡献用于协作和共享的信息。常见的协作联网应用包括例如社交软件、网页联合计划(Web Syndication)、博客以及维基等。通过这些应用贡献群体智慧的能力可以让使用这些应用的个人或组织实现巨大的差异化价值。例如,可以利用大型在线社区提供的内容评论来确定走势、预测以及类似数据,从而使得内容服务提供商能够根据此群体智慧实施各种盈利策略。
问题在于,就贡献这些意见的人员的专业知识/信誉而言,不应认为所收到的每个意见都是等同的。因此,针对某个主题(例如,产品/服务)提供意见的某些网络用户并不与其他网络用户一样有资格对该主题的未来价值做出评论。产品/服务的未来价值可以是使用诸如所产生的投资回报率(ROI)或收益之类的度量衡量的产品/服务成功的量度。
通常可以根据网络用户的主观评估和/或他/她在单个领域或主题区域内的证书先验地确定网络用户的专业水平。例如,机器学习领域中的研究人员可以利用他在该领域中的出版记录作为凭据。但是,当该研究人员对诸如图形或操作系统之类的另一域中的某个主题发表意见时,就很难评定他的证书的价值。假如不同的个体在不同的领域或专业领域中具备不同的专业知识和证书,则更难准确地评估这些个体的各种意见。目前,在个体可能无缝地跨多个领域并且对领域中的主题发表大量评论的现有Web 2.0网络环境中,评估这些个体的意见的难度逐渐增加。
需要一种客观的方法来评估通过网络从跨多个领域的不同实体收集的意见或预测并有效地使用这些意见或预测以预测未来事件(例如,产品、电影的成功/失败或选举、体育比赛的获胜者等)以及根据个体在其他密切相关的领域中的预测或意见的表现历史推断个体在某个领域中的信誉证明。
发明内容
一个示例性实施例是一种用于实施域间信息质量评定的方法。所述方法包括:通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系。所述方法还包括:根据所述关联特征向多对域分配反映关系密切性的值。所述方法还包括:根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉。所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力。所述方法还包括:根据所述评估计算表示所述实体相对于该域的信誉的值以及将表示所述信誉的值分配给所述实体。
另一示例性实施例是一种由域间信息质量评定程序使用的用于实施域间信息质量评定的计算机程序产品。所述计算机程序产品包括可由处理电路读取并存储由所述处理电路执行以执行方法的指令的有形存储介质。所述方法包括:通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系。所述方法还包括:根据所述关联特征向多对域分配反映关系密切性的值。所述方法还包括:根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉。所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力。所述方法还包括:根据所述评估计算表示所述实体相对于该域的信誉的值以及将表示所述信誉的值分配给所述实体。
其他示例性实施例是一种用于实施域间信息质量评定的系统。所述系统包括计算机处理器以及可由所述计算机处理器执行的域间信息质量评定应用。所述域间信息质量评定应用能够执行一种方法。所述方法包括:通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系。所述方法还包括:根据所述关联特征向多对域分配反映关系密切性的值。所述方法还包括:根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉。所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力。所述方法还包括:根据所述评估计算表示所述实体相对于该域的信誉的值以及将表示所述信誉的值分配给所述实体。
通过本发明的技术实现了其他特征和优势。以下将详细说明本发明的其他实施例和方面并将其视为所要求保护的发明的一部分。参考说明和附图可以更好地理解本发明的优势和特征。
附图说明
现在参考附图,其中相同元素在附图中的编号相同:
图1示出了本发明的示例性实施例中的用于实施域间信息质量评定的计算系统;
图2是示出本发明的示例性实施例中的通过域间信息质量评定过程的数据流的方块图;
图3是示出本发明的示例性实施例中的用于实施域间信息质量评定的过程的流程图;以及
图4示出了可由示例性实施例实现的计算机程序产品。
具体实施方式
本发明的一个示例性实施例涉及对协作网络环境的实体提供的域间信息实施质量评定。实体指常见协作网络或网站的在线用户。在一个示例性实施例中,域与归于已定义主题的知识领域或范围相关。可以使用描述域的逻辑结构(包括其概念以及它们之间的关系)的本体技术(ontologicaltechnique)定义域。可以针对属于知识库一部分的多个域实施域间信息质量评定过程。
所述域间信息质量评定过程使用给定域中实体的信誉来解释和推断域(其中所述实体被认为具有很少的经验或专业知识或者没有经验或专业知识)中实体的信誉得分。此过程在此被称为“跨域信誉推断”。信誉指实体呈现有关给定域中的事件的准确预测或意见的能力。事件指可以在特定时间帧内针对其呈现意见/预测的特定主题(例如,问题、疑问、论题)。根据在呈现有关与特定域关联的事件的预测或意见方面的历史表现来计算信誉得分并将其指定给所述实体。因此,高信誉得分指示对域主题的较高精通程度,而低信誉得分指示对域主题的较低精通程度。可以通过在知识库中多个域间利用本体论和统计相关性在域间建立关系,然后以数学方式计算这些域及其关系以标识哪些域可以与针对其推断信誉的域相关来实施跨域信誉推断。还可以通过观察多个域中多个实体的表现并获知他们在不同域中的信誉间的统计关系对此进行补充。
因此,域间信息质量评定过程提供了使用有关实体在不同但密切相关的域中的信誉推断实体在某一域中的信誉的能力(即,根据其对域的知识呈现有关该域中的事件的准确预测的实体很可能在不同但密切相关的域中做出相对良好的预测)。例如,作为房地产市场预测(即,第一域)方面的专家的人员A要比作为西方古典音乐(与所述第一域不相关的第三域)方面的专家的人员B更可能对建筑工程部分(与所述第一域相关的第二域)或家具行业进行很好地预测。因此,当要预测的事件在建筑工程的域中时,由A进行的预测应比由B进行的预测被给予更大的权重。同样,当要预测的事件在乡村音乐的域中(例如,新专辑唱片销售)时,则由B提供的预测可能比A的预测更有价值。此评定被称为“预测能力”,其结果最终形成实体就对应域而言的信誉得分。因此,实体的预测能力是该实体进行的事件预测结果与事件的实际结果匹配的密切程度的量度。
域间信息质量评定过程还使能根据实体在每个域内的过去表现以及实体在其他相关域中的过去表现来评估每个实体在每个域内的当前信誉。此外,域间信息质量评定过程根据每个域内的个体实体预测以及考虑到域间关系而动态计算的所有实体的域相关信誉,跨多个域评估事件的聚合预测。在定义的决策间隔内针对事件做出预测。未来事件可以包括例如产品、电影的成功/失败或选举、体育比赛的获胜者等。
根据实体的信誉得分衡量实体的预测能力。在每个决策间隔的每个结尾处持续更新不同实体的信誉。决策间隔始于系统针对属于任一域D的事件从不同的参与实体收集预测/意见,使用所述预测以预告未知事件并观察事件结果。当实际实现事件时,决策间隔结束。所述系统通过利用来自不同实体的个体预测并使用实体针对域D和其他域的信誉得分以及表示关系密切性的值对这些预测进行加权来做出预测。在决策间隔结束时,不仅更新实体针对域D的信誉得分,而且还更新该实体在其他域中的信誉得分。
所述域间信息质量评定过程提供了新颖的客观累积准则以评定参与实体的信誉。所述域间信息质量评定过程通过将一组评论者(即,参与实体)意见的效果与该总体意见对客观度量(例如,产品、解决方案、服务的销售或理念或概念的领会)的影响程度的客观度量联系起来而使循环闭合。进而,所述域间信息质量评定过程还跟踪评论者在不同域中的表现以提供对评论者信誉的更全面描述。
现在转到图1,现在将描述示例性实施例中可在其上实施域间信息质量评定过程的系统100的方块图。图1的系统100包括通过一个或多个网络106与客户机系统104通信的主机系统102。可以使用响应于存储在可由服务器(多个)访问的存储介质中的计算机程序而工作的一个或多个服务器实现主机系统102。主机系统102可以作为网络服务器(例如,Web服务器)运行以便与一个或多个客户机系统104通信。主机系统102可以处理发送到客户机系统104的信息和从客户机系统104接收的信息,并可以执行关联的任务。
主机系统102还可以作为应用服务器运行。根据示例性实施例,主机系统102执行一个或多个计算机程序以提供域间信息质量评定服务。这些一个或多个计算机程序在此统称为域间信息质量评定应用116。备选地,域间信息质量评定应用116的一部分功能可以通过客户机系统104实现。
可以通过向客户机系统104提供应用(例如,Java小程序)而由客户机系统104和主机系统102共享域间信息质量评定活动。备选地,客户机系统104可以包括用于执行在此描述的处理的一部分的单独软件应用。在其他实施例中,域间信息质量评定系统功能可以内置到在客户机系统104上执行的Web浏览器应用(未示出)中。如前所述,要理解的是,可以使用单独的服务器来实现主机系统102的网络服务器功能和应用服务器功能。备选地,网络服务器和应用服务器可以由执行计算机程序的单个服务器实现以执行根据主机系统102描述的必需功能。
客户机系统104可以通过一个或多个网络106耦合到主机系统102。每个客户机系统104可以使用执行用于实现在此描述的某些过程的计算机程序的通用计算机实现。客户机系统104可以是个人计算机(例如,膝上型计算机、个人数字助理)或主机连接的终端。出于说明的目的,客户机系统104由包括Web服务的因特网服务的用户运行。这些用户在此被称为“实体”和“评论者”,如在此进一步描述的那样。
在示例性实施例中,图1中所示的域间信息质量评定系统100包括存储设备112。存储设备112与主机系统102通信,并且可以使用各种用于存储电子信息的设备实现。要理解的是,存储设备112可以使用主机系统102中包含的存储器实现或者它可以是单独的物理设备,例如如图1中所示。可以跨包括网络(多个)106的分布式环境对作为整合数据源的存储设备112在逻辑上进行寻址。可以通过主机系统102和客户机系统104的授权用户取回和操纵存储设备112中存储的信息。存储设备112可以存储内容数据(例如,由客户机系统104评论的一个或多个信息内容主题源)、内容用户记录(例如,与客户机系统104的用户相关的信息)以及已定义的域、域间距离度量、个体和总体用户评论、评定及信誉,以及主机系统102的服务提供商所需的其他信息。将在此进一步描述这些特征。在一个示例性实施例中,主机系统102作为数据库服务器运行并协调对包括存储设备112上存储的数据的应用数据的访问。
在一个示例性实施例中,主机系统102表示实现协作应用Web服务(例如,社交/商务网络、维基、博客、新闻馈送以及产品/服务等)的服务提供商。此外,主机系统102表示域间信息质量评定服务的提供商。但是,将理解的是,主机系统102可以备选地代表诸如协作内容提供商之类的不同网络实体(未示出)将域间信息质量评定服务实现为应用服务提供商(ASP)。
网络106可以是任何类型的已知网络,包括但不限于广域网(WAN)、局域网(LAN)、全球网络(例如,因特网)、虚拟专用网(VPN)以及内联网。可以使用无线网络或本领域中公知的任何类型的物理网络实施方式实现网络106。客户机系统104可以通过多个网络(例如,内联网和因特网)耦合到主机系统102,以便并非所有客户机系统104都通过同一网络耦合到主机系统102。客户机系统104以及主机系统102中的一个或多个可以以无线方式连接到网络(多个)106。
如上所述,域间信息质量评定系统可以通过单独的应用116实现或者可以内置到一个或多个现有应用(例如,通过Web 2.0实现的协作应用或服务)中。
现在转到图2,现在将在一个示例性实施例中描述示出通过域间信息质量评定过程的数据流的方块图。域间信息质量评定应用116接收实体201-1至201-N(其中201-N表示实体数量)针对事件的个体预测。实体201-1-201-N中的每个实体可以针对对应事件在多个域D1-DN中提交多个预测。这些预测可以采用指示实体相对于特定疑问、问题或主题(即,事件)的意见或预告的某类值的形式。例如,假设问题涉及尚待发行的书籍的建议的成功或失败。通过非限制实例,可以根据该书的预计销售总额、预期销售本数或反映可能对该书有兴趣的消费者类型的人口属性表示预测值。
域间信息质量评定应用116还接收域D1-DN中的每个域的域间距离度量208。域间距离度量指定域D1-DN中的每个域间的关系密切性的量度。域间距离度量值可以使用各种技术实现。例如,可以通过标识定义每个相应域的特征集合来确定域间关系。使用基于本体论的处理、层次树结构或类似的技术,可以建立域间关系(以及关系度)。例如,使用树结构,可以通过两个域之间的跃点数计算这两个域之间的关系密切性。在一个示例性实施例中,可以使用定义一对域的特征间的相关性确定该对域的相关程度。
域间信息质量评定应用116还接收每个实体201-1-201-N的信誉得分202-1-202-N,由此可以针对多个域D1-DN接收每个实体201-1-201-N的多个信誉得分。域间信息质量评定应用116相对于实体201-1至201-N以及与每个实体(例如,客户机系统104的用户)关联的信誉得分202-1至202-N处理域D1-DN的个体预测以得到总体预测值203。所述处理可以包括根据每个相应实体相对于关联域的当前已知信誉的量度、各个域之间的密切性的量度以及关联的预测值,将权重应用于个体预测。域间信息质量评定应用116对具有已应用的权重并响应于所述处理的预测进行平均。将在此进一步描述此处理。
一旦确定事件的实际结果(也称为“事件实现”),将使用每个相应总体预测值203处理表示每个实际结果204的值以得到每个域的对应总体预测误差205。域间信息质量评定应用116接收总体预测误差205,并修改或调整关联实体的一个或多个信誉得分207以反映总体预测值203与总体预测误差205之间的偏差。总体预测值203、总体预测误差205以及总体信誉得分207对应于个体实体的聚合(在此也称为“社区”)。因此,个体实体的聚合形成其成员跨一个或多个域参与一个或多个事件的预测的社区。总体预测误差205和信誉得分207调整可以使用各种技术实现,将在此进一步描述这些技术。
除了总体预测和信誉得分计算及调整之外,域间信息质量评定应用116还关注相对于一个或多个事件并跨多个域调整个体预测和信誉得分。例如,如图2所示,每个实体(实体1至实体N,对应于一个或多个客户机系统104)针对关联域D1-DN提供对应的预测201-1至201-N,预测201-1至201-N与实际结果值204一起被处理以确定每个受影响域D1-DN的对应个体预测误差值206-1至206-N。域间信息质量评定应用116针对每个实体和每个受影响域调整当前信誉得分202-1至202-N,并在后续事件期间,已修改的适应后的信誉得分作为信誉得分202-1至202-N被输入到用于如上所述计算总体预测值的过程,由此确保具有对个体和总体信誉得分的动态更新的闭环循环。
除了根据每个域内的实体的过去表现(以及在其他相关域中的过去表现)评估每个实体在每个域内的当前信誉,并根据每个域内的个体实体预测连同考虑到域间关系而动态计算的所有实体的域相关信誉跨多个域评估事件的聚合预测之外,域间信息质量评定过程还提供使用有关实体在不同但密切相关的域中的信誉推断实体在域中的信誉的能力。可以使用域间距离度量结合基于特定域的实体的当前信誉得分实现信誉推断。域间信息质量评定应用116使用域间距离度量确定知识库中的哪些域被标识为与针对其推断信誉得分的域具有紧密关系。域间信息质量评定应用116还标识实体是否具有与这些密切相关的域中的任何一个域关联的已分配信誉得分。如果是,则域间信息质量评定应用116根据密切相关的域的信誉得分计算(推断)域的信誉得分。将在此进一步描述此计算。可以在观察到针对其做出预测的事件的结果时更新域间距离度量。例如,可以通过计算不同域中实体子集的每个成员做出的预测的正确性(诸如损失函数之类的量度)之间的相关性来更新域间距离度量。将在此进一步描述示例损失函数。多数用户的预测中的高度相关性意味着域关系紧密。
现在转到图3,现在将描述用于实施域间信息质量评定的示例性过程。所述过程在步骤302开始,由此在步骤304,域间信息质量评定应用116从实体(例如,客户机系统104)接收事件的预测。每个事件与特定的域关联。在步骤306,域间信息质量评定应用116获取受影响的域的域间距离度量。在步骤308,应用116获取每个参与实体(即,那些已提交其预测的实体)的信誉得分。这些信誉得分可以包括每个实体的多个信誉得分(例如,每个域一个信誉得分)。一旦获取了所有可用的信誉得分,在步骤310,域间信息质量评定应用116就根据对应信誉得分(例如,使用加权平均值)和域间距离度量来处理预测值。在步骤312,域间信息质量评定应用116从在步骤310描述的处理生成事件的总体预测值。
在步骤314,域间信息质量评定应用116例如通过观察确定事件的实际结果。在步骤316,域间信息质量评定应用116将每个个体实体的预测结果值与每个受影响域的实际结果值进行比较。在步骤318,域间信息质量评定应用116使用与每个实体关联以及用于每个域的实际结果值和预测结果值计算每个对应实体的对应预测误差。在步骤320,域间信息质量评定应用116然后使用预测误差重新计算(或者得到,如果这是实体做出的首次预测)实体相对于每个域的信誉得分。此外,域间信息质量评定应用116还可以在计算实体的已更新信誉得分时使用从步骤328得到的总体预测误差。这些信誉得分被存储在存储设备112中以供将来重新调用和调整。在步骤322,判定是否向社区提供了新事件以供预测。如果是,则所述过程返回步骤304。否则,所述过程在步骤324结束。
转回到步骤314,一旦出现事件的实际结果,域间信息质量评定应用116就对总体预测值执行类似的处理。在步骤326,域间信息质量评定应用116将每个事件的总体预测结果值与实际结果值进行比较。在步骤328,域间信息质量评定应用116使用与社区关联的实际结果值和总体预测结果值计算每个事件的相应总体预测误差。在步骤330,域间信息质量评定应用116然后使用总体预测误差针对每个事件重新计算(或者得到,如果这是社区做出的首次预测)社区的信誉得分。这些总体信誉得分被存储在存储设备112中以供将来重新调用和调整。如上所述,可以使用每个事件的总体预测误差针对每个域以及跨域更新实体的个体信誉得分(步骤320)。所述过程然后继续到步骤322,其中判定是否向社区提供了新事件以供预测。如果是,则所述过程返回步骤304。否则,所述过程在步骤324结束。
如以上在图2中所示,可以使用各种技术得到跨相关域的个体和总体预测值、个体和总体预测误差、个体和总体信誉得分和调整,以及个体信誉得分。现在将描述这些技术的一些技术。
假设做出预测的实体的数量为N。考虑决策时间t。在决策时间,域间信息质量评定应用116从这N个实体收集有关未知事件的结果y(t)的预测。观察到y(t)可以是来自不同域的事件的向量。因此y(t)=[y1(t),y2(t),...,yd(t)]。假设这些N个实体做出的y(t)的预测为x1(t),x2(t),...,xN(t)。对于任一实体i,预测xi(t)还可以是不同域的预测的向量。因此
Figure BDA0000047139120000111
域间信息质量评定应用116从这N个实体获得预测并使用它们预计y(t)的值。域间信息质量评定应用116根据专家的预测及其信誉得分做出预测p(t)=[p1(t),p2(t),...,pD(t)]。一种方法可以是使用不同实体的预测的加权平均值,其中实体的权重是其信誉得分。这可以表示为:
Figure BDA0000047139120000112
其中wi,t-1是专家i在决策时间t的信誉得分。
定义Ld(pd,yd)为域间信息质量评定系统的损失,并且
Figure BDA0000047139120000113
是域d中实体i的损失。所述损失是域d中事件的预测和实际值之间的不匹配的量度。域d中的实体做出的预测优度的量度是域d中的累积遗憾
Figure BDA0000047139120000114
其由域d中时间t之前的系统损失和实体之差的聚合给出。因此, R i , t d = Σ s = 1 t L d ( p d ( s ) , y d ( s ) ) - L d ( x i d ( s ) , y i d ( s ) ) .
域间信息质量评定系统的目标是就每个实体而言最小化跨所有域的累积遗憾Ri,t。实体i跨所有域的累积遗憾的一种量度可以由实体i针对每个域的累积遗憾的总和给出。因此,
Figure BDA0000047139120000116
跨域的累积遗憾的另一种量度可以是针对实体i具有最大累积遗憾的域的累积遗憾。因此,
域间信息质量评定应用116在实现事件之后更新每个实体的信誉得分以便最小化遗憾。理念是增加其累积遗憾较小的那些实体的信誉得分并减少具有较大累积遗憾的实体的信誉得分。
定义时间t之前的累积遗憾的势函数:
Figure BDA0000047139120000118
其中Ψ是非负、严格递增的可微凹函数;Φ是非负、递增的可微函数。当Φ为指数而Ψ为对数时:
Figure BDA0000047139120000119
假设αjd是域j和d之间距离的量度。则域j中的信誉得分被更新为 w i , t j = Σ d = 1 , . . . , D ; d ≠ j α jd ∂ Φ ∂ R i , t d .
使用上述参考,域间信息质量评定应用116通过以下方式实施域间信息质量评定。在时间t=0时针对所有实体i=1,...,N和所有域j=1,...,D初始化信誉得分
Figure BDA0000047139120000122
然后,针对每个时间t=1,2,...,执行:从所有实体i收集有关未知事件y(t)的预测xi(t);计算每个域j的总体预测
Figure BDA0000047139120000123
观察事件y(t)=[y1(t),y2(t),...,yd(t)]。y(t)是不同域中的事件的集合;使用
Figure BDA0000047139120000124
针对所有实体i计算时间t之前的累积遗憾Ri,t;以及使用
Figure BDA0000047139120000125
更新所有实体i的信誉得分。
技术效果和益处包括优化的协作Web服务,此服务根据参与预测过程的个体和社区的动态更新后的信誉评估个体预测以及聚合预测。所述优化的协作Web服务提供关于参与个体的跨域以及域内的高质量事件预测。
此处使用的术语只是为了描述特定的实施例,并非旨在对本发明进行限制。如此处所用,单数形式“一”、“一个”和“该”也旨在包括复数形式,除非上下文中另外明确指出。应该进一步理解,术语“包括”和/或“包含”,当在本说明书中使用时,指定所述的功能、整数、步骤、操作、元素和/或组件存在,但不排除存在或一个或多个其他功能、整数、步骤、操作、元素、组件和/或这些项构成的组,也不排除添加这些项。
下面的权利要求中的所有装置或步骤以及功能元件的相应结构、材料、操作以及等价项旨在包括任何与其他特别提出的元件共同执行功能的结构、材料或操作。出于示例和说明目的给出了对本发明的描述,所述描述并非旨在是穷举的或是将本发明限于所公开的形式。在不偏离本发明的范围和精神的情况下,许多修改和变化对于本领域的技术人员而言将是显而易见的。实施例的选择和描述是为了最佳地解释本发明的原理和实际应用,并且当适合于所构想的特定使用时,使得本领域的其他技术人员能够理解本发明的具有各种修改的各种实施例。
本领域的技术人员将理解,本发明的各方面可以体现为系统、方法或计算机程序产品。相应地,本发明的各方面可以采取完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)或同时包含在此被统称为“电路”、“模块”或“系统”的硬件和软件方面的实施例的形式。而且,本发明的各方面可以采取在一个或多个内含计算机可读程序代码的计算机可读介质中实现的计算机程序产品的形式。
可以使用一个或多个计算机可读介质的任意组合。所述计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质例如可以是(但不限于)电、磁、光、电磁、红外线或半导体系统、装置或设备或上述各项的任意适合的组合。计算机可读存储介质的更具体的实例(非穷举列表)将包括以下项:具有一条或多条线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦写可编程只读存储器(EPROM或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或上述各项的任意适合的组合。在本文档的上下文中,计算机可读存储介质可以是任何能够包含或存储由指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合的程序的有形介质。
计算机可读信号介质可以包括例如在基带中或作为载波的一部分的带有计算机可读程序代码的传播数据信号。此类传播信号可以采用各种形式,包括但不限于电磁、光或它们的任意适合组合。计算机可读信号介质可以是任何并非计算机可读存储介质并且可以传送、传播或传输由指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合的程序的计算机可读介质。
计算机可读介质上承载的程序代码可以使用任意适当的介质进行传输,所述介质包括但不限于无线、有线、光缆、射频等或上述各项的任意适当的组合。
用于执行本发明的各方面的操作的计算机程序代码可以使用包含一种或多种编程语言的任意组合来编写,所述编程语言包括诸如Java、Smalltalk、C++之类的面向对象的编程语言或者诸如“C”编程语言或类似的编程语言之类的常规过程编程语言。所述程序代码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。
上面参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图和/或方块图对本发明的各方面进行了描述。将理解的是,流程图和/或方块图的每个方框以及流程图和/或方块图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或方块图中的方框中规定的功能/操作的装置。
也可以把这些计算机程序指令存储在能指令计算机/其它可编程数据处理装置或其他设备以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一件包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置的制品。
所述计算机程序指令还可被加载到计算机、其他可编程数据处理装置或其他设备,以导致在所述计算机、其他可编程装置或其他设备上执行一系列操作步骤以产生计算机实现的过程,从而在所述计算机或其他可编程装置上执行的指令提供用于实现在一个或多个流程图和/或方块图方块中指定的功能/操作的过程。
如上所述,各实施例可以以计算机实现的过程以及用于实现这些过程的装置的形式体现。在各示例性实施例中,本发明体现在由一个或多个网络元件执行的计算机程序代码中。各实施例包括计算机可用介质402上的计算机程序产品400(如图4中所示),计算机可用介质402包括包含作为制品体现在有形介质中的指令的计算机程序代码逻辑404。计算机可用介质402的示例性制品可以包括软盘、CD-ROM、硬盘驱动器、通用串行总线(USB)闪存驱动器或者任何其他计算机可读存储介质,其中当计算机程序代码逻辑404被加载到计算机并由计算机执行时,所述计算机变成用于实施本发明的装置。各实施例包括计算机程序代码逻辑404,例如无论被存储在存储介质中,被加载到计算机和/或由计算机执行,还是通过某种传输介质(例如,通过电线或电缆、通过光纤或通过电磁辐射)传输,其中当计算机程序代码逻辑404被加载到计算机并由计算机执行时,所述计算机变成用于实施本发明的装置。当在通用微处理器上实现时,计算机程序代码逻辑404段配置所述微处理器以产生特定的逻辑电路。
附图中的流程图和方块图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实施方式的架构、功能和操作。在此方面,所述流程图或方块图中的每个方块都可以表示代码的模块、段或部分,所述代码包括用于实现指定的逻辑功能(多个)的一个或多个可执行指令。还应指出,在某些备选实施方式中,在方块中说明的功能可以不按图中说明的顺序发生。例如,示为连续的两个方块可以实际上被基本同时地执行,或者某些时候,取决于所涉及的功能,可以以相反的顺序执行所述方块。还将指出,所述方块图和/或流程图的每个方块以及所述方块图和/或流程图中的方块的组合可以由执行指定功能或操作的基于专用硬件的系统或专用硬件和计算机指令的组合来实现。

Claims (16)

1.一种用于实施域间信息质量评定的方法,所述方法包括:
在计算机处通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系;
在所述计算机处根据所述关联特征向多对域分配反映关系密切性的值;
在所述计算机处根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉,所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力;
在所述计算机处根据所述评估计算表示所述实体相对于该域的信誉的值;以及
将表示所述信誉的值分配给所述实体。
2.如权利要求1中所述的方法,其中所述域表示其中没有所述实体所呈现的预测的先验知识的主题。
3.如权利要求1中所述的方法,还包括:在所述计算机处根据所述域中的实体相对于所述域的过去表现来评估所述实体的信誉。
4.如权利要求1中所述的方法,还包括:
在所述计算机处接收来自所述实体以及至少一个其他实体的与事件的预测结果相关的值,所述事件与域关联;
在所述计算机处接收表示所述实体相对于该域的信誉得分的值和表示所述至少一个其他实体相对于该域的信誉得分的值;
在所述计算机处接收域间距离度量,所述域间距离度量指定了分配给所述多对域的反映关系密切性的值;
在所述计算机处计算接收到的与所述事件的预测结果相关的各值的加权平均值,其中所述加权平均值基于相对于该域的与所述实体以及所述至少一个其他实体关联的信誉得分、所述域间距离度量,以及所述实体以及所述至少一个其他实体相对于通过所述域间距离度量被确定为与该域相关的其他域的信誉得分;以及
在所述计算机处生成所述事件的反映事件总体预测的总体预测值,通过计算所述各值的加权平均值来生成所述总体预测值。
5.如权利要求4中所述的方法,还包括:
在所述计算机处将与所述实体以及所述至少一个其他实体中的每个实体的预测结果相关的值和指定所述事件相对于该域的实际结果的值进行比较;
响应于所述比较,在所述计算机处确定所述实体以及所述至少一个其他实体中的每个实体相对于该域的预测误差值,所述预测误差值反映了预测结果值和实际结果值之间的差异;以及
在所述计算机处使用该域的预测误差值来分配或更新所述实体以及所述至少一个其他实体相对于该域和各相关域的信誉得分。
6.如权利要求4中所述的方法,还包括:
在所述计算机处根据所述事件的预测结果更新所述域间距离度量。
7.如权利要求1中所述的方法,其中通过以下函数得到表示信誉的值:
w i , t j = Σ d = 1 , . . . , D ; d ≠ j α jd ∂ Φ ∂ R i , t d ;
其中t表示其间收集事件预测的决策时间,y表示事件结果,d表示域,D表示域的数量,w表示信誉得分,i表示实体的索引,以及R表示预测准确性的度量。
8.如权利要求1中所述的方法,其中通过以下函数确定所述加权平均值:
p d ( t ) = Σ i w i , t - 1 d x i d ( t ) Σ i w i , t - 1 d ;
其中t表示其间收集事件预测的决策时间,d表示域,w表示信誉得分,i表示实体的索引,以及Wi,t-1表示实体i在决策时间t的信誉得分。
9.一种用于实施域间信息质量评定优化的系统,所述系统包括:
计算机;以及
可由所述计算机执行的域间信息质量评定应用,所述域间信息质量评定应用能够执行包括以下操作的方法:
通过标识分别定义每个域的特征和标识具有关联特征的域来计算知识库中域间的关系;
根据所述关联特征向多对域分配反映关系密切性的值;
根据一个域中的实体的过去表现来评估所述实体相对于通过所分配的值被确定为与该域相关的另一域的信誉,所述实体的过去表现指示所述实体呈现有关特定域中的事件的准确预测的能力;
根据所述评估计算表示所述实体相对于该域的信誉的值;以及
将表示所述信誉的值分配给所述实体。
10.如权利要求9中所述的系统,其中所述域表示其中没有所述实体所呈现的预测的先验知识的主题。
11.如权利要求9中所述的系统,其中所述方法还包括:根据所述域中的实体相对于所述域的过去表现来评估所述实体的信誉。
12.如权利要求9中所述的系统,其中所述方法还包括:
接收来自所述实体以及至少一个其他实体的与事件的预测结果相关的值,所述事件与域关联;
接收表示所述实体相对于该域的信誉得分的值和表示所述至少一个其他实体相对于该域的信誉得分的值;
接收域间距离度量,所述域间距离度量指定了分配给所述多对域的反映关系密切性的值;
计算接收到的与所述事件的预测结果相关的各值的加权平均值,其中所述加权平均值基于相对于该域的与所述实体以及所述至少一个其他实体关联的信誉得分、所述域间距离度量,以及所述实体以及所述至少一个其他实体相对于通过所述域间距离度量被确定为与该域相关的其他域的信誉得分;以及
生成所述事件的反映事件总体预测的总体预测值,通过计算所述各值的加权平均值来生成所述总体预测值。
13.如权利要求12中所述的系统,其中所述方法还包括:
将与所述实体以及所述至少一个其他实体中的每个实体的预测结果相关的值和指定所述事件相对于该域的实际结果的值进行比较;
响应于所述比较,确定所述实体以及所述至少一个其他实体中的每个实体相对于该域的预测误差值,所述预测误差值反映了预测结果值和实际结果值之间的差异;以及
使用该域的预测误差值来分配或更新所述实体以及所述至少一个其他实体相对于该域和各相关域的信誉得分。
14.如权利要求12中所述的系统,其中所述方法还包括:
根据所述事件的预测结果更新所述域间距离度量。
15.如权利要求9中所述的系统,其中通过以下函数得到表示信誉的值:
w i , t j = Σ d = 1 , . . . , D ; d ≠ j α jd ∂ Φ ∂ R i , t d ;
其中t表示其间收集事件预测的决策时间,y表示事件结果,d表示域,D表示域的数量,w表示信誉得分,i表示实体的索引,以及R表示预测准确性的度量。
16.如权利要求9中所述的系统,其中通过以下函数确定所述加权平均值:
p d ( t ) = Σ i w i , t - 1 d x i d ( t ) Σ i w i , t - 1 d ;
其中t表示其间收集事件预测的决策时间,d表示域,w表示信誉得分,i表示实体的索引,以及Wi,t-1表示实体i在决策时间t的信誉得分。
CN2011100402097A 2010-02-22 2011-02-18 带有优化的域间信息质量评定的协作联网的方法和系统 Pending CN102163304A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US12/709,823 2010-02-22
US12/709,823 US8560490B2 (en) 2010-02-22 2010-02-22 Collaborative networking with optimized inter-domain information quality assessment

Publications (1)

Publication Number Publication Date
CN102163304A true CN102163304A (zh) 2011-08-24

Family

ID=44464518

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011100402097A Pending CN102163304A (zh) 2010-02-22 2011-02-18 带有优化的域间信息质量评定的协作联网的方法和系统

Country Status (3)

Country Link
US (1) US8560490B2 (zh)
KR (1) KR101790788B1 (zh)
CN (1) CN102163304A (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8781984B2 (en) * 2010-08-05 2014-07-15 Ben Schreiner Techniques for generating a trustworthiness score in an online environment
US9098805B2 (en) 2012-03-06 2015-08-04 Koodbee, Llc Prediction processing system and method of use and method of doing business
US20130254146A1 (en) * 2012-03-06 2013-09-26 Koodbee, Llc Prediction processing system and method of use and method of doing business
US9741259B2 (en) * 2012-10-31 2017-08-22 International Business Machines Corporation Identification for performing tasks in open social media
US9450840B2 (en) * 2013-07-10 2016-09-20 Cisco Technology, Inc. Domain classification using domain co-occurrence information
US9946762B2 (en) 2014-09-16 2018-04-17 International Business Machines Corporation Building a domain knowledge and term identity using crowd sourcing
CN105071961B (zh) * 2015-07-30 2018-12-14 中国人民解放军信息工程大学 一种Web服务的服务质量预测方法和装置
CN113538020B (zh) * 2021-07-05 2024-03-26 深圳索信达数据技术有限公司 获取客群特征关联度方法、装置、存储介质和电子装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2001288311A1 (en) * 2000-08-21 2002-03-04 Forequity Inc System and method for evaluation of ideas and exchange of value
US7536315B2 (en) * 2003-02-13 2009-05-19 Sap Aktiengesellschaft Self-balancing of idea ratings
US7130777B2 (en) * 2003-11-26 2006-10-31 International Business Machines Corporation Method to hierarchical pooling of opinions from multiple sources
US20060009994A1 (en) * 2004-07-07 2006-01-12 Tad Hogg System and method for reputation rating
US8015484B2 (en) * 2006-02-09 2011-09-06 Alejandro Backer Reputation system for web pages and online entities
US8862591B2 (en) * 2006-08-22 2014-10-14 Twitter, Inc. System and method for evaluating sentiment
US20080274444A1 (en) * 2007-05-04 2008-11-06 Toufic Saliba Electronic data exchange
US20090125382A1 (en) * 2007-11-07 2009-05-14 Wise Window Inc. Quantifying a Data Source's Reputation
US8200587B2 (en) * 2008-04-07 2012-06-12 Microsoft Corporation Techniques to filter media content based on entity reputation

Also Published As

Publication number Publication date
KR20110096488A (ko) 2011-08-30
KR101790788B1 (ko) 2017-10-26
US20110208687A1 (en) 2011-08-25
US8560490B2 (en) 2013-10-15

Similar Documents

Publication Publication Date Title
Wang et al. A principled approach to data valuation for federated learning
Hernández-Nieves et al. Fog computing architecture for personalized recommendation of banking products
CN113545026B (zh) 用于漏洞评估和补救措施识别的系统和方法
Zhang et al. Evaluating the trustworthiness of advice about seller agents in e-marketplaces: A personalized approach
US8527447B2 (en) Collaborative networking with optimized information quality assessment
CN104025130B (zh) 计算实体之间的重要性的方法、系统和设备
CN102163304A (zh) 带有优化的域间信息质量评定的协作联网的方法和系统
US8732015B1 (en) Social media pricing engine
Mirghafoori et al. Analysis of the barriers affecting the quality of electronic services of libraries by VIKOR, FMEA and entropy combined approach in an intuitionistic-fuzzy environment
US20160321711A1 (en) Indicating unreliable reviews on a website
Maillé et al. Sponsored search auctions: An overview of research with emphasis on game theoretic aspects
Lupo et al. DINESERV along with fuzzy hierarchical TOPSIS to support the best practices observation and service quality improvement in the restaurant context
Belkhadir et al. An intelligent recommender system using social trust path for recommendations in web-based social networks
CN111798280B (zh) 多媒体信息推荐方法、装置和设备及存储介质
US20220108334A1 (en) Inferring unobserved event probabilities
CN111052167A (zh) 自动化在线交易网络中的智能自适应竞价的方法和系统
Wu et al. Optimization matrix factorization recommendation algorithm based on rating centrality
Ghosh et al. Scalable bid landscape forecasting in real-time bidding
CN113672797A (zh) 一种内容推荐方法及装置
WO2020104806A1 (en) Real-time bidding
CN109829593B (zh) 目标对象的信用度确定方法、装置、存储介质及电子装置
Tayaran et al. A Framework for Online Reverse Auction Based on Market Maker Learning with a Risk‐Averse Buyer
Chan et al. Forecasting online auctions via self‐exciting point processes
Wen et al. Improving the novelty of retail commodity recommendations using multiarmed bandit and gradient boosting decision tree
Gutowska et al. Modelling the B2C Marketplace: Evaluation of a Reputation Metric for e-commerce

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110824