CN104636531A - 为许多建模任务创建可理解模型 - Google Patents

为许多建模任务创建可理解模型 Download PDF

Info

Publication number
CN104636531A
CN104636531A CN201410645043.5A CN201410645043A CN104636531A CN 104636531 A CN104636531 A CN 104636531A CN 201410645043 A CN201410645043 A CN 201410645043A CN 104636531 A CN104636531 A CN 104636531A
Authority
CN
China
Prior art keywords
model
transport function
modeling
covariant
target variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410645043.5A
Other languages
English (en)
Inventor
P·庞佩
M·辛恩
O·费舒尔
M·沃斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Core Usa Second LLC
GlobalFoundries Inc
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN104636531A publication Critical patent/CN104636531A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及为许多建模任务创建可理解模型。在一个实施例中,用于为多个建模任务生成模型的方法包括:由处理设备接收各自具有目标变量和至少一个协变量的多个建模任务,目标变量和至少一个协变量对于所有建模任务是相同的,目标变量和至少一个协变量之间的关系对于所有建模任务是不同的;以及按照以下方式为多个建模任务中的每一个生成包括用于估计建模任务的目标值和至少一个协变量之间的关系的传递函数的模型:至少两个模型共享至少一个相同的传递函数并且模型满足准确性条件。

Description

为许多建模任务创建可理解模型
技术领域
本发明涉及统计建模,并且更具体地涉及为大量统计建模任务创建可理解统计模型。
发明内容
根据本发明的一个实施例,为多个建模任务创建模型的计算机程序产品包括计算机可读存储介质,在该计算机可读存储介质上存储有:第一程序指令,其能够由处理器执行以使处理器接收各自具有目标变量和至少一个协变量的多个建模任务,目标变量和至少一个协变量对于所有建模任务是相同的,目标变量和至少一个协变量之间的关系对于所有建模任务是不同的;以及第二程序指令,其能够由处理器执行以使处理器按照以下方式为多个建模任务中的每一个生成包括用于估计建模任务的目标值和至少一个协变量之间的关系的传递函数的模型:至少两个模型共享相同的传递函数并且模型满足准确性条件。
根据本发明的另一个实施例,用于为多个建模任务生成模型的系统包括处理器,其配置成:接收各自具有目标变量和至少一个协变量的多个建模任务,目标变量和至少一个协变量对于所有建模任务是相同的,目标变量和至少一个协变量之间的关系对于所有建模任务是不同的;以及按照以下方式为多个建模任务中的每一个生成包括用于估计建模任务的目标值和至少一个协变量之间的关系的传递函数的模型:至少两个模型共享相同的传递函数并且模型满足准确性条件。
根据本发明的又一个实施例,用于为多个建模任务生成模型的方法包括:用处理设备接收各自具有目标变量和至少一个协变量的多个建模任务,目标变量和至少一个协变量对于所有建模任务是相同的,目标变量和至少一个协变量之间的关系对于所有建模任务是不同的;按照以下方式为多个建模任务中的每一个生成包括用于估计建模任务的目标值和至少一个协变量之间的关系的传递函数的模型:至少两个模型共享相同的传递函数并且模型满足准确性条件。
附加特征和优点通过本发明的技术实现。本发明的其他实施例和方面在本文中被详细描述、并被认为是要求保护的发明的一部分。为了更好地理解具有所述优点和特征的本发明,参考描述和附图。
附图说明
在说明书的末尾处的权利要求书中特别指出并清楚地要求保护被视为本发明的主题。根据结合附图给出的以下详细描述,本发明的前述和其他特征及优点将是明显的,在附图中:
图1是根据本发明的实施例的用于构建模型的建模系统的示意图。
图2是根据本发明的实施例构建的传递函数的示例分层结构。
图3是根据本发明的实施例的方法的流程图。
图4是根据本发明的实施例构建和修改的一组模型。
图5是根据本发明的实施例的方法的流程图。
图6是根据本发明的实施例的用于构建模型的建模系统的示意图。
图7是根据本发明的实施例的方法的流程图。
图8是根据本发明的实施例构建的一组模型。
具体实施方式
针对大量统计建模任务具有可理解的一组统计模型对于许多实际情景是合乎期望的。例如,公共事业公司可能想要预测该公司在不同位置的800,000个分站中的每一个的能量负荷。该公共事业公司可以为分站中的每一个创建统计模型。这些模型可能在它们使用相同类型的协变量(例如,本地天气条件、当日时间等)这一点上是相关的。然而,对于800,000个模型中的每一个而言,协变量和目标变量(即,能量负荷)之间的关系可能是不同的。为了理解这些800,000个不同的模型,公共事业公司可能必须分别单独地检查800,000个模型。分别单独地检查该大量模型是一项具有挑战性的任务。
对于典型的模型,模型的每个协变量(也被称为输入变量)与传递函数相关联,该传递函数将协变量值变换成目标变量(也被称为输出变量)值。也就是说,传递函数估计协变量和目标变量之间的关系。在公共事业公司示例中,如果每个分站具有十个共同协变量,则潜在地将存在8,000,000(800,000乘以10)个不同的传递函数。这会倍增理解800,000个模型的复杂性,而理解800,000个模型已经是一项具有挑战性的任务。
本发明的实施例提供了为大量相关、但不完全相同的建模任务构建模型的方法。在本发明的实施例中,当任务具有相同数目的协变量并且协变量的类型相同时,认为建模任务是相关的。当协变量和目标变量之间的关系对于每一个建模任务不同时,认为相关的建模任务不完全相同。本发明的一个实施例中的方法通过在维持某一准确性水平的同时将所有模型上的大量不同的传递函数减少为更易管理的数目的传递函数来构建模型。例如,对于上面所讨论的公共事业公司示例,该方法在将800,000个模型的准确性维持在某一阈值误差值内的同时,将不同的传递函数的数目从8,000,000减少为400。
图1是根据本发明的实施例的用于构建模型的建模系统100的示意图。如图所示,系统100包括学习模块105、聚类模块110、选择模块115、模型生成模块120以及预测模块125。系统100还包括建模任务130、原始模型135、聚类的传递函数140、所选的传递函数145、新模型150和预测结果155。
建模任务130包括多组时间序列数据。每组时间序列数据表示在一时间段内观测到的目标变量的值。建模任务还包括在相同的时间段内观测到的输入变量的值。系统100构建模型,其可以用于基于这些先前观测到的值来预测目标变量的未来值。
学习模块105分析建模任务130以学习原始模型135。原始模型135中的每一个可以用于预测建模任务130的目标变量的值。学习模块105可以采用一个或多个已知建模技术(例如,回归建模、ARIMAX建模等)来学习原始模型135。在本发明的一个实施例中,学习模块105通过利用加性模型(AM)公式分析建模任务130,所述加性模型公式可以表示为:
Y = Σ i = 1 I X 1 i + Σ j = 1 J f j ( X 2 j | C j ) + Σ k = 1 K g k ( X 3 k , X 4 k | C k )
其中Y为目标变量;I、J和K为正整数;X11到X1I、X21到X2J、X31到X3K以及X41到X4K为协变量;函数f1到fJ以及g1到gK是用于将协变量值变换成目标变量值的传递函数;C1到CK是指示相应传递函数对于给定数据点是否有效的条件。此外,X3k和X4k表示两个协变量的组合,所述两个协变量可以是传递函数gk的输入;k为协变量组合的索引号;以及X1、X2、X3、X4和Y为时间的函数并且对于不同的建模任务具有不同的值。
出于简化描述的目的,上面的模型公式仅具有那些将一个协变量或两个协变量的组合作为输入的传递函数。然而,公式可以包括附加的传递函数,其可以将三个或更多协变量的组合作为输入。此外,公式可以不包括将两个协变量的组合作为输入的传递函数(例如,传递函数g1到gK可以不是模型公式的一部分)。此外,公式可以不包括与传递函数不关联的协变量(例如,X11到X1I)。
建模任务中的每一个可以表示为以下公式:
Y h ≅ Σ i = 1 I X 1 i , h + Σ j = 1 J f j , h ( X 2 j , h | C j , h ) + Σ k = 1 K g k , h ( X 3 k , h , X 4 k , h | C k )
其中h为标识建模任务的索引,并且Yh表示建模任务中的目标变量的实际数据值。学习模块通过解决以下最优化问题来学习建模任务中的每一个的原始模型:
min ( | | Y h - ( Σ i = 1 I X 1 i , h + Σ j = 1 J f j , h ( X 2 j , h | C j , h ) + Σ k = 1 K g k , h ( X 3 k , h , X 4 k , h | C k ) ) | | 2 - Pen h )
其中Penh是控制所学习模型的平滑度的罚函数(penalization)。
假定存在M(正整数)个建模任务130,对于M个模型135可能存在多达M×(J+K)个不同的传递函数。可以通过下述方式来唯一地标识传递函数中的每一个:(1)与传递函数相关联的协变量,以及(2)从其中学习模型的建模任务。例如,建模任务8的协变量X17的传递函数可以被标识为f7,8(X17|C7,8)。同样地,建模任务3的两个协变量(例如,协变量X31和X41)的组合6的传递函数可以被标识为g6,3(X36,3,X4,6,3|C6)。
聚类模块110将原始模型135的传递函数归组成类似传递函数的聚类。特别地,本发明的实施例中的聚类模块110构建与相同协变量或相同协变量组合相关联的传递函数的聚类的分层结构。聚类模块110为模型公式中的传递函数中的每一个构建这样的分层结构。例如,对于上面所述的模型公式,聚类模型110可以为J+K个传递函数f1到fJ以及g1到gK构建J+K个分层结构。
在本发明的实施例中,聚类模块110采用一个或多个已知聚类技术(例如,凝聚法、分裂法等)来构建聚类的分层结构。图2示出聚类模块110构建的传递函数的聚类的示例分层结构200。聚类的分层结构200可以被视为是这样的树:在该树中,较小的聚类合并到一起以创建下一个更高层的聚类。也就是说,在分层结构的顶部是单个聚类205,其包括与相同协变量或相同协变量组合相关联的所有不同的传递函数。在分层结构200的底部,存在和与相同协变量或相同协变量组合相关联的不同传递函数的数目一样多的不同聚类。在分层结构底部的这些聚类中的每一个包括单个传递函数。
使用由聚类模块110构建的分层结构,选择模块115为原始模型135的传递函数中的每一个选择传递函数。模型生成模块120随后用选择模块115所选择的传递函数替换原始模型的传递函数,以便构建新模型150。
现在将参考图2描述遍历分层结构以寻找将要替换原始模型的传递函数的一组传递函数的示例。为了选择传递函数,本发明的一个实施例中的选择模块115从分层结构的顶部朝分层结构的底部遍历聚类的分层结构200,直到实现期望的准确性。在本发明的一个实施例中,当由替换的传递函数变换的目标变量值和由替换前的原始传递函数变换的相应目标变量值之间的差异在阈值内时,选择模块110实现期望的准确性。
在本发明的一个实施例中,选择模块115将特定聚类中的传递函数中的一个识别为表示特定聚类的传递函数。选择模块115通过将每个传递函数的协变量的值变换成目标变量值,来为那些具有属于特定聚类的转移函数的模型计算目标变量值。选择模块115随后把导致变换值和由原始传递函数变换的相应值之间的最小差异量的传递函数指定为特定聚类的代表性传递函数。
出于简化描述的目的,假定分层结构200顶部处的聚类205具有与相同协变量X9相关联的三个传递函数f9,3、f9,4和f9,5。这三个传递函数分别属于原始模型3、4和5。选择模块115用f9,3替换原始模型中的f9,3、f9,4和f9,5并计算目标变量值。聚类模块110随后将这些目标变量值与通过未将传递函数f9,3、f9,4和f9,5替换为f9,3的模型3、4和5计算出的目标变量值进行比较,以便计算目标变量值的差异。聚类模块110为f9,4和f9,5重复计算和比较,随后把导致目标变量值的最小差异量的传递函数识别为聚类的代表性传递函数。
一旦为聚类205指定了代表性传递函数,选择模块115比较以下两者:(1)通过用代表性传递函数替换原始模型的属于聚类205的所有传递函数而产生的目标变量值;以及(2)由替换前的原始传递函数产生的目标变量值。当该比较导致在所期望的阈值内的目标变量值差异时,选择模块115选择代表性传递函数、并且在分层结构200上不进一步向下移动。
当该比较没有导致在所期望的阈值内的目标变量值差异时,选择模块115向下移动到聚类分层结构200的下一个更低层。例如,在分层结构200的下一个更低层处,存在传递函数的两个聚类、并且因此两个传递函数将表示原始模型的所有不同的传递函数。也就是说,在分层结构200的该层处,原始模型的不同传递函数中的每一个属于传递函数的两个聚类中的一个。选择模块115对于分层结构的该层处的这两个聚类中的每一个重复代表性传递函数的指定以及目标变量值的比较。
分别为两个聚类确定是否在分层结构200上进一步向下移动。也就是说,当两个聚类中的一个聚类的代表性传递函数满足所期望的阈值时,选择模块115选择该代表性传递函数以便替换原始模型的属于该聚类的所有传递函数,并停止在分层结构上进一步向下移动。当两个聚类中的一个聚类的代表性传递函数不满足所期望的阈值时,选择模块115沿着从该聚类起源的分支在分层结构上向下移动。
以这种方式,选择模块115“修剪”表示分层结构200的树,从而减少模型中的与相同协变量或相同协变量组合相关联的不同传递函数的数目。选择模块115为所有分层结构140重复该修剪过程,其中由聚类模块110为模型公式中的所有协变量或协变量组合创建所有分层结构140。如此,选择模块115将原始模型的大量不同传递函数减少为易于管理的数目的不同传递函数。
在本发明的一个实施例中,选择模块115将来自用户的输入作为所期望的阈值。可选地或结合地,选择模块115将来自用户的输入作为不同传递函数的期望数目。选择模块115使用不同传递函数的该期望数目来确定选择模块115为原始模型在每个分层结构上向下遍历多远。例如,选择模块115向下移动到每个分层结构的这样的层,在该层处的聚类数目是所述期望数目除以原始建模任务130的数目。
在本发明的一个实施例中,选择模块115配置成使所期望的阈值和/或不同传递函数的期望数目被预定义。也就是说,在本发明的该实施例中,选择模块115配置成自动地选择传递函数而无需取得用户输入。
选择模块115将所选的传递函数145提供给模型生成模块120。在本发明的一个实施例中,所选的传递函数145中的每一个指示要替换原始模型130的哪个(或哪些)传递函数。模型生成模块145通过用所选的传递函数145替换原始模型130的传递函数来产生新模型150。
预测模块125通过使用新模型150预测建模任务130的目标变量值来产生预测结果155。在本发明的实施例中,预测模块125是系统100的可选模块。也就是说,系统100可以不执行目标变量值的预测、并在新模型150的构建处停止。新模型150可用于其他分析,诸如回归和分类(其中新模型中的传递函数可以表示两类建模任务之间的分界面)。例如,可以按照“有多少模型使用第二协变量的传递函数T35”或“示出使用传递函数T98的所有模型”等来进行查询。
图3是示出根据本发明的实施例的用于构建一组可理解模型的方法的流程图。在方框310,该方法接收一组建模任务。如上所述,建模任务包括目标变量和协变量的一组时间序列数据,其中基于该组时间序列数据作出目标变量值的预测。所接收的建模任务具有相同数目的协变量,并且所接收的建模任务的协变量的类型相同。作为简化的示例,该方法接收三个建模任务,以便基于家庭的各个区域中的风速和温度的影响来预测三个区域中的家庭能量消耗。
在方框320,该方法为在方框310处接收的建模任务中的每一个学习原始模型。在本发明的实施例中,该方法通过利用模型公式、并解决如上所述的最优化问题来学习原始模型。原始模型中的每一个具有一组传递函数。每个传递函数与协变量或协变量组合相关联。在家庭能量消耗示例中,该方法产生如图4的左列中所示的三个原始模型1、2和3。三个原始模型中的每一个具有两个传递函数—针对模型1的f1和f4、针对模型2的f2和f5、以及针对模型6的f3和f6。如图所示,六个传递函数相互不同。
再次参考图3,该方法在方框330处随后选择原始模型的传递函数的子集,以便减少从建模任务学习的不同传递函数的数目。在本发明的一个实施例中,该方法选择子集,使得通过用所选的子集替换原始模型的传递函数而从原始模型构建的模型与原始模型相比维持某一准确性水平。下面将参考图5进一步描述用于选择原始模型的传递函数的子集的示例方法。参考针对家庭能量示例的图4,该方法选择四个传递函数f2、f3、f4和f5,如图4的中间列所示。更具体地,该方法优于类似于f2的f1选择f2、并且优于类似于f4的f6选择f4。
返回来参考图3,该方法在方框340通过用在方框330处选择的传递函数中的一个替换原始模型的传递函数中的每一个来修改原始模型。在家庭能量消耗示例中,该方法通过用f2替换f1来修改模型1,并通过用f4替换f6来修改模型3,如图4的右列所示。在方框350,该方法可选地使用更新后的模型为建模任务作出预测。
图5是示出根据本发明的一个实施例的用于选择从一组建模任务学习的一组原始模型的传递函数的子集的方法的流程图。在方框510,该方法接收一组原始模型。原始模型中的每一个具有一个或多个用于将协变量值变换成目标变量值的不同传递函数。传递函数中的每一个与协变量或者两个或更多协变量的组合相关联。
在方框520,该方法分层次地对原始模型的不同传递函数进行归一化(normalize)和聚类。具体地,该方法将那些与相同协变量或相同协变量组合相关联的传递函数归组成类似传递函数的聚类。该方法可以采用一个或多个已知聚类技术使传递函数聚类以产生聚类的分层结构,在所述聚类的分层结构中较小的聚类合并到一起以创建下一个更高层的聚类。该方法为与相同协变量或相同协变量组合相关联的每组传递函数产生分层结构。也就是说,该方法产生与模型公式中不同传递函数的数目一样多的这样的分层结构。
在方框530,该方法移动到与协变量或协变量组合相关联的传递函数的聚类的下一个分层结构。在方框540,该方法向下移动到分层结构中的下一个更低层,并识别分层结构的该层处的所有聚类。当该方法最初移动到一个分层结构时,下一个更低层是该分层结构的顶层,在该顶层中一个聚类包括与协变量或协变量组合相关联的所有不同传递函数。
在方框550,该方法分析分层结构的当前层处的聚类中的下一个聚类。在本发明的一个实施例中,该方法将聚类中的传递函数中的一个识别为表示该特定聚类的传递函数。该方法通过将传递函数中的每一个的协变量的值变换成目标变量值,来为那些具有属于该聚类的传递函数的模型计算目标变量值。该方法随后把导致变换值和由原始传递函数变换的相应值之间的最小差异量的传递函数指定为该聚类的代表性传递函数。
在判定方框560,该方法确定聚类是否满足准确性条件。在本发明的一个实施例中,该方法比较以下两者:(1)通过用代表性传递函数替换原始模型的属于该聚类的所有传递函数而产生的目标变量值(或平均目标变量值);以及(2)由替换前的原始传递函数产生的目标变量值(或平均目标变量值)。当该比较导致所期望的阈值内的目标变量值差异时,该方法确定聚类满足准确性条件。否则,该方法确定聚类不满足准确性条件。
当该方法在判定方框560确定聚类不满足准确性条件时,该方法循环回到方框540,以沿着从该聚类起源的分支移动到分层结构的下一个更低层。当该方法在判定方框560确定聚类满足准确性条件时,该方法进行到方框570,在方框570中该方法停止向下移动分层结构(即,修剪从该聚类起源的分支)并为该聚类选择代表性传递函数。
在判定方框580,该方法确定在分层结构的当前层处是否存在尚未分析的另一个聚类。当该方法确定在当前层处存在这样的聚类时,该方法循环回到方框550以分析该聚类。否则,该方法进行到判定方框590,以确定在比当前层高一个层的层处是否存在尚未分析的聚类。当该方法在判定方框590确定在更高层处存在这样的聚类时,该方法循环回到方框550以分析该聚类。
在判定方框599,该方法确定是否存在尚未遍历的另一个分层结构。当该方法确定存在另一个分层结构时,该方法循环回到方框530以遍历该分层结构。
本发明的替代实施例提供了一种基于用户输入为大量相关、但不完全相同的建模任务构建模型的方法,其中所述用户输入指示针对建模任务的哪些模型应该共享一个或更多完全相同的传递函数。该方法不从建模任务学习模型并选择传递函数的子集以便减少不同传递函数的数目。而是,该方法使用用户输入来产生减少的数目的不同传递函数。在一个实施例中,由熟知协变量(例如,温度、风速等)和目标变量(例如,公共事业公司的分站上的能量负荷)之间的关系的领域专家来提供用户输入。
图6是根据本发明的实施例的用于构建模型的建模系统600的示意图。如图所示,系统600包括学习模块605和预测模块610。系统600还包括建模任务615、共享信息620、模型625和预测结果630。
建模任务615包括多组时间序列数据。每组时间序列数据表示在一时间段内观测到的目标变量的值。建模任务还包括在相同的的时间段内观测到的输入变量的值。系统600构建模型,其可以用于基于这些先前观测到的值来预测目标变量的未来值。
在本发明的一个实施例中,共享信息620是由用户施加在为建模任务615构建的模型上的一组约束(constraint)。具体地,约束中的每一个指示模型中的哪些应该共享一个或更多完全相同的传递函数。在本发明的一个实施例中,领域专家提供该共享信息。
学习模块605分析建模任务615以学习模型625。模型625中的每一个可以用于预测建模任务615的目标变量的值。如同上面参考图1所描述的学习模块105,学习模块605可以利用一个或多个已知建模技术和AM公式来学习模型625。然而,学习模块605通过施加一组约束620来学习模型使得模型共享一个或多个完全相同的传递函数,而不是如学习模块105那样学习具有不同传递函数的不同模型。以这种方式,学习模块605减少模型中的不同传递函数的数目,而无需使传递函数聚类并使用聚类来选择传递函数的子集。
对于在一组约束620中的每一个约束中识别的模型,本发明的一个实施例的学习模块605共同地学习这些模型。具体地,学习模块605合并建模任务、并随后从所合并的建模任务学习这些模型。例如,可以使用以下两个模型公式学习两个建模任务:
M 1 : Y 1 ≅ Σ i = 1 I X 1 i , 1 + Σ j = 1 J f j , 1 ( X 2 j , 1 | C j , 1 ) + Σ k = 1 K g k , 1 ( X 3 k , 1 , X 4 k , 1 | C k )
M 2 : Y 2 ≅ Σ i = 1 I X 1 i , 2 + Σ j = 1 J f j , 2 ( X 2 j , 2 | C j , 2 ) + Σ k = 1 K g k , h ( X 3 k , 2 , X 4 k , 2 | C k )
作为示例,假定特定约束指示模型公式M1中的传递函数f1,1(X21,1|C1)应该与模型公式M2中的传递函数f1,2(X21,2|C1)完全相同。换句话说,约束指示:与协变量X21相关联的传递函数f1应该由从建模任务1和2学习的模型共享。随后,学习模块605可以通过解决以下联合最优化问题来学习两个模型:
min ( μ 1 × Term M 1 + μ 2 × Term M 2 + μ constraint × Term similarity _ constraint )
其中:
Term M 1 = | | Y 1 - ( Σ i = 1 I X 1 i , 1 + Σ j = 1 J f j , 1 ( X 2 j , 1 | C j ∩ data _ set = = 1 ) + Σ k = 1 K g k , 1 ( X 3 k , 1 , X 4 k , 1 | C k , joined ) ) | | 2 - Pen 1
Term M 2 = | | Y 2 - ( Σ i = 1 I X 1 i , 2 + Σ j = 1 J f j , 2 ( X 2 j , 2 | C j ∩ data _ set = = 2 ) + Σ k = 1 K g k , 2 ( X 3 k , 2 , X 4 k , 2 | C k , joined ) ) | | 2 - Pen 2
Termsimliarity_constraint=||f1,1(X21,1|C1)-f1,2(X21,2|C1)||2
其中用于使模型M1尽可能接近地适合建模任务1的数据集D1、并且用于使模型M1尽可能接近地适合建模任务2的数据集D2。数据集D1和D2为:
D1=[X11,1~X1I,1,X21,1~X2J,1,X31,1~X3K,1,X41,1~X4K,1,Y1]
D2=[X11,2~X1I,2,X21,2~X2J,2,X31,2~X3K,2,X41,2~X4K,2,Y2]
Termsimliarity_constraint针对模型公式M1中的函数f1,1(X21,1|C1)和模型公式M2中的函数f1,2(X21,2|C1)之间的差异来惩罚模型。参数μ1、μ2和μconstraint是分别分配给和Termsimilarity_constraint的权重,以用于平衡模型M1和M2中的每一个模型的准确性标准和函数相似性标准。
在具有指示符的合并的数据集D1∪2上训练联合最优化问题,其中所述指示符被添加以指示针对数据点的源数据集。该合并的数据集可以采取以下形式:
D 1 ∪ 2 = X 1 1,1 ~ X 1 I , 1 , X 2 1,1 ~ X 2 J , 1 , X 3 1,1 ~ X 3 K , 1 , X 4 1,1 ~ X 4 K , 1 , Y 1 , data _ set = 1 X 1 1,2 ~ X 1 I , 2 , X 2 1,2 ~ X 2 J , 2 , X 3 1,2 ~ X 3 K , 2 , X 4 1,2 ~ X 4 K , 2 , Y 2 , data _ set = 2
在联合最优化问题的中,利用源数据集指示符data_set来扩展传递函数fj和fk的条件Cj和Ck,以便确保给定模型的传递函数仅对于给定模型的数据点是有效的。
以类似方式,学习模块605可以利用一个或多个约束将三个或更多模型结合在一起。针对具有共同传递函数的三个或更多模型的联合最优化问题可以为以下形式:
min ( Σ h = 1 H μ h Term M h + Σ l = 0 L μ constraint Term similarity _ constraint )
其中H为模型的数目,并且L(正整数)为不同约束的数目。
图7是示出根据本发明的实施例的用于构建一组可理解模型的方法的流程图。在方框710,该方法接收一组建模任务。如上所述,建模任务包括目标变量和协变量的一组时间序列数据,其中可以基于所述一组时间序列数据作出对目标变量值的预测。所接收的建模任务具有相同数目的协变量,并且所接受的建模任务的协变量的类型相同。作为简化的示例,该方法接收三个建模任务,以便基于家庭的各个区域中的风速和温度的影响,来为三个区域中的家庭能量消耗建模。
在方框720,该方法接收共享信息(例如,一组约束),其指示针对建模任务的哪些模型应该共享一个或多个完全相同的传递函数。在本发明的一个实施例中,该方法从用户(例如,熟知协变量和目标变量之间关系的领域专家)接收共享信息。可选地或结合地,该方法从建模系统(例如,上面参考图1描述的建模系统100)接收共享信息,所述建模系统聚类并选择传递函数、并且因此知道针对哪些建模任务的哪些模型应该共享完全相同的传递函数。
在家庭能量消耗示例中,该方法将产生三个模型1、2和3,每个模型具有与两个协变量(温度和风速)相关联的两个传递函数。领域专家提供共享信息,其指示与温度相关联的传递函数对于模型1和2应当完全相同、并且与风速相关联的传递函数对于模型1和3应当完全相同。也就是说,对于该方法存在要学习的四个不同的传递函数,而不是在没有领域专家提供共享信息的情况下将要学习的六个不同的传递函数。
在方框730,该方法通过施加共享信息来从那些建模任务学习模型。对于由共享信息识别的模型,该方法通过联合若干个用于分别单独地学习模型的最优化问题,来制定联合最优化问题。该方法还把要从其中学习模型的建模任务的数据集结合在一起。该方法随后通过基于结合后的数据集解决联合最优化问题来学习模型。图8示出学习家庭能量消耗示例中的模型1、2和3的结果。基于在720由领域专家提供的信息,该方法同时学习四个不同的传递函数g1-g4。
所属技术领域的技术人员知道,本发明的各个方面可以实现为系统、方法或计算机程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、驻留软件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。此外,在一些实施例中,本发明的各个方面还可以实现为在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读的程序代码。
可以采用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
下面将参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述本发明。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些计算机程序指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。
也可以把这些计算机程序指令存储在计算机可读介质中,这些指令使得计算机、其它可编程数据处理装置、或其他设备以特定方式工作,从而,存储在计算机可读介质中的指令就产生出包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的指令的制造品。
计算机程序指令还可以加载到计算机、其它可编程数据处理装置或其他设备上,以使一系列操作步骤在计算机、其它可编程装置或其他设备上被执行以产生计算机实现的过程,使得在计算机或其它可编程装置上执行的指令提供用于实现流程图和/或框图中的一个或多个方框中规定的功能/动作的处理。
附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
在此所用的术语仅用于描述特定实施例的目的,并且并非旨在限制本发明。如在此所使用的,单数形式的“一”、“一个”和“该”旨在也包括复数形式,除非上下文另有明确指示。将进一步理解的是,当在本说明书中使用时,术语“包括”和/或“包含”指的是所陈述的特征、整数、步骤、操作、元件和/或组件的存在,而并不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组合的存在或附加。
下面的权利要求中的所有装置或步骤加功能元件的对应结构、材料、动作和等效体意在包括任何用于结合其他明确宣称的宣称元件来执行功能的结构、材料或动作。本发明的描述已为说明和描述之目的而被呈现,而非意在是无遗漏的或局限于所公开形式的发明。在不脱离本发明的范围和精神的前提下,许多修改和变化对于本领域普通技术人员来说将是明显的。实施例被选择并描述以便最佳解释本发明的原理和实际应用,并且使得本领域普通技术人员能够理解本发明从而获得具有适合于所预期的特定用途的各种修改的各种实施例。
本文所描绘的流程图仅是一个示例。在不脱离本发明的精神的情况下,可以存在对该流程图或本文所描述的步骤(或操作)的许多变化。例如,可以以不同的顺序执行这些步骤,或者可以增加、删除或修改步骤。所有这些变化都应被视为所要求保护的发明的一部分。
尽管已经描述了本发明的优选实施例,但应理解的是,本领域技术人员在现在以及未来都可以作出落入所附权利要求的范围内的各种改进和增强。这些权利要求应被解释为维持对最先描述的发明的适当保护。

Claims (13)

1.一种用于为多个建模任务生成模型的系统,所述系统包括处理器,所述处理器配置成:
接收各自具有目标变量和至少一个协变量的所述多个建模任务,所述目标变量和所述至少一个协变量对于所有建模任务是相同的,所述目标变量和所述至少一个协变量之间的关系对于所有建模任务是不同的;以及
按照以下方式为所述多个建模任务中的每一个生成包括用于估计建模任务的目标值和所述至少一个协变量之间的关系的传递函数的模型:至少两个模型共享至少一个相同的传递函数并且所述模型满足准确性条件。
2.如权利要求1所述的系统,其中所述处理器还配置成:从用户接收输入,所述输入指示哪些模型应该共享所述至少一个相同的传递函数;以及基于所述输入生成所述模型。
3.如权利要求1所述的系统,其中所述多个建模任务中的每一个具有数据集,所述数据集包括所述至少一个协变量的值和所述目标变量的值,其中所述处理器配置成还通过同时从与所述模型相对应的所述数据集学习所述模型来生成所述模型。
4.如权利要求3所述的系统,其中所述学习包括:
通过将所述模型结合在一起来制定最优化问题;
将与所述模型相对应的数据集结合在一起;以及
通过基于结合后的数据集解决所述最优化问题,使所述模型适合所述结合后的数据集。
5.如权利要求4所述的系统,其中解决所述最优化问题包括:使目标变量值和由所述传递函数估计的值之间的差异最小化。
6.如权利要求1所述的系统,其中所述处理器还配置成:使用针对特定建模任务的模型来为所述特定建模任务预测目标变量值。
7.如权利要求1所述的系统,其中所述处理器配置成通过以下方式生成所述模型:
从所述建模任务学习所述传递函数,使得所述传递函数对于所有模型是不同的;
选择所述传递函数的子集;以及
通过用所述传递函数的所述子集替换所述模型的所述传递函数来修改所述模型。
8.一种用于为多个建模任务生成模型的方法,所述方法包括:
由处理设备接收各自具有目标变量和至少一个协变量的所述多个建模任务,所述目标变量和所述至少一个协变量对于所有建模任务是相同的,所述目标变量和所述至少一个协变量之间的关系对于所有建模任务是不同的;以及
按照以下方式为所述多个建模任务中的每一个生成包括用于估计建模任务的目标值和所述至少一个协变量之间的关系的传递函数的模型:至少两个模型共享至少一个相同的传递函数并且所述模型满足准确性条件。
9.如权利要求8所述的方法,其中生成所述模型包括:
从所述建模任务学习所述传递函数,使得所述传递函数对于所有模型是不同的;
选择所述传递函数的子集;以及
通过用所述传递函数的所述子集替换所述模型的所述传递函数来修改所述模型。
10.如权利要求9所述的方法,其中选择所述子集包括:
基于所述传递函数的相似性创建所述传递函数的分层结构;以及
通过遍历所述传递函数的分层结构直到找到满足所述准确性条件的一组传递函数,来选择所述一组传递函数。
11.如权利要求10所述的方法,其中当通过所述分层结构中的第一传递函数估计的值与通过一模型的将被所述第一传递函数替换的第二传递函数估计的值之间的差异在阈值差异内时,所述准确性条件得到满足。
12.如权利要求9所述的方法,还包括从用户接收要选择的传递函数的数目。
13.如权利要求8所述的方法,其中所述生成步骤包括:
从用户接收输入,所述输入指示哪些模型应该共享所述至少一个相同的传递函数;以及
基于所述输入生成多个模型。
CN201410645043.5A 2013-11-13 2014-11-12 为许多建模任务创建可理解模型 Pending CN104636531A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14/079,170 US20150134306A1 (en) 2013-11-13 2013-11-13 Creating understandable models for numerous modeling tasks
US14/079170 2013-11-13

Publications (1)

Publication Number Publication Date
CN104636531A true CN104636531A (zh) 2015-05-20

Family

ID=53044506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410645043.5A Pending CN104636531A (zh) 2013-11-13 2014-11-12 为许多建模任务创建可理解模型

Country Status (2)

Country Link
US (2) US20150134306A1 (zh)
CN (1) CN104636531A (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
US10795347B2 (en) * 2018-09-28 2020-10-06 Rockwell Automation Technologies, Inc. Systems and methods for controlling industrial devices based on modeled target variables
WO2020174672A1 (en) * 2019-02-28 2020-09-03 Nec Corporation Visualization method, visualization device and computer-readable storage medium
CN114629852A (zh) * 2022-03-14 2022-06-14 中国银行股份有限公司 银行业务数据的传输方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5325293A (en) * 1992-02-18 1994-06-28 Dorne Howard L System and method for correlating medical procedures and medical billing codes
CN1494870A (zh) * 2002-09-17 2004-05-12 西门子共同研究公司 用于心脏磁共振灌注数据的综合影像配准
US20080235052A1 (en) * 2007-03-19 2008-09-25 General Electric Company System and method for sharing medical information between image-guided surgery systems
US20110270044A1 (en) * 2010-05-03 2011-11-03 Ron Kimmel Surgery planning based on predicted results

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6199018B1 (en) * 1998-03-04 2001-03-06 Emerson Electric Co. Distributed diagnostic system
US7251791B2 (en) * 2004-01-20 2007-07-31 Sheng-Guo Wang Methods to generate state space models by closed forms and transfer functions by recursive algorithms for RLC interconnect and transmission line and their model reduction and simulations

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5325293A (en) * 1992-02-18 1994-06-28 Dorne Howard L System and method for correlating medical procedures and medical billing codes
CN1494870A (zh) * 2002-09-17 2004-05-12 西门子共同研究公司 用于心脏磁共振灌注数据的综合影像配准
US20080235052A1 (en) * 2007-03-19 2008-09-25 General Electric Company System and method for sharing medical information between image-guided surgery systems
US20110270044A1 (en) * 2010-05-03 2011-11-03 Ron Kimmel Surgery planning based on predicted results

Also Published As

Publication number Publication date
US20150134306A1 (en) 2015-05-14
US20150134307A1 (en) 2015-05-14

Similar Documents

Publication Publication Date Title
Abbasi et al. Predicting solutions of large-scale optimization problems via machine learning: A case study in blood supply chain management
Manjarres et al. A survey on applications of the harmony search algorithm
WO2020040763A1 (en) Real-time production scheduling with deep reinforcement learning and monte carlo tree search
CN113361680B (zh) 一种神经网络架构搜索方法、装置、设备及介质
CN112382082A (zh) 一种拥堵区域交通运行状态预测方法及系统
CN102402716B (zh) 智能生产决策支持系统
CN106527381B (zh) 一种面向并行批处理机动态调度的快速评估方法
CN102214213A (zh) 一种采用决策树的数据分类方法和系统
Pereira Jr et al. On multicriteria decision making under conditions of uncertainty
CN104182489B (zh) 一种文本大数据的查询处理方法
CN104636531A (zh) 为许多建模任务创建可理解模型
CN104331749A (zh) 基于模拟退火粒子群的agv优化调度方法
CN103337041A (zh) 基于知识工程的混凝土坝浇筑施工智能决策系统及其方法
Scholz-Reiter et al. Prediction of customer demands for production planning–Automated selection and configuration of suitable prediction methods
Araújo et al. An evolutionary morphological approach for software development cost estimation
CN107392307A (zh) 并行化时序数据的预测方法
CN108984830A (zh) 一种基于模糊网络分析的建筑能效评价方法及装置
Yasodha et al. Data mining classification technique for talent management using SVM
Xu et al. AGNP: Network-wide short-term probabilistic traffic speed prediction and imputation
Qian et al. Short-term wind speed prediction with a two-layer attention-based LSTM
Rodzin et al. Theory of bioinspired search for optimal solutions and its application for the processing of problem-oriented knowledge
Uguz et al. A new algorithm based on artificial bee colony algorithm for energy demand forecasting in Turkey
Khalifelu et al. A new approach in software cost estimation using regression based classifier
CN116975782A (zh) 基于多层次信息融合的层次化时间序列预测方法和系统
CN117094535A (zh) 基于人工智能的能源补给管理方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20171110

Address after: Grand Cayman, Cayman Islands

Applicant after: GLOBALFOUNDRIES INC.

Address before: American New York

Applicant before: Core USA second LLC

Effective date of registration: 20171110

Address after: American New York

Applicant after: Core USA second LLC

Address before: American New York

Applicant before: International Business Machines Corp.

TA01 Transfer of patent application right
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150520

WD01 Invention patent application deemed withdrawn after publication