CN117099084A - 增量规则条件评估 - Google Patents

增量规则条件评估 Download PDF

Info

Publication number
CN117099084A
CN117099084A CN202280026021.3A CN202280026021A CN117099084A CN 117099084 A CN117099084 A CN 117099084A CN 202280026021 A CN202280026021 A CN 202280026021A CN 117099084 A CN117099084 A CN 117099084A
Authority
CN
China
Prior art keywords
rule
rule set
input
evaluation
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280026021.3A
Other languages
English (en)
Inventor
D·R·切里顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OptumSoft Inc
Original Assignee
OptumSoft Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OptumSoft Inc filed Critical OptumSoft Inc
Publication of CN117099084A publication Critical patent/CN117099084A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Technology Law (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

接收与基于规则的系统相关联的第一规则集。至少部分通过以下操作来执行增量规则评估,其中在规则评估开始时并非所有输入值都是已知的:选择要为其确定第一新值的第一输入;确定第一新值;以及通过基于第一输入值从第一规则集移除其规则条件可能不再为真的规则来确定第二规则集。

Description

增量规则条件评估
对其他应用的交叉引用
本申请要求2021年2月8日提交的题为“INCREMENTAL RULE CONDITIONEVALUATION”的美国临时专利申请第63/147,130号的优先权,该申请通过引用并入本文以用于所有目的。
背景技术
对于传统的基于规则的系统,在评估规则条件时,假设所有输入都是可用的,评估规则条件以确定此时应该“触发”的规则。在规则条件被评估时,使所有输入都可用可能是昂贵的。
附图说明
在以下详细描述和附图中公开了本发明的各种实施例。
图1是示出根据一些实施例的用于增量规则条件评估的编程计算机/服务器系统的功能图。
图2A是示出传统规则评估的框图,其中所有值在评估开始时可用。
图2B是RCI应用的症状的故障场景向量的示例的图示。
图2C是作为根本原因表的RCI应用的规则条件表的图示。
图3是示出增量规则条件评估过程的实施例的流程图。
图4是示出当一些输入值先前已知时,过程增量规则条件评估的实施例的流程图。
图5是合取规则条件表表示的实施例的图示。
图6是示出规则集的增量评估过程的实施例的流程图。
图7是示出用于执行增量规则评估的过程的实施例的流程图。
具体实施方式
本发明可以以多种方式实现,包括作为过程;装置;系统;物质的组成;体现在计算机可读存储介质上的计算机程序产品;和/或处理器,例如被配置为执行存储在耦合到处理器的存储器上和/或由该存储器提供的指令的处理器。在本说明书中,这些实现或者本发明可以采取的任何其他形式可以被称为技术。通常,在本发明的范围内,所公开的过程的步骤顺序可以改变。除非另有说明,否则被描述为被配置成执行任务的诸如处理器或存储器的组件可以被实现为被临时配置成在给定时间执行任务的通用组件,或者被制造成执行该任务的特定组件。如这里所使用的,术语“处理器”指的是被配置成处理诸如计算机程序指令的数据的一个或多个设备、电路和/或处理核心。
下面提供了本发明的一个或多个实施例的详细描述,以及说明本发明原理的附图。结合这些实施例描述了本发明,但是本发明不限于任何实施例。本发明的范围仅由权利要求限定,并且本发明涵盖许多替代、修改和等同物。为了提供对本发明的全面理解,在以下描述中阐述了许多具体细节。这些细节是出于示例的目的而提供的,并且本发明可以根据权利要求来实践,而无需这些具体细节中的一些或全部。为了清楚的目的,没有详细描述与本发明相关的技术领域中已知的技术材料,以免不必要地模糊本发明。
公开了增量规则条件评估。如此处所指的,“增量规则条件评估”包括至少部分地通过在评估时确定一个或多个规则条件的输入值来缩减规则集。
在一个实施例中,并非所有的规则输入最初都是已知的。缩减规则集可以最小化测试/遥测收集的成本,和/或每个增量评估显著减少可能被期望触发或被采取行动的规则的收集。在一个实施例中,适应规则动作的适当子集的初始假设(和后续假设)。
在一个实施例中,通过在评估时选择一个或多个规则条件的输入Ii,确定该输入Ii的值,并将规则集缩减为该规则集的子集(该子集包含基于输入Ii的当前确定值而可能为真的规则),来增量地评估规则集。非限制性的说明性示例是医疗和/或医疗决策制定中的鉴别诊断,以通过测试过程确定一个或多个患者问题。
图1是示出根据一些实施例的用于增量规则条件评估的编程计算机/服务器系统的功能图。如图所示,图1提供了根据一些实施例的被编程为提供增量规则条件评估的通用计算机系统的功能图。如将清楚的,其他计算机系统架构和配置可用于增量规则条件评估。
包括如下所述的各种子系统的计算机系统100包括至少一个微处理器子系统,也称为处理器或中央处理单元(“CPU”)102。例如,处理器102可以由单芯片处理器或多个核心和/或处理器来实现。在一些实施例中,处理器102是控制计算机系统100的操作的通用数字处理器。使用从存储器110检索的指令,处理器102控制输入数据的接收和操纵,以及数据在输出设备(例如显示和图形处理单元(GPU)118)上的输出和显示。
处理器102与存储器110双向耦合,存储器110可以包括通常为随机存取存储器(“RAM”)的第一主存储区和通常为只读存储器(“ROM”)的第二主存储区。如本领域中公知的,主存储区可以用作通用存储区和便笺式存储器,并且还可以用于存储输入数据和已处理数据。除了用于在处理器102上操作的进程的其他数据和指令之外,主存储区还可以以数据对象和文本对象的形式存储编程指令和数据。同样如本领域所公知的,主存储区通常包括基本操作指令、程序代码、数据和处理器102用来执行其功能的对象,例如编程指令。例如,取决于例如数据访问需要双向还是单向,主存储设备110可以包括任何合适的计算机可读存储介质,如下所述。例如,处理器102还可以直接且非常快速地检索频繁需要的数据并将其存储在高速缓冲存储器(未示出)中。处理器102还可以包括协处理器(未示出),作为辅助处理器和/或存储器110的补充处理组件。
可移动大容量存储设备112为计算机系统100提供额外的数据存储容量,并且双向(读/写)或单向(只读)耦合到处理器102。例如,存储设备112还可以包括计算机可读介质,例如闪存、便携式大容量存储设备、全息存储设备、磁设备、磁光设备、光学设备和其他存储设备。例如,固定大容量存储装置120也可以提供额外的数据存储容量。大容量存储装置120的一个示例是eMMC或microSD设备。在一个实施例中,大容量存储装置120是由总线114连接的固态驱动器。大容量存储装置112、120通常存储处理器102通常不主动使用的额外编程指令、数据等。将理解,如果需要,大容量存储装置112、120中保留的信息可以以标准方式并入作为主存储装置110的一部分,例如RAM,作为虚拟存储器。
除了为处理器102提供对存储子系统的访问之外,总线114还可以用于提供对其他子系统和设备的访问。如图所示,这些可以包括显示监视器118、通信接口116、触摸(或物理)键盘104和一个或多个辅助输入/输出设备106,包括音频接口、声卡、麦克风、音频端口、音频输入设备、音频卡、扬声器、触摸(或定点)设备和/或所需的其他子系统。除了触摸屏之外,辅助设备106可以是鼠标、触笔、跟踪球或平板设备,并且对于与图形用户接口交互是有用的。
通信接口116允许处理器102使用如图所示的网络连接耦合到另一计算机、计算机网络或电信网络。例如,通过通信接口116,处理器102可以从另一网络接收信息,例如数据对象或程序指令,或者在执行方法/处理步骤的过程中向另一网络输出信息。通常表示为要在处理器上执行的指令序列的信息可以从另一网络接收并输出到另一网络。接口卡或类似设备以及由处理器102实现(例如在处理器102上执行/施行)的适当软件可用于将计算机系统100连接到外部网络,并根据标准协议传送数据。例如,本文公开的各种过程实施例可以在处理器102上执行,或者可以结合共享一部分处理的远程处理器跨诸如因特网、内联网或局域网之类的网络执行。在整个本说明书中,“网络”是指计算机组件之间的任何互连,包括因特网、蓝牙、WiFi、3G、4G、4GLTE、GSM、以太网、内联网、局域网(“LAN”)、家庭区域网络(“HAN”)、串行连接、并行连接、广域网(“WAN”)、光纤信道、PCI/PCI-X、AGP、VLbus、快速PCI、Expresscard、Infiniband、ACCESS.bus、无线LAN、HomePNA、光纤、G.hn、红外网络、卫星网络、微波网络、蜂窝网络、虚拟专用网(“VPN”)、通用串行总线(“USB”)、火线、串行ATA、单线(1-Wire)、UNI/O或任何将同构和/或异构系统和/或系统组连接在一起的形式。未示出的附加大容量存储设备也可以通过通信接口116连接到处理器102。
未示出的辅助I/O设备接口可以与计算机系统100结合使用。辅助I/O设备接口可以包括通用和定制的接口,这些接口允许处理器102发送和更典型地接收来自其他设备的数据,这些其他设备诸如麦克风、触敏显示器、换能器读卡器、磁带读取器、语音或手写识别器、生物测定读取器、相机、便携式大容量存储设备和其他计算机。
此外,本文公开的各种实施例还涉及具有计算机可读介质的计算机存储产品,该计算机可读介质包括用于执行各种计算机实现的操作的程序代码。计算机可读介质是可以存储数据的任何数据存储设备,该数据随后可以被计算机系统读取。计算机可读介质的示例包括但不限于上述所有介质:闪存介质,例如NAND闪存、eMMC、SD、压缩闪存;磁介质,诸如硬盘、软盘和磁带;光学介质,例如CD-ROM盘;磁光介质,例如光盘;以及专门配置的硬件设备,例如专用集成电路(“ASIC”)、可编程逻辑器件(“PLD”)以及ROM和RAM设备。程序代码的示例包括例如由编译器产生的机器代码,或者包含高级代码的文件,例如可以使用解释器执行的脚本。
图1所示的计算机/服务器系统仅仅是适用于这里公开的各种实施例的计算机系统的示例。适于这种用途的其他计算机系统可以包括附加或更少的子系统。此外,总线114是用来链接子系统的任何互连方案的说明。也可以利用具有不同子系统配置的其他计算机架构。
图2A是示出传统规则评估的框图,其中所有值在评估开始时可用。在传统的基于规则的系统中,在评估规则条件时,假设所有输入都是可用的。可以评估规则条件以确定在评估时应该“触发”的规则。例如,根本原因分析或根本原因标识(RCI)可以通过规则的收集来执行,每个规则匹配一组条件或症状,并且当存在匹配时,即规则条件评估为真时,输出特定的根本原因故障。
根本原因分析。通过使用匹配引擎(204)将给定的实际故障场景与诸如根本原因表(206)的规则条件表中的每行进行匹配,并在根本原因应用中将匹配的行指示为可能的根本原因,来确定与图2A中作为输入值(202)的给定实际故障场景相关联的实际根本原因。也就是说,如果输入值/实际故障场景匹配一行,使得每个条目通过下面描述的匹配(a,b)运算符匹配,则与该行相关联的根本原因作为与该故障场景/输入值相关联的匹配规则标签(208)被输出,如图2A所示。
图2B是RCI应用的症状的故障场景向量的示例的图示。症状的一个示例是无电力,它是指示被监控系统没有电力的症状。症状的状态可能是已知值,或者可能是未知和/或“不关心”的特殊指示。数字逻辑中通常使用术语“不关心”来指示相关项是无关的/不需要的。处理以指示对于给定症状“不关心”的能力允许分析继续进行,即使系统状态的该方面实际上不是已知的。
“故障场景”在这里指的是指示被监控系统的已知和未知故障状态的症状值的收集。从逻辑上来说,故障场景从观察到的/确定的症状的角度表示系统的状态和/或潜在的部分状态,即系统有问题或没有问题。它可能不指示系统的完整状态。例如,对于车辆,故障场景可能不一定指示车辆的位置、速度等,而可能仅指示症状的状态,即执行故障的根本原因分析所需的方面。
如图2B所示,在一个实施例中,故障场景被表示为值数组(212),其中每个条目(214a-m)对应于指定的症状。例如,症状Sy0(214a)是第一条目,症状Sy1(214b)是第二条目,等等。在一个实施例中,可能存在与同一度量相关联的多个症状。例如,温度传感器稍高、中等偏高和极高可能有不同的症状。在一个实施例中,基于不同级别的导数,可能存在与相同度量相关联的症状。例如,症状可能与具有一阶导数为零的时间过长的度量相关联,也就是说,它是恒定的,通常指示输入传感器已经失效。症状可能与一阶导数过高相关联,这意味着它变化太快。
可能存在与度量相关联的附加症状,其指示度量超出范围或行为不正确。在这种情况下,例如,在指示度量过高或过低的症状的同时,设置超范围症状。这种“聚合”形式的症状可以允许用“超出范围”来指定故障场景,而不是必须覆盖“过低”和“过高”二者。
这里在两个故障场景s0和s1之间定义了匹配运算符以返回真:
bool isMatching=match(s0,S1);
如果s0中的每个症状条目要么是“不关心”,要么与s1中相应条目的值相匹配的话。注意,匹配操作是不可交换的;match(a,b)可能不一定等于match(b,a)。
图2C是作为根本原因表(RCT)的RCI应用的规则条件表的图示。RCT是表格,其中每行是故障场景,所述故障场景标有相关联的根本原因。在该上下文中,这种故障场景中症状的未知值被解释为“不关心”。例如,对于根本原因“前方障碍”,该行中的症状可能是:车辆在前方为真,向前移动为真,并且所有其他症状指示为“不关心”。
在一个实施例中,RCT包含针对可能是根本原因的每个故障或事件的行,其中每行指示必须为真才能成为根本原因的症状,必须为假的那些症状,以及被设置为指示“不关心”的其余症状。注意,将更多症状指定为特定值,而不是超出给定根本原因的绝对最小值的“不关心”,可能会导致无法标识或匹配根本原因,因为额外的症状可能未知或与为该行指定的症状相反。因此,针对与表中的行相关联的特定根本原因,指定诊断系统所需的已知症状的最小集合是很重要的。如果给定的根本原因可能具有症状的多个标识集合,则RCT中有多行,每个集合一行。给定的根本原因可能有多个对应的行,因为一行对应于症状的最小集合,并且其他行对应于具有对根本原因提供更大置信度的附加症状的最小集合。例如,在交换机的电源故障的情况下,最小集合可能仅包含来自交换机的电流传感器的“失去电力”症状,而附加行可能包含该症状加上来自直接附接到故障交换机的交换机的“丢失信号”症状。
在一个实施例中,每个RCT行以与故障场景相同的方式表示。因此,它在这里可以被称为“潜在故障场景”。如图2C所示,RCT(222)包括k+1行(224a-524l),每行与特定的根本原因相关联,每行有N个症状。例如,根本原因#0与第一行(224a)相关联。每行(224a)中的症状(504a-m)的值不同于其他行(224b-524l),每行对应于相关联的根本原因的潜在故障场景,如由标记为#0到#k的根本原因所指示的。
与潜在故障场景相反,从被监控系统确定的故障场景在这里被称为“实际故障场景”。对于被监控系统,可能有多种实际故障场景。与另一个实际故障场景相比,一个实际故障场景可能是特定子系统的更详细的故障场景。多个实际故障场景的另一个来源是关于故障的不确定性。例如,一个场景可能具有对应于系统温度过低的症状,而另一场景可能具有指示温度传感器已经失效的症状。在后一种情况下,它可能指示依赖于温度传感器的症状未知。
如本文所述,使用三元症状值,使得症状被表示为“已知”比特和第二“值”比特,所述“已知”比特通过分别为真或假来指示已知或未知,所述第二“值”比特指示真或假,仅当已知比特被设置为真时所述第二“值”比特才被这样解释。使用[a,b]的四元命名法,同样使得可允许的[0,1]的解释是相关联症状未知为真。因此,可以对应于未知的[0,0]不同于可以被解释为未知为真的[0,1]。注意,RCT(222)中的条目中的[0,1]症状可以匹配为假或未知的输入,而不像[0,0],它只是不匹配为真。同样,[0,1]可以不一定被视为与[0,0]相同和/或不被允许。
二元、三元和四元表示。在一个实施例中,值具有三个或更多个状态,包括值“真”、“假”和“不关心”。在一个实施例中,使用三元子条件值,使得子条件被表示为“已知”比特和第二“值”比特,所述“已知”比特通过比特值分别为真或假来指示已知或未知,所述第二“值”比特指示真或假,仅当“已知”比特被设置为真时所述第二“值”比特才被这样解释。使用两个比特来表示三元值的四元表示在这里被称为[a,b],其中a是状态是否已知(0=未知,1=已知),并且b是与该状态相关联的值(0=假,1=真)。按照这种约定,可允许的[0,1]的解释是,相关联的子条件是“未知为真”。将[0,0]与[0,1]进行比较,[0,0]可以对应于未知的状态,[0,1]可以被解释为“未知为真”。(可替代的约定可以是[0,0]是“未知为假”)。完成这些可能性,[1,0]可以对应于“假”,并且[1,1]可以对应于“真”。注意,[0,1]子条件可以匹配为假或未知的输入,并且不同于[0,0],它不匹配任何为真的输入。因此,[0,1]可以不一定被视为与[0,0]相同和/或在内部和/或一致的表示中可以不被允许。
在一个实施例中,值具有两种状态,这两种状态允许表的不同列的不同匹配行为。对于具有二元状态的值,在许多应用中,对象具有症状,否则客户端“不关心”,例如,对象表示过热(即,单元是否过热)。过热的“真”指示特定问题的症状,但可能有许多根本原因与单元是否过热无关,并因此为“不关心”。认识到这一点,可替代方法是每个条目有两个值而不是三个,对应于“真”和“不关心”。对应的匹配运算符输出表是:
这将每个条目所需的比特数从三元表示的两个比特减少到二元表示的一个比特,因此在存储器中的花费是一半。
存在这样的情况,在这些情况中需要在具有症状S1的实体和不具有症状的单独规则/根本原因二者上进行匹配,例如S1为假。在这种情况下,可以显式地引入额外的症状S2,其对应于对S1的否定,例如,症状S1可以是失去电力,并且S2可以是具有电力。然后,需要失去电力的行可以将症状S1的对应表条目设置为“真”,并将S2设置为“不关心”。相反,需要具有电力的行可以将S2的对应表条目设置为“真”,并将S1条目设置为“不关心”。因此,例如如果10%的症状需要否定,则1比特方法在空间上仍然将比2比特方法更便宜,也就是说,多了10%的空间,但不是多了100%。
在一个实施例中,S1和S2二者都为真的组合可以对应于“未知”。也就是说,如果输入设置了S1和S2二者,则症状被视为“未知”。在应用中,将状态表示为“未知”可能比第四个值的“未知为真”解释更有用。对于这种“未知”的工作支持,上述匹配没有变化或扩展。行中的S1和S2条目二者都指定为真,并且输入也指定这些条目为真,所以它匹配“未知”。
还存在这样的症状,其实际上是值的离散枚举,诸如非常冷、冷、凉、正常、温暖、热、非常热。在正常的二元表示中,这七个值可以用三个比特来表示。然而,对于上面的“真”/“不关心”二元方法,对于每个比特,将需要六个正和负的症状作为单独的症状。特别地,上述7个枚举可以使用正常的布尔表示以3比特来表示,例如001可以表示“非常冷”。然而,因为真/不关心实施例不显式地处理假,所以需要另外3比特或症状来指定假,即0。因此,“非常冷”的001编码将指示六个症状[X,X,1,1,1,X],这里“X”表示“不关心”,并且前3个条目对应于真或1值,并且后3个条目对应于假或0条目。可替换地,可以使用这七个值的“独热”表示的七个单独症状,其中“独热”表示在这里被称为一组比特,其中合法的值组合仅仅是那些具有单个“真”比特并且所有其他比特都不是“真”的组合。
在一个实施例中,使用由症状使用的特定列集合,表示多个症状值的这种枚举。在这种情况下,特定的列被指定为匹配“真”/“假”,与“真”/“不关心”相反,以三列而不是六或七列来表示枚举。仍然需要“不关心”值,以便不关心该枚举症状的值的行可以指示这一点。因此,允许指定列值宽度,并保留一个值来指示“不关心”,例如,全零。在这种情况下,可以指定三比特的逻辑列宽,因此[0,0,0]可以对应于“不关心”,而剩余的七种值组合分别表示七种不同的症状状态。因此,该枚举可以用三个比特来表示,但仍然允许在不关心枚举症状的行中指定“不关心”。
因此,这个额外的扩展允许表指定逻辑列宽,并将全零情况视为“不关心”。然后,对应于过热或S1、S2的列可以被标记为一比特宽,而对应于上述枚举的列将被标记为一个三比特的逻辑列。
在一个实施例中,列宽的有效表示是每列有一比特,如果下一列也是跨越多列的逻辑列/条目的一部分,则设置该比特。等效地,该比特可以指示前一列的延续。因此,对应于枚举的列可以被标记为[1,1,0],其中最后一比特指示在第三列之外没有延续,以指示形成一个逻辑列/条目的三比特列。
通常,表格可以指定列宽以及逻辑列的匹配行为。作为这种更一般情况的示例,表格可以指定逻辑列为五比特宽,并且匹配行为是对“大于”的测试。也就是说,如果输入在这五个比特中的值是大于表条目中的值的二元值,则该输入可以在该条目上匹配,除了如果表条目是零,则将该表条目视为“不关心”,或者如果表条目是全1,则将该表条目视为“未知”。作为指定匹配行为的另一个示例,它可以将匹配行为指定为跨这些列的输入的逻辑或。通过在逻辑列中具有一个比特来指示症状是否与该行相关,并且从或中排除该比特,表条目中的全零值可以被视为“不关心”。
在一个实施例中,诸如Intel和AMD指令集中的“ANDN”或逻辑ANDNOT指令的硬件指令可以与二元表示一起使用。硬件指令通常比它们的软件对应物执行更快,并且编程更有效。ANDN指令对反转的第一个操作数和第二个操作数执行按比特逻辑与,例如,两个操作数inBlock和tableBlock不匹配的结果如下:
不匹配=~inBlock&tableBlock
相应的输出表为:
并且因此如果不匹配是匹配的补集,
这种匹配可以是“三元匹配”,但是不同于由三元内容可寻址存储器(T-CAM)提供的三元匹配,输入故障场景(202)也可以是三元的。然而,T-CAM可以用作高效/硬件匹配系统的一部分。被监控系统中可能同时存在多个匹配的规则标签/根本原因故障。因此,有可能匹配表(206)中的多行,每个匹配的规则标签/根本原因一行。例如,在温度传感器已经失效而指示完全不现实的读数的同时,电机可能失效。可能有多行映射到同一个根本原因。这处理了根本原因故障可能由不同的症状集指示的情况。
在一个实施例中,行表示可以存储“不关心”值,其中不显式存储“不关心”条目。也就是说,缺少对第i个症状的显式指定或表示被解释为“不关心”第i个症状。在一个实施例中,症状被聚合到与被监控系统的逻辑单元或组件相关联的块中。例如,实施例可以使用已知/值比特的64比特块。因此,如果组件与特定的根本原因不相关,则不需要存储整个块。每行于是可以需要相对少量的存储。通常,大多数行相对稀疏,因为只有小症状子集与特定故障相关,所以实际上只存储了该行的一小部分,其余部分默认为“不关心”。
任意故障标准的表示是通过使用多个症状来实现的。例如,一个根本原因表现为温度非常高,另一个表现为温度高,并且还有一个表现为温度略高。也就是说,对于这些级别中的每一个,在每行中可以有症状条目。
关键要素是指示已知为假的症状,作为没有故障的症状,以及已知为真的症状,即存在故障,同时仍然允许未知或“不关心”。假情况有效地过滤掉了由其他原因引起的症状,例如压缩机不工作,但实际上没有电力,这是根本原因。因此,在子系统SSi中的故障可以被可靠地标识为根本原因之前,依赖于多个其他子系统的子系统SSi可能需要知道所有这些其他系统都在工作。
在一个实施例中,系统可以记录任何症状自其从上次匹配以来在实际故障场景中是否有改变,并且如果有,则仅将实际故障场景重新匹配到RCT(522)。当实际故障场景没有变化时,这种检查避免了重新匹配的开销。
在一个实施例中,重新匹配的频率可根据应用需求进行配置。例如,ARCA匹配可以被配置为在制冷系统中每30分钟执行一次,以最小化匹配的成本,因为故障不会导致立即有问题,并且在检测故障时产生的延迟不会显著影响维修时间。这种低匹配率假设瞬态故障对于检测来说并不关键,所述故障足够瞬态从而在匹配发生之前出现并然后消失(并因此在匹配时不存在于实际故障场景中)。
例如,有经验的网络操作员可以查看遥测提供的症状,以确定计算机网络中故障的根本原因。这种方法可以被计算机化以提供自动化的根本原因标识,如2018年5月8日提交的题为“AUTOMATIC ROOT CAUSE ANALYSIS USING TERNARY FAULT SCENARIOREPRESENTATION”的美国专利第10,761,921号中所述,该专利通过引用并入本文以用于所有目的。然而,传统的规则评估假设在评估时,即在RCI处理时,所有的遥测都是可用的。
在某些应用中,在每个评估时间内使所有遥测可用是很昂贵的。例如,在医疗诊断中,即医疗决策制定中,一些测试是昂贵的,并且可能会引入获得结果的显著延迟。例如,血液测试引发实验室工作的成本和延迟,以及患者的一些不适和风险。医疗程序可以是基于诸如患者外观、体温、心率和/或血压等容易获得的症状来确定患者问题的假设,并且然后安排一个或多个附加测试来确认该假设以进行诊断,测试选择受获得测试结果的成本和时间延迟的影响。因此,举例来说,如果不能从简单易得的症状中明确患者的疾病,就需要调用血液测试。
更复杂的是,一些测试或遥测根据情形在其结果方面提供不同量的益处。例如,同样对于医疗诊断,不同的患者可能从给定的测试中具有不同程度的益处,并且对每个患者执行给定的测试可能存在不同的成本和风险。因此,要执行的测试的顺序可能取决于具体情形,即医疗诊断示例中的具体患者。
所谓的专家系统是在20世纪80年代开发的,作为斯坦福启发式编程项目的一部分,在医疗诊断(mycin,dendral)以及分析海底声纳信号和其他应用方面取得了成功。美国专利第10,761,921号指示了如何进行有效的根本原因标识。一般来说,基于规则的系统已被证明是分析情形和确定行动方针的有用手段。然而,他们传统上假设在规则条件评估时所有的输入都是可用的。
医疗说明。用于诊断疾病的规则集的简化非限制性示例如下:
表A.完整规则集
如果选择要执行的(第一)测试是测量患者的温度,并且该测试的结果是确定患者具有高温,则产生该原始规则集的子集。该子集中的规则对应于那些在已知温度值为“高温”后其条件可能为真的规则,并且已经从上面规则集中的五个规则减少到下面规则集中的三个规则。这种减少的一个好处是减少了可能诊断的数量,并提供了对下一步选择的最佳测试的澄清。在这个示例中,如果结果是否定的,接下来确定患者是否苍白可以将其减少到单个诊断。另一个示例可能是这样一个患者,通过缩减其只需要三次医疗测试,而不是原始规则集中预期的所有100次测试。规则集的这种缩减也是技术改进,它允许减少存储器使用,减少用于传送规则集的网络带宽,并改进处理速度,因为它减少了计算机要处理的规则的数量。例如,与在增量地获取每个附加输入之后重新评估整个规则集相比,完成规则评估所需的处理量减少了。因此,在增量规则评估之后,可以可选地执行释放与第一规则集相关联的存储器使用的步骤。
表B.缩减的规则集
图3是示出增量规则条件评估过程的实施例的流程图。在一个实施例中,图3的过程由图1的系统施行。
在步骤(302),接收应用的规则集。对于上面给出的医疗示例,这样的规则集在表A中示出。在步骤(304),在步骤(302)中接收的规则集被指定为“当前”子集。
在步骤(306),当当前子集没有充分缩减时,执行步骤(308)、(310)和(312)。
在步骤(308),选择输入用于确定。对于上面给出的医疗示例,高温测试是这样选择的输入。
在步骤(310),确定步骤(308)的所选输入的输入值。对于上面给出的医疗示例,测试的结果是病人具有高温。
在步骤(312),通过基于该输入值移除其规则条件可能不再为真的那些规则来确定新的缩减规则子集。对于上面给出的医疗示例,新的缩减规则子集在表B中示出。
在步骤(314),输出当前子集。在图3中未示出的可选步骤中,系统可以评估和/或触发步骤(314)的子集中的规则。
在一个实施例中,当没有产生更小子集的测试时,在步骤(306)中可以认为当前子集的缩减是充分的。在这种情况下,该子集中规则的所有规则条件都可能为真,因此可以执行相关联的规则动作。例如,在RCI系统中,每个规则具有动作以报告相关联的根本原因故障。可能同时存在多个/独立的根本原因故障,因此有可能的是,充分缩减的子集可能包含多个规则。这种场景也可能出现在医疗诊断中,其中患者可能患有多种疾病,例如上述医疗示例中的COVID-19和血液感染。
在一个实施例中,如果具有重叠的未确定输入的所有规则具有共同的动作,则在步骤(306)中可以认为规则子集被充分缩减。对于上述医疗示例,如果当前子集中剩余的所有规则都要求输血(因为输血是表B中流感、COVID-19和血液感染的主要治疗方法),则即使规则条件中有其值尚未确定的附加输入,也可以认为规则集缩减是充分的。
在一个实施例中,当某个动作的紧迫性比确定附加输入值的成本或延迟更重要时,在步骤(306)中可以认为子集被充分缩减。例如,在医疗领域,如果规则集包括心脏病发作的潜在诊断,那么开始对心脏病发作进行干预可能比等待获得附加测试的结果更好。类似地,如果一件工业机械装备继续发出显著的摩擦噪音,在实现对问题进行全面诊断之前立即润滑装备或将其关闭可能更好。
图4是示出当一些输入值先前已知时,过程增量规则条件评估的实施例的流程图。在一个实施例中,图4的过程由图1的系统施行。如图4所示,图4的过程类似于图3的过程,具有类似的步骤(302)、(306)、(308)、(310)、(312)和(314)。
在一个实施例中,在步骤(404),在规则评估开始时,某个数量的输入值是已知的。在这种情况下,这些输入值用于通过以下方式定义初始的当前子集:消除那些在给定输入值的情况下不可能为真的规则,如图4所示。例如,对于医疗诊断,当患者出现抱怨时,他可能会出现一些明显的或自我报告的症状,诸如苍白、高温和头痛。这种初始缩减移除了基于这些预定输入值不可能为真的所有规则,从而产生初始当前子集。在上面的医疗示例中,如果患者自我报告流鼻涕,那么在表A中COVID-19的与“不流鼻涕”相关联的规则可以被消除。
此外,患者可能有已知的先存条件或医疗史,例如高血压。可以通过使用该条件来处理先存条件,以将某些症状/输入值暗示为预定的,并使用这些预定值来缩减如上所述的当前子集。先存条件仍然包括在该子集中,但是如果已经知道,则可以从最终的缩减子集中移除该先存条件,以隔离新的/未知的条件。在上面的医疗示例中,例如,可能存在具有血液感染倾向的患者的医疗史,这可能暗示像高温这样的症状/输入值。
输入测试选择。在图3和/或4中的过程的迭代中,选择要测试的输入的步骤(308)可以使用各种基于规则的决策树生成过程来进行属性选择。假设规则条件是“attri=vj”的合取,属性选择可以被认为是选择实际规则的输入。例如,Abdelhalim、Traore和Sayed的RBDT-1是一种传统的基于规则的决策树生成技术,它使用属性有效性、属性自主性和/或最小值分布作为选择属性的标准。这些被用作在每个阶段选择属性的试探法,其构建具有最少节点数的决策树。
一般来说,传统技术关注于在每个阶段获得最大的信息增益。如这里所指的,预期信息增益IG是从先前状态到将一些信息视为给定的状态的信息熵H的减少,
IG(T,a)=H(T)-H(T|a)
其中,H(T|a)是给定属性a的值的情况下T的条件熵。
例如,将每个子树中的可能性数量减少为1/M的具有M个可能值的属性提供了良好的信息增益,而挑选仅与单个结果相关的属性仅将决策树的一侧减少了一个叶节点,并且不被认为是良好的信息增益。随着良好的信息增益,结果/剩余规则集的大小显著减小,从而作为增量评估的结果提供了增量益处。
在一个实施例中,属性选择至少部分基于与选择相关联的成本。例如,信息增益可以除以确定属性的成本,以计入成本。可替换地,可以从信息增益中减去成本。成本可以包括进行测试以确定属性值的美元成本,以及为了执行需要一些时间的测试而延迟诊断的成本。另一方面,信息增益部分可以扩展到包括与执行测试相关联的风险降低。例如,在医疗诊断中,如果患者存在脑动脉瘤的风险,则基于测试的成本,延迟诊断会有显著的成本。
在一个实施例中,属性测试AT的分数可以是但不限于一个或多个变量的函数,例如:
ATscore=f(IGAT),
ATscore=g(RRAT),
ATscore=h(TCAT),和/或
ATscore=m(TDAT)
或者那些变量中的一个或多个的组合,例如:
ATscore=K0IGAT+K1RRAT-(K2TCAT+K3TDAT)
其中
·K0,K1,K2和K3是常数;
·IGAT是来自该测试的预期信息增益;
·RRAT是来自执行AT测试的预期风险降低;
·TCAT是AT测试的成本;和
·TDAT是延迟诊断直到测试AT的结果可用的成本。
在一个实施例中,要在步骤(308)中确定的输入属性以及因此要执行的测试是基于跨所有未确定的输入属性具有最高分数的输入属性。
注意,计算的分数用于与为其他输入计算的值进行比较,因此不需要与计算相关联的有意义的单位。此外,由于事先不知道测试的结果,因此有可能无法始终如一地在每一步挑选最佳属性或测试。例如,一个具有特定结果的测试可能将规则子集缩减到单个规则,但是如果结果不是那个特定值,它可能提供很少的信息。因此,目标是在多个规则评估实例上获得最佳结果。
上述常数的值和其他值可以特定于场景,并因此在评估时被动态确定。例如,在上面的医疗示例中,特定测试的成本可能取决于特定患者的医疗保险和取决于特定患者年龄的可变风险。在这种情况下,在对特定场景或医疗环境中的患者进行规则评估之前确定测试顺序是不可行的。
如果在特定的场景中执行给定的测试是不可行的,或者因为测试能力中的一些故障或条件,该测试可能被指示为非常高的成本,因此它不被选择。通过能够在任何时候指定给定的测试和测试结果来查看对规则子集的影响,支持操作员探索“如果……会怎样”场景也是可行的。
在需要规则集来产生一个动作或者规则条件的“第一匹配”就足够使用的应用中,可以使用传统技术从规则集自动产生决策树。通过在动态环境和/或属性选择取决于特定场景(或医疗诊断情况下的患者)的更一般情况下的改进,图3和/或4的过程更有效,因为传统上预先生成整个决策树,然而仅使用到决策的路径。重用生成的决策树也可能是不可行的。
相比之下,公开了仅仅引发选择输入属性以及因此在给定场景中使用的决策节点而不是整个决策树的开销。
在诸如根本原因分析和诊断的许多应用中,可能存在不止一个故障或疾病,因此“第一匹配”语义是不充分的,并因此决策树方法是不可行的。因此,公开了允许测试序列构造,所述测试序列构造是动态的、个性化的和/或专用于特定情形的,和/或还允许多个规则适用于给定场景。
合取规则条件表(CRCT)。图5是合取规则条件表表示的实施例的图示。在一个实施例中,图5的表示可用于表示图1系统的图2A中的规则条件表(206)。从其相似性可以看出,图5的规则条件表(502)可以被认为是图2C的根本原因表(222)的一般化版本。
给定一组规则,其中每个规则条件是子条件的合取,它可以被变换成表(502),其中每个规则(504a)、(504b)、(504c)等有一行,并且对于该组规则中的规则条件中出现的每个子条件有一列,例如(506)。行上的行Id或标签,例如(508),直接或间接地指示当规则条件匹配时要执行的动作。行R和列C中的条目指示对应于列C的子条件与对应于行R的规则的规则条件的该条目相匹配所需的结果。例如,如果列C的子条件是(高度计>200),并且行R和列C中的条目是值“真”,则作为输入的在时间T的高度计读数可能大于200米以匹配该条目,并因此激活对应于行R的规则。
对应于不是相应规则条件的一部分的子条件的条目存储特殊的“不关心”指示,指示该条目匹配任何输入。这种“不关心”的指定是重要的,因为在许多应用中,许多规则条件引用了跨所有规则出现的子条件的子集。例如,在HVAC系统中,依赖于压缩机关闭的规则不依赖于冷却盘管温度或压力,而当压缩机打开时,这些输入通常非常相关。
当所有子条件都评估为相应的条目值或条目值为“不关心”时,规则条件匹配。因此,行对应于其子条件的合取。这种格式的表(502)被称为合取规则条件表(CRCT)。CRCT是一组规则的规则条件的表示,其中存在与每列(506)和每行(504a)、(504b)……相关联的子条件,该子条件对应于与该组中至少一个规则的规则条件对应的子条件的合取,并且该行被标记(508)以直接或间接标识与该规则相关联的动作。如这里所示,表A和表B是子条件的合取(&&),诸如具有高体温的患者的子条件。
在一个实施例中,列(506)可以对应于评估为多于两个值的表达式。例如,对应于温度范围的列可以评估为“冷”、“凉”、“正常”、“暖”和“热”。在这种情况下,列中的每个条目可以指示这些值中的一个或者“不关心”。然后,如果温度范围值等于条目中存储的值,则条目匹配。
在一个实施例中,其中列(506)可以对应于评估为多个值的表达式,条目可以指示要应用的关系运算符以及值。例如,继续温度示例,条目可以指示高于“正常”。因此,该列被标记为“温度relop值”,其中relop是关系运算符之一,并且值是存储在条目中的值。其他子条件/条目表示方案是可行的。
CRCT表示(502)便于在测试结果之后有效地确定要使用的规则子集。这对于计算资源是一个改进,因为它简化了移除具有被测试结果否定的子条件的每行,或者相反,在新的子表中,包括没有子条件为假的那些行。因此,在每次测试后更容易且更有效地自动产生子集或者等价地子表。
将非合取规则条件转换为合取。如果规则集包含任何析取,则可以将其转换为合取规则集。
如果规则在其条件中包含析取,则可以引入对应于该析取的新列。
例如,如果有以下形式的规则条件:
如果(SC0与(SC1或SC2))则做动作Foo
其中SC0、SC1和SC2是子条件,则可以引入逻辑上标记为Sc1或Sc2的新列,因此上述规则变为:
如果(SC0与SC1或SC2)则做动作Foo
这种转换会在表中产生附加的子条件列。如此处所示,这表明任何规则条件可以通过添加更多列来转换成合取形式。
在一些情况下,可以使用另一种技术来将规则条件转换成简单的合取形式,而不引入新的输入,即:如果规则在其条件中包含析取,则该规则可以作为对应于析取可能性的两个规则条件被输入到表格中,如2019年9月5日提交的题为“AUTOMATIC GENERATION OFAN EFFICIENT RULE SET IMPLEMENTATION”的美国专利公开2020/0081882中所述,该专利公开通过引用并入本文以用于所有目的。
使用这种技术,上述初始规则因此被变换成两行,对应于:
如果(SC0与SC1)则做动作Foo
如果(SC0与SC2)则做动作Foo
在某些情况下,来自布尔代数中的附加技术可用于将规则条件变换成合取形式。
用于处理析取的附加列可能引发额外的存储和预计算成本。另一方面,通过跨多行复制规则来移除析取可能会增加匹配的成本。使用这些技术,本领域的普通技术人员能够将任何规则集变换成CRCT。
表格表示是表示规则集的一种改进方式,部分原因是它提供了比单独表示每个规则更节省空间和/或节省时间的表示。例如,与特定子条件相关联的列(506)的指定可以完成一次,并且然后对于该列中的每个条目是隐含的,而不是对于它出现在的规则条件的每个实例指定它。此外,一些属性选择方法需要跨规则集的给定列(506)中的所有条目进行处理。
当这些子条件被组织成列(506)时,该处理更有效。合取结构简化了行(504)的结构和解释,因为独立于子条件的分组,结果是相同的。相比之下,如果允许析取,则评估对相对于其他合取的分组敏感。例如,(SC0或(SC1与SC2))不同于((SC0或SC1)与SC2)。
如2021年1月22日提交的题为“AUTOMATIC GENERATION OF CONTROL DECISIONLOGIC FOR COMPLEX ENGINEERED SYSTEMS FROM DYNAMIC PHYSICAL MODEL”的美国专利申请17/156,378(代理人案卷号OPTUP018)中所述(该申请通过引用并入本文以用于所有目的),可以使用控制系统的CRCT(具有相关联动作)的自动生成。在一个实施例中,CRCT被表示为如图2C和美国专利号10,761,921所示,具有“不关心”子条件。
在一个实施例中,在2020年1月22日提交的题为“APPROXIMATE MATCHING”的美国专利公开号2020/0257692中公开的近似匹配被用于标识原始CRCT的子表,该专利公开通过引用并入本文以用于所有目的。特别地,如果在执行最后一次测试后有K个已知输入,则使用这K个已知输入和指定为K的最小匹配对当前CRCT执行近似匹配,得到的匹配行作为表返回。因为有K个已知输入,并且要求最小匹配数为K,所以返回未被当前已知输入否定的行/规则。
在一个实施例中,如2019年3月19日提交的题为“MATCHSET-BASED AUTOMATICROOT CAUSE ANALYSIS”的美国专利公开第2019/0294486号中的匹配细化被用于抑制一些匹配的潜在根本原因故障,并按概率对根本原因故障排序,该专利公开通过引用并入本文以用于所有目的。因此,概率可以与输出相关联。
系统根本原因故障标识。所公开的内容适用于复杂系统中的根本原因故障标识,在复杂系统中,并非所有的遥测/症状在所有时间都是可行的。例如,飞机中的特定问题可能指示发动机问题,但是确定发动机问题的确切性质可能需要使发动机停止工作并将发动机附接到诊断系统以进行进一步诊断。在其他情况下,可能需要物理打开某个组件来测试其内部操作参数,因为这些参数不会暴露在外部。在这两种情况下,执行这些详细的测试都涉及到显著成本,因此在至少一个问题已经被标识为与该组件有关联之后才执行这些测试。
可替换的方法是使用第一阶段的规则来标识与特定组件相关联的一般问题或故障,并且然后使用第二阶段的特定于该组件的RCI规则集来标识组件内问题的根本原因。然而,这种可替换方案干扰了RCI规则的基于模型的生成,如美国专利号10,761,921中所述。具体而言,美国专利号10,761,921和美国专利公开2020/0081882以及2021年1月22日提交的题为“AUTOMATIC GENERATION OF CONTROL DECISION LOGIC FOR COMPLEX ENGINEEREDSYSTEMS FROM DYNAMIC PHYSICAL MODEL”的美国专利公开2021/0240148中也有所描述(这些专利通过引用并入本文以用于所有目的),教导了从模型生成规则,该模型是用于RCI的故障模型或用于控制的操作模型。
具有更详细的模型提供一组更准确的规则,并且从而提供更好的终端应用行为。在许多情况下,一个组件与其连接的其他组件的交互对于确定实际的根本原因故障是关键的。因此,提供高层级模型来分类成广泛的类别是不可行的,因为准确的分类依赖于许多具体的低层级细节。例如,在HVAC系统中,压缩机的确切问题可能由诸如冷却盘管和电流传感器等其他组件的行为来指示。因此,分级分类并不总是可行的可替换方案。
同样的问题也可能出现在其他领域。例如,在医疗诊断领域中,疾病可能引起跨身体中一系列器官和系统的症状并且也可能引起全身症状。找到具有高层级症状的特定器官或系统的疾病的根本原因可能是不可行的。此外,即使分级分类在技术上是可行的情况下,实现这种分类所需的测试序列也可能导致更昂贵的测试序列。
在任何情况下,分级分类可以在分级中的每个层级使用增量规则评估,以降低实现分类决策的成本。
假设评估。在某些应用中,操作员可能对问题有初始假设。在一个实施例中,可以将初始假设输入系统。系统然后通过选择其动作对应于该假设的规则来选择对应于该假设的规则的初始子集。在该实施例中,系统通过将所公开的内容应用于该子集来选择在确认或反驳假设方面最有效的输入属性。
例如,如果假设是白血病,则可能有规则子集,其动作对应于白血病的诊断。使用该规则子集,属性选择然后选择输入,以基于最大程度地缩减该子集的输入进行确定。在优选实施例中,这个选择的输入可以导致确认或否认假设;也就是说,如果子集被缩减为空集,则假设是矛盾的,因为在子集中没有对应于这个可能为真的假设的规则条件。如果恰好有一个规则对应于该假设,则所公开的内容可以有效地确定该给定的规则条件是否为真。
在一个实施例中,可以通过过滤与规则相关联的动作,移除那些动作没有通过过滤器的规则,来缩减当前子集。过滤可以在初始规则集上执行。它也可以基于输入值确定在减少的迭代上单独执行。初始缩减对应于初始假设。基于动作的后续缩减对应于修改的一个或多个假设。
公开了减少对基于假设的诊断的需要,部分是因为自动化系统可以记录和评估大量假设,这与CRCT的效率并行。这种方法是一种改进,因为它避免了基于假设的诊断的试错低效。它在评估不太可能的诊断方面也是一致的,而不仅仅是集中在常见的诊断上。
医疗诊断应用。医疗诊断是这样一个领域,其中在评估时,例如当患者刚入院时,关于患者的所有潜在有用的“遥测”都是未知的。此外,一些诊断测试执行起来非常昂贵,并且可能给患者带来风险或不便。因此,医疗诊断应用成本效益分析(CEA)模型和增量成本效益比(ICER)来确定测试、诊断和治疗的过程。医疗领域有诊断产量的概念,定义为测试或程序提供建立诊断所需信息的可能性。
在医疗领域,每个患者可能有不同的可用测试结果/历史。对于不同类别的患者,例如“年轻”、“老年”、“青少年”、“男性”和/或“女性”,以及基于病情的明显严重性,也可能有不同的规则集。
在医疗领域中,在完全有把握的诊断可用之前,可能有必要开始干预,例如让患者服用特定的药物。这种干预可能不会立即产生结果,并且还取决于假设的诊断是否正确;也就是说,测试是开出干预的处方,如果诊断是正确的,这应该产生显著的改善。注意,治疗和对治疗的测量反应也可以被认为是测试。
在医疗领域,检测到患者的不良反应或病情突然恶化需要立即采取补救/预防动作,甚至在完全了解不良反应的原因之前就需要采取动作。
医疗领域的所有这些因素使得传统的RCI不适用,因为它需要在评估时所有症状可用。传统的医疗诊断通常依赖于医生形成对患者所患疾病的假设,并且然后基于该假设选择测试和治疗。
这里公开的自动诊断系统是对传统医生的改进,因为它可以同时考虑大量的潜在诊断,这些诊断对应于规则子集中剩余的那些规则,远远超过预期人类可以回忆和管理的数量。
规则集增量评估的另一个改进是避免了基于假设的方法引入的偏差。特别地,它减少了误诊的频率,其中当实际的疾病是不常见的疾病和/或医生经验较少的疾病具有类似症状时,基于假设对常见疾病和/或医生经验丰富的疾病进行诊断。这是因为即使是罕见的疾病也会在规则子集中被考虑,直到每种疾病都被测试结果排除。
规则集的增量评估的另一个改进是,它还可以适应基于假设的诊断,如上所述。在某些情况下,医疗诊断依赖于X射线和CAT扫描,这实际上需要图像处理。在这些情况下,规则集的增量评估可以与图像的解释结合使用,例如由放射科医师提供的解释。在这些情况下,图像处理可以将图像转换为症状,并且然后规则集的增量评估能够将该信息与其他输入一起考虑,以执行根本原因分析或诊断。
更一般地,图像可以是所选输入的一部分和/或用于执行诊断。例如,还可以测量患者的温度、血压和/或心率。在这种情况下,图像处理输出可被视为本文所述的基于规则的诊断的基本输入。尽管如此,候选图像解释仍然可以通过使用相对于图像解释的规则集的增量评估来改进,可能使用这种额外的遥测作为输入。例如,高心率可能是心脏图像的某种解释的反指标。
医疗治疗计划可以被视为引导患者恢复健康的“通道”,潜在地对应于一系列治疗。因此,2020年2月19日提交的题为“USING A LANE-STRUCTURED DYNAMIC ENVIRONMENTFOR RULE–BASED AUTOMATED CONTROL”的“通道结构化”环境专利美国专利公开第2020/0264900号适用于医疗治疗,该专利公开通过引用并入本文以用于所有目的。也就是说,治疗序列的数量受限于那些基于先前的临床研究已知安全的已建立的治疗序列。例如,如果患者已经服用了药物Y,则不应该为其开出服用药物X的处方。该约束限制了潜在的治疗计划,使得动作的数量成为在规则集中处理的实际数量。
投资决策制定应用。在投资和商业决策中,通常有多种选项可用。为了对这些选项制定商业或投资决策,通常会针对选项评估规则集,以确定它是否是有吸引力的机会。例如,举一个简单的情况,一个规则可能是:如果成本基础高度依赖于规模经济,则确定总的可寻址市场和预期的市场渗透率。通常需要花费显著的时间和精力来调查问题。
因此,基于增量地确定输入(例如,总的可寻址市场和预期的市场渗透率)来增量地评估规则集,允许以更低的成本和潜在的更快的速度来评估投资机会,尤其是如果它被证明是没有吸引力的话。也就是说,在评估全面评估应用于该机会的所有规则所需的所有其他输入之前,可以通过一个测试来消除它。因此,当规则集用于商业或投资决策制定时,可以如本文所述执行规则集的增量评估。
对传统技术的其他改进。规则集的增量评估不同于传统的基于规则生成决策树的方法,因为不需要生成决策树,从而节省了存储、网络和/或计算资源。相比之下,规则集的增量评估基于先前的结果和成本信息增益函数动态地生成下一个决策节点/测试,该成本信息增益函数特定于主题系统,例如被诊断的患者。这个序列相当于动态生成决策路径,除了每个下一个内部节点依赖于前一个测试的结果。例如,如果血液测试揭示红细胞计数低,则在选择下一个节点时会考虑具有该值或“不关心”的规则子集。这与实例化决策树并然后重复使用它进行决策的计算低效和静态性质形成对比。
规则集的增量评估的另一个改进是,它不会改变规则的早期评估中使用的值。规则集的增量评估不同于增量“重新评估”,除了对修改后的输入做出反应之外,增量“重新评估”不提供任何关于测试顺序或输入评估的指导。
图6是示出规则集的增量评估过程的实施例的流程图。在一个实施例中,图6的过程由图1的系统施行。
在步骤(602),接收与基于规则的系统相关联的第一规则集。在一个实施例中,在执行增量规则评估之前,至少部分地通过接收已知的输入值并基于已知的输入值从第一规则集移除其规则条件可能不再为真的规则,来缩减第一规则集。在一个实施例中,在执行增量规则评估之前,至少部分地通过接收假设并从第一规则集移除其动作不对应该假设的规则来缩减第一规则集。
在一个实施例中,第一规则集被应用于根本原因标识。在一个实施例中,第一规则集应用于医疗诊断。在一个实施例中,第一规则集被应用于投资决策制定。
在步骤(604),执行增量规则评估,其中在规则评估开始时并非所有输入值都是已知的。在一个实施例中,在执行步骤(604)的增量规则评估之后,释放与第一规则集相关联的存储器使用。在一个实施例中,执行增量规则评估还包括至少部分地通过基于规则的关联动作过滤掉规则来缩减第一规则集。
在一个实施例中,第一规则集由合取规则条件表(CRCT)表示,其中:第一规则集中的每个规则条件由子条件的合取来表示;每个规则由CRCT中的行来表示;并且在第一规则集中的规则条件中出现的每个子条件由CRCT中的列来表示。在一个实施例中,CRCT中的条目可以是指示该条目匹配任何输入的“不关心”值。
图7是示出用于执行增量规则评估的过程的实施例的流程图。在一个实施例中,图7的过程至少是图6中的步骤(604)的一部分。
在步骤(702),选择要为其确定第一新值的第一输入。在一个实施例中,选择第一输入至少部分基于从确定第一输入值获得的预期信息。在一个实施例中,选择第一输入至少部分基于确定第一输入值的成本。在一个实施例中,选择第一输入至少部分基于属性选择过程。在一个实施例中,选择第一输入至少部分基于RBDT-1过程。在一个实施例中,选择第一输入对正在其中评估规则的场景敏感。
在步骤(704),确定第一新值。在步骤(706),至少部分地通过基于第一输入值从第一规则集移除其规则条件可能不再为真的规则来确定第二规则集。
在确定第二规则集时第一规则集没有被充分缩减的情况下,执行进一步的增量规则评估,包括类似于图7所示的第二迭代,其中:选择第二输入,为其确定第二新值;确定第二新值;并且通过基于第二输入值从第二规则集移除其规则条件可能不再为真的规则来确定第三规则集。非限制性地,当当前规则集没有被充分缩减时,可以重复图7的这种增量规则评估迭代。
回到图6,在可选步骤(606),输出第二规则集。在一个实施例中,这包括执行与第二规则集相关联的动作。在一个实施例中,这包括接收一个或多个附加输入,并进一步评估规则,例如应用与第二规则集相关联的规则的动作,该规则的条件不能至少部分地基于附加输入被确定为评估为假。
尽管为了清楚理解的目的,已经以一些细节描述了前述实施例,但是本发明不限于所提供的细节。有许多实现本发明的可替换方式。所公开的实施例是说明性的,并且不是限制性的。

Claims (22)

1.一种方法,包括:
接收与基于规则的系统相关联的第一规则集;以及
至少部分通过以下操作来执行增量规则评估,其中在规则评估开始时并非所有输入值都是已知的:
选择要为其确定第一新值的第一输入;
确定第一新值;以及
通过基于第一输入值从第一规则集移除其规则条件可能不再为真的规则来确定第二规则集。
2.根据权利要求1所述的方法,其中执行增量规则评估还包括,在第一规则集没有被充分缩减的情况下进行以下操作:
选择要为其确定第二新值的第二输入;
确定第二新值;以及
通过基于第二输入值从第二规则集移除其规则条件可能不再为真的规则来确定第三规则集。
3.根据权利要求1所述的方法,还包括报告第二规则集。
4.根据权利要求1所述的方法,还包括:
至少部分通过执行与第二规则集相关联的动作来输出第二规则集。
5.根据权利要求1所述的方法,还包括:
至少部分通过以下操作来输出第二规则集:
接收附加输入;以及
应用与第二规则集相关联的规则的动作,所述规则的条件不能至少部分地基于附加输入被确定为评估为假。
6.根据权利要求1所述的方法,还包括在执行增量规则评估后释放与第一规则集相关联的存储器使用。
7.根据权利要求1所述的方法,其中选择第一输入至少部分基于从确定第一输入值获得的预期信息。
8.根据权利要求1所述的方法,其中选择第一输入至少部分基于确定第一输入值的成本。
9.根据权利要求1所述的方法,其中选择第一输入至少部分基于属性选择过程。
10.根据权利要求1所述的方法,其中选择第一输入至少部分基于RBDT-1过程。
11.根据权利要求1所述的方法,其中选择第一输入对正在其中评估规则的场景敏感。
12.根据权利要求1所述的方法,其中执行增量规则评估还包括至少部分通过基于规则的相关联动作过滤掉规则来缩减第一规则集。
13.根据权利要求1所述的方法,还包括在执行增量规则评估之前,至少部分通过接收已知的输入值并基于已知的输入值从第一规则集移除其规则条件可能不再为真的规则来缩减第一规则集。
14.根据权利要求1所述的方法,还包括在执行增量规则评估之前,至少部分通过接收假设并从第一规则集移除其动作不对应所述假设的规则来缩减第一规则集。
15.根据权利要求1所述的方法,其中第一规则集由合取规则条件表(CRCT)表示,其中:
第一规则集中的每个规则条件由子条件的合取来表示;
每个规则由CRCT中的行来表示;并且
在第一规则集中的规则条件中出现的每个子条件由CRCT中的列来表示。
16.根据权利要求15所述的方法,其中CRCT中的条目可以是“不关心”值,指示所述条目匹配任何输入。
17.根据权利要求1所述的方法,其中第一规则集应用于根本原因标识。
18.根据权利要求1所述的方法,其中第一规则集应用于医疗诊断。
19.根据权利要求1所述的方法,其中第一规则集应用于投资决策制定。
20.根据权利要求1所述的方法,其中确定第一新值是在评估时执行的。
21.一种系统,包括:
通信接口;
处理器,其耦合到通信接口并且被配置为:
从通信接口接收与基于规则的系统相关联的第一规则集;以及
至少部分通过以下操作来执行增量规则评估,其中在规则评估开始时并非所有输入值都是已知的:
选择要为其确定第一新值的第一输入;
确定第一新值;以及
通过基于第一输入值从第一规则集移除其规则条件可能不再为真的规则来确定第二规则集。
22.一种体现在非暂时性计算机可读介质中并且包括计算机指令的计算机程序产品,所述计算机指令用于以下操作:
接收与基于规则的系统相关联的第一规则集;以及
至少部分通过以下操作来执行增量规则评估,其中在规则评估开始时并非所有输入值都是已知的:
选择要为其确定第一新值的第一输入;
确定第一新值;以及
通过基于第一输入值从第一规则集移除其规则条件可能不再为真的规则来确定第二规则集。
CN202280026021.3A 2021-02-08 2022-02-02 增量规则条件评估 Pending CN117099084A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163147130P 2021-02-08 2021-02-08
US63/147130 2021-02-08
PCT/US2022/014861 WO2022169810A1 (en) 2021-02-08 2022-02-02 Incremental rule condition evaluation

Publications (1)

Publication Number Publication Date
CN117099084A true CN117099084A (zh) 2023-11-21

Family

ID=82741640

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280026021.3A Pending CN117099084A (zh) 2021-02-08 2022-02-02 增量规则条件评估

Country Status (3)

Country Link
US (1) US20220261664A1 (zh)
CN (1) CN117099084A (zh)
WO (1) WO2022169810A1 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005022416A1 (en) * 2003-08-21 2005-03-10 The Trustees Of Columbia University In The City Of New York Methods and systems for autonomously managing a network
US8805767B1 (en) * 2012-05-23 2014-08-12 Amazon Technologies, Inc. Machine learning memory management and distributed rule evaluation
US20160292581A1 (en) * 2015-04-02 2016-10-06 Cisco Technology, Inc. Minimized processing of streaming changes into a semantic reasoner
CN113272743B (zh) * 2019-02-19 2024-04-12 奥普塔姆软件股份有限公司 使用有通道结构的动态环境进行基于规则的自动化控制

Also Published As

Publication number Publication date
US20220261664A1 (en) 2022-08-18
WO2022169810A1 (en) 2022-08-11

Similar Documents

Publication Publication Date Title
Mohammed et al. Benchmarking methodology for selection of optimal COVID-19 diagnostic model based on entropy and TOPSIS methods
US20190189253A1 (en) Verifying Medical Conditions of Patients in Electronic Medical Records
US11328220B2 (en) Prediction characterization for black box machine learning models
Ahmed et al. De-identification of electronic health record using neural network
US11527312B2 (en) Clinical report retrieval and/or comparison
Jameela et al. Deep learning and transfer learning for malaria detection
US11748384B2 (en) Determining an association rule
CN114864099B (zh) 一种基于因果关系挖掘的临床数据自动化生成方法及系统
CN112071432A (zh) 医疗数据的分析方法、系统、介质及装置
US20210150358A1 (en) System and method for controlling confidential information
Shahbandegan et al. Developing a machine learning model to predict patient need for computed tomography imaging in the emergency department
CN117099084A (zh) 增量规则条件评估
Hussein et al. Auto-detection of the coronavirus disease by using deep convolutional neural networks and X-ray photographs
Rethmeier et al. EffiCare: better prognostic models via resource-efficient health embeddings
Buragadda et al. Multi Disease Classification System Based on Symptoms using The Blended Approach
Bhuvana et al. Efficient generative transfer learning framework for the detection of COVID-19
US11928186B2 (en) Combined deep learning and knowledge driven reasoning for artificial intelligence classification
Faghani et al. Uncover this tech term: uncertainty quantification for deep learning
CN111383123A (zh) 临床医疗开销的统计方法、装置、存储介质及电子设备
KR20220120345A (ko) 시계열 데이터에 기반한 알츠하이머병 진행감지를 위한 멀티모드 멀티테스크 딥 러닝 모델
Khozama et al. Study the Effect of the Risk Factors in the Estimation of the Breast Cancer Risk Score Using Machine Learning
Ali et al. Using Naïve Bayes and bayesian network for prediction of potential problematic cases in tuberculosis
Zabezhailo et al. On the importance of empirical contradiction for reliability estimation of intelligent data analysis results
Ketabi Using Machine Learning Algorithms for Clinical Decision Support for Breast Cancer Screening at Sunnybrook Health Sciences Center
Boll et al. Graph neural networks for clinical risk prediction based on electronic health records: A survey

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination