CN114496284A - 融合决策方法及装置、计算机可读存储介质及电子设备 - Google Patents

融合决策方法及装置、计算机可读存储介质及电子设备 Download PDF

Info

Publication number
CN114496284A
CN114496284A CN202011265274.5A CN202011265274A CN114496284A CN 114496284 A CN114496284 A CN 114496284A CN 202011265274 A CN202011265274 A CN 202011265274A CN 114496284 A CN114496284 A CN 114496284A
Authority
CN
China
Prior art keywords
input
output
decision
training
rules
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011265274.5A
Other languages
English (en)
Inventor
闫峻
焦晓康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN202011265274.5A priority Critical patent/CN114496284A/zh
Priority to PCT/CN2021/130281 priority patent/WO2022100687A1/zh
Publication of CN114496284A publication Critical patent/CN114496284A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本公开提供一种融合决策方法及装置、计算机可读存储介质以及电子设备;涉及数据处理技术领域。所述方法包括:获取多组疫情数据作为训练数据集,其中,每组疫情数据包含输入特征及对应的输出值,所述输入特征包括健康数据及活动数据,所述输出值为感染状况;获取与所述输入特征相关联的规则,得到对应的输入集合;当所述输入集合中的所述规则无法建立所述输入特征与所述输出值之间的关联关系时,获取与所述输出值相关联的规则,得到输出集合;基于所述输入集合及所述输出集合训练得到决策模型,以便通过所述决策模型得到所述感染状况。本公开可以基于规则与深度学习相融合的决策方法,通过健康数据及活动数据,可解释地得到对应的个人感染状况。

Description

融合决策方法及装置、计算机可读存储介质及电子设备
技术领域
本公开涉及数据处理技术领域,具体而言,涉及一种融合决策方法、融合决策装置、计算机可读存储介质以及电子设备。
背景技术
随着信息时代的到来以及软硬件性能的不断发展,数据在人们的生产生活中起到了越来越重要的作用。通过对数据进行分析和应用可以解决很多实际问题。
例如,人类历史上爆发过多次大规模的疫情,如黑死病、西班牙流感、非典、埃博拉病毒以及新冠病毒等,在疫情期间,及时地进行疫情防控的相应措施对于经济、民众心理及社会安定都具有重要。其中,为了更快地发现感染者以及采取适当的措施,对每个人的身体状况进行监测是至关重要的。对每个人的疫情数据进行适当的数据处理,实时地获取感染状况,便可以达到这一效果。
深度学习凭借优秀的泛化能力和特征抽象能力,在上述通过对疫情数据处理,得到感染状况的决策过程中起着重要的作用。然而,由于深度学习模型参数量巨大,各隐层之间的交互也难以解释,既有认知和深度学习的融合作为现有技术中的主要解决方案,还达不到真正的融合。
因此,需要提供一种融合决策方法,通过该融合决策方法可以基于规则与深度学习相融合的决策方法,通过健康数据及活动数据,可解释地得到对应的个人感染状况。
上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例提供一种融合决策方法、融合决策装置、计算机可读存储介质以及电子设备,可以将规则与深度学习融合,给出各类实际问题可解释的决策过程,解决现有技术中既有认知与深度学习无法真正融合的问题。
根据本公开的第一方面,提供一种融合决策方法,包括:
获取多组疫情数据作为训练数据集,其中,每组所述疫情数据包含输入特征及对应的输出值,所述输入特征包括健康数据及活动数据,所述输出值为感染状况;
获取与所述输入特征相关联的规则,得到对应的输入集合;
当所述输入集合中的所述规则无法建立所述输入特征与所述输出值之间的关联关系时,获取与所述输出值相关联的规则,得到对应的输出集合;
基于所述输入集合及所述输出集合训练得到决策模型,以便通过所述决策模型得到所述输入特征对应的所述感染状况。
在本公开的一种示例性实施例中,在所述获取训练数据集之后,所述方法还包括:
基于所述训练数据集建立对应的知识库,所述知识库包括所述输入特征及所述输出值对应的所述规则;
所述获取与所述输入特征相关联的规则,得到对应的输入集合,包括:
在所述知识库中查询与所述输入特征相关联的规则,得到所述输入集合;
所述获取与所述输出值相关联的规则,得到对应的输出集合,包括:
在所述知识库中查询与所述输出值相关联的规则,得到所述输出集合。在本公开的一种示例性实施例中,在所述得到所述输入集合后,所述方法还包括:
基于所述输入特征、以及与所述输入特征相关的所述规则建立所述输入集合对应的输入关联关系图。
在本公开的一种示例性实施例中,在所述得到所述输出集合后,所述方法还包括:
基于所述输出值、以及与所述输出值相关的所述规则建立所述输出集合对应的输出关联关系图。
在本公开的一种示例性实施例中,所述基于所述输入集合及所述输出集合训练得到决策模型,包括:
提取所述输入集合中与之相关联的规则最多的所述规则,以及所述输出集合中与之相关联的规则最多的所述规则;
以提取出的所述输入集合及所述输出集合的所述规则为训练数据,基于预训练模型训练得到所述决策模型。
在本公开的一种示例性实施例中,所述基于所述输入集合及所述输出集合训练得到决策模型,包括:
对所述输入关联关系图及所述输出关联关系图进行向量化处理,得到各节点的向量化表示;
选取所述输入关联关系图中节点度最大的所述节点作为输入,所述输出关联关系图中节点度最大的所述节点作为输出,训练得到所述决策模型。
在本公开的一种示例性实施例中,所述预训练模型为非线性变换模型。
根据本公开的第二方面,提供一种融合决策装置,包括:
训练数据获取模块,用于获取多组疫情数据作为训练数据集,其中,每组所述疫情数据包含输入特征及对应的输出值,所述输入特征包括健康数据及活动数据,所述输出值为感染状况;
输入集合建立模块,用于获取与所述输入特征相关联的规则,得到对应的输入集合;
输出集合建立模块,用于当所述输入集合中的所述规则无法建立所述输入特征与所述输出值之间的关联关系时,获取与所述输出值相关联的规则,得到对应的输出集合;
决策模型训练模块,用于基于所述输入集合及所述输出集合训练得到决策模型,以便通过所述决策模型得到所述输入特征对应的所述感染状况。根据本公开的第三方面,提供一种电子设备,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述方法。
根据本公开的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述方法。
本公开示例性实施例可以具有以下部分或全部有益效果:
在本公开示例实施方式所提供的融合决策方法中,获取多组疫情数据作为训练数据集,其中,每组疫情数据包含输入特征及对应的输出值,输入特征包括健康数据及活动数据,输出值为感染状况;获取与输入特征相关联的规则,得到对应的输入集合;当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,获取与输出值相关联的规则,得到对应的输出集合;基于输入集合及输出集合训练得到决策模型,以便通过决策模型得到输入特征对应的感染状况。一方面,本示例实施方式在上述输入集合不能建立输入特征与输出值之间的关联关系时,例如,在得到输入特征中的医生指标等健康数据后,并不一定可以直接得到对应个人的感染状况,此时,可以获取对应的输出集合,并通过输入集合及输出集合训练得到决策模型,由于该决策模型可以在输入特征及输出值的断开处建立关联关系,故而,在输入特征与输出值无法依据规则建立关联关系时,也可以基于输入特征得到对应的输出值,实现获取感染状况的决策过程,提高了其在疫情防控过程中的有效性及普适性。另一方面,本示例实施方式获取与输入特征及输出特征相关的的规则,并依据获取到的规则建立对应的输入集合及输出结合,并可以利用不一定与输入特征及输出值同时具有关联关系的规则建立决策模型,实现了依据规则与深度学习的融合实现可解释的决策过程,也即,可以得到依据健康数据及活动数据进行决策,得到对应的感染状况的可解释的过程。同时,本示例实施方式的整体决策过程模拟了人脑的感性思维及理性思考相结合的特点,可以使得决策更加合理及准确。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了可以应用本公开实施例的一种融合决策方法及装置的示例性系统架构的示意图;
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;
图3示意性示出了根据本公开的一个实施例的融合决策方法的过程的流程图;
图4示意性示出了根据本公开的一个实施例的输入关联关系图的示意图;
图5示意性示出了根据本公开的一个实施例的基于输入集合得到决策过程的示意图;
图6示意性示出了根据本公开的一个实施例的输出关联关系图的示意图;
图7示意性示出了根据本公开的一个实施例的输入关联关系图与输出关联关系图出现断开处的示意图;
图8示意性示出了根据本公开的一个实施例的模型训练的示意图;
图9示意性示出了根据本公开的一个具体应用场景的融合决策方法的过程的流程图;
图10示意性示出了根据本公开的一个实施例的融合决策装置的框图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
图1示出了可以应用本公开实施例的一种融合决策方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
本公开实施例所提供的融合决策方法可以由终端设备101、102、103执行,相应地,融合决策装置可以设置于终端设备101、102、103中。本公开实施例所提供的融合决策方法也可以由服务器105执行,相应地,融合决策装置可以设置于服务器105中。本公开实施例所提供的融合决策方法还可以由终端设备101、102、103与服务器105共同执行,相应地,融合决策装置可以设置于终端设备101、102、103与服务器105中,本示例性实施例中对此不做特殊限定。
例如,在本示例实施方式中,可以通过终端设备101、102、103获取训练数据集,该训练数据集包括输入特征及输出值,其中,每组疫情数据包含输入特征及对应的输出值,输入特征包括健康数据及活动数据,输出值为感染状况;终端设备在获取到训练数据集后,可以将获取到的训练数据集通过网络104发送至服务器105;服务器在接收到上述训练数据集后,获取与上述输入特征相关联的规则,得到对应的输入集合;并在得到的输入集合中的规则无法建立输入特征与输出值之间的关联关系时,获取与上述输出值相关联的规则,得到对应的输出集合;最后,服务器可以基于上述输入集合及上述输出集合训练得到决策模型,以便通过决策模型得到输入特征对应的感染状况。
图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图2所示,计算机系统200包括中央处理单元(CPU)201,其可以根据存储在只读存储器(ROM)202中的程序或者从储存部分208加载到随机访问存储器(RAM)203中的程序而执行各种适当的动作和处理。在RAM 203中,还存储有系统操作所需的各种程序和数据。CPU201、ROM 202以及RAM 203通过总线204彼此相连。输入/输出(I/O)接口205也连接至总线204。
以下部件连接至I/O接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至I/O接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
随着信息时代的到来以及软硬件性能的不断发展,数据在人们的生产生活中起到了越来越重要的作用。通过对数据进行分析和应用,可以实现各种各样的业务及日常需求。例如,通过对数据进行分析处理,进行更合理地决策等。
上述决策可以通过将深度学习与规则相结合的方式实现,关于该决策过程,发明人尝试性地提供了以下三种方法:
第一种方法为基于规则在深度学习模型进行预处理和后处理的方法进行融合。然而,该方法虽然可以实际地提升模型的效果,但是深度学习模型的整体决策是不可解释的。
第二种方法为通过深度学习和规则体系并行优化并联合决策的方法进行融合。在该方法中,并行优化虽然可以达到部分决策的解释目的,但是依旧偏向于效果的提升,深度学习模型内部的优化依旧无法得到解释。
第三种方法为通过在深度学习内部的优化函数内加入规则约束的方法进行融合。该方法中,单一规则的约束可以定向地起到实际效果,然而如果是规则体系的融合,多规则在优化函数内的合理数学化体现依旧存在问题。
为了解决上述方法中存在的问题,在本示例实施方式中,发明人提出了一种新的技术方案,以下对本公开实施例的技术方案进行详细阐述:
本示例实施方式首先提供了一种融合决策方法,该融合决策方法,如图3所示,具体包括以下步骤:
步骤S310:获取多组疫情数据作为训练数据集,其中,每组疫情数据包含输入特征及对应的输出值,输入特征包括健康数据及活动数据,输出值为感染状况;
步骤S320:获取与输入特征相关联的规则,得到对应的输入集合;
步骤S330:当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,获取与输出值相关联的规则,得到对应的输出集合;
步骤S340:基于输入集合及输出集合训练得到决策模型,以便通过决策模型得到输入特征对应的感染状况。
在公开示例实施方式所提供的融合决策方法中,一方面,本示例实施方式在上述输入集合不能建立输入特征与输出值之间的关联关系时,例如,在得到输入特征中的医生指标等健康数据后,并不一定可以直接得到对应个人的感染状况,此时,可以获取对应的输出集合,并通过输入集合及输出集合训练得到决策模型,由于该决策模型可以在输入特征及输出值的断开处建立关联关系,故而,在输入特征与输出值无法依据规则建立关联关系时,也可以基于输入特征得到对应的输出值,实现获取感染状况的决策过程,提高了其在疫情防控过程中的有效性及普适性。另一方面,本示例实施方式获取与输入特征及输出特征相关的的规则,并依据获取到的规则建立对应的输入集合及输出结合,并可以利用不一定与输入特征及输出值同时具有关联关系的规则建立决策模型,实现了依据规则与深度学习的融合实现可解释的决策过程,也即,可以得到依据健康数据及活动数据进行决策,得到对应的感染状况的可解释的过程。同时,本示例实施方式的整体决策过程模拟了人脑的感性思维及理性思考相结合的特点,可以使得决策更加合理及准确。
下面,在另一实施例中,对上述步骤进行更加详细的说明:
在步骤S310中,获取多组疫情数据作为训练数据集,其中,每组疫情数据包含输入特征及对应的输出值,输入特征包括健康数据及活动数据,输出值为感染状况。
在本示例实施方式中,上述疫情数据用于表征疫情期间,每个个人的身体状况及活动状况,每组疫情数据都包含有输入特征及与该输入特征对应的输出值。在获取到上述多组疫情数据后,可以将该多组疫情数据用作训练数据集,用于训练从输入特征至输出值的决策过程,以便基于训练得到的结果对应疫情期间每个人的感染状况进行监测,从而更好地实现疫情防控。
其中,上述输入特征可以包括健康数据及活动数据。举例而言,上述健康数据可以包括医疗检测指标以及可能对个人健康产生影响的各种因素,如体温、心率及血压等指标。上述活动数据可以包括个人行动轨迹、密切接触人群以及基站数据等。上述输出值用于表示当前输入特征对应的个人的感染状况。举例而言,该感染状况可以通过不同颜色的健康码来表征,该健康码可以包括绿码、黄码和红码三种状态。其中,绿码表示安全,黄码表示有感染风险,需要进行进一步的医学判断,红码表示确认感染。。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴不此为限。
在本示例性实施方式中,上述训练数据集可以是已经标注好对应关系的输入特征及输出值。并且,在获取该训练数据集后,还可以获取与当前所要解决的问题对应的领域相关的全量知识。由于关于疫情的知识较多,为了提高效率,进一步地,可以基于一阶逻辑建立与训练数据集对应的知识库,该知识库只包括与上述输入特征及输出值相关的规则。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。
在步骤S320中,获取与输入特征相关联的规则,得到对应的输入集合。
在本示例实施方式中,在获取训练数据集后,还可以获取与输入特征相关联的规则。以上述建立的训练数据集对应的知识库为例,该过程可以为:在上述知识库中查询与输入特征相关联的规则,得到输入集合。具体地,我们可以将训练数据集中的每个输入特征与上述知识库中涵盖到该输入特征的规则进行关联,并同时引入和现有规则相关联的所有规则集合,得到输入集合。
其中,规则指的是各项关联的知识,例如,移动终端信号移动的轨迹与个人活动状态的关联性,以及个人各项医疗检测指标和个人身体是否异常的医学知识之间的关联性等,本示例实施方式对此不做特殊限定。
在本示例性实施方式中,上述规则可能是片段化的,也即与输入特征相关联的规则,不一定最终与输出值发生直接关联。例如,与输入特征中个人各项医疗检测指标有关联性的规则,不一定和感染状况具有直接关联,这种情况下,规则便出现了片段化现象。当出现片段化后,要得到与输入特征相关的输出值,则需要通过步骤S330获取输出集合,并进一步地在断开处建立关联关系。当基于输入特征得到的规则没有片段化现像时,则通过输入集合直接得到从输入特征至输出值之间的决策通路。
在本示例实施方式中,举例而言,上述输入集合可以为图结构,则上述得到输入集合的过程可以为:通过上述知识库获取与输入特征相关的规则,并基于输入特征、以及与输入特征相关的规则建立输入集合对应的输入关联关系图。如图4所示,为基于输入特征及涵盖到输入特征的规则构成的图。其中,S1至S3表示与输入特征相关的规则。例如,上述输入特征可以为个人各项医疗检测指标,S1可以为知识库中含有的一项规则:体温为37.8摄氏度则为发烧状态,S2和S3可以为与发烧相关的其他医学知识。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。
上述当基于输入特征得到的规则没有片段化现像时,则通过输入集合直接得到从输入特征至输出值之间的决策通路在上述输入关联关系图中可以表现为包含有由规则构成的从输入特征至输出值的通路,如图5所示,包含有由输入特征为起点,经节点S3及S4之间的关联关系,至输出值的通路。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。
在步骤S330中,当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,获取与输出值相关联的规则,得到对应的输出集合。
在本示例实施方式中,上述在知识库中进行从输入特征至输出值的决策通路的过程类似于通过人类的理性解决问题。但由于知识库中的每一规则可能会孤立存在(即上述规则片段化现象),或者和较少的其他规则存在关联,因此通过上述知识库只能对部分问题进行决策。
当通过上述知识库不能完成决策过程,即当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,本示例实施方式还需要获取与输出值相关联的规则,得到对应的输出集合。以上述建立的训练数据集对应的知识库为例,该过程可以为:在上述知识库中查询与输出值相关联的规则,得到输出集合。具体地,我们可以将训练数据集中的每个输出值与上述知识库中与该输出值相关的规则进行关联,并同时引入和现有规则相关联的所有规则集合,得到输出集合。
在本示例实施方式中,举例而言,上述输出集合可以为图结构,则上述得到输出集合的过程可以为:在上述知识库中查询与输出值相关的规则,并基于输出值、以及与输出值相关的规则建立输出集合对应的输出关联关系图。如图6所示,为基于输出值及与输出值相关的规则构成的图。其中,S4至S6表示与输入特征相关的规则。例如,上述输出值可以为黄色的健康码,S4至S6可以为知识库中含有的与黄码对应的感染状况具有直接或间接关联关系的规则,例如,可以为曾处于危险街道或危险城市。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。
在步骤S340中,基于输入集合及输出集合训练得到决策模型,以便通过决策模型得到输入特征对应的感染状况。
在本示例实施方式中,当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,通过步骤S330获取输出集合后,还需要通过输入集合及输出集合训练得到决策模型,该决策模型可以用于建立规则断开处的关联关系。其中,上述训练过程可以基于深度学习算法进行,为了获取更好的训练效果,可以选取非线性模型作为预训练模型进行训练,用于模拟模拟人脑思维的非线性决策过程(思维跳跃)。
优选地,上述过程可以为:提取输入集合中与之相关联的规则数目最多的规则,以及输出集合中与之相关联的规则数目最多的规则;以提取出的输入集合及输出集合的规则为训练数据,基于预训练模型训练得到上述决策模型。其中,上述作为预训练模型的非线性模型可以为循环神经网络模型,也可以为全连接神经网络模型、卷积神经网络模型或长短时记忆模型等其他非线性模型。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限,例如,所选规则不一定为与之相关联的规则最多的规则,也可以为输入集合或输出集合中的任一规则,本示例实施方式对此不做特殊限定。
下面以图7及图8所示的情景对上述过程进行进一步的说明。图7中包含有输入集合及输出集合,其中输入集合中S1、S2和S3代表的规则与输出集合中S4、S5和S6代表的规则之间没有发生关联。此时,可以建立输入集合及输出集合之间的非线性关联边,并选择输入集合中节点度最大的节点及输出集合中节点度最大的点作为预训练模型的输入与输出进行模型训练。其中,为了得到更好的训练结果,在计算节点度时不考虑输入特征及输出值对应的节点。该过程模拟了人脑感性思维的过程,通过既有知识(规则)到达某一熟悉中间知识节点,结果无路可走时,通过感性的思维跳跃到达另一和输出相关联的熟悉知识节点,并最终关联输出。在图7中去除输入特征及输出值,选取出节点S3作为预训练模型的输入,节点S5作为预训练模型的输出,如图8所示,进行模型训练。为了提高精确度,在训练前,还需要通过Graph embedding(图嵌入)的方式对图7进行向量化处理,得到各节点对应的向量化表示。其中,图嵌入算法可以为Deepwalk(一种学习网络中节点的隐式表征方法),node2vec(通过一种灵活的偏向随机游走程序来抽样),或者其他可以实现向量化的算法,本示例实施方式对此不做特殊限定。
需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。例如,输入节点及输出节点还可以随机选取。
在本示例实施方式中,在上述决策模型训练完成后,便可以通过将规则与深度学习相融合的方式进行决策,并输出可解释的决策过程。具体地,在接收到新输入的输入特征后,可以先在上述知识库中查询与该新的输入特征相关的所有规则,当基于规则可以得到输出值时,则直接通过基于规则的方式获取输出值。否则,则在输入集合的规则断开处,通过上述决策模型获取输出值。
以上述输入集合及输出集合为图结构为例,上述接收到新输入特征的决策过程可以为:无需决策模型桥接的图中可以直接从输入特征链接到输出值,也即,通过既有规则产生有迹可循的思维过程产生决策。需要决策模型桥接到达输出值的输入特征,即在一定知识规则的引导下,通过部分感性跳跃产生决策,得到与输入特征对应的感染状况,从而可以进行有效的疫情防控。需要说明的是,上述场景只是一种示例性说明,本示例实施方式的保护范畴并不以此为限。
此外,此外,本示例实施方式所提出的融合决策方法还可以应用于除疫情防控意外的其他生产生活领域中的任一决策过程,此时,上述训练数据集可以为针对某领域的一当前实际问题,搜集到的该当前实际问题对应的含有标注的数据集,其具体的决策实现过程在本示例实施方式所提出的方法的对应位置也进行了详细的描述。
下面,结合图9所示的场景对上述融合决策方法进行更加进一步地说明,如图9所示,包含以下步骤:
步骤S910:获取训练数据集。
本示例实施方式所提出的融合决策方法除了疫情防控,还可以用于实现任一领域的某一具体的问题的可解释的决策过程。在该步骤中,针对某一领域的实际问题,获取训练数据集的具体方法可以为搜索当前问题的含有标注的数据集,该数据集中包括多个样本数据,每个样本数据包括对应的输入特征及输出值。此外,为了更好地利用规则,还可以搜索该领域的全量知识。
步骤S920:形成知识库。
在该步骤中,将步骤S910中搜集到的全量知识通过一阶逻辑规则化,形成知识库集合S。其中,一阶逻辑是一种抽象推理的符号工具,形式例如(p∧q)→r,表示当p和q同时成立的时刻,可以推理出r的成立。
步骤S930:得到输入集合。
在该步骤中,以训练数据集中的样本为单位,将每个样本的输入特征和知识库集合中涵盖到该输入特征的规则进行关联,得到输入集合C。
步骤S940:得到输出集合。
在该步骤中,以训练数据集中的样本为单位,将每个样本的输出值和知识库集合中涵盖到该输出值的规则进行关联,得到输出集合D。
步骤S950:构建图。
在该步骤中,基于输入特征、输入集合C、输出集合D以及输出值,构建图结构G,将每一部分进行关联。
步骤S960:当输入集合及输出结果无交集时,定义桥接集合。
在该步骤中,以样本为单位,若该样本存在输入集合C以及输出集合D,并且输入集合C及输出集合D之间无交集,则引入GRU(一种循环神经网络,用于模拟人类思考中的非线性变换)单位进行桥接,定义桥接GRU集合=G_SET。
步骤S970:对图G进行向量化。
在该步骤中,使用graph embedding(图嵌入)的方法对图G进行向量化,将向量化后的结果记为GE。
步骤S980:优化桥接单位。
步骤S960得到的桥接集合G_SET中的每一条桥接边对应的节点都已经在步骤S970进行了向量化。在该步骤中,对G_SET中的每一条边,以输入集合C中的节点作为输入,以输出集合D中的节点作为输出,优化G_SET。其中,所选节点可以为输入集合及输出集合中节点度最大的节点。
步骤S990:输出包含优化后含有桥接边G_SET的图G,作为该问题的人脑决策过程。
在该步骤中,可以输出可解释的问题决策过程。此外,在输入新的输入特征时,也可以基于优化得到的决策通路得到新的输入特征对应的输出值。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
进一步地,本示例实施方式提供了一种融合决策装置。参考图10所示,该融合决策装置1000可以包括训练数据获取模块1010、输入集合建立模块1020、输出集合建立模块1030以及决策模型训练模块1040。
其中:
训练数据获取模块1010可以用于获取多组疫情数据作为训练数据集,其中,每组疫情数据包含输入特征及对应的输出值,输入特征包括健康数据及活动数据,输出值为感染状况;
输入集合建立模块1020可以用于获取与输入特征相关联的规则,得到对应的输入集合;
输出集合建立模块1030可以用于当输入集合中的规则无法建立输入特征与输出值之间的关联关系时,获取与输出值相关联的规则,得到对应的输出集合;
决策模型训练模块1040可以用于基于输入集合及输出集合训练得到决策模型,以便通过决策模型得到输入特征对应的感染状况。
在本示例实施方式中,上述融合决策装置还可以包括结果输出模块,该结果输出模块可以用于输出从输入特征至输出值的可解释的决策通路。
在本示例实施方式中,当上述输入集合建立模块得到的输入集合中的规则可以建立输入特征与输出值之间的关联关系时,不必进行决策模块的训练,直接通过结果输出模块输出从输入特征至输出值的可解释的决策通路。
上述融合决策装置中各模块或单元的具体细节已经在对应的融合决策方法中进行了详细的描述,因此此处不再赘述。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述方法。例如,所述电子设备可以实现如图3所示的各个步骤等。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种融合决策方法,其特征在于,包括:
获取多组疫情数据作为训练数据集,其中,每组所述疫情数据包含输入特征及对应的输出值,所述输入特征包括健康数据及活动数据,所述输出值为感染状况;
获取与所述输入特征相关联的规则,得到对应的输入集合;
当所述输入集合中的所述规则无法建立所述输入特征与所述输出值之间的关联关系时,获取与所述输出值相关联的规则,得到对应的输出集合;
基于所述输入集合及所述输出集合训练得到决策模型,以便通过所述决策模型得到所述输入特征对应的所述感染状况。
2.根据权利要求1所述的融合决策方法,其特征在于,在所述获取训练数据集之后,所述方法还包括:
基于所述训练数据集建立对应的知识库,所述知识库包括所述输入特征及所述输出值对应的所述规则;
所述获取与所述输入特征相关联的规则,得到对应的输入集合,包括:
在所述知识库中查询与所述输入特征相关联的规则,得到所述输入集合;
所述获取与所述输出值相关联的规则,得到对应的输出集合,包括:
在所述知识库中查询与所述输出值相关联的规则,得到所述输出集合。
3.根据权利要求1所述的融合决策方法,其特征在于,在所述得到所述输入集合后,所述方法还包括:
基于所述输入特征、以及与所述输入特征相关的所述规则建立所述输入集合对应的输入关联关系图。
4.根据权利要求3所述的融合决策方法,其特征在于,在所述得到所述输出集合后,所述方法还包括:
基于所述输出值、以及与所述输出值相关的所述规则建立所述输出集合对应的输出关联关系图。
5.根据权利要求1所述的融合决策方法,其特征在于,所述基于所述输入集合及所述输出集合训练得到决策模型,包括:
提取所述输入集合中与之相关联的规则最多的所述规则,以及所述输出集合中与之相关联的规则最多的所述规则;
以提取出的所述输入集合及所述输出集合的所述规则为训练数据,基于预训练模型训练得到所述决策模型。
6.根据权利要求4所述的融合决策方法,其特征在于,所述基于所述输入集合及所述输出集合训练得到决策模型,包括:
对所述输入关联关系图及所述输出关联关系图进行向量化处理,得到各节点的向量化表示;
选取所述输入关联关系图中节点度最大的所述节点作为输入,所述输出关联关系图中节点度最大的所述节点作为输出,训练得到所述决策模型。
7.根据权利要求5或6所述的融合决策方法,其特征在于,所述预训练模型为非线性变换模型。
8.一种融合决策装置,其特征在于,包括:
训练数据获取模块,用于获取多组疫情数据作为训练数据集,其中,每组所述疫情数据包含输入特征及对应的输出值,所述输入特征包括健康数据及活动数据,所述输出值为感染状况;
输入集合建立模块,用于获取与所述输入特征相关联的规则,得到对应的输入集合;
输出集合建立模块,用于当所述输入集合中的所述规则无法建立所述输入特征与所述输出值之间的关联关系时,获取与所述输出值相关联的规则,得到对应的输出集合;
决策模型训练模块,用于基于所述输入集合及所述输出集合训练得到决策模型,以便通过所述决策模型得到所述输入特征对应的所述感染状况。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
10.一种电子设备,其特征在于,包括:
处理器;
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-7任一项所述的方法。
CN202011265274.5A 2020-11-12 2020-11-12 融合决策方法及装置、计算机可读存储介质及电子设备 Pending CN114496284A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011265274.5A CN114496284A (zh) 2020-11-12 2020-11-12 融合决策方法及装置、计算机可读存储介质及电子设备
PCT/CN2021/130281 WO2022100687A1 (zh) 2020-11-12 2021-11-12 融合决策方法及装置、计算机可读存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011265274.5A CN114496284A (zh) 2020-11-12 2020-11-12 融合决策方法及装置、计算机可读存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN114496284A true CN114496284A (zh) 2022-05-13

Family

ID=81489991

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011265274.5A Pending CN114496284A (zh) 2020-11-12 2020-11-12 融合决策方法及装置、计算机可读存储介质及电子设备

Country Status (2)

Country Link
CN (1) CN114496284A (zh)
WO (1) WO2022100687A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115993077B (zh) * 2023-03-22 2023-06-06 中国人民解放军火箭军工程大学 复杂路况运输情况下惯导系统优选决策方法及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190148023A1 (en) * 2017-11-16 2019-05-16 Google Llc Machine-Learned Epidemiology
CN109378065A (zh) * 2018-10-30 2019-02-22 医渡云(北京)技术有限公司 医疗数据处理方法及装置、存储介质、电子设备
CN111383754B (zh) * 2018-12-28 2023-08-08 医渡云(北京)技术有限公司 医疗决策方法、医疗决策装置、电子设备及存储介质
CN111446002A (zh) * 2020-03-07 2020-07-24 华中科技大学 一种基于人工智能的新型冠状病毒患者病况分类系统
CN111785380B (zh) * 2020-07-01 2022-12-02 医渡云(北京)技术有限公司 传染性疾病患病风险等级的预测方法及装置、介质、设备
CN111739657B (zh) * 2020-07-20 2020-12-15 北京梦天门科技股份有限公司 基于知识图谱的流行病感染者预测方法及系统
CN111816311A (zh) * 2020-07-22 2020-10-23 北京捷通华声科技股份有限公司 状态识别的方法、系统、装置

Also Published As

Publication number Publication date
WO2022100687A1 (zh) 2022-05-19

Similar Documents

Publication Publication Date Title
CN112560496B (zh) 语义分析模型的训练方法、装置、电子设备及存储介质
JP2020017952A (ja) 警告するための方法と装置
CN112528037B (zh) 基于知识图谱的边关系预测方法、装置、设备及存储介质
EP3455750A1 (en) Primary key-foreign key relationship determination through machine learning
CN114330312B (zh) 标题文本处理方法、装置、存储介质和程序
Banos et al. Mining minds: an innovative framework for personalized health and wellness support
Jovanovic et al. Ambient assisted living: scoping review of artificial intelligence models, domains, technology, and concerns
M. Radwan et al. A new expert system for learning management systems evaluation based on neutrosophic sets
CN113590776A (zh) 基于知识图谱的文本处理方法、装置、电子设备及介质
Henson et al. An ontological approach to focusing attention and enhancing machine perception on the Web
CN114496284A (zh) 融合决策方法及装置、计算机可读存储介质及电子设备
Sun et al. Decoding the silent majority: Inducing belief augmented social graph with large language model for response forecasting
US20240118984A1 (en) Prediction method and apparatus for faulty gpu, electronic device and storage medium
Gunjal et al. Drafting event schemas using language models
CN112735564A (zh) 心理健康状态预测方法、设备、介质及计算机程序产品
Wang et al. Nlp-based cross-layer 5g vulnerabilities detection via fuzzing generated run-time profiling
CN116668105A (zh) 一种结合工控安全知识图谱的攻击路径推理系统
Prado et al. A direct method to detect deterministic and stochastic properties of data
CN115408535A (zh) 事故知识图谱构建方法、装置、存储介质及电子设备
Zhang et al. Modeling temporal-modal entity graph for procedural multimodal machine comprehension
EP3779730A1 (en) Method and apparatus for outputting information
CN113571159A (zh) 一种基于人工智能的孤独症谱系障碍儿童康复护理系统
Haltaufderheide et al. Cultural implications regarding privacy in digital contact tracing algorithms: method development and empirical ethics analysis of a German and a Japanese approach to contact tracing
CN113190749B (zh) 用于确定对象属性的方法及装置、电子设备和介质
Enayet et al. Learning a generalizable model of team conflict from multiparty dialogues

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220513

RJ01 Rejection of invention patent application after publication