CN115408263A - 利用和训练用于控件标识的人工智能模型 - Google Patents

利用和训练用于控件标识的人工智能模型 Download PDF

Info

Publication number
CN115408263A
CN115408263A CN202210516253.9A CN202210516253A CN115408263A CN 115408263 A CN115408263 A CN 115408263A CN 202210516253 A CN202210516253 A CN 202210516253A CN 115408263 A CN115408263 A CN 115408263A
Authority
CN
China
Prior art keywords
mapping
control
mapped
target
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210516253.9A
Other languages
English (en)
Inventor
A·A·阿德巴约
M·F·布鲁特
曾赛
M·H·赫尔南德斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN115408263A publication Critical patent/CN115408263A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3608Software analysis for verifying properties of programs using formal methods, e.g. model checking, abstract interpretation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3604Software analysis for verifying properties of programs
    • G06F11/3616Software analysis for verifying properties of programs using software metrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Medical Informatics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供了用于相对于目标标准的目标规范来利用AI模型的计算机系统、程序代码和方法。AI模型被配置用于标识与对应标准相关的至少一个候选控件。对映射进行遍历以标识映射中的候选控件。利用映射的源和目的地控件来标识与目标标准相关联的至少一个映射的控件。选择性地利用映射的控件和目标标准对AI模型进行训练。

Description

利用和训练用于控件标识的人工智能模型
技术领域
本实施例涉及用于利用人工智能(AI)模型来标识控件(诸如安全和隐私控件)并训练AI模型来提高其技术有效性的系统、计算机程序产品和方法。
背景技术
安全合规和隐私合规是确保满足足够水平的安全相关和隐私相关要求的过程。此类要求通常在法规中规定,尽管这些要求可能存在于其他来源,如法律、行政命令、指令、政策、指南、标准等。这样的要求一般在法规中规定,尽管这些要求可能见于诸如法律、行政命令、指令、政策、指南、标准等的其他来源。在典型的(但非穷尽的)场景中,法规或其他法律要求由通常是行政机构或(联邦或州)立法机构的政府部门发布,其规定涉及诸如保护公共部门和私营部门组织运营和资产(例如数据)免受安全和隐私风险等事项的要求(例如技术要求)。此类安全和隐私风险可能起因于例如试图利用信息技术系统和产品漏洞的威胁性行为者、自然灾害、电力故障、诸如人为错误的被动威胁、以及外部和内部的其他威胁。遵守此类法律要求是审慎的、成本预防性的,并且在许多情况下是强制性的,以避免违反法律和其他法定要求。
信息和安全和隐私标准通常由公认的私营部门或公共部门标准机构或组织批准。网络安全标准例如规定保护数据和实施信息安全的技术规范。遵守此类标准的规范对于行业准入是很有必要、甚至强制性的。标准通常是特定于组织的(例如NIST、HIPPA等)。标准的示例包括例如美国国家标准和技术研究所(NIST)标准、健康保险可移植性和责任法案(HIPAA)标准、支付卡行业数据安全标准(PCI-DSS)、国际标准化组织(ISO)标准、通用数据保护条例(GDPR)等。
确保遵守可能适用于给定组织的各种安全相关和隐私相关要求,不但需要在实施充分保护方面进行尽职调查,而且需要在法规、法律等修订、重写、撤销和颁布时,以及在发现新的秘密攻击手段时,维护和更新此类保护。为了满足这些要求,私营部门和公共部门中的组织以及个人已经开发和实施了安全和隐私控件(下文中统称为“控件”),用以保护信息技术和其他系统、计算平台、设备和产品。组织或个人为满足安全相关和隐私相关要求而选择和实施控件。
控件被描述为可以检测、防止、减轻和/或抵消安全风险(诸如例如威胁性行为者利用安全漏洞的能力)的技术、管理或物理保障和保护能力。例如,美国国家标准和技术研究所(NIST)通过其网站提供出版物《信息系统和组织的安全和隐私控件》(Security andPrivacy Controls for Information Systems and Organizations),NIST SpecialPublication 800-53,Rev.5(Sep.2020))。该出版物公开了包括基本控件部分(规定要实现的安全和/或隐私能力)、讨论部分、相关控件部分、控件增强部分以及参考部分的控件结构。
可以将一个标准组织的标准映射到一个或多个其他标准组织的标准。控件直接映射到标准,因为控件测试被设计用于例如测量标准在实践中是如何实施标准的诸方面。控件检查是对一个或多个标准中的一个或多个控件的合规性进行验证。
通常,不同标准组织或机构开发多个与相同(或相似)安全或隐私要求相关的标准。因此,一个标准组织的给定标准的控件可能与另一标准组织的另一标准的一个或多个控件具有相似性。因此,提供促进利用人工智能(AI)模型来标识安全和隐私控件以及将标准映射纳入AI模型的训练中以推进和改进AI模型的技术有效性的系统、计算机程序产品和方法将是有利的。
发明内容
实施例包括用于利用人工智能(AI)模型来标识诸如安全和隐私控件的控件以及训练AI模型以改善其技术有效性的系统、计算机程序产品和方法。提供本发明内容部分以便简要地介绍在以下具体实施方式部分进一步描述的代表性概念的选择。本发明内容部分并不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在以任何方式限制所要求保护的主题的范围。
一方面,计算机系统设置有操作地耦合至存储器处理器以及与处理器和存储器通信的平台。平台包括人工智能(AI)管理器、映射管理器和训练管理器。AI模型管理器被配置用于相对于目标标准的目标规范来利用AI模型。AI模型被配置用于标识与对应标准相关的至少一个候选控件。映射管理器被配置用于遍历包括源和目的地控件的映射。遍历包括标识该映射中的该至少一个候选控件以及遍历该映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。训练管理器被配置用于利用映射的控件和目标标准选择性地训练AI模型。
另一方面,提供一种利用人工智能(AI)和对应的AI模型来促进将控件映射到目标标准的计算机程序产品。计算机程序产品包括计算机可读存储介质,该计算机可读存储介质具有随其包含的程序代码。程序代码可由处理器执行,所述处理器被配置用于相对于目标标准的目标规范来利用AI模型。所述AI模型被配置用于标识与对应标准相关的至少一个候选控件。程序代码还可由处理器执行以遍历包括源控件和目的地控件的映射。遍历包括标识该映射中的至少一个候选控件以及遍历该映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。程序代码还可由处理器执行以选择性地利用映射的控件和目标标准训练所述AI模型。
又一方面,提供了一种包括相对于目标标准的目标规范来利用人工智能(AI)模型的方法。AI模型标识与相应标准相关的至少一个候选控件。遍历包括源和目的地控件的映射。该遍历包括:至少标识映射中的候选控件,以及遍历映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。选择性地利用映射的控件和目标标准训练AI模型。
根据再一个方面,提供一种计算机系统,其配置有可操作地耦合到存储器的处理器以及与所述处理器和所述存储器通信的平台。该平台包括人工智能(AI)管理器、映射管理器和训练管理器。AI模型管理器被配置用于相对于目标标准的目标规范来利用AI模型。AI模型被配置用于标识与对应标准相关的至少一个候选控件。映射管理器被配置用于遍历包括源控件和目的地控件的映射。该遍历包括:标识映射中的至少一个候选控件,以及遍历映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。映射管理器被配置用于标识所标识的映射的控件的数量。响应于所标识的映射的控件的数量在预定范围之外或者不满足预定限制,映射管理器被配置用于改变遍历的参数并使用改变的参数来重新遍历映射的源和目的地控件。训练管理器被配置用于选择性地利用映射的控件和目标标准来训练AI模型。
根据另一个方面,提供了一种包括相对于目标标准的目标规范来利用人工智能(AI)模型的方法。AI模型标识与相应标准相关的至少一个候选控件。遍历包括源和目的地控件的映射。该遍历包括:至少标识映射中的候选控件,以及遍历映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。标识所标识的映射的控件的数量。响应于所标识的映射的控件的数量在预定范围之外或者不满足预定限制,改变遍历的参数。使用改变的参数重新遍历映射的源和目的地控件。选择性地利用映射的控件和目标标准训练AI模型。
从以下结合附图对示例性实施例的详细描述中,这些和其他特征和优点将变得显而易见,附图描述并示出了另外各方面的各种系统、子系统、设备、装置、模型、过程和方法。
附图说明
在此参考的附图构成说明书的一部分,通过引用纳入本文。除非另外指明,否则附图中所示的特征仅意味着对一些实施例而不是对所有实施例的例示。
图1示出了支持和实现利用和训练用于控件标识的AI模型的计算机系统的示意图。
图2描述了示出如在图1中示出和描述的AI平台工具及其相关联的应用程序接口(API)的框图。
图3A和图3B共同描述了说明用于利用和训练控件标识的AI模型的方法的实施例的流程图。
图4描绘了示出对图3A和图3B的流程图的修改的实施例的流程图。
图5描绘了根据一个实施例的关系映射的示例的片段视图。
图6描绘了示出了用于实现以上关于图1-5描述的系统和过程的基于云的支持系统的计算机系统/服务器的示例的框图。
图7描绘了示出云计算机环境的框图。
图8描绘了示出由云计算环境提供的一组功能抽象模型层的框图。
具体实施方式
将容易理解的是,如在此的附图中总体上描述和展示的这些示例性实施例的这些部件可以按多种不同的设置来安排和设计。因此,如在本说明书和附图中呈现的,在此描述的系统、计算机程序产品和方法以及其他方面的实施例的以下详细描述并不旨在限制所要求保护的实施例的范围,而是仅表示所选择的实施例。
贯穿本说明书提及的“选择的实施例”、“一个实施例”、或“实施例”是指结合该实施例所描述的特定特征、结构、或特性被包括在至少一个实施例中。因此,在整个本说明书中的各个地方出现的短语“选择的实施方式”、“在一个实施例中”或“在实施例中”不一定是指相同的实施例。应当理解,各种实施例可以彼此组合,并且可以用任何一个实施例修改另一个实施例。
通过参考附图,将最好地理解示出的实施例,其中,同样的部分在全文中以同样的标号表示。以下描述仅旨在通过举例的方式,简单地展示与本文所要求保护的实施例一致的设备、系统、和过程的某些选择的实施例。
在信息技术(IT)领域中,合规性旨在对信息进行适当控制和保护。内部合规性围绕策略、目标和组织结构。外部考虑旨在满足客户端或终端用户,同时保护数据和内部结构。例如,从安全观点和隐私观点来看,IT合规性利用IT系统应该遵循的规则和标准来保护底层组织或结构。合规风险度量系统或系统组件由于组织不遵守一组规则或标准而可能具有的关于例如对手攻击、自然灾难、电源故障、人为错误等的弱点的程度。风险管理涉及通过一个或多个控件来减轻和管理风险。
参考图1,描述了平台计算系统100的示意图。在示例性实施例中,该平台包括或纳入人工智能(AI)平台。如图所示,提供了跨网络连接105与多个计算设备180、182、184、186、188和190通信的服务器110。服务器110配置有跨总线114与存储器116通信的处理单元(在本文中也称为处理器)112。服务器110被示为具有用于通过网络105从计算设备180、182、184、186、188和190中的一个或多个进行认知计算(包括自然语言处理(NLP)和机器学习(ML))的人工智能(AI)平台150。更具体来说,计算设备180、182、184、186、188和190通过一个或多个有线和/或无线数据通信链路彼此通信和与其他设备或组件通信,其中每一通信链路可包括导线、路由器、开关、发射器、接收器等中的一个或多个。在该联网布置中,服务器110和网络连接105使得能够进行通信检测、识别和解析。服务器110的其他实施例可以与除了本文描绘的那些之外的组件、系统、子系统和/或设备一起使用。
AI平台150在本文中被示出为配置有用于利用AI模型140来预测用于规定或其他要求的控件(诸如安全和隐私控件)以及训练AI模型140以改善其性能的工具。工具包括但不限于AI模型管理器152、映射管理器154、评分管理器156和训练管理器158。虽然图1将工具152、154、156和158中的每个显示为AI平台150的一部分,但是应当理解,在实施例中,映射管理器154、评分管理器156、训练管理器158或其任何组合不一定是AI平台150或AI操作的部分,并且可以分开地与处理器112和存储器116可操作地通信。
人工智能(AI)涉及针对与人类相关的计算机和计算机行为的计算机科学领域。AI指的是当机器基于信息能够做出决策时的智能,其使得在给定主题中成功的机会最大化。更具体地,AI能够从数据集学习以解决问题并提供相关推荐。例如,在人工智能计算机系统领域中,自然语言系统(诸如IBM
Figure BDA0003639619970000051
人工智能计算机系统或其他自然语言询问应答系统)基于系统获得的知识来处理自然语言。为了处理自然语言,可以用从数据库或知识语料库导出的数据来训练系统,但是由于多种原因,所得结果可能是不正确的或不准确的。
机器学习(ML)(其是人工智能(AI)的子集)利用算法从数据学习并基于该数据创建前瞻。AI指的是当机器基于信息能够做出决策时的智能,其使得在给定主题中成功的机会最大化。更具体地,AI能够从数据集学习以解决问题并提供相关推荐。认知计算是计算机科学和认知科学的结合。认知计算利用使用最小数据、视觉识别和自然语言处理的自教学算法来解决问题并优化人类过程。
AI的核心和相关推理在于相似性的概念。理解自然语言和对象的过程需要从可能具有挑战性的关系角度推理。结构(包括静态结构和动态结构)规定给定确定输入的确定输出或动作。更具体地,所确定的输出或动作基于结构内的明确或固有关系。构建那些结构依赖于适当的数据集。
AI平台150在本文中被示出为被配置用于接收来自各种源的输入102。例如,AI平台150可以跨网络105从多个计算设备180、182、184、186、188和190中的一个或多个接收输入,诸如用于目标标准的目标规范。此外,如本文所示,AI平台150操作地耦合到知识库160,其在本文中也称为语料库或数据库。
在示例性实施例中,AI模型管理器152利用AI模型140进行控件标识。在示例性实施例中,AI模型140例如是分类模型或基于文本相似性的搜索模型。在示例性实施例中,AI模型140是机器学习模型、神经网络或支持向量机。在示例性实施方式中,利用现有的分类控件描述预先训练AI模型140以接收目标规范(例如,“最小密码长度必须是七个字符”)和目标标准(例如,PCI/DSS),并标识与对应标准(例如,NIST IA-5(1))和对应得分(在本文中也称为“第一得分”)相关联的至少一个候选控件。候选控件可包括例如控件相关性标识符(CCI)、基本控件部分、讨论部分、相关控件部分、控件增强部分和参考部分。AI模型140可考虑候选控件的部分或全部的任何组合。
通常,由AI模型140标识出多个候选控件。标识多个候选控件的一个原因在于,尽管存在类似内容,但目标规范的语言在标准上不同,并且由于是基于文本的,因此目标规范的语言常常受到不同的解释。实际上,粒度水平在不同标准之间也不同。进一步,验证与标准的符合通常导致重复的控件检查。
在示例性实施例中,由AI模型140标识的至少一个候选控件(更经常地,多个候选控件)与输入的目标规范共享一个或多个特征或以其他方式拥有一个或多个相似性。根据示例性实施例,相似性可以是基于文本的和/或基于元数据的。根据示例性实施例,由AI模型140标识相应得分包括评估相应得分。例如,得分可以是反映目标规范与所标识的至少一个候选控件(或候选控件的控件结构的任何部分,诸如CCI或控件结构的讨论部分)之间的相似性的置信度得分。可以用余弦相似性来度量目标规范与候选控件的向量(通过已知的向量化技术生成)之间的相似性,以用于评估得分。在示例性实施例中,评估语义相似性。
根据实施例,在(i)由AI模型管理器152标识的置信度得分(例如,0.7)大于并且因此满足预定的第一阈值(例如,0.5)并且(ii)与候选控件(例如,8.2.3)相关联的标准(例如,PCI/DSS)匹配目标标准(例如,PCI/DSS)的情况下,候选控件(例如,8.2.3.)被视为与目标标准的可接受的匹配。因为候选控件是可接受的匹配,所以候选控件作为输出被接受,而不利用关系映射。
另一方面,如果候选控件不是可接受的输出,则用映射管理器154遍历包括源控件和目的地控件的一个或多个关系映射(以下参照图5更详细地讨论)。根据示例性实施例,关系映射是标准之间和跨标准的控件的已知、预定关系的集合。
如图1所示,AI平台150进一步被示出为与知识库160(在本文中也称为语料库)通信。尽管图1中仅示出了一个知识库160,但应当理解,系统(100)可包括额外的知识库。所示出的知识库160被示出为填充有多个关系映射,包括关系映射0(162)、关系映射1(164)、…和关系映射N-1(166),其中N可以是任何整数。虽然在图1中示出了三个关系映射,但是应当理解,知识库160可以包括更少或更多的关系映射。在示例性实施例中,访问单个关系映射。关系映射在这里是出于描述的目的而示出和描述的。
根据实施例,如果候选控件与不同于目标标准的对应标准相关联,则可以认为(由AI模型140标识的)候选控件是对目标规范不可接受的匹配。作为示例,AI模型140可能输出与标准(例如,NIST)相关联的候选控件(例如,IA-5(1)),该标准不同于输入到AI模型140中的目标标准(例如,PCI/DSS)。
根据另一个实施例,在AI模型140标识的候选控件的第一得分不满足第一阈值的情况下,(由AI模型140标识的)候选控件可被视为对目标规范的不可接受匹配。例如,在给定候选控件的第一得分相对较低(例如,0.3)而预定阈值大于第一得分(例如,阈值为0.5)的情况下,候选控件不是目标规范的可接受匹配。
在候选控件对于目标规范不是可接受的匹配的情况下(例如,由于不匹配的标准和/或低的第一得分),系统采用映射管理器154来遍历关系映射以找到“映射的”控件。
映射管理器154被配置用于遍历包括源和目的地控件的关系映射,包括标识映射中的至少一个候选控件以及遍历映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件。
根据实施例,映射管理器154被配置用于标识包括源控件和目的地控件的关系映射中的至少一个候选控件,并遍历关系映射的源控件和目的地控件以标识与目标标准相关联的至少一个映射的控件。所标识的候选控件可对应于关系映射的源控件或目的地控件。例如,在实施例中,如果所标识的候选控件是关系映射中的源控件,则该遍历涉及标识与源控件匹配的目的地控件。另一方面,根据实施例,如果所标识的候选控件是关系映射中的目的地控件,则该遍历涉及标识与目的地控件相匹配的源控件。
现在参考图5,示出了根据实施例的关系映射500的实施例的片段视图。根据不同实施例,关系映射500由一个或多个主题专家(SME)、其他人员和/或由自动化程序准备。
图5的关系映射500体现为一种数据结构,其在实施例中并且如本文所示,采用包括四个列的表的形式,但是应当理解,可以采用包括更少或更多列的表或除图5所示的表的结构之外的结构的关系映射。所述列包括包含源控件和相关联的标准的源列502、包含目的地控件和相关联的标准的目的地列504、置信度列506和关系类型列508。关系映射500进一步包括表示源控件/标准502与目的地控件/标准504的映射的多个行5100、5101、…510N-1,其中,N可以是1与无穷大之间的整数,通常是数以百计、数以千计或数以百万计。
为了说明的目的,在行5100中提供实例,其中源控件/标准NIST:1A-5(1)被映射到目的地控件/标准PCI/DSS:8.2.3。(术语“源”和“目的地”在匹配的对之间任意适用,即,PCI/DSS:8.2.3可以是源控件/标准,NIST:1A-5(1)可以是目的地控件标准。)可以在关系映射500的行中包括的其他标准,例如可包含HIPPA、ISO、GDPR、防卫信息系统代理(DISA)、安全技术实施指南(STIG)和各种其他标准。置信度列506表示与给定行的源对和目的地对之间的展示对应关系的相似性或关系相关联的值。例如,对于行5100,NIST:1A-5(1)与PCI/DSS:8.2.3之间的关系的评估的置信度是“高”。可替代地,置信度列506可以记录数值(例如,在0和1之间)、等级或其它表示置信度的值或标记。关系类型列(508)表示给定行的源和目的地对之间的关系。根据示例性实施例,关系指的是标准分层结构中的关系,诸如父母、孩子、同辈、邻居等。在图5的行(5100)中,关系类型是“邻居”。
根据另一实施例,计算机系统100,更具体地,服务器110被配置用于使关系映射的遍历受至少一个参数或限制的约束。根据实施例,参数包括关系置信度评级(或水平)。例如,要将映射的控件标识为输出,该参数可能要求图5中的置信度列506中关系至少为“高”。例如,如果“高”置信度水平标识出的映射的控件太少,那么可能需要改变可接受的置信度水平,例如改变为“中”。根据实施例,映射管理器154改变置信度水平。
根据另一实施例,为了将映射的控件标识为输出,用于遍历关系映射的参数或限制包括分层结构中的源或目的地控件之间的中间节点数量的限制。例如,在分层结构中,不是所有节点都通过一个边直接连接到彼此。相反,在相邻关系对之间可能存在一个、两个、三个、四个或更多个中间节点(分别具有对应的两个、三个、四个、五个或更多个边)。例如,在源节点表示曾孙而目的地节点表示曾祖父母的情况下,存在两个中间节点。表示曾孙的源节点通过第一边连接到表示父母的第一中间节点,表示父母的第一中间节点通过第二边连接到表示祖父母的第二中间节点,表示祖父母的第二中间节点通过第三边连接到表示曾祖父母的目的节点。所以,在曾孙源节点和曾祖父母目的地节点之间存在两个中间节点。在此实例中,如果将中间节点数量的限制设定为一或更少,那么将不会标识出曾孙源节点与曾祖父母目的地节点之间的关系(由两个中间节点表征)。另一方面,如果将中间节点数量的限制设定为二或更少,那么将会标识出曾孙源节点与曾祖父母目的地节点之间的关系(由两个中间节点表征)。根据实施例,映射管理器154改变可接受的中间节点数量。
下面给出用于遍历关系映射的伪码的示例性实施例:
Figure BDA0003639619970000081
给出traverse(r,t,confidence)的伪码如下:
Figure BDA0003639619970000082
traversal_list(遍历_列表)是可能的映射的列表。如果返回的traversal_list为空,则可能需要对关系进行重新评估,这在实施例中包括以更包含性的方式设置或重新设置置信度以供考虑。
根据实施例,参照图1的平台计算系统100,评分管理器156被配置用于评估表示由映射管理器154输出的至少一个映射的控件与目标规范之间的相似性的第二得分。根据示例性实施例,相似度是基于从文本导出的嵌入向量来计算的。可以用诸如word2vec或语言建模技术(例如变换器)的嵌入技术来从文本导出向量。通常,评分管理器156将评估另外的得分(在此也称为“第二得分”),其中“第一得分”在上文相对于所利用的AI模型140针对映射管理器154输出的多个映射的控件的进行了描述。根据一实施例,评分管理器156被进一步配置用于基于第二得分对映射的控件进行排名。以下给出用于进行排名的伪码的示例:
Figure BDA0003639619970000091
如伪码的第5行所示,生成得分,在实施例中,其可利用许多相似性评估中的一个。在示例性实施例中,相似性是基于文本的评估,其可采用控件和目标规范的余弦相似性评估。
根据实施例,评分管理器156确定每个映射的控件的得分(在此也称为第二得分)高于还是低于阈值。根据实施例,如果第二得分(例如,0.7)等于或大于并且因此满足预定的第二阈值(例如0.5),则映射的控件被视为与目标标准的可接受的匹配。根据实施例,如果第二得分(例如0.3)小于并且因此不满足预定的第二阈值(例如0.5),则映射的控件被视为与目标标准的不可接受的匹配。
在映射的控件具有使映射的控件符合目标规范的可接受的匹配的条件的可接受的得分或其他置信度水平的情况下,评分管理器156接受映射的控件作为输出。目标规范被映射到映射的控件。
在发现映射的控件缺少使映射的控件符合目标规范的可接受的匹配的条件的可接受的得分或其他置信度水平的情况下,可以执行对该发现的验证。根据实施例,验证可以由专家(诸如SME)执行。
训练管理器158被配置用于如果验证揭示映射的控件是目标规范的可接受的匹配,则选择性地用映射的控件和目标规范训练AI模型140。如果验证揭示映射的控件不是目标规范的可接受的匹配,则训练管理器选择不使用该匹配来训练AI模型140。
AI模型140的数据源是知识库k。下面是用于丰富用于AI模型140(例如下文进一步详述的训练AI模型140)的知识库的伪码:
Figure BDA0003639619970000092
Figure BDA0003639619970000101
在一些说明性实施例中,服务器110可以是可从纽约阿蒙克的国际商业机器公司获得的IBM
Figure BDA0003639619970000102
系统,该系统用下文描述的说明性实施例的机制扩充。AI模型管理器152以及可选地映射管理器154、评分管理器156和训练管理器158中的一个或多个(统称为工具)被示为在服务器110的AI平台150中体现或集成在服务器110的AI平台150内。在实施例中,这些工具可在跨网络105连接到服务器110的单独计算系统(例如服务器190)中实现。无论在哪里体现,这些工具都能用于支持用于控件标识的AI模型的利用和训练。这些工具能用于选择‘最佳’匹配的控件并且进一步训练AI模型。
可以利用AI平台150的信息处理系统的类型的范围从诸如手持式计算机/移动电话180的小型手持式设备到诸如大型计算机182的大型主机系统。手持式计算机180的示例包括个人数字助理(PDA)、诸如MP4播放器的个人娱乐设备、便携式电视和致密盘播放器。信息处理系统的其他示例包括笔或平板电脑184、膝上型或笔记本电脑186、个人计算机系统188和服务器190。如图所示,可以使用计算机网络105将不同信息处理系统联网在一起。可以用于互连各种信息处理系统的计算机网络105的类型包括局域网(LAN)、无线局域网(WLAN)、互联网、公共交换电话网(PSTN)、其他无线网络和可以用于互连信息处理系统的任何其他网络拓扑。许多信息处理系统包括非易失性数据存储器,诸如硬盘驱动器和/或非易失性存储器。有些信息处理系统可使用单独的非易失性数据存储器(例如,服务器190利用非易失性数据存储器190A,大型计算机182利用非易失性数据存储器182A。非易失性数据存储器182A可以是各种信息处理系统外部的组件或者可以是信息处理系统之一内部的组件。
用于支持AI平台150的信息处理系统可以采取许多形式,其中一些在图1中示出。例如,信息处理系统可以采取台式机、服务器、便携式、膝上型、笔记本的形式或其他形式因素的计算机或数据处理系统。此外,信息处理系统可以采取其他形式因素,诸如个人数字助理(PDA)、游戏设备、ATM机、便携式电话设备、通信设备或包括处理器和存储器的其他设备。此外,信息处理系统可以体现北桥/南桥控制器架构,尽管将理解也可以采用其他架构。
应用程序接口(API)在本领域中被理解为在两个或更多个应用程序之间的中间的软件。关于图1中示出和描述的(AI)平台150,可以利用一个或多个API来支持工具152、154、156和158中的一个或多个及其相关联的功能。参照图2,提供了示出工具152、154、156和158及其相关联的API的框图200。如图所示,多个工具嵌入在(AI)平台205内,该工具包括与API0 212相关联的AI模型管理器252、与API1 222相关联的映射管理器254、与API2232相关联的评分管理器256、以及与API3 242相关联的训练管理器258。每个API可以用一种或多种语言和接口规范来实现。
如图所示,API0 212被配置用于支持和启用由AI模型管理器252表示的功能。API0212提供对访问预先训练的AI模型、将目标规范与相关联的目标标准一起输入到AI模型中、生成一个或多个候选控件的功能性支持;API1 222提供对利用关系映射来遍历映射以标识一个或多个映射的控件的功能性支持;API2 232提供对映射的控件进行评分和/或排名的功能性支持;API3 242提供对选择性地训练AI模型的功能性支持。如图所示,API212、222和232中的每个都操作地耦合到API协调器260,API协调器260另外也称为协调层,其在本领域中被理解为充当用以将单独的API透明地连接在一起的抽象层。在实施例中,可以将单独的API的功能加以接合或组合。在另一实施例中,可以将单独的API的功能进一步分成另外的API。因此,本文所示的API的配置不应当认为是限制性的。因而,如本文所示,这些工具的功能可以由其相应的API体现或支持。
共同参考图3A和3B,提供了示出用于利用AI模型和关系映射来标识一个或多个控件以及训练AI模型的过程(或方法)的实施例的流程图300。
在图3A中,将目标标准(例如PCI/DSS)和目标规范(例如“最小密码长度7个字符”)输入到预先训练的AI模型中,302。AI模型生成一个或多个候选控件形式的输出,每个候选控件具有相关联的标准和对应的第一得分,304。第一得分可以是数值、置信度水平(例如高)或某个其他定量或定性得分。标识所输出的候选控件的数量并将其赋予变量XTOTAL,306,将对应的候选控件计数变量X初始化,308。对候选控件X是否与匹配输入到AI模型中的目标标准的对应标准相关联作出判定,310。对判定310的否定响应使得过程300跳转到下述的步骤316。对判定310的肯定响应之后,接着是作出候选控件X的第一得分是否满足第一阈值的另一判定,312,第一阈值可以是定量或定性阈值。对判定312的肯定响应被解释为候选控件X是目标规范的可接受的匹配的指示,于是输出候选控件X,314,之后,递增候选控件计数变量X,336,如图3B所示。另一方面,对判定312的否定响应之后,接着是遍历映射,316。在示例性实施例中,利用候选控件X遍历映射,以标识具有与目标标准匹配的对应标准的一个或多个映射的控件。将映射的控件的数量赋予值YTOTAL,318。
如图所示,过程300继续,对映射的控件进行排名,320,随后,初始化映射对控件对计数变量Y,322。在示例性实施例中,使用由用来遍历映射的(图1中的)AI模型140标识的对应“第一得分”来执行排名。如图3B所示,对与映射的控件Y相关联的第二得分是否满足例如由评分管理器确定的第二阈值作出判定,324。与第一阈值一样,第二阈值可以是定量的或定性的。例如,第二阈值可以是零(0)与一(1)之间的最小得分。在上述示例性实施例中,如果第二得分(例如0.7)等于或大于并因此满足预定的第二阈值(例如0.5),则映射的控件被视为目标标准的可接受对匹配。对判定324的肯定响应被解释为映射的控件Y是目标规范的可接受的匹配的指示,然后输出映射的控件Y,326。根据实施例,如果第二得分(例如0.3)小于并因此不能满足预定的第二阈值(例如0.5),则映射的控件被视为目标标准的不可接受的匹配,从而导致对判定324的否定响应。
对判定324的否定响应之后,是对映射的控件Y是否是目标规范的可接受的匹配的判定,328。判定328可以手动进行,例如由主题专家进行。如果对判定作出否定响应,328,则递增变量Y,332。如果对判定作出肯定响应,328,则用映射的控件Y训练AI模型,330,并递增变量Y,332。然后,对Y的递增值是否大于YTOTAL作出判定,334。对判定334的否定响应导致返回步骤324。如果对判定336是肯定响应,则递增候选控件计数变量X,336,对X的递增值是否大于X TOTAL作出判定,338。对判定338的否定响应导致返回步骤310。对判定338的肯定响应结束过程300。
参照图4,流程图400描述了包括对图3A和3B的过程300的修改(或添加)的实施方式。步骤416、418、420和422分别对应于图3A和图3B的步骤316、318、320和322。为了简洁起见,在此相对于步骤416、418、420和422合并对步骤316、318、320和322的以上描述。图4的步骤442、444、446和448是可以包括在过程300中的附加步骤。
如图所示,在步骤418之后,对映射的控件的数量YTOTAL是否小于最小结果参数作出判定,442,该最小结果参数可以表示映射的控件的预定最小群体。对判定442的肯定响应之后,是扩大映射参数(例如,可接受的置信度水平、关系类型等),之后返回步骤416,以进行更新的关系映射遍历以及确定YTOTAL,418。
对判定442的否定响应之后是对映射的控件的数量YTOTAL是否大于最大结果参数的另一判定446,该最大结果参数可以表示映射的控件的预定最大群体。对判定446的肯定响应之后是限制映射参数(例如提高最小置信度评级或水平和/或降低上述中间节点限制),之后返回步骤416以进行更新的遍历或关系映射遍历,以及确定YTOTAL。对判定446的否定响应被解释为映射的控件的数量YTOTAL可接受的指示,然后,过程400前进到步骤420,以对映射的控件进行排名,以及赋予YTotal映射的控件的数量,422。在示例性实施例中,使用由用来遍历映射416的(图1中的)AI模型140所标识的相应的“第一得分”来执行排名420。
利用图1和图2中所示的工具和API以及图3A、图3B和图4中所示的过程示出和描述了利用AI模型进行控件标识和训练AI模型的各方面。功能工具152、154、156和158的各方面及其相关联的功能可以体现在单个位置中的计算机系统/服务器中,或者在实施例中,可以在共享计算资源的基于云的系统中配置。参考图6,提供了示出用以实现上面参考图3A、图3B和图4描述的过程的计算机系统/服务器602的实例的框图600,计算机系统/服务器602在下文中被称为与基于云的支持系统通信的主机602。主机602可与许多其他通用或专用计算系统环境或配置一起操作。可适于与主机602一起使用的众所周知的计算系统、环境和/或配置的示例包括但不限于个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持式或膝上型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费电子产品、网络PC、小型计算机系统、大型计算机系统和包括以上系统、设备及其等效物中的任一者的文件系统(例如,分布式存储环境和分布式云计算环境)。
可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般上下文中描述主机602。一般而言,程序模块可包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、逻辑、数据结构等。主机602可以在分布式云计算环境610中实现,其中任务由通过通信网络链接的远程处理设备执行。在分布式云计算环境中,程序模块可以位于包括存储器存储设备的本地和远程计算机系统存储介质中。
如图6所示,主机602以通用计算设备的形式示出。主机602的组件可以包括但不限于一个或多个处理器或处理单元604,例如。硬件处理器、系统存储器606和将包括系统存储器606的不同系统组件耦合到所述处理单元604的总线608。总线608代表若干类型的总线结构中的任何总线结构中的一个或多个,包括存储器总线或存储器控制器、外围总线、加速图形端口、以及使用各种总线架构中的任何总线架构的处理器或本地总线。作为示例而非限制,此类体系结构包括工业标准体系结构(ISA)总线、微通道体系结构(MCA)总线、增强型ISA(EISA)总线、视频电子标准协会(VESA)局部总线以及外围组件互连(PCI)总线。主机602通常包括各种计算机系统可读介质。这样的介质可以是可由主机602访问的任何可用介质,并且其包括易失性和非易失性介质、可移动和不可移动介质。
系统存储器606可以包括易失性存储器形式的计算机系统可读介质,诸如随机存取存储器(RAM)630和/或高速缓存存储器632。仅通过举例的方式,可以提供存储系统634用于从不可移除的非易失性磁性介质(未示出,通常称为“硬盘驱动器”)进行读取和写入。尽管未示出,可以提供用于从可移动非易失性磁盘(例如“软盘”)读取或向其写入的磁盘驱动器,以及用于从可移动非易失性光盘(如CD-ROM、DVD-ROM或其他光学介质)读取或向其写入的光盘驱动器。在这样的情况下,每一个都可以通过一个或多个数据介质接口连接到总线608。
具有一组(至少)程序模块642的程序/实用程序640以及操作系统、一个或多个应用程序、其他程序模块和程序数据可以作为示例而非限制存储在系统存储器606中。操作系统、一个或多个应用程序、其他程序模块和程序数据中的每一个或它们的一些组合可以包括网络环境的实现方式。程序模块642一般执行各实施例的功能和/或方法以支持和实现通过自然语言(NL)的随机动作重放的增强学习。例如,程序模块642的集合可以包括如图1中所描述的工具152、154、156和/或158。
主机602还可与一个或多个诸如键盘、指向设备外部设备614、显示器624、一个或多个使用户能够与主机602交互的的设备进行通信;和/或与使得主机602能够与一个或多个其他计算设备通信的任何设备(例如网卡、调制解调器等)进行通信。这样的通信可以通过输入/输出(I/O)接口622进行。此外,主机602可以通过网络适配器620与诸如局域网(LAN)、通用广域网(WAN)和/或公共网络(例如,互联网)的一个或多个网络通信。如图所示,网络适配器620通过总线608与主机602的其他组件通信。在实施例中,分布式文件系统(未示出)的多个节点通过I/O接口622或通过络适配器620与主机602进行通信。应当理解,虽然未示出,但是其他硬件和/或软件组件可以与主机602结合使用。示例包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器和数据归档存储系统等。
在本文档中,术语“计算机程序介质”、“计算机可用介质”和“计算机可读介质”用于泛指介质,诸如包括RAM630、高速缓存632的系统存储器606,以及诸如可移动存储驱动器和安装在硬盘驱动器中的硬盘的存储系统634。
计算机程序(也称为计算机控制逻辑)被存储在系统存储器606中。计算机程序还可以通过通信接口(诸如网络适配器620)来接收。这样的计算机程序在运行时使得计算机系统能够执行如本文所讨论的本实施例的特征。具体地,计算机程序在运行时使处理单元604能够执行计算机系统的功能。因此,这样的计算机程序表示计算机系统的控制器。
在实施例中,主机602是云计算环境的节点。如本领域中已知的,云计算是服务递送的模型,用于使得能够方便地、按需地网络访问可配置计算资源(例如,网络、网络带宽、服务器、处理、存储器、存储、应用、虚拟机和服务)的共享池,所述可配置计算资源可以以最小的管理努力或与服务的提供者的交互进行快速供应和释放。云模型可以包括至少五个特性、至少三个服务模型和至少四个部署模型。这样的特性的示例如下:
按需自助服务:云消费者可以单方面地根据需要自动地提供计算能力,诸如服务器时间和网络存储,而不需要与服务的提供者的人类交互。
广泛的网络接入:能力可通过网络获得并且通过标准机制接入,该标准机制促进异构瘦客户机平台或厚客户机平台(例如移动电话、膝上型计算机和PDA)的使用。
资源池化:提供者的计算资源被池化以使用多租户模型来服务于多个消费者,其中不同的物理和虚拟资源根据需要动态地指派和重新指派。存在位置独立性的感觉,因为消费者通常不具有对所提供的资源的确切位置的控制或了解,但可能能够在较高抽象层(例如,国家、州或数据中心)指定位置。
快速弹性:能够快速和弹性地提供能力,在一些情况下自动地快速缩小和快速释放以快速放大。对于消费者而言,可用于供应的能力通常显得不受限制并且可以在任何时间以任何数量购买。
测量的服务:云系统通过在适合于服务类型(例如,存储、处理、带宽和活动用户账户)的某个抽象层利用计量能力来自动控制和优化资源使用。可以监视、控制和报告资源使用,为所利用的服务的供应商和消费者提供透明度。
服务模型如下:
软件即服务(SaaS):提供给消费者的能力是使用在云基础设施上运行的提供者的应用。可通过诸如web浏览器(例如,基于web的电子邮件)之类的瘦客户端接口从不同客户端设备访问应用。消费者不管理或控制包括网络、服务器、操作系统、存储或甚至单独的应用能力的底层云基础设施,可能的例外是有限的用户特定应用配置设置。
平台即服务(PaaS):提供给消费者的能力是将消费者创建的或获取的使用由供应商支持的编程语言和工具创建的应用部署到云基础设施上。消费者不管理或控制包括网络、服务器、操作系统或存储的底层云基础设施,但是对所部署的应用和可能的应用托管环境配置具有控制。
基础设施即服务(IaaS):提供给消费者的能力是提供处理、存储、网络和消费者能够部署和运行任意软件的其他基本计算资源,所述软件可以包括操作系统和应用。消费者不管理或控制底层云基础设施,而是具有对操作系统、存储、所部署的应用的控制以及对所选联网组件(例如主机防火墙)的可能受限的控制。
部署模型如下:
私有云:云基础架构仅为组织运作。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
社区云:云基础架构被若干组织共享并支持共享了关注(例如,任务、安全要求、策略、和合规性考虑)的特定社区。它可以由组织或第三方管理,并且可以存在于场所内或场所外。
公共云:使云基础架构对公众或大型行业组可用,并且由出售云服务的组织拥有。
混合云:云基础架构是两个或更多个云(私有、社区或公共)的组合,这些云保持唯一实体但通过使数据和应用能够移植的标准化或专有技术(例如,云突发以用于云之间的负载平衡)绑定在一起。
云计算环境是面向服务的,专注于无状态、低耦合、模块化和语义互操作性。云计算的核心是包括互连节点网络的基础设施。
现在参见图7,示出了说明性云计算网络700。云计算网络700包括具有云消费者使用的本地计算设备可以与其通信的一个或多个云计算节点710的云计算环境750。这些本地计算设备的示例包括但不限于个人数字助理(PDA)或蜂窝电话754A、台式计算机754B、膝上型计算机754C和/或车载计算机系统754N。云计算节点710内的个体节点可以进一步彼此通信。它们可以物理地或虚拟地分组(未示出)在一个或多个网络中,诸如如上所述的私有云、社区云、公共云或混合云、或其组合。这允许云计算环境700提供基础架构、平台和/或软件作为云消费者不需要为其维护本地计算设备上的资源的服务。应当理解的是,图7中所示的计算设备754A-N的类型旨在仅是说明性的,并且云计算环境750可以通过任何类型的网络和/或网络可寻址连接(例如使用网络浏览器)与任何类型的计算机化设备通信。
现在参见图8,示出了由图7的云计算网络提供的一组功能抽象层800。应提前理解,图8中所示的组件、层和功能仅旨在是说明性的,并且实施例不限于此。如图所示,提供以下层和相应功能:硬件和软件层810、虚拟化层820、管理层830和工作负载层840。
硬件和软件层810包括硬件和软件组件。硬件组件的实例包括:大型机,例如
Figure BDA0003639619970000151
系统;基于RISC(精简指令集计算机)架构的服务器,例如IBM
Figure BDA0003639619970000152
系统;IBM
Figure BDA0003639619970000153
系统;IBM
Figure BDA0003639619970000154
系统;存储设备;网络和网络组件。软件组件的示例包括:网络应用服务器软件,例如IBM
Figure BDA0003639619970000155
应用服务器软件;以及数据库软件,例如IBM
Figure BDA0003639619970000156
数据库软件。(IBM、zSeries、…pSeries、xSeries、BladeCenter、WebSphere和DB2是在全球许多司法辖区中注册的国际商业机器公司的商标)。
虚拟化层820提供从中可以提供虚拟实体的以下示例的抽象层:虚拟服务器;虚拟存储;虚拟网络,包括虚拟专用网络;虚拟应用和操作系统;以及虚拟客户端。
在一个示例中,管理层830可以提供以下功能:资源供应、计量和定价、用户门户、服务层管理和SLA规划和履行。资源供应提供用于在云计算环境内执行任务的计算资源和其他资源的动态采购。计量和定价随着资源在云计算环境内的利用而提供成本跟踪,为这些资源的消费开账单或发票。在一个示例中,这些资源可以包括应用软件许可证。安全性为云消费者和任务提供身份验证,以及为数据和其他资源提供保护。用户门户为消费者和系统管理员提供对云计算环境的访问。服务层管理提供云计算资源分配和管理,使得满足所需的服务层。服务水平协议(SLA)规划和履行提供云计算资源的预安排和采购,根据该SLA预期该云计算资源的未来要求。
工作负载层840提供可以利用云计算环境的功能的示例。可以从该层提供的工作负荷和功能的示例包括但不限于:映射和导航;软件开发和生命周期管理;虚拟课堂教育交付;数据分析处理;事务处理;以及AI模型控件标识和AI模型训练。
虽然已经示出和描述了本实施例的特定实施例,但是对于本领域技术人员来说将显而易见的是,基于本文的教导,在不脱离实施例及其更广泛的方面的情况下可以做出改变和修改。因此,所附权利要求书在其范围内包括在实施例的真实精神和范围内的所有这样的改变和修改。此外,应当理解,实施例仅由所附权利要求限定。本领域技术人员将理解,如果意图具体数目的所引入的权利要求元素,则这样的意图将在权利要求中明确叙述,并且在没有这样的叙述的情况下,不存在这样的限制。作为非限制性示例,为了帮助理解,以下所附权利要求包含使用介绍性短语“至少”和“一个或多个”来介绍权利要求元素。然而,这种短语的使用不应解释为暗示通过不定冠词“一个”或“一种”引入权利要求元件将包含这种引入的权利要求元件的任何特定权利要求限制为仅包含一个这种元件的实施方式,即使当相同的权利要求包括引入性短语“一个或多个”或“至少一个”以及不定冠词诸如“一个”或“一种”时;这同样适用于定冠词的权利要求中的用途。如在本文中使用的,术语“和/或”是指任一个或两者(或术语或所表达的任何组合或全部),例如,“A、B和/或C”涵盖单独的A、单独的B、单独的C、A和B、A和C、B和C、以及A、B和C。
本实施例可以是系统、方法和/或计算机程序产品。此外,本实施方式的所选择的各方面可以采取完全硬件实施方式、完全软件实施方式(包括固件、驻留软件、微代码等)或者组合软件和/或硬件方面的实施方式的形式,在本文中可以统称为“电路”、“模块”或“系统”。此外,本发明实施例的各方面可以采取计算机程序产品的形式,该计算机程序产品体现在其上具有用于使处理器执行本实施例的方面的计算机可读程序指令的计算机可读存储介质(或多个介质)中。如此体现,所公开的系统、方法和/或计算机程序产品可操作以提供对转移学习操作的改进。
计算机可读存储介质可为可保留和存储供指令执行设备使用的指令的有形设备。计算机可读存储介质可以是,例如但不限于,电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备、或者上述的任意合适的组合。计算机可读存储介质的更具体示例的非穷尽列表包括以下各项:便携式计算机盘、硬盘、动态或静态随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、磁存储设备、便携式紧凑盘只读存储器(CD-ROM)、数字通用盘(DVD)、记忆棒、软盘、诸如穿孔卡之类的机械编码设备或具有记录在其上的指令的槽中的凸出结构、以及上述各项的任何合适的组合。如本文所使用的计算机可读存储媒体不应被解释为暂时性信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输媒体传播的电磁波(例如,穿过光纤电缆的光脉冲)或通过电线发射的电信号。
本文中所描述的计算机可读程序指令可以通过网络(例如互联网、局域网、广域网和/或无线网络)从计算机可读存储介质下载到相应的计算/处理设备,或者下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输纤维、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口接收来自网络的计算机可读程序指令,并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。
用于执行本实施例的操作的计算机可读程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或以一种或多种编程语言的任何组合编写的源代码或目标代码,这些编程语言包括面向对象的编程语言(如Java、Smalltalk、C++等)和常规过程编程语言(如“C”编程语言或类似编程语言)。计算机可读程序指令可以完全地在用户计算机上执行、部分在用户计算机上执行、作为独立软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器或服务器集群上执行。在后一种情况下,远程计算机可通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到用户计算机,或者可连接到外部计算机(例如,使用互联网服务提供商通过互联网)。在一些实施例中,包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA)的电子电路可以通过利用计算机可读程序指令的状态信息来使电子电路个性化来执行计算机可读程序指令,以便执行本实施例的方面。
本文参考根据实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图来描述本实施例的各方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,使得通过计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在流程图和/或框图的或多个框中指定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置、和/或其他设备以特定方式工作,从而,其中存储有指令的计算机可读存储介质包括包含实现流程图和/或框图中的或多个方框中规定的功能/动作的方面的指令的制造品。
也可以把计算机可读程序指令加载到计算机、其他可编程数据处理装置、或其他设备上,使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤,以产生计算机实现的处理,使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图中的或多个方框中规定的功能/动作。
图中的流程图和框图示出根据本实施例的不同实施例的系统、方法和计算机程序产品的可能实现方式的架构、功能和操作。对此,流程图或框图中的每个框可表示指令的模块、段或部分,其包括用于实现指定的逻辑功能的一个或多个可执行指令。在一些备选实现中,框中标注的功能可以不按照图中标注的顺序发生。例如,取决于所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者这些框有时可以以相反的顺序执行。图中未表示的其它框可以(例如)在一个或多个所说明的框之前、之后或与一个或多个所说明的框同时包含。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作或执行专用硬件与计算机指令的组合的专用的基于硬件的系统来实现。
应当理解,尽管为了说明的目的在此已经描述了特定实施例,但是在不脱离实施例的精神和范围的情况下可以进行各种修改。具体地,可以由不同的计算平台执行或跨多个设备执行转移学习操作。此外,数据存储和/或语料库可以是局部的、远程的或跨多个系统散布的。因此,实施例的保护范围仅由所附权利要求及其等同物限定。

Claims (19)

1.一种计算机系统,包括:
处理器,操作地耦合至存储器;以及
与所述处理器和所述存储器通信的平台,所述平台包括:
人工智能(AI)管理器,被配置用于相对于目标标准的目标规范来利用AI模型,所述AI模型被配置用于标识与对应标准相关联的至少一个候选控件;
映射管理器,被配置用于遍历包括源控件和目的地控件的映射,包括标识所述映射中的所述至少一个候选控件以及遍历所述映射的源控件和目的地控件以标识与所述目标标准相关联的至少一个映射的控件;以及
训练管理器,被配置用于选择性地用所述映射的控件和所述目标标准训练所述AI模型。
2.如权利要求1所述的计算机系统,其中:
所述AI模型被配置用于评估对应于所述候选控件的得分,所述得分表示所述目标规范与所述候选控件之间的相似性;以及
所述映射管理器被配置用于响应于与所述至少一个候选控件相关联的所述标准不同于所述目标标准和/或所述对应得分不满足第一阈值而遍历所述映射。
3.如权利要求1所述的计算机系统,其中,所述映射管理器还被配置用于使对所述映射的遍历受制于至少一个参数。
4.如权利要求3所述的计算机系统,其中,所述至少一个参数包括关系置信度评级、所述源控件或目的地控件之间的中间节点的数量的限制、或其组合。
5.如权利要求3所述的计算机系统,其中,所述映射管理器进一步被配置用于改变所述至少一个参数并且响应于所改变的参数来遍历所述映射。
6.如权利要求1所述的计算机系统,其中:
所述映射管理器还被配置用于将所述至少一个候选控件映射到与所述目标标准相关联的多个映射的控件;以及
所述平台还包括评分管理器,其被配置用于对所述映射的控件进行排名。
7.如权利要求1所述的计算机系统,其中,所述平台进一步包括评分管理器,其被配置用于评估表示所述至少一个映射的控件与所述目标规范之间的相似性的得分。
8.一种方法,包括:
相对于目标标准的目标规范来利用人工智能(AI)模型,所述AI模型标识与对应标准相关联的至少一个候选控件;
遍历包括源控件和目的地控件的映射,所述遍历包括:
使用所述计算机处理器,至少标识所述映射中的所述候选控件;以及
使用所述计算机处理器,遍历所述映射的所述源和目的地控件以标识与所述目标标准相关联的至少一个映射的控件;以及
利用所述映射的控件和所述目标标准选择性地训练所述AI模型。
9.如权利要求8所述的方法,其中:
利用所述AI模型包括评估对应于所述候选控件的得分,所述得分表示所述目标规范与所述候选控件之间的相似性;以及
遍历所述映射包括响应于与所述至少一个候选控件相关联的所述标准不同于所述目标标准和/或所述对应得分不满足第一阈值而遍历所述映射。
10.如权利要求8所述的方法,其中,遍历所述映射使对所述映射的遍历受制于至少一个参数。
11.如权利要求10所述的方法,其中,所述至少一个参数包括关系置信度评级、所述源控件或目的地控件之间的中间节点的数量的限制、或其组合。
12.如权利要求10所述的方法,进一步包括使用所述计算机处理器改变所述至少一个参数并且响应于所改变的参数来遍历所述映射。
13.如权利要求8所述的方法,其中:
遍历所述映射包括将所述至少一个候选控件映射到与所述目标标准相关联的多个映射的控件;以及
该方法进一步包括对所述映射的控件进行排名。
14.如权利要求10所述的方法,进一步包括评估表示所述至少一个映射的控件与所述目标规范之间的相似性的得分。
15.一种计算机程序产品,包括:
计算机可读存储设备;以及
与所述计算机可读存储设备一起体现的程序代码,所述程序代码可由处理器执行,以执行如权利要求8至14中任何之一的方法的步骤。
16.一种计算机系统,包括:
处理器,操作地耦合至存储器;以及
与所述处理器和所述存储器通信的平台,所述平台包括:
人工智能(AI)管理器,被配置用于相对于目标标准的目标规范来利用AI模型,所述AI模型被配置用于标识与对应标准相关联的至少一个候选控件;
映射管理器,其被配置用于遍历包括源控件和目的地控件的映射,包括:
标识所述映射中的所述至少一个候选控件;
遍历所述映射的源和目的地控件以标识与目标标准相关联的至少一个映射的控件;
标识所标识的映射的控件的数量;以及
选择性地改变所述遍历的参数并且使用改变的参数重新遍历所述映射的所述源控件和所述目的地控件;以及
训练管理器,被配置用于选择性地用所述至少一个映射的控件和所述目标标准训练所述AI模型。
17.权利要求16的计算机系统,其中:
所述AI模型被配置用于评估对应于所述候选控件的得分,所述得分表示所述目标规范与所述候选控件之间的相似性;以及
所述映射管理器被配置用于响应于与所述至少一个候选控件相关联的所述标准不同于所述目标标准和/或所述对应得分不满足第一阈值而遍历所述映射。
18.一种方法,包括:
相对于目标标准的目标规范利用人工智能(AI)管理器,所述AI模型被配置用于标识与对应标准相关联的至少一个候选控件;
遍历包括源控件和目的地控件的映射,包括:
标识所述映射中的所述至少一个候选控件;
遍历所述映射的所述源和目的地控件以标识与所述目标标准相关联的至少一个映射的控件,所述至少一个映射的控件满足第一参数;
标识所标识的映射的控件的数量;以及
选择性地改变所述遍历的参数并且使用改变的参数重新遍历所述映射的所述源控件和所述目的地控件;以及
选择性地用所述至少一个映射的控件和所述目标标准训练所述AI模型。
19.根据权利要求18所述的方法,其中:
利用所述AI模型包括评估对应于所述候选控件的得分,所述得分表示所述目标规范与所述候选控件之间的相似性;以及
遍历所述映射包括响应于与所述至少一个候选控件相关联的所述标准不同于所述目标标准和/或所述对应得分不满足第一阈值而遍历所述映射。
CN202210516253.9A 2021-05-26 2022-05-12 利用和训练用于控件标识的人工智能模型 Pending CN115408263A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US17/330,771 US20220383093A1 (en) 2021-05-26 2021-05-26 Leveraging and Training an Artificial Intelligence Model for Control Identification
US17/330,771 2021-05-26

Publications (1)

Publication Number Publication Date
CN115408263A true CN115408263A (zh) 2022-11-29

Family

ID=84158477

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210516253.9A Pending CN115408263A (zh) 2021-05-26 2022-05-12 利用和训练用于控件标识的人工智能模型

Country Status (3)

Country Link
US (1) US20220383093A1 (zh)
JP (1) JP2022183116A (zh)
CN (1) CN115408263A (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11573995B2 (en) * 2019-09-10 2023-02-07 International Business Machines Corporation Analyzing the tone of textual data

Also Published As

Publication number Publication date
JP2022183116A (ja) 2022-12-08
US20220383093A1 (en) 2022-12-01

Similar Documents

Publication Publication Date Title
US11151664B2 (en) Calculating expertise confidence based on content and social proximity
US20210097052A1 (en) Domain aware explainable anomaly and drift detection for multi-variate raw data using a constraint repository
US10783068B2 (en) Generating representative unstructured data to test artificial intelligence services for bias
US11178186B2 (en) Policy rule enforcement decision evaluation with conflict resolution
US11586813B2 (en) Natural language processing of unstructured data
US10380600B2 (en) Program identifier response to unstructured input
US11188517B2 (en) Annotation assessment and ground truth construction
US11294884B2 (en) Annotation assessment and adjudication
US20200293970A1 (en) Minimizing Compliance Risk Using Machine Learning Techniques
US11972382B2 (en) Root cause identification and analysis
US11537602B2 (en) Computer implemented live cross walks in compliance mappings in response to regulatory changes and assessing risks of changes
US10318559B2 (en) Generation of graphical maps based on text content
US11934922B2 (en) Predictive data and model selection for transfer learning in natural language processing
CN115408263A (zh) 利用和训练用于控件标识的人工智能模型
US20190163787A1 (en) Natural language processing of unstructured data
US20180107964A1 (en) Job profile generation based on intranet usage
US11514340B2 (en) Machine learning for technical tool selection
US20220277082A1 (en) Incremental regulatory compliance
US11797492B2 (en) Cognitive method to perceive storages for hybrid cloud management
US20230161774A1 (en) Semantic annotation for tabular data
US11593013B2 (en) Management of data in a hybrid cloud for use in machine learning activities
US20220012600A1 (en) Deriving precision and recall impacts of training new dimensions to knowledge corpora
US20220076079A1 (en) Distributed machine learning scoring
US20230128532A1 (en) Distributed computing for dynamic generation of optimal and interpretable prescriptive policies with interdependent constraints
WO2023041637A1 (en) Problem solving in a database

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination