WO2021203260A1

WO2021203260A1 - 一种节点匹配方法、装置、设备及系统

Info

Publication number: WO2021203260A1
Application number: PCT/CN2020/083639
Authority: WO
Inventors: 黄高峰; 陈元丰; 晏意林; 史俊杰; 谢翔; 李升林; 孙立林
Original assignee: 云图技术有限公司
Priority date: 2020-04-08
Filing date: 2020-04-08
Publication date: 2021-10-14

Abstract

本说明书提供了一种节点匹配方法、装置、设备及系统。所述方法包括获取数据流图信息和节点信息；判断所述第一数据流图是否为所述第二数据流图的子图；确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配；当匹配成功时，获取明文数据；将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果；对所述密文执行结果进行解密，获得解密结果；计算所述明文执行结果与所述解密结果的差值，并判断所述差值是否在预设误差范围内，输出判断结果。利用本说明书实施例可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。

Description

一种节点匹配方法、装置、设备及系统

技术领域

本申请涉及数据处理技术领域，特别涉及一种节点匹配方法、装置、设备及系统。

背景技术

身处大数据驱动的AI(Artificial Intelligence，人工智能)时代，人们越来越认识到数据的价值。为此，对个人信息、数据的隐私保护提出了更高的要求。

为了解决数据保护和AI之间的矛盾，目前借助密码学和tensorflow机器学习平台，诞生了各种基于加密机器学习的框架(例如，TF-Encrypted、PySyft等)。这些加密机器学习框架可以使不精通密码学、分布式系统的开发者能够对加密数据进行训练和预测。

发明内容

本说明书实施例提供了一种节点匹配方法、装置、设备及系统，可以实现对数据流图和数据流图执行结果正确性的自动化测试，从而提高验证效率。

本说明书提供的节点匹配方法、装置、设备及系统是包括以下方式实现的：

一种节点匹配方法，包括：

获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断所述第一数据流图是否为所述第二数据流图的子图；

确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。

一种节点匹配装置，包括：

信息获取模块，用于获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断模块，用于判断所述第一数据流图是否为所述第二数据流图的子图；

匹配模块，用于确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。

一种节点匹配设备，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：

判断所述第一数据流图是否为所述第二数据流图的子图；

一种节点匹配系统，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现本说明书实施例中任意一个方法实施例方法的步骤。

本说明书提供的一种节点匹配方法、装置、设备及系统。一些实施例中在将预设明文机器学习模型中的明文算子替换为对应的密码算子过程中，由于优化器测试组件封装了静态优化器，使得在获取数据流图信息和节点信息过程中，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，而且可以为实现自动测试数据流图和图执行结果正确性提供保障。在获取数据流图信息和节点信息后，通过对明文算子替换前后对应的数据流图进行判断，可以确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。通过对明文算子替换前后的节点信息进行匹配以及对图执行结果的比较，可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。采用本说明书提供的实施方案，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，提高编码效率，而且可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。

附图说明

此处所说明的附图用来提供对本说明书的进一步理解，构成本说明书的一部分，并不构成对本说明书的限定。在附图中：

图1是本说明书提供的节点匹配方法的一个实施例的流程示意图；

图2是本说明书提供的节点匹配方法的一个具体实施例的流程示意图；

图3是本说明书提供的节点匹配方法的另一个实施例的流程示意图；

图4是本说明书提供的一种节点匹配装置的一个实施例的模块结构示意图；

图5是本说明书提供的一种节点匹配服务器的一个实施例的硬件结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本说明书中的技术方案，下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书中的一部分实施例，而不是全部的实施例。基于本说明书中的一个或多个实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书实施例保护的范围。

一些实施场景中，为了在利用样本数据训练机器模型时保护样本数据的隐私，可以将预设明文机器学习模型中的本地明文算子替换为对应的密码算子，得到对应的隐私机器学习模型，这样通过复用已有的明文机器学习模型实现了隐私机器学习模型，可以有效减少因使用隐私机器学习框架特有的应用程序接口和隐私数据类型重新编码所带来的巨大开发成本，提高编码效率。然而，将明文机器学习模型转化为对应的隐私机器学习模型后，不仅会产生与隐私机器学习模型对应的数据流图，而且也会输出隐私数据类型的执行结果。目前，为了实现数据流图正确性的校验，通常需要先手动导出图并借助Tensorboard进行可视化校验。为了实现对图执行结果的校验，通常需要手动编写测试进行验证，效率较低。

本说明书提供一种节点匹配方法、装置、设备及系统，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，提高编码效率，而且可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。

下面以一个具体的应用场景为例对本说明书实施方案进行说明。具体的，图1是本说明书提供的节点匹配方法的一个实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构，但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中，这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时，可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。

需要说明的是，下述实施例描述并不对基于本说明书的其他可扩展到的应用场景中的技术方案构成限制。具体的一种实施例如图1所示，本说明书提供的一种节点匹配方法的一种实施例中，所述方法可以包括以下步骤。

S0：获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息。

本说明书一个实施例中，数据流图信息可以包括数据流图。数据流图可以用于表征机器学习模型中的数据流动信息。例如，在TensorFlow机器学习框架中，数据流图为张量流图。张量流图中的节点在图中表示数学操作，图中的线则表示在节点间相互联系的多维数据数组，即张量。本实施例中，数据流图信息可以包括第一数据流图和第二数据流图。其中，第一数据流图可以理解为是预设明文机器学习模型对应的数据流图，第二数据流图可以理解为是隐私机器学习模型对应的数据流图。

本说明书一个实施例中，可以在机器学习框架中编写明文机器学习模型。机器学习框架可以理解为是包括机器学习算法在内的所有机器学习的系统或方法，可以包括数据表示与处理的方法、表示和建议预测模型的方法、评价和使用建模结果的方法。机器学习框架可以包括以下之一：TensorFlow、Pytorch、MxNet和CNTK-Azure等框架。本实施例中，预设明文机器学习模型可以是基于明文机器学习框架实现的。

一些实施场景中，明文机器学习模型中可以包括机器学习框架提供的本地明文算子(简称明文算子)。为了在利用样本数据训练机器模型时保护样本数据的隐私，可以将明文机器学习模型中的本地明文算子替换为对应的密码算子，得到对应的隐私机器学习模型。

需要说明的是，本说明书对于预设明文机器学习模型具体采用何种明文机器学习框架生成不作限定，具体可根据实际场景进行选择。一些实施场景中，机器学习框架中可以包括多个明文算子。

本说明书一个实施例中，节点信息可以包括明文算子节点信息和密文算子节点信息。本实施例中，节点信息可以包括第一数据流图中需要替换为密码算子的明文算子节点信息和第二数据流图中包括的密文算子节点信息。

一些实施场景中，考虑到是为了保护各持有方中存储的隐私样本数据的隐私才将预设明文机器学习模型中的明文算子替换为明文算子对应的算子，因此可以将隐私样本数据流经的算子确定为要替换的明文算子。另一些实施场景中，考虑到隐私样本数据是为了训练模型，以得到模型参数(也称为训练变量)，因此，可以将训练变量流经的算子确定为要替换的明文算子。上述实施例中，基于预设明文机器学习模型对应的数据流图中的数据流，可以确定需要替换为密码算子的明文算子。

一些实施场景中，密码算子可以为任何可在两个或多个数据持有方联合(或协同)进行机器学习训练及预测场景中，为各方输入数据提供隐私保护的密码算子。例如一些实施场景中，密码算子可以为安全多方计算(Secure Multi-Party Computation，MPC)算子、同态加密(Homomorphic Encryption，HE)算子、或零知识证明(Zero-knowledge Proof，ZKP)算子等。同样，本说明书对具体采用何种密码算子不作限定，具体可根据实际场景进行选择。需要说明的是，密码算子可以由开发人员预先通过静态语言(例如C、C++等)编程实现并保存，在需要时获取，从而提高效率。一些实施例中，密码算子中通常还可以包含有密码梯度算子。当然，这些密码算子(包括密码梯度算子)，应与预设明文机器学习模型中的明文算子一一对应，以便于后续对应替换。在实现密码算子后，开发人员可以将其注册到明文机器学习框架中，以便于明文机器学习模型使用。

本说明书一个实施例中，明文算子节点信息中至少可以包括需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识，密文算子节点信息中至少可以包括密码算子的节点位置标识、密码算子标识。其中，节点位置标识可以用于唯一标识该节点所处位置，例如，节点对应的IP地址(Internet Protocol Address，互联网协议地址)。密码算子标识可以用于标识该密码算子，例如，可以是密码算子对应的名称等。其中，与明文算子对应的密码算子标识是指预先设置的与明文算子对应的密码算子的标识。

本说明书一个实施例中，所述获取数据流图信息和节点信息，可以包括：获取预设明文机器学习模型中的优化测试组件，所述优化测试组件包括静态优化器，所述优化测试组件用于在节点匹配过程中保存信息，并利用保存信息对数据流图进行校验；基于所述优化测试组件，保存所述预设明文机器学习模型对应的第一数据流图和所述第一数据流图中需要替换为密码算子的明文算子节点信息；执行静态优化器，将所述预设明文机器学习模型中明文算子替换为所述明文算子对应的密码算子，生成隐私机器学习模型；基于所述优化测试组件，保存所述隐私机器学习模型对应的第二数据流图和所述第二数据流图中包括的密文算子节点信息；获取数据流图信息和节点信息。其中，静态优化器可以用于将明文机器模型中的明文算子替换为对应的密码算子。优化器测试组件是对静态优化器的封装。

一些实施场景中，获取预设明文机器学习模型中的优化器测试组件可以是在用户输入时获取，也可以是从预先存储的服务器中获取，还可以是其他方式获取，本说明书对此不作限定。

一些实施场景中，在获取优化器测试组件之后，由于优化器测试组件可以用于在节点匹配过程中保存信息，这样，可以利用优化测试组件保存与预设明文机器学习模型对应的数据流图以及该数据流图中确定需要替换为密码算子的明文算子节点信息。例如，为了保护各持有方中存储的隐私样本数据的隐私，可以将隐私样本数据在预设明文机器学习模型对应的数据流图中流经的算子确定为要替换的明文算子，然后利用优化测试组件保存需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识。一些实施场景中，在确定需要替换为密码算子的明文算子后，可以将其在数据流图中进行标记。之后，可以按照顺序将被标记的算子节点信息保存到堆栈中。其中，明文算子节点信息中还可以包括算子在堆栈中的位置。堆栈是一种数据结构，是一种只能在一端进行插入和删除操作的特殊线性表，其按照先进后出的原则存储数据，先进入的数据被压入栈底，最后的数据在栈顶，需要读数据的时候从栈顶开始弹出数据(最后一个数据被第一个读出来)。

一些实施场景中，在保存预设明文机器学习模型对应的信息后，可以执行静态优化器。由于静态优化器可以将预设明文机器学习模型中的明文算子替换为对应的密码算子，所以可以通过执行静态优化器生成与预设明文机器学习模型对应的隐私机器学习模型。本说明书一个实施例中，将明文机器学习模型中的明文算子替换为密码算子的一般原则是：对于影响数据隐私保护的明文算子，均需要替换为对应的密码算子，以确保输入数据的隐私安全；对于不影响数据隐私保护的明文算子，尽量不进行替换，以提高对明文机器学习模型的复用率，从而有利于降低隐私机器学习模型的实现成本。

一些实施场景中，在生成隐私机器学习模型后，可以利用优化测试组件保存与隐私机器学习模型对应的数据流图以及该数据流图中的密文算子节点信息。例如，可以利用优化测试组件保存替换后数据流图中密码算子的节点位置标识、以及密码算子标识。一些实施场景中，可以将替换后的密码算子在数据流图中进行标记。之后，可以按照顺序将被标记的算子节点信息保存到堆栈中。其中，密文算子节点信息中还可以包括算子在堆栈中的位置。

一些实施场景中，在将明文算子替换前对应的数据流图信息、节点信息以及将明文算子替换后对应的数据流图信息、节点信息保存后，可以获取数据流图信息和节点信息。

上述实施例中的方法，由于优化测试组件包括静态优化器，在获取数据流图信息和节点信息过程中，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，而且可以为实现自动测试数据流图和图执行结果正确性提供保障。

S2：判断所述第一数据流图是否为所述第二数据流图的子图。

其中，数据流图可以用于表征机器学习模型中的数据流动信息。数据流图中可以包括节点。例如，在TensorFlow机器学习框架中，数据流图为张量流图。张量流图中的节点在图中表示数学操作，图中的线则表示在节点间相互联系的多维数据数组，即张量。

本说明书实施例中，在获取数据流图信息和节点信息后，表明已经将明文机器学习模型中的明文算子替换为对应的密码算子，得到对应的隐私机器学习模型。一些实施场景中，通过对明文机器学习模型中需要替换的明文算子进行替换，可以产生明文算子以及密文算子混合的数据流图。为了验证模型中明文算子替换是否正确，可以先对与模型对应的数据流图信息进行判断，以便确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。

本说明书一个实施例中，所述判断所述第一数据流图是否为所述第二数据流图的子图，可以包括：获取所述第一数据流图和所述第二数据流图中节点对应的唯一标识；将所述第一数据流图中节点对应的唯一标识组成第一集合；将所述第二数据流图中节点对应的唯一标识组成第二集合；基于节点标识递增规则，判断所述第一集合是否是所述第二集合的子集；当所述第一集合是所述第二集合的子集时，确定所述第一数据流图是所述第二数据流图的子图。

一些实施场景中，在获取数据流图信息后，可以相应的为数据流图中的每个节点添加节点标识。其中，为了验证模型中明文算子替换是否正确，在将明文机器学习模型中的明文算子替换为对应的密码算子，得到对应隐私机器学习模型的过程中，数据流图中节点对应的节点标识需要满足递增规则。递增规则可以理解为是在明文机器学习模型对应的数据流图(以下可以简称为“原始图”)中节点标识的基础上，对得到的隐私机器学习模型对应的数据流图(以下可以简称“新图”)中密码算子对应节点进行递增标识。例如，原始图中包括5个节点，相应的，为这5个节点添加节点标识1、2、3、4、5，由于原始图中2个节点对应的明文算子需要替换为对应的密码算子，则在替换获得新图后，新图中密码算子对应节点标识应为6、7。

一些实施场景中，为了验证模型中明文算子替换是否正确，得到的新图中需要保存有原始图。例如，原始图中包括5个节点，相应的，为这5个节点添加节点标识1、2、3、4、5，由于原始图中2个节点对应的明文算子需要替换为对应的密码算子，则在替换获得新图后，新图中应包括7个节点，对应的节点标识分别为1、2、3、4、5、6、7。

一些实施场景中，在为原始图、新图中的每个节点添加节点标识后，可以将每个图中的节点标识组成一个集合，然后通过判断原始图中节点标识对应的集合是否是新图中节点标识对应集合的子集，如果是，则说明原始图是新图的子图，从而可以确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。如果原始图中节点标识对应的集合不是新图中节点标识对应集合的子集，则说明原始图不是新图的子图，明文机器学习模型中明文算子替换过程中存在异常。在出现异常时，可以通过预设方式通知开发人员，其中，预设方式可以包括发送信息、发出提醒等方式进行，本说明书对此不作限定。

本说明书实施例中，在获取数据流图信息和节点信息后，通过对明文算子替换前后对应的数据流图进行判断，可以确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。

S4：确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。

其中，明文算子节点信息中至少可以包括需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识，密文算子节点信息中至少可以包括密码算子的节点位置标识、密码算子标识。匹配结果可以包括明文算子节点信息与密文算子节点信息匹配成功，还可以包括明文算子节点信息与密文算子节点信息匹配不成功。

本说明书实施例中，通过对数据流图信息进行判断，确定原始图是新图的子图后，可以说明原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。之后，为了实现对数据流图正确性的校验，可以将明文算子节点信息与密文算子节点信息进行匹配。

本说明书一个实施例中，在确定第一数据流图是第二数据流图的子图时，可以将明文算子节点信息与密文算子节点信息进行匹配，从而实现对数据流图正确性的校验。具体的，例如一些实施场景中，明文算子节点信息包括原始图中需要替换的明文算子节点对应的IP地址和预先设置的与明文算子对应的密码算子的名称，密文算子节点信息包括新图中密码算子节点对应的IP地址和该密码算子的名称，由于算子替换前后节点对应的IP地址是不变的，所以可以基于同一IP地址判断明文算子节点信息中预先设置的与明文算子对应的密码算子的名称是否与密文算子节点信息中密码算子的名称一致，如果同一IP地址对应的明文算子节点信息中预先设置的与明文算子对应的密码算子的名称与密文算子节点信息中密码算子的名称均一致，则说明匹配成功，输出明文算子节点信息与密文算子节点信息匹配的结果。如果至少存在一个节点信息中对应的名称不一致，则说明匹配不成功，输出明文算子节点信息与密文算子节点信息不匹配的结果。需要说明的是，由于每个节点信息中还可以包括其他信息，所以在匹配过程中可以相应的对每个节点信息中包括的其他信息依次进行匹配，在每个节点信息全部一致时，说明匹配成功，否则匹配不成功。

另一些实施场景中，明文算子节点信息除了可以包括原始图中需要替换的明文算子节点对应的IP地址和预先设置的与明文算子对应的密码算子的名称外，还可以包括预先设置的与明文算子对应的密码算子的第一特征信息。密文算子节点信息除了可以包括新图中密码算子节点对应的IP地址和该密码算子的名称外，还可以包括一些与该密码算子对应的第二特征信息。其中，特征信息可以包括算子的生成时间、地点、生成方式等。相应的，在将明文算子节点信息与密文算子节点信息进行匹配过程中，还可以包括：计算第一特征信息与第二特征信息的相似度，根据相识度与预先设定阈值之间关系，确定明文算子节点信息与密文算子节点信息是否匹配。例如，可以先判断IP地址是否一致；确定IP地址一致时，计算第一特征信息与第二特征信息的相似度；判断第一特征信息与第二特征信息的相似度是否大于预先设定阈值，确定第一特征信息与第二特征信息的相似度大于或等于预先设定阈值时，说明匹配成功，输出明文算子节点信息与密文算子节点信息匹配的结果。如果第一特征信息与第二特征信息的相似度小于预先设定阈值，则说明匹配不成功，输出明文算子节点信息与密文算子节点信息不匹配的结果。

一些实施场景中，在第一特征信息与第二特征信息的相似度大于或等于预先设定阈值时，还可以对明文算子节点信息中预先设置的与明文算子对应的密码算子的名称与密文算子节点信息中密码算子的名称进行判断，如果名称均一致，则说明匹配成功，输出明文算子节点信息与密文算子节点信息匹配的结果。如果至少存在一个节点信息中对应的名称不一致，则说明匹配不成功，输出明文算子节点信息与密文算子节点信息不匹配的结果。这样，通过多次匹配，可以提高校验的准确度。

需要说明的是，计算相似度的方式可以通过本领域技术人员知晓的一些方式，如欧几里得距离、曼哈顿距离等，本说明书对此不做限定。预先设定阈值可以根据实际场景进行设定。

本说明书一个实施例中，节点信息中还可以包括算子在堆栈中的位置。由于在获取节点信息后，可以按照顺序将节点信息保存到堆栈中，所以可以记录算子在堆栈中的位置，以便后续可以通过对堆栈中的位置进行相应匹配，从而提高校验准确度。例如一些实施场景中，在获取原始图中节点信息后，可以依次将其保存到堆栈中，并记录每个节点信息在堆栈中的位置，在获取新图中的节点信息后，同样，依次保存到另一个堆栈中，并记录每个节点在堆栈中的位置，最后对明文算子节点信息和密文算子节点信息进行匹配时，可以先对节点信息中包括的算子在堆栈中的位置进行匹配，在匹配成功时，再对节点对应的IP 地址和密码算子的名称进行匹配。

需要说明的是，上述只是进行示例性说明，匹配方式还可以包括其他方式，本说明书对此不做作限定。例如，节点信息中还可以以表的形式存储在数据库等中，这样，节点信息中还可以包括节点信息在数据库中的位置、节点信息在数据库中对应表的名称等信息，此时，可以根据这些信息进行相应匹配，获得匹配结果。

上述实施例的方法，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，提高编码效率，而且可以实现对数据流图正确性的自动化测试，从而提高验证效率。

上述实施例的方法，在进行实现时，可以对外封装成相应的接口(如validate_graph接口)，这样，外部就可以直接调用该接口实现数据流图的自动化测试。

下面结合一个具体实施例对上述方法进行说明，然而，值得注意的是，该具体实施例仅是为了更好地说明本申请，并不构成对本申请的不当限定。

本具体实施例中以TensorFlow框架为例进行说明，其中，静态优化测试组件(Static Pass Tester)中封装有静态优化器(Static Pass)，可以用于在实施过程中保存信息，并利用保存信息对数据流图进行校验。下述信息保存均基于静态优化测试组件完成。如图2所示，在本具体实施例中，可以包括以下步骤。

(1)保存原始graph；

其中，原始graph可以理解为是预设明文机器学习模型对应的第一数据流图。本实施例中，通过保存原始graph，可以为更新图提供原始参考。需要说明的是，该原始graph可以通过对预设明文机器学习模型对应的数据流图进行复制获得。

本实施例中，可以采用TensorFlow框架生成预设明文机器学习模型，然后保存预设明文机器学习模型对应的数据流图。

(2)保存原始graph中需要更新为安全多方计算算子的算子节点栈；

其中，安全多方计算算子(MPC op)可以理解为是密码算子。算子节点栈可以理解为明文算子节点信息。需要更新为安全多方计算算子的算子节点栈可以理解为是需要替换为MPC op的明文算子节点信息。其中，op为Operation的缩写。

本实施例中，可以基于预设明文机器学习模型对应的数据流图中的数据流，确定需要替换为MPC op的本地明文算子(Tensorflow native op)，然后将需要替换的Tensorflow native op在原始graph中进行标记，最后将进行标记的节点对应的信息保存到堆栈中，并保存节点在堆栈中的顺序信息。例如，原始graph中包括5个节点，基于预设明文机器学习模型对应的数据流图中的数据流，可以确定需要替换为MPC op的Tensorflow native op有2个，则可以在原始graph中将这2个Tensorflow native op进行标记，然后把标记的2个Tensorflow native op对应的IP地址、以及预先设定的MPC op名称按顺序保存到堆栈中，并对应记录Tensorflow native op在堆栈中的位置信息。例如，2个Tensorflow native op分别为Tensorflow native op3和Tensorflow native op4，则可以将Tensorflow native op3对应的节点信息保存到堆栈的位置1中，将Tensorflow native op4对应的节点信息保存到堆栈的位置2中，然后将Tensorflow native op在堆栈的具体位置(如，位置1、位置2)记录到对应的节点信息中。其中，可以预先设置Tensorflow native op与MPC op的对应关系。

(3)执行静态优化器进行算子更新替换，并构建新graph；

其中，进行算子更新替换可以理解为将预设明文机器学习模型中的明文算子替换为明文算子对应的密码算子。新graph是指算子更新替换后获得的隐私机器学习模型对应的第二数据流图。

本实施例中，可以通过静态优化器，实现op的更新替换，从而构建新graph。

相应的，本实施例中，在构建新graph后，可以保存新graph以及新graph中的安全多方计算算子的算子节点栈。其中，保存方式与步骤(1)、(2)中类似，对此不作赘述。

需要说明的是，上述执行过程中，如果静态优化测试组件没有进行保存，则可以抛出异常。

(4)比较原始graph是否为新graph的子图；

本实施例中，可以为数据流图中的每个节点添加节点标识。其中，节点标识需要满足递增规则。递增规则可以理解为是在原始graph中节点标识的基础上，对得到的新graph中MPC op对应节点进行递增标识。例如，原始graph中包括5个节点，相应的，为这5个节点添加节点标识1、2、3、4、5，由于原始graph中2个节点对应的Tensorflow native op需要替换为对应的MPC op，则在替换获得新graph后，新graph中MPC op对应节点标识应为6、7。

本实施例中，在为数据流图中的每个节点添加节点标识后，可以将每个图中的节点标识组成一个集合，然后判断原始graph中节点标识对应的集合是否是新graph中节点标识对应集合的子集，如果是，则说明原始graph是新graph的子图，即原始graph与新graph前面部分一致，从而可以确保原始graph的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。如果不是，则说明原始graph不是新graph的子图，即原始graph与新graph前面部分不一致，从而说明进行算子替换后的数据流图不正确，输出校验失败的结果。

(5)确定原始graph为新graph的子图时，比较原始graph中需要更新为安全多方计算算子的算子节点栈与新graph中的安全多方计算算子的算子节点栈是否匹配，并输出结果。

本实施例中，由于原始graph中需要更新为安全多方计算算子的算子节点栈与新graph中的安全多方计算算子的算子节点栈分别保存到堆栈中，所以在确定原始graph为新graph的子图后，可以分别对堆栈中的元素依次进行比较，如果其中有一个元素的Tensorflow native op和MPC op不匹配，则判断为失败，输出校验失败的结果。否则，全部匹配，判断为成功，输出校验成功的结果。其中，匹配过程中可以基于算子替换前后节点对应的IP地址不变进行比较，具体比较过程可参见上述方法的描述，对此不作赘述。

本说明书一个实施例中，在实现对数据流图正确性的自动化测试后，还可以对数据流图的执行结果进行验证。具体的一种实施例如图3所示，所述方法可以包括以下步骤。

S10：当所述匹配结果为匹配成功时，获取明文数据；

S12：将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，其中，所述会话测试器包括第一数据流图和第二数据流图；

S14：对所述密文执行结果进行解密，获得解密结果；

S16：计算所述明文执行结果与所述解密结果的差值，并判断所述差值是否在预设误差范围内，输出判断结果。

其中，明文数据可以理解为是任何没有经过加密的数据。明文数据可以是用户通过接口输入，也可以是预先存储在服务器中，本说明书对此不作限定。会话测试器中可以包括第一数据流图和第二数据流图，其可以用于执行数据流图，并返回对应的参数信息。

本说明书一个实施例中，所述将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，可以包括：将所述明文数据输入所述会话测试器包括的第一数据流图，获得明文执行结果；对所述明文数据进行加密，将加密后的数据分发到各个多方安全计算进程，基于所述各个多方安全计算进程中的数据，执行所述会话测试器包括的第二数据流图，获得密文执行结果。例如一些实施场景中，可以先对明文数据进行加密，然后将加密后的数据分发到各个数据持有方，最后根据各个数据持有方存储的数据，执行会话测试器包括的第二数据流图，获得密文执行结果。其中，对明文数据进行加密可以通过秘密分享的方式实现，这样，进行秘密分享后任何一个存储子秘密的数据持有方均无法获取其他数据持有方存储的子秘密，而且只有所有数据持有方的子秘密合起来才可以对加密结果进行还原或解密。秘密分享可以包括加法秘密分享、谢尔曼秘密分享等。

例如一些实施场景中，为了对密文执行结果和明文执行结果进行比较，可以对Tensorflow框架的原生tf.Session(会话执行器)进行扩展，获得包括原始图和新图的SessionTester(会话测试器)。其中，SessionTester可以包括执行接口(run接口)和验证接口(validate_run接口)，run接口用于基于数据流图和提供的明文数据获得执行结果，validate_run接口用于对执行结果进行验证，并返回验证结果。

一些实施场景中，在获得SessionTester后，可以接收输入接口输入的明文数据，然后可以基于明文数据和原始图执行run接口，获得与原始图对应明文参数。另一些实施场景中，在获得SessionTester后，可以接收输入接口输入的明文数据，对明文数据进行加密，把加密数据分发到各个多方安全计算进程，然后使用新图执行run接口，获得与新图对应的密文参数。需要说明的是，由于SessionTester中包括原始图和新图，所以在获得明文数据后，可以先后基于数据流图和明文数据获得执行结果，也可以同时基于数据流图和明文数据获得执行结果，本说明书对此不作限定。

一些实施场景中，在获得明文参数和密文参数后，可以基于validate_run接口先对密文参数进行解密操作，获得解密参数，然后将解密参数与明文参数进行比较，从而实现对数据流图执行结果正确性的验证。其中，通常对数据流图的执行结果为数字型，所以，在将解密参数与明文参数进行比较时，可以预先设置误差范围，如果解密参数的值与明文参数的值在预设误差范围内，则说明数据流图执行结果正确。如果解密参数的值与明文参数的值不在预设误差范围内，则说明数据流图执行结果不正确。需要说明的是，对数据流图的执行结果还可以是其他类型，如是其他类型，可以通过预设的转化方式将其转化为数字型，其中，本说明书对预设的转化方式不限。

本说明书一些实施例中，可以通过Python语言实现静态优化器以及会话测试器等。当然，也可以采用其他语言来实现密码算子，例如由C语言、C++语言等，本说明书对此不作限定。

本说明书提供的一种节点匹配方法，在将预设明文机器学习模型中的明文算子替换为对应的密码算子过程中，由于优化器测试组件封装了静态优化器，使得在获取数据流图信息和节点信息过程中，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，而且可以为实现自动测试数据流图和图执行结果正确性提供保障。在获取数据流图信息和节点信息后，通过对明文算子替换前后对应的数据流图进行判断，可以确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。通过对明文算子替换前后的节点信息进行匹配以及对图执行结果的比较，可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。

本说明书中上述方法的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参加即可，每个实施例重点说明的都是与其他实施例的不同之处。相关之处参见方法实施例的部分说明即可。

基于上述所述的一种节点匹配方法，本说明书一个或多个实施例还提供一种节点匹配装置。所述的装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思，本说明书实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似，因此本说明书实施例具体的装置的实施可以参见前述方法的实施，重复之处不再赘述。以下所使用的，术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

具体地，图4是本说明书提供的一种节点匹配装置的一个实施例的模块结构示意图，如图4所示，本说明书提供的一种节点匹配装置可以包括：信息获取模块120，判断模块122，匹配模块124。

信息获取模块120，可以用于获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断模块122，可以用于判断所述第一数据流图是否为所述第二数据流图的子图；

匹配模块124，可以用于确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，还可以包括：

明文数据获取模块，可以用于当所述匹配结果为匹配成功时，获取明文数据；

执行结果获得模块，可以用于将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，其中，所述会话测试器包括第一数据流图和第二数据流图；

解密模块，可以用于对所述密文执行结果进行解密，获得解密结果；

结果判断模块，可以用于计算所述明文执行结果与所述解密结果的差值，并判断所述差值是否在预设误差范围内，输出判断结果。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述执行结果获得模块，可以包括：

明文执行结果获得单元，可以用于将所述明文数据输入所述会话测试器包括的第一数据流图，获得明文执行结果；

密文执行结果获得单元，可以用于对所述明文数据进行加密，将加密后的数据分发到各个多方安全计算进程，基于所述各个多方安全计算进程中的数据，执行所述会话测试器包括的第二数据流图，获得密文执行结果。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述信息获取模块120，可以包括：

第一获取单元1200，可以获取预设明文机器学习模型中的优化测试组件，所述优化测试组件包括静态优化器，所述优化测试组件用于在节点匹配过程中保存信息，并利用保存信息对数据流图进行校验；

第一保存单元1202，可以用于基于所述优化测试组件保存所述预设明文机器学习模型对应的第一数据流图和所述第一数据流图中需要替换为密码算子的明文算子节点信息；

模型生成单元1204，可以用于执行静态优化器，将所述预设明文机器学习模型中明文算子替换为所述明文算子对应的密码算子，生成隐私机器学习模型；

第二保存单元1206，可以用于基于所述优化测试组件保存所述隐私机器学习模型对应的第二数据流图和所述第二数据流图中包括的密文算子节点信息；

信息获取单元1208，可以用于获取数据流图信息和节点信息。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述判断模块122，可以包括：

第二获取单元1220，可以用于获取所述第一数据流图和所述第二数据流图中节点对应的唯一标识；

第一组成单元1222，可以用于将所述第一数据流图中节点对应的唯一标识组成第一集合；

第二组成单元1224，可以用于将所述第二数据流图中节点对应的唯一标识组成第二集合；

判断单元1226，可以用于基于节点标识递增规则，判断所述第一集合是否是所述第二集合的子集；

确定单元1228，可以用于当所述第一集合是所述第二集合的子集时，确定所述第一数据流图是所述第二数据流图的子图。

基于前述方法所述实施例的描述，本说明书所述装置的另一个实施例中，所述明文算子节点信息至少包括需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识；所述密文算子节点信息至少包括密码算子的节点位置标识、密码算子标识。

本说明书提供的一种节点匹配装置，在将预设明文机器学习模型中的明文算子替换为对应的密码算子过程中，由于优化器测试组件封装了静态优化器，使得在获取数据流图信息和节点信息过程中，不仅可以复用已有的明文机器学习模型实现隐私机器学习模型，减少开发成本，而且可以为实现自动测试数据流图和图执行结果正确性提供保障。在获取数据流图信息和节点信息后，通过对明文算子替换前后对应的数据流图进行判断，可以确保原始图的部分没有被修改，仍然能够提供正确地明文机器学习模型执行。通过对明文算子替换前后的节点信息进行匹配以及对图执行结果的比较，可以实现对数据流图和图执行结果正确性的自动化测试，从而提高验证效率。

需要说明的，上述所述的装置根据方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书还提供一种节点匹配设备的实施例，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：

判断所述第一数据流图是否为所述第二数据流图的子图；

需要说明的，上述所述的设备根据方法或装置实施例的描述还可以包括其他的实施方式，如确定相邻井的井距信息、根据储量劈分的井距信息和产量劈分的井距信息确定井距等的实现方式。具体的实现方式可以参照相关方法实施例的描述，在此不作一一赘述。

本说明书还提供一种节点匹配系统的实施例，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现上述任意一个或者多个实施例中所述方法的步骤，例如包括：获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；判断所述第一数据流图是否为所述第二数据流图的子图；确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。所述的系统可以为单独的服务器，也可以包括使用了本说明书的一个或多个所述方法或一个或多个实施例装置的服务器集群、系统(包括分布式系统)、软件(应用)、实际操作装置、逻辑门电路装置、量子计算机等并结合必要的实施硬件的终端装置。

本说明书所提供的方法实施例可以在移动终端、计算机终端、服务器或者类似的运算装置中执行。以运行在服务器上为例，图5是本说明书提供的一种节点匹配服务器的一个实施例的硬件结构框图，该服务器可以是上述实施例中的节点匹配装置或节点匹配系统。如图5所示，服务器10可以包括一个或多个(图中仅示出一个)处理器100(处理器100可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器200、以及用于通信功能的传输模块300。本领域普通技术人员可以理解，图5所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器10还可包括比图5中所示更多或者更少的组件，例如还可以包括其他的处理硬件，如数据库或多级缓存、GPU，或者具有与图5所示不同的配置。

存储器200可用于存储应用软件的软件程序以及模块，如本说明书实施例中的节点匹配方法对应的程序指令/模块，处理器100通过运行存储在存储器200内的软件程序以及模块，从而执行各种功能应用以及数据处理。存储器200可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器200可进一步包括相对于处理器100远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输模块300用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输模块300包括一个网络适配器(Network Interface Controller，NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输模块300可以为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

本说明书提供的上述实施例所述的方法或装置可以通过计算机程序实现业务逻辑并记录在存储介质上，所述的存储介质可以计算机读取并执行，实现本说明书实施例所描述方案的效果。

所述存储介质可以包括用于存储信息的物理装置，通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。所述存储介质有可以包括：利用电能方式存储信息的装置如，各式存储器，如RAM、ROM等；利用磁能方式存储信息的装置如，硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘；利用光学方式存储信息的装置如，CD或DVD。当然，还有其他方式的可读存储介质，例如量子存储器、石墨烯存储器等等。

本说明书提供的上述节点匹配方法或装置实施例可以在计算机中由处理器执行相应的程序指令来实现，如使用windows操作系统的c++语言在PC端实现、linux系统实现，或其他例如使用android、iOS系统程序设计语言在智能终端实现，以及基于量子计算机的处理逻辑实现等。

需要说明的是说明书上述所述的装置、计算机存储介质、系统根据相关方法实施例的描述还可以包括其他的实施方式，具体的实现方式可以参照对应方法实施例的描述，在此不作一一赘述。

本申请中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于硬件+程序类实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书实施例并不局限于必须是符合行业通信标准、标准计算机数据处理和数据存储规则或本说明书一个或多个实施例所描述的情况。某些行业标准或者使用自定义方式或实施例描述的实施基础上略加修改后的实施方案也可以实现上述实施例相同、等同或相近、或变形后可预料的实施效果。应用这些修改或变形后的数据获取、存储、判断、处理方式等获取的实施例，仍然可以属于本说明书实施例的可选实施方案范围之内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device，PLD)(例如现场可编程门阵列(Field Programmable Gate Array，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware Description Language)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(Ruby Hardware Description Language)等，目前最普遍使用的是VHDL(Very-High-Speed Integrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元中的部分具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、平板电脑、智能手机等。

虽然本说明书一个或多个实施例提供了如实施例或流程图所述的方法操作步骤，但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式，不代表唯一的执行顺序。在实际中的装置或终端产品执行时，可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境，甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下，并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

为了描述的方便，描述以上装置时以功能分为各种模块分别描述。当然，在实施本说明书一个或多个时可以把部分模块的功能在同一个或多个软件和/或硬件中实现，也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

本发明是参照根据本发明实施例的方法、装置(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储、石墨烯存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

本领域技术人员应明白，本说明书一个或多个实施例可提供为方法、系统或计算机程序产品。因此，本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本说明书一个或多个实施例的实施例而已，并不用于限制本本说明书一个或多个实施例。对于本领域技术人员来说，本说明书一个或多个实施例可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在权利要求范围之内。

Claims

一种节点匹配方法，其特征在于，包括：

获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断所述第一数据流图是否为所述第二数据流图的子图；

确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。
根据权利要求1所述的方法，其特征在于，还包括：

当所述匹配结果为匹配成功时，获取明文数据；

将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，其中，所述会话测试器包括第一数据流图和第二数据流图；

对所述密文执行结果进行解密，获得解密结果；

计算所述明文执行结果与所述解密结果的差值，并判断所述差值是否在预设误差范围内，输出判断结果。
根据权利要求2所述的方法，其特征在于，所述将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，包括：

将所述明文数据输入所述会话测试器包括的第一数据流图，获得明文执行结果；

对所述明文数据进行加密，将加密后的数据分发到各个多方安全计算进程，基于所述各个多方安全计算进程中的数据，执行所述会话测试器包括的第二数据流图，获得密文执行结果。
根据权利要求1所述的方法，其特征在于，所述获取数据流图信息和节点信息，包括：

获取预设明文机器学习模型中的优化测试组件，所述优化测试组件包括静态优化器，所述优化测试组件用于在节点匹配过程中保存信息，并利用保存信息对数据流图进行校验；

基于所述优化测试组件，保存所述预设明文机器学习模型对应的第一数据流图和所述第一数据流图中需要替换为密码算子的明文算子节点信息；

执行静态优化器，将所述预设明文机器学习模型中明文算子替换为所述明文算子对应的密码算子，生成隐私机器学习模型；

基于所述优化测试组件，保存所述隐私机器学习模型对应的第二数据流图和所述第二数据流图中包括的密文算子节点信息；

获取数据流图信息和节点信息。
根据权利要求1所述的方法，其特征在于，所述判断所述第一数据流图是否为所述第二数据流图的子图，包括：

获取所述第一数据流图和所述第二数据流图中节点对应的唯一标识；

将所述第一数据流图中节点对应的唯一标识组成第一集合；

将所述第二数据流图中节点对应的唯一标识组成第二集合；

基于节点标识递增规则，判断所述第一集合是否是所述第二集合的子集；

当所述第一集合是所述第二集合的子集时，确定所述第一数据流图是所述第二数据流图的子图。
根据权利要求1或4所述的方法，其特征在于，所述明文算子节点信息至少包括需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识；所述密文算子节点信息至少包括密码算子的节点位置标识、密码算子标识。
一种节点匹配装置，其特征在于，包括：

信息获取模块，用于获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断模块，用于判断所述第一数据流图是否为所述第二数据流图的子图；

匹配模块，用于确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。
如权利要求7所述的装置，其特征在于，还包括：

明文数据获取模块，用于当所述匹配结果为匹配成功时，获取明文数据；

执行结果获得模块，用于将所述明文数据输入会话测试器，获得明文执行结果和密文执行结果，其中，所述会话测试器包括第一数据流图和第二数据流图；

解密模块，用于对所述密文执行结果进行解密，获得解密结果；

结果判断模块，用于计算所述明文执行结果与所述解密结果的差值，并判断所述差值是否在预设误差范围内，输出判断结果。
如权利要求8所述的装置，其特征在于，所述执行结果获得模块，包括：

明文执行结果获得单元，用于将所述明文数据输入所述会话测试器包括的第一数据流图，获得明文执行结果；

密文执行结果获得单元，用于对所述明文数据进行加密，将加密后的数据分发到各个多方安全计算进程，基于所述各个多方安全计算进程中的数据，执行所述会话测试器包括的第二数据流图，获得密文执行结果。
如权利要求7所述的装置，其特征在于，所述信息获取模块，包括：

第一获取单元，用于获取预设明文机器学习模型中的优化测试组件，所述优化测试组件包括静态优化器，所述优化测试组件用于在节点匹配过程中保存信息，并利用保存信息对数据流图进行校验；

第一保存单元，用于基于所述优化测试组件保存所述预设明文机器学习模型对应的第一数据流图和所述第一数据流图中需要替换为密码算子的明文算子节点信息；

模型生成单元，用于执行静态优化器，将所述预设明文机器学习模型中明文算子替换为所述明文算子对应的密码算子，生成隐私机器学习模型；

第二保存单元，用于基于所述优化测试组件保存所述隐私机器学习模型对应的第二数据流图和所述第二数据流图中包括的密文算子节点信息；

信息获取单元，用于获取数据流图信息和节点信息。
如权利要求7所述的装置，其特征在于，所述判断模块，包括：

第二获取单元，用于获取所述第一数据流图和所述第二数据流图中节点对应的唯一标识；

第一组成单元，用于将所述第一数据流图中节点对应的唯一标识组成第一集合；

第二组成单元，用于将所述第二数据流图中节点对应的唯一标识组成第二集合；

判断单元，用于基于节点标识递增规则，判断所述第一集合是否是所述第二集合的子集；

确定单元，用于当所述第一集合是所述第二集合的子集时，确定所述第一数据流图是所述第二数据流图的子图。
根据权利要求7或10所述的装置，其特征在于，所述明文算子节点信息至少包括需要替换的明文算子的节点位置标识、与明文算子对应的密码算子标识；所述密文算子节点信息至少包括密码算子的节点位置标识、密码算子标识。
一种节点匹配设备，其特征在于，包括处理器及用于存储处理器可执行指令的存储器，所述指令被所述处理器执行时实现包括以下步骤：

获取数据流图信息和节点信息，其中，所述数据流图信息包括预设明文机器学习模型对应的第一数据流图和隐私机器学习模型对应的第二数据流图，所述节点信息包括所述第一数据流图中需要替换为密码算子的明文算子节点信息和所述第二数据流图中包括的密文算子节点信息；

判断所述第一数据流图是否为所述第二数据流图的子图；

确定所述第一数据流图是所述第二数据流图的子图时，将所述明文算子节点信息与所述密文算子节点信息进行匹配，输出匹配结果。
一种节点匹配系统，其特征在于，包括至少一个处理器以及存储计算机可执行指令的存储器，所述处理器执行所述指令时实现权利要求1-6中任意一项所述方法的步骤。