CN116522001B

CN116522001B - 一种隐私保护的跨域序列推荐方法及相关设备

Info

Publication number: CN116522001B
Application number: CN202310763179.5A
Authority: CN
Inventors: 林钊浩; 潘微科; 明仲
Original assignee: Shenzhen University
Current assignee: Shenzhen University
Priority date: 2023-06-27
Filing date: 2023-06-27
Publication date: 2023-09-26
Anticipated expiration: 2043-06-27
Also published as: CN116522001A

Abstract

本发明公开了一种隐私保护的跨域序列推荐方法及相关设备，所述方法包括：获取辅助域的序列数据矩阵和目标域的数据矩阵；根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；将所述扰动序列数据矩阵发送到目标域，得到目标域进行跨域序列推荐的全部必要数据矩阵。本发明所提出的序列差分隐私，同时考虑了序列数据的ID信息和序列信息，为序列数据的隐私保护强度提供了一种可量化的指标；设计了一个满足这种差分隐私的随机机制，对辅助域数据添加可控的噪声来达成保护辅助域数据的目的，解决了现有跨域序列推荐过程中的隐私保护问题，对隐私保护的跨域推荐系统无法保护序列信息的问题提供了有效的解决方案。

Description

一种隐私保护的跨域序列推荐方法及相关设备

技术领域

本发明涉及数据处理技术领域，尤其涉及一种隐私保护的跨域序列推荐方法及相关设备。

背景技术

推荐系统已经成为一项可以为商业企业提供实际利益的关键技术。它在许多应用中发挥了重要作用，包括电子商务、在线视频平台、社交媒体和地图服务等等，并已成为这些应用的标准配置。推荐系统通常利用用户和物品的交互记录、用户画像、物品属性和其他相关信息（如社会关系）来预测用户偏好，然后为用户提供个性化的推荐服务。

考虑到用户的偏好可能会随着时间的推移而变化，最近越来越多的研究更加关注交互记录的序列信息（一般是时间先后信息），并提出了许多利用序列信息的模型。使用序列信息的推荐系统称为序列推荐系统。它们利用递归神经网络、自注意力机制等方法捕捉用户历史交互序列的动态信息。这种方法使推荐系统能够更好地反映用户最近的偏好。通过结合用户的长期和短期偏好，序列推荐系统可以更有效地捕捉用户的兴趣，从而提供更好的推荐服务。

然而，序列推荐系统仍然存在冷启动和数据稀疏性问题。幸运的是，推荐系统中有另一个研究方向可以有效地缓解这两个问题，即跨域推荐系统（cross-domainrecommender systems，CDR）。利用来自其他应用程序的附加辅助数据，CDR可以增强模型性能。这些应用被称为辅助域，而提高推荐精度的应用被称为目标域。辅助域的数据通常与目标域的数据具有相同的用户或相同的物品，因此目标域的模型可以有效地从辅助域迁移用户和物品知识。

近年来，一些研究者成功地将序列推荐系统与跨域推荐系统相结合，从而出现了跨域序列推荐系统（cross-domain sequential recommender systems，CDSR）。CDSR模型不仅有效地利用了用户的长期和短期偏好，而且还从其他域迁移了用户和物品的知识，从而提高了推荐性能。

但现有的跨域序列推荐系统通常假设每个域的数据对所有域都可见。换句话说，数据是公开的。然而，这种做法在现实场景中可能会导致隐私问题，因为数据通常包括用户的历史交互记录，这是用户的隐私。

因此，现有技术还有待于改进和发展。

发明内容

本发明的主要目的在于提供一种隐私保护的跨域序列推荐方法、系统、终端及计算机可读存储介质，旨在解决现有技术中跨域序列推荐过程中的隐私序列信息无法得到保护的问题。

为实现上述目的，本发明提供一种隐私保护的跨域序列推荐方法，所述一种隐私保护的跨域序列推荐方法包括如下步骤：

获取用户的数据记录，从所述数据记录中获取辅助域的序列数据矩阵和目标域的数据矩阵；

根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；

将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到推荐模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述从所述数据记录中获取辅助域的序列数据矩阵，具体包括：

从所述数据记录中获取辅助域的原始数据，将所述原始数据表示为一个集合，其中，/>表示第/>个用户的交互物品序列，/>表示用户的序数，/>表示用户的总数，A表示集合属于辅助域；

每个用户在集合中都有一个有序的交互物品序列，表示为/>，其中，/>表示第/>个用户的交互物品序列中的第/>个物品，/>表示物品的序数；

将用户的交互物品序列的长度固定为/>，若所述交互物品序列的长度超过/>，则只取最后/>个物品，若交互物品序列的长度未超过/>，则在所述交互物品序列前面填零；

只保留一个用户与一个物品之间的第一个交互记录，并删除后续重复的交互记录，得到所述辅助域的序列数据矩阵，其中，/>表示自然数集，/>表示一个集合，集合中的每一个元素都是一个/>的矩阵。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵，具体包括：

对所述序列数据矩阵中的每个元素使用随机机制进行扰动，得到扰动序列数据矩阵；

所述使用随机机制进行扰动的过程为：遍历所述序列数据矩阵中的每个元素，在每遍历一个元素时，根据公式/>中定义的概率分布得到/>的概率分布，根据/>的概率分布进行采样得到/>，判断采样得到的/>是否出现在当前遍历的元素的ID之后的元素ID中，若是，则将两者的元素ID进行交换，否则，将当前遍历的元素的ID替换为/>；

其中，表示辅助域的物品集中的一个元素ID，/>，/>为所述物品集中元素的总数，/>表示在各种情况下/>的值的概率，/>表示在当前遍历的元素之前已经被扰动过后的用户/>交互序列中的元素的ID的集合，/>是指以自然常数e为底的指数函数，/>为隐私预算，/>为当前遍历的元素的ID，/>表示用户的交互物品序列中当前遍历的元素的序数。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述随机机制满足序列差分隐私的要求。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述的序列差分隐私定义为：对于任意一对相邻序列数据矩阵和/>，和随机机制/>的所有可能的输出情况，若成立，则说明随机机制/>满足序列差分隐私的要求；

其中，是指输入的矩阵为/>，随机机制/>的输出为A的概率，是指输入的矩阵为/>，随机机制/>的输出为A的概率，A为随机机制/>的所有可能的输出情况，/>为序列数据矩阵，/>为任意与所述序列数据矩阵相邻的序列数据矩阵。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述相邻序列数据矩阵和，如果/>是通过修改/>中一个用户交互物品序列的元素而获得，表示为：存在一组/>，，使得/>，则说明两个序列数据矩阵/>和/>是相邻的；

或如果是通过交换/>中一个用户交互物品序列的任意两个元素的位置而获得，表示为：存在两组/>和/>，/>，使得，则说明两个序列数据矩阵/>和/>是相邻的，其中，/>、/>和/>分别唯一标识所述交互物品序列中的一个元素。

可选地，所述的隐私保护的跨域序列推荐方法，其中，所述将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到推荐模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务，具体包括：

将所述扰动序列数据矩阵和所述目标域的数据矩阵通过算法一同输入到跨域序列推荐系统模型中进行运算，输出用户的兴趣偏好，根据所述兴趣偏好为用户提供推荐服务。

此外，为实现上述目的，本发明还提供一种隐私保护的跨域序列推荐系统，其中，所述隐私保护的跨域序列推荐系统包括：

数据获取模块，用于获取用户的数据记录，从所述数据记录中获取辅助域的序列数据矩阵和目标域的数据矩阵；

差分扰动模块，用于根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；

兴趣推荐模块，用于将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务。

此外，为实现上述目的，本发明还提供一种终端，其中，所述终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的隐私保护的跨域序列推荐程序，所述隐私保护的跨域序列推荐程序被所述处理器执行时实现如上所述的隐私保护的跨域序列推荐方法的步骤。

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，其中，所述计算机可读存储介质存储有隐私保护的跨域序列推荐程序，所述隐私保护的跨域序列推荐程序被处理器执行时实现如上所述的隐私保护的跨域序列推荐方法的步骤。

本发明中，获取辅助域的序列数据矩阵和目标域的数据矩阵；根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；将所述扰动序列数据矩阵发送到目标域，得到目标域进行跨域序列推荐的全部必要数据矩阵。本发明所提出的序列差分隐私，同时考虑了序列数据的ID信息和序列信息，为序列数据的隐私保护强度提供了一种可量化的指标；设计了一个满足这种差分隐私的随机机制，对辅助域数据添加可控的噪声来达成保护辅助域数据的目的，解决了现有跨域序列推荐过程中的隐私保护问题，对隐私保护的跨域推荐系统无法保护序列信息的问题提供了有效的解决方案。

附图说明

图1是本发明隐私保护的跨域序列推荐方法的较佳实施例的流程图；

图2是本发明隐私保护的跨域序列推荐方法的较佳实施例的整体架构图；

图3是本发明隐私保护的跨域序列推荐方法中随机机制算法的流程图；

图4是本发明隐私保护的跨域序列推荐方法中随机机制算法的运作示例图；

图5是本发明隐私保护的跨域序列推荐系统的较佳实施例的原理图；

图6为本发明终端的较佳实施例的运行环境图。

具体实施方式

本申请提供一种隐私保护的跨域序列推荐方法及相关设备，为使本申请的目的、技术方案及效果更加清楚、明确，以下参照附图并举实施例对本申请进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本技术领域技术人员可以理解，除非另外定义，这里使用的所有术语（包括技术术语和科学术语），具有与本申请所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是，诸如通用字典中定义的那些术语，应该被理解为具有与现有技术的上下文中的意义一致的意义，并且除非像这里一样被特定定义，否则不会用理想化或过于正式的含义来解释。

另外，若本发明实施例中有涉及“第一”、“第二”等的描述，则该“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

本发明较佳实施例所述的隐私保护的跨域序列推荐方法，如图1和图2所示，所述隐私保护的跨域序列推荐方法包括以下步骤：

步骤S100、获取用户的数据记录，从所述数据记录中获取辅助域的序列数据矩阵和目标域的数据矩阵。

利用来自其他应用程序的附加辅助数据，跨域推荐系统（cross-domainrecommender systems，CDR）可以增强模型性能，这些应用被称为辅助域，而提高推荐精度的应用被称为目标域。辅助域的数据通常与目标域的数据具有相同的用户或相同的物品，因此目标域的模型可以有效地从辅助域迁移用户和物品知识，比如，将用户在淘宝上的物品交互数据作为目标域，将用户在某购买平台上的物品交互数据作为辅助域。

本发明假设只有两个域，一个辅助域和一个目标域，这两个域具有相同的用户集，但是，它们的物品集是互斥的。

其中，用户的数据记录指用户在使用的软件中所留下的物品交互数据信息。

具体地，从所述数据记录中获取辅助域的原始数据，将所述原始数据表示为一个集合，其中，/>表示第/>个用户的交互物品序列，/>表示用户的序数，表示用户的总数，A表示集合属于辅助域。

每个用户在集合中都有一个有序的交互物品序列，表示为/>，其中，/>表示第/>个用户的交互物品序列中的第/>个物品，/>表示物品的序数。

进一步地，将用户的交互物品序列的长度固定为/>，若所述交互物品序列的长度超过/>，则只取最后/>个物品，若交互物品序列的长度未超过/>，则在所述交互物品序列前面填零。

进一步地，从所述数据记录中获取目标域的数据矩阵，需要说明的是，本发明只作用在辅助域上，因此不对所述目标域的数据矩阵做定义要求。

步骤S200、根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵。

具体地，对所述序列数据矩阵中的每个元素使用随机机制进行扰动，得到扰动序列数据矩阵。

如图3所示，本发明自定义的随机机制算法，所述使用随机机制/>进行扰动的过程为：遍历所述序列数据矩阵中的每个元素，在每遍历一个元素时，根据公式中定义的概率分布得到/>的概率分布，根据/>的概率分布进行采样得到/>，判断采样得到的/>是否出现在当前遍历的元素的ID之后的元素ID中，若是，则将两者的元素ID进行交换，否则，将当前遍历的元素的ID替换为/>。

本发明的随机机制过程简单的同时满足/>-SDP，随机机制/>的一个重要特征是，随机机制/>生成的扰动序列数据矩阵与原始序列数据矩阵形状相同，即/>，这确保了整个方案的非侵入性。

在跨域序列推荐中，不同的模型以不同的方式利用辅助数据；本发明根据辅助域的数据是否与目标域的数据混合，将跨域序列推荐系统分为两类，即混合流跨域序列推荐（merged flow cross-domain sequential recommendation，MFCDSR）和分离流跨域序列推荐（segregated flow cross-domain sequential recommendation，SFCDSR），MFCDSR是指将目标域数据与辅助数据混合，两个域中每个用户的交互记录通过时间戳按时间顺序重新排列，也就是说，MFCDSR需要利用时间戳来混合来自两个域的数据；而SFCDSR是指一个模型不利用时间戳来混合来自两个域的数据；需要说明的是，本发明提出的方法只应用于SFCDSR，且任何现有的SFCDSR算法都可以应用于本发明中扰动后的序列数据矩阵，从而使目标域从迁移的知识中受益。

进一步地，如图4所示，用一个例子来解释本发明的随机机制的运作过程：

考虑由五个物品组成的用户历史交互序列，即，为了符合固定的交互序列长度（在图4中是8），对序列填零；然后，随机机制/>逐个扰动用户交互序列中的每个物品ID（包括填充的0值）；根据采样到的值的不同，原始值的不同，采样到的值是否出现在后续子序列中，噪声可以分为插入、删除、替换、交换四类，每个步骤的具体操作在相应序列的右侧进行了说明。

首先，对于第一个0，随机机制采样0，因此序列不会改变；出于简洁，没有在图4中说明这种采样；第二，对于第二个0，随机机制/>采样了物品ID 8，这是一个没有出现在原始交互序列中的物品ID，因此物品ID 8取代了原始的0，这种扰动的结果类似于在原始交互序列中插入一个新的物品ID；第三，对于第三个0，随机机制/>采样物品ID 1，这是一个出现在原始交互序列中的物品ID，因此，这个0和原始序列中的物品ID 1交换位置；第四，对于交换的0和物品ID 2，随机机制/>分别采样到0和物品ID 2，因此序列保持不变，简洁起见，图4中也没有说明这两次采样；第五，对于物品ID 3，随机机制/>采样到物品ID 5，然后交换它们在交互序列中的位置；第六，对于物品ID 4，随机机制/>采样0，因此物品ID 4被替换为0，这种扰动的结果类似于删除原始交互序列中的物品ID；最后，对于交换后的物品ID 3，随机机制/>采样到物品ID 6，该物品ID没有出现在原始序列中，因此物品ID 3被物品ID 6替换。

在所有这些扰动之后，随机机制将原始交互序列转换为扰动序列/>。这个例子只是随机机制/>可能对交互序列造成的所有可能扰动的一个举例说明，因此，扰动后的交互序列与原始序列有很大的不同；在现实场景中，情况并非如此，随机机制/>扰动交互序列的强度由隐私预算/>控制。

进一步地，所述随机机制满足序列差分隐私的要求。

本发明提出SDP（sequential differential privacy，序列差分隐私），这是一种既保护用户交互序列的ID信息又保护序列信息的新型差分隐私。

具体地，所述的序列差分隐私定义为：对于任意一对相邻序列数据矩阵和/>，和随机机制/>的所有可能的输出情况，若/>成立，则说明随机机制/>满足序列差分隐私的要求；

为隐私预算，是一个提前给定的值，给定了/>值的SDP记为/>-SDP，

若成立，则说明随机机制/>满足序列差分隐私的要求，随机机制/>可以提供/>-SDP（即，随机机制/>是/>-SDP随机机制）。

进一步地，本发明定义了相邻序列数据矩阵的概念，对于所述相邻序列数据矩阵和/>，如果/>是通过修改/>中一个用户交互物品序列的元素而获得，表示为：存在一组，/>，使得/>，则说明两个序列数据矩阵和/>是相邻的。

步骤S300、将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到推荐模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务。

跨域序列推荐系统（cross-domain sequential recommender systems，CDSR），由序列推荐系统与跨域推荐系统（cross-domain recommender systems，CDR）结合得到，不仅有效地利用了用户的长期和短期偏好，而且还从其他域迁移了用户和物品的知识，从而提高了推荐性能。

具体地，将所述扰动序列数据矩阵和所述目标域的数据矩阵通过算法一同输入到跨域序列推荐系统模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务。

需要说明的是，本发明的目标是利用辅助域上的数据提高目标域上的推荐性能，同时保护辅助域的数据隐私；本发明认为一个域内不存在隐私问题，因此，一个域中的所有数据都可以在该域中自由使用，虽然本发明只考虑一个目标域和一个辅助域的情况，但也可以很容易扩展到一个目标域和多个辅助域的情况，只需要对多个辅助域数据分别执行上述步骤即可，在此不再赘述。

进一步需要说明的是，本发明提出的序列差分隐私和随机机制不限于推荐系统场景，只要应用场景同时满足以下三个条件，就可以做简单的替代后使用。

（1）数据是有顺序的，数据可以是各种序列，包括但不限于时间序列。

（2）数据是非数值型数据，非数值型数据是指物品ID、符号等无法做算术运算的量。

（3）一个数据在一条数据序列中只能出现一次，或者原本可以出现多次，但是在应用序列差分隐私和随机机制之前做了去除重复值的操作。

可见，本发明所提出的序列差分隐私（SDP），同时考虑了序列数据的ID信息和序列信息，为序列数据的隐私保护强度提供了一种可量化的指标。

本发明所提出的PriCDSR模型的核心模块是随机机制，它能对辅助域数据添加可控的噪声来达成保护辅助域数据的目的，噪声的强度由隐私预算/>决定；同时，其被证明满足/>-SDP，因此，其对辅助域数据的保护有理论保证；同时，随机机制/>还是一个非侵入式的模型，这意味着无需对目标域现有的模型做任何修改就可以保护辅助域的用户隐私。

本发明提供随机机制满足/>-SDP的证明，如定理1所示。

需要注意的是，满足SDP的随机机制仅应用于辅助域中的数据，因此，本发明将使用辅助域数据作为输入来描述本发明的随机机制/>的细节。

本发明中，辅助域的物品集记为，/>中的元素总数记为/>，辅助域的数据表示为一个集合/>，被扰动后的/>记为/>，除非另有说明。

定理1：

随机机制满足/>-SDP。

证明：

根据对相邻序列数据矩阵的定义，本发明将证明分为情况1和情况2。情况1处理单个元素值不同的相邻序列数据矩阵的情况，情况2则考虑一对元素位置不同的相邻数据矩阵的情况。

情况1：

对于两个相邻的序列数据矩阵和/>以及任意输出/>，/>和/>只相差一个元素，即一个用户物品交互，本发明使用条件概率公式展开/>，如下所示。

，

对于任意，/>和/>显然是相等的。在扰乱/>和/>，/>时，后续元素也可能受到扰动，因为本发明的随机机制/>可能会采样到后续元素，并将其位置与当前元素交换，但是，这是可以接受的，因为除了和/>不相等之外，当前元素后面的所有元素都是一一相等的，交换操作并不会改变这种不等或相等性，因此，

，

对于该等式，考虑以下四种情况。

情况1.1：

如果随机机制对/>和/>采样到的物品ID是/>，即/>，那么随机机制/>会将/>赋值为/>，在此操作之后，后续的元素，即/>和/>，/>，保持不变，并且仍然是一一相等的，因此，/>和/>都是相等的，无论/>，/>取何值，因此，

；

情况1.2：

如果随机机制对/>和/>采样到的物品ID是/>，即/>，那么

；

情况1.3：

如果随机机制对/>和/>采样到的物品ID存在于后续元素中，即，那么随机机制/>会将/>与该采样到的物品ID交换位置，在这个情况下，/>，并且，/>和/>，/>成为两个新的相邻序列数据矩阵，它们只有一个元素不同，即回到情况1。

情况1.4：

如果随机机制对/>和/>采样到的是一个未出现在原始序列中的物品ID，即/>，那么随机机制/>会将/>和/>都赋值为该新物品ID，在这个情况下，/>，并且，和/>，/>不会被改变，依然保持一一相等，因此

；

综上所述，在情况1中，。

情况2：

对于两个相邻的序列数据矩阵和/>以及任意输出/>，/>和/>的差别只是一对元素的位置发生了交换，那么

，

对于，如果随机机制/>交换/>和/>（或者交换/>和/>），那么它就一定会交换/>和/>（或者交换/>和/>）；对于/>和/>之外的其他元素，随机机制/>对这两个相邻数据矩阵的操作则是一致的，因此，对/>和/>，的任意操作不会改变/>和/>，/>中各个元素的不等或等价性，因此，

，

对于该等式，考虑以下四种子情况。

情况2.1：

如果随机机制对/>和/>采样到的物品ID是/>，即/>，那么随机机制/>会交换/>和/>，在此操作之后，后续的元素，即/>和/>，，将变成一一相等的，因此，

；

情况2.2：

如果随机机制对/>和/>采样到的物品ID是/>，即/>，那么随机机制/>会交换/>和/>；在此操作之后，后续的元素也将变成一一相等的，因此，

；

情况2.3：

如果随机机制对/>和/>采样到的物品ID存在于后续元素中，且不是/>，即/>，那么随机机制/>会将/>与该采样到的物品ID交换位置，在这个情况下，/>，并且，/>和，/>成为两个新的相邻序列数据矩阵，它们有一对元素的位置是相反的，即回到情况2。

情况2.4：

如果随机机制对/>和/>采样到的是一个未出现在原始序列中的物品ID，即/>，那么随机机制/>会将/>和/>都赋值为该新物品ID，在这个情况下，/>，并且，/>和/>，/>成为两个新的相邻序列数据矩阵，它们只有一个元素不同，即回到情况1。在情况1中，有/>。因此，

；

综上所述，在情况2中，。

结合情况1和情况2两种情况，有，证毕。

本发明使用来自亚马逊的真实数据，是亚马逊收集的电子商务数据集，包含商品评分和评论等；本发明选择三个子集Movies（亚马逊公开的数据集中的电影相关数据）、Book（亚马逊公开的数据集中的唱片相关数据）和CD（亚马逊公开的数据集中的书籍相关数据）作为实验的三个域；本发明的研究问题假设只有一个目标域和一个辅助域，因此本发明对所有六种可能的（目标域，辅助域）组合进行实验，即Movie←Book， Movie←CD， Book←Movie， Book←CD， CD←Movie和CD←Book，本发明选择了两个常用指标测评模型，即归一化折损累计增益（NDCG@k）和命中率（HR@k）。k表示模型提供的推荐列表的长度。

随机机制作用于数据而不是模型（如图2所示），这意味着实验应该将重点放在数据是否应用随机机制/>上，因此，本发明使用一个CDSR方法，即DASL（一种跨域序列推荐算法）作为基本模型，得到一个基于DASL的PriCDSR（privacy cross-domain sequentialrecommender systems，隐私保护的跨域序列推荐系统）实现，记为PriCDSR-DASL（一个基于跨域序列推荐算法的隐私保护的跨域序列推荐系统）。

需要注意的是，本发明没有模拟如图2所示的两个域之间的数据传输，取而代之的是，使用随机机制在每个组合的辅助数据中加入噪声，得到扰动后的辅助数据；使用扰动的辅助数据的DASL就是PriCDSR-DASL，因此，PriCDSR-DASL的基本模型（即DASL）保持不变，不做任何修改，这个实现细节进一步展示了PriCDSR的非侵入性。

本发明采用去除DE（dual embedding，双重嵌入向量）和DA（dual attention，双重注意力）模块的DASL作为单域序列推荐的基线模型。通过删除DE和DA模块，DASL只能依赖目标域的数据来捕获用户兴趣；本发明不考虑其他单域序列推荐模型作为本发明的基线模型，原因是实验的目的在于评估PriCDSR在多大程度上影响跨域序列推荐模型的准确性，通过将PriCDSR-DASL与从DASL退化而来的DASL-single（单域序列推荐算法）进行比较，可以确定本发明的随机机制引入的噪声是否完全消除了辅助数据带来的性能增益，因此，没有必要与其他单域推荐方法进行比较。

本发明在下表1中报告了实验结果，其中，PriCDSR-DASL的隐私预算固定为10，从中可以得到以下观察结果，其中，HR@5为模型提供的推荐列表的长度为5时的命中率；HR@10为模型提供的推荐列表的长度为10时的命中率；NDCG@5为模型提供的推荐列表的长度为5时的归一化折损累计增益；NDCG@10为模型提供的推荐列表的长度为10时的归一化折损累计增益；Movie←Book表示实验的目标域数据为Movie，辅助域数据为Book；Movie←CD表示实验的目标域数据为Movie，辅助域数据为CD；Book←Movie表示实验的目标域数据为Book，辅助域数据为Movie；Book←CD表示实验的目标域数据为Book，辅助域数据为CD；CD←Movie表示实验的目标域数据为CD，辅助域数据为Movie；CD←Book表示实验的目标域数据为CD，辅助域数据为Book。

（1）与DASL-single相比，DASL在每个数据上都有更好的推荐性能，这可以归因于DE和DA模块，它们有效地利用辅助域的知识来提高目标域的推荐性能。

（2）与DASL-single相比，即使使用了扰动的辅助数据，PriCDSR-DASL仍然具有更好的性能，这表明随机机制仍然可以使得DASL的DE和DA模块使用辅助域的数据来帮助目标域提高推荐性能，同时保护用户的隐私。

（3）根据数据的不同，PriCDSR-DASL的性能可能比DASL更好，也可能更差，具体来说，PriCDSR-DASL在数据Movie←Book、Movie←CD、Book←Movie和Book←CD上的性能比DASL差，但在数据CD←Movie和CD←Book上的性能更好；所观察到的推荐性能的提高或下降可归因于随机机制引入的噪声，一方面，噪声可能会干扰辅助域迁移的知识，从而降低目标域的收益；另一方面，在辅助数据中引入适量的噪声可以增强目标域模型的鲁棒性，从而提高推荐性能。/>

表1 单域序列推荐算法DASL-single、跨域序列推荐算法DASL、隐私保护的跨域序列推荐算法PriCDSR-DASL在各个数据上的性能对比

进一步地，如图5所示，基于上述隐私保护的跨域序列推荐方法，本发明还相应提供了一种隐私保护的跨域序列推荐系统，其中，所述隐私保护的跨域序列推荐系统包括：

数据获取模块51，用于获取用户的数据记录，从所述数据记录中获取辅助域的序列数据矩阵和目标域的数据矩阵；

差分扰动模块52，用于根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；

兴趣推荐模块53，用于将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务。

进一步地，如图6所示，基于上述的隐私保护的跨域序列推荐方法和系统，本发明还相应提供了一种终端，所述终端包括处理器10、存储器20及显示器30。图6仅示出了终端的部分组件，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

所述存储器20在一些实施例中可以是所述终端的内部存储单元，例如终端的硬盘或内存。所述存储器20在另一些实施例中也可以是所述终端的外部存储设备，例如所述终端上配备的插接式硬盘，智能存储卡（Smart Media Card，SMC），安全数字（SecureDigital， SD）卡，闪存卡（Flash Card）等。进一步地，所述存储器20还可以既包括所述终端的内部存储单元也包括外部存储设备。所述存储器20用于存储安装于所述终端的应用软件及各类数据，例如所述安装终端的程序代码等。所述存储器20还可以用于暂时地存储已经输出或者将要输出的数据。在一实施例中，存储器20上存储有隐私保护的跨域序列推荐程序40，该隐私保护的跨域序列推荐程序40可被处理器10所执行，从而实现本申请中隐私保护的跨域序列推荐方法。

所述处理器10在一些实施例中可以是一中央处理器（Central Processing Unit，CPU），微处理器或其他数据处理芯片，用于运行所述存储器20中存储的程序代码或处理数据，例如执行所述隐私保护的跨域序列推荐方法等。

所述显示器30在一些实施例中可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED（Organic Light-Emitting Diode，有机发光二极管）触摸器等。所述显示器30用于显示在所述终端的信息以及用于显示可视化的用户界面。所述终端的部件10-30通过系统总线相互通信。

在一实施例中，当处理器10执行所述存储器20中隐私保护的跨域序列推荐程序40时实现所述的隐私保护的跨域序列推荐方法。

综上所述，本发明提供了一种隐私保护的跨域序列推荐方法及相关设备，所述方法包括：获取辅助域的序列数据矩阵和目标域的数据矩阵；根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵；将所述扰动序列数据矩阵发送到目标域，得到目标域进行跨域序列推荐的全部必要数据矩阵。本发明所提出的序列差分隐私，同时考虑了序列数据的ID信息和序列信息，为序列数据的隐私保护强度提供了一种可量化的指标；设计了一个满足这种差分隐私的随机机制，对辅助域数据添加可控的噪声来达成保护辅助域数据的目的，解决了现有跨域序列推荐过程中的隐私保护问题，对隐私保护的跨域推荐系统无法保护序列信息的问题提供了有效的解决方案。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者终端中还存在另外的相同要素。

当然，本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器（ROM）、可编程ROM（PROM）、电可编程ROM（EPROM）、电可擦除可编程ROM（EEPROM）或闪存。易失性存储器可包括随机存取存储器（RAM）或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM（SRAM）、动态RAM（DRAM）、同步DRAM（SDRAM）、双数据率SDRAM（DDRSDRAM）、增强型SDRAM（ESDRAM）、同步链路（Synchlink）DRAM（SLDRAM）、存储器总线（Rambus）直接RAM（RDRAM）、直接存储器总线动态RAM（DRDRAM）、以及存储器总线动态RAM（RDRAM）等。

应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims

1.一种基于隐私保护的跨域序列推荐方法，其特征在于，所述隐私保护的跨域序列推荐方法包括：

所述从所述数据记录中获取辅助域的序列数据矩阵，具体包括：

只保留一个用户与一个物品之间的第一个交互记录，并删除后续重复的交互记录，得到所述辅助域的序列数据矩阵，其中，/>表示自然数集，/>表示一个集合，集合中的每一个元素都是一个/>的矩阵；

所述根据随机机制对所述序列数据矩阵添加噪声，得到扰动序列数据矩阵，具体包括：

所述使用随机机制进行扰动的过程为：遍历所述序列数据矩阵中的每个元素，在每遍历一个元素时，根据公式/>中定义的概率分布得到的概率分布，根据/>的概率分布进行采样得到/>，判断采样得到的/>是否出现在当前遍历的元素的ID之后的元素ID中，若是，则将两者的元素ID进行交换，否则，将当前遍历的元素的ID替换为/>；

其中，表示辅助域的物品集中的一个元素ID，/>，/>为所述物品集中元素的总数，/>表示在各种情况下/>的值的概率，/>表示在当前遍历的元素之前已经被扰动过后的用户/>交互序列中的元素的ID的集合，/>是指以自然常数e为底的指数函数，为隐私预算，/>为当前遍历的元素的ID，/>表示用户的交互物品序列中当前遍历的元素的序数；

所述随机机制满足序列差分隐私的要求；

所述的序列差分隐私定义为：对于任意一对相邻序列数据矩阵和/>，和随机机制/>的所有可能的输出情况，若/>成立，则说明随机机制/>满足序列差分隐私的要求；

其中，是指输入的矩阵为/>，随机机制/>的输出为A的概率，是指输入的矩阵为/>，随机机制/>的输出为A的概率，A为随机机制/>的所有可能的输出情况，/>为序列数据矩阵，/>为任意与所述序列数据矩阵相邻的序列数据矩阵；

所述相邻序列数据矩阵和/>，如果/>是通过修改/>中一个用户交互物品序列的元素而获得，表示为：存在一组/>，/>，使得，则说明两个序列数据矩阵/>和/>是相邻的；

或如果是通过交换/>中一个用户交互物品序列的任意两个元素的位置而获得，表示为：存在两组/>和/>，/>，使得，则说明两个序列数据矩阵/>和/>是相邻的，其中，/>、/>和/>分别唯一标识所述交互物品序列中的一个元素；

2.根据权利要求1所述的基于隐私保护的跨域序列推荐方法，其特征在于，所述将所述扰动序列数据矩阵和所述目标域的数据矩阵一同输入到推荐模型中进行运算，输出用户的兴趣偏好信息，根据所述兴趣偏好信息为用户提供推荐服务，具体包括：

3.一种基于隐私保护的跨域序列推荐系统，其特征在于，所述隐私保护的跨域序列推荐系统包括：

所述随机机制满足序列差分隐私的要求；

4.一种终端，其特征在于，所述终端包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于隐私保护的跨域序列推荐程序，所述基于隐私保护的跨域序列推荐程序被所述处理器执行时实现如权利要求1-2任一项所述的基于隐私保护的跨域序列推荐方法的步骤。

5.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有基于隐私保护的跨域序列推荐程序，所述基于隐私保护的跨域序列推荐程序被处理器执行时实现如权利要求1-2任一项所述的基于隐私保护的跨域序列推荐方法的步骤。