CN112116436A

CN112116436A - 一种智能推荐方法、装置、计算机设备及可读存储介质

Info

Publication number: CN112116436A
Application number: CN202011094339.4A
Authority: CN
Inventors: 王浩; 刘丹
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-10-14
Filing date: 2020-10-14
Publication date: 2020-12-22
Anticipated expiration: 2040-10-14
Also published as: CN112116436B

Abstract

本发明涉及大数据技术领域，公开了一种智能推荐方法、装置、计算机设备及可读存储介质，包括：获取用户信息，对用户信息进行特征化处理得到用户向量；调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合；调用最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；将目标类别集合对应的关联信息作为推荐信息。本发明提高了用户向量类别识别的精细度和准确度，提升服务器运算效率，提高了用户信息与索引库中参考信息之间匹配速度，并且降低了数据计算量和储存量。

Description

一种智能推荐方法、装置、计算机设备及可读存储介质

技术领域

本发明涉及大数据的数据分析技术领域，尤其涉及一种智能推荐方法、装置、计算机设备及可读存储介质。

背景技术

推荐算法是计算机专业中的一种算法，通过一些数学算法，推测出用户可能喜欢的东西，目前应用推荐算法比较好的地方主要是网络。所谓推荐算法就是利用用户的一些行为，通过一些数学算法，推测出用户可能喜欢的东西。

当前的推荐算法或采用基于标签映射的方式对用户端进行产品推荐，或采用基于贝叶斯方法对用户端进行产品推荐。

但是，发明人意识到，当前的推荐算法在面对少量数据时，可以无压力运行，但一旦面对海量用户数据时，该推荐算法将会因计算复杂，数据量庞大等原因，导致运行缓慢，服务器压力增大，进而导致推荐信息难以快速有效获得。

发明内容

本发明的目的是提供一种智能推荐方法、装置、计算机设备及可读存储介质，用于解决现有技术存在的在面对海量用户数据时，当前的推荐算法将会因计算复杂，数据量庞大等原因，导致运行缓慢，服务器压力增大，进而导致推荐信息难以快速有效获得问题。

为实现上述目的，本发明提供一种智能推荐方法，包括：

获取用户信息，对所述用户信息进行特征化处理得到用户向量；

调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合；

调用最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；其中，所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的，用于反映该参考信息对应子向量的所属类别的数据集合，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息；

将目标类别集合对应的关联信息作为推荐信息。

上述方案中，所述获取用户信息的步骤之前，所述方法还包括：

识别用户端，从数据库中获取与所述用户端对应的用户基本信息，通过埋点采集所述用户端的行为得到对应的用户行为信息，从所述用户端发送的对话文本中提取得到用户对话信息，汇总所述用户基本信息、用户行为信息和用户对话信息得到用户信息并将其保存至预设的用户数据库。

上述方案中，所述调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合的步骤，包括：

执行切分子进程，用以触发乘积量化算法将用户向量切分为预置数量的子向量；

执行量化子进程，用以触发乘积量化算法通过预置的子码书判断各子向量所属的聚类中心，并将该聚类中心对应的类型设为所述子向量的类型；

执行压缩子进程，用以触发乘积量化算法汇总各子向量的类型得到用户类别集合。

上述方案中，所述最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合的步骤，包括：

获取所述索引库中所有参考类别集合的参考索引值并去重得到综合索引值，汇总所述综合索引值得到综合类别集合；

将用户类别集合的用户索引值依次与所述综合类别集合的综合索引值进行一一比对，以得到反映用户索引值和综合索引值一致的相同值，和反映用户索引值和综合索引值不一致的不同值，汇总所述相同值和不同值得到反映用户类别集合与综合类别集合相似度的用户综合索引集合；

将参考类别集合的参考索引值依次与所述综合类别集合的综合索引值进行一一比对，得到反映参考索引值与综合索引值一致的相同值，和反映参考索引值与综合索引值不一致的不同值，汇总所述相同值和不同值得到反映参考类别集合与综合类别集合相似度的参考综合索引集合；

汇总所述用户综合索引集合和参考综合索引集合得到用户参考索引集合；

调用预置的哈希函数对所述用户参考索引集合的行数进行计算，使所述用户参考索引集合的各行分别得到对应的哈希值；

获取具有用户综合索引集合名称及参考综合索引集合名称的初始签名矩阵，依次识别用户参考索引集合中各行元素值为相同值所对应用户综合索引集合和/或参考综合索引集合，及该行所对应的哈希值；将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，以得到目标签名矩阵；

根据所述目标签名矩阵中，参考综合索引集合名称下和用户综合索引集合名称下一致的目标值的数量，计算所述参考综合索引集合与所述用户综合索引集合之间的相似度；

识别超过预置相似度阈值的相似度对应的参考综合索引集合，并将其对应的参考类别集合设为目标类别集合。

上述方案中，所述将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下的步骤，包括：

判断所述初始签名矩阵中所述用户综合索引集合和/或参考综合索引集合对应的名称下是否具有目标值；

若是，则删除所述哈希值；

若否，则调用所述初始签名矩阵，以将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下。

上述方案中，将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，包括：

判断所述初始签名矩阵中所述用户综合索引集合和/或参考综合索引集合对应名称下的目标值，是否小于所述哈希值；

若是，则删除所述哈希值；

上述方案中，所述将目标类别集合对应的关联信息作为推荐信息的步骤之后，所述方法还包括：

将所述推荐信息发送至与所述用户信息对应的用户端；

所述将所述推荐信息发送至与所述用户信息对应的用户端的步骤之后，所述方法还包括：

将所述推荐信息上传至区块链中。

为实现上述目的，本发明还提供一种智能推荐装置，包括：

信息处理模块，用于获取用户信息，对所述用户信息进行特征化处理得到用户向量；

乘积量化模块，用于调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合；

最小哈希模块，用于调用最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；其中，所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的，用于反映该参考信息对应子向量的所属类别的数据集合，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息；

关联推荐模块，用于将目标类别集合对应的关联信息作为推荐信息。

为实现上述目的，本发明还提供一种计算机设备，其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，所述计算机设备的处理器执行所述计算机程序时实现上述智能推荐方法的步骤。

为实现上述目的，本发明还提供一种计算机可读存储介质，所述可读存储介质上存储有计算机程序，所述可读存储介质存储的所述计算机程序被处理器执行时实现上述智能推荐方法的步骤。

本发明提供的一种智能推荐方法、装置、计算机设备及可读存储介质，通过乘积量化进程不仅极大的压缩了用户类别集合的数据量，且，因对经切分的用户向量的子向量的类别进行了确定，提高了用户向量类别识别的精细度和准确度，实现了压缩海量数据，提升服务器运算效率，以及在多维度向量的基础上提升类型识别的准确度的技术效果。

通过最小哈希进程提高了用户类别集合与参考类别集合之间相似度比对的计算速度，进而提高了用户信息与索引库中参考信息之间匹配速度，并且降低了数据计算量和储存量，极大的适用于大数据匹配推荐。

附图说明

图1为本发明智能推荐方法实施例一的流程图；

图2为本发明智能推荐方法实施例二中智能推荐方法的环境应用示意图；

图3是本发明智能推荐方法实施例二中智能推荐方法的具体方法流程图；

图4是本发明智能推荐方法实施例二中智能推荐方法中调用乘积量化进程的具体方法流程图；

图5是本发明智能推荐方法实施例二中智能推荐方法中最小哈希进程的具体方法流程图；

图6是本发明智能推荐方法实施例二中智能推荐方法中将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下的一种方法流程图；

图7是本发明智能推荐方法实施例二中智能推荐方法中将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下的另一种方法流程图；

图8为本发明智能推荐装置实施例三的程序模块示意图；

图9为本发明计算机设备实施例四中计算机设备的硬件结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

现提供以下实施例：

实施例一：

请参阅图1，本实施例的一种智能推荐方法，包括：

S102：获取用户信息，对用户信息进行特征化处理得到用户向量。

S103：调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合；

S104：调用最小哈希进程，将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；其中，所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的，用于反映该参考信息对应子向量的所属类别的数据集合，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息。

S105：将目标类别集合对应的关联信息作为推荐信息。

具体地，从用户数据库中获得用户信息，可通过独热编码或词袋模型对用户信息进行特征化处理，得到以向量形式表达所述用户信息的用户向量。

通过调用乘积量化进程触发乘积量化算法，以对用户向量进行切分得到若干个字向量，并识别各子向量所述类别并汇总得到用户类别集合；由于对子向量的类别进行判定和汇总，不仅极大的压缩了用户类别集合的数据量，且，因对经切分的用户向量的子向量的类别进行了确定，提高了用户向量类别识别的精细度和准确度，实现了压缩海量数据，提升服务器运算效率，以及在多维度向量的基础上提升类型识别的准确度的技术效果。

通过调用最小哈希进程以将所述用户类别集合中，对各子向量的类型进行描述的用户索引值，与预置索引库中各参考类别集合中的参考索引值进行比对，以得到用户类别集合与各参考类别集合之间的相似度，并将相似度最高的参考类别集合作为目标类别集合。如此一来，提高了用户类别集合与参考类别集合之间相似度比对的计算速度，进而提高了用户信息与索引库中参考信息之间匹配速度，并且降低了数据计算量和储存量，极大的适用于大数据匹配推荐。

需要说明的是，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息，因此，将所述参考信息所交易的产品或服务作为参考类别集合对应的关联信息。因此，将被设为目标类别集合的参考类别集合所对应的关联信息，如：产品或服务，作为推荐信息。

实施例二：

本实施例为上述实施例一的一种具体应用场景，通过本实施例，能够更加清楚、具体地阐述本发明所提供的方法。

下面，以在运行有智能推荐方法的服务器中，对将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别并汇总得到用户类别集合，及将所述用户类别集合与预置索引库中各参考类别集合进行比对得到相似度并根据相似度得到目标类别集合，最后将目标类别集合对应的关联信息作为推荐信息为例，来对本实施例提供的方法进行具体说明。需要说明的是，本实施例只是示例性的，并不限制本发明实施例所保护的范围。

图2示意性示出了根据本申请实施例二的智能推荐方法的环境应用示意图。

在示例性的实施例中，智能推荐方法所在的服务器2通过网络3分别连接用户端4；所述服务器2可以通过一个或多个网络3提供服务，网络3可以包括各种网络设备，例如路由器，交换机，多路复用器，集线器，调制解调器，网桥，中继器，防火墙，代理设备和/或等等。网络3可以包括物理链路，例如同轴电缆链路，双绞线电缆链路，光纤链路，它们的组合和/或类似物。网络3可以包括无线链路，例如蜂窝链路，卫星链路，Wi-Fi链路和/或类似物；所述用户端4可为智能手机、平板电脑、笔记本电脑、台式电脑等计算机设备。

图3是本发明一个实施例提供的一种智能推荐方法的具体方法流程图，该方法具体包括步骤S201至S206。

S201：识别用户端，从数据库中获取与所述用户端对应的用户基本信息，通过埋点采集所述用户端的行为得到对应的用户行为信息，从所述用户端发送的对话文本中提取得到用户对话信息，汇总所述用户基本信息、用户行为信息和用户对话信息得到用户信息并将其保存至预设的用户数据库。

本步骤中，通过识别用户端的用户编码，从数据库中获取与所述用户编码对应的用户基本信息，例如：姓名、性别、年龄、住址等，其中，所述数据库是预先设置的，且，用于保存用户基本信息的数据服务器。根据所述用户编码通过埋点对用户端在服务器上的行为进行采集，以得到用户行为信息，例如：点赞、评论、转发等。通过用户端发送至运行有智能推荐方法服务器的对话文本，得到对话信息，例如：用户通过用户端与服务器的客服人员的通话记录文本，或即时通信文本等。

通过得到由用户基本信息、用户行为信息和用户对话信息所构成的用户信息，以实现多维度的获取用户的属性及行为，使用户信息能够更加准确的描述用户的属性特征和行为特征，有助于提高用户评价的准确度。

S202：获取用户信息，对用户信息进行特征化处理得到用户向量。

本步骤中，从用户数据库中获得用户信息，可通过独热编码或词袋模型对用户信息进行特征化处理，得到以向量形式表达所述用户信息的用户向量。

需要说明的是，独热编码和词袋模型是自然语言处理中，对文本信息进行特征化处理的常用工具，因此，关于独热编码和词袋模型的技术原理在本申请中不做赘述。

进一步地，对所述用户信息进行特征化处理得到用户向量之前可包括：

调用自然语言处理的关键字提取模型提取所述用户信息中的关键字；

汇总所述关键字得到新的用户信息。

本步骤通过所述关键字提取模型，保证了对用户信息进行特征化处理所得到用户向量，在准确反映用户信息所表达的内容前提下，极大的降低用户向量的数据量，有助于提高服务器的运行计算速度。

需要说明的是，所述自然语言处理的关键字提取模型一种用于资讯检索于资讯探勘的常用加权技术。其为一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数呈正比地增加，但同时也会随着它在语料库中出现的频率呈反比地下降，于本申请中，所述关键字提取模型可采用TF-IDF、TextRank等。

S203：调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合。

为将大量数据进行计算压缩，以在多维度向量的基础上提升类型识别的准确度，本步骤通过调用乘积量化进程触发乘积量化算法，以对用户向量进行切分得到若干个字向量，并识别各子向量所述类别并汇总得到用户类别集合；由于对子向量的类别进行判定和汇总，不仅极大的压缩了用户类别集合的数据量，且，因对经切分的用户向量的子向量的类别进行了确定，提高了用户向量类别识别的精细度和准确度。

需要说明的是，所述乘积量化算法是一种用于对目标向量进行切分得到切分子向量，并通过计算各切分子向量与其对应维度上的聚类中心的距离，得到各切分子向量所属的聚类中心，并将该聚类中心所对应的类型作为表达所述切分子向量的值，以达到对目标向量进行分类及压缩目的的计算机算法。

在一个优选的实施例中，请参阅图4，所述调用乘积量化进程用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合的步骤，包括：

S31：执行切分子进程，用以触发乘积量化算法将用户向量切分为预置数量的子向量。

例如，所述预置数量为8，则将D维空间切分成8份：即将D维空间切分成8个D/8维的子空间，如下表所示M＝8。

S32：执行量化子进程，用以触发乘积量化算法通过预置的子码书判断各子向量所属的聚类中心，并将该聚类中心对应的类型设为所述子向量的类型。

本步骤中，调用子码书中与所述子向量对应的维度，计算子向量与该维度中各聚类中心之间的欧式距离，将距所述子向量最近的聚类中心设为所述子向量所属的聚类中心，并将该聚类中心所对应的类型设为所述子向量的类型。其中，可采用OpenCV函数计算所述子向量与该维度中各聚类中心之间的欧式距离。

具体地，所述子码书通过以下方式获得：

获取参考信息，其中，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息。

对所述参考信息进行特征化处理得到参考向量，并对所述参考向量进行分片得到参考子向量；

通过聚类算法分别对各所述参考子向量进行聚类运算，以识别各参考子向量对应维度的聚类中心，其中，采用K-MEAN算法作为所述聚类算法。

将包含有参考子项向量对应维度，及该维度聚类中心的数据设为子码书。

S33：执行压缩子进程，用以触发乘积量化算法汇总各子向量的类型得到用户类别集合。

本步骤不仅对子向量进行了定性评价，以保证用户向量的整体评价稳定不变，还极大的压缩了用户向量所要表达信息的数据量，在保证最终运算准确度不变的前提下，极大的降低了服务器的运算负担。

S204：调用最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；其中，所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的，用于反映该参考信息对应子向量的所属类别的数据集合，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息。。

本步骤中，通过调用最小哈希进程运行局部敏感算法，以将所述用户类别集合中，对各子向量的类型进行描述的用户索引值，与预置索引库中各参考类别集合中的参考索引值进行比对，以得到用户类别集合与各参考类别集合之间的相似度，并将相似度最高的参考类别集合作为目标类别集合；其中，本实施例中的所述最小哈希进程采用的局部敏感算法，可扩大相似程度较高的用户类别集合与预置索引库中各参考类别集合之间的相似度，并降低相似程度较低的用户类别集合与预置索引库中各参考类别集合之间的相似度，如此一来，提高了用户类别集合与参考类别集合之间相似度比对的计算速度，进而提高了用户信息与索引库中参考信息之间匹配速度，并且降低了数据计算量和储存量，极大的适用于大数据匹配推荐。

在一个优选的实施例中，请参阅图5，所述最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合的步骤，包括：

S41：获取所述索引库中所有参考类别集合的参考索引值并去重得到综合索引值，汇总所述综合索引值得到综合类别集合。

示例性地，综合类别集合U＝{a,b,c,d,e}，其中，a,b,c,d,e为综合索引值，用户类别集合S1＝{a，d}，其中，a,d为用户索引值；，S2＝{c}，其中，c为参考索引值；S3＝{b，d，e}，其中，b,d,e为参考索引值；S4＝{a，c，d}，其中，a,c,d为参考索引值。

S42：将用户类别集合的用户索引值依次与所述综合类别集合的综合索引值进行一一比对，以得到反映用户索引值和综合索引值一致的相同值，和反映用户索引值和综合索引值不一致的不同值，汇总所述相同值和不同值得到反映用户类别集合与综合类别集合相似度的用户综合索引集合。

本步骤中，若用户索引值和综合索引值一致，则生成值为“1”的相同值；若用户索引值与综合索引值不一致，则生成值为“0”的不同值。

S43：将参考类别集合的参考索引值依次与所述综合类别集合的综合索引值进行一一比对，得到反映参考索引值与综合索引值一致的相同值，和反映参考索引值与综合索引值不一致的不同值；汇总所述相同值和不同值得到反映参考类别集合与综合类别集合相似度的参考综合索引集合。

本步骤中，若参考索引值和综合索引值一致，则生成值为“1”的相同值；若参考索引值与综合索引值不一致，则生成值为“0”的不同值。

S44：汇总所述用户综合索引集合和参考综合索引集合得到用户参考索引集合。

示例性地，用户参考索引集合如下表所示：

可选的，为避免哈希冲突，还可对用户参考索引集合的排序进行调整。

S45：调用预置的哈希函数对所述用户参考索引集合的行数进行计算，使所述用户参考索引集合的各行分别得到对应的哈希值。

示例性地，使用第一哈希函数第一哈希值h1(x)＝x+1mod5，和第二哈希函数第一哈希值h1(x)＝3x+1mod5，其中，x为用户参考索引集合的行数。

通过所述第一哈希函数和第二哈希函数计算所述行数，得到所述用户参考索引集合各行的第一哈希值和第二哈希值，得到用户参考哈希集合并如下表所示(其中，下方表格中的元素被行数替代)：

S46：获取具有用户综合索引集合名称及参考综合索引集合名称的初始签名矩阵，依次识别用户参考索引集合中各行元素值为相同值所对应用户综合索引集合和/或参考综合索引集合，及该行所对应的哈希值；将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，以得到目标签名矩阵。

于本实施例中，获取具有用户综合索引集合名称及参考综合索引集合名称的初始签名矩阵，依次识别用户参考索引集合中各行元素值为相同值所对应用户综合索引集合和/或参考综合索引集合，及该行所对应的第一哈希值和第二哈希值并将其设为第一目标值和第二目标值；将所述第一目标值和第二目标值，加载至所述初始签名矩阵中与所述用户综合索引集合和/或参考综合索引集合对应的名称下，以得到目标签名矩阵。

示例性地，初始签名矩阵全部都由∞构成，并如下表所示(其中，用户综合索引集合名称及参考综合索引集合名称为首行，第一哈希值和第二哈希值名称为首列)：

首先考虑用户参考哈希集合中的第0行。此时，不论是第一哈希值h1(0)还是第二哈希值h2(0)的结果都是1。而只有集合S1和S4在第0行为1，因此签名矩阵中只有这两列的值需要修改。因为1<∞，因此实际上是对S1和S4的对应值进行修改，所以当前签名矩阵的估计结果为：

接下来，我们下移到用户参考哈希集合中的第1行。对于该行，只有S3的值为1，此时其哈希值为第一哈希值h1(1)＝2，第二哈希值h2(1)＝4。因此，SIG(1,3)置为2，SIG(2,3)置为4。因为第一行中其它列的值均为0，所以签名矩阵的相应列的元素保持不变。于是，新的签名矩阵为：

在一个优选的实施例中，请参阅图6，将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，包括：

S46-01：判断所述初始签名矩阵中所述用户综合索引集合和/或参考综合索引集合对应的名称下是否具有目标值；

S46-02：若是，则删除所述哈希值。

S46-03：若否，则调用所述初始签名矩阵，以将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下。

示例性地，用户参考哈希集合第2行中只有S2和S4对应的列的值为1，且其哈希值第一哈希值h1(2)＝3，第二哈希值h2(2)＝2,。S4对应的标签名本应修改，但是签名矩阵中对应列值为[1,1]，因此其签名最后不会修改。而S2对应的列中仍然是初始值∞，我们将其修改为[3,2]，得到如下表：

在一个优选的实施例中，请参阅图7，将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，包括：

S46-11：判断所述初始签名矩阵中所述用户综合索引集合和/或参考综合索引集合对应名称下的目标值，是否小于所述哈希值；

S46-12：若是，则删除所述哈希值。

S46-13：若否，则调用所述初始签名矩阵，以将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下。

示例性地，基于上述举例，再接下来处理用户参考哈希集合中的第3行。此时只有S2对应的列的值不为1。而哈希值第一哈希值h1(3)＝4，第二哈希值h2(3)＝0。第一哈希值h1的结果已经超过了矩阵中所有列上的已有值，因此不需要修改签名矩阵的第一列的任一值。然而，第二哈希值h2的值为0小于矩阵元素，因此将SIG(2,1)、SIG(2,3)及SIG(2,4)减小为0。需要注意的是，由于用户参考哈希集合中S2列在当前行的取值已经为0，因此SIG(2,2)不可能再减小。于是，此时得到的签名矩阵为：

最后考虑用户参考哈希集合中的第4行，此时第一哈希值h1(4)＝0，第二哈希值h2(4)＝3。由于第4行只在S3列取值为1，我们仅仅比较S3的当前值[2,0]与哈希值[0,3]即可。由于0<2，因此将SIG(1,3)改为0，而同时由于3>0，因此SIG(2,3)保持不变。最终得到的目标签名矩阵为：

S47：根据所述目标签名矩阵中，参考综合索引集合名称下和用户综合索引集合名称下一致的目标值的数量，计算所述参考综合索引集合与所述用户综合索引集合之间的相似度。

本步骤中，将所述用户综合索引集合名称下的目标值与参考综合索引集合名称下的目标值一一对比，计算值为一致的目标值数量与目标值类型数量的比值，并将该比值作为所述相似度。

示例性地，基于上述签名矩阵，可以估计原始集合之间的Jaccard相似度。注意到在签名矩阵中S1和S4对应的列向量完全相同，因此我们将得到相似度SIM(S1，S4)＝1.0。

S48：识别超过预置相似度阈值的相似度对应的参考综合索引集合，并将其对应的参考类别集合设为目标类别集合。

示例性地，假设相似度阈值为0.95，基于上述方案得到相似度SIM(S1，S4)＝1.0，相似度SIM(S1，S2)＝0，相似度SIM(S1，S3)＝0.5，因此，将S4设为目标类别集合。

相比于上述用户参考索引集合中进行复杂计算得到：SIM’(S1，S4)＝0.8，相似度SIM’(S1，S2)＝0.4，相似度SIM’(S1，S3)＝0.4，这种区分度较低的相似度来说，本申请通过哈希函数扩大了相似程度较高的用户类别集合与预置索引库中各参考类别集合之间的相似度，并降低了相似程度较低的用户类别集合与预置索引库中各参考类别集合之间的相似度，以便于直接得到与用户类别集合最为相似的目标类别集合，如此一来，提高了用户类别集合与参考类别集合之间相似度比对的计算速度，进而提高了用户信息与索引库中参考信息之间匹配速度，并且降低了数据计算量和储存，进而无需对用户参考索引集合中各索引值进行大量运算和比较，提高了服务器运行效率，进而提高了推荐信息的获取效率。

S205：将目标类别集合对应的关联信息作为推荐信息。

其中，因所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息，因此，于本实施例中，将所述参考信息所交易的产品或服务作为参考类别集合对应的关联信息。

本步骤中，将被设为目标类别集合的参考类别集合所对应的关联信息，如：产品或服务，作为推荐信息。

S206：将所述推荐信息发送至与所述用户信息对应的用户端。

本步骤中，获取所述用户信息的用户编码，将所述推荐信息发送至与所述用户编码对应的用户端上，以保证推荐信息发送的准确度。

进一步地，将所述推荐信息发送至与所述用户信息对应的用户端之后，包括：

将所述推荐信息上传至区块链中。

需要说明的是，基于推荐信息得到对应的摘要信息，具体来说，摘要信息由推荐信息进行散列处理得到，比如利用sha256s算法处理得到。将摘要信息上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得该摘要信息，以便查证推荐信息是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

实施例三：

请参阅图8，本实施例的一种智能推荐装置1，包括：

信息处理模块12，用于获取用户信息，对所述用户信息进行特征化处理得到用户向量；

乘积量化模块13，用于调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合；

最小哈希模块14，用于调用最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合；其中，所述参考类别集合是预先对预置参考信息进行特征化处理及调用乘积量化进程所获得的，用于反映该参考信息对应子向量的所属类别的数据集合，所述参考信息是指历史上已完成交易用户的用户基本信息、用户行为信息和用户对话信息得到用户信息；

关联推荐模块15，用于将目标类别集合对应的关联信息作为推荐信息。

可选的，所述智能推荐装置1还包括：

信息采集模块11，用于识别用户端，从数据库中获取与所述用户端对应的用户基本信息，通过埋点采集所述用户端的行为得到对应的用户行为信息，从所述用户端发送的对话文本中提取得到用户对话信息，汇总所述用户基本信息、用户行为信息和用户对话信息得到用户信息并将其保存至预设的用户数据库。

可选的，所述智能推荐装置1还包括：

输出模块16，用于将所述推荐信息发送至与所述用户信息对应的用户端。

本技术方案应用于大数据的数据分析领域，通过对用户信息进行特征化处理得到用户向量，并将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别并汇总得到用户类别集合；再将所述用户类别集合与预置索引库中各参考类别集合进行比对得到相似度，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合，最后将目标类别集合对应的关联信息作为推荐信息，以构建基于索引库的关系网络分析技术的智能推荐模型。

实施例四：

为实现上述目的，本发明还提供一种计算机设备5，实施例三的智能推荐装置1的组成部分可分散于不同的计算机设备中，计算机设备5可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个应用服务器所组成的服务器集群)等。本实施例的计算机设备至少包括但不限于：可通过系统总线相互通信连接的存储器51、处理器52，如图9所示。需要指出的是，图9仅示出了具有组件-的计算机设备，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器51(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器51可以是计算机设备的内部存储单元，例如该计算机设备的硬盘或内存。在另一些实施例中，存储器51也可以是计算机设备的外部存储设备，例如该计算机设备上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，存储器51还可以既包括计算机设备的内部存储单元也包括其外部存储设备。本实施例中，存储器51通常用于存储安装于计算机设备的操作系统和各类应用软件，例如实施例三的智能推荐装置的程序代码等。此外，存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器52在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制计算机设备的总体操作。本实施例中，处理器52用于运行存储器51中存储的程序代码或者处理数据，例如运行智能推荐装置，以实现实施例一和实施例二的智能推荐方法。

实施例五：

为实现上述目的，本发明还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器52执行时实现相应功能。本实施例的计算机可读存储介质用于存储智能推荐装置，被处理器52执行时实现实施例一和实施例二的智能推荐方法。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种智能推荐方法，其特征在于，包括：

将目标类别集合对应的关联信息作为推荐信息。

2.根据权利要求1所述的智能推荐方法，其特征在于，所述获取用户信息的步骤之前，所述方法还包括：

3.根据权利要求1所述的智能推荐方法，其特征在于，所述调用乘积量化进程，用以将所述用户向量进行切分得到若干个子向量，及识别各子向量的所属类别、并汇总所述所属类别得到用户类别集合的步骤，包括：

4.根据权利要求1所述的智能推荐方法，其特征在于，所述最小哈希进程，用以将所述用户类别集合与预置索引库中各参考类别集合进行相似度比对，并将相似度超过预置相似度阈值的参考类别集合设为目标类别集合的步骤，包括：

5.根据权利要求4所述的智能推荐方法，其特征在于，所述将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下的步骤，包括：

若是，则删除所述哈希值；

6.根据权利要求4所述的智能推荐方法，其特征在于，将所述哈希值设为目标值并将其加载至所述初始签名矩阵中，与所述用户综合索引集合和/或参考综合索引集合对应的名称下，包括：

若是，则删除所述哈希值；

7.根据权利要求1所述的智能推荐方法，其特征在于，所述将目标类别集合对应的关联信息作为推荐信息的步骤之后，所述方法还包括：

将所述推荐信息发送至与所述用户信息对应的用户端；

将所述推荐信息上传至区块链中。

8.一种智能推荐装置，其特征在于，包括：

9.一种计算机设备，其包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述计算机设备的处理器执行所述计算机程序时实现权利要求1至7任一项所述智能推荐方法的步骤。

10.一种计算机可读存储介质，所述可读存储介质上存储有计算机程序，其特征在于，所述可读存储介质存储的所述计算机程序被处理器执行时实现权利要求1至7任一项所述智能推荐方法的步骤。