CN108874813A

CN108874813A - 一种信息处理方法、装置及存储介质

Info

Publication number: CN108874813A
Application number: CN201710326716.4A
Authority: CN
Inventors: 庄凯; 胡博; 何翔; 郭卫敏; 王聪
Original assignee: Tencent Technology Beijing Co Ltd
Current assignee: Tencent Technology Beijing Co Ltd
Priority date: 2017-05-10
Filing date: 2017-05-10
Publication date: 2018-11-23
Anticipated expiration: 2037-05-10
Also published as: CN108874813B

Abstract

本发明公开了一种信息处理方法，包括：对在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述信息对应分配的向量；计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息；根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引；查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息。本发明还同时公开了一种信息处理装置、以及存储介质。

Description

一种信息处理方法、装置及存储介质

技术领域

本发明涉及通信领域中的信息推广技术，尤其涉及一种信息处理方法、装置及存储介质。

背景技术

随着信息技术的发展，用户可方便快捷地接触到大量信息。在互联网网站中，为了有针对性地向用户提供所需要或感兴趣的信息，进而出现了用于向用户推荐相关信息的系统。

目前信息推荐的技术方案主要存在两大问题：

1、根据热度、质量等方面的固定排序并推荐信息的方案，由于排序方式单一，因此难以满足所有人喜好，也难以捕获到用户对未知/未关注领域的信息的偏好，因此，容易出现向用户推荐的信息涉及领域单一且重复推荐的问题，这样会使得信息推荐效果下降。

2、信息分发不充分。在实际推荐场景下，用户在一段时间内浏览信息的数量有限，而根据热度、质量等方面的固定排序会使排序较后的信息推荐给用户的几率降低，而其中往往会有用户感兴趣的信息，一方面导致信息分发的覆盖面受限，另一方面也导致推荐效果较差。

对于如何保证信息推荐精度的同时提高信息全面分发的几率，相关技术尚无有效解决方案。

发明内容

有鉴于此，本发明实施例期望提供一种信息处理方法、装置及存储介质，能够保证信息推荐精度的同时提高信息全面分发的几率。

为达到上述目的，本发明实施例的技术方案是这样实现的：

本发明实施例提供一种信息处理方法，包括：

对在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；

以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述信息对应分配的向量；

计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息；

根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引；

查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息。

本发明实施例提供一种信息处理装置，包括：

获取单元，用于对在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；还用于以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述信息对应分配的向量；

计算单元，用于计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息；还用于根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度；

形成单元，用于根据计算的所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引；

查询单元，用于查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息。

本发明实施例提供一种存储介质，存储有可执行程序，所述可执行程序被处理器执行时实现前述方法所述步骤。

本发明实施例还提供一种信息处理装置，包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序，所述处理器运行所述可执行程序时实现前述方法所述步骤。

本发明实施例所提供的信息处理方法、装置及存储介质，根据采样周期内被操作的信息在一个或多个方面具有关联/相似的特性，为信息分配对应的向量，而使得向量之间的距离具有与信息之间的相似程度关联的特性；

一方面，对于任意的目标信息而言，通过目标信息的相似度与不同候选信息的相似度的比较，可以轻易地确定与目标信息最为相似的信息，由于采用机器学习的方式能够得到信息的精确向量表达，因此基于向量所形成的相似度必然可以精确表示信息的相似程度，确保了确定推荐信息的精度；

另一方面，对于候选信息而言，只要与目标信息的相似程度足够接近，就能够克服相关技术对信息固定排序使用的热度、质量等维度的限制而被确定为推荐信息，保证了确定的推荐信息在全部信息中的覆盖率，进而能够确保信息全面分发的几率。

附图说明

图1为本发明实施例提供的信息处理方法的流程示意图；

图2为本发明实施例提供的一种信息处理方法的具体实现流程示意图；

图3为本发明实施例提供的CBOW模型的网络结构示意图；

图4为本发明实施例提供的另一种信息处理方法的具体实现流程示意图；

图5为本发明实施例提供的信息处理装置的一个可选的架构示意图；

图6为本发明实施例提供的另一种信息处理方法的具体实现流程示意图；

图7为本发明实施例提供的信息处理装置的组成结构示意图；

图8为本发明实施例提供的信息处理装置的硬件结构示意图。

具体实施方式

以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所提供的实施例仅仅用以解释本发明，并不用于限定本发明。另外，以下所提供的实施例是用于实施本发明的部分实施例，而非提供实施本发明的全部实施例，在不冲突的情况下，本发明实施例记载的技术方案可以任意组合的方式实施。

如图1所示，本发明实施例中信息处理方法的实现流程，包括以下步骤：

步骤101：对在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；

这里，所述被操作的信息包括以下至少之一：广告、文章、视频、音频；其中所述操作包括以下至少之一：点击、转发、浏览。

这里，所述采样周期针对的是全量用户中的任意一个用户对信息产生操作行为的近期一段时间，相应的，所述操作序列是指一个用户的操作序列。

需要强调的是，若某用户在近期一段时间内操作的信息的数量很多，则此时得到的对应的操作序列长度会很长，为避免因操作序列过长而影响处理速度，可以将近期一段时间划分为若干个采样周期，对该用户在各采样周期内操作的信息的集合按照操作的先后时间顺序进行排序，从而得到每个采样周期对应的操作序列。

步骤102：以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述信息对应分配的向量；

本步骤具体包括：提取所述操作序列中各所述信息的特征；

利用所述样本及对应的特征对所述机器学习模型进行训练，得到训练后的所述机器学习模型针对不同所述信息映射的K维向量，其中K为大于等于2的整数。

这里，以所述操作序列作为训练样本，训练机器学习中的机器学习模型，其训练的目的是为了根据所述操作序列中各所述信息具有的不同特征，给各所述信息都分配一个对应的向量。另外，以所述操作序列作为样本训练机器学习模型，避免了遍历查询全量样本所带来的耗时长、操作繁琐的问题，能够实现对信息的快速定位。

步骤103：计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息；

这里，所述待索引信息为一个操作序列中的任一信息；所述参考信息，既可以为所述待索引信息所在操作序列中除所述待索引信息之外的其他信息，也可以为除所述待索引信息所在操作序列之外的其他任一操作序列中的所有信息，在此不做限定。可选地，所述参考信息是根据待索引信息的不同而对应改变的。

这里，可采用各种已有的或新的距离计算方法，计算待索引信息的向量与参考信息的向量之间的距离，这里不做具体限定；其中，所述距离可以用欧式距离来表示，也可以用余弦距离来表示，在此也不做限定。

需要说明的是，之所以计算两个向量的距离，是因为任意两个信息的向量之间的距离，表示所述两个信息之间的相似度。

步骤104：根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引；

其中，所述负相关关系是指，任意两个向量之间的距离越小，则表示所述任意两个向量对应的信息之间的相似度越高。也就是说，所述待索引信息的向量与参考信息的向量之间的距离越小，则表示所述待索引信息与所述参考信息之间的相似度越高。

这里，所述形成所述待索引信息对应的相似度索引，包括以下两种不同的方式：

第一种方式：对所述待索引信息与所述参考信息之间的相似度进行降序的排列，基于排序结果形成所述待索引信息与所述参考信息之间的相似度索引；

第二种方式：当所述参考信息属于不同的类别时，在各所述类别中，对所述待索引信息与相应类别中所述参考信息之间的相似度进行降序的排列，基于排列结果形成所述待索引信息与各所述类别一一对应的相似度子索引。

具体来说，对于上述第一种方式，并未考虑待索引信息与参考信息的类别，而是直接根据待索引信息的向量与参考信息的向量之间的距离，计算待索引信息与所有参考信息对应的相似度，并对所述待索引信息与参考信息之间的所有相似度进行统一的降序排列，从而基于排列结果形成所述待索引信息与所述参考信息之间的相似度索引。

对于上述第二种方式，考虑了待索引信息与参考信息的类别，假设待索引信息属于某一类别，而参考信息所属的类别与待索引信息所属的类别不同时，先根据待索引信息与参考信息所属的类别不同，对待索引信息与参考信息进行分类，得到不同类别的信息；然后，根据待索引信息的向量与各所述类别中的参考信息的向量之间的距离，计算待索引信息与相应类别中的所述参考信息之间的相似度，并对所述待索引信息与每个类别中的参考信息之间的所有相似度进行降序的排列，这样基于排列结果就形成了所述待索引信息与各所述类别一一对应的相似度子索引。

这里，所述相似度子索引是由每个类别中的参考信息与待索引信息之间形成的相似度索引。进一步来说，形成的相似度子索引的数量与参考信息属于类别的个数相关，也就是说，统计参考信息属于哪几个分类，即统计出的参考信息所属类别的个数，就等于形成的相似度子索引的数量。

步骤105：查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息。

这里，在本步骤中当查询目标信息对应的相似度索引之前，所述方法还包括：检测用户操作并检测到所述用户操作的目标信息；

在本步骤中当将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息之后，所述方法还包括：将所述候选的推荐信息发送至所述用户。

这里，当确定所述候选的推荐信息后，除了本发明实施例中的将所述候选的推荐信息发送至所述用户之外，还可以仅基于确定的候选的推荐信息进行后台分析，比较目标信息与参考信息之间的相似度大小，查询到与目标信息的相似度最高的候选的推荐信息。

这里，所述查询目标信息对应的相似度索引，包括以下两种不同的方式：

第一种方式：对不同类别中所述信息被操作的频繁程度进行顺序的排列，选定频繁程度最低的预定数量的目标类别；

查询所述目标信息的相应目标类别的相似度子索引，得到所述目标类别中与所述目标信息的相似度最高的预定数量的信息；

第二种方式：根据所述目标信息所属的类别，查询与所属的类别属于相同类别或不同类别的相似度子索引，得到相应类别的相似度子索引中与所述目标信息相似度最高的预定数量的信息。

需要说明的是，这里的频繁程度是针对全量用户或全量用户中的任一用户在最近一段时间如多个采样周期内对信息的操作进行统计；所述被操作的频繁程度最低的信息，表示该信息是最冷门的信息，或者说是用户不操作或很少操作的信息；所述顺序的排列包括升序的排列和降序的排列。

对于查询与所述目标信息属于相同类别的相似度子索引，实现了根据用户的浏览历史，对同一分类中与目标信息相似度最接近的信息的精准推送；对于查询与所述目标信息属于不同类别的相似度子索引，则实现了对于用户未关注的类别、但是符合用户偏好信息的精准推送，提升了信息推送的覆盖广度。

这里，所述方法还包括：满足以下条件至少之一时，基于所述信息更新的向量，更新所述待索引信息对应的相似度索引：

在采样周期内采样形成的所述操作序列中具有未分配有向量的新信息；

对应同一用户的不同采样周期的操作序列发生变化。

这里，所述信息更新的向量可以是部分更新的向量，也可以是全部更新的向量；所述对应同一用户的不同采样周期的操作序列发生变化包括：对应同一用户在不同采样周期的操作序列部分不同或者全部不同，其中，所述发生变化可以是指操作序列发生变化的数量超出一定数值或者比例等。

举例来说，如果技术人员在采样周期如每天的8点到22点内通过训练机器学习模型给采样形成的所述操作序列中被操作的各所述信息分配对应的向量，而不可避免一些用户在每天的除8点到22点范围之外的其余时间段内浏览了一些信息(将这些信息称为增量信息或新信息)，此时技术人员来不及给这些信息分配对应的向量，因此，在给这些信息分配了对应的向量之后，相应的，就需要更新所述待索引信息对应的相似度索引，以便从更新后的相似度索引中查询到与目标信息的相似度最高的信息。

下面以新闻资讯类系统中的文章为例，结合具体应用场景对本发明实施例信息处理方法的具体实现过程做进一步地详细说明。

应用场景一：假设用户1在最近一段时间内按照时间顺序先后浏览了文章1、文章2、文章3；用户2在该最近一段时间内按照时间顺序先后浏览了文章1、文章2、文章4，采用唯一标识ID来区分不同的文章，则用户1对应序列1：(文章ID1，文章ID2，文章ID3)，用户2对应序列2：(文章ID1，文章ID2，文章ID4)。

图2给出了本发明实施例信息处理方法的一种具体实现流程示意图，如图2所示，包括以下步骤：

步骤201：以序列1、序列2为样本训练机器学习模型，给各篇文章分别分配一个对应的向量；

这里，先提取序列1、序列2中各篇文章的特征信息；然后，以序列1、序列2作为训练样本，利用该训练样本及各篇文章对应的特征信息，训练机器学习模型，得到针对不同文章映射的K维向量，其中K为大于等于2的整数。

需要说明的是，相比于现有的基于文章中的词及词之间的先后顺序构建样本进行向量的学习，本发明实施例基于用户在采样周期内对文章浏览的时间顺序进行排列所得到的对应操作序列构建样本，以便基于该样本对各文章进行向量的学习，从而使得形成文章的向量表示更加精确，这是由于文章中涉及短语的数量往往较多，且一篇文章内涉及的词语较多，若采用现有技术中的以文章中的词及词之间的先后顺序构建样本，会导致词向量之间的距离具有较大的随机性；同时，基于文章中的词向量的融合得到文章向量，会出现各文章对应的向量都比较接近的情况，这就无法形成文章的精确向量表示。

假设将每篇文章映射成的向量的维度为3，例如，将文章ID1映射成的向量为(0.9，0.9，0.9)，将文章ID2映射成的向量为(0.3，0.2，0.1)，将文章ID3映射成的向量为(0.5，0.5，0.4)，将文章ID4映射成的向量为(0.5，0.4，0.4)。

示例性地，这里使用机器学习方法训练连续包-词模型(CBOW，Continuous Bag-of-Words Model)，使得训练后的CBOW模型具有对文章分配向量的性能。当然，也可以使用机器学习方法训练skip-gram模型，使得训练后的skip-gram模型具有对文章分配向量的性能，这里不做限定。

以训练CBOW模型举例，建立一个如图3所示的CBOW模型，用于在已知当前文章w_t的上下文w_t-2、w_t-1、w_t+1、w_t+2的前提下，来预测当前文章w_t。图3给出了CBOW模型的网络结构，如图3所示，该CBOW模型包括三层：输入层、投影层、输出层。下面以样本(Context(w)，w)为例(这里假设Context(w)由w前后各c个文章构成)，对这三个层做简要说明。

1、输入层：包含Context(w)中2c个文章的文章向量v(Context(w)₁)，v(Context(w)₂)，…….，v(Context(w)_2c)∈R^m。这里，m的含义同上表示文章向量的长度。

2、投影层：将输入层的2c个向量做求和累加，即

3、输出层：该层对应一棵二叉树，它是以语料中出现过的文章当叶子结点，以各文章在语料中出现的次数当权值来构造哈夫曼(Huffman)树。在这棵Huffman树中，叶子结点共N(＝|D|)个，分别对应词典D中的文章，非叶子结点N-1个(图3中带有斜线的结点)。

CBOW模型的输入层输入的训练样本的特征(如被操作的文章的类型、被操作的文章的组成部分等)为衍生出来的变量，在CBOW模型的投影层对变量与操作场景之间的映射关系进行学习，从而具有在神经网络输出层输出基于操作事件对文章分配向量的性能。在神经网络训练完成后，通过在神经网络输入所监听到的操作事件，可以得到所述机器学习给各篇文章对应分配的向量。

步骤202：计算每一篇文章的向量与其他几篇文章的向量之间的距离；

为方便计算和描述，这里将计算的距离以欧式距离为例进行说明。

其中，用d12表示文章ID1的向量与文章ID2的向量之间的距离，用d13表示文章ID1的向量与文章ID3的向量之间的距离，用d14表示文章ID1的向量与文章ID4的向量之间的距离，用d23表示文章ID2的向量与文章ID3的向量之间的距离，用d24表示文章ID2的向量与文章ID4的向量之间的距离，用d34表示文章ID3的向量与文章ID4的向量之间的距离。通过计算得到：d12≈1.2207，d13≈0.7550，d14≈0.8124，d23≈0.4690，d24≈0.4123，d34＝0.1。

步骤203：根据距离与相似度之间的关系，计算每一篇文章与其他几篇文章之间的相似度，并对所述相似度进行降序的排序，基于排序结果形成每一篇文章对应的相似度索引；

这里，所述距离与相似度之间是负相关关系，也就是说，任意两个向量之间的距离越小，则表示所述任意两个向量对应的文章之间的相似度越高。取任意两个向量之间的距离的倒数，作为所述任意两个向量对应的文章之间的相似度，并对每一篇文章与其他几篇文章之间的相似度进行降序的排列，相应的，则可以得到如表1所示的文章ID1对应的相似度索引：

文章ID	相似度值
		ID3	1/0.7550
ID4	1/0.8124
		ID2	1/1.2207

表1

如表2所示的文章ID2对应的相似度索引：

文章ID	相似度值
		ID4	1/0.4123
ID3	1/0.4690
		ID1	1/1.2207

表2

如表3所示的文章ID3对应的相似度索引：

表3

如表4所示的文章ID4对应的相似度索引：

文章ID	相似度值
		ID3	1/0.1
ID2	1/0.4123
		ID1	1/0.8124

表4

步骤204：若检测到用户3浏览了文章ID3，查询文章ID3对应的相似度索引，将与文章ID3的相似度最高的文章推送给用户3。

这里，检测到用户3浏览了文章ID3，为查找与文章ID3的相似度最高的文章，并将查找到的文章推荐给用户3，则可以查询与文章ID3对应的相似度索引，即查表3，由于表3中已经对文章ID3与文章ID1、ID2、ID4之间的相似度进行降序的排列，很显然，表3中的相似度值1/0.1是最大的；也就是说，文章ID4是与文章ID3的相似度最高的文章，因此，此时优先将文章ID4推送给用户3，确保了信息的推荐精度。

多样性是推荐系统评价体系中最重要的指标之一，例如：对于新闻资讯类的推荐系统，通常会对文章进行分类，从分类维度的角度来评估推荐的多样性。目前，相关技术中在拓展用户未知兴趣分类内容时，主要采用的推荐方式为：根据用户的历史浏览信息数据分析用户的兴趣爱好，并根据用户的兴趣爱好，将与用户兴趣爱好对应或相似的信息推荐给用户。其中，推荐策略利用的是对与用户兴趣爱好对应或相似的信息进行排序，即根据各信息的热度、质量等方面进行非个性化排序，从而根据排序结果选择向用户推荐的信息。然而，该相关技术对于用户未知/未关注领域的信息而言，无法进行有效的推荐，不能满足用户的个性化需求。

应用场景二：假设用户1在最近一段时间内按照时间顺序先后浏览了文章1、文章2、文章3、文章4、文章5、文章7、文章8；用户2在该最近一段时间内按照时间顺序先后浏览了文章1、文章2、文章4、文章5、文章6、文章9，采用唯一标识ID来区分不同的文章，则用户1对应序列1：(文章ID1，文章ID2，文章ID3，文章ID4，文章ID5，文章ID7，文章ID8)，用户2对应序列2：(文章ID1，文章ID2，文章ID4，文章ID5，文章ID6，文章ID9)。

图4给出了本发明实施例信息处理方法的另一种具体实现流程示意图，如图4所示，包括以下步骤：

步骤401：以序列1、序列2为样本训练机器学习模型，给各篇文章分别分配一个对应的向量；

假设将每篇文章映射成的向量的维度为3，例如，将文章ID1映射成的向量为(0.9，0.9，0.9)，将文章ID2映射成的向量为(0.3，0.2，0.1)，将文章ID3映射成的向量为(0.5，0.5，0.4)，将文章ID4映射成的向量为(0.5，0.4，0.4)，将文章ID5映射成的向量为(0.8，0.6，0.4)，将文章ID6映射成的向量为(0.6，0.5，0.4)，将文章ID7映射成的向量为(0.9，0.7，0.4)，ID8映射成的向量为(0.4，0.3，0.1)，ID9映射成的向量为(0.4，0.2，0.1)。

这里，采用与上述实施例同样的方法，使用机器学习方法训练CBOW模型，得到所述机器学习给各篇文章对应分配的向量，这里不再具体介绍。

步骤402：计算每一篇文章的向量与其他几篇文章的向量之间的距离；

其中，用d12、d13、d14、d15、d16、d17、d18、d19分别表示文章ID1的向量与文章ID2、文章ID3、文章ID4、文章ID5、文章ID6、文章ID7、文章ID8、文章ID9的向量之间的距离，用d23、d24、d25、d26、d27、d28、d29分别表示文章ID2的向量与文章ID3、文章ID4、文章ID5、文章ID6、文章ID7、文章ID8、文章ID9的向量之间的距离，用d34、d35、d36、d37、d38、d39分别表示文章ID3的向量与文章ID4、文章ID5、文章ID6、文章ID7、文章ID8、文章ID9的向量之间的距离，用d45、d46、d47、d48、d49分别表示文章ID4的向量与文章ID5、文章ID6、文章ID7、文章ID8、文章ID9的向量之间的距离，用d56、d57、d58、d59表示文章ID5的向量与文章ID6、文章ID7、文章ID8、文章ID9的向量之间的距离，用d67、d68、d69表示文章ID6的向量与文章ID7、文章ID8、文章ID9的向量之间的距离，用d78、d79表示文章ID7的向量与文章ID8、文章ID9的向量之间的距离，用d89表示文章ID8的向量与文章ID9的向量之间的距离。

通过计算得到：d12≈1.2207，d13≈0.7550，d14≈0.8124，d15≈0.5916，d16≈0.7071，d17≈0.5385，d18≈1.1180，d19≈1.1747，d23≈0.4690，d24≈0.4123，d25≈0.7071，d26≈0.5196，d27≈0.8367，d28≈0.1414，d29＝0.1，d34＝0.1，d35≈0.3162，d36＝0.1，d37≈0.4472，d38≈0.3742，d39≈0.4359，d45≈0.3606，d46≈0.1414，d47≈0.5196，d48≈0.3317，d49≈0.3742，d56≈0.2236，d57≈0.1414，d58≈0.5831，d59≈0.6403，d67≈0.3606，d68≈0.4123，d69≈0.4690，d78≈0.7071，d79≈0.7681，d89＝0.1。

步骤403：对各篇文章进行分类，得到不同类别的文章；

这里，根据文章所属类别的不同，假设将上述各篇文章分为以下三类：娱乐类、体育类、新闻类；其中，娱乐类文章包括：文章ID3、文章ID4、文章ID6；体育类文章包括：文章ID1、文章ID5、文章ID7；新闻类文章包括：文章ID2、文章ID8、文章ID9。

需要说明的是，也可以先执行步骤403，再执行步骤402，这里对步骤402和403的顺序不做限定。

步骤404：根据距离与相似度之间的关系，计算任一类别中的每篇文章与所属类别剩余文章、以及其他类别中的所有文章之间的相似度，并对所述相似度进行降序的排序，基于排列结果形成该类别中的每篇文章与各所述类别一一对应的相似度子索引；

这里，所述距离与相似度之间是负相关关系，也就是说，任意两个向量之间的距离越小，则表示所述任意两个向量对应的文章之间的相似度越高。取任意两个向量之间的距离的倒数，作为所述任意两个向量对应的文章之间的相似度，并对每一篇文章与所属类别剩余文章、以及其他类别中的所有文章之间的相似度进行降序的排列，以娱乐类中的文章为例，相应的，则可以得到如表5所示的文章ID1与娱乐类中剩余文章对应的相似度子索引1：

文章ID	相似度值
		ID7	1/0.5385
ID5	1/0.5916

表5

如表6所示的文章ID1与体育类中所有文章对应的相似度子索引2：

文章ID	相似度值
		ID4	1/0.8124
ID9	1/1.1747
		ID2	1/1.2207

表6

如表7所示的文章ID1与新闻类中所有文章对应的相似度子索引3：

文章ID	相似度值
		ID3	1/0.7550
ID4	1/0.8124
		ID8	1/1.1180

表7

如表8所示的文章ID5与娱乐类中剩余文章对应的相似度子索引4：

文章ID	相似度值
		ID7	1/0.1414
ID1	1/0.5916

表8

如表9所示的文章ID5与体育类中所有文章对应的相似度子索引5：

文章ID	相似度值
		ID4	1/0.3606
ID9	1/0.6403
		ID2	1/0.7071

表9

如表10所示的文章ID5与新闻类中所有文章对应的相似度子索引6：

文章ID	相似度值
		ID3	1/0.3162
ID4	1/0.3606
		ID8	1/0.5831

表10

如表11所示的文章ID7与娱乐类中剩余文章对应的相似度子索引7：

文章ID	相似度值
		ID7	1/0.1414
ID5	1/0.5385

表11

如表12所示的文章ID7与体育类中所有文章对应的相似度子索引8：

文章ID	相似度值
		ID4	1/0.5196
ID9	1/0.7681
		ID2	1/0.8367

表12

如表13所示的文章ID7与新闻类中所有文章对应的相似度子索引9：

表13

对于体育类或新闻类中的每篇文章，可采用上述相同的方式形成该类别中的每篇文章与各所述类别一一对应的相似度子索引，这里不做详细说明。

步骤405：若检测到用户3浏览了文章ID1，根据文章ID1所属的类别为娱乐类，查询与娱乐类相同或不同类别的相似度子索引，将相应类别的相似度子索引中与文章ID1的相似度最高的文章推送给用户3。

这里，检测到用户3浏览了文章ID1，为查找与文章ID1的相似度最高的文章，并将查找到的文章推荐给用户3，则可以查询与文章ID1属于同一类别的相似度子索引1，即查表5，由于表5中已经对文章ID1与文章ID5、ID7之间的相似度进行降序的排列，很显然，表5中的相似度值1/0.5385是最大的；也就是说，文章ID7是与文章ID1的相似度最高的文章，因此，此时优先将文章ID7推送给用户3；或者，查询与文章ID1属于不同类别的相似度子索引，如相似度子索引2，可以看出文章ID4是与文章ID1的相似度最高的文章，因此，此时优先将文章ID4推送给用户3。

步骤405也可以为另外一种实现方法：

若检测到用户3浏览了文章ID1，根据用户3对各类别中信息的感兴趣程度进行顺序的排列，得到用户3最不感兴趣的类别，例如，针对娱乐类、体育类、新闻类的文章，用户3对这三种类别的文章感兴趣程度的顺序为：娱乐类、体育类、新闻类。其中，新闻类是用户3最不感兴趣的类别，即为最冷门的类别。这样，根据用户对各类别信息的感兴趣程度的排列，可选定新闻类为最冷门的类别，查询文章ID1与新闻类对应的相似度子索引3，即查表7，很显然，表7中的相似度值1/0.7550是最大的；也就是说，文章ID3是与文章ID1的相似度最高的文章，因此，此时优先将文章ID3推送给用户3。

上述技术方案中，对于查询与目标信息属于相同类别的相似度子索引，则实现了根据用户的浏览历史，对同一分类中与目标信息相似度最接近的信息的精准推送；对于查询与目标信息属于不同类别的相似度子索引，则实现了对于用户未关注的类别、但是符合用户偏好信息的精准推送，提升了信息推送的覆盖广度；

通过对拓展分类下的信息进行个性化排序，将用户最感兴趣的信息优先推荐给相应用户，提高兴趣探索效果，降低探索风险；同时，个性化排序提高较长长度信息的分发几率，使信息分发更加充分，从而能够在保证推荐效果平稳的前提下，有效地提高信息推荐的多样性，为用户进行个性化的信息推荐，以满足用户个性化需求。

本发明实施例的样本可以以用户为维度进行采集，前述实施例是以用户维度为2为例对本发明实施例信息处理方法的实现过程做进一步说明。下面以用户维度为1为例对本发明实施例信息处理方法的实现过程做进一步说明。

针对一个用户，对该用户在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；以得到的该用户的操作序列作为样本，并对该样本中的信息进行采集，以及以操作序列作为样本训练机器学习模型，得到所述机器学习给该样本中的各所述信息对应分配的向量；计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息，且所述待索引信息与所述参考信息属于同一用户对应的操作序列中的信息；之后，根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引，这里，所述形成的相似度索引中涉及到的信息为针对同一用户在近期一段时间内操作的信息，其中，所述形成待索引信息对应的相似度索引的方式，既可以不考虑信息的类别，仅基于信息的全局相似度索引进行排序，也可以基于不同分类的信息的相似度索引进行排序，本发明在此不做限定；检测该用户操作并检测到所述用户操作的目标信息，查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息，这样就实现了推荐信息的精确选取，从而在保证信息推荐精度的同时提高信息全面分发的几率。

参见图5示出的本发明实施例提供的信息处理装置50的一个可选的架构示意图，在图5中，包括信息推广用户51、投放系统52、应用后台53和用户侧终端54，以下结合图5对信息处理装置50的拓扑结构进行说明。

投放系统52用于为信息推广用户51向用户侧终端54投放推广信息(如广告)。

示例性地，投放系统52根据信息推广用户51针对推广信息设定的定向条件，向符合定向条件的用户侧终端54投放推广信息。一般地，信息推广用户51会在投放系统52设置投放广告的定向条件，包括：用户的地域、年龄度、教育程度和终端设备类型，当然，也可以为其他类型如收入水平、爱好类型等定向条件。

特别地，投放系统52根据信息推广用户51所设定的应用客户端的类型(如新闻客户端、社交客户端)，向用户侧运行有相应类型的应用客户端的终端投放推广信息，从而使得推广信息在用户侧应用客户端的推广信息位实现曝光。

应用后台53用于向用户侧终端54中的应用客户端发送目标业务的信息流，如向新闻客户端发送新闻流，向社交客户端发送好友的动态流。

下面以广告为例，对本发明实施例信息处理方法的具体实现过程做进一步地详细说明。

图6给出了本发明实施例信息处理方法的另一种具体实现流程示意图，如图6所示，包括以下步骤：

步骤601：对在采样周期内检测到的被点击的广告按照点击时间进行排序，得到对应的操作序列；

步骤602：以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述广告对应分配的向量；

步骤603：计算待索引广告的向量与参考广告的向量之间的距离，所述参考广告为除所述待索引广告之外的所述广告；

步骤604：根据所述距离与相似度之间的负相关关系，计算所述待索引广告与所述参考广告之间的相似度，形成所述待索引广告对应的相似度索引；

步骤605：检测用户侧终端54用户的点击操作，并检测到所述用户点击操作的目标广告；

步骤606：查询目标广告对应的相似度索引，将查询得到的与所述目标广告的相似度最高的广告确定为候选的推荐广告；

上述步骤601至步骤606由应用后台53实现，用户所点击的广告由信息推广用户51推广。

步骤607：投放系统52将所述候选的推荐广告投放给所述用户侧终端54的用户。

为实现上述方法，本发明实施例还提供了一种信息处理装置，如图7所示，该装置包括获取单元71、计算单元72、形成单元73、查询单元74；其中，

所述获取单元71，用于对在采样周期内检测到的被操作的信息按照操作时间进行排序，得到对应的操作序列；还用于以所述操作序列作为样本训练机器学习模型，得到所述机器学习给各所述信息对应分配的向量；

所述计算单元72，用于计算待索引信息的向量与参考信息的向量之间的距离，所述参考信息为除所述待索引信息之外的所述信息；还用于根据所述距离与相似度之间的负相关关系，计算所述待索引信息与所述参考信息之间的相似度；

所述形成单元73，用于根据所述计算单元72计算的所述待索引信息与所述参考信息之间的相似度，形成所述待索引信息对应的相似度索引；

所述查询单元74，用于查询目标信息对应的相似度索引，将查询得到的与所述目标信息的相似度最高的信息确定为候选的推荐信息。

这里，所述装置还包括：检测单元75，用于当所述查询单元74查询目标信息对应的相似度索引之前，检测用户操作并检测到所述用户操作的目标信息；

所述装置还包括：发送单元76，用于当确定所述候选的推荐信息时，将所述候选的推荐信息发送至所述用户。

所述形成单元73，具体用于：

对所述待索引信息与所述参考信息之间的相似度进行降序的排列，基于排列结果形成所述待索引信息与所述参考信息之间的相似度索引。

所述形成单元73，还具体用于：

当所述参考信息属于不同的类别时，在各所述类别中，对所述待索引信息与相应类别中所述参考信息之间的相似度进行降序的排列，基于排列结果形成所述待索引信息与各所述类别一一对应的相似度子索引。

所述查询单元74，具体用于：

对不同类别中所述信息被操作的频繁程度进行顺序的排列，选定频繁程度最低的预定数量的目标类别；

查询所述目标信息的相应目标类别的相似度子索引，得到所述目标类别中与所述目标信息的相似度最高的预定数量的信息。

所述查询单元74，还具体用于：

根据所述目标信息所属的类别，查询与所属的类别属于相同类别或不同类别的相似度子索引，得到相应类别的相似度子索引中与所述目标信息相似度最高的预定数量的信息。

所述获取单元71，具体用于：

提取所述操作序列中各所述信息的特征；

所述装置还包括：更新单元77，用于满足以下条件至少之一时，基于所述信息更新的向量，更新所述待索引信息对应的相似度索引：

对应同一用户的不同采样周期的操作序列发生变化。

在实际应用中，所述获取单元71、计算单元72、形成单元73、查询单元74、检测单元75、发送单元76、更新单元77均可由位于计算机设备上的中央处理器(CPU，CentralProcessing Unit)、微处理器(MPU，Micro Processor Unit)、数字信号处理器(DSP，Digital Signal Processor)、或现场可编程门阵列(FPGA，Field Programmable GateArray)等实现。

需要说明的是：上述实施例提供的信息处理装置在进行信息处理时，仅以上述各程序模块的划分进行举例说明，实际应用中，可以根据需要而将上述处理分配由不同的程序模块完成，即将装置的内部结构划分成不同的程序模块，以完成以上描述的全部或者部分处理。另外，上述实施例提供的信息处理装置与信息处理方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

为实现上述方法，本发明实施例还提供了另一种信息处理装置，该装置包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序，所述处理器运行所述可执行程序时，执行以下操作：

所述处理器还用于运行所述可执行程序时，执行以下操作：

当查询目标信息对应的相似度索引之前，检测用户操作并检测到所述用户操作的目标信息；

当确定所述候选的推荐信息时，将所述候选的推荐信息发送至所述用户。

在本实施例中，所述处理器还用于运行所述可执行程序时，执行以下操作：

在另一实施例中，所述处理器还用于运行所述可执行程序时，执行以下操作：

所述处理器还用于运行所述可执行程序时，执行以下操作：

满足以下条件至少之一时，基于所述信息更新的向量，更新所述待索引信息对应的相似度索引：

对应同一用户的不同采样周期的操作序列发生变化。

下面以信息处理装置实施为用于信息处理的服务器或终端为例，对该信息处理装置的硬件结构做进一步说明。

图8给出了本发明另一实施例的信息处理装置的硬件结构示意图，图8所示的信息处理装置800包括：至少一个处理器801、存储器802、至少一个网络接口804和用户接口803。信息处理装置800中的各个组件通过总线系统805耦合在一起。可理解，总线系统805用于实现这些组件之间的连接通信。总线系统805除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图8中将各种总线都标为总线系统805。

其中，用户接口803可以包括显示器、键盘、鼠标、轨迹球、点击轮、按键、按钮、触感板或者触摸屏等。

可以理解，存储器802可以是易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。

本发明实施例中的存储器802用于存储各种类型的数据以支持信息处理装置800的操作。这些数据的示例包括：用于在信息处理装置800上操作的任何计算机程序，如可执行程序8021，实现本发明实施例方法的程序可以包含在可执行程序8021中。

上述本发明实施例揭示的方法可以应用于处理器801中，或者由处理器801实现。处理器801可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器801中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器801可以是通用处理器、DSP，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器801可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本发明实施例所公开的方法的步骤，可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于存储介质中，该存储介质位于存储器802，处理器801读取存储器802中的信息，结合其硬件完成前述方法的步骤。

在示例性实施例中，本发明实施例还提供了一种存储介质，存储有可执行程序8021，所述可执行程序8021被处理器801执行时实现以下操作：

所述可执行程序8021被处理器801运行时，还执行以下操作：

在本实施例中，所述可执行程序8021被处理器801运行时，还执行以下操作：

在另一实施例中，所述可执行程序8021被处理器801运行时，还执行以下操作

在另一实施例中，所述可执行程序8021被处理器801运行时，还执行以下操作：

所述可执行程序8021被处理器801运行时，还执行以下操作：

对应同一用户的不同采样周期的操作序列发生变化。

综上，本发明实施例可实现以下有益效果：

1)通过对目标信息的相似度与不同候选信息的相似度进行比较，可以轻易地确定与目标信息最为相似的信息，由于采用机器学习的方式能够得到信息的精确向量表达，因此基于向量所形成的相似度必然可以精确表示信息的相似程度，确保了确定推荐信息的精度。

2)查询与目标信息的相似程度足够接近的候选信息，就能够克服相关技术对信息固定排序使用的热度、质量等维度的限制而被确定为推荐信息，保证了确定的推荐信息在全部信息中的覆盖率，进而能够确保信息全面分发的几率。

3)对于查询与目标信息属于相同类别的相似度子索引，实现了根据用户的浏览历史，对同一分类中与目标信息相似度最接近的信息的精准推送。

4)对于查询与目标信息属于不同类别的相似度子索引，实现了对于用户未关注的类别、但是符合用户偏好信息的精准推送，提升了信息推送的覆盖广度，保证了信息推荐的多样性。

5)以操作序列作为样本训练机器学习模型，避免了遍历查询全量样本所带来的耗时长、操作繁琐的问题，能够实现对信息的快速定位。

6)对拓展分类下的信息进行个性化排序，将用户感兴趣的信息优先推荐给相应用户，提高兴趣探索效果，降低探索风险。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或可执行程序产品。因此，本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的可执行程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和可执行程序产品的流程图和/或方框图来描述的。应理解可由可执行程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些可执行程序指令到通用计算机、专用计算机、嵌入式处理机或参考可编程数据处理设备的处理器以产生一个机器，使得通过计算机或参考可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些可执行程序指令也可存储在能引导计算机或参考可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些可执行程序指令也可装载到计算机或参考可编程数据处理设备上，使得在计算机或参考可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或参考可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述，仅为本发明的较佳实施例而已，并非用于限定本发明的保护范围，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种信息处理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：

3.根据权利要求1所述的方法，其特征在于，所述形成所述待索引信息对应的相似度索引，包括：

4.根据权利要求1所述的方法，其特征在于，所述形成所述待索引信息对应的相似度索引，包括：

5.根据权利要求1所述的方法，其特征在于，所述查询目标信息对应的相似度索引，包括：

6.根据权利要求1所述的方法，其特征在于，所述查询目标信息对应的相似度索引，包括：

7.根据权利要求1所述的方法，其特征在于，所述方法还包括：

对应同一用户的不同采样周期的操作序列发生变化。

8.一种信息处理装置，其特征在于，包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

检测单元，用于当所述查询单元查询目标信息对应的相似度索引之前，检测用户操作并检测到所述用户操作的目标信息；

发送单元，用于当确定所述候选的推荐信息时，将所述候选的推荐信息发送至所述用户。

10.根据权利要求8所述的装置，其特征在于，所述形成单元，具体用于：

11.根据权利要求8所述的装置，其特征在于，所述形成单元，具体用于：

12.根据权利要求8所述的装置，其特征在于，所述查询单元，具体用于：

13.根据权利要求8所述的装置，其特征在于，所述查询单元，具体用于：

14.一种存储介质，存储有可执行程序，其特征在于，所述可执行程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

15.一种信息处理装置，包括存储器、处理器及存储在存储器上并能够由所述处理器运行的可执行程序，其特征在于，所述处理器运行所述可执行程序时实现如权利要求1至7任一项所述方法的步骤。