WO2020207074A1

WO2020207074A1 - 一种信息推送的方法及设备

Info

Publication number: WO2020207074A1
Application number: PCT/CN2019/130897
Authority: WO
Inventors: 龙信文; 胡希平; 郑建波; 高英; 程俊
Original assignee: 中国科学院深圳先进技术研究院
Priority date: 2019-04-09
Filing date: 2019-12-31
Publication date: 2020-10-15
Also published as: CN110162695B; CN110162695A

Abstract

一种信息推送的方法及设备，应用于数据处理技术领域，包括：获取目标对象的信息查询记录（S101）；根据查询记录以及候选对象的候选查询记录，计算候选对象与目标对象之间的相似度（S102）；基于各个候选对象对应的相似度，从候选对象中选取目标对象的关联对象（S103）；基于关联对象的关联信息库，生成与目标对象匹配的推荐信息列表；关联信息库包含有关联对象的历史查询信息（S104）；对所有关联对象的推荐信息列表进行合并，生成目标对象的待推送信息列表（S105）。该方案根据目标对象的查询记录确定与目标对象的对象属性相似度较高的关联对象，生成推荐信息列表，能够自动扩展推送信息的信息领域，在保证精准推送的同时，扩大信息领域的范围，提高目标对象的信息推送效率。

Description

一种信息推送的方法及设备

技术领域

本发明属于数据处理技术领域，尤其涉及一种信息推送的方法及设备。

背景技术

随着信息更新速度的不断增加，信息数量正以几何级数的速度递增，如何能够精准地为用户推送信息，直接影响用户获取信息的效率。例如，在用户学习新语言，需要对该语言的单词进行记忆时，如何能够根据用户的兴趣以及学习阶段推送相关联的单词，则会对用户的学习效果造成直接影响。由此可见，现亟需一种对信息进行精准推送的方法。

现有的信息推送技术，主要是根据用户的对于信息的查询记录，推荐与查询记录相关联的关联信息给用户，通过此方式推送的信息由于与查询记录之间存在强关联的关系，较难主动扩展所推送信息的领域，从而降低了推送信息的多样性以及丰富性，降低了用户获取信息的效率。

技术问题

有鉴于此，本发明实施例提供了一种信息推送的方法及设备，以解决现有的信息推送技术，主要是根据用户的对于信息的查询记录，推荐与查询记录相关联的关联信息给用户，通过此方式推送的信息由于与查询记录之间存在强关联的关系，较难主动扩展所推送信息的领域，从而降低了推送信息的多样性以及丰富性，降低了用户获取信息的效率的问题。

技术解决方案

本发明实施例的第一方面提供了一种信息推送的方法，包括：

获取目标对象的信息查询记录；

根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度；

基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象；

基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息；

对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。

本发明实施例的第二方面提供了一种信息推送的设备，包括：

信息查询记录获取单元，用于获取目标对象的信息查询记录；

相似度计算单元，用于根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度；

关联对象选取单元，用于基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象；

推荐信息列表生成单元，用于基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息；

待推送信息列表生成单元，用于对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。

本发明实施例的第三方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现第一方面的各个步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现第一方面的各个步骤。

有益效果

实施本发明实施例提供的一种信息推送的方法及设备具有以下有益效果：

本发明实施例通过获取需要进行信息推送的目标对象的查询记录，根据查询记录计算候选对象与目标对象之间的相似度，并根据相似度确定与目标对象存在强关联关系的关联对象，即表示关联对象的浏览习惯以及信息层级与目标对象较为相似，因此可以根据关联对象的关联信息库，生成推荐信息列表，并通过多个关联对象的推荐信息列表，生成目标对象的待推送信息列表，向目标对象推送待推送列表内包含的信息。与现有的信息推送技术相比，本发明不只是仅仅依靠目标对象的查询记录进行推送信息的确定，而是根据目标对象的查询记录确定与目标对象的对象属性相似度较高的关联对象，并根据关联对象的关联信息库生成推荐信息列表，由于不同的关联对象所浏览的信息领域较多，且关联对象与目标对象的相似度较高，从而可以推断关联对象感兴趣的信息领域也很大可能是目标对象所感兴趣的信息领域，实现了自动扩展推送信息的信息领域的目的，在保证精准推送的同时，也能够提高信息领域的范围，提高目标对象的信息推送效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的一种信息推送的方法的实现流程图；

图2是本发明第二实施例提供的一种信息推送的方法S102具体实现流程图；

图3是本发明第三实施例提供的一种信息推送的方法S1023具体实现流程图；

图4是本发明第四实施例提供的一种信息推送的方法S1025具体实现流程图；

图5是本发明第五实施例提供的一种信息推送的方法S104具体实现流程图；

图6是本发明第六实施例提供的一种信息推送的方法S105具体实现流程图；

图7是本发明一实施例提供的一种信息推送的设备的结构框图；

图8是本发明另一实施例提供的一种终端设备的示意图。

本发明的实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明实施例通过获取需要进行信息推送的目标对象的查询记录，根据查询记录计算候选对象与目标对象之间的相似度，并根据相似度确定与目标对象存在强关联关系的关联对象，即表示关联对象的浏览习惯以及信息层级与目标对象较为相似，因此可以根据关联对象的关联信息库，生成推荐信息列表，并通过多个关联对象的推荐信息列表，生成目标对象的待推送信息列表，向目标对象推送待推送列表内包含的信息，解决了现有的信息推送技术，主要是根据用户的对于信息的查询记录，推荐与查询记录相关联的关联信息给用户，通过此方式推送的信息由于与查询记录之间存在强关联的关系，较难主动扩展所推送信息的领域，从而降低了推送信息的多样性以及丰富性，降低了用户获取信息的效率的问题。

在本发明实施例中，流程的执行主体为终端设备。该终端设备包括但不限于：服务器、计算机、智能手机以及平板电脑等能够执行信息推送的操作的设备。图1示出了本发明第一实施例提供的信息推送的方法的实现流程图，详述如下：

在S101中，获取目标对象的信息查询记录。

在本实施例中，终端设备可以将需要进行推送的用户识别为目标对象。若终端设备为某一用户的用户终端，则用户终端可以将登陆于该用户终端的用户识别为目标用户，并为用户终端所属的用户生成与之对应的待推送信息列表。若终端设备为一服务器，服务器可以接收用户的推送请求，并根据推送请求中携带有用户标识，将该用户标识对应的请求用户识别为目标用户，并向该目标用户进行信息推送；当然，服务器还可以为全平台的用户对象自动进行信息推送，在该情况下，终端设备可以创建多条并行线程，通过多条并行线程同时生产多个目标对象的待推送信息列表，优选地，终端设备会为每个用户账户添加一个创建标识符，在创建了某一用户账户的待推送信息列表后，会将该用户账户的创建标识符设置为第一位值，在下一次选取目标对象时，可以根据创建标识符的位值，识别出未创建的用户账户，并将其识别为目标对象。

可选地，在本实施例中，该待推送列表具有有效时长，终端设备在创建了一个目标对象的待推送信息列表后，会创建有个有效计时器，当该有效计时器的计数值等于该有效时长时，则会识别该待推送列表未无效推送列表，并重新为该目标对象生成待推送信息列表。当然，终端设备还可以设置多个列表无效条件，例如，当检测到待推送信息列表中每个推荐信息的推送次数大于预设的推送次数阈值，则识别该待推送列表为无效推送列表；若检测到用户新建的查询记录的个数大于预设的更新个数阈值，则识别该待推送列表为无效推送列表。

在本实施例中，终端设备可以为目标对象创建一个对象数据库，该对象数据库可以用于存储该目标对象的所有操作记录，该操作记录包括有信息查询记录，信息查询记录具体用于记录目标对象查询过的信息。例如，终端设备可以应用于语言学习领域，在该情况下，该信息查询记录可以用于记录目标对象查询过的单词，并将所有查询过的单词对应的信息查询记录存储于该目标对象的对象数据库内；终端设备还可以应用于新闻推荐领域，在该情况下，该信息查询记录可以用于记录目标对象浏览过的新闻文章，并将记录有查询过的文章标识的信息查询记录存储于该目标对象的对象数据库内。

在S102中，根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度。

在本实施例中，终端设备在获取了目标对象的信息查询记录后，还可以获取除目标对象外的所有候选对象的查询记录，并根据信息查询记录与候选查询记录之间的匹配度，计算出候选对象与目标对象之间的相似度。若目标对象的信息查询记录与候选对象的候选查询记录之间的查询内容越相似，则表示两个用户之间的兴趣和/或学习阶段越接近，从而两者之间的相似度越高。

在本实施例中，目标对象与候选对象可以处于同一个应用平台。各个候选对象配置有对应的对象数据库，将候选对象查询过信息的记录存储于该候选对象关联的对象数据库内，因此对象数据库存储有候选对象的候选查询记录。该候选查询记录与信息查询记录一样，根据信息类型的不同，可以记录有候选对象查询过的信息，例如查询过的单词或浏览过的文章等。

可选地，根据信息查询记录以及候选查询记录计算相似度的方式可以为：终端设备可以分别检测每个候选查询记录中包含的字符在信息查询记录中的出现的次数，并基于该出现的次数作为该候选查询记录的相似因子，基于所有候选查询记录的相似因子，计算出该候选对象的相似度。

在S103中，基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象。

在本实施例中，由于相似度可以表示候选对象与目标对象之间的学习领域以及学习阶段越接近，因此终端设备在计算了各个候选对象的相似度后，可以根据相似度数值的大小次序，对各个候选对象进行排序，从而从候选对象中选取出目标对象的关联对象。

在本实施例中，终端设备可以设置有关联个数阈值，在该情况下，终端设备可以根据相似度的数值从大到小进行排序，并选取前N个候选对象作为关联对象，其中N为上述的关联个数阈值；终端设备还可以设置有相似度阈值，终端设备可以选取相似度的数值大于该相似度阈值为关联对象，在该情况下，即关联对象的个数并非固定的。

在S104中，基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息。

在本实施例中，每个对象会有对应的信息库，该信息库用于记录该对象关注的信息、存储的信息和/或浏览过的信息等。因此，在确定了目标对象的关联对象后，可以根据关联对象的对象标识，从数据库中确定该对象标识的关联信息库，该关联信息库用于存储关联对象的所有历史查询信息，从而可以根据历史查询信息，提取关联对象的所关注的信息、所存储的信息等。

在本实施例中，终端设备可以计算该关联信息库中关联对象的历史查询信息的推荐优先级，并基于该推荐优先级从历史查询信息中确定出推荐信息，并将所有推荐信息生成推荐信息列表。

可选地，在本实施例中，计算推荐优先级的方式可以为：终端设备可以识别各个历史查询信息的信息类型，并选取包含的历史查询信息个数最多的信息类型作为主信息类型，并将所有主信息类型的推荐优先级设置为最高级，并将信息个数次多的信息类型作为次信息类型，将所有次信息类型的推荐优先级设置为次高级，如此类推，可以根据各个历史查询信息所属信息类型的层级，确定该历史查询信息的推荐优先级。

在S105中，对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。

在本实施例中，终端设备可以提取各个关联对象的推荐信息列表包含的推荐信息，并对所有推荐信息进行重新排列，得到关于目标对象的待推送信息列表。终端设备可以根据该待推送列表中包含的推荐信息，向目标对象进行推送操作。其中，终端设备可以根据各个推荐信息的推荐优先级确定推荐次序，并基于推荐次序依次对目标对象进行信息推送操作。其中，推荐优先级可以参考S104的计算方式，在此不再赘述；或者，该推荐优先级可以与其对应的关联对象的相似度的大小确定，若对应的关联对象与目标对象的相似度越高，则该关联对象的推荐信息的推送优先级越高。

现有技术中，可以基于社会网络构建目标用户的个人中心网，通过单词库计算与参考用户的相似度；当相似性大于相似度阈值时，通过联系数量计算目标用户与参考用户间的亲密；根据相似度与亲密度确定单词评分，然后将评分大于评分阈值的单词推荐给目标用户。而该方式具有以下缺陷：

(1)仅以社会网络上的好友作为单词匹配的参考，忽略了潜在的与用户相似的陌生人，局限了单词匹配的参考对象，限制了对单词匹配准确率的提升；

(2)只是关注用户的兴趣将忽视用户其处于不同学习阶段的事实，匹配和推荐的单词可能不属于其学习阶段，对用户来说可能出现推荐的单词太容易或者太难的情况；

(3)根据单词的查阅记录和推荐记录计算单词评分，相对仅用查阅记录的话评分会出现虚高，影响匹配的准确率，查阅记录才是用户对单词推荐结果、对单词是否感兴趣的直接反馈；

(4)单词的分类条件不明确，单词类别间界限模糊，根据单词的分类、单词分类的评分进行判断用户间兴趣点的相似度，构建个人中心网，存在一定的误差；

本发明实施例提供了一种基于群智感知的信息匹配和推荐方法，引入群智感知的概念，收集所有用户的信息查阅历史并根据信息查阅历史找出与目标用户兴趣相似、学习阶段重合度大的关联用户，从而匹配和推荐目标用户真正感兴趣的信息。其次，本发明实施例可以自动匹配目标用户的学习阶段，在察觉目标用户的学习阶段发生改变时，自动地为其匹配和推荐属于当前学习阶段的单词，更适合用户进行长期的信息获取。本发明实施例中所提出的基于群智感知的信息匹配和推荐方法，准确匹配用户感兴趣信息，同时让信息推荐智能地匹配用户所处的学习阶段，实现信息推送的个性化定制、优化用户学习体验进而提升学习效率。

以上可以看出，本发明实施例提供的一种信息推送的方法通过获取需要进行信息推送的目标对象的查询记录，根据查询记录计算候选对象与目标对象之间的相似度，并根据相似度确定与目标对象存在强关联关系的关联对象，即表示关联对象的浏览习惯以及信息层级与目标对象较为相似，因此可以根据关联对象的关联信息库，生成推荐信息列表，并通过多个关联对象的推荐信息列表，生成目标对象的待推送信息列表，向目标对象推送待推送列表内包含的信息。与现有的信息推送技术相比，本发明不只是仅仅依靠目标对象的查询记录进行推送信息的确定，而是根据目标对象的查询记录确定与目标对象的对象属性相似度较高的关联对象，并根据关联对象的关联信息库生成推荐信息列表，由于不同的关联对象所浏览的信息领域较多，且关联对象与目标对象的相似度较高，从而可以推断关联对象感兴趣的信息领域也很大可能是目标对象所感兴趣的信息领域，实现了自动扩展推送信息的信息领域的目的，在保证精准推送的同时，也能够提高信息领域的范围，提高目标对象的信息推送效率。

图2示出了本发明第二实施例提供的一种信息推送的方法S102的具体实现流程图。参见图1，相对于图1所述实施例，本实施例提供的一种信息推送的方法S102包括：S1021～S1026，具体详述如下：

进一步地，所述根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度，包括：

在S1021中，从所述信息查询记录中提取所述目标对象的多个第一信息，以及从所述候选查询记录中提取所述候选对象的多个第二信息。

在本实施例中，终端设备在获取了目标对象的信息查询记录中，可以从每个信息查询记录中提取得到目标对象查询过的信息，即上述的第一信息，对每个信息查询记录均执行上述操作，即可以得到多个第一信息。需要说明的是，一个信息查询记录中可以包含有一个第一信息，还可以包含有两个或以上的第一信息，在该情况下，目标用户在编写查询关键词时，可以通过缺省查询或批量查询的方式对信息进行查询，从而一条信息查询记录中可以输出多个查询结果，从而一个查询记录可以对应多个第一信息。

可选地，在本实施例中，若信息查询记录的信息类型为文章信息类型，在该情况下，终端设备可以获取目标对象浏览过的文章，并对该文章进行语义分析，提取出该文章对应的核心关键词，例如统计各个候选关键词在文章中的出现词频，并基于该出现词频选取出核心关键词，并将各个核心关键词识别为该信息查询记录对应的第一信息。

在本实施例中，从候选查询记录中提取第二信息的具体操作过程与提取第一信息的步骤相同，可以参考第一信息的提取过程，在此不再赘述。

在1022中，分别将各个所述第一信息词向量转换模型，生成所述第一信息对应的第一词向量，以及将各个所述第二信息导入到所述词向量转换模型，生成所述第二信息对应的第二词向量。

在本实施例中，终端设备可以存储有一个词向量转换模型，可以将提取得到的信息转换为在同一量纲表示的词向量，从而能够通过词向量之间的距离，确定两个信息之间的关联度。基于此，终端设备可以将第一信息导入该词向量转换模型，计算得到第一信息对应的第一词向量；以及将第二信息导入该词向量转换模型，计算得到第二信息对应的第二词向量。

可选地，在本实施例中，终端设备可以根据多个预设的词性维度，确定第一信息在各个词性维度的维度值，从而根据各个词性维度的维度值构建该第一信息的第一词向量，其中该第一词向量包含的元素个数与词性维度的维度数一致。同样地，对于第二信息也可以通过上述方式进行词向量的转换操作。

可选地，在本实施例中，终端设备可以通过Word2Vec语义模型，将第一信息以及第二信息导入到训练好的Word2Vec语义模型中，得到第一词向量以及第二词向量。

在S1023中，将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子。

在本实施例中，由于在S1022中，已经将第一信息以及第二信息转换为通过统一量纲表示的第一词向量以及第二词向量，终端设备可以根据第一词向量以及第二词向量之间的向量距离，确定不同信息之间的关联度，若两个向量距离越小，则表示两个信息之间关联度越大；反之，若两个向量距离越大，则表示两个信息之间的关联度越小。

可选地，在本实施例中，终端设备可以分别计算各个第一词向量与第二词向量之间的向量距离，并根据各个向量距离进行加权求和，将加权求和的数值作为候选对象与目标对象之间的第一相似因子。

在S1024中，获取所述目标对象的目标属性，以及获取所述候选对象的候选属性。

在本实施例中，终端设备可以根据目标对象的对象标识，从对象数据库中提取关于目标对象的目标属性，该目标属性可以包括有目标对象的年龄、性别、住址、教育背景、学历等与目标对象相关的信息。同样地，终端设备也可以通过候选对象的对象标识，从对象数据库中提取关于候选对象的候选属性。

在S1025中，根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子。

在本实施例中，目标属性可以对目标对象所感兴趣的领域和/或学习阶段进行判定，因此若目标属性与候选属性之间的相似度越大，则表示候选对象与目标对象之间的关联度越大，基于此，可以根据目标属性以及候选属性计算两个对象之间的第二相似因子。

可选地，在本实施例中，终端设备可以统计目标属性以及候选属性中参数值相同的属性项的个数，并将相同属性项的个数导入预设的哈希转换函数，计算出该相同属性项个数对应的哈希值，将该哈希值识别为目标对象与候选对象之间的第二相似因子。若该属性项的个数越大，则对应的第二相似因子越大；反之，若该属性的个数越小，则对应的第二相似因子越小。

在S1026中，将所述第一相似因子以及所述第二相似因子导入预设的相似度计算模型，确定所述目标对象以及所述候选对象之间的所述相似度；所述相似度计算模型具体为：

Sim(A,X)＝W _IC·Sim _IC(A,X)+W _SC·Sim _SC(A,X)

其中，Sim(A,X)为所述候选对象与所述目标对照之间的所述相似度；Sim _IC(A,X)为所述第一相似因子；Sim _SC(A,X)为所述第二相似因子；W _IC以及W _SC为预设系数。

在本实施例中，终端设备将计算得到第一相似因子以及第二相似因子导入到相似度计算模型，通过第一相似因子以及第二相似因子对应的加权权重，对两个相似因子进行加权求和，将求和后的值作为目标对象与候选对象之间的相似度。

在本发明实施例中，由于候选对象不仅包含目标对象的认识的对象还包括有陌生对象，从而能够更大的数据体量提高了匹配和推荐的准确性，进一步而言，引入额外的用户信息，即上述的目标属性以及候选属性，表示学习阶段特征，在原有的浏览记录的基础上，针对不同的学习阶段，匹配和推荐既符合兴趣又符合学习水平的信息，提高了推送信息的准确性。

图3示出了本发明第三实施例提供的一种信息推送的方法S1023的具体实现流程图。参见图3，相对于图2所述的实施例，本实施例提供的一种信息推送的方法S1023包括：S301～S302，具体详述如下：

进一步地，所述将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子，包括：

在S301中，分别将各个所述第二词向量以及所述第一词向量导入到预设的相似距离计算模型，确定所述第二词向量的相似距离；所述相似距离计算模型具体为：

其中，v _2i为第i个所述第二词向量的所述相似距离；

为所述第i个所述第二词向量；

为所述第j个所述第一词向量；L ₁为所述第一词向量的总个数；L ₂为所述第二词向量的总个数；Max{x}为最大值选取函数。

在本实施例中，终端设备可以通过余弦相似度计算两个向量之间的相似距离，并从第一词向量中，选取与第i个第二词向量向量距离最短的一个第一词向量，将该距离最近的第一词向量与第二词向量之间的余弦相似度作为该第二词向量的相似距离。

可选地，在本实施例中，终端设备可以根据第一信息以及第二信息生成一个信息字典，该信息字典中为每个第一信息以及第二信息配置对应的信息编号，终端设备可以根据信息编号配置一个长度为L的距离向量，即上述的v ₂，其中L为该信息字典包含的信息总数。在该情况下，L ₁＝L ₂＝L。

在S302中，根据各个所述第二词向量的所述相似距离，计算所述候选对象与所述目标对象之间的所述第一相似因子；计算所述相似度的模型具体为：

其中，L为预设的词向量长度。

在本实施例中，终端设备在计算了各个第二词向量的相似距离后，可以根据该相似距离计算出候选对象与目标对象之间的第一相似因子。由于目标对象与自身的距离为0，因此可以用一个全为1的数组标识目标对象与自己之间的相似距离。终端设备将所有第二词向量的相似距离进行封装，构成了关于候选对象的一个L维的距离向量，基于候选对象的距离向量以及目标对象的原生向量计算两个向量之间的向量距离，当然，在S302中计算向量距离也可以采用余弦相似度进行计算，从而将计算得到的结果作为目标对象与候选对象之间的第一相似因子。

在本发明实施例中，通过计算出各个第二词向量与最接近的第一词向量之间的相似距离，并构建一个关于候选对象的距离向量，从而计算出目标对象与候选对象在查询记录上的相似度，提高了第一相似因子计算的准确性。

图4示出了本发明第四实施例提供的一种信息推送的方法S1025的具体实现流程图。参见图4，相对于图2所述实施例，本实施例提供的一种信息推送的方法S1042包括：S401～S403，具体详述如下：

进一步地，所述目标属性包括所述目标对象的目标年龄以及目标地址；所述候选属性包括所述候选对象的候选年龄以及候选地址；所述根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子，包括：

在S401中，计算任意两个所述候选地址之间的第一距离值，以及计算任一所述候选地址与所述目标地址之间的第二距离值。

在本实施例中，目标属性包含有目标对象的所在的目标地址，而每个候选对象的候选属性也包含有候选对象所在的候选地址。终端设备可以计算对目标地址以及所有候选地址之间进行两两组合，从而计算得到关于任意两个候选地址之间的第一距离值，以及任一候选地址与目标地址之间的第二距离值。

在S402中，从所有所述第一距离值以及所述第二距离值中选取距离最大值，并将所述距离最大值识别为距离基准值。

在本实施例中，终端设备可以根据第一距离值以及第二距离值，选取距离数值最大的一个距离值，将该数值最大的距离值识别为距离基准值，从而可以确定最大地理位置距离。

在S403中，将所述候选对象的候选地址以及所述候选年龄和所述目标对象的目标地址以及所述目标年龄导入到第二相似因子计算模型，计算所述候选对象与所述目标对象之间的所述第二相似因子；所述第二相似因子计算模型具体为：

其中，age _A为所述目标年龄；age _X为所述候选年龄，Add _A为所述目标地址；Add _X为所述候选地址；Max_Range为所述距离基准值；α和β为预设系数；Min(age _A,age _X)为最小值选取函数；Range(Add _A,Add _X)为距离计算函数

在本实施例中，学习阶段可以从用户的年龄和位于的地理位置间接表示。年龄越相近，位于的地理位置更接近，学习阶段更为相近。年龄越小，年龄差异所造成的影响越明显；年龄越大，这种差异反而变得越小。对于地理位置上的差异，同一座城市内并不会有很大的差异，差异更多是在城市与城市、省内较大的区域以及省与省之间。

在本发明实施例中，通过年龄以及地理位置，确定两个对象之间学习阶段的相似度，从而计算出第二相似因子，能够提高后续计算两个用户之间的相似度的准确性。

图5示出了本发明第五实施例提供的一种信息推送的方法S104的具体实现流程图。参见图5，相对于图1-4所述实施例，本实施例提供的一种信息推送的方法S104包括：S1041～S1044，具体详述如下：

进一步地，所述基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息，包括：

在S1041中，基于各个所述历史查询信息的查询时间，选取所述查询时间在预设的有效时间范围内的所述历史查询信息作为有效查询信息。

在本实施例中，终端设备在确定了关联对象后，需要根据关联对象确定推送给目标对象的推荐信息，基于此，终端设备可以检测该关联对象各个历史查询信息的查询时间，并选取在预设的有效时间范围内的历史查询信息作为有效查询信息。该有效时间范围可以为以当前时刻至T时刻之间，从而能够获取得到关联对象最近浏览过的历史查询信息，从而能够确定该关联对象当前最感兴趣的信息，提高了推荐信息的时效性以及准确性。

在S1042中，基于所述有效查询信息对应的第二信息，统计各个所述第二信息的第一出现次数。

在本实施例中，终端设备从各个有效查询信息中提取对应的第二信息，并统计各个第二信息在所有有效查询记录中的第一出现次数，若该出现次数越多，则表示该第二信息对应的推荐度越高，目标对象对该第二信息感兴趣的概率越大。

在S1043中，将所述第二信息的所述出现次数以及第二词向量导入到推荐度计算模型，计算所述第二信息的推荐度；所述推荐度计算模型具体为：

其中，

为所述推荐度；N _wi为所述第一出现次数；

为所述第二词向量；

为所述目标对象第j个已查询的目标信息对应的第一目标向量；L ₁为所述目标信息的总数。

在本实施例中，终端设备可以将第二信息转换为第二词向量，具体转换为第二词向量的方式可以参照S1022的相关描述，在此不再赘述。在确定了第二词向量以及第一出现次数后，可以将上述两个参数导入到推荐度计算模型，从而计算各个第二信息的推荐度。其中，出现次数越大，则对应的推荐度越大；若该第二信息的第二词向量与目标对象的第一词向量之间的相似度越大，则该第二信息的推荐度越大。

在S1044中，基于各个所述第二信息的推荐度，生成所述推荐信息列表。

在本实施例中，终端设备可以根据各个第二信息的推荐度的数值，从大到小对各个第二信息进行排序，并生成关联对象对应的推荐信息列表。可选地，终端设备可以设置有最大推荐个数，在该情况下，终端设备根据推荐度的数值，从大到小对各个第二信息进行排序，并选取前N个第二信息作为推荐信息，其中N的职位上述的最大推荐个数。当然，终端设备还可以设置有推荐阈值，将所有推荐度大于该推荐阈值的第二信息识别为推荐信息，并生成推荐信息列表。优选地，终端设备可以设置有最大推荐个数以及推荐阈值，选取推荐度大于推荐阈值的第二信息作为候选信息，并选取前N个候选信息作为推荐信息，并生成推荐信息列表。

在本发明实施例中，通过计算各个第二信息的推荐度，从而选取出需要进行推送的推荐信息，生成推荐信息列表，提高了推荐信息的准确率以及与目标用户的相关度，实现了精准信息推送的目的。

图6示出了本发明第六实施例提供的一种信息推送的方法S105的具体实现流程图。参见图6，相对于图1-4所述实施例，本实施例提供的一种信息推送的方法S105包括：S1051～S1053，具体详述如下：

进一步地，所述对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表，包括：

在S1051中，基于各个所述推荐信息列表包含的推荐信息，统计各个所述推荐信息在所有所述推荐信息列表中的第二出现次数。

在本实施例中，终端设备可以根据各个推荐信息列表中包含的推荐信息，分别统计各个推荐信息在所有推荐信息列表中的第二出现次数，若该出现次数越多，则表示该推荐信息对应的推荐优先级越高，目标对象对该推荐信息感兴趣的概率越大。

在S1052中，根据所述第二出现次数确定各个所述推荐信息的推送优先级。

在本实施例中，终端设备可以根据第二出现次数，分别计算各个推荐信息的推送优先级，例如将第二出现次数直接作为推荐信息的推送优先级。可选地，可以参考S1043的计算公式，将各个推荐信息转换为推荐词向量，并基于推荐词向量以及第二出现次数导入到推荐度计算模型，计算出各个推荐信息的推送优先级。

在S1053中，基于所述推送优先级生成所述待推送信息列表。

在本实施例中，终端设备根据推送优先级的数值，由大到小对所有推荐信息进行排序，从而生成关于目标对象的待推送信息列表，并根据该待推送信息列表内的推送次序，依次向目标对象进行信息推送操作。

在本发明实施例中，通过统计各个推荐信息的第二出现，从而确定各个推荐信息的推送优先级，并生成带有推送优先级次序的待推送信息列表，能够有序地向用户进行推送操作，提高了推送操作准确性。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

图7示出了本发明一实施例提供的一种信息推送的设备的结构框图，该信息推送的设备包括的各单元用于执行图1对应的实施例中的各步骤。具体请参阅图1与图1所对应的实施例中的相关描述。为了便于说明，仅示出了与本实施例相关的部分。

参见图7，所述信息推送的设备包括：

信息查询记录获取单元71，用于获取目标对象的信息查询记录；

相似度计算单元72，用于根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度；

关联对象选取单元73，用于基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象；

推荐信息列表生成单元74，用于基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息；

待推送信息列表生成单元75，用于对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。

可选地，所述相似度计算单元72包括：

信息提取单元，用于从所述信息查询记录中提取所述目标对象的多个第一信息，以及从所述候选查询记录中提取所述候选对象的多个第二信息；

词向量转换单元，用于分别将各个所述第一信息词向量转换模型，生成所述第一信息对应的第一词向量，以及将各个所述第二信息导入到所述词向量转换模型，生成所述第二信息对应的第二词向量；

第一相似因子计算单元，用于将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子；

对象属性获取单元，用于获取所述目标对象的目标属性，以及获取所述候选对象的候选属性；

第二相似因子计算单元，用于根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子；

相似度计算单元，用于将所述第一相似因子以及所述第二相似因子导入预设的相似度计算模型，确定所述目标对象以及所述候选对象之间的所述相似度；所述相似度计算模型具体为：

Sim(A,X)＝W _IC·Sim _IC(A,X)+W _SC·Sim _SC(A,X)

可选地，所述第一相似因子计算单元包括：

相似距离计算单元，用于分别将各个所述第二词向量以及所述第一词向量导入到预设的相似距离计算模型，确定所述第二词向量的相似距离；所述相似距离计算模型具体为：

其中，v _2i为第i个所述第二词向量的所述相似距离；

为所述第i个所述第二词向量；

为所述第j个所述第一词向量；L ₁为所述第一词向量的总个数；L ₂为所述第二词向量的总个数；Max{x}为最大值选取函数；

相似距离导入单元，用于根据各个所述第二词向量的所述相似距离，计算所述候选对象与所述目标对象之间的所述第一相似因子；计算所述相似度的模型具体为：

其中，L为预设的词向量长度。

可选地，所述目标属性包括所述目标对象的目标年龄以及目标地址；所述候选属性包括所述候选对象的候选年龄以及候选地址；所述第二相似因子计算单元包括：

距离值计算单元，用于计算任意两个所述候选地址之间的第一距离值，以及计算任一所述候选地址与所述目标地址之间的第二距离值；

距离基准值计算单元，用于从所有所述第一距离值以及所述第二距离值中选取距离最大值，并将所述距离最大值识别为距离基准值；

用户信息导入单元，用于将所述候选对象的候选地址以及所述候选年龄和所述目标对象的目标地址以及所述目标年龄导入到第二相似因子计算模型，计算所述候选对象与所述目标对象之间的所述第二相似因子；所述第二相似因子计算模型具体为：

其中，age _A为所述目标年龄；age _X为所述候选年龄，Add _A为所述目标地址；Add _X为所述候选地址；Max_Range为所述距离基准值；α和β为预设系数；Min(age _A,age _X)为最小值选取函数；Range(Add _A,Add _X)为距离计算函数。

可选地，所述推荐信息列表生成单元74包括：

有效信息选取单元，用于基于各个所述历史查询信息的查询时间，选取所述查询时间在预设的有效时间范围内的所述历史查询信息作为有效查询信息；

第一出现次数统计单元，用于基于所述有效查询信息对应的第二信息，统计各个所述第二信息的第一出现次数；

推荐度计算单元，用于将所述第二信息的所述出现次数以及第二词向量导入到推荐度计算模型，计算所述第二信息的推荐度；所述推荐度计算模型具体为：

其中，

为所述推荐度；N _wi为所述第一出现次数；

为所述第二词向量；

为所述目标对象第j个已查询的目标信息对应的第一目标向量；L ₁为所述目标信息的总数；

推荐信息选取单元，用于基于各个所述第二信息的推荐度，生成所述推荐信息列表。

可选地，所述待推送信息列表生成单元75包括：

第二出现次数统计单元，用于基于各个所述推荐信息列表包含的推荐信息，统计各个所述推荐信息在所有所述推荐信息列表中的第二出现次数；

推送优先级计算单元，用于根据所述第二出现次数确定各个所述推荐信息的推送优先级；

推送信息选取单元，用于基于所述推送优先级生成所述待推送信息列表。

因此，本发明实施例提供的信息推送的设备同样不只是仅仅依靠目标对象的查询记录进行推送信息的确定，而是根据目标对象的查询记录确定与目标对象的对象属性相似度较高的关联对象，并根据关联对象的关联信息库生成推荐信息列表，由于不同的关联对象所浏览的信息领域较多，且关联对象与目标对象的相似度较高，从而可以推断关联对象感兴趣的信息领域也很大可能是目标对象所感兴趣的信息领域，实现了自动扩展推送信息的信息领域的目的，在保证精准推送的同时，也能够提高信息领域的范围，提高目标对象的信息推送效率。

图8是本发明另一实施例提供的一种终端设备的示意图。如图8所示，该实施例的终端设备8包括：处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82，例如信息推送的程序。所述处理器80执行所述计算机程序82时实现上述各个信息推送的方法实施例中的步骤，例如图1所示的S101至S105。或者，所述处理器80执行所述计算机程序82时实现上述各装置实施例中各单元的功能，例如图7所示模块71至75功能。

示例性的，所述计算机程序82可以被分割成一个或多个单元，所述一个或者多个单元被存储在所述存储器81中，并由所述处理器80执行，以完成本发明。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段，该指令段用于描述所述计算机程序82在所述终端设备8中的执行过程。例如，所述计算机程序82可以被分割成信息查询记录获取单元、相似度计算单元、关联对象选取单元、推荐信息列表生成单元以及待推送信息列表生成单元，各单元具体功能如上所述。

所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括，但不仅限于，处理器80、存储器81。本领域技术人员可以理解，图8仅仅是终端设备8的示例，并不构成对终端设备8的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件，例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器80可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器81可以是所述终端设备8的内部存储单元，例如终端设备8的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备，例如所述终端设备8上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。进一步地，所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

一种信息推送的方法，其特征在于，包括：

获取目标对象的信息查询记录；

根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度；

基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象；

基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息；

对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。
根据权利要求1所述的方法，其特征在于，所述根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度，包括：

从所述信息查询记录中提取所述目标对象的多个第一信息，以及从所述候选查询记录中提取所述候选对象的多个第二信息；

分别将各个所述第一信息词向量转换模型，生成所述第一信息对应的第一词向量，以及将各个所述第二信息导入到所述词向量转换模型，生成所述第二信息对应的第二词向量；

将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子；

获取所述目标对象的目标属性，以及获取所述候选对象的候选属性；

根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子；

将所述第一相似因子以及所述第二相似因子导入预设的相似度计算模型，确定所述目标对象以及所述候选对象之间的所述相似度；所述相似度计算模型具体为：

Sim(A,X)＝W _IC·Sim _IC(A,X)+W _SC·Sim _SC(A,X)

其中，Sim(A,X)为所述候选对象与所述目标对照之间的所述相似度；Sim _IC(A,X)为所述第一相似因子；Sim _SC(A,X)为所述第二相似因子；W _IC以及W _SC为预设系数。
根据权利要求2所述的方法，其特征在于，所述将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子，包括：

分别将各个所述第二词向量以及所述第一词向量导入到预设的相似距离计算模型，确定所述第二词向量的相似距离；所述相似距离计算模型具体为：

其中，v _2i为第i个所述第二词向量的所述相似距离；
为所述第i个所述第二词向量；
为所述第j个所述第一词向量；L ₁为所述第一词向量的总个数；L ₂为所述第二词向量的总个数；Max{x}为最大值选取函数；

根据各个所述第二词向量的所述相似距离，计算所述候选对象与所述目标对象之间的所述第一相似因子；计算所述相似度的模型具体为：

其中，L为预设的词向量长度。
根据权利要求2所述的方法，其特征在于，所述目标属性包括所述目标对象的目标年龄以及目标地址；所述候选属性包括所述候选对象的候选年龄以及候选地址；

所述根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子，包括：

计算任意两个所述候选地址之间的第一距离值，以及计算任一所述候选地址与所述目标地址之间的第二距离值；

从所有所述第一距离值以及所述第二距离值中选取距离最大值，并将所述距离最大值识别为距离基准值；

将所述候选对象的候选地址以及所述候选年龄和所述目标对象的目标地址以及所述目标年龄导入到第二相似因子计算模型，计算所述候选对象与所述目标对象之间的所述第二相似因子；所述第二相似因子计算模型具体为：

其中，age _A为所述目标年龄；age _X为所述候选年龄，Add _A为所述目标地址；Add _X为所述候选地址；Max_Range为所述距离基准值；α和β为预设系数；Min(age _A,age _X)为最小值选取函数；Range(Add _A,Add _X)为距离计算函数。
根据权利要求1-4任一项所述的方法，其特征在于，所述基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息，包括：

基于各个所述历史查询信息的查询时间，选取所述查询时间在预设的有效时间范围内的所述历史查询信息作为有效查询信息；

基于所述有效查询信息对应的第二信息，统计各个所述第二信息的第一出现次数；

将所述第二信息的所述出现次数以及第二词向量导入到推荐度计算模型，计算所述第二信息的推荐度；所述推荐度计算模型具体为：

其中，
为所述推荐度；N _wi为所述第一出现次数；
为所述第二词向量；
为所述目标对象第j个已查询的目标信息对应的第一目标向量；L ₁为所述目标信息的总数；

基于各个所述第二信息的推荐度，生成所述推荐信息列表。
根据权利要求1-4任一项所述的方法，其特征在于，所述对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表，包括：

基于各个所述推荐信息列表包含的推荐信息，统计各个所述推荐信息在所有所述推荐信息列表中的第二出现次数；

根据所述第二出现次数确定各个所述推荐信息的推送优先级；

基于所述推送优先级生成所述待推送信息列表。
一种信息推送的设备，其特征在于，包括：

信息查询记录获取单元，用于获取目标对象的信息查询记录；

相似度计算单元，用于根据所述信息查询记录以及候选对象的候选查询记录，计算所述候选对象与所述目标对象之间的相似度；

关联对象选取单元，用于基于各个所述候选对象对应的所述相似度，从所述候选对象中选取所述目标对象的关联对象；

推荐信息列表生成单元，用于基于所述关联对象的关联信息库，生成与所述目标对象匹配的推荐信息列表；所述关联信息库包含有所述关联对象的历史查询信息；

待推送信息列表生成单元，用于对所有所述关联对象的所述推荐信息列表进行合并，生成所述目标对象的待推送信息列表。
根据权利要求6所述的生成设备，其特征在于，所述相似度计算单元包括：

信息提取单元，用于从所述信息查询记录中提取所述目标对象的多个第一信息，以及从所述候选查询记录中提取所述候选对象的多个第二信息；

词向量转换单元，用于分别将各个所述第一信息词向量转换模型，生成所述第一信息对应的第一词向量，以及将各个所述第二信息导入到所述词向量转换模型，生成所述第二信息对应的第二词向量；

第一相似因子计算单元，用于将所述第一词向量以及所述第二词向量导入到预设的第一相似因子计算模型，计算所述候选对象以及所述目标对象之间的第一相似因子；

对象属性获取单元，用于获取所述目标对象的目标属性，以及获取所述候选对象的候选属性；

第二相似因子计算单元，用于根据所述目标属性以及所述候选属性，计算所述目标对象以及所述候选对象之间的第二相似因子；

相似度计算单元，用于将所述第一相似因子以及所述第二相似因子导入预设的相似度计算模型，确定所述目标对象以及所述候选对象之间的所述相似度；所述相似度计算模型具体为：

Sim(A,X)＝W _IC·Sim _IC(A,X)+W _SC·Sim _SC(A,X)

其中，Sim(A,X)为所述候选对象与所述目标对照之间的所述相似度；Sim _IC(A,X)为所述第一相似因子；Sim _SC(A,X)为所述第二相似因子；W _IC以及W _SC为预设系数。
一种终端设备，其特征在于，所述终端设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时如权利要求1至6任一项所述方法的步骤。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。