CN107958042B - 一种目标专题的推送方法及移动终端 - Google Patents

一种目标专题的推送方法及移动终端 Download PDF

Info

Publication number
CN107958042B
CN107958042B CN201711182145.8A CN201711182145A CN107958042B CN 107958042 B CN107958042 B CN 107958042B CN 201711182145 A CN201711182145 A CN 201711182145A CN 107958042 B CN107958042 B CN 107958042B
Authority
CN
China
Prior art keywords
user
target
topic
information
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711182145.8A
Other languages
English (en)
Other versions
CN107958042A (zh
Inventor
吴绍杰
魏茂升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vivo Mobile Communication Co Ltd
Original Assignee
Vivo Mobile Communication Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vivo Mobile Communication Co Ltd filed Critical Vivo Mobile Communication Co Ltd
Priority to CN201711182145.8A priority Critical patent/CN107958042B/zh
Publication of CN107958042A publication Critical patent/CN107958042A/zh
Application granted granted Critical
Publication of CN107958042B publication Critical patent/CN107958042B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供了一种目标专题的推送方法及移动终端,涉及通信技术领域。本发明实施例中,在接收到用户访问目标专题的客户端的请求的情况下,获取用户的用户兴趣标签,在预设的第一数据库中,查找与用户兴趣标签相匹配的目标专题序列,基于目标专题序列,生成专题页面,将专题页面推送至目标专题的客户端。在第一数据库中查找与用户兴趣标签相匹配的目标专题序列,根据目标专题序列生成专题页面并推送至目标专题的客户端,用户可在客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,自动生成契合用户兴趣的专题内容并推送给用户,提高了专题内容契合用户兴趣的概率;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。

Description

一种目标专题的推送方法及移动终端
技术领域
本发明实施例涉及通信技术领域,尤其涉及一种目标专题的推送方法及移动终端。
背景技术
随着用户对目标专题的访问需求的不断增强,如新闻专题、视频专题、小说专题、应用专题等,各个目标专题的客户端都在增强信息流内专题内容的时效性和质量度。
目前,各个目标专题大多依赖人工编辑完成,手动选取专题内容对专题整体的时效性有一定影响,且效率较低;人工配置的同时还容易产生配置的失误,且人工编辑的专题缺乏个性化定制度,无法全面的契合用户真实的兴趣;另外,专题内容的推送需运营人工配置,同样会产生时效性的滞后,同时增加了人工工作量。
发明内容
本发明实施例提供一种目标专题的推送方法、移动终端及计算机可读存储介质,以解决目前推送的专题内容无法契合用户的兴趣,且时效性低、人工工作量大的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,提供了一种目标专题的推送方法,包括:
在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签;
在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列;
基于所述目标专题序列,生成专题页面;
将所述专题页面推送至所述目标专题的客户端。
第二方面,本发明实施例提供了一种移动终端,包括:
用户兴趣标签获取模块,用于在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签;
目标专题序列查找模块,用于在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列;
专题页面生成模块,用于基于所述目标专题序列,生成专题页面;
专题页面推送模块,用于将所述专题页面推送至所述目标专题的客户端。
第三方面,本发明实施例还提供了一种移动终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现本发明所述的目标专题的推送方法的步骤。
第四方面,本发明实施例另外提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现本发明所述的目标专题的推送方法的步骤。
在本发明实施例中,在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签,在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列,基于所述目标专题序列,生成专题页面,将所述专题页面推送至所述目标专题的客户端。根据用户兴趣标签,在预设的第一数据库中查找与用户兴趣标签相匹配的目标专题序列,根据目标专题序列生成专题页面并推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,自动生成契合用户兴趣的专题内容并推送给用户,提高了专题内容契合用户兴趣的概率;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。
附图说明
图1示出了本发明实施例提供的目标专题的推送方法的流程图之一;
图2示出了本发明实施例提供的目标专题的推送方法的流程图之二;
图3示出了本发明实施例提供的移动终端的结构框图之一;
图4示出了本发明实施例提供的移动终端的结构框图之二;
图5示出了本发明实施例提供的移动终端的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,示出了本发明实施例提供的目标专题的推送方法的流程图之一,具体可以包括如下步骤:
步骤101,在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签。
在本发明实施例中,在移动终端中可安装目标专题的客户端应用,当用户打开目标专题的客户端应用,访问目标专题的客户端时,则可接收到用户访问目标专题的客户端的请求,相应的,在接收到用户访问目标专题的客户端的请求的情况下,获取该用户的用户兴趣标签。
其中,目标专题为新闻专题、视频专题、小说专题、应用专题中的任意一个。
以目标专题为新闻专题进行说明,目标专题的客户端应用为可以浏览新闻的应用,如腾讯新闻应用;用户兴趣标签为新闻专题中用户感兴趣的新闻标签,如娱乐新闻、社会新闻、军事新闻等。
步骤102,在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列。
在本发明实施例中,在预设的第一数据库中存储有各种历史专题数据,当有新的专题数据产生时,实时更新第一数据库中的历史专题数据。
根据用户的用户兴趣标签,在预设的第一数据库中查找与用户兴趣标签相匹配的目标专题序列,查找到的目标专题序列契合用户的兴趣。
其中,第一数据库中可存储有各种类型的数据,当目标专题为新闻专题时,第一数据库也可以称为新闻数据库,新闻数据库中存储有新闻数据;当目标专题为视频专题时,第一数据库也可以称为视频数据库,视频数据库中存储有视频数据。
例如,目标专题为新闻专题,且用户兴趣标签为娱乐新闻,则在新闻数据库中查找与用户兴趣标签相匹配的目标专题序列,查找到的目标专题序列包括娱乐新闻信息A1、A2、A3。
步骤103,基于所述目标专题序列,生成专题页面。
在本发明实施例中,根据查找到的目标专题序列,生成专题页面,则在专题页面中包括有查找到的目标专题序列。
例如,根据查找到的娱乐新闻信息A1、A2、A3,生成专题页面A,则在专题页面A中包括有娱乐新闻信息A1、A2、A3。
步骤104,将所述专题页面推送至所述目标专题的客户端。
在本发明实施例中,将生成的专题页面推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面。
其中,客户端在接收到推送的专题页面后,可通过系统通知栏推送、应用内弹出窗口信息、信息流内容插入等方式,将专题页面推送给用户,用户打开专题页面,可查看专题页面中的目标专题序列。
例如,目标专题的客户端为腾讯新闻应用,将专题页面A推送至腾讯新闻应用,用户可在腾讯新闻应用中查看到推送的专题页面A,用户打开专题页面A,可查看题页面A中的娱乐新闻信息A1、A2、A3。
在本发明实施例中,在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签,在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列,基于所述目标专题序列,生成专题页面,将所述专题页面推送至所述目标专题的客户端。根据用户兴趣标签,在预设的第一数据库中查找与用户兴趣标签相匹配的目标专题序列,根据目标专题序列生成专题页面并推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,自动生成契合用户兴趣的专题内容并推送给用户,提高了专题内容契合用户兴趣的概率;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。
参照图2,示出了本发明实施例提供的目标专题的推送方法的流程图之二,具体可以包括如下步骤:
步骤201,获取所述第一数据库中的历史专题数据。
在本发明实施例中,在预设的第一数据库中存储有各种历史专题数据,获取第一数据库中的历史专题数据。当有新的专题数据产生时,实时更新第一数据库中的历史专题数据。
步骤202,根据所述历史专题数据,生成所述目标专题的信息标签矩阵。
在本发明实施例中,根据第一数据库中的历史专题数据,生成目标专题的信息标签矩阵。
具体的,目标专题的信息标签矩阵的生成过程可以包括以下子步骤Ⅰ至子步骤Ⅴ:
子步骤Ⅰ,对所述第一数据库中的所有历史专题数据的标题与内容进行分词处理,得到词向量。
对于第一数据库中的历史专题数据,将所有历史专题数据的标题与内容进行分词处理,保持各个词语的顺序不变,并去除其中的停用词。在分词处理时,将标题中的词语重复两次,再与内容中的词语组合得到词集。
若该词集中包含n个词语,词集中的词语分别表示为:
w1,w2,w3,w4,w5,...,wn; (1)
词集中的n个词语组成n维词向量,w1至wn分别表示词集中的一个词语。
例如,目标专题为新闻专题,对应的新闻数据库中的历史专题数据为历史新闻,若其中一篇历史新闻中的标题为:媒体曝出张三求婚李四成功,内容为:当日也是李四的36岁生日,则最终得到的词集为[媒体][曝][张三][求婚][李四][成功][媒体][曝][张三][求婚][李四][成功][李四][36岁][生日]。
子步骤Ⅱ,按照预设的共现窗口和步长,在所述词向量中,截取第一共现词对。
预先确定共现窗口为k,设置步长为1,则截取公式(1)中的n维词向量中的第一共现词对。
共现窗口截取为:[w1,w2,...,wk],[w2,w3,...,wk+1],…,[wn-k,wn-k+1,...,wn-1],[wn-k+1,wn-k+2,...,wn]; (2)
第一共现词对为:[w1,w2],[w1,w3],…,[w1,wk],[w2,w3],…,[wn-2,wn],[wn-1,wn];(3)
子步骤Ⅲ,基于所述第一共现词对,生成标签集合。
根据公式(3)中的第一共现词对,生成标签集合,标签集合的具体生成方法为:
基于所述第一共现词对的出现频次,过滤掉所述出现频次小于第一阈值的第一共现词对,得到第二共现词对;在所述第二共现词对中,计算每个第二共现词对中主词与副词的关联度;将主词相同的第二共现词对合并,并按照所述关联度进行排序,得到对应的关联度向量;计算所述关联度向量的方差;将所述方差小于第二阈值对应的主词过滤掉,得到标签集合。
首先,对于第一数据库中的历史专题数据,将所有历史专题数据的第一共现词对按照出现频次加和,过滤其中出现频次小于第一阈值的第一共现词对,得到第二共现词对,假设第二共现词对中的剩余主词为m个,则第二共现词对[w1,w2]共现x1次,主词w1出现总频次为y1次;第二共现词对[w1,w3]共现x2次;…;第二共现词对[wm,wm-1]共现xj次,主词wm出现总频次为ym次。
接着,在第二共现词对中,计算每个第二共现词对中主词与副词的关联度。
例如,第二共现词对[w1,w2]的关联度为:
Figure BDA0001479376500000061
以此类推,计算其它第二共现词对中主词与副词的关联度。
然后,将主词相同的第二共现词对合并,并按照关联度进行排序,排序结果为:(w1,[w23,w7,w2,w5,...,w35]);
对应关联度向量为:(w1,[c23,c7,c2,c5,…,c35]); (5)
最后,计算公式(5)中的关联度向量的方差σ(w1),设置第二阈值,将方差小于第二阈值对应的主词过滤掉,剩余L个主词,存储剩余L个主词对应的L维向量,即为标签集合G。其中,标签集合G每日更新一次。
子步骤Ⅳ,对于所述第一数据库中的每个历史专题数据,根据所述第一共现词对和所述标签集合,生成信息标签集合。
对于第一数据库中的每个历史专题数据,根据公式(3)中的第一共现词对和标签集合G,生成信息标签集合。
信息标签集合的具体生成方法为:计算所述第一共现词对的共现概率,得到共现概率方阵;对预设的初始词权向量进行迭代处理,得到新词权向量;当迭代次数大于第三阈值,或者当第一数值与第二数值的比值小于第四阈值时,将最后一次迭代得到的新词权向量确定为目标词权向量;抽取所述目标词权向量中词权大于1的目标关键词;将所述标签集合中的主词与所述目标关键词进行匹配,得到匹配结果;对所述匹配结果进行权重归一化处理后,得到所述信息标签集合;其中,所述第一数值为所述初始词权向量与所述新词权向量的差向量的模,所述第二数值为所述新词权向量的模与1的加和结果。
首先,计算公式(3)中的第一共现词对在每个历史专题数据中的共现概率,得到n维共现概率方阵matp
Figure BDA0001479376500000071
其中,共现概率的计算公式为第一共现词对的出现频次除以副词的出现频次,z23表示第2个词与第3个词的共现概率,其他的共现概率的含义以此类推。
然后,设定公式(1)中的n维词向量对应的初始词权向量为:
Q=(1,1,1,……,1);(7)
假定初始词权向量Q=QOLD,对初始词权向量QOLD进行迭代运算,计算得到新词权向量QNEW,对应的迭代公式为:
QNEW T=0.87*matp*QOLD T+0.13; (8)
当迭代次数大于第三阈值,或者|QOLD-QNEW|/(|QNEW|+1)小于第四阈值时,将最后一次迭代得到的新词权向量QNEW确定为目标词权向量。
最后,抽取目标词权向量中词权大于1的目标关键词,将标签集合G中的主词与抽取的目标关键词进行匹配,在标签集合G和抽取的目标关键词中,获取两者共有的词语,得到匹配结果,对匹配结果进行权重归一化处理后,得到信息标签集合。
子步骤Ⅴ,将所述第一数据库中的所有历史专题数据对应的信息标签集合合并,得到所述目标专题的信息标签矩阵。
假设第一数据库中的所有历史专题数据共有V个,将V个历史专题数据对应的信息标签集合合并,从而可得到目标专题的信息标签矩阵mat信息
Figure BDA0001479376500000081
其中,fVL表示第V个历史专题数据的第L个标签权重。
需要说明的是,信息标签矩阵每日更新一次,而历史专题数据根据推送周期进行更新。
步骤203,在接收到用户访问目标专题的客户端的请求的情况下,检测预设的第二数据库中是否存在所述用户的用户兴趣标签。
在本发明实施例中,当用户打开目标专题的客户端应用,访问目标专题的客户端时,则接收到用户访问目标专题的客户端的请求,在接收到用户访问目标专题的客户端的请求的情况下,检测预设的第二数据库中是否存在该用户的用户兴趣标签。其中,第二数据库中存储有多个用户的用户兴趣标签。
当存在时,执行步骤204;当不存在时,执行步骤205至步骤207。
针对新老用户,获取以不同的方式生成的用户兴趣标签,为所有用户推送契合用户兴趣的专题,实现专题内容推送的全面性。
步骤204,若检测到存在所述用户的用户兴趣标签,则从所述第二数据库中,提取所述用户的用户兴趣标签。
在本发明实施例中,当检测到存在该用户的用户兴趣标签时,则判定该用户为老用户,从第二数据库中,直接提取预先生成的用户兴趣标签。
下面具体介绍用户兴趣标签的生成过程:获取所述用户的历史记录数据;计算所述历史记录数据的权重,得到权重向量;对所述信息标签矩阵的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵;将所述权重向量乘以所述用户阅读标签矩阵,得到所述用户的兴趣向量;根据所述用户的兴趣向量,生成用户兴趣标签矩阵。
首先,获取所有用户在设定周期内的历史记录数据,假设某一用户的历史记录数据共有W个,计算该用户的历史记录数据的权重:
Figure BDA0001479376500000092
其中,r表示用户浏览或搜索的某个历史记录数据的权重,d为用户浏览或搜索某个历史记录数据的日期距离当前时刻的天数,U表示设定周期。
需要说明的是,历史记录数据可以是用户的历史浏览数据,也可以是用户主动搜索的内容。
例如,当目标专题为新闻专题时,历史记录数据可以为用户阅读新闻的数据,也可以为用户通过关键词或其他方式搜索的新闻数据。
通过公式(10)中的权重计算方法,对于W个历史记录数据,可生成W维权重向量R=(r1,r2,r3,r4,r5,...,rW)。 (11)
然后,对公式(9)中信息标签矩阵mat信息的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵mat标签
Figure BDA0001479376500000091
其中,eWL表示用户浏览或搜索第W个历史记录数据,标签L的归一化权重。
接着,将公式(11)中的权重向量R乘以公式(12)中的户阅读标签矩阵mat标签,得到所述用户的L维兴趣向量H:
H=R*mat标签 (13)
最后,对所有用户计算兴趣向量,从而得到用户兴趣标签矩阵mat兴趣,用户兴趣标签矩阵中的行向量表示一个用户的兴趣向量。
需要说明的是,若用户之前有打开目标专题的客户端应用,访问目标专题的客户端时,会存在用户的历史记录数据,或者,用户之前通过关键词或其他方式搜索相关的数据,也会存在用户的历史记录数据。因此,可根据历史记录数据生成用户兴趣标签,且生成的用户兴趣标签以用户兴趣标签矩阵的形式进行表示。
步骤205,若检测到不存在所述用户的用户兴趣标签,则获取所述用户的属性信息。
在本发明实施例中,当检测到不存在该用户的用户兴趣标签时,则判定该用户为新用户,获取新用户的属性信息。其中,所述属性信息包括人口学信息、应用安装信息、系统使用信息、账号信息和移动终端标识信息;移动终端标识信息也可称为IMEI(International Mobile Equipment Identity,国际移动设备识别码)信息。
步骤206,根据所述属性信息,确定所述用户的属性类别。
在本发明实施例中,预先分析各个用户的属性信息,构建各个人群画像,根据人群画像将用户划分成不同的属性类别。根据获取到的新用户的属性信息,构建新用户的初始画像,将新用户的初始画像与预先划分的人群画像进行匹配,确定相似度最高的人群画像对应的属性类别。
步骤207,根据所述用户的属性类别,获取与所述用户的属性类别相匹配的用户兴趣标签。
在本发明实施例中,预先根据人群画像将用户划分成不同的属性类别,针对每个属性类别,根据该属性类别中各个用户的历史记录数据,生成符合大多数用户兴趣的用户兴趣标签,具体的生成方法可参照步骤204中的用户兴趣标签矩阵的生成方法。
当确定新用户的属性类别后,在预先生成的用户兴趣标签中,获取与新用户的属性类别相匹配的用户兴趣标签。
例如,以目标专题为新闻专题进行说明,预先划分的属性类别为女大学生、男高中生等,女大学生对应的用户兴趣标签为娱乐新闻,男高中生对应的用户兴趣标签为军事新闻;对于一个新用户来说,获取新用户的属性信息,对应构建的初始画像中,新用户的性别:女,学历:大学生,则确定新用户的属性类别为女大学生,获取对应的用户兴趣标签为娱乐新闻。
步骤208,将所述用户兴趣标签对应的用户兴趣标签矩阵乘以所述信息标签矩阵的转置矩阵,计算得到信息推送矩阵。
在本发明实施例中,将用户兴趣标签对应的用户兴趣标签矩阵mat兴趣,乘以信息标签矩阵mat信息的转置矩阵,计算得到信息推送矩阵mat推送,计算公式为:
Figure BDA0001479376500000111
步骤209,在所述信息推送矩阵对应的行维度中,选取预设数值对应的历史专题数据,得到目标专题序列。
在本发明实施例中,在公式(14)中计算得到的信息推送矩阵对应的行维度中,选取预设数值对应的历史专题数据,作为该行维度对应的用户的目标专题序列。其中,所述预设数值取值大于零。
步骤210,获取所述目标专题序列的关注度。
在本发明实施例中,针对所有的目标专题序列,获取目标专题序列的关注度。其中,所述关注度包括点击率、评论量和发布周期。
步骤211,根据所述目标专题序列的关注度,对所述目标专题序列进行排序。
在本发明实施例中,对于所有的目标专题序列,按照关注度的取值大小对目标专题序列进行排序,获得关注度排序结果。
关注度的取值越大时,排序越靠前;关注度的取值越小时,排序越靠后。
步骤212,根据排序靠前的N个目标专题序列,生成专题页面。
在本发明实施例中,根据专题内容的数量要求,可人工配置设定阈值N,所述N为大于或等于1的正整数。
针对所有的目标专题序列,自动截取排序靠前的N个目标专题序列填充至专题列表中,根据专题列表中的第一条目标专题序列的题目,自动生成专题标题与专题背景图片,拼接专图片与信息内容,生成专题页面。
通过将当前关注度最高且契合用户兴趣的N个目标专题序列,自动生成专题页面并推送给用户,提高了专题推送的有效性。若将关注度较低的目标专题序列生成专题页面并推送给用户,由于其中的目标专题序列的关注度较低,用户可能不会查看专题页面,使得专题页面推送的有效性降低,因此,将关注度最高的N个目标专题序列生成专题页面并推送给用户,可相应提高专题页面推送的有效性。
步骤213,将所述专题页面推送至所述目标专题的客户端。
此步骤与实施例一中的步骤104原理类似,在此不再详述。
在本发明一种优选的实施例中,在步骤213之后,还可以获取所述用户访问所述专题页面的记录;根据所述用户访问所述专题页面的记录,更新所述用户的历史记录数据;计算所述历史记录数据的权重,得到权重向量;对所述信息标签矩阵的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵;将所述权重向量乘以所述用户阅读标签矩阵,得到所述用户的兴趣向量;根据所述用户的兴趣向量,更新所述用户兴趣标签对应的用户兴趣标签矩阵。
在本发明实施例中,在将专题页面推送给目标专题的客户端后,用户可查看专题页面中的各个目标专题序列,记录用户查看专题页面中各个目标专题序列的相关数据,获取用户访问专题页面的相关记录。
根据用户访问专题页面的相关记录,更新用户的历史记录数据,假设某一用户原本的历史记录数据共有W个,相关记录中的数据共有2个,则更新后的历史记录数据为W+2个。
然后,参照步骤204中的公式(10)计算历史记录数据的权重,得到权重向量,相应的,参照步骤204中的用户阅读标签矩阵、用户的兴趣向量的生成方法,得到更新后的用户的兴趣向量。
最后,根据更新后的用户兴趣向量,更新用户兴趣标签对应的用户兴趣标签矩阵。
在本发明实施例中,根据用户访问专题页面的相关记录,更新该用户的用户兴趣标签,以便用户后续访问目标专题时,获取到的用户兴趣标签更准确,使得推送的专题内容也更契合用户的兴趣。
在本发明实施例中,根据用户兴趣标签矩阵与预先生成的信息标签矩阵,获取目标专题序列,根据关注度排序靠前的N个目标专题序列生成专题页面并推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,将当前关注度最高的N个目标专题序列动生成契合用户兴趣的专题并推送给用户,提高了专题契合用户兴趣的概率,也提高了专题推送的有效性;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。
参照图3,示出了本发明实施例提供的移动终端的结构框图之一。
所述移动终端300包括:用户兴趣标签获取模块301、目标专题序列查找模块302、专题页面生成模块303和专题页面推送模块304。
用户兴趣标签获取模块301,用于在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签。
目标专题序列查找模块302,用于在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列。
专题页面生成模块303,用于基于所述目标专题序列,生成专题页面。
专题页面推送模块304,用于将所述专题页面推送至所述目标专题的客户端。
参照图4,示出了本发明实施例提供的移动终端的结构框图之二。
在图3的基础上,可选的,所述用户兴趣标签获取模块301,可以包括:用户兴趣标签检测子模块3011,用于检测预设的第二数据库中是否存在所述用户的用户兴趣标签;用户兴趣标签提取子模块3012,用于若检测到存在所述用户的用户兴趣标签,则从所述第二数据库中,提取所述用户的用户兴趣标签。
可选的,所述用户兴趣标签获取模块301,还可以包括:属性信息获取子模块3013,用于若检测到不存在所述用户的用户兴趣标签,则获取所述用户的属性信息;属性类别确定子模块3014,用于根据所述属性信息,确定所述用户的属性类别;用户兴趣标签获取子模块3015,用于根据所述用户的属性类别,获取与所述用户的属性类别相匹配的用户兴趣标签;其中,所述属性信息包括人口学信息、应用安装信息、系统使用信息、账号信息和移动终端标识信息。
可选的,所述移动终端300,还可以包括:历史专题数据获取模块305,用于获取所述第一数据库中的历史专题数据;信息标签矩阵生成模块306,用于根据所述历史专题数据,生成所述目标专题的信息标签矩阵。
可选的,所述信息标签矩阵生成模块306,可以包括:分词处理子模块3061,用于对所述第一数据库中的所有历史专题数据的标题与内容进行分词处理,得到词向量;第一共现词对截取子模块3062,用于按照预设的共现窗口和步长,在所述词向量中,截取第一共现词对;标签集合生成子模块3063,用于基于所述第一共现词对,生成标签集合;信息标签集合生成子模块3064,用于对于所述第一数据库中的每个历史专题数据,根据所述第一共现词对和所述标签集合,生成信息标签集合;信息标签集合合并子模块3065,用于将所述第一数据库中的所有历史专题数据对应的信息标签集合合并,得到所述目标专题的信息标签矩阵。
可选的,所述标签集合生成子模块,可以包括:第一共现词对过滤单元,用于基于所述第一共现词对的出现频次,过滤掉所述出现频次小于第一阈值的第一共现词对,得到第二共现词对;关联度计算单元,用于在所述第二共现词对中,计算每个第二共现词对中主词与副词的关联度;关联度向量确定单元,用于将主词相同的第二共现词对合并,并按照所述关联度进行排序,得到对应的关联度向量;方差计算单元,用于计算所述关联度向量的方差;标签集合生成单元,用于将所述方差小于第二阈值对应的主词过滤掉,得到标签集合。
可选的,所述信息标签集合生成子模块,可以包括:共现概率计算单元,用于计算所述第一共现词对的共现概率,得到共现概率方阵;迭代处理单元,用于对预设的初始词权向量进行迭代处理,得到新词权向量;目标词权向量确定单元,用于当迭代次数大于第三阈值,或者当第一数值与第二数值的比值小于第四阈值时,将最后一次迭代得到的新词权向量确定为目标词权向量;目标关键词抽取单元,用于抽取所述目标词权向量中词权大于1的目标关键词;匹配单元,用于将所述标签集合中的主词与所述目标关键词进行匹配,得到匹配结果;信息标签集合生成单元,用于对所述匹配结果进行权重归一化处理后,得到所述信息标签集合;其中,所述第一数值为所述初始词权向量与所述新词权向量的差向量的模,所述第二数值为所述新词权向量的模与1的加和结果。
可选的,所述目标专题序列查找模块302,可以包括:信息推送矩阵计算子模块3021,用于将所述用户兴趣标签对应的用户兴趣标签矩阵乘以所述信息标签矩阵的转置矩阵,计算得到信息推送矩阵;目标专题序列确定子模块3022,用于在所述信息推送矩阵对应的行维度中,选取预设数值对应的历史专题数据,得到目标专题序列;其中,所述预设数值取值大于零。
可选的,所述专题页面生成模块303,可以包括:关注度获取子模块3031,用于获取所述目标专题序列的关注度;目标专题序列排序子模块3032,用于根据所述目标专题序列的关注度,对所述目标专题序列进行排序;专题页面生成子模块3033,用于根据排序靠前的N个目标专题序列,生成专题页面;其中,所述关注度包括点击率、评论量和发布周期;所述N为大于或等于1的正整数。
可选的,所述移动终端,还可以包括:记录获取模块,用于获取所述用户访问所述专题页面的记录;历史记录数据更新模块,用于根据所述用户访问所述专题页面的记录,更新所述用户的历史记录数据;权重计算模块,用于计算所述历史记录数据的权重,得到权重向量;用户阅读标签矩阵确定模块,用于对所述信息标签矩阵的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵;兴趣向量生成模块,用于将所述权重向量乘以所述用户阅读标签矩阵,得到所述用户的兴趣向量;用户兴趣标签矩阵更新模块,用于根据所述用户的兴趣向量,更新所述用户兴趣标签对应的用户兴趣标签矩阵。
本发明实施例提供的移动终端能够实现图1至图2的方法实施例中移动终端实现的各个过程,为避免重复,这里不再赘述。
在本发明实施例中,在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签,在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列,基于所述目标专题序列,生成专题页面,将所述专题页面推送至所述目标专题的客户端。根据用户兴趣标签,在预设的第一数据库中查找与用户兴趣标签相匹配的目标专题序列,根据目标专题序列生成专题页面并推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,自动生成契合用户兴趣的专题内容并推送给用户,提高了专题内容契合用户兴趣的概率;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。
参照图5,示出了本发明实施例提供的移动终端的硬件结构示意图。
该移动终端500包括但不限于:射频单元501、网络模块502、音频输出单元503、输入单元504、传感器505、显示单元506、用户输入单元507、接口单元508、存储器509、处理器510、以及电源511等部件。本领域技术人员可以理解,图5中示出的移动终端结构并不构成对移动终端的限定,移动终端可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。在本发明实施例中,移动终端包括但不限于手机、平板电脑、笔记本电脑、掌上电脑、车载终端、可穿戴设备、以及计步器等。
其中,处理器510用于在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签;在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列;基于所述目标专题序列,生成专题页面;将所述专题页面推送至所述目标专题的客户端。
在本发明实施例中,在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签,在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列,基于所述目标专题序列,生成专题页面,将所述专题页面推送至所述目标专题的客户端。根据用户兴趣标签,在预设的第一数据库中查找与用户兴趣标签相匹配的目标专题序列,根据目标专题序列生成专题页面并推送至目标专题的客户端,用户可在目标专题的客户端中查看到推送的专题页面,针对每一个用户的兴趣喜好,自动生成契合用户兴趣的专题内容并推送给用户,提高了专题内容契合用户兴趣的概率;同时,提高了专题内容推送的时效性与效率,减少了人工工作量。
应理解的是,本发明实施例中,射频单元501可用于收发信息或通话过程中,信号的接收和发送,具体的,将来自基站的下行数据接收后,给处理器510处理;另外,将上行的数据发送给基站。通常,射频单元501包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外,射频单元501还可以通过无线通信系统与网络和其他设备通信。
移动终端通过网络模块502为用户提供了无线的宽带互联网访问,如帮助用户收发电子邮件、浏览网页和访问流式媒体等。
音频输出单元503可以将射频单元501或网络模块502接收的或者在存储器509中存储的音频数据转换成音频信号并且输出为声音。而且,音频输出单元503还可以提供与移动终端500执行的特定功能相关的音频输出(例如,呼叫信号接收声音、消息接收声音等等)。音频输出单元503包括扬声器、蜂鸣器以及受话器等。
输入单元504用于接收音频或视频信号。输入单元504可以包括图形处理器(Graphics Processing Unit,GPU)5041和麦克风5042,图形处理器5041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元506上。经图形处理器5041处理后的图像帧可以存储在存储器509(或其它存储介质)中或者经由射频单元501或网络模块502进行发送。麦克风5042可以接收声音,并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元501发送到移动通信基站的格式输出。
移动终端500还包括至少一种传感器505,比如光传感器、运动传感器以及其他传感器。具体地,光传感器包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板5061的亮度,接近传感器可在移动终端500移动到耳边时,关闭显示面板5061和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别移动终端姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;传感器505还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等,在此不再赘述。
显示单元506用于显示由用户输入的信息或提供给用户的信息。显示单元506可包括显示面板5061,可以采用液晶显示器(Liquid Crystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板5061。
用户输入单元507可用于接收输入的数字或字符信息,以及产生与移动终端的用户设置以及功能控制有关的键信号输入。具体地,用户输入单元507包括触控面板5071以及其他输入设备5072。触控面板5071,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板5071上或在触控面板5071附近的操作)。触控面板5071可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器510,接收处理器510发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板5071。除了触控面板5071,用户输入单元507还可以包括其他输入设备5072。具体地,其他输入设备5072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。
进一步的,触控面板5071可覆盖在显示面板5061上,当触控面板5071检测到在其上或附近的触摸操作后,传送给处理器510以确定触摸事件的类型,随后处理器510根据触摸事件的类型在显示面板5061上提供相应的视觉输出。虽然在图5中,触控面板5071与显示面板5061是作为两个独立的部件来实现移动终端的输入和输出功能,但是在某些实施例中,可以将触控面板5071与显示面板5061集成而实现移动终端的输入和输出功能,具体此处不做限定。
接口单元508为外部装置与移动终端500连接的接口。例如,外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(I/O)端口、视频I/O端口、耳机端口等等。接口单元508可以用于接收来自外部装置的输入(例如,数据信息、电力等等)并且将接收到的输入传输到移动终端500内的一个或多个元件或者可以用于在移动终端500和外部装置之间传输数据。
存储器509可用于存储软件程序以及各种数据。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器510是移动终端的控制中心,利用各种接口和线路连接整个移动终端的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,执行移动终端的各种功能和处理数据,从而对移动终端进行整体监控。处理器510可包括一个或多个处理单元;优选的,处理器510可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器510中。
移动终端500还可以包括给各个部件供电的电源511(比如电池),优选的,电源511可以通过电源管理系统与处理器510逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
另外,移动终端500包括一些未示出的功能模块,在此不再赘述。
优选的,本发明实施例还提供一种移动终端,包括处理器510,存储器509,存储在存储器509上并可在所述处理器510上运行的计算机程序,该计算机程序被处理器510执行时实现上述目标专题的推送方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述目标专题的推送方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random AccessMemory,简称RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

Claims (18)

1.一种目标专题的推送方法,其特征在于,包括:
在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签;
在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列;
基于所述目标专题序列,生成专题页面;
将所述专题页面推送至所述目标专题的客户端;
在所述在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签之前,还包括:
获取所述第一数据库中的历史专题数据;
根据所述历史专题数据,生成所述目标专题的信息标签矩阵;
所述根据所述历史专题数据,生成所述目标专题的信息标签矩阵,包括:
对所述第一数据库中的所有历史专题数据的标题与内容进行分词处理,得到词向量;
按照预设的共现窗口和步长,在所述词向量中,截取第一共现词对;
基于所述第一共现词对,生成标签集合;
对于所述第一数据库中的每个历史专题数据,根据所述第一共现词对和所述标签集合,生成信息标签集合;
将所述第一数据库中的所有历史专题数据对应的信息标签集合合并,得到所述目标专题的信息标签矩阵。
2.根据权利要求1所述的方法,其特征在于,所述获取所述用户的用户兴趣标签,包括:
检测预设的第二数据库中是否存在所述用户的用户兴趣标签;
若检测到存在所述用户的用户兴趣标签,则从所述第二数据库中,提取所述用户的用户兴趣标签。
3.根据权利要求2所述的方法,其特征在于,所述检测预设的第二数据库中是否存在所述用户的用户兴趣标签之后,还包括:
若检测到不存在所述用户的用户兴趣标签,则获取所述用户的属性信息;
根据所述属性信息,确定所述用户的属性类别;
根据所述用户的属性类别,获取与所述用户的属性类别相匹配的用户兴趣标签;
其中,所述属性信息包括人口学信息、应用安装信息、系统使用信息、账号信息和移动终端标识信息。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一共现词对,生成标签集合,包括:
基于所述第一共现词对的出现频次,过滤掉所述出现频次小于第一阈值的第一共现词对,得到第二共现词对;
在所述第二共现词对中,计算每个第二共现词对中主词与副词的关联度;
将主词相同的第二共现词对合并,并按照所述关联度进行排序,得到对应的关联度向量;
计算所述关联度向量的方差;
将所述方差小于第二阈值对应的主词过滤掉,得到标签集合。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一共现词对和所述标签集合,生成信息标签集合,包括:
计算所述第一共现词对的共现概率,得到共现概率方阵;
对预设的初始词权向量进行迭代处理,得到新词权向量;
当迭代次数大于第三阈值,或者当第一数值与第二数值的比值小于第四阈值时,将最后一次迭代得到的新词权向量确定为目标词权向量;
抽取所述目标词权向量中词权大于1的目标关键词;
将所述标签集合中的主词与所述目标关键词进行匹配,得到匹配结果;
对所述匹配结果进行权重归一化处理后,得到所述信息标签集合;
其中,所述第一数值为所述初始词权向量与所述新词权向量的差向量的模,所述第二数值为所述新词权向量的模与1的加和结果。
6.根据权利要求1所述的方法,其特征在于,所述在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列,包括:
将所述用户兴趣标签对应的用户兴趣标签矩阵乘以所述信息标签矩阵的转置矩阵,计算得到信息推送矩阵;
在所述信息推送矩阵对应的行维度中,选取预设数值对应的历史专题数据,得到目标专题序列;
其中,所述预设数值取值大于零。
7.根据权利要求1所述的方法,其特征在于,所述基于所述目标专题序列,生成专题页面,包括:
获取所述目标专题序列的关注度;
根据所述目标专题序列的关注度,对所述目标专题序列进行排序;
根据排序靠前的N个目标专题序列,生成专题页面;
其中,所述关注度包括点击率、评论量和发布周期;所述N为大于或等于1的正整数。
8.根据权利要求1所述的方法,其特征在于,所述将所述专题页面推送至所述目标专题的客户端之后,还包括:
获取所述用户访问所述专题页面的记录;
根据所述用户访问所述专题页面的记录,更新所述用户的历史记录数据;
计算所述历史记录数据的权重,得到权重向量;
对所述信息标签矩阵的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵;
将所述权重向量乘以所述用户阅读标签矩阵,得到所述用户的兴趣向量;
根据所述用户的兴趣向量,更新所述用户兴趣标签对应的用户兴趣标签矩阵。
9.一种移动终端,其特征在于,包括:
用户兴趣标签获取模块,用于在接收到用户访问目标专题的客户端的请求的情况下,获取所述用户的用户兴趣标签;
目标专题序列查找模块,用于在预设的第一数据库中,查找与所述用户兴趣标签相匹配的目标专题序列;
专题页面生成模块,用于基于所述目标专题序列,生成专题页面;
专题页面推送模块,用于将所述专题页面推送至所述目标专题的客户端;
所述移动终端还包括:
历史专题数据获取模块,用于获取所述第一数据库中的历史专题数据;
信息标签矩阵生成模块,用于根据所述历史专题数据,生成所述目标专题的信息标签矩阵;
所述信息标签矩阵生成模块,包括:
分词处理子模块,用于对所述第一数据库中的所有历史专题数据的标题与内容进行分词处理,得到词向量;
第一共现词对截取子模块,用于按照预设的共现窗口和步长,在所述词向量中,截取第一共现词对;
标签集合生成子模块,用于基于所述第一共现词对,生成标签集合;
信息标签集合生成子模块,用于对于所述第一数据库中的每个历史专题数据,根据所述第一共现词对和所述标签集合,生成信息标签集合;
信息标签集合合并子模块,用于将所述第一数据库中的所有历史专题数据对应的信息标签集合合并,得到所述目标专题的信息标签矩阵。
10.根据权利要求9所述的移动终端,其特征在于,所述用户兴趣标签获取模块,包括:
用户兴趣标签检测子模块,用于检测预设的第二数据库中是否存在所述用户的用户兴趣标签;
用户兴趣标签提取子模块,用于若检测到存在所述用户的用户兴趣标签,则从所述第二数据库中,提取所述用户的用户兴趣标签。
11.根据权利要求10所述的移动终端,其特征在于,还包括:
属性信息获取子模块,用于若检测到不存在所述用户的用户兴趣标签,则获取所述用户的属性信息;
属性类别确定子模块,用于根据所述属性信息,确定所述用户的属性类别;
用户兴趣标签获取子模块,用于根据所述用户的属性类别,获取与所述用户的属性类别相匹配的用户兴趣标签;
其中,所述属性信息包括人口学信息、应用安装信息、系统使用信息、账号信息和移动终端标识信息。
12.根据权利要求9所述的移动终端,其特征在于,所述标签集合生成子模块,包括:
第一共现词对过滤单元,用于基于所述第一共现词对的出现频次,过滤掉所述出现频次小于第一阈值的第一共现词对,得到第二共现词对;
关联度计算单元,用于在所述第二共现词对中,计算每个第二共现词对中主词与副词的关联度;
关联度向量确定单元,用于将主词相同的第二共现词对合并,并按照所述关联度进行排序,得到对应的关联度向量;
方差计算单元,用于计算所述关联度向量的方差;
标签集合生成单元,用于将所述方差小于第二阈值对应的主词过滤掉,得到标签集合。
13.根据权利要求12所述的移动终端,其特征在于,所述信息标签集合生成子模块,包括:
共现概率计算单元,用于计算所述第一共现词对的共现概率,得到共现概率方阵;
迭代处理单元,用于对预设的初始词权向量进行迭代处理,得到新词权向量;
目标词权向量确定单元,用于当迭代次数大于第三阈值,或者当第一数值与第二数值的比值小于第四阈值时,将最后一次迭代得到的新词权向量确定为目标词权向量;
目标关键词抽取单元,用于抽取所述目标词权向量中词权大于1的目标关键词;
匹配单元,用于将所述标签集合中的主词与所述目标关键词进行匹配,得到匹配结果;
信息标签集合生成单元,用于对所述匹配结果进行权重归一化处理后,得到所述信息标签集合;
其中,所述第一数值为所述初始词权向量与所述新词权向量的差向量的模,所述第二数值为所述新词权向量的模与1的加和结果。
14.根据权利要求9所述的移动终端,其特征在于,所述目标专题序列查找模块,包括:
信息推送矩阵计算子模块,用于将所述用户兴趣标签对应的用户兴趣标签矩阵乘以所述信息标签矩阵的转置矩阵,计算得到信息推送矩阵;
目标专题序列确定子模块,用于在所述信息推送矩阵对应的行维度中,选取预设数值对应的历史专题数据,得到目标专题序列;
其中,所述预设数值取值大于零。
15.根据权利要求9所述的移动终端,其特征在于,所述专题页面生成模块,包括:
关注度获取子模块,用于获取所述目标专题序列的关注度;
目标专题序列排序子模块,用于根据所述目标专题序列的关注度,对所述目标专题序列进行排序;
专题页面生成子模块,用于根据排序靠前的N个目标专题序列,生成专题页面;
其中,所述关注度包括点击率、评论量和发布周期;所述N为大于或等于1的正整数。
16.根据权利要求9所述的移动终端,其特征在于,还包括:
记录获取模块,用于获取所述用户访问所述专题页面的记录;
历史记录数据更新模块,用于根据所述用户访问所述专题页面的记录,更新所述用户的历史记录数据;
权重计算模块,用于计算所述历史记录数据的权重,得到权重向量;
用户阅读标签矩阵确定模块,用于对所述信息标签矩阵的行向量进行加和归一化,并根据所述历史记录数据选取对应的行向量,得到用户阅读标签矩阵;
兴趣向量生成模块,用于将所述权重向量乘以所述用户阅读标签矩阵,得到所述用户的兴趣向量;
用户兴趣标签矩阵更新模块,用于根据所述用户的兴趣向量,更新所述用户兴趣标签对应的用户兴趣标签矩阵。
17.一种移动终端,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的目标专题的推送方法的步骤。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的目标专题的推送方法的步骤。
CN201711182145.8A 2017-11-23 2017-11-23 一种目标专题的推送方法及移动终端 Active CN107958042B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711182145.8A CN107958042B (zh) 2017-11-23 2017-11-23 一种目标专题的推送方法及移动终端

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711182145.8A CN107958042B (zh) 2017-11-23 2017-11-23 一种目标专题的推送方法及移动终端

Publications (2)

Publication Number Publication Date
CN107958042A CN107958042A (zh) 2018-04-24
CN107958042B true CN107958042B (zh) 2020-09-08

Family

ID=61961728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711182145.8A Active CN107958042B (zh) 2017-11-23 2017-11-23 一种目标专题的推送方法及移动终端

Country Status (1)

Country Link
CN (1) CN107958042B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108721896B (zh) * 2018-05-16 2022-04-01 北京奇虎科技有限公司 游戏页面的跳转方法、装置、计算设备及计算机存储介质
CN110825997B (zh) * 2018-08-09 2023-06-16 阿里巴巴(中国)有限公司 信息流页面的显示方法、装置、终端设备及系统
CN109635157B (zh) * 2018-10-30 2021-05-25 北京奇艺世纪科技有限公司 模型生成方法、视频搜索方法、装置、终端及存储介质
CN109410675B (zh) * 2018-12-12 2021-03-12 广东小天才科技有限公司 一种基于学生画像的练习题推荐方法及家教设备
CN110209958B (zh) * 2019-05-31 2022-03-15 Oppo广东移动通信有限公司 专题制作方法、装置、终端及存储介质
CN110807151A (zh) * 2019-10-24 2020-02-18 中燃慧生活电子商务有限公司 一种燃气标签推送系统
CN111639259B (zh) * 2020-05-26 2023-11-03 上海鲸甲信息科技有限公司 基于特征识别的信息推送方法及装置
CN112100440B (zh) * 2020-08-21 2023-12-12 深圳市雅阅科技有限公司 视频推送方法、设备及介质
CN113010788B (zh) * 2021-03-19 2023-05-23 成都欧珀通信科技有限公司 信息推送方法及装置、电子设备、计算机可读存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104166696A (zh) * 2014-08-01 2014-11-26 小米科技有限责任公司 应用程序推送方法及装置
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置
CN105718443A (zh) * 2016-01-26 2016-06-29 齐鲁工业大学 一种基于依存词汇关联度的形容词词义消歧方法
CN106055552A (zh) * 2016-04-19 2016-10-26 乐视控股(北京)有限公司 用户页面的显示方法及装置
CN106815284A (zh) * 2016-12-02 2017-06-09 乐视控股(北京)有限公司 新闻视频的推荐方法及推荐装置
WO2017124412A1 (zh) * 2016-01-21 2017-07-27 谢文 根据标签自动更新新闻的方法以及新闻系统
CN107220386A (zh) * 2017-06-29 2017-09-29 北京百度网讯科技有限公司 信息推送方法和装置
CN107332879A (zh) * 2017-06-05 2017-11-07 广东欧珀移动通信有限公司 一种信息推送的方法、移动终端及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9491522B1 (en) * 2013-12-31 2016-11-08 Google Inc. Methods, systems, and media for presenting supplemental content relating to media content on a content interface based on state information that indicates a subsequent visit to the content interface

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101694659A (zh) * 2009-10-20 2010-04-14 浙江大学 基于多主题追踪的个性化网络新闻推送方法
CN103886090A (zh) * 2014-03-31 2014-06-25 北京搜狗科技发展有限公司 基于用户喜好的内容推荐方法及装置
CN104166696A (zh) * 2014-08-01 2014-11-26 小米科技有限责任公司 应用程序推送方法及装置
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置
WO2017124412A1 (zh) * 2016-01-21 2017-07-27 谢文 根据标签自动更新新闻的方法以及新闻系统
CN105718443A (zh) * 2016-01-26 2016-06-29 齐鲁工业大学 一种基于依存词汇关联度的形容词词义消歧方法
CN106055552A (zh) * 2016-04-19 2016-10-26 乐视控股(北京)有限公司 用户页面的显示方法及装置
CN106815284A (zh) * 2016-12-02 2017-06-09 乐视控股(北京)有限公司 新闻视频的推荐方法及推荐装置
CN107332879A (zh) * 2017-06-05 2017-11-07 广东欧珀移动通信有限公司 一种信息推送的方法、移动终端及存储介质
CN107220386A (zh) * 2017-06-29 2017-09-29 北京百度网讯科技有限公司 信息推送方法和装置

Also Published As

Publication number Publication date
CN107958042A (zh) 2018-04-24

Similar Documents

Publication Publication Date Title
CN107958042B (zh) 一种目标专题的推送方法及移动终端
CN109800325B (zh) 视频推荐方法、装置和计算机可读存储介质
WO2021169347A1 (zh) 提取文本关键字的方法及装置
CN109918669B (zh) 实体确定方法、装置及存储介质
US11714864B2 (en) Method and apparatus for processing web content, device, and computer storage medium
US20150161249A1 (en) Finding personal meaning in unstructured user data
CN109561211B (zh) 一种信息显示方法及移动终端
CN110989847B (zh) 信息推荐方法、装置、终端设备及存储介质
WO2021120875A1 (zh) 搜索方法、装置、终端设备及存储介质
TW201322014A (zh) 以圈選方式進行檢索之輸入方法及其系統
US8442987B2 (en) Method and system for providing contents based on past queries
CN108388630A (zh) 一种购物信息推送方法、装置及电子设备
WO2020081158A1 (en) Dynamically suppressing query answers in search
CN108399232A (zh) 一种信息推送方法、装置及电子设备
CN111708943A (zh) 一种搜索结果展示方法、装置和用于搜索结果展示的装置
CN108595107B (zh) 一种界面内容处理方法及移动终端
CN108388629A (zh) 一种多媒体信息推送方法、装置及电子设备
CN110990679A (zh) 信息搜索方法及电子设备
CN112784142A (zh) 一种信息推荐方法及装置
CN111125307A (zh) 一种聊天记录查询方法及电子设备
CN116070114A (zh) 数据集的构建方法、装置、电子设备及存储介质
CN109670105B (zh) 搜索方法及移动终端
CN110929122B (zh) 一种数据处理方法、装置和用于数据处理的装置
KR101307105B1 (ko) 정보 제공 장치, 정보 제공 방법, 및 정보 기록 매체
CN114816180A (zh) 一种内容浏览引导方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant