CN110110202A - 一种信息流推送方法及装置 - Google Patents

一种信息流推送方法及装置 Download PDF

Info

Publication number
CN110110202A
CN110110202A CN201810019941.8A CN201810019941A CN110110202A CN 110110202 A CN110110202 A CN 110110202A CN 201810019941 A CN201810019941 A CN 201810019941A CN 110110202 A CN110110202 A CN 110110202A
Authority
CN
China
Prior art keywords
message stream
information flow
feature
text
stream data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810019941.8A
Other languages
English (en)
Inventor
李东军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Yue Meng Mdt Infotech Ltd
Original Assignee
Suzhou Yue Meng Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Yue Meng Mdt Infotech Ltd filed Critical Suzhou Yue Meng Mdt Infotech Ltd
Priority to CN201810019941.8A priority Critical patent/CN110110202A/zh
Publication of CN110110202A publication Critical patent/CN110110202A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种信息流推送方法及装置,其中,该方法包括:获取用户浏览的第一信息流数据;对第一信息流数据进行特征提取,得到对应的第一文本特征;从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据;将确定的第二信息流数据推送给用户。通过本发明提供的信息流推送方法及装置,不仅提高推送精确度,而且能够在提升用户体验度的同时降低对工作人员的投入成本。

Description

一种信息流推送方法及装置
技术领域
本发明涉及互联网技术领域,具体而言,涉及一种信息流推送方法及装置。
背景技术
在目前的互联网时代,能够安装于台式计算机或者笔记本电脑等终端设备中的客户端程序和安装于移动电话或者平板电脑等终端设备中的APP(Application,应用)、以及可供用户利用其浏览器进行访问的网站的数量越来越多。在用户使用上述客户端程序和APP、以及访问上述网站的过程中,往往会涉及到向上述终端设备推送信息流数据,其中,上述信息流数据用于形成首页或者列表页或者内容页等页面。
相关技术中提供了一种信息流推送方法,其通过人工方式进行内容推荐,工作人员可以根据各内容的更新时间以及权重值对各内容进行排序,并根据排序结果选取内容以形成信息流数据,并向用户的终端设备推送。
然而,上述信息流推送方法采用人工方式,耗费的人力成本较高,且受限于工作人员主观推送的限制导致向用户推送的信息流很可能并不是用户真正感兴趣的内容,大大降低了用户的使用体验度。
发明内容
有鉴于此,本发明的目的在于提供一种信息流推送方法及装置,避免了采用人工推送方式推送用户不感兴趣的内容,提高推送的精确度。
第一方面,本发明提供了一种信息流推送方法,所述方法包括:
获取用户浏览的第一信息流数据;
对所述第一信息流数据进行特征提取,得到对应的第一文本特征;
从预先设置的信息流数据库中,确定与所述第一文本特征相匹配的第二信息流数据;
将确定的第二信息流数据推送给所述用户。
结合第一方面,本发明提供了第一方面的第一种可能的实施方式,其中,所述对所述第一信息流数据进行特征提取,得到对应的第一文本特征,包括:
对所述第一信息流数据进行文本类型划分,得到对应的文本类型特征;
和/或,对所述第一信息流数据进行情感类型划分,得到对应的文本情感特征;
和/或,对所述第一信息流数据进行用户意图划分,得到对应的文本意图特征;
和/或,对所述第一信息流数据进行语义提取,得到对应的文本标签特征。
结合第一方面的第一种可能的实施方式,本发明提供了第一方面的第二种可能的实施方式,其中,所述对所述第一信息流数据进行语义提取,得到对应的文本标签特征之前,还包括:
获取样本信息流数据;
根据所述样本信息流数据建立语义网络模型;
所述对所述第一信息流数据进行语义提取,得到对应的文本标签特征,包括:
基于建立的所述语义网络模型对所述第一信息流数据进行语义提取,以得到对应于所述第一信息流数据的语义信息;
为所述语义信息添加对应的文本标签特征。
结合第一方面的第二种可能的实施方式,本发明提供了第一方面的第三种可能的实施方式,其中,所述根据所述样本信息流数据建立语义网络模型,包括:
对所述样本信息流数据进行语义提取,获得文本标签特征;
对所述文本标签特征进行机器学习训练,得到语义网络模型。
结合第一方面的第一种可能的实施方式,本发明提供了第一方面的第四种可能的实施方式,其中,所述确定与所述第一文本特征相匹配的第二信息流数据之前,还包括:
依次提取信息流数据库中的各个信息流数据;
对提取的信息流数据进行特征提取,得到对应的第二文本特征;
计算所述第二文本特征和所述第一文本特征之间的相似度;
所述确定与所述第一文本特征相匹配的第二信息流数据,包括:
若所述相似度符合预设要求,则将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
结合第一方面的第四种可能的实施方式,本发明提供了第一方面的第五种可能的实施方式,其中,所述将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据,包括:
查找大于预设阈值的相似度对应的信息流数据;
将查找到的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
结合第一方面的第四种可能的实施方式,本发明提供了第一方面的第六种可能的实施方式,其中,所述将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据,包括:
按照所述相似度由高至低的顺序进行排名;
查找排名前N位的相似度对应的信息流数据;
将查找到的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
结合第一方面的第四种可能的实施方式,本发明提供了第一方面的第七种可能的实施方式,其中,所述第二文本特征和所述第一文本特征均为文本标签特征,所述计算所述第二文本特征和所述第一文本特征之间的相似度,包括:
提取所述第一文本特征中包含的各个文本标签,构建第一词向量,以及提取所述第二文本特征中包含的各个文本标签,构建第二词向量;
计算所述第一词向量和所述第二词向量之间的余弦相似度;
将计算得到的余弦相似度作为标签相似度。
结合第一方面,本发明提供了第一方面的第八种可能的实施方式,其中,所述将确定的第二信息流数据推送给所述用户,包括:
将确定与所述第一文本特征相匹配的第二信息流数据添加至所述第一信息流数据的预设推送位置;
在所述预设推送位置显示所述第二信息流数据。
第二方面,本发明还提供了一种信息流推送装置,所述装置包括:
数据获取模块,用于获取用户浏览的第一信息流数据;
特征提取模块,用于对所述第一信息流数据进行特征提取,得到对应的第一文本特征;
数据确定模块,用于从预先设置的信息流数据库中,确定与所述第一文本特征相匹配的第二信息流数据;
数据推送模块,用于将确定的第二信息流数据推送给所述用户。
本发明提供的信息流推送方法及装置,与相关技术中的人工方式由于受限于主观推送而推送出用户不感兴趣的内容,精确度较低相比,其首先获取用户浏览的第一信息流数据;然后对第一信息流数据进行特征提取,得到对应的第一文本特征;最后从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据,并将确定的第二信息流数据推送给用户,也即,其从预先设置的信息流数据库中确定与用户当前浏览的第一信息流数据相匹配的第二信息流数据,并将该第二信息流数据推送给用户,不仅推送精确度较高,而且能够在提升用户体验度的同时降低对工作人员的投入成本。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例所提供的一种信息流推送方法的流程图;
图2示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图3示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图4示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图5示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图6示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图7示出了本发明实施例所提供的另一种信息流推送方法的流程图;
图8示出了本发明实施例所提供的一种信息流推送装置的模块组成示意图。
主要元件符号说明:
11、数据获取模块;22、特征提取模块;33、数据确定模块;44、数据推送模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
考虑到相关技术中的信息流推送方法,采用人工方式,耗费的人力成本较高,且受限于工作人员主观推送的限制导致向用户推送的信息流很可能并不是用户真正感兴趣的内容,大大降低了用户的使用体验度。有鉴于此,本发明实施例提供了一种信息流推送方法及装置,避免了采用人工推送方式推送用户不感兴趣的内容,提高推送的精确度。
参见图1所示的本发明实施例提供的信息流推送方法的流程图,上述方法具体包括如下步骤:
S101、获取用户浏览的第一信息流数据;
具体的,考虑到本发明实施例提供的信息流推送方法的具体应用场景,上述信息流推送方需要获取用户当前浏览的第一信息流数据。其中,上述信息流数据可以通过数据接口进行获取,且上述信息流数据可以是用户浏览的感兴趣文章。
S102、对第一信息流数据进行特征提取,得到对应的第一文本特征;
具体的,对获取的第一信息流数据进行智能分析、挖掘,检测、识别文本类型、情感类型、用户意图,以及语义信息等内容,以便于通过相似度匹配推送相应的第二信息流数据。
S103、从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据;
具体的,通过对第一信息流数据进行内容理解,从信息流数据库中筛选或排序出与内容理解的结果相匹配的第二信息流数据。其中,上述第二信息流数据不仅包括实质文章内容,还可以包括广告内容。
对于筛选而言,以用户当前阅读内容的类别、标签、商业语义、语义等多个维度在信息流数据库中进行检索,筛选出和当前内容相关的信息流数据。对于排序而言,本发明实施例提供的信息流推送方法还可以建立打分系统,比如当前内容和推送的广告或内容,如果属于同一个类别,加3分,如果命中一个关键词加2分,商业语义一致,加4分等,然后按照最终得分进行排序,匹配方式多样性,实用性更佳。
S104、将确定的第二信息流数据推送给用户。
具体的,在确定与第一信息流数据匹配的第二信息流数据的前提下,本发明实施例提供的信息流推送方法能够将上述确定的第二信息流数据推送给用户。
其中,上述推送可以是嵌入显示式,还可以是植入显示式,且考虑到用户的体验效果,本发明实施例优选的将上述第二信息流数据显示在第一信息流数据的预设推送位置处,且上述推送是在接收到用户终端界面上的主动操作或者被动触发的控制指令下进行的。
本发明实施例提供的信息流推送方法,其首先获取用户浏览的第一信息流数据;然后对第一信息流数据进行特征提取,得到对应的第一文本特征;最后从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据,并将确定的第二信息流数据推送给用户,也即,其从预先设置的信息流数据库中确定与用户当前浏览的第一信息流数据相匹配的第二信息流数据,并将该第二信息流数据推送给用户,不仅推送精确度较高,而且能够在提升用户体验度的同时降低对工作人员的投入成本。
为了更好的对上述第一信息流数据进行特征提取,上述S102的提取过程,具体通过如下步骤实现:
对第一信息流数据进行文本类型划分,得到对应的文本类型特征;和/或,对第一信息流数据进行情感类型划分,得到对应的文本情感特征;和/或,对第一信息流数据进行用户意图划分,得到对应的文本意图特征;和/或,对第一信息流数据进行语义提取,得到对应的文本标签特征。
具体的,本发明实施例提供的信息流推送方法可以对用户当前浏览的第一信息流数据进行类型和/或情感和/或用户意图和/或语义的分析,还可以根据浏览内容的语义、商业语义、情感、意图、分类、即时兴趣等,并结合用户的场景预测用户的实时意图。
其中,本发明实施例中的文本类型划分可以是按照新闻、娱乐、军事对用户浏览内容进行文本分类,情感类型划分可以是按照乐观、消极对用户浏览内容进行情感分类,用户意图可以是对按照用户购买意愿、用户使用意愿等对用户浏览内容进行意图分类。上述语义提取可以是提取商业语义,还可以是提取自然语义等信息,本发明实施例中优选的采用长短期记忆网络(LSTM,Long Short-Term Memory)进行语义训练,并以标签形式表达语义。
考虑到语义提取是文本分析的关键环节,参见图2,本发明实施例通过如下步骤进行文本标签特征提取:
S201、获取样本信息流数据;
S202、根据样本信息流数据建立语义网络模型;
S203、基于建立的语义网络模型对第一信息流数据进行语义提取,以得到对应于第一信息流数据的语义信息;
S204、为语义信息添加对应的文本标签特征。
具体的,随着大数据时代的到来,只有比较复杂的模型,或者说表达能力强的模型,才能充分发掘海量数据中蕴藏的丰富信息,所以,本发明实施例中的语义网络模型(如LSTM)采用的是更强大的深度模型,以使得我们能够从大数据挖掘出更多有价值的信息和知识。本发明实施例提供的信息流推送方法通过预先训练得到的上述语义网络模型对第一信息流数据进行语义提取,即检测、识别第一信息流数据中所包含的语义信息,并为该语义信息添加对应的文本标签特征。
其中,参见图3,上述根据样本信息流数据建立语义网络模型具体包括如下步骤:
S301、对样本信息流数据进行语义提取,获得文本标签特征;
S302、对文本标签特征进行机器学习训练,得到语义网络模型。
首先对样本信息流数据集进行语义提取,并对获得的文本标签特征进行机器学习训练,得到语义网络模型。具体的,首先将样本信息流数据(如文章)打标签,标记文章的语义信息;然后将文章分成训练集和测试集,训练集用来测试算法,测试集用来测试算法的效果。本发明实施例将训练集输入至LSTM语义网络模型进行训练,然后再根据测试集进行训练好的语义网络模型的测试。
本发明实施例提供的信息流推送方法是根据相似度确定与第一文本特征相匹配的第二信息流数据,参见图4,上述方法还包括:
S401、依次提取信息流数据库中的各个信息流数据;
S402、对提取的信息流数据进行特征提取,得到对应的第二文本特征;
S403、计算第二文本特征和第一文本特征之间的相似度;
S404、若相似度符合预设要求,则将符合预设要求的信息流数据作为与第一文本特征相匹配的第二信息流数据。
具体的,本发明实施例提供的信息流推送方法对信息流数据库中的各个信息流数据进行特征提取,并得到对应的第二文本特征,然后通过计算第二文本特征和第一文本特征之间的相似度,确定与与第一文本特征相匹配的第二信息流数据。
其中,对信息流数据库中的各个信息流数据进行特征提取的方法与对第一信息流数据进行特征提取的方法类似,在此不再赘述。
为了实现上述信息流数据的确定,上述确定过程,具体通过如下步骤实现,参见图5所示的流程图,上述方法还包括:
S501、查找大于预设阈值的相似度对应的信息流数据;
S502、将查找到的信息流数据作为与第一文本特征相匹配的第二信息流数据。
具体的,在计算得到第二文本特征和第一文本特征之间的相似度后,首先从信息流数据中查找大于预设阈值的相似度所对应的信息流数据,然后将查找得到的信息流数据作为与第一文本特征相匹配的第二信息流数据。
另外,本发明实施例所提供的信息流推送方法还可以对相似度进行排名,然后根据排名结果进行上述信息流数据的确定,参见图6所示的流程图,上述方法还包括:
S601、按照相似度由高至低的顺序进行排名;
S602、查找排名前N位的相似度对应的信息流数据;
S603、将查找到的信息流数据作为与第一文本特征相匹配的第二信息流数据。
具体的,根据上述计算得到的相似度由高至低的顺序排序,将排名靠前的相似度对应的信息流数据作为与第一文本特征相匹配的第二信息流数据。其中把相似度最高的信息流数据作为第一待展示第二信息流数据,以保证在信息流推送的过程中可以根据相似排名首先推送相似度最高的信息流数据至第一信息流数据对应的预设推送位置,进一步提高信息流推送的精准度。
为了更好的计算上述第二文本特征和第一文本特征之间的相似度,参见图7,本发明实施例提供的信息流推送方法通过如下步骤进行标签相似度的计算:
S701、提取第一文本特征中包含的各个文本标签,构建第一词向量,以及提取第二文本特征中包含的各个文本标签,构建第二词向量;
S702、计算第一词向量和第二词向量之间的余弦相似度;
S703、将计算得到的余弦相似度作为标签相似度。
具体的,本发明实施例提供的信息流推送方法首先提取提取第一文本特征中包含的各个文本标签,构建第一词向量,以及提取第二文本特征中包含的各个文本标签,构建第二词向量,然后计算第一词向量和第二词向量之间的余弦相似度,并将计算得到的余弦相似度作为标签相似度。
本发明实施例提供的信息流推送方法可以将与第一文本特征相匹配的第二信息流数据添加至第一信息流数据的预设推送位置(如下边),也即是,当用户点击第一信息流数据后,在该条数据后动态插入和该第一信息流数据相匹配的第二信息流数据,那么,当用户阅读完第一信息流数据返回信息流时可以看到新插入的第二信息流数据,推送的时效性和准确性均较高。
另外,本发明实施例提供的信息流推送方法还可以采用其他的推送展现形式,如可以将匹配成功的第二信息流数据添加至其他结果的前后,且添加的第二信息流数据可以动态组合,推送的灵活性更佳。
值得说明的是,上述信息流推送方法适用于移动设备、个人计算机(PC,personalcomputer)设备以及其它适合展示信息流样式的产品,在此不做限制。
本发明实施例提供的信息流推送方法,其首先获取用户浏览的第一信息流数据;然后对第一信息流数据进行特征提取,得到对应的第一文本特征;最后从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据,并将确定的第二信息流数据推送给用户,也即,其从预先设置的信息流数据库中确定与用户当前浏览的第一信息流数据相匹配的第二信息流数据,并将该第二信息流数据推送给用户,不仅推送精确度较高,而且能够在提升用户体验度的同时降低对工作人员的投入成本。
本发明实施例还提供了一种信息流推送装置,该装置用于执行上述信息推送方法,参见图8,上述装置具体包括:
数据获取模块11,用于获取用户浏览的第一信息流数据;
特征提取模块22,用于对第一信息流数据进行特征提取,得到对应的第一文本特征;
数据确定模块33,用于从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据;
数据推送模块44,用于将确定的第二信息流数据推送给用户。
为了更好的对上述第一信息流数据进行特征提取,上述特征提取模块22,具体用于对第一信息流数据进行文本类型划分,得到对应的文本类型特征;和/或,对第一信息流数据进行情感类型划分,得到对应的文本情感特征;和/或,对第一信息流数据进行用户意图划分,得到对应的文本意图特征;和/或,对第一信息流数据进行语义提取,得到对应的文本标签特征。
考虑到语义提取是文本分析的关键环节,上述特征提取模块22具体包括:
获取单元,用于获取样本信息流数据;
建立单元,用于根据样本信息流数据建立语义网络模型;
提取单元,用于基于建立的语义网络模型对第一信息流数据进行语义提取,以得到对应于第一信息流数据的语义信息;
添加单元,用于为语义信息添加对应的文本标签特征。
其中,上述建立单元具体包括:
提取子单元,用于对样本信息流数据进行语义提取,获得文本标签特征;
训练子单元,用于对文本标签特征进行机器学习训练,得到语义网络模型。
本发明实施例提供的信息流推送装置是根据相似度确定与第一文本特征相匹配的第二信息流数据,上述装置还包括:
数据提取模块,用于依次提取信息流数据库中的各个信息流数据;
特征提取模块22,还用于对提取的信息流数据进行特征提取,得到对应的第二文本特征;
计算模块,用于计算第二文本特征和第一文本特征之间的相似度;
确定模块,具体用于若相似度符合预设要求,则将符合预设要求的信息流数据作为与第一文本特征相匹配的第二信息流数据。
为了实现上述信息流数据的确定,上述确定模块包括:
第一查找单元,用于查找大于预设阈值的相似度对应的信息流数据;
第一确定单元,用于将查找到的信息流数据作为与第一文本特征相匹配的第二信息流数据。
另外,本发明实施例所提供的信息流推送装置还可以对相似度进行排名,然后根据排名结果进行上述信息流数据的确定,则上述确定模块还包括:
排名单元,用于按照相似度由高至低的顺序进行排名;
第二查找单元,用于查找排名前N位的相似度对应的信息流数据;
第二确定单元,用于将查找到的信息流数据作为与第一文本特征相匹配的第二信息流数据。
为了更好的计算上述第二文本特征和第一文本特征之间的相似度,上述计算模块包括:
标签提取单元,用于提取第一文本特征中包含的各个文本标签,构建第一词向量,以及提取第二文本特征中包含的各个文本标签,构建第二词向量;
计算单元,用于计算第一词向量和第二词向量之间的余弦相似度;
第三确定单元,用于将计算得到的余弦相似度作为标签相似度。
本发明实施例提供的信息流推送装置中的推送模块可以将与第一文本特征相匹配的第二信息流数据添加至第一信息流数据的预设推送位置(如下边),也即是,当用户点击第一信息流数据后,在该条数据后动态插入和该第一信息流数据相匹配的第二信息流数据,那么,当用户阅读完第一信息流数据返回信息流时可以看到新插入的第二信息流数据,推送的时效性和准确性均较高。
另外,本发明实施例提供的信息流推送装置还可以采用其他的推送展现形式,如可以将匹配成功的第二信息流数据添加至其他结果的前后,且添加的第二信息流数据可以动态组合,推送的灵活性更佳。
本发明实施例提供的信息流推送装置,其首先获取用户浏览的第一信息流数据;然后对第一信息流数据进行特征提取,得到对应的第一文本特征;最后从预先设置的信息流数据库中,确定与第一文本特征相匹配的第二信息流数据,并将确定的第二信息流数据推送给用户,也即,其从预先设置的信息流数据库中确定与用户当前浏览的第一信息流数据相匹配的第二信息流数据,并将该第二信息流数据推送给用户,不仅推送精确度较高,而且能够在提升用户体验度的同时降低对工作人员的投入成本。
本发明实施例所提供的进行信息流推送的方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,所述程序代码包括的指令可用于执行前面方法实施例中所述的方法,具体实现可参见方法实施例,在此不再赘述。
本发明实施例所提供的信息流推送的装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本发明实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
最后应说明的是:以上所述实施例,仅为本发明的具体实施方式,用以说明本发明的技术方案,而非对其限制,本发明的保护范围并不局限于此,尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种信息流推送方法,其特征在于,包括:
获取用户浏览的第一信息流数据;
对所述第一信息流数据进行特征提取,得到对应的第一文本特征;
从预先设置的信息流数据库中,确定与所述第一文本特征相匹配的第二信息流数据;
将确定的第二信息流数据推送给所述用户。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一信息流数据进行特征提取,得到对应的第一文本特征,包括:
对所述第一信息流数据进行文本类型划分,得到对应的文本类型特征;
和/或,对所述第一信息流数据进行情感类型划分,得到对应的文本情感特征;
和/或,对所述第一信息流数据进行用户意图划分,得到对应的文本意图特征;
和/或,对所述第一信息流数据进行语义提取,得到对应的文本标签特征。
3.根据权利要求2所述的方法,其特征在于,所述对所述第一信息流数据进行语义提取,得到对应的文本标签特征之前,还包括:
获取样本信息流数据;
根据所述样本信息流数据建立语义网络模型;
所述对所述第一信息流数据进行语义提取,得到对应的文本标签特征,包括:
基于建立的所述语义网络模型对所述第一信息流数据进行语义提取,以得到对应于所述第一信息流数据的语义信息;
为所述语义信息添加对应的文本标签特征。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本信息流数据建立语义网络模型,包括:
对所述样本信息流数据进行语义提取,获得文本标签特征;
对所述文本标签特征进行机器学习训练,得到语义网络模型。
5.根据权利要求2所述的方法,其特征在于,所述确定与所述第一文本特征相匹配的第二信息流数据之前,还包括:
依次提取信息流数据库中的各个信息流数据;
对提取的信息流数据进行特征提取,得到对应的第二文本特征;
计算所述第二文本特征和所述第一文本特征之间的相似度;
所述确定与所述第一文本特征相匹配的第二信息流数据,包括:
若所述相似度符合预设要求,则将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
6.根据权利要求5所述的方法,其特征在于,所述将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据,包括:
查找大于预设阈值的相似度对应的信息流数据;
将查找到的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
7.根据权利要求5所述的方法,其特征在于,所述将符合所述预设要求的信息流数据作为与所述第一文本特征相匹配的第二信息流数据,包括:
按照所述相似度由高至低的顺序进行排名;
查找排名前N位的相似度对应的信息流数据;
将查找到的信息流数据作为与所述第一文本特征相匹配的第二信息流数据。
8.根据权利要求5所述的方法,其特征在于,所述第二文本特征和所述第一文本特征均为文本标签特征,所述计算所述第二文本特征和所述第一文本特征之间的相似度,包括:
提取所述第一文本特征中包含的各个文本标签,构建第一词向量,以及提取所述第二文本特征中包含的各个文本标签,构建第二词向量;
计算所述第一词向量和所述第二词向量之间的余弦相似度;
将计算得到的余弦相似度作为标签相似度。
9.根据权利要求1所述的方法,其特征在于,所述将确定的第二信息流数据推送给所述用户,包括:
将确定与所述第一文本特征相匹配的第二信息流数据添加至所述第一信息流数据的预设推送位置;
在所述预设推送位置显示所述第二信息流数据。
10.一种信息流推送装置,其特征在于,包括:
数据获取模块,用于获取用户浏览的第一信息流数据;
特征提取模块,用于对所述第一信息流数据进行特征提取,得到对应的第一文本特征;
数据确定模块,用于从预先设置的信息流数据库中,确定与所述第一文本特征相匹配的第二信息流数据;
数据推送模块,用于将确定的第二信息流数据推送给所述用户。
CN201810019941.8A 2018-01-09 2018-01-09 一种信息流推送方法及装置 Pending CN110110202A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810019941.8A CN110110202A (zh) 2018-01-09 2018-01-09 一种信息流推送方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810019941.8A CN110110202A (zh) 2018-01-09 2018-01-09 一种信息流推送方法及装置

Publications (1)

Publication Number Publication Date
CN110110202A true CN110110202A (zh) 2019-08-09

Family

ID=67483108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810019941.8A Pending CN110110202A (zh) 2018-01-09 2018-01-09 一种信息流推送方法及装置

Country Status (1)

Country Link
CN (1) CN110110202A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360761A (zh) * 2021-06-11 2021-09-07 北京百度网讯科技有限公司 信息流推荐方法、装置、电子设备和计算机可读存储介质
CN114422835A (zh) * 2021-12-29 2022-04-29 上海数即数据科技有限公司 一种基于大数据分析的广告定向推广平台

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
US20170103441A1 (en) * 2015-10-07 2017-04-13 Gastown Data Sciences Comparing Business Documents to Recommend Organizations
CN106909658A (zh) * 2017-02-27 2017-06-30 百度在线网络技术(北京)有限公司 信息流推荐方法、装置和搜索引擎
CN107066449A (zh) * 2017-05-09 2017-08-18 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107256232A (zh) * 2017-05-16 2017-10-17 百度在线网络技术(北京)有限公司 一种信息推荐方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104965889A (zh) * 2015-06-17 2015-10-07 腾讯科技(深圳)有限公司 内容推荐方法及装置
US20170103441A1 (en) * 2015-10-07 2017-04-13 Gastown Data Sciences Comparing Business Documents to Recommend Organizations
CN106909658A (zh) * 2017-02-27 2017-06-30 百度在线网络技术(北京)有限公司 信息流推荐方法、装置和搜索引擎
CN107066449A (zh) * 2017-05-09 2017-08-18 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107256232A (zh) * 2017-05-16 2017-10-17 百度在线网络技术(北京)有限公司 一种信息推荐方法和装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113360761A (zh) * 2021-06-11 2021-09-07 北京百度网讯科技有限公司 信息流推荐方法、装置、电子设备和计算机可读存储介质
CN114422835A (zh) * 2021-12-29 2022-04-29 上海数即数据科技有限公司 一种基于大数据分析的广告定向推广平台

Similar Documents

Publication Publication Date Title
CN106649818B (zh) 应用搜索意图的识别方法、装置、应用搜索方法和服务器
CN111143610B (zh) 一种内容推荐方法、装置、电子设备和存储介质
CN110427563B (zh) 一种基于知识图谱的专业领域系统冷启动推荐方法
CN103544176B (zh) 用于生成多个页面所对应的页面结构模板的方法和设备
CN108628833B (zh) 原创内容摘要确定方法及装置,原创内容推荐方法及装置
US10776885B2 (en) Mutually reinforcing ranking of social media accounts and contents
US20220405607A1 (en) Method for obtaining user portrait and related apparatus
CN110909164A (zh) 一种基于卷积神经网络的文本增强语义分类方法及系统
CN107818105A (zh) 应用程序的推荐方法及服务器
CN106970991B (zh) 相似应用的识别方法、装置和应用搜索推荐方法、服务器
CN110737783A (zh) 一种推荐多媒体内容的方法、装置及计算设备
CN111309936A (zh) 一种电影用户画像的构建方法
CN112257452B (zh) 情感识别模型的训练方法、装置、设备和存储介质
CN110413875A (zh) 一种文本信息推送的方法以及相关装置
CN112991017A (zh) 基于用户评论解析的标签体系精准推荐方法
CN106776860A (zh) 一种搜索摘要生成方法及装置
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN108363748B (zh) 基于知乎的话题画像系统及话题画像方法
CN111831924A (zh) 内容推荐方法、装置、设备及可读存储介质
CN104915399A (zh) 基于新闻标题的推荐数据处理方法及系统
CN111400586A (zh) 群组展示方法、终端、服务器、系统及存储介质
CN104050243A (zh) 一种将搜索与社交相结合的网络搜索方法及其系统
CN114443847A (zh) 文本分类、文本处理方法、装置、计算机设备及存储介质
CN111506596A (zh) 信息检索方法、装置、计算机设备和存储介质
US20170235835A1 (en) Information identification and extraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190809

RJ01 Rejection of invention patent application after publication