CN107172151A - 用于推送信息的方法和装置 - Google Patents

用于推送信息的方法和装置 Download PDF

Info

Publication number
CN107172151A
CN107172151A CN201710351701.3A CN201710351701A CN107172151A CN 107172151 A CN107172151 A CN 107172151A CN 201710351701 A CN201710351701 A CN 201710351701A CN 107172151 A CN107172151 A CN 107172151A
Authority
CN
China
Prior art keywords
word
information
message stream
stream data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710351701.3A
Other languages
English (en)
Other versions
CN107172151B (zh
Inventor
史须勇
韩聪
贺登武
王鲁光
王修飞
梁任鹏
杨家俊
刘国庆
杨承
江志敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201710351701.3A priority Critical patent/CN107172151B/zh
Publication of CN107172151A publication Critical patent/CN107172151A/zh
Priority to JP2019537764A priority patent/JP6814298B2/ja
Priority to PCT/CN2017/118007 priority patent/WO2018209954A1/zh
Priority to US16/509,410 priority patent/US11252245B2/en
Application granted granted Critical
Publication of CN107172151B publication Critical patent/CN107172151B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/145Network analysis or design involving simulating, designing, planning or modelling of a network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Pure & Applied Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了用于推送信息的方法和装置。该方法的一具体实施方式包括:接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;根据查询用信息进行查询,得到第一信息流数据;获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;基于搜索记录和/或浏览记录,确定关键词;确定预设信息流数据集合中与关键词匹配的第二信息流数据;基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;向终端推送待推送数据。该实施方式实现了富于针对性的信息推送。

Description

用于推送信息的方法和装置
技术领域
本申请涉及计算机技术领域,具体涉及一种用于推送信息的方法和装置。
背景技术
随着网络科技的发展,目前许多产品,例如,搜索引擎、博客(Blog)、SNS(SocialNetwork Site,社会性网络服务)、RSS(Really Simple Syndication,简易信息聚合)等等,都使用了信息流(Feed)系统来发布信息流数据。信息流数据是指消息来源,也可被称为源料、馈送、信息提供、供稿、摘要、源、新闻订阅、网源等等,网站可通过它将最新信息传播给用户,用户能够订阅网站的先决条件是网站可提供持续更新的信息。信息流展现形式的优势在于让用户每次查询可以看到最新的数据,体验比传统的打开即显示的展现形式要好很多。
在现有技术中,用户进入承载信息流数据的页面时,除用户自身订阅的信息外,服务器还会向用户推送其他信息,例如,该网站近期举办活动的活动信息或广告信息。然而,服务器向用户推送的其他信息,通常不是该用户所需的,存在缺乏针对性的问题。
发明内容
本申请的目的在于提出一种改进的用于推送信息的方法和装置,来解决以上背景技术部分提到的技术问题。
第一方面,本申请实施例提供了一种用于推送信息的方法,该方法包括:接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;根据查询用信息进行查询,得到第一信息流数据;获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;基于搜索记录和/或浏览记录,确定关键词;确定预设信息流数据集合中与关键词匹配的第二信息流数据;基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;向终端推送待推送数据。
在本实施例中,基于搜索记录和/或浏览记录,确定关键词,包括:获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;对搜索语句和/或内容进行内容解析,得到备选词集合;对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;基于第一概率从备选词集合中选取关键词。
在本实施例中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及基于第一概率从备选词集合中选取关键词,包括:对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
在本实施例中,对搜索语句和/或内容进行内容解析,得到备选词集合,包括:对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;将核心词以及得到的扩展词确定为关键词。
在本实施例中,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,包括:响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。
第二方面,本申请实施例提供了一种用于推送信息的装置,该装置包括:接收单元,用于接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;查询单元,用于根据查询用信息进行查询,得到第一信息流数据;获取单元,用于获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;第一确定单元,用于基于搜索记录和/或浏览记录,确定关键词;第二确定单元,用于确定预设信息流数据集合中与关键词匹配的第二信息流数据;生成单元,用于基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;推送单元,用于向终端推送待推送数据。
在本实施例中,第一确定单元,包括:获取子单元,用于获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;解析子单元,用于对搜索语句和/或内容进行内容解析,得到备选词集合;第一确定子单元,用于对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;第一选取子单元,用于基于第一概率从备选词集合中选取关键词。
在本实施例中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及第一选取子单元,包括:第一确定模块,用于对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;选择模块,用于从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
在本实施例中,解析子单元,包括:分析模块,用于对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;扩展模块,用于对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;第二确定模块,用于将核心词以及得到的扩展词确定为关键词。
在本实施例中,生成单元,包括:第二确定子单元,用于响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;第二选取子单元,用于从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合子单元,用于聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。
第三方面,本申请实施例提供了一种设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行,使得上述一个或多个处理器实现如第一方面上述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面上述的方法。
本申请实施例提供的用于推送信息的方法和装置,通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于推送信息的方法的一个实施例的示意性流程图;
图3是根据本申请的用于推送信息的方法的又一个实施例的示意性流程图;
图4是根据本申请的用于推送信息的方法的应用场景的示意图;
图5是根据本申请的用于推送信息的装置的一个实施例的示例性结构图;
图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的用于推送信息的方法或用于推送信息的装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持文字输入的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的使用了信息流系统的应用提供支持的后台服务器。服务器105可以接收终端设备101、102、103发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端设备101、102、103推送待推送数据。
需要说明的是,本申请实施例所提供的用于推送信息的方法可以由服务器105执行,相应地,用于推送信息的装置可以设置于服务器105中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用于推送信息的方法的一个实施例的流程200。该用于推送信息的方法,包括以下步骤:
步骤201,接收终端发送的信息流数据获取请求。
在本实施例中,用于推送信息的方法运行于其上的电子设备(例如图1所示的服务器)可以接收终端发送的信息流数据获取请求。
信息流数据获取请求可以是使用了信息流数据系统的应用开启时终端发送的请求,也可以是响应于用户的特定操作终端发送的请求,例如查询操作、打开信息流数据显示页面的操作、刷新显示信息流数据的页面的操作。作为示例,用户在搜索栏中输入了查询语句后,可以通过点击查询按钮或按下回车键的方式通过终端向服务器发送信息流数据获取请求;用户在浏览显示信息流数据的页面时,可以通过下滑的手势或点击用于指示刷新操作的区域,向服务器发送的信息流数据获取请求,以获取未读的信息流数据。
通过对信息流数据显示的区域的点击操作,可以进入其指向的页面,信息流数据可以理解为针对其指向的页面进行整合得到的数据,可以包括其指向的页面的内容的标题、其指向的页面链接和其指向的页面的内容的描述信息等,例如,搜索结果页面中的搜索结果,社交类应用中用户发布的消息、动态。
信息流数据获取请求包括查询用信息,查询用信息可以是用于指示如何获取第一信息流数据的信息,第一信息流数据可以是用户订阅或查询的信息流数据。作为示例,查询用信息可以是用户输入的查询语句,也可以是与终端关联的账户的账户信息,例如账户标识,通过账户标识可以在数据库中获取该账户的订阅列表或关注列表,以此可进一步获取列表中账户发布的数据。
步骤202,根据查询用信息进行查询,得到第一信息流数据。
在本实施例中,上述电子设备可以根据步骤201中获取的查询用信息进行查询,得到第一信息流数据。作为示例,上述电子设备可以在相应数据库中查询与用户输入的查询语句匹配的信息流数据作为第一信息流数据;上述电子设备也可以首先查询与发送信息流数据获取请求的终端关联的账户的关注列表,得到其关注的账户的标识,之后根据其关注的账户的标识查询其关注的账户发布的信息,将其关注的账户发布的信息中未向该终端推送过的信息作为第一信息流数据。
步骤203,获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。
在本实施例中,上述电子设备可以获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。与终端关联的账户可以是终端上当前登陆的账户,也可以是根据终端的设备信息或其他关联信息建立的账户,例如,根据IMEI(International MobileEquipment Identity,国际移动设备身份码),或SIM(Subscriber IdentificationModule,客户识别模块)建立的账户。预定时间段可以是最近的一段时间,例如,过去几周,过去几天。预定时间段具体可根据实际需要设置,搜索记录和/或浏览记录较多时,可以适当缩短预定时间段。搜索记录可以是与终端关联的账户在搜索引擎中的搜索记录,也可以是与终端关联的账户在其他应用中的搜索记录。浏览记录可以是用户在使用了信息流数据系统的应用中访问过的,信息流数据所指向的页面的记录。
步骤204,基于搜索记录和/或浏览记录,确定关键词。
在本实施例中,上述电子设备可以基于步骤203中获取的搜索记录和/或浏览记录,确定关键词。上述电子设备可以直接从搜索记录中提取用户输入的搜索词,或从浏览记录提取用户浏览过的页面的标题或标签,对搜索词、标题或标签进行切分等操作得到关键词。在得到的词过多时,还可以进一步进行一些筛选的操作,避免关键词过多影响信息后续步骤的执行效率。
步骤205,确定预设信息流数据集合中与关键词匹配的第二信息流数据。
在本实施例中,上述电子设备可以确定预设信息流数据集合中与步骤204中确定的关键词匹配的第二信息流数据。预设信息流数据集合可以是预先存储在与上述电子设备关联的数据库的信息流数据集合,可以是一些推广用信息流数据的集合,例如,广告数据。上述电子设备可以根据关键词生成查询消息(Query),向存储有预设信息流数据集合的数据库发送所生成的查询消息,将数据库返回的信息流数据确定为与关键词匹配的第二信息流数据。与关键词匹配的第二信息流数据可以是包括关键词或关键词的扩展词的信息流数据。也可以预先为信息流数据集合中的各个信息流数据设置有标签,作为示例,企业需要发布推广信息,在获取其提供的推广信息的同时,可以获取为其设置的标签。例如,某品牌欲推广某款手机,在提供了对款手机的介绍信息的同时,还可以将手机、双摄像头、该品牌的名称以及其他手机品牌的名称设置为标签。
步骤206,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据。
在本实施例中,上述电子设备可以基于第一信息流数据和步骤205中确定的第二信息流数据,生成待推送数据。上述电子设备可以根据终端页面的布局信息聚合第一信息流数据和所确定的第二信息流数据,生成待推送数据。布局信息可以用于指示页面显示的信息流数据的个数,第一信息流数据和所确定的第二信息流数据的分布,例如,每隔一定数目的第一信息流数据,插入一个所确定的第二信息流数据。
步骤207,向终端推送待推送数据。
在本实施例中,上述电子设备可以通过网络向终端推送步骤206中生成的待推送数据,以供终端进行显示。
本申请的上述实施例提供的方法通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。
在本实施例的一些可选实现方式中,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,包括:响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率;从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。
在本实现方式中,预设数目可以是终端页面的布局信息中指示页面中显示的第二信息流数据的数目,具体可以根据实际需要设置。与信息流数据的对应的属性值可以是用于表征其特征的一个参数值,例如,信息流数据是广告数据,与广告数据对应的属性值可以是客户对该条广告数据的出价,也可以是该条广告数据被点击的次数或被推送的次数等。
第二概率确定模型可以用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息。与该终端关联的账户的账户信息可以是年龄、职业、所在地、兴趣爱好、关注的账户、订阅的栏目等信息。第二信息流数据的特征信息可以是用于表征第二信息流数据的核心内容的信息,可以通过对第二信息流数据进行语义分析得到,特征信息也可以是预先针对第二信息流数据所设置的,例如,第二信息流数据是推广信息,其特征信息可以是提供推广信息的一方为其设置的标签。
作为示例,上述电子设备可以将历史记录中记录的上述各个信息项作为输入,将根据历史记录统计得到的接收到访问该第二信息流数据所指向的页面的请求的比例作为输出,训练初始的朴素贝叶斯模型(Naive Bayesian Model,NBM)或支持向量机(SupportVector Machine,SVM)等用于分类的模型,得到第二概率确定模型。第二概率确定模型也可以是技术人员基于对大量的上述信息项和第二概率的统计而预先制定的、存储有多个信息项与第二概率的对应关系的对应关系表;同样可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对信息项中的一个或多个进行量化与计算,得到的用于表征第二概率的计算结果的计算公式,例如,该计算公式可以是用于计算账户信息与特征信息的相关度的公式,若得到的相关度高,则第二概率大。
在本实现方式中,根据所获取的属性值与第二概率确定该第二信息流数据的分值,可以是计算所获取的属性值与第二概率的乘积,作为该第二信息流数据的分值,也可以对属性值进行归一化处理,按照预设权重对归一化处理得到的值与第二概率进行加权求和,得到该第二信息流数据的分值。
请参考图3,图3是根据本实施例的用于推送信息的方法的又一个实施例的流程示意图。
在图3中,该用于推送信息的方法的流程300,包括以下步骤:
步骤301,接收终端发送的信息流数据获取请求。
在本实施例中,用于推送信息的方法运行于其上的电子设备(例如图1所示的服务器)可以接收终端发送的信息流数据获取请求。
步骤302,根据查询用信息进行查询,得到第一信息流数据。
在本实施例中,上述电子设备可以根据步骤301中获取的查询用信息进行查询,得到第一信息流数据。
步骤303,获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。
在本实施例中,上述电子设备可以获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录。
步骤304,获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容。
在本实施例中,上述电子设备可以获取步骤303中得到的搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容。
步骤305,对搜索语句和/或内容进行内容解析,得到备选词集合。
在本实施例中,上述电子设备可以对步骤304获取的搜索语句和/或内容进行内容解析,得到备选词集合。对搜索语句和/或内容进行内容解析,得到备选词集合,可以包括:对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;将核心词以及得到的扩展词确定为关键词。作为示例,扩展操作中,核心词“孩子”可以具有同义词“儿童”;核心词“中药”可以具有近义词“草药”,“出席”可以具有近义词“参加”;核心词“感冒”可以具有“发烧”或“流感”之类的关联词,生产同一产品的不同品牌的品牌名称、同一品牌旗下的不同产品的名称也可以互为关联词。
作为示例,统计分析可以是对搜索语句和/或内容中存在的各个词语的出现频率进行统计和排序,之后,再选取出现频率排序靠前的一个或多个词语作为关键词。语义分析可以是首先对内容进行全切分方法等处理,把内容分割成词;再对所得到的词进行重要性计算(例如采用词频-逆向文件频率方法(Term Frequency-Inverse Document Frequency,TF-IDF)),基于重要性计算的结果来得到关键词。通过扩展操作使得关键词更加丰富,进一步提高了信息推送的准确度。
步骤306,对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据,并基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率。
在本实施例中,上述电子设备可以对于步骤305中得到的备选词集合中的每个备选词,首先,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;之后获取第一概率模型所需的输入数据,并将其导入预先训练的第一概率确定模型,以确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面。
第一概率确定模型可以用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息。备选词所属的行业的行业信息可以是用于表征备选词的所属行业或领域的信息,例如汽车行业、手机行业。备选词的来源信息用于表征备选词的来源,例如,来源于用户输入的搜索语句,或浏览记录。
作为示例,上述电子设备可以将历史记录中记录的上述各个信息项作为输入,将根据历史记录统计得到的接收到访问该第二信息流数据所指向的页面的请求的比例作为输出,训练初始的朴素贝叶斯模型或支持向量机等用于分类的模型,得到第一概率确定模型。第一概率确定模型也可以是技术人员基于对大量的上述信息项和第一概率的统计而预先制定的、存储有多个信息项与第一概率的对应关系的对应关系表;同样可以是技术人员基于对大量数据的统计而预先设置并存储至上述电子设备中的、对信息项中的一个或多个进行量化与计算,得到的用于表征第一概率的计算结果的计算公式,例如,该计算公式可以是用于计算与该终端关联的账户的账户信息中兴趣爱好或职业与备选词所属的行业的行业信息的相关度的公式,若得到的相关度高,则第一概率大。
步骤307,对于备选词集合中的每个备选词,执行分数确定操作。
在本实施例中,针对预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值。上述电子设备对步骤305中得到的备选词集合中的每个备选词,执行的分数确定操作,可以包括:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值,和步骤306中确定的该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数。
在本实施例中,可能存在多个与备选词匹配的第二信息流数据,每个第二信息流数据都存在与其对应的属性值,可以将多个属性值的平均值作为与该备选词对应的属性值,也可以将最高的一个属性值作为与该备选词对应的属性值。采用一种多目标融合的方法得到各个备选词对应的分数。可以通过分析两者的均值、设置一组初始权重,然后根据实际需要,不断进行调整。最终获得一组较优的权重。例如,可以通过以下公式计算备选词对应的分数:
S=W1×P+W2×V+W3×P×V; (1)
其中,S表示备选词对应的分数,P表示备选词对应的第一概率,V表示备选词的对应的属性值,W1表示针对第一概率所设置的权重,W2表示针对属性值所设置的权重,W3表示针对第一概率与属性值的乘积所设置的权重。
步骤308,从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
在本实施例中,上述电子设备可以从备选词集合的各个备选词中,按照步骤307中得到的分数由大到小的顺序,选择预定数目个备选词作为关键词。预定数目可以根据系统能承受的运算量确定,预定数目过大,会影响信息推送的效率。作为示例,预定数目可以是2。
步骤309,确定预设信息流数据集合中与关键词匹配的第二信息流数据。
在本实施例中,上述电子设备可以确定预设信息流数据集合中与步骤308中确定的关键词匹配的第二信息流数据。
步骤310,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据。
在本实施例中,上述电子设备可以基于第一信息流数据和步骤309中确定的第二信息流数据,生成待推送数据。
步骤311,向终端推送待推送数据。
在本实施例中,上述电子设备可以通过网络向终端推送步骤310中生成的待推送数据,以供终端进行显示。
步骤301~步骤303、步骤309~步骤311的实现细节和技术效果可以参考步骤201~步骤203、步骤205~步骤207中的说明,在此不再赘述。
从图3中可以看出,与图2对应的实施例相比,本实施例中的用于推送信息的方法的流程300突出了确定关键词的步骤。由此,本实施例描述的方案可以确定出与用户需求的贴合度更高的关键词,从而实现了更有效的信息推送。
继续参见图4,图4是根据本实施例的用于推送信息的方法的应用场景的一个示意图。在图4的应用场景中,当前页面中已无用户未读过的信息流数据,用户通过按住下滑的手势操作,通过终端向服务器发送信息流数据获取请求。服务器通过请求中包括的账户标识,查询到用户的订阅列表,根据订阅列表获取到用户订阅的未读的信息流数据,作为第一信息流数据。服务器还通过账户标识到了用户在预定时间段内的搜索记录和/或浏览记录,发现用户检索过“某品牌手机价格”、“某品牌手机发布时间”,用户浏览过标题为“不得不买某品牌手机的十大原因”、“手机性能对比”的网页。可以将“某品牌”、“手机”、价位接近的其他手机品牌、某品牌旗下的其他产品的产品名称确定为关键词,以在预先设置的推广数据的集合中查询与关键词匹配的第二信息流数据。最后,基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据。
进一步参考图5,作为对上述方法的实现,本申请提供了一种用于推送信息的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于推送信息的装置500包括:接收单元501,查询单元502,获取单元503,第一确定单元504,第二确定单元505,生成单元506,推送单元507,其中,接收单元501,用于接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;查询单元502,用于根据查询用信息进行查询,得到第一信息流数据;获取单元503,用于获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;第一确定单元504,用于基于搜索记录和/或浏览记录,确定关键词;第二确定单元505,用于确定预设信息流数据集合中与关键词匹配的第二信息流数据;生成单元506,用于基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;推送单元507,用于向终端推送待推送数据。
在本实施例中,接收单元501,查询单元502,获取单元503,第一确定单元504,第二确定单元505,生成单元506,推送单元507的具体处理可以参考图2对应实施例步骤201、步骤202、步骤203、步骤204、步骤205、步骤206、步骤207的详细描述,在此不再赘述。
在本实施例的一些可选实现方式中,第一确定单元504,包括:获取子单元(图中未示出),用于获取搜索记录中的搜索语句和/或浏览记录中的浏览过的页面的内容;解析子单元(图中未示出),用于对搜索语句和/或内容进行内容解析,得到备选词集合;第一确定子单元(图中未示出),用于对于备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到终端发送的页面的访问请求的第一概率,页面包括与该备选词匹配的第二信息流数据所指向的页面,第一概率确定模型用于表征以下信息项中的至少一项与第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;第一选取子单元(图中未示出),用于基于第一概率从备选词集合中选取关键词。
在本实施例的一些可选实现方式中,预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及第一选取子单元(图中未示出),包括:第一确定模块(图中未示出),用于对于备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对第一概率、属性值、乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、乘积进行加权求和,得到该备选词对应的分数;选择模块(图中未示出),用于从备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
在本实施例的一些可选实现方式中,解析子单元(图中未示出),包括:分析模块(图中未示出),用于对搜索语句和/或内容进行统计分析和/或语义分析,提取出至少一个核心词;扩展模块(图中未示出),用于对于至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;第二确定模块(图中未示出),用于将核心词以及得到的扩展词确定为关键词。
在本实施例的一些可选实现方式中,生成单元506,包括:第二确定子单元(图中未示出),用于响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,第二概率确定模型用于表征以下信息项中的至少一项与第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与第二概率确定该第二信息流数据的分值;第二选取子单元(图中未示出),用于从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;聚合子单元(图中未示出),用于聚合第一信息流数据和所选取的第二信息流数据,生成待推送数据。
从图5中可以看出,本实施例中用于推送信息的装置500通过接收终端发送的信息流数据获取请求,并根据查询用信息进行查询,得到第一信息流数据,而后获取与终端关联的账户在预定时间段内的搜索记录和浏览记录,基于搜索记录和/或浏览记录,确定关键词,并确定预设信息流数据集合中与关键词匹配的第二信息流数据,最后基于第一信息流数据和所确定的第二信息流数据,生成待推送数据,并向终端推送待推送数据,实现了富于针对性的信息推送。
下面参考图6,其示出了适于用来实现本申请实施例的服务器的计算机系统600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口606。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,所述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括接收单元,查询单元,获取单元,第一确定单元,第二确定单元,生成单元,推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,接收单元还可以被描述为“接收终端发送的信息流数据获取请求的单元”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入服务器中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收终端发送的信息流数据获取请求,信息流数据获取请求包括查询用信息;根据查询用信息进行查询,得到第一信息流数据;获取与终端关联的账户在预定时间段内的搜索记录和/或浏览记录;基于搜索记录和/或浏览记录,确定关键词;确定预设信息流数据集合中与关键词匹配的第二信息流数据;基于第一信息流数据和所确定的第二信息流数据,生成待推送数据;向终端推送待推送数据。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种用于推送信息的方法,其特征在于,所述方法包括:
接收终端发送的信息流数据获取请求,所述信息流数据获取请求包括查询用信息;
根据所述查询用信息进行查询,得到所述信息流数据;
获取与所述终端关联的账户在预定时间段内的搜索记录和/或浏览记录;
基于所述搜索记录和/或所述浏览记录,确定关键词;
确定预设信息流数据集合中与所述关键词匹配的第二信息流数据;
基于所述第一信息流数据和所确定的第二信息流数据,生成待推送数据;
向所述终端推送所述待推送数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述搜索记录和/或所述浏览记录,确定关键词,包括:
获取所述搜索记录中的搜索语句和/或所述浏览记录中的浏览过的页面的内容;
对所述搜索语句和/或所述内容进行内容解析,得到备选词集合;
对于所述备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到所述终端发送的页面的访问请求的第一概率,所述页面包括与该备选词匹配的第二信息流数据所指向的页面,所述第一概率确定模型用于表征以下信息项中的至少一项与所述第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;
基于所述第一概率从所述备选词集合中选取所述关键词。
3.根据权利要求2所述的方法,其特征在于,所述预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及
所述基于所述第一概率从所述备选词集合中选取所述关键词,包括:
对于所述备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对所述第一概率、所述属性值、所述乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、所述乘积进行加权求和,得到该备选词对应的分数;
从所述备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
4.根据权利要求2所述的方法,其特征在于,所述对所述搜索语句和/或所述内容进行内容解析,得到备选词集合,包括:
对所述搜索语句和/或所述内容进行统计分析和/或语义分析,提取出至少一个核心词;
对于所述至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,所述扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;
将所述核心词以及得到的扩展词确定为关键词。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述基于所述第一信息流数据和所确定的第二信息流数据,生成待推送数据,包括:
响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到所述终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,所述第二概率确定模型用于表征以下信息项中的至少一项与所述第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与所述第二概率确定该第二信息流数据的分值;
从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;
聚合所述第一信息流数据和所选取的第二信息流数据,生成待推送数据。
6.一种用于推送信息的装置,其特征在于,所述装置包括:
接收单元,用于接收终端发送的信息流数据获取请求,所述信息流数据获取请求包括查询用信息;
查询单元,用于根据所述查询用信息进行查询,得到所述信息流数据;
获取单元,用于获取与所述终端关联的账户在预定时间段内的搜索记录和/或浏览记录;
第一确定单元,用于基于所述搜索记录和/或所述浏览记录,确定关键词;
第二确定单元,用于确定预设信息流数据集合中与所述关键词匹配的第二信息流数据;
生成单元,用于基于所述第一信息流数据和所确定的第二信息流数据,生成待推送数据;
推送单元,用于向所述终端推送所述待推送数据。
7.根据权利要求6所述的装置,其特征在于,所述第一确定单元,包括:
获取子单元,用于获取所述搜索记录中的搜索语句和/或所述浏览记录中的浏览过的页面的内容;
解析子单元,用于对所述搜索语句和/或所述内容进行内容解析,得到备选词集合;
第一确定子单元,用于对于所述备选词集合中的每个备选词,确定预设信息流数据集合中与该备选词匹配的第二信息流数据;基于预先训练的第一概率确定模型,确定接收到所述终端发送的页面的访问请求的第一概率,所述页面包括与该备选词匹配的第二信息流数据所指向的页面,所述第一概率确定模型用于表征以下信息项中的至少一项与所述第一概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的浏览器类型、备选词、备选词所属的行业的行业信息、备选词的来源信息;
第一选取子单元,用于基于所述第一概率从所述备选词集合中选取所述关键词。
8.根据权利要求7所述的装置,其特征在于,所述预设信息流数据集合中的每个信息流数据,预先设置有与该信息流数据对应的属性值;以及
所述第一选取子单元,包括:
第一确定模块,用于对于所述备选词集合中的每个备选词,执行以下分数确定操作:获取预先设置的与该备选词匹配的第二信息流数据对应的属性值,根据所获取的属性值确定该备选词对应的属性值;计算该备选词的对应的属性值和该备选词对应的第一概率的乘积;获取针对所述第一概率、所述属性值、所述乘积预先设置的权重,根据所获取的权重,对该备选词的对应的属性值、该备选词对应的第一概率、所述乘积进行加权求和,得到该备选词对应的分数;
选择模块,用于从所述备选词集合的各个备选词中按照分数由大到小的顺序选择预定数目个备选词作为关键词。
9.根据权利要求7所述的装置,其特征在于,所述解析子单元,包括:
分析模块,用于对所述搜索语句和/或所述内容进行统计分析和/或语义分析,提取出至少一个核心词;
扩展模块,用于对于所述至少一个核心词中的每个核心词,进行扩展操作得到扩展词,其中,所述扩展词包括以下至少一项:该核心词的同义词、该核心词的近义词、该核心词的关联词;
第二确定模块,用于将所述核心词以及得到的扩展词确定为关键词。
10.根据权利要求6-9中任一项所述的装置,其特征在于,所述生成单元,包括:
第二确定子单元,用于响应于所确定的第二信息流数据的数目大于预设数目,对于所确定的第二信息流数据中的每个第二信息流数据,执行以下分值确定操作:获取预先设置的与该第二信息流数据的对应的属性值;基于预先训练的第二概率确定模型,分别确定接收到所述终端发送的访问该第二信息流数据所指向的页面的请求的第二概率,所述第二概率确定模型用于表征以下信息项中的至少一项与所述第二概率的对应关系:与该终端关联的账户的账户信息、该终端的设备类型、该终端使用的浏览器的类型信息、第二信息流数据的特征信息;根据所获取的属性值与所述第二概率确定该第二信息流数据的分值;
第二选取子单元,用于从所确定的第二信息流数据中按照分值由大到小的顺序选取预设数目个第二信息流数据;
聚合子单元,用于聚合所述第一信息流数据和所选取的第二信息流数据,生成待推送数据。
11.一种设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201710351701.3A 2017-05-18 2017-05-18 用于推送信息的方法和装置 Active CN107172151B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201710351701.3A CN107172151B (zh) 2017-05-18 2017-05-18 用于推送信息的方法和装置
JP2019537764A JP6814298B2 (ja) 2017-05-18 2017-12-22 警告するための方法と装置
PCT/CN2017/118007 WO2018209954A1 (zh) 2017-05-18 2017-12-22 用于推送信息的方法和装置
US16/509,410 US11252245B2 (en) 2017-05-18 2019-07-11 Information pushing method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710351701.3A CN107172151B (zh) 2017-05-18 2017-05-18 用于推送信息的方法和装置

Publications (2)

Publication Number Publication Date
CN107172151A true CN107172151A (zh) 2017-09-15
CN107172151B CN107172151B (zh) 2020-08-07

Family

ID=59815775

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710351701.3A Active CN107172151B (zh) 2017-05-18 2017-05-18 用于推送信息的方法和装置

Country Status (4)

Country Link
US (1) US11252245B2 (zh)
JP (1) JP6814298B2 (zh)
CN (1) CN107172151B (zh)
WO (1) WO2018209954A1 (zh)

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784523A (zh) * 2017-10-30 2018-03-09 拓文化传媒(上海)有限公司 一种移动广告大数据业务服务系统
CN107885872A (zh) * 2017-11-27 2018-04-06 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN107886373A (zh) * 2017-12-11 2018-04-06 广东欧珀移动通信有限公司 基于关键词的广告推送方法、广告推送装置及电子终端
CN107911448A (zh) * 2017-11-14 2018-04-13 北京金山安全软件有限公司 一种内容推送方法及装置
CN108197288A (zh) * 2018-01-16 2018-06-22 平安好房(上海)电子商务有限公司 根据用户特征偏好的房源推送方法、装置、设备及介质
CN108228906A (zh) * 2018-02-08 2018-06-29 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108540831A (zh) * 2018-04-19 2018-09-14 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
WO2018209954A1 (zh) * 2017-05-18 2018-11-22 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN109271397A (zh) * 2018-10-15 2019-01-25 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109587328A (zh) * 2018-11-21 2019-04-05 Oppo广东移动通信有限公司 消息管理方法和装置、存储介质及电子设备
CN109948041A (zh) * 2017-12-07 2019-06-28 北京国双科技有限公司 数据推送方法及装置
CN109981712A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN109978584A (zh) * 2017-12-28 2019-07-05 北京奇虎科技有限公司 一种信息流广告推送方法及装置
CN110069698A (zh) * 2017-11-01 2019-07-30 北京京东尚科信息技术有限公司 信息推送方法和装置
CN110069621A (zh) * 2019-04-23 2019-07-30 上海连尚网络科技有限公司 电子小说的推荐方法、设备及计算机可读存储介质
CN110110071A (zh) * 2019-04-29 2019-08-09 上海连尚网络科技有限公司 电子小说的推荐方法、设备及计算机可读存储介质
CN110908995A (zh) * 2018-09-17 2020-03-24 阿里巴巴集团控股有限公司 数据处理方法、装置以及设备
CN111475536A (zh) * 2019-01-23 2020-07-31 百度在线网络技术(北京)有限公司 基于搜索引擎的数据分析方法和装置
CN111586133A (zh) * 2020-04-29 2020-08-25 深圳市元征科技股份有限公司 一种信息推送方法及相关装置
CN111753194A (zh) * 2020-06-16 2020-10-09 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、电子设备及存储介质
CN111770125A (zh) * 2019-05-23 2020-10-13 北京沃东天骏信息技术有限公司 用于推送信息的方法和装置
CN111881354A (zh) * 2020-07-28 2020-11-03 平安科技(深圳)有限公司 内容推荐方法、装置、电子设备及介质
CN111953741A (zh) * 2020-07-21 2020-11-17 北京字节跳动网络技术有限公司 信息推送方法、装置和电子设备
CN112148962A (zh) * 2019-06-28 2020-12-29 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN112199090A (zh) * 2019-07-08 2021-01-08 腾讯科技(深圳)有限公司 信息流处理方法、装置以及计算机可读存储介质
CN112307321A (zh) * 2019-11-15 2021-02-02 北京字节跳动网络技术有限公司 信息推送方法、装置和电子设备
CN112887426A (zh) * 2021-03-02 2021-06-01 北京百度网讯科技有限公司 信息流的推送方法、装置、电子设备以及存储介质
CN115208946A (zh) * 2022-07-18 2022-10-18 中国银行股份有限公司 一种消息推送方法、消息推送服务器及存储介质

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109889577B (zh) * 2019-01-21 2021-09-10 广州华泓文化发展有限公司 一种流媒体数据流量分析方法及系统
CN110675197B (zh) * 2019-09-30 2023-09-26 北京达佳互联信息技术有限公司 评估数据的方法、装置、设备及存储介质
CN111191126B (zh) * 2019-12-24 2023-11-03 绍兴市上虞区理工高等研究院 一种基于关键词的科技成果精准推送方法及装置
CN111859156B (zh) * 2020-08-04 2024-02-02 上海秒针网络科技有限公司 发布人群的确定方法、装置、可读存储介质及电子设备
KR20220138867A (ko) * 2021-06-23 2022-10-13 베이징 바이두 넷컴 사이언스 테크놀로지 컴퍼니 리미티드 데이터 처리방법 및 장치, 컴퓨팅 기기 및 매체
CN113656683B (zh) * 2021-07-12 2024-08-23 北京旷视科技有限公司 订阅数据推送方法、装置、系统、电子设备及存储介质
CN114817685B (zh) * 2022-03-11 2023-03-10 杭州知聊信息技术有限公司 一种快速锁定目标信息的方法及其系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970289A (zh) * 2012-11-09 2013-03-13 同济大学 基于Web用户行为模式的身份认证方法
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN105095394A (zh) * 2015-06-30 2015-11-25 百度在线网络技术(北京)有限公司 网页生成方法和装置
CN105678587A (zh) * 2016-01-12 2016-06-15 腾讯科技(深圳)有限公司 一种推荐特征确定方法、信息推荐方法及装置
CN105701155A (zh) * 2015-12-30 2016-06-22 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105721944A (zh) * 2016-01-29 2016-06-29 四川长虹电器股份有限公司 智能电视的新闻资讯推荐方法
WO2016176055A1 (en) * 2015-04-30 2016-11-03 Alibaba Group Holding Limited Method and system of monitoring a service object
CN106651429A (zh) * 2016-10-18 2017-05-10 安徽天达网络科技有限公司 一种基于互联网的广告推送方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7089194B1 (en) * 1999-06-17 2006-08-08 International Business Machines Corporation Method and apparatus for providing reduced cost online service and adaptive targeting of advertisements
US7908263B1 (en) * 2008-06-25 2011-03-15 Richard S Paiz Search engine optimizer
US20140180825A1 (en) * 2005-09-14 2014-06-26 Millennial Media, Inc. Interactive Mobile Advertisement Banners
EP1952326A4 (en) * 2005-11-07 2010-08-04 Scanscout Inc TECHNIQUES FOR RENDERING ADVERTISEMENTS TO ENRICHED MEDIA
US8036937B2 (en) * 2005-12-21 2011-10-11 Ebay Inc. Computer-implemented method and system for enabling the automated selection of keywords for rapid keyword portfolio expansion
US20080103887A1 (en) * 2006-10-31 2008-05-01 Google Inc. Selecting advertisements based on consumer transactions
JP2012014652A (ja) * 2010-07-05 2012-01-19 Zenrin Datacom Co Ltd コンテンツ配信システム及びコンテンツ配信方法
US8566160B2 (en) * 2010-09-30 2013-10-22 Yahoo! Inc. Determining placement of advertisements on web pages
US9406077B1 (en) * 2011-10-19 2016-08-02 Google Inc. System and method for ad keyword scoring
US9304738B1 (en) * 2012-06-14 2016-04-05 Goolge Inc. Systems and methods for selecting content using weighted terms
US20140136332A1 (en) * 2012-11-14 2014-05-15 Facebook, Inc. Providing social context for products in advertisements
US9336057B2 (en) * 2012-12-21 2016-05-10 Microsoft Technology Licensing, Llc Assigning jobs to heterogeneous processing modules
WO2014155681A1 (ja) * 2013-03-29 2014-10-02 楽天株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
US9858594B2 (en) * 2014-06-30 2018-01-02 Microsoft Technology Licensing, Llc Assigning scores to electronic communications with extensions
TW201631993A (zh) * 2015-02-26 2016-09-01 艾爾康太平洋股份有限公司 資訊推播及重新導向系統及方法
US10565622B1 (en) * 2015-03-24 2020-02-18 Amazon Technologies, Inc. Optimization of real-time probabilistic model evaluation for online advertising
US20160357764A1 (en) * 2015-06-02 2016-12-08 Quixey, Inc. Generating Search Results based on Proximate Computing Devices
CN106228386B (zh) * 2016-07-12 2018-09-25 腾讯科技(深圳)有限公司 一种信息推送方法及装置
CN107172151B (zh) * 2017-05-18 2020-08-07 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102970289A (zh) * 2012-11-09 2013-03-13 同济大学 基于Web用户行为模式的身份认证方法
WO2016176055A1 (en) * 2015-04-30 2016-11-03 Alibaba Group Holding Limited Method and system of monitoring a service object
CN105095394A (zh) * 2015-06-30 2015-11-25 百度在线网络技术(北京)有限公司 网页生成方法和装置
CN105069102A (zh) * 2015-08-03 2015-11-18 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105069168A (zh) * 2015-08-28 2015-11-18 百度在线网络技术(北京)有限公司 搜索词推荐方法和装置
CN105701155A (zh) * 2015-12-30 2016-06-22 百度在线网络技术(北京)有限公司 信息推送方法和装置
CN105678587A (zh) * 2016-01-12 2016-06-15 腾讯科技(深圳)有限公司 一种推荐特征确定方法、信息推荐方法及装置
CN105721944A (zh) * 2016-01-29 2016-06-29 四川长虹电器股份有限公司 智能电视的新闻资讯推荐方法
CN106651429A (zh) * 2016-10-18 2017-05-10 安徽天达网络科技有限公司 一种基于互联网的广告推送方法

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018209954A1 (zh) * 2017-05-18 2018-11-22 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN107784523A (zh) * 2017-10-30 2018-03-09 拓文化传媒(上海)有限公司 一种移动广告大数据业务服务系统
CN110069698B (zh) * 2017-11-01 2021-09-03 北京京东尚科信息技术有限公司 信息推送方法和装置
CN110069698A (zh) * 2017-11-01 2019-07-30 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107911448A (zh) * 2017-11-14 2018-04-13 北京金山安全软件有限公司 一种内容推送方法及装置
CN107911448B (zh) * 2017-11-14 2021-10-29 北京金山安全软件有限公司 一种内容推送方法及装置
CN107885872A (zh) * 2017-11-27 2018-04-06 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN107885872B (zh) * 2017-11-27 2023-12-19 百度在线网络技术(北京)有限公司 用于生成信息的方法和装置
CN109948041A (zh) * 2017-12-07 2019-06-28 北京国双科技有限公司 数据推送方法及装置
CN107886373B (zh) * 2017-12-11 2021-09-21 Oppo广东移动通信有限公司 基于关键词的广告推送方法、广告推送装置及电子终端
CN107886373A (zh) * 2017-12-11 2018-04-06 广东欧珀移动通信有限公司 基于关键词的广告推送方法、广告推送装置及电子终端
CN109981712A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 用于推送信息的方法和装置
CN109978584A (zh) * 2017-12-28 2019-07-05 北京奇虎科技有限公司 一种信息流广告推送方法及装置
CN108197288B (zh) * 2018-01-16 2020-09-01 平安好房(上海)电子商务有限公司 根据用户特征偏好的房源推送方法、装置、设备及介质
CN108197288A (zh) * 2018-01-16 2018-06-22 平安好房(上海)电子商务有限公司 根据用户特征偏好的房源推送方法、装置、设备及介质
CN108228906A (zh) * 2018-02-08 2018-06-29 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN108540831B (zh) * 2018-04-19 2019-10-22 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
US11310066B2 (en) 2018-04-19 2022-04-19 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for pushing information
CN108540831A (zh) * 2018-04-19 2018-09-14 百度在线网络技术(北京)有限公司 用于推送信息的方法和装置
CN110908995A (zh) * 2018-09-17 2020-03-24 阿里巴巴集团控股有限公司 数据处理方法、装置以及设备
CN110908995B (zh) * 2018-09-17 2023-04-11 阿里巴巴集团控股有限公司 数据处理方法、装置以及设备
CN109271397A (zh) * 2018-10-15 2019-01-25 北京字节跳动网络技术有限公司 用于处理信息的方法和装置
CN109587328A (zh) * 2018-11-21 2019-04-05 Oppo广东移动通信有限公司 消息管理方法和装置、存储介质及电子设备
CN111475536A (zh) * 2019-01-23 2020-07-31 百度在线网络技术(北京)有限公司 基于搜索引擎的数据分析方法和装置
CN111475536B (zh) * 2019-01-23 2023-10-17 百度在线网络技术(北京)有限公司 基于搜索引擎的数据分析方法和装置
CN110069621A (zh) * 2019-04-23 2019-07-30 上海连尚网络科技有限公司 电子小说的推荐方法、设备及计算机可读存储介质
CN110110071A (zh) * 2019-04-29 2019-08-09 上海连尚网络科技有限公司 电子小说的推荐方法、设备及计算机可读存储介质
CN111770125A (zh) * 2019-05-23 2020-10-13 北京沃东天骏信息技术有限公司 用于推送信息的方法和装置
US11962662B2 (en) 2019-05-23 2024-04-16 Beijing Wodong Tianjun Information Technology Co., Ltd. Method and apparatus for pushing information
CN112148962A (zh) * 2019-06-28 2020-12-29 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN112148962B (zh) * 2019-06-28 2023-08-01 北京百度网讯科技有限公司 用于推送信息的方法和装置
CN112199090A (zh) * 2019-07-08 2021-01-08 腾讯科技(深圳)有限公司 信息流处理方法、装置以及计算机可读存储介质
CN112199090B (zh) * 2019-07-08 2024-08-06 腾讯科技(深圳)有限公司 信息流处理方法、装置以及计算机可读存储介质
CN112307321A (zh) * 2019-11-15 2021-02-02 北京字节跳动网络技术有限公司 信息推送方法、装置和电子设备
CN111586133A (zh) * 2020-04-29 2020-08-25 深圳市元征科技股份有限公司 一种信息推送方法及相关装置
CN111753194B (zh) * 2020-06-16 2022-05-17 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、电子设备及存储介质
CN111753194A (zh) * 2020-06-16 2020-10-09 北京字节跳动网络技术有限公司 一种信息推送的方法、装置、电子设备及存储介质
CN111953741A (zh) * 2020-07-21 2020-11-17 北京字节跳动网络技术有限公司 信息推送方法、装置和电子设备
CN111881354A (zh) * 2020-07-28 2020-11-03 平安科技(深圳)有限公司 内容推荐方法、装置、电子设备及介质
CN112887426A (zh) * 2021-03-02 2021-06-01 北京百度网讯科技有限公司 信息流的推送方法、装置、电子设备以及存储介质
CN115208946A (zh) * 2022-07-18 2022-10-18 中国银行股份有限公司 一种消息推送方法、消息推送服务器及存储介质
CN115208946B (zh) * 2022-07-18 2024-03-01 中国银行股份有限公司 一种消息推送方法、消息推送服务器及存储介质

Also Published As

Publication number Publication date
US11252245B2 (en) 2022-02-15
CN107172151B (zh) 2020-08-07
JP2020509449A (ja) 2020-03-26
WO2018209954A1 (zh) 2018-11-22
US20190335011A1 (en) 2019-10-31
JP6814298B2 (ja) 2021-01-13

Similar Documents

Publication Publication Date Title
CN107172151A (zh) 用于推送信息的方法和装置
CN108805594B (zh) 信息推送方法和装置
WO2018192491A1 (zh) 信息推送方法和装置
CN108664513B (zh) 用于推送关键词的方法、装置以及设备
CN107908740A (zh) 信息输出方法和装置
CN107256267A (zh) 查询方法和装置
CN106845999A (zh) 风险用户识别方法、装置和服务器
CN108228906B (zh) 用于生成信息的方法和装置
CN107203894A (zh) 信息推送方法和装置
CN108632311A (zh) 信息推送方法和装置
CN108804450A (zh) 信息推送的方法和装置
CN107295095A (zh) 推送及展示广告的方法和装置
CN107332910A (zh) 信息推送方法和装置
CN110363604B (zh) 页面生成方法和装置
WO2020215977A1 (zh) 用于展示信息的系统、方法及装置
CN107730337A (zh) 信息推送方法和装置
CN109388548A (zh) 用于生成信息的方法和装置
AU2015217230A1 (en) Event-based offers for a geofenced geographic area
JP6018338B1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP6976207B2 (ja) 情報処理装置、情報処理方法、およびプログラム
CN107169077A (zh) 用于推送信息的方法和装置
CN107977678A (zh) 用于输出信息的方法和装置
CN110020112A (zh) 对象推送方法及其系统
CN107729573A (zh) 信息推送方法和装置
CN107346505A (zh) 信息推送方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant