CN105868345B - 一种信息确定方法及装置 - Google Patents
一种信息确定方法及装置 Download PDFInfo
- Publication number
- CN105868345B CN105868345B CN201610183707.XA CN201610183707A CN105868345B CN 105868345 B CN105868345 B CN 105868345B CN 201610183707 A CN201610183707 A CN 201610183707A CN 105868345 B CN105868345 B CN 105868345B
- Authority
- CN
- China
- Prior art keywords
- information
- category
- internet
- determined
- search key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种信息确定方法,用以解决现有技术中通过人工进行手动筛选来确定目标信息导致的目标信息确定效率低的问题。该方法包括:根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。本申请还公开了一种信息确定装置。
Description
技术领域
本申请涉及互联网技术领域,尤其涉及一种信息确定方法及装置。
背景技术
目前,全球已经进入互联网时代,用户可以借助文字、图片、视频等载体将信息发布至互联网中,互联网极大地方便了信息的传播。
在互联网中,每天都充斥着大量的信息,用户在借助互联网获取信息时,往往只关注自己感兴趣的信息。用户感兴趣的信息一般为特定类别的信息,所述特定类别比如可以是新闻、电影、汽车等类别。随着人们生活节奏的加快,用户往往无法阅读自己所关注类别的所有信息,因此用户会只阅读自己感兴趣的类别的部分信息,比如用户往往只阅读自己感兴趣的类别的热门信息。
那么,对于互联网信息发布者而言,为了给用户较好的阅读体验,往往会对信息进行分类展示。比如,在对信息进行分类时,可以根据信息的不同目标用户群体来对信息进行分类。比如有些用户喜欢关注新闻信息,有些用户喜欢关注科技信息,有些用户喜欢关注财经信息,则互联网信息发布者可以将信息划分为新闻、科技、财经等类别;同时,相同领域类别的信息也可以根据关注度的不同,将信息分为热门信息、普通信息等类别,并进行分类展示。在对信息进行分类展示时,可以在信息展示界面中将预定类别的信息进行特殊展示,比如可以对新闻类别的热门信息类的信息(后文简称热门新闻)做醒目的特殊标记或置于界面显著位置,以便和普通的信息进行区分,方便用户快速地获取热门新闻。
在对预定类别的信息进行特殊展示前,互联网信息发布者需要预先确定预定类别的信息,我们将所述预定类别的信息称为目标信息。由于互联网信息发布者往往会发布大量的信息,这些信息存储于数据库中,这就需要互联网信息发布者从数据库的大量信息中筛选出所述目标信息,然后才可以对筛选出的所述目标信息做特殊展示。
在现有技术中,对所述目标信息进行筛选时,需要工作人员进行手动筛选。例如,在从网站A数据库存储的1000条新闻中筛选热门新闻时,网站A的编辑需要获取当前整个互联网中关注度较高的新闻,所述关注度较高的新闻的获取途径比如可以是查看其它媒体中点击量较高的新闻,然后根据当前互联网中关注度较高的新闻,从网站A发布的1000条新闻中选出与所述关注度较高的新闻相同的新闻作为热门新闻。
目前,通过人工进行手动筛选来确定目标信息的目标信息确定方法,确定目标信息的效率较低。
发明内容
本申请实施例提供一种信息确定方法,用以解决现有技术中通过人工进行手动筛选来确定目标信息导致的目标信息确定效率低的问题。
本申请实施例还提供一种信息确定装置,用以解决现有技术中通过人工进行手动筛选来确定目标信息导致的目标信息确定效率低的问题。
本申请实施例采用下述技术方案:
一种信息确定方法,所述方法包括:
根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;
根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;
根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。
一种信息确定装置,所述装置包括:
搜索关键字确定单元,用于根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;
互联网信息确定单元,用于根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;
目标信息确定单元,根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。
本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
通过根据期待筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字,并根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息,进而根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息,无需手动确定目标信息。相对于现有技术中通过人工进行手动筛选来确定目标信息的目标信息确定方法,提高了目标信息的确定效率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请实施例1提供的一种信息确定方法的实现流程示意图;
图2为本申请实施例2提供的一种信息确定方法的一种实现流程示意图;
图3为本申请实施例3提供的一种信息确定方法的一种实现流程示意图;
图4为本申请实施例4提供的一种信息确定装置的具体结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
以下结合附图,详细说明本申请各实施例提供的技术方案。
实施例1
为解决现有技术中通过人工进行手动筛选来确定目标信息导致的目标信息确定效率低的问题,本申请实施例1提供一种信息确定方法。本申请实施例提供的信息确定方法的执行主体可以是服务器,例如,信息资讯网站的服务器、信息资讯客户端对应的服务器、新闻网站的服务器、新闻客户端对应的服务器,等等。
为便于描述,下文以该方法的执行主体为信息资讯客户端对应的服务器为例,对该方法的实施方式进行介绍。可以理解,该方法的执行主体为信息资讯客户端对应的服务器只是一种示例性的说明,并不应理解为对该方法的限定。
该方法的实现流程示意图如图1所示,包括下述步骤:
步骤11:根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;
本申请实施例中,所述信息可以是以文字、音频、视频等为载体的信息。所述信息可以包含信息标题和信息详情。其中,所述信息标题可以是用于概括所述信息的文字,所述信息详情包含用于记录所述信息的文字、音频、视频等信息载体。
本申请实施例中,可以将所述信息存储于数据库中,在对信息进行存储后,可以对存储的信息进行分类管理。在对存储的信息进行分类时,可以根据预先设置的信息类别,从所述存储的信息构成的待筛选的信息集合中进行筛选。
在实际应用中,在对待筛选信息集合中不同关注度的信息进行分类时,所述第一类别,可以是根据期望筛选出的信息对应的互联网中的搜索关键字的搜索指数划分的。其中,所述搜索指数,是用以反映搜索关键字关注度的数据。
本申请实施例中,所述搜索关键字为用户输入的用于检索信息的字或词,亦可称作搜索关键词。所述搜索关键字往往能够最大程度地概括用户所要查找的信息,搜索引擎可以对所有用户输入的搜索关键字进行统计和分析,以关键字的搜索频次为基础进行加权计算,得到搜索指数。搜索指数高的搜索关键字,其被搜索的频次往往较高,在互联网中的受关注程度往往也较高。即所述搜索指数可以反映搜索关键字的关注度。
基于搜索关键字的搜索指数可以反映搜索关键字的关注度,则可以通过根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字,来确定与所述确定出的搜索关键字相对应的目标信息。所述与所述确定出的搜索关键字相对应的目标信息比如可以是信息标题中包含确定出的搜索关键字的目标信息。
本申请实施例中,所述搜索关键字的搜索指数可以从互联网中获取,所述搜索指数的获取途径比如可以是谷歌趋势,也可以是百度搜索风云榜,也可以是提供热门标签或热门话题的微博平台等可以提供搜索关键字的搜索指数的互联网平台。
需要说明的是,由于所述提供搜索指数的互联网平台在提供搜索关键字的搜索指数时,预先为所述搜索关键字进行了分类,并且提供了各分类中搜索关键字的搜索指数排名。那么,可以根据期望筛选出的信息所属的附属类别,从所述提供搜索指数的互联网平台中的与所述附属类别相对应的类别中确定搜索关键字。所述期望筛选出的信息所属的附属类别是根据期望筛选出的信息具备的不同属性划分的,比如可以是根据不同国家划分的类别、后文所述第二类别等根据不同属性划分的类别。比如,可以根据后文所述第二类别,确定所述提供搜索指数的互联网平台中搜索关键字的类别为第二类别,进而从属于所述第二类别的搜索关键字中确定属于所述第一类别的搜索关键字。所述与所述附属类别相对应的类别比如可以是与所述附属类别相同或相似的类别。
在实际应用中,在期望筛选待筛选信息集合中的热门信息时,所述第一类别,可以是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数大于预定指数阈值的期望筛选出的信息所属的类别。其中,所述热门信息为关注度指数高于预定关注度指数阈值的信息,由于搜索指数可以间接反映搜索关键字的关注度,则所述第一类别可以是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数大于预定指数阈值的期望筛选出的信息所属的类别。
在实际应用中,所述第一类别,也可以是搜索指数的排名高于预定搜索指数排名的类别。比如可以是搜索指数的排名高于第11名的类别,即属于所述第一类别的搜索关键字为搜索指数排名前10的搜索关键字。
在实际应用中,所述第一类别,也可以是在预定时长内,搜索指数从不高于预设的第一搜索指数阈值提升到不低于预设的第二搜索指数阈值,并保持不低于预设的第二搜索指数阈值预定保持时长,且搜索指数的排名高于预定搜索指数排名的类别。比如,所述第一类别可以是搜索关键字的搜索指数从20以下提高到100以上,且保持高于100超过2小时,且搜索指数的排名在10名以内的类别。
在实际应用中,在期望筛选待筛选信息集合中的关注度提升较快的信息时,所述第一类别,可以是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数的变化满足预定变化条件的期望筛选出的信息所属的类别。其中,所述关注度提升较快的信息比如可以是突发新闻。由于搜索指数可以间接反映搜索关键字的关注度,则可以预先从互联网中确定搜索指数提升较快的搜索关键字,然后利用确定的搜索指数提升较快的搜索关键字确定与确定的搜索指数提升较快的搜索关键字相对应的目标信息。
本申请实施例中,所述预定变化条件,包括下述至少一种:在预定时间段内,搜索指数从不高于预设的第一搜索指数阈值提升到不低于预设的第二搜索指数阈值;在预定时间段内,搜索指数变化量高于预设的搜索指数变化量阈值;在预定时间段内,搜索指数的排名提高到高于预设的排名阈值。
在实际应用中,在从待筛选信息集合中确定关注度提升较快的信息时,所述预定变化条件比如可以是搜索指数4小时前不在当前分类前10名之内,2小时内排名提高到10名以内,并且搜索指数从一小时前的20以下提高到超过100。
本申请实施例中,可以根据期望筛选出的信息的属性,来划分所述第一类别,在此不再赘述。可以理解,根据期望筛选出的信息对应的互联网中的搜索关键字的搜索指数划分所述第一类别,只是一种示例性的说明,并不应理解为对该方法的限定。
本申请实施例中,在根据期望筛选出的信息,确定所述第一类别后,便可以根据所述第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字。
步骤12:根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;
本申请实施例中,所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的。
在实际应用中,为了向不同阅读喜好的用户分类展示信息,可以根据信息的不同目标用户群体来对信息进行分类。比如有些用户喜欢关注新闻,有些用户喜欢关注科技资讯,有些用户喜欢关注财经信息,则可以将信息划分为新闻、科技、财经等类别。
本申请实施例中,在期望筛选出的信息为新闻时,则所述第二类别可以是新闻类。
本申请实施例中,可以通过根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字,来确定与所述确定出的搜索关键字对应的目标信息。
然而,直接利用确定出的搜索关键字来从待筛选信息中确定目标信息,可能会导致确定的目标信息中存在一些与搜索关键字相关度低的信息,所述与搜索关键字相关度低的信息比如可以是包含所述搜索关键字但是其关注度较低的信息,也可以是包含所述搜索关键字,但是信息主题与所述搜索关键字的相关性较低或不相关的信息。如果将所述与搜索关键字相关度低的信息确定为目标信息,并进行展示,容易导致用户体验较差。
在实际应用中,由于搜索引擎的搜索引擎排名算法,可以根据网页包含的信息和搜索关键字的相关度、网页在搜索结果中的被点击频次、网页内容发布时间以及网站内容质量等信息对搜索结果中的网页进行排序。因此,在确定属于所述第一类别的搜索关键字后,可以利用搜索引擎从互联网中获取与所述确定的搜索关键字相关度高的网页,进而利用获取的与所述确定的搜索关键字相关度高的网页中的信息的信息标题来确定目标信息,便可以获得与搜索关键字相关度高的目标信息。避免了直接从待筛选信息中确定目标信息导致的确定的目标信息中可能存在与搜索关键字相关度低的信息的问题。
具体地,首先,可以根据所述第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的候选信息。例如,可以根据所述确定出的搜索关键字,通过搜索引擎,检索到所述搜索引擎收录的包含所述搜索关键字的互联网中的所有网页。然后可以从所述所有网页中进一步获取包含属于所述第二类别的信息的网页,并将所述进一步获取到的网页中包含的信息作为候选信息。
比如当所述第二类别为新闻时,则可以从所述所有网页中,进一步获取包含的信息的类别为新闻的网页,则所述包含的信息的类别为新闻的网页中包含的信息即为候选信息。
其次,由于所述进一步获取到的包含所述候选信息的网页的数量往往较大,因此可以从所述进一步获取到的网页中进行筛选,以便获得与所述搜索关键字相关度高的网页。
在实际应用中,可以根据所述进一步获取到的网页的搜索引擎排名,以及预设的候选信息筛选条件,来确定与确定出的所述搜索关键字相关度高的网页。由于所述进一步获取到的网页中包含所述候选信息,即可以从确定出的候选信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息。
本申请实施例中,所述预设的候选信息筛选条件可以是,所述进一步获取到的网页的搜索引擎排名高于预设的搜索引擎排名阈值。
步骤13:根据从互联网的信息中确定出的信息的特征,从所述待筛选的信息集合中确定具备所述特征的信息作为目标信息。
本申请实施例中,在从互联网中确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息后,可以获取所述从互联网中确定的信息的特征,以便后续根据所述特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。所述特征比如可以是信息标题,则当所述第二类别为新闻时,则所述特征为新闻标题。
本申请实施例中,所述待筛选的信息集合可以是预先储存的信息构成的集合,所述待筛选的信息可以存储于数据库中。
在实际应用中,所述待筛选的信息集合,比如可以是数据库存储的新闻构成的集合。
在实际应用中,为了方便对信息的管理,可以将信息按照一定的规范进行存储。所述一定的规范比如可以是将信息标题和信息详情分别存储于数据库表的不同字段中。
本申请实施例中,可以根据从互联网的信息中确定出的信息的信息标题,从所述存储有待筛选的信息集合的数据库中查找与所述从互联网的信息中确定出的信息的信息标题相匹配的信息标题。将信息标题与所述从互联网的信息中确定出的信息的信息标题相匹配的数据库中的信息作为目标信息。
在实际应用中,当所述第二类别为新闻类时,可以根据确定出的新闻的新闻标题,从所述待筛选的信息集合中,确定具备所述新闻标题的新闻。
本申请实施例中,在根据确定出的互联网中的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息后,还可以按照预定的目标信息展示规则对确定出的所述目标信息进行展示。
由于存储于数据库中的所述目标信息可以是从互联网中转载或采集的信息,所以所述确定出的互联网中的信息和所述目标信息可以是内容相同或相似的信息。则在实际应用中,可以认为所述确定出的互联网中的信息和所述目标信息的关注度相同。那么,当所述目标信息为热门信息时,可以根据确定出的互联网中的信息的关注度指数,按照预定的目标信息展示规则对确定的具备所述特征的目标信息进行展示。
在实际应用中,所述目标信息展示规则可以是以列表的形式对目标信息中的各条信息进行展示时,目标信息中的各条信息可以在信息展示页面中按照从页面顶部到页面底部依次排列的形式进行展示。比如,可以按照目标信息中的各条信息关注度指数从高到低的顺序在信息展示页面从上到下依次展示所述目标信息中的各条信息。
本申请实施例中,所述确定的互联网中的信息的关注度指数是根据下述至少一种数据确定:从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数;从互联网的信息中确定出的信息对应的网页在所述候选信息对应的网页中的搜索引擎排名。比如可以根据从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数得到的搜索指数的排名,进而根据所述搜索指数的排名确定所述互联网中的信息的关注度指数。
在实际应用中,所述关注度指数也可以是对从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数和从互联网的信息中确定出的信息对应的网页在所述候选信息对应的网页中的搜索引擎排名两个数值进行加权得到的。
本申请实施例中,所述加权的具体加权算法在此不做限定,比如在进行加权时,可以按照下述规则进行加权:从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数越高,则所述从互联网的信息中确定出的信息的关注度指数越高;从互联网的信息中确定出的信息对应的网页在所述候选信息对应的网页中的搜索引擎排名越高,则所述从互联网的信息中确定出的信息的关注度指数越高。
本申请实施例中,在对所述目标信息展示时,还可以对所述目标信息做特殊标记。比如当所述目标信息为热门新闻时,则可以在信息展示页面为所述热门新闻添加与所述热门新闻对应的标记。所述与所述热门新闻对应的标记比如可以是标记热门新闻四个字。
本申请实施例1提供的信息确定方法,通过根据期待筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字,并根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息,进而根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息,无需手动确定目标信息,相对于现有技术中通过人工进行手动筛选来确定目标信息的目标信息确定方法,提高了目标信息的确定效率。
实施例2
基于前述实施例1详细叙述了本申请的发明构思,为了便于更好的理解本申请的技术特征、手段和效果,下面对本申请的频繁项集的挖掘方法做进一步说明,从而形成了本申请的又一个实施例。
本申请实施例2中信息确定的过程与实施例1中所述信息确定的过程相似,实施例2中没有介绍到的其他一些步骤可以参见实施例1中的相关描述,此处不再赘述。
在对该方案的实现方式进行详细介绍前,先对该方案的实施场景进行简单介绍。
该实施场景中,信息资讯网站A的服务器通过转载或采集的方式从互联网中获取了大量的新闻,并存储在网站A的服务器的数据库中,在存储获取到的新闻时,新闻的新闻标题和新闻详细内容分别存储于数据库的不同字段中。
为了在新闻展示页面的显著位置向用户展示获取到的新闻中的属于美国的热门新闻,将要从获取到的新闻中确定属于所述热门新闻的科技类新闻,并对确定的属于所述热门新闻的新闻进行展示。
基于上述场景,实施例2中信息确定的过程如图2所示,包括下述步骤:
步骤21,确定当前时刻谷歌趋势提供的国家类别为美国的科技类的搜索关键字中,搜索指数排名前10的搜索关键字;
步骤22,进一步从确定的搜索指数排名前10的搜索关键字中,确定搜索指数从20以下提高到100以上,且在最近2小时内其搜索指数保持在100以上的搜索关键字,作为热门搜索关键字;
步骤23,根据进一步确定出的热门搜索关键字,利用搜索引擎,确定所述热门搜索关键字的搜索结果;
步骤24,从所述搜索结果中确定属于新闻类且搜索引擎排名前6的新闻网页;
步骤25,获取步骤24中确定的新闻网页的新闻标题;
步骤26,根据获取到的新闻标题,确定数据库中与获取到的新闻标题相匹配的新闻标题对应的新闻;
步骤27,将步骤26中确定的所述新闻归类至为热门新闻类别中;
步骤28,根据步骤24中确定出的新闻网页对应的确定出的搜索关键字的搜索指数和确定出的新闻网页在所述搜索结果中的搜索引擎排名,确定所述热门新闻类别中各条新闻的关注度指数;
步骤29,按照关注度指数从高到低的顺序在新闻展示页面从上到下依次展示所述热门新闻类别中的各条新闻。
本申请实施例2提供的热门新闻确定方法,通过获取搜索引擎中的热门搜索关键字,并获取与所述热门搜索关键字对应的新闻的新闻标题,进而根据所述新闻标题确定数据库中的热门新闻,无需人工手动确定热门新闻,提高了热门新闻的确定效率。
实施例3
基于前述实施例1详细叙述了本申请的发明构思,为了便于更好的理解本申请的技术特征、手段和效果,下面对本申请的频繁项集的挖掘方法做进一步说明,从而形成了本申请的又一个实施例。
本申请实施例3中信息确定的过程与实施例1中所述信息确定的过程相似,实施例3中没有介绍到的其他一些步骤可以参见实施例1中的相关描述,此处不再赘述。
在对该方案的实现方式进行详细介绍前,先对该方案的实施场景进行简单介绍。
该实施场景中,与信息资讯客户端对应的服务器通过转载或采集的方式从互联网中获取了大量的新闻,并存储在所述服务器的数据库中,在存储获取到的新闻时,新闻的新闻标题和新闻详细内容分别存储于数据库的不同字段中。
为了在新闻展示页面的预定位置向用户展示获取到的新闻中的属于美国的突发新闻,将要从获取到的新闻中确定所述突发新闻,并对确定的所述突发新闻进行展示。所述突发新闻可以是最近预定时长内发生的,且关注度在较短时间内迅速上升的新闻,所述最近预定时长比如可以是最近1天。
基于上述场景,实施例3中信息确定的过程如图3所示,包括下述步骤:
步骤31,确定当前时刻谷歌趋势提供的国家类别为美国的新闻类的搜索关键字中,搜索指数排名4小时前不在当前分类前10名之内,2小时内排名提高到10名以内,并且搜索指数从一小时前的20以下提高到超过100的搜索关键字;
步骤32,根据确定出的热门搜索关键字,利用搜索引擎,确定所述热门搜索关键字的搜索结果;
步骤33,从所述搜索结果中确定属于新闻类且搜索引擎排名前6的新闻网页;
步骤34,获取步骤33中确定的新闻网页的新闻标题;
步骤35,根据获取到的新闻标题,确定数据库中与获取到的新闻标题相匹配的新闻标题对应的新闻;
步骤36,将步骤35中确定的所述新闻归类至突发新闻类别中;
步骤37,根据步骤33中确定出的新闻网页对应的确定出的搜索关键字的搜索指数和确定出的新闻网页在所述搜索结果中的搜索引擎排名,确定所述突发新闻类别中各条新闻的关注度指数;
步骤38,按照关注度指数从高到低的顺序在新闻展示页面从上到下依次展示所述突发新闻类别中的各条新闻。
本申请实施例3提供的突发新闻确定方法,通过获取搜索引擎中的搜索指数满足预定变化条件的搜索关键字,并获取与所述满足预定变化条件的搜索关键字对应的新闻的新闻标题,进而根据所述新闻标题确定数据库中的突发新闻,无需人工手动确定突发新闻,提高了突发新闻的确定效率。
实施例4
为解决现有技术中通过人工进行手动筛选来确定目标信息导致的目标信息确定效率低的问题,本申请实施例4提供一种信息确定装置。该信息确定装置的结构示意图如图4所示,主要包括下述功能单元:
搜索关键字确定单元41,用于根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;
互联网信息确定单元42,用于根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;
目标信息确定单元43,用于根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。
在一种实施方式中,所述第一类别,是根据期望筛选出的信息对应的互联网中的搜索关键字的搜索指数划分的;
其中,所述搜索指数,是用以反映搜索关键字关注度的数据。
在一种实施方式中,所述第一类别,是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数大于预定指数阈值的期望筛选出的信息所属的类别;所述第二类别,为新闻类。
在一种实施方式中,所述第一类别,是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数的变化满足预定变化条件的期望筛选出的信息所属的类别;所述第二类别,为新闻类。
所述预定变化条件,包括下述至少一种:
在预定时间段内,搜索指数从不高于预设的第一搜索指数阈值提升到不低于预设的第二搜索指数阈值;在预定时间段内,搜索指数变化量高于预设的搜索指数变化量阈值;在预定时间段内,搜索指数的排名提高到高于预设的排名阈值。
所述待筛选的信息集合,为数据库存储的新闻构成的集合。
在一种实施方式中,所述目标信息确定单元43,具体用于根据确定出的新闻的新闻标题,从所述待筛选的信息集合中,确定具备所述新闻标题的新闻。
信息展示单元44,用于按照预定的目标信息展示规则对确定出的所述目标信息进行展示。
在一种实施方式中,所述信息展示单元44,具体用于根据确定出的互联网中的信息的关注度指数,按照预定的目标信息展示规则对确定的具备所述特征的目标信息进行展示。
在一种实施方式中,所述互联网信息确定单元42,具体用于根据所述第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的候选信息;根据预设的候选信息筛选条件,从确定出的候选信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息。
所述确定的互联网中的信息的关注度指数是根据下述至少一种数据确定:
从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数;
从互联网的信息中确定出的信息在所述候选信息中的搜索引擎排名。
本申请实施例4提供的信息确定装置,通过根据期待筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字,并根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息,进而根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息,无需人工手动确定目标信息,相对于现有技术中通过人工进行手动筛选来确定目标信息的目标信息确定方法,提高了目标信息的确定效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (11)
1.一种信息确定方法,其特征在于,所述方法包括:
根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;所述第一类别,是根据期望筛选出的信息对应的互联网中的搜索关键字的搜索指数划分的;其中,所述搜索指数,是用以反映搜索关键字关注度的数据;所述第一类别,是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数的变化满足预定变化条件的期望筛选出的信息所属的类别;所述预定变化条件,包括:在预定时间段内,搜索指数从不高于预设的第一搜索指数阈值提升到不低于预设的第二搜索指数阈值,并保持不低于预设的第二搜索指数阈值预定保持时长;
根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;
根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。
2.如权利要求1所述方法,其特征在于,所述第一类别,还可以是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数大于预定指数阈值的期望筛选出的信息所属的类别;
所述第二类别,为新闻类。
3.如权利要求1所述方法,其特征在于,
所述第二类别,为新闻类。
4.如权利要求3所述方法,其特征在于,所述预定变化条件,还包括下述至少一种:
在预定时间段内,搜索指数变化量高于预设的搜索指数变化量阈值;
在预定时间段内,搜索指数的排名提高到高于预设的排名阈值。
5.如权利要求1所述方法,其特征在于,所述待筛选的信息集合,为数据库存储的新闻构成的集合。
6.如权利要求2~5任一权项所述方法,其特征在于,根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息,包括:
根据确定出的新闻的新闻标题,从所述待筛选的信息集合中,确定具备所述新闻标题的新闻作为目标信息。
7.如权利要求1所述方法,其特征在于,在根据确定出的互联网中的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息后,所述方法还包括:
按照预定的目标信息展示规则对确定出的所述目标信息进行展示。
8.如权利要求7所述方法,其特征在于,按照预定的目标信息展示规则对确定的具备所述特征的目标信息进行展示,包括:
根据确定出的互联网中的信息的关注度指数,按照预定的目标信息展示规则对确定的具备所述特征的目标信息进行展示。
9.如权利要求8所述方法,其特征在于,根据所述第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息,包括:
根据所述第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的候选信息;
根据预设的候选信息筛选条件,从确定出的候选信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息。
10.如权利要求9所述方法,其特征在于,所述确定的互联网中的信息的关注度指数是根据下述至少一种数据确定:
从互联网的信息中确定出的信息对应的确定出的搜索关键字的搜索指数;
从互联网的信息中确定出的信息对应的网页在所述候选信息对应的网页中的搜索引擎排名。
11.一种信息确定装置,其特征在于,所述装置包括:
搜索关键字确定单元,用于根据期望筛选出的信息所属的第一类别,从互联网中的搜索关键字中确定属于所述第一类别的搜索关键字;所述第一类别,是根据期望筛选出的信息对应的互联网中的搜索关键字的搜索指数划分的;其中,所述搜索指数,是用以反映搜索关键字关注度的数据;所述第一类别,是期望筛选出的信息对应的互联网中的搜索关键字的搜索指数的变化满足预定变化条件的期望筛选出的信息所属的类别;所述预定变化条件,包括:在预定时间段内,搜索指数从不高于预设的第一搜索指数阈值提升到不低于预设的第二搜索指数阈值,并保持不低于预设的第二搜索指数阈值预定保持时长;
互联网信息确定单元,用于根据期望筛选出的信息所属的第二类别,以及确定出的搜索关键字,从互联网中的信息中,确定与所述确定出的搜索关键字相对应且属于所述第二类别的信息;所述第一类别与所述第二类别,是根据期望筛选出的信息具备的不同属性划分的;
目标信息确定单元,用于根据从互联网的信息中确定出的信息的特征,从待筛选的信息集合中确定具备所述特征的信息作为目标信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610183707.XA CN105868345B (zh) | 2016-03-28 | 2016-03-28 | 一种信息确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610183707.XA CN105868345B (zh) | 2016-03-28 | 2016-03-28 | 一种信息确定方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105868345A CN105868345A (zh) | 2016-08-17 |
CN105868345B true CN105868345B (zh) | 2019-06-07 |
Family
ID=56625899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610183707.XA Active CN105868345B (zh) | 2016-03-28 | 2016-03-28 | 一种信息确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105868345B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108540630B (zh) * | 2018-04-20 | 2020-09-18 | 叶盛 | 一种带触控屏的终端保护外壳 |
CN108897853A (zh) * | 2018-06-29 | 2018-11-27 | 北京百度网讯科技有限公司 | 生成推送信息的方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102244817A (zh) * | 2011-06-23 | 2011-11-16 | 康佳集团股份有限公司 | 基于互联网的数字电视节目相关信息的搜索方法 |
CN202929626U (zh) * | 2012-02-07 | 2013-05-08 | 钟勇 | 一种信息订制搜索系统 |
CN103577501A (zh) * | 2012-08-10 | 2014-02-12 | 深圳市世纪光速信息技术有限公司 | 热点话题搜索系统及热点话题搜索方法 |
CN103593482A (zh) * | 2013-12-02 | 2014-02-19 | 中国科学院软件研究所 | 一种城市信息的智能搜索方法 |
-
2016
- 2016-03-28 CN CN201610183707.XA patent/CN105868345B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102244817A (zh) * | 2011-06-23 | 2011-11-16 | 康佳集团股份有限公司 | 基于互联网的数字电视节目相关信息的搜索方法 |
CN202929626U (zh) * | 2012-02-07 | 2013-05-08 | 钟勇 | 一种信息订制搜索系统 |
CN103577501A (zh) * | 2012-08-10 | 2014-02-12 | 深圳市世纪光速信息技术有限公司 | 热点话题搜索系统及热点话题搜索方法 |
CN103593482A (zh) * | 2013-12-02 | 2014-02-19 | 中国科学院软件研究所 | 一种城市信息的智能搜索方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105868345A (zh) | 2016-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107133256B (zh) | 定制的内容消费界面 | |
US8806361B1 (en) | Multi-lane time-synched visualizations of machine data events | |
CN104991899B (zh) | 用户属性的识别方法及装置 | |
CN104035927B (zh) | 一种基于用户行为的搜索方法及系统 | |
JP4524709B2 (ja) | 情報処理装置および方法、並びに、プログラム | |
CN104111941B (zh) | 信息展示的方法及设备 | |
US20170091838A1 (en) | Product recommendation using sentiment and semantic analysis | |
US20100191742A1 (en) | System And Method For Managing User Attention By Detecting Hot And Cold Topics In Social Indexes | |
CN104021140B (zh) | 一种网络视频的处理方法及装置 | |
US10467255B2 (en) | Methods and systems for analyzing reading logs and documents thereof | |
CN108228906A (zh) | 用于生成信息的方法和装置 | |
CN104077707B (zh) | 一种推广呈现方式的优化方法和装置 | |
CN110322281A (zh) | 相似用户的挖掘方法及装置 | |
CN105916032A (zh) | 视频推荐的方法及视频推荐的终端设备 | |
CN107977678A (zh) | 用于输出信息的方法和装置 | |
CN108520007A (zh) | 万维网网页信息提取方法、存储介质及计算机设备 | |
CN112328857B (zh) | 一种产品知识聚合方法、装置、计算机设备及存储介质 | |
CN112000889A (zh) | 一种信息汇聚呈现系统 | |
CN113779381A (zh) | 资源推荐方法、装置、电子设备和存储介质 | |
CN106919703A (zh) | 电影信息搜索方法及装置 | |
CN105868345B (zh) | 一种信息确定方法及装置 | |
JP5048852B2 (ja) | 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体 | |
JP2014153977A (ja) | コンテンツ解析装置、コンテンツ解析方法、コンテンツ解析プログラム、およびコンテンツ再生システム | |
CN106776640A (zh) | 一种股票资讯信息展示方法和装置 | |
CN106776910A (zh) | 一种搜索结果的显示方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 100085 information Road No. 2, Haidian District, Beijing (Beijing 1-8, D 2-2), two storey 207A room. Applicant after: Kylin seing network technology Limited by Share Ltd Address before: 100085 information Road No. 2, Haidian District, Beijing (Beijing 1-8, D 2-2), two storey 207A room. Applicant before: BEIJING KYLIN HESHENG NETWORK TECHNOLOGY CO., LTD. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |