CN104298703A - 一种根据用户行为提炼关键字并智能分发的方法 - Google Patents
一种根据用户行为提炼关键字并智能分发的方法 Download PDFInfo
- Publication number
- CN104298703A CN104298703A CN201410356356.9A CN201410356356A CN104298703A CN 104298703 A CN104298703 A CN 104298703A CN 201410356356 A CN201410356356 A CN 201410356356A CN 104298703 A CN104298703 A CN 104298703A
- Authority
- CN
- China
- Prior art keywords
- information
- user
- key word
- minutes
- server
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明的公开了一种根据用户行为提炼关键字并实现资讯智能分发的方法,服务器会为每个用户建立个人数据库,还有每30分钟关键字评分表,用户每看一条资讯,服务器都会分析该资讯包含哪些关键字,并在历史数据关键字评分表中对这些关键字进行加分,等用户下次请求资讯时,服务器会先分析用户近30分钟的浏览记录,若30分钟内,浏览记录多于10条,则根据30分钟内,浏览记录最多的关键字,下发资讯,若否,服务器会优先下发历史数据关键字评分表中分数较高的关键字对应的资讯,上述方法即可实现按用户所需和兴趣爱好推荐服务的功能。
Description
技术领域:
本发明涉及智能手机阅读软件的资讯智能分发技术领域,特别地涉及一种互联网应用软件的资讯智能分发的技术方法。
背景技术:
随着互联网技术的发展,每天在我们的生活中出现了大量的信息,新闻信息飞速增加、广告信息铺天盖地、科技信息飞速递增。很多时候,用户并不想、也无法接受那么多的信息量,更加无法有效找到自身感兴趣的内容。目前,市面上的资讯聚合类软件,大多都只是通过设置频道、或者让用户选择标签的方式,来区分用户群体,未能实现每个用户差异化、智能化分发。
根据用户行为提炼关键字并智能分发资讯,解决了用户无法有效找到喜爱内容的问题,在算法逻辑上尚属首创。针对活跃用户,效果尤其明显。
实现资讯智能分发,通过分析用户所有的浏览记录,以及近30分钟的浏览记录,提炼出用户最喜欢的关键字是哪些,并储存在用户的个人数据库中。以后,用户请求资讯,服务器会根据该用户个人数据库中的关键字信息,自动匹配用户喜欢的资讯内容,分发给用户。
发明内容:
本发明的主要内容是提供一种根据用户行为提炼关键字并实现资讯智能分发的方法,以解决现有的资讯类软件,无法识别用户兴趣和行为的不同,按用户所需和兴趣爱好推荐服务的功能;
为解决上述问题,提供如下解决方案:
一、 服务器建立一个关键字库,包含大量网络上、日常生活会碰到的关键字;
二、 服务器会为每个用户建立个人数据库,包含两个关键字评分表——历史数据关键字评分表,以及30分钟关键字评分表。用户每看一条资讯,服务器都会分析该资讯包含哪些关键字,并在历史数据关键字评分表中对这些关键字进行加分,等用户下次请求资讯时,服务器会先分析用户近30分钟的浏览记录,若30分钟内,浏览记录多于10条,则根据30分钟内,浏览记录最多的关键字,下发资讯,若否,服务器会优先下发历史数据关键字评分表中分数较高的关键字对应的资讯。
附图说明:
图1:用户历史数据关键字评分表
图2:用户30分钟关键字评分表
具体实施方式:
1、资讯软件发布的每一条资讯,在后台已通过文本数据挖掘的方法,分析出了关键字是哪些。当用户查看了某一条资讯,我们默认为用户喜欢这条资讯,于是,我们对这些关键字进行加分,对其余关键字进行减分,最终保证总分为零。
设现在共有关键词N个,总分为M,设每个关键词对应的分数为,最初状态,每个关键词对应的分数为0,即,则总分。
当用户查看一条资讯,不妨设这条资讯有k个关键词,对应分数为。
当用户看完这条资讯后,服务器对该用户的这k个关键词进行加分,即,,,……,,对剩下的个关键词进行减分,每个关键字减分一样多,同时要保证总分M恒等于0,即,,……,,
最终,总分
如果用户再看另一条资讯,同样的,那条资讯对应的关键词各加1分,其余关键字分摊减分,保证总分为零。
2、 每个用户都有两个关键字评分表(如图1、图2),一个是历史数据的关键字评分表,另一个是近30分钟的关键字评分表。
3、 服务器每隔一分钟,会分析每个用户近30分钟的浏览记录,如果某用户30分钟内浏览记录少于10条,不进行分析,如果该用户30分钟内浏览记录多于或等于10条,对该用户的这些记录进行分析:假设用户30分钟内看了条资讯,包含了n(n>0)个关键字,它们对应的分数为,每个关键字出现的次数分别是,则服务器会对这n个关键字加分,即各个关键字的新分数,,。
4、 这个30分钟内的关键字分数表,每分钟计算一次。当某个用户请求资讯时,服务器会优先判断该用户30分钟内哪个关键字分数最高,如果用户30分钟内没有阅读过资讯,则30分钟关键字评分表中各关键字分数为零,直接跳到第七步;否则,若30分钟内关键字评分表中,有至少1个关键字分数大于零,则服务器会判断该用户哪个关键字分数最高,假设该用户30分钟评分表中得分最高的关键字是A(如果有两个或多个关键字同分,随机取其中一个),则服务器从资讯池中寻找包含关键字A的资讯,由于用户每次请求资讯,服务器都是返回十条数据(资讯),故服务器还需分析出剩下的9条资讯应该选择哪些内容,方法是服务器继续分析用户近30分钟关键字评分表,找到排除关键字A后,30分钟内得分最高的关键字B(如果有两个或多个关键字同分,随机取其中一个),并从资讯池中寻找包含关键字B的资讯,还需分析出剩下8条资讯怎么选择,再找到排除A、B关键字后,得分最高的关键字C,并从资讯池中寻找包含关键字C的资讯,……,如此反复,直到服务器找到了7条资讯,之后,服务器从资讯池中随机抽取3条资讯(无需分析关键字),组装成10条资讯,一并分发给用户;
5、 假设用户30分钟内,没有浏览资讯,30分钟关键字分数表中,各关键字分数都为零。此时,服务器会根据用户历史数据关键字评分表来分发资讯,具体方法是:假设该用户历史数据评分表中,分数最高的关键字是A(如果有两个或多个关键字同分,随机取其中一个),则服务器从资讯池中寻找包含关键字A的资讯,由于用户每次请求资讯,服务器都是返回10条数据(资讯),故服务器还需分析出剩下的9条资讯应该选择哪些内容,方法是服务器继续分析用户历史数据关键字评分表,找到排除关键字A后,历史数据关键字评分表中得分最高的关键字B(如果有两个或多个关键字同分,随机取其中一个),并从资讯池中寻找包含关键字B的资讯,还需分析剩下8条资讯怎么选择,再找到排除A、B关键字后,得分最高的关键字C,并从资讯池中寻找包含关键字C的资讯,……,如此反复,直到服务器找到了7条资讯,之后,服务器从资讯池中随机抽取3条资讯,组装成10条资讯,一并分发给用户。
Claims (8)
1.一种提炼关键字,并实现资讯智能分发的方法,其特征在于,所述方法包括:
对每个用户建立个人数据库,包括两个关键字评分表——用户历史数据关键字评分表,以及用户30分钟关键字评分表,对每个关键字赋值(每个关键字初值为零),并在用户查看资讯后,进行加分、减分操作,然后再通过分值高低,实现资讯的智能分发。
2.根据权利要求1所述的方法,其特征在于,还包括:
在用户历史数据关键字评分表中,每个关键字有对应的分数,初始值均为零,用户看了某条资讯,该资讯会包含一个(或几个)关键字,这些关键字的分值会加一分,其余关键字需要减去同样的分数,且最终要保证所有关键字的分数之和仍然等于零。
3.根据权利要求1所述的方法,其特征在于,还包括:
在用户30分钟关键字评分表中,每个关键字有对应的分数,初始值均为零,服务器每分钟分析一次用户近30分钟查看了哪些资讯,从而分析出这些资讯出现了哪些关键字(有些关键字会出现多次),对这些关键字进行相应的加分(某个关键字出现几次就加几分)。
4.根据权利要求1所述的方法,其特征在于,还包括:
当用户近30分钟有浏览资讯的记录时,服务器优先根据用户近30分钟的行为智能分发资讯,当用户近30分钟没有浏览资讯时,服务器会根据用户历史行为智能分发资讯。
5.根据权利要求4的方法,其特征在于,还包括:
若用户近30分钟没有浏览资讯,服务器会根据用户历史行为智能分发资讯,具体方法为,利用前述方法,确定用户浏览最多的关键字,优先分发包含该关键字的资讯,再确定用户浏览第二多的关键字,继续分发包含该关键字的资讯,再确定用户浏览第三多的关键字,分发包含该关键字的资讯,如此反复,直到凑齐7条资讯,剩下的3条资讯从资讯池中随机获取。
6.根据权利要求4的方法,其特征在于,还包括:
若用户近30分钟有浏览资讯,服务器会根据用户近30分钟的行为智能分发资讯,具体方法为,利用前述方法,确定用户近30分钟浏览最多的关键字,优先分发包含该关键字的资讯,再确定用户浏览第二多的关键字,继续分发包含该关键字的资讯,再确定用户浏览第三多的关键字,分发包含该关键字的资讯,如此反复,直到凑齐7条资讯(若出现30分钟内,用户浏览过的关键字数量太少,则余下的资讯从资讯池中随机选择),剩下的3条资讯从资讯池中随机获取。
7.根据权利要求4的方法,其特征在于,还包括:
只要用户有不一样的浏览记录,根据算法规则,每个用户拉取到的资讯是不一样的,一是因为各个用户关键字评分不一样,二是哪怕关键字评分一样,资讯也是从资讯池中选择,而资讯池可用资讯很多,只能随机选取其中的一个(或几个),所以各用户拉取到的资讯会有一定不同。
8.根据权利要求1的方法,其特征在于,还包括:
随着某个用户使用时间的增长,浏览记录的增多,关键字评分表会越来越符合用户的真实喜好,通俗来说,就是“越看越精准”,比如用户喜欢体育,是梅西的球迷,那么他平时会更多地关注足球,梅西这一类的新闻,等时间久了,“梅西”这个关键字的评分会慢慢变高,于是该用户看到的资讯里面,包含“梅西”这个关键字的资讯也会越来越多。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410356356.9A CN104298703A (zh) | 2014-07-25 | 2014-07-25 | 一种根据用户行为提炼关键字并智能分发的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410356356.9A CN104298703A (zh) | 2014-07-25 | 2014-07-25 | 一种根据用户行为提炼关键字并智能分发的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104298703A true CN104298703A (zh) | 2015-01-21 |
Family
ID=52318430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410356356.9A Pending CN104298703A (zh) | 2014-07-25 | 2014-07-25 | 一种根据用户行为提炼关键字并智能分发的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104298703A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118560A (zh) * | 2006-08-03 | 2008-02-06 | 株式会社东芝 | 关键词输出设备和关键词输出方法 |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
CN103729351A (zh) * | 2012-10-10 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 查询词推荐方法及装置 |
-
2014
- 2014-07-25 CN CN201410356356.9A patent/CN104298703A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101118560A (zh) * | 2006-08-03 | 2008-02-06 | 株式会社东芝 | 关键词输出设备和关键词输出方法 |
US20080294624A1 (en) * | 2007-05-25 | 2008-11-27 | Ontogenix, Inc. | Recommendation systems and methods using interest correlation |
CN103729351A (zh) * | 2012-10-10 | 2014-04-16 | 阿里巴巴集团控股有限公司 | 查询词推荐方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Abisheva et al. | Who watches (and shares) what on youtube? and when? using twitter to understand youtube viewership | |
US10356462B1 (en) | Recommending a composite channel | |
CN105430504B (zh) | 基于电视观看日志挖掘的家庭成员结构识别方法与系统 | |
CA3076113C (en) | Methods and systems for creating a data-driven attribution model for assigning attribution credit to a plurality of events | |
CN102033929A (zh) | 热点视频集的展现方法及装置 | |
CN104394118A (zh) | 一种用户身份识别方法及系统 | |
US20160034592A1 (en) | Personal trends module | |
US9378517B2 (en) | Methods and systems for providing potential search queries that may be targeted by one or more keywords | |
CN101685521A (zh) | 在网页中展现广告的方法及系统 | |
CN102999588A (zh) | 一种多媒体应用的推荐方法和系统 | |
CN102917269A (zh) | 一种电视节目推荐系统及方法 | |
CN103106285A (zh) | 一种基于信息安全专业社交网络平台的推荐算法 | |
CN105095219A (zh) | 微博推荐方法和终端 | |
CN103106208A (zh) | 一种移动互联网中的流媒体内容推荐方法和系统 | |
WO2014043849A1 (en) | Method and system for facilitating users to obtain content | |
CN108337541A (zh) | 一种广告投放方法和装置、计算机可读存储介质 | |
CN105005582A (zh) | 多媒体信息的推荐方法及装置 | |
CN109429103A (zh) | 推荐信息的方法、装置及计算机可读存储介质、终端设备 | |
CN105373633A (zh) | 位置感知订阅/发布系统的top-k订阅查询匹配方法 | |
CN107562848A (zh) | 一种视频推荐方法和装置 | |
Jansen et al. | Viewed by too many or viewed too little: Using information dissemination for audience segmentation | |
CN105205046A (zh) | 一种基于语义分析的在线用户推荐系统及方法 | |
US20160189237A1 (en) | Web page viewership prediction | |
US20140101064A1 (en) | Systems and Methods for Automated Reprogramming of Displayed Content | |
WO2015187485A1 (en) | Systems and methods of generating notifications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 518000 Guangdong city of Shenzhen province Nanshan District South Road four No. 18 SKYWORTH semiconductor design building no.5003 6 floor unit 605-610 Applicant after: Ying Weinuo Science and Technology Ltd. of Shenzhen Address before: 518000 Guangdong city of Shenzhen Province South four Road No. 18 building 6 floor 605-610 SKYWORTH semiconductor design Applicant before: Ying Weinuo Science and Technology Ltd. of Shenzhen |
|
CB02 | Change of applicant information | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20150121 |
|
RJ01 | Rejection of invention patent application after publication |