CN106021476A - 一种个人信息推送系统 - Google Patents

一种个人信息推送系统 Download PDF

Info

Publication number
CN106021476A
CN106021476A CN201610331230.5A CN201610331230A CN106021476A CN 106021476 A CN106021476 A CN 106021476A CN 201610331230 A CN201610331230 A CN 201610331230A CN 106021476 A CN106021476 A CN 106021476A
Authority
CN
China
Prior art keywords
module
information
user
time
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610331230.5A
Other languages
English (en)
Inventor
曾丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Jiushidu Industrial Product Design Co Ltd
Original Assignee
Chengdu Jiushidu Industrial Product Design Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Jiushidu Industrial Product Design Co Ltd filed Critical Chengdu Jiushidu Industrial Product Design Co Ltd
Priority to CN201610331230.5A priority Critical patent/CN106021476A/zh
Publication of CN106021476A publication Critical patent/CN106021476A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

本发明公开了一种个人信息推送系统,涉及信息技术领域。该系统包括:个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库。该系统提供了一种能针对个人兴趣推送信息的系统,具有准确性高、学习性强、针对性强等优点。

Description

一种个人信息推送系统
技术领域
本发明涉及物联网技术领域,特别涉及一种个人信息推送系统。
背景技术
互联网的出现人人加速了现代社会信息化的进程,已经和正在深刻地改变着人们的工作、生活的方式,互联网上丰富的资源也让每个人心动。然而,要在如此浩瀚的资源中找到自己所需的信息是一件费时费力的事情。当用户需要某方面的信息时,通常有两种方式:通过搜索引擎查询或逐个访问专业网站。
搜索引擎的出现和不断完善使得人们在互联网上搜索资源变得容易多了,对于一个搜索主题,可以在很短的时间内得到返回结果。像雅虎、谷歌这些著名的搜索引擎无疑是大多数用户的首选,因为它速度快,准确率高,并且将查找结果按相关程度排序。
但是通过现有的搜索引擎查询信息存在不少缺点:
1、针对性弱,不能就用户查询的信息提供更适合用户兴趣点的信息,导致用户还需要进行筛选信息。
2、时效性弱,网上的信息往往都已经发布很久,存在时间很久,而用户不能第一时间进行查阅,导致时效性较弱。
对一个企业或组织来说,无法通过统一途径对信息进行实时采集,仍然保持剪报、个体上网、信息罗列的低效方法,这种多部门重复收集信息的情况,更加剧了资源浪费和管理上的凌乱。而企业对这种搜集来的良莠不齐又杂乱无章的信息难以进行有效的管理和充分的利用。因此,用户期望出现一些能够协助其理解、检索所需信息的系统。一些信息服务机构也希望能够为它们的川户提供贴切的个性化服务,从而在激烈的竞争中击败对手。
由以上分析可知,无论是通过搜索引擎或逐个访问专业网站查询信息都存在同样的问题:现在绝大多数的网站都只能被动地接受访问。而现在的用户希望能够开发一个系统自动搜集用户定制的某方面的信息,并根据用户的兴趣对获得的信息进行筛选后分类并推荐给用户。为不同用户提供切合其需求的个性化服务是当前最迫切的任务。
发明内容
鉴于此,本发明提供了一种个人信息推送系统,该系统具有集成度高、引导性足、提供个性化服务、安全性高等优点。
本发明采用的技术方案如下:
一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由系统管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
w e i g h t ( A ) = a * 3 N + ( 1 - a ) * Σ P i ⇒ A w e i g h t ( p i ) s c a n f ( p i )
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
采用以上技术方案,本发明产生了以下有益效果:
1、数据处理效率高:系统从安卓手机应用的线程级别入手分析其计算与数据,把应用程序中部分运算量大的函数迁移到云端上执行,利用云端的强大性能来减轻手机端的计算压力,提高手机应用的运行效率。。
2、简洁易操作,无需修改源代码:本专利提出一种高效稳定的划分机制,通过一定的规则和算法自动灵活地划分安卓手机应用的执行模块并计算函数的运行时间,无需修改应用程序的源代码,就能自动地使正在运行的大计算量函数从手机端无缝地转移到云端运行。该系统能够极大地加快安卓手机应用的响应速度,提供更好的用户体验。
3、数据完整性:为了保证数据在传送过程中不会被篡改,手机端利用md5码对传送数据进行加密。服务端接收到数据以后,首先进行的是md5码检测校验,即将接收到的数据信息的md5码计算出来,然后与接收到的数据中的md5码进行对比,如果完全相同,则表示数据再传送过程中未被篡改,可以继续执行。否则就表示数据已经被篡改,转移失败。
附图说明
图1是本发明的一种个人信息推送系统的系统结构示意图。
具体实施方式
本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。
本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
本发明实施例1中提供了一种基于云计算的安卓手机应用加速系统,系统结构如图1所示:
一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
本发明实施例2中提供了一种个人信息推送系统的连接,系统结构如图1所示:
一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
本发明实施例3中提供了一种个人信息推送系统,系统结构如图1所示:
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由系统管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
w e i g h t ( A ) = a * 3 N + ( 1 - a ) * Σ P i ⇒ A w e i g h t ( p i ) s c a n f ( p i )
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
本发明实施例4中提供了一种个人信息推送系统,系统结构如图1所示:
一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
所述时间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块;
所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由系统管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
Wsite={(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,设定其初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
w e i g h t ( A ) = a * 3 N + ( 1 - a ) * Σ P i ⇒ A w e i g h t ( p i ) s c a n f ( p i )
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
本发明并不局限于前述的具体实施方式。本发明扩展到任何在本说明书中披露的新特征或任何新的组合,以及披露的任一新的方法或过程的步骤或任何新的组合。

Claims (7)

1.一种个人信息推送系统,其特征在于,所述系统包括:用户端、个人兴趣采集系统、信息推送系统和信息采集系统;所述用户端包括:数据接收模块、用户注册模块、用户搜索模块和用户自主修改模块;所述个人兴趣采集系统包括:用户属性静态分析模块、词频统计模块、时间分析模块、日志挖掘分析模块、分析模块和个人兴趣集;所述信息推送系统包括:信息检索模块、兴趣采集模块和信息发送模块;所述信息采集系统包括:信息采集模块、信息分类模块和数据库;
所述用户注册模块,用于在用户初次使用软件应用时,对用户的个人兴趣进行初次采集,将采集好的个人兴趣信息发送至用户属性静态分析模块;
所述数据接收模块,用于接收来自信息推送系统发送过来数据信息;
所述用户搜索模块,用于提供给用户自主搜索相关数据信息;
所述用户自主修改模块,用于用户自主修改自己的个人兴趣集数据信息;
所述用户属性静态分析模块,用于对用户注册模块初次采集的个人兴趣记性静态分析,将分析后的个人兴趣发送至个人兴趣集进行存储;
所述词频统计模块,用于对用户搜索模块的搜索关键词进行频率统计,将统计结果发送至分析模块;
所述时间分析模块,用于分析用户在用户搜索模块反馈回来的信息以及信息接收模块接收到的信息上的停留时间,将分析结果发送至分析模块;
所述日志挖掘分析模块,用于对用户的操作日志进行分析,将分析结果发送至分析模块;
所述分析模块,用于根据词频统计模块、时间分析模块和日志挖掘分析模块发送过来分析结果进行分析,得出新的个人兴趣结果,将新的个人兴趣结果发送至个人兴趣集;
所述个人兴趣集,用于存储个人兴趣信息;
所述兴趣采集模块,用于对个人兴趣集中的兴趣进行数据采集,将采集后的结果发送至信息检索模块;
所述信息检索模块,用于根据兴趣采集模块发送过来的采集结果,在数据库中检索相关信息,将信息发送至数据发送模块;
所述数据发送模块,用于将信息检索模块发送过来的数据信息,发送至数据接收模块;
所述信息采集模块,用于采集互联网中的相关数据信息,将这些信息发送至数据分类模块;
所述信息分类模块,用于将信息采集模块采集到的数据信息进行分类处理,将分类后的数据信息发送至数据库;
所述数据库,用于对分类后的数据信息进行分类存储。
2.如权利要求1所述的个人信息推送系统,其特征在于,所述词频统计模块的统计方法包括以下步骤;
步骤1:在搜索模块设置词频触发器,用户每次进行搜索操作的时候,词频触发器启动发送信号至词频统计模块;
步骤2:对用户进行搜索的关键词进行拆分处理;
步骤2:词频统计模块对该次搜索行为的搜索关键词进行记录,存储在本地缓存中;
步骤3:设定一个统计阈值:D;若词频统计模块统计到的某个搜索关键词高于该阈值,则发送该关键词至分析模块。
3.如权利要求1所述的个人信息推送系统,其特征在于,所述时 间分析模块的时间分析方法包括以下步骤:
步骤1:在用户搜索模块和数据接收模块设置时间触发器,当用户每次查阅用户搜索模块反馈回来和数据接收模块接收到的数据信息时,时间触发器启动发送信号至时间分析模块;
步骤2:时间分析模块中设定一个时间阈值:T;
步骤3:时间分析模块记录用户点击进入该页面到最后离开该页面,停留在该数据信息页面的时间,将该时间和时间阈值T进行比较,若该时间大于时间阈值,则发送页面信息至时间分析模块。
4.如权利要求1所述的个人信息推送系统,其特征在于,所述日志挖掘分析模块的日志挖掘分析方法包括以下步骤:
步骤1:在用户搜索模块设置日志触发器,当用于每次对用户搜索模块反馈回来的数据信息进行复制、截图操作时,触发器启动,将该数据信息至日志挖掘分析模块;
步骤2:用户挖掘分析模块对这些操作进行记录,记载在本地缓存中,生成操作日志;
步骤3:设定一个时间周期:H,设定一个日志阈值:I;
步骤4:用户挖掘分析模块每隔该时间周期,对本地缓存中的操作日志进行统计分析;若针对某个网站的数据信息进行的操作高于时间阈值I,则发送该网站和域名信息至分析模块。
5.如权利要求1所述的个人信息推送系统,其特征在于,所述分析模块的分析方法包括以下步骤:
步骤1:接收来自词频统计模块、时间分析模块和日志挖掘分析模块发送过来的信息;
步骤2:提取时间分析模块发送过来的页面信息中的关键词,将词频统计模块发送过来的关键词信息和提取自时间分析模块中的关 键词进行比对,筛选出比对一致的关键词;
步骤3:获取筛选出一致的关键词信息的源网站信息;将网站信息和日志挖掘分析模块发送过来的网站信息进行比对,筛选出一致的网站信息;
步骤4:将筛选出的网站信息发送至个人兴趣集。
6.如权利要求1所述的个人信息推送系统,其特征在于,所述信息采集模块的信息采集方法包括以下步骤:
步骤1:由系统管理员选定多个网站作为网站集:
步骤2:设定站点的权重最大值为100,最小值为0,再设定两个权重阈值:C=70,B=40;然后对每个站点设定权重值;
步骤3:信息检索模块根据每个站点的权重值,采用蜘蛛程序进行不同深度和广度的信息采集;权重值高于70的站点,采集深度和广度为高级;权重值介于40到70之间的站点,采集深度和广度为中级;权重值低于40的站点,采集深度和广度为低级。
7.如权利要求6所述的个人信息推送系统,其特征在于,所述信息采集模块的蜘蛛程序采集后,对信息的排序方法包括以下步骤:
步骤1:取检索系统中的数据结构为G,G的规模为N,设定网站集合为:
Wsite=
{(site1,web1),(site2,web2),(site3,web3),…(siten,webn)},其中1≤i≤n,Wsite中的每一个元素为一个网站站点;每个网站站点为G中的一个结点。
步骤2:对于G中的每一个节点n,设W(n)是权重值,而向量为G对应的W(n)结果向量。
步骤:3:设定即:对G中每一个节点n,
设定其
初始值W(n0)均为
步骤4:当k=1,2,3……n;对G中的每一个节点,均有:
步骤5:其中,a为预先设定的参数,scanf(pi)为页面的出度值;
步骤6:按照出度值对每个采集到的信息进行排序。
CN201610331230.5A 2016-05-18 2016-05-18 一种个人信息推送系统 Pending CN106021476A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610331230.5A CN106021476A (zh) 2016-05-18 2016-05-18 一种个人信息推送系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610331230.5A CN106021476A (zh) 2016-05-18 2016-05-18 一种个人信息推送系统

Publications (1)

Publication Number Publication Date
CN106021476A true CN106021476A (zh) 2016-10-12

Family

ID=57097866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610331230.5A Pending CN106021476A (zh) 2016-05-18 2016-05-18 一种个人信息推送系统

Country Status (1)

Country Link
CN (1) CN106021476A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108763330A (zh) * 2018-05-09 2018-11-06 张耀伦 一种信息资源的导航推荐系统及方法
WO2019000133A1 (zh) * 2017-06-28 2019-01-03 深圳市秀趣品牌文化传播有限公司 电商数据处理方法
CN109145634A (zh) * 2018-07-13 2019-01-04 安徽信尔联信息科技有限公司 一种客户信息自动采集系统
CN111460308A (zh) * 2020-04-07 2020-07-28 贵阳块数据城市建设有限公司 一种基于互联网的app推送系统
CN114159828A (zh) * 2021-11-30 2022-03-11 高小红 一种超临界二氧化碳温控系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070201376A1 (en) * 2006-02-27 2007-08-30 Marshall-Wilson Maria I Apparatus and methods for group communications
CN104135498A (zh) * 2013-05-03 2014-11-05 杭州诺霖信息科技有限公司 一种跨平台的信息推送系统及其推送方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070201376A1 (en) * 2006-02-27 2007-08-30 Marshall-Wilson Maria I Apparatus and methods for group communications
CN104135498A (zh) * 2013-05-03 2014-11-05 杭州诺霖信息科技有限公司 一种跨平台的信息推送系统及其推送方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019000133A1 (zh) * 2017-06-28 2019-01-03 深圳市秀趣品牌文化传播有限公司 电商数据处理方法
CN108763330A (zh) * 2018-05-09 2018-11-06 张耀伦 一种信息资源的导航推荐系统及方法
CN109145634A (zh) * 2018-07-13 2019-01-04 安徽信尔联信息科技有限公司 一种客户信息自动采集系统
CN111460308A (zh) * 2020-04-07 2020-07-28 贵阳块数据城市建设有限公司 一种基于互联网的app推送系统
CN114159828A (zh) * 2021-11-30 2022-03-11 高小红 一种超临界二氧化碳温控系统

Similar Documents

Publication Publication Date Title
CN106021476A (zh) 一种个人信息推送系统
CN107800591B (zh) 一种统一日志数据的分析方法
CN102915335B (zh) 基于用户操作记录和资源内容的信息关联方法
CN104951465B (zh) 应用推荐方法及装置
CN104899324B (zh) 一种基于idc有害信息监测系统的样本训练系统
CN106210150A (zh) 一种基于行为分析的内容推送系统及方法
CN102831193A (zh) 基于分布式多级聚类的话题检测装置及方法
CN104008203A (zh) 一种融入本体情境的用户兴趣挖掘方法
CN103077254B (zh) 网页获取方法和装置
CN104050235A (zh) 基于集合选择的分布式信息检索方法
JP2009048380A5 (zh)
CN105530265A (zh) 一种基于频繁项集描述的移动互联网恶意应用检测方法
CN103425650A (zh) 推荐搜索方法和系统
CN104281619A (zh) 搜索结果排序系统及方法
CN105824880A (zh) 一种网页抓取方法及装置
CN106557483B (zh) 一种数据处理、数据查询方法及设备
CN111159135A (zh) 数据处理方法、装置、电子设备及存储介质
CN109635022B (zh) 一种可视化的ElasticSearch数据采集方法及装置
Kumar et al. Learnable focused meta crawling through Web
CN102737125A (zh) 基于Web时态对象模型的过时网页信息自动发现方法
CN112084095B (zh) 基于区块链的能源网联监控方法、系统及存储介质
CN103248513A (zh) 基于Office办公套件的网络信息数据采集方法及系统
CN105426407A (zh) 一种基于内容分析的web数据采集方法
CN107679240B (zh) 一种虚拟身份挖掘方法
Abdullah et al. A sequential data preprocessing tool for data mining

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20161012

RJ01 Rejection of invention patent application after publication