CN112433993B - 一种基于计算机的网络数据处理分析系统 - Google Patents

一种基于计算机的网络数据处理分析系统 Download PDF

Info

Publication number
CN112433993B
CN112433993B CN202011278618.6A CN202011278618A CN112433993B CN 112433993 B CN112433993 B CN 112433993B CN 202011278618 A CN202011278618 A CN 202011278618A CN 112433993 B CN112433993 B CN 112433993B
Authority
CN
China
Prior art keywords
data
network data
unit
user
viewing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011278618.6A
Other languages
English (en)
Other versions
CN112433993A (zh
Inventor
王建华
赵莉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lianbang Network Technology Service Nantong Co Ltd
Original Assignee
Lianbang Network Technology Service Nantong Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lianbang Network Technology Service Nantong Co Ltd filed Critical Lianbang Network Technology Service Nantong Co Ltd
Priority to CN202011278618.6A priority Critical patent/CN112433993B/zh
Publication of CN112433993A publication Critical patent/CN112433993A/zh
Application granted granted Critical
Publication of CN112433993B publication Critical patent/CN112433993B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • G06F16/986Document structures and storage, e.g. HTML extensions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明公开了一种基于计算机的网络数据处理分析系统,涉及计算机技术领域,该系统包括数据预处理模块、中央控制模块、查看处理模块和删除分析模块;所述数据预处理模块用于对网络数据进行缓存和存储,所述查看处理模块用于对用户查看缓存的网络数据的情况进行处理和分析,确定用户对于网络数据的查看需求,所述删除分析模块用于根据查看处理模块的查看结果对缓存的网络数据进行分析和部分删除;本发明对用户点击查看的缓存数据进行分析,确定每一个缓存数据被查看的频率,利用系统对低频点击查看的缓存数据进行删除,不需要用户主动进行缓存数据的清理,利用数据分析,确定要被自动清理的数据类型,避免了重要数据被清理影响用户的使用体验。

Description

一种基于计算机的网络数据处理分析系统
技术领域
本发明涉及计算机技术领域,具体是一种基于计算机的网络数据处理分析系统。
背景技术
随着社会的不断进步和科技的不断发展,使用和购买电脑的人群也在不断的增加,计算机的使用给人们带来了极大的便利,网络购物、资料查询、娱乐休闲等应有尽有,使得人们的生活不再那么的枯燥乏味,人们在使用计算机的过程中,为了方便下次继续对相同的网络数据进行查看,一般会对网络数据进行缓存,并存储在数据库中,随着缓存的网络数据不断的增加,会使得数据库的空间使用率较高,影响后续的网络数据缓存和使用,所以,需要不定期的对数据库中存储的部分网络数据进行删除,但是,现有技术中,这种删除方式都是由用户手动对缓存的网络数据进行选择和删除,或者由系统弹窗询问用户是否对数据库中的所有数据都进行统一的删除,第一种删除方式会给用户增加一定的负担,影响用户的使用体验,第二种删除方式会导致将有用的数据删除,影响后续的使用,所以,人们急需一种基于计算机的网络数据处理分析系统来解决上述问题。
发明内容
本发明的目的在于提供一种基于计算机的网络数据处理分析系统,以解决现有技术中提出的的问题。
为实现上述目的,本发明提供如下技术方案:
与现有技术相比,本发明的有益效果是:一种基于计算机的网络数据处理分析系统,该网络数据处理分析系统包括数据预处理模块、中央控制模块、查看处理模块和删除分析模块;
所述数据预处理模块用于对网络数据进行缓存和存储,所述中央控制模块用于对整个系统的数据进行智能化控制,所述查看处理模块用于对用户查看缓存的网络数据的情况进行处理和分析,确定用户对于网络数据的查看需求,所述删除分析模块用于根据查看处理模块的查看结果对缓存的网络数据进行分析和部分删除;
所述数据预处理模块的输出端电性连接中央控制模块和查看处理模块的输入端,所述查看处理模块的输出端电性连接中央控制模块的输入端,所述中央控制模块的输出端电性连接删除分析模块的输入端。
根据上述技术方案,所述数据预处理模块包括数据缓存单元、存储数据库和标签添加单元;
所述数据缓存单元用于用户对网络数据进行下载和缓存;所述存储数据库用于对计算机缓存的网络数据进行存储;所述标签添加单元用于对每次缓存的数据进行标签的添加,所述标签添加单元所添加的标签为(Xk,Yk,Zk),其中,Xk表示类型,Yk表示下载时的时间点,Zk表示占用的存储空间;
所述数据缓存单元和标签添加单元的输出端电性连接存储数据库的输入端,所述存储数据库的输出端电性连接中央控制模块和查看处理模块的输入端。
通过上述技术方案,为数据缓存单元所下载的每一份数据添加标签,一方面,可以记录网络数据下载的时间点,方便后期根据下载的时间点和查看的次数确认该网络数据被用户点击查看的频率,以此来确认该数据是否属于常用数据,是否需要被自动清楚,另一方面,通过标签添加该网络数据占用的存储空间,在进行网络数据的处理时,可以将占用的存储空间作为考虑的因素,可以最大程度的减少删除的网络数据的同时,解放了更多的存储空间。
根据上述技术方案,所述中央控制模块还包括数据标记单元,所述数据标记单元用于对Zk>Z的网络数据进行标记,其中,Z表示设定的网络数据所占用存储空间大小的阈值,目的是为了在后期进行网络数据的自动删除时,首先将点击查看频率低且占用存储空间大的网络数据删除,解除更多的存储空间。
根据上述技术方案,所述存储数据库中存储的每一条网络数据所占用的存储空间Zk组成了网络数据存储空间的占用集合Z={Z1,Z2,Z3,…Zn},其中,Z1,Z2,Z3,…Zn表示存储数据库中的每一条网络数据所占用的存储空间大小,根据下列公式对设定的网络数据所占用存储空间大小的阈值Z进行计算:
Figure BDA0002779974210000031
阈值Z表示对Z中的所有数据计算平均值后取整加1,通过上述计算公式,一方面,使得阈值Z的设定随着数据的变化而变化,确保了阈值Z的适用能力,另一方面,对所有存储数据取平均值后取整加1,确保了阈值Z偏向于数据中更大的值,使得可以更加方便数据标记单元对存储空间较大的网络数据进行标记;
当Zk>Z时,所述数据标记单元对该网络数据进行标记,以便于后期对网络数据进行自动删除时,可以根据网络数据被查看的频率,优先考虑自动删除占用空间较大的网络数据,使得可以实现对存储空间的最大程度解除;
当Zk≤Z时,所述数据标记单元不对该网络数据进行标记,因为对该网络数据进行标记之后,即使该网络数据被查看的频率较低,自动删除该网络数据也不会释放太多的空间,还有可能导致用户的重要数据丢失。
根据上述技术方案,所述查看处理模块包括数据查看单元、查看记录单元和数据分析单元;
所述数据查看单元用于用户对存储数据库中储存的网络数据进行查看,所述查看记录单元用于对用户点击查看存储数据库中缓存的网络数据的情况进行记录,所述数据分析单元用于对存储数据库中缓存的网络数据进行分析,确认每一条缓存的网络数据对用户的重要程度;
所述存储数据库的输出端电性连接数据查看单元和查看记录单元的输入端,所述数据查看单元的输出端电性连接查看记录单元的输入端,所述查看记录单元的输出端电性连接数据分析单元的输入端,所述数据分析单元的输出端电性连接中央控制模块的输入端。
通过上述技术方案,使得可以对用户每一次点击查看网络数据的情况进行记录,同时,可以分析出被用户点击查看频率较高的网络数据,那么,该数据将不会被自动删除,因为若该数据被系统自动处理并删除,将会影响用户对该数据的使用,影响用户的使用体验。
根据上述技术方案,所述查看记录单元对用户每次查看网络数据的时间点进行记录,组成每一条网络数据被用户查看的时间点的集合Tk={t0,t1,t2,t3,…,tm},其中,k表示存储数据库中的第k条数据,t0表示第k条数据被缓存时的时间点,即t0=Yk,t1,t2,t3,…,tm表示第k条数据每次被查看的时间点,根据下列公式对网络数据的查看频率进行计算:
Figure BDA0002779974210000051
其中,Qk表示第k条网络数据被用户查看的频率;
所述数据分析单元将被用户查看过的网络数据组成被用户查看频率的集合Q={Q1,Q2,Q3,…,Qp},其中,Q1,Q2,Q3,…,Qp表示每一条网络数据被用户点击查看的频率,p≤n,根据下列公式,计算出n条网络数据被用户点击查看的频率的平均值:
Figure BDA0002779974210000052
其中,
Figure BDA0002779974210000061
表示n条网络数据被用户点击查看的频率的平均值,Qi表示集合Q中的第i条网络数据,利用取整函数对n条网络数据被用户点击查看的频率的平均值进行取整,使得可以保留更多的被用户点击查看过的网络数据,使得对于网络数据的自动删除更加的慎重;
Figure BDA0002779974210000062
时,该条数据不会被系统自动删除;
Figure BDA0002779974210000063
时,该条数据会被中央控制模块列入自动删除的列表。
根据上述技术方案,所述删除分析模块包括排序分类单元、弹窗询问单元、手动删除单元、询问记录单元和自动删除单元;
所述排序分类单元用于根据网络数据被用户点击查看的频率对网络数据进行排序,所述弹窗询问单元用于询问客户是否对某一类别的缓存数据进行统一删除,所述手动删除单元用于客户根据弹窗询问的内容对某一类别的缓存数据进行手动删除,所述询问记录单元用于对弹窗询问单元的弹窗询问结果进行记录,根据标签分析用户对缓存数据删除的想法,所述自动删除单元用于根据数据分析单元的分析结果,接收中央控制单元的指令,对存储数据库中缓存的特定数据进行自动删除;
所述中央控制模块的输出端电性连接弹窗询问单元和排序分类单元的输入端,所述弹窗询问单元的输出端电性连接手动删除单元和询问记录单元的输入端,所述排序分类单元和询问记录单元的输出端电性连接自动删除单元的输入端。
通过上述技术方案,首先利用弹窗询问单元询问用户是否对点击查看频率较低的网络数据进行删除,并将询问结果发送至询问记录单元,利用询问记录单元对用户的选择结果进行记录,实现机器学习的过程,对用户的想法进行判断,然后利用排序分类单元根据网络数据被用户点击查看的频率进行排序,对点击查看频率较低的网络数据进行自动删除。
根据上述技术方案,所述排序分类单元根据下列公式对集合Q={Q1,Q2,Q3,…,Qp}中的网络数据进行排序:
W=Qi-Qi-k,k<i,i=2、…、p,k=1、2、…、p-1;
当W=0时,将Qi和Qi-k绑定在一起进行排序;
当W>0时,表明Qi>Qi-k,将Qi排在Qi-k之前;
当W<0时,表明Qi<Qi-k,将Qi排在Qi-k之后;
完成对集合Q={Q1,Q2,Q3,…,Qp}中的p条网络数据的排序。
根据上述技术方案,所述弹窗询问单元询问用户是否对点击查看频率
Figure BDA0002779974210000071
的网络数据进行手动删除,并将询问的结果传输至询问记录单元,所述询问记录单元对询问的结果进行记录;
所述自动删除单元对排序分类单元排序之后的从未被用户点击查看过的网络数据进行自动删除。
通过上述技术方案,使得本系统可以自动对用户缓存的部分网络数据进行自动删除,而这一部分网络数据也是从未被用户点击查看过的,使得可以减少存储空间被无故占用,减轻了计算机的存储压力。
根据上述技术方案,所述询问记录单元对用户选择手动删除的网络数据进行记录,组成被用户选择手动删除的网络数据的频率集合P={Q1,Q2,Q3,…,Qh},其中,h<p,根据下列公式计算出集合P={Q1,Q2,Q3,…,Qh}中的最大值:
Figure BDA0002779974210000081
i=1、2、3、…h-1,k=1、2、3、…h-1;
其中,
Figure BDA0002779974210000082
表示Qi+1与Qi之间的差值;
Figure BDA0002779974210000083
时,提取Qi+1进入下一轮的计算;
Figure BDA0002779974210000084
时,提取Qi进入下一轮的计算;
得到Qmax,Qmax为集合P={Q1,Q2,Q3,…,Qh}中的最大值;
所述排序分类单元的排序结果中有Qi<Qmax时,将其作为被自动删除的备选项,所述自动删除单元从备选项中挑选被数据标记单元所标记的网络数据进行自动删除。
通过上述技术方案,使得可以对占用较大存储空间以及被用户点击频率较低的网络数据进行删除,使得解除存储数据库的存储压力,实现网络数据缓存的洁净程度,使得计算机的使用更加的顺畅。
1、本发明对用户点击查看的缓存数据进行分析,确定每一个缓存数据被查看的频率,利用系统对低频点击查看的缓存数据进行删除,不需要用户主动进行缓存数据的清理,使得缓存数据的清理更加的智能化,利用数据分析,确定要被自动清理的数据类型,避免了重要数据被清理影响用户的使用体验。
2、本发明通过添加标签,确定每一个缓存数据的大小,将缓存数据的大小作为自动删除的一个依据,使得系统在对缓存的数据进行自动删除时,可以充分考虑缓存数据所占用的存储空间,使得可以最大程度的减小自动删除的缓存数据的数量,同时,解除存储数据库的存储空间。
附图说明
图1为本发明一种基于计算机的网络数据处理分析系统模块组成的结构示意图;
图2为本发明一种基于计算机的网络数据处理分析系统模块连接的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1~2所示,本发明提供以下技术方案,一种基于计算机的网络数据处理分析系统,该网络数据处理分析系统包括数据预处理模块、中央控制模块、查看处理模块和删除分析模块;
所述数据预处理模块用于对网络数据进行缓存和存储,所述中央控制模块用于对整个系统的数据进行智能化控制,所述查看处理模块用于对用户查看缓存的网络数据的情况进行处理和分析,确定用户对于网络数据的查看需求,所述删除分析模块用于根据查看处理模块的查看结果对缓存的网络数据进行分析和部分删除;
所述数据预处理模块的输出端电性连接中央控制模块和查看处理模块的输入端,所述查看处理模块的输出端电性连接中央控制模块的输入端,所述中央控制模块的输出端电性连接删除分析模块的输入端。
所述数据预处理模块包括数据缓存单元、存储数据库和标签添加单元;
所述数据缓存单元用于用户对网络数据进行下载和缓存;所述存储数据库用于对计算机缓存的网络数据进行存储;所述标签添加单元用于对每次缓存的数据进行标签的添加,所述标签添加单元所添加的标签为(Xk,Yk,Zk),其中,Xk表示类型,Yk表示下载时的时间点,Zk表示占用的存储空间;
所述数据缓存单元和标签添加单元的输出端电性连接存储数据库的输入端,所述存储数据库的输出端电性连接中央控制模块和查看处理模块的输入端。
通过上述技术方案,为数据缓存单元所下载的每一份数据添加标签,一方面,可以记录网络数据下载的时间点,方便后期根据下载的时间点和查看的次数确认该网络数据被用户点击查看的频率,以此来确认该数据是否属于常用数据,是否需要被自动清楚,另一方面,通过标签添加该网络数据占用的存储空间,在进行网络数据的处理时,可以将占用的存储空间作为考虑的因素,可以最大程度的减少删除的网络数据的同时,解放了更多的存储空间。
所述中央控制模块还包括数据标记单元,所述数据标记单元用于对Zk>Z的网络数据进行标记,其中,Z表示设定的网络数据所占用存储空间大小的阈值,目的是为了在后期进行网络数据的自动删除时,首先将点击查看频率低且占用存储空间大的网络数据删除,解除更多的存储空间。
所述存储数据库中存储的每一条网络数据所占用的存储空间Zk组成了网络数据存储空间的占用集合Z={Z1,Z2,Z3,…Zn},其中,Z1,Z2,Z3,…Zn表示存储数据库中的每一条网络数据所占用的存储空间大小,根据下列公式对设定的网络数据所占用存储空间大小的阈值Z进行计算:
Figure BDA0002779974210000111
阈值Z表示对Z中的所有数据计算平均值后取整加1,通过上述计算公式,一方面,使得阈值Z的设定随着数据的变化而变化,确保了阈值Z的适用能力,另一方面,对所有存储数据取平均值后取整加1,确保了阈值Z偏向于数据中更大的值,使得可以更加方便数据标记单元对存储空间较大的网络数据进行标记;
当Zk>Z时,所述数据标记单元对该网络数据进行标记,以便于后期对网络数据进行自动删除时,可以根据网络数据被查看的频率,优先考虑自动删除占用空间较大的网络数据,使得可以实现对存储空间的最大程度解除;
当Zk≤Z时,所述数据标记单元不对该网络数据进行标记,因为对该网络数据进行标记之后,即使该网络数据被查看的频率较低,自动删除该网络数据也不会释放太多的空间,还有可能导致用户的重要数据丢失。
所述查看处理模块包括数据查看单元、查看记录单元和数据分析单元;
所述数据查看单元用于用户对存储数据库中储存的网络数据进行查看,所述查看记录单元用于对用户点击查看存储数据库中缓存的网络数据的情况进行记录,所述数据分析单元用于对存储数据库中缓存的网络数据进行分析,确认每一条缓存的网络数据对用户的重要程度;
所述存储数据库的输出端电性连接数据查看单元和查看记录单元的输入端,所述数据查看单元的输出端电性连接查看记录单元的输入端,所述查看记录单元的输出端电性连接数据分析单元的输入端,所述数据分析单元的输出端电性连接中央控制模块的输入端。
通过上述技术方案,使得可以对用户每一次点击查看网络数据的情况进行记录,同时,可以分析出被用户点击查看频率较高的网络数据,那么,该数据将不会被自动删除,因为若该数据被系统自动处理并删除,将会影响用户对该数据的使用,影响用户的使用体验。
所述查看记录单元对用户每次查看网络数据的时间点进行记录,组成每一条网络数据被用户查看的时间点的集合Tk={t0,t1,t2,t3,…,tm},其中,k表示存储数据库中的第k条数据,t0表示第k条数据被缓存时的时间点,即t0=Yk,t1,t2,t3,…,tm表示第k条数据每次被查看的时间点,根据下列公式对网络数据的查看频率进行计算:
Figure BDA0002779974210000131
其中,Qk表示第k条网络数据被用户查看的频率;
所述数据分析单元将被用户查看过的网络数据组成被用户查看频率的集合Q={Q1,Q2,Q3,…,Qp},其中,Q1,Q2,Q3,…,Qp表示每一条网络数据被用户点击查看的频率,p≤n,根据下列公式,计算出n条网络数据被用户点击查看的频率的平均值:
Figure BDA0002779974210000132
其中,
Figure BDA0002779974210000133
表示n条网络数据被用户点击查看的频率的平均值,Qi表示集合Q中的第i条网络数据,利用取整函数对n条网络数据被用户点击查看的频率的平均值进行取整,使得可以保留更多的被用户点击查看过的网络数据,使得对于网络数据的自动删除更加的慎重;
Figure BDA0002779974210000134
时,该条数据不会被系统自动删除;
Figure BDA0002779974210000135
时,该条数据会被中央控制模块列入自动删除的列表。
所述删除分析模块包括排序分类单元、弹窗询问单元、手动删除单元、询问记录单元和自动删除单元;
所述排序分类单元用于根据网络数据被用户点击查看的频率对网络数据进行排序,所述弹窗询问单元用于询问客户是否对某一类别的缓存数据进行统一删除,所述手动删除单元用于客户根据弹窗询问的内容对某一类别的缓存数据进行手动删除,所述询问记录单元用于对弹窗询问单元的弹窗询问结果进行记录,根据标签分析用户对缓存数据删除的想法,所述自动删除单元用于根据数据分析单元的分析结果,接收中央控制单元的指令,对存储数据库中缓存的特定数据进行自动删除;
所述中央控制模块的输出端电性连接弹窗询问单元和排序分类单元的输入端,所述弹窗询问单元的输出端电性连接手动删除单元和询问记录单元的输入端,所述排序分类单元和询问记录单元的输出端电性连接自动删除单元的输入端。
通过上述技术方案,首先利用弹窗询问单元询问用户是否对点击查看频率较低的网络数据进行删除,并将询问结果发送至询问记录单元,利用询问记录单元对用户的选择结果进行记录,实现机器学习的过程,对用户的想法进行判断,然后利用排序分类单元根据网络数据被用户点击查看的频率进行排序,对点击查看频率较低的网络数据进行自动删除。
所述排序分类单元根据下列公式对集合Q={Q1,Q2,Q3,…,Qp}中的网络数据进行排序:
W=Qi-Qi-k,k<i,i=2、…、p,k=1、2、…、p-1;
当W=0时,将Qi和Qi-k绑定在一起进行排序;
当W>0时,表明Qi>Qi-k,将Qi排在Qi-k之前;
当W<0时,表明Qi<Qi-k,将Qi排在Qi-k之后;
完成对集合Q={Q1,Q2,Q3,…,Qp}中的p条网络数据的排序。
所述弹窗询问单元询问用户是否对点击查看频率
Figure BDA0002779974210000151
的网络数据进行手动删除,并将询问的结果传输至询问记录单元,所述询问记录单元对询问的结果进行记录;
所述自动删除单元对排序分类单元排序之后的从未被用户点击查看过的网络数据进行自动删除。
通过上述技术方案,使得本系统可以自动对用户缓存的部分网络数据进行自动删除,而这一部分网络数据也是从未被用户点击查看过的,使得可以减少存储空间被无故占用,减轻了计算机的存储压力。
所述询问记录单元对用户选择手动删除的网络数据进行记录,组成被用户选择手动删除的网络数据的频率集合P={Q1,Q2,Q3,…,Qh},其中,h<p,根据下列公式计算出集合P={Q1,Q2,Q3,…,Qh}中的最大值:
Figure BDA0002779974210000152
i=1、2、3、…h-1,k=1、2、3、…h-1;
其中,
Figure BDA0002779974210000153
表示Qi+1与Qi之间的差值;
Figure BDA0002779974210000154
时,提取Qi+1进入下一轮的计算;
Figure BDA0002779974210000155
时,提取Qi进入下一轮的计算;
得到Qmax,Qmax为集合P={Q1,Q2,Q3,…,Qh}中的最大值;
所述排序分类单元的排序结果中有Qi<Qmax时,将其作为被自动删除的备选项,所述自动删除单元从备选项中挑选被数据标记单元所标记的网络数据进行自动删除。
通过上述技术方案,使得可以对占用较大存储空间以及被用户点击频率较低的网络数据进行删除,使得解除存储数据库的存储压力,实现网络数据缓存的洁净程度,使得计算机的使用更加的顺畅。
实施例一:
所述存储数据库中存储的每一条网络数据所占用的存储空间Zk组成了网络数据存储空间的占用集合Z={128,126,45,135,25},根据下列公式对设定的网络数据所占用存储空间大小的阈值Z进行计算:
Figure BDA0002779974210000161
阈值Z=92表示对Z中的所有数据计算平均值后取整加1;
对128、126和135的网络数据进行标记;
所述查看记录单元对用户每次查看网络数据的时间点进行记录,组成每一条网络数据被用户查看的时间点的集合Tk={t0,t1,t2,t3,…,tm},其中,k表示存储数据库中的第k条数据,t0表示第k条数据被缓存时的时间点,即t0=Yk,t1,t2,t3,…,tm表示第k条数据每次被查看的时间点,根据下列公式对网络数据的查看频率进行计算:
Figure BDA0002779974210000171
其中,Qk表示第k条网络数据被用户查看的频率;
所述数据分析单元将被用户查看过的网络数据组成被用户查看频率的集合Q={Q1,Q2,Q3,…,Qp}={25,2,17,22,14},单位为次/月,根据下列公式,计算出n条网络数据被用户点击查看的频率的平均值:
Figure BDA0002779974210000172
其中,
Figure BDA0002779974210000173
表示n条网络数据被用户点击查看的频率的平均值,Qi表示集合Q中的第i条网络数据,利用取整函数对n条网络数据被用户点击查看的频率的平均值进行取整;
网络数据Z2会被自动删除;
所述排序分类单元根据下列公式对集合Q={Q1,Q2,Q3,…,Qp}中的网络数据进行排序:
W=Qi-Qi-k,k<i,i=2、…、p,k=1、2、…、p-1;
当W=0时,将Qi和Qi-k绑定在一起进行排序;
当W>0时,表明Qi>Qi-k,将Qi排在Qi-k之前;
当W<0时,表明Qi<Qi-k,将Qi排在Qi-k之后;
完成对集合Q={Q1,Q2,Q3,…,Qp}中的p条网络数据的排序,
得到Q={25,22,17,14,2}。
最后一条数据Z2会被系统自动删除。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

Claims (3)

1.一种基于计算机的网络数据处理分析系统,其特征在于:该网络数据处理分析系统包括数据预处理模块、中央控制模块、查看处理模块和删除分析模块;
所述数据预处理模块用于对网络数据进行缓存和存储,所述中央控制模块用于对整个系统的数据进行智能化控制,所述查看处理模块用于对用户查看缓存的网络数据的情况进行处理和分析,确定用户对于网络数据的查看需求,所述删除分析模块用于根据查看处理模块的查看结果对缓存的网络数据进行分析和部分删除;
所述数据预处理模块的输出端电性连接中央控制模块和查看处理模块的输入端,所述查看处理模块的输出端电性连接中央控制模块的输入端,所述中央控制模块的输出端电性连接删除分析模块的输入端;
所述数据预处理模块包括数据缓存单元、存储数据库和标签添加单元;
所述数据缓存单元用于用户对网络数据进行下载和缓存;所述存储数据库用于对计算机缓存的网络数据进行存储;所述标签添加单元用于对每次缓存的数据进行标签的添加,所述标签添加单元所添加的标签为(Xk,Yk,Zk),其中,Xk表示类型,Yk表示下载时的时间点,Zk表示占用的存储空间;
所述数据缓存单元和标签添加单元的输出端电性连接存储数据库的输入端,所述存储数据库的输出端电性连接中央控制模块和查看处理模块的输入端;
所述中央控制模块还包括数据标记单元,所述数据标记单元用于对Zk>Z的网络数据进行标记,其中,Z表示设定的网络数据所占用存储空间大小的阈值;
所述删除分析模块包括排序分类单元、弹窗询问单元、手动删除单元、询问记录单元和自动删除单元;
所述排序分类单元用于根据网络数据被用户点击查看的频率对网络数据进行排序,所述弹窗询问单元用于询问客户是否对某一类别的缓存数据进行统一删除,所述手动删除单元用于客户根据弹窗询问的内容对某一类别的缓存数据进行手动删除,所述询问记录单元用于对弹窗询问单元的弹窗询问结果进行记录,根据标签分析用户对缓存数据删除的想法,所述自动删除单元用于根据数据分析单元的分析结果,接收中央控制单元的指令,对存储数据库中缓存的特定数据进行自动删除;
所述中央控制模块的输出端电性连接弹窗询问单元和排序分类单元的输入端,所述弹窗询问单元的输出端电性连接手动删除单元和询问记录单元的输入端,所述排序分类单元和询问记录单元的输出端电性连接自动删除单元的输入端;
所述存储数据库中存储的每一条网络数据所占用的存储空间Zk组成了网络数据存储空间的占用集合Z={Z1,Z2,Z3,…Zn},其中,Z1,Z2,Z3,…Zn表示存储数据库中的每一条网络数据所占用的存储空间大小,根据下列公式对设定的网络数据所占用存储空间大小的阈值Z进行计算:
Figure FDA0003154674160000031
阈值Z表示对Z中的所有数据计算平均值后取整加1;
当Zk>Z时,所述数据标记单元对该网络数据进行标记;
当Zk≤Z时,所述数据标记单元不对该网络数据进行标记;
所述数据分析单元将被用户查看过的网络数据组成被用户查看频率的集合Q={Q1,Q2,Q3,…,Qp},其中,Q1,Q2,Q3,…,Qp表示每一条网络数据被用户点击查看的频率,p≤n,根据下列公式,计算出n条网络数据被用户点击查看的频率的平均值:
Figure FDA0003154674160000032
其中,
Figure FDA0003154674160000033
表示n条网络数据被用户点击查看的频率的平均值,Qi表示集合Q中的第i条网络数据,利用取整函数对n条网络数据被用户点击查看的频率的平均值进行取整;
Figure FDA0003154674160000034
时,该条数据不会被系统自动删除;
Figure FDA0003154674160000035
时,该条数据会被中央控制模块列入自动删除的列表;
所述排序分类单元根据下列公式对集合Q={Q1,Q2,Q3,…,Qp}中的网络数据进行排序:
W=Qi-Qi-k,k<i,i=2、...p,k=1、2、...p-1;
当W=0时,将Qi和Qi-k绑定在一起进行排序;
当W>0时,表明Qi>Qi-k,将Qi排在Qi-k之前;
当W<0时,表明Qi<Qi-k,将Qi排在Qi-k之后;
完成对集合Q={Q1,Q2,Q3,…,Qp}中的p条网络数据的排序; 所述弹窗询问单元询问用户是否对点击查看频率
Figure FDA0003154674160000041
的网络数据进行手动删除,并将询问的结果传输至询问记录单元,所述询问记录单元对询问的结果进行记录;
所述自动删除单元对排序分类单元排序之后的从未被用户点击查看过的网络数据进行自动删除;
所述询问记录单元对用户选择手动删除的网络数据进行记录,组成被用户选择手动删除的网络数据的频率集合P={Q1,Q2,Q3,…,Qh},其中,h<p,根据下列公式计算出集合P={Q1,Q2,Q3,…,Qh}中的最大值:
Figure FDA0003154674160000042
其中,
Figure FDA0003154674160000043
表示Qi+1与Qi之间的差值;
Figure FDA0003154674160000044
时,提取Qi+1进入下一轮的计算;
Figure FDA0003154674160000045
时,提取Qi进入下一轮的计算;
得到Qmax,Qmax为集合P={Q1,Q2,Q3,…,Qh}中的最大值;
所述排序分类单元的排序结果中有Qi<Qmax时,将其作为被自动删除的备选项,所述自动删除单元从备选项中挑选被数据标记单元所标记的网络数据进行自动删除。
2.根据权利要求1所述的一种基于计算机的网络数据处理分析系统,其特征在于:所述查看处理模块包括数据查看单元、查看记录单元和数据分析单元;
所述数据查看单元用于用户对存储数据库中储存的网络数据进行查看,所述查看记录单元用于对用户点击查看存储数据库中缓存的网络数据的情况进行记录,所述数据分析单元用于对存储数据库中缓存的网络数据进行分析,确认每一条缓存的网络数据对用户的重要程度;
所述存储数据库的输出端电性连接数据查看单元和查看记录单元的输入端,所述数据查看单元的输出端电性连接查看记录单元的输入端,所述查看记录单元的输出端电性连接数据分析单元的输入端,所述数据分析单元的输出端电性连接中央控制模块的输入端。
3.根据权利要求2所述的一种基于计算机的网络数据处理分析系统,其特征在于:所述查看记录单元对用户每次查看网络数据的时间点进行记录,组成每一条网络数据被用户查看的时间点的集合Tk={t0,t1,t2,t3,…,tm},其中,k表示存储数据库中的第k条数据,t0表示第k条数据被缓存时的时间点,即t0=Yk,t1,t2,t3,…,tm表示第k条数据每次被查看的时间点,根据下列公式对网络数据的查看频率进行计算:
Figure FDA0003154674160000051
其中,Qk表示第k条网络数据被用户查看的频率。
CN202011278618.6A 2020-11-16 2020-11-16 一种基于计算机的网络数据处理分析系统 Active CN112433993B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011278618.6A CN112433993B (zh) 2020-11-16 2020-11-16 一种基于计算机的网络数据处理分析系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011278618.6A CN112433993B (zh) 2020-11-16 2020-11-16 一种基于计算机的网络数据处理分析系统

Publications (2)

Publication Number Publication Date
CN112433993A CN112433993A (zh) 2021-03-02
CN112433993B true CN112433993B (zh) 2021-10-01

Family

ID=74701113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011278618.6A Active CN112433993B (zh) 2020-11-16 2020-11-16 一种基于计算机的网络数据处理分析系统

Country Status (1)

Country Link
CN (1) CN112433993B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115510272B (zh) * 2022-09-20 2023-07-14 广州金狐智能科技有限公司 一种基于大数据分析的计算机数据处理系统
CN116627959B (zh) * 2023-07-26 2023-10-13 合肥思迈科技有限公司 机房动环设备运行历史数据的清除方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279163A (zh) * 2014-06-16 2016-01-27 Tcl集团股份有限公司 一种缓存数据的更新及存储方法及其系统
CN108959505A (zh) * 2018-06-27 2018-12-07 平安科技(深圳)有限公司 一种管理缓存图片的方法及终端设备
CN110362769A (zh) * 2019-06-25 2019-10-22 苏州浪潮智能科技有限公司 一种数据处理方法及装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105446864B (zh) * 2014-06-30 2018-03-30 北京金山安全软件有限公司 缓存文件删除影响的校验方法、装置及移动终端
CN108829616A (zh) * 2018-06-15 2018-11-16 佛山长意云信息技术有限公司 一种缓存数据管理方法、装置、计算机设备及存储介质
US10831644B2 (en) * 2018-10-01 2020-11-10 Villani Analytics LLC Automation of enterprise software inventory and testing
CN110287160B (zh) * 2019-05-31 2023-09-12 广东睿江云计算股份有限公司 一种缓存空间清理方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105279163A (zh) * 2014-06-16 2016-01-27 Tcl集团股份有限公司 一种缓存数据的更新及存储方法及其系统
CN108959505A (zh) * 2018-06-27 2018-12-07 平安科技(深圳)有限公司 一种管理缓存图片的方法及终端设备
CN110362769A (zh) * 2019-06-25 2019-10-22 苏州浪潮智能科技有限公司 一种数据处理方法及装置

Also Published As

Publication number Publication date
CN112433993A (zh) 2021-03-02

Similar Documents

Publication Publication Date Title
CN108241667B (zh) 用于推送信息的方法和装置
CN112433993B (zh) 一种基于计算机的网络数据处理分析系统
CN109033408B (zh) 信息推送方法及装置、计算机可读存储介质、电子设备
CN111414479A (zh) 基于短文本聚类技术的标签抽取方法
US20020065841A1 (en) Device for retaining important data on a preferential basis
CN110895586B (zh) 生成新闻页面的方法、装置、计算机设备及存储介质
CN111898675B (zh) 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备
CN111125429A (zh) 一种视频推送方法、装置和计算机可读存储介质
CN113239268B (zh) 一种商品推荐方法、装置及系统
CN113780007A (zh) 语料筛选方法、意图识别模型优化方法、设备及存储介质
CN108536868A (zh) 社交网络上短文本数据的数据处理方法及应用
CN113643070A (zh) 一种基于大数据的智能信息推送方法及系统
CN112163081A (zh) 标签确定方法、装置、介质及电子设备
CN109829063A (zh) 一种数据处理方法、装置及存储介质
CN108347367B (zh) 一种电子邮件处理方法、装置、服务器及客户端
CN113342942B (zh) 语料自动化获取方法、装置、计算机设备及存储介质
CN112269906B (zh) 网页正文的自动抽取方法及装置
CN113836898A (zh) 一种电力系统自动派单方法
CN112565902B (zh) 一种视频推荐方法、装置及电子设备
CN112651582A (zh) 一种产品流失用户的用户类别识别方法及相关设备
CN111797258A (zh) 基于美感评价的图像推送方法、系统、设备及存储介质
CN115759047A (zh) 资产评估报告依据的筛选及自动填充方法和装置
CN111143688B (zh) 一种基于移动新闻客户端的评估方法及其系统
JP7043243B2 (ja) 分類装置、分類方法、およびプログラム
CN112286874B (zh) 一种基于时间的文件管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant