WO2016115957A1

WO2016115957A1 - 一种面向用户与应用的计算机与智能设备加速方法和装置

Info

Publication number: WO2016115957A1
Application number: PCT/CN2015/098536
Authority: WO
Inventors: 张维加
Original assignee: 张维加
Priority date: 2015-01-19
Filing date: 2015-12-24
Publication date: 2016-07-28
Also published as: CN105867832B; CN105867832A

Abstract

一种面向用户与应用的计算机与智能设备加速方法和装置，在大量计算机上布置缓存与预取服务控制装置，这些装置在设备上创建内存虚拟磁盘，然后对各硬件部分进行不同类型读写测试，将设备建模成不同性能参数数据装置的组合，控制装置也可带外接固态硬件并参与建模，随后控制装置初步分析被服务设备上的应用信息，并通过网络操作等分析用户类型，与硬件建模一起对云端提交，云端分析后据先有档案对不同类型硬件给出针对不同应用不同用户群的加速方案，返回装置进行初步处理，同时装置开始统计各应用读写操作、I/O类型、操作频率等，一段时间后结合效果反馈再次反馈云端，云端记录并给出校正方案。反复迭代到基本完善，再将最终方案与历史保存云端。

Description

一种面向用户与应用的计算机与智能设备加速方法和装置

技术领域

该产品属于计算机设备与信息科学技术领域。是一种基于大数据与云技术的跨设备交互的计算机与智能设备加速方法。

背景技术

首先需要说明的是，本发明所指的缓存主要是指的计算机与智能计算设备的磁盘缓存，即用于加速电脑或运行，突破磁盘性能瓶颈的缓存，而不是视频流媒体缓存或路由web缓存。

磁盘缓存技术是为了解决磁盘速度瓶颈而出现的。磁盘性能的提高远远落后于处理器等电子设备，这使得存储系统仍旧是整个计算机系统的性能瓶颈。缓存(Caching)以及预取(Prefetching)是能够提高存储系统性能的两种非常有效的技术。缓存技术的思想是将经常访问的数据放在快速访问设备中，加快其存取速度，减少等待时间。预取技术是把将来有可能马上要被访问到的数据预先从慢速设备中预取到快速设备中。其中，由于预取实际上也是磁盘缓存调配的一种，故在本文中将两者统称为磁盘缓存技术。

缓存技术(Caching)，顾名思义，就是当上下两层次的设备读写性能差异较大时，介于上一级的高性能设备与下一级的低性能设备之间的一个缓冲层，其容量低于下一级的低性能设备，而性能往往低于上一级的高性能设备，但是其速度大于低性能设备，通过转移原本指向低性能设备的读写来提升性能。Cache一词来源于1967年的一篇电子工程期刊论文。凡是位于速度相差较大的两种硬件之间，用于协调两者数据传输速度差异的结构，均可称之为Cache。正是考虑到了缓存技术在整个存储体系中的重要地位，大量以提高缓存命中率、最小化磁盘I/O数量为目标的缓存管理算法纷纷涌现。比如，LRU是应用最为广泛的缓存管理算法，算法的核心思想就是优先将那些设备在最近一段时期内最少访问的数据替换出缓存，从而最大限度保障缓存的利用效率。另外，还有一些与LRU相反的缓存管理算法，它们是针对应用中特定访问模式而设计的。比如最多使用替换算法(Most Recently Used,MRU)也被称为读取-替换算法。与LRU优先替换出设备最近最少使用的数据不同，MRU总是从设备缓存中替换出最近使用的数据块。之所以如此，是因为MRU最初是为一些类似于顺序扫描、循环扫描的访问模式所设计的。无论是基于空间局部性还是访问频率，缓存管理算法的最终目标就是提高设备端缓存的命中率、最小化设备磁盘I/O的数量。

预取技术(Prefetching)是提高存储系统性能的另一项重要技术。预取是将那些尚未访问但未来可能访问的数据预先从磁盘等低速存储设备成批读取到缓存等高速存储设备中，以提高数据访问的速度，并最终提升整个存储系统的性能。

预取技术的有效性主要取决于两个方面：一个是预取的精确度以及受其影响的缓存命中率，另一个则是预取中顺序性的挖掘。一些研究试图通过保存更多更久的历史访问信息来提升预测的准确性。另外一类算法则通过设备的历史访问信息来挖掘文件之间或者数据块之间的访问关系，并基于这些关系预测未来的访问数据，提高缓存的命中率。

无论缓存还是预取，一直以来，存在许多问题，以致于影响了其应用。

比如，旧的缓存技术是以设备为对象，其目的在于提升设备性能，使之做任何事情都有性能提升。这样有三个弊端，第一，缓存都不得不以设备为对象设计，具备了不可移植性，形成了硬件捆绑，不能通用，第二，一个设备的性能提升对于其他设备没有任何帮助，也就是说，无法降低边际成本，无法提升边际效用，举例来说，通过设置了更大的缓存，三星850EVO磁盘获得了比840EVO更好的性能，但是这件事对于现有的840EVO没有任何帮助，第三，对用户帮助很小，还是以三星为例，其固态硬盘的缓存一般都设计地较低，原因很简单，正如其设计师所述，用户一般感觉不到更高缓存带来的性能提升，性能指标跑分虽然上去了，实际应用满意度却较低。

又比如，旧的缓存预取的算法、优化、自我学习都是局域的，针对具体设备的，将效果寄望于硬件带来的即时效果，即使有后期优化也寄希望于长时间的校正。这是因为，在过去，任何缓存预取系统既无法获得其他设备的缓存信息，也无法影响其他设备的运行，更何况在不以应用和用户类型(用户群)为对象而以设备为对象的情况下，设备之间差异巨大即使实现各个设备系统之间的交互似乎也毫无意义：

原因1.无法获得其他设备的缓存信息

在过去，磁盘缓存都与各自设备形成一个孤立的系统，与其他设备的缓存并没有任何交互。

原因2.无法影响其他设备的运行

既然各自都是孤立的系统，自然无法彼此影响。

原因3.设备之间差异巨大即使实现各个设备系统之间的交互似乎也毫无意义

以缓存本身的建立过程为例，需要积累该设备的运行数据，才能统计出常用文件，并将这些常用文件进行缓存。显然，此处所说的常用文件就是针对具体设备，离开了具体设备根本就没有常用文件这个概念。一个计算机工程师的电脑常用程序，比如Visual C或者Dreamwaver，可能在普通用户的计算机上根本就不会安装，那两者之间的缓存系统又有什么可比性呢？更何况，不同设备的缓存本身也差异巨大，过去绝大部分计算机并没有设置处理器缓存之外的磁盘缓存，少数服务器应用有缓存技术，一些台式计算机应用有基于固态硬盘缓存技术(如混合硬盘)，这些设备之间，无缓存的，有缓存的，有完全不同缓存设备的，设备之间差别巨大。因此面向设备的缓存技术没有交互的可能。

总之，过去的磁盘缓存或计算机缓存预取是以设备为对象的、局域的，导致难移植，不通用，边际效用低，边际成本高，实际应用满意率低，优化缓慢耗时间等问题。

可是，如果要改变这种模式，就需要对现有各类设备、软硬件进行重新设计与工作模式改写。

但这一重新设计是值得的。虽然本发明仅仅是其初步探索，也获得了意外的效果。

并且，磁盘缓存的模式是会发生改变的。在发明人的另一项专利中(2014105350389)，发明人提出了跨设备的计算加速系统，本质是性能输送，跨设备的缓存系统中服务端与被服务端之间是短距离但多通道的网络，可在短距离内输送性能，而服务端之间又可以依靠光纤等实现交互。这样，该跨设备的缓存系统就可以形成网络，获得大数据，并能应用云技术。

发明内容

本发明提出一种面向用户与应用的计算机加速方法和装置。

本发明方案改变之前缓存与预取技术的局域特性，挖掘缓存方案与经验的数据特性，变设备对象型的缓存操作为应用与用户对象型的缓存操作，变固定设备型操作为跨设备联网协同操作，变单一缓存预取设备为三级。

方法流程概括：(控制设备安装与识别)----设备建模----应用与用户类型数据与设备模型一起向云端传输----云计算初次优化尝试----反馈采集向云端传输----云端二次矫正反馈并记录数据----多次反复直到完善反馈并记录历史。

传统缓存预取往往在一个设备内完成，而本发明提供的缓存预取技术在架构上采取了三级结构：大量终端的缓存预取控制装置，作为一级控制装置，贡献出大数据，以及数量不多但分析尤其是模糊运算能力强的云端服务器，作为二级控制装置，进行云计算，再加上控制装置携带的USB接口的外接固态硬件，总共通过三级完成。在服务范围方面，这三级结构也不再是局域的，他们彼此之间通过网络连接来完成协同工作。

该方法需要多个或大量缓存预取终端控制装置以及具备模糊分析能力的云端服务器。这些终端控制装置对被加速计算设备进行先期处理，包括载入加速硬件、检测网络设备以及分割内存与存储设备，然后控制装置对设备各硬件部分进行不同类型读写的测试(如4K读写、顺序读写等)，将设备进行建模成不同性能参数数据装置的组合，装置并且将各类缓存设备也进行分类，以便应用优化方案。比如，标记分别出并行设备与串行设备，对于并行I/O，采用细粒度的同步锁机制增加I/O过程的并行性，从而改善I/O性能，又如，标记区分I/O的类型，判断缓存设备最擅长的随机读操作I/O类型，通过在I/O过程中判别其特征，择优分配缓存设备进行缓存。

随后控制装置初步分析被服务设备上的各种应用程序信息以及网络操作的用户特征数据，然后与硬件建模结果一起对云端提交，云端在收到数据后进行统计与模糊分析，依据先有经验数据档案对不同建模硬件给出针对不同应用不同用户类型(用户群)的优化加速方案，返回缓存服务装置进行第一次处理。

初步应用云端返回的第一次配置指导方案后，经过一段时间自我学习与优化后，控制装置再统计各应用读操作写操作比例、I/O请求类型、常用文件数目与大小、使用频率、用户类型特征等，在一段时间后结合自测与用户反馈收集再次反馈云端。以密文上传这些在各自系统中优化后的缓存模式配置数据到处理服务器(云端)。

云端记录数据与反馈情况并给出校正或第二优选方案。如此反复数次，达到基本完善并将最终结果与优化历史保存云端。

云端在收到优化最终数据后进行统计与分析，以应用程序、游戏与网址等应用层面的对象为统计对象，分析总结出针对不同应用的缓存配置或预取的优化方案(或不同应用在不同设备、用户等具体情形下的缓存配置或预取的优化方案)，以便之后再以主动反馈或被动应答等方式将优化后的缓存方案与预取方案返回到缓存服务装置进行相应处理如优化、预判等。见附图1所示。

当然，缓存服务装置与云端之间的上传下载的数据全部以密文的形式传递。

进一步地，缓存服务装置上传的数据还可包括各自设备的缓存硬件特征，也会用于应用云端反馈回的方案。这样在云端分析给出的缓存优化方案并不是一个应用一份的，而是具体的、分类的，如在何种缓存结构上，对该应用采取何种缓存或预取方案。这种依据各类缓存设备进行不同处理有利于应用优化方案。

进一步地，缓存服务装置上传的数据还可包括用户群体特征数据，如年龄范围、职业范围、兴趣范围等，相应地，云端反馈的优化缓存方案也包括针对不同用户类型(用户群)对于不同应用对象的使用特征的优化或预判方案。比如，特定行业、年龄段的用户使用设备都有各自的明显人群特征，如老年人就不会使用大量读随机缓存的3D游戏，而更倾向于使用更多写缓存的浏览器。知道了这些特征，并应用这些特征，都能够更好地发挥预取与缓存的作用。当然，这些信息都是用户群信息，装置既不需要也绝不会获取任何用户本身的个人信息。这些用户群信息也经过加密。

控制装置还可以选择开启服务节点模式(用户有选择权)。如果用户允许开启服务节点模式，则该控制装置还将按照云端服务器的指令，为其他周边用户提供cdn缓存、近距网络缓存、VPN服务、smtp服务等服务。同时，用户也将获得一定的收益回报。

依据该方法设置了多个样例装置，见具体实施案例部分。

有益效果与发明的创造性

本发明能够改变计算设备的缓存优化和预取优化机制，能够提升缓存设备对于第一次使用的应用、新安装的应用、新访问的网站以及使用频率低的应用的缓存加速能力。对于经常使用的应用，也能够通过针对设备硬件特征和用户类型特征等进一步提升缓存与预取的效果。

其效果是广泛的，对于用户层面而言，即使设备才刚刚安装，用户关心的网站与相关网站就能够快速访问，哪怕该用户可能仅仅是第一次或第二次访问这个网站(这种比例占很大，一般网民的60％网络访问都是访问不到三次的网站)，而这在过去是根本不可能的。装置依靠用户群的大数据还能挖掘出更多的网站关联性与加速技术。

类似，即使设备才刚刚安装，用户常用的应用与喜欢用的应用就可能够流畅运行。且以上两点都是用户数量越多，分布越广，用户体验就会更好，具备网络效应和雪球效应。

对于应用层面而言，效果场景举例如下。

举例一：大量被服务设备上某游戏程序的某文件夹都呈现出频繁读取特征，则当设备新装该程序，可直接进行预判性质的工作如缓存那个在其他设备上被频繁读写文件夹到高速设备，而无需重新积累缓存数据。

举例二：大量被服务设备上某程序都呈现出频繁写入工作，如某购物浏览器，则当启动该浏览器时，可预判性质地为其分配较大的写缓存，而无需重新积累缓存数据。

事实上，许多程序由于用户的使用频率并不高，无法在单个设备上学习到最优的缓存，但是跨设备数据的获取，就能够进行大量数据样本的统计与判断，使得许多很少使用的程序甚至第一次使用的程序都能够被准确地预先优化。

对于设备层面而言，装置是通用的、可移植的，也是互联的，并可依靠升级云端完成不断的后续功能升级。

本发明的创造性：

本发明创造了一种新的缓存预取的工作方式与装置制造方式。

第一，过去的磁盘缓存或计算机缓存预取是以设备为对象的、局域的，导致难移植，不通用，边际效用低，边际成本高，实际应用满意率低，优化缓慢耗时间等问题。而本发明提供的新的缓存预取是以应用和用户类型(用户群)为对象的、基于网络的，具有通用性和移植性的，带有网络规模效应的，边际效用高，应用满意率高，并且可快速完成优化配置。

第二，与过去的缓存预取技术不同，本发明提供的缓存预取技术在方法流程上采用了设备建模----应用与用户类型数据与设备模型一起向云端传输----云计算初次优化尝试----反馈采集向云端传输----云端二次矫正反馈并记录数据----多次反复直到完善反馈并记录历史。本发明中的工作流程中存在迭代，并在工作的过程中从无到有地构建出一种反映应用特征与用户类型特征与硬件模型关系的大数据，以及一种新的模糊分析与迭代指导的云计算模式。

第三，传统缓存预取往往在一个设备内完成，而本发明提供的缓存预取技术在架构上采取了三级结构：大量终端的缓存预取控制装置，作为一级控制装置，贡献出大数据，以及数量不多但分析尤其是模糊运算能力强的云端服务器，作为二级控制装置，进行云计算，再加上控制装置携带的USB接口的外接固态硬件，总共通过三级完成。

在服务范围方面，这三级结构也不再是局域的，他们彼此之间通过网络连接来完成协同工作。

第四，过去的缓存预取技术全部忽视了用户类型这一本质性的差异。对于同样的设备，不同用户的需求存在着非常大的差异。技术服务的最终对象应当是人，而不是设备。一个老年人使用同一个浏览器可能主要用途是看视频和看新闻，而一个年轻人主要用途可能是玩网页游戏，这种差异反映在应用的缓存方案上应当是截然不同的。当然，这也不全部是忽视或者说偏见，过去的技术方案对此本来就没有办法，设备在出售前无法预知其买主，程序在被下载前无法预知其用户。而采用本发明就可以挖掘出用户类型、创建相关大数据并应用到缓存预取技术中。

具体实施案例

基于本发明的方法，设计实施了一种装置。应用本发明的方法的装置既可以是硬件，也可以是软件，也可以是软硬件的结合。本处展示的样例装置有两个，其中第一个是一种软硬件结合设备，第二个样例略去外接缓存设备与高速网络部件成为一种软件。

第一个样例带有一个控制装置，以及一个带USB3.0连接线的外接固态加速硬件。该固态加速硬件具备620MB每秒的顺序读，550MB每秒的顺序写，120MB每秒的4K读，160MB每秒的4K写，以上速度是在出厂时通过Thunderbolt测数据参数，在USB3下大致可以达到该性能，装置的工作流程(见附图2所示)：

第一步，缓存载入与虚拟化工作。

1.载入固态加速硬件2.调取被服务端设备部分的内存，将其虚拟成磁盘作为一级缓存，并在关机时保存其内容到文件数据包，开机时载入该数据包到虚拟的内存磁盘，调取大小先为初步设定最小值，在随后与云端反馈过程后逐步修改；3.检测是否存在其他可用磁盘缓存，比如对低速磁盘的移动设备检测是否有wigig外接的高速闪存，如能检测到可用缓存，就创建为二级缓存(或由用户同意是否创建)，以便根据读写操作等进行缓存与预取。

第二步，测量工作。

完成准备操作后，控制装置对设备硬件与创建的各种缓存部件进行不同类型读写的测试，如4K读写、512K随机读写、顺序读写等，判断待加速设备各个部分的缓存性能特征，对外接加速硬件也参与测试，因为设备的USB接口会带来很大的影响。

第三步，建模工作。

依据测量数据，并通过系统函数如Windows函数读取硬件其他信息如大小、接口等，然后将设备进行建模成各个不同性能参数的数据装置的组合，并给出各个部分的每项读写性能评分以及综合评分，并进行归类，比如该部分属于随机读取缓存设备还是4K写缓存设备。该归类信息既会与本机的缓存优化数据一起加密上传云端，也会用于应用云端反馈回的方案。因为，在云端分析给出的缓存优化方案并不是一个应用一份的，而是具体的、分类的，如在何种缓存结构上，应用何种方案。这种依据各类缓存设备进行不同处理有利于应用优化方案。比如，标记分别出并行设备与串行设备，又如，标记区分I/O的类型，判断缓存设备最擅长的随机读操作I/O类型，通过在I/O过程中判别其特征，择优分配缓存设备进行缓存。

第四步，扫描应用状态，并大致确定用户类型(用户群)。

这一步其实有许多实现方式。样例中我们的控制装置是这样做的：扫描程序安装目录获得应用种类，扫描Prefetch目录和日志获得应用使用频率，扫描系统TEMP文件夹获得常访问网站并根据网站推断用户类型特征，推断用户习惯。装置根据网站网址与缓存文件对用户群体特征进行大致判断，根据设备类型、年龄，以及设备上的应用分布，判断用户的职业、兴趣、年龄等。当然，这些信息都是用户群体性的特征信息，装置既不需要也绝不会获取任何用户本身的个人信息。而且这些用户群信息全都会以加密的形式传递到云端。

第五步，数据初步上传云端。

控制装置初步分析并对云端提交被服务设备上的各种应用程序信息以及网络操作的用户特征数据，以及硬件建模结果。

上传数据中不会有任何用户隐私信息，都是抽象的模型信息与用户群，比如一个典型的大致会包含以下类型信息，以下信息仅为举例：最常用的应用程序(魔兽争霸，淘宝浏览器，Word)，用户特征(20-30岁，男，喜爱购物与浏览汽车相关网站，以及页游如4399)，计算机建模特征(测试特征：32位系统，4GB物理DDR2内存，系统识别3.2GB，通过USB3.0普通接口连接加速硬件部分，共64GB，并采用了USB协议优化加速，创建内存虚拟磁盘512MB，单硬盘，希捷混合硬盘为1TB，其中内存虚拟磁盘测分为顺序读2200MB每秒，顺序写1020MB每秒，4K读500MB每秒，4K写300MB每秒，外接加速硬件顺序读480MB每秒，顺序写480MB每秒，4K读100MB每秒，4K写160MB每秒，混合硬盘的顺序读150MB每秒，顺序写120MB每秒，4K读1MB每秒，4K写0.5MB每秒等其他参数，建模特征：设置为一个4K的缓存区A，一个内存虚拟的写缓存区B，一个顺序读缓存区C，一个混合区D----实际的建模当然会比这个复杂一些，此处为说明用)等等，这些信息以加密格式上传给云端服务器。

第六步，云端初步模糊分析。

首先，这个跟互联网一样，如果这是刚刚建网的初期，云端没有已有数据，那么最初的几份档案与数据是需要人工工程师输入的，包括大量的在各类设备环境下针对各类用户群的不同应用的缓存预取方案。这里的方案不完善是没关系的，因为会在后面的过程中被不断迭代、完善。

接下来我们这里重点介绍的当然是网络已经初步建立之后的流程。

在收到应用数据、用户群特征、以及硬件建模结果等上传数据后，云端在收到数据后进行统计与模糊分析，依据先有经验数据档案对不同建模硬件给出针对不同应用不同用户群的优化加速方案，返回缓存服务装置进行第一次处理。

比如上面的例子的处理方式可能就是：据服务器数据库资料，由于大量被服务设备上魔兽争霸的某文件夹都呈现出频繁读取特征，故云端返回方案要求缓存那个被频繁读写文件夹到C；据服务器数据库资料，大量被服务设备上淘宝浏览器都呈现出频繁写入工作，故为其分配较大的写缓存到B；大量被服务设备上Word都涉及大量4K读写，分配A区；由于用户喜爱购物与浏览汽车相关网站，以及页游如4399，故云端返回方案要求缓存预取相关网站的主要页面，并以cdn技术布置一些缓存重定向到附近节点；并针对上传的数据和模型给与一些其他的系统与应用的缓存预取配置方案等。

分析完毕后服务器将上述方案返回控制装置。

第七步，深度数据与测试效果反馈。

在一段时间后控制装置再进行自测与用户反馈收集，并上传一段时间内获得的深度数据，应尽可能包括各应用读操作写操作比例、I/O请求类型、常用文件数目与大小、使用频率，反馈云端，云端根据反馈情况给出校正或第二优选方案。

第八步，反复迭代方案。

如此反复数次后，达到基本完善。

第九步，服务器数据库更新，并将最终结果与优化历史保存云端。

云端服务器收到以密文上传这些在各自系统中的最终优化缓存模式配置数据，处理服务器对多个装置的缓存过的各种应用程序、游戏、网络操作与相关文件的统计数据，以应用、用户与设备模型为分类单位，记录到数据库，如：建筑行业用户、Dell Latitude 600计算机上最佳的AutoCAD缓存与预取方案。(同一个应用程序在不同类型用户、不同设备上的最佳缓存预取方案显然是不同的。)以便之后协调新的装置。

第十步，再服务节点(用户可选模式)。

该样例一装置的设计还包括了：1.对系统内存提供智能压缩与后台自动释放；2.装置将应用程序进行虚拟化处理，从而预存更多甚至所有程序文件与程序所需系统环境文件在缓存中(虚拟化原理可以是重定向和环境虚拟化技术等，被虚拟化的应用程序自我包含，可以在)。

第二个样例装置的工作流程：

第一步，缓存创建与虚拟化工作。

1.调取被服务端设备部分的内存，将其虚拟成磁盘作为一级缓存，并在关机时保存其内容到文件数据包，开机时载入该数据包到虚拟的内存磁盘，调取大小先为初步设定最小值，在随后与云端反馈过程后逐步修改；2.检测是否存在可用磁盘缓存，比如对低速磁盘的移动设备检测是否有wigig外接的高速闪存，如能检测到可用缓存，就创建为二级缓存(或由用户同意是否创建)，以便根据读写操作等进行缓存与预取。

第二步，测量工作。

完成准备操作后，控制装置对设备硬件与创建的各种缓存部件进行不同类型读写的测试，如4K读写、512K随机读写、顺序读写等，判断待加速设备各个部分的缓存性能特征，当存在外部硬件设备如外接固态硬盘等情形时这些外接设备也参与测试。

第三步，建模工作。

第四步，扫描应用状态，并大致确定用户类型(用户群)。

这一步其实有许多实现方式。样例二中我们的控制装置是这样做的：扫描程序安装目录获得应用种类，扫描Prefetch目录和日志获得应用使用频率，扫描系统TEMP文件夹获得常访问网站并根据网站推断用户群特征，推断用户习惯。装置根据网站网址与缓存文件对用户群体特征进行大致判断，根据设备类型、年龄，以及设备上的应用分布，判断用户的职业、兴趣、年龄等。当然，这些信息都是用户群体性的特征信息，装置既不需要也绝不会获取任何用户本身的个人信息。而且这些用户群信息全都会以加密的形式传递到云端。

第五步，数据初步上传云端。

上传数据中不会有任何用户隐私信息，都是抽象的模型信息与用户群，比如一个典型的大致会包含以下类型信息，以下信息仅为举例：最常用的应用程序(魔兽争霸，淘宝浏览器，Word)，用户特征(20-30岁，男，喜爱购物与浏览汽车相关网站，以及页游如4399)，计算机建模特征(测试特征：32位系统，4GB物理DDR2内存，系统识别3.2GB，创建内存虚拟磁盘512MB，双硬盘，其中SSD为32GB，HDD为1TB，其中内存虚拟磁盘测分为顺序读2200MB每秒，顺序写1020MB每秒，4K读500MB每秒，4K写300MB每秒，SSD顺序读300MB每秒，顺序写120MB每秒，512K读280MB每秒，512K写110MB每秒，4K读10MB每秒，4K写16MB每秒，HDD的顺序读80MB每秒，顺序写60MB每秒，4K读0.1MB每秒，4K写0.05MB每秒等其他参数，建模特征：设置为一个4K的缓存区A，一个内存虚拟的写缓存区B，一个顺序读缓存区C，一个混合区D----实际的建模当然会比这个复杂一些，此处为说明用)等等，这些信息以加密格式上传给云端服务器。

第六步，云端初步模糊分析。

分析完毕后服务器将上述方案返回控制装置。

第七步，深度数据与测试效果反馈。

第八步，反复迭代方案。

如此反复数次后，达到基本完善。

云端服务器收到以密文上传这些在各自系统中的最终优化缓存模式配置数据，处理服务器对多个装置的缓存过的各种应用程序、游戏、网络操作与相关文件的统计数据，以应用、用户与设备模型为分类单位，记录到数据库，如：建筑行业用户、Dell Latitude 600计算机上最佳的AutoCAD缓存与预取方案。(因为同一个应用程序在不同类型用户、不同设备上的最佳缓存预取方案显然是不同的。)以便之后协调新的装置。

该样例二装置的设计也包括了：1.对系统内存提供智能压缩与后台自动释放；2.装置将应用程序进行虚拟化处理，从而预存更多甚至所有程序文件与程序所需系统环境文件在缓存中。

除了缓存载入有差别外，其他也可参见附图2所示。

以上所述乃是本发明的具体实施例及所运用的技术手段，根据本文的揭露或教导可衍生推导出许多的变更与修正，若依本发明的构想所作的等效改变，其所产生的作用仍未超出说明书及附图所涵盖的实质精神时，均应视为在本发明的技术范畴之内，合先陈明。

附图说明

图1.设备基本原理图。

图2.样例装置示意图。

Claims

一种基于大数据和云技术的、以用户与应用为对象的计算机及智能设备加速方法，该方法在多台或大量待加速设备上布置控制装置，由这些控制装置对这些待加速设备主要硬件部分进行识别或性能测试，并调取被服务端设备部分的部分内存将其虚拟成磁盘作为缓存，并通过诸如扫描待加速设备上相关程序目录缓存目录等方式获取待加速设备上的应用程序情况数据、及网络操作等用户类型特征数据(用户类型特征数据可视情况决定是否获取)，与识别的硬件特征数据一起提交云端远程服务器，云端在接收上述数据后，结合云端原先已有的数据库进行计算分析，并通过诸如检索相似硬件、相似用户下相应应用程序的最佳缓存方案和预取配置等方式，对每个不同的待加速设备给出针对其具体硬件、具体应用、甚至具体用户类型(此项为可选)的优化缓存或预取加速方案，以主动反馈或被动应答等方式反馈给各服务控制装置，由控制装置依据反馈信息进行相应的缓存加速、缓存优化或预取处理等。
一种权利要求1所描述的方法，其特征在于，在控制状态收到反馈方案后不是直接完成应用而是开启迭代的进程，即，按照服务器初步指示配置缓存预取服务的同时，控制装置开始统计跟踪状态信息如各应用读写操作比例、I/O请求类型、最常读写文件大小、操作频率、文件关联经验关系、响应时间等，在一段时间后结合效果反馈或用户满意度再次反馈云端，云端在收到数据与反馈后再度进行分析给出校正或第二优选方案，如此反复迭代直到基本完善，再将最终方案保存云端，云端以应用、硬件类型、缓存设备类型、用户特征等作为索引，将最终优化的方案添加到数据库，并可选择性地记录部分优化过程信息或全部优化历史到数据库，即，在方法流程上采用了该步骤：(控制设备安装)----设备硬件各部分识别与建模----虚拟化与缓存创建----应用数据与用户类型数据获取----应用数据、用户类型数据、设备模型数据向云端传输----云计算初次优化尝试----反馈采集向云端传输----云端二次矫正反馈----多次反复直到接近完善反馈并记录----云端形成大数据并不断优化、积累。
一种权利要求2所描述的方法，其特征在于，初始分配的内存虚拟化缓存按照最小大小分配，并在之后的优化过程中按服务器指令调整大小。
一种权利要求1所描述的方法，其特征在于，该方法还采用缓存分流，控制装置本身结合带有USB接口或Wigig连接的外接固态硬件，安装到装置时一并载入，在控制装置工作时提供额外的缓存预取用硬件，如4K读写缓存到虚拟化出的内存磁盘，512K以及随机读写缓存到外接固态硬件，实现缓存分流，而其对于不同应用采取不同的分流方案，这些分流方案云端服务器经过对上传的数据分析确定，即，在架构上采取了协同工作的三级结构：由大量终端的缓存预取控制装置作为一级加速装置，负责终端服务(虚拟化改造、缓存、预取等)以及贡献大数据，由云端服务器作为二级加速装置，负责优化方案计算与数据库索引迭代，由控制装置携带的USB接口或Wigig接口的外接固态硬件作为三级加速装置，负责为控制装置提供缓存分流。
一种依照权利要求1所述方法，其特征在于，控制装置本身担任新的服务节点，使加速装置网的服务能力随被加速设备的增多而增多，如，这些控制装置按照云端服务器的指令，为其他周边用户提供如cdn缓存、近距网络缓存、VPN服务、SMTP服务等网络或加速服务。
一种权利要求5所描述的方法，其特征在于，该装置本身也带有USB或Wigig连接的外接固态硬件，在装置工作时提供额外的缓存预取用硬件作为缓存分流，同时在开启服务节点模式时外接硬件提供所需的存储、网络组件等支持，即，在架构上采取了协同工作、并自我扩展的三级结构：由大量终端的缓存预取控制装置作为一级加速装置，负责终端服务(虚拟化改造、缓存、预取等)以及贡献大数据，由云端服务器作为二级加速装置，负责优化方案计算与数据库索引迭代，由控制装置携带的USB接口或Wigig接口的外接固态硬件作为三级加速装置，负责为控制装置提供缓存分流与硬件支持，并在节点模式下扩展被加速设备为新的服务节点。
一种权利要求1所描述的方法，其特征在于，控制装置与云端之间的上传下载的数据全部以加密的形式传递。
一种权利要求1所描述的方法，其特征在于，控制装置上传的数据还包括反映设备用户所属人群的特征数据，如用户年龄范围、职业范围、兴趣范围等，相应地，云端反馈的优化方案也包括针对不同用户类型对于不同应用对象的使用特征进行优化或预判的方案。
一种权利要求1所描述的方法，其特征在于，控制装置上传的数据还包括具体的缓存设备硬件类型或特征信息，相应的，在云端分析给出的优化方案并不是一个应用对应一份的，而是具体的、分类的，如在何种缓存结构上，对应某个应用应采用何种方案。
一种权利要求1所描述的方法，其特征在于，控制装置通过扫描系统注册表获得应用种类，扫描程序安装目录获得应用的文件数量、大小、读写特征，扫描系统本身的预取Prefetch目录、系统缓存和系统日志获得应用使用频率，扫描系统TEMP文件夹、收藏夹和浏览器缓存文件夹获得常访问网站并根据网站、网址、缓存文件推断用户所属用户类型特征，推断用户习惯，以及根据设备类型、年龄，以及设备上的应用分布，判断用户的职业、兴趣、年龄等(这些信息都为用户群体性的特征信息，装置既不需要也绝不获取任何用户本身的个人信息，且这些用户群体特征信息也全都会以加密的形式传递)。