CN109614132B - 一种文件预估方法和装置 - Google Patents
一种文件预估方法和装置 Download PDFInfo
- Publication number
- CN109614132B CN109614132B CN201811482882.4A CN201811482882A CN109614132B CN 109614132 B CN109614132 B CN 109614132B CN 201811482882 A CN201811482882 A CN 201811482882A CN 109614132 B CN109614132 B CN 109614132B
- Authority
- CN
- China
- Prior art keywords
- file
- estimated
- characteristic information
- information
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
- G06F8/658—Incremental updates; Differential updates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computer Security & Cryptography (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供了一种文件预估方法和装置,其中,所述方法包括:获取至少一个待预估文件;提取所述至少一个待预估文件的第一特征信息;根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;生成所述至少一个待预估文件的预估值。通过采用预设的预估模型进行文件大小预估,实现了补丁文件大小的自动预估,大大减少了人工干预的操作,避免人工预估数据和实际数据偏差较大的问题,提高了预估数据的准确率。
Description
技术领域
本发明涉及文件处理技术领域,特别是涉及一种文件预估方法和一种文件预估装置。
背景技术
随着计算机技术和移动应用技术的发展,游戏逐渐从PC端覆盖到手机端。其中,网络游戏作为一种特殊的计算机软件,版本更新维护非常频繁,而大部分的更新都是通过下载patch补丁文件完成的。patch补丁文件的原理是将游戏安装包中所要更新的文件,进行压缩加密,生成一个压缩包,然后用户的游戏客户端下载这个压缩包进行解压,从而完成对客户端的更新。对于手机端的游戏而言,由于流量费用、网络速度等因素限制,游戏产商会对游戏每次更新的patch补丁文件大小进行严格控制。所以在网络游戏开发的过程中,游戏patch补丁文件大小控制成为游戏开发的必要环节。
patch补丁文件大小控制,最直接有效的方式就是在制作阶段的patch补丁文件大小预估。patch补丁文件大小预估最常使用的方法是人工预估或者基于压缩率的计算。人工预估通常使用的方法是根据以往的经验,比如,同类型的文件转换成patch补丁文件大小,来预估本次新增或修改的这类资源占用的patch补丁大小。由于同类文件,文件大小本身存在差异,即使文件大小相同但文件内容不同,在转换成游戏patch补丁文件后,占用的大小通常也不相同。所以这种预估方式,存在预估数据和实际数据偏差较大的问题,从而造成实际的patch补丁文件严重偏离当初设定。
基于压缩率的预估方式,使用同种类型(例如,同一个后缀)文件转换成patch补丁文件之后的文件大小之和除以原始大小之和,从而算出一个压缩率。然后使用这个压缩率,乘以这种类型的新文件的大小,来预估转换成patch补丁文件之后的大小。这种预估方式,当转换成patch补丁文件之后的大小和原始文件的大小成正比的时候,非常有效。但很多时候,文件转换成patch补丁文件后的大小,并不和原始文件的大小成正比。所以这种预估方式,也存在很大的误差,很容易造成预估失效的问题。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种文件预估方法和一种文件预估装置。
为了解决上述问题,本发明实施例公开了一种文件预估方法,包括:
获取至少一个待预估文件;
提取所述至少一个待预估文件的第一特征信息;
根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
生成所述至少一个待预估文件的预估值。
优选的,所述第一特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息。
优选的,所述根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估的步骤之前,还包括:
根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
优选的,所述预设的预估模型通过如下方式生成:
获取多个历史文件;
提取各所述历史文件的第二特征信息和第三特征信息;
根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
优选的,所述第二特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息,所述第三特征信息包括打包后的大小信息。
优选的,所述采用所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型的步骤包括:
根据各所述历史文件的打包前的类型信息,确定各所述历史文件的类型;
根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
优选的,所述方法还包括:
展示所述至少一个待预估文件的预估值。
本发明实施例还公开了一种文件预估装置,包括:
待预估文件获取模块,用于获取至少一个待预估文件;
第一特征信息提取模块,用于提取所述至少一个待预估文件的第一特征信息;
文件预估模块,用于根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
预估值生成模块,用于生成所述至少一个待预估文件的预估值。
优选的,所述第一特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息。
优选的,所述装置还包括:
待预估文件类型确定模块,用于根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
模型适配模块,用于确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
优选的,所述预设的预估模型通过如下模块生成:
历史文件获取模块,用于获取多个历史文件;
第二特征信息提取模块,用于提取各所述历史文件的第二特征信息和第三特征信息;
预估模型训练模块,用于根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
优选的,所述第二特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息,所述第三特征信息包括打包后的大小信息。
优选的,所述预估模型训练模块包括:
第二类型确定子模块,用于根据各所述历史文件的打包前的类型信息,确定各所述历史文件的类型;
预估模型训练子模块,用于根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
优选的,所述装置还包括:
预估值展示模块,用于展示所述至少一个待预估文件的预估值。
本发明实施例还公开了一种装置,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如本发明实施例所述的一个或多个的文件预估方法。
本发明实施例还公开了一种计算机可读存储介质,其存储的计算机程序使得处理器执行如本发明实施例所述的一个或多个的文件预估方法。
本发明实施例包括以下优点:
在本发明实施例中,通过获取至少一个待预估文件,提取至少一个待预估文件的第一特征信息,根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估,生成至少一个待预估文件的预估值,采用预设的预估模型进行文件大小预估,实现了补丁文件大小的自动预估,大大减少了人工干预的操作,避免人工预估数据和实际数据偏差较大的问题,提高了预估数据的准确率。
附图说明
图1示出了本发明实施例的一种文件预估方法的步骤流程图;
图2示出了本发明实施例的一种文件预估的界面框图;
图3示出了本发明实施例的展示文件预估值的界面框图;
图4示出了本发明实施例的一种文件预估装置的结构框图;
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
参照图1,示出了本发明实施例的一种文件预估方法的步骤流程图,具体包括如下步骤:
步骤S101,获取至少一个待预估文件;
在本发明实施例中,一次游戏更新的patch补丁文件可以由一个或多个文件组成。
在进行文件大小预估时,用户可以选择多个文件进行预估,而不必进行多次预估,从而加快文件大小预估的速度。当然,用户也可以每次选择一个文件进行预估,将多次预估的结果相加获得最终的预估结果。
在具体实现中,patch补丁文件中的多个文件可能经过压缩或者拼接成为一个大文件。当用户选择一个大文件进行预估时,首先需要将该大文件解压缩为多个文件,或者将拼接的大文件分解为多个文件,再对多个文件进行预估。
如图2所示,用户可以点击“设置”按钮,进行待预估文件的路径选择,来获取至少一个待预估文件。
在本发明实施例中,针对一次游戏更新的patch补丁文件,在获取至少一个待预估文件之后,还可以选择进行文件大小预估的方式。
文件预估的方式可以包括本次修改patch和整个目录patch两种。例如,一个patch补丁文件夹下有a,b,c三个文件,而本次修改可能只改了文件a,那么可能需要预估文件a本身的patch补丁文件大小,也可能需要预估整个文件夹的patch补丁文件大小。当需要预估文件a本身的patch补丁文件大小时,则选择本次修改patch的方式进行文件预估;当需要预估整个文件夹的patch补丁文件大小时,则选择整个目录patch的方式进行文件预估。
在进行文件大小预估时,用户还可以点击“svn上传”按钮,记录当前用户上传的待预估文件的版本,方便游戏开发人员对patch补丁文件进行版本管理。
步骤S102,提取所述至少一个待预估文件的第一特征信息;
在本发明实施例中,可以查看获取的至少一个待预估文件的属性信息,从属性信息中提取至少一个待预估文件的第一特征信息。
其中,待预估文件的第一特征信息可以包括待预估文件打包前的大小信息、类型信息、路径信息、压缩比特征信息等。
类型信息可以包括文件类型信息和平台类型信息。
文件类型信息可以根据的文件的后缀确定,例如,py、txt、tga等。平台类型信息可以是文件所适用的平台的信息,例如,Windows、Android、iOS等,用于确定该待预估文件适用的平台。
路径信息可以指文件的存储位置。当选择的待预估文件为一个文件夹下所有的文件时,路径信息可以由盘符、文件夹名组成,例如,路径信息可以为:D:\G00\G00SVN\src\Package\Repository;当选择的待预估文件为一个文件夹下具体的某一个文件时,路径信息可以由盘符、文件夹名以及文件名组成,例如,路径信息可以为:D:\G00\G00SVN\src\Package\Repository\A003_proxy.local\resource.repository。
压缩比特征信息可以用于描述待预估文件中的图片的压缩比,例如,设置图片的长和宽各压缩四倍,那么一个像素大小为512*512的图片压缩之后,像素大小就是128*128,则图片的压缩比特征信息是4*4=16。
需要说明的是,当待预估文件中没有图片时,则获取到的压缩比特征信息为1。
步骤S103,根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
在本发明实施例中,通过建立机器模型的方式对待预估文件的大小进行文件预估,预设了用于进行预估的预估模型,可以直接根据一预设的预估模型对待预估文件的第一特征信息进行待预估文件的大小预估。
具体的,可以首先对所述至少一个待预估文件的第一特征信息进行向量化处理,获得所述至少一个待预估文件的特征向量信息,再将获得所述至少一个待预估文件的特征向量信息输入至预设的文件大小预估模型进行待预估文件的大小预估。
例如,可以将待预估文件打包前的大小信息、类型信息、路径信息、压缩比特征信息进行向量化处理,形成一个特征向量x,将多个待预估文件的特征向量组成一个特征向量组[x1,x2,x3…]。
步骤S104,生成所述至少一个待预估文件的预估值。
当获取的待预估文件有多个时,可以针对每一个待预估文件生成对应的预估值,将多个预估值求和获得补丁文件最终的预估值。
在本发明的一种优选实施例中,在步骤S103之前,可以包括如下子步骤:
子步骤S11,根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
不同类型的补丁文件适配的文件大小预估模型不同。
在进行文件大小预估之前,首先需要确定选择的待预估文件的类型,以便根据待预估文件的类型,选择对应类型的文件预估模型进行预估。
其中,可以根据待预估文件打包前的类型信息对待预估文件进行分类,例如,文件类型信息和/或平台类型信息的待预估文件归为一类。
作为一种示例,可以根据平台类型信息确定待预估文件的类型,例如待预估文件的类型可以为Windows、Android、iOS等,还可以根据文件类型信息确定待预估文件的类型,例如待预估文件的类型可以为py、txt、tga等,还可以根据文件类型信息和平台类型信息确定待预估文件的类型,例如,文件类型信息为txt,平台类型信息为Android,则待预估文件的类型可以为txt&Android。当然,待预估文件还可以包括其他的类型,本发明对此并不限制。
子步骤S12,确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
例如,Windows类型的待预估文件,则选择与Windows类型的待预估文件适配的预估模型,作为目标预估模型;Android类型的待预估文件,则选择与Android类型的待预估文件适配的预估模型,作为目标预估模型;iOS类型的待预估文件,则选择与iOS类型的待预估文件适配的预估模型,作为目标预估模型。
在本发明实施例中,在确定了用来对至少一个待预估文件进行文件大小预估的适配的预设的预估模型之后,可以将之前获取的所述至少一个待预估文件的第一特征信息输入至所述适配的预设的预估模型,以通过适配的预设的预估模型对所述至少一个待预估文件进行文件大小预估。
在本发明的一种优选实施例中,所述预设的文件大小预估模型可以通过如下步骤生成:
子步骤S21,获取多个历史文件;
在具体实现中,可以以多个历史文件为样本数据,进行模型训练,获得文件大小预估模型。
历史文件可以是之前进行过patch文件压缩打包的游戏更新文件,包括游戏更新文件的原始文件和进行patch文件压缩打包后的游戏更新文件。
子步骤S22,提取各所述历史文件的第二特征信息和第三特征信息;
在本发明实施例中,可以查看历史文件的属性信息,从属性信息中提取历史文件的第二特征信息和第三特征信息。
其中,所述第二特征信息可以包括历史文件打包前的大小信息、类型信息、路径信息、压缩比特征信息;所述第三特征信息可以包括历史文件打包后的大小信息。
子步骤S23,根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
在本发明的一种优选实施例中,步骤S23可以包括如下子步骤:
子步骤S231,根据各历史文件打包前的类型信息,确定各所述历史文件的类型;
子步骤S232,根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
由于大小相同,而类型不同的补丁文件,对其进行打包后的大小是不同的。在本发明实施例中,对各历史文件进行分类,针对不同类型的历史文件生成不同的预估模型。
具体的,可以通过机器学习的方法,采用所述第二特征信息和所述第三特征信息进行训练,以获得预估模型。
例如,该机器学习的方法可以包括SVM(Support Vector Machine,支持向量机)、Adaboost等等。
在机器学习领域中,SVM是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。
SVM的思想可以概括为两点:
(1)它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;
(2)它基于结构风险最小化理论之上在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。
adaboost是一种迭代算法,其可以针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
adaboost本身可以通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用adaboost分类器可以排除一些不必要的训练数据特征,并放在关键的训练数据上面。
当然,上述训练方式只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他训练方式,本发明实施例对此不加以限制。另外,除了上述训练方式外,本领域技术人员还可以根据实际需要采用其它训练方式,本发明实施例对此也不加以限制。
在本发明的一种优选实施例中,在生成所述至少一个待预估文件的预估值的步骤之后,还可以包括如下步骤:
展示所述至少一个待预估文件的预估值。
其中,可以通过文本的形式展示预估值。根据需要,本领域技术人员还可以选择其他方式展示预估值,本发明实施例对此并不限制。
当进行预估的文件有多个时,可以展示多个文件的预估值,和该多个预估值求和后的总预估值。
本发明的一个示例中,用户可以选择两个文件进行预估,例如,文件A(D:\G00\G00SVN\src\package\Repository\A003_proxy.local/Texture/93/)和文件U(D:\G00\G00SVN\src\package\Repository\A003_proxy.local/Texture/c3/),对文件A和文件U进行patch补丁文件大小预估之后,分别生成针对不同系统版本的预估值,例如,Windows系统,IOS系统,Android系统等。分别将对应不同系统版本的预估值求和,则获得patch补丁文件最终的预估值。
如图3所示,文件A对应的低端安卓版本(即:android_low)的预估值为:14.509KB,文件U对应的低端安卓版本(即:android_low)的预估值为:121.413KB,对两个预估值进行求和运算:14.509KB+121.413KB=135.922KB,则135.922KB即为本次针对android_low版本系统版本的预估值。
在本发明实施例中,通过获取至少一个待预估文件,提取至少一个待预估文件的第一特征信息,根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估,生成至少一个待预估文件的预估值,采用预设的预估模型进行文件大小预估,实现了补丁文件大小的自动预估,大大减少了人工干预的操作,避免人工预估数据和实际数据偏差较大的问题,提高了预估数据的准确率。
参照图4,示出了本发明实施例的一种文件预估装置的结构框图,所述装置具体可以包括如下模块:
待预估文件获取模块401,用于获取至少一个待预估文件;
第一特征信息提取模块402,用于提取所述至少一个待预估文件的第一特征信息;
文件大小预估模块403,用于根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
预估值生成模块404,用于生成所述至少一个待预估文件的预估值。
在本发明的一种优选实施例中,所述第一特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
待预估文件类型确定模块,用于根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
模型适配模块,用于确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
在本发明的一种优选实施例中,所述预设的文件大小预估模型通过如下模块生成:
历史文件获取模块,用于获取多个历史文件;
第二特征信息提取模块,用于提取各所述历史文件的第二特征信息和第三特征信息;
预估模型训练模块,用于根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
在本发明的一种优选实施例中,所述第二特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息,所述第三特征信息包括打包后的大小信息。
在本发明的一种优选实施例中,所述预估模型训练模块可以包括如下子模块:
第二类型确定子模块,用于根据各所述历史文件的打包前的类型信息,确定各所述历史文件的类型;
预估模型训练子模块,用于根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
在本发明的一种优选实施例中,所述装置还可以包括如下模块:
预估值展示模块,用于展示所述至少一个待预估文件的预估值。
在本发明实施例中,通过待预估文件获取模块获取至少一个待预估文件,第一特征信息提取模块提取至少一个待预估文件的第一特征信息,文件预估模块根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估,预估值生成模块生成至少一个待预估文件的预估值,采用预设的预估模型进行文件大小预估,实现了补丁文件大小的自动预估,大大减少了人工干预的操作,避免人工预估数据和实际数据偏差较大的问题,提高了预估数据的准确率。
对于文件预估装置实施例而言,由于其与文件预估方法实施例基本相似,所以描述的比较简单,相关之处参见文件预估方法实施例的部分说明即可。
本发明实施例还提供了一种装置,包括:
一个或多个处理器;和
其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述装置执行如本发明实施例所述的一个或多个的文件预估方法。
本发明实施例还提供了一种计算机可读存储介质,其存储的计算机程序使得处理器执行如本发明实施例所述的一个或多个的文件预估方法。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
以上对本发明所提供的一种文件预估方法和一种文件预估装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
Claims (12)
1.一种文件预估方法,其特征在于,包括:
获取至少一个待预估文件;
提取所述至少一个待预估文件的第一特征信息;其中,所述第一特征信息指用于描述所述待预估文件的属性信息;
根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
生成所述至少一个待预估文件的预估值;
其中,所述预设的预估模型通过如下方式生成:
获取多个历史文件;
提取各所述历史文件的第二特征信息和第三特征信息;所述第二特征信息包括所述历史文件打包前的类型信息和大小信息;所述第三特征信息包括所述历史文件打包后的大小信息;
根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
2.根据权利要求1所述的方法,其特征在于,所述第一特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息。
3.根据权利要求2所述的方法,其特征在于,所述根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估的步骤之前,还包括:
根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
4.根据权利要求1所述的方法,其特征在于,所述第二特征信息还包括打包前的路径信息、压缩比特征信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型的步骤包括:
根据各所述历史文件的打包前的类型信息,确定各所述历史文件的类型;
根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
6.根据权利要求1或2或3所述的方法,其特征在于,还包括:
展示所述至少一个待预估文件的预估值。
7.一种文件预估装置,其特征在于,包括:
待预估文件获取模块,用于获取至少一个待预估文件;
第一特征信息提取模块,用于提取所述至少一个待预估文件的第一特征信息;其中,所述第一特征信息指用于描述所述待预估文件的属性信息;
文件预估模块,用于根据一预设的预估模型对所述至少一个待预估文件的第一特征信息进行所述待预估文件的大小预估;
预估值生成模块,用于生成所述至少一个待预估文件的预估值;
其中,所述预设的预估模型通过如下模块生成:
历史文件获取模块,用于获取多个历史文件;
第二特征信息提取模块,用于提取各所述历史文件的第二特征信息和第三特征信息;所述第二特征信息包括所述历史文件打包前的类型信息和大小信息;所述第三特征信息包括所述历史文件打包后的大小信息;
预估模型训练模块,用于根据所述第二特征信息和所述第三特征信息进行训练,以生成所述预估模型。
8.根据权利要求7所述的装置,其特征在于,所述第一特征信息包括打包前的大小信息、类型信息、路径信息、压缩比特征信息。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
待预估文件类型确定模块,用于根据所述至少一个待预估文件的打包前的类型信息,确定所述至少一个待预估文件的类型;
模型适配模块,用于确定与所述至少一个待预估文件的类型适配的一预设的预估模型。
10.根据权利要求7所述的装置,其特征在于,所述第二特征信息还包括打包前的路径信息、压缩比特征信息。
11.根据权利要求10所述的装置,其特征在于,所述预估模型训练模块包括:
第二类型确定子模块,用于根据各所述历史文件的打包前的类型信息,确定各所述历史文件的类型;
预估模型训练子模块,用于根据同一类型的历史文件的所述第二特征信息和所述第三特征信息进行训练,以生成针对该类型文件的预估模型。
12.根据权利要求7或8或9所述的装置,其特征在于,还包括:
预估值展示模块,用于展示所述至少一个待预估文件的预估值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811482882.4A CN109614132B (zh) | 2018-12-05 | 2018-12-05 | 一种文件预估方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811482882.4A CN109614132B (zh) | 2018-12-05 | 2018-12-05 | 一种文件预估方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109614132A CN109614132A (zh) | 2019-04-12 |
CN109614132B true CN109614132B (zh) | 2022-04-26 |
Family
ID=66006525
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811482882.4A Active CN109614132B (zh) | 2018-12-05 | 2018-12-05 | 一种文件预估方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109614132B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112604300B (zh) * | 2020-12-29 | 2023-07-21 | 珠海金山数字网络科技有限公司 | 更新包生成方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049452A (zh) * | 2011-10-14 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 一种基于预估下载率进行应用排序的方法与设备 |
CN103546646A (zh) * | 2013-10-31 | 2014-01-29 | Tcl通讯(宁波)有限公司 | 一种移动终端相机预览时照片文件大小的预测方法及系统 |
CN104252531A (zh) * | 2014-09-11 | 2014-12-31 | 北京优特捷信息技术有限公司 | 一种文件类型识别方法及装置 |
CN107315955A (zh) * | 2016-04-27 | 2017-11-03 | 百度在线网络技术(北京)有限公司 | 文件安全性识别方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080021692A1 (en) * | 2006-07-21 | 2008-01-24 | Rajat Chaudhry | Method for performing power simulations on complex designs running complex software applications |
-
2018
- 2018-12-05 CN CN201811482882.4A patent/CN109614132B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103049452A (zh) * | 2011-10-14 | 2013-04-17 | 百度在线网络技术(北京)有限公司 | 一种基于预估下载率进行应用排序的方法与设备 |
CN103546646A (zh) * | 2013-10-31 | 2014-01-29 | Tcl通讯(宁波)有限公司 | 一种移动终端相机预览时照片文件大小的预测方法及系统 |
CN104252531A (zh) * | 2014-09-11 | 2014-12-31 | 北京优特捷信息技术有限公司 | 一种文件类型识别方法及装置 |
CN107315955A (zh) * | 2016-04-27 | 2017-11-03 | 百度在线网络技术(北京)有限公司 | 文件安全性识别方法和装置 |
Non-Patent Citations (1)
Title |
---|
"基于特征学习的广告点击率预估技术研究";张志强等;《计算机学报》;20160430;第780-793页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109614132A (zh) | 2019-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111144937B (zh) | 广告素材确定方法、装置、设备及存储介质 | |
US11907675B2 (en) | Generating training datasets for training neural networks | |
CN111046188A (zh) | 用户偏好度确定方法、装置、电子设备及可读存储介质 | |
JP7069029B2 (ja) | 自動予測システム、自動予測方法および自動予測プログラム | |
CN105488049A (zh) | 网页图像解析方法、装置及浏览器 | |
CN114580794B (zh) | 数据处理方法、装置、程序产品、计算机设备和介质 | |
CN109614132B (zh) | 一种文件预估方法和装置 | |
CN110942090A (zh) | 模型训练、图像处理方法、装置、电子设备及存储介质 | |
CN112527676A (zh) | 模型自动化测试方法、装置及存储介质 | |
CN112035325A (zh) | 文本机器人自动监控方法及装置 | |
CN114187486A (zh) | 模型训练方法及相关设备 | |
JP2022125904A (ja) | クラウドサービス評価装置及びクラウドサービス評価方法 | |
CN114092162B (zh) | 推荐质量确定方法、推荐质量确定模型的训练方法及装置 | |
CN114580533A (zh) | 特征提取模型的训练方法、装置、设备、介质及程序产品 | |
CN114925750A (zh) | 信息推荐方法、装置、计算机可读存储介质及电子设备 | |
CN113781236A (zh) | 基金产品推荐方法、装置、电子设备及存储介质 | |
CN112801053A (zh) | 视频数据处理方法、装置 | |
WO2020175162A1 (ja) | 需要予測装置、需要予測方法及びプログラム | |
JP2021149893A (ja) | ニューラルネット解析装置、ニューラルネット解析方法及びプログラム | |
WO2013141018A1 (ja) | 最適システム設計支援装置 | |
US11977869B2 (en) | Two-phase application development device | |
US11403072B1 (en) | Mobile application development device | |
WO2022044314A1 (ja) | 学習装置、学習方法および学習プログラム | |
CN114417979A (zh) | 一种类别识别方法、装置、电子设备及可读存储介质 | |
Sharma et al. | An Approach for Predicting Admissions in Post-Graduate Programme by Using Machine Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |