CN111797076A - 数据清理方法、装置、存储介质及电子设备 - Google Patents
数据清理方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN111797076A CN111797076A CN201910282135.4A CN201910282135A CN111797076A CN 111797076 A CN111797076 A CN 111797076A CN 201910282135 A CN201910282135 A CN 201910282135A CN 111797076 A CN111797076 A CN 111797076A
- Authority
- CN
- China
- Prior art keywords
- data
- user
- information
- user behavior
- behavior model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004140 cleaning Methods 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000003860 storage Methods 0.000 title claims abstract description 22
- 230000006399 behavior Effects 0.000 claims description 104
- 238000012986 modification Methods 0.000 claims description 40
- 230000004048 modification Effects 0.000 claims description 40
- 239000013598 vector Substances 0.000 claims description 40
- 230000015654 memory Effects 0.000 claims description 30
- 238000003062 neural network model Methods 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 14
- 230000000306 recurrent effect Effects 0.000 claims description 13
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 238000013145 classification model Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 description 15
- 230000008447 perception Effects 0.000 description 14
- 230000008569 process Effects 0.000 description 13
- 238000012545 processing Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000010354 integration Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000001133 acceleration Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000013501 data transformation Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000005355 Hall effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/283—Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
Abstract
本申请公开了一种数据清理方法,包括:记录电子设备在第一预设时间段内的历史使用信息,根据历史使用信息进行特征建模,以得到用户行为模型,将用户行为模型发送至服务器,并接收服务器根据用户行为模型生成的分类信息,根据分类信息对电子设备中的数据进行清理。本申请还提供一种数据清理装置、存储介质和电子设备。
Description
技术领域
本申请属于电子设备技术领域,尤其涉及一种数据清理方法、装置、存储介质及电子设备。
背景技术
随着电子技术的发展,诸如智能手机等电子设备的智能化程度越来越高。电子设备可以通过各种各样的算法模型来进行数据处理,从而为用户提供各种功能。例如,电子设备可以根据算法模型对用户的行为特征进行学习,从而为用户提供个性化的服务。
现有技术当中,对电子设备垃圾清理整理方案大致分为以下几个类型:1.系统自动、定时地对黑白名单中的垃圾文件进行清理;2.扫描系统中的碎片化文件进行清理;3.系统对垃圾文件、垃圾内存、垃圾安装包、广告垃圾,卸载残留文件进行清理。4.系统对空白文件夹进行清理。
上述方案实际上在具体技术实施过程中,一般采用正则表达式匹配垃圾文件或者碎片化文件的关键词;另外也会大量使用黑白名单,明确哪些文件夹或者文件不能删掉,哪些是常规垃圾文件需要经常清理。但是上述两种技术方案都是使用人工配对方式,需要大量的对磁盘文件进行研究和探索,另外一方面当增加新的应用或者系统记性更新后,会出现新的需要被删掉的规则或者不明确的文件夹,因此会造成人工资源上的继续投入。最重要的是上述方案并没有办法根据用户的行为习惯进行终端垃圾清理,例如某些用户在相似的照片中只喜欢某一张,其余看作垃圾文件,又例如某些用户认为模糊的照片是垃圾照片,只留下清晰的照片。针对不同用户对垃圾文件的定义不同,本申请实施例可以通过全景感知技术学习电子设备用户对垃圾清理的行为习惯,给出更好的垃圾清理方案。
发明内容
本申请提供一种数据清理方法、装置、存储介质及电子设备,可以提升数据清理的效率和准确性。
第一方面,本申请实施例提供一种数据清理方法,包括:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
第二方面,本申请实施例提供一种数据清理装置,包括:记录模块、建模模块、发送模块以及清理模块;
所述记录模块,用于记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
所述建模模块,用于根据所述历史使用信息进行特征建模,以得到用户行为模型;
所述发送模块,用于将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
所述清理模块,用于根据所述分类信息对所述电子设备中的数据进行清理。
第三方面,本申请实施例提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的数据清理方法。
第四方面,本申请实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述存储器中的指令用于执行以下步骤:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
本申请实施例提供的数据清理方法可以记录电子设备在第一预设时间段内的历史使用信息,历史使用信息包括用户针对电子设备中存储数据的修改记录,根据历史使用信息进行特征建模,以得到用户行为模型,将用户行为模型发送至服务器,并接收服务器根据用户行为模型生成的分类信息,根据分类信息对电子设备中的数据进行清理。本申请可以对用户的历史行为习惯进行记录,并对行为习惯进行数学建模,得到用户的数据清理的场景特征,并根据得到的用户相关数据清理的场景特征,对用户进行分类得到用户分类信息,根据该分类信息自动清理数据,可以提升数据清理的效率和准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的数据清理方法的应用场景示意图。
图2为本申请实施例提供的数据清理方法的一种流程示意图。
图3为本申请实施例提供的数据清理方法的另一流程示意图。
图4为本申请实施例提供的数据清理装置的一种结构示意图。
图5为本申请实施例提供的数据清理装置的另一结构示意图。
图6为本申请实施例提供的电子设备的结构示意图。
图7为本申请实施例提供的电子设备的另一结构示意图。
具体实施方式
请参照图式,其中相同的组件符号代表相同的组件,本申请的原理是以实施在一适当的运算环境中来举例说明。以下的说明是基于所例示的本申请具体实施例,其不应被视为限制本申请未在此详述的其它具体实施例。
在以下的说明中,本申请的具体实施例将参考由一部或多部计算机所执行的步骤及符号来说明,除非另有述明。因此,这些步骤及操作将有数次提到由计算机执行,本文所指的计算机执行包括了由代表了以一结构化型式中的数据的电子信号的计算机处理单元的操作。此操作转换该数据或将其维持在该计算机的内存系统中的位置处,其可重新配置或另外以本领域测试人员所熟知的方式来改变该计算机的运作。该数据所维持的数据结构为该内存的实体位置,其具有由该数据格式所定义的特定特性。但是,本申请原理以上述文字来说明,其并不代表为一种限制,本领域测试人员将可了解到以下所述的多种步骤及操作亦可实施在硬件当中。
本申请中的术语“第一”、“第二”和“第三”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是某些实施例还包括没有列出的步骤或模块,或某些实施例还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
参考图1,图1为本申请实施例提供的数据清理方法的应用场景示意图。所述数据清理方法应用于电子设备。所述电子设备中设置有全景感知架构。所述全景感知架构为电子设备中用于实现所述数据清理方法的硬件和软件的集成。
其中,全景感知架构包括信息感知层、数据处理层、特征抽取层、情景建模层以及智能服务层。
信息感知层用于获取电子设备自身的信息或者外部环境中的信息。所述信息感知层可以包括多个传感器。例如,所述信息感知层包括距离传感器、磁场传感器、光线传感器、加速度传感器、指纹传感器、霍尔传感器、位置传感器、陀螺仪、惯性传感器、姿态感应器、气压计、心率传感器等多个传感器。
其中,距离传感器可以用于检测电子设备与外部物体之间的距离。磁场传感器可以用于检测电子设备所处环境的磁场信息。光线传感器可以用于检测电子设备所处环境的光线信息。加速度传感器可以用于检测电子设备的加速度数据。指纹传感器可以用于采集用户的指纹信息。霍尔传感器是根据霍尔效应制作的一种磁场传感器,可以用于实现电子设备的自动控制。位置传感器可以用于检测电子设备当前所处的地理位置。陀螺仪可以用于检测电子设备在各个方向上的角速度。惯性传感器可以用于检测电子设备的运动数据。姿态感应器可以用于感应电子设备的姿态信息。气压计可以用于检测电子设备所处环境的气压。心率传感器可以用于检测用户的心率信息。
数据处理层用于对信息感知层获取到的数据进行处理。例如,数据处理层可以对信息感知层获取到的数据进行数据清理、数据集成、数据变换、数据归约等处理。
其中,数据清理是指对信息感知层获取到的大量数据进行清理,以剔除无效数据和重复数据。数据集成是指将信息感知层获取到的多个单维度数据集成到一个更高或者更抽象的维度,以对多个单维度的数据进行综合处理。数据变换是指对信息感知层获取到的数据进行数据类型的转换或者格式的转换等,以使变换后的数据满足处理的需求。数据归约是指在尽可能保持数据原貌的前提下,最大限度的精简数据量。
特征抽取层用于对数据处理层处理后的数据进行特征抽取,以提取所述数据中包括的特征。提取到的特征可以反映出电子设备自身的状态或者用户的状态或者电子设备所处环境的环境状态等。
其中,特征抽取层可以通过过滤法、包装法、集成法等方法来提取特征或者对提取到的特征进行处理。
过滤法是指对提取到的特征进行过滤,以删除冗余的特征数据。包装法用于对提取到的特征进行筛选。集成法是指将多种特征提取方法集成到一起,以构建一种更加高效、更加准确的特征提取方法,用于提取特征。
情景建模层用于根据特征抽取层提取到的特征来构建模型,所得到的模型可以用于表示电子设备的状态或者用户的状态或者环境状态等。例如,情景建模层可以根据特征抽取层提取到的特征来构建关键值模型、模式标识模型、图模型、实体联系模型、面向对象模型等。
智能服务层用于根据情景建模层所构建的模型为用户提供智能化的服务。例如,智能服务层可以为用户提供基础应用服务,可以为电子设备进行系统智能优化,还可以为用户提供个性化智能服务。
此外,全景感知架构中还可以包括多种算法,每一种算法都可以用于对数据进行分析处理,所述多种算法可以构成算法库。例如,所述算法库中可以包括马尔科夫算法、隐含狄里克雷分布算法、贝叶斯分类算法、支持向量机、K均值聚类算法、K近邻算法、条件随机场、残差网络、长短期记忆网络、卷积神经网络、循环神经网络等算法。
本申请实施例提供一种数据清理方法,该数据清理方法的执行主体可以是本申请实施例提供的数据清理装置,或者集成了该数据清理装置的电子设备,其中该数据清理装置可以采用硬件或者软件的方式实现。
本申请实施例将从数据清理装置的角度进行描述,该数据清理装置具体可以集成在电子设备中。该数据清理方法包括:记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
一实施例中,记录电子设备在第一预设时间段内的历史使用信息,包括:
当用户对所述电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息;
根据所述操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
一实施例中,根据所述历史使用信息进行特征建模,以得到用户行为模型,包括:
在所述非关系型数据库当中提取词序列;
通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列;
根据所述向量序列生成用户行为模型。
一实施例中,根据所述向量序列生成用户行为模型,包括:
根据所述向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型。
一实施例中,将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息,包括:
获取所述用户行为模型的特征信息;
将所述特征信息发送至服务器,并接收所述服务器根据所述特征信息和分类模型生成的分类信息。
一实施例中,根据所述分类信息对所述电子设备中的数据进行清理,包括:
根据所述分类信息确定数据清理的频率信息;
根据所述频率信息对所述电子设备中的数据进行清理。
一实施例中,根据所述分类信息对所述电子设备中的数据进行清理,包括:
根据所述分类信息确定数据清理的目标数据类型;
根据所述目标数据类型对所述电子设备中的数据进行清理。
请参阅图2,图2为本申请实施例提供的数据清理方法的流程示意图。本申请实施例提供的数据清理方法应用于电子设备,具体流程可以如下:
步骤101,记录电子设备在第一预设时间段内的历史使用信息,历史使用信息包括用户针对电子设备中存储数据的修改记录。
在一实施例中,电子设备可以实时记录用户的使用信息,该使用信息包括用户针对电子设备中存储数据的修改记录。比如,在用户使用电子设备的过程中,可以通过诸如文件管理器等工具对电子设备上存储的数据文件进行修改,上述对数据的修改可以包括删除、命名、修改路径等等。
其中,对电子设备中存储数据的修改包括用户指令下修改和非用户指令下的修改,非用户指令下的修改是指设备由应用程序控制所进行的修改,比如在安装应用程序时电子设备会自动生成新的文件夹,或者在卸载应用程序时自动删除文件夹等等,而用户指令下的修改则是指根据用户的指令对文件进行的删除、更改路径等修改,本申请实施例中所针对的是电子设备根据用户指令对其上存储的数据所进行的的修改。
在一实施例中,上述用户针对电子设备中存储数据的修改记录可以为删除记录,比如删除重复性文件、删除重复图片、删除模糊图片、删除碎片文件、删除无用的文件等等。其中,上述历史使用信息用于对用户针对数据的清理习惯进行判断,因此可以获取较长一段时间的历史使用信息,以提高判断的准确性,比如上述第一预设时间段可以为二十天或者三十天等等,该第一预设时间段也可以由用户根据需求自行设定,本申请对此不做进一步限定。
步骤102,根据历史使用信息进行特征建模,以得到用户行为模型。
本申请实施例中,电子设备系统中的全景感知架构可以对用户修改数据的历史使用信息进行特征建模,分析用户的修改方案属性,得到用户的行为模型。具体的,全景感知架构在获取到用户修改数据的历史使用信息后,提取该历史使用信息当中的关键信息,比如可以将修改数据的操作类型和数据类型当作上述关键信息,然后将上述关键信息通过预先配置的词嵌入模型进行转换,转换后得到上述每个关键信息对应的向量。接着使用全景感知架构当中预置的神经网络模型,将上述词嵌入模型转换的向量作为输入和输出,以对该神经网络模型进行训练,从而得到对历史使用信息进行学习的个性化用户行为模型。
其中,词嵌入模型配置于电子设备当中,从而使得电子设备可以通过该词嵌入模型将接收到的信息转换为向量序列,以将该转换后的向量序列输入至神经网络模型,对该神经网络模型进行训练。在一实施例中,上述神经网络模型可以为循环神经网络模型(Recurrent neural Network,RNN),循环神经网络当作自编码器使用,经过对用户的数据学习得到用户的个性化行为模型特性。
需要说明的是,上述自动编码器是数据相关的(data-specific或data-dependent),即自动编码器只能压缩那些与训练数据类似的数据。自动编码器是从数据样本中自动学习的,这意味着很容易对指定类的输入训练出一种特定的编码器,而不需要完成任何新工作。自编码器经过训练后能尝试将输入复制到输出。自编码器(autoencoder)内部有一个隐藏层h,可以产生编码(code)表示输入。该网络可以看作由两部分组成:一个由函数h=f(x)表示的编码器和一个生成重构的解码器r=g(h)。
步骤103,将用户行为模型发送至服务器,并接收服务器根据用户行为模型生成的分类信息。
在一实施例中,将上述用户行为模型上传至云端服务器,利用云端服务器中的全景感知架构进行用户群体的分类,以得到用户分类信息,然后再发送至电子设备。具体的,可以将步骤102获取到的用户行为模型特征上传至服务器,然后根据服务器中的有监督分类模型算法,其用户行为模型特征作为输入,输出得到用户群体的分类。
在一实施例中,可以根据用户整理数据的数据类型对用户进行分类,比如上述分类可以包括习惯整理图片的第一用户分类、习惯整理文件夹的第二用户分类、习惯整理碎片文件的第三用户分类等等。
步骤104,根据分类信息对电子设备中的数据进行清理。
在一实施例中,电子设备当中可以预设多种数据清理方案,分别与多种预设的用户分类一一对应,比如当电子设备接收到的用户分类信息为习惯整理图片的第一用户分类时,电子设备可以对电子设备中存储的图片进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理文件夹的第二用户分类时,电子设备可以对电子设备中存储的文件夹进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理碎片文件的第三用户分类时,电子设备可以对电子设备中存储的碎片文件进行清理,而忽略其他类型的数据等。
在一实施例中,步骤101当中的历史使用信息可以为用户针对电子设备中存储的图片的删除记录,当用户对设备中的图片进行删除时,记录所要删除的图片的类型,然后进行特征建模并由服务器生成分类信息,该分类信息表明了用户针对图片删除时的行为习惯,比如某些用户在相似的照片中只喜欢某一张,其余看作垃圾图片,又比如某些用户认为模糊的照片是垃圾图片,只留下清晰的图片等。针对不同用户对垃圾文件的定义不同,系统可以通过全景感知技术学习电子设备用户对数据清理的行为习惯,给出更好的数据清理方案。
在实际使用当中,本申请实施例提供的数据清理方法可以根据用户习惯自动对设备中的垃圾数据进行清理,避免垃圾数据占用存储空间,可以提高电子设备的利用率。在一实施例中,还可以设置一个开关,在电子设备当前剩余存储空间较少时进行开启,否则关闭该功能。比如可以获取电子设备当前的剩余存储空间,判断该剩余存储空间是否小于预设值,若是,则执行根据分类信息对电子设备中的数据进行清理的步骤。
由上可知,本申请实施例提供的数据清理方法可以记录电子设备在第一预设时间段内的历史使用信息,历史使用信息包括用户针对电子设备中存储数据的修改记录,根据历史使用信息进行特征建模,以得到用户行为模型,将用户行为模型发送至服务器,并接收服务器根据用户行为模型生成的分类信息,根据分类信息对电子设备中的数据进行清理。本申请可以对用户的历史行为习惯进行记录,并对行为习惯进行数学建模,得到用户的数据清理的场景特征,并根据得到的用户相关数据清理的场景特征,对用户进行分类得到用户分类信息,根据该分类信息自动清理数据,可以提升数据清理的效率和准确性。
下面将在上述实施例描述的方法基础上,对本申请的清理方法做进一步介绍。参阅图3,图3为本申请实施例提供的数据清理方法的另一流程示意图,该数据清理方法包括:
步骤201,当用户对电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息。
在一实施例中,电子设备可以实时记录用户的使用信息,该使用信息包括用户针对电子设备中存储数据的修改记录。比如,在用户使用电子设备的过程中,可以通过诸如文件管理器等工具对电子设备上存储的数据文件进行修改,上述对数据的修改可以包括删除、命名、修改路径等,比如修改文件夹路径、删除重复性文件、删除重复图片、删除模糊图片、删除碎片文件、删除无用的文件等。其中,上述对数据进行修改,可以记录当前的操作类型、数据地址以及数据类型信息。比如操作类型删除删除,数据地址为删除的数据的路径信息,数据类型为重复的图片。
步骤202,根据操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
在一实施例中,可以将上述操作使用noSQL数据库形式保存下来,具体的,首先获取当前操作类型、数据地址以及数据类型信息,操作类型可以作为noSQL的key,数据地址作为value,数据类型作为comment,比如如删除模糊图片的存储格式可以为:{key:delete,value:/sdcard/CDIM/myPhoto.jpg,comment:blurry}。
步骤203,在非关系型数据库当中提取词序列。
在一实施例中,全景感知架构在收集到用户针对存储数据的操作记录后,可以提取其中的关键信息,比如提取上述非关系型数据库当中的key和comment,作为词序列,以作为预先配置好的词嵌入算法的输入。具体的,在收集到操作记录后,可以对该操作记录进行分词,以得到分词后的词序列。
步骤204,通过预先配置的词嵌入模型对词序列进行转换,生成对应的向量序列。
其中,词嵌入模型配置于电子设备当中,从而使得电子设备可以通过该词嵌入模型将接收到的词序列转换为向量序列。在一实施例中,电子设备可以通过预先训练的词嵌入模型,将词序列转换成向量序列,具体可以包括:依据词表确定词序列中的各词对应的第一词向量;通过词嵌入模型将各词对应的第一词向量转换为第二词向量;最后采用各词对应的第二词向量生成向量序列。
需要说明的是,上述词嵌入模型可以为一个X×Y的矩阵,X可以作为转换后维度,Y可以作为转换前维度。本申请实施例可以依据词表的大小配置转换前维度Y,转换后维度X通常可以小于转换前维度Y,从而使得有用的信息可以用更加紧凑的形式来表示,方便处理。
步骤205,根据向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型。
将该转换后的向量序列输入至神经网络模型,对该神经网络模型进行训练。在一实施例中,上述神经网络模型可以为循环神经网络模型,循环神经网络当作自编码器使用,将上述生成的向量序列作为输入和输出,以对该循环神经网络模型进行训练,经过对用户的数据学习得到用户的个性化行为模型特性。
步骤206,获取用户行为模型的特征信息,将特征信息发送至服务器,并接收服务器根据特征信息和分类模型生成的分类信息。
其中,将步骤205中提取得到的用户行为模型特征上传云端服务器,然后利用全景感知的有监督分类模型算法,其用户行为模型特征作为输入,输出得到用户群体的分类。
在一实施例中,可以根据用户整理数据的数据类型对用户进行分类,比如上述分类可以包括习惯整理图片的第一用户分类、习惯整理文件夹的第二用户分类、习惯整理碎片文件的第三用户分类等等。
步骤207,根据分类信息对电子设备中的数据进行清理。
在一实施例中,电子设备当中可以预设多种数据清理方案,分别与多种预设的用户分类一一对应,比如当电子设备接收到的用户分类信息为习惯整理图片的第一用户分类时,电子设备可以对电子设备中存储的图片进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理文件夹的第二用户分类时,电子设备可以对电子设备中存储的文件夹进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理碎片文件的第三用户分类时,电子设备可以对电子设备中存储的碎片文件进行清理,而忽略其他类型的数据等。
在一实施例中,如果用户定期或是频繁的去清理数据或修改数据的存储路径信息,则可以减少电子设备自动清理数据的频率,留给用户更多的选项自行进行清理。也即根据所述分类信息对所述电子设备中的数据进行清理,包括:
根据所述分类信息确定数据清理的频率信息;
根据所述频率信息对所述电子设备中的数据进行清理。
在一实施例中,若用户在清理照片时,在相似的照片中只喜欢某一张,其余看作垃圾文件并删除,则电子设备可以针对相似度较高的照片进行清理;若用户认为模糊的照片是垃圾照片,只留下清晰的照片,则电子设备可以针对照片的质量(比如噪点、清晰度等)对质量较低的照片进行清理。也即根据所述分类信息对所述电子设备中的数据进行清理,包括:
根据所述分类信息确定数据清理的目标数据类型;
根据所述目标数据类型对所述电子设备中的数据进行清理。
因此本申请实施例针对不同用户对垃圾文件的定义不同,系统可以通过全景感知技术学习电子设备用户对垃圾清理的行为习惯,给出更好的垃圾清理方案。
由上可知,本申请实施例提供的数据清理方法可以当用户对电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息,根据操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存,在非关系型数据库当中提取词序列,通过预先配置的词嵌入模型对词序列进行转换,生成对应的向量序列,根据向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型,获取用户行为模型的特征信息,将特征信息发送至服务器,并接收服务器根据特征信息和分类模型生成的分类信息,根据分类信息对电子设备中的数据进行清理。本申请可以对用户的历史行为习惯进行记录,并对行为习惯进行数学建模,得到用户的数据清理的场景特征,并根据得到的用户相关数据清理的场景特征,对用户进行分类得到用户分类信息,根据该分类信息自动清理数据,可以提升数据清理的效率和准确性。
本申请实施例还提供一种神经网络模型,比如为循环神经网络模型,用于在电子设备记录电子设备在第一预设时间段内的历史使用信息后,根据所述历史使用信息进行特征建模,以得到用户行为模型。具体的,电子设备将历史使用信息以非关系型数据库的形式进行记录并保存,在所述非关系型数据库当中提取词序列,通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列,根据所述向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型,从而将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息,并根据所述分类信息对所述电子设备中的数据进行清理。
请参阅图4,图4为本申请实施例提供的数据清理装置的一种结构示意图。其中该数据清理装置30包括记录模块301、建模模块302、发送模块303以及清理模块304;
所述记录模块301,用于记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录。
在一实施例中,记录模块301可以实时记录用户的使用信息,该使用信息包括用户针对电子设备中存储数据的修改记录。比如,在用户使用电子设备的过程中,可以通过诸如文件管理器等工具对电子设备上存储的数据文件进行修改,上述对数据的修改可以包括删除、命名、修改路径等等。
在一实施例中,上述用户针对电子设备中存储数据的修改记录可以为删除记录,比如删除重复性文件、删除重复图片、删除模糊图片、删除碎片文件、删除无用的文件等等。其中,上述历史使用信息用于对用户针对数据的清理习惯进行判断,因此可以获取较长一段时间的历史使用信息,以提高判断的准确性,比如上述第一预设时间段可以为二十天或者三十天等等,该第一预设时间段也可以由用户根据需求自行设定,本申请对此不做进一步限定。
所述建模模块302,用于根据所述历史使用信息进行特征建模,以得到用户行为模型。
本申请实施例中,电子设备系统中的全景感知架构包括建模模块302,可以对用户修改数据的历史使用信息进行特征建模,分析用户的修改方案属性,得到用户的行为模型。具体的,建模模块302在获取到用户修改数据的历史使用信息后,提取该历史使用信息当中的关键信息,比如可以将修改数据的操作类型和数据类型当作上述关键信息,然后将上述关键信息通过预先配置的词嵌入模型进行转换,转换后得到上述每个关键信息对应的向量。接着使用全景感知架构当中预置的神经网络模型,将上述词嵌入模型转换的向量作为输入和输出,以对该神经网络模型进行训练,从而得到对历史使用信息进行学习的个性化用户行为模型。
其中,词嵌入模型配置于电子设备当中,从而使得电子设备可以通过该词嵌入模型将接收到的信息转换为向量序列,以将该转换后的向量序列输入至神经网络模型,对该神经网络模型进行训练。在一实施例中,上述神经网络模型可以为循环神经网络模型(Recurrent neural Network,RNN),循环神经网络当作自编码器使用,经过对用户的数据学习得到用户的个性化行为模型特性。
所述发送模块303,用于将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息。
在一实施例中,发送模块303将上述用户行为模型上传至云端服务器,利用云端服务器中的全景感知架构进行用户群体的分类,以得到用户分类信息,然后再发送至电子设备。具体的,可以将建模模块302生成的用户行为模型特征上传至服务器,然后根据服务器中的有监督分类模型算法,其用户行为模型特征作为输入,输出得到用户群体的分类。
所述清理模块304,用于根据所述分类信息对所述电子设备中的数据进行清理。
在一实施例中,电子设备当中可以预设多种数据清理方案,分别与多种预设的用户分类一一对应,比如当电子设备接收到的用户分类信息为习惯整理图片的第一用户分类时,清理模块304可以对电子设备中存储的图片进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理文件夹的第二用户分类时,清理模块304可以对电子设备中存储的文件夹进行清理,而忽略其他类型的数据;当电子设备接收到的用户分类信息为习惯整理碎片文件的第三用户分类时,清理模块304可以对电子设备中存储的碎片文件进行清理,而忽略其他类型的数据等。
在一实施例中,请参阅图5,图5为本申请实施例提供的数据清理装置的一种结构示意图,其中,所述记录模块301包括:第一获取子模块3011和记录子模块3012;
所述第一获取子模块3011,用于当用户对所述电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息;
所述记录子模块3012,用于根据所述操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
在一实施例中,所述建模模块302包括:提取子模块3021、转换子模块3022以及建模子模块3023;
所述提取子模块3021,用于在所述非关系型数据库当中提取词序列;
所述转换子模块3022,用于通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列;
所述建模子模块3023,用于根据所述向量序列生成用户行为模型。
在一实施例中,所述建模子模块3023,具体用于根据所述向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型。
在一实施例中,所述发送模块303包括:第二获取子模块3031和发送子模块3032;
所述第二获取子模块3031,用于获取所述用户行为模型的特征信息;
所述发送子模块3032,用于将所述特征信息发送至服务器,并接收所述服务器根据所述特征信息和分类模型生成的分类信息。
由上述可知,本申请实施例的数据清理装置可以记录电子设备在第一预设时间段内的历史使用信息,历史使用信息包括用户针对电子设备中存储数据的修改记录,根据历史使用信息进行特征建模,以得到用户行为模型,将用户行为模型发送至服务器,并接收服务器根据用户行为模型生成的分类信息,根据分类信息对电子设备中的数据进行清理。本申请可以对用户的历史行为习惯进行记录,并对行为习惯进行数学建模,得到用户的数据清理的场景特征,并根据得到的用户相关数据清理的场景特征,对用户进行分类得到用户分类信息,根据该分类信息自动清理数据,可以提升数据清理的效率和准确性。
本申请实施例中,数据清理装置与上文实施例中的数据清理方法属于同一构思,在数据清理装置上可以运行数据清理方法实施例中提供的任一方法,其具体实现过程详见数据清理方法的实施例,此处不再赘述。
本文所使用的术语“模块”可看作为在该运算系统上执行的软件对象。本文所述的不同组件、模块、引擎及服务可看作为在该运算系统上的实施对象。而本文所述的装置及方法可以以软件的方式进行实施,当然也可在硬件上进行实施,均在本申请保护范围之内。
本申请实施例还提供一种存储介质,其上存储有计算机程序,当所述计算机程序在计算机上运行时,使得所述计算机执行上述的数据清理方法。
本申请实施例还提供一种电子设备,如平板电脑、手机等。电子设备中的处理器会按照如下的步骤,将一个或一个以上的应用程序的进程对应的指令加载到存储器中,并由处理器来运行存储在存储器中的应用程序,从而实现各种功能:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
在一实施例中,记录电子设备在第一预设时间段内的历史使用信息时,所述处理器用于执行以下步骤:
当用户对所述电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息;
根据所述操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
在一实施例中,根据所述历史使用信息进行特征建模,以得到用户行为模型时,所述处理器用于执行以下步骤:
在所述非关系型数据库当中提取词序列;
通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列;
根据所述向量序列生成用户行为模型。
在一实施例中,根据所述向量序列生成用户行为模型时,所述处理器用于执行以下步骤:
根据所述向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型。
在一实施例中,将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息时,所述处理器用于执行以下步骤:
获取所述用户行为模型的特征信息;
将所述特征信息发送至服务器,并接收所述服务器根据所述特征信息和分类模型生成的分类信息。
在一实施例中,根据所述分类信息对所述电子设备中的数据进行清理时,所述处理器用于执行以下步骤:
根据所述分类信息确定数据清理的频率信息;
根据所述频率信息对所述电子设备中的数据进行清理。
在一实施例中,根据所述分类信息对所述电子设备中的数据进行清理时,所述处理器用于执行以下步骤:
根据所述分类信息确定数据清理的目标数据类型;
根据所述目标数据类型对所述电子设备中的数据进行清理。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
请参阅图6,电子设备400包括处理器401以及存储器402。其中,处理器401与存储器402电性连接。
处理器400是电子设备400的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或加载存储在存储器402内的计算机程序,以及调用存储在存储器402内的数据,执行电子设备400的各种功能并处理数据,从而对电子设备400进行整体监控。
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的计算机程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的计算机程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
在本申请实施例中,电子设备400中的处理器401会按照如下的步骤,将一个或一个以上的计算机程序的进程对应的指令加载到存储器402中,并由处理器401运行存储在存储器402中的计算机程序,从而实现各种功能,如下:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
请一并参阅图7,在一些实施方式中,电子设备400还可以包括:显示器403、射频电路404、音频电路405以及电源406。其中,其中,显示器403、射频电路404、音频电路405以及电源406分别与处理器401电性连接。
显示器403可以用于显示由用户输入的信息或提供给用户的信息以及各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示器403可以包括显示面板,在一些实施方式中,可以采用液晶显示器(Liquid Crystal Display,LCD)、或者有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板。
射频电路404可以用于收发射频信号,以通过无线通信与网络设备或其他电子设备建立无线通讯,与网络设备或其他电子设备之间收发信号。
音频电路405可以用于通过扬声器、传声器提供用户与电子设备之间的音频接口。
电源406可以用于给电子设备400的各个部件供电。在一些实施例中,电源406可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管图7中未示出,电子设备400还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,存储介质可以是磁碟、光盘、只读存储器(Read Only Memory,ROM)、或者随机存取记忆体(Random Access Memory,RAM)等。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
需要说明的是,对本申请实施例的数据清理方法而言,本领域普通测试人员可以理解实现本申请实施例数据清理方法的全部或部分流程,是可以通过计算机程序来控制相关的硬件来完成,计算机程序可存储于一计算机可读取存储介质中,如存储在电子设备的存储器中,并被该电子设备内的至少一个处理器执行,在执行过程中可包括如数据清理方法的实施例的流程。其中,的存储介质可为磁碟、光盘、只读存储器、随机存取记忆体等。
对本申请实施例的数据清理装置而言,其各功能模块可以集成在一个处理芯片中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中,存储介质譬如为只读存储器,磁盘或光盘等。
以上对本申请实施例所提供的一种数据清理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种数据清理方法,其特征在于,所述方法包括以下步骤:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
2.根据权利要求1所述的数据清理方法,其特征在于,记录电子设备在第一预设时间段内的历史使用信息,包括:
当用户对所述电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息;
根据所述操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
3.根据权利要求2所述的数据清理方法,其特征在于,根据所述历史使用信息进行特征建模,以得到用户行为模型,包括:
在所述非关系型数据库当中提取词序列;
通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列;
根据所述向量序列生成用户行为模型。
4.根据权利要求3所述的数据清理方法,其特征在于,根据所述向量序列生成用户行为模型,包括:
根据所述向量序列对预先配置的循环神经网络模型进行训练,以得到训练后的用户行为模型。
5.根据权利要求1所述的数据清理方法,其特征在于,将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息,包括:
获取所述用户行为模型的特征信息;
将所述特征信息发送至服务器,并接收所述服务器根据所述特征信息和分类模型生成的分类信息。
6.一种数据清理装置,其特征在于,所述装置包括:记录模块、建模模块、发送模块以及清理模块;
所述记录模块,用于记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
所述建模模块,用于根据所述历史使用信息进行特征建模,以得到用户行为模型;
所述发送模块,用于将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
所述清理模块,用于根据所述分类信息对所述电子设备中的数据进行清理。
7.根据权利要求6所述的数据清理装置,其特征在于,所述记录模块包括:第一获取子模块和记录子模块;
所述第一获取子模块,用于当用户对所述电子设备中存储数据进行修改操作时,获取当前操作类型、数据地址以及数据类型信息;
所述记录子模块,用于根据所述操作类型、数据地址以及数据类型信息,以非关系型数据库的形式进行记录并保存。
8.根据权利要求7所述的数据清理装置,其特征在于,所述建模模块包括:提取子模块、转换子模块以及建模子模块;
所述提取子模块,用于在所述非关系型数据库当中提取词序列;
所述转换子模块,用于通过预先配置的词嵌入模型对所述词序列进行转换,生成对应的向量序列;
所述建模子模块,用于根据所述向量序列生成用户行为模型。
9.一种存储介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机上运行时,使得所述计算机执行如权利要求1至5任一项所述的数据清理方法。
10.一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,其特征在于,所述处理器加载所述存储器中的指令用于执行以下步骤:
记录电子设备在第一预设时间段内的历史使用信息,所述历史使用信息包括用户针对所述电子设备中存储数据的修改记录;
根据所述历史使用信息进行特征建模,以得到用户行为模型;
将所述用户行为模型发送至服务器,并接收所述服务器根据所述用户行为模型生成的分类信息;
根据所述分类信息对所述电子设备中的数据进行清理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910282135.4A CN111797076A (zh) | 2019-04-09 | 2019-04-09 | 数据清理方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910282135.4A CN111797076A (zh) | 2019-04-09 | 2019-04-09 | 数据清理方法、装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111797076A true CN111797076A (zh) | 2020-10-20 |
Family
ID=72805294
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910282135.4A Pending CN111797076A (zh) | 2019-04-09 | 2019-04-09 | 数据清理方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111797076A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417509A (zh) * | 2020-12-08 | 2021-02-26 | 长春理工大学 | 基于自编码器的数据安全去重方法 |
CN112632051A (zh) * | 2020-12-25 | 2021-04-09 | 中国工商银行股份有限公司 | 基于神经网络的数据库清理方法及系统 |
CN112800043A (zh) * | 2021-02-05 | 2021-05-14 | 凯通科技股份有限公司 | 一种物联网终端信息提取方法、装置、设备和存储介质 |
CN113657708A (zh) * | 2021-07-05 | 2021-11-16 | 江汉大学 | 一种服务器的处理方法、装置以及服务器 |
WO2023087857A1 (zh) * | 2021-11-22 | 2023-05-25 | 中兴通讯股份有限公司 | 一种电子设备的控制方法、电子设备及可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100010979A1 (en) * | 2008-07-11 | 2010-01-14 | International Business Machines Corporation | Reduced Volume Precision Data Quality Information Cleansing Feedback Process |
CN103646086A (zh) * | 2013-12-13 | 2014-03-19 | 北京奇虎科技有限公司 | 一种垃圾文件的清理方法和装置 |
CN106844225A (zh) * | 2016-12-22 | 2017-06-13 | 北京奇虎科技有限公司 | 移动终端及其数据清理方法和装置 |
US20180032623A1 (en) * | 2015-07-24 | 2018-02-01 | Chengdu Yundui Mobile Information Technology Co., Ltd | Text mining-based attribute analysis method for internet media users |
CN108063872A (zh) * | 2017-12-19 | 2018-05-22 | 青岛海信移动通信技术股份有限公司 | 短信的清理方法和装置 |
CN108427737A (zh) * | 2018-02-28 | 2018-08-21 | 上海连尚网络科技有限公司 | 一种数据清理方法、设备及计算机可读介质 |
-
2019
- 2019-04-09 CN CN201910282135.4A patent/CN111797076A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100010979A1 (en) * | 2008-07-11 | 2010-01-14 | International Business Machines Corporation | Reduced Volume Precision Data Quality Information Cleansing Feedback Process |
CN103646086A (zh) * | 2013-12-13 | 2014-03-19 | 北京奇虎科技有限公司 | 一种垃圾文件的清理方法和装置 |
US20180032623A1 (en) * | 2015-07-24 | 2018-02-01 | Chengdu Yundui Mobile Information Technology Co., Ltd | Text mining-based attribute analysis method for internet media users |
CN106844225A (zh) * | 2016-12-22 | 2017-06-13 | 北京奇虎科技有限公司 | 移动终端及其数据清理方法和装置 |
CN108063872A (zh) * | 2017-12-19 | 2018-05-22 | 青岛海信移动通信技术股份有限公司 | 短信的清理方法和装置 |
CN108427737A (zh) * | 2018-02-28 | 2018-08-21 | 上海连尚网络科技有限公司 | 一种数据清理方法、设备及计算机可读介质 |
Non-Patent Citations (1)
Title |
---|
黄梦妮;周晓光;赵肄江;: "顾及可信度的OpenStreetMap数据清理", 测绘与空间地理信息, no. 01, 25 January 2017 (2017-01-25) * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112417509A (zh) * | 2020-12-08 | 2021-02-26 | 长春理工大学 | 基于自编码器的数据安全去重方法 |
CN112417509B (zh) * | 2020-12-08 | 2023-06-06 | 长春理工大学 | 基于自编码器的数据安全去重方法 |
CN112632051A (zh) * | 2020-12-25 | 2021-04-09 | 中国工商银行股份有限公司 | 基于神经网络的数据库清理方法及系统 |
CN112800043A (zh) * | 2021-02-05 | 2021-05-14 | 凯通科技股份有限公司 | 一种物联网终端信息提取方法、装置、设备和存储介质 |
CN113657708A (zh) * | 2021-07-05 | 2021-11-16 | 江汉大学 | 一种服务器的处理方法、装置以及服务器 |
WO2023087857A1 (zh) * | 2021-11-22 | 2023-05-25 | 中兴通讯股份有限公司 | 一种电子设备的控制方法、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111797076A (zh) | 数据清理方法、装置、存储介质及电子设备 | |
CN112232425B (zh) | 图像处理方法、装置、存储介质及电子设备 | |
CN107871001B (zh) | 音频播放方法、装置、存储介质及电子设备 | |
CN111800331A (zh) | 通知消息的推送方法、装置、存储介质及电子设备 | |
AU2021201933A1 (en) | Hierarchical multiclass exposure defects classification in images | |
EP4053735A1 (en) | Method for structuring pedestrian information, device, apparatus and storage medium | |
CN111797288A (zh) | 数据筛选方法、装置、存储介质及电子设备 | |
CN111813532A (zh) | 一种基于多任务机器学习模型的图像管理方法及装置 | |
CN111797870A (zh) | 算法模型的优化方法、装置、存储介质及电子设备 | |
KR20220113919A (ko) | 딥 러닝 네트워크 결정 방법, 장치, 전자 디바이스 및 저장 매체 | |
CN111898675B (zh) | 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备 | |
CN111797851A (zh) | 特征提取方法、装置、存储介质及电子设备 | |
CN111798259A (zh) | 应用推荐方法、装置、存储介质及电子设备 | |
CN111800445B (zh) | 消息推送方法、装置、存储介质及电子设备 | |
CN109408659A (zh) | 基于小世界网络的图像检索方法、装置、计算设备及介质 | |
CN111798019B (zh) | 意图预测方法、装置、存储介质及电子设备 | |
CN117275086A (zh) | 手势识别方法、装置、计算机设备、存储介质 | |
CN112132015A (zh) | 违规驾驶姿势的检测方法、装置、介质和电子设备 | |
CN111797857A (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN111797261A (zh) | 特征提取方法、装置、存储介质及电子设备 | |
CN111816211B (zh) | 情绪识别方法、装置、存储介质及电子设备 | |
CN108536343B (zh) | 控件展示方法、装置、终端及存储介质 | |
CN111797299A (zh) | 模型训练方法、网页分类方法、装置、存储介质及设备 | |
CN111797127A (zh) | 时序数据分割方法、装置、存储介质及电子设备 | |
CN111797863A (zh) | 模型训练方法、数据处理方法、装置、存储介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |