CN113011503A - 一种电子设备的数据取证方法、存储介质及终端 - Google Patents
一种电子设备的数据取证方法、存储介质及终端 Download PDFInfo
- Publication number
- CN113011503A CN113011503A CN202110304911.3A CN202110304911A CN113011503A CN 113011503 A CN113011503 A CN 113011503A CN 202110304911 A CN202110304911 A CN 202110304911A CN 113011503 A CN113011503 A CN 113011503A
- Authority
- CN
- China
- Prior art keywords
- classification
- data information
- target data
- training
- classifier
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012549 training Methods 0.000 claims abstract description 36
- 238000013145 classification model Methods 0.000 claims abstract description 31
- 239000013598 vector Substances 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims description 25
- 238000012545 processing Methods 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 7
- 230000010354 integration Effects 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种电子设备的数据取证方法、存储介质及终端,属于数据分类技术领域,采集电子设备的目标数据信息;计算目标数据信息的特征向量,构建训练集;对训练集进行聚类处理,得到多个聚类子样本集;基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类,模型分类精度高,泛化能力强,适用范围广。
Description
技术领域
本发明涉及数据分类技术领域,尤其涉及一种电子设备的数据取证方法、存储介质及终端。
背景技术
随着手机软硬件技术的不断发展,手机的内存存储量不断增大,手机中的短信息存储量也是越来越大,案件中往往会涉及到众多人员,因此需要同时分析很多部手机,使得分析的数据量非常巨大。为了解决该问题,出现了一些基于数据挖掘、机器学习技术的取证分析方法,通过直接对收集到的所有数据信息进行自动分类,从而智能的帮助排查电子证据。上述分类方法在取证分析过程中,存在短信息数据样本不平衡、数据集噪声大的问题,且传统单一自动分类方法泛化误差较高,对于分布不平衡数据分类性能不理想,无法有效的辅助对电子证据进行分析与排查。
发明内容
本发明的目的在于针对现有取证实际中,短信息数据样本不平衡,数据集噪声大,单一分类方法泛化误差较高,且处理分布不平衡数据达不到较好性能等问题,提出了一种智能手机数据取证方法、存储介质及终端。
本发明的目的是通过以下技术方案来实现的:一种电子设备的数据取证方法,所述方法包括:
采集电子设备的目标数据信息;
计算目标数据信息的特征向量,构建训练集;
对训练集进行聚类处理,得到多个聚类子样本集;
基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;
将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;
对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类。
作为一选项,所述方法还包括预处理步骤:将采集电子设备的目标数据信息进行分词处理,去除停用词。
作为一选项,所述计算目标数据信息的特征向量步骤后还包括:计算目标数据信息的特征权重,进行特征选择更新训练集。
作为一选项,所述计算目标数据信息的特征权重Wi的计算公式为:
Wi=WT×WI
其中,WT为某一特征项在文本中的频率,WI表示特征项的逆向频率;
进行特征选择的计算公式为:
g(D,t)=H(D)-H(D|t)
其中,D表示目标数据信息的整个数据集,t表示特征,H(D)指特征集合中不包含t时系统的信息量,H(D|t)表示特征集合中包含t时系统的信息量。
作为一选项,所述进行特征选择步骤前还包括对特征向量进行归一化处理,具体计算公式为:
其中,WT为某一特征项在文本中的频率ct,WI表示特征项的逆向频率,n目标数据信息的总数,dt表示特征项t在目标数据信息集中的频率。
作为一选项,所述差异度ρav计算公式为:
其中,L为参与集成的分类器个数,ρi,j为分类器间的相关系数。
作为一选项,所述分类器间的相关系数的计算公式具体为:
其中,N11表示分类器A与分类器B都预测正确,N10表示分类器A正确B 错误,N01表示分类器B正确A错误,N00表示A和B都预测错误。
作为一选项,所述对训练集成学习模型进行训练步骤后还包括对集成学习模型的分类性能进行判定,集成学习模型的样本预测值H(x)的计算公式为:
需要进一步说明的是,上述方法各选项对应的技术特征可以相互组合或替换构成新的技术方案。
本发明还包括一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行如上所述电子设备的数据取证方法的步骤。
本发明还包括一种存储介质,一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行如上所述电子设备的数据取证方法的步骤。
与现有技术相比,本发明有益效果是:
(1)本发明基于不同的聚类样本集构建多个对应的分类模型,并将将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型,能够提高模型的泛化能力,且有效提高了模型的分类精度,适用范围广。
(2)本发明采用加权的属性权重对特征进行选择,能够有效减小数据样本不均衡、数据集噪声大影响模型分类性能的问题,并提高了数据的聚类性能。
附图说明
下面结合附图对本发明的具体实施方式作进一步详细的说明,此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,在这些附图中使用相同的参考标号来表示相同或相似的部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1为本发明实施例1的方法流程图;
图2为本发明实施例1的集成分类模型框架示意图。
具体实施方式
下面结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图所述方向或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,属于“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,属于“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明主要用于解决现有电子数据取证过程中,短信息数据样本不平衡,数据集噪声大,单一分类方法泛化误差较高,且处理分布不平衡数据达不到较好性能等问题,提出了一种电子设备的数据取证方法、存储介质及终端,在本发明具体实施方式中,以对手机中的短信文本进行取证为例说明本申请的发明构思。
实施例1
如图1所示,在实施例1中,一种电子设备的数据取证方法,具体包括以下步骤:
S01:采集电子设备的目标数据信息;具体地,本实施例中,具体采集的是手机中的短信文本(目标数据信息),将用户手机中的短信文本上传至计算机数据库系统,并按照用户id以及该id对应的短信文本进行存储,为后续的数据处理提供支撑。
S02:计算目标数据信息的特征向量,构建训练集;
S03:对训练集进行聚类处理,得到多个聚类子样本集;
S04:基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;
S05:将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;
S06:对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类。
本发明基于不同的聚类样本集构建多个对应的分类模型,并将将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,去除了分类性能较差的冗余分类器,从而减少集成分类性能更高的分类器所需的分类器数目,进而减少集成分类器的存储空间,从而进一步降低了分类学习的运算负载,降低模型构建的时间成本;再选择差异度最大的一组分类器构成集成学习模型,使集成学习模型能够适应不同的分类场景,提高了模型的泛化能力,且能够有效提高模型的分类精度,适用范围广的同时分类精度高,解决了大数据背景下的数据取证性能低下问题,为进行智能手机数据取证提供了有力的技术支撑,让智能手机数据取证变得更加具有针对性和高效性。
进一步地,步骤S01后还包括预处理步骤:
将采集电子设备的目标数据信息进行分词处理,去除停用词。具体地,采用Jieba分词器对短信息文本数据进行分词处理,并去除停用词,即在进行文本分词以后,就需要去除停用词操作,停用词主要是属于本身没有任何意义的词汇,忽略或者是去除该类词汇能提高分类的效率并节省存储空间。为了有效的去除停用词,且对于文本分类没有很大的负面影响,为有效去除停用词,通过参考文献资料,收集采用了2000多个常见停用词,主要包括词汇、少量数字和一些符号。在使用jieba分词工具对短信息进行分词以后,在分词后的文本中筛除停用词,能够大大减小整个数据处理过程的计算量并节约时间开销。
进一步地,步骤S02中计算目标数据信息的特征向量步骤后还包括:
计算目标数据信息的特征权重,进行特征选择更新训练集,对加权的属性权重对特征进行选择,能够有效减小数据样本不均衡、数据集噪声大影响模型分类性能的问题,并提高了数据的聚类性能。
具体地,对于所有的短信息文本集D,设定包含n条信息,每条信息d具有m个相互独立的特征(T1,T2,...,Tm)。为对短信息文本进行学习,需要对短信息文本进行编码,采用向量间的距离关系来进行语义相似性度量,本实施例中采用wk表示特征Tk对信息d的重要程度,(w1,w2,...,wm)表示各个特征的不同权重,则整个短信息文本集D的特征向量如下所示:
通过对不同特征设置合适的权值,能够表示特征向量Vd中不同特征对于短信息分类的重要性。进一步地,短信文本的特征权重Wi的计算公式为:
Wi=WT×WI
其中,WT为某一特征项在文本中的频率ct,该指标表示特征项对该文本的重要程度,其计算公式为:
Wi=WT×WI
其中,WI表示特征项的逆向频率,该指标表示特征项在整体文本集中的区分能力。用n表示文本总数,dt表示特征项t在文本集中的频率,其计算公式具体为:
更进一步地,为解决向量高维度的问题,需要进行特征选择,筛选对于分类具有重要意义的特征,对训练集进行更新,特征选择的计算公式为:
g(D,t)=H(D)-H(D|t)
其中,D表示目标数据信息的整个数据集,t表示特征,H(D)表示特征集合中不包含t时系统的信息量,H(D|t)表示特征集合中包含t时系统的信息量。
进一步地,进行特征选择步骤前还包括对特征向量进行归一化处理,能够消除文本长度因素对向量表示的影响,归一化处理具体计算公式为:
其中,WT为某一特征项在文本中的频率ct,WI表示特征项的逆向频率,n目标数据信息的总数,dt表示特征项t在目标数据信息集中的频率。
进一步地,步骤S03对训练集进行聚类处理即基于步骤S02中计算所得特征词权重,使用加权的聚类算法对训练集进行聚类;设定加权的聚类算法样本间相似度函数disw(x,y)为:
其中,x,y分别为图像的像素点坐标。进一步地,依据相似度函数disw计算样本与k个随机聚类中心之间的相似度,依据最大相似度将样本归类于不同的质心,类别划分依据公式为:
Ci={xn:disw(x,ci)<disw(x,cj),1≤j≤k}
其中ci,cj则表示两个不同的质心。进一步地,计算同一类别中对象的均值,然后基于样本点的平均值不断迭代更新聚类质心Centerk,直到达到了设定的最大运行次数或者中心点位置不再变化,迭代停止,得到最终的聚类结果,即多个不同的聚类子样本集。
进一步地,步骤S04中基于不同的聚类样本集构建多个对应的分类模型具体包括卷积神经网络模型、长短时记忆网络模型等不同深度神经网络分类模型。分类模型建立完成后,进一步采用训练集对分类模型进行训练,具体包括利用误差反向传播算法对分类模型进行训练,以此提高分类模型的分类精准度,在此基础上,对比每个深度神经网络分类模型对训练集中样本的分类性能,性能评测指标AC依据下面的公式:
其中,TP为被正确划分为正例的个数,FP为错误划分为正例的个数,FN 为错误划分为负例的个数,TN为正确划分为负例的个数。
进一步地,在步骤S05中,将分类性能排名前三的多个分类模型构成的分类器组合进行差异度计算,即分别计算两两分类器之间的差异度,并选择差异度最大的一组分类器构成集成学习模型,以此提升集成学习模型的泛化能力。具体地,差异度ρav计算公式为:
其中,L为参与集成的分类器个数,ρi,j为分类器间的相关系数,分类器间的相关系数的计算公式具体为:
其中,N11表示分类器A与分类器B都预测正确,N10表示分类器A正确B错误,N01表示分类器B正确A错误,N00表示A和B都预测错误。
进一步地,对训练集成学习模型进行训练步骤后还包括对集成学习模型的分类性能进行判定,具体根据集成学习模型的样本预测值判定集成学习模型的分类性能,集成学习模型的样本预测值H(x)的计算公式为:
更为具体地,将短信息文本或者其他需要进行分类的目标数据信息输入至集成学习模型中,即可实现精准的数据分类,在分类后的电子数据上进行取证分析,能为取证提供有力的数据支撑和参考,能让取证人员专注于重要的信息,从而有效提高取证效率,节约资源消耗。
本发明集成学习模型基于不同的聚类样本集构建多个对应的分类模型,然后选择分类性能排名前三的分类模型进行差异度计算,将性能较差的分类器剔除,只将分类性能优异且具有差异性的分类器进行集成,结果上不仅可以提升集成精度和泛化能力,还可以有效提高算法的效率。
实施例2
本实施例提供了一种存储介质,与实施例1具有相同的发明构思,其上存储有计算机指令,计算机指令运行时执行实施例1中电子设备的数据取证方法的步骤。
基于这样的理解,本实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
实施例3
本实施例还提供一种终端,与实施例1具有相同的发明构思,包括存储器和处理器,存储器上存储有可在处理器上运行的计算机指令,处理器运行计算机指令时执行实施例1中电子设备的数据取证方法的步骤。处理器可以是单核或者多核中央处理单元或者特定的集成电路,或者配置成实施本发明的一个或者多个集成电路。
在本发明提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
以上具体实施方式是对本发明的详细说明,不能认定本发明的具体实施方式只局限于这些说明,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演和替代,都应当视为属于本发明的保护范围。
Claims (10)
1.一种电子设备的数据取证方法,其特征在于:所述方法包括:
采集电子设备的目标数据信息;
计算目标数据信息的特征向量,构建训练集;
对训练集进行聚类处理,得到多个聚类子样本集;
基于不同的聚类样本集构建多个对应的分类模型,并通过训练集对分类模型进行训练,获得不同分类模型的分类性能;
将分类性能排名靠前的多个分类模型构成的分类器组合进行差异度计算,选择差异度最大的一组分类器构成集成学习模型;
对训练集成学习模型进行训练,并将完成训练的集成学习模型用作对目标数据信息的分类。
2.根据权利要求1所述电子设备的数据取证方法,其特征在于:所述方法还包括预处理步骤:
将采集电子设备的目标数据信息进行分词处理,去除停用词。
3.根据权利要求1所述电子设备的数据取证方法,其特征在于:所述计算目标数据信息的特征向量步骤后还包括:
计算目标数据信息的特征权重,进行特征选择更新训练集。
4.根据权利要求3所述电子设备的数据取证方法,其特征在于:所述计算目标数据信息的特征权重Wi的计算公式为:
Wi=WT×WI
其中,WT为某一特征项在文本中的频率,WI表示特征项的逆向频率;
进行特征选择的计算公式为:
g(D,t)=H(D)-H(D|t)
其中,D表示目标数据信息的整个数据集,t表示特征,H(D)表示特征集合中不包含t时系统的信息量,H(D|t)表示特征集合中包含t时系统的信息量。
9.一种存储介质,其上存储有计算机指令,其特征在于:所述计算机指令运行时执行权利要求1-8任意一项所述电子设备的数据取证方法的步骤。
10.一种终端,包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令,其特征在于:所述处理器运行所述计算机指令时执行权利要求1-8任意一项所述电子设备的数据取证方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110304911.3A CN113011503B (zh) | 2021-03-17 | 2021-03-17 | 一种电子设备的数据取证方法、存储介质及终端 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110304911.3A CN113011503B (zh) | 2021-03-17 | 2021-03-17 | 一种电子设备的数据取证方法、存储介质及终端 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113011503A true CN113011503A (zh) | 2021-06-22 |
CN113011503B CN113011503B (zh) | 2021-11-23 |
Family
ID=76404767
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110304911.3A Expired - Fee Related CN113011503B (zh) | 2021-03-17 | 2021-03-17 | 一种电子设备的数据取证方法、存储介质及终端 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113011503B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115018210A (zh) * | 2022-08-08 | 2022-09-06 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据分类预测方法、装置、计算机设备和存储介质 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110081073A1 (en) * | 2009-10-06 | 2011-04-07 | Wright State University | Methods And Logic For Autonomous Generation Of Ensemble Classifiers, And Systems Incorporating Ensemble Classifiers |
CN102402690A (zh) * | 2011-09-28 | 2012-04-04 | 南京师范大学 | 基于直觉模糊集成的数据分类方法与系统 |
CN103164710A (zh) * | 2013-02-19 | 2013-06-19 | 华南农业大学 | 一种基于压缩感知的选择集成人脸识别方法 |
CN103246894A (zh) * | 2013-04-23 | 2013-08-14 | 南京信息工程大学 | 一种解决光照不敏感问题的地基云图识别方法 |
CN103632168A (zh) * | 2013-12-09 | 2014-03-12 | 天津工业大学 | 一种机器学习中的分类器集成方法 |
CN103870798A (zh) * | 2012-12-18 | 2014-06-18 | 佳能株式会社 | 对象检测方法、对象检测设备以及图像拾取设备 |
CN104965867A (zh) * | 2015-06-08 | 2015-10-07 | 南京师范大学 | 基于chi特征选取的文本事件分类方法 |
CN105550292A (zh) * | 2015-12-11 | 2016-05-04 | 北京邮电大学 | 一种基于von Mises-Fisher概率模型的网页分类方法 |
CN106096005A (zh) * | 2016-06-23 | 2016-11-09 | 康佳集团股份有限公司 | 一种基于深度学习的垃圾邮件过滤方法及系统 |
WO2018045269A1 (en) * | 2016-09-02 | 2018-03-08 | Ohio State Innovation Foundation | System and method of otoscopy image analysis to diagnose ear pathology |
CN110069709A (zh) * | 2019-04-10 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 意图识别方法、装置、计算机可读介质及电子设备 |
CN110232395A (zh) * | 2019-03-01 | 2019-09-13 | 国网河南省电力公司电力科学研究院 | 一种基于故障中文文本的电力系统故障诊断方法 |
CN110287311A (zh) * | 2019-05-10 | 2019-09-27 | 平安科技(深圳)有限公司 | 文本分类方法及装置、存储介质、计算机设备 |
CN110489557A (zh) * | 2019-08-22 | 2019-11-22 | 电子科技大学成都学院 | 一种SVM与Bootstrapping相融合的股评类文本情感分析方法 |
US10740371B1 (en) * | 2018-12-14 | 2020-08-11 | Clinc, Inc. | Systems and methods for intelligently configuring and deploying a machine learning-based dialogue system |
CN111967495A (zh) * | 2020-07-06 | 2020-11-20 | 中国科学院计算技术研究所 | 一种分类识别模型构建方法 |
CN112256874A (zh) * | 2020-10-21 | 2021-01-22 | 平安科技(深圳)有限公司 | 模型训练方法、文本分类方法、装置、计算机设备和介质 |
CN112446297A (zh) * | 2020-10-31 | 2021-03-05 | 浙江工业大学 | 一种电子助视器及其适用的智能手机文本辅助阅读方法 |
-
2021
- 2021-03-17 CN CN202110304911.3A patent/CN113011503B/zh not_active Expired - Fee Related
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110081073A1 (en) * | 2009-10-06 | 2011-04-07 | Wright State University | Methods And Logic For Autonomous Generation Of Ensemble Classifiers, And Systems Incorporating Ensemble Classifiers |
CN102402690A (zh) * | 2011-09-28 | 2012-04-04 | 南京师范大学 | 基于直觉模糊集成的数据分类方法与系统 |
CN103870798A (zh) * | 2012-12-18 | 2014-06-18 | 佳能株式会社 | 对象检测方法、对象检测设备以及图像拾取设备 |
CN103164710A (zh) * | 2013-02-19 | 2013-06-19 | 华南农业大学 | 一种基于压缩感知的选择集成人脸识别方法 |
CN103246894A (zh) * | 2013-04-23 | 2013-08-14 | 南京信息工程大学 | 一种解决光照不敏感问题的地基云图识别方法 |
CN103632168A (zh) * | 2013-12-09 | 2014-03-12 | 天津工业大学 | 一种机器学习中的分类器集成方法 |
CN104965867A (zh) * | 2015-06-08 | 2015-10-07 | 南京师范大学 | 基于chi特征选取的文本事件分类方法 |
CN105550292A (zh) * | 2015-12-11 | 2016-05-04 | 北京邮电大学 | 一种基于von Mises-Fisher概率模型的网页分类方法 |
CN106096005A (zh) * | 2016-06-23 | 2016-11-09 | 康佳集团股份有限公司 | 一种基于深度学习的垃圾邮件过滤方法及系统 |
WO2018045269A1 (en) * | 2016-09-02 | 2018-03-08 | Ohio State Innovation Foundation | System and method of otoscopy image analysis to diagnose ear pathology |
US10740371B1 (en) * | 2018-12-14 | 2020-08-11 | Clinc, Inc. | Systems and methods for intelligently configuring and deploying a machine learning-based dialogue system |
CN110232395A (zh) * | 2019-03-01 | 2019-09-13 | 国网河南省电力公司电力科学研究院 | 一种基于故障中文文本的电力系统故障诊断方法 |
CN110069709A (zh) * | 2019-04-10 | 2019-07-30 | 腾讯科技(深圳)有限公司 | 意图识别方法、装置、计算机可读介质及电子设备 |
CN110287311A (zh) * | 2019-05-10 | 2019-09-27 | 平安科技(深圳)有限公司 | 文本分类方法及装置、存储介质、计算机设备 |
CN110489557A (zh) * | 2019-08-22 | 2019-11-22 | 电子科技大学成都学院 | 一种SVM与Bootstrapping相融合的股评类文本情感分析方法 |
CN111967495A (zh) * | 2020-07-06 | 2020-11-20 | 中国科学院计算技术研究所 | 一种分类识别模型构建方法 |
CN112256874A (zh) * | 2020-10-21 | 2021-01-22 | 平安科技(深圳)有限公司 | 模型训练方法、文本分类方法、装置、计算机设备和介质 |
CN112446297A (zh) * | 2020-10-31 | 2021-03-05 | 浙江工业大学 | 一种电子助视器及其适用的智能手机文本辅助阅读方法 |
Non-Patent Citations (2)
Title |
---|
DIEF N A等: "An adaptive semantic descriptive model for multi-document representation to enhance generic summarization", 《INTERNATIONAL JOURNAL OF SOFTWARE ENGINEERING & KNOWLEDGE ENGINEERING》 * |
杨春等: "基于差异性的分类器集成: 有效性分析及优化集成", 《自动化学报》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115018210A (zh) * | 2022-08-08 | 2022-09-06 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据分类预测方法、装置、计算机设备和存储介质 |
CN115018210B (zh) * | 2022-08-08 | 2023-01-10 | 太平金融科技服务(上海)有限公司深圳分公司 | 业务数据分类预测方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113011503B (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11282295B2 (en) | Image feature acquisition | |
CN110909165B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN107436875B (zh) | 文本分类方法及装置 | |
CN110046634B (zh) | 聚类结果的解释方法和装置 | |
CN109960808B (zh) | 一种文本识别方法、装置、设备及计算机可读存储介质 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN107545038B (zh) | 一种文本分类方法与设备 | |
CN108665148B (zh) | 一种电子资源质量评价方法、装置和存储介质 | |
CN112001373A (zh) | 一种物品识别方法、装置及存储介质 | |
CN110287311A (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
CN110348516B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
CN115688760A (zh) | 一种智能化导诊方法、装置、设备及存储介质 | |
CN110866249A (zh) | 一种动态检测恶意代码的方法、装置及电子设备 | |
CN115174250A (zh) | 网络资产安全评估方法、装置、电子设备及存储介质 | |
CN113011503A (zh) | 一种电子设备的数据取证方法、存储介质及终端 | |
CN113641794A (zh) | 简历文本的评估方法、装置及服务器 | |
CN111125329B (zh) | 一种文本信息筛选方法、装置及设备 | |
CN111831819A (zh) | 一种文本更新方法及装置 | |
CN111368131A (zh) | 用户关系识别方法、装置、电子设备及存储介质 | |
CN114048294B (zh) | 相似人群扩展模型训练方法、相似人群扩展方法和装置 | |
CN115730152A (zh) | 基于用户画像分析的大数据处理方法及大数据处理系统 | |
US20170293863A1 (en) | Data analysis system, and control method, program, and recording medium therefor | |
CN116778210A (zh) | 教学影像评价系统以及教学影像评价方法 | |
CN114528378A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN113627542A (zh) | 一种事件信息处理方法、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211123 |