CN113269190B - 基于人工智能的数据分类方法、装置、计算机设备及介质 - Google Patents

基于人工智能的数据分类方法、装置、计算机设备及介质 Download PDF

Info

Publication number
CN113269190B
CN113269190B CN202110823243.5A CN202110823243A CN113269190B CN 113269190 B CN113269190 B CN 113269190B CN 202110823243 A CN202110823243 A CN 202110823243A CN 113269190 B CN113269190 B CN 113269190B
Authority
CN
China
Prior art keywords
data
initial candidate
classification
faster
rcnn
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110823243.5A
Other languages
English (en)
Other versions
CN113269190A (zh
Inventor
欧阳高询
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202110823243.5A priority Critical patent/CN113269190B/zh
Publication of CN113269190A publication Critical patent/CN113269190A/zh
Application granted granted Critical
Publication of CN113269190B publication Critical patent/CN113269190B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/253Fusion techniques of extracted features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种基于人工智能的数据分类方法、装置、计算机设备及介质,通过对获取的训练数据进行预处理得到正负样本,利用Faster‑RCNN网络检测正负样本得到初始候选框,利用改进的NMS算法对初始候选框进行筛选得到中间候选框,采用Softmax‑NMS以改进原有的非极大值抑制算法,将中间候选框输入至改进的残差网络进行特征提取得到特征金字塔,实现不同维度的特征融合,将中间候选框及特征金字塔输入至Faster‑RCNN网络得到分类模型,由于特征处理更加细致,不仅关注到图像的整体特征,更关注到文字等细节特征,进而有效提升了分类模型的准确度,使模型的分类效果更好,最后使用分类模型对目标数据进行分类,实现了目标数据的自动分类。

Description

基于人工智能的数据分类方法、装置、计算机设备及介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的数据分类方法、装置、计算机设备及介质。
背景技术
在保险行业积累着大量的合同资料,需要将这些合同资料进行分档归类,如分为合同是否废弃。保险行业作为金融行业的一个很重要的场景,对于合同的废弃有着很严谨的流程,比如如果某个合同已经废弃,则必然会被盖上相应的废弃印章。
而业内目前对于合同废弃印章的识别主要采用人工干预的办法,不仅耗时耗力,且容易受主观因素的影响而产生误判。
现有的智能分类方法也仅关注图像的整体特征,没有关注到文字等细节特征,分类效果欠佳。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的数据分类方法、装置、计算机设备及介质,能够实现目标数据的自动分类,分类效果好。
本发明的第一方面提供一种基于人工智能的数据分类方法,所述方法包括:
获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本;
利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框;
利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框;
将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔;
将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型;
获取目标数据,并将所述目标数据输入至所述分类模型;
获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
在一个可选的实施方式中,所述利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框包括:
获取所述至少一个初始候选框中每个初始候选框的置信度;
根据每个初始候选框的置信度计算每个初始候选框的softmax;
对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值;
从所述至少一个初始候选框中删除所述置信度分值小于配置分值的初始候选框,得到所述至少一个中间候选框。
在一个可选的实施方式中,所述对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值包括:
获取softmax最大的初始候选框;
计算所述softmax最大的初始候选框与每个初始候选框的交并比;
根据每个初始候选框的softmax及对应的所述交并比计算得到每个初始候选框的置信度分值。
在一个可选的实施方式中,所述将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔包括:
获取所述残差网络的所有卷积神经网络层,其中,除所述所有卷积神经网络层的首层外,每个卷积神经网络层的输入为相邻的上一层的输出,每个卷积神经网络层的输出为相邻的下一层的输入;
将所述至少一个中间候选框输入至所述所有卷积神经网络层的首层,并获取所述所有卷积神经网络层的末层的输出,作为所述特征金字塔。
在一个可选的实施方式中,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,所述方法还包括:
获取所述Faster-RCNN网络的边框回归层;
利用所述边框回归层对所述至少一个中间候选框及所述特征金字塔进行边框回归,得到回归特征;
获取所述Faster-RCNN网络的ROIAlign层;
利用所述ROIAlign层对所述回归特征进行池化处理,得到目标候选框及对应的概率值,作为所述Faster-RCNN网络的输出。
在一个可选的实施方式中,所述对所述训练数据进行预处理,得到正样本及负样本包括:
从所述训练数据中获取带有目标标识的第一数据;
对所述第一数据进行数据扩充处理,得到正样本;
从所述训练数据中获取不带有所述目标标识的第二数据,得到负样本。
在一个可选的实施方式中,所述获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果包括:
从所述分类模型的输出中获取预测类别及概率值;
获取分类阈值;
当所述概率值大于或者等于所述分类阈值时,生成所述目标数据为第一类别的数据分类结果;或者
当所述概率值小于所述分类阈值时,生成所述目标数据为第二类别的数据分类结果。
本发明的第二方面提供一种基于人工智能的数据分类装置,所述装置包括:
处理模块,用于获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本;
检测模块,用于利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框;
筛选模块,用于利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框;
提取模块,用于将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔;
训练模块,用于将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型;
输入模块,用于获取目标数据,并将所述目标数据输入至所述分类模型;
生成模块,用于获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
本发明的第三方面提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的数据分类方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的数据分类方法。
综上所述,本发明所述的基于人工智能的数据分类方法、装置、计算机设备及介质,通过对获取的训练数据进行预处理,得到正样本及负样本,利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框,利用改进的NMS算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框,采用Softmax-NMS以改进原有的NMS算法,将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔,不同于传统的特征提取方式仅采用最后一层进行特征提取,本实施方式将每一个卷积神经网络层的特征都进行特征融合,形成特征金字塔,实现不同维度的特征融合,使提取的特征更加全面、细致,表达也更清晰,将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型,进而结合改进的Softmax-NMS及特征融合后得到的特征金字塔训练得到所述分类模型,由于特征处理更加细致,不仅关注到图像的整体特征,更关注到文字等细节特征,使提取的特征更加清晰,进而有效提升了分类模型的准确度,使模型的分类效果更好,获取目标数据,并将所述目标数据输入至所述分类模型,获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果,进而实现目标数据的自动分类。
附图说明
图1是本发明实施例一提供的基于人工智能的数据分类方法的流程图。
图2是本发明实施例二提供的基于人工智能的数据分类装置的结构图。
图3是本发明实施例三提供的计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的数据分类方法由计算机设备执行,相应地,基于人工智能的数据分类装置运行于计算机设备中。
图1是本发明实施例一提供的基于人工智能的数据分类方法的流程图。所述基于人工智能的数据分类方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S10,获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本。
在本实施例中,所述训练数据可以从目标对象存储器中获取,训练数据可以是指将要进行分类的数据,目标对象可以是某一个或者某几个指定公司。在保险场景中,训练数据可以为合同,则对训练数据进行分类为对合同进行分类。
在本发明的至少一个实施例中,所述对所述训练数据进行预处理,得到正样本及负样本包括:
从所述训练数据中获取带有目标标识的第一数据;
对所述第一数据进行数据扩充处理,得到正样本;
从所述训练数据中获取不带有所述目标标识的第二数据,得到负样本。
其中,目标标识可以为废弃印章,带有废弃印章的合同称之为废弃合同,不带有废弃印章的合同称之为非废弃合同。
本实施例中将带有废弃印章的合同确定为正样本,将不带有废弃印章的合同确定为负样本。
由于废弃合同的数量本身是有限的,因此,为了将合同中的废弃合同准确的分类出来,本实施例可以对带有废弃印章的合同进行数据扩充处理,例如,几何变换,反转,裁剪等,从而扩充带有废弃印章的合同的数量,即扩充正样本的数量。增加了正样本的数量,相当于增加了训练模型的样本的数量,模型的训练样本的数量的增加,能够提高模型训练的精度。
S11,利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框。
Faster-RCNN(Faster-Regions with CNN features)为通过区域提议网络实现实时目标检测。输入一张图片至Faster-RCNN中,Faster-RCNN不仅能够检测出该张图片中的对象,还能用锚定框(例如,矩形框)框选出这些对象的位置以及这些位置的置信概率。
分别将正样本和负样本输入至Faster-RCNN网络中,采用Faster-RCNN主干网络分别在所述正样本及所述负样本中进行目标标识的检测,例如,废弃印章的检测。当在正样本或者负样本中检测到了目标标识,则用锚定框框选出目标标识所在的区域,例如,废弃印章所在的区域。由于锚定框框选出的区域中有些是真实的目标标识,有些是误检测的,因此,将锚定框框选出的区域确定为候选区域。
本实施例中,可以在正样本中检测到一个或者多个对象,也可以在负样本中检测到一个或者多个对象,不同的对象可以用不同的锚定框进行框选。
S12,利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框。
在本发明的至少一个实施例中,所述利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框包括:
获取所述至少一个初始候选框中每个初始候选框的置信度;
根据每个初始候选框的置信度计算每个初始候选框的softmax;
对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值;
从所述至少一个初始候选框中删除所述置信度分值小于配置分值的初始候选框,得到所述至少一个中间候选框。
传统的非极大值抑制算法(Non-Maximum Suppression,NMS)只是简单地进行置信度分值的排序,再剔除较小置信度分值对应的候选框,本实施方式采用Softmax-NMS(基于Softmax的非极大值抑制算法)以改进原有的NMS算法,即:计算置信度分值的softmax,并进行高斯加权,然后再进行置信度分值的排序,并将配置分值作为阈值,从而剔除小于所述阈值的候选框。
在本发明的至少一个实施例中,所述对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值包括:
获取softmax最大的初始候选框;
计算所述softmax最大的初始候选框与每个初始候选框的交并比;
根据每个初始候选框的softmax及对应的所述交并比计算得到每个初始候选框的置信度分值。
具体地,采用下述公式对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值:
Figure 966259DEST_PATH_IMAGE001
其中,
Figure 635138DEST_PATH_IMAGE002
表示第i个初始候选框的置信度分值,
Figure 628502DEST_PATH_IMAGE003
表示第i个初始候选框的softmax,M为softmax最大的初始候选框,
Figure 195881DEST_PATH_IMAGE004
为第i个初始候选框,σ为参数值。
Figure 932893DEST_PATH_IMAGE005
表示softmax最大的初始候选框与第i个初始候选框的交并比。交并比是候选框与原标记框的交叠率,即,交集与并集的比值。关于两个区域的交并比的计算过程,本发明不再详细阐述。
本实施例采用Softmax-NMS,不再直接去除分数值小于阈值的候选框,而是降低候选框的分数值,一方面解决了NMS当中分数值的不连续性,另外,Softmax-NMS还能够更加方便的引用到目标检测当中。
S13,将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔。
残差网络(Resnet)能够将前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。典型的残差网络有resnet50和resnet101等。本实施例可以将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔。
在本发明的至少一个实施例中,所述将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔包括:
获取所述残差网络的所有卷积神经网络层,其中,除所述所有卷积神经网络层的首层外,每个卷积神经网络层的输入为相邻的上一层的输出,每个卷积神经网络层的输出为相邻的下一层的输入;
将所述至少一个中间候选框输入至所述所有卷积神经网络层的首层,并获取所述所有卷积神经网络层的末层的输出作为所述特征金字塔。
例如:ResNet50包括5个卷积神经网络模块,即5个卷积神经网络层,分别是:conv1,conv2_x,conv3_x,conv4_x,conv5_x,其中,conv1为所述首层,conv5_x为所述末层。将Softmax-NMS筛选后得到的候选框区域输入至conv1,得到conv1的输出y1;将y1输入至conv2_x,得到conv2_x的输出y2;将y2输入至conv3_x,得到conv3_x的输出y3;将y3输入至conv4_x,得到conv4_x的输出y4;将y4输入至conv5_x,得到conv5_x的输出y5;y5即为所述特征金字塔。
在上述实施方式中,不同于传统的特征提取方式仅采用最后一层进行特征提取,本实施方式将每一个卷积神经网络层的特征都进行特征融合,形成特征金字塔,实现不同维度的特征融合,使提取的特征更加全面、细致,表达也更清晰。
S14,将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型。
由于所述至少一个中间候选框是通过基于Softmax的非极大值抑制算法(Softmax-NMS),从至少一个初始候选框中筛选得到的,而特征金字塔为将每一个卷积神经网络层的特征进行特征融合得到的,因此,将所述至少一个中间候选框及所述特征金字塔作为所述Faster-RCNN网络的输入,实现了将改进的Softmax-NMS及特征融合得到的特征金字塔的结合并训练得到所述分类模型。特征金字塔关注的是图像的整体特征,至少一个中间候选框更关注的是文字等细节特征,因此,将特征金字塔和至少一个中间候选框共同作为Faster-RCNN网络的输入,不仅能关注到全局特征,还能兼顾局部细节,使提取的特征更加清晰,进而有效提升了分类模型的准确度,使模型的分类效果更好。
在本发明的至少一个实施例中,由于所述分类模型的目的是检测到带有废弃印章的区域,以确定是废弃合同,因此,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,进一步筛选出所述至少一个中间候选框。
具体地,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,所述方法还包括:
获取所述Faster-RCNN网络的边框回归层;
利用所述边框回归层对所述至少一个中间候选框及所述特征金字塔进行边框回归,得到回归特征;
获取所述Faster-RCNN网络的ROIAlign层;
利用所述ROIAlign层对所述回归特征进行池化处理,得到目标候选框及对应的概率值作为所述Faster-RCNN网络的输出。
S15,获取目标数据,并将所述目标数据输入至所述分类模型。
在本实施例中,所述目标数据可以由用户上传,本发明不限制。目标数据为待分类的数据,例如,待分类的合同。
在其他实施例中,为了定期对目标数据进行分类,以便于分类存储,还可以配置为从指定数据库中定期获取所述目标数据。
S16,获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
在本发明的至少一个实施例中,所述获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果包括:
从所述分类模型的输出中获取预测类别及概率值;
获取预设分类阈值;
当所述概率值大于或者等于所述分类阈值时,生成所述目标数据为第一类别的数据分类结果;或者
当所述概率值小于所述分类阈值时,生成所述目标数据为第二类别的数据分类结果。
其中,所述预设分类阈值为预先设置的百分比,为区分预测类别的临界值。分类阈值可以是根据多次实验得出的经验值。
示例性的,当所述分类模型的输出为:所述训练数据带有所述目标标识,概率为96%。假设预设分类阈值为95%时,由于96%大于95%,则生成所述目标数据为第一类别的数据分类结果。假设所述预设分类阈值为97%时,由于96%小于97%,则生成所述目标数据为第二类别的数据分类结果。第一类别可以为带有所述目标标识,第二类别可以为不带有所述目标标识。当训练数据为合同时,则生成的数据分类结果可以为带有废弃印章的废弃合同,或者不带有废弃印章的非废弃合同。
本发明提供的基于人工智能的数据分类方法,能够获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本,利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框,利用改进的NMS算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框,采用Softmax-NMS以改进原有的NMS算法,将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔,不同于传统的特征提取方式仅采用最后一层进行特征提取,本实施方式将每一个卷积神经网络层的特征都进行特征融合,形成特征金字塔,实现不同维度的特征融合,使提取的特征更加全面、细致,表达也更清晰,将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型,进而结合改进的Softmax-NMS及特征融合后得到的特征金字塔训练得到所述分类模型,由于特征处理更加细致,不仅关注到图像的整体特征,更关注到文字等细节特征,使提取的特征更加清晰,进而有效提升了分类模型的准确度,使模型的分类效果更好,获取目标数据,并将所述目标数据输入至所述分类模型,获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果,进而实现目标数据的自动分类。
需要说明的是,为了进一步保证数据的安全性,可以将分类模型部署于区块链,以避免数据被恶意篡改。
图2是本发明实施例二提供的基于人工智能的数据分类装置的结构图。
在一些实施例中,所述基于人工智能的数据分类装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的数据分类装置20中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的数据分类的功能。
本实施例中,所述基于人工智能的数据分类装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:处理模块201、检测模块202、筛选模块203、提取模块204、训练模块205、输出模块206、输入模块207及生成模块208。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述处理模块201,用于获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本。
在本实施例中,所述训练数据可以从目标对象存储器中获取,训练数据可以是指将要进行分类的数据,目标对象可以是某一个或者某几个指定公司。在保险场景中,训练数据可以为合同,则对训练数据进行分类为对合同进行分类。
在本发明的至少一个实施例中,所述处理模块201对所述训练数据进行预处理,得到正样本及负样本包括:
从所述训练数据中获取带有目标标识的第一数据;
对所述第一数据进行数据扩充处理,得到正样本;
从所述训练数据中获取不带有所述目标标识的第二数据,得到负样本。
其中,目标标识可以为废弃印章,带有废弃印章的合同称之为废弃合同,不带有废弃印章的合同称之为非废弃合同。
本实施例中将带有废弃印章的合同确定为正样本,将不带有废弃印章的合同确定为负样本。
由于废弃合同的数量本身是有限的,因此,为了将合同中的废弃合同准确的分类出来,本实施例可以对带有废弃印章的合同进行数据扩充处理,例如,几何变换,反转,裁剪等,从而扩充带有废弃印章的合同的数量,即扩充正样本的数量。增加了正样本的数量,相当于增加了训练模型的样本的数量,模型的训练样本的数量的增加,能够提高模型训练的精度。
所述检测模块202,用于利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框。
Faster-RCNN(Faster-Regions with CNN features)为通过区域提议网络实现实时目标检测。输入一张图片至Faster-RCNN中,Faster-RCNN不仅能够检测出该张图片中的对象,还能用锚定框(例如,矩形框)框选出这些对象的位置以及这些位置的置信概率。
分别将正样本和负样本输入至Faster-RCNN网络中,采用Faster-RCNN(Faster-Regions with CNN features)主干网络在所述正样本及所述负样本中进行目标标识的检测,例如,废弃印章的检测。当在正样本或者负样本中检测到了目标标识,则用锚定框框选出目标标识所在的区域,例如,废弃印章所在的区域。由于锚定框框选出的区域中有些是真实的目标标识,有些是误检测的,因此,将锚定框框选出的区域确定为候选区域。
本实施例中,可以在正样本中检测到一个或者多个对象,也可以在负样本中检测到一个或者多个对象,不同的对象可以用不同的锚定框进行框选。
所述筛选模块203,用于利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框。
在本发明的至少一个实施例中,所述筛选模块203利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框包括:
获取所述至少一个初始候选框中每个初始候选框的置信度;
根据每个初始候选框的置信度计算每个初始候选框的softmax;
对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值;
从所述至少一个初始候选框中删除所述置信度分值小于配置分值的初始候选框,得到所述至少一个中间候选框。
传统的非极大值抑制算法(Non-Maximum Suppression,NMS)只是简单地进行置信度分值的排序,再剔除较小置信度分值对应的候选框,本实施方式采用Softmax-NMS(基于Softmax的非极大值抑制算法)以改进原有的NMS算法,即:计算置信度分值的softmax,并进行高斯加权,然后再进行置信度分值的排序,并将配置分值作为阈值,从而剔除小于所述阈值的候选框。
在本发明的至少一个实施例中,所述对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值包括:
获取softmax最大的初始候选框;
计算所述softmax最大的初始候选框与每个初始候选框的交并比;
根据每个初始候选框的softmax及对应的所述交并比计算得到每个初始候选框的置信度分值。
具体地,采用下述公式对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值:
Figure 456278DEST_PATH_IMAGE001
其中,
Figure 886122DEST_PATH_IMAGE002
表示第i个初始候选框的置信度分值,
Figure 127748DEST_PATH_IMAGE003
表示第i个初始候选框的softmax,M为softmax最大的初始候选框,
Figure 465188DEST_PATH_IMAGE004
为第i个初始候选框,σ为参数值。
Figure 108659DEST_PATH_IMAGE005
表示softmax最大的初始候选框与第i个初始候选框的交并比。交并比是候选框与原标记框的交叠率,即,交集与并集的比值。关于两个区域的交并比的计算过程,本发明不再详细阐述。
本实施例采用Softmax-NMS,不再直接去除分数值小于阈值的候选框,而是降低候选框的分数值,一方面解决了NMS当中分数值的不连续性,另外,Softmax-NMS还能够更加方便的引用到目标检测当中。
所述提取模块204,用于将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔。
残差网络(Resnet)能够将前若干层的某一层数据输出直接跳过多层引入到后面数据层的输入部分。典型的残差网络有resnet50和resnet101等。本实施例可以将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔。
在本发明的至少一个实施例中,所述提取模块204将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔包括:
获取所述残差网络的所有卷积神经网络层,其中,除所述所有卷积神经网络层的首层外,每个卷积神经网络层的输入为相邻的上一层的输出,每个卷积神经网络层的输出为相邻的下一层的输入;
将所述至少一个中间候选框输入至所述所有卷积神经网络层的首层,并获取所述所有卷积神经网络层的末层的输出作为所述特征金字塔。
例如:ResNet50包括5个卷积神经网络模块,即5个卷积神经网络层,分别是:conv1,conv2_x,conv3_x,conv4_x,conv5_x,其中,conv1为所述首层,conv5_x为所述末层。将Softmax-NMS筛选后得到的候选框区域输入至conv1,得到conv1的输出y1;将y1输入至conv2_x,得到conv2_x的输出y2;将y2输入至conv3_x,得到conv3_x的输出y3;将y3输入至conv4_x,得到conv4_x的输出y4;将y4输入至conv5_x,得到conv5_x的输出y5;y5即为所述特征金字塔。
在上述实施方式中,不同于传统的特征提取方式仅采用最后一层进行特征提取,本实施方式将每一个卷积神经网络层的特征都进行特征融合,形成特征金字塔,实现不同维度的特征融合,使提取的特征更加全面、细致,表达也更清晰。
所述训练模块205,用于将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型。
由于所述至少一个中间候选框是通过基于Softmax的非极大值抑制算法(Softmax-NMS),从至少一个初始候选框中筛选得到的,而特征金字塔为将每一个卷积神经网络层的特征进行特征融合得到的,因此,将所述至少一个中间候选框及所述特征金字塔作为所述Faster-RCNN网络的输入,实现了将改进的Softmax-NMS及特征融合得到的特征金字塔的结合并训练得到所述分类模型。特征金字塔关注的是图像的整体特征,至少一个中间候选框更关注的是文字等细节特征,因此,将特征金字塔和至少一个中间候选框共同作为Faster-RCNN网络的输入,不仅能关注到全局特征,还能兼顾局部细节,使提取的特征更加清晰,进而有效提升了分类模型的准确度,使模型的分类效果更好。
在本发明的至少一个实施例中,由于所述分类模型的目的是检测到带有废弃印章的区域,以确定是否为废弃合同,因此,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,进一步筛选出所述至少一个中间候选框。
具体地,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,所述输出模块206,用于:
获取所述Faster-RCNN网络的边框回归层;
利用所述边框回归层对所述至少一个中间候选框及所述特征金字塔进行边框回归,得到回归特征;
获取所述Faster-RCNN网络的ROIAlign层;
利用所述ROIAlign层对所述回归特征进行池化处理,得到目标候选框及对应的概率值作为所述Faster-RCNN网络的输出。
所述输入模块207,用于获取目标数据,并将所述目标数据输入至所述分类模型。
在本实施例中,所述目标数据可以由用户上传,本发明不限制。目标数据为待分类的数据,例如,待分类的合同。
在其他实施例中,为了定期对目标数据进行分类,以便于分类存储,还可以配置为从指定数据库中定期获取所述目标数据。
所述生成模块208,用于获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
在本发明的至少一个实施例中,所述生成模块208获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果包括:
从所述分类模型的输出中获取预测类别及概率值;
获取预设分类阈值;
当所述概率值大于或者等于所述分类阈值时,生成所述目标数据为第一类别的数据分类结果;或者
当所述概率值小于所述分类阈值时,生成所述目标数据为第二类别的数据分类结果。
示例性的,当所述分类模型的输出为:所述训练数据带有所述目标标识,概率为96%。假设预设分类阈值为95%时,由于96%大于95%,则生成所述目标数据为第一类别的数据分类结果。假设所述预设分类阈值为97%时,由于96%小于97%,则生成所述目标数据为第二类别的数据分类结果。第一类别可以为带有所述目标标识,第二类别可以为不带有所述目标标识。当训练数据为合同时,则生成的数据分类结果可以为带有废弃印章的废弃合同,或者不带有废弃印章的非废弃合同。
本发明实施例提供的基于人工智能的数据分类装置,能够获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本,利用Faster-RCNN网络检测所述正样本及所述负样本,得到至少一个初始候选框,利用改进的NMS算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框,采用Softmax-NMS以改进原有的NMS算法,将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔,不同于传统的特征提取方式仅采用最后一层进行特征提取,本实施方式将每一个卷积神经网络层的特征都进行特征融合,形成特征金字塔,实现不同维度的特征融合,使提取的特征更加全面、细致,表达也更清晰,将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型,进而结合改进的Softmax-NMS及特征融合后得到的特征金字塔训练得到所述分类模型,由于特征处理更加细致,不仅关注到图像的整体特征,更关注到文字等细节特征,使提取的特征更加清晰,进而有效提升了分类模型的准确度,使模型的分类效果更好,获取目标数据,并将所述目标数据输入至所述分类模型,获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果,进而实现目标数据的自动分类。
需要说明的是,为了进一步保证数据的安全性,可以将分类模型部署于区块链,以避免数据被恶意篡改。
参阅图3所示,为本发明实施例三提供的计算机设备的结构示意图。在本发明较佳实施例中,所述计算机设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的计算机设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述计算机设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述计算机设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述计算机设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述计算机设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的数据分类方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述计算机设备3的控制核心(Control Unit),利用各种接口和线路连接整个计算机设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行计算机设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的数据分类方法的全部或者部分步骤;或者实现基于人工智能的数据分类装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(CentralProcessing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述计算机设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述计算机设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,计算机设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。本发明陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (9)

1.一种基于人工智能的数据分类方法,其特征在于,所述方法包括:
获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本;
利用Faster-RCNN网络检测所述正样本及所述负样本中的目标标识,得到至少一个初始候选框;
利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框,包括:获取所述至少一个初始候选框中每个初始候选框的置信度;根据每个初始候选框的置信度计算每个初始候选框的softmax;对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值;从所述至少一个初始候选框中删除所述置信度分值小于配置分值的初始候选框,得到所述至少一个中间候选框;
将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔;
将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型;
获取目标数据,并将所述目标数据输入至所述分类模型;
获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
2.如权利要求1所述的基于人工智能的数据分类方法,其特征在于,所述对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值包括:
获取softmax最大的初始候选框;
计算所述softmax最大的初始候选框与每个初始候选框的交并比;
根据每个初始候选框的softmax及对应的所述交并比计算得到每个初始候选框的置信度分值。
3.如权利要求2所述的基于人工智能的数据分类方法,其特征在于,所述将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔包括:
获取所述残差网络的所有卷积神经网络层,其中,除所述所有卷积神经网络层的首层外,每个卷积神经网络层的输入为相邻的上一层的输出,每个卷积神经网络层的输出为相邻的下一层的输入;
将所述至少一个中间候选框输入至所述所有卷积神经网络层的首层,并获取所述所有卷积神经网络层的末层的输出,作为所述特征金字塔。
4.如权利要求1至3中任意一项所述的基于人工智能的数据分类方法,其特征在于,在将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络后,所述方法还包括:
获取所述Faster-RCNN网络的边框回归层;
利用所述边框回归层对所述至少一个中间候选框及所述特征金字塔进行边框回归,得到回归特征;
获取所述Faster-RCNN网络的ROIAlign层;
利用所述ROIAlign层对所述回归特征进行池化处理,得到目标候选框及对应的概率值,作为所述Faster-RCNN网络的输出。
5.如权利要求4所述的基于人工智能的数据分类方法,其特征在于,所述对所述训练数据进行预处理,得到正样本及负样本包括:
从所述训练数据中获取带有目标标识的第一数据;
对所述第一数据进行数据扩充处理,得到正样本;
从所述训练数据中获取不带有所述目标标识的第二数据,得到负样本。
6.如权利要求4所述的基于人工智能的数据分类方法,其特征在于,所述获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果包括:
从所述分类模型的输出中获取预测类别及概率值;
获取预设分类阈值;
当所述概率值大于或者等于所述分类阈值时,生成所述目标数据为第一类别的数据分类结果;或者
当所述概率值小于所述分类阈值时,生成所述目标数据为第二类别的数据分类结果。
7.一种基于人工智能的数据分类装置,其特征在于,所述装置包括:
处理模块,用于获取训练数据,并对所述训练数据进行预处理,得到正样本及负样本;
检测模块,用于利用Faster-RCNN网络检测所述正样本及所述负样本中的目标标识,得到至少一个初始候选框;
筛选模块,用于利用改进的非极大值抑制算法对所述至少一个初始候选框进行筛选,得到至少一个中间候选框,包括:获取所述至少一个初始候选框中每个初始候选框的置信度;根据每个初始候选框的置信度计算每个初始候选框的softmax;对每个初始候选框的softmax进行高斯加权处理,得到每个初始候选框的置信度分值;从所述至少一个初始候选框中删除所述置信度分值小于配置分值的初始候选框,得到所述至少一个中间候选框;
提取模块,用于将所述至少一个中间候选框输入至改进的残差网络进行特征提取,得到特征金字塔;
训练模块,用于将所述至少一个中间候选框及所述特征金字塔输入至所述Faster-RCNN网络,并根据所述Faster-RCNN网络的输出调整Faster-RCNN网络的参数,直至所述Faster-RCNN网络收敛,得到分类模型;
输入模块,用于获取目标数据,并将所述目标数据输入至所述分类模型;
生成模块,用于获取所述分类模型的输出,并根据所述分类模型的输出生成数据分类结果。
8.一种计算机设备,其特征在于,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至6中任意一项所述的基于人工智能的数据分类方法。
9.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任意一项所述的基于人工智能的数据分类方法。
CN202110823243.5A 2021-07-21 2021-07-21 基于人工智能的数据分类方法、装置、计算机设备及介质 Active CN113269190B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110823243.5A CN113269190B (zh) 2021-07-21 2021-07-21 基于人工智能的数据分类方法、装置、计算机设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110823243.5A CN113269190B (zh) 2021-07-21 2021-07-21 基于人工智能的数据分类方法、装置、计算机设备及介质

Publications (2)

Publication Number Publication Date
CN113269190A CN113269190A (zh) 2021-08-17
CN113269190B true CN113269190B (zh) 2021-10-12

Family

ID=77236986

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110823243.5A Active CN113269190B (zh) 2021-07-21 2021-07-21 基于人工智能的数据分类方法、装置、计算机设备及介质

Country Status (1)

Country Link
CN (1) CN113269190B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107808157B (zh) * 2017-11-08 2021-08-13 广东工业大学 一种雷管编码定位及识别的方法及装置
CN109034221A (zh) * 2018-07-13 2018-12-18 马丁 一种宫颈细胞学图像特征的处理方法及其装置
JP6612487B1 (ja) * 2019-05-31 2019-11-27 楽天株式会社 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム
CN112149697A (zh) * 2019-06-27 2020-12-29 商汤集团有限公司 指示灯的指示信息识别方法及装置、电子设备和存储介质
CN111079795B (zh) * 2019-11-21 2023-04-07 西安工程大学 基于cnn的分片多尺度特征融合的图像分类方法
CN111243662B (zh) * 2020-01-15 2023-04-21 云南大学 基于改进XGBoost的泛癌症基因通路预测方法、系统和存储介质
CN111444939B (zh) * 2020-02-19 2022-06-28 山东大学 电力领域开放场景下基于弱监督协同学习的小尺度设备部件检测方法
CN111860670B (zh) * 2020-07-28 2022-05-17 平安科技(深圳)有限公司 域自适应模型训练、图像检测方法、装置、设备及介质

Also Published As

Publication number Publication date
CN113269190A (zh) 2021-08-17

Similar Documents

Publication Publication Date Title
WO2019223139A1 (zh) 一种风险预测方法、装置、存储介质和服务器
CN111046959A (zh) 模型训练方法、装置、设备和存储介质
CN111695392B (zh) 基于级联的深层卷积神经网络的人脸识别方法及系统
WO2020068868A1 (en) Object detection machine learning
CN111814775B (zh) 目标对象异常行为识别方法、装置、终端及存储介质
WO2021126243A1 (en) Systems and methods for detecting and responding to anomalous traffic conditions
CN112200081A (zh) 异常行为识别方法、装置、电子设备及存储介质
WO2022141858A1 (zh) 行人检测方法、装置、电子设备及存储介质
CN111539425A (zh) 一种车牌识别方法、存储介质及电子设备
CN110796039B (zh) 一种面部瑕疵检测方法、装置、电子设备及存储介质
CN114937179B (zh) 垃圾图像分类方法、装置、电子设备及存储介质
CN112137591A (zh) 基于视频流的目标物位置检测方法、装置、设备及介质
CN111046746A (zh) 一种车牌检测方法及装置
CN110163084A (zh) 操作员动作监督方法、装置及电子设备
CN113269190B (zh) 基于人工智能的数据分类方法、装置、计算机设备及介质
CN112613367A (zh) 票据信息文本框获取方法、系统、设备及存储介质
CN116959099A (zh) 一种基于时空图卷积神经网络的异常行为识别方法
CN114245204B (zh) 基于人工智能的视频面签方法、装置、电子设备及介质
CN115512098A (zh) 一种桥梁电子化巡检系统及巡检方法
CN111275035B (zh) 一种识别背景信息的方法及系统
CN111860661A (zh) 基于用户行为的数据分析方法、装置、电子设备及介质
CN114842205B (zh) 车损检测方法、装置、设备及存储介质
CN111860357B (zh) 基于活体识别的出勤率计算方法、装置、终端及存储介质
CN117475367B (zh) 基于多规则协调的污水图像处理方法及系统
Jadhav et al. Application of Communication Computational Intelligence and Learning: Proceeding of National Conference on Communication, Computational Intelligence and Learning (NCCC IL 2021), December 16th–17th Pune, India

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant