CN110517225B - Ai影像识别方法、装置、设备及存储介质 - Google Patents
Ai影像识别方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN110517225B CN110517225B CN201910664161.3A CN201910664161A CN110517225B CN 110517225 B CN110517225 B CN 110517225B CN 201910664161 A CN201910664161 A CN 201910664161A CN 110517225 B CN110517225 B CN 110517225B
- Authority
- CN
- China
- Prior art keywords
- image
- preset
- processing
- target
- layering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000012545 processing Methods 0.000 claims abstract description 178
- 208000024891 symptom Diseases 0.000 claims abstract description 81
- 239000011159 matrix material Substances 0.000 claims description 46
- 238000011176 pooling Methods 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 28
- 238000012360 testing method Methods 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 15
- 238000004891 communication Methods 0.000 claims description 13
- 230000004913 activation Effects 0.000 claims description 10
- 230000006870 function Effects 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 5
- 238000007499 fusion processing Methods 0.000 claims description 5
- 238000011221 initial treatment Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 10
- 238000001994 activation Methods 0.000 description 9
- 238000007781 pre-processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000003213 activating effect Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 206010010214 Compression fracture Diseases 0.000 description 1
- 206010050296 Intervertebral disc protrusion Diseases 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005549 size reduction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/80—Geometric correction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/247—Aligning, centring, orientation detection or correction of the image by affine transforms, e.g. correction due to perspective effects; Quadrilaterals, e.g. trapezoids
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Radiology & Medical Imaging (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种AI影像识别方法、装置、设备及存储介质,该方法包括:在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。本发明基于智能决策方式解决现有技术中,临床AI影像的识别准确度低,识别效率低的技术问题。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种AI影像识别方法、装置、设备及存储介质。
背景技术
在临床AI影像识别中,常常需要不同的AI影像医生人为结合AI影像征象,患者年龄等多种信息综合判断,才能给出精准的识别结果,然而,由于AI影像医生的人手以及经验严重不足,且AI影像病灶对应多个征象特征,而同种征象特征分布在不同位置可能属于不同的病灶,因而造成现有临床AI影像的识别准确度低,识别效率低的技术问题。
发明内容
本发明的主要目的在于提供一种AI影像识别方法、装置、设备及存储介质,旨在解决现有技术中,临床AI影像的识别准确度低,识别效率低的技术问题。
为实现上述目的,本发明提供一种AI影像识别方法,所述AI影像识别方法包括:
在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
可选地,所述根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置步骤之前包括:
获取预设的AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,其中,AI影像的分层征象位置不同,对应的征象类别不同;
将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述AI影像模型。
可选地,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤包括:
对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
可选地,所述对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
根据所述图像权值矩阵,对所述分层后的所述预处理图像进行卷积处理,得到卷积处理结果;
对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
可选地,所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
将所述卷积处理结果分割为多个大小一致的第二预设尺寸的图像矩阵;
获取所述第二预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述第二预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
可选地,所述对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别步骤包括:
通过所述AI影像模型中至少两个以上的各预测子模型分别对所述初始处理结果进行预测,其中,所述各个预测子模型中进行预测的预设阀值不同;
根据所述各个预设阀值,确定所述初始处理结果对应的各个概率预测值,融合处理所述各个概率预测值,以得到所述分层后的所述预处理图像的目标征象类别。
可选地,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤之后包括:
根据所述处理结果生成AI影像的识别报告,以邮件形式将所述识别报告发送给预设的AI影像人员。
本发明还提供一种AI影像识别装置,所述AI影像识别装置包括:
检测模块,用于在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
分层模块,用于根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
识别处理模块,用于对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
可选地,所述AI影像识别装置还包括:
获取层模块,用于获取预设的AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例;
训练模块,用于将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,其中,AI影像的分层征象位置不同,对应的征象类别不同;
测试模块,用于将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述AI影像模型。
可选地,所述识别处理模块包括:
交替处理单元,用于对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
输出单元,用于对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
可选地,所述交替处理单元包括:
卷积处理子单元,用于根据所述图像权值矩阵,对所述分层后的所述预处理图像进行卷积处理,得到卷积处理结果;
最大池化处理子单元,用于对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
交替处理子单元,用于根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
可选地,所述最大池化处理子单元用于实现:
将所述卷积处理结果分割为多个大小一致的第二预设尺寸的图像矩阵;
获取所述第二预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述第二预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
可选地,所述输出单元包括:
预测子单元,用于通过所述AI影像模型中至少两个以上的各预测子模型分别对所述初始处理结果进行预测,其中,所述各个预测子模型中进行预测的预设阀值不同;
融合子单元,用于根据所述各个预设阀值,确定所述初始处理结果对应的各个概率预测值,融合处理所述各个概率预测值,以得到所述分层后的所述预处理图像的目标征象类别。
可选地,所述AI影像识别装置还包括:
发送模块,用于根据所述处理结果生成AI影像的识别报告,以邮件形式将所述识别报告发送给预设的AI影像人员。
此外,为实现上述目的,本发明还提供一种AI影像识别设备,所述AI影像识别设备包括:存储器、处理器,通信总线以及存储在所述存储器上的AI影像识别程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述AI影像识别程序,以实现以下步骤:
在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
此外,为实现上述目的,本发明还提供一种存储介质,所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序可被一个或者一个以上的处理器执行以用于:
在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
本发明通过在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。在本申请中,不再需要将临床AI影像发送给AI影像医生进行人为识别,而是在检测到待识别AI影像时,进行相应的预处理,然后将预处理图像分发至对应的AI影像模型中,而AI影像模型都是经过训练后能够对应对AI影像进行征象位置以及征象类别的准确识别的模型,因而,在本实施例中实现自动对所述待识别AI影像进行识别,因而,提升了临床AI影像的识别准确度,提升了现有临床AI影像的识别效率。解决了现有临床AI影像的识别准确度低,识别效率低的技术问题。
附图说明
图1为本发明AI影像识别方法第一实施例的流程示意图;
图2为本发明AI影像识别方法中根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置步骤之前的细化流程示意图;
图3是本发明实施例方法涉及的硬件运行环境的设备结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种AI影像识别方法,在本发明AI影像识别方法的第一实施例中,参照图1,所述AI影像识别方法包括:
步骤S10,在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
步骤S20,根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
步骤S30,对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
具体步骤如下:
步骤S10,在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
在本实施例中,AI影像识别方法应用于AI影像识别装置中,在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像,对所述待识别AI影像进行预处理的目的在于确保不同规格的待识别AI影像符合AI影像模型的初始输入规则。
预设对比度拉伸包括对待识别AI影像的影像图像与影像背景的亮度对比度的拉伸,该预设对比度可以是4倍不同亮度的对比度拉伸,另外,第一预设尺寸大小调整包括如大小缩小、大小扩大等操作。
用以具体实施例进行说明,在检测到两张不同大小的待识别AI影像时,若其中一张待识别AI影像大小为128*128*128的小图块,另一张待识别AI影像大小为64*64*64的小图块,而AI影像模型的初始输入图像块是90*90*90的规格要求时,对128*128*128的小图块进行缩小处理,对64*64*64的小图块进行扩大处理。
需要说明的是,预处理过程还包括其他预处理方式,具体根据实际处理需求进行调整。
步骤S20,根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
在得到预处理图像后,根据所述AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置,具体地,分层处理过程中可以使用自适应阈值最大类间方差法,其中,自适应阈值最大类间方差法,即是将所述待处理图像按照灰度特征分成图像和背景两类,以提取特征信息,以得到组织区域,在得到组织区域后,将整个组织区域进行分层识别,分层识别即是将组织区域的区域特征与预设的各个分层的区域特征进行比对,以确定所述待识别AI影像对应的目标分层征象位置。
步骤S30,对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
在分层后,对分层后的所述预处理图像分别进行目标征象类别识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出,需要说明的是,在对分层后的所述预处理图像分别进行目标征象类别识别处理过程中,根据得到目标征象类别的具体图像的类别位置,进行同步输出,用以具体实施例进行说明,目标分层征象位置包括类别位置1以及类别位置2,该类别位置1中对应的是第一目标征象类别,该类别位置2对应的是第二目标征象类别,则在输出预处理图像分别将第一目标征象类别与类别位置1作为处理结果并输出,将第二目标征象类别与类别位置2作为处理结果并输出。
具体地,预设的AI影像模型对分层后的所述预处理图像的识别处理涉及卷积、池化、激活以及分类处理过程。
参照图2,在预设的AI影像模型对分层后的所述预处理图像进行卷积、池化、激活以及分类处理前,是需要得到该预设的AI影像模型的,以实现能够对分层后的所述预处理图像进行准确识别处理,因而,所述根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置步骤之前包括:
步骤A1,获取预设的AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例;
在本实施例中,预先存储有AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例,需要说明的是,该影像用例可以通过有放回方式组成多个第一用例以及对应多个第二用例,例如,共有N个影像用例,每次从中随机挑选70%的影像用例作为第一用例,剩下的30%的影像用例作为第一用例,以得到多个第一用例与多个第二用例,得到多个第一用例以及对应多个第二用例的目的在于确保训练模型过程中的客观性。
步骤A2,将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,其中,AI影像的分层征象位置不同,对应的征象类别不同;
将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,例如,所述征象类别包括腰椎间盘膨出、腰椎间盘压缩骨折,腰椎间盘软化,腰椎间盘突出等,AI影像的分层征象位置不同,对应的征象类别不同,例如,腰1中的腰椎间盘膨出1与腰2中的腰椎间盘膨出2不同,具体地,针对该腰1中的腰椎间盘膨出1而言,征象特征指的是具体的腰椎间盘膨出1的图像统计特性,该图像统计特性一般为多个,因而,腰椎间盘膨出1对应有多个征象类别,具体每个征象类别的占比不同,在得到每个征象类别的占比后,才能准确识别腰椎间盘膨出1,而得到腰椎间盘膨出1具体每个征象类别的占比需要不断进行调整训练,该占比即是所述腰椎间盘膨出的每个征象类别的图像权值矩阵,在调整训练过程中,不断进行图像权值矩阵增大或者缩小等调整处理,最终得到腰1中腰椎间盘膨出1的各个图像权值矩阵,同样地,得到腰2中腰椎间盘膨出2的各个图像权值矩阵,得到腰椎间盘压缩骨折,腰椎间盘软化,腰椎间盘突出等分别对应的多个征象类别所分别对应的征象特征的图像权值矩阵。
步骤A3,将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述AI影像模型。
在训练完成后,将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,若测试确定该调整训练后的所述基础识别网络模型的测试的测试准确度大于预设准确度时,将所述调整训练后的所述基础识别网络模型作为目标识别型,其中,若测试确定该调整训练后的所述基础识别网络模型的测试的测试准确度小于预设准确度时,继续训练调整所述调整训练后的所述基础识别网络模型,以最终训练得到AI影像模型。
在得到AI影像模型后,根据该AI影像模型对待识别AI影像进行处理,具体地,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤包括:
步骤S31,对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
在本实施例中,对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果,其中,预设次数可以为3次。
具体地,所述对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
步骤B1,根据所述图像权值矩阵,对所述分层后的所述预处理图像进行卷积处理,得到卷积处理结果;
其中,卷积过程可以理解为:图像的一部分的征象特征与其他部分是一样的,即是在这一部分学习的征象特征也能出现在相应另一部分上,因而将学习到的征象特征作为探测器,应用到这个图像的任意地方中去,即通过小范围图像所学习到的征象特征跟原本的大尺寸的图像作卷积,在数学上,卷积可以是相应图像的特性矩阵与预先的多个征象特征对应探测矩阵相乘最后再图像权值求和,得到卷积处理结果。
在本实施例中,根据所述图像权值矩阵,将分层后的所述预处理图像对应的像素矩阵与预设征象特征对应的探测矩阵或者像素矩阵相乘,最后图像权值求和,得到卷积处理结果。
步骤B2,对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
在得到卷积处理结果后,继续进行最大池化处理而不是平均池化处理。
所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
步骤C1,将所述卷积处理结果分割为多个大小一致的第二预设尺寸的图像矩阵;
例如将所述卷积处理结果分割为多个5*5*5维的图像矩阵。
步骤C2,获取所述第二预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述第二预设尺寸的图像矩阵,以得到新的图像矩阵;
获取所述第二预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述第二预设尺寸的图像矩阵,以得到新的图像矩阵,如5*5*5维的图像矩阵中最大像素值为1,则将1代替所述5*5*5维的图像矩阵,由于卷积处理结果中包括多个5*5*5维的图像矩阵,因而,最后能够得到新的图像矩阵。
步骤C3,将所述新的图像矩阵设为所述最大池化处理结果。
在得到新的图像矩阵后,将所述新的图像矩阵设为所述最大池化处理结果。
步骤B3,根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
上述C1-C3为一次卷积以及最大池化交替处理过程,在本实施例中,需要进行预设次数的卷积以及最大池化的交替处理过程,并进行预设激活函数的激活处理以得到初始处理结果,其中,激活函数可以为为sigmoid函数。
步骤S32,对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
在得到初始处理结果后,对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
本发明通过在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。在本申请中,不再需要将临床AI影像发送给AI影像医生进行人为识别,而是在检测到待识别AI影像时,进行相应的预处理,然后将预处理图像分发至对应的AI影像模型中,而AI影像模型都是经过训练后能够对应对AI影像进行征象位置以及征象类别的准确识别的模型,因而,在本实施例中实现自动对所述待识别AI影像进行识别,因而,提升了临床AI影像的识别准确度,提升了现有临床AI影像的识别效率。解决了现有临床AI影像的识别准确度低,识别效率低的技术问题。
进一步地,本发明提供AI影像识别方法的另一实施例,在该实施例中,所述对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别步骤包括:
步骤D1,通过所述AI影像模型中至少两个以上的各预测子模型分别对所述初始处理结果进行预测,其中,所述各个预测子模型中进行预测的预设阀值不同;
在本实施例中,通过所述AI影像模型中至少两个以上的各预测子模型分别对所述初始处理结果进行预测,具体地,可以是通过2个预测子模型(各个预测子模型中进行预测的预设阀值不同),即采用2个预测子模型融合方式对所述初始处理结果进行预测。
步骤D2,根据所述各个预设阀值,确定所述初始处理结果对应的各个概率预测值,融合处理所述各个概率预测值,以得到所述分层后的所述预处理图像的目标征象类别。
可以根据2个预设阀值,确定所述初始处理结果对应的2个概率预测值,具体地,将初始处理结果与对应各个预设阀值进行比对,得到不同的差值,根据该差值的大小,得到2个概率预测值,融合处理所述2个概率预测值,判断融合处理后的概率预测值是否在对应的征象类别的概率预测值区间内,以得到所述分层后的所述预处理图像的目标征象类别。
在本实施例中,通过通过所述AI影像模型中至少两个以上的各预测子模型分别对所述初始处理结果进行预测,其中,所述各个预测子模型中进行预测的预设阀值不同;根据所述各个预设阀值,确定所述初始处理结果对应的各个概率预测值,融合处理所述各个概率预测值,以得到所述分层后的所述预处理图像的目标征象类别。在本实施例中,消除预测过程中的偶发性,提升了预测的准确性。
进一步地,本发明提供基于深度学习的影像识别方法的另一实施例,在该实施例中,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤之后包括:
步骤S40,根据所述处理结果生成AI影像识别的识别报告,以邮件形式将所述识别报告发送给预设的AI影像识别人员。
在本实施例中,根据所述处理结果生成AI影像识别的识别报告,以邮件形式将所述识别报告发送给预设的AI影像识别人员,以供AI影像识别人员进行后续处理,其中,以邮件形式将所述识别报告发送给预设的AI影像识别人员能够留下发送记录,便于后续查询。
在本实施例中,根据所述处理结果生成AI影像识别的识别报告,以邮件形式将所述识别报告发送给预设的AI影像识别人员,提升了后续查询的查询效率。
参照图3,图3是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
本发明实施例AI影像识别设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等终端设备。
如图3所示,该AI影像识别设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该AI影像识别设备还可以包括目标用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。目标用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选目标用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图3中示出的AI影像识别设备结构并不构成对AI影像识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图3所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及AI影像识别程序。操作系统是管理和控制AI影像识别设备硬件和软件资源的程序,支持AI影像识别程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与AI影像识别设备中其它硬件和软件之间通信。
在图3所示的AI影像识别设备中,处理器1001用于执行存储器1005中存储的AI影像识别程序,实现上述任一项所述的AI影像识别方法的步骤。
本发明AI影像识别设备具体实施方式与上述AI影像识别方法各实施例基本相同,在此不再赘述。
本发明还提供一种AI影像识别装置,所述AI影像识别装置包括:
检测模块,用于在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
分层模块,用于根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
识别处理模块,用于对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
本发明AI影像识别装置具体实施方式与上述AI影像识别方法各实施例基本相同,在此不再赘述。
本发明提供了一种存储介质,所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的AI影像识别方法的步骤。
本发明存储介质具体实施方式与上述AI影像识别方法各实施例基本相同,在此不再赘述。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利处理范围内。
Claims (9)
1.一种AI影像识别方法,其特征在于,所述AI影像识别方法包括:
在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出;
所述根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置步骤之前包括:
获取预设的AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例;
将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,其中,AI影像的分层征象位置不同,对应的征象类别不同;
将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述AI影像模型。
2.如权利要求1所述的AI影像识别方法,其特征在于,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤包括:
对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果;
对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出。
3.如权利要求2所述的AI影像识别方法,其特征在于,所述对所述分层后的所述预处理图像进行预设次数的卷积与最大池化交替处理,得到初始处理结果步骤包括:
根据所述图像权值矩阵,对所述分层后的所述预处理图像进行卷积处理,得到卷积处理结果;
对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果;
根据所述预设次数,对所述最大池化处理结果再次进行相应次数的卷积与最大池化交替处理,并进行预设激活函数的激活处理以得到初始处理结果。
4.如权利要求3所述的AI影像识别方法,其特征在于,所述对所述卷积处理结果进行最大池化处理,以得到最大池化处理结果步骤包括:
将所述卷积处理结果分割为多个大小一致的第二预设尺寸的图像矩阵;
获取所述第二预设尺寸的图像矩阵中的最大像素值,将所述最大像素值代替所述第二预设尺寸的图像矩阵,以得到新的图像矩阵;
将所述新的图像矩阵设为所述最大池化处理结果。
5.如权利要求2所述的AI影像识别方法,其特征在于,所述对所述初始处理结果进行分类处理,以得到所述分层后的所述预处理图像的目标征象类别步骤包括:
通过所述AI影像模型中至少两个的各预测子模型分别对所述初始处理结果进行预测,其中,各个预测子模型中进行预测的预设阀值不同;
根据各个预设阀值,确定所述初始处理结果对应的各个概率预测值,融合处理所述各个概率预测值,以得到所述分层后的所述预处理图像的目标征象类别。
6.如权利要求1所述的AI影像识别方法,其特征在于,所述对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出步骤之后包括:
根据所述处理结果生成AI影像识别的识别报告,以邮件形式将所述识别报告发送给预设的AI影像识别人员。
7.一种AI影像识别装置,其特征在于,所述AI影像识别装置包括:
检测模块,用于在检测到待识别AI影像时,对所述待识别AI影像进行包括预设对比度拉伸以及第一预设尺寸大小调整的预处理,以得到预处理图像;
分层模块,用于根据预设的AI影像模型对所述预处理图像进行分层处理,确定所述待识别AI影像对应的目标分层征象位置;
识别处理模块,用于对分层后的所述预处理图像分别进行目标征象类别的识别处理,将所述目标分层征象位置以及对应的目标征象类别作为处理结果并输出;
所述AI影像识别装置还用于实现:
获取预设的AI影像的影像用例,挑选预设比例的所述影像用例设为第一用例,将所述影像用例中所述第一用例外的其他用例设为第二用例;将所述第一用例作为训练用例进行所述AI影像模型对应基础识别网络模型的调整训练,以调整训练所述基础识别网络模型中针对所述AI影像的多个征象类别所分别对应的征象特征的图像权值矩阵,其中,AI影像的分层征象位置不同,对应的征象类别不同;将所述第二用例作为测试用例进行调整训练后的所述基础识别网络模型的测试,以最终得到所述AI影像模型。
8.一种AI影像识别设备,其特征在于,所述AI影像识别设备包括:存储器、处理器,通信总线以及存储在所述存储器上的AI影像识别程序,
所述通信总线用于实现处理器与存储器间的通信连接;
所述处理器用于执行所述AI影像识别程序,以实现如权利要求1至6中任一项所述的AI影像识别方法的步骤。
9.一种存储介质,其特征在于,所述存储介质上存储有AI影像识别程序,所述AI影像识别程序被处理器执行时实现如权利要求1至6中任一项所述的AI影像识别方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664161.3A CN110517225B (zh) | 2019-07-19 | 2019-07-19 | Ai影像识别方法、装置、设备及存储介质 |
PCT/CN2019/117571 WO2021012508A1 (zh) | 2019-07-19 | 2019-11-12 | Ai影像识别方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910664161.3A CN110517225B (zh) | 2019-07-19 | 2019-07-19 | Ai影像识别方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110517225A CN110517225A (zh) | 2019-11-29 |
CN110517225B true CN110517225B (zh) | 2023-07-11 |
Family
ID=68623319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910664161.3A Active CN110517225B (zh) | 2019-07-19 | 2019-07-19 | Ai影像识别方法、装置、设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110517225B (zh) |
WO (1) | WO2021012508A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111275558B (zh) * | 2020-01-13 | 2024-02-27 | 上海维跃信息科技有限公司 | 用于确定保险数据的方法和装置 |
CN111415356B (zh) * | 2020-03-17 | 2020-12-29 | 推想医疗科技股份有限公司 | 肺炎征象的分割方法、装置、介质及电子设备 |
CN112651960B (zh) * | 2020-12-31 | 2024-08-20 | 上海联影智能医疗科技有限公司 | 一种图像处理方法、装置、设备及存储介质 |
CN113312979B (zh) * | 2021-04-30 | 2024-04-16 | 阿波罗智联(北京)科技有限公司 | 图像处理方法、装置、电子设备、路侧设备及云控平台 |
CN113744845A (zh) * | 2021-09-17 | 2021-12-03 | 平安好医投资管理有限公司 | 基于人工智能的医学影像处理方法、装置、设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018201647A1 (zh) * | 2017-05-05 | 2018-11-08 | 平安科技(深圳)有限公司 | 视网膜病变程度等级检测方法、装置及存储介质 |
CN109919928A (zh) * | 2019-03-06 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 医学影像的检测方法、装置和存储介质 |
CN110020582A (zh) * | 2018-12-10 | 2019-07-16 | 平安科技(深圳)有限公司 | 基于深度学习的人脸情绪识别方法、装置、设备及介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20170337682A1 (en) * | 2016-05-18 | 2017-11-23 | Siemens Healthcare Gmbh | Method and System for Image Registration Using an Intelligent Artificial Agent |
CN108229379A (zh) * | 2017-12-29 | 2018-06-29 | 广东欧珀移动通信有限公司 | 图像识别方法、装置、计算机设备和存储介质 |
CN109685749B (zh) * | 2018-09-25 | 2023-04-18 | 平安科技(深圳)有限公司 | 图像风格转换方法、装置、设备和计算机存储介质 |
CN109977832B (zh) * | 2019-03-19 | 2024-03-29 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置及存储介质 |
-
2019
- 2019-07-19 CN CN201910664161.3A patent/CN110517225B/zh active Active
- 2019-11-12 WO PCT/CN2019/117571 patent/WO2021012508A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018201647A1 (zh) * | 2017-05-05 | 2018-11-08 | 平安科技(深圳)有限公司 | 视网膜病变程度等级检测方法、装置及存储介质 |
CN110020582A (zh) * | 2018-12-10 | 2019-07-16 | 平安科技(深圳)有限公司 | 基于深度学习的人脸情绪识别方法、装置、设备及介质 |
CN109919928A (zh) * | 2019-03-06 | 2019-06-21 | 腾讯科技(深圳)有限公司 | 医学影像的检测方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021012508A1 (zh) | 2021-01-28 |
CN110517225A (zh) | 2019-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110517225B (zh) | Ai影像识别方法、装置、设备及存储介质 | |
CN106796650B (zh) | 多阶段活性确定 | |
CN110930296B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN107871001B (zh) | 音频播放方法、装置、存储介质及电子设备 | |
CN111104988B (zh) | 图像识别方法及相关装置 | |
CN110827236B (zh) | 基于神经网络的脑组织分层方法、装置、计算机设备 | |
CN110667593A (zh) | 基于深度学习的驾驶提醒方法、装置、设备及存储介质 | |
CN109859216B (zh) | 基于深度学习的测距方法、装置、设备及存储介质 | |
CN108897614A (zh) | 一种基于卷积神经网络的内存预警方法及服务端 | |
CN112084959B (zh) | 一种人群图像处理方法及装置 | |
CN111160481A (zh) | 基于深度学习的adas目标检测方法及系统 | |
CN116188929A (zh) | 小目标检测方法、小目标检测系统 | |
CN109376762A (zh) | 图像处理方法及装置 | |
CN112101543A (zh) | 神经网络模型确定方法、装置、电子设备及可读存储介质 | |
CN112306829A (zh) | 性能信息的确定方法及装置、存储介质、终端 | |
CN112102175A (zh) | 图像对比度的增强方法、装置、存储介质及电子设备 | |
CN110458015B (zh) | 基于图像识别的防自杀预警方法、装置、设备及存储介质 | |
CN111985439B (zh) | 人脸检测方法、装置、设备和存储介质 | |
CN111008604A (zh) | 预测图像获取方法、装置、计算机设备和存储介质 | |
CN115375965A (zh) | 一种目标场景识别的预处理方法、目标场景识别方法 | |
CN111539420B (zh) | 基于注意力感知特征的全景图像显著性预测方法及系统 | |
CN114519520A (zh) | 模型评估方法、装置及存储介质 | |
CN111400534B (zh) | 图像数据的封面确定方法、装置及计算机存储介质 | |
CN108154169A (zh) | 图像处理方法及装置 | |
CN113762046A (zh) | 图像识别方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |