CN108629378A - 图像识别方法和设备 - Google Patents
图像识别方法和设备 Download PDFInfo
- Publication number
- CN108629378A CN108629378A CN201810444726.2A CN201810444726A CN108629378A CN 108629378 A CN108629378 A CN 108629378A CN 201810444726 A CN201810444726 A CN 201810444726A CN 108629378 A CN108629378 A CN 108629378A
- Authority
- CN
- China
- Prior art keywords
- image
- pixel
- described image
- interested
- marked
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Eye Examination Apparatus (AREA)
Abstract
本发明提供一种图像识别方法和设备,所述方法包括:获取图像;根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点;根据所述感兴趣像素点在所述图像中的分布情况对所述感兴趣像素点中的噪声进行排除处理;利用机器学习模型对标记了经过排除处理后剩余的感兴趣像素点的所述图像进行识别,以在所述图像中标记识别目标的像素点,其中所述机器学习模型是利用标记有识别目标像素点的样本图像和标记有非识别目标像素点的样本图像进行训练得到的。
Description
技术领域
本发明涉及医疗图像处理领域,具体涉及一种图像识别方法和设备。
背景技术
利用机器学习算法和模型对图像进行识别是一种高效的方式,也是诸如自动驾驶、智能摄像、机器人等众多领域的底层技术。
利用机器学习模型(例如神经网络)进行图像识别之前,首先要使用样本图像对模型进行训练,训练的方式通常是:1.由人工在图像中标记出感兴趣目标,并生成目标区域标识信息;2.使用标注生成的标识信息和图像一同输入深度神经网络;3.训练深度神经网络,待其收敛。然后则可以利用经过训练的机器学习模型从图像中识别并标记出感兴趣目标。
对于模型的训练阶段,在上述方式中,第1步要求标注者描画出图片中所有可能为目标的区域,对于没有被描画出的目标,会被机器学习模型默认为背景,影响训练结果,进而影响识别准确度。现有的基于机器学习的图像识别方法的局限有:需要大量标注过的图片、人力成本较高,对于一些较难标注的图片如目标过于不规则、目标过小、目标过多的情况,目标的标注为一大难题。所以目前多数样本图像中只标记了单一且明显的感兴趣目标。
对于模型的输出结果,由于训练阶段所使用的样本图像中的特征比较简单,所以利用机器学习模型直接对图像进行识别时,对于复杂的图像,感兴趣区域的位置、形状、尺寸不确定性很强,由此使得模型的输出结果准确性较差。
发明内容
有鉴于此,本发明提供一种图像识别方法,包括:
获取图像;
根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点;
根据所述感兴趣像素点在所述图像中的分布情况对所述感兴趣像素点中的噪声进行排除处理;
利用机器学习模型对标记了经过排除处理后剩余的感兴趣像素点的所述图像进行识别,以在所述图像中标记识别目标的像素点,其中所述机器学习模型是利用标记有识别目标像素点的样本图像和标记有非识别目标像素点的样本图像进行训练得到的。
可选地,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
对所述图像进行预处理以增强像素点的特征;
根据预处理后的所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点。
可选地,采用下列公式对所述图像进行预处理:
dst=α·src1+β·src2+γ,
其中,dst为预处理后的图像像素矩阵,src1为所述图像的像素矩阵,src2是对所述图像进行高斯模糊处理后的图像的像素矩阵,α、β是用于控制图像融合时的占比的参数,γ是用于控制图像整体亮度的参数。
可选地,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
在所述图像中确定特定区域;
根据所述特定区域以外的像素点的像素值在所述图像中标记出感兴趣像素点。
可选地,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
将所述图像划分为多个区域,所述多个区域中的不同的区域间相互有部分重合;
分别根据所述多个区域内的像素点的像素值在所述区域中标记出感兴趣像素点。
可选地,所述将所述图像划分为多个区域,包括:
在所述图像中确定特定目标;
基于所述特定目标所在位置将所述图像划分为多个区域。
可选地,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
分别利用不同的预设阈值对所述图像进行二值化处理得到多个二值图像;
分别根据所述多个二值图像内的像素值在所述多个二值图像中标记出感兴趣像素点;
根据各个二值图像中标记的感兴趣像素点确定所述图像中的感兴趣像素点。
可选地,所述分布情况包括以下至少一项:所述感兴趣像素点在所述图像中的位置、基于临近的感兴趣像素点所确定的感兴趣区域内的像素点的数量、所述感兴趣区域的长宽比、所述感兴趣区域内感兴趣像素点所占的面积。
本发明还提供一种眼底图像识别方法,包括:利用上述图像识别方法对眼底图像进行识别,其中所述感兴趣像素点是疑似病灶处的像素点,所述特征像素点由机器学习模型识别出的病灶处的像素点。
本发明还提供一种图像识别设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述图像识别方法。
根据本发明提供的图像识别方法及设备,首先基于机器视觉的原理根据图像内像素点的像素值识别并标记出一些像素点,经此处理将会排除图像中大部分的内容,仅保留一部分作为疑似目标;然后结合被拍摄对象的具体内容,及标记出的像素点的分布对其进行排除,经此处理可以进一步从疑似目标中排除部分内容,所保留的内容特征更加明显且更符合待识别目标的特征;最后将标记有经过排除后的像素点的图像输入机器学习模型,使模型输出最终的标记结果,对于模型而言,模型只需要关注经过此前步骤所筛选出的部分图像内容,而不必去识别图像的其它部分。本方案可以减少机器学习模型所要识别的像素点的范围,模型所要识别的内容是经过预处理的像素点,这些像素点特征明显且可信度较高,由此可以提高图像识别的准确性;并且对于模型的训练过程,只需要使用一些具有明显且单一特征标记的样本图像,达到了简化样本标记工作的目的。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中的图像识别方法的流程图;
图2是利用专用设备拍摄的眼底图像;
图3为本发明实施例中的图像识别方法的流程图;
图4是增强对比度后的眼底图像;
图5是对眼底图像进行区域划分的示意图;
图6是利用机器视觉原理在眼底图像中标记疑似异常像素点的结果;
图7是对图6所示内容进行排除后的结果;
图8是利用机器学习模型对图7所示结果进行识别并标记出的结果。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本发明实施例提供一种图像识别方法,该方法可以由服务器或个人计算机等电子设备执行。如图1所示,该方法包括如下步骤:
S1,获取图像,该图像可以是普通照片、视频截图、医疗设备所拍摄的影像、专用设备所生成的影像等等。图像中包含待识别的目标。
S2,根据图像内的像素点的像素值在图像中标记出感兴趣像素点,该步骤是利用机器视觉的原理,根据像素本身的特征在图像中识别出一些疑似的感兴趣目标。具体识别方式有多种,例如可以先将图像在色彩空间上进行转换,或者调整对比度,或者做二值化处理,或者逐一根据每个点的像素值与周围临近的像素值进行比较等等,找到符合预定特征的像素点。预定特征需要根据实际应用场景来确定,例如是像素值较高或者较低的像素点等等。
S3,根据感兴趣像素点在图像中的分布情况对感兴趣像素点中的噪声进行排除处理。在前一步骤中,根据像素值确定的感兴趣像素点中通常存在较多误判的像素点即噪声,例如拍摄图像时的反光、环境中的尘埃等对成像产生影像,进而使像素失真的像素点;或者由于被拍摄目标本身及其色彩、形状等因素,使得某些前一步骤中找到的像素点不可能是感兴趣目标的一部分等。通常这些因素有一些明显的特征,例如体现在像素点在图像中的位置、像素点组成区域的形状、面积等。通过设置预定规则,可以将前一步找到的感兴趣像素点中排除一些符合预定规则也即误判的像素点。
上述分布情况包括以下至少一项:感兴趣像素点在图像中的位置、基于临近的感兴趣像素点所确定的感兴趣区域(例如外接矩形)内的像素点的数量、感兴趣区域的长宽比、感兴趣区域内感兴趣像素点所占的面积。
S4,利用机器学习模型对标记了剩余的感兴趣像素点的图像进行识别,以在图像中标记识别目标的像素点,其中机器学习模型是利用标记有识别目标像素点的样本图像和标记有非识别目标像素点的样本图像进行训练得到的。机器学习模型只需要对经过前一步骤排除后的感兴趣像素点进行识别,可能会再进一步排除一些感兴趣像素点,进而标记出预期的像素点,将其视为组成识别目标的像素点。
根据本发明实施例提供的图像识别方法,首先基于机器视觉的原理根据图像内像素点的像素值识别并标记出一些像素点,经此处理将会排除图像中大部分的内容,仅保留一部分作为疑似目标;然后结合被拍摄对象的具体内容,及标记出的像素点的分布对其进行排除,经此处理可以进一步从疑似目标中排除部分内容,所保留的内容特征更加明显且更符合待识别目标的特征;最后将标记有经过排除后的像素点的图像输入机器学习模型,使模型输出最终的标记结果,对于模型而言,模型只需要关注经过此前步骤所筛选出的部分图像内容,而不必去识别图像的其它部分。本方案可以减少机器学习模型所要识别的像素点的范围,模型所要识别的内容是经过预处理的像素点,这些像素点特征明显且可信度较高,由此可以提高图像识别的准确性;并且对于模型的训练过程,只需要使用一些具有明显且单一特征标记的样本图像,达到了简化样本标记工作的目的。
在第一个优选的实施例中,上述步骤S2可以包括如下步骤:
S21A,对图像进行预处理以增强像素点的特征;
S22A,根据预处理后的图像内的像素点的像素值在所述图像中标记出感兴趣像素点,例如增强图像A的对比度得到图像A’,通过对图像A’进行二值化处理、比对周围像素值等技术手段找到疑似识别目标的像素点。
上述优选方案可以使图像中的特征更加突出,经过预处理后,基于机器视觉原理对图像进行识别更容易找到疑似识别目标的像素点,从而提高识别准确性和识别效率。
对图像进行预处理的方式有多种,作为一个优选的实施例,可以采用下列公式进行处理:
dst=α·src1+β·src2+γ,
其中,dst为预处理后的图像像素矩阵,src1为原始图像的像素矩阵,src2是对原始图像进行高斯模糊处理后的图像的像素矩阵,α、β是用于控制图像融合时的占比的参数,γ是用于控制图像整体亮度的参数。
在第二个优选的实施例中,上述步骤S2可以包括如下步骤:
S21B,在图像中确定特定区域,特定区域为预先确定的不可能存在识别目标的区域。确定方式有多种,例如通过位置进行确定,对于具有特别明显的内容的图像,也可以根据像素值进行确定,或者也可以采用机器学习、深度学习、神经网络等人工智能方式进行确定;
S22B,根据特定区域以外的像素点的像素值在图像中标记出感兴趣像素点。例如在图像A中排除区域{a},然后通过对图像A-{a}进行二值化处理、比对周围像素值等技术手段找到疑似识别目标的像素点。
根据上述优选方式,对于各种图像,例如特定位置、背景、某个组成部分是可以预先确定的不会存在识别目标的区域,本实施例将这些区域排除在外,减少后续处理范围,并由此提高识别准确性和效率。
在第三个优选的实施例中,上述步骤S2可以包括如下步骤:
S21C,将图像划分为多个区域,多个区域中的不同的区域间相互有部分重合。例如将图像A分为4个区域a、b、c、d,可以是其中区域a和区域b存在部分重合、区域c和区域d存在部分重合;也可以是a、b、c、d均存在部分重合。具体的重合方式可以根据图像内容进行设定,可以将容易出现识别目标的区域设置为重合区域。
S22C,分别根据多个区域内的像素点的像素值在区域中标记出感兴趣像素点。例如可以分别在划分的各个区域内进行二值化处理、比对周围像素值等技术手段找到疑似识别目标的像素点,在此过程中,针对不同的区域进行识别时所使用的参数可以是不同的,例如二值化处理的阈值可以不相同等等。
根据上述优选方式,划分出的区域的重合位置将会被识别多次,由此来降低识别目标被错误地漏掉的几率,从而提高识别准确性。
划分区域的方式有多种,作为一个优选的实施方式,将图像划分为多个区域具体可以包括:
在图像中确定特定目标,此处可参照步骤S21B,特定目标可以是不可能存在识别目标的部位;
基于特定目标所在位置将图像划分为多个区域,例如按照特定目标的上、下、左、右四个方向确定四个区域。
在第四个优选的实施例中,上述步骤S2可以包括如下步骤:
S21D,分别利用不同的预设阈值对图像进行二值化处理得到多个二值图像。例如可以采用4个不同的阈值对原始图像A进行二值化处理,得到4个二值化图像A1、A2、A3、A4。
S22D,分别根据多个二值图像内的像素值在多个二值图像中标记出感兴趣像素点。由于选用的阈值不同,二值图像A1、A2、A3、A4被处理为0或255的像素点也可能不相同,此步骤可以将二值图像中像素值为0的像素点视为背景或不相关目标,将像素值为255的像素点均标记为感兴趣像素点。
S23D,根据各个二值图像中标记的感兴趣像素点确定图像中的感兴趣像素点。例如可以根据4个二值图像A1、A2、A3、A4中被标记出的感兴趣像素点的交集确定原始图像中的感兴趣像素点。对于采用大量阈值得到大量二值图像的情况,可以分别确定各个像素点被标记为感兴趣像素点的次数来判定哪些是感兴趣像素点。
上述优选方式采用不同阈值对原始图像进行二值化处理,在各个二值图像中确定疑似识别目标的像素点,并进行比较来筛选出其中一些像素点,由此提供图像识别的准确性。
需要说明的是,上述四个优选的实施例不存在冲突,可以则一使用也可以部分或全部使用。例如可以先采用第三种实施方式对图像进行分区,然后针对各分区采用第四种实施方式进行二值化处理,而在此之前,还可以采用第一种实施方式增强原始图像的对比度。实际应用时可根据图像的内容进行取舍。
本发明实施例还提供了一种图像识别设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述图像识别方法。
上述图像处理方法可以应用于识别眼底图像中的异常目标,例如眼底的出血点。上述感兴趣像素点是疑似病灶处的像素点,识别目标的像素点即为由机器学习模型识别出的病灶处的像素点。图2示出了一个存在出血点的眼底图像,本发明实施例提供一种眼底图像识别方法,如图3所示,该方法包括如下步骤:
S1’,获取眼底图像A,即如图2所示的使用专用设备所拍摄患者的眼底图像。
S2’,对眼底图像A的像素值拉伸,增强异常目标(出血点、渗出点等)在图中的对比度,得到图像A’。使用的算法是原图逐像素减去高斯模糊过后的图片得到差值图像,再使用一个固定的像素值将差值图像投影回可视像素空间。具体地,采用下列公式增强眼底图像A的对比度得到图像A’:
dst=α·src1+β·src2+γ,
其中dst为增强对比度后的图像A’的像素矩阵,src1代表原眼底图像A素矩阵,src2即为原眼底图像A经高斯模糊过后的像素矩阵,α、β、γ为超参数,通过调整α、β可控制原图与原图经高斯模糊过后的图片在图像融合时的占比,通过调整γ可控制结果图片的整体亮度,色彩空间。
如图4所示,融合过后的图片出血点以及渗出点会在整个眼底图像上对比度更强,并呈现出更明显的特征。
S3’,在眼底图像A中确定并排除特定区域,例如视盘区域a。如图5所示,为了清楚地展示本发明的构思,图5示出的是基于增强对比度的眼底图像的结果,实际使用时,可以在原始图像中确定视盘区域a。因为视盘区域a的特征比较明显,对后续处理影响较大,并且出血点渗出点不会发生在视盘以内,所以在此步骤中可以将视盘区域a排除在外。对于眼底图像而言,整个眼底中只有一个视盘并且特征明显,可以使用深度学习检测模型中较为简单的SSD作为网络框架,经过训练,很容易能够成功准确检测到视盘。而对于其他较为复杂的图像,也可以设置更加复杂排除方式。
S4’,基于特定目标或区域将眼底图像A或A’划分为多个区域。在本实施例中,根据异常位置将图像分为4个区域,如图5所示,划分4个区域的原则是以视盘区域a为中心分为:第一区域A1,即视盘以上部分(覆盖颞上,鼻上的动脉静脉);第二区域A2,视盘以下部分(覆盖颞下,鼻下的动脉静脉);第三区域A3,即上下截取视盘上下沿到图片上下边缘的一半的部分(覆盖黄斑区部分);第四区域A4,上下截取视盘上下沿到图片上下边缘的另一半的部分。
经过上述划分,后续可以更加关注眼底的关键区域,并且能够根据每个不同的区域调整针对该区域的特定参数来优化性能;4个区域是有重叠的,这使得后续步骤将处理多次重叠的区域,由此可以增加异常点在重叠区域的辨识率。
S5’,基于机器视觉的原理,对划分出的区域进行识别,以在眼底图像A中标记疑似异常的像素点。
分别利用不同的预设阈值,对划分的多个区域进行二值化处理得到多个二值区域图像。此步骤是使用机器视觉的算法尽可能的识别所有可能的出血点渗出点。对图像选用不同的阈值对图像进行二值化处理,然后提取多个二值图像中被召回最多的区域,即像素值越接近0和255的像素,越容易被召回,因为接近两端的像素只在阈值范围在其之间都会被召回。
对上述步骤划分的4块眼底区域分别使用上述二值化处理方法,对其中的出血点渗出点进行召回,调整参数使其对出血点渗出点的召回率达到最大,得到如图6所示标记了较多异常像素点的眼底图像。
S6’,根据疑似异常像素点在眼底图像A或A’中的分布情况对疑似异常像素点进行排除处理。此步骤是基于机器视觉和形态学对疑似异常的像素的筛选处理。通过步骤S4’处理过后召回的像素点过多,其中包含了较多的误判像素点(噪声),例如其中包含很多圆形视野边界区域、血管、黄斑区域等等。本实施例使用了5种判断方式将明显误判的区域过滤掉,此区域是指标记的像素点的外接矩形。上述5种方式包括:判断该区域是否在视野圆形区域边缘;判断该区域是否为上述步骤中划分的4个区域边界(有一条非常笔直的边,不是不规则形状);判断该区域的面积不能超过35000个像素点,且不能小于20个像素点;判断该区域长宽比;以及判断该区域内被标记的像素所占面积。
经过此步骤处理可以排除部分像素点,可以展现如图7所示的图像。
S7’,利用机器学习模型对标记了剩余疑似异常像素点的眼底图像A进行识别,以标记出异常像素点,即出血点和渗出点。经过步骤S2’-S6’处理后,一些召回无法通过上述机器视觉和形态学过滤掉,在此使用深度学习来对其分类。
经过测试可以明确得知,对于步骤S6’处理后的所标记的结果一共可以归类为8种:完全正常(无标记)、视野边缘(非识别目标)、微血管瘤(识别目标)、硬性渗出(识别目标)、血管(非识别目标)、黄斑(非识别目标)、亮色污点(非识别目标)、血管旁边的反光(非识别目标)。因此,只需要使用这8种图像作为样本图像预先对模型进行训练,使其能够区分这些识别目标即可。
因为训练样本图像特征简单且单一,图的分辨率也比较低,为了防止神经网络会提取过于多的语义信息并产生过拟合,本实施例选择使用结构较为简单的神经网络模型执行最后的识别步骤。
例如当只需要识别出血点时,可以使模型对图7所示的疑似异常像素点进行识别,排除其中不是出血点的内容,最终得到如图8所示的结果。
本发明实施例还提供了一种眼底图像识别设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行上述眼底图像识别方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (10)
1.一种图像识别方法,其特征在于,包括:
获取图像;
根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点;
根据所述感兴趣像素点在所述图像中的分布情况对所述感兴趣像素点中的噪声进行排除处理;
利用机器学习模型对标记了经过排除处理后剩余的感兴趣像素点的所述图像进行识别,以在所述图像中标记识别目标的像素点,其中所述机器学习模型是利用标记有识别目标像素点的样本图像和标记有非识别目标像素点的样本图像进行训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
对所述图像进行预处理以增强像素点的特征;
根据预处理后的所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点。
3.根据权利要求2所述的方法,其特征在于,采用下列公式对所述图像进行预处理:
dst=α·src1+β·src2+γ,
其中,dst为预处理后的图像像素矩阵,src1为所述图像的像素矩阵,src2是对所述图像进行高斯模糊处理后的图像的像素矩阵,α、β是用于控制图像融合时的占比的参数,γ是用于控制图像整体亮度的参数。
4.根据权利要求1所述的方法,其特征在于,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
在所述图像中确定特定区域;
根据所述特定区域以外的像素点的像素值在所述图像中标记出感兴趣像素点。
5.根据权利要求1所述的方法,其特征在于,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
将所述图像划分为多个区域,所述多个区域中的不同的区域间相互有部分重合;
分别根据所述多个区域内的像素点的像素值在所述区域中标记出感兴趣像素点。
6.根据权利要求5所述的方法,其特征在于,所述将所述图像划分为多个区域,包括:
在所述图像中确定特定目标;
基于所述特定目标所在位置将所述图像划分为多个区域。
7.根据权利要求1所述的方法,其特征在于,所述根据所述图像内的像素点的像素值在所述图像中标记出感兴趣像素点,包括:
分别利用不同的预设阈值对所述图像进行二值化处理得到多个二值图像;
分别根据所述多个二值图像内的像素值在所述多个二值图像中标记出感兴趣像素点;
根据各个二值图像中标记的感兴趣像素点确定所述图像中的感兴趣像素点。
8.根据权利要求1所述的方法,其特征在于,所述分布情况包括以下至少一项:所述感兴趣像素点在所述图像中的位置、基于临近的感兴趣像素点所确定的感兴趣区域内的像素点的数量、所述感兴趣区域的长宽比、所述感兴趣区域内感兴趣像素点所占的面积。
9.一种眼底图像识别方法,其特征在于,包括:利用权利要求1-8中任一项所述的方法对眼底图像进行识别,其中所述感兴趣像素点是疑似病灶处的像素点,所述特征像素点由机器学习模型识别出的病灶处的像素点。
10.一种图像识别设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-9中任意一项所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810444726.2A CN108629378A (zh) | 2018-05-10 | 2018-05-10 | 图像识别方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810444726.2A CN108629378A (zh) | 2018-05-10 | 2018-05-10 | 图像识别方法和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108629378A true CN108629378A (zh) | 2018-10-09 |
Family
ID=63692693
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810444726.2A Pending CN108629378A (zh) | 2018-05-10 | 2018-05-10 | 图像识别方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108629378A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583364A (zh) * | 2018-11-27 | 2019-04-05 | 上海鹰瞳医疗科技有限公司 | 图像识别方法及设备 |
CN109977905A (zh) * | 2019-04-04 | 2019-07-05 | 北京百度网讯科技有限公司 | 用于处理眼底图像的方法和装置 |
CN110222629A (zh) * | 2019-06-03 | 2019-09-10 | 中冶赛迪重庆信息技术有限公司 | 一种钢铁场景下的包号识别方法以及包号识别系统 |
CN110321865A (zh) * | 2019-07-09 | 2019-10-11 | 北京字节跳动网络技术有限公司 | 头部特效处理方法及装置、存储介质 |
CN111797832A (zh) * | 2020-07-14 | 2020-10-20 | 成都数之联科技有限公司 | 一种图像感兴趣区域自动生成方法及系统及图像处理方法 |
CN111862003A (zh) * | 2020-06-30 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 医疗影像目标信息获取方法、装置、设备和存储介质 |
CN111968117A (zh) * | 2020-09-25 | 2020-11-20 | 北京百度网讯科技有限公司 | 重合度检测方法、装置、设备以及存储介质 |
CN112541883A (zh) * | 2020-10-16 | 2021-03-23 | 天津大学 | 基于深度学习的眼底视盘及中央凹实时检测装置和方法 |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722712A (zh) * | 2012-01-02 | 2012-10-10 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
CN102867416A (zh) * | 2012-09-13 | 2013-01-09 | 中国科学院自动化研究所 | 一种基于车辆部位特征的车辆检测与跟踪方法 |
CN103914687A (zh) * | 2014-03-14 | 2014-07-09 | 常州大学 | 一种基于多通道和多阈值的矩形目标识别方法 |
CN104657984A (zh) * | 2015-01-28 | 2015-05-27 | 复旦大学 | 三维超声乳腺全容积图像感兴趣区域的自动提取方法 |
CN104850861A (zh) * | 2015-05-27 | 2015-08-19 | 山东大学 | 基于rx异常探测和纹理分析的真菌性角膜炎图像识别方法 |
CN104899866A (zh) * | 2015-05-05 | 2015-09-09 | 河南三联网络技术有限公司 | 一种智能化的红外小目标检测方法 |
CN105160306A (zh) * | 2015-08-11 | 2015-12-16 | 北京天诚盛业科技有限公司 | 虹膜图像模糊判断的方法和装置 |
CN105913418A (zh) * | 2016-04-06 | 2016-08-31 | 重庆大学 | 一种基于多阈值的瞳孔分割方法 |
CN106203529A (zh) * | 2016-07-18 | 2016-12-07 | 江苏大学 | 一种基于先验信息的车辆轮胎安全检测方法 |
CN106570838A (zh) * | 2016-10-28 | 2017-04-19 | 成都西纬科技有限公司 | 一种图像亮度优化方法及装置 |
CN106951902A (zh) * | 2017-03-27 | 2017-07-14 | 深圳怡化电脑股份有限公司 | 一种图像二值化处理方法及装置 |
CN107038704A (zh) * | 2017-05-04 | 2017-08-11 | 季鑫 | 视网膜图像渗出区域分割方法、装置和计算设备 |
CN107977969A (zh) * | 2017-12-11 | 2018-05-01 | 北京数字精准医疗科技有限公司 | 一种内窥镜荧光图像的分割方法、装置及存储介质 |
-
2018
- 2018-05-10 CN CN201810444726.2A patent/CN108629378A/zh active Pending
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102722712A (zh) * | 2012-01-02 | 2012-10-10 | 西安电子科技大学 | 基于连续度的多尺度高分辨图像目标检测方法 |
CN102867416A (zh) * | 2012-09-13 | 2013-01-09 | 中国科学院自动化研究所 | 一种基于车辆部位特征的车辆检测与跟踪方法 |
CN103914687A (zh) * | 2014-03-14 | 2014-07-09 | 常州大学 | 一种基于多通道和多阈值的矩形目标识别方法 |
CN104657984A (zh) * | 2015-01-28 | 2015-05-27 | 复旦大学 | 三维超声乳腺全容积图像感兴趣区域的自动提取方法 |
CN104899866A (zh) * | 2015-05-05 | 2015-09-09 | 河南三联网络技术有限公司 | 一种智能化的红外小目标检测方法 |
CN104850861A (zh) * | 2015-05-27 | 2015-08-19 | 山东大学 | 基于rx异常探测和纹理分析的真菌性角膜炎图像识别方法 |
CN105160306A (zh) * | 2015-08-11 | 2015-12-16 | 北京天诚盛业科技有限公司 | 虹膜图像模糊判断的方法和装置 |
CN105913418A (zh) * | 2016-04-06 | 2016-08-31 | 重庆大学 | 一种基于多阈值的瞳孔分割方法 |
CN106203529A (zh) * | 2016-07-18 | 2016-12-07 | 江苏大学 | 一种基于先验信息的车辆轮胎安全检测方法 |
CN106570838A (zh) * | 2016-10-28 | 2017-04-19 | 成都西纬科技有限公司 | 一种图像亮度优化方法及装置 |
CN106951902A (zh) * | 2017-03-27 | 2017-07-14 | 深圳怡化电脑股份有限公司 | 一种图像二值化处理方法及装置 |
CN107038704A (zh) * | 2017-05-04 | 2017-08-11 | 季鑫 | 视网膜图像渗出区域分割方法、装置和计算设备 |
CN107977969A (zh) * | 2017-12-11 | 2018-05-01 | 北京数字精准医疗科技有限公司 | 一种内窥镜荧光图像的分割方法、装置及存储介质 |
Non-Patent Citations (2)
Title |
---|
熊荔 等: "彩色盘周眼底图的豹纹状眼底自动分级算法", 《计算机辅助设计与图形学学报》 * |
马文婷 等: "基于多尺度区域块的糖尿病性视网膜病变级联检测", 《北京交通大学学报》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109583364A (zh) * | 2018-11-27 | 2019-04-05 | 上海鹰瞳医疗科技有限公司 | 图像识别方法及设备 |
CN109977905A (zh) * | 2019-04-04 | 2019-07-05 | 北京百度网讯科技有限公司 | 用于处理眼底图像的方法和装置 |
CN109977905B (zh) * | 2019-04-04 | 2021-08-06 | 北京百度网讯科技有限公司 | 用于处理眼底图像的方法和装置 |
US11232560B2 (en) | 2019-04-04 | 2022-01-25 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method and apparatus for processing fundus image |
CN110222629A (zh) * | 2019-06-03 | 2019-09-10 | 中冶赛迪重庆信息技术有限公司 | 一种钢铁场景下的包号识别方法以及包号识别系统 |
CN110321865A (zh) * | 2019-07-09 | 2019-10-11 | 北京字节跳动网络技术有限公司 | 头部特效处理方法及装置、存储介质 |
CN111862003A (zh) * | 2020-06-30 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 医疗影像目标信息获取方法、装置、设备和存储介质 |
CN111862003B (zh) * | 2020-06-30 | 2022-04-22 | 至本医疗科技(上海)有限公司 | 医疗影像目标信息获取方法、装置、设备和存储介质 |
CN111797832A (zh) * | 2020-07-14 | 2020-10-20 | 成都数之联科技有限公司 | 一种图像感兴趣区域自动生成方法及系统及图像处理方法 |
CN111797832B (zh) * | 2020-07-14 | 2024-02-02 | 成都数之联科技股份有限公司 | 一种图像感兴趣区域自动生成方法及系统及图像处理方法 |
CN111968117A (zh) * | 2020-09-25 | 2020-11-20 | 北京百度网讯科技有限公司 | 重合度检测方法、装置、设备以及存储介质 |
CN112541883A (zh) * | 2020-10-16 | 2021-03-23 | 天津大学 | 基于深度学习的眼底视盘及中央凹实时检测装置和方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108629378A (zh) | 图像识别方法和设备 | |
Kaushik et al. | Diabetic retinopathy diagnosis from fundus images using stacked generalization of deep models | |
CN110033456B (zh) | 一种医疗影像的处理方法、装置、设备和系统 | |
JP7458328B2 (ja) | マルチ分解能登録を介したマルチサンプル全体スライド画像処理 | |
US9779492B1 (en) | Retinal image quality assessment, error identification and automatic quality correction | |
Shen et al. | Domain-invariant interpretable fundus image quality assessment | |
CN110163899A (zh) | 图像匹配方法和图像匹配装置 | |
Kayal et al. | A new dynamic thresholding based technique for detection of hard exudates in digital retinal fundus image | |
Xiao et al. | Improving lesion segmentation for diabetic retinopathy using adversarial learning | |
JP7142420B2 (ja) | 画像処理装置、学習方法、学習済モデル、画像処理方法 | |
CN110163219A (zh) | 基于图像边缘识别的目标检测方法 | |
WO2018142388A1 (en) | A method for pupil detection for cognitive monitoring, analysis, and biofeedback-based treatment and training | |
CN109583364A (zh) | 图像识别方法及设备 | |
CN110751637A (zh) | 糖尿病视网膜病变检测系统、方法、设备和训练系统 | |
Singh et al. | An efficient automatic method of Optic disc segmentation using region growing technique in retinal images | |
Shojaeipour et al. | Using image processing methods for diagnosis diabetic retinopathy | |
CN109377462A (zh) | 眼底图像处理方法及设备 | |
Kind et al. | An explainable AI-based computer aided detection system for diabetic retinopathy using retinal fundus images | |
Ang et al. | Computer-based identification of diabetic maculopathy stages using fundus images | |
Pradeep et al. | Enhanced Recognition system for Diabetic Retinopathy using Machine Learning with Deep Learning Approach | |
Ahmed et al. | Retina based biometric authentication using phase congruency | |
AU2020103713A4 (en) | Digital imaging methods and system for processing agar plate images for automated diagnostics | |
CN110276333A (zh) | 眼底身份识别模型训练方法、眼底身份识别方法和设备 | |
Shaikha et al. | Optic Disc Detection and Segmentation in Retinal Fundus Image | |
Helwan | ITDS: Iris tumor detection system using image processing techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |