一种图像识别方法、装置、设备、系统及介质
技术领域
本申请涉及机器学习技术领域,尤其涉及一种图像识别方法、装置、设备、系统及介质。
背景技术
随着人工智能技术的快速发展,深度学习技术在图像处理领域得到广泛应用。如今通过深度学习技术训练模型,基于模型进行图像检测,以识别出图像中目标对象。但是,在现有的的图像识别技术中,通过深度学习技术训练的模型,往往只关注待检测图像本身的信息,信息维度单一,识别图像中的目标特定区域的准确率不高,识别结果参考价值不大。
基于此,需要提供一种新型模型能够提高图像识别准确率,以提供更有参考价值的数据。
发明内容
本申请提供了一种图像识别方法、装置、设备、系统及介质,能够提高检测癌细胞淋巴结转移情况的检测准确率。
有鉴于此,本申请第一方面提供了一种图像识别方法,所述方法包括:
获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
本申请第二方面提供了一种图像识别装置,所述装置包括:
获取模块,用于获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
拼接模块,用于将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
识别模块,用于通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
图像区域分类模块,用于根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
本申请第三方面提供了一种图像识别设备,所述设备包括处理器以及存储器:
所述存储器用于存储计算机程序;
所述处理器用于运行所述计算机程序以执行以下动作:
获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
本申请第四方面提供了一种图像识别系统,所述系统包括:
图像采集设备和图像识别设备,其中,所述图像识别设备中部署有预训练的图像识别模型,其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
所述图像采集设备,用于采集待检测的第一图像和所述第一图像对应的参考图像,并向所述图像识别设备发送所述第一图像和所述第一图像对应的参考图像;
所述图像识别设备,用于获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;
根据所述拼接图的识别结果,识别出所述第一图像包含的目标特征区域。
本申请第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的图像识别方法的步骤。
从以上技术方案可以看出,本申请提供的技术方案具有以下优点:
本申请提供了一种图像识别方法,在该方法中提出了基于预训练的图像识别模型实现图像识别,以针对待检测的第一图像识别出目标特征区域,从而提供有价值的参考数据,而该图像识别模型在训练过程中引入第一图像对应的参考图像作为监督信息,由于第一图像与参考图像中包含的目标特征区域的特征基本相同,因此,基于这一特点,训练所得的该图像识别模型其识别准确率大大提升。
本申请的该方法在应用时,先获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像,然后将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图,再通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。由于对第一图像进行检测的目的就是为了区分出第一图像中的目标特征区域,而在模型识别过程中不仅关注第一图像本身,还引入了目标特征区域本身的特征,以此为先验信息能够提高模型识别结果的准确度,基于模型识别结果就能够准确划分出第一图像中目标特征区域。
附图说明
图1为本申请实施例提供的图像识别方法的场景架构图;
图2为本申请实施例提供的图像识别方法的流程示意图;
图3为本申请实施例提供的图像识别模型训练方法的流程示意图;
图4为本申请实施例提供的图像识别方法的应用场景图;
图5为本申请实施例提供的一种图像识别装置的结构示意图;
图6为本申请实施例提供的一种图像识别设备的结构示意图;
图7为本申请实施例提供的另一种图像识别设备的结构示意图;
图8为本申请实施例提供的一种图像识别系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。在现有的基于人工智能的图像识别技术中,由于现有的用于识别图像中的目标对象的模型往往关注待检测的图像本身的特征,信息维度单一,现有的模型在实际应用中的效果并不太好,主要表现是准确率不高,得到的识别结果参考价值不大。本申请正是为了解决这一问题,提出了一种新的图像识别模型,在该模型的训练过程中引入包含目标特征区域的参考图像这一维度的参考信息,由于检测目的就是从待检测的第一图像中检测出目标特征区域,因此,在第一图像的基础上增加包含目标特征区域本身的参考图像作为先验信息,增加这一维度的参考信息,如此从两个维度出发就能够极大提高对图像中目标对象的识别精准度,基于此,在本申请中进一步提出基于这种新的图像识别模型结合待检测的第一图像以及对应的包含目标特征区域的参考图像对目标对象进行识别,以识别出目标特征区域,从而提高图像中目标识别的准确度。
在具体应用时,本申请实施例提供的图像识别方法可以应用于多种不同识别场景,例如,在图像收集选择场景下,当需要收集出包含目标特征区域的图像集时,可以通过该图像识别模型对待检测的图像进行识别,如此可以确定该图像中是否包含目标特征区域,进而可以筛选出具有目标特征区域的图像集,以用于其他研究;当然,可以应用于图像区域划分场景下,需要从图像中划分出多种不同类型的目标特征区域时,可以通过图像识别模型逐一识别出特定的目标特征区域,进而进行区域截取得到所需的干净特征图。
应理解,本申请实施例提供的图像识别方法可以应用于具有图像处理能力的设备,例如终端设备或服务器,该方法可以独立应用于终端,也可以应用于终端设备(简称终端)和服务器通信的网络场景。其中,终端设备可以为手机、台式计算机、便携式计算机等;服务器可以理解为是应用服务器,也可以为Web服务器,在实际部署时,该服务器可以为独立服务器,也可以为集群服务器。
为了便于整体性理解本申请的技术方案,下面通过实施例对应用本申请提供的图像识别方法的应用场景架构进行介绍。参见图1,图1为本申请实施例提供的图像识别方法的场景架构图。如图1所示,在该应用场景中包括:终端101和服务器102,其中,终端101可以是面向用户的计算机,而服务器102可以是部署在云端的云端服务器,在实际应用中,用户可以根据实际检测需求,指定待检测的第一图像,进而通过终端101向服务器102发送待检测的第一图像以及对应的包含目标特征区域的参考图像,而服务器102中部署有预训练的图像识别模型,该图像识别模型是通过机器学习方式训练得到的,能够将参考图像中的目标特征区域作为第一图像识别的先验信息,提高识别结果的准确性,服务器102通过预训练的图像识别模型基于该待检测的第一图像以及对应的参考图像中的目标特征区域实现对该第一图像中目标对象的识别,最终确定该第一图像对应的目标特征区域识别结果,并通过终端101向用户反馈识别结果,以提供有价值的参考数据。
应理解,图1仅为一种应用场景架构示例,本申请提供的技术方案不局限于此应用场景,本申请实施例提供的基于人工智能的图像识别方法也可以独立应用于终端,如此,该终端上需要预先部署预训练的图像识别模型,进而该终端独立运行该图像识别模型为用户提供识别服务,在实际应用中,用户可以根据实际检测需求,在终端上选定待检测的第一图像以及对应的包含目标特征区域的参考图像,然后,终端利用图像识别模型对该第一图像进行检测,识别出第一图像中的目标对象,以得到该第一图像中的目标特征区域,并直接在终端上显示这一识别结果,方便用户直接查看。
需要说明的是,本申请实施例提供的图像识别方法可以应用于任意场景,对任意类型的图像进行检测,实现对图像中的目标对象进行检测,以识别出待检测的图像中包含的目标特征区域,如此提供有参考价值的数据。在此不对本申请实施例提供的图像识别方法所适用的应用场景做任何限定。下面结合图2以服务器作为执行主体,对本申请提供的一种图像识别方法进行介绍。
参见图2,图2为本申请实施例提供的一种图像识别方法的流程示意图。如图2所示,该图像识别方法包括以下步骤:
步骤S201:获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像。
一般情况下,由用户根据实际应用需求,通过终端指定某个待检测的第一图像以及对应的包含目标特征区域的参考图像,例如,用户通过启动终端上的浏览器或者应用程序进入图像指定界面,进而在该图像指定界面指定待检测的第一图像,并触发图像识别请求;最终,由终端根据用户的图像识别请求,向服务器发送待检测的第一图像以及对应的包含目标特征区域的参考图像。
为了便于理解本申请实施例提供的图像识别方法在实际场景中的应用,在这里将本申请提供的图像识别方法应用于医疗领域中,以识别切片图像中不同细胞类型为例,做示意性地说明。
具体的,在对切片图像进行细胞识别的应用场景中,医护人员可以从图像数据库中选择出需要进行细胞识别的切片图像作为待检测的第一图像,并从图像数据库中选择出与该第一图像对应的参考图像一并发送至服务器,以便服务器针对该第一图像进行细胞识别。
其中,所谓的切片图像可以是利用数字化切片技术对需要检测的切片进行全方位、全信息扫描得到的数字化切片图像(Whole Slide Image,WSI);在实际应用中,医护人员可以将采集的少量组织制成切片,然后通过数字化切片技术对该切片进行扫描得到WSI,并上传给服务器作为待检测的第一图像,或者存储在图像数据库中,以便后续对该WSI进行识别。
另外,与上述第一图像对应的参考图像,是包含目标特征区域的切片图像。这里的目标特征区域可以理解为包含有目标对象的区域。在对切片图像进行细胞识别的应用中,不同类型的细胞形态特征各异,目标对象可以是某种特定类型的细胞,例如血细胞、神经细胞、肌肉细胞、癌细胞等等。
基于此,医护人员在需要检测第一图像中是否包含某种细胞的情况下,与该第一图像对应的参考图像是包含有该种细胞区域的切片图像。例如,医护人员需要检测第一图像中是否包含血细胞时,则与该第一图像对应的参考图像中应该包含血细胞区域;同样的,医护人员需要检测第一图像中是否包含癌细胞时,则与该第一图像对应的参考图像中应该包含癌细胞区域。
需要说明的是,本申请实施例提供的图像识别方法不局限于上述应用场景中,可以针对不同的应用场景,利用本申请实施例提供的图像识别方法对不同的图像进行识别,以识别出不同的目标特征区域。上述应用场景仅是示意性说明,在这里对该图像识别方法的具体应用场景不做任何限定。
步骤S202:将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图。
服务器在获取到待检测的第一图像和参考图像后,继续对该第一图像和该参考图像做拼接处理,以生成参与后续模型识别的输入数据。具体的,服务器将第一图像和参考图像中的目标特征区域拼接在一起,得到拼接图。
上述拼接处理可以理解为,服务器在图像的颜色通道方向将一个第一图像与参考图像中的目标特征区域拼接在一起,得到一个拼接图。例如,服务器在图像的RGB三通道方向将一个第一图像与一个参考图像中的目标特征图像拼接在一起,得到一个拼接图。
需要注意的是,与第一图像进行拼接的是参考图像中的目标特征区域。由于参考图像中包含目标特征区域,也可能包含非目标特征区域,因此,为了给待检测的第一图像增加对应的先验信息,将参考图像中的目标特征区域作为有用信息,与该第一图像进行拼接,得到拼接图,使得利用该拼接图作为先验信息参与后续的实际识别过程,避免无用信息的干扰,如此提高识别准确率。
应理解,利用服务器进行拼接的第一图像和参考图像中的目标特征区域的尺寸应保持一致。在实际应用中,服务器获取的第一图像的尺寸和参考图像中的目标特征区域不同的情况下,服务器可以对待拼接的第一图像和参考图像中的目标特征区域做裁剪、缩放等图像处理,使其尺寸相同,以便对其进行拼接处理,得到拼接图。
在实际应用中,待检测的第一图像和参考图像的尺寸可能非常大,例如,上述对切片图像进行细胞识别的应用场景中,切片图像包含的像素数目往往在上亿级别,服务器无法直接对切片图像进行处理。因此,服务器需要对图像先做切分处理,将大图切分成多个小图,再基于小图执行后续的图像识别处理,如此能够降低对服务器硬件处理性能要求,并提高图像识别效率。
在具体实现时,服务器按照预设尺寸切分第一图像得到多个子图作为多个第一子图;同样的,服务器按照预设尺寸切分参考图像中的目标特征区域子图得到多个子图作为多个第二子图;进而,服务器将上述每个第一子图分别与上述多个第二子图中至少一个子图进行拼接,得到每个第一子图各自对应的拼接图。
在实际切分拼接操作中,服务器可以预先将第一子图的尺寸和第二子图的尺寸设置为相同的尺寸,在获取到第一图像和参考图像后,服务器按照预设的子图的尺寸对第一图像和参考图像中的目标特征区域进行切分,得到相同尺寸的多个第一子图和多个第二子图;进而,服务器可以直接将第一子图与第二子图进行拼接,得到多个拼接图。
其中,服务器需要将上述切分后得到的每个第一子图分别与多个第二子图中至少一个子图进行拼接,得到每个第一子图各自对应的拼接图。具体实现方式中,服务器可以将每个所述第一子图分别与任意多个所述第二子图进行拼接,得到每个第一子图对应的多个拼接图;服务器也可以将每个所述第一子图与任意一个所述第二子图进行拼接,得到每个第一子图对应的拼接图。
下面通过示例对上述拼接处理过程进行说明。
在一个示例中,服务器可以将每个第一子图与多个第二子图进行拼接,得到多个拼接图。例如,对待检测的第一图像进行切分得到100个第一子图,类似的,对参考图像中的目标特征区域进行切分得到30个第二子图,则服务器针对这100个第一子图中每个第一子图,将其分别与30个第二子图进行拼接得到30个拼接图,则针对这100个第一子图经过拼接处理后最终得到100*30=3000个拼接图。基于此,每个第一子图经过拼接处理能够得到多个与之对应的拼接图,而多个拼接图携带的目标特征区域信息比较丰富,如此,为服务器进行图像识别提供更丰富的先验信息,能够提高图像识别准确率。
在另一示例中,服务器可以将每个第一子图与任意一个第二子图进行拼接,得到与第一子图数量相等的多个拼接图。以上述示例场景为例,针对100个第一子图和30个第二子图的情况,服务器可以针对这100个第一子图中每个第一子图,将其与任意一个第二子图进行拼接得到对应的拼接图,如此,针对这100个第一子图经拼接处理后就会得到100个拼接图,如此,服务器所需处理的拼接图数量较小,一定程度上能够提高图像识别效率。
需要说明的是,上述第一子图与第二子图进行拼接过程仅是示例性说明,与每个第一子图进行拼接的第二子图的数量,可以根据实际情况指定,在此不作任何限定。
步骤S203:通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签。
服务器经过上述拼接处理得到与第一图像对应的拼接图,然后针对该拼接图调用服务器本地预置的图像识别模型对该拼接图进行识别得到对应的识别结果,该识别结果能够标注该拼接图中第一子图包含目标对象的概率。
在对图像进行切分处理,得到多个拼接图的情况下,服务器针对这多个拼接图可以发起多个线程并行调用该图像识别模型,通过该图像识别模型并行识别这多个拼接图得到对应的识别结果;服务器也可以直接调用该图像识别模型,依次将这多个拼接图输入该图像识别模型,并依次获得该图像识别模型输出的识别结果。
步骤S204:根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
服务器执行步骤S203后得到与第一图像对应的拼接图的识别结果,该识别结果表征的是该拼接图中第一图像包含目标特征区域的概率,也即该第一图像中出现目标对象的概率。在实际应用中,服务器可以根据该识别结果,在该第一图像中定位出具体的目标特征区域,为用户提供更直观地参考数据,提升用户体验。
在对切片图像进行细胞识别的场景中,服务器对图像进行切分处理后,再进行拼接,可能会得到与第一图像对应的多个拼接图的情况。在此种情况下,服务器执行步骤S203后得到各拼接图的识别结果,该识别结果表征的是该拼接图中第一子图包含目标特征区域的概率,也即该第一子图中出现目标对象的概率。由于第一子图是待检测的第一图像切分所得的子图,因此,基于每个第一子图包含目标对象的概率,就能够确定出整个待检测的第一图像包含目标特征区域的概率,即整个待检测的第一图像包含目标对象的概率。
针对上述多个拼接图的情况,服务器利用多个拼接图的识别结果识别出第一图像包含的目标特征区域具体操作过程可以是:服务器按照每个拼接图中第一子图在第一图像中的位置,将拼接图的识别结果进行拼接生成概率图,然后,对该概率图进行阈值二值化处理得到掩码图像,服务器根据该掩码图像可以识别出该第一图像包含的目标特征区域。
在上述情况下,每个第一子图可以拼接出多个对应的拼接图,经过模型识别就会得到多个拼接图中第一子图包含目标特征区域的概率,基于此,在生成概率图时,则需要针对每个第一子图相关的概率中确定出一个概率参与最终的概率图拼接处理。
例如,将1个第一子图与30个第二子图进行拼接,可以得到30个与该第一子图对应的拼接图,如此,服务器利用图像识别模型对这30个拼接图进行识别,会得到30个识别结果,即得到与该第一子图相关的30个概率值,则在后续的基于识别结果进行拼接得到概率图时,就需要针对每个第一子图相关的30个概率值确定出一个概率值,基于所确定的这个概率值进行概率拼接得到最终的概率图。在实际应用中,服务器可以针对每个第一子图,根据与该第一子图对应的多个概率,确定出该第一子图对应的参考概率,例如,针对第一子图对应的多个概率求取平均值作为该参考概率,或者,针对第一子图对应的多个概率选择最大值作为该参考概率,或者,针对第一子图对应的多个概率选择求取平均概率值,或者针对第一子图对应的多个概率选择中值作为该参考概率,最终,根据每个第一子图的参考概率,按照每个第一子图在第一图像中的位置,进行概率拼接得到概率图。
在对识别结果拼接得到概率图后,服务器需要对该概率图进行阈值二值化处理,也就是,比较每个第一子图包含目标特征区域的概率与阈值的大小,当第一子图包含目标对象的概率大于阈值时,将该第一子图包含目标对象的概率设置为1;当第一子图包含目标对象的概率小于阈值时,将该第一子图包含目标对象的概率设为0。在阈值二值化后的概率图中,服务器将与概率为1对应的第一子图的灰度值设置为255,表示该第一子图对应的区域为目标特征区域,将与概率为0对应的第一子图的灰度值设置为0,表示该第一子图对应的区域为非目标特征区域,由此得到掩码图像。可以理解的是,该掩码图像可以理解为,由灰度值为0或255的像素点组成的黑白图像,目标特征区域呈现为白色,非目标特征区域呈现为黑色。
基于上述掩码图像,服务器可以根据该掩码图像突出显示出该第一图像中的目标特征区域,为用户提供更直观的参考数据。例如,以线条高亮的方式在第一图像中圈出与掩码图像中白色区域对应的区域,线条圈出来的区域就是该第一图像中的目标特征区域。
上述实施例提供的图像识别方法,通过获取与待检测的第一图像对应的包含目标特征区域的参考图像,将该参考图像中的目标特征区域与该第一图像进行拼接,得到拼接图,再将该拼接图作为预训练的图像识别模型的输入,识别该第一图像是否包含目标特征区域。由于参考图像中的目标特征区域与第一图像中可能包含的目标特征区域的信息基本相同,因此,引入了包含目标特征区域的参考图像作为图像识别模型的先验信息,提高了图像识别的准确率。
应理解,在实际应用中,本申请实施例提供的图像识别方法能否识别图像中是否包含目标特征区域,主要取决于预训练的图像识别模型的识别性能,而图像识别模型的识别性能与该图像识别模型的训练过程密切相关。下面的实施例以服务器作为执行主体,对本申请实施例提供的图像识别模型的训练方法进行介绍。
参见图3,图3为本申请实施例提供的图像识别模型的训练方法的流程示意图。下面以服务器作为执行主体对该训练方法进行介绍。如图3所示,该图像识别模型的训练方法包括以下步骤:
S301:获取多种不同检测对象类型对应的多组检测图像数据,其中,每组所述检测图像数据包括检测图像和所述检测图像对应的检测参考图像以及所述检测图像对应的目标特征区域标注信息和所述检测参考图像对应的目标特征区域标注信息。
由于模型训练质量依赖于样本数据的质量和数量,因此,在模型训练之前,首先要收集有价值的样本数据生成样本集,进而才能够基于样本集执行模型训练过程,以保证训练好的模型质量。
基于此,在该实施例中,服务器首先需要获取多种不同检测对象类型对应的多组检测图像数据。
在实际应用中,可以收集多组检测图像数据,每组检测图像数据可以理解为针对一种检测对象的一组图像数据,其包括:含有与该目标对象对应的目标特征区域的检测图像和检测参考图像;例如,用于训练的服务器可以从医院的图像数据库中获取多组检测图像数据。由于本实施例中模型训练是有监督的训练方式,因此,还需要进一步获取与检测图像以及检测参考图像各自对应的目标特征区域标注信息。在实际应用中,该目标特征区域标注信息可以通过人工标注方式生成并存储至图像数据库,也可以通过其他方式自动生成并存储至图像数据库。服务器在需要对模型进行训练的时候,就可以直接从图像数据库中获取带有目标特征区域标注信息的图像数据集合。
以上述利用图像识别模型对切片图像进行细胞识别的应用场景为例进行说明,图像识别模型用于识别切片图像中不同类型的细胞。因此,服务器需要采集包含不同类型细胞的多组检测图像数据,其中,每组检测图像数据可以是通过选择某一特定类型的细胞作为目标对象,然后将包含该类细胞的切片图像作为检测图像和检测参考图像,并标注出该检测图像和检测参考图像中的该类细胞区域。例如,选择淋巴细胞作为目标对象,则与该淋巴细胞对应的一组检测图像数据可以为:包含淋巴细胞的检测图像和检测参考图像,以及与该检测图像和该检测参考图像中包含淋巴细胞区域的标注信息。
在对图像识别模型进行训练过程中,除了检测图像,还增加了与检测图像对应的检测参考图像,将这两者一起作为先验信息输入到模型中,参与后续的训练过程。由于检测参考图像中包含的目标特征区域与检测图像中包含的目标特征区域的特征基本相同,在检测图像的基础上,引入了包含目标特征区域的参考图像,丰富模型的输入数据,如此,提高模型的识别准确率。
S302:将每个所述检测图像和所述检测参考图像对应的检测参考图像中的目标特征区域进行拼接得到拼接图作为样本拼接图,并将所述样本拼接图中的所述检测图像对应的标注标签作为所述样本拼接图的标注标签。
基于上述步骤S301,服务器需要将上述多组图像数据中的每个检测图像,与该检测图像对应的检测参考图像中的目标特征区域进行拼接,得到拼接图,并作为样本拼接图。需要说明的是,每个样本拼接图对应的标注标签,与样本拼接图对应的检测图像的标注标签保持一致。其中,具体的将检测图像与参考图像中的目标特征区域拼接成拼接图这一实现过程,可以参见上文实施例中步骤S202的相关描述,此处不再赘述。
S303:将每个所述样本拼接图以及所述样本拼接图对应的标注标签作为一组样本数据,将多组样本数据的集合作为样本集。
服务器获得样本拼接图以及该样本拼接图对应的标注标签后,将每个样本拼接图以及对应的标注标签作为一组样本数据,收集多组样本数据生成样本集,作为模型训练的数据基础。
S304:根据所述样本集训练预构建的卷积神经网络模型,获得处于收敛态的卷积神经网络模型作为所述图像识别模型。
服务器经过上述步骤收集好样本集后,服务器就可以利用上述样本集对预先构建好的卷积神经网络模型进行训练。在具体实现时,该卷积神经网络模型的网络结构可以多种多样,本实施例对模型的具体网络结构不做限定,可以适用于任何结构的卷积神经网络,一般情况,卷积神经网络可以包括输入层、隐藏层和输出层。在对该卷积神经网络模型训练的过程中,服务器将该样本集从输入层输入,并利用隐藏层对该样本集中的每个样本拼接图进行特征提取,从输出层输出每个样本拼接图的识别结果,进而基于该识别结果和样本拼接图对应的标注标签,基于损失函数计算出模型损失,进而基于模型损失优化模型的参数,如此反复迭代训练直到模型处于收敛状态,将处于收敛状态的模型作为最终的图像识别模型,以用于实际图像识别场景中。其中,所述收敛态的卷积神经网络模型可以理解为该卷积神经网络在经过多次迭代后,识别性能趋于稳定,即网络输出的识别结果的准确率趋于一个稳定值。
上述实施例提供的一种图像识别模型的训练方法,通过获取多种不同检测对象类型对应的多组检测图像数据,其中,每组检测图像数据包括检测图像和该检测图像对应的检测参考图像以及该检测图像对应的目标特征区域标注信息和该检测参考图像对应的目标特征区域标注信息,然后将每个检测图像和该检测参考图像对应的检测参考图像中的目标特征区域进行拼接得到拼接图作为样本拼接图,并将该样本拼接图中的与检测图像对应的标注标签作为该样本拼接图的标注标签,再将每个样本拼接图以及与样本拼接图对应的标注标签作为一组样本数据,将多组样本数据的集合作为样本集,进而,根据所述样本集训练预构建的卷积神经网络模型,获得处于收敛态的卷积神经网络模型作为所述图像识别模型。其中,样本拼接图携带有检测参考图像中包含的目标特征区域,而该检测参考图像中包含的目标特征区域与检测图像中的包含的目标特征区域的特征基本相同。由于,在对模型进行训练的过程中,将该样本拼接图作为该模型的输入,即在训练过程中引入了检测参考图像中的目标特征区域这一先验信息,基于此训练得到的图像识别模型,其识别待检测的第一图像中的目标特征区域的准确率大大地提升。
为了便于进一步理解本申请实施例提供的图像识别方法,基于上述对切片图像进行细胞识别的应用场景,下面以对切片图像中不同类型的癌细胞进行识别为例,对本申请实施例提供的图像识别方法做整体介绍。
参见图4,图4为本申请实施例提供的一种图像识别方法的应用场景图,在该应用场景中包括两个过程:图像识别模型训练过程以及图像识别过程。
在图像识别模型训练过程中包括:用于存储检测图像数据的数据库404和服务器402;其中,服务器402用于从数据库404中获取多组检测图像数据进行处理生成样本集,基于样本集对预先构建的卷积神经网络模型进行训练,得到处于收敛态的图像识别模型。
具体的,服务器402从数据库404中获取多组检测图像数据,其中,每组检测图像数据针对一种细胞类型,具体包括:检测图像和所述检测图像对应的检测参考图像以及所述检测图像对应的目标特征区域标注信息和所述检测参考图像对应的目标特征区域标注信息。然后将每个检测图像和该检测参考图像对应的检测参考图像中的目标特征区域进行拼接得到拼接图作为样本拼接图,并将该样本拼接图中的与检测图像对应的标注标签作为该样本拼接图的标注标签,再将每个样本拼接图以及与样本拼接图对应的标注标签作为一组样本数据,将多组样本数据的集合作为样本集,进而,根据所述样本集训练预构建的卷积神经网络模型,获得处于收敛态的卷积神经网络模型作为所述图像识别模型。
更具体的,在具体是训练过程中,可以采用的多组检测图像数据具体可以是多组癌症类型对应的病理图像,而与病理图像对应的参考图像则是癌症原发地的大体切片图像,如此,基于上述手段确定出训练集训练所得图像识别模型能够准确识别出待检测图像中的癌细胞区域,以供医护人员参考。
模型训练好之后就可以投入图像识别应用场景下,下面以利用上述图像识别模型识别淋巴结切片图像中的癌细胞,以判断该淋巴结是否发生了癌细胞转移为例,对图像识别过程进行说明。由于发生了癌细胞转移的淋巴结中包含的癌细胞特征,通常与癌细胞原发地处的癌细胞特征基本相同,因此,可以从癌细胞原发地处的获取的大体切片图像作为待检测的淋巴结切片图像的参考图像。
具体的,在对淋巴结切片图像进行识别过程中,包括:扫描仪403、终端401和服务器402;其中,扫描仪403用于扫描待检测的淋巴结切片以及对应的大体切片,得到待检测的淋巴结切片图像以及对应的大体切片图像,并将其传输至终端401;终端401用于采集待检测的淋巴结切片图像以及对应的大体切片图像,并将待检测的淋巴结切片图像以及对应的大体切片图像发送给服务器402,还用于显示服务器402对待检测淋巴结切片图像的识别结果;服务器402用于利用预训练的图像识别模型,识别待检测的淋巴结切片图像是否包含与大体切片图像中相同类型的癌细胞区域,从而判断该淋巴结是否发生了癌细胞转移,并将识别结果发送给终端401。
具体的,医疗人员首先通过扫描仪403对待检测的淋巴结切片与对应的大体切片进行扫描,得到待检测的淋巴结切片图像以及对应的大体切片图像,然后通过终端401采集由扫描仪403扫描得到的待检测的淋巴结切片图像以及对应的大体切片图像,并发送给服务器403,服务器403在接收到待检测的淋巴结切片图像以及对应的大体切片图像后,对该淋巴结切片图像以及大体切片图像进行处理,然后利用上述训练得到处于收敛态的卷积神经网络模型识别该淋巴结切片图像中包含的癌细胞区域,从而判断癌细胞淋巴结转移情况,并将识别结果发送给终端401。参见图4,用黑色线条圈出该淋巴结切片图像中与掩码图像白色区域对应的的癌细胞区域,并在终端401上显示出来,为医疗人员提供参考。
针对上文描述的图像识别方法,本申请实施例还提供了一种图像识别装置,以使上述图像识别方法在实际中实现以及应用。
参见图5,图5为上文图2所示的图像识别方法对应的一种图像识别装置500的结构示意图,该装置包括:
获取模块501,用于获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
拼接模块502,用于将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
识别模块503,用于通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
图像区域分类模块504,用于根据所述拼接图的识别结果,识别出所述第一图像包含的目标特征区域。
可选的,所述拼接模块502,可以包括:
第一切分子模块,用于按照预设尺寸切分所述第一图像得到多个子图作为多个第一子图;
第二切分子模块,用于按照预设尺寸切分所述参考图像中的目标特征区域子图得到多个子图作为多个第二子图;
拼接子模块,用于将每个所述第一子图分别与所述多个第二子图中至少一个子图进行拼接,得到每个第一子图各自对应的拼接图。
可选的,所述拼接子模块,具体用于:
将每个所述第一子图分别与任意多个所述第二子图进行拼接,得到每个第一子图对应的多个拼接图;或者,
将每个所述第一子图与任意一个所述第二子图进行拼接,得到每个第一子图对应的拼接图。
可选的,所述识别模块503,可以包括:
第一识别子模块,用于根据所述拼接图的识别结果,识别出所述第一图像包含的目标特征区域,包括:
概率图拼接子模块,用于按照每个所述拼接图中第一子图在所述第一图像中的位置,将所述拼接图的识别结果进行拼接生成概率图;
二值化处理子模块,用于对所述概率图进行阈值二值化处理得到掩码图像;
第二识别子模块,用于根据所述掩码图像识别出所述第一图像包含的目标特征区域。
可选的,所述装置还包括:
样本基础数据获取模块,用于获取多种不同检测对象类型对应的多组检测图像数据,其中,每组所述检测图像数据包括检测图像和所述检测图像对应的检测参考图像以及所述检测图像对应的目标特征区域标注信息和所述检测参考图像对应的目标特征区域标注信息;
样本拼接图生成模块,用于将每个所述检测图像和所述检测参考图像对应的检测参考图像中的目标特征区域进行拼接得到拼接图作为样本拼接图,并将所述样本拼接图中的所述检测图像对应的标注标签作为所述样本拼接图的标注标签;
样本集构建模块,用于将每个所述样本拼接图以及所述样本拼接图对应的标注标签作为一组样本数据,将多组样本数据的集合作为样本集;
训练模块,用于根据所述样本集训练预构建的卷积神经网络模型,获得处于收敛态的卷积神经网络模型作为所述图像识别模型。
需要说明的是,本申请实施例提供的上述图像识别装置中各个模块以及各个子模块的具体实现过程,可以参见上文本申请实施例中提供的上述图像识别方法中各个步骤的具体实现过程,此处不再赘述。
针对上文描述的图像识别方法,本申请实施例还提供了一种图像识别设备,以使上述图像识别方法在实际中实现以及应用。
参见图6,图6为本申请实施例提供的一种终端设备的结构示意图。为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端设备可以为包括平板电脑、个人数字助理(英文全称:Personal DigitalAssistant,英文缩写:PDA)等任意终端设备:
图6示出的是与本申请实施例提供的终端相关的部分结构的框图。参考图6,该终端包括:射频(英文全称:Radio Frequency,英文缩写:RF)电路610、存储器620、输入单元630、显示单元640、传感器650、音频电路660、无线保真(英文全称:wireless fidelity,英文缩写:WiFi)模块670、处理器680、以及电源690等部件。本领域技术人员可以理解,图6中示出的平板电脑结构并不构成对平板电脑的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图6对平板电脑的各个构成部件进行具体的介绍:
存储器620可用于存储软件程序以及模块,处理器680通过运行存储在存储器620的软件程序以及模块,从而实现终端的各种功能应用以及数据处理。存储器620可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器620可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器680是终端的控制中心,利用各种接口和线路连接整个平板电脑的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器620内的数据,执行平板电脑的各种功能和处理数据,从而对平板电脑进行整体监控。可选的,处理器680可包括一个或多个处理单元;优选的,处理器680可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器680中。
在本申请实施例中,该终端所包括的处理器680可以执行以下动作:
获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
在图6所示的设备的基础上,处理器680在执行将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图时,进一步地,可以具体执行以下动作:
按照预设尺寸切分所述第一图像得到多个子图作为多个第一子图;
按照预设尺寸切分所述参考图像中的目标特征区域子图得到多个子图作为多个第二子图;
将每个所述第一子图分别与所述多个第二子图中至少一个子图进行拼接,得到每个第一子图各自对应的拼接图。
在上述实施例的基础上,处理器680在执行将所述多个第一子图中的每个第一子图分别与所述多个第二子图中至少一个子图进行拼接,得到每个第一子图各自对应的拼接图时,具体执行以下动作:
将每个所述第一子图分别与任意多个所述第二子图进行拼接,得到每个第一子图对应的多个拼接图;或者,
将每个所述第一子图与任意一个所述第二子图进行拼接,得到每个第一子图对应的拼接图。
在图6所示的设备的基础上,处理器680在执行根据所述拼接图的识别结果,识别出所述第一图像包含的目标特征区域时,具体执行以下动作:
按照每个所述拼接图中第一子图在所述第一图像中的位置,将所述拼接图的识别结果进行拼接生成概率图;
对所述概率图进行阈值二值化处理得到掩码图像;
根据所述掩码图像识别出所述第一图像包含的目标特征区域。
在图6所示的设备的基础上,该设备中包括的处理器还用于执行以下动作:
获取多种不同检测对象类型对应的多组检测图像数据,其中,每组所述检测图像数据包括检测图像和所述检测图像对应的检测参考图像以及所述检测图像对应的目标特征区域标注信息和所述检测参考图像对应的目标特征区域标注信息;
将每个所述检测图像和所述检测参考图像对应的检测参考图像中的目标特征区域进行拼接得到拼接图作为样本拼接图,并将所述样本拼接图中的所述检测图像对应的标注标签作为所述样本拼接图的标注标签;
将每个所述样本拼接图以及所述样本拼接图对应的标注标签作为一组样本数据,将多组样本数据的集合作为样本集;
根据所述样本集训练预构建的卷积神经网络模型,获得处于收敛态的卷积神经网络模型作为所述图像识别模型。
基于本申请实施例提供的上述方法和装置的具体实现方式,本申请还提供了另一种图像识别设备。下面将从硬件实体化的角度对本申请实施例提供的设备进行介绍。
参见图7,图7是本申请实施例提供的另一种图像识别设备的结构示意图,该设备可以是服务器,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上中央处理器(central processing units,CPU)722(例如,一个或一个以上处理器)和存储器732,一个或一个以上存储应用程序742或数据744的存储介质730(例如一个或一个以上海量存储设备)。其中,存储器732和存储介质730可以是短暂存储或持久存储。存储在存储介质730的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,中央处理器722可以设置为与存储介质730通信,在服务器700上执行存储介质730中的一系列指令操作。
服务器700还可以包括一个或一个以上电源726,一个或一个以上有线或无线网络接口750,一个或一个以上输入输出接口758,和/或,一个或一个以上操作系统741,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等等。
上述实施例中由服务器所执行的步骤可以基于该图7所示的服务器结构。
其中,所述设备用于实现图像识别时,CPU 722用于执行如下步骤:
获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;
将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;
通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
根据所述拼接图的识别结果,识别出所述第一子图包含的目标特征区域。
可选的,所述CPU722还用于执行本申请实施例提供的图像识别方法的任意一种实现方式的步骤。
针对上文描述的图像识别设备,本申请实施例还提供了一种图像识别系统,以使上述图像识别方法在实际中实现以及应用。
参见图8,图8为本申请实施例提供的一种图像识别系统的结构示意图。在该系统中,包括:
图像采集设备801和图像识别设备802,其中,所述图像识别设备中部署有预训练的图像识别模型,其中,所述图像识别模型是通过样本数据训练所得的神经网络模型,所述样本数据包括样本拼接图和用于标注样本拼接图中的样本图像是否包含目标特征区域的标注标签;
所述图像采集设备801,用于采集待检测的第一图像和所述第一图像对应的参考图像,并向所述图像识别设备发送所述第一图像和所述第一图像对应的参考图像;
所述图像识别设备802,用于获取待检测的第一图像和所述第一图像对应的参考图像,所述参考图像为包含目标特征区域的图像;将所述第一图像和所述参考图像中的目标特征区域进行拼接得到拼接图;通过预训练的图像识别模型,获得所述拼接图的识别结果,所述识别结果用于表征所述第一图像包含所述目标对象的概率;根据所述拼接图的识别结果,识别出所述第一图像包含的目标特征区域。
可选的,图像识别设备802还用于向所述图像采集设备801发送所述第一子图包含的目标特征区域;
所述图像采集设备801还用于在所述第一图像中突出显示目标特征区域。
可选的,所述图像采集设备801为终端设备,所述图像识别设备802为服务器,所述终端设备与所述服务器通过网络进行通信。
本申请实施例还提供一种计算机可读存储介质,用于存储程序代码,该程序代码用于执行前述各个实施例所述的一种图像识别方法中的任意一种实施方式。
本申请实施例还提供一种包括指令的计算机程序产品,当其在计算机上运行时,使得计算机执行前述各个实施例所述的一种图像识别方法中的任意一种实施方式。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。