CN113205031A - 图像识别方法、装置、终端设备及存储介质 - Google Patents
图像识别方法、装置、终端设备及存储介质 Download PDFInfo
- Publication number
- CN113205031A CN113205031A CN202110459453.0A CN202110459453A CN113205031A CN 113205031 A CN113205031 A CN 113205031A CN 202110459453 A CN202110459453 A CN 202110459453A CN 113205031 A CN113205031 A CN 113205031A
- Authority
- CN
- China
- Prior art keywords
- image
- target
- specimen
- camera
- recognition result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 239000011521 glass Substances 0.000 claims abstract description 50
- 239000000203 mixture Substances 0.000 claims description 43
- 230000033001 locomotion Effects 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012549 training Methods 0.000 claims description 11
- 238000006243 chemical reaction Methods 0.000 claims description 8
- 238000006073 displacement reaction Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 6
- 230000003321 amplification Effects 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 210000003470 mitochondria Anatomy 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 210000003934 vacuole Anatomy 0.000 description 2
- 241000526657 Microchloa Species 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 235000008216 herbs Nutrition 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本申请公开了一种图像识别方法、装置、终端设备及存储介质,属于图像处理技术领域。应用于终端设备,终端设备包括摄像头以及可拆卸的载玻片组件,摄像头正对可拆卸的载玻片组件,载玻片组件包括载玻片支架,载玻片支架用于放置载玻片,该方法包括:获取摄像头采集的目标标本图像;对目标标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置;根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。本申请终端设备可以实时地对拍摄到的目标标本图像进行识别,在显示屏中进行目标识别结果显示,提高了终端设备获取目标标本图像的信息的效率。
Description
技术领域
本申请涉及图像处理技术领域,特别涉及一种图像识别方法、装置、终端设备及存储介质。
背景技术
随着科学技术领域的发展,显微镜作为一种观察物体的器件已经被广泛使用,人们可以通过显微镜查看到物体更细微的结构。
目前,为了方便人们使用,越来越多的终端设备可以安装有摄像头,用户可以将该摄像头与载玻片支架进行组合,构成一个显微镜,实现通过终端设备也可以获取到物体更细微的结构的功能。在这种显微镜结构中,用户通过在载玻片支架上放入携带有标本的载玻片后,可以通过终端设备控制摄像头进行拍摄。其中,如果用户需要对显微镜拍摄到的图像进行认知,需要通过自身经验对物体微观结构的了解,得到当前观察到的图像的类别等信息,或者通过查阅相关书籍得到类似物体的信息。
在上述相关技术中,由于终端设备未能及时展示观察到的图像的信息,造成获取标本对应的物体信息的时间长、效率低的问题。
发明内容
本申请实施例提供了一种图像识别方法、装置、终端设备及存储介质,可以提高终端设备获取目标标本图像的信息的效率。
一方面,本申请实施例提供了一种图像识别方法,所述方法应用于终端设备,所述终端设备包括摄像头以及可拆卸的载玻片组件,所述摄像头正对所述可拆卸的载玻片组件,所述载玻片组件包括载玻片支架,所述载玻片支架用于放置载玻片,所述方法包括:
获取所述摄像头采集的目标标本图像,所述目标标本图像是所述载玻片上包含的标本在基础放大倍数下的图像;
对所述目标标本图像进行图像识别,得到图像识别结果;
确定显示屏当前显示的图像画面对应在所述目标标本图像的图像区域位置;
根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果。
可选的,所述图像识别结果包括所述标本的标本类别、所述标本的组成结构的结构类别以及所述组成结构在所述目标标本图像中的像素坐标,所述对所述目标标本图像进行图像识别,得到图像识别结果,包括:
将所述目标标本图像输入至第一识别模型,通过所述第一识别模型对所述目标标本图像进行识别,获取所述目标标本图像对应的标本类别,所述第一识别模型是基于第一样本图像集进行训练得到的,所述第一样本图像集中包含有多张在基础放大倍数下的第一标本图像,每张第一标本图像携带有对应的标本类别标签;
将所述目标标本图像输入至第二识别模型,通过所述第二识别模型对所述目标标本图像进行识别,获取所述目标标本图像包含的组成结构的结构类别,以及所述组成结构在所述目标标本图像中的像素坐标,所述第二识别模型是基于第二样本图像集进行训练得到的,所述第二样本图像集中包含有多张在基础放大倍数下的第二标本图像,每张第二标本图像携带有对应的组成结构的结构类别标签以及对应的像素坐标标签。
可选的,所述确定显示屏当前显示的图像画面在所述目标标本图像的图像区域位置,包括:
确定所述终端设备的数字放大镜的放大倍数和移动信息,所述移动信息是所述目标标本图像按照所述放大倍数放大之后在所述显示屏的图像坐标系中移动的位移;
根据所述放大倍数和所述移动信息,对所述目标标本图像的像素坐标进行坐标转换,获取所述目标标本图像在所述显示屏中的图像坐标系下的图像坐标;
根据所述图像坐标系下的图像坐标,确定所述目标标本图像中与所述显示屏当前显示的图像画面对应的图像区域位置。
可选的,所述根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果,包括:
根据所述图像区域位置以及所述图像识别结果,从所述图像识别结果中筛选出所述目标识别结果,所述目标识别结果包括目标展示坐标、所述目标展示坐标对应的标本类别、所述目标展示坐标处的组成结构的结构类别,所述目标展示坐标是所述图像区域位置中包含的像素坐标;
将所述目标识别结果按照预设展示方式展示在所述显示屏的显示区域中。
可选的,在所述获取所述摄像头采集的目标标本图像之前,还包括:
检测所述终端设备的数字放大镜的放大倍数是否是基础放大倍数;
当所述数字放大镜的放大倍数是所述基础放大倍数时,控制所述摄像头对放置于所述载玻片支架的载玻片进行拍摄,得到第一标本图像,并将所述第一标本图像作为所述目标标本图像;
当所述数字放大镜的放大倍数不是所述基础放大倍数时,获取预先存储的基础放大倍数的第二标本图像,将所述第二标本图像作为所述目标标本图像。
可选的,在所述获取目标标本图像之前,还包括:
获取所述摄像头对放置于所述载玻片支架的载玻片进行拍摄得到的当前标本图像以及前N帧标本图像,所述N为正整数;
计算所述当前标本图像以及所述前N帧标本图像各自的哈希值;
当相邻帧的标本图像对应的哈希值之间的差值均小于预设差值阈值时,执行所述获取所述摄像头采集的目标标本图像的步骤。
可选的,所述终端设备中运行有目标应用程序,所述目标应用程序对应的应用界面包含所述标本在所述显示屏中显示的图像画面,在所述获取目标标本图像之前,还包括:
获取所述目标应用程序的操作状态,所述操作状态包括正在操作状态和未操作状态;
当所述目标应用程序的操作状态是所述未操作状态时,执行所述获取所述摄像头采集的目标标本图像的步骤。
另一方面,本申请实施例提供了一种图像识别装置,所述装置应用于终端设备,所述终端设备包括摄像头以及可拆卸的载玻片组件,所述摄像头正对所述可拆卸的载玻片组件,所述载玻片组件包括载玻片支架以及载玻片,所述装置包括:
图像获取模块,用于获取目标标本图像,所述目标标本图像是所述载玻片上包含的标本在基倍放大倍数下的图像;
图像识别模块,用于对所述目标标本图像进行图像识别,得到图像识别结果;
结果获取模块,用于从所述图像识别结果中获取所述目标标本图像中目标位置处对应的目标识别结果,所述目标位置是所述终端设备的显示屏显示的图像画面对应在所述目标标本图像中的图像区域位置。
另一方面,本申请实施例提供了一种终端设备,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如上述一个方面及其任一可选方式所述的图像识别方法。
另一方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述一个方面及其任一可选方式所述的图像识别方法。
另一方面,本申请实施例提供了一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如上述一个方面及其任一可选方式所述的图像识别方法。
另一方面,本申请实施例提供了一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行如上述一个方面及其任一可选方式所述的图像识别方法。
本申请实施例提供的技术方案可以至少包含如下有益效果:
本申请终端设备通过获取摄像头采集的目标标本图像,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像;对目标标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置;根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。终端设备可以基于基础放大倍数下的图像进行图像识别,并确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,从图像识别结果中获取图像区域位置处对应的目标识别结果并进行展示,可以实时地对拍摄到的目标标本图像进行识别,并对显示屏中当前显示的图像画面进行识别结果显示,使得终端设备更方便地展示标本的信息,提高了终端设备获取目标标本图像的信息的效率。
附图说明
图1是本申请一示例性实施例提供的一种终端设备拍摄的场景架构示意图;
图2是本申请一示例性实施例提供的一种图像识别方法的方法流程图;
图3是本申请一示例性实施例涉及的一种目标标本图像的结构示意图;
图4是本申请一示例性实施例提供的一种图像识别方法的方法流程图;
图5是本申请一示例性实施例涉及的一种图像显示界面的界面示意图;
图6是本申请一示例性实施例涉及的一种图像坐标系的结构示意图;
图7是本申请一示例性实施例涉及的一种图像识别结果的展示示意图;
图8是本申请一示例性实施例涉及的一种选择界面的界面示意图;
图9是本申请一示例性实施例涉及的一种目标识别结果的展示界面的界面示意图;
图10是本申请一示例性实施例涉及的一种目标识别结果的展示界面的界面示意图;
图11是本申请一示例性实施例提供的一种图像识别方法的方法流程图;
图12是本申请一示例性实施例提供的图像识别装置的结构框图;
图13是本申请一示例性实施例公开的一种终端设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请提供的方案,可以用于人们在日常生活中使用终端设备时,通过终端设备连接的摄像头采集固定在载玻片支架上采集载玻片上的物体图像的现实场景中,为了便于理解,下面首先对本申请实施例涉及的场景架构进行简单介绍。
随着科学技术的发展,各种各样的终端设备已经出现在人们的日常生活中,人们可以通过终端设备进行工作、娱乐、学习等。其中,在拍摄事物更微观的方面,目前已经可以对终端设备进行改进,通过利用终端设备自带的摄像头模组就可以拍摄更细微结构的图像。例如,终端设备可以安装一个可拆卸的载玻片组件,终端设备的摄像头正对可拆卸的载玻片组件,该载玻片组件中包括载玻片支架,载玻片支架上可以放置载玻片,在载玻片组件安装在终端设备上时,使得载玻片也可以与摄像头模组正对,从而使得终端设备通过摄像头模组拍摄到物体更细微结构的图像。
请参考图1,其示出了本申请一示例性实施例提供的一种终端设备拍摄的场景架构示意图。如图1所示,在该场景架构中包含了终端设备110。
其中,终端设备110是可以安装有摄像头的终端。比如,该终端可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP3播放器(Moving Picture Experts GroupAudio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture ExpertsGroup Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、笔记本电脑、膝上型便携计算机和台式计算机等等。
通过在终端设备110上增加可拆卸的载玻片组件120,可以实现终端设备通过摄像头拍摄到物体更细微结构的图像的功能。其中,载玻片组件120可以包括载玻片支架121,载玻片支架121上可以放置有载玻片122。用户在载玻片122上放置标本后,可以安装在载玻片支架121上,再将载玻片组件120整体安装在与摄像头正对的位置,使得终端设备通过摄像头观察到载玻片上的标本。可选的,终端设备110可以控制摄像头进行拍摄,获取到载玻片上展示的标本的图像。即,终端设备上的摄像头和载玻片组件可以构成简易的一台“显微镜”,进而拍摄标本更细微的结构。
在一种可能实现的方式中,上述终端设备110可以与载玻片组件之间可以通过通信网络连接,可选的,该通信网络是有线网络或无线网络。即,终端设备通过通信网络的方式控制载玻片组件,比如,控制载玻片的插入、移动等。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
在上述场景架构中,用户通过在载玻片上放置标本后,并将载玻片安装在载玻片支架上,从而可以通过控制终端设备控制摄像头进行拍摄,采集到载玻片上的标本的图像。通常情况下,用户通过观察拍摄到的标本的图像,通过自身对各个物体的认知获取观察到的标本图像的信息,比如标本所属的类别,标本的组成结构等。目前,终端设备中仅仅将摄像头拍摄到的标本图像展示在显示屏中,对于显示该标本的信息上,尚未有较为完善的技术方案,从而导致终端设备展示观察到的图像的信息不及时,造成获取标本对应的物体信息的时间长、效率低的问题。
为了避免上述技术方案中存在的问题,提高终端设备及时获取标本的识别结果并在显示屏中展示的效率。本申请提供了一种图像识别方法,可以实现终端设备主动控制摄像头进行拍摄,并获取到标本的目标识别结果,提高展示标本的信息的效率。
请参考图2,其示出了本申请一示例性实施例提供的一种图像识别方法的方法流程图。该方法可以用于图1所示的场景架构中,由该场景架构中的终端设备执行,该终端设备包括摄像头以及可拆卸的载玻片组件,摄像头正对可拆卸的载玻片组件,载玻片组件包括载玻片支架,载玻片支架用于放置载玻片,如图2所示,该图像识别方法可以包括如下几个步骤。
步骤201,获取摄像头采集的目标标本图像,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像。
可选的,基础放大倍数是载玻片组件包含的光学放大镜的放大倍数。其中,光学放大镜可以安装在摄像头与载玻片之间,摄像头拍摄到的图像是经过该光学放大镜放大之后的图像,基础放大倍数可以由开发人员预先设置(比如,1倍、2倍、3倍等)。用户可以将标本放置在载玻片中,并将载玻片放置在载玻片支架上,将光学放大镜的位置摆放正确,通过终端设备控制摄像头进行拍摄,摄像头拍摄到载玻片上基于基础放大倍数的标本的标本图像后,终端设备可以获取到该图像,该图像就是目标标本图像。
可选的,标本可以是现实生活中任意一个可以放置在载玻片上的物体。比如,标本是一片花瓣、一片树叶、一片肌肉组织等物体。
步骤202,对目标标本图像进行图像识别,得到图像识别结果。
可选的,终端设备可以对获取到的目标标本图像进行图像识别,获取图像识别结果。该图像识别结果可以包括目标标本图像的标本类别、标本的组成结构等。比如,标本是一片花瓣时,通过终端设备对目标标本图像进行图像识别之后,可以得知该标本的标本类别是花瓣。花瓣的组成结构可以是液泡、线粒体、细胞壁等,也可以是花瓣根部、花瓣中部、花瓣外部等。
请参考图3,其示出了本申请一示例性实施例涉及的一种目标标本图像的结构示意图。如图3所示,在花瓣300中包含了花瓣根部301、花瓣中部302、花瓣外部303,那么,终端设备可以通过图像识别,获取到的图像识别结果中包含花瓣根部301、花瓣中部302、花瓣外部303的组成结构。需要说明的是,此处具体的组成结构可以由开发人员预先通过机器学习模型训练,本申请对此并不加以限定。
步骤203,确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置。
可选的,终端设备具有显示屏,且在显示屏当前显示的图像画面中显示有目标标本图像的全部或者局部图像,本步骤中,终端设备可以确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置。其中,该图像区域位置是在目标标本图像的像素坐标系下的坐标区域位置。也就是说,终端设备可以确定出显示屏当前显示的图像画面对应在目标标本图像的像素坐标系下的坐标位置区域,将目标标本图像的像素坐标系下的坐标位置区域按照显示屏的显示方式显示出当前显示的图像画面。
步骤204,根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。
可选的,终端设备根据上述得到的图像识别结果,获取到图像区域位置处对应的目标识别结果,将目标识别结果在显示屏中显示,达到及时展示标本的相关信息。其中,终端设备对目标标本图像进行图像识别得到的图像识别结果中包含区域性信息,该区域性信息可以指示目标标本图像中不同区域内各自的结构所在的位置,在终端设备的显示屏中如果显示目标标本图像的局部图像时,终端设备通过将对应的局部图像的图像识别结果展示即可。
综上所述,本申请终端设备通过获取摄像头采集的目标标本图像,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像;对目标标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置;根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。终端设备可以基于基础放大倍数下的图像进行图像识别,并确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,从图像识别结果中获取图像区域位置处对应的目标识别结果并进行展示,可以实时地对拍摄到的目标标本图像进行识别,并对显示屏中当前显示的图像画面进行识别结果显示,使得终端设备更方便地展示标本的信息,提高了终端设备获取目标标本图像的信息的效率。
在一种可能实现的方式中,终端设备中安装有目标应用程序,该目标应用程序可以是用于对标本进行观测时使用的应用程序,该目标应用程序对应的应用界面包含标本在显示屏中显示的图像画面,在终端设备获取目标标本图像之前,终端设备可以对目标应用程序的操作状态进行检测,该操作状态包括正在操作状态和未操作状态,当目标应用程序的操作状态是未操作状态时,终端设备可以获取目标标本图像,从而执行后续步骤,使得显示的标本的信息更加稳定。
请参考图4,其示出了本申请一示例性实施例提供的一种图像识别方法的方法流程图。该方法可以用于图1所示的场景架构中,由该场景架构中的终端设备执行,该终端设备包括摄像头以及可拆卸的载玻片组件,摄像头正对可拆卸的载玻片组件,载玻片组件包括载玻片支架,载玻片支架用于放置载玻片,如图4所示,该图像识别方法可以包括如下几个步骤。
步骤401,获取目标应用程序的操作状态,操作状态包括正在操作状态和未操作状态。
可选的,终端设备中可以预先安装有目标应用程序,该目标应用程序可以是在观测标本时需要启动的应用程序。比如,用户需要通过终端设备观察标本时,需要通过启动该目标应用程序,在目标应用程序中展示相应的应用界面,从而将摄像头拍摄得到的标本图像展示在应用界面中。
可选的,目标应用程序的操作状态包括正在操作状态和未操作状态,正在操作状态是指用户通过触摸操作、鼠标点击等方式使得目标应用程序运行其他进程等。例如,用户通过触摸操作,控制显示屏中的图像画面移动,此时目标应用程序的操作状态就是正在操作状态。其中,目标应用程序的开发人员可以通过在应用程序中的一个或者多个节点处进行埋点,监测目标应用程序是否处于正在操作状态,从而得到目标应用程序的操作状态。或者,终端设备也可以通过检测显示屏中的触发操作,确定目标应用程序的操作状态,本申请对如何获取目标应用程序的操作状态的方式并不加以限定。
步骤402,当目标应用程序的操作状态是未操作状态时,获取摄像头采集的目标标本图像。
其中,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像。可选的,基础放大倍数是载玻片组件包含的光学放大镜的放大倍数,本申请实施例中基础放大倍数可以是1倍放大倍数。
当上述获取到的目标应用程序的操作状态是未操作状态时,终端设备可以执行获取摄像头采集的目标标本图像的步骤。其中,终端设备可以通过调用摄像头,对放置于载玻片支架的载玻片进行拍摄,从而得到的目标标本图像。
在一种可能实现的方式中,为了提高获取目标标本图像的准确性,在拍摄过程中,终端设备还可以获取摄像头对放置于载玻片支架的载玻片进行拍摄得到的当前标本图像以及前N帧标本图像,N为正整数;计算当前标本图像以及前N帧标本图像各自的哈希值;当相邻帧的标本图像对应的哈希值之间的差值均小于预设差值阈值时,执行获取摄像头采集的目标标本图像的步骤。
即,每次获取目标标本图像之前,终端设备可以获取此时拍摄得到当前帧图像以及之前拍摄的前N帧标本图像,比如,终端设备通过A秒内获取多帧标本图像,并计算各帧标本图像各自的哈希值,如果相邻帧的标本图像对应的哈希值之间的差值均小于预设差值阈值,再将当前帧图像获取为目标标本图像。其中,预设差值阈值可以由开发人员预先设置。例如,预设差值阈值是B,终端设备准备获取目标标本图像时,通过计算当前标本图像以及前N帧标本图像各自的哈希值,获取相邻帧的标本图像对应的哈希值之间的差值,如果每相邻帧的标本图像各自的哈希值之间的差值均小于B,说明载玻片此时未移动或者抖动,对载玻片上的标本进行图像采集得到的图像是稳定的,此时终端设备可以将获取的当前标本图像作为目标标本图像。
在一种可能实现的方式中,在获取目标标本图像之前,终端设备还可以检测终端设备的数字放大镜的放大倍数是否是基础放大倍数;当数字放大镜的放大倍数是基础放大倍数时,控制摄像头对放置于载玻片支架的载玻片进行拍摄,得到第一标本图像,并将第一标本图像作为目标标本图像;当数字放大镜的放大倍数不是基础放大倍数时,获取预先存储的基础放大倍数的第二标本图像,将第二标本图像作为目标标本图像。
其中,数字放大镜的放大倍数可以看做是终端设备通过目标应用程序对任意一个图像进行放大时,终端设备对该图像的放大倍数。比如,终端设备可以在显示屏中显示该图像,将该图像进行放大、缩小等操作,数字放大镜是终端设备中的虚拟放大镜,放大或者缩小的倍数就是数字放大镜的放大倍数。请参考图5,其示出了本申请一示例性实施例涉及的一种图像显示界面的界面示意图。如图5所示,在终端设备500中,包含了显示区域501,蒙版区域502。终端设备500在显示区域501中显示图像,用户可以通过在显示区域中操作或者对界面中的虚拟控件进行操作,使得显示区域501中的图像放大或者缩小,实现数字放大的效果。
如上述图5所示,终端设备可以通过目标应用程序将标本图像展示在显示屏中,终端设备通过检测数字放大镜的放大倍数是否是基础放大倍数,此处,基础放大倍数也以上述1倍放大倍数为例,终端设备检测数字放大镜的放大倍数是否是1倍,如果数字放大镜的放大倍数是1倍,终端设备可以控制摄像头对放置于载玻片支架的载玻片进行拍摄,得到第一标本图像,并将第一标本图像作为目标标本图像,从而获取到目标标本图像;如果数字放大镜的放大倍数不是1倍,终端设备可以从预置内存中获取预先存储的基础放大倍数的第二标本图像,并将第二标本图像作为目标标本图像。其中,第二标本图像可以是开发人员对同一标本预先进行采集并存储在预置内存中的。
在一种可能实现的方式中,用户在启动目标应用程序之前,还可以在载玻片上放置标本,并将载玻片安装在载玻片支架上。可选的,载玻片支架上可以安装有触发器件,终端设备通过该触发器件检测载玻片是否放入,在载玻片安装到载玻片支架上时可以触发该触发器件向终端设备反馈触发信号,该触发信号可以指示载玻片已经安装在载玻片支架上,从而使得终端设备根据该触发信号来检测载玻片的放入。例如,在载玻片支架上放置载玻片的容纳槽中安装有霍尔器件,当用户将载玻片放置在载玻片支架上的容纳槽中时,载玻片可以触发该霍尔器件,使得终端设备接收到该霍尔器件反馈的触发信号,进而指示终端设备载玻片放置在载玻片支架上,并触发终端设备检测目标应用程序的操作状态。
可选的,当用户将载玻片进行移动后,以不同的角度观察标本时,终端设备可以重新执行上述步骤401至步骤402的步骤,采集新的目标标本图像。例如,用户移动载玻片之后,终端设备可以通过接收到该霍尔器件重新反馈的触发信号,从而使得终端设备重新对移动之后的标本执行上述步骤。
步骤403,对目标标本图像进行图像识别,得到图像识别结果。
其中,图像识别结果包括标本的标本类别、标本的组成结构的结构类别以及组成结构在目标标本图像中的像素坐标。
可选的,标本的标本类别可以是标本所属的类,例如,树叶、树干、果皮、花瓣、小草、毛发等。其所属类别的精确度由训练的模型决定,此处不再赘述。可选的,终端设备可以将目标标本图像输入至第一识别模型,通过第一识别模型对目标标本图像进行识别,获取目标标本图像对应的标本类别。其中,第一识别模型是基于第一样本图像集进行训练得到的,第一样本图像集中包含有多张在基础放大倍数下的第一标本图像,每张第一标本图像携带有对应的标本类别标签。即,开发人员可以预先通过第一样本图像集的各个样本图像进行模型训练,得到可以识别出各个样本图像的标本类别的机器学习模型,从而得到第一识别模型,将第一识别模型设置在终端设备中,从而实现对目标标本图像进行图像识别的效果。
例如,第一样本图像集中包含的各个第一标本图像对应的标本类别标签分别是树叶、树干、果皮、花瓣、小草等标签,开发人员通过第一样本图像集进行模型训练,得到第一识别模型,通过对该第一识别模型输入一个图像,该第一识别模型可以输出该图像对应的标本类别的结果。
可选的,终端设备还可以将目标标本图像输入至第二识别模型,通过第二识别模型对目标标本图像进行识别,获取目标标本图像包含的组成结构的结构类别,以及组成结构在目标标本图像中的像素坐标。其中,第二识别模型是基于第二样本图像集进行训练得到的,第二样本图像集中包含有多张在基础放大倍数下的第二标本图像,每张第二标本图像携带有对应的组成结构的结构类别标签以及对应的像素坐标标签对目标标本图像进行图像识别,得到图像识别结果。
类似的,第二样本图像集中包含的各个第二标本图像对应的组成结构的结构类别标签分别是叶绿体、线粒体、细胞壁、液泡等标签,以及对应的像素坐标标签分别是A区域、B区域、C区域等,开发人员通过第二样本图像集进行模型训练,得到第二识别模型,通过对该第二识别模型输入一个图像,该第一识别模型可以输出该图像对应的组成结构的结构类别的结果,以及组成结构所在图像内区域的结果。
可选的,上述第一识别模型和第二识别模型实现的效果也可以通过一个或者更多个机器学习模型实现,本申请实施例对此并不加以限定。
步骤404,确定终端设备的数字放大镜的放大倍数和移动信息,移动信息是目标标本图像按照放大倍数放大之后在显示屏的图像坐标系中移动的位移。
可选的,终端设备可以通过目标应用程序获取自身当前展示目标标本图像时数字放大镜的放大倍数。比如,用户在查看目标标本图像过程中,通过放大控件将该目标标本图像放大了10倍,那么,终端设备获取的数字放大镜的放大倍数就是10倍。
可选的,用户在查看上述目标标本图像的过程中,通过拖拽控件,对目标标本图像进行了移动,终端设备可以基于显示屏的图像坐标系记录用户移动的位移。请参考图6,其示出了本申请一示例性实施例涉及的一种图像坐标系的结构示意图。如图6所示,图像坐标系600是终端设备通过目标应用程序对显示屏建立的一个坐标系,用户通过终端设备601的显示屏602控制显示的目标标本图像移动,比如手指从虚线位置移动到实线位置,用户在横纵坐标轴上对目标标本图像的移动距离都可以由终端设备记录,从而使得终端设备得到移动信息。
步骤405,根据放大倍数和移动信息,对目标标本图像的像素坐标进行坐标转换,获取目标标本图像在显示屏中的图像坐标系下的图像坐标。
可选的,终端设备得到放大倍数和移动信息之后,通过对目标标本图像进行放大、移动等处理,得到模拟显示屏中放大后的目标标本图像的结果,从而实现坐标转换,获取到目标标本图像在显示屏中的图像坐标系下的图像坐标。
步骤406,根据图像坐标系下的图像坐标,确定目标标本图像中与显示屏当前显示的图像画面对应的图像区域位置。
可选的,终端设备在显示目标标本图像的过程中,用户通过放大、移动等操作将目标标本图像的全部或者局部图像展示在显示区域中,终端设备在根据放大倍数和移动信息获取到目标标本图像在显示屏中的图像坐标系下的图像坐标后,可以从该图像坐标系下的图像坐标中,选择出与显示屏当前显示的图像画面对应的位置区域,通过该位置区域,确定目标标本图像中的图像区域位置。
例如,终端设备获取之前对目标标本图像中的像素坐标进行坐标转换的对应关系,得到此处在图像坐标系下的图像坐标中与显示屏当前显示的图像画面对应的目标标本图像中的图像区域位置。或者,终端设备还可以通过目标应用程序将显示屏中的显示区域模拟出对应的预设采集区域,通过预设采集区域对图像坐标系下的目标标本图像进行截取,获取到对应的位置区域,根据将图像坐标系下的图像坐标转化至放大、移动之前的目标标本图像中的图像区域位置,从而得到目标标本图像中与显示屏当前显示的图像画面对应的图像区域位置。
比如,将目标标本图像按照获取到的放大倍数进行放大,并按照放大后的目标标本图像的中心位置移动对应的位移信息,通过预设采集区域对放大并移动之后的目标标本图像进行截取,从而确定出显示屏中对应的需要显示的区域内的图像坐标,将该图像坐标转换回未放大、未移动的目标标本图像中,得到目标标本图像中与图像坐标对应的图像区域位置。其中,预设采集区域与显示屏中显示区域的面积大小相同,且预设采集区域的中心与移动之前目标标本图像的中心位置重合。
步骤407,根据图像区域位置以及图像识别结果,从图像识别结果中筛选出目标识别结果,目标识别结果包括目标展示坐标、目标展示坐标对应的标本类别、目标展示坐标处的组成结构的结构类别,目标展示坐标是图像区域位置中包含的像素坐标。
其中,终端设备通过该图像区域位置,对图像识别结果进行筛选,得到图像识别结果中需要显示的目标识别结果。
可选的,上述图像识别结果中包括通过第一识别模型识别得到的标本的标本类别,通过第二识别模型识别得到的标本的组成结构的结构类别,以及组成结构在目标标本图像中的像素坐标,在本步骤中,通过确定出的图像区域位置对应的像素坐标,从图像识别结果中筛选出目标识别结果。
例如,请参考图7,其示出了本申请一示例性实施例涉及的一种图像识别结果的展示示意图。如图7所示,在目标标本图像700中,包括了标本的组成结构一701,标本的组成结构二702,标本的组成结构三703,各个组成结构对应的结构类别分别是类别一、类别二、类别三;标本的组成结构一701在目标标本图像中的像素坐标可以通过像素坐标一来表示,标本的组成结构二702在目标标本图像中的像素坐标可以通过像素坐标二来表示,标本的组成结构三703在目标标本图像中的像素坐标可以通过像素坐标三来表示,终端设备通过上述第一识别模型得到目标标本图像700对应的标本类别,通过第二识别模型得到各个组成结构对应的结构类别,以及组成结构在目标标本图像中的像素坐标,图像区域位置中包含像素坐标一和像素坐标二,终端设备通过该图像区域位置得知像素坐标一和像素坐标二是目标展示坐标,通过目标展示坐从图像识别结果中得到目标展示坐标对应的标本类别,以及目标展示坐标处的组成结构的结构类别。
步骤408,将目标识别结果按照预设展示方式展示在显示屏的显示区域中。
可选的,终端设备可以将得到的目标识别结果按照预设展示方式展示在显示屏的显示区域中。
在一种可能实现的方式中,预设展示方式可以由用户在目标应用程序的选择界面中选择。例如,请参考图8,其示出了本申请一示例性实施例涉及的一种选择界面的界面示意图。如图8所示,在终端设备的展示方式选择界面800中,包含了第一展示方式801,第二展示方式802,第三展示方式803。用户可以通过选择对应的展示方式,确定终端设备如何将目标识别结果在显示屏的显示区域中显示出来。
比如,第一展示方式801是按照表格形式进行展示,当用户在图8中选择第一展示方式后,终端设备可以按照表格的形式将目标识别结果在显示屏的显示区域中展示。第二展示方式802是按照箭头指示的形式进行展示,当用户在图8中选择第二展示方式后,终端设备可以按照箭头指示的形式将目标识别结果在显示屏的显示区域中展示。请参考图9,其示出了本申请一示例性实施例涉及的一种目标识别结果的展示界面的界面示意图。如图9所示,在展示界面900中包含了需要展示的目标识别结果901。第三展示方式803是按照标签形式展示,当用户在图8中选择第三展示方式后,终端设备可以按照标签形式将目标识别结果在显示屏的显示区域中展示。请参考图10,其示出了本申请一示例性实施例涉及的一种目标识别结果的展示界面的界面示意图。如图10所示,在展示界面1000中包含了需要展示的目标识别结果1001。
综上所述,本申请终端设备通过获取摄像头采集的目标标本图像,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像;对目标标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置;根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。终端设备可以基于基础放大倍数下的图像进行图像识别,并确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,从图像识别结果中获取图像区域位置处对应的目标识别结果并进行展示,可以实时地对拍摄到的目标标本图像进行识别,并对显示屏中当前显示的图像画面进行识别结果显示,使得终端设备更方便地展示标本的信息,提高了终端设备获取目标标本图像的信息的效率。
另外,通过第二识别模型在识别组成结构的结构类别时,结合组成结构的像素坐标,使得后续展示识别结果时更加准确,提高了信息展示的准确性。本申请还通过检测目标应用程序的操作状态,以及检测载玻片上的标本是否发生移动,从而避免在非稳定状态下对标本进行图像采集,从而提高标本识别和标本结构检测的精度和整体系统的实时性。
下面,以上述终端设备是平板电脑,平板电脑通过自身的摄像头以及可拆卸的载玻片组件进行组合为例,对上述图2和图4所示的实施例进行举例介绍。请参考图11,其示出了本申请一示例性实施例提供的一种图像识别方法的方法流程图。该方法可以用于图1所示的场景架构中,由该场景架构中的平板电脑执行,该平板电脑包括摄像头以及可拆卸的载玻片组件,摄像头正对可拆卸的载玻片组件,载玻片组件包括载玻片支架,载玻片支架用于放置载玻片,如图11所示,该图像识别方法可以包括如下几个步骤。
步骤1101,在平板电脑的摄像头对应位置安装载玻片组件。
可选的,用户通过将载玻片组件按照规定位置安装在摄像头的对应位置,使得摄像头可以采集到的载玻片的图像。
步骤1102,平板电脑检测目标应用程序的操作状态。
可选的,当用户在平板电脑中执行触摸、滑动等操作时,确定平板电脑中目标应用程序的操作状态是正在操作状态,重新执行步骤1102,继续对目标应用程序的操作状态进行检测。如果平板电脑中目标应用程序的操作状态是未操作状态,执行步骤1103。
步骤1103,平板电脑检测载玻片上的标本是否发生移动。
即,在确定目标应用程序的操作状态是未操作状态时,平板电脑可以继续检测载玻片上的标本是否发生移动,如果发生移动,返回步骤1102,如果未发生移动,执行步骤1104。需要说明的是,上述步骤1102和步骤1103的检测顺序也可以调换,此处不再赘述。
步骤1104,平板电脑获取1倍的目标标本图像。
可选的,平板电脑获取1倍的目标标本图像的过程可以参考上述402中的描述,此处不再赘述。
步骤1105,平板电脑对目标标本图像进行标本类别识别,获取标本的标本类别。
步骤1106,平板电脑对目标标本图像进行内部结构检测,获取组成结构的结构类别以及像素坐标。
可选的,步骤1105至步骤1106的识别过程可以参照上述步骤403中的描述,此处不再赘述。
步骤1107,确定平板电脑的显示屏当前显示的图像画面对应在目标标本图像的图像区域位置。
可选的,步骤1107中平板电脑的实现方式可以参照上述步骤404至步骤406中的描述,此处不再赘述。
步骤1108,在显示屏中显示目标识别结果,目标识别结果包括目标展示坐标、目标展示坐标对应的标本类别、目标展示坐标处的组成结构的结构类别,目标展示坐标是图像区域位置中包含的像素坐标。
可选的,步骤1108中平板电脑将目标识别结果进行展示的内容可以参照上述步骤407至步骤408中的描述,此处不再赘述。
综上所述,本申请平板电脑通过获取摄像头采集的1倍标本图像,对1倍标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,并在显示屏中显示目标识别结果。平板电脑可以基于1倍放大倍数下的图像进行图像识别,并确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,从图像识别结果中获取图像区域位置处对应的目标识别结果并进行展示,可以实时地对拍摄到的目标标本图像进行识别,并对显示屏中当前显示的图像画面进行识别结果显示,使得平板电脑更方便地展示标本的信息,提高了平板电脑获取目标标本图像的信息的效率。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图12,其示出了本申请一示例性实施例提供的图像识别装置的结构框图。该图像识别装置1200可以用于图1所示的场景架构中,由该场景架构中的终端设备执行,该终端设备包括摄像头以及可拆卸的载玻片组件,摄像头正对可拆卸的载玻片组件,载玻片组件包括载玻片支架,载玻片支架用于放置载玻片,以实现图2,图4或者图11所示实施例提供的方法中由终端设备执行的全部或者部分步骤。该图像识别装置1200可以包括如下几个模块:
图像获取模块1201,用于获取所述摄像头采集的目标标本图像,所述目标标本图像是所述载玻片上包含的标本在基础放大倍数下的图像;
结果获取模块1202,用于对所述目标标本图像进行图像识别,得到图像识别结果;
位置确定模块1203,用于确定显示屏当前显示的图像画面对应在所述目标标本图像的图像区域位置;
结果显示模块1204,用于根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果。
可选的,所述图像识别结果包括所述标本的标本类别、所述标本的组成结构的结构类别以及所述组成结构在所述目标标本图像中的像素坐标,所述结果获取模块1202,包括,第一识别单元和第二识别单元;
所述第一识别单元,用于将所述目标标本图像输入至第一识别模型,通过所述第一识别模型对所述目标标本图像进行识别,获取所述目标标本图像对应的标本类别,所述第一识别模型是基于第一样本图像集进行训练得到的,所述第一样本图像集中包含有多张在基础放大倍数下的第一标本图像,每张第一标本图像携带有对应的标本类别标签;
所述第二识别单元,用于将所述目标标本图像输入至第二识别模型,通过所述第二识别模型对所述目标标本图像进行识别,获取所述目标标本图像包含的组成结构的结构类别,以及所述组成结构在所述目标标本图像中的像素坐标,所述第二识别模型是基于第二样本图像集进行训练得到的,所述第二样本图像集中包含有多张在基础放大倍数下的第二标本图像,每张第二标本图像携带有对应的组成结构的结构类别标签以及对应的像素坐标标签。
可选的,所述位置确定模块1203,包括:第一确定单元,坐标转换单元和第二确定单元;
所述第一确定单元,用于确定所述终端设备的数字放大镜的放大倍数和移动信息,所述移动信息是所述目标标本图像按照所述放大倍数放大之后在所述显示屏的图像坐标系中移动的位移;
所述坐标转换单元,用于根据所述放大倍数和所述移动信息,对所述目标标本图像的像素坐标进行坐标转换,获取所述目标标本图像在所述显示屏中的图像坐标系下的图像坐标;
所述第二确定单元,用于根据所述图像坐标系下的图像坐标,确定所述目标标本图像中与所述显示屏当前显示的图像画面对应的图像区域位置。
可选的,所述结果显示模块1204,包括:结果选择单元和显示单元;
所述结果选择单元,用于根据所述图像区域位置以及所述图像识别结果,从所述图像识别结果中筛选出所述目标识别结果,所述目标识别结果包括目标展示坐标、所述目标展示坐标对应的标本类别、所述目标展示坐标处的组成结构的结构类别,所述目标展示坐标是所述图像区域位置中包含的像素坐标;
所述显示单元,用于将所述目标识别结果按照预设展示方式展示在所述显示屏的显示区域中。
可选的,所述装置还包括:
倍数检测模块,用于在所述图像获取模块1201获取所述摄像头采集的目标标本图像之前,检测所述终端设备的数字放大镜的放大倍数是否是基础放大倍数;
第一采集模块,用于当所述数字放大镜的放大倍数是所述基础放大倍数时,控制所述摄像头对放置于所述载玻片支架的载玻片进行拍摄,得到第一标本图像,并将所述第一标本图像作为所述目标标本图像;
第二采集模块,用于当所述数字放大镜的放大倍数不是所述基础放大倍数时,获取预先存储的基础放大倍数的第二标本图像,将所述第二标本图像作为所述目标标本图像。
可选的,所述装置还包括:
第一获取模块,用于在所述图像获取模块1201获取所述摄像头采集的目标标本图像之前,获取所述摄像头对放置于所述载玻片支架的载玻片进行拍摄得到的当前标本图像以及前N帧标本图像,所述N为正整数;
第一计算模块,用于计算所述当前标本图像以及所述前N帧标本图像各自的哈希值;
第一执行模块,用于当相邻帧的标本图像对应的哈希值之间的差值均小于预设差值阈值时,执行所述获取所述摄像头采集的目标标本图像的步骤。
可选的,所述终端设备中运行有目标应用程序,所述目标应用程序对应的应用界面包含所述标本在所述显示屏中显示的图像画面,所述装置还包括:
第二获取模块,用于在所述图像获取模块1201获取所述摄像头采集的目标标本图像之前,获取所述目标应用程序的操作状态,所述操作状态包括正在操作状态和未操作状态;
第二执行模块,用于当所述目标应用程序的操作状态是所述未操作状态时,执行所述获取所述摄像头采集的目标标本图像的步骤。
综上所述,本申请终端设备通过获取摄像头采集的目标标本图像,目标标本图像是载玻片上包含的标本在基础放大倍数下的图像;对目标标本图像进行图像识别,得到图像识别结果;确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置;根据图像识别结果获取图像区域位置处对应的目标识别结果,并在显示屏中显示目标识别结果。终端设备可以基于基础放大倍数下的图像进行图像识别,并确定显示屏当前显示的图像画面对应在目标标本图像的图像区域位置,从图像识别结果中获取图像区域位置处对应的目标识别结果并进行展示,可以实时地对拍摄到的目标标本图像进行识别,并对显示屏中当前显示的图像画面进行识别结果显示,使得终端设备更方便地展示标本的信息,提高了终端设备获取目标标本图像的信息的效率。
请参考图13,其示出了本申请一示例性实施例公开的一种终端设备的结构示意图。如图13所示,可以包括:射频(Radio Frequency,RF)电路1310、存储器1320、输入单元1330、显示单元1340、传感器1350、音频电路1360、WiFi模块1370、处理器1380、以及电源1390等部件。在上述实施例中,该终端设备是可以作为按摩设备,也可以作为目标设备。本领域技术人员可以理解,图13中示出的终端设备结构并不构成对终端设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图13对终端设备的各个构成部件进行介绍:
RF电路1310可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器1380处理;另外,将设计上行的数据发送给基站。通常,RF电路1310包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(Low NoiseAmplifier,LNA)、双工器等。此外,RF电路1310还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(GlobalSystem of Mobile communication,GSM)、通用分组无线服务(General Packet RadioService,GPRS)、码分多址(Code Division Multiple Access,CDMA)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、长期演进(Long Term Evolution,LTE)、电子邮件、短消息服务(Short Messaging Service,SMS)等。
存储器1320可用于存储软件程序以及模块,处理器1380通过运行存储在存储器1320的软件程序以及模块,从而执行终端设备的各种功能应用以及数据处理。存储器1320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据终端设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器1320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元1330可用于接收输入的数字或字符信息,以及产生与终端设备的用户设置以及功能控制有关的键信号输入。具体地,输入单元1330可包括触控面板1331以及其他输入设备1332。触控面板1331,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板1331上或在触控面板1331附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板1331可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器1380,并能接收处理器1380发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板1331。除了触控面板1331,输入单元1330还可以包括其他输入设备1332。具体地,其他输入设备1332可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元1340可用于显示由用户输入的信息或提供给用户的信息以及终端设备的各种菜单。显示单元1340可包括显示面板1341,可选的,可以采用液晶显示器(LiquidCrystal Display,LCD)、有机发光二极管(Organic Light-Emitting Diode,OLED)等形式来配置显示面板1341。进一步的,触控面板1331可覆盖显示面板1341,当触控面板1331检测到在其上或附近的触摸操作后,传送给处理器1380以确定触摸事件的类型,随后处理器1380根据触摸事件的类型在显示面板1341上提供相应的视觉输出。虽然在图13中,触控面板1331与显示面板1341是作为两个独立的部件来实现终端设备的输入和输入功能,但是在某些实施例中,可以将触控面板1331与显示面板1341集成而实现终端设备的输入和输出功能。
终端设备还可包括至少一种传感器1350,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板1341的亮度,接近传感器可在终端设备移动到耳边时,关闭显示面板1341和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别终端设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于终端设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路1360、扬声器1361,传声器1362可提供用户与终端设备之间的音频接口。音频电路1350可将接收到的音频数据转换后的电信号,传输到扬声器1361,由扬声器1361转换为声音信号输出;另一方面,传声器1362将收集的声音信号转换为电信号,由音频电路1360接收后转换为音频数据,再将音频数据输出处理器1380处理后,经RF电路1310以发送给比如另一终端设备,或者将音频数据输出至存储器1320以便进一步处理。
WiFi属于短距离无线传输技术,终端设备通过WiFi模块1370可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图13示出了WiFi模块1370,但是可以理解的是,其并不属于终端设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器1380是终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分,通过运行或执行存储在存储器1320内的软件程序和/或模块,以及调用存储在存储器1320内的数据,执行终端设备的各种功能和处理数据,从而对终端设备进行整体监控。可选的,处理器1380可包括一个或多个处理单元;优选的,处理器1380可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器1380中。
终端设备还包括给各个部件供电的电源1390(比如电池),优选的,电源可以通过电源管理系统与处理器1380逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,终端设备还可以包括摄像头、蓝牙模块等,在此不再赘述。
本申请实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序被处理器执行时实现上述方法实施例中的方法。
本申请实施例公开一种计算机程序产品,该计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,且该计算机程序可操作来使计算机执行上述方法实施例中的方法。
本申请实施例公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行上述方法实施例中的方法。
应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定特征、结构或特性可以以任意适合的方式结合在一个或多个实施例中。本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在本申请的各种实施例中,应理解,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本申请各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本申请的各个实施例上述方法的部分或全部步骤。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
以上对本申请实施例公开的一种图像识别方法、装置、终端设备以及存储介质进行了举例介绍,本文中应用了个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种图像识别方法,其特征在于,所述方法应用于终端设备,所述终端设备包括摄像头以及可拆卸的载玻片组件,所述摄像头正对所述可拆卸的载玻片组件,所述载玻片组件包括载玻片支架,所述载玻片支架用于放置载玻片,所述方法包括:
获取所述摄像头采集的目标标本图像,所述目标标本图像是所述载玻片上包含的标本在基础放大倍数下的图像;
对所述目标标本图像进行图像识别,得到图像识别结果;
确定显示屏当前显示的图像画面对应在所述目标标本图像的图像区域位置;
根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果。
2.根据权利要求1所述的方法,其特征在于,所述图像识别结果包括所述标本的标本类别、所述标本的组成结构的结构类别以及所述组成结构在所述目标标本图像中的像素坐标,所述对所述目标标本图像进行图像识别,得到图像识别结果,包括:
将所述目标标本图像输入至第一识别模型,通过所述第一识别模型对所述目标标本图像进行识别,获取所述目标标本图像对应的标本类别,所述第一识别模型是基于第一样本图像集进行训练得到的,所述第一样本图像集中包含有多张在基础放大倍数下的第一标本图像,每张第一标本图像携带有对应的标本类别标签;
将所述目标标本图像输入至第二识别模型,通过所述第二识别模型对所述目标标本图像进行识别,获取所述目标标本图像包含的组成结构的结构类别,以及所述组成结构在所述目标标本图像中的像素坐标,所述第二识别模型是基于第二样本图像集进行训练得到的,所述第二样本图像集中包含有多张在基础放大倍数下的第二标本图像,每张第二标本图像携带有对应的组成结构的结构类别标签以及对应的像素坐标标签。
3.根据权利要求2所述的方法,其特征在于,所述确定显示屏当前显示的图像画面在所述目标标本图像的图像区域位置,包括:
确定所述终端设备的数字放大镜的放大倍数和移动信息,所述移动信息是所述目标标本图像按照所述放大倍数放大之后在所述显示屏的图像坐标系中移动的位移;
根据所述放大倍数和所述移动信息,对所述目标标本图像的像素坐标进行坐标转换,获取所述目标标本图像在所述显示屏中的图像坐标系下的图像坐标;
根据所述图像坐标系下的图像坐标,确定所述目标标本图像中与所述显示屏当前显示的图像画面对应的图像区域位置。
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果,包括:
根据所述图像区域位置以及所述图像识别结果,从所述图像识别结果中筛选出所述目标识别结果,所述目标识别结果包括目标展示坐标、所述目标展示坐标对应的标本类别、所述目标展示坐标处的组成结构的结构类别,所述目标展示坐标是所述图像区域位置中包含的像素坐标;
将所述目标识别结果按照预设展示方式展示在所述显示屏的显示区域中。
5.根据权利要求1所述的方法,其特征在于,在所述获取所述摄像头采集的目标标本图像之前,还包括:
检测所述终端设备的数字放大镜的放大倍数是否是基础放大倍数;
当所述数字放大镜的放大倍数是所述基础放大倍数时,控制所述摄像头对放置于所述载玻片支架的载玻片进行拍摄,得到第一标本图像,并将所述第一标本图像作为所述目标标本图像;
当所述数字放大镜的放大倍数不是所述基础放大倍数时,获取预先存储的基础放大倍数的第二标本图像,将所述第二标本图像作为所述目标标本图像。
6.根据权利要求1至5任一所述的方法,其特征在于,在所述获取所述摄像头采集的目标标本图像之前,还包括:
获取所述摄像头对放置于所述载玻片支架的载玻片进行拍摄得到的当前标本图像以及前N帧标本图像,所述N为正整数;
计算所述当前标本图像以及所述前N帧标本图像各自的哈希值;
当相邻帧的标本图像对应的哈希值之间的差值均小于预设差值阈值时,执行所述获取所述摄像头采集的目标标本图像的步骤。
7.根据权利要求1至5任一所述的方法,其特征在于,所述终端设备中运行有目标应用程序,所述目标应用程序对应的应用界面包含所述标本在所述显示屏中显示的图像画面,在所述获取所述摄像头采集的目标标本图像之前,还包括:
获取所述目标应用程序的操作状态,所述操作状态包括正在操作状态和未操作状态;
当所述目标应用程序的操作状态是所述未操作状态时,执行所述获取所述摄像头采集的目标标本图像的步骤。
8.一种图像识别装置,其特征在于,所述方法应用于终端设备,所述终端设备包括摄像头以及可拆卸的载玻片组件,所述摄像头正对所述可拆卸的载玻片组件,所述载玻片组件包括载玻片支架,所述载玻片支架用于放置载玻片,所述装置包括:
图像获取模块,用于获取所述摄像头采集的目标标本图像,所述目标标本图像是所述载玻片上包含的标本在基础放大倍数下的图像;
结果获取模块,用于对所述目标标本图像进行图像识别,得到图像识别结果;
位置确定模块,用于确定显示屏当前显示的图像画面对应在所述目标标本图像的图像区域位置;
结果显示模块,用于根据所述图像识别结果获取所述图像区域位置处对应的目标识别结果,并在所述显示屏中显示所述目标识别结果。
9.一种终端设备,其特征在于,包括存储器及处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器实现如权利要求1至7任一所述的图像识别方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的图像识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110459453.0A CN113205031A (zh) | 2021-04-27 | 2021-04-27 | 图像识别方法、装置、终端设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110459453.0A CN113205031A (zh) | 2021-04-27 | 2021-04-27 | 图像识别方法、装置、终端设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113205031A true CN113205031A (zh) | 2021-08-03 |
Family
ID=77026858
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110459453.0A Pending CN113205031A (zh) | 2021-04-27 | 2021-04-27 | 图像识别方法、装置、终端设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113205031A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837195A (zh) * | 2021-10-19 | 2021-12-24 | 维沃移动通信有限公司 | 图像处理方法、装置、设备和存储介质 |
-
2021
- 2021-04-27 CN CN202110459453.0A patent/CN113205031A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113837195A (zh) * | 2021-10-19 | 2021-12-24 | 维沃移动通信有限公司 | 图像处理方法、装置、设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11355157B2 (en) | Special effect synchronization method and apparatus, and mobile terminal | |
CN108848308B (zh) | 一种拍摄方法及移动终端 | |
WO2017020663A1 (zh) | 弹幕视频直播方法、装置、视频源设备及网络接入设备 | |
CN109525874B (zh) | 一种截屏方法及终端设备 | |
WO2019091486A1 (zh) | 拍照处理的方法、装置、终端和存储介质 | |
CN111432265B (zh) | 一种处理视频画面的方法、相关装置及存储介质 | |
CN109040643A (zh) | 移动终端及远程合影的方法、装置 | |
CN108924412B (zh) | 一种拍摄方法及终端设备 | |
CN107908765B (zh) | 一种游戏资源处理方法、移动终端及服务器 | |
CN108833262B (zh) | 会话处理方法、装置、终端及存储介质 | |
WO2020048392A1 (zh) | 应用程序的病毒检测方法、装置、计算机设备及存储介质 | |
CN111010523B (zh) | 一种视频录制方法及电子设备 | |
CN109495616B (zh) | 一种拍照方法及终端设备 | |
WO2014206055A1 (en) | A method and system for generating a user interface | |
CN109857297B (zh) | 信息处理方法及终端设备 | |
CN108335258B (zh) | 一种移动终端的图像处理方法和装置 | |
CN108491130A (zh) | 一种应用程序切换方法及移动终端 | |
JP2016511875A (ja) | 画像サムネイルの生成方法、装置、端末、プログラム、及び記録媒体 | |
CN111010511B (zh) | 全景分身图像拍摄方法及电子设备 | |
CN110604579A (zh) | 一种数据采集方法、装置、终端及存储介质 | |
CN109495638B (zh) | 一种信息显示方法及终端 | |
CN108984143B (zh) | 一种显示控制方法及终端设备 | |
CN112052897A (zh) | 多媒体数据拍摄方法、装置、终端、服务器及存储介质 | |
CN105635553B (zh) | 一种图像拍摄方法和装置 | |
CN110413363B (zh) | 一种截图方法及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |