CN111881913A - 图像识别方法及装置、存储介质和处理器 - Google Patents

图像识别方法及装置、存储介质和处理器 Download PDF

Info

Publication number
CN111881913A
CN111881913A CN201910606437.2A CN201910606437A CN111881913A CN 111881913 A CN111881913 A CN 111881913A CN 201910606437 A CN201910606437 A CN 201910606437A CN 111881913 A CN111881913 A CN 111881913A
Authority
CN
China
Prior art keywords
image
determining
target
pixel point
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910606437.2A
Other languages
English (en)
Inventor
刘根
何炳塬
解春兰
孔甜
屈奇勋
沈凌浩
贡卓琳
张帆
郑汉城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Icarbonx Intelligent Digital Life Health Management Co ltd
Shenzhen Digital Life Institute
Original Assignee
Shenzhen Icarbonx Intelligent Digital Life Health Management Co ltd
Shenzhen Digital Life Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Icarbonx Intelligent Digital Life Health Management Co ltd, Shenzhen Digital Life Institute filed Critical Shenzhen Icarbonx Intelligent Digital Life Health Management Co ltd
Priority to CN201910606437.2A priority Critical patent/CN111881913A/zh
Priority to PCT/CN2020/100247 priority patent/WO2021004402A1/zh
Publication of CN111881913A publication Critical patent/CN111881913A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/136Segmentation; Edge detection involving thresholding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像识别方法及装置、存储介质和处理器。其中,该图像识别方法包括:获取待识别的目标图像;获取所述目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;确定所述目标区域中被选定的像素点坐标;基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值。本申请解决了当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。

Description

图像识别方法及装置、存储介质和处理器
技术领域
本申请涉及图像识别领域,具体而言,涉及一种图像识别方法及装置、存储介质和处理器。
背景技术
图像识别技术是人工智能的重要领域,它是指对图像进行对象识别,以识别各种不同模式的目标和对象的技术。常见识别对象大致可分为自然场景对象和特定场景对象,对于自然场景图像而言,则利用卷积网络训练合适的模型,而对于特定场景对象而言,则需进行一定的网络模型和算法的二次开发。对于图片中数据的识别,现有的是采用光学字符识别(Optical Character Recognition,简称为OCR)识别技术对图片的数据进行识别,但OCR识别技术只能识别图像中所显示的数字,对于点、连续或间断曲线所代表的数值无法识别。
血糖监测硬件设备较多,但是血糖数据的导出需等到监测周期(一般为14天左右)结束后,需通过数据线连接电脑,导出血糖数据表格,无法实现用户实时了解个人血糖数据的变化,更无法监控日常生活中吃、动、睡对自己血糖数据的影响。
由此可见,目前基于图像识别的生理监测参数(如指尖血血糖仪读数)的记录方法及系统是基于光学字符识别技术,只能识别出生理参数数值而不能通过生理曲线自动识别为数值进行后续应用。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种图像识别方法及装置、存储介质和处理器,以至少解决当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。
根据本申请实施例的一个方面,提供了一种图像识别方法,包括:获取待识别的目标图像;获取目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;确定目标区域中被选定的像素点坐标;基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标所对应的参数取值。
可选地,基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标所对应的参数取值之前,方法还包括:从目标区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与所述目标区域的标准色带所对应颜色通道相同的颜色通道;对指定颜色通道的图像进行图像二值化处理,二值化处理为选择指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对目标区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定至少两个参考点的实际取值以及像素点坐标之间的对应关系,并基于所述对应关系建立指定类型参数的取值与像素点坐标的线性关系,并将线性关系作为关联关系。
可选地,确定目标区域中被选定的像素点坐标,包括:对目标区域中的图像进行灰度化处理,得到灰度图像;对灰度图像中的各个像素点进行聚类处理,得到多个簇;从所述多个簇中选择指定簇,并从指定簇中的所有像素点中确定被选定的像素点坐标。
可选地,从多个簇中选择指定簇,并从指定簇中的所有像素点中确定被选定的像素点坐标具体为:从多个簇中选择像素点数量最少的簇,并从像素点数量最少的簇中确定被选定的像素点坐标。
可选地,目标区域中的图像包括:坐标系中的曲线图像或坐标系中离散点图像,该曲线图像中的曲线或离散点图像中的离散点用于反映指定类型参数在不同时刻的取值。
可选地,方法还包括:确定像素点坐标在曲线图像或所述离散点图像中对应的目标记录时间;基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标所对应的参数取值,包括:基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值。
可选地,目标记录时间通过以下方式确定:识别曲线图像中的字符信息,从字符信息中提取指定类型参数的时间信息;对时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;从所述多个时间点中确定被选定的像素点坐标所属的目标记录时间。
可选地,获取所述目标图像中的目标区域,包括:对目标图像进行语义分割,得到所述目标图像的掩码图像和前景图像;从前景图像中确定感兴趣区域,并将感兴趣区域作为目标区域。
可选地,在目标图像为第一类型的情况下,采用高效神经网络模型对目标图像进行语义分割,其中,所述高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,所述三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;在所述目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对所述目标图像进行语义分割,其中,对分割网络模型进行调整包括:双边分割网络模型包括主干网络和辅助网络,所述主干网络由两层构成,每层主干网络分别包括卷积层、批归一化层和非线性激活函数,降低主干网络输出通道特征图数;所述辅助网络模型框架采用轻量级模型,降低主干网络输出通道特征图数,所述轻量级模型包括以下之一:Xception39、SqueezeNet、Xception、MobileNet、ShuffleNet,其中,第一类型所对应第一数据集的数量小于第二类型所对应第二数据集中的图像数量。
可选地,从前景图像中确定感兴趣区域,包括:确定前景图像中的特征区域,以及目标几何区域的角点坐标,其中,特征区域为前景图像中包含指定类型参数信息的区域;基于角点坐标计算投影变换矩阵;对特征区域中的像素点进行投影变换,得到感兴趣区域。
可选地,获取待识别的目标图像之前,所述方法还包括:确定待识别的图像是否为目标图像;在待识别的图像为目标图像时,确定对所述目标图像进行语义分割。需要说明的是,目标图像即是具有目标区域的图像,目标区域中的图像用于反映指定类型参数信息,例如,本申请的一个实施例是用于识别雅培连续血糖仪图像的方法,那么雅培连续血糖仪的含有反映血糖连续变化的图像即为目标图像;当然,如果是用于识别其他曲线图像或离散点图像的数值的实施场景,那么含有用于反映相应的数值的曲线图像或离散点图像即为目标图像。
可选地,上述方法还包括:将感兴趣区域均分成预设数量个不重叠滑块;确定所述预设数量个不重叠滑块的特征值,得到所述预设数量个特征值;将所述预设数量个特征值组合成特征向量;将所述特征向量输入至支持向量机分类器进行分析,得到所述感兴趣区域的类型。
可选地,指定类型参数信息中包含有用于反映血糖数据随时间变化的趋势的曲线信息,或用于反映血糖数据随时间变化的趋势的坐标系中离散点的取值信息。
可选地,上述方法还包括:展示所述被选定的像素点坐标所对应的参数取值。
可选地,确定所述目标区域中被选定的像素点坐标,包括:接收用户针对目标图像的指令;依据所述指令确定被选定的像素点坐标。
可选地,所述指令基于以下之一信息确定:接收所述用户在所述目标图像所在人机交互界面的触摸位置信息;或接收所述用户输入的查询信息。
可选地,当所述指令为接收所述用户在所述目标图像所在人机交互界面的触摸点位置信息时,所述方法还包括:基于所述触摸点位置确定被选定的像素点坐标之前,判断所述触摸点位置是否位于所述目标区域;在判断结果指示所述触摸点位置位于所述目标区域时,触发确定所述被选定的像素点坐标。
根据本申请实施例的又一方面,提供了一种数据展示方法,包括:展示获取待识别的目标图像;展示所述目标图像中的感兴趣区域,其中,该感兴趣区域中的图像用于反映指定类型参数随时间变化的变化信息;展示所述感兴趣区域中被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;展示所述被选定的像素点坐标在所述目标记录时间所对应的参数取值,其中,参数取值是基于指定类型参数的取值与像素点坐标的关联关系确定的。
可选地,关联关系通过以下方式确定:从所述感兴趣区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与所述感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对所述指定颜色通道的图像进行图像二值化处理,得到二值化图像;从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对所述感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
可选地,根据本申请实施例的另一方面,提供了一种图像识别方法,包括:检测用户在目标图像中的触摸点位置;基于所述触摸点位置确定被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值;输出所述参数取值。
可选地,基于触摸点位置确定被选定的像素点坐标之前,方法还包括:判断触摸点位置是否位于目标图像的感兴趣区域,其中,该感兴趣区域中的图像用于反映指定类型参数随时间变化的变化信息;在判断结果指示所述触摸点位置位于感兴趣区域时,触发确定被选定的像素点坐标。
可选地,基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值之前,所述方法还包括:从所述感兴趣区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对所述指定颜色通道的图像进行图像二值化处理,得到二值化图像;从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对所述感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到所述标准色带的至少两个参考点在图像中的像素点坐标;确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
根据本申请实施例的又一方面,提供了一种图像识别方法,包括:检测用户输入的查询信息;基于所述查询信息确定目标图像中被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值;输出所述参数取值。
可选地,基于所述触摸点位置确定目标图像中被选定的像素点坐标之前,所述方法还包括:判断所述触摸点位置是否位于所述目标图像的感兴趣区域,其中,该感兴趣区域中的图像用于反映指定类型参数随时间变化的变化信息;在判断结果指示所述触摸点位置位于所述感兴趣区域时,触发确定所述被选定的像素点坐标。
可选地,基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值之前,所述方法还包括:从所述感兴趣区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对所述指定颜色通道的图像进行图像二值化处理,所述二值化处理为选择所述指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对所述感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
根据本申请实施例的再一方面,提供了一种图像识别装置,包括:第一获取模块,用于获取待识别的目标图像;第二获取模块,用于获取所述目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;第一确定模块,用于确定所述目标区域中被选定的像素点坐标;第二确定模块,用于基于所述指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值。
可选地,所述装置还包括:分离模块,用于从所述目标区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述目标区域的标准色带所对应颜色通道相同的颜色通道;处理模块,用于对所述指定颜色通道的图像进行图像二值化处理,所述二值化处理为选择所述指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;选择模块,用于从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对所述目标区域进行图像分割;拟合模块,用于对分割后得到的二值化图像进行参考点像素识别,得到所述标准色带的至少两个参考点在图像中的像素点坐标;建立模块,用于确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
可选地,所述第一确定模块,包括:灰度处理单元,用于对所述目标区域中的图像进行灰度化处理,得到灰度图像;聚类单元,用于对所述灰度图像中的各个像素点进行聚类处理,得到多个簇;选择单元,用于从所述多个簇中选择指定簇,并从所述指定簇中的所有像素点中确定被选定的像素点坐标。
可选地,所述选择单元,用于从所述多个簇中选择像素点数量最少的簇,并从所述像素点数量最少的簇中确定被选定的像素点坐标。
可选地,所述目标区域中的图像包括:坐标系中的曲线图像或坐标系中离散点图像,该曲线图像中的曲线或所述离散点图像中的离散点,用于反映指定类型参数在不同时刻的取值。
可选地,所述第一确定模块,还用于确定所述像素点坐标在所述曲线图像中对应的目标记录时间;所述第二确定模块,还用于基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值。
可选地,所述第一确定模块还包括:第一识别单元,用于识别曲线图像中的字符信息,从所述字符信息中提取所述指定类型参数的时间信息;第一划分单元,用于对所述时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;第一确定单元,用于从所述多个时间点中确定所述被选定的像素点坐标所属的目标记录时间。
可选地,第二获取模块,包括:分割单元,用于对目标图像进行语义分割,得到所述目标图像的掩码图像和前景图像;确定单元,用于从所述前景图像中确定所述目标区域。
可选地,分割单元,用于在目标图像为第一类型的情况下,采用高效神经网络模型对目标图像进行语义分割,其中,高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,所述三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;所述分割单元,还用于在所述目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对所述目标图像进行语义分割,其中,对所述分割网络模型进行调整包括:双边分割网络模型包括主干网络和辅助网络,所述主干网络由两层构成,每层主干网络分别包括卷积层、批归一化层和非线性激活函数,降低主干网络输出通道特征图数;所述辅助网络模型框架采用轻量级模型,降低主干网络输出通道特征图数,所述轻量级模型包括以下之一:Xception39、SqueezeNet、Xception、MobileNet、ShuffleNet;其中,所述第一类型所对应第一数据集的数量小于第二类型所对应第二数据集中的图像数量。
可选地,装置还包括:第三确定模块,用于确定待识别的图像是否为目标图像;以及在所述待识别的图像为目标图像时,确定对所述目标图像进行语义分割。
可选地,第三确定模块,还用于通过以下方式确定所述感兴趣区域的类型:将感兴趣区域均分成预设数量个不重叠滑块;确定所述预设数量个不重叠滑块的特征值,得到所述预设数量个特征值;将所述预设数量个特征值组合成特征向量;将所述特征向量输入至支持向量机分类器进行分析,得到所述感兴趣区域的类型。
可选地,指定类型参数信息中包含有用于反映血糖数据随时间变化的趋势的曲线信息,或用于反映血糖数据随时间变化的趋势的坐标系中离散点的取值信息。
根据本申请实施例的又一方面,提供了一种非易失性存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行以上所述的图像识别方法。
根据本申请实施例的又一方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行以上所述的图像识别方法。
在本申请实施例中,采用依据目标图像中像素点坐标和指定类型参数的取值之间的关联关系确定被选定的像素点坐标所对应的参数取值的方式,由于采用目标图像中像素点坐标和指定类型参数的取值之间的关联关系识别图像中任意像素点坐标对应的参数取值,因此,实现了对图像中非字符信息所表示的参数取值的识别,达到了将图像中的像素点自动识别为相应的参数取值的目的,进而解决了当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请一个实施例中的一种可选的血糖数据的识别方法的流程图;
图2是本申请另一个实施例中的一种图像识别方法的流程图;
图3为本申请实施例的一种可选的ROI区域的提取示例图;
图4a-4d为本申请实施例的一种可选的血糖曲线检测与分割过程的示例图;
图5为本申请实施例的一种可选的BiSeNet-Xception39精简版模型结构示意图;
图6为本申请实施例的一种可选的8小时图像R方误差分布统计结果;
图7为本申请实施例的一种可选的8小时图像误差值分布图;
图8为本申请实施例的一种可选的24小时图像R方误差分布统计结果示意图;
图9为本申请实施例的一种可选的24小时图像误差值分布图;
图10是本申请实施例的一种图像识别装置的结构框图;
图11是本申请实施例的另一种可选的图像识别装置的结构框图;
图12为本申请实施例的一种数据展示方法的流程图;
图13为本申请实施例的另一种图像识别方法的流程图;
图14为本申请实施例的另一种图像识别方法的流程图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
相关技术中,在对图像中的数据进行识别时,往往仅能识别出字符信息对应的参数取值,而不能识别出非字符信息对应的参数取值,以雅培连续血糖设备为例:血糖设备中瞬感扫描仪能获取用于反映8小时范围内的变化趋势的曲线,无法准确衡量8小时范围内的精确血糖值。瞬时扫描时,只能获取扫描仪扫描时间点时的血糖值,或者通过现有文字识别技术可以识别扫描仪上存在的固定时间点以及扫描当前时刻的血糖值,但是,上述识别方案无法让血糖测试者每时每刻掌握连续血糖值,更无法为后续系统血糖管理与实时推送干预方案提供依据。也就是说,现有的OCR技术无法做到识别血糖曲线中任意一点的血糖值。本申请实施例中利用像素点坐标和实际参数取值的关联关系,实现了对曲线中任意一点的参数取值的识别,简化从图像转化为定量数值的过程,并以一定格式存储于数据库中,为后续血糖分析及干预方案生成提供支持,同时,也可以方便血糖数据的导出、存储,实现手机记录管理血糖,提高使用体验。在本申请的一些实施例中,以血糖图像中血糖数据的识别为例说明如何在像素级别识别相应的参数取值,如图1所示,该流程包括以下步骤:
步骤S102,接收用户上传的图像。
步骤S104,识别用户上传的图像是否为所需处理的血糖仪图像。为保证血糖图像识别算法数据的完整性及规范性,在调用算法模型前利用深度网络模型进行图像分类,如MobileNet,Xception,SqueezeNet等图像分类模型,其中,将利用分类模型输出的置信度确定是否当前图像是否为所需处理的图像,例如,将置信度阈值设置为0.85,以保证用户上传图像质量。
步骤S106,利用语义分割网络进行图像分割。具体地,分割整副图像中前景信息,即血糖仪图像中高亮屏幕部分。用户上传图像包含各种噪声,为保证算法返回结果的精确性,在图像预分割部分选用深度学习中语义分割模型,如BiSeNet,ICNet,BSPNet,ENET等一切语义分割模型。从数据复杂程度及实际应用速度要求考虑,选择具有实时分割特性的网络模型。
步骤S108,进行图像校正。根据语义分割结果进行四边形拟、角点检测并有序返回屏幕四个角点坐标信息。利用角点信息计算投影变换矩阵并进行图像投影变换。图像方向判断——根据图像中灰度、颜色、纹理等信息,进行图像旋转,返回血糖仪屏幕正方向图像(ROI,Region of Interesting,感兴趣区域)。
步骤S110,局部标准差及颜色特征提取——判断图像类型,其中图像类型包含N小时和24小时图像,其中,N小于24。
步骤S112,利用SVM分类器对图像进行分类,然后,利用标准色带检测,并进行血糖曲线的分割,其中,对于24小时的血糖图像利用OCR识别出其中的日期信息,对于8小时的血糖图像则利用OCR识别出血糖设备扫描的起始时间和终点时间。当然,识别图像中的具体数据的方案除了OCR之外,还可以采用数字图像处理(DIPDigital Image Processing)技术。
步骤S114,确定血糖值与图像像素之间的映射关系。
步骤S116,利用上述映射关系计算某一像素点的血糖值,并输出计算得到的血糖值。基于上述实施例,本申请实施例提供了一种图像识别方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图2是根据本申请的另一个实施例的图像识别方法的流程图,如图2所示,该方法包括如下步骤:
步骤S202,获取待识别的目标图像;
步骤S204,获取所述目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;
步骤S206,确定所述目标区域中被选定的像素点坐标;
步骤S208,基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值。
通过上述实施例提供的方案,由于采用目标图像中像素点坐标和指定类型参数的取值之间的关联关系识别图像中任意像素点坐标对应的参数取值,因此,实现了对图像中非字符信息所表示的参数取值的识别,达到了将图像中的像素点自动识别为相应的参数取值的目的,进而解决了当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。
对于上述关联关系,其表现方式有多种,例如,可以表现为映射关系,也可以表现为线性函数关系等,其中,对于前者,可以通过以下方式实现:在基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值之前,从所述目标区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述目标区域的标准色带所对应颜色通道相同的颜色通道;对所述指定颜色通道的图像进行图像二值化处理,二值化处理为选择指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;从预设阈值集合中选择所述二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对所述目标区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到所述标准色带的至少两个参考点在图像中的像素点坐标;确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
具体地,以血糖曲线中血糖数据的识别为例,上述关联关系表现为映射关系,此时,需要用到标准色带。该检测过程是有效建立血糖实际值与血糖图像像素坐标之间的关系的一种途径,其目的就是寻找血糖曲线上像素坐标与实际血糖值的对应线性关系。检测过程中,对血糖图像ROI区域进行颜色通道R,G,B分离,因标准色带呈现蓝色特征,故提取B通道进行图像处理,首先,对该通道图像进行灰度拉伸以及灰度值归一化处理,然后,对图像进行自适应阈值分割,同时,利用图像形态学处理完成分割图像的噪声处理,完成标准色带图像分割操作,最后,对上述过程中的二值图像进行横向直线拟合,拟合结果为标准色带上下线在图像中的像素坐标高度。常见血糖仪扫描仪(即血糖设备)中,标准色带的上下线血糖值分别可以为3.9和7.8。由实际标准色带上的已知实际血糖值以及其对应的像素坐标高度建立其线性关系:
sValue=3.9/(std_lower-std_upper)
rValue=5.85+0.5*sValue*(std_lower+std_upper)-sValue*line_rho
其中,sValue:图像像素与实际血糖值比例系数
rValue:图像处理返回的实际血糖值
line_rho:图像中血糖曲线像素高度
std_upper:标准色带上边缘像素高度
std_lower:标准色带下边缘像素高度
上述目标区域的确定方式有多种,例如,可以对像素点进行聚类的方式确定,也可以将感兴趣区域作为目标区域,对于前者,可以通过以下方式进行处理:对目标区域中的图像进行灰度化处理,得到灰度图像;对灰度图像中的各个像素点进行聚类处理,得到多个簇;从多个簇中选择指定簇,并从指定簇中的所有像素点中确定被选定的像素点坐标。
另外,本实施例中的目标图像可以是针对血糖仪数据生成的需要展示给客户的原始图像,例如,分析血液中血糖含量值与时间值的曲线图,其中该曲线图所处于由时间坐标轴与血糖含量坐标轴构成的坐标系之中,那么这个曲线图便是该血糖仪数据分析的原始待处理图像,即目标图像。
在本申请的一些实施例中,在从多个簇中选择指定簇,并从指定簇中的所有像素点中确定被选定的像素点坐标时,选择指定簇所依据的原则根据实际情况灵活确定,例如,从多个簇中选择像素点数量最少的簇,并从像素点数量最少的簇中确定被选定的像素点坐标。
具体地,在对上述目标区域进行检测时,可以表现为对图像中的曲线进行检测,以血糖曲线为例,为尽可能减少图像噪点的存在,对输入图像进行截取局部区域rect操作,参数设置如表1所示:
表1血糖曲线检测RECT参数详情
Figure BDA0002120869070000101
如图4a所示,图像中血糖曲线可以由黑色和红色(图中未区分颜色)共同连接而成,因此,对图像进行颜色通道分离并提取出R通道,此时,如图4b所示,图像灰度分布呈现黑色、灰色以及白色三种分布趋势,故设置聚类中心个数为3(如图4c所示),利用KMeans对图像进行图像灰度聚类,而血糖曲线在图像中所占区域最少,因此,提取分类结果中类别数量最少的类别作为血糖曲线的类别(如图4d所示),对该类别图像进行图像后处理操作完成血糖曲线分割与检测过程。
正如上面所述,可以依据感兴趣区域确定目标区域,具体地:对目标图像进行语义分割,得到目标图像的掩码图像和前景图像;从前景图像中确定感兴趣区域,并将感兴趣区域作为目标区域。
其中,可以通过以下方式从前景图像中确定感兴趣区域:确定前景图像中的特征区域,以及目标几何区域的角点坐标,其中,特征区域为前景图像中包含指定类型参数信息的区域;基于角点坐标计算投影变换矩阵;对特征区域中的像素点进行投影变换,得到感兴趣区域。其中,在进行投影变换过程中,还可以包括对图像的旋转处理,以保证能够正确识别感兴趣区域。
利用预分割掩码mask以及图像形态学处理进行四边形拟合,有序(逆时针)返回四边形角点坐标(左上,左下,右下,右上,包含但不局限于此顺序)。然后,由返回的角点坐标计算投影变换矩阵,对血糖图像的高亮区域进行投影变换得到ROI区域,其中,变换过程如图3所示。
在本申请的另一些可选的实施例中,上述目标区域中的图像包括:坐标系中的曲线图像,该曲线图像中的曲线用于反映指定类型参数在不同时刻的取值。
在对图像进行识别时,为方便用户查询具体参数值所对应的时刻,在确定像素点坐标时,还可以确定像素点坐标在曲线图像中对应的目标记录时间;此时,步骤S206在确定选择的像素点所对应的参数取值时,可以表现为以下处理过程:基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值。
在本申请的一些实施例中,目标记录时间可以通过以下方式确定:识别曲线图像中的字符信息,从字符信息中提取指定类型参数的时间信息;对时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;从多个时间点中确定被选定的像素点坐标所属的目标记录时间,例如,在T1和T2时刻之间的横向像素数为N,则T1和T2之间横向上第M个像素点对应的时刻为T1+[M*(T2-T1)/N]。其中,可以采用OCR技术识别上述字符信息,但不限于此。
对血糖图像中的时间信息进行字符识别,准确记录瞬感血糖时间,为后续形成连续血糖数据的管理提供有力保障。对于应用程序接口而言,庞大的数据输入势必会增加数据传输时间,同时,接口处理数据时长也会随之增加。因此,为提升字符识别速率,识别过程中对输入数据进行一定的数据前处理,通过实验测试,调整图像尺寸可直接影响识别速率和准确度,在具体实验测试中,固定输入图像大小为256*256(包括但不仅仅局限于该图像尺寸大小,可根据数据复杂程度适当调整)时,字符识别准确率和速率可取得相对较优结果。在固定输入图像大小为256*256后,截取局部区域RECT(RECT为矩形框缩写,其代表在图像中所截取的矩形区域)进行字符识别,8小时RECT区域参数设置为(235,10,20,225),24小时血糖图像RECT区域参数设置为(205,85,20,225),具体参数说明以8小时示例,235代表截取区域图像在大小为256*256输入图像中起始点的纵坐标,10为截取区域图像在大小为256*256输入图像中起始点的横坐标,20代表改截取区域的高度,225则代表截取区域的宽度。具体实例如表2所示:
表2截取区域RECT参数详情及示例
Figure BDA0002120869070000111
可选地,在目标图像为第一类型的情况下,采用高效神经网络模型对目标图像进行语义分割,其中,高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;在目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对目标图像进行语义分割,其中,对分割网络模型进行调整包括:所述双边分割网络模型包括主干网络和辅助网络,所述主干网络由两层构成,每层主干网络分别包括卷积层、批归一化层和非线性激活函数,降低主干网络输出通道特征图数;所述辅助网络模型框架采用轻量级模型,降低主干网络输出通道特征图数,所述轻量级模型包括以下之一:Xception39、SqueezeNet、Xception、MobileNet、ShuffleNet;其中,所述第一类型所对应第一数据集的数量小于第二类型所对应第二数据集中的图像数量。其中,上述第一类型和第二类型分别对应于第一数据集中的图像和第二数据集中的图像,第一数据集中的图像数量小于第二数据集中的数量。在本申请的一个实施方式中,可任选高效神经网络(即第一类型的情况下采用的分割模型)或对双边分割网络模型进行调整后的分割网络模型(即第二类型的情况下采用的分割模型)对目标图像进行语义分割,一个优选的实施方式中,采用双边分割网络模型进行调整后的分割网络模型对目标图像进行语义分割,用双边分割网络模型进行调整后的分割网络模型在处理大规模数据是具有处理速度快、以及在保留一定丰富度的空间信息的能够同时兼顾保护感受野的大小的优点。另外,上述主网络的作用是保留丰富的空间信息,而辅助网络的作用是保护感受野大小。
在本申请的一些实施例中,由于调整后的双边分割网络模型处理能力强,因此,其不仅可处理大规模数据,也可以支持小规模数据的处理。同样,在数据规模较小时,可以采用高效神经网络模型对图像进行处理,在数据规模较大时,也可以手动或自动切换至调整后的双边分割网络模型进行处理。
本申请的一个实施方式中,第一数据集和第二数据集中的图像数量是可以动态变化的,在进行目标图像的语义分割时,可根据第一数据集和第二数据集中的目标图像的数量的多少确定选择采用第一类型对应的模型进行语义分割或采用第二类型对应的模型进行语义分割。例如,在上午9-12点左右由于查询的用户比较多,可以采用第二类型对应的模型进行语义分割,在晚上00:00-08:00时段查询数据的用户比较少,可以采用第一类型对应的模型进行语义分割,在实际应用时:接收用户上传的目标图像;确定目标图像的上传时间;确定所述上传时间对应的时间段;依据该时间段确定对目标图像进行语义分割的分割网络模型,并依据确定的分割网络模型对目标图像进行语义分割。
其中,为避免运算资源的浪费,在对目标图像进行语义分割处理,得到目标图像的感兴趣区域之前,还可以确定目标图像的类型;在类型为预设类型时,确定对目标图像进行语义分割。在确定目标图像的类型时,可以表现为以下处理过程:将目标图像均分成预设数量个不重叠滑块;确定预设数量个不重叠滑块的特征值,得到预设数量个特征值;将预设数量个特征值组合成特征向量;将特征向量输入至支持向量机分类器进行分析,得到目标图像的类型。具体地,以血糖图像为例,比如雅培连续血糖设备的血糖图像额类型包括8小时以及24小时两种类型。首先提取图像局部方差特征以及局部颜色特征,具体而言,将大小为256*256的输入图像均分成256个16*16的不重叠滑块,计算各个相对独立滑块部分方差和图像蓝色通道像素值的平均值,将方差及蓝色通道平均像素值组合成改独立滑块的特征值,然后,将256个滑块特征组合成维度为512的特征向量,最后,结合SVM(support vectormachine支持向量机)分类器实现图像二分类,完成血糖图像分类。
以血糖图像为例,在对其中的图像数据进行识别时,对确定需要识别的图像进行图像分割,以便准确提取屏幕高亮部分。首先,利用ENET网络完成对用户上传图像的预分割,返回前景区域掩码mask。该网络具有参数少,模型小,精确度高等特点。预分割网络ENET的基础实现单元在于:(1)初始化模块,(2)基于ResNet思想设计的bottleneck模块,每个模块包含三个卷积层,其中,第一个卷积层实现降维,第二个卷积层实现空洞卷积,全卷积以及非对称卷积等,第三个卷积实现升维功能,每个卷积核均包含Batch Normalization和PReLU。实验中,总数据集样本644张,其中分成训练数据:515张,验证集:65张,测试集:64张,所有采集图像覆盖多角度情况,所有照片光照分布均匀。网络训练中,初始学习率为0.005,每30个迭代过程学习率衰减一次,总迭代次数epoch为300,但不局限于300,具体所有网络参数可根据数据实际情况调整。在现有小数据集上,所训练的血糖图像分割模型效果可观,具体训练及测试表现如表2所示。其中,测试环境为:内存16G,CPU型号Intel(R)Core(TM)i5-7500 CPU@3.40GHz。模型表现如下表所示,其中,IOU(Intersection overUnion)由真实值GT、测试PR计算得来,最终结果是GT、PR的交集比GT、PR的并集,是目标检测与分割中通用的衡量指标。ENET语义分割网络模型的表现如表3所示。
表3 ENET语义分割网络模型表现(小数据集)
Figure BDA0002120869070000131
随着用户数据的不断增加,在进行分割网络模型迭代过程中发现,该语义分割网络ENET不再适用于大数据集。随着数据集的不断增大,数据复杂程度越高,语义分割网络ENET在追求速度过程中,无法高效合理的平衡图像中空间信息和感受野,因此,该网络在大数据集上的模型表现不符合进一步的应用需求。在新分割数据集中,样本总数为4912张,其中分成训练集4104张,验证集608张,测试集200张。网络训练中,初始学习率为0.01,每30个迭代过程学习率衰减一次,总迭代次数epoch为300,所有网络参数包含但不局限于上述数值,具体数据可根据数据实际情况调整。在同样的测试环境下,模型表现如表3所示:
表4 ENET语义分割网络模型表现(大数据集)
Figure BDA0002120869070000132
因此,为满足大训练数据集上网络模型的分割表现,提出BiSeNet精简版模型。原分割模型BiSeNet在公共数据集(数据集Cityscapes,数据集CamVid,数据集COCO-Stuff等)上的速度和精度表现都呈现一定的优越性。对于本申请实施例中训练数据而言,样本复杂程度相对公共数据集中数据干净、复杂程度低,因此,对语义分割BiSeNet网络进行适当调整与精简,调整思路主要分为:(1)空间信息处理层Spatial Path,(2)感受野处理层Context Path,(3)各网络层间输入-输出通道(特征图)数量,(4)压缩输入图像尺寸。具体精简修改内容为:(1)主干网络Spatial Path部分网络层减少,由原始3层网络(其中,每层网络包括常见的卷积层conv、批归一化层Batch Normalization、非线性激活函数ReLU),减少为2层网络,如图2中的Layer1和Layer2所示,同时,该部分输出通道由128个特征图减少为64个特征图,大量减小网络参数,有效压缩模型大小,在保证分割精度的情况下大大提高分割速率;(2)辅助网络Context Path部分模型框架更改,由原始的ResNet18,ResNet101替换为更轻便的Xception39模型,在有效保证感受野范围的情况下,压缩模型大小;(3)减小各个网络层输出特征图Feature Map的个数;(4)压缩模型输入图像大小,由原始的640*640压缩至320*320,经模型训练测试,直接压缩输入图像进行图像分割的方式能满足一定的分割精度,同时,运算代价明显减少。修改精简后的网络结构如图5所示。
实验结果表明,在上述样本总数为4912张的数据集下训练的分割模型取得了更优的表现,符合实际应用需求,在测试环境为内存16G,CPU型号Intel(R)Core(TM)i5-7500CPU@3.40GHz的硬件条件下,模型表现如表4所示:
表4 BiSeNet-Xception39精简版分割模型表现
Figure BDA0002120869070000141
可选地,上述指定类型参数信息中包含有用于反映血糖数据变化趋势的曲线信息或坐标系中离散点的取值信息,其中,每个离散点对应每个采样时刻的血糖值。
在确定上述参数取值后,还可以展示所述被选定的像素点坐标在所述目标记录时间所对应的参数取值。
在本申请的一些实施例中,可以通过以下方式确定目标区域中被选定的像素点坐标:检测用户针对目标图像的指令;依据指令确定被选定的像素点坐标。
可选地,指令基于以下之一信息确定:用户在目标图像所在人机交互界面的触摸位置;用户输入的查询信息。对于前者,在基于触摸点位置确定被选定的像素点坐标之前,还可以执行以下处理过程:判断触摸点位置是否位于目标区域;在判断结果指示触摸点位置位于目标区域时,触发确定被选定的像素点坐标。
基于上述图像识别方法,对8小时类型血糖图像和24小时类型血糖图像各100张进行数据分析及结果统计,其中,对于8小时图像而言,98张血糖图像能有效识别(本方法识别的血糖值的图像趋势与扫描仪识别的血糖值的图像趋势一致),其误差范围在正负0.4左右,符合实际应用场景。对于24小时图像而言,全部100张血糖图像均能被有效识别(本方法识别的血糖值的图像趋势与扫描仪识别的血糖值的图像趋势一致),起误差范围在-0.6到0.4左右,满足血糖值缺失补录的需求。同时,基于R方(R-Square)、均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)量化指标度量该方法误差情况,具体量化指标如表5所示,对于8小时图像,误差分布统计结果如图5所示,其误差值分布符合正态分布,具体分布情况如图6所示,且误差值集中分布在正负0.4之内,对于24小时图像,误差分布统计结果如图7所示,其误差值分布也符合正态分布,具体分布情况如图8所示。
表5量化指标结果
Figure BDA0002120869070000151
本申请实施例还提供一种图像识别装置,该装置用于实现图2所示方法,如同10所示,该装置包括:
第一获取模块10,用于获取待识别的目标图像;
第二获取模块12,用于获取目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;
第一确定模块14,用于确定目标区域中被选定的像素点坐标;
第二确定模块16,用于基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标所对应的参数取值。
利用上述各个模块实现的功能,同样可以实现对图像中非字符信息所表示的参数取值的识别,达到了将图像中的像素点自动识别为相应的参数取值的目的,进而解决了当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。
在本申请的一些实施例中,如图11所示,该装置还包括:分离模块11,用于从目标区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与目标区域的标准色带所对应颜色通道相同的颜色通道;处理模块13,用于对指定颜色通道的图像进行图像二值化处理,得到二值化图像;选择模块15,用于从预设阈值集合中选择二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对目标区域进行图像分割;拟合模块17,用于对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;建立模块19,用于确定至少两个参考点的实际取值以及像素点坐标之间的对应关系,并基于对应关系建立指定类型参数的取值与像素点坐标的线性关系,并将线性关系作为关联关系。
如图11所示,该第一确定模块14,包括:灰度处理单元140,用于对目标区域中的图像进行灰度化处理,得到灰度图像;聚类单元142,用于对灰度图像中的各个像素点进行聚类处理,得到多个簇;选择单元144,用于从多个簇中选择指定簇,并从指定簇中的所有像素点中确定被选定的像素点坐标。
其中,选择单元144,还用于从多个簇中选择像素点数量最少的簇,并从像素点数量最少的簇中确定被选定的像素点坐标。
可选地,目标区域中的图像包括:坐标系中的曲线图像,该曲线图像中的曲线用于反映指定类型参数在不同时刻的取值。
在本申请的一些实施例中,第一确定模块14,还用于确定像素点坐标在曲线图像中对应的目标记录时间;第二确定模块16,还用于基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值。
上述目标记录时间通过以下方式确定:识别曲线图像中的字符信息,从字符信息中提取指定类型参数的时间信息;对时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;从多个时间点中确定被选定的像素点坐标所属的目标记录时间。
可选地,如图11所示,第二获取模块12包括:分割单元120,用于对目标图像进行语义分割,得到目标图像的掩码图像和前景图像;确定单元122,用于从前景图像中确定目标区域。其中,分割单元120,用于在目标图像为第一类型的情况下,采用高效神经网络模型对目标图像进行语义分割,其中,高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;分割单元120,还用于在目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对目标图像进行语义分割,其中,对分割网络模型进行调整包括以下至少之一:减少分割网络模型中的空间信息处理层的数量;减少各个网络层输出的特征图的数量;对双边分割网络模型的输入图像进行压缩处理;简化感受野处理层。
分割单元120,还用于通过以下方式简化感受野处理层:将感受野处理层中的残差神经网络(RESNET)模块替换为通道分离式卷积(Xception39)模块。
可选地,如图11所示,上述装置还可以包括:第三确定模块21,用于确定目标图像的类型;以及在类型为预设类型时,确定对目标图像进行语义分割。该第三确定模块21,还用于通过以下方式确定目标图像的类型:将目标图像均分成预设数量个不重叠滑块;确定预设数量个不重叠滑块的特征值,得到预设数量个特征值;将预设数量个特征值组合成特征向量;将特征向量输入至支持向量机分类器进行分析,得到目标图像的类型。
可选地,目标区域中包含有血糖数据变化趋势的曲线图像。
本申请实施例还提供了一种数据展示方法,如图12所示,该方法包括:
步骤S1202,展示获取待识别的目标图像;
步骤S1204,展示目标图像中的感兴趣区域,其中,该感兴趣区域中的图像用于反映指定类型参数随时间变化的变化信息;
步骤S1206,展示感兴趣区域中被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;
步骤S1208,展示被选定的像素点坐标在目标记录时间所对应的参数取值,其中,参数取值是基于指定类型参数的取值与像素点坐标的关联关系确定的。
需要说明的是,上述步骤S1202至S1208的执行主体包括但不限于移动终端。
在本申请的一些实施例中,上述关联关系通过以下方式确定:从感兴趣区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对指定颜色通道的图像进行图像二值化处理,得到二值化图像;从预设阈值集合中选择二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定至少两个参考点的实际取值以及像素点坐标之间的对应关系,并基于对应关系建立指定类型参数的取值与像素点坐标的线性关系,并将线性关系作为关联关系。
需要说明的时,图12所示实施例的优选实施方式可以参见图2至9中所示实施例的相关描述,此处不再赘述。
本申请实施例还提供了一种图像识别方法,该方法可以基于用户的触摸操作确定被选中的像素点,从而确定该像素点对应的参数取值,具体地,如图13所示,该方法包括:
步骤S1302,检测用户在目标图像中的触摸点位置;
步骤S1304,基于触摸点位置确定被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;
步骤S1306,基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值;
步骤S1308,输出参数取值。其中,输出参数取值包括但不限于向用户展示参数取值,或者向外接设备发送参数取值,但不限于上述表现形式。
在本申请的一些可选实施例中,在基于触摸点位置确定被选定的像素点坐标之前,为了防止无效触摸操作的干扰,还可以判断触摸点位置是否位于目标图像的感兴趣区域,其中,该感兴趣区域中的图像用于反映指定类型参数随时间变化的变化信息;在判断结果指示触摸点位置位于感兴趣区域时,触发确定被选定的像素点坐标。
在本申请的另一些实施例中,在基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值之前,还可以执行以下处理过程:从感兴趣区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对指定颜色通道的图像进行图像二值化处理,得到二值化图像;从预设阈值集合中选择二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定至少两个参考点的实际取值以及像素点坐标之间的对应关系,并基于对应关系建立指定类型参数的取值与像素点坐标的线性关系,并将线性关系作为关联关系。
需要说明的时,图13所示实施例的优选实施方式可以参见图2至9中所示实施例的相关描述,此处不再赘述。
本申请实施例还提供了一种图像识别方法,该方法可以基于用户的输入确定被选中的像素点,从而确定该像素点对应的参数取值,如图14所示,该方法包括:
步骤S1402,检测用户输入的查询信息;其中,该查询信息可以为通过人机交互界面输入的,该人机交互界面中包括有用于输入查询信息的文字输入框。
步骤S1404,基于查询信息确定目标图像中被选定的像素点坐标,以及该像素点坐标对应的目标记录时间;
步骤S1406,基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值;
步骤S1408,输出参数取值。
在本申请的一些实施例中,在基于指定类型参数的取值与像素点坐标的关联关系确定被选定的像素点坐标在目标记录时间所对应的参数取值之前,还可以执行以下处理过程:从感兴趣区域中分离出指定颜色通道,其中,指定颜色通道为R、G、B颜色通道中与感兴趣区域的标准色带所对应颜色通道相同的颜色通道;对指定颜色通道的图像进行图像二值化处理,得到二值化图像;从预设阈值集合中选择二值化图像中每个像素点所在区域所对应的阈值,并利用选择的阈值对感兴趣区域进行图像分割;对分割后得到的二值化图像进行参考点像素识别,得到标准色带的至少两个参考点在图像中的像素点坐标;确定至少两个参考点的实际取值以及像素点坐标之间的对应关系,并基于对应关系建立指定类型参数的取值与像素点坐标的线性关系,并将线性关系作为关联关系。
需要说明的时,图14所示实施例的优选实施方式可以参见图2至9中所示实施例的相关描述,此处不再赘述。
本申请实施例还提供了一种非易失性存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行以上的图像识别方法。
本申请实施例还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行以上的图像识别方法。
在本申请实施例中,采用依据目标图像中像素点坐标和指定类型参数的取值之间的关联关系确定被选定的像素点坐标所对应的参数取值的方式,由于采用目标图像中像素点坐标和指定类型参数的取值之间的关联关系识别图像中任意像素点坐标对应的参数取值,因此,实现了对图像中非字符信息所表示的参数取值的识别,达到了将图像中的像素点自动识别为相应的参数取值的目的,进而解决了当前的图像识别方式只能识别出图像中的字符格式的数值,不能将曲线或离散点自动识别为数值的技术问题。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (29)

1.一种图像识别方法,其特征在于,包括:
获取待识别的目标图像;
获取所述目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;
确定所述目标区域中被选定的像素点坐标;
基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值。
2.根据权利要求1所述的方法,其特征在于,基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值之前,所述方法还包括
从所述目标区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述目标区域的标准色带所对应颜色通道相同的颜色通道;
对所述指定颜色通道的图像进行图像二值化处理,所述二值化处理为选择所述指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;
对得到的二值化图像进行参考点像素识别,得到所述标准色带的至少两个参考点在图像中的像素点坐标高度;
确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
3.根据权利要求1所述的方法,其特征在于,确定所述目标区域中被选定的像素点坐标,包括:
对所述目标区域中的图像进行灰度化处理,得到灰度图像;
对所述灰度图像中的各个像素点进行聚类处理,得到多个簇;
从所述多个簇中选择指定簇,并从所述指定簇中的所有像素点中确定被选定的像素点坐标。
4.根据权利要求3所述的方法,其特征在于,从所述多个簇中选择指定簇,并从所述指定簇中的所有像素点中确定被选定的像素点坐标具体为:
从所述多个簇中选择像素点数量最少的簇,并从所述像素点数量最少的簇中确定被选定的像素点坐标。
5.根据权利要求1所述的方法,其特征在于,
所述目标区域中的图像包括:坐标系中的曲线图像或坐标系中离散点图像,所述曲线图像中的曲线或所述离散点图像中的离散点用于反映指定类型参数在不同时刻的取值;
所述方法还包括:确定所述像素点坐标在所述曲线图像或所述离散点图像中对应的目标记录时间;
所述基于指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值,包括:基于所述指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值。
6.根据权利要求5所述的方法,其特征在于,所述目标记录时间通过以下方式确定:
识别所述曲线图像或所述离散点图像中的字符信息,从所述字符信息中提取所述指定类型参数的时间信息;
对所述时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;
从所述多个时间点中确定所述被选定的像素点坐标所属的目标记录时间。
7.根据权利要求1所述的方法,其特征在于,所述获取所述目标图像中的目标区域,包括:
对所述目标图像进行语义分割,得到所述目标图像的掩码图像和前景图像;
从所述前景图像中确定感兴趣区域,并将所述感兴趣区域作为所述目标区域。
8.根据权利要求7所述的方法,其特征在于,
在所述目标图像为第一类型的情况下,采用高效神经网络模型对所述目标图像进行语义分割,其中,所述高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,所述三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;
在所述目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对所述目标图像进行语义分割,其中,所述对双边分割网络模型进行调整包括:
所述双边分割网络模型包括主干网络和辅助网络,所述主干网络由两层构成,每层主干网络分别包括卷积层、批归一化层和非线性激活函数,降低主干网络输出通道特征图数;所述辅助网络模型框架采用轻量级模型,降低主干网络输出通道特征图数,所述轻量级模型包括以下之一:Xception39、SqueezeNet、Xception、MobileNet、ShuffleNet;
其中,所述第一类型所对应第一数据集的数量小于第二类型所对应第二数据集中的图像数量。
9.根据权利要求7所述的方法,其特征在于,所述从所述前景图像中确定感兴趣区域,包括:
确定所述前景图像中的特征区域,以及目标几何区域的角点坐标,其中,所述特征区域为所述前景图像中包含所述指定类型参数信息的区域;
基于所述角点坐标计算投影变换矩阵;
对所述特征区域中的像素点进行投影变换,得到所述感兴趣区域。
10.根据权利要求7所述的方法,其特征在于,所述获取待识别的目标图像之前,所述方法还包括:
确定待识别的图像是否为目标图像;
在所述待识别的图像为目标图像时,确定对所述目标图像进行语义分割。
11.根据权利要求9所述的方法,其特征在于,所述方法还包括:
将所述感兴趣区域均分成预设数量个不重叠滑块;
确定所述预设数量个不重叠滑块的特征值,得到所述预设数量个特征值;将所述预设数量个特征值组合成特征向量;将所述特征向量输入至支持向量机分类器进行分析,得到所述感兴趣区域的类型。
12.根据权利要求1所述的方法,其特征在于,所述指定类型参数信息中包含有用于反映血糖数据随时间变化的趋势的曲线信息,或用于反映血糖数据随时间变化的趋势的坐标系中离散点的取值信息。
13.根据权利要求1所述的方法,其特征在于,所述方法还包括:
展示所述被选定的像素点坐标所对应的参数取值。
14.根据权利要求1所述的方法,其特征在于,确定所述目标区域中被选定的像素点坐标,包括:
接收用户针对目标图像的指令;依据所述指令确定被选定的像素点坐标。
15.根据权利要求14所述的方法,其特征在于,所述指令基于以下之一信息确定:接收所述用户在所述目标图像所在人机交互界面的触摸点位置信息;或接收所述用户输入的查询信息。
16.根据权利要求15所述的方法,其特征在于,当所述指令为接收所述用户在所述目标图像所在人机交互界面的触摸点位置信息时,所述方法还包括:
基于所述触摸点位置确定被选定的像素点坐标之前,判断所述触摸点位置是否位于所述目标区域;
在判断结果指示所述触摸点位置位于所述目标区域时,触发确定所述被选定的像素点坐标。
17.一种图像识别装置,其特征在于,包括:
第一获取模块,用于获取待识别的目标图像;
第二获取模块,用于获取所述目标图像中的目标区域,其中,该目标区域中的图像用于反映指定类型参数信息;
第一确定模块,用于确定所述目标区域中被选定的像素点坐标;
第二确定模块,用于基于所述指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标所对应的参数取值。
18.根据权利要求17所述的装置,其特征在于,所述装置还包括:
分离模块,用于从所述目标区域中分离出指定颜色通道,其中,所述指定颜色通道为R、G、B颜色通道中与所述目标区域的标准色带所对应颜色通道相同的颜色通道;
处理模块,用于对所述指定颜色通道的图像进行图像二值化处理,所述二值化处理为选择所述指定颜色通道的图像中大于预设阈值的像素点集合,得到二值化图像;
拟合模块,用于对得到的二值化图像进行参考点像素识别,得到所述标准色带的至少两个参考点在图像中的像素点坐标;
建立模块,用于确定所述至少两个参考点的实际取值以及所述像素点坐标之间的对应关系,并基于所述对应关系建立所述指定类型参数的取值与像素点坐标的线性关系,并将所述线性关系作为所述关联关系。
19.根据权利要求17所述的装置,其特征在于,所述第一确定模块,包括:
灰度处理单元,用于对所述目标区域中的图像进行灰度化处理,得到灰度图像;
聚类单元,用于对所述灰度图像中的各个像素点进行聚类处理,得到多个簇;
选择单元,用于从所述多个簇中选择指定簇,并从所述指定簇中的所有像素点中确定被选定的像素点坐标。
20.根据权利要求19所述的装置,其特征在于,所述选择单元,用于从所述多个簇中选择像素点数量最少的簇,并从所述像素点数量最少的簇中确定被选定的像素点坐标。
21.根据权利要求17所述的装置,其特征在于,
所述目标区域中的图像包括:坐标系中的曲线图像或坐标系中离散点图像,所述曲线图像中的曲线或所述离散点图像中的离散点,用于反映指定类型参数在不同时刻的取值;
所述第一确定模块,还用于确定所述像素点坐标在所述曲线图像中对应的目标记录时间;
所述第二确定模块,用于基于所述指定类型参数的取值与像素点坐标的关联关系确定所述被选定的像素点坐标在所述目标记录时间所对应的参数取值。
22.根据权利要求21所述的装置,其特征在于,所述第一确定模块还包括:
第一识别单元,用于识别所述曲线图像或所述离散点图像中的字符信息,从所述字符信息中提取所述指定类型参数的时间信息;
第一划分单元,用于对所述时间信息中任意的相邻两个记录时刻之间的时长按照像素点数量进行等间隔划分,得到多个时间点;
第一确定单元,用于从所述多个时间点中确定所述被选定的像素点坐标所属的目标记录时间。
23.根据权利要求17所述的装置,其特征在于,所述第二获取模块,包括:
分割单元,用于对所述目标图像进行语义分割,得到所述目标图像的掩码图像和前景图像;
确定单元,用于从所述前景图像中确定所述目标区域。
24.根据权利要求23所述的装置,其特征在于,
所述分割单元,用于在所述目标图像为第一类型的情况下,采用高效神经网络模型对所述目标图像进行语义分割,其中,所述高效神经网络模型包括:初始化模块和瓶颈模块,其中,每个瓶颈模块包括三个卷积层,其中,所述三个卷积层中的第一卷积层用于进行降维处理,第二卷积层用于进行空洞卷积、全卷积和非对称卷积,第三卷积层用于进行升维处理;
所述分割单元,还用于在所述目标图像为第二类型的情况下,对双边分割网络模型进行调整,并利用调整后的分割网络模型对所述目标图像进行语义分割,其中,对所述分割网络模型进行调整包括:所述双边分割网络模型包括主干网络和辅助网络,所述主干网络由两层构成,每层主干网络分别包括卷积层、批归一化层和非线性激活函数,降低主干网络输出通道特征图数;所述辅助网络模型框架采用轻量级模型,降低主干网络输出通道特征图数,所述轻量级模型包括以下之一:Xception39、SqueezeNet、Xception、MobileNet、ShuffleNet;其中,所述第一类型所对应第一数据集的数量小于第二类型所对应第二数据集中的图像数量。
25.根据权利要求17所述的装置,其特征在于,所述装置还包括:
第三确定模块,用于确定待识别的图像是否为目标图像;以及在所述待识别的图像为目标图像时,确定对所述目标图像进行语义分割。
26.根据权利要求25所述的装置,其特征在于,所述第三确定模块,还用于通过以下方式确定感兴趣区域的类型:将所述感兴趣区域均分成预设数量个不重叠滑块;确定所述预设数量个不重叠滑块的特征值,得到所述预设数量个特征值;将所述预设数量个特征值组合成特征向量;将所述特征向量输入至支持向量机分类器进行分析,得到所述感兴趣区域的类型。
27.根据权利要求17至26中任意一项所述的装置,其特征在于,所述指定类型参数信息中包含有用于反映血糖数据随时间变化的趋势的曲线信息,或用于反映血糖数据随时间变化的趋势的坐标系中离散点的取值信息。
28.一种非易失性存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1至16中任意一项所述的图像识别方法。
29.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至16中任意一项所述的图像识别方法。
CN201910606437.2A 2019-07-05 2019-07-05 图像识别方法及装置、存储介质和处理器 Pending CN111881913A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910606437.2A CN111881913A (zh) 2019-07-05 2019-07-05 图像识别方法及装置、存储介质和处理器
PCT/CN2020/100247 WO2021004402A1 (zh) 2019-07-05 2020-07-03 图像识别方法及装置、存储介质和处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910606437.2A CN111881913A (zh) 2019-07-05 2019-07-05 图像识别方法及装置、存储介质和处理器

Publications (1)

Publication Number Publication Date
CN111881913A true CN111881913A (zh) 2020-11-03

Family

ID=73153889

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910606437.2A Pending CN111881913A (zh) 2019-07-05 2019-07-05 图像识别方法及装置、存储介质和处理器

Country Status (2)

Country Link
CN (1) CN111881913A (zh)
WO (1) WO2021004402A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528782A (zh) * 2020-11-30 2021-03-19 北京农业信息技术研究中心 水下鱼类目标检测方法及装置
CN112785640A (zh) * 2020-12-28 2021-05-11 宁波江丰生物信息技术有限公司 一种用于扫描仪内部切片位置检测的方法和系统
CN113065501A (zh) * 2021-04-15 2021-07-02 黑龙江惠达科技发展有限公司 苗线识别的方法、装置和农机
CN113096119A (zh) * 2021-04-30 2021-07-09 上海众壹云计算科技有限公司 晶圆缺陷分类的方法、装置、电子设备以及存储介质
CN113222963A (zh) * 2021-05-27 2021-08-06 大连海事大学 一种非正射红外监测海面溢油面积估算方法及系统
CN113379006A (zh) * 2021-08-16 2021-09-10 北京国电通网络技术有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN113393518A (zh) * 2021-07-15 2021-09-14 北京京仪光电技术研究所有限公司 一种图片曲线相对数值坐标自动提取方法
CN113486892A (zh) * 2021-07-02 2021-10-08 东北大学 基于智能手机图像识别的生产信息采集方法及系统
CN114638774A (zh) * 2020-12-01 2022-06-17 珠海碳云智能科技有限公司 图像数据处理方法及装置、非易失性存储介质
CN115578564A (zh) * 2022-10-25 2023-01-06 北京医准智能科技有限公司 实例分割模型的训练方法、装置、电子设备及存储介质
CN116664529A (zh) * 2023-06-05 2023-08-29 青岛信驰电子科技有限公司 一种基于特征识别的电子元件排线校对方法
CN116820561A (zh) * 2023-08-29 2023-09-29 成都丰硕智能数字科技有限公司 一种基于界面设计图自动生成界面代码的方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112767359B (zh) * 2021-01-21 2023-10-24 中南大学 复杂背景下的钢板角点检测方法及系统
CN112861885B (zh) * 2021-03-25 2023-09-22 北京百度网讯科技有限公司 图像识别方法、装置、电子设备及存储介质
CN113077472B (zh) * 2021-04-07 2023-02-10 华南理工大学 一种纸质心电图曲线图像分割方法、系统、装置及介质
CN113221985B (zh) * 2021-04-29 2024-04-05 大连海事大学 基于金字塔模型的融合网络来提取图像基础特征的方法
CN113239832B (zh) * 2021-05-20 2023-02-17 众芯汉创(北京)科技有限公司 基于图像识别的隐患智能识别方法及系统
CN113533551B (zh) * 2021-06-08 2023-10-03 广西科技大学 一种基于gc-ims的香米共享风味指纹谱的提取方法
CN113436171B (zh) * 2021-06-28 2024-02-09 博奥生物集团有限公司 一种罐印图像的处理方法及装置
CN113486898B (zh) * 2021-07-08 2024-05-31 西安电子科技大学 一种基于改进ShuffleNet的雷达信号RD图像干扰辨识方法及系统
CN113642609B (zh) * 2021-07-15 2024-03-26 东华大学 基于图像识别技术的共混聚合物中分散相形貌的表征方法
CN113592889B (zh) * 2021-07-22 2024-04-12 武汉工程大学 一种检验开口销夹角的方法、系统和电子设备
CN113658132B (zh) * 2021-08-16 2022-08-19 沭阳九鼎钢铁有限公司 基于计算机视觉的结构件焊缝检测方法
CN113554008B (zh) * 2021-09-18 2021-12-31 深圳市安软慧视科技有限公司 静态物体区域内检测方法、装置、电子设备及存储介质
CN113900418B (zh) * 2021-09-30 2024-05-03 广西埃索凯循环科技有限公司 一种高纯度一水硫酸锌的智能生产系统
CN114119976B (zh) * 2021-11-30 2024-05-14 广州文远知行科技有限公司 语义分割模型训练、语义分割的方法、装置及相关设备
EP4187499A1 (en) * 2021-11-30 2023-05-31 Siemens Aktiengesellschaft Target detection method and apparatus, electronic device, and computer storage medium
CN114241407B (zh) * 2021-12-10 2023-05-23 电子科技大学 一种基于深度学习的近距离屏幕监控方法
CN114219813A (zh) * 2021-12-16 2022-03-22 数坤(北京)网络科技股份有限公司 一种影像处理方法、智能终端及存储介质
CN114283474A (zh) * 2021-12-24 2022-04-05 深圳市同为数码科技股份有限公司 基于目标特征的抓拍优选方法、装置、计算机设备及介质
CN114445483B (zh) * 2022-01-28 2023-03-24 泗阳三江橡塑有限公司 基于图像金字塔的注塑件质量分析方法
CN114662594B (zh) * 2022-03-25 2022-10-04 浙江省通信产业服务有限公司 一种目标特征识别分析系统
CN114692202B (zh) * 2022-03-31 2024-07-30 马上消费金融股份有限公司 图像处理方法、装置、电子设备及存储介质
CN114694186B (zh) * 2022-06-01 2022-08-26 南京优牧大数据服务有限公司 牛脸识别数据处理方法及装置
CN115063578B (zh) * 2022-08-18 2023-01-10 杭州长川科技股份有限公司 芯片图像中目标对象检测与定位方法、装置及存储介质
CN115272298B (zh) * 2022-09-19 2022-12-13 江苏网进科技股份有限公司 基于道路监控的城市路面维护监察方法及系统
CN115588099B (zh) * 2022-11-02 2023-05-30 北京鹰之眼智能健康科技有限公司 一种感兴趣区域显示方法、电子设备和存储介质
CN116385706B (zh) * 2023-06-06 2023-08-25 山东外事职业大学 基于图像识别技术的信号检测方法和系统
CN116612287B (zh) * 2023-07-17 2023-09-22 腾讯科技(深圳)有限公司 图像识别方法、装置、计算机设备和存储介质
CN116611503B (zh) * 2023-07-21 2023-09-22 浙江双元科技股份有限公司 用于多类别瑕疵实时检测的轻量化模型构建方法及装置
CN116939906B (zh) * 2023-07-26 2024-04-19 嘉兴市成泰镜业有限公司 基于人工智能的led混色灯光色彩校准调节方法
CN117079218B (zh) * 2023-09-20 2024-03-08 山东省地质矿产勘查开发局第一地质大队(山东省第一地质矿产勘查院) 基于视频监控的客运索道缆绳绳位动态监测方法
CN117079147B (zh) * 2023-10-17 2024-02-27 深圳市城市交通规划设计研究中心股份有限公司 一种道路内部病害识别方法、电子设备及存储介质
CN117437608B (zh) * 2023-11-16 2024-07-19 元橡科技(北京)有限公司 一种全地形路面类型识别方法及系统
CN117749455B (zh) * 2023-12-14 2024-07-30 国网安徽省电力有限公司 一种语音电网调度系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018018788A1 (zh) * 2016-07-29 2018-02-01 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN109766898A (zh) * 2018-12-26 2019-05-17 平安科技(深圳)有限公司 图像文字识别方法、装置、计算机设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2597006B2 (ja) * 1989-04-18 1997-04-02 シャープ株式会社 矩形座標抽出方法
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
CN105938555A (zh) * 2016-04-12 2016-09-14 常州市武进区半导体照明应用技术研究院 一种图片曲线数据的提取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018018788A1 (zh) * 2016-07-29 2018-02-01 深圳友讯达科技股份有限公司 一种基于图像识别的计量表抄表装置及其方法
CN109766898A (zh) * 2018-12-26 2019-05-17 平安科技(深圳)有限公司 图像文字识别方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
徐波宏: "曲线扫描图的矢量化研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *
李涛著: "《数字图像处理之红外弱目标分割方法研究》", 30 June 2016, 西南交通大学出版社 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112528782A (zh) * 2020-11-30 2021-03-19 北京农业信息技术研究中心 水下鱼类目标检测方法及装置
CN112528782B (zh) * 2020-11-30 2024-02-23 北京农业信息技术研究中心 水下鱼类目标检测方法及装置
CN114638774A (zh) * 2020-12-01 2022-06-17 珠海碳云智能科技有限公司 图像数据处理方法及装置、非易失性存储介质
CN114638774B (zh) * 2020-12-01 2024-02-02 珠海碳云智能科技有限公司 图像数据处理方法及装置、非易失性存储介质
CN112785640A (zh) * 2020-12-28 2021-05-11 宁波江丰生物信息技术有限公司 一种用于扫描仪内部切片位置检测的方法和系统
CN112785640B (zh) * 2020-12-28 2022-08-09 宁波江丰生物信息技术有限公司 一种用于扫描仪内部切片位置检测的方法和系统
CN113065501A (zh) * 2021-04-15 2021-07-02 黑龙江惠达科技发展有限公司 苗线识别的方法、装置和农机
CN113065501B (zh) * 2021-04-15 2024-03-22 黑龙江惠达科技股份有限公司 苗线识别的方法、装置和农机
CN113096119A (zh) * 2021-04-30 2021-07-09 上海众壹云计算科技有限公司 晶圆缺陷分类的方法、装置、电子设备以及存储介质
CN113096119B (zh) * 2021-04-30 2024-06-07 上海众壹云计算科技有限公司 晶圆缺陷分类的方法、装置、电子设备以及存储介质
CN113222963A (zh) * 2021-05-27 2021-08-06 大连海事大学 一种非正射红外监测海面溢油面积估算方法及系统
CN113222963B (zh) * 2021-05-27 2024-03-26 大连海事大学 一种非正射红外监测海面溢油面积估算方法及系统
CN113486892B (zh) * 2021-07-02 2023-11-28 东北大学 基于智能手机图像识别的生产信息采集方法及系统
CN113486892A (zh) * 2021-07-02 2021-10-08 东北大学 基于智能手机图像识别的生产信息采集方法及系统
CN113393518A (zh) * 2021-07-15 2021-09-14 北京京仪光电技术研究所有限公司 一种图片曲线相对数值坐标自动提取方法
CN113379006B (zh) * 2021-08-16 2021-11-02 北京国电通网络技术有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN113379006A (zh) * 2021-08-16 2021-09-10 北京国电通网络技术有限公司 图像识别方法、装置、电子设备和计算机可读介质
CN115578564A (zh) * 2022-10-25 2023-01-06 北京医准智能科技有限公司 实例分割模型的训练方法、装置、电子设备及存储介质
CN116664529A (zh) * 2023-06-05 2023-08-29 青岛信驰电子科技有限公司 一种基于特征识别的电子元件排线校对方法
CN116820561A (zh) * 2023-08-29 2023-09-29 成都丰硕智能数字科技有限公司 一种基于界面设计图自动生成界面代码的方法
CN116820561B (zh) * 2023-08-29 2023-10-31 成都丰硕智能数字科技有限公司 一种基于界面设计图自动生成界面代码的方法

Also Published As

Publication number Publication date
WO2021004402A1 (zh) 2021-01-14

Similar Documents

Publication Publication Date Title
CN111881913A (zh) 图像识别方法及装置、存储介质和处理器
US10943346B2 (en) Multi-sample whole slide image processing in digital pathology via multi-resolution registration and machine learning
CN109151501B (zh) 一种视频关键帧提取方法、装置、终端设备及存储介质
CN109154978B (zh) 用于检测植物疾病的系统和方法
Cheng et al. Efficient salient region detection with soft image abstraction
CN112381775B (zh) 一种图像篡改检测方法、终端设备及存储介质
WO2019100282A1 (zh) 一种人脸肤色识别方法、装置和智能终端
Liu et al. Real-time robust vision-based hand gesture recognition using stereo images
CN112052186B (zh) 目标检测方法、装置、设备以及存储介质
WO2021129466A1 (zh) 检测水印的方法、装置、终端及存储介质
CN110136198A (zh) 图像处理方法及其装置、设备和存储介质
CN112784810A (zh) 手势识别方法、装置、计算机设备和存储介质
CN113784171A (zh) 视频数据处理方法、装置、计算机系统及可读存储介质
CN112560845A (zh) 字符识别方法、装置、智能取餐柜、电子设备及存储介质
CN109658523A (zh) 利用ar增强现实应用实现车辆各功能使用说明的方法
CN115082776A (zh) 一种基于图像识别的电能表自动检测系统及方法
CN112036284A (zh) 图像处理方法、装置、设备及存储介质
CN108647605B (zh) 一种结合全局颜色与局部结构特征的人眼凝视点提取方法
CN110751004A (zh) 二维码检测方法、装置、设备及存储介质
CN104298961B (zh) 基于口型识别的视频编排方法
CN113298753A (zh) 敏感肌的检测方法、图像处理方法、装置及设备
CN110910497B (zh) 实现增强现实地图的方法和系统
CN113052234A (zh) 一种基于图像特征和深度学习技术的玉石分类方法
CN114708420A (zh) 基于局部方差和后验概率分类器的视觉定位方法及装置
Jyothi et al. Computational color naming for human-machine interaction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201103

RJ01 Rejection of invention patent application after publication