CN110008965A - 目标物识别方法及识别系统 - Google Patents
目标物识别方法及识别系统 Download PDFInfo
- Publication number
- CN110008965A CN110008965A CN201910263560.9A CN201910263560A CN110008965A CN 110008965 A CN110008965 A CN 110008965A CN 201910263560 A CN201910263560 A CN 201910263560A CN 110008965 A CN110008965 A CN 110008965A
- Authority
- CN
- China
- Prior art keywords
- vector
- sparse
- local binary
- sparse matrix
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 239000013598 vector Substances 0.000 claims abstract description 70
- 238000013500 data storage Methods 0.000 claims abstract description 17
- 230000011218 segmentation Effects 0.000 claims abstract description 9
- 238000000605 extraction Methods 0.000 claims description 12
- 230000006835 compression Effects 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 8
- 239000000039 congener Substances 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 abstract description 5
- 230000009467 reduction Effects 0.000 abstract description 3
- 241001465754 Metazoa Species 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 241000282421 Canidae Species 0.000 description 1
- 240000005595 Echinocereus dasyacanthus Species 0.000 description 1
- 235000008314 Echinocereus dasyacanthus Nutrition 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 241000282320 Panthera leo Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/267—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/50—Extraction of image or video features by performing operations within image blocks; by using histograms, e.g. histogram of oriented gradients [HoG]; by summing image-intensity values; Projection analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/467—Encoded features or binary features, e.g. local binary patterns [LBP]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/513—Sparse representations
Abstract
本公开提供一种目标物识别方法以及识别系统。其中,该目标物识别方法包括对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据均衡的局部二值模式特征对每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;然后基于压缩稀疏行的稀疏数据存储方式,存储该稀疏矩阵向量。通过本公开的识别方法,在以压缩稀疏行的稀疏数据存储方式存储时,存储的矩阵向量占用内存空间可以大大缩小。
Description
技术领域
本公开涉及信息处理技术领域,尤其涉及一种目标物识别方法及系统。
背景技术
目标物的自动识别,例如人脸识别、动物品种识别或植物品种识别,是基于目标物的局部或整体特征信息进行身份识别的识别技术。一种通用的识别技术是基于LBP(localbinary patterns,局部二值模式)特征算法,HOG(histogram of oriented gradient方向梯度直方图)特征算法或者Haar-like(特征的计算-积分图特征)特征算法,且需要创建很大的人脸数据库并一一比对;而另一种通用的识别技术基于深度学习的目标物识别方案,计算时则需要大量的参数量,计算则更为复杂;以上两种识别技术对终端处理芯片的内存和计算能力都具有较高要求,需要更高内存开销的存储装置以及更快运算能力的计算装置与之匹配。
发明内容
有鉴于此,本公开的目的在于提供一种目标物识别方法以及识别系统,以至少部分解决上述的技术问题。
根据本公开的一方面,提供一种目标物识别方法,包括:对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据均衡的局部二值模式特征对每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;基于压缩稀疏行的稀疏数据存储方式,存储该稀疏矩阵向量。
在进一步的实施方案中,所述基于压缩稀疏行的稀疏数据存储方式,包括只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置。
在进一步的实施方案中,所述只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。
在进一步的实施方案中,所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。
在进一步的实施方案中,对图像各像素提取局部二值模式特征之前,还包括:输入待识别图像;对该待识别图像进行灰度化;对灰度化的图像进行双线性插值至设定尺寸。
在进一步的实施方案中,将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。
在进一步的实施方案中,还包括:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。
根据本公开的另一方面,还提供一种目标物识别系统,包括:处理器,用于执行指令,在执行指令时完成以下步骤:对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据均衡的局部二值模式特征对每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;存储器,基于压缩稀疏行的稀疏数据存储方式,存储该稀疏矩阵向量。
在进一步的实施方案中,所述存储器中,基于压缩稀疏行的稀疏数据存储方式,包括:只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置。
在进一步的实施方案中,所述存储器中,只存储所述稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。
在进一步的实施方案中,所述存储器中所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。
在进一步的实施方案中,所述处理器还用于:对图像各像素提取局部二值模式特征之前:输入待识别图像;对该待识别图像进行灰度化;对灰度化的图像进行双线性插值至设定尺寸。
在进一步的实施方案中,所述处理器还用于:将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。
在进一步的实施方案中,所述处理器还用于:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。
通过本公开的识别方法,在以压缩稀疏行(CSR)的稀疏数据存储方式存储时,存储的矩阵向量占用内存空间可以大大缩小,可以节省近60%内存开销;
通过本公开的识别系统,可以减少内存消耗,提高整个识别系统的运算和处理效率。
附图说明
图1是本公开实施例的目标物识别方法流程图。
图2A是本公开另一实施例的目标物识别方法整体示意图;图2B是图2A的具体流程图。
图3是图2B中目标物识别方法中实施例的中局部二值模式特征值的计算示意图。
图4是图3中加入旋转不变性特性的局部二值模式示意图。
图5是图2A实施例的内存开销与现有技术的比较示意。
图6是本公开实施例的目标物识别系统方块图。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开作进一步的详细说明。下面通过实施例,并结合附图,对本公开的技术方案作进一步具体的说明。在说明书中,相同或相似的附图标号指示相同或相似的部件。下述参照附图对本公开实施方式的说明旨在对本公开的总体发明构思进行解释,而不应当理解为对本公开的一种限制。
另外,在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。在其他情况下,公知的结构和装置以图示的方式体现以简化附图。
现有的目标物识别过程中,存储处理后的目标物识别数据时需要耗费大量的存储空间,根据本公开的基本构思,提供一种目标物识别方法,包括对目标物识别数据(例如ULBPH的稀疏矩阵向量)采用稀疏矩阵的存储方式存储,以节省空间,提高效率。
图1是本公开实施例的目标物识别方法流程图。本公开实施例提供一种目标物识别方法,如图1所示,其包括步骤:
S1:对图像各像素提取局部二值模式特征后,经过Uniform(均衡)降维处理得到ULBP(Uniform Local Binary Pattern,均衡的局部二值模式)特征,其中,图像的内容包含至少部分目标物;
S2:对图像进行单元分割,每个单元对应多个像素,并依据ULBP特征对每个单元求取直方图后拼接在一起,得到ULBPH(Uniform Local Binary Pattern Histogram,均衡的局部二值模式直方图)的稀疏矩阵向量;
S3:基于压缩稀疏行(Compressed Sparse Row,简称为CSR)的稀疏数据存储方式,存储该稀疏矩阵向量。
步骤S1中涉及对ULBP特征进行降维处理,通常在目标物识别过程中,需要对拍摄的含目标物的图像进行处理,以利于后期进行判断,一种方式是采用基于ULBPH算法进行处理,其中包括对图片进行多步骤的处理,包括在对图像各像素提取局部二值模式特征后,可经过Uniform降维处理得到ULBP特征。局部二值模式(LBP)是用来描述图像局部纹理特征的算子,另外还可以根据需要加入旋转不变性和灰度不变性特性。经过局部二值处理后,每个像素点都可以得到一个LBP编码,此时得到是一个每一个像素点局部二值的图片。然后,对该LBP图谱进行进一步处理,例如进行Uniform降维处理,对LBP特征值Uniform的操作可以是:在局部二值模式确定的设定邻域范围内(例如8邻域),对于0-1(1-0)跳变次数小于等于2的LBP特征值Uniform为自身,而对于0-1(1-0)跳变次数大于2的LBP特征值Uniform为设定数值,例如58。通过该做法,能够保证不失真的基础上降低数据存储量。
本公开实施例中所指的目标物可以是动物、植物、人或者物品,或者上述所列的局部,后期如果需要对目标物的种类进行区分的也可以包括其中,例如对人脸进行识别,以区分不同的人;对动物进行识别,以区分不同种类的动物,甚至可以同一科的不同动物,例如可以在犬科中区分出斗牛犬、松狮、吉娃娃、藏獒等具体品种。在一实施例中,图像的内容可以包含至少部分目标物,例如目标物为人脸,则可以包括部分人脸;例如目标物为建筑物,则可以是建筑物的局部轮廓。
在一实施例中,对图像各像素提取局部二值模式特征之前,还包括:输入待识别图像;对该待识别图像进行灰度化;以及对灰度化的图像进行双线性插值至设定尺寸。在提取二值模式之前,可能还需要对包含目标物的图像进行预处理,包括但不限于灰度化和线性插值操作。
步骤S2中,对进行过降维后的图像进行ULBP特征谱的直方图统计。由于直接对提取的ULBP特征进行分析的话,可能由于位置未对准即进行分析。可以通过对图像进行单元分割(即将一幅图片划分为若干子区域),每个单元对应多个像素,并依据ULBP特征对每个单元求取直方图后拼接在一起,得到ULBPH的稀疏矩阵向量。例如图片有10*10个单元,也就有了10*10个统计后的直方图,将它们拼接在一起可以形成一矩阵向量,也就是整张图的ULBP纹理特征向量。当然,分割方式可以有多种,例如图片可以分割成多个为正方形、矩形或者不规则图形。本公开实施例中并不以此为限。由于目标物内容部分图像(例如人脸)除了一些比较有棱角的地方,像素变化比较大,其余整体部分都比较平滑,因此在做直方图统计的时候会有大量的0出现,也就是ULBPH会是一个稀疏矩阵(向量)。
在步骤S3中,对处理得到的稀疏矩阵向量需进行存储,如按照通常的向量存储方式进行存储,需要占用大量的存储空间,而且存储空间中为0的值较多,空间严重浪费,本公开实施例提出了基于CSR的稀疏数据存储方式,以存储该稀疏矩阵向量。
在一实施例中基于CSR的稀疏数据存储方式,包括:存储稀疏矩阵向量的非零数据以及非零数据对应位置。在进一步的实施例中,存储稀疏矩阵向量的非零数据以及非零数据对应位置,包括:
确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;以及将各非零元素及其对应地址作为单元数据进行存储。
在一实施例中,由于ULBPH特征为1*N的一个向量,可以只记录各非零元素及偏移量(该偏移量对应元素的地址);作为单位数据进行存储时以链表方式或者组表方式进行存储;链表中的各个节点可以记录地址信息、非零元素信息以及指向下一节点的指针信息;组表进行存储时可以记录的信息中包括非零元素和偏移量。
在一实施例中,上述人脸识别方法步骤中还可以包括:将存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库(这里的同种类可以对应于自然界和社会中对于物种的分类,比如隶属于生物学同一种和/或类概念的猫、狗或人)。也就是组建特定目标物的数据库,对各特征向量所代表的物种进行命名,为后期识别未知种类的目标物提供数据库支持。
在一实施例中,上述人脸识别方法还包括如下步骤:将存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类,从而实现了对目标物的识别。其中,进行上述比较时,可根据已有的比较方式进行,原则是数据相似度高于设定阈值的则认为相同。通过上述的处理和存储方法后,内存开销降低,处理速度加快。
为了更加具体充分的理解本公开,以下特以目标物为人脸进行举例说明,但应理解的是,下述的识别方法的具体细节仅仅用于更好的阐述本公开,而不应该理解为对本公开的限定。
实施例1
具体实施例1的目标物识别方法中,可基于ULBPH算法的人脸识别,具体流程如图2A和图2B所示(图2A是本公开另一实施例的目标物识别方法整体示意图,图2B是图2A的具体流程图):
参见图2A所示,人脸识别整体可以包括人脸数据表示、LBPH特征特征、人脸图像与特征数据库的建立、以及分类识别),具体内容如下所述:
人脸数据表示:
首先,参见图2B所示,识别开始后,对输入待识别人脸进行图像灰度化(选择性的进行双线性插值)至与数据库人脸相同尺寸;
LBPH特征提取:
然后,参见图2B所示,对进行图像灰度化(选择性的双线性插值)的人脸结果提取LBP特征,参见图3,图3是图2A中目标物识别方法中实施例的中局部二值模式特征值的计算示意图;其中,对于LBP特征,加入旋转不变性的LBP特征:
上述LBP特征值的计算基于8邻域,因此同一个点的LBP特征值会随着起点的不一样而不一样,如图4所示,共有8种情况(例如图4中的LBP特征值225对应的旋转LBP特征值可以有240、120、60、30、15、135和195七种),取这些情况中的最小值,也就是图4所示的数据15(LBP特征值15),作为这个点的LBP特征值,这样不管图片怎么旋转,这个点的LBP特征值都会是15,也就是旋转不变性。
接着,参见图2B所示提取后的LBP特征需要经过Uniform进行降维处理得到低维度的ULBP特征,例如8邻域做法,维度会从256维降至59维;
例如对于一个基于8邻域的LBP特征值,其值可认为是unsigned char类型,取值范围为[0b00000000,0b11111111],对LBP特征值Uniform的操作定义为:对于0-1(1-0)跳变次数小于等于2的LBP特征值Uniform为本身,而对于0-1(1-0)跳变次数大于2的LBP特征值Uniform为58,其中部分LBP值跳变为ULBP值之间的对应关系如表1所示:
表1
之后,参见图2B所示,进行单元(cell)分割,并依次求取直方图后拼接在一起,得到ULBPH,分割的单元(cell)的个数为7*7;ULBPH就是对ULBP按cell进行直方图统计,对提取后的单元分割并依次求取直方图后拼接在一起得到的ULBPH如下表2所示,假设图像大小为91*112(宽*高),共有7*7个cell,那每个cell的大小为13*16(宽*高),对每个cell进行直方图统计,每个cell都有59个BIN,然后按照顺序将每个cell的ULBPH进行拼接,也就是说一张人脸经过上述所有操作后会得到7*7*59的一个特征向量。
表2
0 | 1 | 2 | 3 | 4 | 5 | 6 |
7 | 8 | 9 | ||||
人脸图像与特征数据库
随后,参照图2B所示,按照上述方式存储已知目标物种类的特征向量,并且作为已知种类的目标物存入人脸数据库。
分类识别
最后,参见图2B所示,与按照上述方式存储的人脸数据库中的所有ULBPH进行对比,找到与待识别人脸距离最近的ULBPH,以此确定待识别人脸的标签(label)。
以下,将对按照本实施例1方式的方法处理后的内存开销与现有技术中未经处理的内存开销进行比较:
首先,对于现有技术来说,以BIN取得的最大值为13*16=208为例,需要用8bit表示,一张人脸所需要的内存开销为7*7*59*8bit=23128bit,需要创建N张人脸的数据库,则需要N*23128bit。
其次,针对本具体实施例1的设置,非零元素的位置最大为7*7*59,需要用12bit表示,假设非0元素有Nz个,则采用CSR的存储方式需要Nz*(8+12)=Nz*20bit。人脸的ULBPH中非零元素所占比例大约为15%~20%,也就是Nz≈0.2*7*7*59,基于CSR的存储方式需要Nz*(8+12)=Nz*20bit=11564bit;将两者进行比较:11564bit/23128bit=50%,即可以节省50%的存储空间。
还可以通过图5所示的数据库进行验证,例如以Yale数据库和Att数据库验证;通过输入相应的占用内存显示指令,表明:Yale数据库中有165人,未采用本公开实施例1的方式处理时,占用3816120bit,采用本公开实施例1的方式存储后,占用1438860bit,节省了62%的存储空间;类似的,Att数据库中,共有400个的数据,未采用本公开实施例1的方式处理时,占用9251200bit,采用本公开实施例1的方式存储后,占用3911640bit,节省了57%的存储空间。因此,采用本公开实施例的以压缩稀疏行的稀疏数据存储方式存储时,存储的矩阵向量占用内存空间可以大大缩小。
其中可在电脑程序码或机器可使用指令来执行本公开的方法,指令可为程序模组的电脑可执行指令,其程序模组由电脑或其它机器,例如个人数位助理或其它可携式装置执行。一般而言,程序模组包括例程、程序、物件、元件、数据结构等,程序模组指的是执行特定任务或实现特定抽象数据类型的程序码。本公开可在各种系统组态中实现,包括可携式装置、消费者电子产品、通用电脑、更专业的计算装置等。本公开还可在分散式运算环境中实现,处理由通信网路所连结的装置。
如图6所示,本公开实施例还提供了一种目标物识别系统,包括:
处理器610,用于执行指令,在执行指令时完成以下步骤:对图像各像素提取局部二值模式特征后,经过Uniform降维处理得到ULBP特征,其中,图像的内容包含至少部分目标物;对图像进行单元分割,每个单元对应多个像素,并依据ULBP特征对每个单元求取直方图后拼接在一起,得到ULBPH的稀疏矩阵向量;
存储器620,基于CSR的稀疏数据存储方式,存储该稀疏矩阵向量。
在一实施例中,基于CSR的稀疏数据存储方式,包括:只存储稀疏矩阵向量的非零数据以及非零数据对应位置。
在一实施例中,存储器620中,只存储稀疏矩阵向量的非零数据以及非零数据对应位置,包括:确定稀疏矩阵向量中的非零元素数量;确定各非零元素的存储地址;将各非零元素及其对应地址作为单元数据进行存储。
在一实施例中,存储器620中各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。具体存储方式可以参照以上介绍的方法实例内容,在此不予赘述。
在一实施例中,处理器610还用于:输入待识别图像;对该待识别图像进行灰度化;以及对灰度化的图像进行双线性插值至设定尺寸。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。
在一实施例中,处理器610还用于:将存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。
在一实施例中,处理器610还用于:将存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。具体处理方式可以参照以上介绍的方法实例内容,在此不予赘述。
其中,目标物识别系统可以包括直接或间接耦接以下装置的总线660、存储器620、一或多个处理器610、一或多个显示器650、输入/输出(I/O)端口630、输入/输出(I/O)元件640。总线660表示可为一或多个总线的元件(例如,位址总线、数据总线或其组合)。虽然图6的各个方块为简要起见以线示出,实际上,各个元件的分界并不是具体的,例如,可将显示装置的呈现元件视为I/O元件;处理器可具有存储器。
目标物识别系统一般包括各种电脑可读取媒体。电脑可读取媒体可以是可被目标物识别系统存取的任何可用媒体,该媒体同时包括易挥发性和非易挥发性媒体、可移动和不可移动媒体。举例但不局限于,电脑可读取媒体可包括电脑储存媒体和通信媒体。电脑可读取媒体同时包括在用于储存像是电脑可读取指令、数据结构、程序模组或其它数据之类的信息的任何方法或技术中实现的易挥发性性和非易挥发性媒体、可移动和不可移动媒体。电脑储存媒体包括但不局限于RAM、ROM、EEPROM、快闪存储器或其它存储器技术、CD-ROM、数位多功能光碟(DVD)或其它光碟储存装置、磁片、磁碟、磁片储存装置或其它磁储存装置,或可用于储存所需的信息并且可被计算装置存取的其它任何媒体。电脑储存媒体本身不包括信号。
通信媒体一般包含电脑可读取指令、数据结构、程序模组或其它采用诸如载波或其他传输机制之类的模组化数据信号形式的数据,并包括任何信息传递媒体。举例但不局限于,通信媒体包括像是有线网路或直接有线连接的有线媒体及无线媒体,像是声频、射频、红外线以及其它无线媒体。上述媒体的组合包括在电脑可读取媒体的范围内。
存储器620包括以易挥发性和非易挥发性存储器形式的电脑储存媒体。存储器可为可移动、不移动或可以为这两种的组合。示例性硬体装置包括固态存储器、硬碟驱动器、光碟驱动器等。目标物识别系统包括一或多个处理器,其读取来自像是存储器620或I/O元件640各实体的数据。显示器650向使用者或其它装置显示数据指示。示例性显示元件包括显示装置、扬声器、列印元件、振动元件等。
I/O端口630允许目标物识别系统逻辑连接到包括I/O元件640的其它装置,一些此种装置为内建装置。示例性元件包括麦克风、摇杆、游戏台、碟形卫星信号接收器、扫描器、印表机、无线装置等。
以上所述的具体实施例,对本公开的目的、技术方案和有益效果进行了进一步详细说明,应理解的是,以上所述仅为本公开的具体实施例而已,并不用于限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (14)
1.一种目标物识别方法,其中,包括:
对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;
对所述图像进行单元分割,每个单元对应多个像素,并依据所述均衡的局部二值模式特征对所述每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;
基于压缩稀疏行的稀疏数据存储方式,存储所述稀疏矩阵向量。
2.根据权利要求1所述的方法,其特征在于,所述基于压缩稀疏行的稀疏数据存储方式,包括:
只存储所述稀疏矩阵向量的非零数据以及所述非零数据对应位置。
3.根据权利要求2所述的方法,其特征在于,所述只存储所述稀疏矩阵向量的非零数据以及所述非零数据对应位置,包括:
确定稀疏矩阵向量中的非零元素数量;
确定各非零元素的存储地址;
将所述各非零元素及其对应地址作为单元数据进行存储。
4.根据权利要求3所述的方法,其特征在于,所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。
5.根据权利要求1所述的方法,其特征在于,对所述图像各像素提取局部二值模式特征之前,还包括:
输入待识别图像;
对该待识别图像进行灰度化;
对灰度化的图像进行双线性插值至设定尺寸。
6.根据权利要求1所述的方法,其特征在于,还包括:将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个所述设定目标物的标签组成设定种类的目标物标准数据库。
7.根据权利要求6所述的方法,其特征在于,还包括:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。
8.一种目标物识别系统,其特征在于包括:
处理器,用于执行指令,在执行指令时完成以下步骤:
对图像各像素提取局部二值模式特征后,经过均衡降维处理得到均衡的局部二值模式特征,其中,所述图像的内容包含至少部分目标物;
对所述图像进行单元分割,每个单元对应多个像素,并依据所述均衡的局部二值模式特征对所述每个单元求取直方图后拼接在一起,得到均衡的局部二值模式直方图的稀疏矩阵向量;
存储器,基于压缩稀疏行的稀疏数据存储方式,存储所述稀疏矩阵向量。
9.根据权利要求8所述的系统,其特征在于,所述存储器中,基于压缩稀疏行的稀疏数据存储方式,包括:只存储所述稀疏矩阵向量的非零数据以及所述非零数据对应位置。
10.根据权利要求9所述的系统,其特征在于,所述存储器中,只存储所述稀疏矩阵向量的非零数据以及所述非零数据对应位置,包括:
确定稀疏矩阵向量中的非零元素数量;
确定各非零元素的存储地址;
将所述各非零元素及其对应地址作为单元数据进行存储。
11.根据权利要求10所述的系统,其特征在于,所述存储器中所述各非零元素及其对应地址作为单位数据进行存储时以链表方式或者组表方式进行存储。
12.根据权利要求8所述的系统,其特征在于,所述处理器还用于:
输入待识别图像;
对该待识别图像进行灰度化;
对灰度化的图像进行双线性插值至设定尺寸。
13.根据权利要求8所述的系统,其特征在于,所述处理器还用于:将所述存储该稀疏矩阵向量确定为设定目标物的标签;并且将同种类的多个设定目标物的标签组成设定种类的目标物标准数据库。
14.根据权利要求13所述的系统,其特征在于,所述处理器还用于:将所述存储该稀疏矩阵向量确定为未知目标物;并且将该未知目标物的矩阵向量数据与目标物标准数据库的标签对应矩阵向量进行比较,确定该未知目标物的具体种类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910263560.9A CN110008965A (zh) | 2019-04-02 | 2019-04-02 | 目标物识别方法及识别系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910263560.9A CN110008965A (zh) | 2019-04-02 | 2019-04-02 | 目标物识别方法及识别系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110008965A true CN110008965A (zh) | 2019-07-12 |
Family
ID=67169512
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910263560.9A Pending CN110008965A (zh) | 2019-04-02 | 2019-04-02 | 目标物识别方法及识别系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110008965A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110943744A (zh) * | 2019-12-03 | 2020-03-31 | 杭州嘉楠耘智信息科技有限公司 | 数据压缩、解压缩以及基于数据压缩和解压缩的处理方法及装置 |
CN114170588A (zh) * | 2021-12-13 | 2022-03-11 | 西南交通大学 | 基于眼部特征的铁路调度员不良状态识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262723A (zh) * | 2010-05-24 | 2011-11-30 | 汉王科技股份有限公司 | 一种人脸识别方法及装置 |
CN103839042A (zh) * | 2012-11-27 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 人脸识别方法和人脸识别系统 |
CN106446772A (zh) * | 2016-08-11 | 2017-02-22 | 天津大学 | 一种人脸识别系统中的防欺骗方法 |
CN106548160A (zh) * | 2016-11-09 | 2017-03-29 | 浙江博天科技有限公司 | 一种人脸微笑检测方法 |
CN108376256A (zh) * | 2018-05-08 | 2018-08-07 | 兰州大学 | 一种基于arm处理平台动态处理人脸识别系统及其设备 |
-
2019
- 2019-04-02 CN CN201910263560.9A patent/CN110008965A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102262723A (zh) * | 2010-05-24 | 2011-11-30 | 汉王科技股份有限公司 | 一种人脸识别方法及装置 |
CN103839042A (zh) * | 2012-11-27 | 2014-06-04 | 腾讯科技(深圳)有限公司 | 人脸识别方法和人脸识别系统 |
CN106446772A (zh) * | 2016-08-11 | 2017-02-22 | 天津大学 | 一种人脸识别系统中的防欺骗方法 |
CN106548160A (zh) * | 2016-11-09 | 2017-03-29 | 浙江博天科技有限公司 | 一种人脸微笑检测方法 |
CN108376256A (zh) * | 2018-05-08 | 2018-08-07 | 兰州大学 | 一种基于arm处理平台动态处理人脸识别系统及其设备 |
Non-Patent Citations (3)
Title |
---|
BILIBILI: "09-人脸识别算法之LBPH", 《HTTPS://WWW.BILIBILI.COM/VIDEO/BV1FW4111776?P=9》 * |
SEYED MOJTABA MOUSAVI 等: "Crowd Estimation Using Histogram Model Classification Based on Improved Uniform Local Binary Pattern", 《INTERNATIONAL JOURNAL OF COMPUTER AND ELECTRICAL ENGINEERING》 * |
吴建平 等: "《稀疏线性方程组的高效求解与并行计算》", 31 May 2004 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110943744A (zh) * | 2019-12-03 | 2020-03-31 | 杭州嘉楠耘智信息科技有限公司 | 数据压缩、解压缩以及基于数据压缩和解压缩的处理方法及装置 |
CN114170588A (zh) * | 2021-12-13 | 2022-03-11 | 西南交通大学 | 基于眼部特征的铁路调度员不良状态识别方法 |
CN114170588B (zh) * | 2021-12-13 | 2023-09-12 | 西南交通大学 | 基于眼部特征的铁路调度员不良状态识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Caicedo et al. | Histopathology image classification using bag of features and kernel functions | |
Zhou et al. | BIOCAT: a pattern recognition platform for customizable biological image classification and annotation | |
Mala et al. | Multilevel threshold selection for image segmentation using soft computing techniques | |
CN110070115B (zh) | 一种单像素攻击样本生成方法、装置、设备及存储介质 | |
CN108256532A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN109299305A (zh) | 一种基于多特征融合的空间图像检索系统及检索方法 | |
CN110008965A (zh) | 目标物识别方法及识别系统 | |
Sharma et al. | Perceptual video hashing based on Tucker decomposition with application to indexing and retrieval of near-identical videos | |
CN114169381A (zh) | 图像标注方法、装置、终端设备及存储介质 | |
Hernández et al. | CUDA-based parallelization of a bio-inspired model for fast object classification | |
CN111353062A (zh) | 一种图像检索方法、装置以及设备 | |
Shapira et al. | Mode-detection via median-shift | |
Úbeda et al. | Improving pattern spotting in historical documents using feature pyramid networks | |
CN108960246B (zh) | 一种用于图像识别的二值化处理装置及方法 | |
CN111199228B (zh) | 一种车牌定位的方法及装置 | |
CN109800215B (zh) | 一种对标处理的方法、装置、计算机存储介质及终端 | |
CN109857897B (zh) | 一种商标图像检索方法、装置、计算机设备及存储介质 | |
CN115908363B (zh) | 肿瘤细胞统计方法、装置、设备和存储介质 | |
Gani et al. | Copy move forgery detection using DCT, PatchMatch and cellular automata | |
CN113065010B (zh) | 标牌图像管理方法、装置、计算机设备和存储介质 | |
Chen et al. | A low complexity interest point detector | |
Han et al. | A MapReduce approach for SIFT feature extraction | |
CN107766863B (zh) | 图像表征方法和服务器 | |
Davalle et al. | Hardware accelerator for fast image/video thinning | |
CN109948392B (zh) | 二维码边界检测方法、分割方法、存储介质和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20201123 Address after: Room 206, 2 / F, building C, phase I, Zhongguancun Software Park, No. 8, Dongbei Wangxi Road, Haidian District, Beijing 100094 Applicant after: Canaan Bright Sight Co.,Ltd. Address before: 310016, room 12, building 4, building nine, No. nine, 1203 Ring Road, Hangzhou, Zhejiang, Jianggan District Applicant before: Hangzhou Canaan Creative Information Technology Ltd. |
|
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190712 |