CN107766782A - 一种年龄群体分类的方法及装置 - Google Patents

一种年龄群体分类的方法及装置 Download PDF

Info

Publication number
CN107766782A
CN107766782A CN201610711538.2A CN201610711538A CN107766782A CN 107766782 A CN107766782 A CN 107766782A CN 201610711538 A CN201610711538 A CN 201610711538A CN 107766782 A CN107766782 A CN 107766782A
Authority
CN
China
Prior art keywords
information
personage
classifier
classification
age
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610711538.2A
Other languages
English (en)
Inventor
陈彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201610711538.2A priority Critical patent/CN107766782A/zh
Priority to PCT/CN2017/087184 priority patent/WO2018036241A1/zh
Publication of CN107766782A publication Critical patent/CN107766782A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/50Context or environment of the image
    • G06V20/52Surveillance or monitoring of activities, e.g. for recognising suspicious objects
    • G06V20/53Recognition of crowd images, e.g. recognition of crowd congestion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20004Adaptive image processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20212Image combination
    • G06T2207/20224Image subtraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30196Human being; Person
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30232Surveillance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供了一种年龄群体分类的方法及装置,其中,该年龄群体分类的方法包括:获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息,根据所述图像信息,建立与所述视频场景对应的三维图像,获取所述三维图像中的人物的体征信息,根据获取的体征信息,对所述视频场景中的人物进行年龄群体分类。本发明实施例提供的技术方案能够提高年龄群体分类的准确性。

Description

一种年龄群体分类的方法及装置
技术领域
本发明涉及通信技术领域,尤其涉及一种年龄群体分类的方法及装置。
背景技术
在全民移动的时代,年龄群体的分类研究是一个非常关键的技术。从最新的《基于2015年中国移动互联网人群行为分析报告》的研究可以看出,移动互联网的群体时代已到来,用户早已不满足单向的引导和灌输。体验感、参与度以及互相之间的交流,对用户群体来说已经越来越重要。能够把握互联网人群的行为特征及趋势,深入洞察,发现规律,并将其用在数字营销中,是抢占用户市场的前提,能够了解用户群体需求,贴合不同的用户群体,能够为用户创造价值就显得尤为重要。但现有技术中的年龄群体分类方法准确度较低,影响对实际使用用户数据的分析。
发明内容
本发明实施例提供了一种年龄群体分类的方法及装置,以解决现有技术中的年龄群体分类方法准确度低的问题。
为了解决上述技术问题,本发明采用如下技术方案:
第一方面,提供了一种年龄群体分类的方法,包括:
获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息;
根据所述图像信息,建立与所述视频场景对应的三维图像;
获取所述三维图像中的人物的体征信息;
根据获取的体征信息,对所述视频场景中的人物进行年龄群体分类。
进一步地,所述获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息的步骤之前,所述方法还包括:
对相对于所述视频场景位于不同拍摄角度的所述摄像机进行标定,获取每一摄像机的内部参数和外部参数。
进一步地,所述根据所述图像信息,建立与所述视频场景对应的三维图像的步骤包括:
提取所述图像信息中的特征点;
在不同角度拍摄的图像信息中,根据所述特征点进行立体特征匹配;
根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与所述视频场景对应的三维图像。
进一步地,所述获取所述三维图像中的人物的体征信息的步骤包括:
获取所述三维图像中的人物的身高信息和肩宽信息;
其中,所述根据获取的体征信息,对所述视频场景中的人物进行年龄群体分类的步骤包括:
根据获取的身高信息和肩宽信息,对所述视频场景中的人物进行年龄群体分类。
进一步地,所述获取所述三维图像中的人物的身高信息和肩宽信息的步骤包括:
确定所述三维图像中的人物的轮廓信息;
根据确定的轮廓信息,用矩形框框出所述三维图像中的人物;
计算所述矩形框的长度和宽度;
将所述矩形框的长度确定为人物的身高信息,将所述矩形框的宽度确定为人物的肩宽信息。
进一步地,所述根据获取的体征信息,对所述视频场景中人物的年龄群体进行分类的步骤包括:
将获取的体征信息输入预设的多级分类器;
根据所述多级分类器的输出结果,确定每一体征信息所属的年龄群体。
进一步地,在所述将获取的体征信息输入预设的多级分类器的步骤之前,所述方法还包括:
构建所述多级分类器。
进一步地,所述构建所述多级分类器的步骤包括:
从所述三维图像中获取样本信息,其中样本信息包括:所述三维图像中的人物的体征信息和部分物体的形态信息;
分配每一样本信息相同的权重值;
将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练;
根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值;
将完成分类训练的多个基础分类器构建成多级强分类器。
进一步地,所述将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练的步骤包括:
根据预设公式:N=c×(c-1)/2,计算所述多级分类器中的基础分类器的数量;
其中,N表示基础分类器的数量,c表示年龄群体分类的数量;
将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练,其中每一基础分类器能够分类出两种年龄群体。
第二方面,提供了一种年龄群体分类的装置,包括:
图像获取模块,用于获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息;
图像建立模块,用于根据所述图像获取模块所获取的所述图像信息,建立与所述视频场景对应的三维图像;
体征获取模块,用于获取所述图像建立模块所建立的所述三维图像中的人物的体征信息;
分类模块,用于根据所述体征获取模块所获取的体征信息,对所述视频场景中的人物进行年龄群体分类。
进一步地,所述装置还包括:
参数获取模块,用于对相对于所述视频场景位于不同拍摄角度的所述摄像机进行标定,获取每一摄像机的内部参数和外部参数。
进一步地,所述图像建立模块包括:
提取单元,用于提取所述图像信息中的特征点;
匹配单元,用于在不同角度拍摄的图像信息中,根据所述特征点进行立体特征匹配;
图像建立单元,用于根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与所述视频场景对应的三维图像。
进一步地,所述体征获取模块包括:
体征获取单元,用于获取所述三维图像中的人物的身高信息和肩宽信息;
其中,所述分类模块包括:
分类单元,用于根据获取的身高信息和肩宽信息,对所述视频场景中的人物进行年龄群体分类。
进一步地,所述体征获取单元包括:
确定子单元,用于确定所述三维图像中的人物的轮廓信息;
第一处理子单元,用于根据确定的轮廓信息,用矩形框框出所述三维图像中的人物;
第一计算子单元,用于计算所述矩形框的长度和宽度;
第二处理子单元,用于将所述矩形框的长度确定为人物的身高信息,将所述矩形框的宽度确定为人物的肩宽信息。
进一步地,所述分类模块包括:
第一处理单元,用于将获取的体征信息输入预设的多级分类器;
决策单元,用于根据所述多级分类器的输出结果,确定每一体征信息所属的年龄群体。
进一步地,所述装置还包括:
构建模块,用于构建所述多级分类器。
进一步地,所述构建模块包括:
样本获取单元,用于从所述三维图像中获取样本信息,其中样本信息包括:所述三维图像中的人物的体征信息和部分物体的形态信息;
权重分配单元,用于分配每一样本信息相同的权重值;
第二处理单元,用于将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练;
第三处理单元,用于根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值;
构建单元,用于将完成分类训练的多个基础分类器构建成多级强分类器。
进一步地,所述第二处理单元包括:
第二计算子单元,用于根据预设公式:N=c×(c-1)/2,计算所述多级分类器中的基础分类器的数量;
其中,N表示基础分类器的数量,c表示年龄群体分类的数量;
第三处理子单元,用于将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练,其中每一基础分类器能够分类出两种年龄群体。
本发明的有益效果是:
上述技术方案,利用摄像机拍摄的二维图像进行三维重建,在建立的三维图像中获取人物的体征信息,并根据获取的体征信息对视频场景中的人物进行年龄群体分类,由于重建技术能较好的复原原始图像,较为精确,并且能够适应镜头角度的变化,因此能够在建立三维图像中,获取到更加精确的体征信息,从而提高年龄群体分类的准确性。
附图说明
图1表示本发明第一实施例提供的年龄群体分类的方法的流程图;
图2表示本发明第一实施例提供的三维图像建立方法的流程图;
图3表示本发明第一实施例提供的身高和肩宽信息获取方法的流程图;
图4表示本发明第一实施例提供的构建多级分类器的方法的流程图;
图5表示本发明第一实施例提供的多级分类器构建过程结构图;
图6表示本发明第二实施例提供的年龄群体分类的装置的流程图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
第一实施例
本发明实施例提供了一种年龄群体分类的方法,如图1所示,包括:
S101、获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息。
其中,在一视频场景中可根据实际需求布置一个或多个摄像机,以采集视频场景不同角度的图像信息。摄像机可以是单目摄像机也可以是多目摄像机,摄像机的镜头可以是可转动形式,也可以是不可转动形式,具体情况均可根据实际需求选择。
S102、根据图像信息,建立与视频场景对应的三维图像。
本发明实施例中可实时根据摄像机拍摄的二维图像信息,建立动态的三维图像,及时性好,能够准确的从三维图像中获悉视频场景中的信息。
S103、获取三维图像中的人物的体征信息。
其中,这里所述的体征信息种类的选择和数量可以根据年龄群体分类的需求确定,凡是能够进行区分人物年龄的体征信息均在本发明实施例的保护范围内。
S104、根据获取的体征信息,对视频场景中的人物进行年龄群体分类。
在获取到体征信息后,根据体征信息对视频场景中的人物进行年龄群体分类。
本发明实施例中,利用摄像机拍摄的二维图像进行三维重建,在建立的三维图像中获取人物的体征信息,并根据获取的体征信息对视频场景中的人物进行年龄群体分类,由于重建技术能较好的复原原始图像,较为精确,并且能够适应镜头角度的变化,因此能够在建立三维图像中,获取到更加精确的体征信息,从而提高年龄群体分类的准确性。
优选地,本发明实施例中采用多个摄像机获取视频场景的图像信息,多个镜头分别布置于视频场景中的不同方位,从而提高图像信息的准确性和拍摄效率。其中,在利用摄像机拍摄的图像信息进行三维重建之前,还需对相对于视频场景位于不同拍摄角度的摄像机进行标定,获取每一摄像机的内部参数和外部参数,还原摄像机的图像坐标系和世界坐标系的对应关系。其中内部参数包括:焦距、成像原点和畸变系数,外部参数包括:光学特征参数矩阵和平移矩阵。
其中,摄像机标定的过程为:首先准备一份棋盘格的样本,在棋盘格上标定特征点,本发明实施例中可采用红色的直径为1cm的实心圆点标注。多个镜头在不同角度下依次采集若干张样本图像,通过霍夫圆检测算法,提取样本图像中每个特征点的轮廓,拟合为圆形,并定位出每个圆形的圆心,以确定的圆心作为对应于三维世界中棋盘格样本上标注的特征点,从而计算出摄像机的内部参数和外部参数。其中,在标定时还需进行校正操作,降低摄像机镜头的畸变参数对拍摄图像质量的影响,减小拍摄图像的失真,提高显示画面的真实性。
进一步地,如图2所示,在根据摄像机拍摄的图像信息,建立与视频场景对应的三维图像的过程包括:
S201、提取图像信息中的特征点。
其中,特征点的选择可根据实际需求确定。
S202、在不同角度拍摄的图像信息中,根据提取的特征点进行立体特征匹配。
其中,可采用shift特征匹配算法进行立体特征匹配。
S203、根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与视频场景对应的三维图像。
优选地,本发明实施例中所要获取的体征信息为人物的身高信息和肩宽信息。具有国际儿童和成人的身高肩宽作为参考数据,因此通过身高和肩宽信息进行年龄群体分类有较好的依据,方案的实用性和可扩展性较好。
其中,如图3所示,获取三维图像中的人物的身高信息和肩宽信息的实现方法包括:
S301、确定三维图像中的人物的轮廓信息。
在建立三维图像后,对三维图像进行目标检测和特征提取,以将人体轮廓信息提取出来。
其中,可通过背景差分法,对多帧图像信息进行自适应背景学习,获得参考背景,然后根据参考背景,采用图像分割算法,对后续的图像信息进行分割处理,提取差异目标特征,对差异目标特征做Gabor滤波处理,排除差异目标特征在过滤范围内的图像信息,通过shift跟踪算法对图像信息进行差异目标特征的运动匹配跟踪,当持续存在差异目标特征的图像信息的帧数超过预设帧数时,将其标记为有效确定的目标(即人物)。
S302、根据确定的轮廓信息,用矩形框框出三维图像中的人物。
在确定人体轮廓信息后,用矩形框框住确定的人体轮廓,并对框住的人物进行目标跟踪,并根据人物形态的变化实时调整矩形框的形状。若矩形框框住的人物消失在图像中,则放弃对该人物的身高和肩宽信息的获取。
S303、计算矩形框的长度和宽度。
S304、将矩形框的长度确定为人物的身高,将矩形框的宽度确定为人物的肩宽。
进一步地,在获取到的体征信息后,可将体征信息输入预设的多级分类器,并根据多级分类器的输出结果,确定每一体征信息所属的年龄群体。
其中,这里所述的预设的多级分类器为预先训练好的分类器,是由多个弱分类级联构成的多级强分类,能够更准确的对体征信息进行分类。
因此,在将获取的体征信息输入预设的多级分类器的步骤之前,还需构建多级分类器。其中,构建多级分类器的步骤包括:
S401、从三维图像中获取样本信息。
其中,样本信息包括:三维图像中的人物的体征信息(即正样本)和部分物体的形态信息(即负样本),通过增加负样本信息,可提高分类器训练的准确性。
S402、分配每一样本信息相同的权重值。
在开始构建多级分类器,首先对每一样本信息分配相同的权重值,如若存在N个样本信息,则每一个样本信息的权重值为1/N,也就是每个样本都具有相同的话语权。
S403、将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练。
在对每一样本信息分配权重值之后,将样本信息依次输入多个基础分类器重进行分类训练,以构建多级分类器。
S404、根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值。
本发明实施例主要采用Adaboost算法,进行分类器的训练,其中,每个基础分类器经过样本信息进行分类训练后,会产生一个分类结果,对于分类准确的样本信息,降低其权重值,对于分类错误的样本信息,增加其权重值,然后将重新分配权重值的样本信息输入下一个基础分类器进行训练,如图5所示。同时计算完成分类训练的基础分类器的分类误差值,根据分类误差值,计算该基础分类器的权重值,一般分类误差值越小,计算得到的权重值越大。
S405、将完成分类训练的多个基础分类器构建成多级强分类器。
当全部基础分类器完成训练后,每一基础分类器均会被分配一权重值,所有基础分类器级联在一起,构成多级强分类器。
进一步地,本发明实施例中年龄群组包括:年龄段在0~7岁的幼儿组,在8~17岁的少年组、年龄段在18~30岁的青年组、年龄段在31~45岁的中青年组、年龄段在46~60岁的中年组以及年龄段在60岁以上的老年组,共6个分组。其中,实施年龄群组分类的过程,就是识别出三维图像中的人物归属于上面哪一个年龄群组。
其中,强分类器中的基础分类器的数量,可根据年龄群组的数据进行计算,即根据预设公式:N=c×(c-1)/2,计算多级分类器中的基础分类器的数量。
其中,N表示基础分类器的数量,c表示年龄群体分类的数量。例如本发明实施例中共有6个年龄群体分组,那么需要的基础分类器的数量为15。当进行分类器训练时,将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练,其中每一基础分类器能够分类出两种年龄群体。一般情况下,每个基础分类器分类出的两个年龄群体不同于其他基础分类器所分类处的两个年龄群体。
综上所述,本发明实施例提供的技术方案,利用标定过的摄像机拍摄的二维图像进行三维重建,在建立的三维图像中获取人物的体征信息,并根据获取的体征信息对视频场景中的人物进行年龄群体分类,由于重建技术能较好的复原原始图像,较为精确,并且能够适应镜头角度的变化,因此能够在建立三维图像中,获取到更加精确的体征信息,从而提高年龄群体分类的准确性。
第二实施例
本发明实施例提供了一种年龄群体分类的装置,如图6所示,该装置包括:
图像获取模块601,用于获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息。
其中,在一视频场景中可根据实际需求布置一个或多个摄像机,以采集视频场景不同角度的图像信息。摄像机可以是单目摄像机也可以是多目摄像机,摄像机的镜头可以是可转动形式,也可以是不可转动形式,具体情况均可根据实际需求选择。
图像建立模块602,用于根据图像获取模块601所获取的图像信息,建立与视频场景对应的三维图像。
本发明实施例中可实时根据摄像机拍摄的二维图像信息,建立动态的三维图像,及时性好,能够准确的从三维图像中获悉视频场景中的信息。
体征获取模块603,用于获取图像建立模块602所建立的三维图像中的人物的体征信息。
其中,这里所述的体征信息种类的选择和数量可以根据年龄群体分类的需求确定,凡是能够进行区分人物年龄的体征信息均在本发明实施例的保护范围内。
分类模块604,用于根据体征获取模块603所获取的体征信息,对视频场景中的人物进行年龄群体分类。
在获取到体征信息后,根据体征信息对视频场景中的人物进行年龄群体分类。
进一步地,该装置还包括:
参数获取模块,用于对相对于视频场景位于不同拍摄角度的摄像机进行标定,获取每一摄像机的内部参数和外部参数。
本发明实施例中采用多个摄像机获取视频场景的图像信息,多个镜头分别布置于视频场景中的不同方位,从而提高图像信息的准确性和拍摄效率。
其中内部参数包括:焦距、成像原点和畸变系数,外部参数包括:光学特征参数矩阵和平移矩阵。
其中,摄像机标定的过程为:首先准备一份棋盘格的样本,在棋盘格上标定特征点,本发明实施例中可采用红色的直径为1cm的实心圆点标注。多个镜头在不同角度下依次采集若干张样本图像,通过霍夫圆检测算法,提取样本图像中每个特征点的轮廓,拟合为圆形,并定位出每个圆形的圆心,以确定的圆心作为对应于三维世界中棋盘格样本上标注的特征点,从而计算出摄像机的内部参数和外部参数。其中,在标定时还需进行校正操作,降低摄像机镜头的畸变参数对拍摄图像质量的影响,减小拍摄图像的失真,提高显示画面的真实性。
进一步地,该图像建立模块包括:
提取单元,用于提取图像信息中的特征点。
其中,特征点的选择可根据实际需求确定。
匹配单元,用于在不同角度拍摄的图像信息中,根据特征点进行立体特征匹配。
其中,可采用shift特征匹配算法进行立体特征匹配。
图像建立单元,用于根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与视频场景对应的三维图像。
进一步地,该体征获取模块包括:
体征获取单元,用于获取三维图像中的人物的身高信息和肩宽信息。
其中,该分类模块包括:
分类单元,用于根据获取的身高信息和肩宽信息,对视频场景中的人物进行年龄群体分类。
本发明实施例中所要获取的体征信息为人物的身高信息和肩宽信息。具有国际儿童和成人的身高肩宽作为参考数据,因此通过身高和肩宽信息进行年龄群体分类有较好的依据,方案的实用性和可扩展性较好。
进一步地,该体征获取单元包括:
确定子单元,用于确定三维图像中的人物的轮廓信息。
在建立三维图像后,对三维图像进行目标检测和特征提取,以将人体轮廓信息提取出来。
其中,可通过背景差分法,对多帧图像信息进行自适应背景学习,获得参考背景,然后根据参考背景,采用图像分割算法,对后续的图像信息进行分割处理,提取差异目标特征,对差异目标特征做Gabor滤波处理,排除差异目标特征在过滤范围内的图像信息,通过shift跟踪算法对图像信息进行差异目标特征的运动匹配跟踪,当持续存在差异目标特征的图像信息的帧数超过预设帧数时,将其标记为有效确定的目标(即人物)。
第一处理子单元,用于根据确定的轮廓信息,用矩形框框出三维图像中的人物。
在确定人体轮廓信息后,用矩形框框住确定的人体轮廓,并对框住的人物进行目标跟踪,并根据人物形态的变化实时调整矩形框的形状。若矩形框框住的人物消失在图像中,则放弃对该人物的身高和肩宽信息的获取。
第一计算子单元,用于计算矩形框的长度和宽度。
第二处理子单元,用于将矩形框的长度确定为人物的身高,将矩形框的宽度确定为人物的肩宽。
进一步地,该分类模块包括:
第一处理单元,用于将获取的体征信息输入预设的多级分类器。
决策单元,用于根据多级分类器的输出结果,确定每一体征信息所属的年龄群体。
在获取到的体征信息后,可将体征信息输入预设的多级分类器,并根据多级分类器的输出结果,确定每一体征信息所属的年龄群体。
其中,这里所述的预设的多级分类器为预先训练好的分类器,是由多个弱分类级联构成的多级强分类,能够更准确的对体征信息进行分类。
进一步的,所该装置还包括:
构建模块,用于构建多级分类器。
在将获取的体征信息输入预设的多级分类器的步骤之前,还需构建多级分类器。
进一步地,该构建模块包括:
样本获取单元,用于从三维图像中获取样本信息。
其中,样本信息包括:三维图像中的人物的体征信息(即正样本)和部分物体的形态信息(即负样本),通过增加负样本信息,可提高分类器训练的准确性。
权重分配单元,用于分配每一样本信息相同的权重值。
在开始构建多级分类器,首先对每一样本信息分配相同的权重值,如若存在N个样本信息,则每一个样本信息的权重值为1/N,也就是每个样本都具有相同的话语权。
第二处理单元,用于将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练。
在对每一样本信息分配权重值之后,将样本信息依次输入多个基础分类器重进行分类训练,以构建多级分类器。
第三处理单元,用于根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值。
本发明实施例主要采用Adaboost算法,进行分类器的训练,其中,每个基础分类器经过样本信息进行分类训练后,会产生一个分类结果,对于分类准确的样本信息,降低其权重值,对于分类错误的样本信息,增加其权重值,然后将重新分配权重值的样本信息输入下一个基础分类器进行训练,如图5所示。同时计算完成分类训练的基础分类器的分类误差值,根据分类误差值,计算该基础分类器的权重值,一般分类误差值越小,计算得到的权重值越大。
构建单元,用于将完成分类训练的多个基础分类器构建成多级强分类器。
当全部基础分类器完成训练后,每一基础分类器均会被分配一权重值,所有基础分类器级联在一起,构成多级强分类器。
进一步地,该第二处理单元包括:
第二计算子单元,用于根据预设公式:N=c×(c-1)/2,计算多级分类器中的基础分类器的数量。
其中,N表示基础分类器的数量,c表示年龄群体分类的数量。例如本发明实施例中共有6个年龄群体分组,那么需要的基础分类器的数量为15。
第三处理子单元,用于将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练。
其中每一基础分类器能够分类出两种年龄群体。一般情况下,每个基础分类器分类出的两个年龄群体不同于其他基础分类器所分类处的两个年龄群体。
本发明实施例中年龄群组包括:年龄段在0~7岁的幼儿组,在8~17岁的少年组、年龄段在18~30岁的青年组、年龄段在31~45岁的中青年组、年龄段在46~60岁的中年组以及年龄段在60岁以上的老年组,共6个分组。其中,实施年龄群组分类的过程,就是识别出三维图像中的人物归属于上面哪一个年龄群组。
综上所述,本发明实施例提供的技术方案,利用标定过的摄像机拍摄的二维图像进行三维重建,在建立的三维图像中获取人物的体征信息,并根据获取的体征信息对视频场景中的人物进行年龄群体分类,由于重建技术能较好的复原原始图像,较为精确,并且能够适应镜头角度的变化,因此能够在建立三维图像中,获取到更加精确的体征信息,从而提高年龄群体分类的准确性。
需要说明的是,本发明实施例中的年龄群体分类的装置是与第一实施例中的年龄群体分类的方法的对应的装置,上述方法实施例中所有实现方式均适用于该装置的实施例中,也能达到相同的技术效果。
以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。

Claims (18)

1.一种年龄群体分类的方法,其特征在于,包括:
获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息;
根据所述图像信息,建立与所述视频场景对应的三维图像;
获取所述三维图像中的人物的体征信息;
根据获取的体征信息,对所述视频场景中的人物进行年龄群体分类。
2.根据权利要求1所述的方法,其特征在于,所述获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息的步骤之前,所述方法还包括:
对相对于所述视频场景位于不同拍摄角度的所述摄像机进行标定,获取每一摄像机的内部参数和外部参数。
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述图像信息,建立与所述视频场景对应的三维图像的步骤包括:
提取所述图像信息中的特征点;
在不同角度拍摄的图像信息中,根据所述特征点进行立体特征匹配;
根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与所述视频场景对应的三维图像。
4.根据权利要求1所述的方法,其特征在于,所述获取所述三维图像中的人物的体征信息的步骤包括:
获取所述三维图像中的人物的身高信息和肩宽信息;
其中,所述根据获取的体征信息,对所述视频场景中的人物进行年龄群体分类的步骤包括:
根据获取的身高信息和肩宽信息,对所述视频场景中的人物进行年龄群体分类。
5.根据权利要求4所述的方法,其特征在于,所述获取所述三维图像中的人物的身高信息和肩宽信息的步骤包括:
确定所述三维图像中的人物的轮廓信息;
根据确定的轮廓信息,用矩形框框出所述三维图像中的人物;
计算所述矩形框的长度和宽度;
将所述矩形框的长度确定为人物的身高信息,将所述矩形框的宽度确定为人物的肩宽信息。
6.根据权利要求1所述的方法,其特征在于,所述根据获取的体征信息,对所述视频场景中人物的年龄群体进行分类的步骤包括:
将获取的体征信息输入预设的多级分类器;
根据所述多级分类器的输出结果,确定每一体征信息所属的年龄群体。
7.根据权利要求6所述的方法,其特征在于,在所述将获取的体征信息输入预设的多级分类器的步骤之前,所述方法还包括:
构建所述多级分类器。
8.根据权利要求7所述的方法,其特征在于,所述构建所述多级分类器的步骤包括:
从所述三维图像中获取样本信息,其中样本信息包括:所述三维图像中的人物的体征信息和部分物体的形态信息;
分配每一样本信息相同的权重值;
将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练;
根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值;
将完成分类训练的多个基础分类器构建成多级强分类器。
9.根据权利要求8所述的方法,其特征在于,所述将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练的步骤包括:
根据预设公式:N=c×(c-1)/2,计算所述多级分类器中的基础分类器的数量;
其中,N表示基础分类器的数量,c表示年龄群体分类的数量;
将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练,其中每一基础分类器能够分类出两种年龄群体。
10.一种年龄群体分类的装置,其特征在于,包括:
图像获取模块,用于获取至少一摄像机在预定时间段内拍摄的一视频场景的图像信息;
图像建立模块,用于根据所述图像获取模块所获取的所述图像信息,建立与所述视频场景对应的三维图像;
体征获取模块,用于获取所述图像建立模块所建立的所述三维图像中的人物的体征信息;
分类模块,用于根据所述体征获取模块所获取的体征信息,对所述视频场景中的人物进行年龄群体分类。
11.根据权利要求10所述的装置,其特征在于,所述装置还包括:
参数获取模块,用于对相对于所述视频场景位于不同拍摄角度的所述摄像机进行标定,获取每一摄像机的内部参数和外部参数。
12.根据权利要求10或11所述的装置,其特征在于,所述图像建立模块包括:
提取单元,用于提取所述图像信息中的特征点;
匹配单元,用于在不同角度拍摄的图像信息中,根据所述特征点进行立体特征匹配;
图像建立单元,用于根据立体特征匹配结果和每一图像信息对应的摄像机的内部参数和外部参数,建立与所述视频场景对应的三维图像。
13.根据权利要求10所述的装置,其特征在于,所述体征获取模块包括:
体征获取单元,用于获取所述三维图像中的人物的身高信息和肩宽信息;
其中,所述分类模块包括:
分类单元,用于根据获取的身高信息和肩宽信息,对所述视频场景中的人物进行年龄群体分类。
14.根据权利要求13所述的装置,其特征在于,所述体征获取单元包括:
确定子单元,用于确定所述三维图像中的人物的轮廓信息;
第一处理子单元,用于根据确定的轮廓信息,用矩形框框出所述三维图像中的人物;
第一计算子单元,用于计算所述矩形框的长度和宽度;
第二处理子单元,用于将所述矩形框的长度确定为人物的身高信息,将所述矩形框的宽度确定为人物的肩宽信息。
15.根据权利要求10所述的装置,其特征在于,所述分类模块包括:
第一处理单元,用于将获取的体征信息输入预设的多级分类器;
决策单元,用于根据所述多级分类器的输出结果,确定每一体征信息所属的年龄群体。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
构建模块,用于构建所述多级分类器。
17.根据权利要求16所述的装置,其特征在于,所述构建模块包括:
样本获取单元,用于从所述三维图像中获取样本信息,其中样本信息包括:所述三维图像中的人物的体征信息和部分物体的形态信息;
权重分配单元,用于分配每一样本信息相同的权重值;
第二处理单元,用于将分配有权重值的样本信息依次输入多个基础分类器中进行分类训练;
第三处理单元,用于根据每一基础分类器输出的分类结果,重新调整每一样本信息的权重值,并输入下一基础分类器中进行分类训练;以及根据每一基础分类器输出的分类结果,计算每一基础分类器的分类误差值,并根据分类误差值的大小,计算每一基础分类器权重值;
构建单元,用于将完成分类训练的多个基础分类器构建成多级强分类器。
18.根据权利要求17所述的装置,其特征在于,所述第二处理单元包括:
第二计算子单元,用于根据预设公式:N=c×(c-1)/2,计算所述多级分类器中的基础分类器的数量;
其中,N表示基础分类器的数量,c表示年龄群体分类的数量;
第三处理子单元,用于将分配有权重值的样本信息依次输入N个基础分类器中进行分类训练,其中每一基础分类器能够分类出两种年龄群体。
CN201610711538.2A 2016-08-23 2016-08-23 一种年龄群体分类的方法及装置 Pending CN107766782A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201610711538.2A CN107766782A (zh) 2016-08-23 2016-08-23 一种年龄群体分类的方法及装置
PCT/CN2017/087184 WO2018036241A1 (zh) 2016-08-23 2017-06-05 一种年龄群体分类的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610711538.2A CN107766782A (zh) 2016-08-23 2016-08-23 一种年龄群体分类的方法及装置

Publications (1)

Publication Number Publication Date
CN107766782A true CN107766782A (zh) 2018-03-06

Family

ID=61245445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610711538.2A Pending CN107766782A (zh) 2016-08-23 2016-08-23 一种年龄群体分类的方法及装置

Country Status (2)

Country Link
CN (1) CN107766782A (zh)
WO (1) WO2018036241A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829454A (zh) * 2019-01-17 2019-05-31 柳州康云互联科技有限公司 一种基于预训练标识的图像特征采集方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11373063B2 (en) * 2018-12-10 2022-06-28 International Business Machines Corporation System and method for staged ensemble classification
JP7204596B2 (ja) * 2019-06-28 2023-01-16 富士フイルム株式会社 画像処理装置,画像処理方法,画像処理プログラムおよびそのプログラムを格納した記録媒体

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080109397A1 (en) * 2002-07-29 2008-05-08 Rajeev Sharma Automatic detection and aggregation of demographics and behavior of people
US7848548B1 (en) * 2007-06-11 2010-12-07 Videomining Corporation Method and system for robust demographic classification using pose independent model from sequence of face images
CN104112209A (zh) * 2013-04-16 2014-10-22 苏州和积信息科技有限公司 显示终端的受众统计方法和系统
CN104408412A (zh) * 2014-11-20 2015-03-11 苏州福丰科技有限公司 一种用于保险柜的三维人脸识别方法
CN104537353A (zh) * 2015-01-07 2015-04-22 深圳市唯特视科技有限公司 基于三维点云的三维人脸年龄分类装置及方法
CN104915000A (zh) * 2015-05-27 2015-09-16 天津科技大学 用于裸眼3d广告的多感知生物识别交互方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102496001B (zh) * 2011-11-15 2015-02-25 无锡港湾网络科技有限公司 一种视频监控目标自动检测的方法和系统
CN102697508B (zh) * 2012-04-23 2013-10-16 中国人民解放军国防科学技术大学 采用单目视觉的三维重建来进行步态识别的方法
CN102930454A (zh) * 2012-10-07 2013-02-13 乐配(天津)科技有限公司 基于多感知技术的智能3d广告推荐方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080109397A1 (en) * 2002-07-29 2008-05-08 Rajeev Sharma Automatic detection and aggregation of demographics and behavior of people
US7848548B1 (en) * 2007-06-11 2010-12-07 Videomining Corporation Method and system for robust demographic classification using pose independent model from sequence of face images
CN104112209A (zh) * 2013-04-16 2014-10-22 苏州和积信息科技有限公司 显示终端的受众统计方法和系统
CN104408412A (zh) * 2014-11-20 2015-03-11 苏州福丰科技有限公司 一种用于保险柜的三维人脸识别方法
CN104537353A (zh) * 2015-01-07 2015-04-22 深圳市唯特视科技有限公司 基于三维点云的三维人脸年龄分类装置及方法
CN104915000A (zh) * 2015-05-27 2015-09-16 天津科技大学 用于裸眼3d广告的多感知生物识别交互方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109829454A (zh) * 2019-01-17 2019-05-31 柳州康云互联科技有限公司 一种基于预训练标识的图像特征采集方法

Also Published As

Publication number Publication date
WO2018036241A1 (zh) 2018-03-01

Similar Documents

Publication Publication Date Title
CN108985181B (zh) 一种基于检测分割的端对端人脸标注方法
CN104134234B (zh) 一种全自动的基于单幅图像的三维场景构建方法
CN110348445A (zh) 一种融合空洞卷积和边缘信息的实例分割方法
CN108090960A (zh) 一种基于几何约束的目标重建方法
CN104063702B (zh) 一种基于遮挡修复和局部相似性匹配的三维步态识别方法
CN108830252A (zh) 一种融合全局时空特征的卷积神经网络人体动作识别方法
CN108960404B (zh) 一种基于图像的人群计数方法及设备
CN107423678A (zh) 一种提取特征的卷积神经网络的训练方法及人脸识别方法
CN108681700B (zh) 一种复杂行为识别方法
CN106228528B (zh) 一种基于决策图与稀疏表示的多聚焦图像融合方法
CN109543695A (zh) 基于多尺度深度学习的泛密度人群计数方法
CN106127137A (zh) 一种基于3d轨迹分析的目标检测识别算法
CN106530310B (zh) 一种基于人体头顶部识别的行人统计方法及装置
CN110738161A (zh) 一种基于改进生成式对抗网络的人脸图像矫正方法
CN107944437B (zh) 一种基于神经网络和积分图像的人脸定位方法
CN104504365A (zh) 视频序列中的笑脸识别系统及方法
CN102034247B (zh) 一种基于背景建模对双目视觉图像的运动捕捉方法
CN108573222A (zh) 基于循环对抗生成网络的行人图像遮挡检测方法
CN104182970B (zh) 一种基于摄影构图规则的留念照人像站位推荐方法
CN110827312B (zh) 一种基于协同视觉注意力神经网络的学习方法
CN103035013A (zh) 一种基于多特征融合的精确运动阴影检测方法
CN110110682A (zh) 遥感图像的语义立体重构方法
CN108154104A (zh) 一种基于深度图像超像素联合特征的人体姿态估计方法
CN109712247B (zh) 基于混合现实技术的实景训练系统
CN103824272A (zh) 基于k近邻重识别的人脸超分辨率重建方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination