CN107609108A - 一种基于号码牌识别和人脸识别的运动员照片分拣方法 - Google Patents
一种基于号码牌识别和人脸识别的运动员照片分拣方法 Download PDFInfo
- Publication number
- CN107609108A CN107609108A CN201710820179.9A CN201710820179A CN107609108A CN 107609108 A CN107609108 A CN 107609108A CN 201710820179 A CN201710820179 A CN 201710820179A CN 107609108 A CN107609108 A CN 107609108A
- Authority
- CN
- China
- Prior art keywords
- face
- photo
- file
- feature
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
Abstract
一种基于号码牌识别和人脸识别的运动员照片分拣方法,包括如下步骤:1)对比赛过程中运动员的照片集进行预处理;2)采用人脸识别算法对照片集进行分拣,每人一个文件夹Si,其中,i=1,2,3,…,N,N为照片集可人脸分拣的运动员数量,对于无法以人脸进行分拣的照片放入文件夹Sort_F中;3)分别对步骤2)得到的文件夹Si中的照片进行号码牌识别,综合多个识别结果,将对应文件夹重命名为对应号码;4)对步骤2)中文件夹Sort_F中的照片进行号码牌识别,将识别出来的照片放入对应号码的文件夹中。本发明提供了一种识别效率高、鲁棒性强、识别率高的基于号码牌识别和人脸识别的运动员照片分拣方法。
Description
技术领域
本发明涉及深度学习、图像处理、模式识别、目标识别等技术领域,尤其是一种针对拍摄到的大量运动员照片,实现人脸识别与号码牌识别相结合的图像分拣方法,该方法适用于各类大小赛事,例如运动会、马拉松等。
背景技术
随着生活质量的提高,国民更加注重体质健康问题,全民健身文化得到了广泛传播。马拉松作为一个城市性的体育活动,可以全民参加,同时马拉松赛事的举办有助于城市宣传。因此,近年来,马拉松比赛得到了全面推广,参赛人数也逐年递增。参赛选手对于比赛过程中拍摄到的个人照片极为关注,然而赛事主办方普遍存在图像分拣技术不足的情况,一般采用一些简单技术手段辅助以人工分拣进行,效率较低,无法满足运动员需求。人脸和号码牌是运动员的重要标识,专利“一种基于支持向量机的号码牌识别201610319459.7”和专利“基于运动员号码识别的马拉松比赛照片管理方法201610878963.0”提出了号码牌识别的相关方法,其方法以颜色、形状特征或以全局扫描找寻数字字符的形式进行号码牌定位和识别,容易造成定位不准确、识别精度不高的情况;此外,由于号码牌是非刚性的,会产生不同程度的形变,运动员跑步过程中也会对其造成不同形式的遮挡,仅依赖号码牌对比赛照片进行筛选易产生大量无法准确分拣的照片。
发明内容
为了克服已有运动员照片分拣方式的人工分类速度慢,效率低,单一形式的分拣方式识别率较低的不足,本发明提供了一种识别效率高、鲁棒性强、识别率高的基于号码牌识别和人脸识别的运动员照片分拣方法;同时,为了适应复杂环境下多号码牌定位及号码牌出现的扭曲、遮挡等情况,字符分割难度较大、识别精度低等问题,本发明提供了一种CNN与RNN相结合的号码牌定位和识别方法。
本发明解决其技术问题所采用的技术方案是:
一种基于号码牌识别和人脸识别的运动员照片分拣方法,所述分拣方法包括如下步骤:
1)对比赛过程中拍摄到的运动员照片集进行预处理,得到Imgt,其中t=1,2,3,...,T,T为照片总量;
2)采用人脸识别算法对照片集进行分拣,每人一个文件夹Si,其中,i=1,2,3,...,N,N为照片集可人脸分拣的运动员数量,对于无法以人脸进行分拣的照片放入文件夹Sort_F中,过程如下:
2.1)采用基于深度学习的人脸识别算法对每张照片进行多人脸定位和特征提取,得到特征Fm,其中,m=1,2,3,...,M,M为照片集中提取到的人脸数目,并将相应人脸信息存放于数据库中;
2.2)分拣过程如下:
2.2.1)计算Fm与F1的相似度Simj,m=2,3,4,...,M,如若Simm>ThrS,其中,m=2,3,4,...,M,ThrS为人脸相似度阈值,则将Fm对应的图片拷贝入文件夹S1中,假定文件夹S1中图片数量为M1;
2.2.2)在剩余的M-M1个特征中选择一个特征与剩余的M-M1-1个特征进行相似度比较,将相似度大于阈值ThrS对应的图片拷贝入文件夹S2中;
2.2.3)依次对剩余照片进行分拣,最终得到文件夹S1,S2,S3,...,SN,并将无法以人脸进行分拣的照片拷贝入文件夹Sort_F中;
3)分别对步骤2)得到的文件夹Si中的照片进行号码牌识别,综合多个识别结果,将对应文件夹重命名为对应号码,过程如下:
3.1)对文件夹Si中的照片进行号码牌定位和号码牌识别;
3.2)对每个识别进行字符长度判断,舍弃长度异常的结果;
3.3)对剩余识别结果进行对比分析,得到置信度最高的识别结果,并将对应文件夹重命名为相应号码;
4)对步骤2)中文件夹Sort_F中的照片进行号码牌识别,将识别出来的照片放入对应号码的文件夹中。
进一步,所述步骤2)中人脸定位是采用级联卷积神经网络(CNN),网络同步进行是否为人脸的判定及人脸的关键点定位,根据关键点进行人脸归一化,得到归一化为118*118的人脸图片;而后使用28层残差网络进行特征提取。
再进一步,所述步骤3)和步骤4)中号码牌定位和识别过程为:
号码牌定位:①对输入图像以卷积神经网络(CNN)进行特征提取,得到特征模板(feature map)w×h×L,其中,w为feature map的宽,h为feature map的高,L为featuremap的个数;②使用3×3的滤波器对feature map进行滤波,每一行得到w×256的特征序列,将特征序列输入到双向长短时记忆单元(Bi-directional Long Short-time Memory,BLSTM),得到w×256特征,然后输入到512维全连接层,而后连接三个并行全连接层,其功能分别为上下边界回归,左右边界回归和类别信息;最终得到文本区域;③将步骤②中检测到的文本区域再次以分类器进行判断,得到输入图像中号码牌区域。
号码牌识别:号码牌字符识别中不进行字符分割,step1直接采用CNN的卷积层和池化层进行预处理,得到图像特征;step2以循环网络(Recurrent Neural Network,RNN)对特征进行序列预测;step3对步骤step2中的预测结果通过转换层得到最终的号码牌字符序列。
所述step2中,RNN采用深度多层双向长短时记忆单元(deep bidirectional LongShort-time Memory,DBLSTM)。
本发明的有益效果主要表现在:针对已有运动员照片分拣方式的人工分类速度慢,效率低,单一形式的分拣方式识别率较低等情况,本发明通过人脸识别与号码牌识别相结合的方法进行照片分拣;同时,为了适应复杂环境下多号码牌定位及号码牌出现的扭曲、遮挡等情况,字符分割难度较大的问题,本发明提供了一种CNN与RNN相结合的号码牌定位和识别方法。
附图说明
图1是本发明实现的流程图。
图2是号码牌定位方法流程图。
具体实施方式
下面结合附图对本发明作进一步描述,应当理解,此处所描述的实例仅用于说明和解释本发明,并不用于限定本发明。
参照图1和图2,一种基于号码牌识别和人脸识别的运动员照片分拣方法,包括如下步骤:
如图1所示,一种基于号码牌识别和人脸识别的运动员照片分拣方法,所述分拣方法主要包括基于人脸识别的图像分拣和基于号码牌识别的图像分拣,具体步骤如下:
1)对比赛过程中拍摄到的运动员照片集进行预处理(角度、方位校正等),得到Imgt,其中t=1,2,3,...,T,T为照片总量;
2)基于人脸识别的图像分拣,具体过程如下:
采用人脸识别算法对照片集进行分拣,每人一个文件夹Si,其中,i=1,2,3,...,N,N为照片集可人脸分拣的运动员数量,对于无法分拣的照片放入文件夹Sort_F中;
2.1)所述步骤2.1)中人脸识别过程具体如下:采用级联卷积神经网络(CNN)对步骤1)中的所有照片进行人脸定位,CNN在人脸定位过程中同步进行人脸的关键点定位,并根据关键点信息对人脸进行归一化处理,得到大小为118*118的人脸图片;而后使用28层残差网络进行特征提取,得到特征Fm(其中,m=1,2,3,...,M,M为照片集中提取到的人脸数目)并将相应人脸信息存放于数据库中;
2.2)分拣过程如下:
2.2.1)计算Fm(m=2,3,4,...,M)与F1的相似度Simm,如若Simm>ThrS(其中,m=2,3,4,...,M,ThrS为人脸相似度阈值),则将Fm对应的图片拷贝入文件夹S1中,假定文件夹S1中图片数量为M1;
2.2.2)在剩余的M-M1个特征中选择一个特征与剩余的M-M1-1个特征进行相似度比较,类似于步骤2.2.1)将相似度大于阈值ThrS对应的图片拷贝入文件夹S2中;
2.2.3)类似于步骤2.2.2)依次对剩余照片进行分拣,最终得到文件夹S1,S2,S3,...,SN,并将无法分拣的照片拷贝入文件夹Sort_F中;
3)基于号码牌识别的进一步分拣和文件夹管理
3.1)分别对步骤2)得到的文件夹Si中的照片进行号码牌定位和号码牌识别
3.1.1)由于号码牌中字符为一个序列,在同一文本线上,而同一文本线上不同字符之间是存在联系的,充分考虑RNN对序列特征识别的优势,本发明号码牌定位和识别均采用CNN与RNN相结合的方法,此方法对于号码牌形变、款式、颜色等均有很强的鲁棒性,同时可以有效提高检测精度。如图2所示,号码牌定位包括:①对输入图像以卷积神经网络(CNN)进行深度语义特征提取,得到特征模板(feature map)w×h×L(其中,w为feature map的宽,h为feature map的高,L为feature map的个数),此过程中剔除CNN中的全连接层;②使用3×3的滤波器对feature map进行滤波,每一行得到w×256的特征序列,将特征序列输入到双向长短时记忆单元(Bi-directional Long Short-time Memory,BLSTM,此为RNN的一种网络类别),得到w×256特征,然后输入到512维全连接层fc1,而后连接三个并行全连接层fc2,其功能分别为上下边界回归,左右边界回归和类别信息;最终得到文本区域;③将步骤②中检测到的文本区域再次以分类器进行二分类判断,得到输入图像中号码牌区域;
3.1.2)号码牌识别:类似于号码牌定位的思想,识别亦以RNN与CNN相结合的方法进行,不同之处在于,识别过程中的CNN网络结构、RNN网络结构和类型与定位过程是不一样的。由于号码牌的形变会导致号码字符粘连,这对字符分割造成了极大的挑战,而字符分割的效果又直接影响到识别效果,受益于CNN强大的特征学习能力和RNN的字符序列识别能力,本发明在号码牌识别过程中不进行字符分割,step1直接采用CNN的卷积层和池化层进行预处理,提取图像特征;step2以循环网络(Recurrent Neural Network,RNN)对特征进行序列预测;step3对步骤step2中的预测结果通过转换层得到最终的号码牌字符序列。所述步骤step2中RNN采用深度多层双向长短时记忆单元(deep bidirectional Long Short-time Memory,DBLSTM)
3.2)对每个识别结果进行字符长度判断,舍弃长度异常的结果;
3.3)对剩余识别结果进行对比分析,得到置信度最高的识别结果,并将对应文件夹重命名为相应号码;
4)对步骤2)中文件夹Sort_F中的照片进行如步骤3.1)描述的方法进行号码牌识别,将识别出来的照片放入对应号码的文件夹中。
Claims (4)
1.一种基于号码牌识别和人脸识别的运动员照片分拣方法,其特征在于:所述分拣方法包括如下步骤:
1)对比赛过程中拍摄到的运动员照片集进行预处理,得到Imgt,其中t=1,2,3,...,T,T为照片总量;
2)采用人脸识别算法对照片集进行分拣,每人一个文件夹Si,其中,i=1,2,3,...,N,N为照片集可人脸分拣的运动员数量,对于无法以人脸进行分拣的照片放入文件夹Sort_F中,过程如下:
2.1)采用基于深度学习的人脸识别算法对每张照片进行多人脸定位和特征提取,得到特征Fm,其中,m=1,2,3,...,M,M为照片集中提取到的人脸数目,并将相应人脸信息存放于数据库中;
2.2)分拣过程如下:
2.2.1)计算Fm与F1的相似度Simm,m=2,3,4,...,M,如若Simm>ThrS,其中,ThrS为人脸相似度阈值,则将Fm对应的图片拷贝入文件夹S1中,假定文件夹S1中图片数量为M1;
2.2.2)在剩余的M-M1个特征中选择一个特征与剩余的M-M1-1个特征进行相似度比较,将相似度大于阈值ThrS对应的图片拷贝入文件夹S2中;
2.2.3)依次对剩余照片进行分拣,最终得到文件夹S1,S2,S3,...,SN,并将无法以人脸进行分拣的照片拷贝入文件夹Sort_F中;
3)分别对步骤2)得到的文件夹Si中的照片进行号码牌识别,综合多个识别结果,将对应文件夹重命名为对应号码,过程如下:
3.1)对文件夹Si中的照片进行号码牌定位和号码牌识别;
3.2)对每个识别进行字符长度判断,舍弃长度异常的结果;
3.3)对剩余识别结果进行对比分析,得到置信度最高的识别结果,并将对应文件夹重命名为相应号码;
4)对步骤2)中文件夹Sort_F中的照片进行号码牌识别,将识别出来的照片放入对应号码的文件夹中。
2.如权利要求1所述的基于号码牌识别和人脸识别的运动员照片分拣方法,其特征在于:所述步骤2)中人脸定位是采用级联卷积神经网络,网络同步进行是否为人脸的判定及人脸的关键点定位,根据关键点进行人脸归一化,得到归一化为118*118的人脸图片;而后使用28层残差网络进行特征提取。
3.如权利要求1或2所述的基于号码牌识别和人脸识别的运动员照片分拣方法,其特征在于:所述步骤3)和步骤4)中号码牌定位和识别过程为:
号码牌定位:①对输入图像以卷积神经网络CNN进行特征提取,得到特征模板featuremap w×h×L,其中,w为feature map的宽,h为feature map的高,L为feature map的个数;②使用3×3的滤波器对feature map进行滤波,每一行得到w×256的特征序列,将特征序列输入到双向长短时记忆单元,得到w×256特征,然后输入到512维全连接层,而后连接三个并行全连接层,其功能分别为上下边界回归,左右边界回归和类别信息;最终得到文本区域;③将步骤②中检测到的文本区域再次以分类器进行判断,得到输入图像中号码牌区域;
号码牌识别:号码牌字符识别中不进行字符分割,step1直接采用CNN的卷积层和池化层进行预处理,提取图像特征;step2以循环网络RNN对特征进行序列预测;step3对步骤step2中的预测结果通过转换层得到最终的号码牌字符序列。
4.如权利要求3所述的基于号码牌识别和人脸识别的运动员照片分拣方法,其特征在于:所述step2中,RNN采用深度多层双向长短时记忆单元。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710820179.9A CN107609108A (zh) | 2017-09-13 | 2017-09-13 | 一种基于号码牌识别和人脸识别的运动员照片分拣方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710820179.9A CN107609108A (zh) | 2017-09-13 | 2017-09-13 | 一种基于号码牌识别和人脸识别的运动员照片分拣方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107609108A true CN107609108A (zh) | 2018-01-19 |
Family
ID=61063212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710820179.9A Pending CN107609108A (zh) | 2017-09-13 | 2017-09-13 | 一种基于号码牌识别和人脸识别的运动员照片分拣方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609108A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537226A (zh) * | 2018-03-06 | 2018-09-14 | 北京邮电大学 | 一种车牌识别方法和装置 |
CN108875667A (zh) * | 2018-06-27 | 2018-11-23 | 北京字节跳动网络技术有限公司 | 目标识别方法、装置、终端设备和存储介质 |
CN109063536A (zh) * | 2018-06-01 | 2018-12-21 | 浙江理工大学 | 一种反射式舞台人员身份识别方法 |
CN109299717A (zh) * | 2018-09-13 | 2019-02-01 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN110188216A (zh) * | 2019-05-24 | 2019-08-30 | 山西共致科技有限公司 | 一种具有文字识别的照片直播系统及其方法 |
CN111046886A (zh) * | 2019-12-12 | 2020-04-21 | 吉林大学 | 号码牌自动识别方法、装置、设备及计算机可读存储介质 |
CN111160094A (zh) * | 2019-11-26 | 2020-05-15 | 苏州方正璞华信息技术有限公司 | 一种跑步抓拍照片中选手识别方法及装置 |
CN111401313A (zh) * | 2020-04-10 | 2020-07-10 | 深圳新致软件有限公司 | 体育参赛人员识别定位方法、系统以及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016158811A1 (ja) * | 2015-04-01 | 2016-10-06 | キヤノンイメージングシステムズ株式会社 | 画像処理装置、画像処理方法および画像処理システム |
CN106104577A (zh) * | 2014-03-07 | 2016-11-09 | 高通股份有限公司 | 照片管理 |
CN106650699A (zh) * | 2016-12-30 | 2017-05-10 | 中国科学院深圳先进技术研究院 | 一种基于卷积神经网络的人脸检测方法及装置 |
-
2017
- 2017-09-13 CN CN201710820179.9A patent/CN107609108A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106104577A (zh) * | 2014-03-07 | 2016-11-09 | 高通股份有限公司 | 照片管理 |
WO2016158811A1 (ja) * | 2015-04-01 | 2016-10-06 | キヤノンイメージングシステムズ株式会社 | 画像処理装置、画像処理方法および画像処理システム |
CN106650699A (zh) * | 2016-12-30 | 2017-05-10 | 中国科学院深圳先进技术研究院 | 一种基于卷积神经网络的人脸检测方法及装置 |
Non-Patent Citations (1)
Title |
---|
JUNJIE ZHANG ET AL.: "Multi-label Image Classification with Regional Latent Semantic Dependencies", 《ARXIV.ORG》 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108537226A (zh) * | 2018-03-06 | 2018-09-14 | 北京邮电大学 | 一种车牌识别方法和装置 |
CN109063536A (zh) * | 2018-06-01 | 2018-12-21 | 浙江理工大学 | 一种反射式舞台人员身份识别方法 |
CN108875667A (zh) * | 2018-06-27 | 2018-11-23 | 北京字节跳动网络技术有限公司 | 目标识别方法、装置、终端设备和存储介质 |
CN108875667B (zh) * | 2018-06-27 | 2021-03-02 | 北京字节跳动网络技术有限公司 | 目标识别方法、装置、终端设备和存储介质 |
CN109299717A (zh) * | 2018-09-13 | 2019-02-01 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN109299717B (zh) * | 2018-09-13 | 2021-08-17 | 网易(杭州)网络有限公司 | 文字识别模型建立及文字识别方法、装置、介质及设备 |
CN110188216A (zh) * | 2019-05-24 | 2019-08-30 | 山西共致科技有限公司 | 一种具有文字识别的照片直播系统及其方法 |
CN110188216B (zh) * | 2019-05-24 | 2021-09-24 | 山西共致科技有限公司 | 一种具有文字识别的照片直播系统及其方法 |
CN111160094A (zh) * | 2019-11-26 | 2020-05-15 | 苏州方正璞华信息技术有限公司 | 一种跑步抓拍照片中选手识别方法及装置 |
CN111046886A (zh) * | 2019-12-12 | 2020-04-21 | 吉林大学 | 号码牌自动识别方法、装置、设备及计算机可读存储介质 |
CN111401313A (zh) * | 2020-04-10 | 2020-07-10 | 深圳新致软件有限公司 | 体育参赛人员识别定位方法、系统以及设备 |
CN111401313B (zh) * | 2020-04-10 | 2022-10-11 | 深圳新致软件有限公司 | 体育参赛人员识别定位方法、系统以及设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107609108A (zh) | 一种基于号码牌识别和人脸识别的运动员照片分拣方法 | |
CN113011319B (zh) | 多尺度火灾目标识别方法及系统 | |
CN107330396B (zh) | 一种基于多属性和多策略融合学习的行人再识别方法 | |
CN107506702A (zh) | 基于多角度的人脸识别模型训练及测试系统及方法 | |
CN105095870B (zh) | 基于迁移学习的行人重识别方法 | |
CN109948425A (zh) | 一种结构感知自注意和在线实例聚合匹配的行人搜索方法及装置 | |
CN109801292A (zh) | 一种基于生成对抗网络的沥青公路裂缝图像分割方法 | |
CN104809481A (zh) | 一种基于自适应色彩聚类的自然场景文本检测的方法 | |
CN104463233B (zh) | 车标识别方法及车标识别装置 | |
CN111046886B (zh) | 号码牌自动识别方法、装置、设备及计算机可读存储介质 | |
CN106096538A (zh) | 基于定序神经网络模型的人脸识别方法及装置 | |
CN104504362A (zh) | 基于卷积神经网络的人脸检测方法 | |
CN105956626A (zh) | 基于深度学习的对车牌位置不敏感的车牌识别方法 | |
CN108764269A (zh) | 一种基于时空约束增量学习的跨数据集行人再识别方法 | |
CN107633232A (zh) | 一种基于深度学习的低维人脸模型训练方法 | |
CN108537782A (zh) | 一种基于轮廓提取的建筑物图像匹配与融合的方法 | |
CN106503691A (zh) | 一种人脸图片的身份标注方法和装置 | |
CN114067444A (zh) | 基于元伪标签和光照不变特征的人脸欺骗检测方法和系统 | |
CN103413145A (zh) | 基于深度图像的关节点定位方法 | |
CN113033454B (zh) | 一种城市视频摄像中建筑物变化的检测方法 | |
CN109635634A (zh) | 一种基于随机线性插值的行人再识别数据增强方法 | |
CN103810274A (zh) | 基于WordNet语义相似度的多特征图像标签排序方法 | |
CN110414513A (zh) | 基于语义增强卷积神经网络的视觉显著性检测方法 | |
CN112509009B (zh) | 一种基于自然语言信息辅助的目标追踪方法 | |
CN111027377A (zh) | 一种双流神经网络时序动作定位方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: Room 708, building 2, No. 371, Mingxing Road, Xiaoshan Economic and Technological Development Zone, Xiaoshan District, Hangzhou City, Zhejiang Province Applicant after: HANGZHOU JINGLIANWEN TECHNOLOGY Co.,Ltd. Address before: Hangzhou City, Zhejiang province 310011 Gongshu District Moganshan Road 972 Thai Garden Block D room 604 Applicant before: HANGZHOU JINGLIANWEN TECHNOLOGY Co.,Ltd. |
|
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180119 |