CN110276308B - 图像处理方法及装置 - Google Patents
图像处理方法及装置 Download PDFInfo
- Publication number
- CN110276308B CN110276308B CN201910555717.5A CN201910555717A CN110276308B CN 110276308 B CN110276308 B CN 110276308B CN 201910555717 A CN201910555717 A CN 201910555717A CN 110276308 B CN110276308 B CN 110276308B
- Authority
- CN
- China
- Prior art keywords
- abscissa
- vertex angle
- face
- adjusted
- outward expansion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/165—Detection; Localisation; Normalisation using facial parts and geometric relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Geometry (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像处理方法及装置。该方法包括:获取待处理图像;对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例;根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。还公开了图像处理装置。
Description
技术领域
本申请涉及图像处理技术领域,尤其涉及图像处理方法及装置。
背景技术
近几年,随着人脸识别技术的快速发展,人脸识别技术的应用场景越来越多,如:平安城市、智慧交通等安防监控场景。人脸识别技术是通过对待识别图像进行人脸识别得到相应的结果,而待识别图像的质量将大大影响人脸识别的准确性。
通过人脸检测技术对摄像头采集的待处理图像进行处理可获得人脸框,进而截取人脸框所包含的区域,获得人脸图像。但通过这种方法截取获得的人脸图像中人脸区域往往不完整(如:人脸图像中不存在耳朵)。
发明内容
本申请提供一种图像处理方法及装置,以实现从待处理图像中截取人脸图像。
第一方面,提供了一种图像处理方法,所述方法包括:获取待处理图像;对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例;根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
在该种可能实现的方式中,人脸关键点可包括左脸关键点、右脸关键点以及对称中心线上的人脸关键点,根据左脸关键点位置信息和右脸关键点位置信息,可确定待处理图像中的人脸偏转角的正负,并可根据人脸偏转角的正负确定横向外扩比例。而根据对称中心线上的人脸关键点则可确定人脸的俯仰程度,并可根据人脸的俯仰程度确定纵向外扩比例。再根据横向外扩比例和纵向外扩比例调整人脸框的宽度,并将调整后的人脸框作为人脸图像,即可高效、准确的从待处理图像中获得包含完整的人脸区域的人脸图像。
在一种可能实现的方式中,所述人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,所述左脸关键点位置信息包括第一关键点和第二关键点,所述右脸关键点位置信息包括第三关键点和第四关键点;所述根据人脸关键点的位置信息,得到所述人脸框的外扩比例,包括:分别获取所述第一关键点与所述第二关键点之间的第一距离,以及所述第三横坐标的差作为所述第三关键点与所述第四关键点之间的第二距离;根据所述第一距离与所述第二距离的比值,得到所述外扩比例的横向外扩比例。
在该种可能实现的方式中,可根据左脸区域宽度(即第一距离)和右脸区域宽度(即第二距离)确定待处理图像中人脸偏转角的正负,再根据人脸偏转角的正负以及第一距离与所第二距离的比值确定人脸框的横向外扩比例,可在使调整后的人脸框的宽度覆盖人脸区域的宽度的情况下,尽可能的减小人脸框中包含的非人脸区域。
在另一种可能实现的方式中,所述关键点位置信息还包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,且所述第一纵坐标小于所述第二纵坐标,所述方法还包括:将所述第二纵坐标与所述第一纵坐标的差作为所述第五关键点与所述第六关键点之间的第三距离;根据所述第三距离得到所述外扩比例的纵向外扩比例。
在该种可能实现的方式中,可根据第五关键点位置信息和第六关键点位置信息,确定待处理图像中的人脸的俯仰程度,并可根据人脸俯仰程度和第三距离确定人脸框的纵向外扩比例,可在使调整后的人脸框的长度覆盖人脸区域的长度的情况下,尽可能的减小人脸框中包含的非人脸区域。
在又一种可能实现的方式中,所述横向外扩比例包括向左外扩比例和向右外扩比例;所述根据所述第一距离与所述第二距离的比值,得到所述外扩比例的横向外扩比例,包括:在所述比值大于第一阈值的情况下,将所述向右外扩比例设为第一预设值,并根据所述比值得到所述向左外扩比例。
在该种可能实现的方式中,在比值大于第一阈值的情况下,确定待处理图像中的人脸偏转角为正,即待处理图像的左脸区域中未处于人脸框内的区域面积较大,而待处理图像的右脸区域中未处于人脸框内的区域面积较小,因此将向右外扩比例设为第一预设值,并根据比值的大小(即偏转的程度)确定向左外扩比例,这样根据向右外扩比例和向左外扩比例分别调整人脸框的右边框和左边框,可使人脸框的宽度在覆盖人脸区域的宽度的情况下,尽可能的减小人脸框中包含的非人脸区域。
在又一种可能实现的方式中,所述方法还包括:在所述比值小于第二阈值的情况下,将所述向左外扩比例设为所述第一预设值,并根据比值得到所述向右外扩比例。
在该种可能实现的方式中,在比值小于第二阈值的情况下,确定待处理图像中的人脸偏转角为负,即待处理图像的右脸区域中未处于人脸框内的区域面积较大,而待处理图像的左脸区域中未处于人脸框内的区域面积较小,因此将向左外扩比例设为第一预设值,并根据比值的大小(即偏转的程度)确定向右外扩比例,这样根据向右外扩比例和向左外扩比例分别调整人脸框的右边框和左边框,可使人脸框的宽度在覆盖人脸区域的宽度的情况下,尽可能的减小人脸框中包含的非人脸区域。
在又一种可能实现的方式中,所述方法还包括:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述向左外扩比例设为第二预设值,并将所述向右外扩比例设为第三预设值。
在该种可能实现的方式中,在比值大于或等于第二阈值且小于或等于第一阈值的情况下,确定待处理图像中的人脸偏转角为0,即待处理图像的右脸区域中未处于人脸框内的区域面积和左脸区域中未处于人脸框内的区域面积均较小,因此将向左外扩比例设为第二预设值,将向右外扩比例设为第三预设值,根据向右外扩比例和向左外扩比例分别调整人脸框的右边框和左边框,实现对人脸框的微调,使调整后的人脸框的宽度在覆盖人脸区域的宽度的情况下,尽可能的减小人脸框中包含的非人脸区域。
在又一种可能实现的方式中,所述人脸框包括矩形框,所述人脸框的位置信息包括:所述矩形框的第一顶角的初始坐标、所述矩形框的长和宽;所述根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像,包括:根据所述第一顶角的初始坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标;根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标;将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
在该种可能实现的方式中,根据横向外扩比例调整人脸框的四个顶角的横坐标,以实现调整人脸框大小,并将由调整后的四个顶角的坐标确定的人脸框包含的区域作为人脸图像,这样可使人脸框的调整更准确,进而使获得的人脸图像的质量更高。
在又一种可能实现的方式中,所述第一顶角的初始坐标包括第五横坐标和第三纵坐标,所述第二顶角的初始坐标包括第六横坐标和所述第三纵坐标,所述第三顶角的初始坐标包括所述第五横坐标和第四纵坐标,所述第四顶角的初始坐标包括所述第六横坐标和所述第四纵坐标,所述第五横坐标小于所述第六横坐标,所述第三纵坐标小于所述第四纵坐标;所述根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标,包括:在所述比值大于所述第一阈值的情况下,将所述第六横坐标与所述第一预设值相乘得到第七横坐标,并将所述第六横坐标与所述第五横坐标的差与所述向左外扩比例相乘得到第一向左外扩量;将所述第五横坐标与所述第一向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第七横坐标作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在该种可能实现的方式中,在比值大于第一阈值的情况下,确定人脸偏转角为正,根据横向外扩比例,确定第一向左外扩量,再根据第一向左外扩量调整第一顶角和第三顶角的横坐标,可得到调整后第一顶角和第三顶角。同时根据第一预设值和第六横坐标确定第七横坐标,可得到调整后的第二顶角和第四顶角。进而可根据调整后的第一顶角、第二顶角、第三顶角和第四顶角确定调整后的人脸框。
在又一种可能实现的方式中,所述方法还包括:在所述比值小于所述第二阈值的情况下,将所述第五横坐标与所述第一预设值相乘,得到第八横坐标,将所述第六横坐标与所述第五横坐标的差与所述向右外扩比例相乘,得到第一向右外扩量;将所述第八横坐标作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第一向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在该种可能实现的方式中,在比值小于第二阈值的情况下,确定人脸偏转角为负,根据横向外扩比例,确定第一向右外扩量,再根据第一向右外扩量调整第二顶角和第四顶角的横坐标,可得到调整后第二顶角和第四顶角。同时根据第一预设值和第六横坐标确定第八横坐标,可得到调整后的第一顶角和第三顶角。进而可根据调整后的第一顶角、第二顶角、第三顶角和第四顶角确定调整后的人脸框。
在又一种可能实现的方式中,所述方法还包括:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述第六横坐标与所述第五横坐标的差与所述第二预设值相乘得到第二向左外扩量,将所述第六横坐标与所述第五横坐标的差与所述第三预设值相乘得到第二向右外扩量;将所述第五横坐标与所述第二向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第二向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在该种可能实现的方式中,在比值大于或等于第二阈值且小于或等于第一阈值的情况下,确定人脸偏转角为0,根据第二预设值和第三预设值对人脸框进行微调,得到调整后的人脸框的四个顶角的坐标,进而确定调整后的人脸框。
在又一种可能实现的方式中,所述纵向外扩比例包括:向上外扩比例和向下外扩比例;所述根据所述第三距离得到所述外扩比例的纵向外扩比例,包括:将所述第三距离与第四预设值的乘积作为所述向上外扩比例,将所述第三距离与第五预设值的乘积作为所述向下外扩比例。
在该种可能实现的方式中,将第三距离与第四预设值相乘得到向上外扩比例,将第三距离与第五预设值相乘得到向下外扩比例,可使后续根据向上外扩比例和向下外扩比例分别对人脸框的上边框和下边框进行调整,得到的调整后的人脸框的长度在覆盖待处理图像的人脸区域的长度的同时,包含的非人脸区域尽可能小。
在又一种可能实现的方式中,所述方法还包括:将所述第三纵坐标与所述向上外扩比例的差作为所述调整后的第一顶角的纵坐标和所述调整后的第二顶角的纵坐标,将所述第四纵坐标与所述向下外扩比例的和作为所述调整后的第三顶角的纵坐标和所述调整后的第四顶角的纵坐标。
在该种可能实现的方式中,根据上一种可能实现的方式得到的向上外扩比例和向下外扩比例调整人脸框的四个顶角的纵坐标,使由调整后的四个顶角确定的人脸框的长度可覆盖人脸区域的长度。
在又一种可能实现的方式中,所述第一关键点为左眼外眦,所述第二关键点为左眼内眦,所述第三关键点为右眼内眦,所述第四关键点为右眼外眦。
在该种可能实现的方式中,结合前面任何一种可能实现的方式中,根据左眼外眦的坐标和左眼内眦的坐标可得到第一距离(即左眼宽度),根据右眼外眦的坐标和右眼内眦的坐标可得到第二距离(即右眼宽度)。在人的左眼和右眼的宽度相同的情况下,根据左眼宽度和右眼宽度得到人脸偏转角的正负,可提高得到的人脸偏转角的准确率。进而提高后续根据左眼宽度和右眼宽度确定横向外扩比例的准确率,以及提高根据横向外扩比例从待处理图像中截取人脸图像的精确度。
在又一种可能实现的方式中,其特征在于,所述第五关键点为鼻子中心,所述第六关键点为嘴巴中心。
在该种可能实现的方式中,结合前面任何一种可能实现的方式中,根据鼻子中心和嘴巴中心确定第三距离。由于一般情况下,不同的人的鼻子中心到嘴巴中心的距离与眉毛到头顶的距离的比值,以及人的鼻子中心到嘴巴中心的距离与嘴巴到下巴的距离的比值相差不大(即近乎相同)。且在人脸俯仰程度下,上述两个比值均相同,因此根据第三距离得到纵向外扩比例,可提高得到的纵向外扩比例的准确率,以及提高根据横向外扩比例从待处理图像中截取人脸图像的精确度。
第二方面,提供了一种图像处理装置,所述装置包括:获取单元,用于获取待处理图像;第一处理单元,用于对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;
第二处理单元,用于根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例;
截取单元,用于根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
在一种可能实现的方式中,所述人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,所述左脸关键点位置信息包括第一关键点和第二关键点,所述右脸关键点位置信息包括第三关键点和第四关键点;所述第二处理单元具体用于:分别获取所述第一关键点与所述第二关键点之间的第一距离,以及所述第三关键点与所述第四关键点之间的第二距离;以及根据所述第一距离与所述第二距离的比值,得到所述外扩比例的横向外扩比例。
在另一种可能实现的方式中,所述关键点位置信息还包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,且所述第一纵坐标小于所述第二纵坐标,所述图像处理装置还包括:第三处理单元,用于将所述第二纵坐标与所述第一纵坐标的差作为所述第五关键点与所述第六关键点之间的第三距离;第四处理单元,用于根据所述第三距离得到所述外扩比例的纵向外扩比例。
在又一种可能实现的方式中,所述横向外扩比例包括向左外扩比例和向右外扩比例;所述第二处理单元具体还用于:在所述比值大于第一阈值的情况下,将所述向右外扩比例设为第一预设值,并根据所述比值得到所述向左外扩比例。
在又一种可能实现的方式中,所述第二处理单元具体还用于:在所述比值小于第二阈值的情况下,将所述向左外扩比例设为所述第一预设值,并根据比值得到所述向右外扩比例。
在又一种可能实现的方式中,所述第二处理单元具体还用于:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述向左外扩比例设为第二预设值,并将所述向右外扩比例设为第三预设值。
在又一种可能实现的方式中,所述人脸框包括矩形框,所述人脸框的位置信息包括:所述矩形框的第一顶角的初始坐标、所述矩形框的长和宽;所述截取单元具体用于:根据所述第一顶角的初始坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标;以及根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标;以及将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
在又一种可能实现的方式中,所述第一顶角的初始坐标包括第五横坐标和第三纵坐标,所述第二顶角的初始坐标包括第六横坐标和所述第三纵坐标,所述第三顶角的初始坐标包括所述第五横坐标和第四纵坐标,所述第四顶角的初始坐标包括所述第六横坐标和所述第四纵坐标,所述第五横坐标小于所述第六横坐标,所述第三纵坐标小于所述第四纵坐标;所述截取单元具体还用于:在所述比值大于所述第一阈值的情况下,将所述第六横坐标与所述第一预设值相乘得到第七横坐标,并将所述第六横坐标与所述第五横坐标的差与所述向左外扩比例相乘得到第一向左外扩量;以及将所述第五横坐标与所述第一向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第七横坐标作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述截取单元具体还用于:在所述比值小于所述第二阈值的情况下,将所述第五横坐标与所述第一预设值相乘,得到第八横坐标,将所述第六横坐标与所述第五横坐标的差与所述向右外扩比例相乘,得到第一向右外扩量;以及将所述第八横坐标作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第一向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述截取单元具体还用于:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述第六横坐标与所述第五横坐标的差与所述第二预设值相乘得到第二向左外扩量,将所述第六横坐标与所述第五横坐标的差与所述第三预设值相乘得到第二向右外扩量;以及将所述第五横坐标与所述第二向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第二向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述纵向外扩比例包括:向上外扩比例和向下外扩比例;所述第四处理单元具体用于:将所述第三距离与第四预设值的乘积作为所述向上外扩比例,将所述第三距离与第五预设值的乘积作为所述向下外扩比例。
在又一种可能实现的方式中,所述图像处理装置还包括:第五处理单元,用于将所述第三纵坐标与所述向上外扩比例的差作为所述调整后的第一顶角的纵坐标和所述调整后的第二顶角的纵坐标,将所述第四纵坐标与所述向下外扩比例的和作为所述调整后的第三顶角的纵坐标和所述调整后的第四顶角的纵坐标。
在又一种可能实现的方式中,所述第一关键点为左眼外眦,所述第二关键点为左眼内眦,所述第三关键点为右眼内眦,所述第四关键点为右眼外眦。
在又一种可能实现的方式中,所述第五关键点为鼻子中心,所述第六关键点为嘴巴中心。
第三方面,提供了一种处理器,所述处理器用于执行如上述第一方面及其任意一种可能实现的方式的方法。
第四方面,提供了一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被电子设备的处理器执行时,使所述处理器执行如上述第一方面及其任意一种可能实现的方式的方法。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
图1为本申请实施例提供的一种图像处理方法的流程示意图;
图2为本申请实施例提供的一种人脸框及图像坐标系的示意图;
图3为本申请实施例提供的一种左脸区域和右脸区域的示意图;
图4为本申请实施例提供的一种人脸图像的示意图;
图5为本申请实施例提供的另一种图像处理方法的流程示意图;
图6为本申请实施例提供的另一种图像处理方法的流程示意图;
图7为本申请实施例提供的另一种人脸图像的示意图;
图8为本申请实施例提供的另一种人脸图像的示意图;
图9为本申请实施例提供的一种图像处理装置的结构示意图;
图10为本申请实施例提供的一种图像处理装置的硬件结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
本申请实施例中,将用于人脸识别的图像称为待识别图像,如上所述,待识别图像的质量对人脸识别的准确性有很大的影响。而影响待识别图像的质量的因素包括:待识别图像中人脸区域的完整度、待识别图像中非人脸区域的面积,其中,人脸区域越完整表征待识别图像的质量越高,非人脸区域的面积越小表征待识别图像的质量越高。
由于摄像头采集的图像中可能存在人脸区域不完整、包含非人脸区域的面积大等问题,因此,需要从采集的图像中获得一张高质量的待识别图像,以提高后续人脸识别的准确度。
本申请实施例可用于对摄像头采集的图像进行预处理(即从图像中获得包含完整的人脸区域的人脸图像),并将预处理获得的人脸图像用于后续处理(如人脸识别)。其中,人脸区域包括人的整个头部。下文还将大量出现“宽度”和“长度”,其中,宽度的方向为指图像坐标系xoy中的x轴的方向,长度的方向为图像坐标系xoy中的y轴的方向。
可选的,可将本申请所提供的技术方案应用于安防领域。例如,边缘节点设备可应用本申请提供的技术方案对摄像头实时采集的图像(如视频流中的图像)进行预处理获得人脸图像,并将人脸图像发送至服务器,以便服务器基于人脸图像进行人脸识别。
又例如,抓拍机可应用本申请提供的技术方案对实时采集的图像进行预处理获得人脸图像,并将人脸图像用于后续处理。
再例如,终端(如电脑、服务器等)可应用本申请提供的技术方案对任意一张图像(可以是存储于本地的图像,也可以是接收到摄像头或其他终端发送的图像)进行预处理获得人脸图像,并将人脸图像用于后续处理。
下面结合本申请实施例中的附图对如何应用本申请实施例从待处理图像中获得人脸图像进行描述。
请参阅图1,图1是本申请实施例(一)提供的一种图像处理方法的流程示意图。
101、获取待处理图像。
本申请实施例中,待处理图像可以是任意大小的数字图像,本申请对待处理图像的大小以及待处理图像中的内容不做限定。
获取待处理图像的方式可以是接收用户通过输入组件输入的待处理图像,其中,输入组件包括:键盘、鼠标、触控屏、触控板和音频输入器等。也可以是接收终端发送的待处理图像,其中,终端包括手机、计算机、平板电脑、服务器等。还可以是通过摄像采集的图像,如:监控摄像头采集的图像、手机摄像头采集的图像。还可以是从视频中截取的一帧图像。本申请对获取待处理图像的方式不做限定。
102、对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息。
本申请实施例中,可通过任意人脸检测算法对待处理图像进行人脸检测,其中,人脸检测算法可以是开源人脸算法(OpenFace)、目标检测算法(deformable partmodel,DMP),级联卷积神经网络算法(cascade cnn),稠密块算法(densebox)等等,本申请对人脸检测算法不做具体限定。
通过人脸检测算法对待处理图像进行人脸检测,可得到包含待处理图像的人脸区域的人脸框的位置信息,其中,人脸框可以为矩形框,人脸框的位置信息包括人脸框的长和宽,以及人脸框的中任意一个顶角在图像坐标系下的坐标。
举例来说,如图2所示,待处理图像中包含一张人脸,对该待处理图像进行人脸检测,得到人脸框abcd的顶角a在图像坐标系xoy下的坐标(x,y),以及abcd的长和宽。
本申请实施例中,人脸关键点可以是人脸上的任意一点,如:鼻子、眼睛、眉毛、嘴巴、以及人脸轮廓中的任意一点。人脸关键点包括左脸关键点和右脸关键点,如图3所示,以人脸区域的对称中心线为基准将人脸区域分为左脸区域和右脸区域,其中,左脸关键点包括位于左脸区域和对称中心中线上的人脸关键点,右脸关键点包括位于右脸区域的人脸关键点。
本申请实施例中,可通过任意人脸关键点提取算法可提取出待处理图像中的人脸关键点及其位置信息(即人脸关键点位置信息),人脸关键点提取算法可以是OpenFace、多任务级联卷积神经网络(multi-task cascaded convolutional networks,MTCNN),调整卷积神经网络(tweaked convolutional neural networks,TCNN),任务约束深度卷积神经网络(tasks-constrained deep convolutional network,TCDCN)等等,本申请对人脸关键点提取算法不做限定。
可选的,可通过OpenFace对待处理图像进行人脸检测,并提取人脸关键点,并得到人脸关键点的位置信息,即人脸关键点在图像坐标系下的坐标。
103、根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例。
由于待处理图像中的人脸偏转角,因此在通过人脸检测技术检测待处理图像中的人脸区域时,会存在检测出的人脸区域不完整、检测出的人脸区域包含过多非人脸区域等问题,其中,检测出的人脸区域为上述人脸框包含的区域。
将过被拍摄人物(即待处理图像中的人物)的脸部区域的对称中心线,且与脸部区域内两眼之间的连线垂直的平面称为竖直面,上述人脸偏转角指摄像头在采集待处理图像时的拍摄方向与竖直面之间的夹角。从被拍摄人物的头顶从上往下看,摄像头的拍摄方向相较于竖直面的偏移方向为顺时针方向时,人脸偏转角为正,反之,从被拍摄人物的头顶从上往下看,摄像头的拍摄方向相较于竖直面的偏移方向为逆时针方向时,人脸偏转角为负。当人脸偏转角不为0时,即表征待处理图像中存在人脸偏转角。
通常,在待处理图像中的人脸偏转角为正的情况下,检测出的人脸区域中的左脸区域会存在不完整的问题;在待处理图像中的人脸偏转角为负的情况下,检测出的人脸区域中的右脸区域会存在不完整的问题。因此,为从待处理图像中截取包含完整的人脸区域的图像,需要对人脸框的大小进行调整。
可选的,将人脸框中平行于y轴,且位于左脸区域的边框称为左边框;将人脸框中平行于y轴,且位于右脸区域的边框称为右边框;将人脸框中平行于x轴的两条边框中对应y轴上的坐标较小的边框称为上边框;将人脸框中平行于x轴的两条边框中对应y轴上的坐标较大的边框称为下边框。在待处理图像中的人脸偏转角为正的情况下,将人脸框的左边框向左移动(本申请实施例中,向左即为x轴的负方向),以扩大左脸区域的大小,使人脸框的宽度覆盖人脸区域的宽度;在待处理图像中的人脸偏转角为负的情况下,将人脸框的右边框向右移动(本申请实施例中,向右即为x轴的正方向),以扩大右脸区域的大小,使人脸框的宽度覆盖人脸区域的宽度。
综上可知,在待处理图像中的人脸存在人脸偏转角的情况下,可通过调整人脸框的大小从待处理图像中截取包含完整的人脸区域的图像。而在对人脸框进行调整之前,需要确定人脸偏转角是正还是负,也就是说,通过确定待处理图像中的人脸偏转角的正负,可确定调整人脸框的方式,进而实现从待处理图像中截取包含完整的人脸区域的图像。
可选的,人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,根据左脸关键点位置信息和右脸关键点位置信息,可确定人脸偏转角,进而确定人脸框的外扩比例,其中,左脸关键点位置信息包括左脸关键点在图像坐标系下的坐标,右脸关键点位置信息包括右脸关键点在图像坐标系下的坐标。接下来将阐述如何根据左脸关键点位置信息和右脸关键点位置信息确定人脸框的外扩比例。
如图4所示,人脸区域是一个以对称中心线为对称轴的轴对称区域。而根据102所得到的左脸关键点位置信息可确定左眼宽度、位于左脸区域的嘴巴的宽度、位于左脸区域的鼻子的宽度(下文将这三个宽度统称为左脸区域宽度),根据右脸关键点位置信息可确定右眼宽度、位于右脸区域的嘴巴的宽度、位于右脸区域的鼻子的宽度(下文将这三个宽度统称为右脸区域宽度)。在待处理图像中的人脸偏转角为0时,该轴对称可进一步理解为:左眼的宽度与右眼的宽度相等、位于左脸区域的嘴巴的宽度与位于右脸区域的嘴巴的宽度相等、位于左脸区域的鼻子的宽度与位于右脸区域的鼻子的宽度相等等等。
在待处理图像中的人脸存在人脸偏转角时,人脸区域不再是轴对称区域。此时,在人脸偏转角为正时,左眼的宽度比右眼的宽度大、位于左脸区域的嘴巴的宽度比位于右脸区域的嘴巴的宽度大、位于左脸区域的鼻子的宽度比位于右脸区域的鼻子的宽度大等等。在人脸偏转角为负时,左眼的宽度比右眼的宽度小、位于左脸区域的嘴巴的宽度比位于右脸区域的嘴巴的宽度小、位于左脸区域的鼻子的宽度比位于右脸区域的鼻子的宽度小等等。且人脸偏转角的绝对值越大,左脸区域的宽度与右脸区域的宽度之间的差值就越大,人脸框需要调整的幅度也就越大。根据左脸区域的宽度与右脸区域的宽度之间的差值与人脸框所需调整的幅度呈正相关,可根据左脸区域的宽度与右脸区域的宽度之间的差值得到人脸外扩比例的横向外扩比例。
在一种可能实现的方式中,可根据左脸区域的宽度与右脸区域的宽度的比值,确定人脸框外扩的比例。举例来说(例1),根据位于左脸区域的第一关键点的第一横坐标和第二关键点的第二横坐标,可确定第一关键点与第二关键点之间的第一距离,并将第一距离作为左脸区域的宽度L。同理,根据位于右脸区域的第三关键点的第三横坐标和第四关键点的第四横坐标,可确定第三关键点与第四关键点之间的第二距离,并将第二距离作为右脸区域的宽度R。设人脸框外扩的横向外扩比例为V,则可根据L/R的大小确定人脸偏转角的正负,即在L/R大于1的情况下,人脸偏转角为正;在L/R小于1的情况下,人脸偏转角为负;在L/R等于1的情况下,人脸偏转角为0。进一步的,人脸偏转角为正时,可令V=L/R,人脸偏转角为负时,可令V=R/L。
需要理解的是,在该种可能实现的方式中,第一关键点与第三关键点关于对称中心线轴对称,第二关键点与第四关键点关于对称中心线轴对称。
在另一种可能实现的方式中,可根据左脸区域的宽度与右脸区域的宽度之间的差值确定人脸框的外扩比例。举例来说(例2),假定左脸区域的宽度与右脸区域的宽度之间的差值为D=L-R,在D大于0的情况下,人脸偏转角为正;在D小于0的情况下,人脸偏转角为负;在D等于0的情况下,人脸偏转角为0。进一步的,人脸偏转角为正时,在D小于或等于第一像素点阈值(如:30个像素点)的情况下,人脸框外扩的比例V为第一外扩比例(如:1.1);在D大于第一像素点阈值且小于或等于第二像素点阈值(如:60个像素点)的情况下,人脸框外扩的比例V为第二外扩比例(如:1.15);D大于第二像素点阈值的情况下,人脸框外扩的比例V为第三外扩比例(如:1.2)。其中,第一像素点阈值<第二像素点阈值<第三像素点阈值、第一外扩比例<第二外扩比例<第三外扩比例,且第一像素点阈值、第二像素点阈值、第三像素点阈值、第一外扩比例、第二外扩比例以及第三外扩比例均可根据用户的实际使用情况进行调整。
104、根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
在确定人脸框的外扩比例之后,可通过调整人脸框的位置信息调整人脸框的大小。
在一种可能实现的方式中,人脸偏转角为正时,可令V=L/R,并通过将人脸框的左边框向左移动,以使调整后的人脸框的面积与调整前的人脸框的面积的比值等于V。人脸偏转角为负时,可令V=R/L,并通过将人脸框的右边框向右移动,以使调整后的人脸框的面积与调整前的人脸框的面积的比值等于V。
在另一种可能实现的方式中,假定调整前的人脸框的四个顶角分别为a(x1,y1)、b(x2,y1)、c(x1,y2)、d(x2,y2),其中,ac为左边框,bd为右边框。在通过例1中的人脸框外扩比例V确定人脸偏转角的正负之后。当人脸偏转角为正时,可令V=L/R,并通过将人脸框的左边框向左移动,以使调整后的人脸框的左边框对应的横坐标为x1-(V-1)*(x2-x1)。人脸偏转角为负时,可令V=R/L,并通过将人脸框的左边框向左移动,以使调整后的人脸框的左边框对应的横坐标为x2+(V-1)*(x2-x1)。
在调整完人脸框的位置信息后,截取根据调整后的人脸框的位置信息在待处理图像中确定的区域,作为人脸图像。
本实施例中,可根据左脸关键点位置信息和右脸关键点位置信息,确定待处理图像中的人脸偏转角的正负,并可根据左脸区域宽度和右脸区域宽度确定人脸框的横向外扩比例,这样可在使人脸框的宽度覆盖人脸区域的宽度的情况下,尽可能的减小人脸框中包含的非人脸区域。再结合人脸偏转角的正负和人脸框的外扩比例,调整人脸框的大小,并根据调整后的人脸框确定人脸图像,即可高效、准确的从待处理图像中截取包含完整的人脸区域的人脸图像。
如上所述,使用人脸检测算法获得的人脸框不能包含完整的人脸区域,而通过移动人脸框的左边框或右边框可获得横向范围合适的人脸框,即通过横向外扩比例可解决因待处理图像中的人脸存在人脸偏转角而导致人脸框不能包含完整的五官(如:由于人脸偏转角而导致耳朵未被包含在人脸框内)的问题。但如图2所示,使用人脸检测算法获得人脸框的上边框刚好超过眉毛的上方,下边框刚好低于嘴巴的下方,也就是说,人脸框并没有包含头发区域和下巴区域。因此,本申请在实施例(一)的基础上还提供了一种通过人脸框的纵向外扩比例调整人脸框,可使调整后的人脸框包含头发区域和下巴区域的方法。
请参与图5,图5是本申请实施例(二)提供的另一种图像处理的方法的流程示意图。
501、获取待处理图像。
请参见101,此处将不再赘述。
502、对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息。
请参见102,此处将不再赘述。
503、根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例。
本实施例中,人脸框的外扩比例包括横向外扩比例和纵向外扩比例。其中,横向外扩比例指将人脸框在x轴方向上进行扩大的比例,包括向左外扩比例和向右外扩比例。纵向外扩比例指将人脸框在y轴方向上进行扩大的比例。获得横向外扩比例可参见103,此处将不再赘述。
本实施例中,502获得的人脸关键点位置信息包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,其中,第五关键点和第六关键点为人脸区域的对称中心线上任意两点,如:鼻子中心、嘴巴中心。
由于待处理图像中的人脸存在低头或仰头(下文将用俯仰)的情况,在存在低头或仰头的情况时,人脸区域的长度(即人脸区域的下巴的纵坐标与人脸区域的头顶的纵坐标之间的差)较不存在低头或仰头的情况时的长度要短,且俯仰程度越大,人脸区域的长度越短。因此,可通过第五关键点的纵坐标与第六关键点的纵坐标的差来衡量待处理图像中人脸的俯仰程度。
本实施例中,将第六关键点的第二纵坐标与第五关键点的第一纵坐标的差定义为第三距离。第三距离越小,表征待处理图像的人脸的俯仰程度越大,由于俯仰程度越大,人脸区域的长度就越小,相应的,人脸框的纵向外扩比例也就越小。因此可根据第三距离与纵向外扩比例呈正相关的关系,确定纵向外扩比例。
在一种可能实现的方式中,将第三距离与第四预设值的乘积作为向上外扩比例,并将第三距离与第五预设值的乘积作为向下外扩比例。举例来说,假定第三距离为T,第四预设值为α,第五预设值为β,则向上外扩比例为T*α,向下外扩比例为T*β。可选的,α和β的取值范围为0.5至1.5。
504、根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
根据横向外扩比例调整人脸框的左边框和右边框的方式可参见104,此处将不再赘述。
同通过横向外扩比例调整人脸框的左边框和右边框相同,在确定人脸框的纵向外扩比例之后,可通过纵向外扩比例调整人脸框的上边框和下边框。
在一种可能实现的方式中,通过将上边框和下边框同时外扩,使人脸框变大,且使外扩后的人脸框的面积与外扩前的人脸框的面积的比值等于纵向外扩比例。
在另一种可能实现的方式中,假定调整前的人脸框的四个顶角分别为a(x1,y1)、b(x2,y1)、c(x1,y2)、d(x2,y2),其中,ab为上边框,cd为下边框。假定纵向外扩比例为S,通过将人脸框的上边框向上移动,以使调整后的人脸框的上边框对应的纵坐标为y1-S*(y2-y1),并通过将人脸框的下边框向下移动,以使调整后的人脸框的下边框对应的纵坐标为y2+S*(y2-y1)。
在调整完人脸框的位置信息后,截取根据调整后的人脸框的位置信息在待处理图像中确定的区域,作为人脸图像。
本实施例中,可根据左脸关键点位置信息和右脸关键点位置信息,确定待处理图像中的人脸偏转角的正负,并可根据人脸偏转角的正负确定横向外扩比例。还可根据第五关键点的纵坐标与第六关键点的纵坐标确定第三距离,并根据第三距离得到纵向外扩比例。根据横向外扩比例对人脸框进行调整可使调整后的人脸框的宽度可覆盖人脸区域的宽度,而根据纵向外扩比例对人脸框进行调整可使调整后的人脸框的长度可覆盖人脸区域的长度。这样使调整后的人脸框包含完整的脸部区域,最后截取调整后的人脸框包含的区域可获得包含完整人脸区域的人脸图像。
基于人脸关键点实现从待处理图像中获得包含完整人脸区域的人脸图像,使整个技术方案高效,且技术方案中将上、下、左、右四个方向的外扩比例分开考虑,对于不同的人脸偏转角或不同程度的俯仰的人脸区域,均可在获得包含完整的人脸区域的人脸图像的同时,使人脸图像中包含的非人脸区域尽可能的少。
请参阅图6,图6是本申请实施例(三)提供的另一种图像处理方法的流程示意图。
601、获取待处理图像。
请参见501,此处将不再赘述。
602、对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息。
请参见502,此处将不再赘述。
603、根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例。
与503相同,本实施例中的外扩比例也包括横向外扩比例和纵向外扩比例,但与103获得横向外扩比例不同的是,本实施例中根据左脸区域的宽度与右脸区域的宽度的比值判断人脸偏转角的正负的方式与例1中的方式有所不同。举例来说,设左脸区域的宽度为L,右脸区域的宽度为R,在L/R大于第一阈值的情况下,人脸偏转角为正;在L/R小于第二阈值的情况下,人脸偏转角为负;在L/R大于或等于第二阈值且小于或等于第一阈值的情况下,人脸偏转角为0。
考虑到待处理图像中的人脸偏转角很小的情况下,左脸区域与右脸区域基本相同(即左脸区域与右脸区域接近对称)。此外,由于拍摄条件(包括:拍摄设备的影响、拍摄环境的影响等)对采集的图像的影响,在人脸偏转角为0时,L/R=1的概率比较小。综合以上两个因素,本实施例将L/R接近1的情况均视为人脸偏转角为0,并通过判断L/R是否处于第二阈值至第一阈值内判断L/R接近1,可选的,第二阈值为0.95,第一阈值为1.05。这样,可提高根据左脸区域的宽度与右脸区域的宽度的比值确定人脸偏转角的正负,进而根据人脸偏转角的正负得到横向外扩比例的精度。
本实施例中,横向外扩比例包括向左外扩比例和向右外扩比例。在确定待处理图像中人脸偏转角的正负之后,本实施例根据L/R的值确定横向外扩比例的方式与103也不相同。
在一种可能实现的方式中,设人脸框外扩的横向外扩比例为V,在L/R大于第一阈值的情况下,人脸偏转角为正,可令V=L/R-1;在L/R小于第二阈值的情况下,人脸偏转角为负,可令V=R/L-1;在L/R大于或等于第二阈值且小于或等于第一阈值的情况下,人脸偏转角为0,可令向左外扩比例为第二预设值,向右外扩比例为第三预设值。
由于本实施例后续是通过调整人脸框的顶角的位置来调整人脸框的宽度,因此,在存在人脸偏转角的情况下,令V=L/R-1或V=R/L-1,以便后续根据向左外扩比例和向右外扩比例调整人脸框的顶角的位置。
获得纵向外扩比例的方式则可参见503,此处将不再赘述。
604、根据所述第五横坐标、所述第三纵坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标。
本实施例中,人脸框为矩形框,人脸框的位置信息包括:矩形框的第一顶角的第五横坐标和第三纵坐标、矩形框的长和矩形框的宽。进一步的,根据第一顶角的坐标、矩形框的长和宽可确定矩形框的大小以及矩形框其他顶角的坐标。
如图7所示,使用人脸检测算法对待处理图像进行处理,得到的人脸框的信息确定的人脸框DEFG中D的坐标为(x3,y3),E的坐标为(x4,y3),F的坐标为(x3,y4),G的坐标为(x4,y4),将(x3,y3)称为人脸框的第一顶角的初始坐标、(x4,y3)为人脸框的第二顶角的初始坐标、(x3,y4)为人脸框的第三顶角的初始坐标、(x4,y4)为第四顶角的初始坐标。
605、根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标,所述第一顶角的初始坐标包括所述第五横坐标和所述第三纵坐标。
根据603得到的外扩比例,通过调整第一顶角的初始坐标、第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标,调整人脸框的大小。
假定第一顶角的初始坐标包括第五横坐标和第三纵坐标,第二顶角的初始坐标包括第六横坐标和第三纵坐标,第三顶角的初始坐标包括第五横坐标和第四纵坐标,第四顶角的初始坐标包括第六横坐标和所述第四纵坐标,且第五横坐标小于第六横坐标,第三纵坐标小于第四纵坐标。
在左脸区域的宽度与右脸区域的宽度的比值大于第一阈值的情况下,表征人脸偏转角为正,此时人脸框内的左脸区域有较大概率是不完整的,而人脸框内的右脸区域有较大概率是完整的。因此需要根据比值的大小确定人脸框的左边框向左移动的幅度,同时将人脸框的右边框可向右小幅度移动,以使调整后的人脸框的宽度可覆盖整个人脸区域的宽度。
在一种可能实现的方式中,由于左边框上的两个顶角的横坐标相同,第六横坐标与第五横坐标的差为调整前的人脸框的宽度,再将调整前的人脸框的宽度与向左外扩比例相乘,得到第一向左外扩量。其中,第一向左外扩量即为左边框需要向左移动的幅度。因此,将第五横坐标与第一向左外扩量的差作为调整后的第一顶角的坐标的横坐标和调整后的第三顶角的横坐标。此外,由于右边框上的两个顶角的横坐标相同,因此可通过将第六横坐标与第一预设值相乘得到第七横坐标,并将第七横坐标作为调整后的第二顶角的坐标的横坐标和调整后的第四顶角的坐标的横坐标,实现将右边框向右小幅度移动。可选的,第一预设值可为1(即不移动右边框)。
举例来说,假定第一顶角的初始坐标为(4,4),第二顶角的初始坐标为(6,4),第三顶角的初始坐标为(4,6),第四顶角的初始坐标为(6,6),向左外比例为0.1,向右外扩比例为0。比值为1.1,第一阈值为1.05,即比值大于第一阈值,则第七横坐标为6,第一向左外扩量为0.1*(6-4)=0.2,第五横坐标与第一向左外扩量的差=4-0.2=3.8。调整后的第一顶角的坐标为(3.8,4),调整后的第二顶角的坐标为(6,4),调整后的第三顶角的坐标为(3.8,6),调整后的第四顶角的坐标为(6,6)。
在左脸区域的宽度与右脸区域的宽度的比值小于第二阈值的情况下,表征人脸偏转角为负,此时人脸框内的右脸区域有较大概率是不完整的,而人脸框内的左脸区域有较大概率是完整的。因此需要根据比值的大小确定人脸框的右边框向右移动的幅度,同时将人脸框的左边框可向左小幅度移动,以使调整后的人脸框的宽度可覆盖整个人脸区域的宽度。
在一种可能实现的方式中,由于右边框上的两个顶角的横坐标相同,第六横坐标与第五横坐标的差为调整前的人脸框的宽度,再将调整前的人脸框的宽度与向右外扩比例相乘,得到第一向右外扩量。其中,第一向右外扩量即为右边框需要向右移动的幅度。因此,将第六横坐标与第一向右外扩量的和作为调整后的第二顶角的坐标的横坐标和调整后的第四顶角的横坐标。此外,由于左边框上的两个顶角的横坐标相同,因此可通过将第五横坐标与上述第一预设值相乘得到第八横坐标,并将第八横坐标作为调整后的第一顶角的坐标的横坐标和调整后的第三顶角的坐标的横坐标,实现将左边框向左小幅度移动。可选的,第一预设值可为1(即不移动左边框)。
举例来说,假定第一顶角的初始坐标为(4,4),第二顶角的初始坐标为(6,4),第三顶角的初始坐标为(4,6),第四顶角的初始坐标为(6,6),向右外扩比例为0.1,向左外扩比例为0。比值为0.94,第二阈值为0.95,即比值小于第二阈值,则第八横坐标为4,第一向右外扩量为0.1*(6-4)=0.2,第六横坐标与第一向右外扩量的和=6+0.2=6.2。调整后的第一顶角的坐标为(4,4),调整后的第二顶角的坐标为(6.2,4),调整后的第三顶角的坐标为(4,6),调整后的第四顶角的坐标为(6.2,6)。
在左脸区域的宽度与右脸区域的宽度的比值大于或等于第二阈值,且比值小于或等于第一阈值的情况下,表征人脸偏转角为0,此时人脸框内的人脸区域有较大概率是完整的。因此只需要将人脸框的左边框向左小幅度移动,并将右边框向右小幅度移动,以使调整后的人脸框的宽度可覆盖整个人脸区域的宽度。
在一种可能实现的方式中,第六横坐标与第五横坐标的差为调整前的人脸框的宽度,将调整前的人脸框的宽度与第二预设值相乘得到第二向左外扩量,将调整前的人脸框的宽度与第三预设值相乘得到第二向右外扩量。将第五横坐标与第二向左外扩量的差作为调整后的第一顶角的横坐标和调整后的第三顶角的横坐标,将第六横坐标与第二向右外扩量的和作为调整后的第二顶角的横坐标和调整后的第四顶角的横坐标。
举例来说,假定调整前的人脸框的第一顶角的初始坐标为(4,4),第二顶角的初始坐标为(6,4),第三顶角的初始坐标为(4,6),第四顶角的初始坐标为(6,6),第二预设值为0.09,第三预设值为0.1。则第二向左外扩量=0.09*(6-4)=0.18,第二向右外扩量=0.1*(6-4)=0.2,第五横坐标与第二向左外扩量的差=4-0.18=3.82,第六横坐标与第二向右外扩量的和
=6+0.2=6.2。调整后的第一顶角的坐标为(3.82,4),调整后的第二顶角的坐标为(6.2,4),调整后的第三顶角的坐标为(3.82,6),调整后的第四顶角的坐标为(6.2,6)。
需要理解的是,在上述三种可能实现的方式中,只调整了人脸框的四个顶角的横坐标,并没有调整四个顶角的纵坐标,这样可调整人脸框的宽度。
由于使用人脸检测算法获得的人脸框不能包括头发区域和下巴区域,而对于需要通过终端向用户展示人脸图像的情况,展示一张包含完整的人脸区域的图像的效果要比展示一张只包括从嘴巴到眉毛的图像的效果好,即可让用户更加快速、准确的确定图像中的人脸的身份。
可选的,还可根据603得到的纵向外扩比例调整人脸框的长度,使调整后的人脸框的长度可覆盖人脸区域的长度。
在一种可能实现的方式中,将第三纵坐标与上述向上外扩比例的差作为调整后的第一顶角的纵坐标和调整后的第二顶角的纵坐标,将第四纵坐标与上述向下外扩比例的和作为调整后的第三顶角的纵坐标和调整后的第四顶角的纵坐标。其中,第三纵坐标为上述第一顶角和第二顶角的初始纵坐标,第四纵坐标为上述第三顶角和第四顶角的初始纵坐标。
举例来说,假定第一顶角的初始坐标为(4,4),第二顶角的初始坐标为(6,4),第三顶角的初始坐标为(4,6),第四顶角的初始坐标为(6,6),即第三纵坐标为4,第四纵坐标为6。向上外扩比例为0.6,向下外扩比例为0.3。则第三纵坐标与向上外扩比例的差=4-0.6=3.4,第四纵坐标与上述向下外扩比例的和=6+0.3=6.3,调整后的第一顶角的坐标为(4,3.4),调整后的第二顶角的坐标为(4,3.4),调整后的第三顶角的坐标为(4,6.3),调整后的第一顶角的坐标为(4,6.3)。
可选的,可同时调整人脸框的宽度和长度,即既根据横向外扩比例调整人脸框的宽度,又根据纵向外扩比例调整人脸框的长度,以使调整后的人脸框包含完整的人脸区域。
606、将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
在通过601~605的处理,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标之后,即可确定调整后的人脸框,再将待处理图像中处于调整后的人脸框包含的区域内的图像作为人脸图像。
本实施例中,可根据左脸关键点位置信息和右脸关键点位置信息,确定待处理图像中的人脸偏转角的正负,并可根据人脸偏转角的正负确定横向外扩比例。还可根据第五关键点的纵坐标与第六关键点的纵坐标确定第三距离,并根据第三距离得到纵向外扩比例。根据横向外扩比例对人脸框的四个顶角的横坐标进行调整,以实现精确调整人脸框的横向外扩量。根据纵向外扩比例对人脸框的四个顶角的纵坐标进行调整,以实现精确调整人脸框的纵向外扩量。这样使调整后的人脸框包含完整的脸部区域,最后截取调整后的人脸框包含的区域可获得包含完整人脸区域的人脸图像,且可减少人脸图像中包含的非人脸区域。
可选的,实施例(一)至实施例(三)中的第一关键点为左眼外眦,第二关键点为左眼内眦,第三关键点为右眼内眦,第四关键点为右眼外眦。也就是说,左脸区域宽度为左眼宽度,右脸区域宽度为右眼宽度。由于一般情况下,人的左眼和右眼的宽度相同,而在人脸偏转角为正时,左眼宽度要大于右眼宽度,在人脸偏转角为正时,右眼宽度要大于左眼宽度。因此可根据左眼宽度和右眼宽度确定人脸偏转角的正负。
可选的,实施例(一)至实施例(三)中的第五关键点为图8中的鼻子中心,第六关键点为图8中的嘴巴中心。也就是说,第三距离为鼻子中心与嘴巴中心的距离。由于一般情况下,不同的人的鼻子中心到嘴巴中心的距离与眉毛到头顶的距离的比值,以及人的鼻子中心到嘴巴中心的距离与嘴巴到下巴的距离的比值相差不大(即近乎相同)。且在人脸俯仰程度下,上述两个比值均相同,因此可根据鼻子中心到嘴巴中心的距离确定人脸框的纵向外扩比例。
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
上述详细阐述了本申请实施例的方法,下面提供了本申请实施例的装置。
请参阅图9,图9为本申请实施例提供的一种图像处理装置的结构示意图,该装置1包括:获取单元11、第一处理单元12、第二处理单元13、截取单元14、第三处理单元15、第四处理单元16以及第五处理单元17。其中:
获取单元11,用于获取待处理图像;
第一处理单元12,用于对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;
第二处理单元13,用于根据所述人脸关键点的位置信息,得到所述人脸框的外扩比例,其中所述外扩比例包括横向外扩比例和纵向外扩比例;
截取单元14,用于根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
在一种可能实现的方式中,所述人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,所述左脸关键点位置信息包括第一关键点和第二关键点,所述右脸关键点位置信息包括第三关键点和第四关键点;所述第二处理单元12具体用于:分别获取所述第一关键点与所述第二关键点之间的第一距离,以及所述第三关键点与所述第四关键点之间的第二距离;以及根据所述第一距离与所述第二距离的比值,得到所述外扩比例的横向外扩比例。
在另一种可能实现的方式中,所述关键点位置信息还包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,且所述第一纵坐标小于所述第二纵坐标,所述图像处理装置还包括:第三处理单元15,用于将所述第二纵坐标与所述第一纵坐标的差作为所述第五关键点与所述第六关键点之间的第三距离;第四处理单元,用于根据所述第三距离得到所述外扩比例的纵向外扩比例。
在又一种可能实现的方式中,所述横向外扩比例包括向左外扩比例和向右外扩比例;所述第二处理单元13具体还用于:在所述比值大于第一阈值的情况下,将所述向右外扩比例设为第一预设值,并根据所述比值得到所述向左外扩比例。
在又一种可能实现的方式中,所述第二处理单元13具体还用于:在所述比值小于第二阈值的情况下,将所述向左外扩比例设为所述第一预设值,并根据比值得到所述向右外扩比例。
在又一种可能实现的方式中,所述第二处理单元13具体还用于:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述向左外扩比例设为第二预设值,并将所述向右外扩比例设为第三预设值。
在又一种可能实现的方式中,所述人脸框包括矩形框,所述人脸框的位置信息包括:所述矩形框的第一顶角的初始坐标、所述矩形框的长和宽;所述截取单元14具体用于:根据所述第一顶角的初始坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标;以及根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标;以及将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
在又一种可能实现的方式中,所述第一顶角的初始坐标包括第五横坐标和第三纵坐标,所述第二顶角的初始坐标包括第六横坐标和所述第三纵坐标,所述第三顶角的初始坐标包括所述第五横坐标和第四纵坐标,所述第四顶角的初始坐标包括所述第六横坐标和所述第四纵坐标,所述第五横坐标小于所述第六横坐标,所述第三纵坐标小于所述第四纵坐标;所述截取单元14具体还用于:在所述比值大于所述第一阈值的情况下,将所述第六横坐标与所述第一预设值相乘得到第七横坐标,并将所述第六横坐标与所述第五横坐标的差与所述向左外扩比例相乘得到第一向左外扩量;以及将所述第五横坐标与所述第一向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第七横坐标作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述截取单元14具体还用于:在所述比值小于所述第二阈值的情况下,将所述第五横坐标与所述第一预设值相乘,得到第八横坐标,将所述第六横坐标与所述第五横坐标的差与所述向右外扩比例相乘,得到第一向右外扩量;以及将所述第八横坐标作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第一向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述截取单元14具体还用于:在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述第六横坐标与所述第五横坐标的差与所述第二预设值相乘得到第二向左外扩量,将所述第六横坐标与所述第五横坐标的差与所述第三预设值相乘得到第二向右外扩量;以及将所述第五横坐标与所述第二向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第二向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
在又一种可能实现的方式中,所述纵向外扩比例包括:向上外扩比例和向下外扩比例;所述第四处理单元16具体用于:将所述第三距离与第四预设值的乘积作为所述向上外扩比例,将所述第三距离与第五预设值的乘积作为所述向下外扩比例。
在又一种可能实现的方式中,所述图像处理装置1还包括:第五处理单元17,用于将所述第三纵坐标与所述向上外扩比例的差作为所述调整后的第一顶角的纵坐标和所述调整后的第二顶角的纵坐标,将所述第四纵坐标与所述向下外扩比例的和作为所述调整后的第三顶角的纵坐标和所述调整后的第四顶角的纵坐标。
在又一种可能实现的方式中,所述第一关键点为左眼外眦,所述第二关键点为左眼内眦,所述第三关键点为右眼内眦,所述第四关键点为右眼外眦。
在又一种可能实现的方式中,所述第五关键点为鼻子中心,所述第六关键点为嘴巴中心。
在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述。
图10为本申请实施例提供的一种图像处理装置的硬件结构示意图。该处理装置2包括处理器21,还可以包括输入装置22、输出装置23和存储器24。该输入装置22、输出装置23、存储器24和处理器21之间通过总线相互连接。
存储器包括但不限于是随机存储记忆体(random access memory,RAM)、只读存储器(read-only memory,ROM)、可擦除可编程只读存储器(erasable programmable readonlymemory,EPROM)、或便携式只读存储器(compact disc read-only memory,CD-ROM),该存储器用于相关指令及数据。
输入装置用于输入数据和/或信号,以及输出装置用于输出数据和/或信号。输出装置和输入装置可以是独立的器件,也可以是一个整体的器件。
处理器可以包括是一个或多个处理器,例如包括一个或多个中央处理器(centralprocessing unit,CPU),在处理器是一个CPU的情况下,该CPU可以是单核CPU,也可以是多核CPU。
存储器用于存储网络设备的程序代码和数据。
处理器用于调用该存储器中的程序代码和数据,执行上述方法实施例中的步骤。具体可参见方法实施例中的描述,在此不再赘述。
可以理解的是,图10仅仅示出了一种图像处理装置的简化设计。在实际应用中,图像处理装置还可以分别包含必要的其他元件,包含但不限于任意数量的输入/输出装置、处理器、控制器、存储器等,而所有可以实现本申请实施例的图像处理装置都在本申请的保护范围之内。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。所属领域的技术人员还可以清楚地了解到,本申请各个实施例描述各有侧重,为描述的方便和简洁,相同或类似的部分在不同实施例中可能没有赘述,因此,在某一实施例未描述或未详细描述的部分可以参见其他实施例的记载。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本申请实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者通过所述计算机可读存储介质进行传输。所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(digital subscriberline,DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,数字通用光盘(digital versatiledisc,DVD))、或者半导体介质(例如固态硬盘(solid state disk,SSD))等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,该流程可以由计算机程序来指令相关的硬件完成,该程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法实施例的流程。而前述的存储介质包括:只读存储器(read-onlymemory,ROM)或随机存储存储器(random access memory,RAM)、磁碟或者光盘等各种可存储程序代码的介质。
Claims (29)
1.一种图像处理方法,其特征在于,所述方法包括:
获取待处理图像;
对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;所述人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,所述左脸关键点位置信息包括第一关键点和第二关键点,所述右脸关键点位置信息包括第三关键点和第四关键点;
分别获取所述第一关键点与所述第二关键点之间的第一距离,以及所述第三关键点与所述第四关键点之间的第二距离;
根据所述第一距离与所述第二距离的比值,得到外扩比例的横向外扩比例,其中所述外扩比例还包括纵向外扩比例;
根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
2.根据权利要求1所述的方法,其特征在于,所述关键点位置信息还包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,且所述第一纵坐标小于所述第二纵坐标,所述方法还包括:
将所述第二纵坐标与所述第一纵坐标的差作为所述第五关键点与所述第六关键点之间的第三距离;
根据所述第三距离得到所述外扩比例的纵向外扩比例。
3.根据权利要求2所述的方法,其特征在于,所述横向外扩比例包括向左外扩比例和向右外扩比例;
所述根据所述第一距离与所述第二距离的比值,得到外扩比例的横向外扩比例,包括:
在所述比值大于第一阈值的情况下,将所述向右外扩比例设为第一预设值,并根据所述比值得到所述向左外扩比例。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
在所述比值小于第二阈值的情况下,将所述向左外扩比例设为所述第一预设值,并根据比值得到所述向右外扩比例。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述向左外扩比例设为第二预设值,并将所述向右外扩比例设为第三预设值。
6.根据权利要求5所述的方法,其特征在于,所述人脸框包括矩形框,所述人脸框的位置信息包括:所述矩形框的第一顶角的初始坐标,所述矩形框的长和宽;
所述根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像,包括:
根据所述第一顶角的初始坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标;
根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标;
将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
7.根据权利要求6所述的方法,其特征在于,所述第一顶角的初始坐标包括第五横坐标和第三纵坐标,所述第二顶角的初始坐标包括第六横坐标和所述第三纵坐标,所述第三顶角的初始坐标包括所述第五横坐标和第四纵坐标,所述第四顶角的初始坐标包括所述第六横坐标和所述第四纵坐标,所述第五横坐标小于所述第六横坐标,所述第三纵坐标小于所述第四纵坐标;
所述根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标,包括:
在所述比值大于所述第一阈值的情况下,将所述第六横坐标与所述第一预设值相乘得到第七横坐标,并将所述第六横坐标与所述第五横坐标的差与所述向左外扩比例相乘得到第一向左外扩量;
将所述第五横坐标与所述第一向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第七横坐标作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
在所述比值小于所述第二阈值的情况下,将所述第五横坐标与所述第一预设值相乘,得到第八横坐标,将所述第六横坐标与所述第五横坐标的差与所述向右外扩比例相乘,得到第一向右外扩量;
将所述第八横坐标作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第一向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述第六横坐标与所述第五横坐标的差与所述第二预设值相乘得到第二向左外扩量,将所述第六横坐标与所述第五横坐标的差与所述第三预设值相乘得到第二向右外扩量;
将所述第五横坐标与所述第二向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第二向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
10.根据权利要求7所述的方法,其特征在于,所述纵向外扩比例包括:向上外扩比例和向下外扩比例;
所述根据所述第三距离得到所述外扩比例的纵向外扩比例,包括:
将所述第三距离与第四预设值的乘积作为所述向上外扩比例,将所述第三距离与第五预设值的乘积作为所述向下外扩比例。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
将所述第三纵坐标与所述向上外扩比例的差作为所述调整后的第一顶角的纵坐标和所述调整后的第二顶角的纵坐标,将所述第四纵坐标与所述向下外扩比例的和作为所述调整后的第三顶角的纵坐标和所述调整后的第四顶角的纵坐标。
12.根据权利要求1至11中任意一项所述的方法,其特征在于,所述第一关键点为左眼外眦,所述第二关键点为左眼内眦,所述第三关键点为右眼内眦,所述第四关键点为右眼外眦。
13.根据权利要求2、10、11中任意一项所述的方法,其特征在于,所述第五关键点为鼻子中心,所述第六关键点为嘴巴中心。
14.一种图像处理装置,其特征在于,所述装置包括:
获取单元,用于获取待处理图像;
第一处理单元,用于对所述待处理图像进行人脸检测,得到包含所述待处理图像中的人脸区域的人脸框的位置信息,以及人脸关键点及其位置信息;所述人脸关键点的位置信息包括左脸关键点位置信息和右脸关键点位置信息,所述左脸关键点位置信息包括第一关键点和第二关键点,所述右脸关键点位置信息包括第三关键点和第四关键点;
第二处理单元,用于分别获取所述第一关键点与所述第二关键点之间的第一距离,以及所述第三关键点与所述第四关键点之间的第二距离;
根据所述第一距离与所述第二距离的比值,得到外扩比例的横向外扩比例,其中所述外扩比例还包括纵向外扩比例;
截取单元,用于根据所述外扩比例调整所述人脸框的位置信息,并将调整后的人脸框的位置信息确定的区域作为人脸图像。
15.根据权利要求14所述的装置,其特征在于,所述关键点位置信息还包括第五关键点的第一纵坐标和第六关键点的第二纵坐标,且所述第一纵坐标小于所述第二纵坐标,所述图像处理装置还包括:
第三处理单元,用于将所述第二纵坐标与所述第一纵坐标的差作为所述第五关键点与所述第六关键点之间的第三距离;
第四处理单元,用于根据所述第三距离得到所述外扩比例的纵向外扩比例。
16.根据权利要求15所述的装置,其特征在于,所述横向外扩比例包括向左外扩比例和向右外扩比例;
所述第二处理单元还用于:
在所述比值大于第一阈值的情况下,将所述向右外扩比例设为第一预设值,并根据所述比值得到所述向左外扩比例。
17.根据权利要求16所述的装置,其特征在于,所述第二处理单元还用于:
在所述比值小于第二阈值的情况下,将所述向左外扩比例设为所述第一预设值,并根据比值得到所述向右外扩比例。
18.根据权利要求17所述的装置,其特征在于,所述第二处理单元还用于:
在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述向左外扩比例设为第二预设值,并将所述向右外扩比例设为第三预设值。
19.根据权利要求18所述的装置,其特征在于,所述人脸框包括矩形框,所述人脸框的位置信息包括:所述矩形框的第一顶角的初始坐标、所述矩形框的长和宽;
所述截取单元用于:
根据所述第一顶角的初始坐标、所述矩形框的长和所述矩形框的宽,得到第二顶角的初始坐标、第三顶角的初始坐标和第四顶角的初始坐标;
以及根据所述外扩比例,调整所述第一顶角的初始坐标、所述第二顶角的初始坐标、所述第三顶角的初始坐标和所述第四顶角的初始坐标,得到调整后的第一顶角的坐标、调整后的第二顶角的坐标、调整后的第三顶角的坐标和调整后的第四顶角的坐标;
以及将根据所述调整后的第一顶角的坐标、所述调整后的第二顶角的坐标、所述调整后的第三顶角的坐标和所述调整后的第四顶角的坐标在所述待处理图像中确定的图像区域作为所述人脸图像。
20.根据权利要求19所述的装置,其特征在于,所述第一顶角的初始坐标包括第五横坐标和第三纵坐标,所述第二顶角的初始坐标包括第六横坐标和所述第三纵坐标,所述第三顶角的初始坐标包括所述第五横坐标和第四纵坐标,所述第四顶角的初始坐标包括所述第六横坐标和所述第四纵坐标,所述第五横坐标小于所述第六横坐标,所述第三纵坐标小于所述第四纵坐标;
所述截取单元还用于:
在所述比值大于所述第一阈值的情况下,将所述第六横坐标与所述第一预设值相乘得到第七横坐标,并将所述第六横坐标与所述第五横坐标的差与所述向左外扩比例相乘得到第一向左外扩量;
以及将所述第五横坐标与所述第一向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第七横坐标作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
21.根据权利要求20所述的装置,其特征在于,所述截取单元还用于:
在所述比值小于所述第二阈值的情况下,将所述第五横坐标与所述第一预设值相乘,得到第八横坐标,将所述第六横坐标与所述第五横坐标的差与所述向右外扩比例相乘,得到第一向右外扩量;
以及将所述第八横坐标作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第一向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
22.根据权利要求21所述的装置,其特征在于,所述截取单元还用于:
在所述比值大于或等于所述第二阈值,且所述比值小于或等于所述第一阈值的情况下,将所述第六横坐标与所述第五横坐标的差与所述第二预设值相乘得到第二向左外扩量,将所述第六横坐标与所述第五横坐标的差与所述第三预设值相乘得到第二向右外扩量;
以及将所述第五横坐标与所述第二向左外扩量的差作为所述调整后的第一顶角的横坐标和所述调整后的第三顶角的横坐标,将所述第六横坐标与所述第二向右外扩量的和作为所述调整后的第二顶角的横坐标和所述调整后的第四顶角的横坐标。
23.根据权利要求20所述的装置,其特征在于,所述纵向外扩比例包括:向上外扩比例和向下外扩比例;
所述第四处理单元用于:
将所述第三距离与第四预设值的乘积作为所述向上外扩比例,将所述第三距离与第五预设值的乘积作为所述向下外扩比例。
24.根据权利要求23所述的装置,其特征在于,所述图像处理装置还包括:
第五处理单元,用于将所述第三纵坐标与所述向上外扩比例的差作为所述调整后的第一顶角的纵坐标和所述调整后的第二顶角的纵坐标,将所述第四纵坐标与所述向下外扩比例的和作为所述调整后的第三顶角的纵坐标和所述调整后的第四顶角的纵坐标。
25.根据权利要求14至24中任意一项所述的装置,其特征在于,所述第一关键点为左眼外眦,所述第二关键点为左眼内眦,所述第三关键点为右眼内眦,所述第四关键点为右眼外眦。
26.根据权利要求15、23、24中任意一项所述的装置,其特征在于,所述第五关键点为鼻子中心,所述第六关键点为嘴巴中心。
27.一种处理器,其特征在于,所述处理器用于执行如权利要求1至13任意一项所述的方法。
28.一种电子设备,其特征在于,包括:处理器、输入装置、输出装置和存储器,所述处理器、输入装置、输出装置和存储器相互连接,所述存储器中存储有程序指令;所述程序指令被所述处理器执行时,使所述处理器执行如权利要求1至13任一项权利要求所述的方法。
29.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被电子设备的处理器执行时,使所述处理器执行权利要求1至13任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910555717.5A CN110276308B (zh) | 2019-06-25 | 2019-06-25 | 图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910555717.5A CN110276308B (zh) | 2019-06-25 | 2019-06-25 | 图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110276308A CN110276308A (zh) | 2019-09-24 |
CN110276308B true CN110276308B (zh) | 2021-11-16 |
Family
ID=67963142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910555717.5A Active CN110276308B (zh) | 2019-06-25 | 2019-06-25 | 图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110276308B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111046792A (zh) * | 2019-12-11 | 2020-04-21 | 三一重工股份有限公司 | 人脸检测方法、装置、电子设备和计算机可读存储介质 |
CN111104918A (zh) * | 2019-12-24 | 2020-05-05 | 杭州魔点科技有限公司 | 门禁控制方法、装置、电子设备及介质 |
CN111968163B (zh) * | 2020-08-14 | 2023-10-10 | 济南博观智能科技有限公司 | 一种热电堆阵列测温方法及装置 |
CN112287798A (zh) * | 2020-10-23 | 2021-01-29 | 深圳市商汤科技有限公司 | 测温方法及装置、电子设备及存储介质 |
CN112200174A (zh) * | 2020-12-09 | 2021-01-08 | 上海齐感电子信息科技有限公司 | 人脸框检测方法及模块和活体人脸验证方法及系统 |
CN112907803B (zh) * | 2021-01-14 | 2021-09-28 | 湖南海讯供应链有限公司 | 一种自动调节ai智能门禁系统及门禁检测方法 |
CN113222810A (zh) * | 2021-05-21 | 2021-08-06 | 北京大米科技有限公司 | 图像处理方法和图像处理装置 |
CN113628229B (zh) * | 2021-08-04 | 2022-12-09 | 展讯通信(上海)有限公司 | 图像裁剪方法及相关产品 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103605965A (zh) * | 2013-11-25 | 2014-02-26 | 苏州大学 | 一种多姿态人脸识别方法和装置 |
CN104036276A (zh) * | 2014-05-29 | 2014-09-10 | 无锡天脉聚源传媒科技有限公司 | 人脸识别方法及装置 |
CN107437051A (zh) * | 2016-05-26 | 2017-12-05 | 上海市公安局刑事侦查总队 | 图像处理方法及装置 |
CN106897662B (zh) * | 2017-01-06 | 2020-03-10 | 北京交通大学 | 基于多任务学习的人脸关键特征点的定位方法 |
CN107590482A (zh) * | 2017-09-29 | 2018-01-16 | 百度在线网络技术(北京)有限公司 | 信息生成方法和装置 |
CN107886074B (zh) * | 2017-11-13 | 2020-05-19 | 苏州科达科技股份有限公司 | 一种人脸检测方法以及人脸检测系统 |
CN108875515A (zh) * | 2017-12-11 | 2018-11-23 | 北京旷视科技有限公司 | 人脸识别方法、装置、系统、存储介质和抓拍机 |
CN109753886B (zh) * | 2018-12-17 | 2024-03-08 | 北京爱奇艺科技有限公司 | 一种人脸图像的评价方法、装置及设备 |
CN109766792A (zh) * | 2018-12-25 | 2019-05-17 | 东南大学 | 一种基于人脸图像的身份识别方法 |
CN109685740B (zh) * | 2018-12-25 | 2023-08-11 | 努比亚技术有限公司 | 人脸校正的方法及装置、移动终端及计算机可读存储介质 |
-
2019
- 2019-06-25 CN CN201910555717.5A patent/CN110276308B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN110276308A (zh) | 2019-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110276308B (zh) | 图像处理方法及装置 | |
US11551481B2 (en) | Living body detection method and apparatus, electronic device, storage medium, and related system to which living body detection method is applied | |
US11398044B2 (en) | Method for face modeling and related products | |
CN106682632B (zh) | 用于处理人脸图像的方法和装置 | |
JP7387202B2 (ja) | 3次元顔モデル生成方法、装置、コンピュータデバイス及びコンピュータプログラム | |
US11132544B2 (en) | Visual fatigue recognition method, visual fatigue recognition device, virtual reality apparatus and storage medium | |
US11120535B2 (en) | Image processing method, apparatus, terminal, and storage medium | |
CN108090463B (zh) | 对象控制方法、装置、存储介质和计算机设备 | |
CN111147749A (zh) | 拍摄方法、拍摄装置、终端及存储介质 | |
CN112861661B (zh) | 图像处理方法及装置、电子设备及计算机可读存储介质 | |
CN108717704B (zh) | 基于鱼眼图像的目标跟踪方法、计算机装置及计算机可读存储介质 | |
CN111353336B (zh) | 图像处理方法、装置及设备 | |
CN111667504B (zh) | 一种人脸追踪方法、装置及设备 | |
CN111582240B (zh) | 一种对象数量的识别方法、装置、设备和介质 | |
CN112016469A (zh) | 图像处理方法及装置、终端及可读存储介质 | |
CN107977636B (zh) | 人脸检测方法及装置、终端、存储介质 | |
CN110910512B (zh) | 虚拟物体自适应调整方法、装置、计算机设备和存储介质 | |
US20220207917A1 (en) | Facial expression image processing method and apparatus, and electronic device | |
CN111652795A (zh) | 脸型的调整、直播方法、装置、电子设备和存储介质 | |
CN107153806B (zh) | 一种人脸检测方法及装置 | |
CN109711287A (zh) | 人脸采集方法及相关产品 | |
CN110097061A (zh) | 一种图像显示方法及装置 | |
CN111652023B (zh) | 嘴型的调整、直播方法、装置、电子设备和存储介质 | |
CN114155268A (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN113887354A (zh) | 图像识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |