CN110717452A - 图像识别方法、装置、终端及计算机可读存储介质 - Google Patents

图像识别方法、装置、终端及计算机可读存储介质 Download PDF

Info

Publication number
CN110717452A
CN110717452A CN201910957095.9A CN201910957095A CN110717452A CN 110717452 A CN110717452 A CN 110717452A CN 201910957095 A CN201910957095 A CN 201910957095A CN 110717452 A CN110717452 A CN 110717452A
Authority
CN
China
Prior art keywords
frame image
preview frame
target area
camera
preview
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910957095.9A
Other languages
English (en)
Other versions
CN110717452B (zh
Inventor
吴恒刚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority to CN201910957095.9A priority Critical patent/CN110717452B/zh
Publication of CN110717452A publication Critical patent/CN110717452A/zh
Application granted granted Critical
Publication of CN110717452B publication Critical patent/CN110717452B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • G06V20/47Detecting features for summarising video content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/48Matching video sequences

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Studio Devices (AREA)

Abstract

本申请属于计算机技术领域,尤其涉及一种图像识别方法、装置、终端及计算机可读存储介质,其中,所述图像识别方法包括:检测终端是否处于相对静止状态;若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息,解决了终端在对预览帧图像进行目标对象的识别时存在计算量较大的问题。

Description

图像识别方法、装置、终端及计算机可读存储介质
技术领域
本申请属于计算机技术领域,尤其涉及一种图像识别方法、装置、终端及计算机可读存储介质。
背景技术
随着终端拍摄功能的不断优化,终端在拍摄过程常常会对预览帧图像进行目标对象的识别,以满足用户在不同场景下的拍摄需求。
然而,目前,对预览帧图像进行目标对象的识别时,存在计算量较大的问题。
发明内容
本申请实施例提供一种图像识别方法、装置、终端及计算机可读存储介质,可以解决终端在对预览帧图像进行目标对象的识别时,存在计算量较大的技术问题。
本申请实施例第一方面提供一种图像识别方法,包括:
检测终端是否处于相对静止状态;
若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
本申请实施例第二方面提供一种图像识别装置,包括:
检测单元,用于检测终端是否处于相对静止状态;
获取单元,用于若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别单元,用于识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
本申请实施例第三方面提供一种终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述方法的步骤。
本申请实施例第四方面提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述方法的步骤。
本申请实施例中,通过检测终端是否处于相对静止状态,并在终端处于相对静止状态时,才获取摄像头采集的预览帧图像,并识别摄像头采集的预览帧图像的目标区域,得到预览帧图像的目标区域在所述预览帧图像中的位置信息;也就是说,本申请不需要在拍摄预览的过程中一直对预览帧图像的目标区域的进行识别,而是在终端处于相对静止状态之后,才对摄像头采集的预览帧图像进行目标区域的识别,得到预览帧图像的目标区域在所述预览帧图像中的位置信息,使得终端在处于相对静止状态之前不需要进行对目标区域识别的计算,降低了终端在对预览帧图像的目标对象进行识别时的计算量,同时,还降低了终端拍摄过程中的功耗。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本申请实施例提供的一种图像识别方法的第一实现流程示意图;
图2是本申请实施例提供的一种图像识别方法的第一实现效果示意图;
图3是本申请实施例提供的步骤103的实现流程示意图;
图4是本申请实施例提供的一种图像识别方法的第二实现流程示意图;
图5是本申请实施例提供的一种图像识别方法的第二实现效果示意图;
图6是本申请实施例提供的步骤403的实现流程示意图;
图7是本申请实施例提供的目标图片文件的存储结构示意图;
图8是本申请实施例提供的图像识别装置的结构示意图;
图9是本申请实施例提供的终端的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。
随着终端拍摄功能的不断优化,终端在拍摄过程常常会对预览帧图像进行目标对象的识别,以满足用户在不同场景下的使用需求。
然而,由于预览帧图像刷新的速度快,对不断刷新的预览帧图像进行目标对象的识别时,存在计算量较大的问题。
基于此,本申请实施例提供一种图像识别方法、装置、终端及计算机可读存储介质,可以解决终端在对预览帧图像进行目标对象的识别时存在的计算量大的问题。
为了说明本申请的技术方案,下面通过具体实施例来进行说明。
如图1示出了本申请实施例提供的一种图像识别方法的实现流程示意图,该方法应用于终端,可以由终端上配置的图像识别装置执行,适用于需降低对预览帧图像进行目标对象的识别时的计算量的情形。其中,上述终端可以为手机、平板电脑、可穿戴设备等智能终端。
在本申请的一些实施方式中,上述图像识别方法可以包括步骤101至步骤103。
步骤101,检测终端是否处于相对静止状态。
其中,上述相对静止状态是指终端位于拍摄位置的状态,此时,终端的位置可以不需要再改变。
在实际应用中,用户使用终端进行拍摄的过程中,一般会在开启相机应用之后,改变终端的位置,使终端的摄像头对准被拍摄对象之后,保持终端不再移动,并对被拍摄对象进行拍摄。
本申请实施例中,利用这一拍摄特点,通过检测终端是否处于相对静止状态,以便在终端处于相对静止的状态时,才开始识别摄像头采集的预览帧图像的目标区域在所述预览帧图像中的位置信息,而在处于相对静止状态之前(即,终端处于移动的状态时),不进行对目标区域识别的计算,进而降低了终端在对预览帧图像的目标对象进行识别时的计算量。
在本申请的一些实施方式中,可以是在终端已开启相机应用,并需要对拍摄对象进行识别时,开始检测终端是否处于相对静止状态。
具体的,上述检测终端是否处于相对静止状态可以包括:检测终端在X轴、Y轴和Z轴三个方向上的位移是否均小于位移阈值,若检测到终端在X轴、Y轴和Z轴三个方向上的位移均小于位移阈值,则确认终端处于相对静止状态。
例如,通过上述终端上设置的陀螺仪或加速度计检测终端在X轴、Y轴和Z轴三个方向上的位移大小,若检测到终端在X轴、Y轴或Z轴上的位移存在大于或等于上述位移阈值的情况,则表示终端还没有移动到最佳拍摄位置,即,用户还在移动上述终端,寻找用户认为的最佳拍摄位置;若检测到终端在X轴、Y轴或Z轴三个方向上的位移均小于上述位移阈值,则表示终端已经位于拍摄位置,用户不再移动上述终端。
其中,上述位移阈值可以根据实践经验进行设定,例如,上述位移阈值可以设置为1mm~3mm。
需要说明的,在本申请的一些实施方式中,上述检测终端是否处于相对静止状态还可以包括:检测终端的摄像头连续采集的预设帧数的预览帧图像之间的相似度,若终端的摄像头连续采集的预设帧数的预览帧图像之间的相似度均大于相似度阈值,则确认终端处于相对静止状态。
其中,终端的摄像头连续采集的预设帧数的预览帧图像之间的相似度的计算可以参看本申请步骤301的描述,此处不再赘述。
步骤102,若终端处于相对静止状态,则获取摄像头采集的预览帧图像。
步骤103,识别摄像头采集的预览帧图像的目标区域,得到预览帧图像的目标区域在所述预览帧图像中的位置信息。
在本申请实施例中,当终端处于相对静止状态时,表示终端已经位于拍摄位置并且处于相对静止的状态,此时用户有可能需要确定终端是否已经识别出拍摄的目标对象,以便确定触发拍照指令的时机,因此,此时,需要获取摄像头采集的预览帧图像,并识别摄像头采集的预览帧图像的目标区域,得到预览帧图像的目标区域在所述预览帧图像中的位置信息。
在本申请的实施方式中,上述预览帧图像的目标区域是指在预览帧图像中目标对象所处的区域。其中,该目标对象可以包括文本、人脸、动物或植物等目标对象,本申请在此不做限制。
相应的,上述识别摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息可以包括:识别摄像头采集的预览帧图像的文本区域,得到预览帧图像的文本区域在所述预览帧图像中的位置信息;和/或,识别摄像头采集的预览帧图像的人脸区域,得到预览帧图像的人脸区域在所述预览帧图像中的位置信息。
具体的,在本申请的一些实施方式中,可以利用OCR技术识别摄像头采集的预览帧图像的文本区域;并且,可以利用face++工具或dlib算法识别摄像头采集的预览帧图像的人脸区域。
在本申请的另外一些实施方式中,上述对预览帧图像的目标区域进行识别,得到预览帧图像的目标区域在所述预览帧图像中的位置信息,还可以包括:利用边缘检测算法对预览帧图像的目标区域进行识别,得到预览帧图像的目标区域在所述预览帧图像中的位置信息。
例如,利用边缘算子对所述预览帧图像的目标区域进行识别。其中,该边缘算子可以包括Sobel算子、Prewitt算子、Roberts算子、拉普拉斯算子(Laplacian of a Gaussian,LoG)和Canny算子等等。
应理解,利用其他能够对预览帧图像的目标区域在所述预览帧图像中的位置信息进行识别的方法也可以达到同样的有益效果,本申请在此不做限定。
本申请实施例中,通过检测终端是否处于相对静止状态,并在终端处于相对静止状态时,才获取摄像头采集的预览帧图像,并识别摄像头采集的预览帧图像的目标区域,得到预览帧图像的目标区域在所述预览帧图像中的位置信息,也就是说,本申请不需要在拍摄预览的过程中一直对预览帧图像的目标区域的进行识别,而是在终端处于相对静止状态之后,才对摄像头采集的预览帧图像进行目标区域的识别,得到预览帧图像的目标区域在所述预览帧图像中的位置信息,使得终端在处于相对静止状态之前不需要进行对目标区域识别的计算,降低了终端在对预览帧图像的目标对象进行识别时的计算量,同时,还降低了终端拍摄过程中的功耗。
例如,如图2所示,预览帧图像2a至预览帧图像2c表示用户使用终端摄像头连续采集的预览帧图像,在终端拍摄预览帧图像2a至预览帧图像2b的过程中,终端处于移动状态,此时,不对目标区域进行识别,在终端拍摄预览帧图像2b至预览帧图像2c的过程中,终端处于相对静止状态,此时,对摄像头采集的预览帧图像2b至预览帧图像2c的文本区域进行识别。
在本申请的一些实施方式中,如图3所示,上述步骤103中,识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息,可以包括:步骤301至步骤302。
步骤301,计算摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度。
在本申请的一些实施方式中,可以通过计算摄像头采集的上一帧预览帧图像的各个像素点的像素值与摄像头当前采集的预览帧图像中对应位置的像素点的像素值差值,并根据该像素值差值确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度。
例如,当摄像头采集的上一帧预览帧图像的各个像素点的像素值与摄像头当前采集的预览帧图像中对应位置的像素点的像素值差值中存在第一预设占比的像素值差值均小于第一差值阈值,则确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度大于相似度阈值。
在本申请的另外一些实施方式中,上述计算摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度,还可以包括:分别获取摄像头采集的上一帧预览帧图像的颜色分布直方图与摄像头当前采集的预览帧图像的颜色分布直方图;并统计摄像头采集的上一帧预览帧图像的颜色分布直方图与摄像头当前采集的预览帧图像的颜色分布直方图中每一种颜色的像素点的第一数量差值,并根据该像素点的第一数量差值确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度。
例如,摄像头采集的上一帧预览帧图像的颜色分布直方图与摄像头当前采集的预览帧图像的颜色分布直方图中每一种颜色的像素点的第一数量差值中存在第二预设占比的数量差值均小于第二差值阈值,则确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度大于相似度阈值。
为了减少计算量,上述根据生成的颜色分布直方图统计在颜色分布直方图中每一种颜色的像素点的数量,并统计摄像头采集的上一帧预览帧图像的颜色分布直方图与摄像头当前采集的预览帧图像的颜色分布直方图中每一种颜色的像素点的数量差值,还可以包括:划分多个颜色区间;根据获取摄像头采集的上一帧预览帧图像的颜色分布直方图与摄像头当前采集的预览帧图像的颜色分布直方图统计颜色分布直方图中每一个预设颜色区间的像素点的第二数量差值,并根据颜色分布直方图中每一个预设颜色区间的像素点的第二数量差值确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度。
例如,将RGB三个通道分别划分成[0,127]和[128,255]两个区间,从而得到8个预设颜色区间,并分别得到摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像对应的颜色分布直方图中,8个预设颜色区间的像素点的数量,确定每个预设颜色区间的像素点的第二数量差值,当第二数量差值中存在第三预设占比的数量差值均小于第三差值阈值,则确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度大于相似度阈值。
需要说明的是,在本申请的一些实施方式中,还可以根据上述摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像对应的颜色分布直方图中每一种颜色的像素点数量,或者每一个颜色区间的像素点数量分别生成像素点数量向量,并通过皮尔逊相关系数或者余弦相似度计算所述像素点数量向量之间的相似度。
在本申请的另一些实施方式中,上述计算摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度,还可以包括:将摄像头采集的上一帧预览帧图像与所述摄像头当前采集的预览帧图像分别转换成灰度图片,并根据所述摄像头采集的上一帧预览帧图像的灰度图片与所述摄像头当前采集的预览帧图像的灰度图片,生成摄像头采集的上一帧预览帧图像的黑白图片与所述摄像头当前采集的预览帧图像的黑白图片;再根据摄像头采集的上一帧预览帧图像的黑白图片中像素点的像素值与所述摄像头当前采集的预览帧图像的黑白图片对应位置的像素点的像素值相同的像素点个数;当所述像素点个数大于数量阈值时,确定摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度大于相似度阈值。
应理解,其他用于计算摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度的方法同样适用于本申请,此处不再赘述。
步骤302,若相似度大于相似度阈值,则将摄像头采集的上一帧预览帧图像的目标区域在所述上一帧预览帧图像中的位置信息作为摄像头当前采集的预览帧图像的目标区域在所述当前采集的预览帧图像中的位置信息。
当上述相似度大于相似度阈值时,表示摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像没有发生较大变化,因此,可以将摄像头采集的上一帧预览帧图像的目标区域在所述上一帧预览帧图像中的位置信息作为摄像头当前采集的预览帧图像的目标区域在所述当前采集的预览帧图像中的位置信息。
本申请的实施例,通过在摄像头采集的上一帧预览帧图像与摄像头当前采集的预览帧图像的相似度大于相似度阈值时,将摄像头采集的上一帧预览帧图像的目标区域在所述上一帧预览帧图像中的位置信息作为摄像头当前采集的预览帧图像的目标区域在所述当前采集的预览帧图像中的位置信息,进而不需要重新对摄像头当前采集的预览帧图像的目标区域进行识别,进一步降低了终端在对预览图像进行目标对象的识别时的计算量。
在本申请的一些实施方式中,在上述步骤103之后,还可以包括:显示所述预览帧图像,并根据预览帧图像的目标区域在所述预览帧图像中的位置信息显示提示信息,所述提示信息用于在所述预览帧图像中标识所述预览帧图像的目标区域。
其中,上述根据预览帧图像的目标区域在所述预览帧图像中的位置信息显示提示信息,可以包括:根据所述预览帧图像的目标区域在所述预览帧图像中的位置信息在预览帧图像中显示用于标识已经识别到的目标区域的虚线框。
例如,如图2所示,在识别摄像头采集的预览帧图像2c的文本区域21,得到预览帧图像的文本区域21在所述预览帧图像中的位置信息之后,可以根据预览帧图像的文本区域的在所述预览帧图像中位置信息在预览帧图像中显示用于标识已经识别到的目标区域的虚线框22,从而用户可以通过终端显示的提示信息,确认终端已对目标区域进行识别,并且已成功识别出预览帧图像中的目标区域。
在本申请的一些实施方式中,如图4所示,在上述显示所述预览帧图像,并根据所述预览帧图像的目标区域在所述预览帧图像中的位置信息显示提示信息之后,还可以包括:步骤401至步骤403。
步骤401,接收拍照指令,并根据拍照指令获取摄像头采集的拍照帧图像。
步骤402,识别拍照帧图像的目标区域,得到拍照帧图像的目标区域在所述拍照帧图像中的位置信息。
本申请实施例中,上述识别拍照帧图像的目标区域的方法可以与上述步骤103中的识别预览帧图像的目标区域的方法相同,此处不再赘述。
步骤403,根据拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取拍照帧图像的目标区域,生成拍照帧图像的目标区域对应的目标图片文件。
也就是说,终端可以根据拍照指令获取摄像头采集的拍照帧图像,并对拍照帧图像进行目标区域的识别,得到拍照帧图像的目标区域在所述拍照帧图像中的位置信息,并根据拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取拍照帧图像的目标区域,得到拍照帧图像的目标区域对应的目标图片文件。
例如,如图5所示,终端在接收到用户通过点击虚拟控件51触发的拍照指令后,获取摄像头采集的拍照帧图像5b,并对拍照帧图像5b进行目标区域的识别,得到拍照帧图像的目标区域52在所述拍照帧图像中的位置信息,并根据拍照帧图像的目标区域52在所述拍照帧图像中的位置信息提取拍照帧图像的目标区域52,得到拍照帧图像的目标区域52对应的目标图片文件5c。
在本申请的一些实施方式中,如图6所示,上述步骤403中,根据拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取拍照帧图像的目标区域,生成拍照帧图像的目标区域对应的目标图片文件,可以包括:步骤601至步骤602。
步骤601,对拍照帧图像的目标区域进行处理,得到初始图片文件。
例如,对拍照帧图像的目标区域进行透视变换、白平衡等校正处理,或者,进行文字编辑、涂鸦等编辑处理,得到初始图片文件。
步骤602,将拍照帧图像的存储路径信息合成到初始图片文件中,生成拍照帧图像的目标区域对应的目标图片文件。
具体的,可以通过识别初始图片文件的数据结束标识符;并在初始图片文件的数据结束标识符之后,增加拍照帧图像的存储路径信息,得到拍照帧图像的目标区域对应的目标图片文件。
本申请实施例中,在对文件进行存储时,文件头部存储有数据起始标识符,而在文件的尾部存储有数据结束标识符,使得终端进行数据读取时,可以辨认出是否完成了对整个文件的读取。
具体的,数据起始标识符用于标识文件内容的起始位置,数据结束标识符用于标识文件内容的结束位置。终端进行文件内容的读取时,需要识别出数据起始标识符,然后再依次读取出文件内容,并在识别到数据结束标识符时,结束文件内容的读取。因此,本申请实施例中可以识别到初始图片文件的数据结束标识符。
例如,如图7所示,对拍照帧图像的目标区域进行处理,得到初始图片文件之后,可以识别出初始图片文件的数据起始标识符(Start of Image,SoI)71以及数据结束标识符(End of Image,EoI)72,此时,将拍照帧图像的存储路径信息73存放在初始图片文件的数据结束标识符72后面,得到拍照帧图像的目标区域对应的目标图片文件。
在本申请的另外一些实施方式中,如图6所示,上述步骤403中,根据拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取拍照帧图像的目标区域,生成拍照帧图像的目标区域对应的目标图片文件,还可以包括:步骤603,将拍照帧图像的图像数据合成到初始图片文件中,生成拍照帧图像的目标区域对应的目标图片文件。
也就是说,除了在目标图片文件的的数据结束标识符之后存储拍照帧图像的存储路径信息之外,还可以在目标图片文件的的数据结束标识符之后,直接存储拍照帧图像的图像数据。
因此,本申请实施例中,通过识别初始图片文件的数据结束标识符,并在初始图片文件的数据结束标识符之后,增加拍照帧图像的存储路径信息,或者增加拍照帧图像的图像数据,得到拍照帧图像的目标区域对应的目标图片文件,实现了在不影响终端对目标图片文件的读取的情况下,在目标图片文件中同时保存了拍照帧图像的存储路径信息或者拍照帧图像的图像数据,以便用户在查看目标图片文件时,还可以根据目标图片文件中保存的拍照帧图像的存储路径信息或者拍照帧图像的图像数据获取到与该目标图片文件对应的拍照帧图像,实现对拍照帧图像进行二次处理。
例如,重新对拍照帧图像的目标区域进行识别,并重新生成所述拍照帧图像的目标区域对应的目标图片文件。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为根据本发明,某些步骤可以采用其它顺序进行。
图8示出了本申请实施例提供的一种图像识别装置800的结构示意图,包括检测单元801、获取单元802和识别单元803。
检测单元801,用于检测终端是否处于相对静止状态;
获取单元802,用于若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别单元803,用于识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
在本申请的一些实施方式中,上述识别单元803,还用于识别所述摄像头采集的预览帧图像的文本区域,得到所述预览帧图像的文本区域在所述预览帧图像中的位置信息。
在本申请的一些实施方式中,上述识别单元803,还用于识别所述摄像头采集的预览帧图像的人脸区域,得到所述预览帧图像的人脸区域在所述预览帧图像中的位置信息。
在本申请的一些实施方式中,上述识别单元803,还用于计算所述摄像头采集的上一帧预览帧图像与所述摄像头当前采集的预览帧图像的相似度;若所述相似度大于相似度阈值,则将所述摄像头采集的上一帧预览帧图像的目标区域在所述上一帧预览帧图像中的位置信息作为所述摄像头当前采集的预览帧图像的目标区域在所述当前采集的预览帧图像中的位置信息。
可选的,上述图像识别装置还可以包括显示单元,用于显示所述预览帧图像,并根据所述预览帧图像的目标区域在所述预览帧图像中位置信息显示提示信息;所述提示信息用于在所述预览帧图像中标识所述预览帧图像的目标区域。
在本申请的一些实施方式中,上述识别单元803,还用于接收拍照指令,并根据所述拍照指令获取摄像头采集的拍照帧图像;识别所述拍照帧图像的目标区域,得到所述拍照帧图像的目标区域在所述拍照帧图像中的位置信息;根据所述拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取所述拍照帧图像的目标区域,生成所述拍照帧图像的目标区域对应的目标图片文件。
可选的,上述图像识别装置还可以包括存储单元,用于对所述拍照帧图像的目标区域进行处理,得到初始图片文件;将所述拍照帧图像的存储路径信息合成到所述初始图片文件中,生成所述拍照帧图像的目标区域对应的目标图片文件。
在本申请的一些实施方式中,上述存储单元,还用于将所述拍照帧图像的图像数据合成到所述初始图片文件中,生成所述拍照帧图像的目标区域对应的目标图片文件。
在本申请的一些实施方式中,上述检测单元801,还用于检测终端在X轴、Y轴和Z轴三个方向上的位移是否均小于位移阈值,若检测到终端在X轴、Y轴和Z轴三个方向上的位移均小于所述位移阈值,则确认终端处于相对静止状态。
需要说明的是,为描述的方便和简洁,上述描述的图像识别装置800的具体工作过程,可以参考上述图1至图7中描述的方法的对应过程,在此不再赘述。
如图9所示,本申请提供一种用于实现上述图像识别方法的终端,该终端可以包括:处理器91、存储器92、一个或多个输入设备93(图9中仅示出一个)和一个或多个输出设备94(图9中仅示出一个)。处理器91、存储器92、输入设备93和输出设备94通过总线95连接。
应当理解,在本申请实施例中,所称处理器91可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备93可以包括虚拟键盘、触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风等,输出设备94可以包括显示器、扬声器等。
存储器92可以包括只读存储器和随机存取存储器,并向处理器91提供指令和数据。存储器92的一部分或全部还可以包括非易失性随机存取存储器。例如,存储器92还可以存储设备类型的信息。
上述存储器92存储有计算机程序,上述计算机程序可在上述处理器91上运行,例如,上述计算机程序为图像识别方法的程序。上述处理器91执行上述计算机程序时实现上述图像识别方法实施例中的步骤,例如图1所示的步骤101至步骤103。或者,上述处理器91执行上述计算机程序时实现上述装置实施例中各单元的功能,例如图8所示单元801至803的功能。
上述计算机程序可以被分割成一个或多个模块/单元,上述一个或者多个模块/单元被存储在上述存储器92中,并由上述处理器91执行,以完成本申请。上述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述上述计算机程序在上述进行图像识别的第一终端中的执行过程。例如,上述计算机程序可以被分割成检测单元、获取单元和识别单元,各单元具体功能如下:
检测单元,用于检测终端是否处于相对静止状态;
获取单元,用于若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别单元,用于识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将上述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
本申请实施例提供了一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现上述各实施例中的图像识别方法的步骤。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,上述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,上述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,上述计算机程序包括计算机程序代码,上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读介质可以包括:能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,上述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上上述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
检测终端是否处于相对静止状态;
若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
2.如权利要求1所述的图像识别方法,其特征在于,所述识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息,包括:
识别所述摄像头采集的预览帧图像的文本区域,得到所述预览帧图像的文本区域在所述预览帧图像中的位置信息;
和/或,
识别所述摄像头采集的预览帧图像的人脸区域,得到所述预览帧图像的人脸区域在所述预览帧图像中的位置信息。
3.如权利要求1所述的图像识别方法,其特征在于,所述识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息,包括:
计算所述摄像头采集的上一帧预览帧图像与所述摄像头当前采集的预览帧图像的相似度;
若所述相似度大于相似度阈值,则将所述摄像头采集的上一帧预览帧图像的目标区域在所述上一帧预览帧图像中的位置信息作为所述摄像头当前采集的预览帧图像的目标区域在所述当前采集的预览帧图像中的位置信息。
4.如权利要求1-3任意一项所述的图像识别方法,其特征在于,在所述识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息之后,包括:
显示所述预览帧图像,并根据所述预览帧图像的目标区域在所述预览帧图像中的位置信息显示提示信息;所述提示信息用于在所述预览帧图像中标识所述预览帧图像的目标区域。
5.如权利要求4所述的图像识别方法,其特征在于,在所述显示所述预览帧图像,并根据所述预览帧图像的目标区域在所述预览帧图像中的位置信息显示提示信息之后,还包括:
接收拍照指令,并根据所述拍照指令获取摄像头采集的拍照帧图像;
识别所述拍照帧图像的目标区域,得到所述拍照帧图像的目标区域在所述拍照帧图像中的位置信息;
根据所述拍照帧图像的目标区域在所述拍照帧图像中的位置信息提取所述拍照帧图像的目标区域,生成所述拍照帧图像的目标区域对应的目标图片文件。
6.如权利要求5所述的图像识别方法,其特征在于,所述生成所述拍照帧图像的目标区域对应的目标图片文件,包括:
对所述拍照帧图像的目标区域进行处理,得到初始图片文件;
将所述拍照帧图像的存储路径信息合成到所述初始图片文件中,生成所述拍照帧图像的目标区域对应的目标图片文件;或者,
将所述拍照帧图像的图像数据合成到所述初始图片文件中,生成所述拍照帧图像的目标区域对应的目标图片文件。
7.如权利要求1所述的图像识别方法,其特征在于,所述检测终端是否处于相对静止状态,包括:
检测终端在X轴、Y轴和Z轴三个方向上的位移是否均小于位移阈值,若检测到终端在X轴、Y轴和Z轴三个方向上的位移均小于所述位移阈值,则确认终端处于相对静止状态。
8.一种图像识别装置,其特征在于,包括:
检测单元,用于检测终端是否处于相对静止状态;
获取单元,用于若所述终端处于相对静止状态,则获取摄像头采集的预览帧图像;
识别单元,用于识别所述摄像头采集的预览帧图像的目标区域,得到所述预览帧图像的目标区域在所述预览帧图像中的位置信息。
9.一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任意一项所述方法的步骤。
CN201910957095.9A 2019-10-09 2019-10-09 图像识别方法、装置、终端及计算机可读存储介质 Active CN110717452B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910957095.9A CN110717452B (zh) 2019-10-09 2019-10-09 图像识别方法、装置、终端及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910957095.9A CN110717452B (zh) 2019-10-09 2019-10-09 图像识别方法、装置、终端及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN110717452A true CN110717452A (zh) 2020-01-21
CN110717452B CN110717452B (zh) 2022-04-19

Family

ID=69212411

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910957095.9A Active CN110717452B (zh) 2019-10-09 2019-10-09 图像识别方法、装置、终端及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110717452B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112887599A (zh) * 2021-01-25 2021-06-01 惠州Tcl移动通信有限公司 减少移动终端冗余照片方法、装置、终端设备及存储介质
CN113344092A (zh) * 2021-06-18 2021-09-03 中科迈航信息技术有限公司 Ai的图像识别方法及装置
CN113887436A (zh) * 2021-09-30 2022-01-04 唯品会(广州)软件有限公司 一种肢体图像识别方法及相关设备
CN114253559A (zh) * 2020-09-23 2022-03-29 Oppo广东移动通信有限公司 应用程序的安装处理方法、装置、存储介质与电子设备
WO2024174610A1 (zh) * 2023-02-24 2024-08-29 荣耀终端有限公司 基于物理传感器的抓拍方法、设备以及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106612396A (zh) * 2016-11-15 2017-05-03 努比亚技术有限公司 一种拍照装置、终端及方法
WO2018076182A1 (zh) * 2016-10-25 2018-05-03 华为技术有限公司 一种图像拍摄方法及装置
CN108777767A (zh) * 2018-08-22 2018-11-09 Oppo广东移动通信有限公司 拍照方法、装置、终端及计算机可读存储介质
CN109325908A (zh) * 2018-10-30 2019-02-12 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN110248100A (zh) * 2019-07-18 2019-09-17 联想(北京)有限公司 一种拍摄方法、装置及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018076182A1 (zh) * 2016-10-25 2018-05-03 华为技术有限公司 一种图像拍摄方法及装置
CN106612396A (zh) * 2016-11-15 2017-05-03 努比亚技术有限公司 一种拍照装置、终端及方法
CN108777767A (zh) * 2018-08-22 2018-11-09 Oppo广东移动通信有限公司 拍照方法、装置、终端及计算机可读存储介质
CN109325908A (zh) * 2018-10-30 2019-02-12 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN110248100A (zh) * 2019-07-18 2019-09-17 联想(北京)有限公司 一种拍摄方法、装置及存储介质

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114253559A (zh) * 2020-09-23 2022-03-29 Oppo广东移动通信有限公司 应用程序的安装处理方法、装置、存储介质与电子设备
CN114253559B (zh) * 2020-09-23 2024-10-01 Oppo广东移动通信有限公司 应用程序的安装处理方法、装置、存储介质与电子设备
CN112887599A (zh) * 2021-01-25 2021-06-01 惠州Tcl移动通信有限公司 减少移动终端冗余照片方法、装置、终端设备及存储介质
CN112887599B (zh) * 2021-01-25 2022-08-05 惠州Tcl移动通信有限公司 减少移动终端冗余照片方法、装置、终端设备及存储介质
CN113344092A (zh) * 2021-06-18 2021-09-03 中科迈航信息技术有限公司 Ai的图像识别方法及装置
CN113887436A (zh) * 2021-09-30 2022-01-04 唯品会(广州)软件有限公司 一种肢体图像识别方法及相关设备
WO2024174610A1 (zh) * 2023-02-24 2024-08-29 荣耀终端有限公司 基于物理传感器的抓拍方法、设备以及存储介质

Also Published As

Publication number Publication date
CN110717452B (zh) 2022-04-19

Similar Documents

Publication Publication Date Title
CN110717452B (zh) 图像识别方法、装置、终端及计算机可读存储介质
CN110889379B (zh) 表情包生成方法、装置及终端设备
CN108965835B (zh) 一种图像处理方法、图像处理装置及终端设备
CN110335216B (zh) 图像处理方法、图像处理装置、终端设备及可读存储介质
CN110766706A (zh) 图像融合方法、装置、终端设备及存储介质
CN108776800B (zh) 一种图像处理方法、移动终端及计算机可读存储介质
WO2019225964A1 (en) System and method for fast object detection
CN111131688B (zh) 一种图像处理方法、装置及移动终端
CN111290684B (zh) 图像显示方法、图像显示装置及终端设备
CN111028276A (zh) 图像对齐方法、装置、存储介质及电子设备
CN111654637B (zh) 对焦方法、对焦装置及终端设备
CN112689221A (zh) 录音方法、录音装置、电子设备及计算机可读存储介质
CN113283319A (zh) 人脸模糊度的评价方法及装置、介质和电子设备
CN109981989B (zh) 渲染图像的方法、装置、电子设备和计算机可读存储介质
CN111753766A (zh) 一种图像处理方法、装置、设备及介质
CN111080683A (zh) 图像处理方法、装置、存储介质及电子设备
CN110610178A (zh) 图像识别方法、装置、终端及计算机可读存储介质
CN107357424B (zh) 一种手势操作的识别方法、设备及计算机可读存储介质
CN110971820B (zh) 拍照方法、拍照装置、移动终端及计算机可读存储介质
CN108270973B (zh) 一种拍照处理方法、移动终端及计算机可读存储介质
US20220084314A1 (en) Method for obtaining multi-dimensional information by picture-based integration and related device
CN110942065B (zh) 文本框选方法、装置、终端设备及计算机可读存储介质
CN111325656B (zh) 图像处理方法、图像处理装置及终端设备
JP2014085845A (ja) 動画処理装置、動画処理方法、プログラム、および集積回路
CN109005357B (zh) 一种拍照方法、拍照装置及终端设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant