CN105590098A - 图像识别方法及装置 - Google Patents

图像识别方法及装置 Download PDF

Info

Publication number
CN105590098A
CN105590098A CN201510970272.9A CN201510970272A CN105590098A CN 105590098 A CN105590098 A CN 105590098A CN 201510970272 A CN201510970272 A CN 201510970272A CN 105590098 A CN105590098 A CN 105590098A
Authority
CN
China
Prior art keywords
frame
image
described appointment
identified
appointment frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510970272.9A
Other languages
English (en)
Inventor
李广
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510970272.9A priority Critical patent/CN105590098A/zh
Publication of CN105590098A publication Critical patent/CN105590098A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)

Abstract

本发明提供一种图像识别方法及装置。本发明实施例通过获取待识别图像,所述待识别图像中包括指定实物框,进而获得所述指定实物框所对应的物体,使得能够对所述物体进行图像识别处理,无需人工参与,操作简单,而且正确率高,从而提高了图像识别的效率和可靠性。

Description

图像识别方法及装置
【技术领域】
本发明涉及图像处理技术,尤其涉及一种图像识别方法及装置。
【背景技术】
随着科技的发展,人们对图像有着越来越多的应用需求,这就需要对原始获取的图像中的指定物体进行一些识别处理。在实际场景中,拍摄图像的场景情况比较复杂。例如,场景中包含多个物体,使得指定物体难以多个物体中分辨出来,或者,再例如,背景颜色与指定物体颜色非常接近,使得指定物体难以从背景中区分出来,等等。通常,需要借助人工操作,选定指定物体,例如,利用鼠标在电脑屏幕或者用手指在手机触摸屏上进行框选、点选或涂抹等方式,选定指定物体。
然而,由于需要借助人工操作来选定图像中的指定物体,操作复杂,且容易出错,从而导致了图像识别的效率和可靠性的降低。
【发明内容】
本发明的多个方面提供一种图像识别方法及装置,用以提高图像识别的效率和可靠性。
本发明的一方面,提供一种图像识别方法,包括:
获取待识别图像,所述待识别图像中包括指定实物框;
获得所述指定实物框所对应的物体;
对所述物体进行图像识别处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述指定实物框的形状包括规则形状或不规则形状。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得所述指定实物框所对应的物体之前,还包括:
根据特定特征,识别所述指定实物框。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定特征包括下列特征中的至少一项:
特定颜色;
特定纹理;以及
特定标记。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述获得所述指定实物框所对应的物体,包括:
获得所述指定实物框的位置;
根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
本发明的另一方面,提供一种图像识别装置,包括:
获取单元,用于获取待识别图像,所述待识别图像中包括指定实物框;
分析单元,用于获得所述指定实物框所对应的物体;
处理单元,用于对所述物体进行图像识别处理。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述指定实物框的形状包括规则形状或不规则形状。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述分析单元,还用于
根据特定特征,识别所述指定实物框。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定特征包括下列特征中的至少一项:
特定颜色;
特定纹理;以及
特定标记。
如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述分析单元,具体用于
获得所述指定实物框的位置;以及
根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
由上述技术方案可知,本发明实施例通过获取待识别图像,所述待识别图像中包括指定实物框,进而获得所述指定实物框所对应的物体,使得能够对所述物体进行图像识别处理,无需人工参与,操作简单,而且正确率高,从而提高了图像识别的效率和可靠性。
另外,采用本发明所提供的技术方案,一旦获取待识别图像,即能够自动实现待识别图像的识别处理,能够有效提高图像识别的效率,而且能够有效提高图像识别的自动化程度。
【附图说明】
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的图像识别方法的流程示意图;
图2为本发明另一实施例提供的图像识别装置的结构示意图;
图3A为图1所对应的实施例中指定实物框的示意图;
图3B为图1所对应的实施例中指定实物框所包围的物体的示意图。
【具体实施方式】
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本发明保护的范围。
需要说明的是,本发明实施例中所涉及的终端可以包括但不限于手机、个人数字助理(PersonalDigitalAssistant,PDA)、无线手持设备、平板电脑(TabletComputer)、个人电脑(PersonalComputer,PC)、MP3播放器、MP4播放器、可穿戴设备(例如,智能眼镜、智能手表、智能手环等)等。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
图1为本发明一实施例提供的图像识别方法的流程示意图,如图1所示。
101、获取待识别图像,所述待识别图像中包括指定实物框。
所谓的图像,是指采用一定的图像格式,将图像数据即图像的像素按照一定的方式进行存储,所形成的文件,又可以称为图像文件。
其中,图像的图像格式即图像存储的格式,可以包括但不限于位图(Bitmap,BMP)格式、可移植网络图像格式(PortableNetworkGraphicFormat,PNG)、联合图像专家组(JointPhotographicExpertsGroup,JPEG)格式、可交换图像文件格式(ExchangeableImageFileFormat,EXIF),本实施例对此不进行特别限定。
102、获得所述指定实物框所对应的物体。
所谓的指定实物框,其形状可以为规则形状,例如,圆形,如图3A所示、半圆形或长方形等,或者还可以为不规则形状,例如,曲线形或折线形等,本实施例对此不进行特别限定。
所谓的指定实物框所对应的物体,可以是指封闭形状/非封闭形状的所述指定实物框所包围的物体,如图3B所示,或者还可以封闭形状/非封闭形状的所述指定实物框所覆盖的物体,或者还可以为条状的所述指定实物框所指向的物体,本实施例对此不进行特别限定。
103、对所述物体进行图像识别处理。
需要说明的是,101~103的执行主体可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopmentKit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
这样,通过获取待识别图像,所述待识别图像中包括指定实物框,进而获得所述指定实物框所对应的物体,使得能够对所述物体进行图像识别处理,无需人工参与,操作简单,而且正确率高,从而提高了图像识别的效率和可靠性。
本发明中,所述待识别图像可以为利用图像传感器,所采集的。其中,所述图像传感器可以为电荷耦合元件(ChargeCoupledDevice,CCD)传感器,或者还可以为金属氧化物半导体元件(ComplementaryMetal-OxideSemiconductor,CMOS)传感器,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,在102之前,还可以进一步根据特定特征,识别所述指定实物框。
通常情况下,在实际场景中,指定实物框所采用的特定颜色会与背景颜色有较大差异,根据特定颜色,即可以将所述指定实物框识别出来。但是,也不排除该特定颜色与背景颜色相近的情况,在这种情况下,可以根据指定实物框所采用的特定纹理以及特定标记中的至少一项,将所述指定实物框识别出来。
可选地,在本实施例的一个可能的实现方式中,在102中,具体可以获得所述指定实物框的位置,进而,则可以根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
本实施例中,通过获取待识别图像,所述待识别图像中包括指定实物框,进而获得所述指定实物框所对应的物体,使得能够对所述物体进行图像识别处理,无需人工参与,操作简单,而且正确率高,从而提高了图像识别的效率和可靠性。
另外,采用本发明所提供的技术方案,一旦获取待识别图像,即能够自动实现待识别图像的识别处理,能够有效提高图像识别的效率,而且能够有效提高图像识别的自动化程度。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
图2为本发明另一实施例提供的图像识别装置的结构示意图,如图2所示。本实施例的图像识别装置可以包括获取单元21、分析单元22和处理单元23。其中,获取单元21,用于获取待识别图像,所述待识别图像中包括指定实物框;分析单元22,用于获得所述指定实物框所对应的物体;处理单元23,用于对所述物体进行图像识别处理。
需要说明的是,本实施例所提供的图像识别装置可以为位于本地终端的应用,或者还可以为设置在位于本地终端的应用中的插件或软件开发工具包(SoftwareDevelopmentKit,SDK)等功能单元,或者还可以为位于网络侧服务器中的处理引擎,或者还可以为位于网络侧的分布式系统,本实施例对此不进行特别限定。
可以理解的是,所述应用可以是安装在终端上的本地程序(nativeApp),或者还可以是终端上的浏览器的一个网页程序(webApp),本实施例对此不进行特别限定。
所谓的指定实物框,其形状可以为规则形状,例如,圆形、半圆形或长方形等,或者还可以为不规则形状,例如,曲线形或折线形等,本实施例对此不进行特别限定。
所谓的指定实物框所对应的物体,可以是指封闭形状/非封闭形状的所述指定实物框所包围的物体,或者还可以封闭形状/非封闭形状的所述指定实物框所覆盖的物体,或者还可以为条状的所述指定实物框所指向的物体,本实施例对此不进行特别限定。
可选地,在本实施例的一个可能的实现方式中,所述分析单元22,还可以进一步用于根据特定特征,识别所述指定实物框。
其中,所述特定特征可以包括但不限于下列特征中的至少一项:
特定颜色;
特定纹理;以及
特定标记。
可选地,在本实施例的一个可能的实现方式中,所述分析单元22,具体可以用于获得所述指定实物框的位置;以及根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
需要说明的是,图1对应的实施例中方法,可以由本实施例提供的图像识别装置实现。详细描述可以参见图1对应的实施例中的相关内容,此处不再赘述。
本实施例中,通过获取单元获取待识别图像,所述待识别图像中包括指定实物框,进而由分析单元获得所述指定实物框所对应的物体,使得处理单元能够对所述物体进行图像识别处理,无需人工参与,操作简单,而且正确率高,从而提高了图像识别的效率和可靠性。
另外,采用本发明所提供的技术方案,一旦获取待识别图像,即能够自动实现待识别图像的识别处理,能够有效提高图像识别的效率,而且能够有效提高图像识别的自动化程度。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(RandomAccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种图像识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像中包括指定实物框;
获得所述指定实物框所对应的物体;
对所述物体进行图像识别处理。
2.根据权利要求1所述的方法,其特征在于,所述指定实物框的形状包括规则形状或不规则形状。
3.根据权利要求1所述的方法,其特征在于,所述获得所述指定实物框所对应的物体之前,还包括:
根据特定特征,识别所述指定实物框。
4.根据权利要求3所述的方法,其特征在于,所述特定特征包括下列特征中的至少一项:
特定颜色;
特定纹理;以及
特定标记。
5.根据权利要求1~4任一权利要求所述的方法,其特征在于,所述获得所述指定实物框所对应的物体,包括:
获得所述指定实物框的位置;
根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
6.一种图像识别装置,其特征在于,包括:
获取单元,用于获取待识别图像,所述待识别图像中包括指定实物框;
分析单元,用于获得所述指定实物框所对应的物体;
处理单元,用于对所述物体进行图像识别处理。
7.根据权利要求6所述的装置,其特征在于,所述指定实物框的形状包括规则形状或不规则形状。
8.根据权利要求6所述的装置,其特征在于,所述分析单元,还用于
根据特定特征,识别所述指定实物框。
9.根据权利要求8所述的装置,其特征在于,所述特定特征包括下列特征中的至少一项:
特定颜色;
特定纹理;以及
特定标记。
10.根据权利要求6~9任一权利要求所述的装置,其特征在于,所述分析单元,具体用于
获得所述指定实物框的位置;以及
根据所述指定实物框的位置,对所述待识别图像进行分割处理,以获得所述指定实物框所对应的物体。
CN201510970272.9A 2015-12-22 2015-12-22 图像识别方法及装置 Pending CN105590098A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510970272.9A CN105590098A (zh) 2015-12-22 2015-12-22 图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510970272.9A CN105590098A (zh) 2015-12-22 2015-12-22 图像识别方法及装置

Publications (1)

Publication Number Publication Date
CN105590098A true CN105590098A (zh) 2016-05-18

Family

ID=55929668

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510970272.9A Pending CN105590098A (zh) 2015-12-22 2015-12-22 图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN105590098A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106802717A (zh) * 2017-01-20 2017-06-06 深圳奥比中光科技有限公司 空间手势遥控方法及电子设备
CN110977970A (zh) * 2019-12-03 2020-04-10 广东小天才科技有限公司 图像识别系统及其识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577421A (zh) * 2012-07-23 2014-02-12 中国移动通信集团公司 一种应用二维码的方法、设备和系统
CN103577788A (zh) * 2012-07-19 2014-02-12 华为终端有限公司 增强现实的实现方法和装置
CN104156694A (zh) * 2014-07-18 2014-11-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577788A (zh) * 2012-07-19 2014-02-12 华为终端有限公司 增强现实的实现方法和装置
CN103577421A (zh) * 2012-07-23 2014-02-12 中国移动通信集团公司 一种应用二维码的方法、设备和系统
CN104156694A (zh) * 2014-07-18 2014-11-19 百度在线网络技术(北京)有限公司 一种用于识别图像中的目标对象的方法与设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106802717A (zh) * 2017-01-20 2017-06-06 深圳奥比中光科技有限公司 空间手势遥控方法及电子设备
CN110977970A (zh) * 2019-12-03 2020-04-10 广东小天才科技有限公司 图像识别系统及其识别方法
CN110977970B (zh) * 2019-12-03 2021-06-22 广东小天才科技有限公司 图像识别系统的识别方法

Similar Documents

Publication Publication Date Title
US11113523B2 (en) Method for recognizing a specific object inside an image and electronic device thereof
CN107016387B (zh) 一种识别标签的方法及装置
CN112200187A (zh) 一种目标检测方法、装置、机器可读介质及设备
Mutholib et al. Design and implementation of automatic number plate recognition on android platform
CN103198311A (zh) 基于拍摄的图像来识别字符的方法及装置
CN109116129B (zh) 终端检测方法、检测设备、系统及存储介质
CN107257440A (zh) 一种检测视频跟踪拍摄的方法、设备以及存储介质
CN102902943A (zh) 一种二维码扫描的方法、处理装置及终端
CN110991310A (zh) 人像检测方法、装置、电子设备及计算机可读介质
CN108303237B (zh) 一种终端屏幕检测的方法、检测装置以及存储介质
CN113469200A (zh) 数据处理方法和系统、存储介质、计算设备
CN105825228A (zh) 图像识别方法及装置
CN106384071A (zh) 一种二维码扫描识别处理方法及装置
CN102792675A (zh) 用于根据条件自适应地执行图像匹配的方法、系统和计算机可读记录介质
CN105590098A (zh) 图像识别方法及装置
CN104077557A (zh) 一种获取卡片信息的方法和装置
CN114119964A (zh) 一种网络训练的方法及装置、目标检测的方法及装置
CN106228165A (zh) 一种照片分类的方法和移动终端
CN111582353B (zh) 一种图像特征检测方法、系统、设备以及介质
CN110658929B (zh) 一种用于智能笔的控制方法和装置
CN108776959B (zh) 图像处理方法、装置及终端设备
CN111091152A (zh) 图像聚类方法、系统、设备及机器可读介质
CN109144379B (zh) 对终端进行操作的方法、终端检测设备、系统及存储介质
CN111626369B (zh) 一种人脸识别算法效果评估方法、装置、机器可读介质及设备
CN105159663A (zh) 图像的调整方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160518

RJ01 Rejection of invention patent application after publication