CN108804971A - 一种图像识别系统、增强现实显示设备和图像识别方法 - Google Patents
一种图像识别系统、增强现实显示设备和图像识别方法 Download PDFInfo
- Publication number
- CN108804971A CN108804971A CN201710282579.9A CN201710282579A CN108804971A CN 108804971 A CN108804971 A CN 108804971A CN 201710282579 A CN201710282579 A CN 201710282579A CN 108804971 A CN108804971 A CN 108804971A
- Authority
- CN
- China
- Prior art keywords
- image
- identification
- engine
- type
- processor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
- G06V20/42—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items of sport video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
- G06V40/28—Recognition of hand or arm movements, e.g. recognition of deaf sign language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Psychiatry (AREA)
- Social Psychology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种图像识别系统、增强现实显示设备和图像识别方法,所述图像识别系统包括:多个识别引擎;处理器,其配置为获取图像中的对象的类型,并基于该类型选取对应的识别引擎对该获取的对象进行识别,并生成关于所识别的对象的识别结果。本发明实施例具有识别对象的种类多、精度高的特点。
Description
技术领域
本发明涉及图像识别领域,特别涉及一种图像识别系统、增强现实显示设备和图像识别方法。
背景技术
图像识别技术是人工智能的一个重要领域,图像识别技术发展已经步入物体识别阶段。物体识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴,它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。
但是现有的识别领域,通常只能对物体对象进行单一的识别,例如智能进行人脸识别,或者智能对某一特定的对象进行识别,并不能同时对多种对象进行识别,用户体验并不好。
发明内容
本发明实施例提供了一种能够分别对不同的对象进行识别,并且识别精度高的图像识别系统、增强现实显示设备和图像识别方法。
为了解决上述技术问题,本发明实施例提供了如下的技术方案:
本发明实施例中还提供了一种图像识别系统,其包括:
多个识别引擎;
处理器,其配置为获取图像中的对象的类型,并基于该类型选取对应的识别引擎对该获取的对象进行识别,并生成关于所识别的对象的识别结果。
在一优选实施例中,其中,还包括:
学习训练器,其配置为基于各类型对象的数据样本训练对应的识别引擎。
在一优选实施例中,还包括图像采集器,其配置为采集图像并向所述处理器传输关于所采集的图像的信息。
在一优选实施例中,所述图像采集器采集的图像包括视频图像,并且所述处理器进一步配置为对所述图像采集器采集的视频图像执行对象检测、对象的动态跟踪,以获取图像中的对象的类型。
在一优选实施例中,所述处理器进一步配置为根据一选择信息确定需要获取的对象,以执行所述获取图像中的对象的类型。
在一优选实施例中,其中,所述图像采集器还配置为对采集到的图像执行预处理,并将预处理后的图像信息提供给所述处理器以执行所述获取图像中的对象的类型;其中,
所述预处理至少包括对所采集到的图像的降噪处理。
在一优选实施例中,其中所述识别引擎包括人脸识别引擎、姿态识别引擎、文字识别引擎、信息码识别引擎、手势识别引擎中的至少一种。
本发明实施例还提供了一种增强现实显示设备,其配置有如上述任意实施例所述的图像识别系统。
另外,本发明实施例还提供了一种图像识别方法,其包括:
获取图像中的对象的类型;
基于获取的对象的类型,选取对应的识别引擎对该获取的对象进行识别;
生成关于所识别的对象的识别结果。
其中,还包括训练识别引擎的步骤,其包括:
通过学习训练器利用基于各类型对象的数据样本训练对应的识别引擎。
与现有技术相比,本发明实施例具备如下的有益效果:
本发明实施例所提供的图像识别系统可以实现对于图像中的多种对象的识别,并且具有识别效率高、精度高等特点。另外还可以不断的扩展所能识别的对象的种类,具有更广阔的使用空间。
附图说明
图1为本发明实施例中的一种图像识别系统的原理结构图;
图2为本发明另一实施例中的一种图像识别系统的原理结构图;
图3为本发明实施例中的一种图像识别方法的原理流程图。
具体实施方式
下面,结合附图对本发明的具体实施例进行详细的描述,但不作为本发明的限定。
应理解的是,可以对此处公开的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本发明的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本发明进行了描述,但本领域技术人员能够确定地实现本发明的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本公开的具体实施例;然而,应当理解,所公开的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
下面,结合附图详细的说明本发明实施例,本发明实施例提供了一种图像识别系统,该图像识别系统可以分别针对不同类型的对象执行识别操作,并且可以通过不同的识别引擎执行上述识别操作,具有识别精度高且效率高的特点。如图1所示,为本发明实施例中的一种图像识别系统的原理结构图,其中,本发明实施例所提供的图像识别系统可以包括:对应于不同对象的识别引擎100和与各识别引擎100连接的处理器200。
其中,本发明实施例中图像识别系统中可以包括针对于各种类型的对象的识别引擎100,而且各识别引擎100可以对某类型的对象的不同特征进行识别。该识别引擎100可以用于识别人、物体或者其他任意类型的对象,例如发明实施例中的识别引擎100可以包括:执行人脸识别的人脸识别引擎,其可以识别出人脸,并基于该人脸识别对应的性别、年龄信息;用于识别手势的手势识别引擎,其可以识别出手势的变化和手势位置的变化,或者可以识别预设的手势动作;用于识别文字信息的文字识别引擎,其可以识别出是汉字、英文、字数、字型、字号及内容意义等信息,以及用于识别人或物体的姿态的姿态识别引擎,其可以识别出人或物体的姿态变化、位置变化等信息等等。在应用的过程中,可以依据不同的需求配置所需要的识别引擎,从而适用于不同的对象的识别,应用范围更广且适用性更强。
本发明实施例中的处理器200可以分别与各识别引擎100连接,并控制各识别引擎100的操作。本发明实施例中的处理器200可以接收关于图像的信息,如视频信息或者图片信息等,在接收到图像信息后还可以获取图像中各种对象的类型,并基于该识别出的类型选取对应的识别引擎100对该获取的对象进行识别,并生成关于所识别的对象的识别结果。上述对象可以包括所接收的图像中的任意对象,如人物、人脸、手势、各种动植物、生活用品等,即任意包括在图像中的物体都可以作为本发明实施例中所能够识别对象。而处理器200在识别出上述对象的类型后,即可以通过对应的识别引擎100对该对象的具体的状态或特征信息进行识别。
具体的,本发明实施例中的处理器200所接收的图像信息可以实时摄取的图像信息,也可以是接收自其它通信设备的图像信息。处理器200在接收到图像信息后,可以对该图像信息中的对象的类型进行一级识别,例如可以识别出该图像信息中的人物、信息码、文本等类型。在经过一级识别并识别出关于图像中的各对象的类型后,可以选择对应的识别引擎对图像中的对应的对象进行二级识别,即可以执行对各对象的详细信息的识别。例如,在处理器200通过一级识别判断出图像中包括人物对象时,则可以控制人脸识别引擎、姿态识别引擎、手势识别引擎等对该人物对象进行二级识别操作。或者在处理器200通过一级识别判断图像中包括信息码时,可以控制信息码识别引擎和文字识别引擎对该信息码执行二级识别操作。也就是说,在处理器200识别出图像中的对象时,可以控制与该对象有关的识别引擎100(至少一个识别引擎)执行二级识别操作,进而对图像中的各对象进行全面的识别分析。对应的识别引擎100可以将其识别出的信息返回给处理器200,处理器200基于其识别出的对象类型信息以及各识别引擎100识别出的信息生成识别结果。该识别结果可以包括但不限于识别到的物体位置、物体类别和置信度、人脸信息、人脸兴趣点(如年龄、性别等)、条形码/二维码中信息、人体姿态信息、手势、文本等内容。本发明实施例中上述处理器200中可以包括用于执行上述一级识别的一级识别引擎,或者处理器200可以构造为可以执行一级识别的识别引擎。
通过本发明实施例上述配置,可以分别对不同的对象进行识别分析,不仅识别的对象种类丰富,而且,还可以同时对不同的对象进行分别识别,还具有识别效率快的特点。
另外,本发明实施例中的图像识别系统还可以包括图像采集器300和显示器400。该图像采集器300可以包括摄像头,用于实时的采集图像也可以包括通信单元,用于接收从外部传输的图像,并且图像采集器300可以向处理器200传输关于所采集的图像的信息。显示器400可以与显示图像采集器300和处理器200连接,并显示图像采集器300所传输的图像信息以及处理器200生成和传输的识别结果。也就是说,本发明实施例中的显示器400一方面可以对图像采集器300所采集的图像进行显示,另一方面还可以将处理器200针对各对象的识别结果进行显示,从而使用户更加直观的体验到识别结果的显示。优选的,在本发明实施例中,处理器200在向显示器400发送对应的识别结果时,还可以控制显示器将该识别结果显示到对应的对象的识别结果显示区域上。具体的,在对采集图像中的各对象进行检测时,还可以获取该对应的坐标信息,该坐标信息表示对象在图像中的位置。而在显示识别结果时,可以对应根据上述坐标信息指向到该对象,并在对应的坐标框中显示该识别结果,上述坐标框可以是对应的左上角或右上角的信息显示框。
另外,处理器200也可以基于关于对象的选择信息来执行对于对象的识别或者显示该对象的识别结果。也就是说,处理器200可以基于接收到的选择信息来选择识别的对象,例如,上述选择信息可以通过接收控制指令的方式来获取,该控制指令可以接收自其他的电子设备,也可以是通过接收触控信息的方式来获取的。例如处理器200可以接收显示器400上的触控信息,并获取当前触控的图像的对象,从而执行对于被设定对象的类型的识别以及对应的识别引擎100的控制。或者,该选择信息也可以是图片形式的信息,处理器200接收到该选择信息后,可以识别图片中的对象,并在图像信息中查找该对象,如查找到则执行对于该对象的类型的识别以及对应的识别引擎100的控制,如查找不到则不执行识别操作。另外,处理器200也可以在生成关于对象的识别结果时,不直接向显示器400传输显示,可以基于接收到的关于显示该识别结果的控制指令再控制显示器400显示该识别结果。上述控制指令可以是触控形式的触控信号、或者其他形式的通信信号。
如上所述,本发明实施例中图像采集器300所采集的图像可以包括视频图像或者图片图像。上述视频图像或者图片图像可以实时通过摄像设备获取的图像,也可以是与存储的图像,也可以是从其他设备处接收的图像。在采集的图像为视频图像时,处理器200进可以对接收到的图像采集器300采集的视频图像执行图像中对象的检测和对象的动态跟踪分析操作,从而判断该视频图像中的对象的类型,并进一步执行选择识别引擎的操作。上述执行图像中对象的截取和对象动态跟踪操作可以是通过对视频数据中的每一帧图像进行处理分析,获取该帧中的对应的图像,并基于各帧中截取的对象来精确全面的识别出该所识别的对象的类型,从而保证识别精度。
在一优选实施例中,图像采集器300可以对采集到的图像执行预处理,并将预处理后的图像信息传输至所述处理器200进行识别,以及传输至显示器400进行显示。其中,上述预处理至少包括对所采集到的图像的降噪处理,也可以包括其他对于图像的优化处理操作。
通过上述配置,本发明实施例可以实现对于识别结果和图像信息的同时显示,具有更加直观的效果。
另外,在如图2所示的本发明的另一实施例中,为了保证图像识别系统的识别精度,以及识别引擎的可扩展,图像识别系统还可以包括学习训练器500,该学习训练器500可以用于对各识别引擎进行训练,并可以增加识别引擎所能识别的对象的内容和种类。
也就是说,本发明实施例中学习训练器500可以基于接收到的关于各类对象的数据样本对应的训练识别引擎100或者也可以训练处理器200。
本发明实施例中,学习训练器500可以基于现有的识别引擎和接收的针对各类型对象的数据样本,对识别引擎100训练学习并训练生成新的识别引擎100,从而实现对于数据样本以及识别引擎的处理和扩增。在学习训练器500的学习过程中,可以基于现有类型的对象的数据样本进行强化训练学习,增加识别引擎的识别精度,也可以基于新的类型的对象的数据样本进行训练和学习,从而形成新类型对象特征的识别引擎,也就是说本发明实施例可以不断的扩展识别引擎100的识别种类。学习训练器500可以将视频类型的数据样本转换为图片类型训练数据,并基于该图片类型的数据样本的不同分辨率和不同格式生成新的数据样本来对识别引擎100进行训练。也就是说,本发明实施例中的学习训练器500可以基于接收到的图像的数据样本,自动的扩展数据样本的数量,增强训练的强度和学习的强度,从而使得识别引擎100能够更精确的识别到对象的相关信息。
另外,在本发明的实施例中,学习训练器500还可以通过对图片数据执行增加噪声、切割图片、增减图片亮度等处理来扩增训练数据样本集的数量。通过上述配置本发明实施例可以成倍的增加训练样本的数量,从而也就能成倍的提高识别引擎的识别精度。另外,本发明实施例中的学习训练器500也可以对处理器200中的物体检测识别进行训练学习,其使用深度学习框架,基于原有训练模型对新添加类型对象的数据样本进行训练,生成包含新类别的物体检测识别模型。
另外,本发明实施例还提供了一种虚拟设备,该虚拟设备可以包括增强现实显示设备或虚拟现实显示设备,其中上述增强现实显示设备和虚拟现实显示设备可以配置有上述实施例所述的图像识别系统。
而且,在此需要说明的是,本发明实施例中的增强现实显示设备或虚拟现实显示设备在配置上述实施例中的图像识别系统时,可以分离的配置,也可以集成式的配置。
上述集成式的配置是指图像识别系统可以集成的配置到一个设备内。以及分离的配置是指增强现实显示设备可以包括终端设备端和数据处理端,上述终端设备可以构造为至少包括和图像采集器300和显示器400,而处理器200和识别引擎100、训练学习器500则可以配置在数据处理器端。上述配置只是本发明实施例中的一种配置情况,也可以根据实际需求配置成其他的形式。另外,上述虚拟设备也可以是智能手机、智能眼镜或者计算机等智能设备。
另外,本发明实施例还提供了应用在上述实施例的图像识别系统中的图像识别方法,该图像识别方法可以实现对于图像中的对象的精确识别,且识别效率高。
具体的,如图3所示,为本发明实施例中的一种图像识别方法的原理流程图。其中,本发明实施例中的图像识别方法可以包括:
获取图像中的对象的类型;基于获取的对象的类型,选取对应的识别引擎对该获取的对象进行识别;生成关于所识别的对象的识别结果。
本发明实施例中的处理器200可以接收关于图像的信息,如视频信息或者图片信息等,在接收到图像信息后还可以获取的图像中的各种对象的类型,并基于该获取的类型选取对应的识别引擎100对该对象进行识别,并生成关于所识别的对象的识别结果。上述对象可以包括所接收的图像中的任意对象,如人物、人脸、手势、各种动植物、生活用品等,即任意包括在图像中的物体都可以作为本发明实施例中所能够识别对象。而处理器200在出上述对象的类型后,即可以通过对应的识别引擎100对该对象的具体的状态或特征信息进行识别。
具体的,本发明实施例中的处理器200所接收的图像信息可以实时摄取的图像信息,也可以是接收自其它通信设备的图像信息。处理器200在接收到图像信息后,可以对该图像信息中的对象的类型进行一级识别,例如可以识别出该图像信息中的人物、信息码、文本等类型。在经过一级识别并识别出关于图像中的各对象的类型后,可以选择对应的识别引擎对图像中的对应的对象进行二级识别,即可以执行对各对象的详细信息的识别。例如,在处理器200通过一级识别判断出图像中包括人物对象时,则可以控制人脸识别引擎、姿态识别引擎手势识别引擎等对该人物对象进行二级识别操作。或者在处理器200通过一级识别判断图像中包括信息码时,可以控制信息码识别引擎和文字识别引擎对该信息码执行二级识别操作。也就是说,在处理器200识别出图像中的对象时,可以控制与该对象有关的识别引擎100(至少一个识别引擎)执行二级识别操作,进而对图像中的各对象进行全面的识别分析。对应的识别引擎100可以将其识别出的信息返回给处理器200,处理器200基于其识别出的对象类型信息以及各识别引擎100识别出的信息生成识别结果。该识别结果可以包括但不限于识别到的物体位置、物体类别和置信度、人脸信息、人脸兴趣点(如年龄、性别等)、条形码/二维码中信息、人体姿态信息、手势、文本等内容。
本发明实施例中,可以包括针对于各种类型的对象的识别引擎100,而且各识别引擎100可以针对各对象的不同特征进行识别。如发明实施例中的识别引擎可以包括:执行人脸识别的人脸识别引擎,其可以识别出人脸,并基于该人脸识别对应的性别、年龄信息;用于识别手势的手势识别引擎,其可以识别出手势的变化和手势位置的变化,或者可以识别预设的手势动作;用于识别文字信息的文字识别引擎,其可以识别出是汉字、英文、字数、字型、字号及内容意义等信息,以及用于识别人或物体的姿态的姿态识别引擎,其可以识别出人或物体的姿态变化、位置变化等信息等等。在应用的过程中,可以依据不同的需求配置所需要的识别引擎,从而适用于不同的对象的识别,应用范围更广且适用性更强。
另外,还包括获取图像,并将该获取的图像提供给处理器的步骤。以及还可以包括将图像采集器300获取的图像以及生成的识别结果传输至显示器400进行显示的步骤。
具体的,本发明实施例中可以通过图像采集器300来获取图像。该图像采集器300可以包括摄像头,用于实时的采集图像;也可以包括通信单元,用于接收从外部传输的图像,并且图像采集器300可以向处理器200传输关于所采集的图像的信息。
显示器400可以与显示图像采集器300和处理器200连接,并显示图像采集器300所传输的图像信息以及处理器200生成和传输的识别结果。也就是说,本发明实施例中的显示器400一方面可以对图像采集器300所采集的图像进行显示,另一方面还可以将处理器200和识别引擎100针对各对象的识别结果进行显示,从而使用户更加直观的体验到识别结果的显示。优选的,在本发明实施例中,处理器200在向显示器400发送对应的识别结果时,还可以控制显示器将该识别结果显示到对应的对象的识别结果显示区域上。
另外,处理器200也可以基于接收的选择信息来执行对于对象的类型的获取或者显示该对象的识别结果。也就是说,处理器200可以基于接收到的选择信息来选择所要获取对象类型的对象,例如,上述选择信息可以接收触控信息的方式来获取,处理器200可以显示器400上的触控信息,并获取当前触控的图像的对象,从而执行对于该对象的二级识别的控制。或者,该选择信息也可以是图片形式的信息,处理器200接收到该选择信息后,可以识别图片中的对象,并在图像信息中查找该对象,如查找到则执行对于该对象的一级识别和二级识别的控制,如查找不到则不执行识别操作。另外,处理器200也可以在生成关于对象的识别结果时,不直接向显示器400传输显示,可以基于接收到的关于显示该识别结果的控制指令再控制显示器400显示该识别结果。上述控制指令可以是触控形式的触控信号、或者其他形式的通信信号。
如上所述,本发明实施例中图像采集器300所采集的图像可以包括视频图像或者图片图像。上述视频图像或者图片图像可以实时通过摄像设备获取的图像,也可以是与存储的图像,也可以是从其他设备处接收的图像。在采集的图像为视频图像时,处理器200进可以对接收到的图像采集器300采集的视频图像执行图像中对象的截图和对象的动态跟踪操作,从而判断该视频图像中的对象的类型,并进一步执行选择识别引擎的操作。上述执行对象的截取和对象的动态跟踪操作是为了更加全面的识别出该所识别的对象的类型,从而保证识别精度。
在一优选实施例中,图像采集器300可以对采集到的图像执行预处理,并将预处理后的图像信息传输至所述处理器200进行获取对象的类型的操作,以及传输至显示器400进行显示。其中,上述预处理至少包括对所采集到的图像的降噪处理,也可以包括其他对于图像的优化处理操作。
通过上述配置,本发明实施例可以实现对于识别结果和图像信息的同时显示,具有更加直观的效果。
另外,在本发明的优选实施例中,还包括训练识别引擎的步骤,其包括:通过学习训练器利用基于各类型对象的数据样本训练对应的识别引擎。
具体的,为了保证图像识别系统的识别精度,以及识别引擎的可扩展,图像识别系统还可以包括学习训练器500,该学习训练器500可以用于对各识别引擎进行训练,并可以增加识别引擎所能识别的对象的内容和种类。
也就是说,本发明实施例中学习训练器500可以基于接收到的关于各类对象的数据样本对应的训练识别引擎100。学习训练器500可以接收大量的针对各对象的数据样本,并对数据样本进行训练学习,从而实现对于数据样本的处理和扩增。在学习训练器500的学习过程中,可以基于现有类型的对象的数据样本进行强化训练学习,增加识别引擎的识别精度,也可以基于新的类型的对象的数据样本进行训练和讯息,从而扩展识别引擎100的识别种类。
学习训练器500可以将视频类型的数据样本转换为图片类型训练数据,并基于该图片类型的数据样本的不同分辨率和不同格式生成新的数据样本来对识别引擎100进行训练。也就是说,本发明实施例中的学习训练器500可以基于接收到的图像的数据样本,自动的扩展数据样本的数量,增强训练的强度和学习的强度,从而使得识别引擎100能够更精确的识别到对象的相关信息。
另外,在本发明的实施例中,学习训练器500还可以通过对图片数据执行增加噪声、切割图片、增减图片亮度等处理来扩增训练数据样本集的数量。通过上述配置本发明实施例可以成倍的增加训练样本的数量,从而也就能成倍的提高识别引擎的识别精度。另外,本发明实施例中的学习训练器500可以采用训练神经网络的方式对数据样本进行学习从而训练识别引擎100。
综上所述,本发明实施例所提供的图像识别系统、增强现实显示设备和图像识别方法可以实现对于图像中的多种对象的识别,并且具有识别效率高、精度高等特点。另外还可以不断的扩展所能识别的对象的种类,具有更广阔的使用空间。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的数据处理方法所应用于的电子设备,可以参考前述产品实施例中的对应描述,在此不再赘述。
以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。
Claims (10)
1.一种图像识别系统,其包括:
多个识别引擎;
处理器,其配置为获取图像中的对象的类型,并基于该类型选取对应的识别引擎对该获取的对象进行识别,并生成关于所识别的对象的识别结果。
2.根据权利要求1所述的系统,其中,还包括:
学习训练器,其配置为基于各类型对象的数据样本训练对应的识别引擎。
3.根据权利要求1所述的系统,其中,还包括图像采集器,其配置为采集图像并向所述处理器传输关于所采集的图像的信息。
4.根据权利要求3所述的系统,其中,所述图像采集器采集的图像包括视频图像,并且
所述处理器进一步配置为对所述图像采集器采集的视频图像执行对象检测、对象动态跟踪分析,以获取图像中的对象的类型。
5.根据权利要求1所述的系统,其中,所述处理器进一步配置为根据一选择信息确定需要获取的对象,以执行所述获取图像中的对象的类型。
6.根据权利要求3所述的系统,其中,所述图像采集器还配置为对采集到的图像执行预处理,并将预处理后的图像信息提供给所述处理器以执行所述获取图像中的对象的类型;其中,所述预处理至少包括对所采集到的图像的降噪处理。
7.根据权利要求1所述的系统,其中所述识别引擎包括人脸识别引擎、姿态识别引擎、文字识别引擎、信息码识别引擎、手势识别引擎中的至少一种。
8.一种增强现实显示设备,其配置有如权利要求1-7中任意一项所述的图像识别系统。
9.一种图像识别方法,其包括:
获取图像中的对象的类型;
基于获取的对象的类型,选取对应的识别引擎对该获取的对象进行识别;
生成关于所识别的对象的识别结果。
10.根据权利要求9所述的方法,其中,还包括训练识别引擎的步骤,其包括:
通过学习训练器基于各类型对象的数据样本训练对应的识别引擎。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710282579.9A CN108804971A (zh) | 2017-04-26 | 2017-04-26 | 一种图像识别系统、增强现实显示设备和图像识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710282579.9A CN108804971A (zh) | 2017-04-26 | 2017-04-26 | 一种图像识别系统、增强现实显示设备和图像识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108804971A true CN108804971A (zh) | 2018-11-13 |
Family
ID=64068938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710282579.9A Pending CN108804971A (zh) | 2017-04-26 | 2017-04-26 | 一种图像识别系统、增强现实显示设备和图像识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108804971A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110726A (zh) * | 2019-05-15 | 2019-08-09 | 深圳供电局有限公司 | 电力设备铭牌识别方法、装置、计算机设备和存储介质 |
CN110363146A (zh) * | 2019-07-16 | 2019-10-22 | 杭州睿琪软件有限公司 | 一种物体识别方法、装置、电子设备和存储介质 |
CN111147891A (zh) * | 2019-12-31 | 2020-05-12 | 杭州威佩网络科技有限公司 | 视频画面中对象的信息的获取方法、装置及设备 |
CN111523616A (zh) * | 2020-05-14 | 2020-08-11 | 中国铁道科学研究院集团有限公司铁道建筑研究所 | 基于卷积神经网络的粗粒土填料级配识别方法及应用系统 |
CN111652270A (zh) * | 2020-04-23 | 2020-09-11 | 中南大学 | 基于图像匹配的粗粒土填料级配自动识别方法及应用系统 |
CN112069860A (zh) * | 2019-06-10 | 2020-12-11 | 联想新视界(北京)科技有限公司 | 一种基于肢体姿势图像识别奶牛的方法和装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413149A (zh) * | 2013-09-06 | 2013-11-27 | 上海美琦浦悦通讯科技有限公司 | 复杂背景中实现静态目标检测和识别的方法 |
US8627096B2 (en) * | 2011-07-14 | 2014-01-07 | Sensible Vision, Inc. | System and method for providing secure access to an electronic device using both a screen gesture and facial biometrics |
CN103870798A (zh) * | 2012-12-18 | 2014-06-18 | 佳能株式会社 | 对象检测方法、对象检测设备以及图像拾取设备 |
CN106203490A (zh) * | 2016-06-30 | 2016-12-07 | 江苏大学 | 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法 |
CN205942090U (zh) * | 2016-04-29 | 2017-02-08 | 深圳市大疆创新科技有限公司 | 可穿戴设备及无人机系统 |
CN106529605A (zh) * | 2016-11-28 | 2017-03-22 | 东华大学 | 基于免疫理论的卷积神经网络模型的图像识别方法 |
-
2017
- 2017-04-26 CN CN201710282579.9A patent/CN108804971A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8627096B2 (en) * | 2011-07-14 | 2014-01-07 | Sensible Vision, Inc. | System and method for providing secure access to an electronic device using both a screen gesture and facial biometrics |
CN103870798A (zh) * | 2012-12-18 | 2014-06-18 | 佳能株式会社 | 对象检测方法、对象检测设备以及图像拾取设备 |
CN103413149A (zh) * | 2013-09-06 | 2013-11-27 | 上海美琦浦悦通讯科技有限公司 | 复杂背景中实现静态目标检测和识别的方法 |
CN205942090U (zh) * | 2016-04-29 | 2017-02-08 | 深圳市大疆创新科技有限公司 | 可穿戴设备及无人机系统 |
CN106203490A (zh) * | 2016-06-30 | 2016-12-07 | 江苏大学 | 一种安卓平台下基于属性学习和交互反馈的图像在线识别、检索方法 |
CN106529605A (zh) * | 2016-11-28 | 2017-03-22 | 东华大学 | 基于免疫理论的卷积神经网络模型的图像识别方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110110726A (zh) * | 2019-05-15 | 2019-08-09 | 深圳供电局有限公司 | 电力设备铭牌识别方法、装置、计算机设备和存储介质 |
CN112069860A (zh) * | 2019-06-10 | 2020-12-11 | 联想新视界(北京)科技有限公司 | 一种基于肢体姿势图像识别奶牛的方法和装置 |
CN110363146A (zh) * | 2019-07-16 | 2019-10-22 | 杭州睿琪软件有限公司 | 一种物体识别方法、装置、电子设备和存储介质 |
CN111147891A (zh) * | 2019-12-31 | 2020-05-12 | 杭州威佩网络科技有限公司 | 视频画面中对象的信息的获取方法、装置及设备 |
CN111652270A (zh) * | 2020-04-23 | 2020-09-11 | 中南大学 | 基于图像匹配的粗粒土填料级配自动识别方法及应用系统 |
CN111652270B (zh) * | 2020-04-23 | 2022-03-29 | 中南大学 | 基于图像匹配的粗粒土填料级配自动识别方法及应用系统 |
CN111523616A (zh) * | 2020-05-14 | 2020-08-11 | 中国铁道科学研究院集团有限公司铁道建筑研究所 | 基于卷积神经网络的粗粒土填料级配识别方法及应用系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108804971A (zh) | 一种图像识别系统、增强现实显示设备和图像识别方法 | |
KR102266529B1 (ko) | 이미지 기반의 데이터 처리 방법, 장치, 기기 및 판독 가능 저장 매체 | |
US10664060B2 (en) | Multimodal input-based interaction method and device | |
CN109902659B (zh) | 用于处理人体图像的方法和装置 | |
CN107369196B (zh) | 表情包制作方法、装置、存储介质及电子设备 | |
KR101887637B1 (ko) | 로봇 시스템 | |
CN107180226A (zh) | 一种基于组合神经网络的动态手势识别方法 | |
KR20190034021A (ko) | 객체를 인식하는 방법 및 장치 | |
CN105205454A (zh) | 自动捕捉目标物的系统和方法 | |
US9152857B2 (en) | System and method for detecting object using depth information | |
KR20150039252A (ko) | 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법 | |
CN109271533A (zh) | 一种多媒体文件检索方法 | |
CN108805035A (zh) | 基于手势识别的教学互动方法以及装置 | |
CN105917356A (zh) | 对象的基于轮廓的分类 | |
CN113516113A (zh) | 一种图像内容识别方法、装置、设备及存储介质 | |
CN110544287A (zh) | 一种配图处理方法及电子设备 | |
US20220366713A1 (en) | System and method for recognizing online handwriting | |
CN112925470B (zh) | 交互式电子白板的触摸控制方法、系统和可读介质 | |
CN106708950A (zh) | 用于智能机器人自学习系统的数据处理方法及装置 | |
CN108509876A (zh) | 针对视频的物体检测方法、装置、设备、存储介质及程序 | |
Abdulhamied et al. | Real-time recognition of American sign language using long-short term memory neural network and hand detection | |
Jamaludin et al. | Dynamic hand gesture to text using leap motion | |
CN116009682A (zh) | 互动展示方法、装置、电子设备及可读介质 | |
CN116580054A (zh) | 视频数据处理方法、装置、设备以及介质 | |
WO2023091131A1 (en) | Methods and systems for retrieving images based on semantic plane features |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20181113 |