CN105095919A - 图像识别方法和装置 - Google Patents
图像识别方法和装置 Download PDFInfo
- Publication number
- CN105095919A CN105095919A CN201510567452.2A CN201510567452A CN105095919A CN 105095919 A CN105095919 A CN 105095919A CN 201510567452 A CN201510567452 A CN 201510567452A CN 105095919 A CN105095919 A CN 105095919A
- Authority
- CN
- China
- Prior art keywords
- identified
- image
- degree
- recognition
- destination object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 29
- 238000010801 machine learning Methods 0.000 claims abstract description 19
- 230000019771 cognition Effects 0.000 claims description 27
- 238000012512 characterization method Methods 0.000 claims description 14
- 238000003909 pattern recognition Methods 0.000 claims description 11
- 238000013527 convolutional neural network Methods 0.000 claims description 9
- 230000002452 interceptive effect Effects 0.000 claims description 4
- 238000013528 artificial neural network Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 5
- 239000003550 marker Substances 0.000 abstract 3
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000006854 communication Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2111—Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/20—Scenes; Scene-specific elements in augmented reality scenes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/02—Methods for producing synthetic speech; Speech synthesisers
- G10L13/027—Concept to speech synthesisers; Generation of natural phrases from machine-based concepts
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Physiology (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了图像识别方法和装置。该方法的一具体实施方式包括:获取包含有待识别对象的待识别图像;将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数;当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。实现了将服务器自动识别与第三方标注信息进行结合,提升识别准确率,以及利用第三方标注信息对服务器使用的机器学习识别方式对应的识别模型进行训练,提升识别模型的训练效果。
Description
技术领域
本申请涉及计算机领域,具体涉及图像识别领域,尤其涉及图像识别方法和装置。
背景技术
在日常生活中,用户有时会有对拍摄的图像进行识别的需求。在已知的技术中,图像识别是通过对海量图像的特征进行分析而建立识别模型,采用识别模型对图像进行识别。然而,当采用上述方式对图像进行识别时,一方面,由于在识别过程中消耗资源较大,不适用于个人用户,另一方面,仅能根据机器输出的识别结果对识别模型进行调整,当输出的识别结果出现较多错误时,会引起识别模型的调整出现偏差,进而导致识别准确率降低。
发明内容
本申请提供了图像识别方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了图像识别方法,该方法包括:获取包含有待识别对象的待识别图像;将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。
第二方面,本申请提供了图像识别方法,该方法包括:接收客户端发送的包含有待识别对象的待识别图像;对待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;将目标对象的标识信息以及置信度参数发送至客户端。
第三方面,本申请提供了图像识别装置,该装置包括:获取单元,配置用于获取包含有待识别对象的待识别图像;交互单元,配置用于将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;判断单元,配置用于当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。
第四方面,本申请提供了图像识别装置,该装置包括:接收单元,配置用于接收客户端发送的包含有待识别对象的待识别图像;识别单元,配置用于对待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;发送单元,配置用于将目标对象的标识信息以及置信度参数发送至客户端。
本申请提供的图像识别方法和装置,通过获取包含有待识别对象的待识别图像;将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数;当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。实现了将服务器自动识别与第三方标注信息进行结合,提升识别准确率,以及利用第三方标注信息对服务器使用的机器学习识别方式对应的识别模型进行训练,以提升训练效果,从而进一步提升识别准确率。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2示出了根据本申请的图像识别方法的一个实施例的流程图;
图3示出了根据本申请的图像识别方法的另一个实施例的流程图;
图4示出了根据本申请的图像识别装置的一个实施例的结构示意图;
图5示出了根据本申请的图像识别装置的另一个实施例的结构示意图;
图6是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的图像识别方法或图像识别装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用,例如图像识别类应用、即时通信工具等。
终端设备101、102、103可以是具有显示屏并且支持网络通信的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上的图像识别类应用提供支持的后台服务器。后台服务器可以对接收到的待识别图像等数据进行分析等处理,并将处理结果(目标对象)反馈给终端设备。
需要说明的是,本申请实施例中,可以将获取待识别图像的一端称之为客户端,客户端并不特指某一类型终端,其可以为终端设备101、102、103或服务器105。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
请参考图2,其示出了根据本申请的图像识别方法的一个实施例的流程200。需要说明的是,本申请实施例所提供的图像识别方法一般由终端设备101、102、103执行,相应地,图像识别装置一般设置于终端设备101、102、103中。该方法包括以下步骤:
步骤201,获取包含有待识别对象的待识别图像。
在本实施例中,可以通过摄像头采集待识别图像,摄像头可以设置于终端设备上,终端设备可以包括但不限于移动终端、可穿戴设备(例如智能眼镜)。以摄像头设置于智能眼镜上为例,可以在用户佩戴智能眼镜时,可以利用摄像头采集摄像头的视角范围内的图像作为待识别图像。在本实施例中,可以响应于输入的图像采集指令,开启摄像头进行图像采集。例如,可以通过麦克风接收用户输入的语音信息,对语音信息进行解析得到图像采集指令,触发摄像头进行图像采集。在本实施例中,待识别图像中包含待识别对象,例如,当用户进入会议现场时,可以利用其佩戴的可穿戴设备上的摄像头采集与会议现场这一场景相关联的图像,则采集到的待识别图像中可以包含会议现场中的桌子、椅子等待识别对象。
在本实施例的一些可选的实现方式中,待识别对象包括以下至少一项:物体对象、场景对象、颜色对象。
步骤202,将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数。
在本实施例中,置信度参数表征待识别对象为目标对象的概率。在获取待识别图像之后,可以将待识别图像发送至服务器以对图像中的待识别对象进行识别,然后可以接收经服务器对待识别图像进行识别后得到的待识别对象对应的目标对象以及置信度参数。其中,服务器对待识别图像进行识别的一种可选识别方式为机器学习识别方式。在本实施例中,置信度参数可以用于表征在对待识别图像进行识别时,待识别对象为目标对象的概率即待识别对象与目标对象的样本数据的相似度。置信度参数的数值越高,则待识别对象为目标对象的概率越大。
步骤203,当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。
在本实施例中,一种可选的标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。在本实施例中,在得到服务器返回的置信度参数之后,可以进一步确定对待识别图像的识别结果。当置信度参数大于置信度阈值时,则可以将目标对象的标识信息作为识别结果。当置信度参数小于置信度阈值时,则可以从第三方平台获取与待识别图像相关联的标注信息。以待识别图像中包含一个圆形的桌子和三把椅子为例,当通过服务器以机器识别方式对该待识别图像进行识别时,例如,将待识别对象与目标对象即圆形桌子对象和椅子对象的样本数据进行匹配,在置信度参数大于置信度阈值的情况下,则可以将目标对象桌子对象、椅子对象的标识信息即桌子、椅子作为识别结果。在置信度参数小于置信度阈值的情况下,则可以将待识别图像发送至服务器,接收服务器返回的标注信息,以及将标注信息作为识别结果。
在本实施例中,可以采用以下方式获取对待识别对象的标注信息:可以将待识别图像发送至与服务器相关联的第三方平台,该第三方平台可以提供问答服务,其中,问答服务可以用于将用户咨询的问题以任务形式进行下发,由该第三方平台的注册用户将对该问题的答案发布在第三方平台。在将待识别图像发送至第三方平台之后,可以利用第三方平台上的问答服务来生成对待识别图像进行识别的任务,然后将任务下发给第三方平台上的注册用户。当注册用户接受对待识别图像进行识别的任务时,可以在向注册用户展示待识别图像的同时,提供信息输入区。注册用户可以判断待识别图像中包含哪些目标对象,然后可以将目标对象的名称、个数等信息在信息输入区进行填写,从而生成标注信息。例如,注册用户接受的对待识别图像进行识别的任务中的待识别图像包括一个圆形的桌子和三把椅子,则注册用户可以在信息输入区采用以下格式填写信息:圆形、桌子、一个、椅子、三把。然后,可以基于注册用户填写的信息,生成标注信息。该标注信息中包含有待识别对象对应的目标对象的标识信息即“圆形桌子、椅子”,还可以包含表征目标对象的个数的信息即“一个、三把”。
在本实施例的一些可选的实现方式中,还包括:将识别结果转换为语音信息,以及播放语音信息。这种实现方式中,在得到最终的识别结果之后,可以将识别结果转换为语音信息,然后将语音信息播报给用户。
在本实施例的一些可选的实现方式中,还包括:当置信度参数小于置信度阈值时,将标注信息发送至服务器,以作为训练样本用于对服务器所使用的机器学习识别方式对应的识别模型的训练。
本实施例的应用场景可以为:用户(例如盲人用户)利用佩戴的可穿戴设备上的摄像头采集当前所处的场景(例如会议现场)相关联的待识别图像(例如包含会议现场中的桌子、椅子等待识别对象的待识别图像)。然后,可以将待识别图像发送至服务器以对待识别图像进行识别,接收服务器返回待识别对象对应的目标对象的标识信息和置信度参数。当置信度参数大于置信度阈值时(例如正确识别出桌子、椅子对象),可以作为待识别对象对应的目标对象的标识信息作为识别结果,当置信度参数小于置信度阈值时,则可以将待识别图像发送至第三方平台,由第三方平台的注册用户确定待识别对象对应的目标对象(例如注册用户确定出待识别图像中包含桌子、椅子等目标对象),然后可以接收第三方平台返回的包含待识别对象对应的目标对象的标识信息的标注信息,将标注信息作为识别结果。在确定识别结果之后,可以将识别结果转换为语音信息进行播放。从而使得用户可以基于采集到的图像,较为准确地了解当前所处的场景的情况(例如场景中包含哪些物体)。进一步地,当置信度参数小于置信度阈值时,还可以将标注数据发送至服务器,以作为样本数据对服务器所使用的机器学习识别方式对应的识别模型进行训练,以提升识别模型的训练效果,使得在后续图像识别中,进一步提升识别准确率。
请参考图3,其示出了根据本申请的图像识别方法的一个实施例的流程300。需要说明的是,本申请实施例所提供的图像识别方法一般由服务器105执行,相应地,图像识别装置一般设置于服务器105中。该方法包括以下步骤:
步骤301,接收客户端发送的包含有待识别对象的待识别图像。
在本实施例中,待识别图像中包含待识别对象,例如,当用户进入会议现场时,可以利用智能眼镜上的摄像头采集图像,则采集到的图像中可以包含桌子、椅子等待识别对象。
步骤302,对待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数。
在本实施例中,置信度参数表征待识别对象为目标对象的概率。对待识别对象进行识别的一种可选方式为机器学习方式。机器学习方式可以包括但不限于:自动编码器(AutoEncoder)、稀疏编码(SparseCoding)、深信度网络(DeepBeliefNetworks)。上述机器学习方式也可称之为深度学习。
在本实施例的一些可选的实现方式中,对待识别图像进行识别包括:采用卷积神经网络模型对待识别图像进行识别。
在本实施例中,可以首先建立与识别待识别图像使用的机器学习识别方式对应的识别模型,然后,利用识别模型对待识别图像进行识别。利用机器学习方式对应的识别模型对待识别图像进行识别的原理概述如下:在利用识别模型(例如卷积神经网络模型)对待识别图像进行识别时,可以将待识别图像中的待识别对象用一些特征(例如尺度不变特征变换特征点)进行表示,生成输入向量,在经过识别模型对待识别图像进行识别后,可以得到表征待识别对象对应的目标对象的输出向量,识别模型可以用于指示输入向量到输出向量的映射关系,然后可以基于该映射关系,对待识别图像进行识别。
在本实施例中,在利用识别模型对待识别图像进行识别时,可以利用一些特征(例如尺度不变特征变换特征点)来表征待识别图像中的待识别对象,可以将待识别对象(例如桌子对象)在待识别图像中的特征与目标对象(例如桌子对象的样本数据)进行匹配,得到表征待识别对象为目标对象概率的置信度参数。
在本实施例的一些可选的实现方式中,还包括:接收客户端发送的训练用识别结果,训练用识别结果包括从第三方平台获取的与待识别图像相关联的标注信息,标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息;利用训练用识别结果,对机器学习方式对应的识别模型进行训练。
在本实施例中,客户端发送的训练用识别结果可以为在以机器学习方式对待识别图像进行识别得到的置信度参数小于置信度阈值时,客户端从第三方平台获取的与待识别图像相关联的标注信息。标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。以待识别图像中包含一个圆形的桌子和三把椅子为例,当以机器学习方式对待识别图像进行识别得到的置信度参数小于置信度阈值时,即未能准确识别出圆形的桌子或椅子对象时,则可以触发客户端将待识别图像发往第三方平台(例如提供问答服务的第三方平台)以获得对图像的标注信息。该标注信息可以为第三方平台上的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。例如,标注信息包括“圆形桌子、一个、椅子、三把”。
在本实施例中,可以利用标注信息对识别模型进行训练。以识别模型为卷积神经网络为例,可以将待识别图像的特征(例如尺度不变特征变换特征点)作为卷积神经网络的输入向量,将标注信息作为卷积神经网络的理想输出向量,由输入向量与输出向量组成向量对来对卷积神经网络进行训练,从而可以利用正确的识别结果即经过第三方平台的注册用户以人工方式对待识别图像进行识别后获取的标注信息,对识别模型进行训练,从而提高识别模型的训练效果,进而在后续的对待识别图像的识别中,提升识别准确率。
在本实施例中,可以根据待识别对象的类型,预先设置与待识别对象的类型对应的样本数据,然后利用样本数据对识别模型进行训练。例如,可以预先获取一些常见的应用场景的图像和以及对图像的标注信息作为训练数据。
步骤303,将目标对象的标识信息以及置信度参数发送至客户端。
在本实施例中,在对待识别图像进行识别之后,可以将待识别图像中的待识别对象对应的目标对象的标识信息以及得到的置信度参数发送至客户端。
请参考图4,其示出了根据本申请的图像识别装置的一个实施例的结构示意图。装置400包括:获取单元401,交互单元402,判断单元403。其中,获取单元401配置用于获取包含有待识别对象的待识别图像;交互单元402配置用于将待识别图像发送至服务器,以及接收服务器返回的对待识别图像进行识别而得到的待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;判断单元403配置用于当置信度参数大于置信度阈值时,将目标对象的标识信息作为识别结果;当置信度参数小于置信度阈值时,从第三方平台获取与待识别图像相关联的标注信息,以及将标注信息作为识别结果。
在本实施例的一些可选的实现方式中,标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息。
在本实施例的一些可选的实现方式中,装置400还包括:播放单元(未示出),配置用于将识别结果转换为语音信息,以及播放语音信息。
在本实施例的一些可选的实现方式中,装置400还包括:标注信息发送单元(未示出),配置用于当置信度参数小于置信度阈值时,将标注信息发送至服务器,以作为训练样本用于对服务器使用的机器学习识别方式对应的识别模型的训练。
在本实施例的一些可选的实现方式中,待识别对象包括以下至少一项:物体对象、场景对象、颜色对象。
请参考图5,其示出了根据本申请的图像识别装置的另一个实施例的结构示意图。装置500包括:接收单元501,识别单元502,发送单元503。其中,接收单元501配置用于接收客户端发送的包含有待识别对象的待识别图像;识别单元502配置用于对待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;发送单元503配置用于将目标对象的标识信息以及置信度参数发送至客户端。
在本实施例的一些可选的实现方式中,识别单元502包括:神经网络子单元(未示出),配置用于采用卷积神经网络模型对待识别图像进行识别。
在本实施例的一些可选的实现方式中,装置500还包括:识别结果接收单元(未示出),配置用于接收客户端发送的训练用识别结果,训练用识别结果包括从第三方平台获取的与待识别图像相关联的标注信息,标注信息包括由第三方平台的注册用户发布的包含待识别对象对应的目标对象的标识信息的信息;训练单元(未示出),配置用于利用训练用识别结果,对机器学习方式对应的识别模型进行训练。
下面参考图6,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统600的结构示意图。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM603中,还存储有系统600操作所需的各种程序和数据。CPU601、ROM602以及RAM603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取单元,接收单元,处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,获取单元还可以被描述为“获取包含有待识别对象的待识别图像”。
作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取包含有待识别对象的待识别图像;将所述待识别图像发送至服务器,以及接收服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数,所述置信度参数表征所述待识别对象为所述目标对象的概率;当所述置信度参数大于置信度阈值时,将所述目标对象的标识信息作为识别结果;当所述置信度参数小于置信度阈值时,从第三方平台获取与所述待识别图像相关联的标注信息,以及将所述标注信息作为识别结果。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:接收客户端发送的包含有待识别对象的待识别图像;对待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,置信度参数表征待识别对象为目标对象的概率;将目标对象的标识信息以及置信度参数发送至客户端。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (16)
1.一种图像识别方法,其特征在于,所述方法包括:
获取包含有待识别对象的待识别图像;
将所述待识别图像发送至服务器,以及接收所述服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数,所述置信度参数表征所述待识别对象为所述目标对象的概率;
当所述置信度参数大于置信度阈值时,将所述目标对象的标识信息作为识别结果;当所述置信度参数小于置信度阈值时,从第三方平台获取与所述待识别图像相关联的标注信息,以及将所述标注信息作为识别结果。
2.根据权利要求1所述的方法,其特征在于,所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:将所述识别结果转换为语音信息,以及播放所述语音信息。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:当所述置信度参数小于置信度阈值时,将所述标注信息发送至所述服务器,以作为训练样本用于对所述服务器所使用的机器学习识别方式对应的识别模型的训练。
5.根据权利要求1-4之一所述的方法,其特征在于,所述待识别对象包括以下至少一项:物体对象、场景对象、颜色对象。
6.一种图像识别方法,其特征在于,所述方法包括:
接收客户端发送的包含有待识别对象的待识别图像;
对所述待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,所述置信度参数表征所述待识别对象为所述目标对象的概率;
将所述目标对象的标识信息以及置信度参数发送至所述客户端。
7.根据权利要求6所述的方法,其特征在于,所述对所述待识别图像进行识别包括:采用卷积神经网络模型对所述待识别图像进行识别。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
接收客户端发送的训练用识别结果,所述训练用识别结果包括从第三方平台获取的与所述待识别图像相关联的标注信息,所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息;
利用所述训练用识别结果,对识别待识别图像所使用的机器学习识别方式对应的识别模型进行训练。
9.一种图像识别装置,其特征在于,所述装置包括:
获取单元,配置用于获取包含有待识别对象的待识别图像;
交互单元,配置用于将所述待识别图像发送至服务器,以及接收服务器返回的对所述待识别图像进行识别而得到的所述待识别对象对应的目标对象的标识信息以及置信度参数,所述置信度参数表征所述待识别对象为所述目标对象的概率;
判断单元,配置用于当所述置信度参数大于置信度阈值时,将所述目标对象的标识信息作为识别结果;当所述置信度参数小于置信度阈值时,从第三方平台获取与所述待识别图像相关联的标注信息,以及将所述标注信息作为识别结果。
10.根据权利要求9所述的装置,其特征在于,所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息。
11.根据权利要求9所述的装置,其特征在于,所述装置还包括:
播放单元,配置用于将所述识别结果转换为语音信息,以及播放所述语音信息。
12.根据权利要求9所述的装置,其特征在于,所述装置还包括:
标注信息发送单元,配置用于当所述置信度参数小于置信度阈值时,将所述标注信息发送至所述服务器,以作为训练样本用于对所述服务器所使用的机器学习识别方式对应的识别模型的训练。
13.根据权利要求9-12之一所述的装置,其特征在于,所述待识别对象包括以下至少一项:物体对象、场景对象、颜色对象。
14.一种图像识别装置,其特征在于,所述装置包括:
接收单元,配置用于接收客户端发送的包含有待识别对象的待识别图像;
识别单元,配置用于对所述待识别图像进行识别,得到待识别对象对应的目标对象的标识信息以及置信度参数,所述置信度参数表征所述待识别对象为所述目标对象的概率;
发送单元,配置用于将所述目标对象的标识信息以及置信度参数发送至所述客户端。
15.根据权利要求14所述的装置,其特征在于,所述识别单元包括:
神经网络子单元,配置用于采用卷积神经网络模型对所述待识别图像进行识别。
16.根据权利要求15所述的装置,其特征在于,所述装置还包括:
识别结果接收单元,配置用于接收客户端发送的训练用识别结果,所述训练用识别结果包括从第三方平台获取的与所述待识别图像相关联的标注信息,所述标注信息包括由所述第三方平台的注册用户发布的包含所述待识别对象对应的目标对象的标识信息的信息;
训练单元,配置用于利用所述训练用识别结果,对识别待识别图像所使用的机器学习识别方式对应的识别模型进行训练。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510567452.2A CN105095919A (zh) | 2015-09-08 | 2015-09-08 | 图像识别方法和装置 |
US15/535,006 US10796685B2 (en) | 2015-09-08 | 2015-12-01 | Method and device for image recognition |
PCT/CN2015/096132 WO2017041366A1 (zh) | 2015-09-08 | 2015-12-01 | 图像识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510567452.2A CN105095919A (zh) | 2015-09-08 | 2015-09-08 | 图像识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105095919A true CN105095919A (zh) | 2015-11-25 |
Family
ID=54576304
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510567452.2A Pending CN105095919A (zh) | 2015-09-08 | 2015-09-08 | 图像识别方法和装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10796685B2 (zh) |
CN (1) | CN105095919A (zh) |
WO (1) | WO2017041366A1 (zh) |
Cited By (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106022249A (zh) * | 2016-05-16 | 2016-10-12 | 乐视控股(北京)有限公司 | 动态对象识别方法、装置及系统 |
WO2017041366A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN106682590A (zh) * | 2016-12-07 | 2017-05-17 | 浙江宇视科技有限公司 | 一种监控业务的处理方法以及服务器 |
CN106874845A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 图像识别的方法和装置 |
CN107145816A (zh) * | 2017-02-24 | 2017-09-08 | 北京悉见科技有限公司 | 对象识别跟踪方法及装置 |
CN107223261A (zh) * | 2016-12-07 | 2017-09-29 | 深圳前海达闼云端智能科技有限公司 | 人机混合决策方法和装置 |
CN107276974A (zh) * | 2017-03-10 | 2017-10-20 | 阿里巴巴集团控股有限公司 | 一种信息处理方法及装置 |
CN107291737A (zh) * | 2016-04-01 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 敏感图像识别方法及装置 |
WO2017181723A1 (zh) * | 2016-04-20 | 2017-10-26 | 广州视源电子科技股份有限公司 | 细纱断裂的检测方法和系统 |
CN107625527A (zh) * | 2016-07-19 | 2018-01-26 | 杭州海康威视数字技术股份有限公司 | 一种测谎方法及装置 |
CN107758761A (zh) * | 2017-09-28 | 2018-03-06 | 珠海格力电器股份有限公司 | 净水设备及其控制方法、装置、存储介质和处理器 |
CN107786867A (zh) * | 2016-08-26 | 2018-03-09 | 原相科技股份有限公司 | 基于深度学习架构的图像辨识方法及系统 |
CN107832662A (zh) * | 2017-09-27 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 一种获取图片标注数据的方法和系统 |
CN107908641A (zh) * | 2017-09-27 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 一种获取图片标注数据的方法和系统 |
CN108172213A (zh) * | 2017-12-26 | 2018-06-15 | 北京百度网讯科技有限公司 | 娇喘音频识别方法、装置、设备及计算机可读介质 |
CN108171274A (zh) * | 2018-01-17 | 2018-06-15 | 百度在线网络技术(北京)有限公司 | 用于识别动物的方法和装置 |
CN108389316A (zh) * | 2018-03-02 | 2018-08-10 | 北京京东尚科信息技术有限公司 | 自动售货方法、装置和计算机可读存储介质 |
CN108573268A (zh) * | 2017-03-10 | 2018-09-25 | 北京旷视科技有限公司 | 图像识别方法和装置、图像处理方法和装置及存储介质 |
WO2018170663A1 (zh) * | 2017-03-20 | 2018-09-27 | 深圳前海达闼云端智能科技有限公司 | 图像标注方法、装置及电子设备 |
CN108664897A (zh) * | 2018-04-18 | 2018-10-16 | 平安科技(深圳)有限公司 | 票据识别方法、装置及存储介质 |
CN108734718A (zh) * | 2018-05-16 | 2018-11-02 | 北京市商汤科技开发有限公司 | 用于图像分割的处理方法、装置、产品、存储介质及设备 |
CN108897786A (zh) * | 2018-06-08 | 2018-11-27 | Oppo广东移动通信有限公司 | 应用程序的推荐方法、装置、存储介质及移动终端 |
CN109035579A (zh) * | 2018-06-29 | 2018-12-18 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN109035558A (zh) * | 2018-06-12 | 2018-12-18 | 武汉市哈哈便利科技有限公司 | 一种用于无人售货柜的商品识别算法在线学习系统 |
CN109255325A (zh) * | 2018-09-05 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 用于可穿戴设备的图像识别方法和装置 |
CN109409423A (zh) * | 2018-10-15 | 2019-03-01 | 珠海格力电器股份有限公司 | 一种图像识别方法、装置、终端及可读存储介质 |
CN109522947A (zh) * | 2018-10-31 | 2019-03-26 | 联想(北京)有限公司 | 识别方法和设备 |
CN109783674A (zh) * | 2018-12-13 | 2019-05-21 | 平安普惠企业管理有限公司 | 图片识别方法、装置、系统、计算机设备及存储介质 |
CN109817201A (zh) * | 2019-03-29 | 2019-05-28 | 北京金山安全软件有限公司 | 一种语言学习方法、装置、电子设备及可读存储介质 |
CN109886338A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研精准汽车科技有限公司 | 一种智能汽车测试图像标注方法、装置、系统及存储介质 |
CN109981755A (zh) * | 2019-03-12 | 2019-07-05 | 深圳灵图慧视科技有限公司 | 图像识别方法、装置和电子设备 |
CN110245668A (zh) * | 2018-03-09 | 2019-09-17 | 腾讯科技(深圳)有限公司 | 基于图像识别的终端信息获取方法、获取装置及存储介质 |
CN110291538A (zh) * | 2017-02-16 | 2019-09-27 | 国际商业机器公司 | 过滤图像分类输出分布的图像识别 |
CN110309735A (zh) * | 2019-06-14 | 2019-10-08 | 平安科技(深圳)有限公司 | 异常侦测方法、装置、服务器及存储介质 |
CN110750667A (zh) * | 2018-07-05 | 2020-02-04 | 第四范式(北京)技术有限公司 | 辅助标注方法、装置、设备及存储介质 |
CN111089388A (zh) * | 2018-10-18 | 2020-05-01 | 珠海格力电器股份有限公司 | 控制空调的方法及系统、空调器、家用电器 |
CN111414946A (zh) * | 2020-03-12 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111444746A (zh) * | 2019-01-16 | 2020-07-24 | 北京亮亮视野科技有限公司 | 一种基于神经网络模型的信息标注方法 |
US10726573B2 (en) | 2016-08-26 | 2020-07-28 | Pixart Imaging Inc. | Object detection method and system based on machine learning |
CN111611871A (zh) * | 2020-04-26 | 2020-09-01 | 深圳奇迹智慧网络有限公司 | 图像识别方法、装置、计算机设备和计算机可读存储介质 |
CN112288883A (zh) * | 2020-10-30 | 2021-01-29 | 北京市商汤科技开发有限公司 | 作业指导信息的提示方法、装置、电子设备及存储介质 |
CN112507605A (zh) * | 2020-11-04 | 2021-03-16 | 清华大学 | 基于AnoGAN的配电网异常检测方法 |
CN114363206A (zh) * | 2021-12-28 | 2022-04-15 | 奇安信科技集团股份有限公司 | 终端资产识别方法、装置、计算设备及计算机存储介质 |
CN114945102A (zh) * | 2020-07-14 | 2022-08-26 | 海信视像科技股份有限公司 | 显示设备及人物识别展示的方法 |
CN114998665A (zh) * | 2022-08-04 | 2022-09-02 | 创新奇智(广州)科技有限公司 | 一种图像类别识别方法、装置、电子设备及存储介质 |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2956780A1 (en) * | 2016-02-01 | 2017-08-01 | Mitchell International, Inc. | Methods for improving automated damage appraisal and devices thereof |
US11222627B1 (en) * | 2017-11-22 | 2022-01-11 | Educational Testing Service | Exploring ASR-free end-to-end modeling to improve spoken language understanding in a cloud-based dialog system |
US20210157331A1 (en) * | 2018-04-19 | 2021-05-27 | Positec Power Tools (Suzhou) Co., Ltd | Self-moving device, server, and automatic working system thereof |
CN108664997A (zh) * | 2018-04-20 | 2018-10-16 | 西南交通大学 | 基于级联Faster R-CNN的高铁接触网等电位线不良状态检测方法 |
CN109409325B (zh) * | 2018-11-09 | 2022-05-31 | 联想(北京)有限公司 | 一种识别方法和电子设备 |
WO2020100540A1 (ja) * | 2018-11-15 | 2020-05-22 | ソニー株式会社 | 情報処理装置、情報処理システム、および情報処理方法、並びにプログラム |
CN109583499B (zh) * | 2018-11-30 | 2021-04-16 | 河海大学常州校区 | 一种基于无监督sdae网络的输电线路背景目标分类系统 |
CN111611828A (zh) * | 2019-02-26 | 2020-09-01 | 北京嘀嘀无限科技发展有限公司 | 一种非正常图像识别方法、装置、电子设备及存储介质 |
CN112949667A (zh) * | 2019-12-09 | 2021-06-11 | 北京金山云网络技术有限公司 | 图像识别方法、系统、电子设备及存储介质 |
CN111429512B (zh) * | 2020-04-22 | 2023-08-25 | 北京小马慧行科技有限公司 | 图像处理方法和装置、存储介质及处理器 |
US11295167B2 (en) * | 2020-04-27 | 2022-04-05 | Toshiba Global Commerce Solutions Holdings Corporation | Automated image curation for machine learning deployments |
CN111783775A (zh) * | 2020-06-30 | 2020-10-16 | 京东数字科技控股有限公司 | 一种图像采集方法、装置、设备和计算机可读存储介质 |
CN112584213A (zh) * | 2020-12-11 | 2021-03-30 | 海信视像科技股份有限公司 | 一种显示设备和图像识别结果的展示方法 |
CN112613553B (zh) * | 2020-12-18 | 2022-03-08 | 中电金信软件有限公司 | 图片样本集生成方法、装置、计算机设备和存储介质 |
CN112597895B (zh) * | 2020-12-22 | 2024-04-26 | 阿波罗智联(北京)科技有限公司 | 基于偏移量检测的置信度确定方法、路侧设备及云控平台 |
CN112580745A (zh) * | 2020-12-29 | 2021-03-30 | 北京五八信息技术有限公司 | 图像识别方法、装置、电子设备和计算机可读介质 |
US11869319B2 (en) * | 2020-12-31 | 2024-01-09 | Datalogic Usa, Inc. | Fixed retail scanner with annotated video and related methods |
CN113239804B (zh) * | 2021-05-13 | 2023-06-02 | 杭州睿胜软件有限公司 | 图像识别方法、可读存储介质及图像识别系统 |
CN113128247B (zh) * | 2021-05-17 | 2024-04-12 | 阳光电源股份有限公司 | 一种图像定位标识验证方法及服务器 |
CN113344055B (zh) * | 2021-05-28 | 2023-08-22 | 北京百度网讯科技有限公司 | 图像识别方法、装置、电子设备和介质 |
CN113378836A (zh) * | 2021-06-28 | 2021-09-10 | 北京百度网讯科技有限公司 | 图像识别方法、装置、设备、介质及程序产品 |
US11960569B2 (en) * | 2021-06-29 | 2024-04-16 | 7-Eleven, Inc. | System and method for refining an item identification model based on feedback |
CN114708539A (zh) * | 2022-04-19 | 2022-07-05 | 广州欢聚时代信息科技有限公司 | 图像类型识别方法及其装置、设备、介质、产品 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064981A (zh) * | 2013-01-18 | 2013-04-24 | 浪潮电子信息产业股份有限公司 | 一种基于云计算的图片搜索方法 |
CN103942049A (zh) * | 2014-04-14 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 增强现实的实现方法、客户端装置和服务器 |
CN104679863A (zh) * | 2015-02-28 | 2015-06-03 | 武汉烽火众智数字技术有限责任公司 | 一种基于深度学习的以图搜图方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8625902B2 (en) | 2010-07-30 | 2014-01-07 | Qualcomm Incorporated | Object recognition using incremental feature extraction |
JP5891409B2 (ja) * | 2012-01-12 | 2016-03-23 | パナソニックIpマネジメント株式会社 | 特徴抽出装置、特徴抽出方法、および特徴抽出プログラム |
CN104281833B (zh) * | 2013-07-08 | 2018-12-18 | 深圳市腾讯计算机系统有限公司 | 色情图像识别方法和装置 |
US10242036B2 (en) * | 2013-08-14 | 2019-03-26 | Ricoh Co., Ltd. | Hybrid detection recognition system |
US9773209B1 (en) * | 2014-07-01 | 2017-09-26 | Google Inc. | Determining supervised training data including features pertaining to a class/type of physical location and time location was visited |
CN105095919A (zh) * | 2015-09-08 | 2015-11-25 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
-
2015
- 2015-09-08 CN CN201510567452.2A patent/CN105095919A/zh active Pending
- 2015-12-01 US US15/535,006 patent/US10796685B2/en active Active
- 2015-12-01 WO PCT/CN2015/096132 patent/WO2017041366A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103064981A (zh) * | 2013-01-18 | 2013-04-24 | 浪潮电子信息产业股份有限公司 | 一种基于云计算的图片搜索方法 |
CN103942049A (zh) * | 2014-04-14 | 2014-07-23 | 百度在线网络技术(北京)有限公司 | 增强现实的实现方法、客户端装置和服务器 |
CN104679863A (zh) * | 2015-02-28 | 2015-06-03 | 武汉烽火众智数字技术有限责任公司 | 一种基于深度学习的以图搜图方法和系统 |
Cited By (66)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017041366A1 (zh) * | 2015-09-08 | 2017-03-16 | 北京百度网讯科技有限公司 | 图像识别方法和装置 |
CN107291737B (zh) * | 2016-04-01 | 2019-05-14 | 腾讯科技(深圳)有限公司 | 敏感图像识别方法及装置 |
CN107291737A (zh) * | 2016-04-01 | 2017-10-24 | 腾讯科技(深圳)有限公司 | 敏感图像识别方法及装置 |
WO2017181723A1 (zh) * | 2016-04-20 | 2017-10-26 | 广州视源电子科技股份有限公司 | 细纱断裂的检测方法和系统 |
CN106022249A (zh) * | 2016-05-16 | 2016-10-12 | 乐视控股(北京)有限公司 | 动态对象识别方法、装置及系统 |
CN107625527B (zh) * | 2016-07-19 | 2021-04-20 | 杭州海康威视数字技术股份有限公司 | 一种测谎方法及装置 |
CN107625527A (zh) * | 2016-07-19 | 2018-01-26 | 杭州海康威视数字技术股份有限公司 | 一种测谎方法及装置 |
US10726573B2 (en) | 2016-08-26 | 2020-07-28 | Pixart Imaging Inc. | Object detection method and system based on machine learning |
US10726291B2 (en) | 2016-08-26 | 2020-07-28 | Pixart Imaging Inc. | Image recognition method and system based on deep learning |
CN107786867A (zh) * | 2016-08-26 | 2018-03-09 | 原相科技股份有限公司 | 基于深度学习架构的图像辨识方法及系统 |
CN106682590B (zh) * | 2016-12-07 | 2023-08-22 | 浙江宇视科技有限公司 | 一种监控业务的处理方法以及服务器 |
CN107223261A (zh) * | 2016-12-07 | 2017-09-29 | 深圳前海达闼云端智能科技有限公司 | 人机混合决策方法和装置 |
CN106682590A (zh) * | 2016-12-07 | 2017-05-17 | 浙江宇视科技有限公司 | 一种监控业务的处理方法以及服务器 |
CN106874845A (zh) * | 2016-12-30 | 2017-06-20 | 东软集团股份有限公司 | 图像识别的方法和装置 |
CN110291538A (zh) * | 2017-02-16 | 2019-09-27 | 国际商业机器公司 | 过滤图像分类输出分布的图像识别 |
CN107145816A (zh) * | 2017-02-24 | 2017-09-08 | 北京悉见科技有限公司 | 对象识别跟踪方法及装置 |
CN107276974B (zh) * | 2017-03-10 | 2020-11-03 | 创新先进技术有限公司 | 一种信息处理方法及装置 |
CN112383564A (zh) * | 2017-03-10 | 2021-02-19 | 创新先进技术有限公司 | 一种信息处理方法及装置 |
CN108573268A (zh) * | 2017-03-10 | 2018-09-25 | 北京旷视科技有限公司 | 图像识别方法和装置、图像处理方法和装置及存储介质 |
CN112383564B (zh) * | 2017-03-10 | 2024-03-15 | 创新先进技术有限公司 | 一种信息处理方法及装置 |
CN107276974A (zh) * | 2017-03-10 | 2017-10-20 | 阿里巴巴集团控股有限公司 | 一种信息处理方法及装置 |
WO2018170663A1 (zh) * | 2017-03-20 | 2018-09-27 | 深圳前海达闼云端智能科技有限公司 | 图像标注方法、装置及电子设备 |
US11321583B2 (en) | 2017-03-20 | 2022-05-03 | Cloudminds Robotics Co., Ltd. | Image annotating method and electronic device |
CN107908641B (zh) * | 2017-09-27 | 2021-03-19 | 百度在线网络技术(北京)有限公司 | 一种获取图片标注数据的方法和系统 |
CN107908641A (zh) * | 2017-09-27 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 一种获取图片标注数据的方法和系统 |
CN107832662A (zh) * | 2017-09-27 | 2018-03-23 | 百度在线网络技术(北京)有限公司 | 一种获取图片标注数据的方法和系统 |
CN107758761B (zh) * | 2017-09-28 | 2019-10-22 | 珠海格力电器股份有限公司 | 净水设备及其控制方法、装置、存储介质和处理器 |
CN107758761A (zh) * | 2017-09-28 | 2018-03-06 | 珠海格力电器股份有限公司 | 净水设备及其控制方法、装置、存储介质和处理器 |
CN108172213A (zh) * | 2017-12-26 | 2018-06-15 | 北京百度网讯科技有限公司 | 娇喘音频识别方法、装置、设备及计算机可读介质 |
CN108171274A (zh) * | 2018-01-17 | 2018-06-15 | 百度在线网络技术(北京)有限公司 | 用于识别动物的方法和装置 |
CN108171274B (zh) * | 2018-01-17 | 2019-08-09 | 百度在线网络技术(北京)有限公司 | 用于识别动物的方法和装置 |
US11461753B2 (en) | 2018-03-02 | 2022-10-04 | Beijing Jingdong Shangke Information Technology Co., Ltd. | Automatic vending method and apparatus, and computer-readable storage medium |
CN108389316A (zh) * | 2018-03-02 | 2018-08-10 | 北京京东尚科信息技术有限公司 | 自动售货方法、装置和计算机可读存储介质 |
CN110245668A (zh) * | 2018-03-09 | 2019-09-17 | 腾讯科技(深圳)有限公司 | 基于图像识别的终端信息获取方法、获取装置及存储介质 |
CN108664897A (zh) * | 2018-04-18 | 2018-10-16 | 平安科技(深圳)有限公司 | 票据识别方法、装置及存储介质 |
CN108734718A (zh) * | 2018-05-16 | 2018-11-02 | 北京市商汤科技开发有限公司 | 用于图像分割的处理方法、装置、产品、存储介质及设备 |
CN108734718B (zh) * | 2018-05-16 | 2021-04-06 | 北京市商汤科技开发有限公司 | 用于图像分割的处理方法、装置、存储介质及设备 |
CN108897786B (zh) * | 2018-06-08 | 2021-06-08 | Oppo广东移动通信有限公司 | 应用程序的推荐方法、装置、存储介质及移动终端 |
CN108897786A (zh) * | 2018-06-08 | 2018-11-27 | Oppo广东移动通信有限公司 | 应用程序的推荐方法、装置、存储介质及移动终端 |
CN109035558A (zh) * | 2018-06-12 | 2018-12-18 | 武汉市哈哈便利科技有限公司 | 一种用于无人售货柜的商品识别算法在线学习系统 |
CN109035579A (zh) * | 2018-06-29 | 2018-12-18 | 深圳和而泰数据资源与云技术有限公司 | 一种商品识别方法、无人售货机及计算机可读存储介质 |
CN110750667A (zh) * | 2018-07-05 | 2020-02-04 | 第四范式(北京)技术有限公司 | 辅助标注方法、装置、设备及存储介质 |
CN109255325A (zh) * | 2018-09-05 | 2019-01-22 | 百度在线网络技术(北京)有限公司 | 用于可穿戴设备的图像识别方法和装置 |
CN109409423A (zh) * | 2018-10-15 | 2019-03-01 | 珠海格力电器股份有限公司 | 一种图像识别方法、装置、终端及可读存储介质 |
CN111089388A (zh) * | 2018-10-18 | 2020-05-01 | 珠海格力电器股份有限公司 | 控制空调的方法及系统、空调器、家用电器 |
US11852357B2 (en) | 2018-10-18 | 2023-12-26 | Gree Electric Appliances, Inc. Of Zhuhai | Method for controlling air conditioner, air conditioner |
CN109522947B (zh) * | 2018-10-31 | 2022-03-25 | 联想(北京)有限公司 | 识别方法和设备 |
CN109522947A (zh) * | 2018-10-31 | 2019-03-26 | 联想(北京)有限公司 | 识别方法和设备 |
CN109783674A (zh) * | 2018-12-13 | 2019-05-21 | 平安普惠企业管理有限公司 | 图片识别方法、装置、系统、计算机设备及存储介质 |
CN111444746A (zh) * | 2019-01-16 | 2020-07-24 | 北京亮亮视野科技有限公司 | 一种基于神经网络模型的信息标注方法 |
CN111444746B (zh) * | 2019-01-16 | 2024-01-30 | 北京亮亮视野科技有限公司 | 一种基于神经网络模型的信息标注方法 |
CN109886338A (zh) * | 2019-02-25 | 2019-06-14 | 苏州清研精准汽车科技有限公司 | 一种智能汽车测试图像标注方法、装置、系统及存储介质 |
CN109981755A (zh) * | 2019-03-12 | 2019-07-05 | 深圳灵图慧视科技有限公司 | 图像识别方法、装置和电子设备 |
CN109817201B (zh) * | 2019-03-29 | 2021-03-26 | 北京金山安全软件有限公司 | 一种语言学习方法、装置、电子设备及可读存储介质 |
CN109817201A (zh) * | 2019-03-29 | 2019-05-28 | 北京金山安全软件有限公司 | 一种语言学习方法、装置、电子设备及可读存储介质 |
CN110309735A (zh) * | 2019-06-14 | 2019-10-08 | 平安科技(深圳)有限公司 | 异常侦测方法、装置、服务器及存储介质 |
CN111414946A (zh) * | 2020-03-12 | 2020-07-14 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111414946B (zh) * | 2020-03-12 | 2022-09-23 | 腾讯科技(深圳)有限公司 | 基于人工智能的医疗影像的噪声数据识别方法和相关装置 |
CN111611871B (zh) * | 2020-04-26 | 2023-11-28 | 深圳奇迹智慧网络有限公司 | 图像识别方法、装置、计算机设备和计算机可读存储介质 |
CN111611871A (zh) * | 2020-04-26 | 2020-09-01 | 深圳奇迹智慧网络有限公司 | 图像识别方法、装置、计算机设备和计算机可读存储介质 |
CN114945102A (zh) * | 2020-07-14 | 2022-08-26 | 海信视像科技股份有限公司 | 显示设备及人物识别展示的方法 |
CN112288883A (zh) * | 2020-10-30 | 2021-01-29 | 北京市商汤科技开发有限公司 | 作业指导信息的提示方法、装置、电子设备及存储介质 |
CN112507605A (zh) * | 2020-11-04 | 2021-03-16 | 清华大学 | 基于AnoGAN的配电网异常检测方法 |
CN114363206A (zh) * | 2021-12-28 | 2022-04-15 | 奇安信科技集团股份有限公司 | 终端资产识别方法、装置、计算设备及计算机存储介质 |
CN114998665A (zh) * | 2022-08-04 | 2022-09-02 | 创新奇智(广州)科技有限公司 | 一种图像类别识别方法、装置、电子设备及存储介质 |
CN114998665B (zh) * | 2022-08-04 | 2022-11-01 | 创新奇智(广州)科技有限公司 | 一种图像类别识别方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20180204562A1 (en) | 2018-07-19 |
US10796685B2 (en) | 2020-10-06 |
WO2017041366A1 (zh) | 2017-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105095919A (zh) | 图像识别方法和装置 | |
US11978245B2 (en) | Method and apparatus for generating image | |
CN110245213B (zh) | 调查问卷生成方法、装置、设备和存储介质 | |
CN108830235B (zh) | 用于生成信息的方法和装置 | |
CN108038880B (zh) | 用于处理图像的方法和装置 | |
CN107393541B (zh) | 信息验证方法和装置 | |
US10691928B2 (en) | Method and apparatus for facial recognition | |
CN109993150B (zh) | 用于识别年龄的方法和装置 | |
CN109740018B (zh) | 用于生成视频标签模型的方法和装置 | |
CN108960316B (zh) | 用于生成模型的方法和装置 | |
CN112700010B (zh) | 基于联邦学习的特征补全方法、装置、设备及存储介质 | |
KR102002024B1 (ko) | 객체 라벨링 처리 방법 및 객체 관리 서버 | |
CN109829432B (zh) | 用于生成信息的方法和装置 | |
CN105049421A (zh) | 基于用户使用行为特征的认证方法、服务器、终端及系统 | |
CN109784304B (zh) | 用于标注牙齿图像的方法和装置 | |
CN105894028B (zh) | 用户识别方法和装置 | |
CN109214501B (zh) | 用于识别信息的方法和装置 | |
CN110046571B (zh) | 用于识别年龄的方法和装置 | |
CN108288064B (zh) | 用于生成图片的方法和装置 | |
CN112839223B (zh) | 图像压缩方法、装置、存储介质及电子设备 | |
CN110008926B (zh) | 用于识别年龄的方法和装置 | |
CN108921792B (zh) | 用于处理图片的方法和装置 | |
CN108921138B (zh) | 用于生成信息的方法和装置 | |
CN112672202B (zh) | 弹幕处理方法、设备和存储介质 | |
CN110400560B (zh) | 数据处理方法及装置、存储介质、电子装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20151125 |