CN107316035A - 基于深度学习神经网络的对象识别方法及装置 - Google Patents
基于深度学习神经网络的对象识别方法及装置 Download PDFInfo
- Publication number
- CN107316035A CN107316035A CN201710669780.2A CN201710669780A CN107316035A CN 107316035 A CN107316035 A CN 107316035A CN 201710669780 A CN201710669780 A CN 201710669780A CN 107316035 A CN107316035 A CN 107316035A
- Authority
- CN
- China
- Prior art keywords
- scene
- view data
- model
- object identifying
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000013135 deep learning Methods 0.000 title claims abstract description 17
- 230000007935 neutral effect Effects 0.000 title claims abstract description 17
- 230000006835 compression Effects 0.000 claims description 5
- 238000007906 compression Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000003068 static effect Effects 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明提供了一种基于深度学习神经网络的对象识别方法及装置。该对象识别方法包括:获取图像数据,该图像数据为对象所处场景的图像数据;利用场景识别模型确定图像数据对应的场景;利用场景对应的对象识别模型对对象进行识别。通过采用本发明的对象识别方法,提高了对象识别准确率,具有较好的应用前景。
Description
技术领域
本发明涉及神经网络技术领域,特别是一种基于深度学习神经网络的对象识别方法及装置。
背景技术
目前,在神经网络领域,由浅层的人工神经网络所获取的特征来进行分类和识别。在复杂环境条件下,这些浅层特征对识别来说是不够的。同时,图像识别效果容易受到环境的影响。在不同的场景下,图像匹配的相似度会出现波动,某些场景下,识别的正确率会急剧下降。目前,输入的图像通常被直接输入到对象识别模块进行识别,识别准确率较低。
发明内容
鉴于上述情况,本发明的一个方面提供了一种基于深度学习神经网络的对象识别方法和装置,能够提高识别准确率。
一方面,本发明提供了一种基于深度学习神经网络的对象识别方法,包括:获取图像数据,所述图像数据为对象所处场景的图像数据;利用场景识别模型确定所述图像数据对应的场景;利用所述场景对应的对象识别模型对所述对象进行识别。
在一个实施例中,所述对象识别方法还包括:获取不同场景的样本数据;对所述不同的场景的样本数据进行学习,获得所述场景模型。
在一个实施例中,在所述利用场景识别模型确定所述图像数据对应的场景之前,还包括:存储所获取的图像数据;对所述图像数据进行预处理,得到预处理后的图像数据,所述预处理包括缩放处理、压缩处理和挖框中的至少一个,其中,所述利用场景识别模型确定所述图像数据对应的场景,包括:将所述预处理后图像数据输入到所述场景识别模型,以确定所述预处理后的图像数据对应的场景;其中所述利用场景对应的对象识别模型对所述对象进行识别,包括:利用所述场景对应的对象识别模型对所述存储的图像数据中包含的对象进行识别。
在一个实施例中,所述利用场景识别模型确定所述图像数据对应的场景,包括:将所述图像数据输入到所述场景识别模型中;根据预设的场景阈值确定所述图像数据对应的场景。
在一个实施例中,不同场景对应的对象识别模型的权重和偏置中的至少一个不相同,其中所述利用所述场景对应的对象识别模型对所述对象进行识别,包括:调用与所述场景对应的对象识别模型的权重和偏置对所述对象进行识别。
在一个实施例中,所述对象为人脸。
在一个实施例中,所述场景包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光。
本发明的另一方面提供了一种基于深度学习神经网络的对象识别装置,所述装置包括:获取单元,用于获取图像数据,所述图像数据为对象所处场景的图像数据;确定单元,用于利用场景识别模型确定所述图像数据对应的场景;识别单元,用于利用所述场景对应的对象识别模型对所述对象进行识别。
在一个实施例中,所述获取单元还用于获取不同场景的样本数据,并对所述不同的场景的样本数据进行学习,获得所述场景识别模型。
在一个实施例中,所述对象识别装置还包括:存储单元,用于存储所获取的图像数据;预处理单元,用于对所存储的图像数据进行预处理,得到预处理后的图像数据,所述预处理包括缩放处理、压缩处理和挖框中的至少一个,其中,所述识别单元还被配置为利用所述场景对应的对象识别模型对所述存储的图像数据中包含的对象进行识别,其中,所述确定单元将所述预处理后图像数据输入到所述场景识别模型,以确定所述预处理后的图像数据对应的场景。
在一个实施例中,所述确定单元还被配置为将所述图像数据输入到所述场景识别模型中,以及根据预设的场景阈值确定所述图像数据对应的场景。
在一个实施例中,不同场景对应的对象识别模型的权重和偏置中的至少一个不相同,其中所述识别单元还被配置为调用与所述场景对应的对象识别模型的权重和偏置对所述对象进行识别。
在一个实施例中,所述对象为人脸。
在一个实施例中,所述场景包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光。
本发明的又一方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述对象识别方法。
通过采用本发明的对象识别方法,首先确定图像数据对应的场景,然后根据所确定的场景对应的对象识别模型对图像数据中包括的对象进行识别,提高了对象识别准确率。
附图说明
从下面结合附图对本发明实施例的详细描述中,本发明的这些和/或其它方面和优点将变得更加清楚并更容易理解,其中:
图1为本发明的一个实施例的基于深度学习神经网络的对象识别方法的示意性流程图;
图2为本发明的另一实施例的基于深度学习神经网络的对象识别方法的示意性流程图;
图3为本发明的一个实施例的基于深度学习神经网络的对象识别装置的示意性功能结构图;
图4为本发明的另一实施例的基于深度学习神经网络的对象识别装置的示意性功能结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是根据本发明的一个实施例的基于深度学习神经网络的对象识别方法的示意性流程图。图1的方法可以由服务器或图像处理器来执行。该方法包括如下内容。
S110:获取图像数据,该图像数据为对象所处场景的图像数据。
例如,图像数据可以是包含人脸或物体和背景的画面,也可以是只包括背景的画面。
S120:利用场景识别模型确定图像数据对应的场景及该场景对应的对象识别模型。
场景识别模型可以是利用分类器对各种场景的样本数据进行训练而生成的识别模型,用于识别不同的场景。例如,可以采用模式识或机器学习中的分类器来建立上述场景识别模型。
具体而言,可以预先设计各种场景与对象识别模型的对应关系,例如,与晴天场景对应的晴天对象识别模型,与雪天场景对应的雪天对象识别模型、与早晨场景对应的早晨对象识别模型等等。
S130:利用场景对应的对象识别模型识别对象。
具体而言,图像数据可以包括静态图像数据或动态图像数据(诸如图片或视频之类的图像数据)。
如果上述图像数据中包含对象,则可以将该上述图像数据输入到对象识别模型中进行对象识别。如果上述图像数据中不包含对象,则可以另外获取包含对象的图像数据进行图像识别。换句话说,可以先获取对象当前所处场景的图像数据进行场景的识别,再获取对象在当前场景下的图像数据进行对对象识别。
场景指待识别的对象所处的环境,例如,场景可以包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光等。当然,本发明的实施例的场景不限于以上场景。对象可以是物体或人脸,当然,本发明的实施例并不限于上述对象,例如,对象也可以是其它动物或物体。
具体而言,当确定待识别的对象处于某种场景下时,可以利用该场景对应的对象识别模型来进行图像识别。例如,当对处于晴天场景下的人脸进行人脸识别时,可以选择晴天人脸模型进行图像识别。
例如,人脸在不同的场景下可能会呈现不同的颜色或光泽或清晰度,如果采用一种场景下学习得到的对象识别模型去识别另一场景下的对象,可能会造成识别的准确率降低。例如,用早晨场景下学习得到的人脸识别模型来识别处于黄昏场景下的人脸,可能会有识别错误的情况发生。
现有的分类模型可以被用作场景识别模型。例如,当场景不多于10类时,可以使用mnist模型;如果场景大于10类小于1000类时,可以使用alexnet模型。现有的对象识别模型可以用于对象识别,例如SSD(Single Shot MultiBox Detector)和yolo模型。目前,通常使用基于SSD简化的Light SSD模型。这些模型比较小,在设备里运行速度较快。
通过采用本发明的对象识别方法,首先确定图像数据对应的场景,然后根据所确定的场景对应的对象识别模型对图像数据中包括的对象进行识别,提高了对象识别的准确率。
图2是根据本发明的另一实施例的基于深度学习神经网络的对象识别方法的流程图。图2的方法是图1的方法的例子,在此适当省略详细的描述。
S210:获取图像数据,该图像数据为对象所处场景的图像数据。
S220:存储所获取的图像数据。
S230:对所存储的图像数据进行预处理,得到预处理后的图像数据预处理包括缩放处理、压缩处理和挖框中的至少一个。
S240:将预处理后的图像数据输入到场景识别模型,以确定预处理后的图像数据对应的场景。
S250:利用所确定的场景对应的对象识别模型对所存储的图像数据中包含的对象进行识别。图像数据可以包括静态图像数据或动态图像数据(诸如图片或视频之类的图像数据)。
场景指待识别的对象所处的环境,例如,场景可以包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光等。当然,本发明的实施例的场景不限于以上场景。对象可以是物体或人脸,当然,本发明的实施例并不限于上述对象,例如,对象也可以是其它动物或物体。
现有的分类模型可以被用作场景识别模型。例如,当场景不多于10类时,使用mnist模型;如果场景大于10类小于1000类时,可以使用alexnet模型。现有的对象识别模型可以用于对象识别,例如SSD(Single Shot MultiBox Detector)和yolo模型。目前,通常使用基于SSD简化的Light SSD模型。这些模型比较小,在设备里运行速度较快。
在上述实施例中,获取不同场景的样本数据,对不同的场景的样本数据进行学习,获得场景识别模型。例如,使用分类模型对大量标注有场景信息的图像进行训练,从而得到场景识别模型以及场景模型对应的权重和偏置。换言之,不同场景的图像被进行分类训练,从而得到不同场景对应的权重和偏置。不同场景对应的对象识别模型的权重和偏置中的至少一个不相同。具体地,当不同场景对应的对象识别模型不同时,不同的对象识别模型的权重和偏置中的至少一个也不同。当不同场景对应的对象识别模型相同时,相同的对象识别模型的权重和偏置中可以相同或不同。
在一个实施例中,利用场景识别模型确定图像数据对应的场景,包括:将图像数据输入到场景识别模型中;根据预设的场景阈值确定图像数据对应的场景。不同的场景对应不同的阈值。
在一个实施例中,利用场景对应的对象识别模型对该对象进行识别,包括:调用与该场景对应的对象识别模型的权重和偏置对该对象进行识别。
图3为本发明一个实施例的基于深度学习神经网络的对象识别装置3的功能结构图。该对象识别装置包括:获取单元310,用于获取图像数据,该图像数据为对象所处场景的图像数据;确定单元320,用于利用场景识别模型确定图像数据对应的场景;识别单元330,用于利用场景对应的对象识别模型对对象进行识别。获取单元310可以是摄像头、数码相机、摄像机等。图像数据可以包括静态图像数据(诸如图片)或动态图像数据(诸如视频数据)。场景包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光等。现有的分类模型可以被用作场景识别模型。例如,当场景不多于10类时,使用mnist模型;如果场景大于10类小于1000类时,可以使用alexnet模型。现有的对象识别模型可以用于对象识别,例如SSD(Single Shot MultiBox Detector)和yolo模型。目前,通常使用基于SSD简化的Light SSD模型。这些模型比较小,在设备里运行速度较快。通过采用本发明的对象识别装置,首先确定图像数据对应的场景,然后根据所确定的场景对应的对象识别模型对图像数据中包括的对象进行识别,提高了对象识别准确率,具有较好的应用前景。
图4为本发明一个实施例的基于深度学习神经网络的对象识别装置4的功能结构图。该对象识别装置包括:获取单元410,用于获取图像数据,图像数据为对象所处场景的图像数据;存储单元420,用于存储所获取的图像数据;预处理单元430,用于对所存储的图像数据进行预处理,得到预处理后的图像数据,预处理包括缩放处理、压缩处理和挖框中的至少一个;确定单元440,用于将预处理后的图像数据输入到场景识别模型,以确定预处理后的图像数据对应的场景;识别单元450,用于利用场景对应的对象识别模型对存储的图像数据中包含的对象进行识别。图像数据可以被存储为不同的格式。
在上述实施例中,获取不同场景的样本数据,对不同的场景的样本数据进行学习,获得场景识别模型。例如,使用分类模型对大量标注有场景信息的图像进行训练,从而得到场景识别模型以及场景模型对应的权重和偏置。换言之,不同场景的图像被进行分类训练,从而得到不同场景对应的权重和偏置。不同场景对应的对象识别模型的权重和偏置中的至少一个不相同。
在一个实施例中,确定单元还被配置为将图像数据输入到场景识别模型中,以及根据预设的场景阈值确定图像数据对应的场景。不同的场景对应不同的阈值。
在一个实施例中,识别单元还被配置为调用与场景对应的对象识别模型的权重和偏置对对象进行识别。
本发明的又一方面提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述对象识别方法。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。本发明的各个实施例在不违反逻辑的基础上均可相互组合。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (14)
1.一种基于深度学习神经网络的对象识别方法,其特征在于,所述方法包括以下步骤:
获取图像数据,所述图像数据为对象所处场景的图像数据;
利用场景识别模型确定所述图像数据对应的场景;
利用所述场景对应的对象识别模型对所述对象进行识别。
2.根据权利要求1所述的对象识别方法,其特征在于,还包括:
获取不同场景的样本数据;
对所述不同的场景的样本数据进行学习,获得所述场景识别模型。
3.根据权利要求1所述的对象识别方法,其特征在于,在所述利用场景识别模型确定所述图像数据对应的场景之前,还包括:
存储所获取的图像数据;
对所述图像数据进行预处理,得到预处理后的图像数据,所述预处理包括缩放处理、压缩处理和挖框中的至少一个,
其中,所述利用场景识别模型确定所述图像数据对应的场景,包括:
将所述预处理后图像数据输入到所述场景识别模型,以确定所述预处理后的图像数据对应的场景;
其中所述利用场景对应的对象识别模型对所述对象进行识别,包括:
利用所述场景对应的对象识别模型对所述存储的图像数据中包含的对象进行识别。
4.根据权利要求1所述的对象识别方法,其特征在于,所述利用场景识别模型确定所述图像数据对应的场景,包括:
将所述图像数据输入到所述场景识别模型中;
根据预设的场景阈值确定所述图像数据对应的场景。
5.根据权利要求1所述的对象识别方法,其特征在于,不同场景对应的对象识别模型的权重和偏置中的至少一个不相同,
其中所述利用所述场景对应的对象识别模型对所述对象进行识别,包括:
调用与所述场景对应的对象识别模型的权重和偏置对所述对象进行识别。
6.根据权利要求1所述的对象识别方法,其特征在于,所述对象为人脸。
7.根据权利要求1至6中的任一项所述的对象识别方法,其特征在于,所述场景包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光。
8.一种基于深度学习神经网络的对象识别装置,其特征在于,所述装置包括:
获取单元,用于获取图像数据,所述图像数据为对象所处场景的图像数据;
确定单元,用于利用场景识别模型确定所述图像数据对应的场景;
识别单元,用于利用所述场景对应的对象识别模型对所述对象进行识别。
9.根据权利要求1所述的对象识别装置,其特征在于,所述获取单元还用于获取不同场景的样本数据,并对所述不同的场景的样本数据进行学习,获得所述场景识别模型。
10.根据权利要求9所述的对象识别装置,其特征在于,还包括:
存储单元,用于存储所获取的图像数据;
预处理单元,用于对所存储的图像数据进行预处理,得到预处理后的图像数据,所述预处理包括缩放处理、压缩处理和挖框中的至少一个,
其中,所述识别单元还被配置为利用所述场景对应的对象识别模型对所述存储的图像数据中包含的对象进行识别,其中,所述确定单元将所述预处理后的图像数据输入到所述场景识别模型,以确定所述预处理后的图像数据对应的场景。
11.根据权利要求9所述的对象识别装置,其特征在于,所述确定单元还被配置为将所述图像数据输入到所述场景识别模型中,以及根据预设的场景阈值确定所述图像数据对应的场景。
12.根据权利要求9所述的对象识别装置,其特征在于,不同场景对应的对象识别模型的权重和偏置中的至少一个不相同,
其中所述识别单元还被配置为调用与所述场景对应的对象识别模型的权重和偏置对所述对象进行识别。
13.根据权利要求9至12中的任一项所述的对象识别装置,其特征在于,所述场景包括晴天、雨天、雾天、夜晚、早晨、黄昏、雪天等场景、室内、室外、强光、弱光、暗光。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述的对象识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710669780.2A CN107316035A (zh) | 2017-08-07 | 2017-08-07 | 基于深度学习神经网络的对象识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710669780.2A CN107316035A (zh) | 2017-08-07 | 2017-08-07 | 基于深度学习神经网络的对象识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107316035A true CN107316035A (zh) | 2017-11-03 |
Family
ID=60175126
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710669780.2A Pending CN107316035A (zh) | 2017-08-07 | 2017-08-07 | 基于深度学习神经网络的对象识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107316035A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107749950A (zh) * | 2017-11-09 | 2018-03-02 | 睿魔智能科技(东莞)有限公司 | 一种基于深度学习的拍摄方法和系统 |
CN108090497A (zh) * | 2017-12-28 | 2018-05-29 | 广东欧珀移动通信有限公司 | 视频分类方法、装置、存储介质及电子设备 |
CN108318042A (zh) * | 2018-01-29 | 2018-07-24 | 广东欧珀移动通信有限公司 | 导航模式切换方法、装置、终端及存储介质 |
CN108492352A (zh) * | 2018-03-22 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 增强现实的实现方法、装置、系统、计算机设备及存储介质 |
CN108921040A (zh) * | 2018-06-08 | 2018-11-30 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
CN108985163A (zh) * | 2018-06-11 | 2018-12-11 | 视海博(中山)科技股份有限公司 | 基于无人机的受限空间安全探测方法 |
CN109035558A (zh) * | 2018-06-12 | 2018-12-18 | 武汉市哈哈便利科技有限公司 | 一种用于无人售货柜的商品识别算法在线学习系统 |
CN109087167A (zh) * | 2018-07-31 | 2018-12-25 | 西安艾润物联网技术服务有限责任公司 | 服务信息推送方法、相关设备以及存储介质 |
WO2019071623A1 (zh) * | 2017-10-14 | 2019-04-18 | 华为技术有限公司 | 一种拍摄方法以及电子装置 |
CN109727268A (zh) * | 2018-12-29 | 2019-05-07 | 西安天和防务技术股份有限公司 | 目标跟踪方法、装置、计算机设备和存储介质 |
CN109816097A (zh) * | 2019-01-23 | 2019-05-28 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN110225236A (zh) * | 2018-03-02 | 2019-09-10 | 富士通株式会社 | 为视频监控系统配置参数的方法、装置和视频监控系统 |
CN110348422A (zh) * | 2019-07-18 | 2019-10-18 | 北京地平线机器人技术研发有限公司 | 图像处理方法、装置、计算机可读存储介质和电子设备 |
CN111597381A (zh) * | 2020-04-16 | 2020-08-28 | 国家广播电视总局广播电视科学研究院 | 内容生成方法、装置以及介质 |
CN113570817A (zh) * | 2021-08-05 | 2021-10-29 | 广东电网有限责任公司 | 一种消防安全的报警方法、装置、计算机设备和存储介质 |
CN114677691A (zh) * | 2022-04-06 | 2022-06-28 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060171573A1 (en) * | 1997-08-28 | 2006-08-03 | Rogers Steven K | Use of computer-aided detection system outputs in clinical practice |
CN102436583A (zh) * | 2011-09-26 | 2012-05-02 | 哈尔滨工程大学 | 基于对标注图像学习的图像分割方法 |
CN103456301A (zh) * | 2012-05-28 | 2013-12-18 | 中兴通讯股份有限公司 | 一种基于环境声音的场景识别方法及装置及移动终端 |
CN105488044A (zh) * | 2014-09-16 | 2016-04-13 | 华为技术有限公司 | 数据处理的方法和设备 |
CN105575119A (zh) * | 2015-12-29 | 2016-05-11 | 大连楼兰科技股份有限公司 | 路况气候深度学习及识别方法和装置 |
CN105678267A (zh) * | 2016-01-08 | 2016-06-15 | 浙江宇视科技有限公司 | 一种场景识别方法及装置 |
CN105678278A (zh) * | 2016-02-01 | 2016-06-15 | 国家电网公司 | 一种基于单隐层神经网络的场景识别方法 |
CN106845549A (zh) * | 2017-01-22 | 2017-06-13 | 珠海习悦信息技术有限公司 | 一种基于多任务学习的场景与目标识别的方法及装置 |
WO2018083668A1 (en) * | 2016-11-04 | 2018-05-11 | Deepmind Technologies Limited | Scene understanding and generation using neural networks |
CN108154153A (zh) * | 2016-12-02 | 2018-06-12 | 北京市商汤科技开发有限公司 | 场景分析方法和系统、电子设备 |
-
2017
- 2017-08-07 CN CN201710669780.2A patent/CN107316035A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060171573A1 (en) * | 1997-08-28 | 2006-08-03 | Rogers Steven K | Use of computer-aided detection system outputs in clinical practice |
CN102436583A (zh) * | 2011-09-26 | 2012-05-02 | 哈尔滨工程大学 | 基于对标注图像学习的图像分割方法 |
CN103456301A (zh) * | 2012-05-28 | 2013-12-18 | 中兴通讯股份有限公司 | 一种基于环境声音的场景识别方法及装置及移动终端 |
CN105488044A (zh) * | 2014-09-16 | 2016-04-13 | 华为技术有限公司 | 数据处理的方法和设备 |
CN105575119A (zh) * | 2015-12-29 | 2016-05-11 | 大连楼兰科技股份有限公司 | 路况气候深度学习及识别方法和装置 |
CN105678267A (zh) * | 2016-01-08 | 2016-06-15 | 浙江宇视科技有限公司 | 一种场景识别方法及装置 |
CN105678278A (zh) * | 2016-02-01 | 2016-06-15 | 国家电网公司 | 一种基于单隐层神经网络的场景识别方法 |
WO2018083668A1 (en) * | 2016-11-04 | 2018-05-11 | Deepmind Technologies Limited | Scene understanding and generation using neural networks |
CN108154153A (zh) * | 2016-12-02 | 2018-06-12 | 北京市商汤科技开发有限公司 | 场景分析方法和系统、电子设备 |
CN106845549A (zh) * | 2017-01-22 | 2017-06-13 | 珠海习悦信息技术有限公司 | 一种基于多任务学习的场景与目标识别的方法及装置 |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019071623A1 (zh) * | 2017-10-14 | 2019-04-18 | 华为技术有限公司 | 一种拍摄方法以及电子装置 |
CN107749950A (zh) * | 2017-11-09 | 2018-03-02 | 睿魔智能科技(东莞)有限公司 | 一种基于深度学习的拍摄方法和系统 |
CN108090497A (zh) * | 2017-12-28 | 2018-05-29 | 广东欧珀移动通信有限公司 | 视频分类方法、装置、存储介质及电子设备 |
CN108090497B (zh) * | 2017-12-28 | 2020-07-07 | Oppo广东移动通信有限公司 | 视频分类方法、装置、存储介质及电子设备 |
CN108318042A (zh) * | 2018-01-29 | 2018-07-24 | 广东欧珀移动通信有限公司 | 导航模式切换方法、装置、终端及存储介质 |
CN110225236B (zh) * | 2018-03-02 | 2022-06-28 | 富士通株式会社 | 为视频监控系统配置参数的方法、装置和视频监控系统 |
CN110225236A (zh) * | 2018-03-02 | 2019-09-10 | 富士通株式会社 | 为视频监控系统配置参数的方法、装置和视频监控系统 |
CN108492352A (zh) * | 2018-03-22 | 2018-09-04 | 腾讯科技(深圳)有限公司 | 增强现实的实现方法、装置、系统、计算机设备及存储介质 |
CN108492352B (zh) * | 2018-03-22 | 2021-10-22 | 腾讯科技(深圳)有限公司 | 增强现实的实现方法、装置、系统、计算机设备及存储介质 |
CN108921040A (zh) * | 2018-06-08 | 2018-11-30 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
WO2019233393A1 (zh) * | 2018-06-08 | 2019-12-12 | Oppo广东移动通信有限公司 | 图像处理方法和装置、存储介质、电子设备 |
CN108985163A (zh) * | 2018-06-11 | 2018-12-11 | 视海博(中山)科技股份有限公司 | 基于无人机的受限空间安全探测方法 |
CN109035558A (zh) * | 2018-06-12 | 2018-12-18 | 武汉市哈哈便利科技有限公司 | 一种用于无人售货柜的商品识别算法在线学习系统 |
CN109087167A (zh) * | 2018-07-31 | 2018-12-25 | 西安艾润物联网技术服务有限责任公司 | 服务信息推送方法、相关设备以及存储介质 |
CN109727268A (zh) * | 2018-12-29 | 2019-05-07 | 西安天和防务技术股份有限公司 | 目标跟踪方法、装置、计算机设备和存储介质 |
CN109816097A (zh) * | 2019-01-23 | 2019-05-28 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN109816097B (zh) * | 2019-01-23 | 2022-12-09 | 东北大学 | 一种基于YOLO的Compress-YOLO模型压缩方法 |
CN110348422B (zh) * | 2019-07-18 | 2021-11-09 | 北京地平线机器人技术研发有限公司 | 图像处理方法、装置、计算机可读存储介质和电子设备 |
CN110348422A (zh) * | 2019-07-18 | 2019-10-18 | 北京地平线机器人技术研发有限公司 | 图像处理方法、装置、计算机可读存储介质和电子设备 |
CN111597381A (zh) * | 2020-04-16 | 2020-08-28 | 国家广播电视总局广播电视科学研究院 | 内容生成方法、装置以及介质 |
CN113570817A (zh) * | 2021-08-05 | 2021-10-29 | 广东电网有限责任公司 | 一种消防安全的报警方法、装置、计算机设备和存储介质 |
CN114677691A (zh) * | 2022-04-06 | 2022-06-28 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备及存储介质 |
CN114677691B (zh) * | 2022-04-06 | 2023-10-03 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107316035A (zh) | 基于深度学习神经网络的对象识别方法及装置 | |
CN112734775B (zh) | 图像标注、图像语义分割、模型训练方法及装置 | |
CN109543714B (zh) | 数据特征的获取方法、装置、电子设备及存储介质 | |
AU2006252252B2 (en) | Image processing method and apparatus | |
CN109978893A (zh) | 图像语义分割网络的训练方法、装置、设备及存储介质 | |
CN114424253A (zh) | 模型训练方法、装置、存储介质及电子设备 | |
CN105574550A (zh) | 一种车辆识别方法及装置 | |
CN110222686B (zh) | 物体检测方法、装置、计算机设备和存储介质 | |
CN106096542B (zh) | 基于距离预测信息的图像视频场景识别方法 | |
CN112967341B (zh) | 基于实景图像的室内视觉定位方法、系统、设备及存储介质 | |
CN110415184B (zh) | 一种基于正交元空间的多模态图像增强方法 | |
CN110738160A (zh) | 一种结合人脸检测的人脸质量评估方法 | |
CN112766218B (zh) | 基于非对称联合教学网络的跨域行人重识别方法和装置 | |
CN114332578A (zh) | 图像异常检测模型训练方法、图像异常检测方法和装置 | |
WO2023142912A1 (zh) | 遗留物体的检测方法、装置及存储介质 | |
Chen et al. | Integrated content and context analysis for mobile landmark recognition | |
CN110569780A (zh) | 一种基于深度迁移学习的高精度人脸识别方法 | |
CN113870254B (zh) | 目标对象的检测方法、装置、电子设备及存储介质 | |
CN112200844A (zh) | 生成图像的方法、装置、电子设备及介质 | |
CN112101114A (zh) | 一种视频目标检测方法、装置、设备以及存储介质 | |
CN105631404A (zh) | 对照片进行聚类的方法及装置 | |
CN109740527B (zh) | 一种视频帧中图像处理方法 | |
CN113128526B (zh) | 图像识别方法、装置、电子设备和计算机可读存储介质 | |
CN112132839B (zh) | 一种基于深度卷积级联网络的多尺度快速人脸分割方法 | |
CN113706550A (zh) | 图像场景识别和模型训练方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20180418 Address after: 100191 Xueyuan Road, Haidian District, Haidian District, Beijing, No. 607, No. six Applicant after: Beijing Vimicro AI Chip Technology Co Ltd Address before: 100191, Haidian District, Xueyuan Road, Beijing No. 35, Nanjing Ning building, 16 floor Applicant before: Beijing Vimicro Corporation |
|
TA01 | Transfer of patent application right |