CN103955718A - 一种图像主体对象的识别方法 - Google Patents
一种图像主体对象的识别方法 Download PDFInfo
- Publication number
- CN103955718A CN103955718A CN201410205350.1A CN201410205350A CN103955718A CN 103955718 A CN103955718 A CN 103955718A CN 201410205350 A CN201410205350 A CN 201410205350A CN 103955718 A CN103955718 A CN 103955718A
- Authority
- CN
- China
- Prior art keywords
- image
- region
- carry out
- identified
- rectangular area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种图像主体对象的识别方法,其通过对待识别图像进行图像显著性检测以获取图像的显著性区域,并计算包含所述的显著性区域的最大矩形区域,最后根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象,从而能够大大提升识别主体对象的正确率,适应各式各样的构图。
Description
技术领域
本发明涉及一种图像识别方法,特别是一种图像主体对象的识别方法。
背景技术
目前,我们在识别图像中的主体对象主要是提取图像的最中间位置的图像来进行识别,但是我们在拍摄时为了使拍摄照片更好看,往往在构图上采用“黄金分割”,它是广泛存在于自然界的一种现象,简单的说就是将摄影的主体对象放在位于画面大约三分之一处,让人觉得画面和谐充满美感。“黄金分割法”又称“三分法则”,“三分法则”就是将整个画面在横、竖方向各用两条直线分割成等份的三部分,我们将拍摄的主体放置在任意一条直线或直线的交点上这样比较符合人类的视觉习惯。拍摄时可直接调出相机的“井”字辅助线,将拍摄主体放在4个交叉点上,这样画面立刻就活了起来。而这样就导致图像主体识别的错误率居高不下。
发明内容
本发明为解决上述问题,提供了一种图像主体对象的识别方法,其通过图像显著性检测及卷积神经网络的深度学习,能够大大提升识别主体对象的正确率,适应各式各样的构图。
为实现上述目的,本发明采用的技术方案为:
一种图像主体对象的识别方法,其特征在于,包括以下步骤:
10.接收待识别图像;
20.对所述待识别图像进行图像显著性检测以获取图像的显著性区域;
30.计算包含所述的显著性区域的最大矩形区域;
40.根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象。
优选的,所述的步骤20中对待识别图像进行图像显著性检测进一步包括:
21.提取图像特征:采用高斯滤波器对待识别图像进行滤波和采样,形成以待识别图像为底层的高斯金字塔模型;然后对高斯金字塔模型中的每一层分别提取各种图像特征,形成特征金字塔模型;再根据该特征金字塔模型进行计算得到所述待识别图像的特征图;
22.生成显著图:把每一个所述的特征图归一化处理,并将各个归一化处理后的特征图进行综合计算,得到对应于待识别图像的显著图。
优选的,所述的步骤20中对待识别图像进行图像显著性检测后生成显著图,用白色和黑色对该显著图进行标记以获取图像的显著性区域,其中,白色表示图像中显著的区域,黑色表示图像中不显著的区域。
优选的,所述的步骤30中计算包含所述的显著性区域的最大矩形区域,主要通过标记法对所述显著图进行连通区域的计算和提取,从而得到最大矩形区域。
优选的,所述的标记法进一步包括:
31.初始标记值记为1;
32.对所述显著图进行逐行扫描,找到一个未标记区域的颜色为白色的像素点,标记该像素点的标记值为1;
33.检查该点的八邻域的像素点并标记像素点满足为颜色为白色的像素点且未被标记的标记值为当前标记值,同时将新增的标记像素点记录下来作为区域增长的种子点;
34.在后续的标记像素点过程中,不断从记录种子点的数组中取出一个种子,实施上述的操作,如此循环,直到记录种子点的数组为空;
35.若一个连通区域标记结束,则标记值+1,并遍历下一个连通区域,直到所有像素点被标记为止;
36.获取每个标记值的最大区域,并将每个标记值为1的白色区域连接起来,然后计算出显著性区域与非显著性区域的比例达到最大的矩形区域为所述的最大矩形区域。
优选的,所述的步骤40中根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象,主要是系统预先收集各种类型的主体对象的图像进行分类并标注标签,从而得到带有标签的图像块,并将其作为样本图像输入卷积神经网络进行训练学习。
优选的,所述的图像主体对象的分类标签包括:人物标签、食物标签、动物标签、建筑物标签、交通工具标签。
优选的,所述的步骤40中进行卷积神经网络的深度学习,主要是将样本图像输入卷积神经网络进行训练学习,并将分类错误的样本图像收集起来重新进行标注,再将重新标注后的样本图像再次进行训练学习,重复上述过程直到分类正确为止。
本发明的有益效果是:
本发明的一种图像主体对象的识别方法,其通过对待识别图像进行图像显著性检测以获取图像的显著性区域,并计算包含所述的显著性区域的最大矩形区域,最后根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象,从而能够大大提升识别主体对象的正确率,适应各式各样的构图。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明一种图像主体对象的识别方法的流程简图;
图2为本发明一实施例的待识别图像;
图3为对图2进行图像显著性检测后的图;
图4为在图3的基础上获取最大矩形区域的示意图。
具体实施方式
为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1所示,本发明的一种图像主体对象的识别方法,其包括以下步骤:
10.接收待识别图像,如图2;
20.对所述待识别图像进行图像显著性检测,如图3,以获取图像的显著性区域;
30.计算包含所述的显著性区域的最大矩形区域,如图4;主要是为了获取显著性区域最大的部分,方便接下来的主体对象的识别;
40.根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象。
所述的步骤20中对待识别图像进行图像显著性检测进一步包括:
21.提取图像特征:采用高斯滤波器对待识别图像进行滤波和采样,形成以待识别图像为底层的高斯金字塔模型;然后对高斯金字塔模型中的每一层分别提取各种图像特征,形成特征金字塔模型;再根据该特征金字塔模型进行计算得到所述待识别图像的特征图;具体为:先把待识别图像表示成9层的高斯金字塔,其中第0层是待识别图像,1到8层分别是用5*5的高斯滤波器对待识别图像进行滤波和采样形成的,大小分别为待识别图像的1/2到1/256,然后对金字塔每一层分别提取各种特征,例如:亮度、红色、绿色、蓝色、黄色、方向等特征,形成特征金字塔,然后再进行计算得到各个特征的特征图。
22.生成显著图:把每一个所述的特征图归一化处理,以消除干扰噪声及突出显著部分,并将各个归一化处理后的特征图进行综合计算,得到对应于待识别图像的显著图;具体为:对每个特征图分别用二维高斯差函数进行卷积,并把卷积结果叠加回原特征图,使同种特征以侧抑制的方式在空间上竞争;卷积和迭代过程进行多次,这样可以让少数几个最显著的点均匀分布在整个特征图上,从而每个特征图上只保留少数的几个显著点,在叠加多个特征图时能把多种显著特征的点突现出来;接下来分别把每一类归一化后的特征图逐点求和,得到对应于每一类特征的显著图,综合所有特征的显著性,就得到对应于待识别图像的显著图。
所述的步骤20中对待识别图像进行图像显著性检测后生成显著图,用白色和黑色对该显著图进行标记以获取图像的显著性区域,其中,白色表示图像中显著的区域,黑色表示图像中不显著的区域。
所述的步骤30中计算包含所述的显著性区域的最大矩形区域,主要通过标记法对所述显著图进行连通区域的计算和提取,从而得到最大矩形区域。
所述的标记法进一步包括:
31.初始标记值记为1;
32.对所述显著图进行逐行扫描,找到一个未标记区域的颜色为白色的像素点,标记该像素点的标记值为1;
33.检查该点的八邻域的像素点并标记像素点满足为颜色为白色的像素点且未被标记的标记值为当前标记值,同时将新增的标记像素点记录下来作为区域增长的种子点;
34.在后续的标记像素点过程中,不断从记录种子点的数组中取出一个种子,实施上述的操作,如此循环,直到记录种子点的数组为空;
35.若一个连通区域标记结束,则标记值+1,并遍历下一个连通区域,直到所有像素点被标记为止;
36.获取每个标记值的最大区域,并将每个标记值为1的白色区域连接起来,然后计算出显著性区域与非显著性区域的比例达到最大的矩形区域为所述的最大矩形区域,如图2至图4所示。
所述的步骤40中根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象,主要是系统预先收集各种类型的主体对象的图像进行分类并标注标签,从而得到带有标签的图像块,并将其作为样本图像输入卷积神经网络进行训练学习;进一步的,所述的步骤40中进行卷积神经网络的深度学习,主要是将样本图像输入卷积神经网络进行训练学习,并将分类错误的样本图像收集起来重新进行标注,即,调整网络结构,再将重新标注后的样本图像再次进行训练学习,如此重复“训练->调整网络结构->再训练”的过程直到分类正确为止。
上述的图像主体对象的分类标签包括:人物标签、食物标签、动物标签、建筑物标签、交通工具标签;该分类标签还可以进一步细分,例如动物标签还可以分为猫、狗等,交通工具标签还可以分为车、船、飞机等,对于无法分类的图像则分类为其他标签。
本实施例中网格结构顺序为输入层->K个小组层->全连接层->SoftMax层,其中K大于等于1;小组层包括卷积层、激活层、下采样层、归一化层;卷积层、激活层、下采样层、归一化层中每个层的核大小以及输出大小都是可以进行任意调节的,并且每个层都有一个输入且产生一个输出,每一层的输出作为下一层的输入。
其中,输入层的输入大小为Height x Weight x Channel,其中Weight、Height为输入层图像的宽和高,Channel为输入层图像的颜色通道;由于本发明使用GPU硬件实现的原因,Weight=Height;输入图像的channel只能为1或者3。
卷积层:
1)核的大小必须是奇数,且不大于该层输入的宽或者高;
2)中间表示通过卷积层时不改变宽和高,通道数可变可不变;理论上可以为任意正整数,由于本发明使用GPU硬件实现的原因,这里为16的倍数。
激活层:
1)激活层不改变卷积层表示的宽、高或者通道数;
2)激活层所使用的激活函数包括但不限于以下函数类型:
f(x)=1/(1+e-x)
f(x)=a*tanh(b*x),a,b为任意数
f(x)=max(0,x)
f(x)=min(a,max(0,x))
f(x)=log(1+ex)
f(x)=|x|
f(x)=x2
f(x)=ax+b
3)激活层跟在卷积层或者全连接之后。
下采样层:
1)下采样层不改变中间表示的通道数;
2)下采样层对图像的缩小比即为核的大小:即核为m x n的下采样层会造成中间表示缩小为上一层的(1/m)x(1/n),理论上m和n可为任意自然数,由于本发明使用GPU硬件实现的原因,m=n。例如,15x15x32通过3x3的下采样后,变成5x5x32;15x15x32通过5x5的下采样后,变成3x3x32;但是15x15x32不能进行2x2的下采样,因为15不能被2整除;并不是说,输入尺寸必须是2的次幂,即16、32、64等,输入尺寸只要保证能被所有下采样层采样即可。
归一化层:
1)归一化层不改变中间表示的任何尺寸;
2)归一化层不是必须的,可要可不要,添加归一化层通常会提高精度并增加计算量;是否添加归一化层,要看添加后实际提升的精度和损失的速度。
一般的组合是:卷积->激活->下采样->归一化。
以下情况特殊:
1)添加归一化层“划不来”时,取消归一化层,即采用以下组合:卷积->激活->下采样;
2)归一化层提前,效果基本相同,即采用以下组合:卷积->激活->归一化->下采样。
3)取消下采样层:卷积->激活;或者卷积->激活->归一化;下采样本质是为了增加鲁棒性,同时顺便有减少后续层的运算量的作用;一个网络中通常会有几层下采样,但并不是所有的“卷积->激活”后面都要跟下采样。
全连接层:
1)通过全连接层后的中间表示会变成1维的,不再是3维的;
2)全连接的输出可以任意;
3)一旦进过全连接,就无法进行卷积、下采样或归一化;
4)全连接后面可以接激活层,或者继续接全连接。
SoftMax层:
接在全连接层之后,作用是把全连接产生的实值变成[0,1]之间的概率。
本发明最后使用的网络结构如表1所示。
表1卷积神经网络结构
层数 | 类型 | 核大小 | 输出大小 | 注解 |
1 | 输入层 | 32x32x3 | ||
2 | 卷积层 | 5x5 | 32x32x32 | |
3 | 激活层 | 32x32x32 | ||
4 | 下采样层 | 2x2 | 16x16x32 | f(x)=x2 |
5 | 归一化层 | 16x16x32 | 使用局部归一化 | |
6 | 卷积层 | 5x5 | 16x16x16 | |
7 | 激活层 | 16x16x16 | ||
8 | 下采样层 | 2x2 | 8x8x16 | f(x)=|x| |
9 | 归一化层 | 8x8x16 | 使用局部归一化 |
10 | 全连接层 | 6个数据 | ||
11 | SoftMax层 | 6个数据 |
本发明通过在待识别图像中的目标区域进行随机采样,放入神经网络的输入层,进行全连接后,在最后的SoftMax层得到每一种标签的概率,即在区间[0,1]中的实值;本实施例中采用人物标签、食物标签、动物标签、建筑物标签、交通工具标签、其他标签,共6种类型,即6个数据,这6个数据的和等于1;然后,将得到的每个样本图像的标签的概率进行平均,得到待识别图像标签的概率,选择概率最大的标签作为该图像的主体对象的标签。
上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (8)
1.一种图像主体对象的识别方法,其特征在于,包括以下步骤:
10.接收待识别图像;
20.对所述待识别图像进行图像显著性检测以获取图像的显著性区域;
30.计算包含所述的显著性区域的最大矩形区域;
40.根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象。
2.根据权利要求1所述的一种图像主体对象的识别方法,其特征在于:所述的步骤20中对待识别图像进行图像显著性检测进一步包括:
21.提取图像特征:采用高斯滤波器对待识别图像进行滤波和采样,形成以待识别图像为底层的高斯金字塔模型;然后对高斯金字塔模型中的每一层分别提取各种图像特征,形成特征金字塔模型;再根据该特征金字塔模型进行计算得到所述待识别图像的特征图;
22.生成显著图:把每一个所述的特征图归一化处理,并将各个归一化处理后的特征图进行综合计算,得到对应于待识别图像的显著图。
3.根据权利要求1或2所述的一种图像主体对象的识别方法,其特征在于:所述的步骤20中对待识别图像进行图像显著性检测后生成显著图,用白色和黑色对该显著图进行标记以获取图像的显著性区域,其中,白色表示图像中显著的区域,黑色表示图像中不显著的区域。
4.根据权利要求3所述的一种图像主体对象的识别方法,其特征在于:所述的步骤30中计算包含所述的显著性区域的最大矩形区域,主要通过标记法对所述显著图进行连通区域的计算和提取,从而得到最大矩形区域。
5.根据权利要求4所述的一种图像主体对象的识别方法,其特征在于:所述的标记法进一步包括:
31.初始标记值记为1;
32.对所述显著图进行逐行扫描,找到一个未标记区域的颜色为白色的像素点,标记该像素点的标记值为1;
33.检查该点的八邻域的像素点并标记像素点满足为颜色为白色的像素点且未被标记的标记值为当前标记值,同时将新增的标记像素点记录下来作为区域增长的种子点;
34.在后续的标记像素点过程中,不断从记录种子点的数组中取出一个种子,实施上述的操作,如此循环,直到记录种子点的数组为空;
35.若一个连通区域标记结束,则标记值+1,并遍历下一个连通区域,直到所有像素点被标记为止;
36.获取每个标记值的最大区域,并将每个标记值为1的白色区域连接起来,然后计算出显著性区域与非显著性区域的比例达到最大的矩形区域为所述的最大矩形区域。
6.根据权利要求1所述的一种图像主体对象的识别方法,其特征在于:所述的步骤40中根据所述的最大矩形区域进行卷积神经网络的深度学习,识别得到待识别图像的主体对象,主要是系统预先收集各种类型的主体对象的图像进行分类并标注标签,从而得到带有标签的图像块,并将其作为样本图像输入卷积神经网络进行训练学习。
7.根据权利要求6所述的一种图像主体对象的识别方法,其特征在于:所述的图像主体对象的分类标签包括:人物标签、食物标签、动物标签、建筑物标签、交通工具标签。
8.根据权利要求6所述的一种图像主体对象的识别方法,其特征在于:所述的步骤40中进行卷积神经网络的深度学习,主要是将样本图像输入卷积神经网络进行训练学习,并将分类错误的样本图像收集起来重新进行标注,再将重新标注后的样本图像再次进行训练学习,重复上述过程直到分类正确为止。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410205350.1A CN103955718A (zh) | 2014-05-15 | 2014-05-15 | 一种图像主体对象的识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410205350.1A CN103955718A (zh) | 2014-05-15 | 2014-05-15 | 一种图像主体对象的识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103955718A true CN103955718A (zh) | 2014-07-30 |
Family
ID=51332992
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410205350.1A Pending CN103955718A (zh) | 2014-05-15 | 2014-05-15 | 一种图像主体对象的识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103955718A (zh) |
Cited By (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN104301585A (zh) * | 2014-09-24 | 2015-01-21 | 南京邮电大学 | 一种运动场景中特定种类目标实时检测方法 |
CN104392211A (zh) * | 2014-11-12 | 2015-03-04 | 厦门美图网科技有限公司 | 一种基于显著性检测的皮肤识别方法 |
CN104484658A (zh) * | 2014-12-30 | 2015-04-01 | 中科创达软件股份有限公司 | 一种基于多通道卷积神经网络的人脸性别识别方法及装置 |
CN104573715A (zh) * | 2014-12-30 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 图像主体区域的识别方法及装置 |
CN104657706A (zh) * | 2015-01-27 | 2015-05-27 | 北京大学 | 基于图像的高铁线路线杆断裂与联接结构体异常检测方法 |
CN104811276A (zh) * | 2015-05-04 | 2015-07-29 | 东南大学 | 一种超奈奎斯特速率通信的dl-cnn解调器 |
CN105590319A (zh) * | 2015-12-18 | 2016-05-18 | 华南理工大学 | 一种深度学习的图像显著性区域检测方法 |
CN105701508A (zh) * | 2016-01-12 | 2016-06-22 | 西安交通大学 | 基于多级卷积神经网络的全局-局部优化模型及显著性检测算法 |
WO2016112797A1 (zh) * | 2015-01-15 | 2016-07-21 | 阿里巴巴集团控股有限公司 | 一种用于确定图片陈列信息的方法及设备 |
JP2016157434A (ja) * | 2015-02-23 | 2016-09-01 | 三菱電機株式会社 | ストリートビューの画像をラベル付けする方法 |
CN106101540A (zh) * | 2016-06-28 | 2016-11-09 | 北京旷视科技有限公司 | 对焦点确定方法及装置 |
CN106326984A (zh) * | 2016-08-09 | 2017-01-11 | 北京京东尚科信息技术有限公司 | 用户意图识别方法和装置、自动应答系统 |
CN107067043A (zh) * | 2017-05-25 | 2017-08-18 | 哈尔滨工业大学 | 一种农作物病虫害检测方法 |
CN107122701A (zh) * | 2017-03-03 | 2017-09-01 | 华南理工大学 | 一种基于图像显著性和深度学习的交通道路标志识别方法 |
WO2017173605A1 (en) * | 2016-04-06 | 2017-10-12 | Xiaogang Wang | Method and system for person recognition |
CN107563994A (zh) * | 2017-08-08 | 2018-01-09 | 北京小米移动软件有限公司 | 图像的显著性检测方法及装置 |
CN107679487A (zh) * | 2017-09-29 | 2018-02-09 | 中国科学院福建物质结构研究所 | 失踪人口鉴别方法和系统 |
CN107688823A (zh) * | 2017-07-20 | 2018-02-13 | 北京三快在线科技有限公司 | 一种图像特征获取方法及装置,电子设备 |
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN107945210A (zh) * | 2017-11-30 | 2018-04-20 | 天津大学 | 基于深度学习和环境自适应的目标跟踪算法 |
CN108074224A (zh) * | 2016-11-09 | 2018-05-25 | 环境保护部环境规划院 | 一种陆生哺乳动物与鸟类的监测方法及其监测装置 |
CN108280453A (zh) * | 2018-01-08 | 2018-07-13 | 西安电子科技大学 | 基于深度学习的低功耗快速检测图像目标方法 |
CN108288014A (zh) * | 2017-01-09 | 2018-07-17 | 北京四维图新科技股份有限公司 | 道路智能提取方法和装置、提取模型构建方法及混合导航系统 |
CN108462826A (zh) * | 2018-01-23 | 2018-08-28 | 维沃移动通信有限公司 | 一种辅助拍照的方法及移动终端 |
WO2018191887A1 (zh) * | 2017-04-19 | 2018-10-25 | 广东欧珀移动通信有限公司 | 拍照构图方法、装置及电子设备 |
CN108765449A (zh) * | 2018-05-16 | 2018-11-06 | 南京信息工程大学 | 一种基于卷积神经网络的图像背景分割和识别方法 |
CN108805258A (zh) * | 2018-05-23 | 2018-11-13 | 北京图森未来科技有限公司 | 一种神经网络训练方法及其装置、计算机服务器 |
CN108960232A (zh) * | 2018-06-08 | 2018-12-07 | Oppo广东移动通信有限公司 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
CN109147093A (zh) * | 2018-09-04 | 2019-01-04 | 惠州市德赛西威智能交通技术研究院有限公司 | 一种图片样本采集设备及方法 |
CN109299682A (zh) * | 2018-09-13 | 2019-02-01 | 北京字节跳动网络技术有限公司 | 视频文字检测方法、装置和计算机可读存储介质 |
CN109598268A (zh) * | 2018-11-23 | 2019-04-09 | 安徽大学 | 一种基于单流深度网络的rgb-d显著目标检测方法 |
CN110210567A (zh) * | 2019-06-06 | 2019-09-06 | 广州瑞智华创信息科技有限公司 | 一种基于卷积神经网络的服装图像分类与检索方法及系统 |
US10489691B2 (en) | 2016-01-15 | 2019-11-26 | Ford Global Technologies, Llc | Fixation generation for machine learning |
CN110689007A (zh) * | 2019-09-16 | 2020-01-14 | Oppo广东移动通信有限公司 | 主体识别方法和装置、电子设备、计算机可读存储介质 |
CN111079662A (zh) * | 2019-12-19 | 2020-04-28 | 江苏云从曦和人工智能有限公司 | 一种人物识别方法、装置、机器可读介质及设备 |
CN111104832A (zh) * | 2018-10-29 | 2020-05-05 | 百度在线网络技术(北京)有限公司 | 图像标签获取方法、图像标签获取装置以及电子设备 |
CN111277753A (zh) * | 2020-02-10 | 2020-06-12 | Oppo广东移动通信有限公司 | 对焦方法、装置、终端设备和存储介质 |
CN111684368A (zh) * | 2017-12-30 | 2020-09-18 | 美的集团股份有限公司 | 基于成分识别的食物制备方法和系统 |
CN111797790A (zh) * | 2020-07-10 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置、存储介质和电子设备 |
CN112154451A (zh) * | 2018-05-18 | 2020-12-29 | 悟图索知 | 提取图像中对象的代表性特征的方法、设备和计算机程序 |
WO2024065389A1 (zh) * | 2022-09-29 | 2024-04-04 | 京东方科技集团股份有限公司 | 用于检测摄像头干扰的方法、系统和电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080201282A1 (en) * | 2005-03-31 | 2008-08-21 | France Telecom | System and Method for Locating Points of Interest in an Object Image Implementing a Neural Network |
CN102054178A (zh) * | 2011-01-20 | 2011-05-11 | 北京联合大学 | 一种基于局部语义概念的国画图像识别方法 |
CN102147867A (zh) * | 2011-05-20 | 2011-08-10 | 北京联合大学 | 一种基于主体的国画图像和书法图像的识别方法 |
CN103116746A (zh) * | 2013-03-08 | 2013-05-22 | 中国科学技术大学 | 一种基于多特征融合技术的视频火焰探测方法 |
CN103679718A (zh) * | 2013-12-06 | 2014-03-26 | 河海大学 | 一种基于显著性的快速场景分析方法 |
-
2014
- 2014-05-15 CN CN201410205350.1A patent/CN103955718A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080201282A1 (en) * | 2005-03-31 | 2008-08-21 | France Telecom | System and Method for Locating Points of Interest in an Object Image Implementing a Neural Network |
CN102054178A (zh) * | 2011-01-20 | 2011-05-11 | 北京联合大学 | 一种基于局部语义概念的国画图像识别方法 |
CN102147867A (zh) * | 2011-05-20 | 2011-08-10 | 北京联合大学 | 一种基于主体的国画图像和书法图像的识别方法 |
CN103116746A (zh) * | 2013-03-08 | 2013-05-22 | 中国科学技术大学 | 一种基于多特征融合技术的视频火焰探测方法 |
CN103679718A (zh) * | 2013-12-06 | 2014-03-26 | 河海大学 | 一种基于显著性的快速场景分析方法 |
Cited By (65)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104301585A (zh) * | 2014-09-24 | 2015-01-21 | 南京邮电大学 | 一种运动场景中特定种类目标实时检测方法 |
CN104244113A (zh) * | 2014-10-08 | 2014-12-24 | 中国科学院自动化研究所 | 一种基于深度学习技术的视频摘要生成方法 |
CN104392211A (zh) * | 2014-11-12 | 2015-03-04 | 厦门美图网科技有限公司 | 一种基于显著性检测的皮肤识别方法 |
CN104484658A (zh) * | 2014-12-30 | 2015-04-01 | 中科创达软件股份有限公司 | 一种基于多通道卷积神经网络的人脸性别识别方法及装置 |
CN104573715A (zh) * | 2014-12-30 | 2015-04-29 | 百度在线网络技术(北京)有限公司 | 图像主体区域的识别方法及装置 |
US10121095B2 (en) | 2014-12-30 | 2018-11-06 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and device for recognizing subject area of image |
WO2016112797A1 (zh) * | 2015-01-15 | 2016-07-21 | 阿里巴巴集团控股有限公司 | 一种用于确定图片陈列信息的方法及设备 |
CN104657706A (zh) * | 2015-01-27 | 2015-05-27 | 北京大学 | 基于图像的高铁线路线杆断裂与联接结构体异常检测方法 |
CN104657706B (zh) * | 2015-01-27 | 2017-12-29 | 北京大学 | 基于图像的高铁线路线杆断裂与联接结构体异常检测方法 |
JP2016157434A (ja) * | 2015-02-23 | 2016-09-01 | 三菱電機株式会社 | ストリートビューの画像をラベル付けする方法 |
CN104811276B (zh) * | 2015-05-04 | 2018-04-03 | 东南大学 | 一种超奈奎斯特速率通信的dl‑cnn解调器 |
CN104811276A (zh) * | 2015-05-04 | 2015-07-29 | 东南大学 | 一种超奈奎斯特速率通信的dl-cnn解调器 |
CN105590319B (zh) * | 2015-12-18 | 2018-06-29 | 华南理工大学 | 一种深度学习的图像显著性区域检测方法 |
CN105590319A (zh) * | 2015-12-18 | 2016-05-18 | 华南理工大学 | 一种深度学习的图像显著性区域检测方法 |
CN105701508B (zh) * | 2016-01-12 | 2017-12-15 | 西安交通大学 | 基于多级卷积神经网络的全局‑局部优化模型及显著性检测算法 |
CN105701508A (zh) * | 2016-01-12 | 2016-06-22 | 西安交通大学 | 基于多级卷积神经网络的全局-局部优化模型及显著性检测算法 |
US11087186B2 (en) | 2016-01-15 | 2021-08-10 | Ford Global Technologies, Llc | Fixation generation for machine learning |
US10489691B2 (en) | 2016-01-15 | 2019-11-26 | Ford Global Technologies, Llc | Fixation generation for machine learning |
WO2017173605A1 (en) * | 2016-04-06 | 2017-10-12 | Xiaogang Wang | Method and system for person recognition |
CN109074472B (zh) * | 2016-04-06 | 2020-12-18 | 北京市商汤科技开发有限公司 | 用于人物识别的方法和系统 |
CN109074472A (zh) * | 2016-04-06 | 2018-12-21 | 北京市商汤科技开发有限公司 | 用于人物识别的方法和系统 |
CN106101540A (zh) * | 2016-06-28 | 2016-11-09 | 北京旷视科技有限公司 | 对焦点确定方法及装置 |
US10291838B2 (en) | 2016-06-28 | 2019-05-14 | Beijing Kuangshi Technology Co., Ltd. | Focusing point determining method and apparatus |
CN106101540B (zh) * | 2016-06-28 | 2019-08-06 | 北京旷视科技有限公司 | 对焦点确定方法及装置 |
CN106326984A (zh) * | 2016-08-09 | 2017-01-11 | 北京京东尚科信息技术有限公司 | 用户意图识别方法和装置、自动应答系统 |
WO2018028255A1 (zh) * | 2016-08-11 | 2018-02-15 | 深圳市未来媒体技术研究院 | 基于对抗网络的图像显著性检测方法 |
CN108074224A (zh) * | 2016-11-09 | 2018-05-25 | 环境保护部环境规划院 | 一种陆生哺乳动物与鸟类的监测方法及其监测装置 |
CN108074224B (zh) * | 2016-11-09 | 2021-11-05 | 生态环境部环境规划院 | 一种陆生哺乳动物与鸟类的监测方法及其监测装置 |
CN108288014A (zh) * | 2017-01-09 | 2018-07-17 | 北京四维图新科技股份有限公司 | 道路智能提取方法和装置、提取模型构建方法及混合导航系统 |
CN107122701A (zh) * | 2017-03-03 | 2017-09-01 | 华南理工大学 | 一种基于图像显著性和深度学习的交通道路标志识别方法 |
CN110622498B (zh) * | 2017-04-19 | 2022-02-01 | Oppo广东移动通信有限公司 | 拍照构图方法、装置及电子设备 |
WO2018191887A1 (zh) * | 2017-04-19 | 2018-10-25 | 广东欧珀移动通信有限公司 | 拍照构图方法、装置及电子设备 |
CN110622498A (zh) * | 2017-04-19 | 2019-12-27 | Oppo广东移动通信有限公司 | 拍照构图方法、装置及电子设备 |
CN107067043B (zh) * | 2017-05-25 | 2020-07-24 | 哈尔滨工业大学 | 一种农作物病虫害检测方法 |
CN107067043A (zh) * | 2017-05-25 | 2017-08-18 | 哈尔滨工业大学 | 一种农作物病虫害检测方法 |
US11282295B2 (en) | 2017-07-20 | 2022-03-22 | Beijing Sankuai Online Technology Co., Ltd | Image feature acquisition |
CN107688823A (zh) * | 2017-07-20 | 2018-02-13 | 北京三快在线科技有限公司 | 一种图像特征获取方法及装置,电子设备 |
CN107563994A (zh) * | 2017-08-08 | 2018-01-09 | 北京小米移动软件有限公司 | 图像的显著性检测方法及装置 |
CN107679487A (zh) * | 2017-09-29 | 2018-02-09 | 中国科学院福建物质结构研究所 | 失踪人口鉴别方法和系统 |
CN107945210B (zh) * | 2017-11-30 | 2021-01-05 | 天津大学 | 基于深度学习和环境自适应的目标跟踪方法 |
CN107945210A (zh) * | 2017-11-30 | 2018-04-20 | 天津大学 | 基于深度学习和环境自适应的目标跟踪算法 |
CN111684368A (zh) * | 2017-12-30 | 2020-09-18 | 美的集团股份有限公司 | 基于成分识别的食物制备方法和系统 |
US11229311B2 (en) | 2017-12-30 | 2022-01-25 | Midea Group Co., Ltd. | Food preparation system |
CN108280453B (zh) * | 2018-01-08 | 2020-06-16 | 西安电子科技大学 | 基于深度学习的低功耗快速检测图像目标方法 |
CN108280453A (zh) * | 2018-01-08 | 2018-07-13 | 西安电子科技大学 | 基于深度学习的低功耗快速检测图像目标方法 |
CN108462826A (zh) * | 2018-01-23 | 2018-08-28 | 维沃移动通信有限公司 | 一种辅助拍照的方法及移动终端 |
CN108765449A (zh) * | 2018-05-16 | 2018-11-06 | 南京信息工程大学 | 一种基于卷积神经网络的图像背景分割和识别方法 |
CN108765449B (zh) * | 2018-05-16 | 2022-04-26 | 南京信息工程大学 | 一种基于卷积神经网络的图像背景分割和识别方法 |
CN112154451A (zh) * | 2018-05-18 | 2020-12-29 | 悟图索知 | 提取图像中对象的代表性特征的方法、设备和计算机程序 |
CN108805258B (zh) * | 2018-05-23 | 2021-10-12 | 北京图森智途科技有限公司 | 一种神经网络训练方法及其装置、计算机服务器 |
CN108805258A (zh) * | 2018-05-23 | 2018-11-13 | 北京图森未来科技有限公司 | 一种神经网络训练方法及其装置、计算机服务器 |
CN108960232A (zh) * | 2018-06-08 | 2018-12-07 | Oppo广东移动通信有限公司 | 模型训练方法、装置、电子设备和计算机可读存储介质 |
CN109147093A (zh) * | 2018-09-04 | 2019-01-04 | 惠州市德赛西威智能交通技术研究院有限公司 | 一种图片样本采集设备及方法 |
CN109147093B (zh) * | 2018-09-04 | 2021-01-12 | 惠州市德赛西威智能交通技术研究院有限公司 | 一种图片样本采集设备及方法 |
CN109299682A (zh) * | 2018-09-13 | 2019-02-01 | 北京字节跳动网络技术有限公司 | 视频文字检测方法、装置和计算机可读存储介质 |
CN111104832A (zh) * | 2018-10-29 | 2020-05-05 | 百度在线网络技术(北京)有限公司 | 图像标签获取方法、图像标签获取装置以及电子设备 |
CN111104832B (zh) * | 2018-10-29 | 2023-05-26 | 百度在线网络技术(北京)有限公司 | 图像标签获取方法、图像标签获取装置以及电子设备 |
CN109598268A (zh) * | 2018-11-23 | 2019-04-09 | 安徽大学 | 一种基于单流深度网络的rgb-d显著目标检测方法 |
CN110210567A (zh) * | 2019-06-06 | 2019-09-06 | 广州瑞智华创信息科技有限公司 | 一种基于卷积神经网络的服装图像分类与检索方法及系统 |
CN110689007A (zh) * | 2019-09-16 | 2020-01-14 | Oppo广东移动通信有限公司 | 主体识别方法和装置、电子设备、计算机可读存储介质 |
CN110689007B (zh) * | 2019-09-16 | 2022-04-15 | Oppo广东移动通信有限公司 | 主体识别方法和装置、电子设备、计算机可读存储介质 |
CN111079662A (zh) * | 2019-12-19 | 2020-04-28 | 江苏云从曦和人工智能有限公司 | 一种人物识别方法、装置、机器可读介质及设备 |
CN111277753A (zh) * | 2020-02-10 | 2020-06-12 | Oppo广东移动通信有限公司 | 对焦方法、装置、终端设备和存储介质 |
CN111797790A (zh) * | 2020-07-10 | 2020-10-20 | 北京字节跳动网络技术有限公司 | 图像处理方法和装置、存储介质和电子设备 |
WO2024065389A1 (zh) * | 2022-09-29 | 2024-04-04 | 京东方科技集团股份有限公司 | 用于检测摄像头干扰的方法、系统和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103955718A (zh) | 一种图像主体对象的识别方法 | |
CN110348376B (zh) | 一种基于神经网络的行人实时检测方法 | |
CN109685115B (zh) | 一种双线性特征融合的细粒度概念模型及学习方法 | |
CN108776779B (zh) | 基于卷积循环网络的sar序列图像目标识别方法 | |
CN109635744A (zh) | 一种基于深度分割网络的车道线检测方法 | |
CN103632153B (zh) | 一种基于区域的图像显著图提取方法 | |
CN107564009B (zh) | 基于深度卷积神经网络的室外场景多目标分割方法 | |
CN107844795A (zh) | 基于主成分分析的卷积神经网络特征提取方法 | |
CN106570874B (zh) | 一种结合图像局部约束与对象全局约束的图像标记方法 | |
CN104021207A (zh) | 一种基于图像的食物信息提供方法 | |
CN113111758B (zh) | 一种基于脉冲神经网络的sar图像舰船目标识别方法 | |
CN112488046B (zh) | 一种基于无人机高分辨率影像的车道线提取方法 | |
CN106910202B (zh) | 一种遥感图像地物的图像分割方法及系统 | |
CN104091341A (zh) | 一种基于显著性检测的图像模糊检测方法 | |
CN107392314A (zh) | 一种基于确定性丢弃连接的深层卷积神经网络方法 | |
CN104392233B (zh) | 一种基于区域的图像显著图提取方法 | |
CN106295637A (zh) | 一种基于深度学习与强化学习的车辆识别方法 | |
CN109872326B (zh) | 基于深度强化网络跳跃连接的轮廓检测方法 | |
CN103440488A (zh) | 一种虫害识别的方法 | |
CN104598885A (zh) | 街景图像中的文字标牌检测与定位方法 | |
CN103679718A (zh) | 一种基于显著性的快速场景分析方法 | |
CN112560717B (zh) | 一种基于深度学习的车道线检测方法 | |
CN105224937A (zh) | 基于人体部件位置约束的细粒度语义色彩行人重识别方法 | |
CN107967474A (zh) | 一种基于卷积神经网络的海面目标显著性检测方法 | |
CN107506792B (zh) | 一种半监督的显著对象检测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20140730 |
|
RJ01 | Rejection of invention patent application after publication |