CN112040241B - 一种基于深度学习的视频图像透明水印嵌入提取方法 - Google Patents
一种基于深度学习的视频图像透明水印嵌入提取方法 Download PDFInfo
- Publication number
- CN112040241B CN112040241B CN201910480250.2A CN201910480250A CN112040241B CN 112040241 B CN112040241 B CN 112040241B CN 201910480250 A CN201910480250 A CN 201910480250A CN 112040241 B CN112040241 B CN 112040241B
- Authority
- CN
- China
- Prior art keywords
- watermark
- coding
- graph
- information
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000013135 deep learning Methods 0.000 title claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 16
- 238000005516 engineering process Methods 0.000 claims abstract description 4
- 238000004519 manufacturing process Methods 0.000 claims abstract description 4
- 230000009466 transformation Effects 0.000 claims description 15
- 238000012360 testing method Methods 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 238000003491 array Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000005286 illumination Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000007493 shaping process Methods 0.000 claims description 3
- 238000013519 translation Methods 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 abstract description 3
- 230000006835 compression Effects 0.000 abstract description 3
- 238000007906 compression Methods 0.000 abstract description 3
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 8
- 238000001514 detection method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000001795 light effect Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
Abstract
本发明提出了一种基于深度学习的视频图像透明水印嵌入提取方法,包括如下步骤:获取不同场景、不同时间段的视频图像;对视频图像添加透明水印,并生成对应的标签;使用数据增强技术,制作视频图像透明水印数据集;训练深度网络YOLO v3模型,保存训练参数;使用训练好的深度网络YOLO v3模型,识别待提取水印编码图形的水印编码位置、类别信息及类别置信度;整合水印编码图形,生成完整的水印信息。本发明能够增加视频水印的冗余信息,实现局部、不同光线等不同场景下的恶意拍摄传播时,能够提取水印的完整信息;嵌入的半透明水印抗压缩能力强,在手机拍摄等恶劣条件下传播能够保留水印信息;使用深度学习模型提取水印信息,运算快,较传统算法更鲁棒。
Description
技术领域
本发明涉及视频图像透明水印嵌入提取技术领域,具体涉及一种基于深度学习的视频图像透明水印嵌入提取方法。
背景技术
随着计算机网络和嵌入式设备的迅速发展,以及人们公共安全意识的增强,监控设备随处可见,监控视频很容易存储、复制、传播,对现场保护、事件复现起到很大的作用。但监控视频、视频图像的恶意传播却越来越受到人们的关注。
对视频图像添加可提取水印成为追踪视频图像泄露源的重要手段。视频水印算法一般分为三大类,第一类就是在DCT系数中嵌入水印,第二类是在运动矢量中嵌入水印,第三类是在熵编码后的码字中嵌入水印,但存在以下不足:算法抗压缩性不强,带有水印的视频经过重编码后,其中的水印就会损坏,不利于后续的验证。水印冗余信息不足,水印视频经手机拍摄等传播后,水印信息丢失无法提取。
发明内容
为了解决上述问题,本发明提出一种基于深度学习的视频图像透明水印嵌入提取方法。
为实现以上目的,本发明采用的技术方案是:
一种基于深度学习的视频图像透明水印嵌入提取方法,包括如下步骤:
步骤一:获取不同场景、不同时间段的视频图像;
步骤二:对视频图像添加透明水印,并生成对应的标签;
步骤三:使用数据增强技术,制作视频图像透明水印数据集;
步骤四:训练深度网络YOLO v3模型,保存训练参数;
步骤五:使用训练好的深度网络YOLO v3模型,识别待提取水印编码图形的水印编码位置、类别信息及类别置信度;
步骤六:整合水印编码图形,生成完整的水印信息。
优选的,所述步骤二中,对视频图像添加透明水印,并生成对应的标签的具体方法为:
步骤11、随机生成水印信息,水印信息是一个六位数字的整形数;
步骤12、对水印信息进行编码,每个数字对应一个水印编码图形,水印信息编码有一个相同的共用的起始水印编码图形;
步骤13、将水印信息编码嵌入到视频图像中,水印编码图形等间距水平平铺,在竖直方向上的距离在视频图像宽度范围内随机产生;
步骤14、生成对应视频图像的标签文件,每行包含一个水印编码图形的信息:类别,起始坐标,长宽。
进一步的,所述步骤12中,水印编码图形等宽等高,不同的水印编码图形区分度明显,共有11个类别。
进一步的,所述步骤13中,水印信息编码嵌入到视频图像中的嵌入方式算法为:
i(x,y)=α*i(x,y)+(1-α)*(255-i(x,y))
其中,i(x,y)表示水印编码图形掩码下坐标(x,y)的像素值,α表示透明度系数,可通过α值来调整透明度程度。
进一步的,所述水印编码图形水平平铺的间距为水印编码图形宽度的一半。
优选的,所述步骤三中,制作视频图像透明水印数据集的具体方法为:
步骤21、将步骤二中已添加透明水印的视频图像,组成数据集;
步骤22、将数据集中的每张图像依次做水平翻转、随机裁剪、平移变换、仿射变换、颜色变换、光照变换、旋转变换后得到的视频图像分别存入数据集中,并生成对应的标签文件;
步骤23、从数据集中所有图像中随机选取80%的图像,组成训练集,将剩余的20%图像组成测试集。
优选的,所述步骤六中,整合水印编码图形,生成完整的水印信息的具体方法为:
步骤31、过滤掉所述步骤五中类别置信度小于0.55的水印编码图形;
步骤32、对所述步骤31中的水印编码图形从左上角坐标位置进行从左往右、从上往下排序;
步骤33、计算所述步骤32中水印编码图形平均高度;
步骤34、若两个水印编码图形垂直间距相差小于0.25倍的水印编码图形平均高度,并且水平间距小于1.5倍的水印编码图形平均高度,则两水印编码图形相邻。定义6个数组,对应水印信息的六位数字,步骤32中水印编码图形取出起始水印编码图形,从剩余水印编码图形中取出与起始水印编码图形右侧相邻的水印编码图形放入第一个数组,从剩余水印编码图形中取出与第一个数组中水印编码图形右侧相邻的水印编码图形放入第二个数组,以此类推;从剩余水印编码图形中取出与起始水印编码图形左侧相邻的水印编码图形放入第六个数组,从剩余水印编码图形中取出与第六个数组中水印编码图形左侧相邻的水印编码图形放入第五个数组,以此类推。统计每个数组中水印编码图形的种类、以及每类水印编码图形的个数和最大置信度;
步骤35、根据步骤34的统计结果来确认水印编码图形的类别,若在数组中的水印编码图形对应的某一类别的个数最多,则认为该类别为该数组所对应的水印编码图形的类别,若个数相同,则选择类别置信度较大的类别为该数组所对应的水印编码图形的类别,进而将每个数组对应的水印编码图形所对应的数字提取出来。
本发明能够增加视频水印的冗余信息,实现局部、不同光线等不同场景下的恶意拍摄传播时,能够提取水印的完整信息;嵌入的半透明水印抗压缩能力强,在手机拍摄等恶劣条件下传播能够保留水印信息;使用深度学习模型提取水印信息,运算快,较传统算法更鲁棒。
附图说明
构成本发明的一部分附图用来提供对本发明的进一步理解。
在附图中:
图1为本发明一种基于深度学习的视频图像透明水印嵌入提取方法的工作流程框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
缩略语和关键术语定义:
YOLO:Real-Time Object Detection的缩写,一个先进的实时目标检测系统。
GPU:Graphics Processing Unit的缩写,是一种专门在个人电脑、工作站、游戏机和一些移动设备上图像运算工作的微处理器。
如图1所示,一种基于深度学习的视频图像透明水印嵌入提取方法,包括如下步骤:
步骤一:获取不同场景、不同时间段的视频图像;
通过一段时间收集室内、室外的视频图像。室外的包括停车场、公园、小区、路口等不同场景,清早、正午、下午、黄昏、晚上等不同时间段的视频图像;室内的包括厂房、办公室、室内停车场、室内运动场等不同场景不同光线效果下的视频图像。收集的视频图像涵盖的情况越多越好。
步骤二:对视频图像添加透明水印,并生成对应的标签;
具体方法为:
步骤11、随机生成水印信息,水印信息是一个六位数字的整形数M;
步骤12、对水印信息进行编码,每个数字对应一个水印编码图形,水印信息编码有一个相同的共用的起始水印编码图形;水印编码图形等宽等高,不同的水印编码图形区分度明显,共有11个类别,分别用a~k表示,如数9302的编码是akebd,a对应起始水印编码图形对应的类别。
步骤13、将水印信息编码嵌入到视频图像中,水印编码图形等间距水平平铺,所述水印编码图形水平平铺的间距为水印编码图形宽度的一半,在竖直方向上的距离在视频图像宽度范围内随机产生;嵌入方式算法为:
i(x,y)=α*i(x,y)+(1-α)*(255-i(x,y))
其中,i(x,y)表示水印编码图形掩码下坐标(x,y)的像素值,α表示透明度系数,可通过α值来调整透明度程度。
步骤24、生成对应视频图像的标签文件,每行包含一个水印编码图形的信息:类别,起始坐标x、y,长宽h,w。
步骤三:使用数据增强技术,制作视频图像透明水印数据集;
具体方法为:
步骤21、将步骤二中已添加透明水印的视频图像,组成数据集;
步骤22、将数据集中的每张图像依次做水平翻转、随机裁剪、平移变换、仿射变换、颜色变换、光照变换、旋转变换后得到的视频图像分别存入数据集中,并生成对应的标签文件;
步骤23、从数据集中所有图像中随机选取80%的图像,组成训练集,将剩余的20%图像组成测试集。
步骤四:训练深度网络YOLO v3模型,保存训练参数;
定义算法目标。算法全部使用了均方和误差作为Loss函数,算法最终迭代Loss函数,使其收敛值最小(一般情况下为0.6即可)。Loss函数由3部分组成:坐标误差、IOU误差和分类误差,具体计算公式如下:
数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。一般地,在样本量一定时,评价一个点估计的好坏标准使用的指标总是点估计与参数真值的距离的函数,最常用的函数是距离的平方,由于估计量具有随机性,可以对该函数求期望。均方和方差公式:
IOU(Intersection-over-Union,IoU),是一种测量在特定数据集中检测相应物体准确度的一个标准,是产生的候选框(candidate bound)与原标记框(ground truthbound)的交叠率。最理想情况是完全重叠,即比值为1。其计算公式为
公式中C为候选框,G为原标记框;模型将输入图像划分为S×S网格,如果编码图形的中心落入网格单元,那么这个网格单元就负责这个编码图形的检测,每个网格单元要预测B个边界框。
xi,yi,wi,hi分别表示模型训练标注的坐标值,xi表示边界框中心点的横坐标,yi表示边界框中心点的纵坐标,wi表示边界框的宽度,hi表示边界框的高度,是对应预测坐标值,在公式中坐标值都是归一化的相对值,范围为[0,1]。表示第i个网格单元的第j个边界框预测有效取1,无效取0;则相反,有效取0,无效取1。Ci与标注与预测的边界框的置信度。pi(c)与分别表示标注与预测类别的置信度。
初始化训练参数:种类classes为11,yolo层的filters为48,初始学习率base_lr为0.001,优化器采用随机梯度下降(SGD),迭代次数为20000。
开始训练模型,模型采用全卷积和类似残差网络的跨层跳跃链接结构的网络结构对输入图片提取特征,得到一定尺寸的特征映射(feature map)。将输入图像分成网格,如果编码图像目标落到哪个网格单元中,那么这个网格单元负责来预测该目标,在网格单元预测的3个边界框中计算IOU,只用IOU最大的边界框来预测该目标。
模型中采用多标签多分类的逻辑回归层做类别预测。逻辑回归层主要用到sigmoid函数,网格单元的classes个类型预测经sigmoid函数约束到0到1的范围内,如值大于0.5,则目标属于该类。
模型中采用多个尺度融合的方式做边框位置预测,在多个尺度的特征映射上做检测。预测得到的输出特征映射有两个维度是提取到的特征的维度,还有一个维度(深度)是B*(5+C),其中B表示每个单元格预测的边界框的数量,本发明专利中的值为3个,C表示边界框的类别数11,5表示4个坐标信息和一个目标置信度。
加载初始化训练参数,根据上述思路在GPU服务器上进行模型训练。使用测试集对训练的模型效果进行检测,保存最优模型权重参数用于视频图像透明水印编码图形的位置信息与类别信息的提取。
步骤五:使用训练好的深度网络YOLO v3模型,识别待提取水印编码图形的水印编码位置(左上角坐标x,y以及长宽h,w)、类别信息及类别置信度;
步骤六:整合水印编码图形,生成完整的水印信息。
具体方法为:
步骤31、过滤掉所述步骤五中类别置信度小于0.55的水印编码图形;
步骤32、对所述步骤31中的水印编码图形从左上角坐标位置进行从左往右、从上往下排序;
步骤33、计算所述步骤32中水印编码图形平均高度;
步骤34、若两个水印编码图形垂直间距相差小于0.25倍的水印编码图形平均高度,并且水平间距小于1.5倍的水印编码图形平均高度,则两水印编码图形相邻。定义6个数组,对应水印信息的六位数字,步骤32中水印编码图形取出起始水印编码图形,从剩余水印编码图形中取出与起始水印编码图形右侧相邻的水印编码图形放入第一个数组,从剩余水印编码图形中取出与第一个数组中水印编码图形右侧相邻的水印编码图形放入第二个数组,以此类推;从剩余水印编码图形中取出与起始水印编码图形左侧相邻的水印编码图形放入第六个数组,从剩余水印编码图形中取出与第六个数组中水印编码图形左侧相邻的水印编码图形放入第五个数组,以此类推。统计每个数组中水印编码图形的种类、以及每类水印编码图形的个数和最大置信度;
步骤35、根据步骤34的统计结果来确认水印编码图形的类别,若在数组中的水印编码图形对应的某一类别的个数最多,则认为该类别为该数组所对应的水印编码图形的类别,若个数相同,则选择类别置信度较大的类别为该数组所对应的水印编码图形的类别,进而将每个数组对应的水印编码图形所对应的数字提取出来。
尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (4)
1.一种基于深度学习的视频图像透明水印嵌入提取方法,其特征在于:包括如下步骤:
步骤一:获取不同场景、不同时间段的视频图像;
步骤二:对视频图像添加透明水印,并生成对应的标签;
步骤三:使用数据增强技术,制作视频图像透明水印数据集;
步骤四:训练深度网络YOLO v3模型,保存训练参数;
步骤五:使用训练好的深度网络YOLO v3模型,识别待提取水印编码图形的水印编码位置、类别信息及类别置信度;
步骤六:整合水印编码图形,生成完整的水印信息;
所述步骤二中,对视频图像添加透明水印,并生成对应的标签的具体方法为:
步骤11、随机生成水印信息,水印信息是一个六位数字的整形数;
步骤12、对水印信息进行编码,每个数字对应一个水印编码图形,水印信息编码有一个相同的共用的起始水印编码图形;
步骤13、将水印信息编码嵌入到视频图像中,水印编码图形等间距水平平铺,在竖直方向上的距离在视频图像宽度范围内随机产生;
步骤14、生成对应视频图像的标签文件,每行包含一个水印编码图形的信息:类别,起始坐标,长宽;
所述步骤三中,制作视频图像透明水印数据集的具体方法为:
步骤21、将步骤二中已添加透明水印的视频图像,组成数据集;
步骤22、将数据集中的每张图像依次做水平翻转、随机裁剪、平移变换、仿射变换、颜色变换、光照变换、旋转变换后得到的视频图像分别存入数据集中,并生成对应的标签文件;
步骤23、从数据集中所有图像中随机选取80%的图像,组成训练集,将剩余的20%图像组成测试集;
所述步骤六中,整合水印编码图形,生成完整的水印信息的具体方法为:
步骤31、过滤掉所述步骤五中类别置信度小于0.55的水印编码图形;
步骤32、对所述步骤31中的水印编码图形从左上角坐标位置进行从左往右、从上往下排序;
步骤33、计算所述步骤32中水印编码图形平均高度;
步骤34、若两个水印编码图形垂直间距相差小于0.25倍的水印编码图形平均高度,并且水平间距小于1.5倍的水印编码图形平均高度,则两水印编码图形相邻;定义6个数组,对应水印信息的六位数字,步骤32中水印编码图形取出起始水印编码图形,从剩余水印编码图形中取出与起始水印编码图形右侧相邻的水印编码图形放入第一个数组,从剩余水印编码图形中取出与第一个数组中水印编码图形右侧相邻的水印编码图形放入第二个数组,以此类推;从剩余水印编码图形中取出与起始水印编码图形左侧相邻的水印编码图形放入第六个数组,从剩余水印编码图形中取出与第六个数组中水印编码图形左侧相邻的水印编码图形放入第五个数组,以此类推;统计每个数组中水印编码图形的种类、以及每类水印编码图形的个数和最大置信度;
步骤35、根据步骤34的统计结果来确认水印编码图形的类别,若在数组中的水印编码图形对应的某一类别的个数最多,则认为该类别为该数组所对应的水印编码图形的类别,若个数相同,则选择类别置信度较大的类别为该数组所对应的水印编码图形的类别,进而将每个数组对应的水印编码图形所对应的数字提取出来。
2.根据权利要求1所述的一种基于深度学习的视频图像透明水印嵌入提取方法,其特征在于:所述步骤12中,水印编码图形等宽等高,不同的水印编码图形区分度明显,共有11个类别。
3.根据权利要求1所述的一种基于深度学习的视频图像透明水印嵌入提取方法,其特征在于:所述步骤13中,水印信息编码嵌入到视频图像中的嵌入方式算法为:
i(x,y)=α*i(x,y)+(1-α)*(255-i(x,y))
其中,i(x,y)表示水印编码图形掩码下坐标(x,y)的像素值,α表示透明度系数,可通过α值来调整透明度程度。
4.根据权利要求1所述的一种基于深度学习的视频图像透明水印嵌入提取方法,其特征在于:所述水印编码图形水平平铺的间距为水印编码图形宽度的一半。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480250.2A CN112040241B (zh) | 2019-06-04 | 2019-06-04 | 一种基于深度学习的视频图像透明水印嵌入提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910480250.2A CN112040241B (zh) | 2019-06-04 | 2019-06-04 | 一种基于深度学习的视频图像透明水印嵌入提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112040241A CN112040241A (zh) | 2020-12-04 |
CN112040241B true CN112040241B (zh) | 2022-08-05 |
Family
ID=73575847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910480250.2A Active CN112040241B (zh) | 2019-06-04 | 2019-06-04 | 一种基于深度学习的视频图像透明水印嵌入提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112040241B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111932431B (zh) * | 2020-07-07 | 2023-07-18 | 华中科技大学 | 基于水印分解模型的可见水印去除方法和电子设备 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040258243A1 (en) * | 2003-04-25 | 2004-12-23 | Dong-Hwan Shin | Method for embedding watermark into an image and digital video recorder using said method |
CN103391482A (zh) * | 2013-07-15 | 2013-11-13 | 浙江大学 | 一种可对抗几何攻击的盲数字水印编解码方法 |
CN109635875A (zh) * | 2018-12-19 | 2019-04-16 | 浙江大学滨海产业技术研究院 | 一种基于深度学习的端到端网口检测方法 |
CN109816024A (zh) * | 2019-01-29 | 2019-05-28 | 电子科技大学 | 一种基于多尺度特征融合与dcnn的实时车标检测方法 |
-
2019
- 2019-06-04 CN CN201910480250.2A patent/CN112040241B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040258243A1 (en) * | 2003-04-25 | 2004-12-23 | Dong-Hwan Shin | Method for embedding watermark into an image and digital video recorder using said method |
CN103391482A (zh) * | 2013-07-15 | 2013-11-13 | 浙江大学 | 一种可对抗几何攻击的盲数字水印编解码方法 |
CN109635875A (zh) * | 2018-12-19 | 2019-04-16 | 浙江大学滨海产业技术研究院 | 一种基于深度学习的端到端网口检测方法 |
CN109816024A (zh) * | 2019-01-29 | 2019-05-28 | 电子科技大学 | 一种基于多尺度特征融合与dcnn的实时车标检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112040241A (zh) | 2020-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Understanding architecture age and style through deep learning | |
CN110135319A (zh) | 一种异常行为检测方法及其系统 | |
CN110956094A (zh) | 一种基于非对称双流网络的rgb-d多模态融合人员检测方法 | |
CN109886085A (zh) | 基于深度学习目标检测的人群计数方法 | |
Chen et al. | Multi-modal fusion of satellite and street-view images for urban village classification based on a dual-branch deep neural network | |
CN109359563B (zh) | 一种基于数字图像处理的占道现象实时检测方法 | |
CN111626141B (zh) | 基于生成图像的人群计数模型建立方法、计数方法及系统 | |
CN110334719B (zh) | 一种提取遥感影像中建筑物图像的方法及系统 | |
CN113379771B (zh) | 带有边缘约束的层次化人体解析语义分割方法 | |
Law et al. | An application of convolutional neural network in street image classification: The case study of London | |
CN109740485A (zh) | 基于光谱分析和深度卷积神经网络的水库或塘坝识别方法 | |
CN107730530A (zh) | 一种基于智慧城市的远程应急管理控制方法 | |
CN112040241B (zh) | 一种基于深度学习的视频图像透明水印嵌入提取方法 | |
Chen et al. | Classification of soft-story buildings using deep learning with density features extracted from 3D point clouds | |
CN115205672A (zh) | 一种基于多尺度区域注意力的遥感建筑物语义分割方法及系统 | |
Mayer et al. | Building facade interpretation from uncalibrated wide-baseline image sequences | |
CN113240829B (zh) | 一种基于机器视觉的闸机智能通行检测方法 | |
CN113158954B (zh) | 交通非现场的基于ai技术的斑马线区域自动检测方法 | |
CN105844671B (zh) | 一种变光照条件下的快速背景减除法 | |
CN114494999B (zh) | 一种双分支联合型目标密集预测方法及系统 | |
CN115690584A (zh) | 一种基于ssd改进的配电房异物检测方法 | |
CN115620287A (zh) | 一种基于面片上下文特征的室内点云场景语义分割方法 | |
CN117974912B (zh) | 城市规划实景三维模拟系统 | |
Ezimand et al. | The analysis of the spatio-temporal changes and prediction of built-up lands and urban heat islands using multi-temporal satellite imagery | |
CN117115723B (zh) | 一种消防设施计数方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PP01 | Preservation of patent right |
Effective date of registration: 20231113 Granted publication date: 20220805 |
|
PP01 | Preservation of patent right |