CN112307908A - 一种视频语义提取方法及装置 - Google Patents
一种视频语义提取方法及装置 Download PDFInfo
- Publication number
- CN112307908A CN112307908A CN202011101561.2A CN202011101561A CN112307908A CN 112307908 A CN112307908 A CN 112307908A CN 202011101561 A CN202011101561 A CN 202011101561A CN 112307908 A CN112307908 A CN 112307908A
- Authority
- CN
- China
- Prior art keywords
- target
- video
- feature
- sample
- semantic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及视频语义分析技术领域,公开了一种视频语义提取方法,包括以下步骤:获取目标场景的样本视频,对所述样本视频中背景特征进行标注;通过标注后的样本视频对神经网络进行训练得到背景抽取模型;通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。本发明具有视频语义分析精度高、算法简单的技术效果。
Description
技术领域
本发明涉及视频语义分析技术领域,具体涉及一种视频语义提取方法及装置。
背景技术
随着数字影像技术和互联网技术的迅速发展,互联网中的图像、视频越来越多。如何对图像、视频进行快速的识别,以便筛选出相关的目标图像、视频,是需要解决的问题。
目前,图像语义标注一般基于全局信息进行,这种方法由于掺杂了背景信息,因此精度不高,只适用于背景单一的图像。对于背景复杂的图像通常需要基于区域划分进行语义标注,然而区域划分无疑会增加语义标注的算法复杂度,降低标注效率,特别是对于视频语义标注来说,这种问题显得更为突出。
发明内容
本发明的目的在于克服上述技术不足,提供一种视频语义提取方法及装置,解决现有技术中视频语义标注精度低、算法复杂的技术问题。
为达到上述技术目的,本发明的技术方案提供一种视频语义提取方法,包括以下步骤:
获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
本发明还提供一种视频语义提取装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述视频语义提取方法。
本发明还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时,实现所述视频语义提取方法。
与现有技术相比,本发明的有益效果包括:本发明对样本视频进行背景标注,以标注后的样本视频作为样本数据对神经网络进行训练,得到背景抽取模型,通过背景抽取模型可以快速抽取目标视频中背景特征,得到目标特征,在抽取得到目标特征后,将目标特征与特征语义库中特征模型进行对比匹配,得到相应的特征语义,各目标特征的特征语义组成目标视频的语义。由于摒除了背景特征对视频语义提取的影响,从而提高了语义提取的精度,且直接采用背景抽取模型抽取背景,简化了背景划分算法。
附图说明
图1是本发明提供的视频语义提取方法一实施方式的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
实施例1
如图1所示,本发明的实施例1提供了视频语义提取方法,包括以下步骤:
S1、获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
S2、通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
S3、通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
S4、建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
S5、在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
本发明实施例对样本视频进行背景标注,以标注后的样本视频作为样本数据对神经网络进行训练,得到背景抽取模型,通过背景抽取模型可以快速抽取目标视频中背景特征,得到目标特征,在抽取得到目标特征后,将目标特征与特征语义库中特征模型进行对比匹配,得到相应的特征语义,各目标特征的特征语义组成目标视频的语义。由于摒除了背景特征对视频语义提取的影响,从而提高了语义提取的精度,且直接采用背景抽取模型抽取背景,简化了背景划分算法。
具体的,特征语义库根据具体的目标场景以及应用场景进行建立,选取应用场景相关的目标物体进行特征模型的建模,从而加快匹配速度,提高匹配精度。例如,用于在监控视频中检测异常行为时,物体模型可以是各种异常行为的模型,从而识别存在异常行为的目标特征,达到异常行为检测的目的,这对于监控视频的快速浏览和有效浏览非常有效,检测的。再比如,在工业中对工件进行质检,则以不同工件作为目标物体,进行特征模型的建立,然后拍摄工件在传送带上传送的视频,通过识别视频中目标特征,并将目标特征与特征模型进行比较,筛选出符合质检要求的工件,筛除不符合质检要求的工件。再比如,用于学生的口语训练过程中,用于自动生成相关的关键字,以及生成参考答案,播放素材视频,学生根据素材视频描述视频内容进行口语训练,当学生的语音信息中断时,输出相应画面的目标特征的语义作为提示词进行提醒,帮助学生不断提高口语能力。总之特征语义库的建立根据具体应用场景进行设定,本发明提供的视频语义提取方法可应用于各行各业,以上仅为举例说明,并不用于限定本发明。
本发明通过建立背景抽取模型实现目标视频的背景抽取,仅需少量的样本视频就可实现目标视频的背景抽取,且抽取效率快,算法简单。背景抽取后,根据目标物体建立的特征语义库贴近应用场景,因此匹配语义精度高。
优选的,对样本视频中环境背景进行标注,具体为:
将所述样本视频分为多帧样本图像;
分别对每一所述样本图像进行分割得到多个样本特征;
对比各所述样本图像的样本特征,筛选出各所述样本图像中共同的样本特征作为所述背景特征。
对于同一目标场景下的样本视频,其背景一般具有共同性,因此,先对样本图像进行分割,通过对比各样本图像找出背景特征。样本特征的对比通过轮廓对比实现即可。例如,将学生口语训练的素材视频进行标注,素材视频的各帧样本图像种包括人物、交通工具等运动物体,还包括山、水、建筑物等静止物体,通过标注,可标注山、水、建筑物等环境背景。
优选的,对所述样本图像进行分割得到多个样本特征,具体为:
计算所述样本图像中相邻色素点之间的色差值,在色差值超过设定阈值处设置边界,通过所述边界将所述样本图像分割为不同区域,得到所述样本特征。
通过色差值对样本图像进行分割,设定阈值的选取根据具体的目标场景进行设定,如背景与特征之间色差较大,可将设定阈值调高,如背景与特征之间色差较小,可将设定阈值调低。
优选的,通过标注后的样本视频对神经网络进行训练得到背景抽取模型,具体为:
以所述样本图像为输入,以所述样本图像除所述背景特征外的其他样本特征作为输出,对所述神经网络进行训练,得到所述背景抽取模型。
通过样本图像进行训练,在样本图像输入神经网络前需进行图像预处理,图像预处理包括边缘检测、中值滤波。
优选的,通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征,具体为:
将所述目标视频分为多帧目标图像;
将所述目标图像分别输入所述背景抽取模型,得到各所述目标图像的目标特征。
通过背景抽取模型分别对每一帧目标图像中目标特征进行提取。
优选的,建立目标物体的特征模型,具体为:
采集多幅不同角度、不同距离、不同时间点的目标物体图像,获取各所述目标物体图像中目标物体的特征参数,得到所述目标物体的特征模型。
通过不同角度不同距离获取的目标物体图像,从不同方向反映了目标物体的特征,从而获取目标物体不同状态下的特征参数,使得建立的特征模型更加准确的描述目标物体的特征,提高后续匹配的精确度。
优选的,所述特征参数包括尺寸参数、颜色参数、角度参数、纹理参数、形状参数以及速度参数。
特征参数的选取,可根据目标物体特性进行设置。例如,目标物体的颜色特征较为明显,可主要通过颜色参数进行匹配,在颜色匹配成功的情况下,再选取其他的特征参数进行辅助判断。目标物体图像可以从样本视频中截取,从样本视频中截取多张连续的目标物体图像,即可获取到目标物体的速度参数,从而获取到目标物体的动态的特征参数。
优选的,在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,具体为:
获取目标特征的特征参数,在所述特征语义库中搜索与所述目标特征的特征参数相似度最高的特征模型作为所述目标特征模型。
通过相似度判断目标特征与特征模型的相似度,从而找出与目标特征最相似的目标特征模型,采用目标特征模型相对应的特征语义对目标特征进行语义标注。特征参数相似度的计算可采用矩阵相似度方法计算。可为每一种特征参数赋不同权值,计算各特征参数的相似度加权和作为最终的判断指标,选取相似度加权和最大的特征模型作为目标特征模型。每一帧目标图像上所有目标特征的语义组成该目标图像的语义,所有目标图像的语义组成目标视频的语义。
对目标特征进行语义标注,特征语义根据需要实现的功能进行定义。例如对于人物,可进行姓名标注,对于除人物外其他物体进行颜色标注,可实现对学生的颜色识别训练。
实施例2
本发明的实施例2提供了视频语义提取装置,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现以上实施例提供的视频语义提取方法。
视频语义提取方法具体包括以下步骤:
获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
本发明实施例提供的视频语义提取装置,用于实现视频语义提取方法,因此,上述视频语义提取方法所具备的技术效果,视频语义提取装置同样具备,在此不再赘述。
实施例3
本发明的实施例3提供了计算机存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时,实现以上实施例提供的视频语义提取方法。
视频语义提取方法具体包括以下步骤:
获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
本发明实施例提供的计算机存储介质,用于实现视频语义提取方法,因此,上述视频语义提取方法所具备的技术效果,计算机存储介质同样具备,在此不再赘述。
以上所述本发明的具体实施方式,并不构成对本发明保护范围的限定。任何根据本发明的技术构思所做出的各种其他相应的改变与变形,均应包含在本发明权利要求的保护范围内。
Claims (10)
1.一种视频语义提取方法,其特征在于,包括以下步骤:
获取目标场景的样本视频,对所述样本视频中背景特征进行标注;
通过标注后的样本视频对神经网络进行训练得到背景抽取模型;
通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征;
建立多种目标物体的特征模型,并为每一种特征模型定义相对应的特征语义,得到特征语义库;
在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,以所述目标特征模型所对应的特征语义作为所述目标视频的语义。
2.根据权利要求1所述的视频语义提取方法,其特征在于,对样本视频中环境背景进行标注,具体为:
将所述样本视频分为多帧样本图像;
分别对每一所述样本图像进行分割得到多个样本特征;
对比各所述样本图像的样本特征,筛选出各所述样本图像中共同的样本特征作为所述背景特征。
3.根据权利要求2所述的视频语义提取方法,其特征在于,对所述样本图像进行分割得到多个样本特征,具体为:
计算所述样本图像中相邻色素点之间的色差值,在色差值超过设定阈值处设置边界,通过所述边界将所述样本图像分割为不同区域,得到所述样本特征。
4.根据权利要求2所述的视频语义提取方法,其特征在于,通过标注后的样本视频对神经网络进行训练得到背景抽取模型,具体为:
以所述样本图像为输入,以所述样本图像除所述背景特征外的其他样本特征作为输出,对所述神经网络进行训练,得到所述背景抽取模型。
5.根据权利要求1所述的视频语义提取方法,其特征在于,通过所述背景抽取模型抽取出目标视频中的背景特征,得到目标特征,具体为:
将所述目标视频分为多帧目标图像;
将各所述目标图像分别输入所述背景抽取模型,得到各所述目标图像的目标特征。
6.根据权利要求1所述的视频语义提取方法,其特征在于,建立目标物体的特征模型,具体为:
采集多幅不同的目标物体图像,获取各所述目标物体图像中目标物体的特征参数,得到所述目标物体的特征模型。
7.根据权利要求6所述的视频语义提取方法,其特征在于,所述特征参数包括尺寸参数、颜色参数、角度参数、纹理参数以及形状参数。
8.根据权利要求6所述的视频语义提取方法,其特征在于,在所述特征语义库中搜索与所述目标特征相匹配的目标特征模型,具体为:
获取目标特征的特征参数,在所述特征语义库中搜索与所述目标特征的特征参数相似度最高的特征模型作为所述目标特征模型。
9.一种视频语义提取装置,其特征在于,包括处理器以及存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如权利要求1-8任一所述的视频语义提取方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被所述处理器执行时,实现如权利要求1-8任一所述的视频语义提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011101561.2A CN112307908B (zh) | 2020-10-15 | 2020-10-15 | 一种视频语义提取方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011101561.2A CN112307908B (zh) | 2020-10-15 | 2020-10-15 | 一种视频语义提取方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112307908A true CN112307908A (zh) | 2021-02-02 |
CN112307908B CN112307908B (zh) | 2022-07-26 |
Family
ID=74327395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011101561.2A Active CN112307908B (zh) | 2020-10-15 | 2020-10-15 | 一种视频语义提取方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112307908B (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040091135A1 (en) * | 2002-11-07 | 2004-05-13 | Bourg Wilfred M. | Method for on-line machine vision measurement, monitoring and control of product features during on-line manufacturing processes |
CN102289686A (zh) * | 2011-08-09 | 2011-12-21 | 北京航空航天大学 | 一种基于迁移学习的运动目标分类识别方法 |
CN103905824A (zh) * | 2014-03-26 | 2014-07-02 | 深圳先进技术研究院 | 视频语义检索与压缩同步的摄像系统与方法 |
CN105260488A (zh) * | 2015-11-30 | 2016-01-20 | 哈尔滨工业大学 | 一种用于语义理解的文本序列迭代方法 |
CN107341805A (zh) * | 2016-08-19 | 2017-11-10 | 北京市商汤科技开发有限公司 | 图像前背景分割及网络模型训练、图像处理方法和装置 |
US20180211393A1 (en) * | 2017-01-24 | 2018-07-26 | Beihang University | Image guided video semantic object segmentation method and apparatus |
CN109753975A (zh) * | 2019-02-02 | 2019-05-14 | 杭州睿琪软件有限公司 | 一种训练样本获得方法、装置、电子设备和存储介质 |
WO2019232852A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字训练样本获取方法、装置、设备及介质 |
WO2019232849A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、手写字识别方法、装置、设备及介质 |
CN110765314A (zh) * | 2019-10-21 | 2020-02-07 | 长沙品先信息技术有限公司 | 一种视频语义结构化提取与标注的方法 |
CN111046971A (zh) * | 2019-12-24 | 2020-04-21 | 上海眼控科技股份有限公司 | 图像识别方法、装置、设备及计算机可读存储介质 |
CN111080670A (zh) * | 2019-12-17 | 2020-04-28 | 广州视源电子科技股份有限公司 | 图像提取方法、装置、设备及存储介质 |
CN111274389A (zh) * | 2020-01-14 | 2020-06-12 | 北京松果电子有限公司 | 一种信息处理方法、装置、计算机设备及存储介质 |
WO2020119075A1 (zh) * | 2018-12-10 | 2020-06-18 | 平安科技(深圳)有限公司 | 通用文本信息提取方法、装置、计算机设备和存储介质 |
CN111666376A (zh) * | 2020-05-21 | 2020-09-15 | 武汉大学 | 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置 |
CN111709966A (zh) * | 2020-06-23 | 2020-09-25 | 上海鹰瞳医疗科技有限公司 | 眼底图像分割模型训练方法及设备 |
-
2020
- 2020-10-15 CN CN202011101561.2A patent/CN112307908B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20040091135A1 (en) * | 2002-11-07 | 2004-05-13 | Bourg Wilfred M. | Method for on-line machine vision measurement, monitoring and control of product features during on-line manufacturing processes |
CN102289686A (zh) * | 2011-08-09 | 2011-12-21 | 北京航空航天大学 | 一种基于迁移学习的运动目标分类识别方法 |
CN103905824A (zh) * | 2014-03-26 | 2014-07-02 | 深圳先进技术研究院 | 视频语义检索与压缩同步的摄像系统与方法 |
CN105260488A (zh) * | 2015-11-30 | 2016-01-20 | 哈尔滨工业大学 | 一种用于语义理解的文本序列迭代方法 |
CN107341805A (zh) * | 2016-08-19 | 2017-11-10 | 北京市商汤科技开发有限公司 | 图像前背景分割及网络模型训练、图像处理方法和装置 |
US20180211393A1 (en) * | 2017-01-24 | 2018-07-26 | Beihang University | Image guided video semantic object segmentation method and apparatus |
WO2019232849A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 汉字模型训练方法、手写字识别方法、装置、设备及介质 |
WO2019232852A1 (zh) * | 2018-06-04 | 2019-12-12 | 平安科技(深圳)有限公司 | 手写字训练样本获取方法、装置、设备及介质 |
WO2020119075A1 (zh) * | 2018-12-10 | 2020-06-18 | 平安科技(深圳)有限公司 | 通用文本信息提取方法、装置、计算机设备和存储介质 |
CN109753975A (zh) * | 2019-02-02 | 2019-05-14 | 杭州睿琪软件有限公司 | 一种训练样本获得方法、装置、电子设备和存储介质 |
CN110765314A (zh) * | 2019-10-21 | 2020-02-07 | 长沙品先信息技术有限公司 | 一种视频语义结构化提取与标注的方法 |
CN111080670A (zh) * | 2019-12-17 | 2020-04-28 | 广州视源电子科技股份有限公司 | 图像提取方法、装置、设备及存储介质 |
CN111046971A (zh) * | 2019-12-24 | 2020-04-21 | 上海眼控科技股份有限公司 | 图像识别方法、装置、设备及计算机可读存储介质 |
CN111274389A (zh) * | 2020-01-14 | 2020-06-12 | 北京松果电子有限公司 | 一种信息处理方法、装置、计算机设备及存储介质 |
CN111666376A (zh) * | 2020-05-21 | 2020-09-15 | 武汉大学 | 一种基于段落边界扫描预测与词移距离聚类匹配的答案生成方法及装置 |
CN111709966A (zh) * | 2020-06-23 | 2020-09-25 | 上海鹰瞳医疗科技有限公司 | 眼底图像分割模型训练方法及设备 |
Non-Patent Citations (2)
Title |
---|
YIHUA ZHOU等: "A Video Semantic Object Extraction Method Based on Motion Feature and Visual Attention", 《2010 IEEE INTERNATIONAL CONFERENCE ON INTELLIGENT COMPUTING AND INTELLIGENT SYSTEM》 * |
张明: "基于语义特征的人脸特征提取方法的研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN112307908B (zh) | 2022-07-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111080628B (zh) | 图像篡改检测方法、装置、计算机设备和存储介质 | |
CN111461212B (zh) | 一种用于点云目标检测模型的压缩方法 | |
CN111401293B (zh) | 一种基于Head轻量化Mask Scoring R-CNN的手势识别方法 | |
CN113011357A (zh) | 基于时空融合的深度伪造人脸视频定位方法 | |
CN112101386B (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
CN110827312A (zh) | 一种基于协同视觉注意力神经网络的学习方法 | |
CN110599453A (zh) | 一种基于图像融合的面板缺陷检测方法、装置及设备终端 | |
CN109584206B (zh) | 零件表面瑕疵检测中神经网络的训练样本的合成方法 | |
CN110599514B (zh) | 图像分割的方法、装置、电子设备及存储介质 | |
CN115908774A (zh) | 一种基于机器视觉的变形物资的品质检测方法和装置 | |
CN114882204A (zh) | 船名自动识别方法 | |
CN117152094A (zh) | 基于计算机视觉的钢板表面缺陷分析方法、装置及系统 | |
CN112307908B (zh) | 一种视频语义提取方法及装置 | |
CN114743045B (zh) | 一种基于双分支区域建议网络的小样本目标检测方法 | |
CN116977249A (zh) | 缺陷检测的方法、模型训练的方法和装置 | |
CN115457620A (zh) | 用户表情识别方法、装置、计算机设备及存储介质 | |
CN114898290A (zh) | 一种海上船舶实时检测方法及系统 | |
KR20190093752A (ko) | 딥 러닝을 이용한 씬 텍스트 검출 방법 및 시스템 | |
CN114693554A (zh) | 一种大数据图像处理方法及系统 | |
CN112733686A (zh) | 用于云联邦的图像中的目标物识别方法及装置 | |
CN112733670A (zh) | 指纹特征提取方法、装置、电子设备及存储介质 | |
CN111539277A (zh) | 一种输电线路区域内施工机械的检测方法及系统 | |
CN117037049B (zh) | 基于YOLOv5深度学习的图像内容检测方法及系统 | |
CN115294489B (zh) | 一种灾害视频数据的语义分割方法和系统 | |
CN114241495B (zh) | 一种用于脱机手写文本识别的数据增强方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |