CN110321864A - 基于多尺度裁剪机制的遥感图像文字说明生成方法 - Google Patents
基于多尺度裁剪机制的遥感图像文字说明生成方法 Download PDFInfo
- Publication number
- CN110321864A CN110321864A CN201910615120.5A CN201910615120A CN110321864A CN 110321864 A CN110321864 A CN 110321864A CN 201910615120 A CN201910615120 A CN 201910615120A CN 110321864 A CN110321864 A CN 110321864A
- Authority
- CN
- China
- Prior art keywords
- indicate
- remote sensing
- explanatory note
- sensing images
- cutting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Library & Information Science (AREA)
- Astronomy & Astrophysics (AREA)
- Remote Sensing (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种基于多尺度裁剪机制的遥感图像文字说明生成方法,用于解决现有遥感图像文字说明生成方法存在过拟合现象的技术问题。技术方案是在数据集中的遥感图像输入CNN之前,对原始遥感图像按照多个不同的尺度裁剪为大小不一的图像块,再将裁剪后的图像块重新缩放到统一尺寸大小,输入到编码器‑解码器模型中,从而使数据集得到扩充,同时使得CNN能更好地提取图像中的全局特征与局部特征,有效地减少因数据集中图像数量有限所造成的过拟合现象,进一步提高遥感图像文字说明生成任务的准确度。同时,通过裁剪多个尺度图像块进行训练,显著提高了模型的泛化能力。
Description
技术领域
本发明涉及一种遥感图像文字说明生成方法,特别涉及一种基于多尺度裁剪机制的遥感图像文字说明生成方法。
背景技术
文献“B.Qu,X.Li,D.Tao,and X.Lu,Deep Semantic Understanding of HighResolution Remote Sensing Image.International Conference on Computer,Information and Telecommunication Systems,124-128,2016”提出了一种基于深度多模态神经网络模型的高分辨率遥感图像文字说明生成方法。该方法基于编码器-解码器模型分为两个阶段:图像理解阶段和文字说明生成阶段。图像理解阶段首先通过卷积神经网络(Convolutional Neural Network)CNN对遥感图像的视觉特征进行深度提取,将提取到的特征编码为一个固定长度的特征向量,然后在文字说明生成阶段分别通过序列模型中的循环神经网络(Recurrent Neural Network)RNN和长短期记忆网络(Long Short-TermMemory)LSTM,对图像理解阶段提取到的图像特征进行解码,从而生成简明而有意义的文字序列。遥感图像的文字说明生成任务极具挑战性,尤其是遥感数据集中图像数量的不足,使得这种基于深度学习的方法存在着严重的过拟合问题,也造成了该种方法的泛化能力不足。
发明内容
为了克服现有遥感图像文字说明生成方法存在过拟合现象的不足,本发明提供一种基于多尺度裁剪机制的遥感图像文字说明生成方法。该方法在数据集中的遥感图像输入CNN之前,对原始遥感图像按照多个不同的尺度裁剪为大小不一的图像块,再将裁剪后的图像块重新缩放到统一尺寸大小,输入到编码器-解码器模型中,从而使数据集得到扩充,同时使得CNN能更好地提取图像中的全局特征与局部特征,有效地减少因数据集中图像数量有限所造成的过拟合现象,进一步提高遥感图像文字说明生成任务的准确度。同时,通过裁剪多个尺度图像块进行训练,显著提高了模型的泛化能力。
本发明解决其技术问题所采用的技术方案:一种基于多尺度裁剪机制的遥感图像文字说明生成方法,其特点是包括以下步骤:
步骤一、定义缩放尺度比例值列表S。
S=[s1,s2,...,sn] (1)
式中,si(i=1,2,...,n)表示列表中定义的一个比例值,n表示列表中比例值的总数。
步骤二、对输入图像进行处理,将输入图像缩放为固定尺寸大小d×d,从列表S中选取一个比例值si,将缩放为固定尺寸大小的图像根据所选取比例值进行裁剪。
d'=d×si (2)
式中,d'表示裁剪后的图像块尺寸大小。
步骤三、利用卷积神经网络CNN对裁剪后的图像块进行特征提取。
v0=CNN(Pi) (3)
式中,Pi表示裁剪后的图像块,CNN(·)表示卷积神经网络过程,v0表示一个固定长度的特征向量。
步骤四、利用长短期记忆网络LSTM生成相应的文字说明语句。
y={ω1,ω2,...,ωt,...,ωN},t∈{0,...,N} (4)
ht=g(ht-1,v0,ωt-1) (5)
pt=softmax(ht) (6)
式中,ht表示t时刻LSTM的隐藏状态,ωt表示一句文字说明语句y中对应的每一个单词,g(·)表示LSTM的过程,pt表示ht经过softmax函数后的下一个单词出现的概率。然后最小化目标句子的负似然函数Loss损失函数。
式中,ωt表示一句文字说明语句y中对应的每一个单词,pt表示下一个单词出现的概率。
本发明的有益效果是:该方法在数据集中的遥感图像输入CNN之前,对原始遥感图像按照多个不同的尺度裁剪为大小不一的图像块,再将裁剪后的图像块重新缩放到统一尺寸大小,输入到编码器-解码器模型中,从而使数据集得到扩充,同时使得CNN能更好地提取图像中的全局特征与局部特征,有效地减少因数据集中图像数量有限所造成的过拟合现象,进一步提高遥感图像文字说明生成任务的准确度。同时,通过裁剪多个尺度图像块进行训练,显著提高了模型的泛化能力。
下面结合附图和具体实施方式对本发明作详细说明。
附图说明
图1是本发明基于多尺度裁剪机制的遥感图像文字说明生成方法的流程图。
具体实施方式
参照图1。本发明基于多尺度裁剪机制的遥感图像文字说明生成方法具体步骤如下:
步骤一、定义缩放尺度比例值列表S:
S=[s1,s2,...,sn] (1)
式中,si(i=1,2,...,n)表示列表中定义的一个比例值,取值范围是0~1,n表示列表中比例值的总数,实验中取S=[1.0,0.875,0.66]。
步骤二、输入图像的多尺度裁剪。
对输入图像进行处理,将输入图像缩放为固定尺寸大小,从列表中选取一个比例值,将缩放为固定尺寸大小的图像根据所选取比例值进行裁剪。
d'=d×si (2)
式中,d'表示裁剪后的图像块尺寸大小。d设置为224,因此,d'的取值为256、224和169。模型每次将从缩放比例值列表中随机选取一个比例值si,每幅图像将会根据该比例值被裁剪出十个图像块(分别是图像的中心,左上角,右上角,左下角和右下角,以及这五个图像块的竖直翻转图像块)。然后这些根据不同尺度随机剪裁出的大小不同的图像块将被重新放缩为统一尺寸大小,此处的重置大小设置为224×224。
步骤三、利用卷积神经网络CNN对裁剪后的图像块进行特征提取。
v0=CNN(Pi) (3)
式中,Pi表示裁剪后的图像块,CNN(·)表示卷积神经网络过程,v0表示一个固定长度的特征向量。
此处的卷积神经网络CNN是一种前馈神经网络,它由一个或多个卷积层和顶端的全连接层(对应经典的神经网络)组成,同时也包括关联权重和池化层(pooling layer)。它能自动抽取出一些高级特征,缩短了特征提取的时间,具有很强的表达能力。本发明中所采用的CNN是提前在ImageNet数据集上进行预训练的,将最后一个全连接层进行替换后,用于将图像特征提取为固定长度的特征向量。通过将放缩处理后的图像块送入编码器模型中,能使得卷积神经网络(CNN)更好地同时提取到不同的全局特征和局部特征,从而增强模型的泛化能力,有效降低数据集过小带来的过拟合问题。
步骤四、生成文字说明语句。
利用长短期记忆网络LSTM生成相应的文字说明语句。
y={ω1,ω2,...,ωt,...,ωN},t∈{0,...,N} (4)
ht=g(ht-1,v0,ωt-1) (5)
pt=softmax(ht) (6)
式中,ht表示t时刻LSTM的隐藏状态,ωt表示一句文字说明语句y中对应的每一个单词,g(·)表示LSTM的过程,pt表示ht经过softmax函数后的下一个单词出现的概率。在t=1时刻,特征向量v0将作为LSTM的输入,逐个输出预测单词,最后最小化损失函数Loss函数,得到输入图像的文字说明语句,公式如下:
式中,ωt表示一句文字说明语句y中对应的每一个单词,pt表示下一个单词出现的概率。
本发明的效果通过以下实验做进一步的说明。
1.实验条件。
本实验是在中央处理器为i5-3470 3.2GHz CPU、内存4G、Ubuntu 16.04操作系统上,采用Pytorch 1.0框架使用一块GPU进行实验。
实验使用两个用于遥感图像文字说明生成任务的专用数据集UCM-captions和Sydney-captions,这两个数据集由Qu等人在文献“B.Qu,X.Li,D.Tao,and X.Lu,DeepSemantic Understanding of High Resolution Remote Sensing Image.InternationalConference on Computer,Information and Telecommunication Systems,124-128,2016”中提出,其中UCM-captions包含21个种类的图像,每个种类有100幅图像,Sydney-captions数据集共有包含7个类别的2329幅图像,两个数据集中的每幅图像都有相对应的5句文字说明语句。该实验采用文字说明生成任务的一种常用评价标准BLEU,该评价标准是由Papineni等人在文献“K.Papineni,S.Roukos,T.Ward,and W.J.Zhu,Bleu:A Method forAutomatic Evaluation of Machine Translation.Association for ComputationalLinguistics,311-318,2002”中提出。
2.实验内容。
首先,分别在一个尺度,两个尺度,三个尺度下进行遥感图像的文字说明生成实验,通过对比采用不同尺度下实验的BLEU得分,证明该发明的有效性。同时,为了证明本方法的泛化能力,采用三个不同的CNN模型作为编码器提取图像特征进行实验。UCM-captions数据集实验结果参照表1,Sydney-captions数据集实验结果参照表2。
表1
表2
实验结果证明,本发明所采用的多尺度裁剪机制可以对数据集进行扩充,有效降低遥感图像数据集较小带来的过拟合问题,显著提高生成的文字说明语句得分。在三个不同CNN上的对比实验都表明了该发明的有效性,从而证明了该发明在不同模型上的良好泛化能力。
Claims (1)
1.一种基于多尺度裁剪机制的遥感图像文字说明生成方法,其特征在于包括以下步骤:
步骤一、定义缩放尺度比例值列表S;
S=[s1,s2,...,sn] (1)
式中,si(i=1,2,...,n)表示列表中定义的一个比例值,n表示列表中比例值的总数;
步骤二、对输入图像进行处理,将输入图像缩放为固定尺寸大小d×d,从列表S中选取一个比例值si,将缩放为固定尺寸大小的图像根据所选取比例值进行裁剪;
d'=d×si (2)
式中,d'表示裁剪后的图像块尺寸大小;
步骤三、利用卷积神经网络CNN对裁剪后的图像块进行特征提取;
v0=CNN(Pi) (3)
式中,Pi表示裁剪后的图像块,CNN(·)表示卷积神经网络过程,v0表示一个固定长度的特征向量;
步骤四、利用长短期记忆网络LSTM生成相应的文字说明语句;
y={ω1,ω2,...,ωt,...,ωN},t∈{0,...,N} (4)
ht=g(ht-1,v0,ωt-1) (5)
pt=soft max(ht) (6)
式中,ht表示t时刻LSTM的隐藏状态,ωt表示一句文字说明语句y中对应的每一个单词,g(·)表示LSTM的过程,pt表示ht经过soft max函数后的下一个单词出现的概率;然后最小化目标句子的负似然函数Loss损失函数;
式中,ωt表示一句文字说明语句y中对应的每一个单词,pt表示下一个单词出现的概率。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910615120.5A CN110321864A (zh) | 2019-07-09 | 2019-07-09 | 基于多尺度裁剪机制的遥感图像文字说明生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910615120.5A CN110321864A (zh) | 2019-07-09 | 2019-07-09 | 基于多尺度裁剪机制的遥感图像文字说明生成方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110321864A true CN110321864A (zh) | 2019-10-11 |
Family
ID=68121657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910615120.5A Pending CN110321864A (zh) | 2019-07-09 | 2019-07-09 | 基于多尺度裁剪机制的遥感图像文字说明生成方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110321864A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931738A (zh) * | 2020-09-28 | 2020-11-13 | 南京邮电大学 | 用于遥感影像的神经网络模型预训练方法、装置 |
CN112258523A (zh) * | 2020-10-20 | 2021-01-22 | 中国石油大学(华东) | 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1480901A (zh) * | 2002-06-21 | 2004-03-10 | ������������ʽ���� | 数字图像的语义按比例缩小和剪切 |
CN105740786A (zh) * | 2016-01-25 | 2016-07-06 | 中国科学院深圳先进技术研究院 | 书写人的身份识别方法及装置 |
US20170124432A1 (en) * | 2015-11-03 | 2017-05-04 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering |
CN106709917A (zh) * | 2017-01-03 | 2017-05-24 | 青岛海信医疗设备股份有限公司 | 神经网络模型训练方法、装置及系统 |
CN106778584A (zh) * | 2016-12-08 | 2017-05-31 | 南京邮电大学 | 一种基于深层特征与浅层特征融合的人脸年龄估计方法 |
CN107316004A (zh) * | 2017-06-06 | 2017-11-03 | 西北工业大学 | 基于深度学习的空间目标识别方法 |
CN107679525A (zh) * | 2017-11-01 | 2018-02-09 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置及计算机可读存储介质 |
CN107958219A (zh) * | 2017-12-06 | 2018-04-24 | 电子科技大学 | 基于多模型和多尺度特征的图像场景分类方法 |
CN108230233A (zh) * | 2017-05-16 | 2018-06-29 | 北京市商汤科技开发有限公司 | 数据增强、处理方法和装置、电子设备和计算机存储介质 |
CN108460403A (zh) * | 2018-01-23 | 2018-08-28 | 上海交通大学 | 一种图像中多尺度特征融合的目标检测方法与系统 |
CN108520206A (zh) * | 2018-03-22 | 2018-09-11 | 南京大学 | 一种基于全卷积神经网络的真菌显微图像识别方法 |
CN109034184A (zh) * | 2018-06-07 | 2018-12-18 | 广西电网有限责任公司玉林供电局 | 一种基于深度学习的均压环检测识别方法 |
CN109360192A (zh) * | 2018-09-25 | 2019-02-19 | 郑州大学西亚斯国际学院 | 一种基于全卷积网络的物联网大田作物叶部病害检测方法 |
CN109543719A (zh) * | 2018-10-30 | 2019-03-29 | 浙江大学 | 基于多模态注意力模型的宫颈非典型病变诊断模型和装置 |
CN109614998A (zh) * | 2018-11-29 | 2019-04-12 | 北京航天自动控制研究所 | 基于深度学习的陆标数据库制备方法 |
CN109766819A (zh) * | 2019-01-04 | 2019-05-17 | 北京博宇通达科技有限公司 | 车辆身份识别方法及装置 |
CN109902912A (zh) * | 2019-01-04 | 2019-06-18 | 中国矿业大学 | 一种基于性格特征的个性化图像美学评价方法 |
CN109977942A (zh) * | 2019-02-02 | 2019-07-05 | 浙江工业大学 | 一种基于场景分类和超分辨率的场景文字识别方法 |
-
2019
- 2019-07-09 CN CN201910615120.5A patent/CN110321864A/zh active Pending
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1480901A (zh) * | 2002-06-21 | 2004-03-10 | ������������ʽ���� | 数字图像的语义按比例缩小和剪切 |
US20170124432A1 (en) * | 2015-11-03 | 2017-05-04 | Baidu Usa Llc | Systems and methods for attention-based configurable convolutional neural networks (abc-cnn) for visual question answering |
CN105740786A (zh) * | 2016-01-25 | 2016-07-06 | 中国科学院深圳先进技术研究院 | 书写人的身份识别方法及装置 |
CN106778584A (zh) * | 2016-12-08 | 2017-05-31 | 南京邮电大学 | 一种基于深层特征与浅层特征融合的人脸年龄估计方法 |
CN106709917A (zh) * | 2017-01-03 | 2017-05-24 | 青岛海信医疗设备股份有限公司 | 神经网络模型训练方法、装置及系统 |
CN108230233A (zh) * | 2017-05-16 | 2018-06-29 | 北京市商汤科技开发有限公司 | 数据增强、处理方法和装置、电子设备和计算机存储介质 |
CN107316004A (zh) * | 2017-06-06 | 2017-11-03 | 西北工业大学 | 基于深度学习的空间目标识别方法 |
CN107679525A (zh) * | 2017-11-01 | 2018-02-09 | 腾讯科技(深圳)有限公司 | 图像分类方法、装置及计算机可读存储介质 |
CN107958219A (zh) * | 2017-12-06 | 2018-04-24 | 电子科技大学 | 基于多模型和多尺度特征的图像场景分类方法 |
CN108460403A (zh) * | 2018-01-23 | 2018-08-28 | 上海交通大学 | 一种图像中多尺度特征融合的目标检测方法与系统 |
CN108520206A (zh) * | 2018-03-22 | 2018-09-11 | 南京大学 | 一种基于全卷积神经网络的真菌显微图像识别方法 |
CN109034184A (zh) * | 2018-06-07 | 2018-12-18 | 广西电网有限责任公司玉林供电局 | 一种基于深度学习的均压环检测识别方法 |
CN109360192A (zh) * | 2018-09-25 | 2019-02-19 | 郑州大学西亚斯国际学院 | 一种基于全卷积网络的物联网大田作物叶部病害检测方法 |
CN109543719A (zh) * | 2018-10-30 | 2019-03-29 | 浙江大学 | 基于多模态注意力模型的宫颈非典型病变诊断模型和装置 |
CN109614998A (zh) * | 2018-11-29 | 2019-04-12 | 北京航天自动控制研究所 | 基于深度学习的陆标数据库制备方法 |
CN109766819A (zh) * | 2019-01-04 | 2019-05-17 | 北京博宇通达科技有限公司 | 车辆身份识别方法及装置 |
CN109902912A (zh) * | 2019-01-04 | 2019-06-18 | 中国矿业大学 | 一种基于性格特征的个性化图像美学评价方法 |
CN109977942A (zh) * | 2019-02-02 | 2019-07-05 | 浙江工业大学 | 一种基于场景分类和超分辨率的场景文字识别方法 |
Non-Patent Citations (3)
Title |
---|
BO QU ET AL: "Deep semantic understanding of high resolution remote sensing image", 《2016 INTERNATIONAL CONFERENCE ON COMPUTER, INFORMATION AND TELECOMMUNICATION SYSTEMS (CITS)》 * |
DONG-JIN KIM AL: "Sentence Learning on Deep Convolutional Networks for Image Caption Generation", 《2016 13TH INTERNATIONAL CONFERENCE ON UBIQUITOUS ROBOTS AND AMBIENT INTELLIGENCE (URAI)》 * |
张明星: "X射线钢管焊缝缺陷的图像处理与识别技术研究", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111931738A (zh) * | 2020-09-28 | 2020-11-13 | 南京邮电大学 | 用于遥感影像的神经网络模型预训练方法、装置 |
CN111931738B (zh) * | 2020-09-28 | 2021-01-26 | 南京邮电大学 | 用于遥感影像的神经网络模型预训练方法、装置 |
CN112258523A (zh) * | 2020-10-20 | 2021-01-22 | 中国石油大学(华东) | 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法 |
CN112258523B (zh) * | 2020-10-20 | 2022-03-08 | 中国石油大学(华东) | 一种中低分辨率遥感影像浒苔覆盖信息精细提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111046946B (zh) | 基于crnn的缅甸语图像文本识别方法 | |
CN107291795B (zh) | 一种结合动态词嵌入和词性标注的文本分类方法 | |
US20190197109A1 (en) | System and methods for performing nlp related tasks using contextualized word representations | |
CN109948615B (zh) | 多语言文本检测识别系统 | |
CN107392147A (zh) | 一种基于改进的生成式对抗网络的图像语句转换方法 | |
CN110532554A (zh) | 一种中文摘要生成方法、系统及存储介质 | |
CN113254599A (zh) | 一种基于半监督学习的多标签微博文本分类方法 | |
CN109977416A (zh) | 一种多层次自然语言反垃圾文本方法及系统 | |
CN106599198A (zh) | 一种多级联结循环神经网络的图像描述方法 | |
CN111061861B (zh) | 一种基于XLNet的文本摘要自动生成方法 | |
CN111460247B (zh) | 网络图片敏感文字自动检测方法 | |
CN110188654B (zh) | 一种基于移动未裁剪网络的视频行为识别方法 | |
US20220156527A1 (en) | Systems and methods for contrastive attention-supervised tuning | |
CN111859964A (zh) | 一种语句中命名实体的识别方法及装置 | |
CN110956038B (zh) | 图文内容重复判断方法及装置 | |
CN110321864A (zh) | 基于多尺度裁剪机制的遥感图像文字说明生成方法 | |
CN115438154A (zh) | 基于表征学习的中文自动语音识别文本修复方法及系统 | |
CN110956037A (zh) | 多媒体内容重复判断方法及装置 | |
CN111639186A (zh) | 动态嵌入投影门控的多类别多标签文本分类模型及装置 | |
US20220383120A1 (en) | Self-supervised contrastive learning using random feature corruption | |
CN114187595A (zh) | 基于视觉特征和语义特征融合的文档布局识别方法及系统 | |
CN116977844A (zh) | 一种轻量级水下目标实时检测方法 | |
Huang | A CNN model for SMS spam detection | |
CN116932736A (zh) | 一种基于用户需求结合倒排表的专利推荐方法 | |
WO2023192674A1 (en) | Attention neural networks with parallel attention and feed-forward layers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191011 |
|
RJ01 | Rejection of invention patent application after publication |