CN110298361B - 一种rgb-d图像的语义分割方法和系统 - Google Patents
一种rgb-d图像的语义分割方法和系统 Download PDFInfo
- Publication number
- CN110298361B CN110298361B CN201910430602.3A CN201910430602A CN110298361B CN 110298361 B CN110298361 B CN 110298361B CN 201910430602 A CN201910430602 A CN 201910430602A CN 110298361 B CN110298361 B CN 110298361B
- Authority
- CN
- China
- Prior art keywords
- features
- stage
- rgb
- semantic
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 115
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000004927 fusion Effects 0.000 claims abstract description 145
- 238000005070 sampling Methods 0.000 claims abstract description 42
- 230000006403 short-term memory Effects 0.000 claims abstract description 25
- 230000007787 long-term memory Effects 0.000 claims abstract description 10
- 230000015654 memory Effects 0.000 claims description 54
- 239000013598 vector Substances 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 18
- 238000010586 diagram Methods 0.000 claims description 15
- 238000011176 pooling Methods 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 abstract 1
- 238000010606 normalization Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 14
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 3
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/049—Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
Description
序号 | 方法 | 平均像素准确率 | 平均交并比 |
1 | FCN-32s | 41.1 | 29.0 |
2 | LSTM-F | 48.1 | - |
3 | Context | 53.4 | 42.3 |
4 | FuseNet-SF5 | 48.3 | 37.3 |
5 | LSD-GF | 58.0 | - |
6 | 本实施例的方法 | 60.1 | 47.5 |
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910430602.3A CN110298361B (zh) | 2019-05-22 | 2019-05-22 | 一种rgb-d图像的语义分割方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910430602.3A CN110298361B (zh) | 2019-05-22 | 2019-05-22 | 一种rgb-d图像的语义分割方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298361A CN110298361A (zh) | 2019-10-01 |
CN110298361B true CN110298361B (zh) | 2021-05-04 |
Family
ID=68027029
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910430602.3A Active CN110298361B (zh) | 2019-05-22 | 2019-05-22 | 一种rgb-d图像的语义分割方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298361B (zh) |
Families Citing this family (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110796105A (zh) * | 2019-11-04 | 2020-02-14 | 中国矿业大学 | 一种基于多模态数据融合的遥感图像语义分割方法 |
CN111062964B (zh) * | 2019-11-28 | 2023-07-14 | 深圳市华尊科技股份有限公司 | 图像分割方法及相关装置 |
CN110969632B (zh) * | 2019-11-28 | 2020-09-08 | 北京推想科技有限公司 | 一种深度学习模型的训练方法、图像处理方法及装置 |
CN111160140B (zh) * | 2019-12-13 | 2023-04-18 | 浙江大华技术股份有限公司 | 一种图像检测方法及装置 |
CN110929696A (zh) * | 2019-12-16 | 2020-03-27 | 中国矿业大学 | 一种基于多模态注意与自适应融合的遥感图像语义分割方法 |
CN110738200A (zh) * | 2019-12-23 | 2020-01-31 | 广州赛特智能科技有限公司 | 车道线3d点云地图构建方法、电子设备及存储介质 |
CN111242132A (zh) * | 2020-01-07 | 2020-06-05 | 广州赛特智能科技有限公司 | 室外道路场景语义分割方法、装置、电子设备及存储介质 |
CN111292340B (zh) * | 2020-01-23 | 2022-03-08 | 北京市商汤科技开发有限公司 | 语义分割方法、装置、设备及计算机可读存储介质 |
CN111340766B (zh) * | 2020-02-21 | 2024-06-11 | 北京市商汤科技开发有限公司 | 目标对象的检测方法、装置、设备和存储介质 |
CN113361529B (zh) * | 2020-03-03 | 2024-05-10 | 北京四维图新科技股份有限公司 | 图像语义分割方法、装置、电子设备及存储介质 |
CN111340814B (zh) * | 2020-03-03 | 2024-04-09 | 北京工业大学 | 一种基于多模态自适应卷积的rgb-d图像语义分割方法 |
CN111553391A (zh) * | 2020-04-09 | 2020-08-18 | 东南大学 | 语义分割技术中的特征融合方法 |
CN111709947B (zh) * | 2020-04-24 | 2024-04-02 | 浙江科技学院 | 一种双流沟通和全局信息引导的显著物体图像检测方法 |
CN111260653B (zh) * | 2020-04-27 | 2020-08-25 | 腾讯科技(深圳)有限公司 | 一种图像分割方法、装置、存储介质和电子设备 |
CN111915619A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种双特征提取与融合的全卷积网络语义分割方法 |
CN112329780B (zh) * | 2020-11-04 | 2023-10-27 | 杭州师范大学 | 一种基于深度学习的深度图像语义分割方法 |
CN112507898B (zh) * | 2020-12-14 | 2022-07-01 | 重庆邮电大学 | 一种基于轻量3d残差网络和tcn的多模态动态手势识别方法 |
CN112562855B (zh) * | 2020-12-18 | 2021-11-02 | 深圳大学 | 一种肝细胞癌术后早期复发风险预测方法、介质及终端设备 |
CN112527968A (zh) * | 2020-12-22 | 2021-03-19 | 大唐融合通信股份有限公司 | 一种基于神经网络的作文评阅方法和系统 |
CN112861911B (zh) * | 2021-01-10 | 2024-05-28 | 西北工业大学 | 一种基于深度特征选择融合的rgb-d语义分割方法 |
CN112862830B (zh) * | 2021-01-28 | 2023-12-22 | 陕西师范大学 | 一种多模态图像分割方法、系统、终端及可读存储介质 |
CN113011555B (zh) * | 2021-02-09 | 2023-01-31 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN113240631B (zh) * | 2021-04-22 | 2023-12-12 | 北京中科慧眼科技有限公司 | 基于rgb-d融合信息的路面检测方法、系统和智能终端 |
CN113222003B (zh) * | 2021-05-08 | 2023-08-01 | 北方工业大学 | 一种基于rgb-d的室内场景逐像素语义分类器构造方法及系统 |
CN113283435B (zh) * | 2021-05-14 | 2023-08-22 | 陕西科技大学 | 一种基于多尺度注意力融合的遥感图像语义分割方法 |
CN113298154B (zh) * | 2021-05-27 | 2022-11-11 | 安徽大学 | 一种rgb-d图像显著目标检测方法 |
CN113313718B (zh) * | 2021-05-28 | 2023-02-10 | 华南理工大学 | 一种基于深度学习的急性腰椎骨折mri图像分割系统 |
CN113538442B (zh) * | 2021-06-04 | 2024-04-09 | 杭州电子科技大学 | 一种使用自适应特征融合的rgb-d显著目标检测方法 |
CN113393443B (zh) * | 2021-06-17 | 2023-02-14 | 华南理工大学 | 一种he病理图像细胞核分割方法及系统 |
CN113449623B (zh) * | 2021-06-21 | 2022-06-28 | 浙江康旭科技有限公司 | 一种基于深度学习的轻型活体检测方法 |
CN114120253B (zh) * | 2021-10-29 | 2023-11-14 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备和存储介质 |
CN114372986B (zh) * | 2021-12-30 | 2024-05-24 | 深圳大学 | 注意力引导多模态特征融合的图像语义分割方法及装置 |
CN114913325B (zh) * | 2022-03-24 | 2024-05-10 | 北京百度网讯科技有限公司 | 语义分割方法、装置及计算机程序产品 |
CN114972756A (zh) * | 2022-05-30 | 2022-08-30 | 湖南大学 | 一种医学图像的语义分割方法及装置 |
CN114723951B (zh) * | 2022-06-08 | 2022-11-04 | 成都信息工程大学 | 一种用于rgb-d图像分割的方法 |
CN116109645B (zh) * | 2023-04-14 | 2023-07-07 | 锋睿领创(珠海)科技有限公司 | 基于先验知识的智能处理方法、装置、设备和介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107979764A (zh) * | 2017-12-06 | 2018-05-01 | 中国石油大学(华东) | 基于语义分割和多层注意力框架的视频字幕生成方法 |
CN108388900A (zh) * | 2018-02-05 | 2018-08-10 | 华南理工大学 | 基于多特征融合和时空注意力机制相结合的视频描述方法 |
-
2019
- 2019-05-22 CN CN201910430602.3A patent/CN110298361B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107979764A (zh) * | 2017-12-06 | 2018-05-01 | 中国石油大学(华东) | 基于语义分割和多层注意力框架的视频字幕生成方法 |
CN108388900A (zh) * | 2018-02-05 | 2018-08-10 | 华南理工大学 | 基于多特征融合和时空注意力机制相结合的视频描述方法 |
Non-Patent Citations (3)
Title |
---|
FuseNet: Incorporating Depth into Semantic;Caner Hazirbas et al.;《ACCV 2016》;20171231;第213–228页 * |
In Defense of Pre-trained ImageNet Architectures for Real-time Semantic Segmentation of Road-driving Images;Marin Or si et al.;《arXiv》;20190412;第1-10页 * |
LSTM-CF: Unifying Context Modeling and Fusion with LSTMs for RGB-D Scene Labeling;Zhen Li et al.;《arXiv》;20160726;第1-17页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110298361A (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298361B (zh) | 一种rgb-d图像的语义分割方法和系统 | |
CN113240580B (zh) | 一种基于多维度知识蒸馏的轻量级图像超分辨率重建方法 | |
CN113469094B (zh) | 一种基于多模态遥感数据深度融合的地表覆盖分类方法 | |
CN111340814B (zh) | 一种基于多模态自适应卷积的rgb-d图像语义分割方法 | |
CN108154194B (zh) | 一种用基于张量的卷积网络提取高维特征的方法 | |
CN111680176B (zh) | 基于注意力与双向特征融合的遥感图像检索方法及系统 | |
Zhang et al. | Deep hierarchical guidance and regularization learning for end-to-end depth estimation | |
CN107103285B (zh) | 基于卷积神经网络的人脸深度预测方法 | |
CN111931764B (zh) | 一种目标检测方法、目标检测框架及相关设备 | |
CN110705566B (zh) | 一种基于空间金字塔池的多模态融合显著性检测方法 | |
CN110222607A (zh) | 人脸关键点检测的方法、装置及系统 | |
CN117033609B (zh) | 文本视觉问答方法、装置、计算机设备和存储介质 | |
CN113066089A (zh) | 一种基于注意力引导机制的实时图像语义分割网络 | |
CN111611925A (zh) | 一种建筑物检测与识别方法及装置 | |
CN111046213B (zh) | 一种基于图像识别的知识库构建方法 | |
CN116109920A (zh) | 一种基于Transformer的遥感图像建筑物提取方法 | |
CN112733777B (zh) | 一种遥感图像的道路提取方法、装置、设备和存储介质 | |
CN114612666A (zh) | 一种基于多模态对比学习的rgb-d语义分割方法 | |
CN111311732B (zh) | 3d人体网格获取方法及装置 | |
CN117392488A (zh) | 一种数据处理方法、神经网络及相关设备 | |
CN112288702A (zh) | 一种基于车联网的道路图像检测方法 | |
CN111476075A (zh) | 利用1x1卷积的基于CNN的客体检测方法及装置 | |
CN114494893B (zh) | 基于语义重用上下文特征金字塔的遥感图像特征提取方法 | |
CN115937594A (zh) | 基于局部与全局特征融合的遥感图像分类方法和装置 | |
CN113052156B (zh) | 光学字符识别方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20200825 Address after: Room 101, building 1, block C, Qianjiang Century Park, ningwei street, Xiaoshan District, Hangzhou City, Zhejiang Province Applicant after: Hangzhou Weiming Information Technology Co.,Ltd. Applicant after: Institute of Information Technology, Zhejiang Peking University Address before: Room 288-1, 857 Xinbei Road, Ningwei Town, Xiaoshan District, Hangzhou City, Zhejiang Province Applicant before: Institute of Information Technology, Zhejiang Peking University Applicant before: Hangzhou Weiming Information Technology Co.,Ltd. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20191001 Assignee: Zhejiang smart video security Innovation Center Co.,Ltd. Assignor: Institute of Information Technology, Zhejiang Peking University Contract record no.: X2022330000930 Denomination of invention: A Semantic Segmentation Method and System for RGB D Images Granted publication date: 20210504 License type: Common License Record date: 20221229 |
|
EE01 | Entry into force of recordation of patent licensing contract |