CN107403430B - 一种rgbd图像语义分割方法 - Google Patents
一种rgbd图像语义分割方法 Download PDFInfo
- Publication number
- CN107403430B CN107403430B CN201710453788.5A CN201710453788A CN107403430B CN 107403430 B CN107403430 B CN 107403430B CN 201710453788 A CN201710453788 A CN 201710453788A CN 107403430 B CN107403430 B CN 107403430B
- Authority
- CN
- China
- Prior art keywords
- image
- long
- depth
- network
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000011218 segmentation Effects 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 title claims abstract description 36
- 230000015654 memory Effects 0.000 claims abstract description 74
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 39
- 238000012549 training Methods 0.000 claims abstract description 31
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 20
- 230000006870 function Effects 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 15
- 230000007787 long-term memory Effects 0.000 claims description 9
- 238000012937 correction Methods 0.000 claims description 7
- 238000012360 testing method Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 claims description 6
- 238000002372 labelling Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000010304 firing Methods 0.000 claims 1
- 230000006403 short-term memory Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Abstract
Description
Claims (10)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710453788.5A CN107403430B (zh) | 2017-06-15 | 2017-06-15 | 一种rgbd图像语义分割方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710453788.5A CN107403430B (zh) | 2017-06-15 | 2017-06-15 | 一种rgbd图像语义分割方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107403430A CN107403430A (zh) | 2017-11-28 |
CN107403430B true CN107403430B (zh) | 2020-08-07 |
Family
ID=60404428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710453788.5A Active CN107403430B (zh) | 2017-06-15 | 2017-06-15 | 一种rgbd图像语义分割方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107403430B (zh) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019109290A1 (en) * | 2017-12-07 | 2019-06-13 | Qualcomm Incorporated | Context set and context fusion |
CN108154465B (zh) * | 2017-12-19 | 2022-03-01 | 北京小米移动软件有限公司 | 图像处理方法及装置 |
CN108229548A (zh) * | 2017-12-27 | 2018-06-29 | 华为技术有限公司 | 一种物体检测方法及装置 |
CN110363210B (zh) * | 2018-04-10 | 2023-05-05 | 腾讯科技(深圳)有限公司 | 一种图像语义分割模型的训练方法和服务器 |
CN108596102B (zh) * | 2018-04-26 | 2022-04-05 | 北京航空航天大学青岛研究院 | 基于rgb-d的室内场景物体分割分类器构造方法 |
US11630987B2 (en) * | 2018-04-30 | 2023-04-18 | International Business Machines Corporation | Neural belief reasoner |
CN108765425B (zh) * | 2018-05-15 | 2022-04-22 | 深圳大学 | 图像分割方法、装置、计算机设备和存储介质 |
WO2019218136A1 (zh) | 2018-05-15 | 2019-11-21 | 深圳大学 | 图像分割方法、计算机设备和存储介质 |
CN108734713A (zh) * | 2018-05-18 | 2018-11-02 | 大连理工大学 | 一种基于多特征图的交通图像语义分割方法 |
CN108895981B (zh) * | 2018-05-29 | 2020-10-09 | 南京怀萃智能科技有限公司 | 一种三维测量方法、装置、服务器和存储介质 |
CN108764146A (zh) * | 2018-05-29 | 2018-11-06 | 杭州视氪科技有限公司 | 一种地形和目标检测方法 |
CN108629946B (zh) * | 2018-06-14 | 2020-09-04 | 清华大学深圳研究生院 | 一种基于rgbd传感器的人体跌倒检测方法 |
CN109035257B (zh) * | 2018-07-02 | 2021-08-31 | 百度在线网络技术(北京)有限公司 | 人像分割方法、装置及设备 |
CN109087349B (zh) * | 2018-07-18 | 2021-01-26 | 亮风台(上海)信息科技有限公司 | 一种单目深度估计方法、装置、终端和存储介质 |
CN109145747B (zh) * | 2018-07-20 | 2021-10-08 | 华中科技大学 | 一种水面全景图像语义分割方法 |
CN109101972A (zh) * | 2018-07-26 | 2018-12-28 | 天津大学 | 一种带上下文信息编码的语义分割卷积神经网络 |
CN109284779A (zh) * | 2018-09-04 | 2019-01-29 | 中国人民解放军陆军工程大学 | 基于深度全卷积网络的物体检测方法 |
CN109308493B (zh) * | 2018-09-25 | 2020-11-03 | 南京大学 | 一种基于堆叠神经网络的递进式图像解析方法 |
CN109447923A (zh) * | 2018-09-27 | 2019-03-08 | 中国科学院计算技术研究所 | 一种语义场景补全系统与方法 |
CN109359564B (zh) * | 2018-09-29 | 2022-06-24 | 中山大学 | 一种图像场景图生成方法及装置 |
CN110160502B (zh) | 2018-10-12 | 2022-04-01 | 腾讯科技(深圳)有限公司 | 地图要素提取方法、装置及服务器 |
WO2020077604A1 (zh) * | 2018-10-19 | 2020-04-23 | 深圳大学 | 图像语义分割方法、计算机设备和存储介质 |
CN109544559B (zh) * | 2018-10-19 | 2022-07-08 | 深圳大学 | 图像语义分割方法、装置、计算机设备和存储介质 |
CN110163862B (zh) * | 2018-10-22 | 2023-08-25 | 腾讯科技(深圳)有限公司 | 图像语义分割方法、装置及计算机设备 |
CN109447247B (zh) * | 2018-10-23 | 2021-11-16 | 北京旷视科技有限公司 | 获得用于图像处理任务的卷积神经网络的方法及装置 |
CN111127510B (zh) * | 2018-11-01 | 2023-10-27 | 杭州海康威视数字技术股份有限公司 | 一种目标对象位置的预测方法及装置 |
CN109218706B (zh) * | 2018-11-06 | 2020-11-06 | 浙江大学 | 一种由单张图像生成立体视觉图像的方法 |
CN109670409B (zh) * | 2018-11-28 | 2022-10-21 | 浙江大学 | 一种语义棒状像素的场景表示系统及方法 |
EP3664017B1 (en) * | 2018-12-06 | 2022-03-02 | Robert Bosch GmbH | Method and device for digital image or video data processing |
CN109903332A (zh) * | 2019-01-08 | 2019-06-18 | 杭州电子科技大学 | 一种基于深度学习的目标姿态估计方法 |
CN109801297B (zh) * | 2019-01-14 | 2020-12-11 | 浙江大学 | 一种基于卷积实现的图像全景分割预测优化方法 |
CN109800873B (zh) * | 2019-01-29 | 2021-03-23 | 北京旷视科技有限公司 | 图像处理方法及装置 |
CN110245567B (zh) * | 2019-05-16 | 2023-04-07 | 达闼机器人股份有限公司 | 避障方法、装置、存储介质及电子设备 |
CN110232326A (zh) * | 2019-05-20 | 2019-09-13 | 平安科技(深圳)有限公司 | 一种三维物体识别方法、装置及存储介质 |
CN110163876B (zh) * | 2019-05-24 | 2021-08-17 | 山东师范大学 | 基于多特征融合的左心室分割方法、系统、设备及介质 |
CN110276265A (zh) * | 2019-05-27 | 2019-09-24 | 魏运 | 基于智能三维立体监控设备的行人监测方法及装置 |
CN110188765B (zh) | 2019-06-05 | 2021-04-06 | 京东方科技集团股份有限公司 | 图像语义分割模型生成方法、装置、设备及存储介质 |
CN110288695B (zh) * | 2019-06-13 | 2021-05-28 | 电子科技大学 | 基于深度学习的单帧图像三维模型表面重建方法 |
CN110232418B (zh) * | 2019-06-19 | 2021-12-17 | 达闼机器人有限公司 | 一种语义识别方法、终端及计算机可读存储介质 |
WO2020258297A1 (zh) * | 2019-06-28 | 2020-12-30 | 深圳市大疆创新科技有限公司 | 图像语义分割方法、可移动平台及存储介质 |
CN110276767B (zh) * | 2019-06-28 | 2021-08-31 | Oppo广东移动通信有限公司 | 图像处理方法和装置、电子设备、计算机可读存储介质 |
CN110443205B (zh) * | 2019-08-07 | 2022-09-13 | 北京华捷艾米科技有限公司 | 一种手部图像分割方法及装置 |
CN110675403B (zh) * | 2019-08-30 | 2022-05-03 | 电子科技大学 | 一种基于编码辅助信息的多实例图像分割方法 |
CN110782458B (zh) * | 2019-10-23 | 2022-05-31 | 浙江科技学院 | 一种非对称编码网络的物体图像3d语义预测分割方法 |
US11263756B2 (en) * | 2019-12-09 | 2022-03-01 | Naver Corporation | Method and apparatus for semantic segmentation and depth completion using a convolutional neural network |
CN111292340B (zh) * | 2020-01-23 | 2022-03-08 | 北京市商汤科技开发有限公司 | 语义分割方法、装置、设备及计算机可读存储介质 |
CN111368829B (zh) * | 2020-02-28 | 2023-06-30 | 北京理工大学 | 一种基于rgb-d图像的视觉语义关系检测方法 |
CN111583322A (zh) * | 2020-05-09 | 2020-08-25 | 北京华严互娱科技有限公司 | 一种基于深度学习的2d图像场景深度预测及语义分割方法和系统 |
CN111798456A (zh) * | 2020-05-26 | 2020-10-20 | 苏宁云计算有限公司 | 一种实例分割模型的训练方法、装置、实例分割方法 |
CN111915619A (zh) * | 2020-06-05 | 2020-11-10 | 华南理工大学 | 一种双特征提取与融合的全卷积网络语义分割方法 |
CN112115864B (zh) * | 2020-09-18 | 2022-05-17 | 北京航空航天大学 | 红外图像及深度图像双模态目标分割方法及装置 |
CN112330709A (zh) * | 2020-10-29 | 2021-02-05 | 奥比中光科技集团股份有限公司 | 一种前景图像提取方法、装置、可读存储介质及终端设备 |
CN112270379B (zh) * | 2020-11-13 | 2023-09-19 | 北京百度网讯科技有限公司 | 分类模型的训练方法、样本分类方法、装置和设备 |
CN112819044A (zh) * | 2021-01-20 | 2021-05-18 | 江苏天幕无人机科技有限公司 | 用于目标对象的目标操作任务补偿的神经网络的训练方法 |
CN113139983A (zh) * | 2021-05-17 | 2021-07-20 | 北京华捷艾米科技有限公司 | 一种基于rgbd的人像分割方法及装置 |
CN113743417B (zh) * | 2021-09-03 | 2024-02-23 | 北京航空航天大学 | 语义分割方法和语义分割装置 |
CN113989318B (zh) * | 2021-10-20 | 2023-04-07 | 电子科技大学 | 基于深度学习的单目视觉里程计位姿优化与误差修正方法 |
CN113902765B (zh) * | 2021-12-10 | 2022-04-12 | 聚时科技(江苏)有限公司 | 基于全景分割的半导体自动分区方法 |
CN114758191A (zh) * | 2022-04-15 | 2022-07-15 | 浪潮(北京)电子信息产业有限公司 | 一种图像识别方法、装置及电子设备和存储介质 |
CN115018857B (zh) * | 2022-08-10 | 2022-11-11 | 南昌昂坤半导体设备有限公司 | 图像分割方法、装置、计算机可读存储介质及计算机设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104809187A (zh) * | 2015-04-20 | 2015-07-29 | 南京邮电大学 | 一种基于rgb-d数据的室内场景语义标注方法 |
CN105894502A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 基于超图模型的rgbd图像显著性检测方法 |
WO2016168690A1 (en) * | 2015-04-16 | 2016-10-20 | Cylance Inc. | Recurrent neural networks for malware analysis |
CN106372648A (zh) * | 2016-10-20 | 2017-02-01 | 中国海洋大学 | 基于多特征融合卷积神经网络的浮游生物图像分类方法 |
CN106384353A (zh) * | 2016-09-12 | 2017-02-08 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于rgbd的目标定位方法 |
CN106462771A (zh) * | 2016-08-05 | 2017-02-22 | 深圳大学 | 一种3d图像的显著性检测方法 |
CN106504294A (zh) * | 2016-10-17 | 2017-03-15 | 浙江工业大学 | 基于扩散曲线的rgbd图像矢量化方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9633282B2 (en) * | 2015-07-30 | 2017-04-25 | Xerox Corporation | Cross-trained convolutional neural networks using multimodal images |
-
2017
- 2017-06-15 CN CN201710453788.5A patent/CN107403430B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016168690A1 (en) * | 2015-04-16 | 2016-10-20 | Cylance Inc. | Recurrent neural networks for malware analysis |
CN104809187A (zh) * | 2015-04-20 | 2015-07-29 | 南京邮电大学 | 一种基于rgb-d数据的室内场景语义标注方法 |
CN105894502A (zh) * | 2016-03-30 | 2016-08-24 | 浙江大学 | 基于超图模型的rgbd图像显著性检测方法 |
CN106462771A (zh) * | 2016-08-05 | 2017-02-22 | 深圳大学 | 一种3d图像的显著性检测方法 |
CN106384353A (zh) * | 2016-09-12 | 2017-02-08 | 佛山市南海区广工大数控装备协同创新研究院 | 一种基于rgbd的目标定位方法 |
CN106504294A (zh) * | 2016-10-17 | 2017-03-15 | 浙江工业大学 | 基于扩散曲线的rgbd图像矢量化方法 |
CN106372648A (zh) * | 2016-10-20 | 2017-02-01 | 中国海洋大学 | 基于多特征融合卷积神经网络的浮游生物图像分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107403430A (zh) | 2017-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107403430B (zh) | 一种rgbd图像语义分割方法 | |
US10839543B2 (en) | Systems and methods for depth estimation using convolutional spatial propagation networks | |
CN111190981B (zh) | 一种三维语义地图的构建方法、装置、电子设备及存储介质 | |
EP3510561B1 (en) | Predicting depth from image data using a statistical model | |
US11274922B2 (en) | Method and apparatus for binocular ranging | |
US11763433B2 (en) | Depth image generation method and device | |
Clark et al. | Learning to solve nonlinear least squares for monocular stereo | |
CN106204522B (zh) | 对单个图像的联合深度估计和语义标注 | |
US9042648B2 (en) | Salient object segmentation | |
Zhang et al. | Deep hierarchical guidance and regularization learning for end-to-end depth estimation | |
JP7447932B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
Choudhary et al. | Visibility probability structure from sfm datasets and applications | |
KR20210113443A (ko) | 룸 레이아웃 추정 방법들 및 기술들 | |
Wang et al. | 3d lidar and stereo fusion using stereo matching network with conditional cost volume normalization | |
CN107862702B (zh) | 一种结合边界连通性与局部对比性的显著性检测方法 | |
CN110276768B (zh) | 图像分割方法、图像分割装置、图像分割设备及介质 | |
CN111539983B (zh) | 基于深度图像的运动物体分割方法及系统 | |
CN110728707A (zh) | 基于非对称深度卷积神经网络的多视角深度预测方法 | |
KR102299586B1 (ko) | 드론 촬영 영상의 빅데이터를 활용한 인공지능 기반 건물 시공법 도출 방법, 장치 및 시스템 | |
WO2021249114A1 (zh) | 目标跟踪方法和目标跟踪装置 | |
Guo et al. | Using multi-scale and hierarchical deep convolutional features for 3D semantic classification of TLS point clouds | |
CN113177470B (zh) | 行人轨迹预测方法、装置、设备及存储介质 | |
CN113838135B (zh) | 基于lstm双流卷积神经网络的位姿估计方法、系统及介质 | |
KR102299295B1 (ko) | 드론 촬영 영상의 빅데이터를 활용한 인공지능 기반 건물 유지 보수 견적 산출 방법, 장치 및 시스템 | |
CN114627397A (zh) | 行为识别模型构建方法以及行为识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20171128 Assignee: GUANGDONG TECSUN TECHNOLOGY Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2023980054810 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240102 Application publication date: 20171128 Assignee: Guangzhou Quying Information Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2023980054796 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240102 Application publication date: 20171128 Assignee: SHENDAYUN NETWORK (SHENZHEN) Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2023980054660 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20231229 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20171128 Assignee: Guangzhou Lide Information Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2023980054828 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240104 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20171128 Assignee: Guangzhou Zhanpeng Information Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2024980001988 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240205 Application publication date: 20171128 Assignee: Guangzhou Avanti Electronic Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2024980001987 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240205 Application publication date: 20171128 Assignee: Spectrum Blue Cloud (Guangzhou) Digital Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2024980001990 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240205 Application publication date: 20171128 Assignee: Guangzhou Zhanyi Information Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2024980001989 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240205 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20171128 Assignee: Guangzhou Love Time Information Technology Co.,Ltd. Assignor: SUN YAT-SEN University Contract record no.: X2024980002610 Denomination of invention: A semantic segmentation method for RGBD images Granted publication date: 20200807 License type: Common License Record date: 20240307 |