RU2734058C1 - Система сегментации изображений зданий и сооружений - Google Patents

Система сегментации изображений зданий и сооружений Download PDF

Info

Publication number
RU2734058C1
RU2734058C1 RU2019141857A RU2019141857A RU2734058C1 RU 2734058 C1 RU2734058 C1 RU 2734058C1 RU 2019141857 A RU2019141857 A RU 2019141857A RU 2019141857 A RU2019141857 A RU 2019141857A RU 2734058 C1 RU2734058 C1 RU 2734058C1
Authority
RU
Russia
Prior art keywords
images
buildings
structures
image
fragments
Prior art date
Application number
RU2019141857A
Other languages
English (en)
Inventor
Анна Александровна Островская
Владимир Вячеславович Хрящев
Original Assignee
Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы")
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") filed Critical Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы")
Priority to RU2019141857A priority Critical patent/RU2734058C1/ru
Application granted granted Critical
Publication of RU2734058C1 publication Critical patent/RU2734058C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/40Scaling the whole image or part thereof
    • G06T3/4046Scaling the whole image or part thereof using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformation in the plane of the image
    • G06T3/60Rotation of a whole image or part thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction

Abstract

Изобретение относится к вычислительной технике и может быть использовано для сегментации изображений зданий и сооружений. Техническим результатом является повышение быстродействия обработки цифровых данных при снижении количества вычислительных ресурсов. Система содержит компьютерные средства, структурированные на основе свёрточной нейронной сети, в составе блоков кодировщиков для трехканального изображения и изображения инфракрасного канала и блоков декодировщиков, предназначенных для сегментации изображений зданий и сооружений малого, среднего и большого размера, обрабатывают фрагменты четырёхканальных спутниковых снимков, содержащих изображения зданий и сооружений с дополнительным разделением «слипшихся» объектов при помощи предобученной сети DWT и генерацией на этапе обучения алгоритма сегментации восьми фрагментов изображений с помощью всевозможных вариаций поворота исходного фрагмента на угол π/2, π, 3π/2 и зеркального отображения, с применением к каждому новому полученному фрагменту операторов случайного поворота на небольшой угол в пределах [-π/12; π/12], изменения масштаба в пределах [1; 1,2], сдвига в пределах 2% от размера фрагмента и хроматического искажения. В итоге получается спутниковое изображение изначального размера с выделенными на нем зданиями и сооружениями. 5 ил.

Description

Предлагаемое изобретение относится к области средств и технологий дистанционного зондирования Земли, а именно к интеллектуальным космическим системам мониторинга строительных объектов.
Известен способ обработки спутниковых изображений [Blaschke T. et al., «Object-Oriented Image Processing in an Integrated GIS / Remote Sensing Environment and Perspectives for Environmental Applications», EnviroInfo 2000], предусматривающий сегментацию изображений с помощью различных алгоритмов и последующее объединение результатов с данными геоинформационной системы. Известна также система получения и обработки спутниковых изображений, основанная на использовании свёрточной нейронной сети, предложенная в заявке на изобретение CN 10 7 945 146, Univ. Nanjing Information Science & Tech., публикация 2018 г. Система представляет собой нейронную сеть глубокого обучения, получающую изображения от спутников Landsat с аппаратурой дистанционного зондирования Земли Modis и сегментацией изображений, принятых с космического аппарата.
В качестве ближайшего аналога выбрана система сегментации спутниковых изображений, являющаяся составной частью интеллектуальной космической системы мониторинга лесного фонда. Система, основанная на использовании свёрточной нейронной сети, была предложена в патенте на изобретение RU 2 703 349, Российские космические системы, публикация 2019 г. Нейронная сеть глубокого обучения обрабатывает фрагменты изображений, полученных с космических аппаратов дистанционного зондирования Земли типа Ресурс-П. Фрагменты изображений, формируются методом скользящего окна с заданным шагом. На этапе обучения, для расширения обучающей выборки генерируются новые фрагменты изображений.
В нашем изобретении предложено применить технические возможности и особенности алгоритмов глубокого машинного обучения для решения задачи сегментации зданий и сооружений. Система включает в себя свёрточную нейронную сеть, обеспечивающую обработку фрагментов изображений, полученных с космических аппаратов дистанционного зондирования Земли типа Ресурс-П и сформированных методом скользящего окна с заданным шагом. На этапе обучения, для расширения обучающей выборки генерируются новые фрагменты изображений. В отличие от аналога, свёрточная нейронная сеть обрабатывает фрагменты четырехканальных спутниковых снимков, дополнительно разделяя сегментированные «слипшиеся» объекты. При работе системы методом скользящего окна с фиксированным шагом из каждого спутникового изображения выделяется набор фрагментов для сегментации. На этапе обучения, для расширения обучающей выборки к каждому из фрагментов применяются операторы поворота и зеркального отображения, изменения масштаба в пределах [1; 1,2], сдвига в пределах 2% от размера фрагмента, поворота на небольшой угол в пределах [-π/12; π/12] и хроматического искажения. На этапе работы алгоритма фрагменты объединяются для получения изначального, «большого» спутникового снимка с выделенными на нем зданиями и сооружениями.
Предложенная система поясняется следующими изображениями:
фиг. 1 – схема обучения алгоритма сегментации зданий и сооружений;
фиг. 2 – схема работы алгоритма сегментации зданий и сооружений;
фиг. 3 – архитектура свёрточной нейронной сети для сегментации зданий и сооружений;
фиг. 4 – разбиение исходного спутникового снимка на фрагменты фиксированного размера методом скользящего окна;
фиг. 5 – архитектура свёрточной нейронной сети для дополнительного разделения «слипшихся» объектов.
Фрагменты спутниковых изображений зданий и сооружений, полученные с космических аппаратов Ресурс-П поступают на вход свёрточной нейронной сети (фиг. 1, 2). В настоящее время используются четырехканальные спутниковые снимки исследуемой территории. Свёрточная нейронная сеть позволяет быстрее выполнить обработку данных за счет меньшего количества требуемых вычислений. Применение космических аппаратов Ресурс-П позволяет задействовать при мониторинге строительных объектов данные дистанционного зондирования Земли высокого и сверхвысокого разрешения. Архитектуру предложенной свёрточной нейронной сети можно описать как совокупность последовательностей блоков кодировщика и декодировщика (фиг. 3). Кодировщик уменьшает пространственное разрешение фрагмента спутникового снимка, поступившего на вход алгоритму, в то время как декодировщик увеличивает пространственное разрешение, объединяя карту признаков с данными, поступившими из блоков кодировки путем проброса информации.
В конкретном неисключительном примере осуществления данного изобретения свёрточная нейронная сеть (фиг. 3) состоит из двух кодировщиков для трехканального изображения и изображения инфракрасного канала и трёх декодировщиков, предназначенных для сегментации изображений зданий и сооружений малого, среднего и большого размера. Размер каждого здания определялся при формировании обучающей выборки. Путем вычисления значения квадратного корня площади прямоугольника, огибающего здание или сооружение на спутниковом снимке, каждый объект относился к зданиям малого, среднего или большого размера. Таким образом, формировались маски спутниковых снимков, с которыми сравнивались результаты, полученные на выходе алгоритма глубокого машинного обучения. Каждый блок кодировки представляет собой набор из семи операций над картами признаков. Он включает в себя два слоя свёртки, два слоя пакетной нормализации, две функции активации ReLU и функцию понижения дискретизации. Свёрточные слои являются основными элементами нейронных сетей глубокого обучения. На этапе работы этих слоёв с помощью свёрточного фильтра и матричных операций преобразуются данные, поступившие на вход с предыдущего слоя нейронной сети. Результатом такой обработки является набор матриц меньшего размера – множество слоёв преобразованных признаков.
Применена пакетная нормализация – метод, который позволяет стабилизировать работу свёрточных нейронных сетей. Нормализация входного слоя нейронной сети выполняется путём масштабирования признаков таким образом, что перед выполнением следующих операций нейронной сети, данные будут иметь нулевое математическое ожидание и единичную дисперсию. Слой активации ReLU способствует уменьшению значения ошибки сети. Он позволяет избежать проблем затухающего и взрывного градиента. Слой активации ReLU позволяет применить к каждому элементу матрицы, поступившей на вход с предыдущего слоя, функцию вида max(0, x), где x – значение признака. Функция понижения дискретизации представляет собой нелинейное уплотнение карты признаков, поступившей на вход с предыдущего слоя нейронной сети. С помощью нелинейного преобразования, затрагивающего непересекающиеся участки матрицы, группа признаков заменяется одним числовым значением и тем самым пространственный объем признаков уменьшается. Декодировщик содержит такое же количество блоков, как и кодировщик. Блок декодировки представляет собой набор из одиннадцати операций над картами признаков. Каждый такой блок включает в себя функцию повышения дискретизации, операцию объединения данных с признаками соответствующих блоков декодера, три слоя свёртки, три слоя пакетной нормализации и три функции активации ReLU. Функция повышения дискретизации представляет собой расширение карты признаков, поступившей на вход с предыдущего слоя нейронной сети. С помощью нелинейного преобразования, затрагивающего непересекающиеся участки матрицы, каждый признак повторяется и тем самым пространственный объем данных увеличивается.
Для обработки принятых спутниковых снимков методом скользящего окна с заданным шагом формируются фрагменты изображений (фиг. 4), поступающие на вход свёрточной нейронной сети. Предложено использовать окно размером 512×512 пикселей для обеспечения попадания достаточно крупных строительных объектов в один фрагмент. При необходимости, спутниковый снимок по краям дополняется до такого размера, что каждая сторона снимка была кратна 512. Шаг окна в 256 пикселей обеспечивает наложение фрагментов друг на друга таким образом, что край одного фрагмента совпадает с центром смежного с ним. Это позволяет избежать искажений сегментации на краях при восстановлении всего снимка из отдельных фрагментов на этапе внедрения и использования алгоритма.
При обучении сети, из каждого фрагмента спутникового снимка генерируются несколько изображений путем поворота и зеркального отображения исходного фрагмента. Предложено сначала сгенерировать восемь фрагментов изображений с помощью всевозможных вариаций поворота исходного фрагмента на угол π/2, π, 3π/2 и зеркального отображения, а затем к каждому новому полученному фрагменту дополнительно применять операторы случайного поворота на небольшой угол в пределах [-π/12; π/12], изменения масштаба в пределах [1; 1,2], сдвига в пределах 2% от размера фрагмента и хроматического искажения. Это позволяет значительно увеличить обучающую выборку для повышения качества сегментации алгоритма глубокого обучения на этапе обучения. На фазе тестирования свёрточной сети, а также при ее последующем внедрении и использовании генерация новых фрагментов пропускается.
При обучении свёрточной нейронной сети использовалась функция потерь, вычисляемая по формуле L=0,7·BCE+0,3·LH, где BCE – функция кросс-энтропии, а LH – значение коэффициента Ловаса – Хинджа. В качестве алгоритма численной оптимизации при обучении свёрточной нейронной сети был выбран оптимизатор адаптивной оценки моментов Adam со скоростью обучения 1e-4. Эта функция объединяет лучшие подходы от градиентного спуска и импульсных оптимизаторов, показывая быструю сходимость для большинства задач машинного обучения, в частности для задачи сегментации зданий и сооружений. С помощью свёрточного слоя с фильтром 1×1 и последующим применением сигмоидной функции активации для фрагмента изображения получается карта вероятностей того, что каждый пиксель относится к строительным объектам.
Дополнительное разделение «слипшихся» объектов на фрагменте изображения осуществляется с помощью предобученной сети DWT, которая принимала на вход фрагмент спутникового снимка и бинаризованные маски сегментации, объединенные в единый тензор данных. Сеть DWT (фиг. 5) состоит из двух связанных свёрточных нейронных сетей: направляющей и разделяющей. Направляющая сеть представляет собой модифицированную версию известного алгоритма глубокого обучения VGG16. Однако в отличие от VGG16, в направляющей сети третий и четвертый слои понижения дискретизации были изменены: вместо выбора максимального значения в окне на этапе понижения дискретизации, учитывается среднее значение его элементов. Также в прямой сети был удален пятый слой понижения дискретизации, а для сохранения размеров карты признаков используется многоуровневая система агрегирования информации с помощью сверток слоя с фильтром 5×5 и двух свёрток слоёв с фильтром 1×1 после слоёв conv3 и conv4 сети VGG16. В конце направляющей сети, для выходов со слоёв conv3, conv4 и fcn5 выполняются операции повышения дискретизации (Upsample), объединения карты признаков (Concat.), три последовательные свёртки с фильтром 1×1 (слои fuse) и повторное повышение дискретизации. Направляющая сеть позволяет очень точно выделять границы объектов на уровне пикселей.
Разделяющая сеть имеет классическую архитектуру нейронной сети, учитывая при этом высокое пространственное разрешение карты признаков. Она состоит из двух блоков по два свёрточных слоя с фильтром 5×5, после каждого из которых выполняется операция понижения дискретизации, двух свёрточных слоев с фильтром 1×1 и операции повышения дискретизации. С помощью отсечения пикселей по определенному порогу, получается итоговая сегментация фрагмента спутникового изображения. При внедрении и использовании алгоритма фрагменты изображения с помощью нормированной суммы объединяются. В итоге получается спутниковое изображение изначального размера с выделенными на нём зданиями и сооружениями.

Claims (7)

  1. Система сегментации изображений зданий и сооружений, включающая
  2. компьютерные средства, структурированные на основе свёрточной нейронной сети, обеспечивающие обработку фрагментов изображений, полученных с космических аппаратов дистанционного зондирования Земли типа Ресурс-П, сформированных методом скользящего окна с заданным шагом, с генерацией новых фрагментов при помощи поворота исходного фрагмента и зеркального отображения, отличающаяся тем, что
  3. компьютерные средства, структурированные на основе свёрточной нейронной сети, в составе блоков кодировщиков для трехканального изображения и изображения инфракрасного канала и блоков декодировщиков, предназначенных для сегментации изображений зданий и сооружений малого, среднего и большого размера, обрабатывают фрагменты четырёхканальных спутниковых снимков, содержащих изображения зданий и сооружений
  4. с дополнительным разделением «слипшихся» объектов при помощи предобученной сети DWT
  5. и генерацией на этапе обучения алгоритма сегментации восьми фрагментов изображений с помощью всевозможных вариаций поворота исходного фрагмента на угол π/2, π, 3π/2 и зеркального отображения, с
  6. применением
  7. к каждому новому полученному фрагменту операторов случайного поворота на небольшой угол в пределах [-π/12; π/12], изменения масштаба в пределах [1; 1,2], сдвига в пределах 2% от размера фрагмента и хроматического искажения.
RU2019141857A 2019-12-17 2019-12-17 Система сегментации изображений зданий и сооружений RU2734058C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2019141857A RU2734058C1 (ru) 2019-12-17 2019-12-17 Система сегментации изображений зданий и сооружений

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2019141857A RU2734058C1 (ru) 2019-12-17 2019-12-17 Система сегментации изображений зданий и сооружений

Publications (1)

Publication Number Publication Date
RU2734058C1 true RU2734058C1 (ru) 2020-10-12

Family

ID=72940233

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019141857A RU2734058C1 (ru) 2019-12-17 2019-12-17 Система сегментации изображений зданий и сооружений

Country Status (1)

Country Link
RU (1) RU2734058C1 (ru)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107945146A (zh) * 2017-11-23 2018-04-20 南京信息工程大学 一种基于深度卷积神经网络的时空卫星图像融合方法
US20190080456A1 (en) * 2017-09-12 2019-03-14 Shenzhen Keya Medical Technology Corporation Method and system for performing segmentation of image having a sparsely distributed object
CN109886986A (zh) * 2019-01-23 2019-06-14 北京航空航天大学 一种基于多分支卷积神经网络的皮肤镜图像分割方法
RU2694016C1 (ru) * 2015-08-06 2019-07-08 Эксенчер Глобал Сервисез Лимитед Обнаружение состояния объектов с использованием системы обработки изображения, соответствующий способ и постоянный машиночитаемый носитель
CN110264476A (zh) * 2019-06-19 2019-09-20 东北大学 一种多尺度串行的卷积深度学习显微图像分割方法
RU2703349C1 (ru) * 2019-04-16 2019-10-16 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга лесного фонда
RU2707138C1 (ru) * 2018-12-21 2019-11-22 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга зданий и сооружений

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2694016C1 (ru) * 2015-08-06 2019-07-08 Эксенчер Глобал Сервисез Лимитед Обнаружение состояния объектов с использованием системы обработки изображения, соответствующий способ и постоянный машиночитаемый носитель
US20190080456A1 (en) * 2017-09-12 2019-03-14 Shenzhen Keya Medical Technology Corporation Method and system for performing segmentation of image having a sparsely distributed object
CN107945146A (zh) * 2017-11-23 2018-04-20 南京信息工程大学 一种基于深度卷积神经网络的时空卫星图像融合方法
RU2707138C1 (ru) * 2018-12-21 2019-11-22 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга зданий и сооружений
CN109886986A (zh) * 2019-01-23 2019-06-14 北京航空航天大学 一种基于多分支卷积神经网络的皮肤镜图像分割方法
RU2703349C1 (ru) * 2019-04-16 2019-10-16 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга лесного фонда
CN110264476A (zh) * 2019-06-19 2019-09-20 东北大学 一种多尺度串行的卷积深度学习显微图像分割方法

Similar Documents

Publication Publication Date Title
CN111882002B (zh) 一种基于msf-am的低照度目标检测方法
CN113688808B (zh) 一种基于拉普拉斯金字塔遥感图像融合的滑坡体识别方法
CN110348487B (zh) 一种基于深度学习的高光谱图像压缩方法及装置
CN110349087B (zh) 基于适应性卷积的rgb-d图像高质量网格生成方法
CN112419135A (zh) 水印识别在线训练、制样、去除方法及装置、设备、介质
RU2703349C1 (ru) Интеллектуальная космическая система для мониторинга лесного фонда
Gashnikov et al. Hyperspectral remote sensing data compression and protection
CN112258436A (zh) 图像处理模型的训练方法、装置、图像处理方法及模型
CN116797787B (zh) 基于跨模态融合与图神经网络的遥感影像语义分割方法
RU2733823C1 (ru) Система сегментации изображений участков недропользования открытого типа
CN112634120A (zh) 基于cnn预测的图像可逆水印方法
CN111340080A (zh) 一种基于互补卷积特征的高分辨率遥感影像融合方法及系统
CN110992367A (zh) 对带有遮挡区域的图像进行语义分割的方法
RU2707138C1 (ru) Интеллектуальная космическая система для мониторинга зданий и сооружений
CN115190333A (zh) 一种基于云计算的直播视频加密传输方法
RU2734058C1 (ru) Система сегментации изображений зданий и сооружений
CN112598590B (zh) 基于深度学习的光学遥感时间序列影像重建方法及系统
CN112164006B (zh) 一种影像匀色方法、装置、电子设备及存储介质
CN111768326B (zh) 一种基于gan扩增图像前景物体的高容量数据保护方法
CN113096032A (zh) 一种基于图像区域划分的非均匀一致模糊去除方法
CN111274936B (zh) 多光谱图像地物分类方法、系统、介质及终端
CN115187775A (zh) 一种遥感图像语义分割方法及装置
CN111932473B (zh) 一种多分辨率稀疏编码的相位信息降噪算法及存储介质
CN112669234A (zh) 基于神经网络的高分辨率图像复原方法及系统
RU2718419C1 (ru) Интеллектуальная космическая система для мониторинга участков недропользования открытого типа