RU2610283C1 - Способ дешифрации изображений - Google Patents

Способ дешифрации изображений Download PDF

Info

Publication number
RU2610283C1
RU2610283C1 RU2015154460A RU2015154460A RU2610283C1 RU 2610283 C1 RU2610283 C1 RU 2610283C1 RU 2015154460 A RU2015154460 A RU 2015154460A RU 2015154460 A RU2015154460 A RU 2015154460A RU 2610283 C1 RU2610283 C1 RU 2610283C1
Authority
RU
Russia
Prior art keywords
images
image
segmentation
classifier
algorithms
Prior art date
Application number
RU2015154460A
Other languages
English (en)
Inventor
Наталья Викторовна Акинина
Илья Сергеевич Солдатенко
Ирина Александровна Семенова
Татьяна Евгеньевна Шишкова
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего образования "Тверской государственный университет"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего образования "Тверской государственный университет" filed Critical Федеральное государственное бюджетное образовательное учреждение высшего образования "Тверской государственный университет"
Priority to RU2015154460A priority Critical patent/RU2610283C1/ru
Application granted granted Critical
Publication of RU2610283C1 publication Critical patent/RU2610283C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2111Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2137Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к области дешифрации изображений, получаемых от датчиков изображения. Техническим результатом является повышение точности распознавания объектов на изображении. Предложен способ дешифрации изображений, включающий формирование изображений на основе информации, получаемой от датчиков изображения. Согласно способу осуществляют сегментацию изображений на основе использования многомерной нейронной карты Кохонена по пирамидальной схеме, с сегментацией на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшим объединением результатов сегментации. Далее осуществляют классификацию образов на изображении с помощью древовидного классификатора, использующего в качестве простых классификаторов нейронные сети прямого распространения без обратных связей, обучаемые с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети. 1 ил.

Description

Изобретение относится к области дешифрации изображений, получаемых от датчиков изображения, например телевизионных и тепловизионных камер, в режиме реального времени на борту летательных аппаратов гражданского назначения. Изобретение может быть использовано для улучшения точности построения двухмерных и трехмерных карт и моделей местности, в том числе и специализированной системой улучшенного видения на дисплее пилота, используемой для повышения ситуационной осведомленности пилота и принятия им решений по изменению траектории полета летательного аппарата.
Система улучшенного видения EVS - это электронное средство обеспечения летного экипажа изображением внешней обстановки, полученным либо непосредственно от датчиков, либо предварительно обработанным (улучшенным). В качестве датчика изображения может использоваться инфракрасная камера, радиолокатор миллиметрового диапазона и др. Добавление каждого сенсора в систему при комплексировании его информации с другими источниками потенциально приводит к увеличению возможности получить дополнительные эксплуатационные преимущества.
Для решения задач дешифрации изображений, в том числе аэрофотоснимков, полученных от бортовых камер летательного аппарата, бортовые системы улучшенного зрения выполняют ряд действий, среди которых можно выделить:
- формирование изображений;
- сегментация изображений;
- классификация образов на изображении;
- визуализация результатов дешифрации изображений.
Оценка качества работы модулей бортовых систем улучшенного зрения, выполняющих дешифрацию изображений, например аэрофотосъемки, производится путем
- оценки среднего и максимального времени выполнения дешифрации;
- оценки точности дешифрации путем оценки процентного соотношения количества правильно распознанных образов объектов и количества неправильно распознанных образов объектов на изображении;
- оценки диапазона условий применения дешифрации.
Оценка качества работы модулей производится на тестовом наборе изображений, репрезентативно покрывающем множество возможных комбинаций погодных условий, времени съемок, времен года и прочих факторов, влияющих на качество выполнения съемки для конкретного климата, природных условий и тому подобных характеристик местности.
Одним из самых популярных подходов является подход, базирующийся на применении дерева принятия решений для сегментации и распознавания изображений. Дерево принятия решений может быть реализовано аппаратно. Обладая низкими временными затратами на дешифрацию изображений, данный подход имеет низкую точность распознавания 50-60% образов объектов и узкий диапазон условий применения, так как аппаратный модуль, реализующий дерево принятия решений, требует перенастройки под различные погодные условия, различные времена года и т.п. даже для одного изображения.
Другим широко известным подходом является метод, основанный на применении эвристических систем дешифрации изображений, в состав которых входят различные концепции теории искусственного интеллекта и теории машинного обучения. Нередко в состав таких систем включаются искусственные нейронные сети, однако, учитывая общую концепцию данных систем, все вычисления выполняются, как правило, на специализированном вычислительном устройстве, состоящем из центрального процессора и одного или нескольких графических процессоров, с помощью которых достигается распараллеливание вычислений. Данный подход существенно проигрывает по времени выполнения подходам, реализованным полностью аппаратно, однако он лучше подхода, основанного на дереве принятия решений, с точки зрения точности и возможного диапазона дешифрации, поскольку имеет больше возможностей по тонкой настройке.
Известен способ дешифрации изображений, основанный на применении охлаждаемых инфракрасных датчиков, реализованный, в частности, компанией Kollsman Inc. (США) в системах Kollsman All Weather Window - всепогодная система дневного применения и Kollsman Night Window - система ночного применения. К недостаткам данного подхода относятся низкие показатели по точности дешифрации изображений в условиях плохой погоды (тумана, дымки и т.п.) из-за отсутствия в системе датчиков, работающих в видимом диапазоне частот. В отличие от данного подхода заявляемый способ содержит в своем составе датчики, работающие в видимых диапазонах частот.
Наиболее близкими к заявленному техническому решению являются аппаратные комплексы дешифрации изображений, основанные на применении датчиков, работающих в видимом диапазоне, и датчиков, работающих в ближнем инфракрасном диапазоне, реализованные, в частности, компанией CMC Electronics (Канада) в системах СМА-2600 I-Series и СМА-2610 M-Series. К недостаткам данного подхода относят низкие показатели по точности дешифрации изображений из-за применения для дешифрации неинтеллектуальных алгоритмов компьютерного зрения, основанных на простейших операциях обработки изображений, например, таких как пороговая обработка, морфологические операции. В отличие от данного подхода в заявляемом способе дешифрация изображений осуществляется с помощью методов теории искусственного интеллекта, в частности с помощью искусственных нейронных сетей.
Технический результат заявляемого изобретения состоит в улучшении основных эксплуатационных параметров бортовых систем улучшенного видения - качества детектирования объектов на изображении, оцениваемого как процентное соотношение количества правильно распознанных образов объектов и количества неправильно распознанных образов объектов на наборе модельных изображений, репрезентативно покрывающем характерные сцены, анализируемые бортовыми системами улучшенного видения при полетах над средней полосой России, а также в уменьшении времени обработки одного кадра.
Для достижения низких временных показателей, высоких показателей точности и широкой применимости процесса дешифрации в настоящем изобретении используется подход, основанный на применении сегментатора, выполненного по пирамидальной схеме, предполагающей сегментацию различных изображений на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшее объединение результатов сегментации; классификатор состоит из нейронных сетей прямого распространения без обратных связей, обучение которых выполняется с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети; предусмотрено введение дополнительных кеширующих банков памяти, позволяющих эвристически оптимизировать работу за счет кеширования отдельных результатов работы сегментатора и классификатора, позволяющих эвристически оптимизировать работу программно-аппаратного комплекса за счет кеширования отдельных результатов.
Заявляемое изобретение иллюстрируется Фиг. 1.
Фиг. 1. Блок-схема способа дешифрации изображений.
Изобретение осуществляется следующим образом.
Аппаратный комплекс дешифрации изображений состоит из блока «Регистрация изображения», блока «Сегментатор», блока «Классификатор» и блока «Визуализация».
Блок «Регистрация изображения», выполненный по технологии программируемой логической интегральной схемы, получает по шине Ethernet исходные изображения от телевизионной и тепловизионной камер, выполняет их объединение в одно изображение и расширяет цветовой диапазон изображения до 16 бит на спектральный канал, после чего передает результирующее изображение на вход блока «Сегментатор».
Блок «Сегментатор» представляет собой набор модулей, связанных друг с другом шинами передачи данных, выполненных по технологии PCIe. Модуль «Построение дерева изображений» выполняет кратномасштабную обработку изображений (пять уровней), на каждом шаге уменьшая изображение в два раза путем усреднения его элементов. Модули «Простой сегментатор 1», «Простой сегментатор 5» выполняют сегментацию соответствующего уровня дерева изображений с помощью многомерной нейронной карты Кохонена, передавая результат обработки на вход блока «Классификатор».
Блок «Классификатор» выполняет классификацию образов на изображении. Блок содержит несколько модулей, выполненных в виде ПЛИС. Модуль «Очередь» реализует очередь изображений, получаемых от блока «Классификатор». Блок «Дерево классификаторов» управляет деревом классификаторов - передает на вход блока «Простой классификатор» вектор параметров классификатора, зависящий от уровня классификатора в дереве классификаторов, погодных условий съемки, времени года съемки и прочих факторов, а также передает соответствующее изображение. Результат своей работы блок «Простой классификатор» передает обратно блоку «Дерево классификаторов», который выполняет анализ результатов и принимает решение о дальнейшей необходимости классификации или принимает решение о выдаче результатов классификации образов объектов, выделенных на обрабатываемом изображении, на блок «Визуализация».
Блок «Визуализация», выполненный в виде ПЛИС, упорядочивает результаты классификации и передает их по шине Ethernet в систему улучшенного видения.
Отличительные особенности заявляемого изобретения:
- сегментатор выполнен по пирамидальной схеме, предполагающей сегментацию различных изображений на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшее объединение результатов сегментации;
- классификатор состоит из нейронных сетей прямого распространения без обратных связей, обучение которых выполняется с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети;
- введены дополнительные кеширующие банки памяти, позволяющие эвристически оптимизировать осуществление способа за счет кеширования отдельных результатов работы сегментатора и классификатора.
Заявляемое изобретение позволяет достичь точности распознавания образов объектов равной 97,12% от общего количества образов объектов, а также времени обработки кадра размером 2000 на 2000 пикселей, состоящем из пяти спектральных каналов видимого и ближнего инфракрасного диапазонов, в 0,031 секунды, что равно примерно 32-м кадрам в секунду и удовлетворяет требованиям, предъявляемым к бортовой системе улучшенного видения, функционирующей в режиме реального времени.

Claims (4)

  1. Способ дешифрации изображений, включающий формирование изображений на основе информации, получаемой от датчиков изображения, сегментацию изображений на основе использования многомерной нейронной карты Кохонена, классификацию образов на изображении с помощью древовидного классификатора, использующего в качестве простых классификаторов нейронные сети прямого распространения без обратных связей, визуализацию изображений, в котором алгоритмы регистрации и предобработки изображений, алгоритмы работы сегментатора, алгоритмы обучения и работы классификатора, алгоритмы постобработки изображений реализуются на программируемой логической интегральной схеме, отличающийся тем, что
  2. сегментация изображений выполняется по пирамидальной схеме, с сегментацией на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшим объединением результатов сегментации;
  3. классификация образов предусматривает обучение нейронных сетей прямого распространения без обратных связей с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети;
  4. при сегментации изображений и классификации образов на изображении используются дополнительные кеширующие банки памяти.
RU2015154460A 2015-12-18 2015-12-18 Способ дешифрации изображений RU2610283C1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2015154460A RU2610283C1 (ru) 2015-12-18 2015-12-18 Способ дешифрации изображений

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2015154460A RU2610283C1 (ru) 2015-12-18 2015-12-18 Способ дешифрации изображений

Publications (1)

Publication Number Publication Date
RU2610283C1 true RU2610283C1 (ru) 2017-02-08

Family

ID=58457880

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2015154460A RU2610283C1 (ru) 2015-12-18 2015-12-18 Способ дешифрации изображений

Country Status (1)

Country Link
RU (1) RU2610283C1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003287A (zh) * 2018-07-24 2018-12-14 昆山智易知信息科技有限公司 基于改进遗传算法的图像分割方法
RU2752246C1 (ru) * 2020-06-15 2021-07-23 Российская Федерация, от имени которой выступает ФОНД ПЕРСПЕКТИВНЫХ ИССЛЕДОВАНИЙ Программно-аппаратный комплекс, предназначенный для обработки аэрофотоснимков видимого и дальнего инфракрасного диапазонов с целью обнаружения, локализации и классификации строений вне населенных пунктов
US20210327047A1 (en) * 2019-01-11 2021-10-21 Hewlett-Packard Development Company, L.P. Local defect determinations

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7362892B2 (en) * 2003-07-02 2008-04-22 Lockheed Martin Corporation Self-optimizing classifier
RU2513905C2 (ru) * 2008-05-14 2014-04-20 Конинклейке Филипс Электроникс Н.В. Классификация изображения на основе сегментации изображения
US20150356350A1 (en) * 2014-06-05 2015-12-10 Mohamad Mustafa Awad unsupervised non-parametric multi-component image segmentation method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7362892B2 (en) * 2003-07-02 2008-04-22 Lockheed Martin Corporation Self-optimizing classifier
RU2513905C2 (ru) * 2008-05-14 2014-04-20 Конинклейке Филипс Электроникс Н.В. Классификация изображения на основе сегментации изображения
US20150356350A1 (en) * 2014-06-05 2015-12-10 Mohamad Mustafa Awad unsupervised non-parametric multi-component image segmentation method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
статья K.C. YAO et al. "Unsupervised segmentation using a self-organizing map and a noise model estimation in sonar imagery", опубл. 2000 г., 10 стр. статья П.А. Чочиа "Пирамидальный алгоритм сегментации изображений", опубл. 2010 г., 12 стр. *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109003287A (zh) * 2018-07-24 2018-12-14 昆山智易知信息科技有限公司 基于改进遗传算法的图像分割方法
US20210327047A1 (en) * 2019-01-11 2021-10-21 Hewlett-Packard Development Company, L.P. Local defect determinations
RU2752246C1 (ru) * 2020-06-15 2021-07-23 Российская Федерация, от имени которой выступает ФОНД ПЕРСПЕКТИВНЫХ ИССЛЕДОВАНИЙ Программно-аппаратный комплекс, предназначенный для обработки аэрофотоснимков видимого и дальнего инфракрасного диапазонов с целью обнаружения, локализации и классификации строений вне населенных пунктов

Similar Documents

Publication Publication Date Title
Huang et al. Single satellite optical imagery dehazing using SAR image prior based on conditional generative adversarial networks
US11195038B2 (en) Device and a method for extracting dynamic information on a scene using a convolutional neural network
Leira et al. Automatic detection, classification and tracking of objects in the ocean surface from UAVs using a thermal camera
US10169664B2 (en) Re-identifying an object in a test image
CN102708370B (zh) 一种多视角图像前景目标提取方法及装置
CN108805906A (zh) 一种基于深度图的运动障碍物检测及定位方法
CN104933708A (zh) 一种基于多谱三维特征融合的植被环境中障碍物检测方法
Lore et al. Generative adversarial networks for depth map estimation from RGB video
CN106096604A (zh) 基于无人平台的多波段融合探测方法
Gwn Lore et al. Generative adversarial networks for depth map estimation from RGB video
US10861172B2 (en) Sensors and methods for monitoring flying objects
RU2610283C1 (ru) Способ дешифрации изображений
CN106709901A (zh) 基于深度先验的模拟雾图生成方法
CN116343330A (zh) 一种红外-可见光图像融合的异常行为识别方法
Zsedrovits et al. Visual detection and implementation aspects of a UAV see and avoid system
Dinnbier et al. Target detection using Gaussian mixture models and fourier transforms for UAV maritime search and rescue
CN103870847A (zh) 一种低照度环境下对地监控的运动目标检测方法
JP7031584B2 (ja) 領域識別装置と領域識別方法および領域識別プログラム
RU168333U1 (ru) Устройство синтезированного видения
CN113392723A (zh) 基于人工智能的无人机迫降区域筛选方法、装置及设备
Rusyn et al. Deep learning for atmospheric cloud image segmentation
Lin et al. A multi-target detection framework for multirotor UAV
EP2947626B1 (en) Method and apparatus for generating spanning tree, method and apparatus for stereo matching, method and apparatus for up-sampling, and method and apparatus for generating reference pixel
Li et al. IDP-YOLOV9: Improvement of Object Detection Model in Severe Weather Scenarios from Drone Perspective
Pandey et al. Implementation of 5-block convolutional neural network (cnn) for saliency improvement on flying object detection in videos