RU2610283C1 - Способ дешифрации изображений - Google Patents
Способ дешифрации изображений Download PDFInfo
- Publication number
- RU2610283C1 RU2610283C1 RU2015154460A RU2015154460A RU2610283C1 RU 2610283 C1 RU2610283 C1 RU 2610283C1 RU 2015154460 A RU2015154460 A RU 2015154460A RU 2015154460 A RU2015154460 A RU 2015154460A RU 2610283 C1 RU2610283 C1 RU 2610283C1
- Authority
- RU
- Russia
- Prior art keywords
- images
- image
- segmentation
- classifier
- algorithms
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
- G06F18/2111—Selection of the most significant subset of features by using evolutionary computational techniques, e.g. genetic algorithms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2137—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Physiology (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
Изобретение относится к области дешифрации изображений, получаемых от датчиков изображения. Техническим результатом является повышение точности распознавания объектов на изображении. Предложен способ дешифрации изображений, включающий формирование изображений на основе информации, получаемой от датчиков изображения. Согласно способу осуществляют сегментацию изображений на основе использования многомерной нейронной карты Кохонена по пирамидальной схеме, с сегментацией на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшим объединением результатов сегментации. Далее осуществляют классификацию образов на изображении с помощью древовидного классификатора, использующего в качестве простых классификаторов нейронные сети прямого распространения без обратных связей, обучаемые с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети. 1 ил.
Description
Изобретение относится к области дешифрации изображений, получаемых от датчиков изображения, например телевизионных и тепловизионных камер, в режиме реального времени на борту летательных аппаратов гражданского назначения. Изобретение может быть использовано для улучшения точности построения двухмерных и трехмерных карт и моделей местности, в том числе и специализированной системой улучшенного видения на дисплее пилота, используемой для повышения ситуационной осведомленности пилота и принятия им решений по изменению траектории полета летательного аппарата.
Система улучшенного видения EVS - это электронное средство обеспечения летного экипажа изображением внешней обстановки, полученным либо непосредственно от датчиков, либо предварительно обработанным (улучшенным). В качестве датчика изображения может использоваться инфракрасная камера, радиолокатор миллиметрового диапазона и др. Добавление каждого сенсора в систему при комплексировании его информации с другими источниками потенциально приводит к увеличению возможности получить дополнительные эксплуатационные преимущества.
Для решения задач дешифрации изображений, в том числе аэрофотоснимков, полученных от бортовых камер летательного аппарата, бортовые системы улучшенного зрения выполняют ряд действий, среди которых можно выделить:
- формирование изображений;
- сегментация изображений;
- классификация образов на изображении;
- визуализация результатов дешифрации изображений.
Оценка качества работы модулей бортовых систем улучшенного зрения, выполняющих дешифрацию изображений, например аэрофотосъемки, производится путем
- оценки среднего и максимального времени выполнения дешифрации;
- оценки точности дешифрации путем оценки процентного соотношения количества правильно распознанных образов объектов и количества неправильно распознанных образов объектов на изображении;
- оценки диапазона условий применения дешифрации.
Оценка качества работы модулей производится на тестовом наборе изображений, репрезентативно покрывающем множество возможных комбинаций погодных условий, времени съемок, времен года и прочих факторов, влияющих на качество выполнения съемки для конкретного климата, природных условий и тому подобных характеристик местности.
Одним из самых популярных подходов является подход, базирующийся на применении дерева принятия решений для сегментации и распознавания изображений. Дерево принятия решений может быть реализовано аппаратно. Обладая низкими временными затратами на дешифрацию изображений, данный подход имеет низкую точность распознавания 50-60% образов объектов и узкий диапазон условий применения, так как аппаратный модуль, реализующий дерево принятия решений, требует перенастройки под различные погодные условия, различные времена года и т.п. даже для одного изображения.
Другим широко известным подходом является метод, основанный на применении эвристических систем дешифрации изображений, в состав которых входят различные концепции теории искусственного интеллекта и теории машинного обучения. Нередко в состав таких систем включаются искусственные нейронные сети, однако, учитывая общую концепцию данных систем, все вычисления выполняются, как правило, на специализированном вычислительном устройстве, состоящем из центрального процессора и одного или нескольких графических процессоров, с помощью которых достигается распараллеливание вычислений. Данный подход существенно проигрывает по времени выполнения подходам, реализованным полностью аппаратно, однако он лучше подхода, основанного на дереве принятия решений, с точки зрения точности и возможного диапазона дешифрации, поскольку имеет больше возможностей по тонкой настройке.
Известен способ дешифрации изображений, основанный на применении охлаждаемых инфракрасных датчиков, реализованный, в частности, компанией Kollsman Inc. (США) в системах Kollsman All Weather Window - всепогодная система дневного применения и Kollsman Night Window - система ночного применения. К недостаткам данного подхода относятся низкие показатели по точности дешифрации изображений в условиях плохой погоды (тумана, дымки и т.п.) из-за отсутствия в системе датчиков, работающих в видимом диапазоне частот. В отличие от данного подхода заявляемый способ содержит в своем составе датчики, работающие в видимых диапазонах частот.
Наиболее близкими к заявленному техническому решению являются аппаратные комплексы дешифрации изображений, основанные на применении датчиков, работающих в видимом диапазоне, и датчиков, работающих в ближнем инфракрасном диапазоне, реализованные, в частности, компанией CMC Electronics (Канада) в системах СМА-2600 I-Series и СМА-2610 M-Series. К недостаткам данного подхода относят низкие показатели по точности дешифрации изображений из-за применения для дешифрации неинтеллектуальных алгоритмов компьютерного зрения, основанных на простейших операциях обработки изображений, например, таких как пороговая обработка, морфологические операции. В отличие от данного подхода в заявляемом способе дешифрация изображений осуществляется с помощью методов теории искусственного интеллекта, в частности с помощью искусственных нейронных сетей.
Технический результат заявляемого изобретения состоит в улучшении основных эксплуатационных параметров бортовых систем улучшенного видения - качества детектирования объектов на изображении, оцениваемого как процентное соотношение количества правильно распознанных образов объектов и количества неправильно распознанных образов объектов на наборе модельных изображений, репрезентативно покрывающем характерные сцены, анализируемые бортовыми системами улучшенного видения при полетах над средней полосой России, а также в уменьшении времени обработки одного кадра.
Для достижения низких временных показателей, высоких показателей точности и широкой применимости процесса дешифрации в настоящем изобретении используется подход, основанный на применении сегментатора, выполненного по пирамидальной схеме, предполагающей сегментацию различных изображений на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшее объединение результатов сегментации; классификатор состоит из нейронных сетей прямого распространения без обратных связей, обучение которых выполняется с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети; предусмотрено введение дополнительных кеширующих банков памяти, позволяющих эвристически оптимизировать работу за счет кеширования отдельных результатов работы сегментатора и классификатора, позволяющих эвристически оптимизировать работу программно-аппаратного комплекса за счет кеширования отдельных результатов.
Заявляемое изобретение иллюстрируется Фиг. 1.
Фиг. 1. Блок-схема способа дешифрации изображений.
Изобретение осуществляется следующим образом.
Аппаратный комплекс дешифрации изображений состоит из блока «Регистрация изображения», блока «Сегментатор», блока «Классификатор» и блока «Визуализация».
Блок «Регистрация изображения», выполненный по технологии программируемой логической интегральной схемы, получает по шине Ethernet исходные изображения от телевизионной и тепловизионной камер, выполняет их объединение в одно изображение и расширяет цветовой диапазон изображения до 16 бит на спектральный канал, после чего передает результирующее изображение на вход блока «Сегментатор».
Блок «Сегментатор» представляет собой набор модулей, связанных друг с другом шинами передачи данных, выполненных по технологии PCIe. Модуль «Построение дерева изображений» выполняет кратномасштабную обработку изображений (пять уровней), на каждом шаге уменьшая изображение в два раза путем усреднения его элементов. Модули «Простой сегментатор 1», «Простой сегментатор 5» выполняют сегментацию соответствующего уровня дерева изображений с помощью многомерной нейронной карты Кохонена, передавая результат обработки на вход блока «Классификатор».
Блок «Классификатор» выполняет классификацию образов на изображении. Блок содержит несколько модулей, выполненных в виде ПЛИС. Модуль «Очередь» реализует очередь изображений, получаемых от блока «Классификатор». Блок «Дерево классификаторов» управляет деревом классификаторов - передает на вход блока «Простой классификатор» вектор параметров классификатора, зависящий от уровня классификатора в дереве классификаторов, погодных условий съемки, времени года съемки и прочих факторов, а также передает соответствующее изображение. Результат своей работы блок «Простой классификатор» передает обратно блоку «Дерево классификаторов», который выполняет анализ результатов и принимает решение о дальнейшей необходимости классификации или принимает решение о выдаче результатов классификации образов объектов, выделенных на обрабатываемом изображении, на блок «Визуализация».
Блок «Визуализация», выполненный в виде ПЛИС, упорядочивает результаты классификации и передает их по шине Ethernet в систему улучшенного видения.
Отличительные особенности заявляемого изобретения:
- сегментатор выполнен по пирамидальной схеме, предполагающей сегментацию различных изображений на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшее объединение результатов сегментации;
- классификатор состоит из нейронных сетей прямого распространения без обратных связей, обучение которых выполняется с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети;
- введены дополнительные кеширующие банки памяти, позволяющие эвристически оптимизировать осуществление способа за счет кеширования отдельных результатов работы сегментатора и классификатора.
Заявляемое изобретение позволяет достичь точности распознавания образов объектов равной 97,12% от общего количества образов объектов, а также времени обработки кадра размером 2000 на 2000 пикселей, состоящем из пяти спектральных каналов видимого и ближнего инфракрасного диапазонов, в 0,031 секунды, что равно примерно 32-м кадрам в секунду и удовлетворяет требованиям, предъявляемым к бортовой системе улучшенного видения, функционирующей в режиме реального времени.
Claims (4)
- Способ дешифрации изображений, включающий формирование изображений на основе информации, получаемой от датчиков изображения, сегментацию изображений на основе использования многомерной нейронной карты Кохонена, классификацию образов на изображении с помощью древовидного классификатора, использующего в качестве простых классификаторов нейронные сети прямого распространения без обратных связей, визуализацию изображений, в котором алгоритмы регистрации и предобработки изображений, алгоритмы работы сегментатора, алгоритмы обучения и работы классификатора, алгоритмы постобработки изображений реализуются на программируемой логической интегральной схеме, отличающийся тем, что
- сегментация изображений выполняется по пирамидальной схеме, с сегментацией на каждом уровне пирамиды разномасштабных изображений - представлений исходного изображения и дальнейшим объединением результатов сегментации;
- классификация образов предусматривает обучение нейронных сетей прямого распространения без обратных связей с помощью генетического алгоритма с использованием грамматик графовой генерации Китано для кодирования структуры сети;
- при сегментации изображений и классификации образов на изображении используются дополнительные кеширующие банки памяти.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2015154460A RU2610283C1 (ru) | 2015-12-18 | 2015-12-18 | Способ дешифрации изображений |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2015154460A RU2610283C1 (ru) | 2015-12-18 | 2015-12-18 | Способ дешифрации изображений |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2610283C1 true RU2610283C1 (ru) | 2017-02-08 |
Family
ID=58457880
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015154460A RU2610283C1 (ru) | 2015-12-18 | 2015-12-18 | Способ дешифрации изображений |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2610283C1 (ru) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003287A (zh) * | 2018-07-24 | 2018-12-14 | 昆山智易知信息科技有限公司 | 基于改进遗传算法的图像分割方法 |
RU2752246C1 (ru) * | 2020-06-15 | 2021-07-23 | Российская Федерация, от имени которой выступает ФОНД ПЕРСПЕКТИВНЫХ ИССЛЕДОВАНИЙ | Программно-аппаратный комплекс, предназначенный для обработки аэрофотоснимков видимого и дальнего инфракрасного диапазонов с целью обнаружения, локализации и классификации строений вне населенных пунктов |
US20210327047A1 (en) * | 2019-01-11 | 2021-10-21 | Hewlett-Packard Development Company, L.P. | Local defect determinations |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7362892B2 (en) * | 2003-07-02 | 2008-04-22 | Lockheed Martin Corporation | Self-optimizing classifier |
RU2513905C2 (ru) * | 2008-05-14 | 2014-04-20 | Конинклейке Филипс Электроникс Н.В. | Классификация изображения на основе сегментации изображения |
US20150356350A1 (en) * | 2014-06-05 | 2015-12-10 | Mohamad Mustafa Awad | unsupervised non-parametric multi-component image segmentation method |
-
2015
- 2015-12-18 RU RU2015154460A patent/RU2610283C1/ru active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7362892B2 (en) * | 2003-07-02 | 2008-04-22 | Lockheed Martin Corporation | Self-optimizing classifier |
RU2513905C2 (ru) * | 2008-05-14 | 2014-04-20 | Конинклейке Филипс Электроникс Н.В. | Классификация изображения на основе сегментации изображения |
US20150356350A1 (en) * | 2014-06-05 | 2015-12-10 | Mohamad Mustafa Awad | unsupervised non-parametric multi-component image segmentation method |
Non-Patent Citations (1)
Title |
---|
статья K.C. YAO et al. "Unsupervised segmentation using a self-organizing map and a noise model estimation in sonar imagery", опубл. 2000 г., 10 стр. статья П.А. Чочиа "Пирамидальный алгоритм сегментации изображений", опубл. 2010 г., 12 стр. * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109003287A (zh) * | 2018-07-24 | 2018-12-14 | 昆山智易知信息科技有限公司 | 基于改进遗传算法的图像分割方法 |
US20210327047A1 (en) * | 2019-01-11 | 2021-10-21 | Hewlett-Packard Development Company, L.P. | Local defect determinations |
RU2752246C1 (ru) * | 2020-06-15 | 2021-07-23 | Российская Федерация, от имени которой выступает ФОНД ПЕРСПЕКТИВНЫХ ИССЛЕДОВАНИЙ | Программно-аппаратный комплекс, предназначенный для обработки аэрофотоснимков видимого и дальнего инфракрасного диапазонов с целью обнаружения, локализации и классификации строений вне населенных пунктов |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Huang et al. | Single satellite optical imagery dehazing using SAR image prior based on conditional generative adversarial networks | |
US11195038B2 (en) | Device and a method for extracting dynamic information on a scene using a convolutional neural network | |
Leira et al. | Automatic detection, classification and tracking of objects in the ocean surface from UAVs using a thermal camera | |
US10169664B2 (en) | Re-identifying an object in a test image | |
CN102708370B (zh) | 一种多视角图像前景目标提取方法及装置 | |
CN108805906A (zh) | 一种基于深度图的运动障碍物检测及定位方法 | |
CN104933708A (zh) | 一种基于多谱三维特征融合的植被环境中障碍物检测方法 | |
Lore et al. | Generative adversarial networks for depth map estimation from RGB video | |
CN106096604A (zh) | 基于无人平台的多波段融合探测方法 | |
Gwn Lore et al. | Generative adversarial networks for depth map estimation from RGB video | |
US10861172B2 (en) | Sensors and methods for monitoring flying objects | |
RU2610283C1 (ru) | Способ дешифрации изображений | |
CN106709901A (zh) | 基于深度先验的模拟雾图生成方法 | |
CN116343330A (zh) | 一种红外-可见光图像融合的异常行为识别方法 | |
Zsedrovits et al. | Visual detection and implementation aspects of a UAV see and avoid system | |
Dinnbier et al. | Target detection using Gaussian mixture models and fourier transforms for UAV maritime search and rescue | |
CN103870847A (zh) | 一种低照度环境下对地监控的运动目标检测方法 | |
JP7031584B2 (ja) | 領域識別装置と領域識別方法および領域識別プログラム | |
RU168333U1 (ru) | Устройство синтезированного видения | |
CN113392723A (zh) | 基于人工智能的无人机迫降区域筛选方法、装置及设备 | |
Rusyn et al. | Deep learning for atmospheric cloud image segmentation | |
Lin et al. | A multi-target detection framework for multirotor UAV | |
EP2947626B1 (en) | Method and apparatus for generating spanning tree, method and apparatus for stereo matching, method and apparatus for up-sampling, and method and apparatus for generating reference pixel | |
Li et al. | IDP-YOLOV9: Improvement of Object Detection Model in Severe Weather Scenarios from Drone Perspective | |
Pandey et al. | Implementation of 5-block convolutional neural network (cnn) for saliency improvement on flying object detection in videos |