RU173468U1 - Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей - Google Patents

Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей Download PDF

Info

Publication number
RU173468U1
RU173468U1 RU2017110059U RU2017110059U RU173468U1 RU 173468 U1 RU173468 U1 RU 173468U1 RU 2017110059 U RU2017110059 U RU 2017110059U RU 2017110059 U RU2017110059 U RU 2017110059U RU 173468 U1 RU173468 U1 RU 173468U1
Authority
RU
Russia
Prior art keywords
moving objects
neural network
generalized
images
image
Prior art date
Application number
RU2017110059U
Other languages
English (en)
Inventor
Анатолий Владимирович Хамухин
Original Assignee
Акционерное общество "ЭЛВИС-НеоТек"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Акционерное общество "ЭЛВИС-НеоТек" filed Critical Акционерное общество "ЭЛВИС-НеоТек"
Priority to RU2017110059U priority Critical patent/RU173468U1/ru
Application granted granted Critical
Publication of RU173468U1 publication Critical patent/RU173468U1/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing

Landscapes

  • Image Analysis (AREA)

Abstract

Полезная модель относится к области автоматического анализа изображений. Техническим результатом заявленной полезной модели является создание устройства каскадной обработки потока изображений с помощью сверточной нейронной сети с улучшенной достоверностью автоматического определения движущихся объектов в поле зрения видеокамеры, без увеличения аппаратной вычислительной мощности устройства за счет сочетания быстрого метода определения движущихся объектов и метода нейросетевой обработки. 4 з.п. ф-лы, 2 ил.

Description

Полезная модель относится к области автоматического анализа изображений, а именно к устройствам каскадной обработки потока изображений с помощью сверточных нейронных сетей, и может быть использована в системах видеонаблюдения для автоматического определения значимых событий в поле зрения видеокамеры.
Известны способы автоматического анализа изображений [1], которые позволяют выделять движущиеся объекты в поле зрения видеокамеры и использовать при этом сравнительно малопроизводительные вычислительные устройства. В данных способах, как правило, строят модель неподвижной сцены, сравнивают каждый новый кадр видеопотока с построенной моделью и выделяют различия нового кадра и неподвижной сцены. Как правило, выделяют не только движущиеся объекты, но и шум, обусловленный влиянием множества помех: движением нежестких объектов сцены на ветру, переменной освещенностью сцены вследствие влияния внешних движущихся осветителей и переменной облачности. В большинстве случаев к помехам относят движение животных, птиц, насекомых в непосредственной близости от видеокамер. Таким образом, быстродействующие разностные методы определения движущихся объектов имеют проблему различения помех на изображении.
В последнее время для анализа изображений применяют аппарат сверточных нейронных сетей [2, 3], с помощью которого можно отличить события от помех. Однако достоверные результаты анализа изображений на основе нейронных сетей достижимы только с помощью вычислительных устройств с высокой вычислительной мощностью, и для адаптации нейронных сетей к фильтрации помех требуется огромный набор изображений, на которых нейросеть будет обучаться. Объем таких изображений по порядку величины составляет десятки миллионов отдельных картинок, принадлежащих разным сценам, полученным в разных условиях съемки - климатических, географических, временных.
Методы обработки изображений, которые фиксируют изменения на наблюдаемой сцене, известны достаточно давно, при этом недостатки этих методов тоже хорошо изучены [4]. Несмотря на относительно невысокие требования к вычислительной мощности исполнительных устройств, практически каждый метод определения движения обладает следующим главным недостатком: как правило, фиксирует в том числе и такие изменения на сцене, которые не представляют интереса с точки зрения назначения систем видеонаблюдения. К изменениям-помехам относятся: изменение освещенности вследствие переменной облачности или вследствие включения, выключения, движения искусственных источников света, движение объектов сцены из-за ветра, движение теней объектов, движение животных, птиц и насекомых, изменение сцены вследствие хозяйственной деятельности коммунальных служб (уборка, ремонт) и т.д. Классификация всех возможных помех с помощью простых алгоритмических подходов является затруднительной, поэтому предпочтительным является метод обработки изображений с помощью нейронных сетей, которые выполняют классификацию изображений событий, и в результате определяют, является ли изменение изображения помехой или событием, на которое необходимо обращать внимание.
Анализ уровня техники показывает, что до сих пор аппарат нейронных сетей не применяют в полной мере в охранных системах видеонаблюдения. Этому способствует три фактора.
Во-первых, обработку с помощью нейронных сетей успешно осуществляют для изображений с высоким разрешением, а в охранных системах видеонаблюдения, как правило, требуется фиксировать события на изображениях с низким разрешением, поскольку в охранных системах видеонаблюдения стремятся использовать как можно меньше камер, а для этого выбирают объективы видеокамер с широкими углами зрения. Даже переход на видеокамеры высокого разрешения не снижает требования к способности обработки изображений с невысоким разрешением: увеличение разрешения сенсора видеокамеры приводит к тому, что угол обзора видеокамеры увеличивают для того, чтобы использовать как можно меньшее число камер для зоны наблюдения с той же площадью, и в итоге на изображение событий, которые должна выделять система видеонаблюдения, приходится примерно такое же число точек изображения.
Во-вторых, для обучения нейронных сетей требуется, как отмечалось выше, многомиллионный набор изображений. Большинство современных нейронных сетей настраивают на общедоступных базах изображений (например, базах ImageNet, CIFAR, PASCAL и др.), а в них представлены изображения с высоким разрешением, и не представлены изображения с низким разрешением, поэтому попытка применить современные наработки напрямую не дает хороших результатов по достоверности. При этом процесс сбора видеоданных (набора изображений) из действующих систем видеонаблюдения для настройки нейросетей сопряжен с юридическими и организационными проблемами, что затрудняет получение больших наборов изображений с низким разрешением, необходимый для настройки нейронной сети.
В-третьих, операция по обработке одного изображения с помощью эффективных нейронных сетей составляет несколько терафлопов, поскольку нейросети, обладающие высокой достоверностью по определению событий, являются многоуровневыми и состоят из большого числа нейронов. Количество весов у типичной нейронной сети, предназначенной для определения изображений конкретного типа, составляет несколько десятков миллионов чисел. Из-за высоких требований к вычислительным устройствам применение обработки изображений на основе современных сверточных нейронных сетей пока экономически не оправдано в крупных системах видеонаблюдения с большим количеством видеокамер.
Известно устройство [5] обработки изображений с помощью сверточной нейронной сети,в котором классифицируют объект на изображении с помощью сверточной нейронной сети.
Недостатком устройства прототипа является большая аппаратная вычислительная мощность устройства, требуемая для классификации объекта с помощью только сверточной нейронной сети без использования быстрых методов обработки изображения до этапа обработки сверточной нейронной сетью.
Техническим результатом заявленной полезной модели является создание устройства каскадной обработки потока изображений с помощью сверточной нейронной сети с улучшенной достоверностью автоматического определения движущихся объектов в поле зрения видеокамеры, без увеличения аппаратной вычислительной мощности устройства, за счет применения каскада из быстрого метода определения движущихся объектов и метода нейросетевой обработки.
То есть заявленное устройство является столь же быстродействующими, как известный из уровня техники способ определения движущихся объектов на основе сопоставления с фоновой моделью сцены. При этом в заявленной полезной модели также применяется метод настройки нейросети на данных сравнительно небольшого объема.
Поставленный технический результат выполнен путем создания устройства каскадной обработки потока изображений с помощью сверточной нейронной сети, содержащего блок определения движения, соединенный с блоком нейросетевой фильтрации, который содержит блоки определения обобщенных признаков и блок принятия решения, при этом блок определения движения соединен параллельно со входами блоков определения обобщенных признаков, выходы которых соединены с первым входом блока принятия решения, второй вход которого соединен с выходом блока определения движения, причем
блок определения движения выполнен с возможностью получения на входе потока изображений, с возможностью определения положения фрагментов изображений с движущимися объектами на последовательных кадрах и передачи информации о положении фрагментов изображений с движущимися объектами в блоки определения обобщенных признаков, а также с возможностью определения характеристик движущихся объектов и передачи их в блок принятия решения;
блоки определения обобщенных признаков выполнены с возможностью получения на входе потока изображений и информации о положении фрагментов изображений с движущимися объектами, с возможностью параллельной обработки фрагментов изображений с движущимися объектами на серии последовательных кадров и определения обобщенных признаков движущихся объектов с помощью каскада из сверток и нелинейных преобразований посредством сверточной нейронной сети, а также с возможностью передачи обобщенных признаков в
блок принятия решения, который выполнен с возможностью обработки обобщенных признаков и характеристик движущихся объектов, при этом принятия решения о том, являются движущиеся объекты помехами или действительными объектами.
В предпочтительном варианте осуществления устройства блок определения движения выполнен с возможностью определения характеристик движущихся объектов, таких как текстура и траектория движения.
В предпочтительном варианте осуществления устройства блок принятия решений состоит из последовательности полносвязных слоев.
В предпочтительном варианте осуществления устройства в каждом из параллельных блоков определения обобщенных признаков веса сверток выполнены с возможностью предварительной настройки с помощью большого количества изображений из открытых источников, а затем тонкой настройки на тех изображениях, с которыми предстоит работать в качестве исходных изображений потока.
В предпочтительном варианте осуществления устройства сверточная нейронная сеть адаптирована для изображений низкого разрешения.
Для лучшего понимания заявленной полезной модели далее приводится ее подробное описание с соответствующими графическими материалами.
Фиг. 1.
Элементы:
1 - блок определения движения;
2 - блок нейросетевой фильтрации;
3 - блоки определения обобщенных признаков;
4 - блок принятия решения.
Рассмотрим более подробно функционирование заявленного устройства каскадной обработки потока изображений, представленных на фиг. 1 и 2.
Обработку потока изображений осуществляют два основных блока, блок 1 определения движения и блок 2 нейросетевой фильтрации. Блок 1 определения движения осуществляет первичное определение движущихся объектов с помощью быстрого типа обработки изображений. Дополнительно блок 1 определения движения вычисляет различные характеристики объекта, описывающие его текстуру и траекторию, блок 2 нейросетевой фильтрации функционирует на основе нейросети, имеющей архитектуру. Блок 2 нейросетевой фильтрации состоит из блоков 3 определения обобщенных признаков объектов с помощью каскада из сверток и нелинейных преобразований, и блока 4 принятия решения, состоящего из некоторой последовательности полносвязных слоев. В качестве входа блок 4 принятия решения принимает на вход помимо обобщенных признаков, определенных с помощью каскада сверток, свойства объектов, вычисленных блоком 1 определения движения.
Блоки 3 определения обобщенных признаков соединены параллельно и применяются к изображениям объекта на последовательных кадрах потока изображений. При такой структуре нейросети сначала производят предварительную настройку весов сверток в каждом из параллельных блоков 3 с помощью изображений из открытых источников с большим количеством примеров, а затем производят тонкую настройку на тех изображениях, с которыми предстоит работать в системах видеонаблюдения. Тем самым решается проблема набора большого количества примеров изображений.
За счет того, что нейросеть ориентирована на изображения малого разрешения, количество весов в нейронах в ней может быть существенно меньше, чем в нейросетях, предназначенных для обработки изображений высокого разрешения. Кроме того, нейросеть применяют не для каждого фрагмента изображения, а только для каждого потенциального объекта, который выделят блок 1 определения движения. Отсюда следует, что блок 2 нейросетевой фильтрации функционирует с существенно более низкой частотой, чем частота обработки кадров, и поэтому применение такого блока не повышает существенно уровень требований к вычислительной мощности исполнительных устройств.
Применяемый в заявленной полезной модели каскад из блока 1 определения движения и блока 2 нейросетевой фильтрации позволяет, с одной стороны, существенно сократить время обработки изображений блоком 2 нейросетевой фильтрации, поскольку нейросеть применяется не к каждому фрагменту изображения по методу сканирующего окна с перебором масштаба, а лишь к тем фрагментам, которые выдает блок 1 определения движения, а с другой стороны, существенная доля ошибок нейросетей при классификации изображений компенсируется тем, что на ее вход подают не все множество фрагментов кадра изображения, а только те фрагменты, которые могут потенциально представлять интерес. Применение данного каскада стало возможным благодаря отличительным свойствам архитектуры нейронной сети, представленной на фиг. 2. Во-первых, применение отдельных блоков 3 определения обобщенных признаков к каждому кадру изображения позволяет формировать признаки с учетом особенностей движения объектов: зачастую понять, является ли изображение низкого разрешения помехой, можно только с помощью наблюдения за изображением на последовательных кадрах. Во-вторых, использование отдельных блоков 3 определения обобщенных признаков позволяет производить их предварительную настройку на большом объеме данных из открытых баз данных изображений, и затем производить тонкую настройку нейронной сети на данных ограниченного объема, полученных в процессе реальной эксплуатации видеосистем. В-третьих, поскольку в системах видеонаблюдения требуется обрабатывать в том числе изображения низкого разрешения, используемые в заявленной полезной модели сверточные нейронные сети для формирования обобщенных признаков адаптированы к изображениям малого разрешения, и за счет этого используют меньше вычислительных операций, чем известные нейросети для обработки изображений. В-четвертых, блок 4 принятия решения помимо обобщенных признаков, сформированных блоками 3 сверточных нейронных сетей, использует также характеристики траектории и текстуры объектов, которые предоставлет блок 1 определения движения, что существенно повышает достоверность классификации изображений по категориям «действительный объект» или «помеха».
Как и любая архитектура нейронной сети, заявленная архитектура допускает дополнительную тонкую настройку на конкретных сценах, которые контролируются системами видеонаблюдения, с помощью так называемой процедуры дообучения на новых изображениях, с целью повышения достоверности фильтрации помех.
Быстродействие заявленного устройства достигается за счет каскадирования двух блоков, блока определения движения и блока нейросетевой фильтрации.
Хотя описанный выше вариант выполнения полезной модели был изложен с целью иллюстрации заявленной полезной модели, специалистам ясно, что возможны разные модификации, добавления и замены, не выходящие из объема и смысла заявленной полезной модели, раскрытой в прилагаемой формуле полезной модели.
СПИСОК ЛИТЕРАТУРЫ
1. N. Goyette, Р.-М. Jodoin, F. Porikli, J. Konrad, and P. Ishwar, changedetection.net: A new change detection benchmark dataset, in Proc. IEEE Workshop on Change Detection (CDW-2012) at CVPR-2012, Providence, RI, 16-21 Jun., 2012.
2. Krizhevsky A., Sutskever I., Hinton G.E. Imagenet classification with deep convolutional neural networks // Advances in neural information processing systems. - 2012. - C. 1097-1105.
3. Redmon J. et al. You only look once: Unified, real-time object detection // Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. - 2016. - C. 779-788.
4. Сравнение методов разностного выделения движущихся объектов, http://www.changedetection.net, дата обращения 14.03.2017.
5. US 2016140424 (А1), 19.05.2016, Object-centric Fine-grained Image Classification.

Claims (3)

1. Устройство каскадной обработки потока изображений с помощью сверточной нейронной сети, содержащее блок определения движения, соединенный с блоком нейросетевой фильтрации, который содержит блоки определения обобщенных признаков и блок принятия решения, при этом блок определения движения соединен параллельно со входами блоков определения обобщенных признаков, выходы которых соединены с первым входом блока принятия решения, второй вход которого соединен с выходом блока определения движения, причем блок определения движения выполнен с возможностью получения на входе потока изображений, с возможностью определения положения фрагментов изображений с движущимися объектами на последовательных кадрах и передачи информации о положении фрагментов изображений с движущимися объектами в блоки определения обобщенных признаков, а также с возможностью определения характеристик движущихся объектов и передачи их в блок принятия решения; блоки определения обобщенных признаков выполнены с возможностью получения на входе потока изображений и информации о положении фрагментов изображений с движущимися объектами, с возможностью параллельной обработки фрагментов изображений с движущимися объектами на серии последовательных кадров и определения обобщенных признаков движущихся объектов с помощью каскада из сверток и нелинейных преобразований посредством сверточной нейронной сети, а также с возможностью передачи обобщенных признаков в блок принятия решения, который выполнен с возможностью обработки обобщенных признаков и характеристик движущихся объектов, в том числе текстуры и траектории движения, с возможностью классификации изображений, при этом принятия решения о том, являются движущиеся объекты помехами или действительными объектами.
2. Устройство по п. 1, отличающееся тем, что в каждом из параллельных блоков определения обобщенных признаков веса сверток выполнены с возможностью предварительной настройки с помощью большого количества изображений из баз данных открытых источников, а затем тонкой настройки на тех изображениях, с которыми предстоит работать в качестве исходных изображений потока.
3. Устройство по п. 1, отличающееся тем, что сверточная нейронная сеть адаптирована для изображений низкого разрешения.
RU2017110059U 2017-03-27 2017-03-27 Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей RU173468U1 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2017110059U RU173468U1 (ru) 2017-03-27 2017-03-27 Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2017110059U RU173468U1 (ru) 2017-03-27 2017-03-27 Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей

Publications (1)

Publication Number Publication Date
RU173468U1 true RU173468U1 (ru) 2017-08-29

Family

ID=59798382

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2017110059U RU173468U1 (ru) 2017-03-27 2017-03-27 Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей

Country Status (1)

Country Link
RU (1) RU173468U1 (ru)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2672136C1 (ru) * 2017-11-01 2018-11-12 Акционерное общество "ЭЛВИС-НеоТек" Видеокамера для получения и обработки видеоданных в формате 4k с обзором 360x360 градусов и способ ее функционирования
CN110379108A (zh) * 2019-08-19 2019-10-25 铂纳思(东莞)高新科技投资有限公司 一种无人店防盗监控的方法及其系统
RU2707138C1 (ru) * 2018-12-21 2019-11-22 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга зданий и сооружений

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625707A (en) * 1993-04-29 1997-04-29 Canon Inc. Training a neural network using centroid dithering by randomly displacing a template
RU2424561C2 (ru) * 2005-08-31 2011-07-20 Майкрософт Корпорейшн Обучение сверточных нейронных сетей на графических процессорах
RU2476825C2 (ru) * 2011-03-01 2013-02-27 Государственное образовательное учреждение высшего профессионального образования Томский государственный университет (ТГУ) Способ управления движущимся объектом и устройство для его осуществления
US20160140424A1 (en) * 2014-11-13 2016-05-19 Nec Laboratories America, Inc. Object-centric Fine-grained Image Classification
US20160148079A1 (en) * 2014-11-21 2016-05-26 Adobe Systems Incorporated Object detection using cascaded convolutional neural networks
US20160321523A1 (en) * 2015-04-30 2016-11-03 The Regents Of The University Of California Using machine learning to filter monte carlo noise from images

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625707A (en) * 1993-04-29 1997-04-29 Canon Inc. Training a neural network using centroid dithering by randomly displacing a template
RU2424561C2 (ru) * 2005-08-31 2011-07-20 Майкрософт Корпорейшн Обучение сверточных нейронных сетей на графических процессорах
RU2476825C2 (ru) * 2011-03-01 2013-02-27 Государственное образовательное учреждение высшего профессионального образования Томский государственный университет (ТГУ) Способ управления движущимся объектом и устройство для его осуществления
US20160140424A1 (en) * 2014-11-13 2016-05-19 Nec Laboratories America, Inc. Object-centric Fine-grained Image Classification
US20160148079A1 (en) * 2014-11-21 2016-05-26 Adobe Systems Incorporated Object detection using cascaded convolutional neural networks
US20160321523A1 (en) * 2015-04-30 2016-11-03 The Regents Of The University Of California Using machine learning to filter monte carlo noise from images

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2672136C1 (ru) * 2017-11-01 2018-11-12 Акционерное общество "ЭЛВИС-НеоТек" Видеокамера для получения и обработки видеоданных в формате 4k с обзором 360x360 градусов и способ ее функционирования
RU2707138C1 (ru) * 2018-12-21 2019-11-22 Акционерное общество "Российская корпорация ракетно-космического приборостроения и информационных систем" (АО "Российские космические системы") Интеллектуальная космическая система для мониторинга зданий и сооружений
CN110379108A (zh) * 2019-08-19 2019-10-25 铂纳思(东莞)高新科技投资有限公司 一种无人店防盗监控的方法及其系统

Similar Documents

Publication Publication Date Title
RU2651147C1 (ru) Устройство и способ каскадной обработки потока изображений с помощью свёрточных нейронных сетей
Zhang et al. Deep convolutional neural networks for forest fire detection
EP2956891B1 (en) Segmenting objects in multimedia data
US11227397B2 (en) Block-matching optical flow and stereo vision for dynamic vision sensors
CN105930822A (zh) 一种人脸抓拍方法及系统
Li et al. Foreground object detection in changing background based on color co-occurrence statistics
RU173468U1 (ru) Устройство каскадной обработки потока изображений с помощью свёрточных нейронных сетей
CN109583355B (zh) 一种基于边界选择的人流统计的装置和方法
Wang et al. Blur image classification based on deep learning
CN109948725A (zh) 基于地址-事件表达的神经网络目标检测装置
JP2006163452A (ja) 追跡装置および追跡方法
CN111401169A (zh) 基于监控视频信息的供电营业厅服务人员行为识别方法
Li et al. A method of weather recognition based on outdoor images
Singh et al. Animal localization in camera-trap images with complex backgrounds
CN116402852A (zh) 基于事件相机的动态高速目标追踪方法及装置
Zhang et al. Multi-domain collaborative feature representation for robust visual object tracking
Wang et al. Video SAR ground moving target indication based on multi-target tracking neural network
Kosarevych et al. Detection of pixels corrupted by impulse noise using random point patterns
JP6935850B2 (ja) 情報処理装置、方法、およびプログラム
Raghavendra et al. A novel image fusion scheme for robust multiple face recognition with light-field camera
CN107730535B (zh) 一种可见光红外级联视频跟踪方法
Wu et al. Video crowd counting via dynamic temporal modeling
CN111480180A (zh) 用于检测和跟踪目标的方法
Dash et al. Blur parameter identification using support vector machine
JP7279817B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム

Legal Events

Date Code Title Description
QB9K Licence granted or registered (utility model)

Free format text: LICENCE FORMERLY AGREED ON 20191211

Effective date: 20191211