RU2557484C1 - Image segmentation method - Google Patents

Image segmentation method Download PDF

Info

Publication number
RU2557484C1
RU2557484C1 RU2014111855/08A RU2014111855A RU2557484C1 RU 2557484 C1 RU2557484 C1 RU 2557484C1 RU 2014111855/08 A RU2014111855/08 A RU 2014111855/08A RU 2014111855 A RU2014111855 A RU 2014111855A RU 2557484 C1 RU2557484 C1 RU 2557484C1
Authority
RU
Russia
Prior art keywords
image
pixels
numbers
frames
zeroed
Prior art date
Application number
RU2014111855/08A
Other languages
Russian (ru)
Inventor
Андрей Витальевич Богословский
Игорь Сергеевич Маслов
Ирина Викторовна Жигулина
Original Assignee
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тамбовский государственный технический университет" ФГБОУ ВПО ТГТУ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тамбовский государственный технический университет" ФГБОУ ВПО ТГТУ filed Critical Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тамбовский государственный технический университет" ФГБОУ ВПО ТГТУ
Priority to RU2014111855/08A priority Critical patent/RU2557484C1/en
Application granted granted Critical
Publication of RU2557484C1 publication Critical patent/RU2557484C1/en

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

FIELD: physics.
SUBSTANCE: to detect parts of an image containing moving objects, the method includes nulling pixels with the same numbers in both frames consecutively from the edges of the image to the centre; for each nulled pixel, measuring an addition to the interframe difference of frequency characteristics at low phase numbers p; determining the number of the nulled pixels, wherein said addition exceeds a set threshold; based on the values of said numbers of pixels, selecting a segment of the image containing a moving object.
EFFECT: faster segmentation.
5 dwg

Description

Изобретение относится к области сегментации изображения, а более конкретно к выделению областей изображений, содержащих движущиеся объекты.The invention relates to the field of image segmentation, and more particularly to the allocation of image areas containing moving objects.

Известен способ анализа межкадровой разности (К. Фу, Р. Гонсалес, К. Ли. Робототехника / М.: Мир, 1989 г., с.423-426). Он заключается в определении изменений между двумя кадрами изображения, один из которых, имеющий стационарные компоненты, содержит эталонный объект, и последующей пороговой обработке полученной разности, в результате которой выделяются пиксели изображения движущегося объекта. По полученному сегментированному изображению можно определить местонахождение и параметры движения объекта.A known method for the analysis of inter-frame difference (K. Fu, R. Gonzalez, K. Lee. Robotics / M .: Mir, 1989, p. 423-426). It consists in determining the changes between two image frames, one of which having stationary components, contains a reference object, and subsequent threshold processing of the resulting difference, as a result of which the image pixels of a moving object are extracted. Using the received segmented image, you can determine the location and motion parameters of the object.

Недостатками данного способа являются: сложность обнаружения движения объекта и определения параметров его движения в случаях изменения освещенности в пределах границ объекта, высокого уровня шумов, особенно при низкой освещенности, при малых размерах или низком контрасте движущегося объекта.The disadvantages of this method are: the difficulty of detecting the movement of an object and determining the parameters of its movement in cases of changes in illumination within the boundaries of the object, a high noise level, especially at low light, with small size or low contrast of a moving object.

Известен способ определения движения объекта на основе измерения межкадровых разностей частотных характеристик (Богословский А.В., Жигулина И.В., Копылов О.Е., Яковлев В.А. Определение параметров движения объекта по изображению на основе межкадровых разностей частотных характеристик // Радиотехника, 2010, №5). Он заключается в измерении частотных характеристик изображения по строкам и столбцам и дальнейшем определении их разностей. По полученным разностям возможно обнаружение движения объекта. Он предполагает автоматическое определение движения объекта относительно неподвижного фона при хорошем освещении и высоком уровне контраста движущегося объекта (низком уровне шума).There is a method of determining the movement of an object based on measuring interframe differences in frequency characteristics (Bogoslovsky A.V., Zhigulina I.V., Kopylov O.E., Yakovlev V.A. Determining the parameters of movement of an object from an image based on interframe differences in frequency characteristics // Radio Engineering, 2010, No. 5). It consists in measuring the frequency characteristics of the image in rows and columns and further determining their differences. By the differences obtained, it is possible to detect the movement of an object. It involves the automatic determination of the movement of an object relative to a fixed background with good lighting and a high level of contrast of a moving object (low noise).

Недостатком данного способа является низкая вероятность автоматического обнаружения движения объекта в случаях высокого уровня шумов, например при низкой освещенности, малых размерах или низком контрасте движущегося объекта.The disadvantage of this method is the low probability of automatically detecting the movement of the object in cases of high noise, for example, in low light, small size or low contrast of a moving object.

Наиболее близким по технической сущности к заявленному способу является «Способ обнаружения движущихся объектов». Патент RU №2461067, 2011, G06T 7/20. Он заключается в измерении частотных характеристик изображения по строкам и столбцам и дальнейшем определении экстремальных значений двойных разностей частотных характеристик и сравнении их с полученными ранее.Closest to the technical nature of the claimed method is the "Method of detecting moving objects." Patent RU No. 2461067, 2011, G06T 7/20. It consists in measuring the frequency characteristics of the image in rows and columns and further determining the extreme values of the double differences of the frequency characteristics and comparing them with those obtained previously.

Недостатком данного способа является необходимость выполнения большого количества действий, что снижает быстродействие системы в целом.The disadvantage of this method is the need to perform a large number of actions, which reduces the speed of the system as a whole.

Сущность предлагаемого способа заключается в следующем:The essence of the proposed method is as follows:

обнаружение движущихся объектов по видеопоследовательности осуществляется при помощи изменений межкадровых разностей частотных характеристик, возникающих при обнулении одноименных пикселей в двух кадрах видеопоследовательности. Обнуление производится последовательно от краев к центру изображения. Когда обнуленный пиксель попадает на изображение объекта в одном из двух кадров, а в другом - на фон, то величины добавок близки к экстремальным значениям. Это может происходить при значениях номеров p фаз, не превышающих величину перемещения объекта в пикселях между кадрами. Поэтому номера обнуленных пикселей позволяют определить края движущегося объекта, т.е. произвести сегментацию изображения.detection of moving objects by video sequence is carried out by means of changes in the interframe differences in frequency characteristics that occur when the pixels of the same name are zeroed in two frames of the video sequence. Zeroing is performed sequentially from the edges to the center of the image. When a nullified pixel hits the image of an object in one of two frames, and in the other into the background, the values of additives are close to extreme values. This can occur when the values of the numbers of p phases do not exceed the amount of movement of the object in pixels between frames. Therefore, the numbers of zeroed pixels allow you to determine the edges of a moving object, i.e. segment the image.

Техническим результатом предлагаемого способа является повышение быстродействия автоматического обнаружения движущихся объектов и определения параметров их движения за счет учета связности движущего объекта.The technical result of the proposed method is to increase the speed of automatic detection of moving objects and determine the parameters of their motion by taking into account the connectivity of a moving object.

Указанный технический результат достигается тем, что для выделения участков изображения, содержащих движущиеся объекты, производят обнуление пикселей с одинаковыми номерами в обоих кадрах последовательно с краев изображения к центру, для каждого обнуленного пикселя измеряют добавку к межкадровой разности частотных характеристик при малых номерах p фаз, определяют номера обнуленных пикселей, при которых добавка по абсолютной величине превышает установленный порог, по значениям этих номеров пикселей выделяют сегмент изображения, содержащий движущийся объект; после этого процесс сегментирования запускают снова для изображения, которое не содержит выделенную область.The specified technical result is achieved by the fact that, to select portions of the image containing moving objects, the pixels with the same numbers are zeroed in both frames sequentially from the edges of the image to the center, for each zeroed pixel, the addition to the interframe difference of the frequency characteristics at small numbers of p phases is measured, determine numbers of zeroed pixels at which the additive in absolute value exceeds the set threshold, an image segment is allocated according to the values of these pixel numbers, neighing moving object; after that, the segmentation process is started again for an image that does not contain a selected area.

Способ может быть реализован следующей последовательностью действий:The method can be implemented by the following sequence of actions:

- в память записываются два кадра видеопоследовательности, происходит выборка по строкам (столбцам) (см. Андреев А.Л. Автоматизированные телевизионные системы наблюдения. Часть 1 / СПб.: СПбГУИТМО, 2005, с.14-17);- two frames of the video sequence are recorded in memory, and rows (columns) are sampled (see A. Andreev, Automated television surveillance systems. Part 1 / SPb .: SPbGUITMO, 2005, pp. 14-17);

- в строках (столбцах) первого и второго кадров обнуляются пиксели с одинаковыми номерами, обнуление производится последовательно, начиная с краев строк (столбцов) к их центру;- in the rows (columns) of the first and second frames, pixels with the same numbers are zeroed, zeroing is done sequentially, starting from the edges of the rows (columns) to their center;

- для каждого обнуления производится измерение добавки к межкадровым частотным разностям при малых значениях номеров p фаз;- for each zeroing, the additive to the interframe frequency differences is measured at small values of the numbers of p phases;

- значения добавок запоминаются и сравниваются с положительным и отрицательным порогами;- values of additives are remembered and compared with positive and negative thresholds;

- определяются номера обнуленных пикселей, при которых значения добавок по абсолютной величине превышают установленные пороги;- the numbers of zeroed pixels are determined at which the values of additives in absolute value exceed the established thresholds;

- по определенным номерам пикселей сегментируется область изображения, содержащая движущийся объект.- the image area containing the moving object is segmented by certain pixel numbers.

Изобретение поясняется чертежами, где:The invention is illustrated by drawings, where:

Фиг.1 - предлагаемая структурная схема устройства реализации данного способа:Figure 1 - the proposed structural diagram of a device implementing this method:

1 - формирователь видеосигнала;1 - shaper video signal;

2 - блок памяти;2 - memory block;

3 - блок выборки и обнуления;3 - block sampling and zeroing;

4 - блок определения добавок;4 - block definition of additives;

5 - блок анализа;5 - analysis unit;

6 - блок хранения сегментированного изображения.6 - block storage segmented image.

Фиг.2 - видеосигнал одноименных строк тестового изображения двух кадров, содержащих движущийся объект:Figure 2 - video signal of the same name in the test image of two frames containing a moving object:

- строка содержит 101 пиксель;- the line contains 101 pixels;

- весь динамический диапазон составляет 255 ед.;- the entire dynamic range is 255 units .;

- уровень фона a=130 ед.;- background level a = 130 units;

- контраст объекта положительный и составляет b-a=20 ед.;- the contrast of the object is positive and is b-a = 20 units .;

- объект движется вправо и состоит из 20 пикселей;- the object moves to the right and consists of 20 pixels;

- левый край объекта в первом кадре соответствует пикселю с номером l=-36, а левый край объекта во втором кадре l+i=-26;- the left edge of the object in the first frame corresponds to a pixel with the number l = -36, and the left edge of the object in the second frame l + i = -26;

- правый край объекта соответственно r=-17 и r+i=-7.- the right edge of the object, respectively, r = -17 and r + i = -7.

Фиг.3 - вид добавок энергетических межкадровых частотных разностей Δ S o f f j ( p )

Figure 00000001
для фазы p=1 при последовательном обнулении одноименных пикселей обеих строк, штриховой линией показаны пороговые значения.Figure 3 is a view of the additives of energy interframe frequency differences Δ S o f f j ( p )
Figure 00000001
for the phase p = 1, with successive zeroing of the pixels of the same name on both lines, the dashed line shows the threshold values.

Фиг.4 - видеосигналы, соответствующие фиг.2, искаженные аддитивным Гауссовым шумом с нулевым математическим ожиданием и среднеквадратичным отклонением σ=7.Figure 4 - video signals corresponding to figure 2, distorted by additive Gaussian noise with zero mathematical expectation and standard deviation σ = 7.

Фиг.5 - вид добавок энергетических межкадровых частотных разностей Δ S o f f j ( p )

Figure 00000002
для фазы p=1 при видеосигнале, соответствующем фиг.4, штриховой линией показаны пороговые значения.5 is a view of the additives of energy interframe frequency differences Δ S o f f j ( p )
Figure 00000002
for the phase p = 1 for the video signal corresponding to figure 4, the dashed line shows the threshold values.

Осуществление изобретения можно проиллюстрировать на примере обработки двух одноименных строк кадров изображения, содержащих движущийся объект. В качестве модели ситуации на фиг.2 показаны соответствующие видеосигналы. При последовательном обнулении одноименных пикселей обеих строк межкадровые разности частотных характеристик приобретают добавки, вид которых показан на фиг.3 для фазы p=1. График содержит две ярко выраженные области:The implementation of the invention can be illustrated by the example of processing two lines of the same name image frames containing a moving object. As a model of the situation, figure 2 shows the corresponding video signals. When sequentially zeroing the pixels of the same name on both lines, the interframe differences in the frequency characteristics acquire additives, the form of which is shown in Fig. 3 for the phase p = 1. The graph contains two pronounced areas:

- отрицательных добавок, они соответствуют номерам обнуленных пикселей от -37 до -26, т.е. от l-1 до l+i;- negative additives, they correspond to the numbers of zeroed pixels from -37 to -26, i.e. from l-1 to l + i;

- положительных добавок для номеров обнуленных пикселей от -17 до -6, т.е. от r до r+i+1.- positive additives for numbers of zeroed pixels from -17 to -6, i.e. from r to r + i + 1.

Экстремальные значения добавок равны ±2Δ(a+b).The extreme values of additives are ± 2Δ (a + b).

При увеличении номера фазы p до (i-1)/2 области, где добавки не равны нулю, будут расширяться, при этом величина экстремальных значений не меняется. При дальнейшем увеличении p экстремальные величины уменьшаются.As the phase number p increases to (i-1) / 2, the regions where the additives are not equal to zero will expand, while the magnitude of the extreme values does not change. With a further increase in p, the extreme values decrease.

При любых перемещениях и знаках контраста ненулевые добавки будут соответствовать отмеченным номерам обнуленных пикселей.For any movements and signs of contrast, non-zero additives will correspond to the marked numbers of zeroed pixels.

Таким образом, измеряя добавки межкадровых разностей частотных характеристик, можно определять номера пикселей, соответствующие краям движущегося объекта.Thus, by measuring the addition of inter-frame differences in frequency characteristics, it is possible to determine the pixel numbers corresponding to the edges of a moving object.

В реальности фон является неравномерным, может меняться между кадрами, как и видеосигнал, соответствующий движущемуся объекту, кроме того, возможны искажения шумами. Это вынуждает вводить двусторонний порог и выделять только те добавки, которые по абсолютной величине будут превосходить эти пороги.In reality, the background is uneven, it can vary between frames, as well as the video signal corresponding to a moving object, in addition, noise distortions are possible. This forces the introduction of a bilateral threshold and to allocate only those additives that in absolute value will exceed these thresholds.

На фиг.4 показаны видеосигналы, соответствующие фиг.2, искаженные аддитивным гауссовым шумом с нулевым математическим ожиданием и среднеквадратичным отклонением σ=7. На фиг.5 показаны соответствующие добавки. Величина порога выбрана ±2Δa=±0,26·104. Видно, что даже при достаточно большом уровне шума возможно выделить области, соответствующие движущемуся объекту. Величина порога зависит от области применения и может либо устанавливаться заранее, либо определяться путем усреднения сигнала, соответствующего фону, по предварительно сегментированной области. Если сигнал фона соответствует середине динамического диапазона, то можно рекомендовать в качестве пороговой величины выбрать ±(40÷50)a.Figure 4 shows the video signals corresponding to figure 2, distorted by additive Gaussian noise with zero mathematical expectation and standard deviation σ = 7. Figure 5 shows the corresponding additives. The threshold value is selected ± 2Δa = ± 0.26 · 10 4 . It can be seen that even with a sufficiently high noise level, it is possible to distinguish regions corresponding to a moving object. The threshold value depends on the application and can either be set in advance or determined by averaging the signal corresponding to the background over a pre-segmented area. If the background signal corresponds to the middle of the dynamic range, then it is recommended to choose ± (40 ÷ 50) a as a threshold value.

После определения номеров пикселей, соответствующих движущемуся объекту в обоих кадрах, эта область, содержащая движущийся объект, отсекается и процесс сегментации повторяется снова для оставшейся части изображения.After determining the pixel numbers corresponding to the moving object in both frames, this area containing the moving object is cut off and the segmentation process is repeated again for the remaining part of the image.

Claims (1)

Способ сегментации изображения, основанный на формировании видеосигнала изображения, запоминании последовательности двух кадров, принудительном обнулении пикселей изображения, измерении межкадровых частотных разностей, полученных после обнуления кадров, отличающийся тем, что для выделения участков изображения, содержащих движущиеся объекты, производят обнуление пикселей с одинаковыми номерами в обоих кадрах последовательно с краев изображения к центру, для каждого обнуленного пикселя измеряют добавку к межкадровой разности частотных характеристик при малых номерах p фаз, определяют номера обнуленных пикселей, при которых добавка по абсолютной величине превышает установленный порог, по значениям этих номеров пикселей выделяют сегмент изображения, содержащий движущийся объект; после этого процесс сегментирования запускают снова для изображения, которое не содержит выделенную область. The method of image segmentation, based on the formation of the video signal of the image, storing the sequence of two frames, forcing the image pixels to zero, measuring the interframe frequency differences obtained after zeroing the frames, characterized in that to highlight portions of the image containing moving objects, zeroing the pixels with the same numbers in both frames sequentially from the edges of the image to the center, for each zeroed pixel, the additive to the interframe difference is often measured distinct characteristics at small numbers of p phases, the numbers of zeroed pixels are determined at which the additive exceeds the set threshold in absolute value, the image segment containing a moving object is distinguished from the values of these pixel numbers; after that, the segmentation process is started again for an image that does not contain a selected area.
RU2014111855/08A 2014-03-27 2014-03-27 Image segmentation method RU2557484C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2014111855/08A RU2557484C1 (en) 2014-03-27 2014-03-27 Image segmentation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014111855/08A RU2557484C1 (en) 2014-03-27 2014-03-27 Image segmentation method

Publications (1)

Publication Number Publication Date
RU2557484C1 true RU2557484C1 (en) 2015-07-20

Family

ID=53611846

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014111855/08A RU2557484C1 (en) 2014-03-27 2014-03-27 Image segmentation method

Country Status (1)

Country Link
RU (1) RU2557484C1 (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5768412A (en) * 1994-09-19 1998-06-16 Hitachi, Ltd. Region segmentation method for particle images and apparatus thereof
US20020186874A1 (en) * 1994-09-07 2002-12-12 Jeffrey H. Price Method and means for image segmentation in fluorescence scanning cytometry
RU2004121993A (en) * 2001-12-18 2006-01-20 Бурбэй Лимитед (Gb) SEGMENTATION OF IMAGES USING THE WATER DISTRIBUTION METHOD
US7120277B2 (en) * 2001-05-17 2006-10-10 Koninklijke Philips Electronics N.V. Segmentation unit for and method of determining a second segment and image processing apparatus
RU2426172C1 (en) * 2010-01-21 2011-08-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Method and system for isolating foreground object image proceeding from colour and depth data
RU2012133594A (en) * 2012-08-06 2014-02-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Юго-Западный государственный университет" (ЮЗГУ) METHOD FOR SEGMENTATION OF COMPLEX-STRUCTURED RASTER HALF-TONE IMAGES BASED ON COMPOSITE MORPHOLOGICAL OPERATORS

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020186874A1 (en) * 1994-09-07 2002-12-12 Jeffrey H. Price Method and means for image segmentation in fluorescence scanning cytometry
US5768412A (en) * 1994-09-19 1998-06-16 Hitachi, Ltd. Region segmentation method for particle images and apparatus thereof
US7120277B2 (en) * 2001-05-17 2006-10-10 Koninklijke Philips Electronics N.V. Segmentation unit for and method of determining a second segment and image processing apparatus
RU2004121993A (en) * 2001-12-18 2006-01-20 Бурбэй Лимитед (Gb) SEGMENTATION OF IMAGES USING THE WATER DISTRIBUTION METHOD
RU2426172C1 (en) * 2010-01-21 2011-08-10 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Method and system for isolating foreground object image proceeding from colour and depth data
RU2012133594A (en) * 2012-08-06 2014-02-20 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Юго-Западный государственный университет" (ЮЗГУ) METHOD FOR SEGMENTATION OF COMPLEX-STRUCTURED RASTER HALF-TONE IMAGES BASED ON COMPOSITE MORPHOLOGICAL OPERATORS

Similar Documents

Publication Publication Date Title
US10068343B2 (en) Method and apparatus for recognizing moving target
Mustafah et al. Stereo vision images processing for real-time object distance and size measurements
US20200394415A1 (en) Object detection apparatus, prediction model generation apparatus, object detection method, and program
US9972091B2 (en) System and method for detecting object from depth image
US20170330315A1 (en) Information processing apparatus, method for processing information, discriminator generating apparatus, method for generating discriminator, and program
KR101704830B1 (en) Apparatus and method for detecting object in image
KR102085035B1 (en) Method and Apparatus for Setting Candidate Area of Object for Recognizing Object
US10445868B2 (en) Method for detecting a defect on a surface of a tire
US9261585B2 (en) Radar apparatus using image change detector and method of operating the same
EP2966475B1 (en) A method for binning time-of-flight data
EP2993621A1 (en) Method and apparatus for detecting shielding against object
D’Aloia et al. A marker-based image processing method for detecting available parking slots from UAVs
CN109478329A (en) Image processing method and device
CN105513037A (en) Angular point detection method and angular point detection device
RU2557484C1 (en) Image segmentation method
CN106683113B (en) Feature point tracking method and device
KR101696086B1 (en) Method and apparatus for extracting object region from sonar image
Gao et al. A performance comparison of automatic detection schemes in wide-area aerial imagery
US9972095B2 (en) Image measuring apparatus and non-temporary recording medium on which control program of same apparatus is recorded
EP2866171A3 (en) Object detection method and device
WO2016092783A1 (en) Information processing apparatus, method for processing information, discriminator generating apparatus, method for generating discriminator, and program
RU2580466C1 (en) Device for recovery of depth map of scene
CN113508395B (en) Method and device for detecting objects in an image composed of pixels
US9710911B2 (en) System and method for generating a background reference image from a series of images to facilitate moving object identification
Fernandez et al. One-shot absolute pattern for dense reconstruction using DeBruijn coding and windowed Fourier transform

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20160328