RU2116671C1 - Method for processing of object image - Google Patents
Method for processing of object image Download PDFInfo
- Publication number
- RU2116671C1 RU2116671C1 RU95100895A RU95100895A RU2116671C1 RU 2116671 C1 RU2116671 C1 RU 2116671C1 RU 95100895 A RU95100895 A RU 95100895A RU 95100895 A RU95100895 A RU 95100895A RU 2116671 C1 RU2116671 C1 RU 2116671C1
- Authority
- RU
- Russia
- Prior art keywords
- image
- pyramid
- generation
- copies
- level
- Prior art date
Links
Abstract
Description
Изобретение относится к способам обработки визуально информации, в частности к системам преобразований, обеспечивающим извлечение максимально информативных данных о свойствах изображенных объектов или процессов. The invention relates to methods for processing visually information, in particular to transformation systems, providing extraction of the most informative data on the properties of the depicted objects or processes.
Известен способ выделения объекта на изображении и устройство для его осуществления. A known method of selecting an object in the image and a device for its implementation.
Используется анализ изображения на пиксильном уровне при условии априорного задания критериев уровня разной яркости путем уменьшения величин сигналов на первую заданную величину. The analysis of the image at the pixel level is used, provided that the criteria for the level of different brightness are set a priori by reducing the signal values by a first predetermined value.
Известен [3] способ, где также идет анализ изображения на пиксильном уровне, используется медианная фильтрация, применение которой эффективно при априорном знании специфики помех на изображении [4]. The known [3] method, where the image is also analyzed at the pixel level, uses median filtering, the use of which is effective with an a priori knowledge of the specifics of interference in the image [4].
Наиболее близок к предлагаемому способу пиримидальной обработки изображения [1] , в котором реализуется три этапа преобразования информации об изображении:
построение пирамиды изображения, построение "снизу - вверх" последовательных копий исходного изображения; для получения l-й копии (Gl) требуется две операции: свертка копии (Gl-1) с весовой матрицей W, реализующей ФНЧ для пирамиды Гаусса или полосовой фильтр для пирамиды Лапласа, Gl=W+Gl-1; прореживание полученного результата с коэффициентом 2 по каждому уровню пирамиды Gl= [W+Gl-1]↓2. В результате образуется пирамида Гаусса как множество {Gl} или пирамида Лапласа как множество {Ll}, причем Ll=Gl-W+Gl;
построение признаковой пирамиды; изображение каждого уровня пирамиды изображения поддергивается операции свертывания с селективным фильтром F, весовая функция которого настроена на выявление специфического признака в изображении;
обработка изображения и построение пирамиды описания; изображение по каждому уровню признаковой пирамиды проходит необходимую нелинейную обработку, например возведение в квадрат яркостных величин изображения (по каждому уровневому пикселу разрешения) для усиления различия выявляемого признака по отношению к фону; после этого по каждому уровню осуществляют построение " снизу - вверх" пирамиды Гаусса (процедура аналогична первому этапу преобразования изображения).Closest to the proposed method of pyrimidal image processing [1], which implements three stages of converting image information:
building a pyramid of the image, building the "bottom - up" of successive copies of the original image; to obtain the l-th copy (G l ) two operations are required: convolution of the copy (G l-1 ) with the weight matrix W, which implements a low-pass filter for the Gauss pyramid or a band-pass filter for the Laplace pyramid, G l = W + G l-1 ; thinning the result with a coefficient of 2 for each level of the pyramid G l = [W + G l-1 ] ↓ 2. As a result, a Gauss pyramid is formed as the set {G l } or a Laplace pyramid as the set {L l }, moreover, L l = G l -W + G l ;
building a feature pyramid; the image of each level of the image pyramid is supported by a folding operation with a selective filter F, the weight function of which is configured to identify a specific feature in the image;
image processing and construction of a description pyramid; the image for each level of the sign pyramid undergoes the necessary non-linear processing, for example, squaring the brightness values of the image (for each level pixel of resolution) to enhance the difference between the detected sign with respect to the background; after that, a Gauss pyramid is constructed “from bottom to top” for each level (the procedure is similar to the first stage of image conversion).
Данная операция преобразования является необходимой и обеспечивает устранение вероятных помех, возникающих при реализации операции дифференцирования на перовом этапе ( в случае пирамиды Лапласа) и операции усиления - на втором. This conversion operation is necessary and ensures the elimination of possible interference arising from the implementation of the differentiation operation at the first stage (in the case of the Laplace pyramid) and the amplification operation at the second.
В результате формируется пирамида описания изображения, полностью зависящая от применяемого признакового фильтра F. As a result, an image description pyramid is formed that completely depends on the feature filter F.
Недостатком прототипа является то, что способ довольно сложен, а также его недостаточное быстродействие. The disadvantage of the prototype is that the method is quite complicated, as well as its lack of speed.
Особенности преобразования информации по прототипу следующие: построение пирамид снизу вверх; обязательность блоков нелинейной обработки и дополнительной пирамиды Гаусса на выходе; специфичность фильтра F, зависящая от решающей прикладной задачи; отсутствие потенциальной возможности выявления структурных связей между элементами изображения при его описании. Features of the conversion of information on the prototype are as follows: building pyramids from the bottom up; mandatory blocks of nonlinear processing and additional Gauss pyramids at the output; filter specificity F, depending on the crucial application; lack of potential to identify structural relationships between image elements in its description.
Указанные недостатки устраняются предлагаемым решением. These shortcomings are eliminated by the proposed solution.
Задачей изобретения является совершенствование известного способа. The objective of the invention is to improve the known method.
Технический результат - упрощение и ускорение осуществления способа за счет иного построения пирамид, чем в прототипе, и исключения специфических фильтров. The technical result is the simplification and acceleration of the implementation of the method due to the different construction of the pyramids than in the prototype, and the exclusion of specific filters.
Этот технический результат достигается тем, что в способе обработки изображения объекта, включающем построение пирамиды изображения с созданием копий исходного изображения, построение признаковой пирамиды, при построении пирамиды изображения и признаковой пирамиды делят изображение один или более раз, а затем усредняют по яркости как само изображение, так и полученные в результате делений подобласти, получая на множестве копий исходного изображения множество их структурных элементов, между которыми выявляют структурные связи через бинарные отношения. This technical result is achieved in that in a method for processing an image of an object, including constructing an image pyramid with creating copies of the original image, constructing a feature pyramid, when constructing an image pyramid and feature pyramid, divide the image one or more times, and then average the brightness as the image itself, and those obtained as a result of division of the subregion, receiving on the set of copies of the original image many of their structural elements between which structural connections are revealed through inarnye relationship.
Предлагаемый способ заключается в следующем. Реализуют два этапа преобразования информации об изображении. The proposed method is as follows. Two stages of image information conversion are implemented.
Построение пирамиды изображения. Построение "сверху вниз" параллельных копий исходного изображения. Для получения l-й копии изображения (Il) требуется две операции:
деление области изображения I (G) на (22l • 22), равных по площади σl подобластей {G
усреднение по яркости изображения по элементам каждой подобласти
где
μn,m - яркость пиксела исходного изображения с координатами (n,m), принадлежащими подобласти G
dividing the image area I (G) by (2 2l • 2 2 ), equal in area σ l of subdomains {G
averaging over image brightness over the elements of each subregion
Where
μ n, m is the brightness of the pixel of the original image with coordinates (n, m) belonging to the subregion G
Построение признаковой пирамиды, которая одновременно является пирамидой описания изображения. The construction of a feature pyramid, which is also a pyramid of image description.
Построение пирамиды высотой R осуществляют сверху вниз. Для этого требуется три операции:
деление каждой из 22l подобластей {G
усреднение по каждой подобласти G
;
выявление бинарного отношения строгого частичного упорядочения между элементами двух непересекающихся подмножеств , каждое из которых объединяет равное число подобластей G
где
u(•) - вещественнозначная функция на G
▽
где
, и суммирование производится по подобластям, принадлежащим i-му подмножеству .The construction of a pyramid of height R is carried out from top to bottom. This requires three operations:
division of each of the 2 2l subdomains {G
averaging over each subdomain G
;
revealing a binary relation of strict partial ordering between elements of two disjoint subsets , each of which unites an equal number of subdomains G
Where
u (•) is a real-valued function on G
▽
Where
, and the summation is performed over the subdomains belonging to the ith subset .
Первые две операции обеспечивают выявление структурных элементов изображения I уровня l, а последняя - структурных связей между этими элементами. The first two operations provide the identification of structural elements of the image of level I l, and the last - structural relationships between these elements.
В результате формируются уровни описания в виде структур (графов, образов) любого произвольного изображения в условиях отсутствия априорной информации о последнем с использованием универсальной системы однородных признаков {m
Пример осуществления способа. An example implementation of the method.
Пример 1. Построение пирамиды описания (признаковой пирамиды) искаженного символа "□". Example 1. The construction of the description pyramid (feature pyramid) of the distorted symbol "□".
Пусть матрица исходного изображения размера 8х8 имеет вид
1. Строят первый, верхний уровень пирамиды изображения.Let the matrix of the initial image of size 8x8 have the form
1. Build the first, upper level of the image pyramid.
Для этого - делят область изображения на разных по площади подобластей {G
где
Строят признаковую пирамиду для I0. Для этого формируют первый, верхний уровень пирамиды. При k= 0, n= 0, m=0 состоит из одной подобласти G
.To do this, divide the image area into subregions of different sizes {G
Where
Build a sign pyramid for I 0 . To do this, form the first, upper level of the pyramid. For k = 0, n = 0, m = 0 consists of one subdomain G
.
Таким образом, на первом уровне выявляют один структурный элемент m
формируют следующие два уровня признаковой пирамиды:
k=1, n=0, m=1 k=2, n=1, m=0
где
Для выявления структурных связей необходимо знать конкретные значения μij. Пусть μij= 1 по ∀i,j, где μij≠ 0. Тогда
Таким образом, на второй и третьем уровнях выявляют по два структурных элемента, бинарные отношения между которыми соответствуют отношению эквивалентности, т.е. имеем однородное изображение на данных уровнях описания;
формируют следующие уровни описания:
k=3, n=0, m=2 k=4, n=2, m=0
С учетом значений μij получим
Тогда и на уровнях 3 и 4 выявляют отношение строгого порядка - локализация изображения на периферии области изображения на осях x, y и отверстие в центре области изображения. Граф по осям координат имеет вид:
Итак, для описания исходного изображения оказалось достаточным построения одного уровня пирамиды изображения (I0) и 4 уровней признаковой пирамиды. Для выявления более тонкой структуры исходного изображения необходимо перейти к построению следующего уровня пирамиды изображения (I1). Для этого необходимо принять l = 1 и повторить процесс построения, описанный выше.Thus, at the first level, one structural element m
The following two levels of the sign pyramid are formed:
k = 1, n = 0, m = 1 k = 2, n = 1, m = 0
Where
To identify structural relationships, it is necessary to know the specific values of μ ij . Let μ ij = 1 in ∀ i, j , where μ ij ≠ 0. Then
Thus, at the second and third levels, two structural elements are revealed, the binary relations between which correspond to the equivalence relation, i.e. we have a homogeneous image at these levels of description;
form the following levels of description:
k = 3, n = 0, m = 2 k = 4, n = 2, m = 0
Given the values of μ ij we get
Then and at levels 3 and 4, a strict order relation is revealed — localization of the image on the periphery of the image area on the x, y axes and a hole in the center of the image area. The graph along the coordinate axes has the form:
So, to describe the source image, it turned out to be sufficient to build one level of the image pyramid (I 0 ) and 4 levels of the feature pyramid. To identify a finer structure of the original image, it is necessary to proceed to the construction of the next level of the image pyramid (I 1 ). To do this, take l = 1 and repeat the construction process described above.
Пример 2. Обнаружение пятен на поверхности промышленных изделий типа "водяных" знаков, когда контрастность пятна по отношению к окружающему фону ниже 2%. Example 2. Detection of spots on the surface of industrial products such as watermarks, when the contrast of the spot with respect to the surrounding background is below 2%.
Пусть исходное изображение для простоты изложения имеет размер 4 х 4 пиксел. При этом все пикселы имеют однородную яркость, кроме одного, яркость которого на 2% ниже
где а=0,98.Let the original image be 4 x 4 pixels in size for simplicity. Moreover, all pixels have uniform brightness, except for one, whose brightness is 2% lower
where a = 0.98.
Так как I=I0, то строят признаковую пирамиду:
уровень 1: R=n=m=0, , так как m
уровень 2: k=m=1, n=0, , т.е. место нарушения однородности локализовано в левой половине изображения:
уровень 3: k-2, n=1, m=0, , т.е. место нарушения однородности локализовано в нижней половине изображения.Since I = I 0 , then build a sign pyramid:
level 1: R = n = m = 0, , since m
level 2: k = m = 1, n = 0, , i.e. the place of violation of uniformity is localized in the left half of the image:
level 3: k-2, n = 1, m = 0, , i.e. the place of violation of uniformity is localized in the lower half of the image.
Объединяя результаты описания изображения по уровням 2 и 3, (задача анализа), получают место локализации - 3-й квадрант плоскости изображения. Combining the results of the image description by levels 2 and 3, (analysis task), we get the localization place - the 3rd quadrant of the image plane.
Эксперименты показывают, что предлагаемый способ проще в осуществлении и в 10 раз быстрее. Experiments show that the proposed method is easier to implement and 10 times faster.
Основные области использования предлагаемого способы: системы технического зрения; обработка результатов аэрофотосъемки; анализ изображений в системах таможенного контроля; системы анализа и классификации товарных знаков, ярлыков и марок; системы распознавания символов и знаков произвольной конфигурации, например идентификация печатей, подписей, индексов почтовых отправлений и т.п. The main areas of use of the proposed methods: vision systems; processing the results of aerial photography; image analysis in customs control systems; systems for the analysis and classification of trademarks, labels and brands; recognition systems for characters and signs of arbitrary configuration, for example, identification of seals, signatures, postal codes, etc.
Анализ подтверждает, что рассмотренное решение соответствует критериям новизны, изобретательского уровня и промышленной применимости. The analysis confirms that the considered solution meets the criteria of novelty, inventive step and industrial applicability.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU95100895A RU2116671C1 (en) | 1995-01-23 | 1995-01-23 | Method for processing of object image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU95100895A RU2116671C1 (en) | 1995-01-23 | 1995-01-23 | Method for processing of object image |
Publications (2)
Publication Number | Publication Date |
---|---|
RU95100895A RU95100895A (en) | 1996-11-10 |
RU2116671C1 true RU2116671C1 (en) | 1998-07-27 |
Family
ID=20164180
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU95100895A RU2116671C1 (en) | 1995-01-23 | 1995-01-23 | Method for processing of object image |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2116671C1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7834802B2 (en) | 2001-03-16 | 2010-11-16 | Battelle Memorial Institute | Detection of a concealed object |
US7844081B2 (en) | 2006-05-15 | 2010-11-30 | Battelle Memorial Institute | Imaging systems and methods for obtaining and using biometric information |
-
1995
- 1995-01-23 RU RU95100895A patent/RU2116671C1/en active
Non-Patent Citations (2)
Title |
---|
Берт П.Дж. Интеллектуальное восприятие в пирамидальной зрительной машине. - ТИИЭР, 1988, т. 76, N 8, с. 175 - 186. * |
Прэтт У. Цифровая обработка изображений. - М., Мир, 1982, кн. 2, 12.6. * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7834802B2 (en) | 2001-03-16 | 2010-11-16 | Battelle Memorial Institute | Detection of a concealed object |
US7844081B2 (en) | 2006-05-15 | 2010-11-30 | Battelle Memorial Institute | Imaging systems and methods for obtaining and using biometric information |
Also Published As
Publication number | Publication date |
---|---|
RU95100895A (en) | 1996-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0338677B1 (en) | Image processing method for shape recognition | |
Kramer et al. | Iterations of a non-linear transformation for enhancement of digital images | |
CN103456003B (en) | Object tracking device and method and error characteristic point device for eliminating and method | |
Parker et al. | Thresholding using an illumination model | |
KR20120060424A (en) | Matching judgment method of matching target image | |
CN114723724A (en) | Dangerous goods identification method, device, equipment and storage medium based on artificial intelligence | |
RU2116671C1 (en) | Method for processing of object image | |
Mitchell et al. | Image segmentation using a local extrema texture measure | |
CN111784561A (en) | Method, apparatus and storage medium for extracting object from image | |
Wu et al. | Image Edge Detection Based on Sobel with Morphology | |
US7502524B2 (en) | Method and apparatus of processing a skin print image | |
Won et al. | Image pattern recognition in natural environment using morphological feature extraction | |
CN114547437A (en) | Image retrieval method and device | |
Kolesenkov et al. | Automatic scaling method of aerospace images using spectral transformation | |
Deshpande et al. | Use of horizontal and vertical edge processing technique to improve number plate detection | |
Suzuki et al. | Classifying License Plate Numerals Using CNN | |
EP0684577A2 (en) | Binary digital image feature extracting process | |
Konakh et al. | Automating the process of soil maps construction | |
Adinarayana | Edge detector for spectral image using new approach | |
JPH0877355A (en) | Weighed pattern matching method | |
Gottweis | Fully Transparent Computer Vision Framework for Ship Detection and Tracking in Satellite Imagery | |
Zandian et al. | Using Mean Shift for Iranian License Plate Detection | |
Nawaz et al. | An Analysis of Edge Detection Methodologies in Spatial and Morphological Perspective | |
Barsallo | Digital enhancement of degraded fingerprints | |
Qadir et al. | Digital Image Processing: Theory and Applications |