RU2249251C2 - Automatic recognition of symbols on structural background by combination of models of symbols and background - Google Patents

Automatic recognition of symbols on structural background by combination of models of symbols and background Download PDF

Info

Publication number
RU2249251C2
RU2249251C2 RU2000116357/09A RU2000116357A RU2249251C2 RU 2249251 C2 RU2249251 C2 RU 2249251C2 RU 2000116357/09 A RU2000116357/09 A RU 2000116357/09A RU 2000116357 A RU2000116357 A RU 2000116357A RU 2249251 C2 RU2249251 C2 RU 2249251C2
Authority
RU
Russia
Prior art keywords
background
model
image
symbol
characters
Prior art date
Application number
RU2000116357/09A
Other languages
Russian (ru)
Other versions
RU2000116357A (en
Inventor
Луиджи СТРИНГА (MC)
Луиджи СТРИНГА
Original Assignee
Де ла рю Жиори С.А.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Де ла рю Жиори С.А. filed Critical Де ла рю Жиори С.А.
Priority to RU2000116357/09A priority Critical patent/RU2249251C2/en
Publication of RU2000116357A publication Critical patent/RU2000116357A/en
Application granted granted Critical
Publication of RU2249251C2 publication Critical patent/RU2249251C2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/28Quantising the image, e.g. histogram thresholding for discrimination between background and foreground patterns

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

FIELD: automated recognition of symbols.
SUBSTANCE: method includes following stages: tuning, forming symbols models, recognition, recording background model together with background of read image, separating model of registered background from elementary image of background, combining for each position of symbol of model of letters and/or digits with elementary displaying of appropriate background, forming of combined models, comparison of unknown symbols to combined models, recognition of each unknown symbol as appropriate symbol, combined model of which is combined with it best in accordance to "template comparison" technology.
EFFECT: higher efficiency.
10 cl, 10 dwg

Description

Предшествующий уровень техникиState of the art

Предлагаемое изобретение касается способа автоматического распознавания символов, отпечатанных на любом подходящем для этого материале, даже в том случае, когда фон обладает весьма контрастными структурами, вследствие этого сильно интерферирующими со структурой отпечатанных символов.The present invention relates to a method for automatically recognizing characters printed on any material suitable for this, even when the background has very contrasting structures, which therefore interfere strongly with the structure of the printed characters.

Подавляющее большинство известных систем распознавания символов подходит к решению этой проблемы, пытаясь отделить символы от фона посредством использования системы пороговых значений, часто весьма хитроумной и сложной.The vast majority of known character recognition systems come up with a solution to this problem, trying to separate the characters from the background through the use of a threshold system, often very sophisticated and complex.

К сожалению, такая технология не приводит к успеху в тех случаях, когда контраст структур фона является весьма значительным, особенно если положение символов является переменным по отношению к упомянутым структурам. Как следствие, изображения символов в ряде случаев содержат часть знаков фона (тех, которые превышают уровень соответствующего порогового значения) или иногда эти изображения не являются полными, поскольку часть структуры символов не превышает соответствующего порогового значения.Unfortunately, this technology does not lead to success in cases where the contrast of the background structures is very significant, especially if the position of the characters is variable with respect to the mentioned structures. As a result, symbol images in some cases contain some background characters (those that exceed the level of the corresponding threshold value) or sometimes these images are not complete, because part of the symbol structure does not exceed the corresponding threshold value.

Это, в частности, относится к случаю контроля банковских билетов, на которых печать номеров серии осуществляется в процессе фазы, отдельной (обычно последующей) от фазы печати остального изображения, и обычно с использованием другого печатного оборудования. Таким образом, регистрация не может быть вполне совершенной и, следовательно, номера серии "шевелятся" по отношению к фону.This, in particular, refers to the case of control of bank tickets, in which the printing of series numbers is carried out during a phase separate (usually subsequent) from the printing phase of the rest of the image, and usually using other printing equipment. Thus, the registration cannot be completely perfect and, therefore, the series numbers “move” in relation to the background.

Это означает, что если эти номера отпечатаны на структурированной зоне данного банковского билета, то есть на зоне, содержащей какой-либо рисунок, то они "шевелятся" или могут быть смещены произвольным образом по отношению к структуре (к рисунку) фона. В дополнение к сказанному выше в упомянутых случаях даже поиск и сегментация символов могут не привести к успеху по причине наличия специфических структур фона.This means that if these numbers are printed on the structured area of a given bank ticket, that is, on the area containing any pattern, then they “move” or can be shifted arbitrarily in relation to the structure (pattern) of the background. In addition to the above, in the above cases, even the search and segmentation of characters may not lead to success due to the presence of specific background structures.

Действительно, даже с учетом огромного количества вариаций процесс выделения и распознавания символов практически всегда проходит через следующие этапы, при которых осуществляютIndeed, even taking into account the huge number of variations, the process of distinguishing and recognizing characters almost always goes through the following steps, in which

- считывание изображений документа и, особенно, объекта, содержащего подлежащие распознаванию символы. Считывание этих изображений обеспечивается посредством электронной камеры, после чего эти изображения обычно подвергаются обработке с целью повышения контраста и снижения помех;- reading images of a document and, especially, an object containing symbols to be recognized. The reading of these images is provided through an electronic camera, after which these images are usually processed in order to increase contrast and reduce interference;

- поиск на изображении (теперь уже электронном) положения символов, подлежащих распознаванию. Этот поиск часто основывается на анализе резких изменений освещенности (типа перехода от белого к черному) и, в частности, пространственного распределения этих переходов;- search on the image (now electronic) of the position of the characters to be recognized. This search is often based on an analysis of sharp changes in illumination (such as the transition from white to black) and, in particular, the spatial distribution of these transitions;

- сегментацию идентифицированной зоны на участки, каждый из которых содержит только один символ. Эта сегментация осуществляется, например, путем анализа проекции плотности черного на сегмент, параллельный основанию линии символов: минимальные значения этой плотности поддаются корреляции с белым пространством между символами;- segmentation of the identified zone into sections, each of which contains only one symbol. This segmentation is carried out, for example, by analyzing the projection of the black density onto a segment parallel to the base of the symbol line: the minimum values of this density can be correlated with the white space between the symbols;

- каждый изолированный таким образом символ сопоставляют с прототипами (моделями) всех букв и/или всех цифр, либо с точки зрения степени их совпадения (технологии, известные под английским названием "template matching"), либо с точки зрения последовательности характерных структур, таких, например, как вертикальные линии, горизонтальные линии, наклонные линии и т.п. (технологии, известные под названием "features extraction" или структурный анализ).- each symbol isolated in this way is compared with the prototypes (models) of all letters and / or all numbers, either in terms of the degree of their coincidence (technologies known under the English name "template matching"), or in terms of the sequence of characteristic structures, such for example, like vertical lines, horizontal lines, oblique lines, etc. (technologies known as "features extraction" or structural analysis).

В любом случае очевидно, что если часть изображения, сегментированная как символ, содержит структуры, посторонние по отношению к форме самого этого символа (например, линии, принадлежащие структуре фона), опасность несостоятельности или неудачи сравнения с упомянутыми прототипами оказывается весьма высокой. Эта опасность также может быть обусловлена потерей отличительных частей структуры данного символа с последующим резким пороговым переходом в фазе отделения этого символа от фона.In any case, it is obvious that if the part of the image segmented as a symbol contains structures that are extraneous to the shape of this symbol itself (for example, lines belonging to the background structure), the risk of insolvency or failure of comparison with the mentioned prototypes is very high. This danger can also be caused by the loss of the distinctive parts of the structure of this symbol, followed by a sharp threshold transition in the phase of separation of this symbol from the background.

Именно поэтому предшествующие подходы к решению проблемы автоматического распознавания символов, отпечатанных на сильно структурированных фонах, обладающих высокой контрастностью, не являются вполне удовлетворительными.That is why the previous approaches to solving the problem of automatic recognition of characters printed on highly structured backgrounds with high contrast are not quite satisfactory.

Краткое описание изобретенияSUMMARY OF THE INVENTION

В соответствии с предлагаемым изобретением объекты, на которых печатаются подлежащие распознаванию символы, подвергаются оптическому анализу при помощи хорошо известных оптоэлектронных средств, таких, например, как камера типа CCD (линейная или матричная, черно-белая или цветная) с желаемой разрешающей способностью, для формирования электронных изображений символов, подлежащих распознаванию.In accordance with the invention, objects on which the characters to be recognized are printed are subjected to optical analysis using well-known optoelectronic means, such as, for example, a CCD-type camera (linear or matrix, black and white or color) with the desired resolution to form electronic images of characters to be recognized.

В последующем изложении будет использован термин "изображение" в смысле электронного изображения, в частности, дискретной системы величин световой насыщенности, обычно организованной в виде прямоугольной матрицы. Каждый элемент этой матрицы или так называемый пиксель представляет собой меру интенсивности света, отраженного соответствующей частью объекта. Для цветных изображений их общее описание состоит из трех матриц, соответствующих составляющим красного, зеленого и синего цветов для каждого элемента изображения или пикселя. Для упрощения изложения последующее описание касается случая черно-белого изображения. При этом расширение для цветного изображения осуществляется путем повторения тех же самых операций для трех матриц.In the following presentation, the term "image" will be used in the sense of an electronic image, in particular, a discrete system of values of light saturation, usually organized in the form of a rectangular matrix. Each element of this matrix, or the so-called pixel, is a measure of the intensity of light reflected by the corresponding part of the object. For color images, their general description consists of three matrices corresponding to the components of red, green, and blue for each image element or pixel. To simplify the presentation, the following description relates to the case of a black and white image. In this case, the extension for the color image is carried out by repeating the same operations for the three matrices.

В основу предлагаемого изобретения положена задача реализации автоматического распознавания на электронных изображениях символов, отпечатанных на сильно структурированном фоне, контрастность которого даже может быть сопоставима с контрастностью структур самих этих символов (как это показано на примере, проиллюстрированном на фиг.I/4c).The basis of the present invention is the task of implementing automatic recognition on electronic images of characters printed on a highly structured background, the contrast of which can even be comparable with the contrast of the structures of these symbols themselves (as shown in the example illustrated in Fig. I / 4c).

Первый шаг способа в соответствии с предлагаемым изобретением состоит в формировании модели фона, которая может быть получена путем считывания изображений одного или нескольких образцов, на которых представлен только рисунок фона без всяких символов (как это показано на примере, проиллюстрированном на фиг.I/4б).The first step of the method in accordance with the invention consists in forming a background model, which can be obtained by reading images of one or more samples, which shows only the background image without any symbols (as shown in the example illustrated in Fig. I / 4b) .

В качестве такой модели можно использовать, в частности, среднее арифметическое изображение упомянутых образцов. При этом в случае черно-белых изображений будет получена одна единственная матрица этих усредненных изображений, тогда как в случае цветных изображений этих матриц усредненных изображений будет три, например, матрицы красного, зеленого и синего цветов.As such a model, it is possible to use, in particular, the arithmetic mean of the aforementioned samples. Moreover, in the case of black-and-white images, one single matrix of these averaged images will be obtained, while in the case of color images of these matrixes of averaged images there will be three, for example, matrices of red, green and blue.

Затем формируют модели подлежащих распознаванию символов (например, букв и/или цифр), либо путем считывания изображений системы этих символов, отпечатанных на белом фоне, либо путем непосредственного использования электронных изображений из информационных компьютерных файлов, которые в настоящее время имеют коммерческое распространение для большинства шрифтов. В первом случае можно сформировать модель каждого подлежащего распознаванию символа в виде усредненного изображения из некоторого числа экземпляров одного и того же символа, отпечатанного на белом фоне.Then, models of the characters to be recognized (for example, letters and / or numbers) are formed, either by reading images of the system of these characters printed on a white background, or by directly using electronic images from computer information files that are currently commercially available for most fonts . In the first case, it is possible to form a model of each symbol to be recognized in the form of an averaged image from a number of copies of the same symbol printed on a white background.

После того, как сформированы модели всех символов и модель фона, первая фаза данного способа, которую можно назвать "фазой отладки", завершается.After the models of all the characters and the background model are formed, the first phase of this method, which can be called the "debug phase", is completed.

В процессе осуществления последующей фазы распознавания символов выполняются действия в соответствии со следующими этапами:During the subsequent phase of character recognition, actions are performed in accordance with the following steps:

- осуществляют считывание изображения подлежащего распознаванию образца, содержащего неизвестные символы, отпечатанные на определенном фоне в положениях, которые также являются неизвестными (пример проиллюстрирован на фиг.II/4-а);- carry out the reading of the image subject to recognition of the sample containing unknown characters printed on a specific background in positions that are also unknown (an example is illustrated in Fig. II / 4-a);

- регистрация модели фона вместе со считанным изображением при помощи любой из известных технологий регистрации изображений, например, с использованием метода максимальной корреляции;- registration of the background model together with the read image using any of the known image registration technologies, for example, using the maximum correlation method;

- вычитание зарегистрированной модели фона из считанного изображения. Полученное таким образом разностное изображение, где фон будет практически полностью устранен, очень четко выявляет положение символов (пример разностного изображения, которое представляет собой считанное изображение минус зарегистрированная модель фона, показан на фиг.II/4-б);- subtraction of the registered background model from the read image. The differential image obtained in this way, where the background will be almost completely eliminated, very clearly reveals the position of the characters (an example of the differential image, which is a read image minus the registered background model, is shown in Fig. II / 4-b);

- поиск положения каждого из символов на разностном изображении. Эта операция осуществляется при помощи любой из известных технологий локализации и сегментации символов, например, путем анализа резких переходов насыщенности типа перехода от черного к белому. Таким образом, для каждого положения символа будет выделено элементарное изображение, размеры которого совпадают с размерами моделей символов (на фиг.III/4б показаны примеры элементарных изображений сегментированных символов);- search for the position of each of the symbols in the difference image. This operation is carried out using any of the known technologies for character localization and segmentation, for example, by analyzing sharp transitions of saturation such as the transition from black to white. Thus, for each position of the symbol, an elementary image will be selected, the sizes of which coincide with the sizes of the models of symbols (Figs. III / 4b show examples of elementary images of segmented symbols);

- выделение зарегистрированной модели фона из элементарного изображения фона, соответствующего каждому неизвестному символу;- selection of the registered background model from the elementary image of the background corresponding to each unknown symbol;

- комбинирование, для каждого из положений символов, моделей символов с соответствующим элементарным изображением модели фона (см. фиг.III/4-c). Поскольку модель фона была зарегистрирована вместе с фоном изображения, содержащего подлежащие распознаванию символы, в элементарных изображениях, сочетающих модель фона с моделью цифр и/или букв, относительное положение символ-фон оказывается тем же самым, что и в неизвестном изображении. Таким образом, в синтезе для каждого положения символа будут созданы новые прототипы (комбинированные модели) символов (букв и/или цифр) с тем же самым фоном, что и в неизвестном изображении. Одна из разработанных технологий комбинирования будет описана в разделе "Описание нескольких предпочтительных вариантов". Однако здесь может быть использован и любой из методов, предложенных другими авторами;- a combination, for each of the positions of the characters, character patterns with the corresponding elementary image of the background model (see Fig. III / 4-c). Since the background model was registered together with the background of the image containing the characters to be recognized, in elementary images combining the background model with the model of numbers and / or letters, the relative position of the symbol-background is the same as in the unknown image. Thus, in the synthesis for each position of the symbol new prototypes (combined models) of symbols (letters and / or numbers) will be created with the same background as in the unknown image. One of the combination technologies developed will be described in the “Description of Several Preferred Options” section. However, any of the methods proposed by other authors can be used here;

- сопоставление каждого из неизвестных символов со всеми моделями, комбинированными на предыдущих этапах. Распознавание символа с фоном осуществляется, таким образом, путем сопоставления с моделями символов с тем же самым фоном и в том же самом положении. Здесь можно использовать любые известные технологии распознавания, например, метод "template-matching" или "features extraction" и т.д.- Comparison of each of the unknown characters with all the models combined in the previous steps. Recognition of a character with a background is thus accomplished by matching patterns of characters with the same background and in the same position. Here you can use any known recognition technologies, for example, the "template-matching" or "features extraction" method, etc.

Краткое описание чертежейBrief Description of the Drawings

На фиг.I/4 представлен пример последовательности символов, отпечатанных на сильно структурированном и обладающих высокой контрастностью фона, причем на виде а) показана последовательность символов, отпечатанных на белом фоне, на виде б) показан рисунок собственного фона и на виде с) показана последовательность символов а), отпечатанная на фоне б).Fig. I / 4 shows an example of a sequence of characters printed on a highly structured and having a high contrast of the background, and a) shows a sequence of characters printed on a white background, in view b) shows a picture of its own background and in view c) shows the sequence characters a), printed on background b).

На фиг.II/4 вид а) полностью соответствует виду с), показанному на фиг.I/4, тогда как вид б) демонстрирует результат вычитания модели зарегистрированного фона из изображения полностью отпечатанного билета.In Fig. II / 4, view a) fully corresponds to view c) shown in Fig. I / 4, while view b) shows the result of subtracting the registered background model from the image of the fully printed ticket.

На фиг.III/4 вид а) демонстрирует участок билета из примера, показанного на предыдущих фигурах, содержащий подлежащие распознаванию символы, и вид б) демонстрирует элементарные изображения, соответствующие каждой позиции символа, в качестве результата сегментации. Вид с) показывает, для каждого положения символа, комбинацию, соответствующую элементарным изображениям зарегистрированного фона с моделями всех возможных символов, то есть комбинированные модели, описанные в тексте. Этот пример наглядно показывает, что подлежащие обработке символы (б) могут быть более эффективно распознаны, если сравнивать с комбинированными моделями (с), чем с моделями символов, отпечатанных на белом фоне (показаны, например, на фиг.III/4-d).In Fig. III / 4, view a) shows the portion of the ticket from the example shown in the previous figures containing the characters to be recognized, and view b) shows the elementary images corresponding to each position of the character as a result of segmentation. View c) shows, for each position of the symbol, a combination corresponding to elementary images of the registered background with models of all possible symbols, that is, combined models described in the text. This example clearly shows that the characters (b) to be processed can be more effectively recognized when compared with combined models (c) than with models of characters printed on a white background (shown, for example, in FIG. III / 4-d) .

На фиг.IV/4 показана типичная схема построения системы распознавания, описанной в тексте.On IV / 4 shows a typical diagram of the construction of the recognition system described in the text.

Описание предпочтительных вариантов осуществления изобретенияDescription of preferred embodiments of the invention

В последующем изложении будет описан в качестве не являющегося ограничительным примера реализации предлагаемого изобретения один из предпочтительных ее вариантов, касающийся автоматического распознавания номеров серий, отпечатанных на банковских билетах.In the following presentation, one of its preferred variants regarding automatic recognition of series numbers printed on bank notes will be described as a non-limiting example of the implementation of the invention.

Действительно, в большинстве типов банковских билетов номер серии частично или полностью печатается прямо на рисунке фона этого билета. Печатание банковских билетов осуществляется, в частности, с использованием смешения различных технологий, обычно, по меньшей мере, офсета и мелкой насечки. Эта последняя технология, в частности, обычно представляет зоны с большим количеством линий очень высокого контраста. Когда печатают номер серии на одной из этих зон, достаточно трудно с использованием обычных технологий отделить символы от фона, а значит и распознать эти символы.Indeed, in most types of bank tickets, the series number is partially or fully printed directly on the background image of this ticket. The printing of bank tickets is carried out, in particular, using a mixture of various technologies, usually at least offset and small notches. This latest technology, in particular, usually represents areas with a large number of lines of very high contrast. When a series number is printed on one of these zones, it is quite difficult to separate the characters from the background using conventional technologies, which means that these characters can be recognized.

Кроме того, номер серии обычно печатается на заключительной фазе производства, после офсетной печати и мелкой насечки, и на другой печатной машине. Даже если используются весьма сложные и современные системы разметки, относительная регистрация между номерами серии и рисунком фона в результате оказывается скорее переменной, и может обычно "шевелиться" или смещаться в пределах нескольких миллиметров.In addition, the batch number is usually printed in the final phase of production, after offset printing and fine notching, and on another printing machine. Even if very complex and modern markup systems are used, the relative registration between the series numbers and the background pattern is more likely to be variable, and can usually “move” or move within a few millimeters.

На фиг.IV/4 показано построение системы распознавания номеров серии на банковских билетах. Здесь линейная камера CCD 1 со своими линзами 2 и своей системой освещения 3 используется для считывания изображений банковских билетов 4, на которых необходимо прочитать номера серий, пока они транспортируются при помощи всасывающей ленты 5.On IV / 4 shows the construction of a system for recognizing series numbers on bank tickets. Here, the CCD 1 linear camera with its lenses 2 and its lighting system 3 is used to read images of bank tickets 4, on which it is necessary to read the series numbers while they are transported using the suction tape 5.

Линии сканирования камеры последовательно запоминаются в первом контуре буферного запоминающего устройства подсистемы обработки изображений 6 для формирования электронного изображения каждого банковского билета.The camera scan lines are sequentially stored in the first circuit of the buffer storage device of the image processing subsystem 6 to form an electronic image of each bank ticket.

Подсистема обработки изображений 6, которая может быть основана как на специализированной вычислительной аппаратуре, так и на программируемых компьютерах типа DSP (Digital Signal Processor), быстродействующих персональных компьютерах PC и т.д., осуществляют различные операции как в фазе отладки (формирование модели фона и моделей символов), так и в фазе распознавания.The image processing subsystem 6, which can be based both on specialized computing equipment and on programmable computers such as DSP (Digital Signal Processor), high-speed personal computers PC, etc., perform various operations both in the debug phase (formation of a background model and character models), and in the recognition phase.

В процессе осуществления фазы отладки модели фона подсистема обработки изображений:In the process of implementing the debug phase of the background model, the image processing subsystem:

- обеспечивает сбор не пронумерованных изображений банковских билетов, выбранных в качестве "Набора для отладки фона" (НОФ) (EAF) и запоминает этот набор в соответствующем запоминающем устройстве;- provides collection of non-numbered images of bank notes selected as a “Background Debugging Kit” (EAF) and stores this set in a corresponding memory device;

- выделяет из набора НОФ одно "эталонное" изображение для регистрации и делает это либо автоматически (например, выделяет первое изображение из набора НОФ), либо с помощью оператора системы, который использует для этого пульт управления 7;- selects one “reference” image from the set of NOFs for registration and does this either automatically (for example, selects the first image from the set of NOFs) or with the help of a system operator who uses the control panel 7 for this;

- регистрирует все изображения из набора НОФ, определяя, прежде всего, горизонтальное смещение Δх и вертикальное смещение Δу каждого изображения по отношению к эталонному изображению, и накладывая затем соответствующее смещение -Δх и -Δу. В этом варианте измерение смещения осуществляется с использованием метода максимальной корреляции. Небольшой прямоугольный участок S0 (основа разметки) эталонного изображения с центром, имеющим координаты х0, у0, выбранные, например, оператором (вне зоны надпечатывания символов), сопоставляется с участком S1 тех же размеров, центр которого смещается шаг за шагом на каждую позицию (пиксель) изображения из набора НОФ для того, чтобы найти положение х1, y1, где коэффициент корреляции имеет свое максимальное значение (это соответствует наиболее точному наложению между двумя изображениями). При этом смещение может быть определено следующим выражением:- registers all the images from the set of NOF, determining, first of all, the horizontal displacement Δx and the vertical displacement Δy of each image in relation to the reference image, and then applying the corresponding displacement -Δx and -Δy. In this embodiment, the bias is measured using the maximum correlation method. A small rectangular section S 0 (marking base) of the reference image with the center having coordinates x 0 , y 0 , selected, for example, by the operator (outside the zone of printing characters), is compared with the section S 1 of the same size, the center of which is shifted step by step by each position (pixel) of the image from the set of NOFs in order to find the position x 1 , y 1 , where the correlation coefficient has its maximum value (this corresponds to the most accurate overlap between the two images). In this case, the offset can be determined by the following expression:

Δx=х10 и Δу=у10 Δx = x 1 -x 0 and Δy = y 1 -x 0

В соответствии с этим вариантом модель фона Mf формируется в виде среднего арифметического изображения НОФ, зарегистрированных вместе с эталонным изображением.In accordance with this option, the background model M f is formed in the form of an arithmetic mean of the NOF recorded together with the reference image.

В процессе осуществления фазы отладки моделей символов подсистема обработки изображений 6:In the process of implementing the debug phase of character models, the image processing subsystem 6:

- обеспечивает сбор изображений совокупности банковских билетов, где на белом фоне отпечатаны все цифры и/или буквы, используемые в номерах серии, каждая поодиночке, и в известных положениях (набор для отладки символов HOC (EAC);- provides collection of images of a set of bank notes, where all the numbers and / or letters used in series numbers are printed on a white background, each one by one, and in known positions (set for debugging HOC symbols (EAC);

- затем сегментирует изображения из набора EAC в элементарные изображения, каждое из которых содержит один единственный символ. В соответствии с этим вариантом сегментация обеспечивается с использованием стандартной технологии анализа перехода от черного к белому, весьма эффективной в тех случаях, когда символы отпечатаны на белом фоне;- then segments the images from the EAC set into elementary images, each of which contains one single character. In accordance with this option, segmentation is provided using standard technology for analyzing the transition from black to white, which is very effective in cases where characters are printed on a white background;

- формирует модель Ms для каждого символа (буквы или цифры) как среднее арифметическое из набора НОС элементарных изображений каждого положения, зарегистрированного, например, вместе с символом первого билета из набора НОС, взятого в качестве эталонного. Регистрация и усреднение осуществляются так же, как и в случае модели фона, но основы разметки совпадают с целым элементарным изображением символа.- generates a model M s for each symbol (letter or number) as the arithmetic average of the set of NOS elementary images of each position registered, for example, together with the symbol of the first ticket from the set of NOS taken as a reference. Registration and averaging are carried out in the same way as in the case of the background model, but the basics of the markup coincide with the whole elementary image of the symbol.

Обычно в составе номера серии банковского билета используются буквенные и цифровые символы одного и того же шрифта. Таким образом, обычно будет достаточно одного положения на билетах из набора НОС на символ (один символ А, один символ В и т.д.). В другом случае будет необходимо предусмотреть столько положений на символ, сколько используется различных шрифтов (например, А шрифта New York, А шрифта Courrier, А шрифта Geneve и т.д.).Typically, the series number of a bank ticket uses alphanumeric characters in the same font. Thus, usually one position on tickets from the set of FNL per symbol (one symbol A, one symbol B, etc.) will suffice. In another case, it will be necessary to provide as many provisions per character as the number of different fonts used (for example, A font New York, A font Courrier, A font Geneve, etc.).

В процессе осуществления фазы распознавания в соответствии с описываемым здесь вариантом реализации предлагаемого изобретения подсистема обработки изображений 6 после считывания изображения:In the process of implementing the recognition phase in accordance with the embodiment of the invention described here, the image processing subsystem 6 after reading the image:

- прежде всего, регистрирует изображение фона каждого подлежащего считыванию банковского билета вместе с моделью фона посредством той же основы разметки, которая была использована для отладки модели, и с применением той же технологии корреляции;- first of all, it records the background image of each bank ticket to be read together with the background model through the same markup framework that was used to debug the model and using the same correlation technology;

- формирует разностное изображение, которое представляет собой зарегистрированное изображение полного билета минус модель фона, после чего осуществляет поиск положений символов. Используемая при этом технология основывается на уже упомянутом выше анализе переходов. Обычно поиск может быть выполнен на ограниченной зоне билета, поскольку печать номера серии может быть смещена по отношению к рисунку фона не более, чем на несколько миллиметров;- forms a differential image, which is a registered image of a full ticket minus a background model, after which it searches for the positions of the characters. The technology used for this is based on the transition analysis already mentioned above. Usually, a search can be performed on a limited area of the ticket, since the print of the series number can be offset by no more than a few millimeters from the background pattern;

- выделяет для каждого положения символа, отмеченного на разностном изображении, соответствующее элементарное изображение модели фона. Будучи зарегистрированным, упомянутое элементарное изображение будет точно представлять собой участок фона, на котором был отпечатан неизвестный символ;- selects for each position of the symbol marked on the differential image, the corresponding elementary image of the background model. Being registered, the aforementioned elementary image will accurately represent a portion of the background on which an unknown symbol was printed;

- комбинирует для каждого положения символа соответствующее зарегистрированное элементарное изображение фона Mf с каждой из моделей символов Ms.- combines for each symbol position the corresponding registered elementary background image M f with each of the symbol models M s .

Также для каждого положения символа будут получены новые модели, символы плюс фон, с тем же относительным положением, что и на подлежащем считыванию билете. В этом варианте реализации предлагаемого изобретения упомянутая комбинация Мс формируется, пиксель за пикселем, с использованием следующих уравнений:Also, for each position of the symbol, new models will be obtained, symbols plus the background, with the same relative position as on the ticket to be read. In this embodiment of the invention, said combination of M c is formed, pixel by pixel, using the following equations:

Figure 00000001
Figure 00000001

если сначала печатают фон, а затем печатают символы. В противном случае:if you print the background first, and then the characters print. Otherwise:

Figure 00000002
Figure 00000002

Во всех случаях коэффициенты Ко и K1 представляют собой константы, характеризующие используемые типографские краски и бумагу. В уравнениях [1] и [2] первый член (а именно, произведение KoMfMs) учитывает передающую способность используемых типографских красок и отражающую способность бумаги, тогда как второй член в этих уравнениях связан с отражающей способностью поверхности типографской краски, которая была нанесена последней;In all cases, the coefficients K o and K 1 are constants characterizing the printing inks and paper used. In equations [1] and [2], the first term (namely, the product K o M f M s ) takes into account the transmitting power of the printing inks used and the reflectivity of the paper, while the second term in these equations is related to the reflectivity of the surface of the printing ink, which was applied last;

- для каждого положения символа рассчитывает коэффициент корреляции между соответствующим элементарным изображением билета и всеми новыми моделями (символы плюс фон). При этом подлежащий обработке символ распознается как символ комбинированной модели, соответствующей максимальному значению упомянутого коэффициента корреляции;- for each position of the symbol calculates the correlation coefficient between the corresponding elementary image of the ticket and all new models (symbols plus background). In this case, the symbol to be processed is recognized as a symbol of the combined model corresponding to the maximum value of said correlation coefficient;

- в соответствии с этим вариантом реализации предлагаемого изобретения дополнительно проводят сопоставление упомянутого максимального значения коэффициента корреляции с некоторым пороговым значением для того, чтобы проверить качество печати символа и фона элементарных изображений, соответствующих каждому положению символа. Если качество оказывается удовлетворительным (подлежащее обработке элементарное изображение и комбинированная модель являются практически идентичными), коэффициент имеет значение, весьма близкое к 1, тогда как плохое качество будет соответствовать значению коэффициента, более близкому к нулю.- in accordance with this embodiment, the invention further compares the said maximum value of the correlation coefficient with a certain threshold value in order to check the print quality of the symbol and the background of the elementary images corresponding to each symbol position. If the quality is satisfactory (the elementary image to be processed and the combined model are almost identical), the coefficient has a value very close to 1, while poor quality will correspond to a coefficient value closer to zero.

Другие предпочтительные варианты реализации предлагаемого изобретения будут включать:Other preferred embodiments of the invention will include:

a) его применение для распознавания символов на документах, отличных от банковских билетов, то есть таких, например, как письма, почтовые карточки, этикетки, банковские или почтовые чеки и т.д.;a) its use for character recognition on documents other than bank tickets, that is, such as letters, postcards, labels, bank or postal checks, etc .;

b) замену системы транспортировки на ленте на систему транспортировки, подходящую для листов больших размеров, например, на цилиндр по типу используемых в типографских печатных машинах или на систему в соответствии с патентом США №5598006 от 28.01.1998;b) replacing the conveyor system on a tape with a conveyor system suitable for large sheets, for example, a cylinder of the type used in printing presses or a system in accordance with US Pat. No. 5,598,006 of January 28, 1998;

c) замену в системе распознавания линейной камеры на матричную камеру;c) replacement in the recognition system of a linear camera with a matrix camera;

d) использование усредненного изображения набора изображений НОФ в качестве эталонного изображения для регистрации фона;d) using an averaged image of a set of NOF images as a reference image for background recording;

e) автоматическое выделение основы разметки для регистрации фона, например, в соответствии с технологией, предложенной в Патенте княжества Монако №2411992479;e) automatic allocation of the markup basis for background registration, for example, in accordance with the technology proposed in Patent of the Principality of Monaco No. 2411992479;

f) построение модели фона с использованием способа, отличного от усреднения, например, с использованием технологии, указанной в Патенте США №5778088 от 7.07.1998.f) building a background model using a method other than averaging, for example, using the technology specified in US Patent No. 5778088 of 07/07/1998.

Список использованной литературыList of references

(1) L.Stringa - "Inspection Automatique de la qualite d’impression par un modele elastique" - Патент на изобретение №2411.99.2479, выданный Государственным Министерством княжества Монако (27.04.99).(1) L. Stringa - "Inspection Automatique de la qualite d’impression par un modele elastique" - Patent for invention No. 2411.99.2479, issued by the State Ministry of the Principality of Monaco (04/27/99).

(2) L.Stringa - "Procedur for Producing A Referance Model etc." - Патент США №5.778.088 - 7 июля 1998 г.(2) L. Stringa - "Procedur for Producing A Referance Model etc." - US Patent No. 5,778.088 - July 7, 1998

(3) L.Stringa - "Procede de controle automatique de la qualite d’impression d’une image multichrome" - Заявка на Европейский патент №97810160.8-2304.(3) L. Stringa - "Procede de controle automatique de la qualite d’impression d’une image multichrome" - European Patent Application No. 97810160.8-2304.

(4) L.Stringa - "Installation for Quality Control of Printed Sheets, Especially Security Paper" - Патент США №5.598.006 - 28 января 1998 г.(4) L. Stringa - "Installation for Quality Control of Printed Sheets, Especially Security Paper" - US Patent No. 5,598.006 - January 28, 1998

(5) Rice-Nagy-Nartkr - "Optical Character Recognition" - Klumer Academic Publshers - 1999.(5) Rice-Nagy-Nartkr - "Optical Character Recognition" - Klumer Academic Publshers - 1999.

Claims (10)

1. Способ автоматического распознавания электронными средствами символов, таких, как буквы и/или цифры, отпечатанных на любом материале, включающем структуры с сильной контрастностью, даже в случае, когда фон имеет весьма контрастные структуры, при котором используют оптоэлектронное устройство считывания изображения и систему обработки изображения, содержащий следующие шаги, при которых осуществляют этап отладки, при котором формируют модель фона, получаемую путем считывания изображений одного или нескольких образцов, на которых изображен только фон, формируют модель символов (цифр и/или букв, а также других символов), получаемых путем считывания изображений набора символов, отпечатанных на белом фоне, содержащего, по меньшей мере, один экземпляр каждого символа, после чего осуществляют этап распознавания, при котором считывают изображение, подлежащее распознаванию образца, содержащее неизвестные символы, отпечатанные на определенном фоне, регистрируют модель фона вместе с фоном считанного изображения, выделяют модель зарегистрированного фона из элементарного изображения фона, соответствующего каждому неизвестному символу, комбинируют для каждого положения символа модель букв и/или цифр с элементарным изображением соответствующего фона, создают комбинированные модели, сопоставляют неизвестные символы со всеми комбинированными моделями, соответствующими одному и тому же положению символа, распознают каждый неизвестный символ как соответствующий символ, комбинированная модель которого наилучшим образом накладывается на него в соответствии с технологией “сравнение с шаблоном”.1. The method of automatic recognition by electronic means of characters, such as letters and / or numbers, printed on any material, including structures with strong contrast, even in the case where the background has very contrasting structures, which use an optoelectronic image reader and processing system an image containing the following steps, in which the debugging step is carried out, in which a background model is obtained by reading images of one or more samples in which Only the background is shown, a model of characters is formed (numbers and / or letters, as well as other characters) obtained by reading images of a character set printed on a white background containing at least one instance of each character, after which the recognition step is performed, when which reads the image to be recognized by the sample, containing unknown characters printed on a specific background, records the background model together with the background of the read image, extracts the registered background model from the elementary image expressions of the background corresponding to each unknown symbol, combine for each position of the symbol a model of letters and / or numbers with an elementary image of the corresponding background, create combined models, match unknown symbols with all combined models corresponding to the same symbol position, recognize each unknown symbol as the corresponding symbol, the combined model of which is best superimposed on it in accordance with the “comparison with template" technology. 2. Способ по п.1, в котором упомянутая модель фона представляет собой одно из изображений Набора для Отладки Фона (НОФ).2. The method according to claim 1, wherein said background model is one of the images of the Background Debugging Kit (NOF). 3. Способ по п.1, в котором упомянутая модель фона представляет собой среднее значение изображений НОФ, зарегистрированных между собой.3. The method according to claim 1, wherein said background model is the average value of the NOF images recorded between each other. 4. Способ по п.1, в котором упомянутую модель фона представляют посредством набора образцов, содержащих или фон, или символы, в соответствии с технологией разделения символ или фон.4. The method according to claim 1, wherein said background model is represented by a set of patterns containing either a background or symbols, in accordance with a separation technology, a symbol or background. 5. Способ по п.4, в котором модели подлежащих распознаванию символов формируют как средние значения соответствующих изображений из Набора Отладки Символов (НОС).5. The method according to claim 4, in which the models of the characters to be recognized are formed as average values of the corresponding images from the Symbol Debugging Kit (NOS). 6. Способ по п.4, в котором модели, подлежащие распознаванию символов, формируются при помощи информационных компьютерных файлов.6. The method according to claim 4, in which the models to be recognized by characters are formed using information computer files. 7. Способ по п.6, в котором используют систему считывания цветного изображения, распознавание которого осуществляют в том канале цвета, который дает наилучшее наложение.7. The method according to claim 6, in which a color image reading system is used, the recognition of which is carried out in the color channel that gives the best overlap. 8. Способ по п.7, в котором каждое изображение, подлежащее обработке, представляют как отделение неизвестных символов от фона путем выделения модели зарегистрированного фона.8. The method according to claim 7, in which each image to be processed is represented as separating unknown characters from the background by highlighting a registered background model. 9. Способ по п.8, в котором комбинирование моделей фона и символов осуществляют в соответствии со следующими уравнениями:9. The method of claim 8, in which the combination of background models and symbols is carried out in accordance with the following equations:
Figure 00000003
;
Figure 00000003
;
Ms≈Mf,Ms≈Mf, если сначала печатают фон, а затем печатают символы, в противном случае:if the background is printed first and then the characters are printed, otherwise:
Figure 00000004
;
Figure 00000004
;
Ms≈Mf,Ms≈Mf, где Mb - модель символа b;where Mb is the symbol model b; Mf - модель фона;Mf - background model; Ms - модель для каждого символа;Ms - model for each character; Ко и К1 - коэффициенты, представляющие собой константы.By about 1 and K - factors which are constant.
10. Способ по п.9, в котором используют для проверки качества печати путем сравнения с пороговым значением величины коэффициента корреляции между элементарным изображением каждого из положений символов и соответствующей ему комбинированной модели, выбранной на уровне распознавания.10. The method according to claim 9, in which it is used to check print quality by comparing with the threshold value of the correlation coefficient between the elementary image of each of the positions of the characters and the corresponding combined model selected at the recognition level.
RU2000116357/09A 1999-06-21 2000-06-20 Automatic recognition of symbols on structural background by combination of models of symbols and background RU2249251C2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2000116357/09A RU2249251C2 (en) 1999-06-21 2000-06-20 Automatic recognition of symbols on structural background by combination of models of symbols and background

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
MC2427.99.2491 1999-06-21
RU2000116357/09A RU2249251C2 (en) 1999-06-21 2000-06-20 Automatic recognition of symbols on structural background by combination of models of symbols and background

Publications (2)

Publication Number Publication Date
RU2000116357A RU2000116357A (en) 2002-05-27
RU2249251C2 true RU2249251C2 (en) 2005-03-27

Family

ID=35708971

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2000116357/09A RU2249251C2 (en) 1999-06-21 2000-06-20 Automatic recognition of symbols on structural background by combination of models of symbols and background

Country Status (1)

Country Link
RU (1) RU2249251C2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images
RU2454718C2 (en) * 2007-11-05 2012-06-27 Т-Мобиле Интернациональ Аг Image analysis method, particularly for mobile device
RU2656573C2 (en) * 2014-06-25 2018-06-05 Общество с ограниченной ответственностью "Аби Девелопмент" Methods of detecting the user-integrated check marks
RU190639U1 (en) * 2019-04-04 2019-07-05 Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы" SYSTEM OF GENERATION OF IMAGES CONTAINING TEXT

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2454718C2 (en) * 2007-11-05 2012-06-27 Т-Мобиле Интернациональ Аг Image analysis method, particularly for mobile device
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images
RU2656573C2 (en) * 2014-06-25 2018-06-05 Общество с ограниченной ответственностью "Аби Девелопмент" Methods of detecting the user-integrated check marks
RU190639U1 (en) * 2019-04-04 2019-07-05 Акционерное общество Научно-производственный центр "Электронные вычислительно-информационные системы" SYSTEM OF GENERATION OF IMAGES CONTAINING TEXT

Similar Documents

Publication Publication Date Title
DE4202579C2 (en) Document processing system
JP4006224B2 (en) Image quality determination method, determination device, and determination program
JP5379085B2 (en) Method and system for classifying connected groups of foreground pixels in a scanned document image based on marking type
JP4857173B2 (en) Image processing apparatus, image processing method, and image processing program
EP0446631A2 (en) Method and system for locating the amount field on a document
JP4593729B2 (en) A method of automatically recognizing text on a structured background by combining a background model and a character model
JP5830338B2 (en) Form recognition method and form recognition apparatus
CN109784342A (en) A kind of OCR recognition methods and terminal based on deep learning model
JP3018949B2 (en) Character reading apparatus and method
US5113453A (en) Character recognition method and apparatus
US6975761B1 (en) Image processing for clustering related text objects
IL98293A (en) Method of discriminating between text and graphics
RU2249251C2 (en) Automatic recognition of symbols on structural background by combination of models of symbols and background
JP5929282B2 (en) Image processing apparatus and image processing program
CN110533660B (en) Method for detecting silk-screen defect of electronic product shell
Pinto et al. Ancient music recovery for digital libraries
CN102682308B (en) Imaging processing method and device
JP3955467B2 (en) Image processing program and image processing apparatus
Sherkat et al. Use of colour for hand-filled form analysis and recognition
JP2001109887A (en) Area extracting method, method and device for extracting address area, and image processor
US6678427B1 (en) Document identification registration system
JP2005071134A (en) Optical character reader
JP2001109842A (en) Optical character, reader
JPH10162140A (en) Recognition device for stamps or the like
CN116778503A (en) Seal authenticity identification method and system based on OCR (optical character recognition)

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20100621