RU2285952C1 - Device for recognition of printed and hand-printed images of symbols - Google Patents

Device for recognition of printed and hand-printed images of symbols Download PDF

Info

Publication number
RU2285952C1
RU2285952C1 RU2005110802/09A RU2005110802A RU2285952C1 RU 2285952 C1 RU2285952 C1 RU 2285952C1 RU 2005110802/09 A RU2005110802/09 A RU 2005110802/09A RU 2005110802 A RU2005110802 A RU 2005110802A RU 2285952 C1 RU2285952 C1 RU 2285952C1
Authority
RU
Russia
Prior art keywords
block
input
output
unit
semantic significance
Prior art date
Application number
RU2005110802/09A
Other languages
Russian (ru)
Inventor
Виктор Александрович Сойфер (RU)
Виктор Александрович Сойфер
Николай Львович Казанский (RU)
Николай Львович Казанский
Владимир Алексеевич Фурсов (RU)
Владимир Алексеевич Фурсов
Никита Евгеньевич Козин (RU)
Никита Евгеньевич Козин
Original Assignee
Институт систем обработки изображений Российской академии наук (ИСОИ РАН)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Институт систем обработки изображений Российской академии наук (ИСОИ РАН) filed Critical Институт систем обработки изображений Российской академии наук (ИСОИ РАН)
Priority to RU2005110802/09A priority Critical patent/RU2285952C1/en
Application granted granted Critical
Publication of RU2285952C1 publication Critical patent/RU2285952C1/en

Links

Images

Abstract

FIELD: automatics and digital computer engineering.
SUBSTANCE: device contains image generation block, comparison block, multiplier, accumulating adder, decision taking block, standards memory block, weight coefficients memory block and control block. Device additionally includes images normalization block, which consists of serially connected addition and control block, standard selection block and image modification block, and weight coefficients generation block, which consists of serially connected block for forming semantic significance fields, block for ordering semantic significance fields, block for calculation of semantic significance coefficients and block for generation of remainder fields of semantic significance.
EFFECT: increased reliability of symbol recognition.
6 dwg

Description

Изобретение относится к автоматике и цифровой вычислительной технике и может быть использовано при построении устройств автоматического чтения печатных и рукопечатных текстов.The invention relates to automation and digital computing and can be used to build devices for automatic reading of printed and hand-printed texts.

Известно устройство для распознавания изображений символов (RU 2178916, кл. G 06 K 9/68, опубл. 27.01.2002.), содержащее телевизионный датчик, блок памяти эталонов, блок памяти весовых коэффициентов, блок управления, блок сравнения, накапливающий сумматор, блок памяти количества элементов шаблона, блок деления и блок принятия решения.A device for recognizing symbol images (RU 2178916, class G 06 K 9/68, publ. 01/27/2002.), Comprising a television sensor, a memory unit for standards, a memory unit for weight coefficients, a control unit, a comparison unit, an accumulating adder, a unit the memory of the number of template elements, the division block and the decision block.

Известна система распознавания символов "REI Input 80 Model A" компании Recognition Equipment Incorporated (Дж.Ту, Р.Гонсалес. Принципы распознавания образов. М.: Мир, 1978, с.35-37), содержащая блок распознавания, контроллер с программным управлением, печатающее устройство для ввода/вывода данных, построчно-печатающее устройство, блок распознавания, блок магнитной ленты и страничный процессор.Known character recognition system "REI Input 80 Model A" company Recognition Equipment Incorporated (J.Tu, R. Gonzalez. Principles of pattern recognition. M: Mir, 1978, p. 35-37), containing a recognition unit, a controller with program control , a printing device for input / output of data, a line-printing device, a recognition unit, a magnetic tape unit and a page processor.

Недостатком данных устройств является низкая надежность распознавания символов при значительных отклонениях исследуемого изображения от эталонного, характерных для рукопечатных символов.The disadvantage of these devices is the low reliability of character recognition with significant deviations of the investigated image from the reference, characteristic of hand-printed characters.

Наиболее близким по технической сущности к заявляемому устройству является выбранное в качестве прототипа устройство для идентификации текстовых изображений (SU 1543431, G 06 K 9/00, опубл. 15.02.1990.), содержащее телевизионный датчик, блок сравнения, блок управления, блок памяти эталонов, блок памяти весовых коэффициентов, умножитель, накапливающий сумматор и блок принятия решения. Важнейшей отличительной характеристикой прототипа является наличие блока памяти весовых коэффициентов, умножителя и накапливающего сумматора. Весовые коэффициенты, хранящиеся в блоке памяти, выбираются таким образом, чтобы сигналы, поступающие от участков изображения с высокой семантической значимостью, вносили больший вклад при подсчете отличий изображений от эталона.The closest in technical essence to the claimed device is a device for identifying text images selected as a prototype (SU 1543431, G 06 K 9/00, publ. 02.15.1990.), Containing a television sensor, a comparison unit, a control unit, a memory unit of standards , weight memory block, multiplier, accumulating adder, and decision block. The most important distinguishing characteristic of the prototype is the presence of a memory block of weight coefficients, a multiplier and an accumulating adder. The weights stored in the memory block are selected so that the signals coming from portions of the image with high semantic significance make a greater contribution when calculating the differences of images from the standard.

Недостатком известного устройства является недостаточно высокая надежность различения похожих символов. Связано это с тем, что размеры зон семантической значимости, формируемые для символов с разной степенью различий в написании, также существенно различаются. После объединения всех зон семантической значимости каждого отдельного эталона, построенных для изображений символов, которые необходимо отличить от данного эталона, участки семантической значимости некоторых эталонов оказываются также похожими или малыми по площади. При этом, если в блоке принятия решений порог с целью уменьшения числа отказов в распознавании задан небольшим, при наличии помех не обеспечивается достаточно высокая надежность различения похожих символов.A disadvantage of the known device is the insufficiently high reliability of distinguishing similar characters. This is due to the fact that the sizes of zones of semantic significance formed for characters with varying degrees of spelling differences also differ significantly. After combining all the zones of semantic significance of each individual standard, constructed for images of symbols that need to be distinguished from this standard, the sections of the semantic significance of some standards are also similar or small in area. Moreover, if the threshold in order to reduce the number of recognition failures is set small in the decision block, in the presence of interference, a sufficiently high reliability of distinguishing similar characters is not provided.

В основу изобретения поставлена задача повышения надежности различения похожих символов.The basis of the invention is the task of increasing the reliability of distinguishing similar characters.

Поставленная задача решается за счет того, что в устройство для распознавания печатных и рукопечатных изображений символов, содержащее блок формирования изображений, вход которого является информационным входом устройства, блок сравнения, выход которого соединен с первым входом умножителя, выход которого соединен с первым входом накапливающего сумматора, выход которого соединен со входом блока принятия решений, выход которого является выходом устройства, блок памяти эталонов, выход которого соединен со вторым входом умножителя, а также входом блока памяти весовых коэффициентов, выход которого, в свою очередь, соединен со вторым входом накапливающего сумматора, и блок управления, согласно изобретению дополнительно введены блок нормировки изображений, первый выход которого соединен с первым входом блока сравнения, а второй выход соединен с первым входом блока памяти эталонов, и блок формирования весовых коэффициентов, выход которого соединен со вторым входом блока памяти весовых коэффициентов, при этом блок нормировки изображений состоит из последовательно соединенных блока суммирования и контроля, блока выбора шаблона и блока модификации изображений, а блок формирования весовых коэффициентов состоит из последовательно соединенных блока формирования полей семантической значимости, блока упорядочивания полей семантической значимости, выход которого соединен с первым входом блока вычисления коэффициентов семантической значимости, выход которого является выходом блока формирования весовых коэффициентов, а также соединен со входом блока формирования остаточных полей семантической значимости, выход которого соединен со вторым входом блока вычисления коэффициентов семантической значимости.The problem is solved due to the fact that the device for recognition of printed and hand-printed images of characters, containing the image forming unit, the input of which is the information input of the device, the comparison unit, the output of which is connected to the first input of the multiplier, the output of which is connected to the first input of the accumulating adder, the output of which is connected to the input of the decision-making unit, the output of which is the output of the device, a memory unit of standards, the output of which is connected to the second input of the multiplier, and the input of the memory block of the weight coefficients, the output of which, in turn, is connected to the second input of the accumulating adder, and the control unit, according to the invention, an image normalization unit is additionally introduced, the first output of which is connected to the first input of the comparison unit, and the second output is connected to the first input the memory unit of the standards, and the unit for the formation of weighting coefficients, the output of which is connected to the second input of the memory unit of the weighting factors, while the normalization block of images consists of a series connected summation and control units, a template selection unit and an image modification unit, and a weighting coefficient generation unit consists of series-connected semantic significance field generation unit, a semantic significance field ordering unit, the output of which is connected to the first input of the semantic significance coefficient calculation unit, the output of which is the output of the block for the formation of weighting coefficients, and is also connected to the input of the block for the formation of residual fields of semantic significance, the output of which is connected to the second input of the unit for calculating the coefficients of semantic significance.

Повышение надежности является результатом использования данных блоков в совокупности.The increase in reliability is the result of using these blocks together.

Нормировка изображений заключается в том, что исходные бинарные изображения распознаваемых символов и эталонов, имеющие различную протяженность и толщину изображающих их линий, приводятся к таким изображениям, в которых соотношение числа черных и белых точек одинаково для всех различаемых символов и эталонов. Нормировка зон семантической значимости заключается в масштабировании весовых коэффициентов таким образом, чтобы при поэлементном умножении этих коэффициентов на отсчеты изображения, полученного после сравнения эталонов, соответствующих различным символам, получались равные заданные числа.The normalization of images consists in the fact that the original binary images of recognizable symbols and patterns, having different lengths and thicknesses of the lines depicting them, are reduced to such images in which the ratio of the number of black and white dots is the same for all distinguishable symbols and patterns. Normalization of zones of semantic significance consists in scaling the weight coefficients in such a way that by elementwise multiplication of these coefficients by the samples of the image obtained after comparing the standards corresponding to different symbols, equal given numbers are obtained.

Введение указанных нормировок позволяет установить значение порога, обеспечивающее более высокую надежность различения похожих символов за счет "запаса", который имеет место для сильно отличающихся по написанию символов.The introduction of these normalizations allows you to set a threshold value that provides higher reliability of distinguishing similar characters due to the "margin", which is the case for characters that differ greatly in spelling.

Сопоставительный анализ с прототипом показывает, что заявляемое устройство отличается наличием новых блоков: блока нормировки изображений и блока формирования весовых коэффициентов. Таким образом, заявляемое устройство соответствует критерию изобретения "новизна".Comparative analysis with the prototype shows that the inventive device is distinguished by the presence of new units: an image normalization unit and a weighting unit. Thus, the claimed device meets the criteria of the invention of "novelty."

На фиг.1 представлена блок-схема устройства для распознавания печатных и рукопечатных символов. На фиг.2 представлена схема блока нормировки изображений. На фиг.3 представлена схема блока формирования весовых коэффициентов. На фиг.4а приведены примеры нормированных изображений эталонов для случая различения цифр ("2", "3", "4"), на фиг.4б, 4в приведен пример формирования поля нормированных весовых коэффициентов при переходе от эталона цифры "3" к эталону цифры "4".Figure 1 presents a block diagram of a device for the recognition of printed and hand-printed characters. Figure 2 presents the block diagram normalization of images. Figure 3 presents the block diagram of the formation of weighting factors. Fig. 4a shows examples of normalized images of standards for the case of distinguishing between numbers ("2", "3", "4"), Figs. 4b, 4c show an example of the formation of a field of normalized weighting coefficients when switching from the standard of the figure "3" to the standard digits "4".

Устройство для распознавания печатных и рукопечатных символов (фиг.1) содержит блок управления 1, блок формирования весовых коэффициентов 2, блок памяти эталонов 3, блок памяти весовых коэффициентов 4, вход устройства 5, блок формирования изображений 6, блок нормировки изображений 7, блок сравнения 8, умножитель 9, накапливающий сумматор 10, блок принятия решения 11 и выход устройства 12. В свою очередь, блок нормировки изображений 7 состоит из блока суммирования и контроля 13, блока выбора шаблона 14 и блока модификации изображения 15. Блок формирования весовых коэффициентов 2 состоит из блока формирования полей семантической значимости 16, блока упорядочивания полей семантической значимости 17, блока вычисления коэффициентов семантической значимости 18 и блока формирования остаточных полей семантической значимости 19. Вход 5 подключен к блоку формирования изображений 6, выход которого соединен со входом блока нормировки изображений 7, первый выход которого соединен с первым входом блока сравнения 8, а второй выход соединен с первым входом блока памяти эталонов 3. Выход блока сравнения 8 соединен с первым входом умножителя 9, выход которого соединен с накапливающим сумматором 10, выход которого соединен со входом блока принятия решения 11, выход которого является выходом устройства 12. В свою очередь, первый выход блока управления 1 соединен со вторым входом блока памяти эталонов 3, а второй выход соединен со входом блока формирования весовых коэффициентов 2, выход которого соединен со вторым входом блока памяти весовых коэффициентов 4, выход которого соединен со вторым входом умножителя 9. Первый выход блока памяти эталонов 3 соединен со вторым входом блока сравнения 8, а второй выход соединен с первым входом блока памяти весовых коэффициентов 4. Первый вход блока суммирования и контроля 13 является входом блока нормировки изображений 7. Первый выход блока суммирования является выходом блока 7 и также соединен со вторым входом блока модификации изображения 15. Второй выход соединен со входом блока выбора шаблона 14, выход которого соединен с первым входом блока модификации изображения 15. Выход блока 15 соединен со вторым входом блока суммирования и контроля 13. Вход блока формирования полей семантической значимости 16 является входом блока формирования весовых коэффициентов 2. Его выход соединен с блоком упорядочивания полей семантической значимости 17, выход которого соединен с первым входом блока вычисления коэффициентов семантической значимости 18, выход которого является выходом блока формирования весовых коэффициентов 2, а также соединен со входом блока формирования остаточных полей семантической значимости 19, выход которого соединен со вторым входом блока вычисления коэффициентов семантической значимости 18.A device for recognizing printed and hand-written characters (Fig. 1) contains a control unit 1, a weighting unit 2, a memory unit 3, a memory unit 4, the input of the device 5, an image forming unit 6, an image normalization unit 7, a comparison unit 8, the multiplier 9, the accumulating adder 10, the decision block 11 and the output of the device 12. In turn, the image normalization block 7 consists of a summation and control block 13, a pattern selection block 14 and an image modification block 15. The block is formed I of weighting coefficients 2 consists of a block of formation of fields of semantic significance 16, a block of ordering of fields of semantic significance 17, a block of calculating coefficients of semantic significance 18 and a block of formation of residual fields of semantic significance 19. Input 5 is connected to an imaging unit 6, the output of which is connected to the input of the block normalization of images 7, the first output of which is connected to the first input of the comparison unit 8, and the second output is connected to the first input of the memory unit of standards 3. The output of the comparison unit 8 connected to the first input of the multiplier 9, the output of which is connected to the accumulating adder 10, the output of which is connected to the input of the decision block 11, the output of which is the output of the device 12. In turn, the first output of the control unit 1 is connected to the second input of the memory unit of standards 3, and the second output is connected to the input of the weighting unit 2, the output of which is connected to the second input of the weighting unit 4, the output of which is connected to the second input of the multiplier 9. The first output of the reference memory unit 3 s is single with the second input of the comparison unit 8, and the second output is connected to the first input of the memory block of the weight coefficients 4. The first input of the summation and control block 13 is the input of the image normalization block 7. The first output of the summation block is the output of the block 7 and is also connected to the second input of the block modifying the image 15. The second output is connected to the input of the block selection template 14, the output of which is connected to the first input of the block image modification 15. The output of the block 15 is connected to the second input of the summation and control unit 13. Input bl eye for the formation of fields of semantic significance 16 is the input of the unit for generating weighting coefficients 2. Its output is connected to the unit for ordering the fields of semantic significance 17, the output of which is connected to the first input of the unit for calculating the coefficients of semantic significance 18, the output of which is the output of the unit for generating weighting factors 2, and connected to the input of the unit for the formation of residual fields of semantic significance 19, the output of which is connected to the second input of the unit for calculating the coefficients of semantic of importance 18.

Устройство работает в двух режимах: настройки и распознавания. Включение режимов осуществляется блоком управления 1. В режиме настройки устройство работает следующим образом. Блок формирования изображений 6, включающий телевизионный датчик и блок преобразования сигнала, преобразует оптическое изображение эталона, считанное с входа 5, в бинарные цифровые сигналы, соответствующие значениям яркости в точках исследуемого текстового изображения и фона. Точкам фона ставится в соответствие значение 0, а точкам начертания символа - значение 1. Сигнал с выхода блока 6 поступает на вход блока 7 нормировки изображений. Данный блок осуществляет наращивание (или удаление) черных точек по контуру начертания символа, пока их общее число не станет равным заданному числу черных точек, одинаковому для всех эталонов.The device operates in two modes: settings and recognition. The inclusion of modes is carried out by the control unit 1. In the setup mode, the device operates as follows. The imaging unit 6, including a television sensor and a signal converting unit, converts the optical image of the standard read from input 5 into binary digital signals corresponding to the brightness values at the points of the studied text image and background. The value 0 is assigned to the background points, and the value 1 is assigned to the symbol drawing points. The signal from the output of block 6 is fed to the input of the image normalization block 7. This block carries out the buildup (or removal) of black points along the outline of the character, until their total number becomes equal to the specified number of black points, the same for all standards.

Выход блока 6 соединен со входом блока 7. Выход блока 7 соединен со входом блока 8. В блоке суммирования и контроля 13 подсчитывается сумма черных точек на изображении и эта сумма сравнивается с заданным значением. Если эти значения совпадают в пределах допустимой погрешности, изображение передается в блок 8. Если нет, результат сравнения с выхода блока 13 поступает на вход блока 14, в котором, в зависимости от знака результата, выбирается маска наращивания или удаления. Маска представляет собой трехточечный элемент (две черных точки и одна белая для наращивания и две белых и одна черная для удаления). В блоке 15 выбранная маска накладывается во всех точках изображения, поступающего с выхода блока 13, и в случае совпадения одна из соответствующих точек исходного изображения заменяется на противоположное значение (черная на белую при удалении, белая на черную при наращивании). После каждого этапа наращивания или удаления изображение с выхода блока 15 вновь поступает в блок 13 для суммирования и сравнения и т.д.The output of block 6 is connected to the input of block 7. The output of block 7 is connected to the input of block 8. In the summation and control block 13, the sum of black dots in the image is calculated and this sum is compared with the set value. If these values coincide within the margin of error, the image is transferred to block 8. If not, the comparison result from the output of block 13 is sent to the input of block 14, in which, depending on the sign of the result, an extension or deletion mask is selected. The mask is a three-point element (two black dots and one white for building and two white and one black for removal). In block 15, the selected mask is superimposed at all points of the image coming from the output of block 13, and if it matches, one of the corresponding points of the original image is replaced with the opposite value (black to white when deleting, white to black when building). After each stage of building or deleting, the image from the output of block 15 again enters block 13 for summing and comparing, etc.

Сформированные таким образом нормированные эталоны передаются в блок 3 хранения эталонов. После того, как все возможные эталоны будут сформированы, они поступают на вход блока 2 формирования весовых коэффициентов. В блоке 2 путем сравнения изображений эталонов строится поле различий с каждым эталоном, называемое полем семантической значимости.The standardized standards thus formed are transmitted to the standard storage unit 3. After all possible standards are formed, they are fed to the input of block 2 of the formation of weighting factors. In block 2, by comparing the images of the standards, a field of differences is constructed with each standard, called the field of semantic significance.

Для построения полей семантической значимости для каждого эталона в блоке формирования весовых коэффициентов 2 последовательно осуществляются следующие операции. В блоке 16 производится поэлементное сравнение исследуемого эталона со всеми остальными. На основе сравнения строится поле различий с каждым эталоном (фиг.4а), называемое полем семантической значимости. Это поле характеризует степень различия эталонов. Чем меньше область темного, тем больше эталоны "похожи" друг на друга, тем больше возможность ложного распознавания. Пример полей семантической значимости эталона цифры "2" при сравнении с эталонами цифр "3" и "4" приведен на фиг 4б.To construct fields of semantic significance for each standard in the block for the formation of weighting coefficients 2, the following operations are performed sequentially. In block 16, an element-by-element comparison of the investigated standard with all the others is performed. Based on the comparison, a field of differences is constructed with each standard (Fig. 4a), called the field of semantic significance. This field characterizes the degree of difference of the standards. The smaller the dark area, the more standards are “similar” to each other, the greater the possibility of false recognition. An example of fields of semantic significance of the standard of the figure "2" when compared with the standards of the numbers "3" and "4" is shown in Fig. 4b.

Полученные в блоке 16 поля семантической значимости поступают в блок упорядочения полей семантической значимости 17, в котором каждому из них присваивается число ki, i=1, L (где L - число эталонов), равное площади (числу черных точек) темных областей. Поля располагаются в порядке возрастания чисел: k1≤k2≤...≤kL.The fields of semantic significance obtained in block 16 enter the block for ordering the fields of semantic significance 17, in which each of them is assigned the number k i , i = 1, L (where L is the number of standards) equal to the area (number of black dots) of the dark areas. The fields are arranged in ascending order of numbers: k 1 ≤k 2 ≤ ... ≤k L.

Далее в блоке вычисления коэффициентов семантической значимости 18 для первого поля из ряда задается коэффициент q1, определяемый из условияFurther, in the block for calculating the coefficients of semantic significance 18, for the first field from the series, the coefficient q 1 is determined, determined from the condition

Figure 00000002
Figure 00000002

где Q - заданное число, определяемое величиной порога принятия решений.where Q is a given number determined by the value of the decision threshold.

После этого в блоке формирования остаточных полей семантической значимости 19 из следующего поля (соответствующего k2) исключаются участки, которые оказались семантически значимыми на первом поле (фиг.4в). Сформированное остаточное поле семантической значимости по каналу обратной связи из блока 19 поступает в блок 18 и для оставшейся семантически значимой зоны вычисляется значение q2 из условия:After that, in the block of formation of residual fields of semantic significance 19 from the next field (corresponding to k 2 ) are excluded sections that were semantically significant in the first field (pigv). The generated residual field of semantic significance via the feedback channel from block 19 goes to block 18 and for the remaining semantically significant zone, the q 2 value is calculated from the condition:

Figure 00000003
Figure 00000003

Процедура вычисления коэффициентов qi, i=1, L в блоке 18 повторяется для каждого i-го эталона (до тех пор пока i≤L) по формуле:The procedure for calculating the coefficients q i , i = 1, L in block 18 is repeated for each i-th standard (as long as i≤L) according to the formula:

Figure 00000004
Figure 00000004

При реализации описанной процедуры весовые коэффициенты, соответствующие остающимся участкам поля семантической значимости каждого следующего эталона, формируются независимо от предыдущих. При этом при сравнении любых двух эталонных изображений, соответствующих разным символам, всегда получается число, равное Q или незначительно отличающееся от него вследствие помех или искажений символов. Это достигается в том числе за счет использования блока нормировки изображений 7.When implementing the described procedure, the weighting coefficients corresponding to the remaining sections of the field of semantic significance of each subsequent standard are formed independently of the previous ones. Moreover, when comparing any two reference images corresponding to different characters, you always get a number equal to Q or slightly different from it due to interference or distortion of the characters. This is achieved, among other things, by using the image normalization unit 7.

Поле весовых коэффициентов q1, q2...qL, соответствующее каждому эталону, сохраняется в блоке 4 памяти весовых коэффициентов.The field of weight coefficients q 1 , q 2 ... q L , corresponding to each standard, is stored in block 4 of the memory of weight coefficients.

В режиме распознавания предъявленное на вход 6 оптическое изображение преобразуется в блоке формирования изображений в бинарное. Далее в блоке 7 осуществляется нормировка изображения, обеспечивающая заданное относительное число черных точек (такое же, как и для эталонов). Нормированное изображение с выхода блока 7 поступает на вход блока 8 сравнения. На второй вход блока 8 сравнения из блока 3 памяти эталонов поступают сигналы нормированных эталонных изображений. В блоке сравнения поэлементно сравниваются точки эталона и входного изображения символа. В случае совпадения соответствующих точек изображений присваивается значение 0, в противном случае 1. Таким образом, на выходе блока сравнения 8 формируется поле, каждая точка которого отмечена 0 в случае совпадения и 1 в случае несовпадения точек входного изображения символа и эталона. Этот сигнал поступает на вход умножителя 9. Умножитель производит поэлементное умножение отсчетов входного поля на соответствующие коэффициенты, поступающие с блока 4 памяти весовых коэффициентов. Результаты умножения накапливаются в сумматоре 10. Далее в блоке 11 принимается решение.In the recognition mode, the optical image presented at input 6 is converted in the image forming unit to binary. Next, in block 7, the image is normalized, providing a given relative number of black dots (the same as for the standards). The normalized image from the output of block 7 goes to the input of block 8 comparison. The signals of normalized reference images are input to the second input of the comparison unit 8 from the reference memory unit 3. In the comparison unit, the points of the standard and the input image of the symbol are compared elementwise. If the corresponding image points coincide, the value 0 is assigned, otherwise 1. Thus, at the output of the comparison unit 8, a field is formed, each point of which is marked 0 if they coincide and 1 if the points of the input image of the symbol and the reference do not coincide. This signal is fed to the input of the multiplier 9. The multiplier performs element-wise multiplication of samples of the input field by the corresponding coefficients from block 4 of the weight coefficient memory. The multiplication results are accumulated in the adder 10. Next, in block 11, a decision is made.

Процедура принятия решений состоит в следующем. Исследуемое изображение идентифицируется с тем эталоном, для которого накопленная в блоке 10 сумма минимальна и не превышает заданного порога. Если порог превышен для всех эталонов, происходит отказ от распознавания.The decision-making procedure is as follows. The image under study is identified with that standard for which the sum accumulated in block 10 is minimal and does not exceed a predetermined threshold. If the threshold is exceeded for all standards, recognition is rejected.

Качество распознавания регулируется величиной порога. Увеличение значения порога приводит к уменьшению числа отказов, при этом вероятность ошибки возрастает. Значение порога является одинаковым для всех эталонов. Это обеспечивается за счет вычисления весовых коэффициентов в блоке формирования весовых коэффициентов, как указано выше.The recognition quality is regulated by the threshold value. An increase in the threshold value leads to a decrease in the number of failures, while the probability of error increases. The threshold value is the same for all standards. This is achieved by calculating the weighting factors in the weighting unit, as described above.

Экспериментальные исследования заявляемого устройства для распознавания цифр показали, что по сравнению с устройством аналогичного назначения (прототип) заявляемое устройство обеспечивает более высокую надежность распознавания.Experimental studies of the inventive device for recognizing numbers showed that, in comparison with a device of a similar purpose (prototype), the inventive device provides higher recognition reliability.

Claims (1)

Устройство для распознавания печатных и рукопечатных символов, содержащее блок формирования изображений, вход которого является информационным входом устройства, блок сравнения, выход которого соединен с первым входом умножителя, выход которого соединен с первым входом накапливающего сумматора, выход которого соединен со входом блока принятия решений, выход которого является выходом устройства, блок памяти эталонов, выход которого соединен со вторым входом умножителя, а также входом блока памяти весовых коэффициентов, выход которого, в свою очередь, соединен со вторым входом накапливающего сумматора, и блок управления, отличающееся тем, что дополнительно введены блок нормировки изображений, первый выход которого соединен с первым входом блока сравнения, а второй выход соединен с первым входом блока памяти эталонов, и блок формирования весовых коэффициентов, выход которого соединен со вторым входом блока памяти весовых коэффициентов, при этом блок нормировки изображений состоит из последовательно соединенных блока суммирования и контроля, блока выбора шаблона и блока модификации изображений, а блок формирования весовых коэффициентов состоит из последовательно соединенных блока формирования полей семантической значимости, блока упорядочивания полей семантической значимости, выход которого соединен с первым входом блока вычисления коэффициентов семантической значимости, выход которого является выходом блока формирования весовых коэффициентов, а также соединен со входом блока формирования остаточных полей семантической значимости, выход которого соединен со вторым входом блока вычисления коэффициентов семантической значимости.A device for recognizing printed and hand-printed characters, comprising an image forming unit, the input of which is the information input of the device, a comparison unit, the output of which is connected to the first input of the multiplier, the output of which is connected to the first input of the accumulating adder, the output of which is connected to the input of the decision block, the output which is the output of the device, the memory unit of standards, the output of which is connected to the second input of the multiplier, as well as the input of the memory unit of the weight coefficients, the output of which in turn, connected to the second input of the accumulating adder, and a control unit, characterized in that an image normalization unit is additionally introduced, the first output of which is connected to the first input of the comparison unit, and the second output is connected to the first input of the reference memory unit, and the formation unit weight coefficients, the output of which is connected to the second input of the weight coefficient memory unit, while the image normalization unit consists of series-connected summation and control units, a template selection unit and a bl image modification, and the weighting coefficient generation block consists of series-connected semantic significance field forming block, the semantic significance field ordering block, the output of which is connected to the first input of the semantic significance coefficient calculation block, the output of which is the output of the weighting coefficient formation block, and also connected to the input of the unit for the formation of residual fields of semantic significance, the output of which is connected to the second input of the calculation unit to coefficients of semantic significance.
RU2005110802/09A 2005-04-13 2005-04-13 Device for recognition of printed and hand-printed images of symbols RU2285952C1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2005110802/09A RU2285952C1 (en) 2005-04-13 2005-04-13 Device for recognition of printed and hand-printed images of symbols

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2005110802/09A RU2285952C1 (en) 2005-04-13 2005-04-13 Device for recognition of printed and hand-printed images of symbols

Publications (1)

Publication Number Publication Date
RU2285952C1 true RU2285952C1 (en) 2006-10-20

Family

ID=37437986

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2005110802/09A RU2285952C1 (en) 2005-04-13 2005-04-13 Device for recognition of printed and hand-printed images of symbols

Country Status (1)

Country Link
RU (1) RU2285952C1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2456544C2 (en) * 2008-11-11 2012-07-20 Государственное образовательное учреждение высшего профессионального образования "Московский государственный университет геодезии и картографии" (МИИГАиК) Method of controlling bulkiness of equipment layout in tunnels and apparatus for realising said method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2456544C2 (en) * 2008-11-11 2012-07-20 Государственное образовательное учреждение высшего профессионального образования "Московский государственный университет геодезии и картографии" (МИИГАиК) Method of controlling bulkiness of equipment layout in tunnels and apparatus for realising said method

Similar Documents

Publication Publication Date Title
US7801392B2 (en) Image search system, image search method, and storage medium
CN105678292A (en) Complex optical text sequence identification system based on convolution and recurrent neural network
CN105678300A (en) Complex image and text sequence identification method
JPH05143707A (en) Method and device for processing coded image data
CN111738169B (en) Handwriting formula recognition method based on end-to-end network model
CN104008401A (en) Method and device for image character recognition
JP2006053920A (en) Character recognition program, method and device
Kunte et al. An OCR system for printed Kannada text using two-stage Multi-network classification approach employing Wavelet features
RU2285952C1 (en) Device for recognition of printed and hand-printed images of symbols
CN111242114B (en) Character recognition method and device
WO2023078264A1 (en) Method and apparatus for training business card information extraction system, and computer-readable storage medium
CN111553361A (en) Pathological section label identification method
Choudhary et al. Offline handwritten mathematical expression evaluator using convolutional neural network
CN113836941B (en) Contract navigation method and device
CN112381149B (en) Reasonable countermeasure analysis method for source camera identification based on deep learning
Kota et al. Summarizing lecture videos by key handwritten content regions
JP4834693B2 (en) Pattern recognition parameter learning device, pattern recognition device, and pattern recognition parameter learning method
CN111639649A (en) Method and system for identifying and encoding numbered musical notation image based on real-time image stream
CN111523318A (en) Chinese phrase analysis method, system, storage medium and electronic equipment
Mehta et al. Optical music notes recognition for printed piano music score sheet
EP4089568A1 (en) Cascade pooling for natural language document processing
CN113961674B (en) Semantic matching method and device for key information and public company announcement text
KR100243220B1 (en) Method for recognizing character to improve the matching speed
Yanagimoto et al. Visual Question Answering Focusing on Object Positional Relation with Capsule Network
WO2023062799A1 (en) Information processing system, manuscript type identification method, model generation method and program

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20090414