RU2285952C1 - Device for recognition of printed and hand-printed images of symbols - Google Patents
Device for recognition of printed and hand-printed images of symbols Download PDFInfo
- Publication number
- RU2285952C1 RU2285952C1 RU2005110802/09A RU2005110802A RU2285952C1 RU 2285952 C1 RU2285952 C1 RU 2285952C1 RU 2005110802/09 A RU2005110802/09 A RU 2005110802/09A RU 2005110802 A RU2005110802 A RU 2005110802A RU 2285952 C1 RU2285952 C1 RU 2285952C1
- Authority
- RU
- Russia
- Prior art keywords
- block
- input
- output
- unit
- semantic significance
- Prior art date
Links
Images
Abstract
Description
Изобретение относится к автоматике и цифровой вычислительной технике и может быть использовано при построении устройств автоматического чтения печатных и рукопечатных текстов.The invention relates to automation and digital computing and can be used to build devices for automatic reading of printed and hand-printed texts.
Известно устройство для распознавания изображений символов (RU 2178916, кл. G 06 K 9/68, опубл. 27.01.2002.), содержащее телевизионный датчик, блок памяти эталонов, блок памяти весовых коэффициентов, блок управления, блок сравнения, накапливающий сумматор, блок памяти количества элементов шаблона, блок деления и блок принятия решения.A device for recognizing symbol images (RU 2178916, class G 06 K 9/68, publ. 01/27/2002.), Comprising a television sensor, a memory unit for standards, a memory unit for weight coefficients, a control unit, a comparison unit, an accumulating adder, a unit the memory of the number of template elements, the division block and the decision block.
Известна система распознавания символов "REI Input 80 Model A" компании Recognition Equipment Incorporated (Дж.Ту, Р.Гонсалес. Принципы распознавания образов. М.: Мир, 1978, с.35-37), содержащая блок распознавания, контроллер с программным управлением, печатающее устройство для ввода/вывода данных, построчно-печатающее устройство, блок распознавания, блок магнитной ленты и страничный процессор.Known character recognition system "REI Input 80 Model A" company Recognition Equipment Incorporated (J.Tu, R. Gonzalez. Principles of pattern recognition. M: Mir, 1978, p. 35-37), containing a recognition unit, a controller with program control , a printing device for input / output of data, a line-printing device, a recognition unit, a magnetic tape unit and a page processor.
Недостатком данных устройств является низкая надежность распознавания символов при значительных отклонениях исследуемого изображения от эталонного, характерных для рукопечатных символов.The disadvantage of these devices is the low reliability of character recognition with significant deviations of the investigated image from the reference, characteristic of hand-printed characters.
Наиболее близким по технической сущности к заявляемому устройству является выбранное в качестве прототипа устройство для идентификации текстовых изображений (SU 1543431, G 06 K 9/00, опубл. 15.02.1990.), содержащее телевизионный датчик, блок сравнения, блок управления, блок памяти эталонов, блок памяти весовых коэффициентов, умножитель, накапливающий сумматор и блок принятия решения. Важнейшей отличительной характеристикой прототипа является наличие блока памяти весовых коэффициентов, умножителя и накапливающего сумматора. Весовые коэффициенты, хранящиеся в блоке памяти, выбираются таким образом, чтобы сигналы, поступающие от участков изображения с высокой семантической значимостью, вносили больший вклад при подсчете отличий изображений от эталона.The closest in technical essence to the claimed device is a device for identifying text images selected as a prototype (SU 1543431, G 06 K 9/00, publ. 02.15.1990.), Containing a television sensor, a comparison unit, a control unit, a memory unit of standards , weight memory block, multiplier, accumulating adder, and decision block. The most important distinguishing characteristic of the prototype is the presence of a memory block of weight coefficients, a multiplier and an accumulating adder. The weights stored in the memory block are selected so that the signals coming from portions of the image with high semantic significance make a greater contribution when calculating the differences of images from the standard.
Недостатком известного устройства является недостаточно высокая надежность различения похожих символов. Связано это с тем, что размеры зон семантической значимости, формируемые для символов с разной степенью различий в написании, также существенно различаются. После объединения всех зон семантической значимости каждого отдельного эталона, построенных для изображений символов, которые необходимо отличить от данного эталона, участки семантической значимости некоторых эталонов оказываются также похожими или малыми по площади. При этом, если в блоке принятия решений порог с целью уменьшения числа отказов в распознавании задан небольшим, при наличии помех не обеспечивается достаточно высокая надежность различения похожих символов.A disadvantage of the known device is the insufficiently high reliability of distinguishing similar characters. This is due to the fact that the sizes of zones of semantic significance formed for characters with varying degrees of spelling differences also differ significantly. After combining all the zones of semantic significance of each individual standard, constructed for images of symbols that need to be distinguished from this standard, the sections of the semantic significance of some standards are also similar or small in area. Moreover, if the threshold in order to reduce the number of recognition failures is set small in the decision block, in the presence of interference, a sufficiently high reliability of distinguishing similar characters is not provided.
В основу изобретения поставлена задача повышения надежности различения похожих символов.The basis of the invention is the task of increasing the reliability of distinguishing similar characters.
Поставленная задача решается за счет того, что в устройство для распознавания печатных и рукопечатных изображений символов, содержащее блок формирования изображений, вход которого является информационным входом устройства, блок сравнения, выход которого соединен с первым входом умножителя, выход которого соединен с первым входом накапливающего сумматора, выход которого соединен со входом блока принятия решений, выход которого является выходом устройства, блок памяти эталонов, выход которого соединен со вторым входом умножителя, а также входом блока памяти весовых коэффициентов, выход которого, в свою очередь, соединен со вторым входом накапливающего сумматора, и блок управления, согласно изобретению дополнительно введены блок нормировки изображений, первый выход которого соединен с первым входом блока сравнения, а второй выход соединен с первым входом блока памяти эталонов, и блок формирования весовых коэффициентов, выход которого соединен со вторым входом блока памяти весовых коэффициентов, при этом блок нормировки изображений состоит из последовательно соединенных блока суммирования и контроля, блока выбора шаблона и блока модификации изображений, а блок формирования весовых коэффициентов состоит из последовательно соединенных блока формирования полей семантической значимости, блока упорядочивания полей семантической значимости, выход которого соединен с первым входом блока вычисления коэффициентов семантической значимости, выход которого является выходом блока формирования весовых коэффициентов, а также соединен со входом блока формирования остаточных полей семантической значимости, выход которого соединен со вторым входом блока вычисления коэффициентов семантической значимости.The problem is solved due to the fact that the device for recognition of printed and hand-printed images of characters, containing the image forming unit, the input of which is the information input of the device, the comparison unit, the output of which is connected to the first input of the multiplier, the output of which is connected to the first input of the accumulating adder, the output of which is connected to the input of the decision-making unit, the output of which is the output of the device, a memory unit of standards, the output of which is connected to the second input of the multiplier, and the input of the memory block of the weight coefficients, the output of which, in turn, is connected to the second input of the accumulating adder, and the control unit, according to the invention, an image normalization unit is additionally introduced, the first output of which is connected to the first input of the comparison unit, and the second output is connected to the first input the memory unit of the standards, and the unit for the formation of weighting coefficients, the output of which is connected to the second input of the memory unit of the weighting factors, while the normalization block of images consists of a series connected summation and control units, a template selection unit and an image modification unit, and a weighting coefficient generation unit consists of series-connected semantic significance field generation unit, a semantic significance field ordering unit, the output of which is connected to the first input of the semantic significance coefficient calculation unit, the output of which is the output of the block for the formation of weighting coefficients, and is also connected to the input of the block for the formation of residual fields of semantic significance, the output of which is connected to the second input of the unit for calculating the coefficients of semantic significance.
Повышение надежности является результатом использования данных блоков в совокупности.The increase in reliability is the result of using these blocks together.
Нормировка изображений заключается в том, что исходные бинарные изображения распознаваемых символов и эталонов, имеющие различную протяженность и толщину изображающих их линий, приводятся к таким изображениям, в которых соотношение числа черных и белых точек одинаково для всех различаемых символов и эталонов. Нормировка зон семантической значимости заключается в масштабировании весовых коэффициентов таким образом, чтобы при поэлементном умножении этих коэффициентов на отсчеты изображения, полученного после сравнения эталонов, соответствующих различным символам, получались равные заданные числа.The normalization of images consists in the fact that the original binary images of recognizable symbols and patterns, having different lengths and thicknesses of the lines depicting them, are reduced to such images in which the ratio of the number of black and white dots is the same for all distinguishable symbols and patterns. Normalization of zones of semantic significance consists in scaling the weight coefficients in such a way that by elementwise multiplication of these coefficients by the samples of the image obtained after comparing the standards corresponding to different symbols, equal given numbers are obtained.
Введение указанных нормировок позволяет установить значение порога, обеспечивающее более высокую надежность различения похожих символов за счет "запаса", который имеет место для сильно отличающихся по написанию символов.The introduction of these normalizations allows you to set a threshold value that provides higher reliability of distinguishing similar characters due to the "margin", which is the case for characters that differ greatly in spelling.
Сопоставительный анализ с прототипом показывает, что заявляемое устройство отличается наличием новых блоков: блока нормировки изображений и блока формирования весовых коэффициентов. Таким образом, заявляемое устройство соответствует критерию изобретения "новизна".Comparative analysis with the prototype shows that the inventive device is distinguished by the presence of new units: an image normalization unit and a weighting unit. Thus, the claimed device meets the criteria of the invention of "novelty."
На фиг.1 представлена блок-схема устройства для распознавания печатных и рукопечатных символов. На фиг.2 представлена схема блока нормировки изображений. На фиг.3 представлена схема блока формирования весовых коэффициентов. На фиг.4а приведены примеры нормированных изображений эталонов для случая различения цифр ("2", "3", "4"), на фиг.4б, 4в приведен пример формирования поля нормированных весовых коэффициентов при переходе от эталона цифры "3" к эталону цифры "4".Figure 1 presents a block diagram of a device for the recognition of printed and hand-printed characters. Figure 2 presents the block diagram normalization of images. Figure 3 presents the block diagram of the formation of weighting factors. Fig. 4a shows examples of normalized images of standards for the case of distinguishing between numbers ("2", "3", "4"), Figs. 4b, 4c show an example of the formation of a field of normalized weighting coefficients when switching from the standard of the figure "3" to the standard digits "4".
Устройство для распознавания печатных и рукопечатных символов (фиг.1) содержит блок управления 1, блок формирования весовых коэффициентов 2, блок памяти эталонов 3, блок памяти весовых коэффициентов 4, вход устройства 5, блок формирования изображений 6, блок нормировки изображений 7, блок сравнения 8, умножитель 9, накапливающий сумматор 10, блок принятия решения 11 и выход устройства 12. В свою очередь, блок нормировки изображений 7 состоит из блока суммирования и контроля 13, блока выбора шаблона 14 и блока модификации изображения 15. Блок формирования весовых коэффициентов 2 состоит из блока формирования полей семантической значимости 16, блока упорядочивания полей семантической значимости 17, блока вычисления коэффициентов семантической значимости 18 и блока формирования остаточных полей семантической значимости 19. Вход 5 подключен к блоку формирования изображений 6, выход которого соединен со входом блока нормировки изображений 7, первый выход которого соединен с первым входом блока сравнения 8, а второй выход соединен с первым входом блока памяти эталонов 3. Выход блока сравнения 8 соединен с первым входом умножителя 9, выход которого соединен с накапливающим сумматором 10, выход которого соединен со входом блока принятия решения 11, выход которого является выходом устройства 12. В свою очередь, первый выход блока управления 1 соединен со вторым входом блока памяти эталонов 3, а второй выход соединен со входом блока формирования весовых коэффициентов 2, выход которого соединен со вторым входом блока памяти весовых коэффициентов 4, выход которого соединен со вторым входом умножителя 9. Первый выход блока памяти эталонов 3 соединен со вторым входом блока сравнения 8, а второй выход соединен с первым входом блока памяти весовых коэффициентов 4. Первый вход блока суммирования и контроля 13 является входом блока нормировки изображений 7. Первый выход блока суммирования является выходом блока 7 и также соединен со вторым входом блока модификации изображения 15. Второй выход соединен со входом блока выбора шаблона 14, выход которого соединен с первым входом блока модификации изображения 15. Выход блока 15 соединен со вторым входом блока суммирования и контроля 13. Вход блока формирования полей семантической значимости 16 является входом блока формирования весовых коэффициентов 2. Его выход соединен с блоком упорядочивания полей семантической значимости 17, выход которого соединен с первым входом блока вычисления коэффициентов семантической значимости 18, выход которого является выходом блока формирования весовых коэффициентов 2, а также соединен со входом блока формирования остаточных полей семантической значимости 19, выход которого соединен со вторым входом блока вычисления коэффициентов семантической значимости 18.A device for recognizing printed and hand-written characters (Fig. 1) contains a control unit 1, a weighting unit 2, a memory unit 3, a memory unit 4, the input of the device 5, an
Устройство работает в двух режимах: настройки и распознавания. Включение режимов осуществляется блоком управления 1. В режиме настройки устройство работает следующим образом. Блок формирования изображений 6, включающий телевизионный датчик и блок преобразования сигнала, преобразует оптическое изображение эталона, считанное с входа 5, в бинарные цифровые сигналы, соответствующие значениям яркости в точках исследуемого текстового изображения и фона. Точкам фона ставится в соответствие значение 0, а точкам начертания символа - значение 1. Сигнал с выхода блока 6 поступает на вход блока 7 нормировки изображений. Данный блок осуществляет наращивание (или удаление) черных точек по контуру начертания символа, пока их общее число не станет равным заданному числу черных точек, одинаковому для всех эталонов.The device operates in two modes: settings and recognition. The inclusion of modes is carried out by the control unit 1. In the setup mode, the device operates as follows. The
Выход блока 6 соединен со входом блока 7. Выход блока 7 соединен со входом блока 8. В блоке суммирования и контроля 13 подсчитывается сумма черных точек на изображении и эта сумма сравнивается с заданным значением. Если эти значения совпадают в пределах допустимой погрешности, изображение передается в блок 8. Если нет, результат сравнения с выхода блока 13 поступает на вход блока 14, в котором, в зависимости от знака результата, выбирается маска наращивания или удаления. Маска представляет собой трехточечный элемент (две черных точки и одна белая для наращивания и две белых и одна черная для удаления). В блоке 15 выбранная маска накладывается во всех точках изображения, поступающего с выхода блока 13, и в случае совпадения одна из соответствующих точек исходного изображения заменяется на противоположное значение (черная на белую при удалении, белая на черную при наращивании). После каждого этапа наращивания или удаления изображение с выхода блока 15 вновь поступает в блок 13 для суммирования и сравнения и т.д.The output of
Сформированные таким образом нормированные эталоны передаются в блок 3 хранения эталонов. После того, как все возможные эталоны будут сформированы, они поступают на вход блока 2 формирования весовых коэффициентов. В блоке 2 путем сравнения изображений эталонов строится поле различий с каждым эталоном, называемое полем семантической значимости.The standardized standards thus formed are transmitted to the standard storage unit 3. After all possible standards are formed, they are fed to the input of block 2 of the formation of weighting factors. In block 2, by comparing the images of the standards, a field of differences is constructed with each standard, called the field of semantic significance.
Для построения полей семантической значимости для каждого эталона в блоке формирования весовых коэффициентов 2 последовательно осуществляются следующие операции. В блоке 16 производится поэлементное сравнение исследуемого эталона со всеми остальными. На основе сравнения строится поле различий с каждым эталоном (фиг.4а), называемое полем семантической значимости. Это поле характеризует степень различия эталонов. Чем меньше область темного, тем больше эталоны "похожи" друг на друга, тем больше возможность ложного распознавания. Пример полей семантической значимости эталона цифры "2" при сравнении с эталонами цифр "3" и "4" приведен на фиг 4б.To construct fields of semantic significance for each standard in the block for the formation of weighting coefficients 2, the following operations are performed sequentially. In
Полученные в блоке 16 поля семантической значимости поступают в блок упорядочения полей семантической значимости 17, в котором каждому из них присваивается число ki, i=1, L (где L - число эталонов), равное площади (числу черных точек) темных областей. Поля располагаются в порядке возрастания чисел: k1≤k2≤...≤kL.The fields of semantic significance obtained in
Далее в блоке вычисления коэффициентов семантической значимости 18 для первого поля из ряда задается коэффициент q1, определяемый из условияFurther, in the block for calculating the coefficients of
где Q - заданное число, определяемое величиной порога принятия решений.where Q is a given number determined by the value of the decision threshold.
После этого в блоке формирования остаточных полей семантической значимости 19 из следующего поля (соответствующего k2) исключаются участки, которые оказались семантически значимыми на первом поле (фиг.4в). Сформированное остаточное поле семантической значимости по каналу обратной связи из блока 19 поступает в блок 18 и для оставшейся семантически значимой зоны вычисляется значение q2 из условия:After that, in the block of formation of residual fields of
Процедура вычисления коэффициентов qi, i=1, L в блоке 18 повторяется для каждого i-го эталона (до тех пор пока i≤L) по формуле:The procedure for calculating the coefficients q i , i = 1, L in
При реализации описанной процедуры весовые коэффициенты, соответствующие остающимся участкам поля семантической значимости каждого следующего эталона, формируются независимо от предыдущих. При этом при сравнении любых двух эталонных изображений, соответствующих разным символам, всегда получается число, равное Q или незначительно отличающееся от него вследствие помех или искажений символов. Это достигается в том числе за счет использования блока нормировки изображений 7.When implementing the described procedure, the weighting coefficients corresponding to the remaining sections of the field of semantic significance of each subsequent standard are formed independently of the previous ones. Moreover, when comparing any two reference images corresponding to different characters, you always get a number equal to Q or slightly different from it due to interference or distortion of the characters. This is achieved, among other things, by using the image normalization unit 7.
Поле весовых коэффициентов q1, q2...qL, соответствующее каждому эталону, сохраняется в блоке 4 памяти весовых коэффициентов.The field of weight coefficients q 1 , q 2 ... q L , corresponding to each standard, is stored in block 4 of the memory of weight coefficients.
В режиме распознавания предъявленное на вход 6 оптическое изображение преобразуется в блоке формирования изображений в бинарное. Далее в блоке 7 осуществляется нормировка изображения, обеспечивающая заданное относительное число черных точек (такое же, как и для эталонов). Нормированное изображение с выхода блока 7 поступает на вход блока 8 сравнения. На второй вход блока 8 сравнения из блока 3 памяти эталонов поступают сигналы нормированных эталонных изображений. В блоке сравнения поэлементно сравниваются точки эталона и входного изображения символа. В случае совпадения соответствующих точек изображений присваивается значение 0, в противном случае 1. Таким образом, на выходе блока сравнения 8 формируется поле, каждая точка которого отмечена 0 в случае совпадения и 1 в случае несовпадения точек входного изображения символа и эталона. Этот сигнал поступает на вход умножителя 9. Умножитель производит поэлементное умножение отсчетов входного поля на соответствующие коэффициенты, поступающие с блока 4 памяти весовых коэффициентов. Результаты умножения накапливаются в сумматоре 10. Далее в блоке 11 принимается решение.In the recognition mode, the optical image presented at
Процедура принятия решений состоит в следующем. Исследуемое изображение идентифицируется с тем эталоном, для которого накопленная в блоке 10 сумма минимальна и не превышает заданного порога. Если порог превышен для всех эталонов, происходит отказ от распознавания.The decision-making procedure is as follows. The image under study is identified with that standard for which the sum accumulated in block 10 is minimal and does not exceed a predetermined threshold. If the threshold is exceeded for all standards, recognition is rejected.
Качество распознавания регулируется величиной порога. Увеличение значения порога приводит к уменьшению числа отказов, при этом вероятность ошибки возрастает. Значение порога является одинаковым для всех эталонов. Это обеспечивается за счет вычисления весовых коэффициентов в блоке формирования весовых коэффициентов, как указано выше.The recognition quality is regulated by the threshold value. An increase in the threshold value leads to a decrease in the number of failures, while the probability of error increases. The threshold value is the same for all standards. This is achieved by calculating the weighting factors in the weighting unit, as described above.
Экспериментальные исследования заявляемого устройства для распознавания цифр показали, что по сравнению с устройством аналогичного назначения (прототип) заявляемое устройство обеспечивает более высокую надежность распознавания.Experimental studies of the inventive device for recognizing numbers showed that, in comparison with a device of a similar purpose (prototype), the inventive device provides higher recognition reliability.
Claims (1)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2005110802/09A RU2285952C1 (en) | 2005-04-13 | 2005-04-13 | Device for recognition of printed and hand-printed images of symbols |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2005110802/09A RU2285952C1 (en) | 2005-04-13 | 2005-04-13 | Device for recognition of printed and hand-printed images of symbols |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2285952C1 true RU2285952C1 (en) | 2006-10-20 |
Family
ID=37437986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2005110802/09A RU2285952C1 (en) | 2005-04-13 | 2005-04-13 | Device for recognition of printed and hand-printed images of symbols |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU2285952C1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2456544C2 (en) * | 2008-11-11 | 2012-07-20 | Государственное образовательное учреждение высшего профессионального образования "Московский государственный университет геодезии и картографии" (МИИГАиК) | Method of controlling bulkiness of equipment layout in tunnels and apparatus for realising said method |
-
2005
- 2005-04-13 RU RU2005110802/09A patent/RU2285952C1/en not_active IP Right Cessation
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2456544C2 (en) * | 2008-11-11 | 2012-07-20 | Государственное образовательное учреждение высшего профессионального образования "Московский государственный университет геодезии и картографии" (МИИГАиК) | Method of controlling bulkiness of equipment layout in tunnels and apparatus for realising said method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7801392B2 (en) | Image search system, image search method, and storage medium | |
CN105678292A (en) | Complex optical text sequence identification system based on convolution and recurrent neural network | |
CN105678300A (en) | Complex image and text sequence identification method | |
JPH05143707A (en) | Method and device for processing coded image data | |
CN111738169B (en) | Handwriting formula recognition method based on end-to-end network model | |
CN104008401A (en) | Method and device for image character recognition | |
JP2006053920A (en) | Character recognition program, method and device | |
Kunte et al. | An OCR system for printed Kannada text using two-stage Multi-network classification approach employing Wavelet features | |
RU2285952C1 (en) | Device for recognition of printed and hand-printed images of symbols | |
CN111242114B (en) | Character recognition method and device | |
WO2023078264A1 (en) | Method and apparatus for training business card information extraction system, and computer-readable storage medium | |
CN111553361A (en) | Pathological section label identification method | |
Choudhary et al. | Offline handwritten mathematical expression evaluator using convolutional neural network | |
CN113836941B (en) | Contract navigation method and device | |
CN112381149B (en) | Reasonable countermeasure analysis method for source camera identification based on deep learning | |
Kota et al. | Summarizing lecture videos by key handwritten content regions | |
JP4834693B2 (en) | Pattern recognition parameter learning device, pattern recognition device, and pattern recognition parameter learning method | |
CN111639649A (en) | Method and system for identifying and encoding numbered musical notation image based on real-time image stream | |
CN111523318A (en) | Chinese phrase analysis method, system, storage medium and electronic equipment | |
Mehta et al. | Optical music notes recognition for printed piano music score sheet | |
EP4089568A1 (en) | Cascade pooling for natural language document processing | |
CN113961674B (en) | Semantic matching method and device for key information and public company announcement text | |
KR100243220B1 (en) | Method for recognizing character to improve the matching speed | |
Yanagimoto et al. | Visual Question Answering Focusing on Object Positional Relation with Capsule Network | |
WO2023062799A1 (en) | Information processing system, manuscript type identification method, model generation method and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | The patent is invalid due to non-payment of fees |
Effective date: 20090414 |