RU2403617C2 - Способ автоматизированного распознавания идентификационного номера - Google Patents

Способ автоматизированного распознавания идентификационного номера Download PDF

Info

Publication number
RU2403617C2
RU2403617C2 RU2008144384/09A RU2008144384A RU2403617C2 RU 2403617 C2 RU2403617 C2 RU 2403617C2 RU 2008144384/09 A RU2008144384/09 A RU 2008144384/09A RU 2008144384 A RU2008144384 A RU 2008144384A RU 2403617 C2 RU2403617 C2 RU 2403617C2
Authority
RU
Russia
Prior art keywords
identification number
positions
font
characters
approximate
Prior art date
Application number
RU2008144384/09A
Other languages
English (en)
Other versions
RU2008144384A (ru
Inventor
Владимир Аминович Подгорнов (RU)
Владимир Аминович Подгорнов
Семен Владимирович Подгорнов (RU)
Семен Владимирович Подгорнов
Александр Николаевич Щербина (RU)
Александр Николаевич Щербина
Original Assignee
Федеральное государственное унитарное предприятие "Российский Федеральный Ядерный Центр - Всероссийский Научно-Исследовательский Институт Технической Физики имени академика Е.И. Забабахина" (ФГУП "РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина")
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Федеральное государственное унитарное предприятие "Российский Федеральный Ядерный Центр - Всероссийский Научно-Исследовательский Институт Технической Физики имени академика Е.И. Забабахина" (ФГУП "РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина") filed Critical Федеральное государственное унитарное предприятие "Российский Федеральный Ядерный Центр - Всероссийский Научно-Исследовательский Институт Технической Физики имени академика Е.И. Забабахина" (ФГУП "РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина")
Priority to RU2008144384/09A priority Critical patent/RU2403617C2/ru
Publication of RU2008144384A publication Critical patent/RU2008144384A/ru
Application granted granted Critical
Publication of RU2403617C2 publication Critical patent/RU2403617C2/ru

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

Изобретение относится к способам распознавания знаков с применением компьютерных средств и может быть использовано для автоматизированного определения поврежденных номеров отработанных тепловыделяющих сборок. Техническим результатом является повышение достоверности при распознавании поврежденных номеров с неизвестным заранее количеством и шрифтом используемых цифровых символов по их сохранившимся фрагментам. Для этого формируют исходное изображение предполагаемой области нахождения идентификационного номера, выделяют прямоугольную область его размещения, выявляют в ней зоны нахождения отдельных позиций номера, распознают символы на выявленных позициях. При этом предварительно сформированное исходное изображение очищают с помощью морфологического фильтра, определяют координаты приблизительных центров каждой позиции идентификационного номера в выявленных зонах их нахождения, определяют по сохранившимся фрагментам символов номера координаты каждой позиции и приблизительный параметр шрифта, использованного в процессе нанесения идентификационного номера, формируют первоначальный набор шаблонов символов с приблизительным шрифтом распознаваемого номера. В процессе распознавания символов осуществляют последовательное наложение шаблонов с изменяющимися параметрами шрифта символов на зоны нахождения позиций номера с циклическим смещением шаблонов относительно найденных приблизительных центров позиций и производят сравнительный анализ, в ходе которого для каждой позиции выявляют шаблон, имеющий максимальное значение коэффициента совпадения с фрагментами символа, находящегося на данной позиции. 4 з.п. ф-лы, 3 ил.

Description

Изобретение относится к способам распознавания знаков с применением компьютерных средств и может быть использовано для автоматизированного определения поврежденных номеров отработанных тепловыделяющих сборок.
Известен способ компьютерного распознавания объектов по патенту РФ № 2191431 от 03.12.99, МПК G06K 09/68, в соответствии с которым предварительно приводят изображение объекта, вводимое в компьютер, к нормальному, стандартному для данного способа виду путем изменения масштаба, поворота в требуемое положение, центрирования, вписания в прямоугольник требуемого размера, на экран монитора выводят изображение распознаваемого объекта, преобразованное в изображение, выполненное в градациях - различных степенях яркости одного цвета, например красного, и на него последовательно, поочередно накладывают изображения хранящихся в памяти компьютера шаблонов, выполненных, например, в градациях зеленого, что позволяет увидеть в зоне перекрытия изображений изображение другого, отличного от первых двух цвета, которое и фиксируют как распознанное в случае тождественных, идентичных, а значит имеющих одинаковый контур изображений распознаваемого объекта и шаблона. В принципе распознаваемым объектом может быть цифровой или буквенный символ.
Недостаток в трудности визуального распознавания объекта, особенно в том случае, когда объект претерпел значительные изменения по отношению к своему первоначальному виду, сохраняемому в памяти как один из шаблонов. Кроме того, в рассматриваемом способе геометрические характеристики рассматриваемого объекта стандартизированы, но в реальности данные параметры (например, вид шрифта и его высота) могут варьироваться.
Известен способ автоматического распознавания электронными средствами символов, таких как буквы и/или цифры, отпечатанных на любом материале, включающем структуры с сильной контрастностью (патент РФ № 2249251 от 20.06.2000, МПК G06K 09/80, 09/62). Этот способ включает в себя следующие этапы: отладка, формирование моделей символов, распознавание, регистрация модели фона вместе с фоном считанного изображения, выделение модели зарегистрированного фона из элементарного изображения фона, комбинирование для каждого положения символа модели букв и/или цифр с элементарным изображением соответствующего фона, создание комбинированных моделей, сопоставление неизвестных символов с комбинированными моделями, распознавание каждого неизвестного символа как соответствующего символа, комбинированная модель которого наилучшим образом накладывается на него в соответствии с технологией "сравнение с шаблоном".
Данный способ хорошо зарекомендовал себя в том случае, когда заранее известны исходные параметры комбинации символов, т.е. вид и размеры шрифта, количество символов, и нашел применение в распознавании номеров ценных бумаг, в частности денег. Однако распознавание становится крайне затруднительным, если речь идет об идентификационных номерах с неизвестными параметрами шрифта и фона.
В качестве прототипа выбран способ распознавания номерных знаков транспортных средств, описанный в статье с тем же названием, авторы: Иванов Г.А., Ларионов А.А., Панин Д.В., адрес в Интернете: www.http://zntu.edu.ua/cmis/foto/ivanov/ivan_lar_pan.doc.
Способ заключается в формировании исходного изображения предполагаемой области нахождения идентификационного номера, выделении прямоугольной области размещения идентификационного номера (номерной пластины), выявлении в выделенной области зон нахождения отдельных позиций идентификационного номера и распознавании символов на выявленных позициях номера. При этом распознавание отдельных символов осуществляется с помощью набора нейтронных сетей, организованных в два каскада.
Данный способ разработан для распознавания номерных знаков транспортных средств различных стран Европейского союза, которые, в основном, имеют стандартизированное написание с использованием буквенно-цифровых символов единого вида (шрифта).
Проблема заключается в том, что при распознавании номера, о котором неизвестно ни количество используемых символов, ни используемый шрифт, который к тому же наносился без особых требований к прямолинейности и межсимвольным расстояниям и претерпел значительные повреждения в агрессивных условиях эксплуатации, данный способ не дает требуемого результата.
Задачей данного изобретения является создание способа автоматизированного распознавания идентификационного номера, позволяющего обеспечить максимально возможную достоверность при распознавании поврежденных номеров с неизвестным заранее количеством и шрифтом используемых цифровых символов. Зачастую такие маркировки имеют лишь сохранившиеся фрагменты символов, по которым необходимо восстанавливать исходный символ.
Поставленная задача решается следующим образом.
В способе автоматизированного распознавания идентификационного номера, заключающемся в формировании исходного изображения предполагаемой области нахождения идентификационного номера, в выделении прямоугольной области размещения идентификационного номера, выявлении в выделенной прямоугольной области зон нахождения отдельных позиций идентификационного номера и распознавании символов на выявленных позициях номера, согласно изобретению предварительно сформированное исходное изображение очищают с помощью морфологического фильтра, а после выявления зон нахождения отдельных позиций идентификационного номера определяют по сохранившимся фрагментам символов координаты приблизительных центров каждой позиции и приблизительный параметр шрифта, использованного в процессе нанесения идентификационного номера, исходя из которого формируют первоначальный набор шаблонов символов с приблизительным шрифтом распознаваемого номера. Процесс распознавания символов на выявленных позициях номера производят путем последовательного наложения шаблонов с изменяющимися параметрами шрифта символов на зоны нахождения позиций номера с циклическим смещением шаблонов относительно найденных приблизительных центров позиций и сравнительного анализа, в ходе которого для каждой позиции идентификационного номера выявляют шаблон, имеющий максимальное значение коэффициента совпадения с фрагментами символа, находящегося на данной позиции.
Технический результат заключается в оптимизации процесса подгонки шаблонов к фрагментам символов идентификационного номера с неизвестными заранее параметрами. Подгонка осуществляется за счет изменения геометрических параметров шрифта шаблонов и прецизионного поиска оптимального места их расположения в зонах нахождения символов. При этом сам процесс подгонки существенно облегчается за счет предварительной очистки изображения идентификационного номера от фона, благодаря чему фрагменты символов становятся более выделенными. В результате обеспечивается достоверность распознавания посредством выбора тех шаблонов, с которыми происходит максимально возможное совпадение фрагментов символов по каждой позиции идентификационного номера.
Кроме того, в случае сомнительно распознанных позиций сравнительный анализ может включать эвристическую оценку, проводимую по характерным фрагментам символов, находящихся на данных позициях, что обеспечивает точность распознавания символов, незначительно отличающихся друг от друга.
Кроме того, в качестве приблизительного параметра шрифта идентификационного номера можно использовать характерную ширину символов, соответствующую ширине выявленных позиций. Параметр ширины символов является достаточно универсальным и подходит для всех видов шрифтов.
Кроме того, в процессе распознавания символов на выявленных позициях номера шрифт символов унифицированных шаблонов изменяют посредством уменьшения ширины шрифта, а также уменьшения отношения высоты шрифта к ширине, что увеличивает точность распознавания идентификационного номера, за счет точного совпадения шаблонов с фрагментами символов позиций номера.
Кроме того, при распознавании позиций номера поочередно используют позитивные и негативные шаблоны для каждого символа. Первый тип шаблонов содержит зоны, совпадающие с фрагментами символов, а второй тип шаблона содержит участки фона, не совпадающие с фрагментами символов. Благодаря этому увеличивается вероятность точного распознавания идентификационного номера, так как появляется возможность оценить соотношение между уровнем сигнала (яркости зон, где должны находиться сохранившиеся фрагменты символов) и фона (яркости зон, где не должны находиться фрагменты символов).
На фиг.1 показано исходное изображение предполагаемой области нахождения идентификационного номера.
На фиг.2 изображена прямоугольная область размещения идентификационного номера, выделенная на исходном очищенном изображении.
На фиг.3 представлен первоначальный набор шаблонов символов с приблизительным шрифтом распознаваемого номера.
Способ автоматизированного распознавания идентификационного номера включает в себя следующие этапы.
Вначале формируется исходное изображение предполагаемой области нахождения идентификационного номера (фиг.1). Затем данное изображение очищается морфологическим ориентирно-направленным фильтром, в результате чего частично устраняется искажающее влияние фона.
Из очищенного исходного изображения выделяется прямоугольная область размещения идентификационного номера (фиг.2). Границы области размещения номера могут определяться оператором или находиться либо по характерным реперам (например, краям лыски, на которую нанесен номер), либо по различию в освещенности символов и фона (символы светлее фона и наоборот).
После выявления области размещения номера производится поиск зон нахождения отдельных позиций идентификационного номера и определение по сохранившимся фрагментам символов координат приблизительных центров каждой позиции (фиг.2). С этой целью формируется вектор - строка AMrow, каждый j-й элемент которой содержит среднее арифметическое значение элементов j-ого вектор-столбца матрицы изображения области размещения идентификационного номера на отфильтрованном изображении:
Figure 00000002
где Nrow - количество строк в матрице
Figure 00000003
a Ncol - количество столбцов в
Figure 00000004
Из полученной вектор-строки AMrow формируется "сглаженная" вектор-строка
Figure 00000005
, каждый j-й элемент которой содержит среднее арифметическое диапазона значений [AMrow(j-Δ),AMrow(j+Δ)], при этом параметр Δ определяется заранее, исходя из средней степени поврежденности идентификационного номера. Далее, анализируя вектор
Figure 00000006
определяют координаты (X(k)) приблизительных центров каждой позиции номера, например, в результате поиска максимумов функции
Figure 00000007
(фиг.2). Координата Y может определяться как середина изображения
Figure 00000008
По сохранившимся фрагментам символов номера определяется приблизительный параметр шрифта, использованного в процессе нанесения идентификационного номера. В качестве приблизительного параметра шрифта может использоваться характерная ширина символов Wx, соответствующая ширине выявленных позиций (фиг.2). Ширина выявленных позиций определяется в результате анализа положительной части функции
Figure 00000009
Figure 00000010
где значение Δbg определяется заранее, исходя из средней степени поврежденности идентификационного номера.
Формируется первоначальный набор бинарных шаблонов символов с приблизительным шрифтом распознаваемого номера. Приблизительный шрифт соответствует найденной характерной ширине Wx символов, а его высота Wy пропорциональна ширине Wx. Кроме того, при распознавании позиций номера могут использоваться позитивные (первый ряд) и негативные (второй ряд) шаблоны для каждого символа, фиг.3. Темным цветом на шаблонах отмечены области, которым присвоены значения 1, а светлым - 0. Первый тип шаблонов содержит ненулевые области, совпадающие с фрагментами символов; а второй тип шаблона содержит ненулевые области, являющиеся участками фона, не совпадающего с фрагментами символов.
Проводится сравнительное распознавание символов на выявленных позициях номера. С этой целью последовательно на каждую позицию номера накладывают поочередно все шаблоны. Наложение происходит посредством поэлементного перемножения матрицы текущего t-ого шаблона
Figure 00000011
- позитивного,
Figure 00000012
- негативного) на матрицу
Figure 00000013
такого же размера, содержащую прямоугольный фрагмент изображения
Figure 00000014
причем центр данного фрагмента совпадает с координатами (X(k), Y) приблизительного центра текущей распознаваемой k-й позиции номера:
Figure 00000015
при
Figure 00000016
Figure 00000017
при
Figure 00000018
Для обеспечения большей точности совпадения шаблонов с фрагментами символов позиций номера матрицы
Figure 00000019
Figure 00000020
(т.е. шрифт символов шаблонов) могут пропорционально изменяться посредством уменьшения ширины Wx, а также отношения высоты Wy к ширине Wx; кроме того, при наложении шаблонов на позиции номера может осуществляться их незначительная циклическая, практически, прецизионная подвижка относительно друг друга, за счет соответствующего смещения центра матрицы
Figure 00000021
относительно текущих координат X(k), Y.
Далее для каждой полученной матрицы
Figure 00000022
Figure 00000023
вычисляется среднее арифметическое значение ее элементов: для позитивных шаблонов -
Figure 00000024
для негативных шаблонов -
Figure 00000025
После чего, для каждого сопоставления t-ого шаблона с k-й позицией идентификационного номера вычисляется значение коэффициента (k_ver(k,t)) совпадения шаблона с фрагментами символа позиции номера. Значение коэффициента k_ver(k,t) может быть вычислено, как соответствующая разность am_pos(k,t)-am_neg(k,t).
В итоге для каждой k-й позиции номера находится t-й шаблон символа, имеющий из соответствующего множества максимальное значение коэффициента k_ver.
Кроме того, для сомнительно распознанных позиций дополнительно проводят эвристическую оценку. Например, для позиций номера, распознанных как 3, по характерным фрагментам производят их сравнение с цифрой 5. Если позиция распознается как цифра 3, то ее сравнивают с цифрой 8. Если позиция распознается как цифра 5, то ее сравнивают с цифрой 6. В другой ситуации для позиций номера, распознанных как 8, по характерным фрагментам производят их сравнение с цифрой 6. Если позиция распознается как цифра 8, то ее сравнивают с цифрой 2 и т.д.
Для описанного алгоритма разработана компьютерная программа. Способ обеспечивает высокую точность дистанционного автоматического распознавания маркировочных номеров отработанных тепловыделяющих сборок и предназначен для использования в системах учета и контроля отработавших ядерных материалов в ядерной энергетике.

Claims (5)

1. Способ автоматизированного распознавания идентификационного номера, заключающийся в формировании исходного изображения предполагаемой области нахождения идентификационного номера, в выделении прямоугольной области размещения идентификационного номера, в выявлении в выделенной прямоугольной области зон нахождения отдельных позиций идентификационного номера и в распознавании символов на выявленных позициях номера, отличающийся тем, что предварительно сформированное исходное изображение очищают с помощью морфологического фильтра, а после выявления зон нахождения отдельных позиций идентификационного номера определяют по сохранившимся фрагментам символов номера координаты приблизительных центров каждой позиции и приблизительный параметр шрифта, использованного в процессе нанесения идентификационного номера, исходя из которого формируют первоначальный набор шаблонов символов с приблизительным шрифтом распознаваемого номера, при этом процесс распознавания символов на выявленных позициях номера производят путем последовательного наложения шаблонов с изменяющимися параметрами шрифта символов на зоны нахождения позиций номера с циклическим смещением шаблонов относительно найденных приблизительных центров позиций, и сравнительного анализа, в ходе которого для каждой позиции выявляют шаблон, имеющий максимальное значение коэффициента совпадения с фрагментами символа, находящегося на данной позиции.
2. Способ автоматизированного распознавания идентификационного номера по п.1, отличающийся тем, что в сравнительный анализ вводят эвристическую оценку сомнительно распознанных позиций, проводимую по характерным фрагментам символов, находящихся на данных позициях.
3. Способ автоматизированного распознавания идентификационного номера по п.1, отличающийся тем, что в качестве приблизительного параметра шрифта идентификационного номера используют характерную ширину символов, соответствующую ширине выявленных позиций.
4. Способ автоматизированного распознавания идентификационного номера по п.3, отличающийся тем, что в процессе распознавания символов на выявленных позициях номера шрифт символов шаблонов изменяют посредством уменьшения ширины шрифта и отношения высоты шрифта к ширине.
5. Способ автоматизированного распознавания идентификационного номера по п.1, отличающийся тем, что в процессе распознавания символов на выявленных позициях номера поочередно используют позитивные и негативные шаблоны символов.
RU2008144384/09A 2008-11-10 2008-11-10 Способ автоматизированного распознавания идентификационного номера RU2403617C2 (ru)

Priority Applications (1)

Application Number Priority Date Filing Date Title
RU2008144384/09A RU2403617C2 (ru) 2008-11-10 2008-11-10 Способ автоматизированного распознавания идентификационного номера

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2008144384/09A RU2403617C2 (ru) 2008-11-10 2008-11-10 Способ автоматизированного распознавания идентификационного номера

Publications (2)

Publication Number Publication Date
RU2008144384A RU2008144384A (ru) 2010-05-20
RU2403617C2 true RU2403617C2 (ru) 2010-11-10

Family

ID=42675634

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008144384/09A RU2403617C2 (ru) 2008-11-10 2008-11-10 Способ автоматизированного распознавания идентификационного номера

Country Status (1)

Country Link
RU (1) RU2403617C2 (ru)

Also Published As

Publication number Publication date
RU2008144384A (ru) 2010-05-20

Similar Documents

Publication Publication Date Title
CN110909732B (zh) 一种图中数据的自动提取方法
Agbemenu et al. An automatic number plate recognition system using opencv and tesseract ocr engine
CN105913093B (zh) 一种用于文字识别处理的模板匹配方法
EP2897082B1 (en) Methods and systems for improved license plate signature matching
CN109426814B (zh) 一种发票图片特定板块的定位、识别方法、系统、设备
TWI455034B (zh) 條碼辨識方法及其電腦程式產品
CN102704215B (zh) 基于dst文件解析与机器视觉结合的绣布自动切割方法
Garz et al. Layout analysis for historical manuscripts using sift features
CN104680161A (zh) 一种身份证数字识别方法
TWI608422B (zh) Optical character recognition device, optical character recognition method, and recording medium
CN110413824A (zh) 一种相似图片的检索方法及装置
US7564587B2 (en) Method of scoring a printed form having targets to be marked
CA2815591C (en) Method for detecting and recognising an object in an image, and an apparatus and a computer program therefor
CN111382658B (zh) 一种基于图像灰度梯度一致性的自然环境下道路交通标志检测方法
CN111222507B (zh) 数字式仪表读数的自动识别方法、计算机可读存储介质
CN106326887A (zh) 一种光学字符识别结果的校验方法及装置
EP1791089A2 (en) Method and apparatus for the graphical operation of real-time image processing systems
US9953238B2 (en) Image processing method and system for extracting distorted circular image elements
CN111460198B (zh) 一种图片时间戳的审核方法及装置
RU2403617C2 (ru) Способ автоматизированного распознавания идентификационного номера
CN107527423A (zh) 纸币防伪识别方法及纸币识别装置
WO2010113217A1 (ja) 文字認識装置及び文字認識方法
Deb et al. Automatic vehicle identification by plate recognition for intelligent transportation system applications
CN102682308B (zh) 图像处理方法和图像处理设备
Moreno et al. A Static Images Based-System for Traffic Signs Detection.