RU161580U1 - Система распознавания изображений символов на основе обучающей выборки - Google Patents
Система распознавания изображений символов на основе обучающей выборки Download PDFInfo
- Publication number
- RU161580U1 RU161580U1 RU2015148233/08U RU2015148233U RU161580U1 RU 161580 U1 RU161580 U1 RU 161580U1 RU 2015148233/08 U RU2015148233/08 U RU 2015148233/08U RU 2015148233 U RU2015148233 U RU 2015148233U RU 161580 U1 RU161580 U1 RU 161580U1
- Authority
- RU
- Russia
- Prior art keywords
- module
- symbol
- output
- images
- input
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/192—Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
- G06V30/194—References adjustable by an adaptive method, e.g. learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Character Discrimination (AREA)
Abstract
Система распознавания изображений символов на основе обучающей выборки, содержащая модуль приема кодового описания изображений символов, информационный вход которого соединен с информационным выходом модуля позиционирования изображения символов, синхронизирующий выход которого подключен к синхронизирующему входу модуля приема кодового описания изображений символов, модуль синхронизации процесса распознавания изображений символов, тактирующий вход которого соединен с синхронизирующим выходом модуля позиционирования изображения символов, модуль хранения эталонных изображений символов, информационный выход которого является информационным выходом системы, предназначенным для выдачи эталонных изображений распознаваемых символов, регистр адреса, выход которого подключен к адресному входу модуля хранения эталонных изображений символов, отличающаяся тем, что система содержит модуль хранения адресов записей эталонных изображений символов, информационный выход которого соединен с информационным входом регистра адреса, модуль дешифрации кодового описания изображений символов, информационный вход которого подключен к информационному выходу модуля приема кодового описания изображений символов, модули селекции адресов эталонных изображений символов, управляющие входы групп которых соединены с соответствующими управляющими выходами групп модуля дешифрации кодового описания изображений символов, а выходы модулей селекции адресов эталонных изображений символов подключены к соответствующим входам модуля хранения адресов записей эталонных изображений символов, при этом первый выход мо
Description
Полезная модель относится к области автоматики и вычислительной техники, в частности, к системе распознавания изображений символов на основе обучающей выборки.
Системы оптического распознавания текстов, преобразующие графический образ документа в текстовый формат, используют в своей работе различные методы и алгоритмы, такие как бинаризация, сегментация (поиск текстовых блоков, таблиц, иллюстраций и иных объектов), распознавание текстовых строк и полей таблиц, адаптацию к особенностям шрифтов документа, лингвистические средства и т.п.
Многие из них базируются на алгоритмах распознавания образов отдельных символов, которые оперируют либо представлением образа символа в виде набора признаков, либо оригинальным отсканированным образом.
Предельные характеристики качества распознавания, распознающих набор признаков, определяются не только свойствами собственно алгоритма, но также искажениями сигнала и возможностями представления образа символа.
Вместе с тем, по-прежнему, остаются нерешенными вопросы определения возможности распознавания символов, использующих оригинальные образы, насколько могут отличаться образы отсканированных символов от их идеальных прототипов, а также, насколько могут различаться экземпляры одной буквы.
Известны технические решения, которые могли бы быть использованы для решения поставленной задачи (1,2).
Первое из известных технических решений содержит блок представления эталонов символов, блок формирования циклов наложения образов, первый селектор признаков наложения, первый селектор ошибок наложения, второй селектор ошибок наложения, второй селектор признаков наложения, блок измерения параметров наложения, блок 8 задания сдвигов символов, блок 9 идентификации символов (1).
Существенный недостаток данного технического решения состоит в низкой надежности распознавания символов текстовых документов, поступающих с выхода мобильного устройства, например, смартфона, поскольку в этом случае отсутствует какая-либо нормализация положения символов.
Известно и другое техническое решение, содержащее многоканальный коммутатор, аналого-цифровой преобразователь, блок памяти коэффициентов ассоциативности признаков, блок логических элементов И, блок сдвиговых регистров, блок управления, регистр кодов признаков, блок памяти кодов признаков, дешифратор кодов признаков, блок памяти результата (2).
Последнее из перечисленных выше технических решений наиболее близко к описываемому.
Недостаток этого технического решения заключается в его невысоком быстродействии, обусловленном тем, что для принятия решения об отнесении предъявленного графического символа к его эталонному образу требуются временные затраты на последовательный анализ всех признаков кодового описания изображения образа.
Цель полезной модели - повышение быстродействия системы путем исключения необходимости затраты времени на анализ отдельных признаков кодового описания изображения символов.
Поставленная цель достигается тем, что в систему, содержащую модуль приема кодового описания изображений символов, информационный вход которого соединен с информационным выходом модуля позиционирования изображения символов, синхронизирующий выход которого подключен к синхронизирующему входу модуля приема кодового описания изображений символов, модуль синхронизации процесса распознавания изображений символов, тактирующий вход которого соединен с синхронизирующим выходом модуля позиционирования изображения символов, модуль хранения эталонных изображений символов, информационный выход которого является информационным выходом системы, предназначенным для выдачи эталонных изображений распознаваемых символов, регистр адреса, выход которого подключен к адресному входу модуля хранения эталонных изображений символов, введены модуль хранения адресов записей эталонных изображений символов, информационный выход которого соединен с информационным входом регистра адреса, модуль дешифрации кодового описания изображений символов, информационный вход которого подключен к информационному выходу модуля приема кодового описания изображений символов, модули селекции адресов эталонных изображений символов, управляющие входы групп которых соединены с соответствующими управляющими выходами групп модуля дешифрации кодового описания изображений символов, а выходы модулей селекции адресов эталонных изображений символов подключены к соответствующим входам модуля хранения адресов записей эталонных изображений символов, при этом первый выход модуля синхронизации процесса распознавания изображений символов соединен с синхронизирующими входами модулей селекции адресов эталонных изображений символов, второй выход модуля синхронизации процесса распознавания изображений символов подключен к синхронизирующему входу регистра адреса, третий выход модуля синхронизации процесса распознавания изображений символов соединен с входом считывания модуля хранения эталонных изображений символов, а четвертый выход модуля синхронизации процесса распознавания изображений символов является синхронизирующим выходом системы, предназначенным для выдачи сигналов об окончании процедуры распознавания изображения очередного символа.
Сущность изобретения поясняется чертежами, где на фиг. 1 представлена структурная схема системы, на фиг. 2 приведен пример конкретного конструктивного выполнения модуля синхронизации процесса распознавания изображений символов, на фиг. З приведен пример конкретного конструктивного выполнения модулей селекции адресов эталонных изображений символов, на фиг. 4 приведен пример получения кодового описания изображения символов.
Система (фиг. 1) содержит модуль 1 позиционирования изображения символов, модуль 2 приема кодового описания изображений символов, модуль 3 дешифрации кодового описания изображений символов, модуль 4 синхронизации процесса распознавания изображений символов, модули 5, 6, 7 селекции адресов эталонных изображений символов, модуль 8 хранения адресов записей эталонных изображений символов, регистр 9 адреса и модуль 10 хранения эталонных изображений символов. На чертеже показаны информационный Ни синхронизирующий 12 выходы системы.
Модуль 1 (фиг. 1) позиционирования изображения символов выполнен в виде фотокамеры смартфона, имеющей информационный 15 и синхронизирующий 16 выходы.
Модуль 2 (фиг. 1) приема кодового описания изображений символов выполнен в виде регистра, имеющего информационный 17 синхронизирующий 18 входы, а также информационный выход 19.
Модуль 3 (фиг. 1) дешифрации кодового описания изображений символов выполнен в виде дешифратора, имеющего информационный 20 вход, и первую 26-28, вторую 29-31, и третью 32-34 группы информационных выходов модуля.
Модуль 4 (фиг. 2) синхронизации процесса распознавания изображений символов содержит первый 60, второй 61, третий 62 и четвертый 63 элементы 62 задержки. На чертеже показаны синхронизирующий 21 вход, а также первый 22, второй 23, третий 24 и четвертый 25 синхронизирующие выходы.
Модули 5, 6, 7 (фиг. 3) селекции адресов эталонных изображений символов выполнены идентично и содержат элементы 65-67 И, элемент 68 ИЛИ. На чертеже показаны первый управляющий 35 (39, 43), второй управляющий 36 (40, 44), третий управляющий 37 (41, 45) и синхронизирующий 38 (42, 46) входы, а также синхронизирующий выход 47 (48,49).
Модуль 8 (фиг. 1) хранения адресов записей эталонных изображений символов выполнен в виде постоянного запоминающего устройства, имеющего входы 50, 51, 52, а также выход 55.
Модуль 10 (фиг. 1) хранения эталонных изображений символов выполнен в виде оперативного запоминающего устройства, имеющего адресный вход 58, вход 59 управления считыванием данных, и информационный выход 11, являющийся информационным выходом системы.
Система работает следующим образом.
Пусть существует конечное множество графических образов, которые нужно распознать, и соответствующие им двоичные коды желаемых выходов (идентификаторов). В совокупности будет получено обучающее множество, в котором каждому графическому образу соответствует двоичный идентификатор. Спроецируем каждый образ на вход модуля 1 (фиг. 4) и сопоставим ему двоичный код - это код графического символа.
Изображение символа сканируется фотокамерой смартфона модуля 1, основным узлом которой является ПЗС - матрица, которая исполняет роль светочувствительного слоя фотоматериала. Элементы ПЗС - матрицы имеют размер в несколько микрон и расположены в определенном порядке на полупроводниковой пластине.
При экспозиции каждый ПЗС - элемент электрически заряжается пропорционально количеству попавшего на него света. После этого заряды записываются на носитель памяти в виде цифровой последовательности, содержащей информацию о цвете и яркости каждой точки изображения.
При открытом затворе фотографируемое изображение посредством системы линз фокусируется на ПЗС - матрицу. Какие-то сенсоры фиксируют очень яркие фрагменты лица, а какие-то - тени, все же остальные запоминают полутона. Каждый элемент матрицы преобразует падающий свет в электрический сигнал. Когда же затвор закрывается, и выдержка полностью отработана, матрица «вспоминает» первоначальную картину распределения света.
Сенсоры в более светлой области имеют более высокий заряд, чем сенсоры в мало освещенной области. Затем эти различные по силе заряды преобразуются в цифровые выражения, которые, в свою очередь, служат для воссоздания первоначального изображения.
ПЗС - матрицы обеспечивают непрерывный поток импульсов на своем выходе, при этом перекрытие оптического тракта не происходит.Чтобы при этом не происходило «смазывание» изображения, используются ПЗС- матрицы с буферизацией столбцов (interline CCD - matrix).
В таких сенсорах рядом с каждым столбцом (который представляет собой последовательный регистр сдвига) располагается буферный столбец (тоже последовательный регистр сдвига), состоящий из ПЗС - элементов, покрытых непрозрачными полосками (чаще металлическими). Совокупность буферных столбцов составляет буферный параллельный регистр, причем столбцы данного регистра «перемешаны» с регистрирующими свет столбцами.
За один рабочий цикл светочувствительный параллельный регистр сдвига отдает все свои фототоки буферному параллельному регистру посредством «сдвига по горизонтали» зарядов, после чего светочувствительная часть снова готова к экспонированию. Затем идет построчный «сдвиг по вертикали» зарядов буферного параллельного регистра, нижняя строка которого является входом последовательного регистра сдвига матрицы.
Очевидно, что перенос заряда матрицы в буферный параллельный регистр сдвига занимает малый интервал времени и перекрывать световой поток механическим затвором нет необходимости - ямы не успеют переполниться.
С другой стороны, необходимое время экспонирования, как правило, сравнимо со временем считывания всего буферного параллельного регистра. За счет этого интервал между экспонированием можно довести до минимума - в результате видеосигнал в современных видеокамерах формируется с частотой от 30 кадров в секунду и выше.
Указанная информация о яркости каждой точки изображения символа через информационный вход 17 модуля 2 поступает на информационный вход регистра модуля 2 и заносится в него синхронизирующим импульсом, поступающим с выхода 16 модуля 1 на синхронизирующие вход 18 модуля 2.
В результате этого в регистре модуля 2 будет зафиксировано кодовое описание графического изображения символа, подлежащего распознаванию, как, например, на фиг. 4 - показан символ А. Данное кодовое описание символа, подлежащего распознаванию, поступает на вход модуля 3, который расшифровывает входной код и вырабатывает высокий потенциал на одном из своих выходов, соответствующего символу А, например, на выходе 26 модуля 3.
Каждая группа выходов модуля 3 соответствует одному из символов, подлежащих распознаванию. Например, графическому изображению символа буквы А соответствуют выходы 26-28, графическому изображению символа буквы Б соответствуют выходы 29-31, и т.д. Последнее обстоятельство обусловлено тем, что в процессе обучения системы распознавания в обучающей выборке системе предъявляются различные графические изображения одного и того же символа, в том числе, и искаженные графические изображения различными помехами. При этом для каждого из графических изображений символов из обучающей выборки модуль 3 имеет соответствующий выход одной из групп 26-28, 29-31, 32-34.
Модуль 3 по кодовому описанию графического символа, поступающего на его вход 20, вырабатывает на одном из своих выходов, например, выходе 26, высокий потенциал, который через вход 35 модуля 5 открывает по одному входу элемент 65 И. На другой вход элемента 65 И с входа 38 модуля 5 поступает синхронизирующий импульс с выхода 22 модуля 4.
Синхронизирующий импульс с входа 38 проходит через элемент 65 И, затем проходит элемент 68 ИЛИ, и с выхода 47 модуля 5 поступает на вход 50 фиксированной ячейки памяти модуля 8, в которой находится код адреса записи эталонного изображения символа, например, символа буквы А, и считывает код адреса записи эталонного изображения символа с выхода 55 модуля 8 на информационный вход 56 регистра 9, куда он заносится синхронизирующим импульсом, поступающим на вход 57 регистра 9 с выхода 23 модуля 4.
С выхода регистра 9 адрес записи эталонного изображения символа поступает на адресный вход 58 модуля 10 памяти, на вход считывания которого с выхода 24 поступает синхронизирующий импульс. В результате на выход 11 модуля 10 будет считано эталонное изображение символа, графический образ которого был предъявлен для распознавания.
Таким образом, введение новых модулей и новых конструктивных связей позволило существенно повысить быстродействие системы путем исключения необходимости затраты времени на анализ отдельных признаков кодового описания изображения символов.
Источники информации, принятые во внимание при составлении описания заявки:
1. Патент РФ №63 571,29.11.2006
2. Патент РФ №2535182, 28.01.2014 (прототип).
Claims (1)
- Система распознавания изображений символов на основе обучающей выборки, содержащая модуль приема кодового описания изображений символов, информационный вход которого соединен с информационным выходом модуля позиционирования изображения символов, синхронизирующий выход которого подключен к синхронизирующему входу модуля приема кодового описания изображений символов, модуль синхронизации процесса распознавания изображений символов, тактирующий вход которого соединен с синхронизирующим выходом модуля позиционирования изображения символов, модуль хранения эталонных изображений символов, информационный выход которого является информационным выходом системы, предназначенным для выдачи эталонных изображений распознаваемых символов, регистр адреса, выход которого подключен к адресному входу модуля хранения эталонных изображений символов, отличающаяся тем, что система содержит модуль хранения адресов записей эталонных изображений символов, информационный выход которого соединен с информационным входом регистра адреса, модуль дешифрации кодового описания изображений символов, информационный вход которого подключен к информационному выходу модуля приема кодового описания изображений символов, модули селекции адресов эталонных изображений символов, управляющие входы групп которых соединены с соответствующими управляющими выходами групп модуля дешифрации кодового описания изображений символов, а выходы модулей селекции адресов эталонных изображений символов подключены к соответствующим входам модуля хранения адресов записей эталонных изображений символов, при этом первый выход модуля синхронизации процесса распознавания изображений символов соединен с синхронизирующими входами модулей селекции адресов эталонных изображений символов, второй выход модуля синхронизации процесса распознавания изображений символов подключен к синхронизирующему входу регистра адреса, третий выход модуля синхронизации процесса распознавания изображений символов соединен с входом считывания модуля хранения эталонных изображений символов, а четвертый выход модуля синхронизации процесса распознавания изображений символов является синхронизирующим выходом системы, предназначенным для выдачи сигналов об окончании процедуры распознавания изображения символа.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2015148233/08U RU161580U1 (ru) | 2015-11-10 | 2015-11-10 | Система распознавания изображений символов на основе обучающей выборки |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2015148233/08U RU161580U1 (ru) | 2015-11-10 | 2015-11-10 | Система распознавания изображений символов на основе обучающей выборки |
Publications (1)
Publication Number | Publication Date |
---|---|
RU161580U1 true RU161580U1 (ru) | 2016-04-27 |
Family
ID=55859624
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015148233/08U RU161580U1 (ru) | 2015-11-10 | 2015-11-10 | Система распознавания изображений символов на основе обучающей выборки |
Country Status (1)
Country | Link |
---|---|
RU (1) | RU161580U1 (ru) |
-
2015
- 2015-11-10 RU RU2015148233/08U patent/RU161580U1/ru active IP Right Revival
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101334578B (zh) | 图像拍摄装置以及图像拍摄方法 | |
CN102739942B (zh) | 数字图像拍摄设备及其控制方法 | |
US10419661B2 (en) | Shooting method and shooting device | |
CN101836150B (zh) | 摄像设备 | |
CN103491310B (zh) | 图像捕获装置及其控制方法 | |
CN102907085B (zh) | 拍摄装置 | |
TW201410020A (zh) | 用於減少互補式金屬氧化物半導體影像感測器之類比影像資料中之雜訊之方法及裝置 | |
CN104767938A (zh) | 一种拍摄图片的方法及装置 | |
JP6198389B2 (ja) | 画像処理装置、画像処理方法、及びコンピュータプログラム | |
CN102263895A (zh) | 成像系统、成像设备、可换镜头、控制方法和程序 | |
CN103581551A (zh) | 用于拍摄图像的装置和方法 | |
CN105993164A (zh) | 固态图像传感器、电子设备和自动聚焦方法 | |
CN102547130B (zh) | 影像拍摄装置及其影像拍摄方法 | |
CN108881876A (zh) | 对图像进行白平衡处理的方法、装置和电子设备 | |
CN103595922A (zh) | 一种基于电子快门曝光编码的成像方法 | |
CN103795927A (zh) | 一种拍照方法及系统 | |
JP2018125730A (ja) | 撮像装置およびその制御方法 | |
US11159725B2 (en) | Image processing apparatus, image processing method, and recording medium | |
RU161580U1 (ru) | Система распознавания изображений символов на основе обучающей выборки | |
CN105847658A (zh) | 一种多点对焦方法、装置及智能终端 | |
US20180249073A1 (en) | Image photographing apparatus and image photographing method | |
RU159733U1 (ru) | Система распознавания документов в видеопоследовательности | |
JP2016134907A (ja) | 固体撮像装置 | |
JP6955308B2 (ja) | 撮像素子、撮像装置、撮像方法及びプログラム | |
JP2021145175A (ja) | センサ制御装置、プログラムおよびセンサ制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM9K | Utility model has become invalid (non-payment of fees) |
Effective date: 20181111 |
|
NF9K | Utility model reinstated |
Effective date: 20191223 |