UA70933C2 - Автоматичне розпізнавання символів на структурованому фоні за допомогою комбінування моделей фону і символів - Google Patents

Автоматичне розпізнавання символів на структурованому фоні за допомогою комбінування моделей фону і символів Download PDF

Info

Publication number
UA70933C2
UA70933C2 UA2000063568A UA200063568A UA70933C2 UA 70933 C2 UA70933 C2 UA 70933C2 UA 2000063568 A UA2000063568 A UA 2000063568A UA 200063568 A UA200063568 A UA 200063568A UA 70933 C2 UA70933 C2 UA 70933C2
Authority
UA
Ukraine
Prior art keywords
background
symbol
image
symbols
model
Prior art date
Application number
UA2000063568A
Other languages
English (en)
Russian (ru)
Inventor
Луіджи Стрінга
Original Assignee
Де Ла Рю Жиорі С.А.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Де Ла Рю Жиорі С.А. filed Critical Де Ла Рю Жиорі С.А.
Publication of UA70933C2 publication Critical patent/UA70933C2/uk

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background

Abstract

Винахід стосується способу забезпечення за допомогою електронних засобів автоматичного розпізнавання символів навіть в тому випадку, коли вони друковані в положенні, що змінюється на вельми контрастному структурованому малюнку фону. Спосіб полягає в формуванні передусім моделі фону, що отримується шляхом прочитання з використанням електронної камери зображень декількох зразків, на яких є тільки малюнок фону. Потім формують моделі підлягаючих розпізнаванню символів (наприклад, букв і цифр) або шляхом прочитання зображень набору символів, друкованих на білому фоні, або з використанням інформаційних комп'ютерних файлів, що є у вільному продажу і які містять символи вибраних шрифтів. У процесі розпізнавання передусім вимірюють положення кожного з тих, що підлягають розпізнаванню символів по відношенню до положення відбитка малюнка фону. Потім кожний підлягаючий розпізнаванню символ співставляється з моделями, отриманими шляхом комбінування моделей символів з моделлю фону в тому ж самому відносному положенні невідомого символу. Розпізнавання символу разом з фоном здійснюється, таким чином, шляхом співставлення з моделями символів, комбінованими з тим же самим фоном в тому ж самому положенні, з використанням будь-якої відомої технології розпізнавання.

Description

Опис винаходу
Винахід, що пропонується стосується способу автоматичного розпізнавання символів, друкованих на 2 будь-якому придатному для цього матеріалі, навіть в тому випадку, коли фон має вельми контрастні структури, внаслідок чого сильно інтерферуючими зі структурою друкованих символів.
Переважна більшість відомих систем розпізнавання символів підходить до розв'язання цієї проблеми, намагаючись відокремити символи від фону за допомогою використання системи порогових значень, часто вельми хитромудрої і складної.
На жаль, така технологія не призводить до успіху в тих випадках, коли контраст структур фону є вельми значним, особливо якщо положення символів є змінним по відношенню до згаданих структур. Як наслідок, зображення символів в ряді випадків містять частину знаків фону (тих, які перевищують рівень відповідного порогового значення) або іноді ці зображення не є повними, оскільки частина структури символів не перевищує відповідного порогового значення. 12 Це, зокрема, стосується випадку контролю банківських білетів, на яких друк номерів серії здійснюється в процесі фази, окремої (звичайно подальшої) від фази друку іншого зображення, і звичайно з використанням іншого друкарського обладнання. Таким чином, реєстрація не може бути цілюом довершеною і, отже, номери серії "ворушаться" по відношенню до фону.
Це означає, що якщо ці номери друковані на структурованій зоні даного банківського білету, тобто на зоні, що містить який-небудь малюнок, то вони "ворушаться" або можуть бути зміщені довільним чином по відношенню до структури (до малюнка) фону. У доповнення до сказаного вище в згаданих випадках навіть пошук і сегментація символів можуть не призвести до успіху внаслідок наявності специфічних структур фону.
Дійсно, навіть з урахуванням величезної кількості варіацій процес виділення і розпізнавання символів практично завжди проходить через наступні етапи, під час яких здійснюють с 29 - прочитання зображень документа і, особливо, об'єкта, що містить підлягаючі розпізнаванню символи. Ге)
Прочитання цих зображень забезпечується за допомогою електронної камери, після чого ці зображення звичайно зазнають обробки з метою підвищення контрасту і зниження перешкод; - пошук на зображенні (тепер вже електронному) положення символів, що підлягають розпізнаванню. Цей пошук часто грунтується на аналізі різких змін освітленості (типу переходу від білого до чорного) і, зокрема, о 30 просторового розподілу цих переходів; со - сегментацію ідентифікованої зони на дільниці, кожна з яких містить тільки один символ. Ця сегментація здійснюється, наприклад, шляхом аналізу проекції щільності чорного на сегмент, паралельний основі лінії о символів: мінімальні значення цієї щільності піддаються кореляції з білим простором між символами; Га») - кожний ізольований таким чином символ зіставляють з прототипами (моделями) всіх букв і/або всіх цифр, 39 або з точки зору міри їх збігу (технології, відомі під англійською назвою "етріафе таїспіпд"), або з точки в зору послідовності характерних структур, таких, наприклад, як вертикальні лінії, горизонтальні лінії, похилі лінії і т.п. (технології, відомі під назвою "еайшгез ехігасіоп" або структурний аналіз).
У будь-якому випадку очевидно, що якщо частина зображення, що сегментована як символ, містить « структури, сторонні по відношенню до форми самого цього символу (наприклад, лінії, що належать структурі З 70 фону), небезпека неспроможності або невдачі порівняння із згаданими прототипами виявляється вельми с високою. Ця небезпека також може бути зумовлена втратою відмітних частин структури даного символу з
Із» подальшим різким пороговим переходом в фазі відділення цього символу від фону.
Саме тому попередні підходи до розв'язання проблеми автоматичного розпізнавання символів, друкованих на сильно структурованих фонах, що мають високу контрастність, не є цілюом задовільними. 45 Відповідно до винаходу, що пропонується об'єкти, на яких друкуються підлягаючі розпізнаванню символи, 7 зазнають оптичного аналізу за допомогою добре відомих оптоелектроиних засобів, таких, наприклад, як камера ав | типу ССО (лінійна або матрична, чорно-біла або кольорова) з бажаною роздільною здатністю, для формування електронних зображень символів, що підлягають розпізнаванню. о У подальшому викладі буде використаний термін "зображення" в значенні електронного зображення, со 20 зокрема, дискретної системи величин світлової насиченості, звичайно організованої у вигляді прямокутної матриці. Кожний елемент цієї матриці, або так званий піксель, являє собою міру інтенсивності світла, с» відображеного відповідною частиною об'єкта. Для кольорових зображень їх загальний опис складається з трьох матриць, які відповідають складовим червоного, зеленого і синього кольорів для кожного елемента зображення або пікселя. Для спрощення викладу подальший опис стосується випадку чорно-білого зображення. При цьому розширення для кольорового зображення здійснюється шляхом повторення тих же самих операцій для трьох
ГФ) матриць.
В основу винаходу, що пропонується встановлена задача реалізації автоматичного розпізнавання на о електронних зображеннях символів, друкованих на сильно структурованому фоні, контрастність якого навіть може бути порівнянна з контрастністю структур самих цих символів (як це показано на прикладі, 60 проілюстрованому на фіг.І/4с).
Перший крок способу відповідно до винаходу, що пропонується складається в формуванні моделі фону, яка може бути отримана шляхом прочитання зображень одного або декількох зразків, на яких представлений тільки малюнок фону без жодних символів (як це показано на прикладі, проїілюстрованому на фіг.1/46).
Як таку модель можна використати, зокрема, середнє арифметичне зображення згаданих зразків. При цьому бо у разі чорно-білих зображень буде отримана одна єдина матриця цих усереднених зображень, тоді як у разі кольорових зображень цих матриць усереднених зображень буде три, наприклад, матриці червоного, зеленого і синього кольорів.
Потім формують моделі підлягаючих розпізнаванню символів (наприклад, букв і/або цифр), або шляхом прочитання зображень системи цих символів, друкованих на білому фоні, або шляхом безпосереднього використання електронних зображень з інформаційних комп'ютерних файлів, які в цей час мають комерційне поширення для більшості шрифтів. У першому випадку можна сформувати модель кожного підлягаючого розпізнаванню символу у вигляді усередненого зображення з деякого числа примірників одного і того ж символу, друкованого на білому фоні. 70 Після того, як сформовані моделі всіх символів і модель фону, перша фаза даного способу, яку можна назвати "фазою відладки", завершується.
У процесі здійснення подальшої фази розпізнавання символів виконуються дії у відповідності до наступних етапів: - здійснюють прочитання зображення підлягаючого розпізнаванню зразка, що містить невідомі символи, /5 друковані на певному фоні в положеннях, які також є невідомими (приклад проілюстрований на фіг.П/4-а); - реєстрація моделі фону разом з прочитаним зображенням за допомогою будь-якої з відомих технологій реєстрації зображень, наприклад, з використанням методу максимальної кореляції; - віднімання зареєстрованої моделі фону з прочитаного зображення. Отримане таким чином різницеве зображення, де фон буде практично повністю усунений, дуже чітко виявляє положення символів (приклад різницевого зображення, яке являє собою прочитане зображення мінус зареєстрована модель фону, показаний на фіг.П/4-6); - пошук положення кожного з символів на різницевому зображенні. Ця операція здійснюється за допомогою будь-якої з відомих технологій локалізації і сегментації символів, наприклад, шляхом аналізу різких переходів насиченості типу переходу від чорного до білого. Таким чином, для кожного положення символу буде виділене с ов елементарне зображення, розміри якого співпадають з розмірами моделей символів (на фіг.П/4б показані приклади елементарних зображень сегментованих символів); і) - виділення зареєстрованої моделі фону з елементарного зображення фону, яке відповідає кожному невідомому символу; - комбінування, для кожного з положень символів, моделей символів з відповідним елементарним со зо зображенням моделі фону (див. фіг.ПШ/4-3). Оскільки модель фону була зареєстрована разом з фоном зображення, що містить підлягаючі розпізнаванню символи, в елементарних зображеннях, що поєднують модель і, фону з моделлю цифр і/або букв, відносне положення символ-фон виявляється тим же самим, що і в невідомому Ге! зображенні. Таким чином, в синтезі для кожного положення символу будуть створені нові прототипи (комбіновані моделі) символів (букв і/або цифр) з тим же самим фоном, що і в невідомому зображенні. Одна з розроблених о технологій комбінування буде описана в розділі "Опис декількох переважних варіантів". Однак, тут може бути ї- використаний і будь-який з методів, запропонованих іншими авторами; - зіставлення кожного з невідомих символів з усіма моделями, комбінованими на попередніх етапах.
Розпізнавання символу з фоном здійснюється, таким чином, шляхом зіставлення з моделями символів з тим же самим фоном і в тому ж самому положенні. Тут можна використати будь-які відомі технології розпізнавання, «
Наприклад, метод "Четріаге таїспіпд" або "еайшгез ехігасіоп" і т.д. з с На фіг.І/4 представлений приклад послідовності символів, друкованих на сильно структурованому і такому, що має високу контрастність фоні, причому на вигляді а) показана послідовність символів, друкованих на білому ;» фоні, на вигляді б) показаний малюнок власного фону і на вигляді с) показана послідовність символів а), друкована на фоні б).
На фіг.П/4 вигляд а) повністю відповідає вигляду с), показаному на фіг.І/4, тоді як вигляд б) демонструє -І результат віднімання моделі зареєстрованого фону із зображення повністю друкованого білета.
На фіг.Ш/4 вигляд а) демонструє дільницю білета з прикладу, показаного на попередніх фігурах, що о містить підлягаючі розпізнаванню символи, і вигляд б) демонструє елементарні зображення, відповідні кожній
Ге) позиції символу, а якості результату сегментації. Вигляд с) показує, для кожного положення символу, комбінацію, відповідну елементарним зображенням зареєстрованого фону з моделями всіх можливих символів, о тобто комбіновані моделі, описані в тексті. Цей приклад наочно показує, що підлягаючі обробці символи (б) 4) можуть бути більш ефективно розпізнані, якщо порівнювати з комбінованими моделями (с), ніж з моделями символів, друкованих на білому фоні (показані, наприклад, на фіг.П1/4-4).
На фіг.ІМ/4 показана типова схема побудови системи розпізнавання, описаної в тексті.
У подальшому викладі буде описаний в якості такого, що не є обмежувальним, приклад реалізації винаходу, що пропонується, один з переважних Її варіантів, що стосується автоматичного розпізнавання номерів серій, (Ф, друкованих на банківських білетах. ка Дійсно, в більшості типів банківських білетів номер серії частково або повністю друкується прямо на малюнку фону цього білета. Друкування банківських білетів здійснюється, зокрема, з використанням зміщення бо Візних технологій, звичайно, щонайменше, офсету і дрібної насічки. Ця остання технологія, зокрема, звичайно представляє зони з великою кількістю ліній дуже високого контрасту. Коли друкують номер серії на одній з цих зон, досить важко за допомогою звичайних технологій відокремити символи від фону, а значить і розпізнати ці символи.
Крім того, номер серії звичайно друкується на заключній фазі виробництва, після офсетного друку і дрібної 65 насічки, і на іншій друкарській машині. Навіть якщо використовуються вельми складні і сучасні системи розмітки, відносна реєстрація між номерами серії і малюнком фону в результаті виявляється швидше змінною, і може звичайно "ворушитися" або зміщатися в межах декількох міліметрів.
На фіг.ІМ/4 показана побудова системи розпізнавання номерів серії на банківських білетах. Тут лінійна камера ССО 1 із своїми лінзами 2 і своєю системою освітлення З використовується для прочитання зображень банківських білетів 4, на яких необхідно прочитати номери серій, поки вони транспортуються за допомогою всмоктуючої стрічки 5.
Лінії сканування камери послідовно запам'ятовуються в першому контурі буферного запам'ятовуючого пристрою підсистеми обробки зображень б для формування електронного зображення кожного банківського білета. 70 Підсистема обробки зображень 6, яка може бути заснована як на спеціалізованій обчислювальній апаратурі, так і на комп'ютерах, що програмуються типу ОБР (Рідна! Зідпа! Ргосеззог), швидкодіючих персональних комп'ютерах РОС і т.д., здійснюють різні операції як в фазі відладки (формування моделі фону і моделей символів), так і в фазі розпізнавання.
У процесі здійснення фази відладки моделі фону підсистема обробки зображень: - забезпечує збір не пронумерованих зображень банківських білетів, вибраних як "Набір для відладки фону" (НВФ) (ЕАР) і запам'ятовує цей набір у відповідному запам'ятовуючому пристрої; - виділяє з набору НВФ одне "еталонне" зображення для реєстрації і робить це або автоматично (наприклад, виділяє перше зображення з набору НВФ), або за допомогою оператора системи, який використовує для цього пульт управління 7; - реєструє всі зображення з набору НВФ, визначаючи, передусім, горизонтальне зміщення Л, і вертикальне зміщення Ду кожного зображення по відношенню до еталонного зображення, і накладаючи потім відповідне зміщення -А, і Ар В цьому варіанті вимірювання зміщення здійснюється з використанням методу максимальної кореляції. Невелика прямокутна дільниця З о (основа розмітки) еталонного зображення з центром, що має координати Хо, Хо, вибрані, наприклад, оператором (поза зоною наддруковування символів), співставляється з Ге дільницею 5. тих же розмірів, центр якого зміщується крок за кроком на кожну позицію (піксель) зображення з о набору НВФ для того, щоб знайти положення х., уз, де коефіцієнт кореляції має своє максимальне значення (це відповідає найбільш точному накладенню між двома зображеннями). При цьому зміщення може бути визначене наступним виразом: дутХІ-Хо и ДуУТУ4 Ус. о
Відповідно до цього варіанту модель фону М; формується у вигляді середнього арифметичного зображення с
НВФ, зареєстрованих разом з еталонним зображенням.
У процесі здійснення фази відладки моделей символів підсистема обробки зображень 6: Ге) - забезпечує збір зображень сукупності банківських білетів, де на білому фоні друковані всі цифри і/або о букви, що використовуються в номерах серії, кожні поодинці, ії у відомих положеннях (набір для відладки символів НВС (ЕАС); - - потім сегментує зображення з набору ЕАС в елементарні зображення, кожне з яких містить один єдиний символ. Відповідно до цього варіанту сегментація забезпечується з використанням стандартної технології аналізу переходу від чорного до білого, вельми ефективної в тих випадках, коли символи друковані на білому « фоні; - формує модель Ме для кожного символу (букви або цифри) як середнє арифметичне з набору НВС - с елементарних зображень кожного положення, зареєстрованого, наприклад, разом з символом першого білета з и набору НВС, взятого як еталонне. Реєстрація і усереднення здійснюються так само, як і у разі моделі фону, але ,» основи розмітки співпадають з цілим елементарним зображенням символу.
Звичайно в складі номера серії банківського білета використовуються літерні і цифрові символи одного і того ж шрифту. Таким чином, звичайно буде досить одного положення на білетах з набору НВС на символ (один - і символ А, один символ В і т.д.). У іншому випадку буде необхідно передбачити стільки положень на символ, о скільки використовується різних шрифтів (наприклад, А шрифту Мем Хогк, А шрифту Соишгтіег, А шрифту Сепеме і т.д.). се) У процесі здійснення фази розпізнавання відповідно до варіанту реалізації винаходу, що пропонується, який сю 50 описується тут, підсистема обробки зображень 6 після прочитання зображення: - передусім, реєструє зображення фону кожного підлягаючого прочитанню банківського білета разом з сю моделлю фону за допомогою тієї ж основи розмітки, яка була використана для відладки моделі, і з застосуванням тієї ж технології кореляції; - формує різницеве зображення, яке являє собою зареєстроване зображення повного білета мінус модель фону, після чого здійснює пошук положень символів. Технологія, що використовується при цьому заснована на о вже згаданому вище аналізі переходів. Звичайно пошук може бути виконаний на обмеженій зоні білета, оскільки друк номера серії може бути зміщений по відношенню до малюнка фону не більш, ніж на декілька міліметрів; іме) - виділяє для кожного положення символу, відміченого на різницевому зображенні, відповідне елементарне зображення моделі фону. Будучи зареєстрованим, згадане елементарне зображення буде точно являти собою бо дільницю фону, на якій був друкований невідомий символ; - комбінує для кожного положення символу відповідне зареєстроване елементарне зображення фону М ; з кожною з моделей символів Ме.
Також для кожного положення символу будуть отримані нові моделі, символи плюс фон, з тим же відносним положенням, що і на підлягаючому прочитанню білету. У цьому варіанті реалізації винаходу, що пропонується, 65 згадана комбінація Мо; формується, піксель за пікселем, з використанням наступних рівнянь:
ме - мами нки Й- 5) якщо спочатку друкують фон, а потім друкують символи. В іншому випадку: ме - КоМмим. Кк, Й- М) 2
У всіх випадках коефіцієнти Ко і Ку являють собою константи, що характеризують друкарські фарби, які 70 використовуються і папір. У рівняннях |1) і (2) перший член (а саме, добуток К оМ,М») враховує передавальну здатність друкарських фарб, що використовуються і відображаючу здатність паперу, тоді як другий член в цих рівняннях пов'язаний з відображаючою здатністю поверхні друкарської фарби, яка була нанесена останньою; - для кожного положення символу розраховує коефіцієнт кореляції між відповідним елементарним зображенням білета і всіма новими моделями (символи плюс фон). При цьому, підлягаючий обробці символ розпізнається як символ комбінованої моделі, яка відповідає максимальному значенню згаданого коефіцієнта кореляції; - відповідно до цього варіанту реалізації винаходу, що пропонується додатково проводять співставлення згаданого максимального значення коефіцієнта кореляції з певним пороговим значенням для того, щоб перевірити якість друку символу і фону елементарних зображень, які відповідають кожному положенню символу.
Якщо якість виявляється задовільною (підлягаюче обробці елементарне зображення і комбінована модель є практично ідентичними), коефіцієнт має значення, вельми близьке до 1, тоді як погана якість буде відповідати значенню коефіцієнта, більш близькому до нуля.
Інші переважні варіанти реалізації винаходу, що пропонується будуть включати: а) його застосування для розпізнавання символів на документах, відмінних від банківських білетів, тобто с таких, наприклад, як листи, поштові картки, етикетки, банківські або поштові чеки і т.д.; о
Б) заміну системи транспортування на стрічці на систему транспортування, придатну для листів великих розмірів, наприклад, на циліндр за типом що використовуються в друкарських машинах в друкарнях або на систему відповідно до патенту США Мо5598006 від 28.01.1998; с) заміну в системі розпізнавання лінійної камери на матричну камеру; о а) використання усередненого зображення набору зображень НВФ в якості еталонного зображення для со реєстрації фону; е) автоматичне виділення основи розмітки для реєстрації фону, наприклад, відповідно до технології, (є) запропонованої в Патенті князівства Монако Мо2411992479; о
У) побудова моделі фону з використанням способу, відмінного від усереднення, наприклад, з використанням
Зо технології, вказаної в Патенті США Мо5778088 від 7.07.1998. о
Список використаної літератури (1) С. Збгіпда - "Іпвресіоп Аціотайідце де Іа диаійе адітргевзвіоп раг п тодеїе еїазідце" - Патент на винахід Мо2411.99.2479, виданий Державним міністерством Князівства Монако (27.04.99). « (2) У. 5нгіпда - "Ргоседиге їог Ргодисіпу А Кеїегепсе Моавеї! ес." - Патент США Мо5.778.088 -7 липня 1998р. (3) . Бііпда - "Ргоседе де сопігоїе аціотаййдце де Іа диайе адітревзвіоп дипе ітаде тийіспготе" - З с Заявка на Європейський патент Мо97810160.8-2304. "» (4) її. Збіпда "ІпзіаМйацйоп їог бцайу СопігоЇ ої Ргіпіей Зпееї5, Езресіайу Зесигйу Рарег " - Патент " США Мо5.598.006 - 28 січня 1998р. (5) Кісе-Маду-Манкг - "Оріїса! Спагасіег Кесодпійоп" Кіптег Асадетіс Рибіїзпегг - 1999. -І («в) се) о 50 сю»
Ф) іме) 60 б5
Ху ст ро ах хі 7 с 5 В жк ее б. о п. їх ек і - вві с пе ля Ух я о с о ми ІВІХЕ я, Ме
Беж п. ов о. ли с г о п о я ха с тив я соя с с ев лох о о. ве с о о. ВК и 0 ВМ І сн о х
М Тжн вні Бк ТВА пюЯ дя ія пон тя ЗО Яну АД т нд тях З я й т с о ЩО пк до - п си ТеКТту п: Ме їн Кеті с НО ий ко де п Кая ТЯ Б п о о мя о с Б й х чт ад цІ Кн Терсі Я 2 Ви о Моя о тик: - щодва БЕ с
БИ я о. Я КИМ аа По я с ся якщо Є
ГКя Так ях Я ев ке оз Гве Ко Тв пк
МОЯ ЗМ ен Ух он а) ПЕ лес ЗК рес за Ж Ж Хот Х ії кН Ус КЕ с в) с п п ТУ: дея с с о г зе ух кове Тов дан тя Така ЕН ок в. с : с . с ще і
УКВ У й і г ми хе о ПАС -
КА о и хр я я Ск КО теляти з р шо ут с СК в и; с
Ех о ле ме іх я Я п АК щі Ку. ще ух їче ЗУ і . не Я ; ха ть Ме вка со Іа ті я ср Ж пре лен Ко ЗБ п. с зх І ке їх до Тех я о г о в с, : с в: х ХТЗ Як У русі Іекя са о ле ж; тех ДК р сх КВ ях да з: м ДУХ ї А код ід 5 Мох ВК нн у о ве о тв о, Со
Кто с - зи Ух с
З. ОХ п ) Я с з 5. і я ях і ее я дн с лів
Кк ПикшМЯ СК, кот . и, Ф і; ща
Рожни ВК І см
Ка Сон А,
М о МА 4 бле о с 7) вх о с Ех ук ве п со пет ц с о зе с и з ГНН ВЕ ТЕЙ ЕХ вд КИ а Ех ау -
Ех ній КОМ; Що, о г сл зе ер Я с он о ток и а с Кон о
Кк ші сі сш ПЕ Му о а вт с пе лох, с с ве с Аня с с
Кеті пнх я ПН ЩЕ іх с ск о. -І 4 о р г СКК Мн око ее 2 Кор ик: с АКНЕ с ко в ха о й с с ся то вх 1 (ав) дона МОЗк ох си с но с о. о, с Я ие хе рт Ух ор С во з ке УК. в в п Кн ле о Ес
ЕЛЕН с Бе зе Я по Бе . с о ВІ с і с
Га 0. ПОТУ секе о о о ее со т ВАК ах с те 3 ря ке с кет 7 с сів ер ю кА с ей с
Яеча 0 ва з . й ІЙ о . ХУ рч- 55 . пі
ФІ 234
АБУ б; - бі о 5) :
ФІ
Г. ца теории Ам
М рве. і МАН о) 5. ВЕВБНЯВЖЕ: » о вивишен
Ви шя. ї
Ж І
НЯНЯ
КИКАВЯВ.
ХУ 01234557 |Ф
ФІГ. ЦІ/А
Ще підсистема ц обробки зображеннь сяш-ох НОЯ сч се: Й по о сен Ле НН ЩЕ питне й плення | --- и вва В Гзг) 3о | шо ше
Ге) . | : І Ге) (ав) -
ФІГ. ІУ/А

Claims (1)

  1. Формула винаходу -
    с 1. Спосіб автоматичного розпізнавання електронними засобами символів, віддрукованих на будь-якому . . . . . - а матеріалі, навіть у випадку, коли фон має контрастні структури, при якому використовують оптоелектронний пристрій зчитування зображення і систему обробки зображення, що містить наступні етапи, при яких здійснюють напагодження, при якій формують модель фону, що отримується шляхом зчитування зображень одного або -І декількох зразків, на яких зображений тільки фон, формують модель символів (цифр і/або букв, а також інших символів), що отримуються шляхом зчитування зображень набору символів, віддрукованих на білому фоні, що о містять щонайменше один примірник кожного символу, здійснюють розпізнавання, при якому зчитують со зображення, яке підлягає розпізнаванню зразка, що містить невідомі символи, віддруковані на певному фоні, 5о реєструють модель фону разом з фоном зчитаного зображення, виділяють із зареєстрованої моделі фону о елементарне зображення фону, яке відповідає кожному невідомому символу, комбінують для кожного с» положення символу модель букв і/або цифр з відповідним елементарним зображенням фону (комбіновані моделі), зіставляють невідомі символи з всіма комбінованими моделями, які відповідають одному і тому ж положенню символу, розпізнають кожний невідомий символ.
    2. Спосіб за п.1, в якому кожний невідомий символ розпізнають відповідно до технології "порівняння з шаблоном". (Ф) З. Спосіб за п.1, в якому кожний невідомий символ розпізнають відповідно до технології "структурний аналіз". ГІ 4. Спосіб за п. 1, в якому згадана модель фону являє собою одне із зображень набору для налагодження фону (ННФ). во 5. Спосіб за п. 1, в якому згадана модель фону являє собою середнє арифметичне зображень набору ННФ, зареєстрованих між собою.
    6. Спосіб за п. 1, в якому згадана модель фону являє собою середнє арифметичне зображень набору ННФ, зареєстрованих з еталонним зображенням.
    7. Спосіб за будь-яким з пп. 1-6, в якому моделі підлягаючих розпізнаванню символів формують як середні 65 арифметичні зображень з набору налагодження символів (ННО).
    8. Спосіб за будь-яким з пп. 1-7, в якому моделі підлягаючих розпізнаванню символів формуються шляхом безпосереднього використання електронних зображень з інформаційних комп'ютерних файлів.
    9. Спосіб за будь-яким з пп. 1-8, при якому використовують систему зчитування кольорового зображення, розпізнавання якого здійснюється в тому каналі кольору, який дає найкраще накладення.
    10. Спосіб за п. 9, в якому кожне зображення, що підлягає обробці представляють як відділення невідомих символів від фону шляхом віднімання моделі зареєстрованого фону.
    11. Спосіб за п. 10, в якому комбінування моделей фону і символів здійснюють відповідно до наступних рівнянь: Ме - Комьм. НКИ - МО таме Ме й й якщо спочатку друкують фон, а потім друкують символи, в іншому випадку: Ме - Комьм. кий - (Ме )там, «М де Му - модель символу б; 75 М, - модель фону; М - модель для кожного символу; Ко та Ку - коефіцієнти, які являють собою константи.
    12. Спосіб за будь-яким з пп. 1-11, який використовують для перевірки якості друку шляхом порівняння з пороговим значенням величини коефіцієнта кореляції між елементарним зображенням кожного з положень символів і відповідної йому комбінованої моделі, вибраної на рівні розпізнавання. Офіційний бюлетень "Промислоава власність". Книга 1 "Винаходи, корисні моделі, топографії інтегральних мікросхем", 2004, М 11, 15.11.2004. Державний департамент інтелектуальної власності Міністерства освіти і Ге! науки України. о (зе) (зе) (о) «в) і - -
    с . и? -і («в) се) (95) сю іме) 60 б5
UA2000063568A 1999-06-21 2000-06-20 Автоматичне розпізнавання символів на структурованому фоні за допомогою комбінування моделей фону і символів UA70933C2 (uk)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
MC2427A MC2491A1 (fr) 1999-06-21 1999-06-21 Reconnaissance automatique de caractères sur fond structuré par combinaison des modèles du fond et des caractères

Publications (1)

Publication Number Publication Date
UA70933C2 true UA70933C2 (uk) 2004-11-15

Family

ID=19738388

Family Applications (1)

Application Number Title Priority Date Filing Date
UA2000063568A UA70933C2 (uk) 1999-06-21 2000-06-20 Автоматичне розпізнавання символів на структурованому фоні за допомогою комбінування моделей фону і символів

Country Status (11)

Country Link
US (1) US6690824B1 (uk)
EP (1) EP1063606B1 (uk)
JP (1) JP4593729B2 (uk)
KR (1) KR100691651B1 (uk)
CN (1) CN1172264C (uk)
AT (1) ATE349047T1 (uk)
AU (1) AU767855B2 (uk)
CA (1) CA2310874A1 (uk)
DE (1) DE60032413T2 (uk)
MC (1) MC2491A1 (uk)
UA (1) UA70933C2 (uk)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002112005A (ja) * 2000-09-29 2002-04-12 Minolta Co Ltd 画像出力システム
JP4661034B2 (ja) * 2003-07-28 2011-03-30 富士ゼロックス株式会社 印刷品質検査装置及び方法
KR100778014B1 (ko) * 2005-09-16 2007-11-21 한국건설기술연구원 영상을 이용한 액체 높이 측정 장치 및 방법
DE102006029718A1 (de) * 2006-06-28 2008-01-10 Siemens Ag Verfahren zur Auswertung zweier Abbilder sowie medizinisches Abbildungssystem
US8611665B2 (en) * 2006-12-29 2013-12-17 Ncr Corporation Method of recognizing a media item
WO2008141293A2 (en) * 2007-05-11 2008-11-20 The Board Of Regents Of The University Of Oklahoma One Partner's Place Image segmentation system and method
JP5253788B2 (ja) * 2007-10-31 2013-07-31 富士通株式会社 画像認識装置、画像認識プログラムおよび画像認識方法
WO2009070032A1 (en) * 2007-11-28 2009-06-04 Lumex A/S A method for processing optical character recognition (ocr) data, wherein the output comprises visually impaired character images
CN101887520B (zh) * 2009-05-12 2013-04-17 华为终端有限公司 一种图像中的文字定位方法和装置
EP2807602A1 (en) * 2012-01-23 2014-12-03 Microsoft Corporation Pattern matching engine
US9977957B2 (en) 2013-02-28 2018-05-22 Glory Ltd. Method and system for identifying characters on a valuable medium
DE102015003480A1 (de) * 2015-03-18 2016-03-10 Giesecke & Devrient Gmbh Vorrichtung und Verfahren zum Prüfen von Wertdokumenten, insbesondere Banknoten, sowie Wertdokumentbearbeitungssystem
US10068132B2 (en) 2016-05-25 2018-09-04 Ebay Inc. Document optical character recognition
JP2019040315A (ja) * 2017-08-23 2019-03-14 グローリー株式会社 不可視特性検知装置、シート識別装置、シート処理装置、印刷検査装置、及び不可視特性検知方法
JP7379876B2 (ja) * 2019-06-17 2023-11-15 株式会社リコー 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
KR102242965B1 (ko) * 2019-09-23 2021-05-03 주식회사 딥비전 사용자 중심의 도안 생성 방법 및 시스템
WO2022044311A1 (ja) * 2020-08-31 2022-03-03 富士通フロンテック株式会社 データ生成装置、データ生成方法およびデータ生成プログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63137383A (ja) * 1986-11-29 1988-06-09 Toshiba Corp 文字読取装置
US5335292A (en) * 1988-12-21 1994-08-02 Recognition International Inc. Document processing system and method
JP2783033B2 (ja) * 1992-01-13 1998-08-06 日本電気株式会社 カラー画像の領域抽出方法および装置
EP0566015A3 (en) * 1992-04-14 1994-07-06 Eastman Kodak Co Neural network optical character recognition system and method for classifying characters in amoving web
JP3037432B2 (ja) * 1993-11-01 2000-04-24 カドラックス・インク 光波オーブンによる食物調理方法および調理装置
IT1269506B (it) 1994-02-04 1997-04-01 De La Rue Giori Sa Impianto di controllo di qualita' di fogli stampati in particolare di carte-valore
IT1276010B1 (it) * 1995-03-07 1997-10-24 De La Rue Giori Sa Procedimento per produrre un modello di riferimento destinato ad essere utilizzato per il controllo automatico della qualita' di
US5943438A (en) * 1995-03-07 1999-08-24 Siemens Aktiengesellschaft Method for pattern recognition
JP2879800B2 (ja) * 1995-05-09 1999-04-05 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 電子走査ピクチャの背景除去方法
IT1284432B1 (it) 1996-03-22 1998-05-21 De La Rue Giori Sa Procedimento di controllo automatico della qualita' di stampa di un'immagine policroma
US5915039A (en) * 1996-11-12 1999-06-22 International Business Machines Corporation Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition

Also Published As

Publication number Publication date
KR100691651B1 (ko) 2007-03-09
JP4593729B2 (ja) 2010-12-08
DE60032413D1 (de) 2007-02-01
AU767855B2 (en) 2003-11-27
EP1063606B1 (fr) 2006-12-20
US6690824B1 (en) 2004-02-10
EP1063606A3 (fr) 2003-01-08
CA2310874A1 (en) 2000-12-21
AU3937000A (en) 2001-01-04
DE60032413T2 (de) 2007-09-27
KR20010015046A (ko) 2001-02-26
MC2491A1 (fr) 1999-11-22
CN1282070A (zh) 2001-01-31
EP1063606A2 (fr) 2000-12-27
CN1172264C (zh) 2004-10-20
ATE349047T1 (de) 2007-01-15
JP2001022892A (ja) 2001-01-26

Similar Documents

Publication Publication Date Title
UA70933C2 (uk) Автоматичне розпізнавання символів на структурованому фоні за допомогою комбінування моделей фону і символів
JP4857173B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
US4408342A (en) Method for recognizing a machine encoded character
RU2582860C2 (ru) Система и способ считывания серийного номера бумажного листа
US5915039A (en) Method and means for extracting fixed-pitch characters on noisy images with complex background prior to character recognition
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
KR101831783B1 (ko) 출력 인쇄물에 포함된 이미지 및 텍스트 인식 장치 및 그 방법
Lampert et al. Printing technique classification for document counterfeit detection
Yamaguchi et al. Digit classification on signboards for telephone number recognition
JP3018949B2 (ja) 文字読取装置およびその方法
Lakshmi et al. An optical character recognition system for printed Telugu text
JP5630689B2 (ja) 文字認識方法及び文字認識装置
CN103748866A (zh) 取证鉴定系统和方法
JP6010318B2 (ja) 画像検査装置、画像検査方法、及びプログラム
US3201752A (en) Reading machine with mark separation
Schulze et al. Using DCT features for printing technique and copy detection
RU2249251C2 (ru) Автоматическое распознавание символов на структурированном фоне при помощи комбинирования моделей фона и символов
JPH06203204A (ja) 文字認識装置
KR20030052126A (ko) 한글문자 인식 방법
JPS63184181A (ja) 光学文字認識装置
US11521403B2 (en) Image processing device for a read image of an original
JP7202520B2 (ja) 画像処理装置
Mukarambi et al. Segmentation and text extraction from document images: Survey
JP4271428B2 (ja) 文字認識方法および文字認識装置
Khotanzad et al. Segmentation of color maps using eigenvector line-fitting techniques