RU2251736C2 - Способ идентификации зачеркнутых символов при распознавании рукописного текста - Google Patents

Способ идентификации зачеркнутых символов при распознавании рукописного текста Download PDF

Info

Publication number
RU2251736C2
RU2251736C2 RU2002133900/09A RU2002133900A RU2251736C2 RU 2251736 C2 RU2251736 C2 RU 2251736C2 RU 2002133900/09 A RU2002133900/09 A RU 2002133900/09A RU 2002133900 A RU2002133900 A RU 2002133900A RU 2251736 C2 RU2251736 C2 RU 2251736C2
Authority
RU
Russia
Prior art keywords
recognition
symbol
symbols
character
crossed
Prior art date
Application number
RU2002133900/09A
Other languages
English (en)
Other versions
RU2002133900A (ru
Inventor
Д.А. Туганбаев (RU)
Д.А. Туганбаев
гин Д.Г. Дер (RU)
Д.Г. Дерягин
Original Assignee
"Аби Софтвер Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by "Аби Софтвер Лтд." filed Critical "Аби Софтвер Лтд."
Priority to RU2002133900/09A priority Critical patent/RU2251736C2/ru
Priority to US10/348,222 priority patent/US8472719B2/en
Publication of RU2002133900A publication Critical patent/RU2002133900A/ru
Application granted granted Critical
Publication of RU2251736C2 publication Critical patent/RU2251736C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Quality & Reliability (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

Изобретение относится к оптическому распознаванию символов. Его использование при распознавании рукописного текста из растровых изображений обеспечивает технический результат в виде повышения правильности и помехозащищенности распознавания рукописных символов за счет идентификации зачеркнутых символов. Способ характеризуется делением изображения на области, выявлением областей с рукописными символами, применением структурных и признаковых классификаторов для распознавания символов, использованием структурного классификатора как основного инструмента распознавания, выбором наиболее подходящего из нескольких вариантов символов. Технический результат достигается благодаря тому, что распознавание символа включает в себя распознавание символа по крайней мере одним дополнительным признаковым классификатором символов зачеркивания, осуществляющим одновременное сравнение с символом зачеркивания и по крайней мере одним похожим на него обычным символом, и идентификацию символа как зачеркнутого в случае большего соответствия признакам символов зачеркивания. 1 ил.

Description

Изобретение относится к области оптического распознавания символов и, в частности, к способам распознавания рукописного текста из растрового изображения.
Известен способ распознавания текстовой информации, при котором растровое изображение разбивают на области, предположительно содержащие изображения символов текста, с последующим сопоставлением изображения в областях с эталонным изображением, содержащимся в одном или нескольких дополнительных признаковых классификаторах.
Такой способ реализуется в способе распознавания символов по патенту США №5680479, Октябрь 21, 1997.
Недостатком этого способа является то, что в случае распознавания символа зачеркивания результатом является один из символов, подходящий по очертаниям с наибольшей степенью надежности на рисунок линий зачеркивания. Это приводит к ошибке распознавания, поскольку практически всегда этот символ не совпадает с тем, который зачеркнут. Кроме того, известные способы не воспринимают такой результат как ошибку распознавания.
Известный способ не позволяет идентифицировать наличие зачеркнутого символа, что приводит к ошибкам распознавания.
Техническим результатом изобретения является повышение правильности распознавания рукописных символов, повышение помехозащищенности распознавания, обеспечение возможности идентификации зачеркнутых символов.
Это достигается тем, что в системе организуют дополнительный признаковый классификатор, содержащий признаки множества разновидностей символов зачеркивания. При достаточно надежном совпадении с элементом указанного классификатора, символ классифицируют как зачеркнутый и направляют на дополнительную обработку.
Реализация этого способа позволяет существенно повысить качество распознавания рукописных символов, улучшить помехозащищенность распознавания.
Указанные недостатки значительно ограничивают возможности использования известных способов для распознавания текстовой информации.
Известные способы непригодны для достижения заявленного технического результата.
Предлагаемый способ отличается тем, что для распознавания зачеркнутых символов рукописного текста из растрового изображения в системе организуют один обобщенный или несколько частных дополнительных классификаторов, содержащих признаки символов зачеркивания, и используют иную последовательность обработки символа.
Общий классификатор обучают на всем известном наборе признаков зачеркивания. Частные классификаторы обучают на однотипном массиве признаков. Такие классификаторы позволяют выбрать между символом зачеркивания и похожим на него обычным символом. Наиболее типичные символы, сходные с символами зачеркивания, на базе которых создают частные классификаторы, - “3”, “З”, “8”, “Ж” и др.
Распознавание зачеркнутого символа начинают с применения структурных или признаковых классификаторов символов. При появлении многозначного результата, обращаются к одному или более дополнительному признаковому классификатору для уменьшения числа предполагаемых символов. При достижении единственного результата распознанного символа организуют проверку одним общим или несколькими частными дополнительными классификаторами, содержащими признаки различных видов зачеркивания. При достаточно близком совпадении с элементом дополнительного классификатора символ идентифицируют как зачеркнутый и направляют его на дополнительную обработку. Дополнительная обработка может состоять в привлечении оператора для распознавания или в применении полностью автоматизированного способа.
Сущность предложения иллюстрируется на чертеже.
Объектом обработки является графическая область с изображением зачеркнутого символа, выделенная из растрового изображения документа.
Изображение символа поступает в один или последовательно в несколько структурных классификаторов для проведения операции распознавания. Структурные классификаторы являются в заявляемом способе предпочтительным основным инструментом распознавания символов. В результате распознавания образуются один или более вариантов возможных символов вместе с уровнями доверия каждому варианту. В случае множественного результата распознавания, полученные варианты распознанных символов далее направляются на проверку в один или несколько признаковых классификаторов. Признаковые классификаторы являются в заявляемом способе основным инструментом для уменьшения числа предполагаемых вариантов распознанных символов. Признаковые классификаторы проводят распознавание способами, отличными от структурных классификаторов, что при одновременном использовании классификаторов обоих видов значительно повышает общую надежность распознавания. После проверки в структурных и признаковых классификаторах число возможных вариантов значительно уменьшается и повышается их надежность.
Далее проводят проверку символа в одном общем или нескольких частных дополнительных признаковых классификаторах, предварительно прошедших обучение на символах зачеркивания. В результате работы дополнительного классификатора принимают решение об отнесении символа к зачеркнутым либо принятии варианта, полученного на предыдущих этапах. Символ, считающийся зачеркнутым, направляют на последующую дополнительную обработку, дополнительная обработка может быть полностью автоматизированной или требовать привлечения оператора.
Принцип работы следующий. Графическую область 1 с изображениями зачеркнутого символа направляют для анализа в один или более классификатор для распознавания символа (7).
В качестве более предпочтительной реализации используют классификаторы двух типов. Первичный анализ проводят с помощью по крайней мере одного основного структурного классификатора 2. В случае появления множественного результата работы классификатора 2, варианты символов вместе с исходной графической областью 1 направляют для уточнения в один или более признаковый классификатор 3. Далее исходную графическую область 1, вместе с результатами распознавания на предыдущих этапах направляют в дополнительный признаковый классификатор символов зачеркивания 4.
При совпадении с достаточно высокой надежностью с элементом дополнительного классификатора 4 символ идентифицируют как зачеркнутый. Далее этот символ направляют на дополнительную обработку зачеркнутых символов 5, после чего распознавание символа завершают 6.

Claims (1)

  1. Способ идентификации зачеркнутых символов при распознавании рукописного текста, характеризующийся делением распознаваемого изображения на области, выявлением областей, содержащих рукописные символы, применением структурных и признаковых классификаторов для распознавания и проверки правильности распознавания символов, использованием по крайней мере одного структурного классификатора как основного инструмента распознавания символов, выбором наиболее подходящего из нескольких вариантов символов, если на предыдущем этапе не удалось распознать символ однозначно, отличающийся тем, что распознавание символа включает по крайней мере выполнение следующей последовательности действий: распознавание символа по крайней мере одним дополнительным признаковым классификатором символов зачеркивания, осуществляющим одновременное сравнение с символом зачеркивания и по крайней мере одним похожим на него обычным символом, идентификацию символа как зачеркнутого в случае большего соответствия признакам символов зачеркивания.
RU2002133900/09A 2002-12-17 2002-12-17 Способ идентификации зачеркнутых символов при распознавании рукописного текста RU2251736C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2002133900/09A RU2251736C2 (ru) 2002-12-17 2002-12-17 Способ идентификации зачеркнутых символов при распознавании рукописного текста
US10/348,222 US8472719B2 (en) 2002-12-17 2003-01-22 Method of stricken-out character recognition in handwritten text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2002133900/09A RU2251736C2 (ru) 2002-12-17 2002-12-17 Способ идентификации зачеркнутых символов при распознавании рукописного текста

Publications (2)

Publication Number Publication Date
RU2002133900A RU2002133900A (ru) 2004-07-10
RU2251736C2 true RU2251736C2 (ru) 2005-05-10

Family

ID=32501897

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2002133900/09A RU2251736C2 (ru) 2002-12-17 2002-12-17 Способ идентификации зачеркнутых символов при распознавании рукописного текста

Country Status (2)

Country Link
US (1) US8472719B2 (ru)
RU (1) RU2251736C2 (ru)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2641452C2 (ru) * 2013-12-18 2018-01-17 ООО "Аби Девелопмент" Неполные эталоны

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3013879A1 (fr) * 2013-11-26 2015-05-29 Datavote Materiel de vote par correspondance et feuille de vote, pour des elections professionnelles et entreprise
US20160041626A1 (en) 2014-08-06 2016-02-11 International Business Machines Corporation Configurable character variant unification
US10095946B2 (en) 2016-07-07 2018-10-09 Lockheed Martin Corporation Systems and methods for strike through detection
CN109478229B (zh) * 2016-08-31 2021-08-10 富士通株式会社 用于字符识别的分类网络的训练装置、字符识别装置及方法
CN107451559A (zh) * 2017-07-31 2017-12-08 邱宇轩 基于机器学习的帕金森病人手写文字自动识别方法
JP7326753B2 (ja) * 2019-01-24 2023-08-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6002799A (en) * 1986-07-25 1999-12-14 Ast Research, Inc. Handwritten keyboardless entry computer system
US4972496A (en) * 1986-07-25 1990-11-20 Grid Systems Corporation Handwritten keyboardless entry computer system
US5151950A (en) * 1990-10-31 1992-09-29 Go Corporation Method for recognizing handwritten characters using shape and context analysis
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP2611904B2 (ja) * 1992-10-19 1997-05-21 株式会社エイ・ティ・アール視聴覚機構研究所 文字認識装置
US5481278A (en) * 1992-10-21 1996-01-02 Sharp Kabushiki Kaisha Information processing apparatus
JPH07160827A (ja) * 1993-12-09 1995-06-23 Matsushita Electric Ind Co Ltd 手書きストローク編集装置及び方法
DE4434465C2 (de) * 1994-01-21 2003-04-17 Bosch Gmbh Robert Gemischregler für einen Verbrennungsmotor
JP2845149B2 (ja) * 1994-12-28 1999-01-13 日本電気株式会社 手書文字入力装置および手書文字入力方法
ATE376696T1 (de) * 1996-11-15 2007-11-15 Toho Business Man Ct Geschäftsverwaltungssystem

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2641452C2 (ru) * 2013-12-18 2018-01-17 ООО "Аби Девелопмент" Неполные эталоны

Also Published As

Publication number Publication date
US8472719B2 (en) 2013-06-25
US20040114803A1 (en) 2004-06-17

Similar Documents

Publication Publication Date Title
US7756335B2 (en) Handwriting recognition using a graph of segmentation candidates and dictionary search
US8059868B2 (en) License plate recognition apparatus, license plate recognition method, and computer-readable storage medium
Duan et al. Building an automatic vehicle license plate recognition system
JP5522408B2 (ja) パターン認識装置
US8768059B2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
US7512272B2 (en) Method for optical recognition of a multi-language set of letters with diacritics
Kim et al. Bankcheck recognition using cross validation between legal and courtesy amounts
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
RU2251736C2 (ru) Способ идентификации зачеркнутых символов при распознавании рукописного текста
EP2073146A1 (en) Pattern recognizing device for recognizing input pattern by using dictionary pattern
Tse et al. An OCR-independent character segmentation using shortest-path in grayscale document images
RU2002133900A (ru) Способ идентификации зачеркнутых символов при распознавании рукописного текста
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
Ganai et al. Projection profile based ligature segmentation of Nastaleeq Urdu OCR
JP3956625B2 (ja) 領域切り出しプログラムおよび装置
Graf et al. Analysis of complex and noisy check images
KR100473660B1 (ko) 단어인식방법
CN116311264A (zh) 一种基于字符轮廓的字符识别方法
JP3151866B2 (ja) 英文字認識方法
JPH0944604A (ja) 文字認識処理方法
JP2000207491A (ja) 文字列読取方法及び装置
JPH08180142A (ja) 住所読み取り装置
McQueen et al. A language model based optical character recogniser (OCR) for reading incidental text
JPH08167005A (ja) 文字認識装置
Shridhar et al. Impact of lexicon completeness on city name recognition

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20061218

NF4A Reinstatement of patent

Effective date: 20071127

HE4A Change of address of a patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20141031

QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20151118

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20161213

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311