RU2259592C2 - Способ распознавания графических объектов с использованием принципа целостности - Google Patents

Способ распознавания графических объектов с использованием принципа целостности Download PDF

Info

Publication number
RU2259592C2
RU2259592C2 RU2003118580/09A RU2003118580A RU2259592C2 RU 2259592 C2 RU2259592 C2 RU 2259592C2 RU 2003118580/09 A RU2003118580/09 A RU 2003118580/09A RU 2003118580 A RU2003118580 A RU 2003118580A RU 2259592 C2 RU2259592 C2 RU 2259592C2
Authority
RU
Russia
Prior art keywords
image
typical
elements
typical elements
recognized object
Prior art date
Application number
RU2003118580/09A
Other languages
English (en)
Other versions
RU2003118580A (ru
Inventor
К.В. Анисимович (RU)
К.В. Анисимович
А.Л. Шамис (RU)
А.Л. Шамис
К.А. Зуев (RU)
К.А. Зуев
Original Assignee
"Аби Софтвер Лтд."
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by "Аби Софтвер Лтд." filed Critical "Аби Софтвер Лтд."
Priority to RU2003118580/09A priority Critical patent/RU2259592C2/ru
Priority to US10/657,008 priority patent/US8036461B2/en
Publication of RU2003118580A publication Critical patent/RU2003118580A/ru
Application granted granted Critical
Publication of RU2259592C2 publication Critical patent/RU2259592C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

Изобретение относится к распознаванию графических образов. Его использование позволяет увеличить точность и помехозащищённость распознавания объектов изображения. Способ характеризуется разбиением изображения на области; выделением текстовых и нетекстовых областей; распознаванием объектов; предварительным назначением по крайней мере одной графической конструкции из наименьших единиц изображения в качестве типового элемента для составления распознаваемого объекта; предварительным представлением изображения этого объекта в виде совокупности типовых элементов одного типа с их взаимными пространственно-параметрическими соотношениями. Технический результат достигается благодаря тому, что осуществляют поиск и идентификацию изображения типового элемента; выбор найденного типового элемента для проверки на принадлежность распознаваемому объекту; выдвижение и проверку гипотезы о распознаваемом объекте по изображению из совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений. 2 с. и 23 з.п. ф-лы, 3 ил.

Description

Изобретение относится к распознаванию графических образов, в частности к распознаванию нетекстовых объектов и/или текста на изображении документа в электронном виде.
Указанные способы применяют в том числе, но не только при распознавании форм ввода данных, сочетающих типографский и рукописный тексты, и набор специальных ориентиров для осуществления навигации по документу. Это такие документы как опросные листы, анкеты, банковские счета - жесткой или свободной формы расположения полей.
Возможно применение указанных способов для распознавания объектов заданного вида из графического образа в электронной форме.
Из уровня техники известны способы распознавания образов из графического изображения путем сравнения полученного образа объекта как совокупности единичных элементов изображения - точек - с эталонным образом всего объекта или набором разных воплощений объекта, имеющимся в специальном справочнике-классификаторе.
Известен способ распознавания текстовой информации, при котором растровое изображение разбивается на области (блоки), предположительно содержащие изображения печатных символов текста с последующим сопоставлением изображения в блоках с эталонным описанием изображения, содержащимся в одном или нескольких специальных признаковых или растровых классификаторах.
Такой способ реализуется, например, в способе распознавания информации по патенту США № 5680479 (October 21, 1997, Wang, et al.).
Известен аналогичный способ, раскрытый в патенте США № 5684891 (November 4, 1997, Tanaka, et al.). В документе описан способ выполнения сегментации всего изображения для выделения изображения отдельного символа, который по мнению автора позволяет достичь большей достоверности и производительности процесса. Изображение символа, как совокупность точек, сравнивают с эталоном, имеющимся в классификаторе.
Недостатком способа следует считать применение сравнения изображения целого символа с полноразмерным шаблоном.
Технический результат состоит в увеличении точности и помехозащищенности распознавания объектов изображения.
Указанный технический результат достигается предварительным назначением надежно распознаваемых графических конструкций ограниченного числа разновидностей - типовых элементов (типовых графических конструкций) - в качестве элементов, из которых могут состоять распознаваемые объекты.
Указанные типовые элементы состоят из более чем одного наименьшего символа изображения.
Каждый распознаваемый объект описывают, как состоящий из одного или более заранее назначенных типовых элементов, как из частей с указанием их взаимных пространственно-параметрических соотношений. Причем в одном распознаваемом объекте могут присутствовать типовые элементы одного или (более) нескольких видов. Они могут отличаться относительным пространственным расположением, размерами и другими параметрами.
В качестве распознаваемых объектов могут быть графические элементы на изображении, элементы оформления документа, специальные графические элементы, используемые как реперы для навигации по документу, текстовые элементы, в том числе буквы печатного и/или рукописного шрифта.
Сущность изобретения состоит в следующем.
Предварительно назначают элементы одной или более разновидностей, встречающиеся на изображении, - типовые элементы, из которых могут состоять распознаваемые объекты. Например, отрезок прямой, окружность, овал, дуга и др.
Эти типовые элементы отличаются большей надежностью идентификации и распознавания на изображении, вследствие геометрической простоты.
Типовые элементы могут отличаться пространственно-параметрическими соотношениями. Например, для отрезка прямой это может быть длина, угол наклона, толщина линии (относительная или абсолютная); для дуги - это угол, радиус кривизны, ориентация и др.
Типовые элементы могут включать в себя части белого цвета или бесцветные области без черного или цветного изображения.
На фиг.1 показаны примеры простых типовых элементов.
В классификатор (словарь), используемый для распознавания объектов изображения (букв, реперов, др. элементов), заносят описание объекта в виде перечня типовых элементов, из которых состоит объект, их взаимного расположения и пространственно параметрических соотношений.
В классификатор также заносят все возможные варианты реализации изображения распознаваемого объекта, описанные как совокупность типовых элементов вместе с их взаимным расположением и относительными и/или абсолютными размерами. В указанном описании совокупности типовых элементов могут отличаться как составом типовых элементов, так и их пространственно-параметрическими соотношениями. Некоторые из возможных вариантов представления распознаваемого объекта изображения в виде наборов стандартных элементов на примере буквы "В" показаны на фиг.2.
Затем на изображении идентифицируют и распознают типовые элементы.
Выбирают группы типовых элементов. Для каждой группы типовых элементов выдвигают и проверяют гипотезу о принадлежности всех элементов группы в целом к одному предполагаемому объекту, описанному в классификаторе.
При недостаточно надежном результате проверки гипотезы выдвигают и проверяют гипотезу о принадлежности элементов группы в целом к другому предполагаемому объекту, описанному в классификаторе.
После проверки всех гипотез выбирают наиболее вероятный вариант распознаваемого объекта. В случае многозначного результата проверки гипотез используют дополнительную информацию или применяют дополнительные способы распознавания.
Типовые элементы могут образовывать более сложные типовые элементы путем объединения в различные сочетания разных и/или одинаковых элементов с разным взаимным расположением и разными размерами, например крест, - объединение горизонтального и вертикального прямых отрезков.
Примеры сложных типовых элементов показаны на фиг.3.
Описание распознаваемого объекта может быть задано в виде альтернативы, как по составу типовых элементов, так и по их взаимным пространственно-параметрическим соотношениям.
Описание распознаваемого объекта может быть задано в виде интервала для одного или нескольких взаимных пространственно-параметрических соотношений.
Описание распознаваемого объекта может быть задано в виде совокупности типовых элементов, связанных отношениями математической логики, в том числе типа "И", типа "ИЛИ", типа "НЕ".
Взаимосвязи стандартных элементов в распознаваемом объекте могут быть выражены в виде более чем одноуровневой структуры.
Типовые элементы могут содержать элементы белого цвета, а также без цвета.
Изобретение промышленно применимо, поскольку использует для реализации широко известные приемы и математический аппарат.

Claims (25)

1. Способ распознавания объектов на изображении в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, распознаванием объектов, предварительным назначением по крайней мере одной графической конструкции, состоящей более чем из одной наименьшей единицы изображения, в качестве типового элемента, из которого может быть составлен как из частей по крайней мере один распознаваемый объект, предварительным представлением изображения по крайней мере одного распознаваемого объекта в виде совокупности указанных типовых элементов по крайней мере одного типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением следующей процедуры: поиска и идентификации изображения по крайней мере одного типового элемента, выбора по крайней мере одного найденного типового элемента для проверки на принадлежность распознаваемому объекту, выдвижения и проверки гипотезы о распознаваемом объекте по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.
2. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.
3. Способ по п. 1, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.
4. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.
5. Способ по п. 1, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.
6. Способ по п. 5, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.
7. Способ по п. 1, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.
8. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.
9. Способ по п. 1, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.
10. Способ по п. 1 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.
11. Способ по п. 1, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.
12. Способ по п. 1, отличающийся тем, что типовой элемент может быть составлен из более простых типовых элементов по крайней мере одной разновидности.
13. Способ по п. 1, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.
14. Способ распознавания текста на изображении документа в электронной форме, характеризующийся разбиением изображения на области, выделением текстовых и нетекстовых областей, выделением областей, содержащих изображения букв, распознаванием букв, предварительным назначением графической конструкции по крайней мере одной разновидности, состоящей из более чем одного минимального элемента изображения, в качестве типового элемента, из которого может быть составлено, как из частей, по крайней мере одно изображение буквы, предварительным представлением изображения по крайней мере одной буквы в виде совокупности указанных типовых элементов одного или более типа с их взаимными пространственно-параметрическими соотношениями, отличающийся выполнением процедуры поиска и идентификации на области, содержащей изображение буквы, изображения по крайней мере одного типового элемента по крайней мере одной разновидности; выбора всех найденных типовых элементов на области, содержащей изображение буквы для проверки на принадлежность букве, выдвижения и проверки гипотезы о виде буквы по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.
15. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде альтернативы.
16. Способ по п. 14, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта, задают в виде альтернативы.
17. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент, составляющий изображение распознаваемого объекта, задают в виде интервала.
18. Способ по п. 14, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.
19. Способ по п. 18, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов включает анализ совокупности элементов, связанных отношением типа И, анализ совокупности элементов, связанных отношением типа ИЛИ, анализ совокупности элементов, связанных отношением типа НЕ.
20. Способ по п. 14, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более чем одноуровневой структуры.
21. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.
22. Способ по п. 14, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.
23. Способ по п. 14 или 2, отличающийся тем, что в случае многозначного результата проверки гипотез используют дополнительную информацию.
24. Способ по п. 14, отличающийся тем, что в случае многозначного результата проверки гипотез применяют дополнительные способы распознавания.
25. Способ по п. 14, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в средство хранения и поиска.
RU2003118580/09A 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности RU2259592C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности
US10/657,008 US8036461B2 (en) 2003-06-24 2003-09-08 Method of graphical objects recognition using the integrity principle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности

Publications (2)

Publication Number Publication Date
RU2003118580A RU2003118580A (ru) 2004-12-27
RU2259592C2 true RU2259592C2 (ru) 2005-08-27

Family

ID=33538120

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности

Country Status (2)

Country Link
US (1) US8036461B2 (ru)
RU (1) RU2259592C2 (ru)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374914B2 (en) 2008-08-06 2013-02-12 Obschestvo S Ogranichennoi Otvetstvennostiu “Kuznetch” Advertising using image comparison
RU2701453C1 (ru) * 2018-06-25 2019-09-26 Михаил Григорьевич Блайвас Способ представления графических объектов

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9224040B2 (en) * 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
US9015573B2 (en) * 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US8571262B2 (en) 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US8861856B2 (en) 2007-09-28 2014-10-14 Abbyy Development Llc Model-based methods of document logical structure recognition in OCR systems
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems
US8116567B2 (en) * 2008-10-07 2012-02-14 International Business Machines Corporation Digitizing documents
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images
US9413912B2 (en) 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements
US10467507B1 (en) * 2017-04-19 2019-11-05 Amazon Technologies, Inc. Image quality scoring
CN107748888B (zh) * 2017-10-13 2019-11-08 众安信息技术服务有限公司 一种图像文本行检测方法及装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
DE69232493T2 (de) 1991-10-21 2003-01-09 Canon Kk Verfahren und Gerät zur Zeichenerkennung
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
US5838820A (en) * 1997-04-30 1998-11-17 Bergman; Anthony J. Pattern recognition apparatus and method
US7058240B2 (en) * 2002-10-18 2006-06-06 Lockheed Martin Corporation Adaptive system and method for pattern classification
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374914B2 (en) 2008-08-06 2013-02-12 Obschestvo S Ogranichennoi Otvetstvennostiu “Kuznetch” Advertising using image comparison
US8718383B2 (en) 2008-08-06 2014-05-06 Obschestvo s ogranischennoi otvetstvennostiu “KUZNETCH” Image and website filter using image comparison
US8762383B2 (en) 2008-08-06 2014-06-24 Obschestvo s organichennoi otvetstvennostiu “KUZNETCH” Search engine and method for image searching
RU2701453C1 (ru) * 2018-06-25 2019-09-26 Михаил Григорьевич Блайвас Способ представления графических объектов

Also Published As

Publication number Publication date
US8036461B2 (en) 2011-10-11
US20040264774A1 (en) 2004-12-30

Similar Documents

Publication Publication Date Title
US11922318B2 (en) System and method of character recognition using fully convolutional neural networks with attention
US10936862B2 (en) System and method of character recognition using fully convolutional neural networks
Eskenazi et al. A comprehensive survey of mostly textual document segmentation algorithms since 2008
Shafait et al. Table detection in heterogeneous documents
Fiel et al. Writer identification and retrieval using a convolutional neural network
US9665768B2 (en) Process of handwriting recognition and related apparatus
US4611346A (en) Method and apparatus for character recognition accommodating diacritical marks
US5764799A (en) OCR method and apparatus using image equivalents
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
CN110503054B (zh) 文本图像的处理方法及装置
KR20070110399A (ko) 인식 그래프
WO2018090011A1 (en) System and method of character recognition using fully convolutional neural networks
Hussain et al. Nastalique segmentation-based approach for Urdu OCR
Peng et al. Multi-font printed Mongolian document recognition system
CN107463866A (zh) 一种用于成绩评价的识别手写实验报告的方法
Anh et al. A hybrid method for table detection from document image
Mesleh et al. An optical character recognition
Pechwitz et al. Handwritten Arabic word recognition using the IFN/ENIT-database
Saabni Efficient recognition of machine printed Arabic text using partial segmentation and Hausdorff distance
Singh et al. Document layout analysis for Indian newspapers using contour based symbiotic approach
Kumar et al. Line based robust script identification for indianlanguages
Reul et al. Automatic Semantic Text Tagging on Historical Lexica by Combining OCR and Typography Classification: A Case Study on Daniel Sander's Wörterbuch der Deutschen Sprache
Sotoodeh et al. A music symbols recognition method using pattern matching along with integrated projection and morphological operation techniques
Dahllöf Scribe attribution for early medieval handwriting by means of letter extraction and classification and a voting procedure for larger pieces
Puri et al. Sentence detection and extraction in machine printed imaged document using matching technique

Legal Events

Date Code Title Description
HE4A Change of address of a patent owner
PC41 Official registration of the transfer of exclusive right

Effective date: 20141031

QB4A Licence on use of patent

Free format text: LICENCE

Effective date: 20151118

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20161213

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311