RU2003118580A - Способ распознавания графических объектов с использованием принципа целостности - Google Patents

Способ распознавания графических объектов с использованием принципа целостности

Info

Publication number
RU2003118580A
RU2003118580A RU2003118580/09A RU2003118580A RU2003118580A RU 2003118580 A RU2003118580 A RU 2003118580A RU 2003118580/09 A RU2003118580/09 A RU 2003118580/09A RU 2003118580 A RU2003118580 A RU 2003118580A RU 2003118580 A RU2003118580 A RU 2003118580A
Authority
RU
Russia
Prior art keywords
image
typical
elements
letter
recognized object
Prior art date
Application number
RU2003118580/09A
Other languages
English (en)
Other versions
RU2259592C2 (ru
Inventor
Константин Владимирович Анисимович
Александр Львович Шамис
Константин Алексеевич Зуев
Original Assignee
"Аби Софтвер Лтд."
Filing date
Publication date
Application filed by "Аби Софтвер Лтд." filed Critical "Аби Софтвер Лтд."
Priority to RU2003118580/09A priority Critical patent/RU2259592C2/ru
Priority claimed from RU2003118580/09A external-priority patent/RU2259592C2/ru
Priority to US10/657,008 priority patent/US8036461B2/en
Publication of RU2003118580A publication Critical patent/RU2003118580A/ru
Application granted granted Critical
Publication of RU2259592C2 publication Critical patent/RU2259592C2/ru

Links

Claims (14)

1. Способ распознавания объектов на изображении, характеризующийся
разбиением изображения на области, выделение текстовых и нетекстовых областей, распознавание объектов;
отличающийся
предварительным назначением по крайней мере одной графической конструкции, состоящей более, чем из одной наименьшей единицы изображения, в качестве типового элемента из которого может быть составлен, как из частей, по крайней мере один распознаваемый объект,
предварительным представлением изображения по крайней мере одного распознаваемого объекта в виде совокупности указанных типовых элементов по крайней мере одного типа вместе с их взаимными пространственно - параметрическими соотношениями, выполнением следующей процедуры
- поиска и идентификации изображения по крайней мере одного типового элемента,
- выбор по крайней мере одного найденного типового элемента для проверки на принадлежность распознаваемому объекту,
- выдвижение и проверка гипотезы о распознаваемом объекте по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.
2. Способ распознавания текста на изображении документа в электронной форме, характеризующийся
разбиением изображения на области,
выделением текстовых и нетекстовых областей,
выделением областей, содержащих изображения букв;
распознаванием букв;
отличающийся
предварительным назначением графической конструкции по крайне мере одной разновидности, состоящей из более, чем одного минимального элемента изображения, в качестве типового элемента из которого может быть составлено, как из частей, по крайней мере одно изображение буквы,
предварительным представлением изображения по крайней мере одной буквы в виде совокупности указанных типовых элементов одного или более типа с их взаимными пространственно - параметрическими соотношениями,
выполнением процедуры
- поиска и идентификации на области, содержащей изображение буквы, изображения по крайней мере одного типового элемента по крайней мере одной разновидности,
- выбор всех найденных типовых элементов на области, содержащей изображение буквы для проверки на принадлежность букве,
- выдвижение и проверка гипотезы о виде буквы по изображению, составленному из всей совокупности выбранных типовых элементов в целом с учетом их взаимных пространственно-параметрических соотношений.
3. Способ по п.п.1 или 2, отличающийся тем, что по крайней мере один типовой элемент составляющий изображение распознаваемого объекта задают в виде альтернативы.
4. Способ по п.п.1 или 2, отличающийся тем, что состав типовых элементов, образующих изображение распознаваемого объекта задают в виде альтернативы.
5. Способ по п.п.1 или 2, отличающийся тем, что по крайней мере один типовой элемент составляющий изображение распознаваемого объекта задают в виде интервала.
6. Способ по п.п.1 или 2, отличающийся тем, что по крайней мере часть изображения распознаваемого объекта состоит из типовых элементов, связанных отношениями математической логики.
7. Способ по п.6, отличающийся тем, что этап идентификации изображения распознаваемого объекта как совокупности изображения типовых элементов в том числе включает:
- анализ совокупности элементов, связанных отношением типа “И”,
- анализ совокупности элементов, связанных отношением типа “ИЛИ”,
- анализ совокупности элементов, связанных отношением типа “НЕ”.
8. Способ по п.п.1 или 2, отличающийся тем, что взаимосвязи типовых элементов в распознаваемом объекте выражают в виде более, чем одноуровневой структуры.
9. Способ по п.п.1 или 2, отличающийся тем, что по крайней мере один типовой элемент содержит единицы изображения белого цвета.
10. Способ по п.п.1 или 2, отличающийся тем, что по крайней мере один типовой элемент содержит прозрачные единицы изображения.
11. Способ по п.п.1 или 2, отличающийся тем, что в случае неоднозначного результата проверки гипотез используют дополнительную информацию.
12. Способ по п.п.1 или 2, отличающийся тем, что в случае неоднозначного результата проверки гипотез применяют дополнительные способы распознавания.
13. Способ по п.п.1 или 2, отличающийся тем, что типовой элемент может быть составлен из более простых типовых элементов по крайней мере одной разновидности.
14. Способ по п.п.1 или 2, отличающийся тем, что описание состава и взаимных пространственно-параметрических характеристик распознаваемого объекта в виде типовых элементов помещают в специальное средство хранения и поиска.
RU2003118580/09A 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности RU2259592C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности
US10/657,008 US8036461B2 (en) 2003-06-24 2003-09-08 Method of graphical objects recognition using the integrity principle

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности

Publications (2)

Publication Number Publication Date
RU2003118580A true RU2003118580A (ru) 2004-12-27
RU2259592C2 RU2259592C2 (ru) 2005-08-27

Family

ID=33538120

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2003118580/09A RU2259592C2 (ru) 2003-06-24 2003-06-24 Способ распознавания графических объектов с использованием принципа целостности

Country Status (2)

Country Link
US (1) US8036461B2 (ru)
RU (1) RU2259592C2 (ru)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9015573B2 (en) * 2003-03-28 2015-04-21 Abbyy Development Llc Object recognition and describing structure of graphical objects
US9224040B2 (en) * 2003-03-28 2015-12-29 Abbyy Development Llc Method for object recognition and describing structure of graphical objects
US8571262B2 (en) 2006-01-25 2013-10-29 Abbyy Development Llc Methods of object search and recognition
RU2006101908A (ru) * 2006-01-25 2010-04-27 Аби Софтвер Лтд. (Cy) Структурное описание документа, способ описания структуры графических объектов и способы их распознавания (варианты)
US9740692B2 (en) 2006-08-01 2017-08-22 Abbyy Development Llc Creating flexible structure descriptions of documents with repetitive non-regular structures
US8233714B2 (en) 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
US8260049B2 (en) * 2007-09-28 2012-09-04 Abbyy Software Ltd. Model-based method of document logical structure recognition in OCR systems
US8861856B2 (en) 2007-09-28 2014-10-14 Abbyy Development Llc Model-based methods of document logical structure recognition in OCR systems
US8762383B2 (en) 2008-08-06 2014-06-24 Obschestvo s organichennoi otvetstvennostiu “KUZNETCH” Search engine and method for image searching
US8116567B2 (en) * 2008-10-07 2012-02-14 International Business Machines Corporation Digitizing documents
US8023697B1 (en) 2011-03-29 2011-09-20 Kaspersky Lab Zao System and method for identifying spam in rasterized images
US9413912B2 (en) 2012-10-26 2016-08-09 Abbyy Development Llc Scanning device having a bed cover including a pattern of repeated design elements
US10467507B1 (en) * 2017-04-19 2019-11-05 Amazon Technologies, Inc. Image quality scoring
CN107748888B (zh) * 2017-10-13 2019-11-08 众安信息技术服务有限公司 一种图像文本行检测方法及装置
RU2701453C1 (ru) * 2018-06-25 2019-09-26 Михаил Григорьевич Блайвас Способ представления графических объектов

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
EP0539158A2 (en) 1991-10-21 1993-04-28 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5321768A (en) * 1992-09-22 1994-06-14 The Research Foundation, State University Of New York At Buffalo System for recognizing handwritten character strings containing overlapping and/or broken characters
US5838820A (en) * 1997-04-30 1998-11-17 Bergman; Anthony J. Pattern recognition apparatus and method
US7058240B2 (en) * 2002-10-18 2006-06-06 Lockheed Martin Corporation Adaptive system and method for pattern classification
US7283669B2 (en) * 2003-01-29 2007-10-16 Lockheed Martin Corporation Fine segmentation refinement for an optical character recognition system

Similar Documents

Publication Publication Date Title
Hao et al. A table detection method for pdf documents based on convolutional neural networks
CN107798136B (zh) 基于深度学习的实体关系抽取方法、装置及服务器
Diem et al. cBAD: ICDAR2017 competition on baseline detection
Simistira et al. Diva-hisdb: A precisely annotated large dataset of challenging medieval manuscripts
RU2003118580A (ru) Способ распознавания графических объектов с использованием принципа целостности
Ezaki et al. Text detection from natural scene images: towards a system for visually impaired persons
CN1103087C (zh) 光学扫描表单识别及更正方法
KR101376863B1 (ko) 문서 시각 구조의 문법 분석
CN108763380B (zh) 商标识别检索方法、装置、计算机设备和存储介质
CN104809142A (zh) 商标查询系统和方法
CN105930159A (zh) 一种基于图像的界面代码生成的方法及系统
Kesiman et al. AMADI_LontarSet: the first handwritten Balinese palm leaf manuscripts dataset
CN104657463A (zh) 应用于自动问答系统的问句分类方法及装置
RU2648638C2 (ru) Способы и системы эффективного автоматического распознавания символов, использующие множество кластеров эталонов символов
CN113360654B (zh) 文本分类方法、装置、电子设备及可读存储介质
CN109299470B (zh) 文本公告中触发词的抽取方法及系统
RU2259592C2 (ru) Способ распознавания графических объектов с использованием принципа целостности
Dershowitz et al. Computerized source criticism of biblical texts
CN109558591A (zh) 中文事件检测方法及装置
CN113377916A (zh) 一种面向法律文本的多关系中主要关系的抽取方法
CN116958957A (zh) 多模态特征提取网络的训练方法及三维特征表示方法
Clérice You Actually Look Twice At it (YALTAi): using an object detection approach instead of region segmentation within the Kraken engine
Yamazoe et al. Hypothesis preservation approach to scene text recognition with weighted finite-state transducer
CN110032716A (zh) 文字编码方法和装置、可读存储介质及电子设备
CN107122778B (zh) 一种单字区域的合并方法和装置