RU2013156782A - Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами - Google Patents

Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами Download PDF

Info

Publication number
RU2013156782A
RU2013156782A RU2013156782/08A RU2013156782A RU2013156782A RU 2013156782 A RU2013156782 A RU 2013156782A RU 2013156782/08 A RU2013156782/08 A RU 2013156782/08A RU 2013156782 A RU2013156782 A RU 2013156782A RU 2013156782 A RU2013156782 A RU 2013156782A
Authority
RU
Russia
Prior art keywords
elements
document
flexible structural
structural description
image
Prior art date
Application number
RU2013156782/08A
Other languages
English (en)
Other versions
RU2603492C2 (ru
Inventor
Сергей Владимирович Голубев
Ирина Зосимовна Филимонова
Сергей Алексеевич Злобин
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2013156782/08A priority Critical patent/RU2603492C2/ru
Priority to US14/533,530 priority patent/US9740692B2/en
Publication of RU2013156782A publication Critical patent/RU2013156782A/ru
Application granted granted Critical
Publication of RU2603492C2 publication Critical patent/RU2603492C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/192Recognition using electronic means using simultaneous comparisons or correlations of the image signals with a plurality of references
    • G06V30/194References adjustable by an adaptive method, e.g. learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)
  • Image Analysis (AREA)

Abstract

1. Метод создания гибкого структурного описания, содержащий:получение изображения документа определенного типа, содержащего таблицу;получение позиции описывающей запись в таблице;поиск элементов заголовка на основе позиции;обнаружение полей данных и опорных элементов для позиции таблицы;создание, используя процессор, гибкого структурного описания для документа определенного типа, включающего набор элементов поиска для каждого из полей данных на изображении документа, а также элементов заголовка;наложение гибкого структурного описания на изображение иизвлечение данных из изображения в соответствии с параметрами гибкого структурного описания наложением гибкого структурного описания на изображение.2. Метод по п. 1, дополнительно включающий корректировку, используя процессор, гибкого структурного описания на основе пользовательских исправлений обнаруженных полей данных, элементов заголовка и/или опорных элементов.3. Метод по п. 1, в котором таблица занимает несколько страниц документа и в котором элементы заголовка повторяются на двух или более страницах многостраничного документа.4. Метод по п. 1, в котором создание гибкого структурного описания включает определение опорных элементов для поиска полей данных.5. Метод по п. 1, в котором создание гибкого структурного описания включает генерирование значений поисковых параметров для каждого отдельного элемента или поля.6. Метод по п. 1, в котором наложение гибкого структурного описания на изображение включает:сопоставление элементов заголовка на каждой странице документа;исключение сопоставленных элементов заголовка из области поиска документа ипоиск

Claims (20)

1. Метод создания гибкого структурного описания, содержащий:
получение изображения документа определенного типа, содержащего таблицу;
получение позиции описывающей запись в таблице;
поиск элементов заголовка на основе позиции;
обнаружение полей данных и опорных элементов для позиции таблицы;
создание, используя процессор, гибкого структурного описания для документа определенного типа, включающего набор элементов поиска для каждого из полей данных на изображении документа, а также элементов заголовка;
наложение гибкого структурного описания на изображение и
извлечение данных из изображения в соответствии с параметрами гибкого структурного описания наложением гибкого структурного описания на изображение.
2. Метод по п. 1, дополнительно включающий корректировку, используя процессор, гибкого структурного описания на основе пользовательских исправлений обнаруженных полей данных, элементов заголовка и/или опорных элементов.
3. Метод по п. 1, в котором таблица занимает несколько страниц документа и в котором элементы заголовка повторяются на двух или более страницах многостраничного документа.
4. Метод по п. 1, в котором создание гибкого структурного описания включает определение опорных элементов для поиска полей данных.
5. Метод по п. 1, в котором создание гибкого структурного описания включает генерирование значений поисковых параметров для каждого отдельного элемента или поля.
6. Метод по п. 1, в котором наложение гибкого структурного описания на изображение включает:
сопоставление элементов заголовка на каждой странице документа;
исключение сопоставленных элементов заголовка из области поиска документа и
поиск полей данных по области с исключенными сопоставленными элементами заголовка.
7. Метод по п. 1, в котором позиция соответствует ячейке таблицы, охватывающей несколько строчек документа.
8. Метод по п. 1, дополнительно содержащий получение по крайней мере двух позиций таблицы, включающих множество ячеек, которые перекрываются.
9. Система создания гибкого структурного описания, содержащая:
один или несколько электронных процессоров, выполненных с возможностью:
получения изображения документа определенного типа, содержащего таблицу;
получения позиции описывающей запись в таблице;
поиска элементов заголовка на основе позиции;
обнаружения полей данных и опорных элементов для позиции таблицы;
создания гибкого структурного описания для документа определенного типа, включающего набор элементов поиска для каждого из полей данных на изображении документа, а также элементов заголовка;
наложения гибкого структурного описания на изображение и
извлечения данных из изображения в соответствии с наложением гибкого структурного описания на изображение.
10. Система по п. 9, где один или более электронных процессоров дополнительно выполнены с возможностью корректировать гибкое структурное описание на основе пользовательских исправлений обнаруженных полей данных, элементов заголовка и/или опорных элементов.
11. Система по п. 9, в которой таблица занимает несколько страниц документа, и в которой элементы заголовка повторяются на двух или более страницах многостраничного документа.
12. Система по п. 9, в которой для создания гибкого структурного описания определенного типа документов один или более электронных процессоров выполнены с возможностью определения опорных элементов для поиска полей данных.
13. Система по п. 9, в которой для создания гибкого структурного описания определенного типа документов один или более электронных процессоров выполнены с возможностью генерировать значения поисковых параметров для каждого элемента или поля.
14. Система по п. 9, в которой для наложения гибкого структурного описания на изображение один или несколько процессоров выполнены с возможностью:
сопоставления элементов заголовка на каждой странице документа;
исключения сопоставленных элементов заголовка из области поиска документа и
поиска полей данных по области с исключенными сопоставленными элементами заголовка.
15. Система по п. 9, в которой позиция соответствует ячейке таблицы, охватывающей несколько строчек документа.
16. Система по п. 9, в которой один или несколько электронных процессоров дополнительно имеют возможность получения по крайней мере двух позиций таблицы, включающих множество ячеек, которые перекрываются.
17. Энергонезависимый машиночитаемый носитель информации, на котором хранятся инструкции по созданию гибкого структурного описания, содержащие:
инструкции по получению изображения документа определенного типа, содержащего таблицу;
инструкции по получению позиции, описывающей запись в таблице;
инструкции по поиску элементов заголовка на основе позиции;
инструкции по обнаружению полей данных и опорных элементов для позиции в таблице;
инструкции по созданию гибкого структурного описания для документа определенного типа, включающего набор элементов поиска для каждого из полей данных на изображении документа, а также элементов заголовка;
инструкции по наложению гибкого структурного описания на изображение и
инструкции по извлечению данных из изображения в соответствии с наложением гибкого структурного описания на изображение.
18. Энергонезависимый машиночитаемый носитель информации по п. 17, дополнительно содержащий инструкции по корректировке гибкого структурного описания на основе пользовательских исправлений обнаруженных полей данных элементов заголовка и/или опорных элементов.
19. Энергонезависимый машиночитаемый носитель информации по п. 17, в котором таблица занимает несколько страниц документа и в котором элементы заголовка повторяются на двух или более страницах многостраничного документа.
20. Энергонезависимый машиночитаемый носитель информации по п. 17, содержащий инструкции по созданию гибких структурных описаний для определенного типа документов, включая инструкции по определению опорных элементов для поиска полей данных.
RU2013156782/08A 2006-08-01 2013-12-20 Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами RU2603492C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2013156782/08A RU2603492C2 (ru) 2013-12-20 2013-12-20 Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами
US14/533,530 US9740692B2 (en) 2006-08-01 2014-11-05 Creating flexible structure descriptions of documents with repetitive non-regular structures

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2013156782/08A RU2603492C2 (ru) 2013-12-20 2013-12-20 Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами

Publications (2)

Publication Number Publication Date
RU2013156782A true RU2013156782A (ru) 2015-06-27
RU2603492C2 RU2603492C2 (ru) 2016-11-27

Family

ID=53497174

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2013156782/08A RU2603492C2 (ru) 2006-08-01 2013-12-20 Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами

Country Status (1)

Country Link
RU (1) RU2603492C2 (ru)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128466A (ja) * 1995-10-26 1997-05-16 Casio Comput Co Ltd 表処理方法及び表処理装置
RU2256224C1 (ru) * 2003-11-14 2005-07-10 Общество с ограниченной ответственностью "Информационные исследования" ("Изучение, Оценивание, Распознавание") База знаний по обработке, анализу и распознаванию изображений

Also Published As

Publication number Publication date
RU2603492C2 (ru) 2016-11-27

Similar Documents

Publication Publication Date Title
JP2012090264A5 (ru)
RU2013109235A (ru) Устройство обработки изображений, способ обработки изображений и машиночитаемый носитель информации
EA201491544A1 (ru) Извлечение поперечных данных моды sv из данных р волны морской сейсморазведки
RU2013101659A (ru) Способ и устройство детектирования локальных особенностей на изображении
RU2013156782A (ru) Создание гибких структурных описаний для документов с повторяющимися нерегулярными структурами
Michuta et al. Influence of chemical erosion on filtration consolidation of saline soils in nonisothermal conditions
Jiang et al. Research and development of vision based tactile display system using shape memory alloys
Ivanov Solution of the Optimal Ship Route Problem in the Framework of the OKEAN Geoinformation System
RU2017131044A (ru) Способы и системы для экспериментального планирования и анализа
Ivanišević et al. Recovering Lost Landscapes
Avalos Alvarez Sustainability: from a touristic perspective
Vassilakis et al. Recognition of strike-slip faulting on the supra-detachment basin of Messara (central Crete Island) with remote sensing image interpretation techniques
Tahmoush et al. Current research in micro-Doppler: Editorial for the special issue on micro-Doppler
Stavropoulou Optical Character Recognition on Scanned Maps for Information Extraction and Automated Georeference
RU2013156909A (ru) Способ динамического поиска блока информации по случайной выборке входных данных
Thvetkov et al. Ice Situation and Safe Navigation Monitoring System on the Northern Sea Route Based on Intelligent GIS
Iuliia Seasonal and interannual dynamics of frontal zones in the North Atlantic
Niroomand As Long As Your Heart Is In the Left Place: A Study of Left-Right Patterning In Cardiac Morphogenesis in Zebrafish
Greesan et al. A Practical Solution To Ground water Recharge by Rain Water Harvesting System In Pudukkottai Dist, Tamilnadu
Nikezić et al. Visitor Center as a Viable Alternative for Cultural Landscape: The Case of the Remains of the Trajan Bridge on the River Danube
Nedeljković et al. Detecting Concepts in Construction Project Documents using Statistical Measures for Semantic Similarity
Jaranilla et al. Outlined based geometric morphometric analysis in describing shape variation in suckermouth armoured catfishes (Pterygoplichthys spp.): Basis for the development of automated species identification system
JP2009123033A5 (ru)
Bormuth A deep sea detection prototype
Mecit Rum Seljuqs (473-641/1081-1243): ideology, mentality and self-image

Legal Events

Date Code Title Description
QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311