RU2604668C2 - Визуализация машинно-генерируемого изображения документа - Google Patents
Визуализация машинно-генерируемого изображения документа Download PDFInfo
- Publication number
- RU2604668C2 RU2604668C2 RU2014124525/08A RU2014124525A RU2604668C2 RU 2604668 C2 RU2604668 C2 RU 2604668C2 RU 2014124525/08 A RU2014124525/08 A RU 2014124525/08A RU 2014124525 A RU2014124525 A RU 2014124525A RU 2604668 C2 RU2604668 C2 RU 2604668C2
- Authority
- RU
- Russia
- Prior art keywords
- identifiers
- image
- document
- structural blocks
- lines
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/40—Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
Abstract
Description
Claims (21)
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
применение идентификаторов для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков.
использование идентификаторов, включающих (i) одиночные или множественные сплошные, штриховые, пунктирные, штрихпунктирные, ломаные или волнистые линии, имеющие участки одинаковой или разной ширины, или (ii) линии, образованные с использованием предварительно выбранных символов или предварительно выбранных геометрических эталонов.
размещение идентификаторов рядом с периферийными участками структурных блоков.
предложение пользователям, работающим с изображением документа, инструментов графического интерфейса пользователя (GUI) для применения, изменения или замены идентификаторов структурных блоков.
встраивание в машинно-генерируемое изображение документа примененных, измененных или замененных идентификаторов.
локальное, удаленное, распределенное или сетевое вычислительное устройство; и
память, локально или удаленно соединенную с вычислительным устройством и хранящую команды, исполнение которых на вычислительном устройстве приводит к выполнению вычислительным устройством следующих действий:
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
изображение документа обрабатывается методами оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR); и
структурные блоки содержат текстовые объекты, графические/изображаемые объекты или их комбинацию.
идентификаторы размещены рядом с периферийными участками структурных блоков; и
идентификаторы включают в себя (i) линии одинакового или разных цветов или (ii) линии, имеющие элементы разных цветов.
пользователям, работающим с изображением документа, предлагаются инструменты графического пользовательского интерфейса (GUI) для применения, изменения и замены идентификаторов структурных блоков; и
примененные, измененные или замененные идентификаторы встраиваются в машинно-генерируемое изображение документа.
обнаружение структурных блоков или их фрагментов на изображении документа с использованием технологии оптического распознавания символов; и
снабжение обнаруженных на изображении документа структурных блоков или их фрагментов визуально различимыми линейными идентификаторами, где каждый линейный идентификатор несет указание на свойства содержимого соответствующего структурного блока или его фрагмента, обнаруженные в ходе машинной интерпретации изображения;
отображение изображения документа, снабженного визуально различимыми линейными идентификаторами.
обработка изображения документа с использованием методов оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR).
применение идентификаторов для выборочного разделения, подчеркивания или штриховки по меньшей мере фрагментов структурных блоков; и
использование идентификаторов, содержащих (i) одиночные или множественные сплошные, штриховые, пунктирные, штрихпунктирные, ломаные или волнистые линии, имеющие участки одинаковой или разной ширины, или (ii) линии, образованные с использованием предварительно выбранных символов или предварительно выбранных геометрических эталонов.
размещение идентификаторов рядом с периферийными участками структурных блоков; и
использование идентификаторов, включающих в себя (i) линии одинакового или разных цветов или (ii) линии, имеющие элементы разных цветов.
предложение пользователям, работающим с изображением документа, инструментов графического интерфейса пользователя (GUI) для применения, изменения или замены идентификаторов структурных блоков; и
встраивание в машинно-генерируемое изображение документа примененных, измененных или замененных идентификаторов.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014124525/08A RU2604668C2 (ru) | 2014-06-17 | 2014-06-17 | Визуализация машинно-генерируемого изображения документа |
US14/508,617 US20150363658A1 (en) | 2014-06-17 | 2014-10-07 | Visualization of a computer-generated image of a document |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU2014124525/08A RU2604668C2 (ru) | 2014-06-17 | 2014-06-17 | Визуализация машинно-генерируемого изображения документа |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2014124525A RU2014124525A (ru) | 2015-12-27 |
RU2604668C2 true RU2604668C2 (ru) | 2016-12-10 |
Family
ID=54836422
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014124525/08A RU2604668C2 (ru) | 2014-06-17 | 2014-06-17 | Визуализация машинно-генерируемого изображения документа |
Country Status (2)
Country | Link |
---|---|
US (1) | US20150363658A1 (ru) |
RU (1) | RU2604668C2 (ru) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2295154C1 (ru) * | 2005-06-16 | 2007-03-10 | "Аби Софтвер Лтд." | Способ распознавания текстовой информации из графического файла с использованием словарей и дополнительных данных |
US7400768B1 (en) * | 2001-08-24 | 2008-07-15 | Cardiff Software, Inc. | Enhanced optical recognition of digitized images through selective bit insertion |
RU2437152C2 (ru) * | 2007-06-29 | 2011-12-20 | Кэнон Кабусики Кайся | Устройство обработки изображений, способ и компьютерная программа обработки изображений |
US8718367B1 (en) * | 2009-07-10 | 2014-05-06 | Intuit Inc. | Displaying automatically recognized text in proximity to a source image to assist comparibility |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434962A (en) * | 1990-09-07 | 1995-07-18 | Fuji Xerox Co., Ltd. | Method and system for automatically generating logical structures of electronic documents |
US5937084A (en) * | 1996-05-22 | 1999-08-10 | Ncr Corporation | Knowledge-based document analysis system |
US6562077B2 (en) * | 1997-11-14 | 2003-05-13 | Xerox Corporation | Sorting image segments into clusters based on a distance measurement |
US6694053B1 (en) * | 1999-12-02 | 2004-02-17 | Hewlett-Packard Development, L.P. | Method and apparatus for performing document structure analysis |
US7050630B2 (en) * | 2002-05-29 | 2006-05-23 | Hewlett-Packard Development Company, L.P. | System and method of locating a non-textual region of an electronic document or image that matches a user-defined description of the region |
US20040080795A1 (en) * | 2002-10-23 | 2004-04-29 | Bean Heather N. | Apparatus and method for image capture device assisted scanning |
US8571264B2 (en) * | 2003-09-08 | 2013-10-29 | Abbyy Development Llc | Method of using structural models for optical recognition |
US8054495B2 (en) * | 2004-04-07 | 2011-11-08 | Hewlett-Packard Development Company, L.P. | Digital documents, apparatus, methods and software relating to associating an identity of paper printed with digital pattern with equivalent digital documents |
US20060062453A1 (en) * | 2004-09-23 | 2006-03-23 | Sharp Laboratories Of America, Inc. | Color highlighting document image processing |
US8706475B2 (en) * | 2005-01-10 | 2014-04-22 | Xerox Corporation | Method and apparatus for detecting a table of contents and reference determination |
US7937653B2 (en) * | 2005-01-10 | 2011-05-03 | Xerox Corporation | Method and apparatus for detecting pagination constructs including a header and a footer in legacy documents |
JP4443443B2 (ja) * | 2005-03-04 | 2010-03-31 | 富士通株式会社 | 文書画像レイアウト解析プログラム、文書画像レイアウト解析装置、および文書画像レイアウト解析方法 |
US7392473B2 (en) * | 2005-05-26 | 2008-06-24 | Xerox Corporation | Method and apparatus for determining logical document structure |
US20060290789A1 (en) * | 2005-06-22 | 2006-12-28 | Nokia Corporation | File naming with optical character recognition |
US7826665B2 (en) * | 2005-12-12 | 2010-11-02 | Xerox Corporation | Personal information retrieval using knowledge bases for optical character recognition correction |
JP4973063B2 (ja) * | 2006-08-14 | 2012-07-11 | 富士通株式会社 | 表データ処理方法及び装置 |
JP4835459B2 (ja) * | 2007-02-16 | 2011-12-14 | 富士通株式会社 | 表認識プログラム、表認識方法および表認識装置 |
US8260049B2 (en) * | 2007-09-28 | 2012-09-04 | Abbyy Software Ltd. | Model-based method of document logical structure recognition in OCR systems |
US8035855B2 (en) * | 2008-02-01 | 2011-10-11 | Xerox Corporation | Automatic selection of a subset of representative pages from a multi-page document |
US8107766B2 (en) * | 2008-04-03 | 2012-01-31 | Abbyy Software Ltd. | Method and system for straightening out distorted text-lines on images |
US8787690B2 (en) * | 2008-11-12 | 2014-07-22 | Abbyy Development Llc | Binarizing an image |
US8452086B2 (en) * | 2009-07-10 | 2013-05-28 | Palo Alto Research Center Incorporated | System and user interface for machine-assisted human labeling of pixels in an image |
US8340425B2 (en) * | 2010-08-10 | 2012-12-25 | Xerox Corporation | Optical character recognition with two-pass zoning |
US9223769B2 (en) * | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
US9080882B2 (en) * | 2012-03-02 | 2015-07-14 | Qualcomm Incorporated | Visual OCR for positioning |
US9008443B2 (en) * | 2012-06-22 | 2015-04-14 | Xerox Corporation | System and method for identifying regular geometric structures in document pages |
US20140067631A1 (en) * | 2012-09-05 | 2014-03-06 | Helix Systems Incorporated | Systems and Methods for Processing Structured Data from a Document Image |
US9223756B2 (en) * | 2013-03-13 | 2015-12-29 | Adobe Systems Incorporated | Method and apparatus for identifying logical blocks of text in a document |
US9092688B2 (en) * | 2013-08-28 | 2015-07-28 | Cisco Technology Inc. | Assisted OCR |
-
2014
- 2014-06-17 RU RU2014124525/08A patent/RU2604668C2/ru active
- 2014-10-07 US US14/508,617 patent/US20150363658A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7400768B1 (en) * | 2001-08-24 | 2008-07-15 | Cardiff Software, Inc. | Enhanced optical recognition of digitized images through selective bit insertion |
RU2295154C1 (ru) * | 2005-06-16 | 2007-03-10 | "Аби Софтвер Лтд." | Способ распознавания текстовой информации из графического файла с использованием словарей и дополнительных данных |
RU2437152C2 (ru) * | 2007-06-29 | 2011-12-20 | Кэнон Кабусики Кайся | Устройство обработки изображений, способ и компьютерная программа обработки изображений |
US8718367B1 (en) * | 2009-07-10 | 2014-05-06 | Intuit Inc. | Displaying automatically recognized text in proximity to a source image to assist comparibility |
Also Published As
Publication number | Publication date |
---|---|
US20150363658A1 (en) | 2015-12-17 |
RU2014124525A (ru) | 2015-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6226407B1 (en) | Method and apparatus for analyzing computer screens | |
CA2676487C (en) | Method for emphasizing differences in graphical appearance between an original document and a modified document with annotations | |
US20150169995A1 (en) | Method and apparatus for finding differences in documents | |
US9772805B2 (en) | Information processor and digital plate inspection method | |
AU2019229348B2 (en) | Pre-filtering for visual object searching of documents | |
JP2010073099A (ja) | 評価装置、評価方法およびプログラム | |
US9008425B2 (en) | Detection of numbered captions | |
US20180321805A1 (en) | Method for automatically applying page labels using extracted label contents from selected pages | |
RU2605078C2 (ru) | Сегментация изображения для верификации данных | |
US11303769B2 (en) | Image processing system that computerizes documents with notification of labeled items, control method thereof, and storage medium | |
US9569146B2 (en) | Information processor and automatic page replacement method | |
CN113704111A (zh) | 页面自动化测试方法、装置、设备及存储介质 | |
RU2604668C2 (ru) | Визуализация машинно-генерируемого изображения документа | |
CN112084103B (zh) | 界面测试方法、装置、设备和介质 | |
RU2641452C2 (ru) | Неполные эталоны | |
JP2009087270A (ja) | 画像処理装置及びプログラム | |
CN112015634A (zh) | 页面结构信息生成方法、装置和电子设备 | |
JP5402936B2 (ja) | Gui評価システム、gui評価方法およびgui評価用プログラム | |
CN114821618A (zh) | 一种ofd阅读软件显示效果的分析方法 | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
Chan et al. | Application of optical character recognition in thermal image processing | |
US11228687B2 (en) | Image processing system that computerizes document, control method thereof, and storage medium | |
JP7178445B2 (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7317886B2 (ja) | 情報処理装置及び情報処理方法 | |
JP4548062B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
QZ41 | Official registration of changes to a registered agreement (patent) |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20170613 |
|
QZ41 | Official registration of changes to a registered agreement (patent) |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20171031 |
|
QC41 | Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20180710 |
|
PC43 | Official registration of the transfer of the exclusive right without contract for inventions |
Effective date: 20181121 |
|
QB4A | Licence on use of patent |
Free format text: LICENCE FORMERLY AGREED ON 20201211 Effective date: 20201211 |
|
QC41 | Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right |
Free format text: LICENCE FORMERLY AGREED ON 20201211 Effective date: 20220311 |