RU2014144496A - Сравнение документов с использованием достоверного источника - Google Patents

Сравнение документов с использованием достоверного источника Download PDF

Info

Publication number
RU2014144496A
RU2014144496A RU2014144496A RU2014144496A RU2014144496A RU 2014144496 A RU2014144496 A RU 2014144496A RU 2014144496 A RU2014144496 A RU 2014144496A RU 2014144496 A RU2014144496 A RU 2014144496A RU 2014144496 A RU2014144496 A RU 2014144496A
Authority
RU
Russia
Prior art keywords
document
image
text
character recognition
documents
Prior art date
Application number
RU2014144496A
Other languages
English (en)
Other versions
RU2597163C2 (ru
Inventor
Иван Петрович Хинцицкий
Андрей Анатольевич Исаев
Original Assignee
Общество с ограниченной ответственностью "Аби Девелопмент"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "Аби Девелопмент" filed Critical Общество с ограниченной ответственностью "Аби Девелопмент"
Priority to RU2014144496/08A priority Critical patent/RU2597163C2/ru
Priority to US14/588,670 priority patent/US9922247B2/en
Publication of RU2014144496A publication Critical patent/RU2014144496A/ru
Application granted granted Critical
Publication of RU2597163C2 publication Critical patent/RU2597163C2/ru

Links

Landscapes

  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)

Abstract

1. Способ, заключающийся в:сравнении изображений документов для выявления изображения первого документа из эталонного документа, которое соответствует изображению второго документа из сравниваемого документа;преобразовании второго изображения документа на основе разметки изображения первого документа; ивыполнении распознавания символов на изображении второго документа.2. Способ по п. 1, дополнительно содержащий: вычисление различия между сравниваемым документом и эталонным документом на основе результатов распознавания символов.3. Способ по п. 1, отличающийся тем, что сравнение изображений документов содержит сравнение по меньшей мере части первой разметки и первого текста, полученного с помощью распознавания символов на первом изображении документа, и по меньшей мере части второй разметки и второго текста, полученного путем распознавания символов на втором изображении документа.4. Способ по п. 3, отличающийся тем, что часть первого текста и часть второго текста включают слова, содержащие по меньшей мере заранее выбранное количество символов, а сравнение изображений документов дополнительно содержит вычисление расстояния редактирования между соответствующими словами.5. Способ по п. 1, отличающийся тем, что изображение первого документа состоит из изображения страницы первого документа.6. Способ по п. 1, отличающийся тем, что преобразование включает линейное преобразование изображения второго документа на основе положений трех точек на изображении первого документа и на изображении второго документа.7. Способ по п. 1, отличающийся тем, что распознавание символов в сравниваемом документе включает использование эталонног

Claims (20)

1. Способ, заключающийся в:
сравнении изображений документов для выявления изображения первого документа из эталонного документа, которое соответствует изображению второго документа из сравниваемого документа;
преобразовании второго изображения документа на основе разметки изображения первого документа; и
выполнении распознавания символов на изображении второго документа.
2. Способ по п. 1, дополнительно содержащий: вычисление различия между сравниваемым документом и эталонным документом на основе результатов распознавания символов.
3. Способ по п. 1, отличающийся тем, что сравнение изображений документов содержит сравнение по меньшей мере части первой разметки и первого текста, полученного с помощью распознавания символов на первом изображении документа, и по меньшей мере части второй разметки и второго текста, полученного путем распознавания символов на втором изображении документа.
4. Способ по п. 3, отличающийся тем, что часть первого текста и часть второго текста включают слова, содержащие по меньшей мере заранее выбранное количество символов, а сравнение изображений документов дополнительно содержит вычисление расстояния редактирования между соответствующими словами.
5. Способ по п. 1, отличающийся тем, что изображение первого документа состоит из изображения страницы первого документа.
6. Способ по п. 1, отличающийся тем, что преобразование включает линейное преобразование изображения второго документа на основе положений трех точек на изображении первого документа и на изображении второго документа.
7. Способ по п. 1, отличающийся тем, что распознавание символов в сравниваемом документе включает использование эталонного словаря, полученного из эталонного документа, причем этот эталонный словарь содержит слова только из конкретного текстового блока из изображения первого документа.
8. Система, содержащая:
память;
процессор, работающий с этой памятью, причем этот процессор обеспечивает:
сравнение изображений документов для выявления изображения первого документа из эталонного документа, которое соответствует изображению второго документа из сравниваемого документа;
преобразование изображения второго документа на основе разметки изображения первого документа; и
выполнение распознавания символов на изображении второго документа.
9. Система по п. 8, отличающаяся тем, что процессор дополнительно обеспечивает: вычисление различий между сравниваемым документом и эталонным документом на основе результатов распознавания символов.
10. Система по п. 8, отличающаяся тем, что сравнение изображений документов содержит сравнение по меньшей мере части первой разметки и первого текста, полученного посредством распознавания символов на изображении первого документа с по меньшей мере частью второй разметки и вторым текстом, полученным путем распознавания символов на изображении второго документа.
11. Система по п. 10, отличающаяся тем, что часть первого текста и часть второго текста содержат слова, имеющие по меньшей мере заранее заданное количество символов, а сравнение изображений документов дополнительно содержит вычисление расстояния редактирования между соответствующими словами.
12. Система по п. 8, отличающаяся тем, что изображение первого документа состоит из изображения страницы первого документа.
13. Система по п. 8, отличающаяся тем, что преобразование включает в себя линейное преобразование изображения второго документа на основе положений трех точек на изображении первого документа и на изображении второго документа.
14. Система по п. 8, отличающаяся тем, что распознавание символов на сравниваемом документе включает в себя использование эталонного словаря, полученного из эталонного документа, содержащего слова только из конкретного текстового блока в изображении первого документа.
15. Постоянный машиночитаемый носитель данных, содержащий исполняемые команды, которые при исполнении их вычислительным устройством приводят к выполнению операций, включающих в себя:
сравнение изображений документов для выявления изображения первого документа из эталонного документа, которое соответствует изображению второго документа из сравниваемого документа;
преобразовании изображения второго документа на основе разметки изображения первого документа; и
выполнение распознавания символов на изображении второго документа.
16. Постоянный машиночитаемый носитель данных по п. 15, дополнительно обеспечивающий расчет различий между сравниваемым документом и эталонным документом на основе результатов распознавания символов.
17. Постоянный машиночитаемый носитель данных по п. 15, отличающийся тем, что сравнение изображений документов содержит сравнение по меньшей мере части первой разметки и первого текста, полученного путем распознавания символов на изображении первого документа с по меньшей мере частью второй разметки и вторым текстом, полученными при распознавании символов на изображении второго документа.
18. Постоянный машиночитаемый носитель данных по п. 17, отличающийся тем, что часть первого текста и часть второго текста содержат слова, имеющие по меньшей мере заранее заданное число символов, а сравнение изображений документов дополнительно предполагает вычисление расстояния редактирования между соответствующими словами.
19. Постоянный машиночитаемый носитель данных по п. 15, отличающийся тем, что преобразование включает в себя линейное преобразование изображения второго документа на основе положений трех точек на изображении первого документа и на изображении второго документа.
20. Постоянный машиночитаемый носитель данных по п. 15, отличающийся тем, что распознавание символов в сравниваемом документе включает использование эталонного словаря, полученного из эталонного документа, причем эталонный словарь содержит слова только из конкретного текстового блока изображения первого документа.
RU2014144496/08A 2013-12-18 2014-11-06 Сравнение документов с использованием достоверного источника RU2597163C2 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2014144496/08A RU2597163C2 (ru) 2014-11-06 2014-11-06 Сравнение документов с использованием достоверного источника
US14/588,670 US9922247B2 (en) 2013-12-18 2015-01-02 Comparing documents using a trusted source

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2014144496/08A RU2597163C2 (ru) 2014-11-06 2014-11-06 Сравнение документов с использованием достоверного источника

Publications (2)

Publication Number Publication Date
RU2014144496A true RU2014144496A (ru) 2016-05-27
RU2597163C2 RU2597163C2 (ru) 2016-09-10

Family

ID=56097340

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014144496/08A RU2597163C2 (ru) 2013-12-18 2014-11-06 Сравнение документов с использованием достоверного источника

Country Status (1)

Country Link
RU (1) RU2597163C2 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2634194C1 (ru) * 2016-09-16 2017-10-24 Общество с ограниченной ответственностью "Аби Девелопмент" Верификация результатов оптического распознавания символов
RU2668717C1 (ru) * 2017-12-13 2018-10-02 Общество с ограниченной ответственностью "Аби Продакшн" Генерация разметки изображений документов для обучающей выборки
RU2721186C1 (ru) * 2019-07-22 2020-05-18 Общество с ограниченной ответственностью "Аби Продакшн" Оптическое распознавание символов документов с некопланарными областями
WO2023204724A1 (ru) * 2022-04-20 2023-10-26 Общество С Ограниченной Ответственностью "Дентонс Юроп" (Ооо "Дентонс Юроп") Способ анализа юридического документа

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4055385B2 (ja) * 2001-10-11 2008-03-05 富士ゼロックス株式会社 画像検査装置
JP2004348706A (ja) * 2003-04-30 2004-12-09 Canon Inc 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム
US8249344B2 (en) * 2005-07-01 2012-08-21 Microsoft Corporation Grammatical parsing of document visual structures
US7715045B2 (en) * 2006-10-31 2010-05-11 Pitney Bowes Inc. System and methods for comparing documents
US8472726B2 (en) * 2011-01-07 2013-06-25 Yuval Gronau Document comparison and analysis

Also Published As

Publication number Publication date
RU2597163C2 (ru) 2016-09-10

Similar Documents

Publication Publication Date Title
WO2015200110A3 (en) Techniques for machine language translation of text from an image based on non-textual context information from the image
EP2857983A3 (en) Analyzing font similarity for presentation
EP3136257A3 (en) Document-specific gazetteers for named entity recognition
SG11201900263SA (en) Method, device and server for recognizing characters of claim document, and storage medium
MX2016003769A (es) Metodo y dispositivo para extraccion de region.
PH12015000372A1 (en) Conversion of documents of different types to a uniform and an editable or a searchable format
RU2014112237A (ru) Ввод данных с изображений документов с фиксированной структурой
WO2016167919A3 (en) Pairing fonts for presentation
MX2016003774A (es) Metodo y aparato para identificacion de huella dactilar.
JP2015210683A5 (ru)
EP2833294A3 (en) Device to extract biometric feature vector, method to extract biometric feature vector and program to extract biometric feature vector
WO2014110206A3 (en) Advanced text editor
EP3104305A3 (en) Apparatus and method of reducing storage of handwritten strokes
MX365897B (es) Método y aparato para determinar similitud y terminal.
RU2015151699A (ru) Извлечение сущностей из текстов на естественном языке
RU2014144496A (ru) Сравнение документов с использованием достоверного источника
MX361142B (es) Método y aparato de reconocimiento de huellas dactilares.
SG10201806017WA (en) Disease detection system and disease detection method
PH12019501920A1 (en) Image processing method and apparatus
CN103488627B8 (zh) 全篇专利文献翻译方法及翻译系统
GB2551288A (en) Detecting the location of a mobile device based on semantic indicators
WO2014120851A3 (en) Method and system for visualizing documents
AU2017302245A1 (en) Optical character recognition utilizing hashed templates
EP2779037A3 (en) Information processing system and information processing method for comparing devices
PH12018550213A1 (en) System and method for learning-based group tagging

Legal Events

Date Code Title Description
QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20161213

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20170613

QZ41 Official registration of changes to a registered agreement (patent)

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20171031

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20151118

Effective date: 20180710

PC43 Official registration of the transfer of the exclusive right without contract for inventions

Effective date: 20181121

QB4A Licence on use of patent

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20201211

QC41 Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right

Free format text: LICENCE FORMERLY AGREED ON 20201211

Effective date: 20220311