RU2166207C2 - Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения - Google Patents
Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения Download PDFInfo
- Publication number
- RU2166207C2 RU2166207C2 RU99106483/09A RU99106483A RU2166207C2 RU 2166207 C2 RU2166207 C2 RU 2166207C2 RU 99106483/09 A RU99106483/09 A RU 99106483/09A RU 99106483 A RU99106483 A RU 99106483A RU 2166207 C2 RU2166207 C2 RU 2166207C2
- Authority
- RU
- Russia
- Prior art keywords
- semantic units
- error
- units
- auxiliary data
- elements
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
Abstract
Description
В качестве кратких сведений, раскрывающих сущность изобретения следует отметить, что достигаемый технический результат обеспечивают с помощью предложенного способа использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения, заключающегося в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n1 составляющих их элементов, где n1 - выбирают в пределах 1 ≤ n ≤ 103. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n1 элементов, где n1 выбирают в пределах 1 ≤ (n1+n)/n ≤ 2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε выбираемой в пределах 0 ≤ ε ≤ (αn1-1)/n1. Здесь α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от частоты fi появления любой смысловой i-й единицы в допустимом множестве смысловых единиц, которую определяют как количество n2 повторений конкретной смысловой единицы, соотнесенное с общим количеством n3 смысловых единиц в допустимом множестве смысловых единиц.
При изложении сведений, подтверждающих возможность осуществления изобретения целесообразно более подробно описать предложенный способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов и соответствующих им фрагментов изображения. Детально целесообразно остановиться только на существенных особенностях осуществления операций предложенного способа, заключающегося в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n составляющих их элементов, где n - выбирают в пределах 1 ≤ n ≤ 103. Смысловыми единицами могут быть в произвольном случае буквы, математические и другие символы, отдельные слова, предложение, графические элементы, а также их любые сочетания. В отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n1 элементов, где n1 выбирают в пределах 1 ≤ (n1+n)/n ≤ 2. Осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε, выбираемой в пределах 0 ≤ ε ≤ (αn1-1)/n1. Здесь α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от частоты fi появления любой смысловой i-й единицы в допустимом множестве смысловых единиц, которую определяют как количество n2 повторений конкретной смысловой единицы, соотнесенное с общим количеством n3 смысловых единиц в допустимом множестве смысловых единиц. Фрагментами могут быть как смысловые единицы в целом, так и их части, ориентированные, например, на автономное применение. Погрешность преобразования в основном связана с качеством исходных графических изображений, которое определяется, в частности, тем, что предъявляют для распознавания, например, изготовленное на ксерокопировальном аппарате изображение, факсограмму, машинописный или рукописный текст.
Компьютерный код в заявленном объекте, как уже указывалось, - это преобразуемая компьютером совокупность электромагнитных сигналов, адекватно соответствующих распознаваемым исходным символам или любым другим распознаваемым фрагментам исходной информации. Каждый из эталонов совокупности динамических растровых эталонов, образующих периодическую структуру, представляет собой, например, упорядоченный набор электромагнитных сигналов или соответствующих рельефно намагниченных фрагментов жесткого диска. Динамические свойства растровых эталонов определяют временными параметрами их преобразования.
Claims (1)
- Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения, заключающийся в том, что производят выборку смысловых единиц распознаваемых фрагментов изображения, содержащих n составляющих их элементов, где n выбирают в пределах 1 ≤ n ≤ 103, в отобранных выборках выделяют подлежащие верификации совокупности их фрагментов изображения, содержащие n1 элементов, где n1 выбирают в пределах 1 ≤(n1 + n)/n ≤ 2, осуществляют поиск во вспомогательном массиве данных смысловых единиц, отличающихся от выделенных совокупностей фрагментов изображения, с погрешностью ε, выдираемой в пределах 0 ≤ ε ≤ (αn1-1)/n1 где α - экспериментальный коэффициент в пределах 0,6 ≤ α ≤ 1,2, выбираемый в зависимости от части fi появления любой смысловой i-ой единицы в допустимом множестве смысловых единиц, которую определяют как количество n2 повторений конкретной смысловой единицы, соотнесенное с общим количеством n3 смысловых единиц в допустимом множестве смысловых единиц, выявляют в распознанных смысловых единицах элементы, которые не совпадают с эквивалентными им по месту расположения символами в смысловых единицах, найденных в процессе поиска, и производят их замену соответствующими им по месту расположения символами из найденных смысловых единиц, формируют дополнительный массив динамических растровых эталонов компьютерных кодов элементов в составе распознаваемых смысловых единиц количеством n7, величину которого выбирают в пределах 1≤(n2 + n5 + n6 + β n7 + n3)/ n3 ≤ 6,3, где β - экспериментальный коэффициент в пределах 0,4 ≤ β ≤ 1,3, выбираемый в зависимости от задаваемых погрешности ε1 вспомогательного массива данных по отношению к допустимому множеству смысловых единиц, определяемой как вероятность ненахождения в массиве данных элемента nj, в общем количестве смысловых единиц n4 во вспомогательном массиве данных, и погрешности ε2 преобразования, определяемой как количество n5 ошибочно преобразованных элементов, соотнесенное с общим количеством n6 элементов в преобразуемом наборе смысловых элементов из их допустимого множества, и преобразуют вспомогательный массив данных до уменьшения погрешности ε3 способа, которую выбирают по отношению к погрешности ε1 в пределах 1 ≤ (ε1+ε3)/ε1≤ 2.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU99106483/09A RU2166207C2 (ru) | 1999-04-08 | 1999-04-08 | Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения |
PCT/RU2000/000111 WO2000062196A1 (fr) | 1999-04-08 | 2000-04-04 | Procede d'utilisation de blocs auxiliaires de donnees dans un processus de conversion et/ou de verification de codes informatiques et d'originaux leur correspondant |
AU36845/00A AU3684500A (en) | 1999-04-08 | 2000-04-04 | Method for using auxiliary data blocks during the conversion and/or verificationprocess of computer codes and of their corresponding originals |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
RU99106483/09A RU2166207C2 (ru) | 1999-04-08 | 1999-04-08 | Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2166207C2 true RU2166207C2 (ru) | 2001-04-27 |
Family
ID=20217845
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU99106483/09A RU2166207C2 (ru) | 1999-04-08 | 1999-04-08 | Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения |
Country Status (3)
Country | Link |
---|---|
AU (1) | AU3684500A (ru) |
RU (1) | RU2166207C2 (ru) |
WO (1) | WO2000062196A1 (ru) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7967217B2 (en) | 2002-09-26 | 2011-06-28 | Kenji Yoshida | Information reproduction/i/o method using dot pattern, information reproduction device, mobile information i/o device, and electronic toy |
US8315484B2 (en) | 2006-02-17 | 2012-11-20 | Lumex As | Method and system for verification of uncertainly recognized words in an OCR system |
RU2485579C2 (ru) * | 2008-12-23 | 2013-06-20 | Майкрософт Корпорейшн | Обработка электронных чернил |
US9400951B2 (en) | 2005-07-01 | 2016-07-26 | Grid Ip Pte Ltd | Dot pattern |
US9582701B2 (en) | 2005-04-28 | 2017-02-28 | Kenji Yoshida | Information input/output method using dot pattern |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
US5734883A (en) * | 1995-04-27 | 1998-03-31 | Michael Umen & Co., Inc. | Drug document production system |
RU2112273C1 (ru) * | 1995-08-28 | 1998-05-27 | Олег Яковлевич Сивков | Система устройств для интерпретации понятий образными представлениями |
US5850480A (en) * | 1996-05-30 | 1998-12-15 | Scan-Optics, Inc. | OCR error correction methods and apparatus utilizing contextual comparison |
RU2096825C1 (ru) * | 1996-10-14 | 1997-11-20 | Общество с ограниченной ответственностью "Информбюро" | Устройство обработки информации для информационного поиска |
EP0950226A4 (en) * | 1996-11-25 | 2002-09-25 | Metrologic Instr Inc | SYSTEM AND METHOD FOR PERFORMING INFORMATION-ORIENTED TRANSACTIONS |
-
1999
- 1999-04-08 RU RU99106483/09A patent/RU2166207C2/ru active
-
2000
- 2000-04-04 WO PCT/RU2000/000111 patent/WO2000062196A1/ru active Application Filing
- 2000-04-04 AU AU36845/00A patent/AU3684500A/en not_active Abandoned
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7967217B2 (en) | 2002-09-26 | 2011-06-28 | Kenji Yoshida | Information reproduction/i/o method using dot pattern, information reproduction device, mobile information i/o device, and electronic toy |
US9372548B2 (en) | 2002-09-26 | 2016-06-21 | Kenji Yoshida | Information reproduction/I/O method using dot pattern, information reproduction device, mobile information I/O device, and electronic toy using dot pattern |
US9773140B2 (en) | 2002-09-26 | 2017-09-26 | Kenji Yoshida | Information reproduction/I/O method using dot pattern, information reproduction device, mobile information I/O device, and electronic toy using dot pattern |
US9946964B2 (en) | 2002-09-26 | 2018-04-17 | Kenji Yoshida | Information reproducing method, information inputting/outputting method, information reproducing device, portable information inputting/outputting device and electronic toy using dot pattern |
US9984317B2 (en) | 2002-09-26 | 2018-05-29 | Kenji Yoshida | Information reproducing method, information inputting / outputting method, information reproducing device, portable information inputting/ outputting device and electronic toy using dot pattern |
US10192154B2 (en) | 2002-09-26 | 2019-01-29 | Kenji Yoshida | Information reproduction/I/O method using dot pattern, information reproduction device, mobile information I/O device, and electronic toy using dot pattern |
US10339431B2 (en) | 2002-09-26 | 2019-07-02 | Kenji Yoshida | Information reproduction/I/O method using dot pattern, information reproduction device, mobile information I/O device, and electronic toy using dot pattern |
US9582701B2 (en) | 2005-04-28 | 2017-02-28 | Kenji Yoshida | Information input/output method using dot pattern |
US9400951B2 (en) | 2005-07-01 | 2016-07-26 | Grid Ip Pte Ltd | Dot pattern |
US8315484B2 (en) | 2006-02-17 | 2012-11-20 | Lumex As | Method and system for verification of uncertainly recognized words in an OCR system |
RU2485579C2 (ru) * | 2008-12-23 | 2013-06-20 | Майкрософт Корпорейшн | Обработка электронных чернил |
Also Published As
Publication number | Publication date |
---|---|
WO2000062196A1 (fr) | 2000-10-19 |
AU3684500A (en) | 2000-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7106905B2 (en) | Systems and methods for processing text-based electronic documents | |
JP3139521B2 (ja) | 自動言語決定装置 | |
US7499588B2 (en) | Low resolution OCR for camera acquired documents | |
EP0439951B1 (en) | Data processing | |
JP2726568B2 (ja) | 文字認識方法及び装置 | |
US7240062B2 (en) | System and method for creating a searchable word index of a scanned document including multiple interpretations of a word at a given document location | |
JP3232143B2 (ja) | 復号していない文書画像の修正版を自動的に作成するための装置 | |
EP2166488A2 (en) | Handwritten word spotter using synthesized typed queries | |
US7162086B2 (en) | Character recognition apparatus and method | |
KR100627195B1 (ko) | 광학문자인식으로 생성된 전자문서 검색방법 및 그 시스템 | |
US20060285746A1 (en) | Computer assisted document analysis | |
JPH0772906B2 (ja) | 文書認識装置 | |
JP5430312B2 (ja) | データ処理装置、データ名生成方法及びコンピュータプログラム | |
RU2166207C2 (ru) | Способ использования вспомогательных массивов данных в процессе преобразования и/или верификации компьютерных кодов, выполненных в виде символов, и соответствующих им фрагментов изображения | |
WO1997004409A1 (fr) | Dispositif de recherche de fichiers | |
CN112905733A (zh) | 一种基于ocr识别技术的图书保存方法、系统及装置 | |
JPH10177623A (ja) | 文書認識装置および言語処理装置 | |
Puigcerver et al. | Advances in handwritten keyword indexing and search technologies | |
JP2003331214A (ja) | 文字認識誤り訂正方法、装置及びプログラム | |
RU2166209C2 (ru) | Способ построения динамических растровых эталонов компьютерных кодов, выполненных в виде символов, в процессе распознавания соответствующих им фрагментов изображения | |
Walker et al. | A synthetic document image dataset for developing and evaluating historical document processing methods | |
Borpuzari et al. | A Framework for Pre Processing, Recognizing and Distributed Proofreading of Assamese Printed Text | |
JPH06348889A (ja) | 文字認識装置 | |
JPH05120471A (ja) | 文字認識装置 | |
JPH0589279A (ja) | 文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
HE4A | Change of address of a patent owner | ||
PC41 | Official registration of the transfer of exclusive right |
Effective date: 20141031 |
|
QB4A | Licence on use of patent |
Free format text: LICENCE Effective date: 20151118 |
|
QZ41 | Official registration of changes to a registered agreement (patent) |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20161213 |
|
QZ41 | Official registration of changes to a registered agreement (patent) |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20170613 |
|
QZ41 | Official registration of changes to a registered agreement (patent) |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20171031 |
|
QC41 | Official registration of the termination of the licence agreement or other agreements on the disposal of an exclusive right |
Free format text: LICENCE FORMERLY AGREED ON 20151118 Effective date: 20180710 |
|
PC43 | Official registration of the transfer of the exclusive right without contract for inventions |
Effective date: 20181121 |