KR950012276A - 인쇄된 문서의 광학 문자 인식(ocr)을 향상시키기 위한 방법 및 수단 - Google Patents

인쇄된 문서의 광학 문자 인식(ocr)을 향상시키기 위한 방법 및 수단 Download PDF

Info

Publication number
KR950012276A
KR950012276A KR1019940026443A KR19940026443A KR950012276A KR 950012276 A KR950012276 A KR 950012276A KR 1019940026443 A KR1019940026443 A KR 1019940026443A KR 19940026443 A KR19940026443 A KR 19940026443A KR 950012276 A KR950012276 A KR 950012276A
Authority
KR
South Korea
Prior art keywords
printed
document
text
check
sequences
Prior art date
Application number
KR1019940026443A
Other languages
English (en)
Inventor
피. 로프레스티 다니엘
샌드버그 조나단
Original Assignee
모리시따 요이찌
마쯔시다 덴기 산교 가부시끼가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 모리시따 요이찌, 마쯔시다 덴기 산교 가부시끼가이샤 filed Critical 모리시따 요이찌
Publication of KR950012276A publication Critical patent/KR950012276A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Electromagnetism (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Detection And Correction Of Errors (AREA)

Abstract

문서의 배치와 내용에 의존하고 생성 또는 처리 소프트웨어에 의해 할당되는 제1 값들을 포함하는 문서 마커는 인쇄된 형태의 문서 표면 상에 기계가 판독 가능한 기호 표시로 제공된다. 마커는 부호화된 문서 배치 정보와 원래의 텍스트의 시퀀스 상에 할당된 값들을 포함하는 데, 이 값들은 텍스트에 의존하는 데시메이션 시퀀스들, 에러 정정 코드들 또는 검사-합들을 포함한다. 광학 문자 인식으로 주사할 때 또는 다른 디지털화 재생을 할 때, 마커 역시 주사된다. 주사 컴퓨터는 대응되는 소프트웨어를 구비하고 있어 재생된 문서의 배치와 내용에 의존하는 제2 값들을 할당한다. 제1 및 제2 데시메이션 시퀀스를 비교할 때, 라인 및 문자 에러들이 검출되고 어떤 에러들은 정정되어 재배열된 시퀀스들을 생성하게 된다. 선택적인 정정 코드는 상기 재배열된 재생된 문서 시컨스들에 적용될 때 한층 나은 정정기능을 제공할 수 있으며, 재생된 시퀀스들의 정확도가 정확한지를 검증하기 위하여 선택적인 검사-합 비교가 이용될 수 있다.

Description

인쇄된 문서의 광학 문자 인식(OCR)을 향상시키기 위한 방법 및 수단
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제3도는 본 발명에 따라 생성된 문서를 예시한 도면.
제4도는 도표, 텍스트 블럭 및 사진을 포함하는 복잡한 문서를 예시한 도면.
제5A도 내지 제5F도는 제4도에 예시된 복잡한 문서의 배치를 부호화하기 위한 하나의 방법을 예시한 도면.

Claims (24)

  1. 컴퓨터에 의해 발생된 인쇄된 문서의 문자 데이타를 전자적으로 재생하기 위한 방법에 있어서, 제1 문자 데이타에 복수의 제1 이진값을 할당하는데, 하나의 제1 이진값이 상기 제1 문자 데이타의 각각의 하나의 문자에 할당되도록 하는 단계; 상기 데이타와 상기 복수의 제1 이진값을 인쇄하는 단계; 제2 문자들로 된 하나 이상의 스트림을 포함하는 전자 문서를생성하기 위하여 상기 제1 문자 데이타와 상기 복수의 제1 이진값을 포함하는 상기 인쇄문서를 광학적으로 주사하는 단계; 상기 제2 문자들로 된 스트림에 복수의 제2 이진값을 할당하는데, 하나의 제2 이진값이 각각의 하나의 제2 문자에 할당되도록 하는 단계; 및 상기 복수의 제1 이진값과 상기 복수의 제2 이진값을 비교하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제1항에 있어서, 문자에 대한 상기 제2 이진값이 상기 문자에 대한 상기 제1 이진값과 다를 때마다 제2 문자 에러들의 존재와 위치를 식별하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 식별된 에러들을 자동으로 정정하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 상기 정정하는 단계는 상기 에러들을 제거하기 위하여 상기 복수의 제1 이진값에 상기 복수의 제2 이진값을 재배열하는 단계를 포함하는 것을 특징으로 하는 방법.
  5. 제4항에 있어서, 상기 제2 문자들로 된 하나 이상의 스트림을 변경함으로써 제3 문자들로 된 하나 이상의 스트림을 생성하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 할당되도록 하는 단계는 상기 제1 문자 데이타에 하나 이상의 제1 데이타에 의존하는(data-dependent)값을 할당하는 단계를 포함하고, 상기 인쇄하는 단계는 상기 하나 이상의 제1 데이타에 의존하는 값을 인쇄하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  7. 제6항에 있어서, 상기 제1 문자 데이타에 하나 이상의 제1 데이타에 의존하는 값을 할당하는 단계는 상기 제1 문자 데이타에 대한 에러 정정 정보를 부호화하는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 상기 제3 문자들로 된 하나 이상의 스트림에 상기 부호화된 에러 정정 정보를 적용하는 단계를 포함하는 것을 특징으로 하는 방법.
  9. 제6항에 있어서, 상기 제1 문자 데이터에 하나 이상의 데이타에 의존하는 값을 할당하는 단계는 상기 제1 문자 데이타에 대한 하나 이상의 제1 검사-합(check-sum)을 계산하는 단계를 포함하는 것을 특징으로 하는 방법.
  10. 제9항에 있어서, 상기 제3문자들로 된 하나 이상의 스트림에 대한 하나 이상의 제2 검사-합을 계산하는 단계; 상기 하나 이상의 제1 검사-합과 상기 하나 이상의 제2 검사-합을 비교하는 단계; 및 상기 검사-합들이 다를 때 상기 제3 문자들로 된 하나 이상의 스트림에서 하나 이상의 에러의 존재를 검출하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  11. 인쇄된 텍스트의 복수의 라인들을 갖는 인쇄된 문서에 관한 데이타에 의존하는 정보를 부호화하기 위한 방법에 있어서, 상기 인쇄된 텍스트를 복수의 이진값으로 데시메이션 하는 단계; 및 상기 복수의 부호화된 이진값을 포함하는 마커를 상기 인쇄된 문서의 표면에 기계가 판독 가능한 기호 표시로 인쇄하는 단계를 포함하는 것을 특징으로 하는 방법.
  12. 제11항에 있어서, 상기 문서 배치의 세부 사항을 부호화하는 단계와 상기 마커에서의 상기 문서 배치 부호화를 인쇄하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  13. 제11항에 있어서, 상기 인쇄된 텍스트에 복수의 치환 에러 정정 코드를 할당하는 단계와 상기 마커에 있는 상기 코드를 인쇄하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  14. 제11항에 있어서, 상기 인쇄된 텍스트에 대한 하나 이상의 검사-합을계산하는 단계와 상기 마커에 있는 상기 검사-합을 프린트 하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  15. 인쇄된 문자들로 된 라인들을 갖는 인쇄된 문서의 표면에 기계가 판독 가능한 기호 표시로 제공되는 마커에 있어서, 인쇄된 문자들을 부호화하는 하나 이상의 데시메이션 시퀀스를 포함하는 것을 특징으로 하는 마커.
  16. 제15항에 있어서, 상기 인쇄된 문자들 상에서 계산된 하나 이상의 검사-합을 더 포함하는 것을 특징으로 하는 마커.
  17. 제15항에 있어서, 상기 인쇄된 문서의 배치 상에서 계산된 하나 이상의 배치에 의존하는 값(layout dependent value)을 더 포함하는 것을 특징으로 하는 마커.
  18. 상기 인쇄된 문자에 관련된 하나 이상의 에러 정정 코드를 더 포함하는 것을 특징으로 하는 마커.
  19. 원래의 인쇄된 텍스트와 하나 이상의 문서 마커로 된 라인들을 구비하는 문서들을 더욱 정확한 광학 문자 인식으로 재생하는 방법으로서, 상기 문서 마커는 그 각각이 상기 인쇄된 텍스트의 시컨스에 대응하는 복수의 제1데시메이션 시퀀스들 및 상기 인쇄된 텍스트의 시퀀스 상에서 계산된 하나 이상의 제1 검사-합을 포함하는 방법에 있어서, 상기 원래의 인쇄된 텍스트를 광학적으로 주사함으로써 복수의 제1 재생 텍스트 시퀀스를 포함하는 전자 문서를 생성하는 단계; 상기 하나 이상의 문서 마커를 광학적으로 주사하는 단계; 상기 주사된 문서 마커로부터 상기 복수의 제1 데시메이션 시퀀스를 디코딩 하는 단계; 상기 재생된 텍스트를 복수의 제2 데시메이션 시퀀스로 데시메이션 하는 단계; 상기 제1 및 제2 데시메이션 시퀀스들을 비교함으로써 원래의 인쇄된 텍스트의 라인들과 대응되는 재생된 인쇄된 텍스트의 라인들 간의 편집 거리들을 계산하는 단계; 상기 편집 거리들을 비교하고 상기 편집 거리들이 선정된 양 이상만큼 다를 때 상기 재생된 텍스트에 라인 삽입 및 누락 에러들이 있음을 식별하는 단계; 상기 검출된 라인 삽입 및 누락 에러들을 정정하는 단계; 상기 복수의 제1 및 제2 데이메이션 시퀀스의 대응되는 것들 각각을 비교하는 단계; 상기 데시메이션 시퀀스들이 다르게 되는 시퀀스 위치에서 상기 재생된 텍스트에 텍스트 에러들이 있음을 식별하는 단계; 하나 이상의 제2 재생된 텍스트 시퀀스를 생성하기 위하여 상기 텍스트 에러들이 식별된 상기 시퀀스 위치들에서 다른 문자들로 치환하는 단계; 상기 하나 이상의 제2 재생된 텍스트 시퀀스들 각각에 대한 제2 검사-합을 계산하는 단계; 상기 제2 검사-합을 상기 제1 검사-합과 비교하는 단계; 및 상기 제1 및 제2 검사-합들이 같을 때 상기 제2 재생된 텍스트 시퀀스의 정확도를 검증하는 단계를 포함하는 것을 특징으로 하는 방법.
  20. 제19항에 있어서, 상기 문서 마커는 상기 원래의 텍스트에 대한 복수의 에러 정정 코드를 포함하고, 상기 텍스트에 대한 상기 제2 검사-합을 계산하기 전에 상기 하나 이상의 제2 재생된 텍스트 시퀀스에 상기 대응되는 에러 정정 코드를 적용시키는 단계를 더 포함하는 것을 특징으로 하는 방법.
  21. 광학적 주사에 의해 정확히 재생되도록 된 인쇄문서에 있어서, 인지할 수 있는 인쇄된 데이타 및 기계가 판독 가능한 하나 이상의 마커를 포함하며, 상기 마커는 상기 인쇄된 데이타를 부호화하는 하나 이상의 데시메이션 시퀀스를 포함하는 것을 특징으로 하는 인쇄된 문서.
  22. 제21항에 있어서, 상기 기계가 판독 가능한 하나 이상의 마커는 상기 인쇄된 데이타 상에서 계산된 하나 이상의 검사-합을 더 포함하는 것을 특징으로 하는 인쇄된 문서.
  23. 제21항에 있어서, 상기 기계가 판독 가능한 하나 이상의 마커는 상기 인쇄된 문서의 배치 상에서 계산된 하나 이상의 배치에 의존하는 값을 더 포함하는 것을 특징으로 하는 인쇄된 문서.
  24. 제21항에 있어서, 상기 기계가 판독 가능한 하나 이상의 마커는 상기 인쇄된 데이타에 관련된 하나 이상의 에러 정정코드를 더 포함하는 것을 특징으로 하는 인쇄된 문서.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019940026443A 1993-10-15 1994-10-15 인쇄된 문서의 광학 문자 인식(ocr)을 향상시키기 위한 방법 및 수단 KR950012276A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/138,467 US5748807A (en) 1992-10-09 1993-10-15 Method and means for enhancing optical character recognition of printed documents
US08/138.467 1993-10-15

Publications (1)

Publication Number Publication Date
KR950012276A true KR950012276A (ko) 1995-05-16

Family

ID=22482145

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940026443A KR950012276A (ko) 1993-10-15 1994-10-15 인쇄된 문서의 광학 문자 인식(ocr)을 향상시키기 위한 방법 및 수단

Country Status (5)

Country Link
US (2) US5748807A (ko)
EP (1) EP0649112A3 (ko)
JP (1) JPH07168912A (ko)
KR (1) KR950012276A (ko)
TW (1) TW299425B (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100408082B1 (ko) * 2001-07-30 2003-12-03 (주)유라비젼 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법
KR100582342B1 (ko) * 2000-08-30 2006-05-23 인터내셔널 비지네스 머신즈 코포레이션 인쇄용 전자 문서와 그 생성 방법 및 기록 매체

Families Citing this family (116)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5748807A (en) * 1992-10-09 1998-05-05 Panasonic Technologies, Inc. Method and means for enhancing optical character recognition of printed documents
US5625711A (en) * 1994-08-31 1997-04-29 Adobe Systems Incorporated Method and apparatus for producing a hybrid data structure for displaying a raster image
JPH1044513A (ja) * 1996-08-07 1998-02-17 Olympus Optical Co Ltd コード印刷装置及びそれに適用されるコード印刷媒体
US5889897A (en) * 1997-04-08 1999-03-30 International Patent Holdings Ltd. Methodology for OCR error checking through text image regeneration
US6910184B1 (en) * 1997-07-25 2005-06-21 Ricoh Company, Ltd. Document information management system
US6094665A (en) * 1997-09-18 2000-07-25 Hewlett-Packard Company Method and apparatus for correcting a uniform resource identifier
US6697525B1 (en) 1998-10-02 2004-02-24 Parthusceva Ltd. System method and apparatus for performing a transform on a digital image
US6662180B1 (en) * 1999-05-12 2003-12-09 Matsushita Electric Industrial Co., Ltd. Method for searching in large databases of automatically recognized text
US7088459B1 (en) * 1999-05-25 2006-08-08 Silverbrook Research Pty Ltd Method and system for providing a copy of a printed page
JP2001052116A (ja) * 1999-08-06 2001-02-23 Toshiba Corp パターン列マッチング装置とパターン列マッチング方法と文字列マッチング装置と文字列マッチング方法
CA2374196A1 (en) * 1999-08-21 2001-03-01 Kent Ridge Digital Labs Legitimacy protection of electronic document and a printed copy thereof
US6657740B1 (en) * 1999-09-10 2003-12-02 The United States Of America As Represented By The National Security Agency Method of printing portion of document with accountability and error detection
US6674919B1 (en) 1999-09-21 2004-01-06 Matsushita Electric Industrial Co., Ltd. Method for determining the skew angle of a two-dimensional barcode
US6488205B1 (en) 1999-12-03 2002-12-03 Howard John Jacobson System and method for processing data on an information card
DE60005293T2 (de) * 2000-02-23 2004-07-01 Ser Solutions Inc. Methode und Vorrichtung zur Verarbeitung elektronischer Dokumente
US6950553B1 (en) * 2000-03-23 2005-09-27 Cardiff Software, Inc. Method and system for searching form features for form identification
US6741724B1 (en) * 2000-03-24 2004-05-25 Siemens Dematic Postal Automation, L.P. Method and system for form processing
US7110621B1 (en) 2000-05-19 2006-09-19 Xerox Corporation Assist channel coding using a rewrite model
US6862113B1 (en) 2000-05-19 2005-03-01 Xerox Corporation Assist channel coding with character classifications
US6768560B1 (en) 2000-05-19 2004-07-27 Xerox Corporation Assist channel coding with vertical block error correction
US6628837B1 (en) 2000-05-19 2003-09-30 Xerox Corporation Assist channel coding with convolution coding
US7000230B1 (en) 2000-06-21 2006-02-14 Microsoft Corporation Network-based software extensions
US6874143B1 (en) * 2000-06-21 2005-03-29 Microsoft Corporation Architectures for and methods of providing network-based software extensions
US7346848B1 (en) 2000-06-21 2008-03-18 Microsoft Corporation Single window navigation methods and systems
US7191394B1 (en) 2000-06-21 2007-03-13 Microsoft Corporation Authoring arbitrary XML documents using DHTML and XSLT
US6948135B1 (en) 2000-06-21 2005-09-20 Microsoft Corporation Method and systems of providing information to computer users
US7624356B1 (en) 2000-06-21 2009-11-24 Microsoft Corporation Task-sensitive methods and systems for displaying command sets
EP2458511A3 (en) 2000-06-21 2014-08-13 Microsoft Corporation System and method for integrating spreadsheets and word processing tables
US6883168B1 (en) 2000-06-21 2005-04-19 Microsoft Corporation Methods, systems, architectures and data structures for delivering software via a network
US7155667B1 (en) 2000-06-21 2006-12-26 Microsoft Corporation User interface for integrated spreadsheets and word processing tables
US6868186B1 (en) 2000-07-13 2005-03-15 Ceva D.S.P. Ltd. Visual lossless image compression
US7054509B2 (en) * 2000-10-21 2006-05-30 Cardiff Software, Inc. Determining form identification through the spatial relationship of input data
JP4421134B2 (ja) * 2001-04-18 2010-02-24 富士通株式会社 文書画像検索装置
JP2002344736A (ja) * 2001-05-21 2002-11-29 Oki Electric Ind Co Ltd プリント紙の原本保証システム,プリンタ装置,および,検証装置
US6816608B2 (en) * 2001-07-05 2004-11-09 International Business Machines Corporation Storing information recorded as part of a financial transaction with a quantity of data stored determined by a monetary value of the transaction
US6870947B2 (en) * 2001-07-24 2005-03-22 Ncr Corporation Method of processing items in a check processing system and an apparatus therefor
US7400768B1 (en) * 2001-08-24 2008-07-15 Cardiff Software, Inc. Enhanced optical recognition of digitized images through selective bit insertion
US7120299B2 (en) * 2001-12-28 2006-10-10 Intel Corporation Recognizing commands written onto a medium
US8086867B2 (en) * 2002-03-26 2011-12-27 Northrop Grumman Systems Corporation Secure identity and privilege system
US20030218767A1 (en) * 2002-05-23 2003-11-27 Schroath Leonard T. Explicit feedback for remote printing
US20030231344A1 (en) * 2002-05-30 2003-12-18 Fast Bruce Brian Process for validating groups of machine-read data fields
US7092567B2 (en) * 2002-11-04 2006-08-15 Matsushita Electric Industrial Co., Ltd. Post-processing system and method for correcting machine recognized text
US7310769B1 (en) 2003-03-12 2007-12-18 Adobe Systems Incorporated Text encoding using dummy font
US7275216B2 (en) 2003-03-24 2007-09-25 Microsoft Corporation System and method for designing electronic forms and hierarchical schemas
US7415672B1 (en) 2003-03-24 2008-08-19 Microsoft Corporation System and method for designing electronic forms
US7370066B1 (en) 2003-03-24 2008-05-06 Microsoft Corporation System and method for offline editing of data files
US7296017B2 (en) 2003-03-28 2007-11-13 Microsoft Corporation Validation of XML data files
US7913159B2 (en) 2003-03-28 2011-03-22 Microsoft Corporation System and method for real-time validation of structured data files
US7516145B2 (en) 2003-03-31 2009-04-07 Microsoft Corporation System and method for incrementally transforming and rendering hierarchical data files
US20030191681A1 (en) * 2003-05-06 2003-10-09 Gallion Kirk P. Method for managing a business process related to a document publishing project
US7451392B1 (en) 2003-06-30 2008-11-11 Microsoft Corporation Rendering an HTML electronic form by applying XSLT to XML using a solution
US7581177B1 (en) 2003-08-01 2009-08-25 Microsoft Corporation Conversion of structured documents
US7406660B1 (en) 2003-08-01 2008-07-29 Microsoft Corporation Mapping between structured data and a visual surface
US7334187B1 (en) 2003-08-06 2008-02-19 Microsoft Corporation Electronic form aggregation
US8661338B2 (en) * 2004-01-14 2014-02-25 Xerox Corporation System and method for dynamic document layout
US8819072B1 (en) 2004-02-02 2014-08-26 Microsoft Corporation Promoting data from structured data files
US7430711B2 (en) 2004-02-17 2008-09-30 Microsoft Corporation Systems and methods for editing XML documents
US7496837B1 (en) 2004-04-29 2009-02-24 Microsoft Corporation Structural editing with schema awareness
US7568101B1 (en) 2004-05-13 2009-07-28 Microsoft Corporation Digital signatures with an embedded view
US7774620B1 (en) 2004-05-27 2010-08-10 Microsoft Corporation Executing applications at appropriate trust levels
US20050281450A1 (en) * 2004-06-18 2005-12-22 Digicor Llc System and method for correcting data in financial documents
US11468128B1 (en) * 2006-10-20 2022-10-11 Richard Paiz Search engine optimizer
US7725825B2 (en) * 2004-09-28 2010-05-25 Ricoh Company, Ltd. Techniques for decoding and reconstructing media objects from a still visual representation
US7774705B2 (en) 2004-09-28 2010-08-10 Ricoh Company, Ltd. Interactive design process for creating stand-alone visual representations for media objects
US8549400B2 (en) * 2004-09-28 2013-10-01 Ricoh Company, Ltd. Techniques for encoding media objects to a static visual representation
US7516399B2 (en) 2004-09-30 2009-04-07 Microsoft Corporation Structured-document path-language expression methods and systems
US20060074933A1 (en) * 2004-09-30 2006-04-06 Microsoft Corporation Workflow interaction
US7712022B2 (en) 2004-11-15 2010-05-04 Microsoft Corporation Mutually exclusive options in electronic forms
US7584417B2 (en) 2004-11-15 2009-09-01 Microsoft Corporation Role-dependent action for an electronic form
US7721190B2 (en) 2004-11-16 2010-05-18 Microsoft Corporation Methods and systems for server side form processing
US7509353B2 (en) * 2004-11-16 2009-03-24 Microsoft Corporation Methods and systems for exchanging and rendering forms
US7904801B2 (en) 2004-12-15 2011-03-08 Microsoft Corporation Recursive sections in electronic forms
US7437376B2 (en) 2004-12-20 2008-10-14 Microsoft Corporation Scalable object model
US7937651B2 (en) 2005-01-14 2011-05-03 Microsoft Corporation Structural editing operations for network forms
US8553968B1 (en) 2005-02-18 2013-10-08 Western Digital Technologies, Inc. Using optical character recognition augmented by an error correction code to detect serial numbers written on a wafer
US7725834B2 (en) 2005-03-04 2010-05-25 Microsoft Corporation Designer-created aspect for an electronic form template
US7543228B2 (en) 2005-06-27 2009-06-02 Microsoft Corporation Template for rendering an electronic form
US8200975B2 (en) 2005-06-29 2012-06-12 Microsoft Corporation Digital signatures for network forms
US8170289B1 (en) * 2005-09-21 2012-05-01 Google Inc. Hierarchical alignment of character sequences representing text of same source
US8001459B2 (en) 2005-12-05 2011-08-16 Microsoft Corporation Enabling electronic documents for limited-capability computing devices
CA2642217C (en) 2006-02-17 2014-05-06 Lumex As Method and system for verification of uncertainly recognized words in an ocr system
JP4539613B2 (ja) * 2006-06-28 2010-09-08 富士ゼロックス株式会社 画像形成装置、画像生成方法およびプログラム
US8155444B2 (en) * 2007-01-15 2012-04-10 Microsoft Corporation Image text to character information conversion
JP4363533B2 (ja) * 2007-01-31 2009-11-11 インターナショナル・ビジネス・マシーンズ・コーポレーション 文字化けを検出するための装置、方法、及びプログラム
US10102439B2 (en) 2008-01-14 2018-10-16 Hewlett-Packard Development Company, L.P. Document verification method and system
CN101833545B (zh) * 2009-03-11 2015-09-09 汉王科技股份有限公司 数字资源加工过程中的数据标引方法
CN103222005B (zh) * 2009-12-31 2016-08-24 美光科技公司 用于相变存储器阵列的方法
GB2477307A (en) * 2010-01-28 2011-08-03 Adsensa Ltd Embedding authentication data into an electronic document image
JP5433470B2 (ja) * 2010-03-17 2014-03-05 株式会社東芝 住所データベース構築装置および住所データベース構築方法
US9424242B2 (en) * 2010-04-14 2016-08-23 International Business Machines Corporation Data capture and analysis
US11379473B1 (en) 2010-04-21 2022-07-05 Richard Paiz Site rank codex search patterns
US11423018B1 (en) 2010-04-21 2022-08-23 Richard Paiz Multivariate analysis replica intelligent ambience evolving system
JP5636738B2 (ja) * 2010-05-25 2014-12-10 株式会社リコー 料金計算システム
US9846688B1 (en) 2010-12-28 2017-12-19 Amazon Technologies, Inc. Book version mapping
US9069767B1 (en) 2010-12-28 2015-06-30 Amazon Technologies, Inc. Aligning content items to identify differences
US8798366B1 (en) * 2010-12-28 2014-08-05 Amazon Technologies, Inc. Electronic book pagination
US9881009B1 (en) 2011-03-15 2018-01-30 Amazon Technologies, Inc. Identifying book title sets
JP5594269B2 (ja) * 2011-09-29 2014-09-24 コニカミノルタ株式会社 ファイル名作成装置、画像形成装置、およびファイル名作成プログラム
US9330323B2 (en) 2012-04-29 2016-05-03 Hewlett-Packard Development Company, L.P. Redigitization system and service
JP5962419B2 (ja) * 2012-10-15 2016-08-03 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9361531B2 (en) 2014-07-21 2016-06-07 Optum, Inc. Targeted optical character recognition (OCR) for medical terminology
JP6319575B2 (ja) * 2014-09-05 2018-05-09 京セラドキュメントソリューションズ株式会社 画像形成装置および記号印刷プログラム
KR101556998B1 (ko) * 2015-01-27 2015-10-05 주식회사 다우인큐브 전자문서 서비스 시스템 및 방법
US9990268B2 (en) * 2015-03-30 2018-06-05 Infosys Limited System and method for detection of duplicate bug reports
US9858257B1 (en) * 2016-07-20 2018-01-02 Amazon Technologies, Inc. Distinguishing intentional linguistic deviations from unintentional linguistic deviations
RU2634194C1 (ru) * 2016-09-16 2017-10-24 Общество с ограниченной ответственностью "Аби Девелопмент" Верификация результатов оптического распознавания символов
US10296788B1 (en) * 2016-12-19 2019-05-21 Matrox Electronic Systems Ltd. Method and system for processing candidate strings detected in an image to identify a match of a model string in the image
US10346702B2 (en) 2017-07-24 2019-07-09 Bank Of America Corporation Image data capture and conversion
US10192127B1 (en) 2017-07-24 2019-01-29 Bank Of America Corporation System for dynamic optical character recognition tuning
US10445966B1 (en) 2018-07-27 2019-10-15 Hart Intercivic, Inc. Optical character recognition of voter selections for cast vote records
US11157626B1 (en) 2019-05-29 2021-10-26 Northrop Grumman Systems Corporation Bi-directional chain of trust network
WO2020245024A1 (en) * 2019-06-03 2020-12-10 Sicpa Holding Sa Certified text document
US10929076B2 (en) 2019-06-20 2021-02-23 International Business Machines Corporation Automatic scaling for legibility
CN110659640B (zh) * 2019-09-27 2021-11-30 深圳市商汤科技有限公司 文本序列的识别方法及装置、电子设备和存储介质
CN113723420B (zh) * 2021-09-03 2024-07-02 安徽淘云科技股份有限公司 一种扫描方法及其相关设备
CN115439854B (zh) * 2022-09-05 2023-05-02 深圳市学之友科技有限公司 一种基于扫描笔与智能终端互联的扫描显示方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3200372A (en) * 1960-07-26 1965-08-10 Ibm Error detection and correction system
US3713097A (en) * 1971-05-14 1973-01-23 Ibm Test bit pattern generator for pattern recognition machines
US3763467A (en) * 1972-05-04 1973-10-02 Ibm Method and apparatus for reading documents
US4013997A (en) * 1975-11-17 1977-03-22 Recognition Equipment Incorporated Error detection/correction system
US4105997A (en) * 1977-01-12 1978-08-08 United States Postal Service Method for achieving accurate optical character reading of printed text
US4325117A (en) * 1979-12-31 1982-04-13 Honeywell Information Systems Inc. Apparatus for calculating a check digit for a stream of data read from a document
EP0136587B1 (en) * 1983-09-06 1991-04-17 Kabushiki Kaisha Toshiba Error correction circuit
US4866666A (en) * 1984-10-29 1989-09-12 Francisco Michael H Method for maintaining data integrity during information transmission by generating indicia representing total number of binary 1's and 0's of the data
US5070504A (en) * 1989-06-23 1991-12-03 International Business Machines Method and apparatus for providing error correction to symbol level codes
US5748807A (en) * 1992-10-09 1998-05-05 Panasonic Technologies, Inc. Method and means for enhancing optical character recognition of printed documents
DE69331456T2 (de) * 1992-10-09 2002-11-07 Matsushita Electric Ind Co Ltd Überprüfbare optische Zeichenerkennung

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100582342B1 (ko) * 2000-08-30 2006-05-23 인터내셔널 비지네스 머신즈 코포레이션 인쇄용 전자 문서와 그 생성 방법 및 기록 매체
KR100408082B1 (ko) * 2001-07-30 2003-12-03 (주)유라비젼 인식률 및 가독성이 높은 한글 필기용 광학적 문자인식입력 방법

Also Published As

Publication number Publication date
JPH07168912A (ja) 1995-07-04
EP0649112A2 (en) 1995-04-19
TW299425B (ko) 1997-03-01
EP0649112A3 (en) 1995-11-02
US5748807A (en) 1998-05-05
US6047093A (en) 2000-04-04

Similar Documents

Publication Publication Date Title
KR950012276A (ko) 인쇄된 문서의 광학 문자 인식(ocr)을 향상시키기 위한 방법 및 수단
EP0592238B1 (en) Certifiable optical character recognition
US6115508A (en) Clock free two-dimensional barcode and method for printing and reading the same
CA2136166C (en) Document copying deterrent method
US7660020B2 (en) Method and apparatus for controlling image processing for extraction assured embedding, and recording medium storing program product
CA2171886C (en) Bar code encoding system using four-state codes
EP0962883A3 (en) A border-less clock free two-dimensional barcode and method for printing and reading the same
WO2002080520A3 (en) Method and system for image processing
JPH02502679A (ja) バーコードをコード化し又解読する装置と方法
JP2567973B2 (ja) コ−ド化文字記号列を訂正する方法
DE69703155D1 (de) Verfahren zum versehen eines optischen datenträgers mit identitätsinformationen
US20070246542A1 (en) Document element repair
AU2334988A (en) Encoding apparatus and method for error correction
US6641051B1 (en) System for embedded digital data that allows embedding of data around known obstructions
US20080292136A1 (en) Data Processing System And Method
CN102467664A (zh) 辅助光学字符识别的方法和装置
CN102090052A (zh) 检测嵌入信息的装置、方法和计算机程序产品
US6600613B1 (en) Demodulation of magnetically recorded data
JP4905767B2 (ja) 二次元コード検出システムおよび二次元コード検出プログラム
AU2005209709A1 (en) Two dimensionally phase modulated information symbol
EP1343097A1 (en) Method for embedding of information in media files
JP2900714B2 (ja) バーコード検出方式
Kuo Assist channel coding for improving optical character recognition
CN116529800A (zh) 用于保护对象的方法和设备以及用于验证对象的方法
JPH10198751A (ja) デジタルデータ記録紙

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid