WO2007103984A3 - entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères - Google Patents

entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères Download PDF

Info

Publication number
WO2007103984A3
WO2007103984A3 PCT/US2007/063508 US2007063508W WO2007103984A3 WO 2007103984 A3 WO2007103984 A3 WO 2007103984A3 US 2007063508 W US2007063508 W US 2007063508W WO 2007103984 A3 WO2007103984 A3 WO 2007103984A3
Authority
WO
WIPO (PCT)
Prior art keywords
character recognition
optical character
binarization
processing
ocr output
Prior art date
Application number
PCT/US2007/063508
Other languages
English (en)
Other versions
WO2007103984A2 (fr
Inventor
Donald B Curtis
Shawn Reid
Original Assignee
Generations Network Inc
Donald B Curtis
Shawn Reid
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Generations Network Inc, Donald B Curtis, Shawn Reid filed Critical Generations Network Inc
Publication of WO2007103984A2 publication Critical patent/WO2007103984A2/fr
Publication of WO2007103984A3 publication Critical patent/WO2007103984A3/fr

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • G06F18/254Fusion techniques of classification results, e.g. of results related to same input data

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

L'invention concerne une méthode de traitement d'une image comprend les étapes consistant à recevoir une version numérisée de l'image, traiter la version numérisée de l'image par au moins deux processus de numérisation binaire destinés à créer une première numérisation binaire et une seconde numérisation binaire, et traiter la première numérisation binaire par un premier processus de reconnaissance optique de caractères afin de créer un premier fichier de sortie d'OCR. Le traitement de la première numérisation binaire par un premier processus de reconnaissance optique de caractères inclut la compilation de la première métrique associée au premier fichier de sortie d'OCR. La méthode inclut également l'étape consistant à traiter la seconde numérisation binaire par le premier processus de reconnaissance optique de caractères pour créer un second fichier de sortie d'OCR. Le traitement de la seconde numérisation binaire par le premier processus de reconnaissance optique de caractères inclut la compilation de la seconde métrique associée au second fichier de sortie d'OCR. La méthode inclut également l'étape consistant à utiliser les métriques, au moins en partie, pour choisir un fichier final de sortie d'OCR parmi les fichiers de sortie d'OCR.
PCT/US2007/063508 2006-03-07 2007-03-07 entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères WO2007103984A2 (fr)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US78048406P 2006-03-07 2006-03-07
US60/780,484 2006-03-07
US11/560,026 2006-11-15
US11/560,026 US7734092B2 (en) 2006-03-07 2006-11-15 Multiple image input for optical character recognition processing systems and methods

Publications (2)

Publication Number Publication Date
WO2007103984A2 WO2007103984A2 (fr) 2007-09-13
WO2007103984A3 true WO2007103984A3 (fr) 2008-11-06

Family

ID=38475835

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/US2007/063508 WO2007103984A2 (fr) 2006-03-07 2007-03-07 entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères

Country Status (2)

Country Link
US (1) US7734092B2 (fr)
WO (1) WO2007103984A2 (fr)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
US8908998B2 (en) * 2007-12-07 2014-12-09 Educational Testing Service Method for automated quality control
US8073284B2 (en) * 2008-04-03 2011-12-06 Seiko Epson Corporation Thresholding gray-scale images to produce bitonal images
US8320674B2 (en) * 2008-09-03 2012-11-27 Sony Corporation Text localization for image and video OCR
US8290273B2 (en) * 2009-03-27 2012-10-16 Raytheon Bbn Technologies Corp. Multi-frame videotext recognition
US8452099B2 (en) * 2010-11-27 2013-05-28 Hewlett-Packard Development Company, L.P. Optical character recognition (OCR) engines having confidence values for text types
EP2845147B1 (fr) 2012-04-29 2018-06-06 Hewlett-Packard Development Company, L.P. Renumérisation et correction d'erreurs de documents électroniques
US8773733B2 (en) 2012-05-23 2014-07-08 Eastman Kodak Company Image capture device for extracting textual information
US8908970B2 (en) 2012-05-23 2014-12-09 Eastman Kodak Company Textual information extraction method using multiple images
US8768058B2 (en) * 2012-05-23 2014-07-01 Eastman Kodak Company System for extracting text from a plurality of captured images of a document
JP2014036314A (ja) * 2012-08-08 2014-02-24 Canon Inc スキャンサービスシステム、スキャンサービス方法及びスキャンサービスプログラム
US8947745B2 (en) 2013-07-03 2015-02-03 Symbol Technologies, Inc. Apparatus and method for scanning and decoding information in an identified location in a document
US9870520B1 (en) * 2013-08-02 2018-01-16 Intuit Inc. Iterative process for optimizing optical character recognition
US9922247B2 (en) * 2013-12-18 2018-03-20 Abbyy Development Llc Comparing documents using a trusted source
US9251139B2 (en) 2014-04-08 2016-02-02 TitleFlow LLC Natural language processing for extracting conveyance graphs
US9767353B2 (en) * 2014-08-29 2017-09-19 Ancestry.Com Operations Inc. System and method for transcribing historical records into digitized text
CN106874906B (zh) * 2017-01-17 2023-02-28 腾讯科技(上海)有限公司 一种图片的二值化方法、装置及终端
US10984274B2 (en) * 2018-08-24 2021-04-20 Seagate Technology Llc Detecting hidden encoding using optical character recognition
CN118451479A (zh) * 2022-02-15 2024-08-06 三菱电机株式会社 图像滤波器生成系统、图像滤波器生成装置、学习装置、学习方法以及程序
US11961316B2 (en) * 2022-05-10 2024-04-16 Capital One Services, Llc Text extraction using optical character recognition

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020067851A1 (en) * 2000-12-06 2002-06-06 Lange Peter J. Device that scans both sides of a photo and associates information found on the back of the photo with the photo
US6571013B1 (en) * 1996-06-11 2003-05-27 Lockhead Martin Mission Systems Automatic method for developing custom ICR engines
US20030113016A1 (en) * 1996-01-09 2003-06-19 Fujitsu Limited Pattern recognizing apparatus
US20070047816A1 (en) * 2005-08-23 2007-03-01 Jamey Graham User Interface for Mixed Media Reality
US7236632B2 (en) * 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5617484A (en) * 1992-09-25 1997-04-01 Olympus Optical Co., Ltd. Image binarizing apparatus
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
US5519786A (en) * 1994-08-09 1996-05-21 Trw Inc. Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems
US5920655A (en) * 1995-02-10 1999-07-06 Canon Kabushiki Kaisha Binarization image processing for multi-level image data
US6226094B1 (en) * 1996-01-05 2001-05-01 King Jim Co., Ltd. Apparatus and method for processing character information
JPH11232378A (ja) * 1997-12-09 1999-08-27 Canon Inc デジタルカメラ、そのデジタルカメラを用いた文書処理システム、コンピュータ可読の記憶媒体、及び、プログラムコード送出装置
US6269188B1 (en) * 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
EP0961218B1 (fr) * 1998-05-28 2004-03-24 International Business Machines Corporation Procédé de binarisation dans un système de reconnaissance de caractères
JP4018310B2 (ja) * 1999-04-21 2007-12-05 株式会社リコー 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
US6330003B1 (en) * 1999-07-30 2001-12-11 Microsoft Corporation Transformable graphical regions
DE10034629A1 (de) * 1999-08-11 2001-03-22 Ibm Verfahren und System zum Verzahnen von OCR und ABL zur automatischen Postsortierung
JP4377494B2 (ja) * 1999-10-22 2009-12-02 東芝テック株式会社 情報入力装置
US6868524B1 (en) * 1999-10-22 2005-03-15 Microsoft Corporation Method and apparatus for text layout across a region
US6577762B1 (en) * 1999-10-26 2003-06-10 Xerox Corporation Background surface thresholding
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
WO2001058129A2 (fr) * 2000-02-03 2001-08-09 Alst Technical Excellence Center Perfectionnement de la resolution d'image par l'utilisation d'un detecteur de type mosaique couleur
US6351566B1 (en) * 2000-03-02 2002-02-26 International Business Machines Method for image binarization
JP4150842B2 (ja) * 2000-05-09 2008-09-17 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3575683B2 (ja) * 2000-10-05 2004-10-13 松下電器産業株式会社 多素子型磁気抵抗素子
JP4613397B2 (ja) * 2000-06-28 2011-01-19 コニカミノルタビジネステクノロジーズ株式会社 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3904840B2 (ja) * 2000-08-15 2007-04-11 富士通株式会社 多値画像から罫線を抽出する罫線抽出装置
US7738706B2 (en) * 2000-09-22 2010-06-15 Sri International Method and apparatus for recognition of symbols in images of three-dimensional scenes
US7062093B2 (en) * 2000-09-27 2006-06-13 Mvtech Software Gmbh System and method for object recognition
US6741745B2 (en) * 2000-12-18 2004-05-25 Xerox Corporation Method and apparatus for formatting OCR text
JP4164272B2 (ja) * 2001-04-24 2008-10-15 キヤノン株式会社 画像処理装置及び画像処理方法
US6741351B2 (en) * 2001-06-07 2004-05-25 Koninklijke Philips Electronics N.V. LED luminaire with light sensor configurations for optical feedback
JP4100885B2 (ja) * 2001-07-11 2008-06-11 キヤノン株式会社 帳票認識装置、方法、プログラムおよび記憶媒体
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US7339992B2 (en) * 2001-12-06 2008-03-04 The Trustees Of Columbia University In The City Of New York System and method for extracting text captions from video and generating video summaries
US20040146200A1 (en) * 2003-01-29 2004-07-29 Lockheed Martin Corporation Segmenting touching characters in an optical character recognition system to provide multiple segmentations
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
US7724981B2 (en) * 2005-07-21 2010-05-25 Ancestry.Com Operations Inc. Adaptive contrast control systems and methods
US7650041B2 (en) * 2006-02-24 2010-01-19 Symbol Technologies, Inc. System and method for optical character recognition in an image
US20080008383A1 (en) * 2006-07-07 2008-01-10 Lockheed Martin Corporation Detection and identification of postal metermarks
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes
US8155444B2 (en) * 2007-01-15 2012-04-10 Microsoft Corporation Image text to character information conversion

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030113016A1 (en) * 1996-01-09 2003-06-19 Fujitsu Limited Pattern recognizing apparatus
US6571013B1 (en) * 1996-06-11 2003-05-27 Lockhead Martin Mission Systems Automatic method for developing custom ICR engines
US20020067851A1 (en) * 2000-12-06 2002-06-06 Lange Peter J. Device that scans both sides of a photo and associates information found on the back of the photo with the photo
US7236632B2 (en) * 2003-04-11 2007-06-26 Ricoh Company, Ltd. Automated techniques for comparing contents of images
US20070047816A1 (en) * 2005-08-23 2007-03-01 Jamey Graham User Interface for Mixed Media Reality

Also Published As

Publication number Publication date
WO2007103984A2 (fr) 2007-09-13
US7734092B2 (en) 2010-06-08
US20070211942A1 (en) 2007-09-13

Similar Documents

Publication Publication Date Title
WO2007103984A3 (fr) entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères
GB2442409A (en) Techniques to improve contrast enhancement using a luminance histogram
WO2006116145A3 (fr) Listes de suggestion automatique et entree manuscrite
WO2006014846A3 (fr) Systeme a base d'ontologie pour la capture de donnees et la representation de connaissance
WO2007084780A3 (fr) Procédé et système d'inférences de types
WO2008033926A3 (fr) Traitement de documents
WO2009038981A3 (fr) Système et procédé pour générer un cadre logiciel basé sur une modélisation sémantique et des règles d'activité
WO2008057782A3 (fr) Procédé et système pour fournir un traitement d'images permettant de repérer une information numérique
WO2005101186A3 (fr) Systeme, procede et produit-programme informatique pour l'extraction plus rapide qu'en temps reel de metadonnees
WO2010127045A3 (fr) Procédé et système pour appeler des variations dans une séquence polynucléotidique d'échantillon par rapport à une séquence polynucléotidique de référence
WO2010039519A3 (fr) Procédés et appareils relatifs à un traitement de document en fonction d’un type de document
FI20115688A (fi) Menetelmä ja laite häiriön vähentämiseksi kuvanauhalla
WO2006132793A3 (fr) Apprentissage de faits a partir d'un texte semi-structure
WO2005116910A3 (fr) Comparaison d'images
WO2007146994A3 (fr) Amélioration du contenu sur la base de données contextuelles dans une source
WO2004059438A3 (fr) Systeme permettant de traiter automatiquement des composants sur un dispositif
WO2011112573A3 (fr) Reconnaissance de paragraphe dans un processus de reconnaissance optique de caractères (ocr)
WO2012094422A3 (fr) Système et procédé vocaux pour saisie de données
WO2008087633A3 (fr) Procédé d'optimisation, sur la base de statistiques, des performances d'un code régénéré
WO2008055273A3 (fr) Système et procédé pour un sous-titrage rapide
EP1921599A3 (fr) Appareil et procédé de traitement de caractères
WO2006083669A3 (fr) Procede et systeme d'association de fichiers specifiques a differentes applications
WO2010074697A3 (fr) Construction de données d'album en utilisant des données de pistes discrètes provenant de sources multiples
WO2011038099A3 (fr) Système et procédé de localisation et de reconnaissance de documents
WO2006071358A3 (fr) Procede et systeme d'integration d'interpretations multimodales

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2007758095

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE