WO2007103984A3 - entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères - Google Patents
entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères Download PDFInfo
- Publication number
- WO2007103984A3 WO2007103984A3 PCT/US2007/063508 US2007063508W WO2007103984A3 WO 2007103984 A3 WO2007103984 A3 WO 2007103984A3 US 2007063508 W US2007063508 W US 2007063508W WO 2007103984 A3 WO2007103984 A3 WO 2007103984A3
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- character recognition
- optical character
- binarization
- processing
- ocr output
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/254—Fusion techniques of classification results, e.g. of results related to same input data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
L'invention concerne une méthode de traitement d'une image comprend les étapes consistant à recevoir une version numérisée de l'image, traiter la version numérisée de l'image par au moins deux processus de numérisation binaire destinés à créer une première numérisation binaire et une seconde numérisation binaire, et traiter la première numérisation binaire par un premier processus de reconnaissance optique de caractères afin de créer un premier fichier de sortie d'OCR. Le traitement de la première numérisation binaire par un premier processus de reconnaissance optique de caractères inclut la compilation de la première métrique associée au premier fichier de sortie d'OCR. La méthode inclut également l'étape consistant à traiter la seconde numérisation binaire par le premier processus de reconnaissance optique de caractères pour créer un second fichier de sortie d'OCR. Le traitement de la seconde numérisation binaire par le premier processus de reconnaissance optique de caractères inclut la compilation de la seconde métrique associée au second fichier de sortie d'OCR. La méthode inclut également l'étape consistant à utiliser les métriques, au moins en partie, pour choisir un fichier final de sortie d'OCR parmi les fichiers de sortie d'OCR.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US78048406P | 2006-03-07 | 2006-03-07 | |
US60/780,484 | 2006-03-07 | ||
US11/560,026 | 2006-11-15 | ||
US11/560,026 US7734092B2 (en) | 2006-03-07 | 2006-11-15 | Multiple image input for optical character recognition processing systems and methods |
Publications (2)
Publication Number | Publication Date |
---|---|
WO2007103984A2 WO2007103984A2 (fr) | 2007-09-13 |
WO2007103984A3 true WO2007103984A3 (fr) | 2008-11-06 |
Family
ID=38475835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/US2007/063508 WO2007103984A2 (fr) | 2006-03-07 | 2007-03-07 | entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères |
Country Status (2)
Country | Link |
---|---|
US (1) | US7734092B2 (fr) |
WO (1) | WO2007103984A2 (fr) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4713107B2 (ja) * | 2004-08-20 | 2011-06-29 | 日立オムロンターミナルソリューションズ株式会社 | 景観中文字列認識方式および装置 |
US8908998B2 (en) * | 2007-12-07 | 2014-12-09 | Educational Testing Service | Method for automated quality control |
US8073284B2 (en) * | 2008-04-03 | 2011-12-06 | Seiko Epson Corporation | Thresholding gray-scale images to produce bitonal images |
US8320674B2 (en) * | 2008-09-03 | 2012-11-27 | Sony Corporation | Text localization for image and video OCR |
US8290273B2 (en) * | 2009-03-27 | 2012-10-16 | Raytheon Bbn Technologies Corp. | Multi-frame videotext recognition |
US8452099B2 (en) * | 2010-11-27 | 2013-05-28 | Hewlett-Packard Development Company, L.P. | Optical character recognition (OCR) engines having confidence values for text types |
EP2845147B1 (fr) | 2012-04-29 | 2018-06-06 | Hewlett-Packard Development Company, L.P. | Renumérisation et correction d'erreurs de documents électroniques |
US8773733B2 (en) | 2012-05-23 | 2014-07-08 | Eastman Kodak Company | Image capture device for extracting textual information |
US8908970B2 (en) | 2012-05-23 | 2014-12-09 | Eastman Kodak Company | Textual information extraction method using multiple images |
US8768058B2 (en) * | 2012-05-23 | 2014-07-01 | Eastman Kodak Company | System for extracting text from a plurality of captured images of a document |
JP2014036314A (ja) * | 2012-08-08 | 2014-02-24 | Canon Inc | スキャンサービスシステム、スキャンサービス方法及びスキャンサービスプログラム |
US8947745B2 (en) | 2013-07-03 | 2015-02-03 | Symbol Technologies, Inc. | Apparatus and method for scanning and decoding information in an identified location in a document |
US9870520B1 (en) * | 2013-08-02 | 2018-01-16 | Intuit Inc. | Iterative process for optimizing optical character recognition |
US9922247B2 (en) * | 2013-12-18 | 2018-03-20 | Abbyy Development Llc | Comparing documents using a trusted source |
US9251139B2 (en) | 2014-04-08 | 2016-02-02 | TitleFlow LLC | Natural language processing for extracting conveyance graphs |
US9767353B2 (en) * | 2014-08-29 | 2017-09-19 | Ancestry.Com Operations Inc. | System and method for transcribing historical records into digitized text |
CN106874906B (zh) * | 2017-01-17 | 2023-02-28 | 腾讯科技(上海)有限公司 | 一种图片的二值化方法、装置及终端 |
US10984274B2 (en) * | 2018-08-24 | 2021-04-20 | Seagate Technology Llc | Detecting hidden encoding using optical character recognition |
CN118451479A (zh) * | 2022-02-15 | 2024-08-06 | 三菱电机株式会社 | 图像滤波器生成系统、图像滤波器生成装置、学习装置、学习方法以及程序 |
US11961316B2 (en) * | 2022-05-10 | 2024-04-16 | Capital One Services, Llc | Text extraction using optical character recognition |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020067851A1 (en) * | 2000-12-06 | 2002-06-06 | Lange Peter J. | Device that scans both sides of a photo and associates information found on the back of the photo with the photo |
US6571013B1 (en) * | 1996-06-11 | 2003-05-27 | Lockhead Martin Mission Systems | Automatic method for developing custom ICR engines |
US20030113016A1 (en) * | 1996-01-09 | 2003-06-19 | Fujitsu Limited | Pattern recognizing apparatus |
US20070047816A1 (en) * | 2005-08-23 | 2007-03-01 | Jamey Graham | User Interface for Mixed Media Reality |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
Family Cites Families (36)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5617484A (en) * | 1992-09-25 | 1997-04-01 | Olympus Optical Co., Ltd. | Image binarizing apparatus |
DE69519323T2 (de) * | 1994-04-15 | 2001-04-12 | Canon Kk | System zur Seitensegmentierung und Zeichenerkennung |
US5519786A (en) * | 1994-08-09 | 1996-05-21 | Trw Inc. | Method and apparatus for implementing a weighted voting scheme for multiple optical character recognition systems |
US5920655A (en) * | 1995-02-10 | 1999-07-06 | Canon Kabushiki Kaisha | Binarization image processing for multi-level image data |
US6226094B1 (en) * | 1996-01-05 | 2001-05-01 | King Jim Co., Ltd. | Apparatus and method for processing character information |
JPH11232378A (ja) * | 1997-12-09 | 1999-08-27 | Canon Inc | デジタルカメラ、そのデジタルカメラを用いた文書処理システム、コンピュータ可読の記憶媒体、及び、プログラムコード送出装置 |
US6269188B1 (en) * | 1998-03-12 | 2001-07-31 | Canon Kabushiki Kaisha | Word grouping accuracy value generation |
EP0961218B1 (fr) * | 1998-05-28 | 2004-03-24 | International Business Machines Corporation | Procédé de binarisation dans un système de reconnaissance de caractères |
JP4018310B2 (ja) * | 1999-04-21 | 2007-12-05 | 株式会社リコー | 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体 |
US6330003B1 (en) * | 1999-07-30 | 2001-12-11 | Microsoft Corporation | Transformable graphical regions |
DE10034629A1 (de) * | 1999-08-11 | 2001-03-22 | Ibm | Verfahren und System zum Verzahnen von OCR und ABL zur automatischen Postsortierung |
JP4377494B2 (ja) * | 1999-10-22 | 2009-12-02 | 東芝テック株式会社 | 情報入力装置 |
US6868524B1 (en) * | 1999-10-22 | 2005-03-15 | Microsoft Corporation | Method and apparatus for text layout across a region |
US6577762B1 (en) * | 1999-10-26 | 2003-06-10 | Xerox Corporation | Background surface thresholding |
US6738496B1 (en) * | 1999-11-01 | 2004-05-18 | Lockheed Martin Corporation | Real time binarization of gray images |
WO2001058129A2 (fr) * | 2000-02-03 | 2001-08-09 | Alst Technical Excellence Center | Perfectionnement de la resolution d'image par l'utilisation d'un detecteur de type mosaique couleur |
US6351566B1 (en) * | 2000-03-02 | 2002-02-26 | International Business Machines | Method for image binarization |
JP4150842B2 (ja) * | 2000-05-09 | 2008-09-17 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP3575683B2 (ja) * | 2000-10-05 | 2004-10-13 | 松下電器産業株式会社 | 多素子型磁気抵抗素子 |
JP4613397B2 (ja) * | 2000-06-28 | 2011-01-19 | コニカミノルタビジネステクノロジーズ株式会社 | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP3904840B2 (ja) * | 2000-08-15 | 2007-04-11 | 富士通株式会社 | 多値画像から罫線を抽出する罫線抽出装置 |
US7738706B2 (en) * | 2000-09-22 | 2010-06-15 | Sri International | Method and apparatus for recognition of symbols in images of three-dimensional scenes |
US7062093B2 (en) * | 2000-09-27 | 2006-06-13 | Mvtech Software Gmbh | System and method for object recognition |
US6741745B2 (en) * | 2000-12-18 | 2004-05-25 | Xerox Corporation | Method and apparatus for formatting OCR text |
JP4164272B2 (ja) * | 2001-04-24 | 2008-10-15 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
US6741351B2 (en) * | 2001-06-07 | 2004-05-25 | Koninklijke Philips Electronics N.V. | LED luminaire with light sensor configurations for optical feedback |
JP4100885B2 (ja) * | 2001-07-11 | 2008-06-11 | キヤノン株式会社 | 帳票認識装置、方法、プログラムおよび記憶媒体 |
US6922487B2 (en) * | 2001-11-02 | 2005-07-26 | Xerox Corporation | Method and apparatus for capturing text images |
US7339992B2 (en) * | 2001-12-06 | 2008-03-04 | The Trustees Of Columbia University In The City Of New York | System and method for extracting text captions from video and generating video summaries |
US20040146200A1 (en) * | 2003-01-29 | 2004-07-29 | Lockheed Martin Corporation | Segmenting touching characters in an optical character recognition system to provide multiple segmentations |
JP4713107B2 (ja) * | 2004-08-20 | 2011-06-29 | 日立オムロンターミナルソリューションズ株式会社 | 景観中文字列認識方式および装置 |
US7724981B2 (en) * | 2005-07-21 | 2010-05-25 | Ancestry.Com Operations Inc. | Adaptive contrast control systems and methods |
US7650041B2 (en) * | 2006-02-24 | 2010-01-19 | Symbol Technologies, Inc. | System and method for optical character recognition in an image |
US20080008383A1 (en) * | 2006-07-07 | 2008-01-10 | Lockheed Martin Corporation | Detection and identification of postal metermarks |
US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
US8155444B2 (en) * | 2007-01-15 | 2012-04-10 | Microsoft Corporation | Image text to character information conversion |
-
2006
- 2006-11-15 US US11/560,026 patent/US7734092B2/en active Active
-
2007
- 2007-03-07 WO PCT/US2007/063508 patent/WO2007103984A2/fr active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030113016A1 (en) * | 1996-01-09 | 2003-06-19 | Fujitsu Limited | Pattern recognizing apparatus |
US6571013B1 (en) * | 1996-06-11 | 2003-05-27 | Lockhead Martin Mission Systems | Automatic method for developing custom ICR engines |
US20020067851A1 (en) * | 2000-12-06 | 2002-06-06 | Lange Peter J. | Device that scans both sides of a photo and associates information found on the back of the photo with the photo |
US7236632B2 (en) * | 2003-04-11 | 2007-06-26 | Ricoh Company, Ltd. | Automated techniques for comparing contents of images |
US20070047816A1 (en) * | 2005-08-23 | 2007-03-01 | Jamey Graham | User Interface for Mixed Media Reality |
Also Published As
Publication number | Publication date |
---|---|
WO2007103984A2 (fr) | 2007-09-13 |
US7734092B2 (en) | 2010-06-08 |
US20070211942A1 (en) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2007103984A3 (fr) | entrée d'images multiples pour les systèmes et méthodes de reconnaissance optique de caractères | |
GB2442409A (en) | Techniques to improve contrast enhancement using a luminance histogram | |
WO2006116145A3 (fr) | Listes de suggestion automatique et entree manuscrite | |
WO2006014846A3 (fr) | Systeme a base d'ontologie pour la capture de donnees et la representation de connaissance | |
WO2007084780A3 (fr) | Procédé et système d'inférences de types | |
WO2008033926A3 (fr) | Traitement de documents | |
WO2009038981A3 (fr) | Système et procédé pour générer un cadre logiciel basé sur une modélisation sémantique et des règles d'activité | |
WO2008057782A3 (fr) | Procédé et système pour fournir un traitement d'images permettant de repérer une information numérique | |
WO2005101186A3 (fr) | Systeme, procede et produit-programme informatique pour l'extraction plus rapide qu'en temps reel de metadonnees | |
WO2010127045A3 (fr) | Procédé et système pour appeler des variations dans une séquence polynucléotidique d'échantillon par rapport à une séquence polynucléotidique de référence | |
WO2010039519A3 (fr) | Procédés et appareils relatifs à un traitement de document en fonction d’un type de document | |
FI20115688A (fi) | Menetelmä ja laite häiriön vähentämiseksi kuvanauhalla | |
WO2006132793A3 (fr) | Apprentissage de faits a partir d'un texte semi-structure | |
WO2005116910A3 (fr) | Comparaison d'images | |
WO2007146994A3 (fr) | Amélioration du contenu sur la base de données contextuelles dans une source | |
WO2004059438A3 (fr) | Systeme permettant de traiter automatiquement des composants sur un dispositif | |
WO2011112573A3 (fr) | Reconnaissance de paragraphe dans un processus de reconnaissance optique de caractères (ocr) | |
WO2012094422A3 (fr) | Système et procédé vocaux pour saisie de données | |
WO2008087633A3 (fr) | Procédé d'optimisation, sur la base de statistiques, des performances d'un code régénéré | |
WO2008055273A3 (fr) | Système et procédé pour un sous-titrage rapide | |
EP1921599A3 (fr) | Appareil et procédé de traitement de caractères | |
WO2006083669A3 (fr) | Procede et systeme d'association de fichiers specifiques a differentes applications | |
WO2010074697A3 (fr) | Construction de données d'album en utilisant des données de pistes discrètes provenant de sources multiples | |
WO2011038099A3 (fr) | Système et procédé de localisation et de reconnaissance de documents | |
WO2006071358A3 (fr) | Procede et systeme d'integration d'interpretations multimodales |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
WWE | Wipo information: entry into national phase |
Ref document number: 2007758095 Country of ref document: EP |
|
NENP | Non-entry into the national phase |
Ref country code: DE |