JP5237110B2 - 論理構造およびレイアウトに基づくオフラインの文字認識 - Google Patents
論理構造およびレイアウトに基づくオフラインの文字認識 Download PDFInfo
- Publication number
- JP5237110B2 JP5237110B2 JP2008545722A JP2008545722A JP5237110B2 JP 5237110 B2 JP5237110 B2 JP 5237110B2 JP 2008545722 A JP2008545722 A JP 2008545722A JP 2008545722 A JP2008545722 A JP 2008545722A JP 5237110 B2 JP5237110 B2 JP 5237110B2
- Authority
- JP
- Japan
- Prior art keywords
- classifier
- input character
- logical structure
- character
- individual
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K11/00—Methods or arrangements for graph-reading or for converting the pattern of mechanical parameters, e.g. force or presence, into electrical signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Character Discrimination (AREA)
Description
Claims (14)
- 論理構造から成ることを特徴とする入力文字を受信するステップと、
前記入力文字の前記論理構造のレイアウトを識別するステップであって、前記入力文字の1以上の論理構造が、1以上の文字レイアウトのテンプレートに関連づけられ、個別の文字レイアウトのテンプレートは、前記入力文字の個別の論理構造の中間のレイアウトを表す、識別するステップと、
複数の分類器から、前記入力文字の個別の対応する論理構造の個別の分類器を選択するステップであって、前記個別の分類器は、
前記入力文字の左側部を備える少なくとも1つの左側論理構造と、前記入力文字の右側部を備える少なくとも1つの右側論理構造と、を分類する左側−右側分類器と、
前記入力文字の上部を備える少なくとも1つの上部論理構造と、前記入力文字の下部を備える少なくとも1つの下部論理構造と、を分類する上部−下部分類器と、
前記入力文字の隣接する少なくとも2つの部分の間に前記入力文字の中間部分を備える少なくとも1つの中間論理構造を分類する中間分類器と、
前記入力文字の外側部分を備える少なくとも1つの外側論理構造と、前記入力文字の内側部分を備える少なくとも1つの内側論理構造と、を分類する外側−内側分類器と
を含む、ステップと、
1以上の出力を形成するために、前記選択された個別の分類器を用いて前記個別の論理構造を分類するステップと、
出力文字ベクトルを形成するために、前記1以上の選択された分類器からの前記1以上の出力を結合するステップと
を含み、
前記選択するステップと、前記分類するステップと、前記結合するステップは、少なくとも1つのプロセッサユニットにより実施され、
前記論理構造を分類するステップは、前記入力文字が左側−右側部分を有しておらずかつ上部−下部を有していない場合、前記入力文字が認識用の雑分類器に送信され、前記雑分類器において、前記入力文字全体を分析することにより前記1以上の論理構造を分類するステップを含む方法。 - 前記レイアウトを識別するステップは、時間データに基づいて前記レイアウトを識別するステップを含むことを特徴とする請求項1記載の方法。
- 前記レイアウトを識別するステップは、サイズデータに基づいて前記レイアウトを識別するステップを含むことを特徴とする請求項1記載の方法。
- 前記個別の分類器を選択するステップは、テンプレートノードのゲート装置を用いて前記個別の分類器を選択するステップを含むことを特徴とする請求項1記載の方法。
- 前記出力文字ベクトルは、文字のスコアのベクトルであることを特徴とする請求項1記載の方法。
- 入力文字の論理構造を分類する複数の分類器と、
プロセッサユニットにより実施され、前記複数の分類器に接続されていて、前記入力文字を受信しかつ前記入力文字の前記論理構造の空間的配置に基づいて前記複数の分類器のうちの個別の分類器を選択するゲート装置と、
前記複数の分類器に接続されていて、前記選択された個別の分類器の出力を受信して前記出力を結合して出力文字ベクトルとするコンバイナと
を含み、
前記選択された個別の分類器は、
前記入力文字の左側部を備える少なくとも1つの左側論理構造と、前記入力文字の右側部を備える少なくとも1つの右側論理構造と、を分類する左側−右側分類器と、
前記入力文字の上部を備える少なくとも1つの上部論理構造と、前記入力文字の下部を備える少なくとも1つの下部論理構造と、を分類する上部−下部分類器と、
前記入力文字の隣接する少なくとも2つの部分の間に前記入力文字の中間部分を備える少なくとも1つの中間論理構造を分類する中間分類器と、
前記入力文字の外側部分を備える少なくとも1つの外側論理構造と、前記入力文字の内側部分を備える少なくとも1つの内側論理構造と、を分類する外側−内側分類器とを含み、
前記個別の分類器は、前記入力文字が左側−右側部分を有しておらずかつ上部−下部を有していない場合、前記入力文字が認識用の雑分類器に送信され、前記雑分類器が、前記入力文字全体を分析することにより前記論理構造を分類するように構成されること
を特徴とするシステム。 - 前記ゲート装置は、時間データに基づいて前記個別の分類器を選択するように構成されることを特徴とする請求項6記載のシステム。
- 前記ゲート装置は、サイズデータに基づいて前記個別の分類器を選択するように構成されることを特徴とする請求項6記載のシステム。
- 前記個別の分類器の1以上は、論理構造のスコアのベクトルを出力するように構成されることを特徴とする請求項6記載のシステム。
- 前記コンバイナは、前記個別分類器の1以上から出力される前記論理構造のスコアのベクトルを結合して文字のスコアの対応するベクトルを生成するように構成されることを特徴とする請求項9記載のシステム。
- 入力文字の論理構造の空間的配置に基づいて、前記入力文字の論理構造を分類する複数の分類器のうちの個別の分類器を選択するステップであって、前記選択された個別の分類器は、
前記入力文字の左側部を備える少なくとも1つの左側論理構造と、前記入力文字の右側部を備える少なくとも1つの右側論理構造と、を分類する左側−右側分類器と、
前記入力文字の上部を備える少なくとも1つの上部論理構造と、前記入力文字の下部を備える少なくとも1つの下部論理構造と、を分類する上部−下部分類器と、
前記入力文字の隣接する少なくとも2つの部分の間に前記入力文字の中間部分を備える少なくとも1つの中間論理構造を分類する中間分類器と、
前記入力文字の外側部分を備える少なくとも1つの外側論理構造と、前記入力文字の内側部分を備える少なくとも1つの内側論理構造と、を分類する外側−内側分類器と、
を含む選択するステップと、
前記選択された個別の分類器の出力を受信し、前記出力を結合して出力文字のベクトルを生成するステップと、
前記選択するステップと、前記分類するステップと、前記結合するステップは、少なく
とも1つのプロセッサユニットにより実施され、
さらに、前記入力文字が左側−右側部分を有しておらずかつ上部−下部を有していない場合、前記入力文字が認識用の雑分類器に送信され、前記雑分類器において、前記入力文字全体を分析することにより前記1以上の論理構造を分類するステップ
を含む方法。 - 前記個別の分類器を選択するステップは、時間データに基づくことを特徴とする請求項11記載の方法。
- 前記個別の分類器を選択するステップは、サイズデータに基づくことを特徴とする請求項11記載の方法。
- プロセッサユニットにより実施されると、請求項11に記載の方法を実行するコンピュータ読み取り可能命令を実装する少なくとも1つのコンピュータ読み取り可能記録媒体であって、少なくとも1つの読み取り可能記録媒体であって、
少なくとも1つの読み取り可能記録媒体は、RAM、ROM、EEPROM、フラッシュメモリ、CD−ROM、デジタル多用途ディスク(DVD)、その他の光記録デバイス、あるいは、磁気記録デバイスを含むことを特徴とする少なくとも1つのコンピュータ読み取り可能記録媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/299,873 US7844114B2 (en) | 2005-12-12 | 2005-12-12 | Logical structure layout identification and classification for offline character recognition |
US11/299,873 | 2005-12-12 | ||
PCT/US2006/047291 WO2007070489A1 (en) | 2005-12-12 | 2006-12-11 | Logical structure and layout based offline character recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009519547A JP2009519547A (ja) | 2009-05-14 |
JP5237110B2 true JP5237110B2 (ja) | 2013-07-17 |
Family
ID=38139442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008545722A Expired - Fee Related JP5237110B2 (ja) | 2005-12-12 | 2006-12-11 | 論理構造およびレイアウトに基づくオフラインの文字認識 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7844114B2 (ja) |
JP (1) | JP5237110B2 (ja) |
KR (1) | KR101265928B1 (ja) |
CN (1) | CN101366017B (ja) |
WO (1) | WO2007070489A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102050422B1 (ko) * | 2013-03-14 | 2020-01-08 | 한화테크윈 주식회사 | 문자 인식 장치 및 방법 |
US9286527B2 (en) * | 2014-02-20 | 2016-03-15 | Google Inc. | Segmentation of an input by cut point classification |
CN107533671B (zh) * | 2015-05-11 | 2021-02-23 | 株式会社东芝 | 模式识别装置、模式识别方法以及记录介质 |
CN104992173B (zh) * | 2015-06-03 | 2018-08-17 | 北京拍医拍智能科技有限公司 | 用于医学报告单的符号识别方法及系统 |
CN106127198A (zh) * | 2016-06-20 | 2016-11-16 | 华南师范大学 | 一种基于多分类器集成的图像文字识别方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03160585A (ja) * | 1989-11-17 | 1991-07-10 | Sanyo Electric Co Ltd | 文字認識方法 |
JPH06309492A (ja) * | 1993-04-21 | 1994-11-04 | Eastman Kodak Co | 複数分類器出力合成方法及び合成システム |
US5768417A (en) * | 1994-09-09 | 1998-06-16 | Motorola, Inc. | Method and system for velocity-based handwriting recognition |
JPH0969137A (ja) * | 1995-08-31 | 1997-03-11 | Toshiba Corp | 部首抽出方法、部首単位文字認識方法及びその装置 |
US6081621A (en) * | 1996-10-01 | 2000-06-27 | Canon Kabushiki Kaisha | Positioning templates in optical character recognition systems |
KR100199296B1 (ko) | 1996-10-02 | 1999-06-15 | 이계철 | 규칙적인 잡음을 이용한 한글 인식 시스템 |
KR19980058361A (ko) * | 1996-12-30 | 1998-09-25 | 구자홍 | 한글 문자 인식 방법 및 시스템 |
JPH11238099A (ja) | 1997-12-19 | 1999-08-31 | Matsushita Electric Ind Co Ltd | 文字認識装置及びその方法並びに文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
JPH11184971A (ja) * | 1997-12-22 | 1999-07-09 | Toshiba Corp | 手書き文字認識機能を持つ文字入力装置及び方法 |
KR100456620B1 (ko) | 2001-12-20 | 2004-11-10 | 한국전자통신연구원 | 한글문자 인식 방법 |
CN1514340A (zh) * | 2003-08-11 | 2004-07-21 | 张德龙 | 汉字形体特征象形分类法与汉字特征象形码输入法 |
CN1251130C (zh) * | 2004-04-23 | 2006-04-12 | 清华大学 | 多字体多字号印刷体藏文字符识别方法 |
-
2005
- 2005-12-12 US US11/299,873 patent/US7844114B2/en not_active Expired - Fee Related
-
2006
- 2006-12-11 JP JP2008545722A patent/JP5237110B2/ja not_active Expired - Fee Related
- 2006-12-11 CN CN2006800464508A patent/CN101366017B/zh not_active Expired - Fee Related
- 2006-12-11 KR KR1020087013902A patent/KR101265928B1/ko not_active IP Right Cessation
- 2006-12-11 WO PCT/US2006/047291 patent/WO2007070489A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US7844114B2 (en) | 2010-11-30 |
KR101265928B1 (ko) | 2013-05-20 |
JP2009519547A (ja) | 2009-05-14 |
US20070133883A1 (en) | 2007-06-14 |
KR20080080112A (ko) | 2008-09-02 |
CN101366017B (zh) | 2010-06-16 |
WO2007070489A1 (en) | 2007-06-21 |
CN101366017A (zh) | 2009-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101411241B1 (ko) | 필적 분석을 용이하게 하는 시스템, 필적 인식 제공을 용이하게 하는 기계 구현 방법 및 필적 분석을 용이하게 하는 기계 구현 시스템 | |
CN101496036B (zh) | 两层文本识别系统和方法 | |
Jayadevan et al. | Offline recognition of Devanagari script: A survey | |
Dutta et al. | Robust recognition of degraded documents using character n-grams | |
CN101730898A (zh) | 采用神经网络的手写识别 | |
Kaur et al. | A comprehensive survey on word recognition for non-Indic and Indic scripts | |
JP5237110B2 (ja) | 論理構造およびレイアウトに基づくオフラインの文字認識 | |
Bazazian et al. | Fast: Facilitated and accurate scene text proposals through fcn guided pruning | |
Sampath et al. | Decision tree and deep learning based probabilistic model for character recognition | |
Al-Barhamtoshy et al. | Arabic documents information retrieval for printed, handwritten, and calligraphy image | |
Inkeaw et al. | Recognition-based character segmentation for multi-level writing style | |
Murthy et al. | Choice of Classifiers in Hierarchical Recognition of Online Handwritten Kannada and Tamil Aksharas. | |
Kumar et al. | A novel framework for writer identification based on pre-segmented Gurmukhi characters | |
Ghosh et al. | R-PHOC: segmentation-free word spotting using CNN | |
Neves et al. | An efficient way of combining SVMs for handwritten digit recognition | |
El-Mahallawy | A large scale HMM-based omni front-written OCR system for cursive scripts | |
Das et al. | Survey of Pattern Recognition Approaches in Japanese Character Recognition | |
JPWO2017013719A1 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Kaur | An Overview of Advanced Technologies Applied to Identified Printed and Handwritten Text in Gurmukhi Script: A Review | |
Das | Enhancing OCR Performance with Low Supervision | |
Alsurori et al. | Review on Arabic Handwritten Recognition Using Deep Learning and Machine Learning | |
Porwal et al. | Multiclass Learning for Writer Identification Using Error-Correcting Codes | |
Butt et al. | Attention-Based CNN-RNN Arabic Text Recognition from Natural Scene Images. Forecasting 2021, 3, x | |
Xu | Automatic segmentation and recognition system for handwritten dates on cheques | |
Gupta | Assessment of OCR Quality and Font Identification in Historical Documents |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121214 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20121217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20121217 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130328 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |