JP2009519547A - 論理構造およびレイアウトに基づくオフラインの文字認識 - Google Patents
論理構造およびレイアウトに基づくオフラインの文字認識 Download PDFInfo
- Publication number
- JP2009519547A JP2009519547A JP2008545722A JP2008545722A JP2009519547A JP 2009519547 A JP2009519547 A JP 2009519547A JP 2008545722 A JP2008545722 A JP 2008545722A JP 2008545722 A JP2008545722 A JP 2008545722A JP 2009519547 A JP2009519547 A JP 2009519547A
- Authority
- JP
- Japan
- Prior art keywords
- classifiers
- character
- logical structures
- classifier
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K11/00—Methods or arrangements for graph-reading or for converting the pattern of mechanical parameters, e.g. force or presence, into electrical signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Character Discrimination (AREA)
Abstract
Description
Claims (20)
- 1以上の論理構造から成ることを特徴とする入力文字を受信するステップと、
前記入力文字の前記1以上の論理構造のレイアウトを識別するステップと、
前記入力文字の前記1以上の論理構造の前記レイアウトに基づいて複数の分類器のうちの1以上を選択するステップと、
前記1以上の分類器を用いて前記1以上の論理構造を分類して、1以上の出力を形成するステップと、
前記1以上の選択された分類器からの前記1以上の出力を結合して出力文字ベクトルを形成するステップと
を含む方法。 - 前記入力文字の前記1以上の論理構造のレイアウトを識別するステップは、時間データに基づいて前記入力文字の1以上の論理構造のレイアウトを識別するステップを含むことを特徴とする請求項1記載の方法。
- 前記入力文字の前記1以上の論理構造のレイアウトを識別するステップは、サイズデータに基づいて前記入力文字の1以上の論理構造のレイアウトを識別するステップを含むことを特徴とする請求項1記載の方法。
- 前記1以上の論理構造を分類するステップは、前記入力文字全体を分析することにより前記1以上の論理構造を分類するステップを含むことを特徴とする請求項1記載の方法。
- 複数の分類器のうちの1以上を選択するステップは、テンプレートノードのゲート装置を用いて複数の分類器のうちの1以上を選択するステップを含むことを特徴とする請求項1記載の方法。
- 前記出力文字ベクトルは、文字のスコアのベクトルであることを特徴とする請求項1記載の方法。
- 入力文字の1以上の論理構造を分類する複数の分類器と、
前記複数の分類器に接続されていて、前記入力文字を受信しかつ前記入力文字の前記1以上の論理構造のレイアウトに基づいて前記複数の分類器のうちの1以上を選択するゲート装置と、
前記複数の分類器に接続されていて、前記分類器の出力を受信して前記出力を結合して出力文字ベクトルとするコンバイナと
を含むシステム。 - 前記複数の分類器のうちの1つは、左側−右側分類器であって、左側部分及び右側部分を有する文字を分類することを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1つは、上部−下部分類器であって、上部及び下部を有する文字を分類することを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1つは、左側−中間−右側分類器であって、左側部分、中間部分及び右側部分を有する文字を分類することを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1つは、上部−中間−下部分類器であって、上部、中間部分及び下部を有する文字を分類することを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1つは、外側−内側分類器であって、外側部分及び内側部分を有する文字を分類することを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1以上を選択する前記ゲート装置は、時間データに基づいて前記複数の分類器のうちの1以上を選択する前記ゲート装置を含むことを特徴とする請求項7記載のシステム。
- 前記複数の分類器のうちの1以上を選択する前記ゲート装置は、サイズデータに基づいて前記複数の分類器のうちの1以上を選択する前記ゲート装置を含むことを特徴とする請求項7記載のシステム。
- 入力文字の1以上の論理構造を分類する前記分類器は、前記入力文字全体を分析することにより前記1以上の論理構造を分類する前記分類器を含むことを特徴とする請求項7記載のシステム。
- 前記選択された分類器の各々は、論理構造のスコアのベクトルを出力することを特徴とする請求項7記載のシステム。
- 前記分類器の前記出力を結合して出力文字ベクトルを形成する前記コンバイナは、前記分類器から出力される前記論理構造のスコアのベクトルを結合して文字のスコアのベクトルを生成する前記コンバイナを含むことを特徴とする請求項16記載のシステム。
- 入力文字を受信するステップと、
前記入力文字の1以上の論理構造を識別するステップと、
前記入力文字全体を分析して前記1以上の論理構造を分類するステップと、
文字のスコアのベクトルを出力するステップと、
を実行する装置実行可能命令を有することを特徴とする1以上のデバイス読み取り可能な媒体。 - 前記入力文字の1以上の論理構造を識別するステップは、時間データに基づいて前記入力文字の1以上の論理構造を識別するステップを含むことを特徴とする請求項18記載の1以上のデバイス読み取り可能な媒体。
- 前記入力文字の1以上の論理構造を識別するステップは、サイズデータに基づいて前記入力文字の1以上の論理構造を識別するステップを含むことを特徴とする請求項18記載の1以上のデバイス読み取り可能な媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/299,873 US7844114B2 (en) | 2005-12-12 | 2005-12-12 | Logical structure layout identification and classification for offline character recognition |
US11/299,873 | 2005-12-12 | ||
PCT/US2006/047291 WO2007070489A1 (en) | 2005-12-12 | 2006-12-11 | Logical structure and layout based offline character recognition |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009519547A true JP2009519547A (ja) | 2009-05-14 |
JP5237110B2 JP5237110B2 (ja) | 2013-07-17 |
Family
ID=38139442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008545722A Expired - Fee Related JP5237110B2 (ja) | 2005-12-12 | 2006-12-11 | 論理構造およびレイアウトに基づくオフラインの文字認識 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7844114B2 (ja) |
JP (1) | JP5237110B2 (ja) |
KR (1) | KR101265928B1 (ja) |
CN (1) | CN101366017B (ja) |
WO (1) | WO2007070489A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102050422B1 (ko) * | 2013-03-14 | 2020-01-08 | 한화테크윈 주식회사 | 문자 인식 장치 및 방법 |
US9286527B2 (en) * | 2014-02-20 | 2016-03-15 | Google Inc. | Segmentation of an input by cut point classification |
WO2016181468A1 (ja) * | 2015-05-11 | 2016-11-17 | 株式会社東芝 | パターン認識装置、パターン認識方法およびプログラム |
CN104992173B (zh) * | 2015-06-03 | 2018-08-17 | 北京拍医拍智能科技有限公司 | 用于医学报告单的符号识别方法及系统 |
CN106127198A (zh) * | 2016-06-20 | 2016-11-16 | 华南师范大学 | 一种基于多分类器集成的图像文字识别方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03160585A (ja) * | 1989-11-17 | 1991-07-10 | Sanyo Electric Co Ltd | 文字認識方法 |
JPH06309492A (ja) * | 1993-04-21 | 1994-11-04 | Eastman Kodak Co | 複数分類器出力合成方法及び合成システム |
JPH0969137A (ja) * | 1995-08-31 | 1997-03-11 | Toshiba Corp | 部首抽出方法、部首単位文字認識方法及びその装置 |
JPH11184971A (ja) * | 1997-12-22 | 1999-07-09 | Toshiba Corp | 手書き文字認識機能を持つ文字入力装置及び方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5768417A (en) * | 1994-09-09 | 1998-06-16 | Motorola, Inc. | Method and system for velocity-based handwriting recognition |
US6081621A (en) * | 1996-10-01 | 2000-06-27 | Canon Kabushiki Kaisha | Positioning templates in optical character recognition systems |
KR100199296B1 (ko) | 1996-10-02 | 1999-06-15 | 이계철 | 규칙적인 잡음을 이용한 한글 인식 시스템 |
KR19980058361A (ko) * | 1996-12-30 | 1998-09-25 | 구자홍 | 한글 문자 인식 방법 및 시스템 |
JPH11238099A (ja) | 1997-12-19 | 1999-08-31 | Matsushita Electric Ind Co Ltd | 文字認識装置及びその方法並びに文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
KR100456620B1 (ko) | 2001-12-20 | 2004-11-10 | 한국전자통신연구원 | 한글문자 인식 방법 |
CN1514340A (zh) * | 2003-08-11 | 2004-07-21 | 张德龙 | 汉字形体特征象形分类法与汉字特征象形码输入法 |
CN1251130C (zh) * | 2004-04-23 | 2006-04-12 | 清华大学 | 多字体多字号印刷体藏文字符识别方法 |
-
2005
- 2005-12-12 US US11/299,873 patent/US7844114B2/en not_active Expired - Fee Related
-
2006
- 2006-12-11 KR KR1020087013902A patent/KR101265928B1/ko not_active IP Right Cessation
- 2006-12-11 WO PCT/US2006/047291 patent/WO2007070489A1/en active Application Filing
- 2006-12-11 CN CN2006800464508A patent/CN101366017B/zh not_active Expired - Fee Related
- 2006-12-11 JP JP2008545722A patent/JP5237110B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03160585A (ja) * | 1989-11-17 | 1991-07-10 | Sanyo Electric Co Ltd | 文字認識方法 |
JPH06309492A (ja) * | 1993-04-21 | 1994-11-04 | Eastman Kodak Co | 複数分類器出力合成方法及び合成システム |
JPH0969137A (ja) * | 1995-08-31 | 1997-03-11 | Toshiba Corp | 部首抽出方法、部首単位文字認識方法及びその装置 |
JPH11184971A (ja) * | 1997-12-22 | 1999-07-09 | Toshiba Corp | 手書き文字認識機能を持つ文字入力装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
CN101366017A (zh) | 2009-02-11 |
US20070133883A1 (en) | 2007-06-14 |
KR101265928B1 (ko) | 2013-05-20 |
US7844114B2 (en) | 2010-11-30 |
CN101366017B (zh) | 2010-06-16 |
KR20080080112A (ko) | 2008-09-02 |
JP5237110B2 (ja) | 2013-07-17 |
WO2007070489A1 (en) | 2007-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101411241B1 (ko) | 필적 분석을 용이하게 하는 시스템, 필적 인식 제공을 용이하게 하는 기계 구현 방법 및 필적 분석을 용이하게 하는 기계 구현 시스템 | |
Jayadevan et al. | Offline recognition of Devanagari script: a survey | |
CN101496036B (zh) | 两层文本识别系统和方法 | |
CN101730898A (zh) | 采用神经网络的手写识别 | |
Kaur et al. | A comprehensive survey on word recognition for non-Indic and Indic scripts | |
JP5237110B2 (ja) | 論理構造およびレイアウトに基づくオフラインの文字認識 | |
Bazazian et al. | Fast: Facilitated and accurate scene text proposals through fcn guided pruning | |
Nasrollahi et al. | Printed persian subword recognition using wavelet packet descriptors | |
Al-Barhamtoshy et al. | Arabic documents information retrieval for printed, handwritten, and calligraphy image | |
Murthy et al. | Choice of Classifiers in Hierarchical Recognition of Online Handwritten Kannada and Tamil Aksharas. | |
Kumar et al. | A novel framework for writer identification based on pre-segmented Gurmukhi characters | |
Neves et al. | An efficient way of combining SVMs for handwritten digit recognition | |
Das et al. | Survey of Pattern Recognition Approaches in Japanese Character Recognition | |
El-Mahallawy | A large scale HMM-based omni front-written OCR system for cursive scripts | |
Sumetphong et al. | An optimal approach towards recognizing broken Thai characters in OCR systems | |
Islam et al. | Towards building a bangla text recognition solution with a multi-headed cnn architecture | |
Tan et al. | Online writer identification using fuzzy c-means clustering of character prototypes | |
JPWO2017013719A1 (ja) | 文字認識装置、文字認識方法及び文字認識プログラム | |
Kaur et al. | Adverse conditions and techniques for cross-lingual text recognition | |
Siriteerakul et al. | Character classification framework based on support vector machine and knearest neighbour schemes | |
Sundar et al. | A high precision printed character recognition method for Tamil script | |
Alsurori et al. | Review on Arabic Handwritten Recognition Using Deep Learning and Machine Learning | |
Safiya et al. | Interpretation of Handwritten Documents Using ML Algorithms | |
Porwal et al. | Multiclass Learning for Writer Identification Using Error-Correcting Codes | |
Butt et al. | Attention-Based CNN-RNN Arabic Text Recognition from Natural Scene Images. Forecasting 2021, 3, x |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091210 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120120 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20120817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121214 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20121217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20121217 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20130111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130226 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130328 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160405 Year of fee payment: 3 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |