JP2007058304A - 文字認識装置及び文字認識方法 - Google Patents
文字認識装置及び文字認識方法 Download PDFInfo
- Publication number
- JP2007058304A JP2007058304A JP2005239916A JP2005239916A JP2007058304A JP 2007058304 A JP2007058304 A JP 2007058304A JP 2005239916 A JP2005239916 A JP 2005239916A JP 2005239916 A JP2005239916 A JP 2005239916A JP 2007058304 A JP2007058304 A JP 2007058304A
- Authority
- JP
- Japan
- Prior art keywords
- character
- cutting
- frame
- attribute
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/15—Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】文字認識装置は、帳票などの紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行うものである。行画像分離部32は、複数の文字記入枠および前記文字列を含む画像を取得する。各種の処理部33〜37を含む文字切出処理部は、前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する。文字認識部38は、文字切出処理部によって生成された個々の文字候補に対して文字認識を行う。
【選択図】図5
Description
図1は、本発明の一実施形態に係る文字認識装置に適用される基本的な処理の流れを示す概念図である。
図6及び図7を参照して、第1の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
図8及び図9を参照して、第2の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
・文字パーツ1の縦方向の大きさが文字記入枠の大きさに対比して小さくない(所定値以上である)
・文字パーツ1の中心座標が一番近い文字記入枠の縦線の位置から離れている(所定値以上である)
この結果、文字切断点決定部34では、文字パーツ1は文字候補に成り得るとみなし、切断候補点P21の位置での切断を行うべきと決定する。文字パーツ生成部35では、実際に当該切断を行って文字パーツ1を生成し、文字候補生成部37ではその文字パーツ1を文字候補とする。
・文字パーツ2の縦方向の大きさが枠の大きさに対比して小さい(所定値未満である)
・文字パーツ2の中心座標が一番近い文字記入枠の縦線の位置に近い(所定の距離以内である)
この結果、文字切断点決定部34では、文字パーツ2は文字候補に成り得ないとみなし、切断候補点P22の位置での切断を行うべきでないと決定する。このため、文字パーツ2は単体では文字候補とはならない。
図10〜図13を参照して、第3の文字切出手法について説明する。なお、必要に応じて図5も参照するものとする。
・そのパーツがどの文字記入枠に属するかを示す情報
・そのパーツがどの文字記入枠に属するか不明であることを示す情報
・そのパーツの大きさを示す情報
・そのパーツの形状を示す情報
・そのパーツが切断候補点の位置で切断して生成されたものであるか否かを示す情報
・そのパーツがどの切断候補点の位置で切断して生成されたものであるかを示す情報
・上記の各情報を選択的に組み合わせて得られる情報
図11(b)の例では、各文字パーツが属する文字記入枠の枠番号「0」「1」「1」「2」が属性として付与されている(枠属性が付与されている)。すなわち、文字「1」のパーツは中心座標が枠番号「0」の文字記入枠の中にあるため、属性として枠番号「0」が付与され、文字「8」が分離されて出来上がった2つのパーツ「○」「○」は中心座標がそれぞれ枠番号「1」の文字記入枠の中にあるため、属性として枠番号「1」が付与され、文字「0」のパーツは中心座標が枠番号「2」の文字記入枠の中にあるため、属性として枠番号「2」が付与されている。
・同じ枠属性のパーツを結合してできる新しいパーツには、結合したパーツと同じ枠属性を付与する
・どのパーツに属するかわからないパーツは、枠属性をもつパーツと結合しない限り文字候補として残さない
・どのパーツに属するかわからないパーツで、しかも所定の大きさ未満の小さいパーツは左右のパーツのどちらとも結合し文字候補を生成するか、どちらにも結合せず除去する
次に、図12及び図13を参照して、第3の文字切出手法による動作の一例を説明する。当該動作については、個々の文字パーツに属性を付加する属性付加処理と、属性付加処理の終了後に文字候補を作成する文字候補作成処理とに分けて説明する。
・どの枠に属するかわからないパーツは、枠属性をもつパーツと結合する
・どの枠に属するかわからないパーツは、単体では文字候補となりえない
このような文字候補生成規則を採用した場合、文字候補生成部37においては、図15に示されるように、リガチャに相当する文字パーツ「−」が隣接する文字パーツ「0」に結合したものを含む文字候補が生成される。文字認識部38においては、リガチャ付きの「0」を通常の「0」として認識するため、文字認識結果として文字「0」「0」「0」が得られることとなる。
・どの枠に属するかわからないパーツは、単体では文字候補となりえない
このような文字候補生成規則を採用した場合、文字候補生成部37においては、図16に示されるように、リガチャに相当する文字パーツ「−」を破棄し、3つの文字パーツ「0」「0」「0」だけを残すため、文字認識部38においては、文字認識結果として文字「0」「0」「0」が得られることとなる。
・どの枠に属するかわからないパーツは、枠属性をもつパーツと結合する
・同じ枠に属するパーツを結合してできたパーツには同じ枠属性を付与する
・違う枠属性を持つパーツでも隣り合っている場合には結合し、枠属性を2つ付与する
・結合するパーツの枠属性が3つ以上になる場合には結合しない
次に、図19を参照して、このような文字候補生成規則を用いた場合の動作の一例を説明する。
・どの枠に属するかわからないパーツは、枠属性を持つパーツと結合する
・どの枠に属するかわからないパーツは、単体では文字候補としない
・違う枠属性を持つパーツは結合しない
・どの枠に属するかわからないパーツで、小さいものは結合もせず除去する
次に、図20を参照して、このような文字候補生成規則を用いた場合の動作の一例を説明する。
Claims (12)
- 紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識装置であって、
前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得手段と、
前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出処理手段と、
前記文字切出処理手段によって生成された個々の文字候補に対して文字認識を行う文字認識手段と、
を具備することを特徴とする文字認識装置。 - 前記文字切出処理手段は、
検出された点と当該点に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断は行わないことを決定し、所定値未満であれば、その点の位置での切断を行うことを決定する決定手段を具備することを特徴とする請求項1記載の文字認識装置。 - 前記文字切出処理手段は、
1)検出された点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が該当する文字記入枠の中の所定の範囲内にあり、2)当該文字パーツの大きさが所定値以上あり、且つ、3)当該文字パーツの中心座標と当該中心座標の位置に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断を行うことを決定する決定手段を具備することを特徴とする請求項1記載の文字認識装置。 - 前記文字切出処理手段は、
前記文字列において複数の線が互いに接触または交差する個々の点の位置で切断を行って生成される個々の文字パーツに対し、当該文字パーツが属する文字記入枠を識別するための枠属性を付与する属性付与手段と、
前記属性付与手段により同じ枠属性を付与された複数の文字パーツがある場合に、当該複数の文字パーツを再結合して生成される新たな文字パーツを一つの文字候補として生成する文字候補生成手段と、
を具備することを特徴とする請求項1記載の文字認識装置。 - 前記文字候補生成手段は、前記属性付与手段が枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツを隣の文字パーツと結合して生成される新たな文字パーツを一つの文字候補として生成する手段を具備することを特徴とする請求項4記載の文字認識装置。
- 前記文字候補生成手段は、前記属性付与手段が枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツの縦方向の大きさが所定値未満であれば、その文字パーツを破棄する手段を具備することを特徴とする請求項4記載の文字認識装置。
- 紙葉類に記載された複数の文字記入枠に記入された文字列から個々の文字候補を生成して文字認識を行う文字認識方法であって、
前記複数の文字記入枠および前記文字列を含む画像を取得する画像取得ステップと、
前記画像に含まれる前記文字列において複数の線が互いに接触または交差する個々の点を検出し、当該点と該当する文字記入枠との配置関係に基づいて前記文字列を切断もしくは再結合させるべき点を決定した上で当該切断もしくは再結合を行うことによって前記文字列を構成する個々の文字候補を生成する文字切出ステップと、
前記文字切出ステップにおいて生成された個々の文字候補に対して文字認識を行う文字認識ステップと、
を含むことを特徴とする文字認識方法。 - 前記文字切出ステップは、
検出された点と当該点に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断は行わないことを決定し、所定値未満であれば、その点の位置での切断を行うことを決定する決定ステップを含むことを特徴とする請求項7記載の文字認識方法。 - 前記文字切出ステップは、
1)検出された点の位置で切断を行った場合に生成されることになる文字パーツの中心座標が該当する文字記入枠の中の所定の範囲内にあり、2)当該文字パーツの大きさが所定値以上あり、且つ、3)当該文字パーツの中心座標と当該中心座標の位置に最も近いところにある文字記入枠の縦線との距離が所定値以上あれば、その点の位置での切断を行うことを決定する決定ステップを含むことを特徴とする請求項7記載の文字認識方法。 - 前記文字切出ステップは、
前記文字列において複数の線が互いに接触または交差する個々の点の位置で切断を行って生成される個々の文字パーツに対し、当該文字パーツが属する文字記入枠を識別するための枠属性を付与する属性付与ステップと、
前記属性付与ステップにおいて同じ枠属性を付与された複数の文字パーツがある場合に、当該複数の文字パーツを再結合して生成される新たな文字パーツを一つの文字候補として生成する文字候補生成ステップと、
を含むことを特徴とする請求項7記載の文字認識方法。 - 前記文字候補生成ステップは、前記属性付与ステップにおいて枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツを隣の文字パーツと結合して生成される新たな文字パーツを一つの文字候補として生成するステップを含むことを特徴とする請求項10記載の文字認識方法。
- 前記文字候補生成ステップは、前記属性付与ステップにおいて枠属性を付与することができなかった文字パーツがある場合に、当該文字パーツの縦方向の大きさが所定値未満であれば、その文字パーツを破棄するステップを含むことを特徴とする請求項10記載の文字認識方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005239916A JP4834351B2 (ja) | 2005-08-22 | 2005-08-22 | 文字認識装置及び文字認識方法 |
EP06014917A EP1758048A2 (en) | 2005-08-22 | 2006-07-18 | Character recognition apparatus and character recognition method |
US11/497,330 US7680329B2 (en) | 2005-08-22 | 2006-08-02 | Character recognition apparatus and character recognition method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005239916A JP4834351B2 (ja) | 2005-08-22 | 2005-08-22 | 文字認識装置及び文字認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058304A true JP2007058304A (ja) | 2007-03-08 |
JP4834351B2 JP4834351B2 (ja) | 2011-12-14 |
Family
ID=37441560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005239916A Expired - Fee Related JP4834351B2 (ja) | 2005-08-22 | 2005-08-22 | 文字認識装置及び文字認識方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7680329B2 (ja) |
EP (1) | EP1758048A2 (ja) |
JP (1) | JP4834351B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101109329B1 (ko) * | 2008-02-20 | 2012-01-31 | 가부시끼가이샤 도시바 | 패턴 인식 방법, 및 패턴 인식 프로그램을 기억하는 기억 매체 |
JP2019113860A (ja) * | 2019-03-15 | 2019-07-11 | 富士通株式会社 | 正誤判定ルール設定プログラム、正誤判定ルール設定方法および正誤判定ルール設定装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20080099385A (ko) * | 2007-05-09 | 2008-11-13 | 유니챌(주) | 문자 인식을 통한 미디어 컨텐츠 검색 및 출력 시스템과 그방법 |
US9600731B2 (en) * | 2015-04-08 | 2017-03-21 | Toshiba Tec Kabushiki Kaisha | Image processing apparatus, image processing method and computer-readable storage medium |
US9563812B2 (en) | 2015-04-08 | 2017-02-07 | Toshiba Tec Kabushiki Kaisha | Image processing apparatus, image processing method and computer-readable storage medium |
US10395133B1 (en) * | 2015-05-08 | 2019-08-27 | Open Text Corporation | Image box filtering for optical character recognition |
JP6903966B2 (ja) * | 2017-03-16 | 2021-07-14 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、情報処理システム及びプログラム |
US10402673B1 (en) * | 2018-10-04 | 2019-09-03 | Capital One Services, Llc | Systems and methods for digitized document image data spillage recovery |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5449034A (en) * | 1977-09-27 | 1979-04-18 | Nec Corp | Eraser for unneeded part of pattern |
JPS5953983A (ja) * | 1982-09-21 | 1984-03-28 | Toshiba Corp | 文字の検出切出方法 |
JPH0676114A (ja) * | 1992-08-25 | 1994-03-18 | Ricoh Co Ltd | 文字認識方法 |
JPH08202822A (ja) * | 1995-01-26 | 1996-08-09 | Fujitsu Ltd | 文字切り出し装置、及び文字切り出し方法 |
JP2000339408A (ja) * | 1999-05-26 | 2000-12-08 | Matsushita Electric Ind Co Ltd | 文字切り出し装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4024500A (en) | 1975-12-31 | 1977-05-17 | International Business Machines Corporation | Segmentation mechanism for cursive script character recognition systems |
IL75117A (en) | 1985-05-07 | 1990-08-31 | Reuven Nir | Symmetrical optical resonator and laser comprising same |
KR930001416B1 (ko) | 1990-07-13 | 1993-02-27 | 금성일렉트론 주식회사 | 셀 플레이트 전압 발생방법 및 회로 |
US5491758A (en) * | 1993-01-27 | 1996-02-13 | International Business Machines Corporation | Automatic handwriting recognition using both static and dynamic parameters |
JP3345224B2 (ja) * | 1995-03-06 | 2002-11-18 | 富士通株式会社 | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 |
US5768414A (en) * | 1995-12-22 | 1998-06-16 | Canon Kabushiki Kaisha | Separation of touching characters in optical character recognition |
JP3830998B2 (ja) * | 1995-12-28 | 2006-10-11 | 株式会社東芝 | 罫線除去方法及びこれを用いた文字認識装置 |
JP2000113101A (ja) | 1998-09-30 | 2000-04-21 | Matsushita Electric Ind Co Ltd | 文字切り出し方法および装置 |
JP2002063548A (ja) | 2001-06-18 | 2002-02-28 | Hitachi Software Eng Co Ltd | 手書き文字認識方法 |
-
2005
- 2005-08-22 JP JP2005239916A patent/JP4834351B2/ja not_active Expired - Fee Related
-
2006
- 2006-07-18 EP EP06014917A patent/EP1758048A2/en not_active Withdrawn
- 2006-08-02 US US11/497,330 patent/US7680329B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5449034A (en) * | 1977-09-27 | 1979-04-18 | Nec Corp | Eraser for unneeded part of pattern |
JPS5953983A (ja) * | 1982-09-21 | 1984-03-28 | Toshiba Corp | 文字の検出切出方法 |
JPH0676114A (ja) * | 1992-08-25 | 1994-03-18 | Ricoh Co Ltd | 文字認識方法 |
JPH08202822A (ja) * | 1995-01-26 | 1996-08-09 | Fujitsu Ltd | 文字切り出し装置、及び文字切り出し方法 |
JP2000339408A (ja) * | 1999-05-26 | 2000-12-08 | Matsushita Electric Ind Co Ltd | 文字切り出し装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101109329B1 (ko) * | 2008-02-20 | 2012-01-31 | 가부시끼가이샤 도시바 | 패턴 인식 방법, 및 패턴 인식 프로그램을 기억하는 기억 매체 |
JP2019113860A (ja) * | 2019-03-15 | 2019-07-11 | 富士通株式会社 | 正誤判定ルール設定プログラム、正誤判定ルール設定方法および正誤判定ルール設定装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1758048A2 (en) | 2007-02-28 |
JP4834351B2 (ja) | 2011-12-14 |
US7680329B2 (en) | 2010-03-16 |
US20070041643A1 (en) | 2007-02-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4834351B2 (ja) | 文字認識装置及び文字認識方法 | |
JP4787275B2 (ja) | セグメント化ベースの認識 | |
JP5125573B2 (ja) | 領域抽出プログラム、文字認識プログラム、および文字認識装置 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP2008532176A (ja) | 認識グラフ | |
JPH08171614A (ja) | 文字列読み取り装置 | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
JP2008204226A (ja) | 帳票認識装置およびそのプログラム | |
JP2010157107A (ja) | 業務文書処理装置 | |
JP4704601B2 (ja) | 文字認識方法,プログラム及び記録媒体 | |
JP6221220B2 (ja) | 画像処理装置及び画像処理プログラム | |
KR100834602B1 (ko) | 문자 인식 장치 및 문자 인식 방법 | |
JP2009223612A (ja) | 画像認識装置及びプログラム | |
JP6201838B2 (ja) | 情報処理装置及び情報処理プログラム | |
JPH1063744A (ja) | 文書のレイアウト解析方法及びシステム | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP2009087378A (ja) | 帳票処理装置 | |
JP4213558B2 (ja) | 文書レイアウト解析プログラム、文書レイアウト解析プログラムを記憶したコンピュータ読み取り可能な記憶媒体、文書レイアウト解析方法および文書レイアウト解析装置 | |
JP4521377B2 (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
JP4117648B2 (ja) | 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置 | |
JPH10207981A (ja) | 帳票認識方法 | |
JP4221960B2 (ja) | 帳票識別装置及びその識別方法 | |
JP4882929B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009223391A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080812 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100722 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101004 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110510 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110830 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110926 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140930 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |