JP2006277149A - 文字画像切出装置、文字画像切出方法およびプログラム - Google Patents

文字画像切出装置、文字画像切出方法およびプログラム Download PDF

Info

Publication number
JP2006277149A
JP2006277149A JP2005093260A JP2005093260A JP2006277149A JP 2006277149 A JP2006277149 A JP 2006277149A JP 2005093260 A JP2005093260 A JP 2005093260A JP 2005093260 A JP2005093260 A JP 2005093260A JP 2006277149 A JP2006277149 A JP 2006277149A
Authority
JP
Japan
Prior art keywords
character
image
character image
shape characteristic
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005093260A
Other languages
English (en)
Other versions
JP4810853B2 (ja
Inventor
Toshiya Koyama
俊哉 小山
Teruka Saito
照花 斎藤
Shoichi Tateno
昌一 舘野
Kei Tanaka
圭 田中
Masayoshi Sakakibara
正義 榊原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2005093260A priority Critical patent/JP4810853B2/ja
Publication of JP2006277149A publication Critical patent/JP2006277149A/ja
Application granted granted Critical
Publication of JP4810853B2 publication Critical patent/JP4810853B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】 異なる書き手による手書き文字に関し、当該手書き文字を示す画像データから、常に高い精度で正しく各々の文字を示す画像データを切り出す手段を提供する。
【解決手段】 形状特性特定部1014は、升目に書かれた文字の各々を示す文字画像の形状特性を特定し、形状特性データ1023として記憶部102に記憶する。第2文字画像認識部1016は、自由記入欄に書かれた文字列を示す画像から、1文字を示す文字画像の候補をセグメントとして取り出す。第2文字画像認識部1016は、取り出したセグメントの形状特性を、形状特性データ1023により示される形状特性と比較し、当該セグメントを文字画像として切り出すか否かを判定する。
【選択図】 図1

Description

本発明は、文字認識処理に用いられる文字画像の切り出し技術に関する。
文字を示す画像データから抽出した特徴点と、予めデータベースに登録してある文字の特徴点とを比較することにより、画像データにより示される文字を認識し、認識した文字を示すテキストデータを生成する技術がある。
上記のような文字認識処理において、画像データが複数の文字を示す場合、その画像データから各々の文字を示す画像データを切り出すことが必要となる。すなわち、画像データに含まれる連続したオン画素群のいずれが1つの文字を構成するものであるかを特定する必要がある。そのような文字画像の切り出し技術を開示したものとして、例えば特許文献1および2がある。
特開平9−81684号公報 特開平11−224310号公報
上記の特許文献1および2に開示の技術による場合、画像データにより示される文字の縦横比が所定の範囲内に納まっている場合において、各々の文字を示す画像データが正しく切り出される可能性が高い。しかしながら、手書き文字の形状特性は書き手によってまちまちであるため、従来技術による場合、全ての書き手による文字に関して高い精度で各々の文字を示す画像データを正しく切り出すことは困難である。
上述の事情に鑑み、本発明は異なる書き手による手書き文字に関し、当該手書き文字を示す画像データから、常に高い精度で正しく各々の文字を示す画像データを切り出す手段を提供することを目的とする。
上述の課題を解決するため、本発明は、各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得手段と、前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する第1文字画像認識手段と、前記第1文字画像認識手段により認識された文字画像の形状特性を特定する形状特性特定手段と、前記形状特性特定手段により特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識手段と、前記第2文字画像認識手段により認識された文字画像を示す画像データを出力する出力手段とを備えることを特徴とする文字画像切出装置を提供する。
好ましい態様において、前記文字画像切出装置は前記第1文字画像認識手段により認識された文字画像を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像を複数の種別のいずれかに分類する第1分類手段と、前記第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、当該文字画像の候補を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像の候補を前記複数の種別のいずれかに分類する第2分類手段とをさらに備え、前記第2文字画像認識手段は、前記第2分類手段により取り出された文字画像の候補の形状特性と、前記第2分類手段により当該文字画像の候補が分類された種別と同じ種別に前記第1分類手段により分類された文字画像の形状特性とを比較することにより、当該文字画像の候補を1文字を示す文字画像として認識するか否かを決定するように構成されてもよい。
また、他の好ましい態様において、前記文字画像切出装置の前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の縦横比もしくは当該文字画像を構成する複数の部分の各々の縦横比を前記形状特性として特定するように構成されてもよい。
また、他の好ましい態様において、前記文字画像切出装置の前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の傾斜度もしくは当該文字画像を構成する複数の部分の各々の傾斜度を前記形状特性として特定するように構成されてもよい。
また、他の好ましい態様において、前記文字画像切出装置は標準的な文字の形状特性もしくは標準的な文字の構成部の形状特性を示す標準形状特性データを記憶する記憶手段と、画像により示される文字を認識する文字認識手段とを備え、前記第2文字画像認識手段は、第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、前記文字認識手段は、前記第2文字画像認識手段により取り出された文字画像により示されると推定される文字を認識し、前記第2文字画像認識手段は、前記記憶手段に記憶されている標準形状特性データのうち、前記文字認識手段により認識された文字、前記文字認識手段により認識された文字と類似した形状を有する文字および文字の構成部であって前記文字認識手段により認識された文字と類似した形状を有する構成部の少なくとも1に関する標準形状特性データにより示される形状特性に対し、前記形状特性特定手段により特定された形状特性に応じた補正を加えたものと、前記文字画像の候補の形状特性とを比較することにより、前記文字画像の候補を1文字を示す文字画像として認識するか否かを決定するように構成されてもよい。
また、本発明は、上記いずれかに記載の前記文字画像切出装置において行われる文字画像切出方法を提供する。さらに本発明は、上記いずれかに記載の前記文字画像切出装置が行う処理と同様の処理をコンピュータに実行させることを特徴とするプログラムを提供する。
本発明によれば、升目のない領域に書かれた手書き文字を示す画像から各々の文字を示す画像が切り出される際に、同じ書き手によって升目に書かれた手書き文字の形状特性が用いられる。その結果、各々の文字を示す画像の切り出しが高い精度で正しく行われる。
[1.第1実施形態]
図1は本発明の第1実施形態にかかる文字認識システム1の構成を示したブロック図である。文字認識システム1は、複数の文字を示す画像データから各々の文字を示す画像データを切り出して送信する文字画像切出装置10と、紙面に書かれた図形や文字を光学的に読み取ってそれらの図形や文字を白黒で示す画像データを文字画像切出装置10に送信するスキャナ11と、文字画像切出装置10から送信される画像データに対し文字認識処理を行い認識した文字を示すテキストデータを生成する文字認識装置12を備えている。
図2は、スキャナ11により読み取り処理の行われる記入用紙を例示した図である。図2に示されるように、記入用紙には升目により各々の文字が書かれるべき領域が指定された氏名欄および住所欄と、升目が付されていない自由記入欄が含まれている。これらの記入欄には、書き手により手書きの文字列が記入されている。スキャナ11は記入用紙に記載されている図形および文字を示す画像データを生成し、生成した画像データを文字画像切出装置10に送信する。
文字画像切出装置10は、文字画像切出装置10の構成部を制御する制御部101と、制御部101による各種処理を指示するプログラムおよび各種データを記憶するとともに制御部101のワークエリアとして用いられる記憶部102を備えている。以下、図3および図4を参照しつつ、制御部101により行われる処理を説明する。
制御部101は、スキャナ11から画像データを受信する画像データ入力部1011を備えている。画像データ入力部1011はスキャナ11から受信した画像データを記憶部102に画像データ1021として記憶する(ステップS1)。画像データ1021は、平面上に等間隔で配置された画素に対応する画素データの集合であり、各画素データは黒を示すオン画素データもしくは白を示すオフ画素データのいずれかである。
制御部101は、画像データ1021により示される画像から各々の升目が占める領域(以下、「升目領域」と呼ぶ)および自由記入欄の占める領域(以下、「自由記入欄領域」と呼ぶ)を特定する領域特定部1012を備えている。領域特定部1012は、例えば画像データ1021に対し細線化処理を行った後、特徴点の抽出処理を行う。特徴点とは、例えば細線化処理後のオン画素の端点、交点、屈曲点等を意味する。領域特定部1012はそのように抽出した特徴点から直線部分を特定し、特定した直線部分により囲まれる領域を、升目領域もしくは自由記入欄領域として認識する。領域特定部1012は認識した各々の升目領域および自由記入欄領域を示す領域データ1022を記憶部102に記憶する(ステップS2)。
制御部101は、升目領域に含まれる画像を取り出す第1文字画像認識部1013を備えている。第1文字画像認識部1013は、画像データ1021から、領域データ1022により示される升目領域の各々に含まれる画素データ群を取り出し、取り出したオン画素データ群を、1文字を示す画像(以下、「文字画像」と呼ぶ)を示す画像データ(以下、「文字画像データ」と呼ぶ)として認識する(ステップS3)。
制御部101は、文字画像の縦横比および傾斜度を特定する形状特性特定部1014を備えている。第1文字画像認識部1013は文字画像データを形状特性特定部1014に引き渡す。形状特性特定部1014は第1文字画像認識部1013から文字画像データを受け取ると、水平方向に伸びる上底および下底を有し、文字画像データにより示される文字画像に外接する平行四辺形を特定する。文字画像に外接する平行四辺形が複数存在する場合、形状特性特定部1014は、例えば各々の平行四辺形のうち面積が最も小さいものを選択する。図5は升目領域に書かれた文字画像の各々に対し、形状特性特定部1014により特定された平行四辺形が外接している様子を示した図である。
形状特性特定部1014は、各々の文字画像に外接する平行四辺形の高さxの上底(もしくは下底)の長さyに対する比(x/y)の平均値を、升目領域に書かれた文字画像群の縦横比として算出する。また、形状特性特定部1014は、各々の文字画像に外接する平行四辺形の左側(もしくは右側)の辺の垂直方向に対する角度の平均値を、升目領域に書かれた文字画像群の傾斜度として算出する。形状特性特定部1014は算出した縦横比および傾斜度を示すデータを、形状特性データ1023として記憶部102に記憶する(ステップS4)。
制御部101は、自由記入欄領域に含まれる画像から各行の文字列を示す画像(以下、「行画像」と呼ぶ)を切り出す行画像認識部1015を備えている。行画像認識部1015は、まず画像データ1021から、領域データ1022により示される自由記入欄領域に含まれるオン画素データを取り出し、取り出した画素データの水平方向の分布を垂直方向に走査し、水平方向のオン画素データが所定の閾値を超える垂直方向の範囲を特定する。そのように特定された範囲に含まれる画素データ群は行画像を示す画像データ(以下、「行画像データ」と呼ぶ)である(ステップS5)。
制御部101は、行画像から各々の文字を示す文字画像を取り出す第2文字画像認識部1016を備えている。行画像認識部1015は、行画像データを第2文字画像認識部1016に引き渡す。第2文字画像認識部1016は行画像データを受け取ると、受け取った行画像データにより示される行画像に含まれるオン画素のうち最も左に位置するものを起点画素とし、起点画素に連続するオン画素群を取り出す。以下、このように取り出されたオン画素群を「第1セグメント」と呼ぶ(ステップS6)。
続いて、第2文字画像認識部1016は第1セグメントに外接する平行四辺形を、形状特性特定部1014が升目領域内の文字画像に対し行う場合と同様の方法で特定し、特定した平行四辺形の縦横比および傾斜度を算出する(ステップS7)。第2文字画像認識部1016は、算出した縦横比の形状特性データ1023により示される縦横比に対する比率および算出した傾斜度の形状特性データ1023により示される傾斜度に対する比率が、いずれも所定の範囲内(例えば0.8〜1.2)に含まれているか否かを判定する。以下、この判定を「形状特性判定」と呼ぶ(ステップS8)。
第2文字画像認識部1016は、第1セグメントに関する形状特性判定において肯定的な結果を得た場合(ステップS8:Yes)、第1セグメントに外接する平行四辺形の内側領域の画像が1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS9)。識別ラベルは、例えば(1,1)のように2つの要素を持つ配列であり、第1の要素は行画像の番号、すなわち行番号を示し、第2の要素は行画像における文字画像の番号、すなわち行頭からの文字番号を示す。なお、以下の説明において、セグメントに外接する平行四辺形の内側領域の画像を「セグメント領域画像」のように呼ぶ。
一方、第2文字画像認識部1016は、第1セグメントに関する形状特性判定において否定的な結果を得た場合(ステップS8:No)、第1セグメント領域画像は1文字を示す文字画像ではなく、1文字を構成する構成部を示す画像であると仮定し、行画像に含まれるオン画素のうち、第1セグメントより右側に位置しかつ最も左に位置するものを起点画素とし、起点画素に連続するオン画素群を取り出す。以下、このように取り出されたオン画素群を「第2セグメント」と呼ぶ(ステップS10)。
第2文字画像認識部1016は、第1セグメントと第2セグメントの両方を含むオン画素群(以下、「連結セグメント」と呼ぶ)に対し、形状特性判定を行う(ステップS11)。第2文字画像認識部1016は連結セグメントに関する形状特性判定において肯定的な結果を得た場合(ステップS11:Yes)、連結セグメント領域画像が1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS12)。
一方、第2文字画像認識部1016は、連結セグメントに関する形状特性判定において否定的な結果を得た場合(ステップS11:No)、例えば、第1セグメントと連結セグメントのうち、それらの縦横比が形状特性データ1023により示される縦横比により近いものを選択し、選択したセグメントに関するセグメント領域画像を1文字を示す文字画像であると判断し、その文字画像を示す画像データに識別ラベルを付して文字画像データとして記憶部102に記憶する(ステップS13)。
第2文字画像認識部1016は上記のように行画像の一部を文字画像として切り出すと、切り出した文字画像を行画像から除外した後(ステップS14)、行画像から文字画像を切り出す処理(ステップS6〜S14)を、全てのオン画素が行画像から除外されるまで繰り返す(ステップS15)。
第2文字画像認識部1016は、行画像認識部1015により複数の行画像が取り出された場合には、残りの全ての行画像に対し上述した文字画像の切り出し処理(ステップS6〜S15)を繰り返す(ステップS16)。第2文字画像認識部1016により切り出された文字画像を示す文字画像データは順次記憶部102に記憶される。図1においてそれらの文字画像データは文字画像データ群1024として示されている。
制御部101は、文字画像データを文字認識装置12に送信する画像データ出力部1017を備えている。第2文字画像認識部1016は、全ての行画像に関し文字画像の切り出し処理を完了すると、画像データ出力部1017に画像データの送信を指示する。その指示に応じて、画像データ出力部1017は記憶部102に記憶されている文字画像データ群1024に含まれる文字画像データを、識別ラベルの順序に従って順次、文字認識装置12に送信する(ステップS17)。
文字認識装置12は、文字画像切出装置10から文字画像データを受信すると、受信した文字画像データにより示される画像に対し文字認識処理を行い、その画像により示される文字を示す文字データを生成する。
図6は、文字画像切出装置10により、行画像から正しく文字画像が切り出される様子を例示した図である。例えば、横長の字を書く癖のある書き手である田中太郎により自由記入欄に「今日明日」という文字が書かれた場合(図6(a))、従来技術によれば「明」の字が「日」と「月」として切り出される可能性が高かったが(図6(a−1))、文字画像切出装置10によれば正しく「明」として切り出される可能性が高い(図6(a−2))。
同様に、縦長の字を書く癖のある書き手である山田次郎により自由記入欄に「除虫工房」という文字が書かれた場合(図6(b))、従来技術によれば「虫」および「工」の字が「虹」として切り出される可能性が高かったが(図6(b−1))、文字画像切出装置10によれば正しく「虫」および「工」として切り出される可能性が高い(図6(b−2))。
さらに、傾斜の強い字を書く癖のある書き手である鈴木花子により自由記入欄に「春夏秋冬」という文字が書かれた場合(図6(c))、例えばオン画素の垂直方向の分布によりセグメントの切り出しを行う従来技術によれば文字の切り出しが出来ない可能性が高かったが(図6(c−1))、文字画像切出装置10によれば正しく各々の文字が切り出される可能性が高い(図6(c−2))。
上記のように、文字画像切出装置10は升目領域に書かれた文字画像の形状特性に基づき、自由記入欄に書かれた文字画像の切り出しを行うため、切り出された文字画像が正しく1文字を示す画像である可能性が高い。従って、文字画像切出装置10により生成された文字画像データを用いて行われる文字認識装置12による文字認識の結果は精度の高いものとなる。
ところで、上記の説明において文字画像切出装置10は画像認識処理により升目領域および自由記入欄領域を特定するものとして説明したが、予め升目領域および自由記入欄領域を示す領域データを記憶部102に記憶しておくようにしてもよい。また、記入用紙が複数種類あるような場合、文字画像切出装置10に予め複数の領域データを記憶させておき、記入用紙に応じた領域データに従い領域の認識を行わせるようにしてもよい。その場合、例えば記入用紙の所定箇所に記入用紙の識別子を記載しておき、また文字画像切出装置10の記憶部102に識別子と領域データとを対応付けて格納する領域DB(データベース)を準備しておく。そして、文字画像切出装置10は画像データ1021に含まれる識別子を文字認識処理により認識し、認識した識別子に対応する領域データを領域DBから検索して用いるようにすればよい。
また、上記の説明において文字画像切出装置10は画像の形状特性として画像に外接する平行四辺形の縦横比および傾斜度を用いるものとしたが、文字画像切出装置10が文字画像の切り出しの判断基準として用いる形状特性は他に様々なものが考えられる。例えば、画像に外接する矩形の縦横比を形状特性として用いてもよいし、画像に外接する台形の上底と下底の比等を形状特性として用いてもよい。
また、上記の説明において第2文字画像認識部1016は起点画素から連続するオン画素群を選択することにより第1セグメントおよび第2セグメントを取り出すものとしたが、第1セグメントおよび第2セグメントを取り出す方法は他に様々なものが考えられる。例えば、行画像に含まれるオン画素の垂直方向の分布を水平方向に走査し、その分布が所定の閾値を超える範囲を第1セグメントもしくは第2セグメントの範囲として特定してもよい。
また、上記の説明において第2文字画像認識部1016はまず第1セグメントに関する形状特性判定を行い、その判定で否定的な結果を得ると連結セグメントに関する形状特性判定を行い、その判定で否定的な結果を得ると第1セグメント領域画像もしくは連結セグメント領域画像を文字画像として選択するものとして説明した。しかしながら、第2文字画像認識部1016がいずれのセグメント領域画像をどのような判定により文字画像と認識するかは様々に変更可能である。例えば、第1セグメントの横方向の長さが所定の長さを超えている場合には、連結セグメントの形状特性判定を行うことなく第1セグメント領域画像を文字画像として取り出すようにしたり、連結セグメントに関する形状特性判定の結果が否定的である場合であっても連結セグメントの横方向の長さが所定の長さに達していない場合には連結セグメントのさらに右側に位置するセグメントを連結した新たな連結セグメントに関し形状特性判定を行うようにしたりしてもよい。
[2.第2実施形態]
図7は本発明の第2実施形態にかかる文字認識システム2の構成を示したブロック図である。文字認識システム2においては、文字画像の切り出しの精度を高めるために、文字を構成する構成部の配置による種別に応じた形状特性が用いられる。文字認識システム2の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、図7において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
文字認識システム2は、文字認識システム1の文字画像切出装置10の代わりに、文字画像切出装置20を備えている。文字画像切出装置20の制御部101は、文字画像切出装置10の制御部101が備える全ての構成部に加え、第1文字画像認識部1013により認識された文字画像により示される文字を種別ごとに分類する第1分類部2011と、第2文字画像認識部1016により取り出されたセグメントにより示される文字を種別ごとに分類する第2分類部2012を備えている。
図8および図9は、文字画像切出装置20の制御部101により行われる処理を示すフロー図である。文字画像切出装置20の制御部101は、まず文字画像切出装置10の制御部101により行われる場合と同様に、スキャナ11から画像データを受信し(ステップS1)、升目領域および自由記入欄領域を特定し(ステップS2)、升目領域の文字画像を取り出し(ステップS3)、升目領域に含まれる文字画像の形状特性の特定、すなわち各文字画像の縦横比および傾斜度の平均値の算出を行う(ステップS4)。
続いて、制御部101は文字画像の各々により示される文字を種別ごとに分類する(ステップS201)。具体的には、まず第1文字画像認識部1013は升目領域から取り出した文字画像を示す文字画像データを第1分類部2011に引き渡す。第1分類部2011は受け取った文字画像データにより示される文字画像に含まれる任意のオン画素を起点画素とし、起点画素に連続するオン画素群を特定する。第1分類部2011はそのように特定したオン画素群を文字の構成部を示す画像(以下、「構成部画像」と呼ぶ)として切り出し、文字画像からそれらのオン画素群を除外する。第1分類部2011は文字画像からオン画素がなくなるまで、構成部画像の切り出し処理を繰り返す。
第1分類部2011は上記のように構成部画像の切り出し処理を1つの文字画像について完了すると、切り出した構成部画像が文字画像において占める領域に基づき、文字画像により示される文字を複数の種別のいずれかに分類する。図10は、文字認識システム2による分類に用いられる種別を示した図である。種別番号「1」で識別される種別(以下、種別「1」のように呼ぶ)は、1つの構成部で構成される文字の種別を示している。また、例えば種別「2」は、偏(へん)と旁(つくり)で構成される文字の種別を示している。
第1分類部2011は、切り出した構成部画像の各々に外接する矩形もしくは矩形の組合せ(例えばL字の多角形)を特定する。以下、そのように特定された図形を「外接図形」と呼ぶ。続いて、第1分類部2011は占有領域(図10の斜線部)を示す図形に対し、文字画像のサイズおよび傾斜度に応じた拡大・縮小および変形を加える。第1分類部2011は、外接図形と変形後の占有領域の図形との重複部分の面積を、各々の種別について算出する。第1分類部2011はそのように算出した面積が最も広い種別を、文字画像により示される文字の種別と判断する。
ただし、第1分類部2011が文字を分類する方法は重複部分の面積に基づくものに限られない。例えば、第1分類部2011は文字画像の特徴点を抽出し、各種別の占有領域の斜線部で示される図形の特徴点と比較することにより、文字画像により示される文字がいずれの種別に属するかを判断するようにしてもよい。
第1分類部2011は上記のように文字画像をいずれかの種別に分類すると、外接図形を示す画像データと、文字画像が分類された種別を示す種別番号を形状特性特定部1014に引き渡す。形状特性特定部1014は第1分類部2011から画像データおよび種別番号を受け取ると、受け取った画像データにより示される外接図形の形状特性を算出し、その結果を示すデータを第1分類部2011から受け取った種別番号とともに一時的に記憶部102に記憶する。
ここで、外接図形の形状特性は種別により異なる。例えば、種別「2」の場合、文字全体の縦横比、偏の縦横比および旁の縦横比等が形状特性として用いられる。例えば、繞(にょう)と旁からなる種別「3」の場合、文字全体の縦横比、繞の縦、横および幅の比、旁の縦横比が形状特性として用いられる。
第1分類部2011は第1文字画像認識部1013により認識された全ての文字画像に関し上記の分類処理を繰り返し、形状特性特定部1014は第1分類部2011により分類された全ての文字画像に関し上記の形状特性の特定処理を繰り返す。形状特性特定部1014は、全ての文字画像に関する形状特性の特定処理を終えると、記憶部102に一時的に記憶されている各々の文字画像の外接図形の形状特性を示すデータを、ともに記憶されている種別番号ごとに平均して、その結果を種別形状特性データ2021として記憶部102に記憶する(ステップS202)。図11は、種別形状特性データ2021の内容を例示した図である。
上記のように形状特性特定部1014により種別形状特性データ2021が記憶部102に記憶されると、文字画像切出装置20の制御部101は文字画像切出装置10の制御部101により行われる場合と同様に、自由記入欄領域から行画像を切り出し(ステップS5)、行画像から第1セグメントを取り出し(ステップS6)、第1セグメントの形状特性を特定し(ステップS7)、第1セグメントに関する形状特性判定を行う(ステップS8)。
第1セグメントに関する形状特性判定において肯定的な結果が得られた場合(ステップS8:Yes)、制御部101は第1セグメント領域画像を文字画像として切り出す(ステップS9)。一方、第1セグメントに関する形状特性判定において否定的な結果が得られた場合(ステップS8:No)、制御部101は行画像から第2セグメントを取り出し(ステップS10)、連結セグメントに関する形状特性判定を行う。ただし、文字画像切出装置20の制御部101は、文字画像切出装置10の制御部101が行う場合と異なり、連結セグメントに関する形状特性判定において形状特性データ1023の代わりに種別形状特性データ2021を用いる。
すなわち、第2分類部2012は、ステップS201において第1分類部2011が行ったものと同様の分類処理を連結セグメント領域画像に対して行う。第2分類部2012により連結セグメント領域画像について特定される種別は、連結セグメント領域画像が1文字を示す画像であると仮定した場合における、その1文字の種別を示している。
第2文字画像認識部1016は、連結セグメント領域画像に対し特定された種別に基づき、ステップS202において形状特性特定部1014が行ったものと同様の方法で、連結セグメント領域画像の外接図形の形状特性を示すデータを生成する。続いて第2文字画像認識部1016は、種別形状特性データ2021から、連結セグメント領域画像に対し特定された種別に対応するデータを取り出し、連結セグメント領域画像の外接図形の形状特性の、種別形状特性データ2021から取り出したデータにより示される形状特性に対する比率が、いずれも所定の範囲内(例えば0.8〜1.2)に含まれているか否かを判定する(ステップS203)。
文字画像切出装置20の制御部101は、その後、文字画像切出装置10の制御部101により行われる場合と同様に、ステップS203の結果等に応じて連結セグメント領域画像もしくは第1セグメント領域画像を文字画像として切り出す(ステップS12、S13)。制御部101は上記のように文字画像を切り出すと、切り出した文字画像を行画像から除外し(ステップS14)、行画像の残りのオン画素について文字画像の切り出し処理を繰り返す(ステップS15)。さらに、制御部101は全ての行画像について文字画像の切り出し処理を繰り返す(ステップS16)。切り出された文字画像を示す文字画像データは、その後、文字画像切出装置20から文字認識装置12に送信され(ステップS17)、文字認識処理に利用される。
上記のように、文字認識システム2によれば、升目領域に書かれた文字全体の形状特性のみでなく、文字の構成部の形状特性が文字画像の切り出しにおいて用いられる。そのため、より高い精度で、正しく1文字を示す画像が切り出される。
[3.第3実施形態]
図12は本発明の第3実施形態にかかる文字認識システム3の構成を示したブロック図である。文字認識システム3においては、文字画像の切り出しの精度を高めるために、予め記憶された標準的な文字もしくは文字の構成部に関する形状特性と、切り出された画像の形状特性との比較が行われる。その際、標準的な文字等の形状特性には、升目領域に書かれた文字の形状特性に応じた補正が加えられるため、高い精度の文字画像の切り出しが実現される。
文字認識システム3の構成および動作は多くの点で文字認識システム1のそれらと共通しているため、以下、文字認識システム3が文字認識システム1と異なる点のみを説明する。また、図12において、文字認識システム1の構成部に対応する構成部には図1において用いられたものと同じ符号が付されている。
文字認識システム3は、文字認識システム1の文字画像切出装置10の代わりに、文字画像切出装置30を備えている。文字画像切出装置30の制御部101は、文字画像切出装置10の制御部101が備える全ての構成部に加え、第2文字画像認識部1016により取り出された第1セグメント領域画像および第2セグメント領域画像に対し文字認識処理を行う文字認識部3011を備えている。
また、文字画像切出装置30の記憶部102には、標準的な文字もしくは文字の構成部の形状特性を示す標準形状特性データを、それらの形状および文字における占有領域により分類して格納した標準形状特性DB3021が記憶されている。
図13は、標準形状特性DB3021の内容を例示した図である。標準形状特性DB3021は、文字もしくは文字の構成部(以下、「文字/構成部」と呼ぶ)の各々に対応する標準形状特性データを複数含んでいる。標準形状特性データは、文字/構成部が文字認識処理において認識される可能性の高い文字を示す「認識文字」、文字/構成部が文字の中で占有する領域を示す「占有領域」、文字/構成部の内容を示す「文字/構成部」、文字/構成部の形状特性を示す「形状特性」の各項目を含んでいる。ただし、以下の説明において「形状特性」は文字/構成部に外接する矩形の縦横比であるものとする。
標準形状特性DB3021において、標準形状特性データはまず「認識文字」により分類され、さらに「占有領域」により分類されている。例えば、図13において、第1行の標準形状特性データは、1文字の「人」についてのデータであり、その縦横比が「1.0」であることを示している。また、第2行の標準形状特性データは、1文字の「ト」についてのデータであり、その縦横比が「1.3」であることを示している。
第1行および第2行のデータはともに「認識文字」が「人」であることから、「文字/構成部」で示される「人」および「ト」の文字は、ともに文字認識処理において「人」と認識される可能性が高いことを示している。第2行のような標準形状特性データは、「ト」が「人」と誤って認識された場合であっても、正しく文字画像の切り出しを行うために標準形状特性DB3021に含まれている。
図14および図15は、文字画像切出装置30の制御部101により行われる処理を示すフロー図である。文字画像切出装置30の制御部101は、まず文字画像切出装置10の制御部101と同様に、ステップS1〜S7の処理を行う。ただし、文字画像切出装置30において第1セグメントは単に「セグメント」と呼ばれる。
続いて、制御部101の文字認識部3011は、セグメント領域画像に対し文字認識処理を行い、その結果を示すテキストデータを第2文字画像認識部1016に引き渡す(ステップS301)。第2文字画像認識部1016は、標準形状特性DB3021から、「認識文字」のデータが文字認識部3011から受け取ったデータと一致する標準形状特性データを抽出する(ステップS302)。そのように抽出された標準形状特性データは、セグメント領域画像により示される文字もしくは構成部の候補を示すデータである。
続いて、第2文字画像認識部1016はステップS4において形状特性特定部1014により生成され記憶部102に記憶されている形状特性データ1023に応じて、ステップS302において抽出した標準形状特性データの「形状特性」欄のデータを補正する。例えば、標準的な文字の縦横比の平均値が1.0であり、形状特性データ1023により示される手書き文字の縦横比が1.2である場合、第2文字画像認識部1016は「形状特性」欄のデータに1.2(=1.2/1.0)を乗じることにより、それらの値を補正する(ステップS303)。
続いて、第2文字画像認識部1016はステップS303において補正した標準的な文字/構成部の形状特性の、ステップS7において特定したセグメント領域画像の形状特性に対する比率を算出し、その比率が所定の範囲内(例えば0.8〜1.2)に含まれている文字/構成部を抽出する(ステップS304)。
ところで、文字画像切出装置30においては、セグメント領域画像が文字認識部3011により文字の構成部として認識されることがあるため、第2文字画像認識部1016はステップS304において抽出した文字/構成部のいずれかを文字画像として選択するために、後続のセグメント領域画像について、同様に候補となる文字/構成部の抽出処理(ステップS301〜S304)を行う必要がある。従って、第2文字画像認識部1016はこの場合、ステップS304の結果を一時的に記憶部102に記憶する。このように、いずれの文字/構成部であるかの判定が保留されるセグメント領域画像を、以下、「未確定セグメント領域画像」と呼ぶ。
第2文字画像認識部1016は、ステップS304の処理に続き、先行する未確定セグメント領域画像の有無を判定する(ステップS305)。この場合、先行する未確定セグメント領域画像はないので(ステップS305:No)、第2文字画像認識部1016は続いて行画像にオン画素が残っているか否かを判定する(ステップS15)。この場合、通常、第2文字画像認識部1016はステップS15の判定において肯定的な結果を得て(ステップS15:Yes)、ステップS6の処理に戻る。
第2文字画像認識部1016はその後、先に述べたように、後続のセグメント領域画像について候補となる文字/構成部の抽出処理(ステップS301〜S304)を行う。その後、第2文字画像認識部1016は未確定セグメント領域画像の有無を判定するが(ステップS305)、この場合、第2文字画像認識部1016は肯定的な結果を得る(ステップS305:Yes)。第2文字画像認識部1016は、先行する未確定セグメント領域画像についての候補となる文字/構成部と、それに後続するセグメント領域画像についての候補となる文字/構成部の組合せのうち、最適なものを選択する。
具体的には、例えば先行する未確定セグメント領域画像についての候補に文字の左側を占有領域とする構成部が含まれ、後続するセグメント領域画像についての候補に文字の右側を占有領域とする構成部が含まれるような場合、第2文字画像認識部1016はそれらのセグメント領域画像を連結した連結セグメント領域画像を文字画像として切り出す。また、例えば後続するセグメント領域画像についての候補に、文字全体および文字の左側を占有領域とする構成部しか含まれていないような場合、第2文字画像認識部1016は先行する未確定セグメント領域画像を文字画像として切り出し、後続するセグメント領域画像を未確定セグメント領域画像として記憶部102に一時的に記憶する。
なお、複数の可能な組合せが存在する場合には、例えば、第2文字画像認識部1016は各々のセグメント領域画像の形状特性の、補正後の標準文字/構成部の形状特性に対する比率の平均値を算出して、その平均値が最も1に近いものを最適な組合せとして選択する。ただし、最適な組合せを選択する方法はこれに限られない。
第2文字画像認識部1016は、上記のようにいずれかのセグメント領域画像を文字画像として切り出すと、切り出した文字画像を文字画像データ群1024として記憶部102に記憶した後(ステップS306)、行画像から切り出したセグメント領域画像を除外する(ステップS14)。続いて、第2文字画像認識部1016は行画像にオン画素が残っているか否かを判定し(ステップS307)、その判定の結果が肯定的であれば(ステップS307:Yes)、さらに後続のセグメント領域画像について候補となる文字/構成部の抽出処理および文字画像の書き出し処理(ステップS301〜S307)を繰り返す。
第2文字画像認識部1016は、行画像の末尾に位置するセグメント領域画像について候補となる文字/構成部の抽出処理および文字画像の書き出し処理(ステップS301〜S306)を行った後(ステップS307:No)、未確定セグメント領域画像の有無を判定する(ステップS308)。未確定セグメント領域画像がある場合(ステップS308:Yes)、それは行末のセグメント領域画像であるため、第2文字画像認識部1016はそのセグメント領域画像を文字画像として切り出す(ステップS309)。
その後、第2文字画像認識部1016は後続の行画像に関し、ステップS6〜S309の処理を繰り返す(ステップS16)。上記のようにして第2文字画像認識部1016により切り出された文字画像を示す文字画像データは、その後、文字画像切出装置30から文字認識装置12に送信され(ステップS17)、文字認識処理に利用される。
上記のように、文字認識システム3によれば、升目領域に書かれた文字の形状特性に応じて、標準的な文字および文字の構成部の形状特性に補正が施され、補正の施された形状特性に基づき、行画像から取り出されたセグメント領域画像を文字画像として切り出すべきか、文字の構成部として扱うかの判断が行われる。さらに、類似形状の形状特性も文字画像の切り出しの判断において考慮される。そのため、高い精度で、正しく1文字を示す画像が切り出される。
ところで、上述した文字画像切出装置10ないし文字画像切出装置30は、いずれも専用のハードウェアにより実現されてもよいし、汎用的なPC(Personal Computer)にアプリケーションプログラムに従った処理を実行させることにより実現されてもよい。
また、上述した実施形態においては、本発明にかかる文字認識システムを文字画像切出装置とそれに接続されたスキャナおよび文字認識装置により実現するものとして説明したが、それらの構成要素の配置は任意に変更可能である。例えば、文字認識装置12を文字画像切出装置10と同じ筐体内に配置したり、スキャナの筐体内に文字画像切出装置を設けたり、文字画像切出装置とスキャナおよび文字画像切出装置と文字認識装置をネットワークを介して相互に接続するようにしてもよい。
また、上述した実施形態においては、文字画像切出装置に対し、スキャナから文字列を示す画像データが入力されるものとして説明したが、例えば表示部と一体化されたペンタブレットを備えるタブレットPCを文字画像切出装置に接続し、ユーザによるペンタブレットに対する筆記動作に応じて生成される画像データをタブレットPCから文字画像切出装置に入力させるようにしてもよい。
また、上述した実施形態においては、升目領域の画像の形状特性と、自由記入欄領域から取り出されたセグメント領域画像の形状特性とが比較され、その比較の結果に基づきセグメント領域画像を文字画像として切り出すか否かが判定されるものとして説明した。しかしながら、例えば升目領域の画像の形状特性に応じた形状のセグメントを自由記入欄領域から取り出し、取り出したセグメントに含まれるオン画素に連続するオン画素をセグメントに取り込む等の方法により、文字画像の切り出しを行うようにしてもよい。
また、上述した実施形態においては、手書き文字は横書きであるものとして説明したが、縦書き等の手書き文字にも本発明にかかる文字認識システムが利用可能であることは言うまでもない。
第1実施形態にかかる文字認識システムの構成を示したブロック図である。 本発明の実施形態にかかる文字認識システムにおいて処理される記入用紙を例示した図である。 第1実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。 第1実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。 本発明の実施形態にかかる文字画像切出装置により文字画像に外接する平行四辺形が特定される様子を示した図である。 第1実施形態にかかる文字画像切出装置により正しく文字画像が切り出される様子を例示した図である。 第2実施形態にかかる文字認識システムの構成を示したブロック図である。 第2実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。 第2実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。 第2実施形態にかかる文字の種別を示した図である。 第2実施形態にかかる種別形状特性データの内容を例示した図である。 第3実施形態にかかる文字認識システムの構成を示したブロック図である。 第3実施形態にかかる標準形状特性DBの内容を例示した図である。 第3実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。 第3実施形態にかかる文字画像切出装置により行われる処理を示したフロー図である。
符号の説明
1・2・3…文字認識システム、10・20・30…文字画像切出装置、11…スキャナ、12…文字認識装置、101…制御部、102…記憶部、1011…画像データ入力部、1012…領域特定部、1013…第1文字画像認識部、1014…形状特性特定部、1015…行画像認識部、1016…第2文字画像認識部、1017…画像データ出力部、1021…画像データ、1022…領域データ、1023…形状特性データ、1024…文字画像データ群、2011…第1分類部、2012…第2分類部、2021…種別形状特性データ、3011…文字認識部、3021…標準形状特性DB

Claims (7)

  1. 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得手段と、
    前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する第1文字画像認識手段と、
    前記第1文字画像認識手段により認識された文字画像の形状特性を特定する形状特性特定手段と、
    前記形状特性特定手段により特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識手段と、
    前記第2文字画像認識手段により認識された文字画像を示す画像データを出力する出力手段と
    を備えることを特徴とする文字画像切出装置。
  2. 前記第1文字画像認識手段により認識された文字画像を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像を複数の種別のいずれかに分類する第1分類手段と、
    前記第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、当該文字画像の候補を構成する画素のうち所定の条件を満たす属性を備える画素の配置に基づき、当該文字画像の候補を前記複数の種別のいずれかに分類する第2分類手段と
    をさらに備え、
    前記第2文字画像認識手段は、前記第2分類手段により取り出された文字画像の候補の形状特性と、前記第2分類手段により当該文字画像の候補が分類された種別と同じ種別に前記第1分類手段により分類された文字画像の形状特性とを比較することにより、当該文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
    ことを特徴とする請求項1に記載の文字画像切出装置。
  3. 前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の縦横比もしくは当該文字画像を構成する複数の部分の各々の縦横比を前記形状特性として特定する
    ことを特徴とする請求項1に記載の文字画像切出装置。
  4. 前記形状特性特定手段は、前記第1文字画像認識手段により認識された文字画像の傾斜度もしくは当該文字画像を構成する複数の部分の各々の傾斜度を前記形状特性として特定する
    ことを特徴とする請求項1に記載の文字画像切出装置。
  5. 標準的な文字の形状特性もしくは標準的な文字の構成部の形状特性を示す標準形状特性データを記憶する記憶手段と、
    画像により示される文字を認識する文字認識手段と
    を備え、
    前記第2文字画像認識手段は、第2画像データにより示される画像の一部を1文字を示す文字画像の候補として取り出し、
    前記文字認識手段は、前記第2文字画像認識手段により取り出された文字画像により示されると推定される文字を認識し、
    前記第2文字画像認識手段は、前記記憶手段に記憶されている標準形状特性データのうち、前記文字認識手段により認識された文字、前記文字認識手段により認識された文字と類似した形状を有する文字および文字の構成部であって前記文字認識手段により認識された文字と類似した形状を有する構成部の少なくとも1に関する標準形状特性データにより示される形状特性に対し、前記形状特性特定手段により特定された形状特性に応じた補正を加えたものと、前記文字画像の候補の形状特性とを比較することにより、前記文字画像の候補を1文字を示す文字画像として認識するか否かを決定する
    ことを特徴とする請求項1に記載の文字画像切出装置。
  6. 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する画像データ取得過程と、
    前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する第1文字画像認識過程と、
    前記第1文字画像認識過程において認識された文字画像の形状特性を特定する形状特性特定過程と、
    前記形状特性特定過程において特定された形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する第2文字画像認識過程と、
    前記第2文字画像認識過程において認識された文字画像を示す画像データを出力する出力過程と
    を備えることを特徴とする文字画像切出方法。
  7. 各々画像を示す第1画像データと第2の画像を示す第2画像データとを取得する処理と、
    前記第1画像データにより示される画像のうち所定の領域に配置されている部分を1文字を示す文字画像として認識する処理と、
    認識した文字画像の形状特性を特定する処理と、
    特定した形状特性を用いて、前記第2画像データにより示される画像の一部を1文字を示す文字画像として認識する処理と、
    文字画像として認識した前記第2画像データにより示される画像の一部を示す画像データを出力する処理と
    をコンピュータに実行させることを特徴とするプログラム。
JP2005093260A 2005-03-28 2005-03-28 文字画像切出装置、文字画像切出方法およびプログラム Expired - Fee Related JP4810853B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005093260A JP4810853B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置、文字画像切出方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005093260A JP4810853B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置、文字画像切出方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2006277149A true JP2006277149A (ja) 2006-10-12
JP4810853B2 JP4810853B2 (ja) 2011-11-09

Family

ID=37211873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005093260A Expired - Fee Related JP4810853B2 (ja) 2005-03-28 2005-03-28 文字画像切出装置、文字画像切出方法およびプログラム

Country Status (1)

Country Link
JP (1) JP4810853B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186781A (zh) * 2011-12-31 2013-07-03 北京新媒传信科技有限公司 文本识别方法
JP2015225094A (ja) * 2014-05-26 2015-12-14 大日本印刷株式会社 解説動画配信システム
CN107609560A (zh) * 2017-09-27 2018-01-19 北京小米移动软件有限公司 文字识别方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
JPH04299485A (ja) * 1991-03-28 1992-10-22 Nec Corp 文字列認識方法及びその装置
JPH05147187A (ja) * 1991-11-28 1993-06-15 Gunze Ltd スクリーン版検査装置
JP2000090200A (ja) * 1998-09-10 2000-03-31 Ricoh Co Ltd 文字認識方法、装置および記録媒体
JP2004078531A (ja) * 2002-08-16 2004-03-11 Ricoh Co Ltd 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03225578A (ja) * 1990-01-31 1991-10-04 Toshiba Corp 文字の検切り方法
JPH04299485A (ja) * 1991-03-28 1992-10-22 Nec Corp 文字列認識方法及びその装置
JPH05147187A (ja) * 1991-11-28 1993-06-15 Gunze Ltd スクリーン版検査装置
JP2000090200A (ja) * 1998-09-10 2000-03-31 Ricoh Co Ltd 文字認識方法、装置および記録媒体
JP2004078531A (ja) * 2002-08-16 2004-03-11 Ricoh Co Ltd 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103186781A (zh) * 2011-12-31 2013-07-03 北京新媒传信科技有限公司 文本识别方法
JP2015225094A (ja) * 2014-05-26 2015-12-14 大日本印刷株式会社 解説動画配信システム
CN107609560A (zh) * 2017-09-27 2018-01-19 北京小米移动软件有限公司 文字识别方法及装置

Also Published As

Publication number Publication date
JP4810853B2 (ja) 2011-11-09

Similar Documents

Publication Publication Date Title
US7519226B2 (en) Form search apparatus and method
US5410611A (en) Method for identifying word bounding boxes in text
US6687401B2 (en) Pattern recognizing apparatus and method
EP2569930B1 (en) Segmentation of a word bitmap into individual characters or glyphs during an ocr process
JP3294995B2 (ja) 帳票読取装置
JP3452774B2 (ja) 文字認識方法
US20110280481A1 (en) User correction of errors arising in a textual document undergoing optical character recognition (ocr) process
US20010016069A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JPS61267177A (ja) 文書画像追加情報の蓄積方法
JPH0713995A (ja) 自動テキスト特徴決定装置
JP3485020B2 (ja) 文字認識方法及び装置ならびに記憶媒体
JP5906788B2 (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
US20020051574A1 (en) Character recognition method, program and recording medium
JP2007058882A (ja) パターン認識装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3216800B2 (ja) 手書き文字認識方法
JP2002063548A (ja) 手書き文字認識方法
JP4117648B2 (ja) 帳票、帳票処理方法、帳票処理プログラム、帳票処理プログラムを記録した記録媒体及び帳票処理装置
JPH10154204A (ja) パターン認識装置及びパターン認識方法
CN115131806B (zh) 一种基于深度学习的各类证件ocr图像信息识别方法、系统
JP5830996B2 (ja) 画像処理装置及びプログラム
JP3710164B2 (ja) 画像処理装置及び方法
JP2007026470A (ja) パターン認識装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080221

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101227

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110726

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110808

R150 Certificate of patent or registration of utility model

Ref document number: 4810853

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140902

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees