JP2644041B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2644041B2
JP2644041B2 JP1113794A JP11379489A JP2644041B2 JP 2644041 B2 JP2644041 B2 JP 2644041B2 JP 1113794 A JP1113794 A JP 1113794A JP 11379489 A JP11379489 A JP 11379489A JP 2644041 B2 JP2644041 B2 JP 2644041B2
Authority
JP
Japan
Prior art keywords
character
segment
area
feature
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1113794A
Other languages
English (en)
Other versions
JPH02293989A (ja
Inventor
正己 久貝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1113794A priority Critical patent/JP2644041B2/ja
Priority to US07/517,187 priority patent/US5065442A/en
Publication of JPH02293989A publication Critical patent/JPH02293989A/ja
Application granted granted Critical
Publication of JP2644041B2 publication Critical patent/JP2644041B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/18086Extraction of features or characteristics of the image by performing operations within image blocks or by using histograms
    • G06V30/18095Summing image-intensity values; Projection and histogram analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、予め定められた文字枠(セグメント)に沿
って手書きされたセグメント文字を高精度に認識するこ
とができる文字認識装置に関する。
〔従来の技術〕
従来、高精度の手書き文字の認識が要求される分野、
例えばファクシミリ装置における手書き宛先電話番号の
認識などにおいては、“日”の字形の文字枠(セグメン
ト)を考え、このセグメントに沿って手書きの数字文字
に対して数字の認識を行っている。このようなセグメン
ト文字の認識方法では“日”の字形の各セグメントを構
成する線分領域を予め設定し、手書文字における各セグ
メント領域内の黒画素数がしきい値より大きいか否かを
判定することによりそのセグメントに文字線が記入され
ているか否かを決定し、文字線が記入されているセグメ
ントの組み合わせと一致する数字を選択する。
しかしながら、このようなセグメント文字認識方法を
用いた従来の文字認識装置では、第4図に示すような手
書き文字のセグメントa2の位置にしきい値以上の画素数
を持つ点やしみなどのノイズ画像があると、セグメント
a2には文字有りと判別され、例えば文字“0"を“8"と誤
認識してしまっていた。また、第5図に示すように、雪
降り状のノイズ画像によっても従来装置は誤認識を行っ
ていた。
そこで、本発明の目的は、このような不具合を解消
し、点やしみなどのノイズ影響を受けることなく、正し
く文字を認識することが可能な文字認識装置を提供する
ことにある。
〔課題を解決するための手段〕
このような目的を達成するために、本発明は、各セグ
メント領域内に文字線が有るか否かを判別し、文字線を
有するセグメントの組み合わせによって、セグメント文
字の種類を認識する文字認識装置であって、セグメント
領域を予め定めた第1の大きさに設定する第1領域設定
手段と、第1領域設定手段により設定されたセグメント
領域の中に含まれる文字線の幅および長さの少くともい
ずれか一方の文字線の第1特徴値を検出する第1特徴検
出手段と、第1特徴検出手段により検出された第1特徴
値を第1しきい値と比較して、第1特徴値が第1しきい
値より小さいときには当該セグメント領域に文字線無し
と判別する第1判別手段と、第1判別手段の判別の結
果、第1特徴値が第1しきい値より大きいときにはセグ
メント領域を第1の大きさよりも大きい第2の大きさに
再設定する第2領域設定手段と、第2領域設定手段によ
り領域の再設定が行なわれたときには、当該第2領域設
定手段により設定されたセグメント領域の中に含まれる
文字線の幅および長さの小さくともいずれか一方の文字
線の第2特徴値を検出する第2特徴検出手段と、第2特
徴検出手段により検出された第2特徴値を、第1しきい
値よりも大きい第2しきい値と比較して第2特徴値が第
2しきい値よりも大きいときにのみ、当該セグメント領
域に文字線有りと判別する第2判別手段とを具えたこと
を特徴とする。
本発明の第2形態は、第1形態の第1特徴検出手段お
よび第2特徴検出手段は、セグメント領域をラスタ走査
して、当該セグメント領域内の画素データの黒画素数お
よび白黒反転回数を計数し、その計数結果に基いて文字
線の長さおよび幅を検出するようにしたことを特徴とす
る。
〔作 用〕
本発明の第1形態では、セグメント領域に文字線が有
りか否かの判定処理を2つに分け、第1の大きさのセグ
メント領域に対して文字線無しの確認処理を第1判別手
段により行い、第1の大きさよりも大きい第2の大きさ
のセグメント領域に対して文字線有りの確認処理を第2
判別手段により行うようにしたので、ノイズ画像は第2
の大きさにセグメント領域が設定された段階で、文字線
無しと判別され、正しい文字認識が行なわれる。また、
セグメント領域内が無地画像のときは、第1の大きさの
小さいセグメント領域の設定で文字線無しが判別される
ので、認識処理時間を短縮することが可能となる。
本発明の第2形態では、文字線を構成する画素の白黒
反転回数を計数し、この白黒反転回数に基いて文字線の
幅および長さを検出するようにしたので、例えば、雪降
り状のノイズなど従来では文字線と誤認識する場合でも
白黒反転回数が規定値よりも増えることにより雪降り状
ノイズと文字線との識別を確実に行うことができる。
〔実施例〕
以下、図面の参照して、本発明の実施例を詳細に説明
する。
第1図は本発明の実施例の基本構成を示す。
第1図において、一点鎖線ブロック1000は、各セグメ
ント領域内に文字線が有るか否かを判別し、前記文字線
を有するセグメントの組み合わせによって、セグメント
文字の種類を認識する文字認識装置を示す。
100は前記セグメント領域を予め定めた第1の大きさ
に設定する第1領域設定手段である。
200は該第1領域設定手段により設定された前記セグ
メント領域の中に含まれる文字線の幅および長さの少な
くともいずれか一方の文字線の第1特徴値を検出する第
1特徴検出手段である。
300は該第1特徴検出手段により検出された前記第1
特徴値を第1しきい値と比較し、前記第1特徴値が前記
第1しきい値より小さいときには当該セグメント領域に
文字線無しと判別する第1判別手段である。
400は該第1判別手段の判別の結果、前記第1特徴値
が前記第1しきい値より大きいときには前記セグメント
領域を前記第1の大きさよりも大きい第2の大きさに再
設定する第2領域設定手段である。
500は該第2領域設定手段により領域の再設定が行な
われたときには、当該第2領域設定手段により設定され
た前記セグメント領域の中に含まれる文字線の幅および
長さの小さくともいずれか一方の文字線の第2特徴値を
検出する第2特徴検出手段である。
600は該第2特徴検出手段により検出された前記第2
特徴値を、前記第1しきい値よりも大きい第2しきい値
と比較して前記第2特徴値が前記第2しきい値よりも大
きいときにのみ、当該セグメント領域に文字線有りと判
別する第2判別手段である。
第2図は、本発明実施例の回路構成を示すブロック図
である。第2図において、1はバス、2は原稿を読み取
る読取り部である。3は読み取部2により読み取られた
画像を二値画像へ変換する二値化部である。4は二値化
部3により変換された二値画像を記憶する二値画像記憶
部である。
5は二値画像記憶部4に記憶された二値画像の文字認
識を行う第1領域設定手段,第2領域設定手段,第1特
徴検出手段,第2特徴検出手段,第1判別手段,第2判
別手段としての中央演算処理装置(CPU)である。6は
原稿の二値画像から1文字を切り出す処理手順が格納さ
れている文字切出し処理手順部である。7は切り出され
た文字の認識処理を行って上記切り出された文字画像の
文字コードを判定する処理手順が格納されている文字コ
ード判定処理手順部である。8は認識結果の文字コード
を一時記憶する文字コード出力バッファ部である。
文字切出し処理手順部6および文字コード判定処理手
順部8にはランダムアクセスメモリ(RAM)のメモリが
用いられ、上述の処理手順がCPU5に読出され、実行され
る。第3図および第4図を参照して第2図に示す回路の
動作を説明する。ここで、第3図は文字コード判定処理
手順部7に記憶された処理手順を示すフローチャートで
ある。
第4図は数字文字を認識するための文字枠を説明する
図である。第4図において、文字枠は7個のセグメント
a1〜a7から構成されている。
なお、数字の表現が第4図示のセグメントの記入・非
記入により組み合わされるパターンで可能であること
は、電卓の数字等の表示装置で行われているごとく周知
のとおりである。そこで、これらのセグメント上にそっ
て文字線を書いて表わされる文字をセグメント文字と呼
ぶことにし、本実施例ではこのようなセグメント文字を
認識対象とする。
原稿は、第4図示の文字枠に沿って記入された数字が
記載されている。第2図においてこの原稿の数字画像が
読取り部2によって光学的に読み取られた後、二値化部
3によって、二値画像に変換されて、画像メモリ4によ
り記憶される。
次にCPU5によって文字切出し処理手順が実行され、周
知の文字切り出し方法により1文字毎の文字の切り出し
がなされる。切り出された1文字の画像がCPU5により文
字コード判定処理手順部内の作業領域に転送される。次
にCPU5によって第3図に示す処理手順が実行され、文字
コード判定処理がなされる。すなわち、第3図において
ステップS20〜ステップS26の処理がセグメントの個数と
同じ7回繰り返(ループ)して実行され、各セグメント
の中で線分画像があるセグメントの識別処理が実行され
る。
ステップ20はループの終了を判定するステップであ
り、ループが終了しない間にすなわち、未判定セグメン
トが有るならばステップ21へ進み、未判定のセグメント
についての識別処理が開始される。ステップ21では未判
定セグメント(K番目のセグメントとする)に対して識
別対象の領域を設定する。例えば第6図に示すような手
書き文字ではセグメントa2に対して第1の大きさの領域
R1を文字認識対象の画像領域として設定する。ここで、
領域R1の横幅をWで表わす。
次に手順はステップ22へいき、領域R1の中に含まれる
画像の特徴抽出が行われる。本実施例では、領域R1内の
黒画素数N6、領域R1内をラスター走査をしたときの黒白
反転回数t[K]、水平軸への射影配列r[0],r
[1]…r〔W−1]を文字の特徴として求める。ここ
で、射影配列r[i]とは、領域R1の左からi番目の縦
の画素列が全白ならばビット“0"、全白でなければビッ
ト“1"をとる配列であるとする。次にステップ23へい
き、射影配列r[i](i=0,1…W−1)をi=0か
らi=W−1へ走査したときの値の変化がビット“0"→
“1"→“0"となるか否かすなわち、白黒反転回数が第1
のしきい値“2"以下であるか否かを判定し、肯定判定の
ときに、ステップS24の手順へ進み、否定判定のときは
ステップS26の手順へ進む。
ステップS24では、領域を認識対象の領域の射影配列
の値の変化“0"→“1"→“0"を保つ限界まで上記領域の
横方向の長さを拡張して第7図に示すような新しい領域
R2を設定する。具体的には領域R2の横幅を改たに第2の
大きさWに設定する。
次に、ステップS25へ進み、領域R2内の黒画素数N6と
黒白反転回数t[K]を求め直してステップ26へ進む。
次にステップS26では、線幅L[K]をL[K]=N6/W
の計算式により求め、線幅L[K]と、予め定められて
いるしきい値TWと比較する。L[K]≧TWならば当該セ
グメントに文字線の記入有りと判定し、L[K]<TW
らば当該セグメントに文字線の記入無しと判定する。
このような一連の文字線記入の有無の識別処理を実行
すると、ステップ20へ戻り、次の未判定のセグメントに
ついても上述の処理手順(ステップS20〜S26)を繰り返
す。すべてのセグメントa1〜a7について文字線の記入の
有無の判定を終了したとき(ステップS20)、各セグメ
ントについて、文字線記入有無の判定結果と各文字線の
線幅L[K](K=1,…7)と各文字線の白黒反転回数
t[K](K=1,…,7)が得られる。次にステップS27
では、予め定められているしきい値(第2しきい値)Lm
in,tmaxと上記線幅L[K],および白黒反転回数との
大小関係がL[K]<L minかつt[K]>tmaxとなる
ことを確認すると、K番目のセグメントは、ステップ26
での判定結果にかかわらず、文字線記入なしの判定をく
だす。
L[K]≧Lminまたは、t[K]≦tmaxならばステ
ップS26での判定結果そのまま用いる。ここで、線幅比
較用のしきい値Lminは、Lmin>TWとなるように定められ
ている。
次にステップS28では各セグメントの文字線記入有無
から文字コードを判定して文字コードを文字コード出力
バッファ8へ出力する。
なお、第5図に示すような雪降状のノイズがあった場
合でも、上記処理手順中の線幅のチェックでt[K]≧
tmaxとなり、線幅がしきい値よりも大となるのでセグ
メントa2は文字線無しと判定され、正しい文字認識が行
われる。
以上、説明したように本実施例では、手書き文字画像
の中からセグメント部分の画素データを部分的に抽出
し、抽出データに基いて、無地画像を検出する。次に、
無地画像でない画像については画素データの抽出領域を
広げて、新たにこの領域から抽出した画素データに基い
てセグメントを構成する線分の幅又は長さが一定範囲に
収まることを判別して、点画像と線画像を識別する。し
たがって最初から抽出領域を広げて線分の幅または長さ
をチェックするよりも処理時間が短くなる。
第8図は文字枠の他の例を示す図であり、文字枠が12
個のセグメント101〜112で構成される例を示す。本例に
示すセグメント割り当てについても各セグメントの個数
に応じて、第3図に示す手書文字についての文字線の有
無を判別する処理手順を実行すればよい。
〔発明の効果〕
本発明の第1形態では、セグメント領域に文字線が有
りか否かの判定処理を2つに分け、第1の大きさのセグ
メント領域に対して文字線無しの確認処理を第1判別手
段により行い、第1の大きさよりも大きい第2の大きさ
のセグメント領域に対して文字線有りの確認処理を第2
判別手段により行うようにしたので、ノイズ画像は第2
の大きさにセグメント領域が設定された段階で、文字線
無しと判別され、正しい文字認識が行なわれる。また、
セグメント領域内が無地画像のときは、第1の大きさの
小さいセグメント領域の設定で文字線無しが判別される
ので、認識処理時間を短縮することが可能となる。
本発明の第2形態では、セグメント領域を第1の大き
さに設定し、全てのセグメントに文字線の記入の無しの
セグメントを検出した後に、第2の大きさの領域設定で
文字線有りのセグメント判別を行うようにしたので、第
2の大きさでの判別処理回数は少なくてすみ認識処理時
間を必要最少限に留めることができる。
本発明の第3形態では、文字線を構成する画素の白黒
反転回数を計数し、この白黒反転回数に基いて文字線の
幅および長さを検出するようにしたので、例えば、雪降
り状のノイズなど従来では文字線と誤認識する場合でも
白黒反転回数が規定値によりも増えることにより雪降り
状ノイズと上記ノイズと文字線の認識を確実に行うこと
ができる。
【図面の簡単な説明】
第1図は、本発明実施例の基本構成を示すブロック図、 第2図は、本発明の実施例の回路構成を示すブロック
図、 第3図は、本発明実施例のCPU5が実行する制御手順を示
すフローチャート、 第4図および第5図は、手書き文字および線分識別対象
の文字枠とノイズの関係を示す説明図、 第6図および第7図は、認識対象の画像抽出領域を示す
説明図、 第8図は、本発明実施例の他のセグメント形態を示す説
明図である。 1……バス、 2……読取り部、 3……二値化部、 4……画像メモリ、 5……CPU、 6……文字切出し処理手順部、 7……文字コード判定処理手順部、 8……文字コードバッファ部、 a1〜a7……セグメント。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】各セグメント領域内に文字線が有るか否か
    を判別し、前記文字線を有するセグメントの組み合わせ
    によって、セグメント文字の種類を認識する文字認識装
    置であって、 前記セグメント領域を予め定めた第1の大きさに設定す
    る第1領域設定手段と、 該第1領域設定手段により設定された前記セグメント領
    域の中に含まれる文字線の幅および長さの少くともいず
    れか一方の文字線の第1特徴値を検出する第1特徴検出
    手段と、 該第1特徴検出手段により検出された前記第1特徴値を
    第1しきい値と比較して、前記第1特徴値が前記第1し
    きい値より小さいときには当該セグメント領域に文字線
    無しと判別する第1判別手段と、 該第1判別手段の判別の結果、前記第1特徴値が前記第
    1しきい値より大きいときには前記セグメント領域を前
    記第1の大きさよりも大きい第2の大きさに再設定する
    第2領域設定手段と、 該第2領域設定手段により領域の再設定が行なわれたと
    きには、当該第2領域設定手段により設定された前記セ
    グメント領域の中に含まれる文字線の幅および長さの小
    さくともいずれか一方の文字線の第2特徴値を検出する
    第2特徴検出手段と、 該第2特徴検出手段により検出された前記第2特徴値
    を、前記第1しきい値よりも大きい第2しきい値と比較
    して前記第2特徴値が前記第2しきい値よりも大きいと
    きにのみ、当該セグメント領域に文字線有りと判別する
    第2判別手段と を具えたことを特徴とする文字認識装置。
  2. 【請求項2】前記第1特徴検出手段および前記第2特徴
    検出手段は、前記セグメント領域をラスタ走査して、当
    該セグメント領域内の画素データの黒画素数および白黒
    反転回数を計数し、その計数結果に基いて文字線の長さ
    および幅を検出するようにしたことを特徴とする請求項
    1に記載の文字認識装置。
JP1113794A 1989-05-08 1989-05-08 文字認識装置 Expired - Fee Related JP2644041B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1113794A JP2644041B2 (ja) 1989-05-08 1989-05-08 文字認識装置
US07/517,187 US5065442A (en) 1989-05-08 1990-05-01 Character recognition apparatus determining whether read data is a character line

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1113794A JP2644041B2 (ja) 1989-05-08 1989-05-08 文字認識装置

Publications (2)

Publication Number Publication Date
JPH02293989A JPH02293989A (ja) 1990-12-05
JP2644041B2 true JP2644041B2 (ja) 1997-08-25

Family

ID=14621255

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1113794A Expired - Fee Related JP2644041B2 (ja) 1989-05-08 1989-05-08 文字認識装置

Country Status (2)

Country Link
US (1) US5065442A (ja)
JP (1) JP2644041B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5140416A (en) * 1990-09-18 1992-08-18 Texas Instruments Incorporated System and method for fusing video imagery from multiple sources in real time
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US6272238B1 (en) 1992-12-28 2001-08-07 Canon Kabushiki Kaisha Character recognizing method and apparatus
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US5923554A (en) * 1996-01-16 1999-07-13 Matsushita Electric Industrial Co., Ltd. Method for assessing the number and type of flaws
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
JP3113827B2 (ja) * 1996-11-28 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 矩形オブジェクトの認識方法及び認識装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57141779A (en) * 1981-02-26 1982-09-02 Nec Corp Character cutout system
US4817186A (en) * 1983-01-07 1989-03-28 International Business Machines Corporation Locating individual images in a field for recognition or the like
US4562594A (en) * 1983-09-29 1985-12-31 International Business Machines Corp. (Ibm) Method and apparatus for segmenting character images
EP0280320B1 (en) * 1987-02-27 1994-12-07 Nec Corporation Graphics display controller equipped with boundary searching circuit
US4965678A (en) * 1987-03-03 1990-10-23 Canon Kabushiki Kaisha Area designation apparatus in image processing system

Also Published As

Publication number Publication date
JPH02293989A (ja) 1990-12-05
US5065442A (en) 1991-11-12

Similar Documents

Publication Publication Date Title
EP0472313B1 (en) Image processing method and apparatus therefor
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US7636483B2 (en) Code type determining method and code boundary detecting method
US4608489A (en) Method and apparatus for dynamically segmenting a bar code
US5081690A (en) Row-by-row segmentation and thresholding for optical character recognition
JPS63158678A (ja) 単語間スペ−ス検出方法
JP2644041B2 (ja) 文字認識装置
JP2812256B2 (ja) 文字認識装置および方法
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3710164B2 (ja) 画像処理装置及び方法
JP4223295B2 (ja) ナンバープレート自動認識装置
JP2872757B2 (ja) 行方向判定装置
JP2902904B2 (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JP2975720B2 (ja) 光学的文字読取装置
JPH0632074B2 (ja) 正規化方法
JPH07168911A (ja) 文書認識装置
JP3210224B2 (ja) 文字認識装置
JP2963807B2 (ja) 郵便番号枠検出装置
JPH08235311A (ja) 文字認識装置
JPH0535921A (ja) 文字照合装置及びそのための方法
JPH0628522A (ja) 文字認識装置
JPH0573714A (ja) 文字認識装置
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム
JPH0632077B2 (ja) 図形認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees