JPH08263591A - 文字認識装置及び方法 - Google Patents

文字認識装置及び方法

Info

Publication number
JPH08263591A
JPH08263591A JP7064111A JP6411195A JPH08263591A JP H08263591 A JPH08263591 A JP H08263591A JP 7064111 A JP7064111 A JP 7064111A JP 6411195 A JP6411195 A JP 6411195A JP H08263591 A JPH08263591 A JP H08263591A
Authority
JP
Japan
Prior art keywords
character
image
direction vector
contour
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7064111A
Other languages
English (en)
Inventor
Shigeru Kafuku
滋 加福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP7064111A priority Critical patent/JPH08263591A/ja
Publication of JPH08263591A publication Critical patent/JPH08263591A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】簡易な構成としながら高い認識率を得る。 【構成】文書画像を入力する画像入力装置15と、認識対
象となる文字画像の標準パターンにおける輪郭の方向ベ
クトルの加算値を予め記憶しておく方向ベクトル辞書R
OM14と、構造解析法に基づく文字画像の特徴を記憶し
た認識用辞書ROM13と、インストラクションROM12
に記憶される動作プログラムに従い、画像入力装置15で
入力された文書画像中の文字画像をその輪郭に従って1
文字単位で切出し、この文字切出しで得られる文字画像
中の輪郭の方向ベクトルを抽出し、その加算値を基に上
記方向ベクトル辞書ROM14を参照して類似度の高い候
補文字を得る一方、認識用辞書ROM13を参照して構造
解析法に基づく類似度の高い候補文字を得、それぞれ得
られた候補文字を総合して認識結果としての文字を決定
するCPU11とを備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力された画像中の文
字を読取って認識する文字認識装置及び方法に関する。
【0002】
【従来の技術】近時、OCR(光学式文字読取装置)の
技術を用いて、身近にある紙面、例えば名刺の画像を読
取らせ、画像中の文字を認識して名刺データとしてメモ
リやフロッピーディスクに記憶させ、管理する機能が電
子手帳やワードプロセッサ等の機器でも実現されてい
る。
【0003】この種の機器で使用される文字認識手法と
しては、一般に文字画像の外接を求めることにより文字
画像の切出しを行なって、この切出した画像を複数のブ
ロックに等分割することにより、このそれぞれのブロッ
ク画像を切出した画像の特徴として、この特徴に基づい
て文字認識するものであった。
【0004】
【発明が解決しようとする課題】しかしながら、上記の
ような文字認識の手法では、切出した画像を複数の特徴
としているので、例えば文字「−」と「・」とで特徴値
が同等となってしまい、その判別が難しいため、認識率
を上げることができなかった。
【0005】したがって、充分実用となる程度にまで認
識率を上げるためには、上記構造を解析する文字認識の
手法に加えて、例えば予め用意しておいた文字画像の標
準パターンと読取った文字画像のパターンとのマッチン
グをはかって類似度の高い候補文字を得るなど、まった
くアルゴリズムの異なる他の手法を組合わせて文字認識
を行なわなくてはならず、回路規模が大きく複雑なもの
となってしまうという不具合があった。
【0006】本発明は上記のような実情に鑑みてなされ
たもので、その目的とするところは、簡易な構成としな
がら高い認識率を得ることが可能な文字認識装置及び方
法を提供することにある。
【0007】
【課題を解決するための手段】すなわち本発明は、 (1) 入力された文書画像中の文字画像をその輪郭に
従って1文字単位で切出す文字切出手段と、この文字切
出手段で得られる文字画像中の輪郭の方向ベクトルを抽
出する抽出手段と、認識対象となる文字画像の標準パタ
ーンにおける輪郭の方向ベクトルの加算値を予め記憶し
ておく記憶手段と、上記抽出手段で得られた方向ベクト
ルの加算値を基に上記記憶手段を参照して類似度の高い
候補文字を得る第1のマッチング手段と、上記文字切出
手段で得られる文字画像に対して上記第1のマッチング
手段とは異なるアルゴリズムをもって類似度の高い候補
文字を得る第2のマッチング手段と、上記第1及び第2
のマッチング手段でそれぞれ得られた候補文字により認
識結果としての文字を決定し、出力する文字認識手段と
を備えるようにしたものである。 (2) 上記(1)項において、上記文字認識手段は第
1のマッチング手段で得られた特定数の候補文字の中か
ら、第2のマッチング手段で最も高い類似度を有する文
字を認識結果として決定するようにしたものである。
【0008】
【作用】上記(1)項に示した構成とすることにより、
文字の切出処理の過程で得られる文字画像中の輪郭の方
向ベクトルを有効に利用してその加算値により第1のマ
ッチング処理を行ない、この第1のマッチング処理とは
アルゴリズムの異なる第2のマッチング処理と組合わせ
て最終的に認識文字を決定するようになるので、大きな
回路規模を必要とせず、簡単な構成としながらも、認識
率を大幅に向上させることができる。
【0009】また、上記(2)項に示した構成とするこ
とにより、上記(1)項に示した作用に加えて、認識率
を落とすことなく、文字認識に要する時間を大幅に短縮
することができる。
【0010】
【実施例】以下本発明の一実施例について図面を参照し
て説明する。図1はその回路構成を示すもので、11が
全体の動作制御を司るCPUである。このCPU11に
対して、インストラクションROM12、認識用辞書R
OM13、方向ベクトル辞書ROM14、画像入力装置
15、画像メモリ16、ワークメモリ17、キー入力部
18、表示部19及びインタフェイス20がシステムバ
ス10を介して接続される。
【0011】インストラクションROM12は、文書画
像の入力(読込み)、文字の切出し、切出した文字の認
識及び認識結果の出力等、CPU11の動作プログラム
を構成するインストラクション(命令)を記憶したRO
Mである。
【0012】認識用辞書ROM13は、例えば構造解析
法に基づく線素の端点、凹凸、ループなど位相構造の特
徴を文字毎に記憶した辞書としてのROMである。方向
ベクトル辞書ROM14は、一部その内容を後述する
が、認識対象となる文字画像の標準パターンにおける輪
郭の方向ベクトルの加算値を予め記憶した辞書としての
ROMである。
【0013】画像入力装置15は、例えば用紙の給送機
構と光源、CCD等の光電変換素子、増幅機及びA/D
変換器等から構成され、用紙上の文書画像を読取るもの
である。
【0014】画像メモリ16は、例えばDRAMで構成
されるもので、上記画像入力装置15で読取った画像デ
ータを記憶する。ワークメモリ17は、上記CPU11
の動作制御処理に伴う各種データを一次記憶するもので
ある。
【0015】キー入力部18は、アルファベットキー、
数値キー、各種機能キー等のキーを備えており、文書画
像の読取り、認識された文字の確定または次候補の選択
等を指示入力する。
【0016】表示部19は、例えばドットマトリクスタ
イプの液晶表示パネルにより構成されるもので、確定を
終えた文字列や認識結果の文字、次候補文字、動作状況
等を表示する。
【0017】インタフェイス20は、外部機器と接続さ
れることで、外部機器で読取られた文書画像のデータを
直接入力し、あるいは確定を終えた文字列のデータを外
部機器に出力する。
【0018】次に上記実施例の動作について説明する。
図2は主としてCPU11による文字認識の動作処理を
示すもので、その処理当初には画像入力装置15により
文書画像を有した用紙を読取らせ、あるいはインタフェ
イス20を介して外部機器から直接入力された文書画像
データを受付けることで画像の入力を行ない、入力され
た文書画像データを画像メモリ16に記憶させる(ステ
ップS1)。
【0019】こうして画像メモリ16に記憶させた文書
画像データに対し、行切出しを行なう(ステップS
2)。これは、画像メモリ16上に展開された白黒2値
の文書画像データに対し、端から縦方向または横方向に
順に黒画素の走査を行なうことで、黒画素のない2つの
列に挟まれた、少なくとも1つの黒画素を有する連続し
た列の固まりを、複数の文字列からなる行の画像として
検出するもので、検出後、切出すべき行があったかどう
か確認する(ステップS3)。
【0020】行があった場合には、次いでその切出した
行の画像に対し、上記行切出しのときの走査方向と直交
する方向から黒画素を走査することで、文字の始点位置
を見付ける(ステップS4)。
【0021】図3(1)は画像メモリ16上で切出した
行の画像から文字の始点位置を見付ける場合を例示する
ものである。ここでは2本の破線に挟まれた範囲Lが切
出した行を示すもので、行の切出しは図中の横方向の走
査により黒画素の有無を検出するという処理を、図中の
上端から下端へ縦方向に進めることで行なわれるもので
ある。
【0022】こうして切出された行に対し、今度は図中
に矢印Aで示す如く横方向からの黒画素の走査を行なう
ことで、文字の始点位置Pを得るもので、その後、文字
の始点位置Pが得られたか否かにより文字があったかど
うかを確認する(ステップS5)。
【0023】文字があったと判断するとCPU11は、
その始点位置から隣接する8近傍点で黒画素をたどって
いくことにより当該文字画像の輪郭を抽出し、この際に
文字の輪郭がどの方向に進んだのかを示す方向ベクトル
を順次ワークメモリ17に加算していく(ステップS
6)。
【0024】図3(2)はこうして文字画像の輪郭を抽
出していく様子を示すもので、この処理は始点位置に戻
るまで続行される。図5はこのステップS6で加算され
る方向ベクトルを例示するもので、ここでは上述した如
く当該画素位置から隣接する8近傍点で黒画素のある位
置をたどることで方向ベクトル「v=0」〜「v=7」
が得られ、加算されていく。例えば、輪郭をたどること
で上方向への方向ベクトル「v=6」が4画素分連続し
て得られるとすると、その区間での方向ベクトル「v=
6」の加算値が「4」となる。
【0025】しかして、輪郭を抽出する処理により始点
位置に戻ると、以上で1文字分の画像の輪郭を抽出し終
えたこととなるので、この輪郭により囲まれた1文字分
の画像データを画像メモリ16から読出し、ワークメモ
リ17に一旦保持させると共に、画像メモリ16におけ
る当該文字の画像データを消去する(ステップS7)。
【0026】図3(3)はこのときの画像メモリ16の
状態を示すものであり、輪郭を抽出された文字画像デー
タが消去され、まだ処理されていない文字の画像データ
のみが画像メモリ16に残っていることを表わす。
【0027】次いで、ワークメモリ17に保持されてい
る1文字分の画像データに対して例えば構造解析法に基
づいた特徴抽出を行なう(ステップS8)。この場合、
上述した如く文字画像の線素を解析し、端点、凹凸、ル
ープなど位相構造の特徴を抽出するもので、抽出した文
字はワークメモリ17に保持される。
【0028】次いで、このステップS8で抽出した特徴
の情報により、認識対象となる文字の標準パターンにお
ける同特徴の情報を記憶している認識用辞書ROM13
を参照してマッチングを行なうことで類似度の高い候補
文字を特定数得る一方、ワークメモリ17に記憶してい
る上記方向ベクトルの加算値を用いて、認識対象となる
文字の標準パターンにおける同方向ベクトルの加算値を
記憶している方向ベクトル辞書ROM14を参照してマ
ッチングを行なうことで類似度の高い候補文字を特定数
得る(ステップS9)。
【0029】図4は方向ベクトル辞書ROM14に予め
記憶されている文字の標準パターンにおける同方向ベク
トルの加算値の情報の一部を例示するものである。この
場合、例えばアドレス「1」〜「11」が文字「A」に
対する情報であり、アドレス「1」に当該文字「A」
が、アドレス「2」に始点の位置の座標が、アドレス
「3」に外周(輪郭)の長さが、そしてアドレス「4」
〜「11」に上記図5で示した方向ベクトル「v=0」
〜「v=7」それぞれの加算値が記憶されている。外周
(輪郭)の長さは、方向ベクトル「v=0」〜「v=
7」それぞれの加算値の合計値である。
【0030】こうして2種類のマッチングにより得られ
たそれぞれ特定数の候補文字により、総合して最も類似
度の高いものを認識結果として決定し、表示部19で表
示出力する(ステップS10)。
【0031】また、上述したように2種類のマッチング
による認識の手法を平行しておこななってもよいが、類
似度の計算は方向ベクトル辞書ROM14による方向ベ
クトルの加算値に基いたものの方が容易であるため、始
めに方向ベクトル辞書ROM14による方向ベクトルの
加算値に基いたマッチングを行ない、得られた特定数の
候補文字についてのみ、認識用辞書ROM13による構
造解析法に基いたマッチングを行なうようにすれば、文
字認識処理に要する時間を大幅に短縮することができ
る。
【0032】以上で1文字の文字認識処理を終了し、残
る文字の画像データについて再び上記ステップS4から
の処理を繰返し実行する。そして、ステップS4で文字
の始点位置が見つけられず、ステップS5で文字がない
と判断した時点でCPU11は、切出した行における文
字の輪郭の抽出及び抽出した輪郭で囲まれる文字の認識
を終えたこととなるので、画像メモリ16に記憶されて
いる残る文書画像に対して再び上記ステップS2に戻
り、行切出しからの処理を再度実行する。
【0033】そして、ステップS2で行の切出しを行な
うことができず、ステップS3で行がないと判断した時
点でCPU11は、画像メモリ16に記憶した文書画像
中の全ての文字画像の認識を終えたものと判断し、以上
でこの図2の処理を完了する。
【0034】なお、上記実施例では、輪郭抽出により得
られる方向ベクトルの加算値により標準パターンの方向
ベクトルの加算値とのマッチングを行なう第1の方法と
は別に、構造解析法に基く標準パターンの抽出特徴との
マッチングを行なう第2の方法を用いるものとして説明
したが、第2の方法に関してはこれに限るものではな
く、他のアルゴリズム、例えば従来例のように予め用意
しておいた文字画像の標準パターンそれ自体とのマッチ
ングをはかるパターンマッチング法等を用いてもよいこ
とは勿論である。
【0035】
【発明の効果】以上詳記した如く本発明によれば、文字
の切出処理の過程で得られる文字画像中の輪郭の方向ベ
クトルを有効に利用してその加算値により第1のマッチ
ング処理を行ない、この第1のマッチング処理とはアル
ゴリズムの異なる第2のマッチング処理と組合わせて最
終的に認識文字を決定するようになるので、大きな回路
規模を必要とせず、簡単な構成としながらも、認識率を
大幅に向上させることが可能な文字認識装置及び方法を
提供することができる。
【図面の簡単な説明】
【図1】本発明の一実施例に係る回路構成を示すブロッ
ク図。
【図2】同実施例に係る処理動作を説明するフローチャ
ート。
【図3】同実施例に係る文字画像の輪郭抽出の動作を説
明する図。
【図4】図1の方向ベクトル辞書ROMの記憶内容の一
部を例示する図。
【図5】同実施例に係る輪郭抽出で用いる方向ベクトル
を例示する図。
【符号の説明】
10…システムバス 11…CPU 12…インストラクションROM 13…認識用辞書ROM 14…方向ベクトル辞書ROM 15…画像入力装置 16…画像メモリ 17…ワークメモリ 18…キー入力部 19…表示部 20…インタフェイス

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力された文書画像中の文字画像をその
    輪郭に従って1文字単位で切出す文字切出手段と、 この文字切出手段で得られる文字画像中の輪郭の方向ベ
    クトルを抽出する抽出手段と、 認識対象となる文字画像の標準パターンにおける輪郭の
    方向ベクトルの加算値を予め記憶しておく記憶手段と、 上記抽出手段で得られた方向ベクトルの加算値を基に上
    記記憶手段を参照して類似度の高い候補文字を得る第1
    のマッチング手段と、 上記文字切出手段で得られる文字画像に対して上記第1
    のマッチング手段とは異なるアルゴリズムをもって類似
    度の高い候補文字を得る第2のマッチング手段と、 上記第1及び第2のマッチング手段でそれぞれ得られた
    候補文字により認識結果としての文字を決定し、出力す
    る文字認識手段とを具備したことを特徴とする文字認識
    装置。
  2. 【請求項2】 上記文字認識手段は第1のマッチング手
    段で得られた特定数の候補文字の中から、第2のマッチ
    ング手段で最も高い類似度を有する文字を認識結果とし
    て決定することを特徴とする請求項1記載の文字認識装
    置。
  3. 【請求項3】 入力した文字画像を切出して、この切出
    し画像に対して所定の文字認識をする文字認識方法にお
    いて、 上記切出した文字画像の輪郭の方向ベクトルを抽出する
    ステップと、 この抽出された方向ベクトルに基づいて文字認識をする
    ステップとを有することを特徴とする文字認識方法。
  4. 【請求項4】 上記方向ベクトルを抽出するステップ
    は、上記切出した文字画像の輪郭画素を順次サーチする
    ステップと、 このサーチしている輪郭画素の方向ベクトルを検出する
    ステップと、 この検出された方向ベクトルを該方向ベクトル毎にカウ
    ントし、この方向ベクトル毎のカウント値を特徴値とす
    るステップとを有することを特徴とする請求項3記載の
    文字認識方法。
JP7064111A 1995-03-23 1995-03-23 文字認識装置及び方法 Pending JPH08263591A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7064111A JPH08263591A (ja) 1995-03-23 1995-03-23 文字認識装置及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7064111A JPH08263591A (ja) 1995-03-23 1995-03-23 文字認識装置及び方法

Publications (1)

Publication Number Publication Date
JPH08263591A true JPH08263591A (ja) 1996-10-11

Family

ID=13248643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7064111A Pending JPH08263591A (ja) 1995-03-23 1995-03-23 文字認識装置及び方法

Country Status (1)

Country Link
JP (1) JPH08263591A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1155381A (ja) * 1997-07-29 1999-02-26 Yasue Mamezaki 画像認識送受信装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1155381A (ja) * 1997-07-29 1999-02-26 Yasue Mamezaki 画像認識送受信装置

Similar Documents

Publication Publication Date Title
JP2003308480A (ja) オンライン手書き文字パターン認識編集装置及び方法並びに当該方法を実現するコンピュータ実行可能なプログラム
JP2005135041A (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH08180068A (ja) 電子ファイリング装置
JPH08263591A (ja) 文字認識装置及び方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH07160810A (ja) 文字認識装置
JPH01201789A (ja) 文字読取装置
JPH117493A (ja) 文字認識処理装置
JPH0573725A (ja) 手書き文字・図形認識装置
JP2746904B2 (ja) 文書読取り装置
JP2743378B2 (ja) 文字認識方法
JPH07168911A (ja) 文書認識装置
KR100234028B1 (ko) 문자인식 시스템의 문자영역 구분방법
JPS63137383A (ja) 文字読取装置
JPH053631B2 (ja)
JP2005242825A (ja) 帳票読取装置及び帳票読取装置による帳票方向判定方法
JPH08171609A (ja) 文字列高速抽出装置
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
JPH0728930A (ja) 文字認識装置
JPH03217993A (ja) 文字サイズ認識装置
JPH03219384A (ja) 文字認識装置
JPH08115421A (ja) 画像処理装置及び方法
JPH06139277A (ja) 電子辞書装置