JPH0562016A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0562016A
JPH0562016A JP2404261A JP40426190A JPH0562016A JP H0562016 A JPH0562016 A JP H0562016A JP 2404261 A JP2404261 A JP 2404261A JP 40426190 A JP40426190 A JP 40426190A JP H0562016 A JPH0562016 A JP H0562016A
Authority
JP
Japan
Prior art keywords
character
image information
feature amount
standard
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2404261A
Other languages
English (en)
Inventor
Noriyuki Fukuyama
訓行 福山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2404261A priority Critical patent/JPH0562016A/ja
Publication of JPH0562016A publication Critical patent/JPH0562016A/ja
Withdrawn legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は文字認識装置に関し、必要とする認識
辞書の種類を極力少なくし、かつ正解率を低下させるこ
となく文字認識スピードを向上させることを目的とす
る。 【構成】文字認識すべき各文字のイメージ情報を一時的
に格納するメモリ手段11と、メモリ手段11からのイメー
ジ情報の特徴量を抽出する特徴量抽出手段12と、認識辞
書14を参照し特徴量抽出手段12より順次読出したイメー
ジ情報の特徴量に近似する標準の特徴量を検索する文字
検索手段と、特徴量抽出手段12の入力側に設けられ、各
文字イメージの線幅を標準文字を表すイメージの線幅に
近付ける定線化手段20とから構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は文字認識装置に関する。
近年、コンピュータを利用したデータ・ベース等の拡充
が進められている。例えば文書上に書かれた文字につい
ても、これらをコンピュータを介してデータ・ベースに
入力する、というものである。
【0002】このような文書上の文字のデータ・ベース
化においては文字認識装置が必須であるが、この文字認
識装置においては、文書上に文字種の違いがあってもそ
れぞれの文字を正しく認識できることが要求される。
【0003】
【従来の技術】図11は一般的な文字認識装置の構成を示
すブロック図である。本図において、本発明に関係する
文字認識装置は、メモリ手段11、特徴量抽出手段12、文
字検索手段13および辞書14からなる。これら以外の構成
部分は、検索手段13からの認識結果を、コンピュータ
(図示せず)によって読取り可能な情報に変換するコー
ド変換手段15および変換された該情報をそのコンピュー
タに送出する出力手段16である。
【0004】メモリ手段11は、例えば文書上を走査する
イメージスキャナから読取った文字認識すべき各文字の
イメージ情報を一時的に格納するものである。特徴量抽
出手段12は、メモリ手段11から読出した各文字対応のイ
メージ情報の特徴量を抽出するものである。文字検索手
段13は、複数の標準文字の各々に対応して予め算出した
標準の特徴量を保持する認識辞書14を参照し、特徴量抽
出手段12より順次読出したイメージ情報の特徴量に近似
する標準の特徴量を検索するものであり、検索された標
準の特徴量に対応する標準の文字をもって各文字を認識
する。
【0005】なお、特徴量抽出手段12としては、イメー
ジ情報を表す文字イメージ(実際の文字と同じパターン
をもって二次元平面上に表した文字イメージ)を構成す
る白ドット(画素)および黒ドットの分布の特徴を抽出
する方法や、文字イメージの輪郭のつながり具合の特徴
から抽出する方法がある。
【0006】
【発明が解決しようとする課題】前述した一般的な文字
認識装置では、文字種の違いによって文字認識の正解率
が低下してしまうことが経験されている。すなわち、同
一文書上にフォントの異なる文字が混在すると文字認識
誤りが増加してしまう。例えば、明朝体の文字とゴシッ
ク体の文字とが併存するような文書について文字認識を
行うと、その文字認識の正解率は、同一文書上に明朝体
の文字のみが存在する場合あるいはゴシック体の文字の
みが存在する場合の正解率に比べてかなり低下する。
【0007】上述した正解率の低下をもたらす理由は、
明朝体の文字とゴシック体の文字とを比較した場合、そ
れぞれの文字イメージを構成する線の線幅が極端に異な
り、結果として特徴量のバリエーションが大幅に増大す
ることにある。そこでこの点に着目して、従来は図11の
認識辞書14を複数種、例えば明朝体専用認識辞書および
ゴシック体専用認識辞書として2種用意し、正解率の改
善を行っている。
【0008】しかしながら、上記のように一台の文字認
識装置の中に、複数種の認識辞書を併存させることは、
第1に文字認識装置を大形化し、かつコスト高になると
いう問題を生じさせ、第2に、少なくとも2つの認識辞
書の各々について検索動作を行わなければならないか
ら、当然処理時間が長くなり、したがって文字認識スピ
ードが落ちるという問題を生じさせる。
【0009】本発明は上記の問題点に鑑み、必要とする
認識辞書の種類を極力少なく、好ましくは一種とし、か
つ、正解率を低下させることなく文字認識スピードを向
上させることを目的とするものである。
【0010】
【課題を解決するための手段】図1は本発明の原理構成
を示すブロック図である。なお、全図を通じて、同様の
構成要素には同一の参照番号あるいは記号を付して示
す。図1において、本発明の特徴部分は定線化手段20で
あって、この存在により、予め用意すべき認識辞書14の
種類を減らすことができる。この定線化手段20は、特徴
量抽出手段12の入力側に設けられ、前述したイメージ情
報を表す文字イメージの線幅を前記標準文字を表す文字
イメージの線幅に近付けるものである。なお、この文字
イメージは、実際の文字と同じパターンをもって二次元
平面上に表した文字イメージである(前述)。
【0011】
【作用】例えば明朝体の文字とゴシック体の文字の如
く、大きなフォントの違いや線の太さの違いがあったと
しても、それぞれの文字イメージに線幅処理という加工
を加えることによって、明朝体の文字イメージとゴシッ
ク体の文字イメージを相互に近付けてしまう。つまり文
字イメージの線幅を、明朝体、ゴシック体の別に拘らず
一定化してしまう。これが定線化である。そうすること
により、前述した特徴量のバリエーションを極端に減ら
すことができる。
【0012】上述した一定化の目安としては、認識辞書
14内に予め保持される前記標準文字を表す文字イメージ
の線幅と同程度にするのが好ましい。
【0013】
【実施例】図2は定線化手段の動作を図解的に示す図で
あり、(A)は第1工程、(B)は第2工程である。た
だし文字イメージの一部を取り出して示す。本図の
(A)は明朝体の文字イメージをなす黒ドットの一部
(点線で囲む)についてその外周にある黒ドットを除去
し(除去したあとのドットを白丸で示す)、同図の
(B)のように定線化したことを表す。なお、図中の文
字イメージ以外の部分は白ドットである。
【0014】上記の工程(A)および(B)により定線
化を実現することができる。しかしながら上記の定線化
処理によると、処理時間がやや大となる不利がある。こ
れは多種多様の線幅を見極めて、それぞれに必要な所要
の細め処理または太め処理をしなければならないからで
ある。図3は定線化手段の一実施例に基づく動作を図解
的に示す図であり、(A),(B),(C),(D)および
(E)はそれぞれ第1、第2、第3、第4および第5工
程である。本図の第1および第2工程((A)および
(B))は、細線化処理工程を示す。文字イメージの外周
から1ドットずつ黒ドットを除去することにより、文字
イメージの線幅を細める。
【0015】本図の(c)に示す第3工程は、上記第1
および第2工程を繰り返し行い素線化することを表す。
何回繰り返すかは各線の線幅の大小による。本図の
(c)では理解を容易にするために、完全に素線(1黒
ドットの線列)化してしまうイメージを描いているが、
実際には必要以上に細めないよう限界を設けておく。こ
れは、例えば黒丸のパターンがあったときに、これが黒
ドットの一点になってしまい、この段階で元のイメージ
情報(黒丸)を失ってしまうからである。同様のことは
つぶれかかった文字イメージが与えられたときにもあて
はまり、完全に素線化してしまうと、元のイメージ情報
を失なってしまう。なお上記の限界は、イメージスキャ
ナの解像度に応じて最適な値に設定しておくのが好まし
い。
【0016】例えば縦横40ドット程度の大きさで文字イ
メージが構成されている場合は、文字イメージの線はそ
の10分の1程度で構成されるのが普通であるから、第3
工程の細め処理回数は約3回が適当である。かくして文
字イメージの線幅は、フォントや線の太さのバラツキに
拘らず、最小化され統一される。しかしこのように素線
化された文字イメージのままであると、図1の特徴量抽
出手段12で正確な抽出をする場合に支障が生じてくる。
分かり易く表現すれば、特徴量の抽出を見落してしまう
おそれがあるからである。
【0017】そこで図3の第4および第5工程((D)お
よび(E))では、再び線幅の太め処理を行う。同図中の
白丸は太め処理のために改めて追加される黒ドットを表
し、線の外周に付加される。同図(E)の最終線幅は、
認識辞書14内の標準文字を表す文字イメージの線幅と同
等にするのが好ましい。図4は本発明に係る定線化手段
の一実施例を示すブロック図であり、上記図3に表した
工程を実行するためのバードウェアブロックである。た
だし、ソフトウェア処理とすることもできる。本図にお
いて、細線化部21は、図3の第1〜第3工程((A)〜
(C))を実行するものであり、太線化部22は第4および
第5工程((D)および(E))を実行するものである。
【0018】図5は図4の細線化部の一実現例を示すハ
ードウェアブロック図であり、図6は図4の太線化部の
一実現例を示すハードウェアブロック図であって、細線
化論理フィルタ26および太線化論理フィルタ29(いずれ
もROMで構成できる)を除けば両図とも共通の構成で
ある。つまり、メモリ手段11からのイメージ情報IMを
取り込む入力メモリ23と、そのディジタル読出しデータ
Dをライン(走査線)単位で複数ライン分を入力するラ
インメモリ24と、ラインメモリ24より順次出力される白
黒ドットデータを、一定の複数ドット単位で抽出するマ
スクレジスタ25と、フィルタ(26,29)からのフィルタ
出力を一旦保持し、特徴量抽出手段12へ定線化イメージ
情報IM′として供給する出力メモリ27と、一連の走査
のタイミング制御するためのアナログ信号Aを生成する
走査制御回路28は、図5および図6両者に共通である。
【0019】図7は図5および図6における論理フィル
タ処理を説明するための図であり、(A)はマスクを被
せた状態、(B)は細線化の基本的な処理状態、(C)
は細線化の例外的な処理状態、(D)は太線化の基本的
な処理状態である。本図において(A)では文字イメー
ジの上にマスク(9個のますからなる)を被せる。
【0020】(B)ではマスクの中央部が黒ドットで、
中央部から8方向(上、下、左、右、右上、右下、左
上、左下)のいずれかが白ドットであれば中央部の黒ド
ットを白ドットに変換する。(C)の左側では中央部と
その右側が黒ドットでそれらの両側が白ドットの場合は
中央部の黒ドットを残す。
【0021】(C)の右側では中央部とその上部が黒ド
ットでそれらの上下が白ドットの場合は、中央部の黒ド
ットを残す。上記(A),(B)および(C)の処理を文
字イメージの左から右に走査して行い、1ライン分終了
すると、1回の細線化が終了し、再び1つ下にずらして
左から右に走査する。
【0022】一方、太線化論理フィルタでは、図7の
(D)に示すように、(B)あるいは(C)とは逆に、
マスクの中央部が白ドットで、中央部から8方向のいず
れかが黒ドット(または、中央部から4方向(上、下、
左、右)のいずれかが黒ドット)であれば中央部を黒ド
ットに変換する。このような処理を文字イメージの左か
ら右に走査して行い、1ライン分終了すると、1回の太
線化が終了し、再び1つ下にずらして左から右に走査す
る。
【0023】最後に、本発明に適した特徴量抽出手段
(図1の12)の一例を説明する。図8は特徴量抽出の一
例を説明するための図であり、(A)は一例としての文
字イメージ、(B)はそれを複数に分割した状態、図9
は図8の(B)より特徴量を抽出する過程を表す図であ
り、(A)は方向コードと頻度の関係、(B)は特徴量
の分布の一例、図10は図9の情報から得た特徴量のベク
トルを示す図である。
【0024】図8の(A)に示す文字イメージ“A”が
与えられたとすると、これを(B)に示す如く、縦横各
8等分した小領域に分割する。この分割された計64個の
小領域のそれぞれについて、後述する文字輪郭特徴量の
抽出を行う。図9において、文字輪郭特徴量の抽出が行
われる。文字イメージの輪郭について、文字輪郭上の輪
郭点の接続状態に基づいてそれぞれの輪郭点に左右
(0)、右下がり(1)、上下(2)、右上がり(3)
の値(方向コード)を与え、(図9(A)参照)、小領
域中の方向コードの個数を輪郭特徴量(An,Bn,Cn,D
n)とする(図9(B)参照)。なお、図9(B)は図8
(B)のハッチング部分を拡大したものに相当する。
【0025】図10は256(=8×8×4)次元の特徴量を
表すベクトルであり、そのかっこ内の8×8は図8
(B)の小領域の総数を表し、4は図9に示す方向コー
ドの種類数(An,Bn,Cn,Dn)を表す。この図10と同様
のベクトルは、認識辞書14内に各標準文字対応に準備さ
れていて、両者を比較することになる。専用のICを用
いると、例えば1秒当り30文字の認識が可能である。
【0026】
【発明の効果】以上説明したように本発明によればフォ
ントや線の太さの違いに左右されることなく単一の認識
辞書で対処でき、文字認識装置の小形化を可能にする。
また、認識辞書が最小の数であるから検索の処理数が減
少し、文字認識スピードが向上する。
【図面の簡単な説明】
【図1】本発明の原理構成を示すブロック図である。
【図2】定線化手段の動作を図解的に示す図であり、
(A)は第1工程、(B)は第2工程である。
【図3】定線化手段の一実施例に基づく動作を図解的に
示す図であり、(A),(B),(D),(D)および(E)
はそれぞれ第1、第2、第3、第4および第5工程であ
る。
【図4】本発明に係る定線化手段の一実施例を示すブロ
ック図である。
【図5】図4の細線化部の一実現例を示すハードウェア
ブロック図である。
【図6】図4の太線化部の一実現例を示すハードウェア
ブロック図である。
【図7】図5および図6における論理フィルタ処理を説
明するための図であり、(A)はマスクを被せた状態、
(B)は細線化の基本的な処理状態、(C)は細線化の
例外的な処理状態、(D)は太線化の基本的な処理状態
である。
【図8】特徴量抽出の一例を説明するための図であり、
(A)は一例としての文字イメージ、(B)はそれを複
数に分割した状態である。
【図9】図8の(B)より特徴量を抽出する過程を表す
図であり、(A)は方向コードと頻度の関係、(B)は
特徴量の分布の一例である。
【図10】図9の情報から得た特徴量のベクトルを示す図
である。
【図11】一般的な文字認識装置の構成を示すブロック図
である。
【符合の説明】
11…メモリ手段 12…特徴量抽出手段 13…文字検索手段 14…認識辞書 20…定線化手段 21…細線化部 22…太線化部 26…細線化論理フィルタ 29…太線化論理フィルタ

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字認識すべき各文字のイメージ情報を
    一時的に格納するメモリ手段(11)と、 該メモリ手段(11)から読出した各該文字対応のイメー
    ジ情報の特徴量を抽出する特徴量抽出手段(12)と、 複数の標準文字の各々に対応して予め算出した標準の特
    徴量を保持する認識辞書(14)を参照し、前記特徴量抽
    出手段(12)より順次読出した前記イメージ情報の特徴
    量に近似する前記標準の特徴量を検索する文字検索手段
    (13)とを備え、検索された該標準の特徴量に対応する
    前記標準の文字をもって各前記文字を認識する文字認識
    装置において、 前記特徴量抽出手段(12)の入力側に、各前記イメージ
    情報を表す文字イメージの線幅を前記標準文字を表す文
    字イメージの線幅に近付ける定線化手段(20)を設ける
    ことを特徴とする文字認識装置。
  2. 【請求項2】 前記定線化手段(20)が、 各前記イメージ情報を表す文字イメージの線幅を該イメ
    ージ情報が失なわれない限度で縮小する細線化部(21)
    と、 細線化された該文字イメージの線幅を前記標準文字を表
    す文字イメージの線幅まで拡大する太線化部(22)とか
    らなる請求項1記載の文字認識装置。
  3. 【請求項3】 前記細線化部(21)は、前記文字イメー
    ジを複数のドット単位で順次走査しながら、その白黒ド
    ットパターンに応じて所定の黒ドットを白ドットに変換
    する細線化論理フィルタ(26)からなり、 前記太線化部(22)は、前記細線化論理フィルタ(26)
    からの文字イメージを複数のドット単位で順次走査しな
    がら、その白黒ドットパターンに応じて所定の白ドット
    を黒ドットに変換する太線化論理フィルタ(29)からな
    る請求項2記載の文字認識装置。
JP2404261A 1990-12-20 1990-12-20 文字認識装置 Withdrawn JPH0562016A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2404261A JPH0562016A (ja) 1990-12-20 1990-12-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2404261A JPH0562016A (ja) 1990-12-20 1990-12-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0562016A true JPH0562016A (ja) 1993-03-12

Family

ID=18513946

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2404261A Withdrawn JPH0562016A (ja) 1990-12-20 1990-12-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0562016A (ja)

Similar Documents

Publication Publication Date Title
US5048107A (en) Table region identification method
US6661919B2 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
JPS6159568A (ja) 文書処理装置
JP2542947B2 (ja) 画像処理装置
JPS631590B2 (ja)
US5361309A (en) Character recognition apparatus and method with low-resolution storage for character extraction
JPH0562016A (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3056950B2 (ja) 文字認識装置及び方法
JPH0252329A (ja) 画像情報記録・読取方法
JP2655598B2 (ja) 線分抽出方式
KR940003623B1 (ko) 한글문자 인식 빗침 자획추출방법
JP2931041B2 (ja) 表内文字認識方法
JPH08180087A (ja) 図形の歪み補正方法
JP2801246B2 (ja) 文字処理装置及び方法
JP2954218B2 (ja) 画像処理方法及び装置
JPH04306771A (ja) 図面自動入力処理方法
JPH04232583A (ja) 日本語文字の認識辞書作成装置
JPH11120291A (ja) パタン認識システム
JPH0554178A (ja) 文字認識装置及び修正用帳票
JP2602259B2 (ja) 文書処理装置
JPS61221978A (ja) 多色図面読取装置
JPH07160811A (ja) 文字認識装置
JPS6327990A (ja) 文字認識方法
JPH0962782A (ja) 文書読取装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980312