JPH04174088A - 印刷文字認識装置 - Google Patents

印刷文字認識装置

Info

Publication number
JPH04174088A
JPH04174088A JP2298190A JP29819090A JPH04174088A JP H04174088 A JPH04174088 A JP H04174088A JP 2298190 A JP2298190 A JP 2298190A JP 29819090 A JP29819090 A JP 29819090A JP H04174088 A JPH04174088 A JP H04174088A
Authority
JP
Japan
Prior art keywords
moment
character
neural network
mode
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2298190A
Other languages
English (en)
Inventor
Banzuhafu Uorufugangu
ウォルフガング バンズハフ
Shigetoshi Nara
奈良 重俊
Toshinao Ishii
俊直 石井
Takashi Iwamoto
貴司 岩本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2298190A priority Critical patent/JPH04174088A/ja
Publication of JPH04174088A publication Critical patent/JPH04174088A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【産業上の利用分野】
この発明は、神経科学あるいは神経工学を利用した印刷
文字認識装置に関するものである。
【従来の技術】
第5図は従来の印刷文字vllli装置を示す構成図で
ある。図において、1は印刷された文字が読み取られて
認識される原稿であり、2は原稿1上の文字を1文字ず
つ分離し、当該1文字を分離したフレームを画素分解し
て白黒の画像に変換した1文字ずつのビットマツプを作
成する印刷文字写し取り手段である。3はこの印刷文字
写し取り手段2にて作成されたビットマツプの情報圧縮
を行う圧縮部、4は前記ビットマツプを逐次処理的に比
較して文字認識を行う認識部であり、5はこれら圧縮部
3.認識部4を含む処理手段である。6はこの処理手段
5における処理結果が記録される記憶手段である。 次に動作について説明する。ここで、第6図はこの印刷
文字認識装置の処理の流れを示す説明図である。 ユーザはまず、印刷原稿1に印刷された文字の大きさや
フォントを判定してそれについての情報を指定する。印
刷文字写し取り手段2は指定された情報に基づいて1文
字ずつフレームウィンドウに分離し、各フレーム毎に、
走査線(ラスタ)分解をして画素(ピクセル)の明暗を
、文字上のピクセルについては“黒”としてこれに数′
′1″を対応させ、空白上のピクセルについては“′白
”としてこれには数“0”を対応させる。こうして1文
字ずつビットマツプと呼ばれる情報に変換する。 典型的な読み取りにおいては、1インチ当り300ピク
セル(300dpi)が用いられ、A4サイズ1頁当り
の情報量は約1メガバイトに達する。 文字認識としては最も原始的な方法として、このビット
マツプを処理手段5より直接記憶手段6に送って記録し
ていく方法がある(これを方法lとする)。この方法は
認識と呼ばれる処理は実際のところ行っていない。 この方法をもう少し改良するとして、ビットマツプのデ
ータを圧縮するやり方がある。例えば、lフレームのデ
ータ列に対し、データ列の中で“1” (あるいは“0
′”)が連続して連なる場合、” 1 ”か“0”かを
区別する記号を置く操作と、その繰り返し数を振り当て
る操作を内蔵する圧縮部3にて実行する。処理手段5は
こうして得た圧縮情報を記憶手段6に送って記録させる
(これを方法2とする)。この方法によると、元のビッ
トマツプデータは、荒っぽく言ってその情報量をA4サ
イズ1頁当り1キロバイト程度まで落とすことが可能で
ある。これも文字の認識処理は実際のところ行っていな
い。 実際の認識処理を含むやり方としては、ビットマツプを
もとに、データベースとして各文字に対応するビットマ
ツプを用意しておき、認識部4において印刷文字写し取
り手段2の写し取ったビットマツプを逐次処理的に比較
して文字認識を行い、その結果、認識された文字を符号
化して記憶手段6に送り、記録する方法がある(これを
方法3とする)。
【発明が解決しようとする課題】
従来の印刷文字認識装置は以上のように構成されている
ので、ユーザが印刷原稿1の文字の大きさ、フォントの
種別等をあらかじめ事前情報として与える必要があり、
また、文書等の多数の文字が印刷されている印刷原稿1
については、処理すべきデータ量の爆発、さらには文字
認識の際、調べるべき場合の数の爆発などによって処理
時間が極端に増大し、処理のためのプログラムにおける
極端な複雑さの発生などによって、ノイマン型の情報処
理方式では現実的には処理が不可能になるなどの課題が
あった。 この発明は上記のような課題を解消するためになされた
もので、事前情報をあらかじめ与えておく必要がなく、
処理時間が極端に増大するようなこともない印刷文字認
識装置を得ることを目的とする。
【課題を解決するための手段】
この発明に係る印刷文字認識装置は、印刷文字写し取り
手段に視野の縮小/拡大が可能な可動フレームを採用し
、当該印刷文字写し取り手段の作成したビットマツプか
ら定まった次数までのモーメントを計算するモーメント
神経回路網と、そのモーメント出力のパターンをもとに
モード競合を生じせしめて登録してある文字のどれであ
るかを指定するモード競合神経回路網と、その出力をも
とに読み取った文字列を記録する記憶手段とを備えたも
のである。
【作 用】
この発明における印刷文字写し取り手段は、可動フレー
ムを採用することで原稿の印刷文字がどんな大きさでど
んなフォントで印刷されているかを事前情報として与え
ておく必要をなくして、直ちにビットマツプ作成作業の
開始を可能とし、モード競合神経回路網は、確定したビ
ットマツプをもとにモーメント神経回路網が並列的に計
算したモーメント出力を受けてモード競合を生じせしめ
、種々のフォントによる印刷文字の違いを統合すること
により、処理すべきデータおよび調べるべき場合の数の
暴発による計算時間の増大を抑制できる印刷文字認識装
置を実現する。
【実施例】
以下、この発明の一実施例を図について説明する。第1
図において、1は原稿、6は記憶手段であり、7は可動
フレームを採用している点で従来のそれとは異なった印
刷文字写し取り手段である。 8はこの印刷文字写し取り手段7における文字スキャン
のためのフレームであり、9はこのフレーム8のピクセ
ル分解した時の各ピクセルである。 以下、このフレームをスキャンウィンドウ、ピクセルを
セグメントという。 10は各セグメントからビットマツプとしての入力を受
けるセグメント神経細胞層であり、11はこのセグメン
ト神経細胞層10からの各セグメント情報より、指定さ
れた次数のモーメントを計算するモーメント神経回路網
としてのモーメント計算層である。12はこのモーメン
ト計算層11からの入力を受けて、それがどの文字に一
番近いかをモード競合によって決定するモード競合神経
回路網としてのモード競合層であり、13はこのモード
競合層12の出力を受けて対応する文字を符号化し、そ
れを定められた記憶手段6に送って記録させる出力層で
ある。 次に動作について説明する。ここで、第2図はその全体
処理の流れを示すフローチャートである。 今、印刷された文字列から成る原稿1が与えられると、
まず初期条件として任意の大きさのスキャンウィンドウ
8を設定して(ステップ5TI)そこからの入力を考え
る。次に、定められた精度で設定されたスキャンウィン
ドウ8内の横のラスタをたどってスキャンを行い(ステ
ップ5T2)、空白行もしくは空白a(そのラスク上に
は白レベル以外の信号がない)の存在を検出する(ステ
ップ5T3)。空白行(空白a)が存在する場合にはス
キャンウィンドウ8をそこまで収縮させて(ステップ5
T4)、1行分のスイープを終了したことを検出(ステ
ップ5T5)するまで次のラスタへ移行して(ステップ
5T6)処理を繰り返す。 1行分のスイープを終えると、ステップST7〜5T1
1にて縦のラスタをたどる同様の処理を実行する。1文
字分のスイープが終了して1文字1フレームの形で分離
した後、定められた大きさまで全体を相似形に拡大ある
いは収縮させ、前処理としてのフレーム処理を完成する
。第3図はこの1フレームの文字が確定してモーメント
計算層11へ送られるまでを模式的に示した説明図であ
る。 この画&をピクセル分解(セグメンテーション)して、
各ピクセル毎に輝度の平均を行い、闇値処理によって白
レベルには“0″、黒レベルには11”の値を与え、こ
れを各セグメントのフレーム原点に関する座標整数i及
びjの関数として表してこれをセグメント信号 1J とする。これがビットマツプを作成(ステップ5T12
)するセグメント神経細胞層10での処理である。 以下、神経回路網処理(ステップ5T3)によって文字
認識が行われる。ここで、セグメント神経細胞層10と
モーメント計算層11とのシナプス結合行列を W 、JlllI= i I  j l″と取って、積
和演算 M0=ΣiJ p、□j W i j ’″を行い、こ
れをモーメント計算層11の神経細胞の発火(興奮)パ
ターンとする。この実施例では1+m=6  であり、
大火のモーメントまでの処理を行い、これに更に定めら
れた演算を加えて、重心に関するモーメントに変換を行
い、それらを順に、Q++qz、・・・・、q、、と番
号付けをして、モーメント計算層11の神経細胞の発火
(興奮)パターンとする。 次に、このモーメント計算層11とモード競合層12と
のシナプス結合行列 A7B、  の値を、記憶させた
い文字の内 i 番目の文字の k 番目のモーメント
のイ直とする。そうすると、モーメント計算層11の出
力はモード競合層12にdi (0)=ΣkA、□kq
。 の値を加えることになる。これがモード競合層12にお
ける初期条件となる。もし、(qk)が記憶してある一
つの文字と一致しているならば、対応する文字の初期条
件としての di  (0)は1になる。 モード競合層11はその意味で、印刷文字写し取り手段
7からの読み取り信号として、雑音が入ったり、多少変
形したりした文字の信号から、登録してあるどの文字が
その信号に一番フイツトしているかを自律的に判定させ
る機能を持つのである。なお、第4図に登録されたアル
ファベットの次のモーメントまでのモーメントパターン
を例示する。その時間発展方程式は、上に与えられた初
期条件に対し、 で定義される。 この方程式はどれかの i に対応する値が1となり、
他は全てゼロとなる定常解を持ちこれらを(di ’ 
) とする。こうして得られた(di’)がモード競合
層12の出力となる。出力層13との定められた符号化
に基づくシナプス結合行列をB j iとすると、出力
層13は pJ=Σ BJ、dパ なる出力発火(興奮)パターンが出力されることになる
。この情報は定められた処理を受けて、これも定められ
た記憶手段6に送られて記録される。 このようにして1文字ずつの認識を行い、原稿1の最後
の文字の認識が終了したことを検出(ステップ5T14
)するまで、スキャンウィンドウ8を1文字分、あるい
は改行分ずらせ(ステップ5T15)ながら処理をステ
ップST2へ戻し、以上の処理を繰り返す。 なお、上記実施例では、モーメント計算の次数を6とし
たものを示したが、問題によって任意の定まった次数を
設定してもよい。
【発明の効果】
以上のように、この発明によれば、印刷文字写し取り手
段に可動フレームを採用し、モード競合神経回路網にお
いて、確定したビットマツプをもとにモーメント神経回
路網が並列的に計算したモーメント出力を受けてモード
競合を生じせしめ、種々のフォントによる印刷文字の違
いを統合するように構成したので、原稿の印刷文字の大
きさ、フォントの種類などを事前情報として与えておく
必要がなく、処理すべきデータおよび調べるべき場合の
数の暴発による計算時間の極端な増大を抑制することの
できる印刷文字認識装置が得られる効果がある。
【図面の簡単な説明】
第1図はこの発明の一実施例による印刷文字認識装置を
示す構成図、第2図はその全体処理の流れを示すフロー
チャート、第3図はその1フレームの文字が確定した後
にモーメント計算層へ送られるまでの処理を模式的に示
す説明図、第4図は登録されたアルファベットの6次の
モーメントまでのモーメントパターンを示す説明図、第
5図は従来の印刷文字認識装置を示す構成図、第6図は
その処理の流れを示す説明図である。 1は原稿、6は記憶手段、7は印刷文字写し取り手段、
8はフレーム(スキャンウィンドウ)、11はモーメン
ト神経回路網(モーメント計算層)、12はモード競合
神経回路網(モード競合層)。 なお、図中、同一符号は同一、又は相当部分を示す。 特 許 出 願 人  三菱電機株式会社rTF−゛′ 10′セクメント神経酊萌乞眉      13 士力
層第3図 第4図 第5図 第6図

Claims (1)

    【特許請求の範囲】
  1.  視野の縮小/拡大が可能なフレームを有し、前記フレ
    ームの縮小/拡大によって原稿上の1文字を分離し、当
    該1文字を分離したフレームを画素分解して白黒の画像
    に変換した1文字ずつのビットマップを作成し、それを
    前記原稿全体にわたって実行する印刷文字写し取り手段
    と、前記ビットマップから定まった次数までのモーメン
    トを計算するモーメント神経回路網と、前記モーメント
    神経回路網からのモーメント出力のパターンをもとにモ
    ード競合を生じせしめ、あらかじめ登録してある文字の
    いずれに該当するかを指定するモード競合神経回路網と
    、前記モード競合神経回路網の出力をもとに、読み取っ
    た文字列を記録する記憶手段とを備えた印刷文字認識装
    置。
JP2298190A 1990-11-02 1990-11-02 印刷文字認識装置 Pending JPH04174088A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2298190A JPH04174088A (ja) 1990-11-02 1990-11-02 印刷文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2298190A JPH04174088A (ja) 1990-11-02 1990-11-02 印刷文字認識装置

Publications (1)

Publication Number Publication Date
JPH04174088A true JPH04174088A (ja) 1992-06-22

Family

ID=17856386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2298190A Pending JPH04174088A (ja) 1990-11-02 1990-11-02 印刷文字認識装置

Country Status (1)

Country Link
JP (1) JPH04174088A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012104028A (ja) * 2010-11-12 2012-05-31 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012104028A (ja) * 2010-11-12 2012-05-31 Sharp Corp 画像処理装置、画像読取装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
US8941864B2 (en) 2010-11-12 2015-01-27 Sharp Kabushiki Kaisha Image processing apparatus, image reading apparatus, image forming apparatus, and image processing method

Similar Documents

Publication Publication Date Title
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
WO2018223994A1 (zh) 中文打印字符图像合成方法及装置
JP4065460B2 (ja) 画像処理方法及び装置
JP3696920B2 (ja) ドキュメント格納装置及び方法
JPS6118381B2 (ja)
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
EP0649113A2 (en) Multifont optical character recognition using a box connectivity approach
EP1146472A2 (en) Loose-gray-scale template matching
JPH0773329A (ja) 画像処理方法および装置
US7412108B2 (en) Image enhancement employing partial template matching
JPH07225570A (ja) プリント強化用の密度維持テンプレートの統計的生成方法
US5724455A (en) Automated template design method for print enhancement
JPH1196301A (ja) 文字認識装置
US6135653A (en) Data compression method and apparatus and data expansion method and apparatus
JP3045008B2 (ja) ハーフトーン画像の圧縮方式
JPH04174088A (ja) 印刷文字認識装置
JP2700131B2 (ja) パターン認識方法
JPH11272798A (ja) ボ―ルド体文字を区別する方法及び装置
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JP3211417B2 (ja) ページ記述言語処理装置
JP3211545B2 (ja) 画像処理装置
JP3261208B2 (ja) 画情報予測符号化および復号化装置
JPH09167222A (ja) 画像処理装置
US5666440A (en) Method and apparatus for extracting outline data from bi-level image data
JP2976990B2 (ja) 文字認識装置