JPH02187884A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH02187884A
JPH02187884A JP1007237A JP723789A JPH02187884A JP H02187884 A JPH02187884 A JP H02187884A JP 1007237 A JP1007237 A JP 1007237A JP 723789 A JP723789 A JP 723789A JP H02187884 A JPH02187884 A JP H02187884A
Authority
JP
Japan
Prior art keywords
character
character pattern
direction code
pixel
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1007237A
Other languages
English (en)
Inventor
Tamotsu Maeda
保 前田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP1007237A priority Critical patent/JPH02187884A/ja
Publication of JPH02187884A publication Critical patent/JPH02187884A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞、雑誌等の活字、ドツト文字および手書
き文字を読み取り、入力された文字パターンをJfSコ
ード等のコード情報に変換する文字認識装置に関するも
のである。
従来の技術 近年、文字認識装置が簡便な文字入力装置として利用さ
れるようになってきた。従来の文字認識装置は、たとえ
ば矩形状に切り出された認識対象文字パターンを、MX
Nのメツシュ状に分割し、文字パターンの4辺から向か
い合った辺の向きに走査するときに、文字部分に出会う
までの背景部分の面積を計数し、これを全体の面積で正
規化し、これを特徴量としていたく梅田、有野二°′粗
いペリフェラルパターンによるマルチフォント印刷漢字
の分類”、電子通信学会技術研究報告、PRL78−4
)。
発明が解決しようとする課題 しかしながら上記の従来の技術では、文字パターンの周
辺部分の形状を背景部分の面積で表現していたために、
線幅の変動によって背景部分の面積も変動し、書体や字
体によって背景部分の面積が変化する、即ちマルチフォ
ント対応の文字認識装置にとって適した特徴量でない、
という問題点を有していた。たとえば、文字パターン「
木」のゴチック体と明朝体の例をそれぞれ、第4図、第
5図に示すが、これらの文字パターンを4×4に分割し
たときの背景部分の面積はそれぞれ、第8図に示すよう
に異なってしまい、背景部分の面積、即ち特徴量が書体
の違いに対して敏感であることがわかる。
課題を解決するための手段 本発明は、上記課題を解決するため、入力された画像か
ら矩形で切り出された認識対象文字パターンを、上記矩
形の辺から向かい合う辺に向かって走査し、背景部分か
ら文字部分に変化する画素を検出したときに、当該画素
において所定の複数の方向に連続して存在する黒画素の
数を計数し、当該黒画素の数が最大である方向の方向コ
ードを特徴量として認識を行なうものである。
作用 本発明は上記した構成により、文字パターンの特徴を方
向コードによって表現し、この方向コードによって文字
を識別する。
実施例 第1図は本発明の一実施例における文字認識装置の機能
ブロック図を示すものである。第1図において1は画像
データを読み取るスキャナ等で構成された画像入力部、
2は画像入力部lで読み取られた画像を切り出す文字切
り出し部、3は文字切り出し部2で切り出された各文字
の各々における文字パターンの方向を検出する方向コー
ド抽出部、4は方向コード抽出部3で抽出された方向コ
ードに対応する文字コードを検索する文字認識部、5は
方向コードの組み合わせと対応する文字コードとを対に
記憶した辞書、6は表示fjISである。
第2図は本実施例の文字認識装置の構成を示すブロック
図ある。ここで21は文字パターンを読み取るスキャナ
で読み取った文字パターンをビットデータにして出力す
る。22はRAMでスキャナ21からのビットデータを
記憶する文字パターン領域23、この文字パターン領域
23内の文字パターンを解析して得られる方向コード領
域24、及び方向コード領域24に記憶された方向コー
ドから決定される文字コード領域25を有している。
26はROMで方向コードとこれに対応する文字コード
を記憶した辞書、及び第3図(a)、第3図(b)に示
すフローチャートに従った制御プログラムを記憶したプ
ログラム記憶領域28を有する。29はプログラム記憶
領域28に記憶された制御プログラムに従って処理を行
う処理回路である。30はデータを入力するキーボード
であり、6は文字コード領域25に記憶された文字コー
ドに対応する文字を表示する表示部である。
以上のように構成された本実施例の文字認識装置につい
て、第3図のフローチャートに従って説明する。
まず、ステップs1において認識対象文字パターンをサ
ブ文字パターンに分割する。ステップS2ではiに1を
代入してステップs3に移行する。
ステップs3では文字パターン領域23に記憶された文
字パターンの画素((W/2N) ・i、0)から下に
向かって走査する。ステップs4では変化画素が存在す
るかどうかを判別し、存在すればステップs5において
変化画素において連続する黒画素数を4方向について計
数し、ステップS6で黒画素数が最大である方向の方向
コードを方向コード領域に格納する。ステップs4で変
化画素が存在しないと判別された場合はステップs11
において変化画素が存在しないことを示すコードをfI
微量として格納してステップs7に移行する。ステップ
s7では画素(W/2N)・i、H)から上に向かって
走査する。そしてステップS8において変化画素が存在
するかどうかを判別し存在すればステップs9において
変化画素から連続黒画素数を4方向について計数しステ
ップs10において黒画素数が最大である方向の方向コ
ードを特徴量おして方向コード領域25に格納する。
ステップs8で変化画素が存在しない場合はステップs
13において変化画素が存在しないことを示すコードを
格納する。そしてステップs14でiが4より小さいか
否かを判別し小さい場合はステップs12においてiを
インクリメントしてステップs3に戻るがiが4以上の
ときはステップs15に移行してiにOを代入する。ス
テップS16では画素(0,(W/2M)・i)から右
に向かって走査する。ステップs17で変化画素が存在
するかどうかを判別し変化画素が存在する場合はステッ
プs18で変化画素から連続する黒画素の数を計数する
。ステップs19では黒画素数が最大である方向の方向
コードを特徴量として方向コード領域に24に格納する
。ステップs17で変化画素が存在しない場合はステッ
プs25において変化画素が存在しないことを示すコー
ドを特徴量として方向コード領域24に格納する。次に
ステップs20において画素(W、(W/2M)・i)
から左に向かって走査し、ステップs21において変化
画素が存在するかどうか判別しステップs22、ステッ
プs23、或はステップS26と移行してステップs2
4においてiが4より小さいかどうかを判別する小さく
ない場合はステップs27でiに1を加えてステップs
16に戻るが4である場合は処理を終了する。
認識例題文字「木」を例に、以下その動作を説明する。
まず、画像入力部1で、認識対象文字パターンを含む画
像を2値画像として入力して文字パターン領域23に記
憶する。
次に、文字切り出し部2で、入力され文字パターン領域
23に記憶された画像から認識対象文字パターンを切り
出す。入力した文字パターンの文字部分、背景部分の画
素値はそれぞれ1、Oである。また、文字部分、背景部
分を構成する画素をそれぞれ黒画素、白画素とよぶ。認
識例題文字パターン「木」を第4図、第5図に示す。
次に、方向コード抽出部3で、認識対象文字パターンの
周辺部分から方向コードを抽出する。文字パターンに外
接する矩形の高さ、幅をそれぞれHlWとするとき、H
,WをそれぞれM、N個に等分割し、MxN個に分割さ
れた文字パターンの各ブロックをサブ文字パターンとよ
ぶことにする。
ここで、等分割したのは説明を簡潔にするためであって
、本発明の本質ではない。文字パターンに外接する矩形
の上辺から下辺に向かって走査するが、このとき走査は
、上辺上に存在する全ての画素から開始するのではなく
、画素((W/2N)・i、O)から開始する。ここで
、i=1.2゜・・・、Nであり、除数部分は小数第1
位を四捨五入、整数化される。上記走査によって、変化
画素を検出した場合、当該変化画素から第6図に示した
4方向に走査して、白画素に出会うまでの黒画素数を計
数し、黒画素数が最大である方向の方向コードを特徴量
とする。ここで、変化画素とは、文字パターンの背景部
分から文字部分に変化する黒画素のことである。変化画
素が存在しない場合には、このことを示すコード、たと
えば0、を特徴量とする。同様にして下辺から上辺、左
辺から右辺、右辺から左辺について、合計2X (M+
N)個の特徴量を抽出する。第4図、第5図の文字パタ
ーンはH=W= 24であるから、ザブ文字パターンの
高さと幅は共に6である。この場合、中心には画素か存
在しないため、サブ文字パターンが左上を原点(1,1
)とする直交座標系上にあるとき、文字パターンに外接
する矩形の上辺から下辺に向かって走査する場合、画素
(3,1)。
画素(9,1)、画素(15,1)、画素(211)の
それぞれから文字部分にぶつかるまで下方向に向かって
走査する。画素(3,1)の場合、背景部分から文字部
分に変化する画素(3,7)において4方向に連続する
黒画素の数を求めると、方向コード1の黒画素の数が2
4であり最も大きいので、最大の黒画素の数をもつ方向
コード、即ち1を特徴量とする。第4図及び第5図の認
識例題文字パターン「木」をM=4、N=4に分割した
場合、抽出されるゴチック体と明朝体の特徴量として方
向コード記憶領域24内のデータは第7図に示すように
全く等しくなり、本方式がマルチフォント文字認識に有
効である。
最後に、文字認識部4で、抽出された認識対象文字パタ
ーンの特徴量と辞書5に格納された特徴量を照合して、
候補文字を決定し、結果を表示部6に表示する。
以上のように本実施例によれば、文字パターンの背景部
分の特徴を方向コードによって表現したことにより、書
体毎の線幅変動に依存しないで、精度良く識別すること
ができる。
発明の効果 本発明は文字パターンの背景部分の特徴を方向コードに
よって表現したことにより、文字の書体にかかわらず、
精度良く文字を識別することのできる文字認識装置を実
現することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識装置の機能
ブロック図、第2図は本実施例の構成を示すブロック図
、第3図(a)、第3図(b)は本実施例における制御
手順を示すフローチャート、第4図はゴチック体の認識
例題文字パターン図、第5図は明朝体の認識例題文字パ
ターン図、第6図は方向と方向コードとの対応図、第7
図は本実施例によって抽出された方向コード領域内の構
成図、第8図は従来の文字認識装置によって抽出された
明朝体の文字の特徴量とゴチック体の文字の特徴量との
対応図である。

Claims (1)

  1. 【特許請求の範囲】 入力された画像から認識対象文字パターンを矩形に切り
    出す文字切り出し部と、 前記文字切り出し部で切り出された矩形の辺から向かい
    合う辺に向かって走査したときに、認識対象文字パター
    ンの背景部分から文字部分に変化する画素を検出し、当
    該画素から所定の複数の方向の各々に連続して存在する
    黒画素の数を計数し、当該黒画素の数が最大である方向
    の方向コードを抽出する方向コード抽出部と、 前記方向コード抽出部によって抽出された方向コードと
    辞書に格納されている方向コードを照合することにより
    、認識候補文字を決定する文字認識部と、 を有することを特徴とする文字認識装置。
JP1007237A 1989-01-13 1989-01-13 文字認識装置 Pending JPH02187884A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1007237A JPH02187884A (ja) 1989-01-13 1989-01-13 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1007237A JPH02187884A (ja) 1989-01-13 1989-01-13 文字認識装置

Publications (1)

Publication Number Publication Date
JPH02187884A true JPH02187884A (ja) 1990-07-24

Family

ID=11660392

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1007237A Pending JPH02187884A (ja) 1989-01-13 1989-01-13 文字認識装置

Country Status (1)

Country Link
JP (1) JPH02187884A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100411431C (zh) * 2006-03-15 2008-08-13 华为技术有限公司 一种视频节目中字幕的显示方法及系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100411431C (zh) * 2006-03-15 2008-08-13 华为技术有限公司 一种视频节目中字幕的显示方法及系统

Similar Documents

Publication Publication Date Title
EP0854434B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US4903312A (en) Character recognition with variable subdivisions of a character region
KR900007009B1 (ko) 문자인식장치
EP0063454A2 (en) Method for recognizing machine encoded characters
US4850026A (en) Chinese multifont recognition system based on accumulable stroke features
JPH02187884A (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JPH02214992A (ja) 文字認識装置
US5754689A (en) Image processing method and apparatus
JP2578767B2 (ja) 画像処理方法
JPH07160810A (ja) 文字認識装置
JPH09134404A (ja) 棒グラフ認識装置
JP2578768B2 (ja) 画像処理方法
JPS63269267A (ja) 文字認識方法
Kim et al. Segmentation of touching characters in printed Korean/English document recognition
KR100286709B1 (ko) 영문자열에서의 개별문자 분리 방법
JP2582611B2 (ja) マルチフオント辞書の作成法
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPS63271588A (ja) 文字認識装置
JPH0215388A (ja) 文字認識装置
JPH03150690A (ja) 文字認識装置
JPH11134439A (ja) 単語認識方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP3127413B2 (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置