JPH0664628B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0664628B2
JPH0664628B2 JP60106404A JP10640485A JPH0664628B2 JP H0664628 B2 JPH0664628 B2 JP H0664628B2 JP 60106404 A JP60106404 A JP 60106404A JP 10640485 A JP10640485 A JP 10640485A JP H0664628 B2 JPH0664628 B2 JP H0664628B2
Authority
JP
Japan
Prior art keywords
character string
character
recognition
unit
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60106404A
Other languages
English (en)
Other versions
JPS61262984A (ja
Inventor
磨理子 竹之内
正博 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60106404A priority Critical patent/JPH0664628B2/ja
Publication of JPS61262984A publication Critical patent/JPS61262984A/ja
Publication of JPH0664628B2 publication Critical patent/JPH0664628B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は新聞、雑誌などの活字および手書き文字を認識
し、たとえばJISコード等の情報量に変換する文字認識
装置に関するものである。
従来の技術 従来の文字認識装置では、文字列の傾き,文字列間隔,
文字間隔などの書式が明確な文書を対象に文字認識を行
ってきた。このことは、文字認識装置が対象とする文書
に制限を与えており、この問題を解決するために、入力
画像から文字列の傾き(回転角θ)を検出し、傾き補正
を行うことにより書式が未知の文書に対しても安定した
文字切り出しを行う方法がとられていた(例えば、長谷
・星野“印刷文字列の周期的特徴”信学論(D),J65−
D,2,pp.298〜299、秋山・増田“書式指定情報によらな
い紙面構成要素抽出法”信学論(D),J66−D,1,pp111
〜118電気通信学会発行)。また、文字列に傾きのない
文書画像については、第8図(a)に示すように、入力
画像全体に対して文字列方向に走査して文字部を形成す
る画素のヒストグラフHaを求めて、ヒストグラムの値が
N画素以上である文字列部の開始位置siと終了位置niを
検出して文字列を抽出していた。
発明が解決しようとする問題点 しかしながら、入力画像の文字列の傾きを検出し傾き補
正を行うことにより文字切り出しを行う従来の技術で
は、傾き補正に多大な計算量を必要とし処理に時間がか
かる。また、第8図(b)に示すように、傾いて入力さ
れた文字画像については、入力画像全体に対して文字部
のヒストグラムを求めるとHa′となり、文字列が抽出で
きない。
本発明はかかる点に鑑みてなされたものであり、傾いて
入力された文書画像に対しても、簡易な方法で入力画像
の文字列を検出し、入力画像の傾き補正を行うことなく
高速に文字を切り出すことができる文字認識装置を提供
することを目的としている。
問題点を解決するための手段 本発明の文字認識装置は、認識対象文字を含む画像を入
力する画像入力部と、前記画像入力部で入力された画像
を、縦書き文書の場合は縦、横書き文書の場合は横であ
る文字列方向にM画素単位のブロックに区切り、各ブロ
ックを文字列方向に走査して文字部を形成する画素のヒ
ストグラムを求め、ヒストグラムの値がN画素以上であ
る文字列部の、文字列方向と垂直方向の開始位置と終了
位置を検出し、隣り合うブロックの文字列部間で、少な
くとも siBk≦ejB(k+1) でかつ eiBk≧sjB(k+1) 〔但し、si,sjは文字列部の開始位置、ei,ejは文字列部
の終了位置、Bk,B(k+1)は隣り合うブロックで、si
BkはBkブロックのi番目の文字列部の開始位置を示
す。〕 が成立する場合は、隣り合うブロックの文字列部が連結
状態であると判断して 同一文字列として文字列を抽出する文字列抽出部と、文
字列から認識対象文字を切り出す文字切り出し部と、認
識対象文字を辞書と照合して認識候補文字を抽出する認
識部とを設けたことを特徴とする。
作用 この構成によると、入力画像を文字列の方向にブロック
に区切り、各ブロックを文字列方向に走査して文字部を
形成する画素のヒストグラムを求め、ヒストグラムから
文字列部を検出し、各ブロック間の文字列部の連結状態
を調べることにより、容易に文字列を抽出して認識対象
文字を切り出し、認識候補文字を抽出することができ、
傾いて入力された文書画像に対して傾き補正を行うこと
なく高速に文字列を抽出して認識対象文字を切り出し認
識できる。
実施例 以下、本発明の一実施例を第1図〜第7図に基づいて説
明する。
第1図は本発明の文字認識装置を示す。1は画像入力部
で、認識対象文字を含む画像を走査して2値信号で画像
を入力し画像メモリ2に格納する。3は文字列方向設定
部で、入力画像の縦書き・横書きをオペレータ設定す
る。4は文字列抽出部で、文字列方向設定部3で設定し
た文字列方向を用いて画像メモリ2を走査して文字列を
抽出する。5は文字切り出し部で、文字列方向設定部3
で設定した文字列方向を用いて文字列抽出部4で抽出し
た文字列から認識対象文字を切り出す。6は認識部で、
文字切り出し部5で切り出した認識対象文字の特徴量を
求め、あらかじめ辞書7に登録されている文字の特徴量
と照合し、その内の最も似た文字を認識候補文字として
表示部8に表示する。
このように構成された文字認識装置の動作を、第2図に
示す入力画像Pを例に挙げて詳細に説明する。
画像入力部1から入力された画像Pは文字部を“1"、白
部を“0"の2値データで画像メモリ2に蓄えられる。文
字列抽出部4では画像メモリ2を走査して文字列を抽出
する。入力画像Pを文字列方向設定部3で設定された文
字列方向の横方向にm画素ずつのブロックに分けると、
B1・B2・B3の3ブロックとなる。ブロックB1を文字列方
向である横方向に走査して、文字部を形成する画素のヒ
ストグラムHbB1を求めると第3図に示すようになる。ヒ
ストグラムHbB1から、1画素以上の値をもつ文字列部の
開始アドレスs1B1・s2B1…siB1…および文字列部の終了
アドレスe1B1・e2B1…eiB1…を求める。ここで、文字列
部の開始,終了アドレスは、入力画像の上端を0,下方を
正とするY座標値である。同様にしてブロックB2・B3に
ついても、文字部を形成する画素のヒストグラムを求め
文字列部の開始アドレスおよび終了アドレスを求めると
第4図に示すようになる。図中のNo.は文字列部の出現
順序を表わす。これらの文字列部の開始アドレスおよび
終了アドレスから、ブロック毎に求めた文字列部の隣り
合うブロック間の連結状態を調べる。下記第1式と第2
式が成立すれば、隣合うブロックの文字列部が連結状態
であることを示す。
siBk≦ejB(k+1) ……… eiBk≧sjB(k+1) ……… ここでBkはブロック、si,sjは文字列開始アドレス、ei,
ejは文字列部終了アドレスを示す。隣り合うブロックB1
とブロックB2(k=1)について、ブロックB1のNo.1の
文字列部(i=1)にL1の文字列番号を付し、ブロック
B2のNo.1の文字列部(j=1)との連結状態を第1式と
第2式に照らして調べると、 s1B1≦e1B2,e1B1≧s1B2 となり連結状態であるので、ブロックB2のNo.1の文字列
部にもL1の文字列番号を付け、次に、ブロックB2のNo.2
の文字列部(j=2)との連結状態を調べると、 s1B1≦e2B2,e1B1<s2B2 となり連結状態でない。全てのjについてブロックB1の
No.1の文字列部との連結状態を調べ、連結状態であれば
文字列番号L1付ける。次に、ブロックB1のNo.2の文字列
部(i=2)にL2の文字列番号を付し、全てのjについ
て連結状態を調べて文字列番号を付す。全てのiについ
て同様の処理を行うと、次の隣り合うブロックB2とB3
(k=2)の処理に移る。全てのi・j・kについて第
1式と第2式の条件を調べ隣り合うブロックの文字列部
の連結状態を求めると第5図に示すようになり、図中の
L1・L2…Ld…の文字列番号で表わされる文字列が抽出さ
れる。文字切り出し部5には抽出された文字列が順次入
力される。第6図に抽出された第1番目の文字列L1を示
す。文字列L1は、文字列抽出部4で求めた文字列部開始
アドレスs1B1・s1B2・s1B3および文字列部終了アドレス
e1B1・e1B2・e1B3で囲まれている。抽出した文字列L1を
射影してヒストグラムH1を求めると第6図に示すように
なる。ヒストグラムH1か1字1字の横方向のアドレス
(Cs1,Ce1)…(Cs1,Ce1)…を求め、認識対象文字を
1字ずつ切り出す。認識部6には切り出された認識対象
文字の矩形Rが順次入力される。第7図(a)に切り出
された認識対象文字『松』を示す。切り出した『松』の
各画素について、第7図(b)の矢印が示す方向に着目
画素を含んでq個以上(qはあらかじめ設定)連ってい
るか否かを調べ方向コードを設定する。方向コード毎に
各画素の連結性を調べてストロークを抽出し、ストロー
クの数・位置・長さ等の特徴量を抽出する。第7図
(a)に『松』のスローク抽出結果を示す。抽出した特
徴量を辞書7にあらかじめ登録されている文字の特徴量
と照合し、最も似た文字「松」を認識候補文字として表
示部8に表示する。
本実施例によると、第9図(a)〜(c)に示すように
第8図(b)の画像についても、入力画像をm画素単位
のブロックに区切って文字部を形成する画素のヒストグ
ラムを求めると、各ブロックにおける文字列部が抽出で
きるので、隣り合うブロック間の文字列部の連結状態を
調べて文字列を抽出することができる。
発明の効果 以上のように本発明によると、画像入力部と文字列抽出
部と文字切り出し部および認識部を設け、入力画像を文
字列の方向にM画素単位のブロックに区切り、各ブロッ
クを文字列方向に走査して文字部を形成する画素のヒス
トグラムを求め、ヒストグラムから求めた文字列部の開
始アドレスと終了アドレスを用いて、各ブロックの文字
列部の連結状態を調べ高速に入力画像の文字列を抽出す
るよう構成したため、傾いて入力された文書画像に対し
て、入力画像の角度補正等の多大な計算処理を行うこと
なく認識対象文字を切り出し認識することができるもの
である。
【図面の簡単な説明】
第1図は本発明の文字認識装置の一実施例の構成図、第
2図は入力画像および入力画像のブロック分割説明図、
第3図はブロックにおける文字列部抽出の説明図、第4
図は各ブロックの文字列部の開始アドレスと終了アドレ
スの抽出結果の説明図、第5図は文字列の抽出結果の説
明図、第6図は文字列から認識対象文字を切り出す方法
の説明図、第7図は文字認識の説明図、第8図は従来の
文字認識装置の動作の説明図、第9図は傾いて入力され
た画像に対する実施例の動作の説明図である。 1……画像入力部、2……画像メモリ、3……文字列方
向設定部、4……文字列抽出部、5……文字切り出し
部、6……認識部、7……辞書、8……表示部。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象文字を含む画像を入力する画像入
    力部と、前記画像入力部で入力された画像を、縦書き文
    書の場合は縦、横書き文書の場合は横である文字列方向
    にM画素単位のブロックに区切り、各ブロックを文字列
    方向に走査して文字部を形成する画素のヒストグラムを
    求め、ヒストグラムの値がN画素以上である文字列部の
    文字列方向と垂直方向の開始位置と終了位置を検出し、
    隣り合うブロックの文字列部間で、少なくとも siBk≦ejB(k+1) でかつ eiBk≧sjB(k+1) 〔但し、si,sjは文字列部の開始位置、ei,ejは文字列部
    の終了位置、Bk,B(k+1)は隣り合うブロックで、si
    BkはBkブロックのi番目の文字列部の開始位置を示
    す。〕 が成立する場合は、隣り合うブロックの文字列部が連結
    状態であると判断して同一文字列として文字列を抽出す
    る文字列抽出部と、文字列から認識対象文字を切り出す
    文字切り出し部と、認識対象文字を辞書と照合して認識
    候補文字を抽出する認識部とを設けた文字認識装置。
JP60106404A 1985-05-17 1985-05-17 文字認識装置 Expired - Lifetime JPH0664628B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60106404A JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60106404A JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Publications (2)

Publication Number Publication Date
JPS61262984A JPS61262984A (ja) 1986-11-20
JPH0664628B2 true JPH0664628B2 (ja) 1994-08-22

Family

ID=14432742

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60106404A Expired - Lifetime JPH0664628B2 (ja) 1985-05-17 1985-05-17 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0664628B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2590859B2 (ja) * 1987-02-12 1997-03-12 日本電気株式会社 情報処理装置における通信処理のメモリ管理方式

Also Published As

Publication number Publication date
JPS61262984A (ja) 1986-11-20

Similar Documents

Publication Publication Date Title
US4562594A (en) Method and apparatus for segmenting character images
JP2713622B2 (ja) 表形式文書読取装置
US5265171A (en) Optical character reading apparatus for performing spelling check
JPH01253077A (ja) 文字列検出方法
JPH0564834B2 (ja)
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JPH0664628B2 (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JPH0576671B2 (ja)
JPS62219087A (ja) 文字認識装置
JPH083829B2 (ja) 文字認識方法
JPS6219990A (ja) 文字認識装置
JPS6343788B2 (ja)
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH01137385A (ja) 文字認識装置
JPH0436432B2 (ja)
JPH07107700B2 (ja) 文字認識装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP2903599B2 (ja) 文字認識装置
KR940009749B1 (ko) 글자 분할 방법
JPH0782525B2 (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term