JP2586117B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2586117B2
JP2586117B2 JP63189911A JP18991188A JP2586117B2 JP 2586117 B2 JP2586117 B2 JP 2586117B2 JP 63189911 A JP63189911 A JP 63189911A JP 18991188 A JP18991188 A JP 18991188A JP 2586117 B2 JP2586117 B2 JP 2586117B2
Authority
JP
Japan
Prior art keywords
character
storage means
character string
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63189911A
Other languages
English (en)
Other versions
JPH0239388A (ja
Inventor
剛 七野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP63189911A priority Critical patent/JP2586117B2/ja
Publication of JPH0239388A publication Critical patent/JPH0239388A/ja
Application granted granted Critical
Publication of JP2586117B2 publication Critical patent/JP2586117B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は,読み取つた図面のデジタル画像から文字
を認識する文字認識装置に関するものである。
〔従来の技術〕
第6図は例えば情報処理学会第31回全国大会昭和60年
度後期予稿集6N−2「図面中の文字列抽出に関する一方
式」などにみらえる文字認識装置を示す全体構成図であ
る。
図中(1)は図面を読み取つて2値のデジタル画像を
出力する図面入力手段,(2)は図面入力手段(1)に
よつて出力されたデジタル画像を記憶する画像記憶手
段,(15)は画像記憶手段(2)によつて記憶されてい
るデジタル画像を入力し1文字単位の文字の位置を出力
する文字抽出手段,(4)は文字抽出手段(15)によつ
て出力された文字の位置を記憶する文字情報記憶手段,
(16)は文字情報記憶手段(4)によつて記憶されてい
る文字の位置情報を入力し文字列を構成する文字を文字
列情報として出力する文字列抽出手段,(8)は文字列
抽出手段(16)によつて出力された文字列情報を記憶す
る文字列情報記憶手段,(9)は画像記憶手段(2)に
記憶されているデジタル画像と文字情報記憶手段(4)
によつて記憶されている文字の位置の情報を入力し文字
画像を出力する文字画像切り出し手段,(10)は文字画
像切り出し手段(9)によつて出力された文字画像を記
憶する文字画像記憶手段,(11)は文字画像記憶手段
(10)に記憶されている文字画像を認識し文字コードを
出力する文字認識手段,(12)は文字認識手段(11)に
よつて出力された文字コードを記憶する文字記憶手段,
(13)は文字列情報記憶手段(8)によつて記憶されて
いる文字列情報及び文字記憶手段(12)によつて記憶さ
れている文字コードを入力し,誤つている文字コードを
修正する認識結果修正手段,(14)は認識結果修正手段
(13)によつて修正された文字コードを記憶する修正結
果記憶手段である。
次に動作について説明する。
まず読み取り対象となる入力文字列として,より確実
な結果を得るために通常以下のような条件を課す。
(a) 文字列はx軸・y軸の正方向に書かれる。
(b) 文字のゆらぎは前後の文字幅以下である。
(c) 文字間隔は一定値以下である。
(d) 文字列間隔は一定値以上である。
(e) 文字列を矩形領域で囲んだ場合他の文字列の矩
形領域と交わらない。
これら一定の条件のもとに配列された読み取り対象の
記入された図面を画像入力手段(1)により入力する
と,白画素と黒画素から成る2値のデジタル画像として
画像記憶手段(2)に格納される。文字抽出手段(15)
では,このデジタル画像を入力し,文字を構成する図形
要素の互いの位置関係が前述の(b)と(c)のような
条件を満たす時1個の文字を構成する図形要素と判定
し,それらの図形要素を囲む外接長方形の位置を文字の
位置として文字情報記憶手段(4)に出力する。文字列
抽出手段(16)では文字情報記憶手段(4)から文字の
位置情報を入力し,文字を囲む外接長方形の互いの位置
関係が前述の(a),(b),(e)のような条件を満
たす時1組の文字列であると判定し,文字列毎に文字抽
出手段(15)で抽出した文字へのポインターを文字列情
報として文字列情報記憶手段(8)に出力する。文字画
像切り出し手段(9)では,画像情報記憶手段(2)か
らデジタル画像と文字情報記憶手段(4)から文字の位
置情報を入力し,それがあらわす文字を囲む外接長方形
の内部の画像を文字画像記憶手段(10)に出力する。文
字認識手段(11)では,文字画像記憶手段(10)より文
字画像を入力し,1個の文字に対して文字認識の候補とし
てn個の文字コードを優先順位をつけて,文字記憶手段
(12)に出力する。認識結果修正手段(13)では,文字
列情報記憶手段(8)及び文字記憶手段(12)から文字
列を構成する文字の文字コードを入力し,文字列として
正しくない場合は,文字コードを優先順位により修正し
て修正結果記憶手段(14)に出力する。なお,文字列と
しての正しさの判定は,単語辞書との比較により行う。
〔発明が解決しようとする課題〕
従来の文字認識装置は以上のように構成されているの
で,誤つて文字の抽出が行なわれた場合,正しい文字の
認識結果が得られない。また,誤つて文字列の抽出が行
なわれた場合,正しい認識結果修正処理が行なわれない
などの解決すべき課題があつた。
また,文字や文字列の認識率を高めるため,読み取り
対象となる入力文字や文字列に制限が加えられ,任意の
位置の任意のサイズのかつ任意の連結の文字列を認識す
ることができなかつた。
この発明は,上記のような課題を解決するためになさ
れたもので,文字の抽出及び文字列の抽出における誤り
をなくし,任意な位置の任意なサイズの文字で構成され
た,任意に連結された文字列の認識ができる装置を得る
ことを目的とする。
〔課題を解決するための手段〕
この発明に係る文字認識装置は,文字とともにこれと
付随する特定記号を入力し,このデジタル画像から文字
の位置とサイズと文字列を検出し記憶するようにしたも
のである。
〔作用〕
この発明における文字認識装置は,文字とともに入力
した特定記号のデジタル画像の座標位置を文字の位置と
し,この特定記号のデジタル画像の形状から文字のサイ
ズを決定し,この特定記号のデジタル画像の中で文字の
連結を示すものから文字列を検出する。この特定記号に
より,文字の位置・サイズが自由に変えられ,かつ文字
列の方向も自由になる。
〔発明の実施例〕
以下,この発明の一実施例を図によつて説明する。
第1図は,この発明の一実施例を示す全体構成図であ
り,図中(1)は画面入力手段,(2)は画像記憶手
段,(4)は文字情報記憶手段,(8)は文字列情報記
憶手段,(9)は文字画像切り出し手段,(10)は文字
画像記憶手段,(11)は文字認識手段,(12)は文字記
憶手段,(13)は認識結果修正手段,(14)は修正結果
記憶手段であり,これらは第6図に示した従来のものと
同様のものである。(3)は画像記憶手段(2)によつ
て記憶されている白画素と黒画素から成るデジタル画像
を入力し,デジタル画像中の特定記号を検出し,文字の
位置を出力する文字位置検出手段,(5)は文字位置検
出手段(3)で検出された特定記号より文字のサイズを
求め出力する文字サイズ検出手段,(6)は文字サイズ
検出手段(5)が出力した文字のサイズを記憶する文字
サイズ記憶手段,(7)は画像記憶手段(2)によつて
記憶されているデジタル画像を入力し,デジタル画像中
の特定記号より文字列であることを示す情報を出力する
文字列検出手段である。
次に,上記第1図に示すこの発明の一実施例である文
字認識装置の説明を第2図から第5図を用いて行う。
第2図は読み取り対象となる文字が描かれた図面,第
3図は第2図に対応した特定記号を示す図である。第3
図の例では,文字の位置及び文字のサイズを表す文字枠
記号として,文字サイズを一辺の長さとする正方形を,
また,この正方形を結びつけた線を,文字列の連結を示
す連結記号として用いている。これら文字枠記号、連結
記号か特定記号が形成される。
第2図及び第3図の様な図面を画像入力手段(1)に
より入力すると白画素と黒画素からなる2値のデジタル
画像として画像記憶手段(2)に格納される。第4図
は,第3図に対応するデジタル画像の一部を拡大して示
したものである。
文字位置検出手段(3)では,画像記憶手段(2)に
記憶されている第3図のデジタル画像から,まず,上下
左右の4方向に互いに連続している白画素,すなわち4
連結状態にある白画素を1組にまとめた白画素領域を求
め,その縦及び横のサイズがある大きさの範囲に入ると
き,文字の位置及び文字のサイズをあらわす特定記号に
対応する白画素領域として検出する。
次に,検出した白画素領域の外接長方形を求め,その
位置を文字の位置として文字情報記憶手段(4)に出力
する。第5図に,第4図から検出した白画素領域を斜線
のパターンで示す。また,出力する文字の位置情報は,
第5図に示した×印の座標値である。なお文字位置検出
手段(3)が白画素領域を検出した順番は,文字位置情
報のポインタとして使われ,かつ後の工程でも,当該文
字や白画素領域の参照ポインタとして使われる。
文字サイズ検出手段(5)では,文字情報記憶手段
(4)に記憶されている文字の位置情報を入力し,文字
のサイズを算出して文字サイズ記憶手段(6)に出力す
る。ここで文字サイズ算出の方法を説明する。文字の位
置情報は,文字位置検出手段(3)で検出した白画素領
域における外接長方形の左下及び右上の座標値である。
この外接長方形は,特定記号にほぼ一致するため,外接
長方形の二辺の長さを算出すればこれを文字のサイズと
して用いることができる。本例の場合は,特定記号を正
方形としているので一辺の算出のみで文字のサイズが判
定できる。
文字列検出手段(7)では,画像記憶手段(2)に記
憶されているデジタル画像から,まず上下左右および45
゜方向の8方向に互いに連続している黒画素,すなわち
8連結状態にある黒画素を1組にまとめた黒画素領域を
求める。すなわち、2つの正方形を結ぶ線によって、連
結された状態にある黒画素の領域が求められる。次に求
めた黒画素領域に含まれる白画素領域を,文字列を構成
する白画素領域と判断し、その連結順を、文字列である
ことを示す情報として検出し、文字列情報記憶手段
(8)に出力する。ここで連結順として出力されるの
は,前述した白画素領域の参照ポインタであり,同一ポ
インタが文字情報記憶手段(4)に書きこまれた文字位
置情報の参照にも使われている。
次に,文字画像切り出し手段(9)では,画像記憶手
段(2)に記憶されているデジタル画像と,文字情報記
憶手段(4)から文字の位置情報を入力し,白画素領域
内の画像を文字画像記憶手段(10)に出力する。
文字認識手段(11)では,文字サイズ記憶手段(6)
から文字のサイズを,文字画像記憶手段(10)より文字
画像をそれぞれ入力し,1個の文字に対して文字認識の候
補としてn個の文字コードを優先順位を付けて,文字記
憶手段(12)に出力する。
認識結果修正手段(13)では,文字列情報記憶手段
(8)及び文字記憶手段(12)から文字列を構成する文
字の文字コードを入力し,文字列として正しくない場合
は文字コードを優先順位により修正して修正結果記憶手
段(14)に出力する。なお,文字列としての正しさの判
定は,単語辞書との比較により行う。
なお上記実施例では,特定記号として正方形の場合を
示したが,文字の位置とサイズが特定できればどのよう
な記号でもよく長方形や でもよい。
また,上記実施例で示した正方形を結んだ線は各文字
が文字列として結ばれていることが判定できる記号であ
ればどのようなものでもよく,文字列の次の文字を指す
矢印マークでもよい。
また,上記実施例では,文字が縦横の正方向に置かれ
た場合を示したが,文字が回転して置かれても,特定記
号により文字の傾きは容易に求めることができ,この傾
き情報を用いることにより文字が傾斜していても認識で
きる。
また,上記実施例では,同一文字列内での文字サイズ
は同一の場合を図示したが,同一文字列内にサイズが異
なる文字があつても,特定記号によりサイズが判定でき
るため認識できる。
なお,特定記号の入力は,読み取り対象と同時入力し
ても,また別々に入力しても本発明の効果は失われな
い。また,認識できるのは文字のみに限らず,コード化
され登録されたものならどのような符号パターンでもよ
い。
〔発明の効果〕
以上のように,この発明によれば,特定記号により文
字の位置,サイズ,文字列を決定できるので,各文字が
任意の位置に,任意のサイズで,任意の方向に離れて存
在していても文字列として正確に認識できる効果があ
る。また特定記号が付随しないものは認識しないため,
入力画像に文字以外の図形が混在していても無視される
ため問題を起こさないという効果もある。
【図面の簡単な説明】
第1図はこの発明の一実施例を示す全体構成図,第2図
ないし第5図は第1図の文字認識装置の説明を助けるた
めの図で,第2図は読み取り対象となる文字が描かれた
図面,第3図は第2図に対応した特定記号を示す図,第
4図は第3図に対応するデジタル画像の一部を拡大して
示した説明図,第5図は第4図から得られる白画素領域
と文字の位置情報を示す説明図,第6図は従来の文字認
識装置を示す全体構成図である。 図において,(1)は図面入力手段,(2)は画像記憶
手段,(3)は文字位置検出手段,(4)は文字情報記
憶手段,(5)は文字サイズ検出手段,(6)は文字サ
イズ記憶手段,(7)は文字列検出手段,(8)は文字
列情報記憶手段,(9)は文字画像切り出し手段,(1
0)は文字画像記憶手段,(11)は文字認識手段,(1
2)は文字記憶手段,(13)は認識結果修正手段,(1
4)は修正結果記憶手段,(15)は文字抽出手段,(1
6)は文字列抽出手段である。 なお,図中同一符号は同一または相当部分を示す。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】読み取った図面のデジタル画像から文字を
    認識する文字認識装置において、 上記デジタル画像における文字の文字位置および文字サ
    イズを示す文字枠記号とこの各文字枠記号を結びつける
    連結記号からなる特定記号を記憶する画像記憶手段と、
    この画像記憶手段に記憶された上記特定記号の上記文字
    枠記号から文字位置を検出する文字位置検出手段と、上
    記画像記憶手段に記憶された上記特定記号の上記文字枠
    記号から文字サイズを検出する文字サイズ検出手段と、
    このサイズ検出手段および上記文字位置検出手段で検出
    された文字サイズおよび文字位置に基づき文字認識処理
    を行って文字コードを出力する文字認識手段と、上記画
    像記憶手段に記憶された上記特定記号の上記連結記号か
    ら各文字が文字列であることを示す文字列情報を検出す
    る文字列検出手段と、この文字列検出手段で検出された
    文字列情報に基づき、上記文字認識手段から出力された
    文字コードを文字列として入力し、文字列としての認識
    を行う認識結果修正手段とを備えたことを特徴とする文
    字認識装置。
JP63189911A 1988-07-29 1988-07-29 文字認識装置 Expired - Lifetime JP2586117B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63189911A JP2586117B2 (ja) 1988-07-29 1988-07-29 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63189911A JP2586117B2 (ja) 1988-07-29 1988-07-29 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0239388A JPH0239388A (ja) 1990-02-08
JP2586117B2 true JP2586117B2 (ja) 1997-02-26

Family

ID=16249272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63189911A Expired - Lifetime JP2586117B2 (ja) 1988-07-29 1988-07-29 文字認識装置

Country Status (1)

Country Link
JP (1) JP2586117B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69132789T2 (de) * 1990-05-14 2002-05-23 Canon Kk Verfahren und Gerät zur Bildverarbeitung

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5762464A (en) * 1980-10-02 1982-04-15 Fujitsu Ltd Format input system

Also Published As

Publication number Publication date
JPH0239388A (ja) 1990-02-08

Similar Documents

Publication Publication Date Title
US5617481A (en) Address reading apparatus and address printing apparatus using mail address position mark
JP3302147B2 (ja) 文書画像処理方法
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JPH0721310A (ja) 文書認識装置
JP2586117B2 (ja) 文字認識装置
JPH06208625A (ja) 画像処理方法及び装置
JPS6245581B2 (ja)
JPH06187489A (ja) 文字認識装置
JP7043667B1 (ja) 情報処理装置、プログラム、及び情報処理方法
JPH0916713A (ja) 画像領域分割方法
JPS63308689A (ja) 文字の傾き角度検出修正方式
KR930012142B1 (ko) 문서인식장치의 개별문자 절출방법
JPH0697470B2 (ja) 文字列抽出装置
KR20220168787A (ko) 만주어의 글자 추출 방법 및 이를 수행하는 시스템
JPH0586585B2 (ja)
JPH04311283A (ja) 行方向判定装置
JP2890307B2 (ja) 表領域分離装置
JPS6252911B2 (ja)
JPS63204486A (ja) 文字入力装置
JPH08212292A (ja) 枠線認識装置
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JP2679098B2 (ja) 輪郭検出画像の符号化処理装置
JPH0434793B2 (ja)
JP2004013188A (ja) 帳票読取り装置および帳票読取り方法ならびプログラム