JP2933947B2 - 画像処理方法及び装置 - Google Patents

画像処理方法及び装置

Info

Publication number
JP2933947B2
JP2933947B2 JP1156737A JP15673789A JP2933947B2 JP 2933947 B2 JP2933947 B2 JP 2933947B2 JP 1156737 A JP1156737 A JP 1156737A JP 15673789 A JP15673789 A JP 15673789A JP 2933947 B2 JP2933947 B2 JP 2933947B2
Authority
JP
Japan
Prior art keywords
character
line
image
document
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP1156737A
Other languages
English (en)
Other versions
JPH0324681A (ja
Inventor
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1156737A priority Critical patent/JP2933947B2/ja
Publication of JPH0324681A publication Critical patent/JPH0324681A/ja
Application granted granted Critical
Publication of JP2933947B2 publication Critical patent/JP2933947B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字列から文字の切り出しを行なうための画
像処理方法及び装置に関するものである。
[従来の技術] 従来より文字認識処理を行うに際して文字の切り出し
が行われている。従来のこの種の装置においては、横書
き(また、縦書き)文字では横(または、縦)方向の射
影を取り出して行の切出しを行い、この後に、各行に対
して縦(または、横)方向の射影を取り出して文字の切
出しを行つている。
その一例を第5図(a),(b)を用いて説明する。
まず、同図中、は行の長さ、h′は行間隔、xは行
方向射影の傾き限界角、hは文字の高さ、′は文字間
隔、yは文字高さ方向の傾き限界角を示し、上記記号に
より、x,yは以下の式が成り立つ。すなわち、 となる。
[発明が解決しようとしている課題] しかしながら、上記従来例では、斜行した文字切出し
を行つた場合、第5図(a),(b)に示されるよう
に、行の長さ()と行間(h′)との比:h′は文字
の高さhと文字間′との比h:′に対して非常に大き
いため、行の射影を取る限界角度xは文字間の射影の限
界角yに対して非常に小さいため、原稿中の傾きの小さ
い文字列しか文字の切出しが行えないという欠点があ
る。また、このように文字が斜行している場合に対応す
るために、その斜行の角度等を示す斜行情報を与えて射
影を取る角度を制御する方法も考えられるが、別途斜行
情報を入力する必要が生じ、操作性が悪くなる。
本発明は上記従来技術の問題に鑑みてなされたもので
あり、その目的とするところは、斜行した文字列の画像
を入力した場合にも、画像の傾きを自動的に判別し、確
実かつ高速に文字の切り出しを行なえる画像処理方法及
び装置を提供することにある。
[課題を解決するための手段] 上述した目的を達成するための本発明の画像処理方法
は、 原稿画像を表す画像データを所定方向に分割し、 前記分割された領域毎に、行方向に画像の射影をとる
ことにより前記原稿の各文字行を順次抽出し、 前記抽出された文字行のうちの注目する文字行につい
て、当該画像データの基軸に対する当該文字行の傾きを
求め、 前記注目する文字行から求めた傾きを軸として、前記
順次抽出された各文字行毎に前記軸に対して垂直方向の
射影をとることにより、当該原稿に含まれる全文字切り
出しを行なう。
また、好ましくは、前記画像の分割は、文字行に対し
て垂直方向での分割とする。
また、上述した目的を達成する本発明の画像処理方法
は、 原稿画像を表す画像データを所定方向に分割する画像
分割手段と、 前記分割された領域毎に、行方向に画像の射影をとる
ことにより前記原稿の各文字行を順次抽出する行抽出手
段と、 前記抽出された文字行のうちの注目する文字行につい
て、前記画像データの基軸に対する当該文字行の傾きを
求める傾き導出手段と、 前記注目する文字行から求めた傾きを軸として、前記
順次抽出された各文字行毎に前記軸に対して垂直方向の
射影をとることにより、当該原稿に含まれる全文字切り
出しを行なう文字切り出し手段とを備える。
[作用] かかる構成によれば、原稿内の注目する行から判断し
た行の傾きを軸とし、当該原稿内の各文字行毎にその軸
に対して垂直方向に射影をとって文字の切り出しが行わ
れる。このため、傾斜が大きい場合にも切り出された文
字画像の中から文字を切り出す処理を確実に行うことが
できる。また、注目する行の傾きを当該原稿内の各文字
行に対して流用するので、各文字行毎に傾きの導出を行
う必要がなく、処理の効率化が図られる。
[実施例] 以下、添付図面を参照して、本発明に係わる好適な実
施例を詳細に説明する。
第1図は本実施例の文字認識装置の構成を説明するブ
ロック図である。同図において、1は本実施例の文字認
識装置を示し、20は本装置1に原稿から光学的に読取つ
た画像データを送出する読取装置を示し、30は本装置1
で文字認識された認識結果を入力して表示する表示装置
を示している。尚、認識結果の出力先は、表示装置30に
代わり、パーソナルコンピュータとしても良い。
本装置1内において、2は読取装置20からドツトデー
タを入力する入力部を示し、8は表示装置30に認識結
果、即ち、データを出力する出力部を示している。3は
原稿の読取りや文字の認識結果の表示等を指示する操作
を行うための操作部を示している。4は読み取られた画
像データから文字の切出しが行われた領域の文字認識を
行う文字認識部を示し、5は本装置1全体の動作をROM6
中の各種プログラムを用いて制御するCPUを示し、6は
制御プログラム,エラー処理プログラム,第2図に示さ
れるフローチャートのプログラム等を格納しているROM
を示している。7は上記各種プログラムのワークエリア
及びエラー処理時の一時退避エリアとして用いるRAMを
示している。そして、9は本装置1内のデータ,アドレ
ス信号,制御信号を伝送するバスラインを示している。
次に、本実施例の動作について説明する。
第2図は本実施例の文字認識動作を説明するフローチ
ャートであり、第3図は1文字分の領域を切出すまでの
過程を説明する図である。
まず、読取装置20で読取られた原稿画像の画像データ
は入力部2を介して入力された後に、RAM7に格納される
(ステツプS1)。そして、第3図の第1工程(I)に示
されるように画像データに対して行方向にA〜Dの4等
分に区分される(ステツプS2)。第3図によれば、真中
の文字行を文字切出しの対象の文字行としている。その
対象の文字行の画像データの存在を確認するため、副走
査方向を分割する走査ライン(同図中、No.1〜12までの
ラインナンバが割り付けられている)によつて各区分毎
に画像データが存在する走査ラインNo.が第3図の第2
工程(II)の如く、調べられる。このようにして、第3
図の第2工程(II)に示される如く、4等分に区分され
た各対象文字列の画像データは、区分Aには第6ライン
目から第12ライン目、区分Bには第4ライン目から第10
ライン目、区分Cには第3ライン目から第10ライン目、
そして、区分Dには第2ライン目から第8ライン目まで
の間に存在していることが確認される。
この後に、対象の文字行以外の文字行の画像データが
取り除かれて、第3図中の第3工程(III)に示される
如く、対象文字行は各区分での射影領域、即ち、領域A,
B,C,Dとして抽出される(ステツプS3)。まず、領域A
が抽出され(ステツプS4))、第3図中の第3工程(II
I)に示される如く、文字行の高さ方向の射影が求めら
れる(ステツプS5)。このステツプS4とステツプS5の処
理は、領域A〜Dまで繰り返し行われる(ステツプS
6)。
次に、文字の切出しが行われるが、例えば、第3図中
の第4工程(IV)に示される如く、領域Aと領域Bとに
またがる文字「じ」のような場合には、領域Aに属する
第3図(IV)のS1で示される射影と領域Bに属するS2で
示される射影が連続することから夫々の射影に対応する
画像データのC1,C2で示される文字領域が結合され、こ
れによつて文字の高さh及び文字の幅Wが決定され、そ
の文字の高さhと文字の幅Wとで形成される矩形領域
(文字)が1文字分として切出される(ステツプS7)。
そして、切出された文字の文字認識が行われ(ステツプ
S8)、その認識結果は表示部30へ送られる(ステツプS
9)。このようにして、現在対象としている文字行から
文字の切出しがステツプS7〜ステツプS9の間で繰り返し
行われる(ステツプS10)。さらに、原稿画像中のすべ
ての文字列の文字認識が終了するまでステツプS3〜ステ
ツプS10の処理が繰り返し行われる(ステツプS11)。
以上説明したように、本実施例によれば、斜行した文
字列に対しても確実に文字の切出しが行える。
さて、上述した実施例では、行方向(主走査方向)と
高さ方向(副走査方向)との射影を求めることによつて
文字の切出しを行つているが、本発明はこれに限定され
るものではなく、上述実施例の変形例として、特に文字
列の傾きが大きい場合に最適な文字列の傾きを求めて文
字の切出しを行う方法を用いても良い。以下に、その変
形例について説明する。
第4図は変形例を説明する図である。
この変形例では、第4図に示される如く、上述実施例
と同様に読取られた原稿画像の画像データがA〜Dの等
分に区分され、行方向の射影よつて、認識対象の文字列
が決まると、次に、文字列の傾きxが算出される。この
傾きxの算出の方法は、周知の技術のため、説明を省略
する。
そして、傾きxに基づいて、第4図の如く、領域A〜
Dの文字の高さ方向の射影が取られ、上述した実施例と
同様に連続する射影においては、夫々の射影に対応する
文字領域から1つの矩形領域が決定され、その矩形領域
を切出して文字認識が実施される。
この変形例によれば、隣り合う文字間で高さ方向の射
影が重なつてしまうほどの文字列の傾きがあつても、適
確に文字の切出しを実施できる。
この変形例において、各領域での文字列が一定の傾き
を有しているのであれば、文字列毎に傾きを調べる必要
はなく、第1行目の文字列で算出された傾きで全文字列
から文字の切出しを行えば良い。
[発明の効果] 以上説明したように、本発明によれば、原稿内の注目
する行から判断した行の傾きを、他の文字行でも活用し
て、その傾きの軸に対して垂直方向に射影をとることに
より文字の切り出しを行うので、傾斜が大きい場合にも
切り出された文字画像の中から文字を切り出す処理を確
実に行うことができる。また、その為の傾きの導出を各
行毎に行わなくても済むため、処理を効率化することが
できる。
【図面の簡単な説明】
第1図は本実施例の文字認識装置の構成を説明するブロ
ツク図、 第2図は本実施例の文字認識動作を説明するフローチャ
ート、 第3図は1文字分の領域を切出すまでの過程を説明する
図、 第4図は変形例を説明する図、 第5図(a),(b)は従来例の文字切出し方法を説明
する図である。 図中、1……文字認識装置、2……入力部、3……操作
部、4……文字認識部、5……CPU、6……ROM、7……
RAM、8……出力部、20……読取装置、30……表示装置
である。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/32 G06K 9/34 G06K 9/20

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】原稿画像を表す画像データを所定方向に分
    割し、 前記分割された領域毎に、行方向に画像の射影をとるこ
    とにより前記原稿の各文字行を順次抽出し、 前記抽出された文字行のうちの注目する文字行につい
    て、当該画像データの基軸に対する当該文字行の傾きを
    求め、 前記注目する文字行から求めた傾きを軸として、前記順
    次抽出された各文字行毎に前記軸に対して垂直方向の射
    影をとることにより、当該原稿に含まれる全文字切り出
    しを行なうことを特徴とする画像処理方法。
  2. 【請求項2】前記画像の分割は、文字行に対して垂直方
    向での分割とすることを特徴とする請求項1に記載の画
    像処理方法。
  3. 【請求項3】原稿画像を表す画像データを所定方向に分
    割する画像分割手段と、 前記分割された領域毎に、行方向に画像の射影をとるこ
    とにより前記原稿の各文字行を順次抽出する行抽出手段
    と、 前記抽出された文字行のうちの注目する文字行につい
    て、前記画像データの基軸に対する当該文字行の傾きを
    求める傾き導出手段と、 前記注目する文字行から求めた傾きを軸として、前記順
    次抽出された各文字行毎に前記軸に対して垂直方向の射
    影をとることにより、当該原稿に含まれる全文字切り出
    しを行なう文字切り出し手段とを備えることを特徴とす
    る画像処理装置。
  4. 【請求項4】前記画像分割手段は、文字行に対して垂直
    方向で画像を分割することを特徴とする請求項3に記載
    の画像処理装置。
JP1156737A 1989-06-21 1989-06-21 画像処理方法及び装置 Expired - Fee Related JP2933947B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1156737A JP2933947B2 (ja) 1989-06-21 1989-06-21 画像処理方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1156737A JP2933947B2 (ja) 1989-06-21 1989-06-21 画像処理方法及び装置

Publications (2)

Publication Number Publication Date
JPH0324681A JPH0324681A (ja) 1991-02-01
JP2933947B2 true JP2933947B2 (ja) 1999-08-16

Family

ID=15634219

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1156737A Expired - Fee Related JP2933947B2 (ja) 1989-06-21 1989-06-21 画像処理方法及び装置

Country Status (1)

Country Link
JP (1) JP2933947B2 (ja)

Also Published As

Publication number Publication date
JPH0324681A (ja) 1991-02-01

Similar Documents

Publication Publication Date Title
JP2940960B2 (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
JP3878401B2 (ja) 画像処理装置、画像処理方法およびそれを記録した記録媒体
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JP2002056398A (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
JP2933947B2 (ja) 画像処理方法及び装置
JPH08320914A (ja) 表認識方法および装置
JP3020662B2 (ja) 文字行切り出し装置及び文字認識装置
JP2001331763A (ja) 表認識方法
JPH07121734A (ja) 文字画像編集装置
JP3548234B2 (ja) 文字認識方法及び装置
JPS62121589A (ja) 文字切出し方法
JP2803736B2 (ja) 文字認識方式
JP2954218B2 (ja) 画像処理方法及び装置
JPH03142691A (ja) 表形式文書認識方式
JPH117493A (ja) 文字認識処理装置
JP2682873B2 (ja) 表形式文書の認識装置
JP3157534B2 (ja) 表認識方法
JP2827288B2 (ja) 文字認識装置
JPS6343788B2 (ja)
JP2931041B2 (ja) 表内文字認識方法
JP2977259B2 (ja) スキュー検出方法
JPH08321942A (ja) 画像処理装置及び分割図面の画像接合方法
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2790276B2 (ja) 文字読取装置
JPS6292080A (ja) 文字パターン認識修正装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees