JPH09223189A - 表処理方法および表処理装置 - Google Patents

表処理方法および表処理装置

Info

Publication number
JPH09223189A
JPH09223189A JP8027673A JP2767396A JPH09223189A JP H09223189 A JPH09223189 A JP H09223189A JP 8027673 A JP8027673 A JP 8027673A JP 2767396 A JP2767396 A JP 2767396A JP H09223189 A JPH09223189 A JP H09223189A
Authority
JP
Japan
Prior art keywords
image
frame
character string
rectangular frame
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8027673A
Other languages
English (en)
Inventor
Yoshinori Ookuma
好憲 大熊
Isao Sugano
功 菅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8027673A priority Critical patent/JPH09223189A/ja
Publication of JPH09223189A publication Critical patent/JPH09223189A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 表を構成する枠中の文字列の方向をより正確
に判断できる表処理方法の提供。 【解決手段】 文字列の画像イメージを走査して濃度ヒ
ストグラム30および34を抽出する。次に、濃度ヒス
トグラムの上端40、下端42、左端36および右端3
8の各座標値を抽出する。次に、主走査方向に平行な辺
であって濃度ヒストグラム34の上端40および下端4
2の座標値をそれぞれ通る辺と、副走査方向に平行な辺
であって濃度ヒストグラム30の左端36および右端3
8の座標値をそれぞれ通る辺とによって囲まれた矩形枠
44を設定する。次に、矩形枠44の長手方向を文字列
の方向と判別する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、表中の文字画像
を認識するための表処理装置および表処理方法に関す
る。
【0002】
【従来の技術】従来の表処理方法の一例が、文献:「特
開平4−33080号公報」に記載されている。この文
献に記載の技術によれば、先ず、イメージ入力された文
書画像から、処理対象の表を構成する罫線に囲まれた枠
を抽出する。次に、抽出された枠の主走査方向の長さお
よび副走査方向の長さによって、枠内の文字行が横書き
であるか縦書きであるかを判別している。そして、この
判別結果に応じて各枠内の文字行の抽出方法を切り替え
ている。枠内の文字行が横書きであるか縦書きであるか
を知ること、即ち、文字列の方向を知ることは、精度良
く文字認識を行うために必要なことである。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
表処理方法では、文字列の方向を枠の主走査方向の長さ
および副走査方向の長さによって判別している。その結
果、枠長さが長い方向と文字列の方向とが異なる場合に
は、文字列の方向を誤って判別してしまうという問題点
があった。例えば、縦長の枠中に横書きの文字行がある
場合には、文字列の方向を縦書きと誤って判別してしま
う。
【0004】このため、表を構成する枠中の文字列の方
向をより正確に判断できる表処理方法および装置の実現
が望まれていた。
【0005】
【課題を解決するための手段】
(第1の発明)この出願に係る第1の発明の表処理方法
によれば、表を構成する枠の中に記載された文字の文字
認識処理に先立ち、枠の中に記載された文字列の画像イ
メージに外接する矩形枠を設定し、この矩形枠の長手方
向を文字列の方向と判別することを特徴とする。
【0006】また、好ましくは、第1の発明の表処理方
法において、矩形枠を求めるにあたり、文字列の画像イ
メージを複数の方向に走査して濃度ヒストグラムを抽出
し、この濃度ヒストグラムの上端、下端、右端および左
端の各座標値を抽出し、この各座標値を通る矩形枠を設
定すると良い。
【0007】(第2の発明)また、この出願に係る第2
の発明の表処理装置によれば、表を構成する枠の中に記
載された文字の文字認識処理のための表処理装置であっ
て、表の画像イメージから罫線を抽出するための罫線抽
出手段と、罫線抽出手段によって抽出された罫線の座標
値から枠を抽出するための枠抽出手段と、表処理装置を
構成する各手段の制御を行うための制御手段とを具えて
なる表処理装置において、枠の中に記載された文字列の
画像イメージに外接する矩形枠を設定して、この矩形枠
の長手方向を文字列の方向と判別するための文字列方向
判別手段を具えてなることを特徴とする。
【0008】また、好ましくは、第2の発明の表処理装
置において、文字列方向判別手段は、枠抽出手段によっ
て抽出された枠内に記載された文字列の画像イメージを
複数の方向に走査して濃度ヒストグラムを抽出し、この
濃度ヒストグラムの上端、下端、右端および左端の各座
標値を抽出し、この各座標値を通る矩形枠を設定するた
めの文字列方向手段であると良い。
【0009】尚、ここで「文字」には、記号一般も含
む。
【0010】
【発明の実施の形態】以下、図面を参照して、この出願
に係る第1の発明の表処理方法および第2の発明の表処
理装置の実施の形態について併せて説明する。尚、参照
する図面は、これらの発明が理解できる程度に各構成成
分の大きさ、形状および配置間を概略的に示してあるに
過ぎない。従って、これらの発明は図示例にのみ限定さ
れるものではない。
【0011】(処理装置)先ず、図1に、第1の実施の
形態の表処理装置のブロック図を示す。この実施の形態
の表処理装置は、処理対象の表を構成する枠の中に記載
された文字の文字認識処理のための表処理装置である。
【0012】そして、この表処理装置は、図1に示すよ
うに、制御手段10、画像入力手段12、画像イメージ
格納手段14、罫線抽出手段16、表情報格納手段1
8、枠抽出手段20および文字列方向判別手段22を具
えている。
【0013】そして、この画像入力手段12によって文
書や帳票といった情報媒体からその画像イメージが表処
理装置に入力される。また、入力された画像イメージ
は、画像イメージ格納手段14に格納される。また、罫
線抽出手段16では、画像イメージ格納手段14から読
出された画像イメージから罫線を抽出する。罫線抽出手
段16は、水平方向の罫線(以下、横罫線とも称する)
を抽出するための横罫線抽出手段16aと、垂直方向の
罫線(以下、縦罫線とも称する)を抽出する縦罫線抽出
手段16bとを以って構成されている。抽出された罫線
の座標は、表情報格納手段18に格納される。
【0014】次に、枠抽出手段20では、表情報格納手
段18から読出された罫線の座標から枠を抽出する。枠
の抽出にあたっては、水平方向(主走査方向)および垂
直方向(副走査方向)に延在した罫線によって囲まれた
枠の抽出を行う。抽出された枠の座標は、表情報格納手
段18に格納される。
【0015】次に、文字列方向判別手段22では、枠の
中に記載された文字列の画像イメージに外接する矩形枠
を設定して、この矩形枠の長手方向を文字列の方向と判
別する。また、この実施の形態の文字列方向判別手段2
2では、矩形枠を求めるにあたり、文字列の画像イメー
ジを構成する黒ブロック列をこの画像イメージの主走査
方向と副走査方向の濃度ヒストグラムを用いて抽出し、
この黒ブロック列の上端、下端、右端および左端の各座
標値を抽出し、この各座標値から、黒ブロック列に外接
する矩形枠を設定する。
【0016】また、これらの各手段は、バスライン24
を介して制御手段10に接続している。制御手段10
は、表処理装置の各手段の制御、例えば、画像データま
たは座標データの入出力の制御を行うためのものであ
る。
【0017】(処理方法)次に、図2を参照して、この
実施の形態の表処理方法、特に、文字列方向判別手段の
働きについて説明する。図2は、第1の実施の形態の表
処理方法のフローチャートである。尚、この実施の形態
においては、図3に示すように、文字列の方向が水平方
向(主走査方向)である横書きの表を処理対象とする。
【0018】(1)先ず、画像入力手段12によって、
図3に示す表の画像イメージの入力を行う。画像イメー
ジの入力にあたっては、処理対象の表を含む情報媒体を
主走査方向(水平方向)および副走査方向(垂直方向)
に光学的に走査して、この情報媒体からの光信号を光電
変換する。ここでは、主走査方向にX軸、副走査方向に
Y軸をそれぞれ仮想的に設定して、このX−Y座標系で
画素データの位置を表す。
【0019】この光電変換により得られた画像イメージ
は、画像イメージ格納手段14としてのイメージメモリ
に格納される。格納された画像イメージは、X−Y座標
系で画素の位置を指定することにより、その座標の画素
データをイメージメモリ上から読出すことができる。
【0020】(2)次に、罫線抽出手段16によって、
画像イメージから罫線を抽出する。先ず、水平方向の罫
線である横罫線の抽出にあたっては、画像イメージ格納
手段14に格納された一部分または全画像イメージ上の
領域に対して、横罫線抽出手段16aによって、主走査
方向(水平方向)に一定の長さ以上連続した黒画素を検
出する。そして、検出された黒画素の連長を横罫線とし
て、その始点および終点の座標値を表情報格納手段18
に格納する。尚、画像イメージ一部分の領域のみで検出
を行う場合は、その領域を、例えばオペレータがマウス
を用いて指定すると良い。また、黒画素の連長を横罫線
と判断するための水平方向の一定の長さには、任意適当
な値を設定することができる。
【0021】また、垂直方向の罫線である縦罫線の抽出
にあっては、横罫線の場合と同様に、画像イメージ上の
領域に対して、縦罫線抽出手段16bによって、副走査
方向(垂直方向)に一定の長さ以上連続した黒画素を検
出する。そして、検出された黒画素の連長を縦罫線とし
て、その始点および終点の座標値を表情報格納手段18
に格納する。黒画素の連長を縦罫線として判断するため
の横方向の一定の長さについても、縦方向の一定の長さ
と個別に、任意適当な値を設定することができる。
【0022】(3)次に、枠抽出手段20によって、枠
を抽出する。枠の抽出にあたっては、先ず、横罫線およ
び縦罫線のそれぞれの始点および終点の座標値を表情報
格納手段18から読出す。読出した座標値に基づいて、
横罫線と縦罫線とを組合せてその交点の座標を抽出する
ことによって、4つの交点(枠の4頂点)の座標を一組
として規定される、縦罫線と横罫線とに囲まれた枠を抽
出する。抽出された枠の4頂点の座標は、表情報格納手
段18に格納する。
【0023】(4)次に、文字列方向判別手段22によ
って、文字列の方向を判別する。ここでは、図3の表中
の枠から、「A社製」と記載された枠の文字列の方向に
ついて判別する。この枠自体は縦長であるが、枠中の文
字は横書きである。
【0024】文字列の方向を判別するにあたっては、先
ず、(a)表情報格納手段18から文字列方向を判別す
る枠の座標値を読出し、この座標値に基づいて画像格納
手段14から画像イメージを取得する。図4に、取得し
た画像イメージを示す。図4は、文字列の方向の判別方
法の説明に供する図である。
【0025】次に、(b)文字列の画像イメージを走査
して濃度ヒストグラムを抽出する。濃度ヒストグラムを
抽出するにあたっては、先ず、枠内の画像イメージを副
走査方向(縦方向)に順次に走査して黒画素のヒストグ
ラム30を抽出する。互いに隣接したヒストグラムの固
まりを黒ブロック32と称する。このヒストグラム30
は、枠内の各文字毎に黒ブロック32となって現れる。
そして、枠内の走査することにより、ヒストグラム30
は、各文字の画像イメージに対応する黒ブロック32が
連なった黒ブロック列30として抽出される。
【0026】次に、枠内の画像イメージを主走査方向
(横方向)に順次に走査して黒画素の濃度ヒストグラム
34を抽出する。
【0027】次に、(c)ヒストグラムの上端、下端、
右端および左端の各座標値を抽出する。副走査方向に走
査して得られた黒ブロック列30のうち、画像の汚れ等
による黒画素を除去するため、一定の値以上のヒストグ
ラムの部分を抽出する。そして、抽出されたヒストグラ
ムの黒ブロック列の左端36および右端38の座標値を
抽出する。この黒ブロック列30の左端36および右端
38の座標が文字列の画像イメージの左端および右端の
座標となる。
【0028】次に、副走査方向の場合と同様に、主走査
方向の走査して得られた黒ブロック列(この場合は黒ブ
ロックは1つ)の上端40および下端42の座標値を抽
出する。この黒ブロック列34の上端40および下端4
2の座標が文字列の画像イメージの上端および下端の座
標となる。
【0029】次に、(d)この各座標値を通る矩形枠を
設定する。矩形枠の設定にあたっては、主走査方向に平
行な辺であって上端40および下端42の座標値をそれ
ぞれ通る辺と、副走査方向に平行な辺であって左端36
および右端38の座標値をそれぞれ通る辺とによって、
囲まれた矩形枠44を設定する。
【0030】尚、ここでは、矩形枠44として、上下
端、左右端の点を通る枠を設定したが、上下端、左右端
のそれぞれ外側に接する枠を設定しても良い。
【0031】次に、(e)矩形枠44の長手方向を文字
列の方向と判別する。判別にあたっては、矩形枠44の
主走査方向の長さXLと、副走査方向の長さYLとが、
下記の(1)式の関係を満足する場合に文字列の方向を
横方向(横書き)と判別し、満足しない場合は縦方向
(縦書き)と判別する。
【0032】XL>YL・・・(1) 次に、判別された文字列の方向を前提として、従来周知
の技術を用いて文字認識を行う。文字認識にあたって
は、文字列の方向の判別結果によって、例えば行切り出
し方法および文字切り出し方法を代えることができる。
【0033】例えば、横書きと判別した場合、行切り出
しを、主走査方向に走査して得られた黒画素のヒストグ
ラムを検出することによって行い、次に、文字切り出し
を、副走査方向に走査して得られた黒画素のヒストグラ
ムの黒ブロックごとに行う。また、例えば、縦書きと判
別した場合、行切り出しは、副走査方向に走査して得ら
れた黒画素のヒストグラムを検出することによって行
い、次に、文字切り出しは、主走査方向に走査して得ら
れた黒画素のヒストグラムの黒ブロックごとに行う。
【0034】そして、文字切り出しで得られた文字画像
イメージの特徴を抽出して、認識辞書とのマッチングを
行って文字コードを出力することもできる。このため、
表領域中に横書きの枠および縦書きの枠が混在していて
も、文字の精度良い抽出の実現を図ることができる。こ
のため、高い文字認識度の実現を図ることが可能とな
る。上述した各実施の形態では、これらの発明を特定の
条件で構成した例についてのみ説明したが、これらの発
明は多くの変更および変形を行うことができる。例え
ば、上述した形態では、横書きの表を処理する例につい
て説明したが、これらの発明では、縦書きの表を処理す
ることもできる。
【0035】また、これらの発明は、1つの表中に縦書
きの枠と横書きの枠とが混在した場合にも適用すること
ができる。
【0036】
【発明の効果】この出願に係る第1の発明の表処理方法
および第2の発明の表処理装置によれば、文字列の画像
イメージに外接する矩形枠の長手方向を文字列の方向と
判別する。このため、枠の長手方向によって文字列の方
向を判別する場合よりも精度良く文字列の方向を判別す
ることができる。その結果、文字認識の精度の向上を図
ることができる。
【図面の簡単な説明】
【図1】実施の形態の表処理装置のブロック図である。
【図2】実施の形態の表処理方法のフローチャートであ
る。
【図3】処理対象の表の説明に供する図である。
【図4】実施の形態の文字列の方向の判別方法の説明に
供する図である。
【符号の説明】
10:制御手段 12:画像入力手段 14:画像イメージ格納手段 16:罫線抽出手段 16a:横罫線抽出手段 16b:縦罫線抽出手段 18:表情報格納手段 20:枠抽出手段 22:文字列方向判別手段 24:バスライン 30:濃度ヒストグラム(黒ブロック列) 32:黒ブロック 34:濃度ヒストグラム 36:左端 38:右端 40:上端 42:下端 44:矩形枠

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 表を構成する枠の中に記載された文字の
    文字認識処理に先立ち、 前記枠の中に記載された文字列の画像イメージに外接す
    る矩形枠を設定し、 該矩形枠の長手方向を前記文字列の方向と判別すること
    を特徴とする表処理方法。
  2. 【請求項2】 請求項1に記載の表処理方法において、 前記矩形枠を求めるにあたり、 前記文字列の画像イメージを複数の方向に走査して濃度
    ヒストグラムを抽出し、 該濃度ヒストグラムの上端、下端、右端および左端の各
    座標値を抽出し、 該各座標値を通る矩形枠を設定することを特徴とする表
    処理方法。
  3. 【請求項3】 表を構成する枠の中に記載された文字の
    文字認識処理のための表処理装置であって、 前記表の画像イメージから罫線を抽出するための罫線抽
    出手段と、 前記罫線抽出手段によって抽出された罫線の座標値から
    枠を抽出するための枠抽出手段と、 前記表処理装置を構成する各手段の制御を行うための制
    御手段とを具えてなる表処理装置において、 前記枠の中に記載された文字列の画像イメージに外接す
    る矩形枠を設定して、該矩形枠の長手方向を前記文字列
    の方向と判別するための文字列方向判別手段を具えてな
    ることを特徴とする表処理装置。
  4. 【請求項4】 請求項3に記載の表処理装置において、 前記文字列方向判別手段は、前記枠抽出手段によって抽
    出された枠内に記載された前記文字列の画像イメージを
    複数の方向に走査して濃度ヒストグラムを抽出し、該濃
    度ヒストグラムの上端、下端、右端および左端の各座標
    値を抽出し、該各座標値を通る矩形枠を設定するための
    文字列方向判別手段であることを特徴とする表処理装
    置。
JP8027673A 1996-02-15 1996-02-15 表処理方法および表処理装置 Pending JPH09223189A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8027673A JPH09223189A (ja) 1996-02-15 1996-02-15 表処理方法および表処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8027673A JPH09223189A (ja) 1996-02-15 1996-02-15 表処理方法および表処理装置

Publications (1)

Publication Number Publication Date
JPH09223189A true JPH09223189A (ja) 1997-08-26

Family

ID=12227480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8027673A Pending JPH09223189A (ja) 1996-02-15 1996-02-15 表処理方法および表処理装置

Country Status (1)

Country Link
JP (1) JPH09223189A (ja)

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
US4757551A (en) Character recognition method and system capable of recognizing slant characters
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JPH03122773A (ja) 画像形成装置
JPH0418351B2 (ja)
US6356657B1 (en) Image processing method and apparatus for discriminating an input image area or an attribute of image information in the discriminated area
JPH09223189A (ja) 表処理方法および表処理装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3710164B2 (ja) 画像処理装置及び方法
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP4580520B2 (ja) 文字認識方法および文字認識装置
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法
JPH08221515A (ja) 画像処理装置
JPH05266250A (ja) 文字列検出装置
JPH04276888A (ja) 文字読取装置
JP3923104B2 (ja) 表処理方法および表処理装置
JPH08315140A (ja) 画像処理装置およびその方法
JP2931041B2 (ja) 表内文字認識方法
JP2954218B2 (ja) 画像処理方法及び装置
JPS6327752B2 (ja)
JP2023034823A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JPS6343788B2 (ja)
JPH0676108A (ja) 文書画像の傾き検出方法
JPS6361382A (ja) 線画像からの文字成分除去方法
JPH07129723A (ja) 表認識装置および表認識方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060207