JPH07220027A - 文字認識処理装置における文字方向および行方向決定方法 - Google Patents

文字認識処理装置における文字方向および行方向決定方法

Info

Publication number
JPH07220027A
JPH07220027A JP6008837A JP883794A JPH07220027A JP H07220027 A JPH07220027 A JP H07220027A JP 6008837 A JP6008837 A JP 6008837A JP 883794 A JP883794 A JP 883794A JP H07220027 A JPH07220027 A JP H07220027A
Authority
JP
Japan
Prior art keywords
character
line
area
row
recognition processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6008837A
Other languages
English (en)
Inventor
Shiori Ooaku
志緒理 大阿久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6008837A priority Critical patent/JPH07220027A/ja
Publication of JPH07220027A publication Critical patent/JPH07220027A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 処理対象として特定された日本語の文字領域
から得られる言語情報より特定領域の文字方向および行
方向を高精度に決定する。 【構成】 処理対象として特定された文字領域の外接行
を抽出し、各外接行に対して文字方向を生成する。各外
接行と各文字方向ごとに文字認識処理を行なって文字ラ
ティスを生成し、各文字ラティスごとに言語処理を行な
って各文字ラティスの構成単語数または表記長が1の自
立語数を求める。文字ラティスごとに求められた構成単
語数または表記長が1の自立語数に基づいて特定領域の
文字方向および行方向を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書原稿を画像データ
として入力して、文字認識処理を行なう文字認識処理装
置(OCR)において、認識対象の文字領域を単位とし
て、文字方向および行方向を決定する方法に関するもの
である。
【0002】
【従来の技術】従来より、新聞や雑誌などの縦方向の文
字、横方向の文字が混在している文書に対して文字認識
処理を行なう場合には、文字認識処理装置側で処理対象
の領域ごとに文字方向および行方向を正確に特定するこ
とは困難であった。そのために、文字認識処理の前に、
入力画像を表示装置に表示して、操作者がその対象領域
の文字方向、行方向を予め指定したり、誤認識した結果
を修正したりして文字認識処理を施すのが一般的であっ
た。
【0003】こうした操作者の指定作業、修正作業の負
担を軽減するために、文書中の各領域の大きさや縦横比
等の領域情報から文字方向、行方向を推定する方式が採
られる場合がある。しかしながら、領域情報のみに基づ
く文字方向の決定では、例外が多くなり充分な精度が得
られなかった。
【0004】また、特開平4ー312162号公報に
は、罫線で分離された各領域に対して縦書きと横書きの
文字列を作成して、その文字列に対して形態素解析を行
ない、その分割結果からこの文字行中の未知語数が少な
い文字列を正しい文字列として判定する技術が記載され
ている。このように言語的情報から行方向を推定する方
式は、領域情報のみで判定する方式より精度が高いと推
測される。
【0005】しかし、誤った文字方向および行方向で文
字列が生成された場合においても、形態素解析の結果と
して未知語文字列に判定される文字列が少なくなること
が多いために誤判定を起こす場合がある。
【0006】また、上記公報記載の方式は、罫線で分離
された領域に対する処理を前提としており、罫線で分離
されていない文書画像の行方向の判定には不具合が発生
する場合があり、画像の上下方向が正しく入力されるこ
とが前提となっているために文字方向の決定については
考慮されていない。
【0007】
【発明が解決すべき課題】本発明はかかる事情に鑑み、
文字認識処理装置において、処理対象として特定された
日本語の文字領域から得られる言語情報より特定領域の
文字方向および行方向を高精度に決定する文字方向およ
び行方向決定方法を提供することを目的とする。。
【0008】
【課題を解決するための手段】上述した目的を達成する
ために、特許請求の範囲第1項記載の発明は、入力画像
中の文字領域を特定して特定領域内の文字行を切り出
し、前記特定領域の文字画像データに対して文字認識処
理を施す文字認識処理装置において、処理対象として特
定された文字領域の全ての外接行の各文字方向ごとに文
字認識処理を施し、生成されたすべての文字ラティスに
対して言語処理を施し、その結果の文字列を構成してい
る単語数を比較し、比較結果に基づいて前記特定領域の
文字方向および行方向を決定するように構成した。
【0009】また、特許請求の範囲第2項記載の発明
は、入力画像中の文字領域を特定して特定領域内の文字
行を切り出し、前記特定領域の文字画像データに対して
文字認識処理を施す文字認識処理装置において、処理対
象として特定された文字領域の全ての外接行の各文字方
向ごとに文字認識処理を施し、生成されたすべての文字
ラティスに対して言語処理を施し、その結果の文字列を
構成している表記長が1字の自立語数を比較し、比較結
果に基づいて前記特定領域の文字方向および行方向を決
定するように構成した。
【0010】
【作用】本発明によれば、処理対象として特定された文
字領域の外接行を抽出し、各外接行に対して文字方向を
生成する。各外接行と各文字方向ごとに認識処理を行な
って文字ラティスを生成し、各文字ラティスごとに言語
処理を行なって各文字ラティスの構成単語数または表記
長が1の自立語数を求める。文字ラティスごとに求めら
れた構成単語数または表記長が1の自立語数に基づいて
特定領域の文字方向・行方向を決定する。
【0011】
【実施例】以下、図面に基づいて本発明の一実施例を詳
細に説明する。図1は本発明を文字認識装置に応用した
ブロック図であり、1が領域識別部、2が外接行抽出
部、3が文字方向生成部、4が文字認識処理部、5が情
報格納部、6が言語処理部、7が文字方向・行方向判定
部である。
【0012】処理対象の文書はイメージ画像として入力
され、領域識別部1において、文字領域とその他の領域
(写真領域、表領域等)が矩形状に識別される。領域識
別処理は、例えば、本出願人による特開平5−8147
5号公報に記載された、入力された文書画像中の黒画素
の連続性から黒ランを抽出して、黒ランの圧縮処理から
文字行を抽出して、文字行を統合することによって文字
領域と他の領域とを区別する方法によって行なわれる。
【0013】外接行抽出部2では、領域識別部で特定さ
れた処理対象の文字領域に対して、文字領域の最も外側
に位置する最上行、最下行、最右行、最左行、計4行の
外接行を図2に示されるように抽出する。この外接行の
抽出部は、領域識別部における文字行の抽出結果を利用
することにより行なわれる。
【0014】文字方向生成部3では、外接行抽出部によ
って抽出された4行の外接行に対して、図3に示すよう
に、各外接行について上・下・右・左の計4方向の文字
方向を生成する。
【0015】文字認識処理部4では、先ず情報格納部5
を参照して、処理対象領域に関する文字方向・行方向の
情報の有無を確認する。情報格納部に対象領域の文字方
向・行方向に関する情報が無い場合には、外接行抽出部
2によって抽出された各外接行の文字に対して、文字方
向生成部3で設定した上・下・右・左の4方向について
文字認識用の辞書とのマッチングによる文字認識処理を
施す。
【0016】文字認識処理部における認識処理の結果と
して、外接行を構成する各文字の認識候補文字の格子状
のマトリクスである文字ラティスが生成される。文字認
識処理は、各外接行、各方向ごとに施されるために、計
16種類の文字ラティスが生成される。
【0017】文字ラティスとは、ある文字列の認識処理
を行なった際に、各文字に対する認識候補文字を複数保
持している格子状の文字のマトリクスであり、単語の概
念で区切られていない候補文字が連なった状態のもので
ある。
【0018】本願の文字認識処理部では、特定領域の文
字に対して上下左右の全ての方向に認識処理を行なっ
て、各行に対して4種の文字ラティスを生成しているた
めに特に文字方向および行方向を決定する際の判別精度
が高められる。
【0019】言語処理部6においても情報格納部5が参
照されて、文字方向・行方向の情報の有無に応じて処理
が切り替えられる。情報格納部5に対象領域の文字方向
・行方向に関する情報が無い場合には、文字認識処理部
で生成した16種類の文字ラティスに対して、所定の単
語辞書とのマッチングによる言語処理が施される。この
言語処理により候補文字の連なりである文字ラティスか
ら、言語的に最も確からしい文字列が選択される。
【0020】言語的に最も確からしい文字列を選択する
ための言語情報としては、各文字ラティスから言語処理
によって文字列を決定する過程で得られる、文字列を構
成する単語数または表記長が1である自立語数が用いら
れる。
【0021】認識対象の文書が漢字とひらがなの混じっ
た日本語の文字列である場合には、言語処理の結果とし
て得られる文字コードのうち、漢字文字コードの多く
は、表記長が1字の和語名詞や固有名詞等に認定され、
ひらがなの多くは助詞と認定される場合が多い。このと
き文字方向を誤って文字列を構成した場合には、正解文
字列より表記長1字の自立語数が多くなり、さらに、正
解文字列を構成する単語よりも、構成単語数が多くなる
という傾向が見られる。本願発明ではこの特徴を利用す
ることにより、文字方向・行方向判定部7において候補
文字の連なりである文字ラティスから、言語的に最も確
からしい文字列を選択している。
【0022】文字方向・行方向判定部7は、全ての文字
ラティスを対象として、言語処理部6で得た言語情報、
即ち各文字ラティスに含まれる構成単語数または表記長
が1である自立語数を比較して、構成単語数または表記
長が1である自立語数が最も小さくなる文字ラティスの
文字方向・行方向を正しい方向であると判定する。
【0023】図4に文字方向・行方向判定部における判
定例を示す。構成単語数および1文字の自立語数から、
対象領域の文字方向は「上」であり、行方向は「水平」
であると判定され、文字方向・行方向の判定結果は、
「領域の上部から文字方向が上、行方向が水平」とな
る。この文字方向・行方向の判定結果は情報格納部5に
格納される。
【0024】文字認識処理部4は、文字方向・行方向判
定部による判定結果に基づいて、対象領域全体に対して
文字認識処理を行い、領域全体の文字ラティスを後処理
部に渡す。
【0025】情報格納部5に対象領域の文字方向・行方
向に関する情報が格納されている場合には、言語処理部
6では、文字認識処理部4から出力される対象領域全体
の文字ラティスに対して言語処理を行い、言語的に最も
確からしい文字列を選択して、認識結果の文字列として
出力する。
【0026】情報格納部の情報の有無によって文字認識
処理部と言語処理部における処理が切り換えられるため
に、対象領域の文字方向・行方向が判定された後は効率
的に文字認識処理が実行される。認識結果が出力された
後に情報格納部5は初期化される。
【0027】以上説明した本発明の基本処理ステップは
以下のようになる。 ステップ1)処理対象の領域の外接行を抽出する。 ステップ2)各外接行に対して文字方向を生成する。 ステップ3)各外接行と文字方向および行方向ごとに認
識処理を行い文字ラティスを生成する。 ステップ4)各文字ラティスに対して言語処理を行い、
各文字ラティスの言語情報(構成単語数または表記長1
の自立語数)を求める。 ステップ5)文字ラティスの言語情報に基づいて対象領
域の文字方向および行方向を決定する。
【0028】
【発明の効果】請求項1記載の発明においては、文字認
識処理においてすべての文字方向と行方向によって文字
ラティスを生成し、言語処理の結果の構成単語数に基づ
いて文字方向および行方向を選択しているために、日本
語として最も自然な単語列となる文字方向および行方向
を高精度に決定することが可能になる。
【0029】請求項2記載の発明においては、請求項1
と同様に、すべての文字方向と行方向によって文字ラテ
ィスを生成し、言語処理の結果の表記長1の自立語数に
基づいて文字方向および行方向を選択しているために、
日本語として最も自然な単語列となる。特に請求項2記
載の発明では、言語情報を厳密に規定しているために文
字方向および行方向の判別精度は高いものが得られる。
【図面の簡単な説明】
【図1】本発明を文字認識装置に応用したブロック図で
ある。
【図2】本発明における外接行抽出処理を説明する図で
ある。
【図3】本発明における文字方向生成を説明する図であ
る。
【図4】本発明による文字方向・行方向判定を説明する
図である。
【符号の説明】
1 領域識別部 2 外接行抽出部 3 文字方向生成部 4 文字認識処理部 5 情報格納部 6 言語処理部 7 文字方向・行方向判定部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力画像中の文字領域を特定して特定領
    域内の文字行を切り出し、前記特定領域の文字画像デー
    タに対して文字認識処理を施す文字認識処理装置におい
    て、前記特定領域の全ての外接行の各文字方向ごとに文
    字認識処理を施し、生成されたすべての文字ラティスに
    対して言語処理を施し、その結果の文字列を構成してい
    る単語数を比較し、比較結果に基づいて前記特定領域の
    文字方向および行方向を決定することを特徴とする文字
    認識処理装置における文字方向および行方向決定方法。
  2. 【請求項2】 入力画像中の文字領域を特定して特定領
    域内の文字行を切り出し、前記特定領域の文字画像デー
    タに対して文字認識処理を施す文字認識処理装置におい
    て、前記特定領域の全ての外接行の各文字方向ごとに文
    字認識処理を施し、生成されたすべての文字ラティスに
    対して言語処理を施し、その結果の文字列を構成してい
    る表記長が1字の自立語数を比較し、比較結果に基づい
    て前記特定領域の文字方向および行方向を決定すること
    を特徴とする文字認識処理装置における文字方向および
    行方向決定方法。
JP6008837A 1994-01-28 1994-01-28 文字認識処理装置における文字方向および行方向決定方法 Pending JPH07220027A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6008837A JPH07220027A (ja) 1994-01-28 1994-01-28 文字認識処理装置における文字方向および行方向決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6008837A JPH07220027A (ja) 1994-01-28 1994-01-28 文字認識処理装置における文字方向および行方向決定方法

Publications (1)

Publication Number Publication Date
JPH07220027A true JPH07220027A (ja) 1995-08-18

Family

ID=11703904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6008837A Pending JPH07220027A (ja) 1994-01-28 1994-01-28 文字認識処理装置における文字方向および行方向決定方法

Country Status (1)

Country Link
JP (1) JPH07220027A (ja)

Similar Documents

Publication Publication Date Title
JP2973944B2 (ja) 文書処理装置および文書処理方法
US7519226B2 (en) Form search apparatus and method
Hochberg et al. Automatic script identification from document images using cluster-based templates
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
JP2713622B2 (ja) 表形式文書読取装置
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
JPH0721319A (ja) 自動アジア言語決定装置
JP2001325562A (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH07220027A (ja) 文字認識処理装置における文字方向および行方向決定方法
Amano et al. DRS: A workstation-based document recognition system for text entry
JP3233803B2 (ja) 難読漢字検索装置
JPH0863545A (ja) 文字認識処理装置における文字方向および行方向決定方法
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP4805485B2 (ja) 単語認識方法および単語認識装置
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JP3151866B2 (ja) 英文字認識方法
JPS6120180A (ja) 光学的文字認識装置
Saeed et al. Intelligent feature extract system for cursive-script recognition
JP2995825B2 (ja) 日本語文字認識装置
JP2931485B2 (ja) 文字切出し装置及び方法
JPS63143684A (ja) 文字認識装置における認識結果修正方法
CN110246098A (zh) 一种碎片复原方法
JPH08129608A (ja) 文字認識装置
JPH10334190A (ja) 文字認識方法、装置および記録媒体
JP2005346607A (ja) 原稿画像判定装置、原稿画像判定方法及びそのプログラム