JPH09106435A - 文字認識装置及び文書内容表示システム - Google Patents

文字認識装置及び文書内容表示システム

Info

Publication number
JPH09106435A
JPH09106435A JP7264234A JP26423495A JPH09106435A JP H09106435 A JPH09106435 A JP H09106435A JP 7264234 A JP7264234 A JP 7264234A JP 26423495 A JP26423495 A JP 26423495A JP H09106435 A JPH09106435 A JP H09106435A
Authority
JP
Japan
Prior art keywords
character string
area
character
unit
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7264234A
Other languages
English (en)
Inventor
Masateru Yamaoka
正輝 山岡
Kazumi Iwane
和巳 岩根
Michihiro Sato
道弘 佐藤
Osamu Iwaki
修 岩城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
N T T DATA TSUSHIN KK
NTT Data Corp
Original Assignee
N T T DATA TSUSHIN KK
NTT Data Communications Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by N T T DATA TSUSHIN KK, NTT Data Communications Systems Corp filed Critical N T T DATA TSUSHIN KK
Priority to JP7264234A priority Critical patent/JPH09106435A/ja
Publication of JPH09106435A publication Critical patent/JPH09106435A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 文字認識の対象となる文書画像からユーザの
意図を反映した文字列領域の指定を自動的に行うことが
できる文字認識装置を提供する。 【解決手段】 イメージメモリ12に蓄積された学習用
文書画像からユーザが領域指定した文字列領域(指定文
字列領域)を特定するとともに、特徴抽出部15でこの
指定文字列領域の特徴の代表値を求める。この代表値か
らユーザの領域指定意図を表す領域指定ロジックを解析
し、これに基づいて領域指定ルーチン作成部19で文字
列領域の自動抽出のための領域指定ルーチンを作成す
る。そして、イメージメモリ12内の認識対象文書画像
にこの領域指定ルーチンを適用して文字認識部3に送る
文字列領域の自動指定を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、光学的読取装置
(OCR)等のイメージ読取装置で読み取った文書画像
から文字列領域を指定して文字認識を行う方式に係り、
特に、サイズの異なる文字列領域が混在する画像や文書
フォーマットがまちまちな画像における文字列領域の指
定手法に関する。
【0002】
【従来の技術】文書をイメージ読取装置で読み込んで文
字認識を行い、コンピュータが扱うことができる形式の
文字コード列に変換する従来の文字認識装置では、その
前処理として、上記イメージ読取装置より出力される文
書画像をモニタ画面上に表示し、ユーザに対して文字コ
ード列に変換したい領域の指定データ入力を促してい
る。そして、ユーザが領域を指定したときは、そのデー
タに基づいて文書画像中の指定領域の相対的位置を特定
し、この特定した領域を文字認識の対象領域としてい
る。
【0003】また、新聞、雑誌、マニュアル、あるいは
学術論文のように、サイズの異なる文字列が混在する複
数の文書の内容をイメージ読取装置と文字認識装置とを
用いて画面表示する文書内容表示システムを構成する場
合、従来は、文字認識率の低下を防止するため、文字認
識の対象となる文字列領域の指定をページ単位あるいは
ブロック単位ではなく、同サイズの文字列単位に行うこ
とが通例となっている。この場合、指定された文字列領
域(以下、指定文字列領域)が文書画像の定められた位
置に、定められた大きさで形成されている定型的な文書
の場合は、文書画像中の相対位置や大きさの情報とその
指定アルゴリズムを登録しておき、文字認識時にそれら
を読み出して利用することで大量の文書の自動認識が可
能である。しかし、文字列領域の位置等が未知の文書や
非定型文書の場合は、各文書あるいは文字列に対して同
一のアルゴリズムを適用することができないため、ユー
ザがその都度手作業により文字列領域を指定する必要が
あった。
【0004】
【発明が解決しようとする課題】上述のように、従来の
文字認識装置及びそれを用いた文書内容表示システムに
おいて、文字列領域の位置等が未知の文書、あるいは非
定型文書の文字認識を行う場合は、ユーザが手作業で文
字列領域を指定しなければならないため、文書が大量に
なるにつれてユーザの作業負担が増大するという問題が
あった。また、従来の文字認識装置や文書内容表示シス
テムでは、文字列領域の指定に関するユーザの意図を考
慮するという観点がなかったので、ユーザが必要としな
い文字コード列が出力されたり、逆に真に必要とする文
字コード列が出力されなかったりする場合があり、さら
に同一サイズの文字列であっても別々に領域指定するた
めに無駄な作業及び処理時間を費やすという問題もあっ
た。
【0005】本発明の課題は、かかる従来の問題点を解
消し、文書画像上の文字列領域の位置等が未知であった
り、定型的でない場合であってもそれを自動的に指定す
ることができる文字認識装置を提供することにある。本
発明の他の課題は、ユーザの指定意図を反映した文書内
容の表示が可能な文書表示システムを提供することにあ
る。
【0006】
【課題を解決するための手段】上記課題を解決する本発
明の文字認識装置は、所定の領域指定データに基づいて
学習用文書画像上の指定文字列領域を特定するととも
に、特定した指定文字列領域の寸法や前記学習用文書画
像上の相対位置を含む特徴情報の代表値を検出する学習
部と、認識対象文書画像の文字列領域の特徴を解析して
前記学習部で検出した代表値と合致する特徴をもつ文字
列領域のみを自動指定する文字列領域指定部と、この文
字列領域指定部で指定した文字列領域について文字認識
を行う文字認識部と、を備えることを特徴とする。ここ
に学習用文書画像とは、ユーザの領域指定意図を解析す
るために用いる文書画像をいい、認識対象文書画像とは
解析された領域指定意図に基づいて実際に文字認識を行
う文書画像をいう。両文書画像は実質的には同一種類の
ものであり、学習用文書画像を領域指定意図の解析後に
認識対象文書画像とすることもできる。
【0007】この文字認識装置において、前記学習部
は、前記検出した代表値と合致する特徴をもつ文字列領
域のみを指定するための制御手順を規定した領域指定ル
ーチンを自動作成する領域指定ルーチン作成部を備え、
前記文字列領域指定部は、前記認識対象文書画像の文字
列領域を特定する文字列領域特定手段と、前記作成され
た領域指定ルーチンに基づき前記文字列領域特定手段を
制御して該当する文字列領域を自動指定する領域指定ル
ーチン適用部と、を備えることが好ましい。
【0008】また、他の課題を解決する本発明の文書内
容表示システムは、サイズの異なる文字列が混在する文
書を文書画像に変換して取り込むイメージ読取装置と、
このイメージ読取装置で取り込んだ文書画像から指定サ
イズの文字列領域について文字認識を行う文字認識装置
と、この文字認識装置の出力を所定フォーマットで可視
化する手段とを有し、前記文字列のサイズ指定者が意図
する文書内容の表示を行う文書内容表示システムであっ
て、前記文字認識装置が、前記サイズ指定者からの領域
指定データに基づいて学習用文書画像上の指定文字列領
域を特定するとともに、特定した指定文字列領域の寸法
や前記学習用文書画像上の相対位置を含む特徴情報の代
表値を検出する学習部と、認識対象文書画像の文字列領
域の特徴を解析して前記学習部で検出した代表値と合致
する特徴をもつ文字列領域のみを自動指定する文字列領
域指定部と、この文字列領域指定部で指定した文字列領
域について文字認識を行う文字認識部と、を備えること
を特徴とする。
【0009】この文書内容表示システムにおいても、前
記学習部が、前記検出した代表値と合致する特徴をもつ
文字列領域のみを抽出するための制御手順を規定した領
域指定ルーチンを自動作成する領域指定ルーチン作成部
を備え、前記文字列領域指定部が、前記認識対象文書画
像の文字列領域を特定する文字列領域特定手段と、前記
作成された領域指定ルーチンにしたがって前記文字列領
域特定手段を制御して文字列領域を自動指定する領域指
定ルーチン適用部と、を備えることが好ましい。
【0010】
【発明の実施の形態】以下、図面を参照して本発明の実
施形態を詳細に説明する。図1は、本発明の一実施形態
に係る文字認識装置のモジュール構成図である。この文
字認識装置は、ユーザによる領域指定意図を解析する学
習部1と、学習部1で解析した領域指定意図を反映した
文字列領域の自動指定を行う文字列領域指定部2と、こ
の文字列領域指定部2で指定された文字列領域について
文字認識を行う文字認識部3とを有している。なお、図
示を省略しているが、学習部1及び文字認識部3には、
文書画像や文字コードを可視化するための表示部及びそ
の制御部が接続されている。
【0011】学習部1は、スキャナ等のイメージ読取装
置から成る文書画像入力部11、入力された各文書画像
(二値画像)を蓄積するイメージメモリ12、蓄積され
ている文書画像から文字列領域を特定して抽出する文字
列領域抽出部13、ユーザの指定に基づいて領域指定デ
ータを生成する領域指定データ入力部14、指定文字列
領域の特徴を抽出する特徴抽出部15、抽出した特徴デ
ータを記憶する特徴データ記憶部16、この特徴データ
記憶部16に記憶されている特徴データを読み出して領
域指定ロジック、すなわちユーザの領域指定意図を解析
する領域指定ロジック解析部17、領域指定ロジック解
析部17による解析データを記憶する解析データ記憶部
18、ユーザの指定意図を反映した文字列領域抽出を行
うための制御手順を規定した領域指定ルーチンを自動作
成する領域指定ルーチン作成部19、及び作成された領
域指定ルーチンを記憶しておく領域指定ルーチン記憶部
20から構成される。
【0012】また、文字列領域指定部2は、領域指定ル
ーチン記憶部20から領域指定ルーチンを読み出してイ
メージメモリ12上の文書画像からの文字列領域の抽出
を行う領域指定ルーチン適用部21のほか、学習部1と
共用の、文書画像入力部11、イメージメモリ12、文
字列領域抽出部13、領域指定ルーチン記憶部20、及
び領域指定ルーチン適用部21から構成される。学習部
1との相違は、学習部1の場合は、領域指定データ入力
部14から入力された領域指定データに基づいて文字列
領域抽出部13で抽出された文字列領域のうち認識対象
となる文字列領域を特定するのに対し、文字列領域指定
部2の場合には、学習部1で作成された領域指定ルーチ
ンにしたがって文字列領域抽出部13で抽出された文字
列領域から認識対象とする文字列領域を自動的に特定す
ることにある。
【0013】次に、上記構成の文字認識装置において、
横書き文書を読み取って文字認識を行う場合の動作例を
図2〜図7をも参照して具体的に説明する。
【0014】図2は、この場合の全体的な動作手順説明
図であり、処理ステップS101〜S107が学習部1
の動作、処理ステップS108〜S111が文字列領域
指定部2の動作である。学習部1では、まず、文書画像
入力部11より入力した学習用文書画像をイメージメモ
リ12に蓄積し(S101)、文字列領域抽出部13
が、この学習用文書画像から文字列領域を抽出する(S
102)。文字列領域の抽出には、例えば黒連結矩形統
合法を用いる。黒連結矩形統合法とは、文書画像から得
られる黒連結矩形の領域、すなわち二値画像中の連接す
る黒画素を包含する最小矩形の領域を統合して文字列領
域を作成する方法である。図3(a)、(b)はこの黒
連結矩形統合法の概要説明図であり、符号30は黒連結
矩形、31は文字列領域である。抽出された文字列領域
は、図示しない表示制御手段及び表示部により可視化さ
れ、ユーザによる領域指定の便宜に供される。
【0015】ユーザがポインティングデバイス等で領域
を指定することにより領域指定データが入力されると
(S103)、特徴抽出部15がイメージメモリ12内
の学習用文書画像から指定文字列領域を特定するととも
に、特定した指定文字列領域に関する特徴を抽出する
(S104)。具体的には、図4に示すように、文書紙
面左上端を原点に水平方向をx軸、垂直方向をy軸と
し、単位をピクセル(最小読取単位)として、文字の大
きさを表している文字列領域の高さ、文書紙面上での相
対的位置を表している文字列領域の中心のx座標及びy
座標を求め、これら三つの要素を指定文字列領域の特徴
として抽出する。これをユーザが指定する複数の文字列
領域について繰り返す(S105)。図5は、2枚の文
書に対応する学習用文書画像から三つの領域(領域A,
領域B,領域C)が指定された様子を示すものである。
各領域A,B,Cに関する特徴は、特徴データ記憶部1
6内のテーブルに記憶される。
【0016】領域指定ロジック解析部17は、特徴デー
タ記憶部16に記憶されている指定文字列領域の高さ、
x座標、及びy座標の三つの特徴の特徴量に基づいてユ
ーザの領域指定意図を解析し、その結果である解析デー
タを解析データ記憶部18に格納する(S106)。具
体的には、ユーザが指定した文字列領域の高さ、x座
標、y座標の各特徴量の平均、標準偏差、及び変異係数
(=平均値/標準偏差)を求め、さらに変異係数の最も
小さい特徴を代表値として求める。この代表値がユーザ
の領域指定意図であることが想定される。例えば図6は
上記各領域A,B,Cについて抽出した特徴データの例
であるが、この例では文字列領域の高さの変異係数が最
も小さい。したがって、ユーザは文字の大きさを領域指
定の基準にしていることが想定されるので、この高さに
関するデータを文字列領域の特徴の代表値として抽出
し、これらを解析データとする。
【0017】領域指定ルーチン作成部19は、解析デー
タ記憶部18内の解析データをもとに、領域指定ルーチ
ンを自動作成する(S107)。図6に示した例では、
ユーザが指定した文字列領域の高さの最小値から最大値
(“24”〜“28”)までの範囲に、認識対象文書画
像の文字列領域の高さが含まれれば、その文字列領域が
文字認識の対象となる文字列領域であると解釈して自動
的にその領域を自動指定するための制御手順を規定した
ルーチンを作成する。作成された領域指定ルーチンが領
域指定ルーチン記憶部20に格納され、学習部1の動作
が終了する。
【0018】学習部1で領域指定ルーチンが作成される
と、文字列領域指定部2で認識対象文書画像から文字列
領域を自動指定する。すなわち文書画像入力部11から
認識対象文書画像を入力し、これをイメージメモリ12
に蓄積する(S108)。そして領域指定ルーチン適用
部21がこの認識対象文書画像に対して領域指定ルーチ
ンを適用して(S109)文字列領域を指定し、その結
果を文字認識部3に送る(S110)。図7に示す領域
Dは、自動指定された領域を示すものである。文字認識
部3は、学習部1で指定された領域A〜領域C及び文字
列領域指定部2で自動指定された領域Dについて文字認
識を行い、文字コード列に変換する。
【0019】このように、本実施形態では、学習用文書
画像から指定文字列領域の特徴の代表値を求め、この代
表値から領域指定ロジックを解析し、さらにこの解析デ
ータに基づいて文字列領域を自動指定するための領域指
定ルーチンを作成し、これを認識対象文書画像に適用す
るようにしたので、認識対象文書画像から所望の文字列
領域が自動的に指定されて文字認識部3に送られる。こ
れにより、従来のように、ユーザが各文書画像について
手作業で文字列領域を指定する必要がなくなる。また、
ユーザの領域指定意図が反映されて文字列領域の自動指
定がなされるので、無駄な領域が指定されて文字認識に
要する時間が長くなったり、逆に真に必要な領域が指定
されなかったりする事態を防止することができる。
【0020】この文字認識装置を文書内容表示システム
の主要構成要素として使用することにより、従来の同種
システムと異なる利用態様が可能である。すなわち、従
来は文書画像の内容をそのまま画面表示するものであ
り、そのもと文書の内容を把握するには文字認識された
後の文書の全文を読むしかなかったが、本実施形態の文
字認識装置でユーザの意図を反映した文字列領域のみ、
例えば「見出し」の領域のみを自動抽出して文字認識を
行い、これにより得られた文字コードを所定フォーマッ
トで編集して可視化手段(画像表示部及びその制御部、
あるいは印刷装置)で可視化することにより、大きな情
報をもつ認識対象文献が大量に存在する場合であって
も、その文献の内容の概要を迅速に把握することがで
き、システムの利用価値を高めることができる。
【0021】なお、本実施形態では、文書画像入力部1
1でその都度各文書画像をイメージメモリ12に蓄積し
ているが、必ずしも同様の手順を経る必要はなく、予め
大量の文書画像をイメージメモリ12に蓄積しておき、
必要に応じて学習用文書画像と認識対象文書画像を選定
して上記処理を施すようにしてもよい。また、学習用文
書画像ないし指定文字列領域は必ずしも複数である必要
がなく、一つのみであってもよい。
【0022】
【発明の効果】以上の説明から明らかなように、本発明
の文字認識装置によれば、文書画像上における文字認識
の対象領域が、文書の種類あるいは文書上の文字サイズ
がまちまちであっても自動的に指定される効果がある。
したがって、大量の文書について文字認識する場合のユ
ーザの作業負担が従来よりも格段に軽減される。また、
本発明の文書表示システムによれば、ユーザの指定意図
を反映した文書内容のみの表示が可能になり、その利用
価値が高まる効果がある。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文字認識装置のブロ
ック構成図。
【図2】本実施形態の文字認識装置における全体的な処
理手順説明図。
【図3】文字列領域の抽出に用いる黒連結矩形統合法の
概要説明図であり、(a)は黒連結矩形、(b)は黒連
結矩形が統合された文字列領域の例を示す図である。
【図4】文字列領域の特徴の説明図。
【図5】学習用文書画像における指定文字列領域(領域
A〜領域C)の説明図。
【図6】特徴抽出部が抽出した特徴データとその代表値
の説明図。
【図7】文字列領域指定部により自動指定された文字列
領域(領域D)の説明図。
【符号の説明】
1 学習部 2 文字列領域指定部 3 文字認識部 11 文書画像入力部 12 イメージメモリ 13 文字列領域抽出部 14 領域指定データ入力部 15 特徴抽出部 16 特徴データ記憶部 17 領域指定ロジック解析部 18 解析データ記憶部 19 領域指定データ作成部 20 領域指定ルーチン作成部 21 領域指定ルーチン適用部 30 黒連結矩形 31 黒連結矩形が統合されて形成された文字列領域
───────────────────────────────────────────────────── フロントページの続き (72)発明者 岩城 修 東京都江東区豊洲三丁目3番3号 エヌ・ ティ・ティ・データ通信株式会社内

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 所定の領域指定データに基づいて学習用
    文書画像上の指定文字列領域を特定するとともに、特定
    した指定文字列領域の寸法や前記学習用文書画像上の相
    対位置を含む特徴情報の代表値を検出する学習部と、 認識対象文書画像の文字列領域の特徴を解析して前記学
    習部で検出した代表値と合致する特徴をもつ文字列領域
    のみを自動指定する文字列領域指定部と、 この文字列領域指定部で指定した文字列領域のみについ
    て文字認識を行う文字認識部と、を備えることを特徴と
    する文字認識装置。
  2. 【請求項2】 前記学習部は、前記検出した代表値と合
    致する特徴をもつ文字列領域を指定するための制御手順
    を規定した領域指定ルーチンを自動作成する領域指定ル
    ーチン作成部を備え、 前記文字列領域指定部は、前記認識対象文書画像の文字
    列領域を特定する文字列領域特定手段と、前記作成され
    た領域指定ルーチンに基づき前記文字列領域特定手段を
    制御して該当する文字列領域を自動指定する領域指定ル
    ーチン適用部と、を備えることを特徴とする請求項1記
    載の文字認識装置。
  3. 【請求項3】 サイズの異なる文字列が混在する文書を
    文書画像に変換して取り込むイメージ読取装置と、この
    イメージ読取装置で取り込んだ文書画像から指定サイズ
    の文字列領域について文字認識を行う文字認識装置と、
    この文字認識装置の出力を所定フォーマットで可視化す
    る手段とを有し、前記文字列のサイズ指定者が意図する
    文書内容の表示を行う文書内容表示システムであって、 前記文字認識装置が、 前記サイズ指定者からの領域指定データに基づいて学習
    用文書画像上の指定文字列領域を特定するとともに、特
    定した指定文字列領域の寸法や前記学習用文書画像上の
    相対位置を含む特徴情報の代表値を検出する学習部と、 認識対象文書画像の文字列領域の特徴を解析して前記学
    習部で検出した代表値と合致する特徴をもつ文字列領域
    のみを自動指定する文字列領域指定部と、 この文字列領域指定部で指定した文字列領域について文
    字認識を行う文字認識部と、を備えることを特徴とする
    文書内容表示システム。
  4. 【請求項4】 前記学習部は、前記検出した代表値と合
    致する特徴をもつ文字列領域のみを指定するための制御
    手順を規定した領域指定ルーチンを自動作成する領域指
    定ルーチン作成部をさらに備え、 前記文字列領域指定部は、前記認識対象文書画像の文字
    列領域を特定する文字列領域特定手段と、前記作成され
    た領域指定ルーチンに基づき前記文字列領域特定手段を
    制御して文字列領域を自動指定する領域指定ルーチン適
    用部と、を備えることを特徴とする請求項3記載の文書
    内容表示システム。
JP7264234A 1995-10-12 1995-10-12 文字認識装置及び文書内容表示システム Pending JPH09106435A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7264234A JPH09106435A (ja) 1995-10-12 1995-10-12 文字認識装置及び文書内容表示システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7264234A JPH09106435A (ja) 1995-10-12 1995-10-12 文字認識装置及び文書内容表示システム

Publications (1)

Publication Number Publication Date
JPH09106435A true JPH09106435A (ja) 1997-04-22

Family

ID=17400359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7264234A Pending JPH09106435A (ja) 1995-10-12 1995-10-12 文字認識装置及び文書内容表示システム

Country Status (1)

Country Link
JP (1) JPH09106435A (ja)

Similar Documents

Publication Publication Date Title
US5907835A (en) Electronic filing system using different application program for processing drawing commands for printing
TW565803B (en) System and method for accurately recognizing text font in a document processing system
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JP4035228B2 (ja) 画像処理方法及び画像処理装置
US7042594B1 (en) System and method for saving handwriting as an annotation in a scanned document
JP2001307109A (ja) 画像処理方法、装置および記録媒体
US5563964A (en) Method and apparatus for processing a plurality of designated areas of an image
US5854860A (en) Image filing apparatus having a character recognition function
JPH09106435A (ja) 文字認識装置及び文書内容表示システム
JP7318289B2 (ja) 情報処理装置およびプログラム
EP0783149B1 (en) Clipboard for interactive desktop system
EP0996080A2 (en) System and method for automatic region selection
JPS61198376A (ja) 光学的文字読取装置
JP3006294B2 (ja) 光学的文字読取装置
JPH11224259A (ja) 画像処理装置、画像処理方法および記憶媒体
JP3424942B2 (ja) 対訳画像形成装置
JPH10116314A (ja) 表処理方法及び表処理装置
JPH04156694A (ja) 文字認識方式
JPH07193710A (ja) 文章画像処理装置
JPH03103996A (ja) 光学的文字読取装置
JPH08235372A (ja) 画像形成装置
JPS61198378A (ja) 光学的文字読取装置
JPH08185475A (ja) 画像認識装置
JPH04251395A (ja) 光学的文字図形読取装置
JPS6326789A (ja) 文字認識装置