JP2746904B2 - 文書読取り装置 - Google Patents

文書読取り装置

Info

Publication number
JP2746904B2
JP2746904B2 JP63068172A JP6817288A JP2746904B2 JP 2746904 B2 JP2746904 B2 JP 2746904B2 JP 63068172 A JP63068172 A JP 63068172A JP 6817288 A JP6817288 A JP 6817288A JP 2746904 B2 JP2746904 B2 JP 2746904B2
Authority
JP
Japan
Prior art keywords
character line
character
recognition
frame
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63068172A
Other languages
English (en)
Other versions
JPH01241684A (ja
Inventor
修一 辻本
俊二 有吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63068172A priority Critical patent/JP2746904B2/ja
Publication of JPH01241684A publication Critical patent/JPH01241684A/ja
Application granted granted Critical
Publication of JP2746904B2 publication Critical patent/JP2746904B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、入力文書に記載された文字行を抽出してこ
れを順次認識する文書読取り装置に関する。
(従来の技術) 近年、手書き文字、印刷文字等の認識技術の進歩に伴
って、各種の文書に記述された文字行を読取り、その意
味解析を行なう装置の開発が進められている。この種の
装置では、様々なフォーマットで記述された文書から意
味のある文字列の並びとしての文字行を正確に抽出し、
この抽出された文字行を順次認識処理していく。また、
通常、この種の文字行の認識処理では、単純な文字認識
のみならず前後の接続可能性の検討や単語としての成立
性等を加味した認識処理行なうことが多いため、認識処
理に比較的多くの時間を必要とし、文書1枚当りの認識
結果を得るまでのかなりの待ち時間がかかる。このた
め、使用者は認識処理がはたして正常に進んでいるどう
かを多くの時間を経た後でないと知ることができなかっ
た。
一方、認識処理の結果を逐次的に表示していく装置も
提案されているが、このような逐次的な表示によっても
現在の認識処理が入力文書のどの位置まで進んでいるか
ということは知ることができなかった。このため、何等
かのアクシデント(例えば暴走等)が生じた時の使用者
が対処が遅れ、作業効率を低下させるという問題があっ
た。
(発明が解決しようとする課題) このように、従来の文書読取り装置では、認識処理の
経過を使用者が逐次監視することができず、使用者の作
業効率を妨げるという問題があった。
本発明は、認識処理の経過が一目で分り、これにより
作業効率向上に寄与し得る文書読取り装置を提供するこ
とを目的とする。
[発明の構成] (課題を解決するための手段) 本発明に係る文書読取り装置は、入力文書を画像デー
タとして入力する画像入力手段と、この画像入力手段を
介して入力された画像データを記憶する画像メモリと、 この画像メモリに記憶された画像データを構造解析して
前記入力文書における文字行領域を抽出する文字行抽出
手段と、この文字行抽出手段によって抽出された各文字
行領域を示す枠の各々を、前記入力文書における各文字
行領域の位置関係を維持して表示する手段と、前記文字
行抽出手段によって抽出された文字行領域に記述された
文字行の画像データを順次読込んで認識する文字行認識
手段と、この文字列認識手段の認識結果を、認識処理の
進行に沿って逐次表示する手段と、前記枠の表示形態を
変化させることにより、前記文字行認識手段による認識
処理の前記文字行領域に対する進行状況を呈示する手段
とを具備したことを特徴とする。
好ましくは、前記文字列認識手段の認識結果を、前記
枠の表示領域とは別の領域に表示するようにしてもよ
い。
好ましくは、前記文字列認識手段の認識結果を、その
認識結果に係る文字行領域に対応する枠の内部に表示す
るようにしてもよい。
好ましくは、前記枠を表示するにあたっては、各枠の
内部に、その枠に対応する文字行領域に記述された文字
行の画像データを表示するようにしてもよい。
好ましくは、前記認識処理の進行状況を呈示するにあ
たっては、前記文字行認識手段が現在処理対象としてい
る文字行領域に対応する枠に関する表示形態を、他の枠
に関する表示形態とは異なるものになるように制御する
ようにしてもよい。
(作用) 本発明によれば、画像メモリに記憶された画像データ
を構造解析して文字行領域を抽出し、この抽出された文
字行領域のうち、枠の表示形態を変化させることによ
り、前記文字行認識手段による前記文字行領域に対する
認識処理の進行状況を呈示するので、例えば、現在認識
処理を実行中の文字行領域に対応する枠に関する表示形
態を、他の枠に関する表示形態とは異なるものになるよ
うに制御するので、現在処理中の文字行が文書中のどの
位置にある文字行であるかを明確に識別することができ
る。そして、これと同時に認識結果をも表示するので、
使用者は、処理の進行状態を容易に把握することがで
き、アクシデントに対しても速やかに対処でき、作業効
率が向上する。
(実施例) 以下、図面を参照しながら本発明の実施例について説
明する。
第1図は本発明の一実施例に係る文書読取り装置の構
成を示す図である。この文書読取り装置は、画像入力手
段11、画像メモリ12、文字行抽出手段13、表示手段14、
文字行領域メモリ15、文字行認識手段16及び辞書17によ
り構成されている。
画像入力手段11は、例えば8本/mm程度の解像度を有
するラインイメージセンサからなり、入力文書18を上か
ら順次走査して画像データとして取込む。この画像入力
手段11で取込まれた画像データは、一旦画像メモリ12に
格納される。
文字行抽出手段13は、画像メモリ12に格納された画像
データを構造解析して入力文書18における文字行領域を
抽出する。画像データをラン表現した時、文字行領域
は、例えば白ランの長さが所定のしきい値Rthよりも
短いときには、それを黒ランに置換える、又は所定の
しきい値Rthよりも長い白ランを検出したら、それが文
字列領域以外の領域であると判定し、他の部分を黒ラン
に置換える−等の方法によって求めることができる。こ
れらの方法で変換された白ラン及び黒ランは、文字行領
域データとして文字行領域メモリ15に格納されるととも
に、表示手段14に与えられる。
一方、文字行認識手段16は、文字行領域メモリ15に格
納された文字行情報に基づいて、画像メモリ12から文字
行領域の文字行を抽出し、さらにその文字行から文字の
切出しを行ない、辞書17と照合して文字認識を行なう。
次にスペース,ハイフン,コンマ,ピリオド、疑問符等
の存在を調べ、文字を単語にまとめる。なお、スペース
は文字間スペースの大きさより求められ、またハイフ
ン、コンマなどは文字認識結果より求められる。また、
文字を単語にまとめるのではなく、文字行からまず単語
を切出し、次にそれより文字を切出しても良い。文字認
識或は文字検出切出しの段階で、何通りかの候補がある
場合には、それらの組合わせのうち、最も単語として意
味をなすものが単語辞書との照合により決定される。ま
た、文法チェックの結果も踏まえて認識候補の最終的な
決定をしても良い。この認識処理の進行状況の情報(例
えば、処理中の文字行の座標データ、文字行領域番号な
ど)及び認識結果は、表示手段14に与えられている。
表示手段14は、文字行抽出手段13で抽出された文字行
領域を示す黒ランと、その他の領域を示す白ランとに基
づいて、例えば第2図に示すように左側画面に文字列領
域のみを枠で示した文書画像を表示するとともに、文字
行認識手段16から与えられる認識結果を右側画面に表示
し、更に文字行認識手段16から与えられる処理状況情報
に基づいて左側画面の文字領域のうち現在処理中の文字
領域を他の文字領域とは区別できるように、例えば反転
表示する。
このような構成であれば、使用者は現在認識処理がど
の程度進んでいるかを一目に把握することができ、問題
発生時の対処を速やかに行なうことができ、作業効率が
向上する。
なお、表示手段における表示の形態は、特にこの形態
に限定されるものではなく、例えば第3図に示すように
文字行部分を下線や中心線で示すようにしても良い。こ
のように、文字列領域を単純な枠や線で置換えれば、高
解像度ディスプレイを必要とせず、しかも表示のための
処理時間も短くなるという利点がある。
しかし、本発明はこのような表示形態に限定されるも
のではなく、例えば第4図に示すように、文字列そのも
の、つまり読取った原画そのものを表示するようにして
も良い。この場合、第4図に示すように抽出された文字
列領域を枠や下線で重ね書するようにすれば、文字行が
正しく抽出されたかどうかを一目で確認できるという効
果がある。
また、処理中の文字列を他の文字列とは区別する方法
としては、処理中の文字列領域若しくは文字列そのもの
を、反転、点滅、異なる色、異なる輝度等、他の文字列
領域若しくは文字列とは異なる表示形態を取れば良い。
また、文字列そのものを表示した場合には、処理中の文
字列に下線を付すなどの区別方法も考えられる。
また、上記の例において、認識結果が求まる度に原画
情報としての文字行を認識結果の文字行に置換えて行く
ようにしても良い。更には、第5図に示すように、文字
領域に認識結果を順次埋めて行くようにしても良い。ま
た、文字列の認識結果として、まず各文字の認識結果を
表示し、続いて単語、文節或は文字列全体等の認識結果
を表示するようにしても良い。このようにすると、処理
の流れが良好に把握できる。この際、どの文字を処理し
ているかを前述した方法で区別し得るようにしておくと
更に処理の進行状況が良く分る。
[発明の効果] 以上のように本発明によれば、画像データの構造解析
によって抽出された文字行領域のうち、枠の表示形態を
変化させることにより、前記文字行認識手段による前記
文字行領域に対する認識処理の進行状況を呈示し、例え
ば、現在認識処理を実行中の文字行領域に対応する枠に
関する表示形態を、他の枠に関する表示形態とは異なる
ものになるように制御し、これと同時に認識結果をも表
示するので、使用者は、処理の進行状態を容易に把握す
ることができ、問題が発生した場合でも、これを速やか
に発見でき、作業効率の向上が図れるという効果を奏す
る。
【図面の簡単な説明】
第1図は本発明の一実施例に係る文書読取り装置のブロ
ック図、第2図は同装置における表示手段の表示形態を
示す図、第3図乃至第5図は本発明の他の実施例に係る
表示手段の表示形態をそれぞれ示す図である。 11…画像入力手段、12…画像メモリ、13…文字行抽出手
段、14…表示手段、15…文字行領域メモリ、16…文字行
認識手段、17…辞書、18…入力文書。

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】入力文書を画像データとして入力する画像
    入力手段と、 この画像入力手段を介して入力された画像データを記憶
    する画像メモリと、 この画像メモリに記憶された画像データを構造解析して
    前記入力文書における文字行領域を抽出する文字行抽出
    手段と、 この文字行抽出手段によって抽出された各文字行領域を
    示す枠の各々を、前記入力文書における各文字行領域の
    位置関係を維持して表示する手段と、 前記文字行抽出手段によって抽出された文字行領域に記
    述された文字行の画像データを順次読込んで認識する文
    字行認識手段と、 この文字列認識手段の認識結果を、認識処理の進行に沿
    って逐次表示する手段と、 前記枠の表示形態を変化させることにより、前記文字行
    認識手段による認識処理の前記文字行領域に対する進行
    状況を呈示する手段とを具備したことを特徴とする文書
    読取り装置。
  2. 【請求項2】前記文字列認識手段の認識結果を、前記枠
    の表示領域とは別の領域に表示することを特徴とする請
    求項1に記載の文書読取り装置。
  3. 【請求項3】前記文字列認識手段の認識結果を、その認
    識結果に係る文字行領域に対応する枠の内部に表示する
    ことを特徴とする請求項1に記載の文書読取り装置。
  4. 【請求項4】前記枠を表示するにあたっては、各枠の内
    部に、その枠に対応する文字行領域に記述された文字行
    の画像データを表示することを特徴とする請求項1に記
    載の文書読取り装置。
  5. 【請求項5】前記認識処理の進行状況を呈示するにあた
    っては、前記文字行認識手段が現在処理対象としている
    文字行領域に対応する枠に関する表示形態を、他の枠に
    関する表示形態とは異なるものになるように制御するこ
    とを特徴とする請求項1に記載の文書読取り装置。
JP63068172A 1988-03-24 1988-03-24 文書読取り装置 Expired - Lifetime JP2746904B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63068172A JP2746904B2 (ja) 1988-03-24 1988-03-24 文書読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63068172A JP2746904B2 (ja) 1988-03-24 1988-03-24 文書読取り装置

Publications (2)

Publication Number Publication Date
JPH01241684A JPH01241684A (ja) 1989-09-26
JP2746904B2 true JP2746904B2 (ja) 1998-05-06

Family

ID=13366085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63068172A Expired - Lifetime JP2746904B2 (ja) 1988-03-24 1988-03-24 文書読取り装置

Country Status (1)

Country Link
JP (1) JP2746904B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6408055B2 (ja) * 2017-03-22 2018-10-17 株式会社東芝 情報処理装置、方法及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0762859B2 (ja) * 1985-10-18 1995-07-05 株式会社日立製作所 文字パターン認識修正装置
JPS6334681A (ja) * 1986-07-29 1988-02-15 Toshiba Corp 文字認識装置
JPS63115283A (ja) * 1986-10-31 1988-05-19 Nec Home Electronics Ltd 文字認識装置における認識結果修正画面の表示方法
JPS63204487A (ja) * 1987-02-20 1988-08-24 Nippon Telegr & Teleph Corp <Ntt> 文字読取方法

Also Published As

Publication number Publication date
JPH01241684A (ja) 1989-09-26

Similar Documents

Publication Publication Date Title
JP4996940B2 (ja) 帳票認識装置およびそのプログラム
JP2713622B2 (ja) 表形式文書読取装置
JP4733577B2 (ja) 帳票認識装置及び帳票認識プログラム
JP2746904B2 (ja) 文書読取り装置
JP3000349B2 (ja) キー入力編集方法及び編集装置
JPS61272882A (ja) 情報認識装置
JPH07160810A (ja) 文字認識装置
JP3006294B2 (ja) 光学的文字読取装置
JP2950286B2 (ja) 画面イメージ読み取り装置
JP2649807B2 (ja) 文字読取装置
JPH01201789A (ja) 文字読取装置
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH08106513A (ja) 手書き文字認識装置
JPH06149888A (ja) 電子ファイリングシステム
JPH08263591A (ja) 文字認識装置及び方法
JPS62103784A (ja) 文字読取装置
JPH06139277A (ja) 電子辞書装置
JPS63188284A (ja) 文字読取装置
JPH09251510A (ja) 光学的文字読取装置
JPS62118490A (ja) 文字認識装置の誤入力文字修正方式
JPS61226883A (ja) 文字認識装置
JPS61229177A (ja) 濁点・半濁点付き文字の認識方式
JPS61198383A (ja) 文字修正装置
JP2000020638A (ja) 文字列方向判別方法
JPH09204491A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080213

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090213

Year of fee payment: 11