JPH0962786A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0962786A
JPH0962786A JP7242433A JP24243395A JPH0962786A JP H0962786 A JPH0962786 A JP H0962786A JP 7242433 A JP7242433 A JP 7242433A JP 24243395 A JP24243395 A JP 24243395A JP H0962786 A JPH0962786 A JP H0962786A
Authority
JP
Japan
Prior art keywords
line
recognition
recognized
image
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7242433A
Other languages
English (en)
Inventor
Masahiro Sakurai
雅寛 櫻井
Hirohisa Goto
裕久 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP7242433A priority Critical patent/JPH0962786A/ja
Publication of JPH0962786A publication Critical patent/JPH0962786A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【解決手段】 行間認識処理部6は文書イメージ11の
行間を認識しこれをマーク14等で表示する。オペレー
タがカーソル15を認識対象行のある付近に移動させ、
マウスのクリック等により指示を入力すると、その行が
認識行に指定される。 【効果】 文字認識すべき部分を枠等で指定する場合に
比べて装置側で予め行を認識しているため、行単位の指
定が容易になる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、一旦読み込んだ文
書イメージ中から指定された領域の文字を認識処理する
機能を持つ文字認識装置に関する。
【0002】
【従来の技術】文書に記載された各種の文字を情報処理
装置に文字情報として取り込む場合に、文字が記載され
た部分のイメージを読み取って文字を認識処理する方法
がある。また、このとき、一旦文書のイメージ全体を読
み取って、オペレータが特定の領域を指定することによ
ってその領域の文字認識を行うといった方法もある(特
開平4−5779号公報)。この方法では、ディスプレ
イに文書イメージを表示するとともに、マウス等のポイ
ンティングデバイスを用いて認識すべき領域を指定す
る。この指定方法は、一般に長方形の対角頂点である2
点を指定する方法がよく知られている。この長方形に囲
まれた領域が装置による文字認識の対象となり、この領
域中にある文字を1文字ずつ切り出してパターン認識等
の手法によって文字を認識し該当する文字コードを得
る。
【0003】
【発明が解決しようとする課題】ところで、上記のよう
な従来の文字認識装置には次のような解決すべき課題が
あった。従来の文字認識装置では、上記のよう認識すべ
き行を指定する場合に、マウス等を用いて正確に領域を
指定する必要があった。従って、その領域内に認識を希
望する文字が完全に含まれていなければ、その文字は正
確に認識できない。即ち、領域を指定した場合の境界線
と重なるように認識すべき文字が存在する場合、その文
字は正しく認識することができない。
【0004】一方、逆に認識すべき領域を指定する境界
線上に認識不要な文字の一部が存在した場合、その部分
をいずれか別の文字と誤認識してしまうおそれがあっ
た。従って、オペレータは表示画面上で領域指定を、必
要な文字を確実に含み、不要な文字を一切含まないよう
に正確に行う必要があった。しかしながら、認識処理を
させたい行がディスプレイの1画面に表示しきれないよ
うな場合、画面をスクロールさせながら指定した枠の境
界位置を確認し、指定する範囲を確定させるのは非常に
煩雑な作業であって、境界線が認識を必要とする文字あ
るいは不必要とする文字に重なることが多く、しばしば
範囲を再指定する必要が生じるという問題があった。
【0005】
【課題を解決するための手段】
(構成)本発明は以上の点を解決するため次の構成を採
用する。本発明の文字認識装置は、予め読み取られた文
書イメージを表示する表示部と、この文書イメージを所
定の方向に繰り返し走査して、その走査線上の黒ドット
数を比較することにより、文書の行間を認識し、認識さ
れた行間を文書イメージ上で表示する行間認識処理部
と、行間の表示を目標として、認識対象として指定され
るべき行を表示するイメージ中の所定の領域を指示する
指示入力部と、この指示入力部による指示があった行を
認識対象として認識処理する文字認識部とを備える。
【0006】(説明)文書イメージは、その文章中の認
識対象とされる行を指定するために表示される。文書イ
メージの走査方向は、文書に記載された文字の行方向と
平行な方向で、横書きなら横方向、縦書きなら縦方向に
なる。繰り返し走査は、行間の空白部分を検出するため
だから、この行間を走査線が数回以上通過する程度のピ
ッチで走査線をずらしながら行うことが好ましい。黒ド
ット数を比較するというのは、直接黒ドット数を順に比
較して極小値をとる部分を探すほか、白ドット数を数え
て間接的に黒ドット数を認識する場合を含む。
【0007】行間を認識するというのは、行と行の間を
区切る境界線を検出することを意味し、行間の表示は、
行と行の間を区切る境界線の位置や境界線自体を表示し
たり、各行をそれぞれ区別できるような表示方法を含
む。指示入力部とは、表示画面上で任意の位置にカーソ
ルを移動させてマウスボタンをクリックするようなもの
のほか、ライトペンやデジタイザやキーボードによる特
定の領域の指定等、任意の位置指定手段を含む。これに
より、行間の表示を目標にして、一点でなく適当な広さ
の領域中のどこを指示しても、該当する行の指定が簡単
に行えるようにする。
【0008】(構成)この文字認識装置の行間認識処理
部は、指示入力部により指示すべき所定の領域を、対応
する行とともに、表示画面上で他の部分と区別できるよ
うに表示することが好ましい。 (説明)他の部分と区別できるようにするとは、例えば
異なる色で表示したり、高輝度表示をしたり、枠等で囲
むような表示のことをいう。これによって、各行の境界
が分かりやすくなり行の指定がし易い。
【0009】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。図1は、本発明の装置の具体例を
示すブロック図である。この装置は、画像記憶部1、文
字切り出し部2、文字認識部3、制御部4、指示入力部
5、行間認識処理部6及び表示部7等から構成される。
画像記憶部1は、図示しないイメージリーダ等を用いて
読み込んだ文書イメージ8を記憶しておく部分である。
この文書イメージ8は、文字を記入した領域の二次元座
標がそのまま再現できるような形式で格納されているも
のとする。文字切り出し部2は、この文書イメージ8か
ら指定された領域の文字を1文字ずつ切り出して文字認
識部3に向け出力する部分である。文字認識部3は文字
切り出し部2から受け入れた文字のイメージを予め用意
した辞書パターンと比較してその文字の認識を行い、対
応する文字コードを出力する部分である。
【0010】制御部4は、装置各部の動作を制御するプ
ロセッサ等から構成される。指示入力部5は、例えばマ
ウスやデジタイザ、ライトペンやキーボード等から構成
され、オペレータが文書イメージ中の任意の場所をカー
ソル等で指示し認識対象となる行を指定するような操作
を行う部分である。表示部7は、図に示すように文書イ
メージ11を表示するためのディスプレイ等から構成さ
れる。行間認識処理部6は、表示部7に表示された文書
イメージ11を、設定された一定の方向即ち図に示す走
査線13の方向にその位置をシフトさせながら繰り返し
走査して、走査線13上の黒ドット数を比較し、文書の
行間を認識する処理を行う部分である。また、行間認識
処理部6は、例えば図のマーク14に示すような形式で
この文書イメージ11上に表示する制御を行う部分であ
る。
【0011】図2には、行間認識処理部の動作説明図を
示す。行間認識処理部6は、更に具体的にはこの図に示
すような動作によって文書イメージ11の行間を認識す
る。文書イメージ11に記入された文字の行間を認識す
るには、まず走査線13の向きをその行方向と平行な方
向に設定する。そして、1ライン分ずつ順に走査線13
をシフトさせながら文書イメージ11の全体を走査す
る。そして、1回走査する毎に走査線13上に存在する
黒ドットの数をカウントする。図2(a)の左側には、
その右側に示した文字に対し走査線13を用いて走査し
たときのヒストグラムを示している。図の縦軸は走査位
置で、横軸は黒ドット数である。
【0012】その結果を見ると、丁度文字が記入してあ
る部分の黒ドット数は図の右方向に膨らんだ山状の分布
をしており、行間の余白部分は黒ドット数の極小値を示
している。行間認識処理部6はこのような黒ドット数の
極小部分を行間として認識する。(b)と(c)は、こ
のような行間の具体的な認識方法を示している。即ち、
(b)のヒストグラム17を見ると、極小値を示す左に
凸の部分が比較的シャープなピークを示している。従っ
て、この先端を行間18に指定する。これは、文書イメ
ージ中の文字の行間が非常に狭い場合である。一方、
(c)に示す例は、行間が非常に広く、ヒストグラムの
極小値部分がある幅を持ったケースである。この場合に
は、その極小値部分の中央を行間18とする。
【0013】以上のようにして、図1に示す行間認識処
理部6は文書イメージ11中の行間を認識する。そし
て、図1に示したマーク14のような行間表示をこの行
間部分に行う。なお、このマーク14は、ラインの両端
に三角印を付けた構成となっている。行間の表示方法に
は、この他に後から示すように、各行を枠で囲ったり、
その部分を適当な色で塗りつぶしたような各種の表示が
可能である。
【0014】次に、指示入力部5を用いた行の指定方法
を説明する。図3は、本発明による行指定方法の説明図
である。(a)には、2行の文字列を表示した。例え
ば、従来の行指定方法は、この図に示すように、第1行
目を認識対象行とする場合、その行を取り囲む枠21の
対角頂点XとYをマウス等で指定する。これに対して、
本発明による場合には、既にこの行が装置により認識さ
れているため、枠21の内部のどこにカーソル15を指
示してクリックしてもワンタッチでその行が指定でき
る。従って、例えばディスプレイにこの行全体を映し出
すことができなくても、行の一部が見えている状態でカ
ーソル15を枠21の内部まで移動させクリックすれば
行の指定が可能である。なお、この枠を表示することに
より、先に説明した行間表示としてもよいし、図1に示
したような行間に対応する位置にラインを引く表示を行
ってもよい。(b)と(c)は、その両者の場合の行指
定方法の説明図である。
【0015】(c)は、枠を用いて行を表示した場合の
認識対象行の指定方法を示し、(a)で説明したよう
に、カーソル15を任意の認識対象行を示す枠上に移動
させマウスのボタンをクリックしてその行の指定ができ
る。また、例えば図に示す上から3行分を一括指定する
場合には、最初の行を指示した後、3行目を指示する際
にコントロールキーやシフトキー等の機能キーを同時に
押し下げ、3行分一括指定等を可能にすることができ
る。なお、指定された行と指定されない行とを区別する
ため、予め文書イメージ全体を所定の色で表示し、これ
と区別できる色で行間表示をし、更に指定された行につ
いてはこれらと区別できる特別の色で枠を表示したり、
あるいはその枠の内部を塗りつぶしたりすることができ
る。
【0016】(c)に示すように、行間表示のためのマ
ーク14が、行間に引かれたライン等により構成される
場合は、このラインを境に上側は前行、下側は後行とい
うように装置側で認識し同様の指定を行うことができ
る。即ち、このラインが行指定の境界になる。
【0017】なお、行の指定方法には、この他にも各行
毎に適当な指定し易い大きさのマーク等を用意し、その
マークをクリックすることによって行を指定するといっ
た方法も可能である。いずれの場合にも、ディスプレイ
上で文書イメージ全体を完全に表示しなくても部分的な
表示で確実に行を指定できる方法が可能となる。その結
果、オペレータによる、認識対象の行を指定する操作を
十分に簡略化することができる。なお、その後の指定さ
れた行についての文字の切り出し、文字パターンの認識
あるいは認識結果をディスプレイ等に表示してオペレー
タによる確認処理等については従来と全く同様の手続き
をとる。
【図面の簡単な説明】
【図1】本発明の装置の具体例を示すブロック図であ
る。
【図2】行間認識処理部の動作説明図である。
【図3】本発明による行指定方法の説明図である。
【符号の説明】
1 画像記憶部 2 文字切り出し部 3 文字認識部 4 制御部 5 指示入力部 6 行間認識処理部 7 表示部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 予め読み取られた文書イメージを表示す
    る表示部と、 この文書イメージを所定の方向に繰り返し走査して、そ
    の走査線上の黒ドット数を比較することにより、文書の
    行間を認識し、認識された行間を前記文書イメージ上で
    表示する行間認識処理部と、 前記行間の表示を目標として、認識対象として指定され
    るべき行を表示するイメージ中の所定の領域を指示する
    指示入力部と、 この指示入力部による指示があった行を認識対象として
    認識処理する文字認識部とを備えたことを特徴とする文
    字認識装置。
  2. 【請求項2】 行間認識処理部は、指示入力部により指
    示すべき所定の領域を、対応する行とともに、表示画面
    上で他の部分と区別できるように表示することを特徴と
    する請求項1記載の文字認識装置。
JP7242433A 1995-08-28 1995-08-28 文字認識装置 Pending JPH0962786A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7242433A JPH0962786A (ja) 1995-08-28 1995-08-28 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7242433A JPH0962786A (ja) 1995-08-28 1995-08-28 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0962786A true JPH0962786A (ja) 1997-03-07

Family

ID=17089028

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7242433A Pending JPH0962786A (ja) 1995-08-28 1995-08-28 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0962786A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004015619A1 (ja) * 2002-08-07 2004-02-19 Matsushita Electric Industrial Co., Ltd. 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
CN110659607A (zh) * 2019-09-23 2020-01-07 天津车之家数据信息技术有限公司 数据核对方法、装置、系统及计算设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004015619A1 (ja) * 2002-08-07 2004-02-19 Matsushita Electric Industrial Co., Ltd. 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
JPWO2004015619A1 (ja) * 2002-08-07 2005-12-02 松下電器産業株式会社 文字認識処理装置及び文字認識処理方法、並びに携帯端末装置
CN100338619C (zh) * 2002-08-07 2007-09-19 松下电器产业株式会社 字符识别处理设备、字符识别处理方法和便携式终端设备
JP4566740B2 (ja) * 2002-08-07 2010-10-20 パナソニック株式会社 携帯端末装置
US7903875B2 (en) 2002-08-07 2011-03-08 Panasonic Corporation Character recognition processing device, character recognition processing method, and mobile terminal device
CN110659607A (zh) * 2019-09-23 2020-01-07 天津车之家数据信息技术有限公司 数据核对方法、装置、系统及计算设备

Similar Documents

Publication Publication Date Title
US5025484A (en) Character reader device
US5583543A (en) Pen input processing apparatus
US6396950B1 (en) Information processing method and apparatus
US5123062A (en) OCR for sequentially displaying document layout according to recognition process
US4953225A (en) Handwritten character-recognizing apparatus for automatically generating and displaying character frames
JP3113827B2 (ja) 矩形オブジェクトの認識方法及び認識装置
JPH06274680A (ja) 文書認識方法およびシステム
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH0962786A (ja) 文字認識装置
JP6156740B2 (ja) 情報表示装置及び入力情報補正プログラム並びに入力情報補正方法
JP3113747B2 (ja) 文字認識装置及び文字認識方法
JP3085552B2 (ja) オンライン手書入力装置における文字入力/カーソル指示判定方法
JPH0962778A (ja) 文字認識装置
JPS6337487A (ja) 文字認識装置
JPH0573725A (ja) 手書き文字・図形認識装置
JPH086696A (ja) 情報処理装置及びその情報処理方法
JP2994176B2 (ja) 罫線入力装置
JP3221969B2 (ja) 文字認識装置
JP2915417B2 (ja) 文字認識結果表示方法および装置
JPH06223221A (ja) 文字認識装置
JPH06119486A (ja) 文字認識装置および表示方法
JPH08137987A (ja) 光学式文字読取装置
JPH07134750A (ja) 文書画像認識装置
JPH02297687A (ja) 文字認識装置
JP2958803B2 (ja) アウトライン文字フォント作成装置