JPH0424757A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH0424757A
JPH0424757A JP2125931A JP12593190A JPH0424757A JP H0424757 A JPH0424757 A JP H0424757A JP 2125931 A JP2125931 A JP 2125931A JP 12593190 A JP12593190 A JP 12593190A JP H0424757 A JPH0424757 A JP H0424757A
Authority
JP
Japan
Prior art keywords
character
line
output
document
character line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2125931A
Other languages
English (en)
Inventor
Kinya Takahashi
欣也 高橋
Masashi Kiriyama
桐山 雅至
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2125931A priority Critical patent/JPH0424757A/ja
Priority to DE69131496T priority patent/DE69131496T2/de
Priority to EP91304312A priority patent/EP0461760B1/en
Publication of JPH0424757A publication Critical patent/JPH0424757A/ja
Priority to US08/401,336 priority patent/US5754685A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置に関し、特にOCR(光学式文
字読み取り装置)に関するものである。
〔従来の技術〕
新聞や書籍等の記事を電子化し、ファイリンクしたり、
データヘース化することにより、効率的にそれらを利用
しようとする動きが急速に高まってきており、印刷文書
を高速・高精度に入力できる文字認識装置の開発が急が
れている。
この文字認識装置の−っにOCR(光学式文字読取装置
)がある。
従来、このOCRで認識した文書の出力形態は固定され
ており、ユーザが出力形態を指定することはできなかっ
た。つまり、目的の文書の体裁を無視し、文字コードだ
けを表示するか、目的の文書の体裁に合わせて、空白、
改行コードを出力するかは、あらかじめ決められていた
。又、段落の認識を高精度に認識することはできなかっ
た。
〔発明が解決しようとしている課題〕
しかし、上記従来例では、出力形態をユーザか変更でき
ないため次のような欠点があった。
(1)文字コートのみの出力の場合、目的の文書形態に
合わせて認識後にあらためて空白、改行コートの入力を
行う。
(2)初めから空白、段落を共に認識し、表示部に表示
すると、認識に時間がかかるという問題点か起こる。
つまり、出力形態を指定できないと、目的の文書を得る
のに時間がかかるという問題点があった。
(3)又、段落を認識する場合であっても、高精度に段
落を認識することができないという問題点があった。
〔課題を解決するための手段〕
本発明によれば、目的の出力形態を指定するだめの指示
手段、文字情報を格納するための記憶手段、空白、改行
、段落等の出力を制御する制御手段、文字の識別処理を
行う認識手段を設けることにより、ユーザが指定した認
識モードに従って文字を認識し、出力することが可能で
ある。
本発明によれば、文字行の間隔、或いは文字行の先頭部
の空白、或いは文字行の最終文字位置から高精度に段落
を認識することが可能となる。
〔実施例〕
以下に本発明の1実施例について詳細に説明する。
尚、本発明は、文字認識装置、或いは、文字認識装置を
有した文字処理装置に適用でき、又、1つの機器から成
る装置であっても良いし、複数の機器から成るシステム
であっても良いことは言うまでもない。
第1図はこの発明の一実施例を示す文字認装置のブロッ
ク図であり、lはCRT表示部で、ラスクスキャンして
文書画像データを表示する。2はビデオRAM (VR
AM)で、CRT表示部Iの1画面のパターン展開情報
を記憶する。3は表示制御部で、VRAM2へのパター
ン展開制御およびCRT表示部lへのパターン読み出し
を制御する。4はマイクロプロセッサ(MPU)で、各
部を総括的に制御する。5は主メモリで、制御プログラ
ムを内蔵するROMとデータ処理のためのワークメモリ
となるRAMから構成されている。6は文字認識部で、
文字イメージとパターンの整合をおこない文字コートを
出力する。7は外部磁気ディスク装置で、識別結果、及
び候補文字が書き込まれる。8はこの発明の指示手段を
兼ねるポインティングデバイス(PD)で、CRT表示
部lの任意の位置を指定する。9はキーホード、10は
I10バスで、各ブロックとMPU4とを接続する。
尚、第1図のブロック図では、文字認識装置として説明
したが、前述した様に文字処理装置において、認識機能
を付加しても良く、その場合は、前述のROMは、文書
処理プログラムをも格納しているものである。又、MP
Uは、文字認識部6にも設けられ、MPU4による文書
処理制御と並行的に処理が行なわれるものである。
文書編集中に、画面上で、認識処理への移行の為のアイ
コンが表示され、そのアイコンをPD等で指示すると、
認識処理に移行し、例えば認識結果の出力形態を選択す
るメニューが表示される。或いは、スキャナからのイメ
ージを入力を行う為のアイコンを指示すると、自動的に
上述の第2図に示すメニューが表示される様にしても良
い。
第2図は、CRT表示部1に表示された、出力形態を任
意に選択するためのメニュー画面である。この画面によ
り、ユーザは任意に出力形態を指示することができる。
認識結果出力部は、文字認識装置の出力データから指定
された出力モートに従った形態の文字列を生成する。
第3図(a)は、文書画像の一例を模式的に示した図で
ある。斜線の矩形(31)は各文字の外接矩形を示す。
また、32は文字行の矩形を示している。
文字認識装置では、文字の切り出し処理により文書画像
から各文字の外接矩形を求め、続いて、その文字画像に
対する文字コートを求める。これら各文字の文字コード
と外接矩形の位置は、本装置のRAM上に格納される。
尚、文字認識装置における文字の切り出し処理では、文
書画像に対して、まず、文字行方向の度数分布を求め文
字行の位置を検出し、ついて、各文字行部分の画像を文
字行と垂直方向の度数分布を求めることにより、その文
字行にある文字の左右端を検出している。従って、文字
認識の対象である文書の各行における先頭の文字と最後
の文字かとれであるかは文字認識装置により識別される
ので、その情報もRAM上に格納しておく。
第4図は、本装置のRAM上の主要なデータを示した図
である。
文字情報格納領域41には、各文字に対する7つの情報
を文字の出現順に格納しである。CD (i) (Q≦
1〈全文字数)は、文字認識装置によって得られた文字
コート、又、第3図(b)に示す様に、CPX(i)、
CPY (i)、CPW(i)、CPH(i)は外接矩
形を表し、CPX (i)、CPY (i)はそれぞれ
、外接矩形の左上端のXSY座標を、CPW(i)、C
PH(i)はそれぞれ、幅及び高さを表わす。BL (
i)は、その文字の直前に幾つの空白文字が入るかを表
わし、LF (i)は、段落の区切りとして、その文字
の直後にいくつの改行文字を入れるかを表わす。BL(
i)、 LF (i)は初期値は0であり、後述の処理
により適宜、値が格納される。BL (i)、LP (
i)以外のフィールドは文字認識装置によって値が格納
される。
文字行情報格納領域42には、各文字行に関する情報が
文字行の出現順に格納される。LS (i)にはその文
字行に含まれる文字に対する文字情報格納領域の先頭の
文字へのアドレスが格納されている。
又、第3図(b)に示す様に、LPX (j)、LPY
 (j)LPW (D、LPH(j)は文字行の矩形を
表わし、その文字行に含まれる全文字を包含する最小の
矩形である。PT (j)はその文字行を構成する文字
列の文字ピッチで、各文字位置から平均的な値を求め格
納する。また同様に、WD (j)は、その文字行の平
均的な文字幅を表わす。
第5図は認識結果出力部のフローである。
まず文書の左右端検出部55−1では、対象の文書画像
(例えば第7図)の左端のX座標LX、右端のX座標R
X、を求める。左端座標LXは文字行情報格納領域42
の各文字行矩形の左端LPX (j’) (0≦j<N
L)(NLは文字行数)の最小値として求める。同様に
、右端RXには各文字行の右端座標LPX(j)+LP
W(J)が最大のものを選ぶ。求められた文書の左端L
X及び右端RXはRAM上に保存しておく。
文字高さ検出部55−2ては、文書中の本文に相当する
部分の文字高さFHを求める。本文以外の文字行を除外
するため、前行と同し高さを持つ文字行矩形が最も多く
連続して現われる部分を抽出し、それらの高さの平均を
持って文字高さFHとする。
隣接する文字行が同し高さを持つかとうかの判定1−α
< LPH(j −1) /LPH(j) < 1+α
旦し 1≦j<NL ・・・・・・・・・・・・・式S5−2−1で行なう。
αは誤差を吸収するためのもので、例えば、0,2を、
用いる。これにより、第7図における見出し部7−1が
除外される。
文字行間隔検出部55−3では、本文に相当する部分の
文字行間隔LSを求める。文字高さ検出部と同様に、前
文字行間スペースと同し文字行間スペースが最も多く連
続して現われる部分を抽出し、それらの平均をもって文
字行間隔LSとする。隣接する文字行間隔が、同じかと
うかの判定は、■−α< (LPY(j+1)−LPY
(j)+LPH(j)))/(LPY(j)−(LPY
(j−1)+LPH(j−1)))<1+α 但し 1≦j<NL−1 ・・・・・・・・・・・・・式S5−3−1て行なう。
文字高さFH及び文字行間隔LSはRAM上に保存して
おく。これにより、後述の第7図においては、7−2と
7−3が識別できる。
空白検出部55−4では、各文字行内で空白文字相当の
空白を見付は文字情報格納領域41のBL (i)に格
納する。
文字行Jて、文字】−1と文字i(1≦1〈文字行Jて
の文字数)との間の空白の長さCPX (i) −(C
PX(i−1)+CPW (1−1))か、その文字行
の文字ピッチPT (j’)の何倍になっているかを算
出し、最も整数値をBL (i)に格納する。■空白分
もおいていない場合には、0を代入する。また文字行最
初の文字Sに対しては、文書左端座標LXとCPx (
s)との差が文字ピッチPT (j)の何整数倍になっ
ているかを算出しBL (s)に格納する。
段落検出部55−5では、段落の区切りを見付け、その
区切りの文字のLP (i)に所定の値を格納する。
段落の区切りは、以下の条件で定める。
(1)文字行間隔が本文文字行間隔LSに比べ大きい部
分は段落の変わり目である。
(2)文字行の先頭部に空白がある文字行は、段落の先
頭行である。
(3)文字行最後の文字が文書右端まで至っていない文
字行は段落最終行である。
具体的には(1) (2) (3)は次のいづれかの条
件式を満足する場合に段落の境界とする。
文字行j(1≦j<NL)について、 (1’ ) (LPY(、i) −LPY(j −1)
+L、PH(j)))/LS〉 m (2’)BL  (s)  >0 (3’)RX−CPX  (e)>2WD  (j)こ
こてSは文字行Jの先頭文字の文字番号、eは前文字行
j−1の最後の文字の文字番号とする。mは例えば2を
その値とする。
(2′)あるいは(3′)が成立した場合には、LF(
e)に1を代入する。また(1′)が成立した場合には
、(LPY (J)−(LPY (J−1)+LPH(
jl)))/ (PH+LS)の値に最も近い整数値が
1以上の時にはその整数値+1の値を、整数値が0の時
には、2をLP (e)に代入する。尚、処理の手順の
詳細は、第7図、第8図において説明する。
文字列出力部55−6では、指定された出力モードに従
って、所望の文字列を出力する。
出力モートは、行内の空白を認識するかしないかと、改
行コートを認識文書の行末毎に入れるか、段落ごとに入
れるか、それとも改行コートをとこにもいれないかが指
定できる。
第6図6は文字列出力部の詳細なフローである。
0からNL−1のNL行の文字行に対して、863〜S
6−14の処理を行なう。56−3では、文字行Jの最
初の文字の文字番号を1に代入する。文字行最初の文字
は文字行情報格納領域のLS (j’)から知ることが
できる。文字行jの各文字について、56−5〜S6−
12の処理を行なう。その文字行の最後の文字であるか
とうかは56−4の条件分岐で行なう。まず、出力モー
トが行内の空白を認識するモートの時で(S6−5)、
かつ文字iの前に空白文字分のスペースがおいている場
合(S6−6)には、56−7てBL (i)この空白
文字を出力する。
そうでない場合には、何も出力せず、56−8の処理に
移る。56−8では、認識装置で認識された結果の文字
コーt”CD(i)を出力する。その後、出力モードが
段落の終わりに改行コードを認識するモートの峙て(S
6−9)、かつ改行コードを入れるべき場合(S6−1
0)、S6−11でLP (iン個の改行コードを出力
する。文字行Jの全文字が終了した場合、S6−13て
出力モートが、行末毎に改行するモートであるかを判断
し、その場合には、無条件に36−14で1個の改行コ
ートを出力する。56−2で全文字行か終了したと判断
された時に本処理は終了する。
本実施例では、出力モートの種類に関わらず、55−1
−35−5の処理を全て行なっているが、出力モートに
応じて幾つかの処理をスキップしてもよい。例えば、段
落を認識しなくてもよいモートの時は、55−2.55
−3の処理をする必要はない。
また段落、行内の空白共に認識しなくてもよいモートの
時は、55−1〜55−5の処理は必要ない。このよう
な制御を組み込む事によって処理速度の向上をはかるこ
とができる。
次に、第5図の段落検出部55−5について、詳述する
。ここでは、段落の区切りを見つけ、その区切りの文字
のLF (i)に所定の値を格納する。
段落の区切りは、以下の条件により定める。
(1)文字行間隔が本文文字行間隔LSに比べ大きい部
分は段落の変わり目である。
(2)文字行の先頭部に空白がある文字行は、段落の先
頭行である。
(3)文字行最後の文字が文書右端まで至っていない文
字行は段落最終行である。
第7図は、入力文書の模式図である。
第7図の文書例では、文字行7−1は見出し部、7−2
は本文、7−3は例えば何条書き部分に相当する。本段
落検出部では、文字行7−1、文字行7−4から文字行
7−5まで、文字行7−6から文字行7−7まで、文字
行7−8から文字行7−9まで、文字行7−10を段落
として検圧することを目的とする。尚、文字行7−8は
、右端まで文字があるので、文字行7−9まで連続して
いるわけである。
第8図は段落検出部の詳細フローである。
文字行番号0からNL−1のNL個の文字行に対して、
文字行番号1の文字行から順に処理を始める(S8−1
)。各文字行jに対して、58−3から8812の処理
を行う。まず、文字行jの先頭の文字番号を第1図の4
或いは5に設けられるレジスタSに格納する。他のレジ
スタも、前記場所に適宜、設けられており、プログラム
上の1つの保持、メモリとして、使用される。レジスタ
Sの領域はRAM上に確保する。先頭の文字番号は文字
行情報格納領域42のLS (j)から得ることができ
る。同様に、文字行Jの前の文字行j−1の最後の文字
の番号をレジスタeに格納する。eの領域はRAM上に
確保する。前文字行の最後の文字番号は文字行情報格納
領域42のLS (j)が指し示す文字の1つ前の文字
であることから容易に得ることができる。S85では文
字行j−1と文字行Jとの文字行間隔が本文部の文字行
間隔LSと比較して大きい場合には、文字行jと文字行
j−1は異なる段落と判断し、58−6の処理に移行す
る。
58−5の判断は、具体的には、 (LPY(j)−(LPY(j−1)+LPH(j−1
)))/LS〉m  ・・式8−5−1 て行う。ここてmは例えば2とする。
58−6では、空行か何行文かあるか算出しその値をレ
ジスタnに格納する。nは具体的には、n= (LPY
(j)−(LPY(j−1)+LPH(j−1)+LP
H(j−1)))/(FH+LS)・・・・・・・・・
・・・・・式8−6−1その結果、nが1以上の時には
(S8−7)、S88でLF (e’)にn+1の値を
格納する。そうてない場合には、2をLF (e)に格
納する。LF (e)の値は、後に改行コートを出力す
る際の改行コートの数に相当する。5−10では、文字
行Jの先頭の文字Sの前に空白があるかとうかを判断す
る。具体的には、文字情報格納領域41のBL (s)
がOより大きいかとうがて判断する。空白があると判断
された時には、5−11に移行し、LF (e)に1を
格納する。
5−12では、文字行j−1の最後の文字eの後ろに、
空白があるかとうかを判断する。空白は最後の文字eの
位置と文書右端との距離により判断し、具体的には、 RX−CPX(e)>2WD(j−1)  −式8−1
2−1で定める。これにより、第7図における7−5,
7−9,7−10の行が、各段落の終わりであることが
認識できる。
以上の処理をj=1からNL−1まで行い、本処理を終
了する。この結果、段落の区切りは、各文字のLF (
i)の値を参照し、0より大きな値が格納されている文
字が段落の終わりの文字であることから認識できる。
〔効果〕
以上、詳述した様に、本発明により、所望の文書の体裁
に合わせて、認識された文書を出力することが可能とな
る。
【図面の簡単な説明】
第1図は本発明の実施例を示すブロック図、第2図は認
識モード選択画面の説明図、第3図(a)、(b)は文
書画像の1例の模式図、第4図は主要なデータ領域を示
す図、 第5図は認識結果出力部のフロー図、 第6図は文字列出力部の詳細フロー図、第7図は文書画
像の1例を示す模式図、第8図は段落検出のフロー図、 4はMPU 5は主メモリ 6は認識部

Claims (1)

  1. 【特許請求の範囲】 文書情報の認識を行う認識手段、 文書情報の出力形態を指定する指定手段、 前記指定手段によって指定された出力形態に基づいて、
    前記認識手段によって認識された文書情報の出力形態を
    制御する出力制御手段とを有したことを特徴とする文書
    処理装置。
JP2125931A 1990-05-15 1990-05-15 文書処理装置 Pending JPH0424757A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2125931A JPH0424757A (ja) 1990-05-15 1990-05-15 文書処理装置
DE69131496T DE69131496T2 (de) 1990-05-15 1991-05-14 Bildverarbeitungs-Gerät und Verfahren
EP91304312A EP0461760B1 (en) 1990-05-15 1991-05-14 Image processing apparatus and method
US08/401,336 US5754685A (en) 1990-05-15 1995-03-09 Image processing apparatus with blank character and line space recognition capabilities

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2125931A JPH0424757A (ja) 1990-05-15 1990-05-15 文書処理装置

Publications (1)

Publication Number Publication Date
JPH0424757A true JPH0424757A (ja) 1992-01-28

Family

ID=14922505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2125931A Pending JPH0424757A (ja) 1990-05-15 1990-05-15 文書処理装置

Country Status (1)

Country Link
JP (1) JPH0424757A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026667A (ja) * 2008-07-17 2010-02-04 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2010157241A (ja) * 2008-12-30 2010-07-15 Nhn Corp Ocr結果を補正するための方法、システム、及びコンピュータ読み取り可能な記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302483A (ja) * 1988-05-31 1989-12-06 Fuji Electric Co Ltd 文書読取装置
JPH02125389A (ja) * 1988-07-01 1990-05-14 Ricoh Co Ltd スペース検出方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01302483A (ja) * 1988-05-31 1989-12-06 Fuji Electric Co Ltd 文書読取装置
JPH02125389A (ja) * 1988-07-01 1990-05-14 Ricoh Co Ltd スペース検出方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010026667A (ja) * 2008-07-17 2010-02-04 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP2010157241A (ja) * 2008-12-30 2010-07-15 Nhn Corp Ocr結果を補正するための方法、システム、及びコンピュータ読み取り可能な記録媒体

Similar Documents

Publication Publication Date Title
US6437799B1 (en) Method and apparatus for logical zooming of a directed graph
US5513278A (en) Handwritten character size determination apparatus based on character entry area
US4608662A (en) Method for editing document
KR20060129177A (ko) 스케칭을 통한 사용자 인터페이스 설명의 자동 생성
US5412742A (en) Method for the detection of line width of line image in image processor
US5341465A (en) Method and apparatus for displaying and cutting out region of interest from picture
EP0461760B1 (en) Image processing apparatus and method
JPH0424782A (ja) 文書処理装置
JPH0424757A (ja) 文書処理装置
US5471536A (en) Figure digitizing system
JPH08202856A (ja) 画像処理方法
JP3521606B2 (ja) 文字読取り装置
EP0585610B1 (en) Method and apparatus for inputting handwritten alphanumeric characters and for displaying the input character
JP2773127B2 (ja) 画像編集方法
JPH0773269A (ja) 文字認識結果の照合方法
JPH05303644A (ja) 画像処理装置の図形認識方法
JP2834130B2 (ja) 認識データの確認方法
JPH0668299A (ja) 読み取り結果表示方法、読み取り結果修正方法、およびデータ読み取り装置
JPH04156694A (ja) 文字認識方式
JPH0610447Y2 (ja) 画像処理装置
JP3671263B2 (ja) 原稿イメージ出力装置
JPH0644406A (ja) 画像処理方法及び装置
JPS61198376A (ja) 光学的文字読取装置
JPH0773029A (ja) フローチャートの表示方式
JPH06110600A (ja) 図形、イラスト等の表示タブレットを持つ情報処理機器