JPH0424782A - 文書処理装置 - Google Patents
文書処理装置Info
- Publication number
- JPH0424782A JPH0424782A JP2125932A JP12593290A JPH0424782A JP H0424782 A JPH0424782 A JP H0424782A JP 2125932 A JP2125932 A JP 2125932A JP 12593290 A JP12593290 A JP 12593290A JP H0424782 A JPH0424782 A JP H0424782A
- Authority
- JP
- Japan
- Prior art keywords
- character
- line
- paragraph
- recognition
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009795 derivation Methods 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 13
- 238000000034 method Methods 0.000 description 12
- 238000001514 detection method Methods 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文字認識装置に関し、特にOCR(光学式文
字読み取り装置)に関するものである。
字読み取り装置)に関するものである。
新聞や書籍等の記事を電子化し、フフイリンクしたり、
データベース化することにより、効率的にそれらを利用
しようとする動きが急速に高まってきており、印刷文書
を高速・高精度に入力できる文字認識装置の開発が急か
れている。
データベース化することにより、効率的にそれらを利用
しようとする動きが急速に高まってきており、印刷文書
を高速・高精度に入力できる文字認識装置の開発が急か
れている。
この文字認識装置の一つにOCR(光学式文字読取装置
)がある。
)がある。
従来、このOCRで認識した文書の出力形態は固定され
ており、ユーザが出力形態を指定することはできなかっ
た。つまり、目的の文書の体裁を無視し、文字コードだ
けを表示するか、目的の文書の体裁に合わせて、空白、
改行コートを出力するかは、あらかじめ決められていた
。又、段落の認識を高精度に認識することはできなかっ
た。
ており、ユーザが出力形態を指定することはできなかっ
た。つまり、目的の文書の体裁を無視し、文字コードだ
けを表示するか、目的の文書の体裁に合わせて、空白、
改行コートを出力するかは、あらかじめ決められていた
。又、段落の認識を高精度に認識することはできなかっ
た。
しかし、上記従来例では、出力形態をユーザが変更てき
ないため次のような欠点があった。
ないため次のような欠点があった。
(1)文字コートのみの出力の場合、目的の文書形態に
合わせて認識後にあらためて空白、改行コートの入力を
行う。
合わせて認識後にあらためて空白、改行コートの入力を
行う。
(2)初めから空白、段落を共に認識し、表示部に表示
すると、認識に時間がかかるという問題点が起こる。
すると、認識に時間がかかるという問題点が起こる。
つまり、出力形態を指定できないと、目的の文書を得る
のに時間がかかるという問題点があった。
のに時間がかかるという問題点があった。
(3)又、段落を認識する場合であっても、高精度に段
落を認識することができないという問題点があった。
落を認識することができないという問題点があった。
〔課題を解決するための手段]
本発明によれば、目的の出力形態を指定するための指示
手段、文字情報を格納するための記憶手段、空白、改行
、段落等の出力を制御する制御手段、文字の識別処理を
行う認識手段を設けることにより、ユーザが指定した認
識上−トに従って文字を認識し、出力することが可能で
ある。
手段、文字情報を格納するための記憶手段、空白、改行
、段落等の出力を制御する制御手段、文字の識別処理を
行う認識手段を設けることにより、ユーザが指定した認
識上−トに従って文字を認識し、出力することが可能で
ある。
本発明によれば、文字行の間隔、或いは文字行の先頭部
の空白、或いは文字行の最終文字位置から高精度に段落
を認識することが可能となる。
の空白、或いは文字行の最終文字位置から高精度に段落
を認識することが可能となる。
以下に本発明の1実施例について詳細に説明する。
尚、本発明は、文字認識装置、或いは、文字認識装置を
有した文字処理装置に適用でき、又、1つの機器から成
る装置であっても良いし、複数の機器から成るシステム
であっても良いことは言うまでもない。
有した文字処理装置に適用でき、又、1つの機器から成
る装置であっても良いし、複数の機器から成るシステム
であっても良いことは言うまでもない。
第1図はこの発明の一実施例を示す文字認装置のブロッ
ク図であり、1はCRT表示部で、ラスクスキャンして
文書画像データを表示する。2はヒデオRAM(VRA
M)で、CRT表示部1の1画面のパターン展開情報を
記憶する。3は表示制御部で、VRAM2へのパターン
展開制御およびCRT表示部1へのパターン読み出しを
制御する。4はマイクロプロセッサ(MPU)で、各部
を総括的に制御する。5は主メモリで、制御プログラム
を内蔵するROMとデータ処理のためのワークメモリと
なるRAMから構成されている。6は文字認識部で、文
字イメージとパターンの整合をおこない文字コートを出
力する。7は外部磁気ディスク装置で、識別結果、及び
候補文字が書き込まれる。8はこの発明の指示手段を兼
ねるポイシテインクデハイス(PD)で、CRT表示部
1の任意の位置を指定する、9はキーホード、10はI
10ハスで、各フロックとMPU4とを接続する。
ク図であり、1はCRT表示部で、ラスクスキャンして
文書画像データを表示する。2はヒデオRAM(VRA
M)で、CRT表示部1の1画面のパターン展開情報を
記憶する。3は表示制御部で、VRAM2へのパターン
展開制御およびCRT表示部1へのパターン読み出しを
制御する。4はマイクロプロセッサ(MPU)で、各部
を総括的に制御する。5は主メモリで、制御プログラム
を内蔵するROMとデータ処理のためのワークメモリと
なるRAMから構成されている。6は文字認識部で、文
字イメージとパターンの整合をおこない文字コートを出
力する。7は外部磁気ディスク装置で、識別結果、及び
候補文字が書き込まれる。8はこの発明の指示手段を兼
ねるポイシテインクデハイス(PD)で、CRT表示部
1の任意の位置を指定する、9はキーホード、10はI
10ハスで、各フロックとMPU4とを接続する。
尚、第1図のブロック図では、文字認識装置として説明
したが、前述した様に文字処理装置において、認識機能
を付加しても良く、その場合は、前述のROMは、文書
処理プロクラムをも格納しているものである。又、MP
Uは、文字認識部6にも設けられ、MPU4による文書
処理制御と並行的に処理が行なわれるものである。
したが、前述した様に文字処理装置において、認識機能
を付加しても良く、その場合は、前述のROMは、文書
処理プロクラムをも格納しているものである。又、MP
Uは、文字認識部6にも設けられ、MPU4による文書
処理制御と並行的に処理が行なわれるものである。
文書編集中に、画面上で、認識処理への移行の為のアイ
コンが表示され、そのアイコンをPD等で指示すると、
認識処理に移行し、例えば認識結果の出力形態を選択す
るメニューが表示される。或いは、スキャナからのイメ
ージを入力を行う為のアイコンを指示すると、自動的に
上述の第2図に示すメニューが表示される様にしても良
い。
コンが表示され、そのアイコンをPD等で指示すると、
認識処理に移行し、例えば認識結果の出力形態を選択す
るメニューが表示される。或いは、スキャナからのイメ
ージを入力を行う為のアイコンを指示すると、自動的に
上述の第2図に示すメニューが表示される様にしても良
い。
第2図は、CRT表示部1に表示された、出力形態を任
意に選択するためのメニュー画面である。この画面によ
り、ユーザは任意に出力形態を指示することかできる。
意に選択するためのメニュー画面である。この画面によ
り、ユーザは任意に出力形態を指示することかできる。
認識結果出力部は、文字認識装置の出力データから指定
された出力モートに従った形態の文字列を生成する。
された出力モートに従った形態の文字列を生成する。
第3図(a)は、文書画像の一例を模式的に示した図で
ある。斜線の矩形(31)は各文字の外接矩形を示す。
ある。斜線の矩形(31)は各文字の外接矩形を示す。
また、32は文字行の矩形を示している。
文字認識装置では、文字の切り出し処理により文書画像
から各文字の外接矩形を求め、続いて、その文字画像に
対する文字コートを求める。これら各文字の文字コート
と外接矩形の位置は、本装置のRAM上に格納される。
から各文字の外接矩形を求め、続いて、その文字画像に
対する文字コートを求める。これら各文字の文字コート
と外接矩形の位置は、本装置のRAM上に格納される。
尚、文字認識装置における文字の切り出し処理では、文
書画像に対して、まず、文字行方向の度数分布を求め文
字行の位置を検出し、ついて、各文字行部分の画像を文
字行と垂直方向の度数分布を求めることにより、その文
字行にある文字の左右端を検出している。従って、文字
認識の対象てある文書の各行における先頭の文字と最後
の文字がとれであるかは文字認識装置により識別される
ので、その情報もRAM上に格納しておく。
書画像に対して、まず、文字行方向の度数分布を求め文
字行の位置を検出し、ついて、各文字行部分の画像を文
字行と垂直方向の度数分布を求めることにより、その文
字行にある文字の左右端を検出している。従って、文字
認識の対象てある文書の各行における先頭の文字と最後
の文字がとれであるかは文字認識装置により識別される
ので、その情報もRAM上に格納しておく。
第4図は、本装置のRAM上の主要なデータを示した図
である。
である。
文字情報格納領域41には、各文字に対する7つの情報
を文字の出現順に格納しである。CD (i) (0≦
1〈全文字数)は、文字認識装置によって得られた文字
コード、又、第3図(b)に示す様に、CPX(i)、
CPY (i)、CPW(i)、CPH(i)は外接矩
形を表し、CPX (i)、CPY (i)はそれぞれ
、外接矩形の左上端のXXY座標を、CPW(i)、C
PH(i)はそれぞれ、幅及び高さを表わす。BL (
i)は、その文字の直前に幾つの空白文字が入るかを表
わし、LP (i)は、段落の区切りとして、その文字
の直後にいくつの改行文字を入れるかを表わす。BL(
i)、 LF (i)は初期値は0てあり、後述の処理
により適宜、値が格納される。BL (i)、LF (
i)以外のフィールドは文字認識装置によって値か格納
される。
を文字の出現順に格納しである。CD (i) (0≦
1〈全文字数)は、文字認識装置によって得られた文字
コード、又、第3図(b)に示す様に、CPX(i)、
CPY (i)、CPW(i)、CPH(i)は外接矩
形を表し、CPX (i)、CPY (i)はそれぞれ
、外接矩形の左上端のXXY座標を、CPW(i)、C
PH(i)はそれぞれ、幅及び高さを表わす。BL (
i)は、その文字の直前に幾つの空白文字が入るかを表
わし、LP (i)は、段落の区切りとして、その文字
の直後にいくつの改行文字を入れるかを表わす。BL(
i)、 LF (i)は初期値は0てあり、後述の処理
により適宜、値が格納される。BL (i)、LF (
i)以外のフィールドは文字認識装置によって値か格納
される。
文字行情報格納領域42には、各文字行に関する情報が
文字行の出現順に格納される。LS (i)にはその文
字行に含まれる文字に対する文字情報格納領域の先頭の
文字へのアドレスが格納されている。
文字行の出現順に格納される。LS (i)にはその文
字行に含まれる文字に対する文字情報格納領域の先頭の
文字へのアドレスが格納されている。
又、第3図(b)に示す様に、LPX (j)、LPY
(j)LPW(j)、LPH(j)は文字行の矩形を
表わし、その文字行に含まれる全文字を包含する最小の
矩形である。PT (Dはその文字行を構成する文字列
の文字ピッチで、各文字位置から平均的な値を求め格納
する。また同様に、WD(j)は、その文字行の平均的
な文字幅を表わす。
(j)LPW(j)、LPH(j)は文字行の矩形を
表わし、その文字行に含まれる全文字を包含する最小の
矩形である。PT (Dはその文字行を構成する文字列
の文字ピッチで、各文字位置から平均的な値を求め格納
する。また同様に、WD(j)は、その文字行の平均的
な文字幅を表わす。
第5図は認識結果出力部のフローである。
まず文書の左右端検出部55−1では、対象の文書画像
(例えば第7図)の左端のX座標LX、右端のX座標R
X、を求める。左端座標LXは文字行情報格納領域42
の各文字行矩形の左端LPX (J) (0≦j<NL
)(NLは文字行数)の最小値として求める。同様に、
右端RXには各文字行の右端座標LPX(j) +LP
W (j)が最大のものを選ぶ。求められた文書の左端
LX及び右端RXはRAM上に保存しておく。
(例えば第7図)の左端のX座標LX、右端のX座標R
X、を求める。左端座標LXは文字行情報格納領域42
の各文字行矩形の左端LPX (J) (0≦j<NL
)(NLは文字行数)の最小値として求める。同様に、
右端RXには各文字行の右端座標LPX(j) +LP
W (j)が最大のものを選ぶ。求められた文書の左端
LX及び右端RXはRAM上に保存しておく。
文字高さ検出部55−2では、文書中の本文に相当する
部分の文字高さFHを求める。本文以外の文字行を除外
するため、前行と同し高さを持つ文字行矩形が最も多く
連続して現われる部分を抽出し、それらの高さの平均を
持って文字高さFHとする。
部分の文字高さFHを求める。本文以外の文字行を除外
するため、前行と同し高さを持つ文字行矩形が最も多く
連続して現われる部分を抽出し、それらの高さの平均を
持って文字高さFHとする。
隣接する文字行が同じ高さを持つかとうかの判定は
l −α < LPH(j −1) /LPH(
))<1 + α但し 1≦j<NL ・・・・・・・・・・・・・式S5−2−1で行なう。
))<1 + α但し 1≦j<NL ・・・・・・・・・・・・・式S5−2−1で行なう。
αは誤差を吸収するためのもので、例えば、0.2を、
用いる。これにより、第7図における見出し部7−1が
除外される。
用いる。これにより、第7図における見出し部7−1が
除外される。
文字行間隔検出部55−3では、本文に相当する部分の
文字行間隔LSを求める。文字高さ検出部と同様に、前
文字行間スペースと同じ文字行間スペースが最も多く連
続して現われる部分を抽出し、それらの平均をもって文
字行間隔LSとする。隣接する文字行間隔が、同じかど
うかの判定は、1−α< (LPY (j + 1)−
LPY l) +LPH(j)))/(LPY (j)
−(LPY (j−1)+LPH(j −1)))
< 1+α但し 1≦j<NL 1 ・・・・・・・・・・・・・式S5−3−1て行なう。
文字行間隔LSを求める。文字高さ検出部と同様に、前
文字行間スペースと同じ文字行間スペースが最も多く連
続して現われる部分を抽出し、それらの平均をもって文
字行間隔LSとする。隣接する文字行間隔が、同じかど
うかの判定は、1−α< (LPY (j + 1)−
LPY l) +LPH(j)))/(LPY (j)
−(LPY (j−1)+LPH(j −1)))
< 1+α但し 1≦j<NL 1 ・・・・・・・・・・・・・式S5−3−1て行なう。
文字高さFH及び文字行間隔LSはRAM上に保存して
おく。これにより、後述の第7図においては、7−2と
7−3が識別できる。
おく。これにより、後述の第7図においては、7−2と
7−3が識別できる。
空白検出部55−4では、各文字行内で空白文字相当の
空白を見付は文字情報格納領域41のBL (i)に格
納する。
空白を見付は文字情報格納領域41のBL (i)に格
納する。
文字行jて、文字i−1と文字i(1≦l〈文字行Jて
の文字数)との間の空白の長さCPX (i)−(CP
X(i −1) 十CPW (i −1))が、その文
字行の文字ピッチPT (j)の何倍になっているかを
算出し、最も整数値をBL (i)に格納する。■空白
分もおいていない場合には、0を代入する。また文字行
最初の文字Sに対しては、文書左端座標LXとCPx
(S)との差が文字ピッチPT (j)の何整数倍にな
っているかを算出しBL (s)に格納する。
の文字数)との間の空白の長さCPX (i)−(CP
X(i −1) 十CPW (i −1))が、その文
字行の文字ピッチPT (j)の何倍になっているかを
算出し、最も整数値をBL (i)に格納する。■空白
分もおいていない場合には、0を代入する。また文字行
最初の文字Sに対しては、文書左端座標LXとCPx
(S)との差が文字ピッチPT (j)の何整数倍にな
っているかを算出しBL (s)に格納する。
段落検出部55−5では、段落の区切りを見付け、その
区切りの文字のLF (i)に所定の値を格納する。
区切りの文字のLF (i)に所定の値を格納する。
段落の区切りは、以下の条件で定める。
(1)文字行間隔が本文文字行間隔LSに比べ大きい部
分は段落の変わり目である。
分は段落の変わり目である。
(2)文字行の先頭部に空白がある文字行は、段落の先
頭行である。
頭行である。
(3)文字行最後の文字が文書右端まで至っていない文
字行は段落最終行である。
字行は段落最終行である。
具体的には(1) (2) (3)は次のいづれかの条
件式を満足する場合に段落の境界とする。
件式を満足する場合に段落の境界とする。
文字行j(1≦j<NL)について、
(1’) (LPY(j)−LPY(ノー 1)+L
PH(j)))/LS〉 m (2’)BL (s)>Q (3’)RX−CPX (e)>2WD (J)こ
こでSは文字行Jの先頭文字の文字番号、eは前文字行
j−1の最後の文字の文字番号とする。mは例えば2を
その値とする。
PH(j)))/LS〉 m (2’)BL (s)>Q (3’)RX−CPX (e)>2WD (J)こ
こでSは文字行Jの先頭文字の文字番号、eは前文字行
j−1の最後の文字の文字番号とする。mは例えば2を
その値とする。
(2′)あるいは(3′)が成立した場合には、LF(
e)l:1を代入する。また(1′)が成立した場合に
は、(LPY (j) −(LPY (j −1) +
LPH(jl))) 7/ (FH+LS)の値に最
も近い整数値か1以上の時にはその整数値+1の値を、
整数値が0の時には、2をLF (e)に代入する。尚
、処理の手順の詳細は、第7図、第8図において説明す
る。
e)l:1を代入する。また(1′)が成立した場合に
は、(LPY (j) −(LPY (j −1) +
LPH(jl))) 7/ (FH+LS)の値に最
も近い整数値か1以上の時にはその整数値+1の値を、
整数値が0の時には、2をLF (e)に代入する。尚
、処理の手順の詳細は、第7図、第8図において説明す
る。
文字列出力部55−6では、指定された出力モートに従
って、所望の文字列を出力する。
って、所望の文字列を出力する。
出力モートは、行内の空白を認識するかしないかと、改
行コートを認識文書の行末毎に入れるか、段落ごとに入
れるか、それとも改行コートをどこにもいれないかが指
定できる。
行コートを認識文書の行末毎に入れるか、段落ごとに入
れるか、それとも改行コートをどこにもいれないかが指
定できる。
第6図6は文字列出力部の詳細なフローである。
0からNL−1のNL行の文字行に対して、56−3〜
S6−14の処理を行なう。56−3では、文字行Jの
最初の文字の文字番号をlに代入する。文字行最初の文
字は文字行情報格納領域のLS (J)から知ることが
できる。文字行Jの各文字について、56−5〜S6−
12の処理を行なう。その文字行の最後の文字であるか
とうかは56−4の条件分岐で行なう。まず、出力モー
トが行内の空白を認識するモートの時で(S6−5)、
かつ文字lの前に空白文字分のスペースがおいている場
合(S6−6)には、56−7でBL (i)この空白
文字を出力する。
S6−14の処理を行なう。56−3では、文字行Jの
最初の文字の文字番号をlに代入する。文字行最初の文
字は文字行情報格納領域のLS (J)から知ることが
できる。文字行Jの各文字について、56−5〜S6−
12の処理を行なう。その文字行の最後の文字であるか
とうかは56−4の条件分岐で行なう。まず、出力モー
トが行内の空白を認識するモートの時で(S6−5)、
かつ文字lの前に空白文字分のスペースがおいている場
合(S6−6)には、56−7でBL (i)この空白
文字を出力する。
そうでない場合には、何も出力せず、56−8の処理に
移る。56−8では、認識装置で認識された結果の文字
コート’CD(i)を出力する。その後、出力モードが
段落の終わりに改行コートを認識するモートの時で(S
6−9)、かつ改行コートを入れるべき場合(S6−1
0)、S6−11でLF (i)個の改行コートを出力
する。文字行jの全文字が終了した場合、S6−13で
出力モートが、行末毎に改行するモードであるかを判断
し、その場合には、無条件に36−14で1個の改行コ
ートを出力する。56−2で全文字行が終了したと判断
された時に本処理は終了する。
移る。56−8では、認識装置で認識された結果の文字
コート’CD(i)を出力する。その後、出力モードが
段落の終わりに改行コートを認識するモートの時で(S
6−9)、かつ改行コートを入れるべき場合(S6−1
0)、S6−11でLF (i)個の改行コートを出力
する。文字行jの全文字が終了した場合、S6−13で
出力モートが、行末毎に改行するモードであるかを判断
し、その場合には、無条件に36−14で1個の改行コ
ートを出力する。56−2で全文字行が終了したと判断
された時に本処理は終了する。
本実施例では、出力モートの種類に関わらず、55−1
=35−5の処理を全て行なっているが、出力モートに
応じて幾つかの処理をスキップしてもよい。例えば、段
落を認識しなくてもよいモートの時は、85−2.55
−3の処理をする必要はない。
=35−5の処理を全て行なっているが、出力モートに
応じて幾つかの処理をスキップしてもよい。例えば、段
落を認識しなくてもよいモートの時は、85−2.55
−3の処理をする必要はない。
また段落、行内の空白共に認識しなくてもよいモートの
時は、55−1〜85〜5の処理は必要ない。このよう
な制御を組み込む事によって処理速度の向上をはかるこ
とができる。
時は、55−1〜85〜5の処理は必要ない。このよう
な制御を組み込む事によって処理速度の向上をはかるこ
とができる。
次に、第5図の段落検出部85−5について、詳述する
。ここでは、段落の区切りを見つけ、その区切りの文字
のLF (i)に所定の値を格納する。
。ここでは、段落の区切りを見つけ、その区切りの文字
のLF (i)に所定の値を格納する。
段落の区切りは、以下の条件により定める。
(1)文字行間隔が本文文字行間隔LSに比べ大きい部
分は段落の変わり目である。
分は段落の変わり目である。
(2)文字行の先頭部に空白がある文字行は、段落の先
頭行である。
頭行である。
(3)文字行最後の文字が文書右端まで至っていない文
字行は段落最終行である。
字行は段落最終行である。
第7図は、入力文書の模式図である。
第7図の文書例では、文字行7−1は見出し部、7−2
は本文、7−3は例えば側条書き部分に相当する。本段
落検出部では、文字行7−1、文字行7−4から文字行
7−5まで、文字行7−6から文字行7−7まで、文字
行7−8から文字行7−9まで、文字行7−1Oを段落
として検出することを目的とする。尚、文字行7−8は
、右端まで文字があるので、文字行7−9まで連続して
いるわけである。
は本文、7−3は例えば側条書き部分に相当する。本段
落検出部では、文字行7−1、文字行7−4から文字行
7−5まで、文字行7−6から文字行7−7まで、文字
行7−8から文字行7−9まで、文字行7−1Oを段落
として検出することを目的とする。尚、文字行7−8は
、右端まで文字があるので、文字行7−9まで連続して
いるわけである。
第8図は段落検出部の詳細フローである。
文字行番号OからNL−1のNL個の文字行に対して、
文字行番号1の文字行から順に処理を始める(S8−1
)。各文字行jに対して、58−3から38−12の処
理を行う。まず、文字行Jの先頭の文字番号を第1図の
4或いは5に設けられるレジスタSに格納する。他のレ
ジスタも、前記場所に適宜、設けられており、プログラ
ム上の1つの保持、メモリとして、使用される。レジス
タSの領域はRAM上に確保する。先頭の文字番号は文
字行情報格納領域42のLS (Dから得ることができ
る。同様に、文字行Jの前の文字行j−1の最後の文字
の番号をレジスタeに格納する。eの領域はRAM上に
確保する。前文字行の最後の文字番号は文字行情報格納
領域42のLS (j)が指し示す文字の1つ前の文字
であることから容易に得ることができる。58−5では
文字行j−1と文字行Jとの文字行間隔が本文部の文字
行間隔LSと比較して大きい場合には、文字行Jと文字
行j−1は異なる段落と判断し、58−6の処理に移行
する。
文字行番号1の文字行から順に処理を始める(S8−1
)。各文字行jに対して、58−3から38−12の処
理を行う。まず、文字行Jの先頭の文字番号を第1図の
4或いは5に設けられるレジスタSに格納する。他のレ
ジスタも、前記場所に適宜、設けられており、プログラ
ム上の1つの保持、メモリとして、使用される。レジス
タSの領域はRAM上に確保する。先頭の文字番号は文
字行情報格納領域42のLS (Dから得ることができ
る。同様に、文字行Jの前の文字行j−1の最後の文字
の番号をレジスタeに格納する。eの領域はRAM上に
確保する。前文字行の最後の文字番号は文字行情報格納
領域42のLS (j)が指し示す文字の1つ前の文字
であることから容易に得ることができる。58−5では
文字行j−1と文字行Jとの文字行間隔が本文部の文字
行間隔LSと比較して大きい場合には、文字行Jと文字
行j−1は異なる段落と判断し、58−6の処理に移行
する。
58−5の判断は、具体的には、
(LPY(j)−(LPY(j−1)+LPH(j−1
)))/LS〉m ・式8−5−1 で行う。ここてmは例えば2とする。
)))/LS〉m ・式8−5−1 で行う。ここてmは例えば2とする。
58−6では、空行が何行文かあるか算出しその値をレ
ジスタnに格納する。nは具体的には、n−(LPY(
j)−(LPY(j−1)+LPH(j−1)+LPH
(j−1)))/(PH+LS)・・・・・・・・・・
・・・・式8−6−1その結果、nが1以上の時には(
S8−7)、58−8でLF (e)にn+1の値を格
納する。そうでない場合には、2をLF (e)に格納
する。LF (e)の値は、後に改行コートを出力する
際の改行コートの数に相当する。5−10では、文字行
jの先頭の文字Sの前に空白があるかどうかを判断する
。具体的には、文字情報格納領域41のBL (s)が
Oより大きいかとうかで判断する。空白があると判断さ
れた時には、5−11に移行し、LF (e)に1を格
納する。
ジスタnに格納する。nは具体的には、n−(LPY(
j)−(LPY(j−1)+LPH(j−1)+LPH
(j−1)))/(PH+LS)・・・・・・・・・・
・・・・式8−6−1その結果、nが1以上の時には(
S8−7)、58−8でLF (e)にn+1の値を格
納する。そうでない場合には、2をLF (e)に格納
する。LF (e)の値は、後に改行コートを出力する
際の改行コートの数に相当する。5−10では、文字行
jの先頭の文字Sの前に空白があるかどうかを判断する
。具体的には、文字情報格納領域41のBL (s)が
Oより大きいかとうかで判断する。空白があると判断さ
れた時には、5−11に移行し、LF (e)に1を格
納する。
5−12では、文字行j−1の最後の文字eの後ろに、
空白があるかとうかを判断する。空白は最後の文字eの
位置と文書右端との距離により判断し、具体的には、 RX−CPX(e)>2WD(j−1)−式8−12−
1で定める。これにより、第7図における7−5,7−
9,7−10の行が、各段落の終わりであることが認識
できる。
空白があるかとうかを判断する。空白は最後の文字eの
位置と文書右端との距離により判断し、具体的には、 RX−CPX(e)>2WD(j−1)−式8−12−
1で定める。これにより、第7図における7−5,7−
9,7−10の行が、各段落の終わりであることが認識
できる。
以上の処理をj=1からNL−1まで行い、本処理を終
了する。この結果、段落の区切りは、各文字のLF (
i)の値を参照し、0より大きな値が格納されている文
字が段落の終わりの文字であることから認識できる。
了する。この結果、段落の区切りは、各文字のLF (
i)の値を参照し、0より大きな値が格納されている文
字が段落の終わりの文字であることから認識できる。
以上、詳述した様に、本発明により、文書の段落を高精
度に認識することが可能となる。
度に認識することが可能となる。
第1図は本発明の実施例を示すブロック図、第2図は認
識モート選択画面の説明図、第3図(a)、(b)は文
書画像の1例の模式図、第4図は主要なデータ領域を示
す図、 第5図は認識結果出力部のフロー図、 第6図は文字列出力部の詳細フロー図、第7図は文書画
像の1例を示す模式図、第8図は段落検出のフロー図、 4はMPI、’ 5は主メモリ 6は認識部 躬 3 図 (U) 囮租 (b) t/)w (し)
識モート選択画面の説明図、第3図(a)、(b)は文
書画像の1例の模式図、第4図は主要なデータ領域を示
す図、 第5図は認識結果出力部のフロー図、 第6図は文字列出力部の詳細フロー図、第7図は文書画
像の1例を示す模式図、第8図は段落検出のフロー図、 4はMPI、’ 5は主メモリ 6は認識部 躬 3 図 (U) 囮租 (b) t/)w (し)
Claims (2)
- (1)文書情報の認識を行う認識手段、 前記認識手段による認識の結果から文字行の間隔を導出
する第1導出手段、 前記認識手段による認識の結果から文字行の最終文字位
置を導出する第2導出手段、 前記第1或いは第2導出手段からの情報に基づいて文書
情報の段落を決定する決定手段とを有したことを特徴と
する文書処理装置。 - (2)更に文字行の先頭部に空白があるか否かを判定す
る判定手段を有し、前記第1或いは第2導出手段或いは
前記判定手段からの情報に基づいて、前記決定手段は前
記文書情報の段落を決定することを特徴とする請求項第
1項記載の文書処理装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2125932A JPH0424782A (ja) | 1990-05-15 | 1990-05-15 | 文書処理装置 |
EP91304312A EP0461760B1 (en) | 1990-05-15 | 1991-05-14 | Image processing apparatus and method |
DE69131496T DE69131496T2 (de) | 1990-05-15 | 1991-05-14 | Bildverarbeitungs-Gerät und Verfahren |
US08/401,336 US5754685A (en) | 1990-05-15 | 1995-03-09 | Image processing apparatus with blank character and line space recognition capabilities |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2125932A JPH0424782A (ja) | 1990-05-15 | 1990-05-15 | 文書処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0424782A true JPH0424782A (ja) | 1992-01-28 |
Family
ID=14922532
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2125932A Pending JPH0424782A (ja) | 1990-05-15 | 1990-05-15 | 文書処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0424782A (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1155381A (ja) * | 1997-07-29 | 1999-02-26 | Yasue Mamezaki | 画像認識送受信装置 |
WO2004053724A1 (ja) * | 2002-12-06 | 2004-06-24 | Sharp Kabushiki Kaisha | データ変換装置、データ変換方法、および、データ変換プログラムを記録した記録媒体 |
WO2005016916A3 (fr) * | 2003-08-08 | 2005-09-29 | Aventis Pharma Sa | Quinolines substituées comme antimicrobiens |
US7348434B2 (en) | 2003-08-08 | 2008-03-25 | Antony Bigot | 4-substituted quinoline derivatives, method and intermediates for their preparation and pharmaceutical compositions containing them |
JP2014086006A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 電子機器および方法 |
-
1990
- 1990-05-15 JP JP2125932A patent/JPH0424782A/ja active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1155381A (ja) * | 1997-07-29 | 1999-02-26 | Yasue Mamezaki | 画像認識送受信装置 |
WO2004053724A1 (ja) * | 2002-12-06 | 2004-06-24 | Sharp Kabushiki Kaisha | データ変換装置、データ変換方法、および、データ変換プログラムを記録した記録媒体 |
WO2005016916A3 (fr) * | 2003-08-08 | 2005-09-29 | Aventis Pharma Sa | Quinolines substituées comme antimicrobiens |
US7348434B2 (en) | 2003-08-08 | 2008-03-25 | Antony Bigot | 4-substituted quinoline derivatives, method and intermediates for their preparation and pharmaceutical compositions containing them |
JP2014086006A (ja) * | 2012-10-26 | 2014-05-12 | Toshiba Corp | 電子機器および方法 |
US9025879B2 (en) | 2012-10-26 | 2015-05-05 | Kabushiki Kaisha Toshiba | Electronic apparatus and handwritten document processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20060197999A1 (en) | Image processing apparatus, image processing method, and image processing program | |
US8340433B2 (en) | Image processing apparatus, electronic medium, and image processing method | |
JP3795238B2 (ja) | 文書画像処理装置及び文書画像処理方法 | |
JPH0424782A (ja) | 文書処理装置 | |
EP0461760B1 (en) | Image processing apparatus and method | |
JP5245444B2 (ja) | 情報表示装置及びプログラム | |
JP4935459B2 (ja) | 文字認識方法、文字認識プログラムおよび文字認識装置 | |
JPH0424757A (ja) | 文書処理装置 | |
JPH1049688A (ja) | 画像データの部分消去および部分検出方法 | |
JP3422634B2 (ja) | 手書き文字認識方法及び装置 | |
US5471536A (en) | Figure digitizing system | |
JP3521606B2 (ja) | 文字読取り装置 | |
JP2773127B2 (ja) | 画像編集方法 | |
JPH08202856A (ja) | 画像処理方法 | |
JPH04156694A (ja) | 文字認識方式 | |
JPH0644406A (ja) | 画像処理方法及び装置 | |
JP2834130B2 (ja) | 認識データの確認方法 | |
JPH0610447Y2 (ja) | 画像処理装置 | |
JPH0850632A (ja) | 手書き文字切り出し方法および装置 | |
JP3145265B2 (ja) | 文字認識装置 | |
JPH0962778A (ja) | 文字認識装置 | |
JPH0689328A (ja) | 画像編集装置 | |
JPH1196299A (ja) | 文字認識装置及びその方法 | |
JP2003006236A (ja) | タイヤ用文字列作図システム | |
JPH08221518A (ja) | 光学文字読取装置 |