JP3083609B2 - 情報処理装置及びそれを用いた文字認識装置 - Google Patents

情報処理装置及びそれを用いた文字認識装置

Info

Publication number
JP3083609B2
JP3083609B2 JP03339154A JP33915491A JP3083609B2 JP 3083609 B2 JP3083609 B2 JP 3083609B2 JP 03339154 A JP03339154 A JP 03339154A JP 33915491 A JP33915491 A JP 33915491A JP 3083609 B2 JP3083609 B2 JP 3083609B2
Authority
JP
Japan
Prior art keywords
character
block
pattern
order
blocks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03339154A
Other languages
English (en)
Other versions
JPH05174114A (ja
Inventor
浩▲史▼ 吉田
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP03339154A priority Critical patent/JP3083609B2/ja
Publication of JPH05174114A publication Critical patent/JPH05174114A/ja
Application granted granted Critical
Publication of JP3083609B2 publication Critical patent/JP3083609B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、文字媒体から抽出し
た文字ブロックの順序関係を判定する情報処理装置及び
それを用いた文字認識装置に関する。
【0002】
【従来の技術】書式未知の文書が持つ情報を文脈に沿っ
て正確に抽出することができれば、種々の機能を有する
情報処理装置、例えば書式未知の文書の文字認識を行う
文字認識装置、この認識文字を音声で或は翻訳して出力
する装置を構築でき、情報処理装置の用途拡大が容易に
なる。
【0003】書式未知文書の文字認識装置として、例え
ば文献1:電子情報通信学会技術報告PRU86−33
に開示されているものがある。この従来装置では、書式
未知の文書画像から周辺分布特徴、線密度特徴及び外接
矩形特徴を抽出し、これら特徴を用いて文書画像から見
出しの文字ブロックや本文の文字ブロック等の文書構成
要素を抽出し、さらにこれら各文字ブロックから文字パ
タンを抽出し、さらに各文字パタンの特徴抽出を行って
文字認識を行う。
【0004】そして本文の文字ブロックの文字認識を行
う場合、例えば文献2:電子情報通信学会論文誌 VO
L.J69−D,No.3,p.400〜409に開示
されているように、一般的に、次式(1)で表される位
置評価値Hを用いて本文の文字ブロックに関し文字認識
を行う順序を決定する。すなわち位置評価値Hの小さい
順に本文の文字ブロックの文字認識を行う。
【0005】H=Xc+ε・Yc …(1) ここで、Xcは文字ブロックの左上隅点のX座標、Yc
は文字ブロックの左上隅点のY座標、及びεは例えば
0.1程度の値の定数である。
【0006】
【発明が解決しようとする課題】しかしながら本文の文
字ブロックのなかには、例えば図2にも示すように太い
文字線の文字ブロック34及び36と、細い文字線の文
字ブロック38及び40とでそれぞれ異なる文脈を構成
するようにしたものもある。従って上述したように位置
評価値hの小さい順に文字認識を行うようにすると、図
2の例では文字ブロック34、38、36及び40の順
に文字認識を行うこととなり、その結果文脈に沿って正
確に認識結果を得ることはできなくなる。
【0007】また文字認識においては、認識精度を高め
るため、一文字単位に認識処理を行った後に何らかの後
処理、例えば言語情報を用いた言語処理(知識処理)を
行う場合がある。この後処理の処理対象は、通常、文の
構造であるので、文脈に沿って認識結果が得られないと
後処理が意味を成さなくなり、その結果、認識精度が低
下し誤認識が増える。そこでオペレータは、これを防止
するため或は誤認識を修正するために、本文の文字ブロ
ックに関し文字認識を行う順序を指定したり或は誤認識
結果を修正したりする必要が生じる。これら順序の指定
作業や誤認識の修正作業は煩雑であり作業性が非常に悪
い。
【0008】この発明の目的は上述した従来の問題点を
解決するため、文字ブロックを同一種類の情報を担う文
字ブロック毎により精度良く順序付けることができる情
報処理装置及びそれを用いた文字認識装置を提供するこ
とにある。
【0009】
【課題を解決するための手段】この目的の達成を図るた
め第一発明の情報処理装置は、文字媒体の画像データか
ら文字ブロックの位置情報を抽出する文字ブロック抽出
部と、文字ブロックの順序関係を判定する順序判定部
と、文字ブロックから文字パタンの切出し情報を抽出す
る切出し部と、文字パタンの切出し情報を利用して各文
字ブロック毎に文字パタンの特徴を抽出するパタン特徴
抽出部とを備え、順序判定部は、文字ブロックの位置情
報から位置評価値を求めると共に文字ブロックを文字パ
タンの特徴が類似するもの同志にグループ分けし、文字
ブロックの順序を各グループ毎に位置評価値の小さい順
或は大きい順に決定することを特徴とする。
【0010】また第二発明の文字認識装置は、文字媒体
の画像データを生成する画像生成部と、画像データが含
む文字ブロックを文字パタンの特徴が類似するもの同志
にグループ分けし文字ブロックの順序を各グループ毎に
決定する第一発明の情報処理装置と、各グループ毎に、
決定された順序に従って順次に文字ブロックを選択する
ブロック選択部と、文字ブロックの選択順次に文字ブロ
ックから文字パタンを切り出す切出し部と、文字パタン
を認識する認識部とを備えて成ることを特徴とする。
【0011】
【作用】第一発明の情報処理装置によれば、文字ブロッ
クの位置情報から位置評価値を求める。これと共に文字
ブロックを文字パタンの特徴が類似するもの同志にグル
ープ分けする。そして文字ブロックの順序を各グループ
毎に位置評価値の小さい順或は大きい順に決定する。
【0012】従って文字ブロックが含む文字パタンの特
徴を文字ブロック単位で異ならせ、文字ブロックが担う
情報の種類を文字パタンの特徴と対応付けている文書、
帳票等の文字媒体において、文字ブロックの順序を同一
種類の情報毎に精度良く決定できる。
【0013】例えば文字媒体を文書とし異なる文脈の文
字ブロックを文書の同一紙面に掲載してある場合を考え
る。この場合、文脈がつながる文字ブロック同志におい
ては一般に、これら各文字ブロックの文字パタンは例え
ば文字線の太さが等しいといった共通の特徴を備える。
また文脈がつながらない文字ブロック同志に関しては一
般に、これら各文字ブロックの文字パタンは互いに例え
ば文字線の太さが異なるといった異なる特徴を備える。
従ってこのような文書の一般的性質に着目すれば、文字
パタンの特徴が互いに類似する文字ブロック同志は文脈
がつながり、また文字パタンの特徴が類似しない文字ブ
ロック同志は文脈がつながらないと判断できる。従って
異なる文脈の文字ブロックを文書の同一紙面に掲載して
ある場合においては、文字ブロックを文字パタンの特徴
が類似するもの同志にグループ分けし文字ブロックの順
序を各グループ毎に位置評価値の小さい順或は大きい順
に決定することによって、各文字ブロックをそれぞれの
文脈に沿ってより精度良く順序付けることができる。
【0014】また第二発明の文字認識装置によれば、上
述の第一発明の作用で説明したように、文字ブロックを
文字パタンの特徴が類似するもの同志にグループ分けし
文字ブロックの順序を各グループ毎に決定する。そして
各グループ毎に、決定された順序に従って順次に文字ブ
ロックを選択し文字ブロックの選択順次に文字ブロック
から文字パタンを切り出す。その結果、複数の異なる文
脈を文書の同一紙面に掲載してある場合でも、各文脈毎
に文脈に沿ってより精度良く文字パタンを切り出すこと
ができる。
【0015】
【実施例】以下、図面を参照し、これら発明の実施例に
つき説明する。尚、図面はこれら発明が理解できる程度
に概略的に示してあるにすぎず、従ってこれら発明を図
示例に限定するものではない。以下の説明では、第二発
明の文字認識装置の実施例の説明と共に第一発明の情報
処理装置の実施例を説明する。
【0016】図1は第一及び第二発明の第一実施例の全
体構成を概略的に示す機能ブロック図である。
【0017】同図において10は第一発明の第一実施例
としての情報処理装置を示し、この情報処理装置10
は、文字媒体の画像データから文字ブロックの位置情報
を抽出する文字ブロック抽出部12と文字ブロックの順
序関係を判定する順序判定部18と文字ブロックから文
字パタンの切出し情報を抽出する切出し部14と文字パ
タンの切出し情報を利用して各文字ブロック毎に文字パ
タンの特徴を抽出するパタン特徴抽出部16とを備え、
順序判定部18は、文字ブロックの位置情報から位置評
価値を求めると共に文字ブロックを文字パタンの特徴が
類似するもの同志にグループ分けし、文字ブロックの順
序を各グループ毎に位置評価値の小さい順或は大きい順
に決定する。
【0018】また20は第二発明の第一実施例としての
文字認識装置を示し、この文字認識装置20は文字媒体
の画像データを生成する画像生成部22と、画像データ
が含む文字ブロックを文字パタンの特徴が類似するもの
同志にグループ分けし文字ブロックの順序を各グループ
毎に決定する情報処理装置10と、各グループ毎に、決
定された順序に従って順次に文字ブロックを選択するブ
ロック選択部24と、文字ブロックの選択順次に文字ブ
ロックから文字パタンを切り出す切出し部26と、文字
パタンを認識する認識部28とを備えて成る。尚、30
は文字認識装置20の出力端子を示す。
【0019】次に図2に示す文書の文字認識を例に取っ
てこの実施例の動作につき説明する。図2は文書の一例
を示す図である。同図において32は文字媒体としての
文書を示し、文書32は文字高さが高い文字から成りひ
とつの文脈を形成する文字ブロック34及び36と、文
字高さが低い文字から成り別のひとつの文脈を形成する
文字ブロック38及び40とを有する。ここに言う文字
は記号及び図形を含む。図中、文字ブロック34〜40
をそれぞれ一点鎖線で囲んで示した。
【0020】画像生成部22はイメージセンサを備え、
主走査方向を文字行方向(以下、水平方向と称す)Xと
し及び副走査方向を文字行方向と直交する方向(以下、
垂直方向と称す)Yとして文書32を光学的に走査す
る。文書32の文字行方向は従来周知の方法により、予
め検出されているものとする。そして画像生成部22は
文書32からの光信号Sを白黒2値のディジタル信号
(画像データ)に変換し、この画像データを図示しない
画像メモリに格納する。画像データの黒ビットは例えば
文字線及び白ビットは文字背景部分を表す。
【0021】ここでは、文書32上に主走査方向をX軸
方向及び副走査方向をY軸方向としたX−Y座標系を設
定し、文書32の走査位置をこの座標系の座標(X、
Y)で表すものとする。また画像メモリ上には文書32
上のX−Y座標系に相対応するX−Y座標系を仮想的に
設定し、画像メモリの各格納場所の位置をメモリ上の座
標系の座標(X、Y)で表す。そして文書32上の走査
位置(X、Y)の画素の画像データを、当該走査位置
(X、Y)に対応する画像メモリ上の座標(X、Y)の
格納場所に格納する。
【0022】文字ブロック抽出部12は文書32の画像
データを走査し、文書32が含む文字ブロック34〜4
0の画像データを抽出すると共に文字ブロック34〜4
0の位置を検出する。文字ブロック34〜40はそれぞ
れ一又は複数の文字列を含む領域であり、各文字ブロッ
ク34〜40は空白或は罫線そのほかの分割要素により
それぞれ互いに区別できるように画定されている。例え
ば図2の例では、文字ブロック34〜40はそれぞれ、
複数の文字列がほぼ規則正しく密に配列して一塊と成っ
ている領域である。
【0023】この実施例では各文字ブロック34〜40
を空白で区別するようにしている場合に文字ブロックの
画像データを抽出し及び位置を検出する例につき説明す
る。尚、文字ブロック34〜40の位置検出及び画像デ
ータ抽出に当たっては、従来周知の種々の方法を用いる
ことができる。
【0024】まず文字ブロック抽出部12は、走査範囲
を文書32全面、主走査方向を垂直方向Y及び副走査方
向を水平方向Xとして、文書32の画像データを走査し
走査範囲内の垂直な走査線上の黒ビット累積個数を各副
走査位置X毎に求め、求めた黒ビット累積個数を副走査
位置Xの小さい順に参照してゆく。ここで黒ビット累積
個数が所定個数例えば1個未満となる走査線を白線及び
黒ビット累積個数が所定個数例えば1個以上となる走査
線を黒線と表す。そして黒ビット累積個数の参照過程で
白線より黒線に変化した時の当該黒線を黒線Aまた黒線
より白線に変化した時の当該黒線を黒線Bと表せば、第
h番目に検出した垂直な黒線A及びBが挟む領域を第h
番目の水平ブロック候補領域として検出する。この第h
番目の水平ブロック候補領域の始端及び終端位置はこれ
ら第h番目の垂直な黒線A及びBの位置Xである。図2
の例であれば、文書32全面のうちの位置X1及びX2
の垂直な走査線が挟む領域が第1番目の水平ブロック候
補領域、また位置X3及びX4の垂直な走査線が挟む領
域が第2番目の水平ブロック候補領域である。
【0025】次に文字ブロック抽出部12は、水平ブロ
ック候補領域をひとつずつ着目ブロックとし、走査範囲
を着目ブロック、主走査方向を水平方向X及び副走査方
向を垂直方向Yとして、文書32の画像データを走査し
走査範囲内の水平な走査線上の黒ビット累積個数を各副
走査位置Y毎に求め、求めた黒ビット累積個数を副走査
位置Yの小さい順に参照してゆく。この参照過程で、第
1番目に検出した水平な黒線Aの位置Yを第1番目の垂
直ブロック候補領域の始端位置として検出する。そして
第1番目の水平な黒線Aの検出したら第i−1番目(i
=2、3、4、……)に検出される水平な黒線Bと第i
番目に検出される水平な黒線Aとの離間間隔を求める。
この離間間隔は隣接する文字行間の空白の幅を表す。i
の小さい順に、順次に、求めた離間間隔を閾値THと比
較してゆき、閾値THを越える離間間隔を有する第i−
1番目の黒線B及び第i番目の黒線Aを検出したら、こ
のときの第i−1番目の黒線Bの位置Yを当該着目ブロ
ックに関連する第1番目の垂直ブロック候補領域の終端
位置として検出し、またこのときの第i番目の黒線Aの
位置Yを当該着目ブロックに関連する第2番目の垂直ブ
ロック候補領域の始端位置として検出する。閾値TH
は、文字ブロックを分割する分割要素としての空白を検
出するためのパラメータであり、文字の大きさ、フォン
ト及びそのほかを考慮して決定され例えばTH=140
である。以下同様にして、当該着目ブロックに関連す
る、第2番目の垂直ブロック候補領域の終端位置、第3
番目の垂直ブロック候補領域の始端及び終端位置、第4
番目のブロック候補領域の始端位置、……を順次に検出
してゆく。そして文字ブロック抽出部12はひとつの着
目ブロックにつき垂直ブロック候補領域の検出を終えた
ら、次の他の着目ブロックに関連する垂直ブロック候補
領域を検出する。
【0026】図2の例では、第1番目の水平ブロック候
補領域(位置X1及びX2を通る垂直な走査線が挟む領
域)に関連する垂直ブロック候補領域として、位置Y1
及びY2を通る水平な走査線が挟む領域と、位置Y3及
びY4を通る水平な走査線が挟む領域とが検出される。
また第2番目の水平ブロック候補領域(位置X3及びX
4を通る垂直な走査線が挟む領域)に関連する垂直ブロ
ック候補領域として、位置Y5及びY6を通る水平な走
査線が挟む領域と位置Y7及びY8を通る垂直な走査線
が挟む領域とが検出される。
【0027】文字ブロックは関連する水平及び垂直ブロ
ック候補領域が重なり合う領域であり、これら関連する
ブロック候補領域のうち、水平ブロック候補領域の始端
及び終端位置が文字ブロックの垂直方向における始端及
び終端位置を表しまた垂直ブロック候補領域の始端及び
終端位置が文字ブロックの水平方向における始端及び終
端位置を表す。図2の例において例えばX1≧X≧X2
かつY1≧Y≧Y2を満足する領域が、文字ブロックの
ひとつすなわち文字ブロック34となる。
【0028】文字ブロック抽出部12は文字ブロックの
抽出順次に、文字ブロック内の画像データ(ブロックデ
ータ)を切出し部14及びブロック選択部24に出力し
また文字ブロックの位置を順序判定部18に出力する。
【0029】切出し部14はブロックデータを各文字ブ
ロック毎に格納する。そして文字ブロックをひとつずつ
順次に着目ブロックとし、着目ブロックのブロックデー
タを走査して着目ブロックが含む全部又は一部の文字行
を切出し、さらに文字行内のブロックデータを走査して
着目ブロックの文字行内の文字パタンを切出す。切出し
部14は文字行及び文字パタンの切出し過程で得られる
情報やデータ或はこれらを切出した結果得られる情報や
データを、切出し情報としてパタン抽出部16へ出力す
る。
【0030】文字行及び文字パタンの切出しは従来周知
の種々の方法により行うことができるが、この実施例で
は次のようにして行う。
【0031】切出し部14は着目ブロック内の例えば第
1行目の文字行のみを切出す。このため切出し部14は
走査範囲を着目ブロック、主走査方向を水平方向X及び
副走査方向を垂直方向Yとし、副走査位置Yの小さい順
に、走査範囲内の水平な走査線上の黒ビット累積個数を
求める。そして副走査位置Yの小さい順に黒ビット累積
個数を求めてゆく過程で、第1番目に検出した水平な黒
線A及びBの位置Yを第1行目の文字行の垂直方向にお
ける切出し開始及び終了位置とする。また着目ブロック
の水平方向における始端及び終端位置を、第1行目の文
字行の水平方向における切出し開始及び終了位置とす
る。第1行目の文字行は、当該文字行の垂直方向におけ
る切出し開始及び終了位置を通る水平な2つの走査線が
挟み、かつ当該文字行の水平方向における切出し開始及
び終了位置を通る垂直な2つの走査線が挟む領域であ
る。
【0032】次に切出し部14は第1行目の文字行内の
全部又は一部、例えば全部の文字パタンを切出し、文字
パタンの文字切出し位置として文字外接枠の位置を検出
する。このため切出し部14は、走査範囲を着目ブロッ
クの第1行目の文字行、主走査方向を垂直方向Y及び副
走査方向を水平方向Xとし、走査範囲内の垂直な走査線
上の黒ビット累積個数を各副走査位置X毎に求める。そ
してこの求めた黒ビット累積個数を副走査位置Xの小さ
い順に参照してゆき、第j番目に検出した垂直な黒線A
及びBの位置X(これら黒線A及びBの位置Xは文字外
接枠の左端及び右端位置を表す)を第j番目の文字パタ
ンに関する水平方向の切出し開始及び終了位置とする。
次いで走査範囲を文字行内の、これら第j番目の垂直な
黒線A及びBで挟む領域、主走査方向を水平方向X及び
副走査方向を垂直方向Yとして、各副走査位置Y毎に走
査範囲内の水平な走査線上の黒ビット累積個数を求め
る。そしてこの求めた黒ビット累積個数を副走査位置Y
の小さい順に参照して水平な黒線A及びBを検出し、こ
れら水平な黒線Aの副走査位置Yのうち最大のY(この
Yは文字外接枠の上端位置を表す)を第j番目の文字パ
タンに関する垂直方向の切出し開始位置としまたこれら
水平な黒線Bの副走査位置Yのうち最小のY(このYは
文字外接枠の下端位置を表す)を第j番目の文字パタン
に関する垂直方向の切出し終了位置とする。ひとつの着
目ブロックにつき第1行目の文字行の文字パタンを切出
し終えたら次の着目ブロックにつき第1行目の文字行の
文字パタンを切出す。尚、文字外接枠は、当該枠の左端
及び右端位置を通る2本の垂直な走査線と、上端及び下
端位置を通る2本の水平な走査線との交点を結んで得ら
れる矩形枠である。
【0033】切出し部14は着目ブロックの文字行及び
文字パタンの切出し順次に、切出し情報をパタン特徴抽
出部16へ出力する。パタン特徴抽出部16は切出し情
報を利用して各文字ブロック毎に文字パタンの特徴を抽
出する。切出し情報は例えば、文字パタン及び文字行の
切出し位置、文字行内の画像データ、或は文字外接枠内
の画像データである。
【0034】この実施例では、切出し部14は文字パタ
ンの切出し位置を切出し情報として出力し、パタン特徴
抽出部16は文字パタンの文字高さを文字ブロックjの
文字パタンの特徴Fj として求める。jは文字ブロック
番号であり、図2に示す例ではj=34、36、38又
は40である。文字高さは、文字パタンの垂直方向にお
ける切出し開始及び終了位置の離間間隔で表せる。
【0035】しかもパタン特徴抽出部16は、文字ブロ
ックjが含む全部又は一部の文字パタンに関して得た特
徴の平均値を文字パタンの特徴Fj として求める。例え
ば図2に示す例において、文字ブロックjの第1行目の
文字行が含む全ての文字パタンに関して得た平均特徴
を、文字パタンの特徴Fj とすれば、文字ブロック34
の特徴F34はF34=39.1、文字ブロック36の特徴
36はF36=37.5、文字ブロック38の特徴F38
38=31.2、文字ブロック40の特徴F40はF40
32.1となる。パタン特徴抽出部16は各文字ブロッ
クj毎に求めた特徴Fj を順序判定部18へ出力する。
【0036】この実施例の理解を助けるため、文字ブロ
ック34、36、38及び40に関する第1行目の文字
列とこの文字列の各文字パタンの文字外接枠及び文字高
さとを図3及び図4に示す。図3(A)は文字ブロック
34に関する図、図3(B)は文字ブロック38に関す
る図、図4(A)は文字ブロック36に関する図及び図
4(B)は文字ブロック40に関する図である。
【0037】順序判定部18は文字ブロック抽出部12
から入力した各文字ブロックの位置情報を利用し、次式
(2)に従い文字ブロックjの位置評価値Ej を求め
る。
【0038】Ej =Yej+F・Xej ……(2) 但し、Yej及びXejは文字ブロックjの左上隅点Pの画
像メモリ上のY及びX座標を表す。一例として、文字ブ
ロック34の左上隅点Pを図2に示す。またFは任意好
適に定められる定数を示し、例えばF=10である。
【0039】この例では、位置評価値Ej の小さい順に
各文字ブロックjに対し仮の順序を定め、従って図2の
例では文字ブロック34〜40の仮の順序は、文字ブロ
ック34、38、36及び40の順となる。尚、位置評
価値Ej の大きい順に仮の順序を定めてもよい。
【0040】これと共に順序判定部18は、パタン特徴
抽出部16から入力した各文字ブロックjの特徴Fj
利用し、各文字ブロックjを特徴Fj が類似するもの同
志(ほぼ等しいもの同志)にグループ分けし、各文字ブ
ロックjにいずれのグループに属するかを識別するため
のグループ識別情報を付与する。例えば、次式(3)を
満足する特徴Fj を有する文字ブロックをひとつのグル
ープとすればよい。
【0041】|Fj1−Fj2|<U ……(3) 但し、j1及びj2は文字ブロック番号を示し、j1≠
j2である。またUはイメージスキャナの解像度、文字
媒体の種類、文字の大きさそのほかを考慮して任意好適
に定められる定数を示し、例えばU=5である。
【0042】図2に示す文字ブロック34〜40におい
ては、文字パタン特徴F34=39.1、F36=37.
5、F38=31.2及びF40=32.1であったので、
U=5として(3)式を満足する文字ブロックのグルー
プは2つでき、ひとつのグループは文字ブロック34及
び36が構成し、他のひとつのグループは文字ブロック
38及び40が構成することとなる。
【0043】同じグループに属する文字ブロックは、共
通の種類或は属性を有する文字(例えば文字高さが互い
に等しい文字)を含む文字ブロックであり、従って共通
の情報例えば同一文脈を構成する文字ブロックである。
【0044】次に順序判定部18は位置評価値Ei とグ
ループ識別情報とを利用し、各グループ毎に位置評価値
の小さい順に文字ブロックの正式の順序を定める。例え
ば次に示す1)〜4)の処理に従って正式の順序を定め
る処理を行う。
【0045】1)まず文書32が含む全ての文字ブロッ
クを選択対象とする。
【0046】2)次に選択対象のなかから位置評価値の
最も小さい文字ブロックを検出し、この文字ブロックに
対し正式の順序番号1を付与すると共に、当該文字ブロ
ックを選択対象から除外する。
【0047】3)次に選択対象のグループ識別情報を位
置評価値の小さい順に参照し、処理2)で検出した順序
番号1の文字ブロックと同じグループの文字ブロック
を、選択対象のなかから検出する。この検出する過程に
おいて、第k番目(k=1、2、……)に検出した、順
序番号1の文字ブロックと同じグループの文字ブロック
に対し正式の順序番号k+1を付与すると共に、当該順
序番号を付与した文字ブロックを選択対象から除外す
る。処理3)の開始時点での選択対象の全てにつきグル
ープ識別情報の参照を終了したら、処理3)を終了す
る。
【0048】処理2)及び3)によって、同一グループ
に属する全ての文字ブロックに対しそれぞれ正式の順序
番号が付与され、しかもより位置評価値の小さい文字ブ
ロックに対しより小さい順序番号が付与される。例えば
同一グループ内において順序番号がより小さい文字ブロ
ックをより先順位の文字ブロックとして、各文字ブロッ
クの正式の順序を定める。
【0049】4)次に選択対象となる文字ブロックが残
存するか否かを判定する。残存すれば、残りの他のグル
ープに関し正式の順序番号1を付与すべき文字ブロック
を検出するため、処理2)を再び行う。選択対象となる
文字ブロックが残存しなければ、文書32が含む全ての
文字ブロックに対し各グループ毎に正式の順序番号を付
与し終えたので、正式の順序を定める処理を終了する。
【0050】例えば図2に示す例では、上述の処理1)
〜4)により、まずひとつのグループに属する文字ブロ
ック34及び36に対し正式の順序番号1及び2が付与
され、次いで残りの他のグループに属する文字ブロック
38及び40に対し正式の順序番号1及び2が付与され
る。
【0051】順序判定部18は各文字ブロックの正式の
順序番号とグループ識別情報とをブロック選択部24へ
出力する。
【0052】ブロック選択部24は文字ブロック抽出部
12から入力したブロックデータを各文字ブロック毎に
図示しないブロックデータメモリに格納する。そして各
文字ブロックの正式の順序番号及びグループ識別情報に
基づいて、各グループ毎にブロックデータを正式の順序
で順次に切出し部26へ出力する。ブロック選択部24
はひとつのブロックデータを切出し部26へ出力する
と、切出し部26が当該ブロックデータにつき全ての文
字パタンの切出しを終了するまで次のブロックデータの
出力を待ち、当該ブロックデータの全文字パタンの切出
しが終了すると、次のブロックデータを切出し部26へ
出力する。
【0053】切出し部26はブロックデータの入力順次
に、ブロックデータから従来周知の方法により文字パタ
ンを切出し、文字パタンの画像データ(文字データ)と
して文字外接枠内の画像データを認識部28へ出力す
る。
【0054】認識部28は文字データに基づいて文字パ
タンの認識を行い、その認識結果を次段の装置例えば言
語処理或は知識処理を行う装置へ出力する。認識部28
の構成及び認識処理は従来周知の種々のものとすること
ができるが、この実施例では、認識部28を図5に示す
構成のものとする。
【0055】図5は認識部の構成の一例を示す機能ブロ
ック図であり、同図にも示すようにこの実施例の認識部
28はサブパタン抽出部42、特徴抽出部44及び照合
部46を備える。
【0056】サブパタン抽出部42は、文字データを図
示しない文字パタンメモリに格納し、主走査方向を異な
る複数種類の方向として文字データを走査する。そして
各走査線毎に走査線上で所定個数m(例えばm=5)以
上連続する黒ビットの塊を検出し、この黒ビットの塊を
当該塊を検出した主走査方向に関するサブパタンの文字
線成分として抽出する。サブパタン抽出部42は、各主
走査方向毎に、検出したサブパタンの文字線成分をサブ
パタンメモリに格納する。ひとつの文字データから、主
走査方向の種類の個数と同個数nのサブパタンを抽出す
る。
【0057】文字パタン及びサブパタンメモリ上には文
書32上に設定したX−Y座標系に相対応するX−Y座
標系を設定し、これらメモリの格納場所にそれぞれ座標
(X、Y)を付与する。そして文字データを構成する黒
ビット及び白ビットを、当該ビットの文書32上での座
標と対応する座標を有する文字パタンメモリの格納場所
に格納し、またサブパタンの文字線成分を、当該文字線
成分の文書32上での座標と対応する座標を有するサブ
パタンメモリの格納場所に格納する。サブパタンメモリ
の文字線成分が格納されなかった格納場所にはサブパタ
ンの文字背景成分としての白ビットを格納する。
【0058】具体的に一例を挙げれば、文字行方向をX
軸方向(水平方向)とし、文字文字パタンの主走査方向
をX軸方向、Y軸方向(垂直方向)、X軸から反時計回
りに45°回転した方向(左斜め方向)及びX軸から時
計回りに45°回転した方向(右斜め方向)の4つの異
なる方向として文字データを走査する。従ってこの場
合、ひとつの文字データから水平、垂直、左斜め及び右
斜めサブパタンの4個のサブパタンを抽出することとな
る。
【0059】垂直サブパタンを抽出する場合には、主走
査方向を垂直方向として文字データを走査し、垂直な走
査線上で連続する黒ビットの塊(黒ラン)を検出する。
この黒ランを構成する黒ビットの総個数(黒ランの長さ
L)がL≧mを満足するとき当該黒ランを垂直サブパタ
ンの文字線成分として抽出する。L≧mを満足しない長
さLの黒ランは垂直サブパタンの文字背景成分となる。
残りの3個のサブパタンも、垂直サブパタンの場合と同
様にして、抽出する。
【0060】特徴抽出部44は、文字データから抽出し
たn個のサブパタンそれぞれにつき特徴マトリクスFを
抽出し、ひとつの文字データに関しn個の特徴マトリク
スFを抽出する。特徴抽出部44は各文字データ毎に得
たn個の特徴マトリクスFを照合部46に出力する。
【0061】サブパタンから特徴マトリクスFを抽出す
るに当たっては、当該サブパタンを得た文字データの文
字外接枠を文書32上での座標位置と対応するサブパタ
ンメモリ上の座標位置に設定する。次いで文字外接枠が
囲むサブパタンメモリ上の領域をN×M個(N及びMは
それぞれ任意好適に定められる自然数)の小領域に分割
する。N×M個の小領域をそれぞれ小領域iと表す。そ
してN×M個の小領域のそれぞれにつき小領域i内に存
在する文字線成分の長さを表す特徴量ei を求め、これ
ら特徴量ei をそれぞれ文字外接枠の大きさで正規化す
る。正規化された特徴量ei を特徴量fi と表す。特徴
量fi は特徴マトリクスFの要素値であり、特徴マトリ
クスFはN×M個の特徴量fi から成る。
【0062】例えばN=M=8とし、特徴量ei を(d
X+dY)/2で除して得た値を特徴量fi とする。d
X及びdYは文字外接枠の水平及び垂直方向における長
さを表す。
【0063】照合部46は、図示せずも、標準文字パタ
ンの特徴マトリクス(辞書マトリクス)Gを格納した辞
書メモリを備える。辞書マトリクスGは特徴マトリクス
Fと同様にして標準文字パタンから抽出した特徴量であ
り、例えば、標準文字パタンの水平、垂直、左斜め及び
右斜めサブパタンからそれぞれ特徴マトリクスを抽出
し、これら4個の特徴マトリクスをそれぞれ当該標準パ
タンの辞書マトリクスGとしている。
【0064】照合部46は、特徴マトリクスF及び辞書
マトリクスGのサブパタンの種類が同じもの同志例えば
垂直サブパタンの特徴マトリクスF及び辞書マトリクス
G同志を照合し、これらマトリクス間の類似度Rを次式
(4)に従って求める。そしてサブパタンの各種類毎に
求めた類似度Rがそれぞれ予め定めた値P以上となる標
準文字パタンに付与されている文字名を、当該特徴マト
リクスFを得た文字データの候補文字名として検出す
る。照合部46は一又は複数の候補文字名を、ひとつの
文字データにつき検出し認識結果として次段の装置へ出
力する。複数の候補文字名を検出した場合には、これら
候補文字名に対し類似度Rが高い順に第1位、第2位、
……と順位付けし、これら順位付けした候補文字名を認
識結果とする。
【数1】
【0065】
【0066】但し、gi は辞書マトリクスGの要素値を
示す。
【0067】図6は第一及び第二発明の第二実施例の構
成を概略的に示す機能ブロック図である。尚、第一実施
例の構成成分に対応する構成成分については同一の符号
を付して示す。以下の第二実施例の説明では、主として
第一実施例と相違する点につき説明し、第一実施例と同
様の点についてはその詳細な説明を省略する。
【0068】同図において48は第一発明の第二実施例
としての情報処理装置を示し、この情報処理装置48は
文字ブロック抽出部50、切出し部52、パタン特徴抽
出部16及び順序判定部18を備える。また56は第二
発明の第二実施例としての文字認識装置を示し、この文
字認識装置56は画像生成部22、情報処理装置48、
ブロック選択部58及び認識部28を備える。この実施
例では、情報処理装置48において文字パタンの特徴を
抽出するための文字パタンを切り出す切出し部52を、
文字認識装置54において文字パタンの認識のため文字
パタンを切り出す切出し部としても用いる。
【0069】第二実施例では、文字ブロック抽出部50
は文書32の画像データから文字ブロックを抽出し、抽
出した文字ブロックの位置情報を順序判定部18へ出力
すると共に、文字ブロック内の画像データ(ブロックデ
ータ)を切出し部52へ出力する。文字ブロック抽出部
50はブロック選択部58へはブロックデータを出力し
ない。
【0070】切出し部52は、各文字ブロック毎に、ブ
ロックデータを図示しないブッロクデータメモリに格納
する。そして文書32の全ての文字ブロックをひとつず
つ順次に着目ブロックとし、着目ブロック内のブロック
データを走査して、着目ブロック内の全ての文字行を切
り出す。次いで文字行内のブロックデータを走査して文
字パタンを切り出し、最終的に着目ブロック内の全ての
文字パタンを切り出す。そして切出し部52は、着目ブ
ロック内の全部又は一部の文字パタンの切出し情報をパ
タン特徴抽出部54へ出力し、これと共に着目ブロック
内の全部の文字パタンの画像データをブロック選択部5
8へ出力する。
【0071】ブロック選択部58は、各文字ブロック毎
に、文字パタンの画像データを図示しない文字パタンメ
モリに格納する。そしてブロック選択部58は順序判定
部18から入力した各文字ブロックの正式の順序番号及
びグループ識別情報に基づいて、各グループ毎に正式の
順序番号に従って文字ブロックを選択し、選択順次に文
字ブロック内の文字データを認識部28へ出力する。
【0072】図7は第一及び第二発明の第三実施例の全
体構成を概略的に示す機能ブロック図である。尚、第一
実施例の構成成分に対応する構成成分については同一の
符号を付して示す。以下の第三実施例の説明では、主と
して第一実施例と相違する点につき説明し、第一実施例
と同様の点についてはその詳細な説明を省略する。
【0073】同図において60は第一発明の第三実施例
としての情報処理装置を示し、この情報処理装置60は
文字ブロック抽出部12、切出し部14、パタン特徴抽
出部62及び順序判定部18を備える。また64は第二
発明の第三実施例としての文字認識装置を示し、この文
字認識装置64は画像生成部22、情報処理装置60、
ブロック選択部24、切出し部26及び認識部28を備
える。
【0074】次に図8に示す文書の文字認識を例に取っ
てこの実施例の動作につき説明する。図8は文書の他の
例を示す図である。同図において66は文字媒体として
の文書を示し、文書66は文字線幅が太い文字から成り
ひとつの文脈を形成する文字ブロック68及び70と、
文字線幅が細い文字から成り別のひとつの文脈を形成す
る文字ブロック72及び74とを有する。
【0075】画像データ生成部22が文書66の画像デ
ータを生成し終わると、文字ブロック抽出部12は文書
66から文字ブロック68〜74をそれぞれ抽出し、次
いで切出し部14は文字ブロック68〜74から文字パ
タンを切り出し文字パタンの切出し情報をパタン特徴抽
出部62へ出力する。
【0076】この実施例では、文字パタンの水平方向に
おける切出し開始及び終了位置を文字外接枠の左端及び
右端位置とし、また文字パタンの垂直方向における切出
し開始及び終了位置を文字行の垂直方向における切出し
開始及び終了位置とする。そして文字外接枠の左端及び
右端位置の間の文字行内の領域の画像データを文字デー
タとし、この文字データを切出し情報として出力する。
【0077】パタン特徴抽出部62は、文字データを図
示しない文字パタンメモリに格納し、文字パタンの特徴
j (この例ではj=68、70、72又は74であ
る。)として文字パタンの線幅Wを抽出する。線幅Wの
抽出は従来周知の種々の方法で行って良いが、この実施
例では次に述べるようにして抽出する。
【0078】まずパタン特徴抽出部62は文字データを
走査し、文字データの文字外接枠の上端及び下端位置を
検出する。次に文字外接枠内の文字データが含む黒ビッ
トの総個数Pを求め、これと共に文字外接枠内の文字デ
ータを例えば2画素×2画素の広さを有する窓を用いて
線順次に走査しこの窓内の画素が全て黒ビットとなる回
数Qを求める。そしてこれらP及びQより従来周知の次
式(5)に従って、一つ一つの文字パタンにつき線幅W
を求める。
【0079】W=1/{1−(Q/P)} ……(5) この実施例の理解を助けるため、図8に示す文字ブロッ
ク68、70、72及び74に関する第1行目の文字列
とこの文字列の各文字パタンの線幅Wとを図9及び図1
0に示す。図9(A)は文字ブロック68に関する図、
図9(B)は文字ブロック72に関する図、図10
(A)は文字ブロック70に関する図及び図10(B)
は文字ブロック74に関する図である。
【0080】ここでは文字ブロックjが含む全ての文字
パタンに関して得た線幅Wの平均値を、当該文字ブロッ
クjの文字パタン特徴Fj とする。この場合、図8に示
す例では文字ブロック68の特徴F68はF68=9.1、
文字ブロック70の特徴F70はF70=8.5、文字ブロ
ック72の特徴F72はF72=4.2及び文字ブロック7
4の特徴F74はF74=3.9となる。
【0081】順序判定部18は、上述の(3)式の定数
Uを例えばU=3として文字ブロックjをグループ分け
する。図8に示す文字ブロック68〜74においてはF
68=9.1、F70=8.5、F72=4.2及びF74
3.9であったので(3)式を満足する文字ブロックの
グループは2つでき、ひとつのグループは文字ブロック
68及び70が構成し、他のひとつのグループは文字ブ
ロック72及び74が構成する。次に順序判定部18は
文字ブロックjに対し各グループ毎に正式の順序を付与
する。図8に示す例では、ひとつのグループを構成する
文字ブロック68及び70に対し正式の順序番号1及び
2が付与され、残りの他のグループを構成する文字ブロ
ック72及び74に対し正式の順序番号1及び2が付与
される。
【0082】第一及び第二発明は上述した実施例にのみ
限定されるものではなく、従って各構成成分の入出力信
号、動作の流れ、数値的条件、処理方法及びそのほかを
任意好適に変更することができる。
【0083】例えば文字ブロックの抽出方法、文字行及
び文字パタンの切出し方法、文字認識の際の特徴マトリ
クスの作成方法及び類似度算出方法そのほかの処理を、
任意好適な種々の方法に変更できる。
【0084】また文字パタン特徴を文字高さ或は線幅と
するほか、文字幅、文字ピッチ、行高さ、文字外接枠の
縦横比、文字の傾き、文字パタンの黒画素の分布から得
られる特徴、文字パタンから抽出したサブパタンの線
幅、サブパタンの文字線量及び2種類以上の種類の異な
るサブパタン間の文字線量の差(例えば同一の文字パタ
ンから抽出した垂直及び水平サブパタン間の文字線量の
差)のいずれかひとつとしても良い。また1種類の文字
パタン特徴を用いて文字ブロックをグループ分けするの
みならず、異なる複数種類の文字パタン特徴を用いて文
字ブロックをグループ分けするようにしても良い。複数
種類の文字パタン特徴を用いる場合には、これら複数種
類の文字パタン特徴を用いてより高次なひとつの特徴を
導き出すようにするのが良い。
【0085】また上述した例では第一発明の情報処理装
置を用いて文字認識装置を構成した例につき説明した
が、第一発明の適用を文字認識装置にのみ限定するもの
ではなく、このほか、文字ブロックの順序関係を決定し
決定した順序関係に従って文字ブロック内の画像データ
を順次に出力する装置や、文字ブロックの順序関係を抽
出して文字媒体のレイアウト構造を抽出する装置を構成
するのに第一発明の情報処理装置を用いるようにしても
良い。
【0086】
【発明の効果】上述した説明からも明らかなように、第
一発明の情報処理装置によれば、文字ブロックの位置情
報から位置評価値を求める。これと共に文字ブロックを
文字パタンの特徴が類似するもの同志にグループ分けす
る。そして文字ブロックの順序を各グループ毎に位置評
価値の小さい順或は大きい順に決定する。
【0087】従って文字ブロックが含む文字パタンの特
徴を文字ブロック単位で異ならせ、文字ブロックが担う
情報の種類を文字パタンの特徴と対応付けている文字媒
体において文字ブロックの順序を決定する場合、文字ブ
ロックを同一種類の情報毎に精度良く順序付けることが
できる。
【0088】例えば異なる文脈の文字ブロックを、各文
脈毎に文字パタンの特徴を異ならせて同一紙面に掲載し
てある文書にあっては、文字パタン特徴が類似するグル
ープ毎に文字ブロックの順序を定めることができ、従っ
て各文字ブロックをそれぞれの文脈に沿って精度良く順
序付けることができる。
【0089】また第二発明の文字認識装置によれば、上
述の第一発明の情報処理装置を備えるので、文字ブロッ
クが含む文字パタンの特徴を文字ブロック単位で異なら
せ、文字ブロックが担う情報の種類を文字パタンの特徴
と対応付けている文字媒体の文字認識において、文字ブ
ロックを同一種類の情報毎に精度良く順序付けて選択す
ることができ、従って文字パタンを同一種類の情報毎に
精度良く順序付けて切り出せる。その結果、例えば複数
の異なる文脈を各文脈毎に文字パタンの特徴を異ならせ
て同一紙面に掲載してある文書の文字認識を行う場合、
文字パタンを、各文脈毎に文脈に沿って精度良く切り出
し認識することができる。文字パタンを文脈に沿って精
度良く認識できる結果、言語処理による認識精度の向上
を効果的に達成しオペレータが誤認識を確認或は訂正す
る作業を軽減し、またオペレータが文脈毎に文字ブロッ
クを順序付ける作業を省け、従って文字認識処理の作業
効率を高めることができる。
【図面の簡単な説明】
【図1】第一及び第二発明の第一実施例の構成を概略的
に示す機能ブロック図である。
【図2】文書の一例を示す図である。
【図3】(A)及び(B)はそれぞれ文字ブロックの第
1行目の文字列とこの文字列の各文字パタンの文字外接
枠及び文字高さとを例示した図である。
【図4】(A)及び(B)はそれぞれ文字ブロックの第
1行目の文字列とこの文字列の各文字パタンの文字外接
枠及び文字高さとを例示した図である。
【図5】認識部のより具体的な構成の一例を示す図であ
る。
【図6】第一及び第二発明の第二実施例の構成を概略的
に示す機能ブロック図である。
【図7】第一及び第二発明の第三実施例の構成を概略的
に示す機能ブロック図である。
【図8】文書の他の例を示す図である。
【図9】(A)及び(B)はそれぞれ文字ブロックの第
1行目の文字列とこの文字列の各文字パタンの文字線幅
とを例示した図である。
【図10】(A)及び(B)はそれぞれ文字ブロックの
第1行目の文字列とこの文字列の各文字パタンの文字線
幅とを例示した図である。
【符号の説明】
10、48、60:情報処理装置 12、50:文字ブロック抽出部 14、26、52:切出し部 16、62:パタン特徴抽出部 18:順序判定部 20、56、64:文字認識装置 22:画像生成部 24、58:ブロック選択部 28:認識部
フロントページの続き (56)参考文献 特開 平3−230288(JP,A) 特開 平1−130293(JP,A) 特開 昭64−15889(JP,A) 特開 平3−269689(JP,A) 「電子情報通信学会論文誌」 VO L.J74−D−2 NO.4 p.491 −499 (1991) 「電子情報通信学会秋季全国大会講演 論文集」 分冊D−1 p.203 (1988) (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 340 JICSTファイル(JOIS)

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字媒体の画像データから文字ブロック
    の位置情報を抽出する文字ブロック抽出部と、前記文字
    ブロックの順序関係を判定する順序判定部とを備える情
    報処理装置において、 前記文字ブロックから文字パタンの切出し情報を抽出す
    る切出し部と、 前記文字パタンの切出し情報を利用して各文字ブロック
    毎に文字パタンの特徴を抽出するパタン特徴抽出部とを
    備え、 前記順序判定部は、前記文字ブロックの位置情報から位
    置評価値を求めると共に前記文字ブロックを文字パタン
    の特徴が類似するもの同志にグループ分けし、前記文字
    ブロックの順序を各グループ毎に位置評価値の小さい順
    或は大きい順に決定することを特徴とする情報処理装
    置。
  2. 【請求項2】 前記文字パタンの特徴を、文字高さ、文
    字幅、文字ピッチ、行高さ、文字外接枠の縦横比、文字
    線幅、文字の傾き、文字パタンの黒画素の分布から得ら
    れる特徴、文字パタンから抽出したサブパタンの線幅、
    サブパタンの文字線量及び2以上のサブパタンの文字線
    量の差のいずれかひとつ又は複数の特徴としたことを特
    徴とする請求項1に記載の情報処理装置。
  3. 【請求項3】 前記文字パタンの特徴を、文字ブロック
    が含む全部又は一部の文字パタンに関して得た平均特徴
    としたことを特徴とする請求項1に記載の情報処理装
    置。
  4. 【請求項4】 文字媒体の画像データを生成する画像生
    成部と、 前記画像データが含む文字ブロックを文字パタンの特徴
    が類似するもの同志にグループ分けし前記文字ブロック
    の順序を各グループ毎に決定する請求項1に記載の情報
    処理装置と、 各グループ毎に、決定された順序に従って順次に文字ブ
    ロックを選択するブロック選択部と、 前記文字ブロックの選択順次に文字ブロックから文字パ
    タンを切り出す切出し部と、 前記文字パタンを認識する認識部とを備えて成ることを
    特徴とする文字認識装置。
JP03339154A 1991-12-21 1991-12-21 情報処理装置及びそれを用いた文字認識装置 Expired - Fee Related JP3083609B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03339154A JP3083609B2 (ja) 1991-12-21 1991-12-21 情報処理装置及びそれを用いた文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03339154A JP3083609B2 (ja) 1991-12-21 1991-12-21 情報処理装置及びそれを用いた文字認識装置

Publications (2)

Publication Number Publication Date
JPH05174114A JPH05174114A (ja) 1993-07-13
JP3083609B2 true JP3083609B2 (ja) 2000-09-04

Family

ID=18324753

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03339154A Expired - Fee Related JP3083609B2 (ja) 1991-12-21 1991-12-21 情報処理装置及びそれを用いた文字認識装置

Country Status (1)

Country Link
JP (1) JP3083609B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009251872A (ja) * 2008-04-04 2009-10-29 Fuji Xerox Co Ltd 情報処理装置及び情報処理プログラム
JP5664181B2 (ja) * 2010-11-30 2015-02-04 富士通株式会社 画像処理装置、画像処理方法及び画像処理用コンピュータプログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
「電子情報通信学会秋季全国大会講演論文集」 分冊D−1 p.203 (1988)
「電子情報通信学会論文誌」 VOL.J74−D−2 NO.4 p.491−499 (1991)

Also Published As

Publication number Publication date
JPH05174114A (ja) 1993-07-13

Similar Documents

Publication Publication Date Title
US6385350B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US6366695B1 (en) Method and apparatus for producing a hybrid data structure for displaying a raster image
US6327384B1 (en) Character recognition apparatus and method for recognizing characters
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JPH07152867A (ja) パターン認識方法および装置
US5926564A (en) Character recognition method and apparatus based on 0-1 pattern representation of histogram of character image
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
JP3083609B2 (ja) 情報処理装置及びそれを用いた文字認識装置
JPH06214983A (ja) 文書画像の論理構造化文書への変換方法および装置
JPH08320914A (ja) 表認識方法および装置
KR0186025B1 (ko) 후보 문자 분류 방법
JPH09319824A (ja) 帳票認識方法
JP4221960B2 (ja) 帳票識別装置及びその識別方法
JP2902097B2 (ja) 情報処理装置及び文字認識装置
JPH08287188A (ja) 文字列認識装置
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JP2827288B2 (ja) 文字認識装置
JP2616967B2 (ja) 傾き抽出装置
JP3575969B2 (ja) セル領域の決定方法、セル領域の決定装置
JPH03126188A (ja) 文字認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JP2708604B2 (ja) 文字認識方法
JP2866920B2 (ja) 標準パターン作成方法及び装置並びに文字認識装置及び方法
JP3084833B2 (ja) 特徴抽出装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000620

LAPS Cancellation because of no payment of annual fees