JPH10143606A - 文字認識装置および文字認識方法 - Google Patents
文字認識装置および文字認識方法Info
- Publication number
- JPH10143606A JPH10143606A JP8294151A JP29415196A JPH10143606A JP H10143606 A JPH10143606 A JP H10143606A JP 8294151 A JP8294151 A JP 8294151A JP 29415196 A JP29415196 A JP 29415196A JP H10143606 A JPH10143606 A JP H10143606A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- area
- character
- unit
- display
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Digital Computer Display Output (AREA)
- User Interface Of Digital Computer (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【課題】 認識領域を自動的に抽出する文字認識装置に
おいて、認識結果の順序の修正の容易な文字認識装置の
提供。 【解決手段】 読取対象の画像イメージを読み出して、
画像イメージから認識領域を抽出し、認識領域の認識順
序を決定する領域抽出部14と、認識領域およびその認
識順序を格納する領域記憶部16と、結果記憶部26に
記憶された認識結果と、領域記憶部16に記憶された認
識領域、認識順序とを呼び出し、この認識順序に従って
認識結果を認識領域に対応する領域表示と共に表示する
結果表示部28と、領域表示の破線枠を指定することに
よって、指定された破線枠に含まれる認識結果の表示順
序を破線枠単位すなわち認識領域単位で入れ替える結果
編集部30とを具えている。
おいて、認識結果の順序の修正の容易な文字認識装置の
提供。 【解決手段】 読取対象の画像イメージを読み出して、
画像イメージから認識領域を抽出し、認識領域の認識順
序を決定する領域抽出部14と、認識領域およびその認
識順序を格納する領域記憶部16と、結果記憶部26に
記憶された認識結果と、領域記憶部16に記憶された認
識領域、認識順序とを呼び出し、この認識順序に従って
認識結果を認識領域に対応する領域表示と共に表示する
結果表示部28と、領域表示の破線枠を指定することに
よって、指定された破線枠に含まれる認識結果の表示順
序を破線枠単位すなわち認識領域単位で入れ替える結果
編集部30とを具えている。
Description
【0001】
【発明の属する技術分野】この発明は、読取対象の文
書、帳票といった媒体上の、文字パタンを読み取る文字
認識装置および文字認識方法に関する。
書、帳票といった媒体上の、文字パタンを読み取る文字
認識装置および文字認識方法に関する。
【0002】
【従来の技術】従来の文字認識装置の一例が、文献1:
「メディアドライブ株式会社、WinReader P
RO v.3.0 ユーザーズガイド」に記載されてい
る。この文献に開示の技術によれば、文字認識にあた
り、読取対象の画像イメージのレイアウト解析を行って
認識領域を自動的に抽出する。そして、複数の認識領域
が抽出された場合は、各認識領域の認識順序を自動的に
決定する。そして、各認識領域の認識順序が決定した後
に、この認識順序にしたがって、各認識領域の文字認識
処理をそれぞれ行っていた。
「メディアドライブ株式会社、WinReader P
RO v.3.0 ユーザーズガイド」に記載されてい
る。この文献に開示の技術によれば、文字認識にあた
り、読取対象の画像イメージのレイアウト解析を行って
認識領域を自動的に抽出する。そして、複数の認識領域
が抽出された場合は、各認識領域の認識順序を自動的に
決定する。そして、各認識領域の認識順序が決定した後
に、この認識順序にしたがって、各認識領域の文字認識
処理をそれぞれ行っていた。
【0003】ところで、読取対象の画像イメージ(入力
文書画像)が複雑になると、この認識領域を自動的に抽
出することが困難となって、認識順序が間違って決定さ
れてしまうことがある。そこで、文献1の第7〜9頁に
開示の技術によれば、認識順序が自動的に決定した後
に、オペレータが、画像イメージを見ながら認識順序を
修正する。そして、この修正された認識順序に従って、
文字認識処理を行っていた。
文書画像)が複雑になると、この認識領域を自動的に抽
出することが困難となって、認識順序が間違って決定さ
れてしまうことがある。そこで、文献1の第7〜9頁に
開示の技術によれば、認識順序が自動的に決定した後
に、オペレータが、画像イメージを見ながら認識順序を
修正する。そして、この修正された認識順序に従って、
文字認識処理を行っていた。
【0004】
【発明が解決しようとする課題】しかしながら、認識結
果ではなく画像イメージを見ながら認識順序を修正する
際には、画像イメージの全体の認識領域の分布を把握す
るために、画像イメージの全体を縮小して一画面中に表
示する必要がある。ところが、画像イメージを縮小して
表示すると、文字等の表示が小さくなって、個々の文字
等の判別が困難となる。このため、通常、認識順序の修
正にあたっては、画面表示の拡大および縮小を繰返す必
要がある。このため、修正の作業が煩雑になるという問
題点があった。
果ではなく画像イメージを見ながら認識順序を修正する
際には、画像イメージの全体の認識領域の分布を把握す
るために、画像イメージの全体を縮小して一画面中に表
示する必要がある。ところが、画像イメージを縮小して
表示すると、文字等の表示が小さくなって、個々の文字
等の判別が困難となる。このため、通常、認識順序の修
正にあたっては、画面表示の拡大および縮小を繰返す必
要がある。このため、修正の作業が煩雑になるという問
題点があった。
【0005】また、間違った認識順序に従って文字認識
処理を行ってしまった場合には、認識結果も間違った順
序で表示される。この場合、間違った順序で表示された
認識結果は、エディタ等を用いて編集して認識順序を入
れ替えるか、もしくは、認識領域の認識順序を修正して
から、再び文字認識を行わなければならない。しかし、
エディタ等を用いて認識結果を編集すると操作が煩雑と
なってしまい、また、再度文字認識を行うと処理時間が
かかってしまうという問題点があった。
処理を行ってしまった場合には、認識結果も間違った順
序で表示される。この場合、間違った順序で表示された
認識結果は、エディタ等を用いて編集して認識順序を入
れ替えるか、もしくは、認識領域の認識順序を修正して
から、再び文字認識を行わなければならない。しかし、
エディタ等を用いて認識結果を編集すると操作が煩雑と
なってしまい、また、再度文字認識を行うと処理時間が
かかってしまうという問題点があった。
【0006】このため、認識結果の順序の修正の容易な
文字認識装置および方法の実現が望まれていた。
文字認識装置および方法の実現が望まれていた。
【0007】
【課題を解決するための手段】この出願に係る第1の発
明の文字認識装置によれば、読取対象の画像イメージか
ら認識領域を抽出し、認識領域の認識順序を決定する領
域抽出部と、この認識領域から文字パタンを切り出す文
字切出部と、この文字パタンの特徴を抽出する特徴抽出
部と、標準パタンが格納された辞書部と、抽出された文
字パタンの特徴と標準パタンの特徴との照合を行って、
この文字パタンの文字認識を行う文字認識部と、文字認
識の結果を表示する結果表示部とを具えた文字認識装置
において、認識領域および認識順序を格納する領域記憶
部を具え、結果表示部は、領域記憶部に格納された認識
順序に従って、文字認識の結果を、認識領域に対応する
領域表示と共に表示する結果表示部であり、結果表示部
に表示された領域表示を指定することによって、この認
識領域に対応する文字認識の結果の表示順序を認識領域
単位で入れ替える修正部を具えてなることを特徴とす
る。
明の文字認識装置によれば、読取対象の画像イメージか
ら認識領域を抽出し、認識領域の認識順序を決定する領
域抽出部と、この認識領域から文字パタンを切り出す文
字切出部と、この文字パタンの特徴を抽出する特徴抽出
部と、標準パタンが格納された辞書部と、抽出された文
字パタンの特徴と標準パタンの特徴との照合を行って、
この文字パタンの文字認識を行う文字認識部と、文字認
識の結果を表示する結果表示部とを具えた文字認識装置
において、認識領域および認識順序を格納する領域記憶
部を具え、結果表示部は、領域記憶部に格納された認識
順序に従って、文字認識の結果を、認識領域に対応する
領域表示と共に表示する結果表示部であり、結果表示部
に表示された領域表示を指定することによって、この認
識領域に対応する文字認識の結果の表示順序を認識領域
単位で入れ替える修正部を具えてなることを特徴とす
る。
【0008】また、第1の発明の文字認識装置におい
て、好ましくは、結果表示部は、領域表示毎に、認識順
序を示す符号を表示する結果表示部であり、修正部は、
符号を指定することによって領域表示を指定する修正部
であると良い。
て、好ましくは、結果表示部は、領域表示毎に、認識順
序を示す符号を表示する結果表示部であり、修正部は、
符号を指定することによって領域表示を指定する修正部
であると良い。
【0009】また、この出願に係る第2に発明の文字認
識方法によれば、領域抽出部において、読取対象の画像
イメージから認識領域を抽出し、認識領域の認識順序を
決定し、文字切出部において、この認識領域から文字パ
タンを切り出し、特徴抽出部において、この文字パタン
の特徴を抽出し、辞書部において、標準パタンを格納
し、文字認識部において、抽出された文字パタンの特徴
と標準パタンの特徴との照合を行って、この文字パタン
の文字認識を行い、結果表示部にこの文字認識の結果を
表示する、文字認識方法において、領域記憶部に、認識
領域および認識順序を格納し、結果表示部に、領域記憶
部に格納された認識順序に従って、文字認識の結果を、
認識領域に対応する領域表示と共に表示し、修正部にお
いて、結果表示部に表示された領域表示を指定すること
によって、この認識領域に対応する文字認識の結果の表
示順序を認識領域単位で入れ替えることを特徴とする。
識方法によれば、領域抽出部において、読取対象の画像
イメージから認識領域を抽出し、認識領域の認識順序を
決定し、文字切出部において、この認識領域から文字パ
タンを切り出し、特徴抽出部において、この文字パタン
の特徴を抽出し、辞書部において、標準パタンを格納
し、文字認識部において、抽出された文字パタンの特徴
と標準パタンの特徴との照合を行って、この文字パタン
の文字認識を行い、結果表示部にこの文字認識の結果を
表示する、文字認識方法において、領域記憶部に、認識
領域および認識順序を格納し、結果表示部に、領域記憶
部に格納された認識順序に従って、文字認識の結果を、
認識領域に対応する領域表示と共に表示し、修正部にお
いて、結果表示部に表示された領域表示を指定すること
によって、この認識領域に対応する文字認識の結果の表
示順序を認識領域単位で入れ替えることを特徴とする。
【0010】また、第2の発明の文字認識方法におい
て、好ましくは、結果表示部において、領域表示毎に認
識順序を示す符号を表示し、修正部において、符号を指
定することによって認識領域を指定すると良い。
て、好ましくは、結果表示部において、領域表示毎に認
識順序を示す符号を表示し、修正部において、符号を指
定することによって認識領域を指定すると良い。
【0011】このように、第1の発明の文字認識装置お
よび第2の発明の文字認識方法によれば、認識結果を領
域表示と共に表示し、この領域表示を指定して移動する
ことによって、認識結果の表示順序を領域表示単位すな
わち認識領域単位で入れ替える。その結果、認識領域の
認識順序が間違っていた場合でも、文字認識処理の後
に、認識結果の表示画面上で、認識結果の表示順序を容
易に修正することができる。
よび第2の発明の文字認識方法によれば、認識結果を領
域表示と共に表示し、この領域表示を指定して移動する
ことによって、認識結果の表示順序を領域表示単位すな
わち認識領域単位で入れ替える。その結果、認識領域の
認識順序が間違っていた場合でも、文字認識処理の後
に、認識結果の表示画面上で、認識結果の表示順序を容
易に修正することができる。
【0012】
【発明の実施の形態】以下、図面を参照して、この出願
に係る第1の発明の文字認識装置および第2の発明の文
字認識方法の実施の形態について併せて説明する。
に係る第1の発明の文字認識装置および第2の発明の文
字認識方法の実施の形態について併せて説明する。
【0013】(第1の実施の形態)先ず、図1および図
2を参照して、第1の実施の形態の文字認識装置および
文字認識方法について説明する。図1は、第1の実施の
形態の文字認識装置の説明に供するブロック図である。
また、図2は、第1の実施の形態の文字認識方法の説明
に供する流れ図である。
2を参照して、第1の実施の形態の文字認識装置および
文字認識方法について説明する。図1は、第1の実施の
形態の文字認識装置の説明に供するブロック図である。
また、図2は、第1の実施の形態の文字認識方法の説明
に供する流れ図である。
【0014】第1の実施の形態の文字認識装置は、走査
部10、イメージ記憶部12、領域抽出部14、領域記
憶部16、文字切出部18、特徴抽出部20、辞書部2
2、文字認識部としての識別部24、結果記憶部26、
結果表示部28および修正部としての結果編集部30を
具えている。
部10、イメージ記憶部12、領域抽出部14、領域記
憶部16、文字切出部18、特徴抽出部20、辞書部2
2、文字認識部としての識別部24、結果記憶部26、
結果表示部28および修正部としての結果編集部30を
具えている。
【0015】そして、上記の構成成分を以って、図2に
示した流れ図の(a)〜(j)に対応する動作を行う。
示した流れ図の(a)〜(j)に対応する動作を行う。
【0016】(a)先ず、この走査部10は、読取対象
の入力媒体(被読取媒体)上の画像イメージを取り込
む。
の入力媒体(被読取媒体)上の画像イメージを取り込
む。
【0017】ここで、図3に被読取媒体32の例を示
す。この入力媒体は、文字領域が、4つの欄に分かれて
いる。すなわち、入力媒体の中程の一点鎖線によって上
下の欄に分割されおり、さらに、上下のそれぞれの欄で
左右の2つのブロックに分割されている。そして、入力
媒体の文章は、左上の欄、右上の欄、左下の欄そして右
下の欄へと続いている。
す。この入力媒体は、文字領域が、4つの欄に分かれて
いる。すなわち、入力媒体の中程の一点鎖線によって上
下の欄に分割されおり、さらに、上下のそれぞれの欄で
左右の2つのブロックに分割されている。そして、入力
媒体の文章は、左上の欄、右上の欄、左下の欄そして右
下の欄へと続いている。
【0018】(b)次に、イメージ記憶部12は、走査
部10において読み取られた画像イメージを格納する。
部10において読み取られた画像イメージを格納する。
【0019】(c)次に、領域抽出部14は、イメージ
記憶部12に格納された、読取対象の画像イメージを読
み出して、画像イメージから認識領域を抽出し、認識領
域の認識順序を決定する。
記憶部12に格納された、読取対象の画像イメージを読
み出して、画像イメージから認識領域を抽出し、認識領
域の認識順序を決定する。
【0020】(d)次に、領域記憶部16は、領域抽出
部14において抽出された認識領域およびその認識順序
を格納する。尚、抽出された認識領域が一つだけの場合
は、その認識領域の認識順序を1番として格納する。ま
た、認識領域の抽出にあたっては、例えば、文献2:
「PRU86−33」に開示されている方法を用いて認
識領域の抽出をすると良い。
部14において抽出された認識領域およびその認識順序
を格納する。尚、抽出された認識領域が一つだけの場合
は、その認識領域の認識順序を1番として格納する。ま
た、認識領域の抽出にあたっては、例えば、文献2:
「PRU86−33」に開示されている方法を用いて認
識領域の抽出をすると良い。
【0021】ここで、図4に認識領域が抽出された画像
イメージ34を示す。図4では、破線でそれぞれ囲まれ
た4つの認識領域が抽出されている。そして、図4には
示していないが、この場合の認識順序は、左上の認識領
域36、左下の認識領域38、右上の認識領域40そし
て右下の認識領域42の順になっている。
イメージ34を示す。図4では、破線でそれぞれ囲まれ
た4つの認識領域が抽出されている。そして、図4には
示していないが、この場合の認識順序は、左上の認識領
域36、左下の認識領域38、右上の認識領域40そし
て右下の認識領域42の順になっている。
【0022】(e)次に、文字切出部18は、先ず、領
域記憶部16に格納されている認識領域をその認識順序
に従って呼び出す。そして、文字切出部18は、認識領
域毎に文字パタンの文字切出を行う。
域記憶部16に格納されている認識領域をその認識順序
に従って呼び出す。そして、文字切出部18は、認識領
域毎に文字パタンの文字切出を行う。
【0023】(f)次に、特徴抽出部20は、切り出さ
れた文字パタンの特徴を抽出する。
れた文字パタンの特徴を抽出する。
【0024】ここで、図5を参照して、特徴抽出につい
て説明する。図5は、特徴抽出部20の内部構成を示す
ブロック図である。
て説明する。図5は、特徴抽出部20の内部構成を示す
ブロック図である。
【0025】この特徴抽出部20は、パタンレジスタ4
4、線幅計算部46、サブパタン抽出部48、文字枠検
出部50、文字枠分割決定部52および特徴マトリクス
抽出部54を具えている。
4、線幅計算部46、サブパタン抽出部48、文字枠検
出部50、文字枠分割決定部52および特徴マトリクス
抽出部54を具えている。
【0026】文字切出部18から特徴抽出部20へ入力
された文字パタンは、パタンレジスタ44へ格納され
る。そして、文字パタンは、パタンレジスタ44から線
幅計算部46へ送られる。
された文字パタンは、パタンレジスタ44へ格納され
る。そして、文字パタンは、パタンレジスタ44から線
幅計算部46へ送られる。
【0027】線幅計算部46は、入力パタンの線幅Wを
計算する。線幅Wの計算にあたっては、例えば、文字パ
タンを4つの黒画素を一組とした2×2の窓で走査し
て、2×2の窓全ての点が黒画素である窓の個数Mと文
字パタンの全黒画素数Aを計数して、下記の(1)式に
より算出する。
計算する。線幅Wの計算にあたっては、例えば、文字パ
タンを4つの黒画素を一組とした2×2の窓で走査し
て、2×2の窓全ての点が黒画素である窓の個数Mと文
字パタンの全黒画素数Aを計数して、下記の(1)式に
より算出する。
【0028】W=A/(A−M)・・・(1) 線幅Wの計算結果は、サブパタン抽出部48へ送られ
る。また、サブパタン抽出部48へは、パタンレジスタ
44から文字パタンも送られてくる。
る。また、サブパタン抽出部48へは、パタンレジスタ
44から文字パタンも送られてくる。
【0029】サブパタン抽出部48は、文字パタンにつ
いて垂直スキャンを全面行って黒画素の連続長さを得
る。そして、この黒画素の連続長さと線幅Wとに基づい
て、垂直サブパタン(VSP)を抽出する。
いて垂直スキャンを全面行って黒画素の連続長さを得
る。そして、この黒画素の連続長さと線幅Wとに基づい
て、垂直サブパタン(VSP)を抽出する。
【0030】同様にして、サブパタン抽出部48は、水
平スキャンを行って水平サブパタン(HSP)を抽出
し、右斜め45°(右上方向から左下方向)のスキャン
を行って右斜めサブパタン(RSP)を抽出し、左斜め
45°(左上方向から右下方向)のスキャンを行って左
斜めサブパタン(LSP)を抽出する。
平スキャンを行って水平サブパタン(HSP)を抽出
し、右斜め45°(右上方向から左下方向)のスキャン
を行って右斜めサブパタン(RSP)を抽出し、左斜め
45°(左上方向から右下方向)のスキャンを行って左
斜めサブパタン(LSP)を抽出する。
【0031】また、パタンレジスタ44からは、文字枠
検出部50へも文字パタンが送られる。文字枠検出部5
0は、文字パタンに外接する長方形の文字枠を抽出す
る。そして、文字枠検出部50は、検出した文字枠に囲
まれた文字枠領域を文字枠分割決定部52へ送る。
検出部50へも文字パタンが送られる。文字枠検出部5
0は、文字パタンに外接する長方形の文字枠を抽出す
る。そして、文字枠検出部50は、検出した文字枠に囲
まれた文字枠領域を文字枠分割決定部52へ送る。
【0032】文字枠分割決定部52は、文字枠を複数の
領域に分割するための分割点座標を決定する。例えば、
文字枠をN×M(NおよびMは定数、例えばN=M=
5)に分割するためのX軸、Y軸(文字枠水平方向に沿
った軸をX軸とし、文字枠の垂直方向に沿った軸をY軸
とする)上の分割点座標を決定する。そして、決定され
た分割点座標は、特徴マトリクス抽出部54へ送られ
る。また、特徴マトリクス抽出部54へは、サブパタン
抽出部48からVSP、HSP、RSPおよびLSPの
各サブパタンも送られる。
領域に分割するための分割点座標を決定する。例えば、
文字枠をN×M(NおよびMは定数、例えばN=M=
5)に分割するためのX軸、Y軸(文字枠水平方向に沿
った軸をX軸とし、文字枠の垂直方向に沿った軸をY軸
とする)上の分割点座標を決定する。そして、決定され
た分割点座標は、特徴マトリクス抽出部54へ送られ
る。また、特徴マトリクス抽出部54へは、サブパタン
抽出部48からVSP、HSP、RSPおよびLSPの
各サブパタンも送られる。
【0033】特徴マトリクス抽出部54は、文字枠分割
決定部52において決定された分割点座標によって、V
SP、HSP、RSPおよびLSPの各サブパタンの文
字枠領域をそれぞれN×Mの領域に分割し、分割された
各領域の黒画素数(Bij)を計数し、線幅Wを使用し
て、下記の(2)式を用いて文字線長(Lij)を示す特
徴を計算して、N×M×4次元の特徴マトリクスを作成
する。
決定部52において決定された分割点座標によって、V
SP、HSP、RSPおよびLSPの各サブパタンの文
字枠領域をそれぞれN×Mの領域に分割し、分割された
各領域の黒画素数(Bij)を計数し、線幅Wを使用し
て、下記の(2)式を用いて文字線長(Lij)を示す特
徴を計算して、N×M×4次元の特徴マトリクスを作成
する。
【0034】Lij=Bij/W・・・(2) さらに、特徴マトリクス抽出部54は、この特徴マトリ
クスを正規化する。正規化にあたっては、VSPの特徴
マトリクスは、文字枠のY方向の長さΔYで割って正規
化し、HSPの特徴マトリクスは、文字枠のX方向の長
さΔXで割って正規化し、RSPおよびLSPの特徴マ
トリクスは、それぞれ(ΔX2 +ΔY2)1/2 で割って
正規化する。そして、正規化された各特徴マトリクス
を、文字パタンの特徴マトリクスfi として識別部24
へ送る。
クスを正規化する。正規化にあたっては、VSPの特徴
マトリクスは、文字枠のY方向の長さΔYで割って正規
化し、HSPの特徴マトリクスは、文字枠のX方向の長
さΔXで割って正規化し、RSPおよびLSPの特徴マ
トリクスは、それぞれ(ΔX2 +ΔY2)1/2 で割って
正規化する。そして、正規化された各特徴マトリクス
を、文字パタンの特徴マトリクスfi として識別部24
へ送る。
【0035】(g)識別部24は、特徴抽出部20にお
いて抽出された文字パタンの特徴マトリクスfi と、標
準パタンの特徴マトリクスfm との照合を行って、この
文字パタンの文字認識を行う。標準パタンは、辞書部2
2に格納されているものを呼び出して使う。照合にあた
っては、周知の下記の(3)式によって定義される距離
Dを求める。この距離Dが小さい順に標準パタンに順位
を付ける。そして、順位が一位の標準パタンをその文字
パタンの認識結果とする。
いて抽出された文字パタンの特徴マトリクスfi と、標
準パタンの特徴マトリクスfm との照合を行って、この
文字パタンの文字認識を行う。標準パタンは、辞書部2
2に格納されているものを呼び出して使う。照合にあた
っては、周知の下記の(3)式によって定義される距離
Dを求める。この距離Dが小さい順に標準パタンに順位
を付ける。そして、順位が一位の標準パタンをその文字
パタンの認識結果とする。
【0036】 D={Σ(fi −fm )}1/2 ・・・(3) (h)次に、結果記憶部26は、認識結果を記憶する。
【0037】そして、この実施の形態においては、上記
の(e)〜(h)の処理を、各認識領域について、順次
に行う。
の(e)〜(h)の処理を、各認識領域について、順次
に行う。
【0038】(i)次に、結果表示部28は、結果記憶
部26に記憶された認識結果と、領域記憶部16に記憶
された認識領域および認識順序の情報とをそれぞれ呼び
出す。そして、この認識順序に従って、各認識領域の認
識結果を認識領域に対応する領域表示と共に表示する。
部26に記憶された認識結果と、領域記憶部16に記憶
された認識領域および認識順序の情報とをそれぞれ呼び
出す。そして、この認識順序に従って、各認識領域の認
識結果を認識領域に対応する領域表示と共に表示する。
【0039】ここで、図6に、結果表示部28の修正前
の表示画面を示す。図6においては、各認識領域に含ま
れる文字パタンの認識結果を、それぞれ認識領域に対応
する領域表示である破線枠で囲んで、上から順に、認識
順序に従って示す。図5における左上の認識領域36、
左下の認識領域38、右上の認識領域40および右下の
認識領域42は、それぞれ図6の一段目の破線枠56、
二段目の破線枠58、三段目の破線枠60および四段目
の破線枠62に対応している。
の表示画面を示す。図6においては、各認識領域に含ま
れる文字パタンの認識結果を、それぞれ認識領域に対応
する領域表示である破線枠で囲んで、上から順に、認識
順序に従って示す。図5における左上の認識領域36、
左下の認識領域38、右上の認識領域40および右下の
認識領域42は、それぞれ図6の一段目の破線枠56、
二段目の破線枠58、三段目の破線枠60および四段目
の破線枠62に対応している。
【0040】(j)次に、結果編集部30は、結果表示
部28に表示された領域表示としての破線枠を指定する
ことによって、指定された破線枠に含まれる文字認識の
結果(認識結果)の表示順序を破線枠単位、すなわち認
識領域単位で入れ替える。この結果編集部30は、マウ
スといった入力装置を具えている。
部28に表示された領域表示としての破線枠を指定する
ことによって、指定された破線枠に含まれる文字認識の
結果(認識結果)の表示順序を破線枠単位、すなわち認
識領域単位で入れ替える。この結果編集部30は、マウ
スといった入力装置を具えている。
【0041】この実施の形態では、結果表示部28の表
示画面において、二段目の破線枠58で囲まれた認識結
果と、三段目の破線枠60で囲まれた認識結果との順序
が逆になっている。そこで、オペレータは、マウスによ
って、二段目の破線枠58を指定して、2段目の破線枠
58に囲まれた認識結果を、三段目の破線枠60と四段
目の破線枠62との間に、破線枠単位、すなわち認識領
域単位で移動して表示順序を修正する。
示画面において、二段目の破線枠58で囲まれた認識結
果と、三段目の破線枠60で囲まれた認識結果との順序
が逆になっている。そこで、オペレータは、マウスによ
って、二段目の破線枠58を指定して、2段目の破線枠
58に囲まれた認識結果を、三段目の破線枠60と四段
目の破線枠62との間に、破線枠単位、すなわち認識領
域単位で移動して表示順序を修正する。
【0042】ここで、図7に、結果表示部28の修正後
の表示画面を示す。図7においては、上から順に、一段
目の破線枠56、三段目の破線枠60、二段目の破線枠
58および四段目の破線枠62の表示順序で認識結果が
表示されている。
の表示画面を示す。図7においては、上から順に、一段
目の破線枠56、三段目の破線枠60、二段目の破線枠
58および四段目の破線枠62の表示順序で認識結果が
表示されている。
【0043】このように、この実施の形態の文字認識装
置および文字認識方法によれば、認識結果を領域表示と
しての破線枠と共に表示し、この破線枠をマウスなどで
指定して移動することによって、認識結果の表示順序を
領域表示単位すなわち認識領域単位で入れ替える。従っ
て、認識領域の認識順序が間違っていた場合でも、文字
認識処理(例えば、上述の(g)の処理)後に、認識結
果の表示画面上で、認識結果の表示順序を容易に修正す
ることができる。
置および文字認識方法によれば、認識結果を領域表示と
しての破線枠と共に表示し、この破線枠をマウスなどで
指定して移動することによって、認識結果の表示順序を
領域表示単位すなわち認識領域単位で入れ替える。従っ
て、認識領域の認識順序が間違っていた場合でも、文字
認識処理(例えば、上述の(g)の処理)後に、認識結
果の表示画面上で、認識結果の表示順序を容易に修正す
ることができる。
【0044】また、文字認識処理の後に表示順序を容易
に修正することができるので、文字認識処理の前に、認
識領域の認識順序の確認および修正を行う必要がない。
さらに、文字認識処理の後で、表示順序を修正する際
に、従来のようにエディタ等を用いて、移動させる領域
をいちいち設定する必要がない。このため、処理時間の
短縮を図ることができる。
に修正することができるので、文字認識処理の前に、認
識領域の認識順序の確認および修正を行う必要がない。
さらに、文字認識処理の後で、表示順序を修正する際
に、従来のようにエディタ等を用いて、移動させる領域
をいちいち設定する必要がない。このため、処理時間の
短縮を図ることができる。
【0045】(第2の実施の形態)次に、第2の実施の
形態の文字認識装置および文字認識方法について説明す
る。第2の実施の形態の文字認識装置においては、領域
抽出部、結果表示部および修正部を除いては、第1の実
施の形態の構成成分と同一であるので、その詳細な説明
を省略する。そして、認識領域を抽出するまでの処理
は、第1の実施の形態と同一の処理である。
形態の文字認識装置および文字認識方法について説明す
る。第2の実施の形態の文字認識装置においては、領域
抽出部、結果表示部および修正部を除いては、第1の実
施の形態の構成成分と同一であるので、その詳細な説明
を省略する。そして、認識領域を抽出するまでの処理
は、第1の実施の形態と同一の処理である。
【0046】第2の実施の形態においては、抽出された
各認識領域に番号を付与する。ここで、図8に、認識領
域が抽出された画像イメージを示す。被読取媒体、認識
領域および認識順序は、第1の実施の形態の場合と同一
である。そして、図8において、左上の認識領域36に
は、認識順序が1番目であることを示す符号「1」が付
与されている。また、左下の認識領域38には、認識順
序が2番目であることを示す符号「2」が付与されてい
る。また、右上の認識領域40には、認識順序が3番目
であることを示す符号「3」が付与されている。また、
右下の認識領域42には、認識順序が4番目であること
を示す符号「4」が付与されている。
各認識領域に番号を付与する。ここで、図8に、認識領
域が抽出された画像イメージを示す。被読取媒体、認識
領域および認識順序は、第1の実施の形態の場合と同一
である。そして、図8において、左上の認識領域36に
は、認識順序が1番目であることを示す符号「1」が付
与されている。また、左下の認識領域38には、認識順
序が2番目であることを示す符号「2」が付与されてい
る。また、右上の認識領域40には、認識順序が3番目
であることを示す符号「3」が付与されている。また、
右下の認識領域42には、認識順序が4番目であること
を示す符号「4」が付与されている。
【0047】そして、第2の実施の形態においては、第
1の実施の形態と同様に文字認識を行って、結果表示部
へ認識結果を領域表示としての破線枠と共に表示する。
1の実施の形態と同様に文字認識を行って、結果表示部
へ認識結果を領域表示としての破線枠と共に表示する。
【0048】ここで、図9に、結果表示部28の修正前
の表示画面を示す。図9においては、画像イメージの左
上の認識領域36に対応する一段目の破線枠56に接し
て、認識順序が1番目であることを示す符号「1」が表
示されている。また、左下の認識領域38に対応する二
段目の破線枠58に接して、認識順序が2番目であるこ
とを示す符号「2」が表示されている。また、右上の認
識領域40に対応する三段目の破線枠60に接して、認
識順序が3番目であることを示す符号「3」が表示され
ている。また、右下の認識領域42に対応する四段目の
破線枠62に接して、認識順序が4番目であることを示
す符号「4」が表示されている。
の表示画面を示す。図9においては、画像イメージの左
上の認識領域36に対応する一段目の破線枠56に接し
て、認識順序が1番目であることを示す符号「1」が表
示されている。また、左下の認識領域38に対応する二
段目の破線枠58に接して、認識順序が2番目であるこ
とを示す符号「2」が表示されている。また、右上の認
識領域40に対応する三段目の破線枠60に接して、認
識順序が3番目であることを示す符号「3」が表示され
ている。また、右下の認識領域42に対応する四段目の
破線枠62に接して、認識順序が4番目であることを示
す符号「4」が表示されている。
【0049】そして、第2の実施の形態においては、表
示された領域表示としての破線枠の符号を指定すること
によって、指定された符号の破線枠に含まれる文字認識
の結果(認識結果)の表示順序を破線枠単位、すなわち
認識領域単位で入れ替える。ここでは、オペレータは、
符号をキーボードで入力する。
示された領域表示としての破線枠の符号を指定すること
によって、指定された符号の破線枠に含まれる文字認識
の結果(認識結果)の表示順序を破線枠単位、すなわち
認識領域単位で入れ替える。ここでは、オペレータは、
符号をキーボードで入力する。
【0050】図9に示した修正前の表示画面において、
符号「2」が付与された二段目の破線枠58で囲まれた
認識結果と、符号「3」が付与された三段目の破線枠6
0で囲まれた認識結果との表示順序が逆になっている。
そこで、オペレータは、正しい表示順序の符号の順序で
ある「1、3、2、4」を入力することによって、2段
目の破線枠58に囲まれた認識結果と、三段目の破線枠
60と四段目の破線枠62に囲まれた認識結果とを、破
線枠単位、すなわち認識領域単位で入れ替えて表示順序
を修正する。
符号「2」が付与された二段目の破線枠58で囲まれた
認識結果と、符号「3」が付与された三段目の破線枠6
0で囲まれた認識結果との表示順序が逆になっている。
そこで、オペレータは、正しい表示順序の符号の順序で
ある「1、3、2、4」を入力することによって、2段
目の破線枠58に囲まれた認識結果と、三段目の破線枠
60と四段目の破線枠62に囲まれた認識結果とを、破
線枠単位、すなわち認識領域単位で入れ替えて表示順序
を修正する。
【0051】ここで、図10に、修正後の表示画面を示
す。図10においては、上から順に、符号「1」の一段
目の破線枠56、符号「3」の三段目の破線枠60、符
号「2」の二段目の破線枠58および符号「4」の四段
目の破線枠62の表示順序で認識結果が表示されてい
る。
す。図10においては、上から順に、符号「1」の一段
目の破線枠56、符号「3」の三段目の破線枠60、符
号「2」の二段目の破線枠58および符号「4」の四段
目の破線枠62の表示順序で認識結果が表示されてい
る。
【0052】このように、領域表示に符号を付与すれ
ば、修正された符号の順序を入力することによって、表
示順序を容易に修正することができる。
ば、修正された符号の順序を入力することによって、表
示順序を容易に修正することができる。
【0053】上述した各実施の形態では、これらの発明
を特定の条件で構成した例についてのみ説明したが、こ
れらの発明は多くの変更および変形を行うことができ
る。例えば、上述した形態では、認識領域に対応する領
域表示として破線枠を用いたが、これらの発明において
は、領域表示の表示方法はこれに限定されるものではな
い。
を特定の条件で構成した例についてのみ説明したが、こ
れらの発明は多くの変更および変形を行うことができ
る。例えば、上述した形態では、認識領域に対応する領
域表示として破線枠を用いたが、これらの発明において
は、領域表示の表示方法はこれに限定されるものではな
い。
【0054】
【発明の効果】第1の発明の文字認識装置および第2の
発明の文字認識方法によれば、認識結果を領域表示と共
に表示し、この領域表示を指定することによって、認識
結果の表示順序を領域表示単位すなわち認識領域単位で
入れ替える。その結果、抽出された認識領域の認識順序
が間違っていた場合でも、文字認識処理後に、認識結果
の表示画面上で、認識結果の表示順序を容易に修正する
ことができる。
発明の文字認識方法によれば、認識結果を領域表示と共
に表示し、この領域表示を指定することによって、認識
結果の表示順序を領域表示単位すなわち認識領域単位で
入れ替える。その結果、抽出された認識領域の認識順序
が間違っていた場合でも、文字認識処理後に、認識結果
の表示画面上で、認識結果の表示順序を容易に修正する
ことができる。
【0055】また、領域表示に符号を付与すれば、修正
された符号の順序を入力することによって、表示順序を
容易に修正することができる。
された符号の順序を入力することによって、表示順序を
容易に修正することができる。
【図1】第1の実施の形態の文字認識装置の説明に供す
るブロック図である。
るブロック図である。
【図2】第1の実施の形態の文字認識方法の説明の供す
る流れ図である。
る流れ図である。
【図3】第1の実施の形態における被読取媒体を示す図
である。
である。
【図4】第1の実施の形態における認識領域が抽出され
た画像イメージを示す図である。
た画像イメージを示す図である。
【図5】第1の実施の形態の文字認識装置の特徴抽出部
の内部構成の説明に供するブロック図である。
の内部構成の説明に供するブロック図である。
【図6】第1の実施の形態の修正前の表示画面を示す図
である。
である。
【図7】第1の実施の形態の修正後の表示画面を示す図
である。
である。
【図8】第2の実施の形態における認識領域が抽出され
た画像イメージを示す図である。
た画像イメージを示す図である。
【図9】第2の実施の形態の修正前の表示画面を示す図
である。
である。
【図10】第2の実施の形態の修正後の表示画面を示す
図である。
図である。
10:走査部 12:イメージ記憶部 14:領域抽出部 16:領域記憶部 18:文字切出部 20:特徴抽出部 22:辞書部 24:識別部 26:結果記憶部 28:結果表示部 30:結果編集部 32:被読取媒体 34:画像イメージ 36:左上の認識領域 38:左下の認識領域 40:右上の認識領域 42:右下の認識領域 44:パタンレジスタ 46:線幅計算部 48:サブパタン抽出部 50:文字枠検出部 52:文字枠分割決定部 54:特徴マトリクス抽出部 56:一段目の破線枠 58:二段目の破線枠 60:三段目の破線枠 62:四段目の破線枠
Claims (4)
- 【請求項1】 読取対象の画像イメージから認識領域を
抽出し、認識領域の認識順序を決定する領域抽出部と、 該認識領域から文字パタンを切り出す文字切出部と、 該文字パタンの特徴を抽出する特徴抽出部と、 標準パタンが格納された辞書部と、 抽出された文字パタンの特徴と、前記標準パタンの特徴
との照合を行って、該文字パタンの文字認識を行う文字
認識部と、 該文字認識の結果を表示する結果表示部とを具えた文字
認識装置において、 前記認識領域および前記認識順序を格納する領域記憶部
を具え、 前記結果表示部は、前記領域記憶部に格納された前記認
識順序に従って、文字認識の結果を、前記認識領域に対
応する領域表示と共に表示する結果表示部であり、 前記結果表示部に表示された前記領域表示を指定するこ
とによって、該認識領域に対応する文字認識の結果の表
示順序を認識領域単位で入れ替える修正部を具えてなる
ことを特徴とする文字認識装置。 - 【請求項2】 請求項1に記載の文字認識装置におい
て、 前記結果表示部は、前記領域表示毎に、前記認識順序を
示す符号を表示する結果表示部であり、 前記修正部は、前記符号を指定することによって前記領
域表示を指定する修正部であることを特徴とする文字認
識装置。 - 【請求項3】 領域抽出部において、読取対象の画像イ
メージから認識領域を抽出し、認識領域の認識順序を決
定し、 文字切出部において、該認識領域から文字パタンを切り
出し、 特徴抽出部において、該文字パタンの特徴を抽出し、 辞書部において、標準パタンを格納し、 文字認識部において、抽出された文字パタンの特徴と、
前記標準パタンの特徴との照合を行って、該文字パタン
の文字認識を行い、 結果表示部に、該文字認識の結果を表示する文字認識方
法において、 領域記憶部に、前記認識領域および前記認識順序を格納
し、 前記結果表示部において、前記領域記憶部に格納された
前記認識順序に従って、文字認識の結果を、前記認識領
域に対応する領域表示と共に表示し、 修正部において、前記結果表示部に表示された、前記領
域表示を指定することによって、該認識領域に対応する
文字認識の結果の表示順序を認識領域単位で入れ替える
ことを特徴とする文字認識方法。 - 【請求項4】 請求項3に記載の文字認識方法におい
て、 前記結果表示部において、前記領域表示毎に、前記認識
順序を示す符号を表示し、 前記修正部において、前記符号を指定することによって
前記領域表示を指定することを特徴とする文字認識方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8294151A JPH10143606A (ja) | 1996-11-06 | 1996-11-06 | 文字認識装置および文字認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8294151A JPH10143606A (ja) | 1996-11-06 | 1996-11-06 | 文字認識装置および文字認識方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10143606A true JPH10143606A (ja) | 1998-05-29 |
Family
ID=17803978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8294151A Pending JPH10143606A (ja) | 1996-11-06 | 1996-11-06 | 文字認識装置および文字認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10143606A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092091A (ja) * | 2004-09-22 | 2006-04-06 | Nec Corp | 文書構造化装置および文書構造化方法 |
CN112463010A (zh) * | 2019-09-06 | 2021-03-09 | 富士施乐株式会社 | 信息处理装置及记录媒体 |
-
1996
- 1996-11-06 JP JP8294151A patent/JPH10143606A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006092091A (ja) * | 2004-09-22 | 2006-04-06 | Nec Corp | 文書構造化装置および文書構造化方法 |
CN112463010A (zh) * | 2019-09-06 | 2021-03-09 | 富士施乐株式会社 | 信息处理装置及记录媒体 |
JP2021043531A (ja) * | 2019-09-06 | 2021-03-18 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
CN112463010B (zh) * | 2019-09-06 | 2024-09-10 | 富士胶片商业创新有限公司 | 信息处理装置及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0063454B1 (en) | Method for recognizing machine encoded characters | |
KR100268367B1 (ko) | 화성 처리 방법과 장치 | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
EP0519713B1 (en) | Character input method and apparatus | |
JPH10143606A (ja) | 文字認識装置および文字認識方法 | |
JP2003030654A (ja) | パターン識別装置、パターン識別方法及びパターン識別用プログラム | |
JPH07182459A (ja) | 表構造抽出装置 | |
JPH1166228A (ja) | 光学式文字読取装置用帳票のフォーマット情報生成方法 | |
JPH0388086A (ja) | 文書読取装置 | |
JP3000349B2 (ja) | キー入力編集方法及び編集装置 | |
JP3157530B2 (ja) | 文字切り出し方法 | |
JPH02138674A (ja) | 文書処理方法及び装置 | |
JP2978801B2 (ja) | 手書き文字認識の文字入力方式 | |
JPH05274466A (ja) | 文字認識装置 | |
JPH08180050A (ja) | 難読漢字検索装置 | |
JPH08137987A (ja) | 光学式文字読取装置 | |
JPH05303661A (ja) | イメージデータ部分取得表示装置 | |
JPH02195488A (ja) | 文字認識結果修正方法 | |
JPH09114918A (ja) | 光学式文字読取装置 | |
JP3064508B2 (ja) | 文書認識装置 | |
JPH0934987A (ja) | 文字認識結果修正方法および文字認識装置 | |
JPH0528301A (ja) | 文書認識装置 | |
JP2931485B2 (ja) | 文字切出し装置及び方法 | |
JP2963474B2 (ja) | 類似文字識別方法 | |
JPH0433082A (ja) | 文書認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050614 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060411 |