JP2001175811A - 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 - Google Patents

単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体

Info

Publication number
JP2001175811A
JP2001175811A JP36374499A JP36374499A JP2001175811A JP 2001175811 A JP2001175811 A JP 2001175811A JP 36374499 A JP36374499 A JP 36374499A JP 36374499 A JP36374499 A JP 36374499A JP 2001175811 A JP2001175811 A JP 2001175811A
Authority
JP
Japan
Prior art keywords
word
vocabulary
characters
character
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP36374499A
Other languages
English (en)
Other versions
JP3480404B2 (ja
Inventor
Guillevic Didier
ディディエ・ギュヴィック
Takatsugu Yamada
敬嗣 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP36374499A priority Critical patent/JP3480404B2/ja
Priority to US09/739,661 priority patent/US6834121B2/en
Publication of JP2001175811A publication Critical patent/JP2001175811A/ja
Application granted granted Critical
Publication of JP3480404B2 publication Critical patent/JP3480404B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/226Character recognition characterised by the type of writing of cursive writing
    • G06V30/2268Character recognition characterised by the type of writing of cursive writing using stroke segmentation
    • G06V30/2276Character recognition characterised by the type of writing of cursive writing using stroke segmentation with probabilistic networks, e.g. hidden Markov models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/196Recognition using electronic means using sequential comparisons of the image signals with a plurality of references

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 語彙記憶部に記憶する単語に関する特徴を各
単語の文字コードから生成可能とし、効率的に単語を選
択可能な単語大分類装置を提供する。 【解決手段】 候補文字選択部1は単語画像の中から文
字らしい領域を検出し、文字認識部2は候補文字選択部
1で生成された候補文字を認識して文字コードに変換す
る。文字数推定部3は単語画像全体の文字数と候補文字
の間の領域の文字数とを推定し、単語記述部4は候補文
字の認識結果と候補文字間の推定文字数とから状態遷移
グラフに相当する単語記述を生成する。語彙選択部5は
単語記述と照合可能な語彙とを語彙記憶部6に記憶され
た語彙の中から選択する。 【効果】 高速に動作して高精度に単語を大分類可能な
単語大分類装置を構成することができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は単語大分類装置及び
その単語大分類方法並びにその制御プログラムを記録し
た記録媒体に関し、特に文書画像取得装置においてカメ
ラ等の非接触型の画像入力装置を用いて文書領域を検出
する装置に関する。
【0002】
【従来の技術】従来、この主の単語大分類装置として
は、「Didier Guillevic and
C.Y. Suen,“Recognition of
Legal Amounts on Bank Ch
eques”,Pattern Analysis &
Application,Vol.1,No.1,p
p.28−41,1998」中のp.31からp.32
に掛けて記載されているものがある。
【0003】上記の単語大分類装置の構成例を図19に
示す。この単語大分類装置は、単語の画像を入力する端
子101と、単語画像から特徴を抽出する単語特徴抽出
部7と、単語特徴抽出部7で生成された単語特徴を語彙
記憶部6に記憶された全ての語彙の単語特徴と比較して
類似した単語特徴を持つ語彙のみを選択する語彙選択部
8と、その語彙を出力する端子102とからなる。
【0004】単語大分類装置に入力される単語画像の例
を図2に示す。単語特徴抽出部7では単語画像からルー
プに関する特徴と、小文字の場合に‘y’や‘g’の下
に飛び出た部分(以後、ディセンダと呼ぶ)と、‘h’
や‘b’の上に飛び出た部分(以後、アセンダと呼ぶ)
とを検出し、アセンダ、ディセンダ、ループの並びを特
徴として抽出する。
【0005】語彙記憶部6には、例えば10万種類の単
語が図3に示すような表の形式で記憶されているものと
する。図3に示す例では、ある国の地名に関する単語が
記憶されている。各単語には単語のテキストとともに、
単語画像から抽出された単語特徴が併記されている。
【0006】語彙選択部8では単語特徴抽出部7で抽出
された単語特徴を、語彙記憶部6内に記憶されている全
ての単語の単語特徴と比較し、類似していると判定され
た場合にその単語を端子102から出力する。
【0007】
【発明が解決しようとする課題】しかしながら、上述し
た従来の単語大分類装置では、単語特徴抽出部で利用し
ている単語特徴が単語画像から抽出されるアセンダ、デ
ィセンダや、ループ等であり、単語を構成するアルファ
ベットから決定できるものであるが、画像の品質によっ
て安定に抽出されるとは限らない。
【0008】例えば、‘O’の上部が正しく閉じるよう
に記載されていない単語では、ループを検出することが
できない。また、隣接する文字が接触したために、ある
はずのないループが検出されることもある。そのため、
単語特徴の検出漏れや、ないはずの特徴が抽出され、正
しい単語を語彙選択部で類似単語として検出することが
できないことがある。検出漏れを防ぐために、少々の単
語特徴のずれを許容すると、類似しない単語まで多く選
択されるので、単語大分類装置から出力される単語の数
が非常に多くなる。
【0009】また、上記の問題を解決するために、予め
記載された単語画像から、単語特徴を抽出し、語彙記憶
部に記憶しておく方法がある。しかしながら、この方法
で10万単語を単語大分類しようとすると、10万単語
を非常に多くの人に記載させて得られた単語画像から特
徴を抽出する必要があり、実施不可能になる。
【0010】そこで、本発明の目的は上記の問題点を解
消し、語彙記憶部に記憶する単語に関する特徴を各単語
の文字コードから生成することができ、効率的に単語を
選択することができる単語大分類装置及びその単語大分
類方法並びにその制御プログラムを記録した記録媒体を
提供することにある。
【0011】
【課題を解決するための手段】本発明による単語大分類
装置は、単語画像を入力し、それに類似する語彙を予め
語彙記憶手段に記憶された語彙の中から選択する単語大
分類装置であって、前記単語画像中から予め定めた条件
に合った画像領域である候補文字を選択する候補文字選
択手段と、前記候補文字選択手段で選択された画像領域
を文字コードに変換する文字認識手段と、前記文字認識
手段で変換された文字コードを用いて前記単語画像を表
す単語記述を生成する単語記述手段と、前記単語記述手
段で生成された単語記述と前記語彙記憶手段に記録され
た語彙とを照合して無矛盾に照合可能な語彙を選択して
出力する語彙選択手段とを備えている。
【0012】本発明による他の単語大分類装置は、単語
画像を入力し、それに類似する語彙を予め語彙記憶手段
に記憶された語彙の中から選択する単語大分類装置であ
って、前記単語画像中から予め定めた条件に合った画像
領域である候補文字を選択する候補文字選択手段と、前
記候補文字選択手段で選択された画像領域を文字コード
に変換する文字認識手段と、前記単語画像全体の文字数
を推定しかつ前記単語画像から生成した領域内の文字数
を推定する文字数推定手段と、前記文字認識手段で変換
された文字コードと前記文字数推定手段で推定された前
記領域内の文字数とを用いて前記単語画像を表す単語記
述を生成する単語記述手段と、前記単語全体の推定文字
数を用いて前記語彙記憶手段に記録された語彙を選択し
かつ前記単語記述と前記語彙記憶手段に記録された語彙
とを照合して無矛盾に照合可能な語彙を選択して出力す
る語彙選択手段とを備えている。
【0013】本発明による別の単語大分類装置は、単語
画像を入力し、それに類似する語彙を予め語彙記憶手段
に記憶された語彙の中から選択する単語大分類装置であ
って、前記単語画像中から予め定めた条件に合った画像
領域である候補文字を選択する候補文字選択手段と、前
記候補文字選択手段で選択された画像領域を文字コード
に変換する文字認識手段と、前記単語画像全体の文字数
を推定しかつ前記全単語画像から生成した領域内の文字
数を推定する文字数推定手段と、前記単語画像全体の画
像特徴を抽出しかつ前記全単語画像から生成した領域内
の画像特徴を抽出する特徴記述手段と、前記文字コード
と前記領域内の文字数と前記領域内の図形特徴とを用い
て前記単語画像を表す単語記述を生成する単語記述手段
と、前記単語全体の推定文字数と前記単語全体の図形特
徴とを用いて前記語彙記憶手段に記録された語彙を選択
しかつ前記単語記述と前記語彙記憶手段に記録された語
彙とを照合して無矛盾に照合可能な語彙を選択して出力
する語彙選択手段とを備えている。
【0014】本発明によるさらに別の単語大分類装置
は、単語画像を入力し、それに類似する語彙を予め語彙
記憶手段に記憶された語彙の中から選択する単語大分類
装置であって、前記単語画像中から予め定めた条件に合
った画像領域である候補文字を選択する候補文字選択手
段と、前記単語画像が大文字のみからなるか大文字と小
文字との混在かを判定する大文字小文字判定手段と、前
記大文字小文字判定手段で前記大文字のみからなると判
定された時に前記大文字のみに字種を限定して選択され
た画像領域を文字コードに変換しかつ前記大文字小文字
判定手段で前記大文字と小文字との混在と判定された時
に全字種を対象として選択された画像領域を文字コード
に変換する文字認識手段と、前記単語画像全体の文字数
を推定しかつ前記全単語画像から生成した領域内の文字
数を推定する文字数推定手段と、前記単語画像全体の画
像特徴を抽出しかつ前記全単語画像から生成した領域内
の画像特徴を抽出する特徴記述手段と、前記文字コード
と前記領域内の文字数と前記領域内の図形特徴とを用い
て前記単語画像を表す単語記述を生成する単語記述手段
と、前記単語全体の推定文字数と前記単語全体の図形特
徴とを用いて前記語彙記憶手段に記録された語彙を選択
しかつ前記単語記述と前記語彙記憶手段に記録された語
彙とを照合して無矛盾に照合可能な語彙を選択して出力
する語彙選択手段とを備えている。
【0015】本発明による単語大分類方法は、単語画像
を入力し、それに類似する語彙を予め語彙記憶手段に記
憶された語彙の中から選択する単語大分類方法であっ
て、前記単語画像中から予め定めた条件に合った画像領
域である候補文字を選択するステップと、その選択され
た画像領域を文字コードに変換するステップと、変換さ
れた文字コードを用いて前記単語画像を表す単語記述を
生成するステップと、生成された単語記述と前記語彙記
憶手段に記録された語彙とを照合して無矛盾に照合可能
な語彙を選択して出力するステップとを備えている。
【0016】本発明による他の単語大分類方法は、単語
画像を入力し、それに類似する語彙を予め語彙記憶手段
に記憶された語彙の中から選択する単語大分類方法であ
って、前記単語画像中から予め定めた条件に合った画像
領域である候補文字を選択するステップと、その選択さ
れた画像領域を文字コードに変換するステップと、前記
単語画像全体の文字数を推定しかつ前記単語画像から生
成した領域内の文字数を推定するステップと、変換され
た文字コードと推定された前記領域内の文字数とを用い
て前記単語画像を表す単語記述を生成するステップと、
前記単語全体の推定文字数を用いて前記語彙記憶手段に
記録された語彙を選択しかつ前記単語記述と前記語彙記
憶手段に記録された語彙とを照合して無矛盾に照合可能
な語彙を選択して出力するステップとを備えている。
【0017】本発明による別の単語大分類方法は、単語
画像を入力し、それに類似する語彙を予め語彙記憶手段
に記憶された語彙の中から選択する単語大分類方法であ
って、前記単語画像中から予め定めた条件に合った画像
領域である候補文字を選択するステップと、その選択さ
れた画像領域を文字コードに変換するステップと、前記
単語画像全体の文字数を推定しかつ前記全単語画像から
生成した領域内の文字数を推定するステップと、前記単
語画像全体の画像特徴を抽出しかつ前記全単語画像から
生成した領域内の画像特徴を抽出するステップと、前記
文字コードと前記領域内の文字数と前記領域内の図形特
徴とを用いて前記単語画像を表す単語記述を生成するス
テップと、前記単語全体の推定文字数と前記単語全体の
図形特徴とを用いて前記語彙記憶手段に記録された語彙
を選択しかつ前記単語記述と前記語彙記憶手段に記録さ
れた語彙とを照合して無矛盾に照合可能な語彙を選択し
て出力するステップとを備えている。
【0018】本発明によるさらに別の単語大分類方法
は、単語画像を入力し、それに類似する語彙を予め語彙
記憶手段に記憶された語彙の中から選択する単語大分類
方法であって、前記単語画像中から予め定めた条件に合
った画像領域である候補文字を選択するステップと、前
記単語画像が大文字のみからなるか大文字と小文字との
混在かを判定するステップと、前記大文字のみからなる
と判定された時に前記大文字のみに字種を限定して選択
された画像領域を文字コードに変換しかつ前記大文字と
小文字との混在と判定された時に全字種を対象として選
択された画像領域を文字コードに変換するステップと、
前記単語画像全体の文字数を推定しかつ前記全単語画像
から生成した領域内の文字数を推定するステップと、前
記単語画像全体の画像特徴を抽出しかつ前記全単語画像
から生成した領域内の画像特徴を抽出するステップと、
前記文字コードと前記領域内の文字数と前記領域内の図
形特徴とを用いて前記単語画像を表す単語記述を生成す
るステップと、前記単語全体の推定文字数と前記単語全
体の図形特徴とを用いて前記語彙記憶手段に記録された
語彙を選択しかつ前記単語記述と前記語彙記憶手段に記
録された語彙とを照合して無矛盾に照合可能な語彙を選
択して出力するステップとを備えている。
【0019】本発明による単語大分類制御プログラムを
記録した記録媒体は、単語画像を入力し、それに類似す
る語彙を予め語彙記憶手段に記憶された語彙の中から選
択する単語大分類装置を制御する単語大分類制御プログ
ラムを記録した記録媒体であって、前記単語大分類制御
プログラムは前記単語大分類装置に、前記単語画像中か
ら予め定めた条件に合った画像領域である候補文字を選
択させ、その選択された画像領域を文字コードに変換さ
せ、変換された文字コードを用いて前記単語画像を表す
単語記述を生成させ、生成された単語記述と前記語彙記
憶手段に記録された語彙とを照合して無矛盾に照合可能
な語彙を選択して出力させている。
【0020】本発明による他の単語大分類制御プログラ
ムを記録した記録媒体は、単語画像を入力し、それに類
似する語彙を予め語彙記憶手段に記憶された語彙の中か
ら選択する単語大分類装置を制御する単語大分類制御プ
ログラムを記録した記録媒体であって、前記単語大分類
制御プログラムは前記単語大分類装置に、前記単語画像
中から予め定めた条件に合った画像領域である候補文字
を選択させ、その選択された画像領域を文字コードに変
換させ、前記単語画像全体の文字数を推定させかつ前記
単語画像から生成した領域内の文字数を推定させ、変換
された文字コードと推定された前記領域内の文字数とを
用いて前記単語画像を表す単語記述を生成させ、前記単
語全体の推定文字数を用いて前記語彙記憶手段に記録さ
れた語彙を選択させかつ前記単語記述と前記語彙記憶手
段に記録された語彙とを照合して無矛盾に照合可能な語
彙を選択して出力させている。
【0021】本発明による別の単語大分類制御プログラ
ムを記録した記録媒体は、単語画像を入力し、それに類
似する語彙を予め語彙記憶手段に記憶された語彙の中か
ら選択する単語大分類装置を制御する単語大分類制御プ
ログラムを記録した記録媒体であって、前記単語大分類
制御プログラムは前記単語大分類装置に、前記単語画像
中から予め定めた条件に合った画像領域である候補文字
を選択させ、その選択された画像領域を文字コードに変
換させ、前記単語画像全体の文字数を推定させかつ前記
全単語画像から生成した領域内の文字数を推定させ、前
記単語画像全体の画像特徴を抽出させかつ前記全単語画
像から生成した領域内の画像特徴を抽出させ、前記文字
コードと前記領域内の文字数と前記領域内の図形特徴と
を用いて前記単語画像を表す単語記述を生成させ、前記
単語全体の推定文字数と前記単語全体の図形特徴とを用
いて前記語彙記憶手段に記録された語彙を選択させかつ
前記単語記述と前記語彙記憶手段に記録された語彙とを
照合して無矛盾に照合可能な語彙を選択して出力させて
いる。
【0022】本発明によるさらに別の単語大分類制御プ
ログラムを記録した記録媒体は、単語画像を入力し、そ
れに類似する語彙を予め語彙記憶手段に記憶された語彙
の中から選択する単語大分類装置を制御する単語大分類
制御プログラムを記録した記録媒体であって、前記単語
大分類制御プログラムは前記単語大分類装置に、前記単
語画像中から予め定めた条件に合った画像領域である候
補文字を選択させ、前記単語画像が大文字のみからなる
か大文字と小文字との混在かを判定させ、前記大文字の
みからなると判定された時に前記大文字のみに字種を限
定して選択された画像領域を文字コードに変換させかつ
前記大文字と小文字との混在と判定された時に全字種を
対象として選択された画像領域を文字コードに変換さ
せ、前記単語画像全体の文字数を推定させかつ前記全単
語画像から生成した領域内の文字数を推定させ、前記単
語画像全体の画像特徴を抽出させかつ前記全単語画像か
ら生成した領域内の画像特徴を抽出させ、前記文字コー
ドと前記領域内の文字数と前記領域内の図形特徴とを用
いて前記単語画像を表す単語記述を生成させ、前記単語
全体の推定文字数と前記単語全体の図形特徴とを用いて
前記語彙記憶手段に記録された語彙を選択させかつ前記
単語記述と前記語彙記憶手段に記録された語彙とを照合
して無矛盾に照合可能な語彙を選択して出力させてい
る。
【0023】すなわち、本発明の単語大分類装置は、単
語画像から単一の文字らしい部分を検出する候補文字選
択部と、選択した文字を認識する文字認識部と、単語画
像やその一部の画像からそこに含まれる文字数を推定す
る文字数推定部とを有し、選択した候補文字の認識部と
推定文字数とから候補文字を記述する単語記述部と、記
述された結果を語彙記憶部に記録された語彙の文字コー
ドと比較して類似した語彙を選択する語彙選択部とを持
っている。
【0024】したがって、単語画像から単語特徴を予め
抽出して記憶しておく必要がなく、また単語内に含まれ
る数文字だけを用いて類似単語を選択するのに比べ、選
択した文字とその単語内での位置を利用して類似単語を
選択するので、余計な類似単語を選択することが少な
く、効率的に単語を選択することが可能となる。
【0025】
【発明の実施の形態】次に、本発明の実施例について図
面を参照して説明する。図1は本発明の一実施例による
単語大分類装置の構成を示すブロック図である。図1に
おいて、本発明の一実施例による単語大分類装置は入力
端子101と、候補文字選択部1と、文字認識部2と、
文字数推定部3と、単語記述部4と、語彙選択部5と、
語彙記憶部6と、出力端子102とから構成されてい
る。
【0026】入力端子101から入力された単語画像は
候補文字選択部1と文字数推定部3とに転送される。単
語画像の一例を図2に示す。候補文字選択部1は単語画
像の局所領域毎に特徴を抽出し、当該特徴にしたがって
単語画像の局所領域が単一の文字からなっているか否か
を判定する。
【0027】候補文字選択部1は単一の文字からなって
いると判定すると、その単語画像の局所領域を文字認識
部2に転送し、文字認識部2では当該部分の文字認識を
実施し、認識結果の文字コードを単語記述部4に転送す
る。
【0028】図2は本発明の一実施例による単語大分類
装置が扱う単語画像の一例を示す図であり、図3は図1
の語彙記憶部6内の語彙の表の例を示す図であり、図4
は単語画像と選択された候補文字とその認識結果と生成
された照合文字との例を示す図である。
【0029】また、図5は単語画像から選択された候補
文字とそれから生成された照合文字とそれから生成され
た単語記述と同等の状態遷移グラフとの例を示す図であ
り、図6は単語画像から生成された単語記述の例を示す
図である。
【0030】さらに、図7は本発明の一実施例による単
語大分類装置の動作を示すフローチャートである。これ
ら図1〜図7を参照して本発明の一実施例による単語大
分類装置の動作について説明する。尚、図7に示す処理
動作は本発明の一実施例による単語大分類装置の各部が
図示せぬ制御メモリのプログラムを実行することで実現
され、制御メモリとしてはROM(リードオンリメモ
リ)やIC(集積回路)メモリ等が使用可能である。
【0031】まず、単語画像を入力端子101から入力
する際に上記の単語大分類装置の全体処理を起動し(図
7ステップS1)、単語大分類装置は候補文字選択部1
02を起動する(図7ステップS2)。ここで、入力さ
れる単語画像としては図4の(a)に示したような画像
を例とする。
【0032】候補文字選択部1では単語画像から単一の
文字らしい局所領域を検出して文字認識部2と文字数推
定部3とに転送する。図4に示す例では、図4の(b)
に図4の(a)の単語画像から検出した候補文字の例を
示す。この例の場合では3つの候補文字が選択されてい
るものとする。
【0033】文字認識部2は候補文字選択部1が生成し
た局所領域である候補文字を、1つづつ認識する(図7
ステップS3)。例えば、図4に示す例では、最初に図
4の(b)の最も左にある候補文字を選択して文字認識
を実行する。図4に示す例ではその結果を図4の(c)
の認識結果の欄に示している。図4の(b)の最も左の
候補文字の例では、認識結果は(I,R,W)の3つを
選択している。その結果は、文字認識部2から単語記述
部4に転送される。
【0034】単語大分類装置では候補文字選択部1が生
成した候補文字の全てを文字認識部2が認識したか否か
をチェックし(図7ステップS4)、全ての候補文字の
認識が終了していなければ、ステップS3に戻って文字
認識部2を繰返し起動する。
【0035】図4の(b)に示す例では最も左の候補文
字のみが認識されただけであるので、続いて左から2番
目の候補文字を選択して文字認識部2を起動し、認識結
果(M,H,U)を生成して単語記述部4に転送する。
同様に、図4の(b)に示す例では左から3番目の候補
文字についても文字認識部2を実行し、認識結果(U,
V,N)を生成して単語記述部4に転送する。また、単
語大分類装置では全ての候補文字の認識を終了している
ならば、ステップS5に進む。
【0036】続いて、単語大分類装置は文字数推定部3
を起動し、入力端子101から入力された単語画像に含
まれる文字数を推定して求める(図7ステップS5)。
ここで、単語画像はステップS1で入力端子101から
単語画像が入力され、候補文字選択部1に転送されたの
と同時に、同一単語画像が文字数推定部3にも転送され
ているものとする。文字数推定部3は単語画像の文字数
を求めた後に、その文字数を語彙選択部5に転送する。
【0037】文字数推定部3は候補文字間の文字数を推
定する(図7ステップS6)。この場合、まず1番左の
候補文字を選択し、単語画像の左端から当該候補文字の
左端までの局所領域に含まれる文字数を推定する。図4
に示す例では、最も左の候補文字より左の局所領域は図
4の(a)に示す「SA」からなる部分である。文字数
推定部3はその推定結果の文字数を単語記述部4に転送
する。
【0038】単語大分類装置は全ての文字間の文字数を
推定したかをチェックし(図7ステップS7)、全ての
文字間を処理していなければ、ステップS6に戻って文
字数の推定を継続する。図4に示す例では、左から1番
目の候補文字の左側の部分の文字数を推定した後に、左
から1番目の候補文字と2番目の候補文字との間の文字
数、2番目の候補文字と3番目の候補文字との間の文字
数、3番目の候補文字の右側の文字数を順次推定し、そ
の結果を単語記述部4に転送する。
【0039】単語大分類装置は全ての候補文字間の文字
数を推定し終わると、単語記述部4を起動する(図7ス
テップS8)。単語記述部4には文字数推定部3から候
補文字間の文字数の推定結果が転送されており、また文
字認識部2から各候補文字の認識結果が転送されてい
る。単語記述部4はこれらに基にづいて入力端子101
から入力された単語画像の記述を生成する。
【0040】図6に図4の(a)に示した単語画像から
生成した単語記述の一例を示す。図6に示す単語記述例
は図5の(c)に例示した状態遷移グラフを表現するも
のである。図6に示す照合文字の欄に記載された「*」
なる文字はいかなる文字とも照合できることを示す。図
6に示す繰返し数の欄に記載された数字はいかなる文字
でもよいが、当該繰返し数分の文字が現れることを意味
する。例えば、図4に示す状態番号の「1」での繰返し
数「2」は任意の文字が2回連続して現れることを意味
する。
【0041】図6に示す照合文字の欄には候補文字を認
識して得た結果の文字コードを記憶する。候補文字及び
候補文字間はそれぞれ1つの状態として記述され、単語
内での位置の左から順に状態番号を割り当てる。また、
単語の左端を状態「S」として、単語の右端を状態
「E」とする。さらに、次状態番号はある状態から次の
状態に遷移できる状態の番号を示す。例えば、状態番号
「1」の次には、状態番号「1」に移動するか、状態番
号「2」に移動することが記載されている。
【0042】図5に示す状態遷移グラフでは当該事項
が、丸で囲まれた状態番号において、の状態「1」か
ら状態「1」に戻るループ矢印と、状態「2」へ向かう
線分矢印とで記述されている。図6に示す例では図4に
示す単語画像を参照し、単語画像の左端から1番目の候
補文字までに2文字がある単語のみが選択されることを
意味する。
【0043】単語記述部4は単語の初期状態「S」と最
終状態「E」とを設定し、文字認識部2から転送されて
きた候補文字の認識結果から状態を定める。単語の左端
と1番目の候補文字との間の文字間を状態「1」とし、
1番目の候補文字を状態「2」とする。これ以降、候補
文字を左から順位「2」、「4」、「6」という偶数番
目の状態とする。また、文字間を「1」、「3」、
「5」、「7」という奇数番目の状態とする。
【0044】つまり、最も右側の候補文字を2N番目の
状態とする時、その右側で最終状態「E」の直前の状態
を2N+1番目とする。ただし、ここでNは任意の自然
数とする。また、予め次状態番号として、各状態の次状
態番号の欄には、当該状態の番号に「1」を加えた状態
番号を割り当てておく。ここで、初期状態「S」の次状
態番号は「1」とし、最終状態の次状態番号は空欄とす
る。
【0045】次に、単語記述部4は照合文字を各状態に
割り当てる。候補文字をあらわす状態の照合文字には文
字認識部2から転送された認識結果を割り当てる。図6
に示す例では状態番号「2」が図4に示す例での一番左
の候補文字に相当するので、認識結果(I,R,W)を
照合文字として記述する。
【0046】また、繰返し数は「1」とする。これは1
回文字が照合されたら次の状態に進むことを意味する。
同様にして、図6に示す例での状態「4」及び状態
「6」の照合文字と繰返し数とを定めて記述する。続い
て、単語記述部4は図6に示す例での状態番号「1」の
文字間の照合文字を定める。図6に示す状態「1」は、
図4に示す例での1番目の候補文字の左側の文字間に相
当する。
【0047】文字数推定部3からはこの部分に相当する
文字数が「2」と推定されて転送されているものとす
る。この場合に、図6に示す状態「1」の照合文字は不
定であり、どの文字でもよいという「*」記号を与え、
その繰返し数を推定文字数に相当する「2」と定める。
また、同一状態を推定文字数分繰返すので、次状態番号
に当該状態の番号、この例では状態番号「1」の次状態
番号に「1」を加える。同様にして、状態「6」での照
合文字と繰返し数を定めて記述する。また、次状態番号
に「5」を追加する。
【0048】図6に示す状態「3」はその前後の状態
「2」と状態「4」とを表す候補文字が元の単語中で並
んで存在しているために、間に別の文字が入ることはな
い。それゆえ、照合文字には空白を入れる。ただし、空
白すらなく、2つの文字が接触して並んでいることも想
定されるので、空白がない場合の状態遷移を設定する。
【0049】つまり、空白に相当する状態の1つ前の状
態の次状態番号に、空白に相当する状態の次の状態の番
号を追加する。図6に示す例では、状態「3」が空白に
相当するので、状態「2」の次状態番号に「4」を追加
する。この手順に従えば、図5の(c)に示す状態遷移
グラフに相当する単語記述を図6に示す例のように生成
できる。
【0050】ここで生成された単語記述は語彙選択部5
に転送され、語彙選択部5が起動され、文字数推定部3
から転送されてきた単語全体の文字数を利用し、語彙記
憶部6中に記録されている語彙の中から対象語彙を選択
し、語彙記憶部6内に記憶する(図7ステップS9)。
【0051】本発明の一実施例では語彙記憶部6内の構
成が、従来の単語大分類装置と同様に、図3に示す形式
で語彙が記録されているものとするが、これは本発明に
とって本質的なものではなく、どのような形式で語彙が
記録されていもよい。
【0052】語彙選択部5は語彙記憶部6から順に語彙
を読出し、その文字数のとりうる最大値と最小値とを生
成する。図3に示す例では、まず最初に番号「1」の語
彙を選択して文字数を調べ、文字数最大値「10」と最
小値「8」とを得る。
【0053】語彙選択部5は文字数推定部3から転送さ
れた単語全体の文字数を当該語彙の文字数の最大値及び
最小値と比較し、単語全体の文字数が当該語彙の文字数
の最大値と最小値との範囲内にあるならば、当該語彙を
語彙記憶部6に選択した旨記憶する。語彙選択部5は単
語全体の文字数が当該語彙の文字数の最大値と最小値と
の範囲内になければ、第1番目の語彙を棄却し、語彙記
憶部6には選択したことを記憶しない。同様に、語彙選
択部5は語彙記憶部6の2番目以降の語彙についても、
上記と同様の処理を行い、単語全体の文字数が当該語彙
の文字数の最大値と最小値との範囲内にあるならば、語
彙記憶部6内に選択したことを記憶する。
【0054】語彙選択部5は語彙記憶部6に選択記憶さ
れた語彙について順次、単語記述部4で生成された単語
記述に照合する語彙であるかどうかを検証する(図7ス
テップS10)。語彙選択部5は照合できた場合にその
語彙を再び語彙記憶部6に選択した旨を記録し、照合で
きなかった場合に語彙記憶部6から当該語彙を選択した
ことを消去する。
【0055】語彙選択部5は語彙記憶部6に選択された
ことが記憶された全ての語彙について単語記述と照合し
たかをチェックし(図7ステップS11)、全てと照合
していればステップS10に戻って、語彙記憶部6内に
選択記録された別の語彙と単語記述とを照合する。語彙
選択部5は語彙記憶部6に選択記録された語彙の全てと
単語記述との照合が終了していれば、語彙記憶部6に選
択したことが記録されている語彙を出力端子102から
大分類結果の語彙として出力する(図7ステップS1
2)。
【0056】語彙選択部5での単語照合の動作を、図3
と図5とを用いて説明する。図5の(c)に示す状態遷
移グラフは、図6に示す単語記述の表が具体的な記憶形
式である。照合したい語彙の先頭の文字から順に状態遷
移グラフに与え、照合文字に合致した場合に状態をそれ
にしたがって進める。
【0057】まず、図3中の番号「1」の「HARMO
INEN」を照合する場合について説明する。初期状態
「S」から第1番目の文字「H」を状態遷移グラフに与
えると、状態「1」の照合文字は任意の文字であり、状
態を1番に移す。続いて、2番目の文字「A」を状態遷
移グラフと照合すると、状態「2」の照合文字とは合致
しないので、状態「1」の任意の文字とのみ照合するの
で、状態は番号1に留まる。
【0058】さらに、3番目の文字「R」を照合する
と、状態「2」の照合文字の1つと合致するので、状態
を「1」から「2」に移す。この際に、状態「1」での
繰返し数を「2」として記録する。また、状態「1」の
照合文字である任意の文字とも合致するので、状態
「1」に留まる可能性も残す。さらにまた、第4番目の
文字である「M」を照合すると、状態「2」の次状態番
号の内、状態「4」の照合文字と合致するので、状態
「4」へ移動する。また、状態「1」に残っている場合
については、また任意の文字と照合するので、再び状態
「1」に留まる。
【0059】続いて、5番目の文字を照合すると、
「O」であり、状態「4」の次状態番号である「5」を
取得し、状態「5」は任意の文字を照合することができ
るので、状態「5」に進む。状態「1」に留まっている
場合には、状態「2」へ進むための文字が6番目の
「I」までこない。6番目の「I」を照合すると、状態
「2」へ進む場合と、さらに状態「1」に更に留まる場
合とが想定される。状態「1」に留まる場合には、残る
7番目の文字から9番目の文字まで照合しても、状態
「2」へ進むことができず、最終状態「E」まで到達す
ることができないので、この可能性での照合は棄却され
る。
【0060】第6番目の文字「I」で状態「2」へ進ん
だ場合には、状態「2」の次状態番号である状態「3」
または状態「4」の照合文字と、当該語彙の7番目の文
字とは照合されないので、この可能性も棄却される。5
番目の文字である「O」を照合して状態「5」に進んだ
場合には、続く6番目の文字でも、状態「5」の次状態
の一つである状態「6」の照合文字とは合致せず、もう
一つの次状態である状態「5」の照合文字である任意の
文字と合致するので、状態「5」に留まる。
【0061】次の第7番目の文字である「N」は、状態
「5」の次状態の一つである状態「6」の照合文字とは
合致するので、状態「6」へ移る可能性を持つ。ただ
し、状態「6」の次状態である最終状態「E」には必ず
移るものの、最終状態「E」の照合文字は「単語終り」
を表す記号であるので、第8番目の文字である「E」と
は合致せず、この可能性も棄却される。
【0062】第7番目の文字を入力した場合の状態
「5」からのもう一つの移り先である状態「5」では、
第8番目の文字「E」を照合した場合にも状態「5」に
留まる。最終文字である「N」を照合した場合には、状
態「6」の照合文字と合致するので、状態「6」へ進
み、「E」の照合文字である「単語終り」を表す記号と
照合されて最終状態「E」に移る。
【0063】この場合には、照合し残した文字も存在せ
ず、最終状態「E」に至ったので、当該語彙は単語記述
と照合されたものとする。最終文字を照合する場合に
も、状態「5」に留まる可能性については、最終文字を
照合しても最終状態「E」に至らなかったので、この可
能性は棄却される。
【0064】つまり、図3に示す第1番目の語彙の例で
は1つの可能性のみが単語記述と照合される。この際
に、状態「1」で照合された文字コード列は「AR」で
あり、状態「5」で照合された文字コード列は「OIN
E」である。
【0065】語彙選択部5は文字コード列「AR」から
推定文字数の最大値と最小値とを求める。これを最大値
が「3」、最小値が「2」であったとすると、図6に示
す状態「1」の繰返し数はこれらの範囲に入っている。
【0066】同様に、語彙選択部5は文字コード列「O
INE」の文字数推定値の最大値と最小値とを求める。
これらが「5」及び「4」であったとすると、図6に示
す状態「5」の繰返し数は「6」であり、これらの範囲
内にない。それゆえ、繰返し数において、照合の可能性
が棄却される。
【0067】その結果、全ての照合の可能性が棄却され
たので、図3に示す第1番目の語彙は単語記述とは照合
されないものと判定し、語彙記憶部6には選択した旨を
記録しない。同様に、語彙記憶部6に選択されたことが
記録された全ての語彙を単語記述と照合し、状態遷移グ
ラフで照合した上で、推定文字数に関しても唱導できた
場合には、当該語彙が単語記述と照合されたものとして
語彙記憶部6に選択したことを記録する。
【0068】図8は図1の候補文字選択部1の詳細な構
成を示すブロック図である。図8において、候補文字選
択部1は連結矩形検出部11と、矩形特徴抽出部12
と、矩形選択部13とから構成されている。
【0069】入力端子101から入力された単語画像は
候補文字選択部1に入力されると、連結矩形検出部11
に記憶される。単語画像の例は図4の(a)に示す。画
像は2値画像で、画像中の各画素は黒画素か白画素かの
いずれかである。数値的には黒画素は“1”なる値を取
り、白画素は“0”なる値を取るものとして説明する
が、これは本質的な問題ではない。
【0070】連結矩形検出部11では隣接する画素の値
が共に“1”である画素に対して同一のラベル値を与え
て新たな画像を生成する。初期的に全ての黒画素のみに
異なるラベル値を与え、白画素にはラベル値を与えてい
ないものとする。
【0071】連結矩形検出部11では画素の座標を
(x,y)とし、当該画素の値をI(x,y)とし、ラ
ベル画像での当該画素の画素値をL(x,y)とする
と、I(x,y)=I(x+i,y+j)=1で、iが
−1,0,1のいずれかで、jが−1,0,1のいずれ
かで、i,jともに0でない条件が成り立つ時に新たな
ラベル値を、 L(x,y)=Min(L(x,y),L(x+i,y+j)) L(x+i,y+j)=Min(L(x,y),L(x+i,y+j)) ……(1) という式で計算して求める。ただし、ここで、Min
(u,v)はuとvとのうちの小さい値を返す関数とす
る。
【0072】連結矩形検出部11は(1)式の計算を全
ての画素について繰返し実行し、ラベル値の変化がなく
なるまで繰返す。これによって得られるラベル画像は隣
接する画素に黒画素が存在する黒画素のグループが同一
のラベル値を持つようになる。同一ラベル値を持つ黒画
素のグループを連結領域と呼び、連結領域を囲む最小矩
形を連結矩形とする。連結矩形検出部11でK個の連結
矩形が得られたとし、第k番目の連結矩形をその左上の
座標(x(k,1),y(k,1))と右下の座標(x
(k,2),y(k,2))とで表現する。
【0073】連結矩形検出部11は全ての連結矩形の左
上座標のx座標、つまりx(k,1)が小さいものの順
に並べ直し、連結矩形に番号をつける。その結果として
生成されたK個の連結矩形に対応するK個の連結領域
を、連結矩形検出部11は矩形特徴抽出部12に転送す
る。
【0074】矩形特徴抽出部12では入力されたK個の
連結矩形の左下座標と右下座標と連結領域とから連結領
域の特徴を抽出する。第k番目の連結矩形のデータであ
る(x(k,1),y(k,1))と(x(k,2),
y(k,2))とから、 A(k)=(y(k,2)−y(k,1)) /(x(k,2)−x(k,1)) ……(2) なる式にしたがって特徴量A(k)を計算する。
【0075】また、第k番目の連結領域に含まれる黒画
素数をB’(k)とし、 B(k)=B’(k) /((y(k,2)−y(k,1)) ・(x(k,2)−x(k,1))) ……(3) なる式にしたがって特徴量B(k)を計算する。
【0076】矩形特徴抽出部12は以上に述べた特徴量
A(k),B(k)を全てのkについて求め、矩形選択
部13に転送する。本実施例では矩形特徴抽出部12で
特徴量A(k),B(k)の2種類の特徴を抽出する例
を述べたが、縦線の本数や連結領域内の閉白領域の数や
位置等の特徴を抽出して用いても、上記と同様の効果を
得ることができるので、本実施例で述べた2つの特徴に
は限らない。
【0077】矩形選択部13では矩形特徴抽出部12か
ら転送されたK組の特徴量(A(k),B(k))(た
だし、kは1からKまでの自然数)を用いて矩形の選択
を行う。矩形の選択には、例えば、 (A(k)−C)**2+D×B(k)>第1のしきい値 ……(4) という式の条件を満たすかの検定を実行する。ここで、
x**2はxの自乗計算を表す。また、本実施例ではC
を1として、Dを1として、第1のしきい値を0.3と
したが、これらの値は本質的なものではなく、どのよう
な値でもよい。また、(4)式は複数の特徴量を用いて
条件に適合するか否かを検定するための1つの実施例で
あり、判別を実行するようなものであるならばどのよう
な方法でも構わない。
【0078】矩形選択部13はK組の特徴量に対して、
1番目から順に(4)式の検定を実行し、第k番目の組
の特徴量が(4)式の条件を満たした場合には第k番目
の連結領域を文字認識部2に転送する。また同時に、矩
形選択部13は第k番目の連結矩形の左上座標と右下座
標とを文字数推定部3に転送する。候補文字選択部1は
上記の検定をK組全ての特徴量の組に対して実行した後
に停止する。
【0079】文字認識部2は、「文字認識概論」(橋本
新一郎編著、オーム社刊、昭和57年3月発行)の99
ページから126ページに記載されている多数の文字認
識方法のうちの一つを利用すれば実施することができ
る。
【0080】文字認識部2は候補文字選択部1から転送
されてくるK’個の候補文字について、個々の候補文字
を認識して得た結果の文字コードをE個選択して単語記
述部4に転送する。本実施例ではEを3としたが、この
値はどのような値でもよい。Eを3とした場合にはK’
個の候補文字を認識した後に、K’×3個の文字コード
を単語記述部4に転送することになる。文字認識部2は
文字コードを単語記述部4に転送する際に、候補文字数
K’も単語記述部4に転送する。
【0081】図9は図1の文字数推定部3の詳細な構成
を示すブロック図である。図9において、文字数推定部
3は単語画像記憶部31と、領域設定部32と、領域記
憶部33と、黒ラン数計数部34と、文字数計算部35
とから構成されている。
【0082】入力端子101から入力された単語画像は
単語画像記憶部31に記憶される。図7のステップS5
の全体文字数の推定では領域記憶部33に単語画像の全
体での左上座標と右下座標とが記録される。図7のステ
ップS5での候補文字間文字数推定では領域設定部32
が起動され、候補文字選択部1から順次転送されてくる
候補文字の左上座標と右下座標とから文字数推定すべき
局所領域を決定して領域記憶部33に転送して記録す
る。
【0083】領域設定部32では候補文字選択部1から
1番目の候補文字の左上座標と右下座標とを受信した場
合に、局所領域の左端を単語画像の左端として設定し、
局所領域の右端を候補文字の左端として設定する。領域
設定部32は2番目以降の第k番目の候補文字を受信し
た場合に、第k番目の局所領域を、その左端を第k−1
番目の候補文字の右端として、その右端を第k番目の候
補文字の左端としてそれぞれ設定する。
【0084】最後のK’番目の候補文字のデータが候補
文字選択部1から転送された後に、領域設定部32は第
K’+1番目の局所領域の左端を第K’番目の候補文字
の右端として定め、第K’+1番目の局所領域の右端を
当該単語画像の右端として定めて領域億部33に記憶す
る。
【0085】黒ラン数計数部34は領域記憶部33から
領域の左端と右端とを順次読出し、当該領域内の黒ラン
を検出してその数を計数する。当該単語画像の左上の座
標を(0,0)なる原点とし、当該単語画像の右下の座
標を(X,Y)とし、処理対象となる領域の左端のx座
標をX1,右端のx座標をX2とする。単語全体の文字
数を推定する場合にはX1が0であり、X2がXであ
る。また、黒ラン数計数部34では当該単語画像をI
(x,y)として、(x,y)座標の画素値を表現す
る。
【0086】黒ラン検出部34ではy座標値をVに固定
し、I(x,V)なる画素値をxをX1からX2まで変
えて調べる。この場合、連続して現れる一連の画素値1
を黒ランと呼ぶ。画素値が0から1に変化した時が黒ラ
ンの始まりであり、1が続く限り1つの黒ランが続くと
し、画素値が1から0に変化した時に当該黒ランが終了
するとする。
【0087】黒ラン数計数部34ではこの黒ランが何回
現れるかを計数する。例えば、連続する画素値が(0,
0,1,1,1,0,0,1,1,1,1,0)であっ
た場合には、黒ラン数が「2」となる。y座標値がVで
ある画素をx座標がX1からX2まで走査してえた黒ラ
ン数をF(V)とする。本実施例では、黒ラン数計数部
34において、VをY/4,Y/2,3Y/4の3通り
について黒ラン数を求めて文字数計算部35に転送する
ように実現したが、これは本質的な問題ではなく、何通
りのVを用いてもよい。
【0088】文字数計算部35では黒ラン数計算部34
から転送された複数の黒ラン数の平均値を計算して求
め、さらにその値に係数Gを掛けて推定文字数を定め
る。本実施例ではGの値を0.56としたが、他の値で
も問題ない。また、本実施例では文字数の推定値を単一
の値として実現したが、黒ラン数計算部34から転送さ
れた複数の黒ラン数の最大値と最小値との組を文字数推
定値として定めてもよいし、黒ラン数の最大値に係数G
を掛けた値と、黒ラン数の最小値に係数Gを掛けた値と
の組を文字数推定値としてもよい。文字数計算部35は
計算して求めた文字数推定値を単語記述部4と語彙選択
部5とに転送する。
【0089】図10は図1の単語記述部4の詳細な構成
を示すブロック図である。図10において、単語記述部
4は認識候補バッファ41と、文字数バッファ42と、
状態遷移グラフ生成部43とから構成されている。
【0090】文字認識部2はK’個の候補文字を認識
し、各候補文字につき複数の文字コードを単語記述部4
に転送するので、単語記述部4ではそれらを認識候補バ
ッファ41に記録する。同時に、単語記述部4では候補
文字数K’も受信し、認識候補バッファ41に記録す
る。
【0091】また、文字数推定部3はK’+1個の文字
間について文字数推定値を計算して求めて単語記述部4
に転送するので、単語記述部4ではそれらを文字数バッ
ファ42に記録する。単語記述部4ではこれらを記録す
ると、状態遷移グラフ生成部43を起動し、図6に示す
例のような単語記述を生成する。
【0092】図11は図10の状態遷移グラフ生成部4
3の動作を示すフローチャートである。これら図10及
び図11を用いて状態遷移グラフ生成部43の動作につ
いて説明する。尚、図11に示す処理動作は状態遷移グ
ラフ生成部43が図示せぬ制御メモリのプログラムを実
行することで実現され、制御メモリとしてはROMやI
Cメモリ等が使用可能である。
【0093】状態遷移グラフ生成部43は起動されると
(図11ステップS21)、認識候補バッファ41に記
録された候補文字の数K’から状態数を2×K’+3と
設定する(図11ステップS22)。
【0094】続いて、状態遷移グラフ生成部43は単語
記述に状態番号を設定する(図11ステップS23)。
ここでは、最初の状態番号を「S」とし、最後の状態番
号を「E」として状態番号「S」に続く状態に「1」か
ら順に1づつ増やした自然数を割り当てる。
【0095】次に、状態遷移グラフ生成部43は次状態
番号の初期設定を行う(図11ステップS24)。状態
「S」の次状態番号を「1」とし、状態「E」の次状態
番号には何も割り当てない。また、状態番号「1」から
「2K’」までには、状態番号に「1」を加えた値を当
該状態の次状態番号として割り当てる。さらに、状態番
号「2K’+1」の次状態番号には「E」を割り当て
る。以降の説明でも、状態番号「S」は状態番号「0」
と同一であり、状態番号「E」は状態番号「2K’+
2」と同一である。
【0096】状態遷移グラフ生成部43は状態番号
「1」から状態番号「2K’+1」までについて照合文
字と繰返し数とを順次設定するとともに、次状態番号に
追加修正を加える(図11ステップS25〜S35)。
すなわち、状態遷移グラフ生成部43は状態番号が偶数
か否かを判定し(図11ステップS25)、偶数である
場合にステップS26とステップS27とを実行してス
テップS35に進み、奇数である場合にステップS28
からステップS34を実行してステップS35に進む。
【0097】状態遷移グラフ生成部43はステップS2
5で状態番号が「2k」である場合に、状態番号が偶数
であるので、ステップS26に進んで、認識候補バッフ
ァ41から第k番目の候補文字の認識結果の文字コード
の組を読出し、状態番号「2k」の照合文字とし、単語
記述に格納する。ただし、状態番号が「2K’+2」で
ある最終状態「E」の場合には照合文字として「単語の
終り」を示す記号を記録する。続いて、状態遷移グラフ
生成部43はステップS27に進んで、状態番号「2
k」の繰返し数に「1」を設定する。
【0098】状態遷移グラフ生成部43はステップS2
5で状態番号が「2k−1」で、奇数の場合にステップ
S28に進み、文字数バッファ42から第k番目の文字
間の推定文字数を読出し、その推定文字数が「0」より
大きい場合にステップS29からステップS31までを
実行してステップS35に進む。状態遷移グラフ生成部
43は第k番目の文字間での推定文字数が「0」である
場合に、ステップS32からステップS34までを実行
してステップS35に進む。
【0099】状態遷移グラフ生成部43は当該状態での
推定文字数が「0」より大きい場合、文字間の照合文字
に任意の文字と照合可能であることを示す記号「*」を
設定する。状態遷移グラフ生成部43はステップS30
で、当該状態の繰返し数として、文字数バッファ42か
ら読出した第k番目の文字間での推定文字数を設定し、
ステップS31で、当該状態の次状態番号に当該状態の
番号も追加してステップS35に進む。
【0100】状態遷移グラフ生成部43はステップS2
8において、第2k−1番目の状態において、文字数バ
ッファ42から読出した第k番目の文字間の推定文字数
が「0」である場合にステップS32に進んで、当該状
態の照合文字に空白を示す記号を設定する。
【0101】状態遷移グラフ生成部43はステップS3
3において、候補文字の繰返し数に「1」を設定し、ス
テップS34において、当該状態の1つ前の状態、つま
り第2k番目の状態の次状態番号に「2k+2」を追加
設定する。その後、状態遷移グラフ生成部43はステッ
プS35に進む。
【0102】状態遷移グラフ生成部43はステップS3
5で、全ての状態の設定を終了したと判定すると、ステ
ップS36に進んで停止する。状態遷移グラフ生成部4
3は全ての状態の設定が終了していなければ、ステップ
S25に戻って、未設定の状態の設定を継続する。
【0103】図12は図1の語彙選択部5の詳細な構成
を示すブロック図であり、図13は図12の文字数範囲
生成部内の文字コード毎の推定文字数の範囲を記憶した
表の例を示す図である。図12において、語彙選択部5
は文字数検証部51と、文字数範囲生成部52と、状態
遷移検証部53と、候補文字間文字数検証部54とから
構成されている。
【0104】語彙選択部5は文字数推定部3から単語画
像全体の推定文字数が転送されてくると、その推定文字
数を文字数検証部51に格納し、語彙記憶部6から語彙
を順次1つづつ読出し、各語彙の文字数が推定文字数と
無矛盾であるか否かを検証する。例えば、語彙記憶部6
に図3に示す形式で語彙が記憶されている場合について
以下説明する。語彙選択部5は起動直後に、語彙記憶部
6の選択記号の欄をすべて初期化し、全ての語彙の選択
記号の欄に空白記号を書込む。
【0105】その後、語彙選択部5は語彙記憶部6の1
番目の語彙を読出し、文字数範囲生成部52に転送す
る。例えば、図3に示す例では、1番目の「HARMO
INEN」を前記語彙記憶部6から読出す。文字数範囲
生成部52には、図13に示す形式で、各文字コードに
対応する文字を文字数推定部3に入力した場合に推定さ
れる文字数の範囲が記録されているものとする。
【0106】図13に示す例では、文字コード「A」を
手書きした文字を文字数推定すると、最小1文字と推定
され、最大3文字と推定されることが記録されている。
同様に、文字コード「B」を手書きした文字を文字数推
定すると、最小1文字と推定され、最大2文字と推定さ
れることが記録されている。
【0107】本実施例では、図13に示した各文字コー
ドを文字数推定した場合の最小文字数と最大文字数は、
設計者が適当に与えたが、予め収集した文字画像を本発
明の単語大分類装置内の文字数推定部3に入力して得た
結果の推定文字数を調べ、最小文字数と最大文字数とを
定めても良い。また、図13に示す推定文字数の範囲は
整数である必要はない。さらに、文字数推定部3での係
数Gがどのような値であったとしてもそれに合わせて文
字数の範囲を定めればよく、本発明においては本質的に
は何も変わらない。
【0108】文字数範囲生成部52は第k番目の語彙を
読出した時に、当該語彙の個々の文字コードでの推定文
字数の最小値を調べてその総和を求め、当該語彙での文
字数推定値の最小値M1(k)とする。ただし、kは語
彙の番号を表わす。同様に、当該語彙の個々の文字コー
ドでの推定文字数の最大値を調べてその総和を求め、当
該語彙での文字数推定値の最大値M2(k)とする。文
字数範囲生成部52は当該語彙の推定文字数の最小値と
最大値を文字数検証部51に転送する。
【0109】文字数検証部51は受信した推定文字数の
最小値M1(k)と最大値M2(k)とを、文字数推定
部3から受信した単語画像全体の推定文字数と比較す
る。単語画像全体の推定文字数をLとした場合、 M1(k)≦L≦M2(k) ……(5) という式を満たした時に、文字数で無矛盾であると判定
する。ただし、x≦yはxがy以下であることを表わ
す。
【0110】文字数検証部51は語彙記憶部6内の第k
番目の語彙が文字数で無矛盾があると判定すると、語彙
記憶部6の第k番目の語彙の選択記号部に選択中である
ことを表わす「+」記号を記入する。また、文字数検証
部51は第k番目の語彙が(5)式を満たさなければ、
語彙記憶部6の第k番目の語彙の選択記号部に棄却した
ことを表わす「−」記号を記入する。
【0111】文字数検証部51は語彙記憶部6中の全て
の語彙について上記の単語全体の文字数の検証を実施
し、語彙記憶部6の選択記号部の全ての語彙の欄に
「+」または「−」記号を記入する。以上には、文字数
推定部3が単一の推定文字数を出力する場合について説
明したが、文字数推定部3が2つ以上の推定文字数を出
力する場合にはそれらの値をそれぞれ別に(5)式の条
件と照合し、複数の推定文字数のうちの最低1つが無矛
盾であれば当該語彙が文字数で無矛盾であると判定する
ことができる。また、別の実施例としては複数の推定文
字数の全てが(5)式を満たした場合のみ、当該語彙を
文字数で無矛盾と判定することができる。
【0112】状態遷移検証部53は起動されると、単語
記述部4で生成された図6に示すような単語記述を受信
する。また、状態遷移検証部53は語彙記憶部6中の選
択記号部に「+」が記入された語彙を順次読出し、単語
記述と読出された語彙とが無矛盾であるか否かを検証す
る。
【0113】次に、第k番目の語彙が読出されて単語記
述との照合を実施する場合について説明する。状態遷移
検証部53は予め状態を「S」に設定した上で、第k番
目の語彙の第1番目の文字コードを読出し、単語記述の
状態1の照合文字と照合する。
【0114】この照合で合致する照合文字が存在した場
合には状態を「1」に変更し、次状態履歴集合に(0,
(1,1))を記憶する。次状態履歴集合において、最
初の「0」はペナルティが「0」であることを表わし、
次の(1,1)は状態「1」を1回繰返したことを示
す。
【0115】また、この照合で合致する照合文字がなか
った場合にはペナルティを「1」として状態を「1」に
変更し、次状態履歴集合に(1,(1,1))を記憶す
る。次状態履歴集合において、最初の「1」はペナルテ
ィが「1」であることを表わし、次の(1,1)は状態
「1」を1回繰返したことを示す。
【0116】照合文字が「*」であった場合には全ての
文字コードで照合可能であることを示す。それ以外は、
同一の文字コードでのみ照合していることを示す。最後
に、状態遷移検証部53は次状態履歴集合を状態履歴集
合に代入する。続いて、第k番目の語彙の第i番目の文
字コードを照合する場合について説明する。状態遷移検
証部53は第i−1番目の文字コードを照合した時に生
成された状態履歴集合から1つの状態履歴を取り出す。
【0117】その状態履歴が(t,(1,r1),
(2,r2),・・・,(p−1,r(p−1)),
(p,rp))であるとする。これは、ペナルティが
「t」で、状態「1」をr1回繰返し、状態「2」をr
2回繰返し、途中、状態「3」から状態「p−2」も同
様で、状態番号「p−1」をr(p−1)回繰返し、状
態番号「p」をrp回繰返して現在に至っていることを
示している。
【0118】状態遷移検証部53は状態番号「p」の次
状態番号を取り出し、その次状態番号を状態番号とする
場合の照合文字と第i番目の文字コードとを比較する。
状態遷移検証部53は照合文字のうちのいずれかと第i
番目の文字コードとが一致すれば、当該次状態番号と状
態番号「p」とを比較し、その上で当該次状態番号と状
態番号とが一致する場合に状態履歴の状態番号「p」の
繰返し数に「1」を加算し、新しい状態履歴を生成して
次状態履歴集合に記録する。
【0119】状態遷移検証部53は当該次状態番号の照
合文字のうちのいずれかと第i番目の文字コードとが一
致し、当該次状態番号と状態番号とが一致しない場合に
状態履歴に(次状態番号,1)という組を追加した新し
い状態履歴を生成し、次状態履歴集合に記録する。
【0120】状態遷移検証部53は当該次状態番号の照
合文字と第i番目の文字コードとが照合しない場合に当
該状態履歴のペナルティの値を「t+1」と修正し、そ
の値が第2のしきい値を超えていない場合に、その上で
当該次状態番号と状態番号とが一致すれば、状態履歴の
状態番号「p」の繰返し数に「1」を加算し、新しい状
態履歴を生成して次状態履歴集合に記録する。
【0121】また、状態遷移検証部53は修正されたペ
ナルティ値が第2のしきい値を超えておらず、その上で
当該次状態番号と状態番号とが一致しなければ、状態履
歴に(次状態番号,1)という組を追加した新しい状態
履歴を生成し、次状態履歴集合に記録する。状態遷移検
証部53は修正されたペナルティ値が第2のしきい値以
上になった場合に、新しい状態履歴を生成しない。ここ
で、第2のしきい値を本実施例では「2」としたが、こ
の値はどのようなものでよい。
【0122】状態遷移検証部53では上述した状態番号
での照合文字と第i番目の文字コードとの照合と新しい
状態履歴の作成とを、状態番号「p」の全ての次状態番
号について実施する。さらに、状態遷移検証部53では
状態履歴集合に属する全ての状態履歴について、個々の
状態履歴での最大の番号を持つ状態番号を選択し、上記
と同様の手順で、当該状態番号の次状態番号での照合文
字と第i番目の文字コードとの照合と新しい状態履歴の
作成と、次状態履歴への追加とを実施する。
【0123】状態遷移検証部53は状態集合中の全ての
状態履歴について上記の処理を実施した後に、生成した
次状態履歴集合を状態履歴集合に代入し、続いて第k番
目の語彙の第i+1番目の文字コードを照合する処理を
実施する。この処理は上記の第i番目の文字コードの照
合の処理と同じである。状態遷移検証部53は第k番目
の語彙がJ文字からからなる場合に、第J番目の文字コ
ードを照合した後に、さらに「単語の終り」を表す記号
を用いて状態履歴集合の更新を行い、状態履歴集合を調
べ、状態履歴に最終状態「E」を含む状態履歴を選択す
る。
【0124】状態遷移検証部53は状態「E」を含む状
態履歴を検出することができた場合、当該語彙が単語記
述と無矛盾であると判定し、当該状態履歴を候補文字間
文字数検証部54に当該語彙の番号とともに転送する。
状態遷移検証部53は状態「E」を含む状態履歴が検出
できなければ、第k番目の語彙を棄却する。状態遷移検
証部53は上述した第k番目の語彙と単語記述との照合
の処理を、語彙記憶部中6の選択記号部が「+」である
全ての語彙について実施する。
【0125】候補文字間文字数検証部54は単語記述部
4から、入力端子101から入力された単語画像から生
成された単語記述を受信し、記憶しているものとする。
上述したように、本発明の一実施例では単語記述が、例
えば、図6に示す形式で表現されているものとする。状
態遷移検証部53で照合され、無矛盾であることが判定
された語彙の状態履歴が当該語彙の番号とともに転送さ
れると、それらは候補文字間文字数検証部54で受信さ
れる。
【0126】以下、1組の状態履歴と語彙番号とが候補
文字間文字数検証部54で受信された場合の候補文字間
文字数検証部54での動作について説明する。候補文字
間文字数検証部54は語彙番号を語彙記憶部6に転送す
ると、当該語彙番号の語彙が語彙記憶部6から転送され
る。また、候補文字間文字数検証部54は状態履歴の各
状態番号が語彙中の各文字コードのいずれに対応するか
を定める。
【0127】この手順は状態履歴中の状態番号の小さい
ものから順に、当該語彙の先頭の文字コードから、状態
番号の繰返し数分づつ当該状態番号を割り当てる。例え
ば、語彙番号が「1」で、図3に示す「HARMOIN
EN」であり、状態履歴が(0,(1,2),(2,
1),(3,4),(4,1),(5,1))であった
場合に、9個の文字コードにそれぞれ状態番号を割り付
け、「112333345」と表現する。これによっ
て、状態番号「1」が対応する当該語彙中の文字コード
の組が得られる。
【0128】同様に、状態番号「2」、状態番号
「3」、状態番号「4」、状態番号「5」が対応する当
該語彙中の文字コードの組が得られる。上記の例では、
状態番号「3」が対応する文字コードの組が、当該語彙
中の4番目から7番目までの文字コードで「MOIN」
である。
【0129】候補文字間文字数検証部54は状態履歴中
の各状態番号に対応する文字コードの組が得られた後
に、奇数番号の状態番号について順に以下の処理を実施
する。いま、状態番号を「w」とすると、当該状態番号
に対応する文字コードの組の各文字コードを文字数範囲
生成部52に転送する。
【0130】文文字数検証部51で説明したように、文
字数範囲生成部52には、図13に示す形式で、各文字
コードに対応する文字を文字数推定部3に入力した場合
に推定される文字数の範囲が記録されているものとす
る。文字数範囲生成部52は候補文字間文字数検証部5
4から転送された文字コードの組について、それに含ま
れる個々の文字コードでの推定文字数の最小値を調べて
その総和を求め、文字コードの組での文字数推定値の最
小値M1(w)とする。ただし、「w」は文字コードの
組に対応する状態番号とする。
【0131】同様に、文字数範囲生成部52は文字コー
ドの組の個々の文字コードでの推定文字数の最大値を調
べてその総和を求め、文字コードの組の文字数推定値の
最大値M2(w)とする。当該文字コードの組の推定文
字数の最小値M1(w)と最大値M2(w)とは候補文
字間文字数検証部54に転送される。
【0132】候補文字間文字数検証部54は受信した推
定文字数の最小値M1(w)と最大値M2(w)とを、
単語記述部4から受信した単語記述内に記載された状態
番号「w」の繰返し数と比較する。状態番号「w」の繰
返し数をL(w)とした場合に、 M1(w)≦L(w)≦M2(w) ……(6) という式を満たしたならば、文字数で無矛盾であると判
定する。ただし、x≦yはxがy以下であることを表わ
す。(6)式が満たされない場合には状態番号「w」が
文字数条件を満たさないものとし、当該状態履歴を棄却
する。
【0133】全ての奇数番の「w」について上記の文字
コードの組の推定文字数と単語記述内の繰返し数につい
て上記の(6)式の条件が満たされた場合には、当該状
態履歴が無矛盾であったと判定し、当該状態履歴と組に
して状態遷移検証部53から転送されてきた語彙番号に
対応する語彙を出力端子102から出力する。候補文字
間文字数検証部54は状態遷移検証部53から転送され
る全ての状態履歴について上記の処理を繰返し実施す
る。
【0134】図14は本発明の他の実施例による単語大
分類装置の構成を示すブロック図であり、図15は本発
明の他の実施例による単語大分類装置において単語画像
の上基準線と下基準線とを求めるヒストグラムの例を示
す図である。図14において、本発明の他の実施例によ
る単語大分類装置は、大文字小文字判定部25と、候補
文字選択部21と、文字認識部22と、文字数推定部3
と、図形特徴記述部26と、単語記述部23と、語彙選
択部24と、語彙記憶部6とから構成されている。
【0135】大文字小文字判定部25は入力端子101
から入力される単語画像が大文字のみからなるか、小文
字を含んでいるかを判定する。候補文字選択部21は単
語画像から候補文字を選択する。文字認識部22は候補
文字選択部21で選択された候補文字を認識する。文字
数推定部3は単語画像全体及び候補文字間の画像に含ま
れる文字数を推定する。
【0136】図形特徴記述部26は単語画像全体及び候
補文字間の画像に含まれる画像特徴を記述する。単語記
述部23は候補文字の認識結果と候補文字間の推定文字
数と候補文字間の図形特徴とから単語画像を記述する。
語彙選択部24は文字数推定部3で生成された単語画像
全体の推定文字数と図形特徴記述部26で生成された単
語画像全体の図形特徴と単語記述部23で生成された単
語記述とを基に語彙の選択を実施する。語彙記憶部6は
語彙を記憶する。
【0137】入力端子101から入力された単語画像は
文字数推定部3と、大文字小文字判定部25と図形特徴
記述部26とに転送される。大文字小文字判定部25
は、図15に示すように、画像の黒画素の数をX軸方
向、つまり図15での横方向に黒画素数を計数してヒス
トグラムを生成する。
【0138】また、大文字小文字判定部25はヒストグ
ラムの最大値を取る点を検出する。図15に示す例では
ヒストグラムの最大値の点を1401で示す。さらに、
大文字小文字判定部25は当該最大値の2分の1の値を
初めて下回るヒストグラム値を持つ点を当該最大値を取
る点から上方向に探索し、上基準点として検出する。当
該点を図15に示す例では上基準点1402で示す。
【0139】さらにまた、大文字小文字判定部25は当
該点をy軸の座標とする水平線を上基準線とする。大文
字小文字判定部25は上記と同様に、最大値を取る点を
起点として最大値の2分の1の値を初めて下回る点を探
索し、下基準点として検出する。図15に示す例では当
該点を下基準点1403で示す。
【0140】大文字小文字判定部25では上基準点14
02より上のヒストグラム値の総和と下基準点1403
より下のヒストグラム値の総和との和を求め、それを全
ヒストグラム値の総和で割った値を第3のしきい値と比
較し、第3のしきい値より小さい場合に単語画像が大文
字のみでなる単語と判定する。
【0141】大文字小文字判定部25では第3のしきい
値より小さくなければ、単語画像が大文字と小文字とが
混在する単語と判定する。大文字小文字判定部25はそ
の判定結果を候補文字選択部21に転送する。本実施例
では第3のしきい値を0.1としているが、この値は本
質的なものではなく、どのような値でもよい。
【0142】候補文字選択21は図1に示す候補文字選
択部1とほぼ同等の動作をする。ただし、大文字小文字
判定部25で大文字と小文字とが混在していると判定さ
れている場合には、図1に示す候補文字選択1で連結矩
形検出部11を用いて生成した矩形から選択した候補文
字以外に、候補文字間の画像を切断して生成した矩形部
分画像に対しても矩形特徴抽出部12の処理を実施し、
その処理で生成した特徴を用いて矩形選択部13で選択
して候補文字とする。
【0143】この場合、候補文字選択21は先に求めた
連結矩形から選択した候補文字と後に実施した切断を用
いて生成した候補文字とを併せて候補文字とし、文字認
識部22と文字数推定部3とに転送する。本実施例にお
いて候補文字間の画像を切断する方法としては、「F.
Kimura,S.Tsuruoka,Y.Miyak
e,and M.Shridhar,“A Lexic
on Directed Algorithm for
Recognition of Unconstra
ined Handwritten Words”,電
子情報通信学会英論文誌 vol.E77−D,No.
7,July 1994,pp.785−793」の7
85ページの右段から787ページの左段2行目までに
記載されている方法を利用することができる。
【0144】大文字小文字判定部25で大文字のみと判
定している場合、候補文字選択21は図1に示す候補文
字選択部1と同一の動作をする。候補文字選択部21で
生成された候補文字の集合は文字認識部22と文字数推
定部3と図形特徴記述部26とに転送される。
【0145】文字認識部22も、図1に示す文字認識部
2と同じ構成で、同じ動作を行うのであるが、大文字小
文字判定部25の判定結果が大文字のみである場合には
文字認識の対象とする文字種を大文字のみに限定して実
施し、大文字小文字判定部25の判定結果が大文字と小
文字との混在である場合には文字認識の対象とする字種
を大文字と小文字とを併せた全字種とする。
【0146】文字数推定部3は図1及び図9で説明した
文字数推定部3と全く同じ動作を行い、入力端子101
から入力された単語画像全体の文字数を推定して語彙選
択部24へ転送するとともに、候補文字選択部21で生
成された候補文字間の局所領域内の文字数と、単語画像
の左端と最も左の候補文字の左端との間の局所領域の文
字数と、単語画像の右端と最も右の候補文字の右端との
間の局所領域の文字数とを推定し、単語記述部23に転
送する。
【0147】図形特徴記述部26は入力端子101から
入力された単語画像全体からアセンダ数とディセンダ数
とループ数とを検出し、語彙選択部24に転送する。本
実施例ではアセンダの検出を、図15に示す例で説明し
たように、大文字小文字判定部25で検出した上基準線
より上の部分の連結領域の数を計数して求める。連結領
域の検出方法は候補文字選択部1で説明したものと同一
とする。
【0148】また、ディセンダ数は図15に示す例で説
明したように、大文字小文字判定部25で検出した下基
準線より下の部分の連結領域の数を計数して求める。ル
ープ数は連結する黒画素に囲まれた連結した白画素の領
域として検出する。図形特徴記述部26は上記のように
して求めたアセンダ数とディセンダ数とループ数とを計
数して図形特徴として語彙選択部24に転送する。
【0149】また、図形特徴記述部26は候補文字選択
部21から候補文字の右端座標と左端座標との組を受信
し、文字数推定部3の領域設定部32と同じ機能によっ
て、隣り合う候補文字の組で左側の候補の右端と右側の
候補の左端とで囲まれる局所領域と、単語画像の左端と
最左の候補文字の左端とで囲まれる局所領域と、単語画
像の右端と最右の候補文字の右端とで囲まれる局所領域
とをそれぞれ求め、候補文字間領域として定める。
【0150】さらに、図形特徴記述部26は候補文字間
領域の画像を単語画像から取り出し、先に述べた方法と
同じ手段によって、各領域のアセンダ数とディセンダ数
とループ数とをそれぞれ計数し、領域の番号とともに単
語記述部23に転送する。
【0151】単語記述部23の動作は、図1と図10と
図11とによって説明した単語記述部4の動作とほとん
ど同じである。唯一違う点は、図11に示す状態遷移グ
ラフ生成部43の動作で、ステップS30で候補文字の
間の領域において候補文字の繰返し数を設定する際に、
同一の候補文字間領域で検出された図形特徴を単語記述
内に記録する。同様に、ステップS33でも候補文字間
領域において候補文字の繰返し数を設定する際に、同一
の候補文字間領域で検出された図形特徴を単語記述内に
記録する。
【0152】このようにして生成された単語記述の例を
図16に示す。状態番号「1」に相当する候補文字の間
の領域で検出されたアセンダ数が「1」、ディセンダ数
が「2」、ループ数が「3」であることを、図形特徴
「1,2,3」として記述してある。同様に、状態番号
「3」、状態番号「5」、状態番号「7」でもアセンダ
数、ディセンダ数、ループ数の順で図形特徴を記述して
ある。
【0153】図17は図14の図語彙選択部24の詳細
な構成を示すブロック図であり、図18は図17の図形
特徴範囲生成部内の文字コード毎の図形特徴の範囲を記
憶した表の例を示す図である。これら図14と図17と
図18とを図語彙選択部24の動作について用いて説明
する。
【0154】図17において、語彙選択部24は文字数
検証部51と、図形特徴検証部55と、文字数範囲生成
部52と、状態遷移検証部53と、候補文字間文字数検
証部54と、候補文字間図形特徴検証部57と、図形特
徴範囲生成部56とから構成されている。
【0155】語彙選択部24は文字数推定部3から単語
画像全体の推定文字数が転送されてくると、その推定文
字数を文字数検証部51に格納し、語彙記憶部6から語
彙を順次1つづつ読出し、各語彙の文字数が推定文字数
と無矛盾であるか否かを検証する。
【0156】文字数検証部51の動作は、図12を用い
て説明した文字数検証部51の動作と同一である。例え
ば、語彙記憶部6に図3に示す形式で語彙が記憶されて
いる場合を例に説明する。
【0157】語彙選択部24は起動直後に、語彙記憶部
6の選択記号の欄をすべて初期化し、全ての語彙の選択
記号の欄に空白記号を書込む。文字数検証部51は語彙
記憶部6から順次語彙を読出し、その語彙を構成する文
字コードから文字数範囲生成部52を通して推定文字数
の最大値と最小値とを求め、文字数推定部3から転送さ
れてくる単語画像全体から求めた推定文字数を最大値及
び最小値と比較する。
【0158】文字数検証部51は推定文字数が最大値と
最小値との間にあれば、語彙記憶部6の当該語彙の選択
記号の欄に「+」を記入し、推定文字数が最大値と最小
値との間になければ、語彙記憶部6の当該語彙の選択記
号の欄に「−」を記入する。文字数検証部51は上記の
処理を語彙記憶部6の全ての語彙に対して実施する。
【0159】語彙選択部24は図形特徴記述部26から
単語画像全体から抽出された図形特徴が入力されると、
その図形特徴を図形特徴検証部55に格納する。図形特
徴検証部55は語彙記憶部6から選択記号欄に「+」が
記入された語彙が順次読出されると、各語彙の図形特徴
が単語画像から抽出された図形特徴と無矛盾であるか否
かを検証する。
【0160】図形特徴範囲生成部56には語彙記憶部6
から1つの語彙が読出されて転送される。図形特徴範囲
生成部56には、図18に示す形式で、各文字コードに
対応する文字に関する図形特徴の範囲が記録されている
ものとする。例えば、図18に示す例で、文字コード
「a」から抽出されるアセンダの数は最大「1」で最小
「0」であり、ディセンダは「0」で、ループは最大
「1」で最小「0」であることが示されている。本実施
例においてはこれらの具体的な値を、複数の文字パター
ンを図形特徴記述部26に入力して得た図形特徴の最大
値と最小値とを記録しているが、どのような方法で定め
てもよい。
【0161】図形特徴範囲生成部56は入力された語彙
に含まれる文字コードのアセンダ数の最大値をすべて読
出してその総和を求め、当該語彙のアセンダ数の最大値
とする。同様に、図形特徴範囲生成部56はアセンダ数
の最小値とディセンダ値の最大値及び最小値、ループ数
の最大値及び最小値をそれぞれ求め、図形特徴検証部5
5に転送する。
【0162】図形特徴検証部55は図形特徴記述部26
から入力された単語全体のアセンダ数を図形特徴範囲生
成部56から入力されたアセンダ数の最大値及び最小値
と比較し、単語全体のアセンダ数が最大値と最小値の間
になければ、語彙記憶部6内の当該語彙の選択記号欄に
「−」の記号を記入する。
【0163】また、図形特徴検証部55は図形特徴記述
部26から入力された単語全体のディセンダ数を図形特
徴範囲生成部56から入力されたディセンダ数の最大値
及び最小値と比較し、単語全体のディセンダ数が最大値
と最小値との間になければ、語彙記憶部6内の当該語彙
の選択記号欄に「−」の記号を記入する。
【0164】さらに、図形特徴検証部55は図形特徴記
述部26から入力された単語全体のループ数を図形特徴
範囲生成部56から入力されたループ数の最大値及び最
小値と比較し、単語全体のループ数が最大値と最小値と
の間になければ、語彙記憶部6内の当該語彙の選択記号
欄に「−」の記号を記入する。図形特徴検証部55は上
述した手順を語彙記憶部6内で選択記号欄に「+」の記
号が記入された全ての語彙について実行する。
【0165】状態遷移検証部53は起動されると、図1
2の状態遷移検証部53と同一であり、単語記述部23
で生成された単語記述を入力し、語彙記憶部6の選択記
号欄に「+」の記号が記載された全ての語彙について、
単語記述と無矛盾であるか否かを検証する。状態遷移検
証部53は単語記述と照合されずに棄却された場合、当
該語彙の語彙記憶部6内の選択記号欄に「−」の記号を
記入する。
【0166】候補文字間文字数検証部54は起動される
と、図12で説明した候補文字間文字数検証部54の動
作と同一である。候補文字間文字数検証部54は状態遷
移検証部53から転送されてくる状態履歴毎に、単語記
述部23で生成された単語記述内の奇数番の状態に相当
する複数の文字コードを求め、当該複数の文字コードを
文字数推定した場合の推定文字数の範囲を文字数範囲生
成部52で生成し、単語記述内に記載された対応部分で
の照合文字繰返し数が推定文字数の範囲に入っているか
を検証する。
【0167】候補文字間文字数検証部54は照合文字繰
返し数が推定文字数の範囲に入っていない場合、当該状
態履歴を棄却する。候補文字間文字数検証部54は1つ
の状態履歴について全ての候補文字間の照合文字繰り返
し数が対応する複数の文字コードから求めた推定文字数
の範囲に入っている場合、当該状態履歴を文字数に関し
て無矛盾であると判定して候補文字間図形特徴検証部5
7に転送する。
【0168】候補文字間図形特徴検証部57では候補文
字間文字数検証部54から文字数に関して無矛盾である
ことが判定された語彙の状態履歴が当該語彙の番号とと
もに転送されてくる。
【0169】以下、1組の状態履歴と語彙番号が候補文
字間図形特徴検証部57で受信された場合の候補文字間
図形特徴検証部57の動作について説明する。まず、候
補文字間図形特徴検証部57は語彙番号を図形特徴範囲
生成部56を介して語彙記憶部6に転送し、当該語彙番
号の語彙を語彙記憶部6から転送する。
【0170】また、候補文字間図形特徴検証部57は状
態履歴の各状態番号が語彙中の各文字コードのいずれに
対応するかを定める。その手順は状態履歴中の状態番号
の小さいものから順に、当該語彙の先頭の文字コードか
ら状態番号の繰返し数分づつ当該状態番号を割り当て
る。
【0171】例えば、語彙番号が「1」で図3に示す
「HARMOINEN」であり、状態履歴が(0,
(1,2),(2,1),(3,4),(4,1),
(5,1))であった場合に、9個の文字コードにそれ
ぞれ状態番号を割り付け、「112333345」と表
現する。これによって、状態番号「1」が対応する当該
語彙中の文字コードの組が得られる。
【0172】同様に、状態番号「2」、状態番号
「3」、状態番号「4」、状態番号「5」がそれぞれ対
応する当該語彙中の文字コードの組が得られる。上の例
では、状態番号「3」が対応する文字コードの組は、当
該語彙中の4番目から7番目までの文字コードで「MO
IN」である。
【0173】候補文字間図形特徴検証部57は上記の状
態履歴中の各状態番号に対応する文字コードの組が得ら
れた後に、奇数番号の状態番号について順に以下の処理
を実施する。
【0174】いま、状態番号を「w」とすると、候補文
字間図形特徴検証部57は当該状態番号に対応する文字
コードの組の各文字コードを図形特徴範囲生成部56に
転送する。図形特徴範囲生成部56には、図18に示す
形式で、各文字コードに対応する文字を図形特徴記述部
26に入力した場合に推定される図形特徴の範囲が記録
されているものとする。
【0175】図形特徴範囲生成部56は候補文字間図形
特徴検証部57から転送されてきた文字コードの組につ
いて、それに含まれる個々の文字コードでのアセンダ数
の最小値を調べ、その総和を求め、文字コードの組での
アセンダ数の最小値M11(w)とする。ただし、wは
文字コードの組に対応する状態番号とする。同様に、図
形特徴範囲生成部56は文字コードの組の個々の文字コ
ードでのアセンダ数の最大値を調べ、その総和を求め、
文字コードの組のアセンダ数の最大値M12(w)とす
る。
【0176】さらに同様に、図形特徴範囲生成部56は
文字コード組のディセンダ数の最小値M21(w)とデ
ィセンダ数の最大値M22(w)とループ数の最小値M
31(w)とループ数の最大値M32(w)とを求め
る。図形特徴範囲生成部56は当該文字コードの組の各
図形特徴の最小値M11(w),M21(w),M31
(w)と最大値M12(w),M22(w),M32
(w)とを候補文字間図形特徴検証部57に転送する。
【0177】候補文字間図形特徴検証部57は受信した
各図形特徴の最小値M11(w),M21(w),M3
1(w)と最大値M12(w),M22(w),M32
(w)とを、単語記述部23から受信した単語記述内に
記載された状態番号「w」の図形特徴と比較する。
【0178】状態番号wのアセンダ数、ディセンダ数、
ループ数をそれぞれをL1(w),L2(w),L3
(w)とすると、 M11(w)≦L1(w)≦M12(w) かつ、 M21(w)≦L2(w)≦M22(w) かつ、 M31(w)≦L3(w)≦M32(w) ……(7) という式を満たした場合に図形特徴に関して無矛盾であ
ると判定する。ただし、x≦yはxがy以下であること
を表わす。(7)式が満たされない場合には状態番号
「w」が図形特徴の照合条件を満たさないものとして、
当該状態履歴を棄却する。
【0179】全ての奇数番の「w」について上記の文字
コードの組の図形特徴と単語記述内の図形特徴とについ
て上記の(7)式の条件が満たされた場合には、当該状
態履歴が無矛盾であったと判定し、当該状態履歴と組に
して候補文字間文字数検証部54から転送されてきた語
彙番号に対応する語彙を出力端子102から出力する。
候補文字間図形特徴検証部57は候補文字間文字数検証
部54から転送されてくる全ての状態履歴について上記
の処理を繰返し実施する。
【0180】上述した本発明の一実施例及び他の実施例
において、文字認識部2,22でアルファベットを対象
に、与えられた画像の領域をアルファベットの内のいず
れかに分類する例を用いて説明したが、本発明は文字認
識部2,22が対象文字をアルファベットに限るもので
はなく、アルファベット以外の漢字を含む日本語文字や
記号、予め定めた特殊記号でも本発明の構成や効果が変
わるものではない。
【0181】このように、単語画像から文字らしいと選
択した候補文字を認識し、その結果の文字コードを語彙
の文字コードと照合して単語大分類実施するように、候
補文字選択部1,21と文字認識部2,22とを備える
ことで、予め語彙毎に図形特徴を抽出し、全ての語彙に
ついて図形特徴を生成しておかなくても、語彙の文字コ
ード列のみを用いて単語大分類を実施することができ
る。
【0182】このため、大量の語彙に対して単語大分類
を実施する場合にも、全ての語彙の単語画像を収集しな
くても、単語大分類を実現することができる。また、全
ての連結矩形や切断部分を認識するのに比べ、予め選択
した候補文字のみを認識するので、高速に単語大分類を
実現することができるし、余計な認識結果によって単語
大分類の精度を低下させることがない。
【0183】また、文字数推定部3と語彙選択部5,2
4内に文字数範囲生成部52を備えることで、予め文字
コード毎に定めた推定文字数の範囲と単語画像から推定
した文字数とを比較して単語選択を実施し、単語大分類
を実現していることから、単語画像から直接推定文字数
を求めて語彙毎の推定文字数の範囲を定めて記憶してお
く必要がない。このため、全ての語彙の単語画像を持た
なくても、全ての語彙の単語大分類を実現することがで
きる。
【0184】さらに、図形特徴記述部26と語彙選択部
24内に図形特徴範囲生成部56とを備えることによっ
て、予め文字コード毎に定めた画像特徴の値の範囲と単
語画像から推定した画像特徴の値とを比較して単語選択
を実施し、単語大分類を実現していることから、単語画
像から直接推定画像特徴を求めて語彙毎の画像特徴の値
の範囲を定めて記憶しておく必要がない。このため、全
ての語彙の単語画像を持たなくても、全ての語彙の単語
大分類を実現することができる。
【0185】
【発明の効果】以上説明したように本発明によれば、単
語画像を入力し、それに類似する語彙を予め語彙記憶手
段に記憶された語彙の中から選択する単語大分類装置に
おいて、単語画像中から予め定めた条件に合った画像領
域である候補文字を選択し、その選択された画像領域を
文字コードに変換し、変換された文字コードを用いて単
語画像を表す単語記述を生成し、生成された単語記述と
語彙記憶手段に記録された語彙とを照合して無矛盾に照
合可能な語彙を選択して出力することによって、語彙記
憶手段に記憶する単語に関する特徴を各単語の文字コー
ドから生成することができ、効率的に単語を選択するこ
とができるという効果がある。
【図面の簡単な説明】
【図1】本発明の一実施例による単語大分類装置の構成
を示すブロック図である。
【図2】本発明の一実施例による単語大分類装置が扱う
単語画像の一例を示す図である。
【図3】図1の語彙記憶部内の語彙の表の例を示す図で
ある。
【図4】単語画像と選択された候補文字とその認識結果
と生成された照合文字との例を示す図である。
【図5】単語画像から選択された候補文字とそれから生
成された照合文字とそれから生成された単語記述と同等
の状態遷移グラフとの例を示す図である。
【図6】単語画像から生成された単語記述の例を示す図
である。
【図7】本発明の一実施例による単語大分類装置の動作
を示すフローチャートである。
【図8】図1の候補文字選択部の詳細な構成を示すブロ
ック図である。
【図9】図1の文字数推定部の詳細な構成を示すブロッ
ク図である。
【図10】図1の単語記述部の詳細な構成を示すブロッ
ク図である。
【図11】図10の状態遷移グラフ生成部の動作を示す
フローチャートである。
【図12】図1の語彙選択部の詳細な構成を示すブロッ
ク図である。
【図13】図12の文字数範囲生成部内の文字コード毎
の推定文字数の範囲を記憶した表の例を示す図である。
【図14】本発明の他の実施例による単語大分類装置の
構成を示すブロック図である。
【図15】本発明の他の実施例による単語大分類装置に
おいて単語画像の上基準線と下基準線とを求めるヒスト
グラムの例を示す図である。
【図16】単語画像から生成された単語記述の例を示す
図である。
【図17】図14の図語彙選択部の詳細な構成を示すブ
ロック図である。
【図18】図17の図形特徴範囲生成部内の文字コード
毎の図形特徴の範囲を記憶した表の例を示す図である。
【図19】従来の単語大分類装置の構成を示すブロック
図である。
【符号の説明】
1,21 候補文字選択部 2,22 文字認識部 3 文字数推定部 4,23 単語記述部 5,24 語彙選択部 6 語彙記憶部 11 連結矩形検出部 12 矩形特徴抽出部 13 矩形選択部 25 大文字小文字判定部 26 図形特徴記述部 31 単語画像記憶部 32 領域設定部 33 領域記憶部 34 黒ラン数計数部 35 文字数計算部 41 認識候補バッファ 42 文字数バッファ 43 状態遷移グラフ生成部 51 文字数検証部 52 文字数範囲生成部 53 状態遷移検証部 54 候補文字間文字数検証部 55 図形特徴検証部 56 図形特徴範囲生成部 57 候補文字間図形特徴検証部 101 入力端子 102 出力端子

Claims (24)

    【特許請求の範囲】
  1. 【請求項1】 単語画像を入力し、それに類似する語彙
    を予め語彙記憶手段に記憶された語彙の中から選択する
    単語大分類装置であって、 前記単語画像中から予め定めた条件に合った画像領域で
    ある候補文字を選択する候補文字選択手段と、 前記候補文字選択手段で選択された画像領域を文字コー
    ドに変換する文字認識手段と、 前記文字認識手段で変換された文字コードを用いて前記
    単語画像を表す単語記述を生成する単語記述手段と、 前記単語記述手段で生成された単語記述と前記語彙記憶
    手段に記録された語彙とを照合して無矛盾に照合可能な
    語彙を選択して出力する語彙選択手段とを有することを
    特徴とする単語大分類装置。
  2. 【請求項2】 単語画像を入力し、それに類似する語彙
    を予め語彙記憶手段に記憶された語彙の中から選択する
    単語大分類装置であって、 前記単語画像中から予め定めた条件に合った画像領域で
    ある候補文字を選択する候補文字選択手段と、 前記候補文字選択手段で選択された画像領域を文字コー
    ドに変換する文字認識手段と、 前記単語画像全体の文字数を推定しかつ前記単語画像か
    ら生成した領域内の文字数を推定する文字数推定手段
    と、 前記文字認識手段で変換された文字コードと前記文字数
    推定手段で推定された前記領域内の文字数とを用いて前
    記単語画像を表す単語記述を生成する単語記述手段と、 前記単語全体の推定文字数を用いて前記語彙記憶手段に
    記録された語彙を選択しかつ前記単語記述と前記語彙記
    憶手段に記録された語彙とを照合して無矛盾に照合可能
    な語彙を選択して出力する語彙選択手段とを有すること
    を特徴とする単語大分類装置。
  3. 【請求項3】 前記候補文字選択手段によって生成され
    た候補文字の間の領域を選択して当該領域の文字数を推
    定する文字数推定手段を含むことを特徴とする請求項2
    記載の単語大分類装置。
  4. 【請求項4】 前記語彙選択手段は、前記文字コード毎
    に前記推定文字数の最大値と最小値とを記憶しかつ入力
    された文字コード列の推定文字数の最大値と最小値とを
    生成する文字数範囲生成手段と、当該文字コード列の推
    定文字数の最大値と最小値とを用いて前記単語記述との
    照合を実施する手段とを含むことを特徴とする請求項2
    または請求項3記載の単語大分類装置。
  5. 【請求項5】 単語画像を入力し、それに類似する語彙
    を予め語彙記憶手段に記憶された語彙の中から選択する
    単語大分類装置であって、 前記単語画像中から予め定めた条件に合った画像領域で
    ある候補文字を選択する候補文字選択手段と、 前記候補文字選択手段で選択された画像領域を文字コー
    ドに変換する文字認識手段と、 前記単語画像全体の文字数を推定しかつ前記全単語画像
    から生成した領域内の文字数を推定する文字数推定手段
    と、 前記単語画像全体の画像特徴を抽出しかつ前記全単語画
    像から生成した領域内の画像特徴を抽出する特徴記述手
    段と、 前記文字コードと前記領域内の文字数と前記領域内の図
    形特徴とを用いて前記単語画像を表す単語記述を生成す
    る単語記述手段と、 前記単語全体の推定文字数と前記単語全体の図形特徴と
    を用いて前記語彙記憶手段に記録された語彙を選択しか
    つ前記単語記述と前記語彙記憶手段に記録された語彙と
    を照合して無矛盾に照合可能な語彙を選択して出力する
    語彙選択手段とを有することを特徴とする単語大分類装
    置。
  6. 【請求項6】 前記候補文字選択手段によって生成され
    た候補文字の間の領域を選択して当該領域の文字数を推
    定する文字数推定手段と、 前記候補文字選択手段によって生成された候補文字の間
    の領域を選択して当該領域の図形特徴を抽出する図形特
    徴記述手段とを含むことを特徴とする請求項5記載の単
    語大分類装置。
  7. 【請求項7】 前記語彙選択手段は、前記文字コード毎
    に推定文字数の最大値と最小値とを記憶しかつ入力され
    た文字コード列の推定文字数の最大値と最小値とを生成
    する文字数範囲生成手段と、前記文字コード毎に図形特
    徴の最大値と最小値とを記憶しかつ入力された文字コー
    ド列の図形特徴の最大値と最小値とを生成する図形特徴
    範囲生成手段と、当該文字コード列の文字数の最大値及
    び最小値と当該文字列コード列の図形特徴の最大値及び
    最小値とを用いて前記単語記述との照合を実施する手段
    とを含むことを特徴とする請求項5または請求項6記載
    の単語大分類装置。
  8. 【請求項8】 単語画像を入力し、それに類似する語彙
    を予め語彙記憶手段に記憶された語彙の中から選択する
    単語大分類装置であって、 前記単語画像中から予め定めた条件に合った画像領域で
    ある候補文字を選択する候補文字選択手段と、 前記単語画像が大文字のみからなるか大文字と小文字と
    の混在かを判定する大文字小文字判定手段と、 前記大文字小文字判定手段で前記大文字のみからなると
    判定された時に前記大文字のみに字種を限定して選択さ
    れた画像領域を文字コードに変換しかつ前記大文字小文
    字判定手段で前記大文字と小文字との混在と判定された
    時に全字種を対象として選択された画像領域を文字コー
    ドに変換する文字認識手段と、 前記単語画像全体の文字数を推定しかつ前記全単語画像
    から生成した領域内の文字数を推定する文字数推定手段
    と、 前記単語画像全体の画像特徴を抽出しかつ前記全単語画
    像から生成した領域内の画像特徴を抽出する特徴記述手
    段と、 前記文字コードと前記領域内の文字数と前記領域内の図
    形特徴とを用いて前記単語画像を表す単語記述を生成す
    る単語記述手段と、 前記単語全体の推定文字数と前記単語全体の図形特徴と
    を用いて前記語彙記憶手段に記録された語彙を選択しか
    つ前記単語記述と前記語彙記憶手段に記録された語彙と
    を照合して無矛盾に照合可能な語彙を選択して出力する
    語彙選択手段とを有することを特徴とする単語大分類装
    置。
  9. 【請求項9】 前記候補文字選択手段によって生成され
    た候補文字の間の領域を選択して当該領域の文字数を推
    定する文字数推定手段と、前記候補文字選択手段によっ
    て生成された候補文字の間の領域を選択して当該領域の
    図形特徴を抽出する図形特徴記述手段とを含むことを特
    徴とする請求項8記載の単語大分類装置。
  10. 【請求項10】 前記語彙選択手段は、前記文字コード
    毎に推定文字数の最大値と最小値を記憶しかつ入力され
    た文字コード列の推定文字数の最大値と最小値とを生成
    する文字数範囲生成手段と、前記文字コード毎に図形特
    徴の最大値と最小値とを記憶しかつ入力された文字コー
    ド列の図形特徴の最大値と最小値とを生成する図形特徴
    範囲生成手段と、当該文字コード列の文字数の最大値及
    び最小値と当該文字列コード列の図形特徴の最大値及び
    最小値とを用いて前記単語記述との照合を実施する手段
    とを含むことを特徴とする請求項8または請求項9記載
    の単語大分類装置。
  11. 【請求項11】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類方法であって、前記単語画像中から予め定
    めた条件に合った画像領域である候補文字を選択するス
    テップと、その選択された画像領域を文字コードに変換
    するステップと、変換された文字コードを用いて前記単
    語画像を表す単語記述を生成するステップと、生成され
    た単語記述と前記語彙記憶手段に記録された語彙とを照
    合して無矛盾に照合可能な語彙を選択して出力するステ
    ップとを有することを特徴とする単語大分類方法。
  12. 【請求項12】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類方法であって、前記単語画像中から予め定
    めた条件に合った画像領域である候補文字を選択するス
    テップと、その選択された画像領域を文字コードに変換
    するステップと、前記単語画像全体の文字数を推定しか
    つ前記単語画像から生成した領域内の文字数を推定する
    ステップと、変換された文字コードと推定された前記領
    域内の文字数とを用いて前記単語画像を表す単語記述を
    生成するステップと、前記単語全体の推定文字数を用い
    て前記語彙記憶手段に記録された語彙を選択しかつ前記
    単語記述と前記語彙記憶手段に記録された語彙とを照合
    して無矛盾に照合可能な語彙を選択して出力するステッ
    プとを有することを特徴とする単語大分類方法。
  13. 【請求項13】 前記画像領域である候補文字を選択す
    るステップで選択された候補文字の間の領域を選択して
    当該領域の文字数を推定するステップを含むことを特徴
    とする請求項12記載の単語大分類方法。
  14. 【請求項14】 前記無矛盾に照合可能な語彙を選択し
    て出力するステップは、前記文字コード毎に前記推定文
    字数の最大値と最小値とを記憶しかつ入力された文字コ
    ード列の推定文字数の最大値と最小値とを生成するステ
    ップと、当該文字コード列の推定文字数の最大値と最小
    値とを用いて前記単語記述との照合を実施するステップ
    とを含むことを特徴とする請求項12または請求項13
    記載の単語大分類方法。
  15. 【請求項15】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類方法であって、前記単語画像中から予め定
    めた条件に合った画像領域である候補文字を選択するス
    テップと、その選択された画像領域を文字コードに変換
    するステップと、前記単語画像全体の文字数を推定しか
    つ前記全単語画像から生成した領域内の文字数を推定す
    るステップと、前記単語画像全体の画像特徴を抽出しか
    つ前記全単語画像から生成した領域内の画像特徴を抽出
    するステップと、前記文字コードと前記領域内の文字数
    と前記領域内の図形特徴とを用いて前記単語画像を表す
    単語記述を生成するステップと、前記単語全体の推定文
    字数と前記単語全体の図形特徴とを用いて前記語彙記憶
    手段に記録された語彙を選択しかつ前記単語記述と前記
    語彙記憶手段に記録された語彙とを照合して無矛盾に照
    合可能な語彙を選択して出力するステップとを有するこ
    とを特徴とする単語大分類方法。
  16. 【請求項16】 前記候補文字を選択するステップで選
    択された候補文字の間の領域を選択して当該領域の文字
    数を推定するステップと、前記候補文字を選択するステ
    ップで選択された候補文字の間の領域を選択して当該領
    域の図形特徴を抽出するステップとを含むことを特徴と
    する請求項15記載の単語大分類方法。
  17. 【請求項17】 前記無矛盾に照合可能な語彙を選択し
    て出力するステップは、前記文字コード毎に推定文字数
    の最大値と最小値とを記憶しかつ入力された文字コード
    列の推定文字数の最大値と最小値とを生成するステップ
    と、前記文字コード毎に図形特徴の最大値と最小値とを
    記憶しかつ入力された文字コード列の図形特徴の最大値
    と最小値とを生成するステップと、当該文字コード列の
    文字数の最大値及び最小値と当該文字列コード列の図形
    特徴の最大値及び最小値とを用いて前記単語記述との照
    合を実施するステップとを含むことを特徴とする請求項
    15または請求項16記載の単語大分類方法。
  18. 【請求項18】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類方法であって、前記単語画像中から予め定
    めた条件に合った画像領域である候補文字を選択するス
    テップと、前記単語画像が大文字のみからなるか大文字
    と小文字との混在かを判定するステップと、前記大文字
    のみからなると判定された時に前記大文字のみに字種を
    限定して選択された画像領域を文字コードに変換しかつ
    前記大文字と小文字との混在と判定された時に全字種を
    対象として選択された画像領域を文字コードに変換する
    ステップと、前記単語画像全体の文字数を推定しかつ前
    記全単語画像から生成した領域内の文字数を推定するス
    テップと、前記単語画像全体の画像特徴を抽出しかつ前
    記全単語画像から生成した領域内の画像特徴を抽出する
    ステップと、前記文字コードと前記領域内の文字数と前
    記領域内の図形特徴とを用いて前記単語画像を表す単語
    記述を生成するステップと、前記単語全体の推定文字数
    と前記単語全体の図形特徴とを用いて前記語彙記憶手段
    に記録された語彙を選択しかつ前記単語記述と前記語彙
    記憶手段に記録された語彙とを照合して無矛盾に照合可
    能な語彙を選択して出力するステップとを有することを
    特徴とする単語大分類方法。
  19. 【請求項19】 前記候補文字を選択するステップで選
    択された候補文字の間の領域を選択して当該領域の文字
    数を推定するステップと、前記候補文字を選択するステ
    ップで選択された候補文字の間の領域を選択して当該領
    域の図形特徴を抽出するステップとを含むことを特徴と
    する請求項18記載の単語大分類方法。
  20. 【請求項20】 前記無矛盾に照合可能な語彙を選択し
    て出力するステップは、前記文字コード毎に推定文字数
    の最大値と最小値を記憶しかつ入力された文字コード列
    の推定文字数の最大値と最小値とを生成するステップ
    と、前記文字コード毎に図形特徴の最大値と最小値とを
    記憶しかつ入力された文字コード列の図形特徴の最大値
    と最小値とを生成するステップと、当該文字コード列の
    文字数の最大値及び最小値と当該文字列コード列の図形
    特徴の最大値及び最小値とを用いて前記単語記述との照
    合を実施するステップとを含むことを特徴とする請求項
    18または請求項19記載の単語大分類方法。
  21. 【請求項21】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類装置を制御する単語大分類制御プログラム
    を記録した記録媒体であって、前記単語大分類制御プロ
    グラムは前記単語大分類装置に、前記単語画像中から予
    め定めた条件に合った画像領域である候補文字を選択さ
    せ、その選択された画像領域を文字コードに変換させ、
    変換された文字コードを用いて前記単語画像を表す単語
    記述を生成させ、生成された単語記述と前記語彙記憶手
    段に記録された語彙とを照合して無矛盾に照合可能な語
    彙を選択して出力させることを特徴とする単語大分類制
    御プログラムを記録した記録媒体。
  22. 【請求項22】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類装置を制御する単語大分類制御プログラム
    を記録した記録媒体であって、前記単語大分類制御プロ
    グラムは前記単語大分類装置に、前記単語画像中から予
    め定めた条件に合った画像領域である候補文字を選択さ
    せ、その選択された画像領域を文字コードに変換させ、
    前記単語画像全体の文字数を推定させかつ前記単語画像
    から生成した領域内の文字数を推定させ、変換された文
    字コードと推定された前記領域内の文字数とを用いて前
    記単語画像を表す単語記述を生成させ、前記単語全体の
    推定文字数を用いて前記語彙記憶手段に記録された語彙
    を選択させかつ前記単語記述と前記語彙記憶手段に記録
    された語彙とを照合して無矛盾に照合可能な語彙を選択
    して出力させることを特徴とする単語大分類制御プログ
    ラムを記録した記録媒体。
  23. 【請求項23】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類装置を制御する単語大分類制御プログラム
    を記録した記録媒体であって、前記単語大分類制御プロ
    グラムは前記単語大分類装置に、前記単語画像中から予
    め定めた条件に合った画像領域である候補文字を選択さ
    せ、その選択された画像領域を文字コードに変換させ、
    前記単語画像全体の文字数を推定させかつ前記全単語画
    像から生成した領域内の文字数を推定させ、前記単語画
    像全体の画像特徴を抽出させかつ前記全単語画像から生
    成した領域内の画像特徴を抽出させ、前記文字コードと
    前記領域内の文字数と前記領域内の図形特徴とを用いて
    前記単語画像を表す単語記述を生成させ、前記単語全体
    の推定文字数と前記単語全体の図形特徴とを用いて前記
    語彙記憶手段に記録された語彙を選択させかつ前記単語
    記述と前記語彙記憶手段に記録された語彙とを照合して
    無矛盾に照合可能な語彙を選択して出力させることを特
    徴とする単語大分類制御プログラムを記録した記録媒
    体。
  24. 【請求項24】 単語画像を入力し、それに類似する語
    彙を予め語彙記憶手段に記憶された語彙の中から選択す
    る単語大分類装置を制御する単語大分類制御プログラム
    を記録した記録媒体であって、前記単語大分類制御プロ
    グラムは前記単語大分類装置に、前記単語画像中から予
    め定めた条件に合った画像領域である候補文字を選択さ
    せ、前記単語画像が大文字のみからなるか大文字と小文
    字との混在かを判定させ、前記大文字のみからなると判
    定された時に前記大文字のみに字種を限定して選択され
    た画像領域を文字コードに変換させかつ前記大文字と小
    文字との混在と判定された時に全字種を対象として選択
    された画像領域を文字コードに変換させ、前記単語画像
    全体の文字数を推定させかつ前記全単語画像から生成し
    た領域内の文字数を推定させ、前記単語画像全体の画像
    特徴を抽出させかつ前記全単語画像から生成した領域内
    の画像特徴を抽出させ、前記文字コードと前記領域内の
    文字数と前記領域内の図形特徴とを用いて前記単語画像
    を表す単語記述を生成させ、前記単語全体の推定文字数
    と前記単語全体の図形特徴とを用いて前記語彙記憶手段
    に記録された語彙を選択させかつ前記単語記述と前記語
    彙記憶手段に記録された語彙とを照合して無矛盾に照合
    可能な語彙を選択して出力させることを特徴とする単語
    大分類制御プログラムを記録した記録媒体。
JP36374499A 1999-12-22 1999-12-22 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体 Expired - Fee Related JP3480404B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP36374499A JP3480404B2 (ja) 1999-12-22 1999-12-22 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
US09/739,661 US6834121B2 (en) 1999-12-22 2000-12-20 Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP36374499A JP3480404B2 (ja) 1999-12-22 1999-12-22 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001175811A true JP2001175811A (ja) 2001-06-29
JP3480404B2 JP3480404B2 (ja) 2003-12-22

Family

ID=18480088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP36374499A Expired - Fee Related JP3480404B2 (ja) 1999-12-22 1999-12-22 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体

Country Status (2)

Country Link
US (1) US6834121B2 (ja)
JP (1) JP3480404B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373797B2 (en) 2015-03-11 2019-08-06 Hitachi High-Technologies Corporation Charged particle beam device and image forming method using same

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4031210B2 (ja) * 2001-03-30 2008-01-09 株式会社東芝 文字認識装置、文字認識方法、及び記録媒体
US20050097046A1 (en) 2003-10-30 2005-05-05 Singfield Joy S. Wireless electronic check deposit scanning and cashing machine with web-based online account cash management computer application system
JP4150923B2 (ja) * 2003-12-09 2008-09-17 富士ゼロックス株式会社 データ出力システムおよびその方法
US7463774B2 (en) * 2004-01-07 2008-12-09 Microsoft Corporation Global localization by fast image matching
US8708227B1 (en) 2006-10-31 2014-04-29 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US7873200B1 (en) 2006-10-31 2011-01-18 United Services Automobile Association (Usaa) Systems and methods for remote deposit of checks
US8261200B2 (en) * 2007-04-26 2012-09-04 Fuji Xerox Co., Ltd. Increasing retrieval performance of images by providing relevance feedback on word images contained in the images
US9058512B1 (en) 2007-09-28 2015-06-16 United Services Automobile Association (Usaa) Systems and methods for digital signature detection
US9159101B1 (en) 2007-10-23 2015-10-13 United Services Automobile Association (Usaa) Image processing
US10380562B1 (en) 2008-02-07 2019-08-13 United Services Automobile Association (Usaa) Systems and methods for mobile deposit of negotiable instruments
US10504185B1 (en) 2008-09-08 2019-12-10 United Services Automobile Association (Usaa) Systems and methods for live video financial deposit
KR101035744B1 (ko) * 2008-12-08 2011-05-20 삼성전자주식회사 카메라를 이용한 문자 인식 장치 및 방법
US8452689B1 (en) 2009-02-18 2013-05-28 United Services Automobile Association (Usaa) Systems and methods of check detection
US10956728B1 (en) 2009-03-04 2021-03-23 United Services Automobile Association (Usaa) Systems and methods of check processing with background removal
US9779392B1 (en) 2009-08-19 2017-10-03 United Services Automobile Association (Usaa) Apparatuses, methods and systems for a publishing and subscribing platform of depositing negotiable instruments
US8977571B1 (en) 2009-08-21 2015-03-10 United Services Automobile Association (Usaa) Systems and methods for image monitoring of check during mobile deposit
US9129340B1 (en) 2010-06-08 2015-09-08 United Services Automobile Association (Usaa) Apparatuses, methods and systems for remote deposit capture with enhanced image detection
US10380565B1 (en) 2012-01-05 2019-08-13 United Services Automobile Association (Usaa) System and method for storefront bank deposits
US9286514B1 (en) 2013-10-17 2016-03-15 United Services Automobile Association (Usaa) Character count determination for a digital image
US10506281B1 (en) 2015-12-22 2019-12-10 United Services Automobile Association (Usaa) System and method for capturing audio or video data
US11030752B1 (en) 2018-04-27 2021-06-08 United Services Automobile Association (Usaa) System, computing device, and method for document detection
US11900755B1 (en) 2020-11-30 2024-02-13 United Services Automobile Association (Usaa) System, computing device, and method for document detection and deposit processing

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6041141A (en) * 1992-09-28 2000-03-21 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
JP2611904B2 (ja) * 1992-10-19 1997-05-21 株式会社エイ・ティ・アール視聴覚機構研究所 文字認識装置
JPH0757059A (ja) 1993-08-16 1995-03-03 Matsushita Electric Ind Co Ltd 文字認識装置
TW490643B (en) * 1996-05-21 2002-06-11 Hitachi Ltd Estimated recognition device for input character string
JP3522106B2 (ja) 1998-05-11 2004-04-26 富士通株式会社 文字認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10373797B2 (en) 2015-03-11 2019-08-06 Hitachi High-Technologies Corporation Charged particle beam device and image forming method using same

Also Published As

Publication number Publication date
JP3480404B2 (ja) 2003-12-22
US6834121B2 (en) 2004-12-21
US20010051965A1 (en) 2001-12-13

Similar Documents

Publication Publication Date Title
JP3480404B2 (ja) 単語大分類装置及びその単語大分類方法並びにその制御プログラムを記録した記録媒体
US11922318B2 (en) System and method of character recognition using fully convolutional neural networks with attention
US10936862B2 (en) System and method of character recognition using fully convolutional neural networks
US9665768B2 (en) Process of handwriting recognition and related apparatus
Mohamad et al. Combining slanted-frame classifiers for improved HMM-based Arabic handwriting recognition
US5067165A (en) Character recognition method
Kim et al. Handwritten phrase recognition as applied to street name images
JP2008532176A (ja) 認識グラフ
WO2018090011A1 (en) System and method of character recognition using fully convolutional neural networks
Jacobs et al. Text recognition of low-resolution document images
JP2730665B2 (ja) 文字認識装置および方法
JP3917349B2 (ja) 文字認識結果を利用して情報を検索する検索装置および方法
WO2016181470A1 (ja) 認識装置、認識方法およびプログラム
JPH07160822A (ja) パターン認識方法
JP3095069B2 (ja) 文字認識装置、学習方法および文字認識プログラムを記録した記録媒体
US20020126903A1 (en) Word recognizing apparatus for dynamically generating feature amount of word and method thereof
JP2903779B2 (ja) 文字列認識方法及びその装置
Fermanian et al. Deep recognition-based character segmentation in handwritten syriac manuscripts
JPH06223121A (ja) 情報検索装置
JPH07319880A (ja) キーワード抽出・検索装置
JP2006163830A (ja) 文字認識装置、文字認識方法、および文字認識プログラム
KR970000276B1 (ko) 필기체 문자인식방법
JP4633271B2 (ja) 辞書学習方法及び辞書学習プログラム
JP4209511B2 (ja) 文字認識方法、文字認識装置および文字認識方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04363780A (ja) 文字列認識方法及びその装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071010

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081010

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091010

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091010

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101010

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111010

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121010

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131010

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees