JP3154752B2 - 単語認識装置 - Google Patents

単語認識装置

Info

Publication number
JP3154752B2
JP3154752B2 JP19215491A JP19215491A JP3154752B2 JP 3154752 B2 JP3154752 B2 JP 3154752B2 JP 19215491 A JP19215491 A JP 19215491A JP 19215491 A JP19215491 A JP 19215491A JP 3154752 B2 JP3154752 B2 JP 3154752B2
Authority
JP
Japan
Prior art keywords
word
character
candidates
characters
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP19215491A
Other languages
English (en)
Other versions
JPH0535920A (ja
Inventor
浩義 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP19215491A priority Critical patent/JP3154752B2/ja
Publication of JPH0535920A publication Critical patent/JPH0535920A/ja
Application granted granted Critical
Publication of JP3154752B2 publication Critical patent/JP3154752B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声・文字などを単
語単位で認識する単語認識装置に関する。
【0002】
【従来の技術】従来の音声・文字認識装置においては、
単語の認識に際には、単語候補領域の切出し候補の組み
合わせより得られる文字候補から、認識結果候補を展開
処理して逐次新たな文字列を作成し、その文字列に対し
て言語辞書検索を行い、単語を決定するようにしている
(特開昭59−078400号公報、特開昭63−21
6188号公報参照)。
【0003】
【発明が解決しようとする課題】しかしながら、上記決
定方法では、(i)文字の接触や分離などの理由により
切出し候補の数が多くなると、展開処理によって大量の
文字列を作ってしまい処理速度の低下が生じる。また、
(ii)言語辞書に登録されていない単語(固有名詞や
数値など)を正解として選択するのが困難である。
【0004】本発明では、文字列候補の全ての組み合わ
せを考えるのではなく、先頭から文字を決定(あるいは
上位候補に限定)していき、すでに決定している文字に
つながる可能性のある文字だけを考慮することにより、
上記問題点(i)を解決する。また、文字列を構成する
連続した3文字についてのみの存在率を評価すること
で、上記問題点(ii)を解決する。
【0005】すなわち、この発明は、音声・文字などの
認識において、単語候補領域から単語を決定する際、単
語候補領域の切出し候補を左端から右端へ順番に走査し
ていき、連続する3つの文字の3文字間類似度、存在
率、形状値から求まる単語得点を用いて、切出し候補の
それぞれの位置での最適な文字を逐次決定(あるいは上
位候補に限定)しながら単語を決定する単語認識装置を
提供するものである。
【0006】
【課題を解決するための手段】図1はこの発明の構成を
示すブロック図であり、図に示すように、この発明は、
イメージリーダによって読取られた単語として認識する
べきイメージを記憶する単語イメージ記憶手段101 と、
単語イメージ記憶手段101 に記憶されたイメージからキ
ャラクタとして認識するべきイメージを切出す切出し手
段と102 、切出し手段102 によって切出された複数種類
のイメージをキャラクタ候補として認識するキャラクタ
認識手段103 と、キャラクタ認識手段103 によって認識
されたキャラクタ候補について、連続した複数のキャラ
クタのそれぞれの類似度の平均値、連続した複数のキャ
ラクタの組み合わせが文章中に出現する確率、及び連続
した複数のキャラクタの相対的な形状の妥当性を表す値
の内の少なくとも1つの値を算出し、その数値に基づい
て単語得点を算出する算出手段104 と、単語得点が上位
となる複数のキャラクタ候補を単語の先頭から順次選別
するとともに、この選別したキャラクタ候補を組み合わ
せた複数の単語候補を、上位候補として更新保持してお
き、キャラクタの選別後、その複数の上位候補の中から
単語得点の最も高い単語候補を正解と決定する単語決定
手段105 と、を備えてなる単語認識装置である。
【0007】なお、この発明の切出し手段102 、キャラ
クタ認識手段103 、算出手段104 、及び単語決定手段10
5 としては、CPU、ROM、RAM、I/Oポートか
らなるマイクロコンピュータを用いるのが便利であり、
単語イメージ記憶手段101 としては、通常、その中のR
AMが用いられる。
【0008】
【作用】この発明によれば、単語イメージ記憶手段101
に記憶された単語イメージからキャラクタとして認識す
るべきイメージを切出して、それをキャラクタ候補と
し、そのキャラクタ候補について、連続した複数のキャ
ラクタのそれぞれの類似度の平均値、連続した複数のキ
ャラクタの組み合わせが文章中に出現する確率、及び連
続した複数のキャラクタの相対的な形状の妥当性を表す
値の内の少なくとも1つの値を算出し、その数値に基づ
いて単語得点を算出し、単語得点が上位となる複数のキ
ャラクタ候補を単語の先頭から順次選別するとともに、
この選別したキャラクタ候補を組み合わせた複数の単語
候補を、上位候補として更新保持しておき、キャラクタ
の選別後、その複数の上位候補の中から単語得点の最も
高い単語候補を正解と決定する。
【0009】したがって、切出したキャラクタ候補から
最適なキャラクタを逐次選別していくので、接触・分離
などの理由によって切出したキャラクタ候補が多くなる
場合の処理速度を短縮することができる。また、言語辞
書に登録されていない単語の認識率が向上する。
【0010】
【実施例】以下、図面に示す実施例に基づいてこの発明
を詳述する。なお、これによってこの発明が限定される
ものではない。
【0011】図2はこの発明による単語認識装置の一実
施例の構成を示すブロック図であり、以下に、活字英数
字OCR(光学的文字読み取り装置)を例に取り、本発
明を説明する。この図において、1はイメージリーダに
よって読取られた単語として認識するべきイメージ(単
語矩形領域)を記憶する単語イメージバッファメモリ、
2は文字(キャラクタ)候補を格納する文字候補バッフ
ァメモリ、3は単語候補を格納する単語候補バッファメ
モリ、4は選択した単語を記憶する単語選択バッファメ
モリ、5は作業用メモリである。単語イメージバッファ
メモリ1、文字候補バッファメモリ2、単語候補バッフ
ァメモリ3、単語選択バッファメモリ4、作業用メモリ
5は、それぞれRAMから構成されている。
【0012】6はCPU、7はプロセッサからなる単語
得点計算部であり、単語得点計算部7は、3文字間類似
度計算部7a、3文字間存在率計算部7b、3文字間形
状値計算部7cを有している。8はシステム全体を制御
するプロセッサからなる制御部である。
【0013】CPU6は、単語イメージバッファメモリ
1に記憶されたイメージから文字(キャラクタ)として
認識するべきイメージを、切出し位置を様々に変えて切
出して文字候補バッファメモリ2に格納する。
【0014】次に、切出した複数種類のイメージを文字
候補(切出し候補)として認識し、認識した文字候補に
ついて、連続する3つの文字間の類似度、存在率、形状
値を、それぞれ3文字間類似度計算部7a、3文字間存
在率計算部7b、3文字間形状値計算部7cで計算し、
それらの計算値に基づいて単語得点計算部7で単語得点
を算出して単語候補とする。そして、算出した単語得点
から妥当な単語を決定する。
【0015】ここで、3文字間類似度とは、連続した3
つの文字のそれぞれの類似度の平均値である。
【0016】3文字間存在率とは、連続した3つの文字
の組み合わせが英文中に出現する確率である。例えばt
heやablといった組み合わせは、zzzや♯$%と
いった組み合わせより、3文字間存在率が高いと考えら
れる。
【0017】3文字間形状値とは、連続した3つの文字
の相対的な形状の妥当性を表す値である。例えば、3つ
の文字の高さがほぼ同じであれば、aceという組み合
わせは、aCeという組み合わせより、3文字間形状値
が高いと考えられる。
【0018】単語得点とは、3文字間類似度、存在率、
形状値より求まる、第n(但しnは自然数)文字目まで
の単語としての妥当性を表す値である。nが1または2
のときの3文字間類似度、存在率、形状値は、それぞれ
1文字、2文字間の類似度、存在率、形状値を用いる。
単語得点は以下の式で求まる。 S(1)=Wr・R+Wp・P+Wf・F S(n)={S(n−1)+Wr・R+Wp・P+Wf・F}/2 S(n) 第n文字目までの単語得点(但しn
は自然数) R,P,F 3文字間類似度、存在率、形状値 Wr,Wp,Wf 3文字間類似度、存在率、形状値の
重み
【0019】切出し候補とは、単語矩形領域における文
字と文字の切れ目の候補である。単語矩形領域の右端と
左端も切出し候補の一つとして数える。文字と文字の切
れ目の可能性がある場所は全て切出し候補として求める
ので、通常は実際の文字の数以上に分割する。例えば、
Oという文字は( )の様に切出される可能性があり、
mという文字はrnの様に切出される可能性がある。
【0020】図3は文字候補バッファメモリ2の記憶内
容を示す説明図である。文字候補とは、上記切出し候補
の組み合わせから作られる、文字矩形領域の候補であ
る。文字候補は、文字矩形領域の左端の切出し候補(以
後、先頭ライン)、右端の切出し候補(以後、末尾ライ
ン)、文字認識によって得られる認識結果候補などの情
報を持つ。単語矩形領域の全ての文字候補は、文字候補
バッファメモリ2へ格納される。例えば1番から4番ま
で4つの切出し候補がある場合、次の様な切出し候補の
組み合わせの文字候補が、文字候補バッファメモリ2へ
格納される。 1−2 1−3 1−4 2−3 2−4 3−4
【0021】図4は単語候補バッファメモリ3及び単語
選択バッファメモリ4の記憶内容を示す説明図である。
単語候補バッファメモリ3には、単語矩形領域で先頭か
ら決定していった文字が順番に格納されている。単語候
補の最後の文字の末尾ラインを、その単語候補の末尾ラ
インと呼ぶこととする。単語候補は必ずしも1つではな
く、単語得点があるしきい値より大きい全ての単語候補
が、単語候補バッファメモリ3に格納されている。各単
語候補は、その末尾ラインと同じ先頭ラインを持つ文字
が最後に加えられ、新たに単語得点が計算されて単語選
択バッファメモリ4へ移される。単語候補バッファメモ
リ3内の単語候補が一通り評価された後で、単語選択バ
ッファメモリ4から単語得点の高い上位候補が再び単語
候補バッファメモリ3へ戻される。
【0022】次に、図5の単語決定フローチャートに沿
って、本発明の動作を説明する。図5において、開始状
態は、単語矩形領域と切出し候補、文字候補がすでに求
められた状態である。単語矩形領域の切出し候補のう
ち、ある時点で処理の対象になっている切出し候補のこ
とを注目ラインと呼ぶ。注目ラインを単語矩形領域の左
端から右端まで順番に走査していき、走査が終了した時
点で、単語候補バッファメモリ3に残っているものが正
解候補である。
【0023】まず、単語候補バッファメモリ3をクリア
し、単語矩形領域の左端の切出し候補を末尾ラインとす
る、空白だけからなる単語候補を1つ作り、単語候補バ
ッファメモリ3に格納する。また、単語矩形領域の左端
の切出し候補を、注目ラインとする(ステップ11)。続
いて、単語選択バッファメモリ4をクリアする(ステッ
プ12)。次に、単語候補バッファメモリ3の中から、注
目ラインと同じ末尾ラインを持つ単語候補を一つ選択す
る。つまり、その単語候補を抜き出し、単語候補バッフ
ァメモリ3からは抹消する(ステップ13)。
【0024】そして、文字候補バッファメモリ2の中か
ら、注目ラインと同じ先頭ラインを持つ文字候補を一つ
選択する(ステップ14)。また、現在選択している文字
候補の中から、文字認識によって得られた認識結果候補
を一つ選択する(ステップ15)。
【0025】次に、現在選択している単語候補の最後に
上で得られた文字を加えたものを、新たな単語候補とし
て単語選択バッファメモリ4へ格納する。このとき、最
後の3つの文字から3文字間類似度、存在率、形状値を
用いてその単語候補の単語得点を求めておく(ステップ
16)。そして、現在選択している文字候補の中に、文字
認識によって得られた認識結果候補が他にあればステッ
プ15へ戻る(ステップ17)。また、文字候補バッファメ
モリ2の中に、注目ラインと同じ先頭ラインを持つ文字
候補が他にあればステップ14へ戻る(ステップ18)。さ
らに、単語候補バッファメモリ3の中に、注目ラインと
同じ末尾ラインを持つ単語候補が他にあればステップ13
に戻る(ステップ19)。
【0026】そして、単語選択バッファメモリ4の中か
ら、単語得点の高い単語候補(上位候補)を単語候補バ
ッファメモリ3へ戻す。このとき、単語候補バッファメ
モリ3の単語候補の末尾ラインのうち、単語矩形領域で
最も左に位置するものを新しい注目ラインとする(ステ
ップ20)。ここで、新しい注目ラインが単語矩形領域の
右端でないならば、まだ後に続く文字があるのでステッ
プ12へ戻る(ステップ21)。そして、単語候補バッファ
メモリ3の中から、単語得点の最も高い単語候補を正解
として決定する(ステップ22)。
【0027】このようにして、単語のイメージから切出
した文字候補を左端から右端へ順番に走査していき、連
続する3つの文字の3文字間類似度、存在率、形状値か
ら、切出した文字候補のそれぞれの位置での最適な文字
を逐次決定しながら単語を決定することにより、接触・
分離などにより判定しにくい文字であっても、正確、か
つ迅速に認識可能となる。
【0028】
【発明の効果】この発明によれば、単語のイメージから
キャラクタ候補を切出す場合に、キャラクタとして認識
するべきイメージを切出して、それをキャラクタ候補と
し、そのキャラクタ候補について、連続する複数のキャ
ラクタのそれぞれの類似度の平均値、連続した複数のキ
ャラクタの組み合わせが文章中に出現する確率、及び連
続した複数のキャラクタの相対的な形状の妥当性を表す
値の内の少なくとも1つの値から単語得点を算出し、単
語得点が上位となる複数のキャラクタ候補を単語の先頭
から順次選別するとともに、この選別したキャラクタ候
補を組み合わせた複数の単語候補を、上位候補として更
新保持しておき、キャラクタの選別後、その複数の上位
候補の中から単語得点の最も高い単語候補を正解と決定
するようにしたので、接触・分離などの理由により切出
すキャラクタ候補が多くなる場合の処理速度が短縮され
る。また、言語辞書に登録されていない単語の認識率が
向上する。
【図面の簡単な説明】
【図1】この発明の構成を示すブロック図。
【図2】この発明の一実施例の構成を示すブロック図。
【図3】文字候補バッファメモリの記憶内容を示す説明
図。
【図4】単語候補バッファメモリ及び単語選択バッファ
メモリの記憶内容を示す説明図。
【図5】実施例の動作を示すフローチャート。
【符号の説明】
1 単語イメージバッファメモリ 2 文字候補バッファメモリ 3 単語候補バッファメモリ 4 単語選択バッファメモリ 5 作業用メモリ 6 CPU 6a 3文字間類似度計算部 6b 3文字間存在率計算部 6c 3文字間形状値計算部 7 単語得点計算部 8 制御部

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 イメージリーダによって読取られた単語
    として認識するべきイメージを記憶する単語イメージ記
    憶手段と、 単語イメージ記憶手段に記憶されたイメージからキャラ
    クタとして認識するべきイメージを切出す切出し手段
    と、 切出し手段によって切出された複数種類のイメージをキ
    ャラクタ候補として認識するキャラクタ認識手段と、 キャラクタ認識手段によって認識されたキャラクタ候補
    について、連続した複数のキャラクタのそれぞれの類似
    度の平均値、連続した複数のキャラクタの組み合わせが
    文章中に出現する確率、及び連続した複数のキャラクタ
    の相対的な形状の妥当性を表す値の内の少なくとも1つ
    の値を算出し、その数値に基づいて単語得点を算出する
    算出手段と、 単語得点が上位となる複数のキャラクタ候補を単語の先
    頭から順次選別するとともに、この選別したキャラクタ
    候補を組み合わせた複数の単語候補を、上位候補として
    更新保持しておき、キャラクタの選別後、その複数の上
    位候補の中から 単語得点の最も高い単語候補を正解と決
    定する単語決定手段と、を備えてなる単語認識装置。
  2. 【請求項2】 前記算出手段による連続した複数のキャ
    ラクタの組み合わせが文章中に出現する確率の算出が、
    英文中に出現する確率について行われる請求項1記載の
    単語認識装置。
  3. 【請求項3】 前記算出手段による連続した複数のキャ
    ラクタのそれぞれの類似度の平均値、連続した複数のキ
    ャラクタの組み合わせが英文中に出現する確率、及び連
    続した複数のキャラクタの相対的な形状の妥当性を表す
    値の算出が、それぞれ連続した3つのキャラクタについ
    て行われる請求項2記載の単語認識装置。
  4. 【請求項4】 前記算出手段が、連続した複数のキャラ
    クタのそれぞれの類似度の平均値、連続した複数のキャ
    ラクタの組み合わせが文章中に出現する確率、及び連続
    した複数のキャラクタの相対的な形状の妥当性を表す値
    の全ての値を算出する請求項1から3のいずれか1つに
    記載の単語認識装置。
JP19215491A 1991-07-31 1991-07-31 単語認識装置 Expired - Lifetime JP3154752B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19215491A JP3154752B2 (ja) 1991-07-31 1991-07-31 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP19215491A JP3154752B2 (ja) 1991-07-31 1991-07-31 単語認識装置

Publications (2)

Publication Number Publication Date
JPH0535920A JPH0535920A (ja) 1993-02-12
JP3154752B2 true JP3154752B2 (ja) 2001-04-09

Family

ID=16286599

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19215491A Expired - Lifetime JP3154752B2 (ja) 1991-07-31 1991-07-31 単語認識装置

Country Status (1)

Country Link
JP (1) JP3154752B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4601835B2 (ja) * 2000-01-28 2010-12-22 株式会社東芝 単語認識方法および単語認識プログラムおよび単語認識装置

Also Published As

Publication number Publication date
JPH0535920A (ja) 1993-02-12

Similar Documents

Publication Publication Date Title
US6944344B2 (en) Document search and retrieval apparatus, recording medium and program
JPH087033A (ja) 情報処理方法及び装置
JPH0634256B2 (ja) 接触文字切出し方法
JPH0682403B2 (ja) 光学式文字読取装置
JPH08263478A (ja) 中国語簡繁体字文書変換装置
JP3154752B2 (ja) 単語認識装置
JP3309174B2 (ja) 文字認識方法及び装置
JPH0785080A (ja) 全文書検索システム
JP3975825B2 (ja) 文字認識誤り訂正方法、装置及びプログラム
JP2000148788A (ja) 文書画像からのタイトル領域抽出装置およびタイトル領域抽出方法,並びに文書検索方法
JPH06215184A (ja) 抽出領域のラベリング装置
JPH0528324A (ja) 英文字認識装置
JP2002063197A (ja) 検索装置、記録媒体およびプログラム
JPH09274645A (ja) 文字認識方法および装置
JPH07271921A (ja) 文字認識装置および文字認識方法
JP2890241B2 (ja) 光学的文字認識装置
JPH09185674A (ja) 誤認識文字検出装置、誤認識文字訂正装置、誤認識文字検出方法、および、誤認識文字訂正方法
JPH06290209A (ja) 文切り装置
JP3151866B2 (ja) 英文字認識方法
JP3100786B2 (ja) 文字認識後処理方式
JP2891368B2 (ja) 文字認識結果の後処理方法
JP2013246721A (ja) 文字列認識装置、文字列認識プログラム、及び記録媒体
JPS63282586A (ja) 文字認識装置
JP2931485B2 (ja) 文字切出し装置及び方法
JPH0950488A (ja) 異サイズ混在文字列の読取り方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080202

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090202

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100202

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100202

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110202

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120202

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120202

Year of fee payment: 11