JPH05205109A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH05205109A
JPH05205109A JP4014610A JP1461092A JPH05205109A JP H05205109 A JPH05205109 A JP H05205109A JP 4014610 A JP4014610 A JP 4014610A JP 1461092 A JP1461092 A JP 1461092A JP H05205109 A JPH05205109 A JP H05205109A
Authority
JP
Japan
Prior art keywords
phrase
evaluation value
bunsetsu
unit
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4014610A
Other languages
English (en)
Other versions
JP3264961B2 (ja
Inventor
Toshio Niwa
寿男 丹羽
Hidetsugu Maekawa
英嗣 前川
Kazuhiro Kayashima
一弘 萱嶋
泰治 〆木
Taiji Shimeki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP01461092A priority Critical patent/JP3264961B2/ja
Publication of JPH05205109A publication Critical patent/JPH05205109A/ja
Application granted granted Critical
Publication of JP3264961B2 publication Critical patent/JP3264961B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 認識された文字列を文法情報等により修正す
る時認識誤りを多く含んでいても正しい文節を選択す
る。 【構成】 文字認識部11で認識された文字列は文節検
索部12で単語辞書15に存在する単語と一致する候補
文字の組合せを選出し,さらに文法辞書16を参照して
文節となりえる単語の組合せを候補文節として選出す
る。文節評価値演算部13は選出された候補文節に含ま
れる,単語の頻度を求めこれを非線形変換し単語頻度評
価値を求め,品詞を検索しそのうちの付属語の数と文字
列の長さから文節長評価値を求め,さらに文字認識部で
出力される各候補文字に対する評価値の平均である文字
評価値,文節中に含まれる単語の文字数の平均値である
単語長評価値とから,文節評価値を求める。文節選択部
14は文節評価値を基準に正しい文節を選択し修正文字
列を選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字を読みとるための
文字認識装置に関するものである。
【0002】
【従来の技術】近年、データベースの発展に伴い、高速
で認識率の高い文字認識装置に対する要求が高まってい
る。
【0003】従来の文字認識装置としては、例えば、情
報処理学会論文誌Vol.30 No.11 pp.1394-1401 に示され
ている。図2は従来の文字認識装置を示すものである。
文字認識部11は1文字につきn個の候補文字を出力す
る。文節検索部12は、単語辞書15や文法辞書16を用い
て、候補文字列集合の中から文節を構成する文字の組み
合せを求める。文節評価値演算部13で、候補文節の語彙
的および文法的な正しさを示す文節評価値を求める。そ
して、文節選択部14で、最も正しいと思われる文節を選
択して、文字認識装置の出力とする。
【0004】このような構成で、文節評価値演算部13
は、図3に示すような内部構成をしている。それぞれの
候補文節に対して、単語頻度評価部21、文節長評価部2
2、文字評価部23、単語長評価部24で、それぞれ単語頻
度評価値、文節長評価値、文字評価値、単語長評価値を
求め、4つの評価値から文節評価値導出部25で、文節評
価値を求める。
【0005】単語頻度評価部21は、図7に示す内部構造
をしている。単語頻度評価部21に入力された候補文節中
に含まれる単語に対して、単語頻度検索部41で単語辞書
15を用いて単語の一般的な頻度を検索し、その頻度を単
語頻度評価値として出力する。
【0006】文節長評価部22は、図8に示す内部構造を
している。文節長評価部22に入力された候補文節の長さ
を文節長導出部42で求め、その長さを文節長評価値とし
て出力する。
【0007】また、文節選択部14は、図9に示す内部構
造をしている。候補文節に対して接続可能文節探索部52
で接続できる文節を探索しながら、探索木生成部51で文
節の接続を表す探索木を生成していき、探索木が句読点
まで到達したらその到達した枝の文節を選択された文節
として出力する。
【0008】以上のように単語辞書や文法辞書を使うこ
とにより、文字認識部だけでは判断が難しい文字を単語
と文法の知識により修正することができる。
【0009】
【発明が解決しようとする課題】しかしながら、上記の
文字認識装置では、単語頻度評価部21は、単語の頻度を
そのまま単語頻度評価値としているために、高頻度の単
語が含まれる文節の単語頻度評価値が常に大きい値とな
ってしまう。特に、文字認識部から出力される候補文字
の数nが大きくて候補文節の数が多いときには、高頻度
の単語を含むような文節が常に大きな単語頻度評価値を
持って選ばれる可能性が大きい。
【0010】一方、文節長評価部22は、文節の長さをそ
のまま文節長評価値としているために、実際の文章で現
われる確率の少ないような付属語が多く含まれている文
節までも文節の長さが長いために文節長評価値を上げる
ことになる。
【0011】また、文節選択部14は、探索木生成部51で
探索を行いながら探索木を生成するので、探索される順
序によって最適な解が得られないことがある。さらに、
文字認識部で出力された候補文字の中に正解が含まれな
い場合に、その部分の文節が探索できないために、探索
できなかった文節の下に位置する部分の探索ができな
い。
【0012】本発明はこのような従来の課題を解決する
もので、文字認識部から出力される候補文字集合が誤り
を多く含んでいても、文節を正しく選択することにより
文字認識率を高くすることを目的としている。
【0013】
【課題を解決するための手段】本発明は上記目的を達成
するために、一般的な単語の頻度を非線形処理して単語
頻度評価値が大きな値とならないようにする。また、文
節中に含まれる付属語の数を考慮して文節長評価値を求
める。文節の選択では、3文節以上の文節の探索を行
い、できるだけ同じ長さに近い文節間で比較することに
より、文節の選択を行う。
【0014】
【作用】本発明は上記した構成により、文字認識部から
出力される候補文字集合が誤りを多く含んでいても、文
節の語彙的及び文法的正しさを示す単語頻度評価値、文
節長評価値を正しく評価することができる。また、最低
3文節分の文節を探索することにより、少ない計算量で
最適解が得られる。よって、文字修正部での文字認識率
が向上する。
【0015】
【実施例】以下、本発明の一実施例について説明する。
図2にこの実施例の文字認識装置の全体の構成を示す。
【0016】文字認識部11は、文字の画像より文字認識
を行い、長さmの文字列で1文字につき第1候補文字か
ら第n候補文字までのn個の候補文字を持つ候補文字集
合を出力する。
【0017】文節検索部12は、単語辞書15を検索するこ
とにより候補文字集合の組み合わせの中から、単語辞書
15に存在する単語と一致する候補文字の組み合わせを選
び出し、さらに文法辞書16を参照して文節となりえる単
語の組み合わせを選び出す。文節評価値演算部13は、文
節検索部12で検索された文節の語彙的および文法的な正
しさを文節中の単語の長さや頻度などを基準として評価
値を計算する。文節選択部14は、文節の候補の中で評価
値の大きい文節を選択する。
【0018】次に、図3を用いて文節評価演算部13の内
部構成について説明する。文節評価値演算部は、候補文
節を入力とし、その文節の文節評価値を出力する。単語
頻度評価部21は、文節中の単語の頻度から単語頻度評価
値を計算する。文節長22は、文節の長さから文節長評価
値を計算する。文字評価部23は、文字認識部11で認識さ
れたときの文字毎の評価値から文字評価値を計算する。
単語長評価部24は、文節中の単語の長さから単語長評価
値を計算する。文節評価値導出部25は、単語頻度評価
値、文節長評価値、文字評価値、単語長評価値から文節
評価値を計算する。
【0019】単語頻度評価部21は、図4に示すような内
部構成をしている。単語頻度評価部21は、候補文節を入
力とし、その文節の単語頻度評価値を出力する。単語頻
度検索部31は、入力された候補文節中に含まれる単語の
一般的な頻度を単語辞書15を用いて求める。非線形処理
部32は、単語の頻度の値を非線形処理して出力する。
【0020】文節長評価部22は、図5に示すような内部
構成をしている。文節長評価部22は、候補文節を入力と
し、その文節の文節長評価値を出力する。品詞検索部33
は、文節中に含まれる単語の品詞を単語辞書15を用いて
求める。付属語検索部34は、文節中に含まれる付属語の
数を求める。文節長導出部35は、文節の長さを求める。
文節長評価値導出部36は、文節中に含まれる付属語の数
と文節の長さから文節長評価値を出力する。
【0021】図1は文節選択部14の内部構成であり、こ
れについて説明する。文節選択部14は、文節評価値を入
力とし、修正文字列を出力する。接続文節検索部1は、
候補の文節の後ろに接続する文節を検索する。接続評価
値導出部2は、候補の文節とその文節に接続する文節か
ら接続評価値を求める。接続評価値比較部3は、接続評
価値を比較しそれが最も大きい文節を修正文字列として
出力する。
【0022】上記の構成の文字認識装置において次のよ
うにして文字認識を行う。まず、認識対象の文書を文字
認識部11で処理し、長さmの文字列で1文字に付き第1
候補文字から第n候補文字までのn個の候補文字を持つ
候補文字集合Cij(i=1,m j=1,n)を出力する。次に、
文節検索部12で、単語辞書15を検索することにより候補
文字集合の組み合せの中から、単語辞書15に存在する単
語と一致する候補文字の組み合せを選び出し、さらに、
文法辞書16を参照して文節となりえる単語の組み合せを
選び出す。
【0023】選び出された候補文節について文節評価値
演算部13で文節評価値を以下のように計算する。図3に
示すように、それぞれの候補文節に対して、単語頻度評
価部21、文節長評価部22、文字評価部23、単語長評価部
24でそれぞれ単語頻度評価値Eh、文節長評価値Eb、文
字評価値Ec、単語長評価値Etを求める。
【0024】単語頻度評価値Ehは、図4に示す構成で
求める。まず、単語頻度検索部31で文節に含まれている
単語wの頻度Fwを単語辞書15を用いて検索する。次
に、非線形処理部32で非線形関数f(x)を用いて単語頻
度評価値Ehを求める。例えば非線形関数f(x)としてsq
rt(x)を用いて、単語頻度評価値Ehは次の式により求め
ることができる。
【0025】Eh=(Σsqrt(Fw))/p (wは文
節中に含まれる単語) ただし、pは文節中に含まれる単語の数である。
【0026】ここで用いる非線形関数f(x)は、x≧0
で定義されている単調増加関数で、f(x)の微分f'(x)が x>yのとき f'(x)≦f'(y) を満たす関数であれば良く。sqrt(x) に限るものではな
い。このような非線形処理を行うことにより単語の一般
的な頻度Fw の大小の差に比べて単語頻度評価値Eh
大小の差を小さくすることができる。
【0027】単語頻度評価部21の入力は、候補文字の組
み合せから選び出された候補文節であるので、多くの間
違った文節を含んでいる。このような文節に対して、非
線形処理を行わずに一般的な単語の頻度をそのまま単語
頻度評価値Eh とすると、高頻度の単語を含む文節が常
に高い文節評価値を持つようになる。一方非線形処理を
行うことにより、ある程度以上頻度の高い単語を含む文
節の単語頻度評価値をあまり高くしないようにできる。
このように非線形処理を行うことにより、多くの間違っ
た文節を含む候補に対しても、適当な文節評価値を計算
することができる。
【0028】文節長評価値Eb は、図5に示す構成で求
める。まず、品詞検索部33で、文節中に含まれている単
語wの品詞Hw を単語辞書15を用いて検索する。次に、
付属語検索部34で文節中に含まれる単語で品詞が付属語
であるものの数kを求める。さらに、文節長導出部35で
文節の文字列の長さsを求める。文節長評価値導出部36
で、文節中に含まれる付属語の数kと文節の長さsか
ら、文節長評価値Eb を求める。文節長評価値Ebは、
文節中に含まれる付属語の数kが多くなればEbは小さ
くなり、文節の長さsが大きくなればEb は大きくなる
ような関数により求める。例えば文節長評価値Eb は、
次の式により求めることができる。
【0029】Eb=s/(1+0.1k) 一般に一文節中に多くの付属語が現われる確率は小さ
い。しかし、文字認識部1の出力における多くの候補文
字集合の中から、単語相互の接続可能性を基準に文節を
構成する文字の組み合せを選択した場合に、多くの付属
語が連なる文節が構成されてしまう。このような文節が
構成されるのを防ぐためには、文法辞書に3単語間ある
いは4単語間の接続可能性を記述すればよいが、このよ
うな記述は量が膨大となる。一方、単語長評価部22で
は、文節中に含まれる付属語の数が多くなると文節長評
価値Eb は小さくなる。よって、多くの付属語が連なる
文節では文節長評価値Eb が下がるので、多くの付属語
の連なる文節が文字修正部17の最終出力である修正文字
列に出力されるのを簡単に防ぐことができる。
【0030】なお、Eb は前記の式に限定されるもので
はなく、文節中に含まれる付属語の数k が多くなればE
bが小さくなり、文節の長さsが大きくなればEbは大き
くなるものであれば良い。
【0031】文字評価値Ec は、文字認識部で出力され
る各候補文字に対する評価値の平均値である。
【0032】単語長評価値Et は、文節中に含まれる単
語の文字数の平均値である。文節評価値導出部25で、4
つの評価値、単語頻度評価値Eh、文節長評価値Eb、文
字評価値Ec、単語長評価値Etから、文節評価値Eを次
の式で求める。
【0033】E=aEh+bEb+cEc+dEt ただし、a,b,c,dは定数である。
【0034】文節評価値を求めた候補文節に対して文節
評価値を基準にして、文節選択部14で正しい文節を選択
し、修正文字列を出力する。文節選択部14は、文節評価
値に基づいて、文書の一番目の文字から始まる文節に注
目し、順番に前から文節を選択していく。文節の選択
は、基本的に3文節先までの文節を調べ、それらの文節
の評価値の和の最も大きいものの第1文節を修正文字列
として出力する。ただし、このとき比較する文節全体の
文字数をできるだけ同じ長さとする処理を行って文節の
数を調節する。文節の選択の処理を図6の接続評価値例
を用いて説明する。処理は文節中の文字数が多い文節か
ら順に行われる。図6では、3文字、2文字、1文字の
文節があり、3文字の文節(図6の(1))、2文字の文
節(図6の(4))、1文字の文節(図6の(8))の順に処
理を行う。図6の(1)の例では、第1文節が3文字で、
4文字目から始まる第2文節は、3文字の文節(図6の
(1))と2文字の文節(図6の (3))の2つある。これ
も文節中の文字数が多い文節から順に処理をする。する
と、3文字の文節を処理して、次に、7文字目から始ま
る第3文節は、3文字の文節(図6の(1))と2文字の
文節(図6の(2))がある。第3文節までの文節が探索
できたら、第1文節、第2文節、第3文節の3つの文節
の文節評価値を足したものを文節の数(この場合は3)
で割ったものが接続評価値Emである。(1)では、 Em=(100+100+100)/3=100 となる。同様にして(2),(3)の接続評価値Emを求めるこ
とができる。このとき、それぞれの探索において、同じ
文字位置から始まる文節の系列で接続評価値が最も大き
い文節の系列をそれぞれ記憶しておく。例えば、7文字
目から始まる文節では、(1)と(2)から(1)の方が接続評
価値が高いので、(1)の文節の系列を記憶する。また、
4文字目から始まる文節では、(1)と(2)と(3)から(1)が
最も接続評価値が高いので、(1)の文節の系列を記憶す
る。
【0035】(4) の計算では、第2文節までの探索を終
えたところで、第2文節の終了位置が6文字目である。
第3文節は7文字目から始まるが、7文字目から始まる
文節の探索はすでに(1)と(2)で行っているので、以前に
探索した結果を用いる。よって、記憶しておいた7文字
目から始まる文節の系列((1) で探索したもの)を7文
字目からの探索文節として接続評価値を求める。また、
(5) では、第3文節の探索が終わったところで、第3文
節の終了位置が6文字目である。このようにすでに文節
系列が記憶されている文字位置で文節が終わっている場
合は、さらに、7文字目から始まる文節の系列を探索文
節に含めて接続評価値を求める。よって、(5)の場合の
接続評価値Emは、 Em=(80+80+100+100)/4=90 となる。このように、文節の系列に含まれる文字の数を
できるだけ揃えるように探索を行う。以下同様にして、
(6),(7),(8) の接続評価値を求めることができる。
【0036】すべての文節の探索が終わったら、接続評
価値の最も大きい文節の系列の第1文節が出力される文
節として選択される。図6の例では、(1)の第1文節で
ある。 以上の文節選択のアルゴリズムを以下に示す。 1.変数の初期化 文字位置iの文節系列記憶 value(i)←⊥ 文字位置 u←1 文節位置 j←0 計算変数 Ep←0 2.文字位置uから始まる各文節に対して、文字数の多
い文節から順に、uとjとEp と文節pを引数にして接
続評価値を求める。 3.2で求めた接続評価値の中で最も大きいものを求
め、そのときの文節の系列をvalue(u)に代入する。 4.アルゴリズム終了 接続評価値は文字位置uと文節位置jと計算変数Ep
文節pを引数とし、以下のアルゴリズムで求める。 1.文節pの文節評価値EをEp に加える。
【0037】Ep←Ep+E 2.文節pの文字数をsとすると、 u←u+s 3.文節位置を進める。
【0038】j←j+1 4.もし、value(u)が定義されていれば、value(u)に定
義された文節の系列から接続評価値Em は、 Em←(Ep+(value(u)の文節の文節評価値の和))/
(文節の数) アルゴリズム終了。 5.文節位置jが3であれば、 Em←Ep/3 アルゴリズム終了。 6.文節選択のアルゴリズムの2へ。 7.アルゴリズム終了 以上のアルゴリズムを適用することにより、文節選択の
アルゴリズムが終了した時点で、最も接続評価値の大き
い文節の系列がvalue(1)に代入されている。
【0039】なお、本実施例では文節の選択を3文節分
先まで探索して接続評価値を求めたが、探索する文節の
数を2文節あるいは4文節以上のn文節としてもよい。
探索する文節の数を増やすとより正確に文節を選択する
ことができる。しかし、計算量は増大する。
【0040】本実施例の文節選択部14を用いることによ
り、3文節以上の文節を探索して接続評価値を評価して
いるので、先の文節の情報も含めて文節を選択すること
ができる。そして、この方法では、すべての場合を探索
するので、最適解を探索することができる。また、従来
の探索木を生成する方法に比べて、1文節ずつ文節を選
択していくために、正解の文節が候補文字に含まれてい
なかった場合でも、他の文節の部分が間違える可能性が
少なく、計算量も少ない。さらに、文節の選択をするた
めの接続評価値は、できるだけ同じ長さに近い文節の系
列で比較を行っている。これは、文節の個数を一定とし
て文節を探索した場合に、ある部分の候補文字に正解が
含まれていなかったときなどに、その部分を含まないよ
うに短い文節ばかりが選択されることを防いでいる。こ
のため文字認識部11の出力で候補文字の集合に正解文字
が含まれていない部分がある場合でも、文字認識率の低
下を防ぐことができる。
【0041】
【発明の効果】以上の実施例から明らかなように、本発
明の構成の文字認識装置を使用すれば、単語頻度評価部
21の構成により、非線形処理を行うので、ある程度以上
頻度の高い単語を含む文節の単語頻度評価値をあまり高
くしないようにできる。これにより、多くの間違った文
節を含む候補に対しても、間違った文節が常に高い文節
評価値となることを防ぐことができる。
【0042】また、単語長評価部22の構成により、文節
中に含まれる付属語の数によって文節長評価値Eb にペ
ナルティを与えるので、多くの付属語が連なる文節の文
節長評価値Eb を下げ、多くの付属語が連なる文節が文
字修正部7の最終出力である修正文字列に出力されるの
を防ぐことができる。
【0043】さらに、文節選択部14の構成により、3文
節以上の文節を探索して接続評価値を評価しているの
で、先の文節の情報も含めて文節を選択することができ
る。また、すべての場合を探索しているので、最適解を
得ることができる。一方、文節の選択をするための接続
評価値は、できるだけ同じ長さに近い文節の系列で比較
を行っているので、文字認識部1の出力で候補文字の集
合に正解文字が含まれていない部分がある場合でも、文
字認識率の低下を防ぐことができる。
【0044】以上の構成で文字認識を行うために認識率
が向上し、その実用的効果は大きい。
【図面の簡単な説明】
【図1】本発明の実施例の文節選択部の構成を示すブロ
ック図
【図2】本発明の実施例の文字認識装置の構成を示すブ
ロック図
【図3】本発明の実施例の文節評価値演算部の構成を示
すブロック図
【図4】本発明の実施例の単語頻度評価部の構成を示す
ブロック図
【図5】本発明の実施例の文節長評価部の構成を示すブ
ロック図
【図6】本発明の実施例の文節探索図
【図7】従来の単語頻度評価部の構成を示すブロック図
【図8】従来の文節長評価部の構成を示すブロック図
【図9】従来の文節選択部の構成を示すブロック図
【符号の説明】
1 接続文節検索部 2 接続評価値導出部 3 接続評価値比較部 11 文字認識部 12 文節検索部 13 文節評価値演算部 14 文節選択部 15 単語辞書 16 文法辞書 17 文字修正部 21 単語頻度評価部 22 文節長評価部 23 文字評価部 24 単語長評価部 25 文節評価値導出部 31 単語頻度検索部 32 非線形処理部 33 品詞検索部 34 付属語検索部 35 文節長導出部 36 文節評価値導出部 41 単語頻度検索部 42 文節長導出部 51 探索木生成部 52 接続可能文節探索部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 〆木 泰治 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書画像を認識して1文字に付きN個の候
    補文字を出力する文字認識部と、候補文字列の集合から
    語彙的及び文法的に正しい文節を検索する文節検索部
    と、文節の語彙的および文法的な正しさを計算する文節
    評価値演算部と、文節の評価値を基準にして文節を選択
    し修正文字列を出力する文節選択部とを備えた文字認識
    装置において、前記文節選択部が、ある文節に接続する
    文節を検索する接続文節検索部と、接続する文節の系列
    の評価値を求める接続評価値導出部と、接続評価値を比
    較する接続評価値比較部とを備えたことを特徴とする文
    字認識装置。
  2. 【請求項2】文書画像を認識して1文字に付きN個の候
    補文字を出力する文字認識部と、候補文字列の集合から
    語彙的及び文法的に正しい文節を検索する文節検索部
    と、文節の語彙的および文法的な正しさを計算する文節
    評価値演算部と、文節の評価値を基準にして文節を選択
    し修正文字列を出力する文節選択部とを備えた文字認識
    装置において、前記文節評価値演算部が、文節から文節
    中に含まれる単語の頻度を検索する単語頻度検索部と、
    単調増加関数f(x)は xが大きくなるにしたがってx の増
    加分に対するf(x)の増加分が小さくなる関数で、単語の
    頻度を関数f(x)で非線形処理する非線形処理部からな
    る、文節中の単語頻度を評価する単語頻度評価部を含む
    ことを特徴とする文字認識装置。
  3. 【請求項3】文書画像を認識して1文字に付きN個の候
    補文字を出力する文字認識部と、候補文字列の集合から
    語彙的及び文法的に正しい文節を検索する文節検索部
    と、文節の語彙的および文法的な正しさを計算する文節
    評価値演算部と、文節の評価値を基準にして文節を選択
    し修正文字列を出力する文節選択部とを備えた文字認識
    装置において、前記文節評価値演算部が、文節から文節
    中に含まれる単語の品詞を検索する品詞検索部と、文節
    中に含まれる付属語の数を調べる付属語検索部と、文節
    の長さを求める文節長導出部と、付属語の数と文節の長
    さから文節の数が多くなれば文節長評価値を小さくし、
    文節の長さが長くなれば文節長評価値を大きくする、文
    節長評価値を出力する文節長評価値導出部からなる、文
    節の文節長を評価する文節長評価部を含むことを特徴と
    する文字認識装置。
JP01461092A 1992-01-30 1992-01-30 文字認識装置 Expired - Fee Related JP3264961B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01461092A JP3264961B2 (ja) 1992-01-30 1992-01-30 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01461092A JP3264961B2 (ja) 1992-01-30 1992-01-30 文字認識装置

Publications (2)

Publication Number Publication Date
JPH05205109A true JPH05205109A (ja) 1993-08-13
JP3264961B2 JP3264961B2 (ja) 2002-03-11

Family

ID=11865971

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01461092A Expired - Fee Related JP3264961B2 (ja) 1992-01-30 1992-01-30 文字認識装置

Country Status (1)

Country Link
JP (1) JP3264961B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111399A1 (ja) * 2007-03-14 2008-09-18 Kabushiki Kaisha Toshiba 単語認識方法および単語認識プログラム
JP2012008909A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008111399A1 (ja) * 2007-03-14 2008-09-18 Kabushiki Kaisha Toshiba 単語認識方法および単語認識プログラム
JP2008226030A (ja) * 2007-03-14 2008-09-25 Toshiba Corp 単語認識方法および単語認識プログラム
JP4672692B2 (ja) * 2007-03-14 2011-04-20 株式会社東芝 単語認識システムおよび単語認識プログラム
US8208685B2 (en) 2007-03-14 2012-06-26 Kabushiki Kaisha Toshiba Word recognition method and word recognition program
JP2012008909A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム

Also Published As

Publication number Publication date
JP3264961B2 (ja) 2002-03-11

Similar Documents

Publication Publication Date Title
US11182435B2 (en) Model generation device, text search device, model generation method, text search method, data structure, and program
US7818332B2 (en) Query speller
US6879951B1 (en) Chinese word segmentation apparatus
US5832428A (en) Search engine for phrase recognition based on prefix/body/suffix architecture
CN110046351B (zh) 规则驱动下基于特征的文本关系抽取方法
US7401019B2 (en) Phonetic fragment search in speech data
CN1979638A (zh) 一种语音识别结果纠错方法
CN109977220B (zh) 一种基于关键句和关键字的反向生成摘要的方法
Bahl et al. Recognition of continuously read natural corpus
Fusayasu et al. Word-error correction of continuous speech recognition based on normalized relevance distance
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
JPH05205109A (ja) 文字認識装置
CN116340507A (zh) 一种基于混合权重和双通道图卷积的方面级情感分析方法
Byambakhishig et al. Error correction of automatic speech recognition based on normalized web distance
US6757647B1 (en) Method for encoding regular expressions in a lexigon
JP3080066B2 (ja) 文字認識装置、方法及び記憶媒体
JP3123181B2 (ja) 文字認識装置
JPH11338498A (ja) 音声合成装置
JP3339879B2 (ja) 文字認識装置
JPH06102897A (ja) 連続文音声認識方式
CN115630635B (zh) 一种基于检索和多阶段的中文文本校对方法、系统及设备
JPH10232693A (ja) 音声認識装置
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPH1049187A (ja) 音声情報検索装置
KR20040008546A (ko) 연속 음성인식 기기의 오인식 수정 방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees