JP2895486B2 - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JP2895486B2
JP2895486B2 JP63087129A JP8712988A JP2895486B2 JP 2895486 B2 JP2895486 B2 JP 2895486B2 JP 63087129 A JP63087129 A JP 63087129A JP 8712988 A JP8712988 A JP 8712988A JP 2895486 B2 JP2895486 B2 JP 2895486B2
Authority
JP
Japan
Prior art keywords
character
candidate
processing
candidate character
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63087129A
Other languages
English (en)
Other versions
JPH01259477A (ja
Inventor
敏明 矢ヶ崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP63087129A priority Critical patent/JP2895486B2/ja
Publication of JPH01259477A publication Critical patent/JPH01259477A/ja
Application granted granted Critical
Publication of JP2895486B2 publication Critical patent/JP2895486B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は文字処理方法に関し、更に詳しくは、入力文
字を認識するための識別処理の算出結果に基づいて、後
処理の実行を制御する文字処理方法に関する。
[従来の技術] 従来、文字認識装置においては、まず入力文字を認識
するための識別処理を実行し、該入力文字に対して複数
の候補文字を選出し、次に、識別処理で選出された複数
の候補文字から後処理によつて単語辞書をアクセスし、
もつとも単語らしきものを最終候補文字として選出する
ことがなされている。
第6図に従来の文字認識装置の構成図を示す。
スキヤナ等の画像入力部10から入力された文字イメー
ジは、前処理部11による文字の切り出しや正規化等の前
処理の後、特徴抽出部12でベクトル等による特徴の抽出
をする。この特徴と予め格納された標準文字イメージの
特徴とを比較して、候補文字選出部13で候補文字が選出
される。候補文字は全て後処理部15に送られ、単語比較
部15aで前後の候補文字と共に予め格納された単語パタ
ーンと比較され、最終文字選出部15bで最終文字が認識
結果として文字出力部16に出力される。
[発明が解決しようとしている課題] しかしながら、上記従来例では、すべての入力文字に
対して、識別処理の後単語単位の後処理を実行するた
め、単語が複数にまたがりさらに候補文字が複数個ある
ような場合には、その組合せが多く処理時間の莫大な増
加が考えられる。さらに、組合せが多くなれば意味のあ
る単語も多くなり、得られた候補単語の中から最終結果
を選出するためには、別のパラメータも必要となつてく
るし、文章単位で単語の関連性を考慮するような処理系
も考えなくてはならない。
前述の課題をさらに詳細に述べると第7図(a),
(b)のようになる。つまり、第7図(a)のように入
力文字として“文字”というデータを入力すると、識別
処理において“文”は第1位候補文字として“文”、第
2候補文字として“丈”、以下複数個の候補文字が選出
される。“字”も同様に候補文字の選出が行われる。次
に、選出された候補文字は、上位から数文字(例えば第
5位まで)選出され後処理を実行する。そして、2文字
の組合せをつくり、組合せごとに単語辞書をアクセスし
てマツチングをとる。この結果一致したものが単語候補
文字として選出され、その内の第一候補単語を出力す
る。この場合、第7図(b)のように候補単語は、文字
ごとの候補順位の小さいほうの組合せが上位にくる。
ところが、上述したように例えば1文字に対して第5
位候補文字までを選出すると2文字で25通りの組合せが
あり、第10位までにすると100通りと組合せがべき乗で
増大する。そのため、処理スピードが極めて遅くなるば
かりでなく、組合せにより単位辞書にマツチする単語が
増えると、1つの単語だけでなく文章単位の選択という
処理を考える必要があり、処理系も複雑になつていく。
本発明は、上記従来例の欠点を除去し、簡単な構成で
処理速度を落とすことなく、誤認識を少なくする文字処
理方法を提供することを目的とする。
更に詳細には、後処理する価値のある候補文字を正し
く選択することを可能とし、より効率的な後処理を実現
する文字処理方法を提供することを目的とする。
[課題を解決するための手段] 上記の目的を達成するための本発明の一態様による文
字認識方法は、入力パターンと文字辞書パターンとをマ
ッチングすることにより識別された候補文字の距離計算
値と、他順位の候補文字の距離計算値との相対的な値で
あるエラー率を求め、 該求めたエラー率を複数の候補文字に共通な所定の閾
値と比較することにより判断される大小関係に従って、
前記入力パターンの候補文字を、他入力パターンから識
別された候補文字との関連を判断する単語マッチング処
理に用いるか否かを決定し、 前記単語マッチング処理に用いると決定された場合、
当該入力パターンから識別された候補文字と他入力パタ
ーンから識別された候補文字とを組み合わせた文字列を
生成して後処理を行い、結果を出力する。
[作用] かかる構成によれば、入力パターンに従って識別され
た候補文字の距離計算値と、他順位の候補文字の距離計
算値との相対的な値であるエラー率が算出され、当該入
力パターンに関る候補文字を他入力パターンから識別さ
れた候補文字との関連を判断する単語マッチング処理に
用いるか否かが、このエラー率を複数の候補文字に共通
な所定の閾値と比較することにより判断される大小関係
に従って決定される。このため、単語マッチング処理す
る価値のある候補文字を得た入力パターンを選択して単
語マッチング処理を実行することが可能となり、より効
率的な単語マッチング処理を実現できる。
[実施例] 第1図は本実施例の文字認識装置の構成図である。ス
キヤナ等の画像入力部10から入力された文字イメージ
は、前処理部11による文字の切り出しや正規化等の前処
理の後、特徴抽出部12でベクトル等による特徴の抽出を
する。この特徴と予め格納された標準文字イメージの特
徴とを比較して、候補文字選出部13で候補文字が選出さ
れる。候補文字評価部14は、全候補文字の中から後処理
を行う候補文字を選択し、後処理部15に送る。単語比較
部15aで前後の候補文字と共に予め格納された単語パタ
ーンと比較され、最終文字選出部15bで最終文字が認識
結果として文字出力部16に出力される。
尚、候補文字評価部14と文字出力部16を繋ぐ点線は、
候補文字評価部14での評価に従つて後処理部15をバイパ
スする第1実施例を表している。
第2図(a)は、本実施例の文字認識装置のハードウ
エア構成を示す図である。図中、1は文書原稿の入力す
るスキヤナ、2は該スキヤナを制御するスキヤナ・イン
タフエースである。3は装置全体をコントロールするた
めのマイフロプロセツサ(CPU)、4はプログラムが格
納されているプログラムメモリ。9はCPU3によりスキヤ
ナ1が動作した場合に、該スキヤナ1からの読み取つた
イメージデータを格納しておくイメージメモリである。
CPU3は、該イメージメモリ9に格納された画像データか
ら文字画像データを1文字づつ分離して、文字辞書5に
格納された文字イメージをアクセスし識別処理を行う。
その結果を評価した後、距離の小さい順(識別処理にお
ける入力文字の確度が大きい順)に単語辞書6に格納さ
れた単語を基に後処理を行う。
後処理では、入力した候補文字と、この前にすでに入
力してきている候補文字で単語をつくり、あり得る単語
を捜す。その結果は、CRT・インタフエース7を介してC
RT8に表示するような構成になつている。
〈第1実施例〉 本実施例では、候補文字評価部14で、識別処理によつ
て得られた距離計算値に対してエラー率を算出し、該結
果に応じた処理系、例えば後処理を実行しなかつたり、
それぞれの入力文字に対して異なる候補文字において後
処理の実行を行うものである。
第3図は本実施例の文字認識装置の処理フローチヤー
トである。ステツプS10の画像入力はスキヤナ1によつ
て実行される。そしてイメージメモリ9に格納され、ス
テツプS11で文字の切出しが実行される。これにより1
文字ずつに分離され、さらにステツプS12で文字辞書5
に格納されている標準パターンの大きさに文字をそろえ
るための正規化が実行される。正規化された文字パター
ンは、情報収縮のためステツプS13で文字辞書5に格納
されている文字サイズのものと同一のベクトル空間に展
開するための特徴抽出が実行される。
ステツプS14でこの特徴抽出された特徴ベクトルと文
字辞書5による識別が実行される。ステツプS15では、
該結果をもとにソーテイングが実行されて候補文字選出
が行われ、ステツプS16で前述のエラー率が計算され、
このエラー率を基にステツプS17で後処理の実行の有無
が決定される。ステツプS17,S18では、エラー率が所定
の値αより小さい候補文字を選び、ステツプS19で選ば
れた候補文字の1つを後処理をせずに表示する。
尚、単語を形成する第1番目の文字のときは、ここで
バツフアリングされ、次の文字候補の入力を待つ。第2
番目の文字が複数の文字候補のときは、第1番目の文字
候補とともに後処理に送られる。この場合、第1位候補
のみしか選出されないときは、後処理部15を経ないで単
語が決定され表示される。
ここでエラー率の求め方について説明する。エラー率
というのは事後確率であり理論的に求まる。事後確率
は、 となる。ここで、wiはi番目の文字クラス、xは特徴ベ
クトルである。
すべての事前確率は等しいことを前提とすると、 i=1の場合は、第一位候補文字の事後確率となる。
これから、ベイス識別のときは、 となる条件付き確率が得られる。ここで、g(i)(x)は
識別関数で、距離計算値をあてはめることにより、 エラー率は、 で求められる。従つて、Perr>T1として所定値T1(フロ
ーチヤートではαで示す)を与えることで本実施例を実
行する。
〈第2実施例〉 本実施例では、候補文字評価部14で、それぞれの候補
文字と第1位候補文字との演算結果の差分が計算され
る。そして、この差分が所定の値より大きくなったとこ
ろで候補文字の決定を中止し、該候補文字の決定が中止
されるまえまでの候補文字が後処理に送られる。従つ
て、ともに第1位候補のみしか選出されないときは、後
処理部には1文字だけとなる。
第4図は本実施例の処理フローチヤートである。尚、
ステツプS16までは第3図のフローチヤートと同様なの
で省く。ステツプS21でn=2に初期設定され、ステツ
プS22で差分が計算される。ステツプS23で差分が所定値
βより小さい場合は、ステツプS24でnをカウントアツ
プし、これを繰り返す。差分が所定値βより大きくなる
と、ステツプS25で後処理の実行の候補文字数が決定さ
れ、ステツプS26で表示される。
ここで、差分の求め方について説明する。差分は、エ
ラー率である事後確率から理論的に求まる。事後確率
は、前述した如く、 である。ここでは、式の簡略化を考慮して以下のように
する。
ここで、g(j)(x)は識別演算による演算結果であ
り、 のとき、エラー率が高くなる。つまり、これは第1位候
補文字と第2位候補文字との演算結果の差分、あるいは
第1位候補文字と第3位候補文字との演算結果の差分で
ある。これを各候補文字に対して実行する。従つて、上
記T2,T3の値を決定することで第1位と第2位、第1位
と第3位…の差分が所定より小さいとき後処理を実行す
る構成とする。尚、T2,T3は同一の値でもよい。
第2図(b)は本実施例の候補文字評価部14をハード
ウエアで実現したブロツク図である。候補文字選出部13
でソーテイングした全候補文字は、カウンタ113に同期
しながら1文字づつの候補文字メモリ111に格納され
る。格納された第1位候補文字は、セレクタ112の切り
換えで第1位データラツチ114と後処理用メモリ119に転
送される。次降のデータは第2位以降データラツチ115
へ転送され、減算器116で減算されたのち基準値118と比
較され所定値以下の場合のみゲート120が開いて、後処
理メモリ119に転送される。この操作により、後処理メ
モリ119には、基準値118のデータを越えた候補文字は転
送されないことになる。尚、通信路121は第3実施例の
ためのものである。
〈第3実施例〉 本実施例においては、候補文字評価部14において、隣
接する候補文字との差分が計算される。そして、この差
分が所定の値より大きくなつたところで候補文字の決定
を中止し、該差分の実行されるまえまでの候補文字が後
処理に送られる。従つて、ともに第1位候補文字のみし
か選出されないときは、後処理部には第1位候補文字だ
けとなる。
本実施例においては、第1位と第2位,第2位と第3
位というように隣接成分の差分を計算することにより、
後者の文字(第2位,第3位)が前者の文字(第1位,
第2位)と比べてどれだけ近い値になつているかを調べ
ることに主眼をおいている。そのため、エラー率の計算
値の近さが検査される。つまり、候補文字の計算値が得
られた場合、第2位と第1位とが近く第3位と第1位と
は差分が大きいかもしれないが、第3位と第2位とは近
いという場合があるので、全体のエラー率ではある程度
大きくなつても、隣接成分の近さというものに重点を置
き候補文字を選出する。従つて、第3位候補文字の決定
の仕方は、第2実施例で示した計算式で第1位候補文字
を除いて計算されたものと同じことになる。
第5図は本実施例の処理フローチヤートである。尚、
ステツプS16までは第3図のフローチヤートと同様なの
で省く。ステツプS31でm=1に初期設定され、ステツ
プS32で差分が計算される。ステツプS33で差分が所定値
γより小さい場合は、ステツプS34でnをカウントアツ
プし、これを繰り返す。差分が所定値γより大きくなる
と、ステツプS35で後処理の実行の候補文字数が決定さ
れ、ステツプS36で表示される。
第2図(b)は本実施例の候補文字評価部15をハード
ウエアで実現したブロツク図である。本実施例による
と、候補文字選出部13によつてソーテイングされた候補
文字データは、候補文字メモリ111に格納される。格納
が終了すると、1文字データごとセレクタ112を通して
第1位候補文字は第1位データ・ラツチ114に第2位以
降は最初は第二位以降データ・ラツチ115に送られる。
このとき減算処理116が実行されるときに、データ115
は通信路121を通して、第1位データ・ラツチ114に送ら
れる。この間、減算処理116を実行しているデータは、
処理後基準値118のデータと比較器117で大小関係が判定
される。このとき、基準値118より大きくなつた時に
は、ゲート120を閉じ後処理メモリ119にはデータを送な
らいようになつている。
つまり、第1位と第2位との差分、第2位と第3位と
の差分…が引きつづき小さいときは、後処理メモリ119
に候補文字が転送され、基準値を越えた時点でゲート12
0が閉じられることになる。
以上説明した本実施例による効果をまとめてみると、 (1)エラー率を計算することにより第一位候補文字に
対して後処理の実行がなくなるため高速になる。
(2)後処理による組合わせの回数が少なくなるため、
後処理による単語レベルの認識率の信頼性を向上する。
(3)組合せによる回数が少なくなるため高速性が保持
される。
(4)後処理の構成が簡略になる。つまり、複数の単語
レベルの候補文字の出てきた場合に前後関係の単語を考
慮しなくてはいけないが、その数が少なくなるために後
処理が簡単になる。
[発明の効果] 以上のように、本発明によれば、入力パターンと文字
辞書パターンとをマッチングすることにより識別された
候補文字の距離計算値と他順位の候補文字の距離計算値
との相対的な値であるエラー率を求め、このエラー率を
複数の候補文字に共通な所定の閾値と比較することによ
り判断される大小関係に従って、当該入力パターンの候
補文字を、他入力パターンから識別された候補文字との
関連を判断する単語マッチング処理に用いるか否かを決
定し、前記単語マッチング処理に用いると決定された場
合には当該入力パターンから識別された候補文字と他入
力パターンから識別された候補文字とを組み合わせた文
字列を生成して単語マッチング処理を行うようにした。
このため、単語マッチング処理する価値のある候補文字
を得た入力パターンを選択して単語マッチング処理を実
行することができるようになり、不要な後処理の実行を
防止でき、より効率的な単語マッチング処理を実現でき
る。
また、本発明によれば、文字辞書パターンとマッチン
グすることにより、一つの入力パターンから識別される
複数の候補文字を、各候補文字の距離計算値に従ってソ
ートし、ソートの結果、第一位となる候補文字の距離計
算値と、他順位の候補文字の各距離計算値との差分を求
め、求めた差分を複数の候補文字に共通な所定の閾値と
比較することにより判断される大小関係に従って、当該
候補文字を、他入力パターンから識別された候補文字と
の関連を判断する単語マッチング処理に用いるか否かを
決定する。このため、第一位候補文字と他順位の候補文
字との距離計算値のバランスにより単語マッチング処理
する価値のある候補文字を選択することができるので、
不要な単語マッチング処理の実行を防止でき、より効率
的な単語マッチング処理を実現できる。
また、本発明によれば、文字辞書パターンとマッチン
グすることにより、一つの入力パターンから識別される
複数の候補文字を、各候補文字の距離計算値に従ってソ
ートし、ソートの結果、順位の高い順に隣接する2つの
候補文字の距離計算値の差分を求め、求めた差分を複数
の候補文字に共通な所定の閾値と比較することにより判
断される大小関係に従って、当該候補文字を、他入力パ
ターンから識別された候補文字との関連を判断する単語
マッチング処理に用いるか否かを決定する。このため、
順位の高い順に隣接する候補文字の距離計算値のバラン
スにより単語マッチング処理する価値のある候補文字を
選択することができるので、不要な単語マッチング処理
の実行を防止でき、より効率的な単語マッチング処理を
実現できる。
また、本発明によれば、エラー率或いは差分と所定の
閾値との大小関係を判定した後にのみ前記単語マッチン
グ処理を行うことにより、不必要に単語マッチング処理
を行なうことが防止される。このため、例えば、正しく
識別されたにもかかわらず単語マッチング処理で誤認識
であると判断されてしまうというような事態(これは、
例えば、識別された候補文字の識別結果に関する正当性
を評価する前に単語マッチング処理を行なうことで発生
し得る)の発生を防止できる。
また、本発明によれば、単語マッチング処理を行うこ
とにより、文字単独の距離計算のみならず、単語単位で
その文字の正当性を評価できるので、より確実な結果を
得ることができる。
また、本発明によれば、前記エラー率は、入力パター
ンが当該候補文字以外の文字である確率を表す値とする
ことにより、候補文字となり得る文字全体とのバランス
でその候補文字の単語マッチング処理の要否を判断で
き、その判断がより確実に行えるようになる。
また、本発明によれば、前記大小関係を、エラー率或
いは差分と、複数の候補文字に共通な所定の閾値との比
較により判断するので、処理を簡略化することができ
る。
また、候補文字の距離計算値の差分を計算して単語マ
ッチング処理の実行の要否を決定する構成では、エラー
率を演算する場合に比べて処理が簡素化される。
【図面の簡単な説明】
第1図は本実施例の文字認識装置のブロツク構成図、 第2図(a)は本実施例の文字認識装置のハードウエア
構成図、 第2図(b)は本実施例の文字認識装置の候補文字評価
部の構成例図、 第3図は第1実施例の処理フローチヤート、 第4図は第2実施例の処理フローチヤート、 第5図は第3実施例の処理フローチヤート、 第6図は従来例の文字認識装置のブロツク構成図、 第7図(a),(b)は従来例の文字認識を説明する図
である。 図中、1……スキヤナ、2……スキヤナ・インタフエー
ス、3……CPU、4……プログラムメモリ、5……文字
辞書、6……単語辞書、7……CRT・インタフエース、
8……CRT、9……イメージメモリ、10……画像入力
部、11……前処理部、12……特徴抽出部、13……候補文
字選出部、14……候補文字評価部、15……後処理部、15
a……単語比較部、15b……最終文字選出部、16……文字
出力部、20……候補文字選出部である。

Claims (14)

    (57)【特許請求の範囲】
  1. 【請求項1】入力パターンと文字辞書パターンとをマッ
    チングすることにより識別された候補文字の距離計算値
    と、他順位の候補文字の距離計算値との相対的な値であ
    るエラー率を求め、 該求めたエラー率を複数の候補文字に共通な所定の閾値
    と比較することにより判断される大小関係に従って、前
    記入力パターンの候補文字を、他入力パターンから識別
    された候補文字との関連を判断する単語マッチング処理
    に用いるか否かを決定し、 前記単語マッチング処理に用いると決定された場合、当
    該入力パターンから識別された候補文字と他入力パター
    ンから識別された候補文字とを組み合わせた文字列を生
    成して後処理を行い、結果を出力することを特徴とする
    文字処理方法。
  2. 【請求項2】前記エラー率の大小関係を判定した後にの
    み前記後処理を行うことを特徴とする請求項1に記載の
    文字処理方法。
  3. 【請求項3】前記エラー率は、入力パターンが当該候補
    文字以外の文字である確率を表す値とすることを特徴と
    する請求項1に記載の文字処理方法。
  4. 【請求項4】文字辞書パターンとマッチングすることに
    より、一つの入力パターンから識別される複数の候補文
    字を、各候補文字の距離計算値に従ってソートし、 前記ソートの結果、第一位となる候補文字の距離計算値
    と、他順位の候補文字の距離計算値との差分を求め、 前記求めた差分を複数の候補文字に共通な所定の閾値と
    比較することにより判断される大小関係に従って、当該
    候補文字を、他入力パターンから識別された候補文字と
    の関連を判断する単語マッチング処理に用いるか否かを
    決定し、 前記単語マッチング処理に用いると決定された場合、当
    該候補文字と他入力パターンから識別された候補文字と
    を組み合わせた文字列を生成して単語マッチング処理を
    行い、結果を出力することを特徴とする文字処理方法。
  5. 【請求項5】前記差分の大小関係を判定した後にのみ前
    記単語マッチング処理を行うことを特徴とする請求項4
    に記載の文字処理方法。
  6. 【請求項6】文字辞書パターンとマッチングすることに
    より、一つの入力パターンから識別される複数の候補文
    字を、各候補文字の距離計算値に従ってソートし、 前記ソートの結果、順位の高い順に隣接する2つの候補
    文字の距離計算値の差分を求め、 前記求めた差分を複数の候補文字に共通な所定の閾値と
    比較することにより判断される大小関係に従って、当該
    候補文字を、他入力パターンから識別された候補文字と
    の関連を判断する単語マッチング処理に用いるか否かを
    決定し、 前記単語マッチング処理に用いると決定された場合、当
    該候補文字と他入力パターンから識別された候補文字と
    を組み合わせた文字列を生成して単語マッチング処理を
    行い、結果を出力することを特徴とする文字処理方法。
  7. 【請求項7】前記差分の大小関係を判定した後にのみ前
    記後処理を行うことを特徴とする請求項6に記載の文字
    処理方法。
  8. 【請求項8】入力パターンと文字辞書パターンとをマッ
    チングすることにより識別された候補文字の距離計算値
    と、他順位の候補文字の距離計算値との相対的な値であ
    るエラー率を求めるエラー率導出手段と、 前記エラー率導出手段により求めたエラー率を複数の候
    補文字に共通な所定の閾値と比較することにより判断さ
    れる大小関係に従って、前記入力パターンの候補文字
    を、他入力パターンから識別された候補文字との関連を
    判断する単語マッチング処理に用いるか否かを決定する
    決定手段と、 前記決定手段により単語マッチング処理に用いると決定
    された場合、当該入力パターンから識別された候補文字
    と他入力パターンから識別された候補文字とを組み合わ
    せた文字列を生成して単語マッチング処理を行い、結果
    を出力する後処理手段とを有することを特徴とする文字
    処理装置。
  9. 【請求項9】前記後処理手段は、エラー率の大小関係を
    判定した後にのみ前記単語マッチング処理を行うことを
    特徴とする請求項8に記載の文字処理装置。
  10. 【請求項10】前記エラー率導出手段は、入力パターン
    が当該候補文字以外の文字である確率を表す値をエラー
    率として求めることを特徴とする請求項8に記載の文字
    処理装置。
  11. 【請求項11】文字辞書パターンとマッチングすること
    により、一つの入力パターンから識別される複数の候補
    文字を、各候補文字の距離計算値に従ってソートするソ
    ート手段と、 前記ソート手段によるソートの結果、第一位となる候補
    文字の距離計算億と、他順位の候補文字の距離計算値と
    の差分を求める差分導出手段と、 前記差分導出手段により求めた差分を複数の候補文字に
    共通な所定の閾値と比較することにより判断される大小
    関係に従って、当該候補文字を、他入力パターンから識
    別された候補文字との関連を判断する単語マッチング処
    理に用いるか否かを決定する決定手段と、 前記決定手段により単語マッチング処理に用いると決定
    された場合、当該候補文字と他入力パターンから識別さ
    れた候補文字とを組み合わせた文字列を生成して単語マ
    ッチング処理を行い、結果を出力する後処理手段とを有
    することを特徴とする文字処理装置。
  12. 【請求項12】前記後処理手段は、差分の大小関係を判
    定した後にのみ前記単語マッチング処理を行うことを特
    徴とする請求項11に記載の文字処理装置。
  13. 【請求項13】文字辞書パターンとマッチングすること
    により、一つの入力パターンから識別される複数の候補
    文字を、各候補文字の距離計算値に従ってソートするソ
    ート手段と、 前記ソート手段によるソートの結果、順位の高い順に隣
    接する2つの候補文字の識別演算値の差分を求める差分
    導出手段と、 前記差分導出手段により求めた差分を複数の候補文字に
    共通な所定の閾値と差分とを比較することにより判断さ
    れる大小関係に従って、当該候補文字を、他入力パター
    ンから識別された候補文字との関連を判断する単語マッ
    チング処理に用いるか否かを決定する決定手段と、 前記決定手段により単語マッチング処理に用いると決定
    された場合、当該候補文字と他入力パターンから識別さ
    れた候補文字とを組み合わせた文字列を生成して単語マ
    ッチング処理を行い、結果を出力する後処理手段とを有
    することを特徴とする文字処理装置。
  14. 【請求項14】前記後処理手段は、差分の大小関係を判
    定した後にのみ前記単語マッチング処理を行うことを特
    徴とする請求項13に記載の文字処理装置。
JP63087129A 1988-04-11 1988-04-11 文字認識方法及び装置 Expired - Lifetime JP2895486B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63087129A JP2895486B2 (ja) 1988-04-11 1988-04-11 文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63087129A JP2895486B2 (ja) 1988-04-11 1988-04-11 文字認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH01259477A JPH01259477A (ja) 1989-10-17
JP2895486B2 true JP2895486B2 (ja) 1999-05-24

Family

ID=13906354

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63087129A Expired - Lifetime JP2895486B2 (ja) 1988-04-11 1988-04-11 文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JP2895486B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0614375B2 (ja) * 1983-12-23 1994-02-23 株式会社日立製作所 文字入力装置
JPS62202285A (ja) * 1986-03-01 1987-09-05 Ricoh Co Ltd パタ−ン認識の後処理方式
JPS6330991A (ja) * 1986-07-25 1988-02-09 Matsushita Electric Ind Co Ltd 文字認識装置
JPH01311390A (ja) * 1988-06-10 1989-12-15 Toshiba Corp 文字置換制御方式

Also Published As

Publication number Publication date
JPH01259477A (ja) 1989-10-17

Similar Documents

Publication Publication Date Title
US20200160179A1 (en) Recognition system and recognition method
US11816078B2 (en) Automatic entity resolution with rules detection and generation system
US7689418B2 (en) Method and system for non-intrusive speaker verification using behavior models
CA3176868A1 (en) Intent identifying method and device for application to intelligent customer service robot
US7016827B1 (en) Method and system for ensuring robustness in natural language understanding
US8666744B1 (en) Grammar fragment acquisition using syntactic and semantic clustering
US11164564B2 (en) Augmented intent and entity extraction using pattern recognition interstitial regular expressions
US10984785B2 (en) Voice conversation method and system with enhanced word features
CN107229627B (zh) 一种文本处理方法、装置及计算设备
US11062120B2 (en) High speed reference point independent database filtering for fingerprint identification
WO2020233131A1 (zh) 问答处理方法、装置、计算机设备和存储介质
KR20210050884A (ko) 화자 인식을 위한 등록 방법 및 장치
US7873209B2 (en) Segment-discriminating minimum classification error pattern recognition
CN112784066A (zh) 基于知识图谱的信息反馈方法、装置、终端和存储介质
WO2021051877A1 (zh) 人工智能面试中获取输入文本和相关装置
WO2021257160A1 (en) Model selection learning for knowledge distillation
CN112632248A (zh) 问答方法、装置、计算机设备和存储介质
CN115687980A (zh) 数据表的脱敏分类方法、分类模型训练方法及装置
CN116991711A (zh) 一种测试用例的生成方法、装置、终端设备及存储介质
US5375173A (en) Speaker adapted speech recognition system
KR20040068548A (ko) 행동 모델을 사용한 비-개입적 화자 인증 방법 및 시스템
JP2895486B2 (ja) 文字認識方法及び装置
WO2022044955A1 (en) Systems and methods for multilingual sentence embeddings
JPH09245125A (ja) パターン認識装置及び同装置における辞書修正方法
CN111858966B (zh) 知识图谱的更新方法、装置、终端设备及可读存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080305

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090305

Year of fee payment: 10