JPH02214990A - パターン認識後処理方式 - Google Patents

パターン認識後処理方式

Info

Publication number
JPH02214990A
JPH02214990A JP1036735A JP3673589A JPH02214990A JP H02214990 A JPH02214990 A JP H02214990A JP 1036735 A JP1036735 A JP 1036735A JP 3673589 A JP3673589 A JP 3673589A JP H02214990 A JPH02214990 A JP H02214990A
Authority
JP
Japan
Prior art keywords
category
correction
candidate
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1036735A
Other languages
English (en)
Inventor
Akira Suzuki
章 鈴木
Fumihiko Kobashi
小橋 史彦
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP1036735A priority Critical patent/JPH02214990A/ja
Publication of JPH02214990A publication Critical patent/JPH02214990A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文字や音声などのパターン認識に関し、より詳
細には、パターン認識結果の誤りを操作者が訂正した際
の情報を利用して以後のパターン認識結果の誤りを自動
訂正するパターン認識後処理方式に関する。
〔従来の技術〕
近年、オフィスオートメーション化の発達に伴い、文字
や音声の認識が広く研究され、一部実用化されている。
文字や音声の認識は、これらをパターン化してパターン
特徴量を抽出し、認識辞書に登録されている標準パター
ンと比較することにより候補文字や音声(以下、候補カ
テゴリという)を生成している。
通常、このようなパターン認識では認識率を向上させる
ため、特に誤認識しゃすいパターンについては、認識パ
ターン特微量を追加登録する処理が行われている。また
、候補カテゴリについて単語照合や形態素解析などの文
法処理を施すことによって、認識精度を上げることも提
案されている。
〔発明が解決しようとする課題〕
しかしながら、上記認識パターン特徴間を追加登録する
処理では、パターン特微量の情報量が多いため、新規の
パターン特微量の登録には、大きな容量の記憶領域を必
要とするという問題点があった。また、上記理由から、
認識処理に要する時間が増大してしまい、さらには、新
しいカテゴリ(文字や音声)のパターンを登録したため
に、かえって認識N度が低下してしまうという問題点が
あった。この認識精度の低下を避けるためには、そのパ
ターンを登録すべきか否かを確認する作業が必要となり
、その作業に時間がかるという問題点があった。
また文法処理を用いて認識精度を上げる従来技術は、候
補カテゴリ数が多くなるにしたがい、認識処理に要する
時間が急激に増大するという問題点や、候補カテゴリ中
に正解が存在しない場合、または認識辞書中に該当する
単語が存自しない場合、文法処理により得られた結果は
正しいが誤った文を生成する傾向が強いために、操作者
により訂正作業を困難にさせるという問題点があった。
。 さらに、上記従来のパターン認識ではいずれも、認識結
果の誤りを操作者が訂正したとぎの操作の情報は利用さ
れていなかった。
したがって、本発明は上記従来技術の課題を解決し、認
識結果の誤りを操作者が訂正したときの操作の情報を用
いて以後のパターン認識結果の誤りを自動訂正できるよ
うにし、認識辞書の容量を増大させることなく高速かつ
容易な操作で、高い認識精度を得ることを目的とする。
〔課題を解決するための手段〕
本発明は、音声や文字などの人カバターンを認識して単
数または複数の候補カテゴリを生成するパターン認識方
式を対象とする。
本発明では、まず誤って認識したパターンのカテゴリを
操作者が訂正する情報から、該カテゴリおよび該カテゴ
リの周囲に存在するパターンのカテゴリ集合に対する正
解カアゴリ列の関係を規定する訂正規則を自動抽出して
以後のパターン認識結果に適用する。
そして、前記訂正規則内の候補カテゴリ集合とパターン
認識結果内の候補カテゴリ集合が近似している場合、該
訂正規則の正解カテゴリ列でバタン認識結果の対応する
候補カテゴリ(例えば第1位候補カテゴリ)を詔き換え
る。
〔作用〕
例えば1記憶1を認識した結果、第1位・−第3位候補
カテゴリ集合が1“記憶」、「記憶」、「側照」に順に
得られたとする。操作者はこれを手動訂正して、「記憶
」という正解カテゴリ列に対し[紀、記、訓−1および
[憶、億、11!Jを規定する訂正規則を作成する。そ
して、ふたたび1゛記憶」を認識した結果、第1位〜第
3位候補カテゴリ集合が「記憶」、「測値」、「2臆」
の順に得られた場合、この1゛紀、訓、記」と訂正規則
の1゛紀。
記、訓−1との近似度をn1算する。近似している場合
には、この訂正規則1−紀、記、訓」に関する正解カテ
ゴリ列「記憶」で第1位の候補カアゴリI紀憶」を置き
換える。
〔実施例〕
以下、本発明の一実施例を図面を参照して訂細に説明す
る。
第1図は本発明のパターン認識後処即方式の一実施例の
ブロック図である。同図において、自動訂正部10は図
示しないパターン認ll装冒からのパターン認識結果を
入力し、訂正規則テーブル20中の訂正規則にしたがっ
て、入力したパターン認識結果を自動訂正する。自動訂
正した結果は、手動訂正11Jt[1部30へ出力され
る。なお、訂正規則テーブル20に入っている後述する
]正規I’llは、操作者がパターン認識結果を手動訂
正することにより順次自動生成、更新されるため、初期
(1回目)のパターン認識結果には適用されない1、ず
4【電 わち、1回目のパターン認識結果は自動訂正部10を介
してそのまま手動訂正制御部30に出力される。
訂正規則テーブル20は、自動訂正部10がパターン認
識結果を自動訂正する際の訂正規則を定める。前述した
ように、この訂正規則は操作者がパターン認識結果を手
動訂正することにより順次自動生成、更新される。
手動n正制御部30は自動訂正部10から出力された自
動訂正結果(又は1回目のパターン認識結果)を、操作
表示部40を介して操作者が与える訂正操作の指示にし
たがって訂正する。手動訂正制御部30は、初期のパタ
ーン認識結果に対する手動訂正の操作情報にしたがって
、後述する訂正規則を作成し、これを訂正規則テーブル
20に登録する。
操作表示部40はキーボード、マウスおよびデイスプレ
ィ等からなり、手動訂正制御部30からの情報をデイス
プレィ上に表示し、また手動訂正制御部30に対しキー
ボードやマウスから手動操作の指示等を与える。
第2図は、第1図に示す自動訂正部10の構成を示すブ
ロック図である。自動訂正部10は入力データバッファ
11.入力データレジスタ12゜訂正規則レジスタ13
.計算レジスタ14a、計算レジスタ14b、部分−政
変訂粋器152部分一致度レジスタ16.書き換え制御
部17.出力データバッフ718および制御部19を具
備して構成されている。
入力データバッノ711は、パターン認識にJ、り得ら
れる複数の候補カテゴリを格納する。入力データレジス
タ12は複数の候補カテゴリの同一番号(パターン上の
同じ位置)の候補カテゴリ集合を格納する。訂正規則レ
ジスタ13は、第1図に示す訂正規則テーブル20から
読み出した訂正規則を格納する。訂正規則は正解カテゴ
リ列と、正解カテゴリ列中の各カテゴリに関する候補カ
テゴリ列集合とからなる。計算レジスタ14aは、入力
データレジスタ12から読み出した同一位置の候補カテ
ゴリ集合を格納する1、計算レジスタ14bは、訂正規
則レジスタ13から読み出した同−位置の候補カテゴリ
列集合を格納する。部分−成度計算器15は、計算レジ
スタ14aと計算レジスタ14bの候補カテゴリ集合間
の部分−政変(この定義については後述する)を計算す
る。
部分一致度レジスタ16は、部分−成度計算器15で計
算した部分−政変を格納する。出力データバッフ718
は、入力データバッフ711から読み出した候補カテゴ
リを格納する。書き換え制御部17は、部分一致度レジ
スタ16中の部分−政変のうち最小ものが所定のしきい
値を越えた場合には、この最小のしきい値に関する正解
カテゴリ列で出力データバッフ?中の対応する候補カテ
ゴリを置き換える。制御部19Gよ後述する第6図のフ
ローヂャートに従い、各部を制御する。
次に、本実施例の動作を説明する。本実施例は文字や音
声のパターン認識処理のいずれにも適用できるが、以下
の説明では入力パターンとして文字パターンを処理する
場合について説明する。
図示しない文字認識装置からの文字認識結果は、まず第
1図に示す自動訂正部10に入力される。
自動訂正部10は訂正規則テーブル20を参照しながら
、誤認識文字を自動訂正する。前述したJ、うに、自動
訂正部10は初期の認識結果に対しては動作せず、文字
認識結果はそのまま手動n正制御部30に送られる。
第3図(A)は、入力文章[文字を記憶する・・・」を
文字認識した認識結果aに対する操作者の手動訂正操作
および訂正規則生成の手順を示す。また、第3図(B)
は操作表示部40のデイスプレィ画面上の表示例を示す
手動訂正は、第4図に示す手順に従って行われる。手動
訂正制御部30は、各文字の認識結果の第1位候補文字
を、第3図(B)の左側のデイスプレィ表示例に示すよ
うに操作表示部40のデイスプレィに表示する(第4図
のステップ101)。
次に、このデイスプレィに表示された文字を見て、操作
者は操作部40のキーボード、マウス等を用いて誤認識
文字を手動訂正する(ステップ102)。
訂正の方法は、正解が候補文字集合にある場合は次候補
を順次表示して選択する(本例では、第3位まで候補文
字を用いている)ことにより、また正解が候補文字集合
中に存在しない場合はかな漢字変換入力などにより、正
解文字を入力する。手動訂正結果を第3図(B)の右側
のデイスプレィ表示例に足す。手動訂正が終了したら、
操作者は操作表示部40のキーボード等から手動訂正ル
リ御部30に、手動訂正終了信号を送る。
操作表示部40から手動訂正終了の信号が送られてくる
と、手動訂正1illI11部30では操作者が訂正し
た文字、およびその文字に隣接する単数または複数の文
字(これを隣接文字群と呼ぶこととする)の認識結果の
候補文字集合と正解文字との関係をJ正規用として作成
し、訂正規則テーブル20に登録する。隣接文字群の範
囲の決定方法はいくつか考えられるが、例としてここで
は操作者が訂正した文字に隣接する同一字種の文字すべ
てを含めることとする。第3図の場合、入力文章「文字
を記憶する1の中の「記」が「紀」と誤って認識されて
いるので操作者によりn止とれ、この操作の情報により
訂正規則が1個生成される。この場合、訂正された文字
[記1は漢字であるので、隣接文字群は「憶」のみとな
る。したがって、1記憶」を認識した結果の2つの候補
文字集合「紀。
記、訓」および「憶、億、臆」の2つと、操竹者が訂正
入力した[記、1および操作者が正解であると認識した
「憶」からなる]正規則が作成される。
訂正規則テーブル20の内容に一部を第3図(A)に示
す。訂正規則テーブル20は訂正規則番号、正解文字列
および候補文字列集合を有する。。
候補文字列集合は正解文字列の各文字ごとに、候補集合
番号および第1候補から第3候補を有する1、このよう
にして作成された訂正規則テーブル20を用いて、入力
する文字認識結果を以下のとおり自動訂正する。この自
動訂正処理を第5図および第6図を参照して説明する。
ここで、第5図は自動訂正時のデータの流れの一例を示
す図、J3よび第6図は自動訂正の処理手順を示すフロ
ーチャートである。
まず、入力データバッフ711の第1候補文字からなる
文字列を出力データバツ゛ノア18に入れる(第5図お
よび第6図のステップ111)。次に、第2図の$11
11部19の内部レジスタSを出力データバッフ718
の文字数にセツ1〜する(ステップ112)。次に、f
lil 1111部19の内部カウンタIを1にセット
する(ステップ113)。次に、iの値が訂正規則個数
を越えているかどうかを判定する(ステップ114)。
この条件が成立する場合は訂正規則テーブル20内に訂
正規則が存在しないので、処理を終了する。ステップ1
140条件が成立しない場合はステップ115に進み、
訂正規則テーブル20の先頭から1番目の訂正規則を訂
正規則レジスタ13に入れる。そして、この訂正規則の
正解文字列の文字数をNとする。第5図の例で4よN=
2となる。次に、制御部19の内部カウンタKを1にセ
ットする(ステップ116)。そして、K=S−N+1
が成立するかどうかを調べる(ステップ117)。この
条件が成立するときはステップ119に進み、内部カウ
ンタiを1だけインクリメントする。そしてステップ1
14に戻る。一方、ステップ1170条件が不成立のと
きはステップ118の処理を行う。ステップ118では
、入力文字の認識結果の先頭からに番目の位置から、N
個分の候補文字列集合を取り出し、入力データレジスタ
12に入れる。第5図の処理では、入カデータバツフ?
11中の文字番号4と5の候補文字集合が入力データレ
ジスタ12に格納されている。イして、制御部19の内
部レジスタLを1にセツ1〜する(ステップ120)。
次に、入力データレジスタ12の先頭からし一番目の候
補文字列集合を計算レジスタ14.8に入れ、訂正規則
レジスタ13の先頭からL番目の候補文字集合を4算レ
ジスタ14bに入れる(ステップ121)。第5図の例
では、計算レジスタ14.8に人力データレジスタ12
の1番目の候補文字集合[紀1.[訓−1,[記lが格
納され、5″1算レジスタ14bに訂正規則レジスタ1
301番目の候補文字列集合[紀J、[記−1,[訓1
が格納される。
次に、計算レジスタ14aのデータとQ1算レジスタ1
4bのデータとの近似性を表わす部分−政変を部分一致
痩計算器15で下記の式1で計算し、これを部分−政変
レジスタ16のL番目の位置に書き込む(ステップ12
2)。
部分−政変−2X L(X (ly ) /(1−(X
)→−L (V))・・・式1 式1において、x、yはそれぞれ目算レジスタ14aと
計緯レジスタ14bの内容である候補文字集合を表わし
、L(x)、L(V)はそれぞれ計算レジスタ14aと
計算レジスタ14bの候補文字数を表わし、L(xθy
)はX、y間の論理積集合の候補文字数を表わす。第5
図の例では[(x)、L <y)はそれぞれ3であり、
Lux/1y)も3である。従って、部分−政変は1で
ある。
尚、第5図の例ではこれを100倍した値を部分−致痩
としている。この例の場合、L=1なので、この部分−
政変100は部分−政変レジスタ16の1番目の位置に
書き込まれる。
次に、現右のしの値が候補文字数Nを越えるかどうかを
調べる〈ステップ124)。この条件を満足しないとき
は、ステップ121に戻る。以下、候補文字数分だけス
テップ121および122を行い、部分−政変を計算し
て部分−政変レジスタ16に書き込む。この処理が終了
すると、部分−政変レジスタ16に入っているN個の部
分−政変の中から最小の値を選び、これを全体−政変と
するくステップ125)。そして、全体−政変が所定の
しきい値を越えるかどうかを調べる(ステップ126)
全体−政変がしきい値に等しいかまたはそれより小さい
ときは、ステップ128で内部カウンタKを1インクリ
メントし、スーアップ117に戻る、1一方、ステップ
126の条件が成立する場合は、入力ブタレジスタ12
に入っているデータに対応する出力データバッフ718
の箇所のデータが、]訂正規則レジスタ3の正解文字列
に書き換えられる(ステップ127)。この処理は、第
2図の書ぎ換え1lJ1111部17が行う。第5図の
例で部分−政変レジスタ16の1番目の値がステップ1
26の条件を満足するものとすれば、入力データレジス
タ12の4番目と5番目の候補文字が訂正規則レジスタ
13の1番目の正解文字列に置ぎ換えられる。1以上の
ようにして、訂正規則テーブル20を用いた自動訂正が
行われる。なお、上記実施例では認識結果の候補文字は
第3位までであったが、原理的には何位まで出炭しても
同様である。
〔発明の効果〕
以上のように本発明によれば、文字認識後処理を行なう
に際して誤って認識された文字を操作者が訂正する操作
の情報を自圧規則として自動登録し、以後の認識結果に
適用して認識誤りを自動訂正することとしたため、文字
パターン特微量の再登録または文法処理により訂正方法
に比べ処理方法が簡易になり、文字認識後処理の高速化
が図れる。さらに、単語照合・形態素解析などによる、
文法的に正しいが誤訂正された文を生成することがなく
、操作者による訂正作業を容易にすることができる1゜ 第2図は第1図中の自動訂正部のブロック図、第3図は
文字認識結果に対する手動1正を説明するための図、 第4図は手i訂正制御部の動作70−ヂヤート、第5図
は自動訂正時のデータの流れの一例を示す図、および 第6図は自動訂正の処理手順を示ずノロ−チャートであ
る。
10・・・自動訂正部、11・・・入力データバツノノ
7.12・・・入力データレジスタ、13・・・訂正規
則レジスタ、14a、14b・・・計算レジスタ、15
・・・部分−政変計算器、16・・一部分一政変レジス
タ、17・・・書き換え制御部、18・・・出力データ
バツノ?、19・・−制御部、20・・・訂正m則テー
ブル、30・・・手動訂正11JIII部、40・・・
操作表示部、1
【図面の簡単な説明】

Claims (1)

  1. 【特許請求の範囲】 音声や文字などの入力パターンを認識して単数または複
    数の候補カテゴリを生成するパターン認識方式において
    、 誤つて認識したパターンのカテゴリを操作者が訂正する
    情報から、該カテゴリおよび該カテゴリの周囲に存在す
    るパターンのカテゴリ集合に対する正解カテゴリ列の関
    係を規定する訂正規則を自動抽出して以後のパターン認
    識結果に適用し、前記訂正規則内の候補カテゴリ集合と
    パターン認識結果内の候補カテゴリ集合が近似している
    場合、該訂正規則の正解カテゴリ列で、パターン認識結
    果の対応する候補カテゴリを置き換えることを特徴とす
    るパターン認識後処理方式。
JP1036735A 1989-02-16 1989-02-16 パターン認識後処理方式 Pending JPH02214990A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1036735A JPH02214990A (ja) 1989-02-16 1989-02-16 パターン認識後処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1036735A JPH02214990A (ja) 1989-02-16 1989-02-16 パターン認識後処理方式

Publications (1)

Publication Number Publication Date
JPH02214990A true JPH02214990A (ja) 1990-08-27

Family

ID=12477992

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1036735A Pending JPH02214990A (ja) 1989-02-16 1989-02-16 パターン認識後処理方式

Country Status (1)

Country Link
JP (1) JPH02214990A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
JP2001312296A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
JP2001312296A (ja) * 2000-05-02 2001-11-09 Internatl Business Mach Corp <Ibm> 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体

Similar Documents

Publication Publication Date Title
CN110489760B (zh) 基于深度神经网络文本自动校对方法及装置
CN110276077A (zh) 中文纠错的方法、装置及设备
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US20080168341A1 (en) Digital spreadsheet formula automation
US20060149543A1 (en) Construction of an automaton compiling grapheme/phoneme transcription rules for a phoneticizer
CN113591457A (zh) 文本纠错方法、装置、设备及存储介质
US11568150B2 (en) Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space
TW201544976A (zh) 自然語言處理系統、自然語言處理方法、及自然語言處理程式
CN117094311B (zh) 一种关于中文语法纠错的误纠过滤器的建立方法
CN111259635A (zh) 一种对病历书写文本补全和预测的方法及系统
US10854106B2 (en) Targeted repetition and targeted reinforcement in a language learning system
CN116360794A (zh) 数据库语言解析方法、装置、计算机设备及存储介质
JPH02214990A (ja) パターン認識後処理方式
US11907656B2 (en) Machine based expansion of contractions in text in digital media
CN113012685B (zh) 音频识别方法、装置、电子设备及存储介质
CN113096646B (zh) 音频识别方法、装置、电子设备及存储介质
KR102152900B1 (ko) 중의적 음절 데이터 처리 방법 및 장치
JPH0239282A (ja) パターン認識後処理方式
JPS60157659A (ja) 日本語解析方式
JP2870375B2 (ja) 文章訂正装置
JP2003280903A (ja) ソースプログラム比較情報生成システム
JPH0218682A (ja) パターン認識後処理方式
JPH0612520A (ja) 文字認識装置の確認修正方式
JPH09160918A (ja) 対訳文対応付け方法及び装置
JPH02170292A (ja) 文字認識後処理方法