JPH0218682A - Pattern recognition post-processing system - Google Patents

Pattern recognition post-processing system

Info

Publication number
JPH0218682A
JPH0218682A JP63169664A JP16966488A JPH0218682A JP H0218682 A JPH0218682 A JP H0218682A JP 63169664 A JP63169664 A JP 63169664A JP 16966488 A JP16966488 A JP 16966488A JP H0218682 A JPH0218682 A JP H0218682A
Authority
JP
Japan
Prior art keywords
correction
candidate
pattern recognition
pattern
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63169664A
Other languages
Japanese (ja)
Inventor
Akira Suzuki
章 鈴木
Kiyoshi Kabetani
壁谷 喜義
Fumihiko Kobashi
小橋 史彦
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63169664A priority Critical patent/JPH0218682A/en
Publication of JPH0218682A publication Critical patent/JPH0218682A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

PURPOSE:To execute pattern recognition post-processing at a high speed by automatically registering the information of operation, in which an operator corrects a pattern to be erroneously recognized, as a correcting rule when the pattern recognition post-processing is executed, applying the rule for a following recognized result and automatically correcting an recognition error. CONSTITUTION:The correction rule to be composed of the relation of right solution category to a candidate category set to be automatically extracted from the information, with which the operator corrects the category of the pattern to be erroneously recognized, is applied for the following pattern recognized result. When the candidate category set in the correction rule and the candidate category set to be included in the pattern recognized result are approximated, the right solution category of the correction rule is replaced with the first candidate category of the pattern recognized result. Thus, correction can be easily executed in comparison with correction by the re-registration of pattern feature quantity or grammar processing and the processing can be executed at the high speed.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、音声や文字などのパターン認識に関し、より
詳細には、操作者が認識結果の誤りを訂正したときの操
作の情報を利用するパターン認識後処理方式に関する、
[Detailed Description of the Invention] [Field of Industrial Application] The present invention relates to pattern recognition of speech, characters, etc. Regarding pattern recognition post-processing method,
.

〔従来の技術〕[Conventional technology]

近年、オフィスオートメーション化の発達に伴い、文字
や音声の認識が広く研究され、一部実用化されている1
1文字や音声の認識は、これらをパターン化してパター
ン特徴量を抽出し、認識辞書に登録されている標準パタ
ーンと比較することにより候補文字や音声(以下、候補
カテゴリという)を生成している。
In recent years, with the development of office automation, character and voice recognition has been widely researched, and some have been put into practical use1.
To recognize a single character or voice, candidate characters and voices (hereinafter referred to as candidate categories) are generated by converting these into patterns, extracting pattern features, and comparing them with standard patterns registered in a recognition dictionary. .

通常、このようなパターン認識では認識率を向上させる
ため、特に誤認識しやすいパターンについては、認識パ
ターン特!3量を追加登録する処理が行われている。ま
た、候補カテゴリについて単語照合や形態素解析などの
文法処理を施すことによって、認識精度を上げることも
提案されている。
Normally, such pattern recognition improves the recognition rate, so for patterns that are particularly likely to be misrecognized, recognition pattern special! Processing to additionally register three quantities is being carried out. It has also been proposed to improve recognition accuracy by performing grammatical processing such as word matching and morphological analysis on candidate categories.

〔発明が解決しようとする課題〕[Problem to be solved by the invention]

しかしながら、上記認識パターン特徴1を追加登録する
処理では、パターン特微量の情報量が多いため、新規の
パターン特微量の登録には、大きな容量の記憶領域を必
要とするという問題点があった。また、上記理由から、
認識処理に要する時間が増大してしまい、さらには、新
しいカテゴリ(文字や音声)のパターンを登録したため
に、かえって認識精度が低下してしまうという問題点が
あった。この認識粘度の低下を避りるため(は、そのパ
ターンを0録すべきか否かをMl gする作業が必要と
なり、その作業に時間がかるという問題点があった。
However, in the process of additionally registering the recognized pattern feature 1, since the amount of information of the pattern feature amount is large, there is a problem that a large capacity storage area is required to register a new pattern feature amount. Also, for the above reasons,
There is a problem in that the time required for recognition processing increases, and furthermore, since patterns of new categories (characters and sounds) are registered, recognition accuracy actually decreases. In order to avoid this decrease in recognized viscosity, it is necessary to check whether or not the pattern should be zero-recorded, which poses a problem in that it takes time.

また文法処理を用いて認識精度を上げる従来技術は、候
補カテゴリ数が多くなるにしたがい、認識処理に要する
h間が急激に増大するという問題点や1.候補カテゴリ
中に正解が存在しない場合、または認識辞書中に該当す
る単語が存在しない場合、文法処理により得られた結果
は正しいが誤った文を生成する傾向が強いために、操作
者により訂正f業を困難にさせるという問題点があった
Furthermore, conventional techniques that use grammar processing to improve recognition accuracy have problems such as 1. The time required for recognition processing increases rapidly as the number of candidate categories increases. If there is no correct answer in the candidate category, or if the corresponding word does not exist in the recognition dictionary, the result obtained by grammar processing is correct, but there is a strong tendency to generate incorrect sentences, so the operator must correct f. The problem was that it made the work difficult.

さらに、上記従来のパターン認識ではいずれも、認識結
果の誤りを操伯者がW1正したとぎの操作の情報は利用
されていなかった。
Furthermore, in any of the above conventional pattern recognitions, information about the operation after which the operator corrected the error in the recognition result by W1 is not used.

したがって、本発明は上記従来技術の問題点を解決し、
認識結果の誤りを操作者が訂正したときの操作の情報を
用いて、認識辞書の容量を増大ざゼることなく高速かつ
容易な操作で、高い認識精度を得ることを目的とする。
Therefore, the present invention solves the above-mentioned problems of the prior art,
The purpose of the present invention is to obtain high recognition accuracy with fast and easy operations without increasing the capacity of a recognition dictionary, using information on operations when an operator corrects errors in recognition results.

〔課題を解決するための手段〕[Means to solve the problem]

本発明は、入カバターンを認識して単数または複数の候
補カテゴリを生成するパターン認識方式において、誤っ
て認識したパターンのカテゴリを操作者が訂正する情報
から自動抽出された候補カテゴリ集合に対する正解カテ
ゴリの関係よりなる訂正規則を以後のパターン認識結果
に適用する。
In a pattern recognition method that recognizes an input pattern and generates one or more candidate categories, the present invention enables an operator to correct the category of an erroneously recognized pattern. A correction rule based on the relationship is applied to subsequent pattern recognition results.

そして、前記訂正規則内の候補カテゴリ集合とパターン
認識結果に含まれる候補カテゴリ集合同士が近似してい
る場合、該訂正規則の正解カテゴリをパターン認識結果
の第1位候補カテゴリに置き換える。
If the candidate category set in the correction rule and the candidate category set included in the pattern recognition result are similar to each other, the correct category in the correction rule is replaced with the first candidate category in the pattern recognition result.

好ましくは、前記自動抽出された訂正規則を既に訂正済
みの正解が判明しているパターンg J結果に含まれる
候補カテゴリ集合に適用し、前記置き換えにより訂正さ
れた総カテゴリに対する誤認識カテゴリが正しく訂正さ
れた総カテゴリ数の比率が一定値以上となる訂正規則の
みを、以後のパターン認識結果の訂正に適用する。
Preferably, the automatically extracted correction rule is applied to a set of candidate categories included in the pattern gJ result for which the correct answer has already been corrected, and the misrecognized categories for the total categories corrected by the replacement are correctly corrected. Only those correction rules for which the ratio of the total number of categories exceeds a certain value are applied to subsequent corrections of pattern recognition results.

〔作用] 例えば、正解パターンAに対し、候補カテゴリ集合がB
、Cと得られたとする。操作者はこの候補カテゴリ集合
中B、CにAが含まれていないため、Aど真正する。こ
の結果AとBおよびCにり成る訂正規則が得られる。
[Effect] For example, for the correct pattern A, the candidate category set is B
, C. Since A is not included in B or C in this candidate category set, the operator determines that A is genuine. As a result, a correction rule consisting of A, B, and C is obtained.

その後のパターン認識より、訂正思則内の候補カテゴリ
集合に近似する候補カテゴリ集合、例えば同一のB、C
が得られたとする。この場合、訂正規則によりB、Cは
Aを訂正するよう規定されているので、候補カテゴリ集
合B、C中の第1位候補カテゴリ(例えばB)をAと訂
正する。このにうに、従来のようにパターン特微量の再
登録または文法処理による訂正にくらべ簡単に訂正を行
うことができ、処理の高速化が図れる。
Through subsequent pattern recognition, a candidate category set that approximates the candidate category set in the correction rule, for example, the same B, C
Suppose that we obtain In this case, the correction rules stipulate that B and C should correct A, so the first candidate category (for example, B) in the candidate category sets B and C is corrected to A. In this way, the correction can be performed more easily than the conventional correction by re-registering the pattern feature amount or by grammar processing, and the processing speed can be increased.

上記作用において、B、CをAと訂正する訂正規則は引
き続くパターン認識処理において常に正しいものである
とは限らない。そこで、上記比率が一定値以上となる訂
正規則のみを以後のパターン認識結果の訂正に適用する
ことで、自動訂正の信頼性を高めることができる。
In the above operation, the correction rule for correcting B and C to A is not always correct in subsequent pattern recognition processing. Therefore, the reliability of automatic correction can be improved by applying only the correction rules for which the ratio is equal to or greater than a certain value to the subsequent correction of pattern recognition results.

〔実施例〕〔Example〕

以下、本発明の実施例を図面を参照して詳細に説明する
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

第1図は本発明のパターン認識後処理り式の一実施例の
ブロック禍成図である。同図において、自動訂正部1は
図示しないパターン認識装置からのパターンを入力し、
訂正規則テーブル2中の訂正規則にしたがって、入力し
たパターン認識結果を自動訂正する。自動訂正した結果
は、手動訂正制御部3へ出力される。なお、訂正規則テ
ーブル2に入っている後述する訂正規則は、操作者がパ
ターン認識結果を手動訂正することにより順次自動生成
、更新されるため、初期(1回目)のパターン認識結果
には適用されない。すなわち、1回目のパターン認識結
果は自動訂正部1を介してそのまま手動訂正制御部3に
出力される。。
FIG. 1 is a block diagram of an embodiment of the pattern recognition post-processing method of the present invention. In the figure, an automatic correction unit 1 inputs a pattern from a pattern recognition device (not shown),
The input pattern recognition result is automatically corrected according to the correction rules in the correction rule table 2. The automatically corrected result is output to the manual correction control section 3. Note that the correction rules included in the correction rule table 2, which will be described later, are automatically generated and updated sequentially as the operator manually corrects the pattern recognition results, so they are not applied to the initial (first) pattern recognition results. . That is, the first pattern recognition result is directly output to the manual correction control section 3 via the automatic correction section 1. .

訂正規則テーブル2は、自動訂正部1がパターン認識結
果を自動訂正する際の訂正規則を定める。
The correction rule table 2 defines correction rules when the automatic correction unit 1 automatically corrects the pattern recognition result.

前述したように、この訂正規則は操作者がパターン認識
結果を手動口止することにより順次生成。
As mentioned above, these correction rules are sequentially generated by the operator manually blocking the pattern recognition results.

更新される1゜ 手動訂正制御部3は自動訂正部1から出力された自動訂
正結果(又は1回目のパターン認識結果)を、操作部6
を介して操作者が与える訂正操作の指示にしたがって訂
正する。手動l]正副制御部は、初期のパターン認識結
果に対する手動訂正の操作情報にしたがって、後述する
訂正規則を作成し、訂正規則判定部5を介して作成した
訂正規則を訂正規則テーブル2に登録する。初期の認識
結果以降のパターン認識結果に対しては手動訂正終了後
、後述する新規訂正規則候補リストと訂正規則更新用リ
ストとを作成し、それぞれ訂正規則判定部5に送る。ま
た、手動訂正制御部3は後述する履歴情報を作成して、
履歴情報格納部4に格納する。
The updated 1° manual correction control unit 3 transmits the automatic correction result (or first pattern recognition result) output from the automatic correction unit 1 to the operation unit 6.
Corrections are made in accordance with correction operation instructions given by the operator via the . [Manual l] The primary and secondary control unit creates a correction rule, which will be described later, according to the manual correction operation information for the initial pattern recognition result, and registers the created correction rule in the correction rule table 2 via the correction rule determination unit 5. . After manual correction is completed for pattern recognition results subsequent to the initial recognition results, a new correction rule candidate list and a correction rule update list, which will be described later, are created and sent to the correction rule determining section 5, respectively. In addition, the manual correction control unit 3 creates history information, which will be described later, and
The information is stored in the history information storage section 4.

訂正規則判定部5は手動訂正制御部3の出力。The correction rule determination unit 5 is the output of the manual correction control unit 3.

履歴情報格納部4に格納されている履歴情報、上記新規
訂正規則候補リストおよび訂正」則更新用リストを用い
て、訂正規則テーブル2中の訂正規則を更新する。
The correction rules in the correction rule table 2 are updated using the history information stored in the history information storage section 4, the new correction rule candidate list, and the correction rule update list.

操作部6はキーボード、マウスおよびデイスプレィ等か
らなり、手動訂正制御部3からの情報をデイスプレィ上
に表示し、また手動訂正制御部3に対しキーボードやマ
ウスから手動操作の指示等を与える。
The operating section 6 includes a keyboard, a mouse, a display, etc., and displays information from the manual correction control section 3 on the display, and also gives manual operation instructions to the manual correction control section 3 from the keyboard and mouse.

次に、本実施例の動作を第2図、第3図および第4図に
示す動作フローチャート、ならびに第5図ないし第8図
を参照して詳細に説明する。ここで、第2図は手動訂正
制御部3の動作70−チヤトであり、同図(A)は最初
の手動訂正時の動作フローチャート、および同1g(B
)はそれ以降の手動訂正時の動作フローチャートである
。また、第3図は自動訂正制御部3の動作フローチャー
ト、および第4図は訂正規則判定部5の動作フローチャ
ートである。
Next, the operation of this embodiment will be explained in detail with reference to the operation flowcharts shown in FIGS. 2, 3, and 4, and FIGS. 5 to 8. Here, FIG. 2 is an operation 70-chat of the manual correction control unit 3, and FIG.
) is an operation flowchart for subsequent manual correction. 3 is an operation flowchart of the automatic correction control section 3, and FIG. 4 is an operation flowchart of the correction rule determination section 5.

本実施例は文字および音声のパターン認識処理のいずれ
にも適用できるが、以下入カバターンとして文字を対象
にした具体例で説明する。
Although this embodiment can be applied to both character and voice pattern recognition processing, a specific example will be described below in which characters are targeted as input patterns.

文字認識装置により認識された結果は、まず自動訂正部
1に入力される。自動訂正部1は訂正規則テーブル2を
参照しながら、誤認識文字を自動訂正する。前述したよ
うに、自動訂正部1は初期の認識結果に対しては動作せ
ず1文字認識結果はそのまま手動訂正制御部3に送られ
る。
The results recognized by the character recognition device are first input to the automatic correction section 1. The automatic correction unit 1 automatically corrects misrecognized characters while referring to the correction rule table 2. As described above, the automatic correction section 1 does not operate on the initial recognition result, and the single character recognition result is sent as is to the manual correction control section 3.

第5図(A)は、入力文章[今日の夜の天気を予測する
・・・」を文字認識した認識結果aに対する操作者の手
動訂正操作および訂正規則生成の手順を示す。また、第
5図(B)は操作部6のデイスプレィへの表示例を示す
FIG. 5(A) shows the procedure for manual correction operations and correction rule generation by the operator for the recognition result a obtained by character recognition of the input sentence "Predict the weather tonight...". Further, FIG. 5(B) shows an example of a display on the display of the operation unit 6.

手動訂正制御部3は、各文字の認識結果の第1位候補文
字を、第5図(B)の左側のデイスプレィ表示例に丞す
ように操作部6のデイスプレィに表示する(第2図のス
テップ101)。次に、このデイスプレィに表示された
文字を見て、操作者は操作部6のキーボード、マウス等
を用いて誤認識文字を訂正する(ステップ102)。訂
正の方法は、正解が候補文字集合にある場合は次候補を
順次表示して選択する(本例では、第2位までの候補文
字を用いている)ことにより、また正解が候補文字集合
中に存在しない場合はかな漢字変換入力などにより、正
解文字を入力する。手動n正結果を第5図(B)の右側
のデイプレイ表示例に示す。
The manual correction control unit 3 displays the first candidate character as a result of the recognition of each character on the display of the operation unit 6 in a manner similar to the display example on the left side of FIG. 5(B) (as shown in FIG. Step 101). Next, looking at the characters displayed on the display, the operator corrects the misrecognized characters using the keyboard, mouse, etc. of the operation unit 6 (step 102). The correction method is to display and select the next candidates in order if the correct answer is in the candidate character set (in this example, the second candidate characters are used), and if the correct answer is in the candidate character set. If the correct character does not exist, enter the correct character using Kana-Kanji conversion input. The manual n correct result is shown in the display example on the right side of FIG. 5(B).

手動訂正が終了したら、操作者は操作部6のキーボード
から手動訂正制御部3に、手動訂正終了信号を送る。
When the manual correction is completed, the operator sends a manual correction completion signal to the manual correction control section 3 from the keyboard of the operation section 6.

操作部6から手動訂正終了信号が送られてくると、手動
訂正制御部3は操作者が訂正した文字の認識結果の候補
文字集合と正解文字との関係(訂正規則)を作成し、訂
正回数をカウントする(ステップ103)。初期の文字
認識結果に対する手動訂正により生成された訂正規則は
すべて、訂正規則判定部5を介して訂正規則テーブル2
に登録される(ステップ104) 、この場合の訂正規
則テーブル2の内容の一部を第5図(A)に示す。図示
するように、例えば正解文字「日」に関してはこの候補
文字集合「自」および「白」が訂正規則として登録され
る。これを「日←自 白」と表わす。
When a manual correction end signal is sent from the operation unit 6, the manual correction control unit 3 creates a relationship (correction rule) between the candidate character set of the recognition result of the character corrected by the operator and the correct character, and calculates the number of corrections. is counted (step 103). All correction rules generated by manual correction of initial character recognition results are sent to the correction rule table 2 via the correction rule determination unit 5.
(Step 104). Part of the contents of the correction rule table 2 in this case is shown in FIG. 5(A). As shown in the figure, for example, for the correct character ``日'', the candidate character sets ``self'' and ``white'' are registered as correction rules. This is expressed as ``Japanese confession.''

まだ、この場合、最初の手動訂正により生成された訂正
規則のため、訂正回数は1となる。。
However, in this case, the number of corrections is 1 because the correction rule was generated by the first manual correction. .

次に、手動真正制御部3は認識結果すべての正解文字と
それに対する候補文字集合を、後に行う訂正規則判定(
第4図の動作フロー)に使用するために、履歴情報(訂
正結果)として履歴情報格納部4に格納する(ステップ
105)。第6図に、第5図(A)に示す認識結果aを
手動訂正した後の履歴情報格納部4の内容を示す。だし
て、手動訂正の処理を終了する。
Next, the manual authenticity control unit 3 processes all the correct characters as a result of the recognition and the corresponding candidate character set into a correction rule judgment (which will be performed later).
It is stored in the history information storage unit 4 as history information (correction results) for use in the operation flow shown in FIG. 4 (step 105). FIG. 6 shows the contents of the history information storage unit 4 after manual correction of the recognition result a shown in FIG. 5(A). Then, the manual correction process ends.

次に、入力文章「明日の天気を予測するのは難しいのだ
ろう・・・」が人力されたとする。第7図(Δ)にこの
入力文章の認識結果すを示づ几この認識結果すは最初に
、第1図に示す自動訂正部1で自動訂正される。この自
動訂正では、まず先に自動作成された訂正規則テーブル
2に入っている訂正規則内の候補文字集合と、認識結果
すの候補同士の近似性(以下、一致度という)を計算す
る(第3図のステップ121)。この一致度は、次式(
1)にしたがって計算する。
Next, assume that the input sentence ``It will be difficult to predict tomorrow's weather...'' is human-generated. FIG. 7 (Δ) shows the recognition result of this input sentence. The recognition result of this input sentence is first automatically corrected by the automatic correction section 1 shown in FIG. In this automatic correction, first, the similarity (hereinafter referred to as the degree of matching) between the candidate character set in the correction rules included in the automatically created correction rule table 2 and the candidates in the recognition result is calculated. Step 121 in Figure 3). This degree of matching is calculated by the following formula (
Calculate according to 1).

一致度一 2XL  (x   y)/  (L(x)−+−L(
y))  ・ (1)ここで、X、yはそれぞれ認識結
果の候補文字集合および訂正規則の候補文字集合を表し
、L(x)、L(y)は候補文字数、またL(x  y
)はx、y簡の論理積集合の候補文字を表わす。次に、
一致度が一定のしきい値以上かどうかを調べる(ステッ
プ122)。一致度が一定のしきい値以上の場合は、こ
の訂正規則の正解文字を認識結果すの候補文字集合の第
1候補文字に置き換える(ステップ123)。ステップ
123での訂正規則の正解文字への置き換え終了後、ま
たは第3図のステップ122で一致度が所定のしきい値
を下まわるどきは、ステップ124に進む。ステップ1
24では、自動訂正部1は認識結果しおよび自動訂正の
結果を手動訂正制御部3へ送る。
Matching degree - 2XL (x y)/ (L(x)-+-L(
y)) ・ (1) Here, X and y represent the candidate character set of the recognition result and the candidate character set of the correction rule, respectively, and L(x) and L(y) are the number of candidate characters, and L(x y
) represents a candidate character for the logical product set of x and y symbols. next,
It is checked whether the degree of matching is greater than or equal to a certain threshold (step 122). If the degree of matching is above a certain threshold, the correct character of this correction rule is replaced with the first candidate character of the candidate character set of the recognition results (step 123). After the correction rule has been replaced with the correct character in step 123, or when the degree of matching falls below a predetermined threshold in step 122 of FIG. 3, the process proceeds to step 124. Step 1
At step 24, the automatic correction unit 1 determines the recognition result and sends the automatic correction result to the manual correction control unit 3.

手動訂正制御部3では、第2図(B)のステップ111
において、自動訂正部1によって自動訂正された結果の
第1位候補文字を操作部6のデイスプレィに表示する(
第7図(B)の中央のデイスプレィ表示例)。そして、
操作者はデイスプレィを見ながら誤った文字を手動訂正
する(ステップ112)。第7図(B)の右側のデイス
プレィ表示例に、上記手動訂正の結果を示ず21手動訂
正が終了したら、操作者は操作部6から手動訂正終了信
号を手動訂正制御部3に送る。
In the manual correction control unit 3, step 111 in FIG. 2(B)
, the first candidate character automatically corrected by the automatic correction section 1 is displayed on the display of the operation section 6 (
Example of display in the center of FIG. 7(B)). and,
The operator manually corrects the erroneous characters while looking at the display (step 112). The display example on the right side of FIG. 7(B) does not show the result of the manual correction described above. 21 When the manual correction is completed, the operator sends a manual correction completion signal from the operating section 6 to the manual correction control section 3.

操作者から訂正終了の信号が送られてくると、手動訂正
制御部3は操作者によって手動訂正された後の文字を調
べ、次の3つの集合を作成する(ステップ113)。
When the operator sends a signal to complete the correction, the manual correction control unit 3 examines the characters manually corrected by the operator and creates the following three sets (step 113).

(1)  ’FI1.識結果の第1位候補文字が誤って
おり、正しく自動訂正された文字く第8図におけるl’
[!I]貞の・・・」) ■ 認識結果の第1位候補文字が誤っていたが、訂正規
則が適用されず、手動訂正により正しく修正された文字
(同図における「・・・予後する・・・J) C3)  認識結果の第1位候補文字は正しかったが、
誤って自動訂正された文字(同図におりる[・・・予測
するQは・・・]) 以後、これらの集合をそれぞれ集合1.集合2゜集合3
と呼ぶこととする。
(1) 'FI1. The first candidate character in the recognition result is incorrect, and the correct automatically corrected character is l' in Figure 8.
[! ■ The first candidate character in the recognition result was incorrect, but the correction rule was not applied, and the character was correctly corrected by manual correction (in the same figure, the first candidate character was incorrect). ...J) C3) The first candidate character in the recognition results was correct, but
Characters that were incorrectly automatically corrected (as shown in the figure [...predicted Q is...]) From now on, these sets will be referred to as set 1. Set 2゜ Set 3
I will call it.

手動訂正制御部3は集合2の各文字について、認識結果
の候補文字集合と手動訂正された結果の正解文字を新M
」正規則候補リストとして訂正規則判定部5に送る(ス
テップ114)。次に手動訂正制御部3は集合1と集合
3について、各文字の自動訂正に適用された訂正規則を
集めて訂正規則更新用リストを作成し、訂正規則判定部
5に送る(ステップ115)。その際、訂正規則更新用
リストには、訂正規則が正しく訂正されるのに適用され
たもの(集合1)であるか、あるいは誤って訂正するの
に適用されたもの(集合3)であるかを識別する情報も
付加しておく。第8図中、○は正しい適用を示し、×は
誤った適用を示す。
For each character in set 2, the manual correction control unit 3 converts the candidate character set of the recognition result and the correct character of the manually corrected result into a new M
” is sent to the correction rule determining unit 5 as a regular rule candidate list (step 114). Next, the manual correction control unit 3 collects the correction rules applied to the automatic correction of each character for sets 1 and 3, creates a correction rule update list, and sends it to the correction rule determination unit 5 (step 115). At that time, the list for updating correction rules includes information on whether the correction rules are those that were applied to correct corrections (set 1) or those that were applied to incorrect corrections (set 3). Also add information to identify it. In FIG. 8, ◯ indicates correct application, and × indicates incorrect application.

訂正規則判定部5は、最初に手動訂正制御部3から送ら
れてぎた新M訂正規則候補を用いて履歴情報格納部4の
中の履歴情報(第6図)の自動訂正を先に述べた一致度
判定により行う(ステップ131)。ここで、自動訂正
された結果の文字と履歴情報の正解文字とを比較して、
誤っていた文字を正しく訂正した回数(以下、これを訂
正回数とよぶ)と、正しい文字を誤って訂正した回数(
以下、これを誤泪正回数とよぶ)を数え、式■で定義す
る信頼度を計算し、信頼度が一定のしきい値(例えば0
,5)以上の新規泪正規則候補のみを新しい訂正規則と
して作用し、訂正規則テーブル2に追加登録する。
The correction rule determination unit 5 uses the new M correction rule candidate sent from the manual correction control unit 3 to automatically correct the history information (FIG. 6) in the history information storage unit 4 as described above. This is performed by determining the degree of matching (step 131). Here, compare the automatically corrected characters with the correct characters in the history information,
The number of times an incorrect character was correctly corrected (hereinafter referred to as the number of corrections) and the number of times a correct character was incorrectly corrected (
Hereinafter, this will be referred to as the number of false positives), calculate the reliability defined by formula (■), and then calculate the reliability defined by formula
, 5) Only the above new correction rule candidates act as new correction rules and are additionally registered in the correction rule table 2.

信頼度−訂正回数/(訂正回数+誤訂正回数)・・・■ 次に泪正規則判定部5は、手動訂正制御部3から送られ
てぎた訂正規則更新用リストと訂正規則テーブル2を比
較し、泪正規則更新用リストに含まれる訂正規則につい
て、該訂正規則が前記集合1に含まれていたものなら訂
正規則テーブル2の該当する訂正規則の訂正回数に1を
加え、該訂正規則が前記集合3に含まれていたものなら
訂正四則テーブル2の該当する訂正規則の誤訂正回数に
1を加える(ステップ132) 。
Reliability - Number of corrections/(Number of corrections + Number of incorrect corrections)...Next, the corrective rule determination section 5 compares the correction rule update list sent from the manual correction control section 3 with the correction rule table 2. However, regarding the correction rule included in the correction rule update list, if the correction rule was included in the set 1, 1 is added to the number of corrections of the corresponding correction rule in the correction rule table 2, and the correction rule is If the correction rule is included in the set 3, 1 is added to the number of incorrect corrections of the corresponding correction rule in the correction rule table 2 (step 132).

最後に、訂正規則判定部5は訂正規則テーブル2の各5
1正規則について、おのおのの訂正回数と誤訂正回数か
ら式[F]によって信頼度をn1算する(ステップ13
3)。ぞして、信頼度が一定しきい値以上の訂正規則を
訂正規則テーブル2から除去する(ステップ134. 
135)。例えば第8図の訂正規則1を←のも」は信頼
度−0,4となり除去する。そして、最後に認識結果す
に関する履歴情報を履歴情報格納部4に格納した後、処
理を終了する。
Finally, the correction rule determination unit 5 checks each 5 of the correction rule table 2.
For one regular rule, the reliability is calculated by formula [F] from the number of corrections and the number of incorrect corrections (step 13).
3). Then, correction rules whose reliability is above a certain threshold are removed from the correction rule table 2 (step 134.
135). For example, the correction rule 1 in FIG. Finally, after storing the history information regarding the recognition result in the history information storage section 4, the process ends.

このようにして得られた訂正結果は、任意のブタ処理シ
ステム(図示なし)に出力される。
The correction results thus obtained are output to any pig processing system (not shown).

以上説明したように、誤って認識された文字を操作者が
訂正する操作より得られた候補文字集合に対する正解文
字の関係を訂正規則候補として作成し、該訂正規則候補
を操作者による訂正が完了している過去の文字認識結果
に適用することにより、正しく訂正される割合の高い訂
正規則のみを用いて以後の文字認識結果の自動訂正を行
い、認識精度を高めることができる。
As explained above, the relationship between the correct character and the candidate character set obtained through the operator's operation to correct the incorrectly recognized character is created as a correction rule candidate, and the operator completes the correction of the correction rule candidate. By applying this method to past character recognition results, subsequent character recognition results can be automatically corrected using only correction rules with a high rate of correct correction, thereby increasing recognition accuracy.

以上、本発明の一実施例を説明した31本発明は上記実
施例に限定されず、次のように構成することもできる。
The thirty-one embodiments of the present invention described above are not limited to the above-mentioned embodiments, but can also be configured as follows.

M]訂正則テーブル2内の目止規則の数は認識文字数の
増加につれて増加するが、訂正規則テーブル2の各訂正
規則に自動「J正に適用された履歴を記録しておき、使
用@A度の小さい規則や、最後に適用されてから長時間
経過した規則は訂正規則テブル2から除去するなどによ
り、削正規則テーブル2を一定範囲のサイズに抑えるこ
とができる。
M] The number of eye-stopping rules in the correction rule table 2 increases as the number of recognized characters increases, but each correction rule in the correction rule table 2 records the history of the automatic “J positive” application and uses @A The size of the correction rule table 2 can be kept within a certain range by removing from the correction rule table 2 rules with a small degree of accuracy or rules for which a long time has passed since the last application.

また訂正規則の判定に使用される履歴情報の量も認識文
字数の増加につれて増大するが、最新の認識結果数ペー
ジ分のみを蓄積することにより一定範囲のサイズに抑え
ることができる。
Furthermore, the amount of history information used to determine correction rules also increases as the number of recognized characters increases, but by storing only the latest recognition results for several pages, the size can be kept within a certain range.

また、実施例では学習は1文字単位で行われたが、本発
明の原理は隣接した2文字以上を単位とした学習と自動
訂正にも適用できる。
Further, in the embodiment, learning was performed in units of one character, but the principles of the present invention can also be applied to learning and automatic correction in units of two or more adjacent characters.

また、本文中の実施例では認識結果の候補文字は第2位
までであったが、原理的には何位まで出現しても同様で
ある。
Further, in the embodiment described in this text, the candidate characters in the recognition result are up to the second position, but in principle, the same applies no matter how many positions they appear.

また、実施例では最初に入力された入力単位(例、ペー
ジ)から生成された訂正規則に対しては、訂正規則判定
部5において使用するがどうかの判定は行わずに無条件
で採用したが、装置内にあらかじめ履歴情報を組み込む
か、あるいは最初に入力した入力単位を手動訂正した結
果を履歴情報として用いれば、該訂正規則に対しても信
頼度の計算による判定を行うことが可能である。
In addition, in the embodiment, the correction rule generated from the first input unit (eg, page) is unconditionally adopted without determining whether or not to use it in the correction rule determination unit 5. If history information is built into the device in advance, or if the result of manually correcting the first input unit is used as history information, it is possible to make a judgment based on reliability calculation for the correction rule. .

また、実施例において訂正規則の候補文字集合と認識結
果の候補文字集合との近似性の尺度として式(1)で定
義した一致度には、候補文字集合の順位や認識の結果の
距離値が考慮されていないが、これらを考慮にいれた候
補文字集合同士の近似性の尺度を定義して自動訂正に用
いることも可能である。
In addition, in the example, the degree of matching defined by equation (1) as a measure of the similarity between the candidate character set of the correction rule and the candidate character set of the recognition result includes the rank of the candidate character set and the distance value of the recognition result. Although not taken into account, it is also possible to define a measure of similarity between candidate character sets that takes these into account and use it for automatic correction.

以上入カバターンとして文字を例に説明したが、入カバ
ターンが音声の場合は認識結果の候補カデゴリ集合は第
9図に示す通り、音節候補の集合として出力される。第
9図の例で↓ま「せつぞく(接続)」を音声認識した結
果を示している。以降の処理は文字認識結果の後処理と
同様に行なわれる。
The above description has been made using letters as an example of the input cover turn, but when the input cover turn is a voice, the candidate category set of recognition results is output as a set of syllable candidates, as shown in FIG. In the example of Fig. 9, ↓ shows the result of speech recognition of ``Setsuzoku (connection)''. The subsequent processing is performed in the same way as the post-processing of the character recognition results.

第9図に手動訂正の結果として得られる訂正規則を併せ
て示す。
FIG. 9 also shows correction rules obtained as a result of manual correction.

〔発明の効果〕〔Effect of the invention〕

本発明は上述のとおり構成されているので、次に記載す
る効果を奏する。
Since the present invention is configured as described above, it produces the effects described below.

請求項1の構成においては、パターン認識後処那を行な
うに際して誤って認識されたパターンを操作者が訂正す
る操作の情報を訂正規則として自動登録し、以後の認識
結果に適用して認識誤りを自動訂正するもので、パター
ン特微量の再登録または文法処理による訂正方法に比べ
処理方法が簡易なため、パターン認識後処理の高速化が
図れる。
In the structure of claim 1, when performing correction after pattern recognition, information on an operation by an operator to correct a pattern that has been erroneously recognized is automatically registered as a correction rule, and is applied to subsequent recognition results to correct recognition errors. Automatic correction is performed, and the processing method is simpler than correction methods based on re-registration of pattern feature amounts or grammar processing, so it is possible to speed up processing after pattern recognition.

請求項2の構成においては、訂正規則の逐次判定・更新
により信頼性の高い訂正M則のみを常に蓄積しているた
め、文章種別・パターン特徴の変化に容易に追随でき、
適用するにつれて自動訂正の信頼性が高まる学預効果が
実現できる。さらに、単語照合・形態素解析などにより
、文法的には正しいが誤訂正された文を生成することが
なく、操作者による訂正作業を容易にすることができる
In the structure of claim 2, since only highly reliable correction M rules are always stored by sequentially determining and updating correction rules, it is possible to easily follow changes in text types and pattern characteristics.
As it is applied, the reliability of automatic correction increases, creating a school deposit effect. Furthermore, word matching, morphological analysis, and the like prevent the generation of grammatically correct but incorrectly corrected sentences, making correction work easier for the operator.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例のブロック構成図、第2図は
手動訂正制御部の動作フローチャート、第3図は自動訂
正部の動作フローチャート、第4図は訂正規則判定部の
動作フローチャート、第5図は文字認識結果に対する操
作者の手動訂正操作および訂正規則生成の手順並びに操
作部のデイスプレィへの表示例を示す図、第6図は履歴
情報格納部の内容を示す図、第7図は文字認識結果に対
する自動訂正および操作者の手動訂正操作ならびに操作
部のデイスプレィへの表示例を示す図、第8図は訂正規
則の判定処理の流れを示す図、および第9図は本発明を
音声認識に適用した場合の認識結果と訂正規則テーブル
の一例を示す図である。 1・・・自動訂正部、2・・・訂正規則テーブル、3・
・・手動訂正制御部、4・・・M層情報格納部、5・・
・訂正規則判定部、6・・・操作部。 特許出願人 日本電信電話株式会社
FIG. 1 is a block diagram of an embodiment of the present invention, FIG. 2 is an operation flowchart of the manual correction control section, FIG. 3 is an operation flowchart of the automatic correction section, and FIG. 4 is an operation flowchart of the correction rule determination section. Fig. 5 is a diagram showing the manual correction operation by the operator for character recognition results and the procedure for generating correction rules, as well as an example of what is displayed on the display of the operation unit, Fig. 6 is a diagram showing the contents of the history information storage unit, and Fig. 7 8 is a diagram showing an example of an automatic correction for a character recognition result, a manual correction operation by an operator, and a display on the display of an operation unit, FIG. 8 is a diagram showing a flow of correction rule determination processing, and FIG. FIG. 3 is a diagram showing an example of a recognition result and a correction rule table when applied to speech recognition. 1... automatic correction section, 2... correction rule table, 3.
...Manual correction control unit, 4...M layer information storage unit, 5...
- Correction rule determination section, 6... operation section. Patent applicant Nippon Telegraph and Telephone Corporation

Claims (2)

【特許請求の範囲】[Claims] (1)音声や文字などの入力パターンを認識して単数ま
たは複数の候補カテゴリを生成するパターン認識方式に
おいて、 誤つて認識したパターンのカテゴリを操作者が訂正する
情報から自動抽出された候補カテゴリ集合に対する正解
カテゴリの関係よりなる訂正規則を以後のパターン認識
結果に適用し、 前記訂正規則内の候補カテゴリ集合とパターン認識結果
に含まれる候補カテゴリ集合同士が近似している場合、
該訂正規則の正解カテゴリをパターン認識結果の第1位
候補カテゴリに置き換えることを特徴とするパターン認
識後処理方式。
(1) In a pattern recognition method that recognizes input patterns such as speech and text and generates one or more candidate categories, a set of candidate categories automatically extracted from information that allows the operator to correct categories of patterns that are incorrectly recognized. If a correction rule consisting of the relationship between correct categories is applied to subsequent pattern recognition results, and the candidate category set in the correction rule and the candidate category set included in the pattern recognition result are similar to each other,
A pattern recognition post-processing method characterized by replacing the correct category of the correction rule with the first candidate category of the pattern recognition result.
(2)前記自動抽出された訂正規則を既に訂正済みの正
解が判明しているパターン認識結果に含まれる候補カテ
ゴリ集合に適用し、前記置き換えにより訂正された総カ
テゴリに対する誤認識カテゴリが正しく訂正された総カ
テゴリ数の比率が一定値以上となる訂正規則のみを、以
後のパターン認識結果の訂正に適用することを特徴とす
る請求項(1)に記載のパターン認識後処理方式。
(2) The automatically extracted correction rule is applied to a set of candidate categories included in the pattern recognition results for which corrected correct answers are known, and the misrecognized categories for the total categories corrected by the replacement are correctly corrected. 2. The pattern recognition post-processing method according to claim 1, wherein only correction rules for which a ratio of the total number of categories exceeds a certain value are applied to subsequent correction of pattern recognition results.
JP63169664A 1988-07-07 1988-07-07 Pattern recognition post-processing system Pending JPH0218682A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63169664A JPH0218682A (en) 1988-07-07 1988-07-07 Pattern recognition post-processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63169664A JPH0218682A (en) 1988-07-07 1988-07-07 Pattern recognition post-processing system

Publications (1)

Publication Number Publication Date
JPH0218682A true JPH0218682A (en) 1990-01-22

Family

ID=15890640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63169664A Pending JPH0218682A (en) 1988-07-07 1988-07-07 Pattern recognition post-processing system

Country Status (1)

Country Link
JP (1) JPH0218682A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8985975B2 (en) 2009-02-10 2015-03-24 Bp Exploration Operating Company Limited Multistage pump suitable for use in wells

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8985975B2 (en) 2009-02-10 2015-03-24 Bp Exploration Operating Company Limited Multistage pump suitable for use in wells

Similar Documents

Publication Publication Date Title
CN110210029B (en) Method, system, device and medium for correcting error of voice text based on vertical field
CN107305768B (en) Error-prone character calibration method in voice interaction
CN108847241B (en) Method for recognizing conference voice as text, electronic device and storage medium
KR100277694B1 (en) Automatic Pronunciation Dictionary Generation in Speech Recognition System
JP4680714B2 (en) Speech recognition apparatus and speech recognition method
CN111369996A (en) Method for correcting text error in speech recognition in specific field
US20170061958A1 (en) Method and apparatus for improving a neural network language model, and speech recognition method and apparatus
CN112489626B (en) Information identification method, device and storage medium
CN113642316A (en) Chinese text error correction method and device, electronic equipment and storage medium
CN110021293A (en) Audio recognition method and device, readable storage medium storing program for executing
CN113449514B (en) Text error correction method and device suitable for vertical field
US20240135089A1 (en) Text error correction method, system, device, and storage medium
TW201544976A (en) Natural language processing system, natural language processing method, and natural language processing program
CN112669845A (en) Method and device for correcting voice recognition result, electronic equipment and storage medium
CN112101032A (en) Named entity identification and error correction method based on self-distillation
CN114896382A (en) Artificial intelligent question-answering model generation method, question-answering method, device and storage medium
CN112183060B (en) Reference resolution method of multi-round dialogue system
CN112632956A (en) Text matching method, device, terminal and storage medium
CN113012685B (en) Audio recognition method and device, electronic equipment and storage medium
CN112509565A (en) Voice recognition method and device, electronic equipment and readable storage medium
EP4027337B1 (en) Speech recognition method and apparatus, electronic device and storage medium
CN115310432A (en) Wrongly written character detection and correction method
JPH0218682A (en) Pattern recognition post-processing system
CN115099222A (en) Punctuation mark misuse detection and correction method, device, equipment and storage medium
JPH0239282A (en) Pattern recognition postprocessing system