JPH04142690A - Pattern recognition device - Google Patents

Pattern recognition device

Info

Publication number
JPH04142690A
JPH04142690A JP2266061A JP26606190A JPH04142690A JP H04142690 A JPH04142690 A JP H04142690A JP 2266061 A JP2266061 A JP 2266061A JP 26606190 A JP26606190 A JP 26606190A JP H04142690 A JPH04142690 A JP H04142690A
Authority
JP
Japan
Prior art keywords
dictionary
recognition
pattern
user
post
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2266061A
Other languages
Japanese (ja)
Other versions
JP2930246B2 (en
Inventor
Keiji Kojima
啓嗣 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2266061A priority Critical patent/JP2930246B2/en
Publication of JPH04142690A publication Critical patent/JPH04142690A/en
Application granted granted Critical
Publication of JP2930246B2 publication Critical patent/JP2930246B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

PURPOSE:To enable a pattern recognition processor to carry out necessary dictionary registration or correction appropriately and efficiently by providing a dictionary registration means with a means of referring to information about correction of an erroneously recognized character by a postprocessing means to output a message for assisting the user to recognize a correct character. CONSTITUTION:The above pattern recognition processor is provided with a recognition means 5 of recognizing an input pattern by means of pattern matching with pattern dictionary d1, a postprocessing means of correcting the result of recognition by the recognition means 5 using the dictionary of knowledge such as words or the like, and a dictionary registration means 4 of carrying out dictionary registration or correction processing. Further, the dictionary registration means 4 is provided with a means of outputting a message for assisting the user to recognize what registration or correction of dictionary should be done by referring to information about correction done by a postprocessing means on erroneously recognized character the user specified. Thereby, necessary dictionary registration or correction can be carried out firmly and efficiently without charging the user with burden.

Description

【発明の詳細な説明】 [産業上の利用分野] 本!@明は、文字認jI!装置や音声認識装置等のパタ
ーン認識装置に係り、特に入力パターンマツチングによ
って認識し、その結果を単語等の知識を用いて修正する
パターン認識装置に関する。
[Detailed description of the invention] [Industrial application field] Books! @Akira is character recognition jI! The present invention relates to a pattern recognition device such as a speech recognition device or a speech recognition device, and particularly to a pattern recognition device that performs recognition by input pattern matching and corrects the result using knowledge of words and the like.

する。do.

〔従来の技術〕[Conventional technology]

例えば文字認識装置においては、入力文字パターンをパ
ターンをマツチングによって認識するが、パターンマツ
チングのみでは認識率の向上に限界がある。そこで最近
は、パターンマツチングによる認識結果を、文字のパタ
ーンの位置、サイズ等に関するルールや単語などの知識
の辞書を用いて修正する後処理を行っている。
For example, in a character recognition device, an input character pattern is recognized by pattern matching, but there is a limit to improving the recognition rate by pattern matching alone. Therefore, recently, post-processing has been performed to correct the recognition results obtained by pattern matching using a dictionary of knowledge such as rules and words regarding the position and size of character patterns.

また、手書き文字は筆者によってパターンの特徴にかな
りの違いがあるため、認識間違いが生じた場合にパター
ン辞書の登録(更新)を行う必要がある。さらに、後処
理に用いる単語等の辞書も、出現可能性のある単語やそ
の他のルールを予め全て登録しておくことは不可能であ
るため、必要に応じて:gl録(更新)を行わければな
らない。
Furthermore, since the pattern characteristics of handwritten characters vary considerably depending on the writer, it is necessary to register (update) the pattern dictionary when a recognition error occurs. Furthermore, since it is impossible to register in advance all the words and other rules that may appear in the dictionary of words used for post-processing, GL records (updates) are performed as necessary. Must be.

このような辞書の登録(更新)に関しては、パターンを
マツチングにより認識された文字列が、単語をマツチン
グにより修正された場合に、自動的にパターン辞書の更
新を指示するようにした情報入力装置(音声認識装置)
が特開昭58−156998号公報に述べられている。
Regarding registration (update) of such a dictionary, an information input device ( voice recognition device)
is described in Japanese Patent Application Laid-open No. 156998/1983.

[発明が解決しようとする課題〕 しかし、前記公開特註公報に述べられているように単語
をマツチングで修正されたからといって、直ちにパター
ン辞書の更新を指示することは危険である。
[Problems to be Solved by the Invention] However, as stated in the above-mentioned Patent Publication, it is dangerous to immediately instruct the pattern dictionary to be updated just because a word has been corrected by matching.

すなわち、あらゆる単語を網羅した単語辞書を予め登録
しておくことは不可能であるから、パターン辞書側に問
題がなくとも、単語辞書が不備であるために誤修正され
る場合も多いからである。
In other words, it is impossible to pre-register a word dictionary that covers every word, so even if there is no problem with the pattern dictionary, incorrect corrections may occur due to deficiencies in the word dictionary. .

この場合には、パターン辞書の登録を行っても、単語を
マツチングにより同様の修正が繰り返されることになる
ので、ユーザーは困惑してしまう。
In this case, even if the pattern dictionary is registered, the same correction will be repeated by matching words, which will confuse the user.

この場合には、入力単語に対応した新しい単語の登録を
行うべできある。
In this case, a new word corresponding to the input word should be registered.

なお、このような不都合を避けるため、どのような辞書
!!緑を行うべきかの判断をユーザーに委ねるにしても
、現在の文字認識装置では、そのような判断を適確に行
うための情報がユーザーに提供されないため、適確な辞
書登録を行うことは容易ではなかった。
In addition, what kind of dictionary to avoid such inconvenience! ! Even if we leave it up to the user to decide whether or not to use green, current character recognition devices do not provide the user with the information to make such a decision accurately, making it difficult to properly register the text in a dictionary. It wasn't easy.

本発明の目的は、パターンマツチングによる認識結果を
、後処理において単語等の知識の辞書を用いて修正する
文字認識装置や音声認識装置等のパターン認識装置にお
いて、必要な辞書登録もしくは修正を適切かつ効率的に
行い得るようにすることである。
An object of the present invention is to appropriately register or modify the required dictionary in a pattern recognition device such as a character recognition device or a speech recognition device that corrects recognition results by pattern matching using a dictionary of knowledge such as words in post-processing. and to be able to do so efficiently.

[課題を解決するための手段] 特許請求の範囲の請求項(1)記載の発明は、入力パタ
ーンをパターンマツチングにより認識するI!!識手投
手段該認識手段による認識結果を単語等の知識の辞書を
利用して修正する後処理手段と、i記辞書の登録もしく
は修正の処理を行う辞書登録手段とを具備するパターン
認識装置において、前記辞書登録手段に、ユーザーより
指定された誤認識文字に対し前記後処理手段によりなさ
れた修正に関する情報を参照することによって、前記辞
書のいずれの!71録または修正を行うべきかのユーザ
ーの判断を助けるためのメツセージを出力する手段を持
たせることを特徴とする る 特許請求の範囲の請求項(2)記載の発明は、前記の如
き認識手段、後処理手段及び辞書登録手段とを具備する
パターン認識装置において、前記辞書登録手段に、ユー
ザーより指定された誤認識文字に対し前記認識手段によ
り得られた第1候補とユーザーより入力された正解文字
との比較によって、及び前記誤認識文字に対し前記後処
理手段によりなされた修正に関する情報を参照すること
によって、前記辞書のいずれの登録または修正を行うべ
きかのユーザーの判断を助けるためのメツセージを出力
する手段を持たせることを特徴とする特許請求の範囲の
請求項(3)記載の発明は、前記の如き認識手段、後処
理手段及び辞書登録手段とを具備するパターン認識装置
において、前記辞書登録手段に、ユーザーより指定され
た誤認識文字に対し前記後処理手段によりなされた修正
に関する情報を参照することによって、前記辞書のいず
れかを選択し、その登録または修正の処理を起動する手
段を持たせることを特徴とする特許請求の範囲の請求項
(4)記載の発明は、前記の如き認識手段、後処理手段
及び辞書登録手段とを具備するパターン認識装置におい
て、前記辞書登録手段に、ユーザーより指定された誤認
識文字に対し前記認識手段により得られた第1候補とユ
ーザーより入力された正解文字との比較によって、及び
前記誤認識文字に対し前記後処理手段によりなされた修
正に関する情報を参照することによって、前記辞書のい
ずれかを選択し、その登録または修正の処理を起動する
手段を持たせることを特徴とする。
[Means for Solving the Problem] The invention described in claim (1) of the claims is an I! that recognizes an input pattern by pattern matching. ! A pattern recognition device comprising: a post-processing means for modifying the recognition result of the recognition means using a dictionary of knowledge such as words; and a dictionary registration means for registering or modifying the i-written dictionary. , by referring to the dictionary registration means information regarding corrections made by the post-processing means to misrecognized characters specified by the user, the dictionary registering means can determine which one of the ! The invention as set forth in claim (2) of the present invention is characterized in that it has a means for outputting a message to assist the user in determining whether to make a correction or not. , a pattern recognition device comprising a post-processing means and a dictionary registration means, wherein the dictionary registration means receives a first candidate obtained by the recognition means and a correct answer input by the user for an incorrectly recognized character specified by the user. A message for helping the user determine which entry or correction should be made in the dictionary by comparing with the characters and by referring to information regarding corrections made to the misrecognized characters by the post-processing means. The invention as recited in claim (3) is characterized in that the pattern recognition apparatus includes a recognition means, a post-processing means, and a dictionary registration means as described above. Means for selecting one of the dictionaries in the dictionary registration means by referring to information regarding corrections made by the post-processing means to misrecognized characters specified by the user, and activating the registration or correction process. The invention as recited in claim (4) is characterized in that, in a pattern recognition device comprising a recognition means, a post-processing means, and a dictionary registration means as described above, the dictionary registration means has a , regarding the correction made to the incorrectly recognized character by comparing the first candidate obtained by the recognition means with the correct character input by the user for the incorrectly recognized character specified by the user, and by the post-processing means to the incorrectly recognized character specified by the user. The present invention is characterized by having a means for selecting one of the dictionaries by referring to the information and starting processing for registering or modifying the dictionary.

〔作 用〕[For production]

請求項(1)または(2)記載の発明によれば、ユーザ
ーはメツセージを参考にして必要な辞書の登録または修
正を容易にかつ的確に判断し、その処理を行うことがで
きる。
According to the invention described in claim (1) or (2), the user can easily and accurately determine the necessary dictionary registration or modification by referring to the message, and can perform the process.

請求項(3)または(4)記載の発明によれば、ユーザ
ーの判断に依存せずに、適確な辞書の登録または修正を
自動的に選択して行うことができる。
According to the invention described in claim (3) or (4), it is possible to automatically select and perform appropriate dictionary registration or modification without depending on the user's judgment.

〔実施例] 第1図は本発明の一実施例に係る文字認識装置のブロッ
ク図である。
[Embodiment] FIG. 1 is a block diagram of a character recognition device according to an embodiment of the present invention.

1は原稿の画像を読取り2値データとして入力するスキ
ャナー、2はその入力画像データを記憶する画像メモリ
である。3は各種の処理及び制御を実行する中央演算処
理装置(CPU)、4はCPU3で実行される各種の処
理、制御のプログラムやオペレーティングシステム等を
格納したプログラムメモ1ハ5はCPU3による処理の
中間データや処理結果データ等を記憶するためのワーク
メモリ、6はパターンマツチングによる入力文字の認識
のためのパターン辞書d1及び後処理のための単語辞書
d2やルール辞書d3を記憶するための辞書メモリであ
る。7,8及び9はユーザーインタフェースのためのデ
イスプレィ、キーボード及びマウスである。
1 is a scanner that reads an image of a document and inputs it as binary data, and 2 is an image memory that stores the input image data. 3 is a central processing unit (CPU) that executes various processes and controls; 4 is a program memo 1 that stores various processes executed by the CPU 3, control programs, operating systems, etc.; and 5 is an intermediate unit for processing by the CPU 3. A work memory for storing data, processing result data, etc.; 6 a dictionary memory for storing a pattern dictionary d1 for recognizing input characters by pattern matching; a word dictionary d2 and a rule dictionary d3 for post-processing; It is. 7, 8 and 9 are a display, keyboard and mouse for a user interface.

プログラムメモリ4に格納される文字認識に関連したプ
ログラムとしては、画像メモリ2に格納された画像に対
する文字画像切出し、文字画像の正規化等の前処理のた
めの前処理プログラムpl。
Examples of programs related to character recognition stored in the program memory 4 include a preprocessing program pl for preprocessing the images stored in the image memory 2, such as character image extraction and character image normalization;

パターンマツチングによる文字認識のための認識プログ
ラムp2、パターンマツチングによる認識結果に対して
単語辞書d2やルール辞書d3を用いた後処理を行うた
めの後処理プログラムp3、認識結果の修正のため修正
処理プログラムp4、パターン辞書d1または単語辞書
d2の登録あるいはルール辞書d3の登録もしくは修正
のための辞書!Ef!プログラムp5がある。
A recognition program p2 for character recognition by pattern matching, a post-processing program p3 for post-processing the recognition results by pattern matching using a word dictionary d2 and a rule dictionary d3, and a modification to correct the recognition results. A dictionary for registering the processing program p4, pattern dictionary d1 or word dictionary d2, or registering or modifying the rule dictionary d3! Ef! There is a program p5.

なお、この辞書登録プログラムp5は、4種類のモード
をユーザーがキーボード8またはマウス9の操作によっ
て選択することができる。第1モードと第2モードは、
どのような辞書の登録(修正)を行うべきかの判断をユ
ーザーに委ねるモードである。第3モードと第4モード
は、その判断にユーザを介入させないモードである。
Note that this dictionary registration program p5 allows the user to select four types of modes by operating the keyboard 8 or mouse 9. The first mode and the second mode are
This mode leaves the decision of what kind of dictionary registration (modification) should be performed to the user. The third mode and the fourth mode are modes in which the user does not intervene in the judgment.

次に文字認識処理の内容について説明する。Next, the contents of the character recognition process will be explained.

原稿の画像データが画像メモリ2に格納されると、前処
理プログラムpiが起動し、入力画像よノ リ行が切り出され、次に文字画像が切り出されて正規化
される。正規化文字画像や文字切出しの情報はワークメ
モリ5に一時的に記憶される。
When the image data of the original is stored in the image memory 2, a preprocessing program pi is started, and lines are cut out from the input image, and then character images are cut out and normalized. The normalized character image and character cutting information are temporarily stored in the work memory 5.

例えば1行以上の文字画像切出しが終了すると認識プロ
グラムp2が起動し、正規化文字画像のパターンマツチ
ングによる文字認識が実行される。
For example, when one or more lines of character image extraction is completed, the recognition program p2 is started and character recognition is executed by pattern matching of the normalized character images.

具体的には、文字画像の特徴量が抽出され、辞書メモリ
6に記憶されている各パターン辞書d1(標準パターン
の特徴量)との距離演算が行われ、距離が小さい順にソ
ートされた候補がn位まで得られる。候補の文字コード
はワークメモリ5の認識結果エリアa1に格納される。
Specifically, the feature amount of the character image is extracted, a distance calculation is performed with each pattern dictionary d1 (standard pattern feature amount) stored in the dictionary memory 6, and the candidates are sorted in descending order of distance. It can be obtained up to the nth position. The candidate character codes are stored in the recognition result area a1 of the work memory 5.

例えば1行以上についてパターンマツチングによる認識
結果が得られると後処理プログラムp3が起動し、認識
結果エリアミl内の認識結果に対して後処理が行われる
For example, when recognition results are obtained by pattern matching for one or more lines, the post-processing program p3 is activated, and post-processing is performed on the recognition results within the recognition result area 1.

まず、ワークメモリ5に記憶されている切出し情報及び
候補の文字コードを参照し、文字画像の行内での相対的
位置(「・」と「、」の区別等に関係)、文字の大きさ
(文字画像を正規化するのでCとCの区別などに関係)
、文字種(カタカナ文字列中に漢数字の「−」があった
ら、これはカタカナの長音記号「−」に修正するなど)
等の知識であるルール辞書d3を適用することにより、
認識結果エリアミl内のパターンマツチングによる候補
文字列を修正し、修正結果を最終認識結果エリアa2に
格納する。また、この修正が行われた文字については、
予め決められた固有の数値情報を修正情報として認識結
果エリアa2に認識結果とペアにして格納する。
First, the extraction information and candidate character codes stored in the work memory 5 are referred to, and the relative position of the character image within the line (related to the distinction between "・" and ",", etc.), the character size ( Since character images are normalized, this is related to the distinction between C and C, etc.)
, character type (if there is a kanji numeral "-" in the katakana string, change it to a katakana long sound symbol "-", etc.)
By applying the rule dictionary d3, which is the knowledge of
The candidate character string by pattern matching in the recognition result area mil is corrected, and the correction result is stored in the final recognition result area a2. Also, for characters that have been modified,
Predetermined unique numerical information is stored as correction information in a pair with the recognition result in the recognition result area a2.

この最終認識結果エリアミ2内の文字列に対して形態素
解析、単語辞書d2とのマツチングが行われ、必要な修
正がなされる。ここで修正された場合は、予め決められ
た固有の数字情報が修正情報として最終認識結果エリア
a2に認識結果とペアにして格納される。この処理後の
認識結果が最終的な認識結果となる。
Morphological analysis and matching with the word dictionary d2 are performed on the character strings in the final recognition result Ariami2, and necessary corrections are made. If the information is modified here, predetermined unique numerical information is stored as modification information in the final recognition result area a2 as a pair with the recognition result. The recognition result after this processing becomes the final recognition result.

、このような文字認識が例えば1枚の原稿について終了
した時点で(デイスプレィ7の画面には最終認識結果エ
リアミ2内の第1位候補が表示されている)、修正処理
プログラムp4を起動して認識結果の修正を行い、また
辞書登録プログラムp5を起動して誤認識文字に関連し
た辞書登録を行うことができる。修正処理と辞書登録を
同時に行うことも可能である。
When such character recognition is completed for, for example, one document (the first candidate in the final recognition result Ariami 2 is displayed on the display 7 screen), start the correction processing program p4. The recognition result can be corrected, and the dictionary registration program p5 can be activated to perform dictionary registration related to the misrecognized character. It is also possible to perform correction processing and dictionary registration at the same time.

次に辞書登録処理についてモード別に説明する。Next, dictionary registration processing will be explained for each mode.

なお、第2図は第1モードの説明のためのフローチャー
ト、第3図は第2モードの説明のためのフローチャート
、第4図は第3モードの説明のためのフローチャート、
第5図は第4モードの説明のためのフローチャートであ
る。
In addition, FIG. 2 is a flowchart for explaining the first mode, FIG. 3 is a flowchart for explaining the second mode, and FIG. 4 is a flowchart for explaining the third mode.
FIG. 5 is a flowchart for explaining the fourth mode.

第1モード ユーザーは5デイスプレイ7の画面上で、誤認識文字を
例えばマウス9を用いて指定する。
The first mode user specifies the misrecognized character on the screen of the 5-display 7 using, for example, the mouse 9.

辞書登録プログラムp5は、誤認識文字の指定入力を待
ち(ステップ100)、誤認識文字が指定されると、そ
の誤認識文字に対応した数値情報(修正情報)を最終認
識結果エリアa2より読み出しくステップ102)、そ
の数値情報に対応したメツセージをデイスプレィ画面に
出力させ(ステップ104)、ユーザーからの指示を持
つ(ステップ106)。
The dictionary registration program p5 waits for a designation input of a misrecognized character (step 100), and when a misrecognized character is specified, reads numerical information (correction information) corresponding to the misrecognized character from the final recognition result area a2. Step 102), a message corresponding to the numerical information is output on the display screen (Step 104), and instructions are received from the user (Step 106).

読み出した数値情報と出力メツセージの関係は例えば次
の通りである。数値情報が後処理での無修正を意味する
場合、指定された誤認識文字はパターン辞書を用いた認
識処理で間違った可能性が高いので、パターン辞書登録
を勧めるメツセージを出力する。数値情報が単語辞書d
2を用いた後処理による修正を意味する場合、単語辞書
d2に必要な単語が登録されていないために間違った可
能性が高いので、単語辞書登録を勧めるメツセージを出
力する。数値情報がルール辞書d3を用いた後処理によ
る修正を意味する場合、ルール辞書d3に必要なルール
が未登録(あるいは不適切)であるために間違った可能
性が高いので、ルール辞書登録(あるいは修正)を勧め
るメツセージを出力する6単語辞書d2を用いた後処理
での修正を意味する数値情報とルール辞書d3を用いた
後処理での修正を意味する数値情報の両方が読み出され
た場合は、両方または一方の辞書に必要な単耐イたはル
ールが未登録であるため(あるいはルールが不適切であ
るため)に間違った可能性があるので、ルール辞書登録
または単語辞書登録の一方または両方の登録(修正)を
勧めるメツセージを出力する。
For example, the relationship between the read numerical information and the output message is as follows. If the numerical information means no modification in post-processing, there is a high possibility that the specified misrecognized character was erroneously recognized in the recognition process using the pattern dictionary, so a message recommending registration in the pattern dictionary is output. Numerical information is a word dictionary d
If it means correction by post-processing using 2, there is a high possibility that the word is incorrect because the necessary word is not registered in the word dictionary d2, so a message recommending that the word be registered in the word dictionary is output. If the numerical information means correction by post-processing using the rule dictionary d3, there is a high possibility that the necessary rules in the rule dictionary d3 are unregistered (or inappropriate) and are incorrect, so the rule dictionary registration (or If both numerical information indicating correction in post-processing using the 6-word dictionary d2 and numerical information indicating correction in post-processing using the rule dictionary d3 are read out, a message recommending correction) is read out. may be wrong because the required unit or rule is not registered in both or one of the dictionaries (or the rule is inappropriate), so either the rule dictionary registration or the word dictionary registration. Or output a message recommending registration (correction) of both.

ユーザーは、デイスプレィ画面に出力されたメツセージ
を参考して、辞書登録(修正)をするか否か、どの辞書
の登録(修正)を行うかを判断し、判断結果をマウス9
またはキーボード8を用いて入力する。
The user refers to the message output on the display screen, decides whether or not to register (modify) the dictionary, and which dictionary to register (modify), and then displays the decision using the mouse 9.
Or input using the keyboard 8.

辞書登II(修正)が指示された場合、辞書登録プログ
ラムp5は、ユーザーより指定された辞書の登録(修正
)を行うが、その際に必要な情報の入力を促す入力メツ
セージをデイスプレィ画面に出力する(ステップ108
)。ユーザーはデイスプレィ画面の入力メツセージに従
って、パターン辞書登録を行う場合には誤ms文字の正
解文字を、単語辞書登録を行う場合は登録したい単語を
、ルール辞書登録を行う場合は登録したいルールの情報
をそれぞれキーボード8より入力する。辞書登録プログ
ラムp5は、パターン辞書登録を指定された場合、例え
ば認識プログラムp2によって先に抽出された誤認識文
字の特徴量をワークメモリ5より読み出し、これをその
まま、あるいは必要な加工を施してから、ユーザーより
入力された正解文字のコードを対応させてパターン辞書
dlに登録する。単語辞書gl録を指定された場合、ユ
ーザーより入力された単語(文字列)を単語辞書d2に
登録する。ルール辞書登録(修正)を指定された場合、
ユーザーはユーザーより指定されたルールの情報をルー
ル辞書d3に登録する(あるいはルール辞書d3の内容
を修正する)。
When dictionary registration II (correction) is instructed, the dictionary registration program p5 registers (corrects) the dictionary specified by the user, but at that time outputs an input message on the display screen prompting for input of necessary information. (step 108
). Following the input messages on the display screen, the user inputs the correct character for the incorrect ms character when registering a pattern dictionary, the word he or she wants to register when registering a word dictionary, and the information about the rule he or she wants to register when registering a rule dictionary. Each input is made from the keyboard 8. When pattern dictionary registration is specified, the dictionary registration program p5 reads, for example, the feature amount of the misrecognized character previously extracted by the recognition program p2 from the work memory 5, and reads it as is or after performing necessary processing. , the code of the correct character input by the user is associated and registered in the pattern dictionary dl. When the word dictionary GL is specified, the word (character string) input by the user is registered in the word dictionary d2. If rule dictionary registration (modification) is specified,
The user registers information on rules specified by the user in the rule dictionary d3 (or modifies the contents of the rule dictionary d3).

第2モード ユーザーは、デイスプレィ7の画面上で、誤認識文字を
例えばマウス9を用いて指定するとともにキーボード8
を用いて正解文字を入力する。
The second mode user specifies the misrecognized character on the screen of the display 7 using, for example, the mouse 9 and also uses the keyboard 8.
Enter the correct character using .

辞書登録プログラムp5は、誤認識文字の指定及び正解
文字の入力を待ち(ステップ200)、誤認識文字が指
定され、その正解文字が入力されると、誤認識文字に対
する認識プログラムp2による認識結果の第1位候補の
文字コードを認識結果エリアa1より読み出し、これを
正解文字のコードとの一致判定を行う(ステップ202
)。
The dictionary registration program p5 waits for the designation of the misrecognized character and the input of the correct character (step 200). When the misrecognized character is designated and the correct character is input, the dictionary registration program p5 updates the recognition result of the recognition program p2 for the misrecognized character. The character code of the first candidate is read from the recognition result area a1, and a match is determined with the code of the correct character (step 202
).

第1位候補文字と正解文字とが不一致の場合、辞書登録
プログラムp5は、パターン辞書登録を行う必要がある
旨のメツセージをデイスプレィ7の画面に出力しくステ
ップ206)、ユーザーの判断を待つ(ステップ206
)、ユーザーは画面のメツセージを参考にしてパターン
辞書登録を行うか否か−の判断をし、その判断結果をキ
ーボード8より入力する。ユーザーから登録指示が入力
されると、辞書登録プログラムp5は、例えば認識プロ
グラムp2によって先に抽出された誤認識文字の特徴量
をワークメモリ5より読み出し、これをそのまま、ある
いは必要な加工を施してから、ユーザーより入力された
正解文字のコードと対応させてパターン辞書d1に登録
する(ステップ208)。
If the first candidate character and the correct character do not match, the dictionary registration program p5 outputs a message to the screen of the display 7 to the effect that pattern dictionary registration is necessary (step 206), and waits for the user's decision (step 206). 206
), the user makes a decision as to whether or not to register the pattern dictionary by referring to the message on the screen, and inputs the decision result from the keyboard 8. When a registration instruction is input from the user, the dictionary registration program p5 reads the feature amount of the misrecognized character previously extracted by the recognition program p2, for example, from the work memory 5, and uses it as it is or after performing necessary processing. are registered in the pattern dictionary d1 in association with the code of the correct character input by the user (step 208).

ステップ202で一致と判定した場合、辞書登録プログ
ラムp5は指定された誤認識文字に対応する数値情報(
修正情報)を最終認識結果エリアa2より読み出しくス
テップ210) 、その数値情報に対応したメツセージ
をデイスプレィ画面に出力させ(ステップ212)、ユ
ーザーからの指示を待つ(ステップ214)。
If it is determined that there is a match in step 202, the dictionary registration program p5 stores the numerical information (
(Step 210), a message corresponding to the numerical information is output on the display screen (Step 212), and instructions from the user are awaited (Step 214).

読み出した数値情報と出力メツセージの関係は例えば次
の通りである。数値情報が単語辞書d2を用いた後処理
により修正を意味する場合には、単語辞書登録が必要で
ある旨のメツセージを出力する。数値情報がルール辞書
d3を用いた後処理による修正を意味する場合、ルール
辞書登録が必要である旨のメツセージを出力する。単語
辞書d2を用いた後処理での修正を意味する数値情報と
ルール辞書d3を用いた後処理での修正を意味する数値
情報の両方が読み出された場合は、ルール辞書登録また
は単語辞書登録の一方または両方の登録が必要である旨
のメツセージを出力する。
For example, the relationship between the read numerical information and the output message is as follows. If the numerical information means correction by post-processing using the word dictionary d2, a message to the effect that word dictionary registration is necessary is output. If the numerical information indicates correction by post-processing using the rule dictionary d3, a message indicating that registration in the rule dictionary is required is output. If both numerical information indicating correction in post-processing using word dictionary d2 and numerical information indicating correction in post-processing using rule dictionary d3 are read, rule dictionary registration or word dictionary registration is performed. Outputs a message to the effect that one or both of the above must be registered.

ユーザーは、デイスプレィ画面に出力されたメツセージ
を参考にして、辞書登#(修正)をするか否か、どの辞
書の登録(修正)を行うかを判断し、判断結果をマウス
9またはキーボード8を用いて入力する。
Referring to the message output on the display screen, the user decides whether or not to register (modify) the dictionary and which dictionary to register (modify), and uses the mouse 9 or keyboard 8 to transmit the decision result. Enter using

辞書壁#(修正)が指示された場合、辞書登録プログラ
ムp5は、ユーザーより指定された辞書の登録(修正)
を行うが、その際に必要な情報の入力を促す入力メツセ
ージをデイスプレィ画面に出力する(ステップ216)
。ユーザーはデイスプレィ画面の入力メツセージに従っ
て、単語辞書登録を行う場合は登録したい単語を、ルー
ル辞書壁#k(修正)を行う場合は、必要なルールの情
報をそれぞれキーボード8より入力する。辞書登録プロ
グラムp5は、単語辞書登録を指定された場合にはユー
ザーより入力された単語を単語辞書d2に登録し、ルー
ル辞書登録(修正)を指定された場合にはユーザーより
指定されたルールの情報をルール辞書d3に!71録す
る(入力情報に基づいてルール辞書d3の内容を修正す
る)。
When dictionary wall # (modification) is instructed, the dictionary registration program p5 registers (modifies) the dictionary specified by the user.
At that time, an input message prompting the input of necessary information is output on the display screen (step 216).
. In accordance with the input messages on the display screen, the user inputs the word he or she wishes to register using the keyboard 8 when registering a word dictionary, and inputs necessary rule information when performing rule dictionary wall #k (correction). The dictionary registration program p5 registers the word input by the user in the word dictionary d2 when word dictionary registration is specified, and registers the word input by the user in the word dictionary d2 when rule dictionary registration (correction) is specified. Information in rule dictionary d3! 71 (correct the contents of the rule dictionary d3 based on the input information).

第3モード ユーザーは、デイスプレィ画面上で、誤認識文字を例え
ばマウス9を用いて指定する。
The third mode user specifies the misrecognized character on the display screen using, for example, the mouse 9.

d−登録プログラムp5は、誤認識文字の指定入力を待
ち(ステップ300)、誤認識文字が指定されると、そ
の誤認識文字に対応した数値情報(修正情報)を最終認
識結果エリアa2より読み出しくステップ302)、そ
の数値情報に基づいて辞書登録機能を選択して起動する
(ステップ304)、この機能の選択方法はユーザーの
判断を介入させないことを除けば前記第1モードの場合
と同様である。そして、起動した辞書登録機能の名称と
ともに必要な情報の入力を促す入力メツセージをデイス
プレィ画面に出力させ(ステップ306)、ユーザーか
らの入力を待つ(ステップ3o8)。
The d-registration program p5 waits for input of designation of the misrecognized character (step 300), and when the misrecognition character is specified, reads numerical information (correction information) corresponding to the misrecognized character from the final recognition result area a2. (step 302), and selects and activates a dictionary registration function based on the numerical information (step 304). The method for selecting this function is the same as in the first mode, except that the user's judgment is not intervened. be. Then, an input message prompting the input of necessary information along with the name of the activated dictionary registration function is output on the display screen (step 306), and an input from the user is waited for (step 3o8).

ユーザーは、入力メツセージに従って、パターン辞書登
録機能が選択された場合は正解文字を入力し、単語辞書
登録機能が選択された場合は単語を入力し、ルール辞書
登録(修正)機能が選択された場合は登録したいルール
の情報(またはルール修正のための情報)を入力する。
According to the input message, the user inputs the correct character when the pattern dictionary registration function is selected, the word when the word dictionary registration function is selected, and the user inputs the correct character when the rule dictionary registration (correction) function is selected. Enter information about the rule you want to register (or information for modifying the rule).

辞書登録プログラムp5は、ユーザーより入力された情
報を用いて、選択した辞書の登録(修正)を実行する(
ステップ310)。
The dictionary registration program p5 registers (modifies) the selected dictionary using the information input by the user (
step 310).

第4モード ユーザーは、デイスプレィ画面上で誤認識文字を例えば
マウス9を用いて指定し、キーボード8より正解文字を
入力する。
In the fourth mode, the user specifies the misrecognized character on the display screen using, for example, the mouse 9, and inputs the correct character using the keyboard 8.

辞書登録プログラムp5は、誤認識文字の指定と正解文
字の入力を待ち(ステップ400)、この入力がなされ
ると、指定された誤認識文字に対するパターンマツチン
グによる認識結果の第1候補文字を認識結果エリアa1
より読み出し、これは入力された正解文字との一致を調
べる(ステップ402)。
The dictionary registration program p5 waits for the specification of the misrecognized character and the input of the correct character (step 400), and when this input is made, it recognizes the first candidate character of the recognition result by pattern matching for the specified misrecognition character. Results area a1
This is read out and checked to see if it matches the input correct character (step 402).

この比較が不一致の場合、辞書登録プログラムp5はパ
ターン辞書登録機能を選択して起動しくステップ404
)、誤認識文字のパターンのパターン辞書d1への登録
処理を実行する(ステップ406)。
If this comparison does not match, the dictionary registration program p5 selects and starts the pattern dictionary registration function in step 404.
), the process of registering the pattern of the misrecognized character in the pattern dictionary d1 is executed (step 406).

ステップ402の比較が一致した場合、辞書登録プログ
ラムp5は、最終認識結果エリアa2より誤認識文字に
対応した数値情報すなわち修正情報を読み出しくステッ
プ408)、それを解析することにより必要な単語辞書
登録またはルール辞書登録(修正)の一方または両方の
機能を選んで起動しくステップ410)、その機能の名
称とともに必要な情報の入力を促す入力メツセージをデ
イスプレィ画面に出力させ(ステップ412)、ユーザ
ーからの入力を待つ(ステップ414)。
If the comparison in step 402 results in a match, the dictionary registration program p5 reads numerical information corresponding to the misrecognized character, that is, correction information, from the final recognition result area a2 (step 408), and registers the necessary word dictionary by analyzing it. Alternatively, select and activate one or both of the rule dictionary registration (modification) functions (step 410), output an input message on the display screen prompting for the name of the function and necessary information (step 412), and Wait for input (step 414).

ユーザーより必要な情報が入力されると、辞書登録プロ
グラムp5は、入力情報を用いて、選択した辞書壁a(
修正)処理を実行する(ステップ416)。
When the user inputs the necessary information, the dictionary registration program p5 uses the input information to select the dictionary wall a(
correction) processing is executed (step 416).

以上、文字rE識装置の実施例について説明したが、例
えば前処理で入力音声の単音節のパターンを切り出し、
パターンをマツチングにより単音節を認識し、それに対
して単語辞書等を用いた後処理を行うような音声認識装
置等にも、本発明を同様に適用できる。
The embodiments of the character rE recognition device have been described above.
The present invention can be similarly applied to a speech recognition device that recognizes a single syllable by matching patterns and performs post-processing using a word dictionary or the like.

〔発明の効果〕〔Effect of the invention〕

以上、詳細に説明した如く、本発明によれば。 As described above in detail, according to the present invention.

ユーザーに負担をかけずに、必要な辞書の登録または修
正を的確かつ効率的に行うことができるため、従来より
ユーザーに親切な使いやすい文字認識装置等を実現でき
る。
Since necessary dictionary registration or modification can be performed accurately and efficiently without placing a burden on the user, it is possible to realize a character recognition device that is more user-friendly and easier to use than ever before.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例に係る文字認識装置のブロッ
ク図、第2rgJ乃至@58Uはそれぞれ辞書登録処理
の各1モードの説明のためのフローチャートである。 1・・・スキャナー、  2・・・画像メモリ、  3
・・・CPU、  4・・・プログラムメモリ、  5
・・・ワークメモリ、  6・・・辞書メモリ、 7・
・・デイスプレィ、  8・・・キーボード、  9・
・・マウス、dl−・・パターン辞書、 d2・・・単
語辞書、d3・・・ルール辞書、 pl・・・前処理プ
ログラム、p2・・・認識プログラム、  p3・・・
後処理プログラム、 p4・・・修正処理プログラム、
p5・・・辞書登録プログラム。 第2 図 算 モード。 第3図 第4図 v3モード
FIG. 1 is a block diagram of a character recognition device according to an embodiment of the present invention, and 2rgJ to @58U are flowcharts for explaining each mode of dictionary registration processing. 1... Scanner, 2... Image memory, 3
...CPU, 4...Program memory, 5
...Work memory, 6.Dictionary memory, 7.
・・Display, 8・Keyboard, 9・
...Mouse, dl-...Pattern dictionary, d2...Word dictionary, d3...Rule dictionary, pl...Pre-processing program, p2...Recognition program, p3...
Post-processing program, p4...correction processing program,
p5...Dictionary registration program. Second calculation mode. Figure 3 Figure 4 v3 mode

Claims (4)

【特許請求の範囲】[Claims] (1)入力パターンをパターン辞書とのパターンマッチ
ングにより認識する認識手段と、該認識手段による認識
結果を単語等の知識の辞書を利用して修正する後処理手
段と、前記辞書の登録もしくは修正の処理を行う辞書登
録手段とを具備し、前記辞書登録手段は、ユーザーより
指定された誤認識文字に対し前記後処理手段によりなさ
れた修正に関する情報を参照することによって、前記辞
書のいずれの登録または修正を行うべきかのユーザーの
判断を助けるためのメッセージを出力する手段を有する
ことを特徴とするパターン認識装置。
(1) A recognition means for recognizing an input pattern by pattern matching with a pattern dictionary, a post-processing means for modifying the recognition result by the recognition means using a dictionary of knowledge such as words, and a post-processing means for registering or modifying the dictionary. and dictionary registration means for processing, and the dictionary registration means registers any of the registrations or registrations in the dictionary by referring to information regarding corrections made by the post-processing means to misrecognized characters specified by the user. A pattern recognition device characterized by having means for outputting a message to help a user decide whether or not to make a correction.
(2)入力パターンをパターン辞書とのパターンマッチ
ングにより認識する認識手段と、該認識手段による認識
結果を単語等の知識の辞書を利用して修正する後処理手
段と、前記辞書の登録もしくは修正の処理を行う辞書登
録手段とを具備し、前記辞書登録手段は、ユーザーより
指定された誤認識文字に対し前記認識手段により得られ
た第1候補とユーザーより入力された正解文字との比較
によって、及び前記誤認識文字に対し前記後処理手段に
よりなされた修正に関する情報を参照することによって
、前記辞書のいずれの登録または修正を行うべきかのユ
ーザーの判断を助けるためのメッセージを出力する手段
を有することを特徴とするパターン認識装置。
(2) a recognition means for recognizing an input pattern by pattern matching with a pattern dictionary; a post-processing means for modifying the recognition result by the recognition means using a dictionary of knowledge such as words; and a post-processing means for registering or modifying the dictionary. and a dictionary registration means for processing, and the dictionary registration means compares the first candidate obtained by the recognition means with the correct character input by the user for the misrecognized character specified by the user. and means for outputting a message to help the user determine which entry or correction should be made in the dictionary by referring to information regarding corrections made to the misrecognized characters by the post-processing means. A pattern recognition device characterized by:
(3)入力パターンをパターン辞書とのパターンマッチ
ングにより認識する認識手段と、該認識手段による認識
結果を単語等の知識の辞書を利用して修正する後処理手
段と、前記辞書の登録もしくは修正の処理を行う辞書登
録手段とを具備し、前記辞書登録手段は、ユーザーより
指定された誤認識文字に対し前記後処理手段によりなさ
れた修正に関する情報を参照することによって、前記辞
書のいずれかを選択し、その登録または修正の処理を起
動する手段を有することを特徴とするパターン認識装置
(3) a recognition means for recognizing an input pattern by pattern matching with a pattern dictionary; a post-processing means for modifying the recognition result by the recognition means using a dictionary of knowledge such as words; and a post-processing means for registering or modifying the dictionary. dictionary registration means for performing processing, and the dictionary registration means selects one of the dictionaries by referring to information regarding corrections made by the post-processing means to misrecognized characters specified by the user. A pattern recognition device characterized in that it has means for activating a registration or modification process.
(4)入力パターンをパターン辞書とのパターンマッチ
ングにより認識する認識手段と、該認識手段による認識
結果を単語等の知識の辞書を利用して修正する後処理手
段と、前記辞書の登録もしくは修正の処理を行う辞書登
録手段とを具備し、前記辞書登録手段は、ユーザーより
指定された誤認識文字に対し前記認識手段により得られ
た第1候補とユーザーより入力された正解文字との比較
によって、及び前記誤認識文字に対し前記後処理手段に
よりなされた修正に関する情報を参照することによって
、前記辞書のいずれかを選択し、その登録または修正の
処理を起動する手段を有することを特徴とするパターン
認識装置。
(4) a recognition means for recognizing an input pattern by pattern matching with a pattern dictionary; a post-processing means for modifying the recognition result by the recognition means using a dictionary of knowledge such as words; and a post-processing means for registering or modifying the dictionary. and a dictionary registration means for processing, and the dictionary registration means compares the first candidate obtained by the recognition means with the correct character input by the user for the misrecognized character specified by the user. and means for selecting one of the dictionaries and activating its registration or correction process by referring to information regarding corrections made by the post-processing means to the erroneously recognized characters. recognition device.
JP2266061A 1990-10-03 1990-10-03 Pattern recognition device Expired - Lifetime JP2930246B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2266061A JP2930246B2 (en) 1990-10-03 1990-10-03 Pattern recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2266061A JP2930246B2 (en) 1990-10-03 1990-10-03 Pattern recognition device

Publications (2)

Publication Number Publication Date
JPH04142690A true JPH04142690A (en) 1992-05-15
JP2930246B2 JP2930246B2 (en) 1999-08-03

Family

ID=17425835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2266061A Expired - Lifetime JP2930246B2 (en) 1990-10-03 1990-10-03 Pattern recognition device

Country Status (1)

Country Link
JP (1) JP2930246B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189983A (en) * 2000-12-21 2002-07-05 Toshiba Corp Character recognizing device and delivery processor
JP2015130068A (en) * 2014-01-07 2015-07-16 東芝テック株式会社 Information processing apparatus, shop system, and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002189983A (en) * 2000-12-21 2002-07-05 Toshiba Corp Character recognizing device and delivery processor
JP2015130068A (en) * 2014-01-07 2015-07-16 東芝テック株式会社 Information processing apparatus, shop system, and program

Also Published As

Publication number Publication date
JP2930246B2 (en) 1999-08-03

Similar Documents

Publication Publication Date Title
JPH04142690A (en) Pattern recognition device
JP2000348141A (en) Method and device for predicting input information, and program storage medium
US5974370A (en) System for reviewing its processing and method therefor
JPH09282309A (en) Document editing and proofreading processor
JPH07302306A (en) Character inputting device
JPH06251187A (en) Method and device for correcting character recognition error
JPH07182441A (en) Character recognition device
JPH11120294A (en) Character recognition device and medium
JPH0290384A (en) Post-processing system for character recognizing device
JP4092768B2 (en) Character recognition device and character recognition method
JPH0612520A (en) Confirming and correcting system for character recognizing device
JPH0540853A (en) Post-processing system for character recognizing result
JPH07152877A (en) English alphabet recognition device
JPH0458381A (en) Optical character reader
JPH0289191A (en) Recognized result correcting system
JPH0484383A (en) Character recognizing device
JPH0291785A (en) Character recognizing device
JPS63800B2 (en)
JPH076201A (en) Character recognition parameter control method
JPH0358182A (en) Character input device
JPH08221508A (en) Character recognition processor
JPH07239913A (en) Character recognition device
JPH08287190A (en) Optical character reader
JPH10301597A (en) Voice recognition device
JPH05258115A (en) Dictionary registration control system