JPH08180141A - Character recognition system - Google Patents

Character recognition system

Info

Publication number
JPH08180141A
JPH08180141A JP6334600A JP33460094A JPH08180141A JP H08180141 A JPH08180141 A JP H08180141A JP 6334600 A JP6334600 A JP 6334600A JP 33460094 A JP33460094 A JP 33460094A JP H08180141 A JPH08180141 A JP H08180141A
Authority
JP
Japan
Prior art keywords
character recognition
recognition
character
learning data
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6334600A
Other languages
Japanese (ja)
Inventor
Rei Matsubara
玲 松原
Kazutaka Kawakami
和隆 川上
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP6334600A priority Critical patent/JPH08180141A/en
Publication of JPH08180141A publication Critical patent/JPH08180141A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE: To provide a character recognition system which can greatly be improved in recognition performance only by providing a small memory on the side of a terminal character recognition device. CONSTITUTION: In this character recognition system provided with a center device 1 which generates a recognition dictionary by learning learning data and the terminal character recognition device 2 which performs character recognition by dictionary downloaded from the center device, the terminal character recognition device is provided with a storage means 6 which stores the learning data gathered in the execution process of the character recognition until the data are sent to the center device, and the center device is provided with a learning means 16 which updates the recognition dictionary by learning a learning database where the learning data are added and a distributing means 19 which distributes-the updated dictionary to the terminal character recognition device. The terminal character recognition device stores a character which can not be recognized in the process of the character recognition and a misrecognized character as learning data and sends them to the center device when a certain number of data are stored, and the center device learns the learning data additionally to the saved learning data, updates the dictionary, and downloads the updated dictionary to the terminal character, recognition device.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字や数字を読取る文
字認識システムに関し、特に、システムを運用しながら
認識性能の向上を図るための学習データの収集を行ない
得るようにしたものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition system for reading characters and numbers, and more particularly to a system capable of collecting learning data for improving recognition performance while operating the system.

【0002】[0002]

【従来の技術】文字読取り装置では、読取った文字や数
字を認識辞書と照合して、その文字を認識しているが、
この認識辞書を文字読取り装置で個別に持つとなると、
大容量の蓄積手段が必要となり、装置のコスト高を招
く。そこで、センターマシンに文字認識の認識辞書を格
納し、このセンターマシンに接続する各端末文字認識装
置が、必要とする辞書をそこからダウンロードして、文
字認識を実行するように構成した文字認識システムが考
えられている(特開平4−268682、特開平4−3
8585、特開平3−33968など)。
2. Description of the Related Art In a character reading device, the read character or number is collated with a recognition dictionary to recognize the character.
If you have this recognition dictionary individually in the character reader,
A large-capacity storage means is required, which increases the cost of the device. Therefore, a character recognition system configured to store a character recognition recognition dictionary in the center machine, and each terminal character recognition device connected to the center machine downloads the required dictionary from the dictionary and executes character recognition. Are considered (JP-A-4-268682, JP-A-4-3)
8585, JP-A-3-33968, etc.).

【0003】この文字認識システムは、図8(a)に示
すように、センターマシン3には、学習データを学習し
て認識辞書を作成するCPU32と、作成された認識辞書
を格納するメモリ31と、キーボードなどの入力装置34
と、操作画面を表示するディスプレイ33と、端末と通信
を行なう通信部35とを備えており、また、図8(b)に
示すように、端末文字認識装置4には、画像を読取るス
キャナ41と、センターマシン3と通信を行なう通信部42
と、ロードされた認識辞書を格納するメモリ45と、この
認識辞書を用いて文字認識を行なうCPU44と、CPU
44のプログラムを格納するROM43と、キーボードなど
の入力装置46とを備えている。
In this character recognition system, as shown in FIG. 8A, a center machine 3 has a CPU 32 for learning learning data to create a recognition dictionary, and a memory 31 for storing the created recognition dictionary. Input device such as a keyboard 34
And a display unit 33 for displaying an operation screen and a communication unit 35 for communicating with the terminal. Further, as shown in FIG. 8B, the terminal character recognition device 4 has a scanner 41 for reading an image. And a communication unit 42 that communicates with the center machine 3.
A memory 45 for storing the loaded recognition dictionary, a CPU 44 for character recognition using this recognition dictionary, and a CPU
A ROM 43 storing 44 programs and an input device 46 such as a keyboard are provided.

【0004】パタン認識の分野では、脳の神経回路網を
模したニューラルネットを使うことが盛んに行なわれて
いる。このニューラルネットでは、ネットワークに、入
力データとその入力データに対する出力期待値(教師デ
ータという)とを教えるだけで、その入力データから教
師データを識別する認識アルゴリズムを構築する能力を
備えている。
In the field of pattern recognition, a neural network imitating the neural network of the brain is actively used. This neural network has a capability of constructing a recognition algorithm for identifying the teacher data from the input data only by teaching the network the input data and the expected output value (referred to as teacher data) for the input data.

【0005】このニューラルネットを使用する文字認識
システムでは、例えば、図8の端末文字認識装置4のス
キャナ41で文字を読込み、読込んだ文字の文字コードを
入力部46から入力して学習データ(入力データと教師デ
ータとが対となったデータ)を作成し、この学習データ
をセンターマシン3のCPU32に送る。CPU32は、送
られた複数の学習データを使って学習を行ない、認識辞
書(ニューラルネットでは、ニューラルネットの荷重係
数が認識辞書に当たる)を構成する。
In the character recognition system using this neural network, for example, a character is read by the scanner 41 of the terminal character recognition device 4 of FIG. 8, the character code of the read character is input from the input unit 46, and learning data ( Data in which input data and teacher data are paired) is created, and this learning data is sent to the CPU 32 of the center machine 3. The CPU 32 performs learning by using the plurality of transmitted learning data and forms a recognition dictionary (in the neural network, the weighting factor of the neural network corresponds to the recognition dictionary).

【0006】端末文字認識装置4は、認識辞書を備える
センターマシン3を使って、図9に示す手順で文字認識
を行なう。 ステップ1:端末文字認識装置4を起動したオペレータ
は、センターマシン3から認識辞書をダウンロードする
か、または文字認識を実行するかのいずれかを選択す
る。 ステップ5:オペレータがダウンロードを選択した場合
は、ダウンロードの要求をセンターマシン3に送り、セ
ンターマシン3から認識辞書や文字の位置座標を記録し
たフォーマットが送られてくると、それをメモリ45に格
納する。
The terminal character recognition device 4 uses the center machine 3 having a recognition dictionary to perform character recognition in the procedure shown in FIG. Step 1: The operator who has activated the terminal character recognition device 4 selects either downloading the recognition dictionary from the center machine 3 or executing character recognition. Step 5: When the operator selects the download, the download request is sent to the center machine 3, and when the center machine 3 sends the recognition dictionary and the format in which the position coordinates of the characters are recorded, it is stored in the memory 45. To do.

【0007】ステップ2:文字認識を選択したオペレー
タは、センターマシン3から送られてきたフォーマット
情報に一致する用紙に記載された文字をスキャナ41に読
取らせる。CPU44は、この読取った画像から、フォー
マット情報が文字位置として指定している位置の画像を
切り出し、その特徴量(例えば、濃度頻度分布、面積、
周囲長、傾き)を抽出して認識辞書と照合し、読取った
文字を認識する。 ステップ3:読取った文字が認識できない場合や誤って
認識された場合には、オペレータが認識結果を確認し、
端末文字認識装置4の入力部46から正しい文字コードを
入力する。
Step 2: The operator who has selected the character recognition causes the scanner 41 to read the characters written on the paper that matches the format information sent from the center machine 3. The CPU 44 cuts out the image at the position specified by the format information as the character position from the read image, and the feature amount (for example, density frequency distribution, area,
The perimeter and inclination are extracted and collated with the recognition dictionary to recognize the read character. Step 3: If the read character cannot be recognized or is erroneously recognized, the operator confirms the recognition result,
A correct character code is input from the input unit 46 of the terminal character recognition device 4.

【0008】ステップ4:端末文字認識装置4は、認識
した文字の文字コードをセンターマシン3に送信する。
Step 4: The terminal character recognition device 4 sends the character code of the recognized character to the center machine 3.

【0009】一方、センターマシン3は、図10に示す
ように、 ステップ10:端末文字認識装置4からの通信を待ち、 ステップ11:通信が来たときには、その要求に従って処
理を行なう。ダウンロードの要求がきた場合は、 ステップ14:メモリ31に格納している認識辞書とフォー
マット情報とを端末文字認識装置4に送信する。
On the other hand, as shown in FIG. 10, the center machine 3 waits for a communication from the terminal character recognizing device 4, and a step 11: When the communication comes, the processing is performed according to the request. If a download request is made, step 14: The recognition dictionary and the format information stored in the memory 31 are transmitted to the terminal character recognition device 4.

【0010】ステップ12:端末文字認識装置4から認識
結果が送信されてきた場合は、 ステップ13:CPU32は、送られてきた結果を集計す
る。
Step 12: When the recognition result is transmitted from the terminal character recognition device 4, Step 13: the CPU 32 totals the transmitted results.

【0011】このシステムの端末文字認識装置は、ダウ
ンロードしたソフトウェアによって文字認識を行なって
おり、専用のハードウェアの追加を一切必要としない。
そのため、低価格の装置を実現することができる。
The terminal character recognition device of this system recognizes characters by the downloaded software and does not require any additional dedicated hardware.
Therefore, a low-cost device can be realized.

【0012】[0012]

【発明が解決しようとする課題】しかし、従来の文字認
識システムでは、認識率の向上を図るための認識辞書の
修正・更新に際して、次のような問題点がある。
However, the conventional character recognition system has the following problems when the recognition dictionary is modified or updated to improve the recognition rate.

【0013】従来の文字認識システムでは、認識辞書を
修正・更新する場合、端末文字認識装置4を学習モード
に切替えて、学習用データを作成し、これをセンターマ
シン3に送ることにより、センターマシン3での学習が
行なわれる。この学習用データとして、通常の文字認識
動作の過程で認識できなかった文字や誤認識した文字な
どを用いることができれば、センターマシン3の再学習
により、それらの文字が認識できる認識辞書に更新され
ることになるが、端末文字認識装置4に、そうした文字
のデータベースを保持させるとなると、大量のメモリが
必要となり、端末文字認識装置のコストを低価格に抑え
ることができなくなってしまう。
In the conventional character recognition system, when the recognition dictionary is modified or updated, the terminal character recognition device 4 is switched to the learning mode, the learning data is created, and the learning data is sent to the center machine 3, whereby the center machine 3 Learning at 3 is conducted. If characters that could not be recognized or characters that were erroneously recognized in the course of the normal character recognition operation can be used as this learning data, re-learning of the center machine 3 updates the recognition dictionary to recognize those characters. However, if the terminal character recognition device 4 is made to hold a database of such characters, a large amount of memory is required and the cost of the terminal character recognition device cannot be kept low.

【0014】そのため、従来のシステムでは、端末文字
認識装置の構成を簡素化できるように、端末文字認識装
置に学習用データベースを持たせない構成とし、その代
わり、通常の文字認識時に認識できなかった文字や誤認
識した文字を再学習させることを犠牲にしている。従っ
て、従来のシステムでは、認識辞書の更新によって認識
性能を効率よく高めることができない。
Therefore, in the conventional system, the terminal character recognizing device is not provided with a learning database so that the structure of the terminal character recognizing device can be simplified. Instead, the terminal character recognizing device cannot recognize the character at the time of normal character recognition. It comes at the cost of re-learning letters and misrecognized letters. Therefore, the conventional system cannot efficiently improve the recognition performance by updating the recognition dictionary.

【0015】本発明は、こうした従来の問題点を解決す
るものであり、端末文字認識装置側に多少のメモリを設
けるだけで、認識性能の大幅な向上を図ることができる
文字認識システムを提供することを目的としている。
The present invention solves the above-mentioned conventional problems, and provides a character recognition system capable of significantly improving the recognition performance only by providing some memory on the terminal character recognition device side. Is intended.

【0016】[0016]

【課題を解決するための手段】そこで、本発明では、学
習データを学習して認識辞書を作成するセンター装置
と、センター装置からダウンロードされた認識辞書を用
いて文字認識を行なう端末文字認識装置とを備える文字
認識システムにおいて、端末文字認識装置に、文字認識
の実行過程で集めた学習データを、センター装置に送信
するまでの間、蓄積する蓄積手段を設け、センター装置
に、この学習データをその一部に加えた学習データを学
習して認識辞書を更新する学習手段と、更新した認識辞
書を端末文字認識装置に配信する配信手段とを設けてい
る。
Therefore, according to the present invention, a center device that learns learning data to create a recognition dictionary, and a terminal character recognition device that performs character recognition using the recognition dictionary downloaded from the center device. In the character recognition system, the terminal character recognition device is provided with an accumulating means for accumulating the learning data collected in the process of executing character recognition until it is transmitted to the center device, and the learning data is stored in the center device. A learning unit for learning the learning data added to a part and updating the recognition dictionary, and a distribution unit for distributing the updated recognition dictionary to the terminal character recognition device are provided.

【0017】また、蓄積手段が、文字認識においてリジ
ェクトされた文字または誤認識した文字の少なくとも一
部を学習データとして蓄積するように構成している。
Further, the accumulating means is configured to accumulate at least a part of the characters rejected or erroneously recognized in the character recognition as learning data.

【0018】また、蓄積手段が、リジェクトされた文字
または誤認識した文字に対して入力された修正文字コー
ドを学習データの教師データとして蓄積するように構成
している。
Further, the accumulating means is configured to accumulate the corrected character code inputted for the rejected character or the character which is erroneously recognized as the teacher data of the learning data.

【0019】また、蓄積手段が、文字の画像を圧縮して
蓄積するように構成している。
Further, the accumulating means is constituted so as to compress the character image and accumulate it.

【0020】また、蓄積手段が、文字の画像の特徴量を
蓄積するように構成している。
Further, the accumulating means is configured to accumulate the characteristic amount of the character image.

【0021】また、蓄積手段が、文字別ファイルを具備
し、この文字別ファイルに該当する文字の画像データを
蓄積するように構成している。
Further, the accumulating means is provided with a character-by-character file, and is configured to accumulate the image data of the character corresponding to the character-by-character file.

【0022】また、蓄積手段が、文字の画像データのみ
を蓄積し、この文字に対応する教師データを、文字の画
像データが送信されたセンター装置において入力するよ
うに構成している。
Further, the storage means is configured to store only the image data of the character and input the teacher data corresponding to the character in the center device to which the image data of the character is transmitted.

【0023】また、蓄積手段に蓄積された学習データ
が、予め設定した数に達したとき、センター装置に送信
されるように構成している。
Further, the learning data accumulated in the accumulating means is transmitted to the center device when the number reaches a preset number.

【0024】また、蓄積手段に蓄積された学習データ
が、予め設定した時間が経過したとき、センター装置に
送信されるように構成している。
Further, the learning data accumulated in the accumulating means is transmitted to the center device when a preset time has elapsed.

【0025】また、蓄積手段に蓄積された学習データ
が、端末文字認識装置の要求に基づいて、センター装置
に送信されるように構成している。
The learning data accumulated in the accumulating means is transmitted to the center device in response to the request from the terminal character recognition device.

【0026】また、蓄積手段に蓄積された学習データ
が、センター装置の要求に基づいて、センター装置に送
信されるように構成している。
Further, the learning data accumulated in the accumulating means is configured to be transmitted to the center device in response to a request from the center device.

【0027】また、センター装置が、予め設定した時間
が経過したときにこの要求を出力するように構成してい
る。
Further, the center device is configured to output this request when a preset time has elapsed.

【0028】また、センター装置が、接続する複数の端
末文字認識装置の一つから学習データが送信されたとき
に、その他の端末文字認識装置に対して学習データの送
信要求を出力するように構成している。
Further, the center device outputs the learning data transmission request to the other terminal character recognition devices when the learning data is transmitted from one of the plurality of connected terminal character recognition devices. are doing.

【0029】また、センター装置に、端末文字認識装置
の各々から送信された学習データを区分して保存する専
用保存領域と、端末文字認識装置ごとの区分を設けずに
学習データを保存する一般保存領域とを設け、学習手段
が、専用保存領域の学習データと一般保存領域の学習デ
ータとを加えた学習データを学習して認識辞書を更新す
るように構成している。
Further, in the center device, a dedicated storage area for separately storing the learning data transmitted from each of the terminal character recognition devices and a general storage for storing the learning data without providing a partition for each terminal character recognition device. A region is provided, and the learning means is configured to learn the learning data obtained by adding the learning data in the dedicated storage region and the learning data in the general storage region to update the recognition dictionary.

【0030】また、学習手段が、一つの端末文字認識装
置から送信された学習データを加えた学習データを学習
して認識辞書を更新し、配信手段が、更新した認識辞書
を、接続する端末文字認識装置の複数に配信するように
構成している。
Further, the learning means updates the recognition dictionary by learning the learning data including the learning data transmitted from one terminal character recognition device, and the distributing means connects the updated recognition dictionary to the terminal character to be connected. It is configured to deliver to a plurality of recognition devices.

【0031】また、学習手段が、複数の端末文字認識装
置から送信された学習データを加えた学習データを学習
して認識辞書を更新し、配信手段が、更新した認識辞書
を、接続する端末文字認識装置の一または複数に配信す
るように構成している。
Further, the learning means updates the recognition dictionary by learning the learning data including the learning data transmitted from the plurality of terminal character recognition devices, and the distributing means connects the updated recognition dictionary to the terminal character to be connected. It is configured to deliver to one or more of the recognizers.

【0032】また、専用保存領域に保存された学習デー
タが、予め設定した時間の経過後、一般保存領域に移さ
れるように構成している。
Further, the learning data stored in the dedicated storage area is configured to be transferred to the general storage area after a preset time has elapsed.

【0033】また、センター装置に、端末文字認識装置
により行なわれた文字認識の認識率を判定する認識率判
定手段を設け、認識率判定手段が、更新した認識辞書を
用いて行なわれた文字認識の認識率の低下を判定したと
き、配信手段が、端末文字認識装置に更新前の認識辞書
を配信するように構成している。
Further, the center device is provided with a recognition rate determining means for determining the recognition rate of the character recognition performed by the terminal character recognition device, and the recognition rate determining means performs the character recognition performed using the updated recognition dictionary. When it is determined that the recognition rate has decreased, the distribution unit distributes the recognition dictionary before updating to the terminal character recognition device.

【0034】さらに、認識率判断手段が、学習データの
送信間隔、学習データの量、または端末文字認識装置か
らの学習データの送信要求の有無に基づいて認識率を判
定するように構成している。
Further, the recognition rate determination means is configured to determine the recognition rate based on the learning data transmission interval, the amount of learning data, or the presence / absence of a learning data transmission request from the terminal character recognition device. .

【0035】[0035]

【作用】そのため、端末文字認識装置は、センター装置
から認識辞書をダウンロードして文字認識を行ない、こ
の文字認識の過程で認識できなかった文字や誤認識した
文字などを学習データとして蓄積する。蓄積された学習
データは、蓄積数が一定数に達したり、一定時間が経過
したりするごとに、センター装置に送信され、センター
装置は、保存している学習データに受信した学習データ
を追加し、これらの学習データを用いて学習を行ない、
認識辞書を更新する。更新された認識辞書は端末文字認
識装置にダウンロードされ、端末文字認識装置は、新し
い認識辞書を用いて文字認識を行なう。
Therefore, the terminal character recognition device downloads the recognition dictionary from the center device and performs character recognition, and stores characters that could not be recognized or characters that were erroneously recognized in the process of character recognition as learning data. The accumulated learning data is sent to the center device every time the accumulated number reaches a certain number or a certain time elapses, and the center device adds the received learning data to the saved learning data. , Learn using these learning data,
Update the recognition dictionary. The updated recognition dictionary is downloaded to the terminal character recognition device, and the terminal character recognition device performs character recognition using the new recognition dictionary.

【0036】端末文字認識装置に設ける学習データの蓄
積手段は、センター装置に送信される間の学習データを
蓄積するだけで済むため、小容量のメモリで足りる。ま
た、蓄積する学習データの文字画像データを圧縮した
り、特徴点のみを蓄えたり、また、学習データの教師デ
ータをセンター装置側で入力することによって、蓄積に
要するメモリ容量をさらに減少させることができる。
The learning data storage means provided in the terminal character recognition device only needs to store the learning data during the transmission to the center device, so a small capacity memory is sufficient. Further, by compressing the character image data of the learning data to be accumulated, accumulating only the feature points, and inputting the teacher data of the learning data on the side of the center device, the memory capacity required for accumulation can be further reduced. it can.

【0037】また、センター装置に複数の端末文字認識
装置が接続する場合、各端末文字認識装置から送信され
た学習データをその端末文字認識装置向けの認識辞書の
更新に利用することにより、それぞれの端末文字認識装
置で認識される文字の特殊性を配慮した認識性能の改善
を図ることができる。
Further, when a plurality of terminal character recognition devices are connected to the center device, the learning data transmitted from each terminal character recognition device is utilized to update the recognition dictionary for that terminal character recognition device. It is possible to improve the recognition performance in consideration of the peculiarities of characters recognized by the terminal character recognition device.

【0038】また、複数の端末文字認識装置が同一の状
況で文字認識を行なっている場合には、一つの端末文字
認識装置から送信された学習データを用いて更新した認
識辞書を、各端末文字認識装置に配信することによっ
て、各端末文字認識装置における認識性能を効率良く高
めることができる。
When a plurality of terminal character recognition devices perform character recognition in the same situation, the recognition dictionary updated using the learning data transmitted from one terminal character recognition device is used for each terminal character recognition device. By delivering to the recognition device, the recognition performance in each terminal character recognition device can be efficiently improved.

【0039】更新に際しては、今までの認識辞書をコピ
ーして保存し、更新した認識辞書を用いて文字認識が行
なわれたときに、かえって認識率が低下した場合には、
更新前の認識辞書が端末文字認識装置にダウンロードさ
れる。
Upon updating, the recognition dictionary so far is copied and saved, and when character recognition is performed using the updated recognition dictionary, if the recognition rate rather decreases,
The pre-update recognition dictionary is downloaded to the terminal character recognition device.

【0040】[0040]

【実施例】本発明の実施例における文字認識システム
は、その全体構成を図2に示すように、センターマシン
1と、複数の端末文字認識装置2a、2b、2cとが、
公衆網5を介して接続している。このように、端末文字
認識装置は、センターマシン1台に付き、複数台が接続
することができ、また、一つの端末文字認識装置2aが
複数のセンターマシンに接続することもできる。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS A character recognition system according to an embodiment of the present invention includes a center machine 1 and a plurality of terminal character recognition devices 2a, 2b and 2c, as shown in FIG.
It is connected via the public network 5. As described above, a plurality of terminal character recognition devices can be connected to one center machine, and one terminal character recognition device 2a can be connected to a plurality of center machines.

【0041】この実施例のシステムでは、ニューラルネ
ットを使用して文字認識を行なっている。
In the system of this embodiment, a neural network is used for character recognition.

【0042】センターマシンは、ハード的には、図3
(a)に示すように、学習用データベースを格納するハ
ードディスク36と、認識辞書の作成や認識率の判定、各
部の制御などを行なうCPU32と、認識辞書を格納する
メモリ31と、入力装置34と、ディスプレイ33と、端末と
の通信部35と、それらを繋ぐバスとから成り、また、端
末文字認識装置は、図3(b)に示すように、スキャナ
41と、センターマシン1との通信を行なう通信部42と、
ロードされた認識辞書を格納するメモリ45と、認識辞書
を用いて文字認識を行なうCPU44と、入力装置46と、
端末文字認識装置で集めた学習データを一時的に格納す
る学習データメモリ47と、それらを繋ぐバスとから成
る。
The hardware of the center machine is shown in FIG.
As shown in (a), a hard disk 36 that stores a learning database, a CPU 32 that creates a recognition dictionary, determines a recognition rate, and controls each unit, a memory 31 that stores the recognition dictionary, and an input device 34. , A display 33, a communication unit 35 with the terminal, and a bus connecting them, and the terminal character recognition device is a scanner as shown in FIG.
41, and a communication unit 42 that communicates with the center machine 1,
A memory 45 for storing the loaded recognition dictionary, a CPU 44 for character recognition using the recognition dictionary, an input device 46,
It comprises a learning data memory 47 for temporarily storing the learning data collected by the terminal character recognition device, and a bus connecting them.

【0043】このセンターマシン1と端末文字認識装置
2との構成を機能ブロックで表したものが図1であり、
センターマシン1は、学習データを格納する学習データ
保存部12と、学習データを用いて学習する学習部16と、
学習によって得られた認識辞書を格納する認識辞書保存
部13と、端末文字認識装置2から送られてくる認識結果
を集計・演算する認識結果演算部15と、学習データの受
信状況などに基づいて認識率を判定する認識率判定部14
と、操作画面を表示する表示部17と、キーボードの入力
部18と、端末文字認識装置2との通信を行なう通信部19
と、センターマシン1の各部の動作を制御する制御部11
とを備えている。
FIG. 1 is a functional block diagram showing the configuration of the center machine 1 and the terminal character recognition device 2.
The center machine 1 includes a learning data storage unit 12 for storing learning data, a learning unit 16 for learning using learning data,
Based on the recognition dictionary storage unit 13 that stores the recognition dictionary obtained by learning, the recognition result calculation unit 15 that totalizes and calculates the recognition results sent from the terminal character recognition device 2, and the reception status of the learning data. Recognition rate determination unit 14 for determining recognition rate
And a display unit 17 for displaying an operation screen, a keyboard input unit 18, and a communication unit 19 for communicating with the terminal character recognition device 2.
And a control unit 11 that controls the operation of each unit of the center machine 1.
It has and.

【0044】また、端末文字認識装置2は、センターマ
シン1との通信を行なう通信部21と、センターマシン1
からロードされた認識辞書などを格納する認識辞書格納
部27と、文字を読取るスキャナ25と、読取った文字を認
識辞書を用いて認識する文字認識部22と、認識結果の確
認動作を行なう確認部23と、誤認識文字の正しい文字コ
ードなどを入力する入力部24と、センターマシン1に送
る学習データを一時保持する学習データ蓄積部26と、端
末文字認識装置2の各部の動作を制御する制御部28とを
備えている。
The terminal character recognition device 2 includes a communication section 21 for communicating with the center machine 1 and the center machine 1.
A recognition dictionary storage unit 27 that stores a recognition dictionary loaded from, a scanner 25 that reads characters, a character recognition unit 22 that recognizes the read characters using the recognition dictionary, and a confirmation unit that confirms the recognition result. 23, an input unit 24 for inputting a correct character code of a misrecognized character, a learning data storage unit 26 for temporarily holding learning data to be sent to the center machine 1, and a control for controlling the operation of each unit of the terminal character recognition device 2. And part 28.

【0045】このシステムでは、端末文字認識装置2は
図4に示す手順で動作を行なう。
In this system, the terminal character recognition device 2 operates according to the procedure shown in FIG.

【0046】ステップ20:端末文字認識装置2を起動し
たオペレータは、センターマシン1から認識辞書などを
ダウンロードするか、または文字認識を実行するかの選
択を行なう。 ステップ31:オペレータがダウンロードを選択したとき
は、ダウンロードの要求をセンターマシン1に送り、セ
ンターマシン1から送られてくる認識辞書や文字の位置
座標を記録したフォーマット情報を認識辞書格納部27に
格納する。
Step 20: The operator who has activated the terminal character recognition device 2 selects whether to download a recognition dictionary or the like from the center machine 1 or to execute character recognition. Step 31: When the operator selects download, the download request is sent to the center machine 1, and the recognition dictionary sent from the center machine 1 and the format information recording the position coordinates of the characters are stored in the recognition dictionary storage unit 27. To do.

【0047】ステップ21:文字認識を選択したオペレー
タは、フォーマット情報の指定する位置に文字記入欄を
有する用紙に書込まれた文字をスキャナ25に読取らせ
る。文字認識部22は、この読取り画像からフォーマット
情報の指定する位置の文字画像データを切出し、切出し
た文字画像データから特徴量を抽出し、認識辞書と照合
して文字を認識する。この認識辞書との照合は、ニュー
ラルネットの場合には、ニューロン間の荷重係数を用い
て各出力ニューロンの出力値を算出し、その最も大きい
値を出力したニューロンに基づいて文字を認識する動作
となる。
Step 21: The operator who has selected the character recognition causes the scanner 25 to read the characters written on the paper having the character entry field at the position designated by the format information. The character recognition unit 22 cuts out the character image data at the position specified by the format information from the read image, extracts the feature amount from the cut out character image data, and collates with the recognition dictionary to recognize the character. In the case of a neural network, the collation with this recognition dictionary is performed by calculating the output value of each output neuron using the weighting factor between neurons and recognizing the character based on the neuron that outputs the largest value. Become.

【0048】ステップ22:確認部23は、ニューロンの出
力値が閾値に達しないために文字認識ができなかった文
字や、閾値には達したものの出力値が所定値より小さい
文字を抽出して、オペレータの確認を求める。
Step 22: The confirming section 23 extracts a character that cannot be recognized because the output value of the neuron does not reach the threshold value or a character whose threshold value is reached but whose output value is smaller than a predetermined value. Ask for operator confirmation.

【0049】ステップ23:オペレータは抽出された文字
を確認し、文字認識がされなかったり、誤認識された文
字について、 ステップ24:入力部24より正しい文字コードを入力す
る。
Step 23: The operator confirms the extracted characters, and for the characters that are not recognized or are erroneously recognized, Step 24: The correct character code is input from the input unit 24.

【0050】ステップ25:制御部28は、これらの修正さ
れた文字の画像データを学習データ蓄積部26の画像デー
タファイルに蓄積し、その正しい文字コードを学習デー
タ蓄積部26の教師データファイルに蓄積する。このと
き、文字の画像データは、切出した文字画像データを、
一般にFAXで使われているMH圧縮手法等を使用して
圧縮して蓄積する。
Step 25: The control unit 28 stores the image data of these corrected characters in the image data file of the learning data storage unit 26 and stores the correct character code in the teacher data file of the learning data storage unit 26. To do. At this time, the character image data is the cut-out character image data
The data is compressed and stored by using the MH compression method generally used in FAX.

【0051】ステップ26:制御部28は、文字コード化さ
れた認識結果を、通信部21を通じて、センターマシン1
に送信する。
Step 26: The control unit 28 sends the recognition result in the form of character code to the center machine 1 through the communication unit 21.
Send to.

【0052】ステップ27:制御部28は、学習データ蓄積
部26にあらかじめ設定した文字数の学習データが蓄積す
ると、 ステップ28:この学習データをセンターマシン1へ送信
し、 ステップ29:学習データ蓄積部26に蓄積していた学習デ
ータを消去する。
Step 27: When the learning data of the preset number of characters is accumulated in the learning data accumulating unit 26, the control unit 28 transmits this learning data to the center machine 1, and Step 29: the learning data accumulating unit 26. The learning data accumulated in is deleted.

【0053】センターマシン1は、後述するように、ス
テップ28において端末文字認識装置1が送信した学習デ
ータを用いて再学習を行ない、認識辞書を更新する。そ
して、この更新した認識辞書を端末文字認識装置1に送
信する。
As will be described later, the center machine 1 re-learns using the learning data transmitted by the terminal character recognition device 1 in step 28, and updates the recognition dictionary. Then, the updated recognition dictionary is transmitted to the terminal character recognition device 1.

【0054】ステップ30:端末文字認識装置1は、更新
された認識辞書を受信すると認識辞書格納部27に格納
し、以後の文字認識を更新された認識辞書を用いて行な
う。
Step 30: When the terminal character recognition device 1 receives the updated recognition dictionary, it stores it in the recognition dictionary storage unit 27 and performs subsequent character recognition using the updated recognition dictionary.

【0055】一方、センターマシン1は図5に示す手順
で動作を行なう。
On the other hand, the center machine 1 operates according to the procedure shown in FIG.

【0056】ステップ40:端末文字認識装置2からの通
信を待ち、 ステップ41:端末文字認識装置2からダウンロードの要
求がきたときは、 ステップ47:認識辞書保存部13に格納している認識辞書
とフォーマット情報とを端末文字認識装置1に送信す
る。
Step 40: Waiting for communication from the terminal character recognition device 2, Step 41: When a download request is made from the terminal character recognition device 2, Step 47: The recognition dictionary stored in the recognition dictionary storage unit 13 The format information is transmitted to the terminal character recognition device 1.

【0057】ステップ42:端末文字認識装置2から認識
結果が送信されてきた場合は、 ステップ48:認識結果演算部15は、送られてきた結果を
集計する。
Step 42: When the recognition result is transmitted from the terminal character recognition device 2, Step 48: The recognition result calculation unit 15 totalizes the transmitted results.

【0058】ステップ43:いずれかの端末文字認識装置
2から学習データが送信されてきたときは、 ステップ44:制御部11は、図6に示すように、それまで
学習データ保存部12が保持していた学習データベース51
を学習データ保存部12の保存用ファイルにコピーした
後、送られてきた学習データ52を学習データ保存部12に
送り、それまでの学習データベース51に追加する。こう
して学習データ保存部12には、新しい学習データベース
53が保持される。また、認識辞書保存部13で保持してい
た認識辞書も認識辞書保存部13の保存用ファイルにコピ
ーする。
Step 43: When the learning data is transmitted from any of the terminal character recognition devices 2, Step 44: The control unit 11 holds the learning data storage unit 12 until then, as shown in FIG. Learning database 51
After copying to the storage file of the learning data storage unit 12, the transmitted learning data 52 is sent to the learning data storage unit 12 and added to the learning database 51 up to that point. In this way, the learning data storage unit 12 stores the new learning database.
53 is retained. The recognition dictionary stored in the recognition dictionary storage unit 13 is also copied to the storage file in the recognition dictionary storage unit 13.

【0059】ステップ45:学習部16は、新しいデータベ
ース53を使用して学習を行ない、新しい認識辞書を作成
して認識辞書保存部13に格納する。
Step 45: The learning section 16 carries out learning using the new database 53, creates a new recognition dictionary, and stores it in the recognition dictionary storage section 13.

【0060】ステップ46:制御部11は、作成された認識
辞書を、学習データを送信してきた端末文字認識装置に
送信する。
Step 46: The control section 11 sends the created recognition dictionary to the terminal character recognition device that has sent the learning data.

【0061】端末文字認識装置は、受信した新たな認識
辞書を用いて文字認識を行ない、その過程で誤認識した
文字を学習データとして蓄積し、学習データの蓄積数が
一定数に達すると、それをセンターマシン1に送信す
る。センターマシン1の認識率判定部14は、この学習デ
ータが送られてくる間隔が前回より短い場合に、認識辞
書の更新により認識率が落ちたと判断する。この場合、
制御部11は、学習データベースと認識辞書とを、保存フ
ァイルに保存している、再学習する以前のものに戻す。
The terminal character recognition device performs character recognition using the received new recognition dictionary, accumulates the characters erroneously recognized in the process as learning data, and when the accumulated number of learning data reaches a certain number, Is transmitted to the center machine 1. The recognition rate determination unit 14 of the center machine 1 determines that the recognition rate has dropped due to the update of the recognition dictionary when the interval at which the learning data is sent is shorter than the last time. in this case,
The control unit 11 restores the learning database and the recognition dictionary to the ones stored in the storage file before the relearning.

【0062】このように、実施例の文字認識システムで
は、端末文字認識装置に、一定数の学習データを蓄積す
る小容量の蓄積手段を設けることによって、認識できな
いためにリジェクトされた文字や誤認識した文字を学習
データに使用して認識辞書の更新を行なうことが可能と
なり、認識性能を効果的に高めることができる。
As described above, in the character recognition system according to the embodiment, the terminal character recognition device is provided with a small capacity storage means for storing a fixed number of learning data, so that a character rejected due to unrecognized characters or erroneous recognition is rejected. It is possible to update the recognition dictionary using the learned characters as learning data, and it is possible to effectively improve the recognition performance.

【0063】なお、端末文字認識装置2の学習データ蓄
積部26には、誤認識した文字、リジェクトされた文字の
他に、オペレータの指定した文字を蓄積できるように
し、それらの文字が学習データに供されるように構成し
ても良い。また、誤認識した文字及びリジェクトされた
文字の中から、学習データとして不必要な文字をオペレ
ータが削除し、残りの文字を学習データ蓄積部26に蓄積
するように構成しても良い。
The learning data storage unit 26 of the terminal character recognition device 2 can store characters specified by the operator in addition to erroneously recognized characters and rejected characters, and these characters become learning data. It may be configured to be provided. Further, the operator may delete unnecessary characters as learning data from the erroneously recognized characters and rejected characters, and store the remaining characters in the learning data storage unit 26.

【0064】また、文字画像データの学習データ蓄積部
26への蓄積に際しては、切出した文字画像から特徴量を
抽出し、そのデータを圧縮して蓄積しても良い。こうす
ることによってデータ量を減らすことができ、また、セ
ンターマシン側では学習する際に改めて特徴量を求める
必要がなくなる。
A learning data storage unit for character image data
When storing in 26, the feature amount may be extracted from the cut-out character image, and the data may be compressed and stored. By doing so, the amount of data can be reduced, and it becomes unnecessary for the center machine side to obtain the feature amount again at the time of learning.

【0065】また、図7に示すように、学習データ蓄積
部26に文字コードに対応する文字別ファイル54、55、56
を予め設け、蓄積する文字データを該当する文字別ファ
イルに格納するように構成しても良い。この場合には、
教師データの学習データ蓄積部26への格納が不要にな
る。
Further, as shown in FIG. 7, the learning data storage unit 26 stores character-specific files 54, 55, 56 corresponding to character codes.
May be provided in advance and the character data to be stored may be stored in the corresponding character-specific file. In this case,
It is not necessary to store the teacher data in the learning data storage unit 26.

【0066】また、端末文字認識装置側では教師データ
を作成せず、センターマシン側のオペレータが、送信さ
れた文字データを表示部17で見て教師データを入力部18
から入力するように構成することもできる。
Further, the terminal character recognition device side does not create the teacher data, but the operator on the center machine side sees the transmitted character data on the display unit 17 and inputs the teacher data.
It can also be configured to input from.

【0067】また、学習データのセンターマシンへの送
信の時期は、端末文字認識装置側のオペレータが学習の
必要を感じたときに、適宜、学習データを送信できるよ
うに構成しても良い。
The learning data may be transmitted to the center machine so that the learning data can be appropriately transmitted when the operator on the terminal character recognition device side feels the necessity of learning.

【0068】また、予め設定した期間が経過するごと
に、学習データをセンターマシンに送信するように構成
しても良い。
The learning data may be transmitted to the center machine every time a preset period elapses.

【0069】また、センターマシン側から学習データ送
信の要求を出し、それに応じて、端末文字認識装置側が
学習データをセンターマシンに送信するように構成して
も良い。
Further, the center machine side may issue a request for transmitting learning data, and in response to this, the terminal character recognition device side may transmit the learning data to the center machine.

【0070】または、端末文字認識装置側に予め設定し
た文字数の学習データが蓄積するか、あるいは予め設定
した期間が経過したとき、というように、これまでに例
示した送信時期の条件をいくつか組合せて、それらの条
件のいずれかを満たしたときに、学習データを端末文字
認識装置からセンターマシンに送信するように構成して
も良い。
Alternatively, when the learning data of a preset number of characters is accumulated on the terminal character recognition device side, or when a preset period elapses, some combinations of the transmission timing conditions exemplified so far are combined. The learning data may be transmitted from the terminal character recognition device to the center machine when any of these conditions is satisfied.

【0071】また、一つのセンターマシンに複数の端末
文字認識装置が接続している場合に、そのいずれかの端
末認識装置から学習データを受信したセンターマシン
が、その学習データを学習データベースに追加して再学
習を行ない、新しく作成した認識辞書を、接続する全て
の端末文字認識装置に送信するように構成しても良い。
When a plurality of terminal character recognition devices are connected to one center machine, the center machine which receives the learning data from any one of the terminal recognition devices adds the learning data to the learning database. Re-learning may be performed and the newly created recognition dictionary may be transmitted to all connected terminal character recognition devices.

【0072】また、センターマシンに接続するいずれか
の端末文字認識装置から学習データが送信されたとき
に、接続するその他の端末文字認識装置に対して学習デ
ータの送信を要求し、複数の端末文字認識装置から送信
された学習データの全てを、センターマシンの持つ学習
データベースに追加し、この学習データベースを用いた
再学習により認識辞書を更新し、この新しく作成した認
識辞書を、最初に学習データを送信した端末文字認識装
置、または接続する端末文字認識装置の全てに送信する
ように構成しても良い。
When the learning data is transmitted from any one of the terminal character recognition devices connected to the center machine, the other terminal character recognition devices to be connected are requested to transmit the learning data, and a plurality of terminal character recognition devices are requested. All of the learning data sent from the recognizer is added to the learning database of the center machine, the recognition dictionary is updated by re-learning using this learning database, and the newly created recognition dictionary is the learning data first. You may comprise so that it may transmit to the transmitted terminal character recognition device or all the connected terminal character recognition devices.

【0073】また、センターマシンに、接続する端末文
字認識装置から送信された学習データを個別に保存する
各端末文字認識装置専用の保存ファイルを設け、端末文
字認識装置から学習データが送信されたときに、その学
習データをその端末文字認識装置専用の保存ファイルに
追加保存するとともに、その保存ファイルの学習データ
と、センターマシンの持つ学習データベースとを合わせ
て学習用の一時ファイルを作成し、この一時ファイルの
学習データを用いて再学習を行ない、再学習で新しく作
成した認識辞書を、学習データを送信した端末文字認識
装置に送信するように構成しても良い。
When the learning data is transmitted from the terminal character recognition device, the center machine is provided with a storage file dedicated to each terminal character recognition device for individually storing the learning data transmitted from the connected terminal character recognition device. In addition, the learning data is added and saved in the save file dedicated to the terminal character recognition device, and the learning data of the save file and the learning database of the center machine are combined to create a temporary file for learning. Re-learning may be performed using the learning data of the file, and the recognition dictionary newly created by re-learning may be transmitted to the terminal character recognition device that has transmitted the learning data.

【0074】また、この場合、いずれかの端末文字認識
装置から学習データが送信されたときに、センターマシ
ンに接続するその他の端末文字認識装置に学習データの
送信を要求し、それぞれの端末文字認識装置に対して、
同じ処理を行なうように構成しても良い。
Further, in this case, when the learning data is transmitted from any of the terminal character recognition devices, the other terminal character recognition devices connected to the center machine are requested to transmit the learning data, and the respective terminal character recognition devices are requested. For the device,
You may comprise so that the same process may be performed.

【0075】また、このとき、複数の端末文字認識装置
から送信された学習データの全てと、センターマシンの
持つ学習データベースとを合わせて一時ファイルを作成
し、この一時ファイルの学習データを用いて再学習を行
ない、再学習で新しく作成した認識辞書を、学習データ
を送信した端末文字認識装置、または接続する端末文字
認識装置の全てに送信するように構成しても良い。
At this time, a temporary file is created by combining all of the learning data transmitted from the plurality of terminal character recognition devices and the learning database of the center machine, and the temporary file is used to re-create the temporary file. It is also possible to perform learning and transmit the newly created recognition dictionary by re-learning to all the terminal character recognition devices that have transmitted the learning data or all the connected terminal character recognition devices.

【0076】また、センターマシンに、接続する端末文
字認識装置から送信された学習データを個別に保存する
各端末文字認識装置専用の保存ファイルを設けた場合、
予め設定した期間が経過した後、各保存ファイルに保存
されている学習データの全てを、センターマシンが持つ
学習データベースに追加し、センターマシンの学習デー
タベースを更新するように構成しても良い。
Further, when the center machine is provided with a save file dedicated to each terminal character recognition device for individually storing the learning data transmitted from the connected terminal character recognition device,
After the preset period has elapsed, all the learning data stored in each storage file may be added to the learning database of the center machine and the learning database of the center machine may be updated.

【0077】また、この学習データベースの更新を行な
ったとき、新しい学習データベースを使用して学習を行
ない、新しく作成した認識辞書をセンターマシンに接続
する特定の端末文字認識装置、または全ての端末文字認
識装置に送信するように構成しても良い。
When the learning database is updated, learning is performed using the new learning database, and the newly created recognition dictionary is connected to the center machine. It may be configured to transmit to the device.

【0078】また、認識率判定部14は、認識率の低下
を、前回よりも送信される学習データの文字数が多くな
ったこと、学習データの送信される間隔が前回より短
く、また、送信される学習データ量が前回より多くなっ
たこと、端末文字認識装置側から再学習を求めて学習デ
ータが送られてきたこと、ユーザーから認識辞書を元に
戻して欲しいという要求があったこと、などに基づいて
判別することもできる。
Further, the recognition rate determination unit 14 indicates that the recognition rate is lowered because the number of characters of the learning data to be transmitted is larger than that of the previous time, the learning data is transmitted at an interval shorter than the last time, and the learning data is transmitted. The amount of learning data to be used was larger than the previous time, the learning data was sent from the terminal character recognition device for re-learning, the user requested that the recognition dictionary be restored, etc. It can also be determined based on.

【0079】[0079]

【発明の効果】以上の実施例の説明から明らかなよう
に、本発明の文字認識システムは、センター側で学習を
行ない、センターから端末文字認識装置に認識辞書をダ
ウンロードすることによって端末文字認識装置の構成を
簡略化するシステムにおいて、端末文字認識装置の規模
の増加を小さく抑えたまま、誤認識した文字などを学習
データに用いることが可能となり、認識性能を効率良く
向上させることができる。
As is apparent from the above description of the embodiments, the character recognition system of the present invention performs learning on the side of the center and downloads the recognition dictionary from the center to the terminal character recognition device to download the character recognition device to the terminal character recognition device. In the system that simplifies the configuration, it is possible to use erroneously recognized characters and the like as learning data while suppressing an increase in the size of the terminal character recognition device, and it is possible to efficiently improve the recognition performance.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施例における文字認識システムの構
成を示す機能ブロック図、
FIG. 1 is a functional block diagram showing a configuration of a character recognition system in an embodiment of the present invention,

【図2】実施例の文字認識システムの全体構成図、FIG. 2 is an overall configuration diagram of a character recognition system according to an embodiment,

【図3】実施例の文字認識システムのハード構成図、FIG. 3 is a hardware configuration diagram of the character recognition system according to the embodiment,

【図4】実施例のシステムにおける端末文字認識装置の
動作を示すフローチャート、
FIG. 4 is a flowchart showing the operation of the terminal character recognition device in the system of the embodiment.

【図5】実施例のシステムにおけるセンターマシンの動
作を示すフローチャート、
FIG. 5 is a flowchart showing the operation of the center machine in the system of the embodiment,

【図6】実施例のシステムのセンターマシンにおける学
習データ保存手順を示す図、
FIG. 6 is a diagram showing a learning data storage procedure in the center machine of the system of the embodiment,

【図7】実施例のシステムの学習データ蓄積部における
文字別ファイルを示す図、
FIG. 7 is a diagram showing a file for each character in the learning data storage unit of the system of the embodiment,

【図8】従来の文字認識システムの構成を示すブロック
図、
FIG. 8 is a block diagram showing a configuration of a conventional character recognition system,

【図9】従来のシステムの端末文字認識装置の動作を示
すフローチャート、
FIG. 9 is a flowchart showing the operation of the terminal character recognition device of the conventional system,

【図10】従来のシステムのセンターマシンの動作を示
すフローチャートである。
FIG. 10 is a flowchart showing the operation of the center machine of the conventional system.

【符号の説明】[Explanation of symbols]

1、3 センターマシン 11 制御部 12 学習データ保存部 13 認識辞書保存部 14 認識率判定部 15 認識結果演算部 16 学習部 17 表示部 18 入力部 19 通信部 2、2a、2b、2c、4 端末文字認識装置 21 通信部 22 文字認識部 23 確認部 24 入力部 25 スキャナ 26 学習データ蓄積部 27 認識辞書格納部 28 制御部 31、45 メモリ 32、44 CPU 33 CRT 34 キーボード 35、42 通信部 36 ハードディスク 41 スキャナ 43 ROM 46 入力部 47 学習データメモリ 1, 3 Center machine 11 Control unit 12 Learning data storage unit 13 Recognition dictionary storage unit 14 Recognition rate determination unit 15 Recognition result calculation unit 16 Learning unit 17 Display unit 18 Input unit 19 Communication unit 2, 2a, 2b, 2c, 4 terminals Character recognition device 21 Communication unit 22 Character recognition unit 23 Confirmation unit 24 Input unit 25 Scanner 26 Learning data storage unit 27 Recognition dictionary storage unit 28 Control unit 31, 45 Memory 32, 44 CPU 33 CRT 34 Keyboard 35, 42 Communication unit 36 Hard disk 41 Scanner 43 ROM 46 Input 47 Learning data memory

Claims (19)

【特許請求の範囲】[Claims] 【請求項1】 学習データを学習して認識辞書を作成す
るセンター装置と、センター装置からダウンロードされ
た認識辞書を用いて文字認識を行なう端末文字認識装置
とを備える文字認識システムにおいて、 前記端末文字認識装置が、前記文字認識の実行過程で集
めた学習データを、前記センター装置に送信するまでの
間、蓄積する蓄積手段を具備し、 前記センター装置が、前記学習データをその一部に加え
た学習データを学習して前記認識辞書を更新する学習手
段と、更新した前記認識辞書を前記端末文字認識装置に
配信する配信手段とを具備することを特徴とする文字認
識システム。
1. A character recognition system comprising a center device that learns learning data to create a recognition dictionary, and a terminal character recognition device that performs character recognition using a recognition dictionary downloaded from the center device. The recognition device includes a storage unit that stores the learning data collected in the process of performing the character recognition until it is transmitted to the center device, and the center device adds the learning data to a part thereof. A character recognition system comprising: learning means for learning the learning data to update the recognition dictionary; and distribution means for distributing the updated recognition dictionary to the terminal character recognition device.
【請求項2】 前記蓄積手段が、前記文字認識において
リジェクトされた文字または誤認識した文字の少なくと
も一部を学習データとして蓄積することを特徴とする請
求項1に記載の文字認識システム。
2. The character recognition system according to claim 1, wherein the storage unit stores at least a part of the characters rejected or erroneously recognized in the character recognition as learning data.
【請求項3】 前記蓄積手段が、前記リジェクトされた
文字または誤認識した文字に対して入力された修正文字
コードを前記学習データの教師データとして蓄積するこ
とを特徴とする請求項2に記載の文字認識システム。
3. The storage unit stores the corrected character code input to the rejected character or the character that is erroneously recognized as teacher data of the learning data. Character recognition system.
【請求項4】 前記蓄積手段が、文字の画像を圧縮して
蓄積することを特徴とする請求項1乃至3に記載の文字
認識システム。
4. The character recognition system according to claim 1, wherein the storage unit compresses and stores a character image.
【請求項5】 前記蓄積手段が、文字の画像の特徴量を
蓄積することを特徴とする請求項1乃至4に記載の文字
認識システム。
5. The character recognition system according to claim 1, wherein the storage unit stores a feature amount of a character image.
【請求項6】 前記蓄積手段が、文字別ファイルを具備
し、前記文字別ファイルに該当する文字の画像データを
蓄積することを特徴とする請求項1、2、4または5に
記載の文字認識システム。
6. The character recognition according to claim 1, wherein the accumulating unit has a character-by-character file and accumulates image data of a character corresponding to the character-by-character file. system.
【請求項7】 前記蓄積手段が、文字の画像データのみ
を蓄積し、前記文字に対応する教師データを、前記文字
の画像データが送信された前記センター装置において入
力することを特徴とする請求項1、2、4または5に記
載の文字認識システム。
7. The storage means stores only character image data, and inputs teacher data corresponding to the character in the center device to which the character image data is transmitted. The character recognition system according to 1, 2, 4 or 5.
【請求項8】 前記蓄積手段に蓄積された学習データ
が、予め設定した数に達したとき、前記センター装置に
送信されることを特徴とする請求項1乃至7に記載の文
字認識システム。
8. The character recognition system according to claim 1, wherein when the learning data accumulated in the accumulating means reaches a preset number, the learning data is transmitted to the center device.
【請求項9】 前記蓄積手段に蓄積された学習データ
が、予め設定した時間が経過したとき、前記センター装
置に送信されることを特徴とする請求項1乃至7に記載
の文字認識システム。
9. The character recognition system according to claim 1, wherein the learning data accumulated in said accumulating means is transmitted to said center device when a preset time has elapsed.
【請求項10】 前記蓄積手段に蓄積された学習データ
が、前記端末文字認識装置の要求に基づいて、前記セン
ター装置に送信されることを特徴とする請求項1乃至7
に記載の文字認識システム。
10. The learning data stored in the storage means is transmitted to the center device based on a request from the terminal character recognition device.
Character recognition system described in.
【請求項11】 前記蓄積手段に蓄積された学習データ
が、前記センター装置の要求に基づいて、前記センター
装置に送信されることを特徴とする請求項1乃至7に記
載の文字認識システム。
11. The character recognition system according to claim 1, wherein the learning data accumulated in the accumulating means is transmitted to the center device based on a request from the center device.
【請求項12】 前記センター装置が、予め設定した時
間が経過したときに前記要求を出力することを特徴とす
る請求項11に記載の文字認識システム。
12. The character recognition system according to claim 11, wherein the center device outputs the request when a preset time has elapsed.
【請求項13】 前記センター装置が、接続する複数の
端末文字認識装置の一つから前記学習データが送信され
たときに、その他の前記端末文字認識装置に対して前記
要求を出力することを特徴とする請求項11に記載の文
字認識システム。
13. The center device outputs the request to the other terminal character recognition devices when the learning data is transmitted from one of a plurality of terminal character recognition devices to be connected. The character recognition system according to claim 11.
【請求項14】 前記センター装置が、前記端末文字認
識装置の各々から送信された学習データを区分して保存
する専用保存領域と、前記端末文字認識装置ごとの区分
を設けずに学習データを保存する一般保存領域とを具備
し、前記学習手段が、前記専用保存領域の学習データと
前記一般保存領域の学習データとを加えた学習データを
学習して前記認識辞書を更新することを特徴とする請求
項1に記載の文字認識システム。
14. The center device stores learning data without providing a dedicated storage area for separately storing the learning data transmitted from each of the terminal character recognition devices and a division for each terminal character recognition device. The learning means updates learning recognition data by adding learning data of the dedicated storage area and learning data of the general storage area, and updates the recognition dictionary. The character recognition system according to claim 1.
【請求項15】 前記学習手段が、一つの端末文字認識
装置から送信された学習データを加えた学習データを学
習して前記認識辞書を更新し、前記配信手段が、更新し
た前記認識辞書を、接続する端末文字認識装置の複数に
配信することを特徴とする請求項1または14に記載の
文字認識システム。
15. The learning means updates learning recognition data by adding learning data transmitted from one terminal character recognition device to update the recognition dictionary, and the distributing means updates the recognition dictionary updated. The character recognition system according to claim 1 or 14, wherein the character recognition system is distributed to a plurality of connected terminal character recognition devices.
【請求項16】 前記学習手段が、複数の端末文字認識
装置から送信された学習データを加えた学習データを学
習して前記認識辞書を更新し、前記配信手段が、更新し
た前記認識辞書を、接続する端末文字認識装置の一また
は複数に配信することを特徴とする請求項1または14
に記載の文字認識システム。
16. The learning means updates learning recognition data obtained by adding learning data transmitted from a plurality of terminal character recognition devices to update the recognition dictionary, and the distribution means updates the recognition dictionary updated. 15. Distributing to one or more of the terminal character recognition devices to be connected.
Character recognition system described in.
【請求項17】 前記専用保存領域に保存された学習デ
ータが、予め設定した時間の経過後、前記一般保存領域
に移されることを特徴とする請求項14に記載の文字認
識システム。
17. The character recognition system according to claim 14, wherein the learning data stored in the dedicated storage area is moved to the general storage area after a preset time elapses.
【請求項18】 前記センター装置が、前記端末文字認
識装置により行なわれた文字認識の認識率を判定する認
識率判定手段を具備し、前記認識率判定手段が、更新し
た認識辞書を用いて行なわれた文字認識の認識率の低下
を判定したとき、前記配信手段が、前記端末文字認識装
置に更新前の認識辞書を配信することを特徴とする請求
項1に記載の文字認識システム。
18. The center device comprises a recognition rate determination means for determining a recognition rate of character recognition performed by the terminal character recognition device, and the recognition rate determination means performs the recognition using an updated recognition dictionary. The character recognition system according to claim 1, wherein when it is determined that the recognition rate of the recognized character recognition is lowered, the distribution unit distributes the recognition dictionary before updating to the terminal character recognition device.
【請求項19】 前記認識率判断手段が、前記学習デー
タの送信間隔、前記学習データの量、または前記端末文
字認識装置からの学習データの送信要求の有無に基づい
て前記認識率を判定することを特徴とする請求項18に
記載の文字認識システム。
19. The recognition rate determination means determines the recognition rate based on a transmission interval of the learning data, an amount of the learning data, or the presence / absence of a request for transmitting the learning data from the terminal character recognition device. The character recognition system according to claim 18, wherein:
JP6334600A 1994-12-20 1994-12-20 Character recognition system Pending JPH08180141A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6334600A JPH08180141A (en) 1994-12-20 1994-12-20 Character recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6334600A JPH08180141A (en) 1994-12-20 1994-12-20 Character recognition system

Publications (1)

Publication Number Publication Date
JPH08180141A true JPH08180141A (en) 1996-07-12

Family

ID=18279209

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6334600A Pending JPH08180141A (en) 1994-12-20 1994-12-20 Character recognition system

Country Status (1)

Country Link
JP (1) JPH08180141A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002329170A (en) * 2001-04-27 2002-11-15 Konica Corp Image input/output device and image input/output managing device
KR100679113B1 (en) * 2000-11-27 2007-02-07 캐논 가부시끼가이샤 Speech recognition system, speech recognition server, speech recognition client, their control method, and computer readable memory
CN113768394A (en) * 2021-01-11 2021-12-10 北京沃东天骏信息技术有限公司 Intelligent hand sanitizer, liquid outlet control method, medium and electronic equipment

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100679113B1 (en) * 2000-11-27 2007-02-07 캐논 가부시끼가이샤 Speech recognition system, speech recognition server, speech recognition client, their control method, and computer readable memory
JP2002329170A (en) * 2001-04-27 2002-11-15 Konica Corp Image input/output device and image input/output managing device
CN113768394A (en) * 2021-01-11 2021-12-10 北京沃东天骏信息技术有限公司 Intelligent hand sanitizer, liquid outlet control method, medium and electronic equipment

Similar Documents

Publication Publication Date Title
US4758980A (en) Computer-controlled document data filing system
JPH07271981A (en) Update system of dictionary image in fingerprint recognizing device
US20050163376A1 (en) Communication system and control method, and computer-readable memory
EP1085501B1 (en) Client-server based speech recognition
JPH0821065B2 (en) Character recognition device
JP2964222B2 (en) Fingerprint collation access control system
JPH08180141A (en) Character recognition system
CN112612528A (en) System software selective starting and remote updating method based on Bootloader
JP2904463B2 (en) Dictionary registration method for fingerprint matching device
CN1282927C (en) Method and apparatus for utilizing printer memory
JPH06105398B2 (en) Pattern recognition learning device
JP2930653B2 (en) Character recognition device
JP3957846B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
CN114022155A (en) User security verification method and device
CN117272263A (en) Equipment fingerprint inference system and method
JP3000800B2 (en) Dot matrix printer
JP2674826B2 (en) Data transfer processing system
JPH11184973A (en) Communication system, control method for the same and computer readable memory
JPH09193482A (en) Printing data transfer device
JPH05324506A (en) Reception message automatic processing system
CN115907027A (en) Self-adaptive adjusting method and system for machine learning
JPH0776905B2 (en) Document management device
CN117099098A (en) Relearning system and relearning method
JP3957847B2 (en) COMMUNICATION SYSTEM, ITS CONTROL METHOD, AND COMPUTER-READABLE MEMORY
JPH11191141A (en) Communication system, control method therefor and computer readable memory