JPH0793485A - Image filing device - Google Patents

Image filing device

Info

Publication number
JPH0793485A
JPH0793485A JP5236892A JP23689293A JPH0793485A JP H0793485 A JPH0793485 A JP H0793485A JP 5236892 A JP5236892 A JP 5236892A JP 23689293 A JP23689293 A JP 23689293A JP H0793485 A JPH0793485 A JP H0793485A
Authority
JP
Japan
Prior art keywords
character
image data
dictionary
image
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5236892A
Other languages
Japanese (ja)
Inventor
Masaharu Takahashi
正治 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5236892A priority Critical patent/JPH0793485A/en
Publication of JPH0793485A publication Critical patent/JPH0793485A/en
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE:To enable the learning of a character recognizing dictionary to be executed, where the recognition rate of a handwritten character is improved without excessively extending dictionary capacity. CONSTITUTION:A page memory 40 storing image data of a document original, a dictionary memory 26 where the dictionary constituted of plural kinds of character font data is stored, a character recognizing part 39 recognizing the character by comparing character image data which is added to image data stored in the page memory 40 with character font data of the dictionary which is stored in the dictionary memory 26 and a control module 10 which preserves character image data which is not recognized by the character recognizing part 39 so as to be rejected, selectively corrects the preserved character image data when the rejection time of character image data to be recognized as a common character exceeds a prescribed number and adds corrected character image data to the dictionary as character font data of the common character are provided.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】この発明は一般に原稿の画像デー
タを画像ファイルとして管理する画像ファイリング装置
に関し、特に文字認識機能を有する画像ファイリング装
置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention generally relates to an image filing apparatus which manages image data of an original as an image file, and more particularly to an image filing apparatus having a character recognition function.

【0002】[0002]

【従来の技術】典型的な画像ファイリング装置は、イメ
ージスキャナ等により得られる複数の文書原稿の画像デ
ータを光ディスクに画像ファイルとして登録し、登録さ
れた画像データを検索および編集可能に構成される。文
書原稿はその先頭ページの所定領域に記入されたタイト
ルを有し、このタイトルは検索および編集処理において
所望の画像データを特定するためのキーワードとして使
用される。
2. Description of the Related Art A typical image filing apparatus is constructed such that image data of a plurality of document originals obtained by an image scanner or the like is registered as an image file on an optical disk, and the registered image data can be searched and edited. The document original has a title written in a predetermined area on the first page thereof, and this title is used as a keyword for specifying desired image data in the search and edit processing.

【0003】画像ファイリング装置が文字認識機能を有
する場合、例えばこのタイトルがイメージスキャナから
得られた画像データから自動的に認識され、検索用のキ
ーワードとして予め磁気ディスクに設けられる検索キー
ワードテーブルに登録される。この機能を使用した場
合、検索用のキーワードとなる文書原稿のタイトルを画
像データの登録時にキーボード等を用いて入力する必要
がなくなる。
When the image filing device has a character recognition function, for example, this title is automatically recognized from the image data obtained from the image scanner and registered as a search keyword in a search keyword table provided in advance on the magnetic disk. It When this function is used, it is not necessary to input the title of the document original, which is a keyword for search, using a keyboard or the like when registering the image data.

【0004】こうした画像ファイリング装置は、文字認
識を行うために様々な文字のフォントデータで構成され
る辞書を格納した磁気ディスクを備える。文字認識処理
が開始されると、画像ファイリング装置がこの文書原稿
の画像データから文字イメージを表すデータ部分を順次
抽出し、各文字イメージデータを辞書に格納された文字
フォントデータと比較し、最も類似度の高い文字フォン
トを認識文字として決定する。もし、最も高い類似度が
所定値を下回る場合には、文字イメージデータが認識不
能としてリジェクトされる。
Such an image filing apparatus includes a magnetic disk which stores a dictionary composed of font data of various characters in order to perform character recognition. When the character recognition process is started, the image filing device sequentially extracts the data portion representing the character image from the image data of this document original, compares each character image data with the character font data stored in the dictionary, and finds the most similar The character font with high frequency is determined as the recognized character. If the highest similarity is lower than the predetermined value, the character image data is rejected as unrecognizable.

【0005】[0005]

【発明が解決しようとする課題】しかし、従来の文字認
識では、字形(フォント)によっては辞書で対応できず
認識不能になる場合、認識不能なリジェクト文字につい
ては、キーボード等を用いて入力される正しい文字に訂
正しなくてはならないため、字形(フォント)によって
は必ずリジェクトし文字認識機能を使用するメリットが
なくなることが考えられる。この発明の目的は、辞書容
量を不必要に拡張することなく認識率を向上させる文字
認識用辞書の学習が可能な画像ファイリング装置を提供
することにある。
However, in the conventional character recognition, when a character form (font) cannot be supported by the dictionary and cannot be recognized, unrecognizable reject characters are input using a keyboard or the like. Since it has to be corrected to the correct character, it is possible that there will be no merit of always rejecting and using the character recognition function depending on the character shape (font). An object of the present invention is to provide an image filing device capable of learning a character recognition dictionary that improves the recognition rate without unnecessarily expanding the dictionary capacity.

【0006】[0006]

【課題を解決するための手段】この発明の目的は、文書
原稿の画像データを格納する画像メモリと、複数の文字
フォントデータで構成される辞書を格納した辞書メモリ
と、画像メモリに格納された画像データに含まれる文字
イメージデータを辞書メモリに格納された辞書の文字フ
ォントデータと比較することにより文字認識を行なう文
字認識部と、文字認識部が認識できずに拒絶した文字イ
メージデータを保存し、共通文字として認識すべき文字
イメージデータの拒絶回数が所定数を越えた場合に、保
存されたこれらの文字イメージデータを選択的に修正
し、修正された文字イメージデータをこの共通文字の文
字フォントデータとして辞書に追加する処理部を備える
画像ファイリング装置により達成される。
An object of the present invention is to store an image memory for storing image data of a document original, a dictionary memory for storing a dictionary composed of a plurality of character font data, and an image memory. A character recognition unit that recognizes characters by comparing the character image data contained in the image data with the character font data of the dictionary stored in the dictionary memory, and the character image data that the character recognition unit rejects because it cannot be recognized are saved. , When the number of rejections of character image data to be recognized as a common character exceeds a predetermined number, these stored character image data are selectively modified and the modified character image data is converted to the character font of this common character. This is achieved by an image filing device including a processing unit that adds data to a dictionary.

【0007】[0007]

【作用】この発明の画像ファイリング装置において、辞
書の学習は共通文字として認識すべき文字イメージデー
タの拒絶回数が所定数を越えたときのみ行われるため、
辞書容量が不必要に増大することが防止できる。また、
追加される文字フォントデータは共通の文字として認識
されずに保存されたこれら文字イメージデータを選択的
に修正することにより容易に作成できる。この際、例え
ば原稿上のゴミのような偶然的な要素を文字イメージデ
ータから除外できるため、辞書学習によってかえって認
識率が低下することがない。
In the image filing apparatus of the present invention, the dictionary is learned only when the number of rejections of character image data to be recognized as a common character exceeds a predetermined number.
It is possible to prevent the dictionary capacity from unnecessarily increasing. Also,
The added character font data is not recognized as a common character and can be easily created by selectively modifying the saved character image data. At this time, since an accidental element such as dust on the manuscript can be excluded from the character image data, the recognition rate does not lower due to dictionary learning.

【0008】[0008]

【実施例】以下、この発明の一実施例に係る画像ファイ
リング装置を図面を参照して説明する。この画像ファイ
リング装置は例えば複数の文書原稿の画像を読み取り、
読取画像に対応する画像データを画像ファイルとして管
理するために用いられる。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An image filing apparatus according to an embodiment of the present invention will be described below with reference to the drawings. This image filing device reads images of a plurality of document originals,
It is used to manage the image data corresponding to the read image as an image file.

【0009】図1はこの画像ファイリング装置の構成を
示す。この画像ファイリング装置は、制御モジュール1
0、メモリモジュール12、画像処理モジュール14、
通信制御モジュール16、スキャナ装置18、光ディス
ク19、並びに光ディスク装置20、キーボード23、
CRTディスプレイ装置24、プリンタ装置25、磁気
ディスク26および磁気ディスク装置27、マウス2
9、システムバス30、画像バス32、文字認識部39
およびアドレス発生部43を備える。
FIG. 1 shows the configuration of this image filing apparatus. This image filing device includes a control module 1
0, memory module 12, image processing module 14,
Communication control module 16, scanner device 18, optical disc 19, optical disc device 20, keyboard 23,
CRT display device 24, printer device 25, magnetic disk 26 and magnetic disk device 27, mouse 2
9, system bus 30, image bus 32, character recognition unit 39
And an address generator 43.

【0010】制御モジュール10は、画像の登録、検
索、編集、その他の様々な処理を制御するCPU34
と、光ディスク装置20および磁気ディスク装置27を
CPU34に接続するためのインターフェース回路36
とを含む。キーボード23およびマウス29はCPU3
4に接続される。
The control module 10 controls the CPU 34 for controlling various processes such as image registration, retrieval, editing and the like.
And an interface circuit 36 for connecting the optical disk device 20 and the magnetic disk device 27 to the CPU 34.
Including and The keyboard 23 and the mouse 29 are the CPU 3
4 is connected.

【0011】メモリモジュール12は、CPU34によ
って実行される制御プログラム、管理情報、およびワー
クデータ等を一時的に格納するメインメモリ38と、例
えば光ディスク19に書込まれる画像データおよび光デ
ィスク19から読出される画像データを一時的に格納す
る画像メモリであり、数ページ分のA4サイズ原稿に対
応する画像データを格納できる記憶容量を有するページ
メモリ40と、表示用インターフェースとを含む。ペー
ジメモリ40の一部はバッファメモリ40aを構成す
る。表示用インターフェースはCRTディスプレイ装置
24の表示ウインドウ内に実際に表示すべき画像データ
を一時的に格納する表示メモリ42と、表示メモリ42
に格納された画像データをCRTディスプレイ装置24
に表示するための制御を行なう表示制御部44とで構成
される。表示メモリ42は例えばページメモリ40に格
納された画像データおよびバッファメモリ40aに格納
された画像データについて拡大、縮小、回転、挿入、白
黒反転等の処理を行って得られた画像データを受け取
る。
The memory module 12 is read from a main memory 38 for temporarily storing a control program executed by the CPU 34, management information, work data, etc., and image data written on the optical disk 19 and the optical disk 19, for example. The image memory temporarily stores image data, and includes a page memory 40 having a storage capacity capable of storing image data corresponding to several pages of A4 size original document, and a display interface. A part of the page memory 40 constitutes a buffer memory 40a. The display interface includes a display memory 42 for temporarily storing image data to be actually displayed in the display window of the CRT display device 24, and a display memory 42.
Image data stored in the CRT display device 24
And a display control unit 44 for performing control for displaying on. The display memory 42 receives image data obtained by performing processing such as enlargement, reduction, rotation, insertion, and black / white inversion on the image data stored in the page memory 40 and the image data stored in the buffer memory 40a.

【0012】画像処理モジュール14は、画像データの
拡大および縮小処理を行なう拡大縮小回路46と、画像
の回転処理を行なう縦横変換回路48と、冗長度を低下
させる符号化により画像データを圧縮し、符号化により
低下した冗長度を元に戻す複合化により画像データを伸
張する圧縮伸張回路(CODEC)50と、スキャナ装
置18に接続されるスキャナインターフェース52、プ
リンタ装置25に接続されるプリンタインターフェース
54と、これらを相互接続する内部バス56を含む。圧
縮伸張回路50では、画像データの帯域圧縮および帯域
伸張がModifiedHuffman(MH)方式、あるいはModifie
d Read (MR)方式を用いて行われる。
The image processing module 14 compresses the image data by an enlarging / reducing circuit 46 for enlarging and reducing the image data, a vertical / horizontal converting circuit 48 for rotating the image, and encoding for reducing redundancy. A compression / decompression circuit (CODEC) 50 for decompressing image data by decomposing the redundancy reduced by encoding, a scanner interface 52 connected to the scanner device 18, and a printer interface 54 connected to the printer device 25. , An internal bus 56 interconnecting them. In the compression / expansion circuit 50, band compression and band expansion of image data are performed by the Modified Huffman (MH) system or Modifie.
d Read (MR) method is used.

【0013】通信制御モジュール16は、ローカルエリ
アネットワーク(LAN)通信用に設けられるバス通信
プロセッサ(BCP)、ファクシミリ通信用に設けられ
るファクシミリ通信プロセッサ(FCP)、あるいは外
部機器、例えばパソコンとの通信用に設けられる汎用通
信プロセッサ(UCP)のような通信インタフェース5
8で構成される。
The communication control module 16 is for communication with a bus communication processor (BCP) provided for local area network (LAN) communication, a facsimile communication processor (FCP) provided for facsimile communication, or for communication with an external device such as a personal computer. Communication interface 5 such as a Universal Communication Processor (UCP)
It is composed of 8.

【0014】システムバス30は制御モジュール10、
メモリモジュール12、画像処理モジュール14、通信
制御モジュール16、アドレス発生部43、および文字
認識部39に接続される。制御信号はこのシステムバス
30を介してこれらコンポーネント間で転送される。画
像バス32はメモリモジュール12、画像処理モジュー
ル14、および通信制御モジュール16、および文字認
識部39に接続される。画像データはこの画像バス32
を介してこれらコンポーネント間を転送される。アドレ
ス発生部43はさらにアドレス指定のためにページメモ
リ40に接続される。
The system bus 30 is a control module 10,
The memory module 12, the image processing module 14, the communication control module 16, the address generation unit 43, and the character recognition unit 39 are connected. Control signals are transferred between these components via this system bus 30. The image bus 32 is connected to the memory module 12, the image processing module 14, the communication control module 16, and the character recognition unit 39. Image data is the image bus 32
Is transferred between these components via. The address generator 43 is further connected to the page memory 40 for addressing.

【0015】スキャナ装置18は、複数の原稿を順次自
動的に読取位置にフィードする自動原稿送り装置(AD
F)18aを有し、この読取位置に設定された原稿をレ
ーザビーム光で2次元的に走査しこれにより読み取られ
る原稿の画像に対応する電気的な画像データを発生す
る。
The scanner device 18 is an automatic document feeder (AD) for automatically and sequentially feeding a plurality of documents to a reading position.
F) 18a, which two-dimensionally scans the document set at the reading position with laser beam light, and generates electrical image data corresponding to the image of the document to be read.

【0016】光ディスク装置20は光ディスク19をア
クセスするためのインターフェース20aを有し、スキ
ャナ装置18によって得られた画像データを順次光ディ
スク19に書き込むと共に、特定の検索コードによって
指定された画像データを光ディスク19から読み出す。
The optical disc device 20 has an interface 20a for accessing the optical disc 19, and sequentially writes the image data obtained by the scanner device 18 onto the optical disc 19 and also the image data designated by a specific search code. Read from.

【0017】CRTディスプレイ装置24はスキャナ装
置18によって得られた画像データおよび光ディスク1
9に記録された画像データを表示するために用いられ
る。その表示ウインドウの上端、下端、および右端に
は、アイコン等が表示される。
The CRT display device 24 is provided with the image data obtained by the scanner device 18 and the optical disk 1.
9 is used to display the image data recorded. Icons and the like are displayed at the top, bottom, and right ends of the display window.

【0018】キーボード23は光ディスク19に記録さ
れた画像データの検索コード、および処理命令等を入力
するために用いられる。マウス29は、CRTディスプ
レイ装置24の表示ウインドウ内に表示されるカーソル
(図示せず)を上、下、左、および右方向に移動させ、
カーソル位置に対応した動作モード、画像編集領域、ア
イコン、その他を指定するために用いられる。
The keyboard 23 is used for inputting a search code of image data recorded on the optical disk 19, a processing command and the like. The mouse 29 moves a cursor (not shown) displayed in the display window of the CRT display device 24 in the upward, downward, left, and right directions,
It is used to specify an operation mode, an image editing area, an icon, etc. corresponding to the cursor position.

【0019】プリンタ装置25は、スキャナ装置18に
よって得られた画像データ、光ディスク19に記録され
た画像データ、CRTディスプレイ装置24上に表示さ
れた画像データをハードコピーとして印字するために用
いられる。
The printer device 25 is used to print the image data obtained by the scanner device 18, the image data recorded on the optical disc 19, and the image data displayed on the CRT display device 24 as a hard copy.

【0020】磁気ディスク装置27は画像ファイル管理
のために予め用意される様々CPU34の制御プログラ
ム、並びに光ディスク19に記録された画像データを検
索するための検索情報として文書管理テーブルを格納す
る磁気ディスク26をアクセスする。この文書管理テー
ブルはタイトル管理テーブル、検索キーワードテーブ
ル、ページ管理テーブル、およびレコード管理テーブル
によって構成される。タイトル管理テーブルは、複数の
登録番号と、各登録番号に対応して設定される書類番号
およびタイトルとで構成される。検索キーワードテーブ
ルはタイトル管理テーブルのそれと同じ登録番号と、各
登録番号に対応して設定される複数の検索キーワードと
で構成される。ページ管理テーブルは、タイトル管理テ
ーブルのそれと同じ登録番号と、各登録番号に対応する
書類の全ページ番号と、各ページ番号に対応して設定さ
れるレコード番号とで構成される。レコード管理テーブ
ルは、ページ管理テーブルに設定された全レコード番号
と、各レコード番号に対応する画像データの先頭が記憶
されたアドレスを表す光ディスク19の記憶アドレス、
この画像データの長さを表す画像長、この画像データの
圧縮方式、解像度のような属性を表す画像属性、および
この画像データが検索された回数を表す検索頻度等で構
成される。記憶アドレスは論理的なアドレスであり、光
ディスク19の物理トラックアドレス、および物理セク
タアドレスは実際のアクセス時においてこの論理アドレ
スに対応して算出される。
The magnetic disk device 27 stores a control program for various CPUs 34 prepared in advance for managing image files, and a magnetic disk 26 for storing a document management table as search information for searching image data recorded on the optical disk 19. To access. This document management table includes a title management table, a search keyword table, a page management table, and a record management table. The title management table includes a plurality of registration numbers, and document numbers and titles set corresponding to the registration numbers. The search keyword table is composed of the same registration number as that of the title management table and a plurality of search keywords set corresponding to each registration number. The page management table includes the same registration number as that of the title management table, all page numbers of the document corresponding to each registration number, and a record number set corresponding to each page number. The record management table stores all record numbers set in the page management table and the storage address of the optical disk 19 indicating the address where the beginning of the image data corresponding to each record number is stored.
An image length indicating the length of this image data, a compression method of this image data, an image attribute indicating an attribute such as resolution, a search frequency indicating the number of times this image data has been searched, and the like. The storage address is a logical address, and the physical track address and the physical sector address of the optical disk 19 are calculated in correspondence with this logical address during actual access.

【0021】アドレス発生部43はページメモリ40に
格納された画像データの処理範囲を設定するためにペー
ジメモリ40のアドレスを発生する。文字認識部39は
このアドレス発生部43によって設定された特定範囲内
の画像データによって表される文字列の各文字イメージ
データを文字として認識する。
The address generator 43 generates an address of the page memory 40 in order to set the processing range of the image data stored in the page memory 40. The character recognition unit 39 recognizes each character image data of the character string represented by the image data within the specific range set by the address generation unit 43 as a character.

【0022】磁気ディスク26は様々な文字フォントデ
ータで構成される文字認識用辞書を格納する辞書メモリ
およびこの文字認識で拒絶された文字イメージデータを
認識すべき文字と共に格納するリジェクト情報メモリを
含む。
The magnetic disk 26 includes a dictionary memory for storing a character recognition dictionary composed of various character font data and a reject information memory for storing the character image data rejected by the character recognition together with the character to be recognized.

【0023】次にこの画像ファイリング装置の文字認識
動作を説明する。例えば文書原稿のタイトルが文字認識
される場合、このタイトルは文書原稿の所定位置に記入
される。この原稿がスキャナ装置18に設定されると、
このスキャナ装置18が原稿の画像を読取り、この画像
に対応する画像データを発生する。この画像データは画
像処理モジュール1を介してページメモリ40に格納さ
れる。CPU34はページメモリ40に格納された画像
データのうちのタイトルに対応する一部を指定するため
にアドレス発生部43にアドレスを発生させ、タイトル
を構成する文字列の各文字イメージデータを文字認識部
43に供給する。文字認識部43はこの文字イメージデ
ータを磁気ディスク26に設けられた文字認識辞書に含
まれる文字フォントデータと比較し、最も高い類似度の
文字フォントデータに対応して文字を認識する。もし、
この認識において最も高い類似度が所定値を下回る場
合、文字認識部43が文字を認識できないとしてこの文
字イメージデータをリジェクトする。
Next, the character recognition operation of this image filing apparatus will be described. For example, when the title of the document original is recognized by characters, this title is written in a predetermined position of the document original. When this document is set in the scanner device 18,
The scanner device 18 reads an image of a document and generates image data corresponding to this image. This image data is stored in the page memory 40 via the image processing module 1. The CPU 34 causes the address generation unit 43 to generate an address in order to specify a part of the image data stored in the page memory 40 corresponding to the title, and converts each character image data of the character string forming the title into a character recognition unit. 43. The character recognition unit 43 compares the character image data with the character font data included in the character recognition dictionary provided on the magnetic disk 26, and recognizes the character corresponding to the character font data having the highest degree of similarity. if,
When the highest degree of similarity in this recognition is lower than the predetermined value, the character recognition unit 43 rejects this character image data because it cannot recognize the character.

【0024】図2はこのリジェクト時に行われる処理を
示す。この処理が開始されると、まずリジェクト文字の
訂正入力が行われる。ここでは、文字認識部43が認識
できなかった文字がキーボード23等により入力され
る。続いて、この文字について拒絶された文字イメージ
データのリジェクト回数が所定数、例えば5回を越えた
かどうかチェックする。もし、5回を越えていなけれ
ば、リジェクトされた文字イメージデータおよびその訂
正結果の文字がリジェクト情報として磁気ディスク26
のリジェクト情報メモリに記憶され、この処理が次の文
字認識のために終了する。
FIG. 2 shows the processing performed at the time of this rejection. When this process is started, the rejected characters are first corrected and input. Here, the character that the character recognition unit 43 cannot recognize is input through the keyboard 23 or the like. Subsequently, it is checked whether the rejected number of rejected character image data for this character exceeds a predetermined number, for example, 5 times. If it does not exceed 5 times, the rejected character image data and the corrected character are used as reject information on the magnetic disk 26.
Is stored in the reject information memory of, and this process ends for the next character recognition.

【0025】他方、上述のチェックでリジェクト回数が
5回を越えた場合、磁気ディスク26のリジェクト情報
メモリに記憶された対応文字の全リジェクト情報がディ
スプレイ装置24に表示される。この表示を参照して、
辞書の更新が必要かどうかをオペレータが検討した結
果、更新命令がなければ、表示されたリジェクト情報の
うち既にリジェクト情報メモリに格納されていたリジェ
クト情報を削除し、未記憶のリジェクト情報をリジェク
ト情報メモリに格納するステップに戻る。これに伴っ
て、対応文字のリジェクト回数は1回に減少する。
On the other hand, when the number of rejects exceeds 5 in the above-mentioned check, all reject information of the corresponding characters stored in the reject information memory of the magnetic disk 26 is displayed on the display device 24. Referring to this display,
As a result of the operator examining whether or not the dictionary needs to be updated, if there is no update command, the reject information already stored in the reject information memory is deleted from the displayed reject information, and the unmemorized reject information is rejected. Return to the step of storing in memory. Along with this, the number of times the corresponding character is rejected is reduced to one.

【0026】もし、辞書の更新命令がキーボード23等
から入力されると、各文字イメージデータの確認および
修正の指示がキーボード23およびマウス29を用いて
行われ、続いてこの指示に基づいて辞書データ、すなわ
ち文字フォントデータが作成される。ここで、原稿上の
ゴミ等がリジェクトの原因である文字イメージデータは
削除される。また、手書き特有形態の文字であっても、
文字を構成する線が誤って隣の線に接触しているような
場合は、これが正しく修正される。こうして辞書データ
が作成されると、この辞書データを用いた文字認識が認
識誤りが生じないこと確認するために行われる。認識誤
りがあれば、再び更新命令の入力待ちとなる。また、認
識誤りがなければ、辞書がこの辞書データを実際に辞書
に追加することにより更新され、この処理が次の文字認
識のために終了する。
If a dictionary update command is input from the keyboard 23 or the like, an instruction to confirm and correct each character image data is issued using the keyboard 23 and the mouse 29, and then the dictionary data is input based on this instruction. That is, character font data is created. Here, the character image data, which is the cause of rejection due to dust or the like on the document, is deleted. In addition, even if it is a handwritten character,
If a line that makes up a character accidentally touches an adjacent line, this is corrected correctly. When the dictionary data is created in this way, character recognition using this dictionary data is performed to confirm that no recognition error occurs. If there is a recognition error, the input of an update command is awaited again. If there is no recognition error, the dictionary is updated by actually adding this dictionary data to the dictionary, and this process ends for the next character recognition.

【0027】この実施例の画像ファイリング装置におい
て、辞書の学習は共通文字として認識すべき文字イメー
ジデータの拒絶回数が所定数を越えたときのみ行われる
ため、辞書容量が不必要に増大することが防止できる。
また、追加される文字フォントデータは共通の文字とし
て認識されずに保存されたこれら文字イメージデータを
選択的に修正することによりよういに作成できる。この
際、例えば原稿上のゴミのような偶然的な要素を文字イ
メージデータから除外できるため、辞書学習のよってか
えって認識率が低下することがない。
In the image filing apparatus of this embodiment, the dictionary is learned only when the number of rejections of character image data to be recognized as a common character exceeds a predetermined number, so that the dictionary capacity may unnecessarily increase. It can be prevented.
Further, the added character font data is not recognized as a common character, and can be easily created by selectively modifying the saved character image data. At this time, since an accidental element such as dust on the manuscript can be excluded from the character image data, the recognition rate does not lower due to the dictionary learning.

【0028】[0028]

【発明の効果】この発明によれば、辞書容量を不必要に
拡張することなく手書き文字の認識率を向上させる文字
認識用辞書の学習が可能となる。
According to the present invention, it is possible to learn a character recognition dictionary which improves the recognition rate of handwritten characters without unnecessarily expanding the dictionary capacity.

【図面の簡単な説明】[Brief description of drawings]

【図1】この発明の一実施例に係る画像ファイリング装
置の回路構成を示すブロック図である。
FIG. 1 is a block diagram showing a circuit configuration of an image filing device according to an embodiment of the present invention.

【図2】図1に示す画像ファイリング装置が文字認識動
作において文字イメージデータを認識できずにリジェク
トしたときに行われる処理を示すフローチャートであ
る。
FIG. 2 is a flowchart showing a process performed when the image filing apparatus shown in FIG. 1 rejects character image data because it cannot be recognized in a character recognition operation.

【符号の説明】[Explanation of symbols]

10…制御モジュール、23…キーボード、24…CR
Tディスプレイ装置、29…マウス、26…磁気ディス
ク、39…文字認識部、40…ページメモリ。
10 ... Control module, 23 ... Keyboard, 24 ... CR
T display device, 29 ... Mouse, 26 ... Magnetic disk, 39 ... Character recognition unit, 40 ... Page memory.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06K 9/03 C 8623−5L ─────────────────────────────────────────────────── ─── Continuation of the front page (51) Int.Cl. 6 Identification code Office reference number FI technical display location G06K 9/03 C 8623-5L

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 文書原稿の画像データを格納する画像メ
モリと、複数の文字フォントデータで構成される辞書を
格納する辞書メモリと、前記画像メモリに格納された画
像データに含まれる文字イメージデータを前記辞書メモ
リに格納された辞書の文字フォントデータと比較するこ
とにより文字認識を行なう文字認識手段と、この文字認
識手段が認識できずに拒絶した文字イメージデータを保
存し、共通文字として認識すべき文字イメージデータの
拒絶回数が所定数を越えた場合に、保存されたこれらの
文字イメージデータを選択的に修正し、修正された文字
イメージデータをこの共通文字の文字フォントデータと
して前記辞書に追加する処理手段を備えることを特徴と
する画像ファイリング装置。
1. An image memory for storing image data of a document original, a dictionary memory for storing a dictionary composed of a plurality of character font data, and character image data included in the image data stored in the image memory. Character recognition means for performing character recognition by comparing with the character font data of the dictionary stored in the dictionary memory, and character image data rejected because the character recognition means cannot recognize should be saved and recognized as a common character. When the number of rejections of the character image data exceeds a predetermined number, these stored character image data are selectively modified, and the modified character image data is added to the dictionary as character font data of this common character. An image filing apparatus comprising a processing means.
【請求項2】 前記処理手段は認識誤りが生じないこと
を確認するために前記辞書に追加される文字フォントデ
ータを用いた文字認識を前記文字認識手段に行わせる試
験手段を有することを特徴とする請求項1の画像ファイ
リング装置。
2. The processing means has a test means for causing the character recognition means to perform character recognition using character font data added to the dictionary to confirm that a recognition error does not occur. The image filing device according to claim 1.
JP5236892A 1993-09-22 1993-09-22 Image filing device Pending JPH0793485A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5236892A JPH0793485A (en) 1993-09-22 1993-09-22 Image filing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5236892A JPH0793485A (en) 1993-09-22 1993-09-22 Image filing device

Publications (1)

Publication Number Publication Date
JPH0793485A true JPH0793485A (en) 1995-04-07

Family

ID=17007319

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5236892A Pending JPH0793485A (en) 1993-09-22 1993-09-22 Image filing device

Country Status (1)

Country Link
JP (1) JPH0793485A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063773A (en) * 1996-08-13 1998-03-06 Ricoh Co Ltd Recognition result editing method, pattern recognition system, and information recording medium
JP2002329170A (en) * 2001-04-27 2002-11-15 Konica Corp Image input/output device and image input/output managing device
JP2009006572A (en) * 2007-06-27 2009-01-15 Ricoh Co Ltd Image input/output device and image input/output method
CN110233967A (en) * 2019-06-20 2019-09-13 漳州智觉智能科技有限公司 Mould template image generation system and method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1063773A (en) * 1996-08-13 1998-03-06 Ricoh Co Ltd Recognition result editing method, pattern recognition system, and information recording medium
JP2002329170A (en) * 2001-04-27 2002-11-15 Konica Corp Image input/output device and image input/output managing device
JP2009006572A (en) * 2007-06-27 2009-01-15 Ricoh Co Ltd Image input/output device and image input/output method
CN110233967A (en) * 2019-06-20 2019-09-13 漳州智觉智能科技有限公司 Mould template image generation system and method
CN110233967B (en) * 2019-06-20 2021-10-01 漳州智觉智能科技有限公司 Mold template image generation system and method

Similar Documents

Publication Publication Date Title
JPH04205659A (en) Electronic filing device
JPH0512345A (en) Image storage device
US5588149A (en) Document classification and retrieval with title-based on-the-fly class merge
JPH0793485A (en) Image filing device
US5339409A (en) Image storage/search apparatus for merging image and related key codes when match found between key code and specific character code of image
JPH0934903A (en) File retrieval device
JPH05274367A (en) Image storage device
JPH07262216A (en) Picture information processor
JPH0793348A (en) Image information processor
JP2810491B2 (en) Document filing device
JPH0757040A (en) Filing device provided with ocr
JPH0793523A (en) Picture information processor
JPH07200613A (en) Image retrieval device
JPH07271812A (en) Picture information processor
JPH0535841A (en) Image storing device
JPH05128169A (en) Image retrieval device
JPH0535801A (en) Image storing and retrieving device
JP3325038B2 (en) Image storage and retrieval device
JPH01269172A (en) Picture processor
JPH07168849A (en) Image information processor
JP2823280B2 (en) Electronic filing equipment
JPH0887524A (en) Image information processor
JPH07271808A (en) Picture storage device and picture storage retrieving device
JPH05274368A (en) Image storage device
JPH0535842A (en) Image storing device

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees