JP2705972B2 - Document processing device - Google Patents

Document processing device

Info

Publication number
JP2705972B2
JP2705972B2 JP1075085A JP7508589A JP2705972B2 JP 2705972 B2 JP2705972 B2 JP 2705972B2 JP 1075085 A JP1075085 A JP 1075085A JP 7508589 A JP7508589 A JP 7508589A JP 2705972 B2 JP2705972 B2 JP 2705972B2
Authority
JP
Japan
Prior art keywords
character
computer
unit
registered
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1075085A
Other languages
Japanese (ja)
Other versions
JPH02254582A (en
Inventor
幸宏 宮崎
保夫 本郷
幸生 久藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Original Assignee
Fuji Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd filed Critical Fuji Electric Co Ltd
Priority to JP1075085A priority Critical patent/JP2705972B2/en
Publication of JPH02254582A publication Critical patent/JPH02254582A/en
Application granted granted Critical
Publication of JP2705972B2 publication Critical patent/JP2705972B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文字読取装置の辞書データに登録されて
いない文字または記号、誤読し易い文字や記号等を読み
取らせるために必要な外字登録処理を、文字読取装置に
接続したコンピュータからの指示により行う文書読取装
置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Industrial Application Field] The present invention relates to an external character registration process required for reading characters or symbols that are not registered in dictionary data of a character reading device, characters or symbols that are easily misread, and the like. In accordance with an instruction from a computer connected to the character reading device.

〔従来の技術〕[Conventional technology]

文書読取装置で読み取る文字については、予めその文
字等の特徴量を抽出し辞書としてその情報を登録してお
くことが必要である。そこで、辞書データとして登録さ
れていない文字等については、その文字等の特徴量を抽
出し、これを新たな辞書データとして登録することが必
要となる。その際、従来のものでは、登録されでいる文
字等に対しその字形のバリエーションを登録することが
できるに過ぎない。
For a character to be read by the document reading device, it is necessary to extract a feature amount of the character or the like in advance and register the information as a dictionary. Therefore, for a character or the like that is not registered as dictionary data, it is necessary to extract a characteristic amount of the character or the like and register this as new dictionary data. At that time, in the case of the related art, it is only possible to register the variation of the character shape with respect to the registered characters and the like.

〔発明が解決しようとする課題〕[Problems to be solved by the invention]

すなわち、従来の文字読取装置へ新たに文字等を登録
するためには、別の専用装置で辞書データとなる文字の
特徴抽出を行って文字読取装置の辞書データを書き替え
なければならない、と云う問題がある。このため、 a)ユーザが辞書データの追加登録をすることが困難で
ある。
In other words, in order to newly register a character or the like in the conventional character reading device, it is necessary to rewrite the dictionary data of the character reading device by extracting the characteristics of the character serving as the dictionary data by another dedicated device. There's a problem. Therefore, a) it is difficult for the user to additionally register dictionary data.

b)ユーザが自分だけの認識文字のセットを作ることが
困難である(法律用語,技術用語,医学用語など)。
b) It is difficult for users to create their own set of recognized characters (legal, technical, medical, etc.).

などの不便が生じる。Inconvenience such as occurs.

〔課題を解決するための手段〕[Means for solving the problem]

文書画像を入力する画像入力部と、入力された文書画
像から特徴抽出をしこれを予め記憶されている辞書デー
タと比較して文字を読み取る文字読取部と、記憶手段お
よび表示手段を有するとともに文字読取部に所定の指示
を与える計算機部とを備え、前記画像入力部に入力され
前記表示手段に表示される画像の中から所定の文字を指
定しその辞書データを作成して追加登録するときは、前
記計算機部から文字読取部にその旨の指示を与えること
により、前記計算機部は登録したい文字を含む所定領域
を表示画面上に拡大表示し、登録すべき文字の登録枠が
指定されたときは登録枠をその大きさの適否に応じて線
種を変えて表示し、文字読取部では前記登録枠により指
定された文字の特徴抽出をし辞書データを作成して記憶
する一方、計算機部では前記指定された文字対応のフォ
ントを作成して記憶し、出力可能にする。
An image input unit for inputting a document image, a character reading unit for extracting a feature from the input document image, comparing the extracted character with dictionary data stored in advance, and reading a character; A computer unit for giving a predetermined instruction to the reading unit, when a predetermined character is designated from an image input to the image input unit and displayed on the display unit, and dictionary data is created and additionally registered. By giving an instruction to that effect to the character reading unit from the computer unit, the computer unit enlarges and displays a predetermined area including the character to be registered on the display screen, and when a registration frame of the character to be registered is designated. Displays the registration frame by changing the line type according to the size of the registration frame. The character reading unit extracts the characteristics of the character specified by the registration frame, creates and stores the dictionary data, and stores it in the computer unit. Stores creates the designated character corresponding font, enabling output.

〔作用〕[Action]

文書読取装置に計算機を接続し、この計算機からの指
示によって外字の辞書パターンを作成できるようにし、
その適用可能範囲の拡大を図る。
A computer is connected to the document reading device, and a dictionary pattern of external characters can be created according to an instruction from the computer.
The applicable range is to be expanded.

〔実施例〕〔Example〕

第1図はこの発明のシステム構成例を示すブロック図
である。
FIG. 1 is a block diagram showing a system configuration example of the present invention.

すなわち、コンピュータ1が文字読取装置(OCR)2
に接続され、コンピュータ1にはCRTとその画面を操作
する際に使用するキーボード3,マウス4等が接続されて
いる。また、文字読取装置2には、イメージ情報(画像
データ)を入力するためのイメージスキャナ5が接続さ
れている。
That is, the computer 1 operates as a character reading device (OCR) 2
The computer 1 is connected to a CRT and a keyboard 3, a mouse 4 and the like used when operating the screen. Further, an image scanner 5 for inputting image information (image data) is connected to the character reading device 2.

第2図はコンピュータの動作を説明するためのフロー
チャート、第3図は文字読取装置の動作を説明するため
のフローチャートである。
FIG. 2 is a flowchart for explaining the operation of the computer, and FIG. 3 is a flowchart for explaining the operation of the character reading device.

第2図および第3図について第4図ないし第10図を参
照して説明する。
2 and 3 will be described with reference to FIGS. 4 to 10.

いま、外字登録しようとする文字または記号を含む文
書をイメージスキャナ5にのせ、コンピュータ1から文
字読取装置2へ所定の指示を与えると(第2図参
照)、イメージスキャナ5からの情報はイメージ情報と
して、文字読取装置2およびコンピュータ1に送られて
くるので、コンピュータ1ではこのイメージ情報(画像
データ)を図示されないCRTに表示する(同,参
照)。その一例を第4図に示す。また、コンピュータ1
の以上の如き動作により、文字読取装置2では第3図の
ステップ,,の如き動作を行う。
Now, when a document including a character or a symbol to be registered as an external character is placed on the image scanner 5 and a predetermined instruction is given from the computer 1 to the character reader 2 (see FIG. 2), the information from the image scanner 5 becomes image information. Is sent to the character reading device 2 and the computer 1, and the computer 1 displays this image information (image data) on a CRT (not shown) (see above). An example is shown in FIG. Computer 1
According to the above operation, the character reading device 2 performs the operation as shown in FIG.

次に、登録すべき文字または記号に対し、第5図の如
き画面により文字または記号毎にデータとして扱うため
のコードを割り付ける(同参照)。第5図では「160
1」なるコードが割り付けられている。コードの割り付
けが完了すると第4図の画面が再び表示されるので、マ
ウスカーソルにより登録すべき文字または記号の近傍を
指示すると、指示された近傍の画像が第6図のように拡
大表示される。このとき、第7図のように拡大表示する
範囲(拡大表示枠)6をマウスカーソルとともに表示す
ることもできる。すなわち、このようにすれば、特徴抽
出の対象となる領域が拡大表示画像のどの部分に位置す
るかが容易にわかり、登録する文字または記号が適切な
位置にある拡大画像を表示させることができるようにな
る。
Next, a code to be used as data for each character or symbol is assigned to the character or symbol to be registered on the screen as shown in FIG. 5 (see above). In FIG. 5, "160
The code "1" is assigned. When the assignment of the codes is completed, the screen shown in FIG. 4 is displayed again. When the vicinity of the character or the symbol to be registered is designated by the mouse cursor, the image in the designated vicinity is enlarged and displayed as shown in FIG. . At this time, a range (enlarged display frame) 6 to be enlarged and displayed as shown in FIG. 7 can be displayed together with the mouse cursor. That is, in this way, it is possible to easily find which part of the enlarged display image the area to be subjected to feature extraction is located, and to display an enlarged image in which characters or symbols to be registered are at appropriate positions. Become like

このように拡大表示された画面において、登録すべき
文字または記号を、第8図に示すような4辺形の登録枠
7で囲う旨の指示が与えられると(同参照)、コンピ
ュータ1ではその範囲が規定値内か否かを判断し、規定
値内ならば囲われた4辺形の登録枠7の4頂点のアドレ
スをもとに、文字読取装置2における画像データのため
のアドレスに変換し、このアドレスデータと第5図で指
示したコードとを文字読取装置(OCR)2に渡す(同
,参照)。これにより、文字読取装置2ではこれら
のデータをもとに、第3図のステップの如く文字認識
のために必要な特徴量を抽出して辞書データの形に加工
し、第3図のステップ,の如くして追加登録用の辞
書データ格納領域(RAM)に保存するとともに、その辞
書データをコンピュータ1側に転送し、フロッピィディ
スク等に保存できるようにする。なお、ステップにお
ける判断結果について、設定範囲(登録枠)が規定値内
か否かに応じて、例えば第9図のようにすることができ
る。すなわち、同図(イ),(ハ)はそれぞれ登録枠が
規定サイズ以下,以上の場合を示し、ここでは点線にて
表示する。同図(ロ)は登録枠が規定サイズ内の場合で
あり、こゝでは実線で表示する。こうすれば登録枠のサ
イズが規定サイズ内か否かを容易に知ることができる。
When an instruction to enclose a character or a symbol to be registered in a quadrilateral registration frame 7 as shown in FIG. 8 is given on the enlarged display screen (see FIG. 8), the computer 1 displays the instruction. It is determined whether or not the range is within the specified value. If the range is within the specified value, the address is converted into an address for image data in the character reading device 2 based on the addresses of the four vertices of the enclosed quadrilateral registration frame 7. Then, the address data and the code specified in FIG. 5 are transferred to the character reading device (OCR) 2 (see above). As a result, the character reading device 2 extracts the characteristic amount necessary for character recognition as shown in the step of FIG. 3 based on these data and processes it into dictionary data. As described above, the dictionary data is stored in the dictionary data storage area (RAM) for additional registration, and the dictionary data is transferred to the computer 1 so that the dictionary data can be stored on a floppy disk or the like. The result of the determination in the step may be, for example, as shown in FIG. 9, depending on whether the set range (registration frame) is within a specified value. That is, FIGS. 7A and 7C respectively show the case where the registration frame is smaller than or equal to the specified size, and is indicated by a dotted line here. FIG. 11B shows a case where the registration frame is within the specified size, and is displayed by a solid line in this case. This makes it easy to determine whether the size of the registration frame is within the specified size.

コンピュータ1では外部登録が正常に行われたことを
確認した後(同参照)、文字読取装置2を介して与え
られ、登録枠が指定された画像からフォントを作成する
(同参照)。すなわち、第8図の4辺形7で指示され
る情報が第10図(イ)の如く示される(たゞし、拡大し
て示す)ものとすると、その縦,横をそれぞれ24区画ず
つ、つまり、 24×24=576 の区割に分割し、各区画毎のイメージ情報として黒い画
像が多いか白い画像が多いかを判断し、黒画像が多けれ
ば黒ドット情報、白画像が多ければ白ドット情報と云う
具合に置きかえ、 24×24 ドットからなるフォントを第10図(ロ)の如く作成す
る。
After confirming that the external registration has been performed normally (see the same), the computer 1 creates a font from an image provided through the character reading device 2 and having a designated registration frame (see the same). That is, assuming that the information indicated by the quadrilateral 7 in FIG. 8 is indicated (shown in an enlarged manner) as shown in FIG. 10 (a), its vertical and horizontal sides are 24 sections each. In other words, the image is divided into 24 × 24 = 576 divisions, and it is determined whether there are many black images or white images as image information for each division. If there are many black images, black dot information is obtained. Instead of dot information, a font consisting of 24 × 24 dots is created as shown in FIG. 10 (b).

このようにすれば、文字読取装置における新たに登録
した文字等に対する認識結果は、第5図に示すコードで
コンピュータに送られて来ることになり、そのCRT画面
に表示されるフォントは第10図に示す方法で作成された
フォントが使われることになる。
In this way, the recognition result for the newly registered characters and the like in the character reading device will be sent to the computer with the code shown in FIG. 5, and the font displayed on the CRT screen will be as shown in FIG. Will be used.

また、登録した文字に対応する文字コード、文字を認
識するための辞書データ、および認識した結果を表示ま
たは印字する文字フォントの情報は適宜削除、追加する
ことができ、かつフロッピィディスクに保存する機能を
もたせ、必要に応じてこれらの情報を入れ替えること
で、使用目的に合った文書読取装置として活用できるよ
うになる。
In addition, the character code corresponding to the registered character, the dictionary data for character recognition, and the character font information for displaying or printing the recognition result can be deleted or added as appropriate, and can be saved to a floppy disk. By replacing the information as needed, it becomes possible to utilize the device as a document reading device suitable for the purpose of use.

〔発明の効果〕〔The invention's effect〕

この発明によれば、文字読取装置の辞書データにない
文字または記号をスキャナを介して入力し、辞書データ
にそのデータを登録するための外部登録作業が、文字読
取装置に接続したコンピュータとそのCRT画面により簡
単にできるようになるため、文字読取装置のユーザが容
易かつ自由に独自の辞書を作成することができ、その利
用範囲を広げることができる。また、認識率の低い文字
を登録すれば、認識率を上げることも可能となる。
According to the present invention, an external registration operation for inputting characters or symbols not present in the dictionary data of the character reading device via the scanner and registering the data in the dictionary data is performed by the computer connected to the character reading device and its CRT. Since the screen can be more easily displayed on the screen, the user of the character reading apparatus can easily and freely create his / her own dictionary, thereby expanding the range of use. If a character having a low recognition rate is registered, the recognition rate can be increased.

さらに、登録に当たって拡大表示枠を表示するととも
に登録枠の線種を変えるようにすれば、登録したい文字
を適切な位置に表示できるだけでなく、登録枠の大きさ
が規定サイズ内かどうかを容易に判断することができ、
登録作業が正確になり、操作性が向上する。
Furthermore, by displaying an enlarged display frame and changing the line type of the registration frame during registration, not only can the character to be registered be displayed at an appropriate position, but also it is easy to check whether the size of the registration frame is within the specified size. Can judge,
Registration work becomes more accurate and operability is improved.

【図面の簡単な説明】[Brief description of the drawings]

第1図はこの発明のシステム構成を示すブロック図、第
2図は第1図に示すコンピュータの動作を説明するため
のフローチャート、第3図は第1図に示す文字読取装置
の動作を説明するためのフローチャート、第4図は表示
画面の一例を説明するための説明図、第5図は文字コー
ドの割り付け用画面例を説明するための説明図、第6図
は指定された文字を含む所定領域を拡大表示した例を示
す部分拡大図、第7図は拡大表示枠を説明するための説
明図、第8図は指定された文字の読取枠を説明するため
の説明図、第9図は文字登録枠の大きさが適当か否かを
線種を変えて表示する例を説明するための説明図、第10
図は画像データとフォントデータとを説明するための説
明図である。 符号説明 1……コンピュータ、2……文字読取装置(OCR)、3
……キーボード、4……マウス、5……イメージスキャ
ナ、6……拡大表示枠、7……登録枠。
FIG. 1 is a block diagram showing the system configuration of the present invention, FIG. 2 is a flowchart for explaining the operation of the computer shown in FIG. 1, and FIG. 3 is an explanation of the operation of the character reading apparatus shown in FIG. FIG. 4 is an explanatory diagram for explaining an example of a display screen, FIG. 5 is an explanatory diagram for explaining an example of a character code allocation screen, and FIG. 6 is a predetermined diagram including a designated character. FIG. 7 is an explanatory diagram for explaining an enlarged display frame, FIG. 8 is an explanatory diagram for explaining a reading frame of a designated character, and FIG. 9 is an explanatory diagram for explaining an enlarged display frame. FIG. 10 is an explanatory diagram for explaining an example of displaying whether the size of the character registration frame is appropriate or not by changing the line type.
The figure is an explanatory diagram for explaining image data and font data. Description of symbols 1 ... computer, 2 ... character reading device (OCR), 3
... Keyboard, 4 mouse, 5 image scanner, 6 enlarged display frame, 7 registration frame.

───────────────────────────────────────────────────── フロントページの続き (72)発明者 久藤 幸生 東京都日野市富士町1番地 富士フアコ ム制御株式会社内 (56)参考文献 特開 昭63−70391(JP,A) ──────────────────────────────────────────────────続 き Continuation of the front page (72) Inventor Yukio Kuto 1 Fujimachi, Hino-shi, Tokyo Inside Fuji-Facom Control Corporation (56) References JP-A-63-70391 (JP, A)

Claims (1)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】文書画像を入力する画像入力部と、 入力された文書画像から特徴抽出をしこれを予め記憶さ
れている辞書データと比較して文字を読み取る文字読取
部と、 記憶手段および表示手段を有するとともに文字読取部に
所定の指示を与える計算機部と、 を備え、前記画像入力部に入力され前記表示手段に表示
される画像の中から所定の文字を指定しその辞書データ
を作成して追加登録するときは、前記計算機部から文字
読取部にその旨の指示を与えることにより、前記計算機
部は登録したい文字を含む所定領域を表示画面上に拡大
表示し、登録すべき文字の登録枠が指定されたときは登
録枠をその大きさの適否に応じて線種を変えて表示し、
文字読取部では前記登録枠により指定された文字の特徴
抽出をし辞書データを作成して記憶する一方、計算機部
では前記指定された文字対応のフォントを作成して記憶
し、出力可能にすることを特徴とする文字読取装置。
An image input unit for inputting a document image; a character reading unit for extracting a feature from the input document image and comparing the extracted character with dictionary data stored in advance to read characters; And a computer unit for giving a predetermined instruction to the character reading unit, and a dictionary is created by designating a predetermined character from an image input to the image input unit and displayed on the display unit. When additional registration is performed, the computer section gives an instruction to that effect to the character reading section, and the computer section enlarges and displays a predetermined area including the character to be registered on the display screen, and registers the character to be registered. When a frame is specified, the registration frame is displayed with a different line type according to its size,
The character reading unit extracts the characteristics of the character specified by the registration frame and creates and stores the dictionary data, while the computer unit creates and stores a font corresponding to the specified character so that it can be output. A character reading device characterized by the above-mentioned.
JP1075085A 1989-03-29 1989-03-29 Document processing device Expired - Lifetime JP2705972B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1075085A JP2705972B2 (en) 1989-03-29 1989-03-29 Document processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1075085A JP2705972B2 (en) 1989-03-29 1989-03-29 Document processing device

Publications (2)

Publication Number Publication Date
JPH02254582A JPH02254582A (en) 1990-10-15
JP2705972B2 true JP2705972B2 (en) 1998-01-28

Family

ID=13565986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1075085A Expired - Lifetime JP2705972B2 (en) 1989-03-29 1989-03-29 Document processing device

Country Status (1)

Country Link
JP (1) JP2705972B2 (en)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6370391A (en) * 1986-09-12 1988-03-30 Ricoh Co Ltd Method for forming dictionary in character information input device

Also Published As

Publication number Publication date
JPH02254582A (en) 1990-10-15

Similar Documents

Publication Publication Date Title
US5970483A (en) Apparatus and methodology for submitting search queries
EP0750271A2 (en) Image processing method and apparatus
JP2705972B2 (en) Document processing device
JP2845380B2 (en) Printing apparatus and control method thereof
JP2844446B2 (en) Character information storage method, stroke order display method, and stroke order display device
JPH08329187A (en) Document reader
JPH1091701A (en) Form document system
JPH04290184A (en) Handwritten document creation device
KR100702105B1 (en) Display device, display method, display program, and recording medium containing the display program
JPS594358Y2 (en) Character control device in character correction
JP3163577B2 (en) Vector font generation method
JP2937607B2 (en) Layout creation device
JP2922900B2 (en) Handwritten character recognition device
JPS63265374A (en) Character reader
JP2851307B2 (en) Data display system
JP2958784B2 (en) Image processing device
JPH11282965A (en) Character recognizing device and computer readable storage medium recording character recognition program
JPS63282787A (en) Document editing apparatus
JP2012058869A (en) Image processor, image-forming device and image processing program
JPH096899A (en) Processor and method for image processing
JPS605470B2 (en) typesetting system
JPH05246076A (en) Printer
JPH0916717A (en) Document reader
JP2000098997A (en) Device and method for displaying character
JPH10124487A (en) Character processing device and method, and storage medium storing readable program for computer