JPH02234292A - Character reader - Google Patents

Character reader

Info

Publication number
JPH02234292A
JPH02234292A JP1053747A JP5374789A JPH02234292A JP H02234292 A JPH02234292 A JP H02234292A JP 1053747 A JP1053747 A JP 1053747A JP 5374789 A JP5374789 A JP 5374789A JP H02234292 A JPH02234292 A JP H02234292A
Authority
JP
Japan
Prior art keywords
character
data
bit pattern
read
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1053747A
Other languages
Japanese (ja)
Inventor
Tatsuji Kubota
窪田 辰治
Akira Ishikawa
亮 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba System Development Co Ltd
Original Assignee
Toshiba Corp
Toshiba System Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba System Development Co Ltd filed Critical Toshiba Corp
Priority to JP1053747A priority Critical patent/JPH02234292A/en
Publication of JPH02234292A publication Critical patent/JPH02234292A/en
Pending legal-status Critical Current

Links

Abstract

PURPOSE:To facilitate work such as correction and editing and to improve the using efficiency of a file, etc., by converting character data read by means of a picture recognizing device such as an image scanner into a character code. CONSTITUTION:A character reader 1 possesses an image scanner 3, a display device 4, a bit pattern read part 5, a bit pattern storage part 6, a data converting part 7, and a data file 8. The reader reads a character original as image data, displays the data on a screen, reads the bit patterns of the data displayed on the screen in the longitudinal and lateral directions, and detects the character data conforming to the bit pattern. Further the reader converts the character data from the image data into the character code. Thus the work such as correction and editing is facilitated, and the using efficiency of the file, etc., is improved.

Description

【発明の詳細な説明】 [発明の目的] 《産業上の利用分野) 本発明は、イメージスキャナ等の画像認識装置によって
読取られた文字データをキャラクタコードに変換する文
字読取装置に関する。
DETAILED DESCRIPTION OF THE INVENTION [Object of the Invention] <<Industrial Application Field> The present invention relates to a character reading device that converts character data read by an image recognition device such as an image scanner into a character code.

(従来の技術) 現在、文字データをコンピュータに直接入力させる装置
としてOCRが間発されている。ocRは、手書き文字
原稿を読取り、文字データをキャラクタコードに変換し
、これをワープロ等に表ボしたり、ファイルに格納した
りするものである。
(Prior Art) Currently, OCR is being used as a device for directly inputting character data into a computer. ocR reads a handwritten character manuscript, converts the character data into a character code, and displays this on a word processor or the like or stores it in a file.

ところが、OCRでは定められた大きさの用紙の所定の
枠内に収められた文字しか読取ることができない。従っ
て、このような条件を満足しない文字を読取る場合には
、従来より、原稿をイメージスキャナで読み取り、文字
データをイメージデータとしてファイルに格納していた
However, OCR can only read characters that fit within a predetermined frame on paper of a predetermined size. Therefore, when reading characters that do not satisfy these conditions, conventionally the document is read with an image scanner and the character data is stored in a file as image data.

しかしながら、文字データをイメージデータとして取扱
うと、訂正・編集等の作業が困邪になるばかりでなく、
キャラクタコードとして取扱った場合と比較してデータ
量が多くなってしまう。
However, handling text data as image data not only makes corrections and editing difficult;
The amount of data will be larger than when handled as a character code.

(発明が解決しようとする課題) このように、従来は、OCRで読取ることのできない原
稿をイメージスキャナによって読取っているので、文字
はすべてイメージデータとして取扱われてしまう。この
ため、文字の訂正・編集等の作業が困難となる。また、
データ量が多くなるので、保存する際には大容用のファ
イルが必要になるという課題があった。
(Problems to be Solved by the Invention) As described above, conventionally, since documents that cannot be read by OCR are read by an image scanner, all characters are treated as image data. This makes it difficult to correct and edit characters. Also,
Since the amount of data is large, there was a problem in that large-capacity files were required to save it.

この発明はこのような従来の課題を解決するためになさ
れたもので、その目的とするところはイメージデータと
して取込まれた文字データを、キャラクタコードに変換
することのできる文字読取装茸を提供することにある。
This invention was made in order to solve such conventional problems, and its purpose is to provide a character reading device that can convert character data captured as image data into a character code. It's about doing.

「発明の構成] (課題を解決するための手段) 上記目的を達成するため、本発明は画像認識装置によっ
て読取られたイメージデータを表示する表示手段と、前
記表示手段に表示されたイメージデータのビットパター
ンを読取るビットパタ〜ン読取り手段と、予め文字デー
タのビットパターンが記憶されるビットパターン記憶手
段と、前記ピットパターン読取り手段で読取られたビツ
1〜パターンに対応する文字データを萌記ビットパター
ン記憶手段から抽出し、該文字データをキ1・ラクタコ
ードに変換するデータ変換手段と、を有することを特微
とする。
"Structure of the Invention" (Means for Solving the Problems) In order to achieve the above object, the present invention provides a display means for displaying image data read by an image recognition device, and a display means for displaying image data read by an image recognition device; A bit pattern reading means for reading a bit pattern, a bit pattern storage means in which a bit pattern of character data is stored in advance, and character data corresponding to the bit 1 to pattern read by the pit pattern reading means are stored in a bit pattern. The present invention is characterized by comprising data conversion means for extracting character data from the storage means and converting the character data into a character code.

(作用) 本発明による文字読取装置では、文字原稿をイメージデ
ータとして読取っており、これを表示手段の画面に表示
している。そして、この画面に表示されたデータのビッ
トパターンを縦・横から読取り、このビットパターンに
適合する文字データを抽出する。そして、この文字デー
タをイメージデータからキャラクタコードに変換してい
る。
(Operation) The character reading device according to the present invention reads a character document as image data, and displays this on the screen of the display means. Then, the bit pattern of the data displayed on this screen is read vertically and horizontally, and character data matching this bit pattern is extracted. This character data is then converted from image data to a character code.

従って、OCRで読取ることのできない定形外の原稿で
も読取ることが可能となり、また、イメージデータをキ
ャクタコードに変換しているので、訂正・編集等の作業
が容易になる。
Therefore, it is possible to read even non-standard-sized originals that cannot be read by OCR, and since image data is converted into character codes, correction and editing operations become easier.

また、イメージデータと比較してキャラクタコードの方
がデータmが少ないので、ファイル等の使用効率が向上
する。
Furthermore, since the character code has less data m than the image data, the usage efficiency of files and the like is improved.

(実施例) 第1図は本発明の一実施例を示す構成図である。(Example) FIG. 1 is a block diagram showing an embodiment of the present invention.

同図において、文字読取装置1は文字原稿2をイメージ
データとして読取るイメージスキャナ3と、読取られた
イメージデータを画面に表示するディスプレイ4と、デ
ィスプレイ4のピットパターンを読取るビットパターン
読取部5を有している。
In the figure, a character reading device 1 includes an image scanner 3 that reads a character original 2 as image data, a display 4 that displays the read image data on a screen, and a bit pattern reading section 5 that reads a pit pattern on the display 4. are doing.

また、文字読取装置1は予め文字データのビットパター
ンが記憶されているビットパターン記憶部6と、ビット
パターン読取部5で読取られたビットパターンに対応す
る文字データをピットパターン記憶部6から抽出し、こ
の文字データをキャラクタコードに変換するデータ変換
部7と、変換されたデータを格納するデータファイル8
を有している。また、データ変換部7にはキーボード9
及びマウス10が接続されており、データの変換効率を
向上させるためにキーワードが入力されるようになって
いる。
Further, the character reading device 1 extracts character data corresponding to the bit pattern read by the bit pattern reading unit 5 from the bit pattern storage unit 6 in which bit patterns of character data are stored in advance and from the pit pattern storage unit 6. , a data converter 7 that converts this character data into a character code, and a data file 8 that stores the converted data.
have. The data converter 7 also includes a keyboard 9.
and a mouse 10 are connected, and keywords can be entered to improve data conversion efficiency.

次に、第2図に示すフローチャートを参照しながら本実
施例の作用を説明する。
Next, the operation of this embodiment will be explained with reference to the flowchart shown in FIG.

文字原稿2が文字読取装置1に入力されると、イメージ
スキャナ3はこの原稿2の文字データをイメージデータ
として取込む(ステップSTI)。
When the character original 2 is input to the character reading device 1, the image scanner 3 takes in the character data of this original 2 as image data (step STI).

取込まれたイメージデータは、ディスプレイ4に表示さ
れ、ビットパターン読取部5によってビットパターンが
読取られる(ステップST2>。例えば、第3図に示す
ように、画面に表示された文字のビットパターンを、縦
・横から読取っており、個々の文字のビットパターンを
認識すると共に、文字の大きさ、及び間隔を認識してい
る。
The captured image data is displayed on the display 4, and the bit pattern is read by the bit pattern reading section 5 (step ST2>. For example, as shown in FIG. 3, the bit pattern of the character displayed on the screen is read. , it reads vertically and horizontally, and recognizes the bit pattern of each character, as well as the size and spacing of the characters.

一方、文字原稿2の文字データのうち頻繁に使用される
文字をキーボード9から入力すると、この文字はキーワ
ードとしてデータ変換部7に読取られる(ステップST
3)。そして、ディスプレイ4に表示ざれた画面上で、
キーワードが存在づ゛る位置をマウス10で指定すると
、このキーワードは、イメージデータからキャラクタコ
ードに変換される。この操作は、イメージデータをキ1
7ラクタコードに変換する効率を向上させるための操作
であり、特にキーワードが存在しない場合には、入力し
なくてもよい。
On the other hand, when a frequently used character from the character data of the character manuscript 2 is input from the keyboard 9, this character is read as a keyword by the data converter 7 (step ST
3). Then, on the screen displayed on display 4,
When a position where a keyword exists is specified with the mouse 10, this keyword is converted from image data into a character code. This operation cuts the image data
This is an operation to improve the efficiency of converting into a 7 character code, and it is not necessary to input it especially when there is no keyword.

そして、キーワード入力による変換が終了すると、デー
タ変換部7はビットパターン読取部5で認識されたビッ
トパターンに対応する文字データをピットパターン記憶
部6から抽出し(ステップST4)、抽出された文字デ
ータをイメージデータからキャラクタコードに変換する
(ステップST5)。このとき、変換される文字データ
の大きさ及び間隔はピットパターン読取部5で認識ざれ
たものと同一となるように決定される。
When the conversion based on the keyword input is completed, the data conversion section 7 extracts character data corresponding to the bit pattern recognized by the bit pattern reading section 5 from the pit pattern storage section 6 (step ST4), and extracts the character data corresponding to the bit pattern recognized by the bit pattern reading section 5 (step ST4). is converted from image data to a character code (step ST5). At this time, the size and interval of the character data to be converted are determined to be the same as those recognized by the pit pattern reading section 5.

また、文字が不鮮明で文字データがH ggされず、キ
ャラクタコードに変換されなかった文字に対しては(ス
テップST6でNo> 、イメージデータにエラー表示
を付加させておき(ステップST7)、すべての変換作
業が終了した後にオペレータのキーボード入力によって
変換が行われる(ステップST8)。
In addition, for characters whose characters are unclear and whose character data is not Hgged or converted to a character code (No in step ST6), an error display is added to the image data (step ST7), and all After the conversion work is completed, conversion is performed by the operator's keyboard input (step ST8).

そして、変換が終了した文字データはデータフ7イル8
に格納され、保存ざれる(ステップST9)。
The character data that has been converted is then stored in a data file.
is stored and saved (step ST9).

このようにして、本実施例では、文字原稿2をイメージ
データとして取込み、このデータをディスプレイ4に表
示させ、表示されたデータのビットパターンを読取るこ
とによって文字の大ぎざ、及び間隔を認識し、文字デー
タを抽出している。
In this way, in this embodiment, the character manuscript 2 is captured as image data, this data is displayed on the display 4, and the jaggedness and spacing of the characters are recognized by reading the bit pattern of the displayed data. Extracting character data.

そして、この文字データをキャラクタコードに変換して
、印字したりファイルに保存したりしている。
This character data is then converted into a character code and printed or saved in a file.

従って、OCRで読取り不可能な原稿でも読取ることが
でき、また、イメージデータをキャラクタコードに変換
しているので、容易に訂正・編集が行えるようになる。
Therefore, even originals that cannot be read by OCR can be read, and since image data is converted into character codes, corrections and editing can be easily performed.

更に、イメージデータと比較してキャクラクコードの方
がデータ量が少ないので、小容同のファイルでデータを
保存することができる。
Furthermore, since the amount of data in the Kakurak code is smaller than that in the image data, the data can be saved in files of the same small size.

し発明の効果] 以上説明したように、本発明では、文字原椙をイメージ
データとして読取っているので、OCRで読取れない文
字原稿でも読取ることができる。
[Effects of the Invention] As described above, in the present invention, since character originals are read as image data, even character originals that cannot be read by OCR can be read.

また、読取られたイメージデータは、表示手段に表示さ
れ、この表示手段のビットパターンを読取ることによっ
て文字データを抽出している。そして、抽出された文字
データはキャラクタコードに変換されるので、訂正・編
集等の作業が容易にできるようになる。
Further, the read image data is displayed on a display means, and character data is extracted by reading the bit pattern of the display means. Since the extracted character data is converted into a character code, work such as correction and editing can be easily performed.

更に、イメージデータと比較してキャラクタコードの方
がデータ吊が少ないので、ファイル等の使用効率が向上
するという効果が得られる。
Furthermore, since character codes require less data than image data, the efficiency of using files and the like can be improved.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明の一実施例を示す槙成図、第2図は文字
読取装置の動作を示すフローチャート、第3図はディス
プレイに表示された画面の具体例を示す図、第4図はビ
ットパターンから文字データを抽出する一例を示す図で
ある。 1・・・文字読取装置   2・・・文字原稿3・・・
イメージスキャナ 4・・・ディスプレイ5・・・ビッ
トパターン読取部 6・・・ビットパターン記憶部
FIG. 1 is a diagram showing one embodiment of the present invention, FIG. 2 is a flow chart showing the operation of the character reading device, FIG. 3 is a diagram showing a specific example of the screen displayed on the display, and FIG. 4 is a diagram showing a specific example of the screen displayed on the display. FIG. 3 is a diagram showing an example of extracting character data from a bit pattern. 1...Character reading device 2...Character original 3...
Image scanner 4...Display 5...Bit pattern reading section 6...Bit pattern storage section

Claims (1)

【特許請求の範囲】 画像認識装置によって読取られたイメージデータを表示
する表示手段と、 前記表示手段に表示されたイメージデータのビットパタ
ーンを読取るビットパターン読取り手段と、 予め文字データのビットパターンが記憶されるビットパ
ターン記憶手段と、 前記ビットパターン読取り手段で読取られたビットパタ
ーンに対応する文字データを前記ビットパターン記憶手
段から抽出し、該文字データをキャラクタコードに変換
するデータ変換手段と、を有することを特徴とする文字
読取装置。
[Scope of Claims] Display means for displaying image data read by an image recognition device; bit pattern reading means for reading bit patterns of the image data displayed on the display means; bit patterns of character data stored in advance. and a data conversion means for extracting character data corresponding to the bit pattern read by the bit pattern reading means from the bit pattern storage means and converting the character data into a character code. A character reading device characterized by:
JP1053747A 1989-03-08 1989-03-08 Character reader Pending JPH02234292A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1053747A JPH02234292A (en) 1989-03-08 1989-03-08 Character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1053747A JPH02234292A (en) 1989-03-08 1989-03-08 Character reader

Publications (1)

Publication Number Publication Date
JPH02234292A true JPH02234292A (en) 1990-09-17

Family

ID=12951407

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1053747A Pending JPH02234292A (en) 1989-03-08 1989-03-08 Character reader

Country Status (1)

Country Link
JP (1) JPH02234292A (en)

Similar Documents

Publication Publication Date Title
CN101441713B (en) Optical character recognition method and apparatus of PDF document
JP3095709B2 (en) How to generate a user interface form
EP1027785B1 (en) Storage management system for document image database
EP0435316B1 (en) Image information recording apparatus
US6697056B1 (en) Method and system for form recognition
JPH08147446A (en) Electronic filing device
JP2000322417A (en) Device and method for filing image and storage medium
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
JPH10162098A (en) Document electrolyzing device and method therefor
JPH05303619A (en) Electronic scrap book
JPH02234292A (en) Character reader
JPH08180068A (en) Electronic filing device
JPH05108716A (en) Machine translation system
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JPH10171920A (en) Method and device for character recognition, and its recording medium
JPH03276260A (en) Electronic filing device containing title processing function for character code
JP3309084B2 (en) How to digitize shapes
CN106959940A (en) A kind of document format for being easy to document automation typing and conversion and recognition methods
JPS62134765A (en) Electronic retrieving method for dictionary of chinese character explained in japanese
JPS594358Y2 (en) Character control device in character correction
US5655027A (en) Continuous extraction and processing of document fields
JPH10171917A (en) Device and method for character recognition and its recording medium
JP2829186B2 (en) Optical character reader
JP2002298101A (en) Method and device for recognizing character information
JP2000123116A (en) Character recognition result correction method