JPH0612522A - Character recognizing device - Google Patents
Character recognizing deviceInfo
- Publication number
- JPH0612522A JPH0612522A JP4166441A JP16644192A JPH0612522A JP H0612522 A JPH0612522 A JP H0612522A JP 4166441 A JP4166441 A JP 4166441A JP 16644192 A JP16644192 A JP 16644192A JP H0612522 A JPH0612522 A JP H0612522A
- Authority
- JP
- Japan
- Prior art keywords
- character
- information
- recognized
- unit
- code
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
Description
【0001】[0001]
【産業上の利用分野】この発明は、原稿等の記録媒体に
印刷又は手書きされた文字,記号等の文字情報の画像を
イメージデータとして読み取り、その読み取ったイメー
ジデータから文字認識を行なう文字認識装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for reading an image of character information such as characters and symbols printed or handwritten on a recording medium such as a manuscript as image data and performing character recognition from the read image data. Regarding
【0002】[0002]
【従来の技術】近年、文書作成装置,自動翻訳装置等を
含む各種データ処理装置(コンピュータ本体),ファイ
リング装置等のシステム装置に接続して使用する光学的
文字読取装置(OCR)が多用されている。そのOCR
は、原稿等の記録媒体に印刷又は手書きされた文字,記
号等の文字情報の画像をイメージデータとして読み取る
ものである。そして、OCRによって読み取ったイメー
ジデータから文字認識を行なう文字認識装置がある。2. Description of the Related Art In recent years, an optical character reading device (OCR) which is used by connecting to various data processing devices (computer body) including a document creating device, an automatic translation device, etc., and a system device such as a filing device has been widely used. There is. Its OCR
Is to read an image of character information such as characters and symbols printed or handwritten on a recording medium such as an original as image data. There is a character recognition device that recognizes characters from image data read by OCR.
【0003】例えば、以下に示すような装置がある。 (1)タブレットから手書き入力された文字を認識処理
し、その認識した文字を判別してキーボードからの出力
コードと区別可能な体系の出力コードに変換し、アダプ
タを介してその出力コードとキーボードからの出力コー
ドとを統合して制御処理本体へ出力する文字入力装置
(例えば、特開昭61−223974号公報参照)。For example, there are the following devices. (1) Recognize the characters input by handwriting from the tablet, identify the recognized characters and convert them into an output code of a system that can be distinguished from the output code from the keyboard, and from the output code and the keyboard via the adapter. A character input device that integrates the output code of the above and outputs to the control processing main body (for example, refer to Japanese Patent Laid-Open No. 61-223974).
【0004】(2)音声又はキーボードから情報の入力
ができる情報入力装置に手書きOCRを接続し、読みの
判らない漢字等を入力する場合、その手書きOCRによ
る手書き入力ができるようにした情報入力装置(例え
ば、実開昭62−62368号公報参照)。(2) An information input device in which a handwritten OCR is connected to an information input device capable of inputting information from a voice or a keyboard and when inputting unreadable Chinese characters or the like, handwriting input by the handwritten OCR is possible. (See, for example, Japanese Utility Model Laid-Open No. 62-62368).
【0005】(3)キーボードのキー入力やパネル上の
押しボタン入力に換えて、手書き入力された文字又は音
声で入力された指示を認識して、その認識結果に対応し
て予め登録テーブルに登録されている処理を選択する情
報処理装置(例えば、実開昭62−187340号公報
参照)。(3) Instead of key input on the keyboard or push button input on the panel, a handwritten input character or an instruction input by voice is recognized, and the result is registered in advance in a registration table in accordance with the recognition result. An information processing apparatus for selecting the processing that is performed (see, for example, Japanese Utility Model Laid-Open No. 62-187340).
【0006】(4)キーの押下により文字及び数字のコ
ードを出力するキーボードと、ハンドスキャナ及びそれ
によって読み込まれたOCR文字を識別して文字及び数
字のコードを発生すると共にキーボードからの出力との
論理和を出力する文字数字認識部とを有し、キーボード
とハンドスキャナのいずれからの入力も同じ入力として
扱うようにしたパソコン入力装置(例えば、特開昭64
−50114号公報参照)。(4) A keyboard for outputting character and numeral codes by pressing a key, and a hand scanner and an OCR character read by the hand scanner for generating character and numeral codes and outputting from the keyboard. A personal computer input device that has a character and number recognition unit that outputs a logical sum, and handles the input from both the keyboard and the hand scanner as the same input (for example, JP-A-64
-50114).
【0007】従来の文字認識装置では、認識できない文
字が発生したとき、オペレータが原稿から読み取った元
の画像を参照することによってマニュアルで修正できる
ようにするため、原稿から読み取った元の画像を全て保
存していた。あるいは、文字認識装置によって文字認識
した文字を出力する先のシステム装置側に、原稿から読
み取った元の画像を全て保存していた。In the conventional character recognition apparatus, when an unrecognizable character is generated, the operator can manually correct the original image read from the original document so that all the original image read from the original document can be corrected. I had saved it. Alternatively, all original images read from a document are stored on the side of the system device to which the character recognized by the character recognition device is output.
【0008】[0008]
【発明が解決しようとする課題】しかしながら、上述の
ように文字認識装置に原稿から読み取った全ての画像を
保存するには、記憶容量の大きいメモリを設けなければ
ならなくなり、文字認識装置の小型化及び低コスト化の
障害となる問題があった。また、システム装置側に原稿
から読み取った全ての画像を保存するようにすると、そ
の画像の保存のためにシステム装置のメモリの記憶領域
を使ってしまい、システム装置がメモリを効率良く使用
することができなくなるという問題があった。However, in order to store all the images read from the original in the character recognition device as described above, it is necessary to provide a memory having a large storage capacity, and the character recognition device is downsized. In addition, there is a problem that hinders cost reduction. Further, if all the images read from the original are saved on the system device side, the storage area of the memory of the system device is used for saving the images, and the system device can use the memory efficiently. There was a problem that I could not do it.
【0009】さらに、文字認識処理時に文字認識できな
い文字が発生したとき、その認識できない文字の文字コ
ードとして特定の文字コードを対応させ、その特定の文
字コードを認識できない文字の代わりにシステム装置へ
認識文字情報として出力し、システム装置側ではその特
定の文字コードを受け取って文字認識できなかった文字
として処理する。そして、オペレータがシステム装置側
で元の画像を参照し、マニュアルによる修正を行なわな
ければならなかったので、システム装置側で文字認識で
きない文字の処理を効率良く行なえないという問題があ
った。Further, when a character that cannot be recognized occurs during the character recognition processing, a specific character code is made to correspond to the character code of the unrecognizable character, and the specific character code is recognized by the system device instead of the unrecognizable character. It is output as character information, and the system device receives the specific character code and processes it as a character that could not be recognized. Then, the operator had to refer to the original image on the side of the system device and make a manual correction, and there was a problem that the system device could not efficiently process the characters that could not be recognized.
【0010】この発明は上記の点に鑑みてなされたもの
であり、原稿から読み取った全ての画像を保存しなくて
も文字認識できない文字に対する処理を効率良く行なえ
るようにすることを目的とする。The present invention has been made in view of the above points, and an object of the present invention is to enable efficient processing of characters that cannot be recognized without storing all the images read from a document. .
【0011】[0011]
【課題を解決するための手段】この発明は上記の目的を
達成するため、印刷又は手書きされた文字,記号等の文
字情報の画像をイメージデータとして読み取る画像読取
手段と、その手段によって読み取ったイメージデータか
ら各文字部分を抽出する文字抽出手段と、その手段によ
って抽出した各文字部分の位置を検出する文字位置検出
手段と、文字抽出手段によって抽出された各部のイメー
ジデータから文字認識を行なう文字認識手段と、その手
段によって文字認識できた文字に対応する文字コードを
割り当てる文字コード作成手段と、その手段によって割
り当てられた文字コードを認識文字情報として出力する
文字情報出力手段と、文字認識手段によって文字認識で
きなかったイメージデータとその位置情報を認識不可文
字情報として保存する認識不可文字情報保存手段とを備
えた文字認識装置を提供する。In order to achieve the above-mentioned object, the present invention provides an image reading means for reading an image of character information such as printed or handwritten characters and symbols as image data, and an image read by the means. Character extracting means for extracting each character portion from data, character position detecting means for detecting the position of each character portion extracted by the means, and character recognition for performing character recognition from image data of each portion extracted by the character extracting means Means, a character code creating means for assigning a character code corresponding to the character recognized by the means, a character information output means for outputting the character code assigned by the means as recognized character information, and a character by the character recognizing means. Save unrecognized image data and its position information as unrecognizable character information Providing a character recognition apparatus having a unrecognized character information storage means that.
【0012】また、上記文字コード作成手段に、文字認
識手段によって文字認識できなかったイメージデータに
対してその位置情報を含む特定の文字コードを割り当て
る手段を設け、文字情報出力手段によってその特定の文
字コードも認識文字情報として出力するとよい。さら
に、文字情報出力手段によって上記特定の文字コードと
共にその文字認識できなかったイメージデータも認識文
字情報として出力するとよい。Further, the character code creating means is provided with means for assigning a specific character code including position information to the image data which cannot be recognized by the character recognizing means, and the character information outputting means provides the specific character. The code may also be output as the recognized character information. Further, it is preferable that the character information output means outputs, together with the specific character code, the image data in which the character cannot be recognized as the recognized character information.
【0013】[0013]
【作用】この発明による文字認識装置は、印刷又は手書
きされた文字,記号等の文字情報の画像をイメージデー
タとして読み取り、その読み取ったイメージデータから
各文字部分を抽出し、その抽出した各文字部分の位置を
検出する。そして、抽出された各部のイメージデータか
ら文字認識を行ない、文字認識できなかったイメージデ
ータとその位置情報を認識不可文字情報として保存し、
文字認識できた文字はその文字に対応する文字コードを
割り当てて認識文字情報として出力する。したがって、
読み取ったイメージデータの全てを保存しなくても文字
認識できなかった文字を区別することができる。A character recognition device according to the present invention reads an image of character information such as printed or handwritten characters and symbols as image data, extracts each character portion from the read image data, and extracts each extracted character portion. Detect the position of. Then, character recognition is performed from the extracted image data of each part, and the image data in which character recognition cannot be performed and the position information thereof are saved as unrecognizable character information,
Characters that have been recognized can be assigned a character code corresponding to the character and output as recognized character information. Therefore,
It is possible to distinguish characters that could not be recognized without storing all the read image data.
【0014】また、文字認識できなかったイメージデー
タに対してその位置情報を含む特定の文字コードを割り
当てて、その特定の文字コードも認識文字情報として出
力するようにすれば、その出力先で文字認識できなかっ
た文字をそれぞれ区別して処理することができる。さら
に、特定の文字コードと共にその文字認識できなかった
イメージデータも認識文字情報として出力するようにす
れば、文字認識できなかった文字に対するより詳細な処
理を行なえる。Further, if a specific character code including the position information is assigned to the image data in which the character cannot be recognized and the specific character code is also output as the recognized character information, the character is output at the output destination. Characters that cannot be recognized can be processed separately. Furthermore, if the image data that cannot be recognized as a character together with the specific character code is output as the recognized character information, more detailed processing can be performed on the character that cannot be recognized.
【0015】[0015]
【実施例】以下、この発明の実施例を図面に基づいて具
体的に説明する。図1は、この発明の一実施例である文
字認識装置の機能構成をシステム装置と共に示すブロッ
ク図である。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENT An embodiment of the present invention will be specifically described below with reference to the drawings. FIG. 1 is a block diagram showing a functional configuration of a character recognition device according to an embodiment of the present invention together with a system device.
【0016】この文字認識装置1は、インタフェースケ
ーブル1aを介してシステム装置2と接続されている。
そのシステム装置2は、CPU,ROM,及びRAM等
からなるマイクロコンピュータを内蔵し、文字認識装置
1から送られる文字情報を基にして文書作成等の各種の
処理を行なう。The character recognition device 1 is connected to the system device 2 via an interface cable 1a.
The system unit 2 has a built-in microcomputer including a CPU, a ROM, a RAM, etc., and performs various processes such as document creation based on the character information sent from the character recognition unit 1.
【0017】文字認識装置1は、図示しないCPU,R
OM,及びRAM等からなるマイクロコンピュータを内
蔵し、画像読取部3,文字抽出部4,文字位置検出部
5,文字認識部6,文字コード作成部7,文字情報出力
部8,及び認識不可文字情報保存部9の各機能を備えて
いる。The character recognition device 1 includes a CPU, R (not shown).
An image reading unit 3, a character extracting unit 4, a character position detecting unit 5, a character recognizing unit 6, a character code creating unit 7, a character information output unit 8, and an unrecognizable character are built-in with a microcomputer including an OM and a RAM. Each function of the information storage unit 9 is provided.
【0018】画像読取部3はスキャナ等の画像入力手段
であり、原稿等の記録媒体に印刷又は手書きされた文
字,記号,数字等の文字情報の画像を光学的にイメージ
データとして読み取る。文字抽出部4は、画像読取部3
によって読み取ったイメージデータから各文字部分を抽
出する。The image reading unit 3 is an image input means such as a scanner, and optically reads an image of character information such as characters, symbols, numbers printed or handwritten on a recording medium such as a document as image data. The character extracting unit 4 includes the image reading unit 3
Each character portion is extracted from the image data read by.
【0019】文字位置検出部5は、文字抽出部4によっ
て抽出した各文字部分の位置を検出する。文字認識部6
は、文字抽出部4によって抽出された各部のイメージデ
ータから文字認識を行なう。文字コード作成部7は、文
字認識部6によって文字認識できた文字に対応する文字
コードを割り当てる。また、文字認識できなかった文字
に対する特定の文字コードを割り当てる。The character position detecting unit 5 detects the position of each character portion extracted by the character extracting unit 4. Character recognition unit 6
Performs character recognition from the image data of each part extracted by the character extracting unit 4. The character code creation unit 7 assigns a character code corresponding to the character that can be recognized by the character recognition unit 6. In addition, a specific character code is assigned to a character that cannot be recognized.
【0020】文字情報出力部8は、文字コード作成部7
によって割り当てられた文字コード又は特定の文字コー
ドを認識文字情報として出力する。認識不可文字情報保
存部9は、文字認識部6によって文字認識できなかった
イメージデータとその位置情報を認識不可文字情報とし
て保存する。The character information output unit 8 is a character code creation unit 7
The character code assigned by or the specific character code is output as recognition character information. The unrecognizable character information storage unit 9 stores the image data that cannot be recognized by the character recognition unit 6 and its position information as unrecognizable character information.
【0021】次に、上述した各部間の作用について説明
する。最初に、画像読取部3によって原稿上の文字情報
の画像のイメージデータを光学的に読み取り、その読み
取ったイメージデータのドットパターンを文字抽出部4
へ送る。Next, the operation between the above-mentioned parts will be described. First, the image reading unit 3 optically reads the image data of the image of the character information on the original, and the dot pattern of the read image data is used by the character extracting unit 4
Send to.
【0022】文字抽出部4はそのドットパターンから文
字部分を抽出すると、その文字抽出情報を文字位置検出
部5へ送る。文字位置検出部5は、文字抽出部4からの
文字抽出情報を基にして各文字部分の位置を検出し、そ
の位置情報を文字抽出部4へ送る。そして、文字抽出部
4は各文字毎のドットパターンとその位置情報を文字認
識部6へ送る。When the character extraction unit 4 extracts a character portion from the dot pattern, it sends the character extraction information to the character position detection unit 5. The character position detection unit 5 detects the position of each character portion based on the character extraction information from the character extraction unit 4, and sends the position information to the character extraction unit 4. Then, the character extraction unit 4 sends the dot pattern for each character and its position information to the character recognition unit 6.
【0023】文字認識部5は文字抽出部4から受け取っ
た各文字毎のドットパターンによって文字認識を行な
い、文字認識できなかった文字のドットパターンとその
位置情報を認識不可文字情報として認識不可文字情報保
存部9に保存し、その認識不可文字情報を文字コード作
成部7へ送る。The character recognition unit 5 performs character recognition based on the dot pattern of each character received from the character extraction unit 4, and the dot pattern of the character that cannot be recognized and its position information are unrecognizable character information as unrecognizable character information. The unrecognized character information is stored in the storage unit 9 and sent to the character code creation unit 7.
【0024】文字コード作成部7はその認識不可文字情
報によって認識できなかったイメージデータに対して特
定の文字コードを割り当てて文字認識部5へ送る。一
方、文字認識できた文字のドットパターンは文字コード
作成部7へ送り、その文字コード作成部7では文字認識
できた文字のドットパターンに対応する文字コードを割
り当てて文字認識部5へ送る。The character code creating section 7 assigns a specific character code to the image data which cannot be recognized by the unrecognizable character information and sends it to the character recognizing section 5. On the other hand, the dot pattern of the character that has been recognized can be sent to the character code creation unit 7, and the character code creation unit 7 assigns the character code corresponding to the dot pattern of the character that has been recognized and sends it to the character recognition unit 5.
【0025】そして、文字認識部5は文字コード作成部
7から受け取った文字コード又は特定の文字コードを文
字情報出力部8へ送り、文字情報出力部8はそれらの文
字コードをインタフェースケーブル1aを介してシステ
ム装置2へ出力する。Then, the character recognition unit 5 sends the character code or the specific character code received from the character code creation unit 7 to the character information output unit 8, and the character information output unit 8 sends these character codes via the interface cable 1a. Output to the system unit 2.
【0026】なお、上述したドットパターンから文字部
分を抽出する処理と、文字位置検出部5における文字位
置の検出処理は公知の技術を用いればよいので、その詳
細な説明は省略する。Since a known technique may be used for the process of extracting the character portion from the dot pattern and the process of detecting the character position in the character position detecting section 5, detailed description thereof will be omitted.
【0027】次に、図2に示すフローチャートによっ
て、文字認識部6における文字認識処理について説明す
る。まず、文字抽出部4より文字のドットパターン及び
その位置情報を受け取って文字の認識処理を行ない、文
字認識できたか否かを判断する。Next, the character recognition processing in the character recognition unit 6 will be described with reference to the flowchart shown in FIG. First, the dot pattern of a character and its position information are received from the character extraction unit 4 and character recognition processing is performed to determine whether or not the character has been recognized.
【0028】文字認識できたなら、文字コード作成部7
によってその認識できた文字に対する文字コードを割り
当てて文字情報出力部8へ出力する。また、文字認識で
きなかったら、文字位置検出部5からの位置情報によっ
て文字位置を決定し、その文字位置(位置情報)とドッ
トパターンを認識不可文字情報保存部9に保存し、その
認識できなかった文字に対して文字コード作成部7によ
って特定の文字コードを割り当てて、その特定の文字コ
ードを文字情報出力部8へ出力する。その後、次のデー
タ(ドットパターン)の有無を判断し、有れば最初の処
理に戻って上述の処理を繰り返し、なければこの文字認
識の処理を終了する。If the character can be recognized, the character code creating section 7
The character code for the recognized character is assigned by and output to the character information output unit 8. If the character cannot be recognized, the character position is determined based on the position information from the character position detection unit 5, and the character position (position information) and the dot pattern are stored in the unrecognizable character information storage unit 9 and the character cannot be recognized. A specific character code is assigned to the selected character by the character code creating unit 7, and the specific character code is output to the character information output unit 8. Then, the presence or absence of the next data (dot pattern) is determined, and if there is, the process returns to the first process and the above process is repeated. If not, the process of this character recognition ends.
【0029】次に、具体的な文字認識処理例について説
明する。図3は、複数の英文字を手書きした原稿の一例
を示す図であり、この原稿Stには、21個の英文字が
3行7列に配置するように記載されている。この原稿S
tの画像を読み取ると、文字抽出部4からの文字毎のド
ットパターンを基にして文字認識部6が文字認識を行な
う。Next, a specific example of character recognition processing will be described. FIG. 3 is a diagram showing an example of a manuscript in which a plurality of English characters are handwritten. In this manuscript St, 21 English characters are arranged in 3 rows and 7 columns. This manuscript S
When the image of t is read, the character recognition unit 6 performs character recognition based on the dot pattern for each character from the character extraction unit 4.
【0030】文字認識部6は「A」〜「J」までの英文
字を順に正常に認識すると、それぞれの文字コードを文
字コード作成部7によって割り当て、それらの文字コー
ドを文字情報出力部8を通じて順番にシステム装置へ出
力する。When the character recognition unit 6 normally recognizes the alphabetic characters "A" to "J" in order, each character code is assigned by the character code creation unit 7, and those character codes are output through the character information output unit 8. Output to the system unit in order.
【0031】その後、例えば破線枠Im内の文字を認識
できなかったら、文字位置検出部5からの位置情報を基
にしてその認識できなかった文字の位置、つまり原稿中
の4列2行目の文字であることを決定する。次に、破線
枠Im内のイメージデータと共にその位置情報を認識不
可文字情報保存部9に保存し、その認識できなかった文
字に対する特定の文字コードを割り当てて文字情報出力
部8を通じて順番にシステム装置へ出力する。そして、
「L」以降の英文字の認識処理を続行する。Thereafter, for example, if the character in the broken line frame Im cannot be recognized, the position of the character that cannot be recognized based on the position information from the character position detection unit 5, that is, the 4th column and the 2nd line in the manuscript. Determine that it is a character. Next, the position information is stored in the unrecognizable character information storage unit 9 together with the image data in the broken line frame Im, a specific character code is assigned to the unrecognizable character, and the system information is sequentially output through the character information output unit 8. Output to. And
The recognition process of the English characters after "L" is continued.
【0032】例えば、この実施例における文字コード作
成部7に、文字認識部6によって文字認識できなかった
イメージデータに対してその位置情報を含む特定の文字
コードを割り当てる手段を設け、文字情報出力部8によ
ってその特定の文字コードも認識文字情報として出力す
る。For example, the character code creating section 7 in this embodiment is provided with means for assigning a specific character code including position information to image data which cannot be recognized by the character recognizing section 6, and a character information output section is provided. The specific character code is also output by 8 as the recognized character information.
【0033】その場合における文字認識できない文字に
対する特定の文字コードのフォーマットは例えば次のよ
うにする。 特定の文字コード:「FFXY」 この文字コードは16進数で表わし、「FF」は文字認
識できない文字に対する特定コードを、「X」は文字認
識できない文字の位置情報の列数を、「Y」は文字認識
できない文字の位置情報の行数をそれぞれ表わす。In this case, the format of a specific character code for a character that cannot be recognized is as follows. Specific character code: "FFXY" This character code is expressed in hexadecimal notation, "FF" is a specific code for a character that cannot be recognized, "X" is the number of columns of position information of the character that cannot be recognized, and "Y" is Represents the number of lines of position information of a character that cannot be recognized.
【0034】したがって、例えば図3に示した原稿を読
み取って文字認識を行なった際、文字認識できたものに
ついてはその文字コードをシステム装置へ出力する。一
方、文字認識できなかったものについては、そのイメー
ジデータと共に位置情報を保存し、その認識できなかっ
た文字に対する位置情報を含む上記特定の文字コードを
出力する。Therefore, for example, when the original document shown in FIG. 3 is read and character recognition is performed, the character code of the character that is recognized is output to the system unit. On the other hand, if the character cannot be recognized, the positional information is stored together with the image data, and the specific character code including the positional information for the unrecognizable character is output.
【0035】例えば、破線枠Im内の文字を認識できな
かったとき、その文字に対して、認識できなかったこと
を示す特定コード「FF」と、その位置情報の4行2列
を示すコード「42」を組み合わせた特定の文字コード
「FF42」を割り当てて、システム装置へ出力する。For example, when the character within the broken line frame Im cannot be recognized, a specific code "FF" indicating that the character cannot be recognized and a code "4" and 2nd column indicating the position information thereof are displayed. A specific character code "FF42" in which "42" is combined is assigned and output to the system device.
【0036】さらに、文字情報出力部8によって上記特
定の文字コードと共にその文字認識できなかったイメー
ジデータも認識文字情報として出力するようにしてもよ
い。その場合における文字認識できない文字に対する特
定の文字コード及び文字認識できなかったイメージデー
タを含むデータのフォーマットを示す。 フォーマット:「FFXY,xxyy,(イメージデー
タ)」Further, the character information output section 8 may output the specific character code as well as the image data whose character cannot be recognized as the recognized character information. The data format including a specific character code for a character that cannot be recognized and image data that cannot be recognized in that case is shown. Format: "FFXY, xxyy, (image data)"
【0037】このデータは16進数で表わし、「FF」
は文字認識できない文字に対する特定コードを、「X」
は文字認識できない文字の位置情報の列数を、「Y」は
文字認識できない文字の位置情報の行数をそれぞれ表わ
す。また、「xxyy」は文字認識できない文字のイメ
ージデータサイズを表わし、その後にイメージデータを
付加する。つまり、文字認識できなかったものについて
は、そのイメージデータと共に位置情報を保存し、その
認識できなかった文字に対する位置情報を含む特定の文
字コードとそのイメージデータを出力する。This data is represented by a hexadecimal number and is "FF".
Is a specific code for characters that cannot be recognized, "X"
Represents the number of columns of position information of characters that cannot be recognized, and "Y" represents the number of lines of position information of characters that cannot be recognized. Further, "xxyy" represents the image data size of a character that cannot be recognized, and the image data is added after that. In other words, if the character cannot be recognized, the position information is stored together with the image data, and the specific character code including the position information for the unrecognizable character and the image data thereof are output.
【0038】図4は、図3に示した破線枠Im内の文字
のイメージデータのドットパターンを示す図である。こ
の場合、縦横32×32ビットの領域、つまり1〜12
8までの各バイトに文字認識できなかった文字のドット
パターンが展開されており、そのイメージデータサイズ
は「20H×20H」である。FIG. 4 is a diagram showing a dot pattern of image data of characters in the broken line frame Im shown in FIG. In this case, a vertical and horizontal 32 × 32 bit area, that is, 1 to 12
A dot pattern of a character that cannot be recognized is developed in each byte up to 8, and the image data size is “20H × 20H”.
【0039】この文字に対して、認識できなかったこと
を示す特定コード「FF」と、その位置情報の4行2列
を示すコード「42」と、その認識できなかった文字の
イメージデータサイズのコード「2020」と、イメー
ジデータ「0000,・・・,0000」を組み合わせ
る。したがって、「FF42,2020,0000,・
・・,0000」のデータをシステム装置へ出力する。For this character, a specific code "FF" indicating that the character cannot be recognized, a code "42" indicating the 4th row and 2nd column of the position information, and the image data size of the character that cannot be recognized The code “2020” and the image data “0000, ..., 0000” are combined. Therefore, "FF42,202,0000, ...
.., "0000" data is output to the system unit.
【0040】次に、上述した実施例の効果を列挙する。 (1)文字認識できなかった文字のイメージデータだけ
でなくその位置情報も保存することにより、複数の文字
認識できなかったイメージデータの区別が可能になるた
め、文字抽出以前の画像データの全てを保存しなくても
よい。したがって、認識不可文字情報保存部のメモリ容
量も少なくて済み、装置の小型化と低コスト化を実現で
きる。Next, the effects of the above-described embodiments will be listed. (1) By storing not only the image data of the character that could not be recognized but also the position information of the character, it is possible to distinguish multiple image data that could not be recognized. You don't have to save it. Therefore, the memory capacity of the unrecognizable character information storage unit can be small, and the device can be downsized and the cost can be reduced.
【0041】(2)文字認識できなかった文字に対応す
る特定の文字コードにその文字の位置情報も含められる
ので、システム装置側で文字認識できなかった文字の修
正をする場合、文字認識装置から文字抽出以前の画像デ
ータの全てをシステム装置へ送る必要がなく、システム
装置では区別された文字認識できなかった文字のイメー
ジデータのみを受け取って修正することができる。した
がって、文字認識装置からシステム装置に対するデータ
転送時間を短縮することができ、システム装置側のメモ
リの記憶領域を効率良く使用することができる。(2) Since the specific character code corresponding to the character that cannot be recognized includes the position information of that character, when the character that cannot be recognized on the system unit side is corrected, the character recognition unit It is not necessary to send all the image data before the character extraction to the system device, and the system device can receive and correct only the image data of the character that cannot be recognized by the distinguished character. Therefore, the data transfer time from the character recognition device to the system device can be shortened, and the storage area of the memory on the system device side can be used efficiently.
【0042】(3)文字認識できなかった文字に対応す
る特定の文字コードにその文字の位置情報を含め、さら
にそのイメージデータのドットパターン量とドットパタ
ーンの情報を付加するので、文字認識できなかった文字
についての詳細な情報をシステム装置へ出力することが
できる。したがって、システム装置ではその文字認識で
きなかった情報を外字登録し、その外字登録した外字コ
ードによって文字認識できた文字コードと同様に処理す
ることができる。(3) Since character position information is included in a specific character code corresponding to a character that could not be recognized, and the dot pattern amount and dot pattern information of the image data are added, the character cannot be recognized. Detailed information about the selected characters can be output to the system unit. Therefore, the system device can register the information whose character cannot be recognized as an external character, and process it in the same manner as the character code that can be recognized by the external character code registered.
【0043】つまり、文字認識装置からシステム装置へ
文字認識できなかった文字の情報を出力した時でも、必
ずオペレータが修正をしてから認識できた文字データを
処理する必要がなく、外字コードとしての処理によって
文字データを効率的に処理することができる。That is, even when the character recognition device outputs information of a character that cannot be recognized to the system device, it is not necessary to process the recognized character data after the operator corrects the character data. Character data can be efficiently processed by the processing.
【0044】次に、この発明による文字認識装置を適用
した装置の一実施例について説明する。図5は前述した
文字認識装置を含む入力装置を使用したデータ処理装置
の外観斜視図である。このデータ処理装置は、入力装置
11がキーボードインタフェース(I/F)ケーブル1
2を介して、文書作成機能やデータ処理機能等を備えた
図1のシステム装置2と同様なシステム装置13に接続
されており、その入力装置11は挿入口11aから挿入
されるシート(紙等)上に印刷又は手書きされた文字等
の情報を光学的に読み取って、それをキーボード信号に
変換処理する機能を持つ。Next, an embodiment of a device to which the character recognition device according to the present invention is applied will be described. FIG. 5 is an external perspective view of a data processing device using an input device including the character recognition device described above. In this data processing device, the input device 11 is a keyboard interface (I / F) cable 1
2 is connected to a system device 13 similar to the system device 2 of FIG. 1 having a document creation function, a data processing function, etc., and the input device 11 has a sheet (paper or the like) inserted through the insertion port 11a. ) It has a function of optically reading information such as characters printed or handwritten on it and converting it into a keyboard signal.
【0045】図6は、図5に示した入力装置11の機能
構成をシステム装置13と共に示すブロック図であり、
この入力装置11は図1に示した文字認識装置1に、キ
ーボード操作コード作成部16,キーボード操作コード
作成情報格納部17,キーボード信号作成部18,及び
キーボード信号作成情報格納部19,キーボード信号出
力部20を追加したものである。FIG. 6 is a block diagram showing the functional configuration of the input device 11 shown in FIG. 5 together with the system unit 13.
The input device 11 is the same as the character recognition device 1 shown in FIG. 1, except that the keyboard operation code creation unit 16, the keyboard operation code creation information storage unit 17, the keyboard signal creation unit 18, the keyboard signal creation information storage unit 19, and the keyboard signal output are provided. The part 20 is added.
【0046】キーボード操作コード作成部16は、キー
ボード操作コード作成情報格納部17に格納されている
情報をもとにして、文字認識装置1から入力される各認
識コードをキーボード操作コード(キー操作に対応する
コード)に変換してキーボード信号作成部18へ送る。The keyboard operation code creation unit 16 uses the information stored in the keyboard operation code creation information storage unit 17 to recognize each recognition code input from the character recognition device 1 as a keyboard operation code (for key operation). It is converted into a corresponding code) and sent to the keyboard signal creation unit 18.
【0047】キーボード操作コード作成情報格納部17
は、キーボード操作コード作成部16が参照する情報を
テーブル形式で格納しており、文字認識装置1からの認
識コードによって認識された文字等の全ての情報に対し
て、それらの認識コードをインデックスとして対応させ
たキーボード操作コードが登録されている。Keyboard operation code creation information storage unit 17
Stores the information referred to by the keyboard operation code creation unit 16 in a table format. For all information such as characters recognized by the recognition code from the character recognition device 1, these recognition codes are used as indexes. The corresponding keyboard operation code is registered.
【0048】キーボード信号作成部18は、キーボード
操作コード作成部16から送られたキーボード操作コー
ドを、キーボード信号作成情報格納部19に格納してあ
る情報をもとにしてキーボード信号(キーボード上のキ
ー押下時のキーコードおよびそのオン・オフ信号に相当
する)に変換してキーボード信号出力部20へ送る。The keyboard signal creation unit 18 uses the keyboard operation code sent from the keyboard operation code creation unit 16 based on the information stored in the keyboard signal creation information storage unit 19 to generate a keyboard signal (key on the keyboard). The key code at the time of pressing and the corresponding ON / OFF signal are converted) and sent to the keyboard signal output unit 20.
【0049】キーボード信号作成情報格納部19は、キ
ーボード信号作成部18が参照する情報を格納してお
り、キーボード装置上の各キーボード操作コード(1キ
ー入力)に対応するそれぞれのキーボード信号データが
テーブル形式で登録されている。The keyboard signal creation information storage unit 19 stores the information referred to by the keyboard signal creation unit 18, and the keyboard signal data corresponding to each keyboard operation code (one key input) on the keyboard device is stored in a table. It is registered in the format.
【0050】このキーボード信号データとは、例えば、
キーボード装置からシステム装置に対して文字「A」を
入力した場合、キーボード装置からはシステム装置に対
してキーボード装置上のキー配列における文字「A」の
物理的な位置(キーコード)と共に、そのキーが押され
たこと(オン)と離されたこと(オフ)を示すデータを
通知しており、キーボード装置上の各キー単位に決めら
れているキー押下及び押下解除に関する通知情報をい
う。The keyboard signal data is, for example,
When the character "A" is input from the keyboard device to the system device, the keyboard device inputs the key to the system device along with the physical position (key code) of the character "A" in the key arrangement on the keyboard device. Data that indicates that the key is pressed (on) and released (off) is notified, and is notification information regarding key press and key release determined for each key unit on the keyboard device.
【0051】キーボード信号出力部20は、システム装
置13とキーボード装置間のデータの遣り取りを行なう
キーボードI/Fケーブル12を介して、キーボード信
号作成部18から受け取ったキーボード信号データをシ
ステム装置13へ出力する。The keyboard signal output unit 20 outputs the keyboard signal data received from the keyboard signal creation unit 18 to the system unit 13 via the keyboard I / F cable 12 for exchanging data between the system unit 13 and the keyboard unit. To do.
【0052】また、文字認識装置1では、認識できなか
った文字に対してその位置情報を含む特定の文字コード
(例えば前述の「FFXY」)を割り当て、それを認識
コードとして出力するので、キーボード操作コード作成
部16はその認識コードに対するキーボード操作コード
を作成し、そのキーボード操作コードによってキーボー
ド信号作成部18が対応するキーボード信号を作成し、
そのキーボード信号をシステム装置13へ出力する。し
たがって、システム装置13側では認識不可文字の存在
とその位置情報を知ることができる。Further, the character recognition apparatus 1 assigns a specific character code (for example, "FFXY" described above) including the position information to a character that cannot be recognized and outputs it as a recognition code. The code creating unit 16 creates a keyboard operation code for the recognition code, and the keyboard signal creating unit 18 creates a corresponding keyboard signal by the keyboard operation code,
The keyboard signal is output to the system unit 13. Therefore, the system device 13 side can know the existence of the unrecognizable character and its position information.
【0053】図7はキーボード操作コード作成情報の格
納フォーマットの一例を示す図、図8はキーボード信号
作成情報の格納フォーマットの一例を示す図である。キ
ーボード操作コード作成情報は、認識用データとキーボ
ード操作データからなり、認識用データはキーボード装
置上の各キーに対応する文字や記号等の情報(例えば、
「0」「A」「ア」等)であり、キーボード操作データ
は、それらの各情報を入力するためのキーボード操作の
情報である。FIG. 7 is a diagram showing an example of a storage format of keyboard operation code creation information, and FIG. 8 is a diagram showing an example of a storage format of keyboard signal creation information. The keyboard operation code creation information consists of recognition data and keyboard operation data. The recognition data is information such as characters and symbols corresponding to each key on the keyboard device (for example,
"0", "A", "A", etc.), and the keyboard operation data is information on keyboard operation for inputting the respective information.
【0054】たとえば、認識用データ「0」に対応する
‘0’を入力するキーボード操作データは、操作データ
制御情報としてキー操作数=2(2回のキー操作が必要
であることをしめす)と、‘英数’キーの操作を示すキ
ーボード信号作成情報で‘英数’キーを指すポインタ
と、‘0’キーの操作を示すキーボード信号作成情報で
‘0’キーを指すポインタとからなる。For example, the keyboard operation data for inputting “0” corresponding to the recognition data “0” has the number of key operations = 2 (indicating that two key operations are required) as the operation data control information. , A pointer pointing to the "alphanumeric" key in the keyboard signal creation information indicating the operation of the "alphanumeric" key, and a pointer pointing to the "0" key in the keyboard signal creation information indicating the operation of the "0" key.
【0055】また、認識用データ「ア」に対応する
‘ア’を入力するキーボード操作データは、操作データ
制御情報としてキー操作数=2と、‘カタカナ’キーの
操作を示すキーボード信号作成情報で‘カタカナ’キー
を指すポインタと、‘3’キーの操作を示すキーボード
信号作成情報で‘3’キーを示すポインタ(‘ア’のキ
ーは‘3’のキーを兼用しているので)とからなる。Further, the keyboard operation data for inputting "A" corresponding to the recognition data "A" is key operation number = 2 as operation data control information and keyboard signal creation information indicating operation of the "Katakana" key. From the pointer that points to the "Katakana" key and the pointer that points to the "3" key in the keyboard signal creation information that indicates the operation of the "3" key (since the "A" key also serves as the "3" key) Become.
【0056】また、キーボード信号作成情報は、図8に
示すように各キーの押下時と解放時のキーボード信号か
らなる。The keyboard signal generation information is composed of keyboard signals when each key is pressed and released, as shown in FIG.
【0057】次に、図6に示した入力装置11の各部間
の作用について説明する。まず、文字認識部15は認識
した文字に対する結果としてキーボード操作コード作成
情報格納部17内にある該当文字に対応したキーボード
操作データを指すポインタを出力する。Next, the operation of each part of the input device 11 shown in FIG. 6 will be described. First, the character recognition unit 15 outputs a pointer pointing to keyboard operation data corresponding to the corresponding character in the keyboard operation code creation information storage unit 17 as a result of the recognized character.
【0058】このキーボード操作データは、図9に示す
ように操作データ制御情報としてのキー操作数と、操作
データとしてのキーの操作情報を持ち、そのキー操作数
とは認識した文字を実際にキーボード装置から入力する
場合のキー操作回数であり、操作データとは、入力操作
手順に相当し、キーの操作(入力キーの種類)を入力順
にキー操作数だけ並べてある。また、キーの操作情報に
は、キーボード信号作成情報格納部19に格納されてい
る該当キーを指すポインタが設定されている。As shown in FIG. 9, this keyboard operation data has the number of key operations as the operation data control information and the operation information of the key as the operation data. It is the number of key operations when inputting from the device, and the operation data corresponds to the input operation procedure, and the key operations (types of input keys) are arranged by the number of key operations in the order of input. A pointer pointing to the corresponding key stored in the keyboard signal creation information storage unit 19 is set in the key operation information.
【0059】キーボード操作コード作成部16は、文字
認識装置1からポインタを受け取ると、そのポインタに
対応すキー操作数と操作データとを取り出し、キー操作
数だけ操作データから順にキーの操作情報(キーボード
信号作成情報へのポインタ)を入力してキーボード信号
作成部18へ出力する。Upon receiving the pointer from the character recognition device 1, the keyboard operation code creation unit 16 retrieves the number of key operations and operation data corresponding to the pointer, and operates the key operation information (keyboard in order from the operation data by the number of key operations). A pointer to signal creation information) is input and output to the keyboard signal creation unit 18.
【0060】キーボード信号作成部18は、キーボード
操作コード作成部16からのポインタによって該当する
キーのコードとその押下及び解放を示すキーボード信号
を順次キーボード信号出力部20へ出力する。そして、
キーボード信号出力部20は、キーボードI/Fケーブ
ル12を介してシステム装置13へそのキーボード信号
を出力する。The keyboard signal generation unit 18 sequentially outputs the code of the corresponding key and the keyboard signal indicating the pressing and releasing of the key to the keyboard signal output unit 20 by the pointer from the keyboard operation code generation unit 16. And
The keyboard signal output unit 20 outputs the keyboard signal to the system unit 13 via the keyboard I / F cable 12.
【0061】次に、図10のフローチャートによって入
力装置11による情報入力の処理について説明する。ま
ず、文字認識装置1によって文字を入力し、その文字の
認識の処理を行なってキーボード操作コード作成部16
にポインタを送る。Next, the process of inputting information by the input device 11 will be described with reference to the flowchart of FIG. First, a character is input by the character recognition device 1, the character recognition processing is performed, and the keyboard operation code creation unit 16
Send the pointer to.
【0062】そのポインタを受け取ったキーボード操作
コード作成部16は、そのポインタの指す該当データを
キーボード作成コード情報からキー操作数Ktを得て、
キーの操作の取り出し数Knを0に設定する。このキー
操作数Ktとキーの操作の取り出し数Knを比較して、
等しければ入力完了か否かを判断してYESなら終了す
るが、NOなら再び文字入力処理を繰り返す。Upon receiving the pointer, the keyboard operation code creating section 16 obtains the number of key operations Kt of the corresponding data pointed to by the pointer from the keyboard creating code information,
The number Kn of key operations taken out is set to zero. Compare the number Kt of key operations with the number Kn of key operations taken out,
If they are equal, it is determined whether or not the input is completed, and if YES, the process ends, but if NO, the character input process is repeated again.
【0063】一方、KtとKnが等しくなければ、キー
ボード信号作成部18によってKnに1を加算して操作
データからKn番目のキーの操作を得て、それが指すポ
インタでキーボード信号作成情報から押下時キーボード
信号を得て、キーボード信号出力部20によってキーボ
ード信号を出力する。On the other hand, if Kt and Kn are not equal, 1 is added to Kn by the keyboard signal creating unit 18 to obtain the operation of the Kn-th key from the operation data, and the pointer pointed to is pressed from the keyboard signal creation information. When the keyboard signal is obtained, the keyboard signal output unit 20 outputs the keyboard signal.
【0064】さらに、Kn番目のキーの操作が指すポイ
ンタでキーボード信号作成情報から解放時キーボード信
号を得て、キーボード信号出力部20によって出力する
と、KtとKnを比較する処理に戻り、KtとKnが等
しくなるまで処理を繰返す。Further, when a keyboard signal for release is obtained from the keyboard signal creation information by the pointer pointed by the operation of the Kn-th key and output by the keyboard signal output unit 20, the process returns to the process of comparing Kt and Kn, and Kt and Kn. The process is repeated until
【0065】次に、図11のブロック図によってさらに
この入力装置11における実際の文字入力の処理例につ
いて説明する。ここでは、カタカナ「ア」を入力する場
合について説明する。文字認識装置1がシートPに記入
されたカタカナ「ア」を読み取り、そのカタカナ「ア」
を認識してキーボード操作作成情報の認識用データ
「ア」を指すポインタをキーボード操作コード作成部1
6へ送る。Next, an example of actual character input processing in the input device 11 will be described with reference to the block diagram of FIG. Here, the case of inputting the katakana “A” will be described. The character recognition device 1 reads the katakana “A” written on the sheet P, and the katakana “A” is read.
Is recognized and the pointer pointing to the recognition data "A" of the keyboard operation creation information is moved to the keyboard operation code creation unit 1
Send to 6.
【0066】すると、キーボード操作コード作成部16
は、キーボード操作コード作成情報格納部17に格納さ
れている情報中の認識用データ「ア」に対応するキーボ
ード操作データとしてキーの操作回数のデータも含ん
で、‘カタカナ’キーの操作および‘3’キーの操作の
ポインタをキーボード信号作成部18へ送る。Then, the keyboard operation code creating section 16
Includes the data of the number of times the key is operated as the keyboard operation data corresponding to the recognition data “A” in the information stored in the keyboard operation code creation information storage unit 17. 'The pointer for key operation is sent to the keyboard signal creation unit 18.
【0067】キーボード信号作成部18では、そのポイ
ンタによってキーボード信号作成情報格納部19に格納
されている情報内の‘カタカナ’キー押下時のキーボー
ド信号と‘カタカナ’キー解放時のキーボード信号、及
び‘3’キー押下時のキーボード信号と‘3’キー解放
時のキーボード信号をキーボード信号出力部20へ出力
する。In the keyboard signal creation unit 18, the keyboard signal when the "Katakana" key is pressed in the information stored in the keyboard signal creation information storage unit 19 by the pointer, the keyboard signal when the "Katakana" key is released, and " The keyboard signal when the 3'key is pressed and the keyboard signal when the '3' key is released are output to the keyboard signal output unit 20.
【0068】このようにして、キー入力以外の手段によ
って入力された文字等の情報をキーボード装置からキー
入力されたかのようにキーボード信号でシステム装置に
出力する。したがって、システム装置はキーボード装置
以外からの入力情報もキーボード装置からのキー操作入
力と同じデータとして処理することができる。In this way, information such as characters input by means other than key input is output to the system unit as a keyboard signal as if the key input was made from the keyboard unit. Therefore, the system device can process input information from other than the keyboard device as the same data as the key operation input from the keyboard device.
【0069】以下、この実施例の入力装置11における
効果を列挙する。まず、マン−マシンインタフェースの
向上に関するものとして、 (1)キー配列を覚えなくてもよいので入力が容易にな
る。 (2)キー操作の熟練が不要になる。 (3)不慣れなキーボード装置を使用しなくても、手書
き入力等によって文字だけでなく、各種制御情報(例え
ば、半角,倍角,改行,改頁,変換等)をも、文字の組
み合わせや記号,マーク等によって素早く入力すること
ができる。 (4)文字等を間違えて入力しない限り誤入力の恐れが
ない。 (5)日常使用する業務プログラム起動のような、一連
の操作情報を印刷したカードを読み取らせて装置を起動
させるような定形入力操作を容易に行なえる。 (6)障害者でも容易に文字等の入力を行なえるように
なる。The effects of the input device 11 of this embodiment will be listed below. First of all, as to the improvement of the man-machine interface, (1) it is not necessary to remember the key arrangement, so that the input becomes easy. (2) The skill of key operation becomes unnecessary. (3) Even without using an unfamiliar keyboard device, not only characters but also various control information (for example, half-width, double-width, line feed, page break, conversion, etc.) by handwriting input, character combinations, symbols, You can quickly enter by using the mark. (4) There is no risk of erroneous input unless you make a mistake in entering the characters. (5) It is possible to easily perform a fixed-form input operation such as starting a business program that is used daily, by reading a card on which a series of operation information is printed and starting the apparatus. (6) Even persons with disabilities can easily input characters and the like.
【0070】また、ハード面に関して、 (7)すべての入力情報がキーボードI/Fからキーボ
ード信号で入力されるため、システム装置側で入力手段
に応じて異なる認識処理を行なうような負荷の増加がな
い。 (8)一般のキーボード装置を使用するほとんどのデー
タ処理装置にそのまま使用でき、汎用性がある。 (9)操作性を低下させることなく小型化を容易にでき
る。 (10)ファイリング装置に適用すれば、ファイリング
処理の際にイメージではなくコードで入力できるためデ
ータ量が少なくて済み、システム装置におけるメモリ等
の資源を有効に活用することができる。With regard to hardware, (7) Since all input information is input as keyboard signals from the keyboard I / F, there is an increase in the load of different recognition processing on the system unit side depending on the input means. Absent. (8) It can be used as it is for most data processing devices using a general keyboard device and is versatile. (9) The size can be easily reduced without lowering the operability. (10) When applied to a filing device, the amount of data can be small because a code can be input instead of an image in the filing process, and resources such as a memory in the system device can be effectively used.
【0071】[0071]
【発明の効果】以上説明してきたように、この発明によ
る文字認識装置によれば、原稿から読み取った全ての画
像を保存しなくても文字認識できない文字に対する処理
を効率良く行なえるので、記憶容量の大きいメモリを設
ける必要がなく、文字認識装置の小型化及び低コスト化
が可能になる。また、文字コードの出力先であるシステ
ム装置のメモリ領域の使用量を低減でき、システム装置
がメモリを効率良く使用することができる。さらに、シ
ステム装置側で文字認識できない文字の処理を効率良く
行なえる。As described above, according to the character recognition apparatus of the present invention, it is possible to efficiently process characters that cannot be recognized without storing all the images read from the document, so that the storage capacity can be increased. Since it is not necessary to provide a large memory, it is possible to reduce the size and cost of the character recognition device. Further, the amount of use of the memory area of the system device, which is the output destination of the character code, can be reduced, and the system device can efficiently use the memory. Further, it is possible to efficiently process characters that cannot be recognized by the system device.
【図1】この発明の一実施例である文字認識装置の機能
構成をシステム装置と共に示すブロック図である。FIG. 1 is a block diagram showing a functional configuration of a character recognition device according to an embodiment of the present invention together with a system device.
【図2】図1に示した文字認識部における文字認識処理
について示すフローチャートである。FIG. 2 is a flowchart showing a character recognition process in a character recognition unit shown in FIG.
【図3】図1に示した文字認識装置に読み取らせる複数
の英文字を手書きした原稿の一例を示す図である。3 is a diagram showing an example of a manuscript handwritten with a plurality of English characters to be read by the character recognition device shown in FIG.
【図4】図3に示した破線枠Im内の文字のイメージデ
ータのドットパターンを示す図である。4 is a diagram showing a dot pattern of image data of a character within a broken line frame Im shown in FIG.
【図5】この発明による文字認識装置を含む入力装置を
使用したデータ処理装置の外観斜視図である。FIG. 5 is an external perspective view of a data processing device using an input device including a character recognition device according to the present invention.
【図6】図5に示した入力装置の機能構成の一例をシス
テム装置と共に示すブロック図である。6 is a block diagram showing an example of a functional configuration of the input device shown in FIG. 5 together with a system device.
【図7】キーボード操作コード作成情報の格納フォーマ
ットの一例を示す図である。FIG. 7 is a diagram showing an example of a storage format of keyboard operation code creation information.
【図8】キーボード信号作成情報の格納フォーマットの
一例を示す図である。FIG. 8 is a diagram showing an example of a storage format of keyboard signal creation information.
【図9】キーボード操作データの格納フォーマットの一
例を示す図である。FIG. 9 is a diagram showing an example of a storage format of keyboard operation data.
【図10】同じくその入力装置の情報入力処理について
示すフローチャートである。FIG. 10 is a flowchart showing information input processing of the input device.
【図11】同じくその入力装置による実際の文字入力処
理例について説明するためのブロック図である。FIG. 11 is a block diagram for explaining an actual example of character input processing by the input device.
1 文字認識装置 1a インタフェー
スケーブル 2 システム装置 3 画像読取部 4 文字抽出部 5 文字位置検出部 6 文字認識部 7 文字コード作成
部 8 文字情報出力部 9 認識不可文字情
報保存部 St 原稿 11 入力装置 12 キーボードインタフェース(I/F)ケーブル 13 システム装置 16 キーボード操
作コード作成部 17 キーボード操作コード作成情報格納部 18 キーボード信号作成部 19 キーボード信
号作成情報格納部 20 キーボード信号出力部1 character recognition device 1a interface cable 2 system device 3 image reading unit 4 character extraction unit 5 character position detection unit 6 character recognition unit 7 character code creation unit 8 character information output unit 9 unrecognizable character information storage unit St manuscript 11 input device 12 Keyboard interface (I / F) cable 13 System unit 16 Keyboard operation code creation unit 17 Keyboard operation code creation information storage unit 18 Keyboard signal creation unit 19 Keyboard signal creation information storage unit 20 Keyboard signal output unit
Claims (3)
字情報の画像をイメージデータとして読み取る画像読取
手段と、該手段によって読み取ったイメージデータから
各文字部分を抽出する文字抽出手段と、該手段によって
抽出した各文字部分の位置を検出する文字位置検出手段
と、前記文字抽出手段によって抽出された各部のイメー
ジデータから文字認識を行なう文字認識手段と、該手段
によって文字認識できた文字に対応する文字コードを割
り当てる文字コード作成手段と、該手段によって割り当
てられた文字コードを認識文字情報として出力する文字
情報出力手段と、前記文字認識手段によって文字認識で
きなかったイメージデータとその位置情報を認識不可文
字情報として保存する認識不可文字情報保存手段とを備
えたことを特徴とする文字認識装置。1. An image reading unit for reading an image of character information such as printed or handwritten characters and symbols as image data, a character extracting unit for extracting each character portion from the image data read by the unit, and the unit. The character position detecting means for detecting the position of each character portion extracted by the above, the character recognizing means for recognizing the character from the image data of each portion extracted by the character extracting means, and the character recognized by the means. Character code creating means for allocating a character code, character information output means for outputting the character code assigned by the means as recognition character information, and image data which cannot be recognized by the character recognition means and its position information cannot be recognized. Characteristic information storage means for storing as character information is provided. Character recognition device.
文字認識できなかったイメージデータに対してその位置
情報を含む特定の文字コードを割り当てる手段を有し、
前記文字情報出力手段がその特定の文字コードも認識文
字情報として出力するようにしたことを特徴とする文字
認識装置。2. The character recognition device according to claim 1, wherein the character code creating means assigns a specific character code including position information to image data that cannot be recognized by the character recognition means. Have,
A character recognition device, wherein the character information output means also outputs the specific character code as recognized character information.
の文字認識できなかったイメージデータも認識文字情報
として出力するようにしたことを特徴とする文字認識装
置。3. The character recognition device according to claim 2, wherein the character information output means outputs, together with the specific character code, image data in which the character cannot be recognized as recognized character information. Character recognizer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4166441A JPH0612522A (en) | 1992-06-24 | 1992-06-24 | Character recognizing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP4166441A JPH0612522A (en) | 1992-06-24 | 1992-06-24 | Character recognizing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0612522A true JPH0612522A (en) | 1994-01-21 |
Family
ID=15831465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP4166441A Pending JPH0612522A (en) | 1992-06-24 | 1992-06-24 | Character recognizing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0612522A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002329170A (en) * | 2001-04-27 | 2002-11-15 | Konica Corp | Image input/output device and image input/output managing device |
-
1992
- 1992-06-24 JP JP4166441A patent/JPH0612522A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002329170A (en) * | 2001-04-27 | 2002-11-15 | Konica Corp | Image input/output device and image input/output managing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2000322417A (en) | Device and method for filing image and storage medium | |
JPH0612522A (en) | Character recognizing device | |
JP3133419B2 (en) | Input device | |
JPH0612403A (en) | Input device | |
JPH04290184A (en) | Handwritten document creation device | |
JPH0628336A (en) | Input device | |
JP3130346B2 (en) | Input device | |
JPH0660053A (en) | Input device | |
JPH0644216A (en) | Input device | |
JPH05257586A (en) | Input unit | |
JPH0668067A (en) | Input device | |
JPH0644217A (en) | Input device | |
JPH05134796A (en) | Input device | |
JPH05274465A (en) | Input device | |
JPH05120258A (en) | Input device | |
JPH0660054A (en) | Input device | |
JPH05257587A (en) | Input unit | |
JPH0652347A (en) | Input device | |
JPH06131092A (en) | Input device | |
JPH0628519A (en) | Input device | |
JPS62271089A (en) | Character information input device | |
JPH0619879A (en) | Input device | |
JPH05128298A (en) | Input device | |
JPH0635905A (en) | Input device | |
JPH09138835A (en) | Character recognition system |