JPH0991371A - Character display device - Google Patents

Character display device

Info

Publication number
JPH0991371A
JPH0991371A JP7243166A JP24316695A JPH0991371A JP H0991371 A JPH0991371 A JP H0991371A JP 7243166 A JP7243166 A JP 7243166A JP 24316695 A JP24316695 A JP 24316695A JP H0991371 A JPH0991371 A JP H0991371A
Authority
JP
Japan
Prior art keywords
image
character
data
display
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7243166A
Other languages
Japanese (ja)
Inventor
Mitsuhiro Yuhito
光宏 由比藤
Yoshiaki Inada
善明 稲田
Kazuyuki Horigome
和幸 堀米
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP7243166A priority Critical patent/JPH0991371A/en
Publication of JPH0991371A publication Critical patent/JPH0991371A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide the character display device which can display characters together with images of illustrations, etc., without correcting characters which where not recognized or erroneously recognized by a character recognizing means. SOLUTION: The character display device is equipped with an element image deciding and storing means 8 which discriminates between a non-character image that does not consist of characters at all and a character element image that consists of characters entirely according to the recognition result of a recognizing means 5 and stores image data of the element image as a non- character image part when the image is the non-character element image, an unrecognized character extracting and storing means 9 which extracts image data of a character that the character recognizing means can not recognize and the position of the data in the image and stores them as an unrecognized character file, and a display data composing means 11 which puts bit map data for display generated by a bit map data generating means 12 and the image data stored in the non-character image part file together to generate data for display.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、文字表示装置に関
し、特に、文字認識できなかった文字を含む認識結果を
表示するための技術に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character display device, and more particularly to a technique for displaying a recognition result including a character that cannot be recognized.

【0002】[0002]

【従来の技術】従来の文字表示装置は、まず、イメージ
スキャナで読み取った原稿等のイメージ画像データある
いは外部記憶装置等に予め蓄積されたイメージ画像デー
タから文字部分の段落および図版等の像画部分のレイア
ウト構造を解析し、段落(文字列)および図版ごとのイ
メージ画像データ(要素画像)の位置を抽出する。
2. Description of the Related Art In a conventional character display device, first, a paragraph of a character portion and an image portion such as a plate are drawn from image image data of an original read by an image scanner or image image data previously stored in an external storage device. The layout structure of is analyzed, and the positions of image data (element image) for each paragraph (character string) and each plate are extracted.

【0003】次に、前記要素画像ごとに分割を行い、1
文字ごとのイメージ画像データ(文字画像)を切り出
し、この文字画像と予め用意してある文字データの画像
情報とを比較することにより、文字画像に対応する文字
データ(文字コード)および使用文字フォント等を確定
する、いわゆる、文字認識を行い、認識した文字コード
および使用文字フォント等のデータを格納していた。
Next, each element image is divided into 1
Image data for each character (character image) is cut out, and by comparing this character image with the image information of the character data prepared in advance, the character data (character code) corresponding to the character image and the character font used, etc. That is, the so-called character recognition is performed, and the recognized character code and used character font data are stored.

【0004】このとき、要素画像を分解した全ての文字
画像が文字認識できない要素画像については、その要素
画像は図版等の非文字要素画像であると認識していた。
At this time, with respect to the element images in which all the character images obtained by decomposing the element images cannot be recognized as characters, the element images are recognized as non-character element images such as illustrations.

【0005】一方、要素画像中の一部の文字画像が認識
できない部分については、認識できない文字画像(認識
不可能文字)の位置を記憶すると共に、認識できた文字
については、予め用意した日本語辞書等を用いて単語お
よび文法の検査を行い、誤認識文字の特定をしていた。
On the other hand, the position of the unrecognizable character image (unrecognizable character) is stored for a part of the element image where the character image cannot be recognized, and the recognized character is prepared in Japanese. The words and grammar were inspected using a dictionary etc. to identify misrecognized characters.

【0006】さらには、認識不可能文字および誤認文字
を表示し、オペレータがイメージ画像データあるいは原
稿をもとに認識不可能文字および誤認識文字の入力を行
うことにより、認識不能および誤認識文字部分の修正を
行い、この修正した結果を外部記憶装置等に保存し、必
要に応じて外部記憶装置から読み出し、表示させてい
た。
Further, the unrecognizable character and the erroneously recognized character are displayed by displaying the unrecognizable character and the erroneously recognized character, and the operator inputs the unrecognizable character and the erroneously recognized character based on the image image data or the manuscript. The correction result is stored in an external storage device or the like, read out from the external storage device and displayed as needed.

【0007】[0007]

【発明が解決しようとする課題】本発明者は、前記従来
技術を検討した結果、以下の問題点を見いだした。
SUMMARY OF THE INVENTION As a result of studying the above prior art, the present inventor has found the following problems.

【0008】従来の文字表示装置では、イメージ画像デ
ータから要素画像ごとに1文字づつ切り出し、この切り
出した文字画像を文字データ(文字コード)に変換し、
この文字データのみを外部記憶装置に格納し、オペレー
タの表示指示で外部記憶装置から格納した文字データを
読み出し、表示装置に表示させるという構成になってい
たため、認識できない文字および誤認識された文字はオ
ペレータが修正した後に、文字認識結果として保存(格
納)しなければならないという問題があった。
In the conventional character display device, one character is cut out from the image image data for each element image, and the cut out character image is converted into character data (character code).
Only the character data is stored in the external storage device, and the character data stored in the external storage device is read by the operator's display instruction and displayed on the display device. There has been a problem that after the operator corrects it, it must be saved (stored) as the character recognition result.

【0009】本発明の目的は、文字認識手段が認識でき
ない文字および誤認識した文字をオペレータが修正する
ことなく、図版等の非文字画像と共に表示することが可
能な文字表示装置を提供することにある。
It is an object of the present invention to provide a character display device capable of displaying a character which cannot be recognized by the character recognition means and a character which is erroneously recognized together with a non-character image such as a picture plate without the operator correcting the character. is there.

【0010】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述及び添付図面によって明らか
になるであろう。
The above and other objects and novel features of the present invention will become apparent from the description of the present specification and the accompanying drawings.

【0011】[0011]

【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
下記のとおりである。
SUMMARY OF THE INVENTION Among the inventions disclosed in the present application, the outline of a representative one will be briefly described.
It is as follows.

【0012】(1)イメージスキャナで読みとったイメ
ージ画像データあるいは外部記憶装置に格納されている
イメージ画像データを要素画像に分割し、該分割された
各要素画像の全体画像中の位置を抽出する画像データ分
割抽出手段と、前記要素画像から1文字ごとのイメージ
画像データを切り出す文字切り出し手段と、切り出した
文字のイメージ画像データを認識し文字コードに変換す
る認識手段と、該変換結果を予め用意した辞書と比較し
て誤変換個所を抽出する誤変換抽出手段と、前記文字コ
ードと該誤変換個所の情報とを文字認識結果として格納
する文字認識格納手段と、オペレータの表示指示で前記
文字認識結果を読み出し、表示用の文字のビットマップ
データを作成するビットマップ文字データ作成手段と、
前記ビットマップデータを表示用の信号に変換し、表示
手段に表示させる画像表示手段とを備えた文字表示装置
であって、前記認識手段の認識結果から各要素画像が全
て文字以外のイメージ画像データから構成されている非
文字要素画像か、全て文字のイメージ画像データから構
成されている文字要素画像かを判定し、非文字要素画像
であった場合には該当する要素画像のイメージ画像デー
タを非文字画像部ファイルとして格納する要素画像判定
格納手段と、文字要素画像内で前記文字認識手段が認識
できない文字のイメージ画像データと該イメージ画像デ
ータの画像上の位置とを抽出し、非認識文字ファイルと
して格納する非認識文字抽出格納手段と、前記ビットマ
ップデータ作成手段が作成した表示用のビットマップデ
ータと非認識文字ファイルおよび非文字画像部ファイル
に格納されるイメージ画像データとを合成し、表示用の
ビットマップデータを作成する表示データ合成手段とを
具備する。
(1) An image in which image image data read by an image scanner or image image data stored in an external storage device is divided into element images, and the position of each divided element image in the entire image is extracted. Data division extraction means, character cutout means for cutting out image image data for each character from the element image, recognition means for recognizing the cutout image data of the character and converting it into a character code, and the conversion result are prepared in advance. An erroneous conversion extraction means for extracting an erroneous conversion point by comparing with a dictionary, a character recognition storage means for storing the character code and information of the erroneous conversion point as a character recognition result, and the character recognition result by an operator's display instruction And a bitmap character data creating means for reading out and creating bitmap data of characters for display,
A character display device comprising an image display means for converting the bitmap data into a signal for display and displaying the signal on a display means, wherein each element image is image data other than a character from the recognition result of the recognition means. Is determined to be a non-character element image or a character element image composed of all character image image data. An element image determination / storing means for storing as a character image part file, an image image data of a character that cannot be recognized by the character recognizing means in the character element image, and a position on the image of the image image data are extracted, and an unrecognized character file Unrecognized character extraction storage means for storing as, and bitmap data for display and unrecognized characters created by the bitmap data creation means Synthesizing the picture image data stored in Airu and non-text image unit files, and a display data combining means for creating a bit map data for display.

【0013】前述した手段によれば、まず、画像データ
分割抽出手段がイメージ画像データを要素画像に分割し
て各要素画像の全体画像中の位置を抽出し、次に、文字
切り出し手段が前記要素画像内の文字画像を1文字づつ
切り出す。
According to the above-mentioned means, first, the image data division extraction means divides the image image data into element images to extract the positions of the respective element images in the whole image, and then the character cut-out means makes the elements. Cut out character images in the image one by one.

【0014】次に、認識手段が1文字づつ切り出した文
字を該当する文字コードに対応させる文字認識を行い、
文字認識の後処理として、誤変換抽出手段が文字認識で
得られた文章を予め用意してある知識辞書等の辞書を基
に認識結果の検証を行うことにより、誤認識個所(誤認
識文字)の特定を行う。
Next, the recognition means performs character recognition in which the characters cut out one by one correspond to the corresponding character codes,
As a post-processing of character recognition, the erroneous conversion extraction means verifies the recognition result based on a dictionary such as a knowledge dictionary in which the sentence obtained by the character recognition is prepared in advance. To identify.

【0015】誤認識箇所の特定が終了したならば、文字
認識格納手段は正常に認識された文字のみを文字認識結
果として格納する。
When the identification of the erroneously recognized portion is completed, the character recognition storage means stores only the normally recognized character as the character recognition result.

【0016】要素画像判定格納手段は、前記認識手段の
認識結果から各要素画像が全て文字以外のイメージ画像
データから構成されている非文字要素画像か、全て文字
のイメージ画像データから構成されている文字要素画像
かを判定し、非文字要素画像であった場合には該当する
要素画像のイメージ画像データを非文字画像部ファイル
として格納する。
The element image judgment storage means is composed of non-character element images in which each element image is composed of image image data other than characters, or image data of all characters, based on the recognition result of the recognition means. If it is a non-character element image, the image image data of the corresponding element image is stored as a non-character image part file.

【0017】文字認識を行った要素画像内に認識できな
い文字があった場合には、非認識文字抽出格納手段が認
識できなかった文字の要素画像内での位置とイメージ画
像データとを抽出し、抽出した位置とイメージ画像デー
タとを非認識文字ファイルに格納し、文字認識および認
識結果の格納を終了する。
When there is an unrecognizable character in the element image subjected to character recognition, the unrecognized character extracting / storing means extracts the position of the unrecognizable character in the element image and the image image data, The extracted position and the image image data are stored in the unrecognized character file, and the character recognition and the storage of the recognition result are completed.

【0018】このとき、オペレータから表示指示があっ
た場合、まず、ビットマップ文字データ作成手段が文字
認識結果を読み出し、表示用のビットマップデータを作
成する。
At this time, when there is a display instruction from the operator, first, the bit map character data creating means reads the character recognition result and creates bit map data for display.

【0019】次に、表示データ合成手段が前記表示用の
ビットマップデータと非認識文字ファイルおよび非文字
画像部ファイルに格納されるイメージ画像データとを合
成し、表示用の合成ビットマップデータを作成して画像
表示手段に送る。
Next, the display data synthesizing means synthesizes the display bitmap data with the image image data stored in the non-recognized character file and the non-character image part file to create the synthesized bitmap data for display. And send it to the image display means.

【0020】画像表示手段は、合成ビットマップデータ
を表示用の信号に変換し、表示手段に表示させる。
The image display means converts the composite bitmap data into a signal for display and causes the display means to display the signal.

【0021】このように、認識手段が文字として正確に
認識できた文字については文字コードを格納し、一方、
文字として認識できない、あるいは、誤認識してしまっ
た文字についてはその文字のイメージ画像データを非認
識文字ファイルとして格納しておき、オペレータから表
示の指示があったときには、格納した文字コードから生
成したビットマップデータと、非認識文字ファイルから
読み出したイメージ画像データとを位置情報に基づいて
合成することにより、文字として認識できない文字およ
び誤認識してしまった文字をオペレータが修正すること
なく格納しておき、表示指示により表示させることがで
きる。
In this way, the character code is stored for the character that the recognition means has correctly recognized as a character, while
For characters that cannot be recognized as characters or that have been erroneously recognized, the image data of the character is stored as an unrecognized character file, and when the operator instructs to display it, it is generated from the stored character code. By combining the bitmap data and the image image data read from the unrecognized character file based on the position information, the characters that cannot be recognized as characters and the characters that are erroneously recognized can be stored without being corrected by the operator. Every time, it can be displayed by a display instruction.

【0022】[0022]

【発明の実施形態】以下、本発明について、発明の実施
形態(実施例)とともに図面を参照して詳細に説明す
る。
BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, the present invention will be described in detail with reference to the drawings together with embodiments (examples) of the invention.

【0023】なお、発明の実施形態を説明するための全
図において、同一機能を有するものは同一符号を付け、
その繰り返しの説明は省略する。
In all the drawings for explaining the embodiments of the invention, components having the same function are designated by the same reference numerals,
The description of the repetition is omitted.

【0024】図1は本発明の一実施形態の文字表示装置
の概略構成を示すブロック図であり、1はイメージ画像
データ入力端子、2は画像データ蓄積手段、3は画像デ
ータ分割抽出手段、4は文字切り出し手段、5は認識手
段、6は誤変換抽出手段、7は文字認識格納手段、8は
要素画像判定格納手段、9は非認識文字抽出格納手段、
10は詳細レイアウト構造記述手段、11は表示データ
合成手段、12はビットマップ文字データ作成手段、1
3は文字表示用バッファメモリ、14は画像合成用メモ
リ、15は画像表示用メモリ、16は画像表示手段であ
る。
FIG. 1 is a block diagram showing a schematic configuration of a character display device according to an embodiment of the present invention. 1 is an image image data input terminal, 2 is image data storage means, 3 is image data division extraction means, 4 Is character cutting means, 5 is recognition means, 6 is erroneous conversion extraction means, 7 is character recognition storage means, 8 is element image determination storage means, 9 is unrecognized character extraction storage means,
Reference numeral 10 is a detailed layout structure description means, 11 is a display data synthesizing means, 12 is a bitmap character data creating means, 1
Reference numeral 3 is a character display buffer memory, 14 is an image composition memory, 15 is an image display memory, and 16 is an image display means.

【0025】図1において、イメージ画像データ入力端
子1はイメージ画像データを本実施形態の文字表示装置
に読み込むための読み込み端子であり、図示しないイメ
ージスキャナあるいはイメージ画像データが格納された
図示しない外部記憶装置が接続される。
In FIG. 1, an image image data input terminal 1 is a reading terminal for reading the image image data into the character display device of this embodiment, and an image scanner (not shown) or an external storage (not shown) in which the image image data is stored. The device is connected.

【0026】画像データ蓄積手段2は、イメージ画像デ
ータ入力端子1から読み込んだイメージ画像データを格
納しておくためのメモリであり、本実施形態において
は、主メモリ上に確保される。
The image data storage means 2 is a memory for storing the image image data read from the image image data input terminal 1, and in the present embodiment, it is secured on the main memory.

【0027】画像データ分割抽出手段3は、画像データ
蓄積手段2に蓄積されたイメージ画像データから読み取
り対象となる全体画像中で、画像を構成する単位ブロッ
クである複数の要素画像の位置を抽出し、各要素画像が
背景を示すものであるかを示す識別子と、前記要素画像
の位置とを1つのファイルに格納する。
The image data division extraction means 3 extracts the positions of a plurality of element images, which are unit blocks constituting an image, from the image image data stored in the image data storage means 2 in the entire image to be read. An identifier indicating whether each element image indicates a background and the position of the element image are stored in one file.

【0028】文字切り出し手段4は、前記画像データ分
割抽出手段3により段組みごとに抽出(分割)された要
素画像を、公知の技術を用いて、1文字単位のイメージ
画像(文字画像)として切り出す。
The character cut-out means 4 cuts out the element images extracted (divided) for each column by the image data division extraction means 3 as an image image (character image) of each character using a known technique. .

【0029】認識手段5は、文字切り出し手段4で切り
出された文字画像を1文字づつ順番に読み込み、たとえ
ば、パターンマッチング法により、1文字づつに分割さ
れた文字画像と、予め定められたテンプレートとを比較
・照合することにより文字画像に該当する文字を特定し
文字コードに変換する、いわゆる、文字認識を行う。
The recognizing means 5 reads the character images cut out by the character cutting means 4 in order one by one and, for example, a character image divided into each character by a pattern matching method and a predetermined template. Characters corresponding to a character image are specified by comparing and collating with each other and converted into a character code, so-called character recognition is performed.

【0030】誤変換抽出手段6は、公知の技術を用いて
おり、認識手段5で得られた文章を予め用意してある知
識辞書等の辞書を基に認識結果の検証を行うことによ
り、誤認識個所の特定を行う。
The erroneous conversion extraction means 6 uses a known technique, and verifies the recognition result based on a dictionary such as a knowledge dictionary in which the sentence obtained by the recognition means 5 is prepared in advance. Identify the recognition point.

【0031】文字認識格納手段7は、認識手段5で認識
された文字の文字コードを図示しないメモリに格納す
る。
The character recognition storage means 7 stores the character code of the character recognized by the recognition means 5 in a memory (not shown).

【0032】要素画像判定格納手段8は、公知の技術を
用いており、各要素画像内で文字として認識された部分
があるか否かを調べ、たとえば、要素画像内に文字とし
て認識された部分が含まれていない場合は、その要素画
像は文字を含まない非文字要素画像、すなわち、図版と
判断し、この要素画像の位置を抽出してその位置とイメ
ージ画像データとを画像ファイル(非認識文字ファイ
ル)として格納する。
The element image determination / storage means 8 uses a known technique, and checks whether or not there is a portion recognized as a character in each element image, and, for example, a portion recognized as a character in the element image. If the element image is not included, it is determined that the element image is a non-character element image that does not include characters, that is, a figure, the position of this element image is extracted, and the position and the image image data are extracted as an image file (non-recognition). Character file).

【0033】非認識文字抽出格納手段9は、要素画像判
定格納手段8で文字を含む要素画像であると判断された
文字の要素画像の内、認識手段5で認識された文字と、
認識できなかった文字の文字画像と、それぞれのレイア
ウト上での位置情報とをファイルに記述し、たとえば、
図示しない外部記憶装置に格納し、保存する。
The unrecognized character extraction / storing means 9 selects the character recognized by the recognizing means 5 among the element images of the characters determined to be the element image including the character by the element image determining / storing means 8.
Describe the character image of the unrecognized character and the position information on each layout in the file, for example,
It is stored and saved in an external storage device (not shown).

【0034】詳細レイアウト構造記述手段10は、画像
データ分割抽出手段3が抽出した要素画像の入力画像上
での位置と、非認識文字抽出格納手段9の出力とから、
画像データ全体の詳細なレイアウト構造を詳細レイアウ
ト構造ファイルという名前のテキストファイルとして、
図示しない外部記憶装置に保存する。
The detailed layout structure description means 10 determines from the position of the element image extracted by the image data division extraction means 3 on the input image and the output of the unrecognized character extraction storage means 9
The detailed layout structure of the entire image data is stored in a text file called the detailed layout structure file.
It is saved in an external storage device (not shown).

【0035】表示データ合成手段11は、オペレータの
指示で詳細レイアウト構造ファイルに記述されている要
素画像に位置、各要素画像が図版(非文字要素画像)で
あるか文字(文字要素画像)であるかの種別、および、
文字要素画像内の認識できた文字の文字コードと認識で
きなかった文字の位置とから、それぞれのデータが格納
されているファイルのデータを読み出し、文字コードは
ビットマップ文字データ作成手段12に、イメージ画像
データは画像合成用メモリ14にそれぞれ転送する。
The display data synthesizing means 11 is the position of the element image described in the detailed layout structure file according to the instruction of the operator, and each element image is a graphic (non-character element image) or a character (character element image). Type, and
From the character code of the recognized character and the position of the unrecognized character in the character element image, the data of the file in which the respective data is stored is read out, and the character code is stored in the bitmap character data creating means 12 as an image. The image data is transferred to the image compositing memory 14, respectively.

【0036】ビットマップ文字データ作成手段12は、
表示データ合成手段11から転送された文字コードに基
づき、文字コードに該当する文字の表示用データを作成
する。
The bit map character data creating means 12 is
Based on the character code transferred from the display data synthesizing means 11, the display data of the character corresponding to the character code is created.

【0037】文字表示用バッファメモリ13は、ビット
マップ文字データ作成手段12が作成した表示用ビット
マップデータを記憶するためのメモリである。
The character display buffer memory 13 is a memory for storing the display bit map data created by the bit map character data creating means 12.

【0038】画像合成用メモリ14は、表示データ合成
手段11が読み出したイメージ画像データと文字表示用
バッファメモリ13に記憶された文字のビットマップデ
ータとを合成し、一時的に記憶しておくメモリである。
The image synthesizing memory 14 is a memory for synthesizing the image image data read by the display data synthesizing unit 11 and the bit map data of the character stored in the character display buffer memory 13, and temporarily storing the synthesized image data. Is.

【0039】画像表示用メモリ15は、図示しない表示
装置に表示させるためのビットマップデータを格納する
ためのメモリである。
The image display memory 15 is a memory for storing bitmap data to be displayed on a display device (not shown).

【0040】画像表示手段16は、画像表示用メモリ1
5に格納されたビットマップデータを順次読み出し、図
示しない表示装置に画像を表示させるためのアナログ信
号に変換する。
The image display means 16 comprises the image display memory 1
The bitmap data stored in 5 is sequentially read and converted into an analog signal for displaying an image on a display device (not shown).

【0041】図2は本実施形態の文字表示装置の動作を
説明するための入力画像を示す図であり、文字と図版を
含む。
FIG. 2 is a diagram showing an input image for explaining the operation of the character display device of the present embodiment, which includes characters and illustrations.

【0042】図3は図2に示す入力画像を本実施形態の
文字表示装置により、文字列および図版からなる要素画
像に分割した結果を示しており、301〜308は順番
に要素画像1〜8を示す。
FIG. 3 shows the result of dividing the input image shown in FIG. 2 into element images consisting of character strings and illustrations by the character display device of the present embodiment. Numerals 301 to 308 indicate element images 1 to 8 in order. Indicates.

【0043】図3において、たとえば、要素画像8(3
08)は背景画像を示しており、画像データ分割抽出手
段3は図3に示すように分割した画像を背景画像をファ
イル名とする背景画像ファイルとして、図示しない外部
記憶装置に格納し、保存する。
In FIG. 3, for example, the element image 8 (3
Reference numeral 08) indicates a background image, and the image data division and extraction unit 3 stores the image divided as shown in FIG. 3 as a background image file having the background image as a file name in an external storage device (not shown) and saves it. .

【0044】図4は図3に示すように分割した結果を格
納するファイルの記述例であり、上から順番に要素画像
ごとの情報が格納されており、たとえば、401で示す
要素画像1の行の場合を例にとり記述内容を説明する
と、向かって左側から順番に、対象となる要素画像の名
称である「要素画像1」、次が対象となる要素画像が背
景を示すものであるか、あるいは、背景以外のものを示
すのかが記述される識別子であり、本実施形態において
は、「0」が背景画像を示し、「1」が背景画像以外で
あることを示す。
FIG. 4 is a description example of a file for storing the result of division as shown in FIG. 3, in which information for each element image is stored in order from the top. For example, the row of element image 1 indicated by 401. In the case of the example, the description contents will be described. From the left side in order, “element image 1” which is the name of the target element image, and the next target element image indicates the background, or , Is an identifier that describes whether it indicates something other than the background. In the present embodiment, “0” indicates the background image and “1” indicates other than the background image.

【0045】次のx1,y1は対象となる要素画像30
1が画像上のどの位置に位置するかを示す座標値であ
り、図5に示すように、画像の上側からの距離をx1、
左側からの距離をy1に記述する。
Next, x1 and y1 are target element images 30.
1 is a coordinate value indicating which position on the image is located. As shown in FIG. 5, the distance from the upper side of the image is x1,
The distance from the left side is described as y1.

【0046】「¥n」は改行を示し、402で示す要素
画像8の行の「¥e」はファイルの終了を示し、各情報
は「:(コロン)」で区切られる。
"\ N" indicates a line feed, "\ e" on the line of the element image 8 indicated by 402 indicates the end of the file, and each information is separated by ": (colon)".

【0047】図6は文字切り出し手段4の動作を説明す
るための図であり、601は切り出し文字画像1、60
2は切り出し文字画像2、603は切り出し文字画像
3、604は切り出し文字画像4を示す。
FIG. 6 is a diagram for explaining the operation of the character cut-out means 4, and 601 shows cut-out character images 1 and 60.
Reference numeral 2 indicates a cutout character image 2, 603 indicates a cutout character image 3, and 604 indicates a cutout character image 4.

【0048】図6において、切り出し文字画像1〜4
(601〜604)は表題である要素画像301を文字
切り出し手段4で1文字ごとの文字画像に分割した文字
画像であり、要素画像301は「表」,「示」,
「装」,「置」の4文字分の文字画像に分割できたこと
を示す。
In FIG. 6, cut character images 1 to 4
(601 to 604) are character images obtained by dividing the element image 301, which is the title, into character images for each character by the character cutting means 4, and the element images 301 are “table”, “show”,
This indicates that the character image for 4 characters of "apparatus" and "position" could be divided.

【0049】図7は切り出し手段4が図版を分割したと
きの動作を説明するための図であり、701、702は
それぞれ切り出し文字画像5、切り出し文字画像6を示
す。
FIG. 7 is a diagram for explaining the operation when the cut-out means 4 divides the drawing, and reference numerals 701 and 702 denote the cut-out character image 5 and the cut-out character image 6, respectively.

【0050】図7において、切り出し文字画像5,6
(701,702)は、図版であるイメージスキャナと
情報処理装置とがケーブルで接続されている図を、切り
出し手段4が文字として扱い、分割したものである。
In FIG. 7, cut-out character images 5, 6
(701, 702) is a diagram obtained by dividing the diagram in which the image scanner and the information processing device, which are illustrated, are connected by a cable by the cutting means 4 as a character.

【0051】図8は要素画像判定格納手段8が文字画像
の認識結果を判定した結果を示す図であり、黒でハッチ
ングしたところが文字として認識できなかった文字を示
す。
FIG. 8 is a diagram showing a result of the recognition result of the character image judged by the element image judgment storing means 8, and a hatched portion in black indicates a character which cannot be recognized as a character.

【0052】図9は非認識文字抽出格納手段9の動作を
説明するための図であり、901〜903は要素画像3
(303)内で文字として認識できなかった部分を示
す。
FIG. 9 is a diagram for explaining the operation of the unrecognized character extraction / storing means 9, and 901 to 903 are element images 3.
The part which cannot be recognized as a character in (303) is shown.

【0053】図10は図9に示す認識結果をファイルに
保存した場合を示す図であり、1行目に使用している文
字の大きさ、2行目に使用している文字フォントの種
類、3行目に行間隔、4行目以降に認識結果である本文
を記述する。
FIG. 10 is a diagram showing a case where the recognition result shown in FIG. 9 is saved in a file. The size of the character used in the first line, the type of character font used in the second line, In the third line, the line spacing is described, and in the fourth and subsequent lines, the text that is the recognition result is described.

【0054】図11は詳細レイアウト構造記述手段10
が画像の認識結果を格納するファイルの記述例であり、
1101は要素画像1(301)の記述例、1102は
背景を示す要素画像8(308)の記述例を示す。
FIG. 11 shows the detailed layout structure description means 10.
Is a description example of the file that stores the recognition result of the image,
Reference numeral 1101 shows a description example of the element image 1 (301), and 1102 shows a description example of the element image 8 (308) showing the background.

【0055】次に、図1に基づき本発明の本実施形態の
画像認識システムの動作について説明すると、まず、イ
メージ画像入力端子1に接続される図示しないイメージ
スキャナから、図2に示す図版入り文章のイメージ画像
データが入力されると、このイメージ画像データは画像
データ蓄積手段2に格納される。
Next, the operation of the image recognition system of this embodiment of the present invention will be described with reference to FIG. 1. First, from the image scanner (not shown) connected to the image image input terminal 1, the text containing the illustration shown in FIG. When the image image data of is input, this image image data is stored in the image data storage means 2.

【0056】次に、画像データ分割抽出手段3が画像デ
ータ蓄積手段2に格納されたイメージ画像データを、図
3の点線で囲み示すように要素画像1〜8(301〜3
08)に分割し、この分割結果を図4に示すように、対
応する要素画像1〜8(301〜308)に対応する識
別子と画像位置とをファイルに書き込みテキストファイ
ルとして保存する。
Next, the image data division extraction unit 3 extracts the image image data stored in the image data storage unit 2 from the element images 1 to 8 (301 to 3) as shown by the dotted lines in FIG.
08), and as a result of this division, as shown in FIG. 4, the identifiers and image positions corresponding to the corresponding element images 1 to 8 (301 to 308) are written in a file and saved as a text file.

【0057】次に、文字切り出し手段4が図5に示すよ
うに各要素画像1〜8(301〜308)をそれぞれ1
文字単位に分割する。
Next, as shown in FIG. 5, the character slicing means 4 sets the element images 1 to 8 (301 to 308) to 1 respectively.
Divide into characters.

【0058】たとえば、「表」,「示」,「装」,
「置」の4文字からなる要素画像1(301)を分割し
た場合には、図6に示すように、切り出し文字画像1〜
4(601〜604)に分割される。
For example, "table", "show", "apparatus",
When the element image 1 (301) consisting of four characters of "position" is divided, as shown in FIG.
4 (601 to 604).

【0059】一方、非文字要素画像である要素画像5
(305)は、図7に示すようにスキャナを示す絵の部
分が切り出し文字画像5(701)と、パソコンを示す
絵の部分が切り出し文字画像6(702)とに分割され
る。
On the other hand, the element image 5 which is a non-character element image
In (305), as shown in FIG. 7, the picture part showing the scanner is divided into the cut-out character image 5 (701) and the picture part showing the personal computer is divided into the cut-out character image 6 (702).

【0060】認識手段5は、要素画像1〜8(301〜
308)の分割された切り出し文字画像を順番に文字認
識し、要素画像判定格納手段8が各要素画像ごとに文字
として認識された切り出し文字画像があるか否かを判定
する。
The recognition means 5 recognizes the element images 1 to 8 (301 to
In step 308), the divided cut-out character images are sequentially recognized, and the element image judgment storage means 8 judges whether or not there is a cut-out character image recognized as a character for each element image.

【0061】図2に示すサンプル画像の場合では、要素
画像5(305)が構成要素である切り出し文字画像
5,6(701,702)が共に文字と認識できないの
で、非文字画像部と判定され、他の要素画像1〜4,
6,7(301〜304,306,307)が文字画像
部として判定され、図8に示すようになる。
In the case of the sample image shown in FIG. 2, since the cut-out character images 5 and 6 (701 and 702), which are the constituent elements of the element image 5 (305), cannot be recognized as characters, it is determined to be a non-character image portion. , Other element images 1-4
6, 7 (301 to 304, 306, 307) are determined as the character image portion and are as shown in FIG.

【0062】要素画像判定格納手段8は、非文字画像と
判定した要素画像については、画像ファイルとして、た
とえば、ファイル名を非文字画像部ファイル1として保
存する。
The element image judgment storage means 8 saves the element image judged as a non-character image as an image file, for example, the file name as the non-character image part file 1.

【0063】一方、文字画像部であると判定された要素
画像は、非認識文字抽出格納手段9が文字認識できた切
り出し文字画像の認識文字と、認識できないあるいは誤
認識された切り出し文字画像と、それら文字のレイアウ
ト位置の情報をファイルに保存する。
On the other hand, the element images determined to be the character image part include the recognized characters of the cut-out character image that the unrecognized character extraction / storing means 9 can recognize, and the cut-out character image that cannot be recognized or is erroneously recognized. Save the layout position information of those characters in a file.

【0064】たとえば、図9に示す要素画像3(30
3)の場合には、図10に示すように、文字サイズおよ
び文字フォントの種類、行間隔、本文を「文字画像部内
レイアウト構造ファイル3」として、たとえば、図示し
ない外部記憶装置に保存する。
For example, the element image 3 (30
In the case of 3), as shown in FIG. 10, the character size, the type of the character font, the line spacing, and the body are stored as, for example, a “character image section layout structure file 3” in an external storage device (not shown).

【0065】このとき、要素画像3(303)内の一部
の切り出し文字画像が文字認識できない場合、あるい
は、誤認識された場合には、その部分の文字画像が文字
コードの代わりに保存され、1001に示すように、本
文として認識できなかった部分の文字画像ファイル1〜
3が入り、認識結果を表示する時には記述されている文
字画像ファイルの文字画像がそのまま表示される。
At this time, when a part of the cut-out character image in the element image 3 (303) cannot be recognized or is erroneously recognized, the character image of the part is saved instead of the character code, As shown in 1001, the character image files 1 to
When 3 is entered and the recognition result is displayed, the character image of the described character image file is displayed as it is.

【0066】また、他の要素画像についても同様に、要
素画像ごとに「文字画像部内レイアウト構造ファイル
n」(ただし、nは1以上の自然数)に保存する。
Similarly, for the other element images, each element image is stored in the "character image section layout structure file n" (where n is a natural number of 1 or more).

【0067】次に、詳細レイアウト構造記述手段10が
全体レイアウト構造と文字画像部内レイアウト構造とか
らイメージ画像データの全体の詳細なレイアウト構造を
図11に示すように記述し、この記述内容を図示しない
外部記憶装置にファイル名が詳細レイアウト構造ファイ
ルとなるテキストファイルとして保存する。
Next, the detailed layout structure description means 10 describes the detailed layout structure of the entire image image data from the overall layout structure and the layout structure in the character image portion as shown in FIG. 11, and the description content is not shown. Save as a text file whose file name is the detailed layout structure file in the external storage device.

【0068】この後、オペレータにより文字認識結果の
表示が指示されると、表示データ合成手段11は、ま
ず、詳細レイアウト構造ファイルを読み込み、次に、詳
細レイアウト構造ファイルの要素画像識別子を調べ、要
素画像識別子が「0」である背景画像となる要素画像8
(308)の「背景画像ファイル」で示されるファイル
を図示しない外部記憶装置から読み込み、画像合成用メ
モリ2に書き込む。
After that, when the operator gives an instruction to display the character recognition result, the display data synthesizing means 11 first reads the detailed layout structure file, then checks the element image identifier of the detailed layout structure file, Element image 8 as a background image whose image identifier is "0"
The file indicated by the “background image file” in (308) is read from an external storage device (not shown) and written in the image compositing memory 2.

【0069】次に、表示データ合成手段11は詳細レイ
アウト構造ファイルに記述される要素画像1の文字画像
部内レイアウト構造ファイル1を読み込み、その内容を
ビットマップ文字データ作成手段12に転送する。
Next, the display data synthesizing means 11 reads the layout structure file 1 in the character image part of the element image 1 described in the detailed layout structure file, and transfers the contents to the bitmap character data creating means 12.

【0070】ビットマップ文字データ作成手段12は、
表示データ合成手段11から転送された文字画像部内レ
イアウト構造ファイル1に基づき、要素画像1(30
1)のビットマップデータ(表示用ビットマップデー
タ)を作成し、次に、表示開始位置であるx1,y1を
求め、画像合成用メモリ14上でx1,y1に相当する
位置から背景画像のデータに上書きして、要素画像1
(301)のビットマップデータを書き込む。
The bit map character data creating means 12 is
Based on the layout structure file 1 in the character image portion transferred from the display data synthesizing means 11, the element image 1 (30
1) Bitmap data (display bitmap data) is created, then display start positions x1 and y1 are obtained, and background image data is acquired from the position corresponding to x1 and y1 on the image compositing memory 14. Overwriting the element image 1
Write the bitmap data of (301).

【0071】以降、要素画像2〜4,6,7(302〜
304,306,307)についても、要素画像1(3
01)と同様に処理する。
Thereafter, the element images 2 to 4, 6 and 7 (302 to)
304, 306, 307), the element image 1 (3
The same process as in 01)

【0072】一方、要素画像5(305)は非文字画像
であるため、表示データ合成手段11は要素画像5(3
05)の「非文字画像部ファイル1」で示される要素画
像5(305)の部分のイメージ画像データ(ビットマ
ップデータ)が格納されるファイルを読み込み、次に、
表示開始位置であるx5,y5を求め、画像合成用メモ
リ14上でx5,y5に相当する位置から背景画像のデ
ータに上書きして、要素画像5(305)のイメージ画
像データを書き込む。
On the other hand, since the element image 5 (305) is a non-character image, the display data synthesizing means 11 causes the element image 5 (3)
05), the file in which the image image data (bitmap data) of the element image 5 (305) portion indicated by the "non-character image part file 1" is stored is read,
The display start position x5, y5 is obtained, and the image data of the element image 5 (305) is written by overwriting the background image data from the position corresponding to x5, y5 on the image compositing memory 14.

【0073】ここで、文字画像部のビットマップデータ
の作成処理方法を要素画像3(303)を処理する場合
について詳細に説明すると、まず、ビットマップ文字デ
ータ作成手段12は表示データ合成手段11から転送さ
れる要素画像3(303)の記述から、図10に示す記
述内容の文字画像部内レイアウト構造ファイル3を読み
込む。
Here, the method of creating the bitmap data of the character image part will be described in detail for the case of processing the element image 3 (303). First, the bitmap character data creating means 12 starts from the display data synthesizing means 11. From the description of the transferred element image 3 (303), the layout structure file 3 in the character image part having the description content shown in FIG. 10 is read.

【0074】次に、文字画像部内レイアウト構造ファイ
ル3の文字サイズ、文字フォント(使用文字フォント)
および行間隔に基づき、表示用ビットマップデータの文
字サイズ、文字フォントおよび行間隔を設定する。
Next, the character size and character font of the layout structure file 3 in the character image part (character font used)
And the character size, character font, and line spacing of the display bitmap data are set based on the line spacing.

【0075】このとき、文字表示用バッファメモリ13
は、あらかじめ透明色のビットマップデータを書き込み
初期化しておく。
At this time, the character display buffer memory 13
In advance, the transparent color bitmap data is written and initialized.

【0076】そして、文字画像部内レイアウト構造ファ
イル3の本文に記述されるデータを1文字づつ読み込
み、読み込んだデータが文字の場合には、設定した文字
フォントと文字サイズのビットマップデータを文字表示
用バッファメモリ13に書き込む。
Then, the data described in the body of the layout structure file 3 in the character image part is read character by character. When the read data is a character, the bitmap data of the set character font and character size is displayed for character display. Write to the buffer memory 13.

【0077】一方、引用符””で囲まれた文字画像ファ
イル1〜3(901〜903)が記述されている部分
は、対応する文字画像を読み込み、読み込んだ文字画像
を表示用のビットマップデータとして、1つ前に表示し
た文字のビットマップデータもしくは文字画像のビット
マップデータに続けて文字表示用バッファメモリ13に
書き込む。
On the other hand, in the portion where the character image files 1 to 3 (901 to 903) surrounded by the quotation marks "" are described, the corresponding character image is read, and the read character image is displayed as bitmap data. As the data, the character display buffer memory 13 is written following the character display bitmap data or the character image bitmap data displayed immediately before.

【0078】改行マーク¥nがあった場合は、その次の
文字もしくは文字画像ファイルのデータの書き込みを開
始する位置を、文字表示用バッファメモリ13上で改行
分に相当するデータ量だけ後方の左端部からとする。
When there is a line feed mark \ n, the position to start writing the next character or data of the character image file is moved to the left end of the character display buffer memory 13 by the amount of data corresponding to the line feed. From the department.

【0079】そして、本文の終了を示す¥eが表れるま
で前述する処理を繰り返すことにより、要素画像3(3
03)のビットマップデータの作成が終了する。
Then, the above-described processing is repeated until \ e indicating the end of the text appears, and the element image 3 (3
Creation of the bitmap data of 03) is completed.

【0080】以上説明したように、本実施形態によれ
ば、認識手段5が文字として正確に認識できた文字画像
については文字コードを格納し、一方、文字として認識
できなかったあるいは誤認識してしまった文字画像につ
いては図版部分を格納するのと同じように、文字画像を
格納し、表示時には、格納した文字コードから生成した
文字フォントと、図版と同じように蓄積したイメージ画
像データ(文字画像)とを位置情報を元に合成すること
により、文字として認識できなかった文字および誤認識
してしまった文字を修正することなく格納し、表示させ
ることができる。
As described above, according to the present embodiment, the character code is stored for the character image that the recognition means 5 has correctly recognized as a character, and on the other hand, the character image cannot be recognized or is erroneously recognized. As for the stored character image, the character image is stored in the same way as the illustration part is stored, and at the time of display, the character font generated from the stored character code and the image image data (character image ) And are combined on the basis of the position information, it is possible to store and display the character that cannot be recognized as a character and the character that is erroneously recognized as a character without correction.

【0081】以上、本発明者によってなされた発明を、
前記発明の実施形態に基づき具体的に説明したが、本発
明は、前記発明の実施形態に限定されるものではなく、
その要旨を逸脱しない範囲において種々変更可能である
ことは勿論である。
As described above, the invention made by the present inventor is:
Although specifically described based on the embodiment of the invention, the present invention is not limited to the embodiment of the invention,
Of course, various modifications can be made without departing from the spirit of the invention.

【0082】[0082]

【発明の効果】本願において開示される発明のうち代表
的なものによって得られる効果を簡単に説明すれば、下
記の通りである。
The effects obtained by the typical ones of the inventions disclosed in the present application will be briefly described as follows.

【0083】文字認識手段が認識できない文字および誤
認識した文字をオペレータが修正することなく、図版等
の画像と共に表示させることができる。
Characters that cannot be recognized by the character recognition means and characters that are erroneously recognized can be displayed together with an image such as a picture plate without the operator correcting the characters.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態の文字表示装置の概略構成
を示すブロック図である。
FIG. 1 is a block diagram showing a schematic configuration of a character display device according to an embodiment of the present invention.

【図2】本実施形態の文字表示装置の動作を説明するた
めの入力画像を示す図である。
FIG. 2 is a diagram showing an input image for explaining the operation of the character display device of the present embodiment.

【図3】図2に示す入力画像を本実施形態の文字表示装
置で要素画像に分割した結果を示す図である。
FIG. 3 is a diagram showing a result of dividing the input image shown in FIG. 2 into element images by the character display device of the present embodiment.

【図4】図3に示すように分割した結果を格納するファ
イルの記述例を示す図である。
FIG. 4 is a diagram showing a description example of a file that stores a result of division as shown in FIG.

【図5】要素画像1の表示位置の座標置の決め方を示す
図である。
FIG. 5 is a diagram showing how to determine the coordinate position of the display position of the element image 1.

【図6】文字切り出し手段の動作を説明するための図で
ある。
FIG. 6 is a diagram for explaining the operation of the character cutting means.

【図7】文字切り出し手段が図版を分割したときの動作
を説明するための図である。
FIG. 7 is a diagram for explaining an operation when the character segmenting unit divides a plate.

【図8】要素画像判定格納手段が認識結果を判定した結
果を示す図である。
FIG. 8 is a diagram showing a result of determination of a recognition result by an element image determination storage means.

【図9】文字認識格納手段の動作を説明するための図で
ある。
FIG. 9 is a diagram for explaining the operation of the character recognition storage means.

【図10】図9に示す認識結果をファイルに保存したと
きの記述例を示す図である。
10 is a diagram showing a description example when the recognition result shown in FIG. 9 is saved in a file.

【図11】詳細レイアウト構造記述手段が画像の認識結
果を格納したときの記述例を示す図である。
FIG. 11 is a diagram showing a description example when a detailed layout structure description means stores a recognition result of an image.

【符号の説明】[Explanation of symbols]

1…イメージ画像データ入力端子、2…画像データ蓄積
手段、3…画像データ分割抽出手段、4…文字切り出し
手段、5…認識手段、6…誤変換抽出手段、7…文字認
識格納手段、8…要素画像判定格納手段、9…非認識文
字抽出格納手段、10…詳細レイアウト構造記述手段、
11…表示データ合成手段、12…ビットマップ文字デ
ータ作成手段、13…文字表示用バッファメモリ、14
…画像合成用メモリ、15…画像表示用メモリ、16…
画像表示手段、301〜308…要素画像1〜8、60
1〜604…切り出し文字画像1〜4、701…切り出
し文字画像5、702…切り出し文字画像6。
DESCRIPTION OF SYMBOLS 1 ... Image image data input terminal, 2 ... Image data storage means, 3 ... Image data division extraction means, 4 ... Character cut-out means, 5 ... Recognition means, 6 ... Misconversion extraction means, 7 ... Character recognition storage means, 8 ... Element image determination storage means, 9 ... Unrecognized character extraction storage means, 10 ... Detailed layout structure description means,
11 ... Display data synthesizing means, 12 ... Bitmap character data creating means, 13 ... Character display buffer memory, 14
... image composition memory, 15 ... image display memory, 16 ...
Image display means, 301 to 308 ... Element images 1 to 8 and 60
1-604 ... Cut-out character image 1-4, 701 ... Cut-out character image 5, 702 ... Cut-out character image 6.

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 イメージスキャナで読みとったイメージ
画像データあるいは外部記憶装置に格納されているイメ
ージ画像データを要素画像に分割し、該分割された各要
素画像の全体画像中の位置を抽出する画像データ分割抽
出手段と、前記要素画像から1文字ごとのイメージ画像
データを切り出す文字切り出し手段と、切り出した文字
のイメージ画像データを認識し文字コードに変換する認
識手段と、該変換結果を予め用意した辞書と比較して誤
変換個所を抽出する誤変換抽出手段と、前記文字コード
と前記誤変換個所の情報とを文字認識結果として格納す
る文字認識格納手段と、オペレータの表示指示で前記文
字認識結果を読み出し、表示用の文字のビットマップデ
ータを作成するビットマップ文字データ作成手段と、前
記ビットマップデータを表示用の信号に変換し、表示手
段に表示させる画像表示手段とを備えた文字表示装置で
あって、 前記認識手段の認識結果から各要素画像が全て文字以外
のイメージ画像データから構成されている非文字要素画
像か、全て文字のイメージ画像データから構成されてい
る文字要素画像かを判定し、非文字要素画像であった場
合には該当する要素画像のイメージ画像データを非文字
画像部ファイルとして格納する要素画像判定格納手段
と、文字要素画像内で前記文字認識手段が認識できない
文字のイメージ画像データと該イメージ画像データの画
像上の位置とを抽出し、非認識文字ファイルとして格納
する非認識文字抽出格納手段と、前記ビットマップデー
タ作成手段が作成した表示用のビットマップデータと非
認識文字ファイルおよび非文字画像部ファイルに格納さ
れるイメージ画像データとを合成し、表示用のビットマ
ップデータを作成する表示データ合成手段とを具備する
ことを特徴とする文字表示装置。
1. Image data in which image image data read by an image scanner or image image data stored in an external storage device is divided into element images, and the positions of the divided element images in the entire image are extracted. Split extraction means, character cutout means for cutting out image image data of each character from the element image, recognition means for recognizing the cutout image image data of the character and converting it into a character code, and a dictionary prepared in advance for the conversion result. And a character recognition storing means for storing the character code and the information of the wrong conversion point as a character recognition result, and a character recognition result by an operator's display instruction. Bit map character data creating means for creating bit map data of characters for reading and displaying, and the bit map data A character display device including an image display unit for converting a data into a signal for display and displaying it on a display unit, wherein each element image is composed of image image data other than characters based on the recognition result of the recognition unit. A non-character element image or a character element image consisting of image data of all characters, and if it is a non-character element image, the image image data of the corresponding element image Element image determination storage means to be stored as a file, image image data of characters that cannot be recognized by the character recognition means in the character element image, and the position on the image of the image image data are extracted and stored as an unrecognized character file. Unrecognized character extraction storage means, display bitmap data created by the bitmap data creation means, unrecognized character file, and non-character A character display device comprising: display data synthesizing means for synthesizing image image data stored in an image part file to create bitmap data for display.
JP7243166A 1995-09-21 1995-09-21 Character display device Pending JPH0991371A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7243166A JPH0991371A (en) 1995-09-21 1995-09-21 Character display device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7243166A JPH0991371A (en) 1995-09-21 1995-09-21 Character display device

Publications (1)

Publication Number Publication Date
JPH0991371A true JPH0991371A (en) 1997-04-04

Family

ID=17099798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7243166A Pending JPH0991371A (en) 1995-09-21 1995-09-21 Character display device

Country Status (1)

Country Link
JP (1) JPH0991371A (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004502258A (en) * 2000-07-05 2004-01-22 パーマン システム リミテッド Kanji proofreading system based on one-to-one comparison
US6937762B2 (en) 2000-06-20 2005-08-30 Minolta Co., Ltd. Image processing device and program product
US6983077B2 (en) 2000-03-30 2006-01-03 Minolta Co., Ltd. Image processor
US7149352B2 (en) 2000-06-28 2006-12-12 Minolta Co., Ltd. Image processing device, program product and system
US7321688B2 (en) 2000-06-09 2008-01-22 Minolta Co., Ltd. Image processor for character recognition
JP2010261975A (en) * 2009-04-28 2010-11-18 Casio Computer Co Ltd Image display, server device, and program

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6983077B2 (en) 2000-03-30 2006-01-03 Minolta Co., Ltd. Image processor
US7321688B2 (en) 2000-06-09 2008-01-22 Minolta Co., Ltd. Image processor for character recognition
US7454060B2 (en) 2000-06-09 2008-11-18 Minolta Co., Ltd. Image processor for character recognition
US6937762B2 (en) 2000-06-20 2005-08-30 Minolta Co., Ltd. Image processing device and program product
US7149352B2 (en) 2000-06-28 2006-12-12 Minolta Co., Ltd. Image processing device, program product and system
JP2004502258A (en) * 2000-07-05 2004-01-22 パーマン システム リミテッド Kanji proofreading system based on one-to-one comparison
JP2010261975A (en) * 2009-04-28 2010-11-18 Casio Computer Co Ltd Image display, server device, and program

Similar Documents

Publication Publication Date Title
JP3139521B2 (en) Automatic language determination device
JP2835178B2 (en) Document reading device
JP2002203207A (en) Character recognizing method and program, and recording medium
JPH0991371A (en) Character display device
JPH05303619A (en) Electronic scrap book
JPH10162098A (en) Document electrolyzing device and method therefor
JPH10177623A (en) Document recognizing device and language processor
JPH0554072A (en) Digital translation device
JP2890788B2 (en) Document recognition device
JPH01292586A (en) Back-up device for recognition of character
JP2746345B2 (en) Post-processing method for character recognition
JP2887823B2 (en) Document recognition device
JP2891368B2 (en) Post-processing method of character recognition result
JPH06251187A (en) Method and device for correcting character recognition error
JPH0981672A (en) Document reader
JPS6327990A (en) Character recognizing method
JPH04302070A (en) Character recognizing device
JPS61198376A (en) Optical character reader
JP3116453B2 (en) English character recognition device
JPH01233586A (en) Printed character recognizing and editing system
JPH0581318A (en) Digital translating device
JPS61198378A (en) Optical character reader
JPH04293185A (en) Filing device
JPH0830717A (en) Character recognition method and device therefor
JPH06243285A (en) Character recognition method