JPH0773274A - Character recognition device - Google Patents

Character recognition device

Info

Publication number
JPH0773274A
JPH0773274A JP5221737A JP22173793A JPH0773274A JP H0773274 A JPH0773274 A JP H0773274A JP 5221737 A JP5221737 A JP 5221737A JP 22173793 A JP22173793 A JP 22173793A JP H0773274 A JPH0773274 A JP H0773274A
Authority
JP
Japan
Prior art keywords
character
image data
recognition
unit
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5221737A
Other languages
Japanese (ja)
Inventor
Tadashi Aramaki
正 荒巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5221737A priority Critical patent/JPH0773274A/en
Publication of JPH0773274A publication Critical patent/JPH0773274A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To provide a character recognition device which excels in the reliability, the workability and the universal applicability and can easily and correctly recognize a relevant document even if the character directions are not fixed or inverted and also can recognize even such characters that are set in different directions or inverted. CONSTITUTION:A character recognition device is provided with an image reading part 1 which acquires the binary image data, a character image segmenting part 3 which segments the character image data out of the image data, a character image data storing part 4, a character image data left 90 deg.C turning part 5, a character feature dictionary 6 which stores the normal features of all characters, a recognizing precision calculating part 7 which refers to the dictionary 6 to aclculate the precision of the candidate characters resemble to the character image data and their resemblance, etc., and a recognizing character deciding part 8 which decides the recognizing characters based on the recognizing precision.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は新聞,雑誌,小説等の活
字,ドット文字及び手書き文字パターンをJISコード
等のコード情報に変換する文字認識装置に関するもので
ある。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device for converting printed characters, dot characters and handwritten character patterns of newspapers, magazines, novels etc. into code information such as JIS code.

【0002】[0002]

【従来の技術】近年、オフィースオートメーションの進
展に伴い、キーボードを用いず、文字認識装置によって
活字原稿等をコンピュータ等へ入力することが行われて
いる。
2. Description of the Related Art In recent years, with the development of office automation, a character recognition device is used to input a printed manuscript or the like to a computer or the like without using a keyboard.

【0003】以下に従来の文字認識装置について説明す
る。図8は認識対象文書の一例を示す図であり、図9は
表裏が反転した認識対象文書の一例を示す図である。
A conventional character recognition device will be described below. FIG. 8 is a diagram showing an example of a recognition target document, and FIG. 9 is a diagram showing an example of a recognition target document whose front and back are reversed.

【0004】従来の文字認識装置は、認識対象文書が図
8に示すようなものである場合、aの部分の文字はその
向きが文字認識の向きと合っているために、そのまま認
識することができるが、bの部分の文字はその向きが文
字認識の向きから180度回転しており、cの部分の文
字は同様にその向きが右に90度回転しているために、
認識することができない。そこで、まず、aの部分の文
字を認識し、次に、利用者が認識対象文書を回転させ
て、bの部分の文字の向きと文字認識の向きとを一致さ
せ、bの部分の文字を認識し、次に、同様にしてcの部
分の文字を認識し、次に、利用者がこれらの認識結果を
統合して、認識対象文書全体を認識していた。
In the conventional character recognition apparatus, when the document to be recognized is as shown in FIG. 8, the character of part a can be recognized as it is because its orientation matches the orientation of character recognition. Although it is possible, the direction of the character of part b is rotated 180 degrees from the direction of character recognition, and the direction of the character of part c is also rotated 90 degrees to the right.
I can't recognize. Therefore, first, the character of the portion a is recognized, and then the user rotates the recognition target document so that the direction of the character of the portion b matches the direction of character recognition, and the character of the portion b is recognized. Recognizing, and then recognizing the character c in the same manner, and then the user integrates these recognition results to recognize the entire recognition target document.

【0005】また、OHPシートのような透明なシート
等に書かれた文書を認識する際に、誤ってシートの表裏
を逆にセットした場合等に、図9に示すような表裏が反
転した文字からなるものが認識対象文書となる。この場
合は、各文字の表裏が反転しているため、全く文字認識
を行うことができない。そこで、文字認識を行うために
は、利用者がシートの表裏を正しくセットし直す必要が
あった。
Further, when recognizing a document written on a transparent sheet such as an OHP sheet, when the sheet is mistakenly set upside down, the characters as shown in FIG. 9 are reversed. Documents that consist of are the recognition target documents. In this case, since the front and back of each character are reversed, character recognition cannot be performed at all. Therefore, in order to perform character recognition, it is necessary for the user to correctly set the front and back sides of the sheet.

【0006】[0006]

【発明が解決しようとする課題】しかしながら上記従来
の構成では、認識対象文書中の文字の向きが一定でない
場合に、各々の文字の向き毎に認識を行い、利用者がそ
の認識結果を統合する等しなければならず、煩雑で手数
が掛かり作業性、汎用性に欠けるとともに、誤認識をす
ることがあり信頼性に欠けるという問題点を有してい
た。また、認識対象文書を表裏逆にセットした場合等
に、表裏が反転した文字を認識することができず作業
性、汎用性に欠けるとともに、誤認識をすることがあり
信頼性に欠けるという問題点を有していた。
However, in the above-mentioned conventional configuration, when the orientation of the characters in the document to be recognized is not constant, recognition is performed for each orientation of the characters and the user integrates the recognition results. Therefore, there is a problem in that it is complicated and time-consuming, lacks workability and versatility, and may cause misrecognition, and lacks reliability. In addition, when the document to be recognized is set upside down, it is not possible to recognize characters that are upside down, resulting in a lack of workability and versatility, and the possibility of erroneous recognition resulting in a lack of reliability. Had.

【0007】本発明は上記従来の問題点を解決するもの
で、認識対象文書中の文字の向きが一定でなかったり、
文字の表裏が反転していたりした場合であっても、認識
対象文書を正しく認識でき信頼性に優れ、認識作業を容
易に行うことができ作業性に優れ、異なった向きの文字
や表裏が反転した文字でも認識することができる汎用性
に優れた文字認識装置を提供することを目的とする。
The present invention solves the above-mentioned problems of the prior art, and the orientation of the characters in the document to be recognized is not constant,
Even if the front and back of the characters are reversed, the document to be recognized can be correctly recognized and it is highly reliable, and the recognition work can be performed easily and the workability is excellent. It is an object of the present invention to provide a versatile character recognition device capable of recognizing even characters.

【0008】[0008]

【課題を解決するための手段】この目的を達成するため
に本発明の請求項1に記載された文字認識装置は、認識
対象文書を2値画像データへ変換する画像読取部と、前
記画像読取部より出力される2値画像データから1文字
の文字画像データを切り出す文字画像切り出し部と、前
記文字画像切り出し部で切り出された文字画像データを
記憶する文字画像記憶部と、を備えた文字認識装置であ
って、前記文字画像記憶部に記憶されている文字画像デ
ータを回転及び/又は表裏反転させる文字画像変換部
と、全ての文字の通常の文字特徴を記憶した文字特徴辞
書と、前記文字特徴辞書を参照して前記文字画像記憶部
に記憶されている文字画像データと類似する候補文字及
び類似度等の認識確度を求める認識確度計算部と、前記
認識確度計算部で求められた認識確度から認識文字を決
定する認識文字決定部と、を備えた構成を有しており、
請求項2に記載された文字認識装置は、認識対象文書を
2値画像データへ変換する画像読取部と、前記画像読取
部より出力される2値画像データから1文字の文字画像
データを切り出す文字画像切り出し部と、前記文字画像
切り出し部で切り出された文字画像データを記憶する文
字画像記憶部と、を備えた文字認識装置であって、全て
の文字の通常の文字特徴を記憶した文字特徴辞書と、全
ての文字の通常の文字特徴を回転及び/又は表裏反転さ
せた変換済文字特徴を記憶した変換済文字特徴辞書と、
前記文字特徴辞書と前記変換済文字特徴辞書とを参照し
て前記文字画像記憶部に記憶されている文字画像データ
と類似する候補文字及び類似度等の認識確度を求める認
識確度計算部と、前記認識確度計算部で求められた認識
確度から認識文字を決定する認識文字決定部と、を備え
た構成を有している。
In order to achieve this object, a character recognition apparatus according to claim 1 of the present invention comprises an image reading unit for converting a document to be recognized into binary image data, and the image reading unit. Character recognition including a character image cutout unit that cuts out character image data of one character from the binary image data output from the unit, and a character image storage unit that stores the character image data cut out by the character image cutout unit A device, a character image conversion unit for rotating and / or reversing the character image data stored in the character image storage unit, a character feature dictionary storing normal character features of all characters, and the character A recognition accuracy calculation unit that obtains a recognition accuracy of a candidate character similar to the character image data stored in the character image storage unit and the similarity by referring to the feature dictionary, and a recognition accuracy calculation unit that calculates the recognition accuracy. A recognition character determining unit that determines the recognized character from the recognition certainty which is has a configuration including a
The character recognition device according to claim 2 is an image reading unit that converts a recognition target document into binary image data, and a character that cuts out one character image data from the binary image data output from the image reading unit. A character recognition device comprising: an image clipping unit; and a character image storage unit for storing the character image data cut out by the character image clipping unit, wherein the character feature dictionary stores normal character features of all characters. And a converted character feature dictionary storing converted character features obtained by rotating and / or reversing the normal character features of all characters,
A recognition accuracy calculation unit that obtains recognition accuracy of candidate characters similar to the character image data stored in the character image storage unit and the similarity, by referring to the character feature dictionary and the converted character feature dictionary; And a recognition character determination unit that determines a recognition character from the recognition accuracy obtained by the recognition accuracy calculation unit.

【0009】[0009]

【作用】この構成によって、文字画像記憶部に記憶され
ている文字画像データを文字画像変換部によって回転・
表裏反転させながら、認識確度計算部によって文字特徴
辞書を参照して認識確度を求めることで、文字特徴辞書
に要するメモリを増加させることなく、文字の向きが一
定でなかったり、文字の表裏が反転していたりする認識
対象文書を正しく容易に認識することができる。また、
全ての文字の通常の文字特徴を回転させたり表裏を反転
させたりした変換済文字特徴辞書を備えたことによっ
て、文字の向きが一定でなかったり、文字の表裏が反転
している文字画像データを、文字画像変換部等で変換す
ることなく、正しく容易かつ高速に認識することができ
る。
With this configuration, the character image data stored in the character image storage unit is rotated / rotated by the character image conversion unit.
While reversing the front and back, the recognition accuracy calculation unit refers to the character feature dictionary to obtain the recognition accuracy, so that the direction of the character is not constant or the front and back of the character are reversed without increasing the memory required for the character feature dictionary. It is possible to correctly and easily recognize the recognition target document. Also,
By installing a converted character feature dictionary that rotates the normal character features of all characters and reverses the front and back, character image data in which the direction of the character is not constant or the front and back of the character are reversed , And can be recognized correctly, easily and at high speed without conversion by the character image conversion unit or the like.

【0010】[0010]

【実施例】【Example】

(実施例1)以下本発明の一実施例における文字認識装
置について、図面を参照しながら説明する。図1は本発
明の一実施例における文字認識装置の機能ブロック図で
あり、図2は本発明の一実施例における文字認識装置の
回路ブロック図である。図1において1はスキャナ(図
示せず)等からなり認識対象文書を読み取って画像デー
タを出力する画像読取部、2は画像読取部1から出力さ
れる画像データから1ページ分の画像データを記憶する
ページ画像記憶部、3はページ画像記憶部2に記憶され
た1ページ分の画像データから1文字分の文字画像デー
タを切り出す文字画像切り出し部、4は文字画像切り出
し部3で切り出された文字画像データ等を記憶する文字
画像記憶部、5は文字画像変換部の一例であり文字画像
記憶部4に記憶されている文字画像データを左方向へ9
0度回転させる文字画像左90度回転部、6は全ての文
字の通常の文字特徴を記憶している文字特徴辞書、7は
文字特徴辞書6を参照しながら文字画像記憶部4中に記
憶されている文字画像データに類似する候補文字及び類
似度等の認識確度を求める認識確度計算部、8は認識確
度計算部7より出力される認識確度から認識文字及び回
転角を決定する認識文字決定部である。図2において、
9は文字認識装置全体を制御するCPU、10は画像読
取部1を構成し認識対象文書を画像データへと変換する
スキャナ、11はページ画像記憶部2となるページ画像
記憶領域12と文字画像記憶部4となる文字画像記憶領
域13とを有するRAM、14は文字特徴辞書6等を記
憶する文字特徴情報記憶領域15とCPU9における全
ての処理を指示するプログラムを記憶するプログラム記
憶領域16とを有するROMである。
(Embodiment 1) A character recognition apparatus according to an embodiment of the present invention will be described below with reference to the drawings. 1 is a functional block diagram of a character recognition device according to an embodiment of the present invention, and FIG. 2 is a circuit block diagram of the character recognition device according to an embodiment of the present invention. In FIG. 1, reference numeral 1 denotes an image reading unit configured by a scanner (not shown) or the like for reading a recognition target document and outputting image data, and 2 denotes image data for one page stored from the image data output from the image reading unit 1. A page image storage unit 3, a character image cutout unit that cuts out character image data for one character from one page of image data stored in the page image storage unit 2, and 4 a character cut out by the character image cutout unit 3. A character image storage unit 5 for storing image data and the like is an example of a character image conversion unit, and the character image data stored in the character image storage unit 4 is moved to the left 9
A character image rotated 90 degrees to the left by 90 degrees, 6 is a character feature dictionary that stores normal character features of all characters, and 7 is stored in the character image storage unit 4 with reference to the character feature dictionary 6. Recognition accuracy calculation unit for obtaining recognition accuracy of candidate characters similar to the character image data and similarity, and 8 is a recognition character determination unit for determining the recognition character and the rotation angle from the recognition accuracy output from the recognition accuracy calculation unit 7. Is. In FIG.
Reference numeral 9 is a CPU that controls the entire character recognition device, 10 is a scanner that constitutes the image reading unit 1 and converts a recognition target document into image data, and 11 is a page image storage area 12 that serves as a page image storage unit 2 and a character image storage unit. A RAM having a character image storage area 13 serving as the unit 4 has a character feature information storage area 15 for storing the character feature dictionary 6 and the like, and a program storage area 16 for storing a program for instructing all processes in the CPU 9. ROM.

【0011】以上のように構成された本発明の一実施例
における文字認識装置について、以下その動作を説明す
る。図3は本発明の一実施例における文字認識装置のフ
ローチャートであり、図4は本発明の一実施例における
文字認識装置による認識処理の一例を示す図である。
The operation of the character recognition device having the above-described structure according to the embodiment of the present invention will be described below. FIG. 3 is a flowchart of the character recognition device in one embodiment of the present invention, and FIG. 4 is a diagram showing an example of recognition processing by the character recognition device in one embodiment of the present invention.

【0012】初めに、画像読取部1によって、認識対象
文書を読み取り、画像データに変換して、その1ページ
分の画像データをページ画像記憶部2に記憶する(S
1)。次に、文字画像切り出し部3によって、ページ画
像記憶部2に記憶されている画像データから1文字分の
文字画像データを切り出し、文字画像記憶部4に原文字
画像データとして記憶する(S2)。次に、認識確度計
算部7によって、文字特徴辞書6を参照しながら、文字
画像記憶部4内の原文字画像データに対する候補文字,
類似度等の認識確度を通常どおりに求める(S3)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを左に90度回転させる(S
4)。次に、認識確度計算部7によって、文字特徴辞書
6を参照しながら、文字画像記憶部4内の、原文字画像
データを左に90度回転させた文字画像データに対する
候補文字,類似度等の認識確度を求める(S5)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを更に左に90度回転させる
(S6)。次に、認識確度計算部7によって、文字特徴
辞書6を参照しながら、文字画像記憶部4内の、原文字
画像データを180度回転させた文字画像データに対す
る候補文字,類似度等の認識確度を求める(S7)。次
に、文字画像左90度回転部5によって、文字画像記憶
部4内の文字画像データを更に左に90度回転させる
(S8)。次に、認識確度計算部7によって、文字特徴
辞書6を参照しながら、文字画像記憶部4内の、原文字
画像データを左に270度回転させた文字画像データに
対する候補文字,類似度等の認識確度を求める(S
9)。次に、認識文字決定部8によって、S3,S5,
S7,S9で求められた候補文字のうち、類似度が最も
高いものを認識結果とし、同時にその回転角も決定する
(S10)。次に、ページ画像記憶部2内に記憶された
全ての文字を認識したか調べる(S11)。Noである
場合は、次の文字を認識するためにS2へjumpし、
Yesである場合は、認識対象文書の全てのページを認
識したか調べる(S12)。Noである場合は、次のペ
ージを認識するためにS1へjumpし、Yesである
場合は、全ての処理を終了する。
First, the image reading section 1 reads a document to be recognized, converts it into image data, and stores the image data for one page in the page image storage section 2 (S).
1). Next, the character image cutout unit 3 cuts out character image data for one character from the image data stored in the page image storage unit 2 and stores it as original character image data in the character image storage unit 4 (S2). Next, the recognition accuracy calculation unit 7 refers to the character feature dictionary 6 to refer to the candidate character for the original character image data in the character image storage unit 4,
The recognition accuracy such as the similarity is calculated as usual (S3). Next, the character image left 90 ° rotation unit 5 rotates the character image data in the character image storage unit 4 90 ° to the left (S
4). Next, the recognition accuracy calculation unit 7 refers to the character feature dictionary 6 and extracts candidate characters, similarity degrees, etc. for the character image data obtained by rotating the original character image data 90 degrees to the left in the character image storage unit 4. The recognition accuracy is obtained (S5). Next, the character image left 90-degree rotation unit 5 rotates the character image data in the character image storage unit 4 further 90 degrees to the left (S6). Next, the recognition accuracy calculation unit 7 refers to the character feature dictionary 6 and recognizes the recognition accuracy of the candidate character, the similarity, and the like for the character image data obtained by rotating the original character image data 180 degrees in the character image storage unit 4. Is calculated (S7). Next, the character image left 90-degree rotation unit 5 rotates the character image data in the character image storage unit 4 further 90 degrees to the left (S8). Next, the recognition accuracy calculation unit 7 refers to the character feature dictionary 6, and refers to the character image data in the character image storage unit 4 by rotating the original character image data to the left by 270 degrees, such as candidate characters and similarity. Obtain recognition accuracy (S
9). Next, the recognized character determination unit 8 causes S3, S5,
Among the candidate characters obtained in S7 and S9, the character having the highest degree of similarity is set as the recognition result, and at the same time, its rotation angle is also determined (S10). Next, it is checked whether all the characters stored in the page image storage unit 2 have been recognized (S11). If No, jump to S2 to recognize the next character,
If Yes, it is checked whether all pages of the recognition target document have been recognized (S12). If No, jump to S1 in order to recognize the next page, and if Yes, end all processing.

【0013】ここで、例として、原文字画像データが図
4に示すようなものであった場合、本発明の一実施例に
おける文字認識装置は、これを左に90度ずつ回転させ
ながら認識確度を求めていくが、図4から明らかなよう
に、原文字画像データを左に270度回転させた時の候
補文字‘F’に対する類似度が最も高い。よって原文字
画像は‘F’を右に270度回転させたものだと判断
し、これを認識文字とする。
Here, as an example, when the original character image data is as shown in FIG. 4, the character recognition device in one embodiment of the present invention rotates the image 90 degrees to the left and recognizes the recognition accuracy. As is clear from FIG. 4, the similarity to the candidate character'F 'when the original character image data is rotated 270 degrees to the left is the highest. Therefore, it is determined that the original character image is obtained by rotating ‘F’ to the right 270 degrees, and this is set as the recognized character.

【0014】尚、本実施例においては、文字画像変換部
を左へ90度回転させる文字画像左90度回転部5とし
たが、これは他の方向,角度であってもよく、文字の表
裏を反転させるもの、あるいはこの両者を同時に行うも
のであってもよい。
In the present embodiment, the character image conversion unit is the character image left 90-degree rotation unit 5 which rotates 90 degrees to the left, but this may be another direction or angle. May be reversed, or both may be performed simultaneously.

【0015】以上のように本実施例によれば、文字画像
変換部を設けたことにより、文字特徴辞書6に要するメ
モリを増加させることなく、文字が回転していたり、文
字の表裏が反転していたりする文字を正しく認識するこ
とができる。
As described above, according to this embodiment, by providing the character image conversion unit, the character is rotated or the front and back of the character are reversed without increasing the memory required for the character feature dictionary 6. It is possible to correctly recognize the characters that are moved.

【0016】(実施例2)以下本発明の第2の実施例に
おける文字認識装置について、図面を参照しながら説明
する。図5は本発明の第2の実施例における文字認識装
置の機能ブロック図である。1は画像読取部、2はペー
ジ画像記憶部、3は文字画像切り出し部、4は文字画像
記憶部、6は文字特徴辞書、8は認識文字決定部であ
り、これらは実施例1と同様なものなので同一の符号を
付し説明を省略する。17は変換済文字特徴辞書の一例
であり全ての文字の通常の文字特徴を左に90度回転さ
せた左90度回転済文字特徴を記憶した左90度回転文
字特徴辞書、18は左90度回転文字特徴辞書17と同
様な180度回転済文字特徴を記憶した180度回転文
字特徴辞書、19は左90度回転文字特徴辞書17と同
様な左270度回転済文字特徴を記憶した左270度回
転文字特徴辞書、20は文字特徴辞書6,左90度回転
文字特徴辞書17,180度回転文字特徴辞書18,左
270度回転文字特徴辞書19を参照しながら文字画像
記憶部4中に記憶されている文字画像データに類似する
候補文字及び類似度等の認識確度を求める認識確度計算
部である。
(Second Embodiment) A character recognition apparatus according to a second embodiment of the present invention will be described below with reference to the drawings. FIG. 5 is a functional block diagram of the character recognition device in the second embodiment of the present invention. 1 is an image reading unit, 2 is a page image storage unit, 3 is a character image cutout unit, 4 is a character image storage unit, 6 is a character feature dictionary, 8 is a recognized character determination unit, and these are the same as those in the first embodiment. Therefore, the same reference numerals are given and the description thereof will be omitted. Reference numeral 17 is an example of a converted character feature dictionary, which is a left 90-degree rotated character feature dictionary that stores left 90-degree rotated character features that are rotated by 90 degrees to the left for normal character features of all characters, and 18 is left 90-degree. A 180-degree rotated character feature dictionary that stores 180-degree rotated character features similar to the rotated character feature dictionary 17, and 19 indicates a left 270-degree rotated character feature that stores left 90-degree rotated character feature dictionary 17 and a left 270 degree that stores rotated character features The rotated character feature dictionary, 20 is stored in the character image storage unit 4 with reference to the character feature dictionary 6, the left 90-degree rotated character feature dictionary 17, the 180-degree rotated character feature dictionary 18, and the left 270-degree rotated character feature dictionary 19. Is a recognition accuracy calculation unit that obtains recognition accuracy of a candidate character similar to the existing character image data and similarity.

【0017】以上のように構成された本発明の第2の実
施例における文字認識装置について、以下その動作を説
明する。図6は本発明の第2の実施例における文字認識
装置のフローチャートであり、図7は本発明の第2の実
施例における文字認識装置による認識処理の一例を示す
図である。
The operation of the character recognition apparatus according to the second embodiment of the present invention having the above-described structure will be described below. FIG. 6 is a flowchart of the character recognition device in the second embodiment of the present invention, and FIG. 7 is a diagram showing an example of recognition processing by the character recognition device in the second embodiment of the present invention.

【0018】初めに、画像読取部1によって、認識対象
文書を読み取り、画像データに変換して、その1ページ
分の画像データをページ画像記憶部2に記憶する(S1
3)。次に、文字画像切り出し部3によって、ページ画
像記憶部2に記憶されている画像データから1文字分の
文字画像データを切り出し、文字画像記憶部4に記憶す
る(S14)。次に、認識確度計算部20によって、文
字特徴辞書6,左90度回転文字特徴辞書17,180
度回転文字特徴辞書18,左270度回転文字特徴辞書
19を参照しながら、文字画像記憶部4内の文字画像デ
ータに対する候補文字,類似度等の認識確度を求め、認
識文字決定部8によって、これらの候補文字のうち、類
似度が最も高いものを認識結果とし、同時にその回転角
も決定する(S15)。次に、ページ画像記憶部2内に
記憶された全ての文字を認識したか調べる(S16)。
Noである場合は、次の文字を認識するためにS14へ
jumpし、Yesである場合は、認識対象文書の全て
のページを認識したか調べる(S17)。Noである場
合は、次のページを認識するためにS13へjump
し、Yesである場合は、全ての処理を終了する。
First, the image reading unit 1 reads a document to be recognized, converts it into image data, and stores the image data for one page in the page image storage unit 2 (S1).
3). Next, the character image cutout unit 3 cuts out character image data for one character from the image data stored in the page image storage unit 2 and stores it in the character image storage unit 4 (S14). Next, the recognition accuracy calculation unit 20 causes the character feature dictionary 6, the left 90-degree rotated character feature dictionary 17, 180.
While referring to the degree-rotated character feature dictionary 18 and the left 270-degree rotated character feature dictionary 19, the recognition accuracy of the candidate characters, the similarity, etc. for the character image data in the character image storage unit 4 is obtained, and the recognized character determination unit 8 determines Among these candidate characters, the character having the highest degree of similarity is set as the recognition result, and at the same time, its rotation angle is also determined (S15). Next, it is checked whether all the characters stored in the page image storage unit 2 have been recognized (S16).
If No, jump to S14 to recognize the next character, and if Yes, check whether all pages of the document to be recognized have been recognized (S17). If No, jump to S13 to recognize the next page.
If Yes, all the processes are finished.

【0019】ここで、例として、原文字画像データが図
7に示すようなものであった場合、本発明の第2の実施
例における文字認識装置は、図7に示すように、左27
0度回転文字特徴辞書19中の候補文字‘F’に対する
類似度が最も高いとし、原文字画像は‘F’を右に27
0度回転させたものだと判断して、これを認識文字とす
る。
Here, as an example, when the original character image data is as shown in FIG. 7, the character recognizing device in the second embodiment of the present invention, as shown in FIG.
Assume that the similarity to the candidate character “F” in the 0-degree rotated character feature dictionary 19 is the highest, and the original character image has “F” to the right 27
It is determined that the character has been rotated by 0 degrees, and this is set as the recognition character.

【0020】尚、本実施例においては、変換済文字特徴
辞書として、通常の文字特徴を左へ90度ずつ回転させ
た左90度回転文字特徴辞書17,180度回転文字特
徴辞書18,左270度回転文字特徴辞書19を用いた
が、これらは他の方向,角度のものであってもよく、文
字の表裏を反転させたもの、あるいはこの両者を同時に
行ったものであってもよい。
In the present embodiment, as the converted character feature dictionary, a left 90-degree rotated character feature dictionary 17, a 180-degree rotated character feature dictionary 18, and a left 270 are obtained by rotating normal character features 90 degrees to the left. Although the degree-rotated character feature dictionary 19 is used, these may be in other directions and angles, the characters may be reversed, or both may be performed at the same time.

【0021】以上のように本実施例によれば、変換済文
字特徴辞書を設けたことにより、文字が回転していた
り、文字の表裏が反転していたりする文字を、文字画像
データを文字画像変換部等で変換することなく正しく容
易かつ高速に認識することができる。
As described above, according to the present embodiment, by providing the converted character feature dictionary, the character image data is converted into the character image data for the character that is rotated or the character is reversed. It is possible to recognize correctly, easily and at high speed without conversion by the conversion unit or the like.

【0022】[0022]

【発明の効果】以上のように本発明は、文字画像記憶部
に記憶されている文字画像データを文字画像変換部によ
って回転・表裏反転させながら、認識確度計算部によっ
て文字特徴辞書を参照して認識確度を求めることで、文
字特徴辞書に要する記憶容量を増加させることなく、文
字の向きが一定でなかったり、文字の表裏が反転してい
る認識対象文書を正しく容易に認識することができ作業
性、汎用性、信頼性に優れ、メモリ効率が高く、全ての
文字の通常の文字特徴を回転させたり表裏を反転させた
りした変換済文字特徴辞書を備えたことによって、文字
の向きが一定でなかったり、文字の表裏が反転している
認識対象文書の文字画像データを文字画像変換部等で変
換することなく、正しく容易かつ高速に認識することが
できる作業性、汎用性、信頼性に優れた文字認識装置を
実現できるものである。
As described above, the present invention refers to the character feature dictionary by the recognition accuracy calculation unit while rotating and reversing the character image data stored in the character image storage unit by the character image conversion unit. By determining the recognition accuracy, it is possible to correctly and easily recognize a recognition target document in which the orientation of the characters is not constant or the front and back of the characters are reversed without increasing the storage capacity required for the character feature dictionary. It has excellent character, versatility, reliability, high memory efficiency, and has a converted character feature dictionary that rotates the normal character features of all characters and reverses the front and back, so that the orientation of characters is constant. There is no or the front and back sides of the characters are reversed, and the workability and general ability to recognize the character image data of the recognition target document correctly and easily and at high speed without converting it with the character image converter etc. Sex, in which an excellent character recognition device reliability can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例における文字認識装置の機能
ブロック図
FIG. 1 is a functional block diagram of a character recognition device according to an embodiment of the present invention.

【図2】本発明の一実施例における文字認識装置の回路
ブロック図
FIG. 2 is a circuit block diagram of a character recognition device according to an embodiment of the present invention.

【図3】本発明の一実施例における文字認識装置のフロ
ーチャート
FIG. 3 is a flowchart of a character recognition device according to an embodiment of the present invention.

【図4】本発明の一実施例における文字認識装置による
認識処理の一例を示す図
FIG. 4 is a diagram showing an example of recognition processing by a character recognition device according to an embodiment of the present invention.

【図5】本発明の第2の実施例における文字認識装置の
機能ブロック図
FIG. 5 is a functional block diagram of a character recognition device according to a second embodiment of the present invention.

【図6】本発明の第2の実施例における文字認識装置の
フローチャート
FIG. 6 is a flowchart of a character recognition device according to a second embodiment of the present invention.

【図7】本発明の第2の実施例における文字認識装置に
よる認識処理の一例を示す図
FIG. 7 is a diagram showing an example of recognition processing by a character recognition device according to a second embodiment of the present invention.

【図8】認識対象文書の一例を示す図FIG. 8 is a diagram showing an example of a recognition target document.

【図9】表裏が反転した認識対象文書の一例を示す図FIG. 9 is a diagram showing an example of a recognition target document whose front and back are reversed.

【符号の説明】[Explanation of symbols]

1 画像読取部 2 ページ画像記憶部 3 文字画像切り出し部 4 文字画像記憶部 5 文字画像左90度回転部 6 文字特徴辞書 7 認識確度計算部 8 認識文字決定部 9 CPU 10 スキャナ 11 RAM 12 ページ画像記憶領域 13 文字画像記憶領域 14 ROM 15 文字特徴情報記憶領域 16 プログラム記憶領域 17 左90度回転文字特徴辞書 18 180度回転文字特徴辞書 19 左270度回転文字特徴辞書 20 認識確度計算部 1 image reading unit 2 page image storage unit 3 character image cutout unit 4 character image storage unit 5 character image left 90 degree rotation unit 6 character feature dictionary 7 recognition accuracy calculation unit 8 recognition character determination unit 9 CPU 10 scanner 11 RAM 12 page image Storage area 13 Character image storage area 14 ROM 15 Character feature information storage area 16 Program storage area 17 Left 90-degree rotated character feature dictionary 18 180-degree rotated character feature dictionary 19 Left 270-degree rotated character feature dictionary 20 Recognition accuracy calculation unit

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】認識対象文書を2値画像データへ変換する
画像読取部と、前記画像読取部より出力される2値画像
データから1文字の文字画像データを切り出す文字画像
切り出し部と、前記文字画像切り出し部で切り出された
文字画像データを記憶する文字画像記憶部と、を備えた
文字認識装置であって、前記文字画像記憶部に記憶され
ている文字画像データを回転及び/又は表裏反転させる
文字画像変換部と、全ての文字の通常の文字特徴を記憶
した文字特徴辞書と、前記文字特徴辞書を参照して前記
文字画像記憶部に記憶されている文字画像データと類似
する候補文字及び類似度等の認識確度を求める認識確度
計算部と、前記認識確度計算部で求められた認識確度か
ら認識文字を決定する認識文字決定部と、を備えたこと
を特徴とする文字認識装置。
1. An image reading unit for converting a document to be recognized into binary image data, a character image cutout unit for cutting out character image data of one character from the binary image data output from the image reading unit, and the character. A character recognition device comprising: a character image storage unit that stores the character image data cut out by the image cutout unit, wherein the character image data stored in the character image storage unit is rotated and / or inverted. A character image conversion unit, a character feature dictionary that stores normal character features of all characters, a candidate character that is similar to the character image data stored in the character image storage unit by referring to the character feature dictionary, and similar characters Characters including a recognition accuracy calculation unit for determining recognition accuracy such as degree, and a recognition character determination unit for determining recognition characters from the recognition accuracy calculated by the recognition accuracy calculation unit. Identification equipment.
【請求項2】認識対象文書を2値画像データへ変換する
画像読取部と、前記画像読取部より出力される2値画像
データから1文字の文字画像データを切り出す文字画像
切り出し部と、前記文字画像切り出し部で切り出された
文字画像データを記憶する文字画像記憶部と、を備えた
文字認識装置であって、全ての文字の通常の文字特徴を
記憶した文字特徴辞書と、全ての文字の通常の文字特徴
を回転及び/又は表裏反転させた変換済文字特徴を記憶
した変換済文字特徴辞書と、前記文字特徴辞書と前記変
換済文字特徴辞書とを参照して前記文字画像記憶部に記
憶されている文字画像データと類似する候補文字及び類
似度等の認識確度を求める認識確度計算部と、前記認識
確度計算部で求められた認識確度から認識文字を決定す
る認識文字決定部と、を備えたことを特徴とする文字認
識装置。
2. An image reading unit for converting a document to be recognized into binary image data, a character image cutting unit for cutting character image data of one character from the binary image data output from the image reading unit, and the character. A character recognition device comprising a character image storage unit for storing character image data cut out by an image cutout unit, a character feature dictionary storing normal character features of all characters, and a normal character of all characters. Stored in the character image storage unit with reference to the converted character feature dictionary and the converted character feature dictionary, which stores the converted character feature obtained by rotating and / or inverting the character feature Recognition accuracy calculation unit for obtaining recognition accuracy of candidate characters similar to the character image data and similarity, and a recognition character determination unit for determining recognition character from the recognition accuracy obtained by the recognition accuracy calculation unit. Character recognition apparatus characterized by comprising a.
JP5221737A 1993-09-07 1993-09-07 Character recognition device Pending JPH0773274A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5221737A JPH0773274A (en) 1993-09-07 1993-09-07 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5221737A JPH0773274A (en) 1993-09-07 1993-09-07 Character recognition device

Publications (1)

Publication Number Publication Date
JPH0773274A true JPH0773274A (en) 1995-03-17

Family

ID=16771452

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5221737A Pending JPH0773274A (en) 1993-09-07 1993-09-07 Character recognition device

Country Status (1)

Country Link
JP (1) JPH0773274A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260274A (en) * 2005-03-17 2006-09-28 Ricoh Co Ltd Character direction identification device, image forming device, program, storage medium, and character direction identification method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006260274A (en) * 2005-03-17 2006-09-28 Ricoh Co Ltd Character direction identification device, image forming device, program, storage medium, and character direction identification method
JP4607633B2 (en) * 2005-03-17 2011-01-05 株式会社リコー Character direction identification device, image forming apparatus, program, storage medium, and character direction identification method

Similar Documents

Publication Publication Date Title
JP4607633B2 (en) Character direction identification device, image forming apparatus, program, storage medium, and character direction identification method
JP2003308480A (en) On-line handwritten character pattern recognizing editing device and method, and computer-aided program to realize method
JPH0773274A (en) Character recognition device
JPH0528324A (en) English character recognition device
JP3304512B2 (en) Table recognition device
JPH0728945A (en) Character recognition device
JPH0728935A (en) Document image processor
JP2908460B2 (en) Error recognition correction method and apparatus
JP2856409B2 (en) Character recognition apparatus and method
JP3159745B2 (en) Character recognition method and apparatus
JP2002042138A (en) Image collating device, image collating method, and computer-readable recording medium recording program executing its method on computer
JP2007148925A (en) Information processor and information processing method
JP2827066B2 (en) Post-processing method for character recognition of documents with mixed digit strings
JP2874199B2 (en) Word dictionary matching device
JP2972443B2 (en) Character recognition device
JPH09138835A (en) Character recognition system
JPH01106287A (en) Word reader
JPH09305712A (en) Method, device for recognizing character and storage medium storing program for character recognition
JP2963474B2 (en) Similar character identification method
JP2838850B2 (en) Kana-Kanji conversion device
JPH08297720A (en) General document reader
JP2004038736A (en) Character recognition processing method, character recognition processing device, and character recognition program
JPH08180136A (en) Character recognizing method
JPH0496882A (en) Full size/half size discriminating method
JPH03217993A (en) Character size recognizer