JPH07271911A - Character recognizing device - Google Patents

Character recognizing device

Info

Publication number
JPH07271911A
JPH07271911A JP6057364A JP5736494A JPH07271911A JP H07271911 A JPH07271911 A JP H07271911A JP 6057364 A JP6057364 A JP 6057364A JP 5736494 A JP5736494 A JP 5736494A JP H07271911 A JPH07271911 A JP H07271911A
Authority
JP
Japan
Prior art keywords
character
width
full
unit
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6057364A
Other languages
Japanese (ja)
Other versions
JP3236732B2 (en
Inventor
Minoru Takakura
穂 高倉
Mariko Takenouchi
磨理子 竹之内
Ichiro Nakao
一郎 中尾
Satoshi Emura
里志 江村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP05736494A priority Critical patent/JP3236732B2/en
Publication of JPH07271911A publication Critical patent/JPH07271911A/en
Application granted granted Critical
Publication of JP3236732B2 publication Critical patent/JP3236732B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

PURPOSE:To provide a character recognizing device which can fast and accurately segment and recognize the characters and also can detect the margins regardless of a document printed in mixed full and half size characters or a document of unfixed pitches. CONSTITUTION:A character string extracting part 2 segments an input character string image, and a character element detecting part 3 extracts the character elements. A character width calculating part 4 calculates the widths of full and half size characters based on the height, etc., of the character images. A character element dividing part 5 detects and divides the character elements of widths less than the half size character width. A character candidate generating part 6 connects together the divided character elements to generate the full and half size character candidate images, and these candidate images are tentatively recognized by a recognizing part 7. The result of this recognition is evaluated again by a recognition result evaluating part 8. Thus the correct characters are recognized. Then a margin adding part 9 decides the presence or absence of inter-character margins based on the calculated character pitch.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、文字認識装置に関し、
特に入力された文書画像中の文字を認識して、文字コー
ドに変換する文字認識装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character recognition device,
In particular, the present invention relates to a character recognition device that recognizes a character in an input document image and converts it into a character code.

【0002】[0002]

【従来の技術】近年、印刷された文書を光/電気変換等
で読み取った上、いったん画素毎にビット情報化された
画像データ情報とし、この上でこの画像データ中の文字
を認識してデータ入力の省力化を図ったり、更に外国語
に翻訳したり盲人や視力障害者や児童や学童のために発
声するようなシステムの研究、開発がなされ、また一部
実用化されている。
2. Description of the Related Art In recent years, a printed document is read by optical / electrical conversion or the like, and once converted into image data information in which each pixel is converted into bit information, and then characters in the image data are recognized and data is recognized. Research and development of a system for reducing the input power, translating it into a foreign language, and uttering it for the blind, the visually impaired, children, and school children have been made, and some have been put into practical use.

【0003】本発明は、このようなシステムに採用され
る文字認識装置に関する。さて、従来のこのようなシス
テムに採用されている文字認識装置では、切り出した文
字列画像に対して、文字列に垂直方向に黒画素を投影さ
せ、正射影の連続する領域を文字として文字画像の切り
出しを行っていた(例えば、秋山他「印刷物の記事領域
における文字の切り出し」PRL80−70)。ところ
で、認識対象がアルファベット等簡単なものはともか
く、日本語、中国語等においては認識の対象となる文字
の種類、数が多いため、認識に先立ちあるいは認識とい
わば一体になって認識対象となっている文字の形状、大
きさを正確に知る必要がある。また、たとえ欧米系の言
語の印刷文書であっても、理工系の論文等は多種の記号
が使用されるため、認識対象の文字の大きさを正確に判
断するのは重要である。しかしながら、上述の文字切り
出し技術では、正射影の連続する領域を文字として文字
画像の切り出しを行っている。このため、文字と文字の
接触(以後、接触文字と呼称)がある場合や、例えば、
横書き文書における「北」、「川」や縦書き文書におけ
る「二」、「三」のように文字列方向に分離した複数の
文字要素からなる分離文字及び本来単独の文字要素から
なる文字であってもかすれにより複数の文字要素に分離
してしまった文字(以後、両者合わせて分離文字と呼
称)がある場合には、正確な切り出しが行えなかった。
そこで、接触文字や分離文字が含まれる文書の文字列画
像から文字を正しく切り出す手法もいくつか提案されて
いる。例えば、特開平5−128308号「文字認識装
置」では、所定の文字サイズより幅の狭い文字要素は分
離文字として扱い、幅が文字サイズを越えない範囲で前
後(左右、上下)の文字要素と接続して1文字として切
り出す。また、所定の文字サイズより幅の広い文字要素
は、接触文字として扱い、これを文字サイズで分割し、
この分割したそれぞれを1文字として切り出す。所定の
文字サイズより幅の狭い文字要素と所定の文字サイズよ
り幅の広い文字要素が連続している場合には、幅の狭い
文字要素の先頭位置から文字サイズ毎に分割した場合の
分離位置と幅の広い文字要素の先頭位置から文字サイズ
毎に分割した場合の分離位置とを切り出し候補位置と
し、これらの切り出し候補位置のうちの異なる2つの切
り出し候補位置で挟まれた画像を総て一旦文字と仮認識
し、この上で仮認識された文字の評価値の高いものを本
来の文字として選択する。これは、分離文字の後半要素
が次文字と接触している可能性を考慮したものである。
一方、特開平5−128307号「文字認識装置」で
は、前記特開平5−128308号が固定の文字サイズ
ごとに切り出し候補位置を生成しているのに対して、文
字サイズに半角文字幅を適用した場合と、全角文字幅を
適用した場合との分離位置を全て候補としている。
The present invention relates to a character recognition device used in such a system. By the way, in the conventional character recognition device adopted in such a system, a black pixel is projected in a vertical direction on a character string image cut out, and a region of continuous orthographic projection is treated as a character image. Was cut out (for example, Akiyama et al. “Cutout of characters in article area of printed matter” PRL 80-70). By the way, regardless of whether the recognition target is a simple one such as an alphabet, in Japanese, Chinese, etc., there are many types and numbers of characters to be recognized. It is necessary to know exactly the shape and size of the characters that are displayed. In addition, even in printed documents in Western languages, various types of symbols are used in scientific and engineering papers, etc., so it is important to accurately determine the size of characters to be recognized. However, in the above-described character cutout technique, a character image is cut out using a region in which the orthogonal projection is continuous as a character. Therefore, when there is contact between characters (hereinafter referred to as contact characters), for example,
It is a separated character consisting of multiple character elements separated in the character string direction, such as "North" or "River" in a horizontal writing document or "2" or "3" in a vertical writing document, or a character originally consisting of a single character element. However, if there is a character that has been separated into a plurality of character elements due to faintness (hereinafter, both are collectively referred to as a separated character), accurate cutting cannot be performed.
Therefore, some methods have been proposed for correctly extracting characters from a character string image of a document including contact characters and separated characters. For example, in Japanese Unexamined Patent Publication No. 5-128308 “Character recognition device”, a character element having a width narrower than a predetermined character size is treated as a separated character, and a character element before and after (left, right, top and bottom) is regarded as a character element within a width of the character size. Connect and cut out as one character. Also, character elements wider than the specified character size are treated as contact characters, and these are divided by character size.
Each of these divided pieces is cut out as one character. When a character element that is narrower than the specified character size and a character element that is wider than the specified character size are consecutive, the separation position when dividing by character size from the beginning position of the narrow character element The cut-off candidate position is defined as the cut-off candidate position from the start position of the wide character element for each character size, and an image sandwiched between two different cut-out candidate positions among these cut-out candidate positions is once written as a character. Is temporarily recognized, and a character having a higher evaluation value is selected as the original character. This takes into consideration the possibility that the latter half element of the separated character is in contact with the next character.
On the other hand, in Japanese Unexamined Patent Publication No. 5-128307 “Character recognition device”, while Japanese Unexamined Patent Publication No. 5-128308 generates cut-out candidate positions for each fixed character size, half-width character width is applied to the character size. All the separation positions in the case of doing and the case of applying the full-width character width are all candidates.

【0004】また、文字列中の余白の検出については、
切り出された文字の間隔幅と全角文字幅あるいは半角文
字幅とを比較し、余白幅の方が大きい場合を余白として
いる。
Further, regarding the detection of the blank space in the character string,
The interval width of the cut out characters is compared with the full-width character width or the half-width character width, and when the margin width is larger, the margin is defined.

【0005】[0005]

【発明が解決しようとする課題】しかしながら、上記特
開平5−128308号の方式では、文字サイズが一定
であることを前提としている。このため、全角,半角混
じりに印字された文書や不定ピッチの文書にうまく対応
できない。しかも、技術論文等はこれらの態様の文書が
非常に多い。一方、上記特開平5−128307号の方
式では、切り出し候補位置数が非常に多くなり、またそ
れらの切り出し候補位置の内の異なる2つの切り出し候
補位置で挟まれた画像を総て一旦文字として認識して処
理を行うため、計算量が非常に大きくなり、ひいてはシ
ステム全体としての処理速度が遅れる。
However, the method disclosed in Japanese Patent Laid-Open No. 5-128308 is based on the premise that the character size is constant. For this reason, it is not possible to properly deal with a document printed in both full-width and half-width and a document with an inconstant pitch. Moreover, technical papers and the like have a large number of documents in these modes. On the other hand, in the method disclosed in Japanese Patent Laid-Open No. 5-128307, the number of cutout candidate positions is very large, and all the images sandwiched between two different cutout candidate positions among the cutout candidate positions are recognized as characters once. Since the processing is performed in the same manner, the amount of calculation becomes very large, and the processing speed of the entire system is delayed.

【0006】また、余白の検出においては、文字幅とし
て全角文字幅を用いた場合には幅の狭い半角余白が検出
できない。逆に、文字幅として半角文字幅を用いた場合
には例えば「11」のように、全角ピッチで印字された
文書で幅の細い文字が続くようなときに、文字間の余白
幅が半角字幅より大きくなるため、余分な余白が検出さ
れる。ひいては全角、半角混じりに印字された文書や不
定ピッチの文書にうまく対応するのが困難である。
Further, in the detection of the blank space, when the full width character width is used as the character width, the narrow half width blank space cannot be detected. On the other hand, when the half-width character width is used as the character width, for example, when a narrow character continues in a document printed with a full-width pitch, the margin width between characters is a half-width character. Since the width is larger than the width, an extra margin is detected. As a result, it is difficult to properly deal with documents printed with full-width and half-width characters and documents with irregular pitch.

【0007】本発明は、以上の問題点に鑑み、全角,半
角混じりに印字された文書や不定ピッチの文書に対して
も、高速かつ正確に文字の切り出しと余白の検出が可能
な文字認識装置を提供することを目的としてなされたも
のである。
In view of the above problems, the present invention is a character recognition device capable of fast and accurate character cutting and margin detection even for a document printed with a mixture of full-width and half-width characters and a document with an irregular pitch. It is made for the purpose of providing.

【0008】[0008]

【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明においては、画素毎にビット情報化
等されて入力された文書画像から文字列画像を切り出
し、次に各文字列画像から更に個々の文字画像を切り出
し、この上で個々の文字画像を認識して該当する文字コ
ードに変換する文字認識装置において、前記文字列画像
から文字を構成する画素の塊である文字要素(文字列方
向に対して同位相の線分や曲線あるいはこれらの組み合
せ等からなる。)を抽出する文字要素抽出部と、前記文
字要素抽出部で抽出された文字要素の位置あるいは大き
さから全角文字の幅及び半角文字の幅を所定の手段(含
む,手順、方法)で算出する文字幅算出部と、前記文字
要素抽出部で抽出された文字要素のうち前記文字幅算出
部で算出した半角文字幅より幅の狭い文字要素があれば
これを検出してそのままサブ文字要素とし、半角文字幅
より幅の広い文字要素があればこれを検出して個々の幅
が半角文字幅以下の複数のサブ文字要素に分割する文字
要素分割部と、前記文字要素分割部で生成されたサブ文
字要素に対し、前後の文字列の文字要素若しくはサブ文
字要素と単一の文字を構成するものとみなして認識対象
とする接続後の幅が前記半角文字幅を越えない範囲で可
能な限り幅(認識方向が上下ならば、上下方向の長さを
含む概念)広くなるように接続して切り出される文字要
素画像を半角文字候補画像とし、接続後の幅が前記全角
文字幅を越えない範囲で可能な限り幅広くなるように接
続して切り出される文字要素画像を全角文字候補画像と
して切り出す文字候補生成部と、前記文字候補生成部で
生成された半角文字候補画像及び全角文字候補画像を一
旦単一の文字として仮認識し、該当する文字コードおよ
び正確性を示す評価値を算出する認識部と、前記認識部
で半角文字候補画像及び全角文字候補画像に対して得ら
れた評価値を所定の関数に代入して比較し、その結果の
評価の値の高い方の文字候補画像を正しい文字と判断す
る認識結果評価部とを備えたことを特徴としている。
In order to achieve the above object, according to the invention of claim 1, a character string image is cut out from a document image input by converting bit information into pixels for each pixel, and then each character is extracted. In a character recognition device that further cuts out individual character images from a column image, recognizes each character image on this, and converts into a corresponding character code, a character element that is a group of pixels forming a character from the character string image. (Consisting of line segments and curves having the same phase with respect to the character string direction or a combination thereof), and a full-width character from the position or size of the character element extracted by the character element extraction unit. Character width and half-width character width calculation unit that calculates the width of a character by a predetermined means (including, procedure, method), and half-width calculated by the character width calculation unit among the character elements extracted by the character element extraction unit Sentence If there is a character element that is narrower than the width, it is detected and used as a sub-character element as it is.If there is a character element that is wider than the single-byte character width, it is detected and multiple sub-characters with individual widths equal to or less than the single-byte character width are detected. Recognizes a character element dividing unit that divides into character elements and the sub-character elements generated by the character element dividing unit as if they constitute a single character with the character elements or sub-character elements of the preceding and following character strings. A character element image that is cut out by connecting so that the target width after connection is as wide as possible within the range that does not exceed the half-width character width (if the recognition direction is vertical, the concept includes the length in the vertical direction) A half-width character candidate image, a character candidate generation unit that cuts out a character element image that is cut out by connecting so that the width after connection is as wide as possible within a range that does not exceed the full-width character width, and The half-width character candidate image and the full-width character candidate image generated by the character candidate generation unit are temporarily recognized as a single character, and a recognition unit that calculates an evaluation value indicating the corresponding character code and accuracy, and the recognition unit. Substitution of the evaluation values obtained for the half-width character candidate image and the full-width character candidate image into a predetermined function for comparison, and the character candidate image with the higher evaluation value is judged as the correct character Recognition result evaluation It is characterized by having a section.

【0009】請求項2の発明においては、前記文字幅算
出部は、文字要素の位置あるいは大きさ(含む、両方)
から文字印字ピッチを計算し、その計算結果から全角文
字の幅及び半角文字の幅を算出する文字印字ピッチ計算
手段を有していることを特徴としている。請求項3の発
明においては、文字幅算出部は、文字列画像の高さ(文
字列画像の文字列に垂直な方向の大きさ若しくは長さ、
縦書き文字書ならばいわゆる幅となる。)から仮文字幅
を計算する仮文字幅計算手段と、前記文字要素抽出部で
抽出された文字要素の内、文字要素の幅と仮文字幅との
誤差が所定の値よりも小さい文字要素が連続する部分を
検出する連続部検出手段と、検出された連続する文字要
素の文字列方向の中点間距離から文字の印字ピッチを計
算し、その計算結果から全角文字の幅および半角文字の
幅を算出する算出手段とを有していることを特徴として
いる。
According to the second aspect of the present invention, the character width calculation unit is the position or size (including, both) of the character element.
Character print pitch is calculated from the character print pitch, and the character print pitch calculation means for calculating the width of the full-width character and the width of the half-width character from the calculation result is provided. In the invention of claim 3, the character width calculation unit determines the height of the character string image (the size or length of the character string image in the direction perpendicular to the character string,
If the text is written vertically, the width is so-called. ) From the temporary character width calculation means for calculating a temporary character width from the character element extraction unit, and a character element whose error between the width of the character element and the temporary character width is smaller than a predetermined value among the character elements extracted by the character element extraction unit. A continuous portion detecting means for detecting a continuous portion and a character printing pitch are calculated from the distance between the midpoints of the detected continuous character elements in the character string direction, and the width of the full-width character and the width of the half-width character are calculated from the calculation result. And a calculation means for calculating

【0010】請求項4の発明においては、前記文字幅算
出部は、文字列画像の高さから仮文字幅を計算する仮文
字幅計算手段と、仮文字幅より幅の小さい文字要素が連
続する場合には、幅が仮文字幅を越えない範囲で該文字
要素を仮に接続し、その仮接続した文字要素および元来
の文字要素の幅と仮文字幅との誤差をもとめ、これが所
定の値よりも小さい文字要素が連続する部分を検出する
連続部検出手段と、前記連続部検出手段で検出された連
続する部分の文字要素の文字列方向の中点間距離から文
字の印字ピッチを計算し、その計算結果から全角文字の
幅及び半角文字の幅を算出する算出手段とを有している
ことを特徴としている。
According to another aspect of the present invention, the character width calculation unit has a temporary character width calculation means for calculating the temporary character width from the height of the character string image and a character element having a width smaller than the temporary character width. In this case, the character elements are tentatively connected within a range in which the width does not exceed the tentative character width, and the error between the tentatively connected character element and the original character element width and the tentative character width is determined, and this is the predetermined value. A continuous portion detecting means for detecting a portion in which smaller character elements are continuous, and a character printing pitch is calculated from the distance between the midpoints of the character elements in the character string direction of the continuous portion detected by the continuous portion detecting means. , And a calculation means for calculating the width of the full-width character and the width of the half-width character from the calculation result.

【0011】請求項5の発明においては、前記認識部
は、前記文字候補生成部で生成された半角文字候補画像
を認識するのに使用する半角文字認識辞書と、前記文字
候補生成部で生成された全角文字候補画像を認識するの
に使用する全角文字認識辞書とを有していることを特徴
としている。請求項6の発明においては、前記認識部
は、全角文字候補画像の認識結果が、単一の文字の文字
列方向に分割した半分が半角1文字と同形の文字となる
か否かを判断する半分文字判断手段と、前記半分文字判
断手段にてそのような文字と判断されたならば前記認識
結果評価部における評価に際して全角文字候補画像の評
価値を優先させる優先評価手段とを有していることを特
徴としている。
According to a fifth aspect of the present invention, the recognition unit is a half-width character recognition dictionary used for recognizing the half-width character candidate image generated by the character candidate generation unit, and is generated by the character candidate generation unit. And a full-width character recognition dictionary used for recognizing full-width character candidate images. In the invention of claim 6, the recognition unit determines whether or not the recognition result of the full-width character candidate image is a half-width character divided into a half-width character and a half-width character. It has a half-character judgment means and a priority evaluation means for giving priority to the evaluation value of the full-width character candidate image when the recognition result evaluation section evaluates if such a character is judged by the half-character judgment means. It is characterized by that.

【0012】請求項7の発明においては、文字認識装置
が文字のタイプが全角文字か半角文字かを判断するに際
して、その直前に認識対象とされた文字と同じタイプで
あると仮判断した上で文字認識を行い、若し該当する文
字が存在しない(含む、評価値が非常に低い場合)と判
断された場合には、逆の文字タイプであると判断して文
字認識を行うよう各部を制御する全半角仮判断制御部を
有していることを特徴としている。
In the invention of claim 7, when the character recognition device determines whether the character type is a full-width character or a half-width character, it is temporarily determined to be the same type as the character that is the recognition target immediately before that. When character recognition is performed and if it is determined that the corresponding character does not exist (including, if the evaluation value is very low), it is determined that it is the opposite character type and each part is controlled to perform character recognition. It is characterized by having a full-width half-width tentative judgment control unit.

【0013】請求項8の発明においては、文字認識装置
が文字のタイプが全角文字か半角文字かを判断するに際
して、その前後所定字数以内の文字に既に全角か半角か
の認識が終了した文字が存在するならばこれを判断資料
とするよう各部を制御する全半角判断制御部を有してい
ることを特徴としている。請求項9の発明においては、
前記認識結果評価部で単一の文字と判断された各文字画
像について、各文字が全角文字、半角文字のいずれであ
るかと相連続する2文字の文字列方向の中点間隔とから
文字間余白を検出する余白検出部と、前記余白検出部の
検出結果をもとに前記出力文字コード中の対応する位置
に余白コードを挿入する余白追加部とを有していること
を特徴としている。
According to the invention of claim 8, when the character recognition device determines whether the character type is a full-width character or a half-width character, the characters within a predetermined number of characters before and after the character are already recognized as full-width or half-width characters. If it exists, it is characterized by having a full-width half-width determination control unit that controls each unit so that it is used as a determination material. In the invention of claim 9,
For each character image determined to be a single character by the recognition result evaluation unit, a character-to-character space is determined based on whether each character is a full-width character or a half-width character and the midpoint interval between two consecutive characters in the character string direction. And a margin adding section that inserts a margin code at a corresponding position in the output character code based on the detection result of the margin detecting section.

【0014】[0014]

【作用】上記構成により請求項1の発明においては、入
力された文書画像から文字列画像を切り出し、次に各文
字列画像から更に個々の文字画像を切り出し、この上で
個々の文字画像を認識して該当する文字コードに変換す
る文字認識装置において、以下の作用がなされる。
With the above construction, in the invention of claim 1, the character string image is cut out from the input document image, and then the individual character images are further cut out from each character string image, and the individual character images are recognized on this. Then, in the character recognition device for converting to the corresponding character code, the following operations are performed.

【0015】文字要素抽出部が、文字列画像から文字を
構成する画素の塊である文字要素を抽出する。文字幅算
出部が、文字要素抽出部で抽出された文字要素の位置あ
るいは大きさから全角文字の幅および半角文字の幅を所
定の手段で算出する。文字要素分割部が、文字要素抽出
部で抽出された文字要素のうち文字幅算出部で算出した
半角文字幅より幅の狭い文字要素があれば、画素の文字
列方向の正投象影の不連続部の有無等によりこれを検出
してそのままサブ文字要素とし、半角文字幅より幅の広
い文字要素があればこれを検出して個々の幅が半角文字
幅以下の複数のサブ文字要素に分割する。文字候補生成
部が、文字要素分割部で生成されたサブ文字要素に対
し、接続後の幅が前記半角文字幅を越えない範囲で可能
な限りサブ文字要素を接続してなる接続文字要素で切り
出される画像を半角文字候補画像とし、接続後の幅が全
角文字幅を越えない範囲で可能な限りサブ文字要素を接
続してなる接続文字要素で切り出される画像を全角文字
候補画像として切り出す。認識部が、文字候補生成部で
生成された半角文字候補画像及び全角文字候補画像を一
旦単一の文字と仮認識して、この上でパターン照合等に
より該当する文字コード及び正確性を示す評価値を算出
する。認識結果評価部が、認識部で半角文字候補画像及
び全角文字候補画像に対して得られた評価値を所定の関
数に代入して比較し、その結果の評価値の高い方の文字
候補画像を正しい文字と判断する。
The character element extraction unit extracts a character element which is a block of pixels forming a character from the character string image. The character width calculation unit calculates the width of the full-width character and the width of the half-width character by a predetermined means from the position or size of the character element extracted by the character element extraction unit. If the character element division unit has a character element narrower than the half-width character width calculated by the character width calculation unit among the character elements extracted by the character element extraction unit, the normal projection shadow of the pixel in the character string direction is not detected. It is detected by the presence or absence of a continuous part, etc., and it is used as it is as a sub-character element, and if there is a character element wider than the half-width character width, it is detected and divided into multiple sub-character elements whose individual width is less than the half-width character width. To do. The character candidate generator cuts out the sub-character elements generated by the character-element division unit by connecting character elements that connect the sub-character elements as much as possible within the range that the width after connection does not exceed the half-width character width. The image to be cut is defined as a half-width character candidate image, and an image cut out by a connected character element formed by connecting sub-character elements is cut out as a full-width character candidate image as long as the width after connection does not exceed the full-width character width. The recognition unit temporarily recognizes the half-width character candidate image and the full-width character candidate image generated by the character candidate generation unit as a single character, and then evaluates the corresponding character code and accuracy by pattern matching or the like. Calculate the value. The recognition result evaluation unit substitutes the evaluation values obtained for the half-width character candidate image and the full-width character candidate image in the recognition unit into a predetermined function and compares them, and the character candidate image with the higher evaluation value of the result is selected. Judge as the correct character.

【0016】請求項2の発明においては、文字幅算出部
内の文字印字ピッチ計算手段が、文字要素の相互の位置
関係あるいは文字列方向の大きさ(幅)及びこれに直交
する方向の大きさ(高さ)や行間に対する相対的大きさ
等から文字印字ピッチを計算し、その計算結果から全角
文字の幅及び半角文字の幅を算出する。請求項3の発明
においては、文字幅算出部内の仮文字幅計算手段が、文
字列画像の高さから仮文字幅を計算する。同じく連続部
検出手段が、文字要素抽出部で抽出された文字要素の
内、文字要素の幅と仮文字幅との誤差が所定の値よりも
小さい文字要素が連続する部分を検出する。同じく算出
手段が、検出された連続する文字要素の文字列方向の中
点間距離から文字印字ピッチを計算し、その計算結果か
ら全角文字の幅および半角文字の幅を算出する。
According to the second aspect of the invention, the character printing pitch calculating means in the character width calculating section is arranged such that the mutual positional relationship of the character elements or the size (width) in the character string direction and the size in the direction orthogonal thereto ( The character print pitch is calculated from the height) and the relative size to the line spacing, and the width of the full-width character and the width of the half-width character are calculated from the calculation result. In the invention of claim 3, the temporary character width calculating means in the character width calculating unit calculates the temporary character width from the height of the character string image. Similarly, the continuous portion detecting means detects, among the character elements extracted by the character element extracting portion, a portion in which the character elements whose error between the width of the character element and the temporary character width is smaller than a predetermined value are continuous. Similarly, the calculation means calculates the character print pitch from the distance between the midpoints of the detected consecutive character elements in the character string direction, and calculates the width of the full-width character and the width of the half-width character from the calculation result.

【0017】請求項4の発明においては、文字幅算出部
内の仮文字幅計算手段が文字列画像の高さから仮文字幅
を計算する。同じく連続部検出手段が、計算された仮文
字幅より幅の小さい文字要素が連続する場合には、幅が
仮文字幅を越えない範囲で該文字要素を仮に接続し、そ
の仮接続した文字要素および元来の文字要素の幅と仮文
字幅との誤差を求め、これらの値が所定の値よりも小さ
い文字要素が連続する部分を検出する。同じく算出手段
が連続部検出手段で検出された連続する部分の文字要素
の文字列方向の中点間距離から文字印字ピッチを計算
し、その計算結果から全角文字の幅および半角文字の幅
を算出する。
In the invention of claim 4, the temporary character width calculation means in the character width calculation unit calculates the temporary character width from the height of the character string image. Similarly, when the character elements having a width smaller than the calculated temporary character width are continuous, the continuous portion detecting means temporarily connects the character elements within a range in which the width does not exceed the temporary character width, and the temporarily connected character elements are connected. Further, the error between the width of the original character element and the width of the temporary character is calculated, and the portion where the character elements whose values are smaller than the predetermined value are continuous is detected. Similarly, the calculation means calculates the character print pitch from the distance between the midpoints of the character elements in the character string direction of the continuous portions detected by the continuous portion detection means, and calculates the full-width character width and half-width character width from the calculation results. To do.

【0018】請求項5の発明においては、前記認識部内
の半角文字認識辞書が、前記文字候補生成部で生成され
た半角文字候補画像をパターン認識等で認識するのに使
用される。同じく全角文字認識辞書が前記文字候補生成
部で生成された全角文字候補画像を認識するのに使用さ
れる。請求項6の発明において、認識部内の半分文字判
断手段が、全角文字候補画像の認識結果が単一の文字の
文字列方向に分割した半分が半角1文字と同形の文字と
なるか否かを判断する。同じく優先評価手段が、半分文
字判断手段にてそのような文字と判断されたならば認識
結果評価部における評価に際して全角文字候補画像の評
価値を優先させる。
In the invention of claim 5, the half-width character recognition dictionary in the recognition section is used for recognizing the half-width character candidate image generated by the character candidate generation section by pattern recognition or the like. Similarly, the full-width character recognition dictionary is used to recognize the full-width character candidate image generated by the character candidate generation unit. In the invention of claim 6, the half-character determining means in the recognition unit determines whether the half-width character candidate image recognition result is a half-width character divided in the character string direction into a half-width one-character character. to decide. Similarly, when the half-character determining unit determines that the character is such a character, the evaluation value of the full-width character candidate image is prioritized in the evaluation by the recognition result evaluation unit.

【0019】請求項7の発明においては、文字のタイプ
が、全角文字か半角文字かを判断するに際して、全半角
仮判断制御部がその直前に認識対象とされた文字と同じ
タイプであると仮判断した上で文字認識を行い、若し該
当する文字が存在しないと判断された場合(含む,評価
値が低い場合の足切り)には、逆の文字のタイプである
と判断して文字認識を行うように各部を制御する。
According to the invention of claim 7, when it is determined whether the character type is a full-width character or a half-width character, it is assumed that the full-width half-width tentative determination control unit is the same type as the character immediately before the recognition target. If it is judged that the character does not exist, it is judged to be the opposite character type and character recognition is performed if it is judged that the corresponding character does not exist (including, cutoff when evaluation value is low). Control each part to perform.

【0020】請求項8の発明においては、文字が全角文
字か半角文字かを判断するに際して、全半角判断制御部
がその前後所定字数以内の文字に既に全角か半角かの認
識が終了した文字が存在するならば、これを判断資料と
するよう制御する。請求項9の発明においては、余白検
出部が認識結果評価部で単一の文字と判断された各文字
画像について、各文字が全角文字、半角文字のいずれで
あるかと相連続する2文字の文字列方向の中点間隔とか
ら文字間余白を検出する。同じく余白追加部が、余白検
出部の検出結果をもとに出力文字コード中の対応する位
置に余白コードを挿入する。
According to the invention of claim 8, when determining whether the character is a full-width character or a half-width character, the full-width half-width judgment control unit determines that the characters within a predetermined number of characters before and after the full-width character have already been recognized as full-width or half-width characters. If it exists, it is controlled to use it as a judgment material. In the invention of claim 9, in each character image that the margin detection unit has determined to be a single character by the recognition result evaluation unit, two characters that are continuous with whether each character is a full-width character or a half-width character The space between characters is detected from the midpoint spacing in the column direction. Similarly, the margin adding section inserts a margin code at a corresponding position in the output character code based on the detection result of the margin detecting section.

【0021】[0021]

【実施例】以下、本発明に係る文字認識装置を実施例に
基づいて説明する。なお、以下の実施例においては、縦
長、横太等の文字、形状は全角だが見出し欄における文
字のごとく大きい文字等を標準的な文字に修正したりす
る正規化部、認識後の文字を出力する出力部や更には出
力結果をもとに外国語に翻訳したり発声したりする発声
部等のシステム全体としての構成部、使用者が各種操作
を行ったり、あらかじめ判明している条件を入力するた
めの入力操作部等を有しているのは勿論である。しか
し、これらは本発明の主旨には直接には関係しないた
め、図示や説明は省略する。 (第1実施例)図1は、本発明の第1実施例の構成図で
ある。本図において、1は画像が入力される画像入力部
である。2は、画像入力部1で読み込んだ文書画像から
文字列の位置を検出し文字列画像を切り出す文字列抽出
部である。3は、文字列抽出部2で切り出された文字列
画像から文字を構成する画素の塊である文字要素を抽出
する文字要素抽出部である。4は、文字要素抽出部3で
抽出された文字要素の位置あるいは大きさから全角文字
の幅および半角文字の幅を算出する文字幅算出部であ
る。5は、文字要素抽出部3で抽出された文字要素の
内、文字幅算出部4で算出した半角文字幅より幅の狭い
文字要素があればこれを検出した上そのままサブ文字要
素とし、半角文字幅より幅の広い文字要素があればこれ
を検出して個々の幅が半角文字幅以下の複数のサブ文字
要素に分割する文字要素分割部である。6は、文字要素
分割部5で生成されたサブ文字要素に対し、接続後の幅
が半角文字幅を越えない範囲で可能な限りサブ文字要素
を接続した接続文字要素で切り出される画像を半角文字
候補画像とし、接続後の幅が全角文字幅を越えない範囲
で可能な限りサブ文字要素を接続した接続文字要素で切
り出される画像を全角文字候補画像として切り出す文字
候補生成部である。7は、文字候補生成部6で生成され
た半角文字候補画像及び全角文字候補画像を一旦候補文
字として認識し、該当する文字コードおよび認識の正し
さの確率たる評価値を算出する認識部である。8は、認
識部で半角文字候補画像および全角文字候補画像に対し
て得られた評価値を所定の関数に基づき比較し、比較結
果の高い方の文字候補画像を正しい文字と判断する認識
結果評価部である。9は、認識結果評価部8で正しい1
文字と判断された各文字画像について、各文字が全角文
字、半角文字のいずれであるか及び相連続する2文字の
文字列方向の中点間隔から当該文字間に存在する余白を
検出し、前記出力文字コード中の対応する位置に余白コ
ードを挿入する余白追加部である。10は、認識結果を
出力する認識結果出力部である。
DESCRIPTION OF THE PREFERRED EMBODIMENTS A character recognition device according to the present invention will be described below based on embodiments. In the following embodiments, characters such as portrait, width, etc., a normalization unit that corrects large characters such as characters in the heading field but full-size characters, etc. into standard characters, output characters after recognition The output part, and further the structural parts of the entire system such as the voicing part that translates into a foreign language or utters based on the output result, the user performs various operations, and inputs the conditions known in advance. Needless to say, it has an input operation unit for performing the operation. However, since these are not directly related to the gist of the present invention, illustration and description thereof will be omitted. (First Embodiment) FIG. 1 is a block diagram of the first embodiment of the present invention. In the figure, reference numeral 1 is an image input unit to which an image is input. A character string extraction unit 2 detects the position of the character string from the document image read by the image input unit 1 and cuts out the character string image. Reference numeral 3 denotes a character element extraction unit that extracts a character element, which is a block of pixels forming a character, from the character string image cut out by the character string extraction unit 2. A character width calculation unit 4 calculates the widths of full-width characters and half-width characters from the positions or sizes of the character elements extracted by the character element extraction unit 3. In the character elements 5 extracted by the character element extraction unit 3, a character element having a width narrower than the half-width character width calculated by the character width calculation unit 4 is detected as a sub-character element and the half-width character A character element dividing unit that detects a character element wider than the width and divides the character element into a plurality of sub-character elements each having a width equal to or smaller than the half-width character width. 6 is a half-width character image for the sub-character element generated by the character element division unit 5 and is an image cut out by the connected character element in which the sub-character elements are connected as much as possible within a range in which the width after connection does not exceed the half-width character width. A character candidate generation unit that cuts out, as a candidate image, an image cut out by a connected character element in which sub-character elements are connected as much as possible within a range in which the width after connection does not exceed the full-width character width as a full-width character candidate image. Reference numeral 7 denotes a recognition unit that temporarily recognizes the half-width character candidate image and the full-width character candidate image generated by the character candidate generation unit 6 as candidate characters, and calculates the corresponding character code and the evaluation value that is the probability of correctness of recognition. . 8 is a recognition result evaluation for comparing the evaluation values obtained for the half-width character candidate image and the full-width character candidate image by the recognition unit based on a predetermined function, and determining the character candidate image with the higher comparison result as a correct character. It is a department. 9 is correct 1 in the recognition result evaluation unit 8
For each character image that is determined to be a character, whether each character is a full-width character or a half-width character, and a space existing between the characters is detected from the midpoint interval between two consecutive characters in the character string direction. This is a margin adding section that inserts a margin code at a corresponding position in the output character code. Reference numeral 10 is a recognition result output unit that outputs a recognition result.

【0022】以下、以上のように構成された文字認識装
置について、図2に示すような横書きの入力画像を例に
とってその動作を説明する。なお、本図において、下二
段の○部は本実施例の作用の説明に直接には使用しない
何かある文字を表す。画像入力部1から入力された画像
は、文字を形成する画素を1、文字以外の背景画素を0
とした2値データとして画像メモリ(図示せず)に蓄え
る。文字列抽出部2では、まず、画像メモリに蓄えられ
た文書画像から文字列に対して縦方向および横方向の文
字を形成する画素の正投象影を求め、両方向の文字を構
成する画素の正投象影の幅および正投象影間の間隔を比
較し、入力文書画像が縦書き文書か横書き文書かを判定
する(この技術については例えば特願昭60−7763
3号にて開示されている)。ついで、文書画像を文字列
方向に平行のブロックに区切り、各ブロックごとに文字
列方向の文字部射影を求め、ブロックの境界座標と射影
の開始、終了座標とではさまれた矩形領域をそのブロッ
クにおける文字列とし、ブロック毎の文字列の文字列に
垂直な方向での重複の有無を調べることで、各ブロック
毎の文字列を接続し、文字列の座標を得ることにより、
文字列画像を切り出す。図3の(a)にこれを示す(こ
の技術については、例えば特願昭60−106404号
「文字認識装置」にて開示されている。)。文字要素抽
出部3では、文字列抽出部2で切り出された文字列画像
図3(a)から文字要素を抽出する。その処理の内容で
あるが、図3の(b)に示すように、文字列画像の文字
列を垂直方向に投影し、文字部の正投象影の連続する部
分を文字列要素とし、その矩形座標を求める。これを、
図3の(c)のs1,s2,…s10に示す。文字幅算
出部4では、文字要素抽出部3で抽出された文字要素の
座標から全角文字の幅及び半角文字の幅を算出する。こ
こに、文字幅算出部4での文字幅算出の方式は、いくつ
かの方式が考えられるが、本実施例の採用する方式を以
下に3種説明する。
The operation of the character recognition apparatus configured as described above will be described below by taking a horizontal input image as shown in FIG. 2 as an example. In the figure, the lower two circles represent some characters that are not used directly in the explanation of the operation of this embodiment. The image input from the image input unit 1 has 1 pixel forming a character and 0 background pixel other than the character.
Is stored in an image memory (not shown) as binary data. In the character string extraction unit 2, first, the normal projection shadows of the pixels forming the characters in the vertical and horizontal directions are obtained from the document image stored in the image memory, and the normal projection shadows of the pixels forming the characters in both directions are calculated. The width of the regular projection image and the interval between the regular projection images are compared to determine whether the input document image is a vertical writing document or a horizontal writing document (for this technique, for example, Japanese Patent Application No. 60-7763).
No. 3). Then, the document image is divided into blocks parallel to the character string direction, the character part projection in the character string direction is obtained for each block, and the rectangular area sandwiched between the block boundary coordinates and the projection start and end coordinates is divided into that block. By connecting the character strings of each block and obtaining the coordinates of the character strings, by checking for duplication in the direction perpendicular to the character strings of the character strings of each block,
Cut out a character string image. This is shown in FIG. 3A (this technique is disclosed, for example, in Japanese Patent Application No. 60-106404, "Character Recognition Device"). The character element extraction unit 3 extracts a character element from the character string image FIG. 3 (a) cut out by the character string extraction unit 2. 3B, the character string of the character string image is projected in the vertical direction, and a continuous portion of the normal projection shadow of the character portion is set as the character string element. Find the rectangular coordinates. this,
It is shown as s1, s2, ..., S10 in FIG. The character width calculation unit 4 calculates the widths of full-width characters and half-width characters from the coordinates of the character elements extracted by the character element extraction unit 3. There are several possible methods for calculating the character width in the character width calculation unit 4, and three methods adopted in this embodiment will be described below.

【0023】第1の方式を図4の(a)を用いて説明す
る。文字列の高さHに所定の定数αをかけ、仮文字幅W
*を算出する。一般に、印刷された日本語文書では、多
くの文字の縦横比はほぼ1なので、αは概略1に近い値
をとる。ただし、印刷された書体に応じて修正を施した
り正規化処理の内容如何によっては多少の相違があるの
は勿論である。次に、縦書きの「一(漢字のはじめや漢
数字のいち)や横書きの「1(漢字のすすむやアラビア
数字のいち)」が存在するため、仮文字幅W*と幅がほ
ぼ等しい文字要素(図中、s3,s5,s9,s10)
の内でもっとも幅の広い文字要素(図中、s3)の幅W
maxに所定の定数βをかけたものを全角文字幅Wzと
する。即ち、各文字要素の幅をWi(i=1,2,…)
とするとき、全角文字幅Wzは次式で表される。
The first method will be described with reference to FIG. The height H of the character string is multiplied by a predetermined constant α, and the temporary character width W
Calculate *. Generally, in a printed Japanese document, the aspect ratio of many characters is almost 1, so α takes a value close to approximately 1. However, it goes without saying that there is a slight difference depending on the content of the normalization process or the correction performed according to the printed typeface. Next, there are vertically written "1" (the beginning of the kanji and the kanji number 1) and horizontally written "1 (the kanji character and the Arabic number 1)", so the character width W * is almost the same width. Elements (s3, s5, s9, s10 in the figure)
Width W of the widest character element (s3 in the figure)
The full-width character width Wz is obtained by multiplying max by a predetermined constant β. That is, the width of each character element is Wi (i = 1, 2, ...)
Then, the full-width character width Wz is expressed by the following equation.

【0024】 Wmax=max{Wi|Wi/W*〜1} Wz=β1・Wmax (ここに、β1〜1) ここで、max{U}は、集合Uの最大値を表す。ま
た、A〜Bの〜はAとBとがほぼ同値であることを示
す。また、半角文字幅Whは、全角文字幅Wzに所定の
定数γをかけて算出する。
Wmax = max {Wi | Wi / W * ˜1} Wz = β1 · Wmax (where β1˜1) where max {U} represents the maximum value of the set U. In addition, from A to B indicates that A and B have almost the same value. The half-width character width Wh is calculated by multiplying the full-width character width Wz by a predetermined constant γ.

【0025】Wh=γ・Wz (ここに、
γ〜0.5), 第2の方式を図4の(b)を用いて説明する。第1の方
式と同様にして、仮文字幅W*を算出し、文字要素の
内、仮文字幅W*と幅がほぼ等しい文字要素が複数個近
接して存在しているもの(図中、s9,s10)の文字
列方向の中点間距離(図中、d1)の平均値あるいは最
大値を文字印字ピッチPとし、全角文字幅Wz、半角文
字幅Whを、それぞれ以下の式で算出する。これは、で
きるだけ長く、数の多い文字を評価対象としつつ、文字
印字ピッチの変更に柔軟に対応せんとすることによる。
Wh = γ · Wz (where
γ to 0.5), the second method will be described with reference to FIG. In the same manner as the first method, the temporary character width W * is calculated, and among the character elements, a plurality of character elements having a width substantially equal to the temporary character width W * are present close to each other (in the figure, The average value or the maximum value of the distances (d1 in the figure) between the midpoints in the character string direction of s9, s10) is set as the character printing pitch P, and the full-width character width Wz and the half-width character width Wh are calculated by the following formulas, respectively. . This is because the longest possible number of characters are evaluated and the change of the character print pitch is not flexibly dealt with.

【0026】Wz=β2・P (ここに、
β2〜1かつβ2<1) Wh=γ・Wz (ここに、γ〜0.
5)。 第3の方式を図4の(c)を用いて説明する。第1の方
式と同様にして、仮文字幅W*を算出し、仮文字幅W*
より幅の小さい文字要素が連続する場合(図中、s6,
s7)には、幅が仮文字幅W*を越えない範囲で文字要
素を仮に接続し(図中、s’)、いわば単一の文字とし
て扱い、仮文字幅W*と幅がほぼ等しい文字要素または
仮接続した文字要素が複数個近接して存在しているもの
(図中、s6,s’およびs9,s10)の文字列方向
の中点間距離(図中、d1,d2)の平均値あるいは最
大値を文字印字ピッチPとし、全角文字幅Wz、半角文
字幅Whを、それぞれ以下の式で算出する。これも、可
能な限り長い、そして数の多い文字を評価対象とするた
めである。
Wz = β2 · P (where
β2-1 and β2 <1) Wh = γ · Wz (where γ˜0.
5). The third method will be described with reference to FIG. Similar to the first method, the temporary character width W * is calculated, and the temporary character width W * is calculated.
When character elements with smaller width are continuous (in the figure, s6
In s7), character elements are tentatively connected within the range where the width does not exceed the temporary character width W * (s' in the figure) and are treated as a single character, so to speak, and the character width is approximately equal to W *. Average of the distances between the midpoints (d1, d2 in the figure) in the character string direction of elements (s6, s' and s9, s10 in the figure) where multiple elements or tentatively connected character elements exist in close proximity The value or the maximum value is set as the character print pitch P, and the full-width character width Wz and the half-width character width Wh are calculated by the following equations. This is also for the purpose of evaluating characters that are as long and large as possible.

【0027】Wz=β2・P (ここに、
β2〜1かつβ2<1) Wh=γ・Wz (ここに、γ〜0.5) なお、以上の三方式のいずれを採用するかは、処理対象
となっている本来の文書の態様、すなわち新聞紙のごと
く文字間隔を比較的詰めて記載されているか否か、特許
出願の明細書のごとく文字間隔が比較的大きいか否か、
学術論文のごとく全角の漢字と半角の数字やアルファベ
ットとが併用されているか否か、更には不等間隔か否か
等に応じてなされるのは勿論である。更に、γ、β2等
の各定数の値も認識対象の文書に応じて適宜最適の値が
選択されるのは勿論である。
Wz = β2 · P (where
β2 to 1 and β2 <1) Wh = γ · Wz (here, γ to 0.5) Which of the above three methods is to be used depends on the mode of the original document to be processed, that is, Whether or not the character spacing is relatively close, such as newspaper, or whether or not the character spacing is relatively large as in the specification of the patent application,
Needless to say, this is done depending on whether or not full-width Kanji and half-width numbers or alphabets are used together as in an academic paper, and whether or not they are unequal intervals. Further, it goes without saying that the values of the constants such as γ and β2 are appropriately selected according to the document to be recognized.

【0028】文字要素分割部5が、文字要素抽出部3で
抽出された文字要素の各文字要素siについて行う操作
を、図5を参照しつつ説明する。なお、ここに文字幅算
出部4で算出した半角文字幅をWhと表し、文字要素s
iの幅をWiと表すものとする。最初に分割数Nを決定
する。分割数N=〔Wi/Wh+0.5〕。ここで、
〔X〕はガウスの記号であり、Xを越えない最大の整数
値をあらわす。
The operation performed by the character element dividing unit 5 for each character element si of the character elements extracted by the character element extracting unit 3 will be described with reference to FIG. The half-width character width calculated by the character width calculation unit 4 is represented by Wh, and the character element s
Let i be the width of i. First, the division number N is determined. Number of divisions N = [Wi / Wh + 0.5]. here,
[X] is a Gaussian symbol and represents the maximum integer value that does not exceed X.

【0029】次に、図5の(a)におけるs4,s5,
s7,s10のように分割数N>1の場合には、認識対
象として注目している文字要素siをN個に均等幅で分
割する。同図5の(b)のs1,s2,s3,s6,s
8,s9のように分割数N=1の場合には、何もしな
い。
Next, s4, s5 in FIG.
When the number of divisions N> 1 as in s7 and s10, the character element si of interest as a recognition target is divided into N pieces with a uniform width. 5 (b), s1, s2, s3, s6, s
When the number of divisions N = 1, like 8 and s9, nothing is done.

【0030】次に、図6を参照しつつ、文字要素分割部
5で生成されたサブ文字要素に対して、文字列先頭のサ
ブ文字要素から順に文字候補生成部6、認識部7、認識
結果評価部8での処理を行い、認識結果を確定していく
処理の内容を説明する。まず、文字候補生成部6におい
て文字列先頭のサブ文字要素s1に注目し、接続後の幅
が半角文字幅Whを越えない範囲で可能な限りサブ文字
要素を接続した接続文字要素で切り出される半角文字候
補画像c11と、接続後の幅が全角文字幅Wzを越えな
い範囲で可能な限りサブ文字要素を接続した接続文字要
素で切り出される全角文字候補画像c21とを生成す
る。ついで、認識部7で、その両文字候補画像を単一の
文字画像とした上で文字を認識し、文字コードおよび評
価値を算出する。(なお、この評価技術については、例
えば、特昭願63−312288号「文字認識方法」に
て開示されている。)その際、認識速度の向上と正確性
のため半角文字候補画像は半角文字認識辞書を用いて認
識を行い、全角文字候補画像は全角文字認識辞書を用い
て認識を行う。図では、半角文字候補画像c11に対し
て文字コードは「8(アラビア数字)」、評価値=37
を、全角文字候補画像c21に対して文字コードは
「昭」、評価値は=61となっている。これらの結果
を、認識結果評価部8で比較し、評価の高い方の文字候
補画像を文字と判断する。
Next, referring to FIG. 6, with respect to the sub-character elements generated by the character element dividing section 5, the character candidate generating section 6, the recognizing section 7, and the recognition result in order from the sub-character element at the beginning of the character string. The contents of the processing of performing the processing in the evaluation unit 8 and determining the recognition result will be described. First, in the character candidate generation unit 6, paying attention to the sub-character element s1 at the beginning of the character string, the half-width character that is cut out by the connected character element in which the sub-character elements are connected as much as possible within a range in which the width after connection does not exceed the half-width character width Wh The character candidate image c11 and the full-width character candidate image c21 that is cut out by the connected character elements connecting the sub-character elements as much as possible within the range in which the width after connection does not exceed the full-width character width Wz are generated. Then, the recognition unit 7 recognizes the character after making both character candidate images into a single character image, and calculates the character code and the evaluation value. (Note that this evaluation technique is disclosed, for example, in Japanese Patent Application No. 63-312288, “Character recognition method”.) At that time, the half-width character candidate image is a half-width character for improving the recognition speed and accuracy. The recognition is performed using the recognition dictionary, and the full-width character candidate image is recognized using the full-width character recognition dictionary. In the figure, the character code is “8 (Arabic numerals)” for the half-width character candidate image c11, and the evaluation value = 37.
For the full-width character candidate image c21, the character code is "Aki" and the evaluation value is = 61. The recognition result evaluation unit 8 compares these results, and determines that the character candidate image with the higher evaluation is a character.

【0031】さて、この比較は、単純に認識結果の評価
値(認識評価値)の大小で行っても良いが、本実施例で
はより正確な結果を得るべく、この評価値に対して条件
により以下のような関数操作を行い、その結果得られた
評価値(最終評価値)の大小で最終比較を行う。さて、
半角文字候補画像の認識評価値をv1、全角文字候補画
像の認識評価値をv2と表し、半角文字候補画像の最終
評価値をV1、全角文字候補画像の最終評価値をV2と
表す。
This comparison may be performed simply by the size of the evaluation value of the recognition result (recognition evaluation value), but in the present embodiment, in order to obtain a more accurate result, the evaluation value is changed depending on the condition. The following function operation is performed, and the final comparison is performed based on the magnitude of the evaluation value (final evaluation value) obtained as a result. Now,
The recognition evaluation value of the half-width character candidate image is represented by v1, the recognition evaluation value of the full-width character candidate image is represented by v2, the final evaluation value of the half-width character candidate image is represented by V1, and the final evaluation value of the full-width character candidate image is represented by V2.

【0032】第1に、全角文字候補画像の認識結果が、
1文字の前半分、例えば、横書きの「化」、「八」は各
々左半分が「イ」、「ノ」と同形であるように、左横書
き文書では左半分、縦書き文書では上半分が半角1文字
と同形の文字であった場合には、全角文字候補画像の認
識評価値v2に定数δ1(ここに、δ1>1.0 であ
る。)をかけた値を全角文字候補画像の最終評価値V2
とする。
First, the recognition result of the full-width character candidate image is
The first half of one character, for example, horizontal writing "ka" and "eighth" have the same shape as the left half "i" and "no", respectively. If the character has the same shape as one half-width character, a value obtained by multiplying the recognition evaluation value v2 of the full-width character candidate image by a constant δ1 (here, δ1> 1.0) is the final value of the full-width character candidate image. Evaluation value V2
And

【0033】すなわち、 V2=δ1×v2 である。
次に、それ以外の場合には、全角文字候補画像の認識評
価値v2に定数δ2(ここに、1.0<δ2<δ1 で
ある。)をかけた値をの最終評価値V2とする。すなわ
ち、 V2=δ2×v23 である。
That is, V2 = δ1 × v2.
Next, in other cases, a value obtained by multiplying the recognition evaluation value v2 of the full-width character candidate image by a constant δ2 (here, 1.0 <δ2 <δ1) is set as the final evaluation value V2 of. That is, V2 = δ2 × v23.

【0034】半角文字候補画像では、認識評価値v1を
そのまま最終評価値V1とする。すなわち、 V1=v
14 である。もし、V1<V2ならば、全角文字候補
画像を文字と判断する。またV1≧V2ならば、半角文
字候補画像を文字と判断する。これは、可能な限り長い
画素間を評価対象、認識対象とすべく重み付けを行なっ
ていることによる。
In the half-width character candidate image, the recognition evaluation value v1 is used as it is as the final evaluation value V1. That is, V1 = v
14 If V1 <V2, the full-width character candidate image is determined to be a character. If V1 ≧ V2, the half-width character candidate image is determined to be a character. This is because weighting is performed so that pixels that are as long as possible are evaluated and recognized.

【0035】図6の場合、半角文字候補画像c11の最
終評価値V1は37であり、全角文字候補画像c21の
最終評価値 V2は67であり、V1<V2なので、全
角文字候補画像c21が文字であると判断され、文字コ
ード「昭」が認識結果となる。以上のように1文字の認
識結果が確定したら、以下、順次隣接するサブ文字要素
について同様の処理を繰り返し、認識結果として、図中
文字コード欄にて太枠で表示した「昭和35年」が得ら
れる。この様子を図6に示す。なお、文字候補生成部6
において、半角文字候補画像c11と全角文字候補画像
c21とが一致する場合には、他の認識のための処理を
行わないまま全角文字とする。
In the case of FIG. 6, the final evaluation value V1 of the half-width character candidate image c11 is 37, the final evaluation value V2 of the full-width character candidate image c21 is 67, and V1 <V2. And the character code “Aki” is the recognition result. After the recognition result of one character is confirmed as described above, the same process is repeated for the sub-character elements that are successively adjacent to each other. As a recognition result, "Showa 35" displayed in a bold frame in the character code column in the figure is can get. This state is shown in FIG. The character candidate generation unit 6
In the case where the half-width character candidate image c11 and the full-width character candidate image c21 match each other, the full-width character is obtained without performing other recognition processing.

【0036】文字列の全ての文字に対して認識結果が確
定したならば、余白追加部9で、余白の有無を判定し、
余白が検出された場合には、出力文字コード中の対応す
る位置に余白を挿入する。この処理を図7を参照しつつ
説明する。本図において、(a)は図3、図5の(a)
に相当するものであり、(b)は説明のため追加したも
のである。認識結果評価部8で文字とされた各文字候補
画像ci(i=1,2,…)と表し、全角文字には*を
付している。余白追加部9では、認識結果評価部8で文
字とされた各文字候補画像ciについて、次の文字候補
画像ci+1との文字列方向の中点間距離diを順次計
算し、中点間距離から次のようにして、余白の有無を判
定する。ここで、Pは文字印字ピッチであり、ε1,ε
2,ε3は、それぞれ1.0,0.75,0.5程度の
定数である。ただし、具体的な値は、印刷内容に応じて
他の値が採用される。
When the recognition result is confirmed for all the characters in the character string, the margin adding section 9 determines whether or not there is a margin.
When the blank space is detected, the blank space is inserted at the corresponding position in the output character code. This process will be described with reference to FIG. In this figure, (a) is (a) of FIG. 3 and FIG.
(B) is added for explanation. It is represented as each character candidate image ci (i = 1, 2, ...) Characterized by the recognition result evaluation unit 8, and double-byte characters are marked with *. The margin adding unit 9 sequentially calculates, for each of the character candidate images ci that have been recognized as characters by the recognition result evaluation unit 8, a midpoint distance di between the next character candidate image ci + 1 and the character string in the character string direction. The presence / absence of a margin is determined as follows. Where P is the character print pitch, and ε1, ε
2 and ε3 are constants of about 1.0, 0.75, and 0.5, respectively. However, as the specific value, another value is adopted according to the print content.

【0037】1.文字ci,ci+1共に全角文字の場
合、di>ε1・Pならば、文字ci,ci+1間は余
白である。 2.文字ci,ci+1の一方が全角文字、他方が半角
文字の場合、di>ε2・Pならば、文字ci,ci+
1間は余白である。 3.文字ci,ci+1共に半角文字の場合、di>ε
3・Pならば、文字ci,ci+1間は余白である。
1. When both characters ci and ci + 1 are full-width characters, if di> ε1 · P, there is a space between the characters ci and ci + 1. 2. When one of the characters ci and ci + 1 is a full-width character and the other is a half-width character, if di> ε2 · P, the characters ci and ci +
There is a blank space between areas 1. 3. When both characters ci and ci + 1 are half-width characters, di> ε
If it is 3.P, there is a blank space between the characters ci and ci + 1.

【0038】4.上記以外の場合、ci,ci+1間は
余白ではない。 図7の(a)では、全角文字c5*と半角文字c6の中
点間距離d5>ε2×Pなので、認識結果の5文字めと
6文字めの間に余白コードを挿入する。一方、図7の
(b)では、文字c1*とc2*の間の余白の幅は広い
が、両文字とも全角文字なので、中点間距離d1<ε1
×Pであり、余白ではないと判断する。 (第2実施例)本発明の第2実施例の基本的構成は、先
の第1実施例と同じである。このため、本実施例は全体
の構成図をもとに各部の構成、作用等を説明するのは省
略し、固有の部分についてのみ、その原理、目的、構
成、作用、効果を説明する。原理について。
4. In cases other than the above, there is no margin between ci and ci + 1. In (a) of FIG. 7, since the distance d5> ε2 × P between the middle points of the full-width character c5 * and the half-width character c6, a blank space code is inserted between the fifth and sixth characters of the recognition result. On the other hand, in FIG. 7B, the width of the margin between the characters c1 * and c2 * is wide, but since both characters are full-width characters, the distance d1 <ε1 between the midpoints.
XP, and it is determined that the margin is not present. (Second Embodiment) The basic construction of the second embodiment of the present invention is the same as that of the first embodiment. Therefore, in the present embodiment, description of the configuration, action, etc. of each part will be omitted based on the overall configuration diagram, and the principle, purpose, configuration, action, effect of only the unique part will be described. About the principle.

【0039】通常印刷された文書では、文字は全角か半
角かのいずれか一方のみが使用されるのが普通である。
また、たとえ両方のタイプの文字が併用されても、全
角、半角のいずれか一方が主であり、他方のタイプの文
字は例外的に使用されるのがほとんどである。また、例
外的に他方のタイプの文字が使用される場合には、この
例外的な文字が連続して使用されることがほとんどであ
る。従って、ある文字について、これが全角か半角かを
判定する際に、その前後に既に判定された文字が存在す
るならば、これを判定に利用できる。目的について。
In a normally printed document, it is common to use only one full-width or one half-width character.
Further, even if both types of characters are used together, one of full-width and half-width is predominant, and the other type of characters is used exceptionally. In addition, when the other type of character is used exceptionally, this exceptional character is used continuously in most cases. Therefore, when deciding whether this is a full-width or half-width for a certain character, if there are already determined characters before and after that, this can be used for the determination. About the purpose.

【0040】文字の認識速度を向上させ、また半角文字
認識辞書と全角文字認識辞書を一層有効に活用するだけ
でなく、異なるタイプの文字で印刷されている部分は、
他の部分と別に、あるいは独立して翻訳等の対象とする
ことによりシステム全体としての性能を向上させる。構
成について。
Not only is the character recognition speed improved and the half-width character recognition dictionary and the full-width character recognition dictionary are used more effectively, but the portions printed with different types of characters are:
The performance of the system as a whole is improved by subjecting it to translation or the like separately from other parts or independently. About the configuration.

【0041】当初若しくは文の最初は、請求項1から請
求項6の発明に係る第1実施例の構成要素(要件)で文
字のタイプの判定を行い、幾つかの文字のタイプの判定
確定後は、後に続く文字は一応判定済の文字と同じタイ
プと仮判断して全角文字認識辞書若しくは半角文字認識
辞書の一方のみを使用して文字認識を行う。もし、認識
不能の文字がでてくれば、他方の辞書を使用して文字認
識を行う。それでも認識不能ならば、もとの第1実施例
と同じ構成要素(要件)で文字の判定を行う。併せて、
この旨を使用者に注意喚起する。効果について。
At the beginning or at the beginning of the sentence, the character type is judged by the constituent elements (requirements) of the first embodiment according to the inventions of claims 1 to 6, and after the judgment of several character types is confirmed. Tentatively determines that the following character is of the same type as the character that has already been determined, and performs character recognition using only one of the full-width character recognition dictionary and the half-width character recognition dictionary. If unrecognizable characters appear, character recognition is performed using the other dictionary. If it is still unrecognizable, the characters are determined by the same constituent elements (requirements) as in the first embodiment. together,
This is called to the user's attention. About the effect.

【0042】目的の裏返しであり、文字のタイプの判
定、文字認識のみならず、システム全体の性能向上とな
る。以上、本発明を実施例に基づいて説明してきたが、
本発明は上記実施例に限定されないのは勿論である。す
なわち、以下のようなものも本発明に含まれる。
This is an inside-out of the purpose, and not only the type of the character is judged and the character is recognized, but the performance of the entire system is improved. The present invention has been described above based on the embodiments,
Needless to say, the present invention is not limited to the above embodiment. That is, the following is also included in the present invention.

【0043】(1)製造等の都合で、特許請求の範囲に
記載した1の構成要素(要件、ステップ)を複数のもの
としている。逆に、複数のものを1としている。あるい
は、これらを適宜組み合わせている。 (2)画像切出し手段は、取出し、装着可能のフロッピ
ーディスク等の記憶部を内蔵した上で、他の手段と別体
のものとされている。
(1) For convenience of manufacturing, one constituent element (requirement, step) described in the claims is plural. On the contrary, a plurality of items are set to 1. Alternatively, these are appropriately combined. (2) The image cutting-out means has a built-in storage unit such as a floppy disk that can be taken out and mounted, and is separate from other means.

【0044】また、別体の他の手段はこの記憶部を取出
し、装着可能としている。同じく、出力部はフロッピー
ディスク等に出力するものとする。これにより、携帯性
の向上、高価な文字認識部本体や印字部の有効活用や他
の機器等との併用を図る。 (3)認識対象の文字は、漢字とアラビア数字に限定さ
れず、仮字(仮名)、ハングル文字、アルファベットあ
るいはこれらと漢字からなるものや「=」等の記号とし
ている。勿論、各種記号をも含む。
The other storage means can take out the storage part and mount it. Similarly, the output section outputs to a floppy disk or the like. As a result, the portability is improved, the expensive character recognition unit body and the printing unit are effectively used, and they are used together with other devices. (3) Characters to be recognized are not limited to Kanji and Arabic numerals, and they may be Kana (Kana), Hangul characters, alphabets, or a combination of these and Kanji, or a symbol such as "=". Of course, it also includes various symbols.

【0045】(4)文字の記載順序は、左横書き、右横
書き、上下方向のいずれか一に限定されないだけでな
く、この旨を使用者があらかじめ入力可能な機能をも有
している。また、上下方向の場合には、左から右、右か
ら左への2種があるが、これについても同様である。
(4) The writing order of characters is not limited to any one of left horizontal writing, right horizontal writing, and vertical direction, and the user also has a function to input this in advance. Further, in the case of the vertical direction, there are two types from left to right and right to left, and this is also the same.

【0046】(5)β1、β2、ζ1、ζ2、γ等の各
定数は、処理文書の文字、内容を視認した使用者が、新
聞、論文集、特許出願の明細書等のその文書の種類や視
感による大体の推測であらかじめ入力することが可能、
また一応の認識結果をみて変更、修正可能とする機能が
付加されている。 (6)同じく、読み取られる前の用紙上の文字の該当す
る部分にアンダーラインや上下の線等を所定のマーカー
で印を付すことにより、装置側に半角文字や特殊な記号
の位置等を入力可能とする機能が付加されている。これ
は視力障害者や学童に対する新聞の音読システムや特殊
な記号の多く使用される分野での外国語論文の翻訳シス
テムに採用すると有効であろう。
(5) The constants β1, β2, ζ1, ζ2, γ, etc., are the types of documents such as newspapers, collections of papers, specifications of patent applications, etc., by the user who visually recognizes the characters and contents of the processed document. It is possible to input in advance by making a rough guess based on
In addition, a function is added that allows the user to change or correct the temporary recognition result. (6) Similarly, the underline or upper and lower lines are marked with a predetermined marker on the corresponding part of the character on the sheet before being read, and the position of half-width characters or special symbols is input on the device side. The function that enables it is added. This may be useful when applied to the reading system of newspapers for the visually impaired and school children, and the translation system of foreign language articles in fields where special symbols are often used.

【0047】(7)翻訳システム等システム全体が翻訳
がうまくなしえないこと等を検知し、あるいは使用者が
文字認識結果の誤りが多いのを知得し、これをもとに文
字認識装置が各種定数を自動的に若しくは指示により変
更することにより、認識処理の修正、学習を行う機能が
付加されている。 (8)文字認識に際しての評価手法あるいは認識手段そ
のものは、辞書とのパターン認識に限定されず、決定木
法(特願平5−68586号「決定木型文字認識装
置」)等他のものを採用している。
(7) The translation system or the like detects that the whole system cannot translate well, or the user knows that there are many errors in the character recognition results. A function for correcting and learning the recognition process is added by changing various constants automatically or by an instruction. (8) The evaluation method or the recognition means itself for character recognition is not limited to pattern recognition with a dictionary, and other methods such as the decision tree method (Japanese Patent Application No. 5-68586 “Decision tree type character recognition device”) may be used. It is adopted.

【0048】(9)全角文字中の分割した文字要素の一
方が半角文字としての照合の結果あるいはそれ以前に正
投象影長から半角文字を構成しないと判断される場合
(例えば、図3(c)における昭(S1、S2))に
は、全角文字と判断する機能が付加されている。逆に、
半角文字中に半角文字として照合の結果あるいはそれ以
前に正投影長から半角文字でないと判断される場合(例
えば、図3(c)における日(S10)。)には、全角
文字と判断する機能が付加されている。
(9) When one of the divided character elements in the full-width character is determined not to form a half-width character from the result of collation as a half-width character or before that, from the normal projection shadow length (for example, FIG. A) (S1, S2)) in c) is provided with a function for determining a full-width character. vice versa,
When it is determined that the half-width character is not a half-width character based on the result of collation as a half-width character or before the orthographic projection length (for example, the day (S10) in FIG. 3C), it is determined to be a full-width character. Has been added.

【0049】なお、これらの本機能は請求項7若しくは
請求項8の機能と組み合わせた場合に、その効果が増大
する。 (10)欧米系の文書では、各単語間に余白を設けた上
で、行の両端に文字がくるようにその余白を調整してい
る。従って、文字間でなく単語間の余白については、こ
れに対処しえる機能を付加されていてもよい。
When these functions are combined with the functions of claim 7 or claim 8, the effect is increased. (10) In European and American documents, a blank space is provided between each word, and the blank space is adjusted so that characters are placed at both ends of a line. Therefore, with respect to the blank space between words instead of between characters, a function capable of coping with this may be added.

【0050】[0050]

【発明の効果】以上説明してきたように本発明は、抽出
した文字要素を一旦半角幅に分割する文字要素分割部
と、分割した文字要素を接続し、半角文字候補画像と全
角文字候補画像を切り出す文字候補生成部と、半角文字
候補画像と全角文字候補画像の各々を認識し、その評価
値の高い方を正しい文字として選択する認識結果評価部
とを設けている。このため、各文字につき、半角文字候
補画像の認識と全角文字候補画像の認識という高々2回
の認識を行うことで、全角と半角混じりに印字された文
書や不定ピッチの文書に対しても、正確に文字切り出し
を行うことが可能となる。更に、和文中の英文、独文や
その逆、注意喚起のために半角文字からなる文書に使用
された全角文字等は連続して使用されることが多いのに
注目して文字の切り出しを行うことが可能となる。ひい
ては、長く数の多い文字を認識対象としつつ、文字のタ
イプの変更等に柔軟に対応しえることとなる。従って、
正確な文字認識がなされる。また、その文字が全角文字
であるか半角文字であるかの判断が可能なため、余白の
正確な検出が可能となる。
As described above, according to the present invention, a character element dividing unit that temporarily divides an extracted character element into half-width characters is connected to the divided character element, and a half-width character candidate image and a full-width character candidate image are combined. A character candidate generation unit for cutting out and a recognition result evaluation unit for recognizing each of the half-width character candidate image and the full-width character candidate image and selecting the one having a higher evaluation value as a correct character are provided. Therefore, for each character, recognition is performed at most twice, that is, recognition of a half-width character candidate image and recognition of a full-width character candidate image, so that even a document printed in a mixture of full-width and half-width or a document with an irregular pitch can be recognized. It is possible to cut out characters accurately. Furthermore, the characters are cut out while paying attention to the fact that English characters in Japanese, German sentences and vice versa, and double-byte characters used for documents consisting of single-byte characters to call attention are often used consecutively. It becomes possible. As a result, it becomes possible to flexibly deal with the change of the character type and the like while recognizing long and many characters. Therefore,
Accurate character recognition is performed. Further, since it is possible to determine whether the character is a full-width character or a half-width character, it is possible to accurately detect the margin.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例の文字認識装置の構成図であ
る。
FIG. 1 is a configuration diagram of a character recognition device according to an embodiment of the present invention.

【図2】入力文書画像の例である。FIG. 2 is an example of an input document image.

【図3】文字要素抽出処理を説明するための図である。FIG. 3 is a diagram for explaining a character element extraction process.

【図4】文字幅算出処理を説明するための図である。FIG. 4 is a diagram for explaining a character width calculation process.

【図5】文字要素分割処理を説明するための図である。FIG. 5 is a diagram for explaining character element division processing.

【図6】候補文字画像生成処理および認識処理および認
識結果評価処理を説明するための図である。
FIG. 6 is a diagram for explaining candidate character image generation processing, recognition processing, and recognition result evaluation processing.

【図7】余白追加処理を説明するための図である。FIG. 7 is a diagram illustrating a margin adding process.

【符号の説明】[Explanation of symbols]

1 画像入力部 2 文字列抽出部 3 文字要素抽出部 4 文字幅算出部 5 文字要素分割部 6 候補文字画像生成部 7 認識部 8 認識結果評価部 9 余白追加部 10 認識結果出力部 DESCRIPTION OF SYMBOLS 1 image input section 2 character string extraction section 3 character element extraction section 4 character width calculation section 5 character element division section 6 candidate character image generation section 7 recognition section 8 recognition result evaluation section 9 margin addition section 10 recognition result output section

フロントページの続き (72)発明者 江村 里志 大阪府門真市大字門真1006番地 松下電器 産業株式会社内Continuation of the front page (72) Inventor Satoshi Emura 1006 Kadoma, Kadoma City, Osaka Prefecture Matsushita Electric Industrial Co., Ltd.

Claims (9)

【特許請求の範囲】[Claims] 【請求項1】 入力された文書画像から文字列画像を切
り出し、次に各文字列画像から更に個々の文字画像を切
り出し、この上で個々の文字画像を認識して該当する文
字コードに変換する文字認識装置において、 前記文字列画像から文字を構成する画素の塊である文字
要素を抽出する文字要素抽出部と、 前記文字要素抽出部で抽出された文字要素の位置あるい
は大きさから全角文字の幅および半角文字の幅を所定の
手段で算出する文字幅算出部と、 前記文字要素抽出部で抽出された文字要素のうち前記文
字幅算出部で算出した半角文字幅より幅の狭い文字要素
があればこれを検出してそのままサブ文字要素とし、半
角文字幅より幅の広い文字要素があればこれを検出して
個々の幅が半角文字幅以下の複数のサブ文字要素に分割
する文字要素分割部と、 前記文字要素分割部で生成されたサブ文字要素に対し、
前後の文字列の文字要素若しくはサブ文字要素と単一の
文字を構成するものとみなして接続して認識対象とした
後の幅が前記半角文字幅を越えない範囲で可能な限り幅
広くなるように接続して切り出される文字要素画像を半
角文字候補画像とし、接続後の幅が前記全角文字幅を越
えない範囲で可能な限り幅広くなるように接続して切り
出される文字要素画像を全角文字候補画像として切り出
す文字候補生成部と、 前記文字候補生成部で生成された半角文字候補画像及び
全角文字候補画像を一旦単一の文字として仮認識し、該
当する文字コードおよび正確性を示す評価値を算出する
認識部と、 前記認識部で半角文字候補画像及び全角文字候補画像に
対して得られた評価値を所定の関数に代入して比較し、
その結果の評価値の高い方の文字候補画像を正しい文字
と判断する認識結果評価部とを備えたことを特徴とする
文字認識装置。
1. A character string image is cut out from an input document image, and then individual character images are further cut out from each character string image, on which individual character images are recognized and converted into corresponding character codes. In the character recognition device, a character element extraction unit that extracts a character element that is a group of pixels forming a character from the character string image, and a full-width character from the position or size of the character element extracted by the character element extraction unit. A character width calculation unit that calculates the width and the width of half-width characters by a predetermined means, and a character element that is narrower than the half-width character width calculated by the character width calculation unit among the character elements extracted by the character element extraction unit. If there is a character element with a width wider than the half-width character and it is detected as it is, it is detected as it is and the character element is divided into multiple sub-character elements whose individual width is equal to or less than the half-width character width. For the split part and the sub-character elements generated by the character element splitting part,
Make the width as wide as possible within the range not exceeding the above-mentioned half-width character width, assuming that the character elements or sub-character elements of the preceding and following character strings are regarded as constituting a single character and are connected and recognized. The character element image that is cut out by connection is set as a half-width character candidate image, and the character element image that is cut out by connection is set as wide as possible within a range that does not exceed the full-width character width as a full-width character candidate image. The character candidate generation unit to be cut out, and the half-width character candidate image and the full-width character candidate image generated by the character candidate generation unit are temporarily recognized as a single character, and a corresponding character code and an evaluation value indicating accuracy are calculated. A recognition unit, and the evaluation value obtained for the half-width character candidate image and the full-width character candidate image in the recognition unit is substituted into a predetermined function and compared,
A character recognition device, comprising: a recognition result evaluation unit that determines a character candidate image having a higher evaluation value as a result to be a correct character.
【請求項2】 前記文字幅算出部は、 文字要素の位置あるいは大きさから文字印字ピッチを計
算し、その計算結果から全角文字の幅および半角文字の
幅を算出する文字印字ピッチ計算手段を有していること
を特徴とする請求項1記載の文字認識装置。
2. The character width calculation unit has a character print pitch calculation means for calculating a character print pitch from the position or size of a character element and calculating the full-width character width and the half-width character width from the calculation result. The character recognition device according to claim 1, wherein:
【請求項3】 前記文字幅算出部は、 文字列画像の高さから仮文字幅を計算する仮文字幅計算
手段と、 前記文字要素抽出部で抽出された文字要素の内、文字要
素の幅と仮文字幅との誤差が所定の値よりも小さい文字
要素が連続する部分を検出する連続部検出手段と、 検出された連続する文字要素の文字列方向の中点間距離
から文字の印字ピッチを計算し、その計算結果から全角
文字の幅および半角文字の幅を算出する算出手段とを有
していることを特徴とする請求項1記載の文字認識装
置。
3. The character width calculation unit calculates a temporary character width from the height of a character string image, and a width of a character element among the character elements extracted by the character element extraction unit. And the temporary character width have an error smaller than a predetermined value. A continuous portion detecting means for detecting a continuous portion of character elements, and a character printing pitch from the distance between the midpoints in the character string direction of the detected consecutive character elements. 2. The character recognition device according to claim 1, further comprising: a calculation unit that calculates the width of the full-width character and the width of the half-width character from the calculation result.
【請求項4】 前記文字幅算出部は、 文字列画像の高さから仮文字幅を計算する仮文字幅計算
手段と、 計算された仮文字幅より幅の小さい文字要素が連続する
場合には、幅が仮文字幅を越えない範囲で該文字要素を
仮に接続し、その仮接続した文字要素および元来の文字
要素の幅と仮文字幅との誤差を求め、これらの値が所定
の値よりも小さい文字要素が連続する部分を検出する連
続部検出手段と、 前記連続部検出手段で検出された連続する部分の文字要
素の文字列方向の中点間距離から文字印字ピッチを計算
し、その計算結果から全角文字の幅および半角文字の幅
を算出する算出手段とを有していることを特徴とする請
求項1記載の文字認識装置。
4. The character width calculation unit calculates a temporary character width from the height of a character string image, and a temporary character width calculation means, and when a character element having a width smaller than the calculated temporary character width is continuous. , The character elements are temporarily connected within a range that does not exceed the temporary character width, the error between the width of the temporarily connected character element and the original character element and the temporary character width is calculated, and these values are set to predetermined values. A continuous portion detecting means for detecting a portion where a smaller character element is continuous, and a character printing pitch is calculated from the distance between the midpoints in the character string direction of the character elements of the continuous portion detected by the continuous portion detecting means, The character recognition device according to claim 1, further comprising a calculating unit that calculates a width of the full-width character and a width of the half-width character from the calculation result.
【請求項5】 前記認識部は、 前記文字候補生成部で生成された半角文字候補画像を認
識するのに使用する半角文字認識辞書と、 前記文字候補生成部で生成された全角文字候補画像を認
識するのに使用する全角文字認識辞書とを有しているこ
とを特徴とする請求項1、請求項2、請求項3、若しく
は請求項4記載の文字認識装置。
5. The recognition unit includes a half-width character recognition dictionary used for recognizing the half-width character candidate image generated by the character candidate generation unit, and a full-width character candidate image generated by the character candidate generation unit. The character recognition device according to claim 1, 2, 3, or 4, further comprising a full-width character recognition dictionary used for recognition.
【請求項6】 前記認識部は、 全角文字候補画像の認識結果が、単一の文字の文字列方
向に分割した半分が半角1文字と同形の文字となるか否
かを判断する半分文字判断手段と、 前記半分文字判断手段にてそのような文字と判断された
ならば前記認識結果評価部における評価に際して全角文
字候補画像の評価値を優先させる優先評価手段とを有し
ていることを特徴とする請求項1、請求項2、請求項
3、請求項4若しくは請求項5記載の文字認識装置。
6. The half-character determination unit determines whether the recognition result of a full-width character candidate image is such that half of a single character divided in the character string direction has the same shape as one half-width character. And a priority evaluation unit that prioritizes the evaluation value of the full-width character candidate image when the recognition result evaluation unit evaluates the character if the half-character determination unit determines that the character is such a character. The character recognition device according to claim 1, claim 2, claim 3, claim 4, or claim 5.
【請求項7】 文字認識装置が文字のタイプが全角文字
か半角文字かを判断するに際して、その直前に認識対象
とされた文字と同じタイプであると仮判断した上で文字
認識を行い、若し該当する文字が存在しないと判断され
た場合には、逆の文字タイプであると判断して文字認識
を行うよう制御する全半角仮判断制御部を有しているこ
とを特徴とする請求項1、請求項2、請求項3、請求項
4、請求項5若しくは請求項6記載の文字認識装置。
7. The character recognition device, when judging whether the character type is a full-width character or a half-width character, performs a character recognition after tentatively determining that the character type is the same as the character to be recognized immediately before. However, when it is determined that the corresponding character does not exist, it has a full-width half-width tentative determination control unit that controls to perform character recognition by determining that the character type is opposite. The character recognition device according to claim 1, claim 2, claim 3, claim 4, claim 5, or claim 6.
【請求項8】 文字認識装置が文字のタイプが全角文字
か半角文字かを判断するに際して、その前後所定字数以
内の文字に既に全角か半角かの認識が終了した文字が存
在するならば、これを判断資料とするよう制御する全半
角判断制御部を有していることを特徴とする請求項1、
請求項2、請求項3、請求項4、請求項5若しくは請求
項6記載の文字認識装置。
8. When the character recognition device determines whether the type of a character is a full-width character or a half-width character, if a character within a predetermined number of characters before and after that character has already been recognized as a full-width or half-width character, this 2. A full-width half-width judgment control unit for controlling so as to use as a judgment material.
The character recognition device according to claim 2, claim 3, claim 4, claim 5, or claim 6.
【請求項9】 前記認識結果評価部で単一の文字と判断
された各文字画像について、各文字が全角文字、半角文
字のいずれであるかと相連続する2文字の文字列方向の
中点間隔とから文字間余白を検出する余白検出部と、 前記余白検出部の検出結果をもとに前記出力文字コード
中の対応する位置に余白コードを挿入する余白追加部と
を有していることを特徴とする請求項1、請求項2、請
求項3、請求項4、請求項5、請求項6、請求項7若し
くは請求項8記載の文字認識装置。
9. A midpoint interval between two character strings in the character string direction, which are continuous with respect to whether each character is a full-width character or a half-width character for each character image determined by the recognition result evaluation unit to be a single character. A blank space detection unit that detects a space between characters and a blank space addition unit that inserts a blank space code at a corresponding position in the output character code based on a detection result of the blank space detection unit. The character recognition device according to claim 1, claim 2, claim 3, claim 4, claim 5, claim 6, claim 7, or claim 8, which is characterized.
JP05736494A 1994-03-28 1994-03-28 Character recognition device Expired - Fee Related JP3236732B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP05736494A JP3236732B2 (en) 1994-03-28 1994-03-28 Character recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP05736494A JP3236732B2 (en) 1994-03-28 1994-03-28 Character recognition device

Publications (2)

Publication Number Publication Date
JPH07271911A true JPH07271911A (en) 1995-10-20
JP3236732B2 JP3236732B2 (en) 2001-12-10

Family

ID=13053535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP05736494A Expired - Fee Related JP3236732B2 (en) 1994-03-28 1994-03-28 Character recognition device

Country Status (1)

Country Link
JP (1) JP3236732B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154632A2 (en) 2008-08-11 2010-02-17 Omron Corporation Character recognition device, program and method
JP2014535101A (en) * 2011-11-21 2014-12-25 ノキア コーポレイション Method and apparatus for facilitating detection of text in an image

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154632A2 (en) 2008-08-11 2010-02-17 Omron Corporation Character recognition device, program and method
JP2014535101A (en) * 2011-11-21 2014-12-25 ノキア コーポレイション Method and apparatus for facilitating detection of text in an image

Also Published As

Publication number Publication date
JP3236732B2 (en) 2001-12-10

Similar Documents

Publication Publication Date Title
US5664027A (en) Methods and apparatus for inferring orientation of lines of text
EP0844583B1 (en) Method and apparatus for character recognition
JPS61502495A (en) Cryptographic analysis device
JPH05307638A (en) Method for converting bit map image document into encoded data
JPH0684006A (en) Method of online handwritten character recognition
Romeo-Pakker et al. A new approach for Latin/Arabic character segmentation
JP2000315247A (en) Character recognizing device
JPH07271915A (en) Text recognition by predicted synthetic shape
JPH07271911A (en) Character recognizing device
Spitz Multilingual document recognition
JP3274014B2 (en) Character recognition device and character recognition method
Suchenwirth et al. Optical recognition of Chinese characters
JP2915175B2 (en) Word space detection method
JP3537570B2 (en) Space detection method for Japanese-English mixed documents, pitch format determination method, and space detection method for fixed-pitch alphanumeric character strings
CN115410207B (en) Detection method and device for vertical text
Spitz Tilting at windmills: Adventures in attempting to reconstruct Don Quixote
Durrani et al. A New Architecture for Brailee Transcription from Optically Recognized Indian Languages
JP3111522B2 (en) Recognition character correction method
Hussain et al. PAN localization: A study on collation of languages from developing Asia
JPH0290384A (en) Post-processing system for character recognizing device
Negi et al. Issues of document engineering in the Indian context
Negi et al. Issues of Document Engineering in Indian Scripts and Telugu as a Case Study
JPH01171080A (en) Recognizing device for error automatically correcting character
JPH08297720A (en) General document reader
Sugawara Document Reader for the Visually Disabled

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees