JPH01209586A

JPH01209586A - 倍角文字・半角文字混在文章の文字認識方式

Info

Publication number: JPH01209586A
Application number: JP63034356A
Authority: JP
Inventors: Katsumi Tanaka; 克己田中
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1988-02-17
Filing date: 1988-02-17
Publication date: 1989-08-23

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［概要］読込んだ文章から個々の文字毎に文字の大きさを認識す
る倍角文字・半角文字混在文章の文字認ノル式に関し、切出した文字の大きさを正確に認識することを目的とし
、読込んだ文章が全角と倍角の混在文（モード１）か、又
は全角と半角の混在文（モード２）であるかを判別し、
モード１の場合には倍角文字のピッチを、モード２の場
合には全角文字のピッチをそれぞれ基準にして文字の切
出しを行い、切出した文字について、分離しているか分
離していないかを調べ、分離していた場合においてはモ
ード１の場合とモード２の場合とで所定の比較式を用い
て文字の大きさの認識を行うように構成する。

［産業上の利用分野］本発明は、読込んだ文章から個々の文字毎に文字の大き
さを認識する倍角文字・半角文字混在文章の文字認識方
式に関する。

原稿中に書かれた文章をイメージセンサ等で読取った文
章から文字を判読するために、先ず読取った文字の大き
さをｍＲ（判別）することが行われる。ところで、文章
は、全ての文字が同じ大きさで書かれているとは限らず
、又、１個の文字も例えば「発」のようにそれ自体分離
していない文字と、例えば「い」、［化］、「旧」のよ
うに１個の文字でも左右に分離している文字もある。従
って、このような文章から文字の大きさを正確に分離す
ることが重要となる。

［従来の技術］ワードプロセッサ等でｍかれた全角文字のピッチは全て
等しい。そこで、従来は文字を所定ピッチ毎に切出して
認識を行っている。

［発明が解決しようとする課題］しかしながら、書かれた文章は必ずしも全角文字だけで
はなく、倍角文字、半角文字が混在しているのが通常で
ある（特に全角文字と半角文字は混在している）。この
ように、倍角文字、半角文字等が混在している文章を単
純に同一ピッチで切出すと不具合が生じる。例えば、倍
角文字を全角文字のピッチで切出づことは不可能であり
、半角文字を切出す時には、分離した全角文字（例えば
「い」や［門］等）との区別が困難である。このような
場合には、いずれの場合にも正確な文字の切出しができ
ない。

本発明はこのような課題を解決するためになされたもの
であって、切出した文字の大きさを正確に認識すること
ができる倍角文字・半角文字混在文章の文字認識方式を
提供することを目的としている。

［課題を解決するための手段］第１図は、本発明方式の原理を示すフローチャートであ
る。本発明は、原稿中の文章を読取り、読取った文章中
の文字の大きさを認識する方式において、読込んだ文章が全角と倍角の混在文（モード１）か、又
は全角と半角の混在文（モード２）であるかを判別し、
モード１の場合には倍角文字のピッチを、モード２の場
合には全角文字のピッチをそれぞれ基準にして文字の切
出しを行い、切出した文字について、分離しているか分
離していないかを調べ、分離していた場合においてはモ
ード１の場合とモード２の場合とで所定の比較式を用い
て文字の大きさの認識を行うように構成する。

［作用］原稿上の文章は、行単位でみると全角と倍角が混在した
文章、全角と半角が混在した文章であることが多く、全
角９倍角、半角の３種が混在している例はまれである。

その理由は、倍角文字は文章の見出しに使われることが
多いことによる。そこで、読込んだ文章が全角と倍角の
混在文章か、又は全角と半角との混在文章であるかを判
別し、判別した文章毎に所定の文字認識アルゴリズムを
用いて文字の大きさの認識を行う。これにより、全ての
文字について、その大きさを正確に認識することができ
る。

［実施例］以下、図面を参照して本発明の実施例を詳細に説明する
。

第２図は、本発明方式の詳細を示す７０−チャートであ
る。以下、このフローチャートに沿って詳細に説明する
。先ず、原稿中の文章をイメージスキャナで読取る（ス
テップ１）。次に読取った文章を２値化する（ステップ
２）。ここで２１１１化とは読取ったアナログ信号を、
Ａ／Ｄ変換器等を用いてディジタルデータに変換するこ
とをいう。

ディジタルデータに変換された文章画像は、逐次メモリ
に格納される。メモリに格納されたデータから１行分の
文字行を切出す（ステップ３）。

切出した行について、行内垂直ヒストグラムにより行内
最大文字ピッチａを捜す（ステップ４）。

第３図は、行内最大文字ピッチ検出の説明図である。図
に示すような文字行があったものとする。

図の上方向から例えば光を当て、下方向にできた影から
文字のピッチを検出するものである。このようにして１
ｇられた最大ビッヂをａとする。次に読込んだ文章は全
角十倍角か、又は全角十半角であるかどうかを判定する
（ステップ５）。

先ず、判定の結果、全角と倍角の混在文であった場合に
ついて説明する。この場合には、先ず倍角文字の文字ピ
ッチ（ピッチａ）を基準にして切出しを行う（ステップ
６）。次に切出した文字が分離しているかどうかをチエ
ツクする（ステップ７）。分離していなかった場合には
、１個の倍角であることは間違いないので、倍角文字と
判定する（ステップ８）。分離している場合には、例え
ば「門」のように左右が分離した倍角文字である場合と
、「えおＪのように全角文字゛２文字の場合がある。こ
れらの判定は、以下に示すようなアルゴリズムにより行
われる。

倍角文字ビッヂをａ９分離部分のピッチをそれぞれｂ、
ｃとする（ステップ９）。゛第４図は、倍角と全角混在
文章の文字切出しの説明図である。

ここで、ａ＞ｂ＋ｃであるかどうかをチエツクする（ステップ１
０）。チエツクの結果、そうである場合には切出し文字
は倍角であると判定しくステップ１１）、そうでない場
合には切出し文字は全角の２文字であると判定する（ス
テップ１２）。

ａ＞ｂ＋ｃである場合には倍角文字と判定する理由につ
いて説明する。例えば、第４因の「い」について説明す
ると、分離部分すとＣはピッチａ内に必ず含まれる。従
って、ｂ＋ｃはｂとＣの間にあいた隙間弁だけａよりも
短いことになる。よって、切出し文字が倍角文字の場合
にはａ＞ｂ＋Ｃが必ず成り立つことになる。

次にａ＜ｂ＋Ｃである場合には全角文字２文字と判定す
る理由について説明する。例えば第４図の「えお」につ
いて説明すると、分離部分すとＣはそれぞれが１個の文
字であり、その個々のピッチは比較的大きい。従って、
この場合には必ずａ＜ｂ＋ｃが成立する。

なお、行内文字列は必ずしも第４図に示すような場合だ
けとは限らず、第５図に示すようにその先頭が全角１文
字の場合もある。この場合には、「口あ」で切出しく口
は全角のスベ・ニスを表す）、前述のアルゴリズムを用
いるとよい。

次に、判定の結果、全角と半角の混在文であった場合に
ついて説明する。先ず、ステップ６の場合と同様にして
、全角文字の文字ピッチ（ピッチａ）を基準に切出しを
行い（ステップ１３）、切出した文字が分離しているか
どうかをチエツクする（ステップ１４）。チエツクの結
果、分離していた場合には全角文字であることに間違い
ないので、全角文字と判定する（ステップ１５）。分離
している場合には、例えば「門」のように左右が分離し
た全角文字である場合と、「えお」のように半角文字２
文字の場合がある。これらの判定は、以下に示すような
アルゴリズムにより行われる。

全角文字ピッチをａ０分離部分のピッチをそれぞれｂ、
ｃとする（ステップ１６）。第６図は、全角と半角混在
文章の文字切出しの説明図である。

ここで、ａ＞ｂ＋ｃであるかどうかをチエツクする（ステップ１
７）。チエツクの結果、そうである場合には切出し文字
は全角であると判定しくステップ１８）、そうでない場
合には切出し文字は半角の２文字であると判定する（ス
テップ１９）。

ａ＞ｂ＋ｃである場合には倍角文字と判定する理由及び
ａ＜ｂ＋ｃである場合には全角文字２文字と判定する理
由については、ステップ１０〜１２について説明したの
と同様であるので、その説明は省略する。また、この場
合にも第７図に示すように第５図の場合と同様に先頭が
半角の１文字の場合がある。この時の切出しも、前述の
場合と同様にして「ロア」の形で切出した後、同じアル
ゴリズムを用いて文字の認識を行う。

このようにして、読込んだ全ての文字についての大きさ
を認識処理が終了したら、入カバターンの拡大処理を行
う（ステップ２０）。

次に入カバターンの拡大処理について説明する。

切出した文字が何という文字であるかを最終的には判断
する必要がある。このため、切出した文字を予め用意し
ておいた標準パターンと比較することが行われる。この
標準パターンは、全角のＪＩＳコード文字全てに対応す
るが、従来、倍角及び半角に対応する標準パターンとい
うものはない。

この場合において、切出した文字の大きさ毎に標準パタ
ーンを持つものとすると、全角の標準パターンに加えて
倍角、半角用にそれぞれ標準パターンを持つ必要がある
。倍角、半角文字の標準パターンを作成することはデー
タｍも膨大になり、認識速度も低下する。しかも、極め
て人容最のメモリを用意する必要がある。このことは、
はぼ同様のパターンを３種類も用意することになり、い
かにも無駄である。そこで、本発明では、標準パターン
は全角用のものを１個用意し、倍角、半角もこの全角用
の標準パターンを使えるようにした。

先ず、第８図に示すように予め標準パターンのイメージ
を２×２の大きさに拡大して特徴間を抽出しておく。す
ると、入力文字パターンが全角文字の場合には第９図（
イ）に示すように縦横をそれぞれ２倍し、入力文字パタ
ーンが倍角文字の場合には（ロ）に示すように縦方向の
み２倍し、入力文字パターンが半角文字の場合には（ハ
）に示すように縦横をそれぞれ４倍する。この結果、拡
大されたパターンの大きさは全て第８図に示す拡大され
た標準フォーマットと等しくなり、パターン比較が可能
となる。

入カバターンの拡大処理が終わったら、この拡大パター
ンの特徴間を抽出しくステップ２１）、標準パターンと
のマツチングをとり（ステップ２２）、マツチングによ
りセレクトした候補文字を出力する（ステップ２３）。

このようにして出力された候補文字の認識率は９９％に
もなった。

第１０図は、本発明方式を実施するシステム構成図であ
る。図において、１は全体の制御動作を行うＣＰＬＪ、
２は原稿から文章を読取るイメージスキャナ、３は読取
った文章および拡大処理後のパターンを格納するメモリ
、４は読取った情報等を表示するデイスプレィ、５は最
終的に認識が終了した文字データを格納するディスク装
置、６はこれらを相互接続するバスである。イメージス
キャナ２で読込んだ画像は、−旦メモリ３に格納される
。ＣＰＵ１は、メモリ３に格納されている文字データを
行単位で読出し、読出した文章から文字を切出しその大
きさを認識する。次に認識した文字パターンを、メモリ
３に格納されている標準パターンと比較し、比較処理に
より決定した候補文字をディスク装置ｆ５に格納すると
共に、デイスプレィ４上に表示する。

第１１図は、本発明に基づく文字認ｍ装置の一実施例を
示す構成ブロック図である。イメージスキャナ１１で読
取った原稿情報は、ディジタルデータに変換された後、
イメージメモリ１２に格納される。文字切出し回路１３
は、イメージメモリ１２に格納されているデータから文
字１行分を切出して読込み、前述したようなアルゴリズ
ムを用いて１文字毎の大きさを認識する。

拡大特徴抽出回路１４は、文字切出し回路１３の出カバ
ターンを受けて、標準パターンに合わせた拡大処理を行
い、拡大されたパターンを出力する。同時にイメージメ
モリ１２にも格納する。マツチング回路１５は、拡大特
徴抽出回路１４の出力と、イメージメモリ１２に格納さ
れている標準パターンとを付き合わせてマツチングをと
る。そして、マツチングがとれたものについて、候補文
字として出力する。

第１２図は、拡大特徴抽出回路１４の一部であって、文
字の大きさを認識する比較演算回路の具体的構成例を示
す図である。前述の文字ピッチａ。

ｂ、ｃは、それぞれレジスタ２１Ａ、２１８．２１０に
格納される。これらレジスタ２１Ａ、２１Ｂ、２ＩＣに
格納されたデータは、セレクタ２２に入っている。比較
１路２３は、セレクタ２２からピッチデータａ、ｂ、ｃ
を順次受けて、ａとｂ十Ｃとの比較演算を行う。そして
、比較の結果に応じて、切出した文字が倍角文字である
か、全角文字であるか或いは半角文字であるかを出力す
る。

［発明の効果］以上、詳細に説明したように、本発明によれば読み込ん
だ文章を、■全角と倍角の混在文、■全角と半角の混在
文の２つに分類し、これら２つの文章について所定のア
ルゴリズムを用いることにより、切出した文字の大きさ
を正確１に認識することができる倍角文字・半角文字混
在文章の文字認識方式を提供することができる。

【図面の簡単な説明】

第１図は本発明方式の原理を示すフローヂャート、第２図は本発明方式の詳細を示すフローヂャート、第３図は行内最大文字ピッチ検出の説明図、第４図は倍
角と全角混在文章の文字切出しの説明図、第５図は先頭が全角１文字の場合の文字切出しの説明図
、第６図は全角と半角混在文章の文字切出しの説明図、第７図は先頭が半角１文字の場合の文字切出しの説明図
、第８図は標準パターンの拡大の説明図、第９図は入カバ
ターンの拡大の説明図、第１０図は本発明方式を実施す
るシステム構成゛図、第１１図は文字認識装置の一実施例を示す構成プロツク
図、第１２図は比較演算回路の具体的構成例を示す図である
。第１１図において、１１はイメージスキャナ、１２はイメージメモリ、１３は文字切出し回路、１４は拡大特徴抽出回路、１５はマツチング回路である。本発明方式の原理を示すフローチャート第１図Ｌ　　Ｌ　　　Ｉ　　ＩＪ繭４図角何ら　図第６図角■７図２×２拡大標章パターンの拡大の説用図第８図

Claims

【特許請求の範囲】

（１）原稿中の文章を読取り、読取つた文章中の文字の
大きさを認識する方式において、読込んだ文章が全角と倍角の混在文（モード１）か、又は全角と半角の混在文（モード２）である
かを判別し（ステップ［１］）、モード１の場合には倍
角文字のピッチを、モード２の場合には全角文字のピッチをそれぞれ基準に
して文字の切出しを行い（ステップ［２］）、切出した文字について、分離しているか分離していないかを調べ（ステップ［３］）、分離してい
た場合においてはモード１の場合とモード２の場合とで所定の比較式を用いて文字の大
きさの認識を行う（ステップ［４］）ようにしたことを
特徴とする倍角文字・半角文字混在文章の文字認識方式
。
（２）前記ステップ［４］において、モード１の場合に
おいては倍角文字ピッチを、モード２の場合においては
全角文字ピッチをそれぞれａとし、分離部分のピッチを
それぞれｂ、ｃとして、（モード１の場合）ａ＞ｂ＋ｃならば切出し文字は倍角ａ＜ｂ＋ｃならば切出し文字は全角の２文字（モード２
の場合）ａ＞ｂ＋ｃならば切出し文字は全角ａ＜ｂ＋ｃならば切出し文字は半角の２文字と認識する
ようにしたことを特徴とする請求項１記載の倍角文字・
半角文字混在文章の文字認識方式。