JPH0443476A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0443476A
JPH0443476A JP2150970A JP15097090A JPH0443476A JP H0443476 A JPH0443476 A JP H0443476A JP 2150970 A JP2150970 A JP 2150970A JP 15097090 A JP15097090 A JP 15097090A JP H0443476 A JPH0443476 A JP H0443476A
Authority
JP
Japan
Prior art keywords
character
size
rectangle
section
recognition device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2150970A
Other languages
English (en)
Inventor
Yujiro Kamimura
上村 裕二郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2150970A priority Critical patent/JPH0443476A/ja
Publication of JPH0443476A publication Critical patent/JPH0443476A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 差業上の利用分野 本発明は、新聞、雑誌などの活字、ドツト文字および手
書き文字を読み取り、入力された文字パターンをJIS
コードなどのコード情報などに変換する文字認識装置に
関する。
従来の技術 近年、文字認識装置がコンピュータなどの入力装置とし
て利用されるようになってきた。文書の清書システムと
して文字認識装置の利用を考慮すると、入力された文字
の大きさおよび位置の情報を確実に読み取シ保存してお
く必要が生じてくる。
以下に従来の文字認識装置について説明する。
第6図は従来の文字認識装置の機能ブロック図であシ、
構成要素として61は文字画像を入力する画像入力部、
62は入力された画像から認識文字パターンを矩形に切
り出す文字切り出し部、63は文字切シ出し部で切り出
された矩形の画像から特徴を抽出する特徴抽出部、64
は特徴の組合せと対応する文字コードとを対として記憶
した特徴辞書、66は特徴抽出部63で得られた特徴と
特徴辞書64の特徴を比較し、文字コードを決定する認
識部、66は認識部e6で得られた文字コードを出力す
る出力部である。
以上のように構成された従来の文字認識装置について、
以下構成要素のお互いの関連動作を第7図のフローチャ
ートを用いて説明する。
まず、ステップS71で画像入力部61に相描するスキ
ャナから文書画像を入力し、メモリに格納する。ステッ
プS72ではステップS71で入力した画像から、文字
切り出し部62にて文字行を1行切り出す。さらにステ
ップS73ではステップS73で切り出された文字行か
ら文字を1文字切り出す。ステップS74ではステップ
S73で切り出された1文字の画像から特徴抽出部63
により特徴を抽出する。ステップS75では、抽出され
た特徴と辞書の特徴を認識部66により比較し、文字を
決定する。ステップ576では決定した文字のコードを
出力部66より出力する。ステップS77では、1行中
の全ての文字の切り出しが終わったかどうかを調べ、終
わっていれば37Bへ進み、終わっていなければS83
に戻って処理を繰シ返す。ステップ87Bでは文書画像
中の全ての行の切シ出しが終わったかどうかを調べ、終
わっていなければ872に戻って処理を繰シ返し、終わ
っていれば処理を終了する。
発明が解決しようとする課題 しかしながら上記の従来の構成では、いろいろな大きさ
の文字が混存する文書を認識しても、得られる情報は文
字コードのみである。したがって、得られた情報から入
力画像に忠実な再現ができないという問題点を有してい
た。
本発明は上記問題に留意し、認識した文字のコードだけ
でなく、その大きさ位置の情報も出力される文字認識装
置を提供しようとするものである。
課題を解決するための手段 本発明は上記目的を達成するため、文字切り出し部で切
り出された矩形の辺の長さから文字サイズを決定する文
字サイズ決定部と、文字切り出し部で切り出された矩形
の位置から文字の位置を検出する文字位置検出部を備え
、認識パターンの文字サイズとその位置情報を出力する
出力手段を有する文字認識装置である。
作  用 上記構成の本発明の文字認識装置は、文字切り出し部で
切り出された矩形の辺の長さを検出し、その辺の長さか
ら、標準となる文字サイズを文字サイズ決定部で決定し
、この文字サイズ情報を出力するとともに、前述の切り
出された矩形の位置から文字の位置を文字位置検出部で
検出し、文字位置情報を出力するものである。すなわち
、文字サイズが大きい場合は、標準文字で記録したより
多くの行数が当然必要となるので、文字サイズとその文
字の位置情報を同時に出力することにより、原文書に近
いバランスの取れた文字配置がされた文書画像を得るこ
とができることになる。
実施例 第1図は本発明の一実施例における文字認識装置の機能
ブロック図を示すものである。第1図に示すように構成
要素として11は文字画像を入力する画像入力部、12
は入力された画像から認識文字パターンを矩形に切り出
す文字切り出し部、13は文字切り出し部12で切り出
された矩形の画像から特徴を抽出する特徴抽出部、14
は特徴の組合せと対応する文字コードとを対として記憶
した特徴辞書、15は特徴抽出部13で得られた特徴と
特徴辞書14の特徴を比較し、文字コードを決定する認
識部、16は文字切り出し部12で切り出された矩形の
位置から文字行の位置を検出する文字位置検出部、17
は字種ごとの外接矩形の大きさの平均を記憶した文字サ
イズ辞書、18は文字切り出し部12で切り出された矩
形の辺の長さから文字サイズを決定する文字サイズ決定
部、19は認識部15で得られた文字コードと文字サイ
ズ決定部18で決定された文字サイズおよび文字位置検
出部16で検出された文字位置を出力する文字情報出力
手段を構成する出力部である。
第2図は本実施例の文字認識装置の構成を示すブロック
図である。
第4図に示すように、構成要素として21は文字パター
ンを読み取るスキャナで画像入力部11に相当するもの
であり、読み取うた文字ノ9ターンをビットデータにし
て出力する。22はRAMでスキャナ21からのビット
データを文字切り出し部12によシ切り出し記憶する文
字パターン領域23、この文字パターン領域23内の文
字パターンを特徴抽出部13で解析して得られる特徴領
域24、特徴領域24に記憶された特徴から認識部で決
定される文字コード領域25、および処理で使用するレ
ジヌタ領域26を有する。27はROMで特徴とこれに
対応する文字コードを記憶した特徴辞書14を有する特
徴辞書領域28、字種ごとの外接矩形の大きさの平均を
記憶した文字サイズ辞書17を有する文字サイズ辞書領
域29、およびプログラム記憶領域30を有する。31
はプログラム記憶領域30に記憶された制御プログラム
にしたがって処理を行う出力部19を含む処理回路であ
る。32はデータを入力するキーボードであシ、33は
文字コード領域25に記憶された文字コードに対応する
文字を表示する表示部である。
第3図は文字サイズ辞書領域28に相当する文字サイズ
辞書の例である。この文字サイズ辞書17の縦の項目は
字種で、横の項目は文字はイズを決めるポイント数であ
る。辞書の数値は、各々の字種における各々のポイント
数の文字についてその外接矩形の長い方の辺(以下”長
辺”という)の長さの平均をとったものである。各々の
字種の同じ字種の文字であれば、矩形の長辺の長さがほ
とんど等しいという仮定に基づいて字種の項目分けを行
っている。しかし英小文字の場合は、a、C。
eとす、d、fなどのようにとくに矩形の長辺の長さに
違いが生じるため、本実施例では(小)と(大)の2種
の項目に細分している。
以上のように構成された本実施例の文字認識装置につい
て以下その構成要素のお互いの関連動作を第4図のフロ
ーチャートを用いて説明する。
ステップS41では画像入力部11に相当するスキャナ
21から文書画像を入力しメモリに格納する。ステップ
S42では文字切り出し部12によシ入力した文書画像
から文字行を15行切り出す。
ステップ343では文字位置検出部16により切り出し
た文字行の座標から文字行の位置を検出する。ステップ
S44では行に含まれる字数nおよび矩形の長辺の合計
Bを初期化する。ステップS45ではステップS42で
切り出した文字行から同じく文字切り呂し部12により
文字を1文字切り出す。ステップS46はステップS4
5で切り出した1文字の画像から特徴抽出部13により
特徴を抽出する。ステップS47では、抽出された特徴
と辞書の特徴を比較し、認識部16により文字を決定す
る。ステップ848では決定した文字のコードを出力す
る。ステップS49では認識結果が第3図に示した文字
サイズ辞書17の中の字種に含まれているかどうかを調
べ、含まれていればS50へ、含まれていなければ35
1へ進む。
ステップSSOではnに1を加算し、Sに矩形の長辺を
加算する。ステップS51では行に含まれる全ての矩形
について処理が終わったかどうかを調べ、終わっていな
ければS4sに戻って処理を繰り返し、終わっていれば
S52に進む。ステップS52でs/n  を計算する
ことにより、その行の矩形の長辺の平均が求まる(以下
ここで求めた平均を゛実際の平均″という)。
ステップS53では行の平均の文字サイズであるポイン
ト数を決定する。この行ポイント決定手段のステップの
詳細は後述する。ステップS54では文書画像中の全て
の行の切り出しが終わったかどうかを調べ、終わってい
なければ342に戻って処理を繰り返し、終わっていれ
ば処理を終了する。
つぎに第6図の行ポイント決定手段の手順を示すフロー
チャートを用いて1つの行に含まれる文字の平均のポイ
ント数を決定する文字サイズ決定部18の動作の1つで
ある手順について説明する。
ステップ5631でポイント数pK最小ポイント数を代
入し、ステップ5532では矩形の長辺の台形8を初期
化する。ステップ5533ではまず平仮名を対象字種と
する。ステップ5634ではその行に含まれる対象字種
の数(この場合平仮名の数)をmに代入する。ステップ
5536ではpポイント(スタートはまず7ポイントと
なる)の対象文種の大きさを辞書から調べてdに代入す
る。
ステップ5536ではBにm 、 dを加算する。ステ
ップ5637では全ての字種について処理が終ったかど
うかを調べ、終っていれば5539に進み、終っていな
ければ、ステップ8538で対象字種をつぎの字種に変
更して8532以下の処理を繰シ返す。ステップ563
9ではBをその行に含まれる字数で割シ、得られた値を
その行のpポイントの辞書平均とする。ステップ564
oでは実際の平均と辞書平均を比較し、実際の平均が小
さければ5642へ進み、実際の平均が大きければステ
ップ5541でポイント数を増加させ、8532以下の
処理を繰り返す。ステップ5642ではpとp −1ポ
イントの辞書平均の内、実際の平均に近い方を求め、そ
のときのpあるいはp−1をその行のポイント数とする
このように、行単位で文字の大きさを比較し、ステップ
S52で求められた、認識した原稿の行単位の文字サイ
ズの平均である実際の平均(s/n)が大きい場合は、
その大きさに近づくまで、ステップ5532からステッ
プ5641を繰り返すのである。これによυ、見出しな
どで大きなサイズの文字を用いている場合は、それに近
い文字サイズが行単位で再現されることになる。この場
合に轟然この大きなサイズの文字が専有する行数は多く
なるので、文字位置検出部16より文字位置情報をあわ
せて出力し、文字サイズと文字位置が正確に認識される
ことになる。
なお、このように行単位でなく、文字ごとに認識し、処
理することによりより正確な文字認識が行われることは
言うまでもない。
以上のように本実施例によれば、文字サイズ決定部18
および文字位置検出部16を設けたことにより文書画像
の文字の大きさの情報と文字の位置の情報を読み取シ、
記憶装置に正確な文書画像として保存することができる
発明の効果 以上の説明よシ明らかなように本発明の文字認識装置は
文字サイズ決定部を設けることにより、文字の大きさの
情報が得られ、文字位置検出部を設けることにより、文
字の位置の情報が得られるので、認識結果を出力する場
合に入力画像に近い画像を再現することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識装置の機能
ブロック図、第2図は同実施例の文字認識装置の構成を
示すブロック図、第3図は同実施例における文字サイズ
の辞書を説明するための線図、第4図、第6図は同実施
例における制御手順を示すフローチャート、第6図は従
来の文字認識装置の機能ブロック図、第7図は同従来の
文字認識装置における制御手順を示すフローチャートで
ある。 11・・・・・・画像入力部、12・・・・・・文字切
り出し部、13・・・・・・特徴抽出部、14・・・・
・・特徴辞書、15・・・・・・認識部、16・・・・
・・文字位置検出部、17・・・・・・文字サイズ辞書
、18・・・・・・文字サイズ決定部、19・・・・・
・出力部。 代理人の氏名 弁理士 粟 野 重 孝 ほか1名第 図 (Nこ・ツ¥ ) 第 図 解

Claims (3)

    【特許請求の範囲】
  1. (1)入力された画像から認識文字パターンを矩形に切
    り出す文字切り出し部と、 前記文字切り出し部で切り出された矩形の辺の長さから
    文字キイズを決定する文字サイズ決定部と、 前記文字切り出し部で切り出された矩形の位置から文字
    の位置を検出する文字位置検出部を具備し、前記認識文
    字パターンの文字サイズとその位置情報を出力する出力
    手段を有する文字認識装置。
  2. (2)文字サイズ決定部が、字種ごとの文字パターンの
    外接矩形の大きさの複数の標準値を記憶した文字サイズ
    辞書を有する請求項1記載の文字認識装置。
  3. (3)文字サイズ決定部が入力された画像の文字行の1
    行ごとの文字サイズの実際の平均を算出する平均算出手
    段と、前記平均算出手段により算出された文字サイズの
    実際の平均と、文字サイズ辞書内の標準値のサイズとを
    比較し、その中で最も近い標準値を決定する行ポイント
    決定手段を有し、文字サイズ情報として前記行ポイント
    決定手段を出力する請求項2記載の文字認識装置。
JP2150970A 1990-06-08 1990-06-08 文字認識装置 Pending JPH0443476A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2150970A JPH0443476A (ja) 1990-06-08 1990-06-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2150970A JPH0443476A (ja) 1990-06-08 1990-06-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0443476A true JPH0443476A (ja) 1992-02-13

Family

ID=15508421

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2150970A Pending JPH0443476A (ja) 1990-06-08 1990-06-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0443476A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122813A (ja) * 2007-11-13 2009-06-04 Seiko Epson Corp 文字サイズ判定装置および文字サイズ判定方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009122813A (ja) * 2007-11-13 2009-06-04 Seiko Epson Corp 文字サイズ判定装置および文字サイズ判定方法

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
CA2116600C (en) Methods and apparatus for inferring orientation of lines of text
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
EP1265189B1 (en) Pattern extraction apparatus and method
EP0843275A2 (en) Pattern extraction apparatus and method for extracting patterns
JPH0420226B2 (ja)
JPH04195692A (ja) 文書読取装置
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2008108114A (ja) 文書処理装置および文書処理方法
US5854860A (en) Image filing apparatus having a character recognition function
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPH0443476A (ja) 文字認識装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0728935A (ja) 文書画像処理装置
JP3052438B2 (ja) 表認識装置
JP2893781B2 (ja) 文字認識装置
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0728934A (ja) 文書画像処理装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH0573721A (ja) 表認識装置
JPS6383888A (ja) 文字認識装置
JP3064508B2 (ja) 文書認識装置
JPH09106437A (ja) 文字切出し装置および文字切出し方法
JPH04311283A (ja) 行方向判定装置
JP2931485B2 (ja) 文字切出し装置及び方法