JP3064391B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP3064391B2
JP3064391B2 JP2295733A JP29573390A JP3064391B2 JP 3064391 B2 JP3064391 B2 JP 3064391B2 JP 2295733 A JP2295733 A JP 2295733A JP 29573390 A JP29573390 A JP 29573390A JP 3064391 B2 JP3064391 B2 JP 3064391B2
Authority
JP
Japan
Prior art keywords
character
document
character recognition
area
punctuation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2295733A
Other languages
English (en)
Other versions
JPH04167193A (ja
Inventor
昇 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2295733A priority Critical patent/JP3064391B2/ja
Publication of JPH04167193A publication Critical patent/JPH04167193A/ja
Application granted granted Critical
Publication of JP3064391B2 publication Critical patent/JP3064391B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、紙等に印刷された文字を画像として読み取
り、各文字を認識する文字認識方法に関するものであ
る。
[従来の技術] 従来、文字パターンから文字を認識する際には、画像
読み取り装置に認識対象文書となる原稿を載せて、原稿
の画像をビットイメージで読み取り、その中から各文字
を切り出す。そして、各文字の文字パターンの特徴量と
予め保持してある文字の特徴量とを比較しながら、一致
が得られたらその文字を認識結果として出力していた。
[発明が解決しようとする課題] しかしながら従来の場合、原稿の置き方として文字の
方向即ち、上下、左右を指定された通りに置かないと文
字の認識が行われなかったり、或は、原稿の載置の方向
をユーザが文字認識装置に指示しておく必要があった。
或は、4つの方向全てに辞書との照合を行う為処理速度
が遅かった。
[課題を解決するための手段] この課題を解決するために本発明は句読点の位置に着
目して文字の方向を識別するようにした。
即ち、認識対象文書が、縦書きか横書きかを求め認識
対象文書を構成する文字の外接矩形の大きさ、位置に基
づいて句読点に対応する位置に文字が存在するとした場
合の該文字の外接矩形となる句読点領域を求め、その領
域内での句読点の位置に応じて文字の方向を特定し、文
字の認識を行うようにした。
[作用] 句読点は横書きの場合は領域の左下に、縦書きの場合
には右上にあるものなので、文書が縦書きか横書きかと
いう情報とで、文字の方向を特定することができる。
[実施例] 以下、本発明の一実施例における文字認識方法につい
て図面を参照しながら説明する。
第1図は、本実施例の文字認識方法を用いた文字認識
装置の構成図である。1は文字の記入されている文書を
光学的に走査し、電気信号に変換する光電変換部、2は
光電変換部1から送られてくる光電変換信号を、ある基
準により、白黒に対応して2値化する2値化部、3は2
値化部2から送られてくる2値化パターンから領域に分
割する領域分割部、4は分割された領域から文字領域を
抽出する文字領域抽出部、5は文字領域抽出部4により
抽出された文字領域の水平垂直射影を作成し、その間隔
から縦書き・横書きを判定する縦書き・横書き判定部、
6は文字領域抽出部4より抽出された文字領域のオリエ
ンテーションを判定するオリエンテーション判定部であ
る。7は縦書き・横書き判定部5、オリエンテーション
判定部6で判定した結果に従って、文字認識を行う文字
認識部である。
第2図は、第1図の文字認識装置のブロック図であ
る。8はRAMで、画像データ等を格納する。9はROMで、
文字パターン辞書、プログラム等を格納する。10はRS23
2Cで、認識指令及び、文字出力を行う。11は演算処理装
置で、プログラムの動作をコントロールする。12のスキ
ャナで画像をイメージ・メモリの中にとりこむ。
処理全体の流れを、第3図のフローチャートを使っ
て、説明する。
初めに、2値データを縦横両方向に走査して、白黒そ
れぞれの画素の連続した部分を領域区分線として、領域
に分割する(ステップ1、第9図、第10図)。分割した
領域を更に黒画素8連結の小領域に分割し、その間隔、
大きさの分布が、ばらつきの少ない領域を、文字領域と
して抽出する(ステップ2、第11図)。抽出された文字
領域の水平・垂直斜影を取り、その谷間の大きさより、
縦書き・横書きを判定する(ステップ3、第4図)。黒
画素8連結小領域の位置、大きさから、句読点候補を抽
出し、認識を行う(ステップ4、第5図)。認識した結
果、その類似度等の評価値により、句読点であると判定
されれば、その句読点の位置に対応して文字が存在する
とした場合のその文字の外接矩形である句読点領域を求
め、その句読点領域内での句読点の位置により、オリエ
ンテーションを判定し(ステップ8)、すべての句読点
がリジェクトされれば、数個の通常文字パタンを、その
まま、90度、180度、270度回転した4つのパターンで認
識を行う(ステップ6)。その4種類に対して、類似度
等の認識確度の和が最大の方向より、オリンエンテーシ
ョンを判定する(ステップ7)。最後に、対象とした文
字領域が、判定した縦書き・横書き、オリエンテーショ
ンであるとして、すべての文字を認識する(ステップ
9)。
具体例により、オリエンテーション判定について、説
明を補足する。句読点が、第8図(a)の様に左下にあ
る場合、横書きならば、第6図(a)ポートレート、正
置、縦書きならば(d)ポートレート、逆置き(180度
回転)であると判定できる。また、第7図(b)の様に
文字が90度回転ならば、各々第6図(f)ランドスケー
プ、逆置き、第6図(h)ランドスケープ、正置である
と判定できる。
[発明の効果] 以上のように、本発明は、縦書き、横書きの情報と句
読点の位置とから原稿のオリエンテーションを判定する
ことにより、全自動で、文字認識を行うことが可能とな
り、省力化、操作ミスがなくなる等の効果がある。
【図面の簡単な説明】
第1図は本発明の一実施例における文字認識方法を用い
た文字認識装置の構成図、第2図は本発明の一実施例に
おける文字認識装置のブロック図、第3図は本実施例に
おけるフローチャート、第4図は水平・垂直斜影の例を
示す図、第5図は8隣接小領域の外接矩形の例、第6図
は縦書き・横書き、オリエンテーションの例を示す図、
第7図は、スキャナから入ってくる文字パターンの例を
示す図、第8図は、同じく句読点の例を示す図、第9図
は入力文書の例を示す図、第10図は第9図の入力文書の
領域分割を行った例を示す図、第11図は、黒画素8連結
小連結に分割し、文字領域を抽出した例を示す図であ
る。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】認識対象文書の画像を読み取り、 読み取った画像中の各文字の外接矩形を求めて文字領域
    を抽出し、 抽出した文字領域に基づいて外接矩形の並び方向を求
    め、 前記外接矩形内における句読点位置を求め、 外接矩形の大きさと並び方向と、外接矩形内における句
    読点位置とに基づいて、認識対象文書の向きと、該文書
    内の文字方向を識別し、 識別結果に応じて読み取られた画像中の各文字の認識を
    行う文字認識方法。
  2. 【請求項2】句読点位置は複数の句読点に対して求め、
    その各々から得られた文書の方向のうち、最も多い方向
    に応じて文字の認識を行うことを特徴とする請求項1記
    載の文字認識方法。
JP2295733A 1990-10-31 1990-10-31 文字認識方法 Expired - Fee Related JP3064391B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2295733A JP3064391B2 (ja) 1990-10-31 1990-10-31 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2295733A JP3064391B2 (ja) 1990-10-31 1990-10-31 文字認識方法

Publications (2)

Publication Number Publication Date
JPH04167193A JPH04167193A (ja) 1992-06-15
JP3064391B2 true JP3064391B2 (ja) 2000-07-12

Family

ID=17824470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2295733A Expired - Fee Related JP3064391B2 (ja) 1990-10-31 1990-10-31 文字認識方法

Country Status (1)

Country Link
JP (1) JP3064391B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3085925B2 (ja) * 1997-08-26 2000-09-11 株式会社アプタス 電子カルテ装置
JP2000076380A (ja) * 1998-08-31 2000-03-14 Casio Comput Co Ltd 手書き文字入力装置及び記憶媒体

Also Published As

Publication number Publication date
JPH04167193A (ja) 1992-06-15

Similar Documents

Publication Publication Date Title
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
JP3728224B2 (ja) 文書処理装置及び方法
KR20010015025A (ko) 문자인식장치의 문자추출방법 및 장치
JP3064391B2 (ja) 文字認識方法
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH07160810A (ja) 文字認識装置
JP2877380B2 (ja) 光学的文字読取装置
JPS61289476A (ja) 文字読取装置のフオ−マツト生成方式
JP4254008B2 (ja) パターン検出装置及び方法
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2571826B2 (ja) 文字列パターン切り出し装置
JPH08171609A (ja) 文字列高速抽出装置
JPH0586585B2 (ja)
JP2980636B2 (ja) 文字認識装置
JP3199033B2 (ja) 光学式文字読取方法、及び光学式文字読取装置
JPH08227440A (ja) 文書画像処理装置
JPH0433082A (ja) 文書認識装置
JPH083830B2 (ja) 文字列パタ−ン切り出し方式
JPH0132553B2 (ja)
JPH04262660A (ja) 画像認識出力装置
JPH0778820B2 (ja) 画像処理方法
JPS61165184A (ja) 基準点自動検出処理方法
JPS61289479A (ja) 繋がり文字を読取る文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090512

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100512

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees