JPS62219187A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS62219187A
JPS62219187A JP61062271A JP6227186A JPS62219187A JP S62219187 A JPS62219187 A JP S62219187A JP 61062271 A JP61062271 A JP 61062271A JP 6227186 A JP6227186 A JP 6227186A JP S62219187 A JPS62219187 A JP S62219187A
Authority
JP
Japan
Prior art keywords
character
pattern
character pattern
sub
subcharacter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61062271A
Other languages
English (en)
Inventor
Hiroe Fujiwara
藤原 啓恵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61062271A priority Critical patent/JPS62219187A/ja
Publication of JPS62219187A publication Critical patent/JPS62219187A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、新聞・雑誌等の活字及び手書き文字を認識し
、例えばJISコード等の情報量に変換する文字認識装
置に関するものである。
従来の技術 従来の文字認識装置では文字間隔が明確な文書、つまり
読み取る文書の用紙上の絶対的な位置が予め判明してい
る文書を対象としており、対象となる文書に制限を与え
ていた。この問題を解決するために、本発明者は先に、
入力された文書から認識対象となる文字列を幅W、高さ
Hの矩形で切り出し、その文字列において、文字列方向
に対し垂直に走査してヒスドグ2ムを求め、そのヒスト
グラムから文字の切れ目を検出して文字パターンの構成
要素であるサブ文字パターンを求め、前記切り出しだ矩
形の高さHと前記文字列中のサブ文字パターンの幅wi
の中から最大値を求め、その値を文字パターンの基準幅
とし、その基準幅を基にサブ文字パターンを組み合わせ
て個別文字パターンを切り出す文字認識装置を提案した
発明が解決しようとする問題点 しかしながら、実際には、第8図aに示すように文字列
に句読点が含まれる場合、句読点の文字パターンがその
句読点に隣接する文字の一部と認され、第8図dに示す
ように切り出しミスが生じていた。本発明は上記問題点
を解決することを目的としたもので、句読点を文字列か
ら正しく個別文字として切り出し、文字認識を行なうこ
とができる文字認識装置を提供することを目的としてい
る0 問題点を解決するための手段 本発明は前記問題点を解決するため、切り出した文字列
に於いて文字列方向と垂直に走査してヒストグラムを求
め、ヒストグラムから文字の切れ目を検出して文字パタ
ーンの構成要素であるサブ文字パターンを求め、それら
のサブ文字パターンを組み合わせて個別文字パターンを
決定する過程において、i番目のサブ文字パターンSi
の文字列に垂直な方向の幅り、が文字の文字列に垂直な
方向の基準幅Vの1 /n 以下であり、前記サブ文字
パターンSiの位置が文字の基準位置に対し横書きの場
合は下に縦書きの場合は右にあり、サブ文字パターンS
iとi+1番目のサブ文字パターンSi+1との間隔d
iが文字間隔の基準値り以上であれば、Siを独立した
個別文字パターンPmとして決定し、前記サブ文字パタ
ーン抽出部において得られたサブ文字パターンのうち前
記独立した個別文字パターンP として決定されたサブ
文字パターンを除くサブ文字パターンを文字の基準幅を
基に組み合わせて個別文字パターンを決定するように構
成している。
作  用 本発明は前記の技術的手段により、句読点をそれに隣接
する文字パターンから切り離して切シ出し、文字認識の
精度を向上させることができる◇実施例 以下、本発明の実施例について図面を参照しながら説明
する。
第1図は、本発明による文字認識装置の一実施例の構成
図である。1は画像入力部であり、認識対象文字を含む
画像を走査して2値付号で画像を入力し画像メモリ2に
格納する。3は文字列切り出し部であり、画像メモリ2
を走査して文字列を矩形で切り出す◇4はサブ文字パタ
ーン抽出部であり、文字列切り出し部3で切り出した文
字列を列方向と垂直に走査して文字部のヒストグラムを
求め文字パターンの構成要素であるサブ文字パターンを
抽出する05は独立文字パターン決定部であり、サブ文
字パターン抽出部4で抽出したサブ文字パターンについ
て、サブ文字パターンの文字列に垂直な方向の幅2位置
、及びそのサブ文字パターンと隣接するサブ文字パター
ンとの距離を考慮して独立した個別文字パターンを決定
する。6は個別文字パターン決定部であシ、サブ文字パ
ターン抽出部4で抽出したサブ文字パターンのうち、独
立文字パターン決定部6で独立した個別文字パターンと
して決定されたサブ文字パターンを除くサブ文字パター
ンを文字の基準幅を基に組み合わせ、個別文字パターン
を決定する。7は認識部であり、独立文字パターン決定
部6及び個別文字パターン決定部6で得られた各個別文
字パターンのストローク等の特微量を求め、予め辞書8
に登録されている文字の特微量と照合し、最も似た文字
を認識候補文字とする。9は表示部であり、認識部7で
得られた認識結果を表示する。
以上のように構成された文字認識装置の動作について、
まず第2図に示すような画像を入力した場合を例に説明
する。
画像入力部1から入力された第2図に示すような画像は
2値化されて画像メモリ2に格納されるO文字列切り出
し部3は画像メモリ2に蓄えられている入力画像から予
め絶対的な位置が決められている文字列を第3図aに示
すように幅W、高さHの矩形Rで切り出す。
次にサブ文字パターン抽出部4では、矩形Rで切りださ
れた文字列に対し、文字列方向に対し垂直に走査して文
字列のヒストグラムを第3図すに示すように求め、ヒス
トグラムの値が連続して1以上である部分をサブ文字パ
ターンとして、第3図Cに示すようなサブ文字パターン
S1.S2.・・・・・・、S7を切り出す。
独立文字パターン決定部5では、サブ文字パターン抽出
部4で抽出された各サブ文字パターンの幅wi (i=
1.2 、・・・・・・7)及び矩形Rで切り出した文
字列の高さHのうちの最大値を文字の基準幅Aとし、1
/γ×Aを文字間隔の基準値りとする。例えば第3図す
ではW7が最大であり、文字の基準幅A=w7.  文
字間隔の基準値りはγ=4とするとD=1/4×W7と
なる。また文字列の高さHを文字列に垂直な方向の基準
幅Vとし、文字列の中心線を文字の基準位置Qとする。
そしてサブ文字パターンsiの高さり、がり、≦1/n
XV(n:定数)をみたし、かつ、サブ文字パターンS
iの上限が文字の基準位置Qより下にあり、かつ、後に
隣接するサブ文字パターンsi+1との距離d1がdi
≧Dをみたすとき、当サブ文字パターンSiを独立した
個別文字パターンと決定する。例えば、n=3とすると
h5≦1 /3 X Vであり、かつ、サブ文字パター
ンS5の上限は文字の基準位置Qより下にあり、かつ、
d5≧Dをみたすので85は独立した個別文字パターン
と決定される。
個別文字パターン決定部6では、サブ文字パターン抽出
部4で抽出したサブ文字パターンのうち上記独立文字パ
ターン決定部6で独立した個別文字パターンと決定され
たサブ文字パターンを除くサブ文字パターンについて、
サブ文字パターン幅Wi とサブ文字パターン間隔di
が の条件を満たすとき、隣接するサブ文字パターンSj1
.・・・・・・、Siを組み合わせて1つの個別文字パ
ターンとする。例えば、独立文字パターン決定部5で独
立した個別文字パターンと決定されたS6を除くサブ文
字パターンSiに関して条件〔1〕を適応すると、W3
+d3+W4くAよシ、S3.S4が1つの個別文字パ
ターンとみなされ、第3図eのように個別文字パターン
P1.P2.P3.P4.P5゜P6が決定される。
第4図に独立文字パターン決定部5及び個別文字パター
ン決定部6における処理のフローを示す。
認識部7では独立文字パターン決定部5及び個別文字パ
ターン決定部6で得られた個別文字パターンPiについ
て第5図すの矢印が示す方向に着目画素を含んでM個以
上連なっているか否かを調べ方向コードを設定し、方向
コード毎に各画素の連結性を調べてストロークを抽出し
、ストロークの数・位置・長さ等の特徴量を抽出する。
第5図aに文字「あ」のストロークの抽出結果を示す。
抽出した特徴量を辞書8に登録されている特徴量と照合
し、最も似た文字を認識候補文字とし、表示部9で表示
する。
上記動作の説明では、第2図に示すような横書きの画像
について説明したが、例えば、第6図に示すような縦書
きの画像についても、第7図aのように文字列を切り出
し、文字列方向に対して垂直に走査して文字列のヒスト
グラムを第7図すに示すように求め、第7図Cに示すサ
ブ文字パターンS11・S12・S13・”14・”1
5・S16を得る・そして、同様にサブ文字パターン抽
出部4で抽出された各サブ文字パターンの幅Wi(i=
11.12+・・・・・・、16)及び矩形Rで切り出
した文字列の高さHzうちの最大値を文字の基準幅Aと
し、1/γ×Aを文字間隔の基準値りとする。例えば第
6図すではW16が最大であり、文字の基準幅A=W1
6、文字間隔の基準値りはγ=3とするとD=1/3X
W、6となる。また文字列の高さH′を文字の文字列に
垂直な方向の基準幅Vとし、文字列の中心線を文字の基
準位置Qとする。そしてサブ文字パターンSiの高さり
、がり、≦1/nxV(n:定数)をみたし、かつ、サ
ブ文字パターンS□の左限が文字の基準位iQより右に
あり、かつ、後に隣接するサブ文字パターンSi+1と
の距離d0がd0≦Dをみたすとき、当サブ文字パター
ンSiを独立した個別文字パターンと決定する。
例えば、n=5とするとh13≦115XVであり、か
つ、サブ文字パターンS5の左限は文字の基準位置Qよ
り右にあり、かつ、d13≧Dをみたすので81舛独立
した個別文字パ夛−ンと決定される。
そして、独立した個別文字パターンと決定されたS13
を除くサブ文字パターンSiに関して条件〔1〕を適応
すると、W14+d1.+W1.くAより、S14とS
l、が1つの個別文字パターンとみなされ、第7図eの
ように個別文字パターンP11゜P12 +”131P
141P15が決定される。
発明の効果 本発明によれば、認識対象文字列から個別文字パターン
を抽出する際に、句読点、コンマ、ピリオド等を含んで
いる文字列に対しても句読点、コンマ、ピリオド等を他
の文字パターンの一部と混同することなく、個別文字パ
ターンを正確に抽出することができ、文字認識の精度を
向上する事ができる。
【図面の簡単な説明】
第1図は本発明の一実施例による文字認識装置の構成図
、第2図は入力画像の一例の説明図、第3図は本発明の
一実施例において文字列から個別文字パターンを決定す
る方法の一例の説明図、第4図は本発明においてサブ文
字パターンから個別文字パターンを決定する過程の処理
のフロー図、第5図は文字認識方法の説明図、第6図は
入力画像の他の一例の説明図、第7図は本発明の一実施
例において文字列から個別文字パターンを決定する方法
の他の一例の説明図、第8図は従来の技術により文字列
から個別文字パターンを決定する方法の説明図である。 1・・・・・・画像入力部、2・・・・・・画像メモリ
部、3・・・・・文字列切り出し部、4・・・・・・サ
ブ文字パターン抽出部、6・・・・・・独立文字パター
ン決定部、6・・・・・・個別文字パターン決定部、7
・・・・・・認識部、8・・・・・・辞書、9・・・・
・・表示部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 ・                   WPI  
 P2   P3  P4   P5    P6第5
図 06 図 第7図 図面の浄書(内容に変更なし) (0−)(b) 第 7 図    図面の浄書ぐ内容に変更なし)(C
)                 (d−)   
            (e)−面の浄書(内容に変
更なしン ヤ 一一二。 2面の1P吉(内容に変更なし〕 手続補正書(刃側 開用61年6月26L] 特許庁長官殿        □□□ 1事件の表示 昭和61年特許願第 62271  号2発明の名称 文字認識装置 3補正をする者 事件との関係      特   許   出   願
  人住 所  大阪府門真市大字門真1006番地名
 称 (582)松下電器産業株式会社代表者    
谷  井  昭  雄 4代理人 〒571 住 所  大阪府門真市大字閂ム′51006番地松下
電器産業株式会社内 します。

Claims (1)

    【特許請求の範囲】
  1. 認識対象文字を含む画像を入力する画像入力部と、前記
    画像入力部で入力された画像から認識対象となる文字の
    集合である文字列を切り出す文字列切り出し部と、前記
    文字列切り出し部において切り出された文字列について
    、文字列方向に対して垂直に走査して文字を形成する画
    素のヒストグラムを求め、ヒストグラムの値が連続して
    M以上である部分をサブ文字パターンとして抽出するサ
    ブ文字パターン抽出部と、前記サブ文字パターン抽出部
    において得られたi番目のサブ文字パターンS_iの文
    字列に垂直な方向の幅h_iが文字の文字列に垂直な方
    向の基準幅Vの1/n以下であり、前記サブ文字パター
    ンS_iの位置が文字の基準位置に対し横書きの場合は
    下に縦書きの場合は右にあり、サブ文字パターンS_i
    とi+1番目のサブ文字パターンS_i_+_1との間
    隔d_iが文字間隔の基準値D以上であれば、S_iを
    独立した個別文字パターンP_mとして決定する独立文
    字パターン決定部と、前記サブ文字パターン抽出部にお
    いて得られたサブ文字パターンのうち前記独立した個別
    文字パターンP_mとして決定されたサブ文字パターン
    を除くサブ文字パターンを文字の基準幅を基に組み合わ
    せて個別文字パターンを決定する個別文字パターン決定
    部と、前記独立文字パターン決定部及び個別文字パター
    ン決定部により得られた個別文字パターンの特徴を計算
    し、前記特徴と辞書とを照合することにより認識候補文
    字を抽出する認識部を有することを特徴とする文字認識
    装置。
JP61062271A 1986-03-20 1986-03-20 文字認識装置 Pending JPS62219187A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61062271A JPS62219187A (ja) 1986-03-20 1986-03-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61062271A JPS62219187A (ja) 1986-03-20 1986-03-20 文字認識装置

Publications (1)

Publication Number Publication Date
JPS62219187A true JPS62219187A (ja) 1987-09-26

Family

ID=13195315

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61062271A Pending JPS62219187A (ja) 1986-03-20 1986-03-20 文字認識装置

Country Status (1)

Country Link
JP (1) JPS62219187A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008980A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2016071382A (ja) * 2014-09-26 2016-05-09 株式会社東芝 電子機器、方法及びプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS59197581A (ja) * 1983-04-22 1984-11-09 Kanegafuchi Chem Ind Co Ltd 水平型電解槽への陽イオン交換膜の装着方法及び水平型電解槽
JPS59205679A (ja) * 1983-05-06 1984-11-21 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991582A (ja) * 1982-11-16 1984-05-26 Nec Corp 文字読取装置
JPS59197581A (ja) * 1983-04-22 1984-11-09 Kanegafuchi Chem Ind Co Ltd 水平型電解槽への陽イオン交換膜の装着方法及び水平型電解槽
JPS59205679A (ja) * 1983-05-06 1984-11-21 Nippon Telegr & Teleph Corp <Ntt> 文字切出し装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012008980A (ja) * 2010-06-28 2012-01-12 Fuji Xerox Co Ltd 情報処理装置およびプログラム
JP2016071382A (ja) * 2014-09-26 2016-05-09 株式会社東芝 電子機器、方法及びプログラム

Similar Documents

Publication Publication Date Title
US7336813B2 (en) System and method of determining image skew using connected components
CN107093172B (zh) 文字检测方法及系统
US7519226B2 (en) Form search apparatus and method
JPS61188681A (ja) 文字認識装置
US20060194187A1 (en) Material processing apparatus, material processing method, and program product
JPS62219187A (ja) 文字認識装置
JP2661898B2 (ja) 文字認識装置
JPS6316392A (ja) 文字認識装置
JPS63146187A (ja) 文字認識装置
JP2537973B2 (ja) 文字認識装置
JPH0782525B2 (ja) 文字認識装置
JPH0797390B2 (ja) 文字認識装置
JPH0584553B2 (ja)
KR200488959Y1 (ko) 시각장애인을 위한 그림-활자 점자 변환 장치
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JPH0576671B2 (ja)
JPH08101880A (ja) 文字認識装置
JPH0350689A (ja) 文字認識装置
JPH0664628B2 (ja) 文字認識装置
JPS6255783A (ja) 文字認識装置
JPS6330991A (ja) 文字認識装置
JPH10162104A (ja) 文字認識装置
JPS63221495A (ja) 文字認識装置
JPH0261783A (ja) 文字認識装置
JPS63225883A (ja) 文字認識装置