JPS62190575A - 文字パタ−ン切り出し装置 - Google Patents
文字パタ−ン切り出し装置Info
- Publication number
- JPS62190575A JPS62190575A JP61033193A JP3319386A JPS62190575A JP S62190575 A JPS62190575 A JP S62190575A JP 61033193 A JP61033193 A JP 61033193A JP 3319386 A JP3319386 A JP 3319386A JP S62190575 A JPS62190575 A JP S62190575A
- Authority
- JP
- Japan
- Prior art keywords
- character
- pattern
- evaluation value
- character string
- basic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000011156 evaluation Methods 0.000 claims abstract description 112
- 238000004364 calculation method Methods 0.000 claims abstract description 25
- 238000001514 detection method Methods 0.000 claims description 8
- 238000010586 diagram Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 235000014121 butter Nutrition 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000037303 wrinkles Effects 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
この発明は2文隻に記入された文字列から文字パターン
を切り出す文字パターン切り出し装置に関するものであ
る。
を切り出す文字パターン切り出し装置に関するものであ
る。
文字を認識するには、用紙に記入された文字を光電変換
し1文字の部分、背景の部分に対応して1.0の信号に
2埴化変換じた文字パターンから1文字づつ文字パター
ンを切り出さなければならなし。第2図は先に当社よシ
出Mした特願昭60−17265号に示されたこの種の
装置の構成を示す図であり1図中+11は用紙、(21
は用紙(1)上に記入された文字列を光学的に走査して
光電変換する走査手段、13+Fi光電変換された文字
列のパターン(以後、「文字列パターン」と呼ぶ)を記
憶する文字列パターン記憶手段、(41は上記文字列と
直交する方向に文字列パターンを走査して求めた周辺分
布値の連続性に基づき、上記文字列パターンを分割して
求めたパターン(以後、「基本パターン」と呼ぶ)の左
右端と上下端の座標より基本パターン領域を検出する基
本パターン領域検出手段、(5)は上記基本パターン領
域検出手段(4)で求めた基本パターン領域の位置情報
から革独の基本パターン及び連続する複数個の基本パタ
ーン領域を結合したパターン(以後「結合パターン」と
呼ぶ)のそれぞれが、どの程度1文字のパターンらしい
かを定量化した値(以後「文字形状評価値」と呼ぶ)を
計算する文字形状評価値算出手段、(6)は上記文字形
状評価値算出手段(5)で求めた文字形状評価値の大き
さに基づき切り出すべき文字パターンの位置を決定する
文字切り出し手段、(71は上記文字切り出し手段(6
)で決定した文字パターン切り出し位置に基づいて上記
文字列パターン記憶手段(3)に記憶した文字列パター
ンから1文字ずつ文字パターンを切り出す出力手段であ
る。第3図は、上記基本パターン領域検出手段(4)に
よる処理の一例な示す図である。図中ス8)は文字列パ
ターン、(9)は周辺分布値、 QQは基本パターンの
例であシ該基本パターンと対応する基本パターン領域を
矩形で囲って示しである。第4図は、上記文字評価値算
出手段(5)で文字評価値を算出する為の基本パターン
と結合パターン(以後これらのパターンを「要素パター
ン」と呼ぶ)の例を示す図である。第5図は。
し1文字の部分、背景の部分に対応して1.0の信号に
2埴化変換じた文字パターンから1文字づつ文字パター
ンを切り出さなければならなし。第2図は先に当社よシ
出Mした特願昭60−17265号に示されたこの種の
装置の構成を示す図であり1図中+11は用紙、(21
は用紙(1)上に記入された文字列を光学的に走査して
光電変換する走査手段、13+Fi光電変換された文字
列のパターン(以後、「文字列パターン」と呼ぶ)を記
憶する文字列パターン記憶手段、(41は上記文字列と
直交する方向に文字列パターンを走査して求めた周辺分
布値の連続性に基づき、上記文字列パターンを分割して
求めたパターン(以後、「基本パターン」と呼ぶ)の左
右端と上下端の座標より基本パターン領域を検出する基
本パターン領域検出手段、(5)は上記基本パターン領
域検出手段(4)で求めた基本パターン領域の位置情報
から革独の基本パターン及び連続する複数個の基本パタ
ーン領域を結合したパターン(以後「結合パターン」と
呼ぶ)のそれぞれが、どの程度1文字のパターンらしい
かを定量化した値(以後「文字形状評価値」と呼ぶ)を
計算する文字形状評価値算出手段、(6)は上記文字形
状評価値算出手段(5)で求めた文字形状評価値の大き
さに基づき切り出すべき文字パターンの位置を決定する
文字切り出し手段、(71は上記文字切り出し手段(6
)で決定した文字パターン切り出し位置に基づいて上記
文字列パターン記憶手段(3)に記憶した文字列パター
ンから1文字ずつ文字パターンを切り出す出力手段であ
る。第3図は、上記基本パターン領域検出手段(4)に
よる処理の一例な示す図である。図中ス8)は文字列パ
ターン、(9)は周辺分布値、 QQは基本パターンの
例であシ該基本パターンと対応する基本パターン領域を
矩形で囲って示しである。第4図は、上記文字評価値算
出手段(5)で文字評価値を算出する為の基本パターン
と結合パターン(以後これらのパターンを「要素パター
ン」と呼ぶ)の例を示す図である。第5図は。
上記文字切り出し手段(6)で文字を切り出すために発
生させた要素パターンの組み合せの例を示す図である。
生させた要素パターンの組み合せの例を示す図である。
次に第2図〜第5図を用いて第2図の特願昭60−17
265号に示された従来のこの種の装置の動作について
説明する。まず用紙(1)上の文字列は上記走査手段(
2)で光電変換され、上記文字列パターン記憶手段(3
1に格納される。次に上記文字列パターン記憶手段(3
)内の文字列パターン「設計」(8)は上記基本パター
ン領域検出手段(41に渡される。
265号に示された従来のこの種の装置の動作について
説明する。まず用紙(1)上の文字列は上記走査手段(
2)で光電変換され、上記文字列パターン記憶手段(3
1に格納される。次に上記文字列パターン記憶手段(3
)内の文字列パターン「設計」(8)は上記基本パター
ン領域検出手段(41に渡される。
上記基本パターン領域検出手段(41では1文字列と直
交する上下方向に文字列パターンを走査して作成した周
辺分布1[t91が所定の閾値をこえる領域の連続性に
基づいて文字列パ、−7「設計」、8、を分割し1分割
して得た各基本パターン「言」、「i」、r言J、「+
Jo(Iの左右端と上下端の座標を基本パターン領域と
して検出する。
交する上下方向に文字列パターンを走査して作成した周
辺分布1[t91が所定の閾値をこえる領域の連続性に
基づいて文字列パ、−7「設計」、8、を分割し1分割
して得た各基本パターン「言」、「i」、r言J、「+
Jo(Iの左右端と上下端の座標を基本パターン領域と
して検出する。
次に、上記文字形状評価値算出手段(5)では、第4図
に示す要素パターンのすべてに対し、基本パターン領域
の位置情報に基づいて文字領域らしさを示す文字形状評
価値を算出する。具体的には。
に示す要素パターンのすべてに対し、基本パターン領域
の位置情報に基づいて文字領域らしさを示す文字形状評
価値を算出する。具体的には。
パターンに外接する矩形が正方形に近く、パターン内に
存在する空白部分が狭く、さらにパターン両端に存在す
る空白部分が広いほど大きな稙をとるように文字形状評
価値が決定される。
存在する空白部分が狭く、さらにパターン両端に存在す
る空白部分が広いほど大きな稙をとるように文字形状評
価値が決定される。
次に上記文字切り出し手段(6)では、上記基本パター
ン領域間の境界点を文字列パターンの切多出し候補位置
とり、この各切り出し候補位置のあらゆる可能な組み合
せによシ第5図に示すすべての切り出し可能な要素パタ
ーンの組み合せを求める。
ン領域間の境界点を文字列パターンの切多出し候補位置
とり、この各切り出し候補位置のあらゆる可能な組み合
せによシ第5図に示すすべての切り出し可能な要素パタ
ーンの組み合せを求める。
次に各切り出し候補位置の組について、上記文字形状評
価値算出手段(5)で計算した%要素パターンの文字形
状評価値に基づいて、切り出し評価値を求める。
価値算出手段(5)で計算した%要素パターンの文字形
状評価値に基づいて、切り出し評価値を求める。
すなわち文字列の先頭から第1番目の基本パターンPi
iから第j番目の基本パターンPjj まで(j≧i
)を1つにした要素パターンをPij とした時、
Pijに対する文字形状評価11kvf(土、j)に
構成基本パターン数(j−i+1>を掛けた重みwf(
1,j)を第6図に示す2端子有向グラフの各校に割シ
当でる。この時切り出し評価値Vは2端子有向グラフの
始点から終点に至るパスにおける枝の重みの和として表
せる。そこで、枝の重みの和が最大となるパスを周知の
ダイナミックプログラミングの手法を甲イて求める。そ
して。
iから第j番目の基本パターンPjj まで(j≧i
)を1つにした要素パターンをPij とした時、
Pijに対する文字形状評価11kvf(土、j)に
構成基本パターン数(j−i+1>を掛けた重みwf(
1,j)を第6図に示す2端子有向グラフの各校に割シ
当でる。この時切り出し評価値Vは2端子有向グラフの
始点から終点に至るパスにおける枝の重みの和として表
せる。そこで、枝の重みの和が最大となるパスを周知の
ダイナミックプログラミングの手法を甲イて求める。そ
して。
このパスを与える要素パターンの組み合せを最適な文字
切り出し結果と決定する。
切り出し結果と決定する。
最後に上記出力手段+71 Fi上記文字切り出し手段
(61で決定した要素パターンの組の情報に基づいて上
記文字列パターン記憶手段(3)に記憶した文字列パタ
ーンかに1文字ずつ客字パターンを切り出して出力する
。
(61で決定した要素パターンの組の情報に基づいて上
記文字列パターン記憶手段(3)に記憶した文字列パタ
ーンかに1文字ずつ客字パターンを切り出して出力する
。
特願昭60−1726号に示された文字パターン切り出
し装置は以上のように9文字形状評価1直算出手段にお
いて各要素パターンに対しパターン形状やパターン間に
存在する空白部分の広さ尋に基づいてどの程度文字領域
らしいかを示す文字形状評価値を計算し1文字#Aし出
し手段で各要素パターンの文字形状評価値に基づいて最
適な組合せを求めるように構成されていたので、パター
ンに外接する矩形の位置と形状の情報しか用いないため
敷字等の非漢字が接近して記入された文字列や漢字の偏
や労の一方を大きく記入した文字を含む文字列から個々
の文字を正確に切り出すことは困難であるという問題点
があった。例えば1文字列「昭和60年」のように接近
して記入された数字列「60」は偏と労からなる漢字と
同じ形状になる傾向が多(このため「60」を正1 <
r6Jと「0」とに切υ出せないという問題点があっ
た。
し装置は以上のように9文字形状評価1直算出手段にお
いて各要素パターンに対しパターン形状やパターン間に
存在する空白部分の広さ尋に基づいてどの程度文字領域
らしいかを示す文字形状評価値を計算し1文字#Aし出
し手段で各要素パターンの文字形状評価値に基づいて最
適な組合せを求めるように構成されていたので、パター
ンに外接する矩形の位置と形状の情報しか用いないため
敷字等の非漢字が接近して記入された文字列や漢字の偏
や労の一方を大きく記入した文字を含む文字列から個々
の文字を正確に切り出すことは困難であるという問題点
があった。例えば1文字列「昭和60年」のように接近
して記入された数字列「60」は偏と労からなる漢字と
同じ形状になる傾向が多(このため「60」を正1 <
r6Jと「0」とに切υ出せないという問題点があっ
た。
この発明は、上記のような問題点を解消するためになさ
れたもので、接近して記入された非漢字や偏や労が大き
く記入された漢字を含むフリーピッチで記入された文字
列からも正しく文字を切り出せる文字パターン切り出し
装置を得ることを目的とする。
れたもので、接近して記入された非漢字や偏や労が大き
く記入された漢字を含むフリーピッチで記入された文字
列からも正しく文字を切り出せる文字パターン切り出し
装置を得ることを目的とする。
この発明に係る文字パターン切り出り装置は。
読み取り対象文字の基準パターンが格納されている文字
認識辞書記憶手段と、上記文字認識辞書記憶手段に格納
した基準パターンと谷費素パターンとを整合させて文字
認識評価値を算出する文字認識評価値算出手段と1文字
形状評価値算出手段で算出した文字形状評価1区と文字
認識評価値算出手段で算出した文字認識評価値とを〃0
算し1文字評価値を求める評価値加算手段とを付加した
ものである。
認識辞書記憶手段と、上記文字認識辞書記憶手段に格納
した基準パターンと谷費素パターンとを整合させて文字
認識評価値を算出する文字認識評価値算出手段と1文字
形状評価値算出手段で算出した文字形状評価1区と文字
認識評価値算出手段で算出した文字認識評価値とを〃0
算し1文字評価値を求める評価値加算手段とを付加した
ものである。
この発明における文字パターン切り出し装置は。
文字認識評価1[II算出手段で4!r要素パターンを
認識した結果に基づいて算出した文字認識評価値と。
認識した結果に基づいて算出した文字認識評価値と。
評価値71[]算手段でパターンの形状に基づいて算出
した文字形状評価値とを加え、この2種類の情報に基づ
いて文字を切り出すようにしたので、接近して記入され
た非漢字や偏や労を大きく記入された漢字を含んだフリ
ーピッチの文字列かち個々の文字を正L〈切り出すこと
ができる。
した文字形状評価値とを加え、この2種類の情報に基づ
いて文字を切り出すようにしたので、接近して記入され
た非漢字や偏や労を大きく記入された漢字を含んだフリ
ーピッチの文字列かち個々の文字を正L〈切り出すこと
ができる。
以下、この発明の実施例を図を用いて詳細に説明する。
シ、1図は、この発明の一実施例の構成を示す図である
。図中ill〜〔71け上記従来装置と同一である。α
9は、読み散り対象文字の基糸パターンを格納した文字
認識辞書を記憶する文字認識辞書記憶手段、α2は、上
記文字認識辞書、記憶手段Oflに記憶した基皺パター
ンと各要素パターンとを察合させることによυ文字認識
評価値を算出する文字認識評価値算出手段、0は1文字
形状評価稙と文字認識評価値とを加算する評価値加算手
段である。
。図中ill〜〔71け上記従来装置と同一である。α
9は、読み散り対象文字の基糸パターンを格納した文字
認識辞書を記憶する文字認識辞書記憶手段、α2は、上
記文字認識辞書、記憶手段Oflに記憶した基皺パター
ンと各要素パターンとを察合させることによυ文字認識
評価値を算出する文字認識評価値算出手段、0は1文字
形状評価稙と文字認識評価値とを加算する評価値加算手
段である。
第7図は1文字列パターンの一例を示す図であって1図
中0は文字列パターン、αりはこの文字列パターンから
抽出した基本パターンである。
中0は文字列パターン、αりはこの文字列パターンから
抽出した基本パターンである。
第8図は、第7図に示した7個の基本パターンa9より
求めた要素パターンの各評価値を示す図であって2図中
aυけ文字形状評価値Vf、αηは文字認識評価1直v
r、 a9は文字評価値Vである。第9図はこの実施
例における文字切り出し評価値を示す図であって2図中
■は「昭」十「オ[]J+r6J+ roll 十r年
」なる要素パターンの組合せ、(支)は「昭」+rLJ
十r60J+r年」なる要素パターンの組合せ、 CI
!11は「日」+「召」+「和」+r6J +rOJ
+r年」なる要素パターンの組合せ、 023は、要素
パターン「昭」に対する文字評価1直に基本パターン数
を壮1けた切り出し重み、@は上記要素パターンの組合
せa9に対する切多出し評価値である。第10図は1文
字評価1直のかわシに文字形状評価値のみを用いた場合
の文字切り出し評価値を示す図であって1図中a9〜@
は第9図と同一である。
求めた要素パターンの各評価値を示す図であって2図中
aυけ文字形状評価値Vf、αηは文字認識評価1直v
r、 a9は文字評価値Vである。第9図はこの実施
例における文字切り出し評価値を示す図であって2図中
■は「昭」十「オ[]J+r6J+ roll 十r年
」なる要素パターンの組合せ、(支)は「昭」+rLJ
十r60J+r年」なる要素パターンの組合せ、 CI
!11は「日」+「召」+「和」+r6J +rOJ
+r年」なる要素パターンの組合せ、 023は、要素
パターン「昭」に対する文字評価1直に基本パターン数
を壮1けた切り出し重み、@は上記要素パターンの組合
せa9に対する切多出し評価値である。第10図は1文
字評価1直のかわシに文字形状評価値のみを用いた場合
の文字切り出し評価値を示す図であって1図中a9〜@
は第9図と同一である。
次に、第1図に示す実施例の動作を説明する。
まず用紙(1)上に記入された文字列は上記走査手段(
2)で光電変換され、この結果性た1行分の文字列パタ
ーン「昭和60年J 041は、上記文字列パターン記
憶手段(3)に格納される。次に上記文字列パターン「
昭和60年」α4は上記基本パターン領域検出手段(4
1に渡される。上記基本パターン領域検出手段(41で
は2文字列パターン「昭和60年」041から基本パタ
ーン「日」、「召」、「禾」、「口」。
2)で光電変換され、この結果性た1行分の文字列パタ
ーン「昭和60年J 041は、上記文字列パターン記
憶手段(3)に格納される。次に上記文字列パターン「
昭和60年」α4は上記基本パターン領域検出手段(4
1に渡される。上記基本パターン領域検出手段(41で
は2文字列パターン「昭和60年」041から基本パタ
ーン「日」、「召」、「禾」、「口」。
r6J、rOJ、r年」αりを抽出し、各基本パターン
(外接する矩形に対応する左右端、上下端の座標を求め
て上記文字形状評価値算出手段(5)と上記文字認識評
価値算出手段a2に転送する。次に上記文字形状評価値
算出手段(5)では、従来の装置と同様の方法ですべて
の要素パターンに対する文字形状評価値を算出する。な
お文字形状評価値は0.0〜1.0の値になるように正
規化する。
(外接する矩形に対応する左右端、上下端の座標を求め
て上記文字形状評価値算出手段(5)と上記文字認識評
価値算出手段a2に転送する。次に上記文字形状評価値
算出手段(5)では、従来の装置と同様の方法ですべて
の要素パターンに対する文字形状評価値を算出する。な
お文字形状評価値は0.0〜1.0の値になるように正
規化する。
1だ上記文字認識評価値算出手段では上記文字認織辞書
記憶手段(Illに格納[、た基慈パターンと要素パタ
ーンとの整合をと99文字認認識側値を算出する。すな
わち、パターンPから抽出した特徴ベクトルを〆=Cx
1. X2.・・・・・・xk) r 文字Cの基刺
パターンベクトルをFc” Cfcl、fc2.・・−
・・fck)としたM、すでに仰られている文字認識の
技術を片いてパターンPがどの程度1文字のパターンら
しいかを定量化した値である類似度s (p)を算出し
、これを文字認識評価値vr(P)とする。
記憶手段(Illに格納[、た基慈パターンと要素パタ
ーンとの整合をと99文字認認識側値を算出する。すな
わち、パターンPから抽出した特徴ベクトルを〆=Cx
1. X2.・・・・・・xk) r 文字Cの基刺
パターンベクトルをFc” Cfcl、fc2.・・−
・・fck)としたM、すでに仰られている文字認識の
技術を片いてパターンPがどの程度1文字のパターンら
しいかを定量化した値である類似度s (p)を算出し
、これを文字認識評価値vr(P)とする。
Vr (P)= S (p) −・
−(11S (P)= maX 81 (P)−・−(
21ことに 5i(P): パターンPと読み取り対象文字C1と
の類似度 F。□ = 切り出[、対象文字c1の基草)(ターン
ベクトル ’ ′Fc1’ : % ト/’l” ci cD内
tRnzn:J7E−コ)なるノ馬 上記式(1)〜(3)よシ求まる文字認識評価値vr(
P)は0.0〜1.0の値をとシ、パターンPが文字ち
しい程大きな値をとる。
−(11S (P)= maX 81 (P)−・−(
21ことに 5i(P): パターンPと読み取り対象文字C1と
の類似度 F。□ = 切り出[、対象文字c1の基草)(ターン
ベクトル ’ ′Fc1’ : % ト/’l” ci cD内
tRnzn:J7E−コ)なるノ馬 上記式(1)〜(3)よシ求まる文字認識評価値vr(
P)は0.0〜1.0の値をとシ、パターンPが文字ち
しい程大きな値をとる。
以上のようにして上記文字形状評価値算出手段(51で
求めた文字形状計価値と、上記文字認識評価値算出手段
で求めた文字認識評価値は、上記評価値加算手段0へ送
られる。
求めた文字形状計価値と、上記文字認識評価値算出手段
で求めた文字認識評価値は、上記評価値加算手段0へ送
られる。
次に、上記評価値方口算手段0では、各要素パターンP
ij に対する文字評価値を、上記文字形状評価値算出
手段(5)で算出した文字形状評価値Vf(i、j)
と上記文字認識評価値算出手段a2で算出した文字認
識評価値Vr (Pij)との線形加算によシ求める。
ij に対する文字評価値を、上記文字形状評価値算出
手段(5)で算出した文字形状評価値Vf(i、j)
と上記文字認識評価値算出手段a2で算出した文字認
識評価値Vr (Pij)との線形加算によシ求める。
具体的には0式卯より費累パターンPijがどの程度文
字らしいかを示す文字評価値V(i、j)を求める。
字らしいかを示す文字評価値V(i、j)を求める。
v(1+ j)=vf (1,j)十Vr (Pij)
・・”・・(4!実除に上記基本パターンa9から求め
た要素パターンに対する文字評価値を第8図に示す。例
えば。
・・”・・(4!実除に上記基本パターンa9から求め
た要素パターンに対する文字評価値を第8図に示す。例
えば。
基本パターン「日」に対する文字形状評価値は[Q、4
sJであり2文字認識評価値は[0,91Jであシ9両
者を加算した文字評価値は「1.36jである。
sJであり2文字認識評価値は[0,91Jであシ9両
者を加算した文字評価値は「1.36jである。
なお、この例では連続する3個の基本パターンまでを結
合した場合についての例を示している。
合した場合についての例を示している。
次に文字切り出し手段(6)では上記文字評価値をもと
に従来の装置と同様の方法で切多出し評価値を求め、こ
の切り出し評価値を最大とする要素パターンの組合せを
最遠方文字切り出し結果と決定する。この実施例では、
第9図に示すように、すべての要素パターンの組合せの
うち「昭」+「本町十「6J 十rOJ +r年」の組
合せが切り出し評価値は1−12.21Jと最大になる
。従って上記文字切り出し手段(61では「昭」、[オ
IIJ、「6J。
に従来の装置と同様の方法で切多出し評価値を求め、こ
の切り出し評価値を最大とする要素パターンの組合せを
最遠方文字切り出し結果と決定する。この実施例では、
第9図に示すように、すべての要素パターンの組合せの
うち「昭」+「本町十「6J 十rOJ +r年」の組
合せが切り出し評価値は1−12.21Jと最大になる
。従って上記文字切り出し手段(61では「昭」、[オ
IIJ、「6J。
rOJ、r年」となる要素パターンの組を切り出し結果
とする。
とする。
そ[−で最後に上記出力手段(7)では、上記文字切如
出し手段(61で決定した要素パターンの組の情報に基
づいて上記文字列パターン記憶手段(3)から1文字ず
つ文字を切り出して出力する。
出し手段(61で決定した要素パターンの組の情報に基
づいて上記文字列パターン記憶手段(3)から1文字ず
つ文字を切り出して出力する。
次に以上述べたこの発明の効果を従来の装置の効果と比
較する。例えば1文字評価値として従来の装置で用いた
文字形状評価値のみを用いた場合要素パターン「60」
の形状が正方形に近いため第8因に示すように「60」
に対する文字形状評価値は「0.94Jと大きくなシ、
第10図に示すようにすべての要素パターンの組合せの
うち。
較する。例えば1文字評価値として従来の装置で用いた
文字形状評価値のみを用いた場合要素パターン「60」
の形状が正方形に近いため第8因に示すように「60」
に対する文字形状評価値は「0.94Jと大きくなシ、
第10図に示すようにすべての要素パターンの組合せの
うち。
「昭」+「和J +r60J + l’−年」の組合せ
が切り出し評価値は「6.52Jと最大となる。このた
め文字列バター:y641ri、 「昭」、「和J、
r60J。
が切り出し評価値は「6.52Jと最大となる。このた
め文字列バター:y641ri、 「昭」、「和J、
r60J。
「年」と切り出される。このように文字形状評価値のみ
を用いた切り出りでは1文字列パターン「60」を正[
ぐ切り出すことはできない。
を用いた切り出りでは1文字列パターン「60」を正[
ぐ切り出すことはできない。
以上に示すように入力文字列「昭和60年」■は、従来
の文字切り出し装置で用いている文字形状評価値のみを
用いた方法では正L〈切り出すことはできないが1本発
明では文字形状評価値と文字認識評価値を併用して切υ
出すため1個々の文字を正しく切り出すことが出来る。
の文字切り出し装置で用いている文字形状評価値のみを
用いた方法では正L〈切り出すことはできないが1本発
明では文字形状評価値と文字認識評価値を併用して切υ
出すため1個々の文字を正しく切り出すことが出来る。
なお、上記実施例では、横書1の文字列から文字を切り
出す場合について説明したが、この発明はこれに限らず
、縦tきの文字列から文字を切り出す場合に用いてもよ
い。
出す場合について説明したが、この発明はこれに限らず
、縦tきの文字列から文字を切り出す場合に用いてもよ
い。
また、上記実施例では3つの基本パターンを結合したパ
ターンまでの評価値を求める場合について説明しfcが
、これに限らず4個以上の基本パターンを結合したパタ
ーンの評価値を求めてもよい。
ターンまでの評価値を求める場合について説明しfcが
、これに限らず4個以上の基本パターンを結合したパタ
ーンの評価値を求めてもよい。
〔発明の効果〕
以上のように、この発明によれば従来の技術では切り出
すことのできなかった数字同士のような互いに接近した
パターンも1文字認識評価値手段を付加し1文字切り出
し手段に文字認識評価値を考慮に入れて文字を切夛出す
ように変更を加えることによシ正L〈切り出せる効果が
ある。
すことのできなかった数字同士のような互いに接近した
パターンも1文字認識評価値手段を付加し1文字切り出
し手段に文字認識評価値を考慮に入れて文字を切夛出す
ように変更を加えることによシ正L〈切り出せる効果が
ある。
第1図はこの発明の一実施例による文字パターン切り出
し装置の全体構成図、第2図は従来の文字パターン切り
出し装置の全体構成図、第3図は基本パターン領域検出
手段の処理例の説明図、第4図は要素パターンの例を示
す図1w、5図は要素パターンの組合せの例を示す図、
第6図は基本パターンの組合せと文字切り出り評価値の
関係を示す図、第1図は入力文字列の例を示す図、第8
図は各要素パターンの文字形状評価値2文字認識評価値
1文字評価値の例な示す図、第9図、810図はこの発
明の詳細な説明するための図である。 図中、(1)は用紙、f2)は走査手段、(3)は文字
列パターン記憶手段、(41は基本パターン領域検出手
段。 +51 Fi文字形状評価値、(61は文字切り出し手
段、(71け出力手段、αυは文字認識辞書記憶手段、
o4は文字認識評価値算出手段、ojは評価値、!JI
]3B:手段である。 なお図中同一あるいは相当部分には同一符号を付して表
示しである。
し装置の全体構成図、第2図は従来の文字パターン切り
出し装置の全体構成図、第3図は基本パターン領域検出
手段の処理例の説明図、第4図は要素パターンの例を示
す図1w、5図は要素パターンの組合せの例を示す図、
第6図は基本パターンの組合せと文字切り出り評価値の
関係を示す図、第1図は入力文字列の例を示す図、第8
図は各要素パターンの文字形状評価値2文字認識評価値
1文字評価値の例な示す図、第9図、810図はこの発
明の詳細な説明するための図である。 図中、(1)は用紙、f2)は走査手段、(3)は文字
列パターン記憶手段、(41は基本パターン領域検出手
段。 +51 Fi文字形状評価値、(61は文字切り出し手
段、(71け出力手段、αυは文字認識辞書記憶手段、
o4は文字認識評価値算出手段、ojは評価値、!JI
]3B:手段である。 なお図中同一あるいは相当部分には同一符号を付して表
示しである。
Claims (1)
- 用紙などに記入された文字列から1文字ずつ文字パター
ンを切り出す文字パターン切り出し装置において、用紙
上の文字列を光学的に走査し光電変換する走査手段と、
光電変換された上記文字列のパターンを記憶する文字列
パターン記憶手段と、上記文字列の方向と直交する方向
に上記文字列パターンを走査して求めた周辺分布値の連
続性に基づいて文字列パターンを分割し、分割して得た
基本パターンの左右端と上下端との座標より基本パター
ン領域を決める基本パターン領域検出手段と、単独の基
本パターン領域の文字形状評価値と連続する複数個の基
本パターン領域を結合した結合パターン領域の文字形状
評価値とを上記基本パターン領域の左右端と上下端の座
標から各々算出する文字形状評価値算出手段と、読取り
対象文字の基準パターンを格納した文字認識辞書記憶手
段と、単独の基本パターンに対する文字認識評価値と連
続する複数個の基本パターンを結合した結合パターンに
対する文字認識評価値とを上記文字認識辞書記憶手段に
記憶した基準パターンとの整合により求める文字認識評
価値算出手段と、上記文字形状評価値算出手段で算出し
た文字形状評価値と上記文字認識評価値算出手段で算出
した文字認識評価値とを加え合わせることにより、すべ
ての基本パターンと結合パターンとに対応する文字評価
値を算出する評価値加算手段と、上記基本パターン領域
の位置情報に基づいて切り出し候補位置のあらゆる可能
な組み合せを求め、各々の切り出し候補位置の組み合せ
について、切り出し候補位置で切り出された基本パター
ンと結合パターンとに対応する上記評価値加算手段で求
めた文字評価値に基づいて切り出し評価値を求め、この
切り出し評価値に基づいて最適な文字切り出し位置の組
み合せを決定する文字切り出し手段と、上記文字切り出
し手段の結果に基づいて上記文字列パターン記憶手段に
格納した1行の文字列パターンから1文字ずつ文字パタ
ーンを切り出して出力する出力手段とを具備することを
特徴とする文字パターン切り出し装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61033193A JPS62190575A (ja) | 1986-02-18 | 1986-02-18 | 文字パタ−ン切り出し装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP61033193A JPS62190575A (ja) | 1986-02-18 | 1986-02-18 | 文字パタ−ン切り出し装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS62190575A true JPS62190575A (ja) | 1987-08-20 |
JPH0476159B2 JPH0476159B2 (ja) | 1992-12-02 |
Family
ID=12379646
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP61033193A Granted JPS62190575A (ja) | 1986-02-18 | 1986-02-18 | 文字パタ−ン切り出し装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS62190575A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02139686A (ja) * | 1988-11-21 | 1990-05-29 | Fuji Electric Co Ltd | 文字読取方法 |
JPH03191491A (ja) * | 1989-12-21 | 1991-08-21 | Nec Corp | 文字列認識方法及びその装置 |
JPH03260886A (ja) * | 1990-03-12 | 1991-11-20 | Fuji Facom Corp | 文字認識方法 |
JP2012118649A (ja) * | 2010-11-30 | 2012-06-21 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57137976A (en) * | 1981-02-18 | 1982-08-25 | Nec Corp | Zip code discriminating device |
JPS60153575A (ja) * | 1984-01-23 | 1985-08-13 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
-
1986
- 1986-02-18 JP JP61033193A patent/JPS62190575A/ja active Granted
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57137976A (en) * | 1981-02-18 | 1982-08-25 | Nec Corp | Zip code discriminating device |
JPS60153575A (ja) * | 1984-01-23 | 1985-08-13 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02139686A (ja) * | 1988-11-21 | 1990-05-29 | Fuji Electric Co Ltd | 文字読取方法 |
JPH03191491A (ja) * | 1989-12-21 | 1991-08-21 | Nec Corp | 文字列認識方法及びその装置 |
JPH03260886A (ja) * | 1990-03-12 | 1991-11-20 | Fuji Facom Corp | 文字認識方法 |
JP2012118649A (ja) * | 2010-11-30 | 2012-06-21 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
Also Published As
Publication number | Publication date |
---|---|
JPH0476159B2 (ja) | 1992-12-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210150182A1 (en) | Cloud detection from satellite imagery | |
Manoharan | Flawless detection of herbal plant leaf by machine learning classifier through two stage authentication procedure | |
Biswas et al. | Writer identification of Bangla handwritings by radon transform projection profile | |
CN108280430A (zh) | 一种流程图像识别方法 | |
JPS62190575A (ja) | 文字パタ−ン切り出し装置 | |
Han et al. | Off-line cursive handwriting segmentation | |
JPH0452510B2 (ja) | ||
JPS6285394A (ja) | 文字認識装置 | |
JPH0337782A (ja) | 文字パターン切り出し装置 | |
Hawkins et al. | Automatic shape detection for programmed terrain classification | |
JP2925303B2 (ja) | 画像処理方法及び装置 | |
JP2580976B2 (ja) | 文字切出し装置 | |
Benafia et al. | Proposition of a graphic model with features for handwritten character recognition | |
JP2576080B2 (ja) | 文字切出し方法 | |
JPS6125284A (ja) | パターン認識装置 | |
WO2017203663A1 (ja) | 形状弁別装置、形状弁別方法及び形状弁別プログラム | |
JP2974145B2 (ja) | 文字認識結果の修正方法 | |
JPH0242589A (ja) | 文字パターン切り出し装置 | |
JPH0353392A (ja) | 文字認識装置 | |
JPS6334682A (ja) | 文字認識装置 | |
Lee et al. | Determining a maximum value yield of a log using an optical log scanner | |
JPS59106084A (ja) | 文字読取り装置 | |
JPH04260980A (ja) | 図形認識装置 | |
JP2974396B2 (ja) | 画像処理方法及び装置 | |
JPS6089290A (ja) | パタ−ン認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
EXPY | Cancellation because of completion of term |