JPS6360436B2 - - Google Patents

Info

Publication number
JPS6360436B2
JPS6360436B2 JP55084700A JP8470080A JPS6360436B2 JP S6360436 B2 JPS6360436 B2 JP S6360436B2 JP 55084700 A JP55084700 A JP 55084700A JP 8470080 A JP8470080 A JP 8470080A JP S6360436 B2 JPS6360436 B2 JP S6360436B2
Authority
JP
Japan
Prior art keywords
line segment
contour line
white
black
change point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55084700A
Other languages
English (en)
Other versions
JPS5710884A (en
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP8470080A priority Critical patent/JPS5710884A/ja
Publication of JPS5710884A publication Critical patent/JPS5710884A/ja
Publication of JPS6360436B2 publication Critical patent/JPS6360436B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 本発明は、輪郭線分抽出方式、特に水平、垂直
各方向に走査して最初に現われる白から黒への変
化点および/または黒から白への最後の変化点と
を検出し、隣接する走査における対応変化点間の
距離と閾値との比較により抽出された輪郭線分の
連続性を判定するに当り、入力画像情報の特性を
あらかじめ用意しておき、入力される画像情報に
対応づけて輪郭線分の連続性を判定する上記閾値
を可変とし、走査して得られた上記距離を入力さ
れる画像情報の特性に対応づけた形で閾値を選定
し輪郭線分の連続性を判定するようにした輪郭線
分抽出方式に関するものである。
文字を認識する場合、文字の太さには実質上情
報がないので細線化処理を行ない線図形化して文
字認識が行なわれている。細線化処理を行ない文
字認識をする手法は有効な仕方ではあるが、認識
対象文字が複雑になつてくると細線化処理がかえ
つて誤認識の発生原因となることがある。また細
線化処理は長時間を要する欠点もある。そこで文
字認識に当つて上記細線化処理を施こすことなく
文字の特徴を抽出しようとする手法として、文字
の輪郭をとらえ文字認識を行なう考え方が現われ
てきている。
従来の輪郭線分抽出方式は2値化された画像情
報が書込まれている画像メモリと、該画像メモリ
を走査する走査手段を有し、画像メモリの水平、
垂直方向の1行または1列を走査する毎に最初に
現われる白から黒への変化点と、最後に現われる
黒から白への変化点を検出し、このようにして検
出された変化点系列に基づき隣接する変化点間の
走査方向の距離が前もつて決められた閾値以上で
あれば不連続であるとし、これによりセグメント
化された1個または複数個の輪郭線分情報を抽出
していた。このような従来からの方式では、連
続、不連続の判定のための閾値が、例えば文字の
大きさ、筆記具の種類等により輪郭線の状態が変
化するにもかかわらず、固定的であるために予測
に反する輪郭線分情報が抽出されることがあり、
輪郭線分情報の抽出が誤まつているため文字認識
の結果に悪影響を及ぼす欠点があつた。
本発明は上記の問題点を解決することを目的と
しており、輪郭線分の連続、不連続判定のための
上記閾値をパラメータ化し、入力画像特性、例え
ば字種、線幅、文字の大きさ、筆記具の種類等に
より上記閾値を適宜切替り可変とすることによつ
て適切な判定を下す輪郭線分抽出方式の提供を目
的としている。そしてそのため、本発明の輪郭線
分抽出方式は画像メモリに格納されている2値化
入力画像情報を水平、垂直方向の各行列毎に走査
して、最初に現われる白から黒への変化点およ
び/または黒から白への最後の変化点と上記水
平、垂直方向の各行列毎に検出し、これら検出さ
れた行列における変化点と次の行列における対応
変化点との距離と、所定の閾値との大小によつて
走査文字の輪郭線分の連続性を判定する輪郭線分
抽出方式において、入力画像情報の特性をあらか
じめ用意しておき、入力される上記入力画像情報
に対応づけて上記入力画像情報の特性から閾値を
選定する閾値判定回路をもうけ、走査して得られ
る上記距離と上記閾値判定回路から得られた閾値
とを比較して輪郭線分の連続性を判定する上記閾
値を可変にするようにして輪郭線分の連続性を判
定するようにしたことを特徴としている。以下図
面を参照しつつ説明する。
第1図、第2図は輪郭線分の抽出の仕方を説明
する説明図、第3図は第1図の1部省略部分拡大
図、第4図、第5図は曲線を有する輪郭線分の抽
出を説明する説明図、第6図は文字がカスレたと
きの輪郭線分の抽出を説明する説明図、第7図は
第1図のx軸がXs1のときのy軸方向に走査した
場合の最初の白から黒と最後の黒から白への各変
化点の立上り、立下りを示すタイム・チヤート
図、第8図は第1図のx軸がX′s2のときのy軸方
向に走査した場合の上記各変化点の立上り、立下
りを示すタイム・チヤート図、第9図は本発明に
係る輪郭線分抽出方式の一実施例構成を示してい
る。
第1図において、認識対象文字「オ」を垂直方
向即ちy軸方向に走査して得られる最初の白から
黒への変化点系列(線分)と最後の黒から白への
変化点系列の輪郭線分が抽出されている。
白から黒への最初の変化点系列は点(Xs1
Ys1)のS1から点(Xe1、Ye1)のE1に終る線分、
点(Xs2、Ys2)のS2から点(Xe2、Ys2)のE2
終る線分、点(Xs3、Ys3)のS3から点(Xe3
Ys3)のE3に終る線分の3線分であり、黒から白
への最後の変化点系列は点(Xs1、Y′s1)のS′1
ら点(X′e1、Y′e1)のE′1に終る線分、点(X′s2
Y′s2)のS′2から点(Xe1、Y′s2)のE′2に終る線
分、点(Xs2、Y′s3)のS′3から点(Xe2、Y′s3)の
E′3に終る線分、点(Xs3、Y′s2)のS′4から点
(Xe3、Y′s2)のE′4に終る線分の4線分である。
第2図において、認識対象文字「オ」を水平方
向即ちx軸方向に走査して得られる最初の白から
黒への変化点系列は座標点を省略してSL1からEL1
の線分、SL2からEL2の線分、SL3からEL3の線分、
SL4からEL4の線分の4線分であり、黒から白への
最後の変化点系列はSR1からER1の線分、SR2から
ER2の線分、SR3からER3の線分の3線分である。
第3図は第1図のy軸の中間部分を1部分省略
し拡大して描いた認識文字「オ」の部分拡大図
で、図中二重白丸がy軸方向に走査したとき得ら
れる黒から白への最後の変化点を示している。一
般に黒から白への最後の変化点の座標f(xi、yj
とf(xi+1、yj+o)におけるy軸方向の距離nが所
定の値以上であれば即ち閾値以上であるならば点
(xi、yj)と点(xi+1、yj+o)は不連続と判定され
る。また逆にy軸方向の距離nが閾値以下である
ならば点(xi、yj)と点(xi+1、yj+o)は連続して
いるものと判定される。例えば同図におけるXs1
軸をy軸方向に走査して得られる黒から白への最
後の変化点A(Xs1、Y′s1)と近接するXs1+1軸を
y軸方向に走査して得られるその変化点B
(Xs1+1、Y′s1+1)とのy軸方向の距離nは「1」
であり、上記閾値が例えば「3」に選定されてい
るとすれば上記y軸方向の距離n=1は閾値3以
内であるから点Aと点Bは連続しているものと判
定される。これに対し上記変化点C(X′e1、Y′e1
とこれに近接する次の走査線の変化点D(X′e1+1
Y′s2)即ち(X′s2、Y′s2)とのy軸方向の距離n
は「Y′s2−Y′e1」であつて、当該距離n=Y′s2
Y′e1は上記閾値3以上であるから点Cと点Dは不
連続と判定される。
このように上記閾値を適当に定めると、第1
図、第2図の図中に示されている如く符号が丸で
囲まれた点例えばS2、S3などの位置は直前の走査
線上の変化点と不連続であり、輪郭線分を区別す
ることができる。
ところで上記第1図、第2図図示の輪郭線分抽
出は直線、斜線に対するものであつた。輪郭線分
抽出の線分が、曲線を含む場合の一例が第4図、
第5図に図示されている。第4図、第5図は所定
の閾値に対しx軸方向に走査して得られる白から
黒への最初の変化点系列(線分)と黒から白への
最後の変化点系列(線分)とをSL1EL1、SR1ER1
は表わしている。認識対象文字「S」の中央図示
Fに第4図図示の如く比較的大きな凹所があると
き線分SR2ER2と線分SRFERFが得られるのに対し第
5図図示の如く凹所が極めて小さいとき線分SR2
ER2が得られ、同一認識対象文字「S」に対して
異なつた輪郭線分が抽出される。
第6図は認識対象文字「−」の中央部がカス
レ、例えば該文字を走査して得られた2値化画像
情報の輪郭線分の図示G部分がカスレた状態を示
している。このように文字が筆記用具の種類によ
つてカスレたりしたとき認識対象文字「−」の輪
郭線分に不連続部分が生じ、認識対象文字「−」
と異なつた輪郭線分を抽出することとなる。
上述の認識対象文字の輪郭線分が異なつた状態
になるのは上記変化点から連続、不連続を判定す
る基準の閾値が入力画像情報の特性例えば字種、
線幅、文字の大きさ、筆記具の種類等の如何にか
かわらず固定的であるが故であり、これら入力画
像情報の特性に対処した閾値を選定することによ
り認識対象文字の正しい輪郭線分の抽出が期待さ
れる。
第7図は第1図のx軸がXS1のときのy軸方向
に走査した場合の白から黒への変化点と黒から白
への変化点の各々の立上りと立下りとを示すタイ
ム・チヤート図で、スキヤン・ゲートが論理
「1」になりy軸方向に沿つて走査されて行くと、
入力画像が「0」から「1」に変化する即ち白か
ら黒に変化する点Ys1で立上りを検出する。更に
y軸方向に走査が進むと入力画像は「1」から
「0」に変化する即ち黒から白に変化する点Y′s1
で立下りを検出する。そして走査はスキヤン・ゲ
ートが「0」になるまでy軸に沿つて続ける。
第8図は第1図のx軸がX′S2のときのy軸方向
に走査した場合の最初の白から黒への変化点と最
後の黒から白への変化点の各々の立上りと立下り
とを示すタイム・チヤート図で、同図の入力画像
が2回白から黒(「0」から「1」)へ変化してい
る。スキヤン・ゲートが論理「1」になりy軸方
向に沿つて走査されて行くと、入力画像が最初に
白から黒へ変化する点Y′s1で立上りを検出する。
更にy軸に沿つて走査が進むと入力画像は黒から
白へ変化するが、この変化は最後の黒から白への
変化点ではないものの一応立下りを検出する。更
にy軸に沿つて走査が進むと入力画像は白から黒
へ変化する。この変化点は最初の白から黒への変
化点ではないので立上りは変更されない。そして
走査がY′s2に来ると入力画像は最後の黒から白へ
の変化点となり、上記立下りはこの変化点Y′s2
立下り検出を行なう。そしてスキヤン・ゲートが
「0」となりうることによつて次のx軸を走査す
る。
第9図は本発明に係る輪郭線分抽出方式の一実
施例構成を示し、図中1は立上り検出回路、2は
立下り検出回路、3はスキヤン(走査)・カウン
タ、4,5はレジスタ、6ないし9はスキヤン
(走査)・レジスタ、10,11は演算回路、12
は位置決め回路、13は閾値判定回路、14,1
5は連続カウンタ、16は最終ゲート回路、17
はカウンタをそれぞれ表わしている。
立上り検出回路1は画像メモリに格納されてい
る画像を順次読出した2値化入力画像の「0」か
ら「1」への立上りを検出し、その立上り位置を
カウンタ17で数えその内容をレジスタ4にセツ
トする。この立上りの位置は第1図の白から黒へ
の最初の変化点のy座標のYs1に対応するもので
ある。レジスタ4に当該立上り位置がセツトされ
ると、該レジスタ4から立上り検出回路1へサン
プル禁止信号が出力され、これ以後入力画像が再
び「0」から「1」への立上り画像を立上り検出
回路1へ入力しても該立上り画像が受信されるこ
とはない。即ち上記最初の白から黒への変化点の
みを該立上り検出回路1は検出するのである。そ
してレジスタ4にセツトされた立上り位置とスキ
ヤン・カウンタ3の内容とがレジスタ7に格納さ
れる。
立下り検出回路2は入力画像の「1」から
「0」への立下りを検出し、その立下り位置をカ
ウンタ17で数え、その内容をレジスタ5にセツ
トする。そして該レジスタ5にセツトされた立下
り位置とスキヤン・カウンタ3の内容とがレジス
タ9に格納される。1列の走査中に複数の立下り
が存在していても、立下り検出回路2はこれらの
立下りを検出しその立下り位置をカウンタ17で
数え、その内容をレジスタ5にセツトするととも
に、該レジスタ5にセツトされた位置とスキヤ
ン・カウンタ3との内容を順次レジスタ9に格納
させ、最後の立下り位置とスキヤン・カウンタ3
との内容が最終的にレジスタ9に残つた形で格納
される。即ち上記最後の黒から白への変化点の位
置がレジスタ9に格納される。
なおレジスタ7およびレジスタ9に格納された
内容は走査中の1列が終了することを示すスキヤ
ン・ゲートが「1」から「0」への立下がりでレ
ジスタ6およびレジスタ8にそれぞれ転送され
る。
そして次の列の走査が開始され立上り検出回路
1及び立下り検出回路2がそれぞれ立上り位置、
立下り位置を検出し上記と同じ経過を経てそれぞ
れの変化点の位置を示す内容がレジスタ7及びレ
ジスタ9に格納される。
演算回路10は上記レジスタ6とレジスタ7の
それぞれの内容と、閾値判定回路13からの内容
とが入力されており、レジスタ6とレジスタ7と
の内容による立上り位置の差が求められ、そして
当該立上り位置の差の値と上記閾値判定回路13
によつて決定された閾値とが比較される。立上り
位置の差の値が当該閾値以下であるとき、連続カ
ウンタ14の内容を+1歩進させる。即ちレジス
タ6とレジスタ7とに格納されている2つの変化
点は連続性を有するものと判定されているのであ
る。また上記立上り位置の差の値が閾値より大き
いとき、これら2つの変化点は不連続であるもの
と判定され、レジスタ6に格納されている内容か
らその線分(変化点系列)の終点座標が求めら
れ、またレジスタ7に格納されている内容から次
の線分の始点座標が求められる。そして上記立上
り位置の差の符号(+または−)によつてフラグ
が付けられる。このようにして得られる始点、終
点およびフラグの情報は図示されていない輪郭線
分特徴格納用メモリに書込まれる。
演算回路11にはレジスタ8とレジスタ9のそ
れぞれの内容と閾値判定回路13からの内容とが
入力されており上記演算回路10と同様の機能を
行ない、最後の黒から白への変化点系列の連続性
を判定する。最終ゲート回路16にはスキヤン・
ゲートの「1」から「0」の最後の情報をあらか
じめ用意されており、当該最終ゲート回路16か
らの入力信号で認識対象文字の輪郭線分の抽出が
終了することを指示する。
なお該演算回路11は1列の走査が終る即ちス
キヤン・ゲートが「1」から「0」への立下り後
動作する。そして上述の如く、その始点、終点お
よびフラグの情報は輪郭線分特徴格納用メモリに
転送される。
閾値判定回路13は入力フオーマツト情報およ
び位置決め回路12から送られてくる入力画像特
性情報即ち入力画像情報の特性から閾値即ち演算
回路10や11に供給する比較基準値を決定する
回路である。当該閾値は入力画像の位置決め回路
12によつて切出される枠の大きさ即ち文字の大
きさ、或は字種、線幅、筆記具の種類等によつて
決定される。例えば筆記具についてみると、鉛
筆、ボール・ペン、万年筆またはフエルト・ペン
によつて書かれた文字の種類によつて上記閾値は
異なつてくる。フエルト・ペン等コントラストの
大きなものは閾値は小さな値を採ることができる
のに対し、鉛筆等のカスレやすいもの等は大きな
値を選定されることとなる。
一般に閾値に対する文字認識度を統計的に集積
しておき、該情報をフオーマツト情報として入力
することも有力な手法であり、また閾値が大きく
選定されていることに起因して文字認識に対して
電子計算機からの認識拒絶されたときは、該閾値
を降下させ、リスキヤンさせて輪郭線分抽出する
ことが行なわれる。
以上説明した如く、本発明によれば、輪郭線分
を抽出するに当つて連続、不連続の判定をする閾
値をパラメータ化し、入力画像の各種情報により
閾値を可変とすることにより、認識対象文字の輪
郭線分の連続、不連続性の適確な判断が向上し、
長時間の細線処理による文字認識に代り短時間で
の文字認識ができるようになる。
【図面の簡単な説明】
第1図、第2図は輪郭線分の抽出の仕方を説明
する説明図、第3図は第1図の1部分省略し拡大
して描いた認識文字「オ」の部分拡大図、第4図
は認識文字「S」の中央部に大きな凹所を有する
ときの輪郭線分の現れ方を説明する線分説明図、
第5図は認識文字「S」の中央部に凹所があると
きの輪郭線分の現れ方を説明する線分説明図、第
6図は認識文字「−」の中央部がカスレたときの
輪郭線分の現れ方を説明する線分説明図、第7図
は第1図のx軸がXs1のときのy軸方向に走査し
た場合の各変化点の立上り、立下りを示すタイ
ム・チヤート図、第8図は第1図のx軸がX′s2
ときのy軸方向に走査した場合の各変化点の立上
り、立下りを示すタイム・チヤート図、第9図は
本発明に係る輪郭線分抽出方式の一実施例構成を
示している。 図中、1は立上り検出回路、2は立下り検出回
路、10,11は演算回路、13は閾値判定回
路、14,15は連続カウンタを表わす。

Claims (1)

  1. 【特許請求の範囲】 1 画像メモリに格納されている2値化入力画像
    情報を水平、垂直方向の各行列毎に走査して、最
    初に現われる白から黒への変化点および/または
    黒から白への最後の変化点を上記水平、垂直方向
    の各行列毎に検出し、これら検出された行列にお
    ける変化点と次の行列における対応変化点との距
    離と、所定の閾値との大小によつて走査文字の輪
    郭線分の連続性を判定する輪郭線分抽出方式にお
    いて、 入力画像情報の特性をあらかじめ用意してお
    き、入力される上記入力画像情報に対応づけて上
    記入力画像情報の特性から閾値を選定する閾値判
    定回路をもうけ、走査して得られる上記距離と上
    記閾値判定回路から得られた閾値とを比較して輪
    郭線分の連続性を判定する上記閾値を可変にする
    ようにして輪郭線分の連続性を判定するようにし
    たことを特徴とする輪郭線分抽出方式。
JP8470080A 1980-06-23 1980-06-23 Border segment extraction system Granted JPS5710884A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8470080A JPS5710884A (en) 1980-06-23 1980-06-23 Border segment extraction system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8470080A JPS5710884A (en) 1980-06-23 1980-06-23 Border segment extraction system

Publications (2)

Publication Number Publication Date
JPS5710884A JPS5710884A (en) 1982-01-20
JPS6360436B2 true JPS6360436B2 (ja) 1988-11-24

Family

ID=13837934

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8470080A Granted JPS5710884A (en) 1980-06-23 1980-06-23 Border segment extraction system

Country Status (1)

Country Link
JP (1) JPS5710884A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02232690A (ja) * 1989-03-04 1990-09-14 Brother Ind Ltd データ変換装置

Also Published As

Publication number Publication date
JPS5710884A (en) 1982-01-20

Similar Documents

Publication Publication Date Title
US4481665A (en) Character segmentation method
US4408342A (en) Method for recognizing a machine encoded character
JPH06309498A (ja) 画像抽出方式
JPS6357831B2 (ja)
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
EP0524797B1 (en) Image processing method and apparatus
KR100383858B1 (ko) 문자인식장치의 문자추출방법 및 장치
JPS62254282A (ja) 重畳するパタ−ンを分離する方法及び装置
JPS6360436B2 (ja)
JPH06208625A (ja) 画像処理方法及び装置
JPH11219409A (ja) 文書読取装置
JP2821285B2 (ja) 画像処理方法及び装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH07182459A (ja) 表構造抽出装置
JP4242962B2 (ja) 文字切出装置
JP3710164B2 (ja) 画像処理装置及び方法
JPH0277891A (ja) 文字認識装置
KR100332752B1 (ko) 문자인식방법
JP3186712B2 (ja) 文書読取装置
JP2674475B2 (ja) 文字読取装置
JPH0223904B2 (ja)
JPH0433074B2 (ja)
JPS603676B2 (ja) 交差点抽出方式
JPS6019285A (ja) ストロ−ク抽出方法
JPH08339424A (ja) 画像処理装置及び方法