JPH06195513A - 光学式文字認識システム用折曲点抽出方法 - Google Patents

光学式文字認識システム用折曲点抽出方法

Info

Publication number
JPH06195513A
JPH06195513A JP5171761A JP17176193A JPH06195513A JP H06195513 A JPH06195513 A JP H06195513A JP 5171761 A JP5171761 A JP 5171761A JP 17176193 A JP17176193 A JP 17176193A JP H06195513 A JPH06195513 A JP H06195513A
Authority
JP
Japan
Prior art keywords
contour
point
points
bending
bending point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5171761A
Other languages
English (en)
Other versions
JP2641380B2 (ja
Inventor
Hiroyasu Takahashi
ヒロヤス・タカハシ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPH06195513A publication Critical patent/JPH06195513A/ja
Application granted granted Critical
Publication of JP2641380B2 publication Critical patent/JP2641380B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/182Extraction of features or characteristics of the image by coding the contour of the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【目的】 光学式文字認識処理手順に用いる折曲点を文
字画像から抽出するコンピュータ実施方法を提供するこ
と。 【構成】 認識対象の文字画像を表す画素配列パターン
の1つ以上の輪郭を追跡し、各輪郭点について、輪郭湾
曲の角度を表す先鋭度値を計算し、先鋭度値リストに書
き込む(ステップ68)。先鋭度値リストを、全て凸状
の湾曲あるいは全て凹状の湾曲となるように、一連の連
続点を有する複数の輪郭群に分割する(ステップ7
0)。次いで、1回以上の反復によって発見的に決定さ
れたパラメータを用いて、折曲点を1つ以上の輪郭群か
ら抽出し、折曲点とそれらのオリエンテーションと先鋭
度とのリストを含む折曲点データ集合出力を生成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は光学式文字認識に用い
るためのデータ発生に関する。更に特定すれば、この発
明は光学式文字認識システムにおける構造分析や文字分
類のための幾何学的特徴データ及び位相情報(topo
logical information)、具体的に
は折曲点の獲得に関するものである。
【0002】
【従来の技術】光学式文字認識では、対象となる文字の
特徴を表す選択された文字データを分類処理過程に用
い、入力として与えられた文字の特徴を基に文字を分類
して文字認識を試みる。光学式文字認識のために提案さ
れた種々の文字の特徴の中で、文字の「折曲点(ben
ding point)」は、最近大きな注目を集めて
いる。折曲点は、湾曲の位置や先鋭度等の属性を有する
位相的な(topological)湾曲の特徴を表
す。光学式文字認識システムにおいて文字の折曲点を含
む幾何学的情報を用いて構造分析及び文字分類を行なう
と、高い文字認識率が達成される。例えば、折曲点の特
徴を用いて、バック・プロパゲーション法を用いたニュ
ーラル・ネットワーク光学式文字認識システムにおい
て、非常に高い認識率を得ることができるということが
報告されている(H.タカハシ「幾何学的及び領域パタ
ーンの特徴を用いたニューラル・ネットORC」(19
91年10月))。
【0003】歴史的に、入力された文字データから折曲
点情報を抽出することが課題であった。文字によっては
多数の折曲点を有し、各折曲点の特徴及び有意度に関し
て、意味のない特徴は排除し、関連のある特徴を保存す
るよう判断を下さなければならない。適切な折曲点を識
別するために、複雑なアルゴリズムが提案されている。
例えば、I.セキタ等は「弛緩照合のスプライン機能に
よる手書き日本語文字の特徴抽出 」(パターン認識、
Vol.21, No.1, pp.9〜17(198
8))において、非常に時間がかかるスプライン近似方
法を開示している。この方法は、従来の方法の5倍のC
PU時間がかかると言われているが、文字認識率が改善
されたことにより、肯定的に正当化されている。
【0004】不適当な処理時間をかけずに高い認識率を
達成する折曲点抽出方法は、これまで提案されていな
い。したがって、適切に選択された折曲点データによっ
て高い認識率を得ることができるとすれば、既存の処理
手順についてこれまで認識されている欠陥を克服する高
速且つ正確な折曲点抽出方法に対する明らかな要求は、
未だに満たされないでいる。
【0005】
【発明が解決しようとする課題】上述の従来技術の欠点
及び欠陥に鑑みて、この発明の主要な目的は、光学式文
字認識に用いるための折曲点データ集合を生成するため
の折曲点抽出に対する新規な折曲点抽出方法を提供する
ことである。
【0006】この発明の別の目的は、処理時間内に最小
の費用で折曲点データ集合を生成するための折曲点抽出
方法を提供することである。
【0007】この発明の更に別の目的は、高い文字認識
率を達成する折曲点データを生成する折曲点抽出方法を
提供することである。
【0008】
【課題を解決するための手段】これらの及び他の目的及
び利点は、光学式文字認識システムに用いる、文字画像
から折曲点を抽出するためのコンピュータ実施方法によ
って達成される。この発明の一実施例においては、文字
画像の輪郭(ストロークの境界)を追跡し、発見的に決
定されたパラメータを、データ集合出力として与えられ
ている位置、湾曲の角度、凸凹及び先鋭度等の選択され
た属性と共に用いて、強い湾曲を折曲点として検出す
る。
【0009】詳細には、この発明の好適な方法は、認識
対象の文字画像を表す白及び黒の画素の画素配列パター
ンを入力するステップを含む。画素配列パターンは、前
記文字画像の輪郭を表す複数のアレイ位置を含んでい
る。その画素配列パターンを走査し、1つ以上の文字画
像の輪郭を追跡して輪郭点のリストを生成する。各輪郭
点毎に、輪郭の湾曲度を表す先鋭度を計算し、先鋭度値
リストに書き込む。この先鋭度値リストを、全て凸状の
湾曲又は全て凹状の湾曲である一連の連続点を有する複
数の輪郭群に分割する。次いで、選択された折曲点を1
回以上の反復において、発見的に決定されたパラメータ
を用いて1つ以上の輪郭群から抽出し、文字折曲点とそ
のオリエンテーションと先鋭度とのリストを含む折曲点
データ集合出力を生成する。
【0010】
【実施例】自動化された光学式文字認識処理手順によっ
て認識可能な任意の文字画像には、当該文字画像が一員
であるクラスに特有と考えられる折曲点が1つ以上存在
する。図1〜図4は、文字画像の折曲点の例を示すもの
である。各図において、文字画像は24×18個の画素
からなる画素配列パターンとして表され、各画素配列パ
ターンは白及び黒の画素を含み、黒い画素は文字画像に
対応するよう配列されている。図1及び図2において、
黒い画素はアステリスク「*」によって示されおり、白
い画素は白い空間として示されている。
【0011】図1は文字画像「A」を示している。この
画像は「a」〜「g」で識別される7つの折曲点を有し
ている。図2は文字画像「D」を描いたもので、「a」
〜「f」の6つの折曲点を示している。任意の文字画像
に対する折曲点の最少数は、例えば数字「1」の画像の
ように、通常は2つである。図3及び図4は、図1及び
図2の折曲点を、x−y座標位置、折曲点が凸状か凹状
か、折曲点の方向及び折曲点の先鋭度を示すようにそれ
ぞれ表にまとめたものである。x−y座標は折曲点の画
素配列位置である。凸/凹の指示は折曲点における輪郭
の湾曲の性質を示す。曲がりの方向は8つに量子化され
る(例えば、上=0、左=2、下=4、右=6、右上=
7等)。先鋭度は、当該折曲点とそのN個前の点とを結
ぶ線と、当該折曲点とそのN個後ろの点とを結ぶ線との
なす角度を用いて計算される。角度が鋭い程、先鋭度値
は大きくなる(例えば、9は極めて強い先鋭度を表し、
1は極めて弱い先鋭度を表す)。
【0012】この発明の折曲点抽出方法は、入力された
文字画像から折曲点データ集合を発生し、後の文字認識
に用いることができるようにするものである。図5にお
いて、文書10は認識対象の1つ以上の文字画像を含ん
でいる。文書10は、多くの形式及び形態の広範囲の文
字画像担持媒体を含む。例えば、文書10は英数字のテ
キスト情報を含む手紙、或はグラフィックス及びテキス
ト情報を含む図面である。また、文書10は、例えば郵
便小包で使われ得るような、走査を必要とする英数字テ
キスト情報を有する小包、ラベル又はタグでもよい。各
入力された文書10は走査されてしきい値処理され、文
字は従来の走査・しきい値処理・セグメント化装置12
を用いてセグメント化される。この形式の装置は当該技
術分野ではよく知られており、典型的には、文書供給機
構、光源、レンズ、一線上に配置された複数の光学的感
知素子、しきい値処理回路及びセグメント化回路を備え
ている。光学的感知素子の数は典型的には1mm当たり
約8個である。即ち、主走査方向における画素密度は、
典型的には200画素/インチであり、主走査方向に垂
直な副走査方向における画素密度も200画素/インチ
である。1つの光学素子は1つの画素に対応するアナロ
グ信号を発生し、このアナログ信号はしきい値処理回路
に印加される。該アナログ信号が所定のしきい値より小
さいとき、黒い画素を表す二進の「1」が発生され、一
方、該アナログ信号が所定のしきい値より大きいとき、
白い画素を表す二進の「0」が発生される。セグメント
化回路は各文字画像を図5に示すような個別の文字画素
配列パターンに区分する。画素配列パターン14は、入
力記憶バッファ16内の例えば24×16個の画素から
成るフレームに記憶することができる。
【0013】ここで理解すべきことは、この発明の折曲
点抽出方法は、光学式文字認識プロセスにおいて文書か
ら文字が取得された時点で実施される(invoke
d)ということであり、該文字は走査され、しきい値処
理され、セグメント化され、入力記憶バッファ16に記
憶される。この発明の折曲点抽出方法は、中央処理装置
(CPU)20、1つ以上の記憶レジスタ22、局所リ
ードオンリ及びランダム・アクセス・メモリ24、及び
この発明の折曲点抽出方法を実行するための実行可能な
命令セットを含むプログラムを記憶するための長期間プ
ログラム・メモリ26を備えた従来のデータ処理システ
ム18を用いて実施することができる。この発明を実施
するのに適した従来のデータ処理システムとしては、I
BMのOS/2(登録商標)オペレーティング・システ
ムの下で動作するIBM PS/2(登録商標)のよう
なスタンド・アロン型パーソナル・コンピュータ(P
C)がある。他のデータ処理システムとしては、ネット
ワークに組み込まれたPC及びワークステーション、及
び、ミドレンジ及びメインフレーム・プラットホームが
含まれる。この発明の実施例に係る折曲点抽出方法はソ
フトウエアで実施されるが、以下により詳しく述べるよ
うに、部分的にハードウエアでの実施を含むこともでき
る。データ処理システム18は、折曲点データ集合の出
力を生成し、これはテープ、ディスクその他の公知の永
久記憶媒体を用いる従来の出力記憶装置26に記憶され
る。出力記憶装置26に記憶された折曲点データ集合
は、光学式文字認識システム28へ入力される。この発
明にしたがって発生される折曲点データ集合を受け取る
には、種々の光学式文字認識システムを用いることがで
きるが、従来の技術で先に論じたように、それにはバッ
ク・プロパゲーション法を用いたニューラル・ネットワ
ークOCRシステムが含まれる。
【0014】次に図6〜図8を参照し、一例として数字
の「8」に対応する文字画像を用いて、図9aも参照し
ながら、好適な折曲点抽出処理手順について説明する。
この数字を用いるのは、外側及び内側の輪郭を含んでお
り、しかも不当に入り組んでおらず、さほど複雑でもな
いからである。文字画像の走査は、図6のステップ50
にて開始され、1つ以上の画素配列パターンが生成さ
れ、入力記憶バッファ16に記憶される。図9aの画素
配列パターン100は、認識対象の文字画像を表す24
×16の黒及び白の画素から成る配列である。この画素
配列パターンは、図9bに示される位置102〜108
を含む複数の配列位置を有しており、文字画像の連続し
た輪郭を表す。折曲点抽出処理手順のステップ52で、
画素配列パターン100はデータ処理システム18に入
力され、局所メモリ24に記憶される。
【0015】折曲点抽出処理手順の第1の目的は、文字
画像100の外側及び内側の連続した輪郭を追跡し、追
跡した各輪郭に対して輪郭点のリストを作成することで
ある。文字画像「8」の輪郭を追跡するための処理手順
は、画素配列パターン100の各ラインを左から右に水
平方向に掃引して走査する2×2構成のマスク・アレイ
110を用いる。図9cは、マスク・アレイ110が
8、4、2及び1の二進位置値が割り当てられている4
個のアレイ位置を含むことを示している。これらの位置
に現れる黒及び白の画素の組み合せにしたがって、0か
ら15までの値をマスク・アレイから読み取ることがで
きる。
【0016】折曲点抽出処理手順のプロセス・ステップ
54において、マスク・アレイ110を用いて、画素配
列パターン100の各位置が走査される。この走査によ
って、折曲点抽出処理過程のステップ56及び58にお
けるパターン・マトリクスとタグ・マトリクスとが生成
される。パターン・マトリクスは図9dに、タグ・マト
リクスは図9eにそれぞれ示されている。各マトリクス
は25×17個の記憶位置を含んでおり、これらの記憶
位置は、図9aに示すマスク・アレイ110の中央が画
素パターン100を左縁から右縁へ、画素配列パターン
の上縁から開始して下縁に到達するまで、画素配列パタ
ーンの各行間を走査することによって生成される。この
ようにして、パターン・マトリクス及びタグ・マトリク
スの各内側位置が、画素配列パターン100の4つの位
置の交点を表す1つの位置に対応付けられることにな
る。
【0017】パターン・マトリクス120の各画素は、
2×2マスク・アレイ110の4つのアレイ位置の色か
ら決定される加重和である値(0−15)を有する。こ
れらの値は追跡方向を決定するために用いられるが、こ
れについては後述する。タグ・マトリクスの各画素に
も、マスク・アレイ110の位置に現れる色から決定さ
れる値が割り当てられる。マスク・アレイの位置の全て
が白又は黒の場合、値ゼロ(輪郭なし)がその対応する
タグ・マトリクスの位置に割り当てられる。また、マス
ク・アレイが対角線上に2つの黒及び2つの白の画素を
示す場合、値2がそのタグ・マトリクスに割り当てられ
る。他の全てのマスク・アレイの色の組み合せでは、タ
グ・マトリクスに値1が割り当てられる。タグ・マトリ
クス130は輪郭が1回しか追跡されないように追跡の
制御を行なうのに用いられる。2というタグ・マトリク
ス値は、マトリクス位置が2つの輪郭の一部であるとき
に用いられる特別な場合である(図9f参照)。
【0018】画素配列パターン100を走査してパター
ン・マトリクス120及びタグ・マトリクス130を生
成する処理手順は、従来のC言語のようなプログラミン
グ言語を用いてソフトウエアで実施するのが有利であ
る。加えて、プロセス・ステップ54〜58は、好まし
くは一対の16ビットシフトレジスタを含む記憶レジス
タ22を用いてハードウエアで部分的に実施することも
可能である。このような実施においては、画素配列パタ
ーン100の連続するライン対がシフト・レジスタに入
力される。各レジスタを連続的にシフトすることによ
り、2×2マトリクス・アレイ110の各位置に対する
値が連続的に読み出され、パターン・マトリクス及びタ
グ・マトリクスを生成するために用いられる。タグ・マ
トリクスはパターン・マトリクス120の対応する位置
からの値を用いて生成することができる。
【0019】折曲点抽出処理手順のプロセス・ステップ
60において、入力された第1の輪郭を追跡し、x−y
リストを作成する。追跡処理手順では、タグ・マトリク
ス130を左から右の方向に走査し、輪郭の開始点を示
す第1の非ゼロ値を見出す。この開始点のx−yタグ・
マトリクス座標位置はx−y座標リスト140(図11
c)に記憶される。次の輪郭点の方向を決定するため
に、x−y座標位置においてパターン・マトリクス12
0を対応する参照する。この位置には、マスク・アレイ
110がその位置に配置されたときにその中に含まれる
白及び黒の画素のパターンに対応する0から15までの
値が記憶される。このパターン・マトリクス記憶位置に
割り当てられた数に基づいて、図10に示すように、追
跡方向が決定される。図10は、パターン・マトリクス
値が1、5、13のとき、追跡方向は下であり、、パタ
ーン・マトリクス値が2、3、7のとき、追跡方向は左
であり、パターン・マトリクス値が8、10、11のと
き、追跡方向は上であり、パターン・マトリクス値が
4、12、14のとき、追跡方向は右であることを示し
ている。パターン・マトリクス値が6又は9のとき、図
10に示すように、以前の輪郭点に対する方向値を参照
して、図10に示すように、どの方向を取るかが判断さ
れる。パターン・マトリクスに割り当てられる方向値
は、対応するマスク・アレイのパターンの外見に基づい
て直観的に正しいことが図10から理解される。マスク
・アレイを画素配列パターン上に配した窓と考えるなら
ば、各マスク・アレイのパターンは、入力された文字画
像の輪郭上の位置に対応するように現れる。例えば、図
9dは、12及び5の値のマスク・アレイが発生される
文字輪郭パターン上の位置を示している。追跡プロセス
期間において、文字輪郭はマスク・アレイ値に割り当て
られた方向に追跡される。
【0020】図9aの画素配列パターンの場合、タグ・
マトリクス130から決定される追跡開始点は、パター
ン・マトリクス値1に対応する。図11aに示すよう
に、次の輪郭点に向かう方向は下方である。図11aの
残りの矢印は、後続する各輪郭点におけるパターン・マ
トリクス値に基づいた連続した追跡方向を示している。
図11bはタグ・マトリクス130の輪郭開始点を示
す。開始点のx−y座標をx−yリストに設定すると、
その位置におけるタグ・マトリクス値は1だけ減分さ
れ、輪郭点の処理が完了したことが示される。次に、パ
ターン・マトリクス120から決定した追跡方向に1位
置だけ移動させることによって、タグ・マトリクスから
次の輪郭点のx−y座標が決定される。次の輪郭点のx
−y座標はx−yリストに記憶され、輪郭全体が追跡さ
れるまで、同様の処理が継続される。図11cは、追跡
処理手順によって生成されたx−yリスト140を示
す。この追跡によって、入力文字画像「8」の外側輪郭
を規定するx−y座標点のリストが作成される。引続
き、図12a〜図12cに示すように、2度目及び3度
目の追跡が同様に行なわれ、数「8」の内側輪郭に対し
てx−yリスト142及び144が作成される。x−y
リスト140、142、144の作成後は、画素配列パ
ターン110、パターン・マトリクス120及びタグ・
マトリクス130は不要であって、破棄してよい。これ
は、全ての輪郭点の識別が完了し、それぞれのx−yリ
ストへの蓄積が完了したからである。折曲点抽出処理手
順のステップ62は、未だ輪郭が残っているかどうかを
決定する検査を示している。
【0021】全文字輪郭の識別に続いて、折曲点抽出処
理手順はプロセス・ステップ64(図7)を実行する。
ここで、x−yリスト内で選択された点の間のオリエン
テーション方向(orientation direc
tion)を表すオリエンテーション・リストを生成す
る。図13に示すように、オリエンテーション・リスト
は、オリエンテーション・マトリクス索引表150を用
いて迅速に生成することができる。オリエンテーション
・マトリクス150には複数の記憶位置があり、それぞ
れの記憶位置は、1つの輪郭点と選択された次の輪郭点
との間のオリエンテーション方向を表す値を含んでい
る。オリエンテーション・マトリクスは、輪郭点と選択
された次の輪郭点との間のx−y座標値の差を表すx−
yオフセット値を用いてアドレスすることができる。図
14aは、一例として、一連のx−y輪郭点座標値を含
むx−yリスト152を示している。それぞれの輪郭点
からそのN個後ろの輪郭点に至るオリエンテーション方
向を見つけることが望ましい。しきい値の増分に用いる
数Nは変えてもよいが、24×16画素から成るアレイ
・パターンではN=3を用いると良好な結果が得られ
た。それより多くの位置を有する画素配列パターンで
は、大きい値のNを用いることができる。例えば、図1
3及び図14aは、N=5のしきい値増分値に基づいて
いる。
【0022】このように、各輪郭点に対するオリエンテ
ーションは、当該輪郭点からそのN個後ろの点に至る矢
印として定義される。これは、好ましくは(2N+1)
×(2N+1)個の要素から成り予め計算されたオリエ
ンテーション・マトリクス150を用いることによって
迅速に求められる。図14aでは、x−yリスト152
の最初の輪郭点(x=8、y=1)と、その点から5個
後ろの輪郭点(x=6、y=4)との間のx−yオフセ
ット値は、それぞれdx=−2及びdy=3である。こ
れらの値を、オリエンテーション・マトリクス150の
アドレスとして用いると、基準方向(例えばゼロ度)か
らオリエンテーション方向への角度を表すオリエンテー
ション値Θを迅速に決定することができる。図15は、
オリエンテーション値が文字「8」の外側の輪郭とどの
ように関連するかを図式的に示している。折曲点抽出処
理手順のステップ64で決定されるオリエンテーション
値は、図14bに示すオリエンテーション・リスト16
0に記憶される。場合によっては、折曲点抽出処理手順
のステップ66(図7)にあるように、平滑化を行なっ
て輪郭点間のオリエンテーションの連続性を強めること
が好ましい。平滑化は、対象となる輪郭点の直前及び直
後の輪郭点に対するオリエンテーション値の加重平均を
取ることによって、輪郭点間の一層一般的な角度を決定
するものである。例えば、i番目の輪郭点に対する平滑
化されたオリエンテーション値Θiは、直前の輪郭点に
対するオリエンテーション値Θi-1及び直後の輪郭点に
対するオリエンテーション値Θi+1から
【数1】(Θi-1 + 2Θi + Θi+1)/4 に従って決定される。画素配列パターンの大きさが50
×50画素以上であり、しきい値の増分Nがおよそ7個
又はそれ以上の輪郭点である場合、平滑化は一般的に不
要である。
【0023】オリエンテーション・リストの作成及びそ
の平滑化に続いて、折曲点抽出処理手順はプロセス・ス
テップ68において先鋭度リストを生成する。先鋭度リ
ストは図14cに参照番号170で示されている。先鋭
度リストは、各輪郭点とそこからN個後ろの輪郭点との
間の湾曲の先鋭度角を表す値を決定することによって生
成される。先鋭度角は、i番目の輪郭点に割り当てられ
たオリエンテーション値Θiと(i+N)番目の輪郭点
に割り当てられたオリエンテーション値Θi+Nとの間の
差を求めることによって容易に見出される。値Nはオリ
エンテーション値を割り当てる際に用いたものと同一で
あることが好ましい。
【0024】折曲点抽出処理手順のプロセス・ステップ
70において、先鋭度リスト170を1つ以上の輪郭群
に分割する。各輪郭群は、全てが凸状の湾曲或は全てが
凹状の湾曲を形成する一連の連続した輪郭点から成る。
凸状及び凹状は湾曲の角度から容易に決定される。N個
前の点からN個後ろの点を見て湾曲度が180度以下の
場合、湾曲は凸状とみなされる。他の全ての湾曲度は凹
状である。図16は、文字「8」について凸状及び凹状
の輪郭群を識別した結果を示している。2つの凸状の輪
郭群182及び184が存在する。輪郭群186、18
8、190、192は全て凹状の輪郭群である。
【0025】折曲点抽出の次の一連のステップでは、発
見的に決定されたパラメータに基づく折曲点の抽出が試
みられる。これらのパラメータは、折曲点抽出処理手順
を実行する前に、実験によって決定される。本質的に
は、最良の初期近似を行ってパラメータを最適化し、可
能な最高の認識率を得ることである。以下の3種類のパ
ラメータが用いられる。第1のパラメータAnは先鋭度
しきい値を表し、この先鋭度しきい値より低い先鋭度角
を有する折曲点は排除される。第2のパラメータはエッ
ジ値Enであり、これは各輪郭群のエッジからEn個の輪
郭点以内にある折曲点を排除するために用いられる。こ
のパラメータにより、選択された折曲点間に適宜の間隔
が維持される。第3のパラメータLnは最短長しきい値
であり、Ln個の輪郭点より短い長さを有する輪郭群を
排除するために用いられる。図17は、エッジ・パラメ
ータEn及び長さパラメータLnの用法を図式的に表し
たものである。既に抽出されている2つの折曲点20
4、206の間の輪郭群200について考察すると、エ
ッジ・パラメータEnはそれぞれの既に抽出された折曲
点からEn個の点以内の折曲点を除去し、長さパラメー
タLnはその輪郭群にLn個未満の点しか残っていない
ときにその輪郭群を除去する。
【0026】輪郭群からの有意な折曲点の抽出は、一連
の反復動作において実行される。各反復毎に、プロセス
・ステップ72では、反復に用いるための各パラメータ
n、En、Lnに対する値が(例えば、パラメータ索引
表から)選択される。下付き文字nは反復ステップを示
す。各反復毎に、異なるパラメータを用いて異なる折曲
点が抽出される。折曲点抽出処理手順のプロセス・ステ
ップ74において、最初の折曲点抽出ステップは、潜在
的な折曲点を有する輪郭群の識別である。このステップ
では、エッジ・パラメータを用いて各輪郭群の端からE
n個の点が除去され、更に、長さパラメータを用いてLn
個の点より短い長さを有する輪郭群が除去される。次の
プロセス・ステップ76では、各選択された輪郭群にお
いて最大の先鋭度角を有する輪郭点が見出される。プロ
セス・ステップ78では、識別された最大先鋭度の点が
有意であると決定されたならば、その点が折曲点として
抽出される。折曲点が有意と決定されるのは、その先鋭
度が先鋭度しきい値Anを越える場合である。先鋭度し
きい値を満足しなければ、その最大先鋭度の点は破棄さ
れる。選択された群から有意の折曲点を抽出したのに続
いて、折曲点が抽出された各輪郭群は、その折曲点にお
いて1つ以上の輪郭副群に分割される。その後、プロセ
ス・ステップ82おいて、更に反復が必要であると決定
されたならば、処理手順はプロセス・ステップ72に戻
り、新たなパラメータ値が次の反復に割り当てられる。
【0027】先に示したように、各折曲点抽出の反復手
順は、異なる度合いの有意性を持つ折曲点を識別しよう
とするものである。次ページの表1は、4つの発見的ス
テップに対するパラメータ値を含むパラメータ表の例を
示している。
【0028】
【表1】 ステップ Annn ──────────────────────── 1 S − − 2 L M − 3 S L L 4 M M M 但し L:大きな値 S:小さな値 M:中間値 −:適用せず ステップ1では、かなり小さな湾曲を有する各輪郭群か
ら1つの折曲点を抽出しようとする。表1においては、
先鋭度パラメータAnは、湾曲しきい値が弱いことを表
す小さな値「S」を有するとして示されている。この最
初の反復では、長さパラメータには値が割り当てられい
ない。この結果、各輪郭群は長さに関係なく処理される
ことになる。更に、既に抽出された折曲点がないので、
抽出された折曲点の間の間隔を確保するためにエッジ点
を除去する必要がない。したがって、エッジ・パラメー
タにも値が割り当てられない。表1の2度目の反復で
は、強い湾曲を有する輪郭群からの折曲点の抽出を試み
る。このステップでは、先鋭度しきい値Anに大きな値
「L」が割り当てられ、強い湾曲を有する輪郭群のみを
許容する。また、エッジ・パラメータEnには中間値
「M」が割り当てられる。これにより、2度目の反復で
選択された折曲点と先に抽出された複数の折曲点との間
に、中程度の間隔が設けられる。長さパラメータLn
は値が割り当てられず、2度目の反復では長さが要素に
ならないようにする。表1の3度目の反復では、文字
「0」の場合のような長く緩やかな湾曲からの折曲点の
抽出を試みる。先鋭度しきい値パラメータAnには、極
めて小さな値「S」が割り当てられ、かなり弱い湾曲を
有する輪郭群をも受け入れる。エッジ・パラメータEn
には、折曲点の間に最大の間隔を設けるように大きな値
「L」が割り当てられる。長さパラメータLnにも大き
な値「L」が割り当てられ、長い輪郭群のみが受け入れ
られる。最初の3回の反復では、望ましい折曲点を残し
てしまうことがあるので、4度目のステップが表1にお
いて用いられ、中間値「M」が各パラメータAn、En
nの各々に割り当てられる。
【0029】図18及び図19は、表1のパラメータ値
を用いた各反復の効果を図式的に示している。図18で
は文字「z」が処理される。この文字は参照番号210
で示されており、当初の凸状輪郭群212、214、2
16、218と凹状輪郭群220、222、224、2
26とを含んでいる。最初の反復で抽出された折曲点は
参照番号1で示されている。上述のように、折曲点は各
輪郭群から抽出される。次いで、これらの輪郭群は選択
された折曲点の各々において分割される。2度目の反復
では、強い湾曲に対して検査が行なわれて1つの折曲点
「2」が抽出され、その点を含む輪郭群が分割される。
3度目の反復では、折曲点「3」が長く緩やかな湾曲を
有する輪郭群から抽出される。図19は、文字「D」2
30が示されている。もともと、この文字は1つの凸状
輪郭群232と1つの凹状輪郭群234とを含んでいる
ので、輪郭点抽出反復処理の初回では1つの折曲点
「1」が各輪郭群から抽出され、輪郭群が分割される。
2度目の反復では、高い先鋭度を有する折曲点「2」が
各輪郭群から抽出され、抽出した折曲点において再び輪
郭群が分割される。3度目の反復では、折曲点「3」が
長く緩やかな湾曲を有する2つの残りの輪郭群から抽出
される。最後に、4度目の反復で、残りの折曲点「4」
が抽出される。
【0030】表1からのパラメータを用いることの文字
認識率に対する影響は、達成される光学式文字認識率か
ら決定することができる。所望であれば、パラメータを
調整し、又は更に反復ステップを増加することができ、
試行錯誤により有効な値を決定することができる。1組
の最適なパラメータ値が得られたなら、人間の直観とよ
く一致する、所望の折曲点が抽出される。
【0031】折曲点抽出処理手順のプロセス・ステップ
84では、折曲点出力データ集合が発生される。このデ
ータ集合は、次ページの表2に示す情報を含んでいる。
【0032】
【表2】 表2に掲げた折曲点情報は、日本語のカタカナ(音声)
文字に対応するもので、図20及び図21に示すよう
に、オペレータの確認のために図式的に出力することが
できる。図20では、文字のストロークが「0」で示さ
れている。図21では、抽出された折曲点がアステリス
ク「*」で示されている。加えて、各凸状の点には先鋭
度値を表す1から9までの数が関連付けられている。各
凹状の点にも、先鋭度を表す「a」から「i」までの文
字(即ち、a=−1...i=−9)が割り当てられて
いる。結果的に得られるデータ集合は、全ての文字輪郭
の識別、各輪郭での輪郭点の数、各輪郭での凸/凹輪郭
群の数、及び、x−y折曲点座標と各折曲点における輪
郭の先鋭度(正の値は凸、負の値は凹)と各折曲点にお
ける輪郭のオリエンテーションとを含む文字画像におけ
る全ての輪郭点の識別を含む。このデータ集合は、文字
認識のために、選択された光学式文字認識プログラムに
渡される。
【0033】
【発明の効果】以上、この発明に係る光学式文字認識用
自動折曲点抽出方法及び装置を詳細に説明したところか
ら明らかなように、表索引技術を用いることにより、従
来の方法と比較して、この発明は折曲点を迅速に抽出す
ることができるという効果を奏することができる。所望
の折曲点を分析することにより、発見的方法が設計さ
れ、必須のパラメータが開発される。これらのパラメー
タは各発見的ステップに対して異なる値を有するので、
短い湾曲、長い湾曲、緩やかな湾曲及び鋭い湾曲を含む
種々の湾曲について折曲点を柔軟に抽出することができ
る。試行錯誤で折曲点抽出ステップを繰り返すことによ
り、ユーザは人間の直観とよく合致する折曲点を得るた
めの最適なパラメータ値を選択することができる。この
発明の折曲点抽出方法は、より複雑な従来技術のアルゴ
リズムに対抗でき、各発見的ステップに単純なパラメー
タ値を用いることによって、種々の湾曲に対して折曲点
を柔軟に抽出することができる。
【図面の簡単な説明】
【図1】認識対象の文字画像を表す画素配列パターンを
示す図。
【図2】他の認識対象の文字画像を表す画素配列パター
ンを示す図。
【図3】図1に表された文字画像の有意な折曲点をリス
ティングした折曲点表を示す図。
【図4】図2に表された文字画像の有意な折曲点をリス
ティングした折曲点表を示す図。
【図5】この発明に係る、光学式的に文字画像を文書か
ら認識するコンピュータ実施システムを示すブロック
図。
【図6】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図7】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図8】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図9】図9aは画素配列パターンと画素配列パターン
を走査するために用いられるマスク・アレイとを示す図
であり、図9bは図9aの画素配列パターンの一部の拡
大図であって、文字画像を表すための画素配列パターン
位置での白及び黒の使用を示す図であり、図9cは9a
図のマスク・アレイの拡大図であって、各マスク・アレ
イへの二進値の指定を示す図であり、図9dはこの発明
にしたがって図9aの画素配列パターンから生成された
パターン・マトリクスを示す図であり、図9eはこの発
明にしたがって図9aの画素配列パターンから生成され
たタグ・マトリクスを示す図であり、図9fは図9eの
タグ・マトリクスの拡大図であって、輪郭追跡に用いる
画素配列パターン位置への数値の割当てを示す図であ
る。
【図10】図9aのマスク・アレイの拡大図であって、
図9aの画素配列パターンの走査から得られた異なるマ
スク・アレイ構成に対する追跡方向の割当てを示す図。
【図11】図11aはパターン・マトリクス値によって
与えられる追跡方向情報を示す最初の文字画像輪郭追跡
を示す図であり、図11bはタグ・マトリクス値によっ
て与えられる追跡制御情報を用いた最初の文字画像輪郭
追跡を示す図であり、図11cは第1の文字画像の輪郭
追跡から得られる文字画像輪郭点のx−y座標リストを
示す図である。
【図12】図12aはパターン・マトリクス値によって
与えられる追跡方向情報を用いた2度目及び3度目の文
字画像輪郭の追跡を示す図であり、図12bはタグ・マ
トリクス値によって得られる追跡制御情報を用いた2度
目及び3度目の文字画像輪郭の追跡を示す図であり、図
12cは2度目及び3度目の文字画像輪郭の追跡中に発
生されるx−y座標のリストを示す図である。
【図13】図11c及び図12cのx−y座標リストの
座標間の相対的なオリエンテーションの決定に用いられ
るための記憶されたオリエンテーション・マトリクスを
示す図。
【図14】図14aは輪郭点間のx及びyの差の値を得
てアドレス値として図13のオリエンテーション・マト
リクスに入力する方法を示す拡大されたx−y座標リス
トを示す図であり、図14bは文字画像輪郭点に割り当
てられたオリエンテーション値のオリエンテーション・
リストを示す図であり、図14cは図14bのオリエン
テーション・リストから生成された先鋭度リストを示す
図である。
【図15】文字画像の輪郭に沿った点へのオリエンテー
ション値の割当てを示す図。
【図16】文字画像の輪郭追跡から得られた凸輪郭群及
び凹輪郭群を示す図であって、図9aの画素配列パター
ンに対応する文字画像を示す図。
【図17】この発明による折曲点抽出に用いられる種々
の発見的に決定されるパラメータの有意度を示す図。
【図18】折曲点抽出を3回反復した結果として抽出さ
れた折曲点を示す図。
【図19】折曲点抽出を4回反復した結果として抽出さ
れた折曲点を示す図。
【図20】サンプル入力文字画像を示す図。
【図21】この発明にしたがって生成された折曲点デー
タ出力集合を示す図。
【符号の説明】
10 文書 12 走査・しきい値処理・セグメント化装置 14 画素配列パターン 16 入力記憶バッファ 18 データ処理システム 20 中央処理装置(CPU) 22 記憶レジスタ 24 リードオンリ及びランダム・アクセス・メモリ 26 長期間プログラム・メモリ 26 出力記憶装置 28 光学式文字認識システム
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成6年1月13日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】認識対象の文字画像を表す画素配列パターンを
示す図。
【図2】他の認識対象の文字画像を表す画素配列パター
ンを示す図。
【図3】図1に表された文字画像の有意な折曲点をリス
ティングした折曲点表を示す図。
【図4】図2に表された文字画像の有意な折曲点をリス
ティングした折曲点表を示す図。
【図5】この発明に係る、光学式的に文字画像を文書か
ら認識するコンピュータ実施システムを示すブロック
図。
【図6】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図7】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図8】この発明に係る、コンピュータにより実施され
る折曲点抽出方法の流れ図。
【図9】この発明に係る折曲点抽出処理手順を説明する
ための図であって、aは画素配列パターンと画素配列パ
ターンを走査するために用いられるマスク・アレイとを
示す図、bはaの画素配列パターンの一部の拡大図であ
って、文字画像を表すための画素配列パターン位置での
白及び黒の使用を示す図、cはaのマスク・アレイの拡
大図であって、各マスク・アレイへの二進値の指定を示
す図、dはこの発明にしたがってaの画素配列パターン
から生成されたパターン・マトリクスを示す図、eはこ
の発明にしたがってaの画素配列パターンから生成され
たタグ・マトリクスを示す図、fはeのタグ・マトリク
スの拡大図であって、輪郭追跡に用いる画素配列パター
ン位置への数値の割当てを示す図である。
【図10】図9のaのマスク・アレイの拡大図であっ
て、図9のaの画素配列パターンの走査から得られた異
なるマスク・アレイ構成に対する追跡方向の割当てを示
す図。
【図11】この発明に係る折曲点抽出処理手順を説明す
るための図であって、aはパターン・マトリクス値によ
って与えられる追跡方向情報を示す最初の文字画像輪郭
追跡を示す図、bはタグ・マトリクス値によって与えら
れる追跡制御情報を用いた最初の文字画像輪郭追跡を示
す図、cは第1の文字画像の輪郭追跡から得られる文字
画像輪郭点のx−y座標リストを示す図である。
【図12】この発明に係る折曲点抽出処理手順を説明す
るための図であって、aはパターン・マトリクス値によ
って与えられる追跡方向情報を用いた2度目及び3度目
の文字画像輪郭の追跡を示す図、bはタグ・マトリクス
値によって得られる追跡制御情報を用いた2度目及び3
度目の文字画像輪郭の追跡を示す図、cは2度目及び3
度目の文字画像輪郭の追跡中に発生されるx−y座標の
リストを示す図である。
【図13】図11のc及び図12のcのx−y座標リス
トの座標間の相対的なオリエンテーションの決定に用い
られるための記憶されたオリエンテーション・マトリク
スを示す図。
【図14】この発明に係る折曲点抽出処理手順を説明す
るための図であって、aは輪郭点間のx及びyの差の値
を得てアドレス値として図13のオリエンテーション・
マトリクスに入力する方法を示す拡大されたx−y座標
リストを示す図、bは文字画像輪郭点に割り当てられた
オリエンテーション値のオリエンテーション・リストを
示す図、cはbのオリエンテーション・リストから生成
された先鋭度リストを示す図である。
【図15】文字画像の輪郭に沿った点へのオリエンテー
ション値の割当てを示す図。
【図16】文字画像の輪郭追跡から得られた凸輪郭群及
び凹輪郭群を示す図であって、図9のaの画素配列パタ
ーンに対応する文字画像を示す図。
【図17】この発明による折曲点抽出に用いられる種々
の発見的に決定されるパラメータの有意度を示す図。
【図18】折曲点抽出を3回反復した結果として抽出さ
れた折曲点を示す図。
【図19】折曲点抽出を4回反復した結果として抽出さ
れた折曲点を示す図。
【図20】サンプル入力文字画像を示す図。
【図21】この発明にしたがって生成された折曲点デー
タ出力集合を示す図。
【符号の説明】 10 文書 12 走査・しきい値処理・セグメント化装置 14 画素配列パターン 16 入力記憶バッファ 18 データ処理システム 20 中央処理装置(CPU) 22 記憶レジスタ 24 リードオンリ及びランダム・アクセス・メモ
リ 26 長期間プログラム・メモリ 26 出力記憶装置 28 光学式文字認識システム

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 文字画像における折曲点を選択的に識別
    して対応するデータ集合を生成し、前記文字画像を識別
    する光学式文字認識処理手順への入力として用いる折曲
    点抽出方法であって、 認識すべき文字画像を表す黒及び白の画素から成り前記
    文字画像の連続した輪郭を表す複数のアレイ位置を有す
    る画素配列パターンを入力するステップと、 前記画素配列パターンを走査して、前記文字画像の1つ
    以上の連続した輪郭を追跡し、追跡された輪郭毎に輪郭
    点のリストを作成するステップと、 各輪郭点に対して、輪郭の湾曲を表す先鋭度値を決定
    し、各追跡された輪郭に対して先鋭度値リストを生成す
    るステップと、 それぞれの前記先鋭度リストを、全て凸状の湾曲と全て
    凹状の湾曲とのいずれかである一連の連続点を有する輪
    郭群に分割するステップと、 1回以上の反復で発見的に決定されたパラメータを用い
    て、1つ以上の輪郭群から、選択された折曲点を抽出す
    るステップと、 文字の折曲点とそのオリエンテーションと先鋭度とのリ
    ストを含む折曲点データ集合出力を作成するステップ
    と、を含むことを特徴とする折曲点抽出方法。
  2. 【請求項2】 請求項1記載の折曲点抽出方法におい
    て、前記文字画像の1つ以上の連続した輪郭を追跡する
    前記のステップが (1)各輪郭上の追跡開始点を識別するサブステップ
    と、前記輪郭の追跡開始点の位置に基づいて次の輪郭点
    への方向を決定するサブステップとを含むステップ、 (2)各輪郭上の追跡開始点を識別するサブステップ
    と、前記画素配列パターン内の隣接する位置の色に基づ
    いて次の輪郭点への方向を決定するサブステップとを含
    むステップ、 (3)各輪郭点に、次の輪郭点への方向を表す追跡方向
    値を割り当てるステップ、 (4)追跡に適格であるとする輪郭点を示す追跡制御情
    報を保持するステップ、 (5)輪郭点が追跡に適格であるとされた回数を表す値
    を各輪郭点に割り当てるステップ、(6)輪郭点に対応
    する複数の記憶位置を有するタグ・マトリクスであっ
    て、 その各記憶位置には関連する輪郭点が追跡に適格である
    とされた回数を表す値を含むタグ・マトリクスを生成す
    るステップ、のうちのいずれか1つのステップを含むこ
    とを特徴とする折曲点抽出方法。
  3. 【請求項3】 請求項1記載の折曲点抽出方法におい
    て、輪郭点のリストを作成する前記のステップが、各輪
    郭点に対してx−y座標値のリストを作成するステップ
    を含むことを特徴とする折曲点抽出方法。
  4. 【請求項4】 請求項1記載の折曲点抽出方法におい
    て、各輪郭点に対して先鋭度値を決定する前記のステッ
    プが、各輪郭点から選択された後続の輪郭点へのオリエ
    ンテーション方向を表すオリエンテーション値のリスト
    を作成するステップを含んでおり、各輪郭点に対する先
    鋭度値は、前記輪郭点と前記選択された後続の輪郭点と
    の間のオリエンテーション値の角度差であることを特徴
    とする折曲点抽出方法。
  5. 【請求項5】 請求項1記載の折曲点抽出方法におい
    て、各輪郭群からの折曲点の抽出に続いて、前記折曲点
    において輪郭群を1つ以上の輪郭副群に分割し、各輪郭
    副群に対して、選択された折曲点を抽出するステップを
    繰り返すことを特徴とする折曲点抽出方法。
  6. 【請求項6】 請求項1記載の折曲点抽出方法におい
    て、前記発見的に決定されたパラメータは先鋭度パラメ
    ータAn、エッジ・パラメータEn及び長さパラメータL
    nを含むことを特徴とする折曲点抽出方法。
  7. 【請求項7】 光学式文字認識処理手順において、文字
    画像における折曲点を選択的に識別して対応するデータ
    集合を生成し、前記文字画像の識別に用いる折曲点抽出
    方法であって、 入力された文字画像を走査するステップと、 前記文字画像の凸状の湾曲及び凹状の湾曲のみを有する
    1つ以上の輪郭群を識別するステップと、 前記輪郭群の物理的特性をしきい値として定義する発見
    的決定パラメータを用いて各輪郭群を繰り返し検査し、
    前記発見的決定パラメータによって決められるしきい値
    に合致する又は超える輪郭群と折曲点とを識別するステ
    ップと、 識別された折曲点のデータ集合を生成して前記文字画像
    の識別に用いるステップと、を含むことを特徴とする折
    曲点抽出方法。
  8. 【請求項8】 文字画像における折曲点を選択的に識別
    して対応するデータ集合を生成し、前記文字画像を識別
    する光学式文字認識処理手順への入力として用いるコン
    ピュータ実施用折曲点抽出方法であって、 認識すべき文字画像を表す画素配列パターンを入力する
    ステップと、 マスク・アレイを用いて前記画素配列パターンを走査
    し、追跡方向情報を含むパターン・マトリクスと追跡制
    御情報を含むタグ・マトリクスとを作成するステップで
    あって、それぞれの前記マトリクスは前記文字画像の輪
    郭を追跡するために前記画素配列パターンの4つのアレ
    イ位置の連続した群の交点に対応する複数の記憶位置を
    有するステップと、 (a)前記タグ・マトリクスを走査して輪郭開始点を見
    出し、(b)前記輪郭位置のx座標及びy座標を抽出し
    て前記座標をx−yリストに追加し、(c)前記輪郭位
    置におけるパターン・マトリクスを読み出して次の輪郭
    位置への方向を決定し、(d)前記輪郭位置が処理され
    たことを示すように前記タグ・マトリクスを調整し、
    (e)前記パターン・マトリクスから決定された次の輪
    郭位置に移動し、(f)前記輪郭の追跡が終了まで、前
    記(b)〜(e)の処理を繰り返すことによって前記文
    字画像の輪郭を追跡するステップと、 オリエンテーション方向を表す値を含んでいて各輪郭点
    と選択された後続の輪郭点との間のx−y座標値の差を
    表すx−yオフセット値によりアドレス可能な複数の記
    憶位置を有するオリエンテーション・マトリクスを用い
    て、前記x−yリストでの選択された点の間のオリエン
    テーションのオリエンテーション・リストを生成するス
    テップと、 オリエンテーション・リストにおける角度を平滑化し、
    選択された点の間のオリエンテーションの連続性を強化
    するステップと、 前記選択された点の間の湾曲の先鋭度角を表す値を計算
    し、該計算された先鋭度値を含む先鋭度リストを生成す
    るステップと、 前記先鋭度リストを、全て凸状の湾曲と全て凹状の湾曲
    とのいずれかである一連の連続点を有する輪郭群に分割
    するステップと、 先鋭度パラメータAn、エッジ・パラメータEn及び長さ
    パラメータLnを含む発見的決定パラメータを用いて、
    (g)前記エッジ・パラメータを用いて各輪郭端からE
    n個の点を除去し、前記長さパラメータを用いてLn個の
    点より短い長さを有する輪郭群を除去することにより、
    潜在的折曲点を有する輪郭群を識別し、(h)識別され
    た各輪郭群における最大先鋭度点を見出し、(i)前記
    先鋭度パラメータを用いて先鋭度がAnより小さい点を
    除去し、最大先鋭度点を折曲点として抽出し、(j)前
    記折曲点において各輪郭群を1つ以上の輪郭副群に分割
    し、(k)必要に応じて、前記(g)〜(j)の処理を
    繰り返して所望の折曲点を得ることにより、前記輪郭群
    から、選択された折曲点を抽出するステップであって、
    極めて弱い湾曲を有する各輪郭群から折曲点が抽出され
    るように前記の各パラメータを選択する第1の反復と、
    強い湾曲を有する輪郭群から折曲点が抽出されるように
    前記の各パラメータを選択する第2の反復と、長く緩や
    かな湾曲を有する輪郭群から折曲点が抽出されるように
    前記の各パラメータを選択する第3の反復と、中程度の
    湾曲及び長さの輪郭群から折曲点が抽出されるように前
    記の各パラメータを選択する第4の反復とから成る4つ
    の反復において実行されるステップと、 全ての文字輪郭の識別、各輪郭における輪郭点の数、各
    輪郭における凸状輪郭群と凹状輪郭群との数、及び、x
    −y折曲点座標と各折曲点における輪郭の先鋭度と各折
    曲点における輪郭のオリエンテーションとを含む文字画
    像内の全ての折曲点の識別を含む折曲点データ集合を発
    生するステップと、を含むことを特徴とする折曲点抽出
    方法。
JP5171761A 1992-08-12 1993-07-12 光学式文字認識システム用折曲点抽出方法 Expired - Lifetime JP2641380B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US928818 1992-08-12
US07/928,818 US5590220A (en) 1992-08-12 1992-08-12 Bending point extraction method for optical character recognition system

Publications (2)

Publication Number Publication Date
JPH06195513A true JPH06195513A (ja) 1994-07-15
JP2641380B2 JP2641380B2 (ja) 1997-08-13

Family

ID=25456820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5171761A Expired - Lifetime JP2641380B2 (ja) 1992-08-12 1993-07-12 光学式文字認識システム用折曲点抽出方法

Country Status (3)

Country Link
US (1) US5590220A (ja)
EP (1) EP0587301A3 (ja)
JP (1) JP2641380B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483943B1 (en) 1998-10-02 2002-11-19 International Business Machines Corporation Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
US10933576B2 (en) 2017-01-26 2021-03-02 Vmi Holland B.V. Apparatus and method for applying a gum strip to an edge of a cord reinforced ply

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL312469A1 (en) * 1994-05-10 1996-04-29 Motorola Inc Method of stroke-by-stroke segmenting a hand-written input
US6356656B1 (en) * 1994-06-17 2002-03-12 Canon Kabushiki Kaisha Contour-information extraction apparatus and method
US5796868A (en) * 1995-12-28 1998-08-18 Cognex Corporation Object edge point filtering system for machine vision
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
JP2000209430A (ja) * 1999-01-18 2000-07-28 Canon Inc 輪郭抽出装置及び方法並びに記憶媒体
US7123768B2 (en) * 2000-04-26 2006-10-17 Minolta Co., Ltd. Apparatus and method for detecting a pattern
US6721452B2 (en) 2001-09-12 2004-04-13 Auburn University System and method of handwritten character recognition
US6996268B2 (en) * 2001-12-28 2006-02-07 International Business Machines Corporation System and method for gathering, indexing, and supplying publicly available data charts
US6937765B2 (en) * 2003-03-14 2005-08-30 The Regents Of The University Of California Method for contour extraction for object representation
US7496237B1 (en) 2004-01-02 2009-02-24 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image processing for binarization enhancement via fuzzy reasoning
DE502004005457D1 (de) * 2004-01-30 2007-12-20 Baumer Optronic Gmbh Bildverarbeitungssystem
US7298897B1 (en) 2004-02-11 2007-11-20 United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Optimal binarization of gray-scaled digital images via fuzzy reasoning
US7400766B1 (en) 2004-02-19 2008-07-15 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image edge extraction via fuzzy reasoning
US7515752B2 (en) * 2004-08-27 2009-04-07 Corel Corporation Sketch recognition and enhancement
CN101916378B (zh) * 2010-07-20 2013-01-09 青岛海信网络科技股份有限公司 易混淆字符的识别方法及装置
CN103353991B (zh) * 2013-06-24 2016-02-24 西安交通大学 一种轮廓片段的迭代解析生成方法
GB2528028B (en) * 2014-05-13 2017-08-09 String Labs Ltd Border tracing
US9980527B2 (en) * 2016-05-31 2018-05-29 Resonance Companies LLC Garment pattern engineering utilizing two-dimensional imagary of the human form
RU2664411C2 (ru) * 2016-12-01 2018-08-17 Федеральное государственное бюджетное образовательное учреждение высшего образования "Рязанский государственный радиотехнический университет" Способ обработки последовательности изображений для распознавания воздушных объектов
US10438098B2 (en) * 2017-05-19 2019-10-08 Hand Held Products, Inc. High-speed OCR decode using depleted centerlines
JP7187377B2 (ja) * 2019-04-23 2022-12-12 株式会社日立製作所 物体情報登録装置及び物体情報登録方法
CN113256461A (zh) * 2021-05-18 2021-08-13 杭州米络星科技(集团)有限公司 线上作业批改方法、装置、服务器及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63301382A (ja) * 1987-06-02 1988-12-08 Meidensha Electric Mfg Co Ltd 文字成分分離方法
JPS6435674A (en) * 1987-07-31 1989-02-06 Nippon Telegraph & Telephone Character recognizing method

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4208651A (en) * 1978-05-30 1980-06-17 Sperry Corporation Fingerprint identification by ridge angle and minutiae recognition
JPS5926064B2 (ja) * 1979-09-10 1984-06-23 工業技術院長 輪郭画像の特徴抽出装置
US4773098A (en) * 1980-05-27 1988-09-20 Texas Instruments Incorporated Method of optical character recognition
US4542412A (en) * 1982-02-04 1985-09-17 Shaken Co., Ltd. Method for compressing character or pictorial image data
JPS5949071A (ja) * 1982-09-13 1984-03-21 Dainippon Screen Mfg Co Ltd 図形輪郭デ−タ圧縮方法
US4628532A (en) * 1983-07-14 1986-12-09 Scan Optics, Inc. Alphanumeric handprint recognition
GB2147474B (en) * 1983-10-03 1987-05-07 Shaken Kk Method of processing character or pictorial image data
EP0149457B1 (en) * 1984-01-13 1993-03-31 Kabushiki Kaisha Komatsu Seisakusho Method of identifying contour lines
US4910786A (en) * 1985-09-30 1990-03-20 Eichel Paul H Method of detecting intensity edge paths
US4771469A (en) * 1986-06-30 1988-09-13 Honeywell Inc. Means and method of representing an object shape by hierarchical boundary decomposition
US4975853A (en) * 1987-11-20 1990-12-04 Hitachi Software Engineering Co., Ltd. Image processing system having polygonal line processing of pixel line data
JP2739130B2 (ja) * 1988-05-12 1998-04-08 株式会社鷹山 画像処理方法
JP2806961B2 (ja) * 1989-02-22 1998-09-30 株式会社リコー 画像符号化方法
US5237627A (en) * 1991-06-27 1993-08-17 Hewlett-Packard Company Noise tolerant optical character recognition system

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63301382A (ja) * 1987-06-02 1988-12-08 Meidensha Electric Mfg Co Ltd 文字成分分離方法
JPS6435674A (en) * 1987-07-31 1989-02-06 Nippon Telegraph & Telephone Character recognizing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6483943B1 (en) 1998-10-02 2002-11-19 International Business Machines Corporation Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
US10933576B2 (en) 2017-01-26 2021-03-02 Vmi Holland B.V. Apparatus and method for applying a gum strip to an edge of a cord reinforced ply

Also Published As

Publication number Publication date
JP2641380B2 (ja) 1997-08-13
EP0587301A3 (en) 1995-05-24
EP0587301A2 (en) 1994-03-16
US5590220A (en) 1996-12-31

Similar Documents

Publication Publication Date Title
JP2641380B2 (ja) 光学式文字認識システム用折曲点抽出方法
He et al. A run-based two-scan labeling algorithm
JP2951814B2 (ja) 画像抽出方式
JP3822277B2 (ja) 文字テンプレートセット学習マシン動作方法
US4903312A (en) Character recognition with variable subdivisions of a character region
US5515455A (en) System for recognizing handwritten words of cursive script
US8391609B2 (en) Method of massive parallel pattern matching against a progressively-exhaustive knowledge base of patterns
RU2621601C1 (ru) Устранение искривлений изображения документа
US8571264B2 (en) Method of using structural models for optical recognition
JP2001092919A (ja) 2次元バーコードのねじれ角決定法
JPH06301781A (ja) コンピュータによるパターン認識のためのイメージ変換方法及び装置
US6240209B1 (en) Method for deriving character features in a character recognition system
US7251355B2 (en) Three-dimensional labeling apparatus and method
US10460219B2 (en) Generating an object map from a plurality of binary images
JP2001283153A (ja) カラー画像から文字列パターンを抽出する装置および方法
JP3172498B2 (ja) イメージ認識用特徴値抽出方法、およびその装置、イメージ解析プログラムを格納する記憶媒体
JP4390523B2 (ja) 最小領域による合成画像の分割
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JPH06162265A (ja) イメージ認識システム
JP4763113B2 (ja) 高速ラベリング方式
JP2613211B2 (ja) 画像入力装置
CN114299526A (zh) 手写棋谱录入方法及设备
Buchowski et al. OMNIREC: a character recognition system
JPS63178380A (ja) 文字列認識装置
JPH04177483A (ja) パターンマッチング方式