JPH0656621B2 - 文字図形認識方法 - Google Patents

文字図形認識方法

Info

Publication number
JPH0656621B2
JPH0656621B2 JP62177799A JP17779987A JPH0656621B2 JP H0656621 B2 JPH0656621 B2 JP H0656621B2 JP 62177799 A JP62177799 A JP 62177799A JP 17779987 A JP17779987 A JP 17779987A JP H0656621 B2 JPH0656621 B2 JP H0656621B2
Authority
JP
Japan
Prior art keywords
line segment
character
hypothesis
information
graphic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62177799A
Other languages
English (en)
Other versions
JPS6421585A (en
Inventor
信一郎 岡▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP62177799A priority Critical patent/JPH0656621B2/ja
Publication of JPS6421585A publication Critical patent/JPS6421585A/ja
Publication of JPH0656621B2 publication Critical patent/JPH0656621B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は紙面を走査して入力された画像を認識する文字
図形認識方式に係わり、特に文字図形を構成する線分の
構造に基づいて認識を行う文字図形認識方式に係わる。
(従来の技術) 従来の文字図形認識方式の一つとして、入力された文字
図形の画像を芯線化することによって文字図形を構成す
る線分を求めたのち、得られた線分の構造を予め分類す
るべきカテゴリ別に登録された辞書と比較することによ
って文字図形を認識する方式が知られている(例えば電
子通信学会論文誌 ′81/9 Vol.J64-D No.9 pp877-88
4)。更に、画像より求められた文字図形の線分の構造
の変形に柔軟に対処できる認識方式として、複数の隣接
した線分の接続構造を基に各線分の文字図形内の部位の
仮説を多数生成することによって文字図形を認識する同
一出願人による文字図形認識方式(特願昭61-290890
号)が知られている。この方式では、入力画像に出現が
予想される線分の局所的な構造とその線分構造がどの文
字図形のどの部位である可能性があるかを示す仮説との
対応関係を予め登録しておき、これを基に同一の入力画
像内の各線部について多数の仮説を生成した後、最も確
からしい仮説を採用することによって文字図形が認識さ
れた。更に、既に部位が決定された線分あるいは既に抽
出された文字図形との相対的な位置関係に基づいて部位
の仮説を更新することによって、類似した文字図形に対
する認識の信頼性を向上させる本願と同一出願人による
文字図形認識方式が知られている(特願昭62-99406号,
特願昭62-132909号)。この方式では線分と既に部位が
決定されている線分、または線分と既に認識された文字
図形との相対的な位置関係に基づく構造と線分に付与す
る仮説との対応関係を予め登録しておき、これを基に同
一の入力画像内の各線分に対して多数の仮説を生成した
後、最も確からしい仮説を採用することによって文字図
形が認識された。
(発明が解決しようとする問題点) 前述したような従来の文字図形認識方式では、一般に芯
線化の際に、線の交差部分におけるひげの発生や、湾曲
した部分における折線近似の影響のため、同一のカテゴ
リに属する文字図形であっても必ずしも同一の位相構造
の線分が得られない。従って、予め芯線化によって得ら
れる位相構造を予想して作成された線分構造の辞書との
比較によって、入力された文字図形を分類しても、正し
いカテゴリに分類することは困難であった。また同一出
願人による文字図形認識方式では、各線分に対する文字
図形内の部位の仮説を生成する基準ごとに仮説の生成手
段を設けており、多様な着目点による仮説を生成するに
はその数だけの仮説生成手段を必要とするため、大規模
且つ複雑な構成手段となってしまう欠点があり、実現が
困難であった。本発明は、上記の従来の文字図形認識方
式の問題点を解決し、線分抽出処理が抽出する線分群の
位相構造の不安定さを吸収できるばかりでなく、多様な
基準による仮説の生成を単純で同一の手段構成によって
実現する文字図形認識方式を提供するものである。
(問題点を解決するための手段) 本発明の文字図形認識方法は、紙面上に記録された文字
図形を走査して得られた画像から線分を抽出する線分抽
出手段と, 該線分抽出手段によって得られた線分の位置情報と、該
線分が文字図形の部品になり得る可能性を表す部品仮説
と、該線分について最終的に判定された文字図形の部品
を表す部品情報とを線分情報として記憶する線分情報記
憶手段と, 線分群の満たすべき条件と、該条件を満たす各線分に付
与する文字図形における部位を表す部品名の組で表現さ
れた生成規則を記憶する仮説生成規則記憶手段と, 該生成規則の線分群の満たすべき条件を満たす前記線分
情報記憶手段内の線分群を抽出する対象線分抽出手段
と, 該対象線分抽出手段が出力した対象線分に対して、生成
規則内の部品名と信頼度とを前記部品仮説として前記線
分情報記憶手段に出力するか又は既に前記線分情報記憶
手段に記憶された同一線分の前記部品仮説を該部品仮説
によって追加更新する仮説更新統合手段と, 該線分情報記憶手段内に記憶された線分の部品仮説より
各線分の文字図形内における部位を決定し前記部品情報
として前記線分情報記憶手段に出力する部品決定手段
と, 該部品情報をもとに同一文字または同一図形を構成する
線分の集合を生成し文字図形情報として出力する文字図
形生成手段と, 前記仮説生成規則記憶手段において適用すべき前記生成
規則を、参照する情報が求まっているものから順に選択
する規則適用制御手段と を備えることを特徴とするものである。
(作用) 本発明においては、ある文字図形の部位であるという部
品仮説を付与する対象となる線分群の条件を、仮説生成
規則記憶手段が生成規則として保持している。該条件
は、局所的な線分群の位置関係に基づいた構造に関する
ものや、隣接する線分の有する部品仮説に関するもの、
あるいは既に抽出された文字図形との相対的な位置関係
に関するものなどが複数格納されている。仮説生成規則
記憶手段内の各生成規則について生成規則内の条件を満
足する線分を対象線分抽出手段が線分情報記憶手段内か
ら抽出する。該線分群に対して仮説更新統合手段が新た
な部品仮説を生成、あるいは既に存在する部品仮説を更
新する。全ての生成規則について上記の処理を施した
後、該仮説のうち最も確からしい仮説を部品決定手段が
決定する。従って、線分抽出手段において同一のカテゴ
リに属する文字図形が異なる位相の線分構造として抽出
された場合でも、各線分が文字図形内でどの部位となっ
ているかを正しく判定することができる。更に、仮説を
生成する線分の条件は全て仮説生成規則記憶手段内の生
成規則として統一的に保持され、局所的な線分群の位置
関係に基づいた仮説の生成,隣接する線分の有する部品
仮説に基づいた仮説の生成,あるいは既に抽出された文
字図形との相対的な位置関係に基づいた仮説の生成は全
て上記の処理によって行われる。
(実施例) 以下本発明における実施例について図面を参照しつつ説
明する。
第1図は本発明を適用した文字図形認識方式の一実施例
の機能を示す論理ブロック図であり、1は紙面上に記録
された図面を走査して画像を入力し記憶する文字図形入
力手段、2は該文字図形入力手段1によって得られた文
字図形画像を構成する線分を抽出し位置情報を出力する
線分抽出手段、3は該線分抽出手段2によって得られた
位置情報と後記する仮説更新統合手段6が出力する文字
または図形の部品仮説並びに後記する部品決定手段7が
出力する部品情報とを線分情報として記憶する線分情報
記憶手段、4は線分群の満たすべき条件と該条件を満た
す各線分に付与する文字図形における部位を表す部品名
の組で表現された生成規則を記憶する仮説生成規則記憶
手段、5は部品仮説を付与する対象となる線分の集合を
該生成規則の条件に従って抽出する対象線分抽出手段、
6は対象線分抽出手段5が出力した対象線分に対して所
定の部品仮説を新たな部品仮説として生成しまたは既に
線分情報記憶手段3に記憶されている部品仮説を所定の
部品仮説によって更新する仮説更新統合手段、7は線分
情報記憶手段3内に記憶された線分の部品仮説より各線
分の文字図形内における部位を決定し部品情報として出
力する部品決定手段、8は該部品情報をもとに同一文字
または同一図形を構成する線分の集合を生成し文字図形
情報として出力する文字図形生成手段、9は該文字図形
情報を記憶する文字図形記憶手段、10は仮説生成規則記
憶手段4において適用すべき生成規則を選択する規則適
用制御手段、11は文字図形入力手段1ないし規則適用制
御手段10を制御し一連の処理を制御する制御部である。
制御部10はまず文字図形入力手段1を起動し画像を入力
したのち、線分抽出手段2を起動する。線分抽出手段2
は、入力された画像を構成する線分群を抽出し、各々の
線分の2つの端点の位置座標を位置情報として出力する
機能を有する。線分抽出手段2は、公知の直線抽出方式
やベクトル化手法、例えば方向の変化する画素まで細線
化した画素を追跡する方式や局所マッチング法によって
得られる微小線素を追跡する方式によって容易に実現で
きる。
線分情報記憶手段3は第2図に示した項目からなる線分
情報12を記憶する機能を有する。線分情報のうち、第1
端点座標及び第2端点座標は線分抽出手段2が出力する
位置情報の二つの端点の位置座標、部品仮説リストは後
記する仮説更新統合手段6が該当線分に付与した部品仮
説の集合、決定部品名は後記する部品決定手段7が出力
する該線分の部品名を表す文字・記号列または番号であ
る。尚、各線分情報12は線分情報記憶手段3内で固有に
割り当てられた番号または記号である線分情報番号を有
し、該線分情報番号によって個々の線分情報を選択的に
参照することができる。また部品仮説リストは第3図に
示した項目からなる情報13であり、第1線分仮説ないし
第k線分仮説は該当する線分に生成されたk種類の部品
仮説である。部品仮説とは、各線分がどの文字または図
形内のどの部位を構成する線分であるかを示す可能性を
表現した情報であり、どの文字図形のどの部位かを示す
部品名と、その部品名を仮説として有することの確から
しさを示す尺度である信頼度から成る。例えば、部品名
は予め定められた分類すべきカテゴリに対応した記号ま
たは番号とそのカテゴリの文字図形内でのどの部位の線
分であるかを示す記号または番号の組で表現され、信頼
度は確からしさを表す数値で表現される。同一の線分に
対して生成された複数の部品仮説のうち、同一の部品名
を持つ部品仮説に対しては、その信頼性を総合した値を
部品仮説の信頼性として記憶する。
仮説生成規則記憶手段4は、入力画像中の線分あるいは
線分群が満たすべき条件と,条件を満たした線分または
線分群に付与する部品名との対応関係を生成規則として
記憶する機能を有する。生成規則は、入力画像中に出現
が予測される文字図形を認識するに十分な種類と数の生
成規則が予め用意される。生成規則には、各生成規則内
の条件を満たすか否かを判定する際に参照する情報の違
いにより下記の3つの種類が存在する。
(1)位置参照型規則:条件の判定の際に線分情報12内
の位置情報のみを参照する生成規則。
(2)部品参照型規則:条件の判定の際に線分情報12内
の位置情報及び決定部品名を参照する規則。
(3)文字図形参照型規則:条件の判定の際に線分情報
12内の位置情報と後記する文字図形記憶手段内の文字図
形情報、並びに必要が有れば部品仮説リストを参照する
規則。
仮説生成規則記憶手段4内では生成規則をその種類ごと
に区別できるように記憶されている。例えば各生成規則
は第4図に示した項目からなる生成規則情報14として記
憶される。生成規則情報14のうち、規則分類は上記の3
つの型のいづれに属するかを示す識別子、仮説部品名は
後記の仮説生成条件を満足した線分または線分群に付与
する部品仮説の部品名またはその集合、仮説生成条件は
仮説を生成する対象となる線分または線分群を抽出する
際に線分または線分群が満たすべき条件の集合である。
対象線分抽出手段5は仮説生成規則記憶手段4内の生成
規則の仮説生成条件を満たす線分または線分情報記憶手
段3内から抽出する機能を有する。対象線分抽出手段5
は、上記の位置参照型規則の場合には、線分情報記憶手
段内に格納された線分の内、その第1端点座標と第2端
点座標またはそれらから関数的に求められる位置情報を
参照して条件を満足する線分群を抽出する。上記の部品
参照型規則の場合には、線分情報記憶手段内に格納され
た線分の内、その第1端点座標と第2端点座標またはそ
れらから関数的に求められる位置情報と、線分情報内の
決定部品名を参照して条件を満足する線分群を抽出す
る。上記の文字図形参照型規則の場合には、線分情報記
憶手段内に格納された線分の内、その第1端点座標と第
2端点座標またはそれらから関数的に求められる位置情
報と、線分情報内の部品仮説、並びに後記する文字図形
記憶手段9内に既に求められた文字図形の位置情報を参
照して条件を満足する線分群を抽出する機能を有する。
更に対象線分抽出手段5は抽出した線分群が仮説生成条
件を満足する都合を該線分群に対する信頼性尺度として
求め、必要に応じて仮説更新統合手段6へ出力する機能
も有する。
線分抽出手段2によって線分情報が求められた後、制御
部11は規則適用制御手段10を起動し、仮説の生成を開始
する。規則適用制御手段10による仮説の生成は以下の8
個の処理過程を踏む。
規則適用制御手段10はまず仮説生成規則記憶手段4内
の位置参照型規則を適用する。位置参照型規則の各々に
ついて、生成規則を構成する仮説生成条件を満足する線
分群を対象線分抽出手段が抽出し、該線分群に対応した
線分情報番号群と生成規則内の仮説部品名の項目に示さ
れた部品名群、および仮説生成条件を満足した度合を示
す信頼性尺度を仮説更新統合手段6に出力する。
仮説更新統合手段6は入力された線分情報番号群,部
品名群と信頼性尺度をもとに、線分情報番号で示された
線分情報内の部品仮説リストを更新する。今、部品名X
と信頼性尺度Sを用いて線分情報番号Aに部品仮説を付
与する場合を考える。線分情報番号A内の部品仮説リス
ト内に部品名Xと同一の部品名を持つ部品仮説が存在し
ない場合は、部品名Xと信頼性尺度から関数的に求めら
れる信頼度から成る部品仮説を部品仮説リスト内に新た
に生成する。また、部品名Xと同一の部品名を持つ部品
仮説Hが部品仮説リスト内に既に存在する場合には、部
品仮説Hの信頼度を信頼性尺度Sを用いてその信頼度が
向上するように更新する。
規則適用制御手段10は、仮説生成規則記憶手段4内の
全ての位置参照型規則を適用した後、部品決定手段7を
起動し、線分情報記憶手段3に格納された部品仮説リス
トを基に各線分の部品名を決定する。部品決定手段7が
生成する部品名は、予め定められた分類すべきカテゴリ
に対応した記号または番号と、そのカテゴリの文字図形
内でのどの部位の線分であるかを示す記号または番号か
ら成る。部品決定手段7は、線分情報記憶手段3の各線
分情報の内まだ決定部品名の項目が定まっていないもの
について、部品仮説リスト13に格納された各線分の複数
の部品仮説を参照し、予め定められた基準によってもっ
とも確からしい部品仮説を選択して線分の部品名を決定
する。更に決定された部品名を同じ線分情報12の決定部
品名の項目に書き込む。
規則適用制御手段10は上記1ないし3の処理が終了
後、線分情報の決定部品名が定まっていない線分が存在
する場合、仮説生成規則記憶手段4内の部品参照型規則
を適用する。対象線分抽出手段5及び仮説更新統合手段
6は上記と同様にして線分情報記憶手段3内の部品仮説
リストを更新する。全ての部品参照型規則を適用した
後、規則適用制御手段10は部品決定手段7を起動する。
部品決定手段7はまだ決定部品名の項目が定まっていな
い線分情報に対して、上記と同様にして決定部品名を定
める。
規則適用制御手段10は上記4の処理を繰り返し起動す
る。上記4の処理においていづれの部品参照型規則も満
足しなかったとき、または全ての線分の決定部品名が定
まったとき、その繰り返しを終了し、6へ移る。
規則適用制御手段10は文字図形生成手段8を起動し、
認識すべき文字図形を最終的に抽出する。文字図形生成
手段8は、線分情報記憶手段3内の線分情報のうち、そ
の決定部品名として同一のカテゴリ名から成る部品名を
有し、且つ局所的に集中した線分群を抽出することによ
って、文字図形を構成する線分群を抽出する。抽出され
た線分群について、対応する文字図形のカテゴリを示す
番号または記号である文字図形識別子(例えば決定部品
名から得られるカテゴリ名X)とその文字図形を構成す
る線分群の線分情報番号群を組にして文字図形記憶手段
9へ出力する。文字図形記憶手段9は、該文字図形生成
手段8の出力結果を第5図に示す項目からなる文字図形
情報15として記憶する機能を有する。文字図形情報15の
うち、文字図形識別子は文字図形生成手段8が出力する
文字図形識別子、構成線分識別子は該文字図形を構成す
る線分群に対応する線分情報番号群が格納される。
規則適用制御手段10は仮説生成規則記憶手段4内の文
字形成参照型規則を適用する。対象線分抽出手段5及び
仮説更新統合手段6は上記と同様にして線分情報記憶手
段3内の部品仮説リストを更新する。全ての文字図形参
照型規則を適用した後、規則適用制御手段10は部品決定
手段7を起動する。部品決定手段7はまだ決定部品名の
項目が定まっていない線分情報に対して、上記と同様に
して決定部品名を定める。この後、規則適用制御手段10
は文字図形生成手段8を起動し、上記6と同様にして認
識すべき文字図形を抽出する。
規則適用制御手段10は上記4ないし7の処理を繰り返
し起動する。繰り返しの過程の上記7の処理においてい
づれの文字図形参照型規則も満足しなかったとき、その
繰り返しを終了する。
以上の動作により、最終的に文字図形記憶手段9内に認
識された文字図形のカテゴリとそれを構成する線分の線
分情報番号が求められる。
以下に具体的な認識例について図面を用いて詳述する。
第6図(a)は文字図形入力手段によって求められた紙
面上の入力画像の例である。ここでは簡単のため、一つ
の文字図形を含む画像を用いて説明する。まず線分抽出
手段2は入力画像よりこの文字図形を構成する線分群を
抽出する。この結果、第6図(b)16ないし18に示すよ
うな3本の線分を抽出し、この各々に対応して第6図
(c)に示すように3つの線分の第1端点座標並びに第
2端点座標の値を線分情報記憶手段3内の線分情報L16
ないしL18の対応する項目へ格納する。尚、第6図
(c)に示す線分情報L16ないしL18は第2図に示した線
分情報12の具体的な実現例であり、第1端点及び第2端
点の座標を示すために、右方向をX軸,下方向をY軸と
した座標軸を設定している。例えば第6図(b)の線分
16に対応した線分情報L16は第1端点としてX座標が1
3,Y座標が10(以下これを(13,10)と記す)の点、第
2端点として(60,10)の点を持つ線分を表している。
またこの時点では線分情報L16ないしL19の部品仮説リス
トおよび決定部品名の項目には名にも格納されていな
い。
次に制御部11は規則適用制御手段10を起動し、上記した
処理過程により仮説の生成処理を開始する。まず規則適
用制御手段10は仮説生成規則記憶手段4内の位置参照型
規則を選択しそれを順次適用する。第7図R1ないしR3に
仮説生成規則記憶手段4内に格納された位置参照型の生
成規則の例を示す、生成規則R1ないしR3は第4図に示し
た生成規則情報14の一具体例であり、いづれも規則分類
の項目に位置参照型であることを示す値0が格納されて
いる。生成規則R1ないしR3の仮説生成条件の記述に用い
られた5種の条件関数の意味は以下の通りである。
(1)方向(L,T):線分Lの方向がTである。
(2)接続(L1,E1,L2,E2):線分L1のE1側の端点と線
分L2のE2側の端点とが接続している。
(3)平行(L1,L2):線分L1と線分L2が平行である。
(4)非接続(L1,L2):線分L1と線分L2とはいづれの
端点でも接続していない。
(5)距離(L1,L2,m,n):線分L1と線分L2との最
短距離がm以上n以下である。
即ち、生成規則R1は、線分X1の方向が水平,線分X2の方
向が垂直,且つ線分X1の左端と線分X2の上端とが接続し
ている場合、線分X1にはカテゴリ名としてC、部位名と
して上から成る部品名(以下これを部品名(C,上)と
記す)を、線分X2には部品名(C,左)を部品仮説の部
品名としてそれぞれ付与することを意味している。規則
適用制御手段10が生成規則R1を適用したのに伴い、対象
線分抽出手段5が上記の仮説生成条件を満足する線分の
集合を抽出する。尚、説明の簡単のため対象線分抽出手
段5は部品仮説の信頼性尺度としては定数1を出力する
ものとして説明する。この場合上記仮説生成規則を満足
する線分群として線分情報番号L16とL17が抽出され、該
線分情報番号と信頼性尺度1が仮説更新統合手段6へ送
られる。これと同時に仮説生成規則記憶手段4から部品
名(C,上)と(C,左)が仮説更新統合手段6へ送ら
れる。仮説更新統合手段6はこれらの入力を基に線分情
報記憶手段3内の部品仮説リストを第8図(a)に示し
たように更新する。即ち、線分情報L16に対しては部品
仮説リストが空であるのでその第1部品仮説に部品名
(C,上)と信頼度1からなる部品仮説(以下これを部
品仮説[C,上,1]と記す)を書き込む。同様にして
線分情報L17に対しては部品仮説[C,左,1]をその
第1部品仮説に書き込む。規則適用制御手段10は次に仮
説生成規則R2の適用を試みる。この結果、対象線分抽出
手段5が線分情報番号L17とL18を抽出を抽出すると共に
仮説生成規則記憶手段5はそれぞれ対する部品仮説の部
品名(C,左)と(C,下)を仮説更新統合手段6へ出
力する。これに伴い仮説更新統合手段6は第8図(b)
のように部品仮説リストを更新する。即ち、線分情報L1
7に対しては同一の部品名(C,左)を持つ部品仮説
[C,左,1]が既に存在するので、その信頼度を統合
した新たな部品仮説[C,左,2]を書き込む。尚、こ
こでは簡単のため同一の部品名を有する二つの部品仮説
の統合は両者の信頼度の和をとるものとして説明する。
線分情報L18に対しては同じ部品名(C,下)を有する
仮説が存在しないので部品仮説[C,下,1]を新たに
登録する。規則適用制御手段10は同様にして生成規則R3
の適用を試み、この結果第8図(c)のように部品仮説
リストが更新される。
規則適用制御手段10は適用すべき位置参照型の生成規則
が存在しなくなったので次に部品決定手段7を起動し、
線分16ないし18の部品名を決定する。部品決定手段7は
線分情報記憶手段3に格納された線分情報L16ないしL18
の各々に対し、その部品仮説リストに登録された部品仮
説のうちで最大の信頼度を持つ部品仮説を選択し、その
部品仮説の部品名を対応する線分情報の決定部品名の項
目に書き込む。この例ではいづれの部品仮説リスト内に
も唯一の部品仮説しか存在しないので、各々の第1部品
仮説の部品名が選択される。この結果、第9図に示した
ように線分情報L16ないしL18の決定部品名にそれぞれ部
品名(C,上),(C,左),(C,下)が登録され
る。
規則適用制御手段10は次の部品参照型の生成規則の適用
を試みるがこの例では該当する生成規則が存在しないの
で、文字図形生成手段8を起動し、認識すべき文字図形
を構成する線分群を抽出し、その結果を文字図形記憶手
段9に格納する。文字図形生成手段8は線分情報記憶手
段3内の線分情報のうちその決定部品名として同一のカ
テゴリ名から成る部品名を有し、且つ局所的に集中して
存在する線分情報群を抽出する。この例では簡単のた
め、文字を一つしか含まない入力画像を用いて節氏して
いるため、文字図形生成手段8は第9図に示した線分情
報群L16ないしL18全てを抽出する。同時に第10図に示し
たように文字図形記憶手段9内に新たな文字図形情報S1
を生成し、その文字図形識別子としてカテゴリ名C、構
成線分識別子としてL16,L17,L18を書き込む。
以上の処理により入力された画像から認識すべき文字図
形を構成する線分群が文字図形記憶手段9内に求められ
る。上記の説明では入力画像中に文字図形が一つだけ存
在する場合であったが、複数の文字図形が存在する場合
には最終的に文字図形記憶手段9内に複数の文字図形情
報が生成される。
次に仮説生成規則記憶手段4内に部品参照型の生成規則
を含む実施例の場合の動作を第11図ないし第16図を用い
て示す。第11図は認識あるいは識別すべき2つの類似し
た構造を持つ文字図形の例である。第11図における19a
ないし19eは図形ANDの構成線分であり、19aないし19eの
部品名をそれぞれ(AND,上),(AND,頭1),(AN
D,頭2),(AND,底),(AND,尾)とする。また20a
ないし20gは図形ORの構成線分であり、20aないし20gの
部品名をそれぞれ(OR,上),(OR,頭1),(OR,頭
2),(OR,底),(OR,弧2),(OR,尾),(OR,
弧1)とする。
第12図(a)は文字図形入力手段によって求められた紙
面上の入力画像の例である。ここでは簡単のため、一つ
の文字図形を含む画像を用いて説明する。まず線分抽出
手段2は入力画像よりこの文字図形を構成する線分群を
抽出する。この結果、第12図(b)21ないし25に示すよ
うな5本の線分を抽出し、この各々に対応して第12図
(c)に示すように5つの線分の第1端点座標並びに第
2端点座標の値を線分情報記憶手段3内の線分情報L21
ないしL25の対応する項目へ格納する。尚、この時点で
は線分情報L21ないしL25の部品仮説リストおよび決定部
品名の項目には何も格納されていない。
次に制御部11は規則適用制御手段10を起動し、仮説の生
成処理を開始する。まず規則適用制御手段10は第6図の
場合と同様にして仮説生成規則記憶手段4内の位置参照
型規則を選択しそれを順次適用する。第13図はこの結果
線分情報記憶手段3内に得られた部品仮説リストを示
す。例えば線分21に対しては二つの部品仮説[OR,上,
1]と[AND,上,2]が生成されている。規則適用制
御手段10は次に部品決定手段7を起動し、線分21ないし
25の部品名を決定する。部品決定手段7は線分情報L21
ないしL25の各々に対し、その部品仮説リストに登録さ
れた部品仮説のうちで最大の信頼度を持つ部品仮説を選
択し、その部品仮説の部品名を対応する線分情報の決定
部品名の項目に書き込む。即ち、線分情報L21,L24およ
びL25についてはそれぞれ決定部品名(AND,上),(AN
D,底),(AND,尾)が第13図に示すように格納され
る。一方、線分情報L22とL23については二つの部品仮説
の信頼度が等しいため、決定部品名が決定されないまま
となる。
規則適用制御手段10は部品名が決定されていない線分情
報があるので、続いて部品参照型の生成規則の適用を試
みる。第14図R4ないしR7は仮説生成規則記憶手段4に格
納された部品参照型生成規則の一例を示す。生成規則R4
ないしR7は第4図に示した生成規則情報14の一具体例で
あり、いずれも規則分類の項目に部品参照型であること
を示す値1が格納されている。生成規則R4ないしR7の仮
説生成条件の記述に用いられた条件関数、 部位接続(L,S,B) の意味は、部品名(S,B)を決定部品名の項目に有し
ている線分とある線分Lが接続していることを示すもの
である。例えば生成規則R4は、部品名(AND,上)を有
する線分とある線分X1とが接続しているならば、該線分
X1に部品名(AND,頭1)の部品仮説を付与する規則を
示している。規則適用制御手段10は、まず生成規則R4を
適用する。対象線分抽出手段5は該仮説生成条件を満た
す線分として線分情報番号L22を抽出し、該線分番号L22
と信頼度1を仮説更新統合手段6へ出力する。同時に仮
説生成規則記憶手段4は部品仮説の部品名(AND,頭
1)を仮説更新統合手段6へ出力する。仮説更新統合手
段6はこれらの入力を基に線分情報記憶手段3内の部品
仮説リストを第13図(b)に示したように更新する。即
ち、線分情報L22には仮説生成規則記憶手段4が出力し
た部品名(AND,頭1)と同一の部品名を有する第2部
品仮説[AND,頭1,2]が既に存在するので、その信
頼度を更新し、部品仮説を[AND,頭1,3]に変更す
る。規則適用制御手段10は次に生成規則R5およびR6の適
用を順次試みるが、これを満たす線分が存在しないので
部品仮説リストは変更されない。次に満足される生成規
則は生成規則R7であり、対象線分抽出手段5は生成規則
R7の仮説生成条件を満たす線分として線分情報番号L23
を抽出し、該線分番号L23と信頼度1を仮説更新統合手
段6へ出力する。同時に仮説生成規則記憶手段4は部品
仮説の部品名(AND,頭2)を仮説更新統合手段6へ出
力する。仮説更新統合手段6は線分情報L22の場合と同
様にして第13図(b)に示すように第2部品仮説を[AN
D,頭2,3]に変更する。
規則適用制御手段10は適用すべき部品参照型の生成規則
が存在しなくなったので次に部品決定手段7を起動し、
部品名が決定されていない線分22および23の部品名を決
定する。部品決定手段7は線分情報記憶手段3に格納さ
れた線分情報L22ないしL23の各々に対し、その部品仮説
リストに登録された部品仮説のうちで最大の信頼度を持
つ部品仮説を選択し、その部品仮説の部品名を対応する
線分情報の決定部品名の項目に書き込む。この結果、第
13図(b)に示すように線分情報L22とL23の決定部品名
の項目にそれぞれ部品名(AND,頭1),(AND,頭2)
が格納される。
全ての線分21ないし25の決定部品名が定まったので、規
則適用制御手段10は次に文字図形生成手段8を起動し、
認識すべき文字図形を構成する線分群を抽出し、その結
果を文字図形記憶手段9に格納する。この結果、文字図
形生成手段8は第13図(b)に示した線分情報群L21な
いしL25全てを抽出し、第16図に示したように文字図形
記憶手段9内に新たな文字図形情報S2を生成し、その文
字図形識別子としてカテゴリ名AND,構成線分識別子と
してL21ないしL25を書き込む。
以上の処理により入力された画像から認識すべき文字図
形を構成する線分群が文字図形記憶手段9内に求められ
る。上記の説明では入力画像中に文字図形が一つだけ存
在する場合であったが、複数の文字図形が存在する場合
には最終的に文字図形記憶手段9内に複数の文字図形情
報が生成される。尚、第14図に示した部品参照型の生成
規則R4ないしR7を一括して、第15図に示した生成規則R8
のように与えることも可能である。生成規則R8の仮説生
成条件の記述に用いられた条件関数、 部品接続(L,S) の意味は、カテゴリ名としてSを持つような部品名を決
定部品名の項目に有している線分とある線分Lが接続し
ていることを示すものである。即ち、生成規則R8は部品
名のカテゴリ名としてANDを有するような線分とある線
分X1が接続しているならば、該線分X1に存在する部品仮
説の内、部品名のカテゴリ名としてANDを有するような
部品仮説の信頼度を向上させることを示している。即
ち、仮説部品名の項目に示された記号*は部品仮説の更
新の際に部品名の内の部位名の違いを考慮しないことを
示している。
次に仮説生成規則記憶手段4内に文字図形参照型の生成
規則を含む実施例の場合の動作を第17図ないし第22図を
用いて示す。第17図は認識あるいは識別すべき2つの文
字図形の例である。第17図26aないし26gで構成される図
形ORが、27aないし27cで構成される図形「後弧」を部分
図形として含むような例であり、26aないし26gの部品名
をそれぞれ(OR,上),(OR,頭1),(OR,頭2),
(OR,底),(OR,弧2),(OR,尾),(OR,弧1)
とする。また27aないし27cの部品名をそれぞれ(後弧,
弧1),(後弧,尾),(後弧,弧2)とする。
第18図(a)は文字図形入力手段によって求められた紙
面上の入力画像の例である。まず線分抽出手段2は入力
画像よりこの文字図形を構成する線分群を抽出する。こ
の結果、第18図(b)28ないし37に示すような10本の線
分を抽出し、この各々に対応して第18図(c)に示すよ
うに10個の線分の第1端点座標並びに第2端点座標の値
を線分情報記憶手段3内の線分情報L28ないしL37の対応
する項目へ格納する。尚、この時点では線分情報L28な
いしL37の部分仮説リストならびに決定部品名の項目に
も何も格納されていない。
次に制御部11は規則適用制御手段10を起動し、仮説の生
成処理を開始する。即ち、規則適用制御手段10は第12図
の場合と同様の仮説生成規則記憶手段4内の位置参照型
規則および部品参照型の生成規則の適用、部品決定手段
7の起動、および文字図形生成手段8の起動を行う。第
19図(a)はこの結果線分情報記憶手段3内に得られた
部品仮説リストおよび決定部品名を示している。例えば
線分32に対しては二つの部品仮説「OR,弧2,2]と
「後弧,弧2,1]が生成されると共に、その線分が部
品名(OR,弧2)を持つことが決定されている。また第
20図は文字図形生成手段8によって文字図形記憶手段9
内に格納された文字図形情報S3を示している。即ち、線
分28ないし線分34から成るカテゴリ名ORの文字図形情報
S3が抽出されている。
規則適用制御手段10は部品名が決定されていない線分情
報があるので、続いて文字図形参照型の生成規則の適用
を試みる。第21図R9およびR10は仮説生成規則記憶手段
4に格納された文字図形参照型生成規則の一例を示す。
生成規則R9ないしR10は第4図に示した生成規則情報14
の一具体例であり、いづれも規則分類の項目に文字図形
参照型であることを示す値2が格納されている。生成規
則R9ないしR10の仮説生成条件の記述に用いられた3種
の条件関数の意味は以下の通りである。
(1)文字図形距離(L,S,m,n):線分Lとカテ
ゴリSを有する文字図形との最短距離がm以上n以下で
ある。
(2)左側(L,S):線分LがカテゴリSを有する文
字図形の左側に位置する。
(3)右側(L,S):線分LがカテゴリSを有する文
字図形の右側に位置する。
例えば生成規則R9は、カテゴリ名として後弧を有する文
字図形とある線分X1との距離が5以上50以下であり、且
つ線分X1と文字図形後弧の左側に位置するならば、該線
分X1に存在する部品仮説の内、部品名のカテゴリ名とし
てORを有するような部品仮説の信頼度を向上させること
を示している。即ち、仮説部品名の項目に示された記号
*は生成規則R8の場合と同様に部品仮説の更新の際に部
品名の内の部位名の違いを考慮しないことを示してい
る。規則適用制御手段10は、まず生成規則R9を適用する
が、該仮説生成条件を満足する線分は存在しないので、
対象線分抽出手段5は何も抽出しない。続いて規則適用
制御手段10は生成規則R10を適用する。対象線分抽出手
段5は該仮説生成条件を満たす線分として線分情報番号
の集合{L35,L36,L37}を抽出し、信頼度1と共にこれ
を仮説更新統合手段6へ出力する。同時に仮説生成規則
記憶手段4は部品仮説の部品名(後弧,*)を仮説更新
統合手段6へ出力する。仮説更新統合手段6はこれらの
入力を基に線分情報記憶手段3内の部品仮説リストを第
19図(b)に示したように更新する。即ち、線分情報L3
5に対しては、仮説生成規則記憶手段4が出力したカテ
ゴリ名後弧と同一のカテゴリ名から成る部品名を有する
第2部品仮説[後弧,弧1,1]が既に存在するので、
その信頼度を更新し、部品仮説を[後弧,弧1,2]に
変更する。同様に線分情報L36とL37についても部品仮説
の信頼度を更新し、各々の第2部品仮説が[後弧,尾,
3],[後弧,弧2,2]となる。
規則適用制御手段10は適用すべき部品参照型の生成規則
が存在しなくなったので次に部品決定手段7を起動し、
部品名が決定されていない線分35ないし37の部品名を第
19図(b)に示すように決定する。この後、規則適用制
御手段10は文字図形生成手段8を再び起動し、認識すべ
き文字図形を構成する線分群を抽出する。文字図形生成
手段8はこの結果、第22図に示したように、文字図形記
憶手段9内に文字図形識別子としてカテゴリ名後弧、構
成線分識別子としてL35ないしL37を有する新たな文字図
形情報S4を生成する。
以上の処理により入力された画像から認識すべき2つの
文字図形を構成する線分群が文字図形記憶手段9内に求
められる。
以上の3つの実施例の説明では入力画像中に出現する文
字図形として文字C,図形AND,図形OR,図形後弧のみ
を考えたが、仮説生成規則記憶手段4内の生成規則を追
加変更することによりこれ以外の文字のみならず図面に
用いられる図形に対しても認識が可能であることは明ら
かである。また対象線分抽出手段5が生成する信頼性尺
度として定数1を出力するものとして説明したが、抽出
された線分が生成規則内の仮説生成条件を満足する度合
を信頼性尺度として出力し、これを基に仮説更新統合手
段6が部品仮説内の信頼度を生成または更新することも
可能である。例えば対象線分抽出手段5が0から1の範
囲の値の信頼性尺度を生成する場合には、部品仮説内に
与える総合的な信頼度としては複数の信頼性尺度の最大
値、あるいは次式 Pn+1=Pn+(1-Pn)×P 但しPnは更新前の信頼度 Pn+1は更新後の信頼度、 Pは対象線分抽出手段が出力する信頼性尺度で与えられ
る値を用いることができる。
また、仮説生成規則記憶手段4内に格納する生成規則は
第4図に示したような3つの項目からなる表形式だけで
なく、第23図(a)に示したような記述形式でもよい。
第23図(a)に示した生成規則は仮説を生成する際の条
件を示したCONDITION部と、そのCONDITION部を表現する
際に用いる変数名の宣言を示したDECLARE部とから成
る。第23図(a)において、(<対象変数名i>,<部
品名i>)は、該生成規則を成立させた場合に仮説を付
与する対象となる線分を定義する変数名とその線分に付
与する部品仮説の部品名の組、(<変数名j>,<属性
分類j>)はCONDITION部で用いる変数名と、その変数
に割り当てる対象を線分または特定のカテゴリの文字図
形であるかを選択する属性分類との組、<条件関数k>
は仮説を生成する対象となる線分または線分群が満足す
べき条件である。例えば、第7図の生成規則R1を第23図
(a)に従った記述形式で表現したものを第23図(b)
に示す。尚、この表現形式においては、各生成規則にお
いて参照するものをDECLARE部において宣言しているの
で、第7図における規則分類の項目に相当する記述は不
要である。
また、上記の説明においては、仮説生成条件を記述する
と共に対象線分抽出手段5が対象の線分を抽出するため
の条件関数として延べ10種類の条件関数しか挙げなかっ
たが、これ以外の条件関数を予め用意しておくことによ
って多様な仮説生成条件を記述し、結果的に多様な文字
図形を認識することができるのは明らかである。
(発明の効果) 以上説明したように本文字図形認識方式によれば、仮説
生成規則記憶手段4内の生成規則に従って対象線分抽出
手段5が仮説を付与する対象となる線分または線分群を
抽出し、仮説更新統合手段5が抽出された線分に対して
多数の仮説を生成すると共に、部品決定手段7が多数の
仮説から総合的に各線分の部品名を判定するため、線分
抽出手段2によって異なる位相構造の線分群が抽出され
た場合でも、各線分がどの文字図形のどの部位であるか
を正しく判定できる。また仮説生成規則記憶手段4内に
は、局所的な線分の位置関係を基本とした線分構造によ
る生成規則や部品名が既に定まった線分との相対的関係
に基づいた生成規則、あるいは既に抽出された文字図形
との相対的関係に基づいた生成規則といった異なる種類
の生成規則を同一の記述構造によって格納できるため、
仮説を生成する際に着目する対象毎に仮説生成手段を設
ける必要がない。従って、文字図形認識方式を構成する
にあたってのシステムの構成要素が単純であり、実現の
際のコストの低減が図れる。結果的に仮説を生成して文
字図形を認識する方式の実現性を高める効果を有する。
更に、仮説生成規則記憶手段4内に与える生成規則を追
加変更することによって、認識が可能な文字図形を容易
に変更できる。また、仮説生成規則記憶手段4内の生成
規則の記述方式を第23図のようにすることによって、生
成規則を記述する人にとって記述しやすい環境を提供す
ることも同時に可能となる。
【図面の簡単な説明】
第1図は本発明を適用した文字図形認識方式の一実施例
の機能を示す論理ブロック図、第2図は線分情報記憶手
段3に格納される線分情報の形式を示す図、第3図は線
分情報内に格納される部品仮説リストの形式を示す図、
第4図は仮説生成規則記憶手段4に格納される生成規則
情報の形式を示す図、第5図は文字図形記憶手段9に格
納される文字図形情報の形式を示す図、第6図は入力さ
れた第1の文字図形画像の例と線分抽出手段2が生成し
た線分情報の例を示す図、第7図は仮説生成規則記憶手
段4に格納した第1の生成規則の例を示す図、第8図は
部品仮説リストの内容の変化を示す図、第9図は線分情
報内に決定された部品名を示す図、第10図は文字図形記
憶手段9に格納された文字図形情報の例を示す図、第11
図は第2の認識すべき2つの文字図形の例を示す図、第
12図は入力された第2の文字図形画像の例と線分抽出手
段2が生成した線分情報の例を示す図、第13図は線分情
報記憶手段3に格納された第2の部品仮説リストと決定
部品名を示す図、第14図は仮説生成規則記憶手段4に格
納された第2の生成規則の例を示す図、第15図は仮説生
成規則記憶手段4に格納する第2の生成規則の別の記述
例を示す図、第16図は文字図形記憶手段9に格納された
第2の文字図形情報の例を示す図、第17図は第3の認識
すべき2つの文字図形の例を示す図、第18図は入力され
た第3の文字図形画像の例と線分抽出手段2が生成した
線分情報の例を示す図、第19図は線分情報記憶手段3に
格納された第3の部品仮説リストと決定部品名を示す
図、第20図は文字図形生成手段9が生成した第3の文字
図形情報を示す図、第21図は仮説生成規則記憶手段4に
格納された第3の生成規則の例を示す図、第22図は文字
図形記憶手段9に格納された第4の文字図形情報の例を
示す図、第23図は仮説生成規則記憶手段4に格納する生
成規則の別の記述方法を示す図である。 1は紙面上に記録された図面を走査して画像を入力し記
憶する文字図形入力手段、2は該文字図形入力手段1に
よって得られた文字図形画像を構成する線分を抽出し位
置情報を出力する線分抽出手段、3は該線分抽出手段2
によって得られた位置情報と後記する仮説更新統合手段
が出力する文字または図形の部品仮説並びに後記する部
品決定手段が出力する部品情報とを線分情報として記憶
する線分情報記憶手段、4は線分が文字または図形の一
部であることを仮定する部品仮説と該部品仮説を付与す
る対象となる線分の満たすべき条件の組で表現された生
成規則を記憶する仮説生成規則記憶手段、5は部品仮説
を付与する対象となる線分の集合を該生成規則の条件に
従って抽出する対象線分抽出手段、6は対象線分抽出手
段5が出力した対象線分に対して所定の部品仮説を新た
な部品仮説として生成または既に線分情報記憶手段3に
記憶されている部品仮説を所定の部品仮説によって更新
する仮説更新統合手段、7は線分情報記憶手段3内に記
憶された線分の部品仮説より各線分の文字図形内におけ
る部位を決定し部品情報として出力する部品決定手段、
8は該部品情報をもとに同一文字または同一図形を構成
する線分の集合を生成し文字図形情報として出力する文
字図形生成手段、9は該文字図形情報を記憶する文字図
形記憶手段、10は仮説生成規則記憶手段4において適用
すべき生成規則を選択する規則適用制御手段、11は文字
図形入力手段1ないし規則適用制御手段10を制御し一連
の処理を制御する制御部である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】紙面上に記録された文字図形を走査して得
    られた画像から線分を抽出する線分抽出手段と, 該線分抽出手段によって得られた線分の位置情報と、該
    線分が文字図形の部品になり得る可能性を表す部品仮説
    と、該線分について最終的に判定された文字図形の部品
    を表す部品情報とを線分情報として記憶する線分情報記
    憶手段と, 線分群の満たすべき条件と、該条件を満たす各線分に付
    与する文字図形における部位を表す部品名の組で表現さ
    れた生成規則を記憶する仮説生成規則記憶手段と, 該生成規則の線分群の満たすべき条件を満たす前記線分
    情報記憶手段内の線分群を抽出する対象線分抽出手段
    と, 該対象線分抽出手段が出力した対象線分に対して、生成
    規則内の部品名と信頼度とを前記部品仮説として前記線
    分情報記憶手段に出力するか又は既に前記線分情報記憶
    手段に記憶された同一線分の前記部品仮説を該部品仮説
    によって追加更新する仮説更新統合手段と, 該線分情報記憶手段内に記憶された線分の部品仮説より
    各線分の文字図形内における部位を決定し前記部品情報
    として前記線分情報記憶手段に出力する部品決定手段
    と, 該部品情報をもとに同一文字または同一図形を構成する
    線分の集合を生成し文字図形情報として出力する文字図
    形生成手段と, 前記仮説生成規則記憶手段において適用すべき前記生成
    規則を、参照する情報が求まっているものから順に選択
    する規則適用制御手段と を備えることを特徴とする文字図形認識方法。
JP62177799A 1987-07-15 1987-07-15 文字図形認識方法 Expired - Lifetime JPH0656621B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62177799A JPH0656621B2 (ja) 1987-07-15 1987-07-15 文字図形認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62177799A JPH0656621B2 (ja) 1987-07-15 1987-07-15 文字図形認識方法

Publications (2)

Publication Number Publication Date
JPS6421585A JPS6421585A (en) 1989-01-24
JPH0656621B2 true JPH0656621B2 (ja) 1994-07-27

Family

ID=16037291

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62177799A Expired - Lifetime JPH0656621B2 (ja) 1987-07-15 1987-07-15 文字図形認識方法

Country Status (1)

Country Link
JP (1) JPH0656621B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU706285B2 (en) * 1995-05-16 1999-06-10 Ajinomoto Co., Inc. Feed additive

Also Published As

Publication number Publication date
JPS6421585A (en) 1989-01-24

Similar Documents

Publication Publication Date Title
US6118897A (en) Interactive drawing recognition processing method and apparatus thereof
CN110335277A (zh) 图像处理方法、装置、计算机可读存储介质和计算机设备
CN104063723B (zh) 脱机手写汉字的笔画还原方法及装置
JP2003529137A (ja) データ構造を処理する方法
Fahn et al. A topology-based component extractor for understanding electronic circuit diagrams
JP3796658B2 (ja) 解析モデル作成装置
Chen et al. Handwritten character recognition using a 2-layer random graph model by relaxation matching
JP4275866B2 (ja) カラー画像から文字列パターンを抽出する装置および方法
EP0709800B1 (en) Method for designing classification trees
JP2003242513A (ja) 2つ以上の任意のパス上で集合演算を実行して単純輪郭パスを生成する方法
JPH0656621B2 (ja) 文字図形認識方法
CN110489618A (zh) 树形图渲染方法、装置、设备和介质
US20220207287A1 (en) System and Method of Clustering Machine Learning Flows
US20220180243A1 (en) System and method of suggesting machine learning workflows through machine learning
US20220180245A1 (en) System and method of constructing machine learning workflows through machine learning suggestions
CN108256578A (zh) 一种灰度图像的识别方法、装置、设备及可读存储介质
CN109145098B (zh) 基于知识图谱的中华文化元素信息搜索方法
Ebi et al. Automatic Data Acquisition from Topographic Maps Using a Knowledge Based Image Analysis System
JP2945601B2 (ja) 対話型図面入力方法
JP3617225B2 (ja) 描画処理装置
Marchand-Maillet et al. A minimum spanning tree approach to line image analysis
JPH0769967B2 (ja) 形状記述方法
EP1538547A1 (en) Method and device for extracting skeletal data from image data
JPH0616267B2 (ja) 計算機システムの高速処理方法
Consularo et al. Quadtree-based inexact graph matching for image analysis