JPS62280988A - 画像デ−タの自動分類方式 - Google Patents

画像デ−タの自動分類方式

Info

Publication number
JPS62280988A
JPS62280988A JP12411386A JP12411386A JPS62280988A JP S62280988 A JPS62280988 A JP S62280988A JP 12411386 A JP12411386 A JP 12411386A JP 12411386 A JP12411386 A JP 12411386A JP S62280988 A JPS62280988 A JP S62280988A
Authority
JP
Japan
Prior art keywords
image data
patterns
pattern
classification
category name
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP12411386A
Other languages
English (en)
Inventor
Yuko Harada
原田 優子
Mitsuo Ishii
石井 光雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP12411386A priority Critical patent/JPS62280988A/ja
Publication of JPS62280988A publication Critical patent/JPS62280988A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 〔4既要〕 外部より人力された特定のソノテゴリ名を持つ2値画像
データを臼/黒/仄色の何れかのパターンに決定して、
本状に分類する方弐乙こおいて、該本状のある分類レベ
ルで、複数個のカテゴリ名の区別ができないときには、
各カテゴリ名の画像データの全体を複数個の小領域に分
割し、咳分割された小領域のパターンを求めて区別する
第1の手段と、各分類レベルでの各カテゴリ名の持つパ
ターンから、該カテゴリ名の画像データの特徴を自動的
に抽出し、該特徴を用いて分類する第2の手段とを設け
ることにより、複数個の2値画像データを木状に分類す
るようにしたものである。
〔産業上の利用分野〕
本発明は、2値画像データのパターンを学習。
認識する際に利用するパターン分類トリーを、自動的に
作成する画像データの自動分類方式に関する。
最近の計算機技術の進歩に伴い、機械書き2手書き等の
2値画像データが自動的に入力され、処理されるように
なってきた。
この場合、機械書きの文字1図面等は、規則的に書かれ
ている為、計算機システムにおいても認識し易いが、手
書き図面3手書き文字については、作成者の個性的な面
が、その2値画像データを支配することが多い為、その
認識が難しく、接手書き図面5手書き文字の自動入力を
行う為の効果的な分類方式が待たれるようになってきた
〔従来の技術〕
第4図は従来の2イヘ画像データの分類方式を説明する
図である。
先ず、中央処理装置(CPU) 1が特定のプログラム
20を実行することにより、デジタイザ/画像入力装置
(スキャナ)5によって任意の画像データが読み取られ
、2値化されてファイルメモリ(FM) 3に格納され
る。
該ファイルメモリ(FM) 3に格納された2値画像デ
ータが、中央処理装置(CPII) 1が実行する別の
プログラム20によって、主記憶装置(MS) 2上の
画像データバッファ21に読み出された後、別途人間が
見つけた画像の構造上の特徴を組み込んで作成された認
識プログラム22によって識別9分類され、上記主記憶
装置(旧)2上のトリー領域25に、分類トリーを生成
していた。
(発明が解決しようとする問題点〕 従って、従来方式においては、入力された複数個の2値
画像を分類する為の、該画像の構造上の特徴を人間が見
つけ、上記特徴を組み込んだ認識プログラム22を生成
する必要があった。
その為、入力される画像パターンの種類(例えば、文字
1図形1等)や、サイズ等によって、該認識プログラム
22も別となり、分類処理が複雑になる上に、認識プロ
グラムの作成に時間がかかると云う問題があった。
又、画像データを区別する為の構造上の特徴が不足して
いる場合については、新たに人間が特徴を見つけ、該認
識プログラム22を変更、追加する必要があり、認識プ
ログラムが複雑になると云う問題があった。
本発明は上記従来の欠点に鑑み、2値画像データの分類
トリーを、システムが学習により、自動的に作成し、且
つ改良して効率良く、分類トリーを成長させていく方法
を堤供することを目的とするものである。
〔問題点を解決するための手段〕
第1図は本発明の自動分類方式の概念を説明する図であ
って、(a)は学習過程を示し、(b)は改良の過程を
示している。
本発明においては、外部より入力された特定のカテゴリ
名を持つ2値画像データの全体を“白”か、“黒″か、
”灰色゛の何れかに決定し、このパターンを比較して、
該画像データを本状に区別する分類方式であって、接木
のある段階におい′て、複数個のカテゴリ名の画像デー
タを区別できないときには、各カテゴリ名の画像データ
の全領域を分割し、該分割した小領域のパターンを求め
て区別する第1の手段(a)と、各カテゴリ名の各段階
における画像データが持つパターンから、該段階におけ
る該カテゴリ名の画像データの特徴を抽出し、該特徴を
用いて分類する第2の手段(b)とを設け、上記第1の
手段(a)と、第2の手段(b)を繰り返し実行するこ
とにより、2値画像データを本状に分類するように構成
する。
〔作用〕
即ち、本発明によれば、外部より入力された特定のカテ
ゴリ名を持つ2値画像データを白/黒/灰色の何れかの
パターンに決定して、木状に分類する方式において、該
本状のある分類レベルで、複数個のカテゴリ名の区別が
できないときには、各カテゴリ名の画像データの全体を
複数個の小領域に分割し、該分割された小領域のパター
ンを求めて区別する第1の手段と、各分類レベルでの各
カテゴリ名の持つパターンから、該カテゴリ名の画像デ
ータの特徴を自動的に抽出し、該特徴を用いて分類する
第2の手段とを設けることにより、複数個の2値画像デ
ータを本状に分類するようにしたものであるので、人手
によって見つけた2値画像の構造上の特徴を一切与える
ことなく、且つ人力画像の種類や1サイズ等に依存しな
いで分類トリーの生成ができ、入力画像の各カテゴリ名
の画像データの分類が容易となる効果がある。
〔実施例〕
以下本発明の実施例を図面によって詳述する。
第2図は本発明の一実施例を模式的に示した図であり、
第3図は本発明の領域分割方式を説明する図で、(a)
は分割方法を示し、(b)は分割例を示しており、第2
図における分割処理プログラム23、特徴抽出処理プロ
グラム24が本発明を実施するのに必要な手段である。
尚、全図を通して同じ符号は同じ対象物を示している。
本発明を実施しても、デジタイザ等から取り込んだ入力
画像をファイルメモリ(FM) 3に格納し、主記憶装
置(MS) 2上の画像データバッファ21に読み出す
迄の処理は特に変わることはないので省略し、ここでは
、分割処理プログラム23.特徴抽出処理プログラム2
4を実行して、分類トリー25を生成する方法を中心に
、第1図を参照しながら第2図、第3図によって説明す
る。
ここでは、説明の便宜上、2値画像を対象とする。該2
値画像は“白゛、又は°黒゛の画素からなっており、本
発明の分類処理システムが得ることができる該画像から
の情報は、該画像のある領域が゛白゛画素のみからでき
ている(”W’)のか。
゛黒゛画素のみでできている(’B’)のか、それとも
°白”画素と、“黒”画素からできている(”G”)か
のパターンである。
本発明を実施して生成するパターン分類トリーは、各ノ
ード毎に、パターン、画像名1画像のカテゴリ名、特徴
等を持つことができる。
本発明による自動分類方式においては、最初何も学習し
ていない状B(即ち、パターン分類トリーの技がない状
B)から始まる。
先ず、C1と云うカテゴリ名を持つ画像P1が入力され
ると、該画像P1全体が、上記W/B/Gの何れである
かが決定される。
仮に、Bとすると、第1図(a) (1)の技が生成さ
れる。次にC2と云うカテゴリ名を持つ画像P2が入力
され、そのパターンがGであったとすると、第1図(a
) f2)のような分類トリーとなる。
画像全体を1つのパターン(W/B/G)で表現するこ
の段階をレベル1とすると、該レベル1では、画像のパ
ターンがBならばC1と云うカテゴリ名を持つ画像、G
ならばC2と云うカテゴリ名を持つ画像と認識できる。
次に、C3と云うカテゴリ名を持つ画像P3のパターン
がGであったとすると、第1図(a) (31では、1
つのノードに2つの異なるカテゴリ名(cz、 C、I
)を持つ画像が分類されているが、この第ルベルでは両
者の区別はできない。
そこで、本発明の分割処理プログラム23を実行し、画
像パターンP2.P3をn分割し、各領域を学習する。
今、n=g4とすると、該画像は各レベルにおいて、第
3図のように分割されてい(ことになる。
該分割した領域に順番を付けておき(例えば、左上から
右廻りに順番を付ける)、この順に従って、各領域のパ
ターン(W/B/G)を求め、それらを合わせて該画像
全体のパターンとする。但し前のレベルでW/Bと決定
した領域は、それ以上分割しても意味がないので分割し
て解析することはしないようにする。
このようにして、第2レベルでの画像パターンP2. 
P3を求め、それぞれが“BGGG” 、 ’GWBG
“であったとすると、第1図(a) f41の分類トリ
ーが形成される。
この学習により、C2と、C3と云うカテゴリ名を持つ
画像を、本第2レベルで区別することができることにな
る。
同じようにして、C4と云うカテゴリ名を持つ画像P4
と+ CZと云うカテゴリ名を持つ画像P5.P6と+
 C3と云うカテゴリ名を持つ画像P7を学習した結果
を第1図(5)に示している。ここまでの学習を第1ス
テツプ(第1図(a)参照)とする。
学習の第2ステツプは、該作成したパターン分類トリー
(第1図(a) +5)参照)を効率の良い学習。
認識が行えるように改良する手法で、中央処理装置(C
PU) 1が特徴抽出処理プログラム24を実行するこ
とにより達成することができる。
この改良手段は、分類トリーの1つのノードができるだ
け少ないカテゴリ名を持つようにし、且つあるレベルに
おいて、1つのカテゴリ名が複数のノードに重複して現
れることがないように、各カテゴリ名がもつパターンの
特徴を抽出し、その特徴を用いて各画像を分類する方法
である。
該改良方法を、第1図(a) +5)を例にして説明す
ると、第ルベルでは領域分割がなく、パターンが1つ(
B/G)であるので、その特徴パターンは、それぞれB
、Gとなる。(第1図(b)(1)口参照)次に、第2
レベル(4分割)では、Cz、 Cx、C4と云うカテ
ゴリ名のパターンが入り混じっているので、これをカテ
ゴリ毎に整理する。先ず、当該第2レベルにおいて、C
2と云うカテゴリ名が持つ画像の全パターンについて見
ると、 カテゴリCz’−・−・・・−1−・・BGGGl・・
・・GWB G であり、酸カテゴリCtでは、各領域で等しいパターン
は、4番目のGであり、あとには共通なパターンがない
ので、該カテゴリC2の特徴パターンは’−−−G’ 
 であるとする。
この特徴パターンを用いて、分類できるパターンを全て
集めると、パターンBGGGを持つカテゴリC2と、パ
ターンGWBGを持つカテゴリC2とC3であるので、
これらを、第1図(a) +5)における、第2レベル
以下のトリーとして、特徴パターン°−−−G″の下に
付けてお(ようにする。
このような改良を行うことにより、特徴パターン°−−
−G’を持たないものとして、例えば、パターンGWB
11を持つカテゴリC3+パターンW[lGBを持つカ
テゴリC4があり、それぞれのパターンが特徴パターン
となる。従って、このときの分類トリー25は、第1図
(b) (21となる。
第1図(b) (2)において、特徴パターン“−−−
G“を持つトリーにおいては、カテゴリCZ、 Csを
区別することができないので、次のレベル3において、
該トリーの改良を行う。即ち、 第3レベル(8分割)における特徴パターンの抽出は、
上記と同様にして、各ノード毎に該レベル3におけるカ
テゴリC2が持つ全パターンを取り出し、各領域のパタ
ーンが等しいものを調べ、等しくない領域は°−°を入
れておく。
仮に、カテゴリC2の特徴パターンは、パターンBGG
Gのノードにおいて、B−B−GGBBBWGG、 r
:夕−7fJBG(7)/ −トニhイテ、BGBBW
IIGWGGとなり、C3ツバターンはGWWC,Wl
lBWBGとすると、第1図(b) +31のような分
類トリーとなる。
ここで、上記カテゴリC2の特徴パターンで、C1のパ
ターンを分類できないので、上記改良処理は終了する。
尚、上記特徴パターンにおいて、アンダーラインは、そ
れぞれのノードでの共通パターンを示している。
このようにして、1ノードが1カテゴリとなる迄、各パ
ターンから特徴パターンを抽出しながら、改良を繰り返
していく。該改良後の分類トリー25は、改良前の分1
)IJ−25の情報を全て保持しているので、上記学習
と改良とを繰り返し行うことにより、画像パターンを自
動的に効率良く分類していくことができる。
このように、本発明は、画像データのパターンを分類す
るのに、分類トリーのあるレベルにおいて、複数個のカ
テゴリ名の分類ができないときには、各画像データの領
域を複数個に分割し、該分割した小領域のパターンを求
めて区別する第1の手段(学習)と、あるレベルの特定
のカテゴリ名が持つ全パターンを調べて、その特徴パタ
ーンを抽出し、該抽出した特徴パターンで分類すること
を、レベルを下げながら(Jllち、上記領域の分割を
行いながら)繰り返して、1ノード1カテゴリとなる迄
改良する第2の手段とを用いて、分類するようにした所
に特徴がある。
〔発明の効果〕
以上、詳細に説明したように、本発明の画像データの自
動分類方式は、外部より入力された特定のカテゴリ名を
持つ2値画像データを白/黒/灰色の何れかのパターン
に決定して、木状に分類する方式において、咳木状のあ
る分類レベルで、複数個のカテゴリ名の区別ができない
ときには、各カテゴリ名の画像データの全体を複数個の
小領域に分割し、該分割された小領域のパターンを求め
て区別する第1の手段と、各分類レベルでの各カテゴリ
名の持つパターンから、該カテゴリ名の画像データの特
徴を自動的に抽出し、該特徴を用いて分類する第2の手
段とを設けることにより、複数個の2値画像データを本
状に分類するようにしたものであるので、人手によって
見つけた2値画像の構造上の特徴を一切与えることなく
、且つ入力画像の種類や、サイズ等に依存しないで分類
トリーの生成ができ、入力画像の各カテゴリ名の画像デ
ータの分類が容易となる効果がある。
【図面の簡単な説明】
第1図は本発明の自動分類方式の概念を説明する図。 第2図は本発明の一実施例を模式的に示した図。 第3図は本発明の領域分割方式を説明する図。 第4図は従来の2値画像データの分類方式を説明する図
。 である。 図面において、 1は中央処理装置(CPU) 、 2は主記憶装置(M
S)。 21は画像データバッファ。 22は認識プログラム。 23は分割処理プログラム。 24は特徴抽出処理プログラム。 25はトリー領域、又は分類トリー。 3はファイルメモリ(FM)。 4は操作パネル(KB)。 5はデジタイザ、又は画像人力装置(スキャナ)。 Cl+ C2+ C3+ C4,’−はカテゴリ名。 W、B、Gは画像データの各領域のパターン。 をそれぞれ示す。 (1ン                      
              (2ン(S) (、(1) ノド発ef46フ自@/ラテず勇づ5ψこdつイItづ
5.ita刈手う図%1 図 (A f)I) 禾衾F3fd、n  自動溌顛方式ン力 ネ既進、l之
明1ろ図下j 図 (I2) A全一 −−実方色イクhl唆氏自り1ニホした図下 
2 図 /1/1画殊 B’NB/;r/Erer/;re;rWWBcrl;
r水金e月め4貧城脅↑1方戎Σ言先明オ6z箪 ス 

Claims (1)

  1. 【特許請求の範囲】 外部より入力された特定のカテゴリ名を持つ2値画像デ
    ータの全体を‘白’か、‘黒’か、‘灰色’の何れかに
    決定し、このパターンを比較して、該画像データを木状
    に区別する分類方式であって、該木のある段階において
    、複数個のカテゴリ名の画像データを区別できないとき
    には、各カテゴリ名の画像データの全領域を分割し、該
    分割した小領域のパターンを求めて区別する第1の手段
    (a)と、 各カテゴリ名の上記木の各段階における画像データが持
    つパターンから、該段階における該カテゴリ名の画像デ
    ータの特徴を抽出し、該特徴を用いて分類する第2の手
    段(b)とを設け、 上記第1の手段(a)と、第2の手段(b)を繰り返し
    実行することにより、2値画像データを木状に分類する
    ことを特徴とする画像データの自動分類方式。
JP12411386A 1986-05-29 1986-05-29 画像デ−タの自動分類方式 Pending JPS62280988A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP12411386A JPS62280988A (ja) 1986-05-29 1986-05-29 画像デ−タの自動分類方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP12411386A JPS62280988A (ja) 1986-05-29 1986-05-29 画像デ−タの自動分類方式

Publications (1)

Publication Number Publication Date
JPS62280988A true JPS62280988A (ja) 1987-12-05

Family

ID=14877244

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12411386A Pending JPS62280988A (ja) 1986-05-29 1986-05-29 画像デ−タの自動分類方式

Country Status (1)

Country Link
JP (1) JPS62280988A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101894270A (zh) * 2010-07-26 2010-11-24 中国科学院遥感应用研究所 面向遥感影像分类的样本自动选取方法

Similar Documents

Publication Publication Date Title
CN105144239B (zh) 图像处理装置、图像处理方法
US6006240A (en) Cell identification in table analysis
US6903751B2 (en) System and method for editing electronic images
US5774580A (en) Document image processing method and system having function of determining body text region reading order
US7627176B2 (en) Apparatus, method, and computer program for analyzing document layout
US10560601B2 (en) Image processing method, image processing apparatus, and storage medium
US4499596A (en) Adaptive facsimile compression using a dynamic extendable decision network
EP0632402A1 (en) Method for image segmentation and classification of image elements for document processing
US6711292B2 (en) Block selection of table features
US7277584B2 (en) Form recognition system, form recognition method, program and storage medium
JPH0315793B2 (ja)
CN111695453A (zh) 绘本识别方法、装置及机器人
CN108520263B (zh) 一种全景图像的识别方法、系统及计算机存储介质
JP3634574B2 (ja) 情報処理方法及び装置
EP0709800B1 (en) Method for designing classification trees
JPS62280988A (ja) 画像デ−タの自動分類方式
JPH08320914A (ja) 表認識方法および装置
CN111753722B (zh) 一种基于特征点类型的指纹识别方法及装置
CN112183253A (zh) 数据处理方法、装置、电子设备及计算机可读存储介质
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
JPH07160879A (ja) 画像処理方法
Kim Segmentation-free printed character recognition by relaxed nearest neighbor learning of windowed operator
JPS61281377A (ja) 文書画像理解装置
CN117787258A (zh) 文档信息抽取方法及系统
JPH0728952A (ja) 文書認識システム