JPH02253340A - 画像処理による知識処理方法 - Google Patents

画像処理による知識処理方法

Info

Publication number
JPH02253340A
JPH02253340A JP1074098A JP7409889A JPH02253340A JP H02253340 A JPH02253340 A JP H02253340A JP 1074098 A JP1074098 A JP 1074098A JP 7409889 A JP7409889 A JP 7409889A JP H02253340 A JPH02253340 A JP H02253340A
Authority
JP
Japan
Prior art keywords
knowledge
processing
picture
image
table form
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1074098A
Other languages
English (en)
Inventor
Kazuhiro Tsumura
和弘 津村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1074098A priority Critical patent/JPH02253340A/ja
Publication of JPH02253340A publication Critical patent/JPH02253340A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (発明の目的〕 (産業上の利用分野) 本発明は原子力発電プラント等のプラント機器の診断等
に用いられる知識処理方法に係り、特に画像処理a置を
用いて知識の処理を行なう画像処理による知識処理方法
に関する。
(従来の技術) 従来、診断等のエキスパートシステムに用いられている
知識の表現形態は、フレーム、プロダクションルールと
呼ばれるものであり、推論方法もこれに適したものとな
っている。これらの知識形態は、入力された後、主にC
R、T (CathordRay Tube)等のデイ
スプレィ上に図式表現により人に理解し易いように出力
される。
このような従来の知識の表現形態においては、専門家に
よって整理された診断知識、例えば表、ツリー図をフレ
ーム、プロダクションルールに変換し、計算機により処
理を行なう。また、既に入力されている知識をCRTに
出力する場合には、再び変換して人に理解し易いように
図表化、または図式化を行なう。
このような点を考慮し、表形態の知識をそのまま機械処
理する方法として、画像処理を用いた方法が提案されて
いる。表形態の知識は縦と横の配列を関連付けた分り易
い知識表現形態であるが、紙面の寸法と内容によって形
態が多少異なっている。表形態の知識を機械処理する場
合、このような形態の違いが問題となり、形態の統一化
が要求される。このため、表形態の知識を用いて知識処
理する場合、以下に述べる処理が重要となる。
第7図(A)、(B)は表形態の知識例を示し、「名称
」、「型番」、「寸法」 (総称して粗泡と呼ぶ)とい
ったキーワードと、これに属する具体的データ(これも
キーワードである)が記載されている。このような知識
の利用方法として、例えば「名称」というキーワードで
示された覧中の具体的データ10を入力(f5E知)と
し、これに該当する「型番」の具体的データ11、「寸
法」の具体的データ12を知る方法がある。このような
処理を機械で行なう場合、 ■入力された具体的データが何か(粗泡)を調べる。
■入力されたキーワード下に属する具体的データ全てを
取り出す。
といった機能で表現することができる。■は入力された
具体的データが属する粗泡を取り出す処理で、第7図(
B)においては、具体的データ10が存在する文字の塊
(領域A)全体を取り出し、最上行を抽出することによ
って、粗泡「名称」を調べることができる。■は入力さ
れたキーワード(粗泡)下に属する具体的データの全て
を取り出す処理で、領域B、Cを抽出することである。
この2つの処理を組み合せることにより具体的データ1
1.12を抽出することができる。例えば、入力された
具体的データ10を含む行と領域B。
CとのAND処理で行なうことができる。また、入力さ
れた具体的データ10を含む行の具体的データを無条件
に取り出し、これが属する粗泡を調べることもできるが
、この処理は■と同様である。
(発明が解決しようとする課題) このような処理を機械で行なう場合、以下のような問題
が発生する。すなわち、 ■親名と具体的データとの記載方法(第7図(A>、(
B)では縦方向)が横方向になった場合への対応 ■罫線で仕切られた表形態への対応 である。このうち、■は1頁当りに記載すべぎ粗泡が多
数ある場合の表形態の課題、■は表形態の知識を扱う場
合の一般的課題である。
本発明は上記の事情を考慮してなされたもので、表形態
の特徴を認識し、表知識の処理手順および知識の抽出部
を変化させることにより、各種の表形態に適合させて表
形態の知識を作成することができる画像処理による知識
処理方法を提供することを目的とする。
(発明の構成) (課題を解決するための手段) 本発明は、画像処理装置の画像メモリに表形態の知識を
展開し、展開された知識の表形態の特徴を画像処理によ
り識別し、その表形態の知識から既知のキーワードに基
づいて必要とするキーワードを抽出するものである。
(作用) 画像メモリに展開された知識の表形態の特徴を画像処理
により識別するため、各種の表形態に対応することがで
き、表作成時の自由度が増大する。
(実施例) 本発明に係る画像処理による知識処理方法の一実施例に
ついて添付図面を参照して説明する。
第1図は本発明の一実施例を示す機能ブロック図であり
、画像処理装置に備えられる画像メモリ1a、 1b、
lc・・・を中心に、マツチング処理、表形態の識別処
理、粗泡の取出しとマスク処理の手段(機能)を示した
ものである。
画像処理装置は画像メモリIa、1b、IC・・・画像
処理専用回路、上記ハードウェアのIIJ御回路および
装d全体の制御を行なうための計尊機システム(CPL
I、メモリ、入出力装置、補助記憶装M)で構成され、
特に入出力装置に日本語入力が可能な装置を用い、予め
上記画像メモリ1a、1b、lc・・・に第2図(A)
〜(D)に示すような表形態の知識が格納されている。
画像メモリ1a、lb、1c・・・は、1画素当り16
ビツト、1024x1024画素で構成されるものとし
て説明するが、1画素当り8ビツトの場合には16ビツ
トの文字コードを左右また・は上下に隣合った画素に格
納して処理するが、2枚の画像メモリに格納して処理す
ることにより同等の処理が可能である。
一般に、日本語の文字コード(コードデータ)は16ビ
ツ]・で表現されており、1頁当りの文字数が64文字
X64行の場合、1024x1024画素の画像メモリ
1aにおいては、第2図(A)に示すように、16x1
6(=128)頁分の表形態の知識を格納することがで
き、全頁に対して1度のマツチング処理で、入力(既知
)キーワードの検出が可能である。マツチング処理は、
濃度変換、論理フィルタ、ラベリング等を用いて行なう
方法である。
表形態の知識は、第2図(B)、(C)、(D)のよう
に1画素に1文字のコードデータが表形態を保持したま
ま格納されている。つまり、第2図(B)等に示す「名
称」、「型番」、「寸法」、r***J、[+++J、
「−一一一〜」の文字コードが画像メモリ1aに内き込
まれ、画像出力装置には濃度で出力される。
第2図(B)は罫線が無く、行(縦)方向に粗泡に属す
る具体的データが配列されている。第2図(C)は罫線
がなく、文字列(横)方向に粗泡に属する具体的データ
が配列されている。第2図(B)と(C)のパターン的
差異は行方向のパターンの変化にある。つまり、第2図
(B)においては、i行と(i+1)行を比べた場合、
使用される文字の種類、文字数等がよく似ている。2こ
れら比べ第2図(C)においてはj行と(j+1)行の
文字の種類、文字数等は区々である。
この点に着目して表形態の識別処理を行ない、ある粗泡
に属する具体的データの抽出等を行なう。
第2図(D)は罫線コードを含んだ表形態の例で、罫線
で囲まれた小領域内の文字コード列を抽出する必要があ
る。画像メモリ1aに展開された各種の表形態の知識に
対して、次の手順で表形態の識別処理、粗泡の取出し処
理等を行なう。
画像メモリ1aに対して入力(既知)キーワ、−ドでマ
ツチング処理を行ない、マツチングの発生位置を抽出し
、発生位置を含む頁全体を原画から取り出し、画像メモ
リーb等に入れる。次に、画像メモリーbに対して罫線
コードの抽出を行ない、罫線の有無を調べる。罫線が有
った場合には頁または画像メモリ全体に対して第3図に
示すテーブルに基づいて論理フィルタリングを行ない、
第4図に示すような罫線画像を生成し、罫線コードを除
いたfIfflに対してラベリング(領域分割)を行な
い、領域R、R2,R3を抽出した後、文字コードの二
値化画像間で論理積をとる。この結果、罫線内の文字コ
ード全体について同一のラベリング番号が付加され、次
に説明する罫線無しく第2図(B)、(C))の表形態
と同等となる。
罫線が無かった場合には、頁または数をメモリ全体に対
して文字コードのみに着目してラベリングを行ない、第
5図(A)、(B)に示すように、R4,R5・・・R
9のラベリング番号(領域)を得る。ここで得られたラ
ベリング番号は罫線有りの場合の処理で得たラベリング
番号R,R2゜R3に続く番号である。
次に、マツチング発生位置を含む頁について、マツチン
グ発生位置を含む前記ラベリング番号を除いたラベリン
グ番号(領域)毎に横(文字列)方向のプロフィールを
とり、第2図(B)または第2図(D>の表形態か第2
図(C)の表形態かを判定する。ある1つの領域につい
て横方向のプロフィールをとると、第6図に示すように
、文字列位置に対する行数が得られ、次に文字列位置に
対する行数の変化り、・・・Dl・・・Dnを求め、こ
の値が0でない個数があるしきい値より少ない場合、第
2図(B)または第2図(D)の表形態とし、その他の
場合には、第2図(C)の表形態とする。
表形態の判定アルゴリズムはこの他にも多数考えられる
。要は、第2図(B)または(D)の表形態においては
、用いられる文字(英字、数字、片仮名、漢字、平仮名
)が、行方向に周期的または一様に発生することに着目
して判定をするものである。
以上の処理結果を受けてマツチング発生位置のキーワー
ドの粗泡の取出しとマスク処理を行なう。
まず、マツチング発生位置を含む領域(R1゜R2・・
・R9に含まれる)を抽出し、この領域が同一頁の左端
に位置し、かつ第2図(C)の表形態であると判定され
ている場合には、マツチング発生位置は粗毛であり、マ
ツチング発生位置を含む行全体についてマスク画像Aを
作る。このマスク画像Aは入力されたキーワードに対す
る候補を抽出したものである。また、第2図(C)の表
形態であるが、マツチング発生位置の領域が左端に位置
しない場合には、具体的データと解釈し、左端に位置す
る粗毛を抽出すると共に、マツチング発生位置を含むf
r4域をマスク画像Bとして作る。
また、罫線無しの第2図(B)の表形態と判定され、か
つマツチング発生位置が最上行の場合には粗毛であると
し、領域全体をマスク画像へとして作る。また、最上付
以下の場合には具体的データとし、最上行を粗毛として
抽出すると共に、同一行をマスク画像Bとして作る。
また、罫線有りの第2図(D)の表形態と判定され、か
つマツチング発生位置が最上項の場合には粗毛であると
し、上記と同様に領域全体をマスク画ICIAとして作
る。マツチング発生位置が最上項か否かは第3図、第4
図を用いて説明した罫線の処理と同様に行なうものであ
るが、ここでは罫線の外枠と横線に連結する縦線を切断
し、罫線の外枠と横線のみが連結するよう論理フィルタ
リングを行なう。
次に、背景となる部分をラベリングし、マツチング発生
位置を含む領域を取り出し、最上項の判定を行なう。マ
ツチング発生位置が最上項でない場合には、最上項のキ
ーワードを抽出すると共にマスク画像Bを作成する。
このようにして作成されたマスク画像AとBは入力され
たキーワードから抽出されるべき次のキーワード(具体
的データ)を抽出するために用いる画像であり、例えば
マスク画像AとBでAND(論理8N)をとることによ
り、要求されているキーワードまたは具体的データが生
成れさる。
このように上記実施例によれば、表形態の知識を画像処
理装置の画像メモリla、 1b、lc・・・に展開し
、画像処理機能を用いて知識処理(画像処理)を行ない
、要求されている知識、データの抽出を行なうため、知
識の表現形態がU表Jであることから、理解が容易であ
る共に、計till(機械)への入出力が容易である。
また、表の構造を認識し、表知識の処理手順および知識
の処理手順を変化させるため、各種の表形態に適合させ
て表形態の知識を作成することができる。
〔発明の効果〕
本発明は、画像処理装置の画像メモリに表形態の知識を
展開し、展開された知識の表形態の特徴を画像処理によ
り識別し、その表形態の知識から既知のキーワードに基
づいて必要とするキーワードを抽出したから、表の構造
を認識し、表知識の処理手順および知識の抽出部を変化
させることにより、各種の表形態に適合させて、表形態
の知識を作成することができる。
(A)は上記実施例において画像メモリに展開された表
知識を示す図、第2図(B)、(C)。
(D)は第2図(A)の1区画を拡大して示すもので各
種の表形態の例を示す図、第3図は上記実施例における
画像処理に用いるテーブルを示す図、第4図は上記実施
例における罫線画像の一例を示す図、第5図(A)、(
B)は上記実施例における画像メモリにラベリングを行
なった状態を示す図、第6図は上記実施例において表形
態の違いによる文字パターンの違いを示した図、第7図
(A)(B)は表形態の知識の一例を示す図である。
1a、1b、IC・・・画像メモリ。
出願人代理人   波 多 野   久
【図面の簡単な説明】
第1図は本発明に係る画像処理による知識処理方法の一
実施例を示す機能ブロック図、第2図1024ム素 64&青 第 図 R2 第 図 第 図 第 図

Claims (1)

    【特許請求の範囲】
  1. 画像処理装置の画像メモリに表形態の知識を展開し、展
    開された知識の表形態の特徴を画像処理により識別し、
    その表形態の知識から既知のキーワードに基づいて必要
    とするキーワードを抽出することを特徴とする画像処理
    による知識処理方法。
JP1074098A 1989-03-28 1989-03-28 画像処理による知識処理方法 Pending JPH02253340A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1074098A JPH02253340A (ja) 1989-03-28 1989-03-28 画像処理による知識処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1074098A JPH02253340A (ja) 1989-03-28 1989-03-28 画像処理による知識処理方法

Publications (1)

Publication Number Publication Date
JPH02253340A true JPH02253340A (ja) 1990-10-12

Family

ID=13537371

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1074098A Pending JPH02253340A (ja) 1989-03-28 1989-03-28 画像処理による知識処理方法

Country Status (1)

Country Link
JP (1) JPH02253340A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6000870A (en) * 1996-10-14 1999-12-14 Brother Kogyo Kabushiki Kaisha Printing device having dual sheet feed trays

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6000870A (en) * 1996-10-14 1999-12-14 Brother Kogyo Kabushiki Kaisha Printing device having dual sheet feed trays

Similar Documents

Publication Publication Date Title
JP4461769B2 (ja) 文書検索・閲覧手法及び文書検索・閲覧装置
JPH09198456A (ja) グラフをベースとしたテーブル認識方法
JPH0798765A (ja) 方向検出方法および画像解析装置
JPH11120293A (ja) 文字認識/修正方式
US7046847B2 (en) Document processing method, system and medium
KR970049402A (ko) 화상 처리 방법과 장치, 및 기억 매체
US6374242B1 (en) Natural-language information processor with association searches limited within blocks
Prakash et al. Information extraction in unstructured multilingual web documents
JPH02253340A (ja) 画像処理による知識処理方法
JP3898645B2 (ja) 帳票書式編集装置および帳票書式編集プログラム
JP7322468B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP2000090194A (ja) 画像処理方法および画像処理装置
CN110727820B (zh) 一种为图片获得标签的方法和系统
JP3072126B2 (ja) 書体を識別する方法及び装置
CN112231456B (zh) 问题生成方法、装置、存储介质和的电子设备
WO2022025216A1 (ja) 圧縮データ検索エンジンを用いた情報処理装置及びその情報処理方法
JPS6154569A (ja) 文書画像処理方式
JPH0477857A (ja) 不適切表現検出装置
KR20230143885A (ko) 텍스트 검출 및 인식 학습을 위해 사용되는 문서 이미지의 레이블링 장치 및 방법
JPH06101002B2 (ja) 文章作成装置
JPS60110089A (ja) 文字認識装置
JPH11175665A (ja) 文字認識後処理装置
JPH0520420A (ja) 図形処理装置
JPH04264675A (ja) 知識処理方法
JPH0576666B2 (ja)