JP2977260B2 - 情報提示装置 - Google Patents

情報提示装置

Info

Publication number
JP2977260B2
JP2977260B2 JP2255074A JP25507490A JP2977260B2 JP 2977260 B2 JP2977260 B2 JP 2977260B2 JP 2255074 A JP2255074 A JP 2255074A JP 25507490 A JP25507490 A JP 25507490A JP 2977260 B2 JP2977260 B2 JP 2977260B2
Authority
JP
Japan
Prior art keywords
information
drawing information
similarity
correspondence
components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2255074A
Other languages
English (en)
Other versions
JPH04134575A (ja
Inventor
美和子 土井
秀樹 平川
雄一 黒澤
英雄 沼上
彰夫 岡崎
美佳 福井
宏之 坪井
恭一 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2255074A priority Critical patent/JP2977260B2/ja
Priority to US07/740,901 priority patent/US5305208A/en
Priority to DE69121346T priority patent/DE69121346D1/de
Priority to EP91308758A priority patent/EP0478315B1/en
Publication of JPH04134575A publication Critical patent/JPH04134575A/ja
Application granted granted Critical
Publication of JP2977260B2 publication Critical patent/JP2977260B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/53Querying
    • G06F16/532Query formulation, e.g. graphical querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明はシステム構成図等の複数の図面情報間におけ
る構成要素の相違を適確に提示することのできる情報提
示装置に関する。
(従来の技術) 情報・通信機器の目覚ましい発展に伴い、特許や科学
技術文献等、種々様々な情報を大型データベースに蓄積
し、これを通信回線を介して適宜検索して参照すること
が可能になってきた。ところでこの種のデータベースの
検索は、一般にキーワード等を用いて行われる。そして
データベースから検索された情報については、その情報
の全てを表示・出力したり、或いは標題や要旨等からな
る検索情報の一部を表示・出力するものとなっている。
さて情報の検索は、通常、その専門分野においてデー
タベースから検索された特許文献等の情報が、どのよう
な点で価値を持っているかを調べると云う意図の下でな
されることが多い。例えば新しい製品を開発して商品化
しようとするような場合、その製品の構成や構成部品が
抵触する虞れのある特許が存在するか否か、また類似の
特許文献があるならばその構成や構成部品においてどこ
が異なっているかを迅速に、且つ明確に知る必要があ
る。このような調査の一手段として上述した情報検索が
利用される。
しかし現状では、例えばデータベースから検索抽出さ
れる多数の特許文献の要約を読み、その全文を読む必要
のありそうなものを選択してその全文を読み、その上で
その特許との類似性を判断し、類似しているならばどの
ような点で類似し、逆にどのような点で異なっている
か、つまりその相違を判断することが必要である。この
為、例えば特許文献の要約からその全文を読む必要のあ
る特許文献を選択する際、些細な判断の誤ちにより製品
に類似する特許文献を見逃してしまう公算が大きかっ
た。
また選択された特許文献の全文を読むに際しても、例
えばその請求範囲の項目だけを読んだのでは、一般的に
その内容を理解することは難解である。これ故、特許文
献に含まれる図面情報を参照することで、その内容理解
の手助けにしているのが現状である。しかし手助けにな
るべき図面情報に着目しても、どの図面が何を表現して
いるのかを見分けるのに時間が掛かることが多くある。
しかも図面中で使用されている用語に違いがある場合
等、その相違を適確に見出すには時間が掛かっているの
が実情である。
ところで最近、かなり汎用的に使われている[UNIX]
等のオペレーションシステム(OS)に、[diff]と云う
コマンドが設けられている。このコマンド[diff]は、
文字情報だけから構成されているファイル間で相違して
いる箇所を見出し、これを提示する機能である。
しかしこのコマンド[diff]により示される機能は、
本質的に文字情報しか扱うことができない。しかも第22
図に比較される2つのファイルの内容を示し、そのdiff
結果の例を第23図に示すように、この機能では行単位で
しか相違箇所の判定を行わず、またその結果を行単位で
しか出力しない。更には表層的に文字コードを比較して
いるだけなので、例えば「コンピュータ」と「計算機」
とが同一の意味を持つにも拘らず、その文字コードが違
うことに起因してこれらを異なった要素であるとして解
析してしまう欠点がある。この為、図面情報間での相違
検出に適用するには問題がある。
(発明が解決しようとする課題) このように従来では、文字情報を行単位に比較してそ
の相違を求める機能が提唱されているに過ぎず、例えば
システム構成図等の複数の図面情報間の相違点を調べ、
その相違を明確に提示することができなかった。この
為、特許検索を行う場合等、その図面情報が特許文献を
読解するのに有用な手掛かりとなるにも拘らず、その図
面情報の相違点を明確に提示することができないのが実
情である。従って必要な情報を適確に、且つ迅速に選択
し、その情報内容を適確に理解すること支援することを
可能とする装置の開発が強く望まれている。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、複数の図面情報間の構成要素
の相違を適確に提示出力することができ、情報の選択や
その情報内容の理解を効果的に支援することのできる情
報提示装置を提供することにある。
[発明の構成] (課題を解決するための手段) 本発明に係る情報提示装置は、図形および文字から
なる図面情報の中で使用される用語間の、例えば類義語
や反対語,階層関係等の概念関係を記述した概念辞書
と、この概念辞書を参照して複数の図面情報間におけ
る各図面情報の構成要素の対応関係を解析する対応解析
手段と、この対応解析手段による解析結果に基づい
て、前記複数の図面情報間で対応する構成要素を他の構
成要素に対して識別表示する表示手段とを具備したこと
を特徴とするものである。
また図面情報中の文字データと図形データ、およびこ
れらの各データの位置情報を解析して前記文字データと
前記図形データとを対応付けて前記図面情報の構成要素
を抽出する構成要素抽出手段を備えたことを特徴とする
ものである。
(作 用) 本発明によれば、概念辞書を参照しながら図面情報間
における各図面情報の構成要素の対応関係が解析され、
複数の図面情報間で相互に対応する構成要素が求められ
る。そしてこの解析結果に従い、複数の図面情報間で対
応する構成要素を、他の構成要素(図面情報間で対応し
ない構成要素)に対して識別表示するので、識別表示さ
れた構成要素から複数の図面情報間での相違を明確に提
示することが可能となる。この結果、提示出力される図
面情報から、その図面情報間の相違点を容易に、且つ適
確に知ることが可能となるので、例えば複数の文書情報
中から必要な情報を迅速に選択し、その情報内容の読解
を効果的に支援することが可能となる。
(実施例) 以下、図面を参照して本発明に係る情報提示装置の実
施例について説明する。
第1図は本発明の第1の実施例に係る情報提示装置の
概略構成を示す図で、1は図面情報を入力する為のスキ
ャナ,および情報検索の指示情報等を入力する為のマウ
スやキーボード等からなる入力部である。図面情報記憶
部3は、上記入力部1から入力された図面情報、或いは
通信回線等を介して入力された図面情報を記憶し、以下
に示す情報提示処理に供する。
一方、概念辞書4は、図面情報中で使用される用語の
類義関係や反対関係,また用語間の階層関係等の意味関
係を予め記憶したものである。対応解析部5は前記図面
情報記憶部3に記憶された複数の図面情報の構成要素に
含まれる用語について、前記概念辞書4に格納されてい
る意味関係を参照しながらその用語間の類義性や階層性
を解析し、その解析結果に従って構成要素間の対応の有
無を調べるものである。この対応解析部5にて求められ
た構成要素間の対応関係が、対応記憶部6に記憶され
る。
しかして情報管理部7は、上記対応記憶部6に記憶さ
れた構成要素間の対応関係に基づき、複数の図面情報間
において相互に対応する構成要素を、その他の構成要素
に対して識別可能なように、ディスプレイ等からなる出
力部2による図面情報の表示を制御するものである。こ
の情報管理部7による表示制御により、出力部2を介し
て提示出力される図面情報をなす構成要素の中で、他の
図面情報との間で対応関係を持つ構成要素だけが、例え
ば太線表示や網掛け表示等の手法により識別表示され
る。
このように構成された実施例装置の概略的な動作(作
用)を、例えば第2図に示すようなAI(Artificial Int
elligence)専用の新しいCPUの構成を示す図面情報と、
第3図に示すような古いタイプのCPU(RISC)の構成を
示す図面情報とが与えられた場合を想定し、これらの図
面情報における構成要素の相違点を提示出力する場合を
例に説明する。
図面情報記憶部3には、入力された図面情報の、図形
種や終始点の座標値として記述される図形情報と、文字
種やその始点座標値等からなる文字情報との対応関係を
物理的に記憶する物理情報記憶部3aと、ノードとして表
示される上記図面情報や文字情報の接続関係を記憶する
論理情報記憶部3bとが設けられている。
物理情報記憶部3aは、例えば第2図に示すように与え
られた図面情報中の図形情報や文字情報を、例えば第4
図および第5図にそれぞれ示すように節点(ノード)と
辺(ライン)とに分けて記憶するものである。また論理
情報記憶部3bは、ノード間の接続関係を例えば第2図に
示す図面情報を第6図に示すように、また第3図に示す
図面情報を第7図に示すようにそれぞれ記憶して、その
接続関係を論理的に表すものである。
尚、第4図に示されるノード情報の、ノード番号
[1]で示される物理情報は、そのノードを構成する文
字[命令キャッシュタグ]が、明朝体の10ポイントの文
字種[明10]であり、またその始点座標値が[x1,y1]
であることを示している。またこのノード番号[1]で
示されるノードには、文字を囲む図形がないことから図
形種,図形の始終点座標値が共に[null]で表現されて
いる。
また第5図に示されるライン情報の、ライン番号
[1]で示される物理情報は、細い片側に矢印のある線
種(細片矢)であり、その始点座標が[x1,y1],終点
座標が[xm,ym]であることを示している。またこのラ
イン番号[1]で示されるラインがノード番号[1]の
ノードからノード番号[2]のノードに対して引かれて
おり、ノード番号[1]に対して付記された情報[I
N],およびノード番号[2]に対して付記された情報
[OUT]から、前記細片矢で示されるラインの矢印がノ
ード番号[2]のノードに向けられていることが示され
る。
このような第5図に示されるような接続関係は、論理
情報記憶部3bにおいて、第6図に示すように全てのノー
ドを行と列に並べて設定される行列において、行要素を
[IN]とし、列要素を[OUT]としたとき、該当するセ
ルの値を[1]とすることにより表現される。ちなみに
ライン番号[1]で示される片矢印のライン(細片矢)
により結ばれるノード番号[1]のノードとノード番号
[2]のノードとの接続関係は、第6図に示すセル(1,
2)の値が[1]であることにより論理的に示される。
またライン番号[2]で示される両矢印のライン(細両
矢)により結ばれるノード番号[10]のノードとノード
番号[13]のノードとの接続関係は、第6図に示すセル
(10,13)とセル(13,10)の各値がそれぞれ[1]であ
ることにより示される。
対応解析部5は、上述したような形式で前記論理情報
記憶部3bに記憶されている論理情報を、例えば第8図に
示すような形式で用語の類義関係や反対関係,また用語
間の階層関係等の意味関係を予め記憶した概念辞書4を
参照し、例えば第9図に示すような処理手続きに沿っ
て、複数の図面情報間における構成要素の対応関係を次
のようにして解析する。
即ち、対応解析部5は、先ず前述したノード間の類似
距離を算出するべく、前記論理情報記憶部3bに、例えば
第5図や第6図に示すような形式で記憶されている複数
の図面情報のノードとして表現されている構成要素を、
それぞれ行項目,列項目として並べた行列を第10図に示
すように作成する。但し、ここで作成される行列は、第
10図に示す行列において各セルに値が入っていない状態
である。しかる後、この行列の各行項目に関して、その
列項目の要素との間での類似度を算出する(ステップ
a) この類似度算出の基本手続きは、概念辞書4を参照し
て概略的には 完全マッチング [100] 同義語による完全マッチング [100] 接続による完全マッチング [ 95] 類義語による完全マッチング [辞書値] 包含マッチング [ 50] 位置一致部分マッチング [ 10] 位置不一致部分マッチング [ 5] なる類似度を与えることによりなされる。但し、[辞書
値]は概念辞書4において類義語毎に定義される類似度
の値を示している。
このような類似度の算出処理について、第10図に示す
第1行項目の[命令キャッシュタグ]を例にとって説明
する。先ず第1列項目の[データキャッシュタグ]に着
目すると、この列項目との間には なる用語の一致関係が見出され、用語[キャッシュ]
[タグ]の位置が同一なので、前述した手続きに該当
することが判る。この結果、これらの項目(構成要素)
間の類似度が[10]として求められ、その値が第10図に
示す行列のセル(1,1)に書き込まれる。
しかる後、第2列項目の[データキャッシュ]に着目
すると、この列項目との間には なる関係があり、用語[キャッシュ]の部分が一致して
いるが、後続の用語[タブ]に対応するものがないの
で、位置は一致していないことが解析される。この結
果、この場合には前述した手続きに一致し、その類似
度が[5]として求められる。従ってこの場合には、前
記行列のセル(1,2)に類似度[5]が書き込まれる。
第3列項目から第9列項目に関しては、用語の一致し
ないので、これらの各列項目との間の類似度は[0]と
してそれぞれ求められる。尚、第10図においては類似度
[0]が入れられるセル(1,3),〜(1,9)をそれぞれ
空欄で示してある。
更に第10列項目,および第12例項目は第1列項目と同
様に、用語[命令]が一致し、その位置が同一であるこ
とから、手続きに該当してその類似度が[10]として
それぞれ求められる。
そして第11列項目については、 なる用語の一致が見出され、この用語[命令]は行項目
[命令キャッシュタグ]に包含されていることが解析さ
れる。この結果、これらの項目間には前述した手続き
が該当して、その類似度が[50]であることが求めら
れ、セル(1,11)に類似度[50]が書き込まれる。
第13列項目の[命令キャッシュ]に関しても同様に行
項目[命令キャッシュタグ]に包含されていることが解
析されるので、その類似度[50]が求められ、セル(1,
11)に書き込まれる。
しかして第14列項目については、 として完全にマッチングするので、前述した手続きか
らその類似度が[100]として求められ、セル(1,14)
に類似度[100]が書き込まれる。
このようにして各行項目毎に、列項目との類似度が上
述したようにしてそれぞれ算出され、第10図に示す行列
の各セルにその類似度の値が書き込まれる。
ここで、第2行項目[命令キャッシュコントロール]
に着目し、第13列項目の[命令キャッシュ]との間で類
似度を算出する場合には、次のようにして類似度の算出
がなされる。即ち、第8図に示した概念辞書4の接続の
項には、用語[コントロール]については、接尾辞とし
て使われる場合に省略される可能性があることが[尾
(略)]なる記述によって示されている。
従ってこの場合には として用語の一致関係が見出される。この結果、前述し
た手続きに該当し、その類似度が[95]として求めら
れる。
また第10行項目の[データメモリコントロール]と第
4列項目の[データメモリコントローラ]を対比した場
合には、第8図に示す概念辞書4の項目[コントロー
ル]については、類義の項目に用語[コントローラ]が
類義語として存在することが示され、その場合の類似度
を[95]とすることが辞書内容として示されている。
従ってこの場合には、 なる用語の一致関係を見出し、前述した手続きに該当
することからその類似度を[95]として求める。
以上のような手続きを繰り返し実行することにより、
第10図に示すような行列データ構造として、2つの図面
情報間での各図面情報の構成要素をそれぞれ示すノード
間の類似距離が算出される。
次に対応解析部5は、上述した如く求めた、図面情報
間における構成要素を示すノード間の類似度から、第10
図に示す行列の各行項目毎に、その行項目に対して最大
の類似度をとる列項目を探索する(ステップb)。
例えば第1行項目に関してはセル(1,14)の類似度値
が[100]で最大であり、第2行項目についてはセル
(2,13)の類似度値が[95]で最大となることを求め
る。このようにして求められる最大類似度が、例えば類
似度[50]以上である等、一定の値を越える場合、その
最大類似度値を得ているセルにより示される行項目と列
項目とを、対応関係のある構成要素として抽出し、これ
らのノード間の対応表を第11図(a)(b)に示すよう
に作成する(ステップc)。
第11図(a)は第2図に示した図面情報のノードを基
準に作成された対応表を示しており、逆に第11図(b)
は第3図に示した図面情報のノードを基準に作成された
対応表を示している。
尚、ここでは第10図に示すノード間の類似度を示す行
列において、例えば第8行項目についてはその最大類似
度が[50]を越えないので対応なしとして判定してい
る。この結果、第11図(a)に示す対応表におけるノー
ド番号[8]についての対応ノード番号が[null]とな
っている。
以上のようにして図面情報間のノードについての対応
表を求めたならば、次にライン間の対応関係を算出する
べく、例えば第11図(a)に示す対応表に基づいて、第
7図に示した行と列の項目が、第6図に示した行と列の
項目に対応するように、その項目順序の並べ換えを行う
(ステップd)。この場合には、第12図に示すように項
目順序の並べ換えを行う。
そして前述した第6図に示す行列と、先に項目の並べ
換えを行った第12図に示す行列との間で排他的論理和を
とると、対応するラインのないセルのみが[1]となる
行列が求められる(ステップe)。この行列を参照して
各ライン間の対応表を第13図(a)(b)に示すように
作成する(ステップf)。具体的には、例えば第2図に
示す図面情報におけるラインを基準とすれば、ノード番
号[1]で示されるノードとノード番号[2]で示され
るノードとを結ぶライン番号[1]のラインについて、
第3図に示す図面情報におけるノード番号[14]で示さ
れるノードとノード番号[13]で示されるノードとを結
ぶライン番号[13]のラインが対応することが求められ
る。このようにして求められるラインの対応関係をまと
めることにより、各ライン間の対応表が第13図(a)に
示すように求められる。逆に第3図に示す図面情報にお
けるラインを基準とすれば、各ライン間の対応表が第13
図(b)に示すように求められる。
このようにして作成したノード対応表とライン対応表
を前記対応記憶部6にそれぞれ記憶する。
尚、第8図に示したような概念辞書4を、例えば情報
通信や医療,教育等の種々の分野に適用可能なように構
成すると、その項目数が膨大となり、辞書検索に多大な
時間が掛かるようになることが否めない。また同じ語句
(用語)であっても、その適用分野が異なれば類義語と
して用いられるものが異なる場合も生じる。
従ってこのような不具合を招来しないように、例えば
分野毎にそれぞれ専用の概念辞書4を設定し、図面情報
の表題部の解析等による適用分野の識別結果や、ユーザ
からの分野指定の情報に応じて、上述した図面情報の処
理に適切な分野の概念辞書4を選択的に用いるようにす
ることが望ましい。また図面情報の分野に応じて、予め
パッケージ化されている概念辞書4を選択的に装置に組
み込むようにすることも可能である。
さて上述したように複数の図面情報間での構成要素の
対応関係が解析されたならば、次の情報管理部7が起動
される。すると情報管理部7は、前記対応記憶部6に記
憶された前記ノード対応表とライン対応表とを参照しな
がら、前記図面情報記憶部3に記憶された図面情報の内
容を前記出力部2を介して表示出力する。
例えば第2図に示す図面情報を表示する場合、第11図
(a)に示すノード対応表によればノード番号[5]
[8][14]にてそれぞれ示されるノードについては、
第3図に示す図面情報の中に対応するノードがないこと
が示され、また第13図(a)に示すライン対応表によれ
ばライン番号[4]にて示されるラインについては、第
3図に示す図面情報の中に対応するラインがないことが
示される。そこで情報管理部7は、これらの対応しない
ノードやラインと、対応する構成要素を持つノードやラ
インとを識別して表示するべく、例えば第14図に示すよ
うに、対応する構成要素を持つノードやラインを太線化
して表示する等の表示制御を行い、他のノードやライン
(対応しないノードやライン)と識別表示する。尚、こ
の識別表示については、例えば斜線を付けたり、或いは
反転,点滅,色変更等の表示制御を行ったり、更には音
声等の提示アトリビュートを用いて表示するようにして
も良い。
このようにして構成要素の識別表示をしてなる第14図
に示すような図面情報であるば、どのノードとラインに
対応するものがないかが一目で把握できるようになる。
また前述したライン対応表の作成時に、例えば行列を
置換して作成した第12図に示す行列情報を用い、第4図
に示した第2図に示す図面情報の配置等に関する物理的
な情報を利用して、例えば第3図に示した図面情報を第
2図に示した図面情報と類似な配置構造に変換し、これ
を第15図に示すように表示することも可能であ。ちなみ
に第3図に示した図面情報中で、単純に対応関係のない
構成要素を識別表示するだけでは、つまりその構成要素
に表示アトリビュートを付加しただけでは、第14図に示
した図面情報との間で、対応する構成要素を見比べるこ
とが難かしい。この点、上述したように図面の配置構造
を変換しながら、その図面情報を表示するようにすれ
ば、その対比が非常に容易となり、対応関係の把握が容
易となる。
従ってこの実施例に示されるように、本発明によれば
複数の図面情報間の相違が一目で判るようにその構成要
素の対応関係を、対応のあるものと対応のないものとに
分けて識別表示するので、その図面情報内容の理解を容
易化し、迅速に、且つ適確に情報内容理解を支援するこ
とが可能となる。
ところで上述した第1の実施例によれば、複数の図面
情報の構成要素間の対応関係を一目で判るように識別表
示できるが、一般に特許文献等には複数の性質の異なる
図面情報が含まれている。この為、例えば画面の表示例
を示している図面情報と、システムの構成を示している
図面情報とを比較しても、その全ての構成要素に対応関
係がないのは当然なので、図面情報の比較自体が意味を
持たなくなってしまう。
このような不具合を解決するべく、例えば複数の図面
情報の中から類似した性質の図面情報を抽出し、これら
の図面情報についてだけ、その対応関係を解析するよう
に装置を構成することが望ましい。
第16図はこのような観点に立脚してなされた本発明の
第2の実施例を示す情報提示装置の概略構成を示す図で
ある。
この実施例装置は、前述した第1図に示した第1の実
施例装置の構成に、類似性を持つ図面情報を抽出する為
の図面記述解析部8が付加して構成される。尚、その他
の部分について第1の実施例と同様であり、ここでは図
面記述解析部8の機能(動作)について説明する。
第17図は図面記述解析部8における処理手続きの流れ
を示す図である。この第17図に示す処理手続きの流れに
沿って図面記述解析部8での処理機能について説明する
と、例えば複数の図面情報を含む文書情報が与えられた
場合、先ず図面記述解析部8は、図面情報の意味が最も
凝縮されている図標題があるか否かを探索する(ステッ
プA)。この図標題は、図面情報の見出しや要約,図面
識別情報をなすものである。
しかして図面番号を表す図標題を探索する場合には、
例えば第18図に示すような予約語辞書を参照して図面情
報中に記述される図標題を抽出する。尚、図標題と思わ
れる項目(図標題候補)が複数個ある場合には、一般的
に図標題が図面の最下位か最上位に記述されることが多
いと云う知識に基づき、図面中の上部または下部に位置
するものを探索するようにすれば良い。
しかして第18図に示す予約語辞書中の[n]は各種の
値(文字)を取ることを示すもので、例えば[n]とし
ては 数字 ;1,2,3,… アルファベット小文字;a,b,c,… アルファベット大文字;A,B,C,… かな ;あ,い,う,… カタカナ :ア,イ,ウ,… を基本とし、これらの変形記述形態である かっこ ;(n),[n],n),n],… ハイフン :n−m,n−m−l,… ピリオド :n.m.,n.m.l,… 等が付加された値(文字)として与えられる。
前述した第2図に示した図面情報の例では、その構成
要素の項目[Fig.1 AI用新CPUの構成]が上述した予約
語[Fig.n]を含んでいる唯一の項目なので、その後部
の語句[AI用新CPUの構成]が図標題として求められ
る。
同様にして前述した第3図に示した図面情報の例で
は、[図2 RISCの構成]が上述した予約語[図n]を
含んでいる唯一の項目なので、その後部の語句[RISCの
構成]が図標題として求められる。
しかして複数の図面情報からそれぞれ図標題が求めら
れたならば、前述した対応解析部5における類似度計算
と同様の手続きにより、概念辞書4を参照しながら上記
の如く探索された図標題間の類似度を計算する(ステッ
プB)。例えば第2図に示す図面情報を含む文書#1
と、第3図に示す図面情報を含む文書#2とにおいて、
これらの文書#1,#2に含まれる図面情報の図標題間の
類似度を計算すると、例えば第19図に示すように求めら
れる。
そこでこれらの図標題間の類似度に基づき、例えば第
20図に示すように与えられる類似性についての規則を参
照し、その規則に合致する図標題があるか否かを調べる
(ステップC)。この例では[Fig.1]と[図2]との
類似度が規則1に合致することが検出判断される。そこ
でこの場合には、[Fig.1]と[図2]により示される
図面情報について、その構成要素の対応関係を解析する
ことを前記対応解析部5に対して指示することになる
(ステップD)。
このようにして指示された図面情報に対する解析処理
は、先の実施例と同様にして進められる。
ところで一般文献に含まれる図面情報には、前述した
第2図や第3図に例示したように図番号と共に図標題が
記述されることが多いが、特許文書の図面等のように
[第1図]等の図面番号しか記述されないことも多くあ
る。このような図面情報に関しては、例えばその本文中
で図面に関して説明している箇所(図説明部)を探索し
(ステップE)、この図説明部間でその類似度を求める
ようにすれば良い(ステップF)。具体的には特許文書
では、その最後の章「図面の簡単な説明」が説明部にな
っているので、この章から前述した第18図に示すような
予約語を含む文節(或いは行)を探索するようにすれば
良い。また一般文献にあっては、例えばその文書全体か
ら説明部を探索するようにすれば良い。そして説明部が
検出されたならび、例えば第21図に示すようにその説明
部間の類似度を同様にして算出し(ステップF)、合致
する規則があるかを調べるようにすれば良い(ステップ
C)。
しかし説明部が見出せなかったような場合や、合致す
る規則が見出せなかったような場合には、ユーザにどの
図面情報間に関して比較を行うべきかを問い合わせる
(ステップG)。そしてその回答入力に応じて比較照合
すべき図面情報を特定するようにすれば良い。
このような機能を備えた本発明の第2の実施例装置に
よれば、文献や特許文書に含まれる複数の図面情報の中
から類似性の高いものをだけを抽出して、その間の図面
情報を比較することができるので、無駄な図面比較を省
いて効率良く図面情報間の相違点を見出すことが可能と
なり、その実用的利点・効果が非常に大きい。
尚、本発明は上述した実施例に限定されるものではな
い。実施例では標題や説明部に含まれる単語間の類似度
を用いて図面情報の類似性を評価する例について述べた
が、必ずしもこの例に限定されるものではない。例えば
図面情報を構成する文字情報間の類似度やノード間の結
合の類似度等の他の情報についての類似度を用いたり、
或いはこれらの類似度の情報を組み合わせて用いること
も可能である。
また前述した各実施例では、図面情報が第4図および
第5図に示すようにベクトル化され、且つノードを構成
する文字情報と図面情報との対応が付いていることを前
提として説明した。しかし図面情報がスキャナ等により
入力されたドット・イメージであるような場合には、ど
のドットが図形となり、どのドットが文字になるかを認
識する必要がある。このような場合には、例えば下記の
文献 『恒川・下辻,「図面読取装置TOSGRAPH」電子通信学会
論文誌'85/4 Vol.J−68−D No.4,pp466−472』 等により提案されている技術を適宜用いて、その認識処
理を行えば良い。その他、本発明はその要旨を逸脱しな
い範囲で種々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、比較すべき複数
の図面情報間における図面構成要素の対応関係の有無が
解析され、その解析結果に基づいて対応関係にある構成
要素と、対応するものがない構成要素とが識別表示され
るので、上記図面情報間の相違点を明確に提示すること
が可能となる。この結果、図面情報として記述されてい
る技術や方法の新規性や改良点等を、その提示情報から
迅速に、しかも正確に把握することが可能となるので、
種々の文献調査等において多大なる効果が奏せられる。
【図面の簡単な説明】 図は本発明の実施例に係る情報提示装置について示すも
ので、第1図は第1の実施例装置の概略構成図、第2図
および第3図は比較照合される図面情報の例を示す図、
第4図および第5図は図面情報記憶部における図面情報
の物理的な記憶内容を示す図、第6図および第7図は図
面情報記憶部による図面情報の論理的な記憶内容を示す
図、第8図は概念辞書の構成を示す図、第9図は実施例
装置の全体的な処理手続きの流れを示す図、第10図乃至
第15図は実施例装置における処理内容(解析結果)をそ
れぞれ示す図である。 また第16図は本発明の第2の実施例装置の概略構成図、
第17図は第2の実施例装置における図面情報の類似性判
断の処理手続きの流れを示す図、第18図は予約語辞書の
内容を示す図、第19図乃至第21図は類似性判断に用いら
れる情報(規則,解析結果)を示す図、そして第22図お
よび第23図は従来の文字情報に対する比較処理例を説明
する為の図である。 1……入力部、2……出力部、3……図面情報記憶部、
3a……物理情報記憶部、3b……論理情報記憶部、4……
概念辞書、5……対応解析部、6……対応記憶部、7…
…情報管理部、8……図面記述解析部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 沼上 英雄 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (72)発明者 岡崎 彰夫 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (72)発明者 福井 美佳 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (72)発明者 坪井 宏之 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (72)発明者 岡本 恭一 神奈川県川崎市幸区小向東芝町1番地 株式会社東芝総合研究所内 (56)参考文献 特開 平4−48386(JP,A) 脇本浩司、外3名、「グラフ表現を利 用した図面の類似検索方式」、電子情報 通信学会論文誌D−2、電子情報通信学 会、Vol.77、No.7、p.1302〜 1310 (58)調査した分野(Int.Cl.6,DB名) G06F 17/50 G06T 1/00 - 17/50 G06F 17/30 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】図形および文字からなる図面情報の中で使
    用される用語間の概念関係を記述した概念辞書と、 この概念辞書を参照して複数の図面情報間における各図
    面情報の構成要素の対応関係を解析する対応解析手段
    と、 この対応解析手段による解析結果に基づいて、前記複数
    の図面情報間で対応する構成要素を他の構成要素に対し
    て識別表示する表示手段とを具備したことを特徴とする
    情報提示装置。
  2. 【請求項2】請求項(1)に記載の情報提示装置におい
    て、 入力された図面情報中の文字データと図形データ、およ
    びこれらの各データの位置情報を解析して前記文字デー
    タと前記図形データとを対応付けて前記図面情報の構成
    要素を抽出する構成要素抽出手段を備えたことを特徴と
    する情報提示装置。
  3. 【請求項3】請求項(1)に記載の情報提示装置におい
    て、 文書に含まれる複数の図面情報から、概念辞書を参照し
    て図面情報の記述範囲の関係を解析する記述範囲解析手
    段を備え、 複数の文書にそれぞれ含まれる図面情報の中の、前記記
    述範囲解析手段により同じレベルの記述範囲であると解
    析された図面情報に対して対応解析手段を適応すること
    を特徴とする情報提示装置。
JP2255074A 1990-09-27 1990-09-27 情報提示装置 Expired - Fee Related JP2977260B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2255074A JP2977260B2 (ja) 1990-09-27 1990-09-27 情報提示装置
US07/740,901 US5305208A (en) 1990-09-27 1991-08-06 Database retrieval system for effectively displaying differences between elements of plural drawings
DE69121346T DE69121346D1 (de) 1990-09-27 1991-09-25 Gerät und Verfahren zur Ermittlung und Darstellung von Unterschieden zwischen zwei technischen Zeichnungen
EP91308758A EP0478315B1 (en) 1990-09-27 1991-09-25 Apparatus and method for determining and displaying the difference between two technical drawings

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2255074A JP2977260B2 (ja) 1990-09-27 1990-09-27 情報提示装置

Publications (2)

Publication Number Publication Date
JPH04134575A JPH04134575A (ja) 1992-05-08
JP2977260B2 true JP2977260B2 (ja) 1999-11-15

Family

ID=17273776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2255074A Expired - Fee Related JP2977260B2 (ja) 1990-09-27 1990-09-27 情報提示装置

Country Status (4)

Country Link
US (1) US5305208A (ja)
EP (1) EP0478315B1 (ja)
JP (1) JP2977260B2 (ja)
DE (1) DE69121346D1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5752016A (en) * 1990-02-08 1998-05-12 Hewlett-Packard Company Method and apparatus for database interrogation using a user-defined table
JPH06101018B2 (ja) * 1991-08-29 1994-12-12 インターナショナル・ビジネス・マシーンズ・コーポレイション 動画像データベースの検索
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US7650343B2 (en) * 2001-10-04 2010-01-19 Deutsches Krebsforschungszentrum Stiftung Des Offentlichen Rechts Data warehousing, annotation and statistical analysis system
JP3920308B2 (ja) * 2003-10-31 2007-05-30 富士通株式会社 検証支援装置、検証支援方法、検証支援プログラムおよび記録媒体
US7240064B2 (en) * 2003-11-10 2007-07-03 Overture Services, Inc. Search engine with hierarchically stored indices
WO2011044579A1 (en) * 2009-10-11 2011-04-14 Patrick Walsh Method and system for document presentation and analysis
US10050915B2 (en) 2015-09-17 2018-08-14 International Business Machines Corporation Adding images to a text based electronic message
US10129193B2 (en) 2015-11-17 2018-11-13 International Business Machines Corporation Identifying relevant content contained in message streams that appear to be irrelevant
US10444972B2 (en) 2015-11-28 2019-10-15 International Business Machines Corporation Assisting a user with efficient navigation between a selection of entries with elements of interest to the user within a stream of entries
CN108573750B (zh) 2017-03-07 2021-01-15 京东方科技集团股份有限公司 用于自动发现医学知识的方法和系统
JP7009522B2 (ja) * 2020-01-09 2022-01-25 前田建設工業株式会社 情報管理装置、情報管理方法及び情報管理プログラム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3930237A (en) * 1974-03-07 1975-12-30 Computervision Corp Method for automating the production of engineering documentation utilizing an integrated digital data base representation of the documentation
US4665555A (en) * 1985-03-11 1987-05-12 Alpharel Incorporated Computer based drawing management system
JPS6381574A (ja) * 1986-09-25 1988-04-12 Toshiba Corp 図形デ−タベ−ス入力装置
JP2735187B2 (ja) * 1987-03-17 1998-04-02 株式会社東芝 情報検索方法
US5133052A (en) * 1988-08-04 1992-07-21 Xerox Corporation Interactive graphical search and replace utility for computer-resident synthetic graphic image editors

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
脇本浩司、外3名、「グラフ表現を利用した図面の類似検索方式」、電子情報通信学会論文誌D−2、電子情報通信学会、Vol.77、No.7、p.1302〜1310

Also Published As

Publication number Publication date
DE69121346D1 (de) 1996-09-19
EP0478315A3 (en) 1993-06-09
JPH04134575A (ja) 1992-05-08
EP0478315B1 (en) 1996-08-14
EP0478315A2 (en) 1992-04-01
US5305208A (en) 1994-04-19

Similar Documents

Publication Publication Date Title
JP3030786B2 (ja) ユーザー拡張の可能なデータベースシステム
US6728700B2 (en) Natural language help interface
JPH11110416A (ja) データベースからドキュメントを検索するための方法および装置
JP2977260B2 (ja) 情報提示装置
US8412703B2 (en) Search engine for scientific literature providing interface with automatic image ranking
JPH04296989A (ja) 文字認識方法及び装置
KR102546895B1 (ko) 논문의 요약과 본문 매칭에 기반한 학술 정보 제공 방법 및 장치
WO2021145146A1 (ja) 文書表示支援システム及び文書表示支援方法並びに該方法を実行するためのプログラム
JP2011513810A (ja) 用語識別方法および装置
WO2021230054A1 (ja) 文抽出装置及び文抽出方法
JPH0484271A (ja) 文書内情報検索装置
JP2937520B2 (ja) 文書検索装置
JPS62287336A (ja) 電子辞書
JP2013016036A (ja) 文書部品生成方法及び計算機システム
JPH1153394A (ja) 文書処理装置、文書処理プログラムが記憶された記憶媒体、及び文書処理方法
JPH08147311A (ja) 構造化文書検索方法及び装置
JPS6378228A (ja) 情報検索装置
JP3825829B2 (ja) 登録情報検索装置及びその方法
JP4289891B2 (ja) 情報検索装置、情報検索方法およびプログラム
JPH08212230A (ja) 文書検索方法及び文書検索装置
JP2000268034A (ja) テキスト自動前編集装置及び方法並びにこれに利用される記憶媒体
JP2002312401A (ja) 電子ファイリング装置及びその制御方法、記憶媒体並びにプログラム
JP3056810B2 (ja) 文書検索方法および装置
CN108052508B (zh) 一种信息抽取方法及装置
Marshall et al. Aggregating automatically extracted regulatory pathway relations

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070910

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080910

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090910

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees