JPH0584538B2 - - Google Patents

Info

Publication number
JPH0584538B2
JPH0584538B2 JP60060678A JP6067885A JPH0584538B2 JP H0584538 B2 JPH0584538 B2 JP H0584538B2 JP 60060678 A JP60060678 A JP 60060678A JP 6067885 A JP6067885 A JP 6067885A JP H0584538 B2 JPH0584538 B2 JP H0584538B2
Authority
JP
Japan
Prior art keywords
concept
concepts
relationship
information
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60060678A
Other languages
English (en)
Other versions
JPS61220027A (ja
Inventor
Hiromichi Fujisawa
Junichi Tono
Atsushi Hatakeyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60060678A priority Critical patent/JPS61220027A/ja
Priority to DE3650736T priority patent/DE3650736T2/de
Priority to EP94114719A priority patent/EP0638870B1/en
Priority to EP86104083A priority patent/EP0196064B1/en
Priority to DE3650417T priority patent/DE3650417T2/de
Priority to US06/844,123 priority patent/US4868733A/en
Publication of JPS61220027A publication Critical patent/JPS61220027A/ja
Priority to US07/430,241 priority patent/US5553226A/en
Priority to US07/831,093 priority patent/US5404506A/en
Priority to US07/947,536 priority patent/US5696916A/en
Priority to US08/141,039 priority patent/US5555408A/en
Publication of JPH0584538B2 publication Critical patent/JPH0584538B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/20Drawing from basic elements, e.g. lines or circles
    • G06T11/206Drawing of charts or graphs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S706/00Data processing: artificial intelligence
    • Y10S706/902Application using ai with detail of the ai system
    • Y10S706/934Information retrieval or Information management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文書や図面、あるいは写真といつた情
報を一般ユーザが分りやすく記憶・検索・表示で
きるような文書フアイリングシステム及び情報記
憶検索システムに関する。
〔発明の背景〕
従来は大量な情報の記憶と検索を可能とするデ
ータベースの管理や検索の処理は専門家に委ねら
れており、エンドユーザはその専門家を介在して
情報の入手などを行つていた。しかし、近年光デ
イスク記憶装置などの小形の大容量記憶装置が実
現されるに及んで、エンドユーザが直接操作する
オフイスを対象とした文書フアイリング装置が実
現されている。また、ワードプロセツサの普及も
進んでおり、大量の文書が電子的な装置の中に格
納されることになつた。
しかしながら、従来の計算機技術ではこれらの
文書などの物件を、それぞれに付した固有名称
や、標題、著者名といつた書誌的事項を表形式で
表わして管理したり、または更にキーワードや分
類コードを付与して検索しやすくしているが、下
記のような問題点がある。
まず、計算機のフアイルシステムではほとんど
の場合、固有名称(20文字程度)でフアイルを管
理しているが、思い出しやすいように名称を付す
ことが難しく、更にその文字列から中身を想像し
ながら欲しいフアイルを探し出すことは、作成し
た本人でも極めて難しい。
書誌的事項は客観的事者であるため登録する場
合には難しさはないが、これを検索手段に用いる
状況は少ない。引用書類・参考文献として明確に
分つている場合などに限られる。
文書などを引出す多くの場合は、あいまいにし
か憶えていない標題や、その文書の内容が手掛り
となる。このために、キーワードや分類コードが
用いられるが、まず文書を登録するときにこれら
を付与することが難しい。すなわち、何をキーワ
ードとすれば後で適切に選び出せかるかは難しい
問題である。たとえば色々な角度から検索可能と
するための沢山のキーワードを付与すると、検索
時に不要なものが多く出て来てしまう。少なけれ
ば正しく選び出されるかどうか分らなくなる。従
来、文献データベースなどでは専門家がキーワー
ドや分類コードを抽出し、付与している。
更に、検索するときに、キーワードを想起する
ことも難しい。例えば、文献検索などの場合、キ
ーワードからなる検索式を作るに際して、総目録
から欲しいものと似ている文献を探し出し、それ
についているキーワードを捨い上げて、参考にす
るという手順を踏むことも稀ではないことからも
想定することの難しさが分る。
更にまた、分類による文書フアイリングも、分
類木(階層木)のあいまい性や、細分化していつ
た場合の分類木の交錯(一つの文書が多重に分類
される)が発生するという問題がある。また、分
類の規準は時間と共に変つて行き、数年経つと全
く役に立たなくなることが多いことも問題であ
る。
以上のように、従来技術による文書などのフア
イリング方式では、特にエンドユーザにとつて管
理と検索をやりやすくすることが極めて重要な課
題となつている。
これらの課題に対しては文献〔ジエ.エフ.ソ
ワ:“コンセプチユアル グラフズ フオー ア
デタ ベース インターフエース”アイビーエ
ム ジエ.リサーチ アンド デベロプメント、
ボル.20、1976ピピ336〜358(J.F.Sowa:
“Conceptual graphs for a Data Base
Interface、”IBM J.Research and
Development、Vol.20、1976、pp.336−357)〕
に、検索を自然言語で行う場合の検索条件の図式
化方法と形式的検索条件式の導出方法が提案され
ている。また、文献〔エフ.エヌ.トウ.エト
オル、“ラビツト:アン エンチリジエント デ
ータベース アシスタント”、プロシーデングス
オブ ナシヨナル エンフエレンス オブ エ
エエアイ、1982、ピピ:314−318(F.N.Tou、et
al.“RABBIT:An Intelligent Database
Assistant、”Proceedings of National
Conference of AAAI、1982、pp.314−318)〕で
は、データベースの中身に関する知識を計算機か
ら提示することにより、検索条件式を作る支援を
行う方法が提案されている。これらの方法は、デ
ータベースの検索の支援にのみ注目したものであ
り、データの入力、更新といつた情報の格納に対
する支援は含まれていない。
エンドユーザによる文書のフアイリングにおい
ては、新しい文書の登録や、フアイル体系の保守
(分類の適切さの見直しなど)なども検索しやす
くするためには重要であり、上記の提案方法では
不十分である。
さらに、検索し際しても次のような問題が残つ
ている。すなわち、情報を格納した時点では明確
になつていなかつた新しい概念(見方)によつ
て、古い情報を見直したり、その見方で検索する
ための手段が与えられていない。例えば、数年後
に新しい角度から分類し直したり、人とは違つた
観点で分類することが求められており、情報記憶
装置の使い易さを規定する重要な要素である。
〔発明の目的〕
本発明の目的は、以上のような問題点を解決
し、エンドユーザがあいまいで、かつ断片的な情
報から欲しい文書などを容易に検索することを可
能にすると同時に、文書などの登録を容易にする
ことにある。
〔発明の概要〕
かかる目的を達成するため本発明は機械におけ
る情報の記憶方式を人間の記憶特性や意味の捉え
方に合致したものとすることにより、エンドユー
ザにとつて分りやすく、かつ使い易い文書フアイ
リングシステム及び情報記憶検索システムを提供
するものである。
具体的には、新しい情報の登録の容易化、検索
条件入力の容易化、あいまい、かつ意味的な検索
の実現、および物の見方の多様性に適応した検索
の実現を可能とするものである。
これらの実現のために次の新しい機能を与え
た。
(1) 登録支援機能 新しい文書などを登録するには、書誌的事項
(著者名、表題、出典、など)を入力する他、
主題や文書の性格などを入力する必要がある。
また、高度な意味的な検索を可能とするために
は、それらの情報について更に詳しい情報を追
加する必要ががある。
例えば、主題がコンピユータであるとする
と、それはどのようなコンピユータか、どんな
特徴を持つているか、どこの会社が開発した
か、その会社はどこにあるか、その場所はどの
国に属するのか、といつた情報が必要となる。
これらの情報が記憶されていれば、「Aという
国にある会社で開発したコンピユータで、Bな
る特徴をもつたコンピユータに関する文書」を
推論機能を用いることにより検索することが可
能となる。
本発明では、記憶装置内に「コンピユータ」
や「会社」といつた概念に関する知識を記憶さ
せておき、新しい情報を追加する際に、どんな
属性データを入れるべきかをユーザに対話的に
提示し、短時間で入力できるようにするととも
に、誤つた情報が入らないようにする。
更に、既に似た情報を登録してあるときに
は、新たにすべての属性データを入力すること
なく、似た物の属性と異なる点のみを入力する
ような機能を与えることにより、入力の容易化
を計る。例えば、「中山太郎」という人間が既
に登録されていて、その兄弟の「中山次郎」を
登録する場合を考える。この場合、似ている概
念として「中山太郎」を選択すると、システム
はその属性リストを表示する。例えば、 ((父は中山元雄) (母は中山花子) (生年月日は1960年5月4日) (性別は男) (趣味は音楽) (1) と表示する。ユーザは、これらの内、異なるも
ののみ、例えば(生年月日は1963年6月7日)、
(趣味はスポーツ)と入れるのみでよい。
(2) 検索条件入力支援機能 エンドユーザが検索を行う場合、多くはぼん
やりしたイメージしか持つておらず、すべてを
適格に自然言語などで表現することは難しい。
本発明方式では対話的に、最も重要な概念か
ら始めて、検索のための情報を逐次追加して行
く。その際に、登録支援機能と同様に、記憶装
置内にフアイリング対象世界の知識を蓄えてお
き、それに基づいてユーザに、入力可能な属性
名と、そこに入り得る概念(事物のクラス)を
提示する。
例えば、ユーザが欲しい物は「論文」である
とすると、まずユーザは「論文」と入力する。
記憶装置は「論文」から、それは著名、表題、
主題といつた属性があることを知り、端末上
に、それらの属性名称と概念の組、例えば(著
者、人名)、(表題、テキスト)、(主題、概念)
を呈示する。ユーザはそれらを見て、自分が情
報として持つているものを選択して、データを
入力する。例えば「主題」を選択して「コンピ
ユータ」を入力する。この過程は回帰的に繰返
すことができる。例えば、主題が「コンピユー
タ」であるとすると、システムは(開発者、組
織、会社)、(走る言語、コンピユータ言語)、
(OS、OS)などを呈示し、ユーザは例えば、
(走る言語、LISP)と入力し、条件を付加する
ことが出来る。
このような支援機能により、例えば 「LISPが走るコンピユータに関する論文で、
A社の社員が書いた論文」 (2) といつた検索条件を設定することができる。後
に詳述するように、同検索条件を本発明方式で
は形式的に以下のような表現式で表わす。
(TECHNICAL−PAPER (SUBJECT−IS (COMPUTER(RUNS LISP))) (AUTHOR−IS (EMPLOYEE(WORKS−AT A−
COMPANY)))) (3) これは日本語でも表現でき、次のように書
く。
(論文(主題は (コンピユータ (走る言語はLisp))) (著者は (社員(所属はA社)))) (3) なお、上記の記法はLisp言語におけるS式
(symbolic expression)〔文献:ピー.エツ
チ.ウインストン“リスプ”アデイシヨン−ヴ
エスレイ パブリツシング カンパニー1981、
ピー18(P.H.Winston、“LISP、”Addison−
Wesley Publishing CO.、1981、p.18)〕の書
方に準拠する。
(3) 意味的あいまい検索機能 ユーザがある物件を検索したいと思つたとき
に、普通は断片的な情報で、かつあいまいなも
のしか持つていない。一方、記憶装置(データ
ベースなど)には極めて具体的な名称で記憶さ
れている。したがつて、これらのギヤツプを解
消することが求められている。
この場合、大きく分類して、あいまい性には
次の5種類がある。
(i) 名称の不完全性 事物又は概念の名称の一部分しか憶えてい
ない。
(ii) 同義語 同一の事物を異なる単語で憶えていること
が多い。例えば、「人工知能、人工頭脳、
AI」などは同一概念を指している。
(iii) 数の不完全性 数値を厳密に憶えていることは稀である。
「1980年代、85年ごろ、83年から87年の
間、1960年以前」などはその例である。
(iv) 概念の抽象化(その1) 事物や概念は、その上位の概念で憶えて、
その具体的なものは忘れることが多い。ここ
で、上位の概念とは、分類(クラスタリン
グ)によることが多い。「会社名は忘れたが、
その組織は大学や研究所ではなく、とにかく
会社であつた」、あるいは「あれは電機メー
カであつた」はその例である。
この場合、その電機メーカを、例えば
“ABC株式会社”とすると、 (ABC株式会社 IS−A 電気メーカ) (電気メーカ IS−A 企業) という関係式が成り立つ。図式的には、概念
「ABC株式会社」と概念「電気メーカ」が
「IS−A」というリングで結ばれることにな
る。ここで、リンク「IS−A」は上記二つの
概念の間に定義される関係(relationship)
で包摂関係という。
一般にすべての概念はIS−Aリンクによつ
て階層的に分類されると考えられる。その階
層木を概念木と呼ぶことにする。
(v) 概念の抽象化(その2) 前項の抽象化は概念の集合論的抽象化であ
るが、人間は概念の部分関係における上位の
部分で憶えていることも多い。例えば、「A
氏の所属はどの工場か忘れたが、とにかく
ABC株式会社であつた」、あるいは「あれは
何市か忘れたが埼玉県であつた」ということ
がある。
普通、事物を格納するデータベースには
「A氏はXYZ工場の所属である」とか、
「ABC株式会社は所沢市にある」とか記憶さ
れており、従来の情報検索の技術では上記例
のあいまいな情報からでは検索することが出
来ない。
この場合、 (ABC株式会社 HAS−PART−OF XYZ工場) (埼玉県 HAS−PART−OF 所沢市) という関係が重要な役割を果す。ここで注意
すべきことは、 (所沢市 IS−A 埼玉県) ではなく (所沢市 IS−PART−OF 埼玉県) であり、概念的な包摂関係(上下関係)と明
確に区別して把握することである。関係「IS
−PART−OF」は関係「HAS−PART−
OF」の裏返しの関係である。
厳密には、方向性をもつた関係(IS−
PART−OFやHAS−PART−OF)は
relationと呼び、それらをまとめて方向性を
なくした関係(そのリンクとしての存在)を
relationshipと呼ぶことにする。上記例では
IS−PART−OFとHAS−PART−OFは
「部分全体関係」(Part−whole
relationship)と呼ばれている。
人間の記憶に関する特性には、上記5種類
のあいまい性の他に、概念間の関係の方が概
念自体よりも記憶に残りやすい、という特性
がある。たとえば、「ある記事の主題はオペ
レーテイングシステムであつたが、それは米
国の研究所で開発された」という断片情報か
らの検索では、「開発された」という事実が
重要であり、それは同オペレーテイングシス
テムと同研究所という二つの概念の間に定義
される「関係」である。具体的には、 (UXオペレーテイングシステム IS−DEVELOPED−BY B研究所) という関係式で表わされ、IS−
DEVELOPED−BYはrelationである。意味
的なあいまい検索では、この「関係」が重要
である。
以上述べた人間の記憶上の特性の内、名称の不
完全性と数の不完全性については従来の情報検索
においても勘案されている。例えば、部分文字ス
トリングのマツチング機能や、数値範囲指定など
が知られている。
本発明の特徴とする意味的あいまい検索機能は
上記分類の内、特に抽象化概念(その1、および
その2)の扱いにおいて新規性がある。すなわ
ち、前記した検索条件入力支援機能を用いること
により、次のような意味的あいまい検索が可能で
ある。
検索条件:「埼玉県にある会社が開発したコンピ
ユータで、ある研究所が開発したオペレーテイ
ングシステムが走るものに関する記事」 ……(4) ここでは、条件文に現われている具体的な概念
は「埼玉県」のみであり、その他にキーワードに
なりそうな単語は抽象的な「コンピユータ」、「研
究所」、「オペレーテイングシステム」などであ
る。従来の情報検索方式、たとえばキーワード検
索では十分な検索情報を得ることが出来ない。
条件文(4)には埼玉県と会社、会社とコンピユー
タ、オペレーテイングシステムとコンピユータな
どのそれぞれの間の関係をも検索情報として扱つ
ている意味で「意味的な検索」であり、また会
社、コンピユータ、オペレーテイングシステムな
どは一般名称(抽象的概念)であるという意味で
「あいまいな検索」を実現していることになる。
従来の検索方式では、キーワード間の関係を記述
していないため、例えば「埼玉県にある研究所が
導入したコンピユータで、ある会社が開発したオ
ペレーテイングシステムが走るものに関する記
事」も同時に含まれてしまい、その意味で「意味
的でない検索方式」である。
〔発明の実施例〕
以下、本発明を実施例にもとづいて説明する。
第1図は本発明の一実施例である文書フアイリ
ングシステムの構成図である。装置全体の構成と
動作の概要を説明する。
まず、装置は制御装置(CPU)100、主メ
モリ300、磁気デイスク装置群400、操作端
末200(CRT210、キーボード220、マ
ウス230)からなるデータ処理部と、画像スキ
ヤナ700、画像プリンタ750、光デイスク装
置450、画像バツフアメモリ350、高速画像
処理回路(IP)600、および高精細画像表示
装置500からなる画像情報処理部とから成る。
また、これらはバスアダプタ805を経由して接
続されている。
主な動作は、画像情報の文書などからの登録、
欲しい情報の検索表示・出力、およびフアイリン
グ対象となる分野に関する知識の入力・編集であ
る。文書画像の登録では、スキヤナ700から文
書画像をメモリ350に読み込み、IP600に
より圧縮符号化した上で光デイスク450に格納
する。そのとき、メモリ上の画像をCRT500
上に表示し、正しく読み取られたか否かをチエツ
クするとともに、同文書の書誌的事項(表題、著
者、出典など)と分野知識における位置付けなど
を端末250から入力する。書誌的事項、該文書
画像の光デイスク上での物理アドレス(パツクア
ドレス、トラツクアドレス、セクタアドレス)お
よ画像の属性(大きさ、走査密度、符号化方式な
ど)の情報はフアイル420に格納する。また、
同文書の分野知識での位置付けなどの情報はフア
イル430に格納する。
検索・表示では、後述する検索のための対話に
より欲しい文書を端末250上で固定することに
より、画像表示用CRT500に表示する。ハー
ドコピーが欲しい場合はプリンタ750から出力
する。固定された文書の所在情報(光デイスクの
物理アドレスなど)はフアイル420内から読み
出され、光デイスクの読出し制御コマンドとし
て、バスアダプタ805経由で光デイスク制御回
路455へ送られる。読出された画像データは一
担メモリ350に貯えられ、表示されるページの
画像がIP600により逐次復号化される。
マウス230はCRT210およびCRT500
双方に対して位置指定することが可能であり、画
像のCRT500上での表示位置を該マウスで指
定できる。この機能を用いて、複数のページの文
書をCRT500上の任意の位置に重ねて表示す
ることもできる。多数のページを同一画面に表示
するために、1ページ分の文書画像をIPで縮小
して表示することもできる。CRT上の画面の管
理はCPU100で行う。
分野知識の入力・編集は、必要に応じて文書を
CRT500に表示しながら、端末200上で行
う。分野知識とは、登録する、または登録してあ
る文書に記述されている世界に関する概念および
概念間の関係として記述される事実の集合であ
る。更に、概念や関係を表現する自然言語に関す
る知識も含まれる。当然、上記世界には文書自身
も概念の一つとして含まれる。これらの知識はフ
アイル430に格納される。
以上述べた3つの主な機能はモードレスで、い
つでも任意に呼び出すことが出来る。例えば、分
野知識の追加編集を行つている際中に、必要な情
報を検索機能を用いてCRT500上に呼び出し
たり、あるいは文書画像の登録を行つている際中
に、同文書内容に関する知識を追加したりするこ
とが出来る。
次に、分野知識データ表現形式の説明をする。
知識は事物を含めた概念と、それらの間の関係と
いう二つの種類の要素で表現する。第2図は概念
的に意味ネツトワーク(Semantic Network)
の形に表現した図式である。楕円で表わすノード
(節)は概念を表わし、中に書かれている単語は
同概念を表わす代表単語である。概念名称とい
う。楕円と楕円を結ぶリンク(実線または破線で
表わす矢印)は概念と概念の間の「関係」を表現
する。たとえば、スーパーコンピユータ1012
はコンピユータ1011の「一種である」という
ことが、IS−Aというリンクによつて表わされて
いる。ここでUNIVERSAL1010は特別な概
念で、すべてを包摂するものとして定義する。従
つて、すべての概念はUNIVERSALを根(root)
とした概念木(concept tree)を構成し、分類階
層(taxonomic hierarchy)を表わしている。IS
−Aは「関係」の一種ではあるが、概念の属性を
下位概念へ継承させる導筋になつており、その意
味で他の「関係」と分けて考える。したがつて、
第2図においても矢印を実線と破線に別けて記し
ている。
たとえば、「コンピユータはソウトウエアを走
らせる」という一般的な属性がある。同時にそれ
は裏返えせば「ソフトウエアはコンピユータ上で
走る」という属性である。ここでは、これらを
「一般関係」(generic relationship)と呼ぶこと
にする。形式的には (コンピユータ RUNS ソフトウエア) (ソフトウエア RUNS−ON コンピユー
タ) (5) と表わされる。これら一般関係は次のように下位
の概念に継承される。すなわち、「スーパーコン
ピユータはソフトウエアを走らせる」、「X−800
はソフトウエアを走らせる」、あるいは「オペレ
ーテイングシステムはコンピユータ上で走る」、
「UXはコンピユータ上で走る」と言うことがで
きる。これらの関係は一般関係(5)から導き出され
るものであり、知識ベースには直接記述しない。
第2図において、概念「X−800」と「UX」
を結ぶ関係1005は、上記一般関係と異なり、
これら2つの概念間に定義される固有の関係であ
り、「具体関係」(instance relationまたは単に
relation)と言う。但し、具体関係1005は一
般関係1004の具体化したものである。
このようにして、ある記事「ART#018」10
18の主題がスーパーコンピユータX−800であ
り、同スーパーコンピユータではオペレーテイン
グシステムUXが走るという事実が、第2図に示
す図式で表わされることになる。また、すべての
概念はIS−Aリンクという縦糸で、また一般的関
係および具体関係という横糸で結ばれ、全体とし
て概念ネツトワークを構成している。
ここで注目すべきことは、概念に付随する属性
をその概念の側からのみ見るのではなく、属性に
現われる概念からの見方も対等に与えている点で
ある。これは、「属性」という見方を改めて、2
つの概念間に定義される「関係」という見方を採
ることによつて、しかもその関係は両側面から見
ることが出来るようにすることによつて成されて
いる。これにより、例えば記事ART#018とその
主題X−800を登録すると、同時に「X−800は記
事ART#018に載つている」ということが登録さ
れることになる。
以上の知識表現をより形式的に第3図のように
表現することができる。システムは、概念C、包
摂関係S、一般関係R、具体関係rという4種類
のデータの形式でこれらを記憶し、管理する。
C(i)はi番目の概念、S(k、i)C(k)がC(i)
の一種であることを、R(m)はm番目の一般関係、
またr(m、k、l)はR(m)の具体化した関係、
すなわち具体関係であり、C(k)とC(l)との間に定
義されたものであることを表わす。
更に具体的には、これら4種のデータは表形式
で表わされ、実体関係モデル(Entity Relation
Model;ERモデル)の図式で表わすと第4図の
如く表現できる。ここで、概念Cと一般関係Rと
は実体として捉え、包摂関係Sと具体関係rをこ
れら実体を結ぶ関係として捉えている。一般関係
Rは具体関係rのクラスを定義するものであり、
ここでは実体として考える。これらの具体的な表
形式を第5図〜第8図に示す。表の内容は第2図
を表わす。
第5図は概念を表わす言葉を定義する表
(table)であり、基本的には概念固有番号C
#と、それを表わす言葉(単語;又は表記)
CNAME、および同表記CNAMEが基本表記
(Primary)であるか二次的表記(Secondary)
であるかを表わすカラムとからなつている。例え
ば、概念#58は「コンピユータ」であり、表記と
しては「計算機」も与えている。
第6図は包摂関係Sを表わし、概念固有番号C
#と、該概念の上位の概念(Superclass)の固有
番号S#のカラムから成つている。特殊な場合と
して「UNIVERSAL」の上位概念は
「UNIVERSAL」として定義されている。
第7図は一般関係Rを定義する表である。一般
関係固有信号RS#、同関係の名称RSNAME、
同関係を左から右へ読んだときの読みLR、およ
び右から左へ読んだときの読みRLとからなる。
但し、ここで「左から右へ」とは、同関係が結ぶ
2つの概念を左右に並べる基本形に対してであ
り、その基本形は第8図で説明する具体関係rの
表で定義する。表Rでは、例えば16番の一般関係
として「SUBJECT」という関係があり、 IS−SUBJECT−OF 又は SUBJECT−IS という具体関係てして用いられることを表わして
いる。
ここで特記すべきことは、同じ読みの関係が区
別して異なるものとして定義されていることであ
る。例えば、第7図で2つのHAS−PART−OF
があるが、これらは関係PART−WHOLE1と
PART−WHOLE2という異なる関係に対するも
のである。この意味は、「部分全体関係」(part−
whole relationship)でも異なる概念に対するも
のは区別して扱うことにある。例えば、PART
−WHOLE1は「組織」に対する関係で (ABC株式会社 HAS−PART−OF XYZ工場 (6) という場合に適用し、PART−WHOLE2は「地
域」に適用し、 (埼玉県HAS−PART−OF 所沢市) (7) という関係を表わすのに用いる。
第8図は概念間に定義される関係rを表わす表
である。同表には一般関係と具体関係の双方が登
録される。カラムG/Iはそれらを区別するため
のもので、Gは一般関係、Iは具体関係であるこ
とを示す。
表rにおいて、各レコードは関係固有番号R
#関係の種類を示す一般関係固有番号RS#、基
本形において左側に位置する概念の固有番号CL、
同じく右側に位置する概念の固有番号CRなる要
素をもつ。
たとえば、関係#4は概念#58(「コンピユー
タ」)と概念#64(「ソフトウエア」)とに定義され
る一般関係(G/I=G)であり、一般的関係
#7で定義される意味をもつ。より具体的には、 (コンピユータRUNSソフトウエア) (ソフトウエアRUNS−ON コンピユータ)
(8) という表面的には2つの関係を、表rにおいては
1つのレコードが表わしている。同様に、関係
#724は一般関係#7の具体化したものであり、
概念#1512と#1051とを結んでいる。すなわち、
表Cから分るように (X−800 RUNS UX) (UX RUNS−ON X−800) (9) という関係を表わす。
以上説明した4つのデータ(表C、S、R、
r)が知識ベースとしてフアイル430に格納さ
れる。
次に、文書画像を定義する表Dについて第9図
で説明する。表Dは文書固有番号D#、概念固有
番号C#、文書サイズSIZE、圧縮符号化方式
CODE、画像走査密度DENS、光デイスク上の物
理アドレスPHYSA、および記録セクタ数LENG
なるカラムを持つている。第9図で示すレコード
は、文書#98は、概念#313(記事ART#018;第
5図参照)に関するもので、A4サイズであり、
16本/mmの走査密度でスキヤンされ、MH符号で
圧縮されて、光デイスクの400207番地以降13セク
タに格納されていることを示す。
これから分るように、すべての概念に対して文
書画像を付加することが可能であり、これにより
必ずしも“文書”ではなくても、例えば「コンピ
ユータ」にその説明を画像で付随させることがで
きる。また同時に、一つの概念に複数の異なる文
書を付随させることも可能である。
表Dは第1図におけるフアイル420に格納
し、管理する。
以上、本発明実施例の装置構成と、データ表現
形式の説明を行つたので、以下にソフトウエア構
成と処理方式とを提示する。第10図にソフトウ
エア構成図を示す。ここで、該ソフトウエアは制
御装置100(第1図)が処理するものであり、
プログラムはフアイル410に格納されている。
第10図に示す如く、ソフトウエアは、対話制
御モジユール2001、探索・概念マツチングモ
ジユール2002、検索式生成モジユール200
3、概念ネツトワークエデイタ2004、ネツト
ワーク跋渉モジユール2005、表操作モジユー
ル2006、画像表示モジユール2010とから
成つている。
基本部分である表操作モジユールの機能から説
明する。表操作モジユールの目的は、先に説明し
た表形式のデータを高次レベルで操作したり、検
索したりする機能を提供することである。以下に
主な関数を説明する。なお、プログラムはLISP
言語で書かれており、以下S式を用いる。なお、
理解しやすくするため、変数と関数は小文字で、
定数は基本的には大文字で表記することにする。
まず、新しく表を作成する関数としてcreate−
tableがある。例えば第7図の表Rは次のように
同関数を呼ぶことにより、その枠組が新たに定義
される。
(create−table′R ’(RS# RSNAME LR RL)) (10) ここで、第1引数は表名称、第2引数はカラム
名称のリスト(集合)である。また、記号′(引
用符号)は、次の記号は変数ではなく定数である
ことを意味する。
次に、表にレコードを追加するにはinsert関数
がある。
(insert′R ′(RS# RSNAME LR RL) ′((7 RUN RUNS RUNS−ON) (15 DEVELOPMENT HAS−DEVELOPED IS−DEVELOPED−
BY) (16 SUBJECT IS−SUBJECT−OF SUBJECT−IS))) (11) とすることにより、第7図の表Rの3レコードが
追加されることになる。
レコードの更新はupdate関数を用いる。例え
ば (update′R ′RSNAME ″THEME ′(eq(v RS#)16)) (12) とすることにより、表RにおいてカラムRS#の
値が16であるレコードのカラムRSNAMEの値
を′THEMEにすることができる。レコードの削
除は次式の如く行う。
(delete′R′(eq(v RS#)16)) (3) 第2引数は(12)式と同様条件項であり、up
dateおよびdeleteとも、任意の命題関数を書くこ
とができる。
レコードの選択(すなわち検索)はselect関数
を用いる。
(select′(LR RL ′R ′(Smatch′*SUBJ(v RSNAME))) (4) 例(4)式では、部分文字列*SUBJと表Rのカラ
ムRSNAMEとが部分的に一致するレコードを選
択し、結果として同レコードのカラムLRとLRの
値のリストを返す。ここでsmatchは部分文字列
マツチングを行う命題関数である。
以上、表操作モジユールの主な関数を説明し
た。次に、ネツトワーク跋渉機能と、主な機能の
実現方法について説明する。
概念ネツトワークは第2図で説明した如く、概
念ノードと「関係」というリンクとからなつてい
る。システムは、ユーザの興味の中心である概念
をカレントノード(current node)として記憶
している。ユーザは、以下説明する機能を用いな
がら、ネツトワーク中を歩き回る(跋渉する)こ
とができる。ここで歩き回るということは、カレ
ントノードを移動することに等しい。
ネツトワーク跋渉機能の主なものを説明する。
カレンノードを移動させる手段の第1番目に概念
名称またはその部分文字列を入れる方法がある。
ここで、もし部分文字列にマツチングする概念が
複数あつた場合には、メニユー表を表示して、ユ
ーザがその中の一つを選択することができる。そ
の結果へカレントノードは移される。第11図は
部分文字列*DATABASEにマツチングする概
念が表示されて、該メニユー表の7番目を選択し
た例を示す。ここで*記号は以降の文字列が部分
文字列であることを示す。上記機能は、 (select′(C# CNAME) ′C ′(smatch str(v CNAME))) (15) とすることにより概念を選択し、別途メニユー選
択用の関数(select−one a−list)を呼ぶこと
により実現される。ここで、strは端末から読み
込んだ文字列である。
第2番目の跋渉手段は、概念木(階層木)をメ
ニユー選択により順次辿つていく方法である。第
12図は最上位概念において直接下位の概念をメ
ニユーとしてlコマンドで表示したものである。
以降、第13図に示すように、番号を入力するこ
とにより階層木を下つて行くことができる。第1
3図の例では、「6、1、1、2」と入力するこ
とにより「組識(Organization)」という概念に
辿り付いている。この地点で、先の部分文字列を
入力すれば、カレントノードの下に含まれる概念
集合の中からのみ、同部分文字列にマツチングす
る概念が選ばれることになる。例えば、第11図
で現われた11個の概念の内、11番目の
「RELATIONAL−DATABASE−SYSTEM−
INC」は会社名であり、これのみが選択されるこ
とになる。すなわち、これだけが「組識」という
概念に包摂されている。
ここで、ある概念Cが包摂する概念は次のよう
に得られる。まず、 (Select′(C#)′S′(eq(v S#)c))(16
) により該概念に直接包摂される(概念木で直下に
位置する)概念が選び出される。従つて、同機能
を回帰的に繰返して呼ぶことにより、概念cによ
り包摂されるすべての概念を選びだすことができ
る。
次に第3番目の跋渉手段は、概念木をグラフイ
カルに表示しながら行う方法である。第14図は
「空間(space)」という概念に始まる、その下位
2層までの概念木である。第10図における
CRT210上に表示される同概念木の任意のノ
ードをマウス230で指示することにより、指示
された概念にカレントノードを移動したり、指示
された概念から始まる更に下位の概念木を表示し
たりすることができる。ここでマウスで指定した
CRT上の位置情報は第10図に示す対話制御部
2001が受取る。該制御部はグラフイツク表示
を司どるので、CRTの各位置に何を表示してい
るかを記憶しており、位置情報を入力することに
より、同地点の最近点にどの概念を表示している
かが分る。従つて、制御部2001はカーソル位
置情報を入力して、概念名称をネツトワーク跋渉
部2005へ返す。
グラフイカルな跋渉機能は、第14図に示す概
念の包摂関係のみでなく、部分全体関係(part−
whole relation)によつても行える。第15図は
概念「地球(earth)」の部分を階層的に、別な意
味での概念木として表示したものである。上記例
と全く同様に、部分全体関係に沿つて、歩き回る
ことができる。部分関係は次のように抽出するこ
とができる。まず、 (select′(RS#) ′R ′(eq(v LR)′HAS−PART−OF)) (17) は第7図表Rより部分全体関係を表わす一般的関
係番号RS#の集合を返す。第7図の例では
(2223)を返す。これを変数xに一時記憶させる。
いま、部分を見い出したい概念をcとすると、
cが持つ「部分」となる概念は、次式で得られ
る。
(select′(CR) ′r ′(and(eq(v CL)c) (member(v RS#)x))) (18) ここでrは小文字であるが第8図の表の名称で
ある。
同様に、HAS−PART−OFが第7図表Rのカ
ラムPLにある場合についても、(17)式と(18)式にお
けるLRとRLを交換して実行することにより、概
念cの部分概念が得られる。
第4番目の跋渉手段は、概念のフレーム表現を
介在した連鎖的跋渉である。第16図の例で説明
する。人名の部分文字列*sowaを入力し、唯一
に「J.F.SOWA」が見つかり、カレントノードが
同概念に移動する。フレーム表示のためのfrコマ
ンドにより同概念のフレームが表示される(オペ
ラント*はカレントノードのフレームを表示する
ことを意味する)。同フレームから「J.F.SOWA」
は「男(MAN)」であり、PAPER#0012と
BOOK#0007の著者である、ということなどが
分る。ここで、例えば、PAPER#0012は何んで
あるか知りたいというときは、コマンド「fr2」
を投入することにより、表示されているフレーム
の第2行目の概念のフレームが表示される。この
例では、PAPER#0012は「論文(TECH−
PAPRE)」であり、著者が「J.F.SOWA」、ペー
ジは336から357までで、「IBM−RES&DEV−76
−20」に載つているなどということが分る。第1
6図の例では、同様な手続きでJ.F.SOWA→
PAPER#0012→IBM−RES&DEV−76−20→
IBM−CORPとカレントノードを移動させてい
る。
フレームの表示は以上のように行う。いま、概
念cのフレームを表示することにすると、 (select′(RS#CR) ′r ′(eq(v CL)c)) (19) は、関係の基本形においてcが左にある「関係」
とそのときの右側の概念のペア(組)の集合が得
られる。同様に、 (select′(RS#CL) ′r ′(eq(c CR)c)) (20) は、cが右にある「関係」とそのときの左側の概
念のペアの集合が得られる。これらの値(集合)
をそれぞれ、x、yとすると、 (select′(LR) ′R ′(eq(v RS#)x1i)) (21) (select′(RL) ′R ′(eq(v RS#)y1i)) (22) はそれぞれ具体関係の名称を結果として返えす。
但し、xi、yiは集合x、yのi番目の要素で、更
にx1iはxiの第1要素、y1iはyiの第1要素である。
この具体関係の名称はフレーム(第16図)の第
1カラムに対応する。すなわち、フレームの各行
をスロツトと言うときのスロツト名である。フレ
ームの第2カラムはスロツト値(slot value)で
あり、各ペアxi、yiの第2要素x2i、y2iである。従
つて、スロツト名とスロツト値のペアを作り、表
形式に表示すれば、第16図の如くなる。ここで
内部的には概念は概念固有番号で扱つているの
で、表示する際には表C(第5図)から概念名称
に変換してから表示する。
上記例では行番号(スロツト番号)を指定して
次のフレームへ飛んでいるが、マウスによつて直
接、飛んで行きたい概念をCRT上で指示するこ
とが出来るし、またフレームは次々重ねて表示す
ることも出来る。
次に、第10図における概念ネツトワークエデ
イタ2004を説明する。
概念ネツトワークエデイタは知識ベースの保守
を行うものであり、新しい概念・関係の定義、追
加、更新、削除を行うためのものである。
第17図は新しい概念の追加の対話例である。
まず、manとタイプすることによりカレントノー
ドを概念MAN「男」に移し、新しい人間「スー
パーマン」を登録する。命令crcにより「MR.
SUPERMAN」をMANの下位に、すなわち、 (MR.SUPERMAN IS−A MAN) (23) として登録できる。次に、命令crrにより、新規
に登録した概念MR.SUPERMANの属性を、具
体的な関係という形式で定義、登録する。
システムは、一般関係という形式で「人間は物
を新しく考え出すものである」とか、「学位とい
うものを持つ」とか、「何か職をもつ」とかいう
「知識」を持つており、それらの知識を手掛りに
入力すべき項目をプロンプトとして表示する。第
17図に示すごとく、 MR.SUPERMAN HAS−TITLE−OF
{ACADEMIC−TITEL}: という形で、MR.SUPERMANの学位の入力を
捉す。{ }で示す概念ACADEMIC−TITEL
は、入力されるべき属性(ここでは一つの概念)
のクラスを示している。先に説明した概念ネツト
ワーク跋渉機能はこの時点で有効であり、この時
点ではカレントノードは概念ACADEMIC−
TITLEに移されている。したがつて、入力すべ
き属性を見い出すために任意の跋渉機能を用いる
ことができる。第17図の例では、直接、概念名
称「pnd」を入力しているが、同概念を探し出す
ために、命令lによりACADEMIC−TITLEの
下位の概念をメニユーとして表示(第13図参
照)することも出来るし、概念木を表示(第14
図参照)して欲しい概念を探し出してもよい。し
かし、探索および跋渉はこの場合は概念
ACADEMIC−TITLEの下位の概念の範囲に限
定する。跋渉機能により入力したい属性を表わす
概念にカレントノードを移動した後に、「ok」と
入力することにより、次の属性の入力に移る。
以上のようにシステムが表示するプロンプトに
従つて入力すべき属性だけを選択しながら新規に
定義・登録することができる。
本発明方式での特徴の一つは、先に説明したご
とく、属性を具体関係という形で捉えることによ
つて、双方の概念を同等に扱つていることであ
り、第17図の例でいうと、上記定義により (RED IS−GIVEN−TO MR.
SUPERMAN) (AAAI HAS−MEMBER−OF MR.
SUPERMAN) (JAPAN HAS−PEOPLE−OF MR.
SUPERMAN) (HITACHI−LTD HAS−EMPLOYEE−
OF MR.SUPERMAN) などの事実が同時に定義されることになる。
概念の新規登録は、内部的には以下のように実
現できる。いま、最大のC#(第5図参照)を
Cmaxとすると、まず、 (insert′C ′(C# CNAME P/S) (list(add1 Cmax) ′MR.SUPERMAN ′P)) (24) により表Cに概念MR.SUPERMANを登録する。
ここで、要数add1は+1をする関数である。
(insert′S ′(C# S#) (list(addl Cmax) (get−C#′MAN))) (25) により表Sに、(23)式の事実が登録できる。こ
こで関数get−C#は概念名称から同概念の固有
番号を得るための関数である。
具体関係の登録は、名関係(属性)に対して次
のように行える。
(insert′r ′(R# RS# CL CR G/I) (list(add1 r#max) rs (get−C#′MR.SUPERMAN) (get−C#′PHD) ′I)) (26) 但し、ここでrsは一般関係「ACADEMIC−
TITLE」の固有番号、r#maxは表rにおける
その時点での最大R#であるとする。
概念ネツトワークエデイタの別の機能は、既に
登録してある事実や概念の変更・修正である。具
体的には、概念名称の修正、概念木における位置
の修正(分類の修正)、具体関係の修正、一般的
関係の修正などが行える。
第18図は概念木の修正例を示す。概念
RSYCHOLOGYの位置をSOCIAL−SCIENCE
からNATURAL−SCIENCEの元へ移動する例
である。
(update′S ′S# ′(get−C#′NATURAL−SCIENCE) ′(eq(v C#) (get−C#′PSYCHOLOGY))) (27) を実行することで上記例の移動が行われる。
概念ネツトワークエデイタでは、ネツトワーク
跋渉機能を随時用いることが可能なことを述べた
が、同様にネツトワークエデイタ機能自体を再帰
的に用いることができる。例えば、新規概念の定
義登録中に、別の概念を新規登録しておくことが
必要となることが往々にしてあるからである。第
17図の例で、「学会」(ACADEMIC−
ASSOCIATION)の中にもし入力すべき
「AAAI」が未登録であつたとすると、同時点で
命令crcを入力して新規に概念AAAIを登録する
ことができる。更に必要であれば命令crrにより
AAAIの属性をその時点で登録してもよい。
あるいは、新規に概念を登録中に誤つた「事
実」などの登録が見つかることもあり、この場合
も、修正・変更を即時に実行できる機能をもつて
いる。これらの再帰性により、効率よく新規な知
識を追加登録することが可能となる。
次に、第10図における検索式生成部2003
および探索・概念マツチング部2002を説明す
る。これらの部分は、断片的なあいまい情報から
意味的な内容検索を可能とする主要な部分であ
る。まず、機能を説明するために処理の流れを検
索例により説明する。
「カリフオルニア州にある会社が開発したコン
ピユータで、UNIX*が走るものに関する記事」
(28) を検索することを考える*(UNIXは、UNIXシ
ステム ラボラトリーズ社が開発し、ライセンス
しているものである。)。
第19図の示すごとく、まず、カレントノード
を概念ARTICLE(記事)に移し、命令qを入力
することにより検索式生成を開始する。システム
は、上位概念から継承されるものをも含めて、概
念ARTICLEに定義されている一般関係を求め、
フレーム形式で第19図のごとく表示する。「記
事は出版物の一部である」、「記事は何頁にある」、
「記事はある記事から参照されている」などの一
般的知識から作られるフレームが表示されてい
る。ユーザは、この場合は、番号によりスロツト
を指定して、同スロツトに対して現在表示されて
いるよりも具体的な情報を追加することができ
る。第19図の例では、記事の主題がコンピユー
タであることが情報として手元にあるので、第5
番目のスロツトを選択する。システムは入力すべ
き項目の上位概念、この場合はUNIVERSALへ
カレントノードを移す。ユーザはこの時点で任意
のネツトワーク跋渉機能を用いることができる
(第10図参照)。第19図の例では直接
「Computer」と入力し、カレントノードを概念
COMPNUTERに移している。しかし、もし入
力すべき概念名称が思い浮ばなければ、部分文字
列を入力したり、メニユー表示をしたりすること
により、選び出すことが可能である。本例では、
コンピユータに関する情報が更に存在するので、
「Compater」の後に更に命令qを続けて入力し
ている。
第20図は次の対話画面である。概念
COMPUTERに関する一般関係のフレーム表現
が表示されている。先と同様に、追加すべき条件
のスロツト、この場合4番、を選択する。入力す
べき項目のクラスは「ORGANIZATION.
WORKPLACE」であることが表示される。ここ
でもメニユー選択(第13図参照)などを用いる
ことが出来るが、本例では単に「ある会社」とい
う意味で、直接「Company」と入力している。
「Company」に対しても更に追加すべき情報があ
るので、続けて「q」を入力して検索式生成過程
を続ける。
第21図は概念COMPANYに対する一般関係
のフレーム表示である。第7番目のスロツトを選
択し、同会社がカリフオルニア州にある、という
条件を入力している。この場合は部分文字列
「Cal」を入力して「California」を選び出してい
る。概念SPACE.PLACE.LOCATIONの下位概
念は第14図に示した。
条件入力の終了は「ok」と入力することによ
りシステムに伝えられる。第22図は、
COMPANYに対する条件入力を終了して、再度
COMPUTERに対する条件入力を行う場面であ
る。今回は、第13番目のスロツトを選択し、「同
コンピユータはオペレーテイングシステムUNIX
のもとで走る」という情報を入力する。
以上の過程をすべて終了すると、(28)式の検
索条件は次式の形式的表現に置換えられることに
なる。
(ARTICLE (SUBJECT−IS (COMPUTER (RUNS−UNDER UNIX) (IS−DEVELOPED−AT (COMPANY (IS−LOCATED−IN
CALIFORNIA)))))) (29) 検索式の自動的な生成は、上記のように一般的
な関係として記述された一般的知識によつて導か
れて行われる。この一般的知識の多くは、上位の
概念から継承されたものである。例えば、第21
図において、 (COMPANY IS−A ORGANIZATION.
WORKPLACE) であるが、同フレームのほとんどのスロツト(一
般関係)は上位概念ORGANIZATION.
WORKPLACEに対して定義されたものである。
COMPANYに固有なものは、同図の例では
(PRODUCES MACHINERY.DEVICE)のみで
ある。このように、一般的知識としての一般関係
は文字通り、より一般的に(より上位の概念で)
表現されればされる程、強力なものとなる。すな
わち、沢山の下位の概念に適用可能となる。
概念cの一般関係は次のように求めることがで
きる。いま、概念cの上位概念の集合をxとす
る。(表SでIS−AリンクをUNIVERSALに突き
当るまでたどればよい。) (Select′(RS#CR) ′r ′(and(member(v CL)x) (eq(v G/I)′G))) (30) は、概念cに継承される一般関係の内、概念cが
左側に定義されているものを抽出する。(30)式
において、CR→CL、CL→CRと置換えれば、概
念cが右側に定義されている一般関係が得られ
る。(30)式から分るように、得られるものはRS
#とCL又はCRのペア(組)である。RS#から、
表Rを参照することにより、フレームのスロツト
名称を得ることができる。いま、(30)式の答え
を、((y11、y21)…(yi1、y2i)…)という形式で
あるとすると、 (select′(LR) ′R ′(eq(v RS#)y1i)) (31) から、i番目のyに対応するスロツト名称を得る
ことができる。(30)式のCRとCLを代えたもの
に対しては、(31)式においてもLRとRLと置換
えればよい(第7図参照)。
(31)式の答えを((z1)…(zi)…)と書く
と、ペア(ziy2iはスロツト名称と概念固有番号か
ら成つている。
(select′(CNAME) ′C ′(and(eq(v C#)y2i) (eq(v P/S)′P))) (32) は概念名称Ciを返えすので、結局、ペア(ZiCi
はスロツト名称とスロツト値を構成することにな
る。リスト((Z1C1)(Z2C2)…(ZiCi)…)を表
形式で表示することにより、第21図の如く一般
関係のフレームを得ることができる。
さて、自動生成された検索条件式(例えば
(29)式)に対して、探索命令を入力すると、カ
レントノードの終端概念(部分的概念木の「葉」
(leaf)に当る概念)の集合を対象として、概念
マツチングが行われる。すなわち、終端概念(最
も具体的な概念)のそれぞれが、検索条件式で表
現される「抽象的概念」と比較され、概念的に包
含される終端概念が検索結果となる。
第23図は、(29)式の検索条件3000に対
して探索を行つた場合を示しており、条件の合致
した記事の概念フレーム表示3001と、本分の
イメージ3051の表示が可能である。同図で示
すように得られた記号ARTICLE#0014の概念フ
レームは、表面的には検索条件式(29)式と全く
一致していないことである。これは、正に従来の
データベース等の情報検索方式で起る事柄であ
る。すなわち、データベースには最も具体的な情
報が記憶されいるため、検索条件が抽象的である
と、全く一致しないことになる。しかしながら、
本発明方式では、分野に関する知識を用いて、概
念フレームの具体的内容と、検索条件の抽象的表
現のギヤツプを推論により埋めている。
次に、上記ギヤツプを埋めるための抽象的概念
と具体的な概念との推論を用いてマツチング方法
を説明する。ここでは、この過程を概念マツチン
グ(concept matching)と呼ぶ。第24図に、
(29)式で表わされる抽象的概念と概念
ARTICLE#0014との概念マツチングの過程を示
す。
探索過程では終端概念ARTICLE#0001〜
ARTICLE#0040のそれぞれが(29)式の比較さ
れるが、ここではマツチングが成功する
ARTICLE#0014についてのみ説明する。
まず、(ARTICLE)と(ARTICLE#0014)
が比較される。フレーム3001から (ARTICLE#0014 IS−A NEWS.
ARTICLE) 更に (NEWS.ARTICLE IS−A ARTICLE) であることが分り、 (ARTICLE#0014 IS−A ARTICLE) なる結論が得られる。従つて、条件式を一段深く
して、 (ARTICLE(SUBJECT−IS COMPUTER))
(33) が成立かるか否かを次に調べる。フレーム300
1から、まず、 (ARTICLE#0014) (SUBJECT−IS HP−9000)) であることが分る。したがつて、 (HP−9000 IS−A COMPUTER) であるか否かを調べればよい。リンク3003を
辿ると、 (HP−9000 IS−A
SUPERMINICOMPUTER) 更にリンク3032を辿ると (SUPERMINICOMPUTER IS−A
COMPUTER) であることが、それぞれフレーム3002,30
04から分り、(33)式が成立する。したがつて、
次に、 (ARTICLE (SUBJECT−IS (COMPUTER(RUNS−UNDER UNIX) (IS−DEVELOPED−AT COMPANY)))) (34) の成立を調べる。(COMPUTER RUNS−
UNDER UNIX)についてはフレーム3002
から成立することが直接分る。(COMPUTER
IS−DEVELOPED−AT COMPANY)につい
ては、フレーム3002には (HP−9000 IS−DEVELOPED−AT HP.HEWLETT−PACKARD−CO) と書いてあるので、更に調べに行くことが必要で
ある。リンク3033を辿ると、フレーム300
4に (HP.HEWLETT−PACKARD−CO IS−A
COMPANY) と書いているので成立する。従つて(34)式も成
立する。
更に検索条件式を1段深くして(29)式と比較
する。フレーム3004は (HP.HEWLETT−PACKARD−CO IS−LOCATED−IN PALO−ALTO)
(35) と書かれているので、 (COMPANY IS−LOCATED−IN
CALIFORNIA) (36) であるか否かを調べる必要がある。リンク303
4を辿ると、フレーム3005に (PALO−ALTO IS−PART−OF
CALIFORNIA) (37) と記録されているので、(35)式とあわせて、 (HP.HEWLETT−PACKARD−CO IS−LOCATED−IN CALIFORNIA) であることが推論される。結局、抽象的概念
(29)は具体的概念ARTICLE#0014を包摂する
ことが分つた。
以上、具体例を用いて、概念マツチングを説明
したが、この過程は再帰的に表現すると、概念の
包摂関係の成否を調べる過程と、各スロツトが一
致するか否かを調べる過程とが交互に再帰的に呼
ばれる過程となつている。また、説明からも分る
ように、後戻り形推論(backward−chaining
inference)となつている。従つて、探索時間は
検索対象となる具体的物件の数に、基本的には比
例することになる。
概念マツチングではマツチングが成功した時に
具体的な概念を値として返えす。この値を抽象的
概念の中に埋め込むことにより、何故ある具体的
概念がマツチングしたかが、後から分る。本発明
方式では、命令whyを入力すると検索された概念
のマツチング理由が表示・出力される。(29)式
の例では、 (ARTICLE#0014 (SUBJECT−IS (HP−9000 (RUNS−UNDER UNIX) (IS−DEVELOPED−AT (HP.HEWLETT−PACKARD−CO (IS−LOCATED−IN PALO−
ALTO)))))) (38) が得られる。従つて、抽象的に検索時に述べたコ
ンピユータとはHP−9000で、ある会社とはHP.
HEWLETT−PACKARD−COであることが分
ることになる。
さて、本発明の検索方式では、概念ネツトワー
クで表現された知識を、通常ユーザが見慣れた表
形式に変換して表示し、同表の上で検索する手段
をも提供している。第25図に具体例を示す。カ
レントノードを抽象概念NEWS.ARTICLEに移
した後、命令tabを入力すると、システムは同概
念の下位の終端概念の概念フレームを内部的に生
成する。次に、同フレームに現われるスロツト名
称を表にして提示する。第25図の場合は、6種
類のスロツトがあつたことになる。ユーザは、ど
のスロツトをカラムとした表にするかを選択する
ことができる。同例では6番目と5番目のスロツ
ト、すなわち、TITLE−ISとSUBJECT−ISを
選択し、合計3つのカラムからなる表が表示され
る。ユーザは例えばタイトルの文章から欲しいも
のを探し出すことが出来る。選択した結果をカレ
ントノードとして、本文イメージを表示する命令
を入力すれば、イメージ用CRT500に本文イ
メージが表示される。
本発明による検索方式は、必ずしも文書フアイ
リングのみではなく、広く一般のデータや事実の
情報にも適用できる。また概念マツチングは、2
つの概念の包摂関係を自動的に検定する方式を与
えており単に、情報検索のみならず、特許のクレ
ームの包摂関係の審査のような情報分析技術とし
ても応用することが出来る。あるいは、大量な具
体的概念を集めて、同概念マツチングを応用する
ことにより、概念的なクラスタ分析も可能とな
る。
本発明の一拡張として、知識ベースに時間の概
念を導入することができる。一般に、事実などは
「真」である時間を指定する必要があることが多
い。例えば、(MR.SUPERMAN IS−
MEMBER−OF AAAI)という事実は入会した
時刻から、退会したとすればその時刻まで「真」
である。このような時間の概念は、具体関係を保
持する表rを拡張することにより実現できる。
更に別な拡張は、各事実の出所を記録する機能
である。例えば、誰がそう言つたか、どこにそれ
が書いてあつたか、という情報の出典を、表rを
拡張することにより記録し、情報の管理をするこ
とができる。更に、信頼度を付記することも考え
られる。
本発明はシステムの実現方法に依存しない。た
とえば、処理を高速化するために特殊なハードウ
エアを導入してもよい。また、知識ベースが大き
くなつた場合に実現上の変形たとえば、概念や関
係を記憶する表をクラスタに分割して記憶する方
法などが考え得るが、これらは本発明方式に含ま
れる。更に、日本語で概念等を表記した場合に
は、日本語特有の仮名漢字変換機能などが要求さ
れるが、これらの拡張がなされたものも本発明に
含まれる。
〔発明の効果〕
以上説明したごとく、本発明によれば、フアイ
ルまたはデータベースの具体的な構築方法を知ら
ずとも、断片的な情報から欲しい文書などの情報
を容易に引出すことが可能になる。更に、容易に
引出すことができるように格納することも極めて
容易になる。
具体的には、フアイリングする対象に関する分
野知識を、概念ネツトワークで表現して知識ベー
ス化することにより、新しい知識の追加・編集や
検索条件の対話的入力が容易に行えるようにな
る。知識は、一般関係と具体関係という形で表現
されるが、情報の入力に当つてシステムは、一般
関係を用いてユーザが次に何を入力すべきか、更
にそれはどのクラスの概念であるべきかを推定し
て、端末上に表示する機能を持つ。本機能は基本
的な原理の上に組立てられているので、概念ネツ
トワークで表現される知識ベースを追加ないしは
変更するのみで、新しい世界や、より木目の細か
い世界への適応が可能である。
また、知識ベースの追加・変更などのために、
概念ネツトワークエデイタがあり、4種類以上の
ネツトワーク跋渉機能を持つ知識ベースの状態
を、概念木やメニユー表、あるいはフレーム、更
には関係データベース形の表形式で表示する機能
を与え、これらの表現の上で次々異なる概念へ跋
渉することが可能である。これらの豊富なデータ
ビユーが可能なことは、新しく考案した概念関係
モデルを採つたことにある。特に、概念フレーム
を表示しながら異なる概念へ飛んでいく機能は、
人間の思考形態とマツチしており、本機能のみで
もかなり高度な概念探索を実行することができ
る。
更に、本発明によれば、分野知識を用いた推論
を行うことにより、あいまいな断片情報から意味
的な内容検索が可能である。従来の技術では役に
立たないような抽象的な情報からでも、「意味的」
に内容を捉えることにより、精度高く検索でき
る。また、検索条件は任意の項目で、かつ任意の
深さまで指定することができ、人間が思い出すこ
との出来たレベルに合せて、検索式を作ることが
できる。
【図面の簡単な説明】
第1図は本発明方式の一実施例のシステム構成
図である。第2図は概念ネツトワークを説明する
図、第3図は形式的表現による概念ネツトワー
ク、第4図はER図式によつて概念関係モデルの
データ表現図である。第5〜8図は、概念関係モ
デルによる知識表現の具体例を示す図である。第
9図は画像データ管理用の具体例を示す図であ
る。第10図はソフト的な機能ブロツク図であ
る。第11図は部分文字列マツチングの説明する
図、第12図はメニユーを表示する図、第13図
はメニユー選択を用いたネツトワーク跋渉の説明
図、第14図は概念木表示を示す図、第15図は
概念の部分全体関係にもとづく階層木を表示する
図、第16図は概念フレームによるネツトワーク
跋渉の説明図である。第17図は新しい概念の定
義・登録方法の説明図、第18図は概念ネツトワ
ークエデイタの説明図、第19〜22図は対話的
な検索式生成方式の説明のための図である。第2
3図は意味的な内容検索の説明図、第24図は概
念マツチングの説明のための図である。第25図
は表形式で概念ネツトワークの状態を表示する機
能の説明図である。 100……制御装置、200……操作端末、3
00……主メモリ、40……磁気デイスク装置
群、450……光デイスク装置、500……高精
細画像表示装置、600……高速画像処理回路、
700……画像スキヤナ、750……画像プリン
タ、2001……対話制御部、2002……探
索・概念マツチング部、2003……検索式生成
部、2004……概念ネツトワークエデイタ、2
005……ネツトワーク跋渉部、2006……表
操作部、2010……画像表示部。

Claims (1)

  1. 【特許請求の範囲】 1 文書画像を入力する手段と、入力された文書
    画像を記憶する手段と、記憶された文書画像を出
    力する手段を備えた文書フアイリングシステムで
    あつて、 文書に関する情報を入力する手段と、 上記文書に関する情報を知識ベースとして記憶
    する手段と、 上記文書画像と上記知識ベースに記憶された上
    記文書に関する情報とを対応付ける手段と、 表示手段を含み、操作者と対話し指示を与える
    手段と、 操作者が入力した断片的またはあいまいな情報
    に基づき上記知識ベースを用いて所望の文書に関
    する情報を検索する手段と、 検索された文書に関する情報を表示する表示手
    段とを備え、 上記知識ベースは、上記文書に関する情報とし
    て、事物を表す複数の概念と、それらの概念間を
    結び付ける関係によつて記述された知識を記憶
    し、上記概念間は概念同士の包摂関係によつて階
    層化され、かつ、概念間は一般的な関係にて当該
    概念間を定義した一般関係、または固有の関係に
    て当該概念間を定義した具体関係によつて記述さ
    れることを特徴とする文書フアイリングシステ
    ム。 2 特許請求の範囲第1項において、上記知識ベ
    ースは、少なくとも概念固有番号と概念名称を記
    憶する第1の記憶手段を備えたことを特徴とする
    文書フアイリングシステム。 3 特許請求の範囲第2項において、上記知識ベ
    ースは、少なくとも概念の包摂関係のリストを記
    憶する第2の記憶手段を備えたことを特徴とする
    文書フアイリングシステム。 4 特許請求の範囲第3項において、上記知識ベ
    ースは、少なくとも一般関係のリストを記憶する
    第3の記憶手段を備えたことを特徴とする文書フ
    アイリングシステム。 5 特許請求の範囲第4項において、上記知識ベ
    ースは、少なくとも具体関係のリストを記憶する
    第4の記憶手段を備えたことを特徴とする文書フ
    アイリングシステム。 6 特許請求の範囲第1項において、上記知識ベ
    ースは、最上位の概念を根とした概念木を形成し
    て分類階層を構成し、その他の残りの概念は、直
    接的または間接的に上記最上位の概念に包摂され
    ており、上記一般関係は、第1の概念と第2の概
    念間のリンク、上記第1の概念と上記第2の概念
    に包摂される下位概念間のリンク、または上記第
    2の概念と上記第1の概念に包摂される下位概念
    間のリンクを定義し、上記具体関係は、上記第1
    の概念に包摂される下位概念と上記第2の概念に
    包摂される下位概念間のリンクを定義することを
    特徴とする文書フアイリングシステム。 7 特許請求の範囲第6項において、上記表示手
    段を含み、操作者と対話し指示を与える手段は、
    新しい概念を操作者が入力するとき、上記新しい
    概念の上位概念に対応する一般関係に基づいて生
    成される概念フレームを表示することを特徴とす
    る文書フアイリングシステム。 8 情報を入力する手段と、 上記情報を知識ベースとして記憶する手段と、 上記知識ベースを管理する手段と、 表示手段を含み、操作者と対話し指示を与える
    手段と、 操作者が入力した断片的またはあいまいな情報
    に基づき上記知識ベースを用いて所望の情報を検
    索する手段と、 検索された情報を表示する表示手段とを備え、 上記知識ベースは、事物を表す複数の概念と、
    それらの概念間を結び付ける関係によつて記述さ
    れた知識を記憶し、最上位の概念を根とした概念
    木を形成して分類階層を構成し、その他の残りの
    概念は、直接的または間接的に上記最上位の概念
    に包摂される包摂関係によつて記述され、概念間
    は一般的な関係にて当該概念間を定義した一般関
    係、または固有の関係にて当該概念間を定義した
    具体関係によつて記述され、上記一般関係は、第
    1の概念と第2の概念間のリンク、上記第1の概
    念と上記第2の概念に包摂される下位概念間のリ
    ンク、または上記第2の概念と上記第1の概念に
    包摂される下位概念間のリンクを定義し、上記具
    体関係は、上記第1の概念に包摂される下位概念
    と上記第2の概念に包摂される下位概念間のリン
    クを定義することを特徴とする情報記憶検索シス
    テム。
JP60060678A 1985-03-27 1985-03-27 文書ファイリングシステム及び情報記憶検索システム Granted JPS61220027A (ja)

Priority Applications (10)

Application Number Priority Date Filing Date Title
JP60060678A JPS61220027A (ja) 1985-03-27 1985-03-27 文書ファイリングシステム及び情報記憶検索システム
DE3650736T DE3650736T2 (de) 1985-03-27 1986-03-25 Informationswiederauffindungsverfahren
EP94114719A EP0638870B1 (en) 1985-03-27 1986-03-25 Information retrieval method
EP86104083A EP0196064B1 (en) 1985-03-27 1986-03-25 System for information storage and retrieval
DE3650417T DE3650417T2 (de) 1985-03-27 1986-03-25 Informationsaufzeichnungs- und Wiederauffindungssystem.
US06/844,123 US4868733A (en) 1985-03-27 1986-03-26 Document filing system with knowledge-base network of concept interconnected by generic, subsumption, and superclass relations
US07/430,241 US5553226A (en) 1985-03-27 1989-10-30 System for displaying concept networks
US07/831,093 US5404506A (en) 1985-03-27 1992-02-10 Knowledge based information retrieval system
US07/947,536 US5696916A (en) 1985-03-27 1992-09-21 Information storage and retrieval system and display method therefor
US08/141,039 US5555408A (en) 1985-03-27 1993-10-25 Knowledge based information retrieval system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60060678A JPS61220027A (ja) 1985-03-27 1985-03-27 文書ファイリングシステム及び情報記憶検索システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP4070593A Division JPH0727532B2 (ja) 1992-03-27 1992-03-27 情報検索方法及びシステム

Publications (2)

Publication Number Publication Date
JPS61220027A JPS61220027A (ja) 1986-09-30
JPH0584538B2 true JPH0584538B2 (ja) 1993-12-02

Family

ID=13149215

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60060678A Granted JPS61220027A (ja) 1985-03-27 1985-03-27 文書ファイリングシステム及び情報記憶検索システム

Country Status (4)

Country Link
US (1) US4868733A (ja)
EP (2) EP0638870B1 (ja)
JP (1) JPS61220027A (ja)
DE (2) DE3650736T2 (ja)

Families Citing this family (140)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5553226A (en) * 1985-03-27 1996-09-03 Hitachi, Ltd. System for displaying concept networks
JP2997469B2 (ja) * 1988-01-11 2000-01-11 株式会社日立製作所 自然言語理解方法および情報検索装置
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
GB2190772A (en) * 1986-05-05 1987-11-25 David Martin Menne Data storage/retrieval
GB2196764A (en) * 1986-10-30 1988-05-05 Apple Computer Hierarchical file system
JPS6438866A (en) * 1987-08-05 1989-02-09 Hitachi Ltd Document editing device
JPS6474629A (en) * 1987-09-16 1989-03-20 Toshiba Corp Inference device
IN170793B (ja) * 1987-12-18 1992-05-23 Hitachi Ltd
JPH021057A (ja) * 1988-01-20 1990-01-05 Ricoh Co Ltd 文書検索装置
JP3020500B2 (ja) * 1988-01-29 2000-03-15 株式会社日立製作所 メモ情報を持つデータベースシステム及びメモ情報の管理方法
GB2217488B (en) * 1988-04-14 1992-03-11 Racal Data Communications Inc Network diagnostic and management apparatus providing improved information display
US5214779A (en) * 1988-06-30 1993-05-25 International Business Machines Corporation Variable construct representation embedded in data stream which references definition for dynamically generating data used in processing the data stream
US5345587A (en) * 1988-09-14 1994-09-06 Digital Equipment Corporation Extensible entity management system including a dispatching kernel and modules which independently interpret and execute commands
US5115504A (en) * 1988-11-01 1992-05-19 Lotus Development Corporation Information management system
US5179718A (en) * 1988-11-29 1993-01-12 International Business Machines Corporation Method of filing having a directed relationship through defining a staple relationship within the context of a folder document
US5101345A (en) * 1988-11-29 1992-03-31 International Business Machines Inc. Method of filing stapled documents with a staple relationship involving one or more application programs
US5193185A (en) * 1989-05-15 1993-03-09 David Lanter Method and means for lineage tracing of a spatial information processing and database system
US5020019A (en) * 1989-05-29 1991-05-28 Ricoh Company, Ltd. Document retrieval system
US5159667A (en) * 1989-05-31 1992-10-27 Borrey Roland G Document identification by characteristics matching
JP2823268B2 (ja) * 1989-10-31 1998-11-11 株式会社東芝 情報処理装置
JPH03164832A (ja) * 1989-11-22 1991-07-16 Toshiba Corp フレーム構造を有する推論システムにおける継承情報の格納方法
US5752016A (en) * 1990-02-08 1998-05-12 Hewlett-Packard Company Method and apparatus for database interrogation using a user-defined table
US5257185A (en) * 1990-05-21 1993-10-26 Ann W. Farley Interactive, cross-referenced knowledge system
US5309359A (en) * 1990-08-16 1994-05-03 Boris Katz Method and apparatus for generating and utlizing annotations to facilitate computer text retrieval
US5404295A (en) * 1990-08-16 1995-04-04 Katz; Boris Method and apparatus for utilizing annotations to facilitate computer retrieval of database material
JP2895184B2 (ja) * 1990-08-22 1999-05-24 株式会社日立製作所 文書処理システム及び文書処理方法
JPH04281567A (ja) * 1991-03-11 1992-10-07 Agency Of Ind Science & Technol 検索装置
JPH04281568A (ja) * 1991-03-11 1992-10-07 Agency Of Ind Science & Technol 検索装置
US5293552A (en) * 1991-04-08 1994-03-08 U.S. Philips Corporation Method for storing bibliometric information on items from a finite source of text, and in particular document postings for use in a full-text document retrieval system
US5276885A (en) * 1991-04-18 1994-01-04 Carnegie Group Single step mapping in topological order of the queued class and instance frames of a semantic network to a static working memory
US5694590A (en) * 1991-09-27 1997-12-02 The Mitre Corporation Apparatus and method for the detection of security violations in multilevel secure databases
JPH05197756A (ja) * 1991-12-09 1993-08-06 Ricoh Co Ltd 文書検索装置
US5321609A (en) * 1992-05-27 1994-06-14 Franklin Electronic Publishers, Incorporated Electronic encyclopedia
US5598557A (en) * 1992-09-22 1997-01-28 Caere Corporation Apparatus and method for retrieving and grouping images representing text files based on the relevance of key words extracted from a selected file to the text files
JPH06176081A (ja) * 1992-12-02 1994-06-24 Hitachi Ltd 階層構造ブラウジング方法およびその装置
US5594837A (en) * 1993-01-29 1997-01-14 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US5878406A (en) * 1993-01-29 1999-03-02 Noyes; Dallas B. Method for representation of knowledge in a computer as a network database system
US5544352A (en) * 1993-06-14 1996-08-06 Libertech, Inc. Method and apparatus for indexing, searching and displaying data
JP3053153B2 (ja) * 1993-09-20 2000-06-19 株式会社日立製作所 文書管理システムのアプリケーション起動方法
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
JP3526595B2 (ja) * 1993-10-29 2004-05-17 富士通株式会社 情報管理機構
US6339767B1 (en) * 1997-06-02 2002-01-15 Aurigin Systems, Inc. Using hyperbolic trees to visualize data generated by patent-centric and group-oriented data processing
US5761496A (en) * 1993-12-14 1998-06-02 Kabushiki Kaisha Toshiba Similar information retrieval system and its method
US5586252A (en) * 1994-05-24 1996-12-17 International Business Machines Corporation System for failure mode and effects analysis
CA2148028A1 (en) * 1994-05-25 1995-11-26 Deborah L. Mcguinness Knowledge base management system with dependency information for procedural tests
GB2293667B (en) * 1994-09-30 1998-05-27 Intermation Limited Database management system
US5684985A (en) 1994-12-15 1997-11-04 Ufil Unified Data Technologies Ltd. Method and apparatus utilizing bond identifiers executed upon accessing of an endo-dynamic information node (EDIN)
US6029160A (en) * 1995-05-24 2000-02-22 International Business Machines Corporation Method and means for linking a database system with a system for filing data
GB2302420A (en) * 1995-06-19 1997-01-15 Ibm Semantic network
US5721902A (en) * 1995-09-15 1998-02-24 Infonautics Corporation Restricted expansion of query terms using part of speech tagging
US6112199A (en) * 1995-10-18 2000-08-29 Nelson; Paul M. Data item values
US5842203A (en) * 1995-12-01 1998-11-24 International Business Machines Corporation Method and system for performing non-boolean search queries in a graphical user interface
US5832495A (en) * 1996-07-08 1998-11-03 Survivors Of The Shoah Visual History Foundation Method and apparatus for cataloguing multimedia data
JP3198932B2 (ja) * 1996-08-02 2001-08-13 松下電器産業株式会社 文書検索装置
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US5937400A (en) * 1997-03-19 1999-08-10 Au; Lawrence Method to quantify abstraction within semantic networks
CN1212578C (zh) * 1997-06-04 2005-07-27 盖瑞·L·夏普 用于在计算机系统中创建信息数据库的方法
US6278990B1 (en) 1997-07-25 2001-08-21 Claritech Corporation Sort system for text retrieval
DE19737939A1 (de) * 1997-08-30 1999-03-04 Steiner Ralf Dr Verfahren und Datenstruktur zur rechnergestützten Verwaltung von Entwicklungen
JP3283040B2 (ja) 1997-12-19 2002-05-20 ビーエイイー システムズ パブリック リミテッド カンパニー 重み付けなしニューラル技術を利用したデジタル信号フィルタ
US7711672B2 (en) * 1998-05-28 2010-05-04 Lawrence Au Semantic network methods to disambiguate natural language meaning
US6778970B2 (en) * 1998-05-28 2004-08-17 Lawrence Au Topological methods to organize semantic network data flows for conversational applications
US20070294229A1 (en) * 1998-05-28 2007-12-20 Q-Phrase Llc Chat conversation methods traversing a provisional scaffold of meanings
US8396824B2 (en) * 1998-05-28 2013-03-12 Qps Tech. Limited Liability Company Automatic data categorization with optimally spaced semantic seed terms
EP0962873A1 (en) * 1998-06-02 1999-12-08 International Business Machines Corporation Processing of textual information and automated apprehension of information
US6282531B1 (en) * 1998-06-12 2001-08-28 Cognimed, Llc System for managing applied knowledge and workflow in multiple dimensions and contexts
US6792430B1 (en) * 1998-07-29 2004-09-14 Qwest Communications International Information organization and navigation by user-generated associative overlays
US7209928B2 (en) * 1998-07-29 2007-04-24 Qwest Communications International Inc. Information organization and navigation by user-generated associative overlays
US7716060B2 (en) 1999-03-02 2010-05-11 Germeraad Paul B Patent-related tools and methodology for use in the merger and acquisition process
US7966328B2 (en) 1999-03-02 2011-06-21 Rose Blush Software Llc Patent-related tools and methodology for use in research and development projects
US6513027B1 (en) * 1999-03-16 2003-01-28 Oracle Corporation Automated category discovery for a terminological knowledge base
US6584464B1 (en) 1999-03-19 2003-06-24 Ask Jeeves, Inc. Grammar template query system
DE19914326A1 (de) * 1999-03-30 2000-10-05 Delphi 2 Creative Tech Gmbh Verfahren zur Nutzung von fraktalen semantischen Netzen für alle Arten von Datenbank-Anwendungen
EP1041499A1 (en) * 1999-03-31 2000-10-04 International Business Machines Corporation File or database manager and systems based thereon
AU763131B2 (en) 1999-07-09 2003-07-17 Acularo Pty Ltd Methods of organising information
US6408292B1 (en) * 1999-08-04 2002-06-18 Hyperroll, Israel, Ltd. Method of and system for managing multi-dimensional databases using modular-arithmetic based address data mapping processes on integer-encoded business dimensions
US6385604B1 (en) 1999-08-04 2002-05-07 Hyperroll, Israel Limited Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements
US6816857B1 (en) * 1999-11-01 2004-11-09 Applied Semantics, Inc. Meaning-based advertising and document relevance determination
DE19960372A1 (de) * 1999-12-14 2001-06-21 Definiens Ag Verfahren zur Verarbeitung von Datenstrukturen
FR2802731B1 (fr) * 1999-12-16 2002-01-25 Schneider Electric Ind Sa Dispositif autonome de commande a distance, appareil et installation electrique comportant un tel dispositif
US6775663B1 (en) * 1999-12-17 2004-08-10 Si Han Kim Information coding and retrieval system and method thereof
US20020029207A1 (en) 2000-02-28 2002-03-07 Hyperroll, Inc. Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein
US6792418B1 (en) 2000-03-29 2004-09-14 International Business Machines Corporation File or database manager systems based on a fractal hierarchical index structure
US6556982B1 (en) * 2000-04-28 2003-04-29 Bwxt Y-12, Llc Method and system for analyzing and classifying electronic information
US7035864B1 (en) 2000-05-18 2006-04-25 Endeca Technologies, Inc. Hierarchical data-driven navigation system and method for information retrieval
US7617184B2 (en) 2000-05-18 2009-11-10 Endeca Technologies, Inc. Scalable hierarchical data-driven navigation system and method for information retrieval
US7062483B2 (en) * 2000-05-18 2006-06-13 Endeca Technologies, Inc. Hierarchical data-driven search and navigation system and method for information retrieval
US7325201B2 (en) * 2000-05-18 2008-01-29 Endeca Technologies, Inc. System and method for manipulating content in a hierarchical data-driven search and navigation system
DE10033021A1 (de) * 2000-07-07 2002-01-17 Definiens Ag Verfahren zur Verarbeitung Genetischer Datenstrukturen
EP1227410A1 (en) * 2001-01-30 2002-07-31 Bridgewell Incorporated Accessing a database using user-defined attributes
JP3842573B2 (ja) * 2001-03-30 2006-11-08 株式会社東芝 構造化文書検索方法、構造化文書管理装置及びプログラム
US7120646B2 (en) * 2001-04-09 2006-10-10 Health Language, Inc. Method and system for interfacing with a multi-level data structure
US20030120630A1 (en) * 2001-12-20 2003-06-26 Daniel Tunkelang Method and system for similarity search and clustering
US6999966B2 (en) * 2002-04-23 2006-02-14 International Business Machines Corporation Content management system and methodology for implementing a complex object using nested/recursive structures
US20030210249A1 (en) * 2002-05-08 2003-11-13 Simske Steven J. System and method of automatic data checking and correction
US7801361B2 (en) * 2002-10-15 2010-09-21 Definiens Ag Analyzing pixel data using image, thematic and object layers of a computer-implemented network structure
US7593909B2 (en) * 2003-03-27 2009-09-22 Hewlett-Packard Development Company, L.P. Knowledge representation using reflective links for link analysis applications
US7580947B2 (en) * 2003-03-27 2009-08-25 Hewlett-Packard Development Company, L.P. Data representation for improved link analysis
JPWO2004097679A1 (ja) * 2003-04-25 2006-07-13 ヒューレット−パッカード デベロップメント カンパニー エル.ピー. データベース装置及び作成方法、データベース検索装置及び検索方法
US20050028168A1 (en) * 2003-06-26 2005-02-03 Cezary Marcjan Sharing computer objects with associations
US20070061276A1 (en) * 2003-07-10 2007-03-15 Akira Sato Device and method for registering a plurality of types of information
US7428528B1 (en) 2004-03-31 2008-09-23 Endeca Technologies, Inc. Integrated application for manipulating content in a hierarchical data-driven search and navigation system
CA2465558A1 (en) 2004-04-22 2005-10-22 Ibm Canada Limited - Ibm Canada Limitee Framework for retrieval and display of large result sets
US20060036451A1 (en) * 2004-08-10 2006-02-16 Lundberg Steven W Patent mapping
US7590658B2 (en) 2004-09-30 2009-09-15 Deloitte Development Llc System, software and method for examining a database in a forensic accounting environment
JP2006120056A (ja) * 2004-10-25 2006-05-11 Hewlett-Packard Development Co Lp データベースシステムおよびその方法
WO2006128183A2 (en) 2005-05-27 2006-11-30 Schwegman, Lundberg, Woessner & Kluth, P.A. Method and apparatus for cross-referencing important ip relationships
FI20050779L (fi) * 2005-07-22 2007-01-23 Analyse Solutions Finland Oy Tiedonhallintamenetelmä ja -järjestelmä
US8161025B2 (en) 2005-07-27 2012-04-17 Schwegman, Lundberg & Woessner, P.A. Patent mapping
US8677377B2 (en) * 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US8019752B2 (en) 2005-11-10 2011-09-13 Endeca Technologies, Inc. System and method for information retrieval from object collections with complex interrelationships
US7890533B2 (en) * 2006-05-17 2011-02-15 Noblis, Inc. Method and system for information extraction and modeling
WO2008042974A2 (en) * 2006-10-03 2008-04-10 Qps Tech. Limited Liability Company Mechanism for automatic matching of host to guest content via categorization
US9165040B1 (en) 2006-10-12 2015-10-20 Google Inc. Producing a ranking for pages using distances in a web-link graph
WO2008055034A2 (en) * 2006-10-30 2008-05-08 Noblis, Inc. Method and system for personal information extraction and modeling with fully generalized extraction contexts
JP2008112934A (ja) * 2006-10-31 2008-05-15 Oki Electric Ind Co Ltd 半導体記憶装置及びその製造方法
US8565552B2 (en) * 2006-11-14 2013-10-22 Codonics, Inc. Assembling multiple medical images into a single film image
US8019134B2 (en) 2006-11-16 2011-09-13 Definiens Ag Automatic image analysis and quantification for fluorescence in situ hybridization
US8542899B2 (en) 2006-11-30 2013-09-24 Definiens Ag Automatic image analysis and quantification for fluorescence in situ hybridization
US8676802B2 (en) 2006-11-30 2014-03-18 Oracle Otc Subsidiary Llc Method and system for information retrieval with clustering
US7761473B2 (en) 2007-05-18 2010-07-20 Microsoft Corporation Typed relationships between items
US8126826B2 (en) * 2007-09-21 2012-02-28 Noblis, Inc. Method and system for active learning screening process with dynamic information modeling
US7856434B2 (en) 2007-11-12 2010-12-21 Endeca Technologies, Inc. System and method for filtering rules for manipulating search results in a hierarchical search and navigation system
US20100131513A1 (en) 2008-10-23 2010-05-27 Lundberg Steven W Patent mapping
US8285664B2 (en) 2009-11-03 2012-10-09 Clausal Computing Oy Semantic network with selective indexing
US8931039B2 (en) * 2010-05-24 2015-01-06 Datuit, Llc Method and system for a document-based knowledge system
US9904726B2 (en) 2011-05-04 2018-02-27 Black Hills IP Holdings, LLC. Apparatus and method for automated and assisted patent claim mapping and expense planning
US20130086080A1 (en) 2011-10-03 2013-04-04 Steven W. Lundberg System and method for information disclosure statement management and prior art cross-citation control
US9940363B2 (en) 2011-10-03 2018-04-10 Black Hills Ip Holdings, Llc Systems, methods and user interfaces in a patent management system
US11461862B2 (en) 2012-08-20 2022-10-04 Black Hills Ip Holdings, Llc Analytics generation for patent portfolio management
US9767190B2 (en) 2013-04-23 2017-09-19 Black Hills Ip Holdings, Llc Patent claim scope evaluator
US9367625B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Search query interactions on online social networks
US9367880B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Search intent for queries on online social networks
US9367536B2 (en) 2013-05-03 2016-06-14 Facebook, Inc. Using inverse operators for queries on online social networks
US9411905B1 (en) * 2013-09-26 2016-08-09 Groupon, Inc. Multi-term query subsumption for document classification
CN107924417B (zh) * 2015-08-26 2022-04-15 片山成仁 数据库管理装置及其方法
US10303771B1 (en) * 2018-02-14 2019-05-28 Capital One Services, Llc Utilizing machine learning models to identify insights in a document
IL258689A (en) 2018-04-12 2018-05-31 Browarnik Abel A system and method for computerized semantic indexing and searching
CN109918472A (zh) 2019-02-27 2019-06-21 北京百度网讯科技有限公司 存储和查询数据的方法、装置、设备和介质
CN113282689B (zh) * 2021-07-22 2023-02-03 药渡经纬信息科技(北京)有限公司 基于领域知识图谱的检索方法、装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254326A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 知識表現方式
JPS615344A (ja) * 1984-06-18 1986-01-11 Fujitsu Ltd 知識検索処理方式

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4318184A (en) * 1978-09-05 1982-03-02 Millett Ronald P Information storage and retrieval system and method
US4305131A (en) * 1979-02-05 1981-12-08 Best Robert M Dialog between TV movies and human viewers
US4420817A (en) * 1979-05-25 1983-12-13 Sharp Kabushiki Kaisha Word endings inflection means for use with electronic translation device
US4298957A (en) * 1979-06-28 1981-11-03 Xerox Corporation Data processing system with character sort apparatus
US4358824A (en) * 1979-12-28 1982-11-09 International Business Machines Corporation Office correspondence storage and retrieval system
US4384329A (en) * 1980-12-19 1983-05-17 International Business Machines Corporation Retrieval of related linked linguistic expressions including synonyms and antonyms
JPS583031A (ja) * 1981-06-30 1983-01-08 Fujitsu Ltd リレ−シヨナル・モデルにおけるジヨイン演算処理方式
US4606002A (en) * 1983-05-02 1986-08-12 Wang Laboratories, Inc. B-tree structured data base using sparse array bit maps to store inverted lists
US4611298A (en) * 1983-06-03 1986-09-09 Harding And Harris Behavioral Research, Inc. Information storage and retrieval system and method
US4575798A (en) * 1983-06-03 1986-03-11 International Business Machines Corporation External sorting using key value distribution and range formation
JPS603056A (ja) * 1983-06-21 1985-01-09 Toshiba Corp 情報整理装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60254326A (ja) * 1984-05-31 1985-12-16 Fujitsu Ltd 知識表現方式
JPS615344A (ja) * 1984-06-18 1986-01-11 Fujitsu Ltd 知識検索処理方式

Also Published As

Publication number Publication date
DE3650736D1 (de) 2000-02-03
EP0638870A1 (en) 1995-02-15
EP0196064A3 (en) 1989-11-15
DE3650417D1 (de) 1995-11-23
EP0638870B1 (en) 1999-12-29
DE3650417T2 (de) 1996-05-15
EP0196064A2 (en) 1986-10-01
DE3650736T2 (de) 2000-06-08
EP0196064B1 (en) 1995-10-18
JPS61220027A (ja) 1986-09-30
US4868733A (en) 1989-09-19

Similar Documents

Publication Publication Date Title
JPH0584538B2 (ja)
Chang et al. A survey of web information extraction systems
US6704739B2 (en) Tagging data assets
Chu Information representation and retrieval in the digital age
US7287029B1 (en) Tagging data assets
Langenhan et al. The fingerprint of architecture-sketch-based design methods for researching building layouts through the semantic fingerprinting of floor plans
JP2000276487A (ja) 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
Hoeber et al. Visualization support for interactive query refinement
Bouakkaz et al. OLAP textual aggregation approach using the Google similarity distance
Moreno et al. Supporting knowledge creation through has: The hyperknowledge annotation system
JPH05174066A (ja) 検索システム及びその画面表示方法
Hoeber et al. VisiQ: Supporting visual and interactive query refinement
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
Tansley The multimedia thesaurus: An aid for multimedia information retrieval and navigation
Anam et al. Schema mapping using hybrid ripple-down rules
CN111680222A (zh) 一种基于社交类平台的知识图谱的探索式搜索方法
ME Improving the performance of ontology based image retrieval using SPARQL query language and decision tree algorithm
Aras Semantic Interaction in Web-based Retrieval Systems
Tabata et al. An assertion-based information-probe system: Document-skeleton and glossary-skeleton approach
Koh et al. Deriving image-text document surrogates to optimize cognition
Cuna Subject access to images and exploratory search
CN117271795A (zh) 一种跨领域迁移的知识管理方法及知识库系统
El Amrani et al. Coping with information retrieval problems on the web: towards personal web weaver agents
McCool et al. Semantic Web Tools for Enhanced Authoring
Alperovich Sociopath: automatic local events extractor

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term