JP2001521664A - Knowledge broker using signed feature constraints - Google Patents
Knowledge broker using signed feature constraintsInfo
- Publication number
- JP2001521664A JP2001521664A JP54536198A JP54536198A JP2001521664A JP 2001521664 A JP2001521664 A JP 2001521664A JP 54536198 A JP54536198 A JP 54536198A JP 54536198 A JP54536198 A JP 54536198A JP 2001521664 A JP2001521664 A JP 2001521664A
- Authority
- JP
- Japan
- Prior art keywords
- document
- feature
- entity
- constraint
- relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims abstract description 43
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000012545 processing Methods 0.000 claims description 26
- 238000007639 printing Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 8
- 239000012634 fragment Substances 0.000 description 7
- 238000000926 separation method Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000004808 supercritical fluid chromatography Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- BDEDPKFUFGCVCJ-UHFFFAOYSA-N 3,6-dihydroxy-8,8-dimethyl-1-oxo-3,4,7,9-tetrahydrocyclopenta[h]isochromene-5-carbaldehyde Chemical compound O=C1OC(O)CC(C(C=O)=C2O)=C1C1=C2CC(C)(C)C1 BDEDPKFUFGCVCJ-UHFFFAOYSA-N 0.000 description 1
- 101100273890 Bacteroides fragilis (strain ATCC 25285 / DSM 2151 / CCUG 4856 / JCM 11019 / NCTC 9343 / Onslow) bfce gene Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000010432 diamond Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/02—Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
- G06F15/0225—User interface arrangements, e.g. keyboard, display; Interfaces to other computer systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3322—Query formulation using system suggestions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】 知識ブローカソフトウェアエージェントを実行する方法が、特徴制約を用いて表わされる知識リクエストを処理し、必要に応じてこのリクエストをサブリクエストに分解する。本発明は、「符号つき特徴制約」(SFC)と呼ばれる特徴制約の部分集合を使用し、各特徴制約は少なくとも一つの正の成分と負の成分を有し、これら正の成分と負の成分の各々は一つ以上の関係を含む。前記関係として分類関係および特徴関係などがある。このSFCを知識検索エンジンに用いることによって、共通言語で(1)知識検索リクエストと、(2)前記リクエストに対する回答と、(3)知識取得エージェント(ここでは知識ブローカとする)の状態と、を指定できる。また、SFCの解法が開示される。 (57) Abstract A method of executing a knowledge broker software agent processes knowledge requests represented using feature constraints and breaks the requests into sub-requests as needed. The present invention uses a subset of feature constraints, called "signed feature constraints" (SFC), where each feature constraint has at least one positive and negative component, and the positive and negative components Each include one or more relationships. The relation includes a classification relation and a characteristic relation. By using this SFC as a knowledge search engine, (1) a knowledge search request, (2) an answer to the request, and (3) a state of a knowledge acquisition agent (here, a knowledge broker) are described in a common language. Can be specified. Also disclosed is an SFC solution.
Description
【発明の詳細な説明】 符号つき特徴制約を用いた知識ブローカ この発明は、データ処理に関し、特に符号化された特徴制約を用いた情報また は知識のコンピュータ間での転送およびコンピュータによる取得に関する。 電子メール、インターネットアクセスおよびオンラインでの情報記録などの、 新たな電子情報源の利用が広まるにつれて、コンピュータのユーザが利用する電 子文書の数も増加しつつある。また、分散されている情報源上の情報にアクセス して組み合わせることにより動的に文書を作成することもできる。SGMLなど の階層的なマークアップ言語を用いることで、多様な内容を動的に満たして文書 テンプレートを作成することができる。さらに、文書管理システムに保存するこ とによって文書を永続化し、通常の文書のライフサイクルに組み入れることもで きる。 多種の文書管理システム上での電子文書の検索、取得、保存、および変換を標 準化する取り組みが行われ、このための文書管理協定(Document Management Al liance,DMA)工業規格が策定されている。 この規格にしたがって検索と取得を行うために知識仲介(brokerage)システ ムが実装され、この実装において知識ブローカが使用される。ブローカとは、知 識検索リクエストを処理するソフトウェアエージェントのことである。ここで知 識とは、公にアクセスできるようにされている電子情報全てを指すものとする。 また、配信可能な各種情報源は、ユーザのディレクトリ内の一ファイルからある サイトにローカルに設けられたデータベース、さらには、例えばインターネット 上の広域情報サービス(WAIS)まで利用できるものとする。 リクエストの受信時に、十分な知識を有していれば、ブローカがこのリクエス トを処理する。あるいは、ブローカはリクエストを処理するためにより多くの知 識を取得する必要がある。この知識取得のために、ブローカは他のブローカに向 けてサブリクエストを発信する。このように、知識取得は全ブローカの共同作業 (コラボレーション)で実施される。リクエストを処理するサービスプロバイダ と、サブリクエストを発信するサービスクライアントとがそれぞれブローカにな る。 前記共同作業を行うためには、各ブローカが相互に理解し合うことが最低限必 要である。つまり、全リクエスト(およびリクエストに対する全回答)を共通言 語で表現する必要があり、このことは、ブローカがローカルに翻訳を行う場合で あっても必要である。このための適切な言語は、論理学によって得られる。リク エストは、〈x,P〉対で表され、この表記は「式Pで表される特性があてはま るように知識オブジェクトxを取得せよ」ということを意味する。xは論理変数 であり、Pはxを含む論理式である。興味深いことに、このリクエストに対する 回答も同一の形式、すなわち〈x、Q〉対で表現され、この表記は「式Qで表さ れる特性を充足する知識オブジェクトxが存在する」ということを意味する。こ のとき、PがQの論理帰結であることが要求され、従って回答が少なくともリク エストと同程度の知識を含むようになる。また、同じ論理形式を用いてブローカ の範囲、すなわち関連する知識の範囲を取得することができる。つまり、範囲〈 x、R〉のブローカは「私は式Rで表現される属性を充足しない知識オブジェク トxを取得することはできない」ということを意味する。多くの場合、ブローカ の範囲は、外的要因または知識取得処理自体の影響で専門化、あるいは逆に許容 度を伸張するため、変動する。 換言すると、論理学によって、リクエスト、回答および範囲を表現できる共通 言語が得られる。ブローカはこれら三つの成分について論理操作を実行する。も っとも重要な論理操作は充足可能性の照合であり、これによって他の全ての論理 操作が再構築される。充足可能性の照合とは、あるオブジェクトが式で表現され る特性を充足するか、あるいは逆に本質的に矛盾したものであるか、を決定する ことである。残念ながら、周知のように完全な古典論理学においては、この操作 はアルゴリズム的でない。すなわち、処理が必ず終了するプログラムを実装する ことはほとんど不可能である。この制限を考慮した、知識表現の多くの研究が、 充足可能性をアルゴリズム的に決定可能な古典論理学のフラグメント(fragment )を識別することに集中して行われてきた。表現性と操作性とはトレードオフの 関係にあり、例えば空のフラグメントは明らかに操作性が高いが表現性はきわめ て 悪い。 これまでに解明されたもっとも一般的なフラグメントは「特徴制約」(FC) と呼ばれるものである。この場合の充足可能性の問題は「特徴制約解法(featur e constraint solving)」とも呼ばれる。 周知のように、特徴制約は、分類または特徴のいずれかの原子制約で構築され る。分類は単項関係であり、単一のエンティティの属性を表す。例えば、P:p ersonは、エンティティPが分類personからなることを表す。特徴は 二項関係であり、二つのエンティティをリンクする特性を表す。例えば、P:e mployer→Eは、エンティティPが従業員を有し、この従業員がエンティ ティEであることを表す。分類と特徴は別として、大半の特徴体系では、等価( equality)および非等価(disequality)などの組み込み関 係も考慮されている。 完全な特徴制約のフラグメントは、前述の原子成分を全論理結合記号(結合、 分離、否定および限定)によって結合することができるものであり、表現性は高 いが、操作性はきわめて悪い。単に否定と分離を禁じた、「基本特徴制約」(B FC)と呼ばれるサブフラグメントが検討されており、効率的な制約解法アルゴ リズムが、このサブフラグメントについて提案されている。しかしながらこのサ ブフラグメントでは、否定が全く用いられないため、知識ブローカが実行しよう とする操作の種類が著しく制約されるという問題点がある。 このため、上述の問題を解消した操作性の高い解法を得るための方法が必要と される。より高能力の、利用可能な操作集合をもつブローカを得るためのシステ ムが望まれる。 本発明は、プロセッサ、メモリ、およびユーザインタフェースを含むデータ処 理装置で実行される方法を提供する。ここでデータ処理装置はネットワーク中で 一つ以上の他のデータ処理装置に接続されており、当該データ処理装置の少なく とも一つは電子文書の記録領域を保持する手段を含む。この方法は、(a)特徴 制約を指示する少なくとも一つのユーザ入力を受信する工程であって、この特徴 制約は少なくとも一つの正の成分と負の成分とを含み、これら正の成分と負の成 分の各々は一つ以上の関係を含み、当該一つまたは各関係は文書に関するエンテ ィティとそのエンティティの属性を規定する工程と、(b)特徴制約を解いて、 正および負の成分から一つ以上の文書指示子を決定する工程であって、当該一つ または各文書指示子は特徴制約を充足する記録領域内の文書に対応する工程とを 含む。 また本発明は、プロセッサ、メモリ、およびユーザインタフェースを含むデー タ処理装置で実行される次の方法をさらに提供する。この方法は、(i)保存さ れた特徴制約に対応するグラフィカルオブジェクトを指示する第一のユーザ入力 を受信する工程であって、特徴制約は少なくとも一つの正の成分と負の成分とを 含み、これら正の成分と負の成分の各々は一つ以上の関係を含み、当該一つまた は各関係は文書に関するエンティティとそのエンティティの属性を規定する工程 と、(j)特徴制約が別のデータ処理装置に送信されるものであることを示す第 二のユーザ入力を受信する工程と、(k)特徴制約をデータパケットにエンコー ドする工程と、(l)データパケットを送信する工程とを含む。 これらの各方法はいずれも、複数の場所にある各々でのデータ処理装置に保持 された記録領域から知識を取得し、状況に応じて得られた個々の知識を組み合わ せて新しい文書を作成する工程を含む。 また本発明は、前述のあるいは添付した請求範囲のいずれかの方法を実行する ため、適切にプログラムされたデータ処理装置であって、プロセッサ、メモリ、 およびユーザインタフェースを含むデータ処理装置を提供する。 本発明により、さらに次のデータ処理装置が提供される。このデータ処理装置 は、プロセッサと、プロセッサに接続されたメモリと、プロセッサとメモリに接 続されてユーザの操作によりユーザ入力情報を発信できるようにされたユーザイ ンタフェースを含む。このデータ処理装置はネットワーク中で一つ以上の他のデ ータ処理装置に接続されており、該データ処理装置の少なくとも一つは電子文書 の記録領域を保持する手段を含み、さらにこのデータ処理装置は特徴制約を指示 する少なくとも一つのユーザ入力を受信する手段であって、特徴制約は少なくと も一つの正の成分と負の成分とを含み、これら正の成分と負の成分の各々は一つ 以上の関係を含み、当該一つまたは各関係は文書に関するエンティティとそのエ ンティティの属性を規定する手段と、特徴制約を解いて、正の成分と負の成分か ら一つ以上の文書指示子を決定する手段であって、当該一つまたは各文書指示子 は特徴制約を充足する記録領域内の文書に対応する手段とを含む。 また本発明は、添付した請求範囲の請求項19による、電子文書のアクセスま たは配信を行うシステムを提供する。 さらに本発明は、添付した請求範囲の請求項20による、電子文書のアクセス または配信を行う携帯型装置を提供する。 加えて本発明は、添付した請求範囲の請求項21による、文書のスキャン、複 写、および/あるいは印刷を行う装置を提供する。 本発明では、特徴制約の部分集合、すなわち「符号つき特徴制約」(SFC) 、およびSFCの解法を用いる。この解法の利点の一つに、SFCを知識取得エ ンジンに用いて、共通言語で(1)知識検索リクエスト、(2)当該リクエスト に対する回答、(3)知識取得エージェント(本明細書では知識ブローカとする )の状態を指定できることがある。 この共同作業を維持する上で必要なインフラストラクチャ、および知識を各ブ ローカ内に局所的に保存する方法については、Andreoli他著「制約に基づく知識 ブローカのモデル:セマンティクス、実行と解析」(J.Symbolic Computation,1 996年)に依るものとする。以下では、主として各ブローカ内で行われる知識操 作について記述する。 本発明の態様を、添付図を参照しながら例に基づいて説明する。 図1は、本発明の一態様の実装に使用されるデータ処理ネットワークを模式的 に示す図である。 図2は、符号つき特徴制約によって規定される範囲を模式的に示す図である。 図3は、クエリを行うユーザによる入力時の一瞬間における据置型コンピュー タのユーザインタフェースを示す図である。 図4は、図3のインタフェースを用いてクエリ要素を入力するステップを模式 的に示すフローチャートである。 図5は、本発明の別の態様において、ユーザの使用に適したクエリ入力用の用 紙の書式を示す図である。 図6は、図5の用紙書式を用いてクエリ要素を入力するステップを模式的に示 すフローチャートである。 図7は、特徴制約を用いて文書指示子を取得し、対応する文書を表示または印 刷するステップを模式的に示すフローチャートである。 図8は、図7の処理で得られたヒットのリストの一部を示す図である。 図9は、図8のリストから選択されたヒットのHTML書式への変換後の表示 状態を示す図である。 図10は、選択された一つのヒットをより詳細に示す図である。 1.システムハードウェア 明らかに、本発明はローカルエリアネットワーク(LAN)あるいは好適には 広域ネットワーク(WAN)のいずれかの従来のコンピュータネットワーク技術 を用いて実装することができる。本発明の実施形態においては、クロスプラット フォーム通信およびインターネットを通じた文書転送を行うソフトとして(ネッ トスケープなどの)従来のウェブブラウザソフトウェアを用いた。この態様を図 1に模式的に示す。ネットワーク21の一部を形成する各装置2,4,6は、周 知のWindows(商標)を実行するPC、MacOSを実行するMac、あ るいはUNIXを実行するミニコンピュータのいずれでもよいことは明らかであ る。例えば、PCのハードウェア構成については、P.HorowitzおよびW.Hill著「 Art of Electronics」第2版(Cambridge University Press刊、1989年)の10 章に詳細に記載されている。ただし、明らかに本発明は他のシステム構成によっ て実行することもできる(欧州特許出願第691,619号(以下EP’619 とする)参照)。(典型的なネットワーク構成については、例えば欧州特許出願 第772,857号、および(米国特許出願番号第08/668,704号に対 応する)欧州特許出願第 号に詳細に記載されている。) 装置22でユーザがリクエストすると、装置26に保存された文書が取得され 、インターネット上で装置26から複数の中継機24を介して装置22に送信さ れる。周知の如く、文書はワールドワイドウェブのURLを特定の識別子として 用いて取得される(EP’619に記載あり)。またEP’619に記載されて いるように、好適には複数のプリンタあるいは(スキャナ、印刷、およびファク シ ミリ機能等をもつ)多機能装置(図示せず)もまたネットワーク21に接続され る。多機能装置については欧州特許出願第741,487号に詳細に記載されて いる。ネットワークに接続される各装置は、携帯型コンピュータとの通信に適し た公知のハードウェアとソフトウェアとを備えている。この携帯型コンピュータ としては、個人用携帯端末(personal digital assist ants)(PDA)、ハンドヘルドPC、またはポケット型もしくは腕時計型 コンピュータなどがある。このようにして、携帯型コンピュータのユーザから受 信されるデータパケットに応じて、リクエストを行う装置がリクエストを生成す る。さらに詳細については、本明細書と同時出願された英国特許出願第9708 175.6号(リファレンスR/97005)に基づく国際特許出願第 号 に記載されている。 2.特徴制約の原理 上述のように、完全な特徴制約のフラグメントは、原子成分を全ての論理結合 記号(結合、分離、否定および限定)によって結合することができるものであり 、表現性は高いが、操作性はきわめて悪い。単に否定と分離とを禁止した、「基 本特徴制約」(BFC)と呼ばれるサブフラグメントが検討されており、効率的 な制約解法アルゴリズムが、このサブフラグメント用として提案されている。し かしながらこのサブフラグメントでは、否定が全く用いられないため,知識ブロ ーカが実行しようとする操作の種類が著しく制約されるという問題点がある。 好適な実施形態において、本発明では「範囲分割」と称する,否定の使用に依 拠した能力の高い操作を用いる。実際には、ブローカが、式Fで表現される判断 カは、自己の範囲をBFC X X:book X:year→Y Y>1950 で表される「1950年より後に書かれた本」、およびその余りである「19 50年より前に書かれた本、あるいは本以外の文書」の二つの新しい範囲に分割 しようとする。後者の範囲は、否定と分離なしでは表現することができないため BFCによって表現することはできない。範囲分割操作は多くの場合において有 用であることが明らかにされており、例えば、生存中に集めた情報を記憶および 再利用する能力をもつブローカを実行する場合において有用である。本発明の実 施の形態では、一方で「符号つき特徴制約」(SFC)と呼ばれる特徴制約のフ ラグメントを利用し、他方で効率的なSFCの制約解法を用いる。このSFCは 否定を限定的に使用するものであり、前述の分割された範囲の種類を精密に表現 することができる。 2.1 符号つき特徴制約 符号つき特徴制約は、ともに基本特徴制約である,正の部分および負の部分の リストからなる。例えば、次の符号つき特徴制約、 P +P:person, P:employer→E, E:“Xerox” −P:nationality→N, N:“American” −P:spouse→P’ P’:person P’:employer→E’ E’:“Xerox” は、米国人以外で、かつ他のXerox従業員と結婚していないXerox従 業員を指定する。このことを図2に図式的に示す。丸枠はエンティティ(論理変 数)を表す。分類関係(単項)は角枠内に分類名を表示されており、破線矢印で 示されている。特徴関係(二項)は角枠内に特徴名を表示されており、実線矢印 で示されている。組み込み述部(この例には存在しない)は菱形で示す。SFC の正の部分は上欄に含まれ、特別のエンティティ範囲(本例ではP)であること が二重の丸枠により明示されている。SFCの負の部分はグレーの下欄に含まれ ている。 SFCの主な特長は次の特性、すなわち、 ブローカの範囲がSFCe0で表され、かつこの範囲がBFCeで分割される ならば、得られた二つの分割範囲e+,e-は共にSFCである、という特性に基 づく。 実際には、e+はe0の正の部分をBFCeと併合することによって得られ、e- は、eを単独で含む新しい負の部分を用いてe0を伸張することによって得られ る。例えば、アメリカ人以外の著者が書いた芸術関係の各種文書(本、ビデオ他 )を含む、書誌データベース関係のブローカを仮定すると、このブローカはSF CX +X:topic→T T:“Art” −X:author→A A:nationality→N N:“American” で表される。このSFCは「1950年より後に書かれた本」という制約で分 割することができ、この制約はBFC X X:book X:year→Y Y>1950 で表される。得られた範囲は簡明に X +X:book x:topic→T X:year→Y T:“Art” Y>1950 −X:author→A A:nationality→N N:“American” と表され、この表記は、「アメリカ人以外の著者によって1950年より後に 書かれた芸術関係の本」ということを意味する。また X +X:topic→T T:“Art” −X:author→A A:nationality→N N:“American” −X:book X:year→Y Y>1950 と表した場合は、「アメリカ人以外の著者が書いた1950年より後の芸術関 係の文書であって、本以外の文書」ということを意味する。 2.2 符号化された特徴制約の解法 大半の制約体系は、分類や特徴の性質について体系公理と呼ばれるいくつかの 仮定を設けている。これら公理は、特徴制約が矛盾している場合および充足可能 である場合を決定するものであるため、充足可能性アルゴリズムにとって重要で ある。 2.2.1 特徴公理 簡明のために、ここで開示する実施形態ではAit-Kaci H.他著「含意を用いた 論理プログラミング用の特徴に基づく制約体系」(Theoretical Computer Scien ce 122,pp.263-283,1994年)に使用されている基本公理体系を若干改変して用い る。ただし当業者にとって明らかなように、本方法の原理は他の公理集合にも 同様に適用できる。 1.特徴は関数である。つまり、同一の特徴で制約される二つのエンティティ 対が同一の第一項をもつならば、両エンティティ対は同一の第二項をもつ。例え ば、配偶者という特徴は(特定の文化環境において)関数である。このことは一 人の人間は二人の配偶者をもつことはできないことを意味する。つまり、ある人 物Xにおいて、X:spouse→YおよびX:spouse→Zの二つの関係 があるとすると、エンティティYとエンティティZは一致する(すなわち同一人 物を指す)。他の体系では多値の特徴を許す。 2.分類は互いに素である。つまり、二つの異なる分類からなるエンティティ は存在しない。例えば、本は人物ではない、すなわちX:bookおよびX:p ersonの二つの関係をもつエンティティXはあり得ない。他のシステムでは 分類の階層構造が考慮されており、エンティティのいくつかは階層内で共通の要 素を有する限り複数の分類をもち得る。 3.「値(value)」分類と呼ばれる、特別の分類のサブセットがあり、 これによって同じ値の分類からなる二つの異なるエンティティは存在しないよう にされる。伝統的基本要素(文字列、数字他)は典型的な値分類である。例えば 、文字列「Xerox」や数字「1950」は値分類である。値分類が特徴をも つことはなく、分類と特徴の結合だけのための公理である。他の体系では分類と 特徴間のより高度な結合が考慮されている。 4.(分類と特徴を含む)伝統的合同公理をもつ、特別な組み込み二値述語と して等価がある。他の全ての組み込み述語を記述する公理は、分類と特徴につい ての記述を含まないものとする。 以上の公理を、本明細書末尾の付録中の段落A:公理に公式の書式で示す。こ れら公理は理論Tの構成要素となるものである。 2.2.2 制約充足 先ず、組み込み述語上での充足可能性は可解とする。つまり、組み込み述語の みを用いた式Fがあるとすると(Fは組み込み制約とも呼ばれる)、Fが理論T の論理帰結(├τFで表す)であるかどうかを決定することのできるアルゴリズ ムが存在する。 BFC上での制約充足は、BFC上の一連の条件付き書き換え規則(付録のセ クションB.1参照)で定義される。この書き換え規則は次の特性をもつ。 (a)規則体系は収束的であり、したがってBFCの「標準形式」を定義する 。体系が「チャーチロッサ」(クリティカルペア収束)および「ネータリアン」 (項サイズが書き換え毎に確実に減少する)であることを検証することにより、 上記内容を古典的方法で表すことができる。 (b)BFCは、当該BFCの標準形式が矛盾に至ることがなければ、及びそ のときに限って充足可能である。ある含意は、書き換えステップが充足可能性を 保つことを示すことによって証明される。反対の含意は、矛盾に至ることがない 標準形式をもつBFCを充足するモデルを示すことによって証明される。 このようにして、書き換え規則により制約充足アルゴリズムのステップが記述 される。書き換え規則体系は収束的であるため、このアルゴリズムは必ず終了す る。重要なことは、この規則の定義が、可解とされている組み込み制約の充足可 能性テストに依拠していることである。つまり、このアルゴリズムはモジュール 方式であり、適正な組み込み制約の充足アルゴリズムが与えられる限り、あらゆ る種類の組み込み制約を取り込むことができる。 制約充足アルゴリズムの書き換え規則は、リスプやプロローグのような記号言 語を用いて簡単に実装することができる、あるいは使用される特定の組み込み制 約の特性を考慮して最適化することができる。 SFC上での制約充足のためのアルゴリズム(付録のセクションB.2参照) は、簡略には次のように記述される。あるSFCにおいて、最初に正の成分がB FCのアルゴリズムによって正規化される。結果が矛盾していれば、SFC全体 が充足不能である。矛盾していなければ、(正規化された)正の成分が負の成分 の各々に挿入された後、当該負の成分がBFCのアルゴリズムによって正規化さ れる。得られた負の成分が矛盾した標準形式を有していればその成分は削除され 、トートロジ的な標準形式を有していればSFC全体が充足不能とされる。この ようにして得られたSFCの標準形式は次の性質をもつ、すなわち、 SFCは、そのSFCの標準形式が矛盾に至ることがなければ、およびそのと きに限って充足可能である。前述の場合のように、含意の困難な部分はモデル理 論を用いて証明される。 3.特徴制約を用いたユーザトランザクション 図3は、クエリを行うユーザによる入力時の一瞬間における据置型コンピュー タのユーザインタフェースを示す図である。専用ウィンドウ内に、主クエリ入力 ボックス30が周知の形式で表示される。例えば、ユーザは、「「制約」を含み 、「インターネット」を含まない表題の、1990年より後の本または記事」と いう1行のクエリを入力しようとする。クエリボックス30は、ボックス31, 32を含む。ユーザは、このボックス31,32をマウスで選択し、これらボッ クスにタイプ入力を行う、すなわちクエリ要素(例えば「本/記事」など)を全 て入力する。また、ボタン33を用いて、例えば「表題」と表題に付加される、 次を含まない等の制約等、文書に関するエンティティを選択することができる。 ボタン34,36が付加されており、これによって、ユーザは、クエリの再開、 追加、編集、および形成を行うことができる。クエリの各要素が最新のクエリ特 定内容に順次追加され、最新の状態でボックス37に表示される。クエリの特定 内容が完成すると、ボタン38が押され、検索が開始される。 図4は、図3のインタフェースを用いてクエリ要素(例えば90年より後の日 付など)を入力するステップを模式的に示すフローチャートである。まず、知識 ブローカの主クエリウインドウが表示される(ステップs41)。次いで、クエ リの各要素がユーザのキー入力にしたがって順に受信される(s42)。ユーザ が各クエリ要素を確認すると、「現在の特定内容」が表示された各要素を含むも のに更新される(s43)。クエリの特定が終了し、ユーザが図3の「提出(s ubmit)」ボタンを選択すると、各クエリ要素は対応する論理関係に変換さ れる(s44)(前述のセクション2参照)。この後、特徴制約が論理関係の集 合によってコンパイルされる(s45)。 図5に、本発明の別の実施形態における、ユーザによるクエリ入力に適した用 紙の形式50を示す。この実施形態は、多機能装置のユーザ、あるいはコンピュ ータに接続されたスキャナをもつユーザに適したものである。使用される書式5 0には複数の欄51,52,53,54が備わり、この欄を用いてユーザは、文 書の種類、著者名、日付、および特記事項等の情報を入力することができる。た だし、任意の数の欄を用いて、ユーザが希望する任意の種類の文書に関する情報 を入力できることは明らかである。周知のように、この場合、人間が判読できる 字句で指示された各選択部の隣に枠が備わり、ユーザがこの枠をチェックすると 機械読み取りによって選択が判別されるようにすることもできる。また、手書き の情報入力用の枠(55,56,57)を用いてもよい。あるいは、クエリ全体 がタイプ入力または手書き形式で用紙に記入され、クエリの内容をOCRおよび 、必要であれば手書き認識装置によって入力するようにすることもできる。 図6は、図5の書式を用いてクエリ要素を入力するステップを模式的に示すフ ローチャートである。最初に、用紙のスキャンが行われ、用紙に記入された内容 に対応するビットマップ化された画像データファイルが保存される(ステップs 60)。次に、ボックス55〜58に対応する位置で画像データについての解析 が行われ、ボックスがチェックされているかどうか、あるいはボックスに記入さ れた情報の抽出についての解析がなされる(s61)。次いで、各欄51〜54 において指定されるクエリ要素が決定される(s62)。この時必要であれば、 手書き認識装置およびOCRが使用される(s63)。この後、各クエリ要素が 対応する論理関係に変換され(前述のセクション2参照)、論理関係の集合によ って特徴制約がコンパイルされる(s65)。 図7は、特徴制約を用いて文書指示子を取得し、対応する文書を表示または印 刷するステップを模式的に示すフローチャートである。この操作は、従来のコン ピュータまたは多機能装置あるいはユーザインタフェースを備えたプリンタによ って実行される。最初に、ユーザからFCが受信される。周知のようにこのFC は、例えば図8に示したように携帯型コンピュータのユーザからデータパケット の形式で送信される、あるいはユーザがキーボードとマウス、またはタッチスク リーンを操作することで装置に直接入力される。適当な入力によるユーザの指示 に応じて、FCは前述のセクション3に記載された処理により解かれ、それによ り得られた適当な形式のリクエストがサーチエンジンに送られる(s92)。こ のサーチリクエストを用いて、該FCを充足する文書が検索可能な全記録領域か ら検索され(s93)、リクエストは必要に応じて、Andreoli他著「制約に基づ く知識ブローカモデル:セマンティクス、実行と解析」(J.Symbolic computati on,1996年)に詳述されているサブリクエストに細分化される。 サーチエンジンによって(FCを充足する文書の)ヒットのリストが得られる と、図8に示すように、このヒットのリストが表示される(s94)。次いで、 適当なユーザ入力に応じて、個々のヒットの文書細部の拡大表示、文書情報のH TML書式への変換、あるいは記録領域からの文書のダウンロード等の操作が実 行される(s95)。 図9に、図8のリストから選択されたヒットのHTML書式への変換後の表示 状態を示す。図に示すように、各ヒットについて、著者名、http_url、 情報源、および表題などの追加情報が表示される。所望により、ユーザは表示さ れたhttp_url上をマウスクリックすることによってヒット1に相当する 文書を見ることができる。得られた文書は必要に応じて印刷される(s96)。 図10に、選択された一つのヒットについてのより詳細な表示、すなわち一連 の文書属性を示す。図に示すように、複数の属性に対応して、これら属性に関す る情報を提供する追加頁へのリンクを行う複数のURLが表示される。 付録 A 体系公理 次の三つの公理のセットがある。 特徴と種類の特定公理 τ,τ’が任意の分類を表し、fが任意の特徴を表すとする。 等号の合同公理 pは任意の組み込み述語を表す。伝統的な合同公理は:組み込み述語公理 この公理が分類および特徴の記述を行うことはない。例えば、非同等は で公理化される。 優位の制約は で公理化される。 組み込み述語、>,≦,≧、は<および等号によって規定される。 B 制約充足 B.1 BFCの場合 BFCは〈B|Γ〉対で表される。Bは組み込み制約であり、Γは分類および 特徴制約の順序なしリストである(結合的に読む)。⊥は矛盾を表す。 二つの書き換え規則のセットがある。次の規則はBFCの単純化に対応する。 次の規則は矛盾の検出に対応する。 次の特性がこのアルゴリズムの正当性を裏付ける。 B.2 SFCの場合 SFCは、符号(+または−)付けされたBFCの順序なしリストとして表さ れ、一つかつ唯一の成分が正と定義する。SをSFCとする。S*のSFC標準 形式をSnと書き、これは次のアルゴリズムで与えられる。 c0をSの正の成分のBFC標準形式とするとき、 もし、c0=⊥ならば ⊥を返す そうでなければ、 c0は、〈Bo|Γo〉の形式 {〈Br|Γi〉}i=1,...,nをSの負の成分とする i=1,...,nの各々について もし、ci=<B|Γ>かつ├τBかつΓが空であるようなi∈1,...,nが存在 すれば、 ⊥を返す そうでなければ、 I={ci≠⊥であるようなi∈1,...,n}とする 次の特性がこのアルゴリズムの正当性を裏付ける。 Description: TECHNICAL FIELD The present invention relates to data processing, and more particularly to the transfer of information or knowledge between computers and the acquisition by computers using encoded feature constraints. As the use of new electronic sources, such as e-mail, Internet access, and online information recording, becomes widespread, the number of electronic documents used by computer users is also increasing. In addition, a document can be dynamically created by accessing and combining information on distributed information sources. By using a hierarchical markup language such as SGML, it is possible to dynamically satisfy various contents and create a document template. Further, by storing the document in a document management system, the document can be made permanent and can be incorporated into a normal document life cycle. Efforts have been made to standardize the retrieval, retrieval, storage, and conversion of electronic documents on a variety of document management systems, and the Document Management Alliance (DMA) industry standard has been developed for this. A knowledge brokerage system is implemented for searching and obtaining according to this standard, in which a knowledge broker is used. A broker is a software agent that processes knowledge search requests. Here, knowledge refers to all electronic information that is made publicly accessible. Various information sources that can be distributed can be used from a file in the user's directory to a database provided locally at a certain site, and further to a wide area information service (WAIS) on the Internet, for example. Upon receipt of the request, the broker processes the request, provided that it has sufficient knowledge. Alternatively, the broker needs to acquire more knowledge to process the request. To acquire this knowledge, the broker sends a sub-request to another broker. As described above, knowledge acquisition is performed by collaboration of all brokers. The service provider that processes the request and the service client that sends the sub-request are brokers. In order to perform the above-mentioned joint work, it is necessary that the brokers understand each other at a minimum. That is, all requests (and all responses to requests) must be expressed in a common language, even if the broker translates locally. A suitable language for this is obtained by logic. The request is represented by an <x, P> pair, and this notation means that “acquire the knowledge object x so that the property represented by the expression P applies”. x is a logical variable, and P is a logical expression containing x. Interestingly, the answer to this request is also expressed in the same form, i.e., <x, Q> pairs, which means that "there is a knowledge object x that satisfies the property represented by equation Q". . At this time, P is required to be a logical consequence of Q, so the answer will contain at least as much knowledge as the request. Further, the range of the broker, that is, the range of the related knowledge can be acquired using the same logical format. In other words, the broker in the range <x, R> means that "I cannot acquire the knowledge object x that does not satisfy the attribute represented by the expression R." In many cases, the range of brokers varies due to specialization due to external factors or the knowledge acquisition process itself, or conversely, to increase tolerance. In other words, logic provides a common language in which requests, answers and ranges can be expressed. The broker performs logical operations on these three components. The most important logical operation is the check of satisfiability, which reconstructs all other logical operations. Matching satisfiability refers to determining whether an object satisfies the property represented by an expression or, conversely, is essentially inconsistent. Unfortunately, in well-known classical logic, this operation is not algorithmic. That is, it is almost impossible to implement a program that always ends the processing. Considering this limitation, much research on knowledge representation has focused on identifying fragments of classical logic that can algorithmically determine satisfiability. There is a trade-off between expressiveness and operability. For example, an empty fragment has clearly high operability but extremely poor expressiveness. The most common fragment elucidated so far is called the "feature constraint" (FC). The satisfiability problem in this case is also called "feature constraint solving". As is well known, feature constraints are constructed with either class or feature atomic constraints. Classification is a unary relation, representing the attributes of a single entity. For example, P: person indicates that the entity P is composed of the classification person. Features are binary relations and represent the property of linking two entities. For example, P: employer → E indicates that entity P has an employee, and this employee is entity E. Apart from classification and features, most feature systems also take into account built-in relationships such as equality and disequality. A fragment of a perfect feature constraint is one in which the above-mentioned atomic components can be connected by all logical connection symbols (connection, separation, negation and restriction), and is highly expressive but extremely poor in operability. A subfragment called "Basic Feature Constraint" (BFC), which simply forbids negation and separation, is being considered, and an efficient constraint solving algorithm has been proposed for this subfragment. However, since no negation is used in this sub-fragment, there is a problem that the type of operation that the knowledge broker attempts to execute is significantly restricted. For this reason, a method for obtaining a solution with high operability that solves the above-mentioned problem is required. A system for obtaining a broker with a higher capacity, available operation set is desired. The present invention provides a method performed on a data processing device that includes a processor, a memory, and a user interface. Here, the data processing device is connected to one or more other data processing devices in the network, and at least one of the data processing devices includes a unit that holds a recording area of the electronic document. The method comprises the steps of (a) receiving at least one user input indicating a feature constraint, the feature constraint including at least one positive component and a negative component, wherein the positive component and the negative component are included. Each of the components includes one or more relationships, each or each relationship defining an entity for the document and attributes of the entity; and (b) solving the feature constraint to obtain one of the positive and negative components. The step of determining the above-mentioned document designator, wherein the one or each document designator includes a process corresponding to a document in a recording area satisfying the characteristic constraint. The present invention further provides the following method executed in a data processing device including a processor, a memory, and a user interface. The method includes: (i) receiving a first user input indicating a graphical object corresponding to a stored feature constraint, wherein the feature constraint includes at least one positive component and a negative component; Each of these positive and negative components includes one or more relationships, where the one or each relationship defines an entity for the document and the attributes of the entity; Receiving a second user input indicating that it is to be transmitted to the device; (k) encoding the feature constraint into a data packet; and (l) transmitting the data packet. In each of these methods, a process of acquiring knowledge from a recording area held in a data processing device at each of a plurality of places and combining individual knowledge obtained according to a situation to create a new document including. The present invention also provides a data processing device, suitably programmed to perform the method of any of the foregoing or appended claims, including a processor, a memory, and a user interface. According to the present invention, the following data processing device is further provided. The data processing device includes a processor, a memory connected to the processor, and a user interface connected to the processor and the memory and capable of transmitting user input information by a user operation. The data processing device is connected to one or more other data processing devices in a network, at least one of the data processing devices includes a unit for holding a recording area of the electronic document, and the data processing device further includes: A means for receiving at least one user input indicating a feature constraint, wherein the feature constraint includes at least one positive component and a negative component, each of the positive and negative components being one or more. Means including relations, the or each relation defining an entity for the document and attributes of the entity, and means for solving feature constraints to determine one or more document indicators from positive and negative components. And the one or each document designator includes means corresponding to a document in the recording area satisfying the feature constraint. The present invention also provides a system for accessing or delivering an electronic document according to claim 19 of the appended claims. The invention further provides a portable device for accessing or delivering electronic documents according to claim 20 of the accompanying claims. In addition, the present invention provides an apparatus for scanning, copying and / or printing a document according to claim 21 of the accompanying claims. We use a subset of feature constraints, namely "signed feature constraints" (SFC), and the solution of SFC. One of the advantages of this solution is that, using SFC as a knowledge acquisition engine, (1) a knowledge search request, (2) an answer to the request, and (3) a knowledge acquisition agent (in this specification, a knowledge broker and May be specified. See Andreoli et al., "A Model of Constraint-Based Knowledge Brokers: Semantics, Execution and Analysis," by Andreoli et al., For the infrastructure required to maintain this collaboration, and how to store knowledge locally within each broker. Symbolic Computation, 1996). The following describes mainly the knowledge operations performed in each broker. Embodiments of the invention will now be described by way of example with reference to the accompanying drawings. FIG. 1 is a diagram schematically illustrating a data processing network used to implement one aspect of the present invention. FIG. 2 is a diagram schematically illustrating a range defined by a signed feature constraint. FIG. 3 is a diagram illustrating a user interface of the stationary computer at a moment when an input is made by a user who performs a query. FIG. 4 is a flowchart schematically showing a step of inputting a query element using the interface of FIG. FIG. 5 is a diagram showing a form of a query input sheet suitable for use by a user according to another embodiment of the present invention. FIG. 6 is a flowchart schematically showing steps of inputting a query element using the paper format of FIG. FIG. 7 is a flowchart schematically showing a step of acquiring a document designator using a feature constraint and displaying or printing a corresponding document. FIG. 8 is a diagram showing a part of a list of hits obtained by the processing of FIG. FIG. 9 is a diagram showing a display state after the hit selected from the list in FIG. 8 is converted into the HTML format. FIG. 10 is a diagram showing one selected hit in more detail. 1. System Hardware Clearly, the present invention can be implemented using conventional computer network technology, either a local area network (LAN) or, preferably, a wide area network (WAN). In the embodiment of the present invention, conventional web browser software (such as Netscape) is used as software for performing cross-platform communication and document transfer via the Internet. This embodiment is schematically shown in FIG. It is clear that each of the devices 2, 4, and 6 forming a part of the network 21 may be any of a PC running Windows (trademark), a Mac running MacOS, and a minicomputer running UNIX. . For example, the hardware configuration of a PC is described in detail in Chapter 10 of P. Horowitz and W. Hill, "Art of Electronics," Second Edition (Cambridge University Press, 1989). However, it is clear that the invention can also be implemented with other system configurations (see European Patent Application No. 691,619 (hereinafter EP'619)). (For typical network configurations see, for example, European Patent Application No. 772,857 and European Patent Application No. 08 / 668,704). No. In more detail. When a user makes a request at the device 22, a document stored in the device 26 is obtained and transmitted from the device 26 to the device 22 via the plurality of repeaters 24 on the Internet. As is well known, documents are obtained using the URL of the World Wide Web as a specific identifier (described in EP'619). Also, as described in EP'619, preferably a plurality of printers or multi-function devices (not shown) having scanner, printing and facsimile functions are also connected to the network 21. Multifunctional devices are described in detail in European Patent Application 741,487. Each device connected to the network includes known hardware and software suitable for communication with the portable computer. The portable computer includes a personal digital assistant (PDA), a handheld PC, or a pocket or wristwatch computer. In this way, the requesting device generates the request in response to the data packet received from the portable computer user. For further details, see International Patent Application No. based on UK Patent Application No. 9708 175.6 (reference R / 97005) filed concurrently with this specification. No. It is described in. 2. Principle of Feature Constraint As described above, a fragment of a complete feature constraint is one in which atomic components can be connected by all logical connection symbols (bond, separation, negation and limitation), and is highly expressive. Operability is extremely poor. A subfragment called "Basic Feature Constraint" (BFC), which simply prohibits negation and separation, is being considered, and an efficient constraint solving algorithm has been proposed for this subfragment. However, since no negation is used in this subfragment, there is a problem that the type of operation that the knowledge broker attempts to execute is significantly restricted. In a preferred embodiment, the present invention uses a sophisticated operation that relies on the use of negation, referred to as "range partitioning." In effect, the broker determines the decision expressed in equation F The mosquito has its own range of BFCXX: bookX: year → YY> 1950, "the book written after 1950", and the remainder, "the book written before 1950". Book or non-book document ". The latter range cannot be expressed by BFCs because it cannot be expressed without negation and separation. Range splitting operations have proven useful in many cases, for example, when running a broker capable of storing and reusing information gathered during its lifetime. Embodiments of the present invention use fragments of feature constraints called “signed feature constraints” (SFC) on the one hand, and use efficient SFC constraint solving methods on the other hand. This SFC uses negation in a limited manner, and can accurately represent the types of the above-mentioned divided ranges. 2.1 Signed Feature Constraints A signed feature constraint consists of a list of positive and negative parts, both of which are basic feature constraints. For example, the following signed feature constraint: P + P: person, P: employer → E, E: “Xerox” −P: nationality → N, N: “American” −P: spouse → P ′ P ′: person P ′ : Employer → E ′ E ′: “Xerox” specifies a Xerox employee who is not American and is not married to another Xerox employee. This is shown schematically in FIG. Circles represent entities (logical variables). The classification relation (unary) has a classification name displayed in a square frame, and is indicated by a dashed arrow. The feature relationship (binary) has a feature name displayed in a square frame, and is indicated by a solid arrow. Built-in predicates (not present in this example) are indicated by diamonds. The positive part of the SFC is included in the top column, and is marked by a double circle to indicate a special entity range (P in this example). The negative part of the SFC is included in the lower gray box. The main features of the SFC are the following characteristics, ie, the range of the broker is 0 And if this range is divided by BFCE, the two divided ranges e obtained + , E - Are both SFCs. In practice, e + Is e 0 Obtained by merging the positive part of - Is calculated using a new negative part containing e alone 0 By stretching. For example, assuming a broker related to a bibliographic database including various art-related documents (books, videos, etc.) written by non-American authors, this broker is SF CX + X: topic → TT: “Art” −X : Author → AA A: nationality → NN: “American”. This SFC can be divided by the constraint of “book written after 1950”, and this constraint is expressed by BFCXX: bookX: year → YY> 1950. The obtained range is simply expressed as X + X: book x: topic → TX: year → Y T: “Art” Y> 1950 −X: author → AA: Nationality → NN: “American” The notation means "art book written after 1950 by a non-American author". X + X: topic → TT: “Art” −X: author → AA: nationality → NN: “American” −X: book X: year → YY> 1950 Is an art-related document after 1950, written by the author, and is a document other than a book. " 2.2 Solving Encoded Feature Constraints Most constraint systems make some assumptions about the nature of classification and features, called system axioms. These axioms are important for satisfiability algorithms because they determine when feature constraints are inconsistent and satisfiable. 2.2.1 Feature Axiom For simplicity, in the embodiments disclosed herein, Ait-Kaci H. et al., "A Constraint System Based on Features for Logic Programming Using Implications" (Theoretical Computer Science 122, pp. 147-64). 263-283, 1994). However, as will be apparent to those skilled in the art, the principles of the method are equally applicable to other axiom sets. 1. Features are functions. That is, if two entity pairs constrained by the same feature have the same first term, then both entity pairs have the same second term. For example, a spouse feature is a function (in a particular cultural environment). This means that one human cannot have two spouses. That is, assuming that a certain person X has two relations of X: spouse → Y and X: spouse → Z, the entities Y and Z match (that is, indicate the same person). Other schemes allow multivalued features. 2. Classification is disjoint. That is, there is no entity with two different classifications. For example, a book is not a person, that is, there cannot be an entity X with two relationships, X: book and X: person. Other systems consider the hierarchical structure of the classifications, and some of the entities may have multiple classifications as long as they have common elements in the hierarchy. 3. There is a special subset of classifications, called "value" classifications, so that there are no two different entities of the same value classification. Traditional primitives (strings, numbers, etc.) are typical value classes. For example, a character string “Xerox” or a number “1950” is a value classification. Value classification has no features, it is an axiom only for the combination of classification and features. Other systems allow for a higher degree of coupling between classification and features. 4. Equivalence is as a special built-in binary predicate that has a traditional joint axiom (including classification and features). Axioms describing all other built-in predicates shall not include descriptions of classifications and features. The above axiom is shown in an official form in Paragraph A: Axiom in the Appendix at the end of this specification. These axioms are components of theory T. 2.2.2 Constraint Satisfaction First, satisfiability on embedded predicates is solvable. That is, if there is an expression F using only the built-in predicate (F is also called a built-in constraint), F is a logical consequence of the theory T (T τ F)). Constraint satisfaction on the BFC is defined by a series of conditional rewrite rules on the BFC (see Appendix B.1). This rewrite rule has the following properties. (A) The rule system is convergent and thus defines the "standard form" of BFC. By verifying that the system is "Church Rossa" (critical pair convergence) and "Noetherian" (term size decreases steadily with each rewrite), the above can be expressed in a classical way. (B) A BFC is satisfiable if and only if the standard form of the BFC does not lead to inconsistency. One implication is proved by showing that the rewriting step remains satisfiable. The opposite implication is proved by showing a model that satisfies the BFC with a standard format that does not lead to inconsistencies. In this way, the steps of the constraint satisfaction algorithm are described by the rewriting rules. Since the rewriting rule system is convergent, this algorithm always ends. Importantly, the definition of this rule relies on the test of satisfiability of built-in constraints that are solvable. In other words, this algorithm is modular, and can incorporate all kinds of built-in constraints as long as an appropriate built-in constraint satisfaction algorithm is given. The rules for rewriting the constraint satisfaction algorithm can be easily implemented using a symbolic language such as Lisp or Prolog, or can be optimized taking into account the characteristics of the particular built-in constraints used. The algorithm for constraint satisfaction on the SFC (see section B.2 in the Appendix) is briefly described as follows. In some SFCs, the positive component is first normalized by the BFC algorithm. If the results are inconsistent, the entire SFC is unsatisfiable. If not inconsistent, after the (normalized) positive component is inserted into each of the negative components, the negative components are normalized by the BFC algorithm. If the obtained negative component has an inconsistent standard format, the component is deleted. If the negative component has a totological standard format, the entire SFC is unsatisfiable. The standard form of the SFC obtained in this way has the following properties: the SFC is satisfiable if and only if the standard form of the SFC does not lead to inconsistencies. As in the previous case, the difficult parts are proved using model theory. 3. User Transaction Using Feature Constraints FIG. 3 is a diagram showing a user interface of a stationary computer at a moment when an input is made by a querying user. The main query input box 30 is displayed in a well-known format in the dedicated window. For example, a user attempts to enter a one-line query for a book or article after 1990 with a title that includes "constraints" but does not include "Internet." The query box 30 includes boxes 31 and 32. The user selects the boxes 31 and 32 with a mouse and performs a type input in these boxes, that is, inputs all the query elements (for example, “book / article”). Further, using the button 33, it is possible to select an entity relating to the document, such as “title” and restrictions added to the title, such as not including the following. Buttons 34 and 36 are added so that the user can resume, add, edit, and form queries. Each element of the query is sequentially added to the latest query specification, and is displayed in the box 37 in the latest state. When the specific contents of the query are completed, the button 38 is pressed and the search is started. FIG. 4 is a flowchart schematically showing a step of inputting a query element (for example, a date after 90 years) using the interface of FIG. First, the main query window of the knowledge broker is displayed (step s41). Next, each element of the query is sequentially received according to the user's key input (s42). When the user confirms each query element, the "current specific content" is updated to include the displayed element (s43). When the query has been specified and the user selects the "submit" button in FIG. 3, each query element is converted to a corresponding logical relationship (s44) (see section 2 above). Thereafter, the feature constraint is compiled by a set of logical relationships (s45). FIG. 5 shows a paper format 50 suitable for a query input by a user according to another embodiment of the present invention. This embodiment is suitable for a user of a multi-function device or a user with a scanner connected to a computer. The format 50 used includes a plurality of fields 51, 52, 53, 54, which allow the user to enter information such as the type of document, author name, date, and special notes. . However, it should be apparent that any number of fields can be used to enter information about any type of document desired by the user. As is well known, in this case, a frame may be provided next to each of the selection units designated by human-readable lexical characters, and when the user checks this frame, the selection may be determined by machine reading. Further, a frame (55, 56, 57) for handwritten information input may be used. Alternatively, the entire query can be entered on a form in a typed or handwritten form, and the contents of the query can be entered by the OCR and, if necessary, the handwriting recognition device. FIG. 6 is a flowchart schematically showing steps of inputting a query element using the format of FIG. First, the paper is scanned, and a bit-mapped image data file corresponding to the content written on the paper is stored (step s60). Next, the image data is analyzed at positions corresponding to the boxes 55 to 58, and whether the box is checked or the extraction of the information written in the box is analyzed (s61). Next, the query element specified in each of the columns 51 to 54 is determined (s62). At this time, if necessary, a handwriting recognition device and an OCR are used (s63). Thereafter, each query element is converted to a corresponding logical relationship (see section 2 above), and the feature constraint is compiled by the set of logical relationships (s65). FIG. 7 is a flowchart schematically showing a step of acquiring a document designator using a feature constraint and displaying or printing a corresponding document. This operation is performed by a conventional computer or a multi-function device or a printer with a user interface. First, an FC is received from a user. As is well known, this FC is transmitted in the form of a data packet from a portable computer user, for example, as shown in FIG. 8, or directly input to the device by operating the keyboard and mouse or the touch screen. Is done. In response to the user's instruction with the appropriate input, the FC is resolved by the process described in section 3 above, and the resulting request in the appropriate format is sent to the search engine (s92). Using this search request, documents satisfying the FC are searched from all recordable search areas (s93), and the request is made as necessary by Andreoli et al., "Knowledge broker model based on constraints: semantics, execution and analysis." (J. Symbolic Computation, 1996). When a list of hits (of documents satisfying FC) is obtained by the search engine, the list of hits is displayed as shown in FIG. 8 (s94). Next, in response to an appropriate user input, operations such as enlarged display of document details of each hit, conversion of document information to HTML format, or download of a document from a recording area are performed (s95). FIG. 9 shows a display state of the hit selected from the list of FIG. 8 after conversion into the HTML format. As shown, additional information such as author name, http_url, information source, and title is displayed for each hit. If desired, the user can view the document corresponding to hit 1 by clicking the mouse on the displayed http_url. The obtained document is printed as needed (s96). FIG. 10 shows a more detailed display of one selected hit, that is, a series of document attributes. As shown in the figure, a plurality of URLs for linking to an additional page providing information on these attributes are displayed corresponding to the plurality of attributes. Appendix A System axioms There are three sets of axioms: Specific axioms of features and types τ and τ ′ represent arbitrary classifications, and f represents an arbitrary feature. The joint axiom of equality p represents any built-in predicate. The traditional joint axiom is: Built-in predicate axiom This axiom does not describe classifications and features. For example, unequal Axiomized by The dominant constraint is Axiomized by The built-in predicates,>, ≤, ≥, are defined by <and the equal sign. B. Constraint satisfaction 1 In the case of BFC BFC is represented by a <B | Γ> pair. B is a built-in constraint and Γ is an unordered list of classification and feature constraints (read jointly). ⊥ indicates contradiction. There are two sets of rewrite rules. The following rules correspond to the simplification of BFC. The following rules correspond to conflict detection. The following properties support the validity of this algorithm. B. 2. Case of SFC The SFC is represented as an unordered list of BFCs with a sign (+ or-), and one and only component is defined as positive. Let S be SFC. S * Is written as Sn, which is given by the following algorithm: When c0 is the BFC standard format of the positive component of S, if c0 = ⊥, return ⊥. Otherwise, c0 is <B o | Γ o 〉 Form {〈B r | Γ i >} I = 1,. . . , N is the negative component of S For each i = 1, ..., n If i = 1, ..., n such that ci = <B | Γ> and ├τB and Γ is empty, return ⊥. Otherwise, I = {ci ≠ ⊥ I∈1, ..., n} The following properties support the validity of this algorithm.
Claims (1)
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB9708172.3 | 1997-04-23 | ||
GBGB9708172.3A GB9708172D0 (en) | 1997-04-23 | 1997-04-23 | Knowledge brokers using signed feature constraints |
PCT/IB1998/000758 WO1998048361A1 (en) | 1997-04-23 | 1998-04-23 | Knowledge brokers using signed feature constraints |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001521664A true JP2001521664A (en) | 2001-11-06 |
Family
ID=10811192
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP54536198A Pending JP2001521664A (en) | 1997-04-23 | 1998-04-23 | Knowledge broker using signed feature constraints |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP0985184A1 (en) |
JP (1) | JP2001521664A (en) |
GB (1) | GB9708172D0 (en) |
WO (1) | WO1998048361A1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6381598B1 (en) | 1998-12-22 | 2002-04-30 | Xerox Corporation | System for providing cross-lingual information retrieval |
US6434546B1 (en) | 1998-12-22 | 2002-08-13 | Xerox Corporation | System and method for transferring attribute values between search queries in an information retrieval system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5862321A (en) * | 1994-06-27 | 1999-01-19 | Xerox Corporation | System and method for accessing and distributing electronic documents |
-
1997
- 1997-04-23 GB GBGB9708172.3A patent/GB9708172D0/en not_active Ceased
-
1998
- 1998-04-23 WO PCT/IB1998/000758 patent/WO1998048361A1/en active Application Filing
- 1998-04-23 EP EP98917545A patent/EP0985184A1/en not_active Ceased
- 1998-04-23 JP JP54536198A patent/JP2001521664A/en active Pending
Also Published As
Publication number | Publication date |
---|---|
EP0985184A1 (en) | 2000-03-15 |
WO1998048361A1 (en) | 1998-10-29 |
GB9708172D0 (en) | 1997-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6778979B2 (en) | System for automatically generating queries | |
US6820075B2 (en) | Document-centric system with auto-completion | |
US6732090B2 (en) | Meta-document management system with user definable personalities | |
US6928425B2 (en) | System for propagating enrichment between documents | |
US7133862B2 (en) | System with user directed enrichment and import/export control | |
US7769757B2 (en) | System for automatically generating queries | |
US7117432B1 (en) | Meta-document management system with transit triggered enrichment | |
US20050022114A1 (en) | Meta-document management system with personality identifiers | |
US20030074352A1 (en) | Database query system and method | |
US20060053174A1 (en) | System and method for data extraction and management in multi-relational ontology creation | |
JPH11306171A (en) | Item information input method and recording medium | |
US7020670B1 (en) | Document constraint descriptors obtained from user signals indicating attribute-value relations | |
Fadele et al. | A novel Hadith authentication mobile system in Arabic to Malay language translation for android and iOS Phones | |
JP2002511165A (en) | Acquisition and distribution of document information based on feature constraints | |
JP2001521664A (en) | Knowledge broker using signed feature constraints | |
Zhang et al. | Weighted ontology-based search exploiting semantic similarity | |
Zhang et al. | Harnessing the wisdom of the crowds for accurate web page clipping | |
Müller | Inducing conceptual user models | |
JP2010282403A (en) | Document retrieval method | |
Gottron | Content extraction-identifying the main content in HTML documents. | |
Casteleyn et al. | Exploiting Link Types during the Web Site Design Process to Enhance Usability of Web Sites | |
Sajja | Knowledge Representation Using Fuzzy XML Rules in Web-Based Expert System for Medical Diagnosis | |
Snyder et al. | An overview of CARAT: a computer assisted research and analysis tool | |
Chalise | Sabbiu Shah (070/BCT/531) Sagar Adhikari (070/BCT/533) Samip Subedi (070/BCT/536) | |
Liu | A process-based search engine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050419 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080527 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080826 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20081028 |