JP2001521664A - Knowledge broker using signed feature constraints - Google Patents

Knowledge broker using signed feature constraints

Info

Publication number
JP2001521664A
JP2001521664A JP54536198A JP54536198A JP2001521664A JP 2001521664 A JP2001521664 A JP 2001521664A JP 54536198 A JP54536198 A JP 54536198A JP 54536198 A JP54536198 A JP 54536198A JP 2001521664 A JP2001521664 A JP 2001521664A
Authority
JP
Japan
Prior art keywords
document
feature
entity
constraint
relationship
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP54536198A
Other languages
Japanese (ja)
Inventor
ジャン マルク アンドレオリ
ウベ ボルグホッフ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JP2001521664A publication Critical patent/JP2001521664A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/02Digital computers in general; Data processing equipment in general manually operated with input through keyboard and computation using a built-in program, e.g. pocket calculators
    • G06F15/0225User interface arrangements, e.g. keyboard, display; Interfaces to other computer systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 知識ブローカソフトウェアエージェントを実行する方法が、特徴制約を用いて表わされる知識リクエストを処理し、必要に応じてこのリクエストをサブリクエストに分解する。本発明は、「符号つき特徴制約」(SFC)と呼ばれる特徴制約の部分集合を使用し、各特徴制約は少なくとも一つの正の成分と負の成分を有し、これら正の成分と負の成分の各々は一つ以上の関係を含む。前記関係として分類関係および特徴関係などがある。このSFCを知識検索エンジンに用いることによって、共通言語で(1)知識検索リクエストと、(2)前記リクエストに対する回答と、(3)知識取得エージェント(ここでは知識ブローカとする)の状態と、を指定できる。また、SFCの解法が開示される。 (57) Abstract A method of executing a knowledge broker software agent processes knowledge requests represented using feature constraints and breaks the requests into sub-requests as needed. The present invention uses a subset of feature constraints, called "signed feature constraints" (SFC), where each feature constraint has at least one positive and negative component, and the positive and negative components Each include one or more relationships. The relation includes a classification relation and a characteristic relation. By using this SFC as a knowledge search engine, (1) a knowledge search request, (2) an answer to the request, and (3) a state of a knowledge acquisition agent (here, a knowledge broker) are described in a common language. Can be specified. Also disclosed is an SFC solution.

Description

【発明の詳細な説明】 符号つき特徴制約を用いた知識ブローカ この発明は、データ処理に関し、特に符号化された特徴制約を用いた情報また は知識のコンピュータ間での転送およびコンピュータによる取得に関する。 電子メール、インターネットアクセスおよびオンラインでの情報記録などの、 新たな電子情報源の利用が広まるにつれて、コンピュータのユーザが利用する電 子文書の数も増加しつつある。また、分散されている情報源上の情報にアクセス して組み合わせることにより動的に文書を作成することもできる。SGMLなど の階層的なマークアップ言語を用いることで、多様な内容を動的に満たして文書 テンプレートを作成することができる。さらに、文書管理システムに保存するこ とによって文書を永続化し、通常の文書のライフサイクルに組み入れることもで きる。 多種の文書管理システム上での電子文書の検索、取得、保存、および変換を標 準化する取り組みが行われ、このための文書管理協定(Document Management Al liance,DMA)工業規格が策定されている。 この規格にしたがって検索と取得を行うために知識仲介(brokerage)システ ムが実装され、この実装において知識ブローカが使用される。ブローカとは、知 識検索リクエストを処理するソフトウェアエージェントのことである。ここで知 識とは、公にアクセスできるようにされている電子情報全てを指すものとする。 また、配信可能な各種情報源は、ユーザのディレクトリ内の一ファイルからある サイトにローカルに設けられたデータベース、さらには、例えばインターネット 上の広域情報サービス(WAIS)まで利用できるものとする。 リクエストの受信時に、十分な知識を有していれば、ブローカがこのリクエス トを処理する。あるいは、ブローカはリクエストを処理するためにより多くの知 識を取得する必要がある。この知識取得のために、ブローカは他のブローカに向 けてサブリクエストを発信する。このように、知識取得は全ブローカの共同作業 (コラボレーション)で実施される。リクエストを処理するサービスプロバイダ と、サブリクエストを発信するサービスクライアントとがそれぞれブローカにな る。 前記共同作業を行うためには、各ブローカが相互に理解し合うことが最低限必 要である。つまり、全リクエスト(およびリクエストに対する全回答)を共通言 語で表現する必要があり、このことは、ブローカがローカルに翻訳を行う場合で あっても必要である。このための適切な言語は、論理学によって得られる。リク エストは、〈x,P〉対で表され、この表記は「式Pで表される特性があてはま るように知識オブジェクトxを取得せよ」ということを意味する。xは論理変数 であり、Pはxを含む論理式である。興味深いことに、このリクエストに対する 回答も同一の形式、すなわち〈x、Q〉対で表現され、この表記は「式Qで表さ れる特性を充足する知識オブジェクトxが存在する」ということを意味する。こ のとき、PがQの論理帰結であることが要求され、従って回答が少なくともリク エストと同程度の知識を含むようになる。また、同じ論理形式を用いてブローカ の範囲、すなわち関連する知識の範囲を取得することができる。つまり、範囲〈 x、R〉のブローカは「私は式Rで表現される属性を充足しない知識オブジェク トxを取得することはできない」ということを意味する。多くの場合、ブローカ の範囲は、外的要因または知識取得処理自体の影響で専門化、あるいは逆に許容 度を伸張するため、変動する。 換言すると、論理学によって、リクエスト、回答および範囲を表現できる共通 言語が得られる。ブローカはこれら三つの成分について論理操作を実行する。も っとも重要な論理操作は充足可能性の照合であり、これによって他の全ての論理 操作が再構築される。充足可能性の照合とは、あるオブジェクトが式で表現され る特性を充足するか、あるいは逆に本質的に矛盾したものであるか、を決定する ことである。残念ながら、周知のように完全な古典論理学においては、この操作 はアルゴリズム的でない。すなわち、処理が必ず終了するプログラムを実装する ことはほとんど不可能である。この制限を考慮した、知識表現の多くの研究が、 充足可能性をアルゴリズム的に決定可能な古典論理学のフラグメント(fragment )を識別することに集中して行われてきた。表現性と操作性とはトレードオフの 関係にあり、例えば空のフラグメントは明らかに操作性が高いが表現性はきわめ て 悪い。 これまでに解明されたもっとも一般的なフラグメントは「特徴制約」(FC) と呼ばれるものである。この場合の充足可能性の問題は「特徴制約解法(featur e constraint solving)」とも呼ばれる。 周知のように、特徴制約は、分類または特徴のいずれかの原子制約で構築され る。分類は単項関係であり、単一のエンティティの属性を表す。例えば、P:p ersonは、エンティティPが分類personからなることを表す。特徴は 二項関係であり、二つのエンティティをリンクする特性を表す。例えば、P:e mployer→Eは、エンティティPが従業員を有し、この従業員がエンティ ティEであることを表す。分類と特徴は別として、大半の特徴体系では、等価( equality)および非等価(disequality)などの組み込み関 係も考慮されている。 完全な特徴制約のフラグメントは、前述の原子成分を全論理結合記号(結合、 分離、否定および限定)によって結合することができるものであり、表現性は高 いが、操作性はきわめて悪い。単に否定と分離を禁じた、「基本特徴制約」(B FC)と呼ばれるサブフラグメントが検討されており、効率的な制約解法アルゴ リズムが、このサブフラグメントについて提案されている。しかしながらこのサ ブフラグメントでは、否定が全く用いられないため、知識ブローカが実行しよう とする操作の種類が著しく制約されるという問題点がある。 このため、上述の問題を解消した操作性の高い解法を得るための方法が必要と される。より高能力の、利用可能な操作集合をもつブローカを得るためのシステ ムが望まれる。 本発明は、プロセッサ、メモリ、およびユーザインタフェースを含むデータ処 理装置で実行される方法を提供する。ここでデータ処理装置はネットワーク中で 一つ以上の他のデータ処理装置に接続されており、当該データ処理装置の少なく とも一つは電子文書の記録領域を保持する手段を含む。この方法は、(a)特徴 制約を指示する少なくとも一つのユーザ入力を受信する工程であって、この特徴 制約は少なくとも一つの正の成分と負の成分とを含み、これら正の成分と負の成 分の各々は一つ以上の関係を含み、当該一つまたは各関係は文書に関するエンテ ィティとそのエンティティの属性を規定する工程と、(b)特徴制約を解いて、 正および負の成分から一つ以上の文書指示子を決定する工程であって、当該一つ または各文書指示子は特徴制約を充足する記録領域内の文書に対応する工程とを 含む。 また本発明は、プロセッサ、メモリ、およびユーザインタフェースを含むデー タ処理装置で実行される次の方法をさらに提供する。この方法は、(i)保存さ れた特徴制約に対応するグラフィカルオブジェクトを指示する第一のユーザ入力 を受信する工程であって、特徴制約は少なくとも一つの正の成分と負の成分とを 含み、これら正の成分と負の成分の各々は一つ以上の関係を含み、当該一つまた は各関係は文書に関するエンティティとそのエンティティの属性を規定する工程 と、(j)特徴制約が別のデータ処理装置に送信されるものであることを示す第 二のユーザ入力を受信する工程と、(k)特徴制約をデータパケットにエンコー ドする工程と、(l)データパケットを送信する工程とを含む。 これらの各方法はいずれも、複数の場所にある各々でのデータ処理装置に保持 された記録領域から知識を取得し、状況に応じて得られた個々の知識を組み合わ せて新しい文書を作成する工程を含む。 また本発明は、前述のあるいは添付した請求範囲のいずれかの方法を実行する ため、適切にプログラムされたデータ処理装置であって、プロセッサ、メモリ、 およびユーザインタフェースを含むデータ処理装置を提供する。 本発明により、さらに次のデータ処理装置が提供される。このデータ処理装置 は、プロセッサと、プロセッサに接続されたメモリと、プロセッサとメモリに接 続されてユーザの操作によりユーザ入力情報を発信できるようにされたユーザイ ンタフェースを含む。このデータ処理装置はネットワーク中で一つ以上の他のデ ータ処理装置に接続されており、該データ処理装置の少なくとも一つは電子文書 の記録領域を保持する手段を含み、さらにこのデータ処理装置は特徴制約を指示 する少なくとも一つのユーザ入力を受信する手段であって、特徴制約は少なくと も一つの正の成分と負の成分とを含み、これら正の成分と負の成分の各々は一つ 以上の関係を含み、当該一つまたは各関係は文書に関するエンティティとそのエ ンティティの属性を規定する手段と、特徴制約を解いて、正の成分と負の成分か ら一つ以上の文書指示子を決定する手段であって、当該一つまたは各文書指示子 は特徴制約を充足する記録領域内の文書に対応する手段とを含む。 また本発明は、添付した請求範囲の請求項19による、電子文書のアクセスま たは配信を行うシステムを提供する。 さらに本発明は、添付した請求範囲の請求項20による、電子文書のアクセス または配信を行う携帯型装置を提供する。 加えて本発明は、添付した請求範囲の請求項21による、文書のスキャン、複 写、および/あるいは印刷を行う装置を提供する。 本発明では、特徴制約の部分集合、すなわち「符号つき特徴制約」(SFC) 、およびSFCの解法を用いる。この解法の利点の一つに、SFCを知識取得エ ンジンに用いて、共通言語で(1)知識検索リクエスト、(2)当該リクエスト に対する回答、(3)知識取得エージェント(本明細書では知識ブローカとする )の状態を指定できることがある。 この共同作業を維持する上で必要なインフラストラクチャ、および知識を各ブ ローカ内に局所的に保存する方法については、Andreoli他著「制約に基づく知識 ブローカのモデル:セマンティクス、実行と解析」(J.Symbolic Computation,1 996年)に依るものとする。以下では、主として各ブローカ内で行われる知識操 作について記述する。 本発明の態様を、添付図を参照しながら例に基づいて説明する。 図1は、本発明の一態様の実装に使用されるデータ処理ネットワークを模式的 に示す図である。 図2は、符号つき特徴制約によって規定される範囲を模式的に示す図である。 図3は、クエリを行うユーザによる入力時の一瞬間における据置型コンピュー タのユーザインタフェースを示す図である。 図4は、図3のインタフェースを用いてクエリ要素を入力するステップを模式 的に示すフローチャートである。 図5は、本発明の別の態様において、ユーザの使用に適したクエリ入力用の用 紙の書式を示す図である。 図6は、図5の用紙書式を用いてクエリ要素を入力するステップを模式的に示 すフローチャートである。 図7は、特徴制約を用いて文書指示子を取得し、対応する文書を表示または印 刷するステップを模式的に示すフローチャートである。 図8は、図7の処理で得られたヒットのリストの一部を示す図である。 図9は、図8のリストから選択されたヒットのHTML書式への変換後の表示 状態を示す図である。 図10は、選択された一つのヒットをより詳細に示す図である。 1.システムハードウェア 明らかに、本発明はローカルエリアネットワーク(LAN)あるいは好適には 広域ネットワーク(WAN)のいずれかの従来のコンピュータネットワーク技術 を用いて実装することができる。本発明の実施形態においては、クロスプラット フォーム通信およびインターネットを通じた文書転送を行うソフトとして(ネッ トスケープなどの)従来のウェブブラウザソフトウェアを用いた。この態様を図 1に模式的に示す。ネットワーク21の一部を形成する各装置2,4,6は、周 知のWindows(商標)を実行するPC、MacOSを実行するMac、あ るいはUNIXを実行するミニコンピュータのいずれでもよいことは明らかであ る。例えば、PCのハードウェア構成については、P.HorowitzおよびW.Hill著「 Art of Electronics」第2版(Cambridge University Press刊、1989年)の10 章に詳細に記載されている。ただし、明らかに本発明は他のシステム構成によっ て実行することもできる(欧州特許出願第691,619号(以下EP’619 とする)参照)。(典型的なネットワーク構成については、例えば欧州特許出願 第772,857号、および(米国特許出願番号第08/668,704号に対 応する)欧州特許出願第 号に詳細に記載されている。) 装置22でユーザがリクエストすると、装置26に保存された文書が取得され 、インターネット上で装置26から複数の中継機24を介して装置22に送信さ れる。周知の如く、文書はワールドワイドウェブのURLを特定の識別子として 用いて取得される(EP’619に記載あり)。またEP’619に記載されて いるように、好適には複数のプリンタあるいは(スキャナ、印刷、およびファク シ ミリ機能等をもつ)多機能装置(図示せず)もまたネットワーク21に接続され る。多機能装置については欧州特許出願第741,487号に詳細に記載されて いる。ネットワークに接続される各装置は、携帯型コンピュータとの通信に適し た公知のハードウェアとソフトウェアとを備えている。この携帯型コンピュータ としては、個人用携帯端末(personal digital assist ants)(PDA)、ハンドヘルドPC、またはポケット型もしくは腕時計型 コンピュータなどがある。このようにして、携帯型コンピュータのユーザから受 信されるデータパケットに応じて、リクエストを行う装置がリクエストを生成す る。さらに詳細については、本明細書と同時出願された英国特許出願第9708 175.6号(リファレンスR/97005)に基づく国際特許出願第 号 に記載されている。 2.特徴制約の原理 上述のように、完全な特徴制約のフラグメントは、原子成分を全ての論理結合 記号(結合、分離、否定および限定)によって結合することができるものであり 、表現性は高いが、操作性はきわめて悪い。単に否定と分離とを禁止した、「基 本特徴制約」(BFC)と呼ばれるサブフラグメントが検討されており、効率的 な制約解法アルゴリズムが、このサブフラグメント用として提案されている。し かしながらこのサブフラグメントでは、否定が全く用いられないため,知識ブロ ーカが実行しようとする操作の種類が著しく制約されるという問題点がある。 好適な実施形態において、本発明では「範囲分割」と称する,否定の使用に依 拠した能力の高い操作を用いる。実際には、ブローカが、式Fで表現される判断 カは、自己の範囲をBFC X X:book X:year→Y Y>1950 で表される「1950年より後に書かれた本」、およびその余りである「19 50年より前に書かれた本、あるいは本以外の文書」の二つの新しい範囲に分割 しようとする。後者の範囲は、否定と分離なしでは表現することができないため BFCによって表現することはできない。範囲分割操作は多くの場合において有 用であることが明らかにされており、例えば、生存中に集めた情報を記憶および 再利用する能力をもつブローカを実行する場合において有用である。本発明の実 施の形態では、一方で「符号つき特徴制約」(SFC)と呼ばれる特徴制約のフ ラグメントを利用し、他方で効率的なSFCの制約解法を用いる。このSFCは 否定を限定的に使用するものであり、前述の分割された範囲の種類を精密に表現 することができる。 2.1 符号つき特徴制約 符号つき特徴制約は、ともに基本特徴制約である,正の部分および負の部分の リストからなる。例えば、次の符号つき特徴制約、 P +P:person, P:employer→E, E:“Xerox” −P:nationality→N, N:“American” −P:spouse→P’ P’:person P’:employer→E’ E’:“Xerox” は、米国人以外で、かつ他のXerox従業員と結婚していないXerox従 業員を指定する。このことを図2に図式的に示す。丸枠はエンティティ(論理変 数)を表す。分類関係(単項)は角枠内に分類名を表示されており、破線矢印で 示されている。特徴関係(二項)は角枠内に特徴名を表示されており、実線矢印 で示されている。組み込み述部(この例には存在しない)は菱形で示す。SFC の正の部分は上欄に含まれ、特別のエンティティ範囲(本例ではP)であること が二重の丸枠により明示されている。SFCの負の部分はグレーの下欄に含まれ ている。 SFCの主な特長は次の特性、すなわち、 ブローカの範囲がSFCe0で表され、かつこの範囲がBFCeで分割される ならば、得られた二つの分割範囲e+,e-は共にSFCである、という特性に基 づく。 実際には、e+はe0の正の部分をBFCeと併合することによって得られ、e- は、eを単独で含む新しい負の部分を用いてe0を伸張することによって得られ る。例えば、アメリカ人以外の著者が書いた芸術関係の各種文書(本、ビデオ他 )を含む、書誌データベース関係のブローカを仮定すると、このブローカはSF CX +X:topic→T T:“Art” −X:author→A A:nationality→N N:“American” で表される。このSFCは「1950年より後に書かれた本」という制約で分 割することができ、この制約はBFC X X:book X:year→Y Y>1950 で表される。得られた範囲は簡明に X +X:book x:topic→T X:year→Y T:“Art” Y>1950 −X:author→A A:nationality→N N:“American” と表され、この表記は、「アメリカ人以外の著者によって1950年より後に 書かれた芸術関係の本」ということを意味する。また X +X:topic→T T:“Art” −X:author→A A:nationality→N N:“American” −X:book X:year→Y Y>1950 と表した場合は、「アメリカ人以外の著者が書いた1950年より後の芸術関 係の文書であって、本以外の文書」ということを意味する。 2.2 符号化された特徴制約の解法 大半の制約体系は、分類や特徴の性質について体系公理と呼ばれるいくつかの 仮定を設けている。これら公理は、特徴制約が矛盾している場合および充足可能 である場合を決定するものであるため、充足可能性アルゴリズムにとって重要で ある。 2.2.1 特徴公理 簡明のために、ここで開示する実施形態ではAit-Kaci H.他著「含意を用いた 論理プログラミング用の特徴に基づく制約体系」(Theoretical Computer Scien ce 122,pp.263-283,1994年)に使用されている基本公理体系を若干改変して用い る。ただし当業者にとって明らかなように、本方法の原理は他の公理集合にも 同様に適用できる。 1.特徴は関数である。つまり、同一の特徴で制約される二つのエンティティ 対が同一の第一項をもつならば、両エンティティ対は同一の第二項をもつ。例え ば、配偶者という特徴は(特定の文化環境において)関数である。このことは一 人の人間は二人の配偶者をもつことはできないことを意味する。つまり、ある人 物Xにおいて、X:spouse→YおよびX:spouse→Zの二つの関係 があるとすると、エンティティYとエンティティZは一致する(すなわち同一人 物を指す)。他の体系では多値の特徴を許す。 2.分類は互いに素である。つまり、二つの異なる分類からなるエンティティ は存在しない。例えば、本は人物ではない、すなわちX:bookおよびX:p ersonの二つの関係をもつエンティティXはあり得ない。他のシステムでは 分類の階層構造が考慮されており、エンティティのいくつかは階層内で共通の要 素を有する限り複数の分類をもち得る。 3.「値(value)」分類と呼ばれる、特別の分類のサブセットがあり、 これによって同じ値の分類からなる二つの異なるエンティティは存在しないよう にされる。伝統的基本要素(文字列、数字他)は典型的な値分類である。例えば 、文字列「Xerox」や数字「1950」は値分類である。値分類が特徴をも つことはなく、分類と特徴の結合だけのための公理である。他の体系では分類と 特徴間のより高度な結合が考慮されている。 4.(分類と特徴を含む)伝統的合同公理をもつ、特別な組み込み二値述語と して等価がある。他の全ての組み込み述語を記述する公理は、分類と特徴につい ての記述を含まないものとする。 以上の公理を、本明細書末尾の付録中の段落A:公理に公式の書式で示す。こ れら公理は理論Tの構成要素となるものである。 2.2.2 制約充足 先ず、組み込み述語上での充足可能性は可解とする。つまり、組み込み述語の みを用いた式Fがあるとすると(Fは組み込み制約とも呼ばれる)、Fが理論T の論理帰結(├τFで表す)であるかどうかを決定することのできるアルゴリズ ムが存在する。 BFC上での制約充足は、BFC上の一連の条件付き書き換え規則(付録のセ クションB.1参照)で定義される。この書き換え規則は次の特性をもつ。 (a)規則体系は収束的であり、したがってBFCの「標準形式」を定義する 。体系が「チャーチロッサ」(クリティカルペア収束)および「ネータリアン」 (項サイズが書き換え毎に確実に減少する)であることを検証することにより、 上記内容を古典的方法で表すことができる。 (b)BFCは、当該BFCの標準形式が矛盾に至ることがなければ、及びそ のときに限って充足可能である。ある含意は、書き換えステップが充足可能性を 保つことを示すことによって証明される。反対の含意は、矛盾に至ることがない 標準形式をもつBFCを充足するモデルを示すことによって証明される。 このようにして、書き換え規則により制約充足アルゴリズムのステップが記述 される。書き換え規則体系は収束的であるため、このアルゴリズムは必ず終了す る。重要なことは、この規則の定義が、可解とされている組み込み制約の充足可 能性テストに依拠していることである。つまり、このアルゴリズムはモジュール 方式であり、適正な組み込み制約の充足アルゴリズムが与えられる限り、あらゆ る種類の組み込み制約を取り込むことができる。 制約充足アルゴリズムの書き換え規則は、リスプやプロローグのような記号言 語を用いて簡単に実装することができる、あるいは使用される特定の組み込み制 約の特性を考慮して最適化することができる。 SFC上での制約充足のためのアルゴリズム(付録のセクションB.2参照) は、簡略には次のように記述される。あるSFCにおいて、最初に正の成分がB FCのアルゴリズムによって正規化される。結果が矛盾していれば、SFC全体 が充足不能である。矛盾していなければ、(正規化された)正の成分が負の成分 の各々に挿入された後、当該負の成分がBFCのアルゴリズムによって正規化さ れる。得られた負の成分が矛盾した標準形式を有していればその成分は削除され 、トートロジ的な標準形式を有していればSFC全体が充足不能とされる。この ようにして得られたSFCの標準形式は次の性質をもつ、すなわち、 SFCは、そのSFCの標準形式が矛盾に至ることがなければ、およびそのと きに限って充足可能である。前述の場合のように、含意の困難な部分はモデル理 論を用いて証明される。 3.特徴制約を用いたユーザトランザクション 図3は、クエリを行うユーザによる入力時の一瞬間における据置型コンピュー タのユーザインタフェースを示す図である。専用ウィンドウ内に、主クエリ入力 ボックス30が周知の形式で表示される。例えば、ユーザは、「「制約」を含み 、「インターネット」を含まない表題の、1990年より後の本または記事」と いう1行のクエリを入力しようとする。クエリボックス30は、ボックス31, 32を含む。ユーザは、このボックス31,32をマウスで選択し、これらボッ クスにタイプ入力を行う、すなわちクエリ要素(例えば「本/記事」など)を全 て入力する。また、ボタン33を用いて、例えば「表題」と表題に付加される、 次を含まない等の制約等、文書に関するエンティティを選択することができる。 ボタン34,36が付加されており、これによって、ユーザは、クエリの再開、 追加、編集、および形成を行うことができる。クエリの各要素が最新のクエリ特 定内容に順次追加され、最新の状態でボックス37に表示される。クエリの特定 内容が完成すると、ボタン38が押され、検索が開始される。 図4は、図3のインタフェースを用いてクエリ要素(例えば90年より後の日 付など)を入力するステップを模式的に示すフローチャートである。まず、知識 ブローカの主クエリウインドウが表示される(ステップs41)。次いで、クエ リの各要素がユーザのキー入力にしたがって順に受信される(s42)。ユーザ が各クエリ要素を確認すると、「現在の特定内容」が表示された各要素を含むも のに更新される(s43)。クエリの特定が終了し、ユーザが図3の「提出(s ubmit)」ボタンを選択すると、各クエリ要素は対応する論理関係に変換さ れる(s44)(前述のセクション2参照)。この後、特徴制約が論理関係の集 合によってコンパイルされる(s45)。 図5に、本発明の別の実施形態における、ユーザによるクエリ入力に適した用 紙の形式50を示す。この実施形態は、多機能装置のユーザ、あるいはコンピュ ータに接続されたスキャナをもつユーザに適したものである。使用される書式5 0には複数の欄51,52,53,54が備わり、この欄を用いてユーザは、文 書の種類、著者名、日付、および特記事項等の情報を入力することができる。た だし、任意の数の欄を用いて、ユーザが希望する任意の種類の文書に関する情報 を入力できることは明らかである。周知のように、この場合、人間が判読できる 字句で指示された各選択部の隣に枠が備わり、ユーザがこの枠をチェックすると 機械読み取りによって選択が判別されるようにすることもできる。また、手書き の情報入力用の枠(55,56,57)を用いてもよい。あるいは、クエリ全体 がタイプ入力または手書き形式で用紙に記入され、クエリの内容をOCRおよび 、必要であれば手書き認識装置によって入力するようにすることもできる。 図6は、図5の書式を用いてクエリ要素を入力するステップを模式的に示すフ ローチャートである。最初に、用紙のスキャンが行われ、用紙に記入された内容 に対応するビットマップ化された画像データファイルが保存される(ステップs 60)。次に、ボックス55〜58に対応する位置で画像データについての解析 が行われ、ボックスがチェックされているかどうか、あるいはボックスに記入さ れた情報の抽出についての解析がなされる(s61)。次いで、各欄51〜54 において指定されるクエリ要素が決定される(s62)。この時必要であれば、 手書き認識装置およびOCRが使用される(s63)。この後、各クエリ要素が 対応する論理関係に変換され(前述のセクション2参照)、論理関係の集合によ って特徴制約がコンパイルされる(s65)。 図7は、特徴制約を用いて文書指示子を取得し、対応する文書を表示または印 刷するステップを模式的に示すフローチャートである。この操作は、従来のコン ピュータまたは多機能装置あるいはユーザインタフェースを備えたプリンタによ って実行される。最初に、ユーザからFCが受信される。周知のようにこのFC は、例えば図8に示したように携帯型コンピュータのユーザからデータパケット の形式で送信される、あるいはユーザがキーボードとマウス、またはタッチスク リーンを操作することで装置に直接入力される。適当な入力によるユーザの指示 に応じて、FCは前述のセクション3に記載された処理により解かれ、それによ り得られた適当な形式のリクエストがサーチエンジンに送られる(s92)。こ のサーチリクエストを用いて、該FCを充足する文書が検索可能な全記録領域か ら検索され(s93)、リクエストは必要に応じて、Andreoli他著「制約に基づ く知識ブローカモデル:セマンティクス、実行と解析」(J.Symbolic computati on,1996年)に詳述されているサブリクエストに細分化される。 サーチエンジンによって(FCを充足する文書の)ヒットのリストが得られる と、図8に示すように、このヒットのリストが表示される(s94)。次いで、 適当なユーザ入力に応じて、個々のヒットの文書細部の拡大表示、文書情報のH TML書式への変換、あるいは記録領域からの文書のダウンロード等の操作が実 行される(s95)。 図9に、図8のリストから選択されたヒットのHTML書式への変換後の表示 状態を示す。図に示すように、各ヒットについて、著者名、http_url、 情報源、および表題などの追加情報が表示される。所望により、ユーザは表示さ れたhttp_url上をマウスクリックすることによってヒット1に相当する 文書を見ることができる。得られた文書は必要に応じて印刷される(s96)。 図10に、選択された一つのヒットについてのより詳細な表示、すなわち一連 の文書属性を示す。図に示すように、複数の属性に対応して、これら属性に関す る情報を提供する追加頁へのリンクを行う複数のURLが表示される。 付録 A 体系公理 次の三つの公理のセットがある。 特徴と種類の特定公理 τ,τ’が任意の分類を表し、fが任意の特徴を表すとする。 等号の合同公理 pは任意の組み込み述語を表す。伝統的な合同公理は:組み込み述語公理 この公理が分類および特徴の記述を行うことはない。例えば、非同等は で公理化される。 優位の制約は で公理化される。 組み込み述語、>,≦,≧、は<および等号によって規定される。 B 制約充足 B.1 BFCの場合 BFCは〈B|Γ〉対で表される。Bは組み込み制約であり、Γは分類および 特徴制約の順序なしリストである(結合的に読む)。⊥は矛盾を表す。 二つの書き換え規則のセットがある。次の規則はBFCの単純化に対応する。 次の規則は矛盾の検出に対応する。 次の特性がこのアルゴリズムの正当性を裏付ける。 B.2 SFCの場合 SFCは、符号(+または−)付けされたBFCの順序なしリストとして表さ れ、一つかつ唯一の成分が正と定義する。SをSFCとする。S*のSFC標準 形式をSnと書き、これは次のアルゴリズムで与えられる。 c0をSの正の成分のBFC標準形式とするとき、 もし、c0=⊥ならば ⊥を返す そうでなければ、 c0は、〈Bo|Γo〉の形式 {〈Br|Γi〉}i=1,...,nをSの負の成分とする i=1,...,nの各々について もし、ci=<B|Γ>かつ├τBかつΓが空であるようなi∈1,...,nが存在 すれば、 ⊥を返す そうでなければ、 I={ci≠⊥であるようなi∈1,...,n}とする 次の特性がこのアルゴリズムの正当性を裏付ける。 Description: TECHNICAL FIELD The present invention relates to data processing, and more particularly to the transfer of information or knowledge between computers and the acquisition by computers using encoded feature constraints. As the use of new electronic sources, such as e-mail, Internet access, and online information recording, becomes widespread, the number of electronic documents used by computer users is also increasing. In addition, a document can be dynamically created by accessing and combining information on distributed information sources. By using a hierarchical markup language such as SGML, it is possible to dynamically satisfy various contents and create a document template. Further, by storing the document in a document management system, the document can be made permanent and can be incorporated into a normal document life cycle. Efforts have been made to standardize the retrieval, retrieval, storage, and conversion of electronic documents on a variety of document management systems, and the Document Management Alliance (DMA) industry standard has been developed for this. A knowledge brokerage system is implemented for searching and obtaining according to this standard, in which a knowledge broker is used. A broker is a software agent that processes knowledge search requests. Here, knowledge refers to all electronic information that is made publicly accessible. Various information sources that can be distributed can be used from a file in the user's directory to a database provided locally at a certain site, and further to a wide area information service (WAIS) on the Internet, for example. Upon receipt of the request, the broker processes the request, provided that it has sufficient knowledge. Alternatively, the broker needs to acquire more knowledge to process the request. To acquire this knowledge, the broker sends a sub-request to another broker. As described above, knowledge acquisition is performed by collaboration of all brokers. The service provider that processes the request and the service client that sends the sub-request are brokers. In order to perform the above-mentioned joint work, it is necessary that the brokers understand each other at a minimum. That is, all requests (and all responses to requests) must be expressed in a common language, even if the broker translates locally. A suitable language for this is obtained by logic. The request is represented by an <x, P> pair, and this notation means that “acquire the knowledge object x so that the property represented by the expression P applies”. x is a logical variable, and P is a logical expression containing x. Interestingly, the answer to this request is also expressed in the same form, i.e., <x, Q> pairs, which means that "there is a knowledge object x that satisfies the property represented by equation Q". . At this time, P is required to be a logical consequence of Q, so the answer will contain at least as much knowledge as the request. Further, the range of the broker, that is, the range of the related knowledge can be acquired using the same logical format. In other words, the broker in the range <x, R> means that "I cannot acquire the knowledge object x that does not satisfy the attribute represented by the expression R." In many cases, the range of brokers varies due to specialization due to external factors or the knowledge acquisition process itself, or conversely, to increase tolerance. In other words, logic provides a common language in which requests, answers and ranges can be expressed. The broker performs logical operations on these three components. The most important logical operation is the check of satisfiability, which reconstructs all other logical operations. Matching satisfiability refers to determining whether an object satisfies the property represented by an expression or, conversely, is essentially inconsistent. Unfortunately, in well-known classical logic, this operation is not algorithmic. That is, it is almost impossible to implement a program that always ends the processing. Considering this limitation, much research on knowledge representation has focused on identifying fragments of classical logic that can algorithmically determine satisfiability. There is a trade-off between expressiveness and operability. For example, an empty fragment has clearly high operability but extremely poor expressiveness. The most common fragment elucidated so far is called the "feature constraint" (FC). The satisfiability problem in this case is also called "feature constraint solving". As is well known, feature constraints are constructed with either class or feature atomic constraints. Classification is a unary relation, representing the attributes of a single entity. For example, P: person indicates that the entity P is composed of the classification person. Features are binary relations and represent the property of linking two entities. For example, P: employer → E indicates that entity P has an employee, and this employee is entity E. Apart from classification and features, most feature systems also take into account built-in relationships such as equality and disequality. A fragment of a perfect feature constraint is one in which the above-mentioned atomic components can be connected by all logical connection symbols (connection, separation, negation and restriction), and is highly expressive but extremely poor in operability. A subfragment called "Basic Feature Constraint" (BFC), which simply forbids negation and separation, is being considered, and an efficient constraint solving algorithm has been proposed for this subfragment. However, since no negation is used in this sub-fragment, there is a problem that the type of operation that the knowledge broker attempts to execute is significantly restricted. For this reason, a method for obtaining a solution with high operability that solves the above-mentioned problem is required. A system for obtaining a broker with a higher capacity, available operation set is desired. The present invention provides a method performed on a data processing device that includes a processor, a memory, and a user interface. Here, the data processing device is connected to one or more other data processing devices in the network, and at least one of the data processing devices includes a unit that holds a recording area of the electronic document. The method comprises the steps of (a) receiving at least one user input indicating a feature constraint, the feature constraint including at least one positive component and a negative component, wherein the positive component and the negative component are included. Each of the components includes one or more relationships, each or each relationship defining an entity for the document and attributes of the entity; and (b) solving the feature constraint to obtain one of the positive and negative components. The step of determining the above-mentioned document designator, wherein the one or each document designator includes a process corresponding to a document in a recording area satisfying the characteristic constraint. The present invention further provides the following method executed in a data processing device including a processor, a memory, and a user interface. The method includes: (i) receiving a first user input indicating a graphical object corresponding to a stored feature constraint, wherein the feature constraint includes at least one positive component and a negative component; Each of these positive and negative components includes one or more relationships, where the one or each relationship defines an entity for the document and the attributes of the entity; Receiving a second user input indicating that it is to be transmitted to the device; (k) encoding the feature constraint into a data packet; and (l) transmitting the data packet. In each of these methods, a process of acquiring knowledge from a recording area held in a data processing device at each of a plurality of places and combining individual knowledge obtained according to a situation to create a new document including. The present invention also provides a data processing device, suitably programmed to perform the method of any of the foregoing or appended claims, including a processor, a memory, and a user interface. According to the present invention, the following data processing device is further provided. The data processing device includes a processor, a memory connected to the processor, and a user interface connected to the processor and the memory and capable of transmitting user input information by a user operation. The data processing device is connected to one or more other data processing devices in a network, at least one of the data processing devices includes a unit for holding a recording area of the electronic document, and the data processing device further includes: A means for receiving at least one user input indicating a feature constraint, wherein the feature constraint includes at least one positive component and a negative component, each of the positive and negative components being one or more. Means including relations, the or each relation defining an entity for the document and attributes of the entity, and means for solving feature constraints to determine one or more document indicators from positive and negative components. And the one or each document designator includes means corresponding to a document in the recording area satisfying the feature constraint. The present invention also provides a system for accessing or delivering an electronic document according to claim 19 of the appended claims. The invention further provides a portable device for accessing or delivering electronic documents according to claim 20 of the accompanying claims. In addition, the present invention provides an apparatus for scanning, copying and / or printing a document according to claim 21 of the accompanying claims. We use a subset of feature constraints, namely "signed feature constraints" (SFC), and the solution of SFC. One of the advantages of this solution is that, using SFC as a knowledge acquisition engine, (1) a knowledge search request, (2) an answer to the request, and (3) a knowledge acquisition agent (in this specification, a knowledge broker and May be specified. See Andreoli et al., "A Model of Constraint-Based Knowledge Brokers: Semantics, Execution and Analysis," by Andreoli et al., For the infrastructure required to maintain this collaboration, and how to store knowledge locally within each broker. Symbolic Computation, 1996). The following describes mainly the knowledge operations performed in each broker. Embodiments of the invention will now be described by way of example with reference to the accompanying drawings. FIG. 1 is a diagram schematically illustrating a data processing network used to implement one aspect of the present invention. FIG. 2 is a diagram schematically illustrating a range defined by a signed feature constraint. FIG. 3 is a diagram illustrating a user interface of the stationary computer at a moment when an input is made by a user who performs a query. FIG. 4 is a flowchart schematically showing a step of inputting a query element using the interface of FIG. FIG. 5 is a diagram showing a form of a query input sheet suitable for use by a user according to another embodiment of the present invention. FIG. 6 is a flowchart schematically showing steps of inputting a query element using the paper format of FIG. FIG. 7 is a flowchart schematically showing a step of acquiring a document designator using a feature constraint and displaying or printing a corresponding document. FIG. 8 is a diagram showing a part of a list of hits obtained by the processing of FIG. FIG. 9 is a diagram showing a display state after the hit selected from the list in FIG. 8 is converted into the HTML format. FIG. 10 is a diagram showing one selected hit in more detail. 1. System Hardware Clearly, the present invention can be implemented using conventional computer network technology, either a local area network (LAN) or, preferably, a wide area network (WAN). In the embodiment of the present invention, conventional web browser software (such as Netscape) is used as software for performing cross-platform communication and document transfer via the Internet. This embodiment is schematically shown in FIG. It is clear that each of the devices 2, 4, and 6 forming a part of the network 21 may be any of a PC running Windows (trademark), a Mac running MacOS, and a minicomputer running UNIX. . For example, the hardware configuration of a PC is described in detail in Chapter 10 of P. Horowitz and W. Hill, "Art of Electronics," Second Edition (Cambridge University Press, 1989). However, it is clear that the invention can also be implemented with other system configurations (see European Patent Application No. 691,619 (hereinafter EP'619)). (For typical network configurations see, for example, European Patent Application No. 772,857 and European Patent Application No. 08 / 668,704). No. In more detail. When a user makes a request at the device 22, a document stored in the device 26 is obtained and transmitted from the device 26 to the device 22 via the plurality of repeaters 24 on the Internet. As is well known, documents are obtained using the URL of the World Wide Web as a specific identifier (described in EP'619). Also, as described in EP'619, preferably a plurality of printers or multi-function devices (not shown) having scanner, printing and facsimile functions are also connected to the network 21. Multifunctional devices are described in detail in European Patent Application 741,487. Each device connected to the network includes known hardware and software suitable for communication with the portable computer. The portable computer includes a personal digital assistant (PDA), a handheld PC, or a pocket or wristwatch computer. In this way, the requesting device generates the request in response to the data packet received from the portable computer user. For further details, see International Patent Application No. based on UK Patent Application No. 9708 175.6 (reference R / 97005) filed concurrently with this specification. No. It is described in. 2. Principle of Feature Constraint As described above, a fragment of a complete feature constraint is one in which atomic components can be connected by all logical connection symbols (bond, separation, negation and limitation), and is highly expressive. Operability is extremely poor. A subfragment called "Basic Feature Constraint" (BFC), which simply prohibits negation and separation, is being considered, and an efficient constraint solving algorithm has been proposed for this subfragment. However, since no negation is used in this subfragment, there is a problem that the type of operation that the knowledge broker attempts to execute is significantly restricted. In a preferred embodiment, the present invention uses a sophisticated operation that relies on the use of negation, referred to as "range partitioning." In effect, the broker determines the decision expressed in equation F The mosquito has its own range of BFCXX: bookX: year → YY> 1950, "the book written after 1950", and the remainder, "the book written before 1950". Book or non-book document ". The latter range cannot be expressed by BFCs because it cannot be expressed without negation and separation. Range splitting operations have proven useful in many cases, for example, when running a broker capable of storing and reusing information gathered during its lifetime. Embodiments of the present invention use fragments of feature constraints called “signed feature constraints” (SFC) on the one hand, and use efficient SFC constraint solving methods on the other hand. This SFC uses negation in a limited manner, and can accurately represent the types of the above-mentioned divided ranges. 2.1 Signed Feature Constraints A signed feature constraint consists of a list of positive and negative parts, both of which are basic feature constraints. For example, the following signed feature constraint: P + P: person, P: employer → E, E: “Xerox” −P: nationality → N, N: “American” −P: spouse → P ′ P ′: person P ′ : Employer → E ′ E ′: “Xerox” specifies a Xerox employee who is not American and is not married to another Xerox employee. This is shown schematically in FIG. Circles represent entities (logical variables). The classification relation (unary) has a classification name displayed in a square frame, and is indicated by a dashed arrow. The feature relationship (binary) has a feature name displayed in a square frame, and is indicated by a solid arrow. Built-in predicates (not present in this example) are indicated by diamonds. The positive part of the SFC is included in the top column, and is marked by a double circle to indicate a special entity range (P in this example). The negative part of the SFC is included in the lower gray box. The main features of the SFC are the following characteristics, ie, the range of the broker is 0 And if this range is divided by BFCE, the two divided ranges e obtained + , E - Are both SFCs. In practice, e + Is e 0 Obtained by merging the positive part of - Is calculated using a new negative part containing e alone 0 By stretching. For example, assuming a broker related to a bibliographic database including various art-related documents (books, videos, etc.) written by non-American authors, this broker is SF CX + X: topic → TT: “Art” −X : Author → AA A: nationality → NN: “American”. This SFC can be divided by the constraint of “book written after 1950”, and this constraint is expressed by BFCXX: bookX: year → YY> 1950. The obtained range is simply expressed as X + X: book x: topic → TX: year → Y T: “Art” Y> 1950 −X: author → AA: Nationality → NN: “American” The notation means "art book written after 1950 by a non-American author". X + X: topic → TT: “Art” −X: author → AA: nationality → NN: “American” −X: book X: year → YY> 1950 Is an art-related document after 1950, written by the author, and is a document other than a book. " 2.2 Solving Encoded Feature Constraints Most constraint systems make some assumptions about the nature of classification and features, called system axioms. These axioms are important for satisfiability algorithms because they determine when feature constraints are inconsistent and satisfiable. 2.2.1 Feature Axiom For simplicity, in the embodiments disclosed herein, Ait-Kaci H. et al., "A Constraint System Based on Features for Logic Programming Using Implications" (Theoretical Computer Science 122, pp. 147-64). 263-283, 1994). However, as will be apparent to those skilled in the art, the principles of the method are equally applicable to other axiom sets. 1. Features are functions. That is, if two entity pairs constrained by the same feature have the same first term, then both entity pairs have the same second term. For example, a spouse feature is a function (in a particular cultural environment). This means that one human cannot have two spouses. That is, assuming that a certain person X has two relations of X: spouse → Y and X: spouse → Z, the entities Y and Z match (that is, indicate the same person). Other schemes allow multivalued features. 2. Classification is disjoint. That is, there is no entity with two different classifications. For example, a book is not a person, that is, there cannot be an entity X with two relationships, X: book and X: person. Other systems consider the hierarchical structure of the classifications, and some of the entities may have multiple classifications as long as they have common elements in the hierarchy. 3. There is a special subset of classifications, called "value" classifications, so that there are no two different entities of the same value classification. Traditional primitives (strings, numbers, etc.) are typical value classes. For example, a character string “Xerox” or a number “1950” is a value classification. Value classification has no features, it is an axiom only for the combination of classification and features. Other systems allow for a higher degree of coupling between classification and features. 4. Equivalence is as a special built-in binary predicate that has a traditional joint axiom (including classification and features). Axioms describing all other built-in predicates shall not include descriptions of classifications and features. The above axiom is shown in an official form in Paragraph A: Axiom in the Appendix at the end of this specification. These axioms are components of theory T. 2.2.2 Constraint Satisfaction First, satisfiability on embedded predicates is solvable. That is, if there is an expression F using only the built-in predicate (F is also called a built-in constraint), F is a logical consequence of the theory T (T τ F)). Constraint satisfaction on the BFC is defined by a series of conditional rewrite rules on the BFC (see Appendix B.1). This rewrite rule has the following properties. (A) The rule system is convergent and thus defines the "standard form" of BFC. By verifying that the system is "Church Rossa" (critical pair convergence) and "Noetherian" (term size decreases steadily with each rewrite), the above can be expressed in a classical way. (B) A BFC is satisfiable if and only if the standard form of the BFC does not lead to inconsistency. One implication is proved by showing that the rewriting step remains satisfiable. The opposite implication is proved by showing a model that satisfies the BFC with a standard format that does not lead to inconsistencies. In this way, the steps of the constraint satisfaction algorithm are described by the rewriting rules. Since the rewriting rule system is convergent, this algorithm always ends. Importantly, the definition of this rule relies on the test of satisfiability of built-in constraints that are solvable. In other words, this algorithm is modular, and can incorporate all kinds of built-in constraints as long as an appropriate built-in constraint satisfaction algorithm is given. The rules for rewriting the constraint satisfaction algorithm can be easily implemented using a symbolic language such as Lisp or Prolog, or can be optimized taking into account the characteristics of the particular built-in constraints used. The algorithm for constraint satisfaction on the SFC (see section B.2 in the Appendix) is briefly described as follows. In some SFCs, the positive component is first normalized by the BFC algorithm. If the results are inconsistent, the entire SFC is unsatisfiable. If not inconsistent, after the (normalized) positive component is inserted into each of the negative components, the negative components are normalized by the BFC algorithm. If the obtained negative component has an inconsistent standard format, the component is deleted. If the negative component has a totological standard format, the entire SFC is unsatisfiable. The standard form of the SFC obtained in this way has the following properties: the SFC is satisfiable if and only if the standard form of the SFC does not lead to inconsistencies. As in the previous case, the difficult parts are proved using model theory. 3. User Transaction Using Feature Constraints FIG. 3 is a diagram showing a user interface of a stationary computer at a moment when an input is made by a querying user. The main query input box 30 is displayed in a well-known format in the dedicated window. For example, a user attempts to enter a one-line query for a book or article after 1990 with a title that includes "constraints" but does not include "Internet." The query box 30 includes boxes 31 and 32. The user selects the boxes 31 and 32 with a mouse and performs a type input in these boxes, that is, inputs all the query elements (for example, “book / article”). Further, using the button 33, it is possible to select an entity relating to the document, such as “title” and restrictions added to the title, such as not including the following. Buttons 34 and 36 are added so that the user can resume, add, edit, and form queries. Each element of the query is sequentially added to the latest query specification, and is displayed in the box 37 in the latest state. When the specific contents of the query are completed, the button 38 is pressed and the search is started. FIG. 4 is a flowchart schematically showing a step of inputting a query element (for example, a date after 90 years) using the interface of FIG. First, the main query window of the knowledge broker is displayed (step s41). Next, each element of the query is sequentially received according to the user's key input (s42). When the user confirms each query element, the "current specific content" is updated to include the displayed element (s43). When the query has been specified and the user selects the "submit" button in FIG. 3, each query element is converted to a corresponding logical relationship (s44) (see section 2 above). Thereafter, the feature constraint is compiled by a set of logical relationships (s45). FIG. 5 shows a paper format 50 suitable for a query input by a user according to another embodiment of the present invention. This embodiment is suitable for a user of a multi-function device or a user with a scanner connected to a computer. The format 50 used includes a plurality of fields 51, 52, 53, 54, which allow the user to enter information such as the type of document, author name, date, and special notes. . However, it should be apparent that any number of fields can be used to enter information about any type of document desired by the user. As is well known, in this case, a frame may be provided next to each of the selection units designated by human-readable lexical characters, and when the user checks this frame, the selection may be determined by machine reading. Further, a frame (55, 56, 57) for handwritten information input may be used. Alternatively, the entire query can be entered on a form in a typed or handwritten form, and the contents of the query can be entered by the OCR and, if necessary, the handwriting recognition device. FIG. 6 is a flowchart schematically showing steps of inputting a query element using the format of FIG. First, the paper is scanned, and a bit-mapped image data file corresponding to the content written on the paper is stored (step s60). Next, the image data is analyzed at positions corresponding to the boxes 55 to 58, and whether the box is checked or the extraction of the information written in the box is analyzed (s61). Next, the query element specified in each of the columns 51 to 54 is determined (s62). At this time, if necessary, a handwriting recognition device and an OCR are used (s63). Thereafter, each query element is converted to a corresponding logical relationship (see section 2 above), and the feature constraint is compiled by the set of logical relationships (s65). FIG. 7 is a flowchart schematically showing a step of acquiring a document designator using a feature constraint and displaying or printing a corresponding document. This operation is performed by a conventional computer or a multi-function device or a printer with a user interface. First, an FC is received from a user. As is well known, this FC is transmitted in the form of a data packet from a portable computer user, for example, as shown in FIG. 8, or directly input to the device by operating the keyboard and mouse or the touch screen. Is done. In response to the user's instruction with the appropriate input, the FC is resolved by the process described in section 3 above, and the resulting request in the appropriate format is sent to the search engine (s92). Using this search request, documents satisfying the FC are searched from all recordable search areas (s93), and the request is made as necessary by Andreoli et al., "Knowledge broker model based on constraints: semantics, execution and analysis." (J. Symbolic Computation, 1996). When a list of hits (of documents satisfying FC) is obtained by the search engine, the list of hits is displayed as shown in FIG. 8 (s94). Next, in response to an appropriate user input, operations such as enlarged display of document details of each hit, conversion of document information to HTML format, or download of a document from a recording area are performed (s95). FIG. 9 shows a display state of the hit selected from the list of FIG. 8 after conversion into the HTML format. As shown, additional information such as author name, http_url, information source, and title is displayed for each hit. If desired, the user can view the document corresponding to hit 1 by clicking the mouse on the displayed http_url. The obtained document is printed as needed (s96). FIG. 10 shows a more detailed display of one selected hit, that is, a series of document attributes. As shown in the figure, a plurality of URLs for linking to an additional page providing information on these attributes are displayed corresponding to the plurality of attributes. Appendix A System axioms There are three sets of axioms: Specific axioms of features and types τ and τ ′ represent arbitrary classifications, and f represents an arbitrary feature. The joint axiom of equality p represents any built-in predicate. The traditional joint axiom is: Built-in predicate axiom This axiom does not describe classifications and features. For example, unequal Axiomized by The dominant constraint is Axiomized by The built-in predicates,>, ≤, ≥, are defined by <and the equal sign. B. Constraint satisfaction 1 In the case of BFC BFC is represented by a <B | Γ> pair. B is a built-in constraint and Γ is an unordered list of classification and feature constraints (read jointly). ⊥ indicates contradiction. There are two sets of rewrite rules. The following rules correspond to the simplification of BFC. The following rules correspond to conflict detection. The following properties support the validity of this algorithm. B. 2. Case of SFC The SFC is represented as an unordered list of BFCs with a sign (+ or-), and one and only component is defined as positive. Let S be SFC. S * Is written as Sn, which is given by the following algorithm: When c0 is the BFC standard format of the positive component of S, if c0 = ⊥, return ⊥. Otherwise, c0 is <B o | Γ o 〉 Form {〈B r | Γ i >} I = 1,. . . , N is the negative component of S For each i = 1, ..., n If i = 1, ..., n such that ci = <B | Γ> and ├τB and Γ is empty, return ⊥. Otherwise, I = {ci ≠ ⊥ I∈1, ..., n} The following properties support the validity of this algorithm.

Claims (1)

【特許請求の範囲】 1. プロセッサ、メモリ、およびユーザインタフェースを含み、ネットワーク を介して、少なくとも一つは電子文書の記録領域を保持する手段を含む一つ以上 の他のデータ処理装置に接続されたデータ処理装置で実行される方法であって、 (a)特徴制約を指示する少なくとも一つのユーザ入力を受信する工程であって 、前記特徴制約は少なくとも一つの正の成分と負の成分を含み、これら正の成分 と負の成分の各々は一つ以上の関係を含み、当該一つまたは各関係は文書に関す るエンティティとそのエンティティの属性を規定する工程と、 (b)特徴制約を解いて前記正および負の成分から一つ以上の文書指示子を決定 する工程であって、当該一つまたは各文書指示子は前記特徴制約を充足する記録 領域内の文書に対応するものである工程と、 を含むことを特徴とする方法。 2. 請求項1に記載の方法において、さらに (c)工程(b)で決定される前記一つまたは各文書指示子を表示する工程を含 むことを特徴とする方法。 3. 請求項2に記載の方法において、さらに (d)表示された文書指示子の一つを指示する第二のユーザ入力に応じて、前記 記録領域から前記文書指示子に対応する文書を取得し、状況に応じて前記文書ま たは文書の一部を表示する工程を含むことを特徴とする方法。 4. 請求項2または3に記載の方法において、さらに (e)第三のユーザ入力に応じて、前記文書指示子に対応する文書が印刷される ようにする工程を含むことを特徴とする方法。 5. 請求項1〜4のいずれかに記載の方法において、工程(a)が、 (a1)少なくとも一つのユーザ入力を受信する工程であって、前記ユーザ入力 は少なくとも一つの関係を規定し、当該一つまたは各関係は文書に関するエンテ ィティおよびそのエンティティの属性を規定する工程と、 (a2)特徴制約をコンパイルする工程であって、前記特徴制約は工程(a1) で受信された関係を含む工程と、を含むことを特徴とする方法。 6. 請求項1〜5のいずれかに記載の方法において、工程(a2)の前に工程 (a1)が複数回繰り返されることを特徴とする方法。 7. 請求項5または6に記載の方法において、前記データ処理装置が携帯型コ ンピュータを含む装置を含み、かつ工程(a1)がタッチスクリーンまたはキー ボードを介してユーザ入力を受信することを含むことを特徴とする方法。 8. 請求項5または6に記載の方法において、前記データ処理装置が据置型コ ンピュータを含む装置を含み、かつ工程(a1)がタッチスクリーン、キーボー ドおよび/あるいはマウスを介してユーザ入力を受信することを含むことを特徴 とする方法。 9. 請求項8に記載の方法において、前記据置型コンピュータがスキャン手段 を含む多機能装置を含み、 工程(a1)が、 (a1-1)画像を有する持ち運び可能な媒体をスキャンして、媒体中の少なくと も一つの所定部分に対応する電子信号を生成する工程と、 (a1-2)前記信号から当該信号に対応する関係を決定する工程と、を含むこと を特徴とする方法。 10. 請求項9に記載の方法において、前記媒体が、前記所定部分の各々につ いて、人間が判読できる前記所定部分の配置の指標と、当該配置に関連した、人 間が判読できる前記所定部分に対応する関係の指標と、を有することを特徴とす る方法。 11. 請求項1〜4のいずれかに記載の方法において、工程(a)が、 (f)データパケットを受信する工程と、 (g)データパケットをデコードして特徴制約を抽出する工程であって、前記特 徴制約は一つ以上の関係を含み、当該一つまたは各関係が文書に関するエンティ ティとそのエンティティの属性を規定する工程と、 (h)工程(g)で抽出された特徴制約を保存する工程と、を含むことを特徴と する方法。 12. プロセッサ、メモリ、およびユーザインタフェースを含むデータ処理装 置で実行される方法であって、 (i)保存された特徴制約に対応するグラフィカルオブジェクトを指示する第一 のユーザ入力を受信する工程であって、前記特徴制約は少なくとも一つの正の成 分と負の成分とを含み、これら正の成分と負の成分の各々は一つ以上の関係を含 んでおり、当該一つまたは各関係が文書に関するエンティティとそのエンティテ ィの属性を規定する工程と、 (j)前記特徴制約が他のデータ処理装置に送信されるものであることを示す第 二のユーザ入力を受信する工程と、 (k)特徴制約をデータパケットにエンコードする工程と、 (l)データパケットを送信する工程と、を含むことを特徴とする方法。 13. 請求項1〜12のいずれかに記載の方法において、前記関係の一つが分 類関係であり、この分類関係は対応するエンティティが含む分類を示すことを特 徴とする方法。 14. 請求項1〜13のいずれかに記載の方法において、前記関係の一つが特 徴関係であり、この特徴関係は対応するエンティティが属性を含み、前記属性の 値が第二のエンティティであることを示すことを特徴とする方法。 15. 請求項1〜14のいずれかに記載の方法において、前記属性が、前記エ ンティティの持つ値もしくは値の範囲であることを特徴とする方法。 16. 請求項1〜15のいずれかに記載の方法を実行するために、適切にプロ グラムされたデータ処理装置であって、プロセッサ、メモリ、およびユーザイン タフェースを含むことを特徴とするデータ処理装置。 17. データ処理装置が、 プロセッサと、 プロセッサに接続されたメモリと、 プロセッサおよびメモリに接続されたユーザインタフェースであって、ユーザ の操作によりユーザ入力信号を生成できるようにされたユーザインタフェースと 、を含み、 ネットワークを介し、少なくとも一つは電子文書の記録領域を保存する手段を 含む、一つ以上の他のデータ処理装置に接続され、 特徴制約を指示する少なくとも一つのユーザ入力を受信する手段であって、前 記特徴制約は少なくとも一つの正の成分と負の成分を含み、これら正の成分と負 の成分の各々は一つ以上の関係を含み、当該一つまたは各関係は文書に関するエ ンティティとそのエンティティの属性を規定する手段と、 特徴制約を解いて、前記正および負の成分から一つ以上の文書指示子を決定す る手段であって、当該一つまたは各文書指示子は前記特徴制約を充足する前記記 録領域内の文書に対応する手段と、を含むことを特徴とするデータ処理装置。 18. 請求項17に記載の装置において、前記特徴制約を受信する手段が、少 なくとも一つのユーザ入力を受信する手段であって、当該ユーザ入力が少なくと も一つの関係を規定する手段と、受信された関係を含む特徴制約をコンパイルす る手段と、を含むことを特徴とする装置。 19. 電子文書のアクセスまたは配信を行うシステムであって、 電子文書の記録領域を保持する手段であって、各文書が対応する文書指示子を もつ手段と、 複数のオブジェクトであって、前記オブジェクトの少なくとも一つは携帯型ま たは移動体型であり、各オブジェクトは、当該一つのまたは各オブジェクト及び ユーザインタフェースとの通信手段を含むオブジェクトと、特徴制約を受信、保 存、及び/又は送信する手段であって、前記特徴制約は少なくとも一つの正の成 分と負の成分を含み、これら正の成分と負の成分の各々は一つ以上の関係を含み 、当該一つまたは各関係は文書に関するエンティティとそのエンティティの属性 を規定する手段と、を含むことを特徴とするシステム。 20. 電子文書のアクセスまたは配信を行う携帯型装置であって、 据置型または移動体電子装置およびユーザインタフェースとの通信手段であっ て、前記装置の少なくとも一つは電子文書の記録領域を保持する手段を含み、各 文書は対応する文書指示子をもつ手段と、 特徴制約を受信、保存、及び/又は送信する手段であって、前記特徴制約は少 なくとも一つの正の成分と負の成分を含み、当該正の成分と負の成分の各々は一 つ以上の関係を含み、当該一つまたは各関係は文書に関するエンティティとその エンティティの属性を規定する手段と、を含むことを特徴とする携帯型装置。 21. 文書のスキャン、複写、及び/又は印刷を行う装置であって、 電子文書の記録領域にアクセスする手段であって、各電子文書は対応する文書 指示子を有する手段と、少なくとも一つは携帯型または移動体型である一つ以上 の複数のオブジェクト及びユーザインタフェースと通信する手段と、 特徴制約を受信、保存、及び/又は送信する手段であって、前記特徴制約は少 なくとも一つの正の成分と負の成分を含み、当該正の成分と負の成分の各々は一 つ以上の関係を含み、当該一つまたは各関係は文書に関するエンティティとその エンティティの属性を規定するものである手段と、を含むことを特徴とする装置 。[Claims] 1. Network including processor, memory, and user interface Through at least one including means for retaining a recording area of the electronic document A method performed on a data processing device connected to another data processing device, (A) receiving at least one user input indicating a feature constraint, , The feature constraint includes at least one positive component and a negative component, wherein the positive component And each of the negative components includes one or more relationships, where the or each relationship relates to a document. Defining the entity and attributes of that entity; (B) determining one or more document indicators from the positive and negative components by solving feature constraints; The one or each document designator is a record that satisfies the feature constraint. A process corresponding to the document in the area;   A method comprising: 2. The method of claim 1, further comprising: (C) displaying the one or each document indicator determined in step (b). A method characterized by the following: 3. 3. The method of claim 2, further comprising: (D) responding to a second user input indicating one of the displayed document indicators, A document corresponding to the document designator is obtained from a recording area, and the document or the Or displaying a portion of the document. 4. The method according to claim 2 or 3, further comprising: (E) A document corresponding to the document indicator is printed in response to a third user input A method comprising the step of: 5. The method according to any one of claims 1 to 4, wherein step (a) comprises: (A1) receiving at least one user input, wherein the user input is received; Specifies at least one relationship, where the or each relationship is related to the document Defining the attributes of the entity and its entities; (A2) compiling a feature constraint, wherein the feature constraint is included in step (a1) Including the relationship received at. 6. The method according to any one of claims 1 to 5, wherein the step (a2) is performed before the step (a2). A method, wherein (a1) is repeated a plurality of times. 7. 7. The method according to claim 5, wherein the data processing device is a portable computer. Computer, and the step (a1) includes a touch screen or a key. A method comprising receiving user input via a board. 8. 7. The method according to claim 5, wherein the data processing device is a stationary computer. Computer, and the step (a1) includes a touch screen and a keyboard. Receiving user input via a keyboard and / or mouse. And how. 9. 9. The method according to claim 8, wherein the stationary computer is a scanning means. Including multi-function devices, including   Step (a1) includes: (A1-1) A portable medium having an image is scanned and at least the medium in the medium is scanned. Also generating an electronic signal corresponding to one predetermined portion; (A1-2) determining a relationship corresponding to the signal from the signal. A method characterized by the following. 10. 10. The method of claim 9, wherein the medium is provided for each of the predetermined portions. And a human-readable indicator of the location of the predetermined portion and a person associated with the location. And an index of a relationship corresponding to the predetermined portion in which the interval is legible. Way. 11. The method according to any one of claims 1 to 4, wherein step (a) comprises: (F) receiving a data packet; (G) decoding data packets to extract feature constraints, A feature constraint includes one or more relationships, one or each relationship of which Defining the attributes of the entity and its entities; (H) storing the feature constraint extracted in step (g). how to. 12. Data processing equipment including processor, memory, and user interface The method performed in (I) First indicating a graphical object corresponding to the stored feature constraint Receiving at least one positive input, wherein the feature constraint comprises at least one positive component. And a negative component, each of which includes one or more relationships. The one or each relationship is a document entity and its entity. Defining the attributes of the (J) a second indicator indicating that the feature constraint is to be transmitted to another data processing device. Receiving a second user input; (K) encoding the feature constraint into a data packet; (L) transmitting a data packet. 13. 13. The method according to any one of the preceding claims, wherein one of said relationships is different. This is a class relationship, which is characterized by indicating the classification that the corresponding entity contains. How to sign. 14. 14. The method according to any of the preceding claims, wherein one of said relationships is characteristic. A characteristic relationship, in which the corresponding entity includes an attribute and the attribute The method characterized by indicating that the value is a second entity. 15. 15. The method according to any one of claims 1 to 14, wherein the attribute comprises A value or range of values of the entity. 16. Appropriately suitable for carrying out the method according to any of claims 1 to 15. A data processor comprising a processor, a memory, and a user interface. A data processing device comprising: 17. The data processing device   A processor,   Memory connected to the processor,   A user interface connected to the processor and the memory, the user interface comprising: User interface that can generate a user input signal by the operation of , Including   At least one means for storing the storage area of the electronic document via the network Connected to one or more other data processing devices, including   Means for receiving at least one user input indicating a feature constraint, wherein The feature constraint includes at least one positive component and one negative component. Each of the components of the document contains one or more relationships, where the or each relationship is related to the document. Means for specifying the attributes of the entity and its entities;   Solving feature constraints to determine one or more document indicators from the positive and negative components The one or each document designator satisfies the feature constraint. A means corresponding to a document in the recording area. 18. 18. The apparatus according to claim 17, wherein the means for receiving the feature constraint comprises: Means for receiving at least one user input, wherein the user input is at least Also compiles a feature constraint containing the received relation Means. 19. A system for accessing or delivering electronic documents,   A means for holding a recording area of an electronic document, wherein each document has a corresponding document designator. Means to have,   A plurality of objects, at least one of said objects being portable Or each object is a mobile object, and each object is Receives and stores objects including communication means with the user interface and feature constraints Means for transmitting and / or transmitting, wherein the feature constraint comprises at least one positive component. Contains a minute and a negative component, each of these positive and negative components contains one or more relations. , The or each relationship is an entity relating to the document and the attributes of that entity Means for defining the system. 20. A portable device for accessing or delivering electronic documents,   Communication means for stationary or mobile electronic devices and user interfaces. Wherein at least one of said devices includes means for holding a recording area for an electronic document, The document has a corresponding document designator;   Means for receiving, storing, and / or transmitting feature constraints, wherein said feature constraints are small. At least one positive component and one negative component are included, and each of the positive component and the negative component is one Includes one or more relationships, one or each of which relates to the entity Means for defining the attributes of the entity. 21. An apparatus for scanning, copying, and / or printing a document,   Means for accessing a recording area of an electronic document, wherein each electronic document corresponds to a corresponding document. Means having an indicator and at least one being portable or mobile Means for communicating with a plurality of objects and a user interface of   Means for receiving, storing, and / or transmitting feature constraints, wherein said feature constraints are small. At least one positive component and one negative component are included, and each of the positive component and the negative component is one Includes one or more relationships, one or each of which relates to the entity Means for defining attributes of the entity. .
JP54536198A 1997-04-23 1998-04-23 Knowledge broker using signed feature constraints Pending JP2001521664A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GBGB9708172.3A GB9708172D0 (en) 1997-04-23 1997-04-23 Knowledge brokers using signed feature constraints
GB9708172.3 1997-04-23
PCT/IB1998/000758 WO1998048361A1 (en) 1997-04-23 1998-04-23 Knowledge brokers using signed feature constraints

Publications (1)

Publication Number Publication Date
JP2001521664A true JP2001521664A (en) 2001-11-06

Family

ID=10811192

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54536198A Pending JP2001521664A (en) 1997-04-23 1998-04-23 Knowledge broker using signed feature constraints

Country Status (4)

Country Link
EP (1) EP0985184A1 (en)
JP (1) JP2001521664A (en)
GB (1) GB9708172D0 (en)
WO (1) WO1998048361A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6434546B1 (en) 1998-12-22 2002-08-13 Xerox Corporation System and method for transferring attribute values between search queries in an information retrieval system
US6381598B1 (en) 1998-12-22 2002-04-30 Xerox Corporation System for providing cross-lingual information retrieval

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5862321A (en) * 1994-06-27 1999-01-19 Xerox Corporation System and method for accessing and distributing electronic documents

Also Published As

Publication number Publication date
WO1998048361A1 (en) 1998-10-29
GB9708172D0 (en) 1997-06-11
EP0985184A1 (en) 2000-03-15

Similar Documents

Publication Publication Date Title
US6778979B2 (en) System for automatically generating queries
US6820075B2 (en) Document-centric system with auto-completion
US6732090B2 (en) Meta-document management system with user definable personalities
US6928425B2 (en) System for propagating enrichment between documents
US7133862B2 (en) System with user directed enrichment and import/export control
US7769757B2 (en) System for automatically generating queries
US7117432B1 (en) Meta-document management system with transit triggered enrichment
US20050022114A1 (en) Meta-document management system with personality identifiers
US20060053174A1 (en) System and method for data extraction and management in multi-relational ontology creation
US20060053172A1 (en) System and method for creating, editing, and using multi-relational ontologies
US20060053175A1 (en) System and method for creating, editing, and utilizing one or more rules for multi-relational ontology creation and maintenance
JPH11306171A (en) Item information input method and recording medium
US7020670B1 (en) Document constraint descriptors obtained from user signals indicating attribute-value relations
US20040098389A1 (en) Document search method with interactively employed distance graphics display
KR20120058544A (en) Image element searching
MacEachren et al. HEALTH GeoJunction: place-time-concept browsing of health publications
JP2002511165A (en) Acquisition and distribution of document information based on feature constraints
JP2001521664A (en) Knowledge broker using signed feature constraints
Zhang et al. Weighted ontology-based search exploiting semantic similarity
Zhang et al. Harnessing the wisdom of the crowds for accurate web page clipping
JP2010282403A (en) Document retrieval method
Müller Inducing conceptual user models
Gottron Content extraction-identifying the main content in HTML documents.
Snyder et al. An overview of CARAT: a computer assisted research and analysis tool
Sajja Knowledge Representation Using Fuzzy XML Rules in Web-Based Expert System for Medical Diagnosis

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050419

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080826

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20081028