JP4851789B2

JP4851789B2 - ユーザ関心反映型検索結果指示子使用及び作成システム及び方法

Info

Publication number: JP4851789B2
Application number: JP2005364245A
Authority: JP
Inventors: ジーボブロウダニエル; エムカプランロナルド
Original assignee: Palo Alto Research Center Inc
Current assignee: Palo Alto Research Center Inc
Priority date: 2004-12-21
Filing date: 2005-12-19
Publication date: 2012-01-11
Anticipated expiration: 2025-12-19
Also published as: US20070240078A1; US7890500B2; EP1675025A2; JP2006178978A; US7401077B2; US20060136385A1; EP1675025A3

Description

本発明は、テキストその他のコンテンツを要約して検索結果の意味を表す見出しを提示する技術に関する。

検索システムに対し検索語を与えたときに返ってくる返答には、通常、与えた検索語に関わる文書群へのリンク情報が含まれており、また、システムによっては、リンク先文書に対しそれぞれ検索語との関連度に応じランクが付されている。更に、検索システムの中には、文書のうちどの部分が検索語に関わる部分なのかを示すことによって、ユーザ本人がリンク先文書群の中から自分の必要に合致している文書を選択できるよう、ユーザを手助けするシステムもある。しかしながら、その種の既存検索システムの多くは、文書のうち一部分即ち検索語及びその前後を単純に切り出して表示するだけであり、そうして切り出された部分は文法的に完成した文章になっておらず読みづらいものである。更に、切り出された部分がユーザの関心を反映したものになっていないこともあろう。

米国特許第５４３８５１１号明細書米国特許出願公開第２００４／２３０４１５号明細書 S. Riezler et al., "Statistical Sentence Condensation Using Packing and Stochastic Disambiguation Methods for Lexical-Functional Grammer", in Proceedings of HLT-NAACL 2003, Main Papers, pp.118-125, Edmonton, May-June 2003 R. Mitkov, "Introduction to the Special Issue on Computational Anaphora Resolution", in Computational Linguistics Vol.27, Issue 4, pp.473-477, December 2001 A. Frank, "From Parallel Grammer Development towards Machine Translation - A Project Overview -", in Proceedings of the MT Summit VII: MT in the Great Translation Era, pp.134-142, 1999 R. Kaplan et al., "Lexical Functional Grammer: A Formal System for Grammatical Representation", in "Formal Issues in Lexical-Functional Grammer" ed. by M. Dalrymple, R. Kaplan, J. Maxwell and A. Zaenen, 1995 J. Maxwell III et al., "A Method for Disjunctive Constraint Satisfaction", in "Current Issues in Parsing Technology", ed. by Masaru Tomita, Kluwer Academic Publishers, pp.173-190, 1991 U. Hahn,"Automatic Text Summarization Methods, Systems, Evaluation", Text Knowledge Engineering Lab., Freiburg University, Germany, [online], Internet URL:www.coling.uni-freiburg.de/teaching/studies/jena/ss04/introduction.ppt Paul and Carol Kiparsky, especially in "Fact" re-printed from "Progress in Linguistics", pp.143-173, ed. by M. Bierwisch and K. Heidolph, The Hague: Mouton, 1970 R. Kaplan, "Three Seductions of Conceptual Psycholinguistics", in "Linguistic Theory and Computer Applications", ed. by Peter Whitelock, Mary McGee Wood, Harold L. Somers, Rod Johnson and Paul Bennet, pp.149-188, London Academic Press, 1987

従って、章句の意味を示したやすく読み取れるユーザ関心反映型検索結果指示子を作成できるシステム及び方法があれば、有用であると言えよう。

ここに、本発明の一実施形態に係るユーザ関心反映型検索結果指示子（user-interest sensitive indicators of search results）作成方法は、何個かの検索語を特定するステップと、ユーザ関心情報を特定するステップと、上記検索語に基づき何個かの文書を特定するステップと、検索語及び上記ユーザ関心情報に基づき各文書中から何個かの章句を特定するステップと、何個かの要約変換子（condensation transformations）を決定するステップと、各文書から特定された章句毎に且つ上記検索語、上記ユーザ関心情報及び上記要約変換子に基づき何個かの検索結果指示子を作成するステップと、を有するものである。

図１に、本発明の一実施形態に係るユーザ関心反映型検索結果指示子作成システム１０００の実施環境を、図３にその内部構成をそれぞれ示す。これらの図に示すユーザ関心反映型検索結果指示子作成システム１０００は、任意のコンピュータ又はコンピュータ関連機器の内外を通る通信リンク９９に接続されている。この通信リンク９９には、例えば、通信機能付パーソナルコンピュータ９００、ユーザ関心情報レポジトリ１２００、テキスト文書１１００〜１１０１をアクセス可能に保持している情報レポジトリ１３００、インターネット接続機能付スマートホン１４００等を、随時接続することができる。ユーザ関心反映型検索結果指示子作成システム１０００は、こうした接続を介して随時、テキスト文書１１００〜１１０１にアクセスする。

情報レポジトリ１３００は、例えば、ＨＴＭＬ（hyper text markup language）、ＸＭＬ（extensible markup language）、ＷＭＬ（wireless markup language）等の形式に従いエンコードされているファイルを提供するウェブサーバや、Microsoft（登録商標）Word、Adobe（登録商標）PDF（portable document format）等の形式の文書をアクセス可能に格納しているディジタルライブラリ等によって、実現することができる。また、ユーザ関心情報レポジトリ１２００及び情報レポジトリ１３００をユーザ関心反映型検索結果指示子作成システム１０００に統合した形で、本発明を実施することもできる。更に、それらを単体のデバイスに組み込んだ形で、本発明を実施することもできる。組込先となる単体のデバイスは、既知の又は今後開発される単体のデバイスであって検索対象文書を格納するのに有効利用できるもの、例えば、Personal Jukebox（商標）、Apple（登録商標）Computer iPod（登録商標）等のように記憶機能を有するディジタルデバイスである。

何れの形態で実施するにしろ、文書検索動作はまずユーザが何個かの検索語を与えることによって開始される。例えば、ユーザが検索語“Igor Domaradsky”（人名）及び検索語“plague”（疫病／ペスト）を含む検索要求を発すると、プロキシとして動作するユーザ関心反映型検索結果指示子作成システム１０００は入出力回路１００にてこの検索要求を受け取り、ユーザ関心情報レポジトリ１２００からユーザ関心情報を取り寄せるかメモリ３００からユーザ関心情報を読み込む一方、検索エンジン、インデキシングサービス等に対して問い合わせを行う。問い合わせを受けた検索エンジンやインデキシングサービスは、検索語である“Igor Domaradsky”及び“plague”を含む文書が情報レポジトリ１３００上にあるかどうか検索を行い、検索結果や、検索語を含む文書内章句といった情報を、ユーザ関心反映型検索結果指示子作成システム１０００に返送する。

ユーザ関心反映型検索結果指示子作成システム１０００は、検索結果特定回路４００にて取得した検索結果にて特定されている文書又はページの意味を表すユーザ関心焦点見出し（user-interest focused signal）を作成する。その際、本実施形態に係るユーザ関心反映型検索結果指示子作成システム１０００は、その章句を使用すればその文書又はページを正しく取り寄せられるような章句を章句特定回路８００により特定し、特定した章句又はそれを補強章句作成回路５００により補強して得られる補強章句に基づき何通りかの要約を作成し、その要約を以てその文書又はページのコンテンツを示す見出しとする。要約作成に当たり、ユーザ関心反映型検索結果指示子作成システム１０００は、文書又はページ内の章句からその任意部分を切り出すのではなくて、その章句に基づき且つユーザの関心を反映した形で要約を作成する。そうして得られる見出しは、ユーザが情報取り寄せのため与えた情報に対しぴったりと焦点があった情報になる。この見出しは、ユーザの関心に沿うようその意味を保持させながらより長い章句を要約したものであるから、その見出しを受け取ったユーザは、取り立てて頭脳の負担と感ずることなく且つ迅速に、その見出しによって指し示されている文書が自分の求めるものとどの程度関連するものであるかを、その見出しに基づき判断することができる。

ユーザ関心反映型検索結果指示子作成システム１０００は、要約の作成を、検索結果にて指し示されている文書毎に、その文書に係る章句について実行する。その手段として、ユーザ関心反映型検索結果指示子作成システム１０００のプロセッサ２００は、内蔵型（図３）又は外付け（図５及び図７）のユーザ関心反映型要約作成マネージャ６００を起動させる。起動したユーザ関心反映型要約作成マネージャ６００は、構文解析文法（parsing grammer）情報を取り寄せ、その構文解析文法を使用し各章句に係る構造化意味表現（meaning structure/meaning structure representation）を作成する。その際、一般に１個の章句に対して相互交換性のある複数個の構造化意味表現を作成する。作成した構造化意味表現に対しては後に要約変換子を適用することとなるが、要約変換子適用時に発生するかもしれない意味上の歪曲を事前防止し、或いは要約変換子適用時に発生した意味上の歪曲を事後修復するには、何個かの意味歪曲制限子（meaning distortion constraints）を決定して構造化意味表現に適用するとよい。構造化意味表現に対し意味歪曲制限子を適用するタイミングは、要約変換子の適用と同時であってもよい（例えば意味歪曲制限子を要約変換子に組み込んでもよい）し、発生した意味歪曲を事後修正するためなら対構造化意味表現要約変換子適用後でもよい。

ユーザ関心反映型要約作成マネージャ６００は、作成した構造化意味表現に対し要約変換子を適用してその構造化意味表現の構成要素を削除、統合、調整等することにより、何個かの構造化意味表現圧縮体（reduced meaning structure）を作成する。また、ユーザ関心情報（及び意味歪曲制限子）に従い要約変換子を適用することによって、作成した構造化意味表現圧縮体においてユーザの関心対象概念が保存されるようにする。一例を述べると、ユーザ関心反映型要約作成マネージャ６００は、構造化意味表現圧縮体作成に際してまず、ユーザ関心情報の構成要素を各構造化意味表現の構成要素と比較し、後者のうち前者とマッチしているものをユーザ関心焦点要素として識別する。より具体的には、ユーザ関心情報に“plague”という語が含まれているなら各構造化意味表現の構成要素のうち概念的に“plague”と関連のある語をユーザ関心焦点要素として識別する、という具合である。ユーザ関心情報の構成要素と各構造化意味表現の構成要素との比較は、例えば、概念的類似性（conceptual similarity）判別、同義語・類義語判別、上位語判別、下位語判別といった字句的類似性（literal similarity）判別、統計的類似性（statistical similarity）判別、分布的類似性（distributional similarity）判別、共起類似性（co-occurence similarity）判別等、数ある類似性判別手法により、本発明の技術的範囲から逸脱することなく行うことができる。

例えば、ウェブ等の大規模文書データベース全体での分布的類似性指標を利用すれば、ユーザ関心情報の構成要素と各構造化意味表現の構成要素との類似性を判別することができる。２語間の分布的類似性の度合いは、それらの語が同一文内又は同一文書内で他の語群とどの程度共起するかによって、測ることができる。例えば、“cancer”（癌）及び“melanoma”（黒色腫）は“treatment”（処置／手術／治療）、“radiation”（放射線）等といった同じ語群と同じ文内又は同じ文書内で共起する。従って、“cancer”と“melanoma”の間には分布的類似性があると言える。

また、各構造化意味表現には、その構成要素として、ＬＦＧ（lexical functional grammer）におけるｆ構造化意味表現（f-structure）等の構造化意味表現、ＨＰＳＧ（head-driven phrase structure grammer）における素性構造化意味表現（feature structure）や最小回帰構造化意味表現（minimum recursion semantic structure）、述語解析（predicate calculus）で使用される述語-項構造記述式（predicate-argument formula）例えば獲得知識（semantic fact）、といったものが含まれている（但しこれらに限られるものではない）。中でも獲得知識は、一組の項（独立変数）に対しある述語が適用されるという関係を示す単純な命題表現である。例えば、英文“John saw Bill”中の述語はsaw（seeの過去形）であり、その適用対象はJohnとBillであるから、この英文を獲得知識にエンコードすると命題“see(John,Bill)”となる。また、英文“Sam reaized that John saw Bill”中の主たる述語はrealize、その適用対象はSamとthat節であり、that節内の述語はsaw、その適用対象はJohnとBillであるから、この英文を獲得知識にエンコードすると“realize(Sam,P)”及びP=“see(John,Bill)”という２個の命題になる。

ユーザ関心反映型要約作成マネージャ６００は、先に述べたようにユーザ関心焦点要素を識別した上で、その結果に基づき各構造化意味表現に要約変換子を適用して構造化意味表現圧縮体を作成する。即ち、各構造化意味表現の構成要素のうちユーザ関心情報の対応構成要素とマッチしているもの（ユーザ関心焦点要素）を、ユーザが多大な関心を抱くであろう保持優先度の高い構成要素（例えば獲得知識）としてマークし、マークした獲得知識が保存されるようなやり方で、また好ましくはマークしていない獲得知識が除外されるようなやり方で、各構造化意味表現に対し要約変換子を適用する。

要約変換子の適用目的は、各構造化意味表現に含まれる構成要素乃至獲得知識に対し削除、統合、変形等の操作を施し、これによる要約化を通じて何個かの構造化意味表現圧縮体を作成することにある。ユーザ関心焦点要素識別の際ユーザ関心情報を利用しているから、作成される各構造化意味表現圧縮体においては、特定された章句例えば検索語を含む章句に込められておりユーザが関心を抱くであろう概念が、高い確率を以て保持されることとなる。即ち、要約変換子によって作成される各構造化意味表現圧縮体（例えばテキスト型の構造化意味表現の圧縮体）においては、各構造化意味表現内の構成要素乃至獲得知識とユーザ関心情報内の構成要素乃至獲得知識との間の類似度に応じた優先度に従い、ユーザ関心焦点要素が保持されることとなる。また、要約変換子には意味歪曲制限子を組み込むことができる。意味歪曲制限子を適用することによって、作成される構造化意味表現圧縮体にて章句の意味に関する歪曲が発生する危険性を、減らすことができる。

ユーザ関心反映型要約作成マネージャ６００は、作成した構造化意味表現圧縮体に対し多義性解消モデル（disambiguation model）を適用することによって、尤もらしい何個かの構造化意味表現圧縮体を候補として選択する。多義性解消モデルとしては、例えば、確率的多義性解消モデル、予測型多義性解消モデル等、何個かの構造化意味表現圧縮体の中から適当なものを選択できるモデルであって、使用する言語により記述されているものを何個か使用する。使用する多義性解消モデルに対しては、構造化意味表現圧縮体への適用ひいてはそれによる候補選択に先立って、トレーニングを施すとよい。このトレーニングは、例えば、トレーニングセット中の好適な例題に対し高い確率を割り当てることができ望ましくない又は不適当な例題に対し低い確率を割り当てることができるモデルとなるよう施されるものであり、こうしてトレーニングされた多義性解消モデルから得られる情報例えば確率情報は、トレーニングセットに含まれる素性の望ましさの度合いを測る代理指標となる。注記すべきことに、多義性解消モデルの適用によって候補に選択される何個かの構造化意味表現圧縮体が、自然言語文法例えば英文法に照らして正しい文或いは成り立っている文である必要はない。

ユーザ関心反映型要約作成マネージャ６００は、それら候補たる構造化意味表現圧縮体に対し生成文法（generation grammer）を適用して何通りかの候補要約を作成し、作成した候補要約の中から、特定された章句それぞれについてユーザ関心反映型要約を選択する。このとき作成される候補要約は文法的に正しい文章であってもよいし正しくない文章であってもよい。ユーザ関心反映型要約を選択する都合からすると、作成した候補要約に対しランク付けしておくとよい。例えば、多義性解消モデルとして確率モデルや予測モデルを使用している場合はそうしたモデルから確率情報等のランキング情報が得られるから、そうした情報や、更にそれに文長短縮率等の情報を適宜組み合わせた情報を使用することによって、候補要約にランク付けすることができる。この場合に、特定された章句についてのユーザ関心反映型要約として選択されるのは、候補とされた構造化意味表現圧縮体の中で最高ランクを有するものである。以上のプロセスは、検索結果に示されている章句毎に繰り返し実行される。その上で、ユーザ関心反映型検索結果指示子作成システム１０００のプロセッサ２００は指示子作成回路７００を起動させ、文書から特定された各章句に対応するユーザ関心反映型要約に基づき、ユーザ関心反映型検索結果指示子を作成させる。作成するユーザ関心反映型検索結果指示子に対しては、例えば、動的可選択ユーザインタフェース要素を対応付けることができる。動的可選択ユーザインタフェース要素を介し、ユーザは、ユーザ関心反映型要約やそれに対応する文書内章句を任意に表示させ、展開させ、また折り畳むことができる。

また、ユーザによるインターネット接続機能付スマートホン１４００の操作によって、本発明のやり方による文書検索が開始されるようにしてもよい。その場合には、例えば、インターネット接続機能付スマートホン１４００に内蔵される記憶装置内の文書の他、リモート情報レポジトリ、リモートパーソナルコンピュータ９００等、通信リンク９９を介してアクセス可能な場所にある文書が、検索対象となり得る。

ユーザは、インターネット接続機能付スマートホン１４００に対して、音声認識、ＳＭＳ（short message service）、キーボード等、既知の又は今後開発される入力方法により、検索語を入力する。ユーザ関心情報は、ユーザ関心情報レポジトリ１２００内に蓄えておいてもよいし或いはインターネット接続機能付スマートホン１４００側で保持しておいてもよく、何れにしても必要に応じて随時読み出すことができる。ユーザ関心情報レポジトリ１２００からのユーザ関心情報の読出の際には、例えばユーザ識別子（ユーザＩＤ）を使用してユーザを識別する。また、インターネット接続機能付スマートホン１４００でのユーザ関心情報の保持は、例えばそのスマートホン１４００に内蔵又はセットされたスマートカードその他の記憶媒体を使用して行えばよい。

入力された検索語は、そのスマートホン１４００側で保持している関連文書又は通信ネットワークを介してアクセスした先のリモートストレージ内に格納されている関連文書を選び出すのに、使用される。選んだ文書内に他所参照辞（non-local references）を介した参照関係が含まれている場合は、他所参照辞により参照されている照応辞を用いて参照元の他所参照辞を穴埋めし、補強章句（augmented passages）を作成することもできる。この章句又は補強章句に係るユーザ関心反映型検索結果指示子は、入力された検索語と読み出されたユーザ関心情報とに基づき要約変換子を適用することによって作成される。その結果得られるユーザ関心反映型検索結果指示子は、当該章句の構成要素を好適に且つ優先的に保持している意味見出しとなっており、またモバイルデバイス用の小型ディスプレイ上に容易に表示させることが可能な形式を有するものである。

更に、ユーザ関心反映型検索結果指示子作成システム１０００をスタンドアロン読取装置１５００に組み込んだ形で本発明を実施することもできる。スタンドアロン読取装置１５００には情報レポジトリが組み込まれており、またこの情報レポジトリにはユーザ用パーソナルディジタルライブラリが格納されている。ユーザがスタンドアロン読取装置１５００に何個かの検索語を入力すると、スタンドアロン読取装置１５００に組み込まれているサーチマネージャ乃至システムがこれらの検索語に応じてライブラリ等の検索を行い、関連文書群の中からその検索語を含む章句を何個か識別、特定する。

その上で、この内蔵型のユーザ関心反映型検索結果指示子作成システム１０００が起動され、ユーザ関心情報が読み込まれる。このときのユーザ関心情報の読込元は、例えば、ＲＡＭ（random access memory）等のメモリデバイス、ディスクドライブ、スマートカード、メモリスティック（登録商標）その他、ユーザ関心情報を格納可能な各種の記憶媒体である。ユーザ関心反映型検索結果指示子作成システム１０００は、ユーザ用パーソナルディジタルライブラリ等に格納されており以前に使用したことがある要約変換子を、識別された各文書内章句に適用することによって、検索語及びユーザ関心情報構成要素とマッチする章句構成要素を好適に且つ優先的に保持させる。こうして要約化された章句には、その章句の意味を表す見出しであるユーザ関心反映型検索結果指示子が、現れている。

図２に、本実施形態に係るユーザ関心反映型検索結果指示子作成システム１０００の動作手順の一例を示す。この図はユーザ関心反映型要約作成マネージャ６００を内蔵しているユーザ関心反映型検索結果指示子作成システム１０００についての例を示すものであるが、原理的には外付け型の場合でも同様の動作とすることができる。この図に示すプロセスは、ステップＳ１００にて開始された後直ちにステップＳ１０５に移行する（但しステップＳ１０５は本発明の実施に際し必須ではない）。ステップＳ１０５においては、ユーザが継続的に関心を抱いている概念を指し示す情報であるユーザ関心情報が特定される。ユーザ関心情報は、例えばメモリや、通信リンク９９を介してアクセス可能なファイル内等の場所に格納されており、或いは随時必要に応じて作成される。例えば、ある文書を他の類似文書から区別しまたその違いを強調するような特徴的な語を、予めコンピュータ等により求めておき、ユーザがその文書を選択したときに、その文書に係る特徴的な語をそのユーザに係るユーザ関心情報に一時的に又は永久的に付加するようにすればよい。ステップＳ１０５実行後はプロセスはステップＳ１１０へと進む。

ステップＳ１１０においてはユーザが何個かの検索語を入力する。検索語の入力は、キーボード、手書き文字認識、音声認識その他、既知の又は今後開発される各種の入力方法によって行われる。入力される検索語はそのユーザにとり直近な関心を示す語であるが、本発明を実施する際には、例えばユーザ関心情報を利用して検索語に更なる調整乃至修正を施すこともできる。この後プロセスはステップＳ１１５に進む。

ステップＳ１１５においては文書検索結果が作成される。この文書検索結果には、検索語との関連性が最も高いと検索サービス乃至検索システムが判断した文書が現れる。その際、使用する検索サービス乃至検索システムによっては、各文書内における検索語の登場頻度（term frequency）や全文書に占める検索語登場文書の割合の逆数（inverse document frequency）に従い、検索結果内で各文書がランク付けされる。また、入力された検索語だけでなくその検索語に関連する語まで検索語を広げて、検索が行われるようにすることもできる。更に、文書中のどこに検索語が現れているかに応じて、検索結果内における文書のランクが調整されるようにすることもできる。結局、既知の又は今後開発されるどのような方法によって検索語から文書を選択するようにしたとしても、本発明の技術的範囲から逸脱することはない。この後プロセスはステップＳ１２０へと進む。

ステップＳ１２０においては検索語を含む何個かの章句が特定される。章句とは１個又は複数個の多語文を含むものをいう。章句の特定は、例えば、検索語とその前後にある何個かの語を一体に切り出すことによって行う。切り出す範囲は、例えば、その検索語の前後にある文区切りまでとすればよい。文区切りは、句点、読点、大文字等、周知の区切り指示表現を調べれば分かる。この後プロセスはステップＳ１２５へと進む。

ステップＳ１２５においては各章句内にある検索語が特定される。より厳密には、検索語として入力された語又はその構成要素と同一の又は類似している構成要素が、特定された章句内にあるかどうかが調べられる。入力された検索語に類似しているかどうか又はその度合いは、概念的類似性、屈折類似性（inflectional similarity）、分布的類似性その他、周知な各種の類似性指標に従い調べればよい。

ステップＳ１３０においては、他所参照辞（他所共参照情報）に基づき補強章句が作成される（但しステップＳ１３０は本発明の実施に際し必須ではない）。文に含まれ得る他所参照辞としては例えば代名詞がある。他所参照辞又はその前方にある前方照応辞（anaphora）を用いて表されている文は、仮にその他所参照辞又は前方照応辞を介した参照関係にある語句がユーザ関心対象概念を表す語句であったとしても、その文自体にはユーザ関心情報構成要素が明示されていないことが原因で、作成されるユーザ関心反映型検索結果指示子から省かれかねないものである。そこで、本ステップにおいては、章句内の他所参照辞、前方照応辞又はその双方を析出させ、析出した他所参照辞等に基づき補強章句を作成している。例えば、“Igor Domaradsky worked on bioweapons. He was most focused on plague.”という章句があるとする。この章句に含まれる文のうち２個目の文中の他所参照辞Heは１個目の文中にある前方照応辞Igor Domaradskyを参照しているから、２個目の文は“Igor Domaradsky was most focused on plague.”と同じ意味である。本ステップにおいては、２個目の文に含まれている他所参照辞Heの参照先たる前方照応辞Igor Domaradskyを用い、対応する他所参照辞Heを穴埋めすることにより、２個目の文を“Igor Domaradsky was most focused on plague.”に修正した補強章句が作成される。このように他所参照辞に着目して章句を補強することは、その章句によって表されている概念をより適切に要約する上で役立つことである。プロセスはこの後ステップＳ１３５へと進む。

ステップＳ１３５においては、検索語（及びユーザ関心情報）に基づき、作成済の（補強）章句について何個かのユーザ関心反映型要約が作成される。即ち、このステップにて作成される要約においては、（補強）章句に含まれる検索語及びそれに関連した概念が好適に且つ優先的に保持されており、元々の章句の意味合いがすり込まれている。

また、ユーザ関心情報を利用することによって、特定された章句の構成要素の保持に関する優先的取り扱いを修飾することができる。例えば、検索語に対しては比較的大きな重みを置く一方でユーザ関心情報の構成要素に対しては比較的小さな重みを置くようにする。これは、理論的に見て、ユーザが明示的に且つ自発的に自分の関心対象を示しているのが検索語であるのに対し、ユーザ関心情報によって表されているのはユーザ関心対象であるとはいえより一般的又は不特定的なものである、ということに基づいている。また、非特許文献８に記載されている優先度ユニオン（priority union）を用いて検索語とユーザ関心情報とを結び付けてもよい。優先度ユニオンを用いることにより、検索語とユーザ関心情報との干渉乃至抵触が、検索語優先的に解消されることとなる。プロセスはこの後ステップＳ１４０へと進む。

ステップＳ１４０においては、作成されたユーザ関心反映型要約に基づき何個かのユーザ関心反映型検索結果指示子が作成される。作成されるユーザ関心反映型検索結果指示子は一般に複数個の要約に対応している。即ち、ある文書を示す章句が複数個選択されている場合、章句毎に要約が作成されることから１個の文書に対して複数個の要約が作成されることとなり得る。ユーザ関心反映型検索結果指示子を作成する際には、その元となる要約を、例えば、その要約の元になった章句がその文書に現れている概念をどの程度良好に表しているのか、収集されている他の文書に対するその文書の相違がその要約内の語によってどの程度良好に示されているのか、等といった事項についての統計的指標に基づき、選択する。プロセスは、この後、作成したユーザ関心反映型検索結果指示子を出力するステップＳ１４５に進む。ユーザ関心反映型検索結果指示子の出力先は、例えば、コンピュータディスプレイ、音声合成回路、触覚ディスプレイ等、既知の又は今後開発される各種の出力装置である。プロセスはこの後ステップＳ１５０に進む。

ステップＳ１５０においては、現セッションを終了させる処理を開始してよいか（或いはそのように要求されているか）が、判定される。例えば、一連のキー操作、マシンシャットダウン、タイマ超過等が生じるとセッション終了処理が開始される。現セッションを終了すると判別されなかった場合は、プロセスはステップＳ１１０に戻り、ステップＳ１１０〜Ｓ１５０が繰り返される。ステップＳ１５０にて現セッションを終了すると判別された場合は、プロセスはステップＳ１５５に進んで終了する。

図４に、本実施形態に係るプロセスを、図５に示すような外付け型のユーザ関心反映型要約作成マネージャ６００を用いて実行した場合に、主としてユーザ関心反映型要約作成マネージャ６００により実行されるユーザ関心反映型要約生成手順の一例を示す。このプロセスはＳ２００にて開始された後直ちにステップＳ２０５へと進む。

ステップＳ２０５においては、ユーザ関心反映型要約に要約されるべき章句が特定される。要約対象となる章句は、情報レポジトリ、インデクスサーバ、又は検索エンジンによる検索の結果から読み取ればよい。例えば、検索エンジン又は情報レポジトリからユーザ関心反映型検索結果指示子作成システム１０００へと、関連する章句を直接に送りつけるようなプロトコルを用いるとよい。送りつけられた章句はユーザ関心反映型検索結果指示子作成システム１０００からユーザ関心反映型要約作成マネージャ６００へと転送され、入出力回路６０５を介してプロセッサ６１０に入力される。

また、特定した章句については、その章句内の構成要素と同章句内にある他の構成要素との共参照関係を表す語句、即ち他所参照辞乃至共参照情報に基づき、補強するとよい。語句間の共参照関係については非特許文献２を参照されたい。この後プロセスはユーザ関心情報を特定するステップＳ２１０へと進む。ステップＳ２１０においてはプロセッサ６１０がユーザ関心情報レポジトリ１２００から（ユーザ関心情報メモリ６２５上にない）ユーザ関心情報を取り寄せてメモリ６１５に格納する。このユーザ関心情報は、キーワード、同義語・類義語、上位語、下位語等により表現され、必要なら検索語と優先度ユニオンを組む。プロセッサ６１０は構造化意味表現作成回路６２０を起動して何個かの構造化意味表現を作成させ、更にユーザ関心マッチング回路６３０を起動させて構造化意味表現内のユーザ関心焦点要素を特定する。プロセスは更にステップＳ２１５へと進む。

ステップＳ２１５においては何個かの要約変換子が決定される。要約変換子は、特定された章句の構成要素の統合、削除、変更等によって、その章句を圧縮する手段であり、プロセッサ６１０は例えばメモリ６１５から従前の要約変換子を読み出して使用する。要約変換子は例えばＸＬＥ（Xerox Linguistic Environment:「Xerox」は登録商標）にて準備されているリライトルール乃至関数／機能を使用して表現することができる。また、これ以外の各種言語解析ツール、関数／機能、環境等によって表現することもできる。この後プロセスはステップＳ２２０へと進む。

ステップＳ２２０においては、プロセッサ６１０が要約作成回路６３５を起動させ、メモリ６１５上又はユーザ関心情報メモリ６２５上のユーザ関心情報に基づき、且つ要約変換子を用いて、圧縮章句（構造化意味表現圧縮体）を作成させる。要約変換子は語句選択的に作用するので、使用するユーザ関心情報に基づきこれを適用することによって、章句内のあまり特徴的でない情報例えば各種の修飾語句が除去されることとなる。この後プロセスはステップＳ２２５へと進む。

ステップＳ２２５においては、圧縮章句に基づき要約作成回路６３５に何個かの候補要約を作成させる。候補要約は、その章句の意味を表すユーザ関心焦点表現を示す情報である。候補要約に対しては、確率モデル、予測モデル又はその双方を用いて、選択用のランク付けを施しておいてもよい。この後プロセスはステップＳ２３０へと進む。

ステップＳ２３０においては、プロセッサ６１０が要約選択回路６４０を起動させて候補要約のうち最良の１個を選択させ、選択された最良の候補要約及び章句に基づきユーザ関心反映型要約を作成させる。作成されるユーザ関心反映型要約は、その元となっている文書に含まれる章句についてのユーザ関心焦点見出し（ユーザの関心を集中的に表現した見出し）となる。

こうして作成されるユーザ関心反映型要約及びこれに対応する章句は、ユーザアクションに応じて選択的に、ユーザに提示（例えば表示）することができる。例えば、ユーザ関心反映型要約乃至ノートのうちの要約部上をユーザがクリックすると、その要約部に対応する章句部が提示（表示）されるような、提示（表示）形態を採ることができる。この後プロセスはステップＳ２３５へと進み、図２に示したステップＳ１３５に戻って直ちにステップＳ１４０へと進む。

図６に、本実施形態に係るプロセスを、図７に示す外付け型のユーザ関心反映型要約作成マネージャ６００を用いて実行した場合に、主としてユーザ関心反映型要約作成マネージャ６００により実行されるユーザ関心反映型要約生成手順の一例を示す。このプロセスはＳ３００にて開始された後直ちにステップＳ３０５へと進み、要約対象章句が特定される。例えば、プロセッサ６１０は入出力回路６０５を起動させ、ユーザ関心反映型検索結果指示子作成システム１０００から転送されてくる章句をメモリ６１５上に取り込ませる。

章句がテキスト情報である場合、その章句は、検索によって特定された文書に含まれる１個又は複数個の多語文から構成されている。ステップＳ３０５実行後はプロセスはステップＳ３１０へと進み、特定された章句に係る言語特性が判別される（但し本発明の実施に際しステップＳ３１０は必須でない）。即ち、プロセッサ６１０は言語特性判別回路６４５を起動させてその章句に係る言語の特性を判別させる。

章句に係る言語特性の判別は、例えば、ＸＭＬやＨＴＭＬにおける使用言語識別タグ、その章句の言語学的解析等、既知の又は今後開発される言語判別方法を用いて実行する。この後プロセスはステップＳ３１５へと進む。

ステップＳ３１５においてはユーザ関心情報が特定される。例えば、プロセッサ６１０が入出力回路６０５を起動させてユーザ関心情報レポジトリ１２００やメモリ６１５からユーザ関心情報を読み込む。特定されるユーザ関心情報には、例えば、ユーザ関心対象概念についての明示的又は非明示的表現が何個か含まれている（但しこれに限られるものではない）。例えば、ダイアログボックスその他の入力要素から入力されるキーワード、という形態で、明示的なユーザ関心情報を取得することもできる。また、WordNet（商標）等のレキシコン（レキシカルデータベース）を用いて一組の概念語を生成してもよい。生成する概念語には、例えば、ユーザの関心を明示的に表す語に係る同義語・類義語、上位語、下位語、用例等が含まれる。入力されるキーワードやこうした関連概念語は、ユーザの関心対象情報を反映している。

また、ユーザの関心を間接的乃至非明示的に示す表現に基づきユーザ関心情報を特定してもよい。例えば、ライブラリやデータレポジトリ内におけるユーザブラウジングパターンに基づく推論の他、ユーザの履修カリキュラム、履修経歴、学歴／職歴、熟練度／専門性、趣味等、そのユーザに関わる各種の情報に基づき、ユーザ関心情報を特定することができる。この後プロセスはステップＳ３２０へと進む。

ステップＳ３２０においてはプロセッサ６１０が構文解析文法回路６５０を起動させて構文解析文法を特定させる。構文解析文法の特定は、判別済の言語特性、対象としている文書（例えばテキスト）のジャンル等、特定されている章句やその章句の出自文書の特性であって解明済のもの又は今後解明されるものに基づき、行う。構文解析文法としては、章句を構文解析して構造化意味表現に変換できるものであれば、既知のものでも今後開発されるものでも、またそうした構文解析文法同士の組合せでも、本実施形態にて使用することができる。例えば、ＬＦＧ、ＨＰＳＧ、ＬＴＡＧ（lexical tree adjoining grammer）、ＣＣＧ（combinatory categorical grammer）等やその任意の組合せを使用できる。

例えば、構文解析すべき章句の出自が英字新聞であるなら、「英語」という言語特性及び「新聞」というジャンル特性に基づき、構文解析文法を選択すればよい。また例えば、構文解析すべき章句の出自が英文のバイオエンジニアリング記事であるなら、「英語」という言語特性及び「科学出版物」というジャンル特性に基づき、構文解析文法を選択すればよい。このようなやり方で構文解析文法を選択して適用すれば、各テキスト乃至章句の言語構造を適切に認識することができる。構文解析文法は、予め作成してあった総称的文法（generic grammer）から選んでもよいし、テキスト又はその特定の性質に応じて作成してもよい。この後プロセスはステップＳ３２５へと進む。

ステップＳ３２５においては、プロセッサ６１０が生成文法回路６６０を起動させ、生成文法を特定させる。生成文法としては、その適用により作成される要約が使用言語の文法に適ったものになる文法を選択する。生成文法は構文解析文法と同じ文法であってもよい。例えば、ＬＦＧ、ＨＰＳＧ、ＬＴＡＧ、ＣＣＧのうち又はその任意の組合せ等、既知の又は今後開発される文法であって意味表現内の情報を表す文を生成するのに有用なものを、使用すればよい。また、文とは文法規則に従って構成された有意な構造的表現のことであり、またその要約とは元の文と同種又は類種でその文の意味を表すより小さな構造化意味表現のことであるから、表形式の情報も文の一種である。表形式情報の要約は、例えば、検索語と、ユーザ関心情報の構成要素のうちユーザの関心を意味的に反映した見出しになり得る構成要素と、を含む表形式の予測情報となろう。

生成文法として使用できる文法としては、例えばあるバージョンのＬＦＧがある。即ち、生成文法として使用するＬＦＧが英語等の自然言語の特性を正確にモデリングできる範囲内においては、その生成文法の適用結果は文法的に正しいものになるであろう。ＬＦＧのバージョンの中にはこうした文法的に正しい要約文を生成できるものがあるから、本発明の実施に当たってはそうしたバージョンのＬＦＧを使用するとよい。但し、用いる構文解析文法や生成文法が既知の又は今後開発されるどのような文法であっても、本発明を実施する支障にはならない。この後プロセスはステップＳ３３０へと進む。

ステップＳ３３０においては、各構造化意味表現の構成要素を削除、統合、変更等する何個かの要約変換子が決定される。例えば、メモリ６１５から従前の要約変換子が読み込まれる。要約変換子の記述には、構造化意味表現変換に使用できる何通りかのリライトルールその他、既知の又は将来開発される方法が使用される。この後プロセスはステップＳ３３５へと進む。

ステップＳ３３５においては何個かの意味歪曲制限子が決定される（但し本発明の実施に当たりステップＳ３３５は必須ではない）。例えば、メモリ６１５から従前の意味歪曲制限子が読み込まれる。意味歪曲制限子は随意各要約変換子に組み込まれ又はこれに前後して適用されるものであり、意味歪曲制限子を併用することによって、章句に対して要約変換子を適用したときにその章句の意味が歪曲されないようにすること（又は生じた歪曲を事後修正すること）ができる。例えば、“The CEO believes that 4th quarter earnings will improve”（ＣＥＯは第４四半期の売り上げが上向くであろうと信じている）という章句を要約して“The 4th quarter earnings will improve”（第４四半期の売り上げは上向くであろう）となったとしたら、その要約の値打ちはしれたものである。なぜなら、元の章句はＣＥＯの信念乃至信条を表していたのであって事実を表していたのではないのに、この要約は事実を表すかのようなものになっていて、要約に伴う意味上の歪曲が生じているからである。要約変換子に組み込んだ形で又は要約変換子に前後して意味歪曲制限子を適用すれば、元々の章句に対して意味的に歪曲された要約は生成されにくくなり、また一旦生成されても事後的に排除されることとなる。意味歪曲制限子を要約変換子と同時に適用しても、先立って適用しても、後で適用しても、本発明の技術的範囲から逸脱することはない。この後プロセスはステップＳ３４０へと進む。

ステップＳ３４０においては、プロセッサ６１０が構造化意味表現パック作成回路６６５を起動させ、特定されている章句に基づき且つ構文解析文法を使用して各構造化意味表現から構造化意味表現パック（packaged meaning structure）を作成させる。構造化意味表現パックの基本構成としては、例えば、ＸＬＥにて規定されているｆ構造化意味表現パックに従い表現する構成を使用する。

特定されている章句がテキスト章句である場合、ＸＬＥｆ構造化意味表現パックを作成するに当たっては、その章句についての言語事実文脈リストを作成する。従って、ＸＬＥｆ構造化意味表現パック内には、自然言語に含まれている曖昧性乃至多義性が、効率的にエンコードされることとなる。言語事実文脈とはＣｉ→Ｆｉなる形態にて言語事実を記述したもののことを指しており（Ｃｉ：文脈、Ｆｉ：言語事実）、ＸＬＥｆ構造化意味表現パックにおける文脈は、通常、章句又は文の曖昧性を表現するａｎｄ−ｏｒ森林（論理積と論理和の組合せによる樹状構造化表現）から取り出される解釈肢の集合として、表される。また、ＸＬＥｆ構造化意味表現パックにおいては、仮にあるｆ構造化意味表現パックによって表されている章句に複数通りの解釈があり、ある言語事実がそれら複数通りの解釈のうち何個かにより併有されるべきものであるとしても、その言語事実は１回しか現れない。ＸＬＥｆ構造化意味表現パックは、言語事実がこのような形で正規化された構造化意味表現であるため、その構成要素を探して変換を施す上で好都合である。

より詳細には、まず、自然言語には曖昧性乃至多義性があるため１個の章句から複数通りの解釈が生じることがある。ｆ構造化意味表現パックは、それら複数通りの解釈を表現するよう、しかもそのＸＬＥｆ構造化意味表現パック内にエンコードされている複数通りの解釈のうち何通りかに共通する構成要素がそのＸＬＥｆ構造化意味表現パック内に複数回現れることがないよう、作成される。一例として、“the duck is ready to eat”という文節には“the duck is hungry”（その家鴨は空腹だ）なる意味（解釈）と“the duck is cooked”（その家鴨は料理済だ）なる意味（解釈）とがあるが、ＸＬＥｆ構造化意味表現パック内では“the duck”（その家鴨）がそれら二通りの解釈によって共通下位構造として共有される。従って、下位構造とされている共通構成要素を複数回操作する必要がないため、ｆ構造化意味表現パック内に含まれている情報を操作するための所要時間は短い。この後プロセスはステップＳ３４５へと進む。

ステップＳ３４５においては、プロセッサ６１０がユーザ関心焦点特定回路６９０を起動させ、構造化意味表現パック内の何個かのユーザ関心焦点要素をユーザ関心情報に基づき特定させる。ユーザ関心焦点要素とは、構造化意味表現パックの構成要素のうち、ユーザ関心情報内の対応する構成要素とマッチ又は類似している構成要素のことである。これを特定するには、例えば、ユーザ関心情報の各構成要素が構造化意味表現パック内の対応する構成要素とマッチするかどうかを調べ、構造化意味表現パックの構成要素のうちマッチしているとの結果が得られた構成要素にマークする、という手段によってユーザ関心焦点要素を探せばよい。マッチしているかどうかは、ユーザ関心情報内に表現されている概念と、構造化意味表現パック内に表現されている概念との間の字句的類似性、概念的類似性、統計的類似性等に基づいて調べる。ユーザ関心焦点要素特定後、プロセスはステップＳ３５０へと進む。

ステップＳ３５０においては、プロセッサ６１０が構造化意味表現圧縮体作成回路６７０を起動させ、要約変換子、意味歪曲制限子及びユーザ関心焦点要素を用いて、構造化意味表現パックから構造化意味表現圧縮体を作成させる。構造化意味表現パックに適用される要約変換子は、例えば、さほど特徴的でない構成要素を削除する、構成要素をより短く又はよりコンパクトな表現に置き換える、構成要素を変更する等といった機能（但しこれらに限られない）を有する変換子である。意味歪曲制限子及びユーザ関心焦点要素を用いるのは、要約変換子に拘束を加えることによって、ユーザ関心焦点要素が優先的に保存されるようにしまた章句の意味歪曲が回避されるようにするためである。例えば、ＸＬＥｆ構造化意味表現パック内にエンコードされている事実を、こうした要約変換子の適用によって変形する際、それら要約変換子は、自分にエンコードされているアクション乃至プロセスに従い、適用先の構造化意味表現パック内の構成要素乃至情報のうちさほど特徴的でないものの生起回数が少なくなるよう、そのパック内の事実に追加、削除、変更等を施す。このような事実変形を通じて得られる構造化意味表現圧縮体は、それぞれ採用され得る解釈を表す複数通りの要約化された構造化意味表現が、効果的にエンコードされたものになる。この後プロセスはステップＳ３５５へと進む。

ステップＳ３５５においては、プロセッサ６１０が候補構造化意味表現選択回路６７５を起動させ、構造化意味表現圧縮体及び統計的、確率的乃至予測的多義性解消モデルに基づき、最も尤もらしい何個かの構造化意味表現圧縮体を候補として選択させる。候補たる構造化意味表現圧縮体を選択するための多義性解消手法としては、例えば、確率的手法、字句意味論的（lexical semantic）手法等、既知の又は今後開発されるあらゆる手法を使用する。例えば、まず、構造化意味表現圧縮体について統計的解析を行うことによって、最も尤もらしい多義性解消モデルを特定乃至作成する。

次いで、予測的多義性解消モデルを用いまたプロパティ関数に基づいて特定を行い、構造化意味表現圧縮体の中から最も尤もらしい構造化意味表現圧縮体を選択する。その際、プロパティ関数としては、例えば、属性、属性の組合せ、属性と値との対、動詞幹共起、下位範疇化フレーム、ルールトレース情報等、構造化意味表現に係る既知の又は今後解明される素性を使用できる。また、使用する予測的多義性解消モデルにはトレーニングを施しておく。例えば、トレーニングデータ

に含まれる個々の文ｙと、その文ｙに対応する候補たる構造化意味表現Ｓ（ｙ）を定めておく。更に、予測的多義性解消モデルを、所与の文それぞれに係り次の式

により表される構造化意味表現圧縮体の尤度条件Ｌ（λ）を用いて、トレーニングする。この式中、ｆはプロパティ関数であり、ｙ及びｓは原文と基準（gold-standard）構造化意味表現圧縮体との対である。こうしたトレーニングが済んでいる予測的多義性解消モデルを、例えばメモリ６１５から読み出して構造化意味表現圧縮体に適用すれば、候補たる構造化意味表現圧縮体を特定できる。その結果得られる候補は、通常はフルセットの構造化意味表現圧縮体ではなくそのサブセットである。即ち、確率的乃至統計的多義性解消モデルによって決定される確率情報に基づきしきい値を定め、定めたしきい値を基準としてフルセットの構造化意味表現圧縮体から選り出すことによって、得られたサブセットである。こうして最も尤もらしい構造化意味表現圧縮体が候補として選択された後、プロセスはステップＳ３６０へと進む。

ステップＳ３６０においては、プロセッサ６１０が要約作成回路６８０を起動させて候補要約を作成させる。例えば、候補たる最も尤もらしい構造化意味表現圧縮体に対して生成文法を適用することによって、最も形が整っており該当章句の意味を表現させるにふさわしい文を何個か作成し、その章句についての候補要約とする。この後プロセスはステップＳ３６５へと進む。ステップＳ３６５においては、プロセッサ６１０が要約選択回路６８５を起動させ、作成された何個かの候補要約の中から、該当章句についてのユーザ関心反映型要約として使用できるものを選択させる。この後プロセスはステップＳ３７０に進んで終了し、ステップＳ１３５に戻ってステップＳ１４０へと進む。

図８に、本発明に従いその意味についての指示子を作成できる章句の例“Accompanied by an armed guard, Igor Domaradsky carried a dish with a culture of genetically altered plague through the gates of the ancient fortress like a rare jewel”を示す（但し作図の都合で末尾数語が欠けている）。この章句には何個かの修飾語句が含まれている。例えば、この文中のある部分では、どのようなやり方で“a dish of plague”（ペスト菌／疫病菌の培養皿）が“the gates of the fortress”（城門）を通って運搬されたかが詳細に説明されているが、このような事柄がユーザの関心対象外である場合（ユーザの関心を表す情報からそう判断される場合）には、本発明ではこの章句について例えば“Igor Domaradsky carried a dish with a culture of plague through the gates”（イゴール・ドマラドスキが門を通ってペスト菌の培養皿を運んだ／培養されたペスト菌に感染しているイゴール・ドマラドスキが門を通って皿を運んだ）といった要約が作成され、作成された要約と元々の章句とに基づきユーザ関心反映型検索結果指示子が作成される。そのため、作成されるユーザ関心反映型検索結果指示子の要約部には、どのようにして培養皿が運搬されたかに関する記述が含まれないこととなるが、元々の章句の意味のうちユーザの関心を集める部分が見出し化されているので、当該要約部は好適なものであるといえる。

図９に、本発明の一実施形態においてユーザ関心情報が格納されるデータ構造の第１の例１６００を示す。このユーザ関心情報格納用データ構造１６００は複数の行から構成されていて、各行にはユーザ関心情報構成要素が格納されている。このユーザ関心情報構成要素には、例えば論理和演算子、論理積演算子、拡張演算子、否定演算子等、既知の又は今後開発される概念記法による論理演算子を用いて、拡張、圧縮等が施されている（但しこれは必須ではない）。ここでいう拡張は、シソーラスやオントロジ、例えばWordNet等を利用することによって実現できる。

まず、第１行に記載されているエントリ+{Igor Domaradsky|Igor}は、“Igor Domaradsky”のフルネームが“Igor Domaradsky”、ファーストネームが“Igor”であり、どちらで表現されていてもユーザ関心対象であることに変わりがないことを、表している。

第２行に記載されているエントリ+{disease^＊2}は、二番目のユーザ関心情報構成要素が概念的に“disease”に関するものであることを、表している。このエントリ中のシンボル“^＊”はWordNetにおいて使用されるものであり、その語句の概念範囲をWordNet上にある同義語・類義語、上位語、下位語等へのリンクまで拡張する、という宣言である。そのパラメータが“2”であるから、このエントリによって、WordNetレキシコン内で“disease”から２リンクの範囲内が、概念的に取り込まれることになる。例えば、“viral infection”（ウイルス性疾患）や“bacterial infection”（細菌性感染症）は“disease”（病気）の下位語であるので、“disease”から１リンクの範囲内にある。また、具体的な病名、例えば“Ebola”（エボラ出血熱）、“plague”（ペスト）、“pneumonia”（肺炎）等は、“disease”から２リンクの範囲内に捕らえられる。更に、エントリ冒頭に付されている文字“+”は、そのエントリに記載されている語をユーザ関心対象概念に含めることを、表している。もしエントリ冒頭に付されているのが文字“-”ならば、そのエントリに記載されている語は概念的にユーザ関心対象外とされる。

第３行に記載されているエントリ+{bio-weapons^＊}は、三番目のユーザ関心情報構成要素が概念的に“bio-weapons”（生物兵器）なる語に関するものであること、またこの要素により表される概念内にWordNetレキシコン又はオントロジ内で“bio-weapons”から１リンクの範囲内にある同義語・類義語、上位語、下位語等の集合が包含されること等を、表している。なお“^＊”にパラメータが添えられていないのでリンク数はデフォルト値＝１となる。なお、自明なことであろうが、ＳＵＭＯ（Suggested Upper Merged Vocabulary）、Cyc（商標）等、各種のレキシコン、階層的オントロジ等を用いることもできる。

図１０に、本発明の一実施形態における構造化意味表現パックの第１の例１７００を示す。例示されている構造化意味表現パック１７００は図８に示した文をエンコードし、ＸＬＥｆ構造化意味表現パックに変換したものである。図８に示した文には二通りの意味（解釈）があるため、この文をエンコードした結果である構造化意味表現パック１７００内にも、２個の解釈肢１７１０（Ｃ１）及び１７２０（Ｃ２）が生まれている。即ち、まずａｎｄ−ｏｒ森林５１０により記述されている第１の解釈肢１７１０（Ｃ１）は、図示の通り、前置詞句“with a culture of genetically altered plague”（遺伝子改変され培養されたペスト菌が載った）がイゴールによって運ばれる“dish”（皿）を修飾している、という解釈を表す解釈肢である。これに対して、構成要素の複数回出現をなくすためａｎｄ−ｏｒ森林５１０を参照する参照式Ｃ２［５１０］で表現されている第２の解釈肢１７２０（Ｃ２）は、“with a culture of genetically altered plague”（遺伝子改変され培養されたペスト菌に感染した）が皿を運ぶ“Igor”（イゴール）を修飾している、という解釈を表す解釈肢である。

この図においては、構造化意味表現パック１７００の構成要素のうち、ユーザから与えられた検索語である“Igor Domaradsky”及び“plague”即ちそのユーザの最大関心対象を表す情報には、優先的に保持すべき構成要素であることを示す下線が付されている。また、この段階ではユーザ関心情報構成要素がマークされていないが、それらは後のステップにおいてユーザ関心焦点要素従って優先保持対象としてマークされる。例えば、仮に“fortress”等の語がユーザ関心情報の構成要素であったら、そうした語は後にマークされることとなろう。この図で下線を付した構成要素や、後にマークされる構成要素は、それを抑制乃至削除してしまうとその章句乃至要約がユーザにとり不適なものとなってしまう構成要素である。逆に言えば、下線乃至マーク対象外の構成要素を抑制乃至削除しても、そのユーザにとっての適切性に悪影響を及ぼすこと無しに、章句を要約できる。

図１１に、本発明の一実施形態における構造化意味表現圧縮体パックの第１の例１８００を示す。例示されている構造化意味表現圧縮体パック１８００は、構造化意味表現パック１７００として図１０に例示したＸＬＥｆ構造化意味表現パックの全体に対し、要約変換子を適用した場合に得られるもの（例えばユーザ関心情報に基づきユーザ関心焦点要素をマークして要約変換子を適用した場合に得られるもの）である。但し、この図では、議論の簡明化のため、解釈肢１７１０（Ｃ１）に対応する部分のみを示してある。ユーザ関心情報構成要素と同一又は類似の構成要素には、この図ではマークとして下線を付して表してある。具体的には、ユーザ関心情報（図９参照）の構成要素と字句的にマッチしている構成要素“Igor Domaradsky”及び“plague”に、下線を付してある。即ち、構造化意味表現圧縮体パック１８００の構成要素のうち図中で下線が付されている構成要素は、構造化意味表現パック１７００の構成要素のうち対応するユーザ関心情報の構成要素と字句的にマッチしていたものであり、従ってユーザ関心焦点要素である。なお、ユーザ関心情報と構造化意味表現パック１７００との構成要素間マッチ判別手法としては、本発明の技術的範囲を削ぐこと無しに、これ以外のマッチ判別手法も採用でき、またそれにより“マッチ”と判定される範囲を広げることもできる。

構造化意味表現パック１７００に対し要約変換子を適用することによって得られる構造化意味表現圧縮体パック１８００は、元々の章句の意味乃至解釈を、ユーザの関心対象に的を絞りよりコンパクトなフォーマットに詰め込んだものであり、従って元々の章句の意味合いを端的に表しているものである。仮に、ユーザが以前に“ancient”や“fortress”に対して興味関心を示したことがあったのなら、ユーザ関心情報にはそれらの語が含まれることとなり、そのユーザ関心情報に基づき要約変換子が適用されることとなるため、その結果作成される構造化意味表現圧縮体パックは、図示されている構造化意味表現圧縮体パック１８００とは異なり、“ancient”や“fortress”が出現するものになろう（そうなる確率が高いであろう）。また、これは必須ではないが、意味歪曲制限子を適用すれば、元々の章句に対して意味的に歪曲された構造化意味表現圧縮体パックが生じる確率が低くなる。そのようにして作成される構造化意味表現圧縮体パックは、元々の章句に含蓄されている意味合いを受け継ぎつつ、その章句から最尤導出された構造化意味表現圧縮体パックであるから、それに基づき作成される要約は、元々の章句に対し意味的に歪曲されたものにはならない。

また、図示されている構造化意味表現圧縮体パック１８００内には、動詞“carry”（運ぶ）の目的語についての解釈肢として、２個の解釈肢１８１０（Ｄ１）及び１８２０（Ｄ２）が含まれている。そのうち解釈肢１８１０（Ｄ１）が“a dish with a culture of plague”が運ばれる、という解釈を示すものであるのに対して、解釈肢１８２０（Ｄ２）は“with”の目的語５６３を参照する形式Ｄ２［５６３］で表されており、従って“a culture of plague”が運ばれる、という解釈を示している。即ち、ある種の要約変換子の適用によって「Ｘの容器」形式の表現が「Ｘ」そのものと認識され、この認識に基づき「容器」が削除されて「Ｘの容器」形式の表現が「Ｘ」形式の表現（図中の例では解釈肢１８２０（Ｄ２））へと圧縮されている。これは、大抵は容器よりその中身の方が重要であり容器自体はさほど重要でない、という事情に鑑みた要約化である。

図１２に、本発明の一実施形態における構造化意味表現圧縮体パックの第２の例１９００を示す。この図に示す構造化意味表現圧縮体パック１９００は、図１１に示した構造化意味表現圧縮体パック１８００でいうと解釈肢１８１０（Ｄ１）に相当しており、それでいてよりコンパクトな形態に圧縮されているものである。即ち、要約変換子適用により構成要素が削除されスペースになった部分を削除する、という手段を使用することにより、更にコンパクトな圧縮体を得たものである。何れの形態を採るにせよ、構造化意味表現圧縮体パックにおいては、ユーザ関心情報構成要素と概念的に似通っている構成要素が保持乃至優先されることとなる。即ち、構造化意味表現圧縮体パックにおいては、さほど特徴的でない情報が削除される一方、ユーザ関心情報が保存されることとなる。

例えば、例示した構造化意味表現圧縮体パック１８００及び１９００の何れにおいても、皿がどのようにして門から搬入されたか、といった事項についての情報は削除されている。これは、ユーザが関心ありと明示している“Igor Domaradsky”及び“plague”とあまり関係がないからである。実際、図示されている何れの例においても、要約候補“Igor Domaradsky carried a dish with a culture of plague through the gate”を導出できる構造化意味表現圧縮体パックが得られている。この候補要約においては、元々の章句の意味合いのうち関心を惹く部分が保持されており、元々の２８語の章句からユーザの関心を惹くであろう１３語へと圧縮・要約化されている。

構造化意味表現（圧縮体）パックに含まれるユーザ関心焦点要素の識別は、例えば、ユーザ関心情報と構造化意味表現（圧縮体）パックとの間の構成要素間マッチ判別、例えば字句的等価性判別や概念マッチ判別により行うことができる。例えば、ユーザ関心情報の構成要素の一つが“container”の後にシンボル“^＊2”を付したものである場合、WordNetレキシコン内内で単語“container”から２リンクの範囲内にある同義語・類義語、上位語、下位語等が、マッチと判別される対象に加えられ（“+”の場合）又は除かれる（“-”の場合：図１３参照）。また、ユーザ関心情報により表されている概念を特定する手段としては、他種レキシコン、例えばＳＵＭＯやCyc等も使用でき、また一種類のレキシコンを単独で使用してもよいが複数種類のレキシコンを組み合わせて使用してもよい。更に、構成要素間の統計的類似性に基づきマッチ度判別を行ってもよい。

図１３に、本発明の一実施形態におけるユーザ関心情報格納用データ構造の第２の例２０００を示す。このユーザ関心情報格納用データ構造２０００の第１行に記載されているエントリ+{fortress^＊3}は、単語“fortress”（城／砦）の概念的範囲をこの単語“fortress”自体に基づきどのように規定するかを、示すエントリである。この例では、WordNetレキシコン内で単語“fortress”から３リンクの範囲内にある同義語・類義語、上位語、下位語等を単語“fortress”の概念的範囲に含める旨、規定されている。自明なことであろうが、本発明の実施にとりWordNetレキシコン使用は必須なものではない。即ち、ユーザ関心情報の記述に当たっては、既知の又は今後開発されるどのようなレキシコン、オントロジ、システム等でも、概念を表現可能なものであれば本発明の技術的範囲を逸脱すること無しに本発明の実施に利用できるし、またそうしたレキシコン、オントロジ、システム等を、単独での利用に限らず、互いに組み合わせて利用することもできる。

第２行に記載されているエントリ+{archaeology^＊}は、ユーザの関心対象の一つが“archaeology”（考古学）であること、またWordNetレキシコン内で単語“archaeology”から１リンク（デフォルトのリンク範囲）の範囲内にある同義語・類義語、上位語、下位語等を全て単語“archaeology”の概念的範囲に含めることを、表している。

第３行に記載されているエントリ+{bronze age^＊}は、ユーザの関心対象の一つが“bronze age”（青銅器時代）であること、またWordNetレキシコン内で単語“bronze age”から１リンク（デフォルトのリンク範囲）の範囲内にある同義語・類義語、上位語、下位語等を全て単語“archaeology”の概念的範囲に含めることを、表している。

第４行に記載されているエントリ+{c:\user\abc\file_history}は、ユーザの関心対象を示す更なる概念語句を、ファイル又はフォルダ“c:\user\abc\file_history”にアクセスして読み込むべきことを、表している（なお、図中の逆スラッシュを明細書中では円記号で表してある。以下同様）。このファイル又はフォルダ“c:\user\abc\file_history”には、例えば、ユーザの関心対象の一つが歴史であることや、歴史の分野におけるユーザの関心対象がどのようなものであるかが、ユーザ関心情報の一部として記述されている。

第５行に記載されているエントリ+{c:\user\abc\file_project1}は、ユーザの関心対象を示す更なる概念語句を、ファイル又はフォルダ“c:\user\abc\file_project1”にアクセスして読み込むべきことを、表している。このファイル又はフォルダ“c:\user\abc\file_project1”には、例えば、ユーザの関心対象の一つがプロジェクト１であることや、プロジェクト１におけるユーザの関心対象がどのようなものであるかが、ユーザ関心情報の一部として記述されている。プロジェクト１は例えば共同プロジェクトであり、この共同プロジェクトに係るファイル内に記述されている様々な概念語句については、例えば、その共同プロジェクトのチームメンバーによる学習的変更その他の調整が施される。このように概念語句を単一のファイル又はフォルダ内にまとめて保存することによって、チームメンバーが他の人間と知識を共有すること、また調整された知識が調整直後から共有されるようにすることができる。

第６行に記載されているエントリ-{container^＊2}は、符号“-”が付されてたエントリであり、従ってこの単語“container”の概念的範囲がユーザの関心対象外であることを表している。即ち、ユーザ関心対象概念からこの単語“container”及びその関連範囲、具体的には単語“container”から２リンクの範囲内にある同義語・類義語、上位語、下位語等がユーザ関心対象から除外され、又はその重みが低減される。例えば、図１０に示した構造化意味表現パック１７００に対し、このエントリを含むユーザ関心情報を適用した場合、図１１に示した構造化意味表現圧縮体パック１８００と違い、解釈肢１８１０（Ｄ１）が抑制され解釈肢１８２０（Ｄ２）が残った構造化意味表現圧縮体パックが、生成されるであろう。

第７行に記載されているエントリ+{Named_Entity.Person^＊}は、ユーザが関心を持っている人タイプのネームドエンティティを表している。ネームドエンティティの識別は、各種の既知の又は今後開発されるネームドエンティティリコグナイザにより行える。

ユーザ関心情報格納用データ構造は、各行のエントリの内容が互いに暗黙的論理和操作により連結される構造とするとよいが、本発明の実施に当たり他種の論理操作、論理結合にて暗黙的又は明示的にエントリ内容同士を連結することもできるし、またそれによって本発明の技術的範囲から逸脱することもない。

本発明を実施するに当たり、作成した要約をユーザに提示乃至表示する際には、ユーザ関心情報を何組かに分け、それぞれ別々のタグ、別の表示特性等によって提示乃至表示するとよい。例えば、ファイル“file_project1”の構成要素に係るユーザ関心焦点要素を表示する際には、タグ“project1”を付する、全体として赤い表示特性で表示する等とする一方、ファイル“file_history”の構成要素に係るユーザ関心焦点要素を表示する際にはタグ“history”を付する、全体として黄色い表示特性で表示する、等といった具合である。

また、ユーザ関心情報構成要素と同一の又は類似度が高い構成要素であるユーザ関心焦点要素は強調文字にて提示乃至表示し、それよりも類似度が低い構成要素は斜字にて提示乃至表示する、というように、予め定めておいた別々の人間可感知表示特性を使用して表示するとよい。このようにしてあれば、作成された要約乃至テキストの関心対象概念に対する関連度、密接度を、ユーザが素早く察知することができる。そのために利用できる表示特性としては、強調、斜字等の文字特性の他、色、フォント、音響、触感等、様々な既知の又は今後開発される人間可感知表示特性を掲げることができる（即ちこれらの例に限られるものではない）。

図１４に、本発明の一実施形態における意味歪曲制限子格納用データ構造の例２１００を示す。この意味歪曲制限子格納用データ構造２１００はパターン部２１１０及びアクション部２１２０を有している。意味歪曲制限子の実体たる制限条件はパターン部２１１０に記述されており、ある行のパターン部２１１０に記述されている制限条件が成立すると、同じ行のアクション部２１２０に記載されている被制限動作即ち要約変換子（の一部）が実行される。

まず、意味歪曲制限子格納用データ構造２１００第１行のパターン部２１１０には、制限条件として“-DOWNWARD_MONOTONIC(P)”が記載されている。冒頭の文字“-”は否定を表しているから、この制限条件は述語“P”が単調下降性（downward monotonic）でないときに成立する。なお、テキスト述語が単調下降という特性を有しているかどうかは、例えば、ＸＬＥにて提供されている関数乃至機能、オントロジーやレキシコン上でのルックアップ動作等、既知の又は今後開発される単調下降性判別手法により、判別することができる。

意味歪曲制限子格納用データ構造２１００第１行のアクション部２１２０には、被制限動作としてリライトルール“CONDENSE_MODIFIERS(P)”が記述されている。このリライトルールは修飾語句省略というリライトルールであり、このリライトルールが実行されると章句内修飾語句が省略される。但し、このリライトルールが実行されるのは、同じ行のパターン部２１１０に記述されている制限条件が満たされたとき、即ち述語“P”が単調下降性でないときだけである。即ち、このリライトルールによる章句内修飾語句省略が実行されるのは、その省略によってその章句が意味的に変化したりしない場合だけである。

例えば、あるレキシコンにおいて“prevent”は単調下降性であるが“cause”はそうでないという具合に情報がエンコードされているとする。また、与えられた文言が“the president prevented a long strike”即ち“prevent”を含む文言であるとする。“prevent”を含んでいるからこの文言は単調下降性であり、従って第１行のパターン部２１１０に記述されている制限条件は満たされず、同じ行のアクション部２１２０に記述されているリライトルールによる文内修飾語句省略は実行されない。もし、“the president prevented a long strike”（社長はストライキの長期化を防いだ）に対して修飾語句省略が実行されていたら修飾語句“long”の省略によって“the president prevented a strike”（社長はストライキを防いだ）となってしまい、要約化に伴う意味歪曲が生じてしまうところであるが、上述のような制限条件を課してあるためこの種の意味歪曲型要約は生じにくい。それでいて、与えられた文言が“the president caused a long strike”（社長が長期ストライキを招いた）である場合は、正しい要約“the president caused a strike”（社長がストライキを招いた）が高い確率で作成されることとなる。

第２行のパターン部２１１０に記述されている制限条件は“PASSIVE(P),SUBJ(P,S),BY-OBJ(P,O)”である。従って、同じ行のアクション部２１２０に記述されている被制限動作が実行されるのは、与えられている述語“P”が受動態で（PASSIVE(P)の条件）、この述語“P”が主語“S”を有していて（SUBJ(P,S)の条件）、且つこの述語“P”が目的語“O”を伴うＢＹ前置詞句を有している（BY-OBJ(P,O)の条件）場合である。

同じ行のアクション部２１２０に記述されてい被る制限動作は“SUBJ(P,O),OBJ(P,S)”、即ち同じ行のパターン部２１１０に係る制限条件が成立した場合に受動態変形を取り除いて文を能動化する動作であり、この動作の実行によって、それまでＢＹ前置詞句の目的語“O”であった語が述語“P”の主語になり（SUBJ(P,O)の動作）、元々述語“P”の主語“S”であった語が目的語になる（OBJ(P,S)の動作）。従って、与えられた文が例えば“John was seen by Bill”であるなら“Bill saw John”という要約が得られる。即ち、この要約変換子の適用の効果である語句“was seen”から語句“saw”への変形及び文内での主語目的語の入れ替えは、対応する意味歪曲制限子による条件制限の下に発動されているから、その実行に伴い章句意味が歪曲されることはない。

第３行のパターン部２１１０に記述されている制限条件“FACTIVE(P,C)”は、補語“C”を有する述語“P”が叙述述語（factive predicate）である場合、即ちその述語“P”の補語“C”が事実であると認め得るような述語“P”が使用されている場合に成立する。この制限条件が成立すると、同じ行のアクション部２１２０に記述されている被制限動作“EXTRACT-COMPLEMENT(P,C)”が起動されて適用され、その述語“P”の補語“C”が抜粋される。なお、叙述述語に関しては、非特許文献７に記載されているので参照されたい。

また、第４行のパターン部２１１０には制限条件“POLARITY-PRESERVE(P,C)”が、同じ行のアクション部２１２０には被制限動作“EXTRACT-COMPLEMENT(P,C)”が、それぞれ記述されている。従って、対象となる語（述語）が極性保存語（polarity preserving word）例えば“manage”である場合にリライトルール“EXTRACT-COMPLEMENT(P,C)”が実行され、補語が抜粋される。

そして、第Ｎ行のパターン部２１１０には制限条件“POLARITY-REVERSE(P,C)”が、同じ行のアクション部２１２０には被制限動作“EXTRACT-COMPLEMENT(P,C),NEGATE(C)”が、それぞれ記述されている。従って、対象となる語（述語）が極性反転語（polarity reversing word）例えば“fail”である場合にリライトルール“EXTRACT-COMPLEMENT(P,C),NEGATE(C)”が実行され、補語の抜粋及び否定が実行される。

例えば、“The administration failed to track down the terrorists”（行政当局はテロリストの逮捕に失敗した）なる文が与えられたとする。この文中の述語“failed”は極性反転語、即ちその補語の意味を反転する語である。そのため、意味歪曲制限子格納用データ構造２１００に格納されている意味歪曲制限子が適用されると、その第Ｎ行の効果によって、補語“to track down the terrorists”の抜粋即ちfailedの削除と、否定即ち“not”の補充とが実行され、“The administration did not track down the terrorists”（行政当局はテロリストを逮捕しなかった）へとリライトされる。このように、述語が極性反転語である場合に要約に元々の意味を継承させるには、補語抜粋時に“not”を補充する必要がある。これに対して、与えられた文が“The administration managed to track down the terrorists”（行政当局はテロリストを上首尾に逮捕した）である場合、この文中の述語“managed”は極性保存語であってその補語の意味を反転させていないから、補語抜粋の際には第４行に規定されている通り“not”を補充せず、“The administration tracked down the terrorists”（行政当局はテロリストを逮捕した）とすることで、元々の意味が継承された許容できる要約を得ることができる。

図１５に、本発明の一実施形態における文書内章句格納用データ構造の例２２００を示す。この文書内章句格納用データ構造２２００はＩＤ部２２１０及び章句部２２２０を有している。

ＩＤ部２２１０には、ユーザ関心反映型検索結果指示子作成システム１０００向けに文書を識別する情報、例えばリンク、ＵＲＬ（uniform resource locator）等のような文書アドレス指定機構による情報が、格納される。

章句部２２２０には、同じ行のＩＤ部即ち文書識別子２２１０により指定されている文書内章句、例えば検索結果として示された文書内に含まれる文のうち検索語を含む文乃至文章が、文書内関連章句として格納される。ＩＤ部２２１０及び章句部２２２０にセットされた情報は保存される。

図１６に従来型検索結果表２３００を示す。この表に概要化して示した検索結果２３１０は、図１５に例示した文書内章句を対象とし“Igor Domaradsky”及び“plague”を検索語として従来型の検索を実行した場合に提示される検索結果である。この検索結果２３１０においては、抜粋に伴い省略された部分が指示子“...”によって示されている。このように単なる抜粋を行うのでは、例えば第１行にある通り、検索語“Igor Domaradsky”及び“plague”を含んでいるとはいえ文としては成り立っていない章句になり、そのため容易に読み解くことができなくなる。また、この検索結果２３１０の第Ｎ行では“Soviet Bioweapons”が省略されてしまっているので、生物兵器（bioweapon）に関心を持つユーザにはそぐわない。このように、単なる切り出しにより作成される検索結果概要２３１０では、ユーザの関心対象例えば生物兵器に関する情報が入るよう元々の章句の意味を表す見出し、即ちユーザ関心焦点見出しを作成することはできない。

図１７に、本発明の一実施形態におけるユーザ関心反映型検索結果指示子格納用データ構造の例２４００を示す。このユーザ関心反映型検索結果指示子格納用データ構造２４００はＩＤ部２４１０及び要約部２４２０を有している。

ＩＤ部２４１０には、ユーザ関心反映型検索結果指示子作成システム１０００内文書識別子、例えばＵＲＬ等既知の又は今後開発される何れかの形式を有し本システム１０００における文書識別に有用なアドレス情報が、格納されている。

要約部２４２０には、元々の章句に係るユーザ関心反映型要約が格納されている。要約部２４２０においては、元々の章句のうちユーザが関心を持っている概念乃至それを表す語が優先的に保持されている。例えば、検索語及びユーザ関心情報は優先度ユニオンを構成しており、要約作成時には、この優先度ユニオンに含まれている構成要素に応じて、元々の章句の構成要素のうちどれを保持すべきかが決められる。その結果として得られる要約は、元々の章句の意味乃至解釈であって意味的にユーザの関心を惹く情報を、見出しとして含んだ要約になる。

図１８に、本発明の一実施形態におけるユーザ関心反映型検索結果指示子の第１画面２５００を示す。この画面２５００に表示されているユーザ関心反映型検索結果指示子は題名部２５１０、要約部２５２０及びリンク部２５３０を有している（但し題名部２５１０及びリンク部２５３０は必須ではない）。

随意設けられる題名部２５１０には文書の題名が含まれる。文書の題名は、例えばその文書内に含まれるタグやラベル（ＨＴＭＬやＸＭＬのもの）に基づき決定すればよい。題名部２５１０は例えばプログラムによって発生させてもよい。

要約部２５２０にはユーザ関心反映型要約、即ち元々の文書内章句に含まれていた意味のうちユーザの関心を惹く見出しとなる情報が含まれる。従って、例えば、検索語を含まない文言“was researching the Soviet Bioweapons program”（図１５の第Ｎ行を参照）も、ユーザが生物兵器に関心を示している場合（図９参照）は、要約部２５２０内の要約に含まれることとなり得る。

図１９に、本発明の一実施形態におけるユーザ関心反映型検索結果指示子の第２画面２６００を示す。この画面２６００に表示されているユーザ関心反映型検索結果指示子は題名部２６１０、展開章句部２６２０及びリンク部２６３０を有している（但し題名部２６１０及びリンク部２６３０は必須ではない）。また、検索語２６４０及び２６４１は強調文字で示されている。

随意設けられる題名部２６１０の中身は、展開章句部２６２０の題名として抜粋又はプログラム生成された文言“Breeding the Plague”を含んでいる。展開章句部２６２０の中身は文書から選り出された章句である。随意設けられるリンク部２６３０の中身は、その文書へのリンク情報である“www.themoscotimes.com/stories/2004/10/22/110.html”となっている。

展開章句部２６２０は、例えば、図１８に示した指示子表示画面２５００上の要約部２５２０上にポインティングデバイスのカーソルを合わせることによって表示される。それによって展開章句部２６２０に章句として表示されるのは、要約部２５２０に表示されていた要約を作成する元になった章句であり、画面２５００に示されていた指示子を含んでおり、また検索結果の意味をその指示子より文脈が整った形で表す見出しとなっている。また、これを表示させる際に使用できるポインティングデバイスとしては、これらに限られるものではないが、マウス、視線追跡デバイス、タッチスクリーン等がある。指示子構成要素とユーザ関心情報構成要素との類似性がどの程度かを示すには、例えば、フォント種類、フォントサイズ、色、斜字等の表示属性を利用して表示分けを行えばよい。

例えば、指示子構成要素乃至語のうちユーザ関心情報とマッチしているもののフォントサイズを、類似度に応じて調整、変更するようにしてもよい。WordNetレキシコン内でその構成要素乃至語から１リンク離れる毎に、フォントサイズを１ポイント変える、といった具合である。また、これは自明なことであろうが、リンク情報、要約部その他関連する章句を含む検索結果指示子を、ユーザ関心反映型ノート（特願２００５−３３７９６１号参照）としてそのユーザのノートファイル内に差し挟んでもよい。

図２０に、従来型検索結果の例として、出生者数、幼児死者数、婚姻者数及び離婚者数を年単位でまとめた表構造２７００による検索結果を示す。図中、２７１０は見出し列、２７２０〜２７４０は１００列ある情報列のうちの４列である（図示の簡略化のため４列だけを描いてあるが実際には１００列表示されている）。この検索結果は、検索語として“marriage”（結婚）を与えたときに、検索システム乃至サービスがその検索語に基づき作成し検索結果として返してきた情報であり、４行×１００列の表構造２７００になっているため、行数乃至列数が多すぎて、ユーザがその表構造２７００から自分の仕事に有用な情報を見つけるのが難しくなっている。

図２１に、本発明の一実施形態におけるユーザ関心反映型表形式検索結果指示子の例２８００を示す。図中、２８１０は見出し列、２８２０及び２８３０は情報列である。この図に示されているユーザ関心反映型表形式検索結果指示子２８００は、表形式のユーザ関心反映型指示子であって、しかもその構造は２行×２列である。即ち、先の表構造２７００における４行×１００列という大きな表に比べ、行数及び列数が少なくなっている。これは、元々の表構造２７００を文法的に解釈する要約変換子を適用した結果である。即ち、ユーザ関心反映型検索結果指示子作成システム１０００においては、検索語である“marriage”と、先に関心が示された情報であるユーザ関心情報構成要素例えば“1950”、“1960”及び“birth”（出生）とに基づき、ユーザ関心反映型表形式検索結果指示子２８００を作成しているため、表形式構造化意味表現に含まれる意味乃至解釈のうちユーザの関心を惹くものを見出しとして示すユーザ関心反映型検索結果指示子が作成されることとなる。

図２２に、本発明の一実施形態におけるユーザ関心反映型画像形式検索結果指示子の例２９２０を示す。図中の画像２９１０は検索によって発見された文書群中のある文書について章句として選択された画像であり、この画像形式章句２９１０におけるユーザ関心対象を示しているのがユーザ関心反映型画像形式検索結果指示子２９２０である。より詳細には、このユーザ関心反映型画像形式検索結果指示子２９２０は、検索語“house”（家）による検索を行って画像を何個か探しだし、そのうち１個に対してこの検索語とユーザ関心情報構成要素“pond”（池）とに基づき画像用要約変換子を適用し、それによって検索語及びユーザ関心情報構成要素とマッチしているとされた章句内構成要素（この場合画像の一部）を用いて、形成されたものである。なお、画像用要約変換子は、周知の技術を様々に利用すれば、実現することができる。こうして得られるユーザ関心反映型画像形式検索結果指示子２９２０は、その画像の意味合いを示しユーザの関心を反映した見出しとなる。ユーザに対しては、この構成要素を含む圧縮画像、小サイズ画像乃至アイコンを提示乃至表示する。また、マッチしているとされた構成要素について説明するテキストを使用して、ユーザ関心反映型画像対象検索結果指示子を作成してもよい。

本発明の実施に際しては、ユーザ関心反映型検索結果指示子作成システム１０００を構成する概略説明済の回路１００〜８００を、汎用コンピュータに適宜プログラミングすることにより、当該コンピュータの一部として実現することができる。また、先に概略説明したユーザ関心反映型検索結果指示子作成システム１０００乃至その構成要素１００〜８００を、他と独立した物理的実体を有するハードウェア回路、例えばＡＳＩＣ（application specific integrated circuit）、ＦＰＧＡ（field programmable gate array）、ＰＬＤ（programmable logic device）、ＰＬＡ（programmable logic array）、ＰＡＬ（programmable array logic）によって実現することもできるし、ディスクリート論理素子又はディスクリート回路部品から組み上げることもできる。先に概略説明したユーザ関心反映型検索結果指示子作成システム１０００乃至その構成要素１００〜８００がどのような回路形態で実現されるかは、設計的な事項であると共に本件技術分野における習熟者（いわゆる当業者）にとり自明且つ予測可能な事項であると言えよう。また、本発明の実施に際し、ユーザ関心反映型検索結果指示子作成システム１０００を、パーソナルコンピュータ、ディジタルジュークボックス、ＰＤＡ（personal digital assistant）等のデバイス内に、組み込むこともできる。更に、ユーザ関心反映型検索結果指示子作成システム１０００を、ローカル又はデスクトップファイルシステムと併用することもできるし、また通信利用型情報レポジトリと併用することもできる。何れにしても、本発明の技術的範囲乃至神髄から逸脱することはない。

ユーザ関心反映型検索結果指示子作成システム１０００乃至その構成要素は、ソフトウェアルーチン、マネージャ乃至オブジェクトといった形態にて実行・実施することができる。その実行環境は例えばプログラミングが施された汎用コンピュータ上、専用コンピュータ上、マイクロプロセッサ上等でとする。ユーザ関心反映型検索結果指示子作成システム１０００乃至その構成要素は、何個かのルーチンをサーバ上のリソース等として通信ネットワーク上に組み込むことによって、実行・実施することもできる。ユーザ関心反映型検索結果指示子作成システム１０００乃至その構成要素は、また、それ自体をソフトウェアシステム、ハードウェアシステム、又はソフトウェア及びハードウェアからなるシステム内（例えばウェブサーバやクライアントデバイスを構成するハードウェア／ソフトウェアシステム内）に物理的に組み込んだ形で、実行・実施することもできる。

図３、図５又は図７に示されているメモリ３００及び６１５並びにユーザ関心情報レポジトリ６３０は、書換可能メモリ、書換不能メモリ、揮発性メモリ、不揮発性メモリ、固定メモリ等を適宜組み合わせる等して実現することができる。

図１、図３、図５及び図７に示されている通信リンク９９は、ユーザ関心反映型検索結果指示子作成システム１０００又はマネージャ等に対して他の通信デバイスを接続できるデバイス乃至システムである限り、或いはデバイス間を接続して通信を行わしむる接続システム乃至構造物である限り、既知の又は将来開発されるどのようなものでもよい。

以上、本発明について先に概略説明した特定の実施形態に基づき説明を行った。しかしながら、いわゆる当業者にとっては明らかな通り、この実施形態に対しては、本発明の技術的範囲を逸脱することなく、様々な置換、変形乃至修正を施すことができる。

本発明の一実施形態に係るユーザ関心反映型検索結果指示子作成システムの実施環境を示す図である。本発明の一実施形態に係るユーザ関心反映型検索結果指示子作成方法を示すフローチャートである。本発明の一実施形態に係るユーザ関心反映型検索結果指示子作成システムの細部を示す図である。本発明の一実施形態におけるユーザ関心反映型要約生成方法の第１の例を示すフローチャートである。本発明の一実施形態におけるユーザ関心反映型要約作成マネージャの第１の例を示す拡大図である。本発明の一実施形態におけるユーザ関心反映型要約生成方法の第２の例を示すフローチャートである。本発明の一実施形態におけるユーザ関心反映型要約作成マネージャの第２の例を示す拡大図である。本発明に従いその意味についての指示子を作成できる章句の例を示す図である。本発明の一実施形態におけるユーザ関心情報格納用データ構造の第１の例を示す図である。本発明の一実施形態における構造化意味表現パックの第１の例を示す図である。本発明の一実施形態における構造化意味表現圧縮体パックの第１の例を示す図である。本発明の一実施形態における構造化意味表現圧縮体パックの第２の例を示す図である。本発明の一実施形態におけるユーザ関心情報格納用データ構造の第２の例を示す図である。本発明の一実施形態における意味歪曲制限子格納用データ構造の例を示す図である。本発明の一実施形態における文書内章句格納用データ構造の例を示す図である。従来型検索結果表を示す図である。本発明の一実施形態におけるユーザ関心反映型検索結果指示子格納用データ構造の例を示す図である。本発明の一実施形態におけるユーザ関心反映型検索結果指示子の第１画面を示す図である。本発明の一実施形態におけるユーザ関心反映型検索結果指示子の第２画面を示す図である。表構造を示す図である。本発明の一実施形態におけるユーザ関心反映型表形式検索結果指示子の例を示す図である。本発明の一実施形態におけるユーザ関心反映型画像形式検索結果指示子の例を示す図である。

符号の説明

６００ユーザ関心反映型要約作成マネージャ、１０００ユーザ関心反映型検索結果指示子作成システム、１１００，１１０１テキスト文書、１２００ユーザ関心情報レポジトリ、１４００インターネット接続機能付スマートホン、１５００スタンドアロン読取装置、１６００，２０００ユーザ関心情報格納用データ構造、１７００構造化意味表現パック、１８００，１９００構造化意味表現圧縮体パック、２１００意味歪曲制限子格納用データ構造、２２００文書内章句格納用データ構造、２２２０，２６２０，２９１０章句（部）、２４００ユーザ関心反映型検索結果指示子格納用データ構造、２４２０，２５２０要約部、２５００，２６００，２８００，２９２０ユーザ関心反映型検索結果指示子、２６４０，２６４１検索語。

Claims

ユーザ関心反映型検索結果指示子作成システムに含まれるコンピュータが、
ユーザにより入力された検索語を受け取るステップと
ユーザが関心を抱いている概念を指し示す情報であるユーザ関心情報を記憶する記憶手段から読み出すことで、前記検索語を入力したユーザのユーザ関心情報を取得するステップと、
前記検索語に基づき検索を行うことで少なくとも１つの文書を選択するステップと、
前記検索語及び前記ユーザ関心情報に基づき、選択した各文書中から複数の章句を特定するステップと、
前記コンピュータに含まれるユーザ関心反映型要約作成マネージャが、前記ユーザ関心情報の構成要素と合致する章句の構成要素の優先度を参照に、章句の構成要素の統合、削除、及び／又は変更によって、特定した章句を圧縮するための複数の要約変換子を決定するステップと、
前記コンピュータに含まれるユーザ関心反映型要約作成マネージャが、各文書から特定された章句毎に、前記検索語、前記ユーザ関心情報及び前記要約変換子に基づき当該章句の要約としてユーザ関心反映型検索結果指示子を作成するステップと、
を実施することを特徴とするユーザ関心反映型検索結果指示子作成方法。
請求項１記載の方法であって、前記章句に他所参照辞が含まれていたらその他所参照辞に対応する前方照応辞を特定し、その前方照応辞に基づき前記章句から補強章句を作成し、前記章句と当該補強章句との組合せ毎に、前記検索語、前記ユーザ関心情報及び前記要約変換子に基づき前記ユーザ関心反映型検索結果指示子を作成する方法。
請求項１記載の方法であって、前記章句について構造化意味表現を作成し、その構造化意味表現の構成要素のうち前記ユーザ関心情報の構成要素とマッチする構成要素に基づき前記章句のユーザ関心反映型要約を作成し、複数のユーザ関心反映型要約が作成された場合、その中から選択された１つのユーザ関心反映型要約を当該章句のユーザ関心反映型検索結果指示子として選択する方法。
請求項３記載の方法であって、前記構造化意味表現を構文解析文法に基づき作成する方法。
請求項３記載の方法であって、前記要約変換子の適用を制限するための条件である意味歪曲制限子に従いつつ前記要約変換子を前記構造化意味表現に適用して前記ユーザ関心反映型要約を作成する方法。
請求項５記載の方法であって、前記構造化意味表現が単調下降性手法を用いて単調下降性があると判別される場合、または前記意味歪曲制限子に叙述述語が含まれている場合のうち少なくとも一方の場合に、その構造化意味表現に基づき要約を作成する際の前記要約変換子の適用を前記意味歪曲制限子により制限する方法。
請求項１記載の方法であって、前記章句は、テキストを含む表で表される方法。
請求項７記載の方法であって、前記ユーザ関心反映型検索結果指示子を作成するステップは、前記ユーザ関心情報の構成要素を前記表の見出しとしたユーザ関心反映型検索結果指示子を作成する方法。