JP4185500B2 - 文書検索システム、文書検索方法及びプログラム - Google Patents

文書検索システム、文書検索方法及びプログラム Download PDF

Info

Publication number
JP4185500B2
JP4185500B2 JP2005071032A JP2005071032A JP4185500B2 JP 4185500 B2 JP4185500 B2 JP 4185500B2 JP 2005071032 A JP2005071032 A JP 2005071032A JP 2005071032 A JP2005071032 A JP 2005071032A JP 4185500 B2 JP4185500 B2 JP 4185500B2
Authority
JP
Japan
Prior art keywords
search
document
question
question sentence
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005071032A
Other languages
English (en)
Other versions
JP2006252419A (ja
Inventor
勝彦 高知尾
光一 笹氣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2005071032A priority Critical patent/JP4185500B2/ja
Priority to CNB2006100573846A priority patent/CN100511228C/zh
Priority to US11/373,991 priority patent/US7765201B2/en
Publication of JP2006252419A publication Critical patent/JP2006252419A/ja
Application granted granted Critical
Publication of JP4185500B2 publication Critical patent/JP4185500B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、自然言語の問い合わせに従う文書検索を行う文書検索システムに係り、特に複数の事柄の問い合わせに対する検索結果をユーザに提示するのに好適な文書検索システム、文書検索方法及びプログラムに関する。
従来から、キーワードまたは自然言語を用いたユーザからの検索要求(問い合わせ)に従って、当該検索要求に合致した文書(文書データ)をデータベースから検索する文書検索システムが知られている。この種の文書検索システムの1つとして、検索された文書の要約を検索結果として生成し、当該要約を当該文書(原文書)と合わせてユーザに提示する技術(以下、先行技術と称する)を適用した文書検索システムが知られている(例えば、特許文献1参照)。この先行技術によれば、原文書と当該原文書の要約とを合わせてユーザに提示することで、ユーザは当該要約から、当該原文書が自分の意図したものであるかを簡単に判断できる。
特開平7−182373号公報(段落0011)
しかしながら、上記した先行技術においては、ユーザからの自然言語による問い合わせ(質問文)で、「複数の事柄(知りたい事柄)」が尋ねられる場合は想定されていない。もし、問い合わせの中に、「…と…を教えて」のように、2つ以上の知りたい事柄が含まれている場合には、検索結果として複数の別々の文書(ヒット文書)、または要約が取得される可能性がある。
例えば、「鞄の色とメーカーを教えて」というように2つ(複数)の事柄を問い合わせている質問文の場合、上記した先行技術においては、
a.「鞄」「色」「メーカー」の全ての単語が含まれる文書
b.「鞄」「色」が含まれる文書
c.「色」「メーカー」が含まれる文書
d.「鞄」「メーカー」が含まれる文書
などがヒット文書となり得る。ここでは、上記a.に該当する文書が見つかれば良いが、そのような文書が必ずしも見つかるとは限らない。もし、上記a.に該当する文書が見つからず、b.やd.に該当する文書のみがヒットした場合、それらは別々の情報として提示される。この場合、個々の情報は、質問の回答として不十分なものとなる。
本発明は上記事情を考慮してなされたものでその目的は、ユーザからの複数の事柄を問い合わせる質問文に対して、個々の事柄に対する検索を実行することにより、問い合わせられた個々の事柄との対応が明確となる検索結果をユーザに提示できる文書検索システム、文書検索方法及びプログラムを提供することにある。
本発明の1つの観点によれば、複数の文書の各々の形態素解析結果がインデックスとして格納された形態素インデックスデータベースを対象として、自然言語の質問文を用いた問い合わせに従うインデックス検索を行うことによって、当該問い合わせに合致した文書を検索する文書検索システムが提供される。このシステムは、ユーザ指定の第1の質問文を受け付ける第1のインタフェースと、この第1のインタフェースで受け付けられた第1の質問文を解析し、当該第1の質問文が複数の事柄を問い合わせている場合、当該第1の質問文から当該複数の事柄の各々を個々に問い合わせる複数の第2の質問文を生成する質問文解析手段と、この質問文解析手段によって生成された複数の第2の質問文の各々に従い、上記形態素インデックスデータベースから上記複数の第2の質問文の各々によってそれぞれ問い合わせられた1つの事柄に合致した文書を検索する検索エンジンと、この検索エンジンによる文書検索の結果が反映された上記第1の質問に対する検索結果をユーザに提示する第2のインタフェースとから構成される。
このような構成の文書検索システムにおいては、ユーザ指定の複数の事柄を問い合わせる第1の質問文から、当該複数の事柄の各々を個々に問い合わせる(つまり1つの事柄を問い合わせる)複数の第2の質問文が生成される。そして、生成された複数の第2の質問文の各々によって問い合わせられたそれぞれ1つの事柄に合致した文書が検索エンジンによって検索される。この複数の第2の質問文の各々の問い合わせに対する文書検索の結果は、元の質問文である第1の質問文のような複数の事柄の問い合わせと異なり、複数の第2の質問文の各々の問い合わせに完全に合致することが期待される。したがって、複数の第2の質問文の各々の問い合わせに対する文書検索の結果が反映された上記第1の質問文に対する検索結果をユーザに提示することで、ユーザは当該第1の質問文により問い合わせられた個々の事柄との対応を明確に認識できる。
ここで、上記複数の第2の質問文の各々に対する文書検索の結果が反映された当該複数の第2の質問文の各々に対する検索結果を連結して、上記第1の質問に対する検索結果を表す検索結果文書を生成する結果連結手段を追加し、この結果連結手段によって生成された検索結果文書が上記第1の質問に対する検索結果として上記第2のインタフェースによってユーザに提示される構成とすると良い。
このような構成の文書検索システムにおいては、第1の質問文により問い合わせられた個々の事柄に対する回答を1つの検索結果文書にまとめてユーザに提示できるため、ユーザは当該検索結果文書を、第1の質問文により問い合わせられた個々の事柄を意識することなく、当該第1の質問文による複数の事柄の問い合わせに対する1つの回答として極めて自然に把握できる。
また、上記複数の第2の質問文の各々に対する文書検索によって取得された文書の要約を生成する要約生成手段と、上記結果連結手段による検索結果の連結に関する連結条件を指定するチューニング情報であって、連結の対象となる上記複数の第2の質問文の各々に対する検索結果として、上記検索エンジンによる文書検索で取得された文書または上記要約生成手段によって生成された当該文書の要約のいずれを用いるかを指定することが可能なチューニング情報を格納するチューニング情報格納ユニットとを追加し、連結の対象となる複数の第2の質問文の各々に対する検索結果として、上記チューニング情報に従い、上記検索エンジンによる文書検索で取得された文書または上記要約生成手段によって生成された当該文書の要約が上記結果連結手段によって選択される構成とすると良い。このようにすると、連結対象として文書または要約を選択可能なため、ユーザにとってより必要な情報が網羅された回答を当該ユーザに提示できる。ここで、検索結果文書中に、当該検索結果文書の生成の元となった、文書検索で取得された文書を参照するためのリンク情報を持たせると良い。
また、複数の第2の質問文の各々に対する検索結果のうちの同一質問文に対する検索結果が互いに類似している複数の検索結果を含む場合に、当該類似している複数の検索結果のうちの1つだけを当該同一質問文に対する検索結果として上記結果連結手段による連結対象とすると良い。このようにすると、上記複数の第2の質問文の各々に対する検索結果を元の第1の質問文に対する検索結果として連結する際の不要な組み合わせ数を減らすことができる。
また、上記結果連結手段による検索結果の連結に関する連結条件をユーザに指定させるユーザインタフェース画面を当該ユーザに提示すると共に、当該インタフェース画面上で当該ユーザによって指定された前記連結条件を含む上記チューニング情報を上記チューニング情報格納ユニットに格納する第3のインタフェースを追加すると良い。このようにすると、ユーザによる連結条件の設定操作が簡単に行える。このインタフェース画面では、連結の対象となる上記検索結果として文書またはの要約のいずれを用いるか、文書を連結の対象とする場合の、連結に使用可能な文書の最大行数、或いは上記複数の第2の質問文の各々に対する検索結果について、同一質問文毎に当該同一質問文に対する検索結果を連結するか等をユーザに設定させることが可能である。
本発明によれば、ユーザからの複数の事柄を問い合わせる質問文に対して、個々の事柄に対する検索を実行することにより、問い合わせられた個々の事柄との対応が明確となる検索結果をユーザに提示できる。特に、個々の事柄に対する検索結果を1つの検索結果文書にまとめてユーザに提示することにより、ユーザは当該検索結果文書を、複数の事柄の問い合わせに対する1つの回答として極めて自然に把握できる。
以下、本発明の実施の形態につき図面を参照して説明する。
図1は本発明の一実施形態に係る文書検索システムの構成を示すブロック図である。この文書検索システムは、ユーザの要求に応じて自然言語検索を行うシステムであり、ユーザインタフェース11と、検索実行/応答サーバ12と、質問文解析機構13と、形態素解析機構14と、形態素検索エンジン15と、形態素インデックスデータベース16と、要約生成機構17と、結果連結機構18と、チューニング情報格納ユニット19とから構成される。
ユーザインタフェース11は、ユーザからの検索要求、例えば自然言語の問い合わせ(つまり質問文)による検索要求を検索条件として入力する検索条件入力インタフェース機能を有する。ユーザインタフェース11はまた、検索要求に対する検索結果をユーザに提示する結果表示インタフェース機能を有する。ユーザインタフェース11は更に、後述する連結チューニングインタフェース機能を有する。即ちユーザインタフェース11は、条件入力インタフェース111、結果表示インタフェース112及び連結チューニングインタフェース113の各インタフェースを有する。本実施形態において、ユーザインタフェース11は、文書検索システムの一部を構成しているが、これに限るものではない。例えば、ユーザインタフェース11が、図1の文書検索システムと通信回線(例えばネットワーク)を介して接続されたクライアント端末に設けられる構成であっても構わない。
検索実行/応答サーバ12は、ユーザインタフェース11により入力された(受け付けられた)検索要求の示す質問文を、当該質問文に従う検索の実行のために質問文解析機構13に渡す。検索実行/応答サーバ12はまた、検索要求に対する応答として、要約生成機構17によって生成された要約、或いは結果連結機構18によって生成された文書(例えば、要約と検索された文書とが連結された文書)をユーザインタフェース11によってユーザに提示させる。
質問文解析機構13は、形態素解析機構14を用いて質問文の形態素解析及び意味解析を行う。質問文解析機構13は、解析された質問文(第1の質問文)が複数の事柄を問い合わせるものである場合、当該質問文から当該複数の事柄の各々を個々に問い合わせる複数(同数)の質問文(第2の質問文)を生成する。
形態素解析機構14は、質問文解析機構13から要求された質問文の形態素解析を行う。形態素検索エンジン15は、質問文解析機構13によって生成された各々の質問文毎に、その質問文を構成する形態素を用いて形態素インデックスデータベース16を参照して形態素(インデックス)検索を行う。形態素インデックスデータベース16は形態素検索エンジン15による検索の対象とする複数の文書の情報を格納する。ここでは、形態素インデックスデータベース16は、文書の形態素解析結果をインデックス(形態素インデックス)として格納する。この形態素インデックスデータベース16に格納される形態素インデックスには、検索の対象となり得る文書の形態素解析、意味解析によって抽出された形態素毎に割り当てられた、位置情報(インデックス)を含む文書情報が登録されている。そこで形態素検索エンジン15は、形態素インデックスデータベース16に格納されている形態素インデックスを用いた質問文毎の形態素検索により、当該質問文に対応した検索結果、即ち当該質問文にヒットした文書を取得する、
要約生成機構17は、形態素検索エンジン15によって検索された文書を形態素解析機構14を用いて形態素解析及び意味解析する。要約生成機構17は、この文書の形態素解析及び意味解析の結果と、当該文書に対応する質問文に対する形態素解析及び意味解析の結果とを照合することで、当該文書から当該文書の要約を生成する。この要約は、当該要約の生成に用いられた文書、即ち質問文に対する検索結果としての文書と同様に、当該質問文に対する検索結果であると見なすことができる。
結果連結機構18は、質問文解析機構13によって生成された質問文毎に、形態素検索エンジン15によって検索された文書(ヒット文書)と要約生成機構17によって生成された要約とから、異なる質問文に対応する文書または要約(検索結果)が連結された新たな文書(検索結果文書)を生成する。つまり結果連結機構18は、質問文毎の形態素検索エンジン15及び要約生成機構17の検索結果から、異なる質問文に対応する検索結果が連結された新たな文書を生成する。チューニング情報格納ユニット19は、結果連結機構18による連結処理の条件(連結条件)が設定されたチューニング情報を格納する。
ユーザインタフェース11、検索実行/応答サーバ12、質問文解析機構13、形態素解析機構14、形態素検索エンジン15、要約生成機構17及び結果連結機構18は、コンピュータにインストールされた特別のソフトウェアプログラムを当該コンピュータ(内のCPU)が読み取って実行することにより実現される。このプログラムは、コンピュータで読み取り可能な記憶媒体に予め格納して頒布可能である。また、このプログラムが、ネットワークを介してダウンロード(頒布)されても構わない。
次に、図1の文書検索システムにおける検索処理について説明する。
今、ユーザが、図1の文書検索システムによる自然言語検索のために、ユーザインタフェース11(条件入力インタフェース111)によってクライアント端末(または文書検索システム)の表示装置に表示されているグラフィカルユーザインタフェース画面(後述する検索要求・チューニング画面)上で、当該端末を用いて自然言語による質問文を入力する操作を行って、当該質問文(の示す検索条件)に従う検索を要求したたものとする。ユーザインタフェース11(条件入力インタフェース111)は、ユーザの質問文入力操作に応じて、クライアント端末から質問文を入力し、当該質問文をユーザからの自然言語による問い合わせ(検索要求)として検索実行/応答サーバ12に送出する。
検索実行/応答サーバ12は、ユーザインタフェース11から質問文を受け取ると、当該質問文に従う自然言語検索の実行のために、当該質問文を質問文解析機構13に送出する。質問文解析機構13は、検索実行/応答サーバ12から質問文を受け取ると、当該質問文を形態素解析機構14に渡して、当該質問文の形態素解析を要求する。これにより形態素解析機構14は、質問文解析機構13から渡された質問文を形態素解析して、当該質問文を単語単位に分割する。形態素解析機構14は、質問文に対する形態素解析結果を質問文解析機構13に返す。
質問文解析機構13は、検索実行/応答サーバ12から受け取った質問文に対する形態素解析機構14による形態素解析結果を用いて、当該質問文の意味を解析する。このように質問文解析機構13は、検索実行/応答サーバ12から受け取った質問文の形態素解析及び意味解析を形態素解析機構14を利用して実行する。質問文解析機構13は、この質問文に対する形態素解析及び意味解析の結果に基づき、当該質問文が複数の事柄を問い合わせるものであるかを判定する。もし、上記質問文が複数の事柄を問い合わせる質問文(第1の質問文)の場合、質問文解析機構13は、当該質問文から当該複数の事柄の各々を個々に問い合わせる(つまり1つの事柄を問い合わせる)複数の質問文(第2の質問文)を生成する。質問文解析機構13は、複数の事柄を問い合わせる質問文から生成されたそれぞれ1つの事柄を問い合わせる複数の質問文を形態素検索エンジン15に渡して、当該複数の質問文の各々について当該形態素検索エンジン15による形態素検索を行わせる。
形態素検索エンジン15はユーザ指定の質問文から生成された、それぞれ1つの事柄を問い合わせる複数の質問文の各々について、形態素インデックスデータベース16に格納されている形態素インデックスを用いて、形態素インデックスデータベース16から当該質問文に合致した文書(ヒット文書)を検索する。この際、形態素検索エンジン15は、質問文に含まれる単語を「全て含む文書」及び「いずれかを含む文書」のどちらかをヒット文書と扱う。形態素検索エンジン15は、上記複数の質問文の各々に対する形態素検索結果として、当該質問文の各々に合致したヒット文書を要約生成機構17及び結果連結機構18に送出する。形態素検索エンジン15はまた、上記複数の質問文の各々に対する質問文解析機構13による形態素解析及び意味解析の結果を要約生成機構17に送出する。
要約生成機構17は、形態素検索エンジン15から送出された、ユーザ指定の質問文に対応する上記複数の質問文の各々に対する検索結果(つまりヒット文書)を受け取ると、形態素解析機構14を用いて、当該複数の質問文の各々に対するヒット文書の形態素解析及び意味解析を行う。要約生成機構17は、上記複数の質問文の各々に対するヒット文書毎に、当該ヒット文書に対する形態素解析及び意味解析形態素の結果と、形態素検索エンジン15から受け取った当該ヒット文書に対応する質問文に対する質問文解析機構13による形態素解析及び意味解析の結果とを比較照合することで、当該ヒット文書において要約に適している部位を特定する。この例では、要約生成機構17は、ヒット文書の「段落単位」「改行単位」または「句点単位」を要約ターゲット範囲として、その範囲毎に、質問文の形態素解析及び意味解析の結果と比較照合することで、当該質問文に最も近い範囲を特定する。要約生成機構17は、上記複数の質問文の各々に対するヒット文書毎に特定した部位(つまりヒット文書の少なくとも一部)を、それぞれ当該文書の要約として生成する。要約生成機構17は、上記複数の質問文の各々に対するヒット文書毎の要約を、当該複数の質問文の各々に対する検索結果として、実行/応答サーバ12及び結果連結機構18に送出する。
結果連結機構18は、形態素検索エンジン15から送られる上記複数の質問文の各々に対する検索結果(ヒット文書)と、要約生成機構17から送られる当該複数の質問文の各々に対する検索結果(ヒット文書の要約)とを利用して、検索結果連結処理を行う。結果連結機構18は、この検索結果連結処理を、チューニング情報格納ユニット19に格納されているチューニング情報の示す連結条件に従って行う。ここでは、ユーザ指定の質問文から生成された複数の質問文の各々に対応して、それぞれ1つの検索結果(例えば、ヒット文書の要約)が選択されて、その選択された検索結果が連結された1つの文書が、当該ユーザ指定の質問文に対する検索結果(検索結果文書)として生成される。結果連結機構18による連結処理によって生成された文書は、検索実行/応答サーバ12を介してユーザインタフェース11に渡され、当該ユーザインタフェース11によりユーザに提示される。
次に、質問文解析機構13による質問文生成処理を含む質問文解析処理の詳細について、図2のフローチャートを参照して説明する。
まず質問文解析機構13は、形態素解析機構14を利用して、検索実行/応答サーバ12から受け取った質問文に対する形態素解析及び意味解析を行う(ステップS1)。即ち形態素解析機構14は、上記質問文に対する形態素解析機構14による形態素解析の結果を用いて、当該質問文の意味を解析し、予め定められた条件を満たす特定の単語については、その単語が持つ意味(例えば、時間、人物、場所)を特定する。
次に質問文解析機構13は、上記意味解析された質問文中の名詞について、例えば、一般名詞(普通名詞)、固有名詞、更には、組織(に関する用語)、地域(に関する用語)、単位(に関する用語、つまり助数詞)及び評価(に関する用語)など、問い合わせに関連する可能性のある用語のいずれに属するかの類別を行う(ステップS2)。次に質問文解析機構13は、ステップS2で類別された名詞間に存在する助詞による接続関係を評価する(ステップS3)。質問文解析機構13は、このステップS3での接続関係の評価結果に基づき、上記質問文の主格に相当する名詞を特定(抽出)する(ステップS4)。
質問文解析機構13は、上記質問文の解析結果に基づき、当該質問文中に、主格に相当する名詞を除く未処理の名詞(つまり未処理の他の名詞)が含まれているかを判定する(ステップS5)。もし、上記質問文中に未処理の他の名詞が含まれているならば、質問文解析機構13は当該質問文からその名詞を1つ取り出す(ステップS6)。質問文解析機構13は、主格に相当する名詞と、質問文から取り出された名詞と、当該質問文に含まれている動詞句、或いは質問文に固有の例えば事物、場所、方角等を表す不定称の指示代名詞(「何?」、「どこ?」など)とを接続することにより、1つの事柄を問い合わせる1つの質問文を生成する(ステップS7)。
質問文解析機構13は、ステップS5〜S7の処理を、質問文中に、上記未処理の他の名詞(主格に相当する名詞を除く未処理の名詞)がなくなるまで繰り返す。これにより質問文解析機構13は、複数の事柄を問い合わせる質問文(第1の質問文)から、それぞれ1つの事柄を問い合わせる、当該複数の事柄と同数の質問文(第2の質問文)を生成する。この複数の事柄を問い合わせる質問文から生成された、それぞれ1つの事柄を問い合わせる複数の質問文は、形態素検索エンジン15に渡される。
次に、上述の質問文解析処理、即ち複数の事柄を問い合わせる質問文から1つの事柄を問い合わせる複数の質問文を生成する処理を含む質問文解析処理、及び当該複数の質問文の各々に対する検索結果を利用した連結処理(例えば、ヒット文書の要約を連結する処理)の具体例について、図3乃至図7を参照して説明する。
まず、ユーザの操作により、図3に示す質問文Qによる問い合わせが、図1の文書検索システムのユーザインタフェース11に要求されたものとする。この質問文Qは、「ABCブックの売値と特徴を教えて」であり、「ABCブック」と呼ばれるはパーソナルコンピュータの売値と特徴を問い合わせるものである。この質問文Qは形態素解析機構14による形態素解析により、「ABCブック(固有名詞)」「の」「売値」「と」「特徴」「を」「教え」「て」に分割される。
質問文解析機構13は、この形態素解析結果を用いて上記ステップS1乃至S4を実行することで、図3に示す質問文Qから主格相当の名詞として「ABCブック」を抽出する。
次に質問文解析機構13は、質問文Qから、主格相当の名詞「ABCブック」以外の名詞として、「売値」及び「特徴」を順次取り出す(ステップS6)。質問文解析機構13は、主格相当の名詞「ABCブック」と、「売値」及び「特徴」とを用いて、質問文Qから生成された複数の質問文(ここでは、質問文Q1及びQ2)を次のように生成する(ステップS7)。まず質問文解析機構13は、「ABCブック」と「売値」及び「特徴」とをそれぞれ連結することで、「ABCブックの売値」及び「ABCブックの特徴」を生成する。次に質問文解析機構13は、質問文Qの中から、「ABCブックの売値」及び「ABCブックの特徴」と助詞によりそれぞれ接続可能な、問い合わせを表す用語(動詞句、「何?」「どこ?」など)を抽出する。ここでは、動詞句「教えて」が抽出される。次に質問文解析機構13は、「ABCブックの売値」及び「ABCブックの特徴」の各々を、助詞「を」を用いて動詞句「教えて」と連結することにより、質問文Qから分解された2つの質問文Q1及びQ2、即ち図4(a)及び(b)にそれぞれ示す、質問文Q1「ABCブックの売値を教えて」及び質問文Q2「ABCブックの特徴を教えて」を生成する。
形態素検索エンジン15は、質問文Q1「ABCブックの売値を教えて」及び質問文Q2「ABCブックの特徴を教えて」に従う検索処理により、形態素インデックスデータベース16から当該質問文Q1及びQ2にそれぞれ合致する文書を検索する。一方、要約生成機構17は、質問文Q1及びQ2にそれぞれ合致する文書(ヒット文書)の要約を生成する。ここでは、質問文Q1に合致するヒット文書として、図5(a)に示すヒット文書D1が取得され、当該ヒット文書D1の要約として図5(b)に示す要約A1が生成されたものとする。同様に、質問文Q2に対する検索結果として、図6(a)に示すヒット文書D2が取得され、当該ヒット文書D2の要約として図6(b)に示す要約A2が生成されたものとする。ここで、要約A2は、ヒット文書D2それ自体であるものとする。このように、質問文Q1に対する検索結果として、ヒット文書D1及び(当該ヒット文書D1の一部である)要約A1が取得され、質問文Q2に対する検索結果として、ヒット文書D2及び(当該ヒット文書D2それ自体である)要約A2が取得される。
結果連結機構18は、チューニング情報格納ユニット19に格納されているチューニング情報に従い、質問文Q1に対する2種の検索結果(D1及びA1)の1つ、例えば要約A1と、質問文Q1とは別の質問文Q2に対する2種の検索結果(D2及びA2)の1つ、例えば要約A2とを連結することにより、図3の質問文Qに対する検索結果(検索結果文書)として、図7に示す1つの文書RDを生成(取得)する。この他に、上記チューニング情報の指定により、質問文Q1に対する2種の検索結果の1つ、例えばヒット文書D1と、質問文Q2に対する2種の検索結果の1つ、例えば要約A2とを連結することも可能である。これとは逆に、質問文Q1に対する2種の検索結果の1つ、例えば要約A1と、質問文Q2に対する2種の検索結果の1つ、例えばヒット文書D2とを連結することも可能である。また、ヒット文書同士、つまりヒット文書D1とヒット文書D2とを連結することも可能である。
このように本実施形態においては、ユーザ指定の質問文Qから生成された2つの質問文Q1及びQ2の各々に対する検索結果の1つをそれぞれ連結することで、当該質問文Q(図3に示す元の質問文Q)に対する検索結果(検索結果文書)を生成する。このようにして生成された検索結果は、質問文Q1及びQ2の各々の問い合わせに対する検索結果を併せ持っており、したがって元の質問文Qによる2つの事柄の問い合わせに対する検索結果を含む。ここで、質問文Qに対する検索結果文書に、当該検索結果文書の生成に用いられた元の文書(つまり質問文Q1及びQ2の各々の問い合わせに対するヒット文書D1及びD2)を参照するためのリンク情報を持たせると良い。
さて、質問文Q1及びQ2は、それぞれ1つの事柄の問い合わせであることから、当該質問文Q1及びQ2の各々の問い合わせに対する検索結果(ヒット文書及び当該ヒット文書の要約)は、元の質問文Qのような2つの事柄の問い合わせと異なり、質問文Q1及びQ2の各々の問い合わせに完全に合致することが期待される。そこで、上述の結果連結機構18による連結処理を行わずに、質問文Q1及びQ2の各々の問い合わせに対する検索結果(例えば、ヒット文書及び要約の少なくとも一方)を、それぞれ当該質問文Q1及びQ2に対応させてユーザに提示するようにしても良い。この場合、ユーザは、質問文Q1及びQ2毎の検索結果から、元の質問文の問い合わせに対する検索結果を容易に想像できる。
次に、質問文Qから生成された質問文Q1及びQ2に対するヒット文書が複数である場合の検索結果連結処理の具体例について、図8及び図9を参照して説明する。
結果連結機構18は、基本的には、質問文Q1に対する複数のヒット文書の要約の各々と、質問文Q2に対する複数のヒット文書の要約の各々との全ての組み合わせを、元の質問文Qに対する検索結果とする。但し、同一質問文に対する複数のヒット文書の要約の中に、同内容と判定される要約が含まれている場合、結果連結機構18は、当該同内容と判定される要約のうちの1つだけを、当該複数のヒット文書の要約とする。ここで、要約が同内容と判定される条件は、当該要約に対応する質問文を質問文Qiで表した場合、当該質問文Qi中の上記主格に相当する第1の名詞、当該第1の名詞と助詞により接続される名詞に相当する第2の名詞、及び問い合わせに対する回答に相当する用語の特徴が類似していることである。
今、質問文Q1に対するヒット文書が、図8(a)及び(c)に示すヒット文書D1a及びD1bであり、その要約が図7(b)及び(d)に示す要約A1a及びA1bであるものとする。同様に、質問文Q2に対するヒット文書が、図9(a)及び(c)に示すヒット文書D2a及びD2bであり、その要約が図9(b)及び(d)に示す要約A2a及びA2bであるものとする。
結果連結機構18は、基本的には、質問文Q1に対応する要約A1a及びA1bの各々と質問文Q2に対応する要約A2a及びA2bの各々との全ての組み合わせを、元の質問文Qに対する検索結果とする。つまり結果連結機構18は、
(1)「要約A1a」と「要約A2a」とが連結された文書
(2)「要約A1a」と「要約A2b」とが連結された文書
(3)「要約A1b」と「要約A2a」とが連結された文書
(4)「要約A1b」と「要約A2b」とが連結された文書
を、元の質問文Qに対する検索結果として生成する。但し、質問文Q1に対応する「要約A1a」と「要約A1b」、或いは質問文Q2に対応する「要約A2a」と「要約A2b」とが類似している場合、結果連結機構18は、質問文に対応する要約を一方で代表する。
図8及び図9の例では、質問文Q1に対応する「要約A1a」と「要約A1b」とは、主格に相当する名詞(固有名詞)「ABCブック」、当該主格に相当する名詞と接続される名詞「売値」に相当する名詞「価格」、及び問い合わせ「売値を教えて」に対する回答を表す用語「22万円」(数値+単位)(つまり単語または用語の特徴)が同一である(類似している)。この場合、結果連結機構18は、質問文Q1に対応する「要約A1a」と「要約A1b」とは同内容であると判定し、質問文Q1に対応する要約を、「要約A1a」及び「要約A1b」のいずれか一方、例えば「要約A1a」で代表させる。即ち結果連結機構18は、上記の4つの組み合わせのうち、(1)及び(2)に示す2つの組み合わせを、元の質問文Qに対する検索結果として生成する。これにより、質問文Q1及びQ2の各々に対する検索結果を元の質問文Qに対する検索結果として連結する際の不要な組み合わせ数を減らすことができる。このことは、後述するように、質問文Q1またはQ2に対するヒット文書を連結対象とする場合にも、同様に適用できる。
次に、ユーザインタフェース11によるチューニング情報の設定について、図10の検索要求・チューニング画面例を参照して説明する。
ユーザインタフェース11(の連結チューニングインタフェース113)は、ユーザが質問文を入力するためにクライアント端末(または文書検索システムの入力装置)を用いて所定の操作を行うと、図10に示す検索要求・チューニング画面を当該クライアント端末の表示装置に表示させる。この検索要求・チューニング画面は、質問文入力領域101と、連結チューナー領域102と、検索指示領域103とを含む。質問文入力領域71は、ユーザに質問文を入力させるための質問文入力フィールドF1を含む。連結チューナー領域102は、結果連結機構18による検索結果連結処理に関する連結条件をユーザに設定させるためのチェックボックスCB1〜CB5を含む。検索指示領域103は、質問文入力フィールドF1に入力された質問文に従う検索の実行(と連結チューナー領域102内で設定された連結条件に従う検索結果連結処理の実行と)をユーザに指示させるための検索実行ボタンB1を含む。
チェックボックスCB1は、質問文入力フィールドF1に入力されたユーザ指定の質問文を複数の質問文に分解し、その分解された複数の質問文に従う検索結果を連結するか否かをユーザに指示させるのに用いられる。上記実施形態は、検索結果を連結することがチェックボックスCB1で指示されている場合を前提としている。
チェックボックスCB2は、検索結果の連結において、要約よりも文書の連結を優先するか否かを(つまり、要約または文書のいずれの連結を優先させるかを)ユーザに指示させるのに用いられる。上記実施形態は、要約よりも文書の連結を優先しないこと(つまり文書よりも要約の連結を優先すること)がチェックボックスCB2で指示されている場合を前提としている。もし、文書の連結を優先することが指示されている場合には、図5及び図6の例では、ヒット文書D1及びD2が連結される。
チェックボックスCB3は、文書を連結する場合の文書の最大行数xを設定するか否かをユーザに指示させるのに用いられる。連結チューナー領域102は、ユーザが文書の最大行数xを入力するための最大行数入力フィールドF2を含む。この最大行数入力フィールドF2は、チェックボックス102cに対応付けて配置される。もし、文書の最大行数xを設定することが指示されていて、且つ連結すべき文書の行数がxを超えている場合には、例えば当該文書に代えて要約が用いられる。チェックボックスCB4は、質問文入力フィールドF1に入力された質問文(元の質問文)から分解(生成)された複数の質問文の各々について、個々の質問文(つまり同一質問文)に対する複数の検索結果を連結するか否かをユーザに指示させるのに用いられる。
チェックボックスCB5は、元の質問文から分解された質問文毎に、連結すべき検索結果(つまり連結対象)の種別(要約またはヒット文書)を指定するか否かをユーザに指示させるのに用いられる。チェックボックスCB5で連結すべき検索結果の種別を指定することが指示された場合、ユーザインタフェース11はチェックボックスCB5の近傍に、質問文毎に連結すべき検索結果の種別をユーザが指定するための入力フィールドを表示する。このフィールドを使用することで、ユーザは、例えば質問文Q1の検索結果として要約A1を用い、質問文Q2の検索結果としてヒット文書D2を用いることを、ユーザインタフェース11に指示できる。
なお、連結チューナー領域102に、元の質問文から分解された複数の質問文に対応する検索結果を連結するときの順番を、例えば質問文順とするか、その逆順とするかを、ユーザに指示させるためのチェックボックスを配置することも可能である。
なお、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
本発明の一実施形態に係る文書検索システムの構成を示すブロック図。 同実施形態における質問文解析機構13による質問文生成処理を含む質問文解析処理の詳細を説明するためのフローチャート。 同実施形態におけるユーザ指定の質問文Qの例を示す図。 上記質問文Qから生成された2つの質問文Q1及びQ2の例を示す図。 上記質問文Q1に対する検索結果としての、ヒット文書D1とその要約A1の例を示す図。 上記質問文Q2に対する検索結果としての、ヒット文書D1とその要約A2の例を示す図。 上記質問文Q1及びQ2の各々に対する検索結果の連結例を示す図。 上記質問文Q1に対する検索結果として、2つのヒット文書D1a及びD1bが取得された場合の、当該文書D1a及びD1bとその要約A1a及びA1bの例を示す図。 上記質問文Q2に対する検索結果として、2つのヒット文書D2a及びD2bが取得された場合の、当該文書D2a及びD2bとその要約A2a及びA2bの例を示す図。 同実施形態で適用される検索要求・チューニング画面例を示す図。
符号の説明
11…ユーザインタフェース、12…検索実行/応答サーバ、13…質問文解析機構、14…形態素解析機構、15…形態素検索エンジン、16…形態素インデックスデータベース、17…要約生成機構、18…結果連結機構、19…チューニング情報格納ユニット、111…条件入力インタフェース(第1のインタフェース)、112…結果表示インタフェース(第2のインタフェース)、113…連結チューニングインタフェース(第3のインタフェース)、F1…質問文入力フィールド、CB1〜CB5…チェックボックス。

Claims (10)

  1. 複数の文書の各々の形態素解析結果がインデックスとして格納された形態素インデックスデータベースを対象として、自然言語の質問文を用いた問い合わせに従うインデックス検索を行うことによって、当該問い合わせに合致した文書を検索する文書検索システムにおいて、
    ユーザによって指定された問い合わせを表す用語を含む自然言語の第1の質問文を入力する第1のインタフェースと、
    前記第1のインタフェースによって入力された前記第1の質問文を形態素解析することにより、当該第1の質問文を単語単位に分割する形態素解析手段と、
    前記第1の質問文から複数の第2の質問文を生成するための質問文解析手段であって、前記形態素解析手段による形態素解析の結果に基づき、前記第1の質問文に含まれている主格に相当する第1の名詞を特定する手段と、前記形態素解析手段による形態素解析の結果に基づき、前記第1の質問文から前記第1の名詞以外の第2の名詞を抽出する手段と、前記第1の質問文に前記第2の名詞が複数含まれている場合、前記第1の質問文から抽出される前記複数の第2の名詞の各々について、前記第1の名詞と、前記第2の名詞と、前記第1の質問文に含まれている前記問い合わせを表す用語とを接続することにより、それぞれ1つの事柄を問い合わせる前記複数の第2の質問文を生成する手段とから構成される質問文解析手段と、
    前記質問文解析手段によって生成された前記複数の第2の質問文の各々に従い、前記形態素インデックスデータベースを参照することにより、前記複数の第2の質問文の各々によってそれぞれ問い合わせられた1つの事柄に合致した文書を検索する検索エンジンと、
    前記検索エンジンによる前記複数の第2の質問文に対するそれぞれの文書検索で取得された文書または当該文書の要約を含む前記第1の質問に対する検索結果をユーザに提示する第2のインタフェースと
    を具備することを特徴とする文書検索システム。
  2. 前記検索エンジンによる前記複数の第2の質問文の各々に対する文書検索で取得された文書または当該文書の要約を含む検索結果を連結して、前記第1の質問に対する検索結果を表す検索結果文書を生成する結果連結手段を更に具備し、
    前記第2のインタフェースは、前記結果連結手段によって生成された検索結果文書を前記第1の質問に対する検索結果としてユーザに提示する
    ことを特徴とする請求項1記載の文書検索システム。
  3. 前記検索エンジンによる前記複数の第2の質問文の各々に対する文書検索によって取得された文書の要約を生成する要約生成手段と、
    前記結果連結手段による検索結果の連結に関する連結条件を指定するチューニング情報であって、連結の対象となる前記複数の第2の質問文の各々に対する前記検索結果として、前記検索エンジンによる文書検索で取得された文書または前記要約生成手段によって生成された当該文書の要約のいずれを用いるかを指定することが可能なチューニング情報を格納するチューニング情報格納ユニットとを更に具備し、
    前記結果連結手段は、連結の対象となる前記複数の第2の質問文の各々に対する前記検索結果として、前記チューニング情報格納ユニットに格納されている前記チューニング情報に従い、前記検索エンジンによる文書検索で取得された文書または前記要約生成手段によって生成された当該文書の要約を選択する
    ことを特徴とする請求項2記載の文書検索システム。
  4. 前記結果連結手段は、前記第2の質問文に対する前記検索結果が互いに類似している複数の検索結果を含む場合に、当該類似している複数の検索結果のうちの1つだけを当該第2の質問文に対する検索結果として連結対象とすることを特徴とする請求項記載の文書検索システム。
  5. 前記結果連結手段による検索結果の連結に関する連結条件をユーザに指定させるユーザインタフェース画面を当該ユーザに提示すると共に、当該インタフェース画面上で当該ユーザによって指定された前記連結条件を含む前記チューニング情報を前記チューニング情報格納ユニットに格納する第3のインタフェースを更に具備することを特徴とする請求項3記載の文書検索システム。
  6. 前記ユーザインタフェース画面は、前記検索エンジンによる文書検索で取得された文書を連結の対象とする場合の、連結に使用可能な文書の最大行数をユーザに指定させる領域を含む請求項5記載の文書検索システム。
  7. 前記ユーザインタフェース画面は、前記複数の第2の質問文の各々に対する前記検索結果について、当該検索結果が複数の検索結果を含む場合に、当該複数の検索結果を連結するかをユーザに指示させる領域を含む請求項5記載の文書検索システム。
  8. 第1のインタフェース、第2のインタフェース、形態素解析手段、質問文解析手段及び検索エンジンを備えたコンピュータに適用され、複数の文書の各々の形態素解析結果がインデックスとして格納された形態素インデックスデータベースを対象として、自然言語の質問文を用いた問い合わせに従うインデックス検索を行うことによって、当該問い合わせに合致した文書を検索する文書検索方法において、
    前記第1のインタフェースがユーザ指定の第1の質問文を入力するステップと、
    前記形態素解析手段が、前記入力するステップで前記第1のインタフェースによって入力された前記第1の質問文を形態素解析することにより、当該第1の質問文を単語単位に分割する形態素解析ステップと、
    前記質問文解析手段が、前記形態素解析手段による前記形態素解析ステップでの結果に基づき、前記第1の質問文に含まれている主格に相当する第1の名詞を特定するステップと、
    前記質問文解析手段が、前記形態素解析手段による前記形態素解析ステップでの結果に基づき、前記第1の質問文から前記第1の名詞以外の第2の名詞を抽出するステップと、
    前記第1の質問文に前記第2の名詞が複数含まれている場合、前記質問文解析手段が、前記第1の質問文から抽出される前記複数の第2の名詞の各々について、前記第1の名詞と、前記第2の名詞と、前記第1の質問文に含まれている前記問い合わせを表す用語とを接続することにより、それぞれ1つの事柄を問い合わせる複数の第2の質問文を生成するステップと、
    前記検索エンジンが、前記生成するステップで前記質問文解析手段によって生成された前記複数の第2の質問文の各々に従い、前記形態素インデックスデータベースを参照することにより、前記複数の第2の質問文の各々によってそれぞれ問い合わせられた1つの事柄に合致した文書を検索するステップと、
    前記第2のインタフェースが、前記検索するステップにおける前記検索エンジンによる前記複数の第2の質問文に対するそれぞれの文書検索で取得された文書または当該文書の要約を含む前記第1の質問に対する検索結果をユーザに提示するステップと
    を具備することを特徴とする文書検索方法。
  9. 前記検索エンジンが、前記検索するステップにおける当該検索エンジンによる前記複数の第2の質問文に対するそれぞれの文書検索で取得された文書を前記コンピュータが備える結果連結手段に送出するステップと、
    前記処理連結手段が、前記送出するステップで前記検索手段によって送出された前記複数の第2の質問文の各々に対する文書検索で取得された文書または当該文書の要約を含む検索結果を連結して、前記第1の質問に対する検索結果を表す検索結果文書を生成するステップとを更に具備し、
    前記提示するステップにおいて前記第2のインタフェースは、前記検索結果文書を生成するステップで前記結果連結手段によって生成された前記検索結果文書を前記第1の質問に対する検索結果としてユーザに提示する
    ことを特徴とする請求項8記載の文書検索方法。
  10. 複数の文書の各々の形態素解析結果がインデックスとして格納された形態素インデックスデータベースを対象として、自然言語の質問文を用いた問い合わせに従うインデックス検索を行うことによって、当該問い合わせに合致した文書を検索するためのプログラムであって、
    第1のインタフェース、第2のインタフェース、形態素解析手段、質問文解析手段及び検索エンジンを備えたコンピュータに、
    前記第1のインタフェースがユーザ指定の第1の質問文を入力するステップと、
    前記形態素解析手段が、前記入力するステップで前記第1のインタフェースによって入力された前記第1の質問文を形態素解析することにより、当該第1の質問文を単語単位に分割する形態素解析ステップと、
    前記質問文解析手段が、前記形態素解析手段による前記形態素解析ステップでの結果に基づき、前記第1の質問文に含まれている主格に相当する第1の名詞を特定するステップと、
    前記質問文解析手段が、前記形態素解析手段による前記形態素解析ステップでの結果に基づき、前記第1の質問文から前記第1の名詞以外の第2の名詞を抽出するステップと、
    前記第1の質問文に前記第2の名詞が複数含まれている場合、前記質問文解析手段が、前記第1の質問文から抽出される前記複数の第2の名詞の各々について、前記第1の名詞と、前記第2の名詞と、前記第1の質問文に含まれている前記問い合わせを表す用語とを接続することにより、それぞれ1つの事柄を問い合わせる複数の第2の質問文を生成するステップと、
    前記検索エンジンが、前記生成するステップで前記質問文解析手段によって生成された前記複数の第2の質問文の各々に従い、前記形態素インデックスデータベースを参照することにより、前記複数の第2の質問文の各々によってそれぞれ問い合わせられた1つの事柄に合致した文書を検索するステップと、
    前記第2のインタフェースが、前記検索するステップにおける前記検索エンジンによる前記複数の第2の質問文に対するそれぞれの文書検索で取得された文書または当該文書の要約を含む前記第1の質問に対する検索結果をユーザに提示するステップと
    を実行させるためのプログラム。
JP2005071032A 2005-03-14 2005-03-14 文書検索システム、文書検索方法及びプログラム Active JP4185500B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005071032A JP4185500B2 (ja) 2005-03-14 2005-03-14 文書検索システム、文書検索方法及びプログラム
CNB2006100573846A CN100511228C (zh) 2005-03-14 2006-03-14 依照自然语言查询进行文献检索的系统和方法
US11/373,991 US7765201B2 (en) 2005-03-14 2006-03-14 System and method of making search for document in accordance with query of natural language

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005071032A JP4185500B2 (ja) 2005-03-14 2005-03-14 文書検索システム、文書検索方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2006252419A JP2006252419A (ja) 2006-09-21
JP4185500B2 true JP4185500B2 (ja) 2008-11-26

Family

ID=36972245

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005071032A Active JP4185500B2 (ja) 2005-03-14 2005-03-14 文書検索システム、文書検索方法及びプログラム

Country Status (3)

Country Link
US (1) US7765201B2 (ja)
JP (1) JP4185500B2 (ja)
CN (1) CN100511228C (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090150387A1 (en) * 2007-11-08 2009-06-11 Marchewitz Jodi L Guided research tool
JP5106155B2 (ja) * 2008-01-29 2012-12-26 株式会社東芝 文書処理装置、方法及びプログラム
US9069814B2 (en) * 2011-07-27 2015-06-30 Wolfram Alpha Llc Method and system for using natural language to generate widgets
KR101529120B1 (ko) * 2013-12-30 2015-06-29 주식회사 케이티 바이오 문헌 정보의 마이닝을 위한 마이닝 패턴 생성 방법 및 시스템
JP6414956B2 (ja) * 2014-08-21 2018-10-31 国立研究開発法人情報通信研究機構 質問文生成装置及びコンピュータプログラム
CN105786874A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于百科词条构建问答知识库数据项的方法和装置
US9916533B2 (en) * 2015-03-10 2018-03-13 International Business Machines Corporation Enhancement of massive data ingestion by similarity linkage of documents
JP6805927B2 (ja) * 2017-03-28 2020-12-23 富士通株式会社 インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法
US11055495B2 (en) * 2017-11-16 2021-07-06 Ntt Docomo, Inc. Utterance sentence generation system and utterance sentence generation program
US10838951B2 (en) 2018-04-02 2020-11-17 International Business Machines Corporation Query interpretation disambiguation

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5251129A (en) * 1990-08-21 1993-10-05 General Electric Company Method for automated morphological analysis of word structure
JP2957875B2 (ja) 1993-03-17 1999-10-06 株式会社東芝 文書情報検索装置及び文書検索結果表示方法
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
US6078914A (en) * 1996-12-09 2000-06-20 Open Text Corporation Natural language meta-search system and method
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision
US5983216A (en) * 1997-09-12 1999-11-09 Infoseek Corporation Performing automated document collection and selection by providing a meta-index with meta-index values indentifying corresponding document collections
US6460029B1 (en) * 1998-12-23 2002-10-01 Microsoft Corporation System for improving search text
US20010053968A1 (en) * 2000-01-10 2001-12-20 Iaskweb, Inc. System, method, and computer program product for responding to natural language queries
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US7209876B2 (en) * 2001-11-13 2007-04-24 Groove Unlimited, Llc System and method for automated answering of natural language questions and queries
KR100849272B1 (ko) * 2001-11-23 2008-07-29 주식회사 엘지이아이 마크업 문서 자동 요약 방법
JP4389102B2 (ja) 2002-10-08 2009-12-24 宍戸 広信 技術文献検索システム
US20040193596A1 (en) * 2003-02-21 2004-09-30 Rudy Defelice Multiparameter indexing and searching for documents

Also Published As

Publication number Publication date
US20060206463A1 (en) 2006-09-14
US7765201B2 (en) 2010-07-27
JP2006252419A (ja) 2006-09-21
CN1834964A (zh) 2006-09-20
CN100511228C (zh) 2009-07-08

Similar Documents

Publication Publication Date Title
JP4185500B2 (ja) 文書検索システム、文書検索方法及びプログラム
JP3429184B2 (ja) テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
US8583419B2 (en) Latent metonymical analysis and indexing (LMAI)
JP6759308B2 (ja) 保守装置
US20080021887A1 (en) Data product search using related concepts
US7024405B2 (en) Method and apparatus for improved internet searching
JPH08255172A (ja) 文書検索システム
EP2011036A2 (en) Data product search using related concepts
JP4967037B2 (ja) 情報検索装置、情報検索方法、端末装置、およびプログラム
JP7187816B2 (ja) 検索方法、検索プログラム及び検索装置
JP4768882B2 (ja) 情報検索装置、情報検索方法、情報検索プログラム、および、情報検索プログラムを記録した記録媒体
JP7343311B2 (ja) 文書検索装置及び文書検索方法
US11907278B2 (en) Method and apparatus for deriving keywords based on technical document database
JP6653169B2 (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
JP2003162531A (ja) 文書検索システムおよび文書検索方法
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP2012104051A (ja) 文書インデックス作成装置
JPH0962684A (ja) 情報検索方法及び情報検索装置と、情報案内方法及び情報案内装置
KR101238927B1 (ko) 전자도서컨텐츠 검색 서비스 시스템 및 전자도서컨텐츠 검색 서비스 방법
JP7164015B2 (ja) 情報検索システム
JP5127553B2 (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体
JP2010108268A (ja) 文書処理装置
JP5439028B2 (ja) 情報検索装置、情報検索方法、およびプログラム
JP5242722B2 (ja) 代表文抽出装置およびプログラム
KR100361166B1 (ko) 정보 검색 시스템 및 그 방법

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080530

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080617

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080902

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080905

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110912

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4185500

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120912

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130912

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350