JP3944102B2 - 語義関連ネットワークを用いた文書検索システム - Google Patents

語義関連ネットワークを用いた文書検索システム Download PDF

Info

Publication number
JP3944102B2
JP3944102B2 JP2003068505A JP2003068505A JP3944102B2 JP 3944102 B2 JP3944102 B2 JP 3944102B2 JP 2003068505 A JP2003068505 A JP 2003068505A JP 2003068505 A JP2003068505 A JP 2003068505A JP 3944102 B2 JP3944102 B2 JP 3944102B2
Authority
JP
Japan
Prior art keywords
search
meaning
document
tank
search key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003068505A
Other languages
English (en)
Other versions
JP2004280280A (ja
Inventor
修 今一
博行 梶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2003068505A priority Critical patent/JP3944102B2/ja
Priority to US10/784,768 priority patent/US7240051B2/en
Publication of JP2004280280A publication Critical patent/JP2004280280A/ja
Application granted granted Critical
Publication of JP3944102B2 publication Critical patent/JP3944102B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/954Relational
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/953Organization of data
    • Y10S707/959Network
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、利用者の検索意図を表わす語義を用いて関連文書を検索する文書検索システムに関する。
【0002】
【従来の技術】
コンピュータやインターネットの普及に伴い、文書情報の電子化が急速に進んでいる。入手可能な文書情報が増加するにつれ、その中から必要な情報を探し出すことが重要な課題となってくる。情報検索技術(文書検索技術ともいう)はこのような課題を解決するための技術であり、その技術を応用した検索エンジンを利用して必要とする文書情報を検索することが一般的に行われている。さらに、近年では、利用者が入力した検索キーとは異なる言語で記述された文書を検索するクロスリンガル文書検索技術(クロスランゲージ文書検索技術ともいう)に対する要求も高まっている。
【0003】
利用者が入力した検索キーと同一の言語で記述された文書を検索するモノリンガル文書検索では、利用者が入力した検索キーを用いて、検索対象の文書を検索する。一方、クロスリンガル文書検索では、利用者が入力した検索キーと検索対象の文書が異なる言語で記述されているため、検索キーを検索対象の文書の言語に翻訳する必要がある。例えば、英語で記述された検索キーに対して、日本語で記述された文書を検索する英日のクロスリンガル文書検索の場合、利用者が英語で入力した検索キー(例えば「camera」)を日本語の検索キー(例えば「カメラ」)に翻訳してから日本語の文書を検索する。
【0004】
【特許文献1】
特開2001−331484号公報
【0005】
【発明が解決しようとする課題】
しかし、一般に語には複数の意味(語義)があるため、検索キーを検索対象の言語に一意に翻訳できるとは限らない。例えば、英語の「bank」を日本語に翻訳する場合を考えてみると、「bank」には、お金を預けたり引き出したりする機関としての語義(日本語の「銀行」に相当)と、水辺の場所としての語義(日本語の「岸」に相当)があるため、どちらの語義で翻訳すればよいかがわからず、利用者が意図しない語義に翻訳されてしまう可能性がある。その結果、利用者が意図しない文書が検索結果に含まれてしまうことになる。
【0006】
同様の問題はモノリンガル文書検索においても発生する。利用者が入力した検索キーが複数の語義を含む場合、利用者が意図しない語義に関連する文書が検索結果として得られてしまう。例えば、英語の「tank」を検索キーとして入力した場合を考えてみると、「tank」には日本語の「タンク」や「水槽」に相当する語義と「戦車」に相当する語義があるため、「tank」を検索キーとしてモノリンガル文書検索を実行した場合、利用者は日本語の「戦車」に相当する語義を検索意図としてもっていた場合でも、日本語の「タンク」や「水槽」の語義に関連する文書が検索結果に含まれてしまう。
【0007】
このように、検索キーが複数の語義をもつ場合、利用者が複数の語義のうちのどの語義を検索意図としてもっているかを同定しなければ、利用者の検索意図を反映した文書検索を行うことはできない。
【0008】
本発明は、上記現状を鑑み、検索キーがもつ多義性を解消し、利用者の検索意図を反映した検索結果を得ることができる文書検索システムを提供することを目的とする。
【0009】
【課題を解決するための手段】
上記目的を達成するため、本発明では、利用者が入力した検索キーがもつ語義とその語義に関連する語義をネットワーク状に配置した語義関連ネットワークを提示し、その中から検索意図を反映する語義を利用者に選択させることで、利用者の検索意図を明確化する。
【0010】
ここで、語義関連ネットワークで表示される語義は、異なる言語(例えば、英語と日本語)における語(ターム)の集合として定義されるものである。一例をあげると、英語の「bank」の語義には、お金を預けたり引き出したりする機関としての「bank」と、水辺の場所としての「bank」がある。この場合、「bank」の語義として「bank・銀行」と「bank・岸」が定義される。このように定義された語義をノードとし、語義間の関連度をリンクとするネットワーク構造が語義関連ネットワークである。語義関連ネットワークの作成方法は任意でよいが、例えば、特開2001−331484号公報「パラレルシソーラスの生成プログラムを記録した記録媒体、パラレルシソーラスを記録した記録媒体及びパラレルシソーラスナビゲーションプログラムを記録した記録媒体」に記載の方法を用いることができる。この方法でいうパラレルシソーラスが、本発明における語義関連ネットワークに相当する。
【0011】
語義関連ネットワークの中から語義を選択させることで、利用者の検索意図が明確化される。しかし、本発明で用いるのはキーワード検索機能を有する一般の検索エンジン(Google(http://www.google.com)やgoo(http://www.goo.ne.jp)などが代表的である)であり、それらが受け付けるのは語義ではなく語(ターム)である。つまり、利用者が指定した語義をキーとして検索することができない。そのため、語義を同定する前のタームをキーに検索を実行するしかなく、利用者が指定した語義に関連していない文書が検索結果に含まれてしまうことになる。そこで、本発明では、検索結果の文書中に含まれるタームについてその語義を判定し、利用者が指定した語義で、そのタームが使われている文書のみを選別するフィルタリング処理を行うことで、利用者の検索意図を反映した検索結果を提示する。
【0012】
すなわち、入力された検索キーに関連する文書を検索する本発明による文書検索システムは、検索キーがもつ語義と該語義に関連する語義をネットワーク状に提示する語義関連ネットワーク提示部と、検索キーを用いて検索を実行する検索部と、検索を実行して得られた文書集合から、選択された語義に適合する文書を選別するフィルタリング部とを備えることを特徴とする。語義関連ネットワーク提示部は、利用者に語義の選択を促すような形式で語義をネットワーク状に提示する。
【0013】
検索部は、入力された検索キーで検索を実行してもよいし、選択された語義から検索キーを生成し、生成した検索キーを用いて検索を実行するようにしてもよい。また、検索部は入力された検索キーとは異なる言語で記述された文書を検索するクロスリンガル文書検索を行うものであってもよいし、入力された検索キーと同じ言語で記述された文書を検索するモノリンガル文書検索を行うものであってもよい。
【0014】
【発明の実施の形態】
本発明の代表的な態様には、(1)利用者が入力した検索キーと同じ言語で記述された文書を検索するモノリンガル文書検索、(2)利用者が入力した検索キーと異なる言語で記述された文書を検索するクロスリンガル文書検索、がある。検索キーの言語と検索対象の文書の言語は任意の言語の組み合わせでよい。以下では、上記(1)の実施例として、英語の検索キーに対して、英語の文書を検索する場合と、上記(2)の実施例として、日本語の検索キーに対して、英語の文書を検索する場合を説明する。
以下、図面を参照しながら上記(1)の実施例について説明する。
【0015】
図1は、本発明を実現するためのシステムの構成例を示す概略図である。このシステムは、クライアント20、サーバ30、語義関連データベース40、検索エンジン501,502から構成され、クライアント20、サーバ30、検索エンジン501,502は通信ネットワーク10で接続されている。図に示した例では、2つの検索エンジンが通信ネットワークに接続されているが、用いる検索エンジンの数は任意でよい。クライアントの数も任意である。
【0016】
クライアント20は、検索要求入力部201、検索エンジン選択部202、語義関連ネットワーク表示部203、検索結果表示部204を備える。各部の機能については後述する。
サーバ30は、語義関連ネットワーク生成部301、検索部302、語義判定部303、フィルタリング部304を備える。各部の機能については後述する。
【0017】
語義関連データベース40は、語義に関する情報を格納するデータベースであり、(a)ある語(ターム)がもつ語義に関する情報を保持するテーブル、(b)語義と語義の関連度に関する情報を保持するテーブル、(c)あるターム1が他のターム2と共起した場合、ターム1がどの語義をもちやすいかに関する情報を保持するテーブルを備える。
【0018】
図2は語義関連データベース40が備えるテーブルの例を示す図である。図2の(a)、(b)、(c)は、それぞれ上記(a)、(b)、(c)に対応している。図2の(a)は、ターム「tank」が「tank・タンク/水槽」と「タンク・戦車」の2つの語義をもつことを表わしている。図2の(b)は、語義「tank・タンク/水槽」と語義「ammonia・アンモニア」の関連度が4.834であること、語義「tank・戦車」と語義「artillery・砲」の関連度が4.044であること、などを表わしている。図2の(c)は、ターム「tank」がターム「ammonia」と共起した場合は、「tank・戦車」という語義よりも、「tank・タンク/水槽」という語義をもちやすいこと(それぞれの語義をもつ関連度0.169と4.834を比較することでわかる)、ターム「artillery」と共起した場合は、「tank・タンク/水槽」という語義よりも、「tank・戦車」という語義をもちやすいこと(それぞれの語義をもつ関連度0.063と4.044を比較することでわかる)を表わしている。このテーブルは、語義判定部303において、注目するタームが文書中でとる語義を判定する際に用いる。語義判定部303の機能については後述する。
【0019】
検索エンジン501,502は、キーワード検索機能を備えた検索エンジンであり、Google(http://www.google.com)やgoo(http://www.goo.ne.jp)などの一般の検索エンジンを利用することができる。
【0020】
以下、上記各部の機能について、各部間のデータの流れ及び処理の流れを示すシーケンス図である図3、クライアントの画面の例を示す図である図4、図5、図6、語義関連データベースに含まれるテーブルの例を示す図である図2を用いて詳しく説明する。
【0021】
図4は、クライアント20における初期画面の例を示す図である。検索要求入力部201は、検索要求入力エリア2011、語義関連ネットワーク表示指示ボタン2012を備える。例えば、検索要求入力エリア2011に英語の検索キーとして「tank」を入力し、語義関連ネットワーク表示指示ボタン2012をクリックすると、入力された検索キー「tank」は、サーバ30の語義関連ネットワーク生成部301に送信される(図3のT1)。
【0022】
語義関連ネットワーク生成部301は、検索キーである「tank」の語義とその語義と関連度の高い語義(関連語義)を語義関連データベース40の(a)、(b)を用いて検索し(図3のT2,T3)、語義関連ネットワークを生成する。検索する関連語義の数は任意でよいが、5個くらいが妥当である。
【0023】
生成された語義関連ネットワークはクライアント20に送信され(図3のT4)、図5のように、クライアント20の語義関連ネットワーク表示部203に表示される。表示された語義関連ネットワークを見ることによって、利用者は、検索キー「tank」には、「tank・タンク/水槽」と「tank・戦車」という2つの語義があることと、語義「tank・タンク/水槽」には、「ammonia・アンモニア」、「fuel・燃料」などの語義が関連すること、語義「tank・戦車」には、「artillery・砲」、「ball・砲弾」などの語義が関連することを知ることができる。利用者は、語義関連ネットワーク表示部203における語義選択ボタン2031を用いて、検索キーがもつ語義の中から自分が検索したい語義を選択することができる。また、関連語義選択ボタン2032を用いて、検索キーがもつ語義と一緒に検索したい関連語義を選択することができる。
【0024】
次に利用者は、語義関連ネットワーク表示部203が備える検索エンジン選択部202を用いて、検索対象とする検索エンジンを検索エンジン選択ボタン2022で選択し、検索指示ボタン2021をクリックする。選択された語義と関連語義の情報は、サーバ30の検索部302に送信される(図3のT5)。同時に、検索対象として選択された検索エンジン名も送信される。
【0025】
検索部302は、送信されてきた語義をもとに検索エンジンが受け付けることのできる検索キーを生成する。例えば、語義「tank・タンク/水槽」から検索キー「tank」を生成する。生成された検索キーを用いて検索エンジンを検索し(図3のT6)、検索キーに関連する文書を結果として得る(図3のT7)。得られた文書集合は、利用者が意図した語義「tank・タンク/水槽」で検索したわけではなく、ターム「tank」で検索した結果であるので、利用者の意図を満足しない結果も含まれている。つまり、検索結果として得られた文書集合の中から、利用者が意図した語義でターム「tank」が使われている文書を選別しなければならない。文書選別の前処理として、検索結果として得られた文書中に含まれるターム「tank」がどの語義で使われているかを語義判定部303が判定する。
【0026】
語義判定部303は、語義関連データベース40のテーブル(c)を用いて語義判定を行なう(図3のT8,T9)。例えば、検索結果として得られた文書中で、ターム「tank」がターム「ammonia」と共起していた場合、この文書中でのターム「tank」は「tank・タンク/水槽」の語義で使われている可能性が高い(関連度の値0.169と4.834を比較することでわかる)。同様に、ターム「tank」と共起するすべてのタームについて、それぞれとの関連度を考慮し、ターム「tank」の語義を決定する。この語義判定を検索結果として得られた個々の文書について実行する。
【0027】
フィルタリング部304は、語義判定済みの文書集合の中から、利用者の検索意 図を満足する語義で「tank」が使われている文書のみを選び出し、その結果得られた文書集合をクライアント20に送信する(図3のT10)。
【0028】
送信された文書集合は、クライアント20における検索結果表示部204に表示される。図6は、検索結果の表示の例を示す図である。検索結果の表示形式は、単純に、検索結果として得られた文書のタイトル一覧でもよいが、図6のように、文書のタイトルに加えて、本文の一部を表示し、表示された本文中に含まれる検索キーや語義判定に用いたタームを強調表示してもよい。そうすることで、図6では、検索キー「tank」を斜体、語義判定に利用したターム「ammonia」、「fuel」、「toilet」を太字で強調表示している。
【0029】
上記説明のシステムを用いることで、一般の検索エンジンを利用する場合にでも、利用者が入力した検索キーに対する関連文書の中から、その検索キーが利用者の意図した語義で使われている文書を得ることができる。
【0030】
なお、サーバ30の検索部302は、検索エンジンの検索(図3のT6)において、クライアント20から送信されてきた語義の情報をもとに生成した検索キーを用いるのではなく、クライアント20から最初に送信されてきた検索キー(図3のT1)を用いて検索エンジンを検索してもよい。この場合においても、検索によって得られた文書集合に対して、語義判定部303によって各々の文書に含まれる検索キーの語義判定を行い、フィルタリング部304によって利用者の意図する語義で検索キーが使われている文書を選択する処理を行うことで利用者の検索意図を反映した検索結果を得ることができる。
【0031】
以上、英語の検索キーに対して英語の文書を検索する場合(モノリンガル文書検索)の実施の形態について説明した。次に、本発明の変形例として、(2)の態様の実施例である、日本語の検索キーに対して、英語の文書を検索する場合(クロスリンガル文書検索)について説明する。
【0032】
(2)の態様の実施例を実現するためには、語義関連データベース40が備えるテーブルとして、日本語のタームに対する語義に関する情報を格納したテーブルが必要となる。例えば、日本語のターム「戦車」に対する語義は「tank・戦車」であり、日本語のターム「燃料」に対する語義は「fuel・燃料」であるなどの情報が格納されていればよい。このようなテーブルは、(1)の態様の実施例における、語義関連データベース40が備えるテーブル(a)を作成するのと同じ方法で作成することができる。
【0033】
(2)の態様の実施例の処理の流れは、(1)の態様の実施例とほぼ同一であるが、語義関連ネットワーク生成部301が、利用者が入力した検索キー(例えば「戦車」)に対する語義を検索する場合に、上記の日本語のタームに対する語義に関する情報を格納したテーブルを検索すればよい。すると、検索キーに対する語義(例えば「tank・戦車」)が得られる。その後は、(1)の態様の実施例と同様の処理が実行される。
【0034】
(2)の態様の実施例の利点は、以下のとおりである。一般のクロスリンガル文書検索では、入力された検索キーを対訳辞書で翻訳してから文書を検索する。例えば,日本語の検索キー「戦車」を入力すると、その検索キーを対訳辞書を用いて「tank」に翻訳し、「tank」を用いて文書を検索する。しかし、上記の例でも述べてきたとおり、「tank」には複数の語義が含まれるため、利用者が意図した戦車の意味での「tank」以外の語義をもつ「tank」を含む文書が検索されてしまうことになる。しかし、(2)の態様の実施例では、「戦車」の語義が「tank・戦車」であることを同定しているため、「tank」の多義性に左右されることなく、利用者の意図どおりに「tank」が「戦車」の意味で使われている文書を利用者に提示することができる。
【0035】
【発明の効果】
本発明によると、語義関連ネットワーク上に表示された語義を選択して検索を実行することにより、利用者の検索意図を反映した検索結果を得ることができる。
【図面の簡単な説明】
【図1】本発明を実現するためのシステムの構成例を示す概略図。
【図2】語義関連データベースに含まれるテーブルの例を示す図。
【図3】クライアント、サーバ、語義関連データベース、検索エンジンの間のデータ及び処理の流れを示すシーケンス図。
【図4】クライアントにおける初期画面の例を示す図。
【図5】クライアントにおける語義関連ネットワークの表示例を示す図。
【図6】クライアントにおける検索結果の表示例を示す図。
【符号の説明】
10:通信ネットワーク
20:クライアント
201:検索要求入力部
2011:検索要求入力エリア
2012:語義関連ネットワーク表示指示ボタン
202:検索エンジン選択部
2021:検索指示ボタン
2022:検索エンジン選択ボタン
203:語義関連ネットワーク表示部
2031:語義選択ボタン
2032:関連語義選択ボタン
204:検索結果表示部
30:サーバ
301:語義関連ネットワーク生成部
302:検索部
303:語義判定部
304:フィルタリング部
40:語義関連データベース
501、502:検索エンジン

Claims (6)

  1. 入力された検索キーに関連する文書を検索する文書検索システムにおいて、
    タームとそのタームの語義とが対応付けられた第1のテーブル、語義とその語義に関連する語義とが対応付けられた第2のテーブル、及びあるタームが他のタームと共起した場合、そのタームがどの語義をもちやすいかに関する情報を保持する第3のテーブルを格納したデータベースと、
    前記検索キーがもつ語義と該語義に関連する語義をネットワーク状に提示する語義関連ネットワーク提示部と、
    前記ネットワーク状に提示された語義から選択された語義の入力を受けつける手段と、
    検索キーを用いて検索を実行する検索部と、
    検索を実行して得られた文書集合から、文書中で用いられている語義を判定し、選択された語義に適合する文書を選別するフィルタリング部とを備え
    前記語義関連ネットワーク提示部では、前記第1のテーブルを参照して前記入力された検索キーがもつ語義を決定するとともに、前記第2のテーブルを参照して前記検索キーが持つ語義に関連する語義を決定し、
    前記フィルタリング部では、前記第3のテーブルを参照し、文書中において判定対象のタームと共起する全てのタームについて、それぞれとの関連度を考慮し、文書中で用いられている語義を判定することを特徴とする文書検索システム。
  2. 請求項1記載の文書検索システムにおいて、前記検索部は選択された語義から検索キーを生成し、生成した検索キーを用いて検索を実行することを特徴とする文書検索システム。
  3. 請求項1記載の文書検索システムにおいて、前記検索部は入力された検索キーとは異なる言語で記述された文書を検索するクロスリンガル文書検索を行うことを特徴とする文書検索システム。
  4. 請求項1記載の文書検索システムにおいて、前記検索部は入力された検索キーと同じ言語で記述された文書を検索するモノリンガル文書検索を行うことを特徴とする文書検索システム。
  5. 請求項2記載の文書検索システムにおいて、前記検索部は入力された検索キーとは異なる言語で記述された文書を検索するクロスリンガル文書検索を行うことを特徴とする文書検索システム。
  6. 請求項2記載の文書検索システムにおいて、前記検索部は入力された検索キーと同じ言語で記述された文書を検索するモノリンガル文書検索を行うことを特徴とする文書検索システム。
JP2003068505A 2003-03-13 2003-03-13 語義関連ネットワークを用いた文書検索システム Expired - Fee Related JP3944102B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2003068505A JP3944102B2 (ja) 2003-03-13 2003-03-13 語義関連ネットワークを用いた文書検索システム
US10/784,768 US7240051B2 (en) 2003-03-13 2004-02-24 Document search system using a meaning relation network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003068505A JP3944102B2 (ja) 2003-03-13 2003-03-13 語義関連ネットワークを用いた文書検索システム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2006268277A Division JP2007004831A (ja) 2006-09-29 2006-09-29 語義関連ネットワークを用いた文書検索システム

Publications (2)

Publication Number Publication Date
JP2004280280A JP2004280280A (ja) 2004-10-07
JP3944102B2 true JP3944102B2 (ja) 2007-07-11

Family

ID=32959330

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003068505A Expired - Fee Related JP3944102B2 (ja) 2003-03-13 2003-03-13 語義関連ネットワークを用いた文書検索システム

Country Status (2)

Country Link
US (1) US7240051B2 (ja)
JP (1) JP3944102B2 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383269B2 (en) * 2003-09-12 2008-06-03 Accenture Global Services Gmbh Navigating a software project repository
US20050149388A1 (en) * 2003-12-30 2005-07-07 Scholl Nathaniel B. Method and system for placing advertisements based on selection of links that are not prominently displayed
JP2006012078A (ja) * 2004-06-29 2006-01-12 Hitachi Software Eng Co Ltd テキストマイニングサーバ及びプログラム
US7752200B2 (en) * 2004-08-09 2010-07-06 Amazon Technologies, Inc. Method and system for identifying keywords for use in placing keyword-targeted advertisements
JP2006053745A (ja) * 2004-08-11 2006-02-23 Saora Inc データ処理方法及びその装置、及びそのプログラム
JP2006099388A (ja) * 2004-09-29 2006-04-13 Hitachi Software Eng Co Ltd テキストマイニングサーバ及びテキストマイニングシステム
JP4612834B2 (ja) * 2004-12-17 2011-01-12 キヤノン株式会社 文書管理システム、文書検索方法、コンピュータプログラム、文書検索装置
US8660977B2 (en) * 2005-02-04 2014-02-25 Accenture Global Services Limited Knowledge discovery tool relationship generation
US20060179026A1 (en) * 2005-02-04 2006-08-10 Bechtel Michael E Knowledge discovery tool extraction and integration
US7904411B2 (en) * 2005-02-04 2011-03-08 Accenture Global Services Limited Knowledge discovery tool relationship generation
JP4524640B2 (ja) * 2005-03-31 2010-08-18 ソニー株式会社 情報処理装置および方法、並びにプログラム
US20070136243A1 (en) * 2005-12-12 2007-06-14 Markus Schorn System and method for data indexing and retrieval
JP4580351B2 (ja) * 2006-02-22 2010-11-10 日本電信電話株式会社 興味情報生成装置、興味情報生成方法および興味情報生成プログラム
US7765176B2 (en) * 2006-11-13 2010-07-27 Accenture Global Services Gmbh Knowledge discovery system with user interactive analysis view for analyzing and generating relationships
US8001138B2 (en) * 2007-04-11 2011-08-16 Microsoft Corporation Word relationship driven search
WO2008144637A1 (en) * 2007-05-17 2008-11-27 Zi Corporation Of Canada, Inc. Service access method and apparatus
US20080294622A1 (en) * 2007-05-25 2008-11-27 Issar Amit Kanigsberg Ontology based recommendation systems and methods
US20080294624A1 (en) * 2007-05-25 2008-11-27 Ontogenix, Inc. Recommendation systems and methods using interest correlation
US7734641B2 (en) 2007-05-25 2010-06-08 Peerset, Inc. Recommendation systems and methods using interest correlation
US20090007128A1 (en) * 2007-06-28 2009-01-01 International Business Machines Corporation method and system for orchestrating system resources with energy consumption monitoring
JP5656353B2 (ja) * 2007-11-07 2015-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation マルチリンガル・テキスト・リソースのアクセスを制御するための方法および装置
JP2010003015A (ja) * 2008-06-18 2010-01-07 Hitachi Software Eng Co Ltd 文書検索システム
US10726030B2 (en) * 2015-07-31 2020-07-28 Splunk Inc. Defining event subtypes using examples

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05151253A (ja) 1991-11-29 1993-06-18 Canon Inc 文書検索装置
CA2175187A1 (en) * 1993-10-28 1995-05-04 William K. Thomson Database search summary with user determined characteristics
JPH10222540A (ja) 1996-12-04 1998-08-21 N T T Data Tsushin Kk 文書検索方法、装置及び記録媒体
JPH1145268A (ja) 1997-07-28 1999-02-16 Just Syst Corp 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
IL126373A (en) * 1998-09-27 2003-06-24 Haim Zvi Melman Apparatus and method for search and retrieval of documents
US6862710B1 (en) * 1999-03-23 2005-03-01 Insightful Corporation Internet navigation using soft hyperlinks
US6665640B1 (en) * 1999-11-12 2003-12-16 Phoenix Solutions, Inc. Interactive speech based learning/training system formulating search queries based on natural language parsing of recognized user queries
IL133588A0 (en) * 1999-12-19 2001-04-30 Infobit Ltd Apparatus and method for retrieval of documents
WO2001075662A2 (en) * 2000-03-31 2001-10-11 Amikai, Inc. Method and apparatus for providing multilingual translation over a network
JP4259726B2 (ja) 2000-05-22 2009-04-30 株式会社日立製作所 パラレルシソーラスの生成プログラムを記録した記録媒体、パラレルシソーラスを記録した記録媒体及びパラレルシソーラスナビゲーションプログラムを記録した記録媒体
US6675159B1 (en) * 2000-07-27 2004-01-06 Science Applic Int Corp Concept-based search and retrieval system
JP2002230021A (ja) 2001-01-30 2002-08-16 Canon Inc 情報検索装置及び情報検索方法並びに記憶媒体
JP2002251412A (ja) 2001-02-22 2002-09-06 Canon Inc 文書検索装置および方法ならびに記憶媒体
US20050108200A1 (en) * 2001-07-04 2005-05-19 Frank Meik Category based, extensible and interactive system for document retrieval
US20030115191A1 (en) * 2001-12-17 2003-06-19 Max Copperman Efficient and cost-effective content provider for customer relationship management (CRM) or other applications

Also Published As

Publication number Publication date
JP2004280280A (ja) 2004-10-07
US7240051B2 (en) 2007-07-03
US20040181520A1 (en) 2004-09-16

Similar Documents

Publication Publication Date Title
JP3944102B2 (ja) 語義関連ネットワークを用いた文書検索システム
JP5264892B2 (ja) 多言語情報検索
US9323827B2 (en) Identifying key terms related to similar passages
JP5224851B2 (ja) 検索エンジン、検索システム、検索方法およびプログラム
US7266553B1 (en) Content data indexing
US7676452B2 (en) Method and apparatus for search optimization based on generation of context focused queries
US7783633B2 (en) Display of results of cross language search
US7783660B2 (en) System and method for enhanced text matching
EP2347354B1 (en) Retrieval using a generalized sentence collocation
US20150046435A1 (en) Method and System Utilizing a Personalized User Model to Develop a Search Request
US20060195435A1 (en) System and method for providing query assistance
US8639701B1 (en) Language selection for information retrieval
JPH10232883A (ja) 多言語対応文書検索システム
WO2007133625A2 (en) Multi-lingual information retrieval
JP2013109781A (ja) 対話形サーチクエリーを改良するためシステム及び方法
US20160217181A1 (en) Annotating Query Suggestions With Descriptions
US20080256055A1 (en) Word relationship driven search
Khushhal et al. Question retrieval using combined queries in community question answering
Lazarinis Engineering and utilizing a stopword list in Greek web retrieval
JP2007004831A (ja) 語義関連ネットワークを用いた文書検索システム
US20060195313A1 (en) Method and system for selecting and conjugating a verb
Kishida et al. Experiments on cross-language information retrieval using comparable corpora of chinese, japanese, and korean languages
Tikk et al. Searching the deep web: the WOW project
Kishida et al. Cross-lingual information retrieval (CLIR) task at the NTCIR workshop 3
Kürsten et al. Chemnitz at the CHiC Evaluation Lab 2012: Creating an Xtrieval Module for Semantic Enrichment.

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060418

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060619

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060808

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060929

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20061110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070313

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070406

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110413

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120413

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130413

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140413

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees