JP3601653B2 - 情報検索装置および方法 - Google Patents

情報検索装置および方法 Download PDF

Info

Publication number
JP3601653B2
JP3601653B2 JP06905098A JP6905098A JP3601653B2 JP 3601653 B2 JP3601653 B2 JP 3601653B2 JP 06905098 A JP06905098 A JP 06905098A JP 6905098 A JP6905098 A JP 6905098A JP 3601653 B2 JP3601653 B2 JP 3601653B2
Authority
JP
Japan
Prior art keywords
phrase
expansion
keyword
history
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06905098A
Other languages
English (en)
Other versions
JPH11272678A (ja
Inventor
清司 大倉
秀 富士
明 潮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP06905098A priority Critical patent/JP3601653B2/ja
Priority to US09/145,964 priority patent/US6226638B1/en
Publication of JPH11272678A publication Critical patent/JPH11272678A/ja
Application granted granted Critical
Publication of JP3601653B2 publication Critical patent/JP3601653B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99932Access augmentation or optimizing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、キーワードを他の言語に変換してデータベースを検索する多言語情報検索において、検索者に検索のヒントを与える機能を含む情報検索装置およびその方法に関する。
【0002】
【従来の技術】
現在、コンピュータネットワークの発達とともに検索装置も発達し、世界中のホストコンピュータから情報が取り出せるようになっている。ある言語で書かれたデータベースを検索するには、その言語で検索するのが普通であるが、他の言語でそのデータベースを検索する場合、与えられたキーワードをデータベースの言語に変換してやればよい。このような検索方法は、多言語情報検索と呼ばれる。例えば、日本語のキーワードで、英語で書かれたデータベースを検索する場合、そのキーワードを、一旦、英語に変換してから、検索を行う。
【0003】
従来の情報検索としては、キーワードを、類義語、同義語、反意語、表記のゆれ、訳語、略語などの関連語に展開して、その結果を表示し、表示された言葉の中から検索者が検索エンジンに渡すものを選択するという技術がある。ここで、表記のゆれとは、表記上、キーワードと類似した形状を持つ他の文字列を意味する。
【0004】
【発明が解決しようとする課題】
しかしながら、上述した従来の情報検索には、次のような問題がある。
従来の多言語情報検索においては、キーワードを他の言語に変換して検索エンジンに渡す方法や、キーワードを他の言語に変換し、それとは別にキーワードをその関連語などに展開して、検索エンジンに渡す方法を用いている。このような方法では、検索者は、入力したキーワードと、検索エンジンに渡されるキータームとの関係を、大局的・包括的に把握することはできない。
【0005】
多言語でよりよい検索をしようとすると、入力キーワードの単なる翻訳による変換(翻訳展開)と関連語句への変換(関連語展開)を同時に行う必要性が出てくる。しかし、このような2段階以上の展開(以下、多段階の展開と称す)を行うと、展開の過程がさらにわかりにくくなる。このため、不要なキータームを検索エンジンに入力したり、必要なキータームを見落したりする可能性がある。
【0006】
本発明の課題は、多段階のキーワード展開を行う情報検索において、検索者にとって展開の過程が分かりやすいようなインタフェースを含む情報検索装置およびその方法を提供することである。
【0007】
【課題を解決するための手段】
図1は、本発明の情報検索装置の原理図である。図1の情報検索装置は、入力手段1、展開手段2、格納手段3、出力手段4、および検索手段5を備える。
【0008】
入力手段1は、キーワードを入力し、展開手段2は、そのキーワードを複数段階の情報に展開し、格納手段3は、複数段階の展開履歴を木構造で格納する。また、出力手段4は、上記木構造の少なくとも一部の情報を出力し、検索手段5は、出力された情報を用いて検索を行う。
【0009】
展開手段2は、例えば、異なる言語間の翻訳を行う翻訳辞書と、同じ言語内で類義語、同義語、反意語、表記のゆれ、訳語、略語などの関連語を求める関連語辞書とを含み、翻訳展開と関連語展開を組合せて、入力されたキーワードを多段階に展開する。そして、キーワードの展開の履歴は、各段階の展開語句をノードとする木構造の形式で格納手段3に格納される。
【0010】
出力手段4は、例えば、格納手段3に格納された木構造の展開履歴を画面に表示し、ユーザ(検索者)は、表示された展開履歴に含まれる語句を検索キータームとして指定する。そして、検索手段5は、指定された検索キータームを用いてデータベースなどを検索し、検索結果を取得する。
【0011】
このような情報検索装置によれば、多言語情報検索などの多段階のキーワード展開を伴う検索において、展開の履歴が木構造で検索者に呈示されるため、検索者は展開の過程を容易に把握でき、キータームを適切に指定することができる。
【0012】
例えば、図1の入力手段1は、後述する図2のキーワード入力部12に対応し、図1の展開手段2は図2の辞書引き部13および展開辞書16、17に対応し、図1の格納手段3は図2の展開履歴メモリ部18に対応し、図1の出力手段4は図2の画面情報表示編集部11に対応し、図1の検索手段5は図2の検索部15に対応する。
本発明の別の情報検索装置は、入力手段1、展開手段2、格納手段3、出力手段4、検索手段5、および指示手段を備える。入力手段1は、キーワードを入力し、展開手段2は、与えられた語句を他の語句に変換する辞書手段を含み、辞書手段を用いてキーワードを複数段階の語句に展開する。格納手段3は、キーワードを展開して得られた第1の語句を子ノードとしてキーワードから第1の語句を指すポインタと、第1の語句を展開して得られた第2の語句を子ノードとして第1の語句から第2の語句を指すポインタとを用いて、複数段階の展開履歴を木構造で格納する。指示手段は、ユーザからの指示を入力し、出力手段4は、展開履歴の少なくとも一部の情報を画面上に表示し、表示された展開履歴の特定ノードの語句を選択する指示が入力されたとき、特定ノードと特定ノードから派生する子孫ノードの語句を画面上で強調表示する。検索手段5は、強調表示された語句を検索キータームとして用いて情報検索を行う。このとき、入力手段1は、複数の形態素からなる複合語のキーワードを入力し、出力手段4は、キーワードの形態素分割における可能な形態素の組合せを1つ以上画面上に表示し、展開手段2は、1つの組合せを選択する指示が入力されたとき、選択された組合せに含まれる各形態素毎に展開を行い、出力手段4は、各形態素の展開履歴を表示する。
本発明のさらに別の情報検索装置は、入力手段1、展開手段2、格納手段3、出力手段4、検索手段5、指示手段、および編集手段を備える。入力手段1は、キーワードを入力し、展開手段2は、与えられた語句を他の語句に変換する辞書手段を含み、辞書手段を用いてキーワードを複数段階の語句に展開する。格納手段3は、キーワードを展開して得られた第1の語句を子ノードとしてキーワードから第1の語句を指すポインタと、第1の語句を展開して得られた第2の語句を子ノードとして第1の語句から第2の語句を指すポインタとを用いて、複数段階の展開履歴を木構造で格納する。出力手段4は、展開履歴の少なくとも一部の情報を画面上に表示する。指示手段は、ユーザからの指示を入力し、編集手段は、入力された指示に従って、表示された展開履歴の語句の書き換え、語句の追加、および語句の削除のうち少なくとも1つの編集処理を行い、格納手段3に格納された木構造の展開履歴を再計算する。検索手段5は、再計算された展開履歴に含まれる語句を検索キータームとして用いて情報検索を行う。このとき、入力手段1は、複数の形態素からなる複合語のキーワードを入力し、出力手段4は、キーワードの形態素分割における可能な形態素の組合せを1つ以上画面上に表示し、展開手段2は、1つの組合せを選択する指示が入力されたとき、選択された組合せに含まれる各形態素毎に展開を行い、出力手段4は、各形態素の展開履歴を表示する。
【0013】
【発明の実施の形態】
以下、図面を参照しながら、本発明の実施の形態を詳細に説明する。
本実施形態においては、検索者に対してキーワード展開の過程あるいは履歴をわかりやすく表示することで検索のヒントを与えるような、キーワードナビゲーションが行われる。多言語情報検索におけるキーワードナビゲーションを容易にするために、必要かつ効果的な情報をインタラクティブに検索者に呈示する。
【0014】
図2は、本実施形態の情報検索装置の構成図である。図2の情報検索装置は、コンピュータを用いて実現され、画面情報表示編集部11、キーワード入力部12、辞書引き部13、制御部14、検索部15、展開辞書16、17、展開履歴メモリ部18、およびデータベース19から構成される。
【0015】
この装置では、2つの展開辞書が用意されており、展開辞書16は、入力された語句を翻訳語句へ展開するための翻訳辞書であり、展開辞書17は、入力された語句を関連語へ展開するための関連語辞書である。関連語辞書は2つ以上あってもよい。
【0016】
検索者がキーワード入力部12を通じてキーワードを入力すると、制御部14は、辞書引き部13に展開命令を出す。辞書引き部13は、命令に応じて翻訳語句への展開と、関連語句への展開を行う。キーワード展開の履歴は、展開履歴メモリ部18に木構造で保存される。
【0017】
画面情報表示編集部11は、後述するような様々な形態で展開履歴を表示し、検索者とインタラクティブに展開履歴や検索キータームを決定する。制御部14は、装置全体の動作を制御し、検索者が指定した検索キータームを検索部15に渡す。検索部15は、渡されたキータームでデータベース19を検索する。検索部15は、検索エンジンに相当する。
【0018】
図3は、図2の情報検索装置による検索処理のフローチャートである。まず、検索者がキーワード入力部12にキーワードを入力すると(ステップS1)、画面情報表示編集部11は展開履歴を画面に表示する(ステップS2)。そして、検索者が表示された展開履歴から適当な検索キータームを指定すると(ステップS3)、検索部15はそれを用いてデータベース19を検索し(ステップS4)、処理を終了する。
【0019】
また、図4は、図3のステップS2における表示処理のフローチャートである。ここでは、日本語のキーワードが入力され、そのキーワードに関してなるべく多くの情報を検索したいものとする。
【0020】
まず、辞書引き部13は、展開辞書17を用いて、入力されたキーワードの日本語の関連語句を求め(ステップS11)、得られた関連語句を、制御部14を通じて展開履歴メモリ部18に保存する(ステップS12)。このとき、入力されたキーワードを親ノードとし、辞書引きで得られた語句を子ノードとして、木構造形式で展開履歴が保存される。そして、画面情報表示編集部11は、展開履歴メモリ部18に保存された展開履歴の構造を表示する(ステップS13)。
【0021】
次に、辞書引き部13は、展開辞書16を用いて、展開履歴メモリ部18内に子ノードとして保存されたそれぞれの関連語句について翻訳語句を求め(ステップS14)、得られた翻訳語句を、制御部14を通じて展開履歴メモリ部18に保存する(ステップS15)。このとき、関連語句を親ノードとし、辞書引きで得られた翻訳語句を子ノードとして、木構造形式で展開履歴が保存される。そして、画面情報表示編集部11は、展開履歴メモリ部18に新たに保存された展開履歴の構造を表示する(ステップS16)。
【0022】
次に、制御部14は、すべての関連語句について翻訳辞書の辞書引きが終了したかどうかを判定し(ステップS17)、翻訳されていない関連語句があれば、ステップS14以降の処理を繰り返す。そして、翻訳辞書の辞書引きがすべて終了すれば、表示処理を終了する。
【0023】
例えば、キーワードとして「スポーツ」が入力されると、まず、日本語の関連語辞書が「スポーツ」で引かれて、「野球」、「サッカー」、「水泳」、「柔道」などが関連語として得られる。そして、「スポーツ」は親ノードとして、また、「野球」、「サッカー」、「水泳」、「柔道」などはその子ノードとして、展開履歴メモリ部18に保存され、その構造は図5のように表示される。
【0024】
次に、日英翻訳辞書が引かれて、「野球」から“baseball”が得られ、「サッカー」から“soccer”が得られ、「水泳」から“swimming”が得られ、「柔道」から“judo”が得られる。そして、それぞれの展開の履歴が、図6に示すように、木構造で展開履歴メモリ部18に保存される。
【0025】
例えば、「野球」と“baseball”の場合、「野球」は親ノードとして、“baseball”は「野球」の子ノードとして保存され、親ノードから子ノードを指すポインタ(矢印)が設定される。こうして保存された、「スポーツ」を根(ルートノード)とする木構造は、図7のように表示される。また、この展開履歴は、図8のように木構造で表示することもできる。
【0026】
図4の表示処理では、関連語展開と翻訳展開の2段階の展開が行われているが、3段階以上の展開についても同様である。3段階の展開による表示処理のフローチャートは、図9に示すようになる。図9において、ステップS21、S22、S23、S24、S25、S26、およびS27の処理は、図4のステップS11、S12、S13、S14、S15、S16、およびS17の処理と同様である。
【0027】
ステップS27において、翻訳辞書の辞書引きがすべて終了すると、辞書引き部13は、展開辞書17を用いて、展開履歴メモリ部18内の木構造において最下位のノードに対応する翻訳語句について英語の関連語句を求める(ステップS28)。そして、得られた関連語句を、制御部14を通じて展開履歴メモリ部18に保存する(ステップS29)。このとき、翻訳語句を親ノードとし、辞書引きで得られた関連語句を子ノードとして、木構造形式で展開履歴が追加される。そして、画面情報表示編集部11は、展開履歴メモリ部18に新たに保存された展開履歴の構造を表示する(ステップS30)。
【0028】
次に、制御部14は、すべての翻訳語句について関連語辞書の辞書引きが終了したかどうかを判定し(ステップS31)、辞書引きされていない翻訳語句があれば、ステップS28以降の処理を繰り返す。そして、関連語辞書の辞書引きがすべて終了すれば、表示処理を終了する。
【0029】
例えば、キーワードとして「世界」が入力されると、まず、日本語の関連語辞書が「世界」で引かれて、「地球」、「国際化」、および「旅行」が関連語として得られる。そして、「世界」は親ノードとして、また、「地球」、「国際化」、および「旅行」はその子ノードとして、展開履歴メモリ部18に保存される。
【0030】
次に、日英翻訳辞書が引かれて、「地球」、「国際化」、および「旅行」がそれぞれ展開される。これにより、「地球」から“earth ”が得られ、「国際化」から“internationalization”が得られ、「旅行」から“travel”および“tour”が得られる。そして、これらの展開における日本語が親ノードとして、それに対応する英語の翻訳後が子ノードとして、展開履歴メモリ部18に保存される。
【0031】
さらに、英語の関連語辞書が引かれて、“earth ”から“sky ”、“sea ”、“mountain”、および“valley”が得られ、“internationalization”から“cosmopolitan”および“internationalist”が得られ、“travel”から“flight”および“sightseeing ”が得られ、“tour”から“tourist ”が得られる。そして、これらの展開の履歴が展開履歴メモリ部18に保存される。こうして保存された展開履歴の木構造は、図10に示すようになり、図11のように木構造で表示される。
【0032】
同様にして翻訳展開と関連語展開を繰り返すことにより、より多くの展開を含む表示処理を行うことも容易である。このように、入力されたキーワードの展開の情報を一括して表示することにより、検索者は展開の履歴の構造を知ることができ、検索部15に入力される検索キータームが自分の意図した展開に従ったものであることを確信して、検索を行うことができる。
【0033】
ところで、図8の表示画面において、検索者が「水泳」と「柔道」に関連した情報のみを検索したいと思ったとする。検索者がマウスなどのポインティングデバイスでノード「水泳」を選択すると、展開履歴メモリ部18において、「水泳」の子ノードが検索され、“swimming”が求められる。そして、図12に示すように、選択された「水泳」と、その子ノードである“swimming”とが強調表示される。続いて、検索者が「柔道」を選択すると、その子ノードは“judo”であるので、「柔道」と“judo”とが強調表示される。
【0034】
また、図7の表示画面において同様の選択操作を行うと、図13のような強調表示が得られる。ここで、制御部14は、選択されたノードの最終展開語句である“swimming”と“judo”だけを検索部15に渡す。これにより、他の最終展開語句“baseball”、“soccer”などに関連した検索を省略して、検索者が意図した検索キータームによる検索を行うことができる。
【0035】
キーワードが多段階に展開された場合は、検索者が選択したノードは、子ノードだけでなく、さらに多くの子孫ノードの木構造を下層構造として持つ場合がある。この場合、選択された親ノードを含めて、それから派生したすべての子孫ノードが検索され、強調表示される。そして、強調表示されたノードの語句のみが検索部15に渡される。
【0036】
検索者は、強調表示されたノードの中から1つのノードを選択することにより、そのノードから派生した子孫ノードのみを改めて強調表示させることもでき、強調表示されたノードのいくつかを非選択に指定することにより、それらの強調表示を解除することもできる。強調表示を解除されたノードの語句は、検索部15には渡されない。
【0037】
次に、日本語のキーワードを元にして英語のデータベースを検索する例を説明する。ここでは、翻訳展開には日英翻訳辞書を用い、関連語展開には関連語辞書と略語辞書(人名辞書)を用いる。検索者が、キーワードとして「哲学者」を入力すると、まず、日英翻訳辞書が「哲学者」で引かれて、“philosopher ”が得られる。次に、“philosopher ”を関連語辞書を使って展開すると、哲学者の名前の略語として“Aquinas ”および“Hobbs ”が得られる。
【0038】
次に、略語辞書を使って得られた略語を展開し、各哲学者の氏名(フルネーム)を求める。これにより、“Aquinas ”は“Thomas Aquinas”に、“Hobbs ”は“Thomas Hobbs”に展開される。これらの展開履歴は、展開履歴メモリ部18に木構造の形で保存され、図14に示すように、木構造の形で検索者に呈示される。
【0039】
図14の表示画面において、検索者が、“philosopher ”の関連語句として、“Aquinas ”、“Hobbs ”以外に“Mill”を追加したい場合、画面情報表示編集部11の追加の機能を使って、“philosopher ”のノードの子ノードとして“Mill”を追加する。このとき、展開履歴メモリ部18で“philosopher ”の子ノードとして“Mill”が追加され、その木構造が図15のように表示される。
【0040】
また、図7の表示画面において、検索者が、「水泳」に対する翻訳語句として、“water polo”を追加したい場合、表示された表をマウスなどでドラッグして、図16に示すように拡張する。そして、新たに生成された「水泳」に対応するセルに、“water polo”と入力すると、「水泳」の子ノードとして、“water polo”が展開履歴メモリ部18に追加され、その構造が図17のように表示される。
【0041】
画面情報表示編集部11の書き換えおよび削除の機能を使うことにより、展開履歴の書き換えおよび削除に関しても、同様に行うことができる。ここで、書き換えとは、表示されている展開履歴のノードの一部を他の語句に変更する操作を意味し、削除とは、展開履歴のノードの一部を消去する操作を意味する。
【0042】
例えば、図8の表示画面において、検索者が、「スポーツ」の関連語句として、「水泳」ではなく「競泳」を用いたい場合、「水泳」を「競泳」に書き換える指示を入力する。この結果、展開履歴が変更され、図18のように表示される。また、「水泳」を削除したい場合は、その指示を入力すれば、「水泳」とそれより下位のノードがすべて削除される。
【0043】
このような編集機能を設けることにより、検索者が展開履歴を編集することが可能になり、展開辞書にない展開に基づく検索を行うことが可能になる。また、展開辞書にある展開であっても、検索に用いたくないものは、変更/削除することができるようになる。
【0044】
図15のような追加の操作を行ったときに、追加された“Mill”で略語辞書を引くと、その氏名として“John Stuart Mill”が得られる。そこで、それが展開履歴メモリ部18に保存され、展開履歴の構造が自動的に再計算されて、図19のように再表示される。
【0045】
このように、検索者によって追加された“Mill”のみを展開履歴に追加し、その展開履歴で検索を行うだけでなく、追加された“Mill”をさらに展開することによって、検索者が期待する検索キータームの数を自動的に増やすことができる。また、検索者は、追加した“Mill”がただ画面上に表示されていることだけでなく、それが展開履歴の正しい位置に追加されていることも確認できる。展開履歴の書き換え、削除が行われた場合も、同様にして、再計算と再表示が行われる。
【0046】
また、図15のような追加の操作を行ったときに、制御部14は、関連語辞書の登録項目(エントリ)を追加して、展開履歴メモリ部18の修正を関連語辞書に反映する。ここでは、“philosopher ”の関連語句として、新たに“Mill”が追加される。展開履歴の書き換えや削除の場合も、同様にして辞書のエントリが変更され、編集の結果が辞書に反映される。これにより、検索者が、検索をする度に同じ展開に対して同じ修正を指示する必要がなくなる。
【0047】
また、画面情報表示編集部11を介して展開履歴メモリ部18の構造が編集されたとき、編集の履歴を保存しておくこともできる。例えば、図14の展開履歴が図15のように編集された後、検索者が、画面情報表示編集部11にその編集の取り消しを指示した場合、保存された編集の履歴をさかのぼって、展開履歴メモリ部18が再修正される。そして、元の展開履歴の構造が復元され、図14のように表示される。これにより、検索者は、誤った編集操作を行ったときに、それを取り消して、再試行することができる。
【0048】
また、表示画面が小さかったり、検索者が展開履歴の一部を無視したい場合、展開履歴の全体を表示しない方がよい。この場合、展開履歴の一部(中間段階など)を省略して、木構造の階層を削減した省略表示を行う。
【0049】
例えば、展開履歴が図14のような構造を持つとき、検索者が、展開履歴のうち、最初のキーワード、つまり「哲学者」と、翻訳展開した結果の段階、つまり“philosopher ”と、展開の最終段階だけを表示するように指示したとする。このとき、“philosopher ”の関連後展開の結果が省略されて、展開履歴は図20のように表示される。また、省略された構造は、図21のように表示することもできる。
【0050】
このように、展開履歴の一部の段階を省略して、残りの段階の履歴を表示することにより、表示領域を節約することができ、複雑な展開履歴が含まれる場合でも、その部分を非表示にすることができる。
【0051】
また、展開の順序や展開される語句などがあらかじめ決まっている場合、複数段階の展開を経て最終的な検索キータームを得るのでは効率が悪い。そこで、画面情報表示編集部11は、検索者の指示に従って、簡略化された展開履歴を辞書に登録する。
【0052】
例えば、図14のような展開履歴を図20や図21のように表示したとき、検索者が、表示されている展開を辞書に登録するように指示したとする。このとき、“philosopher ”の関連語句として、“Thomas Aquinas”と“Thomas Hobbs”が、直接、関連語辞書に登録される。これにより、以降の展開処理では、“philosopher ”から、直接、“Thomas Aquinas”と“Thomas Hobbs”を得ることができるようになる。
【0053】
さらに、表示された展開履歴の木構造そのものを辞書のエントリとして登録することもできる。木構造を辞書に登録する形式としては、次のようなものが考えられる。
[親ノードの語句,子ノード1,子ノード2,...]
このとき、最下位のノードは“[語句,]”となるが、これを簡略化して、単に“語句”と書くことにする。例えば、図14のような構造を辞書に登録する場合は、次のようなエントリが追加される。
[哲学者,[philosopher ,[Aquinas ,Thomas Aquinas],[Hobbs ,Thomas Hobbs]]]
また、図20のような構造を辞書に登録する場合は、次のようなエントリが追加される。
[哲学者,[philosopher ,Thomas Aquinas,Thomas Hobbs]]
次に、複数のキーワードが入力された場合の処理について説明する。この場合、辞書引き部13は、与えられたキーワードの数だけ、展開辞書による辞書引きを繰り返す。図3のステップS2における表示処理は、図22に示すようになる。
【0054】
まず、制御部14は、与えられたキーワードが最初のキーワードかどうかを判定し(ステップS41)、それが最初のキーワードであれば、図4および図9に示したような表示処理を行う(ステップS42)。次に、すべてのキーワードについて展開履歴を表示したかどうかを判定し(ステップS44)、キーワードが残っていれば、ステップS41以降の処理を繰り返す。
【0055】
また、ステップS41において、与えられたキーワードが2番目以降のキーワードであれば、その展開履歴を、画面に表示されている最初のキーワードの展開履歴の裏に隠して表示し(ステップS43)、ステップS44以降の処理を繰り返す。そして、すべてのキーワードについて展開履歴の表示が終われば、処理を終了する。
【0056】
ステップS42、S43において、辞書引きの結果は、例えば、1つのキーワードにつき1つの表を用いて表示される。2つの日本語キーワード「ソフト」、「選手」を入力し、日本語から英語への翻訳展開と英語の関連語展開を行って、各キーワードを英語の検索キータームに変換すると、図23および図24のような表示が得られる。
【0057】
この場合、複数の表を1つの画面に同時に表示するのではなく、キーワード別に表が選択できるように、まず、図23のように、キーワード「ソフト」、「選手」が表のタイトルとして表示される。そして、最初のキーワード「ソフト」について、翻訳語句の辞書引きが行われ、その結果が図23のように表示される。図23においては、「ソフト」の翻訳語句として、“software”、“softball”、“soft cream”、“gentle”、および“soft”が表示されている。
【0058】
さらに、これらの各翻訳語句について、関連語句の辞書引きが行われ、その結果が図24のように表示される。図24においては、“software”の関連語句として、“download”と“application ”が表示され、“softball”の関連語句として、“pitcher ”と“battery ”が表示され、“soft cream”の関連語句として、“vanilla ”と“chocolate ”が表示され、“gentle”の関連語句として、“gentleman ”と“meek”が表示され、“soft”の関連語句として、“creamy”と“meek”が表示されている。
【0059】
また、他のキーワード「選手」の表は、「ソフト」の表の裏側に隠されているため、図24では非表示になっている。この状態で、検索者がポインティングデバイスなどで「選手」を指示すると、図25に示すように、「選手」の表が表示される。ここでは、「選手」の翻訳語句として、“player”が表示され、“player”の関連語句として、“baseball”と“basketball”が表示されている。また、「ソフト」の表は、「選手」の表の裏側に隠されて、非表示になっている。
【0060】
このように、複数のキーワードが入力された場合でも、展開履歴をキーワード別に整理して、構造的に検索者に呈示することができる。このとき、最初のキーワードの表を表示した後、検索者がその表を見ている間に、2番目以降のキーワードに関する辞書引きと表の計算をバックグラウンドで行う。
【0061】
このような制御を行うことにより、2番目以降のキーワードの辞書引きが終了するのを待つことなく、迅速に、最初のキーワードの展開履歴を表示することができる。また、検索者が2番目以降のキーワードを選択したとき、対応する表を直ちに表示することもできる。
【0062】
また、複数のキーワードが入力されたとき、キーワードまたは展開語句の共起情報を用いて展開履歴の木構造を制約し、制約された展開履歴を展開履歴メモリ部18に保存することもできる。
【0063】
上述の例では、情報検索装置は、「ソフト」と「選手」についてそれぞれ翻訳展開した後で、「ソフト」の翻訳語句と「選手」の翻訳語句について共起情報データベースを調べる。そして、共起する語句のみを自動的に選択して、展開履歴メモリ部18に保存する。例えば、共起情報データベースは、図2のデータベース19に含まれ、検索部15により検索される。情報Aと情報Bが共起するとは、情報Bが情報Aの関連情報として登録されており、情報Aが情報Bの関連情報として登録されていることを意味する。
【0064】
図24では、「ソフト」の翻訳語句として、“software”、“softball”、“soft cream”、“gentle”、および“soft”が得られ、図25では、「選手」の翻訳語句として“player”が得られている。これらの翻訳語句に関する共起情報データベースは、例えば、図26のようになる。この共起情報データベースを検索すると、“softball”の関連情報として“player”が登録されており、“player”の関連情報として“softball”が登録されていることが分かる。したがって、“softball”と“player”は共起する。
【0065】
他に共起する翻訳語句の組がなければ、制御部14は、展開履歴メモリ部18に、「ソフト」の子ノードとして“softball”のみを保存し、「選手」の子ノードとして“player”を保存する。そして、保存された展開履歴を図27のように表示する。このような保存方法によれば、展開履歴の中から検索キータームの絞り込みが自動的に行われるので、検索者が検索キータームを選択する必要がなく、効果的な検索が行われる。
【0066】
ここで、共起情報データベースの作成方法の一例を示すと、次のようになる。まず、ある文書が与えられたとき、語句Aと語句Bの関連率を、次式により定義する。
Figure 0003601653
ここで、語句A(B)の出現確率は、文書全体における語句A(B)の出現回数を文書に含まれるすべての語句の数で割ったものであり、語句Aと語句Bの同時出現確率は、文書のある部分(例えば、50語以内の部分)において、語句Aと語句Bが同時に出現する確率である。
【0067】
このような関連率を文書全体に含まれるそれぞれの語句について計算した後、ある語句と一定値以上の関連率を持つ他の語句を、関連率の高いものから順に列挙して、共起情報データベースに登録する。例えば、語句Aの関連語句B、Cなどは次のように登録される。
語句A:語句B,語句C,...
次に、展開履歴の他の表示方法について説明する。例えば、キーワード「スポーツ」が入力され、その関連語展開を2段階行った後に翻訳展開し、図28のような展開履歴が得られたとする。図28では、「スポーツ」の関連語句「ソフトボール」と「野球」の関連語句として、それぞれ、「投手」と「捕手」が得られ、それらの翻訳語句も同じである。
【0068】
このとき、展開履歴をこのまま表示すると、「ソフトボール」と「野球」について同じ展開がされているのに、その結果が別々に表示されていて、画面が見にくくなる。そこで、複数の同じ展開語句に対して、図29のように同じ色で表示したり、図30のように点線などで接続して表示したり、図31のようにノードに同じ名前をつけて表示したりする。そして、その語句以降の展開履歴については、重複を避けて、1つのノードに対してのみ表示する。
【0069】
このように、同じ展開語句同士を視覚的に関連付けて表示することで、それらが同じであることを検索者に伝えることができる。検索者は、それらの語句を参照して、それ以降の展開履歴を確認することができる。また、重複する展開履歴が1つにまとめて表示されるため、画面が整理されて見やすくなる。
【0070】
また、入力されたキーワードに対する最初の展開結果が表示されたとき、検索者がその中の1つ以上の展開語句を選択し、選択された展開語句に対してのみ次の展開を行わせることもできる。
【0071】
図32は、このような表示処理のフローチャートである。辞書引き部13は、まず、翻訳辞書を使ってキーワードの翻訳語句を辞書引きし(ステップS51)、画面情報表示編集部11は、その結果を表の形式で表示する(ステップS52)。制御部14は、すべての翻訳語句を表示したかどうかを判定し(ステップS53)、まだ表示していないものがあれば、ステップS52の処理を繰り返す。そして、すべての翻訳語句を表示した後、検索者の指示を待つ。
【0072】
次に、検索者が表示された翻訳語句のいくつかを選択すると(ステップS54)、辞書引き部13は、関連語辞書を使って選択された語句の関連語句を辞書引きし(ステップS55)、画面情報表示編集部11は、関連語句を表示する(ステップS56)。制御部14は、すべての語句を辞書引きしたかどうかを判定し(ステップS57)、まだ辞書引きしていないものがあれば、ステップS55以降の処理を繰り返す。そして、関連語辞書の辞書引きが終了すれば、処理を終了する。
【0073】
例えば、キーワード「ソフト」が入力されたとき、ステップS52では、図33のような表が表示される。次に、ステップS54において、検索者が、図34に示すように、翻訳語句“softball”と“soft”を選択している。選択操作が終わり、検索者が画面上に表示された展開ボタンを指示すると、選択された語句の関連語が辞書引きされ、得られた関連語句が、図35または図36のように、画面に表示される。このように、検索者が指定した語句のみを展開/表示することで、余計な展開処理が削減され、処理が高速化される。
【0074】
次に、キーワードが複数の形態素あるいは単語(以下、両者をまとめて形態素と呼ぶことにする)からなる複合語の場合の表示処理について説明する。
図37は、このような表示処理のフローチャートである。画面情報表示編集部11は、まず、キーワードの形態素分割の可能な組合せを表形式で表示する(ステップS61)。そして、検索者がその中からある組合せを選択すると(ステップS62)、情報検索装置は、その分割における形態素別に翻訳展開や関連語展開を行って、展開履歴を展開履歴メモリ部18に保存し、その履歴の一部またはすべてを画面に表示する(ステップS63)。
【0075】
例えば、キーワードとして「自転車専用道路」という複合語が入力されると、図38のように、形態素の分割の可能な組合せが表示される。ここでは、分割の可能性は、「自転車専用道路」と、「自転車」−「専用」−「道路」と、「自転車」−「専用道路」の3通りである。
【0076】
検索者が、「自転車」−「専用」−「道路」の組合せを選択した場合、図22の表示処理に従って各形態素が別々に展開され、図39のような表が表示される。また、検索者が、キーワードである「自転車専用道路」そのものを選択した場合は、図40のような表が表示される。このように、検索者がキーワードの分割方法を指定することで、検索者の意図が検索キータームに反映される。
【0077】
しかしながら、キーワードの分割方法によっては、辞書に登録されていない形態素が含まれる場合もある。そこで、形態素の分割の可能な組合せを表示する際に、各組合せに含まれる形態素を辞書引きして、展開語句が存在するかどうかを調べ、展開語句が存在する割合の多い組合せから順に表示することにする。
図41は、このような表示処理のフローチャートである。辞書引き部13は、まず、形態素分割の可能な組合せに含まれる各形態素について、翻訳辞書で辞書引きをする(ステップS71)。次に、画面情報表示編集部11は、辞書引きできた形態素の割合が多い順に、形態素分割の組合せを表形式で表示する(ステップS72)。
【0078】
次に、検索者がその中からある組合せを選択すると(ステップS73)、画面情報表示編集部11は、対応する翻訳語句を表示する(ステップS74)。次に、辞書引き部13は、各翻訳語句について、その関連語句を関連語辞書から辞書引きし(ステップS75)、画面情報表示編集部11は、関連語句を表示する(ステップS76)。制御部14は、すべての語句を辞書引きしたかどうかを判定し(ステップS77)、まだ辞書引きしていないものがあれば、ステップS75以降の処理を繰り返す。そして、関連語辞書の辞書引きが終了すれば、処理を終了する。
【0079】
上述の例では、「自転車専用道路」、「自転車」、「専用」、「道路」、および「専用道路」のそれぞれが翻訳辞書で辞書引きされる。ここで、「自転車専用道路」、「自転車」、「専用」、および「道路」が翻訳辞書に登録されており、「専用道路」が翻訳辞書に登録されていないとする。
【0080】
このとき、「自転車専用道路」および「自転車」−「専用」−「道路」における辞書引きできた形態素の割合は100%となり、「自転車」−「専用道路」における辞書引きできた形態素の割合は50%となる。このため、図38に示したように、「自転車」−「専用道路」の組合せは、表示の順番が最後になる。
【0081】
これらの組合せから検索者が「自転車」−「専用」−「道路」を選択すると、翻訳辞書の辞書引きはすでに終了しているので、得られた翻訳語句が表示され、それぞれの翻訳語句について、その関連語句が関連語辞書から辞書引きされる。その結果は、図39のように表示される。
【0082】
このような表示方法によれば、検索者は、辞書に登録された形態素の割合に応じて、分割方法を指定することができる。また、形態素分割の組合せ毎に辞書引きできた形態素の割合を表示するようにすれば、表示された組合せを定量的に比較することも可能になる。
【0083】
また、形態素の分割の可能な組合せを表示する際に、すべての形態素が辞書に登録されているもののみを表示してもよい。例えば、上述の例で、「専用道路」が翻訳辞書にない場合、図42に示すように、「自転車」−「専用道路」という形態素の組合せは表示しないようにする。これにより、検索者が「自転車」−「専用道路」を選択したために「専用道路」が展開されないという問題が起きるのを回避することができる。
【0084】
図2の情報検索装置は、例えば、図43に示すような情報処理装置(コンピュータ)を用いて構成することができる。図43の情報処理装置は、CPU(中央処理装置)21、メモリ22、入力装置23、出力装置24、外部記憶装置25、媒体駆動装置26、およびネットワーク接続装置27を備え、それらはバス28により互いに接続されている。
【0085】
メモリ22は、例えば、ROM(read only memory)、RAM(random access memory)などを含み、処理に用いられるプログラムとデータを格納する。CPU21は、メモリ22を利用してプログラムを実行することにより、必要な処理を行う。また、メモリ22は、展開履歴メモリ部18としても用いられる。
【0086】
入力装置23は、例えば、キーボード、ポインティングデバイス、タッチパネルなどであり、検索者からの指示や情報の入力に用いられる。出力装置24は、例えば、ディスプレイやプリンタなどであり、検索者への問い合わせ、展開履歴、検索結果などの出力に用いられる。
【0087】
外部記憶装置25は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク(magneto−optical disk)装置などである。この外部記憶装置25に、上述のプログラムとデータを保存しておき、必要に応じて、それらをメモリ22にロードして使用することもできる。また、外部記憶装置25は、展開辞書16、17を格納したり、データベース19の役割を果たしたりする。
【0088】
媒体駆動装置26は、可搬記録媒体29を駆動し、その記録内容にアクセスする。可搬記録媒体29としては、メモリカード、フロッピーディスク、CD−ROM(compact disk read only memory )、光ディスク、光磁気ディスクなど、任意のコンピュータ読み取り可能な記録媒体が用いられる。この可搬記録媒体29に上述のプログラムとデータを格納しておき、必要に応じて、それらをメモリ22にロードして使用することもできる。
【0089】
ネットワーク接続装置27は、LAN(local area network)などの任意のネットワーク(回線)を介して外部の装置と通信し、通信に伴うデータ変換を行う。また、必要に応じて、上述のプログラムとデータを外部の装置から受け取り、それらをメモリ22にロードして使用することもできる。
【0090】
図44は、図43の情報処理装置にプログラムとデータを供給することのできるコンピュータ読み取り可能な記録媒体を示している。可搬記録媒体29や外部のデータベース30に保存されたプログラムとデータは、メモリ22にロードされる。そして、CPU21は、そのデータを用いてそのプログラムを実行し、必要な処理を行う。
【0091】
【発明の効果】
本発明によれば、従来の多言語情報検索と異なり、キーワードの多段階の展開履歴を保存して、その中の必要な情報を検索者に対してインタラクティブにかつ分かりやすく表示することができる。これにより、検索者が意図したキーワードナビゲーションが効果的に実現される。
【図面の簡単な説明】
【図1】本発明の情報検索装置の原理図である。
【図2】情報検索装置の構成図である。
【図3】検索処理のフローチャートである。
【図4】第1の表示処理のフローチャートである。
【図5】第1の展開表示を示す図である。
【図6】第1の展開履歴を示す図である。
【図7】第2の展開表示を示す図である。
【図8】第3の展開表示を示す図である。
【図9】第2の表示処理のフローチャートである。
【図10】第2の展開履歴を示す図である。
【図11】第4の展開表示を示す図である。
【図12】第5の展開表示を示す図である。
【図13】第6の展開表示を示す図である。
【図14】第7の展開表示を示す図である。
【図15】第8の展開表示を示す図である。
【図16】第9の展開表示を示す図である。
【図17】第10の展開表示を示す図である。
【図18】第11の展開表示を示す図である。
【図19】第12の展開表示を示す図である。
【図20】第13の展開表示を示す図である。
【図21】第14の展開表示を示す図である。
【図22】第3の表示処理のフローチャートである。
【図23】第15の展開表示を示す図である。
【図24】第16の展開表示を示す図である。
【図25】第17の展開表示を示す図である。
【図26】共起情報データベースを示す図である。
【図27】第18の展開表示を示す図である。
【図28】第3の展開履歴を示す図である。
【図29】第19の展開表示を示す図である。
【図30】第20の展開表示を示す図である。
【図31】第21の展開表示を示す図である。
【図32】第4の表示処理のフローチャートである。
【図33】第22の展開表示を示す図である。
【図34】選択結果を示す図である。
【図35】第23の展開表示を示す図である。
【図36】第24の展開表示を示す図である。
【図37】第5の表示処理のフローチャートである。
【図38】キーワードの第1の分割表示を示す図である。
【図39】第25の展開表示を示す図である。
【図40】第26の展開表示を示す図である。
【図41】第6の表示処理のフローチャートである。
【図42】キーワードの第2の分割表示を示す図である。
【図43】情報処理装置の構成図である。
【図44】記録媒体を示す図である。
【符号の説明】
1 入力手段
2 展開手段
3 格納手段
4 出力手段
5 検索手段
11 画面情報表示編集部
12 キーワード入力部
13 辞書引き部
14 制御部
15 検索部
16、17 展開辞書
18 展開履歴メモリ部
19 データベース
21 CPU
22 メモリ
23 入力装置
24 出力装置
25 外部記憶装置
26 媒体駆動装置
27 ネットワーク接続装置
28 バス
29 可搬記録媒体
30 データベース

Claims (20)

  1. キーワードを入力する入力手段と、
    与えられた語句を他の語句に変換する辞書手段を含み、該辞書手段を用いて前記キーワードを複数段階の語句に展開する展開手段と、
    前記キーワードを展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、前記複数段階の展開履歴を木構造で格納する格納手段と、
    ユーザからの指示を入力する指示手段と、
    前記展開履歴の少なくとも一部の情報を画面上に表示し、表示された展開履歴の特定ノードの語句を選択する指示が入力されたとき、前記特定ノードと該特定ノードから派生する子孫ノードの語句を前記画面上で強調表示する出力手段と、
    強調表示された語句を検索キータームとして用いて情報検索を行う検索手段とを備え、
    前記入力手段は、複数の形態素からなる複合語のキーワードを入力し、前記出力手段は、キーワードの形態素分割における可能な形態素の組合せを1つ以上前記画面上に表示し、前記展開手段は、1つの組合せを選択する指示が入力されたとき、選択された組合せに含まれる各形態素毎に展開を行い、前記出力手段は、各形態素の展開履歴を表示することを特徴とする情報検索装置。
  2. 前記出力手段は、ユーザが強調表示された語句の1つを非選択に指定したとき、少なくとも指定された語句の強調表示を解除することを特徴とする請求項1記載の情報検索装置。
  3. キーワードを入力する入力手段と、
    与えられた語句を他の語句に変換する辞書手段を含み、該辞書手段を用いて前記キーワードを複数段階の語句に展開する展開手段と、
    前記キーワードを展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、前記複数段階の展開履歴を木構造で格納する格納手段と、
    前記展開履歴の少なくとも一部の情報を画面上に表示する出力手段と、
    ユーザからの指示を入力する指示手段と、
    入力された指示に従って、表示された展開履歴の語句の書き換え、語句の追加、および語句の削除のうち少なくとも1つの編集処理を行い、前記格納手段に格納された木構造の展開履歴を再計算する編集手段と、
    再計算された展開履歴に含まれる語句を検索キータームとして用いて情報検索を行う検索手段とを備え、
    前記入力手段は、複数の形態素からなる複合語のキーワードを入力し、前記出力手段は、キーワードの形態素分割における可能な形態素の組合せを1つ以上前記画面上に表示し、前記展開手段は、1つの組合せを選択する指示が入力されたとき、選択された組合せに含まれる各形態素毎に展開を行い、前記出力手段は、各形態素の展開履歴を表示することを特徴とする情報検索装置。
  4. 前記出力手段は、再計算された展開履歴の情報を前記画面上に表示することを特徴とする請求項3記載の情報検索装置。
  5. 前記編集手段は、前記辞書手段の辞書のエントリに、前記編集処理の結果を反映することを特徴とする請求項3または4記載の情報検索装置。
  6. 前記編集手段は、前記ユーザからの指示に従って、前記編集処理を取り消すことを特徴とする請求項項3または4記載の情報検索装置。
  7. 前記展開手段は、前記辞書手段として、異なる言語間の翻訳を行う翻訳辞書手段と、同じ言語内で関連語を求める関連語辞書手段とを含み、翻訳展開と関連語展開を組合せて、前記キーワードを複数段階に展開することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  8. 前記出力手段は、前記格納手段に格納された木構造の展開履歴の中間段階の語句を省略して、1段階以上の任意の段階の語句を表示することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  9. 前記展開手段は、前記中間段階を省略した構造を前記辞書手段に登録することを特徴とする請求項8記載の情報検索装置。
  10. 前記入力手段は、複数のキーワードを入力し、前記出力手段は、キーワード別に展開履歴を表示することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  11. 前記展開手段は、前記複数のキーワードのうちの1つの展開履歴が表示されている間に、他のキーワードの展開履歴を計算することを特徴とする請求項10記載の情報検索装置。
  12. 前記入力手段は、複数のキーワードを入力し、前記展開手段は、該複数のキーワードに関する共起情報により前記展開履歴に含める語句を絞り込んで、前記格納手段に格納することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  13. 前記出力手段は、前記表示された展開履歴に2つ以上の同じ語句が含まれるとき、該2つ以上の語句を関連付けて表示し、該2つ以上の語句のうち1つの語句に対してのみ、該同じ語句以降の展開履歴を表示することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  14. 前記展開手段は、前記第1の語句を含む第1段階の展開結果が表示され、該展開結果の中の1つ以上の語句を選択する指示が入力されたとき、選択された語句をさらに展開して第2段階の展開結果を求め、前記出力手段は、該第2段階の展開結果を表示することを特徴とする請求項1、2、3、または4記載の情報検索装置。
  15. 前記出力手段は、展開可能な形態素の割合が多い順に、前記形態素の組合せを表示することを特徴とする請求項記載の情報検索装置。
  16. 前記出力手段は、すべての形態素が展開可能であるような組合せのみを表示することを特徴とする請求項記載の情報検索装置。
  17. コンピュータのためのプログラムを記録した記録媒体であって、
    前記プログラムは、
    複数の形態素からなる複合語のキーワードを入力し、
    キーワードの形態素分割における可能な形態素の組合せが1つ以上画面上に表示され、1つの組合せを選択する指示が入力されたとき、与えられた語句を他の語句に変換する辞書手段を用いて、選択された組合せに含まれる各形態素を複数段階の語句に展開し、
    前記形態素を展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、前記複数段階の展開履歴を木構造で格納手段に格納し、
    各形態素の展開履歴の少なくとも一部の情報を画面上に表示し、
    表示された展開履歴の特定ノードの語句を選択する、ユーザからの指示を入力し、
    前記特定ノードと該特定ノードから派生する子孫ノードの語句を前記画面上で強調表示し、
    強調表示された語句を検索キータームとして用いて情報検索を行う
    処理を前記コンピュータに実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
  18. コンピュータのためのプログラムを記録した記録媒体であって、
    前記プログラムは、
    複数の形態素からなる複合語のキーワードを入力し、
    キーワードの形態素分割における可能な形態素の組合せが1つ以上画面上に表示され、1つの組合せを選択する指示が入力されたとき、与えられた語句を他の語句に変換する辞書手段を用いて、選択された組合せに含まれる各形態素を複数段階の語句に展開し、
    前記形態素を展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、前記複数段階の展開履歴を木構造で格納手段に格納し、
    各形態素の展開履歴の少なくとも一部の情報を画面上に表示し、
    ユーザからの指示を入力し、
    入力された指示に従って、表示された展開履歴の語句の書き換え、語句の追加、および語句の削除のうち少なくとも1つの編集処理を行い、前記格納手段に格納された木構造の展開履歴を再計算し、
    再計算された展開履歴に含まれる語句を検索キータームとして用いて情報検索を行う
    処理を前記コンピュータに実行させることを特徴とするコンピュータ読み取り可能な記録媒体。
  19. 入力手段が、複数の形態素からなる複合語のキーワードを入力し、
    展開手段が、キーワードの形態素分割における可能な形態素の組合せが1つ以上画面上に表示され、1つの組合せを選択する指示が入力されたとき、与えられた語句を他の語句に変換する辞書手段を用いて、選択された組合せに含まれる各形態素を複数段階の語句に展開し、該キーワードを展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、該複数段階の展開履歴を木構造で格納手段に格納し、
    出力手段が、各形態素の展開履歴の少なくとも一部の情報を画面上に表示し、
    指示手段が、表示された展開履歴の特定ノードの語句を選択する、ユーザからの指示を入力し、
    前記出力手段が、前記特定ノードと該特定ノードから派生する子孫ノードの語句を前記画面上で強調表示し、
    検索手段が、強調表示された語句を検索キータームとして用いて情報検索を行う
    ことを特徴とする情報検索方法。
  20. 入力手段が、複数の形態素からなる複合語のキーワードを入力し、
    展開手段が、キーワードの形態素分割における可能な形態素の組合せが1つ以上画面上に表示され、1つの組合せを選択する指示が入力されたとき、与えられた語句を他の語句に変換する辞書手段を用いて、選択された組合せに含まれる各形態素を複数段階の語句に展開し、該キーワードを展開して得られた第1の語句を子ノードとして該キーワードから該第1の語句を指すポインタと、該第1の語句を展開して得られた第2の語句を子ノードとして該第1の語句から該第2の語句を指すポインタとを用いて、該複数段階の展開履歴を木構造で格納手段に格納し、
    出力手段が、各形態素の展開履歴の少なくとも一部の情報を画面上に表示し、
    指示手段が、ユーザからの指示を入力し、
    編集手段が、入力された指示に従って、表示された展開履歴の語句の書き換え、語句の追加、および語句の削除のうち少なくとも1つの編集処理を行い、前記格納手段に格納された木構造の展開履歴を再計算し、
    検索手段が、再計算された展開履歴に含まれる語句を検索キータームとして用いて情報検索を行う
    ことを特徴とする情報検索方法。
JP06905098A 1998-03-18 1998-03-18 情報検索装置および方法 Expired - Fee Related JP3601653B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP06905098A JP3601653B2 (ja) 1998-03-18 1998-03-18 情報検索装置および方法
US09/145,964 US6226638B1 (en) 1998-03-18 1998-09-03 Information searching apparatus for displaying an expansion history and its method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06905098A JP3601653B2 (ja) 1998-03-18 1998-03-18 情報検索装置および方法

Publications (2)

Publication Number Publication Date
JPH11272678A JPH11272678A (ja) 1999-10-08
JP3601653B2 true JP3601653B2 (ja) 2004-12-15

Family

ID=13391369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06905098A Expired - Fee Related JP3601653B2 (ja) 1998-03-18 1998-03-18 情報検索装置および方法

Country Status (2)

Country Link
US (1) US6226638B1 (ja)
JP (1) JP3601653B2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001125894A (ja) * 1999-10-29 2001-05-11 Sony Corp 文書編集処理装置及び文書編集処理方法およびプログラム提供媒体
US7216115B1 (en) * 1999-11-10 2007-05-08 Fastcase.Com, Inc. Apparatus and method for displaying records responsive to a database query
US7047229B2 (en) * 2000-08-08 2006-05-16 America Online, Inc. Searching content on web pages
US7007008B2 (en) * 2000-08-08 2006-02-28 America Online, Inc. Category searching
JP2002215659A (ja) * 2001-01-18 2002-08-02 Noriaki Kawamae 情報検索支援方法および情報検索支援システム
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7260570B2 (en) * 2002-02-01 2007-08-21 International Business Machines Corporation Retrieving matching documents by queries in any national language
US6996558B2 (en) 2002-02-26 2006-02-07 International Business Machines Corporation Application portability and extensibility through database schema and query abstraction
US7854009B2 (en) * 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US9026901B2 (en) * 2003-06-20 2015-05-05 International Business Machines Corporation Viewing annotations across multiple applications
US7315857B2 (en) * 2004-05-13 2008-01-01 International Business Machines Corporation Method and system for propagating annotations using pattern matching
US8321470B2 (en) * 2003-06-20 2012-11-27 International Business Machines Corporation Heterogeneous multi-level extendable indexing for general purpose annotation systems
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US8014997B2 (en) 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US7617196B2 (en) * 2003-10-22 2009-11-10 International Business Machines Corporation Context-sensitive term expansion with multiple levels of expansion
US7900133B2 (en) 2003-12-09 2011-03-01 International Business Machines Corporation Annotation structure type determination
US20050209992A1 (en) * 2004-01-12 2005-09-22 Dan Kikinis Method and system for search engine enhancement
WO2006031307A2 (en) * 2004-08-03 2006-03-23 Otopy, Inc. Method and system for search engine enhancement
JP2006276918A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳装置、翻訳方法およびプログラム
US8798988B1 (en) * 2006-10-24 2014-08-05 Google Inc. Identifying related terms in different languages
US8082240B2 (en) * 2007-02-28 2011-12-20 Classe Qsl, S.L. System for retrieving information units
JP5291004B2 (ja) * 2007-03-02 2013-09-18 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 通信ネットワークにおける方法及び装置
CN102053977A (zh) * 2009-11-04 2011-05-11 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
KR101708691B1 (ko) * 2010-05-26 2017-02-21 엘지전자 주식회사 영상표시기기, 그 시스템 및 그 영상표시기기에 표시된 오브젝트 검색방법
CN102298582B (zh) * 2010-06-23 2016-09-21 商业对象软件有限公司 数据搜索和匹配方法和系统
US8326861B1 (en) * 2010-06-23 2012-12-04 Google Inc. Personalized term importance evaluation in queries
JP5392227B2 (ja) * 2010-10-14 2014-01-22 株式会社Jvcケンウッド フィルタリング装置およびフィルタリング方法
JP5392228B2 (ja) * 2010-10-14 2014-01-22 株式会社Jvcケンウッド 番組検索装置および番組検索方法
CN103970798B (zh) * 2013-02-04 2019-05-28 商业对象软件有限公司 数据的搜索和匹配
JP6135331B2 (ja) * 2013-06-27 2017-05-31 カシオ計算機株式会社 電子機器、プログラム、および、検索システム、検索方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2515726B2 (ja) * 1985-07-10 1996-07-10 株式会社日立製作所 情報検索方法及び装置
JPH01243113A (ja) * 1988-03-25 1989-09-27 Hitachi Ltd 木構造データの表示選択方法
JPH0421180A (ja) * 1990-05-16 1992-01-24 Matsushita Graphic Commun Syst Inc 文書検索装置
JPH04127370A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 情報収集システム
US5278980A (en) * 1991-08-16 1994-01-11 Xerox Corporation Iterative technique for phrase query formation and an information retrieval system employing same
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
JPH07262198A (ja) * 1994-03-18 1995-10-13 Toshiba Corp 文書検索装置
JPH07262217A (ja) * 1994-03-24 1995-10-13 Fuji Xerox Co Ltd テキスト検索装置
US5799268A (en) * 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
US5715468A (en) * 1994-09-30 1998-02-03 Budzinski; Robert Lucius Memory system for storing and retrieving experience and knowledge with natural language
JPH08115334A (ja) * 1994-10-18 1996-05-07 Canon Inc 検索装置
JPH08305728A (ja) * 1995-05-10 1996-11-22 Oki Electric Ind Co Ltd 多言語間検索システム
US5828575A (en) * 1996-05-06 1998-10-27 Amadasoft America, Inc. Apparatus and method for managing and distributing design and manufacturing information throughout a sheet metal production facility
US5971589A (en) * 1996-05-06 1999-10-26 Amadasoft America, Inc. Apparatus and method for managing and distributing design and manufacturing information throughout a sheet metal production facility
JP3733374B2 (ja) * 1996-07-03 2006-01-11 沖電気工業株式会社 情報検索装置
US6092035A (en) * 1996-12-03 2000-07-18 Brothers Kogyo Kabushiki Kaisha Server device for multilingual transmission system

Also Published As

Publication number Publication date
US6226638B1 (en) 2001-05-01
JPH11272678A (ja) 1999-10-08

Similar Documents

Publication Publication Date Title
JP3601653B2 (ja) 情報検索装置および方法
US7194450B2 (en) Systems and methods for indexing each level of the inner structure of a string over a language having a vocabulary and a grammar
JP3181548B2 (ja) 情報検索装置及び情報検索方法
US5257186A (en) Digital computing apparatus for preparing document text
JP2783558B2 (ja) 要約生成方法および要約生成装置
JPH10232883A (ja) 多言語対応文書検索システム
US20100293162A1 (en) Automated Keyword Generation Method for Searching a Database
JP3134204B2 (ja) 情報検索用端末装置及び情報検索用端末装置における情報表示・入出力方法
US6915300B1 (en) Method and system for searching indexed string containing a search string
JPH11184865A (ja) 文書要約装置
JP3178421B2 (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH0844771A (ja) 情報検索装置
JPH10269233A (ja) 文書データベースの検索結果表示方法及び装置
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3498635B2 (ja) 情報検索方法及びその装置並びにコンピュータ可読記録媒体
JP2003108578A (ja) ネットワーク検索システム
JP3537260B2 (ja) リンク付文書検索表示システム
JP2868256B2 (ja) プログラム編集装置
JPH01307865A (ja) 文字列検索方式
JP2009251845A (ja) 検索結果評価装置及び検索結果評価方法
JPH1185765A (ja) タグ付文書検索システム
JPH08249346A (ja) 文書検索装置及び文書生成方法
JPH0793345A (ja) 文書検索装置
JP2000010973A (ja) 文字入力システム、文字入力方法及びコンピュータ読み取り可能な記録媒体
JPH05108621A (ja) 電子辞書・事典装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040430

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040615

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040804

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040914

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040915

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071001

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081001

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091001

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101001

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101001

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111001

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111001

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121001

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees