JP2005516306A - 任意の各国語での照会によるマッチング文書の検索 - Google Patents

任意の各国語での照会によるマッチング文書の検索 Download PDF

Info

Publication number
JP2005516306A
JP2005516306A JP2003564770A JP2003564770A JP2005516306A JP 2005516306 A JP2005516306 A JP 2005516306A JP 2003564770 A JP2003564770 A JP 2003564770A JP 2003564770 A JP2003564770 A JP 2003564770A JP 2005516306 A JP2005516306 A JP 2005516306A
Authority
JP
Japan
Prior art keywords
language
search
documents
keywords
languages
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003564770A
Other languages
English (en)
Other versions
JP4634715B2 (ja
Inventor
ブラウン、グレゴリ、ティー
ドグナタ、ユルダエル、ネズィヒ
ドリッシ、ヨーセフ
フィン、トンハイン
キム、ムーン、ジュ
コザコフ、レヴ
レオン−ロドリゲス、ジュアン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/066,346 external-priority patent/US6952691B2/en
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2005516306A publication Critical patent/JP2005516306A/ja
Application granted granted Critical
Publication of JP4634715B2 publication Critical patent/JP4634715B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • G06F16/319Inverted lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3337Translation of the query language, e.g. Chinese to English
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99943Generating database or data structure, e.g. via user interface
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】任意の各国語での照会によるマッチング文書の検索を提供すること。
【解決手段】複数の言語の1つによるキーワード検索によってアクセスし、それらのすべての言語に含まれる文書のリストを提供できる双方向性の逆索引機能を含む検索エンジンによって、検索時間が短縮される。すべてのサポート言語によるキーワードは、キーワードを含む言語による文書と相互参照される逆索引ルックアップ・テーブルに記憶されることが好ましい。異なる言語で同じ意味を持つ複数のキーワードについては、それらの言語の1つで当該キーワードを照会すれば、同時に他の言語のキーワードすべてにアクセスすることができる。このテーブルを含む検索エンジンは、ユーザの決定に応じて、選択された言語、第2の言語、またはすべてのサポート言語で関連文書を識別することができる。各文書に関する情報は、キーワードの登場頻度やキーワードの近接性など、文書のランク付けに使用する情報も含むことができる。

Description

本発明は、ユーザによって入力される検索キーワード用語を使用するデータベース検索の分野に関する。より詳細には、本発明は、異なる言語による文書を含むデータベースを検索するためのシステムおよび方法であり、複数のデータベース言語の1つを用いて検索語を入力すれば、該当するデータベース文書が別の言語で書かれていても、その文書を識別する。
本出願は、2002年2月1日に出願された「Method and System forSearching a Multi-lingual Database」という名称の米国特許出願第10/066,346号(CHA920010230US1)の一部継続出願である。
複数の言語による素材を含むデータベースを検索するために、さまざまな手法が提案されている。ある手法では、検索語を入力する言語、またはユーザの言語にデータベース全体を翻訳する。しかしこの手法では、相当な大きさのデータベース用に大量の翻訳が(そして複数のユーザが異なる言語でデータベースを使用する場合は複数の翻訳が)必要となる可能性がある。さらに、文書を翻訳する各プロセスには、原文の意味をいくらかでも失う(または歪める)危険性が伴う。
別の手法では、前述の同時係属出願に記載されているように同義語辞書またはキーワード辞書を使用する。この同時係属出願のシステムは同義語辞書またはキーワード辞書を含み、この同義語辞書またはキーワード辞書は双方向性であり、第1の言語と他の言語の間でキーワードの翻訳を可能にする。文書用の翻訳された言葉、キーワードは逆索引に記憶され、この逆索引はユーザの決定に応じて、選択された言語、第2の言語、またはすべての言語による検索に使用される。このように複数の検索および翻訳済み同義語辞書を使用すると、文書全体を翻訳する必要がなくなり、データベース全体を翻訳することに起因して生じる可能性のある前述のような不正確さを避けることができる。しかし、こうした検索を実行し分析するには長時間を要する場合があり、ユーザが検索を対話式に修正し、有意な結果を得ることができない可能性がある。
図1は従来の検索システムを示しており、英語(第1言語)の文書がシンボル102で示され、各国語(NL)などの第2言語の文書がシンボル122で示されている。文書の各セットは別々に維持される一方で、キーワードを抽出して索引を作成するプロセスを介して索引付けされる。このプロセスは、英語の文書102についてはボックス104で、第2言語の文書122についてはボックス124で示されている。次のステップでは、文書の各セットに対して逆索引が実行される。英語による逆索引はブロック106で、第2言語による索引はブロック126で実行される。次いで検索または照会のフォーマットが設定され、複数のデータベースから選択された1つのデータベースに対して適用される。このプロセスは、英語による照会については108で、各国語による照会についてはブロック128で実行される。英語による照会の結果はブロック110で示され、各国語による照会の結果はボックス130で表される。このように、このプロセスのステップは各データベースに対して別々に実行され、ブロック112で文書を索引付けするステップと、ブロック114で逆索引を作成するステップと、ブロック116で検索を実行して結果を提供するステップとを含む。
データベースが異なっても、ステップは同一である。各データベースは別々に維持され、それぞれが別々に検索され、それぞれ別々の結果が生成される。この同一の構造は任意の数の別々のデータベースに適用できるため、このシステムを拡張して希望の数の言語をサポートすることができる。しかし自国語(たとえばスペイン語)で書かれているが別の言語(たとえば英語)の専門用語を使用している技術文書もある。このようなシステムでは、検索語に相当する各国語を求めて各国語のデータベースを検索しても、その検索語が文書中に別の言語で含まれている場合は、その検索語を見つけ出すことはできない。またこうしたシステムでは、各国語で検索しても、検索対象を複数の異なる言語で扱う文書を見つけ出すことはできない。
米国特許出願第10/066,346号
したがって本発明の目的は、複数の言語による文書用の改良型検索エンジンを提供することである。
本発明の別の目的は、実行時におけるキーワードの翻訳およびそれらのキーワードを含む文書の検索を減らすことである。
本発明の別の目的は、任意のサポート言語によるキーワードを使用したデータベース検索を可能にし、そのサポート言語および任意の他のサポート言語で書かれた文書を検索することである。
ここまで本発明の目的および利点のいくつかについて説明したが、他の目的および利点は、以降の本発明に関する説明を添付の図面と併せて参照すれば、当業者にとって明らかになるだろう。
本発明によれば、複数の言語の1つによるキーワード検索によってアクセスされ、それらのすべての言語に含まれる文書のリストを提供できる双方向性の逆索引機能を含む検索エンジンによって、検索時間が短縮される。すべてのサポート言語によるキーワードは、キーワードを含むそれらの言語による文書と相互参照される逆索引ルックアップ・テーブルに記憶されることが好ましい。異なる言語で同じ意味を持つ複数のキーワードは、それらの言語の1つで当該キーワードを照会すれば、同時にアクセスすることができる。このテーブルを含む検索エンジンは、ユーザの決定に応じて、選択された言語、第2の言語、またはすべてのサポート言語で関連文書を識別することができる。各文書に関する情報は、文書のIDだけでなく、当該文書にキーワードが登場する回数や、他のキーワードに対する当該キーワードの近接性など、文書のランク付けに使用する情報も含むことができる。したがって逆索引テーブルを使用すると、検索実行時におけるキーワードの翻訳、文書内でのキーワードの識別、およびランク付け情報の蓄積が不要となり、検索時間が短縮され、文書の全文翻訳に起因して生じる可能性のある不正確さを避けることができる。
図2は、異なる言語の文書内にある複数のキーワードを、図3に示す単一の拡張キーワード索引テーブルに統合するためのシステムを示す。図2に示すように、データベース200内にある任意の言語(たとえば英語)による文書はシンボル202で表される。データベース内の各文書からのキーワードは、クローラ204を用いてオフラインで識別される。クローラ204はエクストラクタ206用に文書を走査し、エクストラクタ206は文書のテキスト内のキーワードを識別する。次いで抽出された英語のキーワードは、キーワード翻訳機構208を用いて他のサポート言語に翻訳され、すべてのサポート言語で同じ意味を持つキーワードの拡張逆索引210が作成される。キーワードの翻訳は、対応する意味を持つ他の各国語のキーワードと関連付けられた英語のキーワードを含むキーワード辞書212を用いて行われることが好ましく、図3の索引用の同義語リストが作成され、他のサポート言語において対応する意味を持つそれぞれのサポート言語の複数のキーワード内の各キーワードが効果的に列挙される。さまざまな言語を管理するために、ユニコード・システム(UTF8)を用いて各キーワードを翻訳することが提案されている。もっとも本発明においては、本発明の趣旨に矛盾しない的確なシステムであれば、他のいかなるシステムも有利に使用することができる。キーワードを求めて文書に対して問合せを行うための1つの言語として英語が記載されているが、本発明は、キーワードを求めて文書に対して英語で問合せを行うことに限定されない。任意のサポート言語En、NL、...NLi...NLnを用いて、英語では見つからない文書内のキーワードを見つけることができる。
図2の拡張索引テーブル210のさらに詳細な図が、図3に示されている。英語のキーワードK1〜Knが、図2に関連して説明した方法を用いて文書D1〜Dnから抽出される。サポートされるすべての各国語における対応するキーワードが前述のように得られるため、英語のキーワードKiそれぞれに対して、すべてのサポート言語における同義のキーワードが存在する。図3に示すように、Xはリストされたキーワードの1つまたは複数が登場する文書D1〜Dnを示す。たとえば図示してあるように、キーワードK1は文書D1およびDj内に英語で登場し、同じ意味を持つキーワードK11およびK12は各国語NL1およびNL2の文書内に存在する。同様に、同義のキーワードKi1およびKi2は、各国語NL1および2では利用できるが英語では利用できない文書D2内に存在する。同義のキーワードKnおよびKn2は、英語および各国語NL2では利用できるが各国語NL1では利用できない文書Dj内に存在する。Xでマークされた各位置に記憶されているのがランク付け要素情報であり、この情報には、その言葉がその文書内に登場する回数、その文書内に登場する他のキーワードとの近接性、そのキーワードを含む文書の種類(すなわち技術誌や広告)などが含まれる。この情報は、検索によって見つかった他の文書と比較して各文書をランク付けするために使用される。
図3のテーブルが任意のサポート言語のキーワードによる問合せを受けると、照会内のキーワードと同じ意味を持つ複数のキーワードを含む任意の言語による文書が識別され、それらのランク付け情報が提供される。たとえば、照会がキーワードKiおよびKnを含むと仮定すると、文書D2〜DjおよびDnはそれらの利用可能な言語で識別されるだろう。したがって文書D2の場合、文書は英語ならびに各国語NL1およびNL2で利用可能と識別され、その一方で文書Djは各国語NL1およびNL2で利用可能と識別されるだろう。タイトルまたはファイル番号で文書を識別することに加えて、記憶されたランク付け要素情報が文書ランク付けアルゴリズムに提供されるだろう。こうしたアルゴリズムは、2002年4月10日に出願された同時係属の米国特許出願第10/120,071号に記載されており、これを参照により本明細書に組み込む。
図4は、図3の拡張逆索引を作成する際に役立つキーワード同義語テーブル400の一部を示す。このテーブルは複数の列を含み、それぞれの列は異なるサポート言語と関連付けられている。図示してあるように、これらのサポート言語は、列410の英語、列420のスペイン語、列430のフランス語、列440のイタリア語である。ドイツ語や日本語といった他の任意のサポート言語用に提供されたさらなる列450が示されている。もちろん、英語とは異なる種類の文字を持つ言語もあり、言語によっては英語とは異なる多くのシンボルを持ち、日本語などのいくつかの言語を表すために設定された2バイト文字を使用する必要性が生じるかもしれないことは認識している。この図4では、行に同義語の2つのセットが示されており、一方は行460の英単語「network」と関連付けられ、他方は行470の英単語「processor」と関連付けられている。実際には同義語テーブル400は、シンボル490によって示されるようなさらなる列を必要に応じて有する場合があり(あるいはサポート言語が少なく、サポート言語の選択が設計上の選択の問題であり、本発明の特徴ではないために列が少ない場合もあり)、シンボル480によって示されるように各キーワード用の行を有するであろう。各項目が言語と関連付けられているため、必要に応じて単語をその言語と関連付けて、ネットワークを意味するスペイン語の単語(red)と赤色を意味する英単語を区別できる点に留意することが重要である。このテーブルは、同義語テーブルの概念を理解する上でそれぞれ表形式で示されているが、従来のデータ処理技術に従ってストレージ内に他の既知のフォーマットで存在することができる。
図5は、本発明を組み込んだ検索システムを示す。照会510が任意のサポート言語で検索エンジン520に入力され、図2および図3に関連して説明した拡張キーワード逆索引210に渡される。索引210は複数の言語をサポートし、任意のサポート言語によるキーワード照会の翻訳を可能にする。英語による照会の場合、照会は英語のキーワード530および他のサポート言語のキーワード530〜530nにおけるリストを用いて逆索引210に適用される。これによって、英語のヒット・リスト540および各国語のヒット・リスト540〜540nが作成される。次いでユーザは、関心のある任意の言語で結果540〜540を選択することができる。ユーザは、1つのリスト(たとえばリスト540)を選択し、それを不適当と判断し、別の選択を試みることができる。ユーザの英語理解力が限られている場合は、他の任意の各国語540〜540nで結果を見ることを望むかもしれない。各国語の結果(たとえば540)が十分でない(または存在しない)場合、ユーザは英語の結果540に進むことができる。あるいはユーザは、関心のある結果として最も可能性が高いのは英語の結果540であると認識し、それらの結果から着手するかもしれない。あるいはユーザは、英語で非常に多くの結果が見つかったため、母国語550でもっと候補を絞り込んだリストを見ようと考えるかもしれない。各国語の結果が貧弱であるか、または利用できない場合、検索エンジンは、選択されたリスト560内に列挙される検索結果を増やすために、他の言語の文書を提供するだろう。この場合、デフォルトのリスト言語は英語であり、英語で利用できない文書は、利用可能な言語で提供される。選択されたリスト内の文書は、ランク付けアルゴリズム570によって分析され、ランク付けされたリスト580がユーザに提供される。
図6に示すように、本発明のシステムに問合せを行うためのコンピュータ画面は、キーワード照会600を入力するためのスペースを含むであろう。検索領域602は、検索範囲を示すためのものである。検索領域604は、検索対象の言語を指定するためのものである。領域606は、照会用語が提供される際の言語を示すためのものであり、スペース608は、ランク付けリストが提供される際の言語を提示するために使用される。たとえば図では、「laptop」および「IBM」が検索対象のキーワードである。検索領域は「任意の国」である。しかし必要であれば、たとえば特定の国に、あるいは特定の文書リポジトリにさえ、検索を限定することができる。たとえば米国国会図書館や米国の任意の図書館に検索領域を限定することができる。検索を実行する言語は「すべて」と記載されている。これによって、図3のテーブルに含まれているすべてのサポート言語で検索が行われることになるため、図3に関連して説明したように、同じ文書の複数のコピーがテーブルから読み出されるだろう。スペース606は、検索語が英語であるという事実を識別する。しかし、他のいかなるサポート言語も使用することができる。たとえばドイツ語がサポート言語であるならば、検索語600はドイツ語の単語とすることができ、照会言語はそれらがドイツ語であることを示すであろう。最終的に結果は、照会言語とは異なる言語で提供できるため、ここに図示してあるように、検索語は英語だが、ランク付けされた文書は、それらがドイツ語で利用できるならドイツ語で提供されるだろう。もし何らかの文書がドイツ語で利用できない場合、リストは、その文書を利用できる言語、すなわち第1のデフォルト言語の英語でその文書を含むであろう。記載のスペース600〜608を使用すると、検索が実行される範囲および言語ならびに得られる結果を制御できるようになる。
次いで図7を参照すると、ステップ702および704では、図6のスペース600〜608に記載された検索情報をユーザが入力することによってシステムに問い合わせる。入力された照会情報および他の情報を用いてステップ706で拡張逆索引テーブルに問合せを行い、テーブル210から文書リストが得られる。次いでステップ710では、ランク付けされた文書のリストが希望の言語で検索者に提供され、検索者は結果が満足できるかどうかをステップ712で判断する。結果が満足できる場合、プロセスは終了する。しかし結果が満足できない場合、検索者はステップ714において、ステップ702および704で提供したデータを修正することによって検索範囲を広げるか、または他の形で変更することができる。
認識されることであろうが、本発明は、複数の命令を含むコンピュータ・プログラム手段を含むプログラムを記憶した汎用コンピュータなどのデータ処理システムでの使用に特に適合したものである。通常これらの命令は、人間が読み取ることのできる高水準言語で書かれ、マシン言語、すなわちデータ処理システムによって理解される単純な命令に翻訳される。適切な例では、こうした命令は必要に応じて直接マシン言語のプログラム言語、すなわち実行の効率は高いがプログラムしづらいシステムで書くことができる。本発明は、何らかの特定の入力言語に限定されるものではない。2002年4月10日に出願された同時係属の米国特許出願第10/120,071号は、本発明と共に使用できるネットワークを開示している。この出願の主題を参照により本明細書に組み込む。本発明のソフトウェアはサーバ上に提供することができ、図6の画面表示が登場するコンピュータを用いてインターネットを介してアクセスすることができる。
本明細書で使用されているように、ソフトウェア、コンピュータ・プログラム、およびコンピュータ・プログラム手段という各用語は、交換可能に使用される。本発明の環境におけるソフトウェアとは、情報処理能力を有するシステムに特定の機能を直接、または(a)別の言語、コード、もしくは表記への変換と(b)異なる形態での複製のいずれかの後に、または両方の後に実行させるように意図された任意の言語、コード、または表記による任意の表現または命令のセットを意味する。好ましい実施形態の説明では、異なる言語を管理するためにユニコード・システムを使用したが、本発明においては、異なる言語を表すのに適した他の方法を必要に応じて有利に使用することもできる。
各国語という用語は、1つの言語または関連する複数の言語を表すために使用した。各国語は、システムによって任意のサポート言語とすることができ、異なるユーザ用の異なる言語を含むことができる。したがって「各国語」と言えば、メキシコ人やスペイン人にとってはスペイン語のことであり、フランスや他のフランス語圏の人にとってはフランス語のことである。キーワードを特定し、検討中の文書を表すキーワードから独自性のほとんどない共通のテキストを分離するためのシステムとして、さまざまな共通言語用に適切な同義語テーブルを利用することができる。こうしたキーワード特定システムは往々にして技術指向であり、検討中の技術に関連のある言葉を識別する。
もちろん、前述の好ましい実施形態に関する説明を添付の図面および特許請求の範囲と併せて参照すれば、本発明に関する多くの変更が当業者にとって明らかであろう。たとえば環境によっては、文書が複数のサポート言語の組合せによって書かれていてもよい。さらに本発明のいくつかの要素は、他の要素を対応して使用することなく単独で有利に使用することもできる。たとえば同義語辞書またはキーワード辞書を使用することが、キーワードを他の言語に翻訳する唯一の方法というわけではない。さらに環境によっては、他のさまざまなデバイスを有利に代用することができる。したがって前述の好ましい実施形態に関する説明は、本発明の原理を例示するものにすぎず、本発明を限定するものではないとみなすべきである。
文書が2つの異なる言語で存在する従来の検索技術を示す図である。 本発明の改良型複数言語文書データベース索引システムおよび逆索引テーブルを示す図である。 1つの言語におけるキーワードと、そのキーワードに相当する他の言語における語とを関連付け、照会されたキーワードを含むすべての言語の文書を識別する本発明の索引テーブルを示す図である。 同義語テーブルの一部を示す図である。 本発明の複数言語データベース検索システムを示す図である。 本発明を組み込んだ検索システムに検索照会を入力するために使用できるコンピュータ表示画面の一部を示す図である。 本発明を実施する際に実行される論理の例を示すフローチャートである。

Claims (13)

  1. 複数のサポート言語による文書のデータベースを作成および検索する方法であって、
    キーワード辞書を用いて各前記文書からキーワードを抽出するステップと、
    前記キーワードを前記サポート言語に翻訳するステップと、
    各サポート言語による各前記文書に対するキーワードのリストを作成するステップと、
    各サポート言語による前記キーワードを用いて、前記キーワードおよび前記文書に関するランク付け要素情報を含む前記文書の逆索引を作成するステップと、
    1つのサポート言語による検索語を用いて前記逆索引に対して問合せを行うことによって、任意のサポート言語による文書を検索するステップと、
    前記逆索引内に含まれる前記文書の前記ランク付け要素情報を用いて前記文書をランク付けするステップとを含む方法。
  2. 請求項1の前記ステップを含む方法であって、前記キーワードを用いて前記逆索引を作成するステップが、ユニコード・システムを用いてサポート言語を管理するステップを含む方法。
  3. 請求項1の前記ステップを含むデータベース検索方法であって、照会を生成するステップが、照会が提示される言語を識別するステップを含む方法。
  4. 複数の言語で書かれた文書を含むデータベースを検索する方法であって、
    他のサポート言語で同じ意味を持つキーワードと並記される各文書のキーワード検索語を識別する検索ツールを作成するステップと、
    任意のサポート言語によるキーワード検索語を用いて検索文書を識別し、検索言語と他のサポート言語の双方によるキーワード検索語に応答して検索エンジンを用いて前記検索ツールに対して問合せを行うステップと、
    前記検索語および並記されるそれらの同義語に基づいて検索された複数の言語による文書のリストを提供するステップとを含む方法。
  5. 検索結果を別の言語に変換するステップを含む、請求項4に記載の方法。
  6. 前記検索ツール内のランク付け情報に基づいて整理された文書のリストを提供するステップをさらに含む、請求項5に記載の方法。
  7. 検索者によって選択されたサポート言語による文書が存在する場合にその言語による文書の検索リストを提供するステップを含む、請求項4に記載の方法。
  8. 入力検索に基づいて文書のデータベースを検索するためのシステムであって、
    前記データベース内の複数の文書のそれぞれについて、少なくとも第1の言語と第2の言語で同じ意味を持つキーワードを含むキーワード・リストと、
    前記データベースの前記複数の文書について前記リスト内で同じ意味を持つ前記キーワードを含む逆索引と、
    前記第1の言語と第2の言語の双方によるキーワードに応答し、前記逆索引を用いて、前記第1の言語すなわち入力言語で入力されたキーワード検索語に対応する文書および前記第2の言語の文書を含む一組の結果を得る検索エンジンとを含むシステム。
  9. 前記リストが、検索語を第1の言語から第2の言語に、そして第2の言語から第1の言語に変換するときに使用できる双方向性のリストである、請求項8に記載されたタイプのシステム。
  10. 前記検索語の変換が、複数の言語を管理するためにユニコード・システムを使用する、請求項8に記載されたタイプの検索システム。
  11. 入力検索に基づいて文書のデータベースを検索するための、コンピュータで使用可能な媒体上のコンピュータ・プログラムであって、
    前記データベース内の複数の文書のそれぞれについて、少なくとも第1の言語と第2の言語で同じ意味を持つキーワードを含むキーワード・リスト用のソフトウェアと、
    前記データベースの前記複数の文書について前記リスト内で同じ意味を持つ前記キーワードを含む逆索引用のソフトウェアと、
    前記第1の言語と第2の言語の双方によるキーワードに応答し、前記逆索引を用いて、前記第1の言語すなわち入力言語で入力されたキーワード検索語に対応する文書および前記第2の言語の文書を含む一組の結果を得る検索エンジン用のソフトウェアとを含むコンピュータ・プログラム。
  12. 前記リストが、検索語を第1の言語から第2の言語に、そして第2の言語から第1の言語に変換するときに使用できる双方向性のリストである、請求項11に記載されたタイプのコンピュータ・プログラム。
  13. 前記検索語の変換が、複数の言語を管理するためにユニコード・システムを使用する、請求項11に記載されたタイプのコンピュータ・プログラム。
JP2003564770A 2002-02-01 2003-01-24 任意の各国語での照会によるマッチング文書の検索 Expired - Fee Related JP4634715B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US10/066,346 US6952691B2 (en) 2002-02-01 2002-02-01 Method and system for searching a multi-lingual database
US10/180,195 US7260570B2 (en) 2002-02-01 2002-06-26 Retrieving matching documents by queries in any national language
PCT/EP2003/000761 WO2003065248A2 (en) 2002-02-01 2003-01-24 Retrieving matching documents by queries in any national language

Publications (2)

Publication Number Publication Date
JP2005516306A true JP2005516306A (ja) 2005-06-02
JP4634715B2 JP4634715B2 (ja) 2011-02-16

Family

ID=27667790

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003564770A Expired - Fee Related JP4634715B2 (ja) 2002-02-01 2003-01-24 任意の各国語での照会によるマッチング文書の検索

Country Status (9)

Country Link
US (1) US7260570B2 (ja)
EP (1) EP1485830B1 (ja)
JP (1) JP4634715B2 (ja)
KR (1) KR100572797B1 (ja)
CN (1) CN100375090C (ja)
AT (1) ATE322045T1 (ja)
CA (1) CA2474814A1 (ja)
DE (1) DE60304331T2 (ja)
WO (1) WO2003065248A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007530819A (ja) * 2004-03-30 2007-11-01 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー 防護服用の布帛
JP2010073177A (ja) * 2008-09-17 2010-04-02 Shinei Planners:Kk 国際対応型日本語入力システム
JP2014518581A (ja) * 2011-04-28 2014-07-31 マイクロソフト コーポレーション 代替市場検索結果トグル

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6952691B2 (en) * 2002-02-01 2005-10-04 International Business Machines Corporation Method and system for searching a multi-lingual database
US7039625B2 (en) * 2002-11-22 2006-05-02 International Business Machines Corporation International information search and delivery system providing search results personalized to a particular natural language
WO2004088479A2 (en) * 2003-03-26 2004-10-14 Victor Hsieh Online intelligent multilingual comparison-shop agents for wireless networks
US7483877B2 (en) * 2003-04-11 2009-01-27 International Business Machines Corporation Dynamic comparison of search systems in a controlled environment
JP2004355069A (ja) 2003-05-27 2004-12-16 Sony Corp 情報処理装置および方法、プログラム、並びに記録媒体
US7854009B2 (en) * 2003-06-12 2010-12-14 International Business Machines Corporation Method of securing access to IP LANs
US8014997B2 (en) * 2003-09-20 2011-09-06 International Business Machines Corporation Method of search content enhancement
US20050065774A1 (en) * 2003-09-20 2005-03-24 International Business Machines Corporation Method of self enhancement of search results through analysis of system logs
US20050138007A1 (en) * 2003-12-22 2005-06-23 International Business Machines Corporation Document enhancement method
US7716211B2 (en) * 2004-02-10 2010-05-11 Microsoft Corporation System and method for facilitating full text searching utilizing inverted keyword indices
US7594277B2 (en) * 2004-06-30 2009-09-22 Microsoft Corporation Method and system for detecting when an outgoing communication contains certain content
US8473475B2 (en) 2004-09-15 2013-06-25 Samsung Electronics Co., Ltd. Information storage medium for storing metadata supporting multiple languages, and systems and methods of processing metadata
US20080077570A1 (en) * 2004-10-25 2008-03-27 Infovell, Inc. Full Text Query and Search Systems and Method of Use
WO2006047654A2 (en) * 2004-10-25 2006-05-04 Yuanhua Tang Full text query and search systems and methods of use
US20070022134A1 (en) * 2005-07-22 2007-01-25 Microsoft Corporation Cross-language related keyword suggestion
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
KR100643801B1 (ko) * 2005-10-26 2006-11-10 엔에이치엔(주) 복수의 언어를 연동하는 자동완성 추천어 제공 시스템 및방법
US8762358B2 (en) * 2006-04-19 2014-06-24 Google Inc. Query language determination using query terms and interface language
US8442965B2 (en) * 2006-04-19 2013-05-14 Google Inc. Query language identification
US7835903B2 (en) * 2006-04-19 2010-11-16 Google Inc. Simplifying query terms with transliteration
US8380488B1 (en) 2006-04-19 2013-02-19 Google Inc. Identifying a property of a document
US8255376B2 (en) 2006-04-19 2012-08-28 Google Inc. Augmenting queries with synonyms from synonyms map
US20070271231A1 (en) * 2006-05-22 2007-11-22 Jimmy Jong-Yuan Lin Search method on the Internet
CN100416570C (zh) * 2006-09-22 2008-09-03 浙江大学 一种基于问答库的中文自然语言问答方法
WO2008086889A1 (de) * 2007-01-16 2008-07-24 Netbreeze Gmbh Transkriptionsvorrichtung zur automatisierten transkription und transphrasierung sowie entsprechendes verfahren
KR100893629B1 (ko) * 2007-02-12 2009-04-20 주식회사 이지씨앤씨 전자교재 컨텐츠의 구문에 식별코드를 부여하는 시스템 및방법, 전자교재 컨텐츠의 데이터 검색 시스템 및 방법,전자교재 컨텐츠의 사용과 제공에 관한 포인트 관리 시스템및 방법
US8051061B2 (en) 2007-07-20 2011-11-01 Microsoft Corporation Cross-lingual query suggestion
US7917488B2 (en) * 2008-03-03 2011-03-29 Microsoft Corporation Cross-lingual search re-ranking
US8065739B1 (en) * 2008-03-28 2011-11-22 Symantec Corporation Detecting policy violations in information content containing data in a character-based language
US8171041B2 (en) * 2008-05-15 2012-05-01 Enpulz, L.L.C. Support for international search terms
WO2009154570A1 (en) * 2008-06-20 2009-12-23 Agency For Science, Technology And Research System and method for aligning and indexing multilingual documents
US8782061B2 (en) 2008-06-24 2014-07-15 Microsoft Corporation Scalable lookup-driven entity extraction from indexed document collections
US8135580B1 (en) * 2008-08-20 2012-03-13 Amazon Technologies, Inc. Multi-language relevance-based indexing and search
US20100145923A1 (en) * 2008-12-04 2010-06-10 Microsoft Corporation Relaxed filter set
EP2406731A4 (en) 2009-03-13 2012-08-22 Invention Machine Corp SYSTEM AND METHOD FOR THE AUTOMATIC SEMANTIC MARKING OF NATURAL LANGUAGE TEXTS
US8577909B1 (en) * 2009-05-15 2013-11-05 Google Inc. Query translation using bilingual search refinements
US8577910B1 (en) 2009-05-15 2013-11-05 Google Inc. Selecting relevant languages for query translation
US8572109B1 (en) 2009-05-15 2013-10-29 Google Inc. Query translation quality confidence
US8538957B1 (en) 2009-06-03 2013-09-17 Google Inc. Validating translations using visual similarity between visual media search results
CN102053991B (zh) * 2009-10-30 2014-07-02 国际商业机器公司 用于多语言文档检索的方法及系统
WO2011061556A1 (en) * 2009-11-20 2011-05-26 Kim Mo Intelligent search system
US8773706B2 (en) * 2010-03-29 2014-07-08 Konica Minolta Laboratory U.S.A., Inc. Apparatus, systems, and methods for dynamic language customization
CN101944108A (zh) * 2010-09-07 2011-01-12 深圳市彩讯科技有限公司 一种索引文件及索引文件建立方法
US8862595B1 (en) * 2010-11-23 2014-10-14 Google Inc. Language selection for information retrieval
US8498972B2 (en) * 2010-12-16 2013-07-30 Sap Ag String and sub-string searching using inverted indexes
US8527518B2 (en) * 2010-12-16 2013-09-03 Sap Ag Inverted indexes with multiple language support
US9792287B2 (en) * 2011-12-29 2017-10-17 P2S Media Group Oy Method and apparatus for providing metadata search codes to multimedia
US20130332450A1 (en) * 2012-06-11 2013-12-12 International Business Machines Corporation System and Method for Automatically Detecting and Interactively Displaying Information About Entities, Activities, and Events from Multiple-Modality Natural Language Sources
CN103488648B (zh) * 2012-06-13 2018-03-20 阿里巴巴集团控股有限公司 一种多语种混合检索方法和系统
CN104281583B (zh) * 2013-07-02 2018-01-12 索意互动(北京)信息技术有限公司 信息检索方法及装置
CN104731828B (zh) 2013-12-24 2017-12-05 华为技术有限公司 一种跨领域文档相似度计算方法及装置
CN103699675B (zh) * 2013-12-30 2017-07-04 语联网(武汉)信息技术有限公司 一种译员分级索引的方法
US9524293B2 (en) * 2014-08-15 2016-12-20 Google Inc. Techniques for automatically swapping languages and/or content for machine translation
US9984110B2 (en) 2014-08-21 2018-05-29 Dropbox, Inc. Multi-user search system with methodology for personalized search query autocomplete
US9384226B1 (en) 2015-01-30 2016-07-05 Dropbox, Inc. Personal content item searching system and method
US9183303B1 (en) 2015-01-30 2015-11-10 Dropbox, Inc. Personal content item searching system and method
TWI712899B (zh) * 2015-07-28 2020-12-11 香港商阿里巴巴集團服務有限公司 資訊查詢方法及裝置
US9606990B2 (en) 2015-08-04 2017-03-28 International Business Machines Corporation Cognitive system with ingestion of natural language documents with embedded code
KR101656357B1 (ko) 2015-11-04 2016-09-09 국방과학연구소 데이터 표를 이용하여 공학용 데이터베이스를 구성하는 방법
CN105404688A (zh) * 2015-12-11 2016-03-16 北京奇虎科技有限公司 搜索方法和搜索设备
US10824795B2 (en) 2016-06-21 2020-11-03 Fernando J. Pinho Indoor positioning and recording system
WO2017223133A1 (en) * 2016-06-21 2017-12-28 Pinho Fernando J Indoor positioning and recording system
US10691734B2 (en) * 2017-11-21 2020-06-23 International Business Machines Corporation Searching multilingual documents based on document structure extraction
CN108345694B (zh) * 2018-03-19 2021-09-03 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
US11392853B2 (en) * 2019-02-27 2022-07-19 Capital One Services, Llc Methods and arrangements to adjust communications
CN110347904A (zh) * 2019-05-28 2019-10-18 成都美美臣科技有限公司 一个多语言电子商务网站处理语言搜索方法
CN112380410A (zh) * 2020-11-10 2021-02-19 北京字节跳动网络技术有限公司 信息处理方法、装置和电子设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01181123A (ja) * 1988-01-14 1989-07-19 Hitachi Ltd 情報検索装置
JPH0869472A (ja) * 1994-08-29 1996-03-12 Nec Corp 外国語キーワード文献検索処理装置
JPH11219368A (ja) * 1998-02-03 1999-08-10 Fujitsu Ltd 情報検索装置及び情報検索方法
JPH11353314A (ja) * 1998-06-02 1999-12-24 Sharp Corp インデックスの作成方法および作成装置、インデックスの使用、ならびに記憶媒体

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6278967B1 (en) 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5799307A (en) * 1995-10-06 1998-08-25 Callware Technologies, Inc. Rapid storage and recall of computer storable messages by utilizing the file structure of a computer's native operating system for message database organization
US6055528A (en) * 1997-07-25 2000-04-25 Claritech Corporation Method for cross-linguistic document retrieval
US5991713A (en) 1997-11-26 1999-11-23 International Business Machines Corp. Efficient method for compressing, storing, searching and transmitting natural language text
JP3601653B2 (ja) * 1998-03-18 2004-12-15 富士通株式会社 情報検索装置および方法
US6275789B1 (en) 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US6336117B1 (en) * 1999-04-30 2002-01-01 International Business Machines Corporation Content-indexing search system and method providing search results consistent with content filtering and blocking policies implemented in a blocking engine
CN1176432C (zh) 1999-07-28 2004-11-17 国际商业机器公司 提供本国语言查询服务的方法和系统
US7027974B1 (en) * 2000-10-27 2006-04-11 Science Applications International Corporation Ontology-based parser for natural language processing
EP1454263A4 (en) * 2001-11-21 2008-02-13 Contecs Dd Llc DATA DICTIONARY OF DIGITAL RIGHTS MANAGEMENT

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01181123A (ja) * 1988-01-14 1989-07-19 Hitachi Ltd 情報検索装置
JPH0869472A (ja) * 1994-08-29 1996-03-12 Nec Corp 外国語キーワード文献検索処理装置
JPH11219368A (ja) * 1998-02-03 1999-08-10 Fujitsu Ltd 情報検索装置及び情報検索方法
JPH11353314A (ja) * 1998-06-02 1999-12-24 Sharp Corp インデックスの作成方法および作成装置、インデックスの使用、ならびに記憶媒体

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
前田亮、外2名: "多言語知識発掘システムの構築", 情報処理学会研究報告(99−DBS−118), vol. 第99巻,第39号, CSNG200001287001, 17 May 1999 (1999-05-17), JP, pages 1 - 8, ISSN: 0000863971 *
前田亮、外2名: "多言語知識発掘システムの構築", 情報処理学会研究報告(99−DBS−118), vol. 第99巻,第39号, JPN6007000722, 17 May 1999 (1999-05-17), JP, pages 1 - 8, ISSN: 0000907460 *
前田亮、外2名: "言語横断情報検索におけるWeb文書群による訳語曖昧性解消", 情報処理学会論文誌, vol. 第41巻,第SIG6(TOD7)号, CSNG200100902002, 15 October 2000 (2000-10-15), JP, pages 12 - 21, ISSN: 0000863972 *
前田亮、外2名: "言語横断情報検索におけるWeb文書群による訳語曖昧性解消", 情報処理学会論文誌, vol. 第41巻,第SIG6(TOD7)号, JPN6007000771, 15 October 2000 (2000-10-15), JP, pages 12 - 21, ISSN: 0000907461 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007530819A (ja) * 2004-03-30 2007-11-01 イー・アイ・デュポン・ドウ・ヌムール・アンド・カンパニー 防護服用の布帛
JP2010073177A (ja) * 2008-09-17 2010-04-02 Shinei Planners:Kk 国際対応型日本語入力システム
JP2014518581A (ja) * 2011-04-28 2014-07-31 マイクロソフト コーポレーション 代替市場検索結果トグル

Also Published As

Publication number Publication date
CN1620661A (zh) 2005-05-25
KR20040077918A (ko) 2004-09-07
US7260570B2 (en) 2007-08-21
ATE322045T1 (de) 2006-04-15
EP1485830B1 (en) 2006-03-29
KR100572797B1 (ko) 2006-04-24
US20030149687A1 (en) 2003-08-07
DE60304331T2 (de) 2006-11-09
JP4634715B2 (ja) 2011-02-16
WO2003065248A3 (en) 2004-03-11
WO2003065248A2 (en) 2003-08-07
EP1485830A2 (en) 2004-12-15
DE60304331D1 (de) 2006-05-18
CN100375090C (zh) 2008-03-12
CA2474814A1 (en) 2003-08-07

Similar Documents

Publication Publication Date Title
JP4634715B2 (ja) 任意の各国語での照会によるマッチング文書の検索
US6662152B2 (en) Information retrieval apparatus and information retrieval method
US6952691B2 (en) Method and system for searching a multi-lingual database
US7676452B2 (en) Method and apparatus for search optimization based on generation of context focused queries
EP1217535A2 (en) Method and apparatus for generating normalized representations of strings
Capstick et al. A system for supporting cross-lingual information retrieval
JPH10232883A (ja) 多言語対応文書検索システム
US9754022B2 (en) System and method for language sensitive contextual searching
Golub et al. Subject indexing in humanities: a comparison between a local university repository and an international bibliographic service
JP2007058706A (ja) 文書検索システム、文書検索方法及び文書検索プログラム
JP2003150623A (ja) 言語横断型特許文献検索方法
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
Ntoulas et al. The infocious web search engine: Improving web searching through linguistic analysis
JP5909123B2 (ja) 機械翻訳装置、機械翻訳方法およびプログラム
JP2005251038A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP4368550B2 (ja) 文書検索装置、文書検索方法およびその方法をコンピュータに実行させるプログラム
Larouk Retrieval textual Information on the web: Multilingual documentary information or linguistic Open Data
Celli et al. Enabling multilingual search through controlled vocabularies: The AGRIS approach
Thapa Use Case Driven Evaluation of Database Systems for ILDA
Golub Subject access in online information services for humanities: the case of LGBTQI fiction: Invited speech
Wang et al. Toward Web mining of cross-language query translations in digital libraries
Mizera-Pietraszko Model design of user interfaces for multilingual digital libraries
JP2001337969A (ja) 知識獲得方法、文書情報構造化方法および装置と前記方法を実施するプログラムを記録した記録媒体
Ruiz et al. UB at CLEF 2005: bilingual CLIR and medical image retrieval tasks
JPH07262198A (ja) 文書検索装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070912

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071016

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101119

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees