JP3231004B2 - データベースアクセス装置およびその方法 - Google Patents

データベースアクセス装置およびその方法

Info

Publication number
JP3231004B2
JP3231004B2 JP15718697A JP15718697A JP3231004B2 JP 3231004 B2 JP3231004 B2 JP 3231004B2 JP 15718697 A JP15718697 A JP 15718697A JP 15718697 A JP15718697 A JP 15718697A JP 3231004 B2 JP3231004 B2 JP 3231004B2
Authority
JP
Japan
Prior art keywords
words
entry
translation
word
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP15718697A
Other languages
English (en)
Other versions
JPH1069497A (ja
Inventor
ポズナンスキー ビクター
ビーバン ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JPH1069497A publication Critical patent/JPH1069497A/ja
Application granted granted Critical
Publication of JP3231004B2 publication Critical patent/JP3231004B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、例えば、一言語の
辞書、シソーラス、百科事典および二言語の辞書のよう
な機械可読辞書に用いられる種類のデータベースにアク
セスする装置およびその方法に関する。
【0002】
【従来の技術】上記のようなデータベースは、典型的に
は、見出し語と呼ばれる単一の語(word)を用いてイン
デックスされる。
【0003】JP−A−6243162は、文書を入力
するためのOCRを備える機械翻訳システムに関する。
文書は、形態的分析によって形態素に分割され処理され
る。「品詞」推論方法は、翻訳の適合性の確率を計算す
るために形態素における先行する2語に基づいて用いら
れる。
【0004】EP0262938は、句(phrase)を第
1の言語から第2の言語に翻訳するためのシステムを開
示している。システムは、第2の言語の句を収集してい
る記憶装置を有し、これらの句のうちのどれが第1の言
語の各入力された句に対応するかを識別しようとする。
具体的には、システムは、入力された句を特徴づける比
較的少数のキーワードを認識しようとし、それによっ
て、対応する出力句を識別し、比較的迅速に翻訳する。
【0005】US5181163は、共起辞書における
エントリを生成または更新する技術を開示している。こ
のような辞書は、自然言語におけるある統語論的関係に
おいて同時に起こる語の対のリストを含んでいる。この
ような辞書は、ある第1の言語からある第2の言語に翻
訳する機械翻訳システムにおいて使用され、第1の言語
についての情報を提供する。入力テキストは統語論的に
分析され、その分析結果は、所望の意味論的関係を有す
る語の対の曖昧さについて分析される。その後、曖昧さ
がない語の対は、エントリを生成または更新するために
用いられる。
【0006】
【発明が解決しようとする課題】特定の問いおよび文脈
に適切なエントリを得るデータベースにアクセスする装
置および方法が提供する課題がある。
【0007】
【課題を解決するための手段】本発明の第1の局面によ
れば、複数のエントリを備えるデータベースのアクセス
方法が提供され、各エントリは見出し語を含むメインエ
ントリを備え、エントリの少なくとも1つは、複数の組
の語を含む第1の補助エントリを備え、そのそれぞれ
が、見出し語に付随し得、その方法は、 (i) 複数の語を含むテキスト部分を入力してルックア
ップバッファに送出する工程と、 (ii) メインエントリがルックアップバッファのテキス
ト部分の選択された語に対応する見出し語を含む、エン
トリの位置を突きとめる工程と、 (iii) 位置を突きとめられたエントリが、複数の組の
語を含む第1の補助エントリを有する場合、第1の補助
エントリから、少なくとも1語がルックアップバッファ
テキスト部分の少なくとも一部に存在する1組の語を
選択したデータベースエントリで更新する工程と、を包
含する。
【0008】好ましくは、テキスト部分が、文法的に完
全な部分を含む。
【0009】好ましくは、その部分の少なくとも一部
が、選択された語の両側にN(Nは、1以上の整数)個
の語を含む。
【0010】好ましくは、工程(ii)および(iii)が、テ
キスト部分の各語に対して繰り返される。
【0011】好ましくは、各選択された組に、その組に
おける語の関数、例えば、組の濃度、または単独または
同時発生の可能性のような、組における1つ以上の語の
特性として決定される優先値を割り当てる工程をさらに
包含する。
【0012】あるいはまたはさらに、関数は、組の使用
の確率または頻度に対応し得る。
【0013】ある実施態様において、データベースは多
言語辞書であり、メインエントリおよび第1の補助エン
トリは、起点言語の語を含み、各エントリは、見出し語
の少なくとも1つの目的言語翻訳を含む第2の補助エン
トリをさらに含む。多言語辞書は、両方向二言語辞書で
あり得る。
【0014】好ましくは、各目的言語翻訳が、付随の第
1の補助エントリのそれぞれの組の語に付随する。より
好ましくは、この方法は、目的言語翻訳の1つを選択
し、選択された翻訳に付随する語の組に含まれる各語の
翻訳の選択を禁止する工程をさらに包含する。より好ま
しくは、この方法は、優先値の下がる順番にテキスト部
分の語のための目的言語翻訳を選択する工程を包含す
る。
【0015】好ましくは、この方法は、目的言語翻訳の
うち選択された翻訳を選択から外し、選択された翻訳に
付随する語の組に含まれる各語の翻訳の選択の禁止を解
き、別の目的言語翻訳を選択し、選択された他の翻訳に
付随する語の組に含まれる各語の翻訳の選択を禁止する
工程をさらに包含する。
【0016】データベースは、機械可読の辞書、シソー
ラス、または百科事典、あるいはマルチメディア辞書あ
り得る。機械可読シソーラスは、両方向機械可読シソー
ラスであり得る。位置を突きとめられたエントリは、テ
キスト部分の少なくとも一部に存在する少なくとも1語
と実質的に同じ言語屈折を与えられ得る。データベース
は、CD−ROMに記憶され得る。
【0017】本発明の第2の局面によれば、複数のエン
トリを備えるデータベースをアクセスする装置が提供さ
れ、各エントリは見出し語を含むメインエントリを備
え、エントリの少なくとも1つは、複数の組の語を含む
第1の補助エントリを備え、そのそれぞれが、見出し語
に付随し得、その装置は、 (i) 複数の語を含むテキスト部分を入力してルックア
ップバッファに送出する入力手段と、 (ii) メインエントリが、ルックアップバッファのテキ
スト部分の選択された語に対応する見出し語を含むエン
トリの位置を突きとめる手段と、 (iii) 位置を突きとめられたエントリが、複数の組の
語を含む第1の補助エントリを有する場合、第1の補助
エントリから、少なくとも1語がルックアップバッファ
テキスト部分の少なくとも一部に存在する1組の語を
選択したデータベースエントリで更新する手段と、を備
える。
【0018】好ましくは、テキスト部分が、文法的に完
全な部分を含む。
【0019】好ましくは、テキスト部分の少なくとも一
部が、選択された語の両側にN(Nは、1以上の整数)
個の語を含む。
【0020】好ましくは、各選択された組に、組におけ
る語の関数、例えば、組の濃度、または単独または同時
発生の可能性のような組における1つ以上の語の特性と
して決定される優先値を割り当てる手段がさらに設けら
れている。
【0021】あるいはまたはさらに、関数は、組の使用
の確率または頻度に対応し得る。
【0022】ある実施様態において、データベースは、
電子多言語辞書であり、メインエントリおよび第1の補
助エントリが、起点言語の語を含み、各エントリは、見
出し語の少なくとも1つの目的言語翻訳を含んでいる第
2の補助エントリをさらに含む。多言語辞書は、両方向
二言語辞書であり得る。
【0023】好ましくは、各目的言語翻訳が、付随の第
1の補助エントリのそれぞれの組の語に付随する。より
好ましくは、目的言語翻訳の1つを選択し、選択された
翻訳に付随する語の組に含まれる各語の翻訳の選択を禁
止する手段が備えられる。より好ましくは、優先値の下
がる順番にテキスト部分の語のための目的言語翻訳を選
択する手段が備えられる。
【0024】好ましくは、目的言語翻訳のうち選択され
た翻訳を選択から外し、選択された翻訳に付随する語の
組に含まれる各語の翻訳の選択の禁止を解き、別の目的
言語翻訳を選択し、選択された他の翻訳に付随する語の
組に含まれる各語の翻訳の選択を禁止する手段が備えら
れる。
【0025】データベースは、機械可読の辞書、シソー
ラス、百科事典またはマルチメディア辞書であり得る。
機械可読シソーラスは、両方向機械可読シソーラスであ
り得る。位置を突きとめられたエントリに、テキスト部
分の少なくとも一部に存在する少なくとも1語と実質的
に同じ言語屈折を与える生成手段が備えられ得る。デー
タベースは、CD−ROMに記憶され得る。
【0026】このように、特定の問いおよび文脈に適切
なエントリを得るデータベースにアクセスする装置およ
び方法を提供することが可能である。
【0027】
【発明の実施の形態】本発明の実施例を図面を参照して
説明する。
【0028】図1のデータ構造は、データベース28
(図2参照)に種々のエントリを記憶するために用いら
れる。各エントリは、見出し語1および、言語的な構成
を形成するための見出し語1に付随し得る語の組(Se
1〜Set3)を含む第1の補助エントリ2からなる。
本実施例において、メインエントリは見出し語1を含ん
でいる。もし、見出し語1と組み合せ得る語の組が存在
しないなら、第1の補助エントリ2には何も記憶されな
い。データ構造はまた、定義Def1、Def2、Def
3、または、見出し語1と第1の補助エントリ2の語の
組のそれぞれの組み合わせに対応する目的言語翻訳を含
む第2のエントリ3も有する。
【0029】図2の装置は、問われるまたは目的言語に
翻訳されるテキスト部分を入力する入力端末21を含
む。あるいは、テキストの一部分を入力可能な他の手
段、例えば、音声認識システムまたは光学式文字読み取
り装置(OCR)が用いられ得る。入力端末21は、テ
キスト部分を区分および還元する還元モジュール22を
介してルックアップバッファ23に接続される。ルック
アップバッファ23は、還元モジュール22によって区
分および還元されたテキスト部分を一時的に記憶し、検
索モジュール25および第1の選択モジュール24に接
続され、検索モジュール25はまた、データベース28
に接続される。検索モジュール25およびルックアップ
バッファ23は、第2の選択モジュール26に接続され
る。ルックアップバッファ23はまた、フィルタモジュ
ール29、再配列モジュール30および生成モジュール
31を介して、出力装置27、例えば、表示装置または
プリンターに接続される。
【0030】上記の装置は、ハードウェアまたはソフト
ウェアの形で実現され得、電子一言語辞書、シソーラ
ス、百科事典、二言語辞典または、例えば、CD−RO
Mシステムから入力されたテキスト部分に基づいてデー
タベースを検索する他の装置と一体化され得る。
【0031】図3を参照すると、動作において、“John
made good use of his knowledge”のような文法的に
完全なテキスト部分、例えば、句、節または文が、入力
端末21を用いてユーザ(図示せず)によって入力され
る(ステップS1)。そのテキスト部分を含む語は、語
に区分または分解され、例えば、還元モジュール22に
よる形態的分析によって、付随見出し語(またはインデ
ックスされた用語)に還元される(ステップS2)。
“John made good use of his knowledge”の場合は、
語“made”を“make”に変化させるだけでよい。その
後、還元されたテキストは、ルックアップバッファ23
に送出される(ステップS3)。その後、ルックアップ
バッファ23の第1の語は、第1の選択モジュール24
によって選択され(ステップS4)、検索モジュール2
5によってデータベース28において検索される(ステ
ップS5)。もし、エントリが見出されると、そのエン
トリは、ルックアップバッファに記憶され注釈づけされ
る。この検索、記憶および注釈づけステップを、以下に
さらに説明する。
【0032】その後、ルックアップバッファ23は、未
検索の語がないかチェックし(ステップS7)、もし、
未検索の語が存在するなら、今度はそれらをそれぞれ選
択し(ステップS8)、そして、データベース28にお
いて検索する(ステップS5)。ルックアップバッファ
23におけるすべての語が一旦検索されると、その結果
はフィルタモジュール29、再配列モジュール30およ
び生成モジュール31に送られ、その後、表示される
か、または表示モジュールに送られてユーザによって問
い合わされる(ステップS9)。
【0033】還元モジュール22によって行われる形態
分析(ステップS2)は、単に、語を対応する不定形、
例えば“made”を“make”に還元するのではなく、他の
言語的情報を還元された語に付随させるのである。例え
ば“made”は、“make past(過去)”に還元され得る。
付加的な言語的情報は、データベースがシソーラスまた
は二言語辞書である場合に保持される。このような場
合、入手可能な言語的情報から屈折させた語を再構築す
ることが必要となり得る。例えば、“make use of”
は、“make past (過去)use of”に還元され得る。も
し、データベースが、シソーラスであれば、“made use
of”のために見つけられたエントリである英語“utili
se”は、“utilise past(過去)”に変換され得る。生
成モジュール31は、このような変換を接辞“past”を
“utilise”に適合させることにより行い、“utilise
d”を生成する(ユーザが必要とすれば)。生成モジュ
ール31の使用は、データベースがシソーラスである場
合に限定されるべきではない。
【0034】フィルタモジュール29は、1つ以上のフ
ィルタ、例えば、「接辞フィルタ」および/または「文
脈フィルタ」を備え得る。接辞フィルタは、出力される
結果から“past”(上述)のような接辞を除去し得る。
例えば、“utilise past”を表示するのでなく、単に、
語“utilise”が出力される。文脈フィルタは、ユーザ
が必要とする場合、ルックアップバッファ23からの検
索に関連する語を表示するために用いられる。例えば、
文の単一の語の翻訳を確かめるために、ユーザは、単一
の語の翻訳に関連するルックアップバッファ23の語の
みを表示することを要求し得る。
【0035】再配列モジュール30は、最も適切な語順
を得るために、例えば、翻訳における検索結果または
「目的」の語を並べ換える。例えば、“John made good
use of his knowledge”は、“John bien utiliser so
n connaisance”としてフランス語に翻訳され得る。し
かし、より適切かつ直観的な語順は、“John utiliserb
ien son connaisance”であり得る。
【0036】データベース28の検索、エントリの記憶
および注釈づけ(ステップS5)を図4を参照して以下
に説明する。
【0037】エントリは、データベース28から選択さ
れ(ステップS10)、そのエントリの見出し語1をル
ックアップバッファ23から選択された語と比較し、検
索モジュール25によって検索する(ステップS1
1)。
【0038】もし、合致すれば、第1の補助エントリ
は、エントリを含むかどうかを確認するために検討され
る(ステップS11a)。もし、エントリが存在しなけ
れば、さらなる動作は行われず、データベースの検索
は、ルックアップバッファ23から選択された語に関し
て終了する。しかし、もしエントリが存在すれば、1組
の語が第1の補助エントリから選択され(ステップS1
2)、ルックアップバッファ23でのこれらの語の存在
について、第2の選択モジュール26によってルックア
ップバッファ23が検索される(ステップS13)。語
の組におけるすべての語がルックアップバッファ23に
見出されるなら、第1の補助エントリ2は、ルックアッ
プバッファ23において検索されずに残っている語の組
があるかどうかを確認するために検討される(ステップ
S14)。もし、検索されていない語の組が存在するな
ら、語の各組が選択され(ステップS15)、第1の補
助エントリ2に未検索の語の組がなくなるまで検索され
る(ステップS13)。もし、ステップS13を実行す
るとき、合致が見つかれば、見出し語および第1の補助
エントリの語の組は注釈づけされ記憶され(ステップS
16)、出力装置27によって表示またはユーザによっ
て操作される。その後、第1の補助エントリ2の語の組
に対する検索が、未検索の語の組がなくなるまで継続さ
れる(ステップS14、S15、S13)。
【0039】見出し語を比較するとき(ステップS1
1)、ステップS10で選択されたエントリの見出し語
1と検索するべきルックアップバッファ23からの語と
の間に、もし合致が見つからなければ、データベース2
8が、見出し語が検索されるべき語と比較されなかった
エントリが存在するかどうかを確認するために検討され
る(ステップS17)。データベース28に未検索エン
トリが残っていなければ、検索は終了する。しかし、も
しデータベース28に未検索エントリが残っていれば、
別のエントリが、検索モジュール25によって選択され
(ステップS18)、検索される(ステップS11)。
データベース28が、例えば、百科事典のように一意的
な見出し語エントリを含んでいれば、ルックアップバッ
ファ23から選択された語が見出されると(データベー
ス28に残っている未検索エントリを検索することな
く)、検索は終了する。
【0040】図7を参照すると、もし、ルックアップバ
ッファ23の例示内容、“John make good use of his
knowledge”が検索されるなら、語“make”が見出され
ると、図5からわかるように、見出し語1の“make”を
含む4つの可能な定義が見出される(“make”、“make
up”、“make it to”、“make the grade”)。しか
し、その定義のうち1つだけが適切である。なぜなら、
他の語の組は、ルックアップバッファ23に存在しない
からである。同様に、語“good”が調べられ、それから
“use”が調べられる。この段階において、5つの可能
な語の組が語“use”に対して見つけられる(図6参
照)(“use”[名詞]、“use”[動詞] , “useto”、
“use up”、“make use of”)。このうちルックアップ
バッファ23での存在のために3つだけが適切であり、
このうち最も注目に値するのが、エントリ“make use o
f”である。ルックアップバッファ23は、ルックアッ
プバッファ23での関連する語で注釈づけされた適切な
データベースエントリで更新される。
【0041】一旦これが行われると、ユーザは、今度
は、例えば、グラフィカルユーザインターフェース(G
UI)の助けをかりて各語を問い合わせ得る。テキスト
部分の各語が、GUIによって表示される。テキスト部
分の語がユーザによって問い合わされると、ルックアッ
プバッファ23は、問い合わされた語に付随する注釈
(見出し語ポインタ)を見つけるためにチェックされ
る。その後、ルックアップバッファ23が、問い合わさ
れた語を指す注釈づきエントリの存在について検索され
る。本実施例での語“make”の場合、語“make”におい
て見出し語ポインタが見出され、構成“make use of”
において語ポインタが見出される(“use2、5”)。
【0042】語は、優先順に並べられ得る。優先の基準
は第1の補助エントリ2の語の組における語の数であ
る。大きな数が、より優先することを示し得る。従っ
て、見出し語のみを含むエントリにおいて、優先値は1
に等しくなり得る。見出し語に付随する組における語が
X個ある場合、(X+1)という優先値がその組に与え
られ得る。この組または組み合わせがユーザ選択用に表
示される場合、それらは、優先値が下がる順番に表示さ
れ得る。
【0043】図8を参照すると、上記の例は、二言語お
よび多言語の辞書にも用いられ得る。ユーザは、目的言
語を選択するというオプションを与えられ得る。
【0044】上記のように、テキスト部分は、辞書見出
し語に還元され、それからルックアップバッファ23に
送出される。各語が検索され、各語に対する可能な翻訳
(データベースエントリ)がルックアップバッファ23
に記憶され、適切な場合には、エントリは、それらが関
連するルックアップバッファ23における語に関して注
釈づけされる。
【0045】一例として、文“John made good use of
his knowledge”のフランス語への翻訳は以下のように
行われる。まず、各語がその辞書見出し語、すなわち
“Johnmake good use of his knowledge”に還元され、
ルックアップバッファ23に送出される。ルックアップ
バッファ23の各語が辞書(データベース28)におい
て検索される。各語の可能な翻訳(エントリ)が、図8
の表のそれぞれの語の下に示される。下つきの番号が、
ルックアップバッファ23のどの語が特定のフランス語
に関連するかについての注釈を表す。例えば、動詞“ut
iliser”は、語“use”に加えて、語“make”および“o
f”にも関連する。
【0046】テキスト部分の各語にとって可能なすべて
の翻訳が見出されると、ユーザはその結果を問い合わせ
得る。ユーザに一貫した代替語のすべてを列挙すること
が可能であるが、各語の代替語のメニュを提供すること
が好ましい。なぜなら、これにより、挙げられる代替語
の数が減るからである。
【0047】ユーザが、第1の補助エントリから見出し
語に対応する翻訳および少なくとも1語を含む組を選択
するとき、そのような語は、選択された翻訳によってす
でにカバーされたので、その組に含まれる各語の翻訳の
選択が禁止され得る。もし、ユーザが、その翻訳を選択
せず別の翻訳を選択することを決定すれば、その禁止が
解除され、もし、他の翻訳が、少なくとも1語を含む組
に関するなら、その組のその語または各語の翻訳が再度
禁止される。
【0048】このような選択は手動で行われ得るが、種
々の組の語が優先値を与えられる場合、選択は自動で行
われ得る。例えば、語のすべてが、辞書にアクセスする
ために用いられ、各語に対応する1つ以上の組み合わせ
を生じさせる。これらの組み合わせは、優先順位が下が
るように配置され、優先順位の最も高い組み合わせが最
初に選ばれる。その後、関連見出し語に付随する組に含
まれる語は、さらにプロセスに参加することを禁じられ
る。語の残っている使用可能な組から、最も優先値の高
いものが選択される。さらなる介入が、最終的な翻訳を
生成するために必要とされ得るが、このような技術は、
多言語辞書で用いられ自動翻訳の基本的な形態を提供し
得る。例えば、辞書にアクセスするために、ルックアッ
プバッファに入力された語が、まず基本的な形態に還元
されている可能性がある。例えば、動詞が、不定形に変
えられ、名詞が単数形にされている可能性がある。最初
の翻訳は、同様に、基本形を含み得る、例えば、動詞
は、最終翻訳での第1の試みが完了する以前に変化させ
なければならない。
【0049】ユーザは、このプロセスに、例えば、優先
値が低い語の組または組み合わせを選択するために介入
し得る。しかし、システムは、矛盾を避けるために、テ
キスト部分の語は2度用いられることがないようにす
る。
【0050】多言語の辞書は、例えば、英語からフラン
ス語への翻訳のための、両方向の辞書であり得る。エン
トリの例は、以下のようである。
【0051】make * use of < = > * utiliser ここで、“use”は、上記のような多数の第1の補助エ
ントリに付随する英語の見出し語であり、かつ“utilis
er”の第2の補助エントリである。“utilise
r”は、第1の補助エントリを有さないフランス語の見
出し語であるが、“make use of”の第2の
補助エントリである。従って、もし“make”と“of”と
の文脈中に見出されると、“make use of”は、“utili
ser”として翻訳され得る。同様に、もし、見出される
と“utiliser”は、“make use of”と翻訳され得る。
【0052】もし、データベースがシソーラスであるな
ら、データベースエントリは、* make use of < = > utilise* make (verb) < = > construct* make (noun) < = > trade mark* use (verb) < = > employ であり得る。
【0053】アステリスクは見出し語を示し、< = > 記
号の右側の語は第2の補助エントリである。アステリス
クが記されず括弧に入っていない左側の語は第1の補助
エントリである。
【0054】見出し語はまた、語の特性を説明するため
に注釈づけされ得る。注釈の例は、上記の括弧内に示さ
れている。
【0055】さらに、シソーラスは、上記の両方向辞書
に類似の両方向シソーラスであり得る。
【0056】データベースは、語法チェッカーとしても
用いられ得る。このような応用において、第2の補助エ
ントリは、テキストのストリングを含み得る。例えば、* make use of < = > “consider using just‘use’” である。
【0057】もし、データベースが一言語辞書であれ
ば、第2の補助エントリは、ポインタを含み得る。例え
ば、* make use of < = > p245 ここで、p245は、例えば、メモリまたはCD−RO
Mに記憶される辞書のエントリに対するポインタまたは
インデックスである。このようなポインタは、例えば、
テキスト、音声または映画などの種々のエントリを示し
得る。さらに、語、テキストおよびポインタは、同時に
第2の補助エントリとして記憶され得る。従って、デー
タベース28は、マルチメディア百科事典であり得る。
【0058】
【発明の効果】上記したように、本発明によると、特定
の問いおよび文脈に適切なエントリを得るデータベース
にアクセスする装置および方法が提供することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施態様によるデータ構造の例を示
す図である。
【図2】本発明の一実施態様による装置を示す図であ
る。
【図3】図2の装置と共に用いられる本発明の一実施態
様による方法のフローチャートである。
【図4】図3に示す方法の一工程をさらに詳細に説明す
るフローチャートである。
【図5】例示データを含む図1のデータ構造を示す図で
ある。
【図6】例示データを含む図1のデータ構造を示す図で
ある。
【図7】図3の方法によるルックアップバッファを説明
する図である。
【図8】二言語辞書に関する本発明の別の実施態様によ
る図7のルックアップバッファの一例を示す図である。
【符号の説明】
1 見出し語 2 第1の補助エントリ 3 第2の補助エントリ 21 入力端末 23 ルックアップバッファ 25 検索モジュール 27 出力装置 28 データベース
フロントページの続き (56)参考文献 特開 昭62−184572(JP,A) 特開 昭59−32062(JP,A) 特開 昭63−89975(JP,A) 特開 昭63−228375(JP,A) 特開 昭58−219670(JP,A) 特開 昭58−92064(JP,A) 特開 昭59−32062(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/27 - 17/30 JICSTファイル(JOIS)

Claims (43)

    (57)【特許請求の範囲】
  1. 【請求項1】 複数のエントリを備えるデータベースの
    アクセス方法であって、各エントリは見出し語を含むメ
    インエントリを備え、該エントリの少なくとも1つは、
    複数の組の語を含む第1の補助エントリを備え、そのそ
    れぞれが、該見出し語に付随し得、該方法は、 (i) 複数の語を含むテキスト部分を入力してルックア
    ップバッファに送出する工程と、 (ii) メインエントリが該ルックアップバッファのテキ
    スト部分の選択された語に対応する該見出し語を含む、
    該エントリの位置を突きとめる工程と、 (iii) 該位置を突きとめられたエントリが、複数の組
    の語を含む第1の補助エントリを有する場合、該第1の
    補助エントリから、少なくとも1語が該ルックアップバ
    ッファのテキスト部分の少なくとも一部に存在する1組
    の語を選択したデータベースエントリで更新する工程
    と、 を包含する方法。
  2. 【請求項2】 前記テキスト部分が、文法的に完全な部
    分を含む、請求項1に記載の方法。
  3. 【請求項3】 前記テキスト部分の前記少なくとも一部
    が、前記選択された語の両側にN(Nは、1以上の整
    数)個の語を含む、請求項1または2に記載の方法。
  4. 【請求項4】 前記工程(ii)および(iii)が、前記テキ
    スト部分の各語に対して繰り返される、請求項1から3
    のいずれかに記載の方法。
  5. 【請求項5】 各選択された組に、該組における語の関
    数として決定される優先値を割り当てる工程をさらに包
    含する、請求項1から4のいずれかに記載の方法。
  6. 【請求項6】 前記関数が、前記組の濃度に対応する、
    請求項5に記載の方法。
  7. 【請求項7】 前記関数が、前記組における1つ以上の
    語の特性に対応する、請求項5に記載の方法。
  8. 【請求項8】 前記特性が、前記組における前記1つ以
    上の語の単独または同時発生の確率である、請求項7に
    記載の方法。
  9. 【請求項9】 前記関数が、前記組の使用の確率または
    頻度に対応する、請求項5に記載の方法。
  10. 【請求項10】 前記データベースが、機械可読多言語
    辞書であり、前記メインエントリおよび前記第1の補助
    エントリが、起点言語の語を含み、各エントリは、前記
    見出し語の少なくとも1つの目的言語翻訳を含んでいる
    第2の補助エントリをさらに含む、請求項1から9のい
    ずれかに記載の方法。
  11. 【請求項11】 前記多言語辞書が、両方向二言語辞書
    である、請求項10に記載の方法。
  12. 【請求項12】 各目的言語翻訳が、前記付随の第1の
    補助エントリのそれぞれの組の語に付随する、請求項1
    0または11に記載の方法。
  13. 【請求項13】 請求項4に従属するとき、前記目的言
    語翻訳の1つを選択し、該選択された翻訳に付随する語
    の組に含まれる各語の翻訳の選択を禁止する工程をさら
    に包含する、請求項12に記載の方法。
  14. 【請求項14】 請求項5〜9のいずれかに従属する場
    合、前記優先値の下がる順番に前記テキスト部分の語の
    ための前記目的言語翻訳を選択する工程を包含する、請
    求項13に記載の方法。
  15. 【請求項15】 前記目的言語翻訳のうち前記選択され
    た翻訳を選択から外し、該選択された翻訳に付随する語
    の組に含まれる各語の翻訳の選択の禁止を解き、別の目
    的言語翻訳を選択し、該選択された他の翻訳に付随する
    語の組に含まれる各語の翻訳の選択を禁止する工程をさ
    らに包含する、請求項13に記載の方法。
  16. 【請求項16】 前記データベースが機械可読辞書であ
    る、請求項1から15のいずれかに記載の方法。
  17. 【請求項17】 前記データベースが機械可読シソーラ
    スである、請求項1から15のいずれかに記載の方法。
  18. 【請求項18】 前記機械可読シソーラスが、両方向機
    械可読シソーラスである、請求項17に記載の方法。
  19. 【請求項19】 前記位置を突きとめられたエントリ
    が、前記テキスト部分の前記少なくとも一部に存在する
    少なくとも1語と実質的に同じ言語屈折を与えられる、
    請求項16、17または18に記載の方法。
  20. 【請求項20】 前記データベースが機械可読百科事典
    である、請求項1から15のいずれかに記載の方法。
  21. 【請求項21】 前記データベースがマルチメディア百
    科事典である、請求項1から15のいずれかに記載の方
    法。
  22. 【請求項22】 前記データベースがCD−ROMに記
    憶される、請求項1から21のいずれかに記載の方法。
  23. 【請求項23】 複数のエントリを備えるデータベース
    をアクセスする装置であって、各エントリは見出し語を
    含むメインエントリを備え、該エントリの少なくとも1
    つは、複数の組の語を含む第1の補助エントリを備え、
    そのそれぞれが、該見出し語に付随し得、該装置は、 (i) 複数の語を含むテキスト部分を入力してルックア
    ップバッファに送出する入力手段と、 (ii) メインエントリが該ルックアップバッファのテキ
    スト部分の選択された語に対応する該見出し語を含む、
    該エントリの位置を突きとめる手段と、 (iii) 該位置を突きとめられたエントリが、複数の組
    の語を含む第1の補助エントリを有する場合、該第1の
    補助エントリから、少なくとも1語が該ルックアップバ
    ッファのテキスト部分の少なくとも一部に存在する1組
    の語を選択したデータベースエントリで更新する手段
    と、 を備える装置。
  24. 【請求項24】 前記テキスト部分が、文法的に完全な
    部分を含む、請求項23に記載の装置。
  25. 【請求項25】 前記テキスト部分の前記少なくとも一
    部が、前記選択された語の両側にN(Nは、1以上の整
    数)個の語を含む、請求項23または24に記載の装
    置。
  26. 【請求項26】 各選択された組に、該組における語の
    関数として決定される優先値を割り当てる手段がさらに
    設けられている、請求項23から25のいずれかに記載
    の装置。
  27. 【請求項27】 前記関数が前記組の濃度に対応する、
    請求項26に記載の装置。
  28. 【請求項28】 前記関数が前記組における1つ以上の
    語の特性に対応する、請求項26に記載の装置。
  29. 【請求項29】 前記特性が前記組における前記1つ以
    上の語の単独または同時発生の確率である、請求項28
    に記載の装置。
  30. 【請求項30】 前記関数が前記組の使用の確率または
    頻度に対応する、請求項26に記載の装置。
  31. 【請求項31】 前記データベースが、機械可読多言語
    辞書であり、前記メインエントリおよび前記第1の補助
    エントリが、起点言語の語を含み、各エントリは、前記
    見出し語の少なくとも1つの目的言語翻訳を含んでいる
    第2の補助エントリをさらに含む、請求項23から30
    のいずれかに記載の装置。
  32. 【請求項32】 前記多言語辞書が、両方向二言語辞書
    である、請求項31に記載の装置。
  33. 【請求項33】 各目的言語翻訳が、前記付随の第1の
    補助エントリのそれぞれの組の語に付随する、請求項3
    1または32に記載の装置。
  34. 【請求項34】 前記目的言語翻訳の1つを選択し、該
    選択された翻訳に付随する語の組に含まれる各語の翻訳
    の選択を禁止する手段を有する、請求項33に記載の装
    置。
  35. 【請求項35】 請求項26〜30のいずれかに従属す
    る場合、前記優先値の下がる順番に前記テキスト部分の
    語のための前記目的言語翻訳を選択する手段を有する、
    請求項34に記載の装置。
  36. 【請求項36】 前記目的言語翻訳のうち前記選択され
    た翻訳を選択から外し、該選択された翻訳に付随する語
    の組に含まれる各語の翻訳の選択の禁止を解き、別の目
    的言語翻訳を選択し、該選択された他の翻訳に付随する
    語の組に含まれる各語の翻訳の選択を禁止する手段を有
    する、請求項34に記載の装置。
  37. 【請求項37】 前記データベースが機械可読辞書であ
    る、請求項23から36のいずれかに記載の装置。
  38. 【請求項38】 前記データベースが機械可読シソーラ
    スである、請求項23から36のいずれかに記載の装
    置。
  39. 【請求項39】 前記機械可読シソーラスが、両方向機
    械可読シソーラスである、請求項38に記載の装置。
  40. 【請求項40】 前記位置を突きとめられたエントリ
    に、前記テキスト部分の前記少なくとも一部に存在する
    少なくとも1語と実質的に同じ言語屈折を与える生成手
    段を有する、請求項37、38または39に記載の装
    置。
  41. 【請求項41】 前記データベースが機械可読百科事典
    である、請求項23から36のいずれかに記載の装置。
  42. 【請求項42】 前記データベースがマルチメディア辞
    書である、請求項23から36のいずれかに記載の装
    置。
  43. 【請求項43】 前記データベースがCD−ROMに記
    憶される、請求項23から42のいずれかに記載の装
    置。
JP15718697A 1996-06-14 1997-06-13 データベースアクセス装置およびその方法 Expired - Fee Related JP3231004B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB9612474.8 1996-06-14
GB9612474A GB2314183A (en) 1996-06-14 1996-06-14 Accessing a database

Publications (2)

Publication Number Publication Date
JPH1069497A JPH1069497A (ja) 1998-03-10
JP3231004B2 true JP3231004B2 (ja) 2001-11-19

Family

ID=10795301

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15718697A Expired - Fee Related JP3231004B2 (ja) 1996-06-14 1997-06-13 データベースアクセス装置およびその方法

Country Status (5)

Country Link
US (1) US5978798A (ja)
EP (1) EP0813160B1 (ja)
JP (1) JP3231004B2 (ja)
DE (1) DE69733294T2 (ja)
GB (1) GB2314183A (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2327133B (en) * 1997-05-17 2002-01-16 Aintree Hospitals Nhs Trust Method and apparatus for data entry and coding
GB2328297B (en) * 1997-08-13 2002-04-24 Ibm Text in anchor tag of hyperlink adjustable according to context
JPH11127545A (ja) 1997-10-23 1999-05-11 Nippon Seiki Co Ltd 車両用計器装置
GB2336694A (en) * 1998-01-23 1999-10-27 Electronic Village Limited Menu-based dictionary information retrieval system
GB2337611A (en) * 1998-05-20 1999-11-24 Sharp Kk Multilingual document retrieval system
GB2338089A (en) 1998-06-02 1999-12-08 Sharp Kk Indexing method
JP3817378B2 (ja) * 1998-12-15 2006-09-06 富士通株式会社 情報入力装置
JP2000284680A (ja) * 1999-03-31 2000-10-13 Seiko Instruments Inc 語彙学習機能付き電子辞書
US6394278B1 (en) 2000-03-03 2002-05-28 Sort-It, Incorporated Wireless system and method for sorting letters, parcels and other items
GB2362971B (en) * 2000-05-30 2004-03-24 Com Nation Ltd A method of searching the internet and an internet search engine
US7376648B2 (en) * 2004-10-20 2008-05-20 Oracle International Corporation Computer-implemented methods and systems for entering and searching for non-Roman-alphabet characters and related search systems
US8239253B2 (en) * 2006-07-26 2012-08-07 Wu Louis L Election-based electronic compilations
GB2444084A (en) * 2006-11-23 2008-05-28 Sharp Kk Selecting examples in an example based machine translation system
US7680780B2 (en) * 2007-04-06 2010-03-16 International Business Machines Corporation Techniques for processing data from a multilingual database
US20100228573A1 (en) * 2009-03-06 2010-09-09 Quinlan Marilyn C Systems and methods for matching consumer requests with supplier appetites
EP2244194A1 (en) 2009-04-24 2010-10-27 Jose Luis Moises Gonzalez Method and apparatus for retrieving information using linguistic predictors
US8484218B2 (en) * 2011-04-21 2013-07-09 Google Inc. Translating keywords from a source language to a target language

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60159970A (ja) * 1984-01-30 1985-08-21 Hitachi Ltd 情報蓄積検索方式
DE3788488T2 (de) * 1986-10-03 1994-05-11 British Telecomm Sprachenübersetzungssystem.
JPH0242572A (ja) * 1988-08-03 1990-02-13 Hitachi Ltd 共起関係辞書生成保守方法
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
JPH06243162A (ja) * 1992-04-15 1994-09-02 Ricoh Co Ltd 機械翻訳装置
JPH06325081A (ja) * 1993-03-26 1994-11-25 Casio Comput Co Ltd 翻訳支援装置
JPH0773464A (ja) * 1993-03-31 1995-03-17 Sony Corp 情報処理装置
DE69424902T2 (de) * 1993-08-20 2000-11-09 Canon Kk Gerät und Verfahren zur anpassungsfähigen nicht-buchstäblichen Textsuche
US5606690A (en) * 1993-08-20 1997-02-25 Canon Inc. Non-literal textual search using fuzzy finite non-deterministic automata
US5680511A (en) * 1995-06-07 1997-10-21 Dragon Systems, Inc. Systems and methods for word recognition

Also Published As

Publication number Publication date
JPH1069497A (ja) 1998-03-10
EP0813160A3 (en) 1998-12-23
GB2314183A (en) 1997-12-17
GB9612474D0 (en) 1996-08-14
US5978798A (en) 1999-11-02
DE69733294T2 (de) 2006-01-19
EP0813160B1 (en) 2005-05-18
EP0813160A2 (en) 1997-12-17
DE69733294D1 (de) 2005-06-23

Similar Documents

Publication Publication Date Title
JP4544674B2 (ja) 選択文字列に関連する情報を提供するシステム
JP3231004B2 (ja) データベースアクセス装置およびその方法
US5541838A (en) Translation machine having capability of registering idioms
US7970768B2 (en) Content data indexing with content associations
US7243305B2 (en) Spelling and grammar checking system
US6473729B1 (en) Word phrase translation using a phrase index
US7283951B2 (en) Method and system for enhanced data searching
US20050203900A1 (en) Associative retrieval system and associative retrieval method
US20020010574A1 (en) Natural language processing and query driven information retrieval
US20020188586A1 (en) Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
JPS63254559A (ja) 複合ワードのためのスペリング援助方法
WO2004114163A2 (en) Method and system for enhanced data searching
JPH10232883A (ja) 多言語対応文書検索システム
WO2001084376A2 (en) System for answering natural language questions
JP2000315216A (ja) 自然言語検索方法および装置
JP2000507008A (ja) テキスト・ベース型情報ソースのコレクションの中の情報を捜し出すためのシステム、ソフトウエア及び方法
US7409381B1 (en) Index to a semi-structured database
Markó et al. Interlingual Indexing across Different Languages.
JP3419748B2 (ja) 辞書作成装置および方法と辞書作成プログラムを記録した記録媒体
JP3176750B2 (ja) 自然言語の翻訳装置
WO2001024053A2 (en) System and method for automatic context creation for electronic documents
JPH0561902A (ja) 機械翻訳システム
Papakitsos et al. Modelling a Morpheme‐based Lexicon for Modern Greek
JP3358100B2 (ja) 日本語質問メッセージ解析方法及び装置
JP2752025B2 (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20010903

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130914

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees