JPS63236168A - 機械翻訳辞書アクセス方法 - Google Patents
機械翻訳辞書アクセス方法Info
- Publication number
- JPS63236168A JPS63236168A JP62070012A JP7001287A JPS63236168A JP S63236168 A JPS63236168 A JP S63236168A JP 62070012 A JP62070012 A JP 62070012A JP 7001287 A JP7001287 A JP 7001287A JP S63236168 A JPS63236168 A JP S63236168A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- data
- speech
- word
- access
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims description 20
- 238000000034 method Methods 0.000 claims description 8
- 230000014616 translation Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 8
- 230000008676 import Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は機械翻訳システムのアクセス方式に係り、特に
多段辞書をアクセスするときに、品詞レベルでのマージ
をするのに好適な機械翻訳辞書アクセス方式に関する。
多段辞書をアクセスするときに、品詞レベルでのマージ
をするのに好適な機械翻訳辞書アクセス方式に関する。
機械翻訳システムでは、基本用語辞書、専門用辞書、ユ
ーザ辞書等、多種類の翻訳辞書が使用され、それらの間
に異なる優先順位を持たせている。
ーザ辞書等、多種類の翻訳辞書が使用され、それらの間
に異なる優先順位を持たせている。
このように、複数種類の翻訳辞書を多段構成とした場合
、従来はアクセスの優先順位の高い辞書で単語が見つか
ると、他の辞書は無視(アクセスしない)していた。
、従来はアクセスの優先順位の高い辞書で単語が見つか
ると、他の辞書は無視(アクセスしない)していた。
第2図は多段構成辞書の従来のアクセス方式を説明する
図であり、アクセスの優先順位は辞書1゜2.3の順序
で低くなるとする。図中、Nは名詞データ、■は動詞デ
ータ、ADVは副詞データ、ADJは形容詞データ、I
Dは熟語データを示す。
図であり、アクセスの優先順位は辞書1゜2.3の順序
で低くなるとする。図中、Nは名詞データ、■は動詞デ
ータ、ADVは副詞データ、ADJは形容詞データ、I
Dは熟語データを示す。
例えば単語rexpressJを検索しようとするとき
、まず辞書1をアクセスする。こNで、単語reXpr
ass Jが存在するから、このデータを品詞テーブル
8にロードする。そして、処理を終りとする。
、まず辞書1をアクセスする。こNで、単語reXpr
ass Jが存在するから、このデータを品詞テーブル
8にロードする。そして、処理を終りとする。
即ち、辞書2.辞書3のデータは無視される。
なお、多段構成辞書のアクセスに関連するものには、例
えば、特開昭55−134477号公報が挙げられる。
えば、特開昭55−134477号公報が挙げられる。
上記従来技術では、多段構成辞書のアクセス時、優先順
位の高い辞書で単語が見つかると、他の辞書をアクセス
しないため、他の辞書に含まれる有効な情報を得られず
1機械翻訳システムにおいて、例えば英文解析に失敗し
、良い翻訳が得られないという問題があった。この対策
として、ユーザ辞書のデータを十分なものにすることが
考えられるが、その作成は難しく、保守も難しくなり、
コストが非常にか\る問題がある。
位の高い辞書で単語が見つかると、他の辞書をアクセス
しないため、他の辞書に含まれる有効な情報を得られず
1機械翻訳システムにおいて、例えば英文解析に失敗し
、良い翻訳が得られないという問題があった。この対策
として、ユーザ辞書のデータを十分なものにすることが
考えられるが、その作成は難しく、保守も難しくなり、
コストが非常にか\る問題がある。
本発明の目的は、ユーザの負担、コストを軽減して、翻
訳辞書からよりよいデータを取り出して、質のよい翻訳
結果を得ることにある。
訳辞書からよりよいデータを取り出して、質のよい翻訳
結果を得ることにある。
上記目的は、多段構成の辞書をアクセスする時、該複数
の辞書を優先順位の高いものから順次アクセスして、複
数の辞書に同一データが存在する場合は優先順位の高い
辞書のものを取込み、複数の辞書で異なるデータについ
ては各辞書のデータを取込むことにより達成される。
の辞書を優先順位の高いものから順次アクセスして、複
数の辞書に同一データが存在する場合は優先順位の高い
辞書のものを取込み、複数の辞書で異なるデータについ
ては各辞書のデータを取込むことにより達成される。
ある単語による辞書アクセス時に、優先順位の高い順序
で、まず辞書1から例えば熟語データと品詞データを取
込み、次に辞#2から熟語データと辞書1にない品詞デ
ータを取込み、更に辞書3から熟語データと辞書1.辞
書2にない品詞データを取込むというマージ操作をして
、メモリ内に単語データを構成する。このように、多段
構成辞書の各データを品詞レベルでマージすることによ
り、該当単語の全ての可能性のある品詞データを取込む
ことができる。
で、まず辞書1から例えば熟語データと品詞データを取
込み、次に辞#2から熟語データと辞書1にない品詞デ
ータを取込み、更に辞書3から熟語データと辞書1.辞
書2にない品詞データを取込むというマージ操作をして
、メモリ内に単語データを構成する。このように、多段
構成辞書の各データを品詞レベルでマージすることによ
り、該当単語の全ての可能性のある品詞データを取込む
ことができる。
以下、本発明の一実施例について図面により詳細に説明
する。
する。
第2図の従来例に対応し、本発明による多段構成辞書ア
クセス方式の具体例を第3図に示す。こ\で、辞書1,
2.3には、この順序のアクセスの優先度がついている
とする。また、熟語データは必ず取込むとする。例えば
単語rclearJで、辞書をアクセスするとき、まず
辞書1より名詞データNい動詞データV工、熟語データ
ID1を取込む。次に、辞書2より副詞データADV2
.熟語データより2を取込む。最後に、辞書3より形容
詞データADJ、、熟語ID、を取込む。二Nで、副詞
データADV、、及び動詞データV、は、既にあるので
取込まない。このようにして、取込んでマージした結果
が品詞テーブル4である。
クセス方式の具体例を第3図に示す。こ\で、辞書1,
2.3には、この順序のアクセスの優先度がついている
とする。また、熟語データは必ず取込むとする。例えば
単語rclearJで、辞書をアクセスするとき、まず
辞書1より名詞データNい動詞データV工、熟語データ
ID1を取込む。次に、辞書2より副詞データADV2
.熟語データより2を取込む。最後に、辞書3より形容
詞データADJ、、熟語ID、を取込む。二Nで、副詞
データADV、、及び動詞データV、は、既にあるので
取込まない。このようにして、取込んでマージした結果
が品詞テーブル4である。
第3図の例によれば、単語rclearJの可能性のあ
る品詞データを、全て取込むことが可能になる。これに
対し、第2図の従来例では、辞書2゜3に存在する単語
rexpressJの他の可能性のある副詞データAD
v2、形容詞7−タA D J z、熟語データID2
.ID、は無視される。
る品詞データを、全て取込むことが可能になる。これに
対し、第2図の従来例では、辞書2゜3に存在する単語
rexpressJの他の可能性のある副詞データAD
v2、形容詞7−タA D J z、熟語データID2
.ID、は無視される。
第1図は本発明で対象とする機械翻訳システムの一実施
例で、中央処理装置(CPU)9、主メモリ10、原文
テキストファイル12、辞書ファイル13〜15.訳文
テキストファイル16より成る。
例で、中央処理装置(CPU)9、主メモリ10、原文
テキストファイル12、辞書ファイル13〜15.訳文
テキストファイル16より成る。
メモリ10には翻訳プログラム11や翻訳規則の他に、
辞書をアクセスして得られる各単語の品詞テーブル4や
翻訳途中データなどが随時格納される。ファイル13の
辞書1は例えばユーザ辞書であり、ユーザが自由に単語
情報を作成したり、修正したりすることが可能である。
辞書をアクセスして得られる各単語の品詞テーブル4や
翻訳途中データなどが随時格納される。ファイル13の
辞書1は例えばユーザ辞書であり、ユーザが自由に単語
情報を作成したり、修正したりすることが可能である。
ファイル14゜15の辞書2、辞書3はシステム提供辞
書である。
書である。
辞書2は例えば専門用語辞書であり、経済分野、法学分
野、コンピュータ分野等、ユーザに対応した辞書である
。辞書3は例えば基本用語辞書であり、基本的な文章を
翻訳するときに、最低限必要な辞書である。こ\で、辞
書1,2.3のアクセスの優先順位は、辞書1が最高で
、次が辞書2、辞書3が最低とするのが普通である。
野、コンピュータ分野等、ユーザに対応した辞書である
。辞書3は例えば基本用語辞書であり、基本的な文章を
翻訳するときに、最低限必要な辞書である。こ\で、辞
書1,2.3のアクセスの優先順位は、辞書1が最高で
、次が辞書2、辞書3が最低とするのが普通である。
第4図は辞書の構造例を示したもので、辞書1゜辞書2
.辞書3ともに同じ構造をしている。辞書内にある各単
語の基本テーブル部17には、その単語のもつ品詞とそ
の品詞情報の存在するアドレスを示すポインタ、及び熟
語(イディオム)の存在を示すフラグとイディオム情報
の存在するアドレスを示すポインタとをもつ、各ポイン
タの示すアドレスには、各品詞の品詞情報18.18’
、及びイディオム情報19が入っている。
.辞書3ともに同じ構造をしている。辞書内にある各単
語の基本テーブル部17には、その単語のもつ品詞とそ
の品詞情報の存在するアドレスを示すポインタ、及び熟
語(イディオム)の存在を示すフラグとイディオム情報
の存在するアドレスを示すポインタとをもつ、各ポイン
タの示すアドレスには、各品詞の品詞情報18.18’
、及びイディオム情報19が入っている。
さて、第1図において、中央処理装置9は、翻訳プログ
ラム11の制御のもとに機械翻訳を実行する。第5図は
その処理フローを示したものである。まず、ファイル1
2より原文テキストを入力し、単語分割を行う(ステッ
プ101)。次に、辞書ファイル13,14.15をア
クセスして、各単語の情報を辞IF1.辞書2.辞書3
より取込み、それらをマージして単語毎に品詞テーブル
4をメモリ10内に形成する(ステップ102)。
ラム11の制御のもとに機械翻訳を実行する。第5図は
その処理フローを示したものである。まず、ファイル1
2より原文テキストを入力し、単語分割を行う(ステッ
プ101)。次に、辞書ファイル13,14.15をア
クセスして、各単語の情報を辞IF1.辞書2.辞書3
より取込み、それらをマージして単語毎に品詞テーブル
4をメモリ10内に形成する(ステップ102)。
次に、これらの単語情報とメモリ10に予め用意された
翻訳規則に従って翻訳を行う(ステップ103)。そし
て、生成された訳文をファイル16に出力する(ステッ
プ104)。
翻訳規則に従って翻訳を行う(ステップ103)。そし
て、生成された訳文をファイル16に出力する(ステッ
プ104)。
第6図は辞書アクセス処理の詳細フローを示したもので
ある。
ある。
一つの単語を読取り(ステップ2’01)、まず。
ファイル13の辞書1をアクセスして(ステップ202
)、該辞書1に存在する当該単語の全品詞データと熟語
データをメモリ10に取込む(ステップ203)。次に
ファイル14の辞書2をアクセスしくステップ204)
、品詞データについては、辞書1に存在するものと異な
る品詞データのみを取込んで辞書1の品詞データとマー
ジしくステップ205.206)+熟語データはそのま
\取込んでマージする(ステップ207)。次にファイ
ル15の辞書3をアクセスしくステップ2゜8)、品詞
データについては、辞書1,2に存在するものと異なる
品詞データのみを取込んで、既に取込んであるものとマ
ージしくステップ209゜210)、熟語データはその
ま\取込んでマージする(ステップ211)。第6図の
処理の具体例は第1図に示した通りである。
)、該辞書1に存在する当該単語の全品詞データと熟語
データをメモリ10に取込む(ステップ203)。次に
ファイル14の辞書2をアクセスしくステップ204)
、品詞データについては、辞書1に存在するものと異な
る品詞データのみを取込んで辞書1の品詞データとマー
ジしくステップ205.206)+熟語データはそのま
\取込んでマージする(ステップ207)。次にファイ
ル15の辞書3をアクセスしくステップ2゜8)、品詞
データについては、辞書1,2に存在するものと異なる
品詞データのみを取込んで、既に取込んであるものとマ
ージしくステップ209゜210)、熟語データはその
ま\取込んでマージする(ステップ211)。第6図の
処理の具体例は第1図に示した通りである。
なお、翻訳対象テキストによっては多段構成のすべての
辞書をアクセスする必要がない場合がある。第7図はこ
のような場合の実施例を示したもので、品詞レベルでの
マージをするがどうかを判別するフラグ20を付加しく
0はオフ、1はオン)、該フラグ20がオフの場合、そ
の辞書の情報は無視するというものである。第7図の例
では、辞書2の品詞マージフラグ20がオフになってい
る。
辞書をアクセスする必要がない場合がある。第7図はこ
のような場合の実施例を示したもので、品詞レベルでの
マージをするがどうかを判別するフラグ20を付加しく
0はオフ、1はオン)、該フラグ20がオフの場合、そ
の辞書の情報は無視するというものである。第7図の例
では、辞書2の品詞マージフラグ20がオフになってい
る。
この場合、辞書1と辞#3で品詞レベルのマージをすれ
ば、辞書2ではマージをしない。これによって、辞書ア
クセスの時間の無駄を省くと2もに、辞書アクセスを柔
軟に処理することが可能になる。
ば、辞書2ではマージをしない。これによって、辞書ア
クセスの時間の無駄を省くと2もに、辞書アクセスを柔
軟に処理することが可能になる。
以上の説明から明らかな如く1本発明によれば、多段構
成辞書をアクセスする時、可能性のある品詞データや熟
語データが全て取込める。そのため、ユーザ辞書は、必
要最小限のデータを記述すればよく1人的負担、メモリ
の負担ともに大幅に軽減される。また、ユーザ辞書で定
義された単語のデータを、その定義されない品詞につい
ては、システム提供辞書からマージしてくるため、当該
単語のデータが十分になり、翻訳の精度が著しく向上す
る。
成辞書をアクセスする時、可能性のある品詞データや熟
語データが全て取込める。そのため、ユーザ辞書は、必
要最小限のデータを記述すればよく1人的負担、メモリ
の負担ともに大幅に軽減される。また、ユーザ辞書で定
義された単語のデータを、その定義されない品詞につい
ては、システム提供辞書からマージしてくるため、当該
単語のデータが十分になり、翻訳の精度が著しく向上す
る。
第1図は本発明で対象とする機械翻訳システムの一実施
例を示す図、第2図は従来の辞書アクセスを説明する図
、第3図は本発明による辞書アクセスの具体例を示す図
、第4図は辞書の形式例を示す図、第5図は翻訳プログ
ラムの概略処理フローを示す図、第6図は翻訳プログラ
ム中の辞書アクセス処理の詳細フローを示す図、第7図
は辞書構成の他の実施例を示す図である。 1.2.3・・・辞書、 4・・・マージされた辞書(品詞テーブル)。 N2図 Cシ詞テーフ゛ル/ 晶感月テープ)し 第6図
例を示す図、第2図は従来の辞書アクセスを説明する図
、第3図は本発明による辞書アクセスの具体例を示す図
、第4図は辞書の形式例を示す図、第5図は翻訳プログ
ラムの概略処理フローを示す図、第6図は翻訳プログラ
ム中の辞書アクセス処理の詳細フローを示す図、第7図
は辞書構成の他の実施例を示す図である。 1.2.3・・・辞書、 4・・・マージされた辞書(品詞テーブル)。 N2図 Cシ詞テーフ゛ル/ 晶感月テープ)し 第6図
Claims (1)
- (1)異なるアクセス優先順位をもつ複数の辞書を有す
る機械翻訳システムにおいて、ある単語による辞書アク
セス時、前記複数の辞書を優先順位の高いものから順次
アクセスして、複数の辞書に同一データが存在する場合
は優先順位の高い辞書のものを取込み、複数の辞書で異
なるデータについては各辞書のデータを取込むことを特
徴とする機械翻訳辞書アクセス方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62070012A JP2588522B2 (ja) | 1987-03-24 | 1987-03-24 | 機械翻訳辞書アクセス方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62070012A JP2588522B2 (ja) | 1987-03-24 | 1987-03-24 | 機械翻訳辞書アクセス方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS63236168A true JPS63236168A (ja) | 1988-10-03 |
JP2588522B2 JP2588522B2 (ja) | 1997-03-05 |
Family
ID=13419263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62070012A Expired - Fee Related JP2588522B2 (ja) | 1987-03-24 | 1987-03-24 | 機械翻訳辞書アクセス方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2588522B2 (ja) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5991455A (ja) * | 1982-11-18 | 1984-05-26 | Ricoh Co Ltd | 複写機 |
-
1987
- 1987-03-24 JP JP62070012A patent/JP2588522B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5991455A (ja) * | 1982-11-18 | 1984-05-26 | Ricoh Co Ltd | 複写機 |
Also Published As
Publication number | Publication date |
---|---|
JP2588522B2 (ja) | 1997-03-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63236168A (ja) | 機械翻訳辞書アクセス方法 | |
Sydor | Lexical features of information technology field in contemporary English | |
JP3136973B2 (ja) | 言語解析システムおよび方法 | |
Tsapkini et al. | The role of configurational asymmetry in the lexical access of prefixed verbs: Evidence from French | |
JP2005025555A (ja) | シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体 | |
JPS59103171A (ja) | 機械翻訳装置 | |
JP3768157B2 (ja) | 他言語オントロジー辞書利用装置及び方法並びにプログラム | |
JP2840258B2 (ja) | 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法 | |
JPH09114828A (ja) | 変換候補の優先順位情報の更新方法 | |
JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
JP3393494B2 (ja) | 利用者辞書作成支援装置 | |
Mow | Insertion and Deletion in English: A Phonological Approach | |
JP3884001B2 (ja) | 言語解析システムおよび方法 | |
JP3132563B2 (ja) | 文書作成支援装置 | |
Park | Opinion: Strategy of Semi-Automatically Annotating a Full-Text Corpus of Genomics & Informatics | |
JPS62256080A (ja) | 翻訳処理方式 | |
JPH0444981B2 (ja) | ||
Novikova | GENERAL PECULIARITIES OF TRANSLATION AND TRANSCRIPTION OF ABBREVIATIONS | |
JPH0785040A (ja) | 表記不統一検出方法およびかな漢字変換方法 | |
JPH07334504A (ja) | 日本語処理システム | |
JPS61136171A (ja) | 構文解析処理方式 | |
JPS6337472A (ja) | 冠詞設定方式 | |
JPH0244427A (ja) | プログラム翻訳変換方式 | |
JPH01287771A (ja) | 形態素解析装置 | |
JPS62282370A (ja) | 品詞のあいまい性除去装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |