JPS63236168A - 機械翻訳辞書アクセス方法 - Google Patents

機械翻訳辞書アクセス方法

Info

Publication number
JPS63236168A
JPS63236168A JP62070012A JP7001287A JPS63236168A JP S63236168 A JPS63236168 A JP S63236168A JP 62070012 A JP62070012 A JP 62070012A JP 7001287 A JP7001287 A JP 7001287A JP S63236168 A JPS63236168 A JP S63236168A
Authority
JP
Japan
Prior art keywords
dictionary
data
speech
word
access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP62070012A
Other languages
English (en)
Other versions
JP2588522B2 (ja
Inventor
Masahiro Otaka
大高 政浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP62070012A priority Critical patent/JP2588522B2/ja
Publication of JPS63236168A publication Critical patent/JPS63236168A/ja
Application granted granted Critical
Publication of JP2588522B2 publication Critical patent/JP2588522B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は機械翻訳システムのアクセス方式に係り、特に
多段辞書をアクセスするときに、品詞レベルでのマージ
をするのに好適な機械翻訳辞書アクセス方式に関する。
〔従来の技術〕
機械翻訳システムでは、基本用語辞書、専門用辞書、ユ
ーザ辞書等、多種類の翻訳辞書が使用され、それらの間
に異なる優先順位を持たせている。
このように、複数種類の翻訳辞書を多段構成とした場合
、従来はアクセスの優先順位の高い辞書で単語が見つか
ると、他の辞書は無視(アクセスしない)していた。
第2図は多段構成辞書の従来のアクセス方式を説明する
図であり、アクセスの優先順位は辞書1゜2.3の順序
で低くなるとする。図中、Nは名詞データ、■は動詞デ
ータ、ADVは副詞データ、ADJは形容詞データ、I
Dは熟語データを示す。
例えば単語rexpressJを検索しようとするとき
、まず辞書1をアクセスする。こNで、単語reXpr
ass Jが存在するから、このデータを品詞テーブル
8にロードする。そして、処理を終りとする。
即ち、辞書2.辞書3のデータは無視される。
なお、多段構成辞書のアクセスに関連するものには、例
えば、特開昭55−134477号公報が挙げられる。
〔発明が解決しようとする問題点〕
上記従来技術では、多段構成辞書のアクセス時、優先順
位の高い辞書で単語が見つかると、他の辞書をアクセス
しないため、他の辞書に含まれる有効な情報を得られず
1機械翻訳システムにおいて、例えば英文解析に失敗し
、良い翻訳が得られないという問題があった。この対策
として、ユーザ辞書のデータを十分なものにすることが
考えられるが、その作成は難しく、保守も難しくなり、
コストが非常にか\る問題がある。
本発明の目的は、ユーザの負担、コストを軽減して、翻
訳辞書からよりよいデータを取り出して、質のよい翻訳
結果を得ることにある。
〔問題点を解決するための手段〕
上記目的は、多段構成の辞書をアクセスする時、該複数
の辞書を優先順位の高いものから順次アクセスして、複
数の辞書に同一データが存在する場合は優先順位の高い
辞書のものを取込み、複数の辞書で異なるデータについ
ては各辞書のデータを取込むことにより達成される。
〔作 用〕
ある単語による辞書アクセス時に、優先順位の高い順序
で、まず辞書1から例えば熟語データと品詞データを取
込み、次に辞#2から熟語データと辞書1にない品詞デ
ータを取込み、更に辞書3から熟語データと辞書1.辞
書2にない品詞データを取込むというマージ操作をして
、メモリ内に単語データを構成する。このように、多段
構成辞書の各データを品詞レベルでマージすることによ
り、該当単語の全ての可能性のある品詞データを取込む
ことができる。
〔実施例〕
以下、本発明の一実施例について図面により詳細に説明
する。
第2図の従来例に対応し、本発明による多段構成辞書ア
クセス方式の具体例を第3図に示す。こ\で、辞書1,
2.3には、この順序のアクセスの優先度がついている
とする。また、熟語データは必ず取込むとする。例えば
単語rclearJで、辞書をアクセスするとき、まず
辞書1より名詞データNい動詞データV工、熟語データ
ID1を取込む。次に、辞書2より副詞データADV2
.熟語データより2を取込む。最後に、辞書3より形容
詞データADJ、、熟語ID、を取込む。二Nで、副詞
データADV、、及び動詞データV、は、既にあるので
取込まない。このようにして、取込んでマージした結果
が品詞テーブル4である。
第3図の例によれば、単語rclearJの可能性のあ
る品詞データを、全て取込むことが可能になる。これに
対し、第2図の従来例では、辞書2゜3に存在する単語
rexpressJの他の可能性のある副詞データAD
v2、形容詞7−タA D J z、熟語データID2
.ID、は無視される。
第1図は本発明で対象とする機械翻訳システムの一実施
例で、中央処理装置(CPU)9、主メモリ10、原文
テキストファイル12、辞書ファイル13〜15.訳文
テキストファイル16より成る。
メモリ10には翻訳プログラム11や翻訳規則の他に、
辞書をアクセスして得られる各単語の品詞テーブル4や
翻訳途中データなどが随時格納される。ファイル13の
辞書1は例えばユーザ辞書であり、ユーザが自由に単語
情報を作成したり、修正したりすることが可能である。
ファイル14゜15の辞書2、辞書3はシステム提供辞
書である。
辞書2は例えば専門用語辞書であり、経済分野、法学分
野、コンピュータ分野等、ユーザに対応した辞書である
。辞書3は例えば基本用語辞書であり、基本的な文章を
翻訳するときに、最低限必要な辞書である。こ\で、辞
書1,2.3のアクセスの優先順位は、辞書1が最高で
、次が辞書2、辞書3が最低とするのが普通である。
第4図は辞書の構造例を示したもので、辞書1゜辞書2
.辞書3ともに同じ構造をしている。辞書内にある各単
語の基本テーブル部17には、その単語のもつ品詞とそ
の品詞情報の存在するアドレスを示すポインタ、及び熟
語(イディオム)の存在を示すフラグとイディオム情報
の存在するアドレスを示すポインタとをもつ、各ポイン
タの示すアドレスには、各品詞の品詞情報18.18’
、及びイディオム情報19が入っている。
さて、第1図において、中央処理装置9は、翻訳プログ
ラム11の制御のもとに機械翻訳を実行する。第5図は
その処理フローを示したものである。まず、ファイル1
2より原文テキストを入力し、単語分割を行う(ステッ
プ101)。次に、辞書ファイル13,14.15をア
クセスして、各単語の情報を辞IF1.辞書2.辞書3
より取込み、それらをマージして単語毎に品詞テーブル
4をメモリ10内に形成する(ステップ102)。
次に、これらの単語情報とメモリ10に予め用意された
翻訳規則に従って翻訳を行う(ステップ103)。そし
て、生成された訳文をファイル16に出力する(ステッ
プ104)。
第6図は辞書アクセス処理の詳細フローを示したもので
ある。
一つの単語を読取り(ステップ2’01)、まず。
ファイル13の辞書1をアクセスして(ステップ202
)、該辞書1に存在する当該単語の全品詞データと熟語
データをメモリ10に取込む(ステップ203)。次に
ファイル14の辞書2をアクセスしくステップ204)
、品詞データについては、辞書1に存在するものと異な
る品詞データのみを取込んで辞書1の品詞データとマー
ジしくステップ205.206)+熟語データはそのま
\取込んでマージする(ステップ207)。次にファイ
ル15の辞書3をアクセスしくステップ2゜8)、品詞
データについては、辞書1,2に存在するものと異なる
品詞データのみを取込んで、既に取込んであるものとマ
ージしくステップ209゜210)、熟語データはその
ま\取込んでマージする(ステップ211)。第6図の
処理の具体例は第1図に示した通りである。
なお、翻訳対象テキストによっては多段構成のすべての
辞書をアクセスする必要がない場合がある。第7図はこ
のような場合の実施例を示したもので、品詞レベルでの
マージをするがどうかを判別するフラグ20を付加しく
0はオフ、1はオン)、該フラグ20がオフの場合、そ
の辞書の情報は無視するというものである。第7図の例
では、辞書2の品詞マージフラグ20がオフになってい
る。
この場合、辞書1と辞#3で品詞レベルのマージをすれ
ば、辞書2ではマージをしない。これによって、辞書ア
クセスの時間の無駄を省くと2もに、辞書アクセスを柔
軟に処理することが可能になる。
〔発明の効果〕
以上の説明から明らかな如く1本発明によれば、多段構
成辞書をアクセスする時、可能性のある品詞データや熟
語データが全て取込める。そのため、ユーザ辞書は、必
要最小限のデータを記述すればよく1人的負担、メモリ
の負担ともに大幅に軽減される。また、ユーザ辞書で定
義された単語のデータを、その定義されない品詞につい
ては、システム提供辞書からマージしてくるため、当該
単語のデータが十分になり、翻訳の精度が著しく向上す
る。
【図面の簡単な説明】
第1図は本発明で対象とする機械翻訳システムの一実施
例を示す図、第2図は従来の辞書アクセスを説明する図
、第3図は本発明による辞書アクセスの具体例を示す図
、第4図は辞書の形式例を示す図、第5図は翻訳プログ
ラムの概略処理フローを示す図、第6図は翻訳プログラ
ム中の辞書アクセス処理の詳細フローを示す図、第7図
は辞書構成の他の実施例を示す図である。 1.2.3・・・辞書、 4・・・マージされた辞書(品詞テーブル)。 N2図 Cシ詞テーフ゛ル/ 晶感月テープ)し 第6図

Claims (1)

    【特許請求の範囲】
  1. (1)異なるアクセス優先順位をもつ複数の辞書を有す
    る機械翻訳システムにおいて、ある単語による辞書アク
    セス時、前記複数の辞書を優先順位の高いものから順次
    アクセスして、複数の辞書に同一データが存在する場合
    は優先順位の高い辞書のものを取込み、複数の辞書で異
    なるデータについては各辞書のデータを取込むことを特
    徴とする機械翻訳辞書アクセス方式。
JP62070012A 1987-03-24 1987-03-24 機械翻訳辞書アクセス方法 Expired - Fee Related JP2588522B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62070012A JP2588522B2 (ja) 1987-03-24 1987-03-24 機械翻訳辞書アクセス方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62070012A JP2588522B2 (ja) 1987-03-24 1987-03-24 機械翻訳辞書アクセス方法

Publications (2)

Publication Number Publication Date
JPS63236168A true JPS63236168A (ja) 1988-10-03
JP2588522B2 JP2588522B2 (ja) 1997-03-05

Family

ID=13419263

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62070012A Expired - Fee Related JP2588522B2 (ja) 1987-03-24 1987-03-24 機械翻訳辞書アクセス方法

Country Status (1)

Country Link
JP (1) JP2588522B2 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991455A (ja) * 1982-11-18 1984-05-26 Ricoh Co Ltd 複写機

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5991455A (ja) * 1982-11-18 1984-05-26 Ricoh Co Ltd 複写機

Also Published As

Publication number Publication date
JP2588522B2 (ja) 1997-03-05

Similar Documents

Publication Publication Date Title
JPS63236168A (ja) 機械翻訳辞書アクセス方法
Sydor Lexical features of information technology field in contemporary English
JP3136973B2 (ja) 言語解析システムおよび方法
Tsapkini et al. The role of configurational asymmetry in the lexical access of prefixed verbs: Evidence from French
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JPS59103171A (ja) 機械翻訳装置
JP3768157B2 (ja) 他言語オントロジー辞書利用装置及び方法並びにプログラム
JP2840258B2 (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH09114828A (ja) 変換候補の優先順位情報の更新方法
JP2742059B2 (ja) 翻訳用辞書編集装置
JP3393494B2 (ja) 利用者辞書作成支援装置
Mow Insertion and Deletion in English: A Phonological Approach
JP3884001B2 (ja) 言語解析システムおよび方法
JP3132563B2 (ja) 文書作成支援装置
Park Opinion: Strategy of Semi-Automatically Annotating a Full-Text Corpus of Genomics & Informatics
JPS62256080A (ja) 翻訳処理方式
JPH0444981B2 (ja)
Novikova GENERAL PECULIARITIES OF TRANSLATION AND TRANSCRIPTION OF ABBREVIATIONS
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JPH07334504A (ja) 日本語処理システム
JPS61136171A (ja) 構文解析処理方式
JPS6337472A (ja) 冠詞設定方式
JPH0244427A (ja) プログラム翻訳変換方式
JPH01287771A (ja) 形態素解析装置
JPS62282370A (ja) 品詞のあいまい性除去装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees