JPH07182342A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPH07182342A JPH07182342A JP5328893A JP32889393A JPH07182342A JP H07182342 A JPH07182342 A JP H07182342A JP 5328893 A JP5328893 A JP 5328893A JP 32889393 A JP32889393 A JP 32889393A JP H07182342 A JPH07182342 A JP H07182342A
- Authority
- JP
- Japan
- Prior art keywords
- list
- noun
- sentence
- dictionary
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
持つ名詞句のリストを作成することができる機械翻訳装
置の提供。リストを参照することによりユーザ辞書への
登録を容易にする。 【構成】 抽出される名詞句の構成が抽出指定バッファ
14に記憶される。CPU1により、入力文から、抽出
指定バッファ14に記憶された構成の名詞句が抽出さ
れ、抽出された名詞句からなるリストが作成される。
Description
変換・生成等の処理を行って翻訳文を出力する機械翻訳
装置に関するものである。
の辞書を用いて入力文の構文を解析し、目的の言語の構
文構造に変換した後、得られた構文構造に従って訳語を
生成することにより翻訳文を得ている。
てを目的とする言語に翻訳してしまうため、ある特定の
分野においてのみ使われる専門用語などが入力文中にあ
る場合、それら専門用語を翻訳すると返って翻訳文の意
味が読み取りにくくなって有効な翻訳処理が実現できな
かった。
いて、複合名詞句の構造を持つ専門用語 "gearbox modu
le" を、それを構成する個々の名詞“gearbox"と "modu
le"に分割してそれぞれを日本語に翻訳した結果、分か
りにくい翻訳文( 例えば「ギアボックス構成要素」) を
出力することがあった。
の文法構造をもつ部分を原文のまま出力することを可能
にした機械翻訳装置(特開平3−222065号公報)
が提案されている。
訳装置によれば、従来に比べて分かり易い翻訳文を出力
することが可能であるが、入力文中の特定の文法構造を
もつ部分は原文のままであるため、出力されたものは翻
訳文としては不完全なものであるという問題点を有して
いる。
目的言語に翻訳して出力するためには、ユーザ辞書に登
録する必要がある。ユーザ辞書に登録する方法として
は、翻訳を行う際、登録の必要な単語が現れるたびに1
つずつ登録していく方法と、翻訳実行時には登録が必要
な単語の見出しリストだけを作成しておき、後でまとめ
て登録する方法とがある。このうち、後者の方法の方が
ユーザの作業効率が良いと考えられる。
特定の文法規則に基づく構造を持つ部分を自動的に抽出
し、抽出された部分をユーザ辞書に登録するための見出
しリストを作成することができる機械翻訳装置を提供す
ることを目的としている。
の機械翻訳装置は上記課題を解決するために、入力文に
対し、解析・変換・訳語生成を行なうことにより翻訳文
を出力する機械翻訳装置において、抽出される名詞句の
構成が記憶される記憶手段、例えばメモリと、入力文の
解析時に上記記憶手段に記憶された構成の名詞句を抽出
して、抽出された名詞句からなるリストを作成するリス
ト作成手段と、作成されたリストが記憶されるリスト記
憶手段とを有することを特徴としている。
は、請求項1の構成に加えて、上記抽出される名詞句の
構成がユーザにより指定される名詞句指定手段を有して
いることを特徴としている。
装置は、請求項1の構成に加えて、作成されたリストの
内容を、所定の規則に基づき並べ換えると共に重複する
ものは1つにする整理手段を有することを特徴としてい
る。
入力文は、まず解析が行なわれる。この解析時に、記憶
手段に記憶された構成を有する名詞句が、リスト作成手
段により抽出され、抽出された名詞句からなるリストが
作成される。作成されたリストはリスト記憶手段に記憶
され、必要に応じて出力される。
はリストに挙げられた名詞句の訳をユーザ辞書に登録す
ることができる。
成が行なわれ、入力文に対応する翻訳文が出力される。
名詞句指定手段によりユーザから指定されるように構成
してもよい。これにより、入力文に応じた名詞句のリス
トが作成され、ユーザの用途に応じた翻訳結果が得られ
る。
手段により所定の規則に基づき並べ換えられると共に重
複するものは1つにするように構成されているので、見
やすいリストになると共に、ユーザ辞書に重複して登録
されることがなくなる。
基づいて説明すれば、以下の通りである。尚、本発明は
この実施例に限られるものではない。
すように、翻訳処理を行う中央処理装置(CPU)1
と、各種処理のためのプログラム等が格納されるプログ
ラムメモリ2と、入出力文を記憶したり各種レジスタメ
モリとして利用されるバッファメモリ7と、入出力文及
びユーザへの提示等の表示を行うCRT表示装置3と、
入力文の入力および各種制御を行うためのキーボード4
と、入力文(原文)の出力文(翻訳文)への翻訳を実行
する翻訳モジュール5とを備えており、該翻訳モジュー
ル5には、翻訳のための各種規則と辞書が記録された辞
書・規則メモリ6が接続されている。また、上記各構成
要素はデータバス、アドレスバス及び制御バスからなる
バス(共通母線)8により相互に接続されている。尚、
上記CPU1はリスト作成手段及び名詞句指定手段の役
割を有している。
成を説明する。
入力文に使用されている言語であるソース言語が入力さ
れる辞書引き形態素解析部9、並びに辞書引き形態素解
析部9から順次接続されている構文解析部10、変換部
11、及び出力文に使用される言語であるターゲット言
語を生成する生成部12の4部分からなる。
形態素(単語列)に分割され、辞書引きが行なわれると
共に、各単語に対する品詞などの文法情報及び訳語が得
られ、更に時制・人称・数なども解析される。
間の係受けなどの文章の構造(構造解析木)が決定され
る。
た文章構造がターゲット言語の文章構造に変換される。
章構造に従って訳文を生成する。
の一部であり、この文法規則に対応する適用プログラム
との関係を示している。これは、前記辞書・規則メモリ
6の中に記憶されている各種規則類の中の1つである。
らできていることを表す。(b)は、名詞句は冠詞と名
詞句1とからできていることを表す。(c)は、名詞句
は冠詞と名詞とからできていることを表す。(d)は、
動詞句は動詞と名詞句からできていることを表す。
(e)は、名詞句1は名詞と名詞からできていることを
表す。(f)は、名詞句1は名詞と名詞と名詞とからで
きていることを表す。(g)は、名詞句1は形容詞と名
詞からできていることを表す。これら、各文法規則に対
応して適用プログラム(a)〜(g)が設定されてい
る。
本発明の具体的な処理動作を説明する。
る場合において、入力文として、 The system requires a gearbox module. が入力されたものと仮定する。
る文法規則を参照して複合名詞自動抽出処理を行うか否
かを、キーボード4に含まれている機能キー等を用いて
指定する。この情報はバッファメモリ7内の抽出モード
フラグ13に0(複合名詞自動抽出を行なわない)又は
1(複合名詞自動抽出を行なう)の値として蓄えられ
る。
定すると(S1)、次に、ユーザは自動抽出を行なう複
合名詞のタイプをキーボード4の機能キー等で指定する
(S2)。これは、予め決められた自動抽出の対象とな
る複合名詞のタイプから選択するものであり、例えばタ
イプ1は名詞が3個以上連続する名詞句を自動抽出、タ
イプ2は名詞が2個以上連続する名詞句を自動抽出、タ
イプ3は名詞が2個以上連続する名詞句の他に形容詞+
1個以上の名詞からなる名詞句も自動抽出する、などと
設定している。
7の抽出指定バッファ14(記憶手段)に、1、2、3
…といった値で蓄えられる。
名詞のタイプをユーザが指定することとしたが、ユーザ
が指定しない場合は、例えば、タイプ2の複合名詞を自
動抽出の対象として処理を行なうように設定しておくよ
うな実現方法も可能である。
格納されている入力プログラムによりバッファメモリ7
内の所定の領域に記憶された後(S3)、辞書引き形態
素解析部9において、辞書・規則メモリ6を用いて辞書
引き、形態素解析が行なわれる(S4)。これにより、
原文に対し次の表2に示すような、単語、品詞及び訳語
に関する辞書引き情報が導入される。
法規則を用いて構文解析が行なわれ、入力文に対して適
用すべき文法規則が調べられる(S5)。適用すべき文
法規則があればその文法規則が適用される(S6)。そ
して、文法規則の適用が成功したか否かが調べられ(S
7)、失敗した場合はS5へ戻って他に適用すべき文法
規則がないかどうかが調べられる。成功した場合は部分
木構造が作られる(S8)。
文法規則に対応する適用プログラムが励起される(S
9)。
は、対応する適用プログラム(e) が励起される。プログ
ラム(e) は、S2で指定された抽出指定バッファ14
の、自動抽出の対象となっている複合名詞のタイプの値
を調べ、複合名詞のタイプが2(連続する2個以上の名
詞からなる名詞句を自動抽出する)または3(連続する
2個以上の名詞からなる名詞句、及び、形容詞+連続す
る1個以上の名詞からなる名詞句を自動抽出する)であ
れば、文法規則(e) の右辺にある2つの名詞をバッファ
メモリ7の見出しリスト15(リスト記憶手段)に格納
する。すなわち、図4の"gearbox" と"module"の2つの
単語を見出しリスト15に格納する。適用プログラム
(e) は、例えば、自動抽出対象の複合名詞のタイプが1
(連続する3個以上の名詞からなる名詞句を自動抽出す
る)の場合はどの単語も見出しリストに格納しない。
則がなくなるまで繰り返される。
に示すような解析結果の構造が得られ、同時に、次の表
3に示すような見出しリストが得られる。
成功したか否かが調べられる(S10)。構文解析が成
功したかどうかは、図3に示すような一文全体が文の木
構造になるかどうかで判断される。
場合は、生成部12において訳語生成が行なわれる(S
11)。即ち、上記の例では「システムは、ギアボック
ス構成要素を必要とする。」という訳文が生成される。
(S13)、入力文があればS3へ戻る。
場合は、失敗したことを表示し、作成された部分木構造
の範囲内で訳文生成を行なう、エラー処理が行なわれた
(S12)後、S13へ進む。
理手段であるCPU1により見出しリストのソート/マ
ージ処理を行なう(S14)。つまり、見出しリストの
内容を見出しのアルファベット順に並べ替え、同一見出
しが複数個ある場合は1つだけを残して他は削除する。
これにより見出しリストの内容が整理され、効率のよい
ものとなる。こうして全処理を終了する。
を参照して、見出しリスト中の必要な名詞句に対し適切
な訳のユーザ辞書登録を行なう。その結果、例えば前記
例文は、「システムは、ギアボックスモジュールを必要
とする。」という正しい訳文に翻訳されるようになる。
構文解析時に所定の文法規則が適用されたとき、その文
法規則に対応して設けられた適用プログラムにより、入
力文における特定の構造の複合名詞を自動的に抽出し
て、抽出された複合名詞の見出しリストを作成すること
ができる。従って、この見出しリストを参照してユーザ
は容易にユーザ辞書登録を行なうことができる。
ユーザが指定することができるので、ユーザの用途に応
じた抽出が行なえる。
できるので、ユーザ辞書登録を行なう必要のない場合な
ど、見出しリストを作成することなく翻訳が行なわれる
ので、ユーザの用途に合わせて装置の効率的な使用が可
能になる。
に、抽出される名詞句の構成が記憶される記憶手段と、
入力文の解析時に上記記憶手段に記憶された構成の名詞
句を抽出して、抽出された名詞句からなるリストを作成
するリスト作成手段と、作成されたリストが記憶される
リスト記憶手段とを有する構成である。
構成を有する名詞句のリストが作成されるので、ユーザ
は必要に応じこれらの名詞句の訳語をユーザ辞書に登録
することができる。従って、特定分野において用いられ
る専門用語等のユーザ辞書への登録が簡単に行なえるの
で、良質の翻訳文が得られると共に使い勝手のよい装置
が得られるという効果を奏する。
される名詞句の構成がユーザにより指定される名詞句指
定手段を有している。これにより、上記効果に加えて入
力文に応じた名詞句のリストが作成され、ユーザの用途
に応じた翻訳結果が得られるという効果を奏する。
れたリストの内容を所定の規則に基づき並べ換えると共
に、重複するものは1つにする整理手段を有している。
それゆえ、リストが見やすいものになると共に、リスト
に挙げられた名詞句がユーザ辞書に重複して登録される
ことがなくなるという効果も併せて奏する。
である。
る。
である。
ある。
手段) 2 プログラムメモリ 5 翻訳モジュール 6 辞書・規則メモリ 7 バッファメモリ 13 抽出モードフラグ 14 抽出指定バッファ(記憶手段) 15 見出しリスト(リスト記憶手段)
Claims (3)
- 【請求項1】入力文に対し、解析・変換・訳語生成を行
なうことにより翻訳文を出力する機械翻訳装置におい
て、 抽出される名詞句の構成が記憶される記憶手段と、 入力文の解析時に上記記憶手段に記憶された構成の名詞
句を抽出して、抽出された名詞句からなるリストを作成
するリスト作成手段と、 作成されたリストが記憶されるリスト記憶手段とを有す
ることを特徴とする機械翻訳装置。 - 【請求項2】上記抽出される名詞句の構成がユーザによ
り指定される名詞句指定手段を有していることを特徴と
する請求項1記載の機械翻訳装置。 - 【請求項3】作成されたリストの内容を、所定の規則に
基づき並べ換えると共に重複するものは1つにする整理
手段を有することを特徴とする請求項1記載の機械翻訳
装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5328893A JPH07182342A (ja) | 1993-12-24 | 1993-12-24 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5328893A JPH07182342A (ja) | 1993-12-24 | 1993-12-24 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07182342A true JPH07182342A (ja) | 1995-07-21 |
Family
ID=18215277
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5328893A Pending JPH07182342A (ja) | 1993-12-24 | 1993-12-24 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH07182342A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7475005B2 (en) | 2003-03-17 | 2009-01-06 | International Business Machines Corporation | Translation system, dictionary updating server, translation method, and program and recording medium for use therein |
-
1993
- 1993-12-24 JP JP5328893A patent/JPH07182342A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7475005B2 (en) | 2003-03-17 | 2009-01-06 | International Business Machines Corporation | Translation system, dictionary updating server, translation method, and program and recording medium for use therein |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5644774A (en) | Machine translation system having idiom processing function | |
JP3220560B2 (ja) | 機械翻訳装置 | |
JP2892548B2 (ja) | 自動翻訳装置 | |
US4833611A (en) | Machine translation system | |
JPS6140673A (ja) | 外国語作文用翻訳方法、および翻訳機 | |
EP0357344B1 (en) | Computer assisted language translating machine | |
US5075851A (en) | System for translating a source language word with a prefix into a target language word with multiple forms | |
JPH0351022B2 (ja) | ||
JPH0332106B2 (ja) | ||
JPH07182342A (ja) | 機械翻訳装置 | |
JPS6190269A (ja) | 翻訳方式 | |
JPS6337471A (ja) | 翻訳方法及び装置 | |
JP2715419B2 (ja) | 翻訳装置 | |
JPS62163174A (ja) | 機械翻訳装置 | |
JPH05151256A (ja) | 機械翻訳方法および機械翻訳装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP2871300B2 (ja) | 機械翻訳装置 | |
JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
JPH05225232A (ja) | テキスト自動前編集装置 | |
JPS63136265A (ja) | 機械翻訳装置 | |
JPH0635964A (ja) | 機械翻訳装置 | |
JPH0332105B2 (ja) | ||
JPH04296969A (ja) | 機械翻訳装置 | |
JPH086950A (ja) | キーワード翻訳機能付き機械翻訳装置 | |
JPH0822468A (ja) | 機械翻訳装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 12 Free format text: PAYMENT UNTIL: 20080725 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090725 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 13 Free format text: PAYMENT UNTIL: 20090725 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 14 Free format text: PAYMENT UNTIL: 20100725 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100725 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 15 Free format text: PAYMENT UNTIL: 20110725 |
|
FPAY | Renewal fee payment (prs date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120725 Year of fee payment: 16 |
|
LAPS | Cancellation because of no payment of annual fees |