JPH0696114A - 機械翻訳システム及び文書編集装置 - Google Patents

機械翻訳システム及び文書編集装置

Info

Publication number
JPH0696114A
JPH0696114A JP4243785A JP24378592A JPH0696114A JP H0696114 A JPH0696114 A JP H0696114A JP 4243785 A JP4243785 A JP 4243785A JP 24378592 A JP24378592 A JP 24378592A JP H0696114 A JPH0696114 A JP H0696114A
Authority
JP
Japan
Prior art keywords
translation
dictionary
unit
rule
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4243785A
Other languages
English (en)
Inventor
Yumiko Yoshimura
裕美子 吉村
Hideki Hirakawa
秀樹 平川
Mariko Kimura
真理子 木村
Koichi Nomura
浩一 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4243785A priority Critical patent/JPH0696114A/ja
Publication of JPH0696114A publication Critical patent/JPH0696114A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 標準辞書以外にユーザ辞書や専門用語辞書に
も同一項目が登録されている場合に、原文の状況に合わ
せてより優先度の高い翻訳規則を適用しより制度の高い
訳文を出力することのできる機械翻訳装置を得ることを
目的とする。 【構成】 与えられる第一言語の文章を第二言語の文章
に翻訳する機械翻訳装置において、複数辞書に登録され
ている同一見出し語の翻訳規則のうち、どの辞書のどの
規則が最も優先度が高いかを判定し適用規則を決定する
翻訳規則制御部を設け、標準辞書中の翻訳規則には、登
録語が他の辞書と重なった場合にはその規則を優先する
か否かの情報を付して構成する。 【効果】 質の高い翻訳文を出力することができる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、第一言語を第2言語に
翻訳する機械翻訳システム及び文章の作成、推敲等を行
なう文書編集装置に関する。
【0002】
【従来の技術】近年、コンピュータを利用して第一言語
の文章を第二言語の文章に自動的に機械翻訳するシステ
ムが注目されている。この機械翻訳システムは、基本的
には入力原文を形態素解析、構文解析するなどして、語
(句)などの所定の処理単位に区分し、その処理単位ご
とに翻訳辞書を検索して適用する翻訳規則を決定し、対
応する訳語(訳語句)などを決定し、これを所定の訳文
生成規則にしたがって結合するなどして、その訳文を得
るように構成されている。
【0003】一般に、このような機械翻訳システムが様
々な要求をもつ個々のユーザによって効果的に利用され
るように、システムにはユーザ登録用辞書(ユーザ辞
書)が用意されていたり、原文の分野ごとに切り替えて
利用可能な専門用語辞書を用いることが可能になってい
る。これらの辞書が用いられる際には、通常、標準辞書
の内容より優先されて翻訳規則が適用されるため、ユー
ザ独特の表現や、文書固有の表現、原文書の関係する分
野の専門用語などに対して望まれる訳語が出力されるよ
うに働く。
【0004】ところが、標準辞書とユーザ辞書あるいは
専門用語辞書に同一の見出し語が登録されている場合、
従来では単純に標準辞書の内容よりユーザ辞書・専門用
語辞書の内容を優先させて適用しているため、標準辞書
の中に、非常に強い翻訳規則が記述されていても、その
規則が記述されている見出し語と同一の見出し語がユー
ザ辞書あるいは専門用語辞書に記述されていれば適用さ
れない、という問題があった。
【0005】例えば、日英翻訳において、「〜線を引
く」という入力表現に対応するために、標準辞書の「引
く」の項目の中に「〜線を」という句が共起した時とい
う条件の下に「引く」の訳語に「draw」を当てる翻訳規
則が記述されていても、ユーザ辞書に「引く」という項
目があり、それが訳語に「attract 」を当てるものであ
れば、全体として出力されるのは「attract a line」で
あり、望ましい訳語「draw」が出力されない。
【0006】また、標準辞書中の翻訳規則の訳語群にユ
ーザ辞書や専門用語辞書で定義されている訳語をマージ
する方式をとっている場合には、第一言語の2単語以上
からなる表現を第二言語の1単語の表現で訳出するよう
な翻訳規則が標準辞書に記述されている際に大きな問題
があった。すなわち、このように原文中のある語の意味
を別の語の訳語中に取り込むタイプの翻訳には、原文か
ら訳文への変換をする間に文を構成する概念(言い換え
れば単語)の数が減少する。この構造変換は訳語の決定
を1対1に対応していなくてはいけない。その決定され
た訳語群に、この構造変換と無関係のユーザ辞書や専門
用語辞書の訳語がマージされれば、出力される訳文は当
然おかしなものになってしまう。
【0007】例えば、日英翻訳において、「〜の電源を
投入する」という入力表現に対応するために、標準辞書
の「投入する」の項目の中に、「〜の」という句が前置
修飾している「電源を」という句が共起した時という条
件を設定して、この時に、「電源を」を構造から切り離
し、「投入する」に「switch on 」という訳語を当て、
「〜」の訳語を「switch on 」の目的語として訳出する
翻訳規則が記述されており、かつ、ユーザ辞書に「投入
する」という項目があり、それが訳語に「invest」を当
てるものであるとする。ここで、ユーザ辞書の訳語を標
準辞書の訳語群にマージする処理が行われると、「電源
を」が構造から切り離されたまま、「switch on 」の代
わりに「invest」が訳語として当てられるため、全体と
して出力されるのは、「invest 〜」であり、原文の意
味とはほど遠い訳文になってしまう。
【0008】また、従来において機械翻訳システムはソ
ース言語とターゲット言語両方を解する翻訳者によって
利用されてきた。その際、翻訳者は翻訳対象である文書
の種類や特徴などから情報を得て翻訳を行っていた。す
なわち、辞書の選択や、語の認識・生成の仕方などに複
数の可能性がある場合、翻訳者が専門知識を用いて最適
な解を選択していた。また、そのような専門の翻訳者に
よる翻訳は、大量の科学技術文書やマニュアルを、短時
間に、正確に翻訳することを目的にしていた。そして、
翻訳品質を向上させる為、現状のシステムにおいては、
前編集/後編集を行うことが必須になっていた。
【0009】しかし、近年の機械翻訳システムの普及に
よって、機械翻訳システムのユーザの層が広がり、ソー
ス言語かターゲット言語のどちらかに自信がない一般の
人や、ソース言語を理解しない外国人など、専門知識を
持たないユーザも現れてきた。そして、それらの新規ユ
ーザは、外国語文書から情報を得る為に、または、外国
人へ情報を伝達する為に、機械翻訳システムを利用しよ
うとしている。すなわち、機械翻訳システムを使って行
われる処理が、「前編集/後編集を前提とした高品質翻
訳」から「そのままで文書の意味が解る程度の翻訳」へ
と拡張してきたと言えるだろう。
【0010】その時問題になるのが、今まで機械翻訳シ
ステムが仮定してきたユーザの専門知識である。例え
ば、現在いくつかの機械翻訳システムが提供している
「カスタマイズ機能」はユーザによる機械翻訳用の文法
や辞書などのカスタマイズ化を可能にしたが、その設定
にもユーザの専門知識が求められている。専門の翻訳者
にとっては明白な選択肢も、一般ユーザにとっては難解
な場合が多い。また、ソース言語を理解しない外国人ユ
ーザにとっては、専門用語辞書の選択すらままならない
かもしれない。更に、辞書の選択やカスタマイズ機能の
設定は、正しく行われると効果を発揮するが、誤って行
われると逆に翻訳品質を落としてしまう恐れがある。
【0011】すなわち、翻訳対象分野や翻訳対象言語に
対する知識がなくても、前編集/後編集を行わなくて
も、ある程度の翻訳結果を得ることができる機械翻訳シ
ステムが望まれている。しかし、従来の機械翻訳システ
ムにおいては、対象を専門知識を有するユーザとしてき
た為、専門知識のないユーザには使いにくく、システム
を利用することによる効果を得るのが難しかった。
【0012】一方、昨今においてワードプロセッサをは
じめとして、文書推敲支援システムや機械翻訳システム
など、各種言語処理装置の発展が目覚ましい。
【0013】ここで、これら言語処理装置においては、
文書の編集機能は必須である。文書編集機能は文書を作
成することのほかに、誤りの訂正や表現方法の変更など
文書に対しての修正を行う。文書編集を効率良く行うた
めに、文書編集装置には誤りのある可能性のある語に対
して指摘を行い、その置換候補を出力する機能を持って
いるものがある。例えば、文書中に「一身同体」なる表
現が現れた場合にはこれを「一心同体」と置換するよう
な機能である。
【0014】また、このような明らかな間違いではな
く、「コンピュータ」という言葉と「コンピューター」
という言葉が一つの文書中に現れた場合、どちらか一方
の表現に統一するような機能を持つものもある。
【0015】従来の文書編集装置においては、あらかじ
め置換候補を登録してある辞書を用意してその情報を利
用して置換を行っていた。文書中に辞書の見出し語に登
録してあるものがあった場合にはその置換候補を出力
し、オペレータの指示に従い置換の作業を行っていた。
【0016】しかし、この方式は辞書に見出し語として
登録されていないものに対しては何ら候補を出力するこ
とができない。また、あらかじめ辞書に誤りとその置換
候補をすべて登録するのは極めて困難な作業となる。
【0017】そこで、別の文書編集装置においてはオペ
レータが辞書に見出し語とその置換候補を登録する機能
を設けているものがある。この方法によれば、オペレー
タが自分の希望に基づき辞書登録を行うために最初に辞
書に存在していなかった語に対しても辞書登録を行った
後であれば置換候補をシステムが出力することが可能と
なる。
【0018】しかし、この方法にはオペレータが辞書登
録を手作業で行う必要があり、結果として文書効率が悪
くなるという問題点がある。
【0019】
【発明が解決しようとする課題】この様に、従来におけ
る機械翻訳システムでは、標準辞書中の翻訳規則と、ユ
ーザ辞書や専門用語辞書中の翻訳規則(訳語定義)間の
規則の適用の制御が困難であり、本来は標準辞書中の翻
訳規則のみを適用することが適切な場合にもユーザ辞書
や専門用語辞書の翻訳規則(訳語定義)が適用されて不
適切な訳文が出力されるという問題点があった。
【0020】また、従来のシステムでは専門知識や対象
言語の知識がないユーザは効果的に機械翻訳システムを
使って翻訳を行うことができないという欠点があった。
【0021】更に、従来の文書編集装置では誤字の置換
候補を作成するための情報があらかじめ辞書に入ってい
ない場合には辞書登録をオペレータが手作業で行わなけ
ればならず結果として文書編集効率を悪化させるという
問題点があった。
【0022】この発明はこのような従来の課題を解決す
るためになされたもので、その第1の目的は、翻訳規則
の適用の優先度を制御し得る機械翻訳システムを提供す
ることである。また、第2の目的は、専門知識や対象言
語の知識のないユーザでも簡単かつ効果的に利用するこ
とができる機械翻訳システムを提供することである。更
に、第3の目的は、オペレータの編集操作の簡略化を図
ることができる文書編集装置を提供することである。
【0023】
【課題を解決するための手段】上記目的を達成するた
め、本願第1の発明では、翻訳処理に使用する知識情報
を収容した標準辞書部と、ユーザ辞書部ないしは専門用
語辞書部からなる翻訳辞書部と、翻訳辞書部中の標準辞
書部とユーザ辞書部あるいは専門用語辞書部中の翻訳規
則を制御する翻訳規則制御部とを備え、与えられる第一
言語の文章を第二言語の文章に翻訳する機械翻訳装置に
おいて、前記翻訳辞書部は、本翻訳辞書不中の各翻訳規
則について、ユーザ辞書あるいは専門用語辞書に同一見
出し語が登録されている場合ユーザ辞書ないし専門用語
辞書中の翻訳規則よりも優先させるか否かの情報を持
ち、前記翻訳規則制御部は、この情報に基づいて適用規
則を決定する手段を有することが特徴である。
【0024】また、本願第2の発明では、翻訳処理に使
用する知識情報を収容した標準辞書部と、ユーザ辞書部
ないしは専門用語辞書部からなる翻訳辞書部と、翻訳辞
書部中の標準辞書部とユーザ辞書部あるいは専門用語辞
書部中の翻訳規則を制御する翻訳規則を制御する翻訳規
則制御部とを備え、与えられる第一言語の文章を第二言
語の文章に翻訳する機械翻訳装置において、前記標準辞
書部は、2単語以上からなる第一言語の語句に1単語の
第二言語の訳語を当てる翻訳規則(タイプ1)、当該原
語単語の生起する文脈を共起する語句の表層文字列のレ
ベルまで限定して訳語を当てる翻訳規則(タイプ2)、
当該原語単語の生起する文脈を当該単語そのものの素性
および共起する語句の表層文字列以外の素性のレベルま
で限定して訳語を当てる翻訳規則(タイプ3)、当該原
語単語の生起する文脈を構文のレベルまで限定して訳語
を当てる翻訳規則(タイプ4)、これら以外のレベルの
翻訳規則(訳語の定義のみも含む)(タイプ5)等のレ
ベルの異なる翻訳規則を有し、前記翻訳規則制御部に、
前記標準辞書部中のどのタイプの翻訳規則について前記
ユーザ辞書部あるいは前記専門用語辞書中の翻訳規則よ
りも優先して適用させたいかをユーザが適宜指定できる
ための優先度指定部を備えたことを特徴とする。なお、
上記した5つのタイプは具体的な例であり、本発明はこ
れに限定されるものではない。
【0025】本発明では、翻訳処理に使用する知識情報
を収容した標準辞書部と、ユーザ辞書部ないしは専門用
語辞書部からなる翻訳辞書部と、翻訳辞書部中の標準辞
書部とユーザ辞書部あるいは専門用語辞書部中の翻訳規
則を制御する翻訳規則制御部とを備え、与えられる第一
言語の文章を第二言語の文章に翻訳する機械翻訳装置に
おいて、前記標準辞書部は、2単語以上からなる第一言
語の語句に1単語の第二言語の訳語を当てる翻訳規則
(タイプ1)、当該原語単語の生起する文脈を共起する
語句の表層文字列のレベルまで限定して訳語を当てる翻
訳規則(タイプ2)、当該原語単語の生起する文脈を当
該単語そのものの素性および共起する語句の表層文字列
以外の素性のレベルまで限定して訳語を当てる翻訳規則
(タイプ3)、当該原語単語の生起する文脈を構文のレ
ベルまで限定して訳語を当てる翻訳規則(タイプ4)、
これら以外のレベルの翻訳規則(タイプ5)等のレベル
の異なる翻訳規則を有し、また、前記ユーザ辞書中の各
翻訳規則が前記標準辞書の翻訳規則のタイプ分けの観点
からみていずれのタイプであるかを自動判定する規則タ
イプ判定部を備え、前記翻訳規則制御部は優先度の高い
タイプの翻訳規則から順に適用することを特徴とする。
【0026】本願第4の発明では、入力部と、この入力
部から入力された翻訳対象となる原文を記憶する原文記
憶部と、翻訳処理に使用する知識情報を収容した知識情
報収容部と、この知識情報収容部の内容を用いて前記入
力された原文の翻訳処理を実行する翻訳部と、翻訳処理
の結果得られた訳文を記憶する訳文記憶部と、前記原文
および訳文を表示する表示部と、これらを制御すると共
に前記表示部で表示された原文または訳文の編集処理を
行う翻訳編集処理部と、原文文書毎に使用する辞書を判
定する辞書分野判定手段とを備え、前記辞書分野判定手
段によって判定される辞書の分野に基づいて辞書を自動
的に選択し、その辞書を用いて翻訳処理を行う手段を有
することを特徴とする。
【0027】本願第5の発明では、入力部と、この入力
部から入力された翻訳対象となる原文を記憶する原文記
憶部と、翻訳処理に使用する知識情報を収容した知識情
報収容部と、この知識情報収容部の内容を用いて前記入
力された原文の翻訳処理を実行する翻訳部と、翻訳処理
の結果得られた訳文を記憶する訳文記憶部と、前記原文
および訳文を表示する表示部と、これらを制御すると共
に前記表示部で表示された原文または訳文の編集処理を
行う翻訳編集処理部と、原文文書毎に使用する文法を判
定する文法判定手段とを備え、前記文法判定部によって
判定される文書の種類に基づいて文法項目の値を自動的
に選択し、その文法を用いて翻訳処理を行う手段を有す
ることを特徴とする。ここでいう文法とは、語の認識の
仕方や文の生成の仕方など、複数の選択肢を持ちかつ翻
訳結果に影響を及ぼし得る項目の値の集合である。文法
は、原文の種類とユーザのニーズ(言い替えれば、訳文
の種類)に依存する為、原文の種類が判定されると、そ
の文書の翻訳に使用できる文法は絞られる。
【0028】本願第6の発明では、文書情報を入力する
入力手段と、前記入力手段から入力された文書情報を記
憶する記憶手段と、前記文書情報を表示する表示手段
と、前記文書情報に対し編集を行う編集手段とを備えた
文書編集装置において、複数の単語とその単語に対し置
換を行う情報を登録した辞書と、前記記憶手段に記憶さ
れた文書情報と前記編集手段により編集された文書情報
との変更部分を抽出する文書抽出手段と、前記文書情報
抽出手段により抽出された変更部分に対して解析を行う
解析手段と、前記解析手段により解析された文書情報が
前記辞書に登録可能であるかを判別する文書情報判別手
段とを備えたことを特徴とする。
【0029】
【作用】上述の如く構成された本願第1の発明では、翻
訳辞書部中の標準辞書部の各翻訳規則に、例えば標準辞
書中の各規則がどのようなタイプの規則であるかに注目
して、ユーザ辞書や専門用語辞書に同じ見出し語の翻訳
規則があった場合どちらの規則を優先するかの情報を記
述しており、与えられた第一言語の入力文に対して適用
する翻訳規則を決定する際に、複数の辞書に入力文中に
現れる語(句)に対する翻訳規則(訳語定義)が存在す
る場合には、翻訳規則制御部が、標準辞書内の前記優先
・非優先の情報を参照して適用すべき規則を制御する。
この結果、並列する翻訳規則の優先度制御が簡単にな
り、文章全体として、望ましい訳文が出力されることに
なる。
【0030】また、本願第2の発明によれば、翻訳辞書
中の標準辞書部に記述されている、2単語以上からなる
第一言語の語(句)に1単語の第二言語の訳語を当てる
翻訳規則(タイプ1)、見出し語単語に共起する語句の
表層文字列のレベルまで限定して訳語を当てる翻訳規則
(タイプ2)、見出し語単語そのものの素性および共起
する語句の表層文字列以外の素性のレベルまで限定して
訳語を当てる翻訳規則(タイプ3)、見出し語単語の生
起する文脈を構文のレベルまで限定して訳語を当てる翻
訳規則(タイプ4)、これら以外のレベルの翻訳規則
(訳語の定義のみも含む)(タイプ5)について、どの
タイプの翻訳規則をユーザ辞書あるいは専門用語辞書の
翻訳規則(訳語定義)よりも優先して適用するかを、ユ
ーザが適宜優先度指定部より指定できる。標準辞書中の
各翻訳規則のタイプのくべつについては、タイプの別を
各規則にマーキングするなど情報化しておくか、あるい
は、翻訳規則制御部が、適用する翻訳規則を決定する際
に当該翻訳規則のシンタックス(構造)からタイプを検
知する。この結果と優先部指定部で指定された内容を考
慮して、翻訳規則制御部が適用すべき規則を決定する。
【0031】本願第3の発明によれば、翻訳辞書中の標
準辞書部には、例えば、2単語以上からなる第一言語の
語(句)に1単語の第二言語の訳語を当てる翻訳規則
(タイプ1)、見出し語単語に共起する語句の表層文字
列のレベルまで限定して訳語を当てる翻訳規則(タイプ
2)、見出し語単語そのものの素性および共起する語句
の表層文字列以外の素性のレベルまで限定して訳語を当
てる翻訳規則(タイプ3)、見出し語単語の生起する文
脈を構文のレベルまで限定して訳語を当てる翻訳規則
(タイプ4)、これら以外のレベルの翻訳規則(訳語の
定義のみも含む)(タイプ5)などの異なるレベルの翻
訳規則が記述されており、このタイプ分けの観点からみ
て、ユーザ辞書・専門用語辞書中の各翻訳規則につい
て、規則タイプ判定部がこれらのシンタックス(構造)
からいずれのタイプであるかを自動判定する。標準辞書
中の各翻訳規則のタイプの区別については、タイプの別
を各規則にマーキングするなど情報化しておくか、ある
いは、翻訳規則制御部が、適用する翻訳規則を決定する
際に当該翻訳規則のシンタックス(構造)からタイプを
検知する。この判定結果をもとに、規則タイプ判定部が
適用の優先度を決定し、実際に適用する規則を決定す
る。この結果、ユーザによる指定がなくても、自動的に
優先度が高いと推定される規則を選定するため、望まし
い訳文を得ることができる。
【0032】本願第4の発明によれば、翻訳が起動され
ると、辞書判定部は自動的に文書の分野を判定しそれに
合った分野の辞書を設定するので、最適の辞書を翻訳処
理に用いることができる。
【0033】本願第5の発明によれば、翻訳が起動され
ると、文法判定部は自動的に文書の種類を判定しそれに
合った文法項目の値を設定するので、文書の特徴に対応
した文法を翻訳処理に用いることができる。
【0034】また、前記表示部は、前記入力原文に対し
て設定された辞書分野や文法を明示できるものであり、
前記入力部は、設定された辞書分野や文法が訂正される
場合においてオペレータによって使用されるものであ
る。
【0035】翻訳処理部は原文記憶部から一文ずつ翻訳
部へ送る。翻訳部はこの原文を設定されている辞書や文
法に従って翻訳し、翻訳編集処理部はこの翻訳された訳
文を訳文記憶部に書き込む。上記処理を繰り返し一文ず
つ翻訳処理が進められる。
【0036】本願第6の発明によれば、記憶されている
文書情報と編集された後の文書情報との間に変更部分が
抽出された場合、抽出された文書情報にたいして解析を
行いその解析された文書情報が辞書に登録可能であるか
の判定を行い、登録可能である文書情報に対しては辞書
の登録を行う。
【0037】また、そのままの形では辞書登録不可能な
文書情報に対しても辞書登録可能な形に変換することに
より辞書登録を行う。
【0038】
【実施例】以下、本発明の実施例を図面を用いて説明す
る。最初に、請求項1に記載の機械翻訳装置に係る第1
実施例を説明する。本発明の機械翻訳装置では、第一言
語のデータを入力するための入力部と、標準辞書、ユー
ザ辞書、専門用語辞書、解析文法、生成文法、形態素生
成文法からなる、翻訳に必要な辞書データ・文法を記録
する翻訳辞書部と、前記入力部より入力された第一言語
のデータを前記辞書データ・文法を参照して第二言語の
データに翻訳する翻訳部と、この翻訳部により得られた
第二言語のデータを出力するための出力部とを備える。
そして、前記翻訳部は、前記翻訳辞書部中のどの翻訳規
則を適用するかを制御する翻訳規則制御部を備え、前記
標準辞書、ユーザ辞書、専門用語辞書に同一項目の見出
し語がある場合に、どの辞書の翻訳規則(訳語定義)を
適用するかを制御する。
【0039】図1は第1実施例のブロック図を示す。図
1において、1は入力部、2は表示部、3は文書記録
部、4は翻訳辞書部、5は翻訳部、6は翻訳規則制御
部、7は翻訳制御部である。
【0040】これらのうち、前記入力部1は翻訳制御部
7に対し、翻訳対象となる原文(この場合、日本語文)
の入力や各種コマンドの入力を行うためのもので、通
常、キーボードなどが使用される。また、原文の入力に
ついてはOCR(光学的文字読取り装置)などによる入
力も考えられる。
【0041】表示部2は、入力部1より入力した日本語
文や、翻訳部5により訳出された英語文を翻訳制御部7
の制御のもとに表示するためのもので、CRTディスプ
レイやプラズマディスプレイ、液晶ディスプレイなどが
使用できる。
【0042】文書記録部3は、翻訳制御部7の制御のも
とに第一言語と第二言語の文書それぞれを記録すると共
に、読み出すことができるもので日英機械翻訳システム
を例にとると、第一言語である日本語文と第二言語であ
る英語文のそれぞれのデータを独立して記録できるほ
か、日本語文のデータとその翻訳結果としての英語文の
データを対応づけて記録することが可能である。
【0043】翻訳辞書部4は、標準辞書4a、ユーザ辞
書4b、専門用語辞書4c、解析文法4d、生成文法4
e、形態素生成文法4fからなる。標準辞書4a、ユー
ザ辞書4b、専門用語辞書4cはいずれも、第一言語で
ある日本語の単語・熟語と第二言語である英語の訳出表
現とを対応づけて記録した語彙辞書(翻訳規則)などの
情報を記録するものでらに、見出し語、品詞、活用形、
その他文法機能を日本語と英語の両方で情報として記録
できるものである。そして、標準辞書4a中の各翻訳規
則には、当該見出し語がユーザ辞書4bや専門用語辞書
4cにもある場合に、4b・4cの辞書の翻訳規則(訳
語定義)よりも優先すべきかどうかがマーキングしてあ
る。すなわち優先すべきものにのみ優先マーカが付され
ている。
【0044】表1は、本発明の一実施例で用いる標準辞
書4a中の翻訳規則の記述例を示す図である。
【0045】
【表1】 見出し語「引く」(動詞)に翻訳規制が2つ記述されて
いる。規則(1)は「(〜が)〜線を引く」という日本
語表現を「〜draw〜」に翻訳するために用意されてい
る。一方(2)は「が格」を主語として、「を格」を目
的語として訳出し、その際の訳語を当てているだけで、
他の条件はない。この例では、(1)についてのみ、規
則番号の後に「*」(優先マーカ)が付されている。つ
まり、(1)の規則についてはユーザ辞書・専門用語辞
書の規則(訳語定義)よりも優先させたいが、(2)に
ついてはユーザ辞書・専門用語辞書の規則(訳語定義)
を優先することを意味する。
【0046】翻訳部5は、翻訳制御部7の制御のもとに
翻訳辞書部4の情報を参照しながら、第一言語のデータ
である日本語文を第二言語のデータである英語文に翻訳
するものである。これは従来の翻訳部に加えて、翻訳規
則制御部6を備えている。
【0047】翻訳規則制御部6は、入力文中に翻訳辞書
部4の標準辞書4a以外にユーザ辞書4bあるいは専門
用語辞書4cにも登録されている語句が存在する場合
に、上記の図2に示される標準辞書中の4aの前記優先
マーカの有無をチェックし、どの辞書の翻訳規則(訳語
定義)を適用するかを決定する。翻訳制御部7は、本装
置の全体の制御を司るものである。
【0048】図2は、前記入力部1のキー配列の一例を
示す図である。入力部lは数字や記号を含む和文・英文
入力用の文字キー301に加え、ファンクションキーと
して翻訳指示キー301、編集キー303、機能キー3
04、カーソルキー305、および他のキーを備えてい
る。
【0049】図3は、表示部2の画面レイアウトの一例
を示す図である。入力した原文は画面左側の原文表示領
域401に表示される。翻訳処理の結果得られた訳文は
画面右側の訳文表示領域402に表示される。また、画
面上部の編集領域403は各種編集に必要な情報を表示
するために用いることができる。
【0050】図4は、翻訳制御部7による対話翻訳処理
の流れの一例を示すフローチャートである。対話翻訳処
理では原文の入力と対応する訳文の編集作業をオペレー
タが適宜に行うことができる。翻訳制御部4は、ステッ
プS1〜S5において、入力部1からなんらかのキー入
力があるか、あるいは翻訳部5から翻訳完了信号を受け
ているかを監視しており、なんらかのキー入力があった
場合にそれに対応する処理を行う。
【0051】オペレータが機能キーのいずれかを操作し
た場合、ステップS5によりこれを検知し、ステップS
12でその機能キーに対応した処理を行う。
【0052】オペレータが編集キーのいずれかを操作し
た場合、ステップS4によりこれを検知し、ステップS
11でその編集キーに対応した処理を行う。
【0053】オペレータがカーソルキー305あるいは
その他の制御キーを操作した場合、ステップS1〜S5
を介してステップS13でキー操作に対応したカーソル
の移動のための処理やその他の処理を行う。
【0054】オペレータが文字キーを操作した原文を入
力すると、ステップS3で各文字キーが検知された後、
対応する文字コードが順次翻訳制御部7内の(図示しな
い)入力バッファにセットされる(ステップS8)。こ
の入力原文は表示部2の原文領域に表示される(ステッ
プS9)。オペレータが任意の時点で、例えば一文の入
力が終了した時、翻訳指示キー302を打鍵すると、ス
テップS2でこのキーが検知され、翻訳制御部7は翻訳
部5に対し入力バッファ内の原文を供給し、翻訳処理の
開始を指示する(ステップS10)。なお、原文入力の
途中で訂正・挿入・削除などの入力編集が必要な場合
は、カーソルキーにより所望の編集箇所へカーソルを移
動した後、挿入キー、削除キーなどの編集キー303を
用いてこれを行うことができる。ステップS10につい
ては後に詳しく説明する。
【0055】翻訳制御部7はステップS1で上記翻訳完
了信号を検知すると、ステップS7に進み、翻訳部5か
ら得られた訳文候補および補助情報を表示部2に送り、
訳文を表示させる(ステップS7)。表示部2は、上記
訳文候補を訳文表示領域内において入力原文(画面左
側)と対応する位置に表示するとともに、補助情報があ
る場合には、その語を太字にしたり反転表示することに
よりオペレータがその旨を識別できるようにしている。
【0056】この状態から編集キーの打鍵があると、翻
訳制御部7はステップS4でこれを検知し、この時、カ
ーソルで指示されている語(句)に対して、各キーに対
応した編集処理を行う(ステップS11)。
【0057】したがって、オペレータは、原文の入力と
その訳文の編集処理とを適宜おこないながら対話的に翻
訳文を得ることができる。
【0058】次に、翻訳部5において、翻訳規制制御部
6が適用する規則を制御しながら訳文を得る過程につい
て説明する。
【0059】図5は翻訳部5における翻訳処理の流れを
示すフローチャートである。
【0060】まず、入力文に対して、標準辞書4a、ユ
ーザ辞書4b、専門用語辞書4c中の活用・変化に関す
る情報を用いて、語尾などに変化があればその原形(基
本形)に変換しながら、見出し語の検索を行い、入力文
を構成する単語の品詞や他の文法情報を得る(S2
1)。解析制御部(S22)は、訳文の候補を構文解析
部に送る処理を行う。構文解析部(S23)は、解析文
法4dを使って入力文の構文を解析し、日本語文の構造
を生成する。解析に失敗した時は、解析制御部に戻る。
【0061】構造変換・訳語決定部(S24)は、標準
辞書4a、ユーザ辞書4b、専門用語辞書4c中の翻訳
規則(訳語定義)をもとに、翻訳規則制御部6が適用す
る翻訳規則を決定して、第一言語の構造を第二言語の構
造へ変換し訳語の設定を行う。この処理については、後
に詳しく説明する。棄却された場合は、構文制御部に戻
る。
【0062】構文生成部(S25)は、生成文法4eに
したがって、英語の構造から英語の語順を決定し単語列
に変換する。形態素生成部(S26)は、形態素生成文
法4fにより単語の語形などを変化させて翻訳文を完成
させる。以上のそれぞれの処理部は、処理を始めた時点
で信号を翻訳制御部7に出力する。
【0063】さらに、前記構造変換・訳語決定部(S2
4)での適用する翻訳規則(訳語定義)の決定の過程に
ついて詳しく説明する。構造変換・訳語決定部では、構
文解析部より日本語の構造が渡されると、その構造の構
成要素の各々について、翻訳規則制御部6が適用する翻
訳規則(訳語定義)を決定し、それにしたがって構造変
換・訳語決定をする。図6,7,8は、一つの構成要素
に対する翻訳規則制御部6の処理の流れを示すフローチ
ャートである。
【0064】まず、当該構成要素の見出し語が標準辞書
4a以外にユーザ辞書4bにも登録されているかをチェ
ックする(S31)。続いて、同様に専門用語辞書4c
に登録されているかをチェックする(S32,S3
3)。次に、上記のチェックの結果に関係なく、いずれ
の場合も標準辞書4aの登録語に記述されている翻訳規
則群に対して、いずれの規則が当該日本語構造に適用可
能であるかをチェックし、適用候補となる規則を決定す
る(それぞれ、S34,S35,S36,S37)。
【0065】その後、標準辞書4a以外に登録語がない
場合は(S44)、S37で決定した標準辞書4a中の
翻訳規則に基づき、日本語構造に構造変換を施し訳語を
設定して終了する。それ以外の場合は、それぞれS3
8,S39,S40にて、直前に決定した標準辞書4a
の適用候補の翻訳規則に、表1で示したような優先マー
カがあるかどうかをチェックする。いずれの場合も、標
準辞書4aの適用候補に優先マーカがある場合は、S4
4にて、標準辞書4aの当該候補の翻訳規制に基づき、
日本語構造に構造変換を施し訳語を設定して終了する。
ユーザ辞書4bには登録語があるが、専門用語辞書4c
には登録語がない場合で、標準辞書4aの適用候補規則
に優先マーカがない時は、次の処理として、ユーザ辞書
4bの登録語に記述されている翻訳規則群(訳語定義)
に対して、いずれの規則が当該日本語構造に適用可能で
あるかをチェックし、適用候補となる規則を決定する
(S41)。続いて、S45にて、そのユーザ辞書4b
の規則は構造変換を伴うものであるかをチェックする。
構造変換を伴う場合は、ユーザ辞書4bの当該適用候補
の翻訳規則に基づき、日本語構造に構造変換を施し訳語
を設定して(S49)終了する。一方、構造変換を伴わ
ない場合は、前過程で決定した標準辞書4aの適用候補
の翻訳規則に基づき、日本語構造に構造変換を施し、訳
語としてはユーザ辞書4bの適用候補の訳語定義の内容
を設定し(S52)終了する。
【0066】ユーザ辞書4bには登録語がないが、専門
用語辞書4cには登録語がある場合で、標準辞書4aの
適用候補規則に優先マーカがない時(S40で「な
し」)は、次の処理として、専門用語4cの登録語に記
述されている翻訳規則群(訳語定義)に対して、いずれ
の規則が当該日本語構造に適用可能であるかをチェック
し、適用候補となる規則を決定する(S43)。続いて
S47にて、その専門用語4cの規則は構造変換を伴う
ものであるかをチェックする。構造変換を伴う場合は、
専門用語辞書4cの当該適用候補の翻訳規則に基づき、
日本語構造に構造変換を施し訳語を設定して(S50)
終了する。一方、構造変換を伴わない場合は、前過程で
決定した標準辞書4aの適用候補の翻訳規則に基づき、
日本語構造に構造変換を施し、訳語としては専門用語辞
書4cの適用候補の訳語定義の内容を設定し(S54)
終了する。また、優先マーカがある場合(S40で「あ
り」)には標準辞書の規則に基づいて、構造変換、訳語
の決定を行なう(S44)。
【0067】ユーザ辞書4bにも専門用語4cにも登録
語がある場合で、標準辞書4aの適用候補規則に優先マ
ーカがない時は、次の処理として、ユーザ辞書4bの登
録語に記述されている翻訳規則群(訳語定義)に対し
て、いずれの規則が当該日本語構造に適用可能であるか
をチェックし、適用候補となる規則を決定する(S4
2)。その後、同様に専門用語辞書4cの登録語につい
ても適用候補となる規則を決定する(S46)。
【0068】続いてS48にて、そのユーザ辞書4bの
規則は構造変換を伴うものであるかをチェックする。構
造変換を伴う場合は、ユーザ辞書4bの当該適用候補の
翻訳規則に基づき、日本語構造に構造変換を施し訳語を
決定して(S49)終了する。一方ユーザ辞書4bの適
用候補規則が構造変換を伴わない場合は、S46で決定
した専門用語4cの規則は構造変換を伴うものであるか
をチェックする。構造変換を伴う場合は、専門用語辞書
4cの当該適用候補の翻訳規則に基づき、日本語構造に
構造変換を施し、訳語としてはユーザ辞書4bの登録語
に記述されている訳語定義の内容の末尾に専門用語辞書
4cの当該適用候補規則が定義している訳語群を追加し
たものを設定して(S53)終了する。専門用語辞書4
cの適用候補規則が構造変換を伴わない場合は、S52
にて、前過程で決定した標準辞書4aの適用候補の翻訳
規則に基づき、日本語構造に構造変換を施し、訳語とし
てはユーザ辞書4cの適用候補の訳語定義の内容を設定
して(S52)終了する。
【0069】この結果、表1に示したように標準辞書の
「引く」のに項目の中の「〜線を引く」に対応した規則
に優先マーカが付加されていれば、ユーザ辞書に訳語と
して「attract 」を当てる「引く」の規則(訳語定義)
が存在しても、入力文「線を引く」から出力される訳文
は「attract a line」となることはなく、適切に「draw
a line 」となる。同様に、「〜の電源を投入する」を
「switch on 」と訳出するための「投入する」の翻訳規
則に優先マーカを付加しておけば、ユーザ辞書の「投入
する」の項目に訳語として「invest」を当てる規則(訳
語定義)が記述されていても、「計算機の電源を投入す
る」という入力文に対する訳文は「invest a computer
」となることはなく、適切に「switch on 」となる。
【0070】以上述べたように、本実施例によれば、標
準辞書以外にユーザ辞書や専門用語辞書にも同一項目が
登録されており、それぞれ異なった翻訳規則(訳語定
義)が記述されている場合に、標準辞書中の翻訳規則に
付加されている優先マーカを翻訳規則制御部6がチェッ
クし、原文により適用すべき翻訳規則を決定するので、
これまでのように一方的に(盲目的に)ユーザ辞書や専
門用語辞書の内容を適用することなく、標準辞書中の本
来適用すべき強い規則(生起する文脈を強く固定して構
造変換・訳語設定をる行うような規則)を有効に翻訳に
生かすことができる。
【0071】本実施例では、最終的に適用すべき(優先
度の最も高い)翻訳規則(訳語定義)が構造変換を伴わ
ないものである場合は、次に優先度の高い規則の構造変
換を適用し、訳語として最も優先度の高い規則の定義内
容を設定する、という手段をとっているが、最優先規則
が構造変換を伴わない時のために、品詞ごとにデフォル
トの構造変換規則を用意しておき、それを適用するよう
に構成することも可能である。また、訳語の設定につい
ても、本実施例の手段に限らず、規則の優先度順にした
がって、それぞれに定義されている訳語群を順にマージ
する方法も有効である。
【0072】さらに、本実施例では、標準辞書の翻訳規
則単位に優先マーカを付与する様式をとっているが、一
規則に複数の訳語を設定する規則がある場合や、辞書の
記述内容が訳語の定義のみからなる場合には、訳語ごと
に優先マーカを付与する様式をとることも可能である。
【0073】次に、請求項2に記載の機械翻訳装置に係
る第2実施例として、ユーザ辞書・専門用語辞書の翻訳
規則を標準辞書のどのタイプの規則より優先するかを、
翻訳する文書ごと、あるいは、見出し語ごと、あるいは
定義している訳語ごとにユーザが適宜指定できる機械翻
訳装置の実施例について説明する。本発明の機械翻訳装
置では、第一言語のデータを入力するための入力部と、
標準辞書、ユーザ辞書、専門用語辞書、解析文法、生成
文法、形態素生成文法からなる、翻訳に必要な辞書デー
タや文法を記録する翻訳辞書部と、前記入力部より入力
された第一言語のデータを前記辞書データ・文法を参照
して第二言語のデータに翻訳する翻訳部と、この翻訳部
により得られた第二言語のデータを出力するための出力
部と、標準辞書・ユーザ辞書・専門用語辞書の登録語が
重なった場合に、どの翻訳規則を優先するかについて
の、前記入力部からのユーザの指定を司る優先度指定部
とを備える。そして、前記翻訳部は、前記優先度指定部
が司るユーザ指定の内容にしたがって適用する翻訳規則
(訳語定義)を制御する翻訳規則制御部を有する。
【0074】図9は、第2実施例を示すブロック図であ
る。同図において、81は入力部、82は表示部、83
は文書記録部、84は翻訳辞書部書、85は翻訳部、8
6は翻訳規則制御部、87は翻訳制御部、88は優先度
指定部である。
【0075】入力部81は、図1を用いて説明した入力
部1の機能に加えて、優先度指定部88が司る、標準辞
書・ユーザ辞書・専門用語辞書の登録語が重なった場合
の適用する適用規則(訳語定義)についてのユーザの指
定を受付け、優先度指定部88にその指定内容を送る。
【0076】表示部82、文書記録部83、翻訳辞書部
書84、翻訳部85の機能については、図1を用いて説
明した表示部2、文書記録部3、翻訳辞書部書4、翻訳
部5の機能と同じである。
【0077】優先度指定部88は、前記入力部81より
送られるユーザ指定の内容が翻訳する文書ごとのもので
ある場合は、前記翻訳制御部87を介して前記翻訳部8
5へその内容を送り、見出し語ごとあるいは訳語ごとの
ものである場合は、その内容に応じて前記翻訳辞書部4
の各辞書中へ優先情報を付加する。翻訳規則制御部86
は、入力文中に翻訳辞書部84の標準辞書84a以外に
ユーザ辞書84bあるいは専門用語辞書84cにも登録
されている語句が存在する場合に、前記優先度指定部8
8より前記翻訳部85へ送られる文書ごとの優先情報あ
るいは前記翻訳辞書部84に前記優先度指定部88が付
加した見出し語ごとおよび訳語ごとの優先情報を参照し
て、どの辞書の翻訳規則(訳語定義)を適用するかを決
定する。図10は、前記入力部81のキー配列の一例を
示す図である。入力部81は、数字や記号を含む和文・
英文入力用の文字キー901に加え、ファンクションキ
ーとして翻訳指示キー902、編集キー903、機能キ
ー904、カーソルキー905、優先度指定キー90
6、および他のキーを備えている。
【0078】本実施例の表示部82は、画面レイアウト
の一例として図3に示した画面レイアウトと同じものを
一例に持つ。 図11は、翻訳制御部87による対話翻
訳処理の流れの一例を示すフローチャートである。ここ
での処理の流れは、ステップS66での優先度指定キー
906の受付けとステップ73での優先度指定処理を除
けば、請求項1に記載の機械翻訳装置の実施例として図
4に示した翻訳制御部7による対話翻訳処理の流れと動
きは同じである。
【0079】ステップS61〜S65を介して、オペレ
ータがステップS66で優先度指定キーを操作した場合
には、ステップS73において優先度指定処理を行う。
これについては、後に詳しく説明する。
【0080】ステップS70翻訳処理については、図5
を用いて説明した内容と、その中の構造変換・訳語決定
過程の詳細な処理内容を除けば同じものである。本実施
例の構造変換・訳語決定過程については、後に詳しく説
明する。
【0081】図12は、優先度指定部88の司る、図1
1のステップS73における優先度指定処理の流れの一
例を示すフローチャートである。まず最初に、これから
どの辞書(ユーザ辞書であるか専門辞書であるか)につ
いて優先度指定をするのかをユーザに指定させる(S8
1)。続いて、その優先内容は、翻訳する文書全体に渡
って一様に適用するものであるか、ある見出し語だけに
関するものであるか、あるいはある見出し語の内のある
訳語に関するものであるかをユーザに指定させる(S8
2)。
【0082】次に、文書ごとの指定であれば文書名を、
見出し語ごとの指定であれば見出し語を、訳語ごとの指
定であれば見出し語と訳語をそれぞれユーザに指定させ
る(それぞれ順にS83,S84,S85)。
【0083】その後、いずれの場合も、表2に示すよう
な優先内容についての選択肢を表示部82に呈示し(S
86,S87,S88)、ユーザの選択した指定内容を
受理する(S89,S90,S91)。
【0084】
【表2】 すなわち、標準辞書中のどのタイプの翻訳規則よりも優
先させるかについてのユーザの指定を受理する。文書ご
との指定の場合は、ステップS92にて、指定辞書名、
文書名、優先指定内容を組にして、優先指定ファイルに
記録して終了する。表3は優先指定ファイルの記述例を
示す。
【0085】
【表3】 ここでは、ユーザ辞書「sousa 」、文書名「chapter 1
」、優先指定内容「タイプ2〜タイプ5」が指定して
ある。見出し語ごとの指定の場合は、ステップS93に
て、指定辞書の指定見出し語に優先情報を付加して終了
する。表4は、ユーザ辞書の見出し語「引く」につい
て、「タイプ3〜タイプ5」に優先情報が付加されてい
る例を示す。
【0086】
【表4】 この例では、構造変換を伴う翻訳規則は記述されておら
ず、訳語定義のみからなる。訳語ごとの指定の場合は、
ステップS94にて、指定辞書の指定見出し語の指定訳
語に優先情報を付加して終了する。表5は、ユーザ辞書
の「引く」の訳語「attrac」について、「タイプ3〜タ
イプ5」に優先するという優先情報が付加されている例
を示す。
【0087】
【表5】 この例では、構造変換を伴う翻訳規則は記述されておら
ず、訳語定義のみからなり、2訳語が定義されている
内、最初の訳語に優先情報が付加されている。訳語の後
の括弧内のカンマの後の文字列が優先情報である。
【0088】次に、翻訳部85の翻訳処理の中の構造変
換・訳語決定過程において、入力文中の語(句)に対し
て複数の辞書に翻訳規則(訳語定義)がある場合に、翻
訳規則制御部86が前記優先度指定部88の処理結果を
参照しながら適用する翻訳規則(訳語定義)を決定する
処理について説明する。ここでは、標準辞書の各翻訳規
則には、どのタイプに属する規則であるかが情報として
付加されている。表6に標準辞書の記述例を示す。
【0089】
【表6】 規則番号(1)、(2)の後の「T1」(タイプ1)、
「T2」(タイプ2)、「T5」(タイプ5)などが規
則の情報にあたる。
【0090】図13,14は、構文解析部より渡される
日本語構造を構成する一つの構成要素に対する翻訳規則
制御部88の処理の流れを示すフローチャートである。
【0091】まず、当該構成要素の見出し語が標準辞書
84a以外にユーザ辞書84bにも登録されているかを
チェックする(S101)。続いて、同様に専門用語辞
書84cに登録されているかをチェックする(S10
2,S103)。次に、それぞれの結果に応じて、各辞
書に登録されている当該構成要素の見出し語の翻訳規則
群について、辞書ごとにいずれの規則が当該日本語構造
に適用可能であるかをチェックし、適用候補となる規則
を決定する(それぞれ、S104,S105,S10
6,S107)。
【0092】この後で、それぞれの辞書の組み合わせご
とに、それに応じた適用規則の優先度判定処理と、日本
語構造に対して判定の結果決定された翻訳規則(訳語定
義)の適用処理を行って(それぞれ、S108,S10
9,S110)終了する。これらの詳しい処理内容につ
いては、後に説明する。標準84a以外に登録語がない
場合は、ステップS107で決定された標準辞書84a
の翻訳規則(訳語定義)を適用して終了する。
【0093】図15は、図14中のステップS108に
て、標準辞書84aとユーザ辞書84bに登録語があっ
た場合に適用する翻訳規則(訳語定義)を決定し、適用
を実行する処理の流れを示すフローチャートである。
【0094】まず最初に、ユーザ辞書84bの適用規則
(訳語定義)の定義している訳語に優先情報があるかを
チェックする(S121)。ない場合には、続いて、ユ
ーザ辞書84bの当該見出し語に優先情報があるかをチ
ェックする(S122)。
【0095】上記のいずれかに優先情報があれば、その
優先情報の示す内容と、標準辞書84aの適用候補規則
の規則タイプ情報と照らしあわせ、どちらの辞書の規則
を適用すべきであるのかを判定する(S123)。
【0096】ステップS123の判定の結果、ユーザ辞
書84bの規則の方が優先されるべきと判断されれば、
ユーザ辞書84bの規則が構造変換を伴うものであるか
をチェックする(S124)。構造変換を伴うものであ
れば、ステップS127にて、ユーザ辞書84bの適用
候補の翻訳規則に基づき、日本語構造に構造変換を施し
訳語を設定して終了する。構造変換を伴わないものであ
れば、ステップ126にて、標準辞書84aの適用候補
の翻訳規則に基づき日本語構造に構造変換を施し、訳語
としてはユーザ辞書84bの適用候補の訳語定義の内容
を設定して終了する。
【0097】ステップ123の判定の結果、標準辞書8
4aの規則の方が優先されるべきと判断されれば、ステ
ップS125に進み、翻訳する文書ごとの優先情報を記
述した優先指定ファイルの内容をチェックする。すなわ
ち、この内容と標準辞書84aの適用候補規則の規則タ
イプ情報と照らしあわせ、どちらの辞書の規則を適用す
べきであるのかを再判定する。再判定の結果、ユーザ辞
書84bの規則の方が優先されるべきと判断されれば、
以下、ステップS123にてユーザ辞書84bの規則の
方が優先されるべきと判断された場合の処理と同一の処
理を行い終了する。再判定の結果、標準辞書84aの規
則の方が優先されるべきと判断されれば、ステップ12
5にて、標準辞書84aの適用候補の翻訳規則に基づ
き、日本語構造に構造変換を施し訳語を設定して終了す
る。
【0098】図16,17は、図14中のステップ10
9にて、標準辞書84aとユーザ辞書84bと専門用語
辞書84cに登録語があった場合に適用する翻訳規則
(訳語定義)を決定し、適用を実行する処理の流れを示
すフローチャートである。
【0099】まず最初に、ユーザ辞書84bの適用候補
規則(訳語定義)の定義している訳語に優先情報がある
かをチェックする(S131)。ない場合には、続い
て、ユーザ辞書84bの当該見出し語に優先情報がある
かをチェックする(S132)。
【0100】上記のいずれかに優先情報があれば、その
優先情報の示す内容と、標準84aの適用候補規則の規
則タイプ情報と照らしあわせ、どちらの辞書の規則の方
が優先度が高いかを判定する(S133)。
【0101】ステップS133の判定の結果、ユーザ辞
書84bの規則の方が優先されるべきと判断されれば、
ステップS134に進み、ユーザ辞書84bの規則が構
造変換を伴うものであるかをチェックする。構造変換を
伴うものであれば、ステップS137にて、ユーザ辞書
84bの適用候補の翻訳規則に基づき、日本語構造に構
造変換を施し訳語を設定して終了する。構造変換を伴わ
ないものであれば、ステップS138にて、標準辞書8
4aの適用候補の翻訳規則に基づき日本語構造に構造変
換を施し、訳語としてはユーザ辞書84bの適用候補の
訳語定義の内容を設定して終了する。
【0102】ステップS133の判定の結果、標準辞書
84aの規則の方が優先されるべきと判断されれば、ス
テップS135以降で、今度は専門用語辞書84cとの
優先関係の判定処理を行う。
【0103】ステップS133の判定の結果、標準辞書
84aの規則の法が優先されるべきと判断されれば、ス
テップS144に進み、翻訳する文書ごとの優先情報を
記述した優先情報を記述した優先指定ファイルの内容を
チェックする。すなわち、この内容と標準辞書84aの
適用候補規則の規則タイプ情報を照らしあわせ、どちら
の辞書の規則を適用すべきであるのかを再判定する。再
判定の結果、ユーザ辞書84bの規則の方が優先される
べきと判断されれば、以下、ステップS133にてユー
ザ辞書84bの規則の方が優先されるべきと判断される
べきと判断された場合の処理と同一の処理を行い終了す
る。再判定の結果、標準辞書84aの規則の方が優先さ
れるべきと判断されれば、以下、ステップS135以降
で、ステップS133にて標準辞書84aの規則の方が
優先されるべきと判断された場合の処理と同一の専門用
語辞書84cとの優先関係の判定処理を行う。
【0104】これから、ステップS135以降の処理に
ついて説明する。まず、専門用語辞書84cの適用候補
規則(訳語定義)の定義している訳語に優先情報がある
かをチェックする(S135)。ない場合には、続い
て、専門用語辞書84cの当該見出し語に優先情報があ
るかをチェックする(S136)。
【0105】上記のいずれかに優先情報があれば、その
優先情報の示す内容と、標準84aの適用候補規則の規
則タイプ情報と照らしあわせ、どちらの辞書の規則を適
用すべきであるのかを判定する(S139)。
【0106】ステップS139の判定の結果、専門用語
辞書84cの規則の方が優先されるべきと判断されれ
ば、専門用語辞書84cの規則が構造変換を伴うもので
あるかをチェックする(S141)。構造変換を伴うも
のであれば、ステップS143にて、専門用語辞書84
cの適用候補の翻訳規則に基づき、日本語構造に構造変
換を施し訳語を設定して終了する。構造変換を伴わない
ものであれば、ステップS142にて、標準辞書84a
の適用候補の翻訳規則に基づき日本語構造に構造変換を
施し、訳語としては専門用語辞書84cの適用候補の訳
語定義の内容を設定して終了する。
【0107】ステップS139の判定の結果、標準辞書
84aの規則の方が優先されるべきと判断されれば、ス
テップS145に進み、翻訳する文書ごとの優先情報を
記述した優先指定ファイルの内容をチェックする。すな
わち、この内容と標準辞書84aの適用辞書84aの適
用候補規則の規則タイプ情報と照らしあわせ、どちらの
辞書の規則を適用すべきであるのかを再判定する。再判
定の結果、専門用語辞書84cの規則の方が優先される
べきと判断されれば、以下、ステップS139にて専門
用語辞書84cの規則の方が優先されるべきと判断され
た場合の処理と同一の処理を行い終了する。再判定の結
果、標準辞書84aの規則の方が優先されるべきと判断
されれば、ステップS145にて、標準辞書84aの適
用候補の翻訳規則に基づき、日本語構造に構造変換を施
し訳語を設定して終了する。
【0108】図14中のステップS110にて、標準辞
書84aと専門用語辞書84cに登録語があった場合に
適用する翻訳規則(訳語定義)を決定し、適用を実行す
る処理については、図15を用いて説明した、標準辞書
84aとユーザ辞書84bに登録語があった場合の処理
のユーザ辞書84bを専門用語辞書84cに置き換えて
みたものと全く同様である。
【0109】この結果、ユーザ辞書84bの登録語に表
4,表5に示したような優先情報が付加されていれば、
表6に示したような標準辞書84aの翻訳規則が記述さ
れている場合に、優先情報と標準辞書規則のタイプから
適切に適用すべき規則を決定できるので、「〜線を引
く」の訳文としては「attract a line」が出力されるこ
とはなく、適切に標準辞書84aのタイプ2の規則が適
用され「draw a line 」が出力される。同様に「計算機
の電源を投入する」に対しても、適切に標準辞書84a
のタイプ1の規則が適用され「switch on a computer」
が出力される。
【0110】以上述べたように、第2実施例によれば、
標準辞書以外にユーザ辞書や専門用語辞書にも同一項目
が登録されており、それぞれ異なった翻訳規則(訳語定
義)が記述されている場合に、ユーザが指定した、文書
ごと、見出し語ごと、訳語ごとの優先情報を翻訳規則制
御部6がチェックし、標準辞書のタイプと照らし合わ
せ、より優先度の高い翻訳規則を決定するので、これま
でのように一方的に(盲目的に)ユーザ辞書や専門用語
辞書の内容を適用することなく、それぞれの辞書にある
規則を有効に翻訳に生かすことができる。これは、ユー
ザ辞書・専門用語辞書の記述力を高めることにもつなが
る。
【0111】本実施例では、対話翻訳中にユーザに優先
情報を指定させる様式を示したが、翻訳中に行なわずに
独立に辞書編集作業の一貫としてユーザに優先情報指定
機能を提供する方法も有効である。また、文書ごとに指
定するモードにおいては、品詞ごとの指定という選択肢
を設けてもよい。
【0112】また、本実施例では、標準辞書84aの中
の翻訳規則にはあらかじめタイプ別情報が付加されてい
る場合を上げたが、これは適用時に、規則のシンタック
スから自動的に判定させる手法も可能である。
【0113】次に、請求項3に記載の機械翻訳装置に係
る第3実施例として、ユーザ辞書に記述されている翻訳
規則が標準辞書の規則のタイプ分けの観点からみてどの
規則タイプ群に属するかを自動判定し、2つの辞書に同
じ見出し語がある場合に、両者の規則のうち優先度の高
いものを適用して翻訳文をえる機械翻訳装置の例につい
て説明する。本発明の機械翻訳装置では、第一言語のデ
ータを入力するための入力部と、標準辞書、ユーザ辞
書、専門用語辞書、解析文法、生成文法、形態素生成文
法からなる、翻訳に必要な辞書データや文法を記録する
翻訳辞書部と、前記入力部より入力された第一言語のデ
ータを前記辞書データ・文法を参照して第二言語のデー
タに翻訳する翻訳部と、この翻訳部により得られた第二
言語のデータを出力するための出力部とを備える。そし
て、前記翻訳部は、従来の翻訳部に加えて、ユーザ辞書
の翻訳規則が標準辞書の規則のタイプ分けの観点からみ
て度の規則タイプ群に属するかを判定する規則タイプ判
定部と、前記規則タイプ判定部の判定内容にしたがって
適用する翻訳規則(訳語定義)を制御する翻訳規則制御
部を有する。
【0114】図18は、本発明の一実施例のブロック図
を示す。同図において、21は入力部、22は表示部、
23は文書記録部、24は翻訳辞書部書、25は、翻訳
部、26は規則タイプ判定部、27は翻訳規則制御部、
28は翻訳制御部である。
【0115】入力部21、表示部22、文書記録部2
3、翻訳辞書部書24、翻訳部25、翻訳制御部28の
機能については、請求項1に記載の機械翻訳装置の実施
例として、図1を用いて説明した入力部1、表示部2、
文書記録部3、翻訳辞書部書4、翻訳部5、翻訳制御部
7の機能と同じである。
【0116】規則タイプ判定部26は、翻訳辞書部24
のユーザ辞書24b中の翻訳規則が標準辞書24aの規
則のタイプ分けの観点からみてどのタイプ群に属するか
を、そのシンタックスから判定し、その結果を翻訳規則
制御部27へ送る。
【0117】翻訳規則制御部27は、入力文中に翻訳辞
書部24の標準辞書24a以外にユーザ辞書24bにも
登録されている語句が存在する場合に、前記規則タイプ
判定部26より送られるユーザ辞書24bの規則のタイ
プと標準辞書24aの規則のタイプと照らし合わせ、優
先度の高い規則を適用規則として決定する。
【0118】本実施例の入力部21は、図2で示した入
力部1のキー配列の一例と同じキー配列を一例に持つ。
【0119】本実施例の表示部82(図9)は、画面レ
イアウトの一例として、請求項1に記載の機械翻訳装置
の実施例として図3に示した画面レイアウトと同じもの
を一例にもつ。
【0120】本実施例の翻訳制御部28は、図4に示し
た請求項1に記載の機械翻訳装置の実施例の翻訳制御部
7による対話翻訳処理の流れの一例と同じ処理の流れを
一例に持つ。図4中のステップS10に相当する翻訳部
25の処理については、請求項1に記載の機械翻訳装置
の実施例として図5を用いて説明した内容と、その中の
構造変換・訳語決定過程の詳細な処理内容を除けば同じ
ものである。
【0121】以下、本実施例の構造変換・訳語決定過程
の処理において、規則タイプ判定部26と翻訳規則制御
部27が機能して適用すべき翻訳規則(訳語定義)を決
定して、日本語構造に構造変換を施し、訳語を設定する
処理について説明する。
【0122】本実施例の標準辞書の翻訳規則のタイプ分
けの基準は、<タイプ1>2単語以上からなる言語に1
単語の訳語を当てる翻訳規則、<タイプ2>共起する単
語を限定して訳語を当てる翻訳規則、<タイプ3>共起
する単語の素性のみを限定して訳語を当てる翻訳規則、
<タイプ4>生起するシンタックスを限定して訳語を当
てる翻訳規則、<タイプ5>その他の規則とする。ここ
では、標準辞書の各翻訳規則には、どのタイプに属する
規則であるかが情報として付加されている。すなわち、
表6で示した標準辞書84aの辞書記述方法と同じ様式
である。
【0123】図19は構造変換。訳語決定過程の処理の
流れを示すフローチャートである。まず最初に、当該構
成要素の見出し語が標準辞書24a以外にユーザ辞書2
4bにも登録されているかをチェックする(S21
1)。
【0124】ユーザ辞書24bには登録語がない場合に
は、標準辞書24aの適用規則を決定する(S21
2)。続いて、決定された翻訳規則に基づいて、日本語
構造に構造変換を施し訳語を設定して(S217)終了
する。
【0125】両辞書に登録語がある場合には、各々の辞
書の適用候補となる翻訳規則を設定する(S213)。
続いて、ステップS214にて、規則タイプ判定部26
がユーザ辞書24bの適用候補規則のタイプを判定す
る。表7に、本実施例のユーザ辞書24bの記述例を示
す。
【0126】
【表7】 例えば、入力文に「線を引く」という表現がある場合、
翻訳規則の(1)の適用条件がマッチするので、(1)
が適用候補規則となる。この規則に対して規則タイプ判
定部26がタイプ判定を行う。条件部に共起する単語の
表層文字列(sw)を指定する記述があるので、タイプ
2であるとの判定結果が出される。その他、タイプ1の
判定は、翻訳規則1行目の構造のマッチングパタン(左
辺)と構造変換パタン(右辺)に指定されている単語指
示番号に注目し、左辺に指定されていたが右辺に記述が
ない場合に行う。タイプ3の判定は、条件部に表層文字
列以外の素性を指定する記述がある場合に行う。タイプ
4の判定は、マッチングパタンにデフォルト的構造以外
の構造が指定してある場合に行う。タイプ5は上記以外
の場合である。
【0127】ユーザ辞書24bの規則のタイプが判定さ
れた後は、標準辞書24aの規則のタイプと照らし合わ
せ、どちらの規則が優先度が高いかを判定する(S21
5)。タイプのランクを示す数字が小さいほど優先度が
高いとみなす。両者のタイプが同じ場合には、ユーザ辞
書24bの方が優先度が高いと判定する。
【0128】ステップS215の判定の結果、標準辞書
24aの規則の方が優先度が高いと判定された場合に
は、標準辞書24aの適用候補規則に基づいて、日本語
構造に構造変換を施し訳語を設定して(S217)終了
する。
【0129】ステップS215の判定の結果、ユーザ2
4bの規則の方が優先度が高いと判定された場合には、
続いて、そのユーザ辞書24bの規則は構造変換を伴う
かどうかをチェックする(S216)。構造変換を伴う
場合には、ユーザ辞書24bの適用候補規則に基づい
て、日本語構造に構造変換を施し訳語を設定して(S2
18)終了する。構造変換を伴わない場合には、標準辞
書24aの適用候補規則に基づいて日本語構造に構造変
換を施し、訳語としてはユーザ辞書24bの定義内容を
設定して(S219)終了する。
【0130】この結果、入力文に「線を引く」という表
現がある場合、ユーザ辞書24b中の「〜線を引く」に
対応した規則がタイプ2という判定をうける。標準辞書
24a中の同様に「〜線を引く」に対応した規則もタイ
プ2に属するが同タイプの場合はユーザ辞書の方が優先
度が高いので、ユーザ辞書24bの規則が適用され、訳
文として「lead a line 」が出力される。また、「注意
を引く」という表現に対しては、表現辞書24aの規則
としては(2)の規則が選ばれ、ユーザ辞書24bにつ
いては、翻訳規則は適用条件のマッチするものがないの
で、訳語定義の「attract(verb) 」が選ばれる。この訳
語定義にはタイプ5との判定がだされ、標準辞書24a
の(2)もタイプ5であるので、ユーザ辞書の訳語定義
が採用され、構造変換としては標準辞書24a(2)の
指定が採用される。
【0131】以上のべたように、第3実施例によれば、
ユーザが特に優先度の指定をしなくてもシステム側が自
動的に優先度を判定し、適切に適用規制を決定するの
で、両者の辞書の様々なレベルの規則を有効に翻訳に利
用できる。
【0132】本実施例では、標準辞書24aの中の翻訳
規則にはあらかじめタイプ別情報が付加されている場合
をあげたが、これは適用時に、規則のシンタックスから
自動的に判定させる手法も可能である。
【0133】なお、これまでに挙げた各実施例に共通す
ることであるが、第1〜第3の発明はこれらの実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変形して実現することができる。対話翻訳モードを
持たない機械翻訳装置についても、本質的に翻訳処理を
行うものであればすべてに実現可能である。また、辞書
の記述の仕方、優先情報の付加の仕方についても趣旨の
範囲であればどのようであってもよい。翻訳規則のタイ
プ分けに関しては、単にレベルの異なる複数の形態があ
ればよく、実施例で挙げたタイプ分けには限定されな
い。さらにまた、本発明は日英翻訳を例に説明したが、
他の言語にも当然適用できる。
【0134】次に、請求項4,5に係る第4実施例につ
いて説明する。図20は第4実施例としての日英機械翻
訳システムの構成を示すブロック図である。
【0135】この日英機械翻訳システムは、翻訳対象で
ある原文を入力するためのキーボードからなる入力部3
1、キー入力された日本語文を記憶する原文記憶部3
2、訳文としての英文を入力日本語文に対応させて記憶
する訳文記憶部33、本システム全体を制御する翻訳編
集処理部34、翻訳処理を実行する翻訳部35、翻訳処
理に利用する知識情報を収容した翻訳辞書部36、原文
や訳文などの表示を制御する表示制御部37、入力部3
1からキー入力された原文や翻訳部35で翻訳処理し生
成された訳文などを表示する表示部38、原文や訳文な
どを出力する印刷部39により構成されている。
【0136】辞書分野判定手段や文法判定手段は、入力
部31、表示部38の他、図示しないディスクに格納さ
れCPUなどで実行されるプログラム、例えば翻訳編集
処理部34、翻訳部35などによって構成されるもので
ある。なお、このとき該プログラムの一部あるいは多く
をハードウェアで置き換えても差し支えないのはいうま
でもない。
【0137】第21図に、入力部31のキー配列の一例
を示す。入力部31は日本語および英文入力用の文字キ
ーに加えて以下の各種キーを備えている。
【0138】翻訳指示キー: 100 編集キー: 101〜106 機能キー: 110〜121 カーソルキー: 130〜133 その他のキー: また、入力原文は図3ですでに説明したように、画面左
側の原文表示領域に表示される。翻訳処理の結果得られ
た訳文は画面右側の訳文表示領域にその原文と対応する
位置に表示される。また、画面上部の編集領域は各種編
集に必要な情報を示すために用いることができる。
【0139】翻訳編集処理部34による対話翻訳処理の
流れは、すでに説明した図4に示したフローチャートの
如くであり、この対話翻訳処理では、原文の入力と対応
する訳文の編集作業をオペレータが適宜に行うことがで
きる。翻訳編集処理部34は、S1〜S6において、入
力部31からなんらかのキー入力があるかあるいは翻訳
部から翻訳完了信号を受けているかを監視しており、な
んらかのキー入力があった場合にそれに対応する処理を
行う。
【0140】オペレータが機能キーのいずれかを操作し
た場合、S5によりこれを検知し、S12でその機能キ
ーに対応した処理を行う。
【0141】オペレータが編集キーのいずれかを操作し
た場合、S4によりこれを検知し、S11でその編集キ
ーに対応した処理を行う。
【0142】オペレータがカーソルキー130あるいは
その他の制御キーを操作した場合、S1〜S6を介して
S13でキー操作に対応したカーソルの移動のための処
理やその他の処理を行う。
【0143】オペレータが文字キーを操作して原文を入
力すると、S3で各文字キーが検知された後、対応する
文字コードが順次翻訳編集処理部34内の(図示しな
い)入力バッファにセットされる(S8)。この入力原
文は表示制御部37を介して表示部38の原文表示領域
に表示される(S9)。オペレータが任意の時点で、例
えば一文の入力が終了した時に翻訳指示キー100を打
鍵すると、S2でこのキーが検知され、翻訳編集処理部
34は翻訳部に対し入力バッファ内の原文を供給し、翻
訳処理の開始を指示する(S10)。なお、原文入力の
途中での訂正・挿入・削除などの入力編集が必要な場合
には、カーソルキーにより所望の編集箇所へカーソルを
移動した後、挿入キー101、削除キー102などの編
集キーを用いてこれを行うことができる。
【0144】図22は翻訳部35における翻訳処理の流
れを示すフローチャートである。形態素解析部(S22
1)は、入力原文に対し、活用変化辞書36aを用いて
語尾などに変化がある単語をその原形(基本形)に変換
する。辞書検索部(S222)は、入力原文を構成する
単語毎に単語・熟語辞書36bを検索し、その品詞や訳
語などの情報を集める。解析制御部(S223)は、訳
文の候補を構文解析部に送る処理を行う。
【0145】構文解析部(S224)は、解析文法36
cを使って訳文候補の構文を解析し、日本語文の構造を
生成する。解析に失敗した場合は解析制御部に戻る。構
文解析部(S225)は、変換文法36dを使って日本
語の構造を英語の構造に変換する。棄却された場合は構
文解析部に戻る。構文生成部(S226)は、生成文法
36eに従って英語の構造から英語の語順を決定し単語
列に変換する。形態素生成部(S227)は、形態素生
成文法36fにより単語の語形などを変化させて翻訳文
を完成させる。そして、以上のそれぞれの処理部は、処
理を始めた時点で信号を翻訳編集処理部34に送る。
【0146】再び図4において、翻訳編集処理部34は
S1で上記翻訳完了信号を検知するとS7に進み、翻訳
部35から得られた訳文候補および補助情報を表示制御
部37に送り、訳文を表示させる(S7)。表示制御部
37は上記訳文候補を訳文表示領域において入力原文
(画面左側)と対応する位置に表示するとともに、補助
情報がある場合にはその訳語を高輝度または反転表示す
ることによりオペレータがその旨識別するようにしてい
る。
【0147】この状態から編集キーの打鍵があると、翻
訳編集処理部34はS4でこれを検知し、このときカー
ソルで指示されている語または句に対して各キーに対応
した編集処理を行う(S11)。例えば、挿入キー10
1の操作によりカーソル位置の前に文字を挿入し、削除
キー102の操作によりカーソルが指示している範囲の
文字列を削除し、移動キー103の操作によりカーソル
が指示している範囲を移動する。また、取消キー104
の操作により上記101,102,103の効果を無効
にし、係り受けキー105の操作により補助情報を用い
てカーソルが指示している語句の他の係り受け候補を表
示させる。
【0148】なお、機能キーにより以下の機能を実現で
きる。訳語表示キー110の操作により訳文中の語に対
してその訳語を表示できる。辞書表示キー111の操作
により原文中の語に対して辞書を表示させる。辞書登録
キー112の操作により単語・熟語の登録ができる。辞
書削除キー113の操作により辞書登録により登録され
た単語・熟語の削除を行うことができる。部分訳キー1
14の操作により翻訳が失敗した時にその部分訳を表示
させる。また、カーソルキーには、カーソルをそれぞれ
各方向に移動させるカーソル移動キー130、カーソル
が移動する単位を切り替える単位切り替えキー131、
各表示領域間にカーソルを移動させるための領域間移動
キー132、カーソルのサイズを文字単位に縮小するた
めまたは語単位に拡大するための拡大縮小キーなどがあ
る。
【0149】従って、オペレータは原文の入力とその訳
文の編集処理とを適宜行いながら対話的に訳文を得るこ
とができる。
【0150】以上の様に構成されたシステムにおいて、
更に文書の分野を自動的に判定し、辞書の分野や文法を
設定する際の処理について以下に詳細に説明する。
【0151】図23,24は、従来の問題を解決するた
めに考えられる、辞書分野判定処理の流れの一例を示す
フローチャートである。オペレータによって入力部31
に配置された翻訳指示キー100が押されると(S23
1)、翻訳辞書部36に用意されている辞書の分野数m
を設定する(S232)。次に、原文記憶部32に記憶
されている原文から名詞を抽出・記憶し(S233)、
抽出された名詞の数nを設定する(S234)。そし
て、S236からS244までの処理を辞書の分野数m
回繰り返す。
【0152】S233において抽出された各名詞が辞書
に登録されているかを調べ(S238)、登録されてい
た名詞の数をカウントする(S239)。その処理を名
詞の数n回繰り返す。そして、S239で得られた値を
他の分野の辞書に対して得られた値と比べ(S242,
S243)、一番多くの語が登録されていた辞書を翻訳
辞書としてセットする(S244)。S244において
セットされた辞書の分野名を表示部38に表示し(S2
46)、ここでオペレータによって取消キーが打鍵され
れば(S248)、スタートへ戻る。表8にS616に
おいて表示される画面を示す。
【0153】
【表8】 この表は専門用語辞書に対する辞書分野候補を示したも
のである。オペレータがキーボードからの入力などによ
り表示の変更を指示すれば(S249)、その入力に従
って表示部38の表示を変更し(S250)、S247
へ戻る。ここで確認キーが打鍵されれば(S247)、
表示されている分野名の辞書を翻訳辞書として設定し
(S251)、翻訳処理を開始する(S252)。翻訳
が開始されると、翻訳部35は知識情報収容部36と設
定された翻訳辞書を用いて原文を翻訳する。S232か
らS251までの処理は、機械翻訳システムに分野を選
択できる複数の辞書の種類(例えば、ユーザ辞書、専門
用語辞書など)がある場合は、それぞれの種類に対して
繰り返して行う。
【0154】図25は従来の問題を解決するために考え
られる、文法判定処理の流れの一例を示すフローチャー
トである。オペレータによって入力部31に配置された
翻訳指示キー100が押されると(S261)、機械翻
訳システムに用意されている文法の項目数mを設定する
(S262)。そして、S264の処理を文法の項目数
m回繰り返す。文法判定規則(図示しない)を用いて、
原文記憶部32に記憶されている原文に合う文法項目の
値を決定する。ここでいう文法判定規則とは、文体使わ
れている語、レイアウトなどによって原文の種類を判定
し、それに合った文法項目の値を設定するヒューリステ
ィックな規則である。表9に文法判定規則の一例を示
す。
【0155】
【表9】 この図は「主語がない文の処理」に対する文法判定規則
を示したものである。文法判定処理が終了すると、その
結果を表示部38に表示し(S267)、ここでオペレ
ータによって取消キーが打鍵されればスタートへ戻る。
表10にS807において表示される画面を示す。
【0156】
【表10】 この表は「主語がない文の処理」に対する文法候補を示
したものである。オペレータがキーボードからの入力な
どにより表示されている値の変更を指示すると(S27
0)、該当箇所を変更し表示する(S271)。確認キ
ーが打鍵されれば(S268)、表示部38に表示され
ていた文法の各項目の値が翻訳処理において使用される
文法として設定され(S272)、翻訳が開始される
(S273)。翻訳が開始されると、翻訳部35は知識
情報収容部36と設定された文法を用いて原文を翻訳す
る。
【0157】以上のように、第4実施例によれば、原文
に最適である分野の辞書や、認識・生成方法を自動的に
設定するようにしたため、ユーザの専門知識に頼ること
なく、質の高い翻訳結果を効率的に得ることができる。
【0158】なお、請求項4,5の発明は上記第4実施
例に限定されるものではなく、例えば辞書の分野や文法
の項目は上記実施例に示したものと異なっても構わな
い。また、辞書分野判定処理の結果として選択された辞
書分野に基づいて文法項目の値を設定することも可能で
ある。また、辞書分野判定処理を、翻訳処理の前処理と
してでなく、文書の種類を判定するために使用してもよ
い。更に、辞書分野判定処理や文法判定処理は翻訳開始
前のみでなく、翻訳処理の途中に行われてもよい。上記
実施例では日本語から英語への翻訳を扱ったが、本発明
は他の言語間の翻訳へも適用できる。また、要約システ
ムなど、処理を行う際に環境を設定することができる他
の言語システムへも適用できる。
【0159】次に、請求項6に係る第5実施例について
説明する。図27は第5実施例の文書編集装置の構成を
示すブロック図であり、図26はこの文書編集装置の主
要部である編集処理部の詳細構成を示すブロック図であ
る。
【0160】図27において51は入力部でこの入力部
51は編集を行うべき文章や編集コマンドを入力するよ
うにしている。この場合入力部51としては、例えばキ
ーボード、磁気ディスク、磁気テープ、OCR、マウ
ス、8mmテープ、手書き文字入力用のディジタイザか
らなる。
【0161】52は表示部であり、入力された文章やそ
の他の編集情報、制御情報などの表示を持つ。この場
合、例えばCRTディスプレー、LCDからなる。
【0162】53は記憶部であり記憶部53は入力部で
入力された文書を記憶するものである。この場合、例え
ばRAM、光ディスク、磁気ディスクからなる。
【0163】54は解析部であり解析部54は入力され
た文書あるいは一文単位で解析を行うものである。この
場合例えばマイクロコンピュータからなる。
【0164】55は辞書部であり辞書部55は見出し語
とその属性の情報が記憶されており、置換候補に関する
属性も記憶されている。この場合例えばRAM、光ディ
スク、磁気ディスクからなる。
【0165】56は印刷部であり印刷部56は画面のハ
ードコピーや作成された文書を印字用紙などの記録媒体
に出力するものである。この場合、例えばレーザープリ
ンタからなる。
【0166】57は編集制御部であり上記入力部51、
表示部52、印刷部56、記憶部53、解析部54、辞
書部55の入出力動作を含めたすべての動作を統括的に
制御すると共に文書記憶部に記憶されている情報と編集
を行った結果の変更部分を抽出し、変更部分の解析部の
解析結果に基づき、辞書部への登録を行う編集作業を行
うものである。この場合例えばマイクロコンピュータを
主制御部として有している。
【0167】図26は編集制御部57の構成を示したも
のである。59は編集部であり入力部51から入力され
た文書情報に対し編集を行なう。また、記憶部53へ対
して文書情報を出力する。また、印刷部に対して文書情
報を出力する。編集されている文書情報を抽出部60へ
出力を行なう。
【0168】60は抽出部であり記憶部53に記憶され
た文書内容と編集された文書情報の変更部分を抽出す
る。61は判別部であり抽出部60で抽出された文書情
報に基づき辞書登録可能かどうかの判断を行い、登録可
能であれば辞書部55へ登録を行う。62は変更部であ
り判別部61で辞書登録が不可能であると判別されたも
のについて文書情報に対して変更を行うことで辞書登録
が可能になる場合には可能な形で辞書部55に対して登
録を行う。
【0169】図28は編集制御部57における文書編集
時の動作の流れを示すフローチャートである。ステップ
S281において入力部51から入力された文書内容を
受け取り、ステップS282へ進む。ステップS282
において文書内容を記憶部53へ記憶し、ステップS2
83へ進む。
【0170】ステップS283において文書の修正など
の編集作業を行い、ステップS284へ進む。ステップ
S284において記憶されている文書内容と編集後の文
書内容との比較を行う。変更されている部分があればス
テップS285へ進み、変更されていない文があればス
テップS289の編集終了へ進む。ステップS285に
おいて編集後の変換部分を抽出しステップS286へ移
る。
【0171】ステップS286においてステップS28
5により抽出された変換部分を解析部へ送り受け取った
解析結果を元に辞書登録可能であるかどうかの判定を行
う。辞書登録が可能であればステップS288へ進み、
辞書登録が不可能であればステップS287へ進む。ス
テップS287において辞書登録可能な形に変更するこ
とができればステップS288へ進み、変更できなけれ
ばステップS289へ進む。
【0172】ステップS288では辞書に登録可能なデ
ータに基づき辞書登録を行ない、ステップS289へ進
む。ステップS289において編集処理を終了する。
【0173】ここで、ステップS284は前記抽出部6
0で行なわれる処理であり、ステップS285,S28
6は判別部61における処理、ステップS287は変更
部62において行われる処理である。
【0174】ここにおいて、処理の流れはこのように決
定されているわけではない。ステップS282の記憶部
への出力は必ずステップS283の前に行なわなければ
いけないのではなく、図29に示すように編集作業中に
オペレータの指示あるいは自動的に記憶部へ出力を行な
っても良い。自動的とは例えばある一定時間が経過した
時、オペレータのキーストロークが一定回数に達した時
などがある。
【0175】また、ステップS284へ進むのも編集終
了時だけではなく、オペレータの指示あるいは自動的に
処理を行なっても構わない。自動的とは先にあげたもの
の他に、例えば一つの文の修正が終了して編集画面にお
いてカーソルを別の文へ移動させた場合や、記憶部への
出力がオペレータによって指示された場合にその直前に
行なうなどがある。
【0176】ステップS282へ進む流れとステップS
284からの流れは図28と図29の流れを組み合わせ
て処理を行なっても問題はない。
【0177】以下、処理の流れは図28を用いて説明を
行なう。表11は辞書部5のもっとも簡単な実現方法の
一例を示したものである。
【0178】
【表11】 :の左側に辞書の見出し語があり、:の右側にその置き
換え候補を示している。表12はその一変形例であり、
*は長音文字が省略可能であることを示している。
【0179】
【表12】 また、()で囲まれた文字は大文字にも小文字にもなり
得るということを示している。
【0180】表13にその表示部における表示例をあげ
る。
【0181】
【表13】 ステップS282において入力された文書が例えば表1
4に示すような形で磁気ディスク上に保存される。
【0182】
【表14】 ここで\nは改行を示す記号である。
【0183】いま、ステップS283において例えば表
15に示すように文書の変更が行われたとする。
【0184】
【表15】 図30は抽出部60におけるステップS284の処理の
詳細な流れを示すフローチャートである。表13から表
15までの例を用いて説明する。ここで、行とは改行ま
での一連の文字列を示す。
【0185】ステップS301において、「最近のコン
ピュータ業界の動向について」という一行がバッファm
1に格納される。この例の場合、m1[1]=「最」,
m1[2]=「近」…m1[18]=「て」となってい
る。
【0186】次にステップS302において「最近のコ
ンピュータ業界の動向について」という一行がバッファ
n1に格納される。
【0187】ステップS303において変数iに1がセ
ットされる。ステップS304においてバッファm1上
のi番目の文字「最」とステップn1上のi番目の文字
「最」という共通の文字であるので、ステップS305
において変数iに1が加えられる。
【0188】その後ステップS306においてバッファ
m1とn1のi文字目が行く末かどうかの判断が行なわ
れ、この場合は、「近」という語であるのでステップS
304へ移り、比較が繰り返される。
【0189】変数iが10の時、バッファm1上では
「業」であるがバッファn1では「−」である。よって
ステップS304において違うものであるという判定が
行なわれステップS308へ処理は移行する。ステップ
S308は「最近のコンピュータ業界の動向について」
という一行に対して、変更が行なわれたという情報を判
別部へ渡す。
【0190】次に「最近のオフィスにおけるコンピュー
タ事情は、従来のオフコンに代わりWS(ワークステー
ション)が主流となってきている。」という文がバッフ
ァm1に格納される。この場合、ステップS302,S
303と先の例と同様の処理が行なわれ、iが59にな
った時にm1とn1のi番目の文字が行末を示す。
【0191】そこでステップS306において行末であ
るという判断がなされ、ステップS307へ処理は移動
する。ステップS307が変更が行なわれていないとい
う情報を持ち、処理を終了する。
【0192】図31,32は判別部の処理のうちステッ
プS285の詳細な流れを示すフローチャート図であ
る。
【0193】ステップS311において、バッファm1
に格納された「最近のコンピュータ業界の動向につい
て」という一行が形態素解析されバッファm2へ格納さ
れる。形態素解析後の形式は例えば「最近(名)/の
(格助)|コンピュータ(名)/業界(名)/の(格
助)|動向(名)/について(格助)|$$」となる。
【0194】ここで(名)、(格助)はそれぞれその語
の品詞が名詞、格助詞であることを示している。
【0195】この例の場合、バッファm2の状態は表1
6及び表17に示す通りである。
【0196】
【表16】
【表17】 ステップS31において、バッファn1に格納された
「最近のコンピュータ業界の動向について」という一行
が形態素解析されバッファn2へ格納される。形態素解
析後の形式は例えば「最近(名)/の(格助)|コンピ
ューター(名)/業界(名)/の(格助)|動向(名)
/について(格助)|$$」となる。
【0197】この例の場合、バッファn2の状態は表1
8及び表19に示す通りである。
【0198】
【表18】
【表19】 以下必要のないところについては品詞は言及しない。ス
テップS313において変数jが1に、変数sが0にセ
ットされる。ステップS314において、m2[1]=
「最近/の」であり、n2[1]=「最近/の」である
から、m2[j]とn2[j]が等しいのでステップS
320へ進む。
【0199】ステップS320において変数jの値に1
が加えられる。
【0200】ステップS321においてm2[2]は
「コンピュータ/業界/の|」であるから、ステップS
314へ進む。
【0201】ステップS314においてn2[2]=
「コンピューター/業界/の|」であり、m2[2]=
「コンピューター/業界/の|」であるから、m2
[j]とn2[j]が異なるのでステップS315へ進
む。
【0202】次にステップS315において、変数kに
1がセットされる。ステップS316においてm2
[j][k]とn2[j][k]を比較し、m2[2]
[1]=「コンピュータ」、n2[2][1]=「コン
ピューター」で異なっているのでステップS317に進
み、バッファo1[1]に「コンピュータ(名):コン
ピューター(名)」の形で格納し、変数sに1を加え
る。
【0203】ステップS318において、変数kに1を
加える。ステップS319において、m2[2][2]
=「業界」であり「|」ではないのでステップS316
へ進む。ステップS316において、m2[2]
[2]、m2[2][3]についても同様の処理が施さ
れ、ステップS318においてkが4に設定される。
【0204】ステップS319において、m2[2]
[4]=「|」であるのでステップS320へ進む。ス
テップS321において、m2[3]は行末ではないの
でステップS314へ進む。m2[3]に対しても同様
の処理を行ない、最終的にステップS320へ進む。ス
テップS320において、変数jに1を加える。ステッ
プS321において、m2[4]は行末記号であるので
処理Aへ進む。ステップS322において、変数tにm
2[][]の要素数を代入する。この例で言えば、「最
近」「の」「コンピュータ」「業界」「の」「動向」
「について」の7である。
【0205】s/jがある基準となる数以上であれば処
理を終了し、その数以下であれば図28のステップS2
86(図ではBとする)へ進む。本例ではその基準値を
0.3とする。s=1,t=7であるから、1/7<
0.3となるためにBへと進む。この基準値は0以上1
未満であればどのような値が適用されても構わない。
【0206】図33,34はステップS286における
詳細な流れを示すフローチャートである。ステップS3
41において、バッファo1より「コンピュータ
(名):コンピューター(名)」という一行が抽出され
る。ステップS342において、置換候補として適当な
品詞であるかのチェックを行なう。
【0207】不適当な品詞としては、例えば助詞、接続
詞などがある。適当な品詞としては例えば名詞、形容詞
などがある。しかし、助詞、接続詞を必ず行なってはい
けないということはなく、また名詞、形容詞は必ず行な
わなければいけないということもない。例えば名詞であ
っても、代名詞や形式名詞は不適当であるとしても良
い。
【0208】また、品詞のチェックは両方の語について
行なっても良いし、どちらか一方のみについてのチェッ
クでも良い。
【0209】ステップS342で不適当な品詞であれば
ステップS345へ進む。また、適当な品詞であればス
テップS343へ進む。この例の場合は両方とも名詞で
あるので適当という判断によりステップS343へ進
む。
【0210】ステップS343において、バッファo1
の内容が同じ品詞であればステップS344へ進み、違
う品詞である時には変更部へ処理が進む。この場合、
「コンピュータ」の品詞は名詞であり、「コンピュータ
ー」の品詞は名詞であるから、ステップS344におい
て辞書登録を行なう。
【0211】ステップS344の後、ステップS345
へ進み、この場合バッファo1には残りの語はないため
に処理が終了する。
【0212】また、別の例を用いて説明する。例えば、
「私はあの白い花がとても好きです」という一文を「白
いあの花が私はとても好きです」のように書き換えたと
する。この場合、これまでに示したようなアルゴリズム
を用いると、バッファm2は「私(名)/は(助)|あ
の(連)/白い(形)/花(名)/が(助詞)|とても
(副)/好き(五か)/です(助)|$$」となり、バ
ッファn2は「白い(形)/あの(連)/花(名)/が
(助詞)|私(名)/は(助)|とても(副)/好き
(五か)/です(助)|$$」となる。ここで、
(連)、(形)、(副)、(五か)は連体詞、形容詞、
副詞、か行五段活用動詞ということを示しているバッフ
ァo1は最終的に表20となる。
【0213】
【表20】 この場合、例えばo1[1]は、このまま辞書登録を行
なうと明かに不適当な例である。そこで、図31,32
に示したフローチャートとは別のフローチャート図を図
35に示す。
【0214】ステップS351において、バッファm1
に格納された文書に対して構文解析を行なう。ステップ
S352において、バッファn1に格納された文書に対
して構文解析を行なう。
【0215】先の2つの文に対して構文解析を行なった
結果の例を図に示したものをそれぞれ図36と図37に
示す。
【0216】また、バッファm2の内容例は「0:>
1,2,3:好き(五か)/です(助)|1:<0:と
ても(副)2:<0,>4,5:花(名)/が(助詞)
|4:<2:白い(形)|5:<2:あの(連)|3:
<0:私(名)/は(助)|$$」となる。
【0217】ここで「|」で区切られた単位をノードと
呼ぶ。各ノードの先頭に与えられた数字をノード番号と
呼ぶ。「数字1:>数字2,数字3…」は数字1のノー
ドが数字2,3のノードの上位のノードであることを示
している。「数字4:<数字5…」は数字4のノードが
数字5の下位のノードであることを示している。
【0218】以下、簡略化のためにバッファm2のi番
目のノードをm2[i]と表記する。
【0219】ステップS353において、各ノードのソ
ートを行なう。図38にソートのアルゴリズムの一例図
をあげる。
【0220】この例の場合、m2[1]=「とても」、
m2[2]=「花」、m2[3]=「私」である。
【0221】ステップS361において、変数iに0を
代入する。
【0222】ステップS362において、0番目のノー
ドの下にノードがあればステップS363へ進む。本例
の場合、0番目のノードの下に3個のノードがあるため
にステップS363に進む。
【0223】ステップS363において、0番目のノー
ドの下のノードをソートする。ソートする順番はどのよ
うに行なっても構わない。本例の場合は、動詞のノード
の下の名詞、副詞の淳に並べ、さらに複数の名詞、副詞
がある場合にはそれらの中で見出し語の読み順にソーテ
ィングをおこなうとする。
【0224】ステップS364において変数iに対して
1増加させ、ステップS362へ進む。ステップS36
2において、ノード「花」の下に2つのノードがあるた
めにステップS363に進む。
【0225】ステップS363において、ノード2の下
のノードをソートする。本例の場合は、名詞のノードの
下のノードは見出し語の読み順にソーティングをおこな
うとする。この時に改めて作成される構文木は図39に
示すものになり、これを改めてm2の内容とする。さら
にバッファn2に対して同様の操作を行なった場合にも
図39と同じ構文木となる。
【0226】ステップS355において、バッファm2
とバッファn2の内容の差をチェックする。差があれば
ステップS356へ進む。ステップS356においてバ
ッファo1に差を格納する。本例の場合はステップS3
55において差がないために処理を終了する。
【0227】また、別の例をあげる。例えば「彼は家に
ゆっくり帰った」という文を「彼はゆっくり帰宅した」
という文に変更したとする。ステップS352が終了し
た時点でのバッファm2とn2の構文木はそれぞれ図4
0と図41に示したものである。ステップS355にお
いてm2とn2が違うために、ステップS356へ進
む。
【0228】ステップS356において違っている箇所
を格納する。バッファo1の内容は「家(名)*帰(五
ら):帰宅(サ変)」となる。
【0229】ステップS357において登録を行なう。
【0230】辞書への登録はオペレータに対し確認を求
めても良いし、求めなくとも良い。求める場合にも、一
括して確認を行なっても良いし各単語について確認を求
めても良い。
【0231】表21はユーザーに対し確認を求める表示
画面の一例図である。
【0232】
【表21】 この例で言えば、「コンピュータ、コムピュータ」を
「コンピューター」に、「家(に)帰(る)」を「帰宅
する」に置き換える登録は行なうが、「白い」を「赤
い」に置き換える登録は行なわない。
【0233】ここで、オペレータはマウスをクリックす
ることにより指定しても良いし、キーボードなどを用い
て指定しても良い。また、登録を行なうものについての
み指定を行なっても良いし、登録を行わないものについ
てのみ指定を行なっても良い。
【0234】
【発明の効果】以上詳述したように、本願第1〜第3の
発明によれば、標準辞書以外にユーザ辞書や専門用語辞
書にも同一項目が登録されている場合に、より原文にあ
った優先度の高い規則を判定して適用したり、ユーザに
複数辞書間の優先関係を細かく指定させたりできるの
で、各々の辞書中の規則を有効に翻訳に利用でき、質の
高い翻訳文を出力することができる。
【0235】また、本願第4、第5の発明によれば、従
来ユーザに委ねられていた原文の種類の判定や、辞書や
文法の設定が自動的に行なわれるようになったため、専
門知識がなくても機械翻訳システムに備えられている機
能を有効に活用できるようになった。すなわち、誰にで
も簡単に、しかも時間をかけずに使用でき、高品質な翻
訳結果を提供できる機械翻訳システムを実現できる。
【0236】更に、本願第6の発明では、オペレータが
文書を編集する際に自動的に変更部の抽出、辞書登録部
への登録の可否の判断、辞書登録を行なうことによりオ
ペレータが手作業で辞書の登録を行なうことが必要なく
なるために作業効率が向上するという効果が得られる。
【図面の簡単な説明】
【図1】本発明の第1実施例に係る機械翻訳装置の全体
構成を示すブロック図である。
【図2】キーボード配列を示す平面図である。
【図3】表示部の対話翻訳画面のレイアウトの一例を示
す図である。
【図4】翻訳制御部の処理の流れの一例を示すフローチ
ャートである。
【図5】翻訳部の処理の流れの一例を示すフローチャー
トである。
【図6】翻訳部の処理中の構造変換・訳語決定過程の処
理の流れの一例を示すフローチャートの第1の分図であ
る。
【図7】翻訳部の処理中の構造変換・訳語決定過程の処
理の流れの一例を示すフローチャートの第2の分図であ
る。
【図8】翻訳部の処理中の構造変換・訳語決定過程の処
理の流れの一例を示すフローチャートの第3の分図であ
る。
【図9】本発明の第2実施例に係る機械翻訳装置の全体
構成を示すブロック図である。
【図10】キーボード配列を示す平面図である。
【図11】翻訳制御部の処理の流れの一例を示すフロー
チャートである。
【図12】優先度指定部の処理の流れの一例を示すフロ
ーチャートである。
【図13】翻訳部の処理中の構造変換・訳語決定過程の
処理の流れの一例を示すフローチャートの第1の分図で
ある。
【図14】翻訳部の処理中の構造変換・訳語決定過程の
処理の流れの一例を示すフローチャートの第2の分図で
ある。
【図15】構造変換・訳語決定過程中の標準辞書・ユー
ザ辞書間の優先度判定処理および規則適用処理の流れの
一例を示すフローチャートである。
【図16】構造変換・訳語決定過程中の標準辞書・ユー
ザ辞書・専門用語辞書間の優先度判定処理および規則適
用処理の流れの一例を示すフローチャートの第1の分図
である。
【図17】構造変換・訳語決定過程中の標準辞書・ユー
ザ辞書・専門用語辞書間の優先度判定処理および規則適
用処理の流れの一例を示すフローチャートの第2の分図
である。
【図18】本発明の第2実施例に係る機械翻訳装置の全
体構成を示すブロック図である。
【図19】翻訳部の処理中の構造変換・訳語決定過程の
処理の流れの一例を示すフローチャートである。
【図20】本発明の第4実施例に係る機械翻訳システム
の構成を示すブロック図である。
【図21】入力部のキー配列を示す図である。
【図22】翻訳部の処理の流れを示すフローチャートで
ある。
【図23】辞書分野判定処理の流れを示すフローチャー
トの第1の分図である。
【図24】辞書分野判定処理の流れを示すフローチャー
トの第2の分図である。
【図25】文法判定処理の流れを示すフローチャートで
ある。
【図26】本発明の第5実施例に係る文書編集装置にお
ける編集処理部の詳細な構成を示すブロック図である。
【図27】本発明の第5実施例の構成を示すブロック図
である。
【図28】編集処理部での動作を示すフローチャートで
ある。
【図29】編集処理部での動作の変形例を示すフローチ
ャートである。
【図30】抽出部での処理の流れを示すフローチャート
である。
【図31】判別部での処理の流れを示すフローチャート
の第1の分図である。
【図32】判別部での処理の流れを示すフローチャート
の第2の分図である。
【図33】判別部での処理の流れを示すフローチャート
である。
【図34】判別部での処理の流れを示すフローチャート
である。
【図35】判別部での処理の流れを示すフローチャート
である。
【図36】構文解析の一例を示す説明図である。
【図37】構文解析の一例を示す説明図である。
【図38】ソートの流れを示すフローチャートである。
【図39】構文解析の一例を示す説明図である。
【図40】構文解析の一例を示す説明図である。
【図41】構文解析の一例を示す説明図である。
【符号の説明】
1 入力部 2 表示部 3 文書記憶部 4 翻訳辞書部 4a 標準辞書 4b ユーザ辞書 4c 専門用語辞書 4d 解析文法 4e 生成文法 4f 形態素生成文法 5 翻訳部 6 翻訳規則制御部 7 翻訳制御部 21 入力部 22 表示部 23 文書記憶部 24 翻訳辞書部 24a 標準辞書 24b ユーザ辞書 24c 解析文法 24d 生成文法 24e 形態素生成文法 25 翻訳部 26 規則タイプ判定部 27 翻訳規則制御部 28 翻訳制御部 31 入力部 32 原文記憶部 33 訳文記憶部 34 翻訳編集処理部 35 翻訳部 36 翻訳辞書部 37 表示制御部 38 表示部 39 印刷部 51 入力部 52 表示部 53 記憶部 54 辞書部 55 解析部 56 印刷部 57 編集制御部 59 編集部 60 抽出部 61 判断部 62 変更部 81 入力部 82 表示部 83 文書記憶部 84 翻訳辞書部 84a 標準辞書 84b ユーザ辞書 84c 専門用語辞書 84d 解析文法 84e 生成文法 84f 形態素生成文法 85 翻訳部 86 翻訳規則制御部 87 翻訳制御部 88 優先度指定部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 野村 浩一 神奈川県川崎市幸区小向東芝町1 株式会 社東芝総合研究所内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 翻訳処理に使用する知識情報を収容した
    標準辞書部と、ユーザ辞書部ないしは専門用語辞書部か
    らなる翻訳辞書部と、翻訳辞書部中の標準辞書部とユー
    ザ辞書部あるいは専門用語辞書部中の翻訳規則を制御す
    る翻訳規則制御部とを備え、与えられる第一言語の文章
    を第二言語の文章に翻訳する機械翻訳装置において、 前記翻訳辞書部は、本翻訳辞書部中の各翻訳規則につい
    て、ユーザ辞書あるいは専門用語辞書に同一見出し語が
    登録されている場合ユーザ辞書ないし専門用語辞書中の
    翻訳規則よりも優先させるか否かの情報を持ち、前記翻
    訳規則制御部は、この情報に基づいて適用規則を決定す
    る手段を有することを特徴とする機械翻訳システム。
  2. 【請求項2】 翻訳処理に使用する知識情報を収容した
    標準辞書部と、ユーザ辞書部ないしは専門用語辞書部か
    らなる翻訳辞書部と、翻訳辞書部中の標準辞書部とユー
    ザ辞書部あるいは専門用語辞書部中の翻訳規則を制御す
    る翻訳規則制御部とを備え、与えられる第一言語の文章
    を第二言語の文章に翻訳する機械翻訳装置において、 前記標準辞書部は、2単語以上からなる第一言語の語句
    に1単語の第二言語の訳語を当てる翻訳規則(タイプ
    1)、当該原語単語の生起する文脈を共起する語句の表
    層文字列のレベルまで限定して訳語を当てる翻訳規則
    (タイプ2)、当該原語単語の生起する文脈を当該単語
    そのものの素性および共起する語句の表層文字列以外の
    素性のレベルまで限定して訳語を当てる翻訳規則(タイ
    プ3)、当該原語単語の生起する文脈を構文のレベルま
    で限定して訳語を当てる翻訳規則(タイプ4)、これら
    以外のレベルの翻訳規則(タイプ5)等のレベルの異な
    る翻訳規則を有し、前記翻訳規則制御部に、前記標準辞
    書部中のどのタイプの翻訳規則について前記ユーザ辞書
    部あるいは前記専門用語辞書中の翻訳規則よりも優先し
    て適用させたいかをユーザが適宜指定できるための優先
    度指定部を備えたことを特徴とする機械翻訳システム。
  3. 【請求項3】 翻訳処理に使用する知識情報を収容した
    標準辞書部と、ユーザ辞書部ないしは専門用語辞書部か
    らなる翻訳辞書部と、翻訳辞書部中の標準辞書部とユー
    ザ辞書部あるいは専門用語辞書部中の翻訳規則を制御す
    る翻訳規則制御部とを備え、与えられる第一言語の文章
    を第二言語の文章に翻訳する機械翻訳装置において、 前記翻訳辞書部は、2単語以上からなる第一言語の語句
    に1単語の第二言語の訳語を当てる翻訳規則(タイプ
    1)、当該原語単語の生起する文脈を共起する語句の表
    層文字列のレベルまで限定して訳語を当てる翻訳規則
    (タイプ2)、当該原語単語の生起する文脈を当該単語
    そのものの素性および共起する語句の表層文字列以外の
    素性のレベルまで限定して訳語を当てる翻訳規則(タイ
    プ3)、当該原語単語の生起する文脈を構文のレベルま
    で限定して訳語を当てる翻訳規則(タイプ4)、これら
    以外のレベルの翻訳規則(タイプ5)等のレベルの異な
    る翻訳規則を有し、また、前記ユーザ辞書部中の各翻訳
    規則が前記標準辞書の翻訳規則のタイプ分けの観点から
    みていずれのタイプであるかを自動判定する規則タイプ
    判定部を備え、前記翻訳規則制御部は優先度の高いタイ
    プの翻訳規則から順に適用することを特徴とする機械翻
    訳システム。
  4. 【請求項4】 入力部と、この入力部から入力された翻
    訳対象となる原文を記憶する原文記憶部と、翻訳処理に
    使用する知識情報を収容した知識情報収容部と、この知
    識情報収容部の内容を用いて前記入力された原文の翻訳
    処理を実行する翻訳部と、翻訳処理の結果得られた訳文
    を記憶する訳文記憶部と、前記原文および訳文を表示す
    る表示部と、これらを制御すると共に前記表示部で表示
    された原文または訳文の編集処理を行う翻訳編集処理部
    と、原文文書毎に使用する辞書を判定する辞書分野判定
    手段とを備え、 前記辞書分野判定手段によって判定される辞書の分野に
    基づいて辞書を自動的に選択し、その辞書を用いて翻訳
    処理を行う手段を有することを特徴とする機械翻訳シス
    テム。
  5. 【請求項5】 入力部と、この入力部から入力された翻
    訳対象となる原文を記憶する原文記憶部と、翻訳処理に
    使用する知識情報を収容した知識情報収容部と、この知
    識情報収容部の内容を用いて前記入力された原文の翻訳
    処理を実行する翻訳部と、翻訳処理の結果得られた訳文
    を記憶する訳文記憶部と、前記原文および訳文を表示す
    る表示部と、これらを制御すると共に前記表示部で表示
    された原文または訳文の編集処理を行う翻訳編集処理部
    と、原文文書毎に使用する文法を判定する文法判定手段
    とを備え、 前記文法判定部によって判定される文書の分野に基づい
    て文法を自動的に選択し、その文法を用いて翻訳処理を
    行う手段を有することを特徴とする機械翻訳システム。
  6. 【請求項6】 文書情報を入力する入力手段と、前記入
    力手段から入力された文書情報を記憶する記憶手段と、
    前記文書情報を表示する表示手段と、前記文書情報に対
    し編集を行う編集手段とを備えた文書編集装置におい
    て、 複数の単語とその単語に対し置換を行う情報を登録した
    辞書と、前記記憶手段に記憶された文書情報と前記編集
    手段により編集された文書情報との変更部分を抽出する
    文書抽出手段と、前記文書情報抽出手段により抽出され
    た変更部分に対して解析を行う解析手段と、前記解析手
    段により解析された文書情報が前記辞書に登録可能であ
    るかを判別する文書情報判別手段とを備えたことを特徴
    とする文書編集装置。
JP4243785A 1992-09-11 1992-09-11 機械翻訳システム及び文書編集装置 Pending JPH0696114A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4243785A JPH0696114A (ja) 1992-09-11 1992-09-11 機械翻訳システム及び文書編集装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4243785A JPH0696114A (ja) 1992-09-11 1992-09-11 機械翻訳システム及び文書編集装置

Publications (1)

Publication Number Publication Date
JPH0696114A true JPH0696114A (ja) 1994-04-08

Family

ID=17108932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4243785A Pending JPH0696114A (ja) 1992-09-11 1992-09-11 機械翻訳システム及び文書編集装置

Country Status (1)

Country Link
JP (1) JPH0696114A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9324325B2 (en) 2013-09-11 2016-04-26 International Business Machines Corporation Converting data between users during a data exchange session
CN109426667A (zh) * 2017-08-21 2019-03-05 阿里巴巴集团控股有限公司 机票类目cat规则的翻译方法和装置
WO2024004184A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 生成装置、生成方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9324325B2 (en) 2013-09-11 2016-04-26 International Business Machines Corporation Converting data between users during a data exchange session
US9542946B2 (en) 2013-09-11 2017-01-10 International Business Machines Corporation Converting data between users during a data exchange session
CN109426667A (zh) * 2017-08-21 2019-03-05 阿里巴巴集团控股有限公司 机票类目cat规则的翻译方法和装置
WO2024004184A1 (ja) * 2022-06-30 2024-01-04 日本電信電話株式会社 生成装置、生成方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP3905179B2 (ja) 文書翻訳装置及び機械読み取り可能媒体
US5845143A (en) Language conversion system and text creating system using such
US6993473B2 (en) Productivity tool for language translators
US6782384B2 (en) Method of and system for splitting and/or merging content to facilitate content processing
JP4446749B2 (ja) 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
JPH0696114A (ja) 機械翻訳システム及び文書編集装置
JPH0576067B2 (ja)
JP3352799B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3657338B2 (ja) 翻訳装置
JP2838984B2 (ja) 汎用参照装置
JPH06348751A (ja) 言語変換装置
Simov et al. The CLaRK System: XML-based Corpora Development System for Rapid Prototyping.
JP3034295B2 (ja) 機械翻訳方法及び機械翻訳装置
JP3734101B2 (ja) ハイパーメディア構築支援装置
Kotsyba et al. UGTag: morphological analyzer and tagger for the Ukrainian language
JP4043176B2 (ja) 自然言語処理装置
JPH0561902A (ja) 機械翻訳システム
JPH05282361A (ja) データベース作成支援装置及び機械翻訳装置
JP2000222407A (ja) 機械翻訳装置および機械翻訳方法
JPH07334506A (ja) 機械翻訳装置
JPH03122760A (ja) 文章作成装置
JPH10134054A (ja) 文作成支援装置
JPH0212457A (ja) 機械翻訳システム
JPH1166090A (ja) 情報処理装置、辞書情報活用方法、及び記録媒体