JPH08101839A - 機械翻訳システム - Google Patents

機械翻訳システム

Info

Publication number
JPH08101839A
JPH08101839A JP6261553A JP26155394A JPH08101839A JP H08101839 A JPH08101839 A JP H08101839A JP 6261553 A JP6261553 A JP 6261553A JP 26155394 A JP26155394 A JP 26155394A JP H08101839 A JPH08101839 A JP H08101839A
Authority
JP
Japan
Prior art keywords
translation
language
sentence
word
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6261553A
Other languages
English (en)
Inventor
Yumiko Yoshimura
裕美子 吉村
Satoshi Kinoshita
聡 木下
Hideki Hirakawa
秀樹 平川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP6261553A priority Critical patent/JPH08101839A/ja
Publication of JPH08101839A publication Critical patent/JPH08101839A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 本発明は、ユーザの知識の違いにより多様化
する訳文の形態に対応するために、第2言語の単語列中
に、要求に応じて第1言語の単語文字列を適宜取り混ぜ
た訳文を構成して生成し、原文の意味の理解を促進する
ことのできる機械翻訳部システムを提供することを目的
とする。 【構成】 本発明は、文字を入力するための入力部と、
入力された自然言語を第2言語へ変換する知識情報を収
容する辞書部と、入力文中の句・節(主節、等位節、従
節)を認識する句・節認識手段と、前記句・節認識/翻
訳形態手段により認識された入力文の構造に応じて決定
する翻訳形態選択手段とを有し、前記翻訳形態選択部の
選択した翻訳形態の情報に基づき、前記辞書部の知識情
報を用いて第2言語の文あるいは第1言語の文字列を含
んだ第2言語の文へ変換する翻訳部と、全体の処理制御
する制御部とを備えて構成される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、第1言語の文を第2
言語の文に翻訳する機械翻訳システムに関する。
【0002】
【従来の技術】近年、コンピュータを利用して第1言語
で表現される文章を自動的に第2言語で表現された文章
に変換する機械翻訳システムに対する注目が高まってい
る。機械翻訳システムが広く使われるようになり、その
ユーザの層も広がってきている。特に、翻訳の目的が第
2言語の文書として清書するということではなく、第1
言語の文書にある情報の獲得である場合には、第1言語
に対する知識のない人、第1言語の文法知識はあるがボ
キャブラリーの少ない人、また、自分の専門分野の語彙
については第1言語の知識の豊な人と、ユーザの知識の
持ち型は様々である。このようなユーザ持つ知識の違い
によって、当然、機械翻訳システムに生成してほしい訳
文の形態も変わってくる。第1言語に関する知識の少な
い人は、第2言語のみからなる訳文が必須であるが、専
門分野については第1言語の知識が十分にある人なら、
すべて第2言語の訳文を呈示されるより、専門用語部分
については第1言語の語句のままの訳文であるほうが、
自然言語特有の曖昧性を回避できる可能性が高くより望
ましいと言える。また、第1言語の文法知識や文書特有
の頻出表現パターンに対する知識はあるが、ボキャブラ
リーは豊富でない人にとっては、節や句を接続する文の
骨組みとなる部分は第1言語のままで、句・節の部分を
第2言語に変換して訳文を構成するのも有効である。こ
の方が、文に現われる語句の語順を保存することにつな
がるため、論旨をつかみながらスムーズに読み進められ
るという効果がある。
【0003】また、自然言語の特徴として、1つの単語
が複数の語義を有するという特徴がある。これに対して
従来の技術としては、一文ないしは周辺の文から語義を
限定できる情報が得られない時に設定するためのデフォ
ルト訳語を辞書に定義しておき、それを生成するという
手段がとられていた。この手法によると、意図された意
味とはずれた概念の語訳が生成されることもあり、原文
の意味がゆがめられて伝えられる可能性があるという問
題があつた。このような場合は、かえって原文の単語を
そのまま訳文に生成するほうが、ユーザに語義が決定で
きなかった旨を伝えられ、解釈においてはユーザの最終
判断に委ねられるので、第1言語の知識をある程度有す
るユーザにとっては望ましい形態といえる。
【0004】従来、このように第1言語と第2言語を取
り混ぜた訳文を生成するための手段としては、(1)原
文書に翻訳不要部分の指定をさせる方法、(2)翻訳不
要語句をユーザ辞書に見出し語と同じ訳語で登録する方
法、(3)システム提供する選択肢(基本的に名詞句の
パターンを細分化したもの)の中から第2言語に変換し
ない項目を選択する方法、(4)翻訳させたくない文字
列をテキストファイルに中に指定する方法(特開平6−
4574号参照)などがあった。
【0005】翻訳不要部分を個々に指定するのは手数が
かかり、第1言語文書からの情報獲得を目的とする翻訳
においては望ましくない。また、指定できる語(句)の
対象としても名詞(句)として構文的に処理できるもの
に限られており、上記のようなユーザ知識に応じて変わ
る種々な要求に応じられるものではない。
【0006】翻訳不要語句をすべてユーザ辞書に登録す
る方法は、処理できる語句の品詞には幅が広がるが、前
方法と同様、効率面から考えて目的にそぐわない。
【0007】第3の方法は前記のとおり、名詞句に限定
されているという制約の上に、名詞句という範疇なら専
門用語でも標準用語でも区別をせずに一様に第2言語に
変換するか変換しないかが決められてしまう。このた
め、第1言語に関して専門分野の知識はあるが、標準用
語のボキャブラリーに自身がない人にとっては、第1言
語の単語が訳文に出力されすぎてかえって理解しにくい
訳文となってしまうという問題があった。
【0008】第4の方法は、第2の方法よりは若干効率
は上がるが、大量文書からの情報収集を目的とした翻訳
を念頭においた場合に、あらかじめ翻訳不要の語を蓄え
ておくこにとは難しいので有効性はあまり高くない。ま
た語義の曖昧性解消の有無にからんで訳語の形態を切り
替えるのには全く無効である。
【0009】文書内容の専門分野を判定する手段として
は、文書中の各語句を各種専門辞書あるいは見出し語ご
とに専門分野情報を備えた辞書に対して辞書引きし、分
野別の出現頻度を元に専門分野を判定する方法がある
(特開平3−78872号公報、特開平6−96114
号公報参照)。
【0010】また、上記のような翻訳形態の切り替えを
ユーザが対話的に行う従来技術とししては、上記第4の
方法で、その都度テキストファイルを書き換えることに
より切り替える対処法と、第2言語の訳語が生成された
結果に対して、特定語を指定して入力単語文字列置き換
えさせる方法があった(特開平5−334345号公報
参照)。前者は非常に効率的でない方法である。後者に
は、第1言語の文字列から第2言語の文字列への変換を
指定する機能が実現されていない。
【0011】
【発明が解決しようとする課題】前節で述べたように、
従来の機械翻訳システムは、特に第1言語の文書からの
情報の獲得を目的とする翻訳において様々な知識の持ち
方のユーザ多様な要求に十分応えることがでなかった。
【0012】本発明はこのような従来の課題を解決する
ためになされたもので、その目的は、ユーザの知識の違
いにより多様化する訳文の形態に対応できる機械翻訳シ
ステムを提供することである。
【0013】具体的には、第2言語の単語列中に、要求
に応じて第1言語の単語文字列を適宜取り混ぜた訳文を
構成して生成し、原文の意味の理解を促進することので
きる機械翻訳システムを提供することを目的とする。
【0014】
【課題を解決するための手段】上記目的を達成するた
め、本願第1の発明は、文字を入力するための入力部
と、入力された第1言語による自然言語文を第2言語へ
変換するための知識情報を収容する辞書部と、 入力文
中の句・節(主節、等位節、従節)を認識する句・節認
手段と、前記句・節認識手段により認識された、句、主
節、等位節、従節から接続詞・関係詞的慣用句を除いた
部分、従節中の接続詞・関係詞的慣用句、句・節がある
接続表現を伴って別の句・節と連結される際の各句・
節、該各句・節の接続表現、前記各部分以外の部分の翻
訳形態(第2言語に変換するか、第1言語のまま出力す
るか)を入力文の構造(「句、主節、等位節」、「従節
から接続詞・関係詞的慣用句を除いた部分」、「従節中
の接続詞・関係詞的慣用句を除いた部分」、「句・節が
ある接続表現を伴って別の句・節と連結される際の各句
・節」の種類、および「従節中の接続詞・関係詞的慣用
句」、「句・節がある接続表現を伴って別の句・節と連
続される際の各句・節の接続表現」との組み合わせ具
合)に応じて決定する翻訳形態選択手段とを有し、前記
翻訳形態選択手段の選択した翻訳形態の情報に基づき、
前記辞書部の知識情報を用いて第2言語の文あるいは第
1言語の文字列を含んだ第2言語の文へ変換する翻訳部
を備え、前記翻訳形態選択手段は、出力文中、第1言語
の単語文字列の連続部分、第2言語の単語文字列の連続
部分の境界においては原文中の生起順序に準じて生成さ
れるように翻訳形態を選択することを特徴とする。
【0015】また、本願第1の発明の構成において、第
1の変形態様では、さらにユーザが各々の句・節の種類
ごとに、翻訳形態を指定できるための翻訳形態指定部を
備え、翻訳形態選択手段は、前記翻訳形態指定部より指
定した内容にそって翻訳形態を選択することを特徴とす
る。
【0016】第2の変形態様では、翻訳部は、入力文に
辞書部に未踏の単語があった場合に訳語として生成する
第1言語の文字列と、入力文中の単語の意味が決定でき
ない場合に訳語として生成する第1言語の文字列とを区
別して生成することを特徴とする。
【0017】第3の変形態様では、第1言語のままの文
字列が設定された訳語、および、従節中の接続詞・関係
詞・接続詞的慣用句、句・節同志を連結する接続表現に
対応する第2言語の訳語に対して、翻訳形態の切り替え
を指定するための翻訳形態切り替え指定手段を有し、前
記翻訳形態切り替えによる切り替え指定の有無により、
翻訳形態選択手段による翻訳形態選択判定を制御させる
ことを特徴とする。
【0018】本願第2の発明は、文字を入力するための
入力部と、入力された第1言語による自然言語文を第2
言語へ変換するための知識情報と少なくとも第1言語の
単語・合成語が専門用語であるかどうかの専門用語情報
を収容する辞書部と、前記辞書部の各種知識情報を用い
て、第2言語の文あるいは第1言語の文字列を含んだ第
2言語の文へ変換する翻訳部を備え、前記翻訳部は、入
力文中の単語・合成語が専門用語であるという専門用語
情報を持つ場合には、その単語・合成語に対する訳出表
現として第1言語のままの文字列を生成することを特徴
とする。
【0019】本願第2の発明の構成において、第1の変
形態様では、辞書部は、少なくとも第1言語の単語・合
成語がどの分野の専門用語であるかどうかの専門分野情
報を有し、翻訳部は、原文書中の単語・合成語の出現頻
度と前記専門分野情報の分野以外の用語は専門用語とし
て扱わないことを特徴とする。
【0020】第2の変形態様では、品詞の種類、専門用
語分野の種類(辞書部が専門分野情報を有しない場合は
1種類)、およびその組み合わせごとに、翻訳形態(第
1言語のまま出力するか、第2言語に変換するか)を指
定できるための翻訳形態指定部を備え、翻訳部は、ユー
ザが前記翻訳形態指定部より「第1言語のまま出力す
る」と指定した品詞、専門分野情報を持つ単語・合成語
に対する訳出表現として第1言語のままの文字列を生成
することを特徴とすることを特徴とする。
【0021】第3の変形態様では、翻訳部は、入力文に
辞書部に未登録の単語があった場合に訳語として生成す
る第1言語の文字列と、入力文中の単語の意味が単一に
決定できない場合に訳語として生成する第1言語の文字
列とを区別して生成することを特徴とする。
【0022】第4変形態様では、第1言語のままの文字
列が設定された訳語に対して、翻訳形態の切り替えを制
定するための翻訳形態切り替え指定手段と、前記翻訳形
態切り替え指定手段により切り替えを指定された単語に
ついて第2言語の訳語に切換える訳語切り替え手段とを
有することを特徴とする。
【0023】第5の変形態様では、翻訳切り替え手段に
より切り替えを指定された語と、さらに切り替え結果の
第2言語訳語まで指定された場合は当該第2言語訳語を
記憶し、語句の対訳リストを作成する、対訳リスト作成
手段を有することを特徴とする。
【0024】本願第3の発明は、文字を入力するための
入力部と、入力された第1言語による自然言語文を第2
言語へ変換するための知識情報を収容する辞書部と、前
記辞書部の各種知識情報を用いて、第2言語の文あるい
は第1言語の文字列を含んだ第2言語の文へ変換する翻
訳部を備え、翻訳部は、入力文中の単語の意味が単一に
決定できない場合は、当該単語の訳語として、第1言語
のままの文字列を設定するように機能する翻訳形態選択
手段を有することを特徴とする。
【0025】また、本願第3の発明の構成において、第
1の変形態様では、翻訳部は、入力文に辞書部に未登録
の単語があった場合に訳語として生成する第1言語の文
字列と、入力文中の単語の意味が単一に決定できない場
合に訳語として生成する第1言語の文字列とを区別して
生成することを特徴とする。
【0026】第2の変形態様では、第1言語のままの文
字列が設定された訳語に対して、翻訳形態の切り替えを
指定するための翻訳形態切り替え指定手段と、前記翻訳
形態切り替え指定手段により切り替えを指定された単語
について第2言語の訳語に切り替える訳語切り替え手段
とを有することを特徴とする。
【0027】第3の変形態様では、翻訳形態切り替え手
段により切り替えを指定された語と、さらに切り替え結
果の第2言語訳語まで指定された場合は当該第2言語誤
訳を記憶し、語句の対訳リストを作成する、対訳リスト
作成手段を有することを特徴とする。
【0028】
【作用】本願第1の発明の機械翻訳システムにおいて
は、入力部より第1言語である自然言語の文および単語
列が入力されると制御部に送られ、制御部はその入力デ
ータを翻訳部に送る。翻訳部は辞書部にアクセスして入
力文および単語列に対して形態素解析処理を行いながら
辞書引きを行う。形態素解析・辞書引き処理が終了する
と、翻訳部は構文・意味解析処理を行う。構文・意味解
析処理が終了すると、翻訳部は、構文・意味解析結果の
データを元に、句・節認識部手段を用いて、入力文中に
ある句・節(主節、等位節、従節)を認識する。認識が
終了すると、翻訳部は、解析・意味結果のデータとに句
・節の認識結果を元に、翻訳形態選択手段を用いて、前
記句・節認識手段により認識された句、主節、等位節、
従節から接続詞・関係詞・接続詞的慣用句を除いた部
分、の従節中の接続詞・関係詞・接続詞的慣用句、句・
節がある接続表現を伴って別の句・節と連結される際の
各句・節、該各句節の接続表現、前記各部分以外の部分
の各々の翻訳形態(第2言語に変換するか、第1言語の
まま出力するか)を選択する。
【0029】具体的には、翻訳形態選択手段は、出力文
中、第1言語の単語文字列の連続部分、第2言語の単語
文字列の連続部分の境界においては原文中の生起順序に
準じて生成されるための翻訳形態選択知識(辞書部に規
則として設けるか、翻訳形態選択手段の処理アルゴリズ
ムに直接組み込む)に基づいて各部分構造の翻訳形態を
選択する。翻訳部は、翻訳形態選択手段により「第2言
語に変換する」と判定された部分構造に対しては辞書部
に収容されている知識情報を用いて第2言語に変換する
処理を行い、それ以外の部分については第2言語への変
換を施さない。最後に、第1言語の語句と第2言語の語
句の混じった構造から、一次元レベルの表層文字列に変
換し出力文として生成する。
【0030】本願第1の発明の機械翻訳システムにおけ
る第1の変形態様では、本願第1の発明の機械翻訳シス
テムの作用に準ずるが、これとの違いは、ユーザが各々
の句・節の種類ごとに、翻訳形態を指定できるための翻
訳形態指定部が備わっていることである。翻訳形態選択
手段による通常の翻訳形態選択の後に、翻訳部は、翻訳
形態指定部を通じてユーザから指定された翻訳形態選択
指示に応じた選択形態の再選択を行う。
【0031】本願第1の発明の機械翻訳システムにおけ
る第2の変形態様では、本願第1の発明の機械翻訳シス
テムの作用に準ずるが、これとの違いとして、翻訳部
は、入力文中の未登録語に対する訳語と、翻訳形態選択
手段が第1言語の文字列で生成することを決定した語と
を、出力文上で区別して生成するように、一方の訳語文
字列に表示を変えるための情報(コードなど)を盛り込
む。
【0032】本願第1の発明の機械翻訳システムにおけ
る第3の変形態様では、ユーザが、第1言語のままの文
字列が設定された訳語、および、従節中の接続詞・関係
詞・接続詞的慣用句、句・節同志を連結する接続表現に
対応する第2言語の訳語に対して、翻訳形態の切り替え
手段により切り替えを指定すると、翻訳部は、その切り
替え指定に添うように再翻訳処理を行い、指定語の翻訳
形態を切り替えた訳文を生成する。この際の指定内容は
指定内容格納部に格納され、以降の翻訳処理に生かす。
【0033】本願第2の発明の機械翻訳システムにおい
ては、入力部より第1言語である自然言語の文および単
語列が入力されると制御部に送られ、制御部はその入力
データを翻訳部に送る。翻訳部は辞書部にアクセスして
入力文および単語列に対して形態素解析処理を行いなが
ら辞書引きを行う。この際に、辞書引きされた単語・合
成語に専門用語であるという専門用語情報があるかどう
かをチェックする。形態素解析・辞書引きが終了する
と、翻訳部は構文・意味解析処理を行う。構文・意味解
析処理が終了すると、翻訳部は、辞書部に収容されてい
る知識情報を用いて第2言語に変換する処理を行うが、
専門用語であるという情報のある単語・合成語に対する
訳出表現として第1言語のまま文字列を当てる。最後
に、一次元レベルの表層文字列に変換し出力文として生
成する。
【0034】本願第2の発明の機械翻訳システムにおけ
る第1の変形態様では、入力部より第1言語である自然
言語の文書および文のセットが入力されると制御部に送
られ、制御部はその入力データを翻訳部に送る。翻訳部
は辞書部にアクセスして入力文および単語列に対して形
態素解析処理を行いながら辞書引きを行う。辞書引きさ
れた単語・合成語にはどの分野の専門用語であるかを示
す専門分野情報も一緒に抽出されている。この後、翻訳
部は、形態素解析・辞書引きの結果に対して、分野判定
手段を用いて当該文書および文のセットがどの専門分野
に関するものであるかを判定する。分野判定が終わる
と、翻訳部は構文・意味解析処理を行う。構文・意味解
析が終了すると、翻訳部は、辞書部に収容されている知
識情報を用いて第2言語に変換する処理を行うが、判定
された分野の専門用語であるという情報のある単語・合
成語に対する訳出表現として第1言語のまま文字列を当
てる。最後に、一次元レベルの表層文字列に変換し出力
文として生成する。
【0035】本願第2の発明の機械翻訳システムにおけ
る第2の変形態様では、本願第2の発明の機械翻訳シス
テムの作用に準ずるが、これとの違いは、ユーザが品詞
の種類、専門用語分野の種類(辞書部が専門分野情報を
有しない場合は1種類)、およびその組合わせごとに、
翻訳形態(第1言語のまま出力するか、第2言語に変換
するか)を指定できるための翻訳形態指定部が備わって
いることである。翻訳部は、第2言語に変換する際に、
ユーザが前記翻訳形態指定部より「第1言語のまま出力
する」と指定した品詞、専門分野情報を持つ単語・合成
語に対する訳出表現として第1言語のままの文字列を当
てる。
【0036】本願第2の発明の機械翻訳システムにおけ
る第3の変形態様では、本願第2の発明の機械翻訳シス
テムの作用に準ずるが、これとの違いとして、翻訳部
は、入力文中の未登録語に対する訳語と、翻訳形態選択
手段が第1言語の文字列で生成することを決定した語と
を、出力文上で区別して生成するように、一方の訳語文
字列に表示を変えるための情報(コードなど)を盛り込
む。
【0037】本願第2の発明の機械翻訳システムにおけ
る第4の変形態様では、ユーザが、第1言語のままの文
字列が設定された訳語に対して翻訳形態切り替え手段に
より切り替えを指定すると、制御部は、そのもともとの
見出し語に対する第2言語の訳語情報を翻訳結果データ
中から抽出し、次候補訳語群としてユーザに提示する。
提示された訳語群の中からユーザが特定の第2言語訳語
を選択すれば出力文中の第1言語の文字列訳語が選択さ
れた第2言語の訳語に置き換えられる。この選択情報は
指定内容格納部に格納され、以降の翻訳処理に生かす。
【0038】本願第2の発明の機械翻訳システムにおけ
る第5の変形態様では、ユーザから、指定内容格納部中
の指定内容を出力して対訳リストを提示する旨の要求が
あると、制御部は対訳リスト作成手段を用いて、指定内
容格納部の内容の提示を出力部において行う。ここでユ
ーザがファイルへの書き出しを指定すれば、ファイルへ
の出力を行う。
【0039】本願第3の発明の機械翻訳システムにおい
ては、入力部より第1言語である自然言語の文および単
語列が入力されると制御部に送られ、制御部はその入力
データを選択部に送る。翻訳部は辞書にアクセスして入
力文および単語列に対して形態素解析処理を行いながら
辞書引きを行う。形態素解析・辞書引き処理が終了する
と、翻訳部は構文解析処理、意味解析処理を順に行う。
構文解析、意味解析処理が終了すると、翻訳部は、辞書
部に収容されている知識情報を用いて第2言語に変換す
る処理を行う。その際に、翻訳形態選択手段を用いて、
語義が限定されない語については入力単語の表層文字列
を訳語として設定する。最後に、一次元レベルの表層文
字列に変換し出力文として生成する。
【0040】本願第3の発明の機械翻訳システムにおけ
る第1の変形態様では、本願第3の発明の機械翻訳シス
テムの作用に準ずるが、これとの違いとして、翻訳部
は、入力文中の未登録語に対する訳語と、翻訳形態選択
手段が第1言語の文字列で生成することを決定した語と
を、出力文上で区別して生成するように、一方の訳語文
字列に表示を変えるための情報(コードなど)を盛り込
む。
【0041】本願第3の発明の機械翻訳システムにおけ
る第2の変形態様では、ユーザが、第1言語のままの文
字列が設定された訳語に対して、翻訳形態切り替え手段
により切り替えを指定すると、制御部は、そのもともと
の見出し語に対する第2言語の訳語情報を翻訳結果デー
タ中から抽出し、次候補訳語群としてユーザに提示す
る。提示された訳語群の中からユーザが特定の第2言語
訳語を選択すれば出力文中の第1言語の文字列訳語が選
択された第2言語の訳語に置き換えられる。この選択情
報は指定内容格納部に格納され、以降の翻訳処理に生か
す。
【0042】本願第3の発明の機械翻訳システムにおけ
る第3の変形態様では、ユーザから、指定内容格納部中
の指定内容を出力して対訳リストを提示する旨の要求が
あると、制御部は対訳リスト作成手段を用いて、指定内
容格納部の内容の提示を出力部において行う。ここでユ
ーザがファイルへの書き出しを指定すれば、ファイルへ
の出力を行う。
【0043】
【実施例】以下、図面を参照しながら、本発明の実施例
を説明する。
【0044】最初に、請求項1に記載の機械翻訳システ
ムの実施例について説明する。
【0045】図1は、本発明の一実施例としての機械翻
訳システムの構成を示したブロック図である。入力部1
は制御部2に接続され、制御部2は出力部7に接続され
る。また、制御部2は翻訳部3と、翻訳部3は辞書部4
とそれぞれ双方向に接続される。また、翻訳部3は、句
・節認識/翻訳形態選択手段3aを有し、辞書部4は、
語彙部4a、形態素解析規則4b、構文・意味解析規則
4c、句・節認識/翻訳形態選択規則4d、変換規則4
e、生成規則4fを有する。
【0046】入力部1は、自然言語の文および単語列を
入力するためのもので、制御部2に対し、翻訳対象とな
る文の入力や各種コマンドの入力を行うためのものであ
る。通常、キーボードなどが使用される。また、OCR
による入力や、フロッピーディスク、磁気テープ、磁気
ディスクからの読み込みなども考えられる。
【0047】出力部5は、翻訳部3の出力である翻訳結
果を出力するためのものである。各種ディスプレイなど
の表示手段、印刷機などの印字手段、あるいは直接フロ
ッピーディスク、磁気テープ、磁気ディスクへ出力する
手段や他のメディアへ送信する送信手段でもよい。
【0048】入力部1より処理対象の原文が入力される
と、制御部2へ送られる。制御部2は、原文のデータを
翻訳部3へ送る。翻訳部3は、辞書部4の知識・規則を
利用して、入力原文に対して、第2言語の文あるいは第
1言語の文字列を含んだ第2言語の文への翻訳処理を行
う。翻訳処理をすると、その翻訳結果は制御部2を通じ
て出力部5へ送られ、一通りの処理を終える。
【0049】次に、翻訳部3において、句・節認識/翻
訳形態選択手段3aを用いて、入力文中の同一節内に現
われる句・節については入力文中での生起順のまま生成
し、等位節と等位節、主節と従節についても入力文中で
の生起順のまま生成するように翻訳形態を選択し、第2
言語の文あるいは第1言語の文字列を含んだ第2言語の
文を生成する処理について説明する。
【0050】図2は、翻訳部3における翻訳処理の流れ
を示すフローチャートである。まず、翻訳部3に入力文
が送られてくると、入力文に対して辞書部4中の語彙部
4aと形態素解析規則4bを用いて、形態素解析・辞書
引き処理を行い、その品詞・訳語など翻訳処理に必要な
各種情報を求める(ステップS21)。次に、構文・意
味解析規則4cを用いて構文・意味解析処理を行う(ス
テップS22)。続いて構文・意味解説結果に対して句
・節認識/翻訳形態選択規則4d用いて入力文中の句・
節の認識をすると共に句・節の種類と句・節同志の組み
合わせにより各部分構造の翻訳形態(第1言語のまま出
力するか、第2言語に変換するか)を選択する(ステッ
プS23)。ステップS23の処理の詳細については別
のフローチャートを用いて後に説明する。翻訳形態の選
択が終わると、ステップS24の構造変換の処理に移
る。構造変換処理は、語彙部4a、変換規則4eを用い
て、第1言語の概念構造を基本的には第2言語の概念構
造に変換する。ただし、翻訳形態として、ステップS2
3で「第1言語のまま」が指定された部分構造では、語
彙部4aや変換規則4eに定義されている第2言語の訳
語ではなく、第1言語の単語文字列をそのまま訳語とし
て設定する。そして最後に、生成規則4fを用いて、ス
テップS24で得られる第1言語と第2言語の語句をあ
わせもった概念構造から出力文を生成する生成処理を行
い(ステップS25)、全体の翻訳処理を終了する。
【0051】次に、前述した句・節認識/翻訳形態選択
処理の流れを図3のフローチャートを参照して説明す
る。ここでは、第1言語を英語、第2言語を日本語とす
る場合の処理を取り上げる。
【0052】入力文として「It seems that he is lyin
g, although he is always faithful to me.」が翻訳部
3に送られてくると、形態素解析・辞書引き処理、構文
・意味解析が順に行われ、図4に示すような構文・意味
解析結果が得られる。図4の中の”(top
y)”,”(vtpn SV)”,”(form cl
s)”,”(aspect prog)”などは、構文
解析の結果付与されるものである。”seem”の付与
された”(top y)”は、”seem”が入力文全
体の構造のトップにあることを示す。”vtpn”は動
詞の文型を示し、”SV”は第1文型、”SVC”は第
2文型である。”(form cls)”はそのノード
以下の構造が節の核部分(接続詞を除いた部分)である
ことを示す。”(aspect prog)”は、さの
動詞句が「進行相」であることを示す。また、”SW”
は、入力単語の文字列、posは品詞、”type”は
当該節が平叙節かWH疑問節かyes−no疑問節かを
示し、”*”はワイルドカードとして用いられている。
【0053】ます、ステップS31において、トップノ
ードである”seem”の親ノードポインタをセットす
る。続いて、着目親ノードから下がっている子ノードの
内、着目子ノードとしてステップS33以降の処理を受
けていないノードを探し、それに子ノードポインタをセ
ットする(ステップS32)。着目子ノードとしてS3
3以降の処理を受けたものについては、各親ノードのレ
ベルごとに記憶しておく。”seem”からは子ノード
が3つ下がっているが、最初なのでまだどれも処理済み
でない。そこで、一番左の”it”を子ノードにセット
する。
【0054】親ノードと子ノードのポインタセットを終
えたら、ステップS33に進み、句・節認識/翻訳形態
選択規則4dの各規則との部分構造の照合を行う。図5
及び図6に規則の記述例を示す。ここには、規則の例と
して、16種類を挙げている。それぞれ、部分構造のマ
ッチングパターン(MP)、書き換えパターン(T
P)、適用条件、アクション、適用語の着目親ノードの
移動先の5つの部分からなる。MPの中の”0”は着目
親ノード、”1”は着目子ノード、他の数字は構造参照
先の任意のノードであり、”COORD”,”SUB
S”,”ADVCLS”などは、ノードとノードをつな
ぐアーク名である。条件部の”0.top=y10.
form=cls”は、親ノードが”(top y)か
(form cls)という素性を持つことを限定して
いる。アクション部の”1−>(trans 1)”
は、”1”のノードに対しては翻訳形態として「第1言
語の文字列のまま」であることを選択したことを示
す。”(trans 1)”を付与されないノードに関
しては第2言語の形態で翻訳することを示すものとして
いる。規則との照合に関しては、(1)より順に行って
いく。以下に、簡単に16個の規則の対応内容を説明し
ておく。
【0055】(1)[等位節]+[等位接続詞]+[等
位節] (対象例文)He is a doctor and she is a teacher. (2)[主節]+[従属副詞節] (対象例文)Tought he did his best, he didn't succ
eed in the undertaking. (3)[動詞]+[whether節以外のWH節] 「3−>(sw 2.sw)(trans 1)(ka
kko y)」 は、ノード”3”の訳語として、ノード”2”の原語文
字列を当て、生成時には括弧で括って生成することを指
定する。
【0056】(対象例文)Idon't know who will come. (4)[動詞]+[whether節」 (対象例文)He doesn't whether he should study or
play. (5)[動詞]+[that節] (対象例文)I expect that I can get permission. (6)形式主語構文(真主語がwhether節以外の
WH節) (対象例文)It is a mystery why he killed himself. (7)形式主語構文(真主語がwhether節) (対象例文)It is doubtful whether he will succee
d. (8)形式主語構文(真主語がthat節) (対象例文)It seems that he is lying. (9)形式主語構文(真主語がto−不定詞) (対象例文)It is difficult to teach him. (10)群前置詞句(およびその相当句) 「1.idiom=y」は慣用句的表現であることを指
定する。
【0057】「1.wdnum>1」は複数の単語から
なっていることを指定する。
【0058】(対象例文)According to today's pape
r, the Prime Minister comesback to Japan tonight. (11)関係節 「!COORD」は並列句を伴わないことを指定する。
【0059】(対象例文)The road which leads to th
e station (12)同格節(whether節以外のWH節) (対象例文)The mystery why he killed himself (13)同格節(whether節) (対象例文)The doubt whether he will succeed (14)同格節(that節) (対象例文)The news that the Prime Minister comes
back to Japantonight (15)名詞句を後置修飾する不定詞 (対象例文)The ability to make a big plan (16)名詞句を後置修飾する動詞句 「3.ocunm<1.ocunmは」原文中での生起
順序が”1”のほうが後であることを指定する。これと
「!*_3」より、被修飾名詞と動詞句は隣接すること
を指定する。
【0060】(対象例文)The device comprising AAA,
BBB, CCC, and DDD 再び、ステップS33の処理の説明に戻る。”see
m”と”it”は”SUBJ”でつながれているが、規
則の中には”0(SUBJ_1...”というものはな
い。すなわち、条件に合う規則がないので、ステップS
34に進み、子ノード”it”に親ノードボタンを移動
する。続いてステップS36で新しく着目子ノードにセ
ットすべき子ノードが残っているかチェックする。しか
し、”it”は構造の最下位のノードであるので、ステ
ップS37へ進む。ステップS37では現親ノード”i
t”がトップノードであるかをチェックする。トップノ
ードではなくので、ステップS38に進み、一段上のノ
ー”seem”に親ノードポインタを戻してステップS
36に進み、続いてステップS32で新しい着目子ノー
ドとして、”it”がセットされる。
【0061】ステップS33において、”seem”
と”lie”に関する構造と規則を照合すると、(8)
の規則のMP、条件に適合することがわかる。そこで、
ステップS35に進み、規則指定のTPに構造変換し、
アクションを適用する。この時点の構造を図7に示す。
規則適用後は、”Next node”に指定されるノ
ード(ここでは”seem”)に親ノードポインタを移
動する。
【0062】”seem”の下にはまだ着目子ノードに
セットすべきノードが残っているので、続くステップS
36を経てステップS32で”although”に子
ノードポインタをセットする。その後、ステップS33
で前回同様、規則との照合をする。すると”seem”
と”although”に関する構造は、(2)の規則
に適合することがわかる。そこで、ステップS35に進
み、規則指定のTPに構造変換し、アクションを適用す
る。この時点の構造を図8に示す。規則適用後は、”N
ext node”に指定されるノード(ここでは”s
eem”)に親ノードポインタを移動する。
【0063】”seem”の下には着目子とすべきノー
ドが残っていないので、ステップS36を経て、ステッ
プS37へ進む。”seem”はトップノードであるの
で、これ以上上位ノードはないため、句・節認識/翻訳
形態選択処理を終了する。
【0064】以上説明したように、基本的には意味・構
文解析結果の全ての2のノード間の関係を規則と照合し
て句・節認識/翻訳形態選択処理を行っていく。規則
に”Next node”の指定をすることにより、下
位構造については処理をジャンプさせたり、ある句・節
に埋め込まれた句・節の認識をさせることができる。図
5及び図6の記述例では、埋め込み処理を対象とした規
則は組みこまれていない。規則の内容はこの例に限定さ
れるものではなく、自由に追加・削除・修正できる。
【0065】句・節認識/翻訳形態選択処理を終える
と、前述の通り図2のステップS24の変換処理が行わ
れる。ここでは、図8に示したようなデータ中の個々の
ノードに対して、語彙部4a、変換規則4eを用いて第
2言語の概念構造に変換する処理を行うが、”(tra
ns 1)”が付与されているノードについては、入力
原文中の表層文字列を訳語に当てる。例えば、図8中
の”seem”については”seems”が当てられ
る。また、図8中の”that”のように句・認識/翻
訳選択択規則4dであらたに挿入されたノードついて
は、規則で指定された”sw”文字列を訳語に当てる。
図9は、図8に示したデータに変換処理を施した後のデ
ータの例である。
【0066】次に、図9に示したような変換結果から、
第1言語と第2言語の単語文字列の混じった文を、2言
語の文字列の境界部分については原文中での生起順序と
同じように生成する処理について簡単に説明する。図1
0は、図4に示した句・節認識/翻訳形態規則4dの適
用結果データを受けるための生成規則を簡単にした記述
例である。
【0067】生成処理は、概念構造のトップノードに対
して、左辺に”S”をもつ規則を適用することにより始
まる。右辺の各項は、着目ノード(初期状態はトップノ
ード)下に直接連結している部分構造を示し、その記述
順序は、生成の順序を示す。アルファベット大文字から
なる項はノードとノードを結ぶアーク名、”$”で始ま
る項は媒介変数、”*”は現在着目のノードである。左
辺にアーク名を持つ規則の適用にはいる時に着目ノード
は当該アークの直下のノードに移り、当該規則の最後の
項の処理を終えると、当該アークの直上のノードに着目
ノードが移動する。
【0068】アーク名直後の”{...}”は、当該ア
ーク直下の部分構造の素性を指定するためのものであ
る。規則(1)の”XADVCLS{ocnum<*.
ocnum}”は、原文において主節よりも前方に生起
していた”XADVCLS”を示す。一方、同規則の”
{...}”のない”XADVCLS”は、”XADV
CLS{ocnmu<*.ocnmu}”に当てはまら
ない、すなわち、主節よりも後方に生起していた”XA
DVCLS”を示す。
【0069】規則(2)の”*(yo){*_COOR
D.}|(si)”は、並列構造(COORD)が下が
っている場合には活用形を連用形(yo)に指定し、そ
れ以外は終止形(si)指定して生成させるための記述
である。
【0070】左辺および右辺の項の直後に記述される”
{...}”は、適用の際の条件を示す。左辺にある場
合は、当該規則の適用全体に関する条件、右辺の項の直
後にある場合は、その項以下の規則の適用に関する条件
である。例えば、規則(7)の”[*.pos=n&*
 ̄OBJ ̄1.trans=1]”は、着目ノード(O
BJアーク直下のノード)の品詞が”n”で、直上ノー
ドに素性”(trans 1)”があることを条件付け
ている。
【0071】”<* ̄OBJ ̄1.ojosi>”は、
着目ノードの直上のノードの素性”ojosi”(目的
語に付ける助詞相当表現)を文字列として生成させるた
めの記述である。
【0072】以下、図5及び図6の規則を使って、図9
の構造から出力文の語順を決定する手順を追っていく。
まず、着目ノードを”seems”に設定し、規則
(1)の右辺を順番に見ていく。最初の項”XADVC
LS{ocnum<*.ocnum}”を”seem
s”の直下の構造と比較してみる。”XADVCLS”
はあるが、これは原文においては主節より後方に生起し
た構造であるので、条件”{ocnum<*.ocnu
m}”に当てはまらない。そこで、次の項のチェックに
移る。同様に、”ADVCLS”も”XADVP{oc
num<*.ocnum}”も”seems”の下には
存在しない。次i”$SETSU”の処理に入る。
【0073】$SETSU”は媒介変数である。着目規
則は”$SETSU”を左辺に持つ規則(2)に移る
が、着目ノードの移動はしない。まず、(2)の最初の
項”XSUBJ”を”seems”直下の構造と比較す
る。これは存在しているので、着目ノードを”it”に
移動すると共に規則(3)の処理に移る。規則(3)で
は、最初に着目ノード自身”it”を生成する。続い
て、”SUBS”の生成を指定しているが、”SUB
S”は”it”の下にないので、規則(3)の適用は終
了し、規則(3)を呼んだ規則(2)の”XSUBJ”
の直後の位置に立ち返り、着目ノードも”seem
s,”に戻る。
【0074】続く”SUBJ”,”ADV”,”ADV
P”,”XOBJ”,”OBJ”,”COMP”は”s
eems”の直下に存在しないので、次の”*(yo)
[*_COORD.]|(si)”に進む。着目ノード
は並列構造(COORD)は存在しないので、自分自身
終止形で生成する。ただし、”seems”には訳語と
して第1言語の文字列”seems”があてられている
ので、日本語の活用情報自体は出力文上には現われな
い。これで、規則(2)の適用が終了し、規則(2)を
呼んだ規則(1)の”$SETSU”の直後の位置に立
ち返る。着目ノードの移動はない。
【0075】続く”XADVP”はないので”XRSU
BJ”の処理に入る。”seems”の直下に”XRS
UBJ”は存在するので、規則(14)の適用に入る。
規則(14)では自分自身”that”を生成した
後、”SUBS”の生成を指定している。”that”
の下に”SUBS”はあるので、規則(13)の適用に
入る。着目ノードは”うそをつく”に移る。
【0076】規則(13)は媒介変数”$SETSU”
を呼んでいるだけなので、規則(2)の適用を行う。規
則(2)の右辺の内、下方アークで存在するのは”SU
BJ”でけである。”SUBJ”以下を生成するため、
規則(4)を適用する。着目ノードは”彼”に移る。規
則(4)の右辺では媒介変数”$MEISHIKU”
(規則(17))を呼ぶ。規則(17)では”彼”が生
成され、続いて、規則(4)に戻り格助詞”は”を生成
する。その後規則(2)に戻り、自分自身”うそをつ
く”を終止形指定で生成する。(これは最終的には”
(aspect prog)”という進行相の情報が加
味され、出力文中では「うそをついている」と生成され
る。)これで、規則(13)の”SUBS”の適用が終
了し、続いて規則(1)の右辺の”XRSUBJ”以下
の生成が終了する。着目ノードは”seems”に移
る。
【0077】次の項は”XADVCLS”であり、これ
は”seems”の下に存在するので、規則(9)を適
用する。規則(9)の左辺の最初の項””,”[*.o
cnum>* ̄XADVCLS ̄1.ocnum]”
は、原文中で”XADVCLS”が主節の後方に生起す
る場合には”,”(コンマ)を生成することを指定して
いる。この条件は今回の例に当てはまるので”,”が生
成される。次に自分自身”although”を生成
し、続いて”SUBS”以下の生成を指定している。”
SUBS”以外は、同様に規則(13),規則(2)の
適用により、”彼”,”は”,”私”,”に対し
て”,”誠実である”が順に生成される。
【0078】最後に規則(1)の最後の項”.”(ピリ
オド)が生成されて、一文全体の生成処理を終了する。
【0079】以上の語順を決定する処理の後に、”(t
rans 1)”を持つ訳語の隣り合うところ、およ
び”(trans 1)もつ訳語と持たない訳語のとな
りあうところ、コンマの後にはブランクを挿入する処理
を施し、最終的に出力文としては「It seems
that彼はうそをついている,although彼は
常に私に対して忠実である.」が生成される。また、上
で個の規則の説明に添えた例文に対する出力文は以下の
通りである。
【0080】(1)彼は医者である,and 彼女は先
生である。
【0081】(2)Though 彼は最善を尽くし
た、彼はその企てに成功しなかった. (3)私は分らない(who)誰が来るのか. (4)彼は分らない(whether)彼は勉強すべき
か遊ぶべきか. (5)私は期待する that 私は許可を得ることが
できる. (6)It is 謎(why)なぜ彼は自殺したの
か. (7)It is 疑わしい(whether)彼は成
功するかどうか. (8)It seems that 彼はうそをついて
いる. (9)It is 難しい to 彼に教える. (10)According to 今日の新聞.総理
大臣は今夜日本に戻る. (11)道路(which) 駅に通じる. (12)謎(why)なぜ彼は自殺したのか (13)疑い(whether)彼は成功するかどうか (14)ニュース that 総理大臣が今夜日本に戻
る (15)能力 to 大きな計画を立てる (16)装置 comprising AAA、BB
B、CCCおよびDDD 以上説明したように、本実施例の機械翻訳システムによ
れば、句・節認識/翻訳形態選択規則4dの記述の仕方
次第で、適当な句・節の単位ごとに第1言語の単語文字
列のまま出力文に生成するか第2言語に変換するかを調
整することができる。その結果、構文のパターン的な骨
格部分を第1言語で生成し、他の情報の肉部分を第2言
語に変換するなどの調整も可能となる。全く全体を第2
言語に変換した訳文に比べ、句・節の出力文中での生起
順序を原文に合わせているので、通常の構造変換による
曖昧性の生成もおさえることができるし、原文の論旨を
おって読み進める上でも無理が少なくなるという利点が
ある。
【0082】なお、本発明は上記実施例に限定されるも
のではない。上記実施例では、句・節の認識と翻訳形態
の選択を結合し、一つの規則の枠組みで実現していが、
これは勿論別個の処理として切り離して行ってもいい
し、規則として処理しなくても処理アルゴリズムに埋め
込んでもよい。また、上述のとおり、上記実施例で用い
た句・節認識/翻訳形態選択規則4dで扱った句・節の
組み合わせに限定されるもんではなく、あらゆるパター
ン、パターンの組み合わせについて対象とすることは可
能である。
【0083】また、本実施例では英日翻訳を例に説明し
たが、その言語対の種類についてもこれらに限定される
ものではなく、全ての自然言語対についても適用可能で
ある。
【0084】次に、請求項1に記載の機械翻訳システム
の第1の変形態様の実施例について説明する。
【0085】図11は、本発明の一実施例としての機械
翻訳システムの構成を示したブロック図である。これ
は、翻訳形態指定部106を除けば、請求項1に記載の
機械翻訳システムの実施例で説明した図1のブロック図
と同じである。翻訳形態指定部106は、句・節の種類
およびその組み合わせごとに翻訳形態をユーザに指定さ
せるもので、その指定結果は、句・節認識/翻訳形態選
択手段103aにより句・節認識/翻訳形態選択規則1
04dを用いて各種句・節を含む文の中の各部分構造の
翻訳形態を選択する処理に反映される。
【0086】翻訳形態指定部106は、制御部102に
接続されている。ユーザから入力部101を通じて翻訳
形態指定部106を起動させるためのキー/コマンド入
力あるいはマウス操作がなされると、制御部102は翻
訳形態指定部106に起動のための信号を送る。翻訳形
態指定部106は信号を受けると、ユーザの翻訳形態の
選択を促すための画面表示信号を102へ送り、出力部
105へ選択促進画面が表示される。図12は、ユーザ
に翻訳形態の選択を促進するため画面表示の一例であ
る。
【0087】本実施例における翻訳形態選択部106が
ユーザに提供する翻訳形態についての選択肢はAからI
までの9種類で、それぞれ、句・節認識/翻訳形態選択
規則104d(規則の内容は句・節認識/翻訳形態選択
規則4dで説明したものと同一)と以下のような対応関
係にある。
【0088】 A−−>(1) B−−>(2) C−−>(3),(4),(5) D−−>(6),(7),(8),(9) E−−>(10) F−−>(11) G−−>(12),(13),(14) H−−>(15) I−−>(16) ユーザによる処理対象項目の選択が終了すると、制御部
102は、その選択内容を翻訳部1103におくる。翻
訳部103は、ユーザにより処理対象として指定されな
かった項目に対応する句・節認識/翻訳形態選択規則1
04dにマスキングを施し、実質的に当該規則を句・節
認識/翻訳形態選択規則104dから削除する処理をす
る。この後の原文入力、翻訳処理、出力文生成に関して
は、請求項1に記載の機械翻訳システムの実施例で説明
した内容と同じであるので詳しい説明を省略する。同じ
入力例文「It seems that is lying, althought he is
always faithful to me.」に対して翻訳形態選択部10
6の効果を説明すると、ユーザが図12のBのみを処理
対象として選択しなければ、出力文は次のようになる。
「彼は常に私に対して誠実であるが、It seems
that 彼は嘘をついている.」 一方、ユーザが図11のDのみを処理対象として選択し
なければ、出力文は次のようになる。「彼はうそをつい
ているようである,althought 彼は常に私に
対して誠実である.」 なお、上記実施例の翻訳形態選択部106は、ユーザに
選択を促す選択肢として、句・節認識/翻訳形態選択規
則104dに直結したものを提供するようにしていた
が、当然のことしながら、それはあくまでも一実施方法
である。もっと抽象化させた選択肢にしておき、規則と
の対応を複雑にする方法もある。また、図11であげた
ようなレベルの選択肢にするにしても、どの句・節を第
1言語にするか、第2言語にするか、という選択を可能
にさせることも実施形態としてはありえる。その際に
は、ユーザの指定により、規則中のアクション部分(特
に素性”trans”に関する部分)を自動追加・削除
・修正するような規則調整ルーチンを設けるようにす
る。本実施例ではこれを、単純なマスキングのみで対応
している。
【0089】次に請求項2に記載の機械翻訳システムの
実施例について説明する。
【0090】図13は、本発明の一実施例としての機械
翻訳システムの構成を示したブロック図である。入力部
121は制御部122に接続され、制御部122は出力
部127に接続される。また、制御部122は翻訳部1
23と、翻訳部123は辞書部134とそれぞれ双方向
に接続される。また、翻訳部123は、翻訳形態選択手
段123aを有し、辞書部124は、標準用語語彙部1
24a、専門用語語彙部124b、形態素解析規則12
4c、構文・意味解析規則124d、変換規則124
e、生成規則124fを有する。
【0091】入力部121、出力部125についての機
能、形態は、請求項1に記載の機械翻訳システムの実施
例として説明した図1中の入力部1、出力部5と同じで
あるので、説明を省略する。
【0092】入力部121より処理対象の原文が入力さ
れると、制御部122へ送られる。制御部122は、原
文のデータを翻訳部123へ送る。翻訳部123は、辞
書部124の知識・規則を利用して、入力原文に対し
て、第2言語の文あるいは第1言語の文字列を含んだ第
2言語の文への翻訳処理を行う。翻訳処理を終了する
と、その翻訳結果は制御部122を通じて出力部125
へ送られ、一通りの処理を終える。
【0093】次に、翻訳部123において、翻訳形態選
択手段123a、辞書部124を用いて、原文中の専門
用語については訳語として第1言語の文字列を当て、第
2言語の訳語文字列の中に第1言語の単語文字列を含ん
だ訳文を生成する翻訳処理について、英日翻訳を例にと
って説明を行う。
【0094】図14は、翻訳部123における翻訳処理
の流れを示すフローチャートである。まず、翻訳部12
3に入力文が送られてくると、入力文に対して辞書部1
24中の標準用語語彙部124a、専門用語語彙部12
4bと、形態素解析規則124cを用いて、形態素解析
・辞書引き処理を行い、その品詞・訳語など翻訳処理に
必要な各種情報を求める。その際に、辞書引き処理が成
功した見出し語の各々については、標準用語語彙部12
4aと専門用語語彙部124bのどちらかに収容されて
いる語彙かに関する情報の付与を行う(ステップS13
1)。例えば、入力文を「The distributed filesystem
permits client systems to access shared files on
a remote system.」とすると、ステップS131の結
果、図15に示すような形態素解析・辞書引き結果が得
られる。図15中の”(dic coomm)”,”
(dic tech)”,”(dic comm te
ch)”がどの語彙部に収容されている見出し語かを示
す情報である。”comm”は標準用語語彙部124
a、”tech”は専門用語語彙部124dであること
を示す。両方の語彙部に収容されている見出し語には”
(dic comm tech)”が付与されている。
【0095】形態素解析・辞書引き結果は、構文・意味
解析過程に送られ、構文・意味解析規則124cを用い
て構文・意味解析処理が行われる(ステップS13
2)。具体的には、図15に示す複数の品詞候補から構
文的に適切な品詞列を選び、第1言語の概念構造木を構
築する。図16は図15の形態素解析・辞書引き結果に
対する英語の概念構造の例である。
【0096】構文・意味解析結果である第1言語の概念
構造は、構造変換過程に送られる。構造変換過程では、
標準用語語彙部124a、専門用語語彙部124bと、
変換規則124eを用いて、概念構造中の個々のノード
に着目して、第2言語の構造に変換したり、訳語を付与
する処理を行う(ステップS133)。この際に、翻訳
形態選択手段123aにより、専門用語情報をもつノー
ドに対しては、専門用語語彙部124bと、変換規則1
24eに定義されている第2言語の訳語を訳語として当
てずに第1言語の単語文字列を訳語に当てる処理を行
う。
【0097】図17は、一つのノード対する構造変換・
訳語設定の処理の流れを示すフローチャートである。最
初にステップS161で、着目ノードに専門用語情報が
あるかどうかをチェックする。図16に示したよう
に、”(dic tech)”あるいは”(dic c
omm tech)”が専門用語の情報である。専門用
語情報のない語、すななわち標準用語については、標準
用語語彙部124a、変換規則124eを用いて通常の
構造変換・訳語設定の処理を行う(ステップS16
2)。
【0098】専門用語情報のあるノードついては、ステ
ップS163に進み、専門用語語彙部124b、変換規
則124eに該当する本館規則があるかどうかをチェッ
クする。該当する規則があれば、規則に従って構造変換
を行う(ステップS164)。
【0099】該当する構造変換規則のないものもあるも
のも、その後ステップS165へ進み、着目ノードの品
詞による場合わけを行う。本実施例では、専門用語語彙
部124bには、名詞、動詞、形容詞以外は含まれない
ものとしている。
【0100】形容詞である場合は、さらにステップS1
66で、「限定用法でかつ修飾先も専門用語か」どうか
をチェックする。限定用法ではないか、あるいは修飾先
が専門用語でない場合にはステップS167に進み、訳
語として、「入力文字列」に形容動詞の活用語尾を付加
したものを設定し、処理を終了する。それ以外の形容詞
については、ステップS169で「入力文字列」そのも
のを訳語として設定して処理を終了する。これにより、
例えば、「aperiodic antenna」とい
う句において、”aperiodic”が専門用語の形
容詞であり、”antenna”も専門用語である場合
には、出力文においては「apepiodic ant
enna」と生成し、”antenna”が専門用語で
ない場合には、”aperiodic”に形容動詞の活
用語尾を付与することにより「aperiodicなア
ンテナ」のような句の生成を行う。また、叙述用法の場
合にも形容動詞の活用語尾を付与することにより「ap
eriodicである」などの生成を行う。
【0101】動詞の場合は、ステップS168で、「入
力文字列」にサ行変格活用の活用語尾を付与したものを
訳語に設定し、目的語を受ける格助詞には、通常の処理
で付与それる訳語に用いられる格助詞類を設定し、処理
を終了する。これにより、例えば「access th
e file」という句において、”access”が
専門用語の動詞である場合、格助詞には通常訳語
「(に)アクセスする」の「に」が設定され、「ファイ
ルにaccessする」が生成される。
【0102】名詞の場合は、ステップS169で「入力
文字列」そのものを訳語として設定して処理を終了す
る。
【0103】ただし、これら品詞に共通の処理として、
入力単語が、文頭であるだけの理由で語頭が大文字化さ
れている場合は、語頭を小文字化した文字列を訳語に設
定する。強調のために、単語全体が大文字化されていた
り、文頭以外であったり、直後の語にも大文字化が見ら
れる場合には、入力文字列をそのまま利用する。ただ
し、動詞が過去分詞形、過去形の時、形容名詞、副詞が
比較級・最上級のときは原形に変換する。
【0104】以上の処理を図16に示した概念構造の各
ノードに対して施した後の第1言語の文字列ノードを含
んだ第2言語の概念構造を図18に示す。図16中の”
client system”,”distribut
ed filesystem”,”file”,”sy
stem”はそれぞれ入力文字列である”client
systems”,”distributed fi
lesystem”,”file”,”system”
に置き代わっている。
【0105】ここで、再び、図14を用いた翻訳部12
3の処理の流れの説明に捩る。ステッププS133の処
理を経て、生成された第1言語の文字列ノードを含んだ
第2言語の概念構造はステップS134の生成過程に送
られる。ここでは、生成規則124fを用いて、最終的
に生成される出力表層文を生成する処理を行う。これ
で、翻訳処理全体が終了したことになる。図18の構造
からは、最終的に「distributed file
systemは、client systemが遠隔の
system上の共有filesにaccessするこ
とを許す。」が出力文として生成される。
【0106】以上説明したように、本実施例の機械翻訳
システムによれば、入力文中の専門用語については入力
文字列のまま生成する訳文を得ることができる。専門用
語については知識のあるユーザにとっては、第2言語へ
の変換による意味のあいまい性の発生を回避することに
もなり、有効である。
【0107】なお、上記実施例では専門用語の分野につ
いては区別を設けていなかったが、当然ながら専門用語
情報は、分野情報であってもよく、個々の分野ごとに独
立した辞書部を形成していてもよい。また、語彙部は共
通に1つとし、個々の見出し語に対して、どの分野用語
であるかの分野情報を持つように構成することも可能で
ある。
【0108】専門用語のうち、第1言語の文字列を訳語
とするものの対象としても、本実施例では、名詞、動
詞、形容詞としたが副詞などの他の品詞も対象とするこ
とも可能であるし、また、対象を名詞だけに限定すると
か、合成語だけに限定するなどの様々なバリエーション
も可能である。
【0109】また本実施例では英日翻訳を例に説明した
が、その言語対の種類についてもこれに限定されるもの
ではなく、全ての自然言語対についても適用可能であ
る。
【0110】次に、請求項2に記載の機械翻訳システム
の第1の変形態様の実施例について説明する。
【0111】図19は、本発明の一実施例としての機械
翻訳システムの構成を示したブロック図である。入力部
181は制御部182に接続され、制御部182は出力
部187に接続される。また、制御部182は翻訳部1
83、分野判定部186と双方向に接続され、翻訳部1
83と分野判定部186も双方向に接続される。また、
翻訳部183は辞書部184とも双方向に接続される。
翻訳部183は、翻訳形態選択手段183aを有し、辞
書部184は、標準用語語彙部184a、専門分野1〜
n語彙部184b、形態素解析規則184c、構文・意
味解析規則184d、変換規則184e、生成規則18
4fを有する。
【0112】入力部181、出力部185についての機
能、形態は、請求項1に記載の機械翻訳システムの実施
例として説明した図1中の入力部1、出力部5と同じで
あるので、説明を省略する。
【0113】入力部181より処理対象の原文書の一部
あるいは全部が入力されると、制御部182へ送られ
る。制御部182は、入力データを分野判定部186に
送る。
【0114】分野判定部186は、翻訳部183中の形
態素解析手段(図示しない)と辞書引き手段(図示しな
い)を起動し、辞書部184中の専門分野1〜n語彙部
184bに対して入力データ中の語彙の辞書引き処理を
行うよう、翻訳部183に信号を送る。入力データ中の
全ての語彙について専門分野1〜n語彙部184bに対
する辞書引きが終わると、その結果は、翻訳部183か
ら分野判定手段186へ送られる。本実施例の分野判定
手段186は、その結果、最も入力データ中に生起頻度
の高い専門分野1分野を、当該文書の分野であると判定
する。専門分野の数は、1つに限定せず、ある一定値以
上の頻度で生起する用語の分野を複数対象分野と判定す
る実施方法も有効である。処理の詳細としては、参考文
献[1]の分野推定部の処理、[2]の辞書分野判定手
段に説明されているので、ここでは省略する。
【0115】分野判定処理が終了すると、分野判定部1
86は判定決とともに制御部182へ信号を送る。続い
て、制御部182は、判定結果と入力データを翻訳部1
83へ送る。翻訳部183は、辞書部184の知識・規
則を利用して、入力原文に対して、第2原語の文あるい
は第1言語の文字列を含んだ第2言語の文への翻訳処理
を行う。翻訳処理を終了すると、その翻訳結果は制御部
182を通じて出力部185へ送られ、一通りの処理を
終える。
【0116】翻訳部183において、翻訳形態選択手段
183a、辞書部184を用いて、分野判定部186の
判定結果に基づき、原文中の特定専門用語については訳
語として第1言語の文字列を当て、第2言語の訳語文字
列の中に第1言語の単語文字列を含んだ訳文を生成する
翻訳処理の大まかな処理の流れは、図14に示した請求
項3に記載の機械翻訳システムの実施例の翻訳部123
の流れと同じである。
【0117】詳細部分の差異としては、第一に、形態素
解析・辞書引き処理の結果付与される専門用語情報が、
単に”(dic tech)”ではなく、専門分野1〜
n語彙部184bの中のどの語彙部に登録されていた語
であるかを示す情報に代わるという点がある。例えば、
専門分野2語彙部と専門分野4語彙部とに登録されてい
るものには、”(dic 2 4)”という情報が付与
される。
【0118】第二の差異は、変換処理ステップS133
の訳語を付与する処理である。具体的には、図17中の
ステッププS161で、構文・意味解析結果中の各々の
ノードに対し、専門用語情報の有無をチェックする処理
を、図20に示したような、専門用語情報中に分野判定
部186の判定した分野の値が含まれるかどうかをチェ
ックする処理(ステップS191)に置き換えること
で、本実施例の変換処理は説明できる。この判定で、着
目ノードが、分野判定部186の判定結果の分野と一致
しない場合は、ステップS162以降の処理を施し、一
致する場合は、ステップS163以降の処理を施す。
【0119】以上説明したように、本実施例の機械翻訳
システムによれば、ユーザが指定することなく自動的に
原文書の専門分野の判定を行い、その分野の用語につい
ては入力文字列のまま生成する訳文を得ることができ
る。
【0120】上記実施例では、専門分野1〜n語彙部1
84bを標準用語語彙部184aと独立に設けている
が、語彙部は共通に1つとし、個々の見出し語に対し
て、どの分野であるかの分野情報を持つように構成する
ことも可能である。
【0121】次に、請求項2に記載の機械翻訳システム
の第2の変形態様の実施例について説明する。
【0122】図21は、本発明の一実施例としての機械
翻訳システムの構成を示したブロック図である。入力部
201は制御部202に接続され、制御部202は出力
部207に接続される。また、制御部202は翻訳部1
83、翻訳形態指定部206と双方向に接続され、さら
に翻訳部203は、辞書部204と双方向に接続され
る。翻訳部203は、翻訳形態選択手段203aを有
し、辞書部204は、標準用語語彙部204a、専門分
野1〜n語彙部204b、形態素解析規則204c、構
文・意味解析規則204d、変換規則204e、生成規
則204fを有する。
【0123】この構成は、翻訳形態指定部206を除け
ば、請求項3に記載の機械翻訳システムの実施例で説明
した図1のブロック図と同じである。翻訳形態指定部2
06は、入力原文中の専門用語のうち、訳文中に第1言
語の文字列のまま生成させたいものの、品詞の種類、専
門分野の種類をユーザに指定させるもので。その指定結
果は、翻訳形態選択手段203aにより、構文・意味解
析結果中の個々のノードに対して訳語を設定する処理に
反映される。
【0124】ユーザから入力部201を通じて翻訳命令
てあるキー/コマンドの入力あるいはマウス操作がなさ
れると、制御部202は翻訳形態指定部206に起動の
ための信号を送る。翻訳形態指定部206は信号を受け
ると、ユーザの翻訳形態の選択を促すための画面表示信
号を制御部202へ送り、出力部205へ選択促進画面
が表示される。図22は、ユーザに翻訳形態の選択を促
進するための画面表示の一例である。図中の専門用語辞
書の種類に挙げられている項目の各々は、辞書部214
の専門分野1〜n語彙部204bの各々に対応する。ユ
ーザの指定が終わると指定結果は、制御部202に送ら
れる。
【0125】指定結果を受け取った制御部202は、出
力部205を通じて翻訳対象の原文の入力をユーザに促
す。入力部201より原文が入力されると、制御部20
2は、ユーザ指定結果と入力データを翻訳部203へ送
る。翻訳部203は、辞書部204の知識・規則を利用
して、入力原文に対して、第2言語の文あるいは第1言
語の文字列を含んだ第2言語の文への翻訳処理を行う。
翻訳処理を終了すると、その翻訳結果は制御部202を
通じて出力部205へ送られ、一通りの処理を終える。
【0126】翻訳部203において、翻訳形態選択手段
203a、辞書部204を用いて、翻訳形態指定部20
6によりユーザが指定した結果に基づき、原文中の特定
専門用語については訳語として第1言語の文字列を当
て、第2言語の訳語文字列の中に第1言語の単語文字列
を含んだ訳文を生成する翻訳処理の大まかな処理の流れ
は、図14に示した請求項2に記載の機械翻訳システム
の実施例の翻訳部123の流れと同じである。
【0127】詳細部分の差異としては、第一に、形態素
解析・辞書引き処理の結果付与される専門用語情報が、
単に”(dic tech)”ではなく、専門分野1〜
n語彙部184bの中のどの語彙部に登録されていた語
であるかを示す情報に代わるという点がある。例えば、
専門分野1語彙部と専門分野2語彙部とに登録されてい
るものには、”(dic 1 2)”という情報が付与
される。実際の専門用語辞書の種類を図22にあげた8
種類とすると、専門分野1語彙部は「情報処理」分野、
専門分野2語彙部は「電気・電子」分野の辞書、、、と
いうように対応させる。
【0128】第二の差異は、変換処理ステップS133
の訳語を付与する処理てである。具体的には図17中の
ステップS161で、構文・意味解析結果中の各々のノ
ードに対し、専門用語情報の有無をチェックする処理
を、22に示したような、専門用語情報中に翻訳形態指
定部206によりユーザが指定した辞書分野の値が含ま
れるか(ステップS221)、および品詞はユーザが指
定した品詞と一致するか(ステップS222)をチェッ
クする処理に置き換えることで、本実施例の変換処理は
説明できる。いずれかの判定で、ユーザ指定内容と一致
しないノードについては、ステップS162以降の処理
を何処し、いずれも一致するノードについては、ステッ
プS163以降の処理を施す。
【0129】以上説明したように、本実施例の機械翻訳
システムによれば、ユーザが訳文中に言語の文列のまま
生成してほしい用語の専門分野や品詞を簡単に指定で
き、それに応じた訳文を得ることができる。
【0130】なお、上記実施例では、専門分野と品詞の
指定は独立に行うように構成しているが、辞書ごとに異
なった品詞の選択を行えるようにすることも可能であ
る。そのためには、ユーザ指定結果を辞書の種類と品詞
との組み合わせで記憶し、変換処理時に対象語どうかを
判定する際にも組み合わせて判定するようにすればよ
い。
【0131】次に、請求項3に記載の機械翻訳システム
の実施例について説明する。
【0132】図1は、本発明の一実施例としての機械翻
訳システムの構成を示したブロック図である。入力部2
31は制御部232に接続され、制御部232は出力部
237に接続される。また、制御部232は翻訳部23
3と、翻訳部233は辞書部234とそれぞれ双方向に
接続される。また、翻訳部233は、翻訳形態選択手段
233aを有し、辞書部234は、語彙部234a、形
態素解析規則234b、構文解析規則234c、意味解
析規則234d、変換規則234e、生成規則234f
を有する。
【0133】入力部231、出力部235についての機
能、形態は、請求項1に記載の機械翻訳システムの実施
例として説明した図1中の入力部5と同じであるので、
説明を省略する。
【0134】入力部231より処理対象の原文が入力さ
れると、制御部232へ送られる。制御部232は、原
文のデータを翻訳部233へ送る。翻訳部233は、辞
書部234の知識・規則を利用して、入力原文に対し
て、第2言語の文あるいは第1言語の文字列を含んだ第
2言語の文への翻訳処理を行う。翻訳処理を終了する
と、その翻訳結果は制御部232を通じて出力部235
へ送られ、一通りの処理を終える。
【0135】次に、翻訳部233において、翻訳形態選
択手段233a、辞書部234を用いて、原文中の単語
の意味が単一に決定できない場合は、当該単語の訳語と
して、第1言語のままの文字列を設定し、他の部分につ
いては第2言語の文に変換して訳文を生成する翻訳処理
について、英日翻訳を例にとって説明を行う。
【0136】図25は、翻訳部233における翻訳処理
の流れを示すフローチャートである。まず、翻訳部23
3に入力文が送られてくると、入力文に対して辞書部2
34中の語彙部234aと形態素解析規則234bを用
いて、形態素解析・辞書引き処理を行い、その品詞・訳
語など翻訳処理に必要な各種情報を求める(ステップS
241)。次に、構文解析規則234cを用いて構文解
析処理を行う(ステップS242)。
【0137】構文処理解析が終了すると、ステップS2
43において、意味解析規則234dを用いて意味解析
処理を行う。日本語を第1言語とする場合には、動詞、
形容詞、形容動詞などの用言と格要素の間の意味関係の
解析が行われる。その他の言語の意味解析に共通な処理
としては、並列構造、修飾・被修飾構造の解析など、係
り受け関係の解析がある。それ以外に重要な意味処理で
ある語義の解析は、本実施例では、続くステップS24
4の構造変換処理の一環に組み込んで行う。
【0138】構造変換処理では、構文解析・意味解析処
理を経てえられる第1言語の概念構造を第2言語の概念
構造に変換する処理を行うが、その際に、翻訳形態選択
手段233aを用いて、語義が1つの定められない語訳
語としては、入力文中の表層単語文字列を生成する。
【0139】図26は、語彙部234a中の、見出し
語”Japanese”,”like”,”spea
k”に定義されている各種意味情報の定義例を示す図で
ある。「意味情報」には、当該見出し語自体の語義の違
いにつながる意味分類が定義され、「補助意味情報」に
は、他の語句の語義の解析に利用するための種々の情報
が定義されている。(個々の値の示す意味は、括弧の中
に付記した。)図27に示したのは、変換規則234e
のうち、”Japanes”が固有にもつ規則の記述の
一例である。先も書いたように、本実施例では、言語構
造から第2言語構造への変換処理の過程に、個々の語の
語義の解析処理も組み込んで構成している。個々の規則
は上位にあるものほど優先度が高く、(1)の規則から
順に適用を試み、適用条件に適合しない場合は順に下方
の規則へと適用を進めていく。個々の規則はそれぞれ、
部分構造のマッチングパターン(MP)、書き換えパタ
ーン(TP)、適用条件、アクションの4つの部分から
なる。MPの中の”1”は、構文・意味解析結果構造で
ある第1言語の構造中の着目ノード(当該規則の見出し
語)、他の数字は構造参照先の任意のノードであり、”
OBJ”,”COMP”,”SUBJ”などは、ノード
とノードをつなぐアーク名である。条件部の”0.se
m>ol”は、当該ノードの意味情報、補助意味情報
に”ol”が含まれることを限定し、(”>”のかわり
に”!>”なら含まれないことを限定する)、”0.v
ptn=SVC”は、当該ノード(ここでは動詞に相当
する)の文型が第2文型であることを限定している。ア
クション部には、一般に訳語、その他の訳出のための情
報の設定記述する。以下、(1)−(6)の規則の意図
を記述しておく。
【0140】(1)目的語に言語を取りやすい動詞の目
的語として用いられたとき 訳語−>「日本語」 (2)主語に意志を有するものを取りやすい動詞の主語
語として用いられたとき 訳語−>「日本人」 (3)第2文型の主語が人間で、主格補語に”Japa
nese”がきたとき 訳語−>「日本人」 (4)第2文型の主語が言語で、主格補語に”Japa
nese”がきたとき 訳語−>「日本語」 (5)第2文型の主語が”Japanese”で、目的
格補語に人間がきたとき 訳語−>「日本人」 (6)第2文型の主語が”Japanese”で、目的
格補語に言語がきたとき 訳語−>「日本語」 図27の規則によれば、(1)から(n−1)までの規
則に入力文の解析結果が適合しない場合は、(n)の規
則が適用され、訳語として、”’1.sw’”が設定さ
れる。これは、当該の語義が(n−1)までの規則で決
められなかった時に、入力文中の表層単語文字列を訳語
に設定することを意味している。
【0141】図28は、適用条件が適合し、適用規則が
決まった後の、書き換えパターンへの変換およびアクシ
ョン部の実行の処理の流れを示すフローチャートであ
る。
【0142】当該適用規則に書き換えパターン(TP)
が指定されていれば(ステップS2701)、ステップ
2702で指定通りの構造変換を行う。構造変換時の有
無にかかわらず、その後ステップS2703に進む。
【0143】ステップS2703以降では、アクション
部の実行を行う。図27の規則の記述例には、アクショ
ンとしては1つのノードに対する”TW”の設定しか記
述されていないが、訳出のための他の情報が設定・削除
されることもあるし、複数のノードに対する情報の設定
・削除が指定されることもある。その各々を1つづつ取
り出して処理をするのがステップS2704以降の処理
である。すべての指定アクションに対する処理が終了し
たところで、規則の適用が終了する。
【0144】一方、未処理アクションが残っている時
は、一つを取り出す。それが”TW”(訳語)以外の情
報の設定・削除の場合は通常の処理を行う(ステップS
2707)。”TW”に対するアクションである場合に
は、さらに設定内容が第2言語の文字列かどうかをチェ
ックする(ステップS2705)。第2言語の文字列で
ある場合には、通常の処理を行う(ステップS270
7)。
【0145】”TW”に対して第2言語の文字列以外、
すなわち、’1.sw’などを設定するアクションであ
る場合には、ステップS2706以降で、第1言語の入
力文字列を訳語に設定する処理を行う。その際には、品
詞によって処理を切り替える(ステップS2706)。
名詞である場合は、入力文字列そのものを訳語に設定す
る(ステップS2708)。形容詞の場合は、入力文字
列に形容動詞の活用語尾を付加して訳語に設定する(ス
テップS2709)。副詞の場合は、入力文字列に
「に」を付加して訳語に設定する(ステップS271
0)。動詞の場合は、入力文字列にサ行変格活用語尾を
付加して訳語に設定する(ステップS2710)。通
常、動詞の場合は、”TW”以外に目的語を受ける助詞
相当語の指定も合わせて記述される。例えば、”1−>
(TW’1.sw)(ojosiを)”のような記述で
ある。本実施例では、第1言語の入力文字列を設定する
ための規則は、名詞、形容詞、副詞、動詞のみに限定し
ている。これらいずれの品詞にも共通処理として、入力
単語が、文頭であるだけの理由で語頭が大文字化されて
いる場合は、語頭を小文字化し文字列を訳語に設定す
る。強調のために、単語全体が大文字化されていたり、
文頭以外であったり、直後の話にも大文字化が見られる
場合には、入力文字列をそのまま利用する。ただし、動
詞が過去分詞形、過去形の時、形容名詞、副詞が比較級
・最上級のときは原形に変換する。
【0146】上記処理(ステップS2708〜S271
1)の後、およびステップS2707の後は、ステップ
S2703に戻り、未処理アクションがなくなるまで処
理を続ける。
【0147】このような処理の結果、入力文「We s
peak Japanese.」の”Japanes
e”は図26の(1)の規則が適用でき語義が限定され
「日本語」が訳語として設定されるため、訳文として
「私達は日本語を話す。」が生成される。一方、「We
like Japanese.」の”Japanes
e”に対しては語義の限定ができず、(n)の規則が適
用され、「私達はJapaneseが好きである。」が
生成される。このように、語義の限定できない語につい
ては入力文字列を訳文中に導入すことにより、誤った概
念、ずれた概念の訳語を設定することによる意味内容の
歪んだ翻訳を回避し、ユーザに語義が曖昧であることを
知らせることができる。
【0148】なお、本実施例ては、当該入力文内の情報
のみを用いて語義の解析を行っているが、当然ながら、
当該文以前の文、以降の文において語義が限定されれ
ば、当該入力文において限定不可能でも、その情報を当
該文の翻訳に取り入れることは有効である。当該文以前
の文における情報を利用するには、1文ごとに語義の解
析、訳語の設定をしていくことも可能であるが、当該文
以降の文の情報も利用するには、文書全体の翻訳に先立
ち、語義を限定できた語の解析結果をデータとして蓄
え、その蓄えられたデータを用いて、改めて文書の翻訳
処理を行う方法が適している。(この技術については特
開平2−308370号公報を参照)。
【0149】本実施例で用いた語義を解析するための規
則は、各々の見出し語のリンクした語彙固有のものとし
たが、語彙によらず、概念をつなぐ構造をキーに語義を
解析する、一般的な規則を備えてもよい。また、本実施
例では、語義の解析処理を第2言語の構造への変換処理
に埋め込む形で実現したが、当然ながら分離することも
可能である。
【0150】次に請求項1に記載の機械翻訳システムの
第2の変形態様の実施例について説明する。本実施例と
請求項1に記載の発明との違いは、本実施例では、登録
の語と、句・節認識/翻訳形態手段により第1言語の文
字列を訳語として生成することを決定された語とを、出
力文中で区別して生成することを特徴とする点である。
【0151】この第2の変形態様の機械翻訳システムの
構成は、図1に示した請求項1に記載の発明の実施例の
構成と同じもので実現できる。個々の要素の説明は省略
する。
【0152】本実施例の翻訳部3における処理の流れ
は、図2を使って説明した請求項1に記載の発明の実施
例と同じであるので、本発明の特徴に当る部分だけをと
くに詳しく説明する。
【0153】入力文中の未登録語は、通常、形態素解析
・辞書引き処理(ステップS21)において未登録語と
判定される。未登録語の品詞を判定する際には次の構文
解析処理と協同する部分もある。(品詞推定に関する既
存技術としては参考文献[6],[7],[8]を参
照) 未登録語と判定された語は、通常、構造変換過程(ステ
ップS24)において、訳語として第1言語の入力文字
列が設定される。単純に入力文字列を訳語に当てると、
句・節認識/翻訳形態選択手段3aにより第1言語の文
字列を訳語として生成することを決定された語との区別
が出力文上でつかないため、本実施例では、この過程
で、未登録語は訳語に下線付きで出力されるための情報
を付与する(コードを埋め込むなど)。その結果、翻訳
部3での翻訳処理が終了し、制御部2を経て出力部5に
出力される際には、未登録語は下線付きで、それ以外は
下線なしでと、区別した表示がされる。
【0154】上記実施例では「下線」を区別に用いた
が、これは字体・字種の変更、種々な文字装飾(「網か
け」など)でもよい。同じアルファベットでもJISコ
ードに変換するかしないかで区別してもよい。また、上
記実施例では未登録語側に「区別」をほどこしたが、句
・節認識/翻訳形態選択手段3aにより第1言語の文字
列を訳語として生成することを決定された語のほうに
「区別」をほどこしてもよい。要するに、本発明の主旨
を逸脱しない範囲で種々変型して実施できる。
【0155】次に請求項2に記載の機械翻訳システムの
第3の変形態様の実施例について説明する。本実施例と
請求項2に記載の発明との違いは、本実施例では、登録
の語と、翻訳形態選択手段により第1言語の文字列を訳
語として生成することを決定された語とを、出力文中で
区別して生成することを特徴とする点である。
【0156】本実施例としての機械翻訳システムの構成
は、図13に示した請求項1に記載の発明の実施例の構
成と同じもので実現できる。個々の要素の説明は省略す
る。
【0157】本実施例の翻訳部123における処理の流
れは、図14を使って説明した請求項2に記載の発明の
実施例と同じであるので、本発明の特徴に当たる部分だ
けをとくに詳しく説明する。
【0158】入力文中の未登録語は、通常、形態素解析
・辞書引き処理(ステップS131)において未登録語
と判定される。未登録語の品詞を判定する際には次の構
文解析処理と協同する部分もある。(品詞推定に関する
既存技術としては特公平3−43661号公報、特開昭
58−175075号公報、特公平3−43662号公
報を参照) 未登録語と判定された語は、通常、構造変換過程(ステ
ップS133)において、訳語として第1言語の入力文
字列が設定される。この過程の処理の流れを示した図1
7中のステップS162の「通常の構造変換及び訳語設
定」で行われる。単純に入力文字列を訳語に当てると、
翻訳形態選択手段123aにより第1言語の文字列を訳
語として生成することを決定された語との区別が出力文
上でつかないため、本実施例では、この過程で、未登録
語は、訳語に下線付きで出力されるための情報を付与す
る(コードを埋め込むなど)。その結果、翻訳部123
での翻訳処理が終了し、制御部122を経て出力部12
5に出力される際には、未登録語は下線付きで、それ以
外は下線なしでと、区別した表示がされる。
【0159】上記実施例では「下線」を区別に用いた
が、これは字体・字種の変更、種々な文字装飾(「網か
け」など)などでもよい。同じアルファベットでもJI
Sコードに変換するかしないかで区別してもよい。ま
た、上記実施例では未登録語側に「区別」をほどこした
が、翻訳形態選択手段123aにより第1言語の文字列
を訳語として生成することを決定された語のほうに「区
別」をほどしてもよい。要するに、本発明の主旨を逸脱
しない範囲で種々変形して実施できる。
【0160】次に請求項3に記載の機械翻訳システムの
第1の変形態様の実施例について説明する。本実施例と
請求項3に記載の発明との違いは、本実施例では、未登
録の語と、翻訳形態選択手段により第1言語の文字列を
訳語として生成することを決定された語とを、出力文中
で区別して生成することを特徴とする点である。
【0161】本実施例としての機械翻訳システムの構成
は、図24に示した請求項6に記載の発明の実施例の構
成と同じもので実現できる。個々の要素の説明は省略す
る。
【0162】本実施例の翻訳部233における処理の流
れは、図25を使って説明した請求項6に記載の発明の
実施例と同じであるので、本発明の特徴に当たる部分だ
けをとくに詳しく説明する。
【0163】入力文中の未登録語は、通常、形態素解析
・辞書引き処理(ステップS241)において未登録語
と判定される。未登録語の品詞を判定する際には次の構
文解析処理と協同する部分もある。(品詞推定に関する
既存技術としては参考文献[6],[7],[8]を参
照) 未登録語と判定された語は、通常、構造変換過程(ステ
ップS244)において、訳語として第1言語の入力文
字列が設定される。単純に入力文字列を訳語に当てる
と、翻訳形態選択手段133aにより第1言語の文字列
を訳語として生成することを決定された語との区別が出
力文上でつかないため、本実施例では、この過程で、未
登録語は訳語に下線付きで出力されるための情報を付与
する(コードを埋め込むなど)。その結果、翻訳部23
3での翻訳処理が終了し、制御部232を経て出力部2
35に出力される際には、未登録語は下線付きで、それ
以外は下線なしでと、区別した表示がされる。
【0164】上記実施例では「下線」を区別に用いた
が、これは字体・字種の変更、種々な文字装飾(「網か
け」など)などでもよい。同じアルファベットでもJI
Sコードに変換するかしないかで区別してもよい。ま
た、上記実施例では未登録語側に「区別」をほどこした
が、翻訳形態選択手段223aにより第1言語の文字列
を訳語として生成することを決定された語のほうに「区
別」をほどしてもよい。要するに、本発明の主旨を逸脱
しない範囲で種々変形して実施できる。
【0165】次に請求項1に記載の機械翻訳システムの
第3の変形態様の実施例について説明する。図29は、
本実施例としての機械翻訳システムの構成を示したブロ
ック図である。これは、制御部282が有する翻訳形態
切り替え指定手段282aと指定内容格納部286を除
けば、請求項1に記載の機械翻訳システムの実施例で説
明した図1のブロック図と同じてある。指定内容格納部
286は、制御部282と翻訳部283と相互に接続さ
れている。
【0166】翻訳形態切り替え指定手段282aは、第
1言語のままの文字列が設定された訳語、および、従節
中の接続詞・関係詞・接続詞的慣用句、句・節同志を連
結する接続表現に対応する第2言語の訳語に対して、翻
訳形態の切り替えを指定するためのものである。ただ
し、後者に対する翻訳形態の切り替えの指定は、それ以
前に、言語のままの文字列が設定された訳語に対して翻
訳形態の切り替えが指定され、それに対応する第2言語
の訳語に限定する。
【0167】図30は、入力部281からユーザによ
り、出力部285に表示された出力文中の(1)第1言
語のままの文字列が設定された訳語、および(1)従節
中の接続詞・関係詞・接続詞的慣用句、句・節同志を連
結する接続表現に対応する第2言語の訳語のいずれかを
指定して、翻訳形態を切り替える旨のコマンド/キー入
力あるいはマウス操作の後の制御部282と翻訳部28
3の処理の流れを示すフローチャートである。
【0168】ユーザは、翻訳結果の出力文の特定の語を
指定して、翻訳形態の切り替えを指示する。そこで、ま
ず最初に、制御部282において、その語が、入力文な
かのどの語に対応する語であるかを割り出す(ステップ
S2901)。本実施例では、出力文のデータには、入
力文中の語との対応情報が保存されているので、この対
応情報を抽出すればよい。
【0169】入力文における翻訳切り替え指示の対象語
が割り出されたら、その情報と、対象が(1)か(2)
かの情報と、原文とを翻訳部283に送り、翻訳形態切
り替えモードでの再翻訳命令を出す(ステップS290
2)。
【0170】続く、ステップS2903より翻訳部29
3での処理が始まる。ステップS2903、S2904
では、通常の形態素解析・辞書引き処理、構文・意味解
析処理が行われる。
【0171】その後、ステップS2905で句・節認識
/翻訳形態選択の処理が行われる。この処理の詳細、特
に請求項1に記載の機械翻訳装置およびその方式の実施
例における処理との違いに関しては後で、別図を用いて
説明する。句・節認識/翻訳形態選択の結果、翻訳形態
の切り替えが成功したかどうかのフラグと、成功した際
には、その切り替えに関与する・節認識/翻訳形態選択
規則284d中の規則番号が得られる。
【0172】句・節認識/翻訳形態選択の結果、切り替
えが不成功であるというフラグが得られた場合は、制御
部282に不成功であることを示す信号を送り、制御部
282は、ユーザに対して、指定語は翻訳形態の切り替
えの対象に含まれないことを示すメッセージを出力部2
85を通じて表示して(ステップS2913)処理を終
了する。
【0173】句・節認識/翻訳形態選択の結果、切り替
えが成功であるというフラグが得られた場合は、句・節
認識/翻訳形態選択処理の結果えられた構造をもとに、
通常の翻訳処理と同様に、構造変換(ステップS290
7)、出力文生成(ステップS2908)の処理を順に
行う。これで、翻訳部283における処理が終了する。
翻訳部283は、出力文のデータと共に、切り替えに関
与した句・節認識/翻訳形態選択規則284dの規則番
号の情報を制御部282に送る。
【0174】翻訳部283より出力文のデータを受け、
制御部282は出力部285へ出力文を表示する(ステ
ップS2909)。続いて、当該切り替え指示内容を今
後の翻訳処理に反映するかどうかをユーザに指定させる
ための指定促進メッセージを出力285へ表示する(ス
テップS2910)。
【0175】ユーザより、今後の翻訳処理に反映する旨
のキー入力あるいはマウス操作などがあれば、ステップ
S2912に進み、指定内容格納部286へ当該規則の
番号を格納して終了する。ユーザより、今後の翻訳処理
に反映しない旨のキー入力あるいはマウス操作などがあ
った場合には、そのまま終了する。
【0176】続いて、ステップS2905の処理を図3
0を用いて説明する。本発明の機械翻訳システムにの句
・節認識/翻訳形態選択の処理は、図3を用いて説明し
た請求項1に記載の発明の実施例における句・節認識/
翻訳形態選択処理と共通部分がある。すなわち、解析結
果の各々のノードに着目しながら適用可能な句・節認識
/翻訳形態選択規則を探していくアルゴリズムは同じで
ある。適用条件が適合する規則を見つけた後の処理に違
いがある。図30はその部分を示している。
【0177】図3のステップS33で、適用条件に適合
する規則が見つけられれると、ステップS3301へ進
み、切り替え成功フラグを0に初期化する。
【0178】次にステップS3302で、その規則が、
翻訳形態の切り替えの対象語であるかをチェックする。
当該規則で”(trans 1)”を付与するノード
が、ユーザの指定した対象語であるかをみればよい。
【0179】これが対象語でない場合には、ステップS
3303へ進み、指定内容格納部286に、非適用の対
象規則として、当該規則の番号が格納されていないかを
チェックする。格納されていなければ、図3のステップ
S35へ進み、通常の処理(指定のアクションの実現、
親ノードポインタの移動、およびその後の処理)が行わ
れる。格納されている場合には、指定のアクションは行
わずに、親ノードポインタの移動のみを行い、その後は
図3のステップS36へ進む。
【0180】一方、”(trans 1)”を付与する
ノードが対象である場合には、ステップS3304へ進
み、対象語が(1)であるか(2)であるかチェックす
る。(1)である場合には、ステップS3305へ進
み、切り替え成功フラグを1(=成功)にセットし、当
該規則の番号を保存する。その後親ノードポインタの移
動を行い(ステップS3306)、図3のステップS3
6へ進む。
【0181】(2)である場合には、ステップS330
7へ進み、指定内容格納部286に、非適用の対象規則
として、当該規則の番号が格納されていないかをチェッ
クする。正常な状況ではこのステップにくる場合は、必
ず格納されているはずである。万一格納されていない場
合は処理エラーとして、切り替え成功フラグに0をセッ
トし(ステップS3309)、句・節認識/翻訳形態選
択処理を終了する。
【0182】当該規則の番号が指定内容格納部286に
格納されていることが確認されたら、ステップS330
8に進み、切り替え成功フラグに1をセットし、当該規
則の番号を保存し、その後、図3のステップS35へ進
む。
【0183】なお、以上の説明は、翻訳形態の切り替え
モードにおける句・節認識/翻訳形態選択処理の処理の
説明である。それ以外の通常の翻訳処理における句・節
認識/翻訳形態選択処理を図32を用いて簡単に説明す
る。
【0184】図3のS33で適用条件に適合するひとつ
の規則を見つけるところまでは共通である。その後は、
図32のステップS3101に進み、指定内容格納部2
86に、非適用の対象規則として、当該規則の番号が格
納されていないかをチェックする。格納されていなけれ
ば、図3のステップS35へ進む。格納されている場合
は、指定アクションは行わずに親ノードの移動のみを行
い(ステップS3102)、図3のステップS36へ進
む。
【0185】以上説明したような処理により、入力文
「It seems that he is lying, although he is always
faithful to me.」に対して、図5及び図6の規則適用
によって訳文として「It seems that彼は
うそをついている,although彼は常に私に対し
て忠実である.」が生成された際に、ユーザが「alt
hough」に対して翻訳形態の切り替えの指定をする
と、句・節認識/翻訳形態選択処理の過程で、この規則
番号(2)を規則すると共に、この規則の適用が回避さ
れ、再翻訳の結果「彼は常に私に対して誠実であるが、
It seemsthat彼はうそをついている.」が
生成される。この後、ユーザがこの切り替え効果を保存
するように指示すれば、この規則番号が指定内容格納部
286に格納され、通常の翻訳処理において参照される
ため、その後の翻訳処理でも切り替え指定を生かした翻
訳がなされる。その後、再度「(..である)が」に対
して翻訳形態の切り替え指定がされれば、当初の訳文と
同じ出力文が生成されるようになる。
【0186】翻訳形態の切り替えを指定された直後に、
もともとの訳文を保存しておき、翻訳形態切り替え指定
の再翻訳後に、ユーザのundo指示により元の訳文を
再度表示するように構成すると、さらに使いやすいもの
となる。また、上記の実施例では、翻訳形態切り替え指
定内容を今後の翻訳処理に生かすかどうかを、再翻訳後
にユーザに指定させているが、指定のないかぎり今後に
生かしたり、undoの指示があれば生かさないような
構成にするのもよい。そりの際には、指定内容格納部2
86に規則番号を格納するタイミングは、句・節認識/
翻訳形態選択処理中で切り替え成功フラグを1にセット
する時とし、内容格納部286から規則番号を削除する
タイミングは、undo指示時とすることができる。
【0187】次に、請求項2に記載の機械翻訳システム
の第3の変形態様の実施例について説明する。図33
は、本実施例としての機械翻訳システムの構成を示した
ブロック図である。これは、制御部322が有する翻訳
形態切り替え指定手段322aと指定内容格納部326
を除けば、請求項2に記載の機械翻訳システムの実施例
で説明した図13のブロック図と同じである。指定内容
格納部326は、制御部322と翻訳部323と相互に
接続されている。翻訳形態切り替え指定手段322a
は、第1言語のままの文字列が設定された訳語に対し
て、翻訳形態の切り替えを指定するためのものである。
【0188】図34は、入力部321からユーザによ
り、出力部325に表示された出力文中の第1言語のま
まの文字列が設定された訳語を指定して、翻訳形態を切
り替える旨のコマンド/キー入力あるいはマウス操作の
後の制御部322の処理の流れを示すフローチャートで
ある。
【0189】ユーザは、翻訳結果の出力文の特定の語を
指定して、翻訳形態の切り替えを指示する。その直後
に、指定されたもともとの訳語は保存する(ステップS
3301)。
【0190】次にその語が、入力文なかのどの語に対応
する語であるかを割り出す(ステップS3302)。本
実施例では、出力文のデータには、入力文中の語との対
応情報が保存されているので、この対応情報を抽出すれ
ばよい。
【0191】入力文における翻訳切り替え指示の対象語
が割り出されたら、その語の持つ他の第2言語の訳語に
関する情報を抽出し、出力部321に表示を指示する
(ステップS3303)。ここで抽出される第2言語の
訳語情報は、翻訳処理時に翻訳処理結果データ中に保有
させている。出力部325は、標準の指示を受けると、
同時に送られてきた訳語候補群を表示する(ステップS
3304)、図35は、この時に表示するサブウィンド
ゥの一例である。ここで、いづれかの訳語が選択される
と、ステップS3306に進み、見出し語、品詞、選択
訳語の情報をせっとで指定内容格納部326に格納する
と共に、出力部325において、出力文中の第1言語文
字列の訳語を指定の訳語に置き換える。例えば、もとも
と生成されていた訳文「distributed fi
lesystemは、clientsystemsが遠
隔のsystem上の共有fileにaccessする
ことを許す。」のうち、「client」に対して「ク
ライアント」が選択されれば、「client」(見出
し語)、「名詞」(品詞)、「クライアント」(訳語)
のセットが格納され、出力文中の「client」は
「クライアント」に置き換えられる。(全体の訳文は、
「distributed filesystemは、
クライアントsystemsが遠隔のsystem上の
共有filesにaccessすることを許す。」とな
る。)一方、訳語の選択はなくそのままサブウィンドゥ
消去の指示があれば、処理を終了する。
【0192】指定内容の格納および訳語の置き換えの直
後、ユーザから格納・置き換え処理の取り消しを意図す
るキー入力があれば、ステップS3308へ進み、当該
情報を指定内容格納部326から消去し、出力部325
において、置き換え訳語をもとの第1言語の訳語に戻す
処理を行い、処理を終了する。
【0193】次に、翻訳部323の処理について説明す
る。本実施例の翻訳部323の処理は、変換処理におけ
るわずかな違いを除き、請求項3に記載の発明に対する
実施例の機械翻訳システムの翻訳部123の処理と同じ
である。そこで、ここでは、その違いを中心に変換処理
の過程について説明をする。
【0194】図36、図37は、図17を用いて説明し
た請求項3に記載の発明に対する実施例の機械翻訳シス
テムの翻訳部123の変換処理と異なる部分の処理に流
れを示すフローチャートである。図17のステップS1
61で、当該見出し語が専門用語であることを示す専門
用語情報があれば、図36のステップS3501に進
み、その見出し語が指定内容格納部326に格納されて
いるかどうかをチェックする。格納されている語である
場合には、ステップS3502へ進み、通常の構造変換
を行い、訳語としては指定内容格納部326に指定され
ている訳語をセッし、その他の訳語は次候補訳語領域に
セットして、処理を終了する。一方、格納されていない
語である場合は、図17のステップS163へ進む。
【0195】もうひとつの違いは、図37に示した図1
7のステップ167,S168,S168の後の処理で
ある。図17のステップS167,S168,S168
で、それぞれの品詞に応じて第1言語の文字列訳語を訳
語にセットした後は、ステップS3601に進む。ここ
で、第2言語の訳語を次候補訳語領域にセットする。こ
れは、ユーザから翻訳形態切り替え要求があった際にユ
ーザに次候補語群を提示する際に参照される。
【0196】以上説明したように、本実施例によれば、
簡単に訳語の形態の切り替え、切り替え結果の学習が簡
単にできる。なお、本実施例では、ユーザ翻訳形態切り
替え要求により、第2言語の訳語群を一致させる方式を
とっているが、特定のキーの入力あるいはマウス操作
で、訳文中において次々と次候補訳語を置き換えて提示
する方式をとることも可能である。その際の指定内容の
学習は最終的に置き換えた表示させた訳語を学習対象と
するか、あるいは、特定キーを入力した時や特定のマウ
ス操作をした時に学習対象とすることができる。
【0197】次に、請求項3に記載の機械翻訳システム
における第2の変形態様の実施例について説明する。
【0198】図37は、本実施例としての機械翻訳シス
テムの構成を示したブロック図である。これは、制御部
372が有する翻訳形態切り替え指定手段372aと指
定内容格納部376を除けば、請求項3に記載の機械翻
訳システムの実施例で説明した図24のブロック図と同
じである。指定内容格納部376は、制御部372と翻
訳部373と相互に接続されている。翻訳形態切り替え
指定手段372aは、第1言語のままの文字列が設定さ
れた訳語に対して、翻訳形態の切り替えを指定するため
のものである。
【0199】入力部371からユーザにより、出力部3
75に表示された出力文中の第1言語のままの文字列が
設定された訳語を指定して、翻訳形態を切り替える旨の
コマンド/キー入力あるいはマウス操作の後の制御部3
72の処理の流れは、図34を用いて説明した、請求項
2に記載の発明の第4の変形態様に対する実施例の機械
翻訳システムの制御部322の処理の流れと同じである
ので、ここでは説明を省略する。要するに、本実施例に
おいて第1言語の文字列が訳語に設定される対象が「語
義を1つに決定できないもの」であるのに対し、前実施
例では対象が「専門用語情報を有するもの」であること
が異なるだけであるので、制御部373と制御部322
のユーザにかかわる翻訳形態切り替え要求に対する処理
については差がない。
【0200】この処理により、例えば、もともと生成さ
れていて訳文「私達はJapaneseが好きであ
る。」のうち、「Japanese」に対して翻訳形態
切り替え要求が出されたとすると、出力部375には第
2言語の訳語候補として「日本語」、「日本人」が表示
され、その後、ユーザが「日本人」を選択すれば、「J
apanese」(見出し語)、「名詞」、(品詞)、
「日本人」(訳語)のセットが指定内容格納部376に
格納され、出力文中の「Japanese」は「日本
人」に置き換えられる。(全体の訳文は「私達は日本人
が好きである。」となる。)さらに、その直後、ユーザ
ら格納・置き換え処理の取り消しを意図するキー入力が
あれば、当該情報は、指定内容格納部376から消去さ
れ、出力部375において、置き換えられた訳語「日本
人」はもとの第1言語の訳語「Japanese」に戻
る。
【0201】次に、翻訳部373の処理について説明す
る。本実施例の翻訳部373の処理は、変換処理におけ
るわずかな違いを除き、請求項3に記載の発明に対する
実施例の機械翻訳システムの翻訳部233の処理と同じ
である。そこで、ここでは、その違いを中心に変換処理
の過程について説明をする。
【0202】図39、図40は、図28を用いて説明し
た請求項3に記載の発明に対する実施例の機械翻訳シス
テムの翻訳部233の変換処理過程において、適用規則
が決まった後の、書き換えパターンへの変換およびアシ
ョン部の実行の処理と異なる部分の処理の流れを示すフ
ローチャートである。図28のステップS27051
で、当該アクションが第1言語の文字決を訳語に設定す
るアクションであることが判定されると、図39のステ
ップS3801に進み、その見出し語が指定内容格納部
376に格納されているかどうかをチェックする。格納
されている語である場合には、ステップS3802へ進
み、訳語として指定内容格納部376に指定されている
訳語をセットし、その他の訳語は次候補訳語領域にセッ
トして、図28のステップS2703に戻る。一方、格
納されていない語である場合は、図28のステップS2
706へ進む。
【0203】もうひとつの違いは、図40に示した図2
8のステップS2708,S2709,S2710、S
2711の後の処理である。図28のステップS270
8,S2709,S2710、S2711で、それぞれ
の品詞に応じて第1言語の文字列訳語を訳語にセットし
た後は、ステップS3901に進む。ここで、第2言語
の訳語を次候補訳語領域にセットする。これは、ユーザ
から翻訳形態切り替え要求があった際にユーザに次候補
訳語群を提示する際に参照される。
【0204】以上説明したように、本実施例によれば、
簡単に訳語の形態の切り替え、切り替え結果の学習が簡
単にできる。なお、本実施例では、ユーザ翻訳形態切り
替え要求により、第2言語の訳語群を一覧させる方式を
とっているが、特定のキーの入力あるいはマウス操作
で、訳文中において次々と次候補訳語を置き換えて提示
する方式をとることも可能である。その際の指定内容の
学習は最終的に置き換えた表示させた訳語を学習対象と
するか、あるいは、特定キーを入力した時や特定のマウ
ス操作をした時に学習対象とする、ことができる。
【0205】次に、請求項2に記載の機械翻訳システム
の第5の変形態様の実施例について説明する。
【0206】図40は、本実施例としての機械翻訳シス
テムの構成を示したブロック図である。これは、制御部
402が有する対訳リスト作成手段402bを除けば、
請求項2に記載の機械翻訳システムの第3の変形態様の
実施例で説明した図33のブロック図と同じてある。対
訳リスト作成手段402bは、指定内容格納部406に
格納された、ユーザが翻訳形態切り替え要求を出した内
容をリストとしてユーザに提示するためのものである。
ユーザから、入力部401を通じて対訳リストを提示す
る旨のキー/コマンド入力あるいはマウス操作がある
と、制御部402は対訳リスト作成手段402bを用い
て、指定内容格納部406の内容の提示を出力部405
において行う。図42は、その提示画面の一例である。
ここでファイルへの出力を指示すれば、ユーザが第1言
語の文字列からは意味がわからず第2言語の訳語を参照
した語のリストを単語帳のようにファイルとして保有す
ることができる。
【0207】次に、請求項3に記載の機械翻訳システム
の第3の変形態様の実施例について説明する。
【0208】図43は、本実施例としての機械翻訳シス
テムの構成を示したブロック図である。これは、制御部
422が有する対訳リスト作成手段422bを除けば、
請求項3に記載の機械翻訳システムの第2の変形態様の
実施例で説明した図38のブロック図と同じてある。対
訳リスト作成手段422bは、指定内容格納部426に
格納された、ユーザが翻訳形態切り替え要求を出した内
容をリストとしてユーザに提示するためのものである。
ユーザから、入力部421を通じて対訳リストを提示す
る旨のキー/コマンド入力あるいはマウス操作がある
と、制御部422は対訳リスト作成手段422bを用い
て、指定内容格納部426の内容の提示を出力部425
において行う。その際に出力425に表示する画面は、
請求項13に記載の発明に対する実施例の画面表示例
(図42)と同様のものである。ここでファイルへの出
力を指示すれば、ユーザが第1言語の文字列からは意味
がわからず第2言語の訳語を参照した語のリストを単語
帳のようにファイルとして保有することができる。
【0209】
【発明の効果】上述したように、本発明は、ユーザの知
識の違いにより多様化する訳文の形態に対応できるよう
にしたもので、様々なレベルで第1言語の単語文字列を
取り混ぜた訳文を構成して生成することにより、原文の
理解を促進することのできる機械翻訳システムを提供す
ることができる。
【図面の簡単な説明】
【図1】本発明の一実施例にかかわる機械翻訳システム
の全体構成を示すブロック図である。
【図2】上記機械翻訳システムの翻訳部における翻訳処
理の流れを示すフローチャートである。
【図3】上記機械翻訳システムの翻訳部における句・節
認識/翻訳形態選択処理の流れを示すフローチャートで
ある。
【図4】上記機械翻訳システムの翻訳部における構文・
意味解析結果の一例を示す図である。
【図5】上記機械翻訳システムの句・節認識/翻訳形態
選択規則の記述例の一部を示す図である。
【図6】上記機械翻訳システムの句・節認識/翻訳形態
選択規則の記述例の他の一部を示す図である。
【図7】上記機械翻訳システムの句・節認識/翻訳形態
選択規則の適用途中の概念構造の一例を示す図である。
【図8】上記機械翻訳システムの句・節認識/翻訳形態
選択規則の適用結果の概念構造の一例を示す図である。
【図9】上記機械翻訳システムの翻訳部における変換処
理の結果の概念構造の一例を示す図である。
【図10】上記機械翻訳システムの生成規則の記述例を
示す図である。
【図11】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図12】上記機械翻訳システムの翻訳形態指定部がユ
ーザに選択を促す表示画像の一例を示す図である。
【図13】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図14】上記機械翻訳システムの翻訳部における翻訳
処理の流れを示すフローチャートである。
【図15】上記機械翻訳システムの翻訳部における形態
素解析・辞書引き結果の一例を示す図である。
【図16】上記機械翻訳システムの翻訳部における構文
・意味解析結果の一例を示す図である。
【図17】上記機械翻訳システムの翻訳部における変換
処理の流れを示すフローチャートである。
【図18】上記機械翻訳システムの翻訳部における変換
処理の結果の概念構造の一例を示す図である。
【図19】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図20】上記機械翻訳システムの翻訳部における変換
処理の流れを示すフローチャートである。
【図21】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図22】上記機械翻訳システムの翻訳形態指定部がユ
ーザに選択を促す表示画面の一例を示す図である。
【図23】上記機械翻訳システムの翻訳部における変換
処理の流れを示すフローチャートである。
【図24】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図25】上記機械翻訳システムの翻訳部における翻訳
処理の流れを示すフローチャートである。
【図26】上記機械翻訳システムの語彙部234aにお
ける各種意味情報の定義例を示す図である。
【図27】上記機械翻訳システムの変換規則234e例
の記述例を示す図である。
【図28】上記機械翻訳システムの変換処理における、
変換規則中の適用規則決定後の流れを示すフローチャー
トである。
【図29】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図30】上記機械翻訳システムにおける、翻訳形態切
り替え指定後の制御部と翻訳部の処理の流れを示すフロ
ーチャートである。
【図31】上記機械翻訳システムにおける、翻訳形態切
り替え指定モードでの句・節認識/翻訳形態選択処理の
流れを示すフローチャートである。
【図32】上記機械翻訳システムにおける、正規翻訳処
理時の句・節認識/翻訳形態選択処理の流れを示すフロ
ーチャートである。
【図33】本発明の一実施例にかかわる機械翻訳システ
ムの全体構造を示すブロック図である。
【図34】上記機械翻訳システムにおける翻訳形態切り
替え指定後の制御部の処理の流れを示すフローチャート
である。
【図35】上記機械翻訳システムにおける画面表示の一
例を示す図である。
【図36】上記機械翻訳システムにおける変換処理の流
れを示すフローチャートである。
【図37】上記機械翻訳システムにおける変換処理の流
れを示すフローチャートである。
【図38】本発明の一実施例かかわる機械翻訳システム
の全体構成を示すブロック図である。
【図39】上記機械翻訳システムの変換処理における、
変換規則の適用規則決定後の処理の流れを示すフローチ
ャートである。
【図40】上記機械翻訳システムの変換処理における、
変換規則の適用規則決定後の処理の流れを示すフローチ
ャートである。
【図41】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【図42】上記機械翻訳システムにおける画面表示の一
例を示す図である。
【図43】本発明の一実施例にかかわる機械翻訳システ
ムの全体構成を示すブロック図である。
【符号の説明】
1,101,121,181,201,231,28
1,321,371,401,421 入力部 2,102,122,182,202,232,28
2,322,372,402,422 制御部 282a,322a,372a,402a,422a
翻訳形態切り替え指定手段 402b,422b 対話リスト作成手段 3,103,123,183,203,233,28
3,323,373,403,423 翻訳部 3a,103a,283a 句・節認識/翻訳形態選択
手段 123a,183a,203a,233a,323a,
373a,403a,423a 翻訳形態選択手段 4,104,124,184,204,234,28
4,324,374,404,424 辞書部 4a,104a,234a,284a,374a,42
4a 語彙部 124a,184a,204a,324a,404a
標準用語語彙部 124b,324b,404b 専門用語語彙部 184b,204b 専門分野1〜n語彙部 4b,104b,124c,184c,204b,23
4b,284b,324c,374b,404c,42
4b 形態素解析規則 4c,104c,124d,184d,204d,28
4d,324d,404d 構文・意味解析規則 234c,374c,424c 構文解析規則 234d,374d,424d 意味解析規則 4d,104d,284d 句・節認識/翻訳形態選択
規則 4e,104e,124e,184e,204e,23
4e,284e,324e 変換規則 4f,104f,124f,184f,204f,23
4f,284f,324f 生成規則 5,105,125,185,205,235,28
5,325,375,405,425 出力部 106,206 翻訳形態指定部 186 分野判定部 286,326,376,406,426 指定内容格
納部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字を入力するための入力部と、入力さ
    れた第1言語による自然言語文を第2言語へ変換するた
    めの知識情報を収容する辞書部と、 入力文中の句・節(主節、等位節、従節)を認識する句
    ・節認手段と、 前記句・節認識手段により認識された、句、主節、等位
    節、従節から接続詞・関係詞的慣用句を除いた部分、従
    節中の接続詞・関係詞的慣用句、句・節がある接続表現
    を伴って別の句・節と連結される際の各句・節、該各句
    ・節の接続表現、前記各部分以外の部分の翻訳形態(第
    2言語に変換するか、第1言語のまま出力するか)を入
    力文の構造(「句、主節、等位節」、「従節から接続詞
    ・関係詞的慣用句を除いた部分」、「従節中の接続詞・
    関係詞的慣用句を除いた部分」、「句・節がある接続表
    現を伴って別の句・節と連結される際の各句・節」の種
    類、および「従節中の接続詞・関係詞的慣用句」、「句
    ・節がある接続表現を伴って別の句・節と連続される際
    の各句・節の接続表現」との組み合わせ具合)に応じて
    決定する翻訳形態選択手段とを有し、 前記翻訳形態選択手段の選択した翻訳形態の情報に基づ
    き、前記辞書部の知識情報を用いて第2言語の文あるい
    は第1言語の文字列を含んだ第2言語の文へ変換する翻
    訳部を備え、 前記翻訳形態選択手段は、出力文中、第1言語の単語文
    字列の連続部分、第2言語の単語文字列の連続部分の境
    界においては原文中の生起順序に準じて生成されるよう
    に翻訳形態を選択することを特徴とする機械翻訳システ
    ム。
  2. 【請求項2】 文字を入力するための入力部と、 入力された第1言語による自然言語文を第2言語へ変換
    するための知識情報と少なくとも第1言語の単語・合成
    語が専門用語であるかどうかの専門用語情報を収容する
    辞書部と、 前記辞書部の各種知識情報を用いて、第2言語の文ある
    いは第1言語の文字列を含んだ第2言語の文へ変換する
    翻訳部を備え、 前記翻訳部は、入力文中の単語・合成語が専門用語であ
    るという専門用語情報を持つ場合には、その単語・合成
    語に対する訳出表現として第1言語のままの文字列を生
    成することを特徴とする機械翻訳システム。
  3. 【請求項3】 文字を入力するための入力部と、 入力された第1言語による自然言語文を第2言語へ変換
    するための知識情報を収容する辞書部と、 前記辞書部の各種知識情報を用いて、第2言語の文ある
    いは第1言語の文字列を含んだ第2言語の文へ変換する
    翻訳部を備え、 翻訳部は、入力文中の単語の意味が単一に決定できない
    場合は、当該単語の訳語として、 第1言語のままの文字列を設定するように機能する翻訳
    形態選択手段を有することを特徴とする機械翻訳システ
    ム。
JP6261553A 1994-09-30 1994-09-30 機械翻訳システム Pending JPH08101839A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6261553A JPH08101839A (ja) 1994-09-30 1994-09-30 機械翻訳システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6261553A JPH08101839A (ja) 1994-09-30 1994-09-30 機械翻訳システム

Publications (1)

Publication Number Publication Date
JPH08101839A true JPH08101839A (ja) 1996-04-16

Family

ID=17363503

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6261553A Pending JPH08101839A (ja) 1994-09-30 1994-09-30 機械翻訳システム

Country Status (1)

Country Link
JP (1) JPH08101839A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065469A (ja) * 2006-09-05 2008-03-21 Sharp Corp 電子機器、その制御方法、および、翻訳文出力用プログラム
JP2008293359A (ja) * 2007-05-25 2008-12-04 Sharp Corp 電子機器、その制御方法、および、翻訳文出力用プログラム
JP2009003648A (ja) * 2007-06-20 2009-01-08 Sharp Corp 電子機器、その制御方法、および、その制御プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008065469A (ja) * 2006-09-05 2008-03-21 Sharp Corp 電子機器、その制御方法、および、翻訳文出力用プログラム
JP2008293359A (ja) * 2007-05-25 2008-12-04 Sharp Corp 電子機器、その制御方法、および、翻訳文出力用プログラム
JP2009003648A (ja) * 2007-06-20 2009-01-08 Sharp Corp 電子機器、その制御方法、および、その制御プログラム

Similar Documents

Publication Publication Date Title
US5099425A (en) Method and apparatus for analyzing the semantics and syntax of a sentence or a phrase
Hamp et al. Germanet-a lexical-semantic net for german
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5528491A (en) Apparatus and method for automated natural language translation
US20020128814A1 (en) Operator-assisted translation system and method for unconstrained source text
US20090070099A1 (en) Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
US20080086300A1 (en) Method and system for translating sentences between languages
US20120173224A1 (en) Deep Model Statistics Method for Machine Translation
US20080086299A1 (en) Method and system for translating sentences between languages
US20050137853A1 (en) Machine translation
JP4319860B2 (ja) 転移ベースの機械翻訳システムで使用される転移辞書を開発するための方法および装置
JPH07295986A (ja) イディオム処理機能を持つ機械翻訳装置
WO2008045815A2 (en) Method and system for natural-language sentence generation from language-independent semantic structures
JP2003030185A (ja) 2カ国語コーパスからの変換マッピングの自動抽出
US20060200338A1 (en) Method and system for creating a lexicon
Boguslavsky et al. Creating a Universal Networking Language module within an advanced NLP system
Felshin The Athena Language Learning Project NLP System: a multilingual system for conversation-based language learning
JPH08101839A (ja) 機械翻訳システム
WO1997048058A1 (en) Automated translation of annotated text
WO1997048058A9 (en) Automated translation of annotated text
KR950013129B1 (ko) 기계번역장치 및 방법
Melby Design and implementation of a computer-assisted translation system
Pease et al. Towards an automatic translation of medical terminology and texts into Arabic
JP3406462B2 (ja) 機械翻訳装置
Heath Dyirbal ergativity: counter-rejoinder to Dixon