JPH0981567A - 翻訳方法 - Google Patents

翻訳方法

Info

Publication number
JPH0981567A
JPH0981567A JP7235632A JP23563295A JPH0981567A JP H0981567 A JPH0981567 A JP H0981567A JP 7235632 A JP7235632 A JP 7235632A JP 23563295 A JP23563295 A JP 23563295A JP H0981567 A JPH0981567 A JP H0981567A
Authority
JP
Japan
Prior art keywords
language
sentence
translation
level
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7235632A
Other languages
English (en)
Inventor
Miwako Shimazu
美和子 島津
Akira Kumano
明 熊野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7235632A priority Critical patent/JPH0981567A/ja
Publication of JPH0981567A publication Critical patent/JPH0981567A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】言語能力とは関係なく第一言語から第二言語に
翻訳された文章を容易に内容把握できるようにする。 【解決手段】第一言語の文章を第二言語の文章に翻訳す
る翻訳方法であって、第二言語の文章の文章形態を特定
するための言語レベルを入力し、第一言語の文章を、入
力された言語レベルに応じた文章形態による第二言語の
文章に翻訳し、この翻訳によって得られた第二言語の文
章を提示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自然言語処理技術
に関わり、より詳しくは、自然言語による文章を他の言
語の文章に翻訳する翻訳方法に関する。
【0002】
【従来の技術】従来から多くの機械翻訳システムが開発
されているが、それらは主として企業内の、英語をある
程度学んだ成人によって利用されてきた。しかし、翻訳
システムの低価格化がインターネットの浸透と結び付
き、翻訳システムが個人でも利用されるようになってき
た。
【0003】近年、外国語を知らない子供も、自習で外
国語を学ぶ手段として、その言語を母国語とする人と通
信したり、その言語の文書を読む必要がでてきており、
そのために翻訳システムが必要になっている。しかし、
現状では、一通りの読み書きの能力を身に付けていない
学童前の幼児や小学生低学年を想定した訳文を作成する
翻訳システムはない。つまり、第一言語が幼児向けの文
章であっても現在のシステムでは大人の文法で大人の文
章を訳出している。
【0004】まず、子供の文章の代表的な特徴を掴んで
おく。次は、小学1・2年生向けの文章である。「藤六
は、おおきな よめいりだんすを、せなかに しょっ
て、やっと、となりむらとの むらざかいの もりま
で、あるいていきました。そらはすっかり はれわたっ
て、けさの あの ふきぶりは、まるで ゆめだったと
でも いいたいような、いい てんきに なりまし
た。」(ただし、漢字「藤六」には「とうろく」のルビ
が付与される)。
【0005】以上の文章で見られる特徴を挙げると次の
ようになる。大部分をひらがなで記述する、未習だがど
うしても漢字で表示する必要がある語りは仮名を付け
る、ひらがなが多いため文節毎に分かち書きする、読点
が多い、「である」調よりは「ですます」調が多い、で
ある。
【0006】さらに、小学生に関しては文部省の「小学
校学習指導要領」に学年別漢字配当表(計1006文字)が
掲載されているので、漢字の使用率はこれに準じている
ことが多い。
【0007】もう少し年齢が上がると、分かち書きはし
なくなるが、どの漢字のどの用法(読み方)をどの学年
で学ぶという知識を持っていなければ子供向けの文章は
書けない。つまり、原則として既出用法は漢字で書ける
が、それ以外で漢字を用いるときは必ず振り仮名を振
る。
【0008】次は、小学5、6年生向けの文章である。
「年月がたって、ヤーコは、りっぱに大きくなった。年
ごとにちからがついて、おなじ年の友だちととっくみあ
いをすれば、かならずけがをさせた。ちからがつよく
て、あばれ牛のつのをつかみ、くびをねじふせておさえ
こんでしまうくらいだった。」(ただし、漢字「年月」
には「としつき」、「年」には「とし」、「牛」には
「うし」のルビが付与される)。
【0009】この文章は大人であれば、「年月がたって
ヤーコは立派に大きくなった。年ごとに力がついて同じ
年の友達と取っ組み合いをすれば、必ず怪我をさせた。
力が強くて、暴れ牛の角を掴み、首を捩じ伏せて押さえ
込んでしまうくらいだった。」といったようになったで
あろうと思われる。
【0010】中学・高校では小学校ほど厳密ではない
が、それぞれ「常用漢字の大体を読み、小学校の学年別
漢字配当表の漢字を主として1000字程度の常用漢字につ
いて使い慣れること」、「常用漢字の読みになれ、主な
常用漢字が書けるようになること」と目標設定されてい
る。
【0011】このように見てくると子供向けの訳文を作
るには特別な配慮が必要であることが分かる。例えば、
次のような英文があったとする。“The Clintons have
decided to go West for their summer vacation thisy
ear. After spending their last two summe
r vacations on theMassachusetts island. Whit
e House sources say the First Family willhead to t
he Grand Teton mountains in Wyo. for a week or mor
e of golf, horseback riding and buffalo barley
soup at the home of DemocraticSen.John D. Rockef
eller IV. Then they're off to Hawaii for a few d
aysof R&R. ”この英文の訳文として、大人が読者の場
合、「クリントン一家は今年の夏期休暇には西に行くと
決定した。この2年の夏期休暇はマサチューセッツの島
で過ごしたため、大統領一家はワイオミング州のグラン
ドティートンの山々へ向かい、民主党のジョン・D・ロ
ックフェローIV上院議員の家で一週間程度ゴルフや乗馬
やバッファローの大麦スープを満喫する予定である、と
ホワイトハウス関係者は言っている。その後、彼らは
2、3日の保養休暇のためにハワイに向かう。」といっ
たようになると考えられる。
【0012】また中学生であれば、「クリントン一家は
今年の夏の休暇には西に行くことを決めた。ここ2年の
夏の休暇はマサチューセッツの島で過ごしたため、大統
領一家はワイオミング州のグレンドディートンの山々へ
向かい、民主党のジョン・D・ロックフェローIV上院議
員の家で一週間ほどゴルフや乗馬やバッファローの大麦
スープを楽しむ予定である、とホワイトハウスの関係者
達は言っている。その後、彼らは2、3日の保養休暇の
ためにハワイに向かう。」といったようになる。(ただ
し、漢字「休暇」には「きゅうか」、「大統領」には
「だいとうりょう」、「上院議員」には「じょういんぎ
いん」、「保養休暇」には「ほようきゅうか」のルビが
それぞれ付与される)。
【0013】一方、読み手が小学生の場合、難しい単語
には易しい言い回しに変更したり、難解な読みには振り
仮名をふったりする必要が出てくる。さらに、年齢が下
の小学生低学年の場合、大幅な変更が必要になる。具体
的には用いる語をかなり制限し、ひらがなを多くし、文
節毎に分かち書きし、読点も多用するといったことであ
る。場合によっては訳出を省いたり、語を補ったりする
工夫や、文章も「です・ます」調を用い、語りかけるよ
うな文体にするなどの変更が必要となってくるであろ
う。
【0014】この場合、先の英文に対しては次のような
日本語訳文が考えられる。「クリントンいっかは、こと
しのなつ休みには 西に行くことをきめました。おとと
しときょねんのなつ休みは マサチューセッツのしまで
すごしたため、だいとうりょういっかは ことしは ワ
イオミングしゅうグランドティートンの山へいき、ジョ
ン・D・ロックフェローさんの家で 一しゅうかんくら
いゴルフや馬のりやバッファローのスープをたのしみま
す、とホワイトハウスのひとたちは、いってます。その
あと、だいとうりょういっかは2、3日のお休みにハワ
イにいきます。」(ただし、漢字「家」には「いえ」、
「馬」には「うま」のルビが付与される)。
【0015】以上のように、利用者にとって最も分かり
やすい訳文を生成するには、利用者の母国語の言語能力
に応じて訳文の生成や加工を行ったり、対象の学年で決
まっている用法と記述様式に基づいて訳文を生成するシ
ステムが必要となる。
【0016】
【発明が解決しようとする課題】このように従来の機械
翻訳システムでは、第一言語の文章を訳出する際には、
一律に一般の成人向けの文章を訳出しており、一般の成
人レベルに達していない読み手を想定して、あらかじめ
訳文を生成する、あるいはその成人向けの訳文をさらに
加工するということは行われていなかった。
【0017】そのため、読み手は訳文が母国語でありな
がら、提示された文章を理解することができず、翻訳が
第一に目指す目標を果たしているとは言えなかった。も
との文章がたとえ大人の文章であっても、このように読
み手の言語能力に合わせて訳文を生成・調整する必要性
は大きい。しかし、現状では原文書が子供向けの易しい
文章であっても、訳文が大人向けの難解な文章となって
しまうことも少なくなかった。
【0018】本発明は前記のような事情を考慮してなさ
れたもので、言語能力とは関係なく第一言語から第二言
語に翻訳された文章を容易に内容把握できるようにする
ことが可能な翻訳方法を提供することを目的とする。
【0019】
【課題を解決するために手段】本発明は、第一言語の文
章を第二言語の文章に翻訳する翻訳方法であって、第二
言語の文章の文章形態を特定するための言語レベルを入
力し、第一言語の文章を、入力された言語レベルに応じ
た文章形態による第二言語の文章に翻訳し、この翻訳に
よって得られた第二言語の文章を提示することを特徴と
する。
【0020】また本発明は、第一言語の文章を第二言語
の文章に翻訳する翻訳方法であって、第一言語の文章を
第二言語の文章に翻訳し、第二言語の文章の文章形態を
特定するための言語レベルを入力し、翻訳によって得ら
れた第二言語の文章を、入力された言語レベルに応じた
文章形態による第二言語の文章に変換し、この変換によ
って得られた第二言語の文章を提示することを特徴とす
る。
【0021】このような方法によれば、利用者の言語レ
ベルに応じて利用者が通常接している文章形態で原文に
対する訳文が提示されるので、母国語以外の文章を人手
を借りることなく理解し、情報を得ることができる人々
の層が増加する。
【0022】
【発明の実施の形態】以下、図面を参照して本発明の実
施の形態について説明する。 (第1実施形態)図1は第1実施形態に係わる機械翻訳
装置の構成を示すブロック図である。図1に示すよう
に、機械翻訳装置は、入力部101、システム制御部1
02、編集部103、翻訳部104、翻訳辞書部10
5、表示部106、及び文書記憶部107によって構成
されている。
【0023】入力部101は、キーボードやマウス、O
CR、磁気テープ装置、磁気フロッピーディスク装置な
どから構成される。入力部101は、翻訳処理の対象と
なる文章(例えば、日本語文、英文、中国語文)のデー
タを入力するのを始め、各種編集・修正等のイベントを
実行させるためのコマンドを入力するためのものであ
る。例えば、入力部101として設けられたキーボード
には、処理の終了を指示するための「終了キー」、翻訳
の実行を指示するための「翻訳キー」等が設けられてい
る。
【0024】システム制御部102は、本装置全体の制
御を司るものである。システム制御部102は、入力部
101からの文章データや、辞書データを各部に送った
り、入力部101から入力されたコマンドの指示に基づ
いて翻訳すべき文章(例えば一文単位)の選択、辞書の
選択などを行なうものである。
【0025】編集部103は、システム制御部102で
選択された第一言語の文章データ等に対する編集の他、
表示部106の表示画面に対する編集、すなわち入力部
101から入力された指示に応じた表示画面上でカーソ
ルの移動、言語レベル入力用の画面の設定、翻訳部10
4における翻訳処理によって得られた訳文の表示部10
6での表示等の制御を行なうものである。
【0026】翻訳部104は、システム制御部102で
選択された第一言語による文章データに対して、システ
ム制御部102で選択された翻訳辞書部105の辞書を
参照しながら翻訳処理を行なう。
【0027】翻訳辞書部105は、翻訳部104が翻訳
処理を行なう際に使用する各種辞書データを収容してい
る。翻訳辞書部105に含まれる辞書の内容については
後述する。
【0028】表示部106は、入力部101から入力さ
れた翻訳対象とする第一言語の文章(原文)や、翻訳部
104により訳出された第二言語の文章(訳文)の他、
言語レベル入力用の画面等を表示するものである。表示
部106は、文字表示が可能なものとして、通常CRT
や液晶ディスプレイ等が使われる。
【0029】文書記憶部107は、第一言語の文章デー
タと第二言語の文章データとをそれぞれ独立して記憶す
ると共に、第一言語データとその翻訳結果としての第二
言語のデータを対応付けて記憶することができる。
【0030】次に、翻訳辞書部105に含まれる辞書の
内容について説明する。翻訳辞書部105は、第一言語
から第二言語への読み手の言語レベルに合った翻訳を行
なうための辞書であり、言語レベルに関係なく共通の知
識を記憶した辞書と、言語レベルごとに異なる知識を記
憶した辞書の二段階構造になっている。
【0031】図1に示すように、言語レベル共通の知識
を記憶する辞書には、語尾等に変化のある単語・熟語を
その原形に変換するための活用変化辞書105a、第一
言語を解析するための文法が記憶された解析文法辞書1
05b等が含まれている。一方、言語レベルごとに異な
る知識を記憶した辞書には、第一言語の単語・熟語に対
応する第二言語の訳語がレベル別に分類され、その品詞
情報と共に記憶されるレベル別単語・熟語辞書105
c、利用者の言語レベルに適した変換情報が記憶された
レベル別変換文法辞書105d、利用者向けに書き換え
られた文の構造を決定するレベル別生成文法辞書105
e、さらに語尾等の語形を変化させて利用者向けの翻訳
文を完成させるレベル別形態素生成文法辞書105f、
言語レベルに応じた特殊な書式に変換するために必要な
書式知識辞書105g等を収容したものである。各辞書
の内部データの詳細については後述する。
【0032】次に、第1実施形態における機械翻訳装置
の動作について説明する。入力部101から入力された
文章に対する翻訳処理の流れを、第一言語の英語による
原文を、第二言語の日本語による訳文に翻訳する場合を
例にして、図2のフローチャートを参照しながら説明す
る。
【0033】ここでは、具体例として、表示部106に
よって図3に示すように表示された英語の文章のうち、
第5行目からの「Construction has begun on its th
reearenas, including the Olympic stadium, which
after the Games will betrimmed by one third and c
onverted into a major-league baseball park. 」とい
う文に対する翻訳の要求を受け、翻訳・表示する場合を
例にして説明する。
【0034】まず、入力部101(キーボードやOCR
等)から第一言語の英文による原文(文章データ)が読
み込まれる。システム制御部102は、入力された第一
言語の原文の文章データを、文書記憶部107に記憶さ
せる(ステップA1)。
【0035】システム制御部102によって原文(文章
データ)が保存されると、編集部103は、システム制
御部102を介して得られる文書記憶部107に記憶さ
れた文章データをもとに、図3に示すように、表示部1
06によって表示画面206中に原文を表示させる。ま
た、編集部103は、翻訳対象とする文を指定するため
のカーソルを第一文に移動させる(ステップA2)。
【0036】以下、入力部101から入力されるイベン
トの実行を指示するコマンドに応じて処理を実行する
(ステップA3)。ステップA3において、処理の終了
または翻訳実行の要求以外のイベントが入力された場
合、ステップA9において入力された指示に応じたイベ
ントの処理を行なう。これには、例えばカーソルの移動
が含まれる。
【0037】カーソルの移動が指示されると、編集部1
03は、指示に応じて表示画面上のカーソルを移動させ
る。本実施形態では、表示画面上でカーソルが位置する
1文、例えばカーソルが先頭にある一文を、翻訳のイベ
ントが指示された際の翻訳対象とする。カーソルの移動
は、例えば原文を翻訳しようとする際に、現在のカーソ
ル位置の直後の文ではなく、その前や後にあるその他の
文を翻訳したいときなどに、対象とする文を指定するた
めに行なわれる。
【0038】また、入力部101のキーボードに設けら
れた「終了キー」が押され、処理の終了が指示される
と、システム制御部102は、処理を終了させる(ステ
ップA4)。
【0039】一方、「翻訳キー」が押された場合(ステ
ップA5)、システム制御部102は、翻訳要求が出さ
れたと見なし、以下のステップA6〜A8の処理を各部
において実行させる。まず、システム制御部102は、
翻訳部104に対して、第一言語の原文を第二言語の訳
文に翻訳する翻訳処理を、言語レベルに応じて実行させ
る。すなわち、翻訳処理によって生成される第二言語の
訳文を、言語レベルによって特定される表示形態となる
ようにする。
【0040】ここで、第1実施形態における機械翻訳装
置では、利用者の言語レベルが一般の成人のレベルに達
しておらず、言語レベルに応じた翻訳処理が必要な場合
には、例えば図4(a)〜(c)に示すような、言語レ
ベル入力用の画面を用いて言語レベルを指示し、その言
語レベルによる翻訳を実行させることができる。
【0041】言語レベルの入力としては、具体的にはそ
の利用者の年齢や学年や最終学歴といった項目が用いら
れる。図4(a)に示す言語レベル入力用の画面206
aは、利用者の年齢に基づいて言語レベルを入力するた
めのものである。図4(b)(c)に示す言語レベル入
力用の画面206b,206cは、利用者の学歴に基づ
いて言語レベルを入力するためのものである。また、言
語レベル入力用の画面206a,206cでは、選択肢
がボタンで表示されており、該当するボタンを選択する
ことによって言語レベルが入力される。また、言語レベ
ル入力用の画面206cでは、利用者学歴が直線上の位
置で示されており、この直線上でカーソルを移動させ位
置を決定することで言語レベルが入力される。
【0042】以下、利用者が小学3年生であって、図4
に示すように、画面206aでは「8〜9」(年齢を表
わす)のボタンが選択され、画面206bでは「小学3
年」のボタンが選択され、画面206cでは小学3年の
位置にカーソルが位置決めされた場合を例にして説明す
る。
【0043】なお、図4(a)〜(c)に示す3つの言
語レベル入力用の画面206a〜206cは、何れか1
つが機械翻訳装置に固定的に設けられていても良いし、
何れかの形態を選択的に任意に用いることができるよう
になっていても良い。
【0044】まず、翻訳部104は、編集部103によ
って制御されているカーソルが、現在位置している原文
を翻訳対象とする。ここでは、図3中に示す第5行目に
ある「 Construction has begun on its three arena
s, including the Olympicstadium, which after
the Games will be trimmed by one third andcon
verted into a major-league baseball park.」という
文の先頭にカーソルがあるもとのとして説明する。な
お、翻訳部104における翻訳処理に必要な形態素解
析、構文解析等の手法に関しては、既に様々なものが提
案されているので詳細な説明を省略する。
【0045】翻訳部104は、翻訳処理の対象とする文
章を、入力された利用者の言語レベルに照らし合わせて
変換・生成を行なう。まず、翻訳部104は、言語レベ
ルに関係なく共通する活用変化辞書105aや解析文法
辞書105bを用いて、語尾等に変化のある単語・熟語
をその原形に変換する処理や、文法の解析等を行なう。
この言語レベルに関係なく共通である解析結果は、シス
テム制御部102を介して文書記憶部107に保持させ
ておく。さらに、翻訳部104は、図5に示すようなレ
ベル別単語・熟語辞書105cの単語情報を参照しなが
ら形態素解析を行なう。
【0046】レベル別単語・熟語辞書105cは、各見
出し語(第一言語の単語)に対する訳語を、ひらがなで
表記するか、あるいは漢字の訳語の場合であっても、振
り仮名を付けるかなどの情報が記憶されており、レベル
別に訳語が設定されている。レベル別単語・熟語辞書1
05cは、単語ごとに個別に、第一言語から第二言語に
変換する変換処理に用いる。
【0047】次に、翻訳部104は、解析文法辞書10
5bを用いて、翻訳対象とする入力文を解析する。この
場合、「 Construction has begun on its three arena
s,including the Olympic stadium.」の文については、
例えば図6に示すように解析される。
【0048】次に、翻訳部104は、解析文法辞書10
5bを用いた解析結果を参照しながら、図7に示すよう
な、レベル別変換文法辞書105dを用いて、利用者に
とって理解しやすい構造に変換する。
【0049】具体的には、レベル別変換文法辞書105
dには、埋め込み文を分割する規則1や受動態を能動態
に変換する規則2など文の構造を単純にするための規則
が蓄積されている。
【0050】本例の場合、規則1が適用され「 Constr
uction has begun on its threearenas, including t
he Olympic stadium.」という埋め込み文が「Construct
ionhas begun on its three arenas. They include the
Olympic stadium. 」のように分割される。
【0051】この後、翻訳部104は、レベル別単語・
熟語辞書105c(図5)を参照して、変換処理によっ
て単語ごとに個別に変換する。利用者が小学3年生であ
ることを想定している場合、成人向け訳語として使用さ
れている単語のうち、通常、4年生以上で学習する
「含、競、技、建、設、縮、改、造」といった漢字を含
む単語が原則として漢字表記されないようにレベル別単
語・熟語辞書105cが作成されている。これらの漢字
を含む単語は、ひらがなで表記させるか、あるいはその
ままで残して、振り仮名を付与させることを示してい
る。また、小学3年レベルの漢字もまだ未習の可能性が
あるので、同様に振り仮名を付与させるようになってい
る。
【0052】一方、単語として小学校3年生には難解だ
と思われる「改造」といったような語は、図5に示すよ
うに「つくりかえる」というような和語を使った訳語に
させるようになっている。
【0053】次に、翻訳部104は、図8に示すような
レベル別生成文法辞書105eを用いて、言語レベルに
あった訳文を生成するために、訳文中に挿入すべき読点
の数を調整する。
【0054】例えば、「輸入された」という述語が、
「アスバラガス[は]」、「食用[として]」「明治時
代[に]」「アメリカ[から]」という名詞句によって
修飾されている文の場合、小学3年の言語レベルでは、
名詞句連続3以上のときに読点を挿入するという規則
が、図8に示すレベル別生成文法辞書105eに記憶さ
れているので、例えば「アスパラガスは、食用として明
治時代にアメリカから輸入された。」のように読点が挿
入される。
【0055】さらに、翻訳部104は、図9に示すよう
なレベル別形態素生成文法辞書105fに記憶された規
則に従って、一般向けの訳文を言語レベルに応じて「で
ある」調から「です・ます」調に変換したり、名詞に
「お皿」の「お」に見られるような接頭語の「お」を付
加したりする。本例では、利用者が小学3年の言語レベ
ルであるので、訳文を「です・ます」調に変換すること
になる。
【0056】最後に、翻訳部104は、図10に示すよ
うな書式知識辞書105gに記憶された規則に従って、
訳文に分かち書き、及び漢字に対して振り仮名を付与
(初回のみ、あるいは該当する漢字の全て)して訳文を
生成する。
【0057】翻訳部104によって翻訳対象となった原
文に対して訳文が生成されると、編集部103は、この
訳文を表示部106に表示させる(ステップA7)。図
11には、表示部106の訳文表示用の画面306a,
306bの一例を示している。
【0058】言語レベルが小学3年の場合には、図10
の書式知識辞書105gに示すように、分かち書きをし
ない規則が記憶されているので、図11(a)に示すよ
うに、最終的な訳文である「その3か所のきょうぎ場
で、けんせつの作業が始まりました。これはオリンピッ
ク・スタジアムをふくみます。ここは、オリンピックの
後、3分の1に小さくして、メージャーリーグの野球場
につくりかえます。」を表示部106の画面306aに
表示させて利用者に提示する(なお、図11に示すよう
に、漢字「所」には「しょ」、「始」には「はじ」、
「野球」には「やきゅう」の振り仮名が付与されてい
る)。
【0059】また、小学2年以下の言語レベルが指示さ
れていた場合には、図11(b)に示すように、図11
(a)に示す訳文に、さらに分かち書きが施されて表示
される。
【0060】こうして、訳文の表示が完了すると、編集
部103は、カーソルを翻訳が終了した文の次の文の先
頭に移動させ(ステップA8)、ステップA3に戻る。
ここで、さらに翻訳要求の指示があった場合には、シス
テム制御部102は、各部を制御して、次の原文につい
て同様に言語レベルに応じた翻訳を実行させる。
【0061】なお、第1実施形態の機械翻訳装置では、
次のようなことも可能である。すなわち、最初に指定さ
れた言語レベルに合った翻訳を行なった後、利用者がレ
ベルの変更を指示した場合には、翻訳部104は、言語
レベルに関係なく共通して行なわれる処理の解析結果が
文書記憶部107に保持されているので、この解析結果
を利用して訳文の生成を行なう。すなわち、最初から翻
訳をやり直す必要はなく、この解析結果のデータをもと
に、言語レベルによって異なる部分の処理をレベル別単
語・熟語辞書105c、レベル別変換文法辞書105
d、レベル別生成文法辞書105e、レベル別形態素生
成文法105f、書式知識辞書105gを用いて行えば
よい。 (第2実施形態)次に、本発明の第2実施形態について
説明する。
【0062】図12は第2実施形態に係わる機械翻訳装
置の構成を示すブロック図である。図12に示すよう
に、機械翻訳装置は、入力部101、システム制御部1
02、編集部103、翻訳部404、翻訳辞書部40
5、表示部106、及び文書記憶部107によって構成
されている。なお、第1実施形態と同一の部分について
は同一の符号を付して説明を省略する。
【0063】翻訳部404は、システム制御部102で
選択された第一言語による文章データに対して、システ
ム制御部102で選択された翻訳辞書部405の辞書を
参照しながら翻訳処理を行なう。
【0064】翻訳辞書部405は、翻訳部404が翻訳
処理を行なう際に使用する各種辞書データを収容してい
る。以下、翻訳辞書部405に含まれる辞書の内容につ
いて、図12の翻訳辞書部405を参照しながら説明す
る。
【0065】翻訳辞書部405は、第一言語から第二言
語への標準的な翻訳を行なうための辞書と、同一の言語
内、すなわち第二言語内で言語レベルに応じた書き替え
(翻訳)を行なうための辞書の二段階構造になってい
る。
【0066】図12に示すように、標準的な翻訳を行な
うための辞書には、語尾等に変化のある単語・熟語をそ
の原形に変換する活用変化辞書405a、第一言語の単
語・熟語に対応する第二言語の訳語がその品詞情報と共
に記憶される一般単語・熟語辞書405h、第一言語を
解析するための文法が記憶された一般解析文法辞書40
5b、第一言語の解析結果をもとに第二言語の構造に変
換するために必要な情報が記憶された一般変換文法辞書
405i、変換された第二言語の文の構造を決定する一
般生成文法辞書405j、第二言語の訳語(単語)の語
尾等の語形を変化させて一般的な翻訳文を完成させる一
般形態素生成文法405k等を収容したものである。
【0067】一方、第二言語内で書き替えを行なうため
の辞書は、第二言語の単語・熟語がレベル別に分類され
ているレベル別単語・熟語辞書405c、第二言語を解
析するための文法が記憶された第二言語解析文法辞書4
05l、同じ第二言語内で利用者の言語レベルに適した
変換情報が記憶されたレベル別変換文法辞書405d、
変換された第二言語の利用者向けに書き換えられた文の
構造を決定するレベル別生成文法辞書405e、さらに
語尾等の語形を変化させて利用者向けの翻訳文を完成さ
せるレベル別形態素生成文法辞書405f、言語レベル
に応じた特殊な書式に変換するために必要な書式知識辞
書405g等を記憶したものである。
【0068】次に、第2実施形態における機械翻訳装置
の動作について説明する。入力部101から入力された
文章に対する翻訳処理の流れを、第一言語の英語による
原文を、第二言語の日本語による訳文に翻訳する場合を
例にして、図13のフローチャートを参照しながら説明
する。
【0069】ここでは、具体例として、表示部106に
よって図3に示すように表示された英語の文章のうち、
第5行目からの「 Construction has begun on its th
reearenas, including the Olympic stadium, which
after the Games will betrimmed by one third and c
onverted into a major-league baseball park. 」とい
う文に対する翻訳の要求を受け、翻訳・表示する場合を
例にして説明する。
【0070】なお、図13に示すステップB1〜B5、
B10の処理は、前述した第1実施形態における図2に
示すフローチャートのステップA1〜A5、A9の処理
と同一であるので説明を省略する。また、翻訳レベルの
入力の方法についても、第1実施形態と同様にして図4
に示す言語レベル入力用の画面を用いて行なうものとす
る。
【0071】ところで、「翻訳キー」が押された場合
(ステップB5)、システム制御部102は、翻訳要求
が出されたと見なし、以下のステップB6〜B9の処理
を各部において実行させる。まず、システム制御部10
2は、翻訳部404に対して、第一言語の原文を第二言
語の訳文に翻訳する翻訳処理を、言語レベルに応じて実
行させる。すなわち、第一言語の原文を翻訳することに
よって生成された第二言語の訳文について、言語レベル
によって特定される表示形態となるように変換する。
【0072】ここでは、利用者が小学3年生の言語レベ
ルを指示した場合を例にして説明する。まず、翻訳部1
04は、編集部103によって制御されているカーソル
が、現在位置している原文を翻訳対象とする。ここで
は、図3中に示す第5行目にある「 Construction has
begun on its three arenas, including the Olympi
cstadium, which after the Games will be tr
immed by one third andconverted into a major-leagu
e baseball park.」という文の先頭にカーソルがあるも
とのとして説明する。なお、翻訳部404における翻訳
処理に必要な形態素解析、構文解析等の手法に関して
は、既に様々なものが提案されているので詳細な説明を
省略する。
【0073】翻訳部404は、翻訳辞書部405の標準
的な翻訳を行なうための辞書を参照して、第一言語から
第二言語への通常の翻訳を行なう(ステップB6)。ス
テップB6における翻訳結果としては、例えば「オリン
ピック・スタジアムを含む、その3か所の競技場で建設
作業が始まった。これは、オリンピックの後は3分の1
に縮小され、メージャーリーグの野球場に改造され
る。」のような訳文が得られる。
【0074】次に、翻訳部404は、ステップB6にお
ける翻訳処理によって得られた、言語レベルに関係のな
い一般向け訳文について、さらに利用者の言語レベルに
照らし合わせて解析・変換・書き替えを行なう。すなわ
ち、翻訳部404は、第二言語内で、指示された言語レ
ベルに応じた翻訳を行なう(ステップB7)。
【0075】まず、翻訳部404は、図14に示すよう
なレベル別単語・熟語辞書405cを参照し、訳文で用
いられている各単語について、書き替えが必要かどうか
を調べる。
【0076】図14に示すレベル別単語・熟語辞書40
5cにおいて、「0」は変更を加える必要のないことを
示しており、それ以外は該当する単語に変えることを示
している。利用者が小学3年であることを想定している
場合、4年生以上で学習する「含、競、技、建、設、
縮、改、造」といった漢字を含む単語が原則として漢字
表記されないようにレベル別単語・熟語辞書405cが
作成されている。これらの漢字を含む単語は、ひらがな
に変換するか、あるいはそのままで残して、振り仮名を
付与させることを示している。
【0077】また、小学3年レベルの漢字もまだ未習の
可能性があるので、同様に振り仮名を付与させるように
なっている。一方、単語として小学校3年生には難解だ
と思われる「改造」といったような語は、図14にある
ように「つくりかえる」というように和語を使って言い
換える必要があることを示している。
【0078】次に、翻訳部404は、第二言語解析文法
辞書405lを用い、解析文法辞書405bを用いて入
力文を解析した場合と同様の手法で、一般の翻訳処理で
生成された訳文を解析する。この訳文の場合、例えば図
15のように解析される。
【0079】次に、翻訳部404は、解析結果を参照し
ながら、レベル別変換文法辞書405d(図7に示すレ
ベル別変換文法辞書105dと同一)を用いて、現状の
訳文が利用者にとって理解しづらいか否かを言語レベル
に基づいて判断する。
【0080】レベル別変換文法辞書405dには、埋め
込み文を分割する規則1や受動態を能動態に変換する規
則2など文の構造を単純にするための規則が蓄積されて
いる。本例の場合では、規則1が適用され、「オリンピ
ック・スタジアムを含む、その3か所の競技場で建設作
業が始まった。」の部分が「その3か所の競技場で建設
作業が始まった。オリンピック・スタジアムを含む。」
のように分割される。
【0081】次に、翻訳部404は、レベル別生成文法
辞書405e(図8に示すレベル別生成文法辞書105
eと同一)を用いて、言語レベルにあった訳文を生成す
るために、一般向けの訳文にさらに読点を追加して訳文
を生成する。
【0082】レベル別生成文法辞書405eに記憶され
た規則では、例えば「アスパラガスは食用として明治時
代にアメリカから輸入された。」という訳文の場合、小
学3年生の言語レベルでは、名詞句連続3以上のときに
読点を挿入するという規則があるため、例えば「アスパ
ラガスは、食用として明治時代にアメリカから輸入され
た。」のように読点が挿入される。
【0083】さらに、翻訳部404は、レベル別形態素
生成文法405f(図9に示すレベル別形態素生成文法
辞書105fと同一)を用いて、一般向けの訳文を言語
レベルに応じて「である」調から「です・ます」調に変
換したり、名詞に「お皿」の「お」に見られるような接
頭語の「お」を付加したりする。本例では、利用者が小
学3年生であるので、「です・ます」調に変換すること
になる。
【0084】最後に、翻訳部404は、書式知識辞書4
05k(図10に示す書式知識辞書105gと同一)に
記憶された規則に従って、訳文に分かち書き、及び漢字
に対して振り仮名を付与(初回のみ、あるいは該当する
漢字の全て)して訳文を生成する。
【0085】翻訳部404によって翻訳対象となった原
文に対して訳文が生成されると、編集部103は、この
訳文を第1実施形態の場合と同様にして、図11に示す
ように表示部106に表示させる(ステップB8)。
【0086】こうして、訳文の表示が完了すると、編集
部103は、カーソルを翻訳が終了した文の次の文の先
頭に移動させ(ステップB9)、ステップB3に戻る。
このようにして、第1実施形態及び第2実施形態におい
て説明した翻訳方法によれば、利用者の言語レベルに応
じて利用者が通常接している文章形態で原文に対する訳
文を生成し、提示することができるので、母国語以外の
文章を人手を借りることなく容易に理解し、情報を得る
ことができる人々の層が増加する。
【0087】なお、本発明は、前述した実施形態に限定
されず、要旨を変更しない範囲で適宜変形して実施でき
る。まず、前述した実施形態では英語の文章を日本語に
翻訳する場合を例にして説明したが、逆に日本語の文章
を英語の文章に翻訳する場合にも応用することができ
る。この場合、訳文の難易度はラテン語系統の語とゲル
マン語(古英語)系統の使い分けで決められるであろ
う。例えば、「庭園は夏には花一面になる。」の訳は、
標準的には「There is a profusion of flowers inthe
garden in summer.」となるが、読み手が例えば英語圏
の小学一年の場合、「There is a lot of flowers in t
he garden in summer.」となる。
【0088】また、同じ英語から日本語への翻訳であっ
ても、利用者等が高齢者の場合は最近のカタカナ語を極
力使わないように訳文を書き換えるといったことも考え
られる。さらに、ステップA7,B8では、最終的な訳
文のみを表示するとしたが、途中で得られる一般向けの
訳文をあわせて表示することも可能である。
【0089】さらに、訳文を視覚的に提示するために表
示しているが、必ずしも表示させる必要はなく、例えば
音声合成を用いて出力することも可能である。これに加
え、利用者がとくに低学年の場合は関連する絵をあわせ
て表示し、理解の一助とすることも考えられる。
【0090】
【発明の効果】以上詳述したように本発明によれば、利
用者の言語レベルに応じて利用者が通常接している文章
形態で原文に対する訳文を生成し提示するので、利用者
は言語能力とは関係なく母国語以外の文章を人手を借り
ることなく容易に理解することができる。従って、訳文
から情報を得ることができる人々の層を増加させること
ができる。
【図面の簡単な説明】
【図1】本発明の第1実施形態に係わる機械翻訳装置の
構成を示すブロック図。
【図2】第1実施形態における英語を日本語に翻訳する
場合の翻訳処理の流れを示すフローチャート。
【図3】第1実施形態の翻訳処理を説明するための文章
の具体例を示す図。
【図4】第1実施形態における言語レベル入力用の画面
の一例を示す図。
【図5】図1中に示すレベル別単語・熟語辞書105c
の一例を示す図。
【図6】第1実施形態を説明するための文章の解析結果
の一例を示す図。
【図7】第1実施形態のレベル別変換文法辞書105d
の一例を示す図。
【図8】第1実施形態のレベル別生成文法辞書105e
の一例を示す図。
【図9】第1実施形態のレベル別形態素生成文法辞書1
05fの一例を示す図。
【図10】第1実施形態の書式知識辞書105gの一例
を示す図。
【図11】第1実施形態に用いられる表示部106の訳
文表示用の画面のレイアウトの一例を示す図。
【図12】本発明の第2実施形態に係わる機械翻訳装置
の構成を示すブロック図。
【図13】第2実施形態における英語を日本語に翻訳す
る場合の翻訳処理の流れを示すフローチャート。
【図14】第2実施形態のレベル別単語・熟語辞書40
5cの一例を示す図。
【図15】第2実施形態を説明するための文章の解析結
果の一例を示す図。
【符号の説明】
101…入力部 102…システム制御部 103…編集部 104,404…翻訳部 105,405…翻訳辞書部 105a,405a…活用変化辞書 105b,405b…解析文法辞書 105c,405c…レベル別単語・熟語辞書 105d,405d…レベル別変換文法辞書 105e,405e…レベル別生成文法辞書 105f,405f…レベル別形態素生成文法辞書 105g,405g…書式知識辞書 106…表示部 107…文書記憶部 405h…一般単語・熟語辞書 405i…一般変換文法辞書 405j…一般生成文法辞書 405k…一般形態素生成文法辞書 405l…第二言語解析文法辞書

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 第一言語の文章を第二言語の文章に翻訳
    する翻訳方法であって、 第二言語の文章の文章形態を特定するための言語レベル
    を入力し、 第一言語の文章を、入力された言語レベルに応じた文章
    形態による第二言語の文章に翻訳し、 この翻訳によって得られた第二言語の文章を提示するこ
    とを特徴とする機械翻訳方法。
  2. 【請求項2】 第一言語の文章を第二言語の文章に翻訳
    する翻訳方法であって、 第一言語の文章を第二言語の文章に翻訳し、 第二言語の文章の文章形態を特定するための言語レベル
    を入力し、 翻訳によって得られた第二言語の文章を、入力された言
    語レベルに応じた文章形態による第二言語の文章に変換
    し、 この変換によって得られた第二言語の文章を提示するこ
    とを特徴とする機械翻訳方法。
JP7235632A 1995-09-13 1995-09-13 翻訳方法 Pending JPH0981567A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7235632A JPH0981567A (ja) 1995-09-13 1995-09-13 翻訳方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7235632A JPH0981567A (ja) 1995-09-13 1995-09-13 翻訳方法

Publications (1)

Publication Number Publication Date
JPH0981567A true JPH0981567A (ja) 1997-03-28

Family

ID=16988901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7235632A Pending JPH0981567A (ja) 1995-09-13 1995-09-13 翻訳方法

Country Status (1)

Country Link
JP (1) JPH0981567A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003075143A1 (en) * 2002-03-04 2003-09-12 Matsushita Electric Industrial Co., Ltd. Data output method, server device, and information processing device
KR20190041147A (ko) * 2017-10-12 2019-04-22 한국전자통신연구원 사용자 맞춤형 통번역 장치 및 방법
KR20190043329A (ko) * 2017-10-18 2019-04-26 삼성전자주식회사 음성 신호 번역 방법 및 그에 따른 전자 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003075143A1 (en) * 2002-03-04 2003-09-12 Matsushita Electric Industrial Co., Ltd. Data output method, server device, and information processing device
KR20190041147A (ko) * 2017-10-12 2019-04-22 한국전자통신연구원 사용자 맞춤형 통번역 장치 및 방법
KR20190043329A (ko) * 2017-10-18 2019-04-26 삼성전자주식회사 음성 신호 번역 방법 및 그에 따른 전자 장치

Similar Documents

Publication Publication Date Title
Black et al. Statistically-driven computer grammars of English: The IBM/Lancaster approach
US6729882B2 (en) Phonetic instructional database computer device for teaching the sound patterns of English
US6022222A (en) Icon language teaching system
US5953692A (en) Natural language to phonetic alphabet translator
US6564186B1 (en) Method of displaying information to a user in multiple windows
US7717712B2 (en) Method and apparatus for language learning via controlled text authoring
US6148286A (en) Method and apparatus for database search with spoken output, for user with limited language skills
AU2003290395A1 (en) A system of interactive dictionary
US20040076933A1 (en) Chinese spelling input system and method with multimedia Chinese spelling learning function
Hinton et al. A dictionary for whom? Tensions between academic and nonacademic functions of bilingual dictionaries
JPH0981567A (ja) 翻訳方法
Akhlaghi et al. Using the LARA platform to crowdsource a multilingual, multimodal Little Prince
Androutsopoulos et al. Generating multilingual personalized descriptions of museum exhibits-The M-PIRO project
McLelland Walter Rippmann and Otto Siepmann as Reform Movement textbook authors: A contribution to the history of teaching and learning German in the United Kingdom
JP3321650B1 (ja) 学習システム
Laurillard Principles for Computer‐Based Software Design for Language Learning
JPH07302036A (ja) パソコン上で行なうcai用演習問題の作成方法
Frishberg et al. Sign language interfaces
Harless The development of a computer-assisted instruction program in a medical center environment
JP4281748B2 (ja) 情報表示制御装置及びプログラム
US20220215774A1 (en) System and method for electronic text display
Kledecka-Nadera Application of computer-assisted language learning in the development of reading comprehension skills
JP4281749B2 (ja) 情報表示制御装置及びプログラム
Destombes et al. The development and application of the IBM speech viewer
JPH0289166A (ja) 文書作成支援装置