JPH09179866A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH09179866A
JPH09179866A JP7339433A JP33943395A JPH09179866A JP H09179866 A JPH09179866 A JP H09179866A JP 7339433 A JP7339433 A JP 7339433A JP 33943395 A JP33943395 A JP 33943395A JP H09179866 A JPH09179866 A JP H09179866A
Authority
JP
Japan
Prior art keywords
language
sentence
unit
dictionary
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7339433A
Other languages
English (en)
Inventor
Toshiyuki Okunishi
稔幸 奥西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP7339433A priority Critical patent/JPH09179866A/ja
Publication of JPH09179866A publication Critical patent/JPH09179866A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 複数言語混在文に対する正しい翻訳を行う。 【解決手段】 言語指定部25は、利用者との対話によ
って、入力文における必要な箇所に言語名とその適用範
囲とを指定する。翻訳制御部31は、指定された言語名
とその適用範囲とを参照して、言語種類管理バッファ2
4dの内容を設定する。そして、辞書メモリ24aから、
指定された言語記号に従って使用辞書を選定し、言語種
類管理バッファ24dの設定内容に従って使用文法規則
および使用木構造変換規則を選定する。そして、辞書引
き・形態素解析部27,構文解析部28,構文変換部29
および翻訳文生成部30を制御して複数言語混在文の各
処理対象文に対する部分翻訳を行う。こうして、各処理
対象文に対する部分翻訳処理に相応しい辞書,文法規則,
木構造変換規則等を適確に選択して、複数言語混在文の
正しい翻訳文を得る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ある言語で書か
れた文書を別の言語に翻訳する機械翻訳装置に関する。
【0002】
【従来の技術】現在の機械翻訳装置の多くは、翻訳対象
の文書に対して前編集や後編集の操作を行うことが前提
となっている。例えば、並列句や埋め込み構造等を含ん
だ長文の構造を取り違えた場合には、前編集として並列
している夫々の句や埋め込まれている句等の構造の範囲
を指定する必要がある。その際に、原文に構造の範囲を
指定するための記号を追加する等の少々の前編集だけで
は正しい訳文が得られず、場合によっては原文自身を変
更しないと希望通りの訳文が得られない場合がある。
【0003】一方、訳語選択・学習に関して言えば、専
門辞書や意味情報・分野情報の充実によってきめ細かな
訳し分けができるようになったとは言え、訳語として適
切な語句をマニュアル選択したり翻訳後に入力する場合
がまだ多い。例えば、以下のような入力文があったとす
る。 I hear what with cold fit and what with itch,his p
erformance was miserable. この入力文には、 「what with A and what with B」(「AやらBやら
で」)という相関表現と 「performance」の訳語(「演技」) 等、現在の機械翻訳装置では誤って翻訳する可能性の高
い部分が含まれている。このような場合には、前編集機
能を使用して「performance」や「what with」をユーザ辞書
に登録したり、更には、後編集で訳文を変更する必要が
ある。
【0004】しかしながら、現在の前編集操作や後編集
操作には以下のような欠点があり、利用者の大きな負担
になっている。そして、このことが機械翻訳装置の普及
の妨げとなっている。 1)前編集操作の主なものは記号の付与であり、熟達し
た人しか扱えない。 2)機械翻訳システム毎に編集機能や操作方法が異な
る。 3)前編集操作の効果は翻訳後でないと分からない。 4)後編集操作の必要性や後編集対象箇所は、生成され
た訳文を見て見ないと分からない。
【0005】上述のような欠点を克服する機械翻訳シス
テムとしては、独特の訳語や難解な構造を有する文やイ
ディオムや慣用句等のうち、利用者が自分で翻訳できる
単語や文に関しては入力文の一部を直接訳文に変換し
て、残りの部分に関しては機械翻訳装置に任せるものが
考えられる。例えば、冒頭の入力文の場合には、 I hear cold fit やら itch やらで, his 演技 was mis
erable. のように、その一部を直接訳文に変換するのである。
【0006】また、上述のように、利用者が自由に訳文
を埋め込むことができるということは、場合によっては
様々な形で原文と訳文とを混在させてしまうことに繋が
る。複雑な複数言語の混在例を以下に示す。 例文: He knows the pen I bought. 複数言語混在文の例 複数言語混在の内容 a) He knows ペン I bought the pen だけ訳した場合 b) He knows pen 私が 買った I と bought を訳した場合 c) He knows 私が 買った ペン the pen I bought を訳した場合 d) 彼は the pen I bought を知っている He knows を訳した場合 e) He knows I bought ペン the pen I bought を訳したけれ ど I と bought は原語のまま f) He knows ペン 私が 買った 原文構造のままthe pen,I,bought を訳した場合 g) 彼は 知っている ペン 私が 買った 原文構造のまま各単語を訳した場 合
【0007】a)〜g)の文は、一見不思議な文に見え
る。ところが、このような文は、英語の文章を読んだり
マニュアルで翻訳したりする場合に、完全な翻訳結果を
得るまでに中間段階で実際に作成される文である。した
がって、このような混在文を完全な訳文にまで機械翻訳
できるのあれば、このような複数言語の混在文は、機械
翻訳支援ツールとしては十分使用できるものとなる。
【0008】ところで、上述のような独特の訳語や難解
な構造を有する文の一部を利用者が直接訳文に変換する
前編集機能を実現するためには、利用者が埋め込んだ訳
文が混在する入力文を正しく翻訳できる機械翻訳装置が
必要となる。このような複数の言語が混在した入力文を
翻訳できる機械翻訳装置として、次のようなものが提案
されている。
【0009】特開平2−25973号公報には、解析プ
ログラムに従って中間言語に翻訳した後に生成プログラ
ムに従って所望の言語による文を生成するピボット方式
を前提としており、種々の言語による構文解析を行う構
文解析手段を自動的に選択することによって多種類の言
語が混在するような大量の文書を中間言語表現に翻訳す
る。また、1文書内においても、異なった言語による挿
入句(語句)を同時に中間言語表現に翻訳することを可能
にする機械翻訳装置が開示されている。
【0010】この機械翻訳装置は、図25に示すよう
に、キーワード辞書1、このキーワード辞書1を検索し
て入力文書からキーワードに関する情報を抽出するキー
ワード辞書検索装置2、入力された文書がどれほどのキ
ーワードを含んでいるかを評価ことによって入力文書の
言語を判定するパーザ判定装置3、このパーザ判定装置
3による判定結果に基づいて当該入力文書の言語の構文
解析装置を起動するパーザ制御装置4等によって構成さ
れている。上記キーワード辞書1に登録されるキーワー
ドは各言語の特徴を表す語であって、その言語による文
章での出現頻度が高い語や機能語(前置詞や接続詞等)で
ある。
【0011】上記構成において、入力ファイル保存装置
5からキーワード辞書検索装置2に文書が入力される
と、キーワード辞書検索装置2によってキーワードに関
する情報が抽出され、パーザ判定装置3によって入力文
書が含むキーワードが評価されて言語が判定される。そ
うすると、パーザ制御装置4は、パーザ判定装置3の判
定結果に基づいて、構文解析装置6〜8のうち入力文書
の言語に応じた構文解析装置を起動する。そして、該当
する構文解析装置によって中間言語表現に翻訳され、所
望の言語の文書が生成される。また、上記キーワード辞
書検索装置2によるキーワードの検索を1行〜数行毎に
行うことによって、例えば1文書内の処理においても、
異なった言語で書かれた挿入文(語句)が中間言語表現に
翻訳される。
【0012】特開平4−309171号公報には、原言
語に目的言語が混在した文字列の翻訳と目的言語に原言
語を混在させた翻訳とを行うことができる機械翻訳装置
が開示されている。この機械翻訳装置は、図26に示す
ように、入力文字列のうち変換する必要の無い文字を指
定する部分文字列指定部11、指定された文字列を検索
する部分文字列検索部12、指定された文字列を特殊文
字に変換する特殊文字発生部13、指定文字列と特殊文
字との対を記憶する特殊文字部分文字列対応記憶部1
4、第二の文字列に変換後の文字列に含まれる特殊文字
を第一の文字列の部分文字列に回復する特殊文字回復部
15等によって構成されている。そして、利用者が変換
しない部分(原言語に目的言語が混在した文字列の翻訳
の場合には混在する目的言語の部分であり、目的言語に
原言語を混在させた翻訳の場合には混在させる原言語の
部分)を指定しておくことによって、その部分の文字列
を第二の文字列に変換しないようにする。
【0013】例えば、2つの入力文 私は日本という単語を書いて、米国という単語を消し
た。 私は Nature という雑誌を買った。 に対して、「日本」,「米国」,「Nature」の3つの単語が無変
換指定されたとすると、文字列「日本」,「米国」,「Natur
e」は変換部16による第二の文字列への変換の際に退
避されて、特殊文字回復部15によって以下のように復
元される。 I wrote a word,日本,and erase a word,米国 I bought a magazine,Nature.
【0014】
【発明が解決しようとする課題】しかしながら、上記複
数の言語が混在した入力文を翻訳できる機械翻訳装置に
おいては、上述のような複数言語の混在文 a) He knows ペン I bought b) He knows pen 私が 買った c) He knows 私が 買った ペン d) 彼は the pen I bought を知っている e) He knows I bought ペン f) He knows ペン 私が 買った g) 彼は 知っている ペン 私が 買った を翻訳する場合には、次のような問題が発生する。
【0015】(1)用いるべき構文解析装置を特定でき
ない 特開平2−25973号公報に開示された機械翻訳装置
においては、入力文書からキーワードを抽出し、入力文
書が含んでいるキーワードに基づいて入力文書の言語を
判定し、判定結果に応じた言語の構文解析装置を起動す
るようにしている。したがって、日本語のみが出現する
例文 g) 彼は 知っている ペン 私が 買った が入力された場合には、日本語構文解析装置6が起動さ
れることになる。ところが、この場合には、例文g)の
構文構造は英語の構造を有しているから、英語構文解析
装置7を機動しないと正しく構文構造を抽出できないの
である。
【0016】(2)正確に翻訳できない 上述の例は極端な例であるが、他の例文a)〜f)におい
ても、英語と日本語とが単語レベルと構文構造レベルと
で混在している。したがって、特開平2−25973号
公報に開示された機械翻訳装置のように単純に単語レベ
ルでのキーワード情報に基づいて構文解析装置を判定し
た場合には、用いるべき構文解析装置が正しく判定でき
ず正確に翻訳できないのである。このことは、無翻訳指
定を行う特開平4−309171号公報に開示された機
械翻訳装置とて同様である。例えば、上述の例文 e) He knows I bought ペン を考えてみる。この場合、入力文e)における単語「ペ
ン」に対して無翻訳指定を行うと、入力文e)における単
語「ペン」が特殊文字(#1)に変換された入力文 He knows I bought #1. に対して翻訳処理が行われることになる。ところが、こ
の入力文を英語として構文解析を行うと、一般には「関
係節」であると解釈されて、「that−節(名詞節:that
は省略されている)」の解釈が優先される。その結果、
誤った翻訳文 彼は私が#1(=ペン)を買ったことを知っている が出力されるのである。
【0017】そこで、この発明の目的は、その一部を利
用者の望ましい訳語に変換した複数言語混在文に対し
て、この複数言語混在文におけるある言語での部分文字
列用の辞書や文法規則等を正しく選択して当該部分文字
列に対する部分翻訳を行い、得られた部分翻訳結果に基
づいて当該複数言語混在文を正しく翻訳できる機械翻訳
装置を提供することにある。
【0018】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に係る発明は、入力部から入力されたある
言語による文字列に対して辞書を用いて形態素解析を行
う辞書引き・形態素解析部と,この辞書引き・形態素解析
部による形態素解析結果に基づいて文法規則を用いて当
該文字列の構文解析を行う構文解析部と,構文変換規則
を用いて上記構文解析部によって得られた構文構造を他
の言語による構文構造に変換する構文変換部と,この構
文変換部による変換結果に基づいて入力文の上記他の言
語による翻訳文を生成する翻訳文生成部を有して,ソー
ス言語以外の言語の文を含む複数言語混在文をターゲッ
ト言語に翻訳して出力部から出力する機械翻訳装置にお
いて、上記辞書,構文規則および構文変換規則が,少なく
とも上記ソース言語とターゲット言語を含む複数の言語
毎に格納されている辞書・規則格納部と、使用者との対
話によって,入力された複数言語混在文に対して,各単語
には言語名を表す言語記号を付加する一方,ある言語で
の構文構造の統率下にある部分文字列には当該言語名を
表す言語記号と当該言語の適用範囲を指定する範囲指定
記号を付加する言語指定部と、当該複数言語混在文中の
上記言語記号および範囲指定記号に基づいて設定される
上記部分文字列と当該部分文字列の言語名と当該部分文
字列に対する構文解析の際に使用する文法規則の言語名
とターゲット言語名を保持する言語種類保持部と、上記
言語指定部によって複数言語混在文に付加された言語記
号と範囲指定記号と上記言語種類保持部に保持された内
容を参照して使用する辞書,構文規則および構文変換規
則を上記辞書・規則格納部から選定し,上記辞書引き・形
態素解析部,構文解析部,構文変換部および翻訳文生成部
を制御して,当該複数言語混在文中の個々の部分文字列
に対する部分翻訳と,この部分翻訳結果に基づく当該複
数言語混在文の構文解析,構文変換および翻訳文生成と
を行う翻訳制御部を備えたことを特徴とを特徴としてい
る。
【0019】上記構成によれば、複数言語混在文中のあ
る言語での構文構造の統率下にある部分文字列に対する
翻訳制御部による部分翻訳に際して、使用する辞書,構
文規則および構文変換規則が、当該複数言語混在文に付
加された言語記号と範囲指定記号と上記言語種類保持部
に保持された内容を参照して選定される。こうして、当
該複数言語混在文中の上記部分文字列に対する部分翻訳
処理が、当該部分文字列用の正しい辞書,構文規則およ
び構文変換規則を用いて行われる。その結果、後に、上
記翻訳制御部の制御の下に各部分文字列の部分翻訳結果
に基づいて行われる当該複数言語混在文に対する翻訳処
理によって、当該複数言語混在文の正しい翻訳文が得ら
れる。
【0020】また、請求項2に係る発明は、請求項1に
係る発明の機械翻訳装置において、上記翻訳制御部は、
上記言語指定部によって複数言語混在文に付加された言
語記号と範囲指定記号とを参照して,上記範囲指定記号
によって上記適用範囲が指定された部分文字列を検出す
る毎に,上記言語種類保持部に現在保持されている内容
を退避し,新たに当該部分文字列と当該部分文字列の言
語名と当該部分文字列に適用する文法規則の言語名とを
保持させて,当該部分文字列に関する言語の種類を管理
する言語種類管理手段と、当該複数言語混在文の各単語
に付加された言語記号および上記範囲指定記号と,上記
言語種類保持部に保持されている内容とを参照して,使
用する辞書,構文規則および構文変換規則を上記辞書・規
則格納部から選定し,上記辞書引き・形態素解析部,構文
解析部,構文変換部および翻訳文生成部を制御して,各
部分文字列を構成する単語の形態素解析とこの単語の形
態素解析結果に基づく個々の部分文字列に対する部分翻
訳処理と上記言語種類保持部の退避内容の復帰を行う部
分翻訳制御手段と、上記辞書引き・形態素解析部,構文解
析部,構文変換部および翻訳文生成部を制御して,上記
部分翻訳制御手段による各部分翻訳結果に基づいて,当
該複数言語混在文の構文解析,構文変換および翻訳文生
成を行う翻訳制御手段を備えたことを特徴としている。
【0021】上記構成によれば、上記言語種類保持部に
保持される内容は、言語種類管理手段によって、上記言
語記号と範囲指定記号とが参照されて上記部分文字列を
検出する毎に退避および再設定される一方、部分翻訳制
御手段によって、当該部分文字列に対する部分翻訳処理
が終了すると復帰される。こうして、上記言語種類保持
部には、常に、現在部分翻訳の対象となっている部分文
字列に関する内容が保持される。そして、上記部分翻訳
制御手段による部分翻訳に際して使用される辞書,構文
規則および構文変換規則は、上記言語種類保持部の内容
を参照することによって常に正しく選定される。
【0022】また、請求項3に係る発明は、請求項1に
係る発明の機械翻訳装置において、上記言語指定部は,
予め言語が分かっている単語および既に付加された言語
記号による統率下にある単語に対する上記言語記号の付
加を省略することが可能であり、上記言語種類保持部
は,当該部分文字列に対する形態素解析の際に使用する
辞書の言語名をも保持し、上記翻訳制御部は,上記辞書
引き・形態素解析部を制御して上記形態素解析を行う場
合には,上記言語種類保持部に保持された辞書の言語名
を参照して上記辞書・規則格納部から使用する辞書を選
定するようになっていることを特徴としている。
【0023】上記構成によれば、上記言語指定部によっ
て複数言語混在文に言語記号が付加される場合には、予
め言語が分かっている単語および既に付加された言語記
号による統率下にある単語に対する上記言語記号の付加
が省略されて、必要最小限の言語記号が付加される。
【0024】また、請求項4に係る発明は、請求項1に
係る発明の機械翻訳装置において、入力された複数言語
混在文の文字コードに基づいて,当該複数言語混在文の
言語を文字単位で判定する言語判定部を備えると共に、
上記言語指定部は,表記言語と構文構造の言語とが異な
るような部分文字列に対して構文構造の言語名を表す言
語記号と当該構文構造の適用範囲を指定する上記範囲指
定記号を付加し、上記翻訳制御部は,上記辞書引き・形態
素解析部を制御して上記形態素解析を行う場合には,上
記言語判定部による判定結果に従って上記辞書・規則格
納部から使用する辞書を選定するようになっていること
を特徴としている。
【0025】上記構成によれば、言語判定部によって複
数言語混在文の文字コードに基づいて複数言語混在文の
言語が判定される。したがって、上記言語指定部は、当
該複数言語混在文を構成する単語に言語記号を付加する
必要はなく、表記言語と構文構造の言語とが異なるよう
な部分文字列に対する構文構造の言語名を指定するため
の言語記号のみが付加される。
【0026】
【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。図1は、本実施の形態の機械
翻訳装置における機能構成を示すブロック図である。こ
の機械翻訳装置は、入力部21,翻訳CPU(中央演算処
理装置)22,出力部23および翻訳記憶部24で概略構
成される。
【0027】上記入力部21からは文字列や記号等が入
力され、出力部23からは翻訳文等が出力される。翻訳
記憶部24には、各言語用の辞書や文法規則等が記憶さ
れた辞書メモリ24aと、図4に示すような各言語間の
文法素性対応表が記憶された文法素性対応バッファ24
bと、図5に示すような言語名と言語記号の対応が記憶
された言語記号バッファ24cと、翻訳処理中の対象文
や入力言語および出力言語の言語名やその言語用の辞書
や使用文法が一時的に記憶される言語種類管理バッファ
24dが設けられている。また、上記翻訳CPU22
は、言語指定部25,辞書引き・形態素解析部27,構文
解析部28,構文変換部29,翻訳文生成部30および翻
訳制御部31を有して、入力部21から入力されたソー
ス言語による文章をターゲット言語に翻訳して出力部2
3から出力する。
【0028】機械翻訳処理には様々な解析レベルがあ
り、図6において、ソース言語による原文が入力される
と、レベルL1の辞書引き、レベルL2の形態素解析、レ
ベルL3の構文解析、…と、解析が進められる。機械翻
訳は、どのレベルまで解析を行うかによって大きく次の
2つに分けられる。1つは、レベルL6のソース言語お
よびターゲット言語の何れにも依存しない概念である中
間言語まで解析し、そこから、レベルL7のターゲット
言語による文脈生成、レベルL8の意味生成、レベルL9
の構文生成、レベルL10の形態素生成と生成を進めてタ
ーゲット言語による訳文を生成していくピボット方式で
ある。もう1つは、上記レベルL2の形態素解析,レベル
L3の構文解析,レベルL4の意味解析及びレベルL5の文
脈解析の何れかのレベルまで解析を行ってソース言語の
内部構成を得、次に、この得られたソース言語の内部構
造と同レベルのターゲット言語の内部構造に変換した
後、ターゲット言語の訳文を生成するトランスファー方
式である。ここで、上記翻訳CPU22によって行われ
る翻訳処理はトランスファー方式による。
【0029】上記言語指定部25は入力部21からの入
力文中の単語や部分文字列毎に言語を指定する。辞書引
き・形態素解析部27は、入力文から前編集記号を取り
除いた後、辞書を引いて入力文を各形態素に分割して時
制・人称・数等を得る辞書引き・形態素解析を行う。ま
た、上記構文解析部28は、単語間の係り受け等の文法
構造(構文解析木)を決定する。構文変換部29は、構文
解析部28で決定された構文解析木をターゲット言語で
の構文解析木に変換する。翻訳文生成部30は、辞書引
き・形態素解析部27によって得られた訳語の並びをタ
ーゲット言語での構文解析木に従って決定し、更に活用
変化させる。また、上記翻訳制御部31は、入力文中の
部分文字列毎に言語指定部25で指定された言語の種類
に応じて、辞書引き・形態素解析部27,構文解析部28
および構文変換部29等で参照する辞書や文法規則や木
構造変換規則等を翻訳記憶部24から選択し、辞書引き
・形態素解析部27,構文解析部28,構文変換部29お
よび翻訳文生成部30を制御して翻訳処理を行う。
【0030】図2は、図1の機能を実現するための構成
を示す図である。図2において、37はCRT(陰極線
管)やLCD(液晶ディスプレイ)等からなる表示装置で
あり、図1における出力部23を構成する。38はキー
ボードであり、図1における入力部21を構成する。3
9は翻訳モジュールであり、図1における翻訳記憶部2
4を構成する辞書メモリ24aに格納された翻訳用の辞
書,文法規則および木構造変換規則等を用いて入力文を
翻訳する。35はメインのCPUであり、メインメモリ
36に格納された制御プログラムに従ってバス40を介
して表示装置37,キーボード38および翻訳モジュー
ル39等を制御して翻訳処理を行う。
【0031】図3は、上記翻訳モジュール39の詳細な
構成図である。この翻訳モジュール39は、上記翻訳C
PU22,翻訳プログラムメモリ41および5つのバッ
ファA〜Eで概略構成される。上記翻訳CPU22は、
バス40を介して入力されるソース言語による入力文を
翻訳プログラムメモリ41に格納されている翻訳プログ
ラムに従って辞書メモリ24aを参照してターゲット言
語による翻訳文に変換する。バッファAは、入力された
ソース言語による原文を例えばスペース等を利用して得
られた各単語毎に格納する。バッファBは、バッファA
に格納された単語に対する翻訳CPU22の辞書引き・
形態素解析部27(図1参照)による形態素解析の結果得
られた各単語の品詞や訳語等の情報を格納する。バッフ
ァCは、翻訳CPU22の構文解析部28(図1参照)に
よる構文解析の結果得られた構文解析木に関する情報を
格納する。バッファDは、翻訳CPU22の構文変換部
29(図1参照)による構文変換の結果得られたターゲッ
ト言語の構文解析木を格納する。バッファEは、翻訳C
PU22の翻訳文生成部30(図1参照)によってターゲ
ット言語による構文解析木に基づいて並べられた訳語に
付属語(ターゲット言語が日本語である場合には助詞や
助動詞)等を補充して得られた翻訳文を格納する。
【0032】以下、図1に従って、上記翻訳CPU22
による翻訳処理について詳細に説明する。まず、読み込
まれてバッファに格納された入力文章は、辞書引き・形
態素解析部27によって、辞書メモリ24aの辞書を引
いて各形態素列(単語列)に分割される。そして、この分
割された各単語に対する品詞等の文法情報および訳語が
得られる。さらに、各単語に対する時制・人称・数等が解
析される。次に、構文解析部28によって、辞書メモリ
24aの文法規則を用いて各単語間の係り受け関係を示
す文章の構造(構文解析木)が決定される。次に、構文変
換部29によって、上述の構文解析の場合と同様に辞書
メモリ24aの木構造変換規則を用いて、入力された原
文の構文解析木の構造がターゲット言語における構造に
変換される。そして、翻訳文生成部30によってターゲ
ット言語による翻訳文として適切な付属語が付けられて
翻訳文が得られる。こうして得られた翻訳文は原文と共
に表示装置37に表示されるのである。
【0033】次に、上記構成を有する翻訳モジュール3
9の動作を、イディオムを含まない英文「This is a pe
n.」を日本語に翻訳する場合を例に説明する。先ず、読
み込まれた原文がスペースによって部分文字列に分割さ
れて、図7に示すように、バッファAに格納される。そ
して、翻訳CPU22の辞書引き・形態素解析部27に
よる上記辞書引き・形態素解析が行われ、得られた各単
語の品詞や訳語がバッファBに格納される。例えば、品
詞情報は図8に示すように格納される。ここで、単語「T
his」は多品詞語であり、原文での品詞は構文解析部28
による構文解析時に一意に決定される。
【0034】上記構文解析部28は、辞書メモリ24a
に格納された辞書と文法規則に従って、各単語間の係り
受け関係を示す構文解析木を例えば図9に示すように決
定して、バッファC(図3参照)に格納する。この構文解
析木の決定は、次のようにして行われる。すなわち、辞
書メモリ24aに格納された文法規則から 文 → 主部, 述部 主部 → 名詞句 述部 → 動詞, 名詞句 名詞句 → 代名詞 名詞句 → 冠詞, 名詞 の規則が得られる。この規則は、例えば、1つ目の規則
は「文とは、主部と述部からできている」ということを
表わす。以下、この規則に従って構文解析木が決定され
るのである。
【0035】次に、上記構文変換部29によって、辞書
メモリ24aに格納された木構造変換規則を用いて、入
力された英語による構文解析木(図9参照)の構造が、図
10に示すような日本語による構文解析木に変換され
る。そして、得られた結果がバッファD(図3参照)に格
納される。最後に、翻訳文生成部30によって、得られ
た日本語文「これ ペン である。」に適切な助詞「は」や助
動詞が付けられて、図11に示すような日本語の形にし
てバッファE(図3参照)に格納される。こうして得られ
た日本語による翻訳文「これはペンである。」は、翻訳モ
ジュール39から出力されて、メインメモリ36に格納
されると共に、表示装置37によって表示される。
【0036】以下、上述のような構成を有して上述のよ
うな基本動作を行う機械翻訳装置によって行われる複数
言語混在文に対する翻訳処理動作について詳細に説明す
る。英語による原文 I hear what with cold fit and what with itch,his
performance was miserable. には、 「what with A and what with B(AやらBやらで)」
という相関表現 「performance」の訳語(「演技」) 等の現在の機械翻訳装置では誤訳される可能性の高い部
分文字列が含まれているので、前編集によって、原文の
一部を以下のように直接日本語に変換された文章が入力
部21に入力されたとする。 入力文 I hear cold fit やら itch やらで,his 演技 was mis
erable.
【0037】そうすると、上記翻訳CPU22における
言語指定部25によって、利用者との対話によって、入
力文における必要な箇所に、言語名とその適用範囲とが
指定される。こうすることによって、以降の処理によっ
て、正しい言語知識選択が行われて正しい解析結果が得
られるのである。
【0038】その際における言語指定部25による言語
名の指定および適用範囲の指定は、入力部21からの利
用者の次のような入力に呼応して行われる。 ・言語名の指定 :図5に示すように、翻訳記憶部24
における言語記号バッファ24cに格納されている言語
記号の何れかを目的とする単語に付加する ・適用範囲の指定:括弧“[ ]"で括る
【0039】上述の入力文の場合には、先ず言語名の指
定が次のように行われる。 e I e hear e cold e fit j やら e itch j やらで,e
his j 演技 e was e miserable. 次に、「cold fit やら itch やらで,」という部分は、
「〜やら〜やらで」というイディオムの日本語訳は分かっ
ているが「cold fit」および「itch」の単語の日本語訳が分
からないために行われた前編集結果であるから、この部
分全体の言語は訳文側(日本語)である。そこで、この部
分を括弧“[ ]"で括って「j (日本語)」を付加する。さら
に、上記「cold fit やら itch やらで,」という部分は
日本語での構文構造ではあるが、その中の「cold fit」お
よび「itch」の部分は英語であるから、「cold fit」およ
び「itch」の部分を括弧“[ ]”で括って「e (英語)」を付
加する。 j [e [e cold e fit] j やら e [e itch] j やらで] 次に、「his 演技 was miserable.」という部分は英語で
の構文構造ではあるがその中の「演技」の部分は日本語で
あるから、「演技」の部分を括弧“[ ]”で括って「j 」を
付加する。最後に、入力文全体は英語であるから、入力
文全体を括弧“[ ]"で括って「e 」を付加する。その結
果、入力文に対する言語名の指定と範囲の指定との結果
は次のようになる。 e [e I e hear j [e [e cold e fit] j やら e [e itc
h] j やらで],e his j [j 演技] e was e miserable].
【0040】尚、言語指定のシンタックスについては他
にも種々考えられる。例えば、HTML(ハイパーテキ
スト・マークアップ言語)方式のタグを拡張して文書に言
語種類を指定できるようにすれば、インターネット上の
文書の翻訳にも利用できる。また、それらのシンタック
スに基づきグラフィック・ユーザ・インターフェースを用
いて指定することも可能である。
【0041】こうして、上記言語指定部25によって、
利用者との対話を通して、言語記号「e」や「j」が付加さ
れて言語名が指定され、括弧“[ ]"で括って適用範囲が
指定された入力文が辞書引き・形態素解析部27に入力
される。以下、辞書引き・形態素解析部27,構文解析部
28,構文変換部29,翻訳文生成部30および指定言語
翻訳制御部31によって、辞書引き・形態素解析処理,構
文解析処理,構文変換処理および翻訳文生成処理が行わ
れる。図12および図13は、上記翻訳制御部31によ
る制御の下に、辞書引き・形態素解析部27,構文解析部
28,構文変換部29および翻訳文生成部30によって
行われる翻訳処理動作のフローチャートである。以下、
図12および図13に従って複数言語混在文の翻訳処理
動作について説明する。
【0042】ステップS1で、上記辞書引き・形態素解析
部27によって、上述のように言語名および適用範囲が
指定された入力文から1つの単語(日本語のような膠着
言語の場合には文字)が読み出される。ステップS2で、
上記読み出された単語(文字)に、括弧“["が付加され
ているか否かが判別される。その結果、括弧“["が付
加されていればステップS3に進み、そうでなければス
テップS6に進む。
【0043】ステップS3で、以下、入力文の各単語(文
字)が属する言語指定範囲の部分文字列(以下、処理対象
文と言う)に対する部分翻訳処理を各処理対象文の先頭
単語(文字)に付加された言語記号で指定された辞書や文
法規則を用いて実行する。したがって、夫々の処理対象
文に対する処理が終了した場合には、使用した言語の辞
書や文法規則を各処理対象文に対する処理がスタートす
る前の設定に戻しておく必要がある。そこで、本ステッ
プでは、現在設定されている言語や文法規則を退避する
のである。具体的には、翻訳記憶部24の言語種類管理
バッファ24dに書き込まれている当該内容を後の領域
に移動して新たに書き込まれる内容の後に結合させるこ
とによって、後に参照可能な状態にしておくのである。
尚、上記言語種類管理バッファ24dの内容とは、図1
4に例示するように、 出力言語:翻訳ターゲット言語名(英日翻訳の場合には
日本語) 入力言語:処理対象文全体を文法的に司る言語名 使用文法:入力言語用の文法規則 処理対象文:入力文あるいは言語指定範囲内の部分文字
列 である。
【0044】ステップS4で、上記言語種類管理バッフ
ァ24dにおける出力言語,入力言語,使用文法および処
理対象文の内容が、当該単語(文字)付加されている言語
記号および括弧“[ ]"に基づいて以下のように設定され
る。 出力言語:以前の設定内容そのまま複写 入力言語:当該単語(文字)に付加されている言語記号で
表される言語名 使用文法:入力言語用の文法規則 処理対象文:当該単語(文字)に付加されている括
弧“["とその括弧“["に対応する括弧“]"とで言語
指定された部分文字列 ステップS5で、当該単語(文字)に付加されている言語
記号と括弧“["とが除去される。そうした後、上記ス
テップS2に戻って、さらに括弧“["が付加されている
かが判別される。
【0045】ステップS6で、当該単語(文字)に付加さ
れている言語記号が参照されて、辞書メモリ24aから
当該言語記号によって指定された言語用の辞書(指定言
語用辞書)が選択されて設定される。そして、上記辞書
引き・形態素解析部27が起動される。ステップS7で、
上記辞書引き・形態素解析部27によって、上記ステッ
プS6において設定された辞書を用いて、言語記号と括
弧“["とが除去された当該単語(文字)に対して辞書引
き・形態素解析処理が行われる。そして、得られた処理
結果がバッファBに格納される。ステップS8で、当該
単語(文字)に括弧“]"が付加されているか否かが判別
される。その結果、括弧“]"が付加されていればステ
ップS9に進み、そうでなければステップS17に進む。
【0046】ステップS9で、当該単語(文字)は当該入
力文における末尾の単語(文字)であるか否かが判別され
る。その結果、末尾の単語(文字)であればステップS18
に進み、そうでなければステップS10に進む。ステップ
S10で、上記言語種類管理バッファ24dにおける「使用
文法」の内容に応じた文法規則が辞書メモリ24aから選
択される。そして、構文解析部28が起動されて、当該
処理対象文に対する構文解析処理が行われる。こうし
て、入力文の構文解析木の一部分を成す部分木が決定さ
れてバッファCに格納される。
【0047】ステップS11で、上記言語種類管理バッフ
ァ24dにおける「出力言語」の内容は「入力言語」の内容
と一致しているか否かが判別される。その結果、一致し
ていれば上記ステップS10において得られた上記部分木
がターゲット言語による部分木であると確定され、この
部分木と当該処理対象文を構成する各単語の辞書引き・
形態素解析結果とに基づいて当該処理対象文の翻訳文が
生成されてバッファEに格納された後ステップS14に進
む。一方、一致していなければステップS12に進んで、
構文変換部29および翻訳文生成部30が起動される。ス
テッフ゜S12で、上記構文変換部29によって、言語種類管理
バッファ24dの「入力言語」に応じて辞書メモリ24aか
ら木構造変換規則が選択される。そして、この木構造変
換規則を用いて、上記ステップS10において決定された
上記部分木がターゲット言語による部分木に変換されて
バッファDに格納される。ステップS13で、上記翻訳文
生成部30によって、上記変換後の部分木と当該処理対
象文を構成する各単語の訳語とに基づいて当該処理対象
文の翻訳文が生成されてバッファEに格納される。
【0048】ステップS14で、上記文法素性対応バッフ
ァ24bが参照されて、上記ステップS10において得ら
れた上記部分木の文法素性が言語種類管理バッファ24
dにおける退避されている直前の「出力言語」での文法素
性に変換される。そして、上記ステップS13において生
成された翻訳文を当該処理対象文の形態素とする一方、
本ステップにおいて得られた文法素性を当該処理対象文
の品詞とする当該処理対象文の辞書引き・形態素解析結
果が、バッファBに格納される。ステップS15で、上記
言語種類管理バッファ24dの内容が上記ステップS3に
おいて退避された内容に復帰される。具体的には、翻訳
記憶部24の言語種類管理バッファ24dの最新の内容
が削除され、他の内容が順次繰り上げられる。ステップ
S16で、当該単語(文字)に付加されている括弧“]"が
除去される。そうした後、上記ステップS8に戻って、
さらに括弧“]"が付加されているかが判別される。
【0049】ステップS17で、当該単語(文字)は当該入
力文における末尾の単語(文字)であるか否かが判別され
る。その結果、末尾の単語(文字)であればステップS18
に進んで、構文解析部28が起動される。一方、そうで
なければ上記ステップS1に戻って、次の単語(文字)に
対する処理に移行する。
【0050】ステップS18で、上記構文解析部28によ
って、上述のようにして得られた辞書引き・形態素解析
結果に対して構文解析処理が行われて、当該入力文(複
数言語混在文)の構文解析木が決定される。そして、得
られた構文解析木がバッファCに格納される。ステップ
S19で、上記言語種類管理バッファ24dにおける「出力
言語」の内容は「入力言語」の内容と一致しているか否か
が判別される。その結果、一致していれば上記ステップ
S18において得られた構文解析木がターゲット言語によ
る構文解析木であると確定され、この構文解析木と上記
ステップS1〜ステップS17の処理で得られた辞書引き・
形態素解析結果とに基づいて当該複数言語混在文の翻訳
文が生成されてバッファEに格納され、翻訳処理動作を
終了する。一方、一致していなければステップS20に進
んで、構文変換部29および翻訳文生成部30が起動さ
れる。
【0051】ステップS20で、上記構文変換部29によ
って、上記ステップS18において決定された構文解析木
がターゲット言語による構文解析木に変換されて、バッ
ファDに格納される。ステップS21で、上記翻訳文生成
部30によって、上記ターゲット言語による構文解析木
と上記ステップS1〜ステップS17の処理で得られた各
形態素の訳語とに基づいて、当該複数言語混在文の翻訳
文が生成されてバッファEに格納される。そうした後、
翻訳処理動作を終了する。
【0052】次に、上述のように言語名の指定および適
用範囲の指定が行われて、各単語別にバッファAに格納
されている複数言語混在文 e [e I e hear j [e [e cold e fit] j やら e [e itc
h] j やらで],e his j [j 演技] e was e miserable]. を例に、辞書引き・形態素解析部27,構文解析部28,
構文変換部29,翻訳文生成部30および翻訳制御部3
1による翻訳文生成処理動作を、より具体的に説明す
る。尚、以下の説明では、各単語に付加されている言語
記号,括弧“["および括弧“]"等を含めて単語と言う
場合もある。
【0053】先ず、上記例文における先頭単語「e [e I」
がバッファAから読み出される。この単語「e [e I」には
括弧“["が存在するので、言語種類管理バッファ24d
の内容が退避されて(実際には、当該単語は先頭単語で
あるから初期設定されて)、新たに、当該処理対象文「e
I e hear j … e miserable」に関する内容が設定され
る。その結果、言語種類管理バッファ24dの内容は図
14に示すようになる。そうした後に、辞書引き・形態
素解析部27が起動されて、単語「I」に付加されている
言語記号「e」に従って、辞書メモリ24aの英語辞書が用
いられて先頭単語「I」に対する辞書引き・形態素解析処
理が行われ、処理結果がバッファBに格納される。ま
た、この時点では当該処理対象文に対する辞書引き・形
態素解析処理は終了していないので、以後の構文解析部
28等による処理や翻訳結果の文法素性の変換や言語種
類管理バッファ24dの内容の復帰は行われない。…ス
テップS1〜S5,S2,S6〜S8,S17
【0054】次に、単語「e hear」がバッファAから読み
出される。この単語「e hear」には括弧“["あるいは括
弧“]"が付加されていないので、単語「e hear」に付加
されている言語記号「e」に従って辞書メモリ24aの英語
辞書が用いられて、単語「hear」に対する辞書引き・形態
素解析処理が行われて処理結果がバッファBに格納され
る。…ステップS1,S2,S6〜S8,S17
【0055】次に、単語「j [e [e cold」がバッファAか
ら読み出される。この単語「j [e [e cold」には括弧
“["が付加されているので、言語種類管理バッファ2
4dの内容が退避されて、新たに処理対象文「e [e cold
… j やらで」に関する内容が設定される。その結果、言
語種類管理バッファ24dの内容は図15に示すように
なる。さらに、当該単語「j [e [e cold」から言語記号
「j」と括弧“["とを除去した単語「e [e cold」には括弧
“["が付加されているので、言語種類管理バッファ2
4dの内容が再度退避されて、新たに処理対象文「e cold
e fit」に関する内容が設定される。その結果、言語種
類管理バッファ24dの内容は図16に示すようにな
る。…ステップS1〜S5,S2〜S4その後、上記辞書引
き・形態素解析部27が起動されて、単語「colde」に付
加されている言語記号「e」に従って、英語辞書が用いら
れて上記辞書引き・形態素解析処理が行われ、処理結果
がバッファBに格納される。その際に、一般的にイディ
オムの辞書引きは先頭語の辞書引きの際に同時に行われ
る。したがって、当該単語「colde」に対する辞書引き・形
態素解析処理の結果、熟語「cold fit」の辞書引き・形態
素解析にも成功する。ここで、単語「e fit]」には括
弧“]"が付加されているので、当該処理対象文「e cold
e fit」に関する辞書引き・形態素解析は終了したと判断
される。そして、図16に示す言語種類管理バッファ2
4dにおける「使用文法(英語)」に従って、英語の文法規
則を用いて熟語「cold fit」に対する構文解析が行われ
て、図17における破線a内の如く熟語「cold fit」の英
語における構文解析木の部分木が得られてバッファCに
格納される。…ステップS5,S2,S6〜S8,S17,S1,S
2,S6〜S10
【0056】次に、図16に示す言語種類管理バッファ
24dにおける「出力言語(日本語)」と「入力言語(英語)」
とが異なるために、熟語「cold fit」の上記部分木に対す
る構文変換処理および翻訳文生成処理が行われ、処理結
果がバッファDおよびバッファEに格納される。その結
果、熟語「cold fit」の部分訳「寒け」が得られるのであ
る。…ステップS11〜S13 こうして当該処理対象文(熟語)「cold fit」に対する部分
翻訳が終了すると、翻訳記憶部24の文法素性対応バッ
ファ24bが参照されて、当該処理対象文「coldfit」の英
語による文法素性「NP」が日本語による文法素性「名詞
句」に変換されて、上記部分訳「寒け」の文法素性として
与えられる(図17における破線b内)。そして、処理対
象文「cold fit」の辞書引き・形態素解析処理結果として
形態素「寒け」と品詞「名詞句」が与えられてバッファBに
格納される。そうした後、上記言語種類管理バッファ2
4dの内容を、直前の処理対象文に基づく内容に復帰す
る(具体的には、図15に示す内容に戻す)。…ステップ
S14〜S16,S8,S17
【0057】次に、単語「j やら」がバッファAから
読み出される。この単語「j やら」には括弧“["および
括弧“]"が付加されていないので、言語記号「j」に従っ
て日本語辞書が用いられて単語「やら」に対する辞書引
き・形態素解析処理が行われ、得られた処理結果がバッ
ファBに格納される。…ステップS1,S2,S6〜S8,S1
7 次に、単語「e [e itch]」が読み出される。この単語「e
[e itch]」においては、括弧“["と括弧“]"とによっ
て言語範囲の開始と終了とが指定されている。したがっ
て、上述した単語「e [e cold」と単語「e fit]」との場合
と同様にして、言語種類管理バッファ24dの内容の退
避と処理対象文「e itch」に関する内容の設定、英語辞書
を用いた単語「itch」に対する辞書引き・形態素解析処
理、および、英語の文法規則および日本語構文への木構
造変換規則を用いた処理対象文(単語)「itch」に対する構
文解析処理,構文変換処理及び翻訳文生成処理が行われ
る。その結果、処理対象文「itch」の部分訳「痒み(NP)」
が得られるのである。さらに、文法素性の変換が行われ
て上記部分訳「痒み」の日本語による文法素性として「名
詞句」与えられる。そして、処理対象文「itch」の辞書引
き・形態素解析処理結果として形態素「痒み」と品詞「名詞
句」がバッファBに格納される。そうした後、上記言語
種類管理バッファ24dの内容が図15に示す内容に戻
される。…ステップS1〜S5,S2,S6〜S16,S8,S17
【0058】次に、単語「j やらで]」が読み出され、日
本語辞書を用いた辞書引き・形態素解析処理が行われて
バッファBに格納される。さらに、この単語「j やら
で]」には括弧“]"が付加されているので、処理対象文
「e [e cold … j やらで」に関する辞書引き・形態素解析
は終了したと判断される。そして、図15に示す言語種
類管理バッファ24dにおける「使用文法(日本語)」に従
って、日本語の文法規則を用いて処理対象文「e [e cold
… j やらで」に対する構文解析が行われ、図17にお
ける破線c内の如く処理対象文「cold fit やら itch や
らで」の日本語における構文解析木の部分木が得られ
る。そして、処理対象文「cold fit やら itchやら
で」の構文解析結果がバッファCに格納される。…ステ
ップS1,S2,S6〜S10 また、図15に示す言語種類管理バッファ24dにおけ
る「出力言語」と「入力言語」とが共に日本語で等しいため
に上記構文変換処理および翻訳文生成処理は行われず、
処理対象文「cold fit やら itch やらで」の日本語構文
の部分木は図17における破線c内と確定され、部分訳
が「寒けやら痒みやらで」と確定されてバッファDに格納
される。さらに、当該処理対象文「cold fit やら itch
やらで」の日本語による文法素性「従属句」が英語による
文法素性「SCL」に変換され、上記部分訳「寒けやら痒
みやらで」の文法素性として与えられる(図17における
破線d内)。そして、処理対象文「cold fit やら itch
やらで」の辞書引き・形態素解析処理結果として形態素
「寒けやら痒みやらで」と品詞「SCL」がバッファBに格
納される。そうした後、上記言語種類管理バッファ24
dの内容が図14に示す内容に戻される。…ステップS1
1,S14〜S16,S8,S17
【0059】以下、初期の処理対象文「e I e hear j
… e miserable」の残りの文「e hisj [j 演技] e was」
に対する処理が順次行われる。この場合、単語「his」,「w
as」については英語辞書が用いられる一方、単語「演技」
については日本語辞書が用いられ辞書引き・形態素解析
処理が行われる。また、単語「演技」の文法素性「名詞」が
英語による文法素性「NOUN」に変換される。そして、
得られた処理結果がバッファBに格納される。
【0060】最後に、単語「e miserable]」が読み出さ
れ、英語辞書を用いた辞書引き・形態素解析処理が行わ
れてバッファBに格納される。すなわち、上述の各処理
の結果、バッファBには、入力部21に入力された入力
文 I hear cold fit やら itch やらで,his 演技 was mis
erable. の辞書引き・形態素解析結果が次のように格納されるこ
とになる(図17における破線e内)。 形態素 品詞 I NOUN hear VERB 寒けやら痒みやらで SCL his DET 演技 NOUN was BE miserable ADJ
【0061】さらに、上記最後の単語「e miserable]」に
は括弧“]"が付加されており、末尾の単語であるの
で、処理対象文「e I e hear j … e miserable」に関す
る辞書引き・形態素解析は終了したと判断される。そし
て、図14に示す言語種類管理バッファ24dにおける
「使用文法(英語)」に従って、英語による文法規則を用
いて、処理対象文「e I e hear j [ … e miserable」に
対する構文解析が、図17における破線e内の辞書引き
・形態素解析結果に基づいて行われる。こうして、処理
対象文「e I e hear j [ … e miserable」の日本語にお
ける構文解析木が、図17に示すように得られるのであ
る。…ステップS1,S2,S6〜S9,S18 また、図14に示す言語種類管理バッファ24dの「出力
言語(日本語)」と「入力言語(英語)」とが異なるために、
図14に示す言語種類管理バッファ24dにおける「入力
言語(英語)」に基づいて英語から日本語への木構造変換
規則を用いた構文変換処理が行われ、図14に示す言語
種類管理バッファ24dにおける「出力言語(日本語)」に
基づいて日本語の文法規則に従った翻訳文生成処理が行
われ、処理結果がバッファDおよびバッファEに格納さ
れる。…ステップS19〜S21
【0062】こうして、最終的に、入力文 I hear cold fit やら itch やらで,his 演技 was
miserable. の翻訳文 私は 寒けやら痒みやらで、彼の 演技 が悲惨だった
と聞いている。 が生成されるのである。
【0063】また、上述の例文 He knows the pen I bought. の複数の言語を混在させた前編集文 e)He knows I bought ペン が入力部21に入力された場合も、言語指定部25によ
って、利用者との対話によって、 言語指定文:e He e knows j [e [e I e bought] j
ン]. を生成することによって、翻訳制御部31による制御の
下に、当該複数言語混在文に対する翻訳処理が以下のよ
うに行われる。先ず、単語「I」および単語「bought」に対
する英語辞書を用いた辞書引き・形態素解析および英語
の文法規則による構文解析が行われ、得られた文法素性
が日本語の文法素性に変換される。さらに、処理対象文
「e [e I e bought] j ペン」に対する日本語辞書を用い
た辞書引き・形態素解析および日本語の文法規則による
構文解析等が行われ、得られた文法素性が英語の文法素
性に変換されて当該処理対象文「e [e I e bought] j
ン」の形態素と品詞とが求められる。そして、さらに、
単語「He」と単語「knows」に対する英語辞書を用いた辞書
引き・形態素解析結果と併せて、処理対象文「e He e kno
ws j [e [e I e bought] j ペン]」の構文解析処理,構文
変換処理および翻訳文生成処理が行われて、上記入力文 He knows I bought ペン. の正しい翻訳文 彼は、私が買ったペンを知っている が得られるのである。
【0064】上述のように、本実施の形態においては、
言語指定部25によって、利用者との対話によって、入
力文における必要な箇所に言語記号と括弧“["および
括弧“]"が付加されて言語名とその適用範囲とを指定
する。そして、翻訳制御部31は、辞書引き・形態素解
析部27,構文解析部28,構文変換部29および翻訳文
生成部30を制御して、言語範囲が指定されている処理
対象文に対する部分翻訳処理を行う。
【0065】その際に、上記言語記号と言語指定範囲と
に基づいて、括弧“["が付加された単語が入力されて
言語指定範囲に突入すると、翻訳記憶部24の言語種類
管理バッファ24dの「出力言語」,「入力言語」および「使
用文法」の内容を退避して当該言語範囲に係る処理対象
文に関する内容を設定する。そして、辞書引き・形態素
解析部27によって、当該処理対象文を構成する個々の
単語に付加されている言語記号に基づく辞書を用いた各
単語に対する辞書引き・形態素解析処理を行う。こうし
て、当該言語指定範囲に係る処理対象文に関する辞書引
き・形態素解析処理が終了すると、構文解析部28によ
って、言語種類管理バッファ24dの「使用文法」に基づ
く言語の文法規則に従った当該処理対象文に対する構文
解析処理を行う。そして、言語種類管理バッファ24d
の「出力言語」と「入力言語」とが異なる場合には、構文変
換部29および翻訳文生成部30によって、言語種類管
理バッファ24dの「入力言語」に基づく木構造変換規則
に従った構文変換処理及び「出力言語」に基づく翻訳文生
成処理を行う。
【0066】こうして、当該処理対象文に対する部分翻
訳処理が終了すると、得られた文法素性を言語種類管理
バッファ24dにおける退避されている直前の「入力言
語」に応じた文法素性に変換し、得られた部分訳と変換
後の文法素性を当該処理対象文の辞書引き・形態素解析
結果の形態素と品詞とする。そして、上記退避されてい
る言語種類管理バッファ24dの内容を復帰させるよう
にしている。
【0067】したがって、本実施の形態によれば、複数
言語混在文を構成する各処理対象文毎に指定された言語
名とその適用範囲とに基づいて、各処理対象文に対する
部分翻訳処理の際に用いるのに相応しい辞書,文法規則,
木構造変換規則等を適確に選択して、正しい部分翻訳処
理を行なうことができる。その結果、各部分翻訳処理結
果を用いて当該複数言語混在文の翻訳処理を行なうこと
によって、当該複数言語混在文の正しい翻訳文を得るこ
とができるのである。
【0068】<第2実施の形態>図18は、本実施の形
態における機械翻訳装置の構成図である。入力部51,
出力部53,辞書引き・形態素解析部57,構文解析部5
8,構文変換部59および翻訳文生成部60は、図1に
示す第1実施の形態における入力部21,出力部23,辞
書引き・形態素解析部27,構文解析部28,構文変換部
29および翻訳文生成部30と同様の構成を有して、同
様に動作する。また、辞書メモリ54a,文法素性対応バ
ッファ54bおよび言語記号バッファ54cは、図1に示
す第1実施の形態における辞書メモリ24a,文法素性対
応バッファ24bおよび言語記号バッファ24cと同様の
構成を有している。
【0069】第1実施の形態においては、上記言語指定
部25は、入力文における総ての単語に対して言語名と
その適用範囲とを指定するようになっている。したがっ
て、利用者は、入力部21から、総ての単語に対して言
語記号を付加し、総ての処理対象文に対して言語記号と
括弧“["と括弧“]"とを付加する必要があり、非常に
煩わしい。そこで、本実施の形態における言語指定部5
5は、入力部51からの利用者の次のような入力に呼応
して言語名の指定および範囲の指定を行う。 ・言語名の指定:上記言語記号の何れかを目的とする単
語に付加する既に付加された言語記号による統率下にあ
る単語への付加は省略できる ・範囲の指定 :括弧“[ ]"で括る
【0070】上述の入力文 I hear cold fit やら itch やらで,his 演技 was mis
erable. の場合には、先ず当該入力文は英語であり、単語「I」お
よび「hear」の言語は英語であるから、単語「I」と単語「he
ar」とに対する言語記号の付加は省略される。次に、「co
ld fit やら itch やらで,」は、英単語列「cold fit」お
よび英単語「itch」を含んではいるものの文の構造は日
本語であるから、括弧“[ ]"で括って「j 」を付加する。 j [cold fit やら itch やらで] その結果「cold fit やら itch やらで,」全体が日本語
指定となったので、単語列「cold fit」および単語「itch」
を括弧“[ ]"で括って「e 」を付加して英語を指定する。
逆に、単語「やら」および単語「やらで」に対しては日本語
の指定する必要がない。 j [e [cold fit] やら e [itch] やらで] 残りの「his 演技 was miserable.」は英語の構造を有し
ているが、当該入力部全体が英語指定であるから言語指
定と範囲指定の必要はない。但し、単語「演技」は日本語
であるから括弧“[ ]"で括って「j 」を付加する必要があ
る。その結果、当該入力文に対する言語名の指定と範囲
の指定は次のようになる。 I hear j [e [cold fit] やら e [itch] やらで],his
j [演技] was miserable. このように、本実施の形態における言語名の指定と範囲
の指定とは、第1実施の形態に比して大幅に簡略化され
るのである。
【0071】また、本実施の形態における言語種類管理
バッファ54dは、図21に例示するように、 出力言語:翻訳ターゲット言語名(英日翻訳の場合には
日本語) 入力言語:処理対象文全体を文法的に司る言語名 使用辞書:入力言語用の辞書 使用文法:入力言語用の文法規則 処理対象文:入力文あるいは言語指定範囲内の部分文字
列 の構造を有している。また、翻訳制御部61は、入力文
中における言語指定部55で指定された言語の種類に応
じて、辞書引き・形態素解析部57,構文解析部58およ
び構文変換部59等で使用する辞書や文法規則や木構造
変換規則等を翻訳記憶部54から選択し、辞書引き・形
態素解析部57,構文解析部58,構文変換部59および
翻訳文生成部60を制御して翻訳処理を行う。
【0072】図19および図20は、上記辞書引き・形
態素解析部57,構文解析部58,構文変換部59,翻訳
文生成部60および指定言語翻訳制御部61によって行
われる翻訳処理動作のフローチャートである。本翻訳処
理動作のフローチャートは、図12および図20に示す
第1実施の形態における翻訳処理動作のフローチャート
と基本的には同一である。但し、本翻訳処理動作におい
ては、言語種類管理バッファ54dにおける「出力言語」,
「入力言語」,「使用辞書」,「使用文法」及び「処理対象文」の
内容が、言語指定部55によって言語名と適用範囲とが
指定された複数言語混在文に基づいて所定の値に設定さ
れた後にスタートされる。こうして、辞書引き・形態素
解析処理の際に使用される辞書は予め言語種類管理バッ
ファ54dにおける「使用辞書」に設定されているので、
図12に示す翻訳処理動作のフローチャートにおける上
記ステップS6に相当する指定言語用辞書設定の処理は
必要ない。
【0073】以下、上述のように言語名の指定および適
用範囲の指定が行われて、各単語別にバッファAに格納
されている複数言語混在文 I hear j [e [cold fit] やら e [itch] やらで],his
j [演技] was miserable. を例に、翻訳制御部61による制御の下に、辞書引き・
形態素解析部57,構文解析部58,構文変換部59およ
び翻訳文生成部60によって行われる翻訳文生成処理動
作を具体的に説明する。本翻訳文生成処理動作の開始に
先立って、当該複数言語混在文に基づいて、言語種類管
理バッファ54dの内容が、 出力言語:日本語 入力言語:英語 使用辞書:英語 使用文法:英語 処理対象文:I hear j [e [cold fit] やら e [itch]
やらで],his j [演技] was miserable. の如く設定される(図21)。
【0074】先ず、上記処理対象文における先頭の単語
「I」と2番目の単語「heare」とには、括弧“["および括
弧“]"は存在しないので、言語種類管理バッファ54d
の「使用辞書」に従って英語辞書を用いた辞書引き・形態
素解析処理が行われる。…ステップS31,S32,S36,S3
7,S46
【0075】次に、単語「j [e [cold」には括弧“["が
存在するので、言語種類管理バッファ54dの内容が退
避されて、新たに処理対象文「e [cold fit] やら e [it
ch]やらで」に関する内容が設定される。その結果、言語
種類管理バッファ54dの内容は図22に示すようにな
る。さらに、当該単語「j [e [cold」から言語記号「j」と
括弧“["が外された単語「e [cold」には括弧“["が付
加されているので、言語種類管理バッファ54dの内容
が再度退避される一方、新たに処理対象文「coldfit」に
関する内容が設定される。その結果、言語種類管理バッ
ファ54dの内容は図23に示すようになる。そして、
当該単語「cold」と次の単語「fit]」とから成る熟語「cold
fit」に対する辞書引き・形態素解析処理が、図23に示
す言語種類管理バッファ54dの「使用辞書」に従って英
語辞書を用いて行われる。…ステップS31〜S35,S32
〜S35,S32,S36,S37,S46,S31,S32,S36
【0076】さらに、上記単語「fit]」には括弧“]"が
付加されているので、熟語(処理対象文)「cold fit」に関
する辞書引き・形態素解析は終了したと判断される。そ
して、図23に示す言語種類管理バッファ54dの「使用
文法」に従って、英語の文法規則を用いた処理対象文「co
ld fit」に対する構文解析が行われる。また、図23に
示す言語種類管理バッファ54dにおける「出力言語」と
「入力言語」とが異なるために、処理対象文「cold fit」の
上記部分木に対する構文変換処理および翻訳文生成処理
が行われて、処理対象文「cold fit」に対する部分訳「寒
け」が得られるのである。…ステップS37〜S42 こうして当該処理対象文「cold fit」に対する部分翻訳が
終了すると、翻訳記憶部54の文法素性対応バッファ5
4bが参照されて、当該処理対象文「cold fit」の英語に
よる文法素性「NP」が日本語による文法素性「名詞句」に
変換される。こうして、処理対象文「cold fit」の辞書引
き・形態素解析処理結果として形態素「寒け」と品詞「名詞
句」とが得られる。そうした後、上記言語種類管理バッ
ファ54dの内容を図22に示す内容に戻される。…ス
テップS43〜S45,S37,S46
【0077】次に、単語「やら」には括弧“["は存在し
ないので、言語種類管理バッファ54dの「使用辞書」に
従って日本語辞書を用いた辞書引き・形態素解析処理が
行われる。…ステップS31,S32,S36,S37,S46 次に、単語「e [itch]」に対して、上述した単語「e [col
d」と単語「fit]」との場合と同様にして、言語種類管理バ
ッファ54dの内容の退避と処理対象文「itch」に関する
内容の設定、英語辞書を用いた単語「itch」に対する辞書
引き・形態素解析処理、および、英語の文法規則や日本
語構文への木構造変換規則を用いた処理対象文「itch」に
対する構文解析処理,構文変換処理および翻訳文生成処
理が行われて、処理対象文「itch」の部分訳「痒み(NP)」
が得られる。さらに、文法素性の変換が行われて、処理
対象文「itch」の辞書引き・形態素解析処理結果として形
態素「痒み」と品詞「名詞句」とが得られる。そうした後、
上記言語種類管理バッファ54dの内容が図22に示す
内容に戻される。…ステップS31〜S35,S32,S36〜S
45,S37,S46
【0078】次に、単語「やらで]」に対して、言語種類
管理バッファ54dの「使用辞書」に従って日本語辞書を
用いた辞書引き・形態素解析処理が行われる。さらに、
この単語「やらで]」には括弧“]"が付加されているの
で、処理対象文「e [cold fit] やら e [itch] やらで」
に対して、図22に示す言語種類管理バッファ54dの
「使用文法」に従った日本語の文法規則での構文解析処理
が行われる。そして、図22に示す言語種類管理バッフ
ァ54dの「出力言語」と「入力言語」とが等しいために、
処理対象文「cold fit やら itch やらで」の日本語構文
の部分木が確定されて、部分訳が「寒けやら痒みやらで」
と確定される。さらに、上記文法素性の変換が行われ、
処理対象文「cold fit やら itch やらで」の辞書引き・形
態素解析処理結果として、形態素「寒けやら痒みやらで」
と品詞「SCL」とが得られる。そうした後、上記言語種
類管理バッファ54dの内容が図21に示す内容に戻さ
れる。…ステップS31,S32,S36〜S40,S43〜S45,S
37,S46
【0079】以下、初期の処理対象文「I hear … his j
[演技] was miserable.」における残りの文「his j [演
技] was」に対する処理が順次行われる。この場合、言語
種類管理バッファ54dの「使用辞書」に従って、単語「hi
s」および「was」については英語辞書が用いられる一方、
単語「演技」については日本語辞書が用いられて辞書引き
・形態素解析処理が行われる。また、単語「演技」の文法
素性「名詞」が英語による文法素性「NOUN」に変換され
る。
【0080】さらに、当該入力文の末尾の単語「miserab
le.」が読み出されて、言語種類管理バッファ54dの「使
用辞書」に従って、英語辞書が用いられた辞書引き・形態
素解析処理が行われる。すなわち、上述の各処理の結
果、バッファBには、入力部51に入力された入力文 I hear cold fit やら itch やらで,his 演技 was mis
erable. の辞書引き・形態素解析結果が次のように格納されるこ
とになる。 形態素 品詞 I NOUN hear VERB 寒けやら痒みやらで SCL his DET 演技 NOUN was BE miserable ADJ
【0081】さらに、初期処理対象文「I hear … mise
rable」に関する辞書引き・形態素解析は終了したと判断
されて、図21に示す言語種類管理バッファ54dの「使
用文法」に従って英語の文法規則を用いて、処理対象文
「I hear … miserable」に対する構文解析が、上述の辞
書引き・形態素解析結果に基づいて行われる。こうし
て、初期処理対象文「I hear … miserable」の日本語に
おける構文解析木が、図17に示すように得られるので
ある。さらに、図21に示す言語種類管理バッファ54
dにおける「出力言語」と「入力言語」とが異なるために、
構文変換処理および翻訳文生成処理が行われ、処理結果
がバッファDおよびバッファEに格納される。…ステッ
プS31,S32,S36,S37,S46〜S50
【0082】こうして、最終的に、入力文 I hear cold fit やら itch やらで,his 演技 was mis
erable. の翻訳文 私は 寒けやら痒みやらで、彼の 演技 が悲惨だった と
聞いている。 が生成されるのである。
【0083】上述のように、本実施の形態における言語
種類管理バッファ54dには、単語に付加されている言
語記号および括弧“["に基づいて内容が更新される「使
用辞書」および「使用文法」が設定されている。そして、
辞書引き・形態素解析部57によって使用される辞書
は、言語種類管理バッファ54dの「使用辞書」の内容に
従って設定するようになっている。したがって、入力文
に対しては、使用辞書や使用規則を変更する必要がある
位置にのみ言語名および適用範囲を指定すればよい。す
なわち、本実施の形態においては、第1実施の形態のよ
うに総ての単語に言語記号を付加する必要がなく、使用
者の労力を軽減できる。
【0084】<第3実施の形態>図24は、本実施の形
態における機械翻訳装置の構成図である。入力部71,
出力部73,言語指定部75,辞書引き・形態素解析部7
7,構文解析部78,構文変換部79および翻訳文生成部
80は、図1に示す第1実施の形態における上記入力部
21,出力部23,言語指定部25,辞書引き・形態素解析
部27,構文解析部28,構文変換部29および翻訳文生
成部30と同様の構成を有して、同様に動作する。ま
た、翻訳記憶部74は、図1に示す第1実施の形態にお
ける翻訳記憶部24と同様の構成を有している。
【0085】第2実施の形態においては、使用辞書や使
用規則を変更する必要がある単語にのみ言語名および適
用範囲を指定すればよくはなっているが、まだ多くの単
語に対して言語名および適用範囲をしてする必要があ
り、使用者に多大の負担を強いている。
【0086】ところで、言語によっては、独特の文字コ
ードを有しているものがある。例えば、日本語の全角文
字(漢字,平仮名,カタカナ等)は16ビット(2バイト)の
文字コードが割り当てられているが、現在の計算機での
内部表現においては、全角文字の領域の前後に特定のコ
ードシーケンスを挿入したり(JISコード体系)、全角
文字領域をずらしたり(シフトJISコード体系)、最上
位ビットをセットしたり(EUCコード)して、1つの文
字列中に全角文字とASCIIコードとが混在するよう
なことがあっても識別できるようになっている。
【0087】そこで、本実施の形態では、入力文におけ
る各単語の文字コードを調べて言語を判定する言語判定
部76を設ける。この言語判定部76は、言語指定部7
5から送出されてくる複数言語混在文の1文字毎に、特
定のコードシーケンスが存在するか否か、領域にずれが
あるか否か、最上位ビットが「1」か否かをチェックす
る。そして、何れかが可であれが入力文字が日本語であ
ると判定し、判定結果を翻訳制御部81に送出するので
ある。
【0088】このように、本実施の形態においては、使
用辞書を指定するための言語名および適用範囲の指定は
必要がないので、言語指定部75は、表記言語と構文構
造の言語とが異なるような領域に対してのみ言語名およ
び適用範囲の指定を行えばよいことになる。すなわち、
上述の入力文 I hear cold fit やら itch やらで,his 演技 was mis
erable. の場合には、次のようになる。 I hear j [cold fit やら itch やらで],his 演技 was
miserable. このように、本実施の形態における言語名の指定と範囲
の指定とは、第2実施の形態に比しても大幅に簡略化さ
れるのである。
【0089】翻訳制御部81は、入力文中における言語
指定部75で指定された言語の種類および言語判定部7
6によって判定された言語の種類に応じて、辞書引き・
形態素解析部77,構文解析部78および構文変換部7
9等で使用する辞書や文法規則や木構造変換規則等を翻
訳記憶部74から選択し、辞書引き・形態素解析部77,
構文解析部78,構文変換部79および翻訳文生成部8
0を制御して翻訳処理を行う。
【0090】尚、本実施の形態における翻訳処理動作の
フローチャートは、図12及び図13に示す第1実施の
形態における翻訳処理動作のフローチャートと基本的に
は同一であるからその記載は省略する。但し、本翻訳処
理動作における言語種類管理バッファ24dの内容の退
避への移行の判定は、括弧“["の有無に加えて、言語
判定部76による判定結果と言語種類管理バッファ74
dに退避されている直前の「入力言語」との差異によって
行う。また、各処理対象文に対する構文解析処理への移
行の判定は、括弧“]"の有無に加えて、言語判定部7
6による判定結果に基づく言語の切り替わりによって行
う。さらに、上記指定言語用辞書設定は、言語判定部7
6による判定結果に基づいて行う。さらに、言語種類管
理バッファ74dの「出力言語」,「入力言語」,「使用文法」
および「処理対象文」の内容が、言語指定部75からの複
数言語混在文に基づいて所定の値に設定された後にスタ
ートされる。
【0091】尚、アルファベットのように半角文字しか
現れない欧米言語(英語,フランス語,ドイツ語等)間の翻
訳の場合には、文字コードのみでは言語を判別すること
は不可能である。したがって、このような場合には、第
1実施の形態あるいは第2実施の形態の方法によって言
語名および適用範囲の指定を行う必要がある。
【0092】上述のように、本実施の形態においては、
言語指定部75から送出されてくる複数言語混在文の1
文字毎に日本語であると判定して判定結果を翻訳制御部
81に送出する言語判定部76を有している。そして、
翻訳制御部81は、言語判定部76からの判定結果を受
けて指定言語用辞書の設定を行うようにしている。した
がって、入力文に対しては、使用文法規則を変更する必
要がある場合にのみ言語指定部75から言語名および適
用範囲を指定すればよい。すなわち、本実施の形態にお
いては、使用辞書を指定するために言語名および適用範
囲を指定する必要がなく、使用者の労力を更に軽減でき
る。
【0093】この発明における翻訳処理動作の詳細なア
ルゴリズムは、図12,図13,図19,図20に示すフ
ローチャートに限定されるものではない。
【0094】
【発明の効果】以上より明らかなように、請求項1に係
る発明の機械翻訳装置は、辞書引き・形態素解析部,構文
解析部,構文変換部および翻訳文生成部を制御して、複
数言語混在文中のある言語での構文構造の統率下にある
部分文字列に対する部分翻訳を行う際に、使用する辞
書,構文規則および構文変換規則を、言語指定部によっ
て当該複数言語混在文に付加された言語記号と範囲指定
記号と言語種類保持部の保持内容を参照して辞書・規則
格納部から選定する翻訳制御部を備えたので、当該複数
言語混在文中の個々の部分文字列に対する部分翻訳処理
を当該部分文字列用の正しい辞書,構文規則および構文
変換規則を用いて行うことができる。したがって、後
に、上記翻訳制御部の制御の下に、辞書引き・形態素解
析部,構文解析部,構文変換部および翻訳文生成部によっ
て各部分文字列の部分翻訳結果に基づいて行われる当該
複数言語混在文に対する翻訳処理によって、当該複数言
語混在文の正しい翻訳文を得ることができる。
【0095】また、請求項2に係る発明の機械翻訳装置
における翻訳制御部は、部分文字列を検出する毎に上記
言語種類保持部の保持内容を退避して新たに当該部分文
字列に関する内容を保持させる言語種類管理手段と、使
用する辞書,構文規則および構文変換規則を上記辞書・規
則格納部から選定して辞書引き・形態素解析部,構文解析
部,構文変換部および翻訳文生成部を制御して各部分文
字列に対する部分翻訳処理と上記言語種類保持部の退避
内容の復帰を行う部分翻訳制御手段と、上記辞書引き・
形態素解析部,構文解析部,構文変換部および翻訳文生成
部を制御して当該複数言語混在文の翻訳文を生成する翻
訳制御手段を備えたので、上記言語種類保持部には、常
に、現在部分翻訳の対象となっている部分文字列に関す
る内容が保持される。したがって、上記部分翻訳制御手
段による部分翻訳に際しては、上記言語種類保持部の内
容を参照して、常に、正しい辞書,構文規則および構文
変換規則を選定することができる。
【0096】また、請求項3に係る発明の機械翻訳装置
における言語指定部は、予め言語が分かっている単語お
よび既に付加された言語記号による統率下にある単語に
対する上記言語記号の付加を省略することが可能であ
り、言語種類保持部は、当該部分文字列に対する形態素
解析の際に使用する辞書の言語名を保持し、翻訳制御部
は、上記形態素解析を行う場合には上記言語種類保持部
に保持された辞書の言語名を参照して使用する辞書を選
定するので、上記言語指定部によって複数言語混在文に
対して必要最小限の言語記号を付加するだけで、複数言
語混在文中の各部分文字列に対する部分翻訳時に使用さ
れる辞書,構文規則および構文変換規則を正しく設定で
きる。したがって、この発明によれば、上記言語指定部
からの簡単な指定で、複数言語混在文の正しい翻訳文を
得ることができる。
【0097】また、請求項4に係る発明の機械翻訳装置
における翻訳制御部は、上記形態素解析を行う場合に
は、言語判定部による文字コードに基づく言語の判定結
果に従って使用する辞書を選定するので、上記形態素解
析時に使用する辞書を自動的に正しく設定できる。した
がって、この発明によれば、上記言語指定部は、表記言
語と構文構造の言語とが異なるような部分文字列に対す
る構文構造の言語名を表す言語記号と当該構文構造の適
用範囲を指定するだけでよく、さらに簡単な処理で、複
数言語混在文の正しい翻訳文を得ることができる。
【図面の簡単な説明】
【図1】この発明の機械翻訳装置における一実施の形態
における機能構成を示すブロック図である。
【図2】図1に示す機能を実現するための構成図であ
る。
【図3】図2における翻訳モジュールの構成図である。
【図4】図1における文法素性対応バッファの記憶内容
を示す概念図である。
【図5】図1における言語記号バッファの記憶内容を示
す概念図である。
【図6】機械翻訳処理時における解析レベルの説明図で
ある。
【図7】図3におけるバッファAの記憶内容を示す概念
図である。
【図8】図3におけるバッファBの記憶内容を示す概念
図である。
【図9】図3におけるバッファCの記憶内容を示す概念
図である。
【図10】図3におけるバッファDの記憶内容を示す概
念図である。
【図11】図3におけるバッファEの記憶内容を示す概
念図である。
【図12】図1に示す機械翻訳装置による翻訳処理動作
のフローチャートである。
【図13】図12に続く翻訳処理動作のフローチャート
である。
【図14】図13に示す指定言語翻訳サブルーチン実行
の際における言語種類管理バッファの内容の変遷の一例
を示す概念図である。
【図15】図14に続く言語種類管理バッファの内容の
変遷の一例を示す概念図である。
【図16】図15に続く言語種類管理バッファの内容の
変遷の一例を示す概念図である。
【図17】図12に示す翻訳処理動作の結果得られる構
文解析木の一例を示す概念図である。
【図18】この発明の機械翻訳装置における図1とは異
なる機能構成を示すブロック図である。
【図19】図18に示す機械翻訳装置による翻訳処理動
作のフローチャートである。
【図20】図19に続く翻訳処理動作のフローチャート
である。
【図21】図20に示す指定言語翻訳サブルーチン実行
の際における言語種類管理バッファの内容の変遷の一例
を示す概念図である。
【図22】図21に続く言語種類管理バッファの内容の
変遷の一例を示す概念図である。
【図23】図22に続く言語種類管理バッファの内容の
変遷の一例を示す概念図である。
【図24】この発明の機械翻訳装置における図1および
図18とは異なる機能構成を示すブロック図である。
【図25】複数言語混在文を翻訳可能な従来の機械翻訳
装置のブロック図である。
【図26】複数言語混在文を翻訳可能な図25とは異な
る従来の機械翻訳装置のブロック図である。
【符号の説明】
21,51,71…入力部、 22,52,72…
翻訳CPU、24,54,74…翻訳記憶部、 24
a,54a,74a…辞書メモリ、24b,54b,74b…文法
素性対応バッファ、24c,54c,74c…言語記号バッ
ファ、24d,54d,74d…言語種類管理バッファ、2
5,55,75…言語指定部、27,57,77…辞書引き
・形態素解析部、28,58,78…構文解析部、
29,59,79…構文変換部、30,60,80…翻訳文
生成部、 31,61,81…翻訳制御部、76…言語
判定部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 入力部から入力されたある言語による文
    字列に対して辞書を用いて形態素解析を行う辞書引き・
    形態素解析部と、この辞書引き・形態素解析部による形
    態素解析結果に基づいて文法規則を用いて当該文字列の
    構文解析を行う構文解析部と、構文変換規則を用いて上
    記構文解析部によって得られた構文構造を他の言語によ
    る構文構造に変換する構文変換部と、この構文変換部に
    よる変換結果に基づいて入力文の上記他の言語による翻
    訳文を生成する翻訳文生成部を有して、ソース言語以外
    の言語の文を含む複数言語混在文をターゲット言語に翻
    訳して出力部から出力する機械翻訳装置において、 上記辞書,構文規則および構文変換規則が、少なくとも
    上記ソース言語とターゲット言語を含む複数の言語毎に
    格納されている辞書・規則格納部と、 使用者との対話によって、入力された複数言語混在文に
    対して、各単語には言語名を表す言語記号を付加する一
    方、ある言語での構文構造の統率下にある部分文字列に
    は当該言語名を表す言語記号と当該言語の適用範囲を指
    定する範囲指定記号を付加する言語指定部と、 当該複数言語混在文中の上記言語記号および範囲指定記
    号に基づいて設定される上記部分文字列と当該部分文字
    列の言語名と当該部分文字列に対する構文解析の際に使
    用する文法規則の言語名とターゲット言語名を保持する
    言語種類保持部と、 上記言語指定部によって複数言語混在文に付加された言
    語記号と範囲指定記号と上記言語種類保持部に保持され
    た内容を参照して使用する辞書,構文規則および構文変
    換規則を上記辞書・規則格納部から選定し、上記辞書引
    き・形態素解析部,構文解析部,構文変換部および翻訳文
    生成部を制御して、当該複数言語混在文中の個々の部分
    文字列に対する部分翻訳と、この部分翻訳結果に基づく
    当該複数言語混在文の構文解析,構文変換および翻訳文
    生成とを行う翻訳制御部を備えたことを特徴とする機械
    翻訳装置。
  2. 【請求項2】 請求項1に記載の機械翻訳装置におい
    て、 上記翻訳制御部は、 上記言語指定部によって複数言語混在文に付加された言
    語記号と範囲指定記号とを参照して、上記範囲指定記号
    によって上記適用範囲が指定された部分文字列を検出す
    る毎に、上記言語種類保持部に現在保持されている内容
    を退避し、新たに当該部分文字列と当該部分文字列の言
    語名と当該部分文字列に適用する文法規則の言語名とを
    保持させて、当該部分文字列に関する言語の種類を管理
    する言語種類管理手段と、 当該複数言語混在文の各単語に付加された上記言語記号
    および範囲指定記号と上記言語種類保持部に保持されて
    いる内容とを参照して、使用する辞書,構文規則および
    構文変換規則を上記辞書・規則格納部から選定し、上記
    辞書引き・形態素解析部,構文解析部,構文変換部および
    翻訳文生成部を制御して、各部分文字列を構成する単語
    の形態素解析とこの単語の形態素解析結果に基づく個々
    の部分文字列に対する部分翻訳処理と上記言語種類保持
    部の退避内容の復帰を行う部分翻訳制御手段と、 上記辞書引き・形態素解析部,構文解析部,構文変換部お
    よび翻訳文生成部を制御して、上記部分翻訳制御手段に
    よる各部分翻訳結果に基づいて、当該複数言語混在文の
    構文解析,構文変換および翻訳文生成を行う翻訳制御手
    段を備えたことを特徴とする機械翻訳装置。
  3. 【請求項3】 請求項1に記載の機械翻訳装置におい
    て、 上記言語指定部は、予め言語が分かっている単語および
    既に付加された言語記号による統率下にある単語に対す
    る上記言語記号の付加を省略することが可能であり、 上記言語種類保持部は、当該部分文字列に対する形態素
    解析の際に使用する辞書の言語名をも保持し、 上記翻訳制御部は、上記辞書引き・形態素解析部を制御
    して上記形態素解析を行う場合には、上記言語種類保持
    部に保持された辞書の言語名を参照して上記辞書・規則
    格納部から使用する辞書を選定するようになっているこ
    とを特徴とする機械翻訳装置。
  4. 【請求項4】 請求項1に記載の機械翻訳装置におい
    て、 入力された複数言語混在文の文字コードに基づいて、当
    該複数言語混在文の言語を文字単位で判定する言語判定
    部を備えると共に、 上記言語指定部は、表記言語と構文構造の言語とが異な
    るような部分文字列に対して構文構造の言語名を表す言
    語記号と当該構文構造の適用範囲を指定する上記範囲指
    定記号とを付加し、 上記翻訳制御部は、上記辞書引き・形態素解析部を制御
    して上記形態素解析を行う場合には、上記言語判定部に
    よる判定結果に従って上記辞書・規則格納部から使用す
    る辞書を選定するようになっていることを特徴とする機
    械翻訳装置。
JP7339433A 1995-12-26 1995-12-26 機械翻訳装置 Pending JPH09179866A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7339433A JPH09179866A (ja) 1995-12-26 1995-12-26 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7339433A JPH09179866A (ja) 1995-12-26 1995-12-26 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH09179866A true JPH09179866A (ja) 1997-07-11

Family

ID=18327426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7339433A Pending JPH09179866A (ja) 1995-12-26 1995-12-26 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH09179866A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519963A (zh) * 2018-03-02 2018-09-11 山东科技大学 一种将流程模型自动转换为多语言文本的方法
WO2020012813A1 (ja) * 2018-07-09 2020-01-16 ソニー株式会社 情報処理装置、および情報処理方法、並びにプログラム
JP2022510818A (ja) * 2018-11-20 2022-01-28 アマゾン テクノロジーズ インコーポレイテッド 改良されたデータマッチングのためのデータレコードの字訳

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108519963A (zh) * 2018-03-02 2018-09-11 山东科技大学 一种将流程模型自动转换为多语言文本的方法
WO2020012813A1 (ja) * 2018-07-09 2020-01-16 ソニー株式会社 情報処理装置、および情報処理方法、並びにプログラム
JP2022510818A (ja) * 2018-11-20 2022-01-28 アマゾン テクノロジーズ インコーポレイテッド 改良されたデータマッチングのためのデータレコードの字訳

Similar Documents

Publication Publication Date Title
JP3377290B2 (ja) イディオム処理機能を持つ機械翻訳装置
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPH04235673A (ja) 翻訳装置
US5075851A (en) System for translating a source language word with a prefix into a target language word with multiple forms
JPH09179866A (ja) 機械翻訳装置
JPH0855123A (ja) イディオム登録機能を有する機械翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP2719453B2 (ja) 機械翻訳装置
JP3999771B2 (ja) 翻訳支援プログラム、翻訳支援装置、翻訳支援方法
JPH05225232A (ja) テキスト自動前編集装置
JP3233800B2 (ja) 機械翻訳装置
JP3353873B2 (ja) 機械翻訳装置
JPH0332105B2 (ja)
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH0736885A (ja) 文書作成装置の文字情報変換制御方法及び同装置
JPH09179865A (ja) 翻訳対象領域決定機能付き機械翻訳装置
JPH07141382A (ja) 外国語文書作成支援装置
JPH03129468A (ja) 英日機械翻訳装置
JPH0383161A (ja) 文書作成処理装置
JPH10320395A (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH05158971A (ja) 機械翻訳装置
JPH0345423B2 (ja)
JPS62163170A (ja) 機械翻訳システム
JPH08241315A (ja) 文書処理装置の単語登録機構
JPH0877159A (ja) 学習方法