JP3569753B2 - 機械翻訳用辞書作成装置 - Google Patents

機械翻訳用辞書作成装置 Download PDF

Info

Publication number
JP3569753B2
JP3569753B2 JP25721099A JP25721099A JP3569753B2 JP 3569753 B2 JP3569753 B2 JP 3569753B2 JP 25721099 A JP25721099 A JP 25721099A JP 25721099 A JP25721099 A JP 25721099A JP 3569753 B2 JP3569753 B2 JP 3569753B2
Authority
JP
Japan
Prior art keywords
pattern
translation
source language
target language
variable
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25721099A
Other languages
English (en)
Other versions
JP2001084249A (ja
Inventor
さより 下畑
稔樹 村田
秀樹 山本
毅至 福居
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP25721099A priority Critical patent/JP3569753B2/ja
Publication of JP2001084249A publication Critical patent/JP2001084249A/ja
Application granted granted Critical
Publication of JP3569753B2 publication Critical patent/JP3569753B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、機械翻訳システムにおいて、高品質の翻訳結果を得るために利用する辞書を効率的に作成する機械翻訳用辞書作成装置に関するものである。
【0002】
【従来の技術】
インターネットの普及、パーソナルコンピュータ利用者の増加に伴い、ある言語で記述されたテキストを別の言語に翻訳する機械翻訳システムが急速に普及している。
【0003】
しかしながら、一般の機械翻訳システムでは、システムが提供する辞書だけでは多様な分野の文章を適切に翻訳することができないため、ユーザ毎、あるいは分野毎の辞書を構築することが不可欠である。
【0004】
辞書の構築にかかわる従来技術としては、例えば特開平11−45244号公報等に開示されている方法があった。これは、文対応のついた対訳文書を対象に、原文と訳文の同一文中にある閾値を越えて出現する語句のペアを対訳対として抽出する方法である。
【0005】
機械翻訳の方式には、トランスファー方式、中間言語方式を始めとして様々な方式があるが、近年実用化され始めた方式として大量の翻訳パターンを用いて原言語から目的言語に変換する翻訳方式がある。この方式では、単語、句、節、あるいは文毎に原言語と目的言語を対応づけた翻訳パターンを用いて翻訳処理を行う。
【0006】
このような従来技術としては、例えば特開平10−11447号公報に開示されている方法があった。
【0007】
図2は、一般的な翻訳パターンの例を示す説明図である。図示のように、翻訳パターンは、原言語パターンを表す記号(変数)、原言語パターン、目的言語パターン、目的言語パターンを表す記号(変数)、原言語に対応する目的言語パターンで構成されている。
【0008】
原言語パターンおよび目的言語パターンは[]で囲まれた変数部分とそれ以外の定数部分からなる。変数部分は、[id:変数名]あるいは[id:変数名:素性情報]といった形で記述される。idは2言語間の変数の対応付けを示す値(例えば数字)である。原言語パターンと目的言語パターンで同じid値を持つ変数は、2言語間で等価な言い換え、即ち、翻訳対であることを示す。
【0009】
例えば、図2の1行目のデータは、英語の名詞句NPと動詞句VPの並びが文Sに置換されていることを表している。また、英語のSは日本語のSになっており、英語の名詞句NPは日本語のNPに、英語の動詞句VPは日本語の動詞句VPにそれぞれ対応している。
【0010】
素性情報とは、単語の活用形や単数複数の情報、名詞の意味カテゴリなど、単語や句、節の詳細な特徴を示す情報である。素性情報は、素性=値の形で記述されるものとする。“:”に繋げていくつでも記述でき、または一つもなくてもよい。素性情報は、原言語パターンに付与されるとパターンマッチの条件となり、目的言語パターンに付与される訳文生成のための情報となる。素性情報は更に、変数部分だけでなく、定数部分にも記述することができる。
【0011】
図2の4行目と5行目の原言語パターンは、同じ単語列から構成されているが、4行目のパターンは“take a bath”という単語の並び全てにマッチしている動詞句に変換される(つまり、“took a bath”や“taking a bath”にもマッチする)が、5行目のパターンは“take”が原形の場合にしかマッチしない(“take”が原形の場合にマッチして文(命令文)に変換される)ことを示している。
【0012】
また、5行目のパターンの目的言語パターンでは“入る”に素性情報が付与されているが、これは5行目の原言語パターンにマッチした時、目的言語では動詞“入る”が命令形になる(つまり、「風呂に入れ」という命令文が生成される)ことを示している。
【0013】
この方式では、原言語で記述されたテキストを、原言語の翻訳パターンに照合して順次変数に置換していく。そして、文全体をカバーする一つのSに置換された時、解析に成功したという。解析が成功すれば、適用した原言語の翻訳パターンに対応する目的言語の翻訳パターンを用いて目的言語のテキスト、即ち、訳文を生成する。
【0014】
この方式では、翻訳したい表現対をパターン形式で記述できるので、以前から行われてきた単語の辞書登録や文法の追加・変更に比べて、カスタマイズが容易に行えるという特徴がある。
【0015】
【発明が解決しようとする課題】
しかしながら、上述したようなパターンに基づく翻訳においても、ユーザ毎あるいは分野毎の翻訳パターンが必要になる。しかし、このような翻訳パターンを効率的に作成する手段がなかった。
【0016】
【課題を解決するための手段】
本発明は、前述の課題を解決するため次の構成を採用する。
【0017】
〈構成1〉
本発明は、原言語文及びその訳文となる目的言語文を入力するための入力手段と、置換表示用の変数がそれぞれ付加されている原言語の語句及び対応する目的言語の語句格納る対訳リストと、前記対訳リストから前記入力された原言語文及び目的言語文の各語句と一致する語句を判定し、該原言語文及び目的言語文の判定した各語句を対応する変数に置換して成る翻訳パターンを作成するパターン作成部と、該翻訳パターンを格納するための翻訳パターンファイルとを含むことを特徴とする。
【0018】
〈構成
構成に記載の機械翻訳用辞書作成装置において、対訳リストは、翻訳パターン作成処理の対象となる原言語文と目的言語文から抽出する語句から作成されることを特徴とする。
【0019】
〈構成
構成1に記載の機械翻訳用辞書作成装置において、パターン作成部は、原言語文及び目的言語文に形態素解析処理を行い、得られた情報を素性情報として翻訳パターンに付与することを特徴とする。
【0020】
【発明の実施の形態】
以下、本発明の実施の形態を具体例を用いて詳細に説明する。
【0021】
《具体例1》
図1は、本発明の機械翻訳用辞書作成装置の具体例1を示すフローチャートであるが、この説明に先立ち、本発明方法を実現するための機械翻訳用辞書作成装置を説明する。
【0022】
〈構成〉
図3は、機械翻訳用辞書作成装置の構成図である。
図の装置は、入出力装置1、処理装置2、記憶装置3からなる。
【0023】
ここで、入出力装置1は、テキストデータや各種の操作コマンドを入力するキーボード、マウス、ファイル等の入力手段11と、翻訳パターンの表示等を行うCRT、出力ファイル等の出力手段12を備えている。
【0024】
処理装置2は、演算装置やメモリ、制御部等を備えており、翻訳パターン作成処理を実行する機能を有している。即ち、処理装置2は、入力手段11によって入力された原言語と目的言語のそれぞれの文中の任意の文字列に対して、ユーザから変数が指定された場合は、その文字列を変数に置換して、この変数を含む翻訳パターンを作成すると共に、指定された文字列と変数とからなる翻訳パターンを作成し、かつ、変数が指定された文字列中の任意の文字列に対して、更に変数が指定された場合は、同様の処理を行って翻訳パターンを更に作成し、これら処理を繰り返すことにより、翻訳パターンを作成する機能を有している。
【0025】
処理装置2は、入力処理部21、パターン作成部22、出力処理部23からなる。入力処理部21は、入力手段11からの入力を処理する機能部、パターン作成部22は、ユーザからの指示に基づき翻訳パターンを作成する機能部、出力処理部23は、原言語パターンや目的言語パターン等からなるパターン作成画面を出力手段12に出力する機能部である。
【0026】
記憶装置3は、磁気ディスク装置や半導体メモリ等で構成され、作成した翻訳パターンを記憶する翻訳パターンファイル31と、変数に付与するidの値を制御するidカウンタ32と、入力されたテキストや各段階の処理結果を保存するバッファ33を備えている。
【0027】
図4は、翻訳パターンファイル31の内部表現を示したテーブルである。
翻訳パターンファイル31は、原言語パターンを置換した変数を格納する原言語変数格納部311と、原言語のパターンを格納する原言語パターン格納部312と、目的言語パターンを置換した変数を格納する目的言語変数格納部313と、目的言語のパターンを格納する目的言語パターン格納部314の四つのフィールドから構成されている。
【0028】
バッファ33は、翻訳パターンファイル31と同様に四つのフィールドから構成されている。即ち、後述する図6に示すように、原言語変数格納部331と、原言語パターン格納部332と、目的言語変数格納部333と、目的言語パターン格納部334の四つのフィールドから構成されており、これらの値を一時的に格納する。
【0029】
〈動作〉
以下、本具体例の機械翻訳用辞書作成装置の動作を図1のフローチャートに沿って説明する。
先ず、ユーザが原言語と目的言語のテキストを入力する(ステップS1)。テキストは、入力手段11のキーボードから直接入力しても良いし、ファイルを指定するといった方法でもよい。
図5は、入力テキストの例を示す。
【0030】
入力されたテキストは、処理装置2の入力処理部21によって、原言語と目的言語の文対応がついた形で記憶装置3のバッファ33に格納される。尚、文の対応をつける方法としては、入力テキスト中に、文番号等を付与することにより、予め文の対応関係を記述しておく方法や、原言語文ファイルと目的言語文ファイルから自動的に文対応を推定する処理を行う方法等がある。自動的に文の対応付けを行う場合には、処理の後でGUI(Graphical User Interface)を用いて処理結果を編集するようにしてもよい。
【0031】
バッファ33の原言語パターン格納部332には入力テキストの原言語の文、目的言語パターン格納部334には入力テキストの目的言語の文が格納される。また、原言語変数名、目的言語変数名は定義されていないので、原言語変数格納部331と目的言語変数格納部333は空であるが、デフォルトの変数(例えば、“S”)を与えてもよい。
図6に、図5のテキストを入力した時点のバッファの内容を示す。
【0032】
また、入力したテキストに形態素解析処理を行い、得られた品詞情報、活用情報等を素性情報として付与しても良い。
【0033】
次に、パターン作成部22は、バッファ33より1行読み込み、出力処理部23はパターン作成画面を出力手段12に出力する。
【0034】
図7は、出力手段12で表示されたパターン作成画面の説明図である。
図示のように、パターン作成画面は、原言語パターン表示部41、目的言語パターン表示部42、原言語変数名表示部43、目的言語変数名表示部44、変数メニュー45、登録ボタン46で構成されている。
【0035】
ここで、バッファ33から読み込んだ原言語パターンを原言語パターン表示部41に、目的言語パターンを目的言語パターン表示部42に、変数を原言語変数名表示部43および目的言語変数名表示部44に表示する。尚、変数名が格納されていない場合には、原言語変数名表示部43および目的言語変数名表示部44には何も表示しない。
【0036】
パターン作成画面が表示されると、ユーザは、この画面に従って翻訳パターンを作成する(ステップS3)。翻訳パターン作成処理では、先ず、ユーザは、原言語パターンおよび目的言語パターン全体を置換する変数名を変数名表示部43,44に指定する(ステップS31)。パターンを置換する変数の指定処理には、変数メニュー45から変数名を指定する方法(変数の一覧を表示し、その中から変数を選択する)や、変数名を直接編集する方法等がある。変数名表示部43,44に既に値がセットされている場合には、その値を変更したい場合にのみ変数の指定を行う。
【0037】
図8は、ステップS31におけるパターンの変数名の指定処理後のパターン作成画面の説明図である。
図8に示されている例では、原言語パターン、目的言語パターン共に文を示す変数名“S”がセットされているため、何もせずに次の処理に進む。
【0038】
次に、パターン作成部22は、idカウンタ32に1をセットする(ステップS32)。そして、ユーザは原言語パターンおよび目的言語パターン中の置き換え可能な範囲の指定を行う(ステップS33)。パターン中の変数部分の指定処理には、原言語パターン表示部41および目的言語パターン表示部42に示された文にマウスで範囲を指定する方法や、表示された文を直接編集する方法等がある。指定された範囲はかっこで囲む、あるいは文字の色を変える等の方法により、指定されているいることが明確に分かるように表示する。
【0039】
図9は、ステップS33におけるパターン中の変数範囲指定処理後のパターン作成画面の説明図である。
例えば、図9の例では、原言語パターンの“to agree to meet with me on April 24th”と目的言語パターンの“4月24日にお会いいただける”が対応する置き換え可能な部分として選択された状態を示している。
【0040】
次に、(ユーザは)上記ステップS5で指定した置き換え可能な範囲に変数名を付与する(ステップS34)。変数名の指定処理には、メニューから変数名を選択する方法や表示された文を直接編集する方法等がある。変数名を指定すると、パターン作成部22は選択された範囲を変数に置換し、id部分にはidカウンタ32の値をセットする(ステップS35)。
【0041】
図9の例の場合、原言語パターンの“to agree to meet with me on April 24th”と目的言語パターンの“4月24日にお会いいただける”の変数名として動詞句を表すVPが選択され、この選択範囲の文字列が“VP”に置換される。また、idカウンタ32の値“1”がid部に付与される。
【0042】
図10は、ステップS35における変数置換処理後のパターン作成画面の説明図である。
このように、ユーザによって選択された範囲が変数名“VP”とidが付与された状態で置換されている。
【0043】
次に、パターン作成部22は、変数に置き換えられた範囲の文字列をサブパターンとして抽出し、バッファ33に格納する(ステップS36)。サブパターンは同じidを持つ変数の範囲が対訳形式で抽出されたものである。抽出されたサブパターンは、入力テキストが格納されたバッファ33の、現在処理中の行の直後に挿入される。
【0044】
図11は、抽出されたサブパターンがバッファ33に格納された状態を示す説明図である。
サブパターンの原言語変数格納部331および目的言語変数格納部333には、ステップS34で指定された変数名がコピーされる。
【0045】
そして、ユーザから次の範囲指定があった場合(ステップS37)、パターン作成部22は、idカウンタ32の値を一つ増やして(ステップS38)ステップS33に戻り、上述したステップS33〜ステップS36の処理を繰り返す。
【0046】
ステップS37において、ユーザから次の範囲指定がなく、登録指定が行われた場合(ステップS39)、パターン作成部22は、原言語変数名表示部43、原言語パターン表示部41、目的言語変数名表示部44、目的言語パターン表示部42に表示された内容を、翻訳パターンファイル31の原言語変数格納部311、原言語パターン格納部312、目的言語変数格納部313、目的言語パターン格納部314にそれぞれ格納する(ステップS40)。
【0047】
尚、登録の指定は、例えば、登録ボタン46(yesボタン)をマウスでクリックする等の方法で行う。
図12は、図10に示された内容から生成された翻訳パターンを示している。
【0048】
上記ステップS39において非登録が選択された場合は、何もせずに次の処理に進む。ステップS4において、バッファ33に未登録のパターンがある場合は、ステップS2に戻る。図11に示した例では、バッファ33に未登録のパターンが残っているので、ステップS2以降の処理を繰り返し行う。先ず、入力テキストの文より先にサブパターンが処理対象となる。
【0049】
即ち、パターン作成部22は、バッファ33から1行読み込み、パターン作成画面に表示する(ステップS2)。次に対象となるのは、バッファ33の1行目の文から抽出されたサブパターンである。例えば、図11の例では、原言語パターンの“to agree to meet with me on April 24th”と目的言語パターンの“4月24日にお会いいただける”が対象となる。
【0050】
サブパターンから更にサブパターンが抽出されることもある。その場合も、同様に、抽出されたサブパターンは、入力テキストが格納されたバッファ33の処理中の行の直後に挿入され、既に格納されていた未処理の文より先に翻訳パターン作成処理の対象となる。
【0051】
図13は、翻訳パターンファイルの内容である。
図示の内容は、図6の1行目の文とその内容を示している。
【0052】
バッファ33中の全ての文に対して同様の処理を繰り返し、未処理のパターンがなくなったら処理を終了する。
【0053】
〈効果〉
以上のように、具体例1によれば、原言語文と目的言語文の対応する一部分を変数に置き換えて翻訳パターンを作成し、かつ、変数に置き換えた部分に対しても更に変数に置き換えて翻訳パターンを作成するようにしたので、簡単な操作で、2言語の翻訳対から翻訳パターンを作成することが可能となる。特に、入力テキストから抽出されたサブパターンについては、元のパターンで付与された変数をそのまま継承するので、新たに変数名を指定する手間が省け、効率よく翻訳パターンの登録が行える。
【0054】
また、入力テキストの形態素解析処理を行うことにより、品詞情報や活用情報といった素性情報を翻訳パターンに自動的に付与することが可能となり、さらなる効率化が可能となる。
【0055】
《具体例2》
〈構成〉
図14は、具体例2の機械翻訳用辞書作成装置の構成図である。
図の装置は、入出力装置1、処理装置2、記憶装置3からなる。ここで、入出力装置1は具体例1の構成と同様である。
【0056】
また、処理装置2も基本的な構成は具体例1と同様であるが、次のような機能を有している。即ち、後述する対訳リスト34の原言語パターンと目的言語パターンとが、入力手段11より入力された原言語と目的言語のそれぞれの文中の任意の文字列に対して一致した場合はその文字列を出力手段12に出力し、この文字列に対してユーザから変数が指定された場合はその文字列を変数に置換して、この変数を含む翻訳パターンを作成する機能を有している。
【0057】
処理装置2は、入力処理部21、パターン作成部22a、出力処理部23からなる。入力処理部21および出力処理部23は具体例1の構成と同様である。パターン作成部22aは、対訳リスト34を用いて翻訳パターンを作成する機能部である。
【0058】
記憶装置3は、具体例1と同様に、翻訳パターンファイル31、idカウンタ32、バッファ33を備えると共に、対訳リスト34を備えている。
【0059】
図15は、対訳リスト34の一例を示す説明図である。
対訳リスト34は、専門用語等の語句を対訳形式で格納したもので、翻訳パターンファイル31と同様に原言語パターンを置換した変数を格納する原言語変数格納部341と、原言語のパターンを格納する原言語パターン格納部342と、目的言語のパターンを置換した変数を格納する目的言語変数格納部343と、目的言語のパターンを格納する目的言語パターン格納部344の四つのフィールドから構成されている。
【0060】
対訳リスト34は、人手で作成してもよいし、特開平11−45244号公報に記載されているような方法により対訳テキストから自動的に作成してもよい。
【0061】
〈動作〉
図16は、具体例2の全体の動作を示すフローチャートである。
先ず、ユーザが原言語と目的言語のテキストを入力する(ステップS11)。テキストは、入力手段11のキーボードから直接入力してもよいし、ファイルを指定する方法でもよい。
【0062】
入力されたテキストは、原言語と目的言語の文対応がついた形でバッファ33に格納される。
【0063】
図17は、バッファ33の内容を示す説明図である。
原言語パターン格納部332には入力テキストの原言語の文、目的言語パターン格納部334には入力テキストの目的言語の文が格納される。また、原言語変数名、目的言語変数名は定義されていないので、原言語変数格納部331と目的言語変数格納部333は空であるが、具体例1と同様、デフォルトの変数(例えば、“S”)を与えてもよい。
【0064】
次に、翻訳パターンを作成する(ステップS12)。
図18は、翻訳パターン作成処理のフローチャートである。
先ず、パターン作成部22aは、idカウンタ32の値を“1”として(ステップS121)、対訳リスト34から1行読み込む(ステップS122)。次に、対訳リスト34の原言語パターンとバッファ33の1行目の原言語パターン(以下、単に原言語パターン3321とする)を照合する(ステップS123)
【0065】
対訳リスト34の原言語パターンが、原言語パターン3321の少なくとも一部にマッチするかを判定し(ステップS124)、そうであれば、目的言語パターンが、バッファ33の目的言語パターン(以下、単に目的言語パターン3341とする)の少なくとも一部にマッチするかを判定する(ステップS125)。
【0066】
図15と図17の1行目の例では、対訳リスト34の原言語パターン“ABC company”と原言語パターン3321との照合を行い、マッチするのでステップS125に進む。
【0067】
ステップS125において、対訳リスト34の目的言語パターンが目的言語パターン3341の一部にマッチすれば、次のステップS126に進む。
【0068】
図15と図17の1行目の例では、対訳リスト34の“ABC社”と目的言語パターン3341との照合を行い、マッチするのでステップS126に進む。
【0069】
ステップS126では、原言語パターン3321中の対訳リスト34の、原言語パターンと一致する部分を対訳リスト34の原言語変数と置換し、目的言語パターン3341中の対訳リスト34の、目的言語パターンと一致する部分を対訳リスト34の目的言語変数と置換する。
【0070】
図15と図17の1行目の例では、原言語パターン3321中の“ABC company”を対訳リスト34の原言語の変数名“NP”と置き換え、目的言語パターン3341中の、“ABC社”を対訳リスト34の目的言語の変数名“NP”と置き換える。
【0071】
図19は、パターンの変数化が終わった後の処理結果の説明図である。
図示の状態は、“ABC company”、“ABC社”の置換処理が終わった後の原言語パターン3321および目的言語パターン3341の状態を示している。
【0072】
パターンの変数化が終了すると、パターン作成部22aは、idカウンタ32の値を1カウントアップし(ステップS127)、対訳リスト34に未処理の行が残っているかを判定する(ステップS128)。また、上記ステップS124において原言語がマッチしない場合やステップS125において目的言語がマッチしない場合は、そのままステップS128に移行する。
【0073】
ステップS128において、対訳リスト34に未処理の行が残っていた場合は、ステップS122に戻り、上述したステップS122以降の処理を繰り返す。
【0074】
図15と図17の1行目の例では、次に、対訳リスト34の原言語パターン“MT system”と目的言語パターン“機械翻訳システム”について照合処理を行い、一致する部分を原言語変数“NP”および目的言語変数“NP”に置換する。
【0075】
この処理を対訳リスト34に含まれる全ての訳語対について行う。
図20は、翻訳パターン作成処理が終了した場合の原言語パターン3321および目的言語パターン3341の状態を示す説明図である。
【0076】
翻訳パターン作成処理が終了すると、その処理結果をパターン作成画面に表示する(ステップS13)。ユーザは、このパターン作成画面を見て、作成された翻訳パターンを翻訳パターンファイルとして登録するか否かの指定を行う(ステップS15)。
【0077】
尚、作成された翻訳パターンが不適切な場合は、図示しないキャンセルボタン等をクリックすることにより、一部の、あるいは全ての変数部分を取り消すことができる。また、原言語パターン表示部41、目的言語パターン表示部42の内容を直接編集することもできる。
【0078】
ステップS14において、「登録」が選択された場合、パターン作成部22aは、原言語変数名表示部43、原言語パターン表示部41、目的言語変数名表示部44、目的言語パターン表示部42に表示された内容を、翻訳パターンファイル31の原言語変数格納部311、原言語パターン格納部312、目的言語変数格納部313、目的言語パターン格納部314にそれぞれ格納する。
【0079】
一方、ステップS14において、「非登録」が選択された場合は何もせず、次の処理に進む(ステップS16)。バッファ33に未処理のパターンがある場合は、ステップS12に戻り、上述した処理を行う。
【0080】
尚、上記ステップS123の対訳リスト34と入力テキストの照合処理の前に、原言語パターン3321と目的言語パターン3341を形態素解析して各単語の標準形を求め、標準形と対訳リスト34との照合を行うようにしてもよい。
【0081】
また、入力したテキストに形態素解析処理を行い、得られた品詞情報、活用情報等を素性情報として付与しても良い。
【0082】
〈効果〉
以上のように具体例2によれば、予め用意された対訳リスト34と入力テキストを照合し、対訳リスト34のパターンが入力テキストの任意の文字列と一致した場合はこれを出力し、変数が指定された場合は、この変数を含む翻訳パターンを作成するようにしたので、ユーザは、メニューによる変数指定と登録するかどうかの判定をするだけで、2言語間の翻訳対から翻訳パターンを作成することが可能となる。
【0083】
また、対訳形式の入力テキストから対訳リストを自動的に作成する機能を追加するようにすれば、入力テキストに含まれる専門用語等の翻訳対の抽出と効率的な翻訳パターンの作成が同時に実現される。
【0084】
尚、上記具体例1、2では、原言語パターンを英語、目的言語パターンを日本語としているが、任意の言語に適用可能である。
【図面の簡単な説明】
【図1】本発明の機械翻訳用辞書作成装置の具体例1の動作を示すフローチャートである。
【図2】一般的な翻訳パターンの例を示す説明図である。
【図3】具体例1の機械翻訳用辞書作成装置の構成図である。
【図4】翻訳パターンファイルの内容を示す説明図である。
【図5】入力テキストの説明図である。
【図6】図5のテキストを入力した時点のバッファの内容を示す説明図である。
【図7】パターン作成画面の説明図である。
【図8】パターンの変数名の指定処理後のパターン作成画面の説明図である。
【図9】パターン中の変数範囲指定処理後のパターン作成画面の説明図である。
【図10】変数置換処理後のパターン作成画面の説明図である。
【図11】抽出されたサブパターンがバッファに格納された状態を示す説明図である。
【図12】図10に示された内容から生成された翻訳パターンを示す説明図である。
【図13】翻訳パターンファイルの内容を示す説明図である。
【図14】具体例2の機械翻訳用辞書作成装置の構成図である。
【図15】対訳リストの一例を示す説明図である。
【図16】具体例2の全体の動作を示すフローチャートである。
【図17】バッファの内容を示す説明図である。
【図18】翻訳パターン作成処理のフローチャートである。
【図19】パターンの変数化が終わった後の処理結果の説明図である。
【図20】翻訳パターン作成処理が終了した場合の原言語パターンおよび目的言語パターンの状態を示す説明図である。
【符号の説明】
1 入出力装置
2 処理装置
3 記憶装置

Claims (3)

  1. 原言語文及びその訳文となる目的言語文を入力するための入力手段と、置換表示用の変数がそれぞれ付加されている原言語の語句及び対応する目的言語の語句格納る対訳リストと、前記対訳リストから前記入力された原言語文及び目的言語文の各語句と一致する語句を判定し、該原言語文及び目的言語文の判定した各語句を対応する変数に置換して成る翻訳パターンを作成するパターン作成部と、該翻訳パターンを格納するための翻訳パターンファイルとを含むことを特徴とする機械翻訳用辞書作成装置。
  2. 請求項1に記載の機械翻訳用辞書作成装置において、
    対訳リストは、翻訳パターン作成処理の対象となる原言語文と目的言語文から抽出する語句から作成されることを特徴とする機械翻訳用辞書作成装置。
  3. 請求項1に記載の機械翻訳用辞書作成装置において、
    前記パターン作成部は、前記原言語文及び目的言語文に形態素解析処理を行い、得られた情報を素性情報として翻訳パターンに付与することを特徴とする機械翻訳用辞書作成装置。
JP25721099A 1999-09-10 1999-09-10 機械翻訳用辞書作成装置 Expired - Lifetime JP3569753B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25721099A JP3569753B2 (ja) 1999-09-10 1999-09-10 機械翻訳用辞書作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25721099A JP3569753B2 (ja) 1999-09-10 1999-09-10 機械翻訳用辞書作成装置

Publications (2)

Publication Number Publication Date
JP2001084249A JP2001084249A (ja) 2001-03-30
JP3569753B2 true JP3569753B2 (ja) 2004-09-29

Family

ID=17303200

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25721099A Expired - Lifetime JP3569753B2 (ja) 1999-09-10 1999-09-10 機械翻訳用辞書作成装置

Country Status (1)

Country Link
JP (1) JP3569753B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3987533B2 (ja) 2003-03-14 2007-10-10 富士通株式会社 翻訳支援装置

Also Published As

Publication number Publication date
JP2001084249A (ja) 2001-03-30

Similar Documents

Publication Publication Date Title
JPS6140673A (ja) 外国語作文用翻訳方法、および翻訳機
WO2000029964A1 (en) Software language translation system and method
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
JP4304268B2 (ja) 複数言語対訳テキスト入力による第3言語テキスト生成アルゴリズム及び装置、プログラム
JPS61255469A (ja) 言語生成装置
JP3569753B2 (ja) 機械翻訳用辞書作成装置
JPWO2020044290A5 (ja)
JP2006201873A (ja) 未登録語自動抽出装置及びプログラム、並びに未登録語自動登録装置及びプログラム
JP2002091963A (ja) 機械翻訳システム
JP6766384B2 (ja) 情報処理装置及びプログラム
JP3324830B2 (ja) 機械翻訳装置
JP3898615B2 (ja) 短縮語作成支援装置および短縮語作成支援プログラム
JP7083473B2 (ja) 入力支援装置
JP2014071726A (ja) 帳票出力装置、帳票出力方法、および、プログラム
JPH04673A (ja) 連語登録方法および装置
JP2005157412A (ja) 機械翻訳装置及び、プログラム、記録媒体
JP3051747B2 (ja) 機械翻訳方法及び機械翻訳システム
JPH0561902A (ja) 機械翻訳システム
JPH08297675A (ja) 翻訳支援装置
JP2000003365A (ja) 機械翻訳システム、返信メール作成支援システム及び文書作成支援システム並びに機械翻訳方法、返信メール作成方法及び文書作成方法
JP3692711B2 (ja) 機械翻訳装置
JP2871300B2 (ja) 機械翻訳装置
JPH10149364A (ja) 訳語選択装置と記憶媒体
JP2004213083A (ja) 自然言語処理用辞書登録装置、自然言語処理用辞書登録方法及びプログラム
JP2004264960A (ja) 用例ベースの文変換装置、およびコンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20031216

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040302

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040428

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040525

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040528

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080702

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090702

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100702

Year of fee payment: 6