JP2004220416A - 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置 - Google Patents

機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置 Download PDF

Info

Publication number
JP2004220416A
JP2004220416A JP2003008338A JP2003008338A JP2004220416A JP 2004220416 A JP2004220416 A JP 2004220416A JP 2003008338 A JP2003008338 A JP 2003008338A JP 2003008338 A JP2003008338 A JP 2003008338A JP 2004220416 A JP2004220416 A JP 2004220416A
Authority
JP
Japan
Prior art keywords
language
unit
translation
expression
proper noun
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003008338A
Other languages
English (en)
Other versions
JP3896084B2 (ja
Inventor
Takashi Shibuya
貴志 澁谷
Etsuo Ito
悦雄 伊藤
Naoko Takigawa
直子 瀧川
Akira Sasaki
晶 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003008338A priority Critical patent/JP3896084B2/ja
Publication of JP2004220416A publication Critical patent/JP2004220416A/ja
Application granted granted Critical
Publication of JP3896084B2 publication Critical patent/JP3896084B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達させる。
【解決手段】入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置において、翻訳部6の訳文生成部9は、特定見出し記憶部1を参照しつつ、第一言語内に数量程度表現を含むか否かを判定し、また、翻訳辞書部2を参照しつつ、第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する。ここで、第一言語の1つの文内で数量程度表現及び固有名詞がそれぞれ含まれるとき、訳文生成部9は、補足語辞書部3を参照しつつ、当該固有名詞に補足情報を付加して翻訳結果を作成する。このように、第一言語の国内特有の固有名詞には補足情報を付加して、第二言語を母国語とする人に翻訳文の意味を伝達させる。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、第一言語を第二言語に翻訳するための機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置に関する。
【0002】
【従来の技術】
一般に、第一言語を第二言語に翻訳する分野では、通常の人間による翻訳に限らず、機械によって翻訳を実行する機械翻訳装置が広く知られている。
【0003】
さて、係る機械翻訳装置は、第一言語に対応する第二言語とその品詞や両言語の文法等が予め登録された電子辞書と、この電子辞書を参照しながら第一言語を第二言語に変換するコンピュータとを備えて構成されている。
【0004】
なお、以下の本明細書中では、第一言語を日本語とし、第二言語を英語とした例を用いて説明する。但し、第一言語及び第二言語は、この組合せに限らず、互いに異なる言語の組合せであれば、任意の言語が適用可能となっている。
【0005】
さて、機械翻訳装置は、仮に「東京都民ドーム」という名称の「広い野球場」が第一言語を母国語とする国内に固有に存在する場合、例えば「この公園の面積は、東京都民ドームの面積の3倍です。」といった第一言語が入力されると、この第一言語をコンピュータにより、「The area of this park is 3 times the area of TOKYO TOMIN DOME.」といった第二言語に翻訳して出力する。
【0006】
ここで、第一言語は、「東京都民ドーム」という国内固有な表現を含むにもかかわらず、正確に第二言語に翻訳されている。
このような機械翻訳装置は、第一言語内で広さを表す表現に限らず、単位や、距離、高さ等を表す第一言語の国内固有な表現でも同様に第二言語に翻訳可能となっている。
【0007】
【発明が解決しようとする課題】
しかしながら以上のような機械翻訳装置では、国内固有の表現を含む第一言語を第二言語に翻訳する場合、翻訳文自体が正確でも、翻訳文の意味が第二言語を母国語とする人々には伝わりにくい状況にある。
【0008】
理由は、例えば翻訳文である第二言語に「Tokyo Tomin Dome」を含む場合、第二言語を母国語とする人々のほとんどの者が「Tokyo Tomin Dome」を知らないので、描写された「Tokyo Tomin Dome」及びその3倍の「this park」の広さを想像できないことによる。
【0009】
また、このように国内固有の表現を他の言語に翻訳した際に意味が伝わりにくい状況は、国内固有の施設等と比較する表現に限らず、国内固有の単位(寸、尺、升などの尺貫法の単位)で定義する表現でも同様である。
【0010】
本発明は上記の問題を解決するためになされたものであり、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達し得る機械翻訳装置を提供することを目的とする。
【0011】
【課題を解決するための手段】
第1の発明は、入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置において、前記第一言語内に数量程度表現を含むか否かを判定する数量表現判定手段と、前記第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する固有名詞判定手段と、前記第一言語の1つの文内で前記数量表現判定手段が数量程度表現を含むと判定し且つ前記固有名詞判定手段が固有名詞を含むと判定したとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する補足情報付加手段と、を備えた機械翻訳装置である。
【0012】
このように、第一言語の国内特有の固有名詞には補足情報を付加するようにしたので、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達することができる。
【0013】
第2の発明は、Webブラウザから送信された第一言語を第二言語に翻訳し、得られた翻訳結果を前記Webブラウザに返信するためのホームページを提供するサーバ装置が実行する機械翻訳方法であって、前記Webブラウザから送信された第一言語内に数量程度表現を含むか否かを判定する工程と、前記Webブラウザから送信された第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する工程と、前記第一言語の1つの文内で前記数量程度表現及び前記固有名詞がそれぞれ含まれると判定されたとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する工程と、を含んでいる機械翻訳方法である。
【0014】
このように、第1の発明の機械翻訳技術をネットワークを介して提供するようにしても、第1の発明と同様の作用を奏することができる。
【0015】
また、第1及び第2の発明は、それぞれ「装置」又は「方法」として表現した場合を示すが、これに限らず、適宜、「システム」、「記憶媒体」、「プログラム」又は「プログラムを格納した装置」等として表現しても良いことは言うまでもない。
【0016】
【発明の実施の形態】
次に、本発明の各実施形態について図面を参照して説明する。なお、以下の各実施形態は、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含むとき、第二言語を母国語とする人々にとって理解可能な補足情報を付加する機械翻訳装置について述べている。また、国内固有の表現としては、比喩を用いて数量的に比較する表現を例に挙げて説明するが、この例に限らず、補足情報とのリンクが可能な表現であれば、表現の内容には限定されないことは言うまでもない。
【0017】
(第1の実施形態)
図1は本発明の第1の実施形態に係る機械翻訳装置の基本構成を示す模式図である。この機械翻訳装置は、特定見出し記憶部1、翻訳辞書部2、補足語辞書部3、入力部4、制御部5、翻訳部6、形態素解析部7、構文解析部8、訳文生成部9及び表示部10を備えている。なお、各部5〜9はハードウェア構成及び/又はソフトウェア構成により実現可能であり、例えばソフトウェア構成により実現される場合、各部5〜9の機能が記述されたプログラムが予め記憶媒体又はネットワークから機械翻訳装置のコンピュータにインストールされる。
【0018】
ここで、特定見出し記憶部1は、翻訳部6から読出可能なメモリであり、図2に一部を示すように、第一言語の数量的な程度表現(数量程度表現)を示す特定見出し語が記憶されている。
【0019】
特定見出し語としては、例えば第一言語の国内特有の概念である「数量単位」や、両言語間で共通の概念である「面積」、「広さ」、「長さ」、「距離」、「時間」及び「時刻」などが適宜、使用可能となっており、これに限らず、「倍」、「…分の1」及び「半分」などを使用してもよい。
【0020】
翻訳辞書部2は、翻訳部6から読出可能に第一言語の文法や語彙が記憶されたメモリであり、特に、図3に一部を示すように、第一言語にて数量的な比較物を示す見出し語と、見出し語の品詞と、見出し語の訳語(第二言語)とからなるデータの組が記憶されている。
【0021】
補足語辞書部3は、訳文生成部9から読出可能なメモリであり、図4に一部を示すように、見出し語の訳語(第二言語)と、見出し語の補足語(第二言語)との組が記憶されたメモリである。
【0022】
入力部4は、通常の入力デバイスであり、例えばユーザの操作により、電子的なデータとして入力された第一言語や実行コマンド等を制御部5に送出する機能をもっている。
【0023】
制御部5は、入力部4、翻訳部6及び表示部10の三者の間に配置され、入力部4から受けた第一言語を翻訳部6に入力する機能と、入力部4から受けたコマンドによって翻訳部6を制御する機能と、翻訳部6から電子的なデータとして受けた第二言語を表示部10に送出する機能とをもっている。
【0024】
翻訳部6は、翻訳時に、特定見出し記憶部1、翻訳辞書部2及び補足語辞書3を参照する機能を有し、制御部5から入力された第一言語を第二言語に翻訳し、翻訳結果を制御部5に送出するものであり、翻訳のための形態素解析部7、構文解析部8及び訳文生成部9を備えている。
【0025】
形態素解析部7は、翻訳辞書部2を参照しつつ、制御部5から入力された第一言語の形態素を解析し、解析結果を構文解析部8に送出する機能をもっている。
【0026】
構文解析部8は、翻訳辞書部2を参照しつつ、形態素解析部7から受けた解析結果の構文を解析し、図5に示す如き、解析結果としての構文木を訳文生成部9に送出する機能をもっている。
【0027】
ここで、構文木は、各単語からなる文の構造を示す通常の構文木の構造に加え、訳文生成部9による設定動作により、単語毎に単語番号iを設定可能なものである。
【0028】
訳文生成部9は、翻訳辞書部2及び補足語辞書部3を参照しつつ、構文解析部8から受けた解析結果を用いて第一言語に対応する第二言語(翻訳文)を生成し、この第二言語を制御部5に送出するものである。
【0029】
ここで、訳文生成部9は、第二言語を生成する際に、図6に示すように、構文木の単語毎に単語番号iを設定する機能と、特定見出し語辞書部1を参照しつつ、各単語番号iの単語が数量程度表現を含むか否かを判定する機能と、1つの文内で数量程度表現を含む単語があるときには特定見出しフラグを立てる機能と、翻訳辞書部2を参照しつつ、各単語番号iの単語が第一言語の国内特有の固有名詞を含むか否かを判定する機能と、当該固有名詞を含み且つ同一の文内で前述した数量程度表現を含むとき、補足語辞書部3を参照しつつ、当該固有名詞を含む単語に補足情報を付加する機能をもっている。
【0030】
表示部10は、制御部5から送出された電子的なデータとしての第二言語を表示する機能とをもっている。なお、表示部10による表示出力に限らず、ユーザ操作により、プリンタによる印字出力を適宜行なうようにしてもよい。
【0031】
次に、以上のように構成された機械翻訳装置による機械翻訳方法を図7及び図8のフローチャートを用いて説明する。
いま、第一言語の入力文「この公園の面積は、東京都民ドームの面積の3倍です。」がユーザによる入力部4の操作により、制御部5を介して翻訳部6に入力されたとする(ST1)。
【0032】
翻訳部6においては、形態素解析部7が、入力文の形態素を翻訳辞書部2を用いて解析することにより、入力文を単語単位に分割し(ST2)、分割結果を構文解析部8に送出する。
【0033】
構文解析部8は、この分割結果に基づいて、入力文の構文を解析し、図5に示すように、解析結果としての構文木を生成(ST3)して訳文生成部9に送出する。
【0034】
訳文生成部9は、図6に示すように、この構文木の各単語毎に単語番号iを割付けた後、構文木における単語番号i=0の単語を処理対象とし(ST4)、特定見出し語を検索するループ処理(ST5〜ST10)に移行する。
【0035】
すなわち、訳文生成部9は、この単語番号iの単語を検索キーとして、特定見出し記憶部1を検索し(ST5)、特定見出し記憶部1内に一致する語があるか否かを判定する(ST6)。
【0036】
ST1の入力文の例では、単語番号i=2の単語「面積」の際に、一致する語があると判定され、それ以前の単語番号i=0,1の単語「この」,「公園」の際には、一致する語が無いと判定される。
【0037】
ステップST6の判定の結果、一致する語があるときには特定見出しフラグを立てて(ST7)、ループ処理を抜けてステップST10に進むが、一致する語が無いときには今回のループ処理の対象が最後の単語か否かを判定する(ST8)。
【0038】
ステップST8の判定の結果、最後の単語でないときには、単語番号を“+1”だけ更新(ST9)してステップST5に戻り、最後の単語のときには、ループ処理を終えてステップST10に進む。
【0039】
続いて、訳文生成部9は、構文木における単語番号i=0の単語を処理対象とし(ST10)、各単語の訳語を決定するループ処理(ST11〜ST17)に移行する。
【0040】
訳文生成部9は、単語番号iの単語を構文木から取得し(ST11)、この単語を検索キーとして翻訳辞書部2を検索し(ST12)、対応する第二言語の訳語及び品詞を取得すると共に、この訳語をST11の単語に対して置き換える(ST13)。
【0041】
また、取得した品詞に基づいてこの単語が固有名詞であるか否かを判定し、且つ前述したループ処理の結果からこの単語を含む入力文に特定見出しフラグが立てられているか否かを判定する(ST14)。
【0042】
この入力文の例では、単語番号i=5の単語「東京都民ドーム」の際に、固有名詞であり且つ特定見出しフラグが立てられていると判定され、それ以外の各単語番号i=0〜4,6,7の単語の際には、固有名詞でないが特定見出しフラグが立てられていると判定される。
【0043】
また、訳文生成部9は、ステップST14の判定の結果、固有名詞であり且つ特定見出しフラグが立てられているときには、訳語(又は元の単語)を検索キーにして補足語辞書部3を検索し、対応する補足語を取得して訳語に付加する(ST15)。
【0044】
付加の際には、例えば予め設定された形式に応じ、「訳語を補足語に置き換える」形式か、「訳語の直後にかっこ書きの補足語を追記する」形式を用いる。
【0045】
例えば、訳文生成部9は、訳語「TOKYO TOMIN DOME」を補足語「Baseball Field」に置き換えるか、又は訳語「TOKYO TOMIN DOME」の後にかっこ書きの補足語「(Baseball Field)」を追記する。
【0046】
ステップST15の後、前述同様に、最後の単語か否かを判定し(ST16)、最後の単語でないときには、単語番号を“+1”だけ更新(ST17)してステップST11に戻るが、最後の単語のときには単語毎の訳文生成処理を終了し、適宜、定冠詞や前置詞等を付加して翻訳文全体を生成し、得られた翻訳文全体が制御部5を介して表示部10に転送される。
【0047】
表示部10は、この翻訳文全体を表示する。ここでの例の場合、翻訳文全体は「The area of this park is 3 times the area of Baseball Field.」(置換形式)、又は「The area of this park is 3 times the area of TOKYO TOMIN DOME (Baseball Field).」(追記形式)と表現されている。
【0048】
このように、翻訳文中に何らかの形式で補足語を含めるようにしたので、第一言語を母国語とする国内固有の表現を第二言語に翻訳する際に、この国内固有の表現の意味を第二言語を母国語とする人々に正確に伝達することができる。
【0049】
上述したように本実施形態によれば、第一言語の国内特有の固有名詞には補足情報を付加するようにしたので、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達することができる。
【0050】
(第2の実施形態)
図9は本発明の第2の実施形態に係る機械翻訳装置の構成を示す模式図であり、前述した図面と同一部分には同一符号を付してその詳しい説明を省略し、ここでは異なる部分について主に述べる。
【0051】
すなわち、本実施形態は、第1の実施形態の変形例であり、機械翻訳装置をネットワークを介して提供する方式であって、具体的には前述した機械翻訳装置の機能を有するサーバ装置20と、このサーバ装置20にアクセス可能なクライアント装置30とがインターネット等のネットワーク40を介して接続された構成となっている。
【0052】
ここで、サーバ装置20は、ネットワーク40を介して接続されることから、前述した機械翻訳装置から入力部4及び表示部10が省略されたものであり、具体的には、前述した特定見出し記憶部1、翻訳辞書部2、補足語辞書部3、制御部5、翻訳部6、形態素解析部7、構文解析部8及び訳文生成部9を備えたものである。
【0053】
これに伴い、制御部5は、前述した機能に加え、ネットワーク40上で機械翻訳サービスを提供するためのホームページの提供機能と、ホームページにアクセスしてきたクライアント装置30と通信する通信機能とが付加されている。
【0054】
なお、制御部5は、サービス提供時にクライアント装置30を認証する機能や、課金する機能、通信内容の暗号化/復号する機能といった、通常の電子商取引等で必要とされる各機能を備えていることは言うまでもない。
【0055】
一方、クライアント装置30は、前述した入力部4及び表示部10に加え、ネットワーク40を介してサーバ装置20から機械翻訳サービスを受けるための通常のWebブラウザ31を備えたものである。
【0056】
次に、以上のように構成された機械翻訳装置による機械翻訳方法を図10のシーケンス図を用いて述べる。
クライアント装置30では、Webブラウザ31が起動されているとする。 Webブラウザ31は、ユーザの操作により、機械翻訳サービスの提供サイト(以下、機械翻訳サイトという)のURL(Uniform Resource Locators)が入力されると、このURLに基づいてホームページ閲覧要求を機械翻訳サイトのサーバ装置20に送信する(ST21)。
【0057】
サーバ装置20は、インターネットを介してこのホームページ閲覧要求を受けると、所望の条件入力要求を含むホームページ画面情報をWebブラウザ31に返信する(ST22)。ここで、条件入力要求は、サービス業者側が任意の内容で設定可能であり、例えば、翻訳内容の分野(又は翻訳辞書)あるいは翻訳精度(又は翻訳速度)等の翻訳条件や、クレジットカード又は銀行振込等の料金支払い条件などといった各種の条件の入力を促すためのものである。但し、条件入力要求は、条件が確定している場合などには省略してもよい。
【0058】
Webブラウザ31は、ホームページ画面情報を受信し、条件入力要求を含むホームページ画面を表示部10に表示させる。
しかる後、Webブラウザ31は、ユーザの操作により、各種の条件情報が入力されると、この条件情報をサーバ装置20に送信する(ST23)。
【0059】
サーバ装置20は、条件情報を受信すると、条件に対する回答と第一言語入力要求とをWebブラウザ31に返信する(ST24)。
【0060】
Webブラウザ31は、これら回答及び第一言語入力要求を受信し、これら受信内容を表示部10に表示させる。
また、Webブラウザ31は、ユーザの操作により、第一言語及び翻訳要求が入力されると、これら第一言語と翻訳要求とをサーバ装置20に送信する(ST25)。
【0061】
サーバ装置20は、第一言語と翻訳要求とを受信すると、翻訳部6により、第一言語を第二言語に翻訳する(図7,図8のST1〜ST17)。このとき、翻訳部6は、前述同様に、第一言語の国内固有の表現があれば、対応する第二言語に補足語を付加して翻訳を行なう。翻訳の完了後、サーバ装置20は、翻訳結果の第二言語をWebブラウザ31に返信する(ST26)。
【0062】
Webブラウザ31は、翻訳結果を受信し、その第二言語を表示部10に表示させる。
ここで、ユーザにより翻訳結果が確認されて修正が要求された翻訳箇所に関しては、適宜、第一言語の表現が変更入力された後、再度、前述した通りにステップST25〜ST26と翻訳結果の表示処理が繰り返される。
【0063】
一方、ステップST26の後、翻訳結果を表示した際に、ユーザにより翻訳結果が確認されて修正箇所が無いとき、Webブラウザ31は、ユーザの操作により、終了通知をサーバ装置20に送信する(ST27)。
【0064】
サーバ装置20は、終了通知を受信すると、翻訳結果のワード数などに応じた料金明細を作成してWebブラウザ31に送信する(ST28)。
【0065】
Webブラウザ31は、料金明細を受信して表示部10に表示させる。
また、Webブラウザ31は、ユーザの操作により、確認通知をサーバ装置20に送信する(ST29)。
【0066】
サーバ装置20は、確認通知を受信すると、翻訳処理の終了を示す終了画面情報をWebブラウザ31に返信する(ST30)。
【0067】
Webブラウザ31は、終了画面情報を受信し、終了画面を表示部10に表示させる。これにより、一連の機械翻訳サービスの提供が完了する。
【0068】
上述したように本実施形態によれば、第1の実施形態の機械翻訳処理をネットワークを介してサービス提供する形態であっても、第1の実施形態を同様に実施でき、同様の効果を得ることができる。
【0069】
なお、上記各実施形態に記載した手法は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクなど)、光ディスク(CD−ROM、DVDなど)、光磁気ディスク(MO)、半導体メモリなどの記憶媒体に格納して頒布することもできる。
【0070】
また、この記憶媒体としては、プログラムを記憶でき、かつコンピュータが読み取り可能な記憶媒体であれば、その記憶形式は何れの形態であっても良い。
【0071】
また、記憶媒体からコンピュータにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワークソフト等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行しても良い。
【0072】
さらに、本発明における記憶媒体は、コンピュータと独立した媒体に限らず、LANやインターネット等により伝送されたプログラムをダウンロードして記憶または一時記憶した記憶媒体も含まれる。
【0073】
また、記憶媒体は1つに限らず、複数の媒体から本実施形態における処理が実行される場合も本発明における記憶媒体に含まれ、媒体構成は何れの構成であっても良い。
【0074】
尚、本発明におけるコンピュータは、記憶媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するものであって、パソコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であっても良い。
【0075】
また、本発明におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本発明の機能を実現することが可能な機器、装置を総称している。
【0076】
なお、本願発明は、上記各実施形態に限定されるものでなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。また、各実施形態は可能な限り適宜組み合わせて実施してもよく、その場合、組み合わされた効果が得られる。さらに、上記各実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。例えば実施形態に示される全構成要件から幾つかの構成要件が省略されることで発明が抽出された場合には、その抽出された発明を実施する場合には省略部分が周知慣用技術で適宜補われるものである。
【0077】
その他、本発明はその要旨を逸脱しない範囲で種々変形して実施できる。
【0078】
【発明の効果】
以上説明したように本発明によれば、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達できる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態に係る機械翻訳装置の基本構成を示す模式図
【図2】同実施形態における特定見出し記憶部の構成を示す模式図
【図3】同実施形態における翻訳辞書部の構成を示す模式図
【図4】同実施形態における補足語辞書部の構成を示す模式図
【図5】同実施形態における構文木を説明するための模式図
【図6】同実施形態における単語番号及び特定見出しフラグを示す模式図
【図7】同実施形態における機械翻訳方法を説明するためのフローチャート
【図8】同実施形態における機械翻訳方法を説明するためのフローチャート
【図9】本発明の第2の実施形態に係る機械翻訳装置の基本構成を示す模式図
【図10】同実施形態における機械翻訳方法を説明するためのシーケンス図
【符号の説明】
1…特定見出し記憶部
2…翻訳辞書部
3…補足語辞書部
4…入力部
5…制御部
6…翻訳部
7…形態素解析部
8…構文解析部
9…訳文生成部
10…表示部
20…サーバ装置
30…クライアント装置
31…Webブラウザ
40…ネットワーク

Claims (9)

  1. 入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置において、
    前記第一言語内に数量程度表現を含むか否かを判定する数量表現判定手段と、
    前記第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する固有名詞判定手段と、
    前記第一言語の1つの文内で前記数量表現判定手段が数量程度表現を含むと判定し且つ前記固有名詞判定手段が固有名詞を含むと判定したとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する補足情報付加手段と、
    を備えたことを特徴とする機械翻訳装置。
  2. 請求項1に記載の機械翻訳装置において、
    前記数量程度表現は、当該第一言語の国内特有の数量単位を表す単位見出し語、あるいは両言語間で共通の広さ、高さ、距離又は時間を表す概念見出し語であり、
    前記補足情報は、前記数量程度表現が単位見出し語のときには換算数値情報であり、前記数量程度表現が概念見出し語のときには当該固有名詞の上位概念を表す普通名詞であることを特徴とする機械翻訳装置。
  3. Webブラウザから送信された第一言語を第二言語に翻訳し、得られた翻訳結果を前記Webブラウザに返信するためのホームページを提供するサーバ装置が実行する機械翻訳方法であって、
    前記Webブラウザから送信された第一言語内に数量程度表現を含むか否かを判定する工程と、
    前記Webブラウザから送信された第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する工程と、
    前記第一言語の1つの文内で前記数量程度表現及び前記固有名詞がそれぞれ含まれると判定されたとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する工程と、
    を含んでいることを特徴とする機械翻訳方法。
  4. 請求項3に記載の機械翻訳方法において、
    前記数量程度表現は、当該第一言語の国内特有の数量単位を表す単位見出し語、あるいは両言語間で共通の広さ、高さ、距離又は時間を表す概念見出し語であり、
    前記補足情報は、前記数量程度表現が単位見出し語のときには換算数値情報であり、前記数量程度表現が概念見出し語のときには当該固有名詞の上位概念を表す普通名詞であることを特徴とする機械翻訳方法。
  5. 入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置に用いられる機械翻訳プログラムにおいて、
    前記機械翻訳装置のコンピュータを、
    前記第一言語内に数量程度表現を含むか否かを判定する手段、
    前記第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する手段、
    前記第一言語の1つの文内で前記数量程度表現及び前記固有名詞がそれぞれ含まれると判定されたとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する手段、
    として機能させるための機械翻訳プログラム。
  6. 請求項5に記載の機械翻訳プログラムにおいて、
    前記数量程度表現は、当該第一言語の国内特有の数量単位を表す単位見出し語、あるいは両言語間で共通の広さ、高さ、距離又は時間を表す概念見出し語であり、
    前記補足情報は、前記数量程度表現が単位見出し語のときには換算数値情報であり、前記数量程度表現が概念見出し語のときには当該固有名詞の上位概念を表す普通名詞であることを特徴とする機械翻訳プログラム。
  7. Webブラウザから送信された第一言語を第二言語に翻訳し、得られた翻訳結果を前記Webブラウザに返信するためのホームページを提供するサーバ装置に用いられる機械翻訳プログラムであって、
    前記サーバ装置のコンピュータを、
    前記Webブラウザから送信された第一言語内に数量程度表現を含むか否かを判定する手段、
    前記Webブラウザから送信された第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定する手段、
    前記第一言語の1つの文内で前記数量程度表現及び前記固有名詞がそれぞれ含まれると判定されたとき、当該固有名詞に補足情報を付加して前記翻訳結果を作成する手段、
    として機能させるための機械翻訳プログラム。
  8. 請求項7に記載の機械翻訳プログラムにおいて、
    前記数量程度表現は、当該第一言語の国内特有の数量単位を表す単位見出し語、あるいは両言語間で共通の広さ、高さ、距離又は時間を表す概念見出し語であり、
    前記補足情報は、前記数量程度表現が単位見出し語のときには換算数値情報であり、前記数量程度表現が概念見出し語のときには当該固有名詞の上位概念を表す普通名詞であることを特徴とする機械翻訳プログラム。
  9. 請求項7又は請求項8に記載の機械翻訳プログラムを格納したことを特徴とするサーバ装置。
JP2003008338A 2003-01-16 2003-01-16 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置 Expired - Fee Related JP3896084B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003008338A JP3896084B2 (ja) 2003-01-16 2003-01-16 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003008338A JP3896084B2 (ja) 2003-01-16 2003-01-16 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置

Publications (2)

Publication Number Publication Date
JP2004220416A true JP2004220416A (ja) 2004-08-05
JP3896084B2 JP3896084B2 (ja) 2007-03-22

Family

ID=32898165

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003008338A Expired - Fee Related JP3896084B2 (ja) 2003-01-16 2003-01-16 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置

Country Status (1)

Country Link
JP (1) JP3896084B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013073355A (ja) * 2011-09-27 2013-04-22 Toshiba Corp 対話支援装置、方法及びプログラム
CN103678288A (zh) * 2013-11-30 2014-03-26 武汉传神信息技术有限公司 一种专名自动翻译的方法
JP2015022448A (ja) * 2013-07-17 2015-02-02 Kddi株式会社 言語体系の間で同義語句に対する特定の感情を推定するプログラム、装置及び方法
US11256880B2 (en) 2017-09-21 2022-02-22 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013073355A (ja) * 2011-09-27 2013-04-22 Toshiba Corp 対話支援装置、方法及びプログラム
JP2015022448A (ja) * 2013-07-17 2015-02-02 Kddi株式会社 言語体系の間で同義語句に対する特定の感情を推定するプログラム、装置及び方法
CN103678288A (zh) * 2013-11-30 2014-03-26 武汉传神信息技术有限公司 一种专名自动翻译的方法
US11256880B2 (en) 2017-09-21 2022-02-22 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Also Published As

Publication number Publication date
JP3896084B2 (ja) 2007-03-22

Similar Documents

Publication Publication Date Title
US8831928B2 (en) Customizable machine translation service
US5497319A (en) Machine translation and telecommunications system
EP0519049B1 (en) Machine translation and telecommunications system
RU2003128308A (ru) Сегмент данных о переводе
JP3896084B2 (ja) 機械翻訳装置、方法、プログラム及びプログラムを格納したサーバ装置
JP3467160B2 (ja) 多言語対応通信システム、サーバー装置及びサーバー装置の文書送信方法
KR20000039748A (ko) 다국어 웹 문서 번역 서비스 장치 및 이를 이용한번역 서비스 방법
Musleh et al. Enabling medical translation for low-resource languages
Chang et al. A corpus-based statistics-oriented transfer and generation model for machine translation
JP4350566B2 (ja) 機械翻訳システム
Zhang et al. Building user-oriented personalized machine translator based on user-generated textual content
WO2001055901A1 (fr) Systeme de traduction automatique, serveur et client de ce systeme
WO2002073464A1 (en) System and method for providing efficient and accurate translation of information in a communication network
Singh et al. Intelligent English to Hindi Language Model Using Translation Memory
JPH10222513A (ja) 多言語対応通信システム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
Guo Intelligent English Automatic Translation System Based on Human-Computer Interaction Enhancement Algorithm
WO2001080036A1 (en) System and method for providing interactive translation of information in a communication network
Gupta et al. Improving Low-Resource NMT with Parser Generated Syntactic Phrases
Teubert Language Resources: The Foundations of a Pan-European Information Society.
Bramantoro Arabic Translation Web Services: An Implementation Survey Towards Arabic Language Grid.
JP2004013785A (ja) 翻訳サービスシステム、翻訳サービス方法、翻訳サービスサーバ、翻訳処理装置及びプログラム
JP3267168B2 (ja) 自然言語変換システム
JPH10222516A (ja) 多言語対応通信システム
JPH10134059A (ja) Html文書処理装置及びhtml文書処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061010

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061124

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061215

R151 Written notification of patent or utility model registration

Ref document number: 3896084

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111222

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121222

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131222

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees