JP4812811B2 - 機械翻訳装置及び機械翻訳プログラム - Google Patents
機械翻訳装置及び機械翻訳プログラム Download PDFInfo
- Publication number
- JP4812811B2 JP4812811B2 JP2008178666A JP2008178666A JP4812811B2 JP 4812811 B2 JP4812811 B2 JP 4812811B2 JP 2008178666 A JP2008178666 A JP 2008178666A JP 2008178666 A JP2008178666 A JP 2008178666A JP 4812811 B2 JP4812811 B2 JP 4812811B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- phrase
- dictionary
- unit
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
このような辞書登録を一旦行えば、以降の原文に”tick attachment”が再び現れた場合は、「マダニ咬着」と訳出することができ、正確な翻訳を手間無く行うことができる。
このように、辞書登録を行った表現が翻訳対象文書の主題に関わる語である場合には、その辞書登録を行った表現の関連語が次から次へと出てくる可能性があるので、その都度、その関連語について辞書登録を行う必要が生じてくる。これは、主題に関わる概念は、品詞や表現形態を変えた語を使って、文書の中で繰り返し述べられる傾向があるためである。日本語文では、文中で同じキーワードを繰り返し使用することにあまり問題はないが、英文では、同じ語を繰り返し使用することはレトリック上避けられる傾向がある。
品詞1 = 名詞
訳語1 = チクタクという音;ダニ(動物);ふとんカバー(衣類);…
品詞2 =自動詞
訳語2 =チクタクと鳴る;行動する;…
品詞3 =他動詞
訳語3 =時を刻む(+off)
attachment:
品詞1 =名詞
訳語1 =付着(行為);愛情(感情);差し押さえ(行為);出向(行為);添付ファイル(物体)、…
派生語1=attach、品詞 =自動詞、訳語 =付着する(+to)
派生語2=attachable、品詞 =自動詞、訳語 =付着可能な(+to); 添付可能な(+to); …
派生語2=attached、品詞 =形容詞、訳語 =付属の(+to);添付の(+to); …
語彙部28aには、品詞、対応する訳語などの情報の他に、属性情報(意味分類、目的語となる前置詞など)、動詞の場合は目的語に取りうる属性のリストなどの情報も格納されており、品詞及び訳語の絞込みの際に参照される。この例では訳語の後ろのカッコの中に属性が記入されている。
品詞1 = 名詞
訳語1 =tick(動物);deer tick(動物);dog tick(動物);ixodid(動物)
咬着:
品詞1 =名詞
この例の「咬着」はユーザが辞書登録した語であり、語彙部28aに見出し語が無く、ユーザが指定した品詞情報が利用される場合を想定している。辞書登録された語が「吸着」などの比較的一般的な語である場合には、語彙部28aに見出し語があり、品詞情報、対応する訳語情報などが得られると期待される。
マダニ;名詞 tick, deer tick, dog tick, ixodid
"tick"の訳語各候補と「マダニ」との類似度を順に調べると、「ダニ」という訳語候補との類似度が最大となる。具体的には、「マダニ」の3文字中2文字が共通しているため、類似度は2/3であると計算する。次に、「マダニ」の訳語各候補と”tick”との類似度を順に調べると、「マダニ」の訳語である”tick”と原文言語の表現の”tick”とが完全一致していることから、類似度は最大となり、1と計算する。最終的な対応付けの点数は、上記で求めた類似度を掛け合わせて2/3*1=2/3と計算する。計算の際には、係数などを加味して、それぞれの類似度に重みを付けることもできる。
P-1-1) A(名詞) of B(名詞)
P-1-2) B(名詞) of A(名詞)
P-2-1) Aの現在分詞形 B(名詞)
P-2-2) Aの過去分詞形 B(名詞)
P-3-1) Bの現在分詞形 A(名詞)
P-3-2) Bの過去分詞形 A(名詞)
P-4-1) A-able B(名詞)
P-4-2) B(名詞) A-able
P-5-1) B-able A(名詞)
P-5-2) A(名詞) B-able
P-6-1) A(名詞) B(動詞形)
P-6-2) B(動詞形) A(名詞)
P-7-1) A(動詞形) B(名詞)
P-7-2) B(名詞) A(動詞形)
・・・
関連表現パターン制御部27に原文語句(英語表現)が入力されると、関連表現パターン展開部27aによって上記の関連表現パターンが参照され、関連表現パターンに該当するかどうかが判定される。そして、該当するものが見つかると、図5に示した動詞パターン展開、形容詞パターン展開、名詞パターン展開の一連のパターン展開処理を開始する。
E-1-1a) attachment of a tick:マダニの咬着
E-1-1b) attachment of ticks:マダニの咬着
E-1-2a) a tick of attachment:咬着のマダニ
E-1-2b) ticks of attachment:咬着のマダニ
E-2-1a) * a ticking attachment:マダニしている咬着、マダニする咬着
E-2-2a) * a ticked attachment:マダニした咬着
E-3-1a) an attaching tick:咬着しているマダニ、咬着するマダニ
E-3-2a) an attached tick:咬着したマダニ
E-4-1a) * a tickable attachment:マダニ可能な咬着
E-4-2a) *an attach tickable (to 〜):(〜に)咬着できるマダニ
E-5-1a) an attachable tick:咬着可能なマダニ
E-5-2a) a tick attachable (to 〜):(〜に)咬着できるマダニ
E-6-1a) a tick attach (to 〜): マダニが(〜に)咬着する
E-6-2a) attach a tick (to 〜):(〜に)マダニを咬着させる
E-7-1a) * tick an attachment: 咬着にマダニする
E-7-2a) * an attachment tick 〜: 咬着がマダニする
・・・
パターン展開の際には、語彙部28aに登録された派生語を参照する。語彙部28aに派生語の登録が無い場合は、接頭辞(en-、anti-、など)及び接尾辞(-able、-ment、など)を用いて派生語を生成してパターンを展開し、語彙部28aを参照して合成した語が存在する確からしさを評価して点数を付ける。例えば、P-1-1)とP-1-2)は、AとBのどちらかは実際に使用される頻度が少ない表現となるが、どちらの表現も存在する可能性はあるため、両方のパターンを展開し、確からしさも同じとする。また、P-2-1)、P-2-2)、P-7-1)、P-7-2)は、Aである”tick”の「ダニ」の意味としての動詞形が存在しないため、展開はされるが評価点が低くなり、低評価の印として*が付けられる。同様にP-4-1)及びP-4-2)は、Aである”tick”の「ダニ」の意味としての形容詞形が存在しないため、展開はされるが評価点が低くなり、*が付けられる。ここでは、生成した派生表現の確からしさを、*のあるなしの2段階で表しているが、語彙部28aに派生表現が無い場合、品詞としての存在可能性自体が低い場合などの場合別に、複数段階に点数付けをすることも可能である。なお、ここでの評価点は辞書登録する際に記憶され、評価点が高いほど、翻訳時の辞書参照の際の優先度が高くなる。
Claims (4)
- 機械翻訳プログラム、翻訳に必要な語彙・規則を蓄積した翻訳辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し前記翻訳辞書部の語彙・規則を用いて前記入力装置で入力された第一言語の原文を第二言語の訳文に翻訳する演算制御装置と、前記入力装置で入力された第一言語の原文を表示するとともに前記演算制御装置で翻訳された翻訳後の第二言語の訳文を表示する表示装置とを備えた機械翻訳装置において、
前記記憶装置に形成され、翻訳辞書に対する辞書登録または訳語学習の対象となる原文語句から派生する関連語句のパターンを関連表現パターンとして予め定義し格納した関連表現パターン定義格納部と、
ユーザによって前記入力装置から指定された第一言語の原文中の辞書登録または訳語学習の対象となる原文語句、その原文語句に対応する訳文語句及び前記訳文語句の品詞そのほかの属性である訳語情報を受け付ける辞書登録/訳語学習指定部と、
前記辞書登録/訳語学習指定部にて受け付けた前記原文語句の構成語と前記訳文語句の構成語との対応付けを行う登録見出し語・訳語対応付け部と、
前記関連表現パターン定義格納部に格納された関連表現パターンに基づいてユーザによって前記入力装置から指定された辞書登録または訳語学習の対象となる原文語句の関連表現を展開し前記原文語句から派生する関連語句を作成する関連表現パターン展開部と、
前記関連表現パターン展開部で作成された関連語句に対して前記登録見出し語・訳語対応付け部で対応付けられた前記原文語句の構成語と前記訳文語句の構成語との対応付けに基づいて関連語句の訳語を作成する訳出パターン作成部と、
前記翻訳辞書部に形成され前記訳出パターン作成部で作成された前記関連語句の訳語を格納する関連表現翻訳辞書部と、
前記翻訳辞書部の語彙・規則を用いて前記入力装置で入力された第一言語の原文を第二言語の訳文に翻訳するとともにユーザが辞書登録または訳語学習を行った原文中の箇所以降に出現した前記関連語句に対しては前記関連表現翻訳辞書部に格納された前記関連語句の訳語を適用して翻訳する翻訳部とを備えたことを特徴とする機械翻訳装置。 - 機械翻訳プログラム、翻訳に必要な語彙・規則を蓄積した翻訳辞書部を記憶した記憶装置と、翻訳対象の第一言語の原文をデータとして入力する入力装置と、前記機械翻訳プログラムを演算実行し前記翻訳辞書部の語彙・規則を用いて前記入力装置で入力された第一言語の原文を第二言語の訳文に翻訳する演算制御装置と、前記入力装置で入力された第一言語の原文を表示するとともに前記演算制御装置で翻訳された翻訳後の第二言語の訳文を表示する表示装置とを備えた機械翻訳装置に用いられる機械翻訳プログラムにおいて、
前記記憶装置は、辞書登録または訳語学習の対象となる原文語句から派生する関連語句のパターンを関連表現パターンとして予め定義し格納した関連表現パターン定義格納部を有し、前記翻訳辞書部は、前記関連語句の訳語を格納する関連表現翻訳辞書部を有し、前記コンピュータに、
ユーザによって前記入力装置から指定された第一言語の原文中の辞書登録または訳語学習の対象となる原文語句、その原文語句に対応する訳文語句及び前記訳文語句の訳語情報を受け付ける手順と、
受け付けた前記原文語句の構成語と前記訳文語句の構成語との対応付けを行う手順と、
前記関連表現パターン定義格納部に格納された関連表現パターンに基づいてユーザによって前記入力装置から指定された辞書登録または訳語学習の対象となる原文語句の関連表現を展開し前記原文語句から派生する関連語句を作成する手順と、
作成された関連語句に対して前記原文語句の構成語と前記訳文語句の構成語との対応付けに基づいて関連語句の訳語を作成する手順と、
作成された前記関連語句の訳語を前記関連表現翻訳辞書部に格納する手順と、
前記翻訳辞書部の語彙・規則を用いて前記入力装置で入力された第一言語の原文を第二言語の訳文に翻訳するとともにユーザが辞書登録または訳語学習を行った原文中の箇所以降に出現した前記関連語句に対しては前記関連表現翻訳辞書部に格納された前記関連語句の訳語を適用して翻訳する手順とを実行させるための機械翻訳プログラム。 - 請求項1の機械翻訳装置の関連表現パターン定義格納部において定義される関連表現パターンが、複数の原文語句に対して、品詞の異なる派生に変化させ、名詞の場合は複数形に変化させ、動詞、形容詞の場合には活用させて分詞に変化させ、原文語句または前記変化により生成した語句の順序を入れ替え、前記語句間に必要な前置詞を挿入する、ことによって定義されるパターンであることを特徴とする機械翻訳装置。
- 請求項2の機械翻訳プログラムの関連表現パターン定義格納部において定義される関連表現パターンが、複数の原文語句に対して、品詞の異なる派生に変化させ、名詞の場合は複数形に変化させ、動詞、形容詞の場合には活用させて分詞に変化させ、原文語句または前記変化により生成した語句の順序を入れ替え、前記語句間に必要な前置詞を挿入する、ことによって定義されるパターンであることを特徴とする機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008178666A JP4812811B2 (ja) | 2008-07-09 | 2008-07-09 | 機械翻訳装置及び機械翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008178666A JP4812811B2 (ja) | 2008-07-09 | 2008-07-09 | 機械翻訳装置及び機械翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010020436A JP2010020436A (ja) | 2010-01-28 |
JP4812811B2 true JP4812811B2 (ja) | 2011-11-09 |
Family
ID=41705281
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008178666A Expired - Fee Related JP4812811B2 (ja) | 2008-07-09 | 2008-07-09 | 機械翻訳装置及び機械翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4812811B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852113B (zh) * | 2019-10-10 | 2023-05-26 | 林原 | 翻译方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05165881A (ja) * | 1991-12-11 | 1993-07-02 | Ricoh Co Ltd | 機械翻訳装置 |
JPH05257969A (ja) * | 1992-03-11 | 1993-10-08 | Nec Corp | 機械翻訳方法および装置 |
JPH06162071A (ja) * | 1992-11-27 | 1994-06-10 | Matsushita Electric Ind Co Ltd | 機械翻訳装置 |
JP5354483B2 (ja) * | 2006-12-15 | 2013-11-27 | シャープ株式会社 | 電子機器および電子機器の制御方法 |
-
2008
- 2008-07-09 JP JP2008178666A patent/JP4812811B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010020436A (ja) | 2010-01-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ge et al. | A statistical semantic parser that integrates syntax and semantics | |
JP4654745B2 (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
US8386234B2 (en) | Method for generating a text sentence in a target language and text sentence generating apparatus | |
JP4694121B2 (ja) | 句の間の翻訳関係を学習するための統計的な方法および装置 | |
WO2017130434A1 (ja) | 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム | |
US20100179803A1 (en) | Hybrid machine translation | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
JP2006252382A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
WO2003056450A1 (fr) | Procede et appareil d'analyse syntaxique | |
KR20040025642A (ko) | 확인 문장을 검색하기 위한 방법 및 시스템 | |
JP2005165958A (ja) | 情報検索システム、情報検索支援システム及びその方法並びにプログラム | |
JP6077727B1 (ja) | 多言語の固有表現認識モデルの転移を行うコンピュータシステム、方法、およびプログラム | |
Yeh et al. | Chinese spelling checker based on an inverted index list with a rescoring mechanism | |
JP4812811B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4435144B2 (ja) | データ検索システム及びプログラム | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
KR950013128B1 (ko) | 기계번역장치 및 방법 | |
Jusoh et al. | Automated translation machines: Challenges and a proposed solution | |
Saini et al. | Relative clause based text simplification for improved english to hindi translation | |
JP4033093B2 (ja) | 自然言語処理システム及び自然言語処理方法、並びにコンピュータ・プログラム | |
CN117094329B (zh) | 一种用于解决语音歧义的语音翻译方法及装置 | |
JP4417967B2 (ja) | 用例データベース及び用例検索システム | |
JP2006024114A (ja) | 機械翻訳装置および機械翻訳コンピュータプログラム | |
JPH1145266A (ja) | 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
WO2024004184A1 (ja) | 生成装置、生成方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4812811 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |