JP4881399B2 - 対訳情報作成装置、機械翻訳装置及びプログラム - Google Patents
対訳情報作成装置、機械翻訳装置及びプログラム Download PDFInfo
- Publication number
- JP4881399B2 JP4881399B2 JP2009027688A JP2009027688A JP4881399B2 JP 4881399 B2 JP4881399 B2 JP 4881399B2 JP 2009027688 A JP2009027688 A JP 2009027688A JP 2009027688 A JP2009027688 A JP 2009027688A JP 4881399 B2 JP4881399 B2 JP 4881399B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- translated
- unit
- original
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
原文1:Seventeen members of the International Olympic Committee are scheduled to tour 29 sports and other facilities ….
訳文1:国際オリンピック委員会の委員17名は、29の運動施設他の視察を予定しており、…
原文2:In addition, the committee will visit the beach near Kansai International Airport,
訳文2:さらに、IOCは関西国際空港近辺の海岸地域を訪問する予定で、…
そして、このような対訳ペアを有した対訳データベースを用いて、次の翻訳対象文を翻訳した場合には、望ましい翻訳文に対して、対訳ペアが適用された不適切な訳文が得られることになる。
Construction Work Disputes Committee are scheduled to inspect 29 sports facilities …. In addition, the committee will visit the beach near Kansai International Airport,
(望ましい翻訳文)
国土交通省は、29の運動施設他の視察を予定しており、…。さらに、同省は関西国際空港近辺の海岸地域を訪問する予定で、
(対訳ペアの訳文2が適用された訳文:不適切)
国土交通省は、29の運動施設他の視察を予定しており、…。さらに、IOCは関西国際空港近辺の海岸地域を訪問する予定で、…
このように、省略や前後関係に依存する語が原文に含まれており、原文に書かれていない内容が補われて訳出されている対訳ペアの場合、その対訳ペアが作られた文脈と異なる文脈の翻訳対象文に訳文を適用すると、不適切な結果となることがある。
訳文3:How long will the train take?
図5は原文3について原文解析処理(S34)で得られた結果の構文ツリー構造図であり、図6は訳文3について訳文解析処理(S35)で得られた結果の構文ツリー構造図である。
原文4:In addition, the committee will visit the beach near Kansai International Airport.
訳文4:さらに、IOCは関西国際空港近辺の海岸地域を訪問する予定である。
(新たに生成されて対訳データベースに登録されたデータ)
訳文4a:「さらに、同委員会は関西国際空港近辺の海岸地域を訪問する予定である。」
(翻訳対象文)
Construction Work Disputes Committee are scheduled to inspect 29 sports facilities …. In addition, the committee will visit the beach near Kansai International Airport,
(望ましい翻訳文)
国土交通省は、29の運動施設他の視察を予定しており、…。さらに、同省は関西国際空港近辺の海岸地域を訪問する予定で、
(訳文4が適用された訳文:不適切)
国土交通省は、29の運動施設他の視察を予定しており、…。さらに、IOCは関西国際空港近辺の海岸地域を訪問する予定で、…。
(追加訳文4aが適用された訳文:適切)
国土交通省は、29の運動施設他の視察を予定しており、…。さらに、同委員会は関西国際空港近辺の海岸地域を訪問する予定で、…。
Claims (7)
- 対訳データベース作成プログラム、対訳データベース、辞書部を記憶する記憶装置と、第一言語の原文文書と第二言語の訳文文書とからなる対訳文書のデータを入力する入力装置と、前記対訳データベース作成プログラムを演算実行する演算制御装置とを備えた対訳情報作成装置において、
前記入力装置から入力された前記対訳文書のデータを入力処理して前記記憶装置に記憶する入力処理部と、
前記記憶装置に記憶された前記対訳文書のデータの第一言語の原文文書及び第二言語の訳文文書についてそれぞれ文単位に分割し前記記憶装置に記憶する文分割部と、
前記文分割部により文単位に分割された原文及び訳文に対して前記辞書部を参照して文の解析または翻訳を行う文解析・翻訳部と、
前記文解析・翻訳部で得られた解析・翻訳結果を基に前記文分割部にて文単位に分割された原文と前記文分割部にて文単位に分割された訳文とを対応付けた対訳ペアを対訳情報として前記対訳データベースに記憶する文対応付け部と、
前記文対応付け部により対応付けられた対訳ペアに対して原文と訳文とを構成する語の対応関係を解析する原文・訳文対応関係解析部と、
前記原文・訳文対応関係解析部にて解析された結果に基づいて対訳ペアにおいて訳文中に存在し原文中に存在しない付加情報の有無を検出する訳文中付加情報検出部と、
前記訳文中付加情報検出部により前記付加情報の存在が検出された訳文の前記付加情報部分の語句を対応する原文を前記辞書部を参照して翻訳した際に得られる訳語で置き換えた追加訳文を生成し対訳情報として前記対訳データベースに記憶する置き換え訳文生成部とを備えたことを特徴とする対訳情報作成装置。 - 前記訳文中付加情報検出部が検出対象とする対訳ペアは、前記原文・訳文対応関係解析部での原文と訳文とを構成する語の対応関係の解析結果により、訳文の必須構成要素でありながら省略されている原文中の語句、または冠詞が付いた一般名詞、または代名詞を含んでいる原文であると解析された対訳ペアであることを特徴とする請求項1に記載の対訳情報作成装置。
- 前記訳文中付加情報検出部は、前記付加情報が検出された対訳ペアに対して、前記付加情報が検出されたことを示す識別情報を付与して前記対訳データベースに記憶することを特徴とする請求項1または2に記載の対訳情報作成装置。
- 前記置き換え訳文生成部は、前記追加訳文を生成したときは、前記対訳ペアに対して、追加訳文が対応付けられていることを示す識別情報を付与して前記対訳データベースに記憶することを特徴とする請求項1または2に記載の対訳情報作成装置。
- 機械翻訳プログラム、辞書部及び請求項1乃至4のいずれかの対訳情報作成装置で作成された対訳データベースを記憶する記憶装置と、翻訳対象の第一の言語の原文を入力する入力装置と、翻訳後の第二の言語の訳文を出力する出力装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置において、
前記入力装置から入力された第一の言語の原文のデータを入力処理して前記記憶装置に記憶する入力処理部と、
前記記憶装置に記憶された前記原文を取り出し前記対訳データベースから前記原文と訳文とが対となった対訳ペアを検索するとともに前記対訳ペアが請求項1の前記置き換え訳文生成部によって生成された追加訳文を有するときは前記追加訳文を第1の訳文候補として検索する対訳データベース検索部と、
前記記憶装置に記憶された前記原文のうち前記対訳データベース検索部で訳文が検索されなかった原文に対して前記辞書部を参照して訳文に翻訳する翻訳部と、
前記対訳データベース検索部で検索された訳文及び前記翻訳部で翻訳された訳文や前記追加訳文を前記出力装置に出力処理する出力処理部とを備えたことを特徴とする機械翻訳装置。 - 前記対訳データベース検索部は、前記追加訳文を第1の訳文候補として検索した際に前記追加訳文を検索したことを示す識別情報を前記出力装置に出力することを特徴とする請求項5記載の機械翻訳装置。
- 対訳データベース作成プログラム、対訳データベース、辞書部を記憶する記憶装置と、第一言語の原文文書と第二言語の訳文文書とからなる対訳文書のデータを入力する入力装置と、前記対訳データベース作成プログラムを演算実行する演算制御装置とを備えた対訳情報作成装置として機能させるコンピュータに用いられるプログラムにおいて、
前記コンピュータに、
前記入力装置から入力された前記対訳文書のデータを入力処理して前記記憶装置に記憶する手順と、
前記記憶装置に記憶された前記対訳文書のデータの第一言語の原文文書及び第二言語の訳文文書についてそれぞれ文単位に分割し前記記憶装置に記憶する手順と、
前記文単位に分割された原文及び訳文に対して前記辞書部を参照して文の解析または翻訳を行う手順と、
得られた文の解析・翻訳結果を基に前記文単位に分割された原文と前記文単位に分割された訳文とを対応付けた対訳ペアを対訳情報として前記対訳データベースに記憶する手順と、
前記対応付けられた対訳ペアに対してそれぞれを構成する語の対応関係を解析する手順と、
前記語の対応関係の解析結果に基づいて対訳ペアにおいて訳文中に存在し原文中に存在しない付加情報の有無を検出する手順と、
前記付加情報の存在が検出された訳文の前記付加情報部分の語句を対応する原文を前記辞書部を参照して翻訳した際に得られる訳語で置き換えた追加訳文を生成し対訳情報として前記対訳データベースに記憶する手順とを実行させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009027688A JP4881399B2 (ja) | 2009-02-09 | 2009-02-09 | 対訳情報作成装置、機械翻訳装置及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009027688A JP4881399B2 (ja) | 2009-02-09 | 2009-02-09 | 対訳情報作成装置、機械翻訳装置及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010182261A JP2010182261A (ja) | 2010-08-19 |
| JP4881399B2 true JP4881399B2 (ja) | 2012-02-22 |
Family
ID=42763802
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009027688A Expired - Fee Related JP4881399B2 (ja) | 2009-02-09 | 2009-02-09 | 対訳情報作成装置、機械翻訳装置及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4881399B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112364669B (zh) * | 2020-10-14 | 2021-09-03 | 北京中科凡语科技有限公司 | 机器翻译译后的术语翻译方法、装置、设备及存储介质 |
| CN114118112A (zh) * | 2021-12-02 | 2022-03-01 | 江苏省舜禹信息技术有限公司 | 一种双语合并文档的合并方法 |
-
2009
- 2009-02-09 JP JP2009027688A patent/JP4881399B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010182261A (ja) | 2010-08-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Fernandes et al. | Latent structure perceptron with feature induction for unrestricted coreference resolution | |
| EP3230896B1 (en) | Localization complexity of arbitrary language assets and resources | |
| US9342499B2 (en) | Round-trip translation for automated grammatical error correction | |
| US20150051896A1 (en) | Method and apparatus to construct program for assisting in reviewing | |
| US10936825B1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space | |
| Mujadia et al. | BhashaVerse: translation ecosystem for indian subcontinent languages | |
| Spencer et al. | Can LLMs help create grammar?: Automating grammar creation for endangered languages with in-context learning | |
| JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
| JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
| Maheshwari et al. | Udaan-machine learning based post-editing tool for document translation | |
| JP5302784B2 (ja) | 機械翻訳方法、及びシステム | |
| JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
| JP6564709B2 (ja) | 文書き換え装置、方法、及びプログラム | |
| JP6235373B2 (ja) | 言語解析方法及びシステム | |
| JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
| Shukla et al. | A Framework of Translator from English Speech to Sanskrit Text | |
| JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
| US20130080144A1 (en) | Machine translation apparatus, a method and a non-transitory computer readable medium thereof | |
| JP3999771B2 (ja) | 翻訳支援プログラム、翻訳支援装置、翻訳支援方法 | |
| JP2011186507A (ja) | 翻訳前換言規則生成システム、翻訳前換言規則生成方法および翻訳前換言規則生成用プログラム | |
| Kardava | A Morphology-Driven Approach to NLP for a Low-Resource, Highly Complex Language | |
| JP5039114B2 (ja) | 機械翻訳装置及びプログラム | |
| JP4951023B2 (ja) | 機械翻訳装置、方法及びプログラム | |
| JP2012190166A (ja) | 翻訳支援装置、翻訳支援方法及びプログラム | |
| Andres et al. | Corpus-based Sequence to Sequence with Luong Attention Mechanism for Ilocano to English Translation |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111108 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111202 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4881399 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141209 Year of fee payment: 3 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |