JP2013250605A - 機械翻訳装置、機械翻訳方法、およびプログラム - Google Patents
機械翻訳装置、機械翻訳方法、およびプログラム Download PDFInfo
- Publication number
- JP2013250605A JP2013250605A JP2012122866A JP2012122866A JP2013250605A JP 2013250605 A JP2013250605 A JP 2013250605A JP 2012122866 A JP2012122866 A JP 2012122866A JP 2012122866 A JP2012122866 A JP 2012122866A JP 2013250605 A JP2013250605 A JP 2013250605A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- swap operator
- swap
- target language
- word order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013519 translation Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims description 42
- 238000012545 processing Methods 0.000 claims abstract description 31
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 11
- 230000014616 translation Effects 0.000 description 85
- 230000006870 function Effects 0.000 description 9
- 241000220225 Malus Species 0.000 description 7
- 235000021016 apples Nutrition 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 3
- 244000046101 Sophora japonica Species 0.000 description 2
- 235000010586 Sophora japonica Nutrition 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000004836 empirical method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001629 sign test Methods 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
【解決手段】語順の入れ替えが発生する二分木の文脈自由文法規則を示す情報である2以上のスワップオペレータを格納し得るスワップオペレータ格納部と、原言語文を受け付ける受付部と、原言語文を構文解析し、当該構文解析の結果を用いて、1以上の二分木を取得する二分木取得部と、1以上の各二分木に対して、スワップオペレータ格納部のスワップオペレータを適用し、いずれかのスワップオペレータに対応するか否かを判断する判断部と、判断部がいずれかのスワップオペレータに対応すると判断した二分木の葉の部分の語順を入れ替える入替部と、入替部の処理結果に対して、目的言語への機械翻訳を実行し、目的言語文を取得する機械翻訳部と、機械翻訳部が取得した目的言語文を出力する出力部とを具備する機械翻訳装置により、任意の二言語間で、高精度な機械翻訳ができる。
【選択図】図1
Description
本実施の形態において、受け付けた原言語文を二分木にし、スワップオペレータを用いて、原言語の二分木を入れ替えることにより、任意の二言語間で、高精度な機械翻訳ができる機械翻訳装置1について説明する。なお、機械翻訳装置1では、原言語の二分木を入れ替えた後、機械翻訳を行い、目的言語文を取得する。
第一順位相関と第二順位相関とを比較し、所定の条件を満たすほど第二順位相関が大きいか否かを判断する。条件を満たす場合はステップS314に行き、条件を満たさない場合はステップS315に行く。
101 アライメント情報格納部
102 対訳コーパス
103 スワップオペレータ候補格納部
104 スワップオペレータ格納部
105 例外情報格納部
106 受付部
107 二分木取得部
108 判断部
109 入替部
110 機械翻訳部
111 出力部
112 構文解析部
113 目的言語語順文取得部
114 順位相関算出部
115 スワップオペレータ取得部
116 スワップオペレータ蓄積部
117 制御部
1131 第一目的言語語順文取得手段
1132 第二目的言語語順文取得手段
1141 第一順位相関算出手段
1142 第二順位相関算出手段
Claims (6)
- 語順の入れ替えが発生する二分木の文脈自由文法規則を示す情報である1以上のスワップオペレータを格納し得るスワップオペレータ格納部と、
原言語文を受け付ける受付部と、
前記原言語文を構文解析し、当該構文解析の結果を用いて、1以上の二分木を取得する二分木取得部と、
前記1以上の各二分木に対して、前記スワップオペレータ格納部のスワップオペレータを適用し、いずれかのスワップオペレータに対応するか否かを判断する判断部と、
前記判断部がいずれかのスワップオペレータに対応すると判断した二分木の葉の部分の語順を入れ替える入替部と、
前記入替部の処理結果に対して、目的言語への機械翻訳を実行し、目的言語文を取得する機械翻訳部と、
前記機械翻訳部が取得した目的言語文を出力する出力部とを具備する機械翻訳装置。 - 枝分かれが3以上のn分木であり、二分木を構成しないことを示す情報である1以上の例外情報を格納し得る例外情報格納部をさらに具備し、
前記二分木取得部は、
前記原言語文を構文解析した結果のうち、前記1以上のいずれかの例外情報に対応しない部分に対してのみ、1以上の二分木を取得し、
前記判断部は、
前記原言語文を構文解析した結果のうち、前記1以上のいずれかの例外情報に対応する部分について、いずれかのスワップオペレータに対応するか否かを判断しない請求項1記載の機械翻訳装置。 - 原言語文と目的言語文とを対応付けた1組以上の対応文を格納し得る対訳コーパスと、
原言語の単語または句と目的言語の単語または句とのアライメントの情報であるアライメント情報を格納し得るアライメント情報格納部と、
語順の入れ替えが発生する二分木の文脈自由文法規則を示す情報であるスワップオペレータの候補である1以上のスワップオペレータ候補を格納し得るスワップオペレータ候補格納部と、
前記対訳コーパスの1以上の原言語文を構文解析し、原言語文の1以上の二分木を取得する構文解析部と、
前記構文解析部が取得した原言語文の1以上の二分木に対して、前記1以上の各スワップオペレータ候補を適用し、スワップオペレータ候補に対応する二分木の葉の部分を語順変換して、原言語の目的言語の語順の文である1以上の目的言語語順文を取得する目的言語語順文取得部と、
前記アライメント情報を用いて、前記対訳コーパスが有する1以上の目的言語文と、前記目的言語語順文取得部が取得した1以上の目的言語語順文との順位相関を算出する順位相関算出部と、
前記順位相関算出部が算出した順位相関が所定の条件を満たすほど大きい場合、当該順位相関に対応するスワップオペレータ候補をスワップオペレータとして取得するスワップオペレータ取得部と、
前記スワップオペレータ取得部が取得したスワップオペレータを、前記スワップオペレータ格納部に蓄積するスワップオペレータ蓄積部とをさらに具備する請求項1または請求項2記載の機械翻訳装置。 - 前記スワップオペレータ候補格納部は、
重要度の順にソートされた2以上のスワップオペレータ候補を格納しており、
前記目的言語語順文取得部は、
前記構文解析部が取得した原言語文の1以上の二分木に対して、初期値が空であるスワップオペレータ格納部の各スワップオペレータを適用し、当該各スワップオペレータに対応する二分木の葉の部分を語順変換して、原言語の目的言語の語順の文である1以上の第一目的言語語順文を取得する第一目的言語語順文取得手段と、
前記構文解析部が取得した原言語文の1以上の二分木に対して、初期値が空であるスワップオペレータ格納部の各スワップオペレータおよび前記重要度順の上位から順次取り出されたスワップオペレータ候補を適用し、前記各スワップオペレータまたは前記スワップオペレータ候補に対応する二分木の葉の部分を語順変換して、原言語の目的言語の語順の文である1以上の第二目的言語語順文を取得する第二目的言語語順文取得手段とを具備し、
前記順位相関算出部は、
前記アライメント情報を用いて、前記対訳コーパスが有する1以上の目的言語文と、前記第一目的言語語順文取得手段が取得した1以上の第一目的言語語順文との第一順位相関を算出する第一順位相関算出手段と、
前記アライメント情報を用いて、前記対訳コーパスが有する1以上の目的言語文と、前記第二目的言語語順文取得手段が取得した1以上の第二目的言語語順文との第二順位相関を算出する第二順位相関算出手段とを具備し、
前記スワップオペレータ取得部は、
前記第一順位相関と前記第二順位相関とを比較し、所定の条件を満たすほど前記第二順位相関が大きい場合、前記スワップオペレータ候補をスワップオペレータとして取得し、
前記スワップオペレータ蓄積部は、
前記スワップオペレータ取得部が取得したスワップオペレータを、前記スワップオペレータ格納部に蓄積し、
前記スワップオペレータ候補格納部のすべてのスワップオペレータ候補に対する処理を終了するまで、前記目的言語語順文取得部、前記順位相関算出部、前記スワップオペレータ取得部、および前記スワップオペレータ蓄積部の処理を継続させる制御部をさらに具備する請求項3記載の機械翻訳装置。 - 記録媒体に、
語順の入れ替えが発生する二分木の文脈自由文法規則を示す情報である2以上のスワップオペレータを格納しており、
受付部、二分木取得部、判断部、入替部、機械翻訳部、および出力部により実現される機械翻訳方法であって、
前記受付部が、原言語文を受け付ける受付部と、
前記二分木取得部が、前記原言語文を構文解析し、当該構文解析の結果を用いて、1以上の二分木を取得する二分木取得ステップと、
前記判断部が、前記1以上の各二分木に対して、前記記録媒体のスワップオペレータを適用し、いずれかのスワップオペレータに対応するか否かを判断する判断ステップと、
前記入替部が、前記判断ステップでいずれかのスワップオペレータに対応すると判断された二分木の葉の部分の語順を入れ替える入替ステップと、
前記機械翻訳部が、前記入替ステップにおける処理結果に対して、目的言語への機械翻訳を実行し、目的言語文を取得する機械翻訳ステップと、
前記出力部が、前記機械翻訳ステップで取得された目的言語文を出力する出力ステップとを具備する機械翻訳方法。 - 語順の入れ替えが発生する二分木の文脈自由文法規則を示す情報である2以上のスワップオペレータを格納し得るスワップオペレータ格納部にアクセス可能なコンピュータを、
原言語文を受け付ける受付部と、
前記原言語文を構文解析し、当該構文解析の結果を用いて、1以上の二分木を取得する二分木取得部と、
前記1以上の各二分木に対して、前記スワップオペレータ格納部のスワップオペレータを適用し、いずれかのスワップオペレータに対応するか否かを判断する判断部と、
前記判断部がいずれかのスワップオペレータに対応すると判断した二分木の葉の部分の語順を入れ替える入替部と、
前記入替部の処理結果に対して、目的言語への機械翻訳を実行し、目的言語文を取得する機械翻訳部と、
前記機械翻訳部が取得した目的言語文を出力する出力部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012122866A JP5924677B2 (ja) | 2012-05-30 | 2012-05-30 | 機械翻訳装置、機械翻訳方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012122866A JP5924677B2 (ja) | 2012-05-30 | 2012-05-30 | 機械翻訳装置、機械翻訳方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013250605A true JP2013250605A (ja) | 2013-12-12 |
JP5924677B2 JP5924677B2 (ja) | 2016-05-25 |
Family
ID=49849280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012122866A Active JP5924677B2 (ja) | 2012-05-30 | 2012-05-30 | 機械翻訳装置、機械翻訳方法、およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5924677B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016125710A1 (ja) * | 2015-02-02 | 2016-08-11 | 国立研究開発法人情報通信研究機構 | 構文解析装置、学習装置、機械翻訳装置、および記録媒体 |
JP2017021596A (ja) * | 2015-07-10 | 2017-01-26 | 日本電信電話株式会社 | 単語並べ替え学習装置、単語並べ替え装置、方法、及びプログラム |
JP2019533181A (ja) * | 2016-08-02 | 2019-11-14 | ハイパーコネクト インコーポレイテッド | 通訳装置及び方法(device and method of translating a language) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05266069A (ja) * | 1992-03-23 | 1993-10-15 | Nec Corp | 中国語と日本語との間の双方向機械翻訳方式 |
-
2012
- 2012-05-30 JP JP2012122866A patent/JP5924677B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05266069A (ja) * | 1992-03-23 | 1993-10-15 | Nec Corp | 中国語と日本語との間の双方向機械翻訳方式 |
Non-Patent Citations (1)
Title |
---|
JPN7015003568; Kenji Yamada and Kevin Knight: 'A syntax-based statistical translation model' Proceedings of the 39th Annual Meeting on Association for Computational Linguistics , 20010711, p.523-530, Association for Computational Linguistics * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016125710A1 (ja) * | 2015-02-02 | 2016-08-11 | 国立研究開発法人情報通信研究機構 | 構文解析装置、学習装置、機械翻訳装置、および記録媒体 |
JP2017021596A (ja) * | 2015-07-10 | 2017-01-26 | 日本電信電話株式会社 | 単語並べ替え学習装置、単語並べ替え装置、方法、及びプログラム |
JP2019533181A (ja) * | 2016-08-02 | 2019-11-14 | ハイパーコネクト インコーポレイテッド | 通訳装置及び方法(device and method of translating a language) |
Also Published As
Publication number | Publication date |
---|---|
JP5924677B2 (ja) | 2016-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110874537B (zh) | 多语言翻译模型的生成方法、翻译方法及设备 | |
Ortega et al. | Neural machine translation with a polysynthetic low resource language | |
KR101762866B1 (ko) | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 | |
KR100530154B1 (ko) | 변환방식 기계번역시스템에서 사용되는 변환사전을생성하는 방법 및 장치 | |
KR20080014845A (ko) | 1개 국어 및 이용가능한 2개 국어 코퍼스로부터의 연어번역을 위한 컴퓨터 판독가능 매체, 추출 방법 및 추출시스템 | |
US9779086B2 (en) | Learning apparatus, translation apparatus, learning method, and translation method | |
KR20120021933A (ko) | 의존관계 포레스트를 이용한 통계적 기계 번역 방법 | |
Lindén et al. | Hfst—a system for creating nlp tools | |
JP2017199363A (ja) | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム | |
JP5911098B2 (ja) | 翻訳装置、およびプログラム | |
JP6952967B2 (ja) | 自動翻訳装置 | |
JP5924677B2 (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
JP5410334B2 (ja) | 語順変換装置、機械翻訳用統計モデル作成装置、機械翻訳装置、語順変換方法、機械翻訳用統計モデル作成方法、機械翻訳方法、プログラム | |
JP5552101B2 (ja) | 並べ替え規則学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム | |
JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
Rikters | Hybrid machine translation by combining output from multiple machine translation systems | |
Salami et al. | Phrase-boundary model for statistical machine translation | |
Nguyen et al. | A tree-to-string phrase-based model for statistical machine translation | |
Rikters et al. | Combining machine translated sentence chunks from multiple MT systems | |
US20180011833A1 (en) | Syntax analyzing device, learning device, machine translation device and storage medium | |
Bhat et al. | A house united: bridging the script and lexical barrier between Hindi and Urdu | |
JP2004318344A (ja) | 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム | |
JP6221339B2 (ja) | 翻訳装置及び翻訳方法 | |
Zhang et al. | A unified approach for effectively integrating source-side syntactic reordering rules into phrase-based translation | |
Kapanadze et al. | Building resources for georgian treebanking-based nlp |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150305 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160324 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160412 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5924677 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |