JP2015153182A - 語順並べ替え装置、翻訳装置、方法、及びプログラム - Google Patents
語順並べ替え装置、翻訳装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP2015153182A JP2015153182A JP2014026801A JP2014026801A JP2015153182A JP 2015153182 A JP2015153182 A JP 2015153182A JP 2014026801 A JP2014026801 A JP 2014026801A JP 2014026801 A JP2014026801 A JP 2014026801A JP 2015153182 A JP2015153182 A JP 2015153182A
- Authority
- JP
- Japan
- Prior art keywords
- phrase
- translation
- main part
- clause
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】文節同定部34により、入力文又は句について、機能語を含む各文節を同定し、主部同定部40により、入力文又は句の主部を同定し、並べ替え部50により、同定された入力文又は句の主部について、主部に含まれる各文節の順序を反転するように並べ替え、入力文又は句のうち、主部とは異なる部分について、各文節の順序を反転するように並べ替え、主部について並べ替えられた各文節及び主部とは異なる部分について並べ替えられた各文節について、文節同定部により同定された機能語を文節の先頭に並べ替えるように、文節内の語順を並べ替える。
【選択図】図1
Description
本発明の実施の形態において、日本語から英語への翻訳を対象とした事前並べ替えを行うために、上記非特許文献5と同様に日本語で記述された文を主部と述部に分け、その後に上記非特許文献4と同様に文節間・文節内の二段階の並べ替えを行う。特に、本実施の形態においては、文節間の並べ替えにおいて、並列句の順序を誤って反転させることがないように、並列句の情報を利用することで過剰な順序反転を抑制する。なお、日本語を第1特定言語の一例とし、英語を第2特定言語の一例とする。
次に、本発明の実施の形態に係る翻訳装置の構成について説明する。図1に示すように、本発明の実施の形態に係る翻訳装置100は、CPUと、RAMと、後述する翻訳処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この翻訳装置100は、機能的には図1に示すように入力部10と、演算部20と、出力部90とを備えている。
次に、本発明の実施の形態に係る翻訳モデル学習装置の構成について説明する。図2に示すように、本発明の実施の形態に係る翻訳モデル学習装置200は、CPUと、RAMと、後述する翻訳モデル学習処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することができる。この翻訳モデル学習装置200は、機能的には図2に示すように入力部210と、演算部220と、出力部290とを備えている。
次に、本発明の実施の形態に係る翻訳モデル学習装置200の作用について説明する。まず、入力部210により、日本語と英語の対訳となっている文対、語句対(対訳データ)の集合である学習用並行コーパスを受け付け、学習用並行コーパス222に記憶される。そして、翻訳モデル学習装置200のROMに記憶されたプログラムを、CPUが実行することにより、図3に示す翻訳モデル学習処理ルーチンが実行される。
次に、本発明の実施の形態に係る翻訳装置100の作用について説明する。まず、入力部10により、翻訳モデル学習装置200によって学習された複数の翻訳モデル及び翻訳モデルの各々に対する重みを受け付けモデル記憶部54に記憶される。そして、入力部10により、日本語で記述された文を受け付けると、翻訳装置100のROMに記憶されたプログラムを、CPUが実行することにより、図4に示す翻訳処理ルーチンが実行される。
次に、約300万文の日本語・英語並行コーパスから統計翻訳モデルの学習を行った実施例について以下説明する。
「また、データ保存装置とデータ収集装置がネットワークに接続される。」という日本語文を、翻訳装置100が実装された計算機端末に入力した場合の実施例を以下に示す。
20 演算部
30 言語解析部
32 形態素解析部
34 文節同定部
36 並列同定部
38 文分割部
40 主部同定部
50 並べ替え部
52 翻訳部
54 モデル記憶部
90 出力部
100 翻訳装置
200 翻訳モデル学習装置
210 入力部
220 演算部
222 学習用並行コーパス
250 モデル学習部
252 学習データ言語解析部
254 学習データ並べ替え部
256 モデル用並行コーパス
258 翻訳モデル学習部
260 翻訳部
262 学習部
270 モデル記憶部
290 出力部
Claims (7)
- 入力文又は句について、機能語を含む各文節を同定する文節同定部と、
前記入力文又は句の主部を同定する主部同定部と、
前記主部同定部により同定された前記入力文又は句の主部について、前記主部に含まれる各文節の順序を反転するように並べ替え、前記入力文又は句のうち、前記主部とは異なる部分について、各文節の順序を反転するように並べ替え、前記主部について並べ替えられた各文節及び前記主部とは異なる部分について並べ替えられた各文節について、前記文節に含まれる機能語を前記文節の先頭に並べ替えるように、前記文節内の語順を並べ替える並べ替え部と、
を含む、語順並べ替え装置。 - 前記入力文又は句の各文節から、並列の関係となる文節の組み合わせを同定する並列同定部を更に含み、
前記並べ替え部は、前記並列同定部により同定された並列の関係となる文節の組み合わせについての文節の順序を維持するように、前記主部に含まれる各文節の順序を反転するように並べ替え、前記主部とは異なる部分について各文節の順序を反転するように並べ替え、前記並列の関係となる文節の組み合わせについて、最も後方に位置する文節に含まれる機能語を、最も前方に位置する文節の先頭に並べ替え、前記並列の関係となる文節の組み合わせとは異なる各文節について、前記文節に含まれる機能語を前記文節の先頭に並べ替えるように、前記文節内の語順を並べ替える請求項1記載の語順並べ替え装置。 - 第1特定言語で記述された入力文又は句を、第1特定言語とは異なる第2特定言語で記述された文又は句に翻訳する翻訳装置において、
請求項1又は2記載の語順並べ替え装置によって前記入力文又は句を並べ替えた結果について、複数種類の翻訳モデル及び前記複数種類の翻訳モデルの各々に対する重みに基づいて、前記第2特定言語で記述された文又は句に翻訳する翻訳部
を含む翻訳装置。 - 文節同定部と、主部同定部と、並べ替え部と、を含む語順並べ替え装置における語順並べ替え方法であって、
前記文節同定部が、入力文又は句について、機能語を含む各文節を同定し、
前記主部同定部が、前記入力文又は句の主部を同定し、
前記並べ替え部が、前記主部同定部により同定された前記入力文又は句の主部について、前記主部に含まれる各文節の順序を反転するように並べ替え、前記入力文又は句のうち、前記主部とは異なる部分について、各文節の順序を反転するように並べ替え、前記主部について並べ替えられた各文節及び前記主部とは異なる部分について並べ替えられた各文節について、前記文節に含まれる機能語を前記文節の先頭に並べ替えるように、前記文節内の語順を並べ替える
語順並べ替え方法。 - 翻訳部を含む、第1特定言語で記述された入力文又は句を、第1特定言語とは異なる第2特定言語で記述された文又は句に翻訳する翻訳装置における翻訳方法であって、
前記翻訳部によって、請求項4記載の語順並べ替え方法によって前記入力文又は句を並べ替えた結果について、複数種類の翻訳モデル及び前記複数種類の翻訳モデルの各々に対する重みに基づいて、前記第2特定言語で記述された文又は句に翻訳する
翻訳方法。 - コンピュータを、請求項1又は請求項2記載の語順並べ替え装置を構成する各部として機能させるためのプログラム。
- コンピュータを、請求項3記載の翻訳装置を構成する各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026801A JP6040946B2 (ja) | 2014-02-14 | 2014-02-14 | 語順並べ替え装置、翻訳装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014026801A JP6040946B2 (ja) | 2014-02-14 | 2014-02-14 | 語順並べ替え装置、翻訳装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015153182A true JP2015153182A (ja) | 2015-08-24 |
JP6040946B2 JP6040946B2 (ja) | 2016-12-07 |
Family
ID=53895341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014026801A Active JP6040946B2 (ja) | 2014-02-14 | 2014-02-14 | 語順並べ替え装置、翻訳装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6040946B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018097022A1 (ja) * | 2016-11-24 | 2018-05-31 | 国立研究開発法人情報通信研究機構 | 自動翻訳パターン学習装置、自動翻訳の前処理装置、及びコンピュータプログラム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013054607A (ja) * | 2011-09-05 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 並べ替え規則学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム |
-
2014
- 2014-02-14 JP JP2014026801A patent/JP6040946B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013054607A (ja) * | 2011-09-05 | 2013-03-21 | Nippon Telegr & Teleph Corp <Ntt> | 並べ替え規則学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム |
Non-Patent Citations (2)
Title |
---|
JPN6016037402; 星野 翔 外3名: '日英統計的機械翻訳のための述語項構造に基づく事前並べ替え' 言語処理学会第19回年次大会 発表論文集 , 20130304, p.394-397, 言語処理学会 * |
JPN6016037411; 磯崎 秀樹: '英日翻訳における語順について' 言語処理学会第16回年次大会発表論文集 , 20100308, p.884-887, 言語処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018097022A1 (ja) * | 2016-11-24 | 2018-05-31 | 国立研究開発法人情報通信研究機構 | 自動翻訳パターン学習装置、自動翻訳の前処理装置、及びコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6040946B2 (ja) | 2016-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102268875B1 (ko) | 전자 장치에 텍스트를 입력하는 시스템 및 방법 | |
US7478033B2 (en) | Systems and methods for translating Chinese pinyin to Chinese characters | |
US10061768B2 (en) | Method and apparatus for improving a bilingual corpus, machine translation method and apparatus | |
US8670975B2 (en) | Adaptive pattern learning for bilingual data mining | |
JP4694111B2 (ja) | 用例ベースの機械翻訳システム | |
US6816830B1 (en) | Finite state data structures with paths representing paired strings of tags and tag combinations | |
Mori et al. | A machine learning approach to recipe text processing | |
JP2006012168A (ja) | 翻訳メモリシステムにおいてカバレージおよび質を改良する方法 | |
JP2007241764A (ja) | 構文解析プログラム、構文解析方法、構文解析装置、及び構文解析プログラムが記録されたコンピュータ読み取り可能な記録媒体 | |
CN112417823B (zh) | 一种中文文本语序调整和量词补全方法及系统 | |
JP5552101B2 (ja) | 並べ替え規則学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム | |
JP6040946B2 (ja) | 語順並べ替え装置、翻訳装置、方法、及びプログラム | |
KR20100062834A (ko) | 번역 오류 후처리 보정 장치 및 방법 | |
JP5800206B2 (ja) | 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム | |
JP5734917B2 (ja) | 並べ替えモデル学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム | |
JP5780670B2 (ja) | 翻訳装置、方法、及びプログラム、並びに翻訳モデル学習装置、方法、及びプログラム | |
JP2017142758A (ja) | 単語並べ替え学習方法、単語並べ替え方法、装置、及びプログラム | |
Glöckner et al. | The LogAnswer Project at ResPubliQA 2010. | |
JP6083645B2 (ja) | 語順並べ替え装置、翻訳装置、翻訳モデル学習装置、方法、及びプログラム | |
Murawaki et al. | Online Japanese Unknown Morpheme Detection using Orthographic Variation. | |
JP3939264B2 (ja) | 形態素解析装置 | |
Howlett et al. | Dual-path phrase-based statistical machine translation | |
KR101638442B1 (ko) | 중국어 구문 분절 방법 및 장치 | |
JP5462894B2 (ja) | 翻訳モデル学習装置、方法、翻訳装置、方法、及びプログラム | |
Ekbal et al. | Named entity transliteration |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20151209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20151209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160920 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161024 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6040946 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |