JP6265923B2 - 翻訳学習装置、方法、及びプログラム - Google Patents
翻訳学習装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6265923B2 JP6265923B2 JP2015007131A JP2015007131A JP6265923B2 JP 6265923 B2 JP6265923 B2 JP 6265923B2 JP 2015007131 A JP2015007131 A JP 2015007131A JP 2015007131 A JP2015007131 A JP 2015007131A JP 6265923 B2 JP6265923 B2 JP 6265923B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- language sentence
- translation
- sentence
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Description
20、220 演算部
26、226 部分文字列アラインメントアノテートデータ
28 自然言語文間翻訳モデル学習部
30 単語アラインメント推定部
32 単語アラインメント
34 単語複製部
36 複製済単語アラインメント
38 半教師ありフレーズ推定部
40 フレーズテーブル
42 フレーズフィルタリング部
44 フィルタリング済フレーズテーブル
46 翻訳モデル学習部
48 翻訳モデル
50 パラフレージング適用部
52、252 パラフレーズ済翻訳モデル
60、260 自然言語文間翻訳モデル
62、262 単語複製モデル
100 翻訳学習装置
200 翻訳装置
228 自然言語文間翻訳部
230 単語複製部
232 デコーディング部
Claims (5)
- 入力された、翻訳元言語文と、前記翻訳元言語文に対応する論理形式文である翻訳先言語文とのペアの集合に基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである単語アラインメントを推定する単語アラインメント推定部と、
前記単語アラインメント推定部により推定された前記単語アラインメントに基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記ペアの前記単語アラインメントにおいて、前記翻訳元言語文の1つの単語が、前記翻訳先言語文の複数の部分文字列に対応し、かつ、前記複数の部分文字列が同一又は類似している場合、前記1つの単語を複製した前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである複製済単語アラインメントを生成すると共に、前記翻訳元言語文の単語の各々について複製された単語数に基づいて、前記翻訳元言語文の単語の複製数を推定するための単語複製モデルを学習する単語複製部と、
前記翻訳元言語文及び前記翻訳先言語文のペアの各々について前記単語複製部により生成された前記複製済単語アラインメントに基づいて、前記翻訳元言語文を前記翻訳先言語文に翻訳するための翻訳モデルを学習する翻訳モデル学習部と、
を含む翻訳学習装置。 - 前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記翻訳元言語文の部分文字列と前記翻訳先言語文の部分文字列との対応付けを表す予め定められた部分文字列アラインメントに基づいて、前記ペアについての前記複製済単語アラインメントを補正し、前記ペアの各々について補正した前記複製済単語アラインメントに基づいて、前記翻訳元言語文のフレーズと前記翻訳先言語文のフレーズとのペアを格納したフレーズテーブルを推定する半教師ありフレーズ推定部を更に含み、
前記翻訳モデル学習部は、前記半教師ありフレーズ推定部により生成された前記フレーズテーブルに基づいて、前記翻訳モデルを学習する請求項1に記載の翻訳学習装置。 - フレーズフィルタリング部と、パラフレージング適用部とを更に含み、
前記フレーズフィルタリング部は、前記半教師ありフレーズ推定部により生成されたフレーズテーブルから、前記翻訳先言語文について予め定められた制約を満たさないフレーズを含むペアを削除し、
前記翻訳モデル学習部は、前記フレーズフィルタリング部によりフレーズが削除された前記フレーズテーブルに基づいて、前記翻訳モデルを学習し、
前記パラフレージング適用部は、前記翻訳モデル学習部により学習された前記翻訳モデルに含まれる各フレーズについて、言い換え可能なフレーズを格納したパラフレーズ辞書を参照して、言い換え可能なフレーズに拡張した前記翻訳モデルを、パラフレーズ済翻訳モデルとして生成する請求項2に記載の翻訳学習装置。 - 単語アラインメント推定部と、単語複製部と、翻訳モデル学習部とを含む翻訳学習装置における翻訳学習方法であって、
前記単語アラインメント推定部が、入力された、翻訳元言語文と、前記翻訳元言語文に対応する論理形式文である翻訳先言語文とのペアの集合に基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである単語アラインメントを推定するステップと、
前記単語複製部が、前記単語アラインメント推定部により推定された前記単語アラインメントに基づいて、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について、前記ペアの前記単語アラインメントにおいて、前記翻訳元言語文の1つの単語が、前記翻訳先言語文の複数の部分文字列に対応し、かつ、前記複数の部分文字列が同一又は類似している場合、前記1つの単語を複製した前記翻訳元言語文の単語と前記翻訳先言語文の単語との対応付けである複製済単語アラインメントを生成すると共に、前記翻訳元言語文の単語の各々について複製された単語数に基づいて、前記翻訳元言語文の単語の複製数を推定するための単語複製モデルを学習するステップと、
前記翻訳モデル学習部が、前記翻訳元言語文及び前記翻訳先言語文のペアの各々について前記単語複製部により生成された前記複製済単語アラインメントに基づいて、前記翻訳元言語文を前記翻訳先言語文に翻訳するための翻訳モデルを学習するステップと、
を含む翻訳学習方法。 - コンピュータを、請求項1〜請求項3のいずれか1項に記載の翻訳学習装置の各部として機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015007131A JP6265923B2 (ja) | 2015-01-16 | 2015-01-16 | 翻訳学習装置、方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015007131A JP6265923B2 (ja) | 2015-01-16 | 2015-01-16 | 翻訳学習装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016133920A JP2016133920A (ja) | 2016-07-25 |
JP6265923B2 true JP6265923B2 (ja) | 2018-01-24 |
Family
ID=56464356
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015007131A Active JP6265923B2 (ja) | 2015-01-16 | 2015-01-16 | 翻訳学習装置、方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6265923B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7444434B2 (ja) | 2020-01-22 | 2024-03-06 | プラスワン株式会社 | 包装用容器 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6884945B2 (ja) * | 2016-09-06 | 2021-06-09 | 国立研究開発法人情報通信研究機構 | 訓練用データ生成装置、最適パラメータ取得装置、訓練用データ生成方法、および最適パラメータ取得方法 |
CN106502997A (zh) * | 2016-10-08 | 2017-03-15 | 新译信息科技(深圳)有限公司 | 短语表过滤效率的评估方法及系统 |
WO2018179355A1 (ja) * | 2017-03-31 | 2018-10-04 | 日本電気株式会社 | 情報処理システム、情報処理装置、情報処理方法および情報処理プログラム |
WO2023157047A1 (ja) * | 2022-02-15 | 2023-08-24 | 日本電信電話株式会社 | 妥当性判定装置、妥当性判定方法、および妥当性判定プログラム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7725306B2 (en) * | 2006-06-28 | 2010-05-25 | Microsoft Corporation | Efficient phrase pair extraction from bilingual word alignments |
JP2011180823A (ja) * | 2010-03-01 | 2011-09-15 | National Institute Of Information & Communication Technology | 機械翻訳装置、機械翻訳方法、およびプログラム |
US8818790B2 (en) * | 2010-04-06 | 2014-08-26 | Samsung Electronics Co., Ltd. | Syntactic analysis and hierarchical phrase model based machine translation system and method |
JP5879989B2 (ja) * | 2011-12-06 | 2016-03-08 | 日本電気株式会社 | 機械翻訳システム、機械翻訳方法および機械翻訳プログラム |
-
2015
- 2015-01-16 JP JP2015007131A patent/JP6265923B2/ja active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7444434B2 (ja) | 2020-01-22 | 2024-03-06 | プラスワン株式会社 | 包装用容器 |
Also Published As
Publication number | Publication date |
---|---|
JP2016133920A (ja) | 2016-07-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Grave et al. | Learning word vectors for 157 languages | |
Flanigan et al. | Generation from abstract meaning representation using tree transducers | |
JP6265923B2 (ja) | 翻訳学習装置、方法、及びプログラム | |
Pust et al. | Parsing English into abstract meaning representation using syntax-based machine translation | |
Pourdamghani et al. | Aligning english strings with abstract meaning representation graphs | |
Yang et al. | Joint relational embeddings for knowledge-based question answering | |
US10585924B2 (en) | Processing natural-language documents and queries | |
Mulang et al. | Matching natural language relations to knowledge graph properties for question answering | |
WO2003056450A1 (fr) | Procede et appareil d'analyse syntaxique | |
TW476895B (en) | Natural language inquiry system and method | |
Völker et al. | HDT-UD: A very large Universal Dependencies treebank for German | |
Ell et al. | SPARQL query verbalization for explaining semantic search engine queries | |
Pollicott et al. | Open conformal systems and perturbations of transfer operators | |
JP2016224483A (ja) | モデル学習装置、方法、及びプログラム | |
Lee et al. | Splitting complex English sentences | |
Green et al. | NP subject detection in verb-initial Arabic clauses | |
Borisov et al. | Yandex school of data analysis russian-english machine translation system for wmt14 | |
JP6586055B2 (ja) | 深層格解析装置、深層格学習装置、深層格推定装置、方法、及びプログラム | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
Murthy et al. | Kannada spell checker with sandhi splitter | |
Noferesti et al. | A hybrid algorithm for recognizing the position of Ezafe constructions in Persian texts | |
Shaheer et al. | Evaluating Question generation models using QA systems and Semantic Textual Similarity | |
Rodrigues et al. | Bootstrapping a hybrid MT system to a new language pair | |
Pawar et al. | Question systematization using templates | |
Nathani et al. | Part of Speech Tagging for a Resource Poor Language: Sindhi in Devanagari Script using HMM and CRF |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20161209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171003 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171212 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6265923 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |