JP5700833B2 - 並替モデル生成装置、語順並替装置、方法及びプログラム - Google Patents
並替モデル生成装置、語順並替装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5700833B2 JP5700833B2 JP2011265390A JP2011265390A JP5700833B2 JP 5700833 B2 JP5700833 B2 JP 5700833B2 JP 2011265390 A JP2011265390 A JP 2011265390A JP 2011265390 A JP2011265390 A JP 2011265390A JP 5700833 B2 JP5700833 B2 JP 5700833B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- sentence
- language sentence
- rearrangement
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
図3のペアの例では、例えば図4に例示するように単語の対応付けが行われる。すなわち、「Taro」と「太郎」とが対応付けられ、「saw」と「見た」とが対応付けられ、「Hanako」と「花子」とが対応付けられる。
ここで、θは重みベクトル、φは素性ベクトル(特徴ベクトル)、wは第二言語文の単語列、LとRはwのインデックスであり、「0≦L,R≦wの長さ-1」である。このモデルでは、Bw[L,R]>Bw[R,L]のとき、インデックスLの単語w_Lが、インデックスRの単語w_Rよりも左側に来ることが適切であることを表す。モデルBwに基づく単語列w_0,w_1,…,w_(n-1)のスコアscore(w_0,w_1,…,w_(n-1))は、以下のように与えられる。
ここで用いる並替モデルの生成、すなわちθの値の学習には、例えば、非特許文献1にあるようにLog-oddsやパーセプトロン等の既存の学習法が利用できる。また、素性ベクトルについても、例えば非特許文献1で利用しているものが利用できる。
語順並替装置は、並替モデル生成装置を含んでいてもよい。
2 対応付部
3 対応並替部
4 モデル生成部
5 並替モデル記憶部
6 並替対象言語文記憶部
7 並替部
8 文節分割部
Claims (7)
- 第一言語で記載された文を第一言語文とし、その第一言語文と同じ意味を持つ、第二言語で記載された文を第二言語文とし、上記第二言語文を構成する各文節の少なくとも1つは、1つ以上の自立語と1つ以上の機能語から構成されるとして、
上記第二言語文を構成する各文節を、上記第一言語文を構成する単語のひとつに対応づける対応付部と、
上記第二言語文を構成する各文節を、その各文節に対応する上記第一言語文を構成する単語の上記第一言語文における順序に基づいて並び替えることにより、上記第二言語文を第一言語の語順に変換する対応並替部と、
上記第一言語の語順に変換された上記第二言語文の複数に基づいて、上記第一言語の語順に変換された第二言語文としての尤もらしさを評価するための並替モデルを生成するモデル生成部と、
を含む並替モデル生成装置。 - 請求項1に記載された並替モデル生成装置であって、
上記対応付部は、上記第二言語文を構成する各文節が上記第一言語文を構成する単語に対応付けされた機能語を含む場合には、上記第一言語文の単語と上記機能語との対応付けを消し、また、上記第二言語文を構成する各文節に含まれる自立語が上記第一言語文の複数の単語に対応付けされている場合には、一番確からしい対応付けを残して他の対応付けを消し、また、上記第二言語文を構成する各文節が2以上の自立語を含み上記2以上の自立語が上記第一言語文の異なる複数の単語に対応付けされている場合には、一番確からしい対応付けを残して他の対応付けを消す、
並替モデル生成装置。 - 請求項1又は2に記載された並替モデル生成装置と、
第二言語文を文節に分割する文節分割部と、
上記並替モデル生成装置で生成された第一言語の語順に変換された第二言語文としての尤もらしさを評価するための並替モデルを用いて、互いに異なる順序で文節が並び替えられた複数の第二言語文のそれぞれについて第一言語の語順に変換された第二言語文としての尤もらしさを計算し、尤もらしさが最も大きい順序で文節が並び替えられた第二言語文を出力する並替部と、
を含む語順並替装置。 - 第一言語で記載された文を第一言語文とし、その第一言語文と同じ意味を持つ、第二言語で記載された文を第二言語文とし、上記第二言語文を構成する各文節の少なくとも1つは、1つ以上の自立語と1つ以上の機能語から構成されるとして、
対応付部が、第二言語文を構成する各文節を、上記第一言語文を構成する単語の1つに対応付ける対応付ステップと、
対応並替部が、上記第二言語文を構成する各文節を、その各文節に対応する上記第一言語文を構成する単語の上記第一言語文における順序に基づいて並び替えることにより、上記第二言語文を第一言語の語順に変換する対応並替ステップと、
モデル生成部が、上記第一言語の語順に変換された上記第二言語文の複数に基づいて、上記第一言語の語順に変換された第二言語文としての尤もらしさを評価するための並替モデルを生成するモデル生成ステップと、
を含む並替モデル生成方法。 - 請求項4に記載された並替モデル生成方法であって、
上記対応付ステップは、上記第二言語文を構成する各文節が上記第一言語文を構成する単語に対応付けされた機能語を含む場合には、上記第一言語文の単語と上記機能語との対応付けを消し、また、上記第二言語文を構成する各文節に含まれる自立語が上記第一言語文の複数の単語に対応付けされている場合には、一番確からしい対応付けを残して他の対応付けを消し、また、上記第二言語文を構成する各文節が2以上の自立語を含み上記2以上の自立語が上記第一言語文の異なる複数の単語に対応付けされている場合には、一番確からしい対応付けを残して他の対応付けを消す、
並替モデル生成方法。 - 請求項4又は5に記載された並替モデル生成方法の各ステップと、
文節分割部が、第二言語文を文節に分割する文節分割ステップと、
並替部が、上記並替モデル生成方法で生成された第一言語の語順に変換された第二言語文としての尤もらしさを評価するための並替モデルを用いて、互いに異なる順序で文節が並び替えられた複数の第二言語文のそれぞれについて第一言語の語順に変換された第二言語文としての尤もらしさを計算し、尤もらしさが最も大きい順序で文節が並び替えられた第二言語文を出力する並替ステップと、
を含む語順並替方法。 - 請求項1及び2に記載の並替モデル生成装置又は請求項3に記載の語順並替装置の各部としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265390A JP5700833B2 (ja) | 2011-12-05 | 2011-12-05 | 並替モデル生成装置、語順並替装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011265390A JP5700833B2 (ja) | 2011-12-05 | 2011-12-05 | 並替モデル生成装置、語順並替装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013117888A JP2013117888A (ja) | 2013-06-13 |
JP5700833B2 true JP5700833B2 (ja) | 2015-04-15 |
Family
ID=48712398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011265390A Active JP5700833B2 (ja) | 2011-12-05 | 2011-12-05 | 並替モデル生成装置、語順並替装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5700833B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7247460B2 (ja) | 2018-03-13 | 2023-03-29 | 富士通株式会社 | 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム |
JP7477359B2 (ja) | 2020-05-11 | 2024-05-01 | 株式会社Nttドコモ | 文章作成装置 |
-
2011
- 2011-12-05 JP JP2011265390A patent/JP5700833B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013117888A (ja) | 2013-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gupta et al. | Abstractive summarization: An overview of the state of the art | |
KR101762866B1 (ko) | 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법 | |
US9342499B2 (en) | Round-trip translation for automated grammatical error correction | |
JP5239307B2 (ja) | 翻訳装置及び翻訳プログラム | |
JP2016522524A (ja) | 同義表現の探知及び関連コンテンツを検索する方法及び装置 | |
JP6578941B2 (ja) | 含意判定装置、含意判定方法及びプログラム | |
JP2017199363A (ja) | 機械翻訳装置及び機械翻訳のためのコンピュータプログラム | |
JP2019082931A (ja) | 検索装置、類似度算出方法、およびプログラム | |
Zhu et al. | Robust spoken language understanding with unsupervised asr-error adaptation | |
JP5700833B2 (ja) | 並替モデル生成装置、語順並替装置、方法及びプログラム | |
Chaudhary et al. | The ariel-cmu systems for lorehlt18 | |
JP2011227749A (ja) | 略語完全語復元装置とその方法と、プログラム | |
JP2018072979A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
JP5734917B2 (ja) | 並べ替えモデル学習装置、方法、及びプログラム、並びに翻訳装置、方法、及びプログラム | |
JP5523929B2 (ja) | テキスト要約装置、テキスト要約方法及びテキスト要約プログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP2013054608A (ja) | 翻訳装置、方法、及びプログラム、並びに翻訳モデル学習装置、方法、及びプログラム | |
JP5544518B2 (ja) | 機械翻訳装置、機械翻訳方法、およびそのプログラム | |
Venkatapathy et al. | Three models for discriminative machine translation using Global Lexical Selection and Sentence Reconstruction | |
Parnow et al. | Grammatical error correction: More data with more context | |
Tambouratzis et al. | Language-independent hybrid MT: Comparative evaluation of translation quality | |
JP2012042991A (ja) | 文作成プログラム及び文作成装置 | |
JP2004318344A (ja) | 機械翻訳システム及び機械翻訳方法、並びにコンピュータ・プログラム | |
JP2018055328A (ja) | 対訳文抽出装置、対訳文抽出方法およびプログラム | |
Yao et al. | Joint decoding of tree transduction models for sentence compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140219 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140924 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5700833 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |