JP4381425B2 - 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 - Google Patents
二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 Download PDFInfo
- Publication number
- JP4381425B2 JP4381425B2 JP2007048881A JP2007048881A JP4381425B2 JP 4381425 B2 JP4381425 B2 JP 4381425B2 JP 2007048881 A JP2007048881 A JP 2007048881A JP 2007048881 A JP2007048881 A JP 2007048881A JP 4381425 B2 JP4381425 B2 JP 4381425B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- bilingual
- language
- languages
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
Description
第1及び第2言語用単語翻訳サブモデル並びに第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語翻訳サブモデルを推定するステップと、
第1及び第2言語用位置歪みサブモデル並びに第2及び第3言語用位置歪みサブモデルに基づいて、第1及び第3言語用位置歪みサブモデルを推定するステップと、
第1及び第2言語用単語増殖サブモデル及び/又は第2及び第3言語用単語増殖サブモデル、第1及び第2言語用単語翻訳サブモデル及び/又は第2及び第3言語用単語翻訳サブモデルに基づいて、第1及び第3言語用単語増殖サブモデルを推定するステップとを含む。
Claims (4)
- 第1及び第2言語の二言語コーパスを用いて、前記第1言語及び第2言語用二言語単語対応付けモデルを訓練するよう構成される第1訓練ユニットと、
前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応付けモデルを訓練するよう構成される第2訓練ユニットと、
前記第1及び第2言語用二言語単語対応付けモデル及び前記第2及び第3言語用二言語単語対応付けモデルに基づいて、前記第1言語及び第3言語用二言語単語対応付けモデルを推定するよう構成されるモデル推定ユニットと、
を具備し、
前記第1及び第2言語用二言語単語対応付けモデル並びに前記第2及び第3言語用二言語単語対応付けモデルは各々単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルからなり、
前記モデル推定ユニットは、
前記第1及び第2言語用前記単語翻訳サブモデル並びに前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語翻訳サブモデルを推定するよう構成される単語翻訳サブモデル推定ユニットと、
前記第1及び第2言語用前記位置歪みサブモデル並びに前記第2及び第3言語用位置歪みサブモデルに基づいて、前記第1及び第3言語用位置歪みサブモデルを推定するよう構成される位置歪みサブモデル推定ユニットと、
前記第1及び第2言語用単語増殖サブモデル及び/又は前記第2及び第3言語用単語増殖サブモデル、前記第1及び第2言語用単語翻訳サブモデル及び/又は前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語増殖サブモデルを推定するよう構成される単語増殖サブモデル推定ユニットと、
を具備し、
- 請求項1に記載の二言語単語対応付けモデル訓練装置により前記第1及び第2言語の前記二言語コーパス並びに前記第2及び第3言語の二言語コーパスに基づいて第1言語及び第3言語用二言語単語対応モデルを得るように構成されるモデル取得ユニットと、
前記第1及び第3言語用前記二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語文対を単語対応付けするよう構成される単語対応付けユニットと、
を具備する、二言語単語対応付け装置。 - 第1訓練ユニットが第1及び第2言語の二言語コーパスを用いて、前記第1言語及び第2言語用二言語単語対応付けモデルを訓練する第1ステップと、
第2訓練ユニットが前記第2及び第3言語の二言語コーパスを用いて、前記第2言語及び第3言語用二言語単語対応付けモデルを訓練する第2ステップと、
モデル推定ユニットが前記第1及び第2言語用二言語単語対応付けモデル及び前記第2及び第3言語用二言語単語対応付けモデルに基づいて、前記第1言語及び第3言語用二言語単語対応付けモデルを推定する第3ステップと、
を含み、
前記第1及び第2言語用二言語単語対応付けモデル並びに前記第2及び第3言語用二言語単語対応付けモデルは各々単語翻訳サブモデル、位置歪みサブモデル及び単語増殖サブモデルからなり、
前記第3ステップは、
前記第1及び第2言語用前記単語翻訳サブモデル並びに前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語翻訳サブモデルを推定する第1サブステップと、
前記第1及び第2言語用前記位置歪みサブモデル並びに前記第2及び第3言語用位置歪みサブモデルに基づいて、前記第1及び第3言語用位置歪みサブモデルを推定する第2サブステップと、
前記第1及び第2言語用単語増殖サブモデル及び/又は前記第2及び第3言語用単語増殖サブモデル、前記第1及び第2言語用単語翻訳サブモデル及び/又は前記第2及び第3言語用単語翻訳サブモデルに基づいて、前記第1及び第3言語用単語増殖サブモデルを推定する第3サブステップと、
を含み、
- 請求項3に記載の二言語単語対応付けモデル訓練方法により前記第1及び第2言語の前記二言語コーパス並びに前記第2及び第3言語の二言語コーパスに基づいて第1言語及び第3言語用二言語単語対応モデルを取得するステップと、
前記第1及び第3言語用前記二言語単語対応付けモデルを用いて前記第1及び第3言語の二言語文対を単語対応付けするステップと、
を含む、二言語単語対応付け方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200610058067A CN101030196B (zh) | 2006-02-28 | 2006-02-28 | 训练双语词对齐模型的方法和装置、双语词对齐方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007234023A JP2007234023A (ja) | 2007-09-13 |
JP4381425B2 true JP4381425B2 (ja) | 2009-12-09 |
Family
ID=38445093
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007048881A Expired - Fee Related JP4381425B2 (ja) | 2006-02-28 | 2007-02-28 | 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7844447B2 (ja) |
JP (1) | JP4381425B2 (ja) |
CN (1) | CN101030196B (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8185375B1 (en) * | 2007-03-26 | 2012-05-22 | Google Inc. | Word alignment with bridge languages |
CN101201820B (zh) * | 2007-11-28 | 2010-06-02 | 北京金山软件有限公司 | 一种双语语料库过滤方法及系统 |
JP5008144B2 (ja) * | 2008-02-13 | 2012-08-22 | 独立行政法人情報通信研究機構 | 対訳情報生成装置、対訳情報生成方法、及びプログラム |
CN101667174A (zh) * | 2008-09-01 | 2010-03-10 | 株式会社东芝 | 用于提高多语语料库中词对齐质量的方法及装置 |
US20120158398A1 (en) * | 2010-12-17 | 2012-06-21 | John Denero | Combining Model-Based Aligner Using Dual Decomposition |
CN102591857B (zh) * | 2011-01-10 | 2015-06-24 | 富士通株式会社 | 一种平行语料资源获取方法及系统 |
US8838433B2 (en) | 2011-02-08 | 2014-09-16 | Microsoft Corporation | Selection of domain-adapted translation subcorpora |
US8903707B2 (en) * | 2012-01-12 | 2014-12-02 | International Business Machines Corporation | Predicting pronouns of dropped pronoun style languages for natural language translation |
CN104123274B (zh) * | 2013-04-26 | 2018-06-12 | 富士通株式会社 | 评价中间语的词语的方法和装置以及机器翻译方法和设备 |
CN103577399B (zh) * | 2013-11-05 | 2018-01-23 | 北京百度网讯科技有限公司 | 双语语料库的数据扩充方法和装置 |
CN103544147A (zh) * | 2013-11-06 | 2014-01-29 | 北京百度网讯科技有限公司 | 训练翻译模型的方法和装置 |
CN103678565B (zh) * | 2013-12-09 | 2017-02-15 | 国家计算机网络与信息安全管理中心 | 一种基于自引导方式的领域自适应句子对齐系统 |
CN105446958A (zh) * | 2014-07-18 | 2016-03-30 | 富士通株式会社 | 词对齐方法和词对齐设备 |
US10713593B2 (en) * | 2016-11-04 | 2020-07-14 | Google Llc | Implicit bridging of machine learning tasks |
WO2023128170A1 (ko) * | 2021-12-28 | 2023-07-06 | 삼성전자 주식회사 | 전자 장치, 전자 장치의 제어 방법 및 프로그램이 기록된 기록매체 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
GB2272091B (en) * | 1992-10-30 | 1996-10-23 | Canon Europa Nv | Apparatus for use in aligning bilingual corpora |
US6349276B1 (en) * | 1998-10-29 | 2002-02-19 | International Business Machines Corporation | Multilingual information retrieval with a transfer corpus |
US7318022B2 (en) * | 2003-06-12 | 2008-01-08 | Microsoft Corporation | Method and apparatus for training a translation disambiguation classifier |
CN1567297A (zh) * | 2003-07-03 | 2005-01-19 | 中国科学院声学研究所 | 一种从双语语料库中自动抽取多词翻译等价单元的方法 |
US8666725B2 (en) * | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
-
2006
- 2006-02-28 CN CN200610058067A patent/CN101030196B/zh not_active Expired - Fee Related
-
2007
- 2007-02-23 US US11/678,378 patent/US7844447B2/en not_active Expired - Fee Related
- 2007-02-28 JP JP2007048881A patent/JP4381425B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US7844447B2 (en) | 2010-11-30 |
US20070203690A1 (en) | 2007-08-30 |
CN101030196A (zh) | 2007-09-05 |
CN101030196B (zh) | 2010-05-12 |
JP2007234023A (ja) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4381425B2 (ja) | 二言語単語対応付けモデル訓練方法及び装置、二言語単語対応付け方法及び装置 | |
JP4331219B2 (ja) | 二言語単語対応付けの方法および装置、二言語単語対応モデルを訓練する方法および装置 | |
US8886514B2 (en) | Means and a method for training a statistical machine translation system utilizing a posterior probability in an N-best translation list | |
CN107066455B (zh) | 一种多语言智能预处理实时统计机器翻译系统 | |
JP4886459B2 (ja) | 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置 | |
JPH08101837A (ja) | 機械翻訳装置における翻訳規則学習方法 | |
JP2005011358A5 (ja) | ||
US20120010873A1 (en) | Sentence translation apparatus and method | |
Meetei et al. | WAT2019: English-Hindi translation on Hindi visual genome dataset | |
US9311299B1 (en) | Weakly supervised part-of-speech tagging with coupled token and type constraints | |
CN110555213A (zh) | 文本翻译模型的训练方法、文本翻译方法及装置 | |
JP5060522B2 (ja) | 多言語コーパスの単語アライメント品質を改善する方法及び装置 | |
CN112016271A (zh) | 语言风格转换模型的训练方法、文本处理方法以及装置 | |
CN110728154B (zh) | 一种半监督式通用神经机器翻译模型的构建方法 | |
Afli et al. | Integrating optical character recognition and machine translation of historical documents | |
KR20170008357A (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
Zhang | Research on English machine translation system based on the internet | |
CN114519358A (zh) | 翻译质量评估方法、装置、电子设备和存储介质 | |
CN110147556B (zh) | 一种多向神经网络翻译系统的构建方法 | |
Mohaghegh et al. | Improving Persian-English statistical machine translation: experiments in domain adaptation | |
Chen et al. | A statistical method for translating Chinese into under-resourced minority languages | |
CN117094329B (zh) | 一种用于解决语音歧义的语音翻译方法及装置 | |
KR102653880B1 (ko) | 번역 품질 평가 장치 및 방법 | |
Mahata et al. | Jumt at wmt2019 news translation task: a hybrid approach to machine translation for lithuanian to english | |
Kwong | Phonological context approximation and homophone treatment for NEWS 2009 English-Chinese transliteration shared task |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090217 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090420 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090731 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090825 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090915 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121002 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131002 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |