JP5525529B2 - 機械翻訳装置および翻訳プログラム - Google Patents
機械翻訳装置および翻訳プログラム Download PDFInfo
- Publication number
- JP5525529B2 JP5525529B2 JP2011525684A JP2011525684A JP5525529B2 JP 5525529 B2 JP5525529 B2 JP 5525529B2 JP 2011525684 A JP2011525684 A JP 2011525684A JP 2011525684 A JP2011525684 A JP 2011525684A JP 5525529 B2 JP5525529 B2 JP 5525529B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- dictionary
- data
- language
- term
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 498
- 230000014616 translation Effects 0.000 claims description 514
- 238000012937 correction Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 11
- 238000012986 modification Methods 0.000 claims 1
- 230000004048 modification Effects 0.000 claims 1
- 238000004458 analytical method Methods 0.000 description 34
- 238000006243 chemical reaction Methods 0.000 description 18
- 238000000605 extraction Methods 0.000 description 11
- 238000007689 inspection Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 2
- 238000004040 coloring Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
第1の実施形態の機械翻訳装置および翻訳プログラムでは、翻訳メモリ辞書との照合により得られた対訳文から訳語の対応情報を取得して、翻訳された用語についての原文と訳語の用語対応データを作成する。そして、最初の基本語辞書を用いた翻訳時に同時に利用される専門用語辞書等の訳語データと、翻訳メモリ辞書との照合により得られた前記用語対応データとの対訳不整合データを検査して出力するものである。なお、本発明の翻訳プログラムをインストールした機械翻訳装置としては、パーソナルコンピュータ、デスクトップコンピュータ、PDA等、いずれのものでも良い。
応訳語データとして、用語「音声認識装置」とその訳語「voice recognizing unit」と、
用語「認識処理」とその訳語「recognition process」と、用語「フローチャート」とそ
の訳語「flow chart」が例示されている。「メモリ辞書名」は、3 用語とも同じ「特許
」である。
図6は、本実施形態の機械翻訳装置の処理過程を示したフローチャートである。ここでは、以下の動作を実行する翻訳プログラムが、予め機械翻訳装置にインストールされているとして説明する。
図8は、第2の実施形態に係る機械翻訳装置を示すブロック図である。この機械翻訳装置は、第1言語文書入力部110と、翻訳辞書検索・形態素解析部120と、翻訳メモリ辞書検索部130と、解析・変換・生成部140と、第2言語文書出力部150に加えて、アライメント抽出部160と、対訳不整合検査部170と、原文訳文データファイル400と、不整合用語選択部410と、訳語修正部420を備えている。第1言語文書入力部110〜対訳不整合検査部170の各構成は、図1に示したものと同じである。
第3の実施例は、第2の実施形態の一部を変更したものである。第2の実施形態では、不整合検査・修正のために原文訳文データファイル400を持つ構成としたが、第3の実施形態では図1の訳文データファイル300を採用するものである。そして、第3の実施形態では、図8の不整合用語選択部410の選択結果に応じて、翻訳処理を再実行する方式とする。
第4の実施形態は、第2の実施形態の一部を変更したものである。第2の実施形態では、訳語不整合データを修正するために原文訳文データを原文訳文データファイル400に保持したが、第4の実施形態ではその必要はない。その代わり、図8の不整合用語選択部410の選択結果に応じて、専門用語辞書210又は翻訳メモリ辞書220の訳語又は訳文データを修正し、翻訳処理を再実行するものである。
120‥翻訳辞書検索・形態素解析部
130‥翻訳メモリ辞書検索部
140‥解析・変換・生成部
150‥第2言語文書出力部
160‥アライメント抽出部
170‥対訳不整合検査部
180‥不整合検査出力部
200‥基本語辞書
210‥専門用語辞書
220‥翻訳メモリ辞書
230‥解析・変換・生成辞書
300‥訳文データファイル
310‥訳語データテーブル
320‥訳文データテーブル
330‥用語対応データテーブル
340‥対応不整合データテーブル
400‥原文訳文データファイル
410‥不整合用語選択部
420‥訳語修正部
420A‥訳語修正部A
420B‥訳語修正部B
Claims (5)
- 第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、
第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、
前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によ
って前記第2言語に翻訳すると共に、前記入力原文データを前記翻訳メモリ辞書との照合
によって前記第2言語に翻訳する翻訳処理部と、
前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳
語を対にした訳語データを記憶する第1テーブルと、
前記入力原文データの文章の中で前記翻訳メモリ辞書と照合し、かつ、アライメント抽
出された原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応デ
ータを記憶する第2テーブルと、
前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳
語データとを比較照合し、不整合な訳語を検出した場合、対話不整合データを生成する不
整合検査部と、
前記不整合検査部で生成した前記対話不整合データを出力し、前記対話不整合データで
示される前記不整合な訳語の中から前記専門用語辞書から得た訳語又は前記翻訳メモリ辞
書から得た訳語のどちらかをユーザに選択させる選択部と、
前記選択部により選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳
メモリ辞書から得た訳文の前記不整合な訳語を統一するように修正する修正部と、
を備えたことを特徴とする機械翻訳装置。 - 前記選択部により選択された訳語に従って前記翻訳メモリ辞書又は前記専門用語辞書の
使用を抑制して、前記選択された訳語の基となる前記専門用語辞書又は前記翻訳メモリ辞
書を用いて翻訳処理を再実行することを特徴とする請求項1に記載の機械翻訳装置。 - 前記修正部により修正された前記専門用語辞書又は修正された前記翻訳メモリ辞書を用
いて翻訳を再実行することを特徴とする請求項1に記載の機械翻訳装置。 - 第1言語の用語と第2言語の訳語とを記憶する基本語辞書および専門用語辞書と、
第1言語の原文文章と第2言語の訳文データとを記憶する翻訳メモリ辞書と、
前記入力原文データの単語の中で前記専門用語辞書と照合した単語とそれに対応する訳
語を対にした訳語データを記憶する第1テーブルと、
前記入力原文データの文章の中で前記翻訳メモリ辞書と照合し、かつ、アライメント抽
出された原文文章の用語とそれに対応する訳文データ中の訳語との関係を示す用語対応デ
ータを記憶する第2テーブルと、
前記第1言語の入力原文データを前記基本語辞書および前記専門用語辞書との照合によ
って前記第2言語の訳文データを作成すると共に、前記翻訳メモリ辞書との照合によって
前記第2言語の訳文データを作成する翻訳処理部と、
を有する機械翻訳装置の翻訳プログラムであって、
前記第2テーブルに記憶した前記用語対応データと前記第1テーブルに記憶した前記訳
語データとを比較照合し、不整合な訳語を検出する機能と、
前記不整合な訳語を検出した場合、対話不整合データを生成して、ユーザによって認識
可能に出力する機能と、
前記対話不整合データで示される前記不整合な訳語の中から前記専門用語辞書から得た
訳語又は前記翻訳メモリ辞書から得た訳語のどちらかをユーザに選択させる機能と、
前記選択された訳語に従って前記専門用語辞書から得た訳文又は前記翻訳メモリ辞書か
ら得た訳文の前記不整合な訳語を統一するように修正する機能と、
を備えたことを特徴とする翻訳プログラム。 - 前記選択された訳語に従って前記翻訳メモリ辞書又は前記専門用語辞書の使用を抑制し
て、前記選択された訳語の基となる前記専門用語辞書又は前記翻訳メモリ辞書を用いて翻
訳処理を再実行する機能、又は
前記修正部により修正された前記専門用語辞書又は修正された前記翻訳メモリ辞書を用
いて翻訳処理を再実行する機能と、
を備えたことを特徴とする請求項4に記載の翻訳プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2009/003700 WO2011016078A1 (ja) | 2009-08-04 | 2009-08-04 | 機械翻訳装置および翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2011016078A1 JPWO2011016078A1 (ja) | 2013-01-10 |
JP5525529B2 true JP5525529B2 (ja) | 2014-06-18 |
Family
ID=43544003
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011525684A Expired - Fee Related JP5525529B2 (ja) | 2009-08-04 | 2009-08-04 | 機械翻訳装置および翻訳プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US8655641B2 (ja) |
JP (1) | JP5525529B2 (ja) |
WO (1) | WO2011016078A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014102992A1 (ja) * | 2012-12-28 | 2014-07-03 | 株式会社日立製作所 | データ加工システムおよびデータ加工方法 |
GB2513348A (en) * | 2013-04-24 | 2014-10-29 | Ibm | Translation validation |
US20150039286A1 (en) * | 2013-07-31 | 2015-02-05 | Xerox Corporation | Terminology verification systems and methods for machine translation services for domain-specific texts |
JP2015172792A (ja) * | 2014-03-11 | 2015-10-01 | 株式会社リコー | 翻訳システム、情報処理装置、情報処理方法およびプログラム |
US10672391B2 (en) * | 2014-09-26 | 2020-06-02 | Nuance Communications, Inc. | Improving automatic speech recognition of multilingual named entities |
KR20160105215A (ko) * | 2015-02-27 | 2016-09-06 | 삼성전자주식회사 | 텍스트 처리 장치 및 방법 |
JP2016194822A (ja) * | 2015-03-31 | 2016-11-17 | 株式会社エクシング | サーバシステム及びそのプログラム、並びにエラーチェック方法 |
US9898460B2 (en) * | 2016-01-26 | 2018-02-20 | International Business Machines Corporation | Generation of a natural language resource using a parallel corpus |
KR102637338B1 (ko) * | 2017-01-26 | 2024-02-16 | 삼성전자주식회사 | 번역 보정 방법 및 장치와 번역 시스템 |
JP7114892B2 (ja) * | 2017-12-13 | 2022-08-09 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
KR102382477B1 (ko) * | 2018-08-29 | 2022-04-04 | 주식회사 아이팩토리 | 특허 문서 작성 장치, 방법, 컴퓨터 프로그램, 컴퓨터로 판독 가능한 기록매체, 서버 및 시스템 |
CN110543644B (zh) * | 2019-09-04 | 2023-08-29 | 语联网(武汉)信息技术有限公司 | 包含术语翻译的机器翻译方法、装置与电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278964A (ja) * | 2001-03-19 | 2002-09-27 | Fujitsu Ltd | 翻訳支援装置、方法及び翻訳支援プログラム |
JP2006163769A (ja) * | 2004-12-07 | 2006-06-22 | Nec Corp | 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4218760A (en) * | 1976-09-13 | 1980-08-19 | Lexicon | Electronic dictionary with plug-in module intelligence |
JPH0242572A (ja) * | 1988-08-03 | 1990-02-13 | Hitachi Ltd | 共起関係辞書生成保守方法 |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
US5224040A (en) * | 1991-03-12 | 1993-06-29 | Tou Julius T | Method for translating chinese sentences |
US5477451A (en) * | 1991-07-25 | 1995-12-19 | International Business Machines Corp. | Method and system for natural language translation |
US6275789B1 (en) * | 1998-12-18 | 2001-08-14 | Leo Moser | Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language |
US7865358B2 (en) * | 2000-06-26 | 2011-01-04 | Oracle International Corporation | Multi-user functionality for converting data from a first form to a second form |
JP2002108858A (ja) * | 2000-09-20 | 2002-04-12 | Internatl Business Mach Corp <Ibm> | 機械翻訳方法、機械翻訳装置および記録媒体 |
JP4330285B2 (ja) * | 2001-04-16 | 2009-09-16 | 沖電気工業株式会社 | 機械翻訳用辞書登録装置、機械翻訳用辞書登録方法、機械翻訳装置、機械翻訳方法及び記録媒体 |
US20030101044A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
JP4410486B2 (ja) * | 2003-05-12 | 2010-02-03 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 機械翻訳装置及びプログラム |
US7383542B2 (en) * | 2003-06-20 | 2008-06-03 | Microsoft Corporation | Adaptive machine translation service |
JP2005100335A (ja) * | 2003-09-01 | 2005-04-14 | Advanced Telecommunication Research Institute International | 機械翻訳装置、機械翻訳コンピュータプログラム及びコンピュータ |
US8296127B2 (en) * | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US7653531B2 (en) * | 2005-08-25 | 2010-01-26 | Multiling Corporation | Translation quality quantifying apparatus and method |
US7672831B2 (en) * | 2005-10-24 | 2010-03-02 | Invention Machine Corporation | System and method for cross-language knowledge searching |
US7882119B2 (en) * | 2005-12-22 | 2011-02-01 | Xerox Corporation | Document alignment systems for legacy document conversions |
EP2044533A2 (en) * | 2006-07-17 | 2009-04-08 | Total Recall Aps | A computer-implemented translation tool |
KR100837358B1 (ko) * | 2006-08-25 | 2008-06-12 | 한국전자통신연구원 | 동적 번역자원을 이용한 분야 적응형 휴대용 방송자막기계번역 장치 및 방법 |
US20080098005A1 (en) * | 2006-10-19 | 2008-04-24 | Gautam Dharamdas Goradia | Interactive community portal that, inter alia, allows members to create, modify, organize, share, and receive well-classified content in any language in one or more formats of database files and the like, and further helps members to learn/teach and/or enjoy from the said content |
US8204739B2 (en) * | 2008-04-15 | 2012-06-19 | Mobile Technologies, Llc | System and methods for maintaining speech-to-speech translation in the field |
GB2444084A (en) * | 2006-11-23 | 2008-05-28 | Sharp Kk | Selecting examples in an example based machine translation system |
JP5002271B2 (ja) | 2007-01-18 | 2012-08-15 | 株式会社東芝 | 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム |
US8185377B2 (en) * | 2007-08-11 | 2012-05-22 | Microsoft Corporation | Diagnostic evaluation of machine translators |
JP5239307B2 (ja) * | 2007-11-20 | 2013-07-17 | 富士ゼロックス株式会社 | 翻訳装置及び翻訳プログラム |
US8229728B2 (en) * | 2008-01-04 | 2012-07-24 | Fluential, Llc | Methods for using manual phrase alignment data to generate translation models for statistical machine translation |
KR20100037813A (ko) * | 2008-10-02 | 2010-04-12 | 삼성전자주식회사 | 통계적 자동 번역 장치 및 방법 |
-
2009
- 2009-08-04 JP JP2011525684A patent/JP5525529B2/ja not_active Expired - Fee Related
- 2009-08-04 WO PCT/JP2009/003700 patent/WO2011016078A1/ja active Application Filing
-
2011
- 2011-12-05 US US13/310,879 patent/US8655641B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002278964A (ja) * | 2001-03-19 | 2002-09-27 | Fujitsu Ltd | 翻訳支援装置、方法及び翻訳支援プログラム |
JP2006163769A (ja) * | 2004-12-07 | 2006-06-22 | Nec Corp | 利用者辞書作成システム、利用者辞書作成装置、利用者辞書作成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2011016078A1 (ja) | 2011-02-10 |
US8655641B2 (en) | 2014-02-18 |
JPWO2011016078A1 (ja) | 2013-01-10 |
US20120136647A1 (en) | 2012-05-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5525529B2 (ja) | 機械翻訳装置および翻訳プログラム | |
US7774193B2 (en) | Proofing of word collocation errors based on a comparison with collocations in a corpus | |
US8121829B2 (en) | Method and apparatus for constructing translation knowledge | |
JPH08101837A (ja) | 機械翻訳装置における翻訳規則学習方法 | |
US11227116B2 (en) | Translation device, translation method, and program | |
Liyanapathirana et al. | Sinspell: A comprehensive spelling checker for sinhala | |
JP2004220616A (ja) | 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置 | |
Chowdhury et al. | Implementation of an optical character reader (ocr) for bengali language | |
JP5185343B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム | |
JP4843596B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP3737817B2 (ja) | 表現変換方法及び表現変換装置 | |
Lehal | A Gurmukhi to Shahmukhi transliteration system | |
JP4016037B2 (ja) | 機械翻訳プログラム、機械翻訳装置 | |
JPS6337471A (ja) | 翻訳方法及び装置 | |
Dhanju et al. | Design and implementation of Shahmukhi spell checker | |
JP7526475B2 (ja) | 後編集支援システム、後編集支援方法、後編集支援装置、およびコンピュータプログラム | |
Forkel et al. | Towards a sustainable handling of interlinear-glossed text in language documentation | |
JP2002297585A (ja) | 英文名詞句の区分方法,英文構文情報生成方法および装置 | |
JP5337516B2 (ja) | 文書処理装置及びプログラム | |
Sinha | Automated mining of names using parallel Hindi-English corpus | |
LIST | Please cite as: List, Johann-Mattis and Sims, Nathanial A.(2019): Towards a sustainable handling of inter-linear-glossed text in language documentation.[Preprint under review. Not peer-reviewed] | |
JPH11282844A (ja) | 文書作成方法および情報処理装置および記録媒体 | |
JP5331964B2 (ja) | 翻訳支援装置、翻訳支援方法および翻訳支援プログラム | |
JPH09269945A (ja) | メディア変換方法およびメディア変換装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130717 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130910 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20131008 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131226 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20140108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140314 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140411 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5525529 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |