JP3936687B2 - 機械翻訳文の評価方法、および機械翻訳文の評価装置 - Google Patents
機械翻訳文の評価方法、および機械翻訳文の評価装置 Download PDFInfo
- Publication number
- JP3936687B2 JP3936687B2 JP2003307240A JP2003307240A JP3936687B2 JP 3936687 B2 JP3936687 B2 JP 3936687B2 JP 2003307240 A JP2003307240 A JP 2003307240A JP 2003307240 A JP2003307240 A JP 2003307240A JP 3936687 B2 JP3936687 B2 JP 3936687B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sentence
- backward
- evaluation
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 379
- 238000011156 evaluation Methods 0.000 title claims description 200
- 230000014616 translation Effects 0.000 claims description 376
- 238000000034 method Methods 0.000 description 28
- 238000002474 experimental method Methods 0.000 description 12
- 238000012854 evaluation process Methods 0.000 description 8
- 108040009536 hydroxyproline O-arabinosyltransferase activity proteins Proteins 0.000 description 7
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000002950 deficient Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000002105 tongue Anatomy 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
K.Yasuda, F.Sugaya, T.Takezawa, S.Yamamoto and M.Yanagida, 2003. Application of automatic evaluation methods to measuring a capability of speech translation system, In 10th Conference of European Chapter of the Association for Computational Linguistica(EACL), pages 371-378. R.Frederking, A.W.Black, H.D.Brown, J.Moody and E.Steinhrecher, 2002, Field Testing the Tongues Speech-to-Speech Machine Translation System, In Proceedings of International Conference on Language Resources and Evaluation(LREC), pages 160-164.
図1は、第1の実施形態に係る機械翻訳文評価装置の構成を示す。同図を参照して、この機械翻訳文評価装置19は、順方向機械翻訳部11と、順方向翻訳文評価部10と、この順方向翻訳文評価部10による評価結果を表示する表示装置14とから構成される。
ここで、Tは、原文の語数、Saは、逆方向翻訳文Aで置換された語(原文の語と異なる逆方向翻訳文Aの語)の数、Iaは、逆方向翻訳文Aで挿入された語(つまり、逆方向翻訳文Aにあって、原文にない語)の数、Daは、逆方向翻訳文Aで削除された語(つまり、原文にあって、逆方向翻訳文Aにない語)の数を示す。
ここで、Tは、原文の語数、Sbは、逆方向翻訳文Bで置換された語(原文の語と異なる逆方向翻訳文Bの語)の数、Ibは、逆方向翻訳文Bで挿入された語(つまり、逆方向翻訳文Bにあって、原文にない語)の数、Dbは、逆方向翻訳文Bで削除された語(つまり、原文にあって、逆方向翻訳文Bにない語)の数を示す。
ここで、Tは、原文の語数、Scは、逆方向翻訳文Cで置換された語(原文の語と異なる逆方向翻訳文Cの語)の数、Icは、逆方向翻訳文Cで挿入された語(つまり、逆方向翻訳文Cにあって、原文にない語)の数、Dcは、逆方向翻訳文Cで削除された語(つまり、原文にあって、逆方向翻訳文Cにない語)の数を示す。
本実施の形態に係る機械翻訳文評価装置と、図1に示す第1の実施形態に係る機械翻訳文評価装置とは、評価部のみが相違する。
本実施の形態に係る機械翻訳文評価装置と、図1に示す第1の実施形態に係る機械翻訳文評価装置とは、評価部のみが相違する。
図10は、第4の実施形態に係る機械翻訳文評価装置の構成を示す。同図を参照して、この機械翻訳文評価装置49の順方向翻訳文評価部40は、第1パラフレーズ部41と、逆方向機械翻訳部12a,12b,12cと、第2パラフレーズ部42a,42b,42cと、第3パラフレーズ部44と、評価部43とからなる。
本発明は、上記実施の形態に限定されるものではなく、たとえば、以下の変形例も包含する。
本発明の実施形態では、DPマッチングを行なうことによって文間の類似度を算出したが、これに限定するものではなく、その他の文間の類似度を計算する手法を用いてもよい。
本発明の第2の実施形態では、マッチングスコアが最大の逆方向翻訳文を表示装置に出力するものとしたが、これに限定するものではない。たとえば、逆方向翻訳部が10個あるような場合には、マッチングスコアが1位〜5位の逆方向翻訳文を表示装置に出力するものとしてもよい。
本発明の第4の実施形態では、順方向翻訳文評価部は、第1パラフレーズ部、第2パラフレーズ部、および第3パラフレーズ部を備えるものとしたが、これらのうち、1つのパレフレーズ部のみを備えるものとしてもよく、あるいは、任意の2つのパラフレーズ部を備えるものとしてもよい。
本発明の実施の形態では、評価部によって評価が行なわれるものとしたが、評価部による評価を行なうことなく、逆方向翻訳文A,B,Cをそのまま表示装置に送って表示するものとしてもよい。
本発明の実施の形態では、評価部による評価結果は表示装置に送られて表示されたが、これに限定するものではなく、音声などによって評価結果を通知するものとしてもよい。
本発明の第4の実施形態では、評価部として、第3の実施形態と同様の評価部(完全一致判定部)を用いたが、第1または第2の実施形態における評価部を用いてもよい。
本発明の実施形態では、3個の逆方向機械翻訳部を備えるものとしたが、これに限定するものではなく、n個(n≧2)の逆方向機械翻訳部を備えるものであればよい。
本発明の実施形態では、各パラフレーズ部は、元の文から9個の文を生成することによって10個の文を出力したが、これに限定するものではなく、m個(m≧2)の文を出力するものであればよい。
(1) 実験1(複数の逆方向翻訳文を用いた評価方法の有効性について)
実験1では、順方向機械翻訳部が出力した順方向翻訳文を、評価者がA〜Dの4段階にランク付けを行なった。これは、従来の第1の評価方法に相当する。ここで、Aランクは、「情報および文法において問題なし」を表わし、Bランクは、「重要でない情報が抜けていたり、文法に欠陥があるが、簡単に理解できる」を表わし、Cランクは、「不完全だが、努力すれば理解でき、容認可能」を表わし、Dランクは、「重要な情報が誤訳されているため、意味不明」を表わす。
つまり、順方向機械翻訳部としていずれの翻訳エンジンを用いても、逆方向機械翻訳装置をマルチMTにすると、単一の逆方向機械翻訳装置(HPAT、SAT、TDMT)にするよりも、確率P(Smatch|RA)が少なくとも0.1ほど高くなる。
実験2では、順方向機械翻訳部が出力した順方向翻訳文を、評価者がA〜Dの4ランクで主観評価を行なった。この方法は、従来の第1の評価方法に相当する。ここで、Aランクに対してランクFR=3を割当て、Bランクに対してランクFR=2を割当て、Cランクに対してランクFR=1を割当て、Dランクに対してランクFR=0を割当てた。そして、次の(a)〜(c)を行なった。
実験3では、順方向機械翻訳部が出力した順方向翻訳文を、A〜Dの4段階で主観評価し、(2)と同様にしてランクFRを割当てた。この方法は、従来の第1の評価方法に相当する。そして、次の(a)〜(c)を行なった。
Claims (7)
- 第1の言語で表わされた原文を第2の言語に機械翻訳した順方向翻訳文の良否を評価する機械翻訳文の評価装置であって、
原文を取得して第2の言語の順方向翻訳文に機械翻訳する順方向機械翻訳部と、
各々が、前記順方向翻訳文を第1の言語に機械翻訳して逆方向翻訳文を生成するn個(n≧2)の逆方向機械翻訳部と、
前記n個の逆方向翻訳部が生成したn個の逆方向翻訳文と、前記原文との一致または類似度を表わすスコアに基づいて、前記順方向翻訳文の良否を評価する評価部とを備えた機械翻訳文の評価装置。 - 前記評価部は、前記各逆方向翻訳文と前記原文との類似度を表わすスコアを算出し、算出した最大のスコアを出力する、請求項1記載の機械翻訳文の評価装置。
- 前記評価部は、前記各逆方向翻訳文と前記原文との類似度を表わすスコアを算出し、算出した最大のスコアを有する逆方向翻訳文を前記原文とともに出力する、請求項1記載の機械翻訳文の評価装置。
- 前記評価部は、前記各逆方向翻訳文について、前記原文と完全一致するか否かを判定し、前記n個の逆方向翻訳文のうち完全一致するものがあるか否かを出力する、請求項1記載の機械翻訳文の評価装置。
- 前記順方向翻訳文のパラフレーズを行なって、m個(m≧2)の順方向翻訳文を得るパラフレーズ部をさらに備え、
前記n個の逆方向翻訳部の各々は、前記m個の順方向翻訳文を第1の言語に機械翻訳して、m個の逆方向翻訳文を生成し、
前記評価部は、前記n個の逆方向翻訳部が生成する(n×m)個の逆方向翻訳文と前記原文との一致または類似度を表わすスコアに基づいて、前記順方向翻訳文の良否を評価する、請求項1記載の機械翻訳文の評価装置。 - 各々が、前記逆方向翻訳文のパラフレーズを行なってm個(m≧2)の逆方向翻訳文を得るn個のパラフレーズ部をさらに備え、
前記評価部は、前記n個のパラフレーズ部による(n×m)個の逆方向翻訳文と、前記原文との一致または類似度を表わすスコアに基づいて、前記順方向翻訳文の良否を評価する、請求項1記載の機械翻訳文の評価装置。 - 原文のパラフレーズを行なって、m個(m≧2)の原文を得るパラフレーズ部をさらに備え、
前記評価部は、前記n個の逆方向翻訳文と前記m個の原文との一致または類似度を表わすスコアに基づいて、前記順方向翻訳文の良否を評価する、請求項1記載の機械翻訳文の評価装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003307240A JP3936687B2 (ja) | 2003-08-29 | 2003-08-29 | 機械翻訳文の評価方法、および機械翻訳文の評価装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003307240A JP3936687B2 (ja) | 2003-08-29 | 2003-08-29 | 機械翻訳文の評価方法、および機械翻訳文の評価装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005078318A JP2005078318A (ja) | 2005-03-24 |
JP3936687B2 true JP3936687B2 (ja) | 2007-06-27 |
Family
ID=34410083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003307240A Expired - Fee Related JP3936687B2 (ja) | 2003-08-29 | 2003-08-29 | 機械翻訳文の評価方法、および機械翻訳文の評価装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3936687B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006024454A1 (en) * | 2004-08-31 | 2006-03-09 | Techmind S.R.L. | Method for automatic translation from a first language to a second language and/or for processing functions in integrated-circuit processing units, and apparatus for performing the method |
JP2016071439A (ja) | 2014-09-26 | 2016-05-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 翻訳方法及び翻訳システム |
US9836457B2 (en) | 2015-05-25 | 2017-12-05 | Panasonic Intellectual Property Corporation Of America | Machine translation method for performing translation between languages |
JP6364629B2 (ja) | 2016-07-08 | 2018-08-01 | パナソニックIpマネジメント株式会社 | 翻訳装置および翻訳方法 |
US10679014B2 (en) | 2017-06-08 | 2020-06-09 | Panasonic Intellectual Property Management Co., Ltd. | Method for providing translation information, non-transitory computer-readable recording medium, and translation information providing apparatus |
KR102424540B1 (ko) | 2017-10-16 | 2022-07-25 | 삼성전자주식회사 | 문장 생성 모델의 업데이트 방법 및 문장 생성 장치 |
JP7160327B2 (ja) * | 2017-11-07 | 2022-10-25 | アイビーリサーチ株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN111680525B (zh) * | 2020-06-09 | 2024-03-26 | 语联网(武汉)信息技术有限公司 | 基于逆向差异识别的人机共译方法与系统 |
-
2003
- 2003-08-29 JP JP2003307240A patent/JP3936687B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005078318A (ja) | 2005-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11144729B2 (en) | Summary generation method and summary generation apparatus | |
US8209163B2 (en) | Grammatical element generation in machine translation | |
JP2008276517A (ja) | 訳文評価装置、訳文評価方法およびプログラム | |
US20090234634A1 (en) | Method for Automatically Modifying A Machine Translation and A System Therefor | |
KR20220002068A (ko) | 회의 요록 생성 방법, 장치, 전자 장치 및 판독 가능 저장 매체 | |
US20090012776A1 (en) | Apparatus, method, and computer program product for machine translation | |
JP2015176099A (ja) | 対話システム構築支援装置、方法、及びプログラム | |
JP2006252380A (ja) | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム | |
WO2021136453A1 (zh) | 应急预案辅助信息获取方法、装置及设备 | |
US11868718B2 (en) | Technology name/service name generation device and method therefor | |
Wu et al. | Good for misconceived reasons: An empirical revisiting on the need for visual context in multimodal machine translation | |
US11227116B2 (en) | Translation device, translation method, and program | |
KR20210035721A (ko) | 다중-언어 코퍼스를 이용하여 기계번역 하는 방법 및 이를 구현한 시스템 | |
US20200311350A1 (en) | Generating method, learning method, generating apparatus, and non-transitory computer-readable storage medium for storing generating program | |
KR101709693B1 (ko) | 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법 | |
JP3936687B2 (ja) | 機械翻訳文の評価方法、および機械翻訳文の評価装置 | |
KR20160133349A (ko) | 구 표 생성 방법 및 구 표를 이용한 기계 번역 방법 | |
JP2009151777A (ja) | 音声言語パラレルコーパスのアライメント方法及び装置 | |
KR20220071017A (ko) | 문맥의존 철자오류 교정 테스트 문서 생성을 위한 시스템 및 방법 | |
US11907656B2 (en) | Machine based expansion of contractions in text in digital media | |
JP2008225963A (ja) | 機械翻訳装置、置換辞書生成装置、機械翻訳方法、置換辞書生成方法、及びプログラム | |
JP5230927B2 (ja) | 問題自動作成装置、問題自動作成方法、及びコンピュータプログラム | |
CN111507113B (zh) | 一种机器辅助人工翻译的方法和装置 | |
Soh et al. | A review of Mandarin speech recognition test materials for use in Singapore | |
Stodden | Reproduction of German Text Simplification Systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20061003 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061018 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070110 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070305 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070313 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070323 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3936687 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110330 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120330 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130330 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140330 Year of fee payment: 7 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |