JP7030434B2 - 翻訳方法、翻訳装置及び翻訳プログラム - Google Patents
翻訳方法、翻訳装置及び翻訳プログラム Download PDFInfo
- Publication number
- JP7030434B2 JP7030434B2 JP2017137828A JP2017137828A JP7030434B2 JP 7030434 B2 JP7030434 B2 JP 7030434B2 JP 2017137828 A JP2017137828 A JP 2017137828A JP 2017137828 A JP2017137828 A JP 2017137828A JP 7030434 B2 JP7030434 B2 JP 7030434B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- text
- sentence
- translated
- language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
- G06F40/56—Natural language generation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
Description
近年、第1言語の文を第1言語と異なる第2言語の文に翻訳する機械翻訳装置が研究及び開発されている。このような機械翻訳装置の翻訳性能の向上には、翻訳に利用可能な多数の例文を収集した対訳コーパスが必要となる。
図1は、本開示の実施の形態1における翻訳システムの全体構成を示す図である。
上記の実施の形態1では、原文と翻訳文とをユーザに提示し、翻訳文が正しく翻訳されているか否かのユーザによる判定結果の入力を受け付けているが、実施の形態2では、翻訳文を第1言語に翻訳した逆翻訳文を生成し、原文と逆翻訳文とをユーザに提示し、提示した原文と逆翻訳文とに基づいて、翻訳文が正しく翻訳されているか否かのユーザによる判定結果の入力を受け付ける。
上記の実施の形態2では、原文と逆翻訳文とをユーザに提示し、提示した原文と逆翻訳文とに基づいて、翻訳文が正しく翻訳されているか否かのユーザによる判定結果の入力を受け付けているが、実施の形態3では、原文の意味を解析するとともに、逆翻訳文の意味を解析し、原文の意味と逆翻訳文の意味とが同じであるか否かを判断し、原文の意味と逆翻訳文の意味とが同じではないと判断した場合、対訳データを生成する。
2 翻訳装置
3 端末装置
4 ネットワーク
11 翻訳対象取得部
12,12a 機械翻訳モデル記憶部
13,13a 機械翻訳部
14,14a 翻訳結果送信部
15,15a 判定結果受信部
16,16a,16b 誤訳判断部
17 対訳データ送信部
18,18a 修正対訳データ受信部
19,19a 対訳コーパス記憶部
20,20a 対訳コーパス登録部
21,21a 機械モデル学習部
22,22a 対訳データ記憶部
23 翻訳結果解析部
24 翻訳結果送信部
Claims (5)
- 第1言語と、前記第1の言語とは異なる第2言語との間の翻訳処理を行う翻訳装置における翻訳方法であって、
翻訳対象である前記第1言語の原文を取得し、
前記原文を前記第2言語に翻訳した翻訳文を生成し、
前記翻訳文を前記第1言語に翻訳した逆翻訳文を生成し、
前記原文と前記逆翻訳文とをユーザに提示し、
提示した前記原文と前記逆翻訳文とに基づいて、前記翻訳文が正しく翻訳されているか否かの前記ユーザによる判定結果の入力を受け付け、
前記翻訳文が正しく翻訳されていないという判定結果が受け付けられた場合、前記原文と前記翻訳文に対応する誤訳文と前記逆翻訳文とを含む対訳データを生成し、
前記対訳データを少なくとも1つの端末装置へ送信し、
前記誤訳文を正しく修正した修正翻訳文と、前記逆翻訳文を正しく修正した修正逆翻訳文と、前記原文とを含む少なくとも1つの修正対訳データを前記少なくとも1つの端末装置から受信し、
受信した前記少なくとも1つの修正対訳データを、前記第1言語の文と前記第2言語の翻訳文とを対にして記憶する記憶部に登録し、
前記原文を前記第2言語に翻訳するための第1機械翻訳モデルと、前記翻訳文を前記第1言語に翻訳するための第2機械翻訳モデルとを、前記少なくとも1つの修正対訳データにより学習する、
翻訳方法。 - 前記少なくとも1つの修正対訳データは、前記修正翻訳文と、前記原文とは意味的に同じであり表記的に異なる文章である修正原文とを含む、
請求項1記載の翻訳方法。 - さらに、受信した前記少なくとも1つの修正対訳データに含まれる前記修正原文の意味を解析し、
同じ意味を有する前記修正原文を含む修正対訳データの数が、所定の数以上である場合、当該修正対訳データを前記記憶部に登録する、
請求項2記載の翻訳方法。 - 第1言語と、前記第1の言語とは異なる第2言語との間の翻訳処理を行う翻訳装置であって、
前記第1言語の文と前記第2言語の翻訳文とを対にして記憶する記憶部と、
翻訳対象である前記第1言語の原文を取得する取得部と、
前記原文を前記第2言語に翻訳した翻訳文を生成する翻訳文生成部と、
前記翻訳文を前記第1言語に翻訳した逆翻訳文を生成する逆翻訳文生成部と、
前記原文と前記逆翻訳文とをユーザに提示する提示部と、
提示した前記原文と前記逆翻訳文とに基づいて、前記翻訳文が正しく翻訳されているか否かの前記ユーザによる判定結果の入力を受け付ける入力受付部と、
前記翻訳文が正しく翻訳されていないという判定結果が受け付けられた場合、前記原文と前記翻訳文に対応する誤訳文と前記逆翻訳文とを含む対訳データを生成する対訳データ生成部と、
前記対訳データを少なくとも1つの端末装置へ送信する送信部と、
前記誤訳文を正しく修正した修正翻訳文と、前記逆翻訳文を正しく修正した修正逆翻訳文と、前記原文とを含む少なくとも1つの修正対訳データを前記少なくとも1つの端末装置から受信する受信部と、
受信した前記少なくとも1つの修正対訳データを前記記憶部に登録する登録部と、
前記原文を前記第2言語に翻訳するための第1機械翻訳モデルと、前記翻訳文を前記第1言語に翻訳するための第2機械翻訳モデルとを、前記少なくとも1つの修正対訳データにより学習する学習部と、
を備える翻訳装置。 - 第1言語と、前記第1の言語とは異なる第2言語との間の翻訳処理を行うための翻訳プログラムであって、
コンピュータを、
前記第1言語の文と前記第2言語の翻訳文とを対にして記憶する記憶部と、
翻訳対象である前記第1言語の原文を取得する取得部と、
前記原文を前記第2言語に翻訳した翻訳文を生成する翻訳文生成部と、
前記翻訳文を前記第1言語に翻訳した逆翻訳文を生成する逆翻訳文生成部と、
前記原文と前記逆翻訳文とをユーザに提示する提示部と、
提示した前記原文と前記逆翻訳文とに基づいて、前記翻訳文が正しく翻訳されているか否かの前記ユーザによる判定結果の入力を受け付ける入力受付部と、
前記翻訳文が正しく翻訳されていないという判定結果が受け付けられた場合、前記原文と前記翻訳文に対応する誤訳文と前記逆翻訳文とを含む対訳データを生成する対訳データ生成部と、
前記対訳データを少なくとも1つの端末装置へ送信する送信部と、
前記誤訳文を正しく修正した修正翻訳文と、前記逆翻訳文を正しく修正した修正逆翻訳文と、前記原文とを含む少なくとも1つの修正対訳データを前記少なくとも1つの端末装置から受信する受信部と、
受信した前記少なくとも1つの修正対訳データを前記記憶部に登録する登録部と、
前記原文を前記第2言語に翻訳するための第1機械翻訳モデルと、前記翻訳文を前記第1言語に翻訳するための第2機械翻訳モデルとを、前記少なくとも1つの修正対訳データにより学習する学習部として機能させる、
翻訳プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137828A JP7030434B2 (ja) | 2017-07-14 | 2017-07-14 | 翻訳方法、翻訳装置及び翻訳プログラム |
US16/013,508 US10832012B2 (en) | 2017-07-14 | 2018-06-20 | Method executed in translation system and including generation of translated text and generation of parallel translation data |
CN201810735086.0A CN109255129B (zh) | 2017-07-14 | 2018-07-06 | 翻译方法、翻译装置以及记录介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137828A JP7030434B2 (ja) | 2017-07-14 | 2017-07-14 | 翻訳方法、翻訳装置及び翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020950A JP2019020950A (ja) | 2019-02-07 |
JP7030434B2 true JP7030434B2 (ja) | 2022-03-07 |
Family
ID=64999537
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017137828A Active JP7030434B2 (ja) | 2017-07-14 | 2017-07-14 | 翻訳方法、翻訳装置及び翻訳プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10832012B2 (ja) |
JP (1) | JP7030434B2 (ja) |
CN (1) | CN109255129B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6775202B2 (ja) * | 2017-06-19 | 2020-10-28 | パナソニックIpマネジメント株式会社 | 処理方法、処理装置、及び処理プログラム |
JP7170984B2 (ja) * | 2018-03-02 | 2022-11-15 | 国立研究開発法人情報通信研究機構 | 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法 |
US10929617B2 (en) * | 2018-07-20 | 2021-02-23 | International Business Machines Corporation | Text analysis in unsupported languages using backtranslation |
CN111508484B (zh) * | 2019-01-31 | 2024-04-19 | 阿里巴巴集团控股有限公司 | 语音数据的处理方法及装置 |
JP7322428B2 (ja) * | 2019-02-28 | 2023-08-08 | 富士フイルムビジネスイノベーション株式会社 | 学習装置及び学習プログラム並びに文生成装置及び文生成プログラム |
US20220138088A1 (en) * | 2019-03-08 | 2022-05-05 | Micro Focus Llc | Internationalization of automated test scripts |
US11507760B2 (en) | 2019-06-07 | 2022-11-22 | Semiconductor Energy Laboratory Co., Ltd. | Machine translation method, machine translation system, program, and non-transitory computer-readable storage medium |
JP2021018442A (ja) * | 2019-07-17 | 2021-02-15 | 日本電信電話株式会社 | 文比較装置、文比較方法、及び文比較プログラム |
WO2021090681A1 (ja) * | 2019-11-07 | 2021-05-14 | ソニー株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
CN111368561A (zh) | 2020-02-28 | 2020-07-03 | 北京字节跳动网络技术有限公司 | 平行语料获取方法、装置、电子设备、及存储介质 |
CN112215015B (zh) * | 2020-09-02 | 2024-09-03 | 文思海辉智科科技有限公司 | 翻译文本修订方法、装置、计算机设备和存储介质 |
CN112434537A (zh) * | 2020-11-24 | 2021-03-02 | 掌阅科技股份有限公司 | 翻译文本一致性校验方法、计算设备及存储介质 |
CN118428376B (zh) * | 2024-07-05 | 2024-09-27 | 中科云谷科技有限公司 | 用于翻译工程资料的方法、装置及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008123234A (ja) | 2006-11-10 | 2008-05-29 | Nec Corp | 翻訳サーバ装置、翻訳システム、翻訳方法、翻訳プログラム |
JP2009122989A (ja) | 2007-11-15 | 2009-06-04 | Junichi Shibuya | 翻訳装置 |
JP2014229122A (ja) | 2013-05-23 | 2014-12-08 | 富士通株式会社 | 翻訳装置、方法、及びプログラム |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU7753998A (en) * | 1997-05-28 | 1998-12-30 | Shinar Linguistic Technologies Inc. | Translation system |
JP2004156806A (ja) | 2002-11-05 | 2004-06-03 | Sanyo Electric Co Ltd | 温冷熱システム |
JP3973549B2 (ja) * | 2002-12-19 | 2007-09-12 | 沖電気工業株式会社 | 対訳依存構造対応付け装置、方法及びプログラム、並びに、対訳依存構造対応付けプログラムを記録した記録媒体 |
US7383542B2 (en) * | 2003-06-20 | 2008-06-03 | Microsoft Corporation | Adaptive machine translation service |
US7539619B1 (en) * | 2003-09-05 | 2009-05-26 | Spoken Translation Ind. | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy |
US8898052B2 (en) * | 2006-05-22 | 2014-11-25 | Facebook, Inc. | Systems and methods for training statistical speech translation systems from speech utilizing a universal speech recognizer |
US8972268B2 (en) * | 2008-04-15 | 2015-03-03 | Facebook, Inc. | Enhanced speech-to-speech translation system and methods for adding a new word |
US8078451B2 (en) * | 2006-10-27 | 2011-12-13 | Microsoft Corporation | Interface and methods for collecting aligned editorial corrections into a database |
US20090326913A1 (en) * | 2007-01-10 | 2009-12-31 | Michel Simard | Means and method for automatic post-editing of translations |
US7983897B2 (en) * | 2007-02-14 | 2011-07-19 | Google Inc. | Machine translation feedback |
CN101034395A (zh) * | 2007-03-30 | 2007-09-12 | 传神联合(北京)信息技术有限公司 | 一种待译文件处理系统及使用这种系统的文件处理方法 |
JP5280642B2 (ja) * | 2007-04-23 | 2013-09-04 | 株式会社船井電機新応用技術研究所 | 翻訳システム及び翻訳プログラム、並びに、対訳データ生成方法 |
US8352244B2 (en) * | 2009-07-21 | 2013-01-08 | International Business Machines Corporation | Active learning systems and methods for rapid porting of machine translation systems to new language pairs or new domains |
JP5014449B2 (ja) * | 2010-02-26 | 2012-08-29 | シャープ株式会社 | 会議システム、情報処理装置、会議支援方法、情報処理方法、及びコンピュータプログラム |
US8930176B2 (en) * | 2010-04-01 | 2015-01-06 | Microsoft Corporation | Interactive multilingual word-alignment techniques |
CN102591856B (zh) * | 2011-01-04 | 2016-09-14 | 杨东佐 | 一种翻译系统及翻译方法 |
CN102043774A (zh) * | 2011-01-13 | 2011-05-04 | 北京交通大学 | 机器翻译测评装置和方法 |
US20130054224A1 (en) * | 2011-08-30 | 2013-02-28 | Dublin City University | Method and system for enhancing text alignment between a source language and a target language during statistical machine translation |
KR20130047471A (ko) * | 2011-10-31 | 2013-05-08 | 한국전자통신연구원 | 자동번역 시스템의 패러프레이징 데이터 구축방법 |
JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
CN103793322A (zh) * | 2012-11-05 | 2014-05-14 | 深圳中兴网信科技有限公司 | 一种针对软件本地化测试中翻译问题的检测方法及系统 |
US9152622B2 (en) * | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
CN103150382B (zh) * | 2013-03-14 | 2015-04-01 | 中国科学院计算技术研究所 | 基于开放知识库的短文本语义概念自动化扩展方法及系统 |
CN103440314A (zh) * | 2013-08-27 | 2013-12-11 | 北京工业大学 | 一种基于Ontology的语义检索方法 |
US9213694B2 (en) * | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
CN104391852B (zh) * | 2014-09-15 | 2017-12-29 | 国家电网公司 | 一种建立关键词词库的方法和装置 |
US9442922B2 (en) * | 2014-11-18 | 2016-09-13 | Xerox Corporation | System and method for incrementally updating a reordering model for a statistical machine translation system |
CN104731777B (zh) * | 2015-03-31 | 2019-02-01 | 网易有道信息技术(北京)有限公司 | 一种译文评价方法及装置 |
US9836457B2 (en) * | 2015-05-25 | 2017-12-05 | Panasonic Intellectual Property Corporation Of America | Machine translation method for performing translation between languages |
CN106383818A (zh) * | 2015-07-30 | 2017-02-08 | 阿里巴巴集团控股有限公司 | 一种机器翻译方法及装置 |
JP6655788B2 (ja) * | 2016-02-01 | 2020-02-26 | パナソニックIpマネジメント株式会社 | 対訳コーパス作成方法、該装置および該プログラムならびに機械翻訳システム |
US10460040B2 (en) * | 2016-06-27 | 2019-10-29 | Facebook, Inc. | Language model using reverse translations |
US10248651B1 (en) * | 2016-11-23 | 2019-04-02 | Amazon Technologies, Inc. | Separating translation correction post-edits from content improvement post-edits in machine translated content |
US10679014B2 (en) * | 2017-06-08 | 2020-06-09 | Panasonic Intellectual Property Management Co., Ltd. | Method for providing translation information, non-transitory computer-readable recording medium, and translation information providing apparatus |
-
2017
- 2017-07-14 JP JP2017137828A patent/JP7030434B2/ja active Active
-
2018
- 2018-06-20 US US16/013,508 patent/US10832012B2/en active Active
- 2018-07-06 CN CN201810735086.0A patent/CN109255129B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008123234A (ja) | 2006-11-10 | 2008-05-29 | Nec Corp | 翻訳サーバ装置、翻訳システム、翻訳方法、翻訳プログラム |
JP2009122989A (ja) | 2007-11-15 | 2009-06-04 | Junichi Shibuya | 翻訳装置 |
JP2014229122A (ja) | 2013-05-23 | 2014-12-08 | 富士通株式会社 | 翻訳装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN109255129A (zh) | 2019-01-22 |
US20190018842A1 (en) | 2019-01-17 |
JP2019020950A (ja) | 2019-02-07 |
US10832012B2 (en) | 2020-11-10 |
CN109255129B (zh) | 2023-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7030434B2 (ja) | 翻訳方法、翻訳装置及び翻訳プログラム | |
KR102401942B1 (ko) | 번역품질 평가 방법 및 장치 | |
US20240078386A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN104731777B (zh) | 一种译文评价方法及装置 | |
CN108351871A (zh) | 通用翻译 | |
CN107239801A (zh) | 视频属性表示学习方法及视频文字描述自动生成方法 | |
CN106383875A (zh) | 基于人工智能的人机交互方法和装置 | |
CN106557452B (zh) | 用于数值字符或字符串的显示方法、装置、设备及系统 | |
US10650195B2 (en) | Translated-clause generating method, translated-clause generating apparatus, and recording medium | |
CN110727417B (zh) | 一种数据处理方法和装置 | |
CN108304376B (zh) | 文本向量的确定方法、装置、存储介质及电子装置 | |
CN102982027A (zh) | 提取文档中内容的方法和装置 | |
KR20210035721A (ko) | 다중-언어 코퍼스를 이용하여 기계번역 하는 방법 및 이를 구현한 시스템 | |
CN111783863A (zh) | 一种图像处理方法、装置、设备以及计算机可读存储介质 | |
JP2019197366A (ja) | コンテンツ評価装置、コンテンツ評価方法、プログラム、および記録媒体 | |
CN110489747A (zh) | 一种图像处理方法、装置、存储介质及电子设备 | |
CN111144140A (zh) | 基于零次学习的中泰双语语料生成方法及装置 | |
CN109710894A (zh) | 文件内容提取方法、设备、装置及计算机可读存储介质 | |
US11531814B2 (en) | Method and device for generating modified statement | |
JPWO2018198807A1 (ja) | 翻訳装置 | |
US20230306196A1 (en) | System and method for spelling correction | |
JP2020149119A (ja) | レコメンド文生成装置、レコメンド文生成方法、及びレコメンド文生成プログラム | |
CN115718904A (zh) | 文本处理方法及装置 | |
US20210312144A1 (en) | Translation device, translation method, and program | |
CN115546815A (zh) | 一种表格识别方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200626 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210531 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220222 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7030434 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |