JP2019003552A - 処理方法、処理装置、及び処理プログラム - Google Patents
処理方法、処理装置、及び処理プログラム Download PDFInfo
- Publication number
- JP2019003552A JP2019003552A JP2017119766A JP2017119766A JP2019003552A JP 2019003552 A JP2019003552 A JP 2019003552A JP 2017119766 A JP2017119766 A JP 2017119766A JP 2017119766 A JP2017119766 A JP 2017119766A JP 2019003552 A JP2019003552 A JP 2019003552A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- translation
- word
- bilingual
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/49—Data-driven translation using very large corpora, e.g. the web
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/045—Explanation of inference; Explainable artificial intelligence [XAI]; Interpretable artificial intelligence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/53—Processing of non-Latin text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】翻訳処理装置1は、第1言語で記述された第1文と、第2言語による第1文の翻訳文である第1翻訳文との組である第1対訳データを取得する取得部11と、第1文及び第1翻訳文に含まれる語句に基づき、第1対訳データが誤訳可能性のある対訳データであるか否かを評価する評価部12と、評価の結果に基づく情報を出力する出力部13とを備え、評価部12は、(1)第1文に、第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第1判定、及び、(2)第1翻訳文に、第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第2判定、の結果に基づき、第1対訳データが誤訳可能性のある対訳データであるか否かを評価する。
【選択図】図1
Description
従来の機械翻訳システムは、近年目覚しい性能向上を示す一方で、場合によっては論外な翻訳結果を出力することがある。例えば、ごくまれではあるが、「右」の意味を示す第1言語を「左」の意味を示す第2言語に、あるいはその反対に「左」の意味の第1言語を「右」の意味の第2言語に翻訳すること(以下、「左右対義誤翻訳」という)がある。これは、道案内用途や作業指示用途での使用においては、致命的な問題である。
図1は、本開示の実施の形態1における翻訳処理装置の構成の一例を示すブロック図である。図1に示す翻訳処理装置1は、評価装置10及び翻訳装置20を備える。評価装置10は、取得部11、評価部12、及び出力部13を備える。翻訳装置20は、対訳コーパス記憶部21、生成部22、訓練用対訳コーパス記憶部23、学習部24、及び翻訳モデル記憶部25を備える。
図5は、本開示の実施の形態2における翻訳処理装置の構成の一例を示すブロック図である。図5に示す翻訳処理装置1aは、評価装置10a及び翻訳装置20aを備える。評価装置10aは、取得部11a、評価部12a、及び出力部13aを備える。翻訳装置20aは、生成部22a、入力部26、翻訳部27、及び表示部28を備える。
10、10a 評価装置
20、20a 翻訳装置
11、11a 取得部
12、12a 評価部
13、13a 出力部
21 対訳コーパス記憶部
22、22a 生成部
23 訓練用対訳コーパス記憶部
24 学習部
25 翻訳モデル記憶部
26 入力部
27 翻訳部
28 表示部
Claims (17)
- 第1言語で記述された入力文と前記入力文の第2言語への翻訳文とを含む対訳データを処理する処理装置における処理方法であって、
前記第1言語で記述された第1文と、前記第2言語による前記第1文の翻訳文である第1翻訳文との組である第1対訳データを取得し、
前記第1文及び前記第1翻訳文に含まれる語句に基づき、前記第1対訳データが誤訳可能性のある対訳データであるか否かを評価し、
前記評価の結果に基づく情報を出力し、
前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第1判定、及び、(2)前記第1翻訳文に、前記第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第2判定、の結果に基づき行われる、
処理方法。 - 前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語が存在することの第1判定、及び、(2)前記第1翻訳文に、前記第1の意味を有する単語及びその対義語が存在することの第2判定、の結果に基づき行われる、
請求項1に記載の処理方法。 - 前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語のうち一方の第1の単語が存在し且つ他方の第2の単語が存在しないことの第1判定、及び、(2)前記第1翻訳文に、前記第1の単語の翻訳である第1の翻訳単語が存在せず且つ前記第2の単語の翻訳である第2の翻訳単語が存在することの第2判定、の結果に基づき行われる、
請求項1に記載の処理方法。 - 前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語のうち一方の第1の単語が存在することの第1判定、及び、(2)前記第1翻訳文に、前記第1の単語の翻訳である第1の翻訳単語が存在しないことの第2判定、の結果に基づき行われる、
請求項1に記載の処理方法。 - 前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語のうち一方の第1の単語が存在しないことの第1判定、及び、(2)前記第1翻訳文に、前記第1の単語の翻訳である第1の翻訳単語が存在することの第2判定、の結果に基づき行われる、
請求項1に記載の処理方法。 - 前記取得は、
前記第1対訳データを対訳コーパス記憶部から取得し、前記対訳コーパス記憶部は、前記第1言語で記述された文と、前記第1言語で記述された文の前記第2言語による翻訳文との対を複数含む対訳コーパスを記憶する、
請求項1に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、訓練用対訳コーパスを生成する、
請求項6に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記訓練用対訳コーパスとして採用しないことにより、前記訓練用対訳コーパスを生成する、
請求項7に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、前記誤訳可能性のない対訳データを前記訓練用対訳コーパスとして採用し、前記誤訳可能性のある対訳データを前記誤訳可能性がないように修正した修正対訳データを前記訓練用対訳コーパスとして採用することにより、前記訓練用対訳コーパスを生成する、
請求項7に記載の処理方法。 - 前記訓練用対訳コーパスを用いて翻訳モデルを学習する、
請求項7に記載の処理方法。 - 前記取得は
前記第1文を前記第1翻訳文に翻訳する翻訳装置から前記第1対訳データを取得する、
請求項1に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、アラート情報を生成して表示する、
請求項11に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、前記アラート情報として、前記誤訳可能性として第1の可能性を示す第1アラート情報と、前記誤訳可能性として前記第1の可能性より高い第2の可能性を示す第2アラート情報とを生成する、
請求項12に記載の処理方法。 - 前記出力は、
前記評価の結果に基づき、前記アラート情報に付加して、参考翻訳例を生成して表示する、
請求項12に記載の処理方法。 - 前記第1文又は前記第1翻訳文に含まれる語句は、「右」又「左」である、
請求項1に記載の処理方法。 - 第1言語で記述された入力文と前記入力文の第2言語への翻訳文とを含む対訳データを処理する処理装置であって、
前記第1言語で記述された第1文と、前記第2言語による前記第1文の翻訳文である第1翻訳文との組である第1対訳データを取得する取得部と、
前記第1文及び前記第1翻訳文に含まれる語句に基づき、前記第1対訳データが誤訳可能性のある対訳データであるか否かを評価する評価部と、
前記評価の結果に基づく情報を出力する出力部とを備え、
前記評価部は、(1)前記第1文に、第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第1判定、及び、(2)前記第1翻訳文に、前記第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第2判定、の結果に基づき、前記第1対訳データが誤訳可能性のある対訳データであるか否かを評価する、
処理装置。 - 第1言語で記述された入力文と前記入力文の第2言語への翻訳文とを含む対訳データを処理する処理装置として、コンピュータを機能させるための処理プログラムであって、
前記コンピュータに、
前記第1言語で記述された第1文と、前記第2言語による前記第1文の翻訳文である第1翻訳文との組である第1対訳データを取得し、
前記第1文及び前記第1翻訳文に含まれる語句に基づき、前記第1対訳データが誤訳可能性のある対訳データであるか否かを評価し、
前記評価の結果に基づく情報を出力する、
処理を実行させ、
前記評価は、
(1)前記第1文に、第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第1判定、及び、(2)前記第1翻訳文に、前記第1の意味を有する単語及びその対義語の少なくとも一方が存在するか否かの第2判定、の結果に基づき行われる、
処理プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017119766A JP6775202B2 (ja) | 2017-06-19 | 2017-06-19 | 処理方法、処理装置、及び処理プログラム |
US15/962,628 US10402497B2 (en) | 2017-06-19 | 2018-04-25 | Processing method, processing apparatus, and recording medium |
CN201810584251.7A CN109145311B (zh) | 2017-06-19 | 2018-06-08 | 处理方法、处理装置以及处理程序 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017119766A JP6775202B2 (ja) | 2017-06-19 | 2017-06-19 | 処理方法、処理装置、及び処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019003552A true JP2019003552A (ja) | 2019-01-10 |
JP6775202B2 JP6775202B2 (ja) | 2020-10-28 |
Family
ID=64658119
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017119766A Active JP6775202B2 (ja) | 2017-06-19 | 2017-06-19 | 処理方法、処理装置、及び処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US10402497B2 (ja) |
JP (1) | JP6775202B2 (ja) |
CN (1) | CN109145311B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020140709A (ja) * | 2019-02-26 | 2020-09-03 | 株式会社リコー | ニューラル機械翻訳モデルの訓練方法、装置及び記憶媒体 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6775202B2 (ja) * | 2017-06-19 | 2020-10-28 | パナソニックIpマネジメント株式会社 | 処理方法、処理装置、及び処理プログラム |
US20230169388A1 (en) * | 2018-06-22 | 2023-06-01 | Meta Platforms, Inc. | Systems and methods for training a machine learning model for a second language based on a machine learning model for a first language |
CN113947092A (zh) * | 2020-07-16 | 2022-01-18 | 阿里巴巴集团控股有限公司 | 一种翻译方法及装置 |
JP7164651B2 (ja) * | 2020-09-07 | 2022-11-01 | バイドゥ オンライン ネットワーク テクノロジー(ペキン) カンパニー リミテッド | 翻訳方法、装置、電子機器及びコンピュータプログラム製品 |
KR102418873B1 (ko) * | 2021-08-24 | 2022-07-08 | 아부하킴 주식회사 | 아랍어 사용자를 위한 인터페이스 변환 기술에 기초한 전자 상거래 서비스 제공 방법 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148756A (ja) * | 1998-11-12 | 2000-05-30 | Matsushita Electric Ind Co Ltd | 対訳文誤り検出装置 |
JP2005092253A (ja) * | 2003-09-11 | 2005-04-07 | Fuji Xerox Co Ltd | 機械学習用データ生成システム及び機械学習用データ生成方法、類似文書対生成システム及び類似文書対生成方法、並びにコンピュータ・プログラム |
US20120284015A1 (en) * | 2008-01-28 | 2012-11-08 | William Drewes | Method for Increasing the Accuracy of Subject-Specific Statistical Machine Translation (SMT) |
JP2014505939A (ja) * | 2011-01-05 | 2014-03-06 | グーグル・インコーポレーテッド | テキスト入力を容易にするための方法およびシステム |
US20140172411A1 (en) * | 2012-12-17 | 2014-06-19 | Electronics And Telecommunications Research Institute | Apparatus and method for verifying context |
JP2017058865A (ja) * | 2015-09-15 | 2017-03-23 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0715691B2 (ja) * | 1988-09-22 | 1995-02-22 | 日本電気株式会社 | 自動翻訳装置 |
US7539619B1 (en) * | 2003-09-05 | 2009-05-26 | Spoken Translation Ind. | Speech-enabled language translation system and method enabling interactive user supervision of translation and speech recognition accuracy |
EP1784746A1 (en) * | 2004-08-31 | 2007-05-16 | Techmind S.R.L. | Method for automatic translation from a first language to a second language and/or for processing functions in integrated-circuit processing units, and apparatus for performing the method |
CN100474301C (zh) * | 2005-09-08 | 2009-04-01 | 富士通株式会社 | 基于数据挖掘获取词或词组单元译文信息的系统和方法 |
CN101187922A (zh) * | 2006-11-17 | 2008-05-28 | 徐赞国 | 精确机器翻译的方法及其装置 |
WO2009149549A1 (en) * | 2008-06-09 | 2009-12-17 | National Research Council Of Canada | Method and system for using alignment means in matching translation |
JP2013114433A (ja) * | 2011-11-28 | 2013-06-10 | Toshiba Corp | 電子機器及び機械翻訳方法 |
KR102115645B1 (ko) * | 2013-06-03 | 2020-05-26 | 엠지 아이피 홀딩스, 엘엘씨 | 다중 사용자 다중 언어 통신 시스템 및 방법 |
JP2016194822A (ja) | 2015-03-31 | 2016-11-17 | 株式会社エクシング | サーバシステム及びそのプログラム、並びにエラーチェック方法 |
JP6583686B2 (ja) * | 2015-06-17 | 2019-10-02 | パナソニックIpマネジメント株式会社 | 意味情報生成方法、意味情報生成装置、およびプログラム |
KR102251832B1 (ko) * | 2016-06-16 | 2021-05-13 | 삼성전자주식회사 | 번역 서비스를 제공하는 전자 장치 및 방법 |
JP6775202B2 (ja) * | 2017-06-19 | 2020-10-28 | パナソニックIpマネジメント株式会社 | 処理方法、処理装置、及び処理プログラム |
JP7030434B2 (ja) * | 2017-07-14 | 2022-03-07 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 翻訳方法、翻訳装置及び翻訳プログラム |
-
2017
- 2017-06-19 JP JP2017119766A patent/JP6775202B2/ja active Active
-
2018
- 2018-04-25 US US15/962,628 patent/US10402497B2/en active Active
- 2018-06-08 CN CN201810584251.7A patent/CN109145311B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000148756A (ja) * | 1998-11-12 | 2000-05-30 | Matsushita Electric Ind Co Ltd | 対訳文誤り検出装置 |
JP2005092253A (ja) * | 2003-09-11 | 2005-04-07 | Fuji Xerox Co Ltd | 機械学習用データ生成システム及び機械学習用データ生成方法、類似文書対生成システム及び類似文書対生成方法、並びにコンピュータ・プログラム |
US20120284015A1 (en) * | 2008-01-28 | 2012-11-08 | William Drewes | Method for Increasing the Accuracy of Subject-Specific Statistical Machine Translation (SMT) |
JP2014505939A (ja) * | 2011-01-05 | 2014-03-06 | グーグル・インコーポレーテッド | テキスト入力を容易にするための方法およびシステム |
US20140172411A1 (en) * | 2012-12-17 | 2014-06-19 | Electronics And Telecommunications Research Institute | Apparatus and method for verifying context |
JP2017058865A (ja) * | 2015-09-15 | 2017-03-23 | 株式会社東芝 | 機械翻訳装置、機械翻訳方法および機械翻訳プログラム |
Non-Patent Citations (1)
Title |
---|
隅田 英一郎 外2名: "機械翻訳システム評価法の最前線", 情報処理, vol. 第46巻第5号, JPN6020034823, 15 May 2005 (2005-05-15), JP, pages 552 - 557, ISSN: 0004346662 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020140709A (ja) * | 2019-02-26 | 2020-09-03 | 株式会社リコー | ニューラル機械翻訳モデルの訓練方法、装置及び記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
CN109145311B (zh) | 2024-04-26 |
JP6775202B2 (ja) | 2020-10-28 |
CN109145311A (zh) | 2019-01-04 |
US20180365234A1 (en) | 2018-12-20 |
US10402497B2 (en) | 2019-09-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019003552A (ja) | 処理方法、処理装置、及び処理プログラム | |
Derczynski et al. | Microblog-genre noise and impact on semantic annotation accuracy | |
US10762293B2 (en) | Using parts-of-speech tagging and named entity recognition for spelling correction | |
US9916306B2 (en) | Statistical linguistic analysis of source content | |
JP2018037095A (ja) | フレーズに基づく辞書抽出及び翻訳品質評価 | |
US9646512B2 (en) | System and method for automated teaching of languages based on frequency of syntactic models | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
US20180260390A1 (en) | Translation assistance system, translation assitance method and translation assistance program | |
JP2018206356A (ja) | 翻訳情報提供方法、翻訳情報提供プログラム、及び翻訳情報提供装置 | |
US20190303437A1 (en) | Status reporting with natural language processing risk assessment | |
CN107870900B (zh) | 提供翻译文的方法、装置以及记录介质 | |
Ganfure et al. | Design and implementation of morphology based spell checker | |
US10878189B2 (en) | Method for correcting a mistyped word resulting from at least one of an inaccurate keyboard input and a wrong keyboard layout and system implementing thereof | |
US20180341646A1 (en) | Translated-clause generating method, translated-clause generating apparatus, and recording medium | |
Sharma et al. | Word prediction system for text entry in Hindi | |
JP2017010274A (ja) | 対応付け装置及びプログラム | |
WO2015162464A1 (en) | Method and system for generating a definition of a word from multiple sources | |
US20120265520A1 (en) | Text processor and method of text processing | |
JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
Liu et al. | A hybrid ranking approach to Chinese spelling check | |
Naemi et al. | Informal-to-formal word conversion for persian language using natural language processing techniques | |
AlShenaifi et al. | ARIB@ QALB-2015 shared task: a hybrid cascade model for Arabic spelling error detection and correction | |
CN106776533B (zh) | 用于分析一段文本的方法和系统 | |
JP2010170303A (ja) | 機械翻訳装置及びプログラム | |
Fan et al. | Automatic extraction of bilingual terms from a chinese-japanese parallel corpus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200106 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200915 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200918 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6775202 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |