JP6045948B2 - 機械翻訳装置及び機械翻訳プログラム - Google Patents
機械翻訳装置及び機械翻訳プログラム Download PDFInfo
- Publication number
- JP6045948B2 JP6045948B2 JP2013052709A JP2013052709A JP6045948B2 JP 6045948 B2 JP6045948 B2 JP 6045948B2 JP 2013052709 A JP2013052709 A JP 2013052709A JP 2013052709 A JP2013052709 A JP 2013052709A JP 6045948 B2 JP6045948 B2 JP 6045948B2
- Authority
- JP
- Japan
- Prior art keywords
- answer
- ambiguous
- sentence
- language
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
English)があり、日本語では日本特許情報機構(Japio)(登録商標)による「産業日本語」(http://japio-tjp.org/)がある。
Acrobat(登録商標)が広く知られている。
図1は第1の実施形態に係る機械翻訳装置の構成を示す模式図であり、図2は機械翻訳装置のハードウェア構成を示すブロック図である。機械翻訳装置は、図1に示すように、入力装置10、演算制御装置20、表示装置30及び記憶装置40を備えている。このような機械翻訳装置は、図2に示すように、例えば、入力装置10、演算制御装置20、表示装置30及びハードディスクドライブ(HDD)45を備えて実現してもよい。
features)が第二言語の訳出には必要となる単語及びそのような文構造を集めた文法知識である辞書である。
(http: //chasen.org/~taku/publications/nl138-slide.ppt)、
又は最大エントロピー(ME)法“内元他(1998)「MEによる日本語化係り受け解析」”(http://ci.nii.ac.jp/els/110002934785.pdf?id=ART0003285753&type=pdf&lang=jp&host=cinii&order_no=&ppv_type=0&lang_sw=&no=1360293915&cp=)などが適宜、使用可能となっている。
この場合、Wordなどの文書作成ソフトウェアにより質問文を付与した文書をユーザに提示し、この質問文に対する回答を入力した文書を機械翻訳装置に入力すればよい。これにより、回答付与手段236を省略することが可能となる。
次に、第2の実施形態に係る機械翻訳装置について図1を参照しながら説明する。
この設定は、機械翻訳装置の過剰学習(overlearning)の可能性、ユーザの誤答の可能性、及びユーザの解釈が変化する可能性を考慮している。このような設定は、文書の曖昧性判定の実行前に、例えば図18に示す如き、曖昧性判断設定画面G1により実行可能としている。
次に、第3の実施形態に係る機械翻訳装置について図1を参照しながら説明する。
いずれも”floating …structures”という単語列を含んでいる。
floatingが動名詞であるのか、現在分詞を形容詞的に用いた名詞句であるのか、曖昧となる。前者の解釈では、floatingがhead、後者の解釈では、structuresがheadであることになる。
floating (形容詞) tree-based structureという名詞句(複数形)か」、という質問を付与する。
floating structuresという動名詞(〜すること)か、又は、
floating (形容詞) structureという名詞句(複数形)なのか」、という質問を付与する。
floating (形容詞) structureという名詞句(複数形)なのか、
floating structuresという動名詞(〜すること)か」のように選択肢が逆転する。
単語”transfer”は、動詞の可能性が高いと機械翻訳装置が判定して、文を解析したと仮定する。その場合、”transfer”の主語は、”these”、目的語は名詞”rules”(同じく動詞・名詞同形の単語(三人称現在形の動詞又は名詞複数形)と解釈されている。
”transfer rules”を名詞句として文全体の解析を再度試み、文番号13の文の解析が成功する。ここで蓄えられる知識は、”transfer rules”という並びがあった場合、
”transfer”は名詞の可能性が高いという品詞優先度の知識である。
enumeration] [[of] [[input sequences] [and] [transfer rules]]]]全体が名詞句を構成することになり、文の解釈も初期段階とは大幅に変更される。
次に、第4の実施形態に係る機械翻訳装置について図1を参照しながら説明する。
Claims (6)
- 第一言語では曖昧とならないが第二言語の訳文を作成する場合には曖昧となる単語又は文構造を記憶装置に格納した第一言語曖昧箇所文法辞書と、
翻訳対象となる第一言語文書を解析して得られた解析情報に基づいて前記第二言語の訳文を作成する文書解析翻訳手段と、
前記解析により得られた解析情報及び前記第一言語曖昧箇所文法辞書に基づいて、前記第一言語文書から、前記訳文の作成に必要となる情報が欠落している曖昧箇所を検出する曖昧箇所検出手段と、
前記曖昧箇所ごとに前記必要となる情報を得るためのユーザへの質問文を作成する質問文作成手段と、
前記質問文を前記第一言語文書の該当曖昧箇所に付与して表示装置に表示する質問文付与手段と、
前記質問文に対するユーザからの回答を入力装置から入力したときは当該回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる回答解析手段とを備えた機械翻訳装置であって、
前記回答に基づいて前記必要となる情報が獲得された回答済みの曖昧箇所に対しては、当該回答済みの曖昧箇所を示す単語又は文構造と、当該回答とを含む知識情報を前記記憶装置に書込む知識書込手段と、
前記質問文のうちのある質問文が回答のデフォルト選択肢を含む場合、前記ある質問文に対する回答がなく、前記ある質問文よりも後段の質問文に対する回答があったときには、当該ある質問文については前記デフォルト選択肢が回答されたことを認識する手段とを備え、
前記曖昧箇所検出手段は、前記知識情報に基づいて前記回答済みの曖昧箇所と同一タイプの箇所を検出し、前記同一タイプの箇所を除外するように前記曖昧箇所の検出を再実行する手段を含み、
前記回答解析手段は、前記同一タイプの箇所に対し、前記知識情報に含まれる回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段と、前記認識された回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段とを含んでおり、
前記回答済みの曖昧箇所と同一タイプの箇所は、当該回答済みの曖昧箇所を示す単語と同一の単語により示される箇所であるか、又は当該回答済みの曖昧箇所を示す文構造と同一の文構造により示される箇所であることを特徴とする機械翻訳装置。 - 第一言語では曖昧とならないが第二言語の訳文を作成する場合には曖昧となる単語又は文構造を記憶装置に格納した第一言語曖昧箇所文法辞書と、
翻訳対象となる第一言語文書を解析して得られた解析情報に基づいて前記第二言語の訳文を作成する文書解析翻訳手段と、
前記解析により得られた解析情報及び前記第一言語曖昧箇所文法辞書に基づいて、前記第一言語文書から、前記訳文の作成に必要となる情報が欠落している曖昧箇所を検出する曖昧箇所検出手段と、
前記曖昧箇所ごとに前記必要となる情報を得るためのユーザへの質問文を作成する質問文作成手段と、
前記質問文を前記第一言語文書の該当曖昧箇所に付与して表示装置に表示する質問文付与手段と、
前記質問文に対するユーザからの回答を入力装置から入力したときは当該回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる回答解析手段とを備えた機械翻訳装置であって、
前記回答に基づいて前記必要となる情報が獲得された回答済みの曖昧箇所に対しては、当該回答済みの曖昧箇所を示す単語又は文構造と、当該回答とを含む知識情報を前記記憶装置に書込む知識書込手段を備え、
前記曖昧箇所検出手段は、
前記知識情報に基づいて前記回答済みの曖昧箇所と同一タイプの箇所を検出し、前記同一タイプの箇所を除外するように前記曖昧箇所の検出を再実行する手段と、
前記同一タイプの箇所が検出された場合に対し、当該同一タイプの箇所を前記曖昧箇所の検出対象から除外するか否かを設定する設定手段と、
前記設定手段の設定内容に基づいて前記曖昧箇所の検出を再実行する手段と、
を含み、
前記質問文付与手段は、前記設定手段により前記否と設定された場合、前記回答済みの曖昧箇所に対する回答内容を確認する質問文を前記同一タイプの箇所に付与して前記表示を行う手段を含んでおり、
前記回答解析手段は、前記同一タイプの箇所に対し、前記知識情報に含まれる回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段を含んでおり、
前記回答済みの曖昧箇所と同一タイプの箇所は、当該回答済みの曖昧箇所を示す単語と同一の単語により示される箇所であるか、又は当該回答済みの曖昧箇所を示す文構造と同一の文構造により示される箇所であることを特徴とする機械翻訳装置。 - 請求項2に記載の機械翻訳装置において、
前記回答解析手段は、前記回答内容を確認する質問文に対して当該回答内容とは異なる内容の回答を前記入力装置から受けたときには、前記回答済みの曖昧箇所に対して、前記回答内容の確認を促す手段、
を含んでいることを特徴とする機械翻訳装置。 - 第一言語では曖昧とならないが第二言語の訳文を作成する場合には曖昧となる単語又は文構造を示す第一言語曖昧箇所文法辞書及び前記第一言語を前記第二言語に翻訳するための機械翻訳プログラムを記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力装置と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置に用いられる前記機械翻訳プログラムであって、
前記機械翻訳装置を、
翻訳対象となる第一言語文書を解析して得られた解析情報に基づいて前記第二言語の訳文を作成する文書解析翻訳手段、
前記解析により得られた解析情報及び前記第一言語曖昧箇所文法辞書に基づいて、前記第一言語文書から、前記訳文の作成に必要となる情報が欠落している曖昧箇所を検出する曖昧箇所検出手段、
前記曖昧箇所ごとに前記必要となる情報を得るためのユーザへの質問文を作成する質問文作成手段、
前記質問文を前記第一言語文書の該当曖昧箇所に付与して表示装置に表示する質問文付与手段、
前記質問文に対するユーザからの回答を入力装置から入力したときは当該回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる回答解析手段、
前記回答に基づいて前記必要となる情報が獲得された回答済みの曖昧箇所に対しては、当該回答済みの曖昧箇所を示す単語又は文構造と、当該回答とを含む知識情報を前記記憶装置に書込む知識書込手段、
前記質問文のうちのある質問文が回答のデフォルト選択肢を含む場合、前記ある質問文に対する回答がなく、前記ある質問文よりも後段の質問文に対する回答があったときには、当該ある質問文については前記デフォルト選択肢が回答されたことを認識する手段、
として機能させ、
前記曖昧箇所検出手段は、前記知識情報に基づいて前記回答済みの曖昧箇所と同一タイプの箇所を検出し、前記同一タイプの箇所を除外するように前記曖昧箇所の検出を再実行する手段を含み、
前記回答解析手段は、前記同一タイプの箇所に対し、前記知識情報に含まれる回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段と、前記認識された回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段とを含んでおり、
前記回答済みの曖昧箇所と同一タイプの箇所は、当該回答済みの曖昧箇所を示す単語と同一の単語により示される箇所であるか、又は当該回答済みの曖昧箇所を示す文構造と同一の文構造により示される箇所である、機械翻訳プログラム。 - 第一言語では曖昧とならないが第二言語の訳文を作成する場合には曖昧となる単語又は文構造を示す第一言語曖昧箇所文法辞書及び前記第一言語を前記第二言語に翻訳するための機械翻訳プログラムを記憶した記憶装置と、翻訳対象の第一言語の原文を入力するとともに操作に必要な情報を入力する入力装置と、翻訳対象の第一言語の原文や翻訳後の第二言語の訳文を表示する表示装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置に用いられる前記機械翻訳プログラムであって、
前記機械翻訳装置を、
翻訳対象となる第一言語文書を解析して得られた解析情報に基づいて前記第二言語の訳文を作成する文書解析翻訳手段、
前記解析により得られた解析情報及び前記第一言語曖昧箇所文法辞書に基づいて、前記第一言語文書から、前記訳文の作成に必要となる情報が欠落している曖昧箇所を検出する曖昧箇所検出手段、
前記曖昧箇所ごとに前記必要となる情報を得るためのユーザへの質問文を作成する質問文作成手段、
前記質問文を前記第一言語文書の該当曖昧箇所に付与して表示装置に表示する質問文付与手段、
前記質問文に対するユーザからの回答を入力装置から入力したときは当該回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる回答解析手段、
前記回答に基づいて前記必要となる情報が獲得された回答済みの曖昧箇所に対しては、当該回答済みの曖昧箇所を示す単語又は文構造と、当該回答とを含む知識情報を前記記憶装置に書込む知識書込手段、
として機能させ、
前記曖昧箇所検出手段は、
前記知識情報に基づいて前記回答済みの曖昧箇所と同一タイプの箇所を検出し、前記同一タイプの箇所を除外するように前記曖昧箇所の検出を再実行する手段と、
前記同一タイプの箇所が検出された場合に対し、当該同一タイプの箇所を前記曖昧箇所の検出対象から除外するか否かを設定する設定手段と、
前記設定手段の設定内容に基づいて前記曖昧箇所の検出を再実行する手段と、
を含み、
前記質問文付与手段は、前記設定手段により前記否と設定された場合、前記回答済みの曖昧箇所に対する回答内容を確認する質問文を前記同一タイプの箇所に付与して前記表示を行う手段を含んでおり、
前記回答解析手段は、前記同一タイプの箇所に対し、前記知識情報に含まれる回答に基づいて前記必要となる情報を獲得し、当該必要となる情報を前記訳文の作成に反映させる手段を含んでおり、
前記回答済みの曖昧箇所と同一タイプの箇所は、当該回答済みの曖昧箇所を示す単語と同一の単語により示される箇所であるか、又は当該回答済みの曖昧箇所を示す文構造と同一の文構造により示される箇所である、機械翻訳プログラム。 - 請求項5に記載の機械翻訳プログラムにおいて、
前記回答解析手段は、前記回答内容を確認する質問文に対して当該回答内容とは異なる内容の回答を前記入力装置から受けたときには、前記回答済みの曖昧箇所に対して、前記回答内容の確認を促す手段を含んでいる、機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013052709A JP6045948B2 (ja) | 2013-03-15 | 2013-03-15 | 機械翻訳装置及び機械翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013052709A JP6045948B2 (ja) | 2013-03-15 | 2013-03-15 | 機械翻訳装置及び機械翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014178915A JP2014178915A (ja) | 2014-09-25 |
JP6045948B2 true JP6045948B2 (ja) | 2016-12-14 |
Family
ID=51698789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013052709A Active JP6045948B2 (ja) | 2013-03-15 | 2013-03-15 | 機械翻訳装置及び機械翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6045948B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019093239A1 (ja) | 2017-11-07 | 2019-05-16 | 日本電気株式会社 | 情報処理装置、方法及び記録媒体 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2626174B2 (ja) * | 1990-05-28 | 1997-07-02 | 日本電気株式会社 | 翻訳支援装置 |
JP5632213B2 (ja) * | 2010-06-25 | 2014-11-26 | 株式会社東芝 | 機械翻訳装置及び機械翻訳プログラム |
-
2013
- 2013-03-15 JP JP2013052709A patent/JP6045948B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014178915A (ja) | 2014-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11250841B2 (en) | Natural language generation, a hybrid sequence-to-sequence approach | |
US7904291B2 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
CN107209759B (zh) | 注解辅助装置及记录介质 | |
US7908132B2 (en) | Writing assistance using machine translation techniques | |
US7752034B2 (en) | Writing assistance using machine translation techniques | |
US20060224378A1 (en) | Communication support apparatus and computer program product for supporting communication by performing translation between languages | |
US20140039879A1 (en) | Generic system for linguistic analysis and transformation | |
JPH1011447A (ja) | パターンに基づく翻訳方法及び翻訳システム | |
JP2002215617A (ja) | 品詞タグ付けをする方法 | |
Novák et al. | Creation of an annotated corpus of Old and Middle Hungarian court records and private correspondence | |
Kammoun et al. | The MORPH2 new version: A robust morphological analyzer for Arabic texts | |
Wang et al. | Automatic paper writing based on a RNN and the TextRank algorithm | |
US11568150B2 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using transducers applied on a structured language space | |
Kac | Corepresentation of grammatical structure | |
JP2010244385A (ja) | 機械翻訳装置、機械翻訳方法、およびプログラム | |
JP6045948B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
Grác | Rapid development of language resources | |
Krishnamurthy et al. | Ease: Enabling hardware assertion synthesis from english | |
JP4371080B2 (ja) | 自然言語学習支援装置及び方法 | |
JP5632213B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4298771B2 (ja) | 機械翻訳装置及びプログラム | |
Dahou et al. | Arabic Anaphora Resolution System Using New Features: Pronominal and Verbal Cases | |
JPH052605A (ja) | 機械翻訳方式 | |
JPH08190562A (ja) | 機械翻訳装置 | |
US20220004708A1 (en) | Methods and apparatus to improve disambiguation and interpretation in automated text analysis using structured language space and transducers applied on automatons |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150914 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160726 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160729 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160923 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161018 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6045948 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |