JP5746921B2 - 機械翻訳装置、方法及びプログラム - Google Patents
機械翻訳装置、方法及びプログラム Download PDFInfo
- Publication number
- JP5746921B2 JP5746921B2 JP2011143491A JP2011143491A JP5746921B2 JP 5746921 B2 JP5746921 B2 JP 5746921B2 JP 2011143491 A JP2011143491 A JP 2011143491A JP 2011143491 A JP2011143491 A JP 2011143491A JP 5746921 B2 JP5746921 B2 JP 5746921B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- translation
- language
- words
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000013519 translation Methods 0.000 title claims description 191
- 238000000034 method Methods 0.000 title claims description 21
- 230000014616 translation Effects 0.000 claims description 205
- 238000004458 analytical method Methods 0.000 claims description 77
- 230000006870 function Effects 0.000 claims description 12
- 239000000284 extract Substances 0.000 claims description 2
- 238000012545 processing Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 13
- 241000282414 Homo sapiens Species 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 108090000623 proteins and genes Proteins 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 4
- 230000035939 shock Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000005352 clarification Methods 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001502 supplementing effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 210000003813 thumb Anatomy 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
このように従来の方式では、何らかの人間の介在が前提となっている。前編集の方法をとる場合、第1言語の知識を必要とし、負荷の高い作業、いわゆるチューニングが発生する。これは、通常の第1言語の知識だけでなく、どのような言語表現が機械にとって処理しにくいかといった(人間が処理しやすい言語表現とは必ずしも一致しない)特殊な知識も必要とする。したがって、パーソナル・ユーザのように、単に大意をつかむために、機械翻訳を利用している場合には適切といえない。特に、第1言語をまったく解さないユーザの場合は、特にそのことがいえる。
図2は本発明の実施例1に係る機械翻訳装置11の機能ブロック図である。図2において、演算制御装置12内の各機能ブロックは、上述の機械翻訳プログラム15を構成する各プログラムに対応する。すなわち、プロセッサ13が機械翻訳プログラム15を構成する各プログラムを実行することで、演算制御装置12は、各機能ブロックとして機能することとなる。また、記憶装置26の各ブロックは、演算制御装置12内のメモリ14及びハードディスクドライブ25の記憶領域に対応する。
word2, word3, word4, ..wordn(word1を除去)
word1, word3,word4,…wordn(word2を除去)
…
word1, word2, word3,…wordn-1(wordnを除去)
のようなn−1単語からなる単語の並びをn種作成した上で、それぞれに対して構文解析を行う。これらの構文解析の結果は、必要に応じて、制御部28及び出力処理部32を介して表示装置18に表示・出力される。
これは、先のすべての単語を取り込んで翻訳した結果、「使用したがってプライマーを設計する、人間の遺伝子のポリメラーゼ連鎖反応が達成された」と比較して、「使用」と「プライマー」との関係が明らかになっていること、「使用」「したがって」と日本語として接続していない表現がないことから、読みやすさが増していることがわかる。”thus”を省くことによる情報量の損失の量よりも、構成要素の関係の明確化による増大する情報の量のほうが高いといえる。つまり、大意をつかむには十分である。
図8は、本発明の実施例2に係る機械翻訳装置の機能ブロック図である。この実施例2は、図2に示した実施例1に対し、文書解析手段30で構文解析に成功した1単語を除去した単語列が複数あるときは、その複数の各単語列について除去した1単語の重要度を判断する単語重要度判定手段35を追加して設け、訳文生成手段33は、単語重要度判定手段で除去した1単語の重要度が最も低いと判定された単語列の訳文を生成するようにしたものである。
図10は、本発明の実施例3に係る機械翻訳装置の機能ブロック図である。この実施例3は、図2に示した実施例1に対し、1単語を除去した単語列の構文解析に成功したときは、除去した1単語の直前の単語の品詞と直後の単語の品詞とを参照し、それらの品詞の間に生起し得る品詞を翻訳辞書部31に基づいて抽出し、その生起し得る品詞に基づいて除去した1単語の品詞を変更して調整する品詞調整手段36を設け、訳文生成手段33は、1単語を除去した単語列の訳文を生成することに代えて、品詞調整手段36で変更した品詞を、除去した1単語に割当て原文の訳文を生成するようにしたものである。
図14は、本発明の実施例4に係る機械翻訳装置の機能ブロック図である。この実施例4は、図2に示した実施例1に対し、1単語を除いた単語列が構文解析に成功したときは、除去した1単語の前後m語のm単語の単語列をコーパスから検索するコーパス検索手段を設けたものである。
(2)better placed to withstand(前1単語、後ろ2単語)26,800
(3)better placed to (前1単語、後ろ1単語) 4,600,000
(4)it better placed to withstand shocks (前2単語、後ろ3単語) 1
(5)it better placed to withstand (前2単語、後ろ2単語) 1,820
(6)it better placed to (前2単語、後ろ1単語) 286,000
(7)making it better placed to withstand (前3単語、後ろ2単語)114
(8)making it better placed to (前3単語、後ろ1単語) 6,410
右の数字は、ある実際の検索サイトを使って検索した場合のヒット件数を示すものである。検索対象の単語の数が少ないほど、検索ヒット率が高まるのは当然である。しかし、検索対象の語数が同一であっても、検索ヒット率には大きな差があることがわかる。例えば、同じ4語であっても、making it better placed toは6,000台、it better placed to withstandは1,800台、better placed to withstand shocksは20程度と幅がある。3単語の場合はit better placed toが群を抜いて高く、辞書文法が扱えるようにする必要があると判断できる。このことから、検索対象の語数ごとに予め設定した基準値を決めておき、コーパスから検索されたヒット件数がその基準値を超えたときに検索ヒット率が高いと判断する。
図17は、本発明の実施例5に係る機械翻訳装置の機能ブロック図である。この実施例5は、図2に示した実施例1に対し、1単語を除いた単語列が構文解析に成功したときは、除去した1単語Bの直前の単語Aと除去した単語Bとから構成される2語の単語列AB、または、除去した単語Bと除去した単語Bの直後の単語Cとから構成される2語の単語列BCを見出し語とした品詞の辞書登録をユーザに問い合わせる辞書登録問い合わせ手段38を設けたものである。
Claims (7)
- 機械翻訳プログラム、翻訳対象の第1言語の原文を翻訳目的の第2言語の訳文に翻訳するための機械翻訳辞書を記憶した記憶装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えた機械翻訳装置において、前記機械翻訳プログラムは、
第1言語で表現された文書の各原文を構文解析する文書解析手段と、
前記文書解析手段で構文解析に成功したときは前記原文の訳文を生成する訳文生成手段と、
前記文書解析手段で構文解析に失敗したときはn単語からなる前記原文から1単語を除去したn−1単語からなるn種の単語列を作成する第1言語単語除去手段とを備え、
前記文書解析手段は、前記第1言語単語除去手段で得られた1単語を除去した単語列を構文解析し、
前記訳文生成手段は、前記1単語を除去した単語列の構文解析に成功したときはその単語列の訳文を生成し、前記1単語を除去した単語列の構文解析に失敗したときは前記原文の不完全な訳文を生成する機械翻訳装置。 - 前記文書解析手段で構文解析に成功した前記1単語を除去した単語列が複数あるときは、その複数の各単語列について除去した単語の重要度を判断する単語重要度判定手段を設け、
前記訳文生成手段は、前記単語重要度判定手段で除去した単語の重要度が最も低いと判定された単語列の訳文を生成する請求項1記載の機械翻訳装置。 - 前記1単語を除去した単語列の構文解析に成功したときは、除去した単語の直前の単語の品詞と直後の単語の品詞とを参照し、それらの品詞の間に生起し得る品詞を前記機械翻訳辞書に基づいて抽出し、その生起し得る品詞に基づいて前記除去した1単語の品詞を変更する品詞調整手段を設け、
前記訳文生成手段は、前記1単語を除去した単語列の訳文を生成することに代えて、前記品詞調整手段で変更した品詞を前記除去した1単語に割当て前記原文の訳文を生成する請求項1記載の機械翻訳装置。 - 前記1単語を除去した単語列が構文解析に成功したときは、除去した1単語の前後m語で構成される第1の単語列、除去した1単語の前後1個からm個の範囲で検索対象として抽出した単語で構成される前記第1の単語列を除く複数の組み合わせからなる第2の単語列、または、除去した1単語に先行するi個の単語、除去した1単語に後続するj個の単語、除去した1単語を任意の単語に置き換えたi+j+1個の単語列をコーパスから検索するコーパス検索手段を備え、検索ヒット率に基づいて辞書文法の拡張要否を判断する請求項1記載の機械翻訳装置。
- 前記1単語を除去した単語列が構文解析に成功したときは、除去した1単語の直前の単語と除去した1単語とから構成される2語の単語列、または、除去した1単語と除去した1単語の直後の単語とから構成される2語の単語列を見出し語とした品詞の辞書登録をユーザに問い合わせる辞書登録問い合わせ手段を備えた請求項1記載の機械翻訳装置。
- 機械翻訳プログラム、翻訳対象の第1言語の原文を翻訳目的の第2言語の訳文に翻訳するための機械翻訳辞書を記憶した記憶装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えたコンピュータを操作して、
入力装置から入力された第1言語で表現された文書の各原文を構文解析し、
前記原文の構文解析に成功したときは前記原文の訳文を生成し、
前記原文の構文解析に失敗したときはn単語からなる前記原文から1単語を除去したn−1単語からなるn種の単語列を作成し、
前記1単語を除去した単語列を構文解析し、
前記1単語を除去した単語列の構文解析に成功したときはその単語列の訳文を生成し、
前記1単語を除去した単語列の構文解析に失敗したときは前記原文の不完全な訳文を生成する機械翻訳方法。 - 機械翻訳プログラム、翻訳対象の第1言語の原文を翻訳目的の第2言語の訳文に翻訳するための機械翻訳辞書を記憶した記憶装置と、前記機械翻訳プログラムを演算実行する演算制御装置とを備えたコンピュータに用いられ、前記コンピュータに、
入力装置から入力された第1言語で表現された文書の各原文を構文解析する機能と、
前記原文の構文解析に成功したときは前記原文の訳文を生成する機能と、
前記原文の構文解析に失敗したときはn単語からなる前記原文から1単語を除去したn−1単語からなるn種の単語列を作成する機能と、
前記1単語を除去した単語列を構文解析する機能と、
前記1単語を除去した単語列の構文解析に成功したときはその単語列の訳文を生成する機能と、
前記1単語を除去した単語列の構文解析に失敗したときは前記原文の不完全な訳文を生成する機能とを実現させるための機械翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011143491A JP5746921B2 (ja) | 2011-06-28 | 2011-06-28 | 機械翻訳装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011143491A JP5746921B2 (ja) | 2011-06-28 | 2011-06-28 | 機械翻訳装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013011993A JP2013011993A (ja) | 2013-01-17 |
JP5746921B2 true JP5746921B2 (ja) | 2015-07-08 |
Family
ID=47685837
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011143491A Expired - Fee Related JP5746921B2 (ja) | 2011-06-28 | 2011-06-28 | 機械翻訳装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5746921B2 (ja) |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS638864A (ja) * | 1986-06-27 | 1988-01-14 | Sharp Corp | 翻訳装置 |
JPH01213750A (ja) * | 1988-02-22 | 1989-08-28 | Ricoh Co Ltd | 機械翻訳用の構文解析におけるサルベージ方法 |
-
2011
- 2011-06-28 JP JP2011143491A patent/JP5746921B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013011993A (ja) | 2013-01-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101544690B1 (ko) | 단어 분할 장치, 단어 분할 방법 및 단어 분할 프로그램 | |
JP2001101185A (ja) | 辞書の自動切り換えが可能な機械翻訳方法および装置並びにそのような機械翻訳方法を実行するためのプログラムを記憶したプログラム記憶媒体 | |
KR20150140683A (ko) | 큐레이션을 통한 다국어 사업 표시 및 음역의 합성, 번역 및 문자소 통찰력의 향상 | |
Graliński et al. | PSI-toolkit: A natural language processing pipeline | |
Sornlertlamvanich et al. | Thai Part-of-Speech Tagged Corpus: ORCHID | |
Shmidman et al. | Nakdan: Professional hebrew diacritizer | |
WO1997040453A1 (en) | Automated natural language processing | |
JP2017151553A (ja) | 機械翻訳装置、機械翻訳方法、及びプログラム | |
JP2009059300A (ja) | 訳語学習のためのデータを作成する装置、方法、およびプログラム | |
JP5746921B2 (ja) | 機械翻訳装置、方法及びプログラム | |
JP4875040B2 (ja) | 機械翻訳システム及び機械翻訳プログラム | |
Reddy et al. | POS Tagger for Kannada Sentence Translation | |
Rajendran | Parsing in tamil: Present state of art | |
JP5879989B2 (ja) | 機械翻訳システム、機械翻訳方法および機械翻訳プログラム | |
Tambouratzis et al. | Machine Translation with Minimal Reliance on Parallel Resources | |
JP2632806B2 (ja) | 言語解析装置 | |
JP4869281B2 (ja) | 機械翻訳装置、プログラム及び方法 | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム | |
KR100322743B1 (ko) | 음성합성기의 문서해석기에서 사용되는 형태소 해석방법 및 그 장치 | |
Ouersighni | Robust rule-based approach in Arabic processing | |
Cheng et al. | MAG-Tagalog: A rule-based Tagalog morphological analyzer and generator | |
Pretorius et al. | Finite-state computational morphology-treatment of the zulu noun | |
JP5387166B2 (ja) | 情報処理装置及びプログラム | |
JP2009258887A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP4881399B2 (ja) | 対訳情報作成装置、機械翻訳装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141028 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150127 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150327 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150414 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5746921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |