JPS63204463A - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JPS63204463A JPS63204463A JP62038247A JP3824787A JPS63204463A JP S63204463 A JPS63204463 A JP S63204463A JP 62038247 A JP62038247 A JP 62038247A JP 3824787 A JP3824787 A JP 3824787A JP S63204463 A JPS63204463 A JP S63204463A
- Authority
- JP
- Japan
- Prior art keywords
- word
- character string
- length
- comparator
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013519 translation Methods 0.000 title claims abstract description 29
- 230000004044 response Effects 0.000 abstract 2
- 230000014616 translation Effects 0.000 description 21
- 238000000034 method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000000877 morphologic effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ) 産業上の利用分野
本発明は機械8訳装置に関し、機械翻訳過程における原
文解析を効率化し、高速翻訳を実現するとともに、機械
翻訳装置全体を小型化し得る機械翻訳装置に関する。
文解析を効率化し、高速翻訳を実現するとともに、機械
翻訳装置全体を小型化し得る機械翻訳装置に関する。
(ロ)従来の技術
近年、日本語から英語へ、あるいは英語から日本語へと
文章布コ〉・ピユータで翻訳する機械翻訳処理システム
の開発が盛んであり、1983年8月29日発行の日経
エレクトロニクスの記事「実用化の見通しがついた日本
語機械翻訳システムの動き」に詳しい。このような計算
機システムを用いた機械翻訳装置は、第2図に例示する
ような原文の解析過程を有する。同図に於いて、原文解
析部(10)は形態素解析部〈11)と、構文解析部(
12)と意味角7析部(13)とからなり、原文(a)
を形態素解析、構文解析、及び意味解析を行なって、原
言語の中間表現(b)を得る。 (20)は変換部であ
り、中間表現(b)を対象言語の中間表現(c)に変換
する。(30)は訳文生成部であり、中間表現から訳文
を生成する。
文章布コ〉・ピユータで翻訳する機械翻訳処理システム
の開発が盛んであり、1983年8月29日発行の日経
エレクトロニクスの記事「実用化の見通しがついた日本
語機械翻訳システムの動き」に詳しい。このような計算
機システムを用いた機械翻訳装置は、第2図に例示する
ような原文の解析過程を有する。同図に於いて、原文解
析部(10)は形態素解析部〈11)と、構文解析部(
12)と意味角7析部(13)とからなり、原文(a)
を形態素解析、構文解析、及び意味解析を行なって、原
言語の中間表現(b)を得る。 (20)は変換部であ
り、中間表現(b)を対象言語の中間表現(c)に変換
する。(30)は訳文生成部であり、中間表現から訳文
を生成する。
同図の機械翻訳装置では、形態素解析部(11)に於い
てまず原文(a)を単語単位に分割する。この分割を行
うために翻訳用辞書を備え、辞書には成るIt語に関す
る文法的な情報とともに単語の表記が記憶きれている。
てまず原文(a)を単語単位に分割する。この分割を行
うために翻訳用辞書を備え、辞書には成るIt語に関す
る文法的な情報とともに単語の表記が記憶きれている。
単語表記の記憶方法は、従来、固定長または可変長のレ
コードとして記憶される。可変長の場合は、その取扱が
複雑になり、!!、語の追加や削除などの際は−1複雑
になるという欠点があった。一方、同定長の場合は取扱
は簡、!@℃あるが記憶領域の無駄が多いという欠点が
ある。特に、翻訳機の場合はその傾向が強い。何故なら
、翻訳機では名詞が複数個連続して一つの名詞として扱
われる単語に対してそれに特有な訳語が必要となること
が多いため、長い名詞連続複合語を格納するだけの記憶
領域が必要となるからである。
コードとして記憶される。可変長の場合は、その取扱が
複雑になり、!!、語の追加や削除などの際は−1複雑
になるという欠点があった。一方、同定長の場合は取扱
は簡、!@℃あるが記憶領域の無駄が多いという欠点が
ある。特に、翻訳機の場合はその傾向が強い。何故なら
、翻訳機では名詞が複数個連続して一つの名詞として扱
われる単語に対してそれに特有な訳語が必要となること
が多いため、長い名詞連続複合語を格納するだけの記憶
領域が必要となるからである。
(ハ) 発明が解決しようとする問題点本発明は、上記
の問題点を解決すべ〈発明したもので、単語表記の長さ
に応じてそれぞれ異なった記憶形式を適珀し、なおかつ
、それぞれは固定長の記憶形式とすることにより、可変
長の場合の問題である取扱の複雑さを取り除き、また、
固定長の場合の問題である記憶領域の無駄を排除し、機
械翻訳機の小型化を可能にするような手段を提供するこ
とを目的とする。
の問題点を解決すべ〈発明したもので、単語表記の長さ
に応じてそれぞれ異なった記憶形式を適珀し、なおかつ
、それぞれは固定長の記憶形式とすることにより、可変
長の場合の問題である取扱の複雑さを取り除き、また、
固定長の場合の問題である記憶領域の無駄を排除し、機
械翻訳機の小型化を可能にするような手段を提供するこ
とを目的とする。
(ニ)問題点を解決するための手段
本発明の機械翻訳装置は、単語表記の長さに応じた単語
表記そのものを記憶する手段と、その記憶の内容と一致
比較すべき原文中の文字列の長さを判定する手段と、判
定された長さに従って一致比較させるべき記憶領域を切
り替える手段と、実際に比較し一致を検出する手段を有
する。
表記そのものを記憶する手段と、その記憶の内容と一致
比較すべき原文中の文字列の長さを判定する手段と、判
定された長さに従って一致比較させるべき記憶領域を切
り替える手段と、実際に比較し一致を検出する手段を有
する。
(ホ) 作用
本発明装置によれば単語表記は、その長さに応して、そ
れを格納するのに充分な記憶領域の内の最少のものに格
納されるので使われずに残る記憶領域が減少する。その
結果、記憶領域の必四量が減少し装置の小型化が図れる
。また、必要記憶領域が減少すること記憶領域へのアク
セスの減少をもたらし翻訳速度を向上させる。
れを格納するのに充分な記憶領域の内の最少のものに格
納されるので使われずに残る記憶領域が減少する。その
結果、記憶領域の必四量が減少し装置の小型化が図れる
。また、必要記憶領域が減少すること記憶領域へのアク
セスの減少をもたらし翻訳速度を向上させる。
(へ)実施例
以下に、本発明の機械翻訳装置の詳細を第1図図示の実
施例に従って説明する。
施例に従って説明する。
以下の実施例では、簡単のため、単語表記の長さを長短
の2種類に分けた場合で説明する。ここに、単語表記(
短)は4文字以下のものであり、単語表記(長)は4文
字を越えるものである。なお、4文字と゛いう長さは日
本語のXL語切り出しに適した長さである。日本語の単
語の多くは4文字以内に収まるので、はとんどのものが
単語表記(短)で扱え記憶領域は少なくて済む。単語表
記(長)の文字列の最大長は仮に20文字としても、こ
こに入る単語の数が少ないので記憶領域の増大を避は得
る。
の2種類に分けた場合で説明する。ここに、単語表記(
短)は4文字以下のものであり、単語表記(長)は4文
字を越えるものである。なお、4文字と゛いう長さは日
本語のXL語切り出しに適した長さである。日本語の単
語の多くは4文字以内に収まるので、はとんどのものが
単語表記(短)で扱え記憶領域は少なくて済む。単語表
記(長)の文字列の最大長は仮に20文字としても、こ
こに入る単語の数が少ないので記憶領域の増大を避は得
る。
第1図において、原文人力部(1)で翻訳対象の文章か
ら一文を取り出す。文字列切りだし部(2)では−文の
中から単語候補となる文字列を切り出し文字列長比較判
定回路(3)に渡す。文字列長判定回路(3)はこの文
字列の長さが4文字以下かどうかを判定し、4文字以下
なら文字列(短)比較回路(4)に単語候補の文字列を
送り、そうでなければ、文字列(長)比較回路(6)に
単語候補の文字列を送る。文字列(短)比較回路(4)
は送られてきた@語候補の文字列を単語表記(短)記憶
領域(5)に予め格納されている4文字以下の語表記と
比較し、−・致するものがあれば、単語表記(短)記憶
領域(5)における位置情報を文字列切り出し回路(2
)に送る。この時、文字列(短)比較回路(4)は単語
表記(短)記憶領域(5)の中だけを捜せばよく、単語
表記(長)記憶領域(7)を読み出す必要がなく検索時
間が短縮される。さらに、単語表記(短)記憶領域(5
)の一つの単語表記の記憶領域長は4文字文であり全体
の長さが短く、ここでも検索時間か短縮される。なお、
文字列長判別回路(3)が5文字以上の単語候補を検知
した時は文字列(長)比較回路(6)、及び単語表記(
艮)記憶領域(7)を使用するが、この時の文字列(長
)比較回路(6)と単語表記(長)記憶領域(7)の動
作および効果も上述と同様である。
ら一文を取り出す。文字列切りだし部(2)では−文の
中から単語候補となる文字列を切り出し文字列長比較判
定回路(3)に渡す。文字列長判定回路(3)はこの文
字列の長さが4文字以下かどうかを判定し、4文字以下
なら文字列(短)比較回路(4)に単語候補の文字列を
送り、そうでなければ、文字列(長)比較回路(6)に
単語候補の文字列を送る。文字列(短)比較回路(4)
は送られてきた@語候補の文字列を単語表記(短)記憶
領域(5)に予め格納されている4文字以下の語表記と
比較し、−・致するものがあれば、単語表記(短)記憶
領域(5)における位置情報を文字列切り出し回路(2
)に送る。この時、文字列(短)比較回路(4)は単語
表記(短)記憶領域(5)の中だけを捜せばよく、単語
表記(長)記憶領域(7)を読み出す必要がなく検索時
間が短縮される。さらに、単語表記(短)記憶領域(5
)の一つの単語表記の記憶領域長は4文字文であり全体
の長さが短く、ここでも検索時間か短縮される。なお、
文字列長判別回路(3)が5文字以上の単語候補を検知
した時は文字列(長)比較回路(6)、及び単語表記(
艮)記憶領域(7)を使用するが、この時の文字列(長
)比較回路(6)と単語表記(長)記憶領域(7)の動
作および効果も上述と同様である。
(ト)発明の効果
従来の機械翻訳機では、単語の切り出しの際にはまだ候
補を絞りきれないので多数の候補を取り出しておく必要
があり、さらに、これを収める辞書はその容量が大きい
ため、通常、ディスクなどの低速の外部記憶装置に格納
されるので、その処理時間が問題であった。この部分の
処理を早くすることは翻訳処理全体の処理速度に大きく
影響する。本発明では、機械翻訳機が扱うべき自然言語
の単語の特性、即ち、単語長の艮いものが存在する反面
、多くのものは4文字などの極めて短い長さに収まると
いう特性に着目し、単語表記の記憶領域を単語の長さに
よって分離し、その記憶領域そのものの大きさを縮小し
小型の翻訳機にも適用できるようにし、さらに、単語検
索時間を削減することが可能となる。
補を絞りきれないので多数の候補を取り出しておく必要
があり、さらに、これを収める辞書はその容量が大きい
ため、通常、ディスクなどの低速の外部記憶装置に格納
されるので、その処理時間が問題であった。この部分の
処理を早くすることは翻訳処理全体の処理速度に大きく
影響する。本発明では、機械翻訳機が扱うべき自然言語
の単語の特性、即ち、単語長の艮いものが存在する反面
、多くのものは4文字などの極めて短い長さに収まると
いう特性に着目し、単語表記の記憶領域を単語の長さに
よって分離し、その記憶領域そのものの大きさを縮小し
小型の翻訳機にも適用できるようにし、さらに、単語検
索時間を削減することが可能となる。
第1図は本発明の機械翻訳装置の単語検索機態部のブロ
ック図、第2図は一般的な機械翻訳装置の構成を示すブ
ロック図である。 (1)・・・原文人力部、(2)・・・文字列切り出し
回路、(3〉・・・文字列長判定回路、(4)・・・文
字列(短)比較回路、(5)・・・jK語表記(短)記
憶回路、(6)・・・文字列(長)比較回路、(7)・
・・単語表記(長)記憶回路。
ック図、第2図は一般的な機械翻訳装置の構成を示すブ
ロック図である。 (1)・・・原文人力部、(2)・・・文字列切り出し
回路、(3〉・・・文字列長判定回路、(4)・・・文
字列(短)比較回路、(5)・・・jK語表記(短)記
憶回路、(6)・・・文字列(長)比較回路、(7)・
・・単語表記(長)記憶回路。
Claims (1)
- (1)入力された原文を翻訳し訳文を得る手段を有する
機械翻訳装置において、入力となる原文を解析するに当
って、原文中の単語を検索して切り出す際にその単語長
を検出して単語長に応じて検索手段を切り替え、また単
語長に応じて翻訳用辞書が構成されていることを特徴と
する機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62038247A JPS63204463A (ja) | 1987-02-20 | 1987-02-20 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62038247A JPS63204463A (ja) | 1987-02-20 | 1987-02-20 | 機械翻訳装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS63204463A true JPS63204463A (ja) | 1988-08-24 |
Family
ID=12519978
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62038247A Pending JPS63204463A (ja) | 1987-02-20 | 1987-02-20 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS63204463A (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5811101A (ja) * | 1981-07-13 | 1983-01-21 | 日立工機株式会社 | 動力切断工具 |
JPS61267885A (ja) * | 1984-11-21 | 1986-11-27 | Nec Corp | 単語辞書照合装置 |
JPS63153632A (ja) * | 1986-12-17 | 1988-06-27 | Fujitsu Ltd | 文字列検索方式 |
-
1987
- 1987-02-20 JP JP62038247A patent/JPS63204463A/ja active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5811101A (ja) * | 1981-07-13 | 1983-01-21 | 日立工機株式会社 | 動力切断工具 |
JPS61267885A (ja) * | 1984-11-21 | 1986-11-27 | Nec Corp | 単語辞書照合装置 |
JPS63153632A (ja) * | 1986-12-17 | 1988-06-27 | Fujitsu Ltd | 文字列検索方式 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR930002967A (ko) | 비텍스트 대상 저장 및 검색 | |
JPS62203273A (ja) | 機械翻訳システム | |
JPH0689304A (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
JP3022539B1 (ja) | 文書検索装置 | |
JPS6033665A (ja) | キ−ワ−ド自動抽出方式 | |
JPH0344343B2 (ja) | ||
Craft et al. | A table look-up machine for processing of natural languages | |
JPS63204463A (ja) | 機械翻訳装置 | |
JPS61248160A (ja) | 文書情報登録方式 | |
JPH0827803B2 (ja) | テキストベース検索方法 | |
JPH03135666A (ja) | 機械翻訳方式 | |
JPH09146958A (ja) | 語彙対応辞書作成装置および語彙対応辞書作成方法 | |
JPS59116835A (ja) | 短縮入力機能付日本語入力装置 | |
JPS6324458A (ja) | 自然言語処理装置 | |
JP2995783B2 (ja) | カタカナ語の訳語推定装置 | |
JPH0821031B2 (ja) | 言語解析装置 | |
JPH0225973A (ja) | 機械翻訳装置 | |
JPH04372047A (ja) | 仮名漢字変換装置 | |
JPS61115171A (ja) | 機械翻訳システム | |
JPS59214978A (ja) | 辞書検索方式 | |
JPH0816910B2 (ja) | 言語解析装置 | |
JPH064573A (ja) | 機械翻訳装置 | |
JPH01118961A (ja) | 翻訳装置 | |
JP2001318595A (ja) | 点字変換システム | |
JPH11259473A (ja) | 機械翻訳装置及び機械翻訳方法 |