JPH0346865B2 - - Google Patents
Info
- Publication number
- JPH0346865B2 JPH0346865B2 JP59154485A JP15448584A JPH0346865B2 JP H0346865 B2 JPH0346865 B2 JP H0346865B2 JP 59154485 A JP59154485 A JP 59154485A JP 15448584 A JP15448584 A JP 15448584A JP H0346865 B2 JPH0346865 B2 JP H0346865B2
- Authority
- JP
- Japan
- Prior art keywords
- katakana
- string
- sent
- text
- word dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、機械翻訳の前処理において、入力テ
キスト中の外国語を表す片仮名文字列を外国語表
記の文字列に変換し、しかる後にテキストを翻訳
部に送るようになつた機械翻訳装置に関するもの
である。
キスト中の外国語を表す片仮名文字列を外国語表
記の文字列に変換し、しかる後にテキストを翻訳
部に送るようになつた機械翻訳装置に関するもの
である。
従来の日本語を英語に翻訳する機械翻訳装置に
おいては、片仮名文字列を日本語単語辞書だけか
ら検索していたため、英語単語で片仮名表記され
ているものは日本語単語辞書に登録しておく必要
がある。英語単語を片仮名表記したものを日本語
単語辞書に入れ且つ同一の英語単語をアルフアベ
ツト表記したものを英語単語辞書に入れておくこ
とは、辞書の容量を増大させるばかりでなく翻訳
処理を複雑にするこという欠点がある。
おいては、片仮名文字列を日本語単語辞書だけか
ら検索していたため、英語単語で片仮名表記され
ているものは日本語単語辞書に登録しておく必要
がある。英語単語を片仮名表記したものを日本語
単語辞書に入れ且つ同一の英語単語をアルフアベ
ツト表記したものを英語単語辞書に入れておくこ
とは、辞書の容量を増大させるばかりでなく翻訳
処理を複雑にするこという欠点がある。
本発明は、上記の欠点を除去するものであつ
て、辞書の容量を小さくできると共に機械翻訳の
負荷を軽減できるようにした機械翻訳装置を提供
することを目的としている。
て、辞書の容量を小さくできると共に機械翻訳の
負荷を軽減できるようにした機械翻訳装置を提供
することを目的としている。
そしてそのため、本発明の機械翻訳装置は、片
仮名列抽出部と辞書アクセス部とテキスト併合部
とを有する前処理部、 翻訳部、 日本語単語辞書、及び 外国語単語辞書 を具備する機械翻訳装置であつて、 上記外国語単語辞書の中には、外国語文字表記
の文字列に対応して片仮名文字表記の文字列が書
き込まれ、 上記片仮名列抽出部は、入力テキスト中の片仮
名文字列を上記辞書アクセス部に送り、片仮名文
字列以外を上記テキスト併合部に送るように構成
され、 上記辞書アクセス部は、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にある場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にない場合には、
送られて来た片仮名文字列と一致する片仮名文字
列が上記外国語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にある場合には、
対応する外国語文字表記の文字列を上記テキスト
併合部に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にない場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送るように構成され、 上記テキスト併合部は、送られてきた外国語文
字列に対応する入力テキスト中の片仮名文字列を
送られて来た外国語表記の文字列に置き換え、置
き換え済みのテキストを上記翻訳部に送るように
構成されている ことを特徴とするものである。
仮名列抽出部と辞書アクセス部とテキスト併合部
とを有する前処理部、 翻訳部、 日本語単語辞書、及び 外国語単語辞書 を具備する機械翻訳装置であつて、 上記外国語単語辞書の中には、外国語文字表記
の文字列に対応して片仮名文字表記の文字列が書
き込まれ、 上記片仮名列抽出部は、入力テキスト中の片仮
名文字列を上記辞書アクセス部に送り、片仮名文
字列以外を上記テキスト併合部に送るように構成
され、 上記辞書アクセス部は、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にある場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にない場合には、
送られて来た片仮名文字列と一致する片仮名文字
列が上記外国語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にある場合には、
対応する外国語文字表記の文字列を上記テキスト
併合部に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にない場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送るように構成され、 上記テキスト併合部は、送られてきた外国語文
字列に対応する入力テキスト中の片仮名文字列を
送られて来た外国語表記の文字列に置き換え、置
き換え済みのテキストを上記翻訳部に送るように
構成されている ことを特徴とするものである。
以下、本発明の実施例を図面を参照しつつ説明
する。
する。
第1図は本発明の1実施例の概要を示す図であ
る。第1図において、1は翻訳装置、2は前処理
部、3は翻訳部、4は日本語解析部、5は英語生
成部をそれぞれ示している。
る。第1図において、1は翻訳装置、2は前処理
部、3は翻訳部、4は日本語解析部、5は英語生
成部をそれぞれ示している。
翻訳装置1は前処理部2と翻訳部3から構成さ
れている。前処理部2は、日本語文字列の入力テ
キストにおける外来語の片仮名文字列をアルフア
ベツト表記の英語単語に置き換え、この結果得ら
れるテキストを翻訳部に送る。翻訳部3は、日本
語解析部4と英語生成部5を有している。なお、
入力テキストは単語単位に分割されているもので
ある。日本語解析部4は、単語の品詞種別を調
べ、単語間の係り受け関係を調べるものである。
英語生成部5は、日本語解析部4の解析結果に従
つて英語を生成するものである。
れている。前処理部2は、日本語文字列の入力テ
キストにおける外来語の片仮名文字列をアルフア
ベツト表記の英語単語に置き換え、この結果得ら
れるテキストを翻訳部に送る。翻訳部3は、日本
語解析部4と英語生成部5を有している。なお、
入力テキストは単語単位に分割されているもので
ある。日本語解析部4は、単語の品詞種別を調
べ、単語間の係り受け関係を調べるものである。
英語生成部5は、日本語解析部4の解析結果に従
つて英語を生成するものである。
第2図は前処理部2の1実施例のブロツク図で
ある。第2図において、6は片仮名抽出部、7は
辞書アクセス部、8は日本語単語辞書、9は英語
単語辞書、10はテキスト併合部をそれぞれ示し
ている。片仮名列抽出部6は、入力テキストの中
から片仮名列を抽出し、抽出した片仮名列を辞書
アクセス部7に送り、片仮名以外をテキスト併合
部10に送るものである。辞書アクセス部7は、
送られて来た片仮名列に基づいて日本語単語辞書
8を検索し、該当する単語が日本語単語辞書8の
中に存在する場合には当該片仮名列をそのままテ
キスト併合部10に送り、該当する単語が日本語
単語辞書8に存在しない場合には英語単語辞書9
を検索し、該当するアルフアベツト表記の英語単
語をテキスト併合部10に送る。辞書アクセス部
7は、片仮名列抽出部6から送られて来た片仮名
列が日本語単語辞書8になく且つ英語単語辞書9
にもない場合には、送られて来た片仮名列をテキ
スト併合部10に送る。テキスト併合部10は、
送られて来たアルフアベツト表記の英語単語で以
て入力テキスト中の該当する片仮名列を置き換
え、その結果生成されるテキストを翻訳部3に送
る。日本語単語辞書8の中には複数の日本語単語
レコードが格納されており、日本語単語レコード
は仮名の見出フイールド、対応する漢字が格納さ
れる漢字フイールド、品詞種別を格納するフイー
ルド、使用回数を格納するフイールド及び単語を
表す記号が格納される記号フイールドなどから構
成されている。英語単語辞書9には複数の英語単
語レコードが格納されており、英語単語レコード
はアルフアベツトの見出フイールド、対応する片
仮名表記の英語単語を格納するフイールド、品詞
種別を格納するフイールド、使用回数を格納する
フイールド及び記号フイールドなどから構成され
ている。なお、コンセント等の和製英語は日本語
単語辞書8に格納される。
ある。第2図において、6は片仮名抽出部、7は
辞書アクセス部、8は日本語単語辞書、9は英語
単語辞書、10はテキスト併合部をそれぞれ示し
ている。片仮名列抽出部6は、入力テキストの中
から片仮名列を抽出し、抽出した片仮名列を辞書
アクセス部7に送り、片仮名以外をテキスト併合
部10に送るものである。辞書アクセス部7は、
送られて来た片仮名列に基づいて日本語単語辞書
8を検索し、該当する単語が日本語単語辞書8の
中に存在する場合には当該片仮名列をそのままテ
キスト併合部10に送り、該当する単語が日本語
単語辞書8に存在しない場合には英語単語辞書9
を検索し、該当するアルフアベツト表記の英語単
語をテキスト併合部10に送る。辞書アクセス部
7は、片仮名列抽出部6から送られて来た片仮名
列が日本語単語辞書8になく且つ英語単語辞書9
にもない場合には、送られて来た片仮名列をテキ
スト併合部10に送る。テキスト併合部10は、
送られて来たアルフアベツト表記の英語単語で以
て入力テキスト中の該当する片仮名列を置き換
え、その結果生成されるテキストを翻訳部3に送
る。日本語単語辞書8の中には複数の日本語単語
レコードが格納されており、日本語単語レコード
は仮名の見出フイールド、対応する漢字が格納さ
れる漢字フイールド、品詞種別を格納するフイー
ルド、使用回数を格納するフイールド及び単語を
表す記号が格納される記号フイールドなどから構
成されている。英語単語辞書9には複数の英語単
語レコードが格納されており、英語単語レコード
はアルフアベツトの見出フイールド、対応する片
仮名表記の英語単語を格納するフイールド、品詞
種別を格納するフイールド、使用回数を格納する
フイールド及び記号フイールドなどから構成され
ている。なお、コンセント等の和製英語は日本語
単語辞書8に格納される。
第3図は第2図の実施例の動作を説明する図で
ある。のようなテキストが入力されると、の
ような片仮名列が片仮名抽出部6から辞書アクセ
ス部7に送られ、のような文字列が片仮名抽出
部6からテキスト併合部10に送られ、のよう
なアルフアベツト文字列が辞書アクセス部7から
テキスト併合部10に送られ、のようなテキス
トがテキスト併合部10から出力される。
ある。のようなテキストが入力されると、の
ような片仮名列が片仮名抽出部6から辞書アクセ
ス部7に送られ、のような文字列が片仮名抽出
部6からテキスト併合部10に送られ、のよう
なアルフアベツト文字列が辞書アクセス部7から
テキスト併合部10に送られ、のようなテキス
トがテキスト併合部10から出力される。
翻訳部3は下記のような動作を行うものであ
る。例えば「私はSuper Computerを開発する。」
という文字列が翻訳部3に入力されたと仮定す
る。日本語解析部4は、入力テキストの単語の品
詞種別及び記号を調べる。「私」は代名詞、「は」
は係助詞、「Super Computer」は名詞、「を」は
格助詞、「開発する」は動詞という品詞種別を有
している。また、「私」は例えば001、「開発する」
は例えば005という記号を有している。次に日本
語解析部4は、「私」と「は」とが名詞文節を作
ること、「Super Computer」と「を」が名詞文
節を作ることを知り、更に「私は」という名詞文
節が「開発する」に係ること、「Super
Computerを」という名詞文節も「開発する」に
係ることを知る。日本語解析部4の解析結果は英
語生成部5に渡され、英語生成部5はこの解析結
果に基づいて「I develop a Super
Computer.」という英語文を生成する。
る。例えば「私はSuper Computerを開発する。」
という文字列が翻訳部3に入力されたと仮定す
る。日本語解析部4は、入力テキストの単語の品
詞種別及び記号を調べる。「私」は代名詞、「は」
は係助詞、「Super Computer」は名詞、「を」は
格助詞、「開発する」は動詞という品詞種別を有
している。また、「私」は例えば001、「開発する」
は例えば005という記号を有している。次に日本
語解析部4は、「私」と「は」とが名詞文節を作
ること、「Super Computer」と「を」が名詞文
節を作ることを知り、更に「私は」という名詞文
節が「開発する」に係ること、「Super
Computerを」という名詞文節も「開発する」に
係ることを知る。日本語解析部4の解析結果は英
語生成部5に渡され、英語生成部5はこの解析結
果に基づいて「I develop a Super
Computer.」という英語文を生成する。
以上の説明から明らかなように、本発明によれ
ば、辞書の容量を小さく出来ること及び機械翻訳
の負荷を軽減すること等の効果を奏することが出
来る。
ば、辞書の容量を小さく出来ること及び機械翻訳
の負荷を軽減すること等の効果を奏することが出
来る。
第1図は本発明の翻訳装置の1実施例の概要を
示す図、第2図は第1図の前処理部の1実施例の
ブロツク図、第3図は第2図の動作を説明するた
めの図である。 1……翻訳装置、2……前処理部、3……翻訳
部、4……日本語解析部、5……英語生成部、6
……片仮名抽出部、7……辞書アクセス部、8…
…日本語単語辞書、9……英語単語辞書、10…
…テキスト併合部。
示す図、第2図は第1図の前処理部の1実施例の
ブロツク図、第3図は第2図の動作を説明するた
めの図である。 1……翻訳装置、2……前処理部、3……翻訳
部、4……日本語解析部、5……英語生成部、6
……片仮名抽出部、7……辞書アクセス部、8…
…日本語単語辞書、9……英語単語辞書、10…
…テキスト併合部。
Claims (1)
- 【特許請求の範囲】 1 片仮名列抽出部と辞書アクセス部とテキスト
併合部とを有する前処理部、 翻訳部、 日本語単語辞書、及び 外国語単語辞書 を具備する機械翻訳装置であつて、 上記外国語単語辞書の中には、外国語文字表記
の文字列に対応して片仮名文字表記の文字列が書
き込まれ、 上記片仮名列抽出部は、入力テキスト中の片仮
名文字列を上記辞書アクセス部に送り、片仮名文
字列以外を上記テキスト併合部に送るように構成
され、 上記辞書アクセス部は、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にある場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記日本語単語辞書の中にない場合には、
送られて来た片仮名文字列と一致する片仮名文字
列が上記外国語単語辞書の中にあるか否かを調
べ、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にある場合には、
対応する外国語文字表記の文字列を上記テキスト
併合部に送り、 送られて来た片仮名文字列と一致する片仮名文
字列が上記外国語単語辞書の中にない場合には、
送られて来た片仮名文字列を上記テキスト併合部
に送るように構成され、 上記テキスト併合部は、送られてきた外国語文
字列に対応する入力テキスト中の片仮名文字列を
送られて来た外国語表記の文字列に置き換え、置
き換え済みのテキストを上記翻訳部に送るように
構成されている ことを特徴とする機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15448584A JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP15448584A JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6133577A JPS6133577A (ja) | 1986-02-17 |
| JPH0346865B2 true JPH0346865B2 (ja) | 1991-07-17 |
Family
ID=15585271
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP15448584A Granted JPS6133577A (ja) | 1984-07-25 | 1984-07-25 | 機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6133577A (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03211669A (ja) * | 1990-01-17 | 1991-09-17 | Nec Corp | 機械翻訳装置 |
| JP2761622B2 (ja) * | 1994-10-20 | 1998-06-04 | カシオ計算機株式会社 | 文字変換装置 |
-
1984
- 1984-07-25 JP JP15448584A patent/JPS6133577A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6133577A (ja) | 1986-02-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0689304A (ja) | テキスト処理システムにより使用されるテキストを準備する方法及び装置 | |
| Diab et al. | Automatic processing of modern standard Arabic text | |
| JPS59165179A (ja) | 辞書引方式 | |
| JPH0346865B2 (ja) | ||
| JPS5892063A (ja) | イデイオム処理方式 | |
| JPH0578058B2 (ja) | ||
| Nongmeikapam et al. | A transliteration of CRF based Manipuri POS tagging | |
| JP3285149B2 (ja) | 外国語電子辞書検索方法及び装置 | |
| JPS62130458A (ja) | かな漢字変換処理方式 | |
| JPS6154559A (ja) | 日本語処理装置 | |
| JP2915225B2 (ja) | 文書作成装置 | |
| JPH039502B2 (ja) | ||
| Tukur et al. | A Corpus-Based Approach to Parts-of-Speech Tagging of the Hausa-Based Texts Using Hidden Markov and Unigram Models | |
| JPH0350668A (ja) | 文字処理装置 | |
| JPS6154561A (ja) | 日本語処理装置 | |
| JPS59103136A (ja) | カナ漢字変換処理装置 | |
| Myint et al. | Morpheme-Based Myanmar Word Segmenter | |
| JPS63115264A (ja) | 文書処理装置 | |
| KR100248386B1 (ko) | 인간 가독형 형태소 접속 정보와 자종(字種) 정보를 이용한 일본어 형태소 분석 장치 및 그 방법 | |
| JPS61233862A (ja) | かな漢字変換装置 | |
| JPS6324359A (ja) | 翻訳支援装置 | |
| Segert et al. | A Computer Program for Analysis of Words According to Their Meaning (Conceptual analysis of Latin equivalents for the comparative dictionary of Semitic languages) | |
| JPH02110771A (ja) | 電訳機 | |
| Libben | Some fundamentals of ESL composition analysis | |
| JPH0357065A (ja) | 接尾語処理方式 |