JPH10307823A - 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体 - Google Patents

翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体

Info

Publication number
JPH10307823A
JPH10307823A JP9118948A JP11894897A JPH10307823A JP H10307823 A JPH10307823 A JP H10307823A JP 9118948 A JP9118948 A JP 9118948A JP 11894897 A JP11894897 A JP 11894897A JP H10307823 A JPH10307823 A JP H10307823A
Authority
JP
Japan
Prior art keywords
speech
combination
japanese
english
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9118948A
Other languages
English (en)
Inventor
Yoshifumi Hara
慶史 原
Kaoru Nihonmatsu
薫 二本松
Kenichiro Nishida
憲一郎 西田
Kosuke Suhara
康介 寿原
Toshihiko Yamaura
登志彦 山浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YUUNA KK
Original Assignee
YUUNA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YUUNA KK filed Critical YUUNA KK
Priority to JP9118948A priority Critical patent/JPH10307823A/ja
Publication of JPH10307823A publication Critical patent/JPH10307823A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 (修正有) 【課題】 人間の頭脳で行われる翻訳工程に従って、翻
訳処理を行う、方法、装置及び翻訳プログラム。 【解決手段】 日本語の語句と、この語句の品詞と、前
記語句に対応する少なくとも1以上の英語の語句とがそ
れぞれ対応づけられて登録されている辞書テーブルと、
日本語における品詞の組み合わせが、優先順位の高い順
に登録されている縮小テーブルと、日本語における品詞
の順序と、この品詞の順序を英語の文法に対応させた場
合の品詞の順序とが登録されている順序転換テーブル
と、日本語の語句の組み合わせ、この組み合わせに対応
する英語の語句の組み合わせ及び前記日本語の語句の組
み合わせの場合の英語文法に沿った英語の語句が対応づ
けられて登録されている変革テーブルとを記憶装置に格
納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は日本語を英語に翻訳
する技術に関し、特に日本語を英語に翻訳する方法、翻
訳装置及び翻訳プログラムが格納された記録媒体に関す
る。
【0002】
【従来の技術】近年の国際化によって日本語を英語に翻
訳する文書も増加しており、これに伴いコンピュータに
日本語を英語に翻訳させる翻訳プログラムも数多く流通
している。
【0003】
【発明が解決しようとする課題】しかし、現在流通して
いるプログラムは、人間の頭脳で行われる翻訳工程に従
って翻訳するものではなく、翻訳結果が満足するような
プログラムはなかった。そこで、本発明の目的は、人間
の頭脳で行われる翻訳工程に従って、翻訳処理を行う、
翻訳方法、翻訳装置及び翻訳プログラムが格納された記
録媒体を提供することにある。
【0004】
【課題を解決するための手段】上記本発明の目的は、日
本文を英文に翻訳する翻訳方法であって、日本語の語句
と、この語句の品詞と、前記語句に対応する少なくとも
1以上の英語の語句とがそれぞれ対応づけられて登録さ
れている辞書テーブルを記憶装置に格納する工程と、日
本語における品詞の組み合わせが、優先順位の高い順に
登録されている縮小テーブルを記憶装置に格納する工程
と、日本語における品詞の順序と、この品詞の順序を英
語の文法に対応させた場合の品詞の順序とが登録されて
いる順序転換テーブルを記憶装置に格納する工程と、日
本語の語句の組み合わせ、この組み合わせに対応する英
語の語句の組み合わせ及び前記日本語の語句の組み合わ
せの場合の英語文法に沿った英語の語句が対応づけられ
て登録されている変革テーブルを記憶装置に格納する工
程と、前記辞書テーブルを検索しながら入力された日本
文を品詞毎に語句に分割すると共に分割された品詞の語
句に対応する一つの英語の語句を前記辞書テーブルから
選択し、分割された語句、この語句の品詞及び前記語句
の選択された英語の語句を対応させて日本文の順序で記
憶装置の起動ファイルに格納する起動工程と、前記起動
ファイルに格納されている日本語の語句の品詞の組み合
わせを前記縮小テーブルから検索しながら、格納されて
いる日本文の文章構造と語句の修飾関係とを示す階層付
けを行い、結果を階層付けファイルに格納する階層付け
工程と、前記階層付けファイルに格納されている階層づ
けられた品詞の組み合わせを最も深い階層から浅い階層
に向かって、階層毎に、順序転換テーブルで検索して品
詞の順序を転換すると共に、該階層の日本語の語句の組
み合わせを前記変化テーブルから検索して変化させる英
語の語句を得て、これらの結果を階層付けファイルに更
新する前記変革工程と、前記階層付けファイルに格納さ
れた順番に英語の語句を読みだし、翻訳された英文を出
力する工程とを有することを特徴とする翻訳方法によっ
て達成される。
【0005】尚、入力された日本文を、最長一致法によ
って品詞毎に分割することが好ましい。又、上記階層付
け工程は、(a) 起動ファイルに登録されている順序
で先頭から順次二つの品詞を一組にする工程と、(b)
縮小テーブルに登録されている組み合わせを、(a)
工程の先頭の組から順番に検索し、ヒットした組み合わ
せについては階層を一つ深くする工程と、(c) ヒッ
トした組み合わせと前の品詞との組み合わせ及びヒット
した組み合わせと後の品詞との組み合わせを新たな組み
合わせとして、再び縮小テーブルに登録されている組み
合わせを検索し、ヒットした組み合わせについては階層
を一つ深くする工程と、(d) (b)と(c)との工
程を縮小テーブルの先頭に登録されている組み合わせか
ら最後に登録されている組み合わせまで行う工程とを有
する。
【0006】又、上記変革テーブルは、変化させる英語
の語句を辞書テーブルで用いているコードで登録してい
ることを特徴とする。又、上記変革工程は、(a) 所
定の階層の品詞の組み合わせを順序転換テーブルから検
索し、前記品詞の組み合わせに対応する品詞の順序を検
索して得られた順序に更新する工程と、(b) 前記所
定の階層の組における日本語の語句の組み合わせを変革
テーブルから検索し、前記所定の階層の組における日本
語の語句に対応した英語の語句を検索された組み合わせ
に対応する英語の語句に更新する工程と、(c)
(a)から(b)の工程を最も深い階層から最も浅い階
層まで繰り返し行う工程とを有することを特徴とする。
【0007】上記本発明の目的は、コンピュータによっ
て日本文を英文に翻訳する為の翻訳プログラムを記録し
た記録媒体であって、前記翻訳プログラムは、日本語の
語句と、この語句の品詞と、前記語句に対応する少なく
とも1以上の英語の語句とがそれぞれ対応づけられて登
録されている辞書テーブルを記憶装置に格納させ、日本
語における品詞の組み合わせが、優先順位の高い順に登
録されている縮小テーブルを記憶装置に格納させ、日本
語における品詞の順序と、この品詞の順序を英語の文法
に対応させた場合の品詞の順序とが登録されている順序
転換テーブルを記憶装置に格納させ、日本語の語句の組
み合わせ、この組み合わせに対応する英語の語句の組み
合わせ及び前記日本語の語句の組み合わせの場合の英語
文法に沿った英語の語句が対応づけられて登録されてい
る変革テーブルを記憶装置に格納させ、前記辞書テーブ
ルを検索しながら入力された日本文を品詞毎に語句に分
割すると共に分割された品詞の語句に対応する一つの英
語の語句を前記辞書テーブルから選択し、分割された語
句、この語句の品詞及び前記語句の選択された英語の語
句を対応させて日本文の順序で記憶装置の起動ファイル
し、前記起動ファイルに格納されている日本語の語句の
品詞の組み合わせを前記縮小テーブルから検索しなが
ら、格納されている日本文の文章構造と語句の修飾関係
とを示す階層付けを行い、結果を記憶装置の階層付けフ
ァイルに格納し、前記階層付けファイルに格納されてい
る階層づけられた品詞の組み合わせを最も深い階層から
浅い階層に向かって、階層毎に、順序転換テーブルで検
索して品詞の順序を転換すると共に、該階層の日本語の
語句の組み合わせを前記変化テーブルから検索して変化
させる英語の語句を得て、これらの結果を階層付けファ
イルに更新し、前記階層付けファイルに格納された順番
に英語の語句を読みだし、翻訳された英文を出力させる
ことを特徴とする翻訳プログラムを記録した記録媒体に
よって達成される。
【0008】尚、入力された日本文を、最長一致法によ
って品詞毎に分割することが好ましい。又、上記階層付
けは、(a) 起動ファイルに登録されている順序で先
頭から順次二つの品詞を一組にする工程と、(b) 縮
小テーブルに登録されている組み合わせを、(a)工程
の先頭の組から順番に検索し、ヒットした組み合わせに
ついては階層を一つ深くする工程と、(c) ヒットし
た組み合わせと前の品詞との組み合わせ及びヒットした
組み合わせと後の品詞との組み合わせを新たな組み合わ
せとして、再び縮小テーブルに登録されている組み合わ
せを検索し、ヒットした組み合わせについては階層を一
つ深くする工程と、(d) (b)と(c)との工程を
縮小テーブルの先頭に登録されている組み合わせから最
後に登録されている組み合わせまで行う工程とを行うこ
とを特徴とする。
【0009】又、上記変革テーブルは、変化させる英語
の語句を辞書テーブルで用いているコードで登録してい
る。又、階層付けファイルの更新は、(a) 所定の階
層の品詞の組み合わせを順序転換テーブルから検索し、
前記品詞の組み合わせに対応する品詞の順序を検索して
得られた順序に更新する工程と、(b) 前記所定の階
層の組における日本語の語句の組み合わせを変革テーブ
ルから検索し、前記所定の階層の組における日本語の語
句に対応した英語の語句を検索された組み合わせに対応
する英語の語句に更新する工程と、(c) (a)から
(b)の工程を最も深い階層から最も浅い階層まで繰り
返し行う工程とを行うことを特徴とする。
【0010】尚、上記記録媒体に格納された翻訳プログ
ラムは、コンピュータのFD又はCD−ROMドライブ
等により読み取り可能である。上記本発明の目的は、日
本文を英文に翻訳する翻訳装置であって、表示手段と、
入力手段と、日本語の語句と、この語句の品詞と、前記
語句に対応する少なくとも1以上の英語の語句とがそれ
ぞれ対応づけられて登録されている辞書テーブルと、日
本語における品詞の組み合わせが、優先順位の高い順に
登録されている縮小テーブルと、日本語における品詞の
順序と、この品詞の順序を英語の文法に対応させた場合
の品詞の順序とが登録されている順序転換テーブルと、
日本語の語句の組み合わせ、この組み合わせに対応する
英語の語句の組み合わせ及び前記日本語の語句の組み合
わせの場合の英語文法に沿った英語の語句が対応づけら
れて登録されている変革テーブルとが格納された記憶装
置と、前記辞書テーブルを検索しながら入力された日本
文を品詞毎に語句に分割すると共に分割された品詞の語
句に対応する一つの英語の語句を前記辞書テーブルから
選択し、分割された語句、この語句の品詞及び前記語句
の選択された英語の語句を対応させて日本文の順序で前
記記憶装置の起動ファイルに格納する第1の処理手段
と、前記起動ファイルに格納されている日本語の語句の
品詞の組み合わせを前記縮小テーブルから検索しなが
ら、格納されている日本文の文章構造と語句の修飾関係
とを示す階層付けを行い、結果を階層付けファイルに格
納する第2の処理手段と、前記階層付けファイルに格納
されている階層づけられた品詞の組み合わせを最も深い
階層から浅い階層に向かって、階層毎に、順序転換テー
ブルで検索して品詞の順序を転換すると共に、該階層の
日本語の語句の組み合わせを前記変化テーブルから検索
して変化させる英語の語句を得て、これらの結果を階層
付けファイルに更新する第3の処理手段と、前記階層付
けファイルに格納された順番に英語の語句を読みだし、
翻訳された英文を表示手段に表示する第4の処理手段と
を有することを特徴とする翻訳装置によって達成され
る。
【0011】尚、第1の処理手段は、入力された日本文
を、最長一致法によって品詞毎に分割することを特徴と
する。又、第2の処理手段は、(a) 起動ファイルに
登録されている順序で先頭から順次二つの品詞を一組に
する処理と、(b) 縮小テーブルに登録されている組
み合わせを、(a)処理の先頭の組から順番に検索し、
ヒットした組み合わせについては階層を一つ深くする処
理と、(c) ヒットした組み合わせと前の品詞との組
み合わせ及びヒットした組み合わせと後の品詞との組み
合わせを新たな組み合わせとして、再び縮小テーブルに
登録されている組み合わせを検索し、ヒットした組み合
わせについては階層を一つ深くする処理と、(d)
(b)と(c)との処理を縮小テーブルの先頭に登録さ
れている組み合わせから最後に登録されている組み合わ
せまで繰り返し行う処理とを行うことを特徴とする。
【0012】又、第3の処理手段は、(a) 所定の階
層の品詞の組み合わせを順序転換テーブルから検索し、
前記品詞の組み合わせに対応する品詞の順序を検索して
得られた順序に更新する処理と、(b) 前記所定の階
層の組における日本語の語句の組み合わせを変革テーブ
ルから検索し、前記所定の階層の組における日本語の語
句に対応した英語の語句を検索された組み合わせに対応
する英語の語句に更新する処理と、(c) (a)から
(b)の工程を最も深い階層から最も浅い階層まで繰り
返し行う処理とを行うことを特徴とする。
【0013】尚、第1〜第4の処理手段はコンピュータ
のCPUであり、表示手段はディスプレイやプリンタ等
であり、入力手段はキーボードやマウス等である。
【0014】
【発明の実施の形態】本発明の実施の形態を図面を参照
しながら説明する。まず、本実施の形態の翻訳装置(コ
ンピュータ)について説明する。尚、図1は翻訳装置
(コンピュータ)の斜視図、図2は翻訳装置(コンピュ
ータ)のブロック図である。
【0015】図中、1はコンピュータ本体(CPU)で
あり、他の装置の制御及び本翻訳プログラムに従ってデ
ータを処理するものである。2は表示装置(ディスプレ
イ)であり、入力された日本文の表示や翻訳された英文
等を表示するものである。3はプリンタであり、翻訳さ
れた英文をプリントアウトする為のものである。4は入
力装置(キーボード、マウス)であり、翻訳しようとす
る日本文の入力や他のデータを入力する際に用いられ
る。5はFD(フロッピーディスク)、6はCD−RO
Mであり、本発明の翻訳プログラムが格納されている。
7はFDドライブ、8はCD−ROMドライブであり、
FD5又はCD−ROM6に格納されている翻訳プログ
ラムを読み取る為のものである。9はHDユニット(主
記憶装置)であり、FDドライブ7又はCD−ROMド
ライブ8で読み取られた翻訳プログラムや、後述する各
テーブル及びファイルが格納されるものである。
【0016】次に、本実施の形態の動作を説明する。本
実施の形態では、起動処理、縮小処理及び自己変革処理
の順に処理を行い、日本語を英語に翻訳する。ここで、
起動処理とは入力された日本語(日本文)を種別に仕分
ける処理を言い、縮小処理とは起動処理で仕分けられた
データを群にする処理を言い、自己変革処理とは縮小処
理で群にされたデータを意味のあるデータに変革して統
合する処理を言う。
【0017】又、起動処理では辞書テーブルが使用さ
れ、縮小処理では縮小テーブルが使用され、自己変革処
理では自己変革テーブル及び順序転換テーブルが使用さ
れる。尚、各テーブルについては、後述する各処理の説
明において、詳細に説明する。次に、図3のジェネラル
フロー及び図4の概要図を用いて、日本語が起動処理か
ら自己変革処理までの処理が行われて英語に翻訳される
までの動作の概要を説明する。
【0018】まず、翻訳しようとする日本文を入力する
(Step100)。続いて、入力された日本文を、辞
書テーブルを検索しながら最長一致法に基づいて品詞毎
に語句に分割すると共に、分割した語句に対応する英語
を選択する(Step101)。そして、処理結果を起
動ファイルに登録する(Step102)。ここまでの
処理が起動処理である。尚、最長一致法及び起動ファイ
ルについては、後に詳細に説明する。
【0019】次に、縮小テーブルの最初から起動ファイ
ルの隣り合う2つの品詞の組み合わせを検索し(Ste
p103)、検索した結果に基づいて品詞同士の結合を
行い、結合した箇所に階層付けを行っていく(Step
104)。そして、Step103とStep104と
を縮小テーブルの最後まで行って階層付けをし、階層付
けファイルに登録する(Step105)。これらの処
理が縮小処理である。尚、階層付けファイルについて
は、後に詳細に説明する。
【0020】続いて、階層付けファイルを読み込み、深
い階層から順序転換テーブルと自己変革テーブルとを検
索し(Step106)、検索した結果、一致するデー
タがあれば順序転換及び自己変革を行いデータを更新し
て階層付けファイルを更新する(Step107)。そ
して、Step106及びStep107を最も浅い階
層まで行って終了する(Step108)。最後に、更
新されたファイルの英語の部分のみを抽出し、翻訳され
た英語を表示又は出力する(Step109)。これら
の処理が自己変革処理である。
【0021】続いて、各処理について詳細に説明する。 1.起動処理 (1) 辞書テーブル 辞書テーブルは、日本語の語句と、この語句の品詞と、
前記語句に対応する全ての英単語(語句)が対応づけら
れて登録されている。
【0022】例えば、図5、図6に示されるとおり、
「写真」と言う語句に対して「名詞」と言う品詞、「偉
大な」と言う語句に対して「形容詞」と言う品詞、「翻
訳する」と言う語句に対して「動詞」と言う品詞であ
る。更に、例えば、「写真」と言う語句に対して英語の
the+単数、a+単数及びthe+複数等、「偉大
な」と言う語句に対して原級、the+原級及びa+原
級等、「翻訳する」と言う語句に対して三人称単数現
在、二〜三人称複数現在及び過去形等の複数の英語の候
補群が登録されている。
【0023】これは英語にあって日本語には無い習慣と
して、主語の人称や単数、複数によって動詞の形が変化
したり、物の数、特定か不特定かによって名詞の形が変
化するか、又は使用法が異なったりする場合がある為で
ある。従って、辞書テーブルには英単語として取得され
うる全てのパターンの登録がされている。パターンは品
詞毎にパターンを持っており、品詞によっては英語の候
補として一つしか持たないものもある。又、複数の英単
語の候補を持つ品詞は、品詞単位で使用頻度が高い順の
単語を想定した登録順序となっている(具体的には、三
人称・単数・現在形の主語となるケースが多い)。
【0024】更に、日本語と英語の品詞を比較すると、
日本語にはあるが英語には無い品詞、又はその逆の品詞
が存在する。例えば、助詞、形容動詞、連体詞、疑問助
詞及び終助詞は、日本語にはあるが英語には無い。又、
前置詞及び間投詞は、英語にはあるが日本語には無い。
システム内では、パターン分けされた共通の品詞として
扱われる必要がある為、これらの品詞はシステム内独自
の品詞として区分けされている。
【0025】又、日本語段階で活用が行われる品詞(動
詞・形容詞他等)があり、これについては日本語の段階
での活用を行う。「翻訳する」の例ではサ変動詞に当た
るので、日本文の中で使用される時は下記の活用表の中
での使用が行われている。 未然形 連用形 終止形 連体形 仮定形 命令形 登録形 翻訳し 翻訳し 翻訳する 翻訳する 翻訳すれ 翻訳しろ 予定される 送り仮名 ない ます とき ば (よ) この為、活用を持つ(日本語の品詞上)語は活用を行っ
てから、該当する英語を登録する。上述の例では、未然
形〜命令形迄の全て「translate」という英訳
語を登録する。
【0026】又、上述の例では、サ行・変革活用の5通
り×「translate」の動詞パターンである24
通りの合計120パターンが登録される事になる。最後
に、具体的な辞書テーブルの登録について述べる図7は
辞書テーブルの登録イメージである。図7の例では「写
真」という日本語に対して英語「the pictur
e」が登録されている様子を示している。尚、a0は日
本語の名詞を示す品詞コード、pictは対応する英単
語の頭4文字、a001は写真に対応する英単語として
登録されている順番を示す番号、シャシンは「写真」の
仮名文字を示しており、zは字数があまった場合に用い
られる。
【0027】そして、上述の組みが「写真」という日本
語に対して、変化し得る6パターンの英単語がセットで
登録されている。尚、「zzzz」は英単語への表記を
行わないという意味で、英単語の複数候補を持つ語句の
最後尾に必ず登録されている。 (2) 最長一致法 次に、入力された日本文を品詞毎に語句に区切る為の最
長一致法について説明する。英語の文章は「ピリオ
ド(.)」によって文章の切れ目や分かれ目が分かり、
かつ一つの文章を見ても各語のブロックがスペースによ
って区切られている。この為、語と語との区切り目が分
からないという事が無い。
【0028】これに対して日本語の文章を大まかなイメ
ージで見てみると、漢字及びカナ文字が切れ目なく並ん
でおり「句点(。)」で一つの文章が終わる形となって
いる。この為、少し見ただけでは語の切れ目が分から
ず、分かるのは「句点(。)」によって文章の終了が分
かるのみである。辞書を引いてみないと、語句の切れ目
として妥当かどうかわからないという面をもっている。
【0029】そこで、辞書を引くという処理を機械上で
行おうとした場合、 (a)最初の文字で辞書領域を検索する。 (b)最初の文字+1文字分で辞書領域を検索する。 (c)最初の文字+2文字分で辞書領域を検索する。 (d)最初の文字+3文字分で辞書領域を検索する。
【0030】 ・・・・・・・・・・・・・・・・・・・・・・・・ (n)最初の文字+N文字分で辞書領域を検索する。 といった一連の動作が、一つの語句を得る為に必要とな
る。図8では「国」、「国会」及び「国会議事堂」とい
う字句が辞書領域に該当する単語として検索出来た事を
示している。そして、それらの中で「国会議事堂」を候
補として採用する。この採用方法は、検索出来た結果の
中で最長の文字数の語句を採用する最長一致法という方
法である。
【0031】図9では「私」という語句から検索を開始
し、人間の目で見ればそれ以降の文字と検索しても、辞
書領域に該当無しとなる事は一目瞭然であるが、コンピ
ュータ上の処理では文の終わりまで必ず検索する。又、
「私」という語句が得られた後、「は」以降を検索し、
結局、助詞の「は」が検索結果として得られる事にな
る。同様にして、「は」が得られた後「写」以降の文字
列を検索していき、それぞれの検索結果を得る。
【0032】(3)起動処理の内容 最後に、起動処理について、図10、図11及び図12
を参照して具体的に説明する。尚、ここでは「私は写真
を持っています。」と言う例文が入力された場合を想定
して説明を行う。まず、日本文「私は写真を持っていま
す。」がテキスト形式で入力される(Step20
0)。
【0033】この日本文に対して、(1)辞書領域の検
索、(2)文→語句への切り出しが行われる(Step
201)。その結果、図11の様な語の切り分け及び情
報の付加が行われる。図11を詳しく説明すると、
「は」にはbe動詞の意味が与えてある。これは「花は
きれいだ。」という様な例文の場合、英語辞書上は動詞
が無い様な型式になってしまう為、便宜的に設けてあ
る。しかし、「持つ」という動詞がある為に「は」のb
e動詞は不要となるが、後の処理(自己変革処理)で
「は」に対応する「is」を消す作業が行われる。
【0034】又、「い」、「ます」の様な英単語を特に
表記しない場合、「zzzz」を設定される。又、「持
つ」の英単語「have」は、主語が「I」である事を
考慮すると「have」となるべきであり、「has」
は正しくない。又、「写真」の「the pictur
e」も「a picture」となるべきところである
が、これらの人称,単数複数,定冠詞,不定冠詞の調整
といった作業は後続の「自己変革処理」時で行い、起動
処理ステップ段階では何も考慮されない。この段階では
日本語に対する英語の候補の内、一番最初に登録されて
いる英単語をピックアップするのみである。
【0035】尚、品詞の対応品詞名は、上述したaoの
ように各品詞に内部コードが付されている。最後にこれ
らの結果を起動ファイルに格納する(Step20
2)。尚、図12は図11の内容を起動ファイルに格納
する際のイメージ図である。 2.縮小処理 縮小処理は、起動処理が行われた文章(起動ファイル)
の構造を解析し、その解析結果により文章の内部の修飾
関係を明確にした形で表す目的で行われる。
【0036】(1)縮小テーブル、ファイル及び語句の
説明 縮小処理で用いられる用語について説明する。階層と
は、文章の構造と語句との修飾関係を言う。階層付けと
は、縮小動作によって解析された日本語の構造、語句の
修飾関係を階層づけることを言い、階層が付けられる毎
にどの語句がどの階層に属しているかを示すため、ファ
イルが更新される。
【0037】階層付けファイルとは、縮小処理の結果を
示すファイルで、縮小処理により階層が付けられてい
る。縮小テーブルとは、品詞の組み合わせで表され、階
層付けの優先順位を表すテーブルを言う。 (2)縮小処理の内容 図13のフローチャート、及び図14、図15を参照し
ながら縮小処理を説明する。
【0038】まず、起動ファイルを読み込む(Step
300)。縮小テーブルの1行目の品詞の組み合わせ
で、読み込まれた起動ファイルの品詞情報を文の先頭か
ら2組ずつ文の最後まで検索する(Step301)。
一致する組み合わせがあれば(Step302)、階層
付けを行う(Step303)。そして、Step30
1の動作を繰り返す。一致する組み合わせがない場合に
は(Step302)、縮小テーブルの2行目の品詞の
組み合わせで起動ファイルの品詞情報を検索する(St
ep301)。
【0039】Step301〜Step303の様に検
索を行い、一致する組み合わせがあれば常に縮小テーブ
ルの1行目から検索を行い、一致する組み合わせがない
場合には2行目以降の検索を行う。「縮小テーブル」の
1行目から最終行まで起動ファイルを検索して一致しな
い場合には(Step303)、縮小処理を終了して階
層付けファイルとして出力する(Step304)。
尚、図14、図15は、階層付けファイルと、品詞の包
含関係がどのようになっているかをイメージで示した図
である。
【0040】3.自己変革処理 (1)日本語と英語の特徴と相違点 自己変革処理の説明を行う前に、先ず、日本語と英語と
それぞれの特長と相違点とを簡単に述べると、 (a)日本語と英語の文章では各単語の並び順(語順)
が違う。
【0041】(b)日本語では余り意識していない人
称,時制等を反映させる必要がある。などの違いがあり
(a)に関することを反映させるのが順序転換で(b)
に関することを反映させるのが自己変革である。 (a)について、例えば、「私は写真を持っていま
す。」と言う文と「机に」との場合は、図16の様に日
本語と英語との語の並びは異なる。この違いを補正する
動作を順序転換と言う。
【0042】又、(b)については、日本語と英語とで
は文法上以下の様な違いがある。 人称・・・・日本語では人称で動詞に変化はないが、英
語では“動詞”自体に変化がある。 時制・・・・日本語では時制は助動詞によって表される
が、英語では“動詞”自体で表される。
【0043】単数・複数・・日本語では前後の語によっ
て単数・複数を表されるが、英語では“語”自体も単数
複数を表す必要がある。 以上の人称、時制及び単数・複数の表現は日本語では余
り意識しないが、英語では“語”自体を変化させる必要
がある。この変化を行う動作を自己変革と言う。
【0044】上述の二つの処理を自己変革処理と言う。 (2)使用テーブルの説明 自己変革処理では、順序転換テーブルと自己変革テーブ
ルとを使用する。順序転換テーブルとは、品詞の組み合
わせで“品詞”の順番を管理しているテーブルである。
又、自己変革テーブルとは、日本語と登録順序とを表す
連番で英語の変化を管理しているテーブルである。
【0045】以下、詳細に説明する。 (3)順序転換テーブル 順序転換テーブルについて図17、図18を用いて説明
する。順序転換テーブルは以下の様な形式をしている。 (aozzzzzzz)(k2zzzzzzz) (zzzzzzzz2)(zzzzzzzz1) ここで、(aozzzzzzz)及び(k2zzzzz
zz)は、品詞の並びを表現しており、下の(zzzz
zzzz2)及び(zzzzzzzz1)は英語での品
詞の並びを表現している。
【0046】例えば、図17、図18に示される「机
に」と言う文を例にとると、起動処理で区切られた
「机」と「に」とにそれぞれ英語を対応させると、 「机」=(aozzzzzzz)=「the des
k」 「に」=(k2zzzzzzz)=「on」 となる。
【0047】ここで日本語に英語を対応させただけの場
合は「机に」は「the deskon」となる。しか
し、英語では「机に」は「on the desk」と
なるので日本語から対応させた場合と比べ語順が異な
る。そこで、順序変換テーブルを検索すると、以下の2
行が検出される。
【0048】 (aozzzzzzz)(k2zzzzzzz) (zzzzzzzz2)(zzzzzzzz1) 従って、「机」が(zzzzzzzz2)であり、
「に」(zzzzzzzz1)なので、「に」が前とな
り「机」が後ろとなって「に机」となる。 (4)自己変革テーブル 自己変革テーブルは図19、図20のような形式を持
ち、上の行の登録順序を示すコードが他のコードに変化
することにより、英語が変化する。
【0049】例えば、「私(代名詞,aa,I,a00
1)」と「は(助詞,f0,is,a001)」の場合
を自己変革テーブルで検索すると、図19、図20に示
される通り、「私」は「I」のままであり、「は」は
(a001)が(a017)に変わるので、辞書テーブ
ルを検索して(a017)に該当する英単語を抽出し、
「は」を「am」に変換する。
【0050】(5)自己変革処理の内容 以下、図21のフローチャート及び図22、図23を用
いて処理の内容を説明する。まず、縮小処理から引きづ
かれた階層付けファイルを読み込む(Step40
0)。
【0051】最も深い階層の2ブロックでそれぞれ品詞
コードを抽出し(Step401)、順序転換テーブル
の検索を行って情報を得る(Step402)。同様に
同じ2ブロックの最初の語と最後の語とで、自己変革テ
ーブルの検索を行って自己変革の情報を得る(Step
403)。Step402とStep403とで得た情
報により、階層付けファイルを更新する(Step40
4)。
【0052】Step401〜Step404までの処
理を最も浅い階層まで行う(Step405)。そし
て、最も浅い階層まで行ったら、階層付けファイルに登
録されている順で英語を取り出し、翻訳文として出力す
る(Step406)。尚、本発明は他の言語、例えば
日本語からドイツ語等にも応用することが出来る。
【0053】
【発明の効果】本発明によれば、起動、縮小及び自己変
革の処理を経ることにより、人間の思考に近い翻訳をす
ることが可能であり、複雑な処理プログラムを必要とし
ないという効果がある。
【図面の簡単な説明】
【図1】翻訳装置(コンピュータ)の斜視図
【図2】翻訳装置(コンピュータ)のブロック図
【図3】処理のジェネラルフロー
【図4】各処理の概念図
【図5】辞書テーブルの概念図
【図6】辞書テーブルの概念図
【図7】辞書テーブルの登録イメージ図
【図8】最長一致法を説明する為の図
【図9】最長一致法を説明する為の図
【図10】起動処理のフローチャート
【図11】起動処理後のイメージ図
【図12】起動ファイルの登録イメージ図
【図13】縮小処理のフローチャート
【図14】縮小処理を説明する為の図
【図15】縮小処理を説明する為の図
【図16】自己変革処理を説明する為の図
【図17】順序変換テーブルを説明する為の図
【図18】順序変換テーブルを説明する為の図
【図19】自己変革テーブルを説明する為の図
【図20】自己変革テーブルを説明する為の図
【図21】自己変革処理のフローチャート
【図22】自己変革処理を説明する為の図
【図23】自己変革処理を説明する為の図
【符号の説明】
1 コンピュータ本体(CPU) 2 表示装置(ディスプレイ) 3 プリンタ 4 入力装置(キーボード、マウス) 5 FD(フロッピーディスク) 6 CD−ROM 7 FDドライブ 8 CD−ROMドライブ 9 HDユニット
───────────────────────────────────────────────────── フロントページの続き (72)発明者 寿原 康介 東京都調布市小島町3−69−14 株式会社 ユーナ内 (72)発明者 山浦 登志彦 東京都調布市小島町3−69−14 株式会社 ユーナ内

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 日本文を英文に翻訳する翻訳方法であっ
    て、 日本語の語句と、この語句の品詞と、前記語句に対応す
    る少なくとも1以上の英語の語句とがそれぞれ対応づけ
    られて登録されている辞書テーブルを記憶装置に格納す
    る工程と、 日本語における品詞の組み合わせが、優先順位の高い順
    に登録されている縮小テーブルを記憶装置に格納する工
    程と、 日本語における品詞の順序と、この品詞の順序を英語の
    文法に対応させた場合の品詞の順序とが登録されている
    順序転換テーブルを記憶装置に格納する工程と、 日本語の語句の組み合わせ、この組み合わせに対応する
    英語の語句の組み合わせ及び前記日本語の語句の組み合
    わせの場合の英語文法に沿った英語の語句が対応づけら
    れて登録されている変革テーブルを記憶装置に格納する
    工程と、 前記辞書テーブルを検索しながら入力された日本文を品
    詞毎に語句に分割すると共に分割された品詞の語句に対
    応する一つの英語の語句を前記辞書テーブルから選択
    し、分割された語句、この語句の品詞及び前記語句の選
    択された英語の語句を対応させて日本文の順序で記憶装
    置の起動ファイルに格納する起動工程と、 前記起動ファイルに格納されている日本語の語句の品詞
    の組み合わせを前記縮小テーブルから検索しながら格納
    されている日本文の文章構造と語句の修飾関係とを示す
    階層付けを行い、結果を階層付けファイルに格納する階
    層付け工程と、 前記階層付けファイルに格納されている階層づけられた
    品詞の組み合わせを最も深い階層から浅い階層に向かっ
    て、階層毎に、順序転換テーブルで検索して品詞の順序
    を転換すると共に、該階層の日本語の語句の組み合わせ
    を前記変化テーブルから検索して変化させる英語の語句
    を得て、これらの結果を階層付けファイルに更新する前
    記変革工程と、 前記階層付けファイルに格納された順番に英語の語句を
    読みだし、翻訳された英文を出力する工程とを有するこ
    とを特徴とする翻訳方法。
  2. 【請求項2】 入力された日本文を、最長一致法によっ
    て品詞毎に分割することを特徴とする請求項1の翻訳方
    法。
  3. 【請求項3】 階層付け工程は、 (a) 起動ファイルに登録されている順序で先頭から
    順次二つの品詞を一組にする工程と、 (b) 縮小テーブルに登録されている組み合わせを、
    (a)工程の先頭の組から順番に検索し、ヒットした組
    み合わせについては階層を一つ深くする工程と、 (c) ヒットした組み合わせと前の品詞との組み合わ
    せ及びヒットした組み合わせと後の品詞との組み合わせ
    を新たな組み合わせとして、再び縮小テーブルに登録さ
    れている組み合わせを検索し、ヒットした組み合わせに
    ついては階層を一つ深くする工程と、 (d) (b)と(c)との工程を縮小テーブルの先頭
    に登録されている組み合わせから最後に登録されている
    組み合わせまで行う工程とを有することを特徴とする請
    求項1又は請求項2の翻訳方法。
  4. 【請求項4】 変革テーブルは、変化させる英語の語句
    を辞書テーブルで用いているコードで登録していること
    を特徴とする請求項1から請求項3のいずれかに記載の
    翻訳方法。
  5. 【請求項5】 前記変革工程は、 (a) 所定の階層の品詞の組み合わせを順序転換テー
    ブルから検索し、前記品詞の組み合わせに対応する品詞
    の順序を検索して得られた順序に更新する工程と、 (b) 前記所定の階層の組における日本語の語句の組
    み合わせを変革テーブルから検索し、前記所定の階層の
    組における日本語の語句に対応した英語の語句を検索さ
    れた組み合わせに対応する英語の語句に更新する工程
    と、 (c) (a)から(b)の工程を最も深い階層から最
    も浅い階層まで繰り返し行う工程とを有することを特徴
    とする請求項1から請求項4のいずれかに記載の翻訳方
    法。
  6. 【請求項6】 コンピュータによって日本文を英文に翻
    訳する為の翻訳プログラムを記録した記録媒体であっ
    て、前記翻訳プログラムは、 日本語の語句と、この語句の品詞と、前記語句に対応す
    る少なくとも1以上の英語の語句とがそれぞれ対応づけ
    られて登録されている辞書テーブルを記憶装置に格納さ
    せ、 日本語における品詞の組み合わせが、優先順位の高い順
    に登録されている縮小テーブルを記憶装置に格納させ、 日本語における品詞の順序と、この品詞の順序を英語の
    文法に対応させた場合の品詞の順序とが登録されている
    順序転換テーブルを記憶装置に格納させ、 日本語の語句の組み合わせ、この組み合わせに対応する
    英語の語句の組み合わせ及び前記日本語の語句の組み合
    わせの場合の英語文法に沿った英語の語句が対応づけら
    れて登録されている変革テーブルを記憶装置に格納さ
    せ、 前記辞書テーブルを検索しながら入力された日本文を品
    詞毎に語句に分割すると共に分割された品詞の語句に対
    応する一つの英語の語句を前記辞書テーブルから選択
    し、分割された語句、この語句の品詞及び前記語句の選
    択された英語の語句を対応させて日本文の順序で記憶装
    置の起動ファイルし、 前記起動ファイルに格納されている日本語の語句の品詞
    の組み合わせを前記縮小テーブルから検索しながら、格
    納されている日本文の文章構造と語句の修飾関係とを示
    す階層付けを行い、結果を記憶装置の階層付けファイル
    に格納し、 前記階層付けファイルに格納されている階層づけられた
    品詞の組み合わせを最も深い階層から浅い階層に向かっ
    て、階層毎に、順序転換テーブルで検索して品詞の順序
    を転換すると共に、該階層の日本語の語句の組み合わせ
    を前記変化テーブルから検索して変化させる英語の語句
    を得て、これらの結果を階層付けファイルに更新し、 前記階層付けファイルに格納された順番に英語の語句を
    読みだし、翻訳された英文を出力させることを特徴とす
    る翻訳プログラムを記録した記録媒体。
  7. 【請求項7】 入力された日本文を、最長一致法によっ
    て品詞毎に分割することを特徴とする請求項6の翻訳プ
    ログラムを記録した記録媒体。
  8. 【請求項8】 階層付けは、 (a) 起動ファイルに登録されている順序で先頭から
    順次二つの品詞を一組にする工程と、 (b) 縮小テーブルに登録されている組み合わせを、
    (a)工程の先頭の組から順番に検索し、ヒットした組
    み合わせについては階層を一つ深くする工程と、 (c) ヒットした組み合わせと前の品詞との組み合わ
    せ及びヒットした組み合わせと後の品詞との組み合わせ
    を新たな組み合わせとして、再び縮小テーブルに登録さ
    れている組み合わせを検索し、ヒットした組み合わせに
    ついては階層を一つ深くする工程と、 (d) (b)と(c)との工程を縮小テーブルの先頭
    に登録されている組み合わせから最後に登録されている
    組み合わせまで行う工程とを行うことを特徴とする請求
    項6又は請求項7の翻訳プログラムを記録した記録媒
    体。
  9. 【請求項9】 変革テーブルは、変化させる英語の語句
    を辞書テーブルで用いているコードで登録していること
    を特徴とする請求項6から請求項8のいずれかに記載の
    翻訳プログラムを記録した記録媒体。
  10. 【請求項10】 階層付けファイルの更新は、 (a) 所定の階層の品詞の組み合わせを順序転換テー
    ブルから検索し、前記品詞の組み合わせに対応する品詞
    の順序を検索して得られた順序に更新する工程と、 (b) 前記所定の階層の組における日本語の語句の組
    み合わせを変革テーブルから検索し、前記所定の階層の
    組における日本語の語句に対応した英語の語句を検索さ
    れた組み合わせに対応する英語の語句に更新する工程
    と、 (c) (a)から(b)の工程を最も深い階層から最
    も浅い階層まで繰り返し行う工程とを行うことを特徴と
    する請求項6から請求項9のいずれかに記載の翻訳プロ
    グラムを記録した記録媒体。
  11. 【請求項11】 日本文を英文に翻訳する翻訳装置であ
    って、 表示手段と、 入力手段と、 日本語の語句と、この語句の品詞と、前記語句に対応す
    る少なくとも1以上の英語の語句とがそれぞれ対応づけ
    られて登録されている辞書テーブルと、 日本語における品詞の組み合わせが、優先順位の高い順
    に登録されている縮小テーブルと、 日本語における品詞の順序と、この品詞の順序を英語の
    文法に対応させた場合の品詞の順序とが登録されている
    順序転換テーブルと、 日本語の語句の組み合わせ、この組み合わせに対応する
    英語の語句の組み合わせ及び前記日本語の語句の組み合
    わせの場合の英語文法に沿った英語の語句が対応づけら
    れて登録されている変革テーブルとが格納された記憶装
    置と、 前記辞書テーブルを検索しながら入力された日本文を品
    詞毎に語句に分割すると共に分割された品詞の語句に対
    応する一つの英語の語句を前記辞書テーブルから選択
    し、分割された語句、この語句の品詞及び前記語句の選
    択された英語の語句を対応させて日本文の順序で前記記
    憶装置の起動ファイルに格納する第1の処理手段と、 前記起動ファイルに格納されている日本語の語句の品詞
    の組み合わせを前記縮小テーブルから検索しながら、格
    納されている日本文の文章構造と語句の修飾関係とを示
    す階層付けを行い、結果を階層付けファイルに格納する
    第2の処理手段と、 前記階層付けファイルに格納されている階層づけられた
    品詞の組み合わせを最も深い階層から浅い階層に向かっ
    て、階層毎に、順序転換テーブルで検索して品詞の順序
    を転換すると共に、該階層の日本語の語句の組み合わせ
    を前記変化テーブルから検索して変化させる英語の語句
    を得て、これらの結果を階層付けファイルに更新する第
    3の処理手段と、 前記階層付けファイルに格納された順番に英語の語句を
    読みだし、翻訳された英文を表示手段に表示する第4の
    処理手段とを有することを特徴とする翻訳装置。
  12. 【請求項12】 第1の処理手段は、入力された日本文
    を、最長一致法によって品詞毎に分割することを特徴と
    する請求項11の翻訳装置。
  13. 【請求項13】 第2の処理手段は、 (a) 起動ファイルに登録されている順序で先頭から
    順次二つの品詞を一組にする処理と、 (b) 縮小テーブルに登録されている組み合わせを、
    (a)処理の先頭の組から順番に検索し、ヒットした組
    み合わせについては階層を一つ深くする処理と、 (c) ヒットした組み合わせと前の品詞との組み合わ
    せ及びヒットした組み合わせと後の品詞との組み合わせ
    を新たな組み合わせとして、再び縮小テーブルに登録さ
    れている組み合わせを検索し、ヒットした組み合わせに
    ついては階層を一つ深くする処理と、 (d) (b)と(c)との処理を縮小テーブルの先頭
    に登録されている組み合わせから最後に登録されている
    組み合わせまで繰り返し行う処理とを行うことを特徴と
    する請求項11又は請求項12の翻訳装置。
  14. 【請求項14】 第3の処理手段は、 (a) 所定の階層の品詞の組み合わせを順序転換テー
    ブルから検索し、前記品詞の組み合わせに対応する品詞
    の順序を検索して得られた順序に更新する処理と、 (b) 前記所定の階層の組における日本語の語句の組
    み合わせを変革テーブルから検索し、前記所定の階層の
    組における日本語の語句に対応した英語の語句を検索さ
    れた組み合わせに対応する英語の語句に更新する処理
    と、 (c) (a)から(b)の工程を最も深い階層から最
    も浅い階層まで繰り返し行う処理とを行うことを特徴と
    する請求項11から請求項13のいずれかに記載の翻訳
    装置。
JP9118948A 1997-05-09 1997-05-09 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体 Pending JPH10307823A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9118948A JPH10307823A (ja) 1997-05-09 1997-05-09 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9118948A JPH10307823A (ja) 1997-05-09 1997-05-09 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体

Publications (1)

Publication Number Publication Date
JPH10307823A true JPH10307823A (ja) 1998-11-17

Family

ID=14749224

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9118948A Pending JPH10307823A (ja) 1997-05-09 1997-05-09 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体

Country Status (1)

Country Link
JP (1) JPH10307823A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167805A (ja) * 2016-03-16 2017-09-21 株式会社東芝 表示支援装置、方法およびプログラム
JP2020057401A (ja) * 2016-03-16 2020-04-09 株式会社東芝 表示支援装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017167805A (ja) * 2016-03-16 2017-09-21 株式会社東芝 表示支援装置、方法およびプログラム
JP2020057401A (ja) * 2016-03-16 2020-04-09 株式会社東芝 表示支援装置、方法およびプログラム

Similar Documents

Publication Publication Date Title
CN102982021B (zh) 用于消除语言转换中的多个读法的歧义的方法
JP2016186805A (ja) 中国語、日本語、および韓国語の言語データを電子的形態で管理するためのモジュラーシステムと方法
CN103970798B (zh) 数据的搜索和匹配
JP2016186805A5 (ja)
JP3038079B2 (ja) 自動翻訳装置
JP2012248210A (ja) 日本語などの複雑言語のコンテンツを検索するシステム及び方法
JPS63231674A (ja) コンピュータによる形態論的テキスト解析方法
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur
US20070011160A1 (en) Literacy automation software
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
JPH10307823A (ja) 翻訳方法、翻訳装置及び翻訳プログラムを格納した 記録媒体
JP2001060194A (ja) 企画支援装置、企画支援方法および企画支援プログラムを格納したコンピュータ読取り可能な記録媒体
Sinha Computer Processing of Indian Languages and Scripts—Potentialities & Problems
Waldispühl et al. Material philology meets digital onomastic lexicography: The NordiCon database of medieval nordic personal names in continental sources
JPH07325826A (ja) 日本語処理システム
JP2009075748A (ja) 機械翻訳装置及びプログラム
JPH0944521A (ja) インデックス作成装置および文書検索装置
JP2007072663A (ja) 用例翻訳装置、及び用例翻訳方法
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
Balcha et al. Design and Development of Sentence Parser for Afan Oromo Language
JPH0785026A (ja) 辞書更生方法及び装置
Shi et al. Chinese online-problems and solutions
JP2819766B2 (ja) 外国語電子辞書検索方式