JPH11282839A - 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JPH11282839A
JPH11282839A JP10105776A JP10577698A JPH11282839A JP H11282839 A JPH11282839 A JP H11282839A JP 10105776 A JP10105776 A JP 10105776A JP 10577698 A JP10577698 A JP 10577698A JP H11282839 A JPH11282839 A JP H11282839A
Authority
JP
Japan
Prior art keywords
sentence
translation
procedure
character string
short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10105776A
Other languages
English (en)
Inventor
Yutaka Yamada
山田  豊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP10105776A priority Critical patent/JPH11282839A/ja
Publication of JPH11282839A publication Critical patent/JPH11282839A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 長文と短文が混在しているような文章におい
て、短文は短時間に翻訳処理をし、長文については正確
に訳すことで全体として正確かつ短時間に翻訳処理がで
きる機械翻訳システムを提供すること。 【解決手段】 共起データなどを有する翻訳辞書を用い
た長文翻訳手段と、これを持たない短文翻訳手段を有
し、原言語文を入力し(S10)、この文字列を一文単
位に分割し(S12)、この文の文長を測定し(S1
3)、所定の長さより長ければ長文翻訳(S16)、短
ければ短文翻訳(S15)をし、結果を文結合(S1
8)して入力された原言語文に対応した目的言語文を出
力する(S19)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、機械翻訳システム
及び機械翻訳処理プログラムを記録したコンピュータ読
み取り可能な記録媒体に関し、詳しくは、短文と長文が
混じった文章を正確かつ高速に翻訳をする技術に関する
ものである。
【0002】
【従来の技術】従来の機械翻訳システムは、短い文であ
れば構文等が単純なため正確に翻訳できたが、長い文の
場合では、構文や係り受けが複雑になることが多く、単
語と単語との関係についての情報がない辞書を用いる限
りはどの単語がどの単語に関係するのか判断できないた
め、構文解析を十分にすることができず、そのためほと
んど訳すことができないようなシステムが多かった。
【0003】そこで長い文でも訳せるように、例えば、
名詞と用言の組み合わせを予め辞書に準備をしておき、
さらに特定の名詞を主語とした場合には、同じ動詞でも
訳を変えて翻訳するようなシステムなど単語と単語の関
係を考慮することにより長文を正確に訳すような機械翻
訳システムが考えられた。このような機械翻訳システム
であれば、長文であっても従来の機械翻訳システムに比
較して正確な翻訳が得られる。
【0004】
【発明が解決しようとする課題】しかしながら、長い文
でも正確に翻訳することができるようにした上記のよう
な機械翻訳システムは、複雑な翻訳をするために単語と
単語の関係についての膨大な情報を格納した翻訳辞書の
検索が必要になり、また、複雑な構文解析をするのに必
要なファイル容量(辞書等を含む)や実行時のメモリ容
量は膨大なものとなるため、長文の翻訳について正確に
翻訳することができるようになったが、翻訳に時間がか
かってしまうという問題があった。特に、簡単な短い文
に対しても、長文と同じように膨大な辞書の情報を検索
して、複雑な手順を経て翻訳をするため無駄が多く、短
い文であっても長文と同じように時間がかかり、従来の
機械翻訳で処理するよりも処理に時間を要してしまうと
いう問題があった。
【0005】本発明は、上述した問題点を解決するため
になされたものであり、長文と短文が混在しているよう
な文章において、短文は短時間に翻訳処理をし、なおか
つ長文については正確に訳すことで全体として正確かつ
短時間に翻訳処理ができる機械翻訳システムを提供する
ことを目的とする。
【0006】
【課題を解決するための手段】上記課題を解決するた
め、請求項1の機械翻訳システムでは、原言語からなる
文字列を入力する原言語入力装置と、前記入力装置から
入力された原言語文からなる文字列を記憶する入力文字
列記憶手段と、前記入力文字列記憶手段に入力された原
言語文からなる文字列から、一文ずつ文を分割して取出
す文分割手段と、前記取出された一文の長さを測定する
文長測定手段と、前記取出された一文を目的言語文に翻
訳する翻訳手段と、を備え、原言語文を目的言語文に一
文ずつ翻訳する機械翻訳システムであって、前記翻訳手
段は、前記文長測定手段により測定された一文の長さが
所定の文字数よりも長い長文のときに当該一文を翻訳す
る長文翻訳手段と、前記文長測定手段により測定された
一文の長さが前記所定の文字数よりも短い短文のときに
当該一文を翻訳する短文翻訳手段とからなることを特徴
とする。
【0007】この構成に係る、機械翻訳システムでは、
入力された原言語文を一文ごとに分割して、構文が簡単
な短文と、構文が複雑な長文に分けて、短文には翻訳処
理の速い短文翻訳手段をもって翻訳し、長文には高度な
解析力のある長文翻訳手段をもって翻訳するため、構文
の簡単な短文は短時間に翻訳処理をし、構文の複雑な長
文には時間をかけて深く解析して正確な翻訳をすること
により、全体としての処理時間を、翻訳精度を落とすこ
となく高速な翻訳処理を達成するものである。
【0008】請求項2に記載の機械翻訳システムは、請
求項1に記載の機械翻訳システムの構成に加え、前記長
文翻訳手段は、単語の意味と接続関係を判断して訳語を
選択するための共起データを有するとともに、前記共起
データを処理する共起データ処理手段を有し、前記短文
翻訳手段は、前記共起データを有さないことを特徴とす
る。
【0009】この構成にかかる機械翻訳システムでは、
特に不正確な翻訳となりやすい特定の単語と単語の関係
における訳し分けを正確に行い、一方検索に時間がかか
りやすいこのような処理を短文には行わないことで、高
速かつ精度の高い機械翻訳を達成するものである。
【0010】請求項3に記載の機械翻訳システムは、請
求項1又は請求項2に記載の機械翻訳システムの構成に
加え、前記短文翻訳手段と前記長文翻訳手段とを別々の
計算機上に配置したことを特徴とする。
【0011】この構成にかかる機械翻訳システムは、短
文と長文の翻訳作業を別々の計算機で行うことにより、
短文と長文の処理を同時に並行して進めることができる
ので、1の計算機をもって処理するのに比べより高速な
処理ができる。
【0012】請求項4に記載の機械翻訳システムは、請
求項1又は請求項2に記載の機械翻訳システムの構成に
加え、前記短文翻訳手段と前記長文翻訳手段とを同じ計
算機上に配置し、プログラムの切り換えのみにより使い
分けるようにしたことを特徴とする。
【0013】この構成にかかる機械翻訳システムは、短
文処理手段と長文処理手段を1の計算機でプログラムの
切り替えで行うため、簡単な汎用の構造の計算機を使用
して本機械翻訳システムを構成することができる。
【0014】請求項5に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、原
言語文を目的言語文に翻訳する機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
て、前記プログラムは、コンピュータに、原言語からな
る文字列を入力する原言語文入力の手順と、前記入力の
手順から入力された原言語文からなる文字列を入力文字
列記憶手段に記憶する入力文字列記憶の手順と、前記入
力文字列記憶の手順により入力された原言語文からなる
文字列から、一文ずつ文を分割して取出す文分割の手順
と、前記取出された一文の長さを測定する文長測定の手
順と、前記取出された一文を目的言語文に翻訳する翻訳
の手順と、前記文長測定の手順により測定された一文の
長さが所定の文字数よりも長いときに、当該一文を翻訳
する長文翻訳の手順と、前記文長測定の手順により測定
された一文の長さが前記所定の文字数よりも短いときに
当該一文を翻訳する短文翻訳の手順とを含むことを特徴
とする。
【0015】この構成にかかる記録媒体では、コンピュ
ータに、入力された原言語文を一文ごとに分割して、構
文が簡単な短文と、構文が複雑な長文に分けて、短文に
は翻訳処理の速い短文翻訳手段をもって翻訳し、長文に
は高度な解析力のある長文翻訳手段をもって翻訳する手
順を実行させることができるため、構文の簡単な短文は
短時間に翻訳処理をし、構文の複雑な長文には正確な翻
訳をすることにより、全体としての処理時間を、翻訳精
度を落とすことなく高速な翻訳処理を実行させることが
できる。
【0016】請求項6に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5に記載の記録媒体の機械翻訳プログラムにおい
て、コンピュータに、前記長文翻訳の手順において、単
語の意味と接続関係を判断して訳語を選択するための前
記共起データを用いて翻訳処理する手順と、前記短文翻
訳の手順において、前記共起データを用いないで翻訳処
理する手順とを実行させるように構成されたことを特徴
とする。
【0017】この構成にかかる記録媒体では、コンピュ
ータに、特に不正確な翻訳となりやすい特定の単語と単
語の関係における訳し分けを正確に行い、一方、検索に
時間がかかりやすいこのような処理を短文では行わない
ことで、高速かつ精度の高い機械翻訳処理を実行させる
ことができる。
【0018】請求項7に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5又は請求項6に記載の記録媒体において、前記
機械翻訳処理プログラムは、コンピュータに、前記短文
翻訳の手順と前記長文翻訳の手順とを別々の計算機にお
いて実行させるように構成されたことを特徴とする。
【0019】この構成にかかる記録媒体では、コンピュ
ータに短文と長文の翻訳作業を別々の計算機に行なわせ
ることにより、短文と長文の処理を同時に並行して進め
ることができるので、1の計算機をもって処理するのに
比べより高速な処理ができる。
【0020】請求項8に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5又は請求項6に記載の記録媒体において、前記
機械翻訳処理プログラムは、コンピュータに、前記短文
翻訳の手順と前記長文翻訳の手順とをプログラムの切り
替えにより同一の計算機において実行させるように構成
されたことを特徴とする。
【0021】この構成にかかる記録媒体では、コンピュ
ータに短文処理の手順と長文処理の手順を1の計算機で
プログラムの切り替えで行わせるため、簡単な汎用の構
造の計算機を使用して本機械翻訳処理を実行することが
できる。
【0022】
【発明の実施の形態】以下、本発明の機械翻訳システム
を1の実施の形態により図面を参照して説明する。
【0023】尚、本実施の形態では、日本語(原言語)
から英語(目的言語)に翻訳する場合を一例として説明
する。
【0024】まず、本実施形態の機械翻訳システムの概
略構成を示すブロック図を図1に示す。
【0025】図1に示すように、本実施形態の機械翻訳
システムは、翻訳対象となる日本語の原文や各種操作指
示等を入力するためのキーボード等からなる原言語入力
装置である入力装置11と、翻訳処理に利用される専門
辞書14等各種辞書が格納され、ハードディスクや光デ
ィスク等からなる外部記憶装置13と、入力された日本
語の原文や翻訳結果である英語の訳文等を表示するため
のCRT等からなる表示装置17と、翻訳結果である英
語の訳文等を印刷して出力するためのレーザープリンタ
等からなる印刷装置19と、有線または無線によりデー
タの入出力を行うI/Oポート16などが、データバス
15に接続されており、本システムの情報の入出力を行
っている。
【0026】一方、データバス15には、システム全体
の制御を司るCPU10と読み書き自由なメモリである
RAM20と読み出し専用のメモリであるROM30が
接続されている。
【0027】入力装置11には、図示しない文字を入力
するための文字キー、各種処理を起動するための入力文
編集キー、翻訳実行キー、定型文編集キー、出力文編集
キー、終了キー、及び印字実行キーといった各種機能キ
ー、入力文や出力文の編集、表示部6に表示されている
画面操作等に使用するカーソルキー、挿入キー、削除キ
ー、確定キー、及び次候補選択キー等が設けられてい
る。また、マウスなどの入力用機器も接続可能である。
【0028】外部記憶装置13は、FDドライブや、C
Dドライブや、ハードディスクドライブなどからなり、
各種記録媒体に専用辞書14、ユーザ辞書などを格納し
たり、翻訳結果を蓄積しておくものである。
【0029】なお、専門分野毎に編集された専門辞書1
4の他にもユーザが独自に構築するユーザ辞書などを格
納してもよく、また、専門辞書14も、各種専門分野毎
に、ユーザ辞書は、例えば、ユーザ毎や利用分野毎にそ
れぞれ複数個の辞書が同時に存在可能に構成されていて
もよい。
【0030】また、記録済みのCDやFDなどから、原
言語文の情報を、入力文字列記憶手段である入力文字列
バッファ22に入力することも可能である。
【0031】さらにI/Oポート16に、例えば電話回
線を通じて、インターネットに接続し、入力装置11に
よらず、原言語文入力したり、さらに音声認識装置に接
続して音声により入力することも可能である。この意味
で、本発明の原言語入力装置には、入力装置11のみな
らず、外部記憶装置13やI/Oポート16なども相当
するものである。
【0032】表示装置17は、CRTの他、液晶ディス
プレー等入出力文が表示可能であればいずれの表示手段
であってもよい。
【0033】印刷装置19は、本実施形態ではレーザプ
リンタを用いているがその他各種のプリンタが用いられ
る。
【0034】RAM20には、作業領域21、入力文字
列バッファ22、文番号カウンタ23、分割原文記憶手
段24、分割訳文記憶手段25、出力文字列バッファ2
6などの領域が設けられている。
【0035】作業領域21は、各種の作業を行うため
に、設けられた記憶領域で、翻訳作業のために一時的に
読み出されたデータを保持したり、パラメータを保持し
たりする。
【0036】入力文字列バッファ22は、入力装置11
等から入力された原言語文をテキストデータの形式で、
記憶しておくもので、翻訳処理は、このデータから、後
述するように一文ずつ分割されて処理されていく。
【0037】文番号カウンタ23は、文を数えるための
カウンタで最初に取り出した文を1として、以後順番に
1刻みにカウントアップして切り出した文に順次固有の
番号を付けて区別する変数を記憶しておく領域である。
【0038】分割原文記憶手段24は、後述の文分割の
手順により、入力文字列バッファ22に格納されている
入力された原言語からなる文字列から、一文ずつ切り出
した原言語文を、文番号カウンタ23により生成した番
号を付与して、一文の単位で、それぞれ原文中間バッフ
ァを生成して記憶しておく記憶領域である。従ってこの
分割原文記憶手段24は、分割し格納された一文ごとの
原文中間バッファの集合体であるといえる。この分割原
文記憶手段24に格納されたそれぞれの原文中間バッフ
ァが、翻訳処理の単位とされる。
【0039】分割訳文記憶手段25は、長文翻訳プログ
ラム35または短文翻訳プログラム36のいずれかで翻
訳された分割原文記憶手段24のバッファの単位で翻訳
処理され生成された目的言語文を、原文中間バッファに
付与された文番号をそのまま引継いで付与して、一文単
位で訳文中間バッファに記憶しておくものである。従っ
て、訳文中間バッファは、原文中間バッファと同数存在
することになる。
【0040】出力文字列バッファ26は、分割訳文記憶
手段25の各訳文中間バッファに付された文番号の順番
に文結合プログラム37によりソート処理され並べられ
て入力され、原言語文による入力された文字列と対応す
る最終的な訳文を出力のために記憶する領域である。
【0041】ROM30には、制御プログラム31、文
分割プログラム32、文長測定プログラム33、翻訳プ
ログラム34、文結合プログラム37、翻訳辞書38が
格納されている。
【0042】制御プログラム31は、システム全体を制
御するプログラムであり、入出力の制御や各プログラム
の起動や受け渡しの調整などを行うものである。
【0043】文分割プログラム32は、入力文字列バッ
ファ22に入力される原言語文による文字列が、単数の
文章に限らず複数の文章の入力を許容しているため、こ
こから一文ずつ分割して、一文単位に分割原文記憶手段
24のそれぞれの原文中間バッファに格納するものであ
る。これが本発明の文分割手段に相当する。
【0044】文長測定プログラム33は、分割原文記憶
手段に記憶されている各一文が、所定の文字列長より長
いか否かを判定し、これを長文翻訳プログラム35で処
理をするか、短文翻訳プログラム36で処理をするかを
判断するプログラムである。具体的には、文字列を構成
する文字の数や、単語総数、用言の数などを文長の基準
にすることが考えられるが、本実施の形態では文字数を
基準に、20字未満を短文、20字以上を長文としてい
る。この基準は、統計的に複文や重文などになりにくい
文字列の長さであり、形態素解析などをしなくても長文
と短文を識別できるところに特長がある。この文長測定
プログラム33は、本発明の文長測定手段を構成する。
【0045】翻訳プログラム34は、長文翻訳プログラ
ム35と短文翻訳プログラム36とから構成される。翻
訳プログラム34が本発明の翻訳の手順を実行させる翻
訳手段、長文翻訳プログラム35が長文翻訳手段、と短
文翻訳プログラム36が本発明の短文翻訳手段をそれぞ
れ構成する。いずれの翻訳プログラムにも、文章を構成
する単語を翻訳辞書38を検索することで切り出し、訳
語、品詞、活用、接続情報、その他の単語情報を付加す
る形態素解析プログラムと、形態素解析によって得られ
た情報から原言語の文法に従って構文を解析する構文解
析プログラムと、原言語文を対応する目的言語文に変換
する変換プログラムと、変換された単語を目的言語の文
法に従って文を構成する構文生成プログラムと、これら
に目的言語の文法情報に従って文章の構成部分を形成す
る形態素生成プログラムとを有し、一連の翻訳処理をす
るプログラムである。
【0046】なお、ここで長文翻訳プログラム35と短
文翻訳プログラム36との違いを説明すると、先ず、そ
れぞれが使用する翻訳辞書38に違いがある。図7、図
8に示すように、翻訳辞書38にはいずれのプログラム
も共通して使用する図9に示すような、用言の共通辞書
39が備えられており、この共通辞書39は原則として
1の用言に対して1の訳語を対応させている。これに対
し長文翻訳プログラム35は、同じく翻訳辞書38に格
納されたこの用言の共通辞書39に加えて別に図10に
示すような名詞と用言との共起データをデータ内に持っ
ている共起データ用辞書40を使用する。ここで、「共
起データ」とは、同じ用言でも組み合わされる名詞によ
って訳語が変わるため、特定の用言と名詞の組み合わせ
のデータを予め共起データ用辞書40に登録しておい
て、この登録された名詞を目的語に採る用言の場合に
は、所定の訳をするようにするためのデータである。ま
た、この共起データは本発明の共起データ処理手段であ
る長文翻訳プログラム35により利用される。例えば、
図11に示すように、通常「切る」の訳語は「cut」
であるので、目的語が「枝」というような場合は「切
る」の共起データとして「枝」は登録されていないため
に、この「切る」は、「cut」と訳される。しかし、
「ハンドルを切る」という場合の「切る」は、「tur
n」である。つまり、「切る」という用言が検出された
場合、すぐさま「cut」という訳語を与えないで、
「切る」の目的語に当たる「ハンドル」という名詞をこ
の共起データで検索をして、特定の名詞、例えばこの場
合であると「ハンドル」という名詞が「切る」の共起デ
ータとして登録されていれば、「ハンドル」という名詞
を目的語にした場合、この「切る」は、「cut」では
なく、共起データ用辞書40に登録された「turn」
であるとするものである。同様に、「スイッチを切る」
という場合には、図10に示すように「切る」の共起デ
ータとして「スイッチ」が登録されており、この場合は
「turn off」という訳語が与えられ、図11の
ように、形態素解析の結果である過去形という情報から
「turned off」という訳語が与えられる。従
って、短文翻訳プログラム36と比較して長文翻訳プロ
グラム35による翻訳は、検索に時間を要することが容
易に分かる。
【0047】なお、この構造を、図7及び図8で説明す
ると、短文翻訳プログラム36は、RAM20の作業領
域21の一部である作業領域361を使用する他に、R
OM30の翻訳辞書38に格納された共通辞書39の実
行コードS用辞書データ362を利用する。各命令につ
いてはROM30内の短文翻訳プログラム36に格納さ
れた実行コードS363により実行される。
【0048】一方、長文翻訳プログラム35は、RAM
20の作業領域21の一部である作業領域351を使用
する他に、ROM30に格納された翻訳辞書38に格納
された共起データ用辞書40の実行コードL用辞書デー
タ352を利用する。各命令についてはROM30内の
長文翻訳プログラム35に格納された実行コードS36
3により実行される。
【0049】他にも長文翻訳プログラム35と短文翻訳
プログラム36との違いは、短文翻訳プログラム36
は、例えば格助詞「と」の使い方で、名詞の並列の
「と」と、動作の相手を表わす「と」の使い分けについ
ては、名詞の意味を考えず、すべて並列の「と」と判断
するが、長文翻訳プログラム35については、これらを
区別するため、名詞の意味を形態素解析の結果を参照し
て判断して、構文解析を行うことにおいても異なる。例
を挙げれば、「私たちは社長とりんごを食べた。」とい
う文を入力したとすると、短文翻訳プログラム36で
は、「社長」も「りんご」も単に名詞と判断し、「と」
は名詞を並列につなぐ格助詞として、「社長とりんご」
を並列に接続し、用言「食べた」の目的語として判断す
るため、ここから翻訳される結果は、「We ate
the president and an appl
e.」という不自然な翻訳文を生成してしまう。一方、
長文翻訳プログラム35では、それぞれの意味を判断す
るため、「社長」は、人を表わす名詞として判断され、
「社長」につづく「と」は、動作の共同を表わす格助詞
「と」と判断される。また「りんご」は、食べ物の名前
として判断されるため用言「食べる」の目的語として判
断されて「食べる」に関係付けられて構文解析がなされ
る。その結果、「We ate an apple w
ith the president.」という正しい
翻訳結果を得ることができるが、同時にこの結果を得る
ために長文翻訳プログラム35は多くの検索を必要とす
ることも判る。
【0050】さらに、長文翻訳プログラム35と短文翻
訳プログラム36との違いは次のような点にも現れる。
短文プログラム36では、読点「、」やコンマ「,」で
並べた名詞をある程度以上並んだ場合には一律に複合名
詞として処理してしまうか、最初から複合名詞にしてし
まうような処理がなされるのが普通であるが、長文翻訳
プログラム35では、それぞれを独立した名詞として判
断し、それぞれの意味から接続関係を判断するような処
理が可能となる。例えば、「私が好きなものはりんご、
みかん、ぶどう、いちご、バナナです。」という文を入
力したとすると、短文翻訳プログラム36では、「りん
ご、みかん、ぶどう、いちご、バナナ」の部分は形態素
解析の結果、全部が一体となった複合名詞として判断さ
れてしまうため、翻訳した結果は、「The thin
g which I likeis an apple
orange grapes strawberry
banana.」という一つの名詞として扱われてしま
う翻訳結果となる。一方、長文翻訳プログラム35であ
れば、それぞれが食べ物を表わす名詞として形態素解析
され、「です」は形式的な用言だから、実質的な意味上
の用言「好き」の目的語と判断されて翻訳されるため
「The thing which Ilike ar
e an apple, an orange, gr
apes, a strawberry and a
banana.」という、それぞれの名詞を独立した名
詞として冠詞が正しく付与されるように形態素生成され
て翻訳される。
【0051】以上説明した例の如く、短文翻訳プログラ
ム36においては、検索辞書を省略したり、意味を判断
することなくして、処理手順を少なくして速く翻訳処理
をするように、構成されている。
【0052】一方、長文翻訳プログラムでは、ここに挙
げた例に止まらず種々の翻訳精度を上げるための手段が
用いられ、本実施形態の翻訳辞書38の共起データ用辞
書のみならず、さらに辞書を充実して形態素解析におけ
る付加情報を増やしたり、上記のように形態素解析の結
果を利用して、接続情報を増加させて構文解析の精度を
高めることが可能となる。
【0053】ここで両者のプログラムを比較すると、も
ちろん、短文翻訳プログラム36については不正確にな
り易いというデメリットはあるが、処理スピードが速い
というメリットがあり、実際の翻訳作業については、単
純に翻訳できる文が多く、そのすべてを長文翻訳プログ
ラムを用いて翻訳するのは効率が悪い。一方、長さが長
い文は、文の構成要素も多く、構文も重文や複文の構成
を採るものも多く、各単語の関係も複雑となってくる。
従って、構文解析においては短文翻訳プログラムのよう
な各単語の接続情報や係り受けの情報が少ないもので
は、正確な翻訳ができない。従って、両者のメリットを
生かすような本実施形態の機械翻訳システムが有効なこ
とが解る。
【0054】つぎに、文結合プログラム37について説
明する。既に、文分割プログラム32において一文に切
り出される原言語文毎に文番号カウンタ23により生成
された固有の連番である文番号が、原文中間バッファに
格納される際に付与されているが、長文翻訳プログラム
35または短文翻訳プログラム36でそれぞれ翻訳処理
がされて、分割訳文記憶手段25の訳文中間バッファに
格納される際も原文中間バッファと同一の文番号が引き
続き用いられる。この分割訳文記憶手段25の訳文中間
バッファに保存された目的言語文を、付与された文番号
に従って並べて出力文字列バッファ26に記憶させ一つ
の文字列に結合するプログラムである。このように結合
された文字列は、入力された原言語文に対応する内容の
目的言語による最終訳文となっている。
【0055】以下、図2のフローチャートに従って、本
実施形態の機械翻訳システムの作用について説明する。
まず、機械翻訳システムに電源を投入しシステムを立ち
上げる(開始)。
【0056】入力装置11から、翻訳の対象である原言
語文をキー入力すると(ステップ10、以下ステップを
単にSとしてS10ように略記する)、入力文字列バフ
ァ22に、テキストデータとして原言語文からなる文字
列が記憶される(S11)。
【0057】テキストデータとして入力文字列バッファ
22に入力された文字列は、文の数を制限していないた
め、ここで文字列を一文ごとに分割する文分割の処理を
する(S12)。以下、文分割の手順を図3に示すフロ
ーチャートで説明する。
【0058】まず、分割する一文に、それぞれ1から順
番に番号を付けて、当初に入力された順番が分かるよう
にするため、文番号カウンタにより1から順番にカウン
トアップした文番号を生成させる(S111)。この生
成された文番号に対応して、分割した一文を記憶してお
くための新たな原文中間バッファを生成する(S11
2)。生成された原文中間バッファの文番号部分に文番
号カウンタで生成された値を入れ文番号とする(S11
3)。入力文字列バッファ22に格納されているテキス
トデータを先頭から検索し、文の終末を表わす記号であ
るcut charsに含まれる文字を探す(S11
4)。ここで、「cut chars」とは、原言語に
おける文区切り文字を記憶する領域で、具体的には、原
言語が日本語であれば、「。」「?」「.」又は、スペ
ース記号のようなものが挙げられる。
【0059】入力文字列バッファ22内に格納された入
力文字列を先頭から検索した結果、「cut char
s」が見つかれば(S115:YES)、そこが文の終
末と判断され、入力文字列バッファ22の先頭からcu
t charsに含まれる文字の後ろまでを原文中間バ
ッファに複写する(S116)。入力文字列バッファ2
2に格納されている原言語による入力文字列のうち、既
にS116で、原文中間バッファに複写された部分を除
いた文字列とするため、残りの部分を新たに入力文字列
バッファ22の内容とするように複写して更新する(S
117)。
【0060】また、残余の部分について文を分割するた
め、S111に戻り同様の手順を実行する。こうして、
入力文字列バッファ22のテキストデータを、一文ずつ
文番号を付与しつつ独立した原文中間バッファに分割し
ていく。ここで、S115において、入力文字列バッフ
ァ22内にcut charsが見つからない場合(S
115:NO)、入力文字列バッファ22の文が最後の
一文または、一文のみであったと判断され入力文字列バ
ッファ22内には、一文しかないと判断され、入力文字
列バッファ22の内容をそっくりすべて原文中間バッフ
ァに複写し(S118)、文分割作業は既に終了したも
のと判断し、入力文字列バッファ22を空にして(S1
19)、文分割の手順は終了する(終了)。
【0061】次に、図2の示すフローチャートに戻り説
明を続ける。文分割が終了すると(S12)、分割され
た原言語文の文長の測定をする(S13)。測定された
分割された言語文の長さが長文であると判定されれば
(S14:YES)、長文翻訳がなされ(S16)、長
文ではないと判定されれば(S14:NO)、短文翻訳
(S15)の処理がなされる。この文長測定の手順(S
14)と長文か否かの判断の手順(S14)を実行させ
る文長測定プログラム33が、本発明の文長測定手段を
構成する。ここで、図4に示すフローチャートでS14
からS16までの文長測定の手順を説明する。まず、文
分割プログラム32が終了すると(S12)、文長測定
処理が開始する(開始)。RAM20の分割原文記憶手
段24に格納されている原文中間バッファの分割された
原言語文の文字列の文字数をカウントし(S131)、
カウントした文字数が、threshold leng
thに規定された文字数より多いかどうか比較され、即
ち、基準より長いかどうか判断され(S132)、文字
列の文字数がthreshold lengthに規定
された文字数より多い、つまり長いと判断されれば長文
と判断され(S132:YES)、長文翻訳処理S16
に回され(S134)、文字列の文字数がthresh
old lengthに規定された文字数を超さない場
合は、短文と判断され(S132:NO)、短文翻訳処
理S15に回される。ここで「threshold l
ength」とは、文の長さの閾値をいい、ここでは文
字数により規定されるもので、具体的には20文字とし
ている。一般的には、20字を超えると文が複雑になる
ことが多く、20字以上では、長文翻訳プログラム35
による翻訳が、処理時間を多く使っても好ましいといえ
る。逆に、20字未満の文字列であれば、原言語文が重
文や複文の構成を採ることも少なく、短文翻訳プログラ
ム36であっても翻訳結果には大きな影響がなく処理の
速さがメリットとして生かされる。
【0062】短文翻訳の手順(S15)における翻訳処
理の手順の流れを説明すると、原文中間バッファに格納
されている文字列を、翻訳辞書38のうち、図9に示す
共通辞書39のみを使用し、即ち共起データは使用せず
に、文字列の文頭から最長一致法により、形態素解析を
行う。まず、原言語による文字列を共通辞書39の最長
単語の長さだけ切り出し、この切り出した文字列を共通
辞書39で検索する。ここで同一文字列がなければ、最
後尾の文字を1字へらし再び共通辞書39を検索する。
こうして順次文字数を減らして検索をし、ここで同一文
字列の見出しが見つかったら、共通辞書39からその文
字列に関する見出語・訳・品詞・活用情報・接続情報等
を読み出し、検索が終わった文字列に関連付けて原文中
間バッファに格納する。
【0063】次に、翻訳辞書38の文法部を参照して、
先に得た形態素解析の結果と共に接続関係を木(ツリ
ー)構造にして構文の解析をする構文解析を行う。
【0064】そして、形態素解析の結果を参照して原言
語の単語を目的言語の単語に変換する。この場合は、共
起データはないため、訳語は、原則として原言語の単語
と目的言語の単語が図9の例のように1対1に変換さ
れ、例えば目的語が枝であれハンドルであれ、用言が
「切る」である限り、訳は必ず「cut」になる。
【0065】この後、原言語で解析された結果の構文情
報により、翻訳辞書の目的言語の文法情報を読み出し
て、例えば日本語の用言「切る」であれば、目的言語で
ある英語では主部の直後にくるというような文法情報に
より英文を組み立てる構文生成を行う。
【0066】そして最後に、冠詞の「a」などを付加す
るなどの形態素生成を行い目的言語文としての体裁を整
えて最終翻訳文を得ることで翻訳処理を終了する。
【0067】一方、文長測定の手順(S14)で長文と
判断された場合(S14:YES)、長文翻訳の手順
(S16)により翻訳処理がなされる。長文翻訳の手順
(S16)は、前述短文翻訳の手順(S15)と共通す
る手順が多いので、短文翻訳の手順(S15)との比較
で異なる点を述べる。短文翻訳の手順(S15)では、
翻訳辞書38の内、共通辞書39しか使用しなかった
が、長文翻訳の手順(S16)では、共通辞書39と同
時に共起データ用辞書40を初めとする種々の辞書を使
用して形態素解析を行う点が異なる。一例として共起デ
ータ用辞書40には、図10に示すようなものがあり、
用言とその用言に共起する名詞を情報として格納してあ
るが、形態素解析の段階で、例えば「切る」という単語
が切り出されたとき、すぐに対応する訳として「cu
t」としないで、この共起データ用辞書40が起動さ
れ、形態素解析の結果「切る」の他に、切るの目的語と
して当該長文の中に共起される名詞がないか検索され
る。もし、「切る」の目的語が「スイッチ」であるとさ
れた場合は、共起データ用辞書40を検索した結果共起
する名詞として「スイッチ」があるため、この「切る」
は訳として「cut」とするのではなく「turn o
ff」とするという判断がなされ、形態素解析の結果と
して、「切る」に関連する情報として形態素解析結果に
記録される。なお、共起データとしては用言に対応する
名詞ばかりでなく前述のように、名詞の意味から接続す
る条件を限定する情報などについても広く共起データに
含めるものとする。さらに、各種の接続データや、慣用
句、定型句など正確な構文解析及び変換の手順のための
情報は適宜使用され得るのは言うまでもない。以上の説
明から判るように、長文翻訳の手順(S16)について
は、正確な翻訳がなされ得るが、精度を高めるためには
各種の情報を検索して正確な訳語及び正確な構文解析を
する必要があるので、処理に時間がかかるのは明らかで
ある。
【0068】次に、短文翻訳の手順(S15)または長
文翻訳の手順(S16)により翻訳処理が終了して生成
された目的言語文については、分割訳文記憶の手順(S
17)により訳文中間バッファに一旦格納される。以
下、図5に示すフローチャートにより説明すると、翻訳
が終了した目的言語文による一文は、図7及び図8に示
すようにRAM20の作業領域21の中の短文用作業領
域361または長文用作業領域351のいずれかに保存
されている。先ず、この目的言語からなる訳文を格納す
るための領域である訳文中間バッファを生成する(S1
71)。前述のS15,S16において生成された翻訳
結果を呼出し(S172)、その結果を訳文中間バッフ
ァに格納する(S173)。そして当該訳文が翻訳前に
格納されていた分割原文記憶手段24の原文中間バッフ
ァに付与されていた文番号を読み出し、当該翻訳結果を
格納する訳文中間バッファに文番号を複写する(S17
4)。このように一文単位で訳文が格納された複数の訳
文中間バッファは文番号を付されて分割訳文記憶手段2
5に格納される(終了)。
【0069】そして、このように一文単位で各訳文を、
入力された原文に対応するような文章の集合とするため
文結合の手順が実行される(S18)。以下図6に示す
フローチャートを参照しながら説明する。先ず、前述の
分割された訳文が格納されている訳文中間バッファから
文番号を呼出す(S181)。読み出した文番号をソー
トし(S182)、1から昇順の文番号により格納され
ていた訳文の内容を呼び出し、RAM20の出力文字列
バッファ26に順次格納して文を結合して、連続した文
字列を形成し、入力文と対応する出力文字列を生成する
(S183)この機械翻訳処理の最後の手順として、出
力文字列バッファに格納されていた目的言語文を出力手
段である表示装置17、印刷装置19またはI/Oポー
ト16を介して例えば電話回線経由でインターネットや
ファックス出力したり、さらに音声出力をするなど、所
望の手段で出力する(S19)。
【0070】尚、本発明は、上述した実施の形態に限定
されるものではなく、その要旨を変更しない範囲内にお
いて種々の変更が可能である。
【0071】例えば、短文翻訳と長文翻訳の手順につい
て、それぞれを別の計算機であるCPUにより計算処理
をさせることも可能である。そうすることにより長文と
短文のそれぞれが効率よく翻訳でき、さらに時間短縮が
可能になる。特に、本機械翻訳システムでは文分割手段
により一文毎に処理をするが、翻訳処理が後先になって
も文番号で管理され、翻訳処理が済んだものは訳文中間
バファに一文ごとに分けて管理されているため、別の計
算機であるCPUを使用しても、文結合プログラム37
により入力文に対応した順番に並べ直されるため混乱は
ない。
【0072】本実施実施の形態ではROM30には、制
御プログラム31、文分割プログラム32、文長測定プ
ログラム33、翻訳プログラム34、文結合プログラム
37翻訳辞書38が格納されており、各手段が機能して
いるが、これらのプログラムはハードディスク、CD、
FDD等コンピュータが読み取り可能な記録媒体に記録
して、これらを外部または内蔵の記憶装置でドライブさ
せて読み出すことによってコンピュータを機械翻訳シス
テムとしての手順を実行させることができる。この場合
において、制御プログラム31及びRAM20の作業領
域21とともに入力装置11、外部記憶装置13、I/
Oポート16が原言語文入力の手順を、入力文字列バッ
ファ22が入力文字列記憶の手順を、文分割プログラム
32が文分割の手順を、文長測定プログラム33が文長
測定の手順を、翻訳プログラム34が翻訳の手順を、長
文翻訳プログラム35が長文翻訳の手順を、短文翻訳プ
ログラム36が短文翻訳の手順を主として実行する。
【0073】また、本実施の形態では原言語を日本語、
目的言語を英語に例を取って説明したが、原言語及び目
的言語はいずれの言語であってもよい。
【0074】
【発明の効果】以上に詳述したことから明らかなよう
に、請求項1の機械翻訳システムでは、原言語からなる
文字列を入力する原言語入力装置と、前記入力装置から
入力された原言語文からなる文字列を記憶する入力文字
列記憶手段と、前記入力文字列記憶手段に入力された原
言語文からなる文字列から、一文ずつ文を分割して取出
す文分割手段と、前記取出された一文の長さを測定する
文長測定手段と、前記取出された一文を目的言語文に翻
訳する翻訳手段とを備え、原言語文を目的言語文に一文
ずつ翻訳する機械翻訳システムであって、前記翻訳手段
は、前記文長測定手段により測定された一文の長さが所
定の文字数よりも長い長文のときに当該一文を翻訳する
長文翻訳手段と、前記文長測定手段により測定された一
文の長さが前記所定の文字数よりも短い短文のときに当
該一文を翻訳する短文翻訳手段とからなることを特徴と
するため、入力された原言語文を一文ごとに分割して、
構文が簡単な短文と、構文が複雑な長文に分けて、短文
には翻訳処理の速い短文翻訳手段をもって翻訳し、長文
には高度な解析力のある長文翻訳手段をもって翻訳する
ことにより、構文の簡単な短文は短時間に翻訳処理を
し、構文の複雑な長文には正確な翻訳をすることがで
き、全体としての翻訳精度を落とすことなく高速に翻訳
できるという効果がある。
【0075】請求項2に記載の機械翻訳システムは、請
求項1に記載の機械翻訳システムの効果に加え、前記長
文翻訳手段は、単語の意味と接続関係を判断して訳語を
選択するための共起データを有するとともに、共起デー
タを処理する共起データ処理手段を有し、前記短文翻訳
手段は、共起データを有さないことを特徴とするため、
特に不正確な翻訳となりやすい特定の単語と単語の関係
における訳し分けを正確に行い、一方検索に時間がかか
りやすいこのような処理を短文には行わないことで、高
速かつ精度の高い機械翻訳を達成するものである。
【0076】請求項3に記載の機械翻訳システムは、請
求項1又は請求項2に記載の機械翻訳システムの効果に
加え、前記短文翻訳手段と前記長文翻訳手段とを別々の
計算機上に配置したことを特徴とするため、短文と長文
の翻訳作業を別々の計算機で行うことにより、短文と長
文の処理を同時に並行して進めることができるので、1
の計算機をもって処理するのに比べより高速な処理がで
きるという効果がある。また、短文翻訳用の計算機は、
小さい記憶領域で済むため容量の小さなハードディスク
か或いはメインメモリだけでも構成でき、それ以外のハ
ードウェアを長文翻訳用の計算機に集中して用いるよう
なこともできるという効果がある。
【0077】請求項4に記載の機械翻訳システムは、請
求項1又は請求項2に記載の機械翻訳システムの効果に
加え、前記短文翻訳手段と前記長文翻訳手段とを同じ計
算機上に配置し、プログラムの切り換えのみにより使い
分けるようにしたことを特徴とするため、短文処理手段
と長文処理手段を1の計算機でプログラムの切り替えで
行うため、簡単な汎用の構造の計算機を使用して本機械
翻訳システムを構成することができるという効果があ
る。
【0078】請求項5に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体は、原
言語文を目的言語文に翻訳する機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体であっ
て、前記プログラムは、コンピュータに、原言語からな
る文字列を入力する原言語文入力の手順と、前記入力の
手順から入力された原言語文からなる文字列を入力文字
列記憶手段に記憶する入力文字列記憶の手順と、前記入
力文字列記憶手段に入力された原言語文からなる文字列
から、一文ずつ文を分割して取出す文分割の手順と、前
記取出された一文の長さを測定する文長測定の手順と、
前記取出された一文を目的言語文に翻訳する翻訳の手順
と、前記文長測定の手順により測定された一文の長さが
所定の文字数よりも長いときに、当該一文を翻訳する長
文翻訳の手順と、前記文長測定の手順により測定された
一文の長さが前記所定の文字数よりも短いときに当該一
文を翻訳する短文翻訳の手順とを含むことを特徴とする
ため、コンピュータに、入力された原言語文を一文ごと
に分割して、構文が簡単な短文と、構文が複雑な長文に
分けて、短文には翻訳処理の速い短文翻訳手段をもって
翻訳し、長文には高度な解析力のある長文翻訳手段をも
って翻訳する手順を実行させることができるため、構文
の簡単な短文は短時間に翻訳処理をし、構文の複雑な長
文には正確な翻訳をすることにより、全体としての処理
時間を、翻訳精度を落とすことなく高速な翻訳処理を実
行させることができるという効果がある。
【0079】請求項6に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5に記載の記録媒体の機械翻訳プログラムにおい
て、コンピュータに、前記長文翻訳の手順において、単
語の意味と接続関係を判断して訳語を選択するための前
記共起データを用いて翻訳処理する手順と、前記短文翻
訳の手順において、前記共起データを用いないで翻訳処
理する手順とを実行させるように構成されたことを特徴
とするため、コンピュータに、特に不正確な翻訳となり
やすい特定の単語と単語の関係における訳し分けを正確
に行い、一方検索に時間がかかりやすいこのような処理
を短文では行わないことで、高速かつ精度の高い機械翻
訳処理を実行させることができるという効果がある。
【0080】請求項7に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5又は請求項6のいずれにか記載の記録媒体にお
いて、前記機械翻訳処理プログラムは、コンピュータ
に、前記短文翻訳の手順と前記長文翻訳の手順とを別々
の計算機において実行させるように構成されたことを特
徴とするため、コンピュータに短文と長文の翻訳作業を
別々の計算機で行うことにより、短文と長文の処理を同
時に並行して進めることができるので、1の計算機をも
って処理するのに比べより高速な処理ができるという効
果がある。
【0081】請求項8に記載の機械翻訳処理プログラム
を記録したコンピュータ読み取り可能な記録媒体では、
請求項5又は請求項6記載の記録媒体において、前記機
械翻訳処理プログラムは、コンピュータに、前記短文翻
訳の手順と前記長文翻訳の手順とをプログラムの切り替
えにより同一の計算機において実行させるように構成さ
れたことを特徴とするため、短文処理手段と長文処理手
段を1の計算機でプログラムの切り替えで行うため、簡
単な汎用の構造の計算機を使用して本機械翻訳システム
を構成することができるという効果がある。
【図面の簡単な説明】
【図1】本実施形態の機械翻訳システムの構成の概略を
示すブロック図である。
【図2】機械翻訳処理の流れを示すフローチャートであ
る。
【図3】文分割の手順を示すフローチャートである。
【図4】文長測定の手順及び短文用機械翻訳、長文用機
械翻訳の手順を示すフローチャートである。
【図5】分割訳文記録の手順を示すフローチャートであ
る。
【図6】文結合の手順を示すフローチャートである。
【図7】短文翻訳プログラムの構造を示す図である。
【図8】長文翻訳プログラムの構造を示す図である。
【図9】共通辞書の内容の一部を示す図である。
【図10】共起データ用辞書の内容の一部を示す図であ
る。
【図11】共起データを用いて翻訳した例文を表わした
図である。
【符号の説明】
11 入力装置(原言語入力手段) 20 RAM 22 入力文字列バッファ(入力文字列記憶手段) 23 文番号カウンタ 30 ROM 32 文分割プログラム(文分割手段) 33 文長測定プログラム(文長測定手段) 34 翻訳プログラム(翻訳手段) 35 長文翻訳プログラム(長文翻訳手段、共起データ
処理手段) 36 短文翻訳プログラム(短文翻訳手段) 37 文結合プログラム 38 翻訳辞書

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 原言語からなる文字列を入力する原言語
    入力装置と、 前記入力装置から入力された原言語文からなる文字列を
    記憶する入力文字列記憶手段と、 前記入力文字列記憶手段に入力された原言語文からなる
    文字列から、一文ずつ文を分割して取出す文分割手段
    と、 前記取出された一文の長さを測定する文長測定手段と、 前記取出された一文を目的言語文に翻訳する翻訳手段
    と、を備え、原言語文を目的言語文に一文ずつ翻訳する
    機械翻訳システムであって、 前記翻訳手段は、 前記文長測定手段により測定された一文の長さが所定の
    文字数よりも長い長文のときに当該一文を翻訳する長文
    翻訳手段と、 前記文長測定手段により測定された一文の長さが前記所
    定の文字数よりも短い短文のときに当該一文を翻訳する
    短文翻訳手段とからなることを特徴とする機械翻訳シス
    テム。
  2. 【請求項2】 前記長文翻訳手段は、単語の意味と接続
    関係を判断して訳語を選択するための共起データを有す
    るとともに、前記共起データを用いて翻訳処理する前記
    共起データ処理手段を有し、 前記短文翻訳手段は、共起データを有さないことを特徴
    とする請求項1に記載の機械翻訳システム。
  3. 【請求項3】 前記短文翻訳手段と前記長文翻訳手段と
    を別々の計算機上に配置したことを特徴とする請求項1
    又は請求項2に記載の機械翻訳システム。
  4. 【請求項4】 前記短文翻訳手段と前記長文翻訳手段と
    を同じ計算機上に配置し、プログラムの切り換えのみに
    より使い分けるようにしたことを特徴とする請求項1又
    は請求項2に記載の機械翻訳システム。
  5. 【請求項5】 原言語文を目的言語文に翻訳する機械翻
    訳処理プログラムを記録した記録媒体であって、前記プ
    ログラムは、コンピュータに、 原言語からなる文字列を入力する原言語文入力の手順
    と、 前記入力の手順から入力された原言語文からなる文字列
    を入力文字列記憶手段に記憶する入力文字列記憶の手順
    と、 前記入力文字列記憶の手順により入力された原言語文か
    らなる文字列から、一文ずつ文を分割して取出す文分割
    の手順と、 前記取出された一文の長さを測定する文長測定の手順
    と、 前記取出された一文を目的言語文に翻訳する翻訳の手順
    と、 前記文長測定の手順により測定された一文の長さが所定
    の文字数よりも長いときに、当該一文を翻訳する長文翻
    訳の手順と、 前記文長測定の手順により測定された一文の長さが前記
    所定の文字数よりも短いときに当該一文を翻訳する短文
    翻訳の手順とを実行させることを特徴とする機械翻訳処
    理プログラムを記録したコンピュータ読み取り可能な記
    録媒体。
  6. 【請求項6】 請求項5に記載の記録媒体において、 前記機械翻訳処理プログラムは、コンピュータに、前記
    長文翻訳の手順において、単語の意味と接続関係を判断
    して訳語を選択するための前記共起データを用いて翻訳
    処理する手順と、 前記短文翻訳の手順において、前記共起データを用いな
    いで翻訳処理する手順とを実行させるように構成された
    ことを特徴とする機械翻訳処理プログラムを記録したコ
    ンピュータ読み取り可能な記録媒体。
  7. 【請求項7】 請求項5又は請求項6に記載の記録媒体
    において、 前記機械翻訳処理プログラムは、コンピュータに、前記
    短文翻訳の手順と前記長文翻訳の手順とを別々の計算機
    において実行させるように構成されたことを特徴とする
    機械翻訳処理プログラムを記録したコンピュータ読み取
    り可能な記録媒体。
  8. 【請求項8】 請求項5又は請求項6に記載の記録媒体
    において、 前記機械翻訳処理プログラムは、コンピュータに、前記
    短文翻訳の手順と前記長文翻訳の手順とをプログラムの
    切り替えにより同一の計算機において実行させるように
    構成されたことを特徴とする機械翻訳処理プログラムを
    記録したコンピュータ読み取り可能な記録媒体。
JP10105776A 1998-03-31 1998-03-31 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体 Pending JPH11282839A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10105776A JPH11282839A (ja) 1998-03-31 1998-03-31 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10105776A JPH11282839A (ja) 1998-03-31 1998-03-31 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Publications (1)

Publication Number Publication Date
JPH11282839A true JPH11282839A (ja) 1999-10-15

Family

ID=14416569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10105776A Pending JPH11282839A (ja) 1998-03-31 1998-03-31 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体

Country Status (1)

Country Link
JP (1) JPH11282839A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422809B1 (ko) * 2000-12-27 2004-03-12 한국전자통신연구원 기계 번역을 위한 장문 분할 방법
JP5497230B1 (ja) * 2013-06-10 2014-05-21 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP5586772B1 (ja) * 2013-11-22 2014-09-10 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100422809B1 (ko) * 2000-12-27 2004-03-12 한국전자통신연구원 기계 번역을 위한 장문 분할 방법
JP5497230B1 (ja) * 2013-06-10 2014-05-21 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
WO2014199681A1 (ja) * 2013-06-10 2014-12-18 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP2014238772A (ja) * 2013-06-10 2014-12-18 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP5586772B1 (ja) * 2013-11-22 2014-09-10 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法
JP2014238808A (ja) * 2013-11-22 2014-12-18 株式会社バイトルヒクマ 翻訳システム及び翻訳プログラム、並びに翻訳方法

Similar Documents

Publication Publication Date Title
US5794177A (en) Method and apparatus for morphological analysis and generation of natural language text
US5579224A (en) Dictionary creation supporting system
JPH083815B2 (ja) 自然言語の共起関係辞書保守方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
JP4001283B2 (ja) 形態素解析装置および自然言語処理装置
KR100792203B1 (ko) 특허 문서 번역을 위한 미등록 단일명사 특허 전문용어의대역어 사전 구축 장치 및 방법
JPH11282839A (ja) 機械翻訳システム及び機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2838984B2 (ja) 汎用参照装置
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JPH0561902A (ja) 機械翻訳システム
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JPH03229367A (ja) テキストベース検索方式
JPH0827803B2 (ja) テキストベース検索方法
JP3139624B2 (ja) 形態素解析装置
JPH05225232A (ja) テキスト自動前編集装置
JP3253311B2 (ja) 言語処理装置および言語処理方法
JP3313810B2 (ja) アスペクト処理装置
JPH08235180A (ja) 機械翻訳装置
JPS63136264A (ja) 機械翻訳装置
JPH04130577A (ja) 自然言語処理装置
JPH0635964A (ja) 機械翻訳装置
JPH09160929A (ja) 文書処理装置及び方法
JPH08329107A (ja) 文書作成装置及び文書作成方法
JPH0756925A (ja) 中日機械翻訳方式
JPH03129468A (ja) 英日機械翻訳装置