JPH0244463A

JPH0244463A - 機械翻訳システムにおける原文入力方法

Info

Publication number: JPH0244463A
Application number: JP63195759A
Authority: JP
Inventors: Minoru Sakai; 稔境井; Takashi Katooka; 隆加登岡; Shuntaro Shimada; 嶋田　駿太郎; Yoshiyuki Usui; 碓井　吉行; Tadahito Hori; 堀　格人
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1988-08-05
Filing date: 1988-08-05
Publication date: 1990-02-14

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、機械翻訳システムにおける原文入力方法に関
する。

従来の技術最近、原文をキー入力するだけで自動的にその訳文を得
ることができるようにした機械翻訳システムが出現して
いる。

この場合、翻訳システムに対する原文入力はファイル単
位で行われている。

発明が解決しようとする間・照点しかし、機械翻訳システムによる翻訳処理は時間がかか
るものである。よって、多量の文を含むファイルの翻訳
に際しては、莫大な時間（時には、数日）を要し、翻訳
処理の途中で中断せざるを得ない場合も生ずる。しかし
、翻訳処理中は機械を停止させるべきではなく、操作ミ
スも高価につくことになる。よって、現実に中断させて
しまった場合にはマシントラブル等の一因ともなってし
まい、連続処理が強いられることになり、不便である。

問題点を解決するための手段入力ファイル中で所定の閾値以上の多量の文の翻訳要求
が生じた時に、当該文を閾値以下の文からなる複数のフ
ァイルに分割して入力させ、分割されたファイル単位で
逐次翻訳させる。

作用入力ファイル中の文数が少ない場合には、当該入力ファ
イルそのままで翻訳処理に供される。−方、入力ファイ
ル中の文数が多い場合には、複数のファイルに分割され
てから、そのファイル単位での翻訳に供される。よって
、分割ファイル間での翻訳処理の中断等は任意となり、
多量の文の翻訳処理の扱いが断続的でよく、容易となる
。

実施例本発明の一実施例を図面を参照して説明する。

まず、本発明に用いられる機械翻訳システムの概念ない
しは手順を一般的な構文トランスファ方式による第３図
のアルゴリズムを参照して説明する。これは、例えば英
語−日本語機械翻訳システムであり、原文入力した後、
そのスペルチェック用の形態素解析を選択的に行う。そ
して、−船釣な形態素解析を行う。これは、単語単位の
解析であり、例えばハイフン等の特殊文字等に着目した
解析処理である。次に、構文解析を行う。これは、文の
構造を知るための統語論的解析である。この構文解析結
果から、意味的におかしな解析を排除する等の英語構造
の同定処理を行い英語の中間構造を作成した後、構文変
換処理を行う。即ち、英語の言い回しに基づいた中間構
造から日本語の言い回しを表しやすい中間構造に変換す
る。そして、日本語生成を行う。即ち、日本語の中間構
造から自然な日本語の文を生成するため、最初に構文生
成を行い、次に助詞や助動詞の並び順等を整える形態素
生成を行う。この後、最終的には訳文、例えば日本語を
出力する。

ここに、入力された原文に対し形態素解析を施し、その
結果をユーザにフィードバックさせ前編集に供し、又は
、翻訳結果を対訳表示させてユーザ所望のものに手直し
させる後編集に供する等の、前・後編集機能が持たされ
ている。

そして、本実施例の翻訳表示方法は、このような処理中
の、原文入力後のスペルチェック形態素解析、前編集な
いしは形態素解析なる、構文解析前の一連の処理に関す
るものであるが、基本的には、上側のような翻訳方式に
は何ら左右されないものである。

また、ブロック図構成的には第２図に示すように構成さ
れる。即ち、コマンド、テキスト等の入力を行うキーボ
ード等による入力部１と、その入力を受けて後述するフ
ァイル分割等の処理を実行する入力ファイル管理部２と
、入力ファイル管理部２を経て入力される原文について
翻訳処理を実行する翻訳部３と、翻訳結果を出力する出
力部４と、これら全体を制御する制御部５とからなる。

このような構成において、本実施例による原文入力方式
を第１図のフローチャートを参照して説明する。基本的
には、ファイル単位での翻訳処理となるが、ｌファイル
として中断することなく連続処理する文数について所定
の閾値Ｎを予め設定しておく。つまり、この閾値Ｎが１
フアイルとして処理し得る文の最大数となる。ここに、
「文」とは何であるかが問題となるが、厳密には、何ん
らかの解析を行なわなければこれを規定できない。

即ち、第３図の構文トランスファ方式によれば、「形態
素解析」以降の「構文解析」にて「文」が認識されるも
のである。従って、本実施例のファイル分割処理は、実
際には「構文解析」以降の処理において本来の機能が発
揮されるものである。

まず、入力ファイル中の文数が多ければ、必然的にその
翻訳に要する時間も長くなる。そこで、入力ファイル中
に存在する文数ｎを計数し、この文数ｎが予め設定され
た閾値Ｎを越える入力ファイルが与えられた時には、当
該入力ファイルを［ｎ　／　Ｎ　］個（但し、［ｘ］は
ガウス記号であり、Ｘ以上の最小の整数）のファイルｆ
に分割する。

当然、この分割に際しては閾値Ｎ以下の文にょす分割フ
ァイルが構成されるようにするのは勿論、各分割ファイ
ル中に含まれる文数ができるだけ均一となるように分割
される。第１図には、Ｎ行ずつの（［ｎ／Ｎ１−１）個
の分割ファイルｆと、（ｎ−Ｎ・　（［ｎ／Ｎ］　−１
））行の分割ファイルｆとを作成する場合を例示する。

このような分割ファイルによれば、個々の分割ファイル
の翻訳に要する時間は限られたものとなり、各分割ファ
イル間での翻訳処理の一時的な中断が容易となる。よっ
て、従来のような連続処理を要する１文中での中断とい
ったマシントラブルの被害を最小限とすることができ、
ユーザーにとって使い安いものとなる。

ところで、このように文の数のみに着目して入力ファイ
ルを複数のファイルに分割したが、１文の長さも翻訳時
間に重要な影響を及ぼす。そこで、例えば（文数）×（
１文の平均語数）等のように、適切な関数を定めること
により、−層きめ細かい処理を行わせることも可能であ
る。

なお、厳密な意味での「文」は、前述した通り、解析が
終了しなければ決定できない。しかし、本発明の目的は
ファイルの分割であり、１フアイル中の正確な文数等は
問題とならない。そこで、段落の区切り、その他明白な
文の区切りのみを見てファイルを分割することにより、
本発明の目的を達成することは十分可能である。

発明の効果本発明は、上述したように入力ファイル中で所定の閾値
以上の多量の文の翻訳要求が生じた時に、当該文を閾値
以下の文からなる複数のファイルに分割して入力させ、
分割されたファイル単位で逐次翻訳させるようにしたの
で、入力ファイル中の文数が多く連続処理するとなると
莫大な翻訳処理時間を要するような場合であっても、複
数のファイルに分割されてから、そのファイル単位での
翻訳に供されるため、分割ファイル間での翻訳処理の一
時中断等は任意となり、多量の文の翻訳処理の扱いが断
続的でよく、マシントラブルも少なし入ものとなる。

【図面の簡単な説明】

図面は本発明の一実施例を示し、第１図はフローチャー
ト、第２図はブロック図、第３図は構文トランスファ方
式を示すフローチャートである。

Claims

【特許請求の範囲】

入力ファイル中で所定の閾値以上の多量の文の翻訳要求
が生じた時に、当該文を閾値以下の文からなる複数のフ
ァイルに分割して入力させ、分割されたファイル単位で
逐次翻訳させることを特徴とする機械翻訳システムにお
ける原文入力方法。