JPH0244463A - 機械翻訳システムにおける原文入力方法 - Google Patents
機械翻訳システムにおける原文入力方法Info
- Publication number
- JPH0244463A JPH0244463A JP63195759A JP19575988A JPH0244463A JP H0244463 A JPH0244463 A JP H0244463A JP 63195759 A JP63195759 A JP 63195759A JP 19575988 A JP19575988 A JP 19575988A JP H0244463 A JPH0244463 A JP H0244463A
- Authority
- JP
- Japan
- Prior art keywords
- file
- translation
- divided
- sentences
- files
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 24
- 230000000877 morphologic effect Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、機械翻訳システムにおける原文入力方法に関
する。
する。
従来の技術
最近、原文をキー入力するだけで自動的にその訳文を得
ることができるようにした機械翻訳システムが出現して
いる。
ることができるようにした機械翻訳システムが出現して
いる。
この場合、翻訳システムに対する原文入力はファイル単
位で行われている。
位で行われている。
発明が解決しようとする間・照点
しかし、機械翻訳システムによる翻訳処理は時間がかか
るものである。よって、多量の文を含むファイルの翻訳
に際しては、莫大な時間(時には、数日)を要し、翻訳
処理の途中で中断せざるを得ない場合も生ずる。しかし
、翻訳処理中は機械を停止させるべきではなく、操作ミ
スも高価につくことになる。よって、現実に中断させて
しまった場合にはマシントラブル等の一因ともなってし
まい、連続処理が強いられることになり、不便である。
るものである。よって、多量の文を含むファイルの翻訳
に際しては、莫大な時間(時には、数日)を要し、翻訳
処理の途中で中断せざるを得ない場合も生ずる。しかし
、翻訳処理中は機械を停止させるべきではなく、操作ミ
スも高価につくことになる。よって、現実に中断させて
しまった場合にはマシントラブル等の一因ともなってし
まい、連続処理が強いられることになり、不便である。
問題点を解決するための手段
入力ファイル中で所定の閾値以上の多量の文の翻訳要求
が生じた時に、当該文を閾値以下の文からなる複数のフ
ァイルに分割して入力させ、分割されたファイル単位で
逐次翻訳させる。
が生じた時に、当該文を閾値以下の文からなる複数のフ
ァイルに分割して入力させ、分割されたファイル単位で
逐次翻訳させる。
作用
入力ファイル中の文数が少ない場合には、当該入力ファ
イルそのままで翻訳処理に供される。−方、入力ファイ
ル中の文数が多い場合には、複数のファイルに分割され
てから、そのファイル単位での翻訳に供される。よって
、分割ファイル間での翻訳処理の中断等は任意となり、
多量の文の翻訳処理の扱いが断続的でよく、容易となる
。
イルそのままで翻訳処理に供される。−方、入力ファイ
ル中の文数が多い場合には、複数のファイルに分割され
てから、そのファイル単位での翻訳に供される。よって
、分割ファイル間での翻訳処理の中断等は任意となり、
多量の文の翻訳処理の扱いが断続的でよく、容易となる
。
実施例
本発明の一実施例を図面を参照して説明する。
まず、本発明に用いられる機械翻訳システムの概念ない
しは手順を一般的な構文トランスファ方式による第3図
のアルゴリズムを参照して説明する。これは、例えば英
語−日本語機械翻訳システムであり、原文入力した後、
そのスペルチェック用の形態素解析を選択的に行う。そ
して、−船釣な形態素解析を行う。これは、単語単位の
解析であり、例えばハイフン等の特殊文字等に着目した
解析処理である。次に、構文解析を行う。これは、文の
構造を知るための統語論的解析である。この構文解析結
果から、意味的におかしな解析を排除する等の英語構造
の同定処理を行い英語の中間構造を作成した後、構文変
換処理を行う。即ち、英語の言い回しに基づいた中間構
造から日本語の言い回しを表しやすい中間構造に変換す
る。そして、日本語生成を行う。即ち、日本語の中間構
造から自然な日本語の文を生成するため、最初に構文生
成を行い、次に助詞や助動詞の並び順等を整える形態素
生成を行う。この後、最終的には訳文、例えば日本語を
出力する。
しは手順を一般的な構文トランスファ方式による第3図
のアルゴリズムを参照して説明する。これは、例えば英
語−日本語機械翻訳システムであり、原文入力した後、
そのスペルチェック用の形態素解析を選択的に行う。そ
して、−船釣な形態素解析を行う。これは、単語単位の
解析であり、例えばハイフン等の特殊文字等に着目した
解析処理である。次に、構文解析を行う。これは、文の
構造を知るための統語論的解析である。この構文解析結
果から、意味的におかしな解析を排除する等の英語構造
の同定処理を行い英語の中間構造を作成した後、構文変
換処理を行う。即ち、英語の言い回しに基づいた中間構
造から日本語の言い回しを表しやすい中間構造に変換す
る。そして、日本語生成を行う。即ち、日本語の中間構
造から自然な日本語の文を生成するため、最初に構文生
成を行い、次に助詞や助動詞の並び順等を整える形態素
生成を行う。この後、最終的には訳文、例えば日本語を
出力する。
ここに、入力された原文に対し形態素解析を施し、その
結果をユーザにフィードバックさせ前編集に供し、又は
、翻訳結果を対訳表示させてユーザ所望のものに手直し
させる後編集に供する等の、前・後編集機能が持たされ
ている。
結果をユーザにフィードバックさせ前編集に供し、又は
、翻訳結果を対訳表示させてユーザ所望のものに手直し
させる後編集に供する等の、前・後編集機能が持たされ
ている。
そして、本実施例の翻訳表示方法は、このような処理中
の、原文入力後のスペルチェック形態素解析、前編集な
いしは形態素解析なる、構文解析前の一連の処理に関す
るものであるが、基本的には、上側のような翻訳方式に
は何ら左右されないものである。
の、原文入力後のスペルチェック形態素解析、前編集な
いしは形態素解析なる、構文解析前の一連の処理に関す
るものであるが、基本的には、上側のような翻訳方式に
は何ら左右されないものである。
また、ブロック図構成的には第2図に示すように構成さ
れる。即ち、コマンド、テキスト等の入力を行うキーボ
ード等による入力部1と、その入力を受けて後述するフ
ァイル分割等の処理を実行する入力ファイル管理部2と
、入力ファイル管理部2を経て入力される原文について
翻訳処理を実行する翻訳部3と、翻訳結果を出力する出
力部4と、これら全体を制御する制御部5とからなる。
れる。即ち、コマンド、テキスト等の入力を行うキーボ
ード等による入力部1と、その入力を受けて後述するフ
ァイル分割等の処理を実行する入力ファイル管理部2と
、入力ファイル管理部2を経て入力される原文について
翻訳処理を実行する翻訳部3と、翻訳結果を出力する出
力部4と、これら全体を制御する制御部5とからなる。
このような構成において、本実施例による原文入力方式
を第1図のフローチャートを参照して説明する。基本的
には、ファイル単位での翻訳処理となるが、lファイル
として中断することなく連続処理する文数について所定
の閾値Nを予め設定しておく。つまり、この閾値Nが1
フアイルとして処理し得る文の最大数となる。ここに、
「文」とは何であるかが問題となるが、厳密には、何ん
らかの解析を行なわなければこれを規定できない。
を第1図のフローチャートを参照して説明する。基本的
には、ファイル単位での翻訳処理となるが、lファイル
として中断することなく連続処理する文数について所定
の閾値Nを予め設定しておく。つまり、この閾値Nが1
フアイルとして処理し得る文の最大数となる。ここに、
「文」とは何であるかが問題となるが、厳密には、何ん
らかの解析を行なわなければこれを規定できない。
即ち、第3図の構文トランスファ方式によれば、「形態
素解析」以降の「構文解析」にて「文」が認識されるも
のである。従って、本実施例のファイル分割処理は、実
際には「構文解析」以降の処理において本来の機能が発
揮されるものである。
素解析」以降の「構文解析」にて「文」が認識されるも
のである。従って、本実施例のファイル分割処理は、実
際には「構文解析」以降の処理において本来の機能が発
揮されるものである。
まず、入力ファイル中の文数が多ければ、必然的にその
翻訳に要する時間も長くなる。そこで、入力ファイル中
に存在する文数nを計数し、この文数nが予め設定され
た閾値Nを越える入力ファイルが与えられた時には、当
該入力ファイルを[n / N ]個(但し、[x]は
ガウス記号であり、X以上の最小の整数)のファイルf
に分割する。
翻訳に要する時間も長くなる。そこで、入力ファイル中
に存在する文数nを計数し、この文数nが予め設定され
た閾値Nを越える入力ファイルが与えられた時には、当
該入力ファイルを[n / N ]個(但し、[x]は
ガウス記号であり、X以上の最小の整数)のファイルf
に分割する。
当然、この分割に際しては閾値N以下の文にょす分割フ
ァイルが構成されるようにするのは勿論、各分割ファイ
ル中に含まれる文数ができるだけ均一となるように分割
される。第1図には、N行ずつの([n/N1−1)個
の分割ファイルfと、(n−N・ ([n/N] −1
))行の分割ファイルfとを作成する場合を例示する。
ァイルが構成されるようにするのは勿論、各分割ファイ
ル中に含まれる文数ができるだけ均一となるように分割
される。第1図には、N行ずつの([n/N1−1)個
の分割ファイルfと、(n−N・ ([n/N] −1
))行の分割ファイルfとを作成する場合を例示する。
このような分割ファイルによれば、個々の分割ファイル
の翻訳に要する時間は限られたものとなり、各分割ファ
イル間での翻訳処理の一時的な中断が容易となる。よっ
て、従来のような連続処理を要する1文中での中断とい
ったマシントラブルの被害を最小限とすることができ、
ユーザーにとって使い安いものとなる。
の翻訳に要する時間は限られたものとなり、各分割ファ
イル間での翻訳処理の一時的な中断が容易となる。よっ
て、従来のような連続処理を要する1文中での中断とい
ったマシントラブルの被害を最小限とすることができ、
ユーザーにとって使い安いものとなる。
ところで、このように文の数のみに着目して入力ファイ
ルを複数のファイルに分割したが、1文の長さも翻訳時
間に重要な影響を及ぼす。そこで、例えば(文数)×(
1文の平均語数)等のように、適切な関数を定めること
により、−層きめ細かい処理を行わせることも可能であ
る。
ルを複数のファイルに分割したが、1文の長さも翻訳時
間に重要な影響を及ぼす。そこで、例えば(文数)×(
1文の平均語数)等のように、適切な関数を定めること
により、−層きめ細かい処理を行わせることも可能であ
る。
なお、厳密な意味での「文」は、前述した通り、解析が
終了しなければ決定できない。しかし、本発明の目的は
ファイルの分割であり、1フアイル中の正確な文数等は
問題とならない。そこで、段落の区切り、その他明白な
文の区切りのみを見てファイルを分割することにより、
本発明の目的を達成することは十分可能である。
終了しなければ決定できない。しかし、本発明の目的は
ファイルの分割であり、1フアイル中の正確な文数等は
問題とならない。そこで、段落の区切り、その他明白な
文の区切りのみを見てファイルを分割することにより、
本発明の目的を達成することは十分可能である。
発明の効果
本発明は、上述したように入力ファイル中で所定の閾値
以上の多量の文の翻訳要求が生じた時に、当該文を閾値
以下の文からなる複数のファイルに分割して入力させ、
分割されたファイル単位で逐次翻訳させるようにしたの
で、入力ファイル中の文数が多く連続処理するとなると
莫大な翻訳処理時間を要するような場合であっても、複
数のファイルに分割されてから、そのファイル単位での
翻訳に供されるため、分割ファイル間での翻訳処理の一
時中断等は任意となり、多量の文の翻訳処理の扱いが断
続的でよく、マシントラブルも少なし入ものとなる。
以上の多量の文の翻訳要求が生じた時に、当該文を閾値
以下の文からなる複数のファイルに分割して入力させ、
分割されたファイル単位で逐次翻訳させるようにしたの
で、入力ファイル中の文数が多く連続処理するとなると
莫大な翻訳処理時間を要するような場合であっても、複
数のファイルに分割されてから、そのファイル単位での
翻訳に供されるため、分割ファイル間での翻訳処理の一
時中断等は任意となり、多量の文の翻訳処理の扱いが断
続的でよく、マシントラブルも少なし入ものとなる。
図面は本発明の一実施例を示し、第1図はフローチャー
ト、第2図はブロック図、第3図は構文トランスファ方
式を示すフローチャートである。
ト、第2図はブロック図、第3図は構文トランスファ方
式を示すフローチャートである。
Claims (1)
- 入力ファイル中で所定の閾値以上の多量の文の翻訳要求
が生じた時に、当該文を閾値以下の文からなる複数のフ
ァイルに分割して入力させ、分割されたファイル単位で
逐次翻訳させることを特徴とする機械翻訳システムにお
ける原文入力方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63195759A JPH0244463A (ja) | 1988-08-05 | 1988-08-05 | 機械翻訳システムにおける原文入力方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP63195759A JPH0244463A (ja) | 1988-08-05 | 1988-08-05 | 機械翻訳システムにおける原文入力方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0244463A true JPH0244463A (ja) | 1990-02-14 |
Family
ID=16346486
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63195759A Pending JPH0244463A (ja) | 1988-08-05 | 1988-08-05 | 機械翻訳システムにおける原文入力方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0244463A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6158A (ja) * | 1984-06-12 | 1986-01-06 | Nippon Carbide Ind Co Ltd | アジンの製法 |
US5931707A (en) * | 1996-04-01 | 1999-08-03 | Kansei Corporation | Connector with terminal hooking device |
US7414763B2 (en) | 2002-05-31 | 2008-08-19 | Samsung Electronics Co., Ltd. | Contact image sensor fixing device |
-
1988
- 1988-08-05 JP JP63195759A patent/JPH0244463A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6158A (ja) * | 1984-06-12 | 1986-01-06 | Nippon Carbide Ind Co Ltd | アジンの製法 |
US5931707A (en) * | 1996-04-01 | 1999-08-03 | Kansei Corporation | Connector with terminal hooking device |
US7414763B2 (en) | 2002-05-31 | 2008-08-19 | Samsung Electronics Co., Ltd. | Contact image sensor fixing device |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPS63223962A (ja) | 翻訳装置 | |
JPS638864A (ja) | 翻訳装置 | |
JPS58192173A (ja) | 機械翻訳装置 | |
JPH0244463A (ja) | 機械翻訳システムにおける原文入力方法 | |
JP2742059B2 (ja) | 翻訳用辞書編集装置 | |
JPH0520354A (ja) | 日本語文章解析装置 | |
JP3132563B2 (ja) | 文書作成支援装置 | |
Chen et al. | Development of a partially bracketed corpus with part-of-speech information only | |
El-Naggar | A finite state automata of the Arabic grammar | |
JP2915225B2 (ja) | 文書作成装置 | |
Loh et al. | Machine-aided Translation from Chinese to English | |
JPH03259376A (ja) | 日本語長文分割支援装置 | |
JPH05233689A (ja) | 文書自動要約方法 | |
JPH04152458A (ja) | 文書作成装置 | |
JPS63175971A (ja) | 自然言語処理方式 | |
Mone et al. | Automatic Answering System for English Language Questions | |
JPH03248264A (ja) | 日本語文推敲装置 | |
JPH09212507A (ja) | 文字処理装置と文字列の解析方法 | |
JPH08137883A (ja) | 辞書装置 | |
JPH03157766A (ja) | 機械翻訳装置 | |
JPH08272784A (ja) | 日本語変換装置 | |
JPS63298668A (ja) | 自然言語解析装置 | |
JPH09106398A (ja) | 機械翻訳方法 | |
JPH02297137A (ja) | 文書作成支援装置 | |
Hunnicutt et al. | A morphologically-based word predictor for Swedish |