JPS62143178A - 自然言語翻訳方式 - Google Patents

自然言語翻訳方式

Info

Publication number
JPS62143178A
JPS62143178A JP60282851A JP28285185A JPS62143178A JP S62143178 A JPS62143178 A JP S62143178A JP 60282851 A JP60282851 A JP 60282851A JP 28285185 A JP28285185 A JP 28285185A JP S62143178 A JPS62143178 A JP S62143178A
Authority
JP
Japan
Prior art keywords
sentence
document
grammar
translation
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60282851A
Other languages
English (en)
Inventor
Atsushi Okajima
岡島 惇
Fumiyuki Yamano
山野 文行
Eri Okamoto
岡本 恵里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60282851A priority Critical patent/JPS62143178A/ja
Publication of JPS62143178A publication Critical patent/JPS62143178A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は、自然言語翻訳方式に関し、特に第1の自然言
語で表現された文章を第2の自然言語で表現された文章
に翻訳する機械翻訳システムにおいて、雑誌、新聞等の
ように、標題(見出し)、要約1本文といった、複数個
の構成物からなる文章を効率良く翻訳するのに好適な自
然言語翻訳方式%式% 〔発明の背景〕 現在、日本語から英語へ、あるいは、英語から日本語へ
と文章をコンピュータで翻訳する機械翻訳システムの研
究開発が活発に進められている。
技術文書やマニュアルのような特定の分野の文章に対象
を限定し、翻訳後、人手により校正すれば実用化が可能
な段階にきている。
従来の翻訳方式を、翻訳の対象範囲から分類すると、次
の4つのタイプに分けられる。
第1のタイプは、単語対応の辞書引きによるものであり
、電子辞書と呼ばれるものである。
第2のタイプは、定型文、常用文を文の型て記憶してお
くものであり、その一部を別の単語に変更して翻訳する
ものもこのタイプに入る。
第3のタイプは、任意の文型の複雑な文を構文解析する
ものである。
第4のタイプは、文のみならず、文章を翻訳対象とする
ものであり、研究としては、文屈・談話の理解として、
主に人工知能の研究の中で行なわれている。例えば、「
彼は・・・・・」といった文に対し、それ以前の文を解
析することにより、彼が誰であるかを明示するような文
章理解の研究が行なわれている。
一方、文や文章を解析する方法(一般に構文解析という
)から見た場合、文法規則の扱いやすさのため、なるべ
く統一的な記述方法が採られてきた。例えば、「冠詞 
名詞」の並びを「名詞句」にするといった書き換え規則
により、まとめて行き、「文」にまとまれば、正しく構
文解析が行なわれたとする書き換え規則によるものが1
、一般的な方法である。また、単語の語尾活用等の文字
を扱う規則と、「名詞句 動詞句」を1文」とするよう
な単語や句を扱う規則を別にするとか入力言語の解析と
出力言語の生成とは規則群を別にするといった処理の流
れの中で、異なる規則群を適用していくものもある。
上記とは別に、対象の違いによって文法が異なると考え
るべきだという考え方は、文法学からも一般的に指摘さ
れていることである(例えば、R。
クワーク:現代英語文法−大学錫;紀伊国屋書店の7.
66ブロツク言語の項を参照)。
さらに、構文的な多義を文法規則だけではなく節番号、
目次等(これをどう判定するかが問題だが)を手がかり
に解消する方法も考えられる。その−例が、手法は明確
ではないが、広瀬他:英日機械翻訳システムATLAS
/Iにおける原文形式解析(情報処理学会第28回全国
大会+PP−903〜904)に述べられている。
〔発明の目的〕
本発明の目的は、このような従来の問題を解消し、翻訳
すべき文書等の属する分野・対象の違いや同−文書内で
も役割が違う部分には異なる文法規則を適用して、構文
解析における多義性解消率を向上させ、かつ、処理効率
の良い自然言語翻訳方式を提供することにある。
〔発明の概要〕
上記目的を達成するために1本発明の自然言語翻訳方式
は、第1自然言語の文法規則群または第2自然言語の文
法規則群を格納している文法ファイル、および各種情報
を格納している主メモリを用いて、第1自然言語から第
2自然言語に機械翻訳する機械翻訳システムにおいて、
上記文法ファイルの文法規則群を分野等の対象と文書内
の各部分別とで構成し、入力文書に対して該文法ファイ
ルのどの文法規則を使用すべきかを判定する手段を設け
、該判定手段による判定結果に基づいて該文法規則の適
用を決定し、上記文法規則単位に入力文書の各部分を翻
訳することに特徴がある。
〔発明の実施例〕
以下、本発明の一実施例を、図面により詳細に説明する
まず、本発明の詳細な説明する。
機械翻訳システムにおいて、対象および文章の構成要素
別に、文法群を構成し、この文法群を文章のどの部分に
適用していくかを指示する制御部とを設ける。また、こ
れとは別に、対象や部分の違いを認識する手段を設け、
該認識手段の情報により、文法群の適用を制御すること
により、適用される文法数を少なくし、もって、高速か
つ多義性(適用可能な文法が多いと、構文的多義性が増
える)の少ない構文解析を行えるようにしたものである
第2図は、本発明の一実施例を示す機械翻訳システムの
概略描成図である。
第2図において、1は第1自然言語情報等を入力するた
めのキーボード、2は入力文書および翻訳結果等を表示
するための表示装置、3は入力文書を入力するための図
形読取装置、4は各種清報を格納しているメインメモリ
55はCPU、6は第1自然言語と第2自然言語とを対
比して格納している辞書ファイル、7は対象および文書
中での部分別の文法規則群を格納している文法ファイル
である。
第3図は、第2図に示したキーボード1および表示装置
2の構成図である。
キーボード1には、入力文書をキーボード1から入力す
る際、文字コードを入力する文字キー1a、入力文書を
図形読取装置3から入力する際や翻訳を行なう際に必要
となる機能を選択指示するコードを入力する機能キー1
b(開始キー1b1を含む)2図形読取装置3から読取
られた文書上の位置を表示装置3上で指示するための位
置指示キー1cを有する。また、表示装置2には、見出
し、要約、通常の文章1図などを含んでいる新聞や雑誌
等の入力文書が表示されている。
第4図は、第2図におけるメインメモリ4の割付配置図
である。
メインメモリ4は、翻訳のためのアルゴリズムを実行す
る処理プログラム419図形読取装置3から読取られた
文書上のどこにどの文が対応しているか等を示す図形/
文対応テーブル42.入力文を格納する入力文エリア4
3.対象および文章の構成要素別に文法ファイル7から
適した文法(または文法番号)のみを集めて構成され、
入力文を翻訳するための翻訳用規則群テーブル44.翻
訳文を格納する翻訳文エリア452文書の図形的範囲を
参照するための対応関係を表示する図形テーブル46.
ワークレジスタ47を有する。
次に、本実施例の処理動作について説明する。
まず、ユーザが開始キー1b工を押下すると、CPU5
は処理プログラム41を起動する。処理プログラム41
は、大きく分けて、次の2つの処理を行う。
(I)、翻訳すべき単位の切り出しと、切り出された単
位の対象および文書中での役割の認識。
(■)、対象および文書中での部分の認識に従った翻訳
の実行と翻訳文の表示。
以下、本実施例を上記(r)、 (II)の処理に分け
て詳細に説明する。
(I)、9訳すべき単位の切り出しと役割の認識翻訳す
べき文書における翻訳の単位としては、一般には文(英
語の場合は″・″やII Q uで区切られた単位)を
考えれば良いが、新聞記事の見出しや図中の文字列、論
文の標題や著者名等断片的な文字列については、どこま
でを単位とすべきか不明のものもあるが、一応それらも
、文字列として切れる単位をもって一文と定義しておく
さて、この−文を切り出す操作としては、入力が、文字
単位にキーボード1の文字キー1aから入力される場合
と、図形読取装置3から入力する場合では、少し処理が
異なる。すなわち、文字キー1aから入力する場合は、
行や句読点を手がかりに、「単語の後が行末まで空白な
ら句読点がなくとも見出しと見なして一文とする。」と
いった方法を採る。一方、図形読取装置3から入力する
場合では、字の大きさ、字種、書体の他、図表や絵との
位置関係や段組み等から一文の範囲や文書中での役割が
決まることが多いが、これを認識する方法は、種々考え
られるが本発明では特に規定しない。−例としてユーザ
に指定させる方法の処理動作を示すフローチャートを第
5図に示す。
まず、図形読取装置3から入力された文書を表示装置2
に表示する(ステップ201)。次に、文書がどのよう
な対象(分野や文書の種類)に居するかをユーザに指示
するように表示(または音声等で知らせてもよい)する
(ステップ202)。次に、ユーザの入力を受けてこれ
をワークレジスタ47に格納する(ステップ203)。
次に、文書中の翻訳の単位(以後、これを単に「図形」
と呼ぶ)の範囲をユーザが指示するように表示する(ス
テップ204)。ユーザにより範囲が指示されると、こ
の図形に番号を付け2図形番号とその文書上の位置を図
形テーブル46に格納する(ステップ205)。以上の
処理により図形が決定すると、その中にある文字列の文
字種、字体および文字を認識し1文番号を付し、図形7
文対応テーブル42には、図形番号と対応づけて文番号
を登録しくステップ206)、入力文エリア43には、
文字コードとしての文章を格納する(ステップ207)
、ここで、文字種、字体は5単語や文字単位に変わるこ
とがあるので1文字コードの違いとして表現されること
が望ましいが、花文字等の図形的属性もあるので、それ
らは、図形7文対応テーブル42に格納されてもよい。
次に、範囲指定された図形が、文章全体のどの部分にあ
たるのかをユーザに指示するように表示する(ステップ
208)。ユーザの部分指示が入力されると、これを図
形7文対応テーブル42に格納する(ステップ209)
。次に、表示文書中に未だ範囲を指定されない文字があ
るかをチェックしくステップ210)、あわば、範囲指
定(範囲指示)の表示(ステップ204)に戻り、なけ
れば処理を終了する。
第5図のフローチャートに示された処理を、第3図の表
示装置2に示された文書の一例に対して実行した一例を
第6図に示す。ここに、HVgは各図形の左上を、また
LL」Hは右下を表し、この範囲内の図形を指示する。
また、第7図には、各範囲の対象と部分の分類とそのコ
ードの一実施例を示す。ここに、「雑誌」等は「対象」
の指示入力のための補助情報を表示したものであり、「
大分野」等は、「部分」の指示入力のための補助情報を
表示したものである。
第8図は、本実施例による図形7文対応テーブル42の
テーブル構成例を示す図である。これは、上記の処理に
より、図形7文対応テーブル42に格納された情報の一
例が表示されている。
第8図において、421は図形読取装置3により読取ら
れた図形の番号を示す図形No、422は文字の大きさ
を示すポイント数、423は字体(Bはボールド、Eは
エリート)、424は文N05425は対象(第7図参
照−)、426は部分(第7図参照)である。また、ポ
イント数422と字体423により図形属性を表し、対
象425と部分426により文属性を表している。
字体4232例えばボールドBやエリートEなどは、図
形読取装置3に依存して良く、「対象」や1部分」(「
文屈性」)がユーザから指定されない時、処理プログラ
ム41により自動的に判定されるような場合に利用され
る。「対象J425゜1部分」426の欄の数字は、第
7図に示されるような分類に従った場合の一例であり、
例えば第8図の文No(424)が「4」のものは、「
雑誌」の「小見出し」であることを示している。
さて、以上のようにして、翻訳単位(−例として1文」
として以上述べたので、以下も文として述べる)が切出
され、各文の「対ajと「文書中での部分」の情報が格
納されると、次に各文に対し、必要最小限となるべく構
成された文法群によす翻訳が行われる。
(■)、翻訳の実行と翻訳文の表示 第1図は1本実施例による翻訳の実行と翻訳文の表示処
理を説明するためのフローチャートである。これは、上
述した(1)の処理(翻訳単位の切り出しと対象および
部分の認識)を含む処理動作のフローチャートの一例で
ある。以下、第1図のフローチャートに従って説明する
まず、以上述べたように、「対象」と「部分」の認識を
行い(ステップ101)、「対象」と「部分」の情報に
従ってそれに適した文法群を設定する(ステップ]02
)。設定の方法は、設定規則としてファイル化し、それ
に従って規則群を設定する方法も考えられるが、簡便化
のためには、あらかじめ「対象」と「部分」別にどのよ
うな規則群を使うかをテーブル化しておくのが望ましい
。第9図に文法ファイル7の内容の一例を、また、第1
0図にその文法ファイル7のどの文法規則を翻訳の際に
使用する規則群とするかを指示する規則群テーブルの一
実施例を示す。規則群テーブルは、文法ファイル7内に
格納されても、また、メインメモリ4内にテーブルまた
はワークレジスタ47の一部として設けられてもよい。
さらに、文法群の設定においては(ステップ102)、
その結果を翻訳用規則群テーブル44に格納するが、そ
の内容は対応する文法ファイル7内の規則そのものを翻
訳用規則群テーブル44に複写してもよいし、規則番号
を表すコードのみを翻訳用規則群テーブル44に格納し
、実際の翻訳時には、そのコードに従って文法ファイル
7を参照しながら規則を適用して行く方法でもよい。
次に、翻訳用規則群テーブル44に従って翻訳を行う(
ステップ103)。その方法は、特に規定しないが、例
えば、本発明者等による特開昭56−138586号公
報によればよい。翻訳が終った翻訳文は、翻訳文エリア
45に格納され、ユーザに表示される(ステップ104
)。表示の方法は、表示装置2によるのが望ましいが、
大量に翻訳する場合でユーザの確認が不要の場合は、表
示装置2のかわりに写植機等に出力されてもよい。文書
の入力が図形読取装置3から行われる場合は、翻訳文の
原文における図形属性(ポイント数422と字体423
)に従って表示されるのが望ましく、その場合、翻訳文
が原文より長い場合は、あらかじめ翻訳用規則群テーブ
ル44に意味は同じで短い文にする規則を用意しておく
等により文の長さを調整するとか1文字の大きさを調整
することにより、同じ図柄の出力文書を得るのが望まし
い。
第11図に第3図に図示された文書の翻訳結果のこのよ
うに、本実施例においては、翻訳に最適の規則が対象と
なる文の異なりや、同−文書内でもその役割が部分によ
って異なることを利用して、それら翻訳のための規則群
を変えることにより、各規則群を翻訳すべき文に適した
、かつ、規則数も必要最小限のものとすることにより、
簡便で、多義性解消率の高く、かつ、処理効率の良い翻
訳機を得ることができる。また、本実施例は、主に英語
で記述された文書を日本語に翻訳する場合を示したが、
逆に日本語を英語に翻訳する場合、さらには、第1言語
と第2言語が同一で、文書の必要な部分のみを(例えば
、主文だけを集めるとか修飾句は削るといった方法によ
って)抜粋するといった場合にも適用し得る。
〔発明の効果〕
以上説明したように、本発明によれば、翻訳すべき文書
等の厘する分野・対象の違いや同−文書内でも役割が違
う部分には異なる文法規則を適用して、構文解析におけ
る多義性解消率を向上でき、かつ、処理効率の良い翻訳
が行える。
【図面の簡単な説明】
第1図は本発明の一実施例を示す翻訳方法の処理フロー
チャート、第2図は本実施例による機械翻訳システムの
構部構成図、第3図は第2図における入力装置と表示装
置の構成図、第4図は第2図におけるメインメモリの割
付は配置図、第5図はユーザから対象や文書中の部分等
の情報を得る処理の一実施例を示すフローチャート、第
6図は第5図の処理によりユーザが指示入力した情報の
一例を示す図、第7図は対象と部分の分類の一例を示す
図、第8図は第5図の処理により得られた図形7文対応
テーブルの一例を示す図、第8図はり設定される規則群
の一例を示す図、第ト÷図は第3図に図示された文書の
翻訳結果表示の一例を示す図である。 2:表示装置、3:図形読取装置、4:メインメモリ、
41:処理プロクラム、42;図形7文対応テーブル、
44:翻訳用規則群テーブル、43:入力文エリア、4
5:8訳文エリア、46二図形テーブル、47:ワーク
レジスタ、7:対象/部分別文法ファイル。 第 1 図 第2 図 c Z 5 図 第 7 (2) 第 9 図

Claims (2)

    【特許請求の範囲】
  1. (1)第1自然言語の文法規則群または第2自然言語の
    文法規則群を格納している文法ファイル、および各種情
    報を格納している主メモリを用いて、第1自然言語から
    第2自然言語に機械翻訳する機械翻訳システムにおいて
    、上記文法ファイルの文法規則群を分野等の対象と文書
    内の各部分別とで構成し、入力文書に対して該文法ファ
    イルのどの文法規則を使用すべきかを判定する手段を設
    け、該判定手段による判定結果に基づいて該文法規則の
    適用を決定し、上記文法規則単位に入力文書の各部分を
    翻訳することを特徴とする自然言語翻訳方式。
  2. (2)上記判定手段は、ユーザとの質疑応答により情報
    を収集することを特徴とする特許請求の範囲第1項記載
    の自然言語翻訳方式。
JP60282851A 1985-12-18 1985-12-18 自然言語翻訳方式 Pending JPS62143178A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60282851A JPS62143178A (ja) 1985-12-18 1985-12-18 自然言語翻訳方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60282851A JPS62143178A (ja) 1985-12-18 1985-12-18 自然言語翻訳方式

Publications (1)

Publication Number Publication Date
JPS62143178A true JPS62143178A (ja) 1987-06-26

Family

ID=17657891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60282851A Pending JPS62143178A (ja) 1985-12-18 1985-12-18 自然言語翻訳方式

Country Status (1)

Country Link
JP (1) JPS62143178A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6458060A (en) * 1987-08-28 1989-03-06 Hitachi Software Eng Translating device
US4980829A (en) * 1987-03-13 1990-12-25 Hitachi, Ltd. Method and system for language translation
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4980829A (en) * 1987-03-13 1990-12-25 Hitachi, Ltd. Method and system for language translation
JPS6458060A (en) * 1987-08-28 1989-03-06 Hitachi Software Eng Translating device
JP2000003126A (ja) * 1998-03-23 2000-01-07 Xerox Corp 音声部を使用するテキスト要約方法

Similar Documents

Publication Publication Date Title
US4864503A (en) Method of using a created international language as an intermediate pathway in translation between two national languages
EP0370774B1 (en) Machine translation system
JP3220560B2 (ja) 機械翻訳装置
KR900009120B1 (ko) 기계번역장치
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
JPH02253369A (ja) 電子辞書
JPH05120324A (ja) 言語処理方式
CN109344389B (zh) 一种汉盲对照双语语料库的构建方法和系统
JPS63106866A (ja) 機械翻訳装置
JP2848729B2 (ja) 翻訳方法および翻訳装置
JPS59165179A (ja) 辞書引方式
JPS62143178A (ja) 自然言語翻訳方式
JPS62245366A (ja) 文書処理装置
JPS62163174A (ja) 機械翻訳装置
JPH0561902A (ja) 機械翻訳システム
Tanev et al. LINGUA: a robust architecture for text processing and anaphora resolution in Bulgarian
JP2862236B2 (ja) 文字処理装置
JPH03129568A (ja) 文書処理装置
JPS6244872A (ja) 機械翻訳装置
JPH07182344A (ja) 機械翻訳装置
JPH0778166A (ja) 翻訳方法及び機械翻訳装置
JPH11232268A (ja) 文書処理装置、ルビ割り付け方法、及び記録媒体
JPH0550778B2 (ja)
JPH01120612A (ja) 操作ガイダンス方式
JPH0414168A (ja) 文書作成装置