JPH07113922B2 - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH07113922B2
JPH07113922B2 JP62091405A JP9140587A JPH07113922B2 JP H07113922 B2 JPH07113922 B2 JP H07113922B2 JP 62091405 A JP62091405 A JP 62091405A JP 9140587 A JP9140587 A JP 9140587A JP H07113922 B2 JPH07113922 B2 JP H07113922B2
Authority
JP
Japan
Prior art keywords
sentence
same
analysis
sentences
syntactic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62091405A
Other languages
English (en)
Other versions
JPS63255773A (ja
Inventor
好昭 内田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62091405A priority Critical patent/JPH07113922B2/ja
Publication of JPS63255773A publication Critical patent/JPS63255773A/ja
Publication of JPH07113922B2 publication Critical patent/JPH07113922B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】 [概 要] 機械翻訳において、複数の文について形態素解析まで
(または構文解析まで)行っておき、同一文要素を抽出
して、それらに対する以後の処理を共通化するよう構成
したものであり、これにより処理を効率化し処理速度を
向上させたものである。
[産業上の利用分野] 本発明は機械翻訳に係わり、特に計算機を用いた機械翻
訳システムにおいて原文の同一部分を抽出しその部分の
処理を共通化する制御方式に関する。
[従来の技術] 従来の機械翻訳システムは、通常一つの文ずつ順次翻訳
するようになっている。
即ち、ある一つの文についての処理(解析・変形・生
成)が終了すると、次の文の処理を最初から行うもので
ある、 機械翻訳は、通常第9図に示すような処理の段階を経て
行われる。
入力文は、まず形態素解析が行われる。これは、単語辞
書を参照して入力文を形態素(単語)に分割し、形態素
間の連接関係を解析する。
次に、形態素解析の結果から、文の要素が互いにどのよ
うに結び付いて、どういう統語的役割を果し、どのよう
に文を構成するかを決定する構文解析が行われる。
次に構文解析の結果から、概念記号といくつかの補助記
号をノードとした意味構造を抽出する意味解析が行われ
る。
次に意味構造が出力言語に変換され、出力言語による構
文生成が行われる。
構文生成の結果から、形態素生成が行われ、出力文が生
成されて出力される。
意味解析は独立した処理段階とせず、構文解析に含めて
構文・意味解析とすることもある。また、構文・意味解
析の結果に対し、入出力言語のに依存しない中間表現を
用いた概念構造を生成して、これを出力言語に変換する
システムもある。
従来の機械翻訳においては、一つの文ずつ順次翻訳処理
が行われ、形態素解析の結果、既に翻訳の行われた前の
文に現れた文節と同一の文節が現れても、これに対する
構文解析は繰り返して行われるものであった。
[発明が解決しようとする問題点] 文章中には、対句による表現や、箇条書きされた部分の
ように、同じような構造の部分がある。
従来の機械翻訳システムで、複数の文にまたがる処理を
行わないため、このような同一部分に対しても同一の処
理が繰り返されていた。
本発明は、このような従来の機械翻訳システムにおける
同一処理の繰返しという点を解消し、処理速度の向上を
期した機械翻訳制御方式を提供しようとするものであ
る。
[問題点を解決するための手段] 第1図は本発明の機械翻訳制御方式の原理ブロック図を
示す。
図において、1は形態素解析手段であり、単語辞書を参
照して入力文を形態素(単語)に分割し、形態素間の連
接関係を解析する。
3は同一要素抽出手段であり、形態素解析手段1による
形態素解析の結果から同一の文要素を抽出し、同一要素
間関係データ4を作成する。
2は構文解析手段であり、形態素解析の結果から、文の
要素が互いにどのように結び付いて、どういう統語的役
割を果し、どのように文を構成するかを決定する。その
際、同一要素抽出手段3の作成した同一要素間関係デー
タ4を使用し、同一要素の前の解析結果を利用する。
[作用] 入力文を読み込み、一文ずつ形態素解析を行い、その結
果を保存する。
その際、接続詞や分ち書きされた部分など、文の切れ目
となる語に印を付けておき、切れ目から切れ目までを一
つの単位として、それが出現した文の番号、文中での位
置と共に記憶する。
ある数の文について処理が進んだ時点で、同一要素抽出
手段3により、先に記憶した各要素に同一のものがない
か調べる。
同一のものがあった場合には同一要素間関係データ4を
作成する。これには、例えば『後で同一の要素が現れ
る』、『前に同一の要素があった』という印を付ける。
具体的には、形態素解析の終了した部分全体について、
最後の要素からそれと同一の要素が前に現れていないか
を調べ、現れていれば、それに対し印1を、後に現れて
いる方に印2を付ける。のち、さらに前に同じ要素が現
れていれば、それに対し印1を、その次に現れた方(先
に印1を付けたもの)を印2に変える。印1が『後で同
一の要素が現れる』を意味し、印2が『前に同一の単位
があった』を意味する。
その後、先頭から構文解析を行う。その際、印1が付い
ている要素の処理結果は保存し、印2の付いている単位
は記憶されている処理結果を利用する。
簡単なポインタ操作により、処理結果の再利用に要する
手間は無視できる程度に減らすことができる。
このような処理方法によれば、同一の文単位(句、節)
に対する処理を一度の処理で行うことができるので、翻
訳に要する処理時間を減らすことができる。
上記の処理方式において、『形態素解析』を『構文解
析』としてもよい。さらに、形態素解析、構文解析の両
方の段階で上記の処理を行ってもよい。複数文の構文解
析の結果を用いて同一文要素のみならず同一構文の文要
素を抽出し、以後の処理を共通化することができる。例
えば、次の例文、 A.鳥は空を飛びます。
B.魚は海を泳ぎます。
C.魚は空を飛びません。
を構文解析の結果、 A.主語(bird)−自動詞(fly) −場所(sky) B.主語(fish)−自動詞(swim)−場所(sea) C.主語(bird)−自動詞(fly) −場所(sky) −否定(not) となり、AとBは構文的には同一であり、AとCは自動
詞を否定しているか否かが異なるだけであるので、以後
の意味解析等の処理を共通化することができる。
[実施例] 以下第2図〜第8図に示す実施例により、本発明をさら
に具体的に説明する。
第2図は、本発明の一実施例による処理を説明するため
の入力例文である。
第3図は、第2図の入力例文の形態素解析による分割結
果を示す。
第4図は、第3図に示した形態素解析の結果から文節の
まとまり(自立語+附属語)にまとめた結果を示す。
第4図において分割されている単位が、本実施例による
処理単位となる。
第5図は同一文節間の関係を示す制御ブロックの構成を
示す図であって、第4図の形態素分析結果に対する処理
を示している。
第4図の文(2)の最初の方から以前に出現している文
節を捜すと、『空を・飛びません』というまとまりが、
文(1)に使用されているから、これに対する制御ブロ
ックを作成する。
制御ブロックの意味は次のとおりである。
PTR1:先に使用されている場所に対応する制御ブロック
へのポインタ、または0(先に使用されていない、即ち
これが最初であることを示す)。
PTR2:次に使用されている場所に対応する制御ブロック
へのポインタ、または0(次に使用されていない、即ち
これが最後であることを示す)。
PTR3:注目しているまとまりを示すポインタ。
文(1)の『空を・飛びません』に対応する制御ブロッ
クでは、PTR1が0であり、PTR2は・であって、文(2)
の『空を・飛びません』に対応する制御ブロックでは、
PTR1が・であり、PTR2は0である。
同様に、文(4)と文(3)に共通に使用されている
『海の・上を・飛ぶ』についても、制御ブロックが作成
される。
第6図は、本実施例における同一部分を抽出する処理を
示すフローチャートである。
以上のようにして、第5図に示したような制御ブロック
の鎖ができあがる。
次に、構文解析処理が行われる。
第7図は、本実施例における同一部分の解析処理状況を
示す図である。即ち、文(1)の解析を終り、文(2)
の解析を始めた時点の状況を示している。
文(1)の解析において、『空を飛びません』の解析結
果は図中に矩形枠で囲んで示すように、FLYという動詞
節であり、LOC(場所)はSKY(空)であり、NOT(否
定)であることを示している。
文(1)の解析が終了すると、『飛びません』に対する
制御ブロックのポインタPTR3は、『飛びません』の解析
結果を指すように更新する。
文(2)の解析においては、文(2)の『飛びません』
に対する制御ブロックが作られているから、そのポイン
タPTR1の指す制御ブロックを参照して、文(1)の『飛
びません』の解析結果を得る。得られた解析結果を文
(2)の解析結果として利用する。
文(2)の『飛びません』に対する制御ブロックのポイ
ンタPTR3の、文(1)のものと同じく『飛びません』の
解析結果を指すようにしてもよいし、そのままにしてお
いてもよい。後者の場合は、さらに後の文で同一部分
(『飛びません』)が現れていた場合は、制御ブロック
の鎖を先頭まで戻り、文(1)の解析結果を利用するこ
とになる。
第8図は、本実施例における解析結果の保存、利用の処
理を示すフローチャートである。
[発明の効果] 以上説明したように本発明によれば、計算機を用いて行
う機械翻訳システムにおいて、同一要素の解析を重複し
て行う必要がなくなり、処理が効率化され、処理速度の
向上に及ぼす効果は大である。
【図面の簡単な説明】
第1図は本発明の原理ブロック図、 第2図は入力例文を示す図、 第3図は形態素解析の結果を示す図、 第4図は形態素解析の結果を文節にまとめたものを示す
図、 第5図は本発明の一実施例による制御ブロックを示す
図、 第6図は同一部分抽出処理を示すフローチャート、 第7図は同一部分の解析処理状況を示す図、 第8図は解析結果の保存、利用の処理を示すフローチャ
ート、 第9図は機械翻訳の処理の段階を示す図である。 図面において、 1は形態素解析手段、 2は構文解析手段、 3は同一要素抽出手段、 4は同一要素間関係データ、 をそれぞれ示す。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】単語辞書を参照して入力文を形態素に分割
    し、形態素間の連接関係を解析する形態素解析手段
    (1)と、形態素解析の結果から文の要素間の統語関係
    を解析する構文解析手段(2)を備えた機械翻訳装置に
    おいて、 形態素解析手段(1)による複数の文の解析結果から、
    同一の文要素を抽出し、複数の文における該同一文要素
    に対し最初に現れたものであるか後で現れたものかを示
    す情報および参照すべきデータへのポインタの情報を記
    述した同一要素間関係データ(4)を作成する同一要素
    抽出手段(3)を備え、 複数の文に対する形態素解析を行った後、前記構文解析
    の際前記同一要素間関係データ(4)において最初に現
    れたものと記号付けされた文要素の解析結果を保存し、
    前記後で現れたものと記号付けされた文要素は該保存さ
    れた解析結果を利用することにより、同一文要素に対す
    る構文解析処理を共通化して行うよう構成したことを特
    徴とする機械翻訳装置。
  2. 【請求項2】上記同一要素抽出手段(3)が、上記構文
    解析手段(2)による複数の文の構文解析結果から、同
    一文要素および/または同一構文の文要素を抽出するも
    のであり、 複数の文に対する構文解析を行った後、同一文要素およ
    び/または同一構文文要素に対する以後の処理を共通化
    して行うよう構成したことを特徴とする特許請求の範囲
    第1項記載の機械翻訳装置。
JP62091405A 1987-04-14 1987-04-14 機械翻訳装置 Expired - Fee Related JPH07113922B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62091405A JPH07113922B2 (ja) 1987-04-14 1987-04-14 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62091405A JPH07113922B2 (ja) 1987-04-14 1987-04-14 機械翻訳装置

Publications (2)

Publication Number Publication Date
JPS63255773A JPS63255773A (ja) 1988-10-24
JPH07113922B2 true JPH07113922B2 (ja) 1995-12-06

Family

ID=14025470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62091405A Expired - Fee Related JPH07113922B2 (ja) 1987-04-14 1987-04-14 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH07113922B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11886052B2 (en) 2016-09-29 2024-01-30 Nlight, Inc Adjustable beam characteristics

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62139076A (ja) * 1985-12-13 1987-06-22 Agency Of Ind Science & Technol 言語解析方式
JPS6330968A (ja) * 1986-07-24 1988-02-09 Nec Corp 言語解析方式
JPS6395570A (ja) * 1986-10-09 1988-04-26 Nec Corp 言語解析方式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11886052B2 (en) 2016-09-29 2024-01-30 Nlight, Inc Adjustable beam characteristics

Also Published As

Publication number Publication date
JPS63255773A (ja) 1988-10-24

Similar Documents

Publication Publication Date Title
US6470306B1 (en) Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
JPH0724055B2 (ja) 単語分割処理方法
JPH02308370A (ja) 機械翻訳システム
JPH0351020B2 (ja)
EP0403057B1 (en) Method of translating sentence including adverb phrase by using translating apparatus
JPS58192173A (ja) 機械翻訳装置
JPH07113922B2 (ja) 機械翻訳装置
JP2536633B2 (ja) 複合語抽出装置
WO1997048058A9 (en) Automated translation of annotated text
WO1997048058A1 (en) Automated translation of annotated text
KR100198959B1 (ko) 토큰 분리기를 이용한 원시언어 번역방법
JP2632806B2 (ja) 言語解析装置
JPH0415504B2 (ja)
JPS62184572A (ja) 単語分割装置における呼応複合語の辞書検索方式
JPS63221475A (ja) 構文解析方法
JPH0816910B2 (ja) 言語解析装置
JPS6389976A (ja) 言語解析装置
JP2687334B2 (ja) 機械翻訳装置
JPS63138465A (ja) 構文解析装置
KR19990001034A (ko) 문맥 정보 및 지역적 문서 형태를 이용한 문장 추출 방법
JPH0320866A (ja) テキストベース検索方式
JP2695772B2 (ja) 仮名漢字変換装置
JP2856736B2 (ja) 辞書参照装置及び辞書参照方法
JPH01213750A (ja) 機械翻訳用の構文解析におけるサルベージ方法
JPH0636167B2 (ja) 意味・文脈処理システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees