JPH09293075A - 機械翻訳装置及び翻訳処理方法 - Google Patents

機械翻訳装置及び翻訳処理方法

Info

Publication number
JPH09293075A
JPH09293075A JP8100059A JP10005996A JPH09293075A JP H09293075 A JPH09293075 A JP H09293075A JP 8100059 A JP8100059 A JP 8100059A JP 10005996 A JP10005996 A JP 10005996A JP H09293075 A JPH09293075 A JP H09293075A
Authority
JP
Japan
Prior art keywords
pattern
data
hierarchical
hierarchy
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8100059A
Other languages
English (en)
Other versions
JP3437710B2 (ja
Inventor
Akira Sagaraki
昌 佐良木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LES-MU PUROPATEIZU BV
REEM PROPERTIES BV
ROEHM PROPERTIES BV
Original Assignee
LES-MU PUROPATEIZU BV
REEM PROPERTIES BV
ROEHM PROPERTIES BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LES-MU PUROPATEIZU BV, REEM PROPERTIES BV, ROEHM PROPERTIES BV filed Critical LES-MU PUROPATEIZU BV
Priority to JP10005996A priority Critical patent/JP3437710B2/ja
Publication of JPH09293075A publication Critical patent/JPH09293075A/ja
Priority to JP2001103210A priority patent/JP2001306561A/ja
Application granted granted Critical
Publication of JP3437710B2 publication Critical patent/JP3437710B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【課題】 英文特許明細書のクレームにあらわれる複雑
な構文を原文のまま画面表示することにより、修飾関係
を明かにするとともに、日本語の語順で翻訳する機械翻
訳装置と翻訳処理方法を提供する 【解決手段】 英文クレームを移行句を基準に分割し、
パターン照合することで英文クレームの整形を行う。そ
して、整形されたクレームを解析することにより修飾句
を分離し、階層構造を作る。これらの処理により複雑な
英文クレームの修飾関係を画面表示することができる。
この後にS410でデータ構造の逆転を行い、S420〜S440で
翻訳文が出力される。S410のデータ構造の逆転処理によ
って日本語の語順で翻訳することが可能となる。

Description

【発明の詳細な説明】
【0001】
【発明の属する分野】本発明は入力された特許明細書の
クレーム文を目標言語に翻訳して出力する機械翻訳装置
と翻訳処理方法に関する。
【0002】
【従来の技術】従来より機械翻訳システムでは、周知の
ように、解析部において、翻訳対象である原文テクスト
について一文単位での解析処理を行う。たとえば、形態
素解析(Morephore Analysis)→統語解析(構文解析と
もいう、Syntax Analysis, Parsing)→意味解析(Mean
ing Analysis)という解析処理系が知られている。まず
形態素解析によって、単語の切り出しを行い、続いて統
語解析を行う。統語解析は、切り出された単語の並びが
どのような規則的配列になっているかを解析する処理で
ある。統語解析処理の一例として、トップダウン縦型探
索法を採用した統語解析がある。この統語解析処理で
は、文脈自由文法(Context Free Grammar,CFG)などに
則って、根→節→葉へと分岐していく解析過程を、解析
最少単位である終端に達するまで繰り返すことで、統語
構造を解析木(Parsing Tree)として分析する。意味解
析処理では、たとえば、システム辞書に記述された名詞
意味属性を参照・照合することで、主部の意味属性を決
定する共に、検出された述部が形成可能な文型について
の情報を参照・照合することで、文型と意味とを決定す
る。
【0003】ところが、英文解析の場合、節同士の接続
強度にかかわる情報の抽出や、先行副詞と対になってい
る相関従位接続詞(Correlative Subordinate Conjunct
ion)に関る情報は解析・抽出することができなかっ
た。英文特許明細書のクレームでは、長文、複雑な構文
がきわめて多く、このような機械翻訳システムでは、統
語解析がまったくできないといった深刻な問題があっ
た。
【0004】そこで、関連性情報のモデルを原文テクス
トの傾向から発見的方法で構築し、これをもとにして統
語解析を行う機械翻訳装置と翻訳方法を提案した(特願
平7−157686)。この方法で上記関連性情報モデ
ルで原文テクストの統語情報を解析し、原文テクストを
編集することによって、以前の形態素解析において、節
同士の接続強度にかかわる情報の抽出や、先行副詞と対
になっている相関従位接続詞にかかわる情報の解析・抽
出ができるようになる。
【0005】
【発明が解決しようとする課題】ところが、上記方法は
訳出された日本語に、もとの原文テクストにあった統語
情報を欠落させないことを目的としており、特に英文特
許明細書の複雑な構文は訳出されたときに修飾句などの
関係が複雑な日本語となる。
【0006】本発明は、特に英文特許明細書のクレーム
にあらわれる複雑な構文を原文のまま画面表示すること
により、修飾関係を明かにするとともに、日本語の語順
で翻訳する機械翻訳装置と翻訳処理方法を提供すること
を目的とする。
【0007】
【課題を解決するための手段】かかる目的を達成するた
めになされた本発明は、入力された原文テクストを目標
言語に変換して翻訳文を出力する機械翻訳装置におい
て、原文特許明細書におけるクレームのパターンを格納
するパターン格納手段と、上記パターン格納手段に格納
されたパターンと入力された原文クレームを照合するパ
ターン照合手段と、上記パターン照合手段で照合された
パターンに合わせて、上記原文クレームを整形し、該原
文クレームの修飾構造から階層化処理して、階層データ
をつくる階層化手段と、上記階層データから原文クレー
ムの修飾関係を示すデータを作成して出力する階層デー
タ出力手段と、上記階層データを逆転して新たな逆転階
層データをつくる階層データ逆転手段と、上記逆転階層
データを各階層ごとに翻訳して、該翻訳した文を結合す
る翻訳結合手段とを備えた機械翻訳装置を要旨としてい
る。
【0008】また、本発明は、上記階層化手段が、上記
パターン照合手段によって照合されたパターンに合わせ
て整形されたクレームの修飾句を分離して階層化してい
くものであって、該分離した修飾句の内部に新たな修飾
句があった場合には再帰的に分離、階層化を繰り返し、
分離した修飾句の内部に修飾句がなくなるまで、階層を
深化していくことを特徴とする上記機械翻訳装置を要旨
としている。
【0009】さらにまた本発明は、原文特許明細書のク
レームのパターンを格納しておき、そのパターンと入力
された原文クレームを照合して、そのパターンと、原文
クレームの修飾関係から、原文クレームの階層化をし階
層データをつくり、さらに該階層データを逆転し、逆転
階層データをつくることで、該逆転階層データに基づい
て目標言語の語順で翻訳文を出力することを特徴とする
翻訳処理方法を要旨としている。
【0010】
【発明の実施の形態】以下に本発明の一実施例を図面と
共に説明する。まず、図1は本発明が適用された実施例
の機械翻訳システムを表すブロック図である。機械翻訳
システムは、情報処理装置10と、ハードディスク装置
(以下、HD装置という)13と、CD−ROM読み取
り装置(以下、CD装置という)15と、プリンタ17
と、光ディスク装置19と、CRT表示装置21と、入
力装置23と、フレキシブルディスク装置(以下、FD
装置という)25などを備えている。
【0011】情報処理装置10は、論理演算回路として
構成された中央演算部31と、外部インターフェイス3
3と、内部インターフェイス35と、メモリ装置39
と、通信インターフェイス37とを主要部として構成さ
れている。外部インターフェイス33には、HD装置1
3と、CD装置15と、プリンタ17と、光ディスク装
置19が着脱可能に接続されている。内部インターフェ
イス35には、CRT表示装置21と、入力装置23
と、フレキシブルディスク装置25が接続されている。
【0012】CD装置15には、米国特許商標庁発行の
特許公報CD−ROM(不図示)がセットされている。
CD−ROMには、検索用のキーワードを格納するキー
インデックス・ファイル、特許明細書などの技術情報を
収録するテクスト・ファイルなども格納されている。
【0013】プリンタ17は、上記CD−ROM内のデ
ータファイルを始め、本機械翻訳システムが解析したC
D−ROM内の英文特許明細書の階層構造や、訳出され
た翻訳文を出力する。光ディスク装置19は、本機械翻
訳システムによって解析されたCD−ROM内の英文特
許明細書の階層構造や、訳出された翻訳文を記録した
り、読み込んだりする。
【0014】CRT表示装置21は、上記CD−ROM
内のデータファイルを始め、本機械翻訳システムが解析
したCD−ROM内の英文特許明細書の階層構造や、訳
出された翻訳文を表示する。入力装置23は、キーボー
ド(不図示)と、マウス(不図示)から構成されてい
て、CD−ROMからの検索や、訳出文の指示や、訳出
文の編集など利用者の指示を情報処理装置10に伝え
る。
【0015】フレキシブル・ディスク装置25は、利用
者毎のシステム設定など簡単で、小容量のデータを読み
書きする。中央演算装置31はCPUと、ROMと、R
AMとからなっている。ROMには、英文特許明細書の
解析と翻訳のためのプログラムが記憶されている。RA
Mはプログラム実行のための作業領域として用意されて
いる。
【0016】メモリ装置39はCD装置より読み込まれ
た英文特許明細書のテクスト・ファイルを解析にあたっ
て記憶する。通信インターフェイス37は、外部装置
(不図示)との間でデータ送受信を行う。通信インター
フェイス37は、復変調機(不図示)を内蔵していて、
一般回線に接続可能である。通信インターフェイス37
は、原文の特許明細書を通信回線を介して先方より受信
したり、また訳出した特許明細書を通信回線を介して、
先方に送信したりする。
【0017】図2にHD装置13の内部構成を示す。H
D装置13は、英和辞書41と、専門用語辞書43と、
移行句辞書45と、英文特許明細書クレームパターン4
7と、階層構造記憶領域49と、翻訳文記憶領域51を
備えている。英和辞書41、専門用語辞書43は、翻訳
文を生成する時に、情報処理装置31によってアクセス
される。移行句辞書45は、英文特許明細書のクレーム
を解析にあたって分割する際に使用する。また移行句辞
書は利用者が書換え可能である。英文特許明細書クレー
ムパターン47は、英文特許明細書に現れるクレームの
パターンが登録されている。このパターンは追加登録可
能である。階層構造記憶領域49には、英文特許明細書
のクレームを解析して得られた階層構造の情報が一旦メ
モリ装置39に出力された後、記憶される。記憶された
階層構造情報は、プリンタ17や、CRT表示装置21
や、光ディスク装置19に出力することができる。翻訳
文記憶領域51には、英文特許明細書のクレームから得
られた階層構造に基づいて、翻訳されたクレームが一旦
メモリ装置39に記憶された後、この領域に記憶され
る。記憶された翻訳文は、プリンタ17や、CRT表示
装置21や、光ディスク装置19に出力することができ
る。
【0018】ここで解析から翻訳に至る処理を説明す
る。入力装置23より、利用者から翻訳の指示がある
と、中央演算装置31はプログラムに基づいて、CD装
置15よりCD−ROM内の英文特許明細書を読みだ
し、CD−ROM内の制御コードに従って、クレーム部
分を抽出する。抽出したクレームはメモリ装置39に記
憶される。
【0019】次にクレームの分割処理を行う。この処理
を図3を用いて説明する。まず上記読みだした英文クレ
ームを、メモリ装置39より入力する(S100)。次
に移行句のテーブルをHD装置13内の移行句辞書45
より入力する(S110)。
【0020】ここで移行句の典型例を示す。 comprising: comprising in combination(:) the improvement comprising(:) comprising the step of(:) which comprises the step of(:) なお、コロンを伴わない「comprising」一語だけでも移
行句で有り得るが、クレーム文中には「comprising」が
複数回使われる場合もあり、当該「comprising」が移行
句とは限らないからである。「comprising」に代えて、
「which comprise(s)」「which comprised」も可とす
る。また、移行句はテーブルに追加登録可能である。
【0021】移行句のテーブルが入力されると、先に入
力された英文クレーム中に移行句が存在するかを検索す
る(S120)。検索結果より移行句が存在を判断する
(S130)。移行句が存在しなかった場合は、「クレ
ームの中に移行句が存在しませんでした。」等のメッセ
ージをCRT表示装置より出力して、処理を終了する。
移行句を発見した場合は、分割処理を行う(S14
0)。分割処理は当該クレーム文を文頭から移行句の直
前まで、即ちプリアンブル(preamble)、移行句(tran
sitional phrase)、移行句の直後から文末まで、即ち
本文(body of the claim)の3つに分割する。つま
り、当該クレームを、3つの主要部に分割する。要する
に、米国特許審査便覧6801.01の(e)項に規定
されたクレーム形式であるとみなす。最後に分割したク
レームをメモリ装置39に出力する。
【0022】次にパターン照合処理を図4に沿って説明
する。まず上記で分割したクレームをメモリ装置39よ
り入力する(S200)。次に、英文特許明細書のクレ
ームパターンをHD装置13内の英文クレーム辞書領域
より入力する(S210)。ここで英文クレームのパタ
ーンについて説明する。なお、シリーズ形式の語句の配
列については、英語の一般規則であるN1N2N3N4Nn-
1Nnとする。
【0023】 <第1形式> X comprising, in combination, N1, N2, Nm-1 and Nm <第2形式> X comprising, N1, N2, Nm-1, Nm <第3形式> In combination,N1,N2,・・・,Nm-1 and Nm. <第4形式> For use with Y ・・・,X comprising N1,N2,・・・,Nm -1 and Nm. <第5形式> A including a1,a2,a3 and a4. <第6形式> X comprising N1,N2,・・・,Nm-2 and Nm-1,the improvement comprising Nm. <第7形式> In X,in combination,N1,N2,・・・,Nm-1,Nm. <第8形式> In X,N1,N2,・・・,Nm-1 and Nm. <第9形式> The combination with A and B,of C and D. <第10形式> In the X,the combination with A and B,of C and D. <第11形式> A method of ・・・ which comprises (V1)ing ・・・ ,(Vn-1)ing ・・・ and (Vn)ing ・・・. <第12形式> A method of ・・・ which the step of (V1)ing ・・・ ,(Vn-1)ing ・・・ and (Vn)ing ・・・. <第13形式> In a process of ・・・,the improvement comprising (V1)ing ・・・,(Vn-1)ing ・・・ and (Vn)ing ・・・. <第14形式> X ・・・,said X comprising N1,N2,・・・,Nm-1, Nm. <第15形式> A process for ・・・ of the formula: −− wherein R1 ・・・ <第16形式> A product ・・・ of the general formula: −− wherein R1 ・・・ <第17形式> X ・・・ having a factor which is determined by the formula: −− wherein m ・・・ <第18形式> In X comprising A,B,C and D said D inc luding d1 and d2. <第19形式> X comprising A,B and C characterized by D . <第20形式> X comprising A,B,C and D whereby ・・・. 上記した英文クレームのパターンと分割したクレームを
照合する(S220)。この処理内容は、各パターンと
比較し最も近似しているパターンを選定することによっ
て当該クレームを特定のパターンとして認識するもので
ある。例えば、クレーム文を単語単位および句単位にサ
ーチして、パターンに含まれているキーワード・キーフ
レーズの配列とを照合する。なお、キーワード・キーフ
レーズには、同義語や語尾の活用形も含まれ、英文クレ
ームのキーワード、キーフレーズの変形例として登録さ
れている。照合して位置の近似度(一致する語句の数/
全語数×語順)が所定のレベル以上か否かを判断する
(S230)。所定レベル以上でない場合は、CRT表
示装置21に「パターンに合致しませんでした。」等の
メッセージを表示して(S270)、処理を終了する。
所定レベル以上であった場合は、クレームをパターンに
合わせて整形する(S240)。次に整形したクレーム
をメモリ装置39に出力する(S250)。最後に合致
したパターン形式をメモリ装置39に出力して(S26
0)、処理を終了する。
【0024】図5に上記の整形されたクレーム文の階層
化の処理を示す。まず、整形したクレームをメモリ装置
39より入力する(S300)。次に、メモリ装置39
より、パターン形式を入力する(S310)。次に、マ
ーキング処理を実行する(S320)。この処理は、プ
リアンブルと、本文とのそれぞれについて行われる。名
詞の直後に配置されている現在分詞句(having, includ
ing, containing, consisting)、過去分詞句、名詞 f
or (副詞)Vingの形の名詞句および形容詞句(availa
ble, enough, suitable, adjacent)などの修飾句に対
して行われる。以下、修飾される名詞を先行名詞、修飾
する句を後置修飾句と呼ぶ。また先行名詞についてもマ
ーキング処理をする。なお、関係節(関係代名詞節、関
係副詞節)についても同様の処理を行う。次に修飾句の
分離を行う(S330)。この処理は当該現在分詞、過
去分詞、形容詞の直前で文を分割して、当該現在分詞
句、過去分詞句、形容詞句を分離する。さらに、これら
の修飾句を分離した後の文を各部分の基本骨格として整
序する。次に階層化を行う(S340)。この処理は、
分離された句は係り先である先行の名詞の下層をなすデ
ータ項目として階層化する。基本骨格をなすデータ項目
は、基層(BASE)に属するものとし、上記の分離さ
れた句データ項目を第一階層(CLASS1)に属する
ものとして階層構造をなすデータ構造を構築する。次に
第一階層の句データ項目の中に先行名詞・後置修飾句が
あるかを判断する(S350)。先行名詞、後置修飾句
があるときはステップ340にもどり、当該後置修飾句
を第2階層の句データ項目に属するものとしてデータ構
造をさらに深化する形態に構築する。この処理は再帰的
に行われ、文構造が重層構造をなしているときには、階
層化することにより縦系列のデータユニットの帰属関係
(修飾、被修飾の関係)を階層化するとともに、文構造
の基本骨格を抽出することができる。縦系列のデータユ
ニットの帰属関係は、上位と下位の上下関係と共に被修
飾(上位)と修飾(下位)との関係も表現することがで
きる。階層構造は、一般に親子関係として表現され、上
位(親)は複数の下位(子)をもつことができるが、下
位(子)はただ一つの直属の上位(親)しかもつことが
できない。また、下位自身も上位と同じデータ構造をも
つことができる。即ち、下位は、自身に直属する下位
(最上位の親から見れば孫)を複数もつことができる。
つまり、階層構造を持つデータベースを構築すること
で、クレーム文における修飾被修飾の上下関係を正確に
表すことができる。次に、階層化されたデータ構造に基
づいて階層分類を行うことで、クレーム文の基本構造を
抽出する(S360)。最後に階層化された階層構造の
各クラスデータをメモリ装置39に出力して(S37
0)、処理を終了する。
【0025】図6に、翻訳処理についてのフローチャー
トを示す。上記、階層化された階層構造の各クラスデー
タをメモリ装置39より入力する(S400)。次にデ
ータ構造を逆転する(S410)。次に各クラスデータ
単位で翻訳処理を実行する(S420)。データ構造の
逆転に伴って、翻訳処理においては「said」なる英語の
訳語は「前記」ではなく「後記」となる。各クラス単位
に訳出した翻訳文を結合する(S430)。先行詞の前
に修飾語があるときには、修飾語を含む先行しに係るよ
うに訳出するが、データの逆転構造に従って結合すれば
よい。同じクラスに複数のデータがあるときには、原文
の順序で訳出しシリーズ形式に配列する。次に、翻訳文
をメモリ装置39に出力する(S440)。さらに、図
5ステップ370でメモリ上に出力した階層分類された
データをHD装置13の階層構造記憶領域49に出力す
る(S450)。HD装置に保存された階層構造データ
は、階層構造表示処理に使われる。最後に、メモリ装置
39に出力された翻訳文を、HD装置13の翻訳文の記
憶領域に出力して(S460)、処理を終了する。
【0026】次に具体的な例文を用いて、処理の説明を
行う。 In apparatus for recording data in tracks on magne
tic storage disks including a tunnel erase magneti
c head recording assembly movable along said track
s and comprising a magnetic read/write transducer
for magnetically recording data along said tracks
and at least one magnetic erase transduser adjacen
t to said write transducer for limiting the width
of recorded data, means for safeguarding data reco
rded on said disks comprising:means operative duri
ng quiescent conditions when said apparatus is not
writing nor reading and during operating conditio
ns when said apparatus is reading or writing for s
ensing the activation of said erase transducer, an
d means responsive to said sensed activation for d
eter mining if said activation is erroneus. 上記のクレーム文が入力されると(S100)、HD装
置から読み込んだ移行句のテーブルを参照して、移行句
を検索し(S120)、クレームを3つに分割する(S
140)。以下で示す3つの部分に分かれる。
【0027】In apparatus for recording data in t
racks on magnetic storage disks including a tunnel
erase magnetic head recording assembly movable al
ong saidtracks and comprising a magnetic read/writ
e transducer for magneticallyrecording data along
said tracks and at least one magnetic erase transd
user adjacent to said write transducer for limitin
g the width of recorded data, means for safeguardi
ng data recorded on said disks comprising: means operative during quiescent conditions when
said apparatus is not writing nor reading and dur
ing operating conditions when said apparatus is re
ading or writing for sensing the activation of sai
d erase transducer, and means responsive to said s
ensed activation for deter mining if said activati
on is erroneus. 次に、HD装置13から読みだしたパターンとの照合を
行い(S210、S220)、パターンに合わせて整形
する(S240)。本実施例のクレームは第2形式であ
ることがわかる。
【0028】In apparatus for recording data in t
racks on magnetic storage disks including a tunnel
erase magnetic head recording assembly movable al
ong saidtracks and comprising a magnetic read/writ
e transducer for magneticallyrecording data along
said tracks and at least one magnetic erase transd
user adjacent to said write transducer for limitin
g the width of recorded data, means for safeguardi
ng data recorded on said disks comprising: means operative during quiescent conditions when
said apparatus is not writing nor reading and dur
ing operating conditions when said apparatus is re
ading or writing for sensing the activation of sai
d erase transducer,andmeans responsive to said sen
sed activation for deter mining if said activation
is erroneus. 次に、先行名詞、修飾句にマーキング処理を行う(S3
20)。例えばプリアンブルでは、以下になる。 In {apparatus} for recording data in tracks on m
agnetic storage {disks} including a tunnel erase
magnetic head recording {assembly} movable alon
g said tracks and comprising a magnetic read/write
{transducer}for magnetically recording data alo
ng said tracks and at least one magnetic erase {t
ransduser} adjacent to said write {transducer}
for limiting the width of recorded data, {means}
for safeguarding data recordedon said disks 次に、修飾句の分離を行う(S330)。分離した後の
文を各部分の基本骨格として整序する。例えば、プリア
ンブルの場合、分離後の文は以下のように簡素化され
る。コンマがあるので、その箇所で2要素に分離でき
る。 {In apparatus}{,} {means} 次に、分離された句の階層化を行う(S340)。階層
化された句データ項目の中に先行名詞、後置修飾句があ
るときには、当該後置修飾句を次の階層の句データ項目
に属するものとしてデータ構造をさらに深化する形態に
構築する(S350)。プリアンブルの場合以下のよう
に階層化される。
【0029】BASE(基層) (1)In apparatus (2)means CLASS1 (1)−I(先行名詞=apparatus) {for recording data in tracks on magnetic
storage disks} (2)−I(先行詞=means) {for safeguarding data} CLASS2 (1)−I−A (先行名詞=magnetic storage dis
ks) {including a tunnel erase magnetic head rec
ording assembly and comprising a magnetic re
ad/write transducer and at least onemagnetic
erase transducer} (2)−I−A (先行詞=data) {recorded on said disks} CLASS3 (1)−I−A−a (先行名詞=assembly) {movable along said tracks} (1)−I−A−b (先行名詞=a magnetic read/
write transducer) {for magnetically recording data along said
tracks} (1)−I−A−c (先行名詞=at least one ma
gnetic erase transducer) {adjacent to said write transducer} CLASS4 (1)−I−A−c−α (先行名詞=said write t
ransducer) {for limiting the width of recorded data} この階層構造に基づいて階層分類を行う(S360)。
図7aに階層分類を表す。 さらに、階層構造の逆転を
行う(S410)。図7bに逆転した階層分類を表す。
【0030】次に各クラスのデータ単位で翻訳処理を実
行する(S420)。例えば、プリアンブルの翻訳は以
下のようになる。 a:<後記トラックに沿って移動可能な> b:<後記トラックに沿ってデータを磁気的に記録する
ための> c:<{後記書き込み変換器}に隣接する> α:<記録されたデータの長さを制限するための> A:<トンネル消去磁気ヘッド記録のアセンブリを一部
分としてもち、磁気的なリード/ライト変換器と少なく
とも一つの磁気的な消去用変換器とを備える> I:<磁気記憶ディスク上のトラックにデータを記録す
るための> (1):<装置において> 最後に翻訳文を結合する。
【0031】{{{a+b+c}+A}+I}+(1)
は以下となる。 <後記トラックに沿って移動可能な>、<後記トラック
に沿ってデータを磁気的に記録するための>、<記録さ
れたデータの長さを制限するための><{後記書き込み
変換器}に隣接する><トンネル消去磁気ヘッド記録の
{アセンブリ}を一部分としてもち、磁気的なリード/
ライト変換器と少なくとも一つの磁気的な消去用変換器
とを備える>、<{磁気記憶ディスク}上のトラックに
データを記録するための>、<装置において> 更に、先行詞との関連付けを行うと共に、次の訳出結果
が出力される。 「後記トラックに沿って移動可能な、後記トラックに沿
ってデータを磁気的に記録するための、記録されたデー
タの長さを制限するための[後記書き込み変換器]に隣
接する、トンネル消去磁気ヘッド記録の[アセンブリ]
を一部分としてもち磁気的なリード/ライト変換器と少
なくとも一つの磁気的な消去用変換器とを備える[磁気
記憶ディスク]上のトラックにデータを記録するための
[装置において]」 次に(2)系列の訳出を示す。まず、各クラス毎に翻訳
すれば、 A:前記ディスク上に記された I:データを保護するための (1):手段 となり、ここで、「said」は、disksが訳出済みなので
「前記」と訳出する。
【0032】次に、クラス単位の翻訳文を結合する。つ
まり、{{A}+I}+(1)とすると、 <前記ディスク上に記された><[データ]を保護する
ための><[手段]> となり、次の訳出結果を出力する。 「前記ディスク上に記された[データ]を保護するため
の[手段]」 ここまでがプリアンブルの訳出処理である。
【0033】次に本文の翻訳を行う。本文は次に示す構
成となっている。即ち、 {means} and {means}{if said activation is erroneous} 上記は二つの手段が並列に記述されている形である。
【0034】これを、BASEから階層化すれば、 BASE (1):means CLASS1 I:{operative during quiescent conditions} {and} CLASS2 I−A:when said apparatus is not writing n
or reading CLASS1 II:{(operative)during operating condition
s}, CLASS2 II−A:when said apparatus is reading or
writing CLASS3 II−A−a:for sensing the activation of s
aid erase transducer,と階層化され、各クラス毎に
訳出すれば I−A:<前記装置が書き込み中でもなく読み出し中で
もないという> I:<非動作の場合に、作動する> II−A−a:<前記消去変換器の作動を検出するため
に> II−A:<前記装置が書き込み中又は読み出し中であ
るという> II:<動作の場合に、作動する> 訳出された各文を結合すれば、 <前記装置が書き込み中でもなく読み出し中でもないと
いう><[非動作の場合に]、作動する><及び><前
記消去変換器の作動を検出するために><前記装置が書
き込み中又は読み出し中であるという><[動作の場合
に]、作動する><手段> 同様に本文後半も階層化すれば、 BASE (2):{means} CLASS1 I:{responsive to said sensed [activatio
n]}{if said activation is erroneous} CLASS2 A:{for determining} と階層化され、クラス単位で訳出すれば、 A:<決定するための> I:<前記検出された動作に反応する>/<前記動作が
エラーならば>/ (2):手段 これらを、結合すると、 <決定するための><前記検出された[動作]に反応す
る>/<前記動作がエラーならば>/<手段> と訳出することができる。以上が実際の例文を用いた処
理の流れである。
【0035】また、本発明の機械翻訳装置はステップ4
50でHD装置13へ出力した階層分類のデータから、
英文特許明細書のクレームの階層構造を画面上でもしく
はプリンタ出力して確認することができる。図8に本実
施例のプリアンブル階層構造の出力例を示す。これによ
り訳出のみならず、英文特許明細書の複雑な構文から、
各修飾句の修飾関係を簡単に把握できる。
【0036】
【発明の効果】上記したように本発明では、クレームに
現れるパターンを格納しておいて、原文クレームと照合
することにより、パターンに合わせた原文整序を行い、
階層化してデータを分類し、さらにそのデータ構造の逆
転をすることによって、目標言語の語順で訳出できると
いう極めて大きな効果を奏する。さらに階層化したデー
タから修飾関係を画面上、またはプリンタに出力できる
ため、原文クレームの修飾関係を瞬時に把握できるとい
う効果を奏する。
【図面の簡単な説明】
【図1】機械翻訳装置の電気ブロック図である。
【図2】ハードディスク装置13の内容を示す図であ
る。
【図3】クレーム分割処理のフローチャートである。
【図4】パターン照合処理のフローチャートである。
【図5】階層化処理のフローチャートである。
【図6】翻訳処理のフローチャートである。
【図7】図7a:階層分類されたデータの図である。 図7b:階層分類データを逆転したデータの図である。
【図8】本実施例のプリアンブルの階層構造の出力例の
図である。
【符号の説明】
10・・・制御装置 13・・・ハードディスク装置 15・・・CD−ROM装置 17・・・プリンター 19・・・光ディスク装置 21・・・CRT表示装置 23・・・入力装置 25・・・フレキシブルディスク装置 39・・・メモリ装置 31・・・中央処理装置 45・・・移行句辞書領域 47・・・英文特許明細書クレームパターン記憶領域 49・・・階層構造記憶領域 51・・・翻訳文記憶領域

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】入力された原文テクストを目標言語に変換
    して翻訳文を出力する機械翻訳装置において、 原文特許明細書におけるクレームのパターンを格納する
    パターン格納手段と、 上記パターン格納手段に格納されたパターンと入力され
    た原文クレームとを照合するパターン照合手段と、 上記パターン照合手段で照合されたパターンに合わせ
    て、上記原文クレームを整形し、該原文クレームの修飾
    構造から階層化処理して、階層データをつくる階層化手
    段と、 上記階層データから原文クレームの修飾関係を示すデー
    タを作成して出力する階層データ出力手段と、 上記階層データを逆転して新たな逆転階層データをつく
    る階層データ逆転手段と、 上記逆転階層データを各階層ごとに翻訳して、該翻訳し
    た文を結合する翻訳結合手段とを備えた機械翻訳装置。
  2. 【請求項2】上記階層化手段が、上記パターン照合手段
    によって照合されたパターンに合わせて整形されたクレ
    ームの修飾句を分離して階層化していくものであって、
    該分離した修飾句の内部に新たな修飾句があった場合に
    は再帰的に分離・階層化を繰り返し、分離した修飾句の
    内部に修飾句がなくなるまで、階層を深化していくこと
    を特徴とする請求項1の機械翻訳装置。
  3. 【請求項3】原文特許明細書のクレームのパターンを格
    納しておき、その格納パターンと入力された原文クレー
    ムを照合して、その格納パターンと、原文クレームの修
    飾関係とから、原文クレームの階層化を行って階層デー
    タをつくり、さらに該階層データを逆転して逆転階層デ
    ータをつくることで、該逆転階層データに基づいて目標
    言語の語順で翻訳文を出力することを特徴とする翻訳処
    理方法。
JP10005996A 1996-04-22 1996-04-22 機械翻訳装置 Expired - Fee Related JP3437710B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10005996A JP3437710B2 (ja) 1996-04-22 1996-04-22 機械翻訳装置
JP2001103210A JP2001306561A (ja) 1996-04-22 2001-04-02 機械翻訳装置及び翻訳処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10005996A JP3437710B2 (ja) 1996-04-22 1996-04-22 機械翻訳装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001103210A Division JP2001306561A (ja) 1996-04-22 2001-04-02 機械翻訳装置及び翻訳処理方法

Publications (2)

Publication Number Publication Date
JPH09293075A true JPH09293075A (ja) 1997-11-11
JP3437710B2 JP3437710B2 (ja) 2003-08-18

Family

ID=14263911

Family Applications (2)

Application Number Title Priority Date Filing Date
JP10005996A Expired - Fee Related JP3437710B2 (ja) 1996-04-22 1996-04-22 機械翻訳装置
JP2001103210A Pending JP2001306561A (ja) 1996-04-22 2001-04-02 機械翻訳装置及び翻訳処理方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2001103210A Pending JP2001306561A (ja) 1996-04-22 2001-04-02 機械翻訳装置及び翻訳処理方法

Country Status (1)

Country Link
JP (2) JP3437710B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009088067A1 (ja) * 2008-01-10 2009-07-16 Nec Corporation 機械翻訳装置および機械翻訳方法
JP2014199476A (ja) * 2013-03-29 2014-10-23 株式会社エヌ・ティ・ティ・データ 機械翻訳装置、機械翻訳方法およびプログラム
JP2015228170A (ja) * 2014-06-02 2015-12-17 富士通株式会社 機械翻訳方法、機械翻訳プログラム及び機械翻訳装置
JP2021043954A (ja) * 2019-09-06 2021-03-18 国人 小林 発明文書分析システム及び発明文書分析処理プログラム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6417359B2 (ja) * 2016-05-06 2018-11-07 雲拓科技有限公司Integral Search International Ltd. 請求の範囲の構文解析構成方法
TW201828104A (zh) * 2017-01-26 2018-08-01 雲拓科技有限公司 申請專利範圍之解析紀錄方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009088067A1 (ja) * 2008-01-10 2009-07-16 Nec Corporation 機械翻訳装置および機械翻訳方法
JP5423398B2 (ja) * 2008-01-10 2014-02-19 日本電気株式会社 機械翻訳装置および機械翻訳方法
JP2014199476A (ja) * 2013-03-29 2014-10-23 株式会社エヌ・ティ・ティ・データ 機械翻訳装置、機械翻訳方法およびプログラム
JP2015228170A (ja) * 2014-06-02 2015-12-17 富士通株式会社 機械翻訳方法、機械翻訳プログラム及び機械翻訳装置
JP2021043954A (ja) * 2019-09-06 2021-03-18 国人 小林 発明文書分析システム及び発明文書分析処理プログラム

Also Published As

Publication number Publication date
JP2001306561A (ja) 2001-11-02
JP3437710B2 (ja) 2003-08-18

Similar Documents

Publication Publication Date Title
US5799268A (en) Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
CA2546896C (en) Extraction of facts from text
US7774198B2 (en) Navigation system for text
US7788084B2 (en) Labeling of work of art titles in text for natural language processing
US8447588B2 (en) Region-matching transducers for natural language processing
US7617444B2 (en) File formats, methods, and computer program products for representing workbooks
CN100474301C (zh) 基于数据挖掘获取词或词组单元译文信息的系统和方法
Sedláček et al. A new Czech morphological analyser ajka
JP2006178944A (ja) 文書を表すファイル・フォーマット、その方法、およびコンピュータ・プログラム製品
CN100361124C (zh) 用于词分析的系统和方法
Kazman Structuring the text of the Oxford English Dictionary through finite state transduction
JP3437710B2 (ja) 機械翻訳装置
JP2001331515A (ja) 単語シソーラス構築方法及びコンピュータシステムに単語シソーラスの構築を行わせるためのコンピュータソフトウエアプログラム製品
EP0466516A2 (en) Text analysis system
Shreve Corpus enhancement and computer-assisted localization and translation
JP4213900B2 (ja) 文書分類装置と記録媒体
Trippel The Lexicon Graph Model: A generic model for multimodal lexicon development
JP2004334382A (ja) 構造化文書要約装置、プログラムおよび記録媒体
JP4098764B2 (ja) 文書処理装置及びプログラム
Sedlácek et al. Automatic Processing of Czech Inflectional and Derivative Morphology
KR100404320B1 (ko) 문장 자동 색인 방법
Salmon-Alt et al. Proposals for a normalized representation of Standard Arabic full form lexica
Huitfeldt et al. Document similarity
JP2023120824A (ja) 文書分析システム、文書分析方法、及びプログラム
Lehtonen Preparing heterogeneous XML for full-text search

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S202 Request for registration of non-exclusive licence

Free format text: JAPANESE INTERMEDIATE CODE: R315201

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees