JPS5840684A - 自然言語間の自動翻訳方式 - Google Patents

自然言語間の自動翻訳方式

Info

Publication number
JPS5840684A
JPS5840684A JP56138586A JP13858681A JPS5840684A JP S5840684 A JPS5840684 A JP S5840684A JP 56138586 A JP56138586 A JP 56138586A JP 13858681 A JP13858681 A JP 13858681A JP S5840684 A JPS5840684 A JP S5840684A
Authority
JP
Japan
Prior art keywords
speech
word
sentence
pattern
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP56138586A
Other languages
English (en)
Other versions
JPH0351020B2 (ja
Inventor
Yoshihiko Nitta
義彦 新田
Atsushi Okajima
岡島 惇
Fumiyuki Yamano
山野 文行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56138586A priority Critical patent/JPS5840684A/ja
Priority to US06/415,601 priority patent/US4641264A/en
Publication of JPS5840684A publication Critical patent/JPS5840684A/ja
Publication of JPH0351020B2 publication Critical patent/JPH0351020B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は自然d語間の自動翻訳方式に係り、特に、英語
で表わされた文章を日本語の文章に自動的に翻訳する方
式に関する。
らず、任意の異なる自然言語間の1訳に適用することが
できると共に、表記法の異なる同系列言語間の翻訳(変
A)方式、例えばカナ文字で記載された文章を漢字混じ
りの文章に変換する場合にも通用できる。以下の説明で
は便宜−ヒ、人力6語が英語、出力8語が日本語の場合
について述べるが、本発明方式はこれに限定されるもの
ではない。
従来技術とその問題点 一つの自然言語で表わされた文章を他の自然言語で表わ
された文章に自動的に翻訳する方式として、従来、電気
通信学会雑誌第46巻、第11号の第1730頁〜第1
739頁に記載されている方式%式% この従来方式を簡単に説明する。まず英文テキストが入
力されると、辞書検索を行い、単語の並びからなる文章
を品詞列に変換する。しかしながら多くの場合、品詞が
一義的に定まらないことがめる0例えば”5tudy”
という単語は動詞をとる場合と名詞をとる場合がある。
このような場合にはまず一義的に品詞が確定できる単語
を選び、確定した品詞の率、f!を基準にして、その前
説の開法より他の単語の品詞を決定する。Jl後まで品
詞が定まらない単語についてはとり得る品詞の候mt−
fJしておき、とりあえず一つの品詞を仮に決定する。
次に句及び節に相当する品詞列パターンを予め登録して
おき、このパターンと一致する品詞列を探す、一致する
ものがあればその句又は節は1116Iの品詞記号によ
シ置き換えられる。
例えば第1図に示すように・・・aρulse ofk
nown rlte of riseという文が6つた
場合、a pulse 、  known rate 
、がそnぞれ名詞句(NP)として判定される。さらに
、of 十riseが形容詞句(AP)、known 
rate +of +rlseが名詞句、of +kn
own rate +of −1−rneが形容詞句と
いうように置き換えられる。
こうして一つの文が簡単な品詞列のパターン変換される
。この変換された品詞列のパターンが予めf録された文
1r表わす標準の品詞列パターンと比軟される。両パタ
ーンが一致する場合には翻訳可能と判断され、予め定め
られた規則に従って単語の、*Ii[変換が行われる。
変換され良品−列パターンが登録された標準パターンと
一致しない場合には、単語の品詞の決め万が不適切と判
断し、不確定の単語の品詞を登録され虎刈の品詞に置き
換え、上記と同じ処理が繰り返して行われる。すなわち
、単語が多品詞をもつ場合に、一つの品詞を決定するた
めに一櫨のフィードバック・ループが用いられる。
最後に語順変換さnた単語列に訳語が付与され英文を翻
訳した和文が出力される。
しかしながら、上記のような従来の自動翻訳方式には下
記のような櫨々の問題点がある。
第1のl’dl14点は多品詞語の決定が極めて複雑に
なり、翻訳の成功率が低くKなりがちということである
。前述のように従来方式では一つの単語が多品詞をもつ
場合には、一つの品詞を仮にあてはめて、パターン辞書
による構文解析を行い、うまくいかなかった場合には、
又もとに戻って別の品詞をあてはめてみるという処理7
に繰プ返す、しかしながら、多数の品詞をもつ手暗(i
現実に数多くあり、しかも文章が複雑になると、一つの
文についての回目ヒな品詞列の種類は美大な奴に達する
こnらの品詞列について何回も同じ処4をく9返すこと
は、1訳速度の低下を招くことはもちるしのこと、間違
った品詞を暫定的に足め7′c*合でも、単語の品詞列
がたまたま辞書にi録されたパターンと一致し、間違っ
た翻訳処理が行われてしまうこともある。
従って文章が複雑になる機、これを正しく翻訳できる卓
、つt#)成功率が低下する。
第2の間4点は、仮に単語の品詞が正しく決定されたと
しても、句、1fJt″l)出して1つの品詞におき代
える処理を行う際、文頭又は文末から順奇に句を切出し
ておシ、句、節のポク先、修飾の対象となる単語の関係
、つまシ依存・修飾関係を分析せずに行っているために
間違った翻訳をしやすいということである。例えば41
a)図に示すような・・−take a bus in
 ;1 cityという文dL6うた場合、第1囚図と
同様に構文分析を行うと、”Hbus ゑn a C1
ty”が1つの名詞句と認識され、この結果、訳語は“
街の中のパスに乗る”となってしまう。これは@in 
a C1ty” がtakeにかかる副詞句でろるにも
かかわらず、文末から順番に句を切、田していくと形容
詞句として、i!!i識され”abut”を修飾すると
判定されたために生じ九誤訳でめる。このように文頭又
は文末から順に句を切出していく方法をとると句品詞が
一義的に定まらない場合が生ずる。ま九文章が階層的構
造をもつ場合が生ずる。また文章が階層的構造をもつ場
合、つまシ、修飾金する相手先が複雑に入り組んだ文章
の場合にはこれを正確に翻訳することができなくなる。
第3の問題点は、従来方式では翻訳すべき文型の増補を
行うためには処理装置のプログラム全体を手直しする必
要が69、従って−Hシステムができめがってしまうと
文型の増補が極めて困離になることである。すなわち、
従来方式においては、多品間をもつ単語の品詞を決定す
るために、フィードバックループを用いており、このル
ープの中にパター/辞嘗による構文分析の処理が含まれ
ている。従ってパターン辞書のiI#+ハターンを追加
したり1−正する場合には、フィードバックループ全体
の動作に矛盾を生じないように処理アルゴリズムを手直
ししなければならない。通常、自動−訳における成功率
は上記の博文分析用の盆4パター7fいかに構築するか
に依存するところ大であり、従って試行錯誤的にこの登
録パターンの増加、変更t−要するが、その都度処理ア
ルゴリズム全体の手直しをするのは実際上大きな負担に
なる。
発明の目的 本発明の目的は上述のような従来技術のrdll−魚倉
解決した新規な自動翻訳4式を提供することにある。
具体的に言うと、自ttha訳の成功率が高く、複雑な
文章倉正確に翻訳することができ、しかも文型パター/
の増補が容易な方式を提供することが本発明の王たる目
的である。
発明の概要 上述の目的を達成するために、本発明方式では第2図に
午す逃埋過僅を経て自然言語間の翻訳が行われる。
まず英文テキス)t4み込み、入力データパックアメモ
リにセットする(テキスト入力処理)。
次に辞vIt−TIt索してテキスト中の変化形をもつ
単語、例えば時制変化、複数形変化、比軟級変化などを
している単語を原形に変換する処理金貸う(辞書検索)
。更に、テキスト中のすべての単語及び遅m<イデオム
等)の列を、七nらに対応する品詞列に変換する(品詞
認識)。次に品詞列の形に変換された文を、d1敗1の
名詞の連なり、助#詞+動詞、冠詞十名tA%前rII
t詞十名詞、形容詞十名詞等の8語的意味をもつ最小単
位、つまり句要素に分割する(句構造認識)。そして上
iピの各句要素に対して、改めて名詞句、形容詞句、副
詞句、動詞句、前置詞句などの句品詞を与える。この後
、後述の辞書再検索が行われる。次に句品詞列を、主語
、中心動詞、直接目的虐、補譲、動詞修飾語等の構文的
役割子列に変換する。更に構文的役割子列の中から単文
パターン、節パターン、及び意味的に閉じた王語、述語
関係を有する一文率位(単節パターン)を見出す(英文
型パターン認a)。
更に、1ut11.5151句、副詞句等の旬要素の係
り先、つまりどの名詞句あるいは!jh詞句を修飾して
いるかの依存関係を決定する(依存・1−一関係認識)
次に上記のようにして認識された英文型パターンを、そ
のパターン毎に予め定めらnた変換規則全参照して、日
本語の骨格パターンに変換する(文型変更)、最後に予
め用意された単語、連語の辞書を検索することにより出
力言語である日本語の文を生成する(和文生成)。
本発明方式の特徴の第1は、単語及び連語の列を品詞列
に変換する品詞列認識の処理が、句構造認識などの構文
分析の前段階においで完了し、従来方式のよりなフィー
ドバックループをもたないことでbる。換言fnば品詞
列認識の処理ステップではすべての単語・連語の品詞t
この段1曾で確定してしまい、句構造認識等の処理結果
をみて、再び品詞認識に処理が戻るようなフィードバッ
クループを有しない、従って谷処理ステップにおける処
理結果が他の処理ステップに影#を与えないため句構造
等の認識の九めのf録パターンの増補が極めて容易にな
る。
特徴の第2は、多品詞金もつ単語の品5ITIを決定す
るのに、後述のような品詞認識用パターンを予め定め、
これta照しながら決定するように構成されている点で
るる。この品詞認識用パターンを用いることによって、
谷単語の品詞の確定が迅速正確に行われ、結果的に翻訳
の成功率が向上することになる。
本発明方式のm3の特徴は、品詞列パターンから句、1
rJt切り出して構文分析を行う際、従来の英文法の句
、節とは異なる句要素の概念全導入したことである。更
に句要素の単位で切出し、新たに句品詞列を形成した後
、これを碑文的役割子列に変換することも特徴の1つで
ろる。このように句要素、構文的役割子の考え方を導入
することによって、複雑な文章も正確に翻訳する仁とが
り能となる。
dc4の時漱Vま、句、節などがどの語を−g市するの
刀・を認識するー飾・依存関係認識の処理ステップ倉キ
んでいることでるる。この処理を行うことによって第1
(13図のように修飾の相手先が入り組んでいる文章も
正確に1訳することが可i巨になる。
本発明の上記#砿及びこの他の時機は、以下説明する実
施9tIta照することによって、いっそう明確になろ
う。
実施例 第3図は本発明方式の全体t4tgk示す。同図から明
らかなように本発明方式は、入力装置100、翻訳処J
l装置200、辞蕾用メモリ300、作業用メモリ40
0及び出力装置500よシ4成される。
入力装置100は英文テキス)1人力するためのもので
、通常、キーボードが用いられる。もちろん、この他の
方法によシ英文テキストを入力することも9罷である。
例えば磁気テープζdi気ディスク等に予め英文テキス
)f記録しておき、公知の磁気記憶制御回路を通して処
理fc11200に入力してもよい。また、ファクシミ
リ等の通信機器を通して送られてくる英文テキストを、
公知の通信回線制御回路を堰して処理装置200に入力
することもできる。
辞書用メモリ300は率請、述語(2以上の単語よシな
るイデオム等の語)等の辞膏や、−灰処理のために用い
られる規則全定義したテーブルを予め格納しておくため
のものである。具体的にいうと、このメモリ300には
、単語辞11301、述語辞書302、品詞認識用パタ
ーン303、句要素切出用パターン304、文型認識用
パターン305、依存・修飾関係認識用パターン306
、文型変換用パターン307、和文生成用パターン30
8が格納されている。
単語辞$301のメモリエリアの内部構造を第4Q図及
び第4@図に示す、1番地からN番地のそれぞれの゛ブ
ロックには単語情報レコードが記憶されている。単語情
報レコードは単語の見出し語と、その単語の属性を示す
単語情報とを含む。単語情報としては、その単語音もと
にしてつくられる連語(イデオム等も含む)のll!数
、連語の先頭會地、その単語がとり得る品詞の開数、品
詞名、品詞の訓分虜、谷品詞における単語の4性その単
語が多義の意味をもつ場合にはその個数、それぞれの訳
語、各訳語の語尾活用、谷訳語の付JI4愼MB語等が
含まれる。
第4@図には”5T(Jl)Y”という英−に相当する
率# r* 報が例示されている。この単語をもとにし
てつくられる逐語としてはMAKE A 8TLJDY
OF  、UNI)ER5TLJDY 、  CASE
 5TLJDY。
など(6) +d登録されている。それらの連語のうち
先頭に登4されている連語の曲尾が(76)でめる。
(第5(2)図参照)または5TUDYは動詞(V)と
名8i1(N)の両方をとり得るので多品詞個e(2)
、品詞名1として(V)、品詞名2として(N)がf録
される。なお品詞の111N1分類の禰には、例えば動
詞の場合、自動詞と+tlll−詞の区別、また自動詞
でもその後に禰語をとる自動詞、(例えばget。
1ook 、 make等)とその後に前[1詞をとる
自動詞(例えば5end 、  advertゑ8e等
)との区別等、品詞に関する更に洲かい1ft報が督き
込まれる。
更に8TUL)Yが動詞として用いられる場合、その意
味が1勉強する”と解釈される場合と、′研究する”と
解釈される場合とがちるので、多ati個数の禰にはく
匂、訳語lの禰には“勉強する”、訳語2の掴には@研
究する”と登録される。また訳語1及び2共に1勉強″
及び1研究”の後の1する1が、状況に志してす行変化
して用いられるので、語尾活用l及び2の欄にその旨登
録きれる。更に付II dA 罷語(て、に、會、は)
としては、@8T[JDY’  が目的請(OBJ )
tとるja&には(OBJ )の後に一ビが入るので、
その1#罐が訳語l及び2に対応する付属愼能語1及び
2の欄に登録される。
54(2)図では図示してないが42品詞名(N)につ
いても上述と同様の清報が登録される。
連#膏302(dX3図)のメモリエリアの内部構造を
第5(A)図及び第5@図及び第50図に示す。
連語情報レコードは、連語の見出し語と、その連語の属
性等を示す連、f情報を含む。連虜清報には、その連語
のとり得る品詞の個数、その品詞名品j+1細分類、そ
の品詞における連語の属性、逐語が多義に解釈される場
合その個数、各訳語、谷訳語における語尾活用、付属愼
能語等が含まれる。
第5@図には″MAKE A 5TUi)Y OF”と
いう固定連語に関する連語情報が例示されている。
この連語は1研究をする・”という動詞句を形成するの
で、品詞の個数は(1)、品詞名は(V)と蓋縁される
第50図はOT変連語辞畜の内部4成を示すもので、そ
の拝誦については後述する。
更に、この4語の多義性の個数の禰には(1)、訳#1
の禰には1研究2する”がi録される。語尾活用lの欄
には訳#lD@研究をする”の1する”がす行変格活用
して用いられる旨の情報が登録される。付属憤龍語1の
欄には、上記連語が目的語(UBJ)t−とる場合に@
(OBJ )の研究をする”の訳語となシ、′の1の付
属愼罷語が必要になる旨の+1vliが登録される。
第6(4)図は辞★メモリ300の中の品詞認識用パタ
ーンエリア303に格納されるパターンの一例を示す、
仁の品詞認識用パターンは4語又は連語の並びからなる
文を、それぞれの単語又は連語の品詞の並びへと変形す
る場合に用いられる。単語又は逼−がOL故の品詞を文
法的にとり得る場合、品詞の並びの前後関係から、最も
ふされしい一つの品詞を最終的に選び出す。この場合、
予め、文法的にと夛得ない品詞列のパターン、つまシ禁
制品tpJ 列パターンを登録しておき、このパターン
を用いて多数の品詞から一つの品golk通択する。第
6(A)図には6個の県側品詞列パターン及び禁制解除
条件が示されているに過ぎないが、実際にはこのパター
ンが数十個以上用意される。tた入力される文の特性を
考慮してパターンの変更、増加、簡略化などを行っても
よい。
546■図において禁制品詞列パターンの米は、品詞を
判定すべき単語の位dr表わす。又、F、。
F2は木のそれぞれ1つ前、2つ前の単語の品詞を表わ
し% Bj a s、は米のそれぞれ1つ後、2つ仮の
単語の品詞に表わす。
、IJj#lノ米位&の[−Vjの、e号は、[−6司
(V)以外の品詞」という意味で我る。従って項蕾lの
品詞列パターンは、「t、の麦に動詞(v)の町、ヒ性
のめる単語が並んだ場オ1.kM(V)として判定し、
他の品詞の可能性はなしとしてよい」という意味である
禁制解除条件は禁制品詞列パターンの禁制が解除される
こと、換言すれば品詞列パターンの品詞の並びが許容さ
れることを示す。例えば、項番2U−形容IPl(AL
)J ) +1rhA (V )”というaxの並びは
通常は系止さnるが、Fl として冠詞(ART)や、
BE動詞(BE)がきた場合°にはそのような品詞の並
びも許容されることを示している。換言すれば1冠詞(
ART)ではなく、かつBE動詞(BE)でないもの十
形各詞(ADJ)+米”という品詞の並びがあるとき、
米の位置が#tJJ詞(V)のoT能性はないと判断し
て良いという意味でおる。
JAAs2.1F1 (動詞(V))十米”という品詞
の並びが出てさた)a酋sFlが−ingのついた動詞
(ING)のとき、半がbe励詞(BE)のとき、或い
はF、がhelpという単語であるときを除いて、米の
位置は動詞金とり得ないと判断して良いことを弐現して
いる。
項番4は1代名詞愼数(P几NM)  十米”という品
詞の並びが出てきたとき米の位置は(動詞+S)の形は
と9得ないと判断して良いことを示す。同様に項番5は
1名詞41奴(NM )十米”という品詞の並びが出て
@九とき、米の位置は(動詞+S)の形はとシ得ないと
判断して良いことを意味する。
更に項番6は、′場所の固有名詞(N1 )十米”とい
う品詞の並びがあったとき、米の位置は!Ib詞現在(
VP )の形はとり得ないと判断して良いことを示して
いる。
この他のパターンについては説明を省略するが要するに
上記のような禁制品詞列パターンがテーブルとして#記
メモリエリア303(第3図)に格納されているのでる
る。
第7Q図は辞書メモリ300の中の句妥素切出用パター
ンエリア304に格納されるパターン例を示す、この可
安累切出用パターンは、単語及び連語に付与された品詞
の並びからなる品詞列から刃要素を切出し、この刃要素
に新たに品詞を付与することによシ句要素品詞列を生成
する際に用いられる。ここで刃要素とは第7囚図に示す
品詞の並びをもつ単語の並び金称し、通常の英文法で定
在される句のa念とはJ4なる。なお第7(A)図は刃
要素の一部を示したに過ぎず、実際には多数用意される
第7囚図において、’ooo’なる記号り、そnkはさ
む品詞が111以上有限個出現したとき、その全体音g
Jシ出すことを意味する。項41は1副8ol(ADV
)livA”マタハ′″IIgJ詞(ADV)+・・・
十副詞(At)V)”という品詞列がめった場合、この
列全体を句*素として切9出し、新九に刃要素品詞とし
て副詞が付与さルることを示している0項番2は、′前
置詞(PREP)  十名詞(N)”めるいは1前直詞
(PREP)  十名詞・(N)+・・・十名詞(N)
″という品詞列には前lli詞的(P階Nし)の刃要素
品詞が付与されることを示す、項番3は1助動詞(AU
X)十励詞(V)”ま友は、“助1jbACAUX)+
−・・十助動詞(AUX)+動yl(V)”という品詞
列かめつ几場合、この列全体を刃要素として切シ出し、
frfCに刃要素品詞として動詞(V)が付与されるこ
とを示す。項番4゜5.6についても同様である。
辞書メモリ3000文型認識用パターンメモリエリア3
05には、4つのテーブルが格納されている。すなわち
動詞パターンテーブル、接続d司パターンテーブル、節
パターンテーブル、文パターンテーブルでおる。
5g8(4)図は1IIJ詞パターンテーブルの一部を
示し、mAOタイプ番号全手がかりとして1J=fJf
rもつノードの前後のノードの襦文的役割子を決定する
ために用いられる。動詞のタイプ番号は率賭辞書および
連語辞書を検索することによシ得られる。動詞のタイプ
査号と動詞の列、IIb詞が前後の名詞相当句を支配す
るパターンを表1囚に示す。
第80図は燻続詞パターンテーブルの一例゛を示し、接
Ift詞を有するノードの前後のノードの構文的役割子
列パターンからsf詞のノードの構文的役割子を決定す
るために用いられる。
第8(0図は節パターンテーブルの一例を示し、接続詞
、句読点等で区切られるノード列の構文的役割子パター
ンから節パターンを決定するために用いられる。
第8(ハ)図は文パターンテーブルの一例を示し、節パ
ターンの並びから文パターン(骨格)くターン)を決定
するために用いられる。
それぞれのパターンテーブルの詳細については後述する
。時に第8(A)図中、第8C)図中、、ig8■図中
に出現する記号については、後で第20@図等を用いて
述べる。辞書メモリ300には、この他に形容詞、副詞
の単語、句等がどこにかかるかt決定するための依存・
修飾間−’1M 、JA識用ノ(ターフ306、文型の
変換用に用いられる)(ターン307、和文生成の際に
用いられるパターン308をそれぞれ格納するエリア會
有する。各)くターンについては後で詳述する。
以上述べたようVC1辞誓メモリ300には、単語、連
語辞書の他、%橿の規則パターンが予め格納されるが、
このメモリ300への1#報の4′f!込み及び読出し
は、着込み読出し制御回路201によって行われる。
一万、作業用メモリ400は、第2図に示した各処理の
過程で必要になるテーブルを格納するためのもので、続
出した単語、連語i!報を一時的に格納するバッファテ
ーブルエリア401、入力テキストストリームテーブル
t−41!!稍するエリア402、ワードストリームテ
ーブルt4納するエリア403、ノードストリームテー
ブルを格納するエリア404、句g!木列を格納するエ
リア405、英文型ノード列を格納するエリア406、
和文型ノード列を格納するエリア407、出力テキス)
1格納するエリア408を含んでいる。尚各テーブルの
詳細については後述する。
上記作業用メモリ400の情報の1込みd!、出しは、
翻訳処理装置200からの指令に基づき、書込み続出し
制御回路202を介して行われる。
翻訳処理装置11200は、後で詳しく述べるようにd
X2図に示した処理を行うためのプログラムを格納して
おり、辞書メモリ300の一1#罐を適宜用い、メモリ
400をワーキングエリアとして用いて、入力の英文テ
キストヲ和文に翻訳して出力する。
出力装置500としては和文出力をプリント又は表示す
るためのプリンタ又はディスプレイ装置等が用いられる
なお、前述の辞簀メモリ300として例えばディスクメ
モリ、作業用メモリ400としてコアメモリが用いられ
る。もちろん本発明方式ではこれらのメモリの種類は特
定のものに限定されない。
又こルらメ・モリを処理装置と別に設けてもよいし、処
理装置の中に設けても麦支えない。
以下本発明方式による処理手順についてIIf:MJに
説明する。
α)テキスト入力処理 テキスト入力処理というのは、入力装置100(第2図
)よシ入力した英文テキス)金、l’l:業用メモリ内
の入力テキストストリームエリア402に順次セットす
る処理をいう、英文テキストの一例を第9図に示す。キ
ーボード等の入力装置100によシ英文を入力すると、
アルファベットに対応するコード石号に変換された後、
上記入力テキストストリームエリア402に格納される
(2)辞簀検索 テキスト入力処理が完了すると、次に、いわゆる辞書引
きの作業が行われる。辞書引きとは入力テキストストリ
ームエリア402に格納された、入力テキストの単語の
出現の順に、単語辞4301を検索し、該当する単語の
単語情報を作業用メモリ460の単語%連語用バッファ
メモリ゛エリア401に順次格納する処理をいう。例え
ば第9図のテキストの場合、第10図に示すようにまず
HE、’を見出し語とする単語情報がメモリエリア40
1のW B (1)番地に格納される。次にWROTE
は不規則変化IIh詞であるので予め単語辞書301に
登録されておシ、その単語情報には’WRITE’への
ポインタ(WRI TEへの先頭着地)と不規則変化情
li(wroteはwrtteの過去形)が格納されて
いる。従ってWaOTEの半、&1r辞書引きするとW
几ITEを見出し語とする単語1青報が読出され、この
単語fiv報に不規則変化情報を付加した後メモリエリ
ア401のWB(2)許地に格納される。以後、順KB
NGLI8H、VERY−O#誉引きが行われる。
このように単語辞書の内容と同じ1′#1111に一旦
、単語c連語用パックアメモリエリア401にとシ込む
のは、作業用メモリ400として通常、^速アクセス可
能なメモリ、例えばコアメモリが用いられるので、後の
品詞認定、依存修飾関係認識、和文生成などの処理過程
における辞書検索が高速に行えるためである。従って、
上記の単語・連語バッファメモ!7401に−I1m?
用せずに各処理過程において直接単語辞11i301.
連語辞誉302t−検索することもできる。
上述のいわゆる辞書引きの段階で、単語の語尾変化処理
及び4#の検出処理が行われる。以下それらの処理の内
容t−詳しく説明する。
語尾変化処理とは、語尾が活用変化している単一% y
uえば時制変化、榎数形変化、比較級変化など倉してい
る単at、その原形に変換し、単語辞書301、連語辞
書302を検索した後、検索した内容に語尾変化情報を
付加した上で単語・J!!語バッファメモリエリア40
1にセットする処理ヲいう。この処理を行うことによシ
後の品詞認識処理における単語辞vI!あるいは連語辞
書の検索を、単語の原形の見出し1lft−参照して行
うことが可能になる。従って辞書には、このように−尾
変化した単語情報を予めf録しておく必要がな、くなシ
、辞書メモリ容量の低減に効果がろる。
説明の便宜上、以下@5TUDIES”という複数名詞
変化形おるいは三人称率数4411詞変化形の単語を例
にとって、原形への変換手順を述べる。他の変化形単語
の原形変換処理も同様の考え方で処理できる。
処理対象となる単語は単語を構成する一文字ずつに’I
 s Lm e z、・・・なる符号が与えられる。
たとえば″8TUDIE8”に対しては、第11■図の
ように末尾の5Vct、が、次のEには1.が、さらに
次の工には1sというように付与される。
ま九第11(A)図のステップ1011に示されている
ようにrzs it SIJ除」という処理を受けると
単語の各文字に付与される符号は第11■図のように変
化する。すなわち末尾の2文字を削除して再び符号のつ
け変えが行われる。
まずステップ1002において辞書検索が行われ、辞書
にあれば処理は終了しく1003)、なければステップ
1004に進む。ステップ1004.1005゜100
6.1007.1008はそれぞれ語尾変化が生じてい
るかどうかを判定するためのIA埋である。
この例の場合はステップ1008で判定結果がYESと
なシ、ステップ1010に進む。ここで5TUDIES
の末尾の8が削除され、8TUDIE とな夛、ステッ
プ10’l 6で再び辞書検索が行われる。単純な複数
形の場合はこの段階で辞書に登録されていることが多い
、(例えば1ikes)本例の場合は更にステップ10
17に進み末尾がEかどうか判定され。
この結果YESとなるので、更にステップ1018に進
む。更にステップ1022に至’tt*t+の文字、つ
まシIEが削床され5TUDになる。更にステップ10
23においてYが付加され5TUDYという原形に変換
された後、ステップ1024で再び辞書引きが行われる
。ここでも、もし辞書になければ未JT:縁語と判断さ
れる(1025)。
以上述べたような処理を経て、5TUDYの単語が辞書
にあると、その単#1ill報が読み出され、単語情報
に語尾変化処理(複数名詞変化形iびに三人祢率数動詞
変化形)を付加したものが前述の率―・連語バッファメ
モリエリア401に薔き込まれる。
次に単語の並びからなる英文テキストの中の連語を検出
する処理について第12図1r参照して説明する。連語
とは、2以上の単語の結合により意味のめるーを形成す
るもので、イデオムもこれに含まれる。
ここでは−列として”MAKE A  5TUDY O
F”なる連語が検出され、単語・連語バッファメモリエ
リア401に格納される千ノeについて説明する。
まずステップ1040で単語の切出しが行われ、ステッ
プ1041で前述の語尾変化処理が行われる。
次にステップ1042で単語辞簀検索がなされる。
@MAKE”及び′″A”については前述と同様に単語
辞書301の該当見出し語?検索して、その単語情報を
単語・連語バッファメモリエリア401に順次格納して
いく。ステップ1043では、単語が辞書に登録されて
いない未知単語がどうが判定する。登録されていない場
合にはステップ1o47で固有名詞として判断する。次
に″A#の次の@″5TUDY”全見出し飴として単語
辞書301をf!IL索すると、第4(6)図に示すよ
うに、”5TUI)Y”を含む連語が6個存在すること
が判る(ステップ1044)、そこで直ちに対応連語部
の先頭番地(76)から4語の見出し語の検索が開始さ
れる(ステップ1048)、g5@図に示すように、”
5TUDY’ を含む連語としては、 @MAKE A
STUDY OF” ”UNI)ER5TUDY”等が
存在することが検知される。このうち入力テキスト中の
モ(1)と一致すル17)d″MAKE A 5TUD
Y OF”であることが判る(ステップ1049 )。
なお、会致する連語が存在しないと判rrされた場合に
は、−8TUDY”を単なる単語とみて、剖述と同様に
″5TIJDY” の単語情報をバッファメモリエリア
401に格納することになる(ステップ1045)。
また入力テキストが2以上の邊胎と一致することが検知
された場合には%最も長いiL語と一致したものを採用
する。同工ば@MAKE A 5TUDY”ト”MAK
E A 5TUDY OF−(Dtd4者j!ニー −
攻1..fC場合には後者が採用される。
さて、現在の例では人力テキストと@″MAKEA 5
TUDY OF”が−紋し次駅でるるか、この場合には
まず単語、4語バッファエリア401内にすでに格納さ
れている@MAKE’及び@A”の率ti1#鰍に対し
て無効マークの付与あるいは単語情報の消去が行われる
(ステップ1050)。この後”MAKE A 5TL
JDY OF”に対応する連語情報が単語・連語バッフ
ァエリア401に格納される(ステップ1045)。
上記のような処理Vてよシ、最終的には入力英文テキス
ト中に出現する単語及び1県語は、すべてその出−Jl
、1mにバッファエリア401に格納されることになる
なお、上記の丙では簡単化のため、未知単語はすべて固
有名詞として認識する場合を述べたが、より正確な品詞
を決定することもできる。この未知単語の正確な品詞の
判定は、前述した「禁制テーブル検索による品詞認識処
理」を再度実行することにより、全く同様に実行できる
(3)  品詞認識処理 品詞認識処理とは4語・連語用バッファ401に格納さ
れた各単語及び連語に1つずつ品詞金付与する処理を称
し、第13図に示すフローチャートにしたがって処理が
行われる。
まずステップ1060において、単語・連語用バッファ
メモリ401内をWB(1)、WB(2)、WB(3)
・・・の如くA次走査しながら、単語及び連語の品詞名
、品詞細分類、属性↑H報倉読み出し、ワードストリー
ムテーブルエリア403に順次格納していく。品詞基と
その記号の一部に&1(Bに示す。
第14囚図及び第14[F])図はワードストリームテ
ーブルの内部礪成倉示す、同図〃・ら判るように各単語
・運、fIはそれぞれワードレコードを含む。
谷ワードレコードは第14四図に示すようなtf1報を
會んでいる。−タυとして率#@vV几ITE”につい
てのワードレコード’td明する。単語/4ftNの区
別指示子には単語でろる旨の情報(単)が薔き込まれる
。fIの識別舒号はテキストストリームテーブル(第9
図参照)においてその語が何會目に出現するかを表わす
ので、この場合は(2)が齋き込まれる。更に語長の個
は、単語又は連語金4成する文字at−sワt、、” 
WRI TE ’ ノjlh & l’t (5)カ4
8き込まれる。先頭文字の文字曲号の欄はテキストスト
リームテーブル402(第9図)において、″WRIT
E”の頭文字@IW”の位置する番地(4)が4II自
込まれる。更に多品間の個数の欄には動詞(V)と名詞
(N)の2つでろるのでe)が畜き込まれる。この他、
品詞の細分類、多義性の個叔、谷品詞に対↓6する先頭
訳語部(ig4−0図参照)へのポインタがそれぞれの
欄に蒼き込まれる。
dX13図に戻り、ステップ1061にお匹ては、WS
に)の着地の単語が多品間がどうが判定する。
周知のように各単語及び連語は多品間をもっことが多く
、従って、この場合には−っρ最も適切な品詞を選ぶ処
理を行わなければならない(以下この処理を多晶詞S消
処理と称する)、この多品側解消処理を実行するために
本発明方式では辞書メモリ300に格納された品詞認識
用パターン表(第6囚図参照)が用いられる。単語又は
連語が多品間をもつ場合、ステップ1062において、
品詞名の1つがテスト用バッファメモリ(作業用メモリ
の一部が用いられるがここでは図示しない)にセットさ
れる。ステップ1063においてはテスト用バッファメ
モリにセットされた品詞列と、第6(A)図に示した禁
制品詞列パターンとが順次比較され、一致するパターン
を探す、第9図に示す入力テキストの”ENGLISH
”の多品側解消処理を行う場合を例にとって説、明する
。”ENGLIi9H”は名i#1I(N )及び形容
詞(AI)J)の2つの品詞を有する。まず”ENGL
ISH”の#vJ後の2つずっの単詣、′つまり“HE
 ” 、 =WRITE ’ と”VERY’ 、”5
LOWLY”ノ品詞代名d(PRN)%助詞(V、)と
副詞(ADV)、副詞(At)V)iそれぞれテスト用
バッファにセットする。この状態を第6@図に示す、こ
こでIJh詞(V、)の添字(ηは、動詞の品詞細分譲
を示し、目的語をとる他動詞でろることを表示している
テスト用バッファ(第6@図)の米の位置に形容詞(A
DJ)t−セットした後、第6囚図に示した禁制品詞列
パターンと比較される。この結果、第60図の品詞列パ
ターンは第6(4)図の項着7のパターンと会致し、(
+、v、、ADJ、−−)なるパターンは禁制されるこ
とが検知される。従って″ENGLI8H”の単語が、
この文章においては形容詞をと9得ないことがgl&さ
れる。次にテスト用バッファ(第60図)の米の泣屓に
名PJ(N)をセットして再び禁制品詞列パターンと比
較される。この場合にはいずれの禁制パターンとも合致
しないことがjlll終的に検知され、”ENGI、I
SH”の品詞は名詞であると決定される。
再び第13図に戻り、ステップ1064において。
更に第6(4)図に示した禁制解除条件1.2’を満足
しているかどうか判定される。
こうして須薊品詞列パターンに合致し、且つ解除条件も
満足しない場合には適切な品詞の峡補から消去される(
ステップ1065 )、品詞の侯補が28以上残ってい
る場合はステップ1062に戻り同様の処理が1#!り
返される。この処理によって最後に111!lだけの品
詞が残ったかどうかを判定しくステップ1067)、Y
ESの場合には残った品詞t−wsに)番地の単語又は
連語の品詞と決定する(ステップ1069)。
2個以上の品詞が最終的に残った場合にはステップ1G
70に進み、ここで第15図のような優先f表による品
詞決定が行われる。2つの品O司1例えば形容詞(AD
J )と名詞(N)とが残ってしまつ九鳩合、ADJを
見出し語とする第3行と、Nt見出しとする第2列とを
査読することによりADJ>Nなる関係、つまりADJ
O方がNよりも優先度が高いということになり結局AD
Jが採用されることになる。
以上、多品側解消処理の一例について述べたがこの処理
の効率、成功率を高めるために下記のような処理金する
こともできる。
α)テスト用バッファメモリに候補となる品1iIIJ
をセットする際、出現頻度の高い順にセットすることに
より処理効4Aヲ上げることができる。
(乃 第15図に示した優先度表は、21rIA以上の
品詞が最終的に残った場付に使用するものとして、i1
2明したが、品詞の候補が最終的に全部消去されてしま
った場合にも、もとの品詞候補全体に対して第15図の
at用い、蝋も高い優先度の品詞全採用することができ
る。
(4)  句構造認識 句構造認誠とは、英文人力テキストの各単語及び連語に
唯一の品詞を与えることによってつくられた品詞列から
切要素に相当する部分を切り出す処理、および、それら
に新友な切要素品詞を付与することにより、1品詞性け
された切要素列(切要素品詞列)”を生成する処理をい
う。ここで切要素とは前述のように、英文法の句の概念
とは異なり、言語的意味をもつ最小単位の単語、又は/
及び連語の組み合せよりなるものである0例えば名測子
名詞、助動詞+動詞、冠測子名詞、形容測子名詞、前置
測子名詞等は切要素を形成する。
つまり、従来の英文法では、1句”という概念は、かな
シゆるやかな定義dNuしか持っておらず、与えられ九
英文テキストに対して、どの部分が1句”かについて−
意に定めることができない。
例えば本発明でいう“中心動詞となっている切要索1と
、1その目的となっている切要素”は、従来の英文法で
はそれぞれ単独でも1句”であるが、同時にま九そnら
を連結したものも1句”である。
英文例をあげると“助動詞+動詞十冠詞+形容測子名詞
”(will have a beaut目ul gi
rl )は、英文法の1句(!IdJp1句)”とみな
されるが、本発明でいう1切要1g”ではない、′助動
測子動詞”(will have )  と1冠詞+形
容詞十名ail (ai)eauHful girl 
)とが1句要素”である。
さらに多くの句を連結させた句、互いに重複した部分を
もつ14なる句なども、従来の英文法では定義され得る
これに対し本発明では、中心動詞と、その目的語とは、
ろくまでも別個の警句要素”でるる。本発明でいう1句
要素1は一般に、与えられた英文テキストに対して、−
意に、ただ一つ、互いに重複することなく定まるもので
ろり、こnらの組み什せを1文型認識ならびに文型変換
の基礎データとしている。
このことにより、句構造認識の処理を間車かつ明確にし
、かつ、それ以後の文型変侠や和文生成等の処理を明確
に分離することができる。
第16図は句構造認識の処理の流れを示す。まずステッ
プ1080において、ワードストリームメモリエリア4
03の各単語及び連語のワードレコードが、ノードスト
リームメモリエリア404にセットされる。第17図は
セットされ良状態を模式図として示したもので米lO行
に示し九NSα)。
N8(ツ・・・N 8 (20)Vi、ノード会号であ
る。又米2の行には対応する単語が格納されているが、
実際にはフードストリームテーブル(第14(A、1図
、第14@図参照)へのポインタのramが格納される
米30行にはノードのカテゴリー、つまり単語(W)、
切要素(P)、1e(C)、単節(Q)、文(、S)の
区別を表わす情報が格納される。米4、の行には品詞情
報及び品詞−分情報が格納される。
以後、このノードストリームメモリエリア404にセッ
トされた償@iをもとにして句!2累が切出されていく
。ステップ1081において、ノードの厳木尾の一号に
+1した前号′ltkにセットする。すなわち、この逃
埋により入力英文テキストは、ピリオドやコンマもざめ
て(k−1)dの単語及び逐語から構成さnたことにな
る。次にステップ1082において、ノード膏号NSα
)、N8伐)、・・・N8(k−1)t−句安累列テー
プルエリ7405にセットする。ステップ1083にお
いて、句!&L[素列テーブルにセットされたノード溌
号のうち、n以上の番号から(k−1)に至るまでの番
号をCz −Cm −Cm・・・Oxとする。ただし、
nは繰返しが行われる直前にn=1に初期化されている
ざらにノードNS (Cs ) = N8 (Cm )
−・・・ の品詞列パターンに関して、第7(A)図に
示したり要素として切出すべき品詞パターンと合致する
ものが存在するかどうか判定する。例えばn=lの場合
はHEから始まる文の品詞列、PRへ、 V、 N  
・・・と登録パターンとが比叙され、n−2の場合はW
几ITEから始まる文の品詞列V、 N、 ADV、・
・・と登録パターンとが比較される。品詞列が第7囚図
に示す品詞パターンの2個以上と合致した場合には、よ
り長い品詞パターンと一致するものを切要素として切出
す。第17図に示した英文テキストの横付にはfi=4
のとき、つまりvgayから始まる文の品詞列がADV
、 At)V、 COM、・・・となり、g77囚の登
録パターンの項番lと一致するので@VEFLY  8
1.OWl、Y’が切要素として認識される。
同僚にして、”To  5TUDY”、 @TOREA
DAND WRITE”、” IN ENGLI8)1
”、−ATSCH(JOL” もそれぞれ句妥累、とじ
て認識される。
さて、ステップ1084においては、登録し九句要素の
品詞パターンと一致し九ノードの並びN8 (C+ )
、 N8 (Cm )・・・tまとめて新たなノードN
8に)をつ〈シこn1i−切要素列テーブルにセットす
る。
新しく生成され九ノードN8□□□)會親ノードと称す
る。第17図のテキストの例ではN 8 (4)とN8
(5)とをまとめて新たなノードN5(21)をつくる
このノードの切要素の品詞は第7囚図のテーブルよシ副
詞(ADV)が付与される。frたに形成され九親ノー
ドには新たなノード爵号が付与されると同時に、子供ノ
ードの番号も登録される。つまりノードN8 (21)
のメモリエリアに格納される情報は、このノード(21
)がノードN8(4)とN5(5)からつくられたもの
であること、このノードが切要素でおること(P)、切
要素の品詞は副詞(ADV)であること等である。
一万、ステップ1083において、NOと判定された場
合はステップ1086に進み、N5(C,)そのものを
切要素とみなす。つまり、この場合には新しいノードの
生成はしない。
次にステップ1085においては、新しく生成された親
ノードを子供ノードに置換して切要素列テーブルを修正
する処理が行われる。かくして、当初句要素列テーブル
には1,2,3,4.・・・19゜20の順にノードの
會号が並んでいたものが、新しい切要素の生成によl、
2,3.21,6゜7.8.tj、22,24,25,
26.2(1)番号順に並びかえられる。(第17図参
照)なお、英文テキストが、例えば″JJOyotlk
now・・・”のような場合には″Do#と“know
”が切要素を形成する。従って必ずしも連続した位置に
あるa数の単語によって句賛素が形成されるとは限らな
い。
(5)  連語辞書再検索 句構造m織の処理が終了した後に、もう一度連語辞II
F検索の処理が行われる。連語辞書再検索を行う理由は
次の通シである。
英文中に出現する連語、つまシ単語の連なシによシ単語
と同様の意味や作用をなすものには2つのタイプがある
。1つは@MAKE USE OF”の如く、固定され
た単語列よシなる連語でるり、他の1つは、TAIα〜
INTOC0N5IDE貼T’IαCのように、ある一
定の注實tもつ単語や句や節を上記〜の部分に4RJ)
込んでから初めて完成された連語を形成するものでめる
。説明の便宜上、前者を固定型連語、後者を可変型連語
と称する。上記〜の部分には名詞句あるいは名詞節がと
りこまれる。
第50図に示すように連語辞書には名詞を表わす品詞記
号′″N”を用いて″TAKE 、/N  INTOC
ON8IDERATIUN”トd己述亭しル。cコ’t
”−/’の印は通常の単語のつづシと区別するための符
号でおる。
前述のように、固定型連語の検索処理は、辞書検索の段
階ですでに済んでいるが%町変型連暗の処!t−行う友
めには、句構造認識が終了し九後に再び連語辞書を検索
する必Ji!かめる。
第18図は連語辞書再検索の処理手順を示す。
まずステップ1090において、入力テキストの英文の
率dakt−作某メモリ4000通当なエリアにセット
する0次にステップ1091において、ノードN5(i
)(第17図参照)にろる単語を見出し語とする可変型
連語が存在するかどうか判定される。ただし、iは繰り
返しが行われる直前にi=1に初期化されている。もし
存在しない場合は、ステップ1096.1097に進み
、全部の単語数について終了するまで同じ判定が繰シ返
される。
入力テキストの英文が例えば@THE TEACHERTAKE8 HI8 GOODATTI
TUDEINTOC0N8IDERATION”の場合
、′″TAKE”を見出し語とする述語辞書検索で連語
が存在することが認識される。(TAKE OUT 、
  TA=IN 、  TAKE  INTO、/N 
C0N5IDIATION等の4語がある。)次にステ
ップ1092において、ノードN5(i)の前後に存在
する切要索ヲつなげると、可変型連語辞書にあるパター
ン−蚊するかどうか判定する。上S己の例の場合、@I
(Is GOODATTITUDE”は句構造認識で名
−句(N)と認識されているので、連語辞曽パターンの
@TAKE、/N  INTOC(JNSIDERAT
ION ”  と−紋する。
(第sC)図参照)入力英文テキストが複数個の可変型
連語パターンと一致する場合には、最も・長い可変型連
語パターン全採用する(ステップ1093)、更にステ
ップ1094では、町変緘遵a辞書の述語と一致する入
力テキストの部分を新しいノード(親ノード)とすると
共に、新しく生成され九親ノードを子供ノードと置換し
て切要素テーブルを修正する。つまり、可変型連語パタ
ーンと対志する子供ノード群を切要素テーブルから除去
し、代りに新しい親ノードを代入する。新しいノードの
生成が6つ九場付には、そのノードを形成している蟻漫
の単語、すなわち上記の例では”C0N8IDERAT
ION”の次の切要素から再び述語辞書検索が行われる
(ステップ1095゜1096.1097)。
以上説明した連語辞薔再検索の処理により、最終的な切
要素列テーブルが作られる。
(6)  英文型パターン認識 英文型パターンgIIlとは、ノードN8(i)’ta
数個ずつまとめ、予め定められ次英文のノ(ターンに分
類する処理をいう。この英文型パターン認識は、各ノー
ドに一文的役割子を付与する段階と、この構文的役割子
の配列から文、顧、単節を見い出す段階とに分けて考え
ることができる。ここで構文的役割子とは、句*2テー
ブル内の各ノードが、文章の内部でどのような役割上も
っているのη為、つl)主&(SUBJ)、中心dJA
 (G OV )、目的語(UBJ )等のどれに相当
するのかを表わすものでめる。
次に英文型パターン4鐵の処理の流れを第19図及び第
20囚図を用いて説明する。
前述の句傅造4鐵処理の結果、句賛累列テーブルメモリ
エリア405には第20図の米11゜米12.米13.
米14の各行のように情報が格納されている。米1の行
エリアにはノード前号の情報が格納される。米12の行
エリアには谷ノードに対応する単語又は連語が格納され
るが、実際にはノードストリームテーブルへのポインタ
の情報が格納される。米13の行エリアにはノードのカ
テゴリー、つまり、単語(W)、句1!IJ(P)、節
(C)、準1i(Q)、文(8)の区別全表わす情報が
格−納されている。米14の行エリアには、単語・連語
の品詞、あるいは単節、節、文のタイプ前号が格納され
ている。*15の行エリアには英文型パターン認識の処
理の21i!程で得られる構文的役割子の情報が格納さ
れる。
第19図のステップ1100においては、切要素テーブ
ル40S内の谷ノードの品詞f+−次調べ、動詞族(動
詞及びTO+lIb詞など)の品詞をもつものが検出さ
れる。第20(4)図に示した例ではノードN8(2)
、N5(9)、N5(22)、N5(24)が動詞族で
ある0次にステップ1101では、検出された動詞族ノ
ードの動詞の細分情報(すなわち動詞のタイプ)を見出
し語(エントリー)として動詞パターンテーブルを検索
することによって、動詞族ノード及びその前後のノード
の一文的役割子を決定する。
動詞パターンテーブルの一例は第8囚図に示されている
6項番1は見出し語の動詞がbe!Ih詞のタイプ(v
l)でメジ、かつ、その@後に、「名詞(N)または代
名詞(PFLN)Jと[名詞(N)または代名詞(PR
N)Jがある横片、より拝し〈遺言すればノード列NS
(す、NS(j)、NS(ト))の品詞が1@に名詞(
N>または代名詞(PRN)、動詞(VS)、名詞(N
)t7’cは代名詞(PRN)の場合、ノードNS(り
には主語(8UBJ)、NS(j)KU中心動詞(GO
V) 、NS(k)Ktui語(COMF)の構文的役
割子がそれぞれ付与されること上水している。また項番
3には見出し語が自動詞のタイプ(VS)であり、かつ
、その前に名詞(N)または代名詞(PRN)のノード
がある場合、より詳しく換言すれば、ノードN5(i)
NS(j)の品詞が順に「名詞または代名詞」、「動詞
」である場合には、ノードNS(りに主語(SUBJ 
)、NS(j)K中心#Ib詞(GOV)(7)構文的
役割子を付与すべきことを示している。又項番4は、ノ
ードNS(す、NS(j)の品詞が共に不定詞の形をと
る動詞の場合には、NS(りに不定−形の中心動詞(T
OGOV)、NS(j)に不定詞形の目的tm (T(
J OBJ )の構文的役割子が付与されることを示し
ている。
さて、第20囚図に示した英文テキストの例では、ノー
ドN5(1)、NS(2)、NS(3)の品詞がそれぞ
れ代名詞(PRN)、動詞(vi、名詞(N)であるた
め、第8(A)図の項番6の品詞列と一致することが検
出される。従ってN8α)に主語(8U、BJ)、NS
(2)に中心112I詞(GOV)、NS(3)に目的
語(OBJ)の構文的役割子が付与されメモリエリア米
15に格納される。更にノードN S (22)、 N
S (24)の+8′i!I詞列は項番4のパターンに
一致し、ノードN8(22)KTOGOV、NS(24
)にTOOBJの構文的役割子が付与される。
同様にしてノードN 8(8)、 N 8(9)にも4
文的役割子が付与される。なお、第8(4)図はごく一
部の動詞パターンを示したに過ぎず、実際には多数のパ
ターンが用意される。
このようにして、第19図のステップ1101の処理の
結果、IIb詞の前後のノードN8(1)、NS(2)
N 8(3)、 N 8(8)、 N 8(9)、 N
S (22)、 NS (24)の−文的役割子が決定
し、その他のノードは未決定のままである。ステップ1
102において、すべての動詞族ノードについて動詞パ
ターン表の検索が行われたかどうか判定し、YB2の場
合にはステップ1103に進む。このステップ1103
では句g!素テーブル405内の残りのノードの品詞を
順次調べ、接続詞(CNJ )の品詞をもつものを検出
する。更にステップ1104において、検出された接続
詞族ノードについて接続詞パターンテーブルを検索する
ことによシ、接続詞族ノードの構文的役割子を決定する
接続詞パターンテーブルの一例を第8@図に示す、同図
の項81は、tC枕詞(CNJ)の単語綴シが“BUT
”であり、この前後の博文的役割子列パターンが、句読
点(DEL)、BUT、主語(8UBJ)、中心動詞(
GUY)’t’6つた場合、単語BUTには等位接続詞
を衆わす構文的役割子BUT(単語と同級シの記号)を
付与すべきこと上水している。項番2は、接続詞の単語
績りが−IF”でろp、この単語の前後の燐文的役割子
列パターンが、主語(SUBJ )、タイプ8の中心動
PJ(GOV)、IF、 主、fl(8UBJ )と配
列されている場合は、上記単語”IP”に名詞節を導び
(IFi表わす4文的役割子NIF’が付与されること
を示す、同様にして項43.4,5゜6には副詞節を導
び<IFtfiわす構文的役割子ADIF及び名詞節を
導び(THATを表わす構文的役割子NTHATが付与
さnる規則が示されている。
図 さて第20 (A)、Q:) 4文テキストの場合、ノ
ードN8(7)の単語の前後には、接続詞テーブル(第
80図)の項番lのパターンと一致する構文的役割子列
パターンが存在する。従って上述のステップ1104の
処理を実行することによってノードN8(7)には、構
文的役割子BUTが付与さ几る。なお、ノードN 8 
(6)と、NS(2G)についてはそれぞれ品詞(CU
MとP RD ) tみて、自動的に句読点を表わす構
文的役割子(DEL)が付与される。
接続−をもつすべてのノードについて接続詞テーブルの
検索が終了したかどうかを判定し、(ステップ1tos
)その結果、終了した場合にはステップ1106に進む
。このステップ1106では、今迄の処理で構文的役割
子が付与されなかつ九ノード、つまり−j詞(ADV)
及び@置詞的(PRENAL)の句品詞t−有するノー
ドに、構文的役割子が未だ定まらないことt表わす未確
定修飾子(pENDM)が付与される。g20図に示す
英文テキストの例では、ノードN8 (21)、 NS
 (25)。
NS (26)にそれぞれ未確定修飾子(PENDM)
が付与される。
次にステップ1107において、接続詞族ノード、(た
とえばAND、 BUT、 OfL、 ADIF、 H
THAT等の構文的役割子をもつノード)により区切ら
れた構文的役割子列パターンの中に、節パターン及び単
節パターンがあるかどうか検索し、存在す今場合には節
及び単節パターンテーブル(以下単に節パターンテーブ
ルという)を参照し、その節又は単節に「ノードカテゴ
リー」、「節又は単節の構文的役割子」及び「節又は単
節のタイプ」を付与する。
節パターンテーブルの一例を第80図に示す。
同図の項番lは、接続詞又は句読点によシ区分られた構
文的役割子列パターンの前に位置する接続詞(以下先行
接続詞という)の4文的役割子が「AND、0亀BUT
 又は接続詞が無い(φ)」ときで、且つ上記構文的役
割子列パターンが[主語(8UBJ)十中心1ha−5
(GOV ) j ノ場&には、このパターンをまとめ
て新たな親ノードを形成し、この親ノードのカテゴリー
として「文(S)」、親ノードの構文的役割子として文
章が完成したことを表わす[5ENTJ、文のタイプと
しては中心動詞(GOV)のタイプ膏号(す)たとえば
[TYPIJを付与すべきことt示している。節、文の
タイプは、その節や文を支配している動詞(中心動詞(
GOV))のタイプと同じく定められる。動詞のタイプ
番号と例とについては表1■に示した。
同様に項番2は、親ノードのカテゴリーが[文(8)J
m構文的役割子文が完成したことt−表わす「8ENT
Jそして、文のタイプとしては、中心動詞(G(1)の
タイプ番号(φ)たとえばrTYP2Jなる場合の、子
ノードの構文的役割子列t−表わす。
項番4は、接続詞又は句読点までの4文的役割子列のパ
ターンが「TO不不定酸型中心動詞(TOGOV)J 
+ 「TO不不定酸型目的語」の場合でろって、そのパ
ターンに先行するノードの4文的役割子が[中心1hp
j <GOV ) J又はrINGmの中心stb、i
oI (INGGoV) Jの場a1そのパターンをま
とめて親ノードとし、その親ノードのカテゴリー’ir
4節(Q)J、構文的役割子を「目的語(OBJ N 
、単節のタイプとしては中心動詞(TOGOV)のタイ
プ前号(す)、たとえばrTYP6J t−付与すべき
ことを示している。
項番6は、区切られたノード列の構文的役割子タリのパ
ターンが「主語(8UBJ)十中心1jh詞(GOV)
+4a(COMP)J ”1つて、そのパターンに先行
するノードの構文的役割子が[ADIF(副詞節を導び
<IF)Jでろる場合、このパターンをまとめて親ノー
ドを形JRし、その親ノードにカテゴリーとしてr# 
(、C)J 、411文的役割子として「CApy(c
lauaual adverb)J、節のタイプとして
は中心動詞(GOV)のタイプ番号(す)、九とえばr
TYP2J ’!r付与すべきことを示している。
再び第19図の説明に戻り、ステップ1107で行われ
る処理を具体的に述べる。第20図に示す英文テキスト
の場合、ノードN8α)、Nl2(2)。
NS(3)の4文的役割子列のパターンは、弔80図の
項IF3のパターンと一致する。従ってこれらのノード
NS値)、NS(2)、NS(3)をまとめて新しい親
ノードN8(27)が形成され、米11のエリアに格納
される。又米13のエリアにはカテゴリーが文であるこ
と金示す情報が格納され、米14のエリアには文のタイ
プTYP7が、米15のエリアには親ノードは文が完成
していることtpわす構文的役割子5ENTが格納され
る。
同様にノードN8(22)、NS(24)の構文的役割
子列のパターンは第80図の項番4のパターンと一致し
、新たに親ノードN8(28)が作られる。この親ノー
ドN8(28)には、カテゴリーとして単節、単節のタ
イプはTYP6%傅文的役副文的役割子(OBJ )が
付与される。
さらに、ノードN 5(8)、  N 8(9)、 N
8 (28)の構文的役割子列のパターンが第80図の
JJQ査3のパターンと一致することが検出され上述と
同様に、新たな親ノードN5(29)がつくられ検索の
P?i釆得られたT#報がその親ノードN8(29)の
谷エリアに格納される。
このようにしてステップ1107では、構文的役割子列
から文、節又は単節が検出され、節パターンに新たなノ
ード前号全付与する。ここでは詳しく説明しないが、新
しい親ノードが生成された場合は前に説明した手順と同
様にして、切要素列テーブル405の子ノードを消去し
、その代りに新しく生成された親ノードを置き代える処
理が行われる。この場合親ノードには子ノードへのポイ
ンタの情報が格納される。従ってステップ1107の終
了し九時点において句賛素列テーブル405におけるノ
ードの配列は、順にN8(27)、N8(21)。
N8(6)、N5(29)、N5(25)、N5(26
)。
N8(20)となる。
次にステップ1108に進み、節ノードが副詞節(CA
DV)6るいU形容詞節(CADJ ) となるときに
はこれらに未確定修飾子(PENDM)?付与する処理
が実行される。第20図に示す英文テキストの場合には
副詞節及び形容詞節はないので新たに未確定修飾詞金付
与されるノードはない。
ステップ1109では、接続詞等で区切られるすべての
1文的役割子列パターンについて検索が行われたか否か
判定され、その結果YESの場合には、最後の処理ステ
ップ1110に進む。ここでは、ステップ1107の処
理の結果得らnた節パターンが、予め定められた骨格パ
ターンと一致するかどうか判定し、一致した場合には新
しいノードが生成される。この判定には第8(ロ)図に
示す骨格パターンテーブルが用いられる。同図の記号と
第20囚図のメモリエリアに格納される↑#報との対応
関係は第20(6)図に示されている。
すなわち、第20@図は、1つのノードに対応して1つ
定まる。第20[F])図は第20囚図中の1列分(米
11〜米15に1つずつ縦に並べ友もの)の省略化表記
法である。
第20@図中の米14には、単語、句I!累の品詞、ま
たは、節、$4、文のタイプ信号が格納される。
第20(6)図中の*−15には4文的役割子が格納さ
れる。
第20@区中の左肩の添字米13にはノードのカテゴリ
ー(W、P、Q、S)が格納される。
第20(6)図中の米16の分岐表現は、本ノードに属
する子供ノードへのポインタを表現している。
これは第20(A)図中の米12の部分に格納されてい
る情報に対応している。
第20(6)図中の米17の波線表現は、副詞句・節や
形容開切・節の依存・修飾関係を表現する。
すなわち波線型矢印の尾部にめるノードが、矢印の頭部
にあるノードを修飾することを表現する。
項81は、「カテゴリーがII(C)となっているノー
ド」の前後がφの場合(ノードが無い場合)、つまシ未
確定修飾子を付与したノードを除き、節パターンが1個
しかないときは、そのカテゴリー(*13)を文(S)
に変換すると共に、テーブルの米15のエリアには文が
完成していることを示す4文的役割子(SENT)i格
納すべきことを示している。
項番2は、カテゴリーが文(8)となっているノードの
次に構文的役割子が句読点(DEL)となっているノー
ド、その次にAND、BUT、(JR等を4文的役割子
としてもっノード、その次にカテゴリーが文(S)とな
っているノード、その次に句読点(L)EL)t−m文
的役割子としてもっノードのようなノードのパターンが
検出さnたときには、これらをまとめて新しいノードを
生成し、その新しいノードのカテゴリー(米13)には
文(S)、米14のエリアにil″lt、!を文である
ことを示すtWll(COMPD)米15のエリアには
文章として完成していることヲ衣ゎす4文的役割子5E
NTt格納すべきことを示している。
さて、g20(A)図に示す英文テキストの場合、未確
定疹峰子のノード′fr:除くノード列N5(27)。
N8(6)、 N8(7)、N5(29)、N5(20
)Oパターンは第8O図の項番2のパターンと一致する
ことが慣用される。従ってこれらのノード列tまとめて
新しいノードN5(30)k生成し、その谷エリア米1
3.米14.米15に新しい1肯報が書き込まれる。
かくして、第20囚図に示す英文テキストは、未確定1
1m子を付与したノード倉除くすべてのノードが単一の
ノードN5(30)にまとめられたことになる、このノ
ードN5(30)は1つの英文型骨格パターンと呼ばれ
る。
(7)  依存・修飾関係認識 依存・修飾関係認識とは、前述の英文型パターン認識の
段階で、構文的役割子として未確定−飾子(PENDM
) t−付与されたノードが、どのノードの半語、句、
節等をl!!而しているのかを認識、決定する処理をい
う。
第21図は依存・疹篩関係g碌の処理手順を示す、ステ
ップ1120では、ノードNS(りが、構文的役割子と
して未確定1i!飾子(PENDM)t−待つものかど
うか判定される。この判定の結果、YB2であればステ
ップ1121に進み、依存・修飾関係のga処理が実行
される。−万、NOの場合には、ステップ1122に進
み、すべてのノードについてステップ1120のも理が
1−了したかどうか判定される。もちろん、これが完了
していない場合にはステップ1120にもどり、同様の
も理が繰シ返される。
js20囚図に示したテキストを例にとって説明すると
、この英文の場合、ノードN8 (21)、 N8(2
5) 、 N8 (26)が、ステップ1120の処理
の結果、修飾光未決定と判定される。これらのノードの
II峰先は、辞書メモリ300(第3図参照)に格納さ
れた依存・修飾関係認識用テーブルを参照して決定され
る。
表2は依存・修飾関係認識用テーブルの一犬施例を示す
。同図の項番1は、ノードN8(りに関する条件として
、カテゴリーが単語(W)、切要素(P)、単節(Q)
、節(C)のいずれかであって、その品詞が副詞(AD
V)で且つ、そのノードが文頭にるるか或いはそのノー
ドの前に句読点(COM)がおる場合には、そのノード
の構文的役割子として副詞的修飾子(ADVAL)を付
与し、且の蕾号の最も若いノードで構文的役割子が5E
NTなるノードt′疹師すべきことを意味している0項
番2,3,4.5についてもそれぞれ表に記載されたよ
うに、ノードNS(りに関する条件と、そのノードNS
(りが廖飾をする相手先のノード査号及びN8Cりに付
与される構文的役割子との関係が予め定められている。
第20(A)図に示した英文テキストのノードN8(2
5)について考えると、このノードの品詞は前置詞(P
)LENAL)であり、且つ七〇ノードの直面に名詞(
N)のノードがないから戒2の項番5の規則が適用され
る。従って、修飾光のノードは、品詞が動詞族で且つノ
ード着呼が25より小さい範曲で一番大きいものである
から、結N86%ノードN8(24)ということになる
。そして上記ノードN8(25)O−文的役割子はAD
VAL、!:nる。
同様にノードN5(26)についても表20項#5の規
則が適当され、−両光のノードはNS(22)、構文的
役割子はADVALとなる。
ノードN8(21)について適用される規則は、表2で
は省略されているが同様の考え方に従って、ノードN8
(2)を廖飾することが最終的に決定される。第20(
A)図においてローl−N−9図の表示は、αのノード
がβのノードを修飾していることを示している。
以上のs飾・依存関係の処理により、ノード関の関係が
すべて定まり、ノード列から遊心し九ノードは黒くなる
(8)文型変換 文型変換とは、ノードの配列の順番を英文型パターンか
ら和文型パターンに変換することをいう。
第22図は上記文型変換の処理の流れを示す。
1−jステップ1130において切要素列テーブルに最
終的に残っているノード、つまりカテゴリーがS%構文
的役割子が5ENTなるノードを検出し、そのノード前
号をkとする。第20■図に示し友英文テキストの場合
にはノードN8(30)がRk終的に生成された単一の
ノードでろり、従ってこのノードがNS(k)と表わさ
れる。
次にステップ1131において、ノードNS(ト))の
子ノード列の並びを読み出し、そのノード番号列を句i
!素列テーブルにセットする。この場合、ノードN5(
k)は子ノード番号列のセットの直前に消しておく、第
20(4)図の英文テキストの場合、ノー・ドN8(3
0)の子ノード列は、NS(27ン、NS(6λNS(
η、 NS (29)、 NS (2G)でめるからそ
れらのノード着呼27,6,7,29.20がこの順番
に切要素列テーブルにセットされる。ここでは句安素列
テーブルに並べられる番号の1r!A数をm個と仮足す
る。
更にステップ1132において、ノードN5(6)の子
ノード列を作業用メモリ400内の英文型ノード列バッ
ファエリア406にセットする。
ステップ1133においては、辞書メモリ300内の文
型変換パターンテーブル307を191索し、上記のバ
ッファエリア406にセットされた子ノード列の4文的
役割子の並びと一致する英文型パターンをみつける。上
記文型パターンテーブルの一例は表3に示されており、
その内容については後述する。
ステップ1134では、一致した英文型ノ(ターンに対
応する和文型パターン全文型)(ターンテーブルよシ読
み出し、作業用メモリ400内に設けられ次和文ノード
列バッファエリア407にセットする。
表3の文型パターンテーブルは、英゛文型)くターン金
和文型パターンに変換するときの変換規則を示している
0項I11は、英文テキストの親ノードの構文的役割子
が文(8ENT)でアリ、その子ノード列が8ENT、
DEL、BUT、5ENT の場合は、和文屋パターン
における構文的役割子の並びは8ENT、 @、’、B
UT、8ENTになることを意味している0項番3は、
親ノードのカテゴリーが文(8)又は節(C)でろって
子ノード列の構文的役割子が、主m(S(JB)、中心
動詞(GOV)、TO4−伴つ目的=tj (T(JO
BJ )ノ順に並んでいた場合には、和文型ノ(ターン
は8LJBJ。
TOOBJ、GOVの順に構文的役割子が並びかえら構
文的役割子は5ENT DEL BUT 5ENT で
おるから表3のJAAl1英文型パターンと一致し、従
ってステップ1133の処理により項番lに示され次相
文型パターンに変換さルる。
第22図のB5L明に戻り、ステップ1134において
は上記のステップ1133の処理によシ得られた和文W
パターン倉、和文ノード列バッファエリア407のノー
ドJN(1)にセットする。第23図は英文型ノード列
バッファエリア406の内容が、文型変換されて和文型
ノード列バッファエリア407に4納された状態ヲ示し
ている。
矢にステップ1135では、和文型ノード列テーブルJ
N(イ)内のノードのうち、自己のノードラ原動してい
るノードがあるかどうか判定し、その結果1める”場合
は、ステップ1136に、1ない”場合はステップ11
37に進む。第20(至)図のテキストの場合、ノード
N8(27)及びN8(29)については自己のノード
(又は自己のノードの子ノード)を疹4するノードが必
るのでステップ1136に進む。
ステップ1136においては1−飾するノードJk疹飾
されているノードの直前に割り込ませて和文型ノード列
テーブルJN(4’il@換える逃埋が行われる。(第
23図) 一万、ステップ1137では、1t−ノードN8(k)
の和文テーブルポインタにセットする処理が行われ、さ
らにt=:=t+1.t=iとした後、ステップ113
8の判定が行われる。このステップ1138では、句賛
素テーブル内でilI目にあるノードのノード番号t−
nlとするとき、ノードN8 (n s )のカテゴリ
ーが切要素(P)または語(W)かどうか判定される。
第20図のテキストの場汗、ノードN8(30)におけ
る子ノード列のうち、[着目(i=1)のノードはN8
(27)で69、このノードのカテゴリーは文(8)で
あるからステップ1138の判定結果は1NO#となり
ステップ1141の処理に進む。
上記ステップ1141ではノードN8(n+ )の千ノ
ード列の並びkfiみ出し、′QJ要素要素ノー1−テ
ーブル内、と置換する処理が行われる。従ってこれによ
りmも当然増加することになる。そして読み出されたN
S(nt )の子ノード列は前述の英文型ノード列バッ
ファエリア406(第23図)にセットされる。J20
(1%)図のテキストの横片、ノードN5(27)の子
ノードはNSα)、NS(2)、NS(3)でろるから
、上記英文型ノード列バッファエリア406のノードE
N(1)、EN(2)、EN(3)に、それらのノード
のJ1文的役割子でめる5(JBJ、 G<JV。
OBJがセットされることになる。
とのち埋の後、再びステップ1133の処理に戻シ、再
び文型バター7テーブル(諌3)の検索が行われる。英
文型ノード列バッファエリア406に耕たニセットされ
fF、5UBJ、 GUY、 OBJ On構文的役割
子配ダUは、表3の項着2の英文パターンと一致するか
ら、これと対応する和文型パター/、ツl F) 8U
BJ、 OBJ、 GUYに変換サレ、和文型ノード列
バッファエリア407のJN(2)にセットされる。更
にステップ1135では前述と同速にJN(2)のエリ
アにセットされたノードのうち自己のノード1に疹峰し
ているものがるるかどうか判定される。
この結果、ノードN5(2)、GOVを114している
ノードがあることが分かる。従って−4しているノード
N8(21)(7)m文的役割子ADVAI、 (先に
PENDM からADVALKKIi18nている) 
がGUVの直前に割シ込ませてJN(2)のエリアの構
文的役割子列金並びかえる処理が行われる。(ステップ
1136)従って最終的にJN(2)のエリアにセット
される4文的役割子列id 5UBJ、 OBJ、 A
DVAL。
aovの1@番になる。(第23図) 以上のようにしてノードN5(3G)の最初(1;l)
のノードN5(27)の処理が終ると、次の子ノードN
8(6)の処理に移る。このノードN 8 (6)のカ
テゴリーは語(W)であるから、ステップ1138の判
定の結果”YB2”となシ、i == 1+lとされる
。つまり次の子ノードN S (7)の処理に進む。
このノードN8(ηのカテゴリーも語(W)であるので
i−i+lとされ、次の子ノードN8(29)の処理に
進む、ノー)’N8(29)は構文的役割子が文(8E
NT)でめるから、その子ノードタIIN 8((至)
NS(9)、 NS(28)の構文的役割子が英文型ノ
ード列バッファにセットされ、再び文型パターンテーブ
ルの横木が行われる(ステップ1134)。こうして沌
文型パターンが見出され、4P、的に和文型ノードバッ
ファ407のエリアJN(3)に第23図に示す和文パ
ターンがセットされることになる。
以上述べ九ようにしてノードN8(ト))(第20Q図
のテキストではに=30)の全ての子ノードについて文
型変換の処理が終了すると、ステップ口10に進む。ス
テップ1140では切要素列テーブルの内Wtすべて消
去し、査gkt−セットしておく、こうしてノードN5
(k)の文型変換処理が終了する。
(9)和文生成 和文生成とは、和文型パターンを形成するノードに訳語
全付与することにより、和文を生成する処理tいう。
第24(至)図及び第24(2)図は和文生成の処理の
流れを示す。
ステップ1150において、切要素テーブル内に4終的
に生成され比率−のノード、つまりカテゴリーが8%−
文的役割子が5ENTのノードを検出し1そのノード番
号′kkとする0次にステップ1151において、゛ノ
ードN8(k)i硝酸する英文パターンを文型変換処理
することにより得らnた和文パターンを格納する和文型
バッファテーブルへのポインタtを検出する。そして和
文型バッファテーブルJN(イ)内に設定されたノード
列fr読み出し、そのノード番号列を切要素列テーブル
に設定する。第20囚図のテキストの場合には、文型変
換によシ、k;30、ノート”NS (30)中の和文
型バッファテーブルへのポインタtはt−1となってい
る。そして和文型バッファ407のエリアJN(1)K
/−)’N80f号とL’C(27)、(6)。
(η、(29)、(20)が格納されているので、この
前号列が句4素列テーブルにセットされる。
説明の便宜上、切要素列テーブルにセラ)され九ノード
番号の1数km11!、そして、セットされ九ノード番
号列t”+e”xm・・・、n、とする。
次にステップ1152においては、句挟素列テーブル内
でl@目に6るノード番号をn−とするとき、ノードN
8(nl )のカテゴリーはP又はWが否か判定される
。第23図のバッファエリアJN(1)のIIIL初(
i=−1)のノード信号は27でろり、ノードN5(2
7,)のカテゴリーは5ENTでろるから上記の判定結
果は”NO”であり、従ってステップ1154の処理に
進む。
ステップ1154においては、ノードN8(nl)中の
和文型バッファテーブルへのポインタの値ttとする。
そして和文型ノード列テーブルJN(/、1内にらるノ
ード列を読み出し、切要素列テーブル内のn、と入れ替
える。これによ[mの直も当然増加する。
すなわち第23図の例では、NS(nt)=NS (n
、 )−NS (27)  でl、NS(27)中のポ
インタtはt=2でろる。そこでバッファエリアJN(
4)つまシJN(2)に格納されたノード列(1)、 
(3)。
(21)が絖み出され、切要素列テーブルにセットされ
次ノード信号(27)と入れ換えられる。
この結果句要素列テーブル内のノード信号の配列は% 
(1)、 (3)、  (21)、(2)、(6)、(
7)、  (29)。
(20)に変わる。従ってmも51固から8−に変わる
ことになる。この処理の後、再びステップ1152にも
どる。そして耕たに配列され九ノード列の最初(i=1
)のノードN5(1)のカテゴリーが句Ji!素(P)
または語(W)か否か判定さ扛る。
ノードN8(1)のカテゴリーは語(W)でりるから、
上記の判定結果は″YES”となシ、S=+Xと置かれ
、1〉mかどうか判定され(ステップ1153)た後、
再びステップ1152の処理にもどる。
以上述べた処理金繰シ返すことによって、切要素列テー
ブルには5g25図に示すようにノード着号がα)s 
(3)、  (21)、、(2)、 (6)、 (7)
、 (9)、 (26)。
(25)、(24)、(22)、(20)の順に格納さ
れる。これまでの処理によシ入力英文テキストが日本語
固有の語順に変換されたことになる。
次にステップ1155に進み、切要素列テーブル内の直
着目のノード着号tn+とする。セしてノードN8(I
ll )に関するT#mt格納しであるワードストリー
ムテーブル403のエリア(第14囚図)tdl索し、
更にワードレコードに関する。*mt格納しである単語
・4Mメモリバッファメモリエリア401(第10図)
を検索することによシ、該ノードN5(il+ )の日
本語としての訳語全付与する。
例えば5g25図のi=lのエリアに格納されているノ
ード着号(1)の訳語全付与する4オには、ポインタに
よシまずワードストリームテーブル403のエリアw 
s (1)の′r# 4を検索し、更にW S (1)
に格納されているポインタによル、単語・連語バッファ
メモリ401のエリアW B (1)の情報が検索され
る。このエリアW B (1)には、ノードN S (
1)の単語@HE”の訳語が格納されているのでこの訳
謙情at−読み出す訳である。他のノードについても各
ノードに対応するワードストリームテーブルへのポイン
タを、更に単語・遅−パックアメモリへのボイ/りtた
どることによシ訳−を読み出すことができる。
次にステップ1156に進み、訳語に対して、時制障腿
衆現処理が必要か否か判定さnる。この時制謙!M表現
処理とは、動詞句の場合に、文型・肯定・否定・受身・
時制によりその訳語が変化することに対応する適切な訳
語を得るための処理である。し友がって時制様4戒現が
必安か否かの判定は、該尚ノードがIdJ811句に対
応するものかどうかによって判定される。換言すれば、
ステップ1156ではノードN5(nl)の消又的役割
子がGOV、 TOGOV、 TOOBJ等で6るか否
か調べ、もしそうでろnば、時制体感表現処理の必要あ
りと判断する。
動詞句の訳の生成については、そのm−句が、(a) 
 助動詞を含む場合 −) 助動詞を含まない場合 02つに分けて処理される。この処理の流れを第248
図に示す。
まずステップ1170においては、ノードN8(−)に
属している動詞句を解析して、−駅処理装置200中の
レジスタ(図示省略)に4つの7ラグQ、N、8.Tt
−下d己のようにセットする。
つまC1Qは動詞句の文型、NはW定、否定の区分、S
は11ヒ動、受動の区分、Tは時制によりそれぞれ0ま
たはlの1直がセットさnる。
次にステップ1171に移り、ノードN8(ΩI)の子
供ノード遍の中に、品詞として助動詞(A(JX )を
待つものがるるかないか調べる。あればYB2としてス
テップ1173に移り、無ければNOとしてステップ1
172に移る。ここでは、筐ずNOの場合、つt9上記
の(b)の場合について説明する。
ステップ1172では、翻訳処理装[41200中のレ
ジスタから4つの7ラグQ、N、8.Tの+[t”絖み
出し、そして、辞書メモリ300の和文生成用パターン
メモリエリア308に格納され九「語尾決定用テーブル
」と比較照合することにより、活用語尾と付加語尾とを
決定する。決定された語尾は翻訳処理装置200中のレ
ジスタに−Q記憶しておく、「語尾決定用テーブル」の
−犬施例の一部t−fi4に示す。表4では、Q=00
とき肯定文、Q=1のとき鍵閲文、N=00とき肯定形
、N=1のとき否定形、5=00とき能動形、S;1の
とき受動形、T=00とき現在形、T=1のとき過去形
を示す。
表   4 たとえば、次4の唄査1は、文章が肯定文(Q=0)で
、動詞句が肯定形(N=0)、能動形(S=O)、かつ
、時制が過去形(T=1)の場合、動詞句の訳文は、動
詞の連用形の後に1次1を付加すべきことを示している
以下、具体例について、語尾決定の処理を述べる。
たとえば、ノードN5(nt )に属する動詞句(ただ
しアンダーライン部分のみ)が@I 5TUDIEDE
NGLI8H”でめる場合、第24囚図のステップ11
55によシ単語辞書(第4@図参照)から訳語1勉強1
が取9出され、かつま九−尾活用は“すf(す行変格活
用)”でろるという情報が取〕出される。これらの訳語
・活用1′#報は、翻訳処理装置1200中のレジスタ
に一時セットされる。
次にステップ1156において、動詞句でろるためYE
Sと判定されてステップ1157へ移る。ステップ11
57は、すなわち第24(0図でろる。第24(0図の
ステップ117Gによ#)4つの7ラグQ=0(肯定文
)% N=0 (肯定形)% S=0 (能動形)、T
=1 (過去形)が翻訳処理装置200中のレジスタに
セットされる。
助IIh詞(AUX)はないので、ステップ1171で
はNOと判断され、ステップ1172に移る。
ステップ1172では、第3図中の和文生成用パターン
メモリエリア308に格納されている「語尾活用テーブ
ル(44)J’に検索する。すると(Q、N、8.T)
のパターンは、項mlと一致するので、項#rlの訳出
指示の「連用+た」が検索される。−万、既に、翻訳処
理装[11200中のレジスタには、(訳語、活用)情
報として(勉強、す変)があるため、′す変の連用形+
た”、つまシ1した”なる語尾が“勉強”という訳語に
付加されて、′勉強し九”という語尾性の訳語が決定さ
れる。
次にステップ1173に移った場汗、つまりノードN8
(n+ )の子供ノード達の中に品詞として助動詞(A
UX)’に持つものかロシ、ステップ1171でYB2
と判断された場合、つまシ削述の−)の場合について説
明する。
ステップ1173では、まず、?#畜メモリ300の和
文生成用パターンメモリエリア308(43図参照)に
格納されている「助lIb詞細分類テーブル」倉比収δ
照しつつ、ノードN8(fit )に属している!g!
I8A句中の助動詞の分類コードを決定する。
この決定された分類コードは一時、@駅処理装置200
中のレジスタに記憶される。「助動詞細分類テーブル」
の一実施例の一部分を表5に示す。
表5の説明については後述する。
次にステップ1174に移る。このステップでは既に、
ステップ1170で決定されている「(Q。
N、S、T)フラグ1青報」と、ステップ1173で決
定され九「助動詞分類コード情報」全読み出し、セして
辞畜メモリ300の和文生成用パターンメモリエリア3
08(5g3図参照)に格納されている「助動詞全考慮
した祷尾決定用テーブル」と金地・は参照することによ
)活用語尾と付加語尾を決定する。決定された語尾は、
翻訳処理装置200中のレジスタに一時記憶しておく。
「助動詞を考慮し九語尾決定用テーブル」の一実施例の
一部分を表6に示す。表6の説明は後述する。
次に表5の解釈の仕方を説明する。
( 同表の縦軸には細分類された助動詞が列挙されており、
横軸にa時制として原形、過去、過去分詞(pp) s
進行形(jng)・・・等が列挙されている。
L)01.CAI、CA2.・・・、MAI、MA2゜
・・・等は助動詞分類コードである。
ノードN8 (nl)に属する動詞句を分析して、同表
の縦軸と横軸の入り口(エン) リ−)を見つけて、分
類コードを読享出すのである。
たとえば項番9と列番7の交叉する部分については、助
動開切か、「5hould have+V(pp)(過
去分詞型の動詞)」の形で出現している場合には、分類
コードとして、8D4が検索決定されることを示してい
る。
次に表6の解釈の仕方について説明する。
表6の縦軸には、助d詞の分類コードが列すされて&シ
、横軸には、動詞句の肯定、否定、疑問などの区別が既
述の(Q、N、S)フラグの1ま几はOの1直によシ列
挙されている。ノードN8 (fit )に属する動詞
句を解析して得られる(Q。
N、S)フラグ1直と、助動詞分類コードとt入シロ(
エントリー)として、活用佃尾と何刀口語尾とに選択決
定するのでめる。
以下具体例について助動詞を増殖した語尾決定の列を述
べる。たとえばノードNS (flt )に属する動詞
句(九だしアンダーライン部分のみ)が、@you 5
hould have taken hjs opjn
ムon jnto consj −d酊atton ”
でめる鳩首、第24囚図のステップ1155にニジ、連
語辞1iF(第50図参照ンから訳##”、/Nを考慮
”がJ4g#)出され、かつまた語尾活用は1す変(f
行変格活用)”でるるという1#報が取り出される。こ
nらの連語・活用1#報は、翻訳処理装置1l1200
中のレジスタに一時セットされる。次にステップ115
6において、動詞句でろるためYESと判定され、ステ
ップ1157へ進む。
ステップ1157は、すなわち第240図である。
第240図のステップ1170により4つのフラグ、Q
=0(肯定文)%N=O(剪定形)、5=O(能動形)
、T=米(七ッ卜せず)が、a駅処理装置1200中の
レジスタにセットされる。次にステップ1171に移る
が、助動l80I(ALJX)が存在するので、ステッ
プ1171では、YESと判断され、ステップ1173
に移る。ステップ1173では、第3図中の和文生成用
パターンメモリエリア308に格納されている「助動詞
細分類テーブル(表5)」全検索し、項番9と列番7の
交叉するところのコード”SD4”を横木し、翻訳処!
t装置20G中のレジスタにセットする。
次にステップ1174に移る。このステップでは、辞誓
メモリ300の和文生成用パターンメモリエリア308
(83図−照)に格納されている「助IIJ詞を考イし
九語尾決定用テーブル(表6)」の比較参照がおこなわ
れる。既に、ステップ1170によム ”Q−0,N−
0,S=0’なるフラグ1直がセットされている九め、
表6の列番lのエントリーが選択される。’tfc、既
にステップ1173により、助1Ibp1分類コード@
SD4’がセットされているため、表6の項一1124
の工/トリーが選択される。したがって%弐6からは語
尾情報としては、’CM止)べきであった”が選択決定
される。この決定結果と、既にステップ1155によp
検索されていた。訳鹸fW報1゜/Nを考慮(?変)”
とが、照合処理されて、′、’Nを考慮するべ龜で6っ
た”という語尾付きの訳語が決定される。
なお1.7Nについてf@、 @hts opinio
n’に対応するノードに対する和文生成処理により。
彼の意見”という訳語が纏め込まれることはもちろんで
める。
以上d98シた時制・様態表現処理の実行が終了すると
、譲24(a)図のステップ1158の石塊に進む。こ
のステップ1158では、訳語に対して付−一(て、に
、を、は)を付加する処理が必要か否かを判定して、必
蒙な礪曾はステップ1159に進む、この判定は該当す
るノードN8(n*)の禰文的役割子が、主ffI族(
5UBJ 、 CLUB、 TO8OB4)撚るいは目
的語族(OBJ 、 TOOBJ 、 l0BJ。
C0BJIでろる場貧にYES、そうでない場合にNo
とすることにより行われる。ここで8UBJは主1!i
、c8UBは「#の形をし友主語」。
TOi9UBJは「TO不定詞型の王、tliiJt−
それぞれ意味し、OBJは目的語、 TOOBJはrT
O不定1i1j!ilの目的語J、l0BJは「間接目
的語」。
C0IIJは「節の形をした目的語」をそれぞれ意味す
る記号でめる。
ステップ1159における付属−付加46理を戎3の項
*2t−例にとって飢明する。
1jil12の和文型パター7は、8UBJ・、 OB
J 。
GOvでめるが、この場合、ます8UBJの次に(組回
し、OBJの次に(かQ  の付agg紀号が挿入され
る0次に、各付属語m1号に対応し丸竹ismが割り当
てられる。このgg当てに際して。
和文生成用テーブル308に格納された付msテーブル
が参照される。
表7は付JIK#テーブルの一例を示すもので、付14
B己号がぐJ〕し のときは、N属語として1は”およ
び1が”をとり得ることを示し、ぐ巧刀し のときは、
@″を”νよび1に”をとり得ることを示している。
表 7 付属1.11記号が単一の付114語をとp傅る礪曾は
付属語がそのまま付属語記号に置拳換えられる。
上記のように付属a Mr2号が2個以上の付属語をと
り得る場合は、仄のようにして、単一の1t114語が
選択される。
まず(部]しのm盆は、当践ノード(II文的役割子が
5ENTQもの)が他のノードt−疹飾する4酋には1
が”が付与され、その他の場合には1は”が付与される
一方eについては、lIb−の訳語清報に、@に”tと
り得るというフラグがセットされていれば(第4(A)
図の付禰語愼、1し語の禰にセットされている)、′に
’を付与し、その池の場合には1を”全付与する。この
結果、たとえば鳴resemi)jc”は1〜に似る1
と訳され、”5tudy”は1〜1に勉強する”のよう
に訳される。
このようにしてfjs語付刀口処理が終了すると、ステ
ップ1160に進む。ここでは、ノードN8(n+ )
に対して最終的に得られ之訳語全出力テ中ストテーブル
エリア408に左づめにセットする処理が行われる。そ
の後、ステップ1161に進み1〉mの関係′It′f
t足するまで、上述の処理が繰9返して実行される。
第26図は和文生成処理の結果、出力テキストテーブル
エリア408に得られる訳文を示している。すなわち、
米20で示した和文型ノード列エリア407の各ノード
に訳語が付与され、出力テキストテーブルエリア408
には米21で示す訳語が得られる。
以上、本発明方式の実施例について説明したが、この方
式によれば下記のような幼果が得らnる。
(1)  辞書検索の段層で、単語の語尾が時制、複数
形などによシ変化している場合に、原形にもどした後に
辞誓引きを行っているので、辞書に用意する単語の叔を
着しく低減することができる。
(2)単語辞曹と迩坩辞書とが用意され、単語辞書にお
ける各単語の情報として、その単語をもとにして形成さ
れる連語の有無と、逐語辞書へのポインタの情報が含ま
れているので、単語を切出しながら同時に連語も切出す
ことができる。
(3)テギスト入力後、単語及び逐語辞書の内容と同じ
情報を一旦、高速アクセス可能なバッファメモリにとシ
込んでいるので、後の処理における辞iIF+jIt索
を高速に行い得る。
(4)逐語辞書として固定連語辞書の他に可変4語辞誉
を有し、切要素切出しの後に可変連語辞書の検索を行っ
ているので、あらゆるイデオムの検出が、少ない辞書容
量で可能になる。
(5)  品詞認識処理が、文型パターン認識の処理の
前に完了してしまうので、文型パターンの変更増補と、
品詞認識用規則の変更・増補と独立に設計することがで
きる。
(6)単語及び連語の品詞の認識に、禁制品詞列パター
ンを用い、更に必要に応じて優先度テーブルを用いてい
るので、認繊処理τ迅速且つ正確に実行できる。
(7)  従来の英文法における句とは異なる概念の「
句4素」會定議し、入力英文テキスト?「切要素」の単
位で切出し、切要素品詞列を形成し*&、fiパターン
をつくっているので、骨格パターンの形成に至る処理及
び和文生成の処理が容易になる。従来の英文法における
句の概念では、名詞句を含む名詞句、名詞句を含むlI
J:J開切などが6勺、句の切出しが困峻である。
(8)英文の骨格パターンを形成するのに構文的役割子
の概念r導入し、切要素品詞列倉構文的役割子列に変換
した後に節、4#を検出し、更に節、単節から文の骨格
パターン全形成しているので、慎雑な英文に対しても谷
易且つ正確に、檎々のパターン設定、変更がoT能であ
る。
(9)英文の文型パターンを認識する場合において、句
焚累tm下ノーにおき、中間に準節、節ノード、頂点部
に文ノードを持つような簡明な階層構造を採用している
ため、入力d語の文4(英文型)から、出力言語の文型
(和文型)への変換が、「率なる兄弟ノード間の線型並
べかえ」という形式で簡略に実現できる。従来のように
、入力言#解析本から出カー語解析木への本構造変換(
Treetransduce )という複雑な処理を回
避することができる。ま九文型変換規則の変換も容易と
なる。
(10構文的役割子の定まらない切要素に対し、修飾先
倉定めるための依存1−腫関係のgR処理を行っている
ので、複雑なIl師関係をもつ文章の翻訳も町FiF、
になる。又、骨格パターンは、形容詞、−詞のように相
手を修飾する構文的役割子をもつもの′に除いた句g!
索によシ傳成されるのでその骨格パターンの種類があま
り多くならない。
114語付刀口処理をよむので、正確な翻訳が可能にな
る。
@ 和文生成の処理に2いて、時制様悪逸理は、構文的
役割子として中心動詞族(UOV族)を持りノード次け
、付属語付力ロ処理は、構文的役割子として主語、目的
語族(S(JBJ族、OB J族)金持つノードだけ、
のように#l限されている沈め、これらの処理が簡略化
されると同時に修正、変換が容易になる。
0 人力英文の解析、文型の変換、&よび出力和文の生
成等の過程における翻訳規則がナベてパターンメモリ内
のテーブルの形で記述され、翻訳処理装置は、これらの
テーブルを解釈実行するように設計されている。従って
翻訳規則の変更%湯止、補強などが、率なるパターンメ
モリ内部の情報の誓換えのみで簡単に、翻訳処理装置と
は独立に実行できる。
【図面の簡単な説明】
5gl囚図、第1(B)図は従来の翻訳方法の説明図、
第3図は本発明の自動翻訳方式の燐或図、第4囚図、第
4(B)図は本発明方式に用いらnる単語辞書の一例上
水す図、第5(至)図、第5(2)図は本発明方式に用
いられる固定連語辞書の一例上水す図、第50図は本発
明方式に用いられる可変連語辞書の一列を示す凶、第6
(A)図は本発明方式の品詞認識に用いられる禁制品詞
列パターンの一例を示す図、第6■図は品詞認識のため
の説明図、第7囚図は本発明方式の句構造認識に用いら
れるパターンの一列を示す図、第8Q図、第8(ト)凶
、第80図、第8(ロ)図は本発明方式の英文型パター
ン1誠に用いられるパターンの一例を示す図、第9図は
入力テキストストリームテーブルの説明図、第10図は
単語・連語バッファメモリの説明図、′第11(A)図
、第11(2)図、第tt(0図は本発明方式の辞書検
索における紛尾変化処理の流れを示す図、第11QJ図
、第11■図は語尾変化処理の説明図、第12図は本発
明方式における辞書検索の九埋の流れを示す一% 5g
13図は本発明方式における品詞認識処理の流れを示す
図、第14囚図、414(ロ)図は本発明方式のワード
ストリームテーブルに格納される1f報の内容倉説明す
るための図、第15図は本発明方式における品詞認識処
理に用いられる凝先度表を示す図、、gia図は本発明
方式における句購遺認識の処理の訛れを示す凶、第17
図は本発明方式のノードスト・リームテーブルに格納さ
れるt#報の内容?説明する九めの図、第18図は本発
明方式の町変遵語辞書検索のも壇の流nを示す図、第1
9図は本発明方式における英文型パターン認識の処理の
流れを示す図、42c1図、第2003)図は切要素列
テーブルに格納される情報の内容t−説明する几めの図
、′igz1図は本発明方式における依存・1参峰関係
認識の処理の流れt示す図、第22図は本発明方式にお
ける文型変換のiA埋の流れを示す因、第23図は英文
型ノード列テーブル及び和文型ノード列テーブルに格納
される慣罐の内容1に:dj;L明するための図、第2
4(転)図、第240図、第240図は本発明方式にお
ける和文生成処理の渡れを示す図、第25図は和文生成
処理の説明図、第26図は和文生成により、入力英文テ
キストに訳文が付与された状態を示す図である。 100・・・入力装置、200・・・−駅処理装置、3
00・・・辞書メモリ、400・・・作業用メモリ、5
00・・・−+1 第1(A)図 Nl’ % /  (B)  ■ −−−j(’e   IL   bug    +’?
t   L   C:tブLNP−J      LF
JP」 AP− Nl’ ′fJz   図 烹3図 1/14<A)図 %  S  (A)  図 ¥i  5  (C)  図 vi6CA)  図 第 6(8)  図 %    7   CA)    図 ¥Ig(B)図 1Fl  ≦?((ン 図 藁  9  図 第 10   図 第 11(1図 あ II  (CJ  図 ¥711+  (幻 図 ′I!313図 ”f、  /4  (A)  図 ¥i   ts   図 ″jfJ16図 ’%  r*  図 ¥5. tq図 第  22  図 ′%  23t4 7 肩 24(A) 図 朋Q58−!4Ub84(39) %za<c>   図 viU図

Claims (1)

  1. 【特許請求の範囲】 1 、 <a)単語又は/及び連語に関する訳語情報及
    び品詞情報を格納した辞誓メモリを検索することにより
    、自然言語で記述された人力テキスト文の単語又は/及
    び述語にそれぞれ品詞を付与する5@1ステツプと、 (b)品詞列の形に変換された入力テキスト文をぼ語的
    意味をもつ最小単位である句要素に分割し、各句要素に
    それぞれ品詞を付与する第2ステツプと1 、  (C)各句要素及び単語・述語に付与された品詞
    の連なシと、予め定められ九品詞列と全比較することに
    よシ、各句要木及び単語・連語に、構文的な役割t−表
    わしている構文的役割子を付与する第3ステツプと、 (d)構文的役割子の配列から、文、節、単節を表わす
    パターンを認識し、入力テキスト文を、これらのバター
    7の組み合わせで表現される骨格パターンに変換する第
    4ステツプと、<e)予め定められた変換規則を適用す
    る仁とによって、骨格パターンを形成している入力6語
    固有の単文、節、単節の配列順序を、出力言語固有の)
    畝序に変換する第5ステツプと、(f)予め定められた
    変換規則を適用することによって%変換後の骨格パター
    ンを形成している単文、節、準i!Jを構成する入力ざ
    語固有の構文的役割子の並び順序を、出力言語固有の構
    文的役割子の並び順序に変換する第6ステツプと。 一変換後の傳文的役割子列のそれぞれに訳語全付与する
    ことによって、出力gdの文を生成する第7ステツプと
    、 を具備することを特徴とする自然言−関の自動翻訳方式
    。 2、第1項記載の方式において、第1ステツプにより単
    語又は/及び連語に付与される品詞が複数個おる場合に
    、禁制される品詞列の75ターンのS類を予め用意して
    おき、該ノ(ターンを参照することにより、多品詞t−
    aする単語及び/又は連語の品詞を厳科的に1個決定す
    ること7に特徴とする自然言語間の自11h翻訳方式。 3、第2項記載の方式において、匣用されるテーブルは
    、品詞の並びが禁止される県側品詞列パターンの池に、
    この禁制が解除される特別の条件を含み、該禁制品詞列
    パターンと県側鱗除条件の両者から単語及び/又は逐語
    の品詞の決定が行われる仁とt−特徴とする自然言語間
    の自動a訳方式。 4、第2項記載の方式において、禁制品詞列パターンは
    、品詞判定すべき単語の前後の41数1固の単語の品詞
    を予め定め九品詞列から形成さILることを特徴とする
    自然言語間の自動翻訳方式。 5、!@1項記載の方式において、第1ステツプにより
    単語及び/又は連語に付与される品詞が複数Imある場
    合に、予め品詞間の優先度を定め九浚先度テーブルを参
    照することによシ、最終的に単語及び/又は連語の品詞
    を1個決定することを特徴とする自然言語間の自動翻訳
    方式。 6、第1項記載の方式において、第1ステツプにより単
    語及び又は逐語に付与される品詞が複数個ある場合に、
    禁制される品詞列のパターンの種類を予め登録したテー
    ブルを参照し、多品詞を有する単語及び/又は連語の中
    で、禁制される品詞を除去し、更に21i!以上の品詞
    が残った場合には、予め品詞間の優先度金定め九優先度
    テーブルを参照することによシ、1&科的に単語及び/
    又は連語の品詞t−1個決定することtW徴とする自然
    画#閾の自動翻訳方式。 7、s1項記畝の方式において、辞書メモリは単一辞書
    メモリと連a辞膏メモリを含み、上記単一辞書は、単語
    の見出し語と率#を基にして形成される連語の有無と、
    単語の訳語及び品詞情報を含み、連語辞書は、連語の見
    出し語と、連語の訳語及び品詞情報を含み、辞着検索の
    処塩は、 (a)人力テキストの単語を切シ出し、該単語の語尾が
    変化している場合はこれを原形に変換するステップと、 (b)原形に変換された単#!を見出し語として、単語
    辞−INFを検索し、該単語を基にして形成される連語
    が存在しない場合には単語の訳語及び品、詞情at−逐
    次、バッファメモリエリアに格納するステップと、 (C)人カテキスト文と一致する連語が仔伍する場合に
    は連語辞#t−検索し、逐語の訳語及び品詞情報を上記
    バッファメモリエリアに格納するステップと、 を具備することを特徴とする自然言語間の自動翻訳方式
    。 8、第7項記載の方式において、連語辞書の検索の結果
    、すてにバッフアメ、モリエリアに格納され友単語を含
    む連語が見出された場合には、該連語の訳語及び品詞情
    報をバッファメモリエリアに格納すると共に、すでに格
    納されている単語清llヲ無効にすることを特徴とする
    自然言語間の自IIJa訳方式。 9、第7項記4a!ρ万式において、入カテキスト文と
    一致する連語が複数1固存在する場合には最も長い連語
    の訳語及び品詞nr*’を上記バッファメモリエリアに
    格納することを待機とする自然d語間の自動翻訳方式。 10、第1項記載の方式にシいて、辞書メモリは、刃要
    素を形成する既知の品詞列パターンと、該刃要素の品詞
    との関係を示すテーブルを有し、第2ステツプは、 (Ji)入力テキスト文の品詞列と、上記辞書メモリの
    品詞列パターンとを比較するステップと、(り上記の比
    較の結果、両品詞列が一致しない場合は単語又は/及び
    連語を1つのノードとし、一致する場合には刃要素を1
    つのノードとして、谷ノードの品詞情報及び単d゛・4
    Mと刃要素との区別を表わす情報を順番にバッファメモ
    リエリアに格納するステップと、t”具備することを特
    徴とする自然言語間の自動翻訳方式。 11・、第1O項記載の方式において、入力テキスト文
    と、(l!数個の品詞列パターンとが一致する場合には
    、最も長い品詞列のパターンを形成する句要素を1つの
    ノードとすることを特徴とする自然言語間の自lIh翻
    訳方式。 12、第1項の方式において、辞書メモリは単語辞書と
    、予め定められたfJi数の単語よシなる固定連語の辞
    書と、予め定められた単語列の一部にブランク+r有し
    、該ブランクに適当な単語、句、又は節を挿入すること
    によって連語が形成される可変連語の辞書と′fr!L
    、上記単語辞書及び固定連給辞書の検索は第1ステツプ
    で行い、可変連語辞書の検索は第2ステツプの後で行う
    ことを待機とする自然言語間の自IIh翻訳万式。 13、第1項記載の方式において、辞書メモリは、動詞
    の単語を含む@後の単語及び句要素の列の品詞列と、そ
    の品詞列をと9得る既知の構文的役割子列との関係を示
    すテーブルを含み、′43ステップは、 (a)入力テキスト文の中で4J詞を検出するステップ
    と、 (b)入力テキストの動詞を含む前後の単語及び句要素
    の列の品詞列と、上記テーブルの品詞列とt比較し、一
    致する4h raにテーブルの品詞列に対応する構文的
    役割子列を上記単語及び句!巣の列に付与するステップ
    と、 全具備することを特徴とする自然言語間の自動翻訳方式
    。 14、第1JA記載の方式において、辞書メモリは、接
    続詞の単語の前後の単語及び句l!索の列のとシ得る既
    知の構文的役割子列と、その接続詞の単語の構文的役割
    子との関係を示すテーブルを含み、第3ステツプは、 (a)入力テキストの中で接続詞をもつ単語を検出する
    ステップと、 (呻接続詞をもつ単語゛の前後の単語及び句l!素の列
    の構文的役割子列と、上記テーブルの構文的役割子列と
    を比較するステップと、(C)比較の結果、両方の構文
    的役割子列が一致する場合には、テーブルの構文的役割
    子列に対応する接続詞の単語の構文的役割子を該単語に
    付与するステップと、 を具備することを%黴とする自然N語間の自動@訳方式
    。 15、第1項記載の方式において、辞書メモリは、紛、
    単節、パターンと、それらのとシ得る構文的役割子列と
    の関係を定義したテーブルを含み、!4ステップは、 (a)入カテキスト文t−接続詞をもつ単語及び句読点
    で区切るステップと、 (b)区切られた区間における4文的役割子の列と、上
    記テーブルの構文的役割子列とを比較するステップと、 (C)比較の結果、両方の構文的役割子列が一致し友場
    合には、その構文的役割子列に対応する節、単節のパタ
    ーンを上記区間の入力テキストに付与するステップと、 fr具備することを特徴とする自然言語間の自動翻訳方
    式。 16、 #115項記載の方式において、辞書メモリは
    、節及び単節のパターンの並び・と、骨格パターンとの
    関係を定め九骨格パターンテーブルtctみ、第4ステ
    ツプは、 (51)入力テキストに付与された節、単節パターンの
    並びと、上記テーブルの節及び単節パターンの並びとt
    比較するステップと、 (b)比較の結果、両方の頗及び単節パターンが一致し
    た場合にはそのバター/に対応する骨格パターンを人力
    テキストに付与するステップと、 を具備することを特徴とする自然d#間の自動翻訳方式
    。 17、第1項記載の方式において、辞書メモリは、入力
    言語による骨格パターンと、これに対応する出力言語に
    よる骨格パターンとの関係を定めた文型変換テーブルを
    含み、第5ステツプは、(a)入力テキストを形成して
    いる骨格パターンと、上記文型変換テーブルの入力言語
    の骨格パターンとを比較するステップと、 (嚇比叔の結果、両パターンが一致した場合にはこのパ
    ターンに対応する出力言語の骨格パターンを入力テキス
    トに付与するステップと、を具備すること1r籍徴とす
    る自然言語間の自動翻訳方式。 18.第17項記載の方式において、辞書メモリは、入
    力8mの構文的役割子列と、これに対応する出力ぎ語の
    構文的役割子列の量定を定めた変換テーブルを含み、第
    5ステツプは、 (a)入力テキストに付与された出力言語の骨格パター
    ンrts成する文、虻、単節の構文的役割子列と、上記
    変換テーブルの人力言語の構文的役割子列とt比軟する
    ステップと、(b)両比較結果が一致したとき上記文、
    節、単節の構文的役割子列をこれに対応する出力言語の
    構文的役割子列に変換するステップとを含み、上記構文
    的役割子を付与されたノードのカテゴリー、が句要素又
    は単語になるまで、上記(1)、(b)のステップを繰
    シ返して実行すること倉特徴とする自然言語間の自ll
    Ib翻訳方式。
JP56138586A 1981-09-04 1981-09-04 自然言語間の自動翻訳方式 Granted JPS5840684A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP56138586A JPS5840684A (ja) 1981-09-04 1981-09-04 自然言語間の自動翻訳方式
US06/415,601 US4641264A (en) 1981-09-04 1982-09-07 Method for automatic translation between natural languages

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56138586A JPS5840684A (ja) 1981-09-04 1981-09-04 自然言語間の自動翻訳方式

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP63176905A Division JPH01162978A (ja) 1988-07-18 1988-07-18 辞書検索方式

Publications (2)

Publication Number Publication Date
JPS5840684A true JPS5840684A (ja) 1983-03-09
JPH0351020B2 JPH0351020B2 (ja) 1991-08-05

Family

ID=15225569

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56138586A Granted JPS5840684A (ja) 1981-09-04 1981-09-04 自然言語間の自動翻訳方式

Country Status (2)

Country Link
US (1) US4641264A (ja)
JP (1) JPS5840684A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59160269A (ja) * 1983-03-02 1984-09-10 Kokusai Denshin Denwa Co Ltd <Kdd> 言語処理用パ−ジング方式
JPS59201182A (ja) * 1983-04-28 1984-11-14 Nec Corp 言語意味解析装置
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS6069776A (ja) * 1983-09-26 1985-04-20 Casio Comput Co Ltd 電子式英文翻訳機
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式
US4717824A (en) * 1983-12-02 1988-01-05 Mitutoyo Mfg. Co., Ltd. Photoelectric displacement detecting apparatus
JPH01189767A (ja) * 1988-01-25 1989-07-28 Nec Corp 文並列認識方式
JPH01307871A (ja) * 1988-06-06 1989-12-12 Nec Corp 文型・文法格認識方式
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
US5268839A (en) * 1990-03-27 1993-12-07 Hitachi, Ltd. Translation method and system for communication between speakers of different languages
US5297027A (en) * 1990-05-11 1994-03-22 Hitachi, Ltd. Method of and apparatus for promoting the understanding of a text by using an abstract of that text
JPH06139272A (ja) * 1992-10-30 1994-05-20 Sharp Corp イディオム登録機能を持つ機械翻訳装置
US5396419A (en) * 1991-09-07 1995-03-07 Hitachi, Ltd. Pre-edit support method and apparatus
US5408410A (en) * 1992-04-17 1995-04-18 Hitachi, Ltd. Method of and an apparatus for automatically evaluating machine translation system through comparison of their translation results with human translated sentences
US5907821A (en) * 1995-11-06 1999-05-25 Hitachi, Ltd. Method of computer-based automatic extraction of translation pairs of words from a bilingual text
US7117223B2 (en) 2001-08-09 2006-10-03 Hitachi, Ltd. Method of interpretation service for voice on the phone
JP2010515178A (ja) * 2007-01-04 2010-05-06 シンキング ソリューションズ ピーティーワイ リミテッド 言語分析

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS619753A (ja) * 1984-06-26 1986-01-17 Hitachi Ltd 文書処理装置における頻発熟語の自動登録方法
JPH0724055B2 (ja) * 1984-07-31 1995-03-15 株式会社日立製作所 単語分割処理方法
DE3587009T2 (de) * 1984-09-18 1993-05-06 Sharp Kk Uebersetzungssystem.
JPS61105671A (ja) * 1984-10-29 1986-05-23 Hitachi Ltd 自然言語処理装置
JPH0664585B2 (ja) * 1984-12-25 1994-08-22 株式会社東芝 翻訳編集装置
JPH0782498B2 (ja) * 1985-01-14 1995-09-06 株式会社日立製作所 機械翻訳システム
JPS61184685A (ja) * 1985-02-12 1986-08-18 Hitachi Ltd 翻訳情報追加方法
US5351189A (en) * 1985-03-29 1994-09-27 Kabushiki Kaisha Toshiba Machine translation system including separated side-by-side display of original and corresponding translated sentences
JP2848593B2 (ja) * 1985-05-07 1999-01-20 株式会社東芝 翻訳処理方法
JPS6231467A (ja) * 1985-08-01 1987-02-10 Toshiba Corp 文章作成装置
JPH083815B2 (ja) * 1985-10-25 1996-01-17 株式会社日立製作所 自然言語の共起関係辞書保守方法
JPS62163173A (ja) * 1986-01-14 1987-07-18 Toshiba Corp 機械翻訳方法
JP2732563B2 (ja) * 1986-05-20 1998-03-30 株式会社東芝 機械翻訳方法及び装置
JPS638864A (ja) * 1986-06-27 1988-01-14 Sharp Corp 翻訳装置
JPH0625901B2 (ja) * 1986-08-08 1994-04-06 三輪 博秀 電子単一言語辞典及び電子複数言語間辞典
JPS63120362A (ja) * 1986-11-10 1988-05-24 Brother Ind Ltd スペルチエツク機能付文書処理装置
US4864503A (en) * 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
US4862408A (en) * 1987-03-20 1989-08-29 International Business Machines Corporation Paradigm-based morphological text analysis for natural languages
US5321606A (en) * 1987-05-19 1994-06-14 Hitachi, Ltd. Data transforming method using externally provided transformation rules
JPS63305463A (ja) * 1987-06-05 1988-12-13 Hitachi Ltd 自然言語処理方式
JPH01234975A (ja) * 1988-03-11 1989-09-20 Internatl Business Mach Corp <Ibm> 日本語文章分割装置
US4994966A (en) * 1988-03-31 1991-02-19 Emerson & Stern Associates, Inc. System and method for natural language parsing by initiating processing prior to entry of complete sentences
US5060146A (en) * 1988-04-08 1991-10-22 International Business Machines Corporation Multilingual indexing system for alphabetical lysorting by comparing character weights and ascii codes
US4907971A (en) * 1988-10-26 1990-03-13 Tucker Ruth L System for analyzing the syntactical structure of a sentence
US5111398A (en) * 1988-11-21 1992-05-05 Xerox Corporation Processing natural language text using autonomous punctuational structure
JPH02240769A (ja) * 1989-03-14 1990-09-25 Canon Inc 自然言語文生成装置
EP0409425A3 (en) * 1989-07-15 1993-04-28 Keechung Kim Method and apparatus for translating language
US5146406A (en) * 1989-08-16 1992-09-08 International Business Machines Corporation Computer method for identifying predicate-argument structures in natural language text
JP3009215B2 (ja) * 1990-11-30 2000-02-14 株式会社日立製作所 自然語処理方法および自然語処理システム
US5475587A (en) * 1991-06-28 1995-12-12 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5559693A (en) * 1991-06-28 1996-09-24 Digital Equipment Corporation Method and apparatus for efficient morphological text analysis using a high-level language for compact specification of inflectional paradigms
US5317508A (en) * 1991-10-24 1994-05-31 Matsushita Electric Industrial Co., Ltd. Image editing apparatus
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
US5523946A (en) * 1992-02-11 1996-06-04 Xerox Corporation Compact encoding of multi-lingual translation dictionaries
JP3038079B2 (ja) * 1992-04-28 2000-05-08 シャープ株式会社 自動翻訳装置
JPH05314166A (ja) * 1992-05-08 1993-11-26 Sharp Corp 電子化辞書および辞書検索装置
US6278967B1 (en) * 1992-08-31 2001-08-21 Logovista Corporation Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5608622A (en) * 1992-09-11 1997-03-04 Lucent Technologies Inc. System for analyzing translations
US5541838A (en) * 1992-10-26 1996-07-30 Sharp Kabushiki Kaisha Translation machine having capability of registering idioms
US5675815A (en) * 1992-11-09 1997-10-07 Ricoh Company, Ltd. Language conversion system and text creating system using such
US5579223A (en) * 1992-12-24 1996-11-26 Microsoft Corporation Method and system for incorporating modifications made to a computer program into a translated version of the computer program
US5678051A (en) * 1992-12-24 1997-10-14 Matsushita Electric Industrial C., Ltd. Translating apparatus with special display mode for supplemented words
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
JPH07282055A (ja) * 1994-04-06 1995-10-27 Fujitsu Ltd 文解析方法および装置
JP3377290B2 (ja) * 1994-04-27 2003-02-17 シャープ株式会社 イディオム処理機能を持つ機械翻訳装置
US5721938A (en) * 1995-06-07 1998-02-24 Stuckey; Barbara K. Method and device for parsing and analyzing natural language sentences and text
US6161083A (en) * 1996-05-02 2000-12-12 Sony Corporation Example-based translation method and system which calculates word similarity degrees, a priori probability, and transformation probability to determine the best example for translation
US5836771A (en) * 1996-12-02 1998-11-17 Ho; Chi Fai Learning method and system based on questioning
US6498921B1 (en) * 1999-09-01 2002-12-24 Chi Fai Ho Method and system to answer a natural-language question
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
AU7753998A (en) * 1997-05-28 1998-12-30 Shinar Linguistic Technologies Inc. Translation system
US5930756A (en) * 1997-06-23 1999-07-27 Motorola, Inc. Method, device and system for a memory-efficient random-access pronunciation lexicon for text-to-speech synthesis
EP1710951A3 (en) 1997-07-17 2006-10-25 Matsushita Electric Industrial Co., Ltd. Elliptic curve calculation apparatus capable of calculating multiples at high speed
US6173250B1 (en) 1998-06-03 2001-01-09 At&T Corporation Apparatus and method for speech-text-transmit communication over data networks
US7099876B1 (en) * 1998-12-15 2006-08-29 International Business Machines Corporation Method, system and computer program product for storing transliteration and/or phonetic spelling information in a text string class
US6460015B1 (en) 1998-12-15 2002-10-01 International Business Machines Corporation Method, system and computer program product for automatic character transliteration in a text string object
US6496844B1 (en) 1998-12-15 2002-12-17 International Business Machines Corporation Method, system and computer program product for providing a user interface with alternative display language choices
US6389386B1 (en) 1998-12-15 2002-05-14 International Business Machines Corporation Method, system and computer program product for sorting text strings
US20020143524A1 (en) * 2000-09-29 2002-10-03 Lingomotors, Inc. Method and resulting system for integrating a query reformation module onto an information retrieval system
US6985851B2 (en) * 2001-07-17 2006-01-10 Microsoft Corporation Method and apparatus for providing improved HMM POS tagger for multi-word entries and factoids
KR100485909B1 (ko) * 2002-11-06 2005-04-29 삼성전자주식회사 3자 통화 방식의 자동 통역 시스템 및 방법
US7593842B2 (en) * 2002-12-10 2009-09-22 Leslie Rousseau Device and method for translating language
CN101512518B (zh) * 2006-09-07 2015-06-24 日本电气株式会社 自然语言处理系统和词典登录系统
US20080076103A1 (en) * 2006-09-15 2008-03-27 Wallace Thomas B Electronic book
US8706477B1 (en) 2008-04-25 2014-04-22 Softwin Srl Romania Systems and methods for lexical correspondence linguistic knowledge base creation comprising dependency trees with procedural nodes denoting execute code
US8219397B2 (en) * 2008-06-10 2012-07-10 Nuance Communications, Inc. Data processing system for autonomously building speech identification and tagging data
US8762131B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for managing a complex lexicon comprising multiword expressions and multiword inflection templates
US8762130B1 (en) 2009-06-17 2014-06-24 Softwin Srl Romania Systems and methods for natural language processing including morphological analysis, lemmatizing, spell checking and grammar checking
USH2269H1 (en) * 2009-11-20 2012-06-05 Manuel-Devadoss Johnson Smith Johnson Automated speech translation system using human brain language areas comprehension capabilities
US8543381B2 (en) * 2010-01-25 2013-09-24 Holovisions LLC Morphing text by splicing end-compatible segments
WO2014130132A2 (en) * 2012-12-06 2014-08-28 Raytheon Bbn Technologies Corp. Active error detection and resolution for linguistic translation
US11593561B2 (en) * 2018-11-29 2023-02-28 International Business Machines Corporation Contextual span framework
CN111666738B (zh) * 2020-06-09 2023-06-20 南京师范大学 一种动作描述自然文本的形式化编码方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5953590B2 (ja) * 1979-09-14 1984-12-26 シャープ株式会社 翻訳装置
JPS5731083A (en) * 1980-07-31 1982-02-19 Sharp Corp Electronic interpreter
JPS57201958A (en) * 1981-06-05 1982-12-10 Hitachi Ltd Device and method for interpretation between natural languages
US4503426A (en) * 1982-04-30 1985-03-05 Mikulski Walter J Visual communication device

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59160269A (ja) * 1983-03-02 1984-09-10 Kokusai Denshin Denwa Co Ltd <Kdd> 言語処理用パ−ジング方式
JPH0346866B2 (ja) * 1983-03-02 1991-07-17 Kokusai Denshin Denwa Co Ltd
JPH0415504B2 (ja) * 1983-04-28 1992-03-18 Nippon Electric Co
JPS59201182A (ja) * 1983-04-28 1984-11-14 Nec Corp 言語意味解析装置
JPS59201172A (ja) * 1983-04-28 1984-11-14 Nec Corp 曖味さ解析方式
JPS6069776A (ja) * 1983-09-26 1985-04-20 Casio Comput Co Ltd 電子式英文翻訳機
US4717824A (en) * 1983-12-02 1988-01-05 Mitutoyo Mfg. Co., Ltd. Photoelectric displacement detecting apparatus
JPS6140672A (ja) * 1984-07-31 1986-02-26 Hitachi Ltd 多品詞解消処理方式
JPH01189767A (ja) * 1988-01-25 1989-07-28 Nec Corp 文並列認識方式
JPH01307871A (ja) * 1988-06-06 1989-12-12 Nec Corp 文型・文法格認識方式
JPH03129469A (ja) * 1989-10-14 1991-06-03 Canon Inc 自然言語処理装置
US5268839A (en) * 1990-03-27 1993-12-07 Hitachi, Ltd. Translation method and system for communication between speakers of different languages
US5297027A (en) * 1990-05-11 1994-03-22 Hitachi, Ltd. Method of and apparatus for promoting the understanding of a text by using an abstract of that text
US5396419A (en) * 1991-09-07 1995-03-07 Hitachi, Ltd. Pre-edit support method and apparatus
US5408410A (en) * 1992-04-17 1995-04-18 Hitachi, Ltd. Method of and an apparatus for automatically evaluating machine translation system through comparison of their translation results with human translated sentences
JPH06139272A (ja) * 1992-10-30 1994-05-20 Sharp Corp イディオム登録機能を持つ機械翻訳装置
US5907821A (en) * 1995-11-06 1999-05-25 Hitachi, Ltd. Method of computer-based automatic extraction of translation pairs of words from a bilingual text
US7117223B2 (en) 2001-08-09 2006-10-03 Hitachi, Ltd. Method of interpretation service for voice on the phone
JP2010515178A (ja) * 2007-01-04 2010-05-06 シンキング ソリューションズ ピーティーワイ リミテッド 言語分析

Also Published As

Publication number Publication date
US4641264A (en) 1987-02-03
JPH0351020B2 (ja) 1991-08-05

Similar Documents

Publication Publication Date Title
JPS5840684A (ja) 自然言語間の自動翻訳方式
Klein et al. A computational approach to grammatical coding of English words
Jacquemin Spotting and discovering terms through natural language processing
EP0180888B1 (en) Method and apparatus for natural language processing
US20140039879A1 (en) Generic system for linguistic analysis and transformation
JP2006164293A (ja) 自動自然言語翻訳
Thet et al. Word segmentation for the Myanmar language
KR20040086775A (ko) 단어 분석 시스템 및 방법
Vasiu et al. Enhancing tokenization by embedding romanian language specific morphology
JP2632806B2 (ja) 言語解析装置
JP3876014B2 (ja) 機械翻訳装置
Namboodiri et al. On using classical poetry structure for Indian language post-processing
Hatzivassiloglou et al. Unification-based glossing
KR100404320B1 (ko) 문장 자동 색인 방법
Kawtrakul et al. A gradual refinement model for a robust thai morphological analyzer
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
Aghdam et al. Persian Semantic Role Labeling Using Transfer Learning and BERT-Based Models
JP2000259627A (ja) 自然言語文関係判定装置、自然言語文関係判定方法およびこれを用いた検索装置、検索方法ならびに記録媒体
JPH01162978A (ja) 辞書検索方式
JPH0345423B2 (ja)
JP3093759B2 (ja) 日本語解析装置
Xolmo'minovna Morphological Annotation System in The Corpus of Internet Information Texts in The Uzbek Language
JP2000322449A (ja) 自然言語文関係判定装置、自然言語文検索装置、自然言語文生成装置およびこれらに用いる枠組み表現出力装置、ならびにそれらの方法および記録媒体
Xiong et al. A Computer-assisted dictionary-making system for Chinese English learner's dictionary
JPH0345424B2 (ja)