JPH01162978A - 辞書検索方式 - Google Patents

辞書検索方式

Info

Publication number
JPH01162978A
JPH01162978A JP63176905A JP17690588A JPH01162978A JP H01162978 A JPH01162978 A JP H01162978A JP 63176905 A JP63176905 A JP 63176905A JP 17690588 A JP17690588 A JP 17690588A JP H01162978 A JPH01162978 A JP H01162978A
Authority
JP
Japan
Prior art keywords
word
collocation
dictionary
node
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63176905A
Other languages
English (en)
Other versions
JPH0352101B2 (ja
Inventor
Yoshihiko Nitta
義彦 新田
Atsushi Okajima
岡島 惇
Fumiyuki Yamano
山野 文行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63176905A priority Critical patent/JPH01162978A/ja
Publication of JPH01162978A publication Critical patent/JPH01162978A/ja
Publication of JPH0352101B2 publication Critical patent/JPH0352101B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、例えば英語で表わされた文章を日本語の文章
に自動的に翻訳する方法等への適用に有用な自然言語処
理に係り、特に単語及び連語の辞書検索方法に関する。
本発明の方法は、自然菖゛語間の翻訳のみならず、自然
5語入力に伴う各種の自然“言語処理に適用することが
できる。以下の説明では便宜上、入力j′語が英語、出
力言語がIEI木語の自動翻訳の場合について述べるが
1本発明はこれに限定されるものではない。
従来技術とその問題点 −つの自然1語で表わされた文章を他の自然石。
語で表わされた文章に自動的に翻訳する方法として、従
来、電気通信学会雑誌第46巻、第11号の第1730
頁〜第1739頁に記載されている方法が知られている
この従来方法を簡単に説明する。まず英文テキストが入
力されると、辞書検索を行い、単語の並びからなる文章
を品詞列に変換する。しかしながら多くの場合、品詞が
一義的に定まらないことがある。例えば“5tudy”
  という甲1語は動詞をとる場合と名詞をとる場合が
ある。このような場合にまず一義的に品詞が確定できる
単語を選び、確定した品詞の単語を基準にして、その前
後の関係より他の単語の品詞を決定する。最後まで品詞
が定まらない単語についてはとり得る品詞の候補を登録
しておき、とりあえず一つの品詞を仮に決定する。次に
句及び節に相当する品詞列パターンを予め登録しておき
、このパターンと一致する品詞列を探す。一致するもの
があればその句又は節は1個の品詞記号により置き換え
られる。
例えば第1(A)図に示すように・・・a pulse
 ofknown rate of riseという文
があった場合、apulse、 known rate
がそれぞれ名詞句(N P)として判定される。さらに
、of+riseが形容詞句(AP)、known r
ate + of + riseが名詞句、of+kn
own rate+ of + riseが形容詞句と
いうように置き換えられる。こうして一つの文が簡単な
品詞列にパターン変換されるにの変換された品詞列のパ
ターンが予め登録された文を表わす標準の品詞列パター
ンと比較される。両パターンが一致する場合には翻訳可
能と判断され、予め定められた規則に従って単語の語順
変換が行われる。
変換された品詞列パターンが登録された標準パターンと
一致しない場合には、単語の品詞を決め方が不適切と判
断し、不確定の単語の品詞を登録された別の品詞に置き
換え、上記と同じ処理が繰り返して行われる。すなわち
、単語が多品間をもつ場合に、一つの品詞を決定するた
めに一種のフィードバック・ループが用いられる。
最後に語順変換された単語列に訳語が付与され英文を翻
訳をした和文が出力される。
しかしながら、上記のような従来の自動翻訳方法には下
記のような種々の問題点がある。
第1の問題点は多品詞語の決定が極めて複雑になり、翻
訳の成功率が低くなりがちということである。前述のよ
うに従来方法では一つの単語が多品間をもつ場合には、
一つの品詞を仮にあてはめて、パターン辞書による構文
解析を行い、うまくいかなかった場合には、又もとに戻
って別の品詞をあてはめてみるという処理を繰り返す。
しかしながら、多数の品詞をもつ単語は現実に数多くあ
り、しかも文章が複雑になると、一つの文についての可
能な品詞列の種類は美大な数に達する。これらの品詞列
について何回も同じ処理をくり返すことは、翻訳速度の
低下を招くことはもちろんのこと1間違った品詞を暫定
的に定めた場合でも、単語の品詞列がたまたま辞書に登
録されたパターンと一致し1間違った翻訳処理が行われ
てしまうこともある。
従って文章が複雑になる程、これを正しく翻訳できる率
、つまり成功率が低下する。
第2の問題点は、仮に単語の品詞が正しく決定されたと
しても、句、節を切り出して1つの品詞に置き換える処
理を行う際、文頭又は文末から順番に句を切出しており
1句、節の係り先、修飾の対象となる単語の関係、つま
り依存・修飾関係を分析せずに行っているために間違っ
た翻訳をしやすいということである1例えば第1(B)
図に示すような−take a bus in a c
ityという文があった場合、第1(A)図と同様に構
文分析を行うと、a bu+ in a city” 
が1つの名詞句と認識され、この結果、訳語は“街の中
のバスに乗る”となってしまう。これは”in s c
ity”がtakeにかかる副詞句であるにもかかわら
ず、文末から順番に句を切出していくと形容詞句として
認識され“abus″  を修飾すると判定されたため
に生じた誤訳である。このように文頭又は文末から順に
句を切出していく方法をとると句品詞が一義的に定まら
ない場合があるμ)二車が階層的構造をもつ場合が生ず
る。妻与文章が階層的構造をもつ場合、つまり、修飾を
する相手先が複雑に入り組んだ文章の場合にはこれを正
確に翻訳することができなくなる。
第3の問題点は、従来方法では翻訳すべき文型の増補を
行うためには処理装置のプログラム全体を手直しする必
要があり、従って一旦システムができあがってしまうと
文型の増補が極めて困難になることである。すなわち、
従来方法においては、多品間をもつ単語の品詞を決定す
るために、フィードバックループを用いており、このル
ープの中にパターン辞書による構文分析の処理が含まれ
ている。従ってパターン辞書の登録パターンを追加した
り修正する場合には、フィードバックループ全体の動作
に矛盾を生じないように処理アルゴリズムを手直ししな
ければならない。通常、自動翻訳における成功率は上記
の構文分析用の登録パターンをいかに構築するかに依存
するところ大であり、従って試行錯誤的にこの登録パタ
ーンの増加、変更を要するが、その都度処理アルゴリズ
ム全体の手直しをするのは実際上大きな負担になる。
発明の目的 本発明の目的は上述のような従来技術の問題点を解決す
る新規な、自然言語処理におけるvpa検索方法を提供
することにある。
具体的に言うと、自然言語処理全搬に亘って、その第一
段階である辞書検索を高速に、且つ使用する自然言語辞
書を小容量で構築する方法を提供することが、本発明の
主たる目的である。
発明の概要 上述の目的を達成するために、本発明方法では第2図に
示す処理過程を経て自然言語間翻訳が行われる。
まず英文テキストを読み込み、入カデータパツファメモ
リにセットする(テキスト入力処理)。
次に辞書を検索してテキスト中の変化形をもつ単語1例
えば時制変化、複数形変化、比較級変化などをしている
単語を原形に変換する処理を行う(辞書検索)、更に、
テキスト中のすべての単語及び連語(イデオム等)に列
を、それらに対応する品詞列に変換する(品詞認識)1
次に品詞列の形に変換された文を、?6i数個の名詞の
連なり、助動詞+動詞、冠調子名詞、前置調子名詞、形
容調子名詞等の言語的意味をもつ最小単位、つまり句要
素に分割する(句摺造認m)、そして上記の各句要索に
対して、改めて名詞句、形容詞句、副詞句、動詞句、前
置詞句などの句品詞を与える。この後、後述の辞書再検
索が行われる。次に句品詞列を、主語、中心動詞、直接
目的語、補語、動詞修飾語等の構文的役割子列に変換す
る。更に構文的役割子列の中から文パターン、節パター
ン、及び意味的に閉じた主語、述語関係を有する構文単
位(型筒パターン)を見出す(英文型パターン認ra)
更に、前置詞句、副詞句等の句要素の係り先、つまりど
の名詞句あるいは動詞句を修飾しているかの依存関係を
決定する(依存・修飾関係認識)。
次に上記のようにして認識された英文型パターンを、そ
のパターン毎に予め定められた変換規則を参照して、日
本語の骨格パターンに変換する(文型変換)。最後に予
め用意された単語、連語の辞書を検索することにより出
力a゛語である日本語の文を生成する(和文生成)。
本発明方法の特徴の第1は、単語及び連語の列を品詞列
に変換する品詞列認識の処理が、句構造認識などの構文
分析の前段階において完了し、従来方法のようなフィー
ドバックループをもたないことである。換言すれば品詞
列認識の処理ステップではすべての単語・連語の品詞を
この段階で確定してしまい1句構造認識等の処理結果を
みて、再び品詞認識に処理が戻るようなフィードバック
ループを有しない、従って各処理ステップにおける処理
結果が他の処理ステップに影響を与えないため句構造等
の認識のための登録パターンの増補が極めて容易になる
特徴の第2は、多品側をもつ単語の品詞を決定するのに
、後述のような品詞認識用パターンを予め定め、これを
参照しながら決定するように構成されている点である。
この品詞認識用パターンを用いることによって、各単語
の品詞の確定が迅速正確に行われ、結果的に翻訳の成功
率が向上することになる。
本発明方法の第3の特徴は、品詞列パターンから句、節
を切り出して構文分析を行う際、従来の英文法の句、節
とは異な8句要素の概念を導入したことである。更に句
要索の単位で切出し、新たに句品詞列を形成した後、こ
れを構文的役割子列に変換することも特徴の1つである
。このように句要素、構文的役割子の考え方を導入する
ことによって、複雑な文章も正確に翻訳することが可能
となる。
第4の特徴は、句、節などがどの語を修飾するのかを認
識する修飾・依存関係認識の処理ステップを含んでいる
ことである。この処理を行うことによって第1 (B)
図のように修飾の相手先が入り組んでいる文章も正確に
翻訳することが可能になる。
本発明の上記特徴及びこの他の特徴は、以下説明する実
施例を参照することによって、いっそう明確になろう。
実施例 第3図は本発明方法の全体構成を示す。同図から明らか
なように本発明方法は、入力装置100゜翻訳処理装置
200.辞書用メモリ300、作業用メモリ400及び
出力装置500より構成される。
入力装fitlooは英文テキストを入力するためのも
ので1通常、キーボードが用いられる。もちろん、この
他の方法により英文テキストを入力することも可能であ
る6例えば磁気テープ、磁気ディスク等に予め英文テキ
ストを記録しておき、公知の磁気記憶制御回路を通して
処理装置200に入力してもよい。また、ファクシミリ
等の通信機器を通して送られてくる英文テキストを、公
知の通信回線制御回路を通して処理装置200に入力す
ることもできる。
辞書用メモリ300は単語、連語(2以上の単語よりな
るイデオム等の語)等の辞書や、翻訳処理のために用い
られる規則を定義したテーブルを予め格納しておくため
のものである。具体的にいうと、このメモリ300には
、単語辞書301、連語辞書302、品詞認識用パター
ン3031句要素切出用パターン3041文型認識用パ
ターン305、依存・修飾関係認識用パターン306、
文型変換用パターン307、和文生成用パターン308
が格納されている。
m語辞書301のメモリエリアの内部構造を第4(A)
図及び第4(B)図に示す。1番地からN番地のそれぞ
れのブロックには用語情報レコードが記憶されている。
単語情報レコードは単語の見出し語と、その用語の属性
を示す単語情報とを含む。単語情報としては、その単語
をもとにしてつくられる連語(イデオム等も含む)の個
数、連語の先頭番地、その単語がとり得る品詞の個数、
品詞名、品詞の細分類、各品詞における単語の属性、そ
の単語が多義の意味をもつ場合にはその個数、それぞれ
の訳語、各訳語の語尾活用、各訳語の付属機能語等が含
まれる。
第4(B)図には′″5TUDY”  という英語に相
当する単語情報が例示されている。この単語をもとにし
てつくられる連語としてはMAKE A ST[JDY
 OF。
υNDER5TUDY、 CASE 5TUDY、など
(6)個登録されている。それらの連語のうち先頭に登
録されている連語の番地が(76)である(第5(B)
図参照)。
また5TUDYは動詞(V)と名詞(N)の両方をとり
得るので多品側個数(2)1品詞名1として(V)、品
詞名2として(N)が登録される。なお品詞の細分類の
欄には、例えば動詞の場合、自動詞と他動詞の区別、ま
た自動詞でもその後に補語をとる自動詞(例えばget
、 1ook、 make等)とその後に前置詞をとる
自動詞(例えば5end、 advertise等)と
の区別等1品詞に関する更に細かい情報が書き込まれる
更に5TUDYが動詞として用いられる場合、その意味
が“勉強する″と解釈される場合と、′研究する″と解
釈される場合とがあるので、多義語個数の欄には(2)
、訳語1の欄には“勉強する”、訳語2の欄には“研究
する″と登録される。また訳語1及び2共に″勉強”及
び″研究”の後の″する″が、状況に応じてす行変格活
用して用いられるので、語尾活用1及び2の欄にその旨
登録される。更に付属機能語(て、に、を、は)として
は、”5TUDY ”が目的語(OBJ)をとる場合に
は(目的語0BJ)の後に“を′が入るので。
その情報が訳語1及び2に対応する付属機能語1及び2
の欄に登録される。
第4(B)図では図示してないが第2品詞名(N)につ
いても上述と同様の情報が登録される。
連語辞1F302(第3図)のメモリエリアの内部構造
を第5(A)図及び第5(B)図及び第5(C)図に示
す。
連語情報レコードは、連語の見出し語と、その連語の属
性等を示す連語情報を含む。連語情報には、その連語の
とり得る品詞の個数、その品詞名、品詞細分類、その品
詞における連語の属性、連語が多義に解釈される場合そ
の個数、各訳語、各訳語における語尾活用、付属機能語
等が含まれる。
第5(B)図には11MAKE A 5TUDY OF
” という固定連語に関する連語情報が例示されている
この連語は″研究をする″という動詞句を形成するので
1品詞の個数は(1)、品詞名は(V)と登録される。
更に、この連語の多義性の個数の欄には(1)、訳語1
の欄には“研究をする″が登録される0語尾活用1の欄
には訳語1のパ研究をする”の″する″がす行変格活用
して用いられる旨の情報が登録される。付属機能語1の
欄には、上記連語が目的語(OBJ)をとる場合に“(
OBJ)の研究をする”の訳語となり、′の″の付属機
能語が必要になる旨の情報が登録される。
第5(C)図は可変連語辞書の内部構成を示すもので、
その詳細については後述する。
第6(A)図は辞書メモリ300の中の品詞認識用パタ
ーンエリア303に格納されるパターンの一例を示す。
この品詞認識用パターンは単語又は連語の並びからなる
文を、それぞれの単語又は連語の品詞の並びへと変形す
る場合に用いられる。
単語又は連語が複数の品詞を文法的にとり得る場合、品
詞の並びの前後関係から、最もふされしい一つの品詞を
最終的に選び出す、この場合、予め、文法的にとり得な
い品詞列のパターン、つまり禁制品詞列パターンを登録
しておき、このパターンを用いて多数の品詞から一つの
品詞を選択する。
第6(A)図には7個の禁制品詞列パターン及び禁制解
除条件が示されているに過ぎないが、実際にはこのパタ
ーンが数十個以上用意される。また入力される文の特性
を考慮してパターンの変更。
増加、簡略化などを行ってもよい。
第6(A)図において禁制品詞列パターンの拳は1品詞
を判定すべき単語の位置を表わす、又、Fl、 F2.
は傘のそれぞれ1つ前、2つ前の単語の品詞を表わし、
Bz、Bzは傘のそれぞれ1つ後、2つ後の単語の品詞
を表わす。
項番1の重位置の「−V」の記号は、「動詞(V)以外
の品詞」という意味である6従って項番1の品詞列パタ
ーンは、rtoの後に動詞(V)の可能性のある単語が
並んだ場合、動詞(V)として判定し、他の品詞の可能
性はなしとしてよい」という意味である。
禁制解除条件は禁制品詞列パターンの禁制が解除される
こと、換言すれば品詞列パターンの品詞の並びが許容さ
れることを示す0例えば、項番2は゛形容詞(A D 
J )  十動詞(V)”という品詞の並びは通常は禁
止されるが、Fzとして冠詞(A RT)や、be動詞
(B E)がきた場合にはそのような品詞の並びも許容
されることを示している。換言すれば“冠詞(ART)
ではなく、かつbe動詞(BE)でないもの十形8詞(
A D J )1車″という品詞の並びがあるとき、傘
の位置が動詞(V)の可能性はないと判断して良いとい
う意味である。
項番3は、”Fl(動詞(■))+−″という品詞の並
びが出てきた場合、Flが一1nHのついた動詞(IN
G)のとき、傘がbe動詞(BE)のとき、或いはFl
がhelpという単語であるときを除いて、拳の位置は
動詞をとり得ないと判断して良いことを表現している。
項番4は“代名詞複数(P RN H) + 申I+と
いう品詞の並びが出てきたとき串の位置は(動詞+3)
の形はとり得ないと判断して良いことを示す。
同様に項番5は″名詞複数(Nに)1傘”という品詞の
並びが出てきたとき、傘の位置は(動詞中S)の形はと
り得ないと判断して良いことを意味する。
更に項番6は、″場所の固有名詞(N1)+傘”という
品詞の並びがあったとき、串の位置は動詞現在(vp)
の形はとり得ないと判断して良いことを示している。
この他のパターンについては説明を省略するが要するに
上記のようなM制品詞列パターンがテーブルとして前記
メモリエリア303(第3図)に格納されているのであ
る。
第7キA午図は辞書メモリ300の中の句要素切出用パ
ターンエリア304に格納されるパターン例を示す。こ
の句要素切出用パターンは、単語及び連語に付与された
品詞の並びからなる品詞列から句要素を切出し、この句
要素に新たに品詞を付与することにより句要素品詞列を
生成する際に用いられる。ここで句要素とは第7##図
に示す品詞の並びをもつ単語の並びを称し、通常の英文
法で定義される句の概念とは異なる。なお第7#井図は
句要索の一部を示したに過ぎず、実際には多数用意され
る。
第7図において“−m−”なる記号は、それをはさむ品
詞が1個以上有限個出現したとき、その全体を切り出す
ことを意味する0項番1は″副詞(ADV)1個”また
は“副詞(ADV)+−+副詞(ADV)”という品詞
列があった場合、この列全体を句要素として切り出し、
新たに句要素品詞として副詞が付与されることを示して
いる。
項番2は、゛′前置詞(PREP)十名詞(N)”ある
いは″前置詞(PREP)十名詞(N)+・・・十名詞
(N)”という品詞列には前1i!詞的(PRENAL
)の句要素品詞が付与されることを示す。項番3は“助
動詞(AUX)十動詞(V)”または、′助動詞(AU
X)+・・・十助動詞(A U X)十動詞(V)”と
いう品詞列があった場合、この列全体を句要素として切
り出し、新たに句要素品詞として動詞(V)が付与され
ることを示す9項番4゜5.6についても同様である。
辞書メモリ300の文型認識用パターンメモリエリア3
05には、4つのテーブルが格納されている。すなわち
動詞パターンテーブル、接続詞パターンテーブル、節パ
ターンテーブル、文パターンテーブルである。
第8(A)図は動詞パターンテーブルの一例を示し、#
詞のタイプ番号を手がかりとして動詞をもつノードの前
後のノードの構文的役割子を決定するために用いられる
。ここでノードとは、後述するように、品詞列や各句要
素列の各要素を表す概念的な単位であり、品謂やカテゴ
リー、構文的役割子等の各種情報を含む。動詞のタイプ
番号は単語辞書および連語辞書を検索することにより得
られる。a詞のタイプ番号と動詞の例、動詞が前後の名
詞相当句を支配するパターンを表1(A)に示す。
第8(B)図は接続詞パターンテーブルの一例を示し、
接続詞を有するノードの前後のノードの構文的役割子列
パターンから接続詞のノードの構文的役割子を決定する
ために用いられる。
第8(C)図は節パターンテーブルの一例を示し、接続
詞1句読点等で区切られるノード列の構文的役割子パタ
ーンから節パターンを決定するために用いられる。
ff18 (D)図は文パターンテーブルの一例を示し
、節パターンの並びから文パターン(骨格パターン)を
決定するために用いられる。
それぞれのパターンテーブルの詳細については後述する
。特に第8(C)図中、第8(D)図中に出現する記号
については、後で第20 (B)図等を用いて述べる。
辞書メモリ300には、この他に形容詞、副詞の単語、
句等がどこにかかるかを決定するための依存・修飾関係
認識用パターン306、文型の変換用に用いられるパタ
ーン307、和文生成の際に用いられるパターン308
をそれぞれ格納するエリアを有する。各パターンについ
ては後で詳述する。
以上述べたように、辞書メモリ300には、単語、連語
辞書の他、各種の規則パターンが予め格納されるが、こ
のメモリ300への情報の書き込み及び読出しは、書込
み読出し制御回路201によって行われる。
一方、作業用メモリ400は、第2図に示した各処理の
過程で必要になるテーブルを格納するためのもので、読
出した単語、連語情報を一時的に格納するバッファテー
ブルエリア401.入力テキストストリームテーブルを
格納するエリア402、ワードストリームテーブルを格
納するエリア403゜ノードストリームテーブルを格納
するエリア404、句要素列を格納するエリア405、
英文型ノード列を格納するエリア406、和文型ノード
列を格納するエリア407、出力テキストを格納するエ
リア408を含んでいる。尚各テーブルの詳細について
は後述する。
上記作業用メモリ400の情報の書込み読出しは、翻訳
処理装置200からの指令に基づき、書込み読出し制御
回路202を介して行われる。
翻訳処理装置200は、後で詳しく述べるように第2図
に示した処理を行うためのプログラムを格納しており、
辞書メモリ300の情報を適宜用い、メモリ400をワ
ーキングエリアとして用いて、入力の英文テキストを和
文に翻訳して出力する。
出力袋[500としては和文出力をプリント又は表示す
るためのプリンタ又はデイスプレィ装置等が用いられる
なお、前述の辞書メモリ300として例えばディスクメ
モリ、作業用メモリ400としてコアメモリが用いられ
る。もちろん本発明方式ではこれらのメモリの種類は特
定のものに限定されない。
又これらのメモリを処理装置と別に設けてもよいし、処
理装置の中に設けても差支えない。
以下本発明方式による処理手順について詳細に説明する
(1)テキスト入力処理 テキスト入力処理というのは、入力装置100(第3@
)より入力した英文テキストを、作業用メモリ内の入力
テキストストリームエリア402に順次セットする処理
をいう、英文テキストの一例を第9図に示す、キーボー
ド等の入力袋w100により英文を入力すると、アルフ
ァベットに対応するコード信号に変換された後、上記入
力テキストストリームエリア402に格納される。
(2)辞書検索 テキスト入力処理が完了すると、次に、いわゆる辞書引
きの作業が行われる。辞書引きとは入力テキストストリ
ームエリア402に格納された、入力テキストの単語の
出現の順に、単語辞書301を検索し、該当する単語の
単語情報を作業用メモII 400の単語、連語用バッ
ファメモリエリア401に順次格納する処理をいう0例
えば第9図のテキストの場合、第10図に示すようにま
ずHEを見出し語とする単語情報がメモリエリア401
のW B (1)番地に格納される0次ニVROTI!
は不規則変化動詞であるので予め単語辞書301に登録
されており、その単語情報には“WRITE”へのポイ
ンタ(IIRITEへの先頭番地)と不規則変化情報(
wroteはwriteの過去形)が格納されている。
従ってIIROTEの単語を辞書引きするとWRITE
を見出し語とする単語情報が読出され、この単語情報に
不規則変化情報を付加した後メモリエリア401のW 
B (2)番地に格納される。以後、順にENGLIS
)I 。
VERY・・・の辞書引きが行われる。
このように単語辞書の内容と同じ情報を一旦、単語・連
語用バッファメモリエリア401にとり込むのは、作業
用メモリ400として通常、高速アクセス可能なメモリ
、例えばコアメモリが用いられるので、後の品詞認識、
依存修飾関係認識。
和文生成などの処理過程における辞書検索が高速に行え
るためである。従って、上記の単語・連語バッファメモ
リ401を使用せずに各処理過程において直接単語辞書
301、連語辞書302を検索することもできる。
上述のいわゆる辞書引きの段階で、単語の語尾変化処理
及び連語の検出処理が行われる。以下それらの処理の内
容を詳しく説明する。
語尾変化処理とは、語尾が活用変化している単語1例え
ば時制変化、複数形変化、比較級変化などをしている単
語を、その原形に変換し、単語辞1F301、連語辞書
302を検索した後、検索した内容に語尾変化情報を付
加した上で単語・連語バッファメモリエリア401にセ
ットする処理をいう。この処理を行うことにより後の品
詞EWt処理における単語辞書あるいは連語辞書の検索
を、単語の原形の見出し語を参照して行うことが可能に
なる。従って辞書には、このように語尾変化した単語情
報を予め登録しておく必要がなくなり、辞書メモリ容量
の低減に効果がある。
説明の便宜上、以下”5TUDIES” という複数名
詞変化形あるいは三人称単数動詞変化形の単語を例にと
って、原形への変換手順を述べる。他の変化層単語の原
形変換処理も同様の考え方で処理できる。
処理対象となる単語は単語を構成する一文字ずつにQl
、 fixt Qs・・・なる符号が与えられる。たと
えば“5TLIDIES” に対しては、第11(D)
図のように末尾のSにQlが、次にEにはQzが、さら
に次のIにはQsというように付与される。
まずステップ1002において辞書検索が行われ、辞書
にあれば処理は終了しくl O03)、なければステッ
プ1004に進む。ステップ1004゜1005.10
06,1007.1008はそれぞれ語尾変化が生じて
いるかどうかを判定するための処理である。この例の場
合はステップ1008で判定結果がYESとなり、ステ
ップ1010に進む、ここで5TUDI[ESの末尾の
Sが解除され、5TUI)IEとなり、符号の付は換え
が行われる。ステップ1016で再び辞書検索が行われ
る。単純な複数形の場合はこの段階で辞書に登録されて
いることが多い(例えば1ikes) 、本例の場合は
更にステップ1017に進み末尾がEかどうか判定され
この結果YESとなるので、更にステップ1018に進
む、更にステップ1022に至りQ201の文字。
つまりIEが削除され5TUDになる。更にステップ1
023においてYが付加され5TLIDYという原形に
変換された後、ステップ1024で再び辞書引きが行わ
れる。ここでも、もし辞書になければ未登録語と判断さ
れる(1025)。
以上述べたような処理を経て、 5TLIDYの単語が
辞書にあると、その単語情報が読み出され、単語情報に
語尾変化情報(複数名詞変化形並びに三人称単数動詞変
化形)を付加したものが前述の単語・連語バッファメモ
リエリア401に書き込まれる。
以上のように、辞書検索の段階で、単語の語尾が時制、
複数形などにより変化している場合に、原形に戻した後
に辞書引きを行っているので、辞書には単語の原形のみ
を用意すればよく、辞書に用意する単語の数を著しく低
減することができる。
次に単語の並びからなる英文テキストの中の連語を検出
する処理について第12図を参照して説明する。連語と
は、2以上の単語の結合により意味のある語を形成する
もので、イデオムもこれに含まれる。
ここでは−例として”MAKE A 5TUDY OF
” なる連語が検出され、単語・連語バッファメモリエ
リア401に格納される手順について説明する。まずス
テップ1040で単語の切出しが行われ、ステップ10
41で前述の語尾変化処理が行われる。
次にステップ1042で単語辞書検索がなされる。
”MAKE”及び“A ”については前述と同様に単語
辞書301の該当見出し語を検索して、その単語情報を
単語・連語バッファメモリエリア401に順次格納して
いく、ステップ1043では、単語が辞書に登録されて
いない未知単語かどうか判定する。登録されていない場
合にはステップ1047で固有名詞として判断する。次
に”A”の次の”5TUDY″″を見出し語として単語
辞書301を検索すると、第4(B)図に示すように、
  ”STυDY ”を含む連語が6個存在することが
判る(ステップ1044)。そこで直ちに対応連語部の
先頭番地(76)から連語の見出し語の検索が開始さ才
しる(ステップ1048)。第5(B)図に示すように
、“5TUDY ”を含む連語とシテハ、”MAKE(
A 5TUDYOF”UNDER5TUDY”等が存在
することが検知されるにのうち入力テキスト中のものと
一致するのは“MAKE A 5TUDY OF”であ
ることが判る(ステップ1049)、なお1合致する連
語が存在しないと判断された場合には、’5TUDY”
  を単なる単語とみて、前述と同様に”5TUDY″
  の単語情報をバッファメモリエリア401に格納す
ることになる(ステップ1045)。また入力テキスト
が2以上の連語と一致することが検知された場合には。
最も長い連語と一致したものを採用する。例えば“MA
KE A 5TUDY”と“MAKE A 5TUDY
 OF”  の両者と一致した場合には後者が採用され
る。
さて、現在の例では入力テキストと”MAKE AST
UDY OF″が一致した訳であるが、この場合にはま
ず単語、連語バッファエリア401内にすでに格納され
ている” M A K E”及び“A 11の単語情報
に対して無効マークの付与あるいは単語情報の消去が行
われる(ステップ1050)。この後“MAKE A 
5TLIDY OF” に対応する連語情報が単語・連
語バッファエリア401に格納される(ステップ104
5)。
上記のような処理により、最終的には入力英文テキスト
中に出現する単語及び連語は、すべてその出現類にバッ
ファエリア401に格納されることになる。
なお、上記の例では簡単化のため、未知単語はすべて固
有名詞として認識する場合を述べたが、より正確な品詞
を決定することもできる。この未知単語の正確な品詞の
判定は、前述した[禁制テーブル検索による品詞認識処
理」を再度実行するは別に用意され、単語辞書における
各単語の情報として、その単語を元にして形成される連
語の有無と、連語辞書へのポインタの情報が含まれてい
るので、単語を切出しながら同様に連語も切出すことが
できる。
(3)品詞認識処理 品詞認識処理とは単語・連語用バッファ401に格納さ
れた各単語及び連語に1つずつ品詞を付与する処理を称
し、第13図に示すフローチャートにしたがって処理が
行われる。
まずステップ1060において、単語・連語用バッファ
メモリ401内をWB(1)、WB(2)。
WB(3)、・・・の如く順次走査しながら、単語及び
連語の品詞名、品詞細分類、属性情報を読み出し、ワー
ドストリームテーブルエリア403に順次格納していく
。品詞名とその記号の一部を表1(B)に示す。
表1(B) 第14(A)図及び第14 (B)図はワードストリー
ムテーブルの内部構成を示す、同図から判るように各単
語・連語はそれぞれワードレコードを含む。
各ワードレコードは第14 (B)図に示すような情報
を含んでいる。−例として単語“WRITR”について
のワードレコードを説明する。単語/連語の区別指示子
には単語である旨の情報(#)が書き込まれる。語の識
別番号は入力テキストストリームテーブル402(第9
図参照)においてその語が何番目に出現するかを表わす
ので、この場合は(2)が書き込まれる。更に語長の欄
は、41語又は連語を構成する文字数を表わし、“WR
ITE”の場合は(5)が書き込まれる。先頭文字の文
字番号の欄は入力テキストストリームテーブル402(
第9図)において、“WRITE” の頭文字“W I
Iの位置する番地(4)が書き込まれる。更に多品側の
個数の欄には動詞(V)と名詞(N)の2つであるので
(2)が書き込まれる。この他、品詞の細分類、多義性
の個数、各品詞に対応する先頭訳語部(第44i)(B
)図参照)へのポインタがそれぞれの欄に書き込まれる
第13図に戻り、ステップ1061においては。
WS(m)の番地の単語が多品側かどうか判定する。周
知のように各単語及び連語は多品側をもつことが多く、
従って、この場合には一つの最も適切な品詞を選ぶ処理
を行わなければならない(以下この処理を多品側解消処
理と称する)、この多品側解消処理を実行するために本
発明方式では辞書メモリ300に格納された品詞認識用
パターン表(第6(A)図参照)が用いられる。単語又
は連語が多品側をもつ場合、ステップ1062において
、品詞名の1つがテスト用バッファメモリ(作業用メモ
リの一部が用いられるがここでは図示しない)にセット
される。ステップ1063においてはテスト用バッファ
メモリにセットされた品詞列と、第6(A)図に示した
禁制品詞列パターンとが順次比較され、一致するパター
ンを探す。
第9図に示す入力テキストの“ENGLISII”  
の多品側解消処理を行う場合を例にとって説明する。
” ENGLISH”  は名詞(N)及び形容詞(A
DJ)の2つの品詞を有する。まず“ENGLISH”
 の前後の2つずつの単語、つまり“HE”、 ”WR
OTE”と“VERY”、“5LOvLY”の品詞、代
名詞(PRN)、動詞(v7)と副詞(ADV)、副詞
(ADV)をそれぞれテスト用バッファにセットする。
この状態を第6(B)図に示す、ここで動詞(v7)の
添字(7)は、動詞の品詞細分類を示し、目的語をとる
他動詞であることを表示している。テスト用バッファ(
第6(B)図)の傘の位置に形容詞(ADJ)をセット
した後、第6(A)図に示した禁制品詞列パターンと比
較される。この結果、第6(B)図の品詞列パターンは
第6(A)図の項番7のパターンと合致し、  (−+
 V7.ADJv   +  )なるパターンは禁制さ
れることが検知される。従って“ENGLIS)I” 
の単語が、この文章においては形容詞をとり得ないこと
が認識される0次にテスト用バッファ(第6(B)図)
の・の位置に名詞(N)をセットして再び禁制品詞列パ
ターンと比較される。この場合にはいずれの禁制品詞列
パターンとも合致しないことが最終的に検知され、”E
NGLIS11″  の品詞は名詞であると決定される
再び第13図に戻り、ステップ1064において、更に
第6(A)図に示した禁制解除条件1゜2を満足してい
るかどうか判定される。
こうして禁制品詞列パターンに合致し、且つ解除条件も
満足しない場合には適切な品詞の候補から消去される(
ステップ1065)、品詞の候補が残っている場合はス
テップ1062に戻り同様の処理が繰り返される。この
処理によって最後に1個だけの品詞が残ったかどうかを
判定しくステップ1067)、YESの場合には残った
品詞をWS(m)番地の単語又は連語の品詞と決定する
(ステップ1069)。。
2個以上の品詞が最終的に残った場合にはステップ10
70に進み、ここで第15図のような優先度表による品
詞決定が行われる。2つの品詞、例えば形容詞(ADJ
)と名詞(N)とが残ってしまった場合、ADJを見出
し語とする第3行と、Nを見出しとする第2列とを査続
することによりADJ>Nなる関係、つまりADJの方
がNよりも優先度が高いということになり結局ADJが
採用されることになる。
以上、多品側解消処理の一例について述べたがこの処理
の効率、成功率を高めるために下記のような処理をする
こともできる。
(1)テスト用バッファメモリに候補となる品詞をセッ
トする際、出現頻度の高い順にセットすることにより処
理効率を上げることができる。
(2)第15図に示した優先度表は、2個以上の品詞が
最終的に残った場合に使用するものとして説明したが、
品詞の候補が最終的に全部消去されてしまった場合にも
、もとの品詞候補全体に対して第15図の表を用い、最
も高い優先度の品詞を採用することができる。
以上述べたように、単語及び連語の認識に禁制品詞列パ
ターンを用い、更に必要に応じて優先度る テーブルを用いてい蝉ので、品詞認識処理を迅速且つ正
確に実行できる。
(4)句構造認識 句構造!!識とは、英文人カテキ・ストの各単語及び連
語に唯一の品詞を与えることによってつくられた品詞列
から句要素に相当する部分を切り出す処理、および、そ
れらに新たに句要素品詞を付与することにより、パ品詞
付けされた句要素列(句要素品詞列)″を生成する処理
をいう。ここで句要素とは前述のように、英文法の句の
概念とは異なり、言語的意味をもつ最小単位の単語、又
は/及び連語の組み合せよりなるものである。例えば名
詞中名詞、助動詞+動詞、冠調子名詞、形容調子名詞、
前置調子名詞等は句要索を形成する。
つまり、従来の英方法では、″句″という概念は、かな
りゆるやかな定義機能しか持っておらず。
与えられた英文テキストに対して、どの部分が″句″か
について一意に定めることができない。
例えば本発明でいう″中心動詞となっている句要素″と
、′その目的語となっている句要素″は、従来の英方法
ではそれぞれ独立でも“句″であるが、同時にまたそれ
らを連結したものも“句″である。英文例をあげると、
″助動詞+動詞十冠詞+形容魚十名詞” (will 
havs a beautiful girl)は、英
文法の“句(動詞句)″とみなされるが、本発明でいう
″句要素″ではない。゛′助動詞+動詞” (vHl 
have)と“冠詞+形容調子名詞(abeautif
ul girl)とが11句要素である。
さらに多くの句を連結させた句、互いに重複した部分を
もつ異なる句なども、従来の英方法では定義され得る。
これに対し本発明では、中心動詞と、その目的語とは、
あくまでも別個の“句要素″である1本発明でいう“句
要索″は一般に、与えられた英文テキストに対して、−
意に、ただ一つ、互いに重複することなく定まるもので
あり、これらの組み合せを、文型認識ならびに文型変換
の基礎データとしている。
このことにより、句構造認識の処理を簡単かつ明確にす
ることができる。
第16図は句構造認識の処理の流れを示す、まずステッ
プ1080において、ワードストリームメモリエリア4
03の各単語及び連語のワードレコードが、ノードスト
リームメモリエリア404にセットされる。第17図は
セットされた状態を模式図として示したものでmlの行
に示したNS(1) 、 NS(2)・・・N S (
20)はノード番号である。
又傘2の行には対応する単語が格納されているが、実際
にはワードストリームテーブル(第14(A)図、第1
4(B)図参照)へのポインタの情報が格納される。−
3の行にはノードのカテゴリー、つまり単語(W)、句
要素(P)、節(C)、型筒(Q)、文(S)の区別を
表わす情報が格納される。傘4の行には品詞情報及び品
詞細分情報が格納される。
以後、このノードストリームメモリエリア404にセッ
トされた情報をもとにして句要素が切出されていく、ス
テップ1081において、ノードの最末尾の番号に+1
した番号をkにセットする。
すなわち、この処理により入力英文テキストは。
ピリオドやコンマも含めて(k−1)個の単語及び連語
から構成されたことになる。次にステップ1082にお
いて、ノード番号N5(1)、NS(2)。
・・・NS (k−1)を句要素列テーブルエリア40
5にセットする。ステップ1083において、句要素列
テーブルにセットされたノード番号のうち、n以上の番
号から(k−1)に至るまでの番号をC1l Cz、 
Cs・=Ch−nとする。ただし、nは繰返しが行われ
る直前にn=1に初期化されている。
さらにノードN5(Ct)、NS(Cz)、・・・の品
詞列パターンに関して、第7図に示した句要素として切
出すべき品詞パターンと合致するものが存在するかどう
か判定する。例えばn=1の場合はHEから始まる文の
品詞列、PRN、V、N・・・と登録パターンとが比較
され、n=2の場合はWRITEから始まる文の品詞列
V、N、ADV、・・・と登録パターンとが比較される
。品詞列が第7図に示す品詞パターンの2個以上と合致
した場合には、より長い品詞パターンと一致するものを
句要素として切出す。第17図に示した英文テキストの
場合にはn=4のとき、つまりVERYから始まる文の
品詞列がΔDV、ADV、COM、・・・となり、第7
図の登録パターンの項番1と一致するので”VERY 
5LOWLY”  が句要素として認識される。同様に
して、”To 5TUDY”、 ”TOREAD AN
D vRITE”。
”IN ENGLIS++” 、  ”AT 5C)1
00L” もそれぞれ句要素として認識される。
さて、ステップ1084においては、登録した句要素の
品詞列パターンと一致したノードの並びNS(CI)、
NS(C2)・・・をまとめて新たなノードN5(k)
をつくりこれを句要索列テーブルにセットする。
新しく生成されたノードN5(k)を親ノードと称する
。また元のノードN S (C1)、 N S (Cz
)・・・を子ノードと称する。第17図のテキストの例
ではN S (4)とN S (5)とをまとめて新た
なノードN S (21)をつくる。このノードの句要
素の品詞は第7図のテーブルより副詞(A D V)が
付与される。新たに形成された親ノードには新たなノー
ド番号が付与されると同時に、子ノードの番号も登録さ
れる。つまりノードN S (21)のメモリエリアに
格納される情報は、このノードN5(21)がノードN
 S (4)とN S (5)からつくられたものであ
ること、このノードが句要素であることCP)、句要素
の品詞は副詞(A D V)であること等である。
一方、ステップ1083において、Noと判定された場
合はステップ1086に進み、N5(C1)そのものを
句要索とみなす、つまり、この場合には新しいノードの
生成はしない。
次にステップ1085においては、新しく生成された親
ノードを子ノードに置換して句要素列テーブルを修正す
る処理が行われる。かくして、当初切要素列テーブルに
は1,2.3,4.・・・19゜2oの順にノードの番
号が並んでいたものが、新して句要素の生成により1,
2.3,21,6゜7.8,9,22,24,25,2
6.20の番号順に並びかえられる。(第17図参照)
なお、英文テキストが、例えば“Do you kno
w・・・”のような場合には#D、t+と“know”
が句要素を形成する。従って必ずしも連続した位置にあ
る複数の単語によって句要索が形成されるとは限らない
以上のように、従来の英文法における句とは異なる概念
であるr句要素」を定義し、入力英文テキストを「句要
素」の単位で切出し1句要素品調列を形成した後、骨格
パターンを作っているので、骨格パターンの形成に至る
処理及び和文生成の処理が容易になる。従来の英文法に
おける句の概念では、名詞句を含む名詞句、名詞句を含
む動詞句などがあり1句の切出しが困難である。
(5)連語辞書再検索 句構造認識の処理が終了した後に、もう−度連語辞書検
索の処理が行われる。連語辞書再検索を行う理由は次の
通りである。
英文中に出現する連語、つまり単語の連なりによりm語
と同様の意味や作用をなすものには2つのタイプがある
。1つは”MAKE USHOP”の如く。
固定された単語列よりなる連語であり、他の1つは、”
TAKE〜INTOC0N5IDERATION”のよ
うに、ある一定の性質をもつ単語や句や節を上記〜の部
分に取り込んでから初めて完成された連語を形成するも
のである。説明の便宜上、前者を固定型連語、後者を可
変型連語と称する。上記〜の部分には名詞句あるいは名
詞節がとりこまれる。第5(C)図に示すように連語辞
書には名詞を表わす品詞記号“N”を用いて“TOE 
! N INTOC0N5IDERATION”と記述
される。ここで!”の印は通常の単語のつづりと区別す
るための符号である。
前述のように、固定型連語の検索処理は、辞書検索の段
階ですでに済んでいるが、可変型連語の処理を行うため
には、句構造V、識が終了した後に再び連語辞書を検索
する必要がある。
第18図は連語辞書再検索の処理手順を示す。
まずステップ1090において、入力テキストの英文の
単語数kを作業メモリ400の適当なエリアにセットす
る1次にステップ1091において。
ノードN5(i)(第17ti参照)にある単語を見出
し語とする可変型連語が存在するかどうか判定される。
ただし、iは繰り返しが行われる直前にi=1に初期化
されている。もし存在しない場合は、ステップ1096
.1097に進み、全部の単語数について終了するまで
同じ判定が繰り返される。
入力テキストの英文が例えば“T)IE TE!ACH
ERTAKES HIS GOOD ATTITUDE
 INTOC0N5IDERATION”の場合、”T
AKE”を見出し語とする連語辞書検索で連語が存在す
ることが認識される(TAKE OUT 。
TAKE IN、  TAK[E ! N INTOC
0N5IDERATION等の連語がある。)1次にス
テップ1092において、ノードN5(i)の前後に存
在する句要素をつなげると、可変型連語辞書にあるパタ
ーンと一致するかどうか判定する。上記の例の場合、 
 ”)IIs GOODATTITUDE”は句構造認
識で名詞句(N)と認識されているので、連語辞書パタ
ーンの“TAKE IN INTO(1:0NsIDE
RATION”と一致する(第5(C)図参照)。
入力英文テキストが複数個の可変型連語パターンと一致
する場合には、最も長い可変型連語パターンを採用する
(ステップ1093)、更にステップ1094では、可
変型連語辞書の連語と一致する入力テキストの部分を新
しいノード(親ノード)とすると共に、新しく生成され
た親ノードを子ノードと置換して句要素列テーブルを修
正する。つまり、可変型連語パターンと対応する子ノー
ド群を句要索列テーブルから除去し、代りに新しい親ノ
ードを代入する。新しいノードの生成があった場合には
、そのノードを形成している最後の単語。
すなわち上記の例では” C0N5IDERATION
” の次の句要素から再び連語辞書検索が行われる(ス
テップ1095,1096,1097)。
以上説明した連語辞書再検索の処理により、最終的な句
要素列テーブルが作られる。
以上述べたように、連語辞書として固定連語辞書の他に
可変連語#書を有し、句要索切出しの後に可変連語辞書
の検索を行っているので、あらゆる連語の検出が少ない
辞書容量で可能になる。すなわち上記の例の場合、句要
素の概念を導入しなければ、!Nに相当するすべての品
詞列パターンを辞書に用意しておく必要があり、辞書容
量は美大になる。また品詞列パターンを用意してなけれ
ば、正確な翻訳ができないことになる。
以上までの一連の処理で品詞認識の処理が完了するので
、品詞認識用の規則の変更・増補を、以降の文型パター
ン認識の処理等に使用する文型パターンの変更・増補と
独立に設計することができる。
(6)英文型パターン認識 英文型パターン認識とは、ノードN5(i)を複数個ず
つまとめ、予め定められた英文のパターンに分類する処
理をいう。この英文型パターン認識は、各ノードに構文
的役割子を付与する段階と、この構文的役割子の配列か
ら文、節、章節を見い出す段階とに分けて考えることが
できる。ここで構文的役割子とは1句要索テーブル内の
各ノードが、文章の内部でどのような役割をもっている
のか、つまり主語(SUBJ)、中心動詞(GOV)。
目的語(OBJ)等のどれに相当するのかを表わすもの
である。
次に英文型パターン認識の処理の流れを第19図及び第
20(A)図を用いて説明する。
前述の句溝造認識処理の結果1句要素列テーブルメモリ
エリア405には第20図の串11゜傘12.@13.
傘14.傘15の各行のように情報が格納されている。
−11の行エリアにはノード番号の情報が格納される。
皐12の行エリアには各ノードに対応する単語又は連語
が格納されるが、実際にはノードストリームテーブルへ
のポインタの情報が格納される。傘13の行エリアには
ノードのカテゴリー、つまり、単語(W)、句要素(P
)、節(C)、章節(Q)、文(S)の節、文のタイプ
番号が格納されている。申15の行エリアには英文型パ
ターン認識の処理の過程で得られる構文的役割子の情報
が格納される。
第19図のステップ1100においては、句要素テーブ
ル405内の各ノードの品詞を順次調べ、動詞族(動詞
及びTo+動詞など)の品詞をもつものが検出される。
第20(A)図に示した例ではノードN5(2)、N5
(9)、N5(22)、N5(24)が動詞族である。
次にステップ1101では、検出された動詞族ノードの
動詞の細分情報(すなわち動詞のタイプ)を見出し語(
エントリー)として動詞パターンテーブルを検索するこ
とによって、動詞族ノード及びその前後のノードの構文
的役割子を決定する。
動詞パターンテーブルの一例は第8(A)図に示されて
いる0項番1は見出し語の動詞がbe@詞のタイプ(V
z)であり、かつ、その前後に。
「名詞(N)または代名詞(PRN)Jと「名詞(N)
または代名詞(PRN)Jがある場合、より詳しく換i
゛すればノード列N S (i L N S (j )
N5(k)の品詞が順に名詞(N)または代名詞(PR
N)、動詞(■1)、名詞(N)または代名詞(PRN
)の場合、ノードN S (i )には主語(SUBJ
)、N5Cj)#:=は中心動詞(GOV)。
N5(k)には補語(COMP)の構文的役割子がそれ
ぞれ付与されることを示している。また項番3には見出
し語が自動詞のタイプ(v8)であり、かつ、その前に
名詞(N)または代名詞(PRN)のノードがある場合
、より詳しく換言すれば、ノードN S (i )、 
N S (j )の品詞が順に「名詞または代名詞」、
「動詞Jである場合には、ノードNS (i)に主語(
SUBJ)、N5(j)に中心動詞(G OV)の構文
的役割子を付与すべきことを示している。又項番4は、
ノードN5(i)。
N S (j )の品詞が共に不定詞の形をとる動詞の
場合には、N5(i)に不定詞形の中心動詞(TOGO
V)、N5(j)に不定詞形の目的語(TO,0BJ)
の構文的役割子が付与されることを示している。
さて、第20(A)図に示した英文テキストの例では、
ノードN5(1)、N5(2)、N5(3)の品詞がそ
れぞれ代名詞(P RN)、動詞(v7)、名詞(N)
であるため、第8(A)図の項番6の品詞列と一致する
ことが検出される。従ってN S (1)(:。
に主語(SUBJ)、N5(2)4中心動詞(GOV)
、N S (3)に目的語(OBJ)の構文的役割子が
付与されメモリエリア噂15に格納される。更にノード
N S (22)、N S (24)の品詞列は項番4
のパターンニ一致し、ノードN S (22) ニTO
GOV、 N S (24)にTOOBJの構文的役割
子が付与される。同様にしてノードN5(8)、N5(
9)にも構文的役割子が付与される。なお、第8(A)
図はごく一部の動詞パターンを示したに過ぎず、実際に
は多数のパターンが用意される。
このようにして、第19図のステップ1101の処理の
結果、動詞の前後のノードN S (1) 。
N5(2)、N5(3)、N5(8)、N5(9)、N
5(22)。
N S (24)の構文的役割子が決定し、その他のノ
ードは未決定のままである。ステップ11o2において
、すべての動詞族ノードについて動詞パターン表の検索
が行われたかどうか判定し、YESの場合にはステップ
1103に進む。このステップ1103では句要素テー
ブル405内の残りのノードの品詞を順次調べ、接続詞
(CNJ)の品詞をもつものを検出する。更にステップ
11o4において、検出された接続詞族ノードについて
接続詞パターンテーブルを検索することにより、接続詞
族ノードの構文的役割子を決定する。
接続詞パターンテーブルの一例を第8(B)図に示す。
同図の項番1は、接続詞(CN J )の単語啜りが’
 B U T ”であり、この前後の構文的役割子列パ
ターンが、句読点(DEL)、BUT、主語(SUBJ
)、中心動詞(GOV)であった場合、単語BUTには
等位接続詞を表わす構文的役割子BUT(単語と同啜り
の記号)を付与すべきことを示している。項番2は、接
続詞の単語啜りが“IF”であり、この単語の前後の構
文的役割子列パターンが、主語(SUBJ)、タイプ8
の中心動詞(GOV)、I F、主語(SUBJ)と配
列されている場合は、上記単語gi I Fl FFに
名詞節を導<IFを表わす構文的役割子NIFが付与さ
れることを示す。同様にして項番3,4,5゜6には副
詞節を導<IFを表わす構文的役割子ADIF及び名詞
節をi < THATを表わす構文的役割子NTHAT
が付与される規則が示されている。
さて第20(A)図の英文テキストの場合、ノードN 
S (7)の単語の前後には、接続詞テーブル(第8(
B)図)の項番1のパターンと一致する構文的役割子列
パターンが存在する。従って上述のステップ1104の
処理を実行することによってノードN S (7)には
、構文的役割子BUTが付与される。なお、ノードN5
(6)と、N S C20)についてはそれぞれ品詞(
COMとPRD)をみて、自動的に句読点を表わす構文
的役割子(DEL)が付与される。
接続詞をもつすべてのノードについて接続詞テーブルの
検索が終了したかどうかを判定し、(ステップ1105
)その結果、終了した場合にはステップ1106に進む
。このステップ1106では、令名の処理で構文的役割
子が付与されなかったノード、つまり副詞(ADV)及
び前置詞的(PRENAL)の句品詞を有するノードに
、構文的役割子が未だ定まらないことを表わす未確定修
飾子(PENDM )が付与される。第20(A)図に
示す英文テキストの例では、ノードN5(21)、 N
5(25) 、 N S (26)にそれぞれ未確定修
飾子(PENDM)が付与される。
次にステップ1107において、接続詞族ノード、(た
とえばAND、BUT、OR,ADI F。
HT)IAT等の構文的役割子をもつノード)により区
切られた構文的役割子列パターンの中に、節パターン及
び型筒パターンがあるかどうか検索し、存在する場合に
は節及び型筒パターンテーブル(以を付与する。
節パターンテーブルの一例を第8(C)図に示す、同図
の項番1は、接続詞又は句読点により区来られた構文的
役割子列パターンの前に位置する接続詞(以下先行接続
詞という)の構文的役割子がrA、ND、OR,BUT
又は接続詞が無い(φ)」ときで、且つ上記構文的役割
子列パターンが[主語(SUBJ)土中心動詞(GOV
)Jの場合には、このパターンをまとめて新たな親ノー
ドを形成し、この親ノードのカテゴリーとして「文(S
)」、親ノードの構文的役割子として文章が完成したこ
とを表わすrSENTJ 、文のタイプとしては中心動
詞((30V)のタイプ番号(#)たとえばrTYPI
Jを付与すべきことを示している。節、文のタイプは、
その節や文を支配している動詞(中心動詞(GOV))
のタイプと同じく定められる。動詞のタイプ番号と例と
については表1(A)に示した。
同様に項番2は、親ノードのカテゴリーがr文(S) 
J 、構文的役割子は文が完成したことを表わすrsE
NTJ 、そして文のタイプとしては。
中心動詞(G OV)のタイプ番号(#)、たとえばr
TYP2Jなる場合の、子ノードの構文的役割子列を表
わす。
項番4は、接続詞又は句読点までの構文的役割子列のパ
ターンが「TO不不定梨型中心動詞(TOGOV) J
 + rTo不定詞型の目的語(TOOBJ) Jの場
合であって、そのパターンに先行するノードの構文的役
割子が「中心動詞(GOV)J又はrING型の中心動
詞(INGGOV) J ノ場合、そのパターンをまと
めて親ノードとし、その親ノードのカテゴリーを「章節
(Q) J 、構文的役割子を「目的語(OBJ)J、
i節のタイプとしては中心動詞(TOGOV)のタイプ
番号(#)、たとえばrTYP6」を付与すべきことを
示している。
項番6は、区切られたノード列の構文的役割子列のパタ
ーンが「主語(SUBJ)十中心動詞(GOV)十補語
(C;OMP)Jであって、そのパターンに先行するノ
ードの構文的役割子がrADIF(副詞節を導<IF)
Jである場合、このパターンをまとめて親ノードを形成
し、その親ノードにカテゴリーとしてr節(C) J 
、構文的役割子としてr CA D V (claus
ual adverb) J、節のタイプとしては中心
動g (G OV )のタイプ番号(#)、たとえばr
TYP2Jを付与すべきことを示している。
再び第19図の説明に戻り、ステップ1107で行われ
る処理を具体的に述べる。第20(A)図に示す英文テ
キストの場合、ノードN S (1) 。
N5(2)、N5(3)の構文的役割子列のパターンは
第8(C)図の項番3のパターンと一致する。従ってこ
れらのノードN5(1)、N5(2)、N5(3)をま
とめて新しい親ノードN S (27)が形成され、え 率11のエリアに格納される。又拳13のエリアにはカ
テゴリーが文であることを示す情報が格納され、廟14
のエリアには文のタイプTYP7が、−15のエリアに
は親ノードは文が完成していることを表わす構文的役割
子5ENTが格納される。
同様にノードN S (22) 、 N S (24)
の構文的役割子列のパターンは第8(C)図の項番4の
パターンと一致し、新たに親ノードN S (28)が
作られる。
この親ノードN S (28)には、カテゴリーとして
準節、章節のタイプはTYP6.W文的役割子は目的語
(OBJ)が付与される。
さらに、ノードN5(8)、N5(9)、NSC2g)
の構文的役割子列のパターンが第8(C)の項番3のパ
ターンと一致することが検出され上述と同様に、新たな
親ノードN S (29)かつ(られ検索の結果得られ
た情報がその親ノードN S (29)の各エリアに格
納される。
このようにしてステップ1107では、構文的役割子列
から文、節又は章節が検出され、節パターンに新たなノ
ード番号を付与する。ここでは詳しく説明しないが、新
しい親ノードが生成された場合は前に説明した手順と同
様にして1句要素列テーブル405の子ノードを消去し
、その代りに新しく生成された親ノードを置き換える処
理が行われる。この場合親ノードには子ノードへのポイ
ンタの情報が格納される。従ってステップ11o7の終
了した時点において句要素列テーブル405におけるノ
ードの配列は、順ニN S (27)、 N S (2
1) 。
N5(6)、N5(7)、N5(29)、N5(25)
、N5(26)。
N S (20)となる。
次にステップ1108に進み、節ノードが副詞節(CA
 D V)あるいは形容詞節(CADJ)となるときに
はこれらに未確定修飾子(PENDM)を付与する処理
が実行される。第20(A)図に示す英文テキストの場
合には副詞節及び形容詞節はないので新たに未確定修飾
子を付与されるノードはない。
ステップ1109では、接続詞等で区切られるには、最
後の処理ステップ1110に進む。ここでは、ステップ
1107の処理の結果得られた節パターンが、予め定め
られた骨格パターンと一致するかどうか判定し、一致し
た場合には新しいノードが生成される。この判定には第
8(D)図に示す骨格パターンテーブルが用いられる。
同図の記号と第20(A)図のメモリエリアに格納され
る情報との対応関係は第20 (B)図に示されている
すなわち、第20 (B)図は、1つのノードに対応し
て1つ定まる。第20(B)図は第20(A)図中の1
列分(串11〜傘15を1つずつ縦に並べたもの)の省
略化表記法である。
第20 (B)図中の*14には、単語、句要素の品詞
、または、節、章節1文のタイプ番号が格納される。
第20 (B)図中の傘15には構文的役割子が格納さ
れる。
第20 (B)図中の右肩の添字傘13にはノードのカ
テゴリー(W、P、Q、C,S)が格納される。
第20 (B)図中の傘16の分岐表現は、本ノードに
属する子ノードへのポインタを表現している。これは第
20(A)図中の申12の部分に格納されている情報に
対応している。
第20(B)図中の拳17の波線表現は、副詞句・節や
形容詞句・節の依存・修飾関係を表現する。すなわち波
線型矢印の連部にあるノードが、矢印の頭部にあるノー
ドを修飾することを表現する。
第8(D)図の項番1は、「カテゴリーが節(C)とな
っているノード」の前後がφの場合(ノードが無い場合
)、つまり未確定修飾子を付与したノードを除き、節パ
ターンが1個しかないときは、そのカテゴリー(本13
)を文(S)に変換すると共に、テーブルの−15のエ
リアには文が完成していることを示す構文的役割子(S
ENT)を格納すべきことを示している。
項番2は、カテゴリーが文(S)となっているノードの
次に構文的役割子が句読点(DEL)となっているノー
ド、その次にAND、BUT。
OR等の構文的役割子としてもっノード、その次にカテ
ゴリーが文(S)となっているノード、その次に句読点
(DEL)を構文的役割子としてもつノードのようなノ
ードのパターンが検出されたときには、これらをまとめ
て新しいノードを生成し、その新しいノードのカテゴリ
ー(申13)には文(S)、*14のエリアには重文で
あることを示す情報(COMPD)、中15のエリアに
は文章として完成していることを表わす構文的役割子5
ENTを格納すべきことを示している。
さて、第20(A)図に示す英文テキストの場合、未確
定修飾子のノードを除くノード列N5(27)、 N5
(6)、 N5(7)、 N5(29)、 N5(20
)のパターンは第8(D)図の項番2のパターンと一致
することが検出される。従ってこれらのノード列をまと
めて新しいノードN5(30)を生成し、その各エリア
傘13.傘14.中15に新しい情報が書き込まれる。
かくして、第20(A)図に示す英文テキストは、未確
定修飾子を付与したノードを除くすべてのノードが単一
のノードN S (30)にまとめられたことになる。
このノードN S (30)は1つの英文型骨格パター
ンと呼ばれる。
以上のように、構文的役割子の概念を8人し、句要素品
詞列を構文的役割子列に変換した後に、節、章節を検出
し、更に節、章節から文の骨格パターンを形成している
ので、複雑な英文に対しても容易且つ正確に、種々のパ
ターン設定、変更が可能である。又、骨格パターンは、
形容詞、副詞のように相手を修飾する構文的役割子、す
なわち未確定修飾子をもつものを除いた句要素により構
成されるので、骨格パターンの種類があまり多くならな
い。
(7)依存・修飾関係認識 依存・修飾関係認識とは、前述の英文型パターン認識の
段階で、構文的役割子として未確定修飾子(PENDM
)を付与されたノードが、とのノードの単語、句、節等
を修飾しているのかを認識、決定する処理をいう。
第21図は依存・修飾関係認識の処理手順を示す。ステ
ップ1120では、ノードN5(i)が、構文的役割子
として未確定修飾子(PENDM)を持つものかどうか
判定される。この判定の結果、YESであればステップ
1121に進み、依存・修飾関係の認識処理が実行され
る。一方、NOの場合には、ステップ1122に進み、
すべてのノードについてステップ1120の処理が修了
したかどうか判定される。もちろん、これが完了してい
ない場合にはステップ1120にもどり、同様の処理が
繰り返される。
第20(A)図に示したテキストを例にとって説明する
と、この英文の場合、ノードN5(21)。
N S (25) 、 N S (26)が、ステップ
1120の処理の結果、修飾光未決定と判定される。こ
れらのノードの修飾光は、辞書メモリ300(第3図参
照)に格納された依存・修飾関係認識用テーブルを参照
して決定される。
表2は依存・修飾関係認識用テーブルの一実施例を示す
。同表の項番1は、ノードN S (i )に関する条
件として、カテゴリーが単語(W)9句要素(P)、型
筒(Q)、節(C)のいずれかであって、その品詞が副
詞(A D V)で且つ、そのノードが文頭にあるか或
いはそのノードの前に句読点(COM)がある場合には
、そのノードの構文的役割子として副詞的修飾子(AD
VAL )を付与し、番号の最も若いノードで構文的役
割子が5ENTなるノードを修飾すべきことを意味して
いる6項番2,3,4.5についてもそれぞれ表に記載
されたように、ノードN S (i )に関する条件と
、そのノードN5(i)が修飾をする相手先のノード番
号及びN S (i )に付与される構文的役割子との
関係が予め定められている。
第20 (A)図に示した英文テキストのノードN S
 (25)について考えると、このノードの品詞は前置
詞(PRENAL)であり、且つそのノードの直前に名
詞(N)のノードがないから表2の項番4の規則が適用
される。従って、修飾先のノードは、品詞が動詞族で且
つノード番号が25より小さい範囲で一番大きいもので
あるから、結局、ノードN S (24)ということに
なる、そして上記ノードN S (25) (7)構文
的役割子はADVALとなる。
同様にノードN S (26)についても表2の項番4
の規則が適用され、修飾先のノードはN S (22)
、構文的役割子はADVALとなる。
ノードN S (21)について適用される規則は、表
2では省略されている同様の考え方に従って、ノードN
 S (2)を修飾することが最終的に決定される。第
20(A)図において+の表示は、αのノードがβのノ
ードを修飾していることを示している。
以上の依存・修飾関係の処理により、ノード間の関係が
すべて定まり、ノード列から遊離したノードは無くなる
。この依存・修飾関係の処理は、複雑な修飾関係を持つ
文章の正確な翻訳を可能とする。
(8)文型変換 文型変換とは、ノードの配列の順番を英文型パターンか
ら和文型パターンに変換することをいう。
第22図は上記文型変換の処理の流れを示す。
まずステップ1130において句要素列テーブルに最終
的に残っているノード、つまりカテゴリーがs、44文
的役割子が5ENTなるノードを検出し、そのノード番
号をkとする。第20(A)図に示した英文テキストの
場合にはノードN S (30)が最終的に生成された
単一のノードであり、従ってこのノードがN S (k
)と表わされる。
次にステップ1131において、ノードN S (k)
の子ノード列の並びを読み出し、そのノード番号列を句
要素列テーブルにセットする。第20(A>図の英文テ
キストの場合、ノードN S (30)の子ノード列は
、N S (27)、 N S (6)、 N S (
7)、N S (29)。
N S (20)であるからそれらのノード番号27,
6゜7.29.20がこの順番に句要素列テーブルにセ
ットされる。ここでは句要素列テーブルに並べられる番
号の個数をm個と仮定する。
更にステップ1132において、ノードN5(k)の子
ノード列を作業用メモリ400内の英文型ノード列バッ
ファエリア406にセットする。
ステップ1133においては、辞書メモリ300内の文
型変換用パターンテーブル307を検索し、上記のバッ
ファエリア406にセットされた子ノード列の構文的役
割子の並びと一致する英文型パターンをみつける。上記
文型パターンテーブルの一例は表3に示されており、そ
の内容については後述する。
ステップ1134では、一致した英文型パターンに対応
する和文型パターンを文型変換用パターンテーブルより
読み出し、作業用メモリ400内に設けられた和文型ノ
ード列バッファエリア407にセットする。
表3の文型変換用パターンテーブルは、英文型パターン
を和文型パターンに変換するときの変換規則を示してい
る。項番1は、英文テキストの親ノードの構文的役割子
が文(SENT)であり、その子ノード列が5ENT、
DEL、BUT。
5ENTの場合は、和文型パターンにおける構文的役割
子の並びは5ENT、”、” 、BUT。
5ENTになることを意味している。項番3は、親ノー
ドのカテゴリーが文(S)又はに6CC)であって子ノ
ード列の構文的役割子が、主語(SUBJ)、中心動詞
(GOV) 、Toを伴う目的語(丁00BJ)の順に
並んでいた場合には、和文型パターンは5tJBJ、 
TOOBJ、 GOV (7)順に構文的役割子が並び
かえられたものになることを意味している。
第20(A)図の英文テキストの場合、子ノード列の構
文的役割子は5ENT  DEL  BUTSENTで
あるから表3の項番1の英文型パターンと一致し、従っ
てステップ1133の処理により項番1に示された和文
型パターンに変換される。
第22図の説明に戻り、ステップ1134においては上
記のステップ1133の処理により得られた和文型パタ
ーンを、和文型ノード列バッファエリア407のノード
JN(1)にセットする。第23図は英文型ノード列バ
ンファエリア406の内容が、文型変換されて和文型ノ
ード列バッファエリア407に格納された状態を示して
いる。
次にステップ1135では、和文型ノード列テーブルJ
N(u)内のノードのうち、自己のノードを修飾してい
るノードがあるかどうか判定し、その結果“ある″場合
は、ステップ1136に、″ない”場合はステップ11
37に進む。第20(A)図のテキストの場合、N S
 (27)及びN5(29)については自己のノード(
又は自己のノードの子ノード)を修飾するノードがある
のでステップ1136に進む。
ステップ1136においては修飾するノードを修飾され
ているノードの直前に割り込ませて和文型ノード列テー
ブルJN (Q)を書き換える処理が行われる。(第2
3図) 一方、ステップ1137では、QをノードN5(k)の
和文テーブルポインタにセットする処理が行われ、さら
にΩ=fl+1.i=1とした後。
ステップ1138の判定が行われる。このステップ11
38では、句要素テーブル内でi番目にあるノードのノ
ード番号をnl とするとき、ノードN S (n s
 )のカテゴリーが句要素(P)または語(W)かどう
か判定される。
第20(A)図のテキストの場合、ノードN5(30)
における子ノード列のうち、i番目(i=1)のノード
はN S (27)であり、このノードのカテゴリーは
文(S)であるからステップ1138の判定結果は” 
N O’″となりステップ1141の処理に進む。
上記ステップ1141ではノードN5(n+)の子ノー
ド列の並びを読み出し、句要素ノード列テ−プル内のn
lと置換する処理が行われる。従ってこれによりmも当
然増加することになる。そして読み出されたN S (
n 、)の子ノード列は前述の英文型ノード列バッファ
エリア406(第23図)にセットされる。第20(A
)図のテキストの場合。
ノードN S (27)の子ノードはN5(1)、N5
(2)。
N S (3)であるから、上記英文型ノード列バッフ
ァエリア406のノードEN(1)、EN(2)、EN
(3)に、それらのノードの構文的役割子である5UB
J、GOV、OBJがセットされるコトニなる。
この処理の後、再びステップ1133の結果に戻り、再
び文型パターンテーブル(表3)の検索が行われる。英
文型ノード列バッファエリア406に新たニセットされ
た5UBJ、GOV、OBJの構文的役割子の配列は、
表3の項番2の英文パターンと一致するから、これと対
応する和文型パターン、つまり5UBJ、OBJ、GO
Vに変換され、和文型ノード列バッファエリア407の
JN(2)にセットされる。更にステップ1135では
前述と同様にJN(2)のエリアにセットされたノード
のうち自己のノードを修飾しているものがあるかどうか
判定される。この結果、ノードN5(2)、GOV を
修飾しているノードがあることが分かる。従って修飾し
ているノードN S (21)の構文的役割子ADVA
I、(先ニPENDMからADVALに変換されている
)をGOVの直前に割り込ませてJN(2)のエリアの
構文的役割子列を並びかえる処理が行われる(ステップ
1136)、従って最終的にJN(2)のエリアにセッ
トされる構文的役割子列は5UBJ、OBJ、ADVA
L 、GOVの順番になる。(第23図) 以上のようにしてノードN S (30)の最初(i=
1)のノードN S (27)の処理が終ると、次の子
ノードN S (6)の処理に移る。このノードN S
 (6)のカテゴリーは語(W)であるから、ステップ
1138の判定の結果“YES”となり、i=i+1と
される。つまり次の子ノードN S (7)の処理に進
む、このノードN S (7)のカテゴリーも語(W)
であるのでi=i+1とされ、次の子ノードN S (
29)の処理に進む。ノードN S (29)は構文的
役割子が文(S E NT)であるから、その子ノード
列N5(8)、N5(9)、N5(28)の構文的役割
子が英文型ノード列バッファにセットされ、再び文型パ
ターンテーブルの検索が行われる(ステップ1134)
、こうして和文型パターンが見出され、最終的に和文型
ノードバッファ407のエリアJN(3)に第23図に
示す和文パターンがセットされることになる。
以上述べたようにしてノードN5(k)(第20(A)
図のテキストではに=30)の全ての子ノードについて
文型変換の処理が終了すると、ステップ1140に進む
。ステップ1140では句要素列テーブルの内容をすべ
て消去し1番号kをセットしておく、こうしてノードN
5(k)の文型変換処理が終了する。
以上のように、英文の文型パターンを認識する場合、句
要素を最下層に置き、中間に型筒、節ノード、頂点部に
文ノードを持つような簡明な階層構造を採用しているた
め、入力言語の文型(英文型)から出力言語の文型(和
文型)への変換が、「単なる兄弟ノード間の線形並べか
え」という形式で簡単に実現できる。したがって、従来
の入力言語解祈木から出カー゛語解析木への木構造変換
(Tree transduce)という複雑な処理を
回避することができる。また文型変換規則の変更も容易
となる。
(9)和文生成 和文生成とは、和文型パターンを形成するノードに訳語
を付与することにより、和文を生成する処理をいう。
第24 (A)図及び第24 (B)図は和文生成の処
理の流れを示す。
ステップ115oにおいて、句要素テーブル内に最終的
に生成された単一のノード、つまりカテゴリーがS、構
文的役割子がSE’NTのノードを検出し、そのノード
番号をkとする。次にステップ1151において、ノー
ドN5(k)を構成する英文パターンを文型変換処理す
ることにより得られた和文パターンを格納する和文型バ
ッファテープルへポインタQを検出する。そして和文型
バッファテーブルJN (Q)内に設定されたノード列
を読み出し、そのノード番号列を句要素列テーブルに設
定する。第20(A)図のテキストの場合には、文型変
換により、k=30.ノードN5(30)中の和文型バ
ッファテーブルへのポインタaはQ=1となっている。
そして和文型バッファ407のエリアJN(1)にノー
ドNSの番号として(27)、 (6)、 (7)、 
(29)、 (20)が格納されているので、この番号
列が句要素列テーブルにセットされる6説明の便宜上、
句要素列テーブルにセットされたノード番号の個数をm
個、そして、セットされたノード番号列をn1en2y
・・・Inm とする。
次にステップ1152においては、句要素列テーブル内
でi番目にあるノード番号をniとするとき、ノードN
 S (n i )のカテゴリーはP又はWか否か判定
される。第23図のバッファエリアJN(1)の最初(
i=1)のノード番号は27であり、ノードN S (
27)のカテゴリーは5ENTであるから上記の判定結
果は” N O”であり、従つてステップ1154の処
理に進む6 ステツプ1154においては、ノードN5(ns)中の
和文型バッファテーブルへのポインタの値をQとする。
そして和文型ノード列テーブルJN(Q)内にあるノー
ド列を読み出し、句要素列テーブル内のntと入れ替え
る。これによりmの値も当然増加する。
すなわち第23図の例では、N S (n s) = 
N S(n z) = N S (27)であり、N 
S (27)中のポインタΩはα=2である。そこでバ
ッファエリアJN(Q)つまりJN(2)に格納された
ノード列(1)。
(3)、 (21)が読み出され1句要素列テーブルに
セットされたノード番号(27)と入れ換えられる。こ
の結果句要素列テーブル内のノード番号の配列は、(1
)、 (3)、 (21)、 (2)、 (6)、 (
7)、 (29)、 (20)に変わる。従ってmも5
個から8個に変わることになる。この処理の後、再びス
テップ1152にもどる。そして新たに配列されたノー
ド列の最初(i = 1 )のノードN S (1)の
カテゴリーが句要素(P)または語(W)か否か判定さ
れる。ノードN S (1)のカテゴリーは語(W)で
あるから、上記の判定結果は“YES”となり、i=i
+1と置かれ、i>mかどうか判定され(ステップ11
53)だ後、再びステップ1152の処理にもどる。
以上述べた処理を繰り返すことによって、句要素列テー
ブルには第25図に示すようにノード番号が(1)、 
(3)、 (21)、 (2)、 (6)、 (7)、
 (8)、 (25)。
(24)、 (26)、 (22)、 (9)、 (2
0)の順に格納される。
これまでの処理により入力英文テキストが日本語固有の
語順に変換されたことになる。
次にステップ1155に進み、句要素列テーブル内のi
番目のノード番号をnlとする。そしてノードN5(n
i)に関する情報を格納しであるワードストリームテー
ブル403のエリア(第14(A)図)を検索して、更
にワードレコードに関する情報を格納しである単語・連
語メモリバッファメモリエリア401(第10図)を検
索することにより、該ノードN S (n + )の日
本語としての訳語を付与する。
例えば第25図のi=1のエリアに格納されているノー
ド番号(1)の訳語を付与する場合には。
ポインタによりまずワードストリームテーブル403の
エリアW S (1)の情報を検索し、更にW S (
t)に格納されているポインタにより、単語・連語バッ
ファメモリ401のエリアW B (1)の情報が検索
される。このエリアW B (1)には、ノードN S
 (1)の単語1(HE 17の訳語が格納されている
のでこの訳語情報を読み出す訳である。他のノードにつ
いても各ノードに対応するワードストリームテーブルへ
のポインタを、更に単語・連語バッファメモリへのポイ
ンタをたどることにより訳語を読み出すことができる。
次にステップ1156に進み、訳語に対して、時制様態
表現処理が必要か否か判定される。この時制様態表現処
理とは、動詞句の場合に1文型・肯定・否定・受身・時
制によりその訳語が変化することに対応する適切な訳語
を得るための処理である。したがって時制様態表現が必
要か否かの判定は、該当ノードが動詞句に対応するもの
かどうかによって判定される。換言すれば、ステップ1
156ではノードN5(nt)の構文的役割子がG O
V 、 TOGOV 、 TOOBJ等であルカ否カ調
へ、モジそうであれば、時制様態表現処理の必要ありと
判断する。
動詞句の訳の生成については、その動詞句が、(a)助
動詞を含む場合 (b)助動詞を含まない場合 の2つに分けて処理される。この処理の流れを第24 
(C)図に示す。
まずステップ1170においては、ノードN5(nl)
に属している動詞句を解析して、翻訳処理装置200中
のレジスタ(図示省略)に4つのフラグQ、N、S、’
rを下記のようにセットする。
つまり、Qは動詞句の文型、Nは背定、否定の区分、S
は能動、受動の区分、Tは時制によりそれぞれ0または
1の値がセットされる。
次にステップ1171に移り、ノードN5(n+)の子
ノード達の中に1品詞として助動詞(AUX)を持つも
のがあるかないか調べる。あればYESとしてステップ
1173に移り、無ければNoとしてステップ1172
に移る。ここでは、まずNoの場合、つまり上記の(b
)の場合について説明する。
ステップ1172では、翻訳処理装置200中のレジス
タから4つのフラグQ、N、S、Tの値を読み出し、そ
して、辞書メモリ300の和文生成用パターンメモリエ
リア308に格納された「語尾決定用テーブル」と比較
照合することにより、活用語尾と付加語尾とを決定する
。決定された語尾は翻訳処理装置200中のレジスタに
一時記憶しておく。「語尾決定用テーブル」の一実施例
の一部を表4に示す。表4では、Q=0のとき肯定文、
Q=1のとき疑問文、N=0のとき肯定形、N=1のと
き否定形、S=0のとき能動形。
S=1のとき受動形、T=Oのとき現在形、T=1のと
き過去形を示す。
表   4 たとえば、表4の項番1は1文章が肯定文(Q=0)で
、動詞句が肯定形(N=O) 、能動形(S=O)、か
つ、時制が過去形(T=1)の場合、動詞句の訳文は、
動詞の連用形の後に″た″を付加すべきことを示してい
る。
以下、具体例について1語尾決定の処理を述べる。
たとえば、ノードN S (n t )に属する#詞句
(ただしアンダーライン部分のみ)が III乳珪W却ENGLIS)I”である場合、第24
 (A)図のステップ1155により単語辞書(第4(
B)図参照)から訳語パ勉強″が取り出され、かつまた
語尾活用は′す変(す行変格活用)″であるという情報
が取り出される。これらの訳語・活用情報は、翻訳処理
装置200中のレジスタに一時セットされる。
次にステップ1156において、動詞句であるためYE
Sと判定されてステップ1157八移る。
ステップ]157は、すなわち第24 (C)図である
。第24(C)図のステップ1170によす4つのフラ
グQ=0(肯定文)、N=0(背定形)、5=0(能動
形)、T=1(過去形)が翻訳処理装置200中のレジ
スタにセットされる。
助動詞(AUX)はないので、ステップ1171ではN
oと判断され、ステップ1172に移る。
ステップ1172では、第3図中の和文生成用パターン
メモリエリア308に格納されている[語尾活用テーブ
ル(表4)」を検索する。すると(Q、N、S、T)の
パターンは、項番1と一致するので1項番1の訳出指示
の「連用子た」が検索される。一方、既に、翻訳処理装
置rt200中のレジスタには、(訳語、活用)情報と
して(勉強、す変)があるため、″す変の連用形+た″
つまり“した″なる語尾が“勉強”という訳語に付加さ
れて、″勉強した”という語尾付の訳語が決定される。
次にステップ1173に移った場合、つまりノードN5
(nt)の子ノード達の中に品詞として助動詞(AUX
)を持つものがあり、ステップ1171でYESと判断
された場合、つまり前述の(a)の場合について説明す
る。
ステップ1173では、まず、辞書メモリ300の和文
生成用パターンメモリエリア308(第3図参照)に格
納されている「助動詞細分類テーブル」を比較参照しつ
つ、ノードN S (n i)に属している動詞句中の
助動詞の分類コードを決定する。
この決定された分類コードは一時、翻訳処理装置200
中のレジスタに記憶される。「助動詞細分類テーブルJ
の一実施例の一部分を表5に示す。
表5の説明については後述する。
次にステップ1174に移る。このステップでは既に、
ステップ1170で決定されている「(Q。
N、S、T)フラグ情報」と、ステップ1173で決定
された「助動詞分類コード情報」を読み出し、そして辞
書メモリ300の和文生成用パターンメモリエリア30
8(第3図参照)に格納されている「助動詞を考慮した
語尾決定用テーブル」とを比較参照することにより活用
語尾と付加語尾を決定する。決定された語尾は、翻訳処
理装置200中のレジスタに一時記憶しておく。
r助動詞を考慮した語尾決定用テーブル」の一実施例の
一部分を表6に示す。表6の説明は後述する。
次に表5の解釈の仕方を説明する。
同表の縦軸には細分類された助動詞が列挙されており、
横軸には時制として原形、過去、過去分詞(pp) r
進行形(jng)・・・等が列挙されている。
D○1.CAL、CA2.・・・MAL、MA2.・・
・等は助動詞分類コードである。
ノードN5(ni)に属する動詞句を分析して、同表の
縦軸と横軸の入り口(エントリー)を見つけて、分類コ
ードを読み出すのである。
たとえば項番9と列番7の交叉する部分については、助
動詞句か、rshouldhave+V(PP)  (
過去形調型の動詞)」の形で出現している場合には、分
類コードとして、SD4が検索決定されることを示して
いる。
次に表6の解釈の仕方について説明する。
表6の縦軸には、助動詞の分類コードが列挙されており
、横軸には、動詞句の肯定、否定、疑問などの区別が既
述の(Q、N、S)フラグの1または0の値により列挙
されている。ノードN5(n、)に属する助動詞を解析
して得られる(Q。
N、S)フラグ値と、助動詞分類コードとを入り口(エ
ントリー)として、活用語尾と付加語尾とを選択決定す
るのである。
以下具体例について助動詞を考慮した語尾決定の例を述
べる。たとえばノードN5(nt)に属する動詞句(た
だしアンダーライン部分のみ)が、“you 5hou
ld haye token his opinion
 int。
:onsideration ”である場合、第24 
(A)図のステップ1155により、連語辞書(第5(
C)図診照)から訳語゛′!Nを考慮′″が取り出され
、かつまた語尾活用はパす変(す行変格活用)″である
という情報が取り出される。これらの連語・活用情報は
、翻訳処理袋@200中のレジスタに一時セットされる
6次にステップ1156において、FIJk句であるた
めYESと判定され、ステップ1157へ進む。ステッ
プ1157は、すなわち第24(C)図である。第24
 (C)図のステップ1170により4つのフラグ、Q
=O(肯定文)。
N=0(肯定形)、5=O(能動形)、T=傘(セット
せず)が、翻訳処理装置200中のレジスタにセットさ
れる。次にステップ1171に移るが、助動詞(AUX
)が存在するので、ステップ1171では、YESと判
断され、ステップ1173に移る。ステップ1173で
は、第3図中の和文生成用パターンメモリエリア308
に格納されている「助動詞細分類テーブル(表5)」を
検索し、項番9と列番7の交叉するところのコード゛’
SD4″′を検索し、翻訳処理装置200中のレジスタ
にセットする。
次にステップ1174に移る。このステップでは、辞書
メモリ300の和文生成用パターンメモリエリア308
(第3図参照)に格納されている「助動詞を考慮した語
尾決定用テーブル(表6)」の比較参照がおこなわれる
。既に、ステップ1170により、”Q=O,N=O,
S=O” なる7ラグ値がセットされているため、表6
の列番1のエントリーが選択される。また、既にステッ
プ1173により、助動詞分類コード” S D 4”
がセットされているため1表6の項番24のエントリー
が選択される。したがって1表6からは語尾情報として
は、″(終止)べきであった′″が選択決定される。
この決定結果と、既にステップ1155により検索され
ていた、訳語情報″!Nを考慮(す変)′″とが、照合
処理されて、“!Nを考慮するべきであった″という語
尾付きの訳語が決定される。
なお、!Nについては、”hjs opinion” 
に対応するノードに対する和文生成処理により、パ彼の
意見”という訳語が埋め込まれることはもちろんである
以上説明した時制・様態表現処理の実行が終了すると、
第24 (B)mのステップ1158の処理に進む。こ
のステップ1158では、訳語に対して付属語(て、に
、を、は)を付加する処理が必要か否かを判定して、必
要な場合はステップ1159に進む、この判定は該当す
るノードN5(n=)の構文的役割子が、主語族(SU
BJ。
C3UB、rosul) あるいは目的語族(OBJ。
TOOBJ、 I OB J 、 COB J等)であ
る場合にYES。
そうでない場合にNoとすることにより行われる。
ここで5UBJは主語、C3UBは「節の形をした主語
J 、 TO3UBは「To不定詞の主語」をそれぞれ
意味し、OBJは目的語、TOOBJはrTo不定詞型
の目的語J、l0BJは「間接目的語」、C0BJは「
節の形をした目的語」をそれぞれ意味する記号である。
ステップ1159における付属語付加処理を表3の項番
2を例にとって説明する。
項番2の和文型パターンは、5UBJ、OBJ。
GOVであるが、この場合、まず5UBJの次に0■す
、OBJの次に口の付属語記号が挿入される0次に、各
付属語記号に対応した付属語が割り当てられる。この割
り当てに際して、和文生成用テーブル308に格納され
た付属語テーブルが参照される。
表7は付属語テーブルの一例を示すもので、付属記号が
0■りのときは、付属語として″は″および″が″をと
り得ることを示し、■百ノ  のときは、“を”および
“に″をとり得ることを示している。
表    7 付属語記号が単一の付属語をとり得る場合は、付属語が
そのまま付属語記号に置き換えられる。
上記のように付属語記号が2個以上の付hル語をとり得
る場合は、次のようにして、単一の付属語が選択される
まずC■Dの場合は、当該ノード(at構文的役割子5
ENTのもの)が他のノードを修飾する場合には′が″
が付与され、その他の場合には″は”が付与される。
一方口については、動詞の訳語情報に、“に″をとり得
るというフラグがセットされていれば(第4(A)図の
付属語機能語の欄にセットされている)、″に”を付与
し、その他の場合には“を”を付与する。この結果、た
とえば”resemble”は〜に似る”と訳され、”
 5tudy”は“〜を勉強する′″のように訳される
このようにして付属語付加処理が終了すると5ステツプ
1160に進む。ここでは、ノードN5(nl)に対し
て最終的に得られた訳語を出力テキストテーブルエリア
408に左づめにセットする処理が行われる。その後、
ステップ1161に進みi>mの関係を満足するまで、
上述の処理が繰り返して実行される。
第26図は和文生成処理の結果、出力テキストテーブル
エリア408に得られる訳文を示している。すなわち、
傘20で示した和文型ノード列エリア407の各ノード
に訳語が付与され、出力テキストテーブルエリア408
には傘21で示す訳語が得られる。
以上の和文生成の処理においては、時制・様態表現処理
及び付属語付加処理を含んでいるので、正確な翻訳が可
能になる。また、時制・様態表現処理は構文的役割子と
して中心動詞族(GOV族)を持つノードだけ、付属語
付加処理は構文的役割子として主語、目的語族(SUB
J族、oBJ族)を持つノードだけ、のように局限され
ているので。
これらの処理が簡略化されると同時に修正、変更が容易
になる。
以上の一連の処理、すなわち入力英文の解析。
文型の変換、及び出力和文の生成等の過程における翻訳
規則がすべて辞書用メモリ内にテーブルの形で記述され
、翻訳処理装置は、これらのテーブルを解釈しながら実
行するように設計されている。
したがって翻訳規則の変更、修正、補強などを。
翻訳処理装置とは独立に、単に辞書メモリの内部情報の
書き換えのみで簡単に実行できる。
以上、本発明の実施例について説明したが、この方式に
よ才しば下記のような効果が得られる。
(])単単語帯と連語辞書が用意され、単語辞書の各単
語情報として、その単語を基にして形成される連語の有
無と、連語辞書へのポインタの情報が含まれているので
(a)単語を切り出しながら同時に連語の検索が可能で
ある。
(b)単語を基にして形成される連語が存在するときの
み、連語辞書を検索する。
ことにより、高速に辞書検索できる。
(2)連語辞書として、固定連語辞書の他に可変連語辞
書を有し、旬の切り出しの後に可変連語辞書の検索を行
っているので、あらゆる連語の検出が少ない辞書容量で
可能になると共に、連語検出に要する辞書検索を高速に
行い得る。
【図面の簡単な説明】
第1(A)図、第1(B)図は従来の翻訳方法の説明図
、第2図は本発明を適用した自動翻訳方法の概念の説明
図、第3図は本発明を適用した自動翻訳方法の構成図、
第4(A)図、第4(B)図は本発明方法に用いられる
単語辞書の一例を示す図、第5(A)図、第5(B)図
は本発明方法に用いられる固定連語辞書の一例を示す図
、第5(C)図は本発明方法に用いられる可変連語辞書
の一例を示す図、第6(A)図は本発明方法に基づく品
詞認識に用いられる禁制品詞列パターンの一例を示す図
、第6(B)図は品詞認識のための説明図、第7競り図
は本発明方法に基づく句構造認識に用いられるパターン
の一例を示す図、第8(A)図、第8(B)図。 第8(C)図、第8(D)図は本発明に基づく英文型パ
ターン認識に用いられるパターンの一例を示す図、第9
図は入力テキストストリームテーブルの説明図、第1o
図は単語・連語バッファ、メモリの説明図、第11(A
)図、第11(B)図、第11(C)図は本発明方法の
辞書検索における語尾変化処理の流れを示す図、第11
(D)図、第11(E)図は語尾変化処理の説明図、第
12図は本発明方法における辞書検索の処理の流れを示
す図。 第13図は本発明方法に基づく品詞認識処理の流れを示
す図、第14 (A)図、第14(F3)図はワードス
トリームテーブルに格納される情報の内容を説明するた
めの図、第15図は本発明方法に基づく品詞認識処理に
用いられる優先皮表を示す図、第16図は本9!明方法
に基づく句摺造認識の処理の流れを示す図、第17図は
ノードストリームテーブルに格納される情報の内容を説
明するための図、第18図は本発明方法の可変連語辞書
検索の処理の流れを示す図、第19図は本発明方法に基
づく英文型パターン認識の処理の流れを示す図、第20
(A)図、第20 (B)図は句要素列テーブルに格納
される情報の内容を説明するための図、第21図は本発
明方法に基づく依存・修飾関係認識の処理の流れを示す
図、第22図は本発明方法に基づく文型変換の処理の流
れを示す図、第23図は英文型ノード列テーブル及び和
文型ノード列テーブルに格納される情報の内容を説明す
るための図、第24 (A)図、第24 (B)図、第
24(C)図は本発明方法に基づく和文生成処理の流れ
を示す図、第25図は和文生成処理の説明図、第26図
は和文生成により、入力英文テキストに訳文が付与され
た状態を示す図である。 100・・・入力装置、200・・・翻訳処理装置、3
00・・・辞書メモリ、400・・・作業用メモリ、5
00・・・出力装置。 第 /  (A) 図 NP −−一一−−−−−−−−−−−第 1(B)図 −−−tLKe、 (L  bLls  j’rL I
L  C7UJ”WF”      Lup」 二ΔP− μ−−−−NP−−−−−− ’L  Z 口 M 4<A)図 躬 5(A)図 第Δ(A)図 F2’  h’   l   B、’   Bz’冨 
7 反 冨 3(A)図 冨3(B)図 ¥3(C)図 第 3(p)図 第  q  図 第1θ図 ¥J  1z  図 猶15図 第  /4   (A)  図 不 16   図 石I8図 第 19   図 1夕 2ρ (B)5コ 豪/’1 ¥yXI  図 % zz 図 第 23  図 Lη VJ24 (A)  図 巣Xi (F3)図 第 24  (C)  図 第 25  図 一1kジ   籾

Claims (1)

  1. 【特許請求の範囲】 1、単語の見出し語と、該単語を基にして形成される連
    語の有無と、該単語の訳語及び品詞情報を含む単語辞書
    と、 連語の見出し語と、該連語の訳語及び品詞情報を含む連
    語辞書と、を設け、 自然言語で記述された入力テキスト文より単語を切り出
    すステップと、 該単語を見出し語として上記単語辞書を検索し、該単語
    を基にして形成される連語が存在しない場合に、該単語
    の訳語及び品詞情報を所定のメモリエリアに格納するス
    テップと、 上記単語辞書検索の結果、その単語を基にして形成され
    る連語が存在する場合に、上記連語辞書を検索するステ
    ップと、 連語辞書検索の結果、入力テキスト文に含まれる連語が
    存在する場合に該連語の訳語及び品詞情報を上記メモリ
    エリアに格納するステップと、 連語辞書検索の結果、入力テキスト文に含まれる連語が
    存在しない場合には、上記の元の単語の訳語及び品詞情
    報を上記メモリエリアに格納するステップと、 を具備することを特徴とする自然言語処理における辞書
    検索方法。 2、第1項記載の方法において、連語辞書検索の結果、
    既にメモリエリアに格納された単語を含む連語が見出さ
    れた場合に、 該連語の訳語及び品詞情報を上記メモリエリアに格納す
    るステップと、 該連語に含まれ、既にメモリエリアに格納された単語の
    訳語及び品詞情報を無効にするステップと、 を具備することを特徴とする自然言語処理における辞書
    検索方法。 3、第1項記載の方法において、入力テキスト文に同一
    単語を含む連語が複数個見出された場合に、 最も長い連語の訳語及び品詞情報を上記のメモリエリア
    に格納するステップ、 を具備することを特徴とする自然言語処理における辞書
    検索方法。 4、単語の見出し語と、該単語を基にして形成される連
    語の有無と、該単語の訳語及び品詞情報を含む単語辞書
    と、 連続的な複数の単語よりなる固定連語の見出し語と、該
    固定連語の訳語及び品詞情報を含む固定連語辞書と、 単語列の一部にブランクを有し、該ブランクに適当な単
    語、句又は節を挿入することによつて形成される可変連
    語の見出し語と、該可変連語の訳語及び品詞情報を含む
    可変連語辞書と、を設け、 自然言語で記述された入力テキスト文より単語を切り出
    しながら、 上記単語辞書及び上記固定連語辞書を検索し、その訳語
    及び品詞情報を所定のメモリエリアに格納するステップ
    と、 入力テキスト文の品詞列から句及び/又は節を検出し、
    品詞を付与するステップと、 上記可変連語辞書を検索し、入力テキスト文中に可変連
    語を見出された場合に、該可変連語の訳語及び品詞情報
    を上記メモリエリアに格納するステップと、 を具備することを特徴とする自然言語処理における辞書
    検索方法。 5、第4項記載の方法において、可変連語辞書検索の結
    果、既にメモリエリアに格納された単語及び/又は固定
    連語を含む可変連語を見出された場合に、 該可変連語の訳語及び品詞情報を上記メモリエリアに格
    納するステップと、 該可変連語に含まれ、既にメモリエリアに格納された、
    単語及び/又は固定連語の訳語及び品詞情報、及び句及
    び/又は節の品詞情報を無効にするステップと、 を具備することを特徴とする自然言語処理における辞書
    検索方法。 6、第4項記載の方法において、入力テキスト文に同一
    単語を含む可変連語が複数個見出された場合に、 最も長い可変連語の訳語及び品詞情報を上記のメモリエ
    リアに格納するステップ、 を具備することを特徴とする自然言語処理における辞書
    検索方法。
JP63176905A 1988-07-18 1988-07-18 辞書検索方式 Granted JPH01162978A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63176905A JPH01162978A (ja) 1988-07-18 1988-07-18 辞書検索方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63176905A JPH01162978A (ja) 1988-07-18 1988-07-18 辞書検索方式

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP56138586A Division JPS5840684A (ja) 1981-09-04 1981-09-04 自然言語間の自動翻訳方式

Publications (2)

Publication Number Publication Date
JPH01162978A true JPH01162978A (ja) 1989-06-27
JPH0352101B2 JPH0352101B2 (ja) 1991-08-08

Family

ID=16021806

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63176905A Granted JPH01162978A (ja) 1988-07-18 1988-07-18 辞書検索方式

Country Status (1)

Country Link
JP (1) JPH01162978A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55131870A (en) * 1979-03-30 1980-10-14 Sharp Corp Data storing method of electronic dictionary

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55131870A (en) * 1979-03-30 1980-10-14 Sharp Corp Data storing method of electronic dictionary

Also Published As

Publication number Publication date
JPH0352101B2 (ja) 1991-08-08

Similar Documents

Publication Publication Date Title
JPH0351020B2 (ja)
US5895446A (en) Pattern-based translation method and system
EP0266001B1 (en) A parser for natural language text
CA1235817A (en) Method and apparatus for natural language processing
US5640575A (en) Method and apparatus of translation based on patterns
JPH0447364A (ja) 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
JPH05314166A (ja) 電子化辞書および辞書検索装置
Dror et al. Morphological Analysis of the Qur'an
Thet et al. Word segmentation for the Myanmar language
JP2001515616A (ja) 自動自然言語翻訳
JP2997469B2 (ja) 自然言語理解方法および情報検索装置
JPH09190453A (ja) データベース装置
JP3876014B2 (ja) 機械翻訳装置
JPH01162978A (ja) 辞書検索方式
Talmon et al. Morphological Tagging of the Qur’an
KR100404320B1 (ko) 문장 자동 색인 방법
Neme An arabic language resource for computational morphology based on the semitic model
JPH0345423B2 (ja)
JP2958044B2 (ja) かな漢字変換方法及び装置
JPH0345424B2 (ja)
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04130578A (ja) 未登録語検索方法および装置
JPH0345422B2 (ja)
Sarveswaran Morphology and Syntax of the Tamil Language