JPH0519186B2

JPH0519186B2 -

Info

Publication number: JPH0519186B2
Application number: JP63259630A
Authority: JP
Inventors: Zamora Antonio
Original assignee: International Business Machines Corp
Current assignee: International Business Machines Corp
Priority date: 1987-11-18
Filing date: 1988-10-17
Publication date: 1993-03-16
Also published as: EP0316743B1; US4852003A; JPH01142866A; EP0316743A2; DE3853045D1; DE3853045T2; EP0316743A3

Description

【発明の詳細な説明】

Ａ産業上の利用分野本発明は一般にはデータ処理手法、更に詳細に
説明すれば、ロマンス語（スペイン語、ポルトガ
ル語、イタリヤ語、フランス語、ルーマニヤ語な
どのラテン語系の言語）で動詞から前接語の語尾
を除去する装置に関する。Ｂ従来技術テキスト処理ワード処理システムは独立型並び
に分散型の用法の双方が開発されている。用語テ
キスト処理及びワード処理は本明細書では同義で
あり、基本的に、文書に書かれたテキストを構成
する英数字の文字ストリングの生成、編集、伝
達、及び印刷に用いられるデータ処理システムを
指す。特開昭63−36420号公報にワード処理のた
めの特定の分散処理システムが開示されている。
その特許出願の図面及び明細書は本発明を適用し
うるホストシステムの例として本明細書で引用さ
れる。Ｂ−１スペイン語スペイン語では、一定の動詞形に代名詞が付
いて新しいワードをつくることはよく知られて
いる。例えば、“dame”（英語の“give me”）
は動詞の命令形“da”と代名詞“me”からつ
くられる。これらの代名詞は先行するワードに
付着して新しいワードをつくるため“前接語”
と呼ばれる。前接語の形式で使用できるスペイン語の代名
詞は11あり、その用法は下記のように分類され
る。 (1) se：再帰代名詞又は非人称代名詞 (2) me、nos：第１人称（単数、複数） (3) te、os：第２人称（単数、複数） (4) lo、la、lo、los第３人称（対格） le、les：第３人称（与格）１つのワードにいくつかの前接語の代名詞が
付加されることがある。従つて、“da´melo”
（英語の“give it to me”）は第２の前接語を
含むだけではなく、基本的なアクセントのつけ
方に適合するように新しいワードにアクセント
が付けられる。スペイン語には基本的なアクセントのつけ方
の規則が３つある： (1) 最後のシラブルに強勢が付けられ、しかも
母音または“ｎ”ないし“ｓ”で終る全ての
ワードは明瞭なアクセント記号を有する。 (2) 語尾から２番目のシラブルに強勢が付けら
れるワードは、もし“ｎ”または“ｓ”以外
の子音で終るなら、明瞭なアクセント記号を
有する。 (3) 語尾から２番目のシラブルの前に強勢が付
けられたワードは常に明瞭なアクセントを有
する。強勢が付けられたシラブルの母音の上にアクセ
ント記号が書かれるほか、厄介な発音を避けるた
めに、一定の動詞と代名詞の組合わせに音調をよ
くする規則が適用される。第１人称複数の命令形
“vamos”（英語の“we go”）に前接語“nos”が
付くと最後の“ｓ”が削除される。従つて、
“vamos”＋“nos”は“va´monos”（英語の“let's
go”）となる。第１人称複数の前接語“se”が付
くと重なる“ｓ”は省略されるので、
“hagamos”＋“se”＋“lo”は“haga´moselo”（英
語の“Let's do it for them！”）を生ずる。前
接語“os”があとに来ると、第２人称複数の命令
形の最後の“ｄ”は省略されるので、“comed”＋
“os”は“comeos”（英語の“you eat！”）を生
ずる。スペイン語の前接形成の１つの特色は動詞の形
式が全て前接形式をつくるとは限らないことであ
る。不定形、動名詞（現在分詞）及び命令形の５
つの形式だけが前接代名詞をとることができる。
下記に示す動詞の形式“amar”（英語の“love”）
は幾つかの有効な前接形式を表わす：

【表】表中の１、２、３はそれぞれ第１人称、第２
人称、第３人称を指し、“Ｓ”及び“ｐ”はそ
れぞれ単数形及び複数形を指す。スペイン語の文法は前接語の代名詞に対し厳
格な優先順位を要求する。“se”は常に最初に
来ては次に第２人称、続いて第１人称、最後に
第３人称の代名詞が来る。もちろん、これらの
各々の任意であるが、３つ以上の代名詞が１つ
の動詞に付けられることは希である。Ｂ−２イタリヤ語イタリヤ語の属性は代名詞が一定の動詞形式
に付けられると新しいワードがつくられること
である。例えば、“dammi”（英語の“give
me”）は動詞の命令形“da”＋代名詞“mi”か
らつくられる（この場合、代名詞の最初の文字
は二重になる）。これらの代名詞は先行するワ
ードに付けられて新しいワードをつくるため
“前接語”と呼ばれる。しかしながら、動詞の
全ての形式が前接語をとるとは限らないい。不
定形、動名詞及び５つの命令形だけが前接代名
詞をとることができる。前接語で使用可能なイタリヤ語の代名詞及び
小辞は17あり、それらの用法は下記のように分
類される：

【表】幾つかの前接語の代名詞がワードに付けられ
るが、特定の膠着語形の規則に従わなければな
らない。動詞形は規則形または不規則形で終ら
なければならない。もし２つ以上の代名詞があ
るなら、“mici”、“tici”及び“vici”の組合せ
の場合（この場合には“ci”は指示詞であつて
人称代名詞ではないので一様に処理するため規
則形に含まれている）のほかは、あとに相補形
が来る代名詞の不規則形が用いられる。更に、スペリングを変更する２つの規則が用
いられる： (1) 動詞の不定形は、その不定形が“rre”で
終る場合（この場合には最後の“re”が削除
される）のほかは、前接語の代名詞が付加さ
れると、最後の“ｅ”が削除される。 (2) もし動詞の命令形で最後のシラブルに強勢
が付けられれば、その動詞に最も近い前接語
の子音は重ねられる（“gli”、“glie”の場合
を除く）。下記はこれらの場合の例を示す：

【表】

【表】規則の複雑さ及び前接語をとることができる
動詞形の数が多いため、前接語のある動詞形を
分解する強力な辞書及び分析手順が必要であ
る。語形論に基づいて、前接語、例えば
“Oslo”、“cola”を有すると思われるが、実際
には全く前接語尾ではない多くのワードがあ
る。イタリヤ語では未完了時制仮定法のような
動詞形には“si”の語尾を持つものがあり、適
切に分析されないと再帰代名詞と混同されるこ
ともある。コンピユータに基づいた辞書−前接
語の語尾を持つ動詞を含む―も幾つかあるが、
従来技術のものはどれも、多くのアプリケーシ
ヨンに必要な動詞の基本形を得るための自動的
に前接語を除去する問題には取組んでいない。Ｃ発明が解決しようとする問題点本発明の目的はロマンス語で動詞から前接語の
語尾を除去する方法を提供することである。更に、本発明の目的はスペイン語、イタリヤ
語、ポルトガル語、フランス語及びその他のロマ
ンス語で動詞から前接語の語尾を除去する方法を
提供することである。Ｄ問題点を解決するための手段本発明は前接形式を生成するのに使用された動
詞を識別するため前接語の語尾を除去するプロセ
スを含む。このプロセスは前接形成規則とは逆の
語形論的な変換、アクセントのつけ方とは逆の規
則、及び妥当な動詞形及び両義にとれる語句を識
別できる辞書索引の組合せである。本発明のアプリケーシヨン (1) ワード処理システムにおけるワード検査：前接代名詞は非常に豊富な組合せがあるため
徹底したリステイングによつても動詞形を完全
にカバーするのは困難である。ゆえに、前接語
のない動詞形を識別し生成する手順がワードリ
を検査する有効な方法として用いられる。 (2) データベースによる自然言語のアクセスのよ
うな言語分析アプリケーシヨンではどれも、疑
問符で用いられた動詞形を分離して質問を解釈
する必要がある。前接語の標準化によりロマン
ス語の動詞形の処理が可能となる。 (3) 計算機翻訳は前接語の形式の識別及び前接代
名詞のない動詞形の生成を必要とする。本発明
は計算機翻訳アプリケーシヨンによるロマンス
語の動詞の処理を可能にする。Ｅ実施例Ｅ−１スペイン語この実施例は前接形式を生成するのに使用さ
れた動詞を識別するために前接語の語尾を除去
するための、スペイン語に適用される反復プロ
セスから成る。反復プロセスは： (1) 前接形成及びアクセントのつけ方の規則と
は逆の語形論的な変換と、 (2) 妥当な動詞形を識別することができる辞書
の索引との組合せである。第１図はこのプロセスの流れを示す。ステツプ２０は前接語を除去するプロセスで
入力ワードを得るプロセスを示す。入力ワード
は辞書索引の共通フオントを保証するため必要
なら小文字に変換される。ステツプ２２で、ワ
ードの語尾は11の前接代名詞のリストについて
検査される。もしワードが前接語の語尾を持た
ないか、前接が間違つた順序で生じているか、
または３つ以上の前接語が見つかるなら、ワー
ドは妥当な前接語の語尾を持たないのでプロセ
スは終了する。ステツプ２４で、両義にとれるワードのリス
トが検査される。例えば、ワード“salte”は
“sal”＋“te”（英語の“（thou）get out”）とみ
なすか、又は、もしそのワードに前接語がない
と解釈すれば、そのワードは英語の“（you）
jump”を意味する。ワードが該リストで見つ
かると、出力ワードの形式は該リスト中の入力
ワードに関連して配置される。ステツプ２６は辞書索引プロセスである。こ
れはそのワードが動詞であるかどうかを決める
ため辞書中でそのワードの形式を見つける必要
がある。もしそれが動詞なら、それに対応する
語形変化表（表１）がアクセスされ、それがど
の動詞形であるかを決める。語形変化表一致手
順は該ワード形式の語尾と語形変化表で指定さ
れた語尾との一致

【表】 ′
futu5 areis
′
futu6 aran

【表】を含む。一致する語尾は表中の対応する文法形
に関連する。この一致手順は動詞形が前接語の
語尾をとる動詞形と一致するかどうかを決める
ことを可能にする。もし一致すれば、一致した
語尾と不定形の語尾とを置換えることにより動
詞の見出し語形式（一般に不定形）が得らえ
る。一致が成功すればこの手順は終了する。前接語の語尾はステツプ２７で除去される
が、前接語はステツプ２８及びステツプ３０で
参照するため保管される。ステツプ２８は前接語代名詞“os”が除去さ
れるときに適用されるプロセスである。一般
に、前接語“os”は単に除去されるだけである
が、もし“os”に先行する文字が母音“ａ”、
“ｅ”、“ｉ”又は（アクセンと記号付きの）
“ｉ”のうちの１つであるなら、前接語“os”
は除去されて“ｄ”に置換えられる。例えば、
“rei´os”は“reid”になり、“burlaos”は
“burlad”になる。それに対し、“obedeceros”
は単に“obedecer”となる。ステツプ３０は前接語“nos”又は“se”が
除去されるときに適用されるプロセスである。
これらの前接語は発見されると除去され、もし
（動詞の複数形を表わす）文字“mo”が先行し
ていれば、除去された前接語は“ｓ”に置換え
られる。例えば、“prepare´monos”は
“prepare´mos”になるが、“ri´anse”は“ri´an”
になる。このステツプはアクセントの除去とは
無関係であり、このステツプでつくられたワー
ド形の中には間違つたアクセントを有するため
辞書と一致しないものがある。ステツプ３２は正しいスペリングを有する辞
書との一致を再度試みるためアクセント（もし
あれば）除去する。ステツプ３４は“frei´dmelo”（英語の
“（you）fry it for me”！）のような複数の
前接語を有しアクセントが付けられたワードと
の一致を試みる際に除去されていることがある
アクセントを復元する。最初の試みでは、最初
の前接語だけが除去されて“frei´dme”を生す
るが、これは辞書とは一致しないので、ステツ
プ３２でアクセントが除去される。ステツプ３
４でアクセントが復元されてからワードステツ
プ２２に戻され、付加されている前接語の語尾
が検出され、あとで除去される。表２は前記プロセスの良好な実施例の擬似コ
ードを示す。本発明のこの実施例は特定のステ
ツプ列に関して説明されているが、これらのス
テツプの幾つかの順序はやや任意である。前接
語の除去及びアクセントの除去のような幾つか
の動作を組合せて、入力ワードのシラブルを考
慮する単一の動作にすることにより、プロセス
を簡素化することが可能である。Ｅ−２イタリヤ語この実施例は前接形式を生成するのに使用さ
れた動詞を識別するために前接語の語尾を除去
するための、イタリヤ語に適用するプロセスか
ら成る。このプロセスは(1)前接形式及びアクセ
ントのつけ方の規則とは逆の語形論的な変換と
(2)妥当な動詞形を識別できる辞書の索引との組
合せである。第２図はこのプロセスの流れを示
す。ステツプ１２０は前接語を除去するプロセス
で入力ワードを得るプロセスを示す。入力ワー
ドは

【表】

【表】辞書索引の共通フオントを保証するため必要な
ら小文字に変換される。ステツプ１２２で、入力ワードの語尾は規則
的且つ相補的な代名詞のリストについて検査さ
れる。もしワードが前接語の語尾を持たなけれ
ば、プロセスはワードが妥当な前接語の語尾を
もたないので終了する。ステツプ１２４で、両義にとれるワードのリ
ストについてワードが検査される。これは、も
し前接語の代名詞を持つワードも妥当な動詞形
なら、前接形式もそのように認識されることを
保証する。両義にとれるワードのリストは両義
にとれるワード、前接語のない対応する動詞
形、及び動詞の見出し語形式（オプシヨン）か
ら成る。このリストとの一致により手順は終了
する。例えば、ワード“segnalo”は動詞
“segnalare”（対応する英語：“to signal”）の
第１人称単数現在形とするか又は“segnare”
（対応する英語：“to mark”の第３人称単数命
令形＋前接語“lo”とすることがある。ステツプ１２６は辞書索引プロセスである。
これはそのワードが動詞であるかどうかを決め
るため辞書中でそのワードの形式を見つける必
要がある。もしそれが動詞なら、それに対応す
る語形変化表（表３）がアクセスされ、それが
どの動詞形であるかを決める。語形変化表一致
手順は該ワード形式の語尾と語形変化表で指定
された語尾との一致を含む。一致する語尾は表
中の対応する文法形に関連する。この一致手順
により動詞形が前接語尾をとる動詞形と一致す
るかどうかを決めることが可能になる。もし一
致するなら、一致した語尾と不定形の語尾とを
置換えることにより動詞の見出し語形式（不定
形）が得られる。一致が成功すればこの手順は
終了する。前接語の語尾はステツプ１２８で除去され、
ステツプ１３４での検査のため保管される。最
初に０にセツトされたカウンタはこの時点で増
分され、除去された前接語の語尾数をカウンタ
に記憶し、ステツプ１３２でカウンタを参照す
る。ステツプ１３０は前接形成中に適用されるス
ペリングの変更修正を逆にする。即ち、もし除
去さ

【表】

【表】たれた前接代名詞に先行する文字が“ｒ”な
ら、動詞形は不定詞でなければならないので、
“ｅ”又は“re”が付加される。そうではなく、
もし除去された前接語に先行する文字が前接語
の最初の文字と同じならこの重なつた文字も除
去される。これはたぶん最後のシラブルが強勢
を付けられた命令形の動詞であるからである。
“gli”及び“glie”については例外として考慮
される。ステツプ１３２で、ステツプ１２８で増分さ
れたカウンタを検査し、ワードから除去された
前接語の語尾数を調べる。もし２つの語尾が除
去されていて、辞書アクセスがワードの残りの
部分を動詞として確認するのにこれまで失敗し
ているなら、前接語を識別せずにプロセスは終
了する。ステツプ１３４は除去された語尾の相補形の
語尾であつたかどうかを検査する。その理由
は、もしそうなら、複数の前接代名詞の可能性
の検査を必要とするからである。しかしなが
ら、もし前接語の語尾が相補形ではなかつたな
ら、先行する辞書アクセスは動詞形を見つける
のが失敗したので、前接語の語尾を見つけるこ
となく出口へ出る。よつて、識別された前接語
の語尾は誤つた前接語である。ステツプ１３６で、相補的な前接語を持たな
いワードの語尾が不規則代名詞のリストにより
検査される。もしなにも見つからなければ、プ
ロセスは終了する。そして前の辞書アクセスで
は動詞が見つからなかつたので、前に見つかつ
た相補形の前接語は誤つた前接語とみなされ
る。しかしながら、もし不規則代名詞が見つか
れば、処理はステツプ１２８に戻り、語尾が除
去され、スペリングが正規化され、再び辞書が
アクセスされる。表４はこのプロセスの良好な実施例の擬似コ
ードを示す。この実施例は特定のステツプ列に
関連して説明されているが、これらのステツプ
の順序には任意な部分がある。前接語の除去及
びスペリング変更修正のような幾つかの動作の
組合せにより、プロセスを簡素化することが可
能である。

【表】

【表】Ｅ−３ポルトガル語ポルトガル語の前接代名詞の構造ポルトガル語の前接代名詞は、スペイン語又
はイタリヤ語の前接語とは異なり、動詞形の中
に埋め込むことができる。これらの前接語を形
成する規則を下記に示す。次いで、これらの情
報は前接代名詞が付加された動詞の最初の形式
を生成するため動詞形から前接語を除去するア
ルゴリズムの設計に用いられる。表５は代名詞及び短縮形の分類を示す。ブラジルのポルトガル語は省略記号による短
縮形を使用することができ、前接語が動詞、例
えば、dar−lhs'emosの未来形又は条件文形式
でそれ自身に埋め込まれるとき、−lhe−の代り
に特別な短縮形−lh'も使用することができる。一般的な前接形成規則どの動詞形も１〜３の前接語を持つことがで
きる。各々の前接語は動詞形にハイフンで分離
されて付加されるか埋め込まれる。もし前接語
が１つ使用されるなら、それはRP、PP、IO、
IP、PPIPC、

【表】

【表】又はIOIPCのいずれかである。もし前接語が２
つ使用されるなら、それらはPP＋IP、RP＋
PP、RP＋IO、RP＋PPIPC、またはRP＋
IOIPCのいずれかである。RP＋IPの組合せは
決して使用されない。もし前接語が３つ使用さ
れるなら、RP＋PP＋IPだけが有効である。こ
の場合、PPは変換規則によつて“nos”または
“vos”である。各前接代名詞はハイフンにより動詞形又は前
の代名詞から分離される。短縮形は、それ自身
による−lh'のほかは、２つの代名詞とみなさ
れ、前述の組合せで使用される。“ｌ”または
“ｎ”で始まるIP形式は下記の変換規則があて
はまる時にだけ使用される。埋込み規則：未来形及び仮定法の動詞形は、前接語を埋め
込む前に、語幹と語尾に分解され、語尾は前接
語の後に付加され、ハイフンによつて前接語か
ら分離される。動詞の語幹または前接語自身は
下記の規則により変換を受けることがある。未来形の語尾は：−ei、−a´s、−a´、−emos、−
eis、−a〓である。仮定法の語尾は：−ia、−ias、−ia、−i´amos、
−i´eis、−iamである。例：dar−lhe−emos dar−lho−emos 動詞“fazer”、“dizer”及び“trazer”の未
来形及び仮定法は、それらがラテン語の“far
(e)”、“dir(e)”、“trar(e)”の短縮した不定形か
ら引出されるので不規則であるが、埋め込みの
規則は上記と同じであり、変換規則、例えば、
farei＋ｏ＝＞ｆ a´−lo−eiにも従う。変換規則： IP形式−lo、los、la及び−la、ｓは下記の
２つの条件に従つて形式−ｏ、−os、−ａ、及び
−asの形式の変換としてのみ存在する： (1) 不定形（ないしは未来形、または不定形＋
語尾から成る条件法）の動詞形が前接語−
ｏ、−os、−ａ、または−asをとる必要がある
ときは、不定形の語幹の“ｒ”は落され、前
接語はそれぞれ−lo、−los、−la、または−
lasに変換される。もし“ｒ”に先行する母
音が“ａ”なら、それは“a´”に変り、もし
それが、“ｅ”であるが、“o〓e”ではないか
ら、それは、“e^”に変り、そしてそれが
“ｏ”なら、“o^”に変る。 (2) 形式が動詞“trazer”、“fazer”、“dizer”
、
及びそれらの派生語―“afazer”、
“satisfazer”、“bendizer”等のような―の
“ｚ”で終る形式が前接語−ｏ、−os、−ａ、
または−asをとる必要があるときは、“ｚ”
は落され、前接語はそれぞれ−lo、−los、−
la、または−lasに変換される。もし“ｚ”
に先行する母音が“ａ”なら、それは“a´”
に変り、もしそれが“ｅ”なら、それは、
“e^”に変る。 (3) “ｓ”で終る動詞形が前接語−ｏ、−os、−
ａ、または−asをとる必要があるときは、
“ｓ”は落され、前接語は−lo、−los、−laま
たは−lasにそれぞれ変換される。 (4) “mos”で終る第１人称複数の動詞形の最
後の“ｓ”は、前接語“−nos”があとに続
くと削除し、“mo−nos”を生成する。この
規則は前接語を埋め込む未来及び条件法の形
式にあてはまらない。 (5) 代名詞“nos”および“vos”のあとに−
ｏ、−os、−ａまたは−asが続くことになつて
いるときは、“nos”または“vos”の“ｓ”
は削除し、あとに続く前接語はそれぞれ−
lo、−los、−laないしは−lasに変換される。これらの規則は前接語の語尾が埋め込まれる
とこきもあてはまる。例：dar＋ｏ＝＞ｄ a´−lo traz＋ｏ＝＞tr a´−lo ｐ o〓es＋ｏ＝＞ｐ o〓e−lo darei＋ｏ＝＞ｄ a´−lo−ei daria＋as ＝＞ｄ a´−las−ia viveriam＋ｏ＝＞viv e^−lo−iam trazes＋nos＋ｏ＝＞trazes＋no−lo trazem＋nos＋ｏ＝＞trazem−vo−lo dispor＋ｏ＝＞dispo−ｏ−lo IP形式−no、−nos、−na、および−nasはそ
れらが文字“ｍ”で終る動詞形のあとか又は鼻
母音の組合せ“a〓o”および“o〓e”のあとに生
ずるときは形式−ｏ、−os、−ａおよび−asの変
換である。語尾−nosも人称代名詞であること
は両義にとられる可能性がある。例：lavavam＋os ＝＞lavavam−nos trazem＋ｏ＝＞trazem−no 表６はポルトガル語の前接語処理の擬似コー
ドを示す。第３図はポルトカル語の前接語を除去する手
順の流れを示す。ステツプ２２０は前接語を除去するプロセス
において入力ワードを得るプロセスを示す。ステツプ２２２で、ワードを検査し、それが
ハイフンを有することを確認する。もしワード
にハイフンがなければ、そのワードがポルトガ
ル語の前接語の語尾を持つことはありえず、プ
ロセスは終了する。ステツプ２２４で、ワードの最後にハイフン
で結ばれたストリングを検査し、それが条件法
又は未来形の動詞の語尾であるかどうかを調べ
る。もしそうなら、その語尾は将来の使用のた
め保管される。

【表】

【表】ステツプ２２６で、ワードの最初のストリン
グ（最初のハイフンまでの部分）が分離され
る。これは動詞の語幹、即ちヘツド（主要部）
に相当する。この動詞の語幹を検査して次の処
理を決める。ステツプ２２８で、動詞の語幹の最後の文字
を検査し、それにアクセントが付いているかど
うかを調べる。もしアクセントが付いていれ
ば、次の処理がステツプ２３０で行われる。ア
クセントが付いていない動詞の語幹の処理はス
テツプ２３６で行われる。ステツプ２３０は“ｚ”プロセスを適用す
る。このプロセスはリストを索引することによ
りアクセントのある（“ｒ”よりも“ｚ”に復
元すべき）動詞の語幹を識別することを含む。
このリストには、“contrafaz”から来る
“contraf a´”のような項目及び、動詞
“fazer”、“dizer”及び“trazer”から引出さ
れる他の動詞形式から成る。“ｚ”プロセスは
条件法又は未来形の語尾がないときにだけあて
はまる。ステツプ２３２では、動詞の語幹に続く語尾
を検査して、それが“−la”、“−las”、“−lo”
または“−los”であるかどうかを調べる。も
しそうなら、アクセントのある文字をアクセン
トのない文字と取替え、動詞の語幹に“ｒ”を
復元する。ステツプ２３４では、未来形又は条件法の語
尾を、もしあれば、動詞の語幹に付加して該復
元された動詞を生成し、プロセスを終了する。ステツプ２３６では、アクセントのない動詞
の語幹に“ｚ”プロセスを適用する。このプロ
セスは、検査されるワードのリストが、
“contrafiz”から来る“contrafi”のようなア
クセントのない項目から成るほかは、ステツプ
２３０のプロセスと同じである。ステツプ２３８は“mo”プロセスを適用す
る。このプロセスは“mo”で終る動詞の語幹
を検査し、“ｓ”が削除されているかどうかを
調べる。もし動詞の語幹に続く前接語が“−
la”、“−las”、“−lo”、“−los”ないしは“−
nos”、又はもう１つの前接語があとに来る
“−no”であれば、動詞の語幹に、“ｓ”が付
加され、プロセスは終了する。ステツプ２４０では、動詞の語幹に続く前接
語を検査し、それが“−la”、“−las”、“−lo”
または“−los”であるかどうかを調べる。も
しそうなら、そして未来形又は条件法の語尾が
ないなら、動詞の語幹の“ｓ”が復元され、プ
ロセスは終了する。ステツプ２４２で、“ｒ”＋未来形又は条件法
の語尾を、もしあれば、動詞の語幹に付加して
その動詞を復元し、プロセスは終了する。Ｅ−４フランス語フランス語の前接語フランス語の前接語は動詞の末尾に付加さ
れ、ハイフンで分離される。前接語の存在は先
行する動詞のスペリング又はアクセントのつけ
方には影響しない。従つて、フランス語の前接
語は動詞をその最初の状態に復元するために識
別し除去するのが最も容易である。前接語のほ
かに、フランス語のワードの中には前接語から
識別しなければならない副詞の小辞を付加する
ものがある。フランス語で使用される前接語の代名詞とし
て、ce、ces、cet、cette、elle、elles、en、
eux、il、ils、je、la、le、les、leur、lui、
me、moi、nous、on、te、toi、tu、vous及び
ｙがある。時には、代名詞は“ａ−ｔ−il”の
ように、“音調のよい”小辞“ｔ”により動詞
から分離される。“ｔ”は音調をよくする目的
に使用されるだけであり、代名詞を表わすもの
ではない。代名詞“me”及び“te”は一定の
他の代名詞があとに来るときには短縮される。
従つて、“me”のあとに“en”が来るときは、
montrez−o'en”（英語の“show it to me”）
のように“m'en”に短縮される。これらの快
音調及び短縮の慣習のほかは、例えば、
“donnez−le−moi”のように、フランス語で
は動詞の末尾に少なくとも１つの前接代名詞を
付加し、ハイフンで分離することができる。前接代名詞のほかに、フランス語のワードは
ハイフンで分離した副詞の小辞“di”及び“ｌ
a´”をとることができる（例、“fille−ci”）。Ｆ発明の効果前述にように、本発明によれば、スペイン語、
イタリヤ語、ポルトガル語、フランス語、及びそ
の他のロマンス語で動詞から前接語の語尾を除去
する装置が提供される。

【図面の簡単な説明】

第１図はスペイン語の動詞から前接語の語尾を
除去する方法の流れ図、第２図はイタリヤ語の動
詞から前接語の語尾を除去する方法の流れ図、第
３図はポルトガル語の動詞から前接語の語尾を除
去する方法の流れ図である。２２……前接語の語尾を検査するステツプ、２
７……前接語を除去するステツプ。

Claims

【特許請求の範囲】１ホスト・データ・プロセツサと、該ホスト・
データ・プロセツサに接続された記憶装置と、端
末制御装置を介して該ホスト・データ・プロセツ
サに接続された出力装置および入力装置とを備え
たロマンス語処理装置において、有効な１以上の前接語を、その各々の前接語の
発生可能性を示す優先順位値とともに記憶する手
段と、ワードを入力する入力手段と、上記入力ワードと上記１以上の前接語とを比較
し、上記入力ワードの語尾の一致を判別する手段
と、上記語尾の前接語に該当する第１の優先順位値
を記憶する手段と、上記入力ワードから上記語尾を除去する手段
と、上記語尾を除去した残余ワードと上記１以上の
前接語とを比較し、上記入力ワードの第２の前接
語を識別する手段と、上記第１の優先順位値と上記第２の前接語に対
応する第２の優先順位値とを比較する手段と、上記第２の優先順位値が上記第１の優先順位値
よりも大でないとき、上記残余ワードを出力する
手段と、上記第２の優先順位値が上記第１の優先順位値
よりも大であるとき、上記残余ワードから上記第
２の前接語を除去し残りのワード部を出力する手
段と、を有することを特徴とするロマンス語処理装置。