JP2000259635A

JP2000259635A - 翻訳装置及び翻訳方法並びに翻訳プログラムを記録した記録媒体

Info

Publication number: JP2000259635A
Application number: JP11065445A
Authority: JP
Inventors: Takeshi Kutsumi; 毅九津見
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1999-03-11
Filing date: 1999-03-11
Publication date: 2000-09-22
Anticipated expiration: 2019-03-11
Also published as: US6385569B1; EP1037153A3; JP3539479B2; EP1037153A2

Abstract

(57)【要約】【課題】単語辞書にない入力原文から接辞と語基の組
み合わせが複数存在する派生語を認識した際、本来の接
辞と語基とからなる正確な派生語を抽出して訳語を生成
する。【解決手段】単語辞書と、接辞辞書と、第１言語であ
る原語を入力する入力部と、単語辞書を参照し、入力原
語を第２言語である訳語に変換する変換部と、単語辞書
及び接辞辞書を参照し、変換部によって訳語に変換され
ない入力原語から接辞と語基とからなる派生語を認識す
る認識部と、認識された派生語の接辞に対応した訳語と
語基に対応した訳語を連結して一つの派生語の訳語を生
成する派生語訳生成部と、認識部により複数の接辞が含
まれる派生語が認識された際、言語的特性情報から付与
された接辞処理条件に基づいて一つの接辞を決定する接
辞決定部とを備え、前記派生語訳生成部は、接辞決定部
によって決定された接辞とこれに対応する語基とからな
る派生語の訳語を生成するよう構成される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、単語辞書に登録さ
れていない接頭辞・接尾辞と語基からなる派生語を抽出
して訳語を生成する翻訳装置及び翻訳方法並びに翻訳プ
ログラムを記録した記録媒体に関する。

【０００２】

【従来の技術】近年、英日翻訳等の翻訳装置の要望が高
くなり、種々開発されている。従来の翻訳装置は、例え
ば、キーボードなどの入力手段からソース言語（原語）
を記憶手段に入力し、この入力されたソース言語を、単
語辞書、文法規則および木構造変換規則を記憶したテー
ブルを利用して、翻訳処理手段によってターゲット言語
（目的語）に翻訳するものである。このとき、単語辞書
に登録されていない原語は、通常、未知語として処理さ
れるので、後から未知語について別の字典などを参照し
て翻訳する必要があった。

【０００３】しかし、未知語の中には、既知の単語（語
基）に接頭語や接尾語を付加した派生語があり、派生語
を構成する語基が単語辞書に登録されており、派生語に
含まれる接頭語、接尾語の解析が可能であれば、語基の
意味と、接頭語や接尾語の意味から派生語の意味も推定
することができる。

【０００４】例えば、特開昭６１−２６８８０２０号公
報に記載によれば、単語辞書と接辞辞書とを備え、入力
された原文中に未知語が検出された際、その未知語が、
既知語に接頭辞または接尾辞が連結した派生語であるか
否かを調べ、派生語として認識されたものに対して、条
件に従って、特に、目的語（訳語）生成用の文法情報を
も付与した文法的性質、意味的性質または訳語等を推定
する構成にして、解析結果や翻訳結果の確実性を向上さ
せることができる派生語処理方式が提案されている。

【０００５】

【発明が解決しようとする課題】しかしながら、上記の
特開昭６１−２６８８０２０号公報に記載の派生語処理
方式では、以下に示すように、派生語の構成によって
は、適切な訳語が得られないという問題がある。（１）接辞が複数含まれる派生語の場合、接辞を正確に
抽出する機能がないため、例えば、“exportable”とい
う単語を翻訳すると、接頭辞“ex”と既知語“portabl
e”からなる派生語であると認識され、訳語「前携帯用
の」として翻訳される可能性がある。しかし、“export
able”という英単語は、既知語“export”と接尾辞“ab
le”からなる派生語と認識する方が正しい。

【０００６】（２）語基の表記に接尾語の表記が一部分
が含まれる場合、語基を正確に抽出する機能がないた
め、“noter ”という単語を翻訳すると、単語“not ”
と接尾辞“er”からなる派生語であると認識される可能
性がある。しかし、“noter ”という英単語は、既知語
“note”と接尾辞“er”からなる派生語と認識する方が
正しい。

【０００７】（３）接辞の訳語が画一的に登録されてい
るため、例えば、接頭辞“non ”の訳語が「非」と定め
られていると、“nonremunerative ”という英単語は、
接頭辞“non ”と既知語“remunerative”からなる派生
語と認識され、その訳語は、“non ”の訳語「非」と
“remunerative”の訳語「利益がある」が連結された
「非利益がある」となり、これは不自然な訳語となる。
語基の訳の形から、“non ”の訳語は、「〜がある」を
「〜がない」に置換して、“nonremunerative ”という
英単語は、「利益がない」と翻訳される方が日本語とし
て自然な訳語となる。

【０００８】本発明は、以上の事情を考慮してなされた
ものであり、例えば、単語辞書にない入力原語から接辞
と語基の組み合わせが複数存在する派生語を認識した
際、本来の接辞と語基とからなる正確な派生語を抽出
し、自然な訳語を生成することができる翻訳装置及び翻
訳方法並びに翻訳プログラムを記録した記録媒体を提供
する。

【０００９】

【課題を解決するための手段】本発明は、単語辞書と、
接辞辞書と、第１言語である原語を入力する入力部と、
単語辞書を参照し、入力原語を第２言語である訳語に変
換する変換部と、単語辞書及び接辞辞書を参照し、変換
部によって訳語に変換されない入力原語から接辞と語基
とからなる派生語を認識する認識部と、認識された派生
語の接辞に対応した訳語と語基に対応した訳語を連結し
て一つの派生語の訳語を生成する派生語訳生成部と、認
識部により複数の接辞が含まれる派生語が認識された
際、言語的特性情報から付与された接辞処理条件に基づ
いて一つの接辞を決定する接辞決定部とを備え、前記派
生語訳生成部は、接辞決定部によって決定された接辞と
これに対応する語基とからなる派生語の訳語を生成する
ことを特徴とする翻訳装置及び翻訳方法並びに翻訳プロ
グラムを記録した記録媒体である。

【００１０】本発明によれば、ソース言語の言語的特性
情報から付与された接辞処理条件に基づいて接辞を決定
する手段を備えることによって、単語辞書にない入力原
文から接辞と語基の組み合わせが複数存在する派生語で
も、その中から最適な接辞を決定しこれに対応する語基
とから正確な派生語を認識し、自然な訳語を生成するこ
とができる。

【００１１】

【発明の実施の形態】なお、本発明において、第１言語
の単語に対する第２言語の訳語、品詞情報、文法情報な
どを登録した単語辞書、接頭辞情報、接尾辞情報、接辞
処理条件などを登録した接辞辞書、接辞訳変更情報テー
ブルは、例えば、本体と分離可能な磁気テープやカセッ
トテープ等のテープ系、フロッピーディスクやハードデ
ィスク等の磁気ディスクやＣＤ−ＲＯＭ／ＭＯ／ＭＤ／
ＤＶＤ等の光ディスクのディスク系、ＩＣカード（メモ
リカードも含む）／光カード等のカード系、あるいはマ
スクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュＲ
ＯＭ等による半導体メモリを含めた固定的にプログラム
を担持する記憶媒体で構成してもよい。入力部は、例え
ば、キーボード、マウス、ペン・タブレット等の入力装
置、通信装置、記憶媒体読取装置などで構成してもよ
い。変換部、認識部、派生語訳生成部、接辞決定部は、
例えば、ＣＰＵ、ＲＯＭ、ＲＡＭ、Ｉ／Ｏポートからな
るコンピュータで構成してもよい。変換部、認識部、派
生語訳生成部、接辞決定部は、形態素解析部、構文解析
部、構文変換部、派生語処理部、ターゲット言語生成部
として機能する。

【００１２】なお、本発明において、接辞は、接頭語、
接尾語のことをいう。また、語基は、その派生語の基本
的な意味をもつ単語であり、派生語は、「接頭語＋語
基」、「語基＋接尾語」、「接頭語＋語基＋接尾語」の
形の単語をいう。前記接辞処理条件が、接辞の長さ情報
であってもよいし、語基の動詞の変化形情報であっても
よいし、語基の品詞情報であってもよい。これらの情報
を組み合わせてもよい。また、前記接辞処理条件が、接
辞と語基間のハイフン情報であってもよい。

【００１３】前記認識部が一つの接辞に対して複数の語
基がある派生語を認識した際、言語的特性情報から付与
された動詞の変化形情報に基づいて一つの語基を決定す
る語基決定部をさらに備え、前記派生語訳生成部は、語
基決定部によって決定された語基とこれに対応する接辞
とからなる派生語の訳語を生成する構成にしてもよい。
なお、この構成において、語基決定部は、ＣＰＵで構成
してもよい。この構成によれば、ソース言語の言語的特
性情報から付与された動詞の変化形情報に基づいて派生
語の語基を決定するよう構成したことにより、派生語に
対して接辞が一意に定まっているがこれに連結し得る語
基が複数通り存在する場合でも、その中から最適の語基
が決定されるので、派生語の派生語を形態素解析がより
正確に行える。

【００１４】前記接辞辞書は、語基の品詞とその活用形
に対応して接辞の訳語を変更するための接辞訳変更情報
を記憶した接辞訳変更情報テーブルをさらに備え、前記
派生語訳生成部は、接辞訳変更情報に基づいて語基の訳
語に対応して接辞の訳語を変更する構成にしてもよい。
なお、この構成において、接辞訳変更情報テーブルはＲ
ＯＭで構成してもよい。この構成によれば、派生語の訳
語を生成する際、語基の訳語に対応して接辞の訳語を変
更することができるので、派生語としてより自然な訳文
を生成することができる。

【００１５】前記派生語訳生成部は、一度訳語を生成し
た派生語を既知語として処理する構成にしてもよい。

【００１６】以下、図に示す実施例に基づいて本発明を
詳述する。なお、これによって本発明は限定されること
はない。

【００１７】図１は本発明の一実施例である翻訳装置の
構成を示すブロック図である。本実施例では、説明をわ
かりやすくするためにソース言語（原語）が英語であ
り、ターゲット言語（目的語）が日本語であるような機
械翻訳装置を例にとり説明するが、ソース言語（原語）
及びターゲット言語（目的語）はそれ以外の独語、仏
語、スペイン語、蘭語、露語、中国語、などの言語を対
象とした機械翻訳装置であってもよい。図１において、
１はコピュータのＣＰＵ（中央処理装置）からなる制御
部を示し、制御部１は、プログラムメモリに記憶された
制御プログラムにより各部を制御する。

【００１８】２はキーボード、マウス、ペン、タブレッ
ト、スキャナ、文字認識装置などの入力装置や、通信回
線と接続されている通信装置、記憶媒体読取装置などか
らなる入力部を示し、入力部２は、翻訳言語の指定、原
語の入力、翻訳開始の指示の他、通信、プログラムのイ
ンストールなどを行う。

【００１９】３はＣＲＴ（陰極線管）ディスプレイ、Ｌ
ＣＤ（液晶ディスプレイ）、ＰＤ（プラズマディスプレ
イ）などからなる表示装置３ａや、サーマルプリンタ、
レーザプリンタなどからなる印字装置、または通信回線
と接続されている通信装置３ｃで構成される出力部を示
し、出力部３は、入力部２による入力結果、制御部１の
制御により翻訳結果を表示装置３ａに表示したり、印字
装置３ｂを介して印字したり、通信装置３ｃを介して送
信する。４はバスラインを示し、制御プログラムデータ
及びアドレスデータが転送される。

【００２０】５はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲ
ＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやＣＤ−
ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク
系、ＩＣカード（メモリカードも含む）／光カード等の
カード系などを含めた記憶媒体からなるプログラムメモ
リを示し、プログラムメモリ５は、形態素解析部５ａ、
構文解析部５ｂ、構文変換部５ｃ、ターゲット言語生成
部５ｄ、派生語処理部５ｅ、接辞決定部５ｆ、語基決定
部５ｇ、派生語訳生成部５ｈとして機能する各制御プロ
グラムを記憶している。

【００２１】特に、形態素解析部５ａ、構文解析部５
ｂ、構文変換部５ｃ、ターゲット言語生成部５ｄは、入
力された第１言語の原語を第２言語である訳語（ターゲ
ット言語）に変換する変換部として機能する。制御部１
の制御動作に応じてプログラムメモリ５から制御プログ
ラムを読み出して各部を制御することにより本発明の翻
訳装置を実現する。

【００２２】６はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲ
ＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやＣＤ−
ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク
系、ＩＣカード（メモリカードも含む）／光カード等の
カード系などを含めた記憶媒体からなるテーブルメモリ
を示し、テーブルメモリ６は、第１言語に対応する第２
言語を記憶した単語辞書テーブル６ａ、言語的特性情報
から付与された文法規則を記憶した文法規則テーブル６
ｂ、翻訳規則を記憶した翻訳規則テーブル６ｃ、言語的
特性情報から付与された動詞の規則変化形情報を記憶し
た動詞規則変化形テーブル６ｄ、言語的特性情報から付
与された接辞処理条件や語基の品詞とその活用形に対応
して接辞の訳語を変更するための接辞訳変更情報を記憶
した接辞テーブル（接頭辞テーブル、接尾辞テーブル、
接頭辞処理パターンテーブル、接尾辞処理パターンテー
ブル）６ｅとして機能する各テーブルを記憶している。

【００２３】また、接辞処理条件として、接辞の長さ情
報、語基の動詞の変化形情報、語基の品詞情報、接辞と
語基間のハイフン情報であってもよい。

【００２４】７はマスクＲＡＭ、ＥＥＰＲＯＭ、フラッ
シュＲＯＭ等による半導体メモリ、あるいは磁気テープ
やカセットテープ等のテープ系、フロッピーディスクや
ハードディスク等の磁気ディスクやＭＯ／ＭＤ／ＤＶＤ
等の光ディスクのディスク系、ＩＣカード（メモリカー
ドも含む）／光カード等のカード系などを含めた記憶媒
体からなるバッファメモリを示し、バッファメモリ７
は、原文バッファ７ａ、辞書検索バッファ７ｂ、変換前
構文バッファ７ｃ、変換後構文バッファ７ｄ、訳文バッ
ファ７ｅ、マッチ接頭辞バッファ７ｆ、マッチ接尾辞バ
ッファ７ｇ、語基バッファ７ｈ、語基用辞書検索バッフ
ァ７ｉとして機能する領域に備えている。制御部１は、
翻訳処理、派生語処理の進行に応じて処理したデータを
各バッファに記憶する。一度訳語が生成された派生語
を、既知語として処理する。

【００２５】８はマスクＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲ
ＯＭ、フラッシュＲＯＭ等による半導体メモリ、あるい
は磁気テープやカセットテープ等のテープ系、フロッピ
ーディスクやハードディスク等の磁気ディスクやＣＤ−
ＲＯＭ／ＭＯ／ＭＤ／ＤＶＤ等の光ディスクのディスク
系、ＩＣカード（メモリカードも含む）／光カード等の
カード系などを含めた本体と分離可能なメディアで構成
した固定的にプログラムを担持する記憶媒体を示し、記
憶媒体８に本発明の機械翻訳プログラムを記憶し、入力
部２の記憶媒体読取装置によりバッファメモリ７の予備
領域に翻訳プログラムをインストールすることにより本
発明の翻訳機能を実現してもよい。また、この記憶媒体
は、本翻訳装置がインターネットを含めた外部の通信ネ
ットワークとの接続が可能な通信装置を備えている場合
には、その通信装置を介して通信ネットワークからプロ
グラムをダウンロードするように流動的にプログラムを
担持する媒体であってもよい。尚、このように通信ネッ
トワークからプログラムをダウンロードする場合には、
そのダウンロード用プログラムは予め本体装置に格納し
ておくか、あるいは別な記録媒体からインストールされ
るものであってもよい。尚、記録媒体に格納されている
内容としてはプログラムに限定されず、データであって
もよい。

【００２６】本発明の別の観点によれば、単語辞書６
と、接辞辞書６と、第１言語である原語を入力する入力
部２とを備えた翻訳装置にコンピュータで読み取り可能
な翻訳プログラムを記憶した記憶媒体を用いることによ
り、コピュータ１に、単語辞書６を参照させ、入力原語
を第２言語である訳語に変換させ、単語辞書及び接辞辞
書を参照させ、訳語に変換されない入力原語から接辞と
語基とからなる派生語を認識させ、認識された派生語の
接辞に対応した訳語と語基に対応した訳語を連結して一
つの派生語の訳語を生成させ、複数の接辞が含まれる派
生語が認識された際、言語的特性情報から付与された接
辞処理条件に基づいて一つの接辞を決定させ、決定され
た接辞とこれに対応する語基とからなる派生語の訳語を
生成させることができる。

【００２７】図２は図１の翻訳装置による各翻訳処理の
手順を示すブロック図である。図２に示すように、機械
翻訳処理方法の１つとして、構文トランスファー方式が
ある。この方式は、入力されたソース言語の原文に対し
て、Ｓ１で、辞書検索・形態素解析を行い、Ｓ２で、構
文解析を行い、各解析を進めて、ソース言語の構文構造
を得て、Ｓ３で、これをターゲット言語の構文構造木に
変換し、Ｓ４で、各解析結果から、訳語を選択し、Ｓ５
で、ターゲット言語を生成する方式である。

【００２８】ここで、図２に示すＳ１、Ｓ２の各処理に
ついて説明する。Ｓ１の［辞書検索・形態素解析］形態素解析部５ａは、単語辞書テーブル６ａ、文法規則
テーブル６ｂ、翻訳規則テーブル６ｃを用いて、入力さ
れた原文から単語を検索し、入力された原文を各形態素
列（単語列）に分割し、この各単語に対する品詞などの
文法情報および訳語を得て、さらに、動詞規則変化形テ
ーブル６ｄを用いて、時制・人称・数などを解析する。

【００２９】Ｓ２の［構文解析］構文解析部５ｂは、文法規則テーブル６ｂを用いて、形
態素解析された単語間の係り受けなどの文章の構造を解
析し、構造解析木を決定する。

【００３０】図３は本実施例の翻訳処理（１）の手順を
示すフローチャートである。図３を用いて、図２に示す
Ｓ１の辞書検索・形態素解析処理の手順を説明する。Ｓ
１１で、原文が原文バッファ７ａに入力されると、ま
ず、単語ごとに分割が行われ、全文単語数が求められ
る。辞書検索の動作に移り、単語位置変数であるｎに１
がセットされる。Ｓ１２で、ｎ番目の単語の辞書検索が
試みられてからいずれかの処理経路を通ってＳ１９の処
理に至り、ｎが全文単語数に達していなければ、Ｓ２０
で、ｎを１増加し、Ｓ１２の処理に至るという動作が繰
り返し行われる。

【００３１】Ｓ１２で、ｎ番目の単語を辞書検索を行っ
て、辞書検索が成功した場合は、Ｓ１４で、辞書データ
の単語を辞書検索バッファ７ｂに格納し、Ｓ１９の処理
に至る。また、Ｓ１２で、ｎ番目の単語を辞書検索を行
って、辞書検索が失敗し、既知語が検索できなかった場
合は、Ｓ１５で、ｎ番目の単語の派生語処理を行う。

【００３２】この派生語処理に成功した場合は、Ｓ１７
で、派生語に関する情報を辞書検索バッファ７ｂに格納
し、Ｓ１９の処理に至る。Ｓ１５で、派生語処理に失敗
した場合は、Ｓ１８で、ｎ番目の単語を未知語として扱
い辞書検索バッファ７ｂに格納する。Ｓ１９で、ｎが全
文単語数に達していたら、辞書検索・形態素解析処理を
終了し、図２に示すＳ２の構文解析処理に移る。

【００３３】［実施例１］実施例１では、例えば、“ex
portable”、“uncleared ”、“nonradioactive”とい
う３種類の英単語（ソース言語）の派生語処理の手順に
ついて説明する。ここでは、ソース言語の特質を考慮し
て適切な接辞を選ぶ例（その１）として接辞の長さに関
して、英単語“exportable”の派生語処理を行う。

【００３４】図４は本実施例の翻訳処理（２）の手順を
示すフローチャートである。また、図４は、図３のＳ１
５の「ｎ番目の単語の派生語処理」を詳細に示したもの
であり、入力単語１個あたりの派生語処理の動作手順を
示す。Ｓ１０１で、語基バッファ７ｈがクリアされる。
次に、Ｓ１０２に進み、接頭辞マッチング処理が行われ
る。Ｓ１０１とＳ１０２の処理間で、接頭辞にハイフン
が付いているか否かを判定するＳ２０１の処理を設定し
てもよい。接頭辞にハイフンが付いている場合は、接頭
辞が決定されたものと見なし、Ｓ１０９の接頭辞処理に
進む。接頭辞にハイフンが付いていない場合は、Ｓ１０
２の処理に進む。

【００３５】図５は本実施例の翻訳処理（３）の手順を
示すフローチャートである。また、図５は図４のＳ１０
１の「接頭辞マッチング処理」を詳細に示したものであ
る。図５において、Ｓ３０１で、接頭辞テーブルのポイ
ンタ変数ｎｐに１がセットされる。Ｓ３０２で、マッチ
接頭辞バッファ７ｆがクリアされる。Ｓ３０３で、接頭
辞テーブルのｎｐ番目のレコードの接頭辞とのマッチン
グが試みられてから、いずれかの処理経路を通ってＳ３
０７の処理に至り、ｎｐが接頭辞テーブルの終端に達し
ていなければ、Ｓ３０８で、ｎｐを１増加し、Ｓ３０３
の処理に至るという動作が繰り返し行われる。

【００３６】単語“exportable”の場合、図１１に示す
接頭辞テーブルを参照して、ＩＤ（レコード番号）が１
の接頭辞“ex”とマッチするので、ｎｐが１のときに、
Ｓ３０３からＳ３０４に進み、ＩＤの１番目の接頭辞
“ex”がマッチ接頭辞バッファ７ｆにセットされる。Ｓ
３０５で、入力語“exportable”が接頭辞“ex”のつい
た派生語であるとした場合の語基を求め、その結果、
“portable”という文字列が語基バッファ７ｈにセット
される。

【００３７】Ｓ３０６で、接頭辞と語基とを関連づける
ため、マッチ接頭辞バッファ７ｆの１番目のレコードの
「語基ポインタ」欄に、語基バッファ７ｈのうち“port
able”が格納されているレコードの番号である“１”を
格納する。この結果、マッチ接尾辞バッファ７ｆは、図
１７に示すような記憶内容になる。入力語“exportabl
e”に対して図１１の接頭辞テーブル中の接頭辞でマッ
チするものは上記の“ex”だけなので、図５の接頭辞マ
ッチング処理は終わり、図４に示す処理に戻り、Ｓ１０
２からＳ１０３の処理に進み、接尾辞マッチング処理が
行われる。Ｓ１０２とＳ１０３の処理間で、接尾辞にハ
イフンが付いているか否かを判定するＳ２０２の処理を
設定してもよい。接尾辞にハイフンが付いている場合
は、接尾辞が決定されたものと見なし、Ｓ１０７の接尾
辞処理に進む。接尾辞にハイフンが付いていない場合
は、Ｓ１０３の処理に進む。

【００３８】図６は本実施例の翻訳処理（４）の手順を
示すフローチャートである。また、図６は図４のＳ１０
３の「接尾辞マッチング処理」を詳細に示したものであ
る。図６において、Ｓ４０１で、接尾辞テーブルポイン
タ変数ｎｓに１がセットされ、次に、Ｓ４０２に進み、
マッチ接尾辞バッファ７ｇがクリアされる。Ｓ４０３
で、接尾辞テーブルのｎｓ番目のレコードの接尾辞との
マッチングが試みられてから、いずれかの経路を通って
Ｓ４０７に至り、ｎｓが接尾辞テーブルの終端に達して
いなければ、Ｓ４０８でｎｓを１増加し、Ｓ４０３の処
理に至るという動作が繰り返し行われる。

【００３９】単語“exportable”の場合、図１２の接尾
辞テーブルを参照して、ＩＤ( レコード番号) が１の接
尾辞“able”とマッチするので、ｎｓが１のときに、Ｓ
４０３からＳ４０４に進み、ＩＤの１番目の接尾辞“ab
le”がマッチ接頭辞バッファ７ｇにセットされる。

【００４０】Ｓ４０５で、入力語“exportable”が接尾
辞“able”のついた派生語であるとした場合の語基を、
ＩＤの１番目の接尾辞“able”の「連結条件」欄を参照
して求め、その結果、“exportable”から接尾辞“abl
e”を単純に除去した“export”という文字列と、「連
結条件」に従って語基の末尾の“e ”が除去された可能
性があると見なして、末尾に“e ”を補った“exporte
”いう文字列とが、語基バッファ７ｈにセットされ
る。

【００４１】Ｓ４０６で、接尾辞と語基とを関連づける
ため、マッチ接尾辞バッファ７ｇの１番目のレコードの
「語基ポインタ」欄に、語基バッファ７ｈのうち“expo
rt”および“exporte ”が格納されているレコードの番
号である“２”と“３”を格納する。この結果、マッチ
接尾辞バッファ７ｇは、図１８に示すような記憶内容に
なる。そして、語基バッファ７ｈは、図１９に示すよう
な記憶内容になる。

【００４２】入力語“exportable”に対して、図１２の
接尾辞テーブル中の接尾辞でマッチするものは上記の
“able”だけなので、図６の接尾辞マッチング処理は終
わり、図４の処理に戻り、Ｓ１０３からＳ１０４の処理
に進む。

【００４３】図４の処理において、接頭辞・接尾辞それ
ぞれマッチング候補が存在するかが判定される。Ｓ１０
４で、接頭辞が判定される。上記したように、Ｓ１０２
の処理結果、図１７に示すように、マッチ接頭辞バッフ
ァに接頭辞“ex”が格納されたので、接頭辞は存在し、
Ｓ１０５の処理に進む。Ｓ１０５で、接尾辞が判定され
る。上記したように、Ｓ１０３の処理の結果、図１８に
示すように、マッチ接尾辞バッファに接尾辞“able”が
格納されたので、接尾辞は存在し、Ｓ１１１に進む。

【００４４】この時点で、入力単語に対しては、接頭辞
・接尾辞ともマッチするものが存在しており、そのどち
らを処理するかが以下の処理で決定される。Ｓ１１１
で、言語的特性に基づいた判定の一つとして、マッチ接
尾辞バッファ７ｇに格納されている接尾辞が動詞の規則
変化形と同じかどうかが、図１６の規則変化形テーブル
を参照して判定される。この場合、接尾辞“able”は、
図１６の規則変化形のいずれとも一致しないので、Ｓ１
１１からＳ１１２の処理に進む。

【００４５】Ｓ１１２で、言語的特性に基づいた判定の
一つとして、マッチした接頭辞とマッチした接尾辞の長
さの比較が行われる。ここで、接頭辞と接尾辞の長さが
同じか、接尾辞の方が長いと、Ｓ１１７に進み、接尾辞
処理が行われる。一方、接頭辞の方が長いと、Ｓ１１３
に進み、接頭辞処理が行われる。この場合、接頭辞“e
x”より接尾辞“able”の方が長いので、Ｓ１１７に進
む。

【００４６】図８は本実施例の翻訳処理（６）の動作手
順を示すフローチャートである。また、図８は図４のＳ
１０７・Ｓ１１５・Ｓ１１７の「接尾辞処理」を詳細に
示したものである。図８において、Ｓ６０１で、マッチ
接尾辞バッファポインタ変数ｍｓに１がセットされる。
Ｓ６０２で、語基用辞書検索バッファ７ｉがクリアされ
る。Ｓ６０３で、マッチ接尾辞バッファの１番目の接尾
辞である“able”に対応する語基バッファの語基である
“export”と“exporte ”をそれぞれキーとして辞書検
索される。

【００４７】この結果、図１５のような辞書データのも
とでは、“export”では辞書検索が成功するが“export
e ”では辞書検索は失敗し、語基用辞書検索バッファ７
ｉには“export”の辞書検索結果が図２０に示すように
格納される。“export”に関して辞書検索が成功したの
で、Ｓ６０５に進み、言語的特性に基づいた判定の一つ
として、検索した単語の品詞が調べられる。

【００４８】この場合、検索された単語に否定詞も前置
詞も代名詞も存在しないので、語基用辞書検索バッファ
７ｉから消去されるデータはなく、Ｓ６１０に進む。そ
して、派生語“exportable”に対する派生語訳生成が行
われるが、この詳細な動作手順については実施例３で詳
述する。この結果、辞書検索バッファ７ｂには、入力語
“exportable”に対して、既知語“export”と接尾辞
“able”からなる派生語としての情報が、図２１に示す
ように格納される。

【００４９】本実施例のように、入力単語に対して、接
頭辞・接尾辞ともマッチするものが存在している場合
に、接辞の長さ等の言語的特性に基づいた判定を行った
結果、入力語“exportable”を、接頭辞“ex”と既知語
“portable”からなると見なすような不適切な判定を防
止することができる。

【００５０】ここでは、ソース言語の特質を考慮して適
切な接辞を選ぶ例（その２）として、動詞の規則変化形
等に関して、単語“uncleared ”の派生語処理を行う。
図４において、Ｓ１０１で、語基バッファ７ｈがクリア
される。Ｓ１０２で、接頭辞マッチング処理、Ｓ１０３
で、接尾辞マッチング処理が行われる。各マッチング処
理の詳細な動作は、単語“exportable”の場合と同様で
あるのでここでは割愛する。

【００５１】この結果、図２２に示すように、マッチ接
頭辞バッファ７ｆには接頭辞“un”が格納されており、
図２３に示すように、マッチ接尾辞バッファ７ｇには接
尾辞“ed”が格納されている。そして図２４に示すよう
に、語基バッファ７ｈには接頭辞“un”に対応する語基
“cleared ”と、接尾辞“ed”に対応する語基“unclea
r ”とが格納されている。

【００５２】このように、入力単語“uncleared ”に対
しては、接頭辞・接尾辞ともマッチするものが存在して
いるので、単語“exportable”の場合と同様に、Ｓ１０
３→Ｓ１０４→Ｓ１０５→Ｓ１１１の処理に進む。

【００５３】Ｓ１１１で、言語的特性に基づいた判定の
一つとして、マッチ接尾辞バッファ７ｇに格納されてい
る接尾辞が動詞の規則変化形と同じかどうかが、図１６
の規則変化形テーブルを参照して判定される。このよう
な判定を行うのは、動詞の規則変化形と同じ末尾に付い
た単語が、接尾辞つき単語としてでなく、動詞の変化形
として処理できるなら、その方が一般に望ましい場合が
多いからである。この場合、接尾辞“ed”は、図１６
に示す動作の規則変化形の１つと一致するので、Ｓ１１
１からＳ１１３の処理に進み、接頭辞処理が行われる。

【００５４】図７は本実施例の翻訳処理（５）の手順を
示すフローチャートである。また、図７は図４のＳ１０
９・Ｓ１１３・Ｓ１１９の「接頭辞処理」を詳細に示し
たものである。図７において、Ｓ５０１で、マッチ接尾
辞バッファポインタ変数ｍｐに１がセットされる。Ｓ５
０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ５０３で、マッチ接尾辞バッファの１番目の接尾辞で
ある“un”に対応する語基バッファの語基である“clea
red ”をキーとして辞書検索される。

【００５５】この結果、図１５のような単語辞書テーブ
ルの単語データでは、“clear ”の過去形または過去分
詞形として辞書検索が成功し、語基用辞書検索バッファ
７ｉには“cleared ”の辞書検索結果が図２５に示すよ
うに格納される。“cleared ”に関して辞書検索が成功
したのでＳ５０５に進み、検索された単語の品詞が調べ
られる。この場合、検索された単語に否定詞も前置詞も
代名詞も存在しないので、語基用辞書検索バッファから
消去されるデータはなく、Ｓ５１０に進む。そして、派
生語“uncleared ”に対する派生語訳生成が行われる。
この結果、辞書検索バッファ７ｂには、入力語“unclea
red ”に対して、接頭辞“un”と既知語“cleared ”と
からなる派生語としての情報が、図２６に示すように格
納される。

【００５６】以上のように、入力単語に対して、接頭辞
・接尾辞ともマッチするものが存在している場合に、も
し接辞の長さだけで判定した場合は、入力語“uncleare
d ”を既知語“unclear ”と接尾辞“ed”からなると見
なし、その結果訳語が、例えば「はっきりしなくされ
た」のような訳になるところを、本実施例のように、接
辞の長さによる判定に動詞の規則変化形を加えた接辞を
優先する等の言語的特性に基づいた判定を行った結果、
不適切な判定を防止することができる。

【００５７】なお、ソース言語の特質の考慮として、上
記実施例では「接辞の長さ」、「動詞の規則変化形」を
利用したが、本発明により利用できるソース言語の特質
はこれらに限られるものではない。

【００５８】上記のように、本実施例による派生語処理
部は、入力単語に対して接頭辞・接尾辞ともマッチする
ものが存在している場合に、言語的特性に基づいて適切
な接辞を選択する機能を有しているが、このように選択
された接辞が必ずしも正しくない場合があるので、その
場合の動作について説明する。

【００５９】次に、処理失敗後のバックアップ処理によ
り成功する例について説明する。ここでは、単語“nonr
adioactive”の派生語処理を説明する。図４において、
Ｓ１０１で、語基バッファ７ｈがクリアされる。Ｓ１０
２で、接頭辞マッチング処理が行われる。Ｓ１０３で、
接尾辞マッチング処理が行われる。各マッチング処理の
詳細な動作は、前記の単語“exportable”の場合と同様
であるのでここでは割愛する。

【００６０】この結果、図２７に示すように、マッチ接
頭辞バッファ７ｆには接頭辞“non”が格納されてお
り、図２８に示すように、マッチ接尾辞バッファ７ｇに
は接尾辞“ive ”が格納されている。そして、図２９に
示すように、語基バッファには接頭辞“non ”に対応す
る語基“radioactive ”と、接尾辞“ive ”に対応する
語基“nonradioact ”とが格納されている。このよう
に、入力単語“nonradioactive”に対しては、接頭辞・
接尾辞ともマッチするものが存在しているので、単語
“exportable”の場合と同様に、図４のＳ１０３→Ｓ１
０４→Ｓ１０５→Ｓ１１１の処理に進む。

【００６１】Ｓ１１１で、マッチ接尾辞バッファ７ｇに
格納されている接尾辞が動詞の規則変化形と同じかどう
かが判定される。この場合、接尾辞“ive ”は図１６の
規則変化形のいずれとも一致しないので、Ｓ１１１から
Ｓ１１２に進む。Ｓ１１２で、マッチした接頭辞とマッ
チした接尾辞の長さの比較が行われる。この場合、接頭
辞“non ”と接尾辞“ive ”の長さが同じなので、Ｓ１
１７の処理に進む。

【００６２】図８の処理に移り、Ｓ６０１で、マッチ接
尾辞バッファのポインタ変数ｍｓに１がセットされ、Ｓ
６０２で、語基用辞書検索バッファ７ｉがクリアされ
る。次に、Ｓ６０３に進み、マッチ接尾辞バッファの１
番目の接尾辞である“ive”に対応する語基バッファの
語基である“nonradioact ”をキーとして辞書検索され
る。

【００６３】この結果、図１５のような単語辞書テーブ
ルの単語データのもとでは、“nonradioact ”では、図
３０のように未知語しか存在せず、辞書検索が失敗する
ので、Ｓ６０８に進むが、図２８に示すように、マッチ
接尾辞バッファ７ｇの２番目のレコードは空であるの
で、接尾辞処理は失敗に終わる。接尾辞処理が失敗した
ので、図４の処理に戻り、Ｓ１１７→Ｓ１１８→Ｓ１１
９の処理に進み、今度は接頭辞処理が行われる。

【００６４】図７の処理に移り、Ｓ５０１で、マッチ接
頭辞バッファのポインタ変数ｍｐに１がセットされ、Ｓ
５０２で、語基用辞書検索バッファ７ｉがクリアされ
る。Ｓ５０３に進み、マッチ接頭辞バッファの１番目の
接尾辞である“non ”に対応する語基バッファの語基で
ある“radioactive ”をキーとして辞書検索される。こ
の結果、図１５のような単語辞書テーブルの辞書データ
のもとでは、辞書検索が成功し、語基用辞書検索バッフ
ァ７ｉには“radioactive ”の辞書検索結果が、図３１
に示すように格納される。

【００６５】単語“radioactive ”に関して辞書検索が
成功したので、Ｓ５０５に進み、検索された単語の品詞
が調べられる。この場合、検索された単語に否定詞も前
置詞も代名詞も存在しないので、語基用辞書検索バッフ
ァから消去されるデータはなく、Ｓ５１０に進み、派生
語“nonradioactive”に対する派生語訳生成が行われ
る。

【００６６】この結果、辞書検索バッファ７ｂには、入
力語“nonradioactive”に対して、接頭辞“non ”と既
知語“radioactive ”とからなる派生語としての情報
が、図３２に示すように格納される。以上のように、本
実施例の派生語処理部では、最初に選択した接辞が誤っ
ていた場合でも、適切な回復処理を行うことができる。

【００６７】実施例１によれば、原文中の未知語を形態
素解析する際に、ソース言語の言語的特性情報に基づい
て接辞を決定するよう構成したことにより、原文中の未
知語に対して接辞と語基の組み合わせが複数通り存在す
る場合でも、その中から最適である可能性が高い接辞と
語基の組み合わせを選択し、原文の解析がより正確に行
えるという利点がある。

【００６８】［実施例２］実施例２として、単語“note
r ”の派生語処理を例にとり、本発明の特徴を説明す
る。図４において、Ｓ１０１で、語基バッファ７ｈがク
リアされる。Ｓ１０２で、接頭辞マッチング処理が行わ
れる。次に、図５の処理に移り、Ｓ３０１で、接頭辞テ
ーブルのポインタ変数ｎｐに１がセットされ、Ｓ３０２
で、マッチ接頭辞バッファ７ｆがクリアされる。以下、
前記したように、ｎｐを１ずつ増加しながら動作が繰り
返し行われる。

【００６９】単語“noter ”の場合、図１１に示す接頭
辞テーブルを参照して、マッチする接頭辞が存在しな
い。よって、マッチ接頭辞バッファ７ｆには情報がセッ
トされずに、ｎｐが接頭辞テーブルの終端に達した際
に、図５の接頭辞マッチング処理は終わり、図４の処理
に戻り、Ｓ１０２からＳ１０３に進み、接尾辞マッチン
グ処理が行われる。

【００７０】図６の処理に移り、Ｓ４０１で、接尾辞テ
ーブルのポインタ変数ｎｓに１がセットされ、Ｓ５０２
でマッチ接尾辞バッファ７ｇがクリアされる。以下、前
記したように、ｎｓを１ずつ増加しながら動作が繰り返
し行われる。単語“noter ”の場合、図１２に示す接尾
辞テーブルを参照して、ＩＤ（レコード番号）が４の接
尾辞“er”とマッチするので、ｎｓが４のときに、Ｓ４
０３からＳ４０４に進み、図１２の４番目の接尾辞“e
r”がマッチ接頭辞バッファ７ｇにセットされる。

【００７１】Ｓ４０５で、入力語“noter ”が接尾辞
“er”のついた派生語であるとした場合の語基を、図１
２の４番目の接尾辞“er”の「連結条件」欄を参照して
求め、その結果、“noter ”から接尾辞“er”を単純に
除去した“not ”という文字列と、「連結条件」に従っ
て語基の末尾の“e ”が除去された可能性があると見な
して、末尾に“e ”を補った“note”いう文字列とが、
語基バッファ７ｈにセットされる。

【００７２】Ｓ４０６で、接尾辞と語基とを関連づける
ため、マッチ接尾辞バッファ７ｇの１番目のレコードの
「語基ポインタ」欄に、語基バッファ７ｈのうち“not
”および“note”が格納されているレコードの番号で
ある“１”と“２”を格納する。この結果、マッチ接尾
辞バッファ７ｇは、図３３に示すような記憶内容にな
る。そして語基バッファ７ｈは、図３４に示すような記
憶内容になる。

【００７３】入力語“noter ”に対して図１２の接尾辞
テーブル中の接尾辞でマッチするものは上記の“er”だ
けなので、図６の接尾辞マッチング処理は終わり、図４
に戻り、Ｓ１０３からＳ１０４の処理に進む。次に、接
頭辞・接尾辞それぞれマッチング候補が存在するかが判
定される。この場合、入力単語“noter ”に対しては、
マッチする接頭辞は存在せず、マッチする接尾辞のみ存
在するので、図４のＳ１０３→Ｓ１０４→Ｓ１０６→Ｓ
１０７の処理に進む。

【００７４】図８の処理に移り、Ｓ６０１で、マッチ接
尾辞バッファのポインタ変数ｍｓに１がセットされ、６
０２で、語基用辞書検索バッファ７ｉがクリアされる。
Ｓ６０３に進み、マッチ接尾辞バッファの１番目の接尾
辞である“er”に対応する語基バッファの語基である
“not ”と“note”をそれぞれキーとして辞書検索され
る。この結果、図１５のような単語辞書テーブルの辞書
データのもとでは“not ”、“note”共に辞書検索が成
功し、語基用辞書検索バッファ７ｉに“not ”と“not
e”の辞書検索結果が図３５に示すように格納される。

【００７５】辞書検索が成功したので、Ｓ６０５に進
み、言語的特性に基づいた判定の一つとして、索いた単
語の品詞が調べられる。この場合、“not ”は品詞が否
定詞なので、Ｓ６０６に進み、“not ”に関する情報が
語基用辞書検索バッファから消去され、その結果、図３
６に示すように、語基用辞書検索バッファ７ｉは“not
e”に関する情報のみが残る。そして、Ｓ６０７に進
み、語基用辞書検索バッファ７ｉには情報が残っている
ので、Ｓ６１０に進み、派生語“noter ”に対する派生
語訳生成が行われる。

【００７６】この結果、辞書検索バッファ７ｂには、入
力語“noter ”に対して、既知語“note”と接尾辞“e
r”とからなる派生語としての情報が、図３７に示すよ
うに格納される。以上のように、入力単語に対して、同
一の接辞にマッチする語基が複数存在している場合に、
本実施例のように、品詞等の言語的特性に基づいた判定
を行った結果、入力語“noter ”を、既知語“not ”と
接尾辞“er”からなると見なすような不適切な判定を防
止することができる。

【００７７】実施例２によれば、原文中の未知語を形態
素解析する際に、ソース言語の言語的特性情報に基づい
て語基を決定するように構成したことにより、原文中の
未知語に対して接辞が一意に定まっているが、これに連
結し得る語基が複数通り存在する場合でも、その中から
最適である可能性が高い語基を選択し、原文の解析がよ
り正確に行えるという利点がある。

【００７８】［実施例３］実施例３として、接頭辞処理
について“nonradioactive”、“nonremunerative ”と
いう２個の英単語、接尾辞処理について“amiableness
”、“abidingness ”という２個の英単語の派生語訳
生成処理を例にとり、本発明の特徴を説明する。

【００７９】［接頭辞処理］ここでは、単語“nonradio
active”の派生語訳生成処理を説明する。この単語につ
いては、前記したように、図４において、Ｓ１０１→Ｓ
１０２→Ｓ１０３→Ｓ１０４→Ｓ１０５→Ｓ１１１→Ｓ
１１２→Ｓ１１７→Ｓ１１８→Ｓ１１９の処理へと進
み、接頭辞“non ”と既知語“radioactive ”からなる
派生語としての処理が行われる。次に、図７の処理に移
り、Ｓ５０１→Ｓ５０２→Ｓ５０３→Ｓ５０４→Ｓ５０
５→Ｓ５１０の処理へと進んで、接頭辞つき派生語訳語
生成処理に移る。このとき、語基用辞書検索バッファ７
ｉは、図３１のような記憶内容になる。

【００８０】図９は本実施例の翻訳処理（７）の手順
を示すフローチャートである。また、図９は図７のＳ５
１０の「接頭辞つき派生語訳生成」を詳細に示したもの
である。図９において、Ｓ７０１で、現在選ばれている
接頭辞に関して接頭辞テーブルの「処理パターンテーブ
ル」欄に値があるか否かがチェックされる。この場合、
選ばれている接頭辞が“non ”で、図１１の接頭辞テー
ブルの“non ”の処理パターンテーブル欄には“101 ”
という値が存在しているので、Ｓ７０２に進む。

【００８１】Ｓ７０２で、接頭辞処理パターンテーブル
のポインタ変数ｐｐに１がセットされる。この時点で、
接頭辞処理パターンテーブルとして、図１３に示す接頭
辞処理パターン１０１のものが選ばれる。Ｓ７０３で、
接頭辞処理パターンテーブル１０１のｐｐ番目のレコー
ドの「条件」が語基用辞書検索バッファ７ｉの訳語欄の
訳語「放射性の」と合致するかどうかの調査が試みら
れ、合致しなければ、Ｓ７０３→Ｓ７０４→Ｓ７０５→
Ｓ７０３の処理へと進み、これが合致するか、あるいは
ｐｐが接頭辞処理パターンテーブル１０１のレコード数
に達するまで、ｐｐを１ずつ増加しながら調査が繰り返
して行われる。

【００８２】訳語「放射性の」の場合、図１３の接頭辞
処理パターンテーブル１０１を参照して、ＩＤ（レコー
ド番号）が１の条件「名詞＋“の”」とマッチするの
で、ｐｐが１の時に、Ｓ７０３からＳ７０４に進み、図
１３のＩＤ１の処理「“非”＋語基の訳語」という操作
を、文字列「放射性の」に施し、その結果として生成さ
れた文字列「非放射性の」が、辞書検索バッファ７ｂの
訳語欄に、図３２のように格納される。

【００８３】次に、単語“nonremunerative ”の派生語
訳生成処理を説明する。この単語については、図１１の
接頭辞テーブルや図１２の接尾辞テーブルを参照した結
果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→Ｓ
１０４→Ｓ１０５→Ｓ１１１→Ｓ１１２→Ｓ１１７→Ｓ
１１８→Ｓ１１９の処理へと進み、接頭辞“non ”と既
知語“remunerative”からなる派生語としての処理が行
われる。次に、図７の処理に移り、Ｓ５０１→Ｓ５０２
→Ｓ５０３→Ｓ５０４→Ｓ５０５→Ｓ５１０の処理へと
進んで、接頭辞つき派生語訳生成処理に入る。このと
き、語基用辞書検索バッファ７ｉは図３８のような記憶
内容になる。

【００８４】図９の処理に移り、この場合、選ばれてい
る接頭辞が前記同様“non ”であるので、Ｓ７０１から
Ｓ７０２→Ｓ７０３の処理に進み、接頭辞処理パターン
テーブルとして、図１３に示す接頭辞処理パターン１０
１が選ばれ、語基用辞書検索バッファ７ｉの訳語欄の訳
語「利益がある」が接頭辞処理パターンテーブル１０１
のいずれのレコード順と合致するか調査していく、Ｓ７
０３からの繰り返し動作に移る。

【００８５】訳語「利益がある」の場合、図１３の接頭
辞処理パターンテーブルを参照して、ＩＤ（レコード番
号）が５の条件「格助詞＋“ある”」とマッチするの
で、ｐｐが５のときに、Ｓ７０３からＳ７０４の処理に
進み、図１３のＩＤ１の処理「“ある”を“ない”に置
換」という操作を、文字列「利益がある」に施し、その
結果として生成された文字列「利益がない」が、辞書検
索バッファ７ｂの訳語欄に、図３９のように格納され
る。

【００８６】以上のように、同じ接頭辞“non ”のつい
た派生語であっても、語基の訳語によって接頭辞部分を
訳し分けることにより、より自然な訳語を得ることがで
きる。

【００８７】［接尾辞処理］単語“amiableness ”の派
生語訳生成処理を説明する。この単語については、図１
１の接頭辞テーブルや図１２の接尾辞テーブルを参照し
た結果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３
→Ｓ１０４→Ｓ１０６→Ｓ１０９の処理へと進み、既知
語“amiable ”と接尾辞“ness”からなる派生語として
の処理が行われる。次に、図８の処理に移り、Ｓ６０１
→Ｓ６０２→Ｓ６０３→Ｓ６０４→Ｓ６０５→Ｓ６１０
の処理へと進んで、接尾辞つき派生語訳語生成処理に移
る。このとき、語基用辞書検索バッファ７ｉは、図４０
のような記憶内容になる。

【００８８】図１０は本実施例の翻訳処理（８）の手順
を示すフローチャートである。また、図１０は図８のＳ
６１０の「接尾辞つき派生語訳生成」、「接頭辞つき派
生語訳生成」を詳細に示したものである。図１０におい
て、Ｓ８０１で、現在選ばれている接尾辞に関して接尾
辞テーブルの「処理パターンテーブル」欄に値があるか
がチェックされる。この場合、選ばれている接頭辞が
“ness”で、図１２の接尾辞テーブルの“ness”の処理
パターンテーブル欄には“203 ”という値が存在してい
るので、Ｓ８０２に進む。

【００８９】Ｓ８０２で、接尾辞処理パターンテーブル
のポインタ変数ｐｓに１がセットされる。この時点で、
接尾辞処理パターンテーブルとして、図１４に示す接尾
辞処理パターンテーブル２０３が選ばれる。Ｓ８０３
で、接尾辞処理パターンテーブル２０３のｐｓ番目のレ
コードの「条件」が語基用辞書検索バッファ７ｉの訳語
欄の訳語「感じがよい」と合致するかどうかの調査が試
みられ、合致しなければ、Ｓ８０３→Ｓ８０４→Ｓ８０
５→Ｓ８０３の処理に進み、これが合致するか、あるい
はｐｓが接尾辞処理パターンテーブル２０３のレコード
数に達するまで、ｐｓを１ずつ増加しながら調査が繰り
返して行われる。

【００９０】訳語「感じがよい」の場合、図１４の処理
パターンテーブルを参照して、ＩＤ（レコード番号）が
１の条件「“｛が｜の｝”+ 形容詞( “ない”以外) 」
とマッチするので、ｐｓが１の時に、Ｓ８０３からＳ８
０４の処理に進み、図１４のＩＤ１の処理「“の”＋形
容詞の語幹＋“さ”」という操作を、文字列「感じがよ
い」に施し、その結果として生成された文字列「感じの
よさ」が、辞書検索バッファ７ｂの訳語欄に、図４１の
ように格納される。

【００９１】次に、単語“nonremunerative ”の派生語
訳語生成処理を説明する。この単語については、図１１
の接頭辞テーブルや図１２の接尾辞テーブルを参照した
結果、図４において、Ｓ１０１→Ｓ１０２→Ｓ１０３→
Ｓ１０４→Ｓ１０６→Ｓ１０９の処理へと進み、既知語
“abiding ”と接尾辞“ness”からなる派生語としての
処理が行われる。次に、図８の処理に移り、Ｓ６０１→
Ｓ６０２→Ｓ６０３→Ｓ６０４→Ｓ６０５→Ｓ６１０の
処理へと進んで、接尾辞つき派生語訳語生成処理に移
る。このとき、語基用辞書検索バッファ７ｉは図４２の
ような記憶内容になる。

【００９２】図１０の処理に移り、この場合、選ばれて
いる接尾辞が前記同様“ness”であるので、Ｓ８０１か
らＳ８０２→Ｓ８０３の処理に進み、接尾辞処理パター
ンテーブルとして、図１４に示す接尾辞処理パターンテ
ーブル２０３が選ばれ、語基用辞書検索バッファ７ｉの
訳語欄の訳語「永続的な」が、接尾辞処理パターンテー
ブル２０３のいずれのレコード順と合致するか調査して
いく、Ｓ８０３からの繰り返し動作に移る。

【００９３】訳語「永続的な」の場合、図１４に示す接
尾辞処理パターンテーブルを参照して、ＩＤ（レコード
番号）が３の条件「“｛的な｜的｝”」とマッチするの
で、ｐｓが３のときに、Ｓ８０３からＳ８０４の処理に
進み、図１４のＩＤ３の処理「“｛的な｜的｝”を
“性”に置換」という操作を、文字列「永続的な」に施
し、その結果として生成された文字列「永続性」が、辞
書検索バッファ７ｂの訳語欄に、図４３のように格納さ
れる。

【００９４】以上のように、同じ接尾辞“ness”のつい
た派生語であっても、語基の訳語によって接尾辞部分の
訳し方を訳し分けることにより、より自然な訳語を得る
ことができる。

【００９５】実施例３によれば、派生語として処理され
た原文中の未知語の訳語を生成する際に、語基の訳語に
よって接辞部分を訳し分ける派生語訳生成部を構成した
ことにより、語基の訳語と接辞の訳語を単純に連接した
形の訳語以外の訳語を生成することが可能となり、ター
ゲット言語としてより自然な訳文を生成することができ
るという利点がある。

【００９６】

【発明の効果】本発明によれば、原文中の未知語を形態
素解析する際に、ソース言語の言語的特性情報に基づい
て接辞を決定するよう構成したことにより、原文中の未
知語に対して接辞と語基の組み合わせが複数通り存在す
る場合でも、その中から最適である可能性が高い接辞と
語基の組み合わせを選択し、原文の解析がより正確に行
えるという利点がある。

【図面の簡単な説明】

【図１】本発明の一実施例である翻訳装置の構成を示す
ブロック図である。

【図２】本実施例の翻訳装置による各翻訳処理の手順を
示すブロック図である。

【図３】本実施例の翻訳処理（１）の手順を示すフロー
チャートである。

【図４】本実施例の翻訳処理（２）の手順を示すフロー
チャートである。

【図５】本実施例の翻訳処理（３）の手順を示すフロー
チャートである。

【図６】本実施例の翻訳処理（４）の手順を示すフロー
チャートである。

【図７】本実施例の翻訳処理（５）の手順を示すフロー
チャートである。

【図８】本実施例の翻訳処理（６）の手順を示すフロー
チャートである。

【図９】本実施例の翻訳処理（７）の手順を示すフロー
チャートである。

【図１０】本実施例の翻訳処理（８）の手順を示すフロ
ーチャートである。

【図１１】本実施例の接頭辞テーブルの記憶内容を示す
図である。

【図１２】本実施例の接尾辞テーブルの記憶内容を示す
図である。

【図１３】本実施例の接頭辞処理パターンテーブルを示
す図である。

【図１４】本実施例の接尾辞処理パターンテーブルを示
す図である。

【図１５】本実施例の単語辞書テーブルの記憶内容を示
す図である。

【図１６】本実施例の動詞規則変化形テーブルの記憶内
容を示す図である。

【図１７】本実施例のマッチ接頭辞バッファの記憶内容
（１）を示す図である。

【図１８】本実施例のマッチ接尾辞バッファの記憶内容
（１）を示す図である。

【図１９】本実施例の語基バッファの記憶内容（１）を
示す図である。

【図２０】本実施例の語基用辞書検索バッファの記憶内
容（１）を示す図である。

【図２１】本実施例の辞書検索バッファの記憶内容
（１）を示す図である。

【図２２】本実施例のマッチ接頭辞バッファの記憶内容
（２）を示す図である。

【図２３】本実施例のマッチ接尾辞バッファの記憶内容
（２）を示す図である。

【図２４】本実施例の語基バッファの記憶内容（２）を
示す図である。

【図２５】本実施例の語基用辞書検索バッファの記憶内
容（２）を示す図である。

【図２６】本実施例の辞書検索バッファの記憶内容
（２）を示す図である。

【図２７】本実施例のマッチ接頭辞バッファの記憶内容
（３）を示す図である。

【図２８】本実施例のマッチ接尾辞バッファの記憶内容
（３）を示す図である。

【図２９】本実施例の語基バッファの記憶内容（３）を
示す図である。

【図３０】本実施例の語基用辞書検索バッファの記憶内
容（３）を示す図である。

【図３１】本実施例の辞書検索バッファの記憶内容
（３）を示す図である。

【図３２】本実施例の辞書検索バッファの記憶内容
（４）を示す図である。

【図３３】本実施例のマッチ接尾辞バッファの記憶内容
（４）を示す図である。

【図３４】本実施例の語基バッファの記憶内容（４）を
示す図である。

【図３５】本実施例の語基用辞書検索バッファの記憶内
容（４）を示す図である。

【図３６】本実施例の語基用辞書検索バッファの記憶内
容（５）を示す図である。

【図３７】本実施例の辞書検索バッファの記憶内容
（５）を示す図である。

【図３８】本実施例の語基用辞書検索バッファの記憶内
容（６）を示す図である。

【図３９】本実施例の辞書検索バッファの記憶内容
（６）を示す図である。

【図４０】本実施例の語基用辞書検索バッファの記憶内
容（７）を示す図である。

【図４１】本実施例の辞書検索バッファの記憶内容
（７）を示す図である。

【図４２】本実施例の語基用辞書検索バッファの記憶内
容（８）を示す図である。

【図４３】本実施例の辞書検索バッファの記憶内容
（８）を示す図である。

【符号の説明】

１制御部２入力部３出力部４バスライン５プログラムメモリ５ａ形態素解析部５ｂ構文解析部５ｃ構文変換部５ｄターゲット言語生成部５ｅ派生語処理部５ｆ接辞決定部５ｇ語基決定部５ｈ派生語訳生成部６テーブルメモリ６ａ単語辞書テーブル６ｂ文法規則テーブル６ｃ翻訳規則テーブル６ｄ動詞規則変化形テーブル６ｅ接辞テーブル（接頭辞テーブル、接尾辞テーブ
ル、接頭辞処理パターンテーブル、接尾辞処理パターン
テーブル、）７バッファメモリ７ａ原文バッファ７ｂ辞書検索バッファ７ｃ変換前構文バッファ７ｄ変換後構文バッファ７ｅ訳文バッファ７ｆマッチ接頭辞バッファ７ｇマッチ接尾辞バッファ７ｈ語基バッファ７ｉ語基用辞書検索バッファ

Claims

【特許請求の範囲】

【請求項１】単語辞書と、接辞辞書と、第１言語であ
る原語を入力する入力部と、単語辞書を参照し、入力原
語を第２言語である訳語に変換する変換部と、単語辞書
及び接辞辞書を参照し、変換部によって訳語に変換され
ない入力原語から接辞と語基とからなる派生語を認識す
る認識部と、認識された派生語の接辞に対応した訳語と
語基に対応した訳語を連結して一つの派生語の訳語を生
成する派生語訳生成部と、認識部により複数の接辞が含
まれる派生語が認識された際、言語的特性情報から付与
された接辞処理条件に基づいて一つの接辞を決定する接
辞決定部とを備え、前記派生語訳生成部は、接辞決定部
によって決定された接辞とこれに対応する語基とからな
る派生語の訳語を生成することを特徴とする翻訳装置。
【請求項２】前記認識部が一つの接辞に対して複数の
語基がある派生語を認識した際、言語的特性情報から付
与された動詞の変化形情報に基づいて一つの語基を決定
する語基決定部をさらに備え、前記派生語訳生成部は、
語基決定部によって決定された語基とこれに対応する接
辞とからなる派生語の訳語を生成することを特徴とする
請求項１記載の翻訳装置。
【請求項３】前記接辞辞書は、語基の品詞とその活用
形に対応して接辞の訳語を変更するための接辞訳変更情
報を記憶した接辞訳変更情報テーブルをさらに備え、前
記派生語訳生成部は、接辞訳変更情報に基づいて語基の
訳語に対応して接辞の訳語を変更することを特徴とする
請求項１記載の翻訳装置。
【請求項４】前記派生語訳生成部は、一度訳語を生成
した派生語を既知語として処理することを特徴とする請
求項１〜３のいずれか一つに記載の翻訳装置。
【請求項５】前記接辞処理条件が、接辞の長さ情報で
あることを特徴とする請求項１記載の翻訳装置。
【請求項６】前記接辞処理条件が、語基の動詞の変化
形情報であることを特徴とする請求項１記載の翻訳装
置。
【請求項７】前記接辞処理条件が、語基の品詞情報で
あることを特徴とする請求項１記載の翻訳装置。
【請求項８】前記接辞処理条件が、接辞と語基間のハ
イフン情報であることを特徴とする請求項１記載の翻訳
装置。
【請求項９】単語辞書と接辞辞書とを備え、入力部を
用いて、第１言語である原語を入力し、変換部を用い
て、単語辞書を参照し、入力言語を第２言語である訳語
に変換し、認識部を用いて、単語辞書及び接辞辞書を参
照し、変換部によって訳語に変換されない入力原語から
接辞と誤基とからなる派生語を認識し、派生語約生成部
を用いて、認識された派生語の接辞に対応した訳語と語
基に対応した訳語を連結して一つの派生語の訳語を生成
し、認識部により複数の接辞が含まれる派生語が認識さ
れた際、接辞決定部を用いて、言語的特性情報から付与
された接辞処理条件に基づいて一つの接辞を決定し、派
生語訳生成部が接辞決定部によって決定された接辞とこ
れに対応する語基からなる派生語の訳語を生成すること
を特徴とする翻訳方法。
【請求項１０】単語辞書と、接辞辞書と、第１言語で
ある原語を入力する入力部とを備えた翻訳装置に用いら
れ、コンピュータで読み取り可能な翻訳プログラムを記
憶した媒体であって、前記コンピュータに、単語辞書を
参照させ、入力原語を第２言語である訳語に変換させ、
単語辞書及び接辞辞書を参照させ、訳語に変換されない
入力原語から接辞と語基とからなる派生語を認識させ、
認識された派生語の接辞に対応した訳語と語基に対応し
た訳語を連結して一つの派生語の訳語を生成させ、複数
の接辞が含まれる派生語が認識された際、言語的特性情
報から付与された接辞処理条件に基づいて一つの接辞を
決定させ、決定された接辞とこれに対応する語基からな
る派生語の訳語を生成させることを特徴とする翻訳プロ
グラムを記憶した記憶媒体。