JPH10105552A - 機械翻訳システム - Google Patents
機械翻訳システムInfo
- Publication number
- JPH10105552A JPH10105552A JP8275378A JP27537896A JPH10105552A JP H10105552 A JPH10105552 A JP H10105552A JP 8275378 A JP8275378 A JP 8275378A JP 27537896 A JP27537896 A JP 27537896A JP H10105552 A JPH10105552 A JP H10105552A
- Authority
- JP
- Japan
- Prior art keywords
- word string
- idiom
- heading
- word
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【課題】 辞書登録の負担を軽減し、辞書の情報記録容
量を低減する。 【解決手段】 単語列処理参照テーブル5は、イディオ
ム中、語句の固定部分の形態が変化するイディオムに対
して、イディオムとなる語句の見出しと、イディオム中
の活用する単語の活用情報と、イディオムの機能と、そ
の訳とを格納する。単語列処理部4は、単語列処理参照
テーブル5の見出しに基づいて生成された各単語の原形
である原形見出しと、活用情報で指定された情報に基づ
いて見出しの語句が活用する場合に生成される活用見出
しとを用いて、入力された英文の原形の語句との照合を
行う。その結果、その語句がイディオムと認識した場合
は、その機能と訳とを出力する。
量を低減する。 【解決手段】 単語列処理参照テーブル5は、イディオ
ム中、語句の固定部分の形態が変化するイディオムに対
して、イディオムとなる語句の見出しと、イディオム中
の活用する単語の活用情報と、イディオムの機能と、そ
の訳とを格納する。単語列処理部4は、単語列処理参照
テーブル5の見出しに基づいて生成された各単語の原形
である原形見出しと、活用情報で指定された情報に基づ
いて見出しの語句が活用する場合に生成される活用見出
しとを用いて、入力された英文の原形の語句との照合を
行う。その結果、その語句がイディオムと認識した場合
は、その機能と訳とを出力する。
Description
【0001】
【発明の属する技術分野】本発明は、機械翻訳システム
に係わり、主として、原言語を英語、目的言語を日本語
として、英文中に存在するイディオムの中で構成する語
句の固定部分の形態が変化するイディオムに対して適切
な日本文に自動的に解析して出力する英日機械翻訳シス
テムに関するものである。
に係わり、主として、原言語を英語、目的言語を日本語
として、英文中に存在するイディオムの中で構成する語
句の固定部分の形態が変化するイディオムに対して適切
な日本文に自動的に解析して出力する英日機械翻訳シス
テムに関するものである。
【0002】
【従来の技術】機械翻訳処理装置において、複数の単語
からなる語句全体で固有の意味を持つ単語列であるイデ
ィオムを処理する場合、イディオムを見出し語として採
用し、対応するターゲット言語の言い回し等をペアとし
て、このようなペアを多数登録しておくことが翻訳効率
の上では望ましい。しかし、翻訳効率を上げるには単語
列の一部が同じで同種の見出しを持つイディオムを多数
登録しなくてはならず、これは、辞書登録の負担が増大
し、また情報記憶容量も増大するため登録方法としては
好ましいものではない。
からなる語句全体で固有の意味を持つ単語列であるイデ
ィオムを処理する場合、イディオムを見出し語として採
用し、対応するターゲット言語の言い回し等をペアとし
て、このようなペアを多数登録しておくことが翻訳効率
の上では望ましい。しかし、翻訳効率を上げるには単語
列の一部が同じで同種の見出しを持つイディオムを多数
登録しなくてはならず、これは、辞書登録の負担が増大
し、また情報記憶容量も増大するため登録方法としては
好ましいものではない。
【0003】このため、従来、例えば、特開平6−13
9272号公報等に開示されているように、イディオム
の多くが、ある文法特徴を共有する単語や句が入り、主
語や他の語との関係でその形を変え得る部分である可変
部分と、骨格となる単語や単語列からなる部分である固
定部分とから構成されていることに着目し、イディオム
における可変部分を代表記号で表し、イディオム中に可
変部分が複数存在する場合や可変部分に単語だけでなく
句が入る場合でも、一つのイディオムとして登録が可能
であるシステムがあった。
9272号公報等に開示されているように、イディオム
の多くが、ある文法特徴を共有する単語や句が入り、主
語や他の語との関係でその形を変え得る部分である可変
部分と、骨格となる単語や単語列からなる部分である固
定部分とから構成されていることに着目し、イディオム
における可変部分を代表記号で表し、イディオム中に可
変部分が複数存在する場合や可変部分に単語だけでなく
句が入る場合でも、一つのイディオムとして登録が可能
であるシステムがあった。
【0004】また、従来、この他にも、例えば、特開平
6−139271号公報に開示されているように、イデ
ィオムの可変部分に名詞句等の大きなカテゴリを指定す
ると、入力文によっては的確な翻訳結果が得られないこ
とに鑑み、イディオムの可変部分にある特徴を共有する
グループを指定することのできるシステムも考えられて
いた。
6−139271号公報に開示されているように、イデ
ィオムの可変部分に名詞句等の大きなカテゴリを指定す
ると、入力文によっては的確な翻訳結果が得られないこ
とに鑑み、イディオムの可変部分にある特徴を共有する
グループを指定することのできるシステムも考えられて
いた。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来のシステムでは、イディオムの可変部分についての登
録は簡単化できるが、イディオムを構成する語句のう
ち、例えば、名詞における複数になることによる形態の
変化や、動詞における3人称単数現在直接法の時および
時制が変化すること等による形態の変化、あるいは助動
詞における時制が変化することによる形態の変化等の固
定部分における形態の変化には対応できなかった。
来のシステムでは、イディオムの可変部分についての登
録は簡単化できるが、イディオムを構成する語句のう
ち、例えば、名詞における複数になることによる形態の
変化や、動詞における3人称単数現在直接法の時および
時制が変化すること等による形態の変化、あるいは助動
詞における時制が変化することによる形態の変化等の固
定部分における形態の変化には対応できなかった。
【0006】このため、翻訳効率を向上させるには、固
定部分が形態的に変化する場合は、その変化形の形態を
一つ一つイディオムとして登録しなければならない。し
かしながら、これは辞書登録の負担が増大し、また情報
記憶容量も増大することになる。例えば、“deal with
”という語句をイディオムとして登録する場合には“d
eal with ”中の“deal”はその形態が3人称単数現在
直接法の使用時で“deals ”となったり、現在分詞とし
て“dealing ”となったり、過去形あるいは過去分詞と
して“dealt ”と変化する。これらを同じイディオムと
して機能させるためには“deal with ”というイディオ
ムの登録に“deal with ”、“deals with”、“dealin
g with”、“dealt with”という見出しのイディオムを
登録しなければならなかった。
定部分が形態的に変化する場合は、その変化形の形態を
一つ一つイディオムとして登録しなければならない。し
かしながら、これは辞書登録の負担が増大し、また情報
記憶容量も増大することになる。例えば、“deal with
”という語句をイディオムとして登録する場合には“d
eal with ”中の“deal”はその形態が3人称単数現在
直接法の使用時で“deals ”となったり、現在分詞とし
て“dealing ”となったり、過去形あるいは過去分詞と
して“dealt ”と変化する。これらを同じイディオムと
して機能させるためには“deal with ”というイディオ
ムの登録に“deal with ”、“deals with”、“dealin
g with”、“dealt with”という見出しのイディオムを
登録しなければならなかった。
【0007】また、例えば、“to all appearance ”と
いう語句をイディオムとして登録する場合には“to all
appearance ”中の“appearance”は複数の場合にも同
じイディオムとして機能するために、“to all appeara
nce ”という見出しのイディオムと、“appearance”を
複数にした“to all appearances”という見出しのイデ
ィオムの両方を登録しなければならなった。
いう語句をイディオムとして登録する場合には“to all
appearance ”中の“appearance”は複数の場合にも同
じイディオムとして機能するために、“to all appeara
nce ”という見出しのイディオムと、“appearance”を
複数にした“to all appearances”という見出しのイデ
ィオムの両方を登録しなければならなった。
【0008】このような点から、辞書登録の負担を軽減
し、情報記録容量も低減することのできる機械翻訳シス
テムの実現が望まれていた。
し、情報記録容量も低減することのできる機械翻訳シス
テムの実現が望まれていた。
【0009】
【課題を解決するための手段】本発明は以上の点を解決
するため次の構成を採用する。 〈請求項1の構成〉原言語の複数の単語からなる語句全
体で固有の意味を持つ単語列に対して、その単語列の見
出しと、単語列中、他の語との関係から形態が変化する
単語の活用形態を示す活用情報と、単語列を一まとまり
として扱った場合の品詞を示す機能と、単語列の前記固
有の意味である目的言語の訳とを格納する単語列処理参
照テーブルと、原言語の任意の単語列に対して、単語列
処理参照テーブルの見出しに基づき、この見出しにおけ
る各単語の原形で構成する原形見出しを生成すると共
に、活用情報に基づき、単語の形態が変化した単語列で
ある活用見出しを生成し、一方、入力された原言語の文
に対して、各単語の原形を求め、この原形の単語列と入
力文中の単語列とを、原形見出しと活用見出しとに一致
するかを照合し、一致した場合は、機能と訳とを出力す
る単語列処理部とを備えたことを特徴とする機械翻訳シ
ステムである。
するため次の構成を採用する。 〈請求項1の構成〉原言語の複数の単語からなる語句全
体で固有の意味を持つ単語列に対して、その単語列の見
出しと、単語列中、他の語との関係から形態が変化する
単語の活用形態を示す活用情報と、単語列を一まとまり
として扱った場合の品詞を示す機能と、単語列の前記固
有の意味である目的言語の訳とを格納する単語列処理参
照テーブルと、原言語の任意の単語列に対して、単語列
処理参照テーブルの見出しに基づき、この見出しにおけ
る各単語の原形で構成する原形見出しを生成すると共
に、活用情報に基づき、単語の形態が変化した単語列で
ある活用見出しを生成し、一方、入力された原言語の文
に対して、各単語の原形を求め、この原形の単語列と入
力文中の単語列とを、原形見出しと活用見出しとに一致
するかを照合し、一致した場合は、機能と訳とを出力す
る単語列処理部とを備えたことを特徴とする機械翻訳シ
ステムである。
【0010】〈請求項1の説明〉原言語と、これを翻訳
する目的言語とは、例えば、英語と日本語であるが、他
の言語種であってもよい。複数の単語からなる語句全体
で固有の意味を持つ単語列とは、例えばイディオムであ
るが、このような機能を持つ単語列であれば、どのよう
な単語列であっても適用可能である。このような単語列
をイディオムとした場合、見出しは、そのイディオムの
見出しとしての機能を持つ語句であり、活用情報は、そ
のイディオムが活用する場合の活用形態、機能は、その
イディオムとしての品詞、訳はそのイディオムの目的言
語の訳である。
する目的言語とは、例えば、英語と日本語であるが、他
の言語種であってもよい。複数の単語からなる語句全体
で固有の意味を持つ単語列とは、例えばイディオムであ
るが、このような機能を持つ単語列であれば、どのよう
な単語列であっても適用可能である。このような単語列
をイディオムとした場合、見出しは、そのイディオムの
見出しとしての機能を持つ語句であり、活用情報は、そ
のイディオムが活用する場合の活用形態、機能は、その
イディオムとしての品詞、訳はそのイディオムの目的言
語の訳である。
【0011】単語列処理部は、単語列処理参照テーブル
の見出しと活用情報から、原形見出しと活用見出しとを
生成する。また、入力された原言語の文章に対して、各
単語の原形を求める。そして、原形見出しと入力文の原
形が一致し、かつ、入力文そのものと活用見出しとが一
致した場合は、単語列処理参照テーブルにおける機能と
訳とを出力する。
の見出しと活用情報から、原形見出しと活用見出しとを
生成する。また、入力された原言語の文章に対して、各
単語の原形を求める。そして、原形見出しと入力文の原
形が一致し、かつ、入力文そのものと活用見出しとが一
致した場合は、単語列処理参照テーブルにおける機能と
訳とを出力する。
【0012】これにより、従来のように、イディオムの
固定部分が形態的に変化する場合は、その変化形の形態
を一つ一つイディオムとして登録しなければならないと
いったことがなく、辞書登録の負担が軽減され、機械翻
訳システムとしての運用も容易に行うことができる。し
かも、重複して記憶する情報が少ないので、情報記憶容
量も縮減できるという効果がある。
固定部分が形態的に変化する場合は、その変化形の形態
を一つ一つイディオムとして登録しなければならないと
いったことがなく、辞書登録の負担が軽減され、機械翻
訳システムとしての運用も容易に行うことができる。し
かも、重複して記憶する情報が少ないので、情報記憶容
量も縮減できるという効果がある。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を具体
例を用いて説明する。 《具体例》 〈構成〉図1は本発明の機械翻訳システムの具体例のブ
ロック図である。図のシステムは、入力部1、形態素解
析部2、形態素解析辞書3、単語列処理部4、単語列処
理参照テーブル5、解析部6、解析辞書7、変換部8、
変換辞書9、生成部10、生成辞書11、形態素生成部
12、形態素生成辞書13、出力部14からなる。尚、
以下の具体例では、原言語を英語、目的言語を日本語と
している。
例を用いて説明する。 《具体例》 〈構成〉図1は本発明の機械翻訳システムの具体例のブ
ロック図である。図のシステムは、入力部1、形態素解
析部2、形態素解析辞書3、単語列処理部4、単語列処
理参照テーブル5、解析部6、解析辞書7、変換部8、
変換辞書9、生成部10、生成辞書11、形態素生成部
12、形態素生成辞書13、出力部14からなる。尚、
以下の具体例では、原言語を英語、目的言語を日本語と
している。
【0014】入力部1は、翻訳対象の英文を入力する機
能部で、英文ファイル等の読み取り装置や通信回線を介
して英文を入力するといった外部からの入力を受け付け
る部分である。形態素解析部2は、読み込まれた英文に
ついて形態素解析辞書3を用いて単語の分割および分割
した単語の品詞、用法、訳等の情報を付与する処理を行
う機能部である。単語列処理部4は、形態素解析部2に
おける形態素解析結果に基づき、単語列処理参照テーブ
ル5を用いて、英文中からイディオムを認識し、その機
能、訳を決定する処理を行うものである。これは、単語
列処理参照テーブル5に登録してあるイディオムに関す
る情報を手がかりにしてイディオムとなる語句を自動的
に選択し関連のある部分を一まとまりに変換し、後の処
理過程において簡単に扱えるようにすることを目的とし
ている。
能部で、英文ファイル等の読み取り装置や通信回線を介
して英文を入力するといった外部からの入力を受け付け
る部分である。形態素解析部2は、読み込まれた英文に
ついて形態素解析辞書3を用いて単語の分割および分割
した単語の品詞、用法、訳等の情報を付与する処理を行
う機能部である。単語列処理部4は、形態素解析部2に
おける形態素解析結果に基づき、単語列処理参照テーブ
ル5を用いて、英文中からイディオムを認識し、その機
能、訳を決定する処理を行うものである。これは、単語
列処理参照テーブル5に登録してあるイディオムに関す
る情報を手がかりにしてイディオムとなる語句を自動的
に選択し関連のある部分を一まとまりに変換し、後の処
理過程において簡単に扱えるようにすることを目的とし
ている。
【0015】即ち、単語列処理参照テーブル5は、イデ
ィオムといった複数の単語からなる語句全体で固有の意
味を持つ単語列に対して、その単語列の見出しと、単語
列中、他の語との関係から形態が変化する単語の活用形
態を示す活用情報と、単語列を一まとまりとして扱った
場合の品詞を示す機能と、単語列の固有の意味である目
的言語の訳と備えたものである。また、単語列処理部4
は、原言語の任意の単語列に対して、単語列処理参照テ
ーブル5の見出しに基づき、その見出しにおける各単語
の原形で構成する原形見出しを生成すると共に、活用情
報に基づき、単語の形態が変化した単語列である活用見
出しを生成し、一方、入力された原言語の文に対して、
各単語の原形を求め、その原形の単語列と入力文中の単
語列とを、原形見出しと活用見出しとに一致するか照合
し、一致した場合は、単語列処理参照テーブル5におけ
る機能と訳とを出力する機能を有している。
ィオムといった複数の単語からなる語句全体で固有の意
味を持つ単語列に対して、その単語列の見出しと、単語
列中、他の語との関係から形態が変化する単語の活用形
態を示す活用情報と、単語列を一まとまりとして扱った
場合の品詞を示す機能と、単語列の固有の意味である目
的言語の訳と備えたものである。また、単語列処理部4
は、原言語の任意の単語列に対して、単語列処理参照テ
ーブル5の見出しに基づき、その見出しにおける各単語
の原形で構成する原形見出しを生成すると共に、活用情
報に基づき、単語の形態が変化した単語列である活用見
出しを生成し、一方、入力された原言語の文に対して、
各単語の原形を求め、その原形の単語列と入力文中の単
語列とを、原形見出しと活用見出しとに一致するか照合
し、一致した場合は、単語列処理参照テーブル5におけ
る機能と訳とを出力する機能を有している。
【0016】図2に単語列処理参照テーブル5の一例を
示す。図示のように、単語列処理参照テーブル5は、イ
ディオムとなる語句の見出し項目101と、イディオム
の見出しを構成する単語の活用形態を活用情報項目10
2として登録し、更に、登録するイディオムの、文内で
機能する部分を一まとまりとして扱った場合の機能およ
び訳を、それぞれ機能項目103、訳項目104に格納
しているテーブルである。尚、これらの各項目101〜
104の詳細については後で詳細に説明する。
示す。図示のように、単語列処理参照テーブル5は、イ
ディオムとなる語句の見出し項目101と、イディオム
の見出しを構成する単語の活用形態を活用情報項目10
2として登録し、更に、登録するイディオムの、文内で
機能する部分を一まとまりとして扱った場合の機能およ
び訳を、それぞれ機能項目103、訳項目104に格納
しているテーブルである。尚、これらの各項目101〜
104の詳細については後で詳細に説明する。
【0017】ここで、単語列処理参照テーブル5中の活
用情報項目102の記述は、予め記号化された活用記号
を用いる(例えば、図中のD0、N0)。図3は、この
活用形記号テーブルの説明図である。尚、これについて
もその詳細は後述する。
用情報項目102の記述は、予め記号化された活用記号
を用いる(例えば、図中のD0、N0)。図3は、この
活用形記号テーブルの説明図である。尚、これについて
もその詳細は後述する。
【0018】また、上記の単語列処理参照テーブル5の
見出し項目101および活用情報項目102にデータが
登録されると、単語列処理部4は、イディオムの見出し
と活用情報で指定した情報に基づいて、見出しを構成す
る各単語が活用しても照合可能にするため、原形見出し
と活用見出しに変換する。これを慣用表現参照テーブル
と呼ぶことにする。
見出し項目101および活用情報項目102にデータが
登録されると、単語列処理部4は、イディオムの見出し
と活用情報で指定した情報に基づいて、見出しを構成す
る各単語が活用しても照合可能にするため、原形見出し
と活用見出しに変換する。これを慣用表現参照テーブル
と呼ぶことにする。
【0019】図4は、この慣用表現参照テーブルの説明
図である。ここで、原形見出し302とは、見出し30
1を構成する各単語の原形で構成する見出しのことであ
り、活用見出し303とは、活用情報項目102で指定
した情報に基づいて、見出し301中の各単語が活用す
る場合に構成される見出しのことである。この変換され
た原形見出し302と活用見出し303を用いることに
より、イディオムを構成する語句の固定部分における形
態の変化に対応した照合が可能となる。
図である。ここで、原形見出し302とは、見出し30
1を構成する各単語の原形で構成する見出しのことであ
り、活用見出し303とは、活用情報項目102で指定
した情報に基づいて、見出し301中の各単語が活用す
る場合に構成される見出しのことである。この変換され
た原形見出し302と活用見出し303を用いることに
より、イディオムを構成する語句の固定部分における形
態の変化に対応した照合が可能となる。
【0020】図1に戻って、解析部6は、形態素解析結
果およびイディオム処理結果に基づき、解析辞書7を用
いて構文の解析を行う機能を有している。変換部8は、
解析結果に基づき、変換辞書9を用いて英文を日本文に
変換するものである。生成部10は、変換結果に基づ
き、生成辞書11を用いて生成すべき日本語の単語、活
用形態およびその語順を決定する処理を行う機能を有し
ている。形態素生成部12は、生成部10の生成結果に
基づき、形態素生成辞書13を用いて日本語の自然な文
として整える機能を有している。出力部14は、整えら
れた文を出力する例えばディスプレイやプリンタといっ
た出力装置である。
果およびイディオム処理結果に基づき、解析辞書7を用
いて構文の解析を行う機能を有している。変換部8は、
解析結果に基づき、変換辞書9を用いて英文を日本文に
変換するものである。生成部10は、変換結果に基づ
き、生成辞書11を用いて生成すべき日本語の単語、活
用形態およびその語順を決定する処理を行う機能を有し
ている。形態素生成部12は、生成部10の生成結果に
基づき、形態素生成辞書13を用いて日本語の自然な文
として整える機能を有している。出力部14は、整えら
れた文を出力する例えばディスプレイやプリンタといっ
た出力装置である。
【0021】尚、上記、形態素解析部2、単語列処理部
4、解析部6、変換部8、生成部10、形態素生成部1
2は、マイクロコンピュータにおけるCPUやメモリ、
およびCPUの実行するプログラム等により機能構成さ
れ、また、形態素解析辞書3、解析辞書7、変換辞書
9、生成辞書11、形態素生成辞書13は、ハードディ
スク装置等の不揮発性メモリに格納されている。更に、
単語列処理参照テーブル5は、RAM等のメモリ上に生
成される。
4、解析部6、変換部8、生成部10、形態素生成部1
2は、マイクロコンピュータにおけるCPUやメモリ、
およびCPUの実行するプログラム等により機能構成さ
れ、また、形態素解析辞書3、解析辞書7、変換辞書
9、生成辞書11、形態素生成辞書13は、ハードディ
スク装置等の不揮発性メモリに格納されている。更に、
単語列処理参照テーブル5は、RAM等のメモリ上に生
成される。
【0022】次に、上述した単語列処理参照テーブル
5、活用形記号テーブル、慣用表現参照テーブルを説明
する。先ず、図3で示した活用形記号テーブルを説明す
る。活用形記号テーブルは、上述した単語列処理参照テ
ーブル5への登録に際し、その中の活用情報項目102
の記述に使用する活用形の種類を記号化したテーブルで
ある。この活用形記号テーブルは、左欄にそのシンボル
となる記号を示し、右欄にその意味が示してある。例え
ば、左欄にある“N0”という記号は、対応する右欄に
「名詞:単数/複数」と記載されてあるように、登録す
るイディオムの見出しの中で名詞が存在し、その名詞が
単数でも複数でもイディオムとなる場合に用いる記号で
あることを意味している。
5、活用形記号テーブル、慣用表現参照テーブルを説明
する。先ず、図3で示した活用形記号テーブルを説明す
る。活用形記号テーブルは、上述した単語列処理参照テ
ーブル5への登録に際し、その中の活用情報項目102
の記述に使用する活用形の種類を記号化したテーブルで
ある。この活用形記号テーブルは、左欄にそのシンボル
となる記号を示し、右欄にその意味が示してある。例え
ば、左欄にある“N0”という記号は、対応する右欄に
「名詞:単数/複数」と記載されてあるように、登録す
るイディオムの見出しの中で名詞が存在し、その名詞が
単数でも複数でもイディオムとなる場合に用いる記号で
あることを意味している。
【0023】図2に示す単語列処理参照テーブル5は、
上述したように、見出し項目101、活用情報項目10
2、機能項目103、訳項目104から構成されてい
る。見出し項目101は、イディオムとなる語句を格納
している。活用情報項目102は、イディオムとなる語
句を構成する単語の活用情報を、活用する単語とその活
用の種類という形式で格納している。機能項目103
は、見出し項目101で記述してある部分を一まとまり
として扱った場合の文内での機能を格納している。訳項
目104は、見出し項目101で記述してある部分を、
一まとまりとして扱った場合の文内での訳を格納してい
る。
上述したように、見出し項目101、活用情報項目10
2、機能項目103、訳項目104から構成されてい
る。見出し項目101は、イディオムとなる語句を格納
している。活用情報項目102は、イディオムとなる語
句を構成する単語の活用情報を、活用する単語とその活
用の種類という形式で格納している。機能項目103
は、見出し項目101で記述してある部分を一まとまり
として扱った場合の文内での機能を格納している。訳項
目104は、見出し項目101で記述してある部分を、
一まとまりとして扱った場合の文内での訳を格納してい
る。
【0024】例えば、“deal with ”というイディオム
を例とした場合、見出し項目101には、“deal with
”が格納される。この見出しの中で、“deal”は、
「動詞」であり、「原形、3単現、現在分詞、過去形、
過去分詞」のいずれの場合にもイディオムとして成立す
るので、図3の活用形の記号の中の“D0”を用い、活
用情報項目102には、“deal:D0”が格納される。
機能項目103には、“deal with ”が、文内で「動
詞」として機能するので「動詞」が格納される。訳項目
104には、“deal with ”の訳である「処理する」が
格納される。
を例とした場合、見出し項目101には、“deal with
”が格納される。この見出しの中で、“deal”は、
「動詞」であり、「原形、3単現、現在分詞、過去形、
過去分詞」のいずれの場合にもイディオムとして成立す
るので、図3の活用形の記号の中の“D0”を用い、活
用情報項目102には、“deal:D0”が格納される。
機能項目103には、“deal with ”が、文内で「動
詞」として機能するので「動詞」が格納される。訳項目
104には、“deal with ”の訳である「処理する」が
格納される。
【0025】また、例えば、“to all appearance ”の
単語列処理参照テーブル5の情報は、見出し項目101
には、“to all appearance ”が格納される。この見出
しの中で、“appearance”は、「名詞」であり、「単
数、複数」のいずれの場合にもイディオムとして成立す
るので、図3の活用形の記号の中で“N0”を用いて活
用情報項目102には、“appearance:N0”が格納さ
れる。機能項目103には、“to all appearance ”
が、文内で「副詞」として機能するので「副詞」が格納
される。訳項目104には、“to all appearance ”の
訳である「どう見ても」が格納される。
単語列処理参照テーブル5の情報は、見出し項目101
には、“to all appearance ”が格納される。この見出
しの中で、“appearance”は、「名詞」であり、「単
数、複数」のいずれの場合にもイディオムとして成立す
るので、図3の活用形の記号の中で“N0”を用いて活
用情報項目102には、“appearance:N0”が格納さ
れる。機能項目103には、“to all appearance ”
が、文内で「副詞」として機能するので「副詞」が格納
される。訳項目104には、“to all appearance ”の
訳である「どう見ても」が格納される。
【0026】活用情報項目102の記述において、以上
の例では全ての活用形に対応する例を示したが、例え
ば、動詞の活用情報を「現在分詞、過去分詞」の2つに
対応するように指定する場合には、活用情報項目には
“動詞の見出し:D3,D5”というように並べて記述
することができる。また、登録するイディオムに活用す
る語句が含まれていない場合や、活用させて使用しない
場合には、活用情報項目の欄は空白にしておく。
の例では全ての活用形に対応する例を示したが、例え
ば、動詞の活用情報を「現在分詞、過去分詞」の2つに
対応するように指定する場合には、活用情報項目には
“動詞の見出し:D3,D5”というように並べて記述
することができる。また、登録するイディオムに活用す
る語句が含まれていない場合や、活用させて使用しない
場合には、活用情報項目の欄は空白にしておく。
【0027】次に、図4の慣用表現参照テーブルを説明
する。慣用表現参照テーブルは、上述した単語列処理参
照テーブル5の見出し項目101および活用情報項目1
02の情報を変換した場合に得られる原形見出し302
と活用見出し303の構成を示すテーブルである。
する。慣用表現参照テーブルは、上述した単語列処理参
照テーブル5の見出し項目101および活用情報項目1
02の情報を変換した場合に得られる原形見出し302
と活用見出し303の構成を示すテーブルである。
【0028】原形見出し302および活用見出し303
は、単語列処理参照テーブル5にデータが登録される
と、単語列処理参照テーブル5の見出し項目101と活
用情報項目102の情報から、単語列処理部4によって
自動的に変換されて生成されるパターンである。原形見
出し302は、見出し301を構成する各単語の原形で
構成される見出しのことであり、活用見出し303は、
活用情報項目102で指定した情報に基づいて、見出し
301中の各単語が活用する場合に構成される見出しの
ことである。図4において、見出し項目301は単語列
処理参照テーブル5中の見出し項目101と同じものを
示し、これに対応する原形見出しおよび活用見出しを、
原形見出し項目302と活用見出し項目303に示す。
また、登録するイディオムに活用する語句が含まれてい
ない場合や、活用させて使用しない場合には、活用情報
項目102の欄は空白であり、この場合には原形見出し
および活用見出しには見出しと同じデータが生成され
る。
は、単語列処理参照テーブル5にデータが登録される
と、単語列処理参照テーブル5の見出し項目101と活
用情報項目102の情報から、単語列処理部4によって
自動的に変換されて生成されるパターンである。原形見
出し302は、見出し301を構成する各単語の原形で
構成される見出しのことであり、活用見出し303は、
活用情報項目102で指定した情報に基づいて、見出し
301中の各単語が活用する場合に構成される見出しの
ことである。図4において、見出し項目301は単語列
処理参照テーブル5中の見出し項目101と同じものを
示し、これに対応する原形見出しおよび活用見出しを、
原形見出し項目302と活用見出し項目303に示す。
また、登録するイディオムに活用する語句が含まれてい
ない場合や、活用させて使用しない場合には、活用情報
項目102の欄は空白であり、この場合には原形見出し
および活用見出しには見出しと同じデータが生成され
る。
【0029】例えば、単語列処理参照テーブル5の見出
し項目101の情報が“deal with”であり、活用情報
項目102の情報が“deal:D0”の場合、原形見出し
302は、“deal”の原形が“deal”であり、“with”
の原形が“with”であることから“deal with ”が生成
される。また、活用見出し303は、活用情報項目10
2の情報が“deal:D0”であるから、“deal”は、
「原形、3単現、現在分詞、過去形、過去分詞」に対応
し、“deal with, deals with, dealing with, dealt w
ith ”が生成される。このため、単語列処理参照テーブ
ル5は、原形見出しと活用見出しの情報が増えて、以下
に示すようなテーブルとなる。図5は、実際のイディオ
ム処理を行う場合の単語列処理参照テーブル5の説明図
であり、“deal with ”の例を示している。
し項目101の情報が“deal with”であり、活用情報
項目102の情報が“deal:D0”の場合、原形見出し
302は、“deal”の原形が“deal”であり、“with”
の原形が“with”であることから“deal with ”が生成
される。また、活用見出し303は、活用情報項目10
2の情報が“deal:D0”であるから、“deal”は、
「原形、3単現、現在分詞、過去形、過去分詞」に対応
し、“deal with, deals with, dealing with, dealt w
ith ”が生成される。このため、単語列処理参照テーブ
ル5は、原形見出しと活用見出しの情報が増えて、以下
に示すようなテーブルとなる。図5は、実際のイディオ
ム処理を行う場合の単語列処理参照テーブル5の説明図
であり、“deal with ”の例を示している。
【0030】また、例えば、単語列処理参照テーブル5
の見出し項目101の情報が“to all appearance ”で
あり、活用情報項目102の情報が“appearance:N
0”の場合、原形見出し302は、“to”の原形が“t
o”であり、“all ”の原形が“all ”であり、“appea
rance”の原形が“appearance”であるから、“to all
appearance ”が生成される。活用見出し303は、活
用情報項目102の情報が“appearance:N0”である
から、“appearance”は「単数、複数」に対応し、“to
all appearance, to all appearance”が生成される。
このため、単語列処理参照テーブル5は、原形見出しと
活用見出しの情報が増えて、以下に示すようなテーブル
となる。図6は、“to all appearance ”の場合の単語
列処理参照テーブル5の説明図である。
の見出し項目101の情報が“to all appearance ”で
あり、活用情報項目102の情報が“appearance:N
0”の場合、原形見出し302は、“to”の原形が“t
o”であり、“all ”の原形が“all ”であり、“appea
rance”の原形が“appearance”であるから、“to all
appearance ”が生成される。活用見出し303は、活
用情報項目102の情報が“appearance:N0”である
から、“appearance”は「単数、複数」に対応し、“to
all appearance, to all appearance”が生成される。
このため、単語列処理参照テーブル5は、原形見出しと
活用見出しの情報が増えて、以下に示すようなテーブル
となる。図6は、“to all appearance ”の場合の単語
列処理参照テーブル5の説明図である。
【0031】〈動作〉次に、単語列処理部4の動作を説
明する。図7は、その動作を示すフローチャートであ
る。 〈ステップ401〉入力された英文に対して、当該英文
を構成する各単語の原形情報を付与する。
明する。図7は、その動作を示すフローチャートであ
る。 〈ステップ401〉入力された英文に対して、当該英文
を構成する各単語の原形情報を付与する。
【0032】〈ステップ402〉原形情報に対して、単
語列処理参照テーブル5から生成された原形見出し30
2との照合を行い、該当するイディオムデータを抽出す
る。
語列処理参照テーブル5から生成された原形見出し30
2との照合を行い、該当するイディオムデータを抽出す
る。
【0033】〈ステップ403〉ステップ402の照合
により、単語列処理参照テーブル5から生成される原形
見出しデータの有無を判定する。この判定により、検索
されたデータが存在しなければイディオム処理を終了す
る。また、データが存在すれば次のステップ404に進
む。 〈ステップ404〉ステップ403の判定により該当し
た原形見出しを持つイディオムデータを用いて、入力さ
れた英文の原形情報に対応する表層上の語句と活用見出
しとの照合を行い、該当するイディオムデータを抽出す
る。
により、単語列処理参照テーブル5から生成される原形
見出しデータの有無を判定する。この判定により、検索
されたデータが存在しなければイディオム処理を終了す
る。また、データが存在すれば次のステップ404に進
む。 〈ステップ404〉ステップ403の判定により該当し
た原形見出しを持つイディオムデータを用いて、入力さ
れた英文の原形情報に対応する表層上の語句と活用見出
しとの照合を行い、該当するイディオムデータを抽出す
る。
【0034】〈ステップ405〉ステップ404の照合
により、単語列処理参照テーブル5から生成される活用
見出しデータの有無を判定する。この判定により、検索
されたデータが存在しなければイディオム処理を終了す
る。また、データが存在すれば次のステップ406に進
む。
により、単語列処理参照テーブル5から生成される活用
見出しデータの有無を判定する。この判定により、検索
されたデータが存在しなければイディオム処理を終了す
る。また、データが存在すれば次のステップ406に進
む。
【0035】〈ステップ406〉該当する見出し301
のデータを持つ単語列処理参照テーブル5の機能項目1
03および訳項目104の情報を得る。 〈ステップ407〉単語列処理参照テーブル5のイディ
オムの見出しに相当する語句列をイディオムパターンと
してまとめる。この際、原文の活用情報はまとめたイデ
ィオムパターンに付加情報として付与する。 〈ステップ408〉ステップ407でまとめたイディオ
ムパターンに単語列処理参照テーブル5の機能項目10
3、訳項目104の情報を付与する。
のデータを持つ単語列処理参照テーブル5の機能項目1
03および訳項目104の情報を得る。 〈ステップ407〉単語列処理参照テーブル5のイディ
オムの見出しに相当する語句列をイディオムパターンと
してまとめる。この際、原文の活用情報はまとめたイデ
ィオムパターンに付加情報として付与する。 〈ステップ408〉ステップ407でまとめたイディオ
ムパターンに単語列処理参照テーブル5の機能項目10
3、訳項目104の情報を付与する。
【0036】これで、単語列処理部4によるイディオム
処理が終了する。このように、英文中に存在するイディ
オムに対して単語列処理参照テーブル5に登録されたイ
ディオムを原形見出しと活用見出しに自動的に変換して
イディオム処理を行うため、イディオムを構成する語句
の固定部分における形態を変化させたイディオム見出し
を多数登録することなくイディオム処理を適用でき、イ
ディオムとして特殊に機能する部分は一まとまりにして
簡単に扱うことが可能となる。そして、以下、解析部
6、変換部8、生成部10、形態素生成部12と進んで
いき、出力部14から日本文を出力する。尚、これら解
析部6〜出力部14の動作は既知の動作であるため、こ
こでの説明は省略する。
処理が終了する。このように、英文中に存在するイディ
オムに対して単語列処理参照テーブル5に登録されたイ
ディオムを原形見出しと活用見出しに自動的に変換して
イディオム処理を行うため、イディオムを構成する語句
の固定部分における形態を変化させたイディオム見出し
を多数登録することなくイディオム処理を適用でき、イ
ディオムとして特殊に機能する部分は一まとまりにして
簡単に扱うことが可能となる。そして、以下、解析部
6、変換部8、生成部10、形態素生成部12と進んで
いき、出力部14から日本文を出力する。尚、これら解
析部6〜出力部14の動作は既知の動作であるため、こ
こでの説明は省略する。
【0037】次に、この単語列処理部4の動作例を例文
を用いて説明する。例えば、入力された英文が、イディ
オム表現である“deal with ”を含む“Hehas been dea
ling with the problem. ”の場合、先ず、ステップ4
01で、入力された英文に対して構成する各単語の原形
情報を付与する処理が行われ、“hehave be deal with
the problem. ”という情報を得る。
を用いて説明する。例えば、入力された英文が、イディ
オム表現である“deal with ”を含む“Hehas been dea
ling with the problem. ”の場合、先ず、ステップ4
01で、入力された英文に対して構成する各単語の原形
情報を付与する処理が行われ、“hehave be deal with
the problem. ”という情報を得る。
【0038】次に、ステップ402で、原形情報に対し
て単語列処理参照テーブル5から生成された原形見出し
302との照合を行い、該当するイディオムデータを抽
出する処理が行われ、原形見出し項目302の中の“de
al with ”を含むイディオムデータが検索される。この
場合には、以下のようなデータが検索される。図8は、
この場合の検索された照合データの候補を示す説明図で
ある。
て単語列処理参照テーブル5から生成された原形見出し
302との照合を行い、該当するイディオムデータを抽
出する処理が行われ、原形見出し項目302の中の“de
al with ”を含むイディオムデータが検索される。この
場合には、以下のようなデータが検索される。図8は、
この場合の検索された照合データの候補を示す説明図で
ある。
【0039】次に、ステップ403で単語列処理参照テ
ーブル5のデータの有無が判定される。この判定で、イ
ディオムデータが存在しなければ、イディオム処理を終
了し、存在すれば次のステップに進む。この場合には、
検索されたイディオムデータが存在するので、次のステ
ップに進む。
ーブル5のデータの有無が判定される。この判定で、イ
ディオムデータが存在しなければ、イディオム処理を終
了し、存在すれば次のステップに進む。この場合には、
検索されたイディオムデータが存在するので、次のステ
ップに進む。
【0040】次のステップ404では、ステップ403
で照合された原形見出しに該当する入力英文の原形情報
に対応する表層上の語句と、ステップ402で抽出され
たイディオムデータの活用見出し303との照合を行
い、該当するイディオムデータを抽出する処理が行われ
る。この場合には、原形見出し“deal with ”に該当す
る入力英文の表層上の語句は“dealing with”であり、
また、原形見出しに対応する活用見出しは、“deal wit
h, deals with, dealing with, dealt with ”であり、
この中に該当する活用見出しのデータ“dealing with”
が存在するので、このデータがイディオムデータとして
抽出される。即ち、以下のようなイディオムデータが抽
出されることになる。図9は、この場合の抽出された照
合データの候補を示す説明図である。
で照合された原形見出しに該当する入力英文の原形情報
に対応する表層上の語句と、ステップ402で抽出され
たイディオムデータの活用見出し303との照合を行
い、該当するイディオムデータを抽出する処理が行われ
る。この場合には、原形見出し“deal with ”に該当す
る入力英文の表層上の語句は“dealing with”であり、
また、原形見出しに対応する活用見出しは、“deal wit
h, deals with, dealing with, dealt with ”であり、
この中に該当する活用見出しのデータ“dealing with”
が存在するので、このデータがイディオムデータとして
抽出される。即ち、以下のようなイディオムデータが抽
出されることになる。図9は、この場合の抽出された照
合データの候補を示す説明図である。
【0041】次に、ステップ405で、単語列処理参照
テーブル5のイディオムデータの有無が判定される。こ
の判定で、イディオムデータが存在しなければ、イディ
オム処理を終了し、存在すれば、次のステップに進む。
この場合には、イディオムデータが存在するので、次の
ステップに進む。
テーブル5のイディオムデータの有無が判定される。こ
の判定で、イディオムデータが存在しなければ、イディ
オム処理を終了し、存在すれば、次のステップに進む。
この場合には、イディオムデータが存在するので、次の
ステップに進む。
【0042】次のステップ406では、照合されたイデ
ィオムデータの機能項目103および訳項目104から
情報を抽出する。この場合には、機能項目103から
「動詞」、訳項目104から「処理する」がそれぞれ抽
出される。
ィオムデータの機能項目103および訳項目104から
情報を抽出する。この場合には、機能項目103から
「動詞」、訳項目104から「処理する」がそれぞれ抽
出される。
【0043】次に、ステップ407では、入力された英
文中で、イディオムとして照合された語句列をイディオ
ムパターンとしてまとめる。この際、原文の活用情報
は、まとめたイディオムパターンに付加情報として付与
する。この場合には、入力された英文が“He has been
dealing with the problem. ”であり、その原形情報が
“he have be deal with the problem. ”である。まと
めるべきイディオムは“deal with ”であるが、英文
は、“dealing with”という形態に活用されている。こ
のため、“He has been [deal with] the problem.”と
してイディオム部分をまとめ、この“[deal with] ”に
付加情報として“deal:現在分詞”を付与しておく。こ
の付加情報により、単語列処理部4の次に来る解析部6
の構文解析処理において、動詞“deal”が現在分詞の形
式をしていることが認識され処理される。
文中で、イディオムとして照合された語句列をイディオ
ムパターンとしてまとめる。この際、原文の活用情報
は、まとめたイディオムパターンに付加情報として付与
する。この場合には、入力された英文が“He has been
dealing with the problem. ”であり、その原形情報が
“he have be deal with the problem. ”である。まと
めるべきイディオムは“deal with ”であるが、英文
は、“dealing with”という形態に活用されている。こ
のため、“He has been [deal with] the problem.”と
してイディオム部分をまとめ、この“[deal with] ”に
付加情報として“deal:現在分詞”を付与しておく。こ
の付加情報により、単語列処理部4の次に来る解析部6
の構文解析処理において、動詞“deal”が現在分詞の形
式をしていることが認識され処理される。
【0044】次のステップ408では、まとめたイディ
オムパターンに、ステップ406で抽出した機能項目1
03および訳項目104の情報を付与する。この例で
は、機能項目103の情報として「動詞」、訳項目10
4の情報として「処理する」を付与する。
オムパターンに、ステップ406で抽出した機能項目1
03および訳項目104の情報を付与する。この例で
は、機能項目103の情報として「動詞」、訳項目10
4の情報として「処理する」を付与する。
【0045】このように、単語列処理部4では、英文中
に存在するイディオムに対して、単語列処理参照テーブ
ル5に登録されたイディオムを、原形見出しと活用見出
しに自動的に変換してイディオム処理を行うため、イデ
ィオムを構成する語句の固定部分における形態を変化さ
せたイディオム見出しを多数登録することなく、イディ
オム処理を適用でき、また、イディオムとして特殊に機
能する部分は一まとまりにして簡単に扱うことが可能と
なる。そして、以下、解析部6、変換部8、生成部1
0、形態素生成部12と進んでいき、最終的に英文“He
has been dealing with the problem. ”に対する日本
文「彼は、その問題を処理し続けている。」を生成す
る。
に存在するイディオムに対して、単語列処理参照テーブ
ル5に登録されたイディオムを、原形見出しと活用見出
しに自動的に変換してイディオム処理を行うため、イデ
ィオムを構成する語句の固定部分における形態を変化さ
せたイディオム見出しを多数登録することなく、イディ
オム処理を適用でき、また、イディオムとして特殊に機
能する部分は一まとまりにして簡単に扱うことが可能と
なる。そして、以下、解析部6、変換部8、生成部1
0、形態素生成部12と進んでいき、最終的に英文“He
has been dealing with the problem. ”に対する日本
文「彼は、その問題を処理し続けている。」を生成す
る。
【0046】また、例えば、入力された英文がイディオ
ム表現である“to all appearance”を含む“He is to
all appearances kind.”の場合には以下のような処理
が行われる。
ム表現である“to all appearance”を含む“He is to
all appearances kind.”の場合には以下のような処理
が行われる。
【0047】先ず、ステップ401で、入力された英文
に対して、構成する各単語の原形情報を付与する処理が
行われ、“he be to all appearance kind. ”という情
報を得る。
に対して、構成する各単語の原形情報を付与する処理が
行われ、“he be to all appearance kind. ”という情
報を得る。
【0048】次に、ステップ402で、原形情報に対し
て単語列処理参照テーブル5から生成された原形見出し
302との照合を行い、該当するイディオムデータを抽
出する処理が行われ、原形見出し項目302の中の“to
all appearance ”を含むイディオムデータが検索され
る。この場合には、以下のようなデータが検索される。
図10は、この場合の検索された照合データの候補を示
す説明図である。
て単語列処理参照テーブル5から生成された原形見出し
302との照合を行い、該当するイディオムデータを抽
出する処理が行われ、原形見出し項目302の中の“to
all appearance ”を含むイディオムデータが検索され
る。この場合には、以下のようなデータが検索される。
図10は、この場合の検索された照合データの候補を示
す説明図である。
【0049】次に、ステップ403で単語列処理参照テ
ーブル5のデータの有無が判定される。この判定で、イ
ディオムデータが存在しなければ、イディオム処理を終
了し、存在すれば次のステップに進む。この場合には、
検索されたイディオムデータが存在するので、次のステ
ップに進む。
ーブル5のデータの有無が判定される。この判定で、イ
ディオムデータが存在しなければ、イディオム処理を終
了し、存在すれば次のステップに進む。この場合には、
検索されたイディオムデータが存在するので、次のステ
ップに進む。
【0050】次に、ステップ404において、照合され
た原形見出しに該当する入力英文の原形情報に対応する
表層上の語句と、ステップ402で抽出されたイディオ
ムデータの活用見出しとの照合を行い、該当するイディ
オムデータを抽出する処理を行う。この場合には、原形
見出し“to all appearance ”に該当する入力英文の表
層上の語句は“to all appearances”であり、また、原
形見出しに対応する活用見出しは、“to all appearanc
e, to all appearances ”であるから、該当する活用見
出しのデータ“to all appearances”が存在するので、
このデータがイディオムデータとして抽出される。即
ち、以下のようなイディオムデータが抽出されることに
なる。図11は、この場合の抽出された照合データの候
補を示す説明図である。
た原形見出しに該当する入力英文の原形情報に対応する
表層上の語句と、ステップ402で抽出されたイディオ
ムデータの活用見出しとの照合を行い、該当するイディ
オムデータを抽出する処理を行う。この場合には、原形
見出し“to all appearance ”に該当する入力英文の表
層上の語句は“to all appearances”であり、また、原
形見出しに対応する活用見出しは、“to all appearanc
e, to all appearances ”であるから、該当する活用見
出しのデータ“to all appearances”が存在するので、
このデータがイディオムデータとして抽出される。即
ち、以下のようなイディオムデータが抽出されることに
なる。図11は、この場合の抽出された照合データの候
補を示す説明図である。
【0051】次に、ステップ405で、単語列処理参照
テーブル5のイディオムデータの有無が判定される。こ
の判定で、イディオムデータが存在しなければ、イディ
オム処理を終了し、存在すれば、次のステップに進む。
この場合には、検索されたイディオムデータが存在する
ので、次のステップに進む。
テーブル5のイディオムデータの有無が判定される。こ
の判定で、イディオムデータが存在しなければ、イディ
オム処理を終了し、存在すれば、次のステップに進む。
この場合には、検索されたイディオムデータが存在する
ので、次のステップに進む。
【0052】次に、ステップ406では、照合されたイ
ディオムデータの機能項目103および訳項目104か
ら情報を抽出する。この場合には、機能項目103から
「副詞」、訳項目104から「どう見ても」がそれぞれ
抽出される。
ディオムデータの機能項目103および訳項目104か
ら情報を抽出する。この場合には、機能項目103から
「副詞」、訳項目104から「どう見ても」がそれぞれ
抽出される。
【0053】次に、ステップ407では、入力された英
文中で、イディオムとして照合された語句列をイディオ
ムパターンとしてまとめる。この際、原文の活用情報
は、まとめたイディオムパターンに付加情報として付与
する。この場合には、入力された英文が“He is to all
appearances kind.”であり、その原形情報が“he bet
o all appearance kind. ”である。まとめるべきイデ
ィオムは“to all appearance ”であるが、英文は、
“to all appearances”という形態に活用されている。
このため、“He is [to all appearance] kind. ”とし
てイディオム部分をまとめ、この“[to all appearanc
e] ”に付加情報として“appearance:複数”を付与し
ておく。この付加情報により、単語列処理部4の次に来
る解析部6の構文解析処理において、名詞“appearanc
e”が複数の形式をしていることが認識され処理され
る。
文中で、イディオムとして照合された語句列をイディオ
ムパターンとしてまとめる。この際、原文の活用情報
は、まとめたイディオムパターンに付加情報として付与
する。この場合には、入力された英文が“He is to all
appearances kind.”であり、その原形情報が“he bet
o all appearance kind. ”である。まとめるべきイデ
ィオムは“to all appearance ”であるが、英文は、
“to all appearances”という形態に活用されている。
このため、“He is [to all appearance] kind. ”とし
てイディオム部分をまとめ、この“[to all appearanc
e] ”に付加情報として“appearance:複数”を付与し
ておく。この付加情報により、単語列処理部4の次に来
る解析部6の構文解析処理において、名詞“appearanc
e”が複数の形式をしていることが認識され処理され
る。
【0054】次に、ステップ408では、まとめたイデ
ィオムパターンに、ステップ406で抽出した機能項目
103および訳項目104の情報を付与する。この例で
は、機能項目103の情報として「副詞」、訳項目10
4の情報として「どう見ても」を付与する。
ィオムパターンに、ステップ406で抽出した機能項目
103および訳項目104の情報を付与する。この例で
は、機能項目103の情報として「副詞」、訳項目10
4の情報として「どう見ても」を付与する。
【0055】これで、イディオム処理が終了し、以下、
解析部6、変換部8、生成部10、形態素生成部12と
進んでいき、最終的に英文“He is to all appearances
kind.”に対する日本文「彼はどう見ても親切であ
る。」を生成する。
解析部6、変換部8、生成部10、形態素生成部12と
進んでいき、最終的に英文“He is to all appearances
kind.”に対する日本文「彼はどう見ても親切であ
る。」を生成する。
【0056】〈効果〉以上説明したように、上記具体例
によれば、上記のように構成された単語列処理参照テー
ブル5を利用してイディオム処理を行うようにしたの
で、これ以降の処理過程において簡単に扱えるようにな
る。そして、このような単語列処理参照テーブル5およ
び単語列処理部4を設けることにより、従来のように、
構成する語句の固定部分の形態が変化するイディオムに
対して、その変化形の形態を一つ一つのイディオムとし
て登録しなければならないというようなことはなくな
り、辞書登録の負担が軽減され、簡易な運用が可能とな
る。しかも、重複して記憶する情報が少ないので、情報
記憶容量も縮減できるという効果がある。
によれば、上記のように構成された単語列処理参照テー
ブル5を利用してイディオム処理を行うようにしたの
で、これ以降の処理過程において簡単に扱えるようにな
る。そして、このような単語列処理参照テーブル5およ
び単語列処理部4を設けることにより、従来のように、
構成する語句の固定部分の形態が変化するイディオムに
対して、その変化形の形態を一つ一つのイディオムとし
て登録しなければならないというようなことはなくな
り、辞書登録の負担が軽減され、簡易な運用が可能とな
る。しかも、重複して記憶する情報が少ないので、情報
記憶容量も縮減できるという効果がある。
【0057】《利用形態》上記具体例では、複数の単語
からなる語句全体で固有の意味を持つ単語列として、い
わゆるイディオムの場合を説明したが、これ以外の単語
列であっても、利用者が、その単語列全体で固有の意味
を持つものとして処理させたい場合は、上記具体例同様
に、その単語列の見出し、活用情報、機能、訳を登録す
ることにより、上記具体例と同様の効果を奏することが
できる。
からなる語句全体で固有の意味を持つ単語列として、い
わゆるイディオムの場合を説明したが、これ以外の単語
列であっても、利用者が、その単語列全体で固有の意味
を持つものとして処理させたい場合は、上記具体例同様
に、その単語列の見出し、活用情報、機能、訳を登録す
ることにより、上記具体例と同様の効果を奏することが
できる。
【図1】本発明の機械翻訳システムの具体例を示すブロ
ック図である。
ック図である。
【図2】単語列処理参照テーブルの一例を示す図であ
る。
る。
【図3】活用形記号テーブルの説明図である。
【図4】慣用表現参照テーブルの説明図である。
【図5】deal with の場合の単語列処理参照テーブルの
説明図である。
説明図である。
【図6】to all appearance の場合の単語列処理参照テ
ーブルの説明図である。
ーブルの説明図である。
【図7】単語列処理部の動作を示すフローチャートであ
る。
る。
【図8】deal with の照合データの候補の説明図(その
1)である。
1)である。
【図9】deal with の照合データの候補の説明図(その
2)である。
2)である。
【図10】to all appearance の照合データの候補の説
明図(その1)である。
明図(その1)である。
【図11】to all appearance の照合データの候補の説
明図(その2)である。
明図(その2)である。
4 単語列処理部 5 単語列処理参照テーブル
Claims (1)
- 【請求項1】 原言語の複数の単語からなる語句全体で
固有の意味を持つ単語列に対して、当該単語列の見出し
と、前記単語列中、他の語との関係から形態が変化する
単語の活用形態を示す活用情報と、前記単語列を一まと
まりとして扱った場合の品詞を示す機能と、当該単語列
の前記固有の意味である目的言語の訳とを格納する単語
列処理参照テーブルと、 原言語の任意の単語列に対して、前記単語列処理参照テ
ーブルの見出しに基づき、当該見出しにおける各単語の
原形で構成する原形見出しを生成すると共に、前記活用
情報に基づき、単語の形態が変化した単語列である活用
見出しを生成し、 一方、入力された原言語の文に対して、各単語の原形を
求め、当該原形の単語列と前記入力文中の単語列とを、
前記原形見出しと活用見出しとに一致するか照合し、一
致した場合は、前記機能と訳とを出力する単語列処理部
とを備えたことを特徴とする機械翻訳システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8275378A JPH10105552A (ja) | 1996-09-26 | 1996-09-26 | 機械翻訳システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8275378A JPH10105552A (ja) | 1996-09-26 | 1996-09-26 | 機械翻訳システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH10105552A true JPH10105552A (ja) | 1998-04-24 |
Family
ID=17554659
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8275378A Pending JPH10105552A (ja) | 1996-09-26 | 1996-09-26 | 機械翻訳システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH10105552A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453280B1 (en) | 1998-10-07 | 2002-09-17 | International Business Machines Corporation | Electronic dictionary capable of identifying idioms |
-
1996
- 1996-09-26 JP JP8275378A patent/JPH10105552A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6453280B1 (en) | 1998-10-07 | 2002-09-17 | International Business Machines Corporation | Electronic dictionary capable of identifying idioms |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3220560B2 (ja) | 機械翻訳装置 | |
US5490061A (en) | Improved translation system utilizing a morphological stripping process to reduce words to their root configuration to produce reduction of database size | |
US5895446A (en) | Pattern-based translation method and system | |
US5475586A (en) | Translation apparatus which uses idioms with a fixed and variable portion where a variable portion is symbolic of a group of words | |
JPS61163467A (ja) | 機械翻訳システム | |
US20040254783A1 (en) | Third language text generating algorithm by multi-lingual text inputting and device and program therefor | |
JPH05120324A (ja) | 言語処理方式 | |
JPH0855123A (ja) | イディオム登録機能を有する機械翻訳装置 | |
JPH08212216A (ja) | 自然言語処理装置および自然言語処理方法 | |
JPH10105552A (ja) | 機械翻訳システム | |
JP3136973B2 (ja) | 言語解析システムおよび方法 | |
JP3244286B2 (ja) | 翻訳処理装置 | |
JP2719453B2 (ja) | 機械翻訳装置 | |
JP3884001B2 (ja) | 言語解析システムおよび方法 | |
JPH1166068A (ja) | 機械翻訳装置および機械翻訳方法ならびに機械翻訳プログラムを記録した記録媒体 | |
JPS63109572A (ja) | 派生語処理方式 | |
JP3132563B2 (ja) | 文書作成支援装置 | |
JP2608384B2 (ja) | 機械翻訳装置及びその方法 | |
JPH09146959A (ja) | 機械翻訳システム | |
JP2901977B2 (ja) | 翻訳装置 | |
JPH06325082A (ja) | 機械翻訳装置 | |
JPH02208775A (ja) | 機械翻訳方式 | |
JPH07249044A (ja) | 機械翻訳装置 | |
JPH0962682A (ja) | 英文解析システム | |
JPH02110771A (ja) | 電訳機 |