JP3768157B2 - 他言語オントロジー辞書利用装置及び方法並びにプログラム - Google Patents

他言語オントロジー辞書利用装置及び方法並びにプログラム Download PDF

Info

Publication number
JP3768157B2
JP3768157B2 JP2001401617A JP2001401617A JP3768157B2 JP 3768157 B2 JP3768157 B2 JP 3768157B2 JP 2001401617 A JP2001401617 A JP 2001401617A JP 2001401617 A JP2001401617 A JP 2001401617A JP 3768157 B2 JP3768157 B2 JP 3768157B2
Authority
JP
Japan
Prior art keywords
language
translation
ontology
ontology dictionary
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001401617A
Other languages
English (en)
Other versions
JP2003196276A (ja
Inventor
佳美 齋藤
能久 大嶽
和広 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001401617A priority Critical patent/JP3768157B2/ja
Publication of JP2003196276A publication Critical patent/JP2003196276A/ja
Application granted granted Critical
Publication of JP3768157B2 publication Critical patent/JP3768157B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、他言語のオントロジー辞書を利用するための他言語オントロジー辞書利用装置及び方法並びにプログラムに関する。
【0002】
【従来の技術】
近年、電子技術や半導体技術、そしてソフトウェア技術の飛躍的な進歩に伴い、計算機はますます小型化され、広く普及している。特に最近は、一定の形式に基づいて作成されネットワーク上に分散的に存在する文書をインターネット環境で閲覧するシステムが爆発的に普及しており、計算機上で文書を作成したり検索したりする機会が飛躍的に増大している。
【0003】
また、これらの文書は、あらゆる言語で作成される可能性を持ち、実際、インターネット上には様々な言語により記述された文書が存在している。ユーザがこれらの様々な言語で記述された文書資源にアクセスし、必要な情報、役に立つ情報、意義ある情報を効率よく得たいという要求はますます強くなっている。
【0004】
以上のように、近年においては様々な言語で記述された種々の文書資源に対し、これを自動的に検索するための文書検索システムや、自動的に翻訳するための機械翻訳システムの性能向上が必須課題となっている。更に、これらのシステムを含め、文書資源に関わる人間の行動をコンピュータにより支援するための様々なシステムについて、自然言語処理の分野で、多くの研究・開発が行われている。
【0005】
これら、自然言語処理システムにおける重要な課題のひとつは、自然言語表現の意味処理の精度を向上させることである。すなわち、意味の曖昧性、意味の類似性などの問題であり、例えば、ある表現が文脈により別の意味を持ったり、また互いに異なる表現が同じ意味を持ったりするという問題を解決する必要がある。
【0006】
この問題を解決するための手段のひとつとして、自然言語表現に関する意味的な知識をコンピュータに理解可能な形式で記述したオントロジー辞書を利用する方法がある。オントロジー辞書は、類義語、上位下位、対語、因果性、方法、格パターン等のように例えば単語間の種々の関係を記述したものであり、自然言語表現の本質的な意味処理には、オントロジー辞書は必須である。
【0007】
自然言語処理の性能を向上させるためには、オントロジー辞書の開発は欠くことのできない要素である。オントロジー辞書は、言語テキストの膨大なデータベースであるコーパス等を利用して、通常、人手で作成される。
【0008】
【発明が解決しようとする課題】
しかしながら、オントロジー辞書の開発は、例えば対訳辞書の開発等に比べて、多大の時間と労力とを必要とし、良質のオントロジー辞書を構築することは極めて困難である。特に、他国のオントロジー辞書の構築は容易ではなく、良質な自国のオントロジー辞書が存在しても、これを基に良質な他国のオントロジー辞書を構築することはできない。また、その言語圏において自然言語処理自体が十分に発展していなければ、単語間の種々の関係の全てを網羅した良質なオントロジー辞書を構築することはできない。また、オントロジー辞書の開発にはその分野における発展度合いも関係し、例えば、遺伝子情報の分野や生物分野等において十分成熟していなければ、これらの分野の良質なオントロジー辞書を構築することはできない。
【0009】
従って、全ての分野において全ての言語について良質なオントロジー辞書を揃えることは不可能であり、少なくとも自国で成熟していない分野については、良質なオントロジー辞書が得られないという問題点があった。
【0010】
本発明は、第1の言語の意味処理に際して、第2の言語で記述されたオントロジー辞書を利用可能とすることにより、自然言語処理システムの性能を向上させることができる他言語オントロジー辞書利用装置及び方法並びにプログラムを提供することを目的とする。
【0011】
【課題を解決するための手段】
本発明に係る他言語オントロジー辞書利用装置は、入力された第1の言語を第2の言語に翻訳する第1の翻訳手段と、前記第2の言語で構築されたオントロジー辞書を前記第1の翻訳機能手段の翻訳結果に基づいて検索し、検索結果であるオントロジー情報を取得するオントロジー辞書検索手段と、前記第2の言語で記述されている前記検索結果を前記第1の言語に翻訳する第2の翻訳手段とを具備したものである。
【0012】
本発明において、入力された第1の言語は、第1の翻訳手段によって第2の言語に翻訳される。オントロジー辞書検索手段は、この翻訳結果が用いて、第2の言語で構築されたオントロジー辞書を検索する。検索結果であるオントロジー情報は、第2の翻訳手段によって第1の言語に翻訳される。これにより、第1の言語で記述された文書資源に対する意味処理に際して第2の言語で記述されたオントロジー辞書の利用を可能にする。
【0013】
なお、装置に係る本発明は方法に係る発明としても成立する。
【0014】
また、装置に係る本発明は、コンピュータに当該発明に相当する処理を実行させるためのプログラムとしても成立する。
【0015】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について詳細に説明する。図1は本発明の一実施の形態に係る他言語オントロジー辞書利用装置を示すブロック図である。
【0016】
本実施の形態は第1の言語と第2の言語との間の翻訳を可能にすると共に、翻訳時等の解釈及び表現の多様性を考慮した出力結果を得ることにより、第2の言語で記述された良質なオントロジー辞書を第1の言語の言語表現によっても十分に利用可能とするようにしたものである。なお、オントロジー辞書は少なくとも類義語情報又はシソーラス情報を含むものである。
【0017】
図1は第1の言語として日本語を採用し第2の言語として英語を採用して、良質な英語のオントロジー辞書を日本語で利用可能にした装置を示している。
【0018】
入力部102には、オントロジー辞書を使用する自然言語処理における日本語の言語表現が入力される。例えば、検索ソフトや翻訳ソフト等のアプリケーションが発生する言語表現が入力されることもあり、また、ユーザの入力操作に基づく日本語表現が入力されることもある。一方、出力部103からはオントロジー辞書の出力結果である日本語の言語表現が出力される。
【0019】
日英翻訳機能部104は、制御部101から日本語の言語表現が入力され、この日本語の言語表現を英語に翻訳する。オントロジー辞書検索機能部105は、日英翻訳部104の翻訳結果が与えられ、この翻訳結果を用いて、英語オントロジー辞書108を検索する。英語オントロジー辞書108は、英語で記述された所定のオントロジー辞書であり、オントロジー辞書翻訳検索機能部105は、英語オントロジー辞書108を検索することで、日英翻訳結果に基づく英語表現を得て、英日訳機能部106に出力する。英日翻訳機能部106は、オントロジー辞書検索機能部105からの英語表現を日本語に翻訳するようなっている。
【0020】
なお、英語オントロジー辞書108は、類義語、下位概念・下位語、反対概念・反対語等の種々の情報の全て又は一部を備えている。なお、本実施の形態においては、説明を簡略化するために、英語オントロジー辞書108としては、上位概念・上位語を得るオントロジー情報のみを備えているものとする。
【0021】
制御部101はこれらのシステム全体を制御する。出力情報保持部107は、日英翻訳機能部104、オントロジー辞書検索機能部105及び英日翻訳機能部106の出力を保持するようになっている。
【0022】
図2は図1中の出力情報保持部107に保持される情報を説明するための説明図である。図2中のnは任意の整数を示している。また、図2中の各フィールドには文字列データが記述される。また、A1 ,A2 ,…、C1 ,C2 ,…及びE1 ,E2 ,…は、意味解釈の別(語義)を表し、B1 ,B2 ,…、D1 ,D2 ,…及びF1 ,F2 ,…は表現リストを表す。
【0023】
上述したように、1つの言語について複数の解釈及び表現が存在する。従って、日英翻訳、オントロジー辞書検索、英日翻訳に際して、これらの複数の解釈及び表現に応じた分岐が生じる。出力情報保持部107は、これらの分岐についての情報を保持することで、異なる言語間でのオントロジー辞書の利用の実効性を向上させるようになっている。
【0024】
即ち、出力情報保持部107は、図2に示すように、日本語の1つの言語表現(日本語表現)に対して複数の日英解釈A1 ,A2 ,…を記憶する領域を有し、更に、各日英解釈A1 ,A2 ,…について夫々複数の日英訳語B1 ,B2 ,…を記憶する領域を有する。日英解釈及び日英訳語は、図1中の日英翻訳機能部104によって得られる。
【0025】
また、出力情報保持部107は、各日英訳語B1 ,B2 ,…について夫々複数の上位概念C1 ,C2 ,…を記憶する領域を有し、更に、各上位概念C1 ,C2 ,…について夫々複数の上位語D1 ,D2 ,…を記憶する領域を有する。これらの上位概念及び上位語は、図1中のオントロジー辞書検索機能部105によって得られる。
【0026】
また、出力情報保持部107は、各上位語D1 ,D2 ,…について夫々複数の英日解釈E1 ,E2 ,…を記憶する領域を有し、更に、各英日解釈E1 ,E2 ,…について夫々複数の英日訳語F1 ,F2 ,…を記憶する領域を有する。これらの英日解釈及び英日訳語は、図1中の英日翻訳機能部106によって得られる。
【0027】
次に、このように構成された実施の形態の作用について図3を参照して説明する。図3は処理の流れの概要を示すフローチャートである。
【0028】
いま、例えば、上位概念・上位語に関する良質な日本語オントロジー辞書が存在しない場合において、検索ソフトや翻訳ソフト等のアプリケーションが上位概念・上位語に関する良質な英語オントロジー辞書108を利用して上位概念・上位語を得る場合について説明する。
【0029】
アプリケーション等から入力部101を介して入力された日本語表現は、制御部101によって日英翻訳機能部104及び出力情報保持部107に供給される。日英翻訳機能部104は、図3のステップS1 において、入力された日本語表現を英語の言語表現(英語表現)に翻訳する。翻訳結果はオントロジー辞書検索機能部105及び出力情報保持部107に供給される。こうして、出力情報保持部107において、日本語表現に対する日英解釈及び日英訳語が記憶される。
【0030】
オントロジー辞書検索機能部105は、入力された英語表現について、ステップS2 において英語オントロジー辞書108を検索し、英語オントロジー情報を得る。オントロジー辞書検索機能部105は、取得した英語オントロジー情報を英日翻訳機能部106及び出力情報保持部107に出力する。こうして、出力情報保持部107において、英語表現に対するオントロジー情報、即ち、この場合には上位概念・上位語の情報を記憶する。
【0031】
英日翻訳機能部106は、入力された英語オントロジー情報を日本語オントロジー情報に翻訳する。英日翻訳機能部106は翻訳結果を出力情報保持部107に出力する。こうして、出力情報保持部107は、英日解釈及び英日訳語の情報を記憶する。
【0032】
出力情報保持部107は、記憶した情報を制御部101に出力する。制御部101は、出力情報保持部107に記憶されている日本語オントロジー情報を出力部103を介して出力する。
【0033】
次に、図4乃至図7の説明図及び図8のフローチャートを参照して、英語オントロジー辞書の利用法について具体例を用いて説明する。図4乃至図7は夫々出力情報保持部107に記憶されている日本語表現、日英翻訳結果、英語オントロジー辞書108の検索結果及び日英翻訳結果を示している。
【0034】
いま、入力部102を介して日本語表現として「車」が入力されるものとする。制御部101は、ステップS11において、入力された日本語を出力情報保持部107に保持させる。図4はこの場合の出力情報保持部107の記憶内容を示している。日本語表現のフィールドに「車」という文字列が保持される。
【0035】
次に、ステップS12において、制御部101は、入力された日本語表現を日英翻訳機能部104に送る。日英翻訳機能部104は、「車」について英語への翻訳を行う。日英翻訳機能部104が「車」について、例えば、日本語で乗り物を意味する「車」と車輪を意味する「車」との2つの意味に解釈し、これらの2つの意味解釈について3つの訳語表現を得るものとする。日英翻訳機能部104は、これらの2つの意味解釈の3つの訳語表現を日英翻訳結果として出力情報保持部107に出力する。
【0036】
図5はこの場合の出力情報保持部107に保持されている日英翻訳結果を示している。図5に示すように、「車」という日本語表現に対して、乗り物を意味する「車」として“vehicle”と“car”という2つの訳語が記憶され、車輪を意味する「車」として“wheel”という訳語が記憶されている。
【0037】
制御部101は、次のステップS13において、日英翻訳結果の1番目の意味解釈を参照する。この場合には、図5の日英解釈のA1 欄を参照する。次に、制御部101は、ステップS14において、参照している意味解釈の第1番目の訳語表現(図5のB1 欄の文字列)を図示しないオントロジー辞書検索語バッファにセットする。図5の例では、“vehicle”という表現がセットされる。次いで、制御部101は、ステップS15において、検索語バッファにセットされた検索語をオントロジー辞書検索機能部105に送る。
【0038】
これにより、オントロジー辞書検索機能部105は、1番目の意味解釈(“vehicle”という単語)について、英語オントロジー辞書108を検索して英語のオントロジー情報を得る。
【0039】
例えば、英語オントロジー辞書108が“vehicle”について、例えば、上位概念として日本語で輸送と媒体の2つの概念を備え、これらの2つの意味解釈(上位概念)について、夫々“transportation”及び“transport”と“medium”との3つの上位語表現を有しているものとする。オントロジー辞書検索機能部105は、これらの2つの意味解釈の3つの上位語表現を英語オントロジー情報として出力情報保持部107に出力する。
【0040】
図6はこの場合の出力情報保持部107に保持されている英語オントロジー情報の検索結果を示している。図6に示すように、“vehicle”という日英翻訳結果の英語表現に対して、日本語で輸送を意味する“transportaion”と“transpot”という2つの上位語が記憶され、日本語で媒体を意味する“medium”という1つの上位語が記憶されている。
【0041】
制御部101は、次のステップS16において、英語オントロジー情報の検索結果の1番目の意味解釈(上位概念)を参照する。この場合には、図6の上位概念のC1 欄を参照する。次に、制御部101は、ステップS17において、参照している意味解釈の第1番目の上位語表現(図6のD1 欄の文字列)を図示しない英語オントロジー表現バッファにセットする。図6の例では、“transpotation”という表現がセットされる。次いで、制御部101は、ステップS18において、英語オントロジー表現バッファにセットされた英語表現を英日翻訳機能部106に送る。
【0042】
これにより、英日翻訳機能部106は、1番目の上位語(“transpotaion”という単語)について、日本語への翻訳を行う。英日翻訳機能部106が“transpotation”について、例えば、1つの意味解釈のみを有し、この意味解釈について、「輸送」と「輸送機関」との2つの訳語表現を得るものとする。英日翻訳機能部106は、この1つの意味解釈の2つの訳語表現を英日翻訳結果として出力情報保持部107に出力する。
【0043】
図7はこの場合の出力情報保持部107に保持されている英日翻訳結果を示している。図7に示すように、“transpotration”という英語表現に対して、「輸送」と「輸送機関」という2つの訳語が記憶されている。
【0044】
こうして、ステップS18において、日本語表現の「車」に対して、「輸送」及び「輸送機関」という上位語の日本語オントロジー情報が得られる。
【0045】
次のステップS19では、制御部101は、参照しているオントロジー情報、即ち、図7のD欄に次のオントロジー表現(上位語)があるか否かを調べる。次のオントロジー表現がある場合には、ステップS20に処理を進め、無い場合にはステップS21に処理を移行する。この場合には、次のオントロジー表現として、D1 欄に“transport”があるので、ステップS20に進む。
【0046】
ステップS20において、制御部101は、次のオントロジー表現を英語オントロジー表現バッファにセットし、処理をステップS18に戻す。以後、ステップS18〜S20を繰返して、全てのオントロジー表現に対して英日翻訳結果を得て出力情報保持部107に保持させる。
【0047】
図7の上位概念のC1 欄の全てのオントロジー表現(上位語)についての英日翻訳結果が出力情報保持部107に記憶されると、制御部101は、ステップS19からステップS21に処理を移行して、次の意味解釈(上位概念)があるか否かを判定する。
【0048】
この場合には、図7のC2 欄に上位概念として“medium”があるので、処理をステップS22に移行して、上位概念のC2 欄を参照する。次いで、ステップS17に処理を戻して、C2 欄の上位概念中の1番目の上位語の文字列(“medium”)を英語オントロジー表現バッファにセットする。以後、ステップS17〜S22を繰返して、全ての上位概念についての英日翻訳結果である日本語オントロジー情報を得て、出力情報保持部107に記憶させる。
【0049】
こうして、図7のB1 欄の日英訳語(“vehicle”)について、英語オントロジー辞書108を用いて得られる全ての日本語オントロジー情報が出力情報保持部107に記憶される。
【0050】
次に、制御部101は、ステップS23において、現在参照している日英翻訳結果の意味解釈で、次の訳語表現があるか否かを調べる。この場合には、図7のB2 欄に次の訳語表現として“car”があるので、処理をステップS24に移行する。なお、次の訳語表現がない場合には、処理をステップS25に移行させる。
【0051】
ステップS24では、制御部101は、次の訳語表現(“car”)をオントロジー辞書検索語バッファにセットし、処理をステップS15に戻す。以後、ステップS15〜S24の処理を繰返して、図7のB2 欄の日英訳語(“car”)について、英語オントロジー辞書108を用いて得られる全ての日本語オントロジー情報を得て、出力情報保持部107に記憶させる。
【0052】
次に、制御部101は、ステップS25において、次の日英翻訳結果の意味解釈があるか否かを判定する。この場合には、図7のA2 の欄に車輪を意味する日英翻訳結果が存在するので、処理をステップS26に進める。なお、次の意味解釈が存在しない場合には、処理をステップS27に移行させる。
【0053】
ステップS26では、次の意味解釈を参照して、ステップS14に処理を戻す。以後、ステップS14〜S26の処理を繰返して、「車」についての全ての日英解釈について、英語オントロジー辞書108を用いて得られる全ての日本語オントロジー情報を得て出力情報保持部107に記憶させる。最後に、制御部101は、ステップS27において、出力情報保持部107に記憶されている情報を出力部103を介して出力させる。
【0054】
このように、本実施の形態においては、例えばアプリケーションによって日本語の言語表現を入力すると、英語オントロジー辞書の上位概念・上位語を利用して、日本語オントロジー情報として出力することができる。これにより、例えば、良質な英語のオントロジー辞書が存在する場合には、日本語でこの英語オントロジー辞書を利用することができる。また、日英翻訳、オントロジー辞書検索及び英日翻訳の際の意味解釈及び表現の多様性に基づく分岐毎に、日本語オントロジー情報を得ており、オントロジー検索結果の実効性に優れている。
【0055】
図9は本発明の第2の実施の形態に採用される処理の流れを示すフローチャートである。図9において図8と同一のステップには同一符号を付して説明を省略する。なお、本実施の形態は図1と同様のハードウェア構成によって実現可能である。
【0056】
上記第1の実施の形態においては、日英翻訳、オントロジー辞書検索及び英日翻訳に際して、複数の解釈及び表現に応じた分岐の全てについて、日本語オントロジー情報を得るようになっている。これにより、オントロジー検索結果の実効性を向上させることができる反面、アプリケーションによっては選択肢が多いことによって出力された日本語オントロジー情報を利用しにくいこともある。そこで、本実施の形態においては、日英翻訳結果に複数の意味解釈が存在した場合には、優先順位が1位の意味解釈のみについて以後の処理を行うようにしたものである。
【0057】
本実施の形態は図8のステップS25,S26を省略した点が第1の実施の形態と異なる。即ち、本実施の形態においては、ステップS11〜S24までの処理は第1の実施の形態と同様であるが、ステップS23において、制御部101が次の訳語表現がないものと判定した場合には、処理をステップS27に移行して出力情報保持部107の情報を出力させるようになっている。
【0058】
このように構成された実施の形態においては、日英翻訳の結果、複数の意味解釈が存在した場合においても、制御部101は、優先順位が1位の意味解釈についてのみ、以降の処理を行う。
【0059】
例えば、図7の例では、「車」に対して1番目の意味解釈であるA1 (訳語表現では“vehicle”又は“car”)についてのみの処理を行い、2番目の意味解釈であるA2 (訳語表現では“wheel”)についての処理は行わない。
【0060】
このように本実施の形態においては、第1の実施の形態と同様の効果が得られる。また、日英翻訳結果の優先順位が1番目の意味解釈の単語についてのみ、日本語オントロジー情報を得て、出力部103から出力させることができる。
【0061】
図10は本発明の第3の実施の形態に採用される処理の流れを示すフローチャートである。図10において図8と同一のステップには同一符号を付して説明を省略する。
【0062】
本実施の形態においても、複数の解釈及び表現に応じた分岐の全てについて日本語オントロジー情報を得るのではなく、日英翻訳結果のある意味解釈について複数の訳語表現が存在した場合には、優先順位が1位の訳語表現のみについて以後の処理を行うようにしたものである。
【0063】
本実施の形態は図8のステップS23〜S26を省略した点が第1の実施の形態と異なる。即ち、本実施の形態においては、ステップS11〜S22までの処理は第1の実施の形態と同様であるが、ステップS21において、制御部101が次の意味解釈がないものと判定した場合には、処理をステップS27に移行して出力情報保持部107の情報を出力させるようになっている。
【0064】
このように構成された実施の形態においては、日英翻訳の結果、ある意味解釈に複数の訳語表現が存在した場合においても、制御部101は、優先順位が1位の訳語表現についてのみ、以降の処理を行う。
【0065】
例えば、図7の例では、優先順位が1番目のB1 欄の訳語表現“vehicle”についてのみの処理を行い、2番目の訳語表現であるB2 欄の“car”についての処理は行わない。
【0066】
このように本実施の形態においても、第1の実施の形態と同様の効果が得られる。また、日英翻訳結果の優先順位が1番目の訳語表現の単語についてのみ、日本語オントロジー情報を得て、出力部103から出力させることができる。
【0067】
図11は本発明の第4の実施の形態に採用される処理の流れを示すフローチャートである。図11において図8と同一のステップには同一符号を付して説明を省略する。
【0068】
本実施の形態においても、複数の解釈及び表現に応じた分岐の全てについて日本語オントロジー情報を得るのではなく、英語オントロジー辞書検索の結果、複数の意味解釈(上位概念)が存在した場合には、優先順位が1位の意味解釈のみについて以後の処理を行うようにしたものである。
【0069】
本実施の形態は図8のステップS21〜S26を省略した点が第1の実施の形態と異なる。即ち、本実施の形態においては、ステップS11〜S20までの処理は第1の実施の形態と同様であるが、ステップS19において、制御部101が次のオントロジー表現がないものと判定した場合には、処理をステップS27に移行して出力情報保持部107の情報を出力させるようになっている。
【0070】
このように構成された実施の形態においては、英語オントロジー辞書検索の結果、複数の意味解釈が存在した場合においても、制御部101は、優先順位が1位の意味解釈についてのみ、以降の処理を行う。
【0071】
例えば、図7の例では、優先順位が1番目のC1 欄の意味解釈(上位語が“transportaion”又は“transpot”)についてのみの処理を行い、2番目のC2 欄の意味解釈(上位語が“medium”)についての処理は行わない。
【0072】
このように本実施の形態においても、第1の実施の形態と同様の効果が得られる。また、オントロジー辞書検索の結果、優先順位が1番目の上位概念の単語についてのみ、日本語オントロジー情報を得て、出力部103から出力させることができる。
【0073】
図12は本発明の第5の実施の形態に採用される処理の流れを示すフローチャートである。図12において図8と同一のステップには同一符号を付して説明を省略する。
【0074】
本実施の形態においても、複数の解釈及び表現に応じた分岐の全てについて日本語オントロジー情報を得るのではなく、英語オントロジー辞書検索の結果の意味解釈(上位概念)に複数の英語オントロジー表現(上位語)が存在した場合には、優先順位が1位の上位語のみについて以後の処理を行うようにしたものである。
【0075】
本実施の形態は図8のステップS19〜S26を省略した点が第1の実施の形態と異なる。即ち、本実施の形態においては、ステップS11〜S18までの処理は第1の実施の形態と同様であるが、ステップS18の処理が終了すると、処理をステップS27に移行して出力情報保持部107の情報を出力させるようになっている。
【0076】
このように構成された実施の形態においては、英語オントロジー辞書検索の結果、ある意味解釈に複数の上位語が存在した場合においても、制御部101は、優先順位が1位の上位語についてのみ、以降の処理を行う。即ち、この場合には、日英翻訳の1番目の意味解釈、1番目の訳語表現、英語オントロジー辞書検索の1番目の上位概念及び1番目の上位語についての日本語オントロジー情報が出力される。
【0077】
例えば、図7の例では、優先順位が1番目のD1 欄の上位語“transportaion”についてのみの処理を行い、2番目のD2 欄の上位語“transpot”についての処理は行わない。従って、日本語オントロジー情報としては、「輸送」及び「輸送機関」のみが得られる。
【0078】
このように本実施の形態においても、第1の実施の形態と同様の効果が得られる。また、オントロジー辞書検索の結果、優先順位が1番目の上位語の単語についてのみ、日本語オントロジー情報を得て、出力部103から出力させることができる。
【0079】
なお、図7のように全ての分岐についての日本語オントロジー情報を出力情報保持部107に記憶させた場合でも、制御部101が出力部3への出力時に、優先順位が1番目の日本語オントロジー情報のみを出力させるようにしてもよい。
【0080】
また、上記各実施の形態においては、全ての分岐について処理を行うか又は各優先順位が1番目ものについてのみ処理を行う例について説明したが、出力情報保持部107に保持されている情報を、日英翻訳の段階、オントロジー情報の検索の段階及び英日翻訳の各段階で随時出力することにより、ユーザ又は所定のアプリケーションによって、以後の処理を行う意味解釈(上位概念)又は訳語表現(上位語)を選択するようにしてもよい。
【0081】
図13は本発明の第6の実施の形態に採用される処理を説明するための説明図である。本実施の形態は図1と同様のハードウェア構成によって実現可能である。
【0082】
上記各実施の形態における日英翻訳機能部104は、解釈及び表現の多様性に応じた複数の解釈及び訳語を出力した。しかし、入力部102に入力される情報によっては、解釈が一義的に決定されることもある。本実施の形態はこの場合に対応させたものであり、日英翻訳機能部104の翻訳機能に、多義解消の知識を導入した点が上記各実施の形態と異なる。
【0083】
即ち、本実施の形態における日英翻訳機能部は、図13に示すように、日本語表現と文脈情報とが与えられる。日英翻訳機能部は、日本語表現と文脈情報とを用いて、日本語表現を英語表現に翻訳する場合に、優先順位が1位の語義の英語表現を選択的に出力する。
【0084】
例えば「車」という単語についてのオントロジー情報を取得したい場合には、「車に乗る」という表現と、対象単語がこの表現中の「車」という単語であるという情報とを制御部101が受け取る。日英翻訳機能部では、多義解消の知識を用いて「車に乗る」という文を翻訳し、結果として「車」に対して、図5の日英解釈のA1の欄に記述した解釈のみを得る。
【0085】
制御部101は、この唯一得られた意味解釈のみに対して、以降の処理を行うことが可能となる。なお、文脈情報としては、文章表現以外に分野情報でも可能である。
【0086】
なお、翻訳機能部のこのような翻訳における多義解消については、公知の種々のシステムを採用することが可能である。
【0087】
このように本実施の形態においては、文脈情報を利用した日英翻訳を導入しているので、得られた日本語オントロジー情報の実効性が向上する。
【0088】
図14は本発明の第7の実施の形態に採用される処理を説明するための説明図である。本実施の形態は図1と同様のハードウェア構成によって実現可能である。
【0089】
上記各実施の形態におけるオントロジー辞書検索機能部105は、解釈及び表現の多様性に応じた複数の意味解釈(上位概念)及び訳語表現(上位語)を出力した。しかし、日英翻訳結果の品詞によっては、検索された複数の英語オントロジー情報の1つを選択することができることもある。本実施の形態はこの場合に対応させたものであり、オントロジー辞書検索機能部105の検索結果に対して、品詞解釈の知識を導入した点が上記各実施の形態と異なる。
【0090】
即ち、本実施の形態においては、図14に示すように、品詞の情報を含む英語表現が与えられる。オントロジー辞書検索機能部105は、英語表現を用いて英語オントロジー辞書を検索する。制御部101は、英語オントロジー辞書に対する複数の検索結果に対して、英語表現の品詞を考慮した検索結果を優先順位の第1位とする。
【0091】
例えば、入力部102を介して「愛」という日本語を入力した場合に、日英翻訳機能部104の訳語として“love”という表現が得られたものとする。この場合には、“love”の品詞は名詞である。この“love”についてのオントロジー辞書検索機能部105の検索結果が、“love”を名詞と解釈した場合と“love”を動詞と解釈した場合とで異なるものとする。
【0092】
この場合には、制御部101は、オントロジー辞書検索処理以前の段階の品詞情報を参照して、“love”を名詞と解釈した場合のオントロジー情報を優先する。これにより、より確からしい日本語オントロジー情報を得ることができる。
【0093】
このように本実施の形態においては、品詞情報を利用してオントロジー辞書検索結果に優先順位を付しているので、得られた日本語オントロジー情報の実効性が向上する。
【0094】
図15は本発明の第8の実施の形態に採用される処理を説明するための説明図である。本実施の形態は図1と同様のハードウェア構成によって実現可能である。
【0095】
上記各実施の形態における制御部101は、解釈及び表現の多様性に応じた複数の英語オントロジー情報を得ていた。しかし、英語オントロジー辞書の複数の検索結果を総合的に判断することで、入力日本語表現にふさわしいと考えられる英語オントロジー情報を選択することができることもある。本実施の形態はこの場合に対応させたものであり、制御部101が複数の英語オントロジー情報に対する多数決処理を導入した点が上記各実施の形態と異なる。
【0096】
即ち、本実施の形態における日英翻訳機能部104は、図15に示すように、1つの日本語表現に対して複数の訳語を出力する。これらの複数の英語表現w1 ,w2 ,…に対して、オントロジー辞書検索機能部105は、夫々1つ以上の英語オントロジー情報を検索結果として出力する。制御部101は、これらの複数の英語オントロジー情報に対する多数決処理によって、オントロジー情報の優先順位を決する。
【0097】
例えば「教師」という日本語表現が入力された場合に、”teacher”、”instructor”、”master”という3つの訳語が日英翻訳機能部104から出力されたものとする。オントロジー辞書検索機能部105は、各日英訳語について英語オントロジー辞書108を検索する。
【0098】
いま、オントロジー辞書検索機能部105によって検索結果が、“teacher”→“educator”、“instructor”→“educator”、“master”→“artist”、“master”→“authority”であるものとする。この場合には、制御部101は、個々のオントロジー情報を勘案して総合判定する機能を有する。
【0099】
具体的には、例えば得られた複数のオントロジー情報のうち最も多くの訳語表現により支持されているオントロジー情報を選択する機能を有する。この場合には、制御部101は最多である“educator”というオントロジー表現を優先する。こうして、日英翻訳の結果、例えば「教育者」という日本語オントロジー表現が出力される。
【0100】
このように本実施の形態においては、多数決情報を利用してオントロジー辞書検索結果に優先順位を付しているので、得られた日本語オントロジー情報の実効性が向上する。
【0101】
なお、上記各実施の形態は、制御部101、日英翻訳機能部104、オントロジー辞書検索機能部105及び英日翻訳機能部106をコンピュータによって実行可能なプログラムによってソフトウェア処理により実現可能であることは明らかである。この場合には、翻訳機能やオントロジー辞書検索機能等は、特に1つのプログラム内に実装されている必然性はなく、これらの機能を有する個別のプログラムを利用して、各機能を発揮するようなプログラムとして実現することも可能である。
【0102】
また、翻訳機能としては、文書レベル・文レベルでの翻訳機能のほか、単語・熟語レベルでの翻訳機能、いわゆる2カ国語対象辞典を電子化したものでもよい。
【0103】
また、図8の全てのステップを処理した後に出力情報保持部から出力する情報を制御することによって、図9乃至図12に示す第2乃至第5の実施の形態と同様の出力を得ることができることも明らかである。
【0104】
その他、本発明はその趣旨を逸脱しない範囲内で種々の応用が可能である。
【0105】
【発明の効果】
以上説明したように本発明によれば、第1の言語の意味処理に際して、第2の言語で記述されたオントロジー辞書を利用可能とすることにより、自然言語処理システムの性能を向上させることができるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施の形態に係る他言語オントロジー辞書利用装置を示すブロック図。
【図2】図1中の出力情報保持部107に保持される情報を説明するための説明図。
【図3】第1の実施の形態における処理の流れの概要を示すフローチャート。
【図4】出力情報保持部107に記憶されている日本語表現を示す説明図。
【図5】出力情報保持部107に記憶されている日英翻訳結果を示す説明図。
【図6】出力情報保持部107に記憶されている英語オントロジー辞書108の検索結果を示す説明図。
【図7】出力情報保持部107に記憶されている日英翻訳結果を示す説明図。
【図8】第1の実施の形態の作用を説明するためのフローチャート。
【図9】本発明の第2の実施の形態に採用される処理の流れを示すフローチャート。
【図10】本発明の第3の実施の形態に採用される処理の流れを示すフローチャート。
【図11】本発明の第4の実施の形態に採用される処理の流れを示すフローチャート。
【図12】本発明の第5の実施の形態に採用される処理の流れを示すフローチャート。
【図13】本発明の第6の実施の形態に採用される処理を説明するための説明図。
【図14】本発明の第7の実施の形態に採用される処理を説明するための説明図。
【図15】本発明の第8の実施の形態に採用される処理を説明するための説明図。
【符号の説明】
101…制御部、102…入力部、103…出力部、104…日英翻訳機能部、105…オントロジー辞書検索機能部、106…英日翻訳機能部、107…出力情報保持部、108…英語オントロジー辞書。

Claims (14)

  1. 入力された第1の言語を第2の言語に翻訳する第1の翻訳手段と、
    前記第2の言語で構築されたオントロジー辞書を前記第1の翻訳機能手段の翻訳結果に基づいて検索し、検索結果であるオントロジー情報を取得するオントロジー辞書検索手段と、
    前記第2の言語で記述されている前記検索結果を前記第1の言語に翻訳する第2の翻訳手段とを具備したことを特徴とする他言語オントロジー辞書利用装置。
  2. 前記第1及び第2の翻訳手段並びに前記オントロジー辞書検索手段の処理結果を保持する出力情報保持手段を更に具備したことを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  3. 前記第1の翻訳手段は、第1の言語の単語表現を第2の言語の単語表現に変換する翻訳処理を行い、前記第2の翻訳手段は、第2の言語の単語表現を第1の言語の単語表現に変換する翻訳処理を行うことを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  4. 前記第1及び第2の翻訳手段は、解釈及び表現の相違に基づく複数の翻訳結果を得ることを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  5. 前記第1及び第2の翻訳手段は、前記解釈及び表現の相違に基づく複数の翻訳結果に優先順位を付して出力することを特徴とする請求項4に記載の他言語オントロジー辞書利用装置。
  6. 前記オントロジー辞書検索手段は、解釈及び表現の相違に基づく複数の検索結果を得ることを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  7. 前記オントロジー辞書検索手段は、前記解釈及び表現の相違に基づく複数の検索結果に優先順位を付して出力することを特徴とする請求項6に記載の他言語オントロジー辞書利用装置。
  8. 前記優先順位は、前記解釈を上層とし前記表現を下層として階層化されることを特徴とする請求項5又は請求項7のいずれか一方に記載の他言語オントロジー辞書利用装置。
  9. 前記第1及び第2の翻訳手段並びに前記オントロジー辞書検索手段のうちの少なくとも1つは、前記解釈及び表現の相違に基づく複数の翻訳結果又は検索結果のうち優先順位が第1位の解釈の結果のみを出力することを特徴とする請求項5又は請求項7のいずれか一方に記載の他言語オントロジー辞書利用装置。
  10. 前記第1及び第2の翻訳手段並びに前記オントロジー辞書検索手段のうちの少なくとも1つは、前記解釈及び表現の相違に基づく複数の翻訳結果又は検索結果のうち優先順位が第1位の表現の結果のみを出力することを特徴とする請求項5又は請求項7のいずれか一方に記載の他言語オントロジー辞書利用装置。
  11. 前記第1の翻訳手段は、前記第1の言語の言語表現とその文脈情報とを用いて、前記第1の言語の言語表現の意味解釈を決定して、前記第2の言語の1つの言語表現に翻訳することを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  12. 前記第1及び第2の翻訳手段並びに前記オントロジー辞書検索手段のうちの少なくとも1つは、入力された言語表現の品詞と同一品詞の翻訳結果又は検索結果を出力することを特徴とする請求項1に記載の他言語オントロジー辞書利用装置。
  13. 第1の翻訳機能部、オントロジー辞書検索機能部及び第2の翻訳機能部を具備するコンピュータに第2の言語で構築されたオントロジー辞書を利用させるための他言語オントロジー辞書利用方法であって、
    前記第1の翻訳機能部が、入力された第1の言語を第2の言語に翻訳する第1の翻訳ステップと、
    前記オントロジー辞書検索機能部が、前記第2の言語で構築されたオントロジー辞書を前記第1の翻訳ステップの翻訳結果に基づいて検索し、検索結果であるオントロジー情報を取得するオントロジー辞書検索ステップと、
    前記第2の翻訳機能部が、前記第2の言語で記述されている前記検索結果を前記第1の言語に翻訳する第2の翻訳ステップと、
    を具備したことを特徴とする他言語オントロジー辞書利用方法。
  14. 第1の翻訳機能部、オントロジー辞書検索機能部及び第2の翻訳機能部を具備するコンピュータに、
    前記第1の翻訳機能部によって、入力された第1の言語を第2の言語に翻訳する第1の翻訳処理ステップと、
    前記オントロジー辞書検索機能部によって、前記第2の言語で構築されたオントロジー辞書を前記第1の翻訳処理ステップの翻訳結果に基づいて検索し、検索結果であるオントロジー情報を取得するオントロジー辞書検索処理ステップと、
    前記第2の翻訳機能部によって、前記第2の言語で記述されている前記検索結果を前記第1の言語に翻訳する第2の翻訳処理ステップとを実行させるための他言語オントロジー辞書利用プログラム。
JP2001401617A 2001-12-28 2001-12-28 他言語オントロジー辞書利用装置及び方法並びにプログラム Expired - Fee Related JP3768157B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001401617A JP3768157B2 (ja) 2001-12-28 2001-12-28 他言語オントロジー辞書利用装置及び方法並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001401617A JP3768157B2 (ja) 2001-12-28 2001-12-28 他言語オントロジー辞書利用装置及び方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2003196276A JP2003196276A (ja) 2003-07-11
JP3768157B2 true JP3768157B2 (ja) 2006-04-19

Family

ID=27605464

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001401617A Expired - Fee Related JP3768157B2 (ja) 2001-12-28 2001-12-28 他言語オントロジー辞書利用装置及び方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP3768157B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106663143B (zh) * 2014-07-18 2019-12-17 康维达无线有限责任公司 M2m本体管理和语义互操作性
US9678946B2 (en) * 2014-11-10 2017-06-13 Oracle International Corporation Automatic generation of N-grams and concept relations from linguistic input data

Also Published As

Publication number Publication date
JP2003196276A (ja) 2003-07-11

Similar Documents

Publication Publication Date Title
AU2004200638B2 (en) Methods and systems for language translation
KR101130444B1 (ko) 기계번역기법을 이용한 유사문장 식별 시스템
Fitria Translation techniques found in English to Indonesian abstract translation of Journal Edunomika 2018
KR20040025642A (ko) 확인 문장을 검색하기 위한 방법 및 시스템
KR20080084803A (ko) 교차-언어 지식 검색을 위한 시스템 및 방법
JP2008287406A (ja) 情報処理装置および情報処理方法、プログラム、並びに、記録媒体
Boguslavsky et al. Creating a Universal Networking Language module within an advanced NLP system
Bond et al. Combining linguistic resources to create a machine-tractable Japanese-Malay dictionary
JP2008026971A (ja) 機械翻訳システム及びプログラム
Revanth et al. Nl2sql: Natural language to sql query translator
JP3768157B2 (ja) 他言語オントロジー辞書利用装置及び方法並びにプログラム
Yeshambel et al. Evaluation of corpora, resources and tools for Amharic information retrieval
Sankaravelayuthan et al. English to tamil machine translation system using parallel corpus
Tarish et al. Text correction algorithms for correct grammar and lex-ical errors in the English language
Hanane et al. A model of a generic Arabic language interface for multimodel database
WO1999052041A1 (fr) Procede de traduction de langage a gabarit holographique et d'ouverture presentant une fonction d'interaction homme-machine et systeme de marquage holographique
Nowakowski et al. A proposal for a unified corpus of the Ainu language
Zhebel et al. Approaches to Cross-Language Retrieval of Similar Legal Documents Based on Machine Learning
Lachichi et al. An Arabic WordNet enrichment approach using machine translation and external linguistic resources
Haddouti Survey: Multilingual text retrieval and access
Varanovich et al. Creation of a legal domain corpus for the Belarusian module in NooJ: Texts, Dictionaries, Grammars
JPH0561902A (ja) 機械翻訳システム
Mezghanni et al. Information retrieval from unstructured Arabic legal data
Maisto LG-Starship: A Framework for Text Analysis
Joshi et al. Code Mixed Information Retrieval for Gujarati Script News Articles

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051025

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060131

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees