JP4047885B2 - 機械翻訳装置、機械翻訳方法および機械翻訳プログラム - Google Patents

機械翻訳装置、機械翻訳方法および機械翻訳プログラム Download PDF

Info

Publication number
JP4047885B2
JP4047885B2 JP2005313227A JP2005313227A JP4047885B2 JP 4047885 B2 JP4047885 B2 JP 4047885B2 JP 2005313227 A JP2005313227 A JP 2005313227A JP 2005313227 A JP2005313227 A JP 2005313227A JP 4047885 B2 JP4047885 B2 JP 4047885B2
Authority
JP
Japan
Prior art keywords
semantic class
direct expression
word
information
machine translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005313227A
Other languages
English (en)
Other versions
JP2007122383A (ja
Inventor
和広 木村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2005313227A priority Critical patent/JP4047885B2/ja
Priority to US11/446,961 priority patent/US8060359B2/en
Priority to CNA2006101429645A priority patent/CN1955953A/zh
Publication of JP2007122383A publication Critical patent/JP2007122383A/ja
Application granted granted Critical
Publication of JP4047885B2 publication Critical patent/JP4047885B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Description

この発明は、単語間の意味関係に基づき最適な訳し分けを行う機械翻訳装置、機械翻訳方法および機械翻訳プログラムに関するものである。
従来、機械翻訳の適用領域は文型が限定された技術文書等に限られていたが、近年の機械翻訳技術の進展により、Web文書等の幅広い分野の文書を扱えるようになった。また、機械翻訳技術と音声認識技術との融合により、人間の発話を実世界・実時間で翻訳する音声翻訳装置(通訳装置)の実用化が期待される状況になっている。
ところが、音声翻訳は話し言葉を扱う性格上、言葉の省略や助詞等の脱落、句や文の倒置、言い直し、不要語句の挿入など、書き言葉にはあまり現れなかった言語現象に対応する必要があり、実用化において克服すべき課題も多い。
このような課題の一つとして、話し言葉では直示表現(deixis)が多用されるという課題が存在する。直示表現とは、“this”、“that”などの指示詞や“I”、“you”などの代名詞によって直接発話の現場に存在する事物を指し示す表現である。直示表現が用いられた場合、その指示対象を同定せずに翻訳を行うと、適切な訳し分けが行えず、翻訳文の質が低下する。
例えば、直示表現“this”を含む”Can I take this?”という英語を日本語に翻訳する場合、指示対象を同定せずに翻訳すると、日本語で“これを取ってもいいですか?”と訳される。しかし、より正確に翻訳するには“take”の直接目的語である“this”の表すものを特定する必要がある。例えば、“this”がタクシーを表すことが特定できれば、“このタクシーに乗ってもいいですか?”と訳し、“this”が風呂を表すことが特定できれば、“お風呂に入ってもいいですか?”と訳すことができる。
このように、直示表現の指示対象を同定することにより、より適切な訳語に訳し分けることが可能となり、翻訳文の質を向上させることができる。従来、先行する発話を参照して直示表現の指示対象を推定する方法などが提案されていたが、実用に耐えうる推定の精度を得ることができなかった。
また、特許文献1では、PDA(Personal Digital Assistance)等へ音声によりコマンドを入力すると同時に、マウスやペンを画面上で操作して音声に含まれる直示表現の指示対象を指定することにより、直示表現を含む入力音声の言語解釈を適切に行う技術が提案されている。この技術によれば、先行する発話が存在しない場合でも直示表現の指示対象を同定することが可能となる。
米国特許第6868383号明細書
しかしながら、特許文献1の技術では、指示対象がPDA上の画面という仮想空間に存在していることが前提とされているため、音声翻訳装置のようにさまざまな環境で使用され、指示対象が実世界上のあらゆる事物に対し想定されうる状況では、適用範囲が極めて限定されるという問題があった。
本発明は、上記に鑑みてなされたものであって、さまざまな状況で入力された直示表現を含む原言語文に対する翻訳の精度を向上させることができる機械翻訳装置、機械翻訳方法および機械翻訳プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明は、指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段と、原言語文を受付ける受付手段と、前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける対応づけ手段と、前記直示表現に対して前記対応づけ手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、を備えたことを特徴とする。
また、本発明は、上記装置を実行することができる機械翻訳方法および機械翻訳プログラムである。
本発明によれば、利用者が指し示した対象に埋め込まれた情報を検出し、入力された音声に含まれる直示表現の指示対象として同定することができる。このため、指示対象が事前に登録されたものに限られることなく、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことができるという効果を奏する。
以下に添付図面を参照して、この発明にかかる機械翻訳装置、機械翻訳方法および機械翻訳プログラムの最良な実施の形態を詳細に説明する。
(第1の実施の形態)
第1の実施の形態にかかる機械翻訳装置は、利用者が発話すると同時に指し示した対象の情報を検出し、発話に含まれる直示表現の指示対象として同定して翻訳を行うものである。
図1は、第1の実施の形態にかかる機械翻訳装置100の構成を示すブロック図である。同図に示すように、機械翻訳装置100は、指示対象検出部111と、直示表現パターン記憶部121と、意味クラス情報記憶部122と、意味クラス階層記憶部123と、翻訳規則記憶部124と、入力受付部101と、単語分割部102と、直示表現検出部103と、指示対象同定部104と、意味クラス決定部105と、翻訳部106と、出力制御部107とを備えている。
指示対象検出部111は、対象物に埋め込まれた非接触ICタグ(RFID(Radio Frequency Identification)タグ)から当該対象物の情報を読み取るものであり、例えば、RFIDリーダーなどにより構成する。RFIDタグは、商品等の対象物に予め配置されており、当該対象物の固有情報を保持している。指示対象検出部111は、例えば、指示棒のような棒状の形態の先端に備えられ、利用者が当該指示棒で指し示した位置の近傍に存在するRFIDタグを認識し、RFIDタグに記憶された対象物の固有情報を読み取る。
なお、固有情報には対象物を一意に識別するための情報が含まれる。また、固有情報内に、対象物の意味クラス自体を格納するように構成してもよい。この場合、固有情報から直接意味クラスを取得できるため、後述する意味クラス情報記憶部122は不要となる。
指示対象検出部111はRFIDタグから情報を読み取るものに限られず、利用者が指し示した対象の固有情報を検出するものであればあらゆる方法を適用することができる。例えば、対象物に付された2次元バーコードなどのバーコードから固有情報を読み取るように構成してもよい。
また、CCD(Charge Coupled Devices)カメラにより近傍の画像を取得し、画像認識技術によって、撮影した対象物を特定するように構成してもよい。また、GPS(Global Positioning System)受信機能により自装置が存在する位置を認識し、ネットワーク上に存在するサービスに問い合わせて現在地の位置情報(店舗情報等)を獲得し、対象物の情報として検出するように構成してもよい。さらに、指示対象検出部111は、上記方法を組み合わせて指示対象からの情報を取得するように構成してもよい。
直示表現パターン記憶部121は、対象を直接指示する表現である直示表現のパターンを記憶するものであり、直示表現検出部103が入力された原言語文中から直示表現を検出するときに参照される。
図2は、直示表現パターン記憶部121に格納される直示表現のデータ構造の一例を示す説明図である。同図に示すように、直示表現パターン記憶部121は、正規表現を用いて直示表現を示すパターンを格納している。
直示表現のパターンは、“単語1/品詞1”または“単語1/品詞1 単語2/品詞2”のようなパターンで表される。前者は、品詞が“品詞1”である“単語1”が直示表現であることを示すパターンである。後者は、品詞が“品詞1”である“単語1”に続けて、品詞が“品詞2”である“単語2”が存在するとき、当該2つの単語を合わせた単語列が直示表現であることを示すパターンである。
具体的には、同図に示すように、“*/EP3”、“*/ET1 */EN1”のように直示表現のパターンが表わされる。ここで、“EP3”、“ET1”、“EN1”はそれぞれ、指示代名詞、指示限定詞、普通名詞を表す。なお、記号“*”は、任意の情報が該当することを示すものである。
例えば、単語“this”は指示代名詞(“EP3”)であるため、前者のパターンに該当し、当該単語“this”は直示表現として検出される。また、単語列“that hat”は、指示限定詞(“that”)に普通名詞(“hat”)が結合した単語列であるため、後者のパターンに該当し、直示表現として検出することができる。
なお、直示表現のパターンは上記例に限られるものではなく、一般的に直示表現であると認められているあらゆる単語または単語列のパターンを格納することができる。
意味クラス情報記憶部122は、対象物の固有情報と、対象物の意味属性を表す意味クラスとを対応づけた意味クラス情報を記憶するものであり、意味クラス決定部105が対象物の意味クラスを決定する際に参照される。
図3は、意味クラス情報記憶部122に格納される意味クラス情報のデータ構造の一例を示す説明図である。同図に示すように、意味クラス情報記憶部122は、対象物の固有情報と、対象物の意味クラスとを対応づけて格納している。
同図では、対象物の商品の種別を示す文字情報と、対象物を一意に識別する情報(数値)とを記号“#”で区切った形式の固有情報の例が示されている。固有情報の形式はこれに限られるものではなく、少なくとも対象物を一意に識別することができる情報を含んでいればどのような形式でもよい。
意味クラス階層記憶部123は、複数の意味クラス間の階層関係を記憶するものであり、意味クラス決定部105が対象物の意味クラスと、直示表現に含まれる単語の意味クラスとの整合性を確認する際に参照される。
図4は、意味クラス階層記憶部123に格納される意味クラス間の階層関係のデータ構造の一例を示す説明図である。同図では、楕円で示されたノードの内部に記載された文言が意味クラスを表している。また、矢印はその始点に位置する意味クラスが、矢印の終点に位置する意味クラスの上位概念であることを示している。また、記号“・・・”は省略された部分を表している。
例えば同図では、意味クラス“c#dress"や、意味クラス“c#kimono"は、意味クラス“c#clothes”の下位概念であるという階層関係が記述されている。
翻訳規則記憶部124は、原言語による単語に対して、その単語の意味クラスまたはその単語が目的語とする単語の意味クラスに応じて、訳語をどのように決定するかを判断するための翻訳規則を記憶するものである。このように、翻訳規則記憶部124は、翻訳部106が、対象物の意味クラスに応じた適切な訳語を決定するために参照される。
なお、直示表現パターン記憶部121、意味クラス情報記憶部122、意味クラス階層記憶部123、および翻訳規則記憶部124は、HDD(Hard Disk Drive)、光ディスク、メモリカードなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
図5は、翻訳規則記憶部124に格納される翻訳規則のデータ構造の一例を示す説明図である。同図に示すように、翻訳規則記憶部124は、翻訳方向と、条件部と、アクション部とを対応づけた翻訳規則を格納している。
条件部は、翻訳部106が依存構造解析した結果に含まれる部分構造と照合するパターンを指定する。アクション部は、条件部に指定されたパターンと一致する部分構造に対して適用する動作を指定する。条件部、アクション部の詳細については、後述する翻訳部106の機能と合わせて説明する。
入力受付部101は、利用者が入力した音声による原言語文を受付けるものである。本実施の形態では、利用者は音声により原言語文を入力する。このため、入力受付部101は、入力された音声を音声認識し、その結果である原言語文の入力を受付ける。音声認識処理では、LPC分析、隠れマルコフモデル(HMM:Hidden Markov Model)、ダイナミックプログラミング、ニューラルネットワーク、Nグラム言語モデルなどを用いた、一般的に利用されているあらゆる音声認識方法を適用することができる。
なお、入力受付部101は、手書き文字認識、キー入力などにより入力された原言語文を受付けるように構成してもよい。
単語分割部102は、入力受付部101が受付けた原言語文を形態素解析し、単語列に分割するものである。形態素解析処理では、日本語に対しては、連接行列と文節数最小法を用いた形態素解析、英語に対しては、確率モデルとダイナミックプログラミング、A*アルゴリズムを用いた形態素解析を適用するなど、一般的に用いられているあらゆる方法を適用することができる。また、形態素情報、意味情報などを格納した辞書(図示せず)が、HDD、光ディスク、メモリカードなどの一般的に利用されている記憶媒体に格納され、形態素解析処理で参照される。
形態素解析の結果、分割した各単語と、各単語の品詞とが対応づけて出力される。例えば、原言語文“May I try this on?”が入力された場合、形態素解析結果として、“May/EAV I/EP1 try/EVE this/EP3 on/ED3”が出力される。ここで、EAV、EP1、EVE、EP3、ED3はそれぞれ助動詞、人称代名詞、動詞、指示代名詞、副詞小辞を示す。
なお、形態素解析では、数、性、アスペクト、モダリティ、訳語などの品詞以外の情報も同時に得ることができるが、ここでは省略する。
直示表現検出部103は、単語分割部102が入力文を形態素解析して出力した単語列に含まれる各単語を、直示表現パターン記憶部121に記憶されている直示表現のパターンと照合することにより、単語列から直示表現を検出するものである。
指示対象同定部104は、指示対象検出部111が検出した指示対象の情報と、直示表現検出部103が検出した直示表現とを対応づけることにより、入力された原言語文中の直示表現が指し示す対象を同定するものである。
例えば、入力された原言語文に、直示表現“this”が含まれていることを直示表現検出部103が検出した場合、指示対象検出部111が検出した指示対象が、直示表現“this”の示す内容であるとして指示対象を特定する。
意味クラス決定部105は、指示対象同定部104により直示表現と対応づけられた指示対象の意味クラスを決定するものである。具体的には、意味クラス決定部105は、指示対象検出部111が検出した指示対象の固有情報を検索キーとして意味クラス情報記憶部122から対応する意味クラスを取得し、取得した意味クラスを指示対象の意味クラスとして決定する。
この際、意味クラス決定部105は、取得した意味クラスを指示対象の意味クラスとして決定する前に、取得した意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする。これにより、指示対象検出部111が誤って指示対象を検出した場合であっても、誤った意味クラスにより誤った訳語を選択することを回避できる。
なお、指示対象検出部111が検出した指示対象の情報内に意味クラス自体が含まれている場合は、指示対象の情報から意味クラスを抽出し、抽出した意味クラスを、指示対象の意味クラスとして決定する。
翻訳部106は、単語分割部102が形態素解析した結果である単語列に対して統語解析および依存構造解析を行い、翻訳の目的言語への構造変換規則や対訳辞書(図示せず)を参照して目的言語による翻訳文を出力するものである。翻訳部106により行われる翻訳処理は、トランスファ方式などの一般的なルールベース翻訳で利用されているあらゆる方法を適用することができる。
図6は、依存構造解析結果のデータ構造の一例を示す説明図である。翻訳部106は、同図に示すような木構造の依存構造解析結果を出力する。同図では、楕円で示されたノードは形態素解析結果の単語を表し、単語間を結ぶ矢印は単語間の関係を表す。
単語には、記号“[”、“]”で囲まれた単語属性が付与される。単語属性は形態素解析処理で得られたものに、依存構造解析の結果が反映されて出力される。単語属性には、“属性名:属性値”の形式で複数の属性を設定することができる。属性としては、例えば、原言語表記(sw)、品詞(cat)、目的言語表記(tw)、モダリティ(mod)、意味クラス(sem)などが与えられる。
目的言語表記(tw)には、翻訳の目的言語による訳語の候補が複数格納される。例えば、同図の上部の英語の単語“try on”に対しては、3つの日本語による訳語の候補が示されている。なお、目的言語表記の左端に記載された候補は、目的語の意味クラスが特定できなかった場合等に選択されるデフォルトの候補を表す。
なお、同図では、直示表現“this”を含む原言語文“May I try this on?”が入力されたときの依存構造解析結果の例が示されている。この場合、同図の“this”のノードに示すように、意味クラス決定部105が決定した意味クラス601が、対応する単語の単語属性に追加される。これにより、原言語文として“May I try shoes on?”が入力されたときと同様の依存構造が得られる。また、“May I”の語順から主動詞“try on”のモダリティ属性(mod)には疑問文属性(+qst)が加えられ、“May”自身のノードは消滅して、“try on”のモダリティ属性の許可属性(+permit)として書き換えられている。
ノードを結ぶ矢印には、単語間の文法的関係を表すラベルが付与される。例えば、動詞-主語の関係(subj)や動詞-目的語の関係(obj)などが与えられる。
翻訳部106は、依存構造解析結果から訳語を生成する際、翻訳規則記憶部124に記憶された翻訳規則を参照し、入力された原言語文中の単語間の文法的関係または意味的関係によって訳語を訳し分ける処理を行う。
具体的には、翻訳部106は、まず、依存構造解析結果に含まれる部分構造と一致するパターンが、翻訳規則記憶部124に記憶された翻訳規則の条件部に存在するか否かを検索する。一致するパターンが条件部に存在する場合、条件部に対応するアクション部を取得し、アクション部に記載された翻訳規則に従い、単語の訳語を決定する。
この際、直示表現である単語の属性に、意味クラス決定部105が決定した意味クラスが付与されているため、翻訳部106は直示表現である単語が当該意味クラスを有する単語であるものとして適切に訳語を選択することができる。
ここで、図5に示した条件部およびアクション部の形式について詳述する。条件部には、例えば、“self[属性名1:属性値1]、obj[属性名2:属性値2]”の形式で部分構造と照合するパターンを記述する。これは、属性名1が属性値1であるノード(self)に対し、属性名2が属性値2であるノードが目的語として対応づけられている部分構造のパターンを示している。
条件部の別の例としては、“self[属性名1:属性値1、属性名2:属性値2]”の形式でパターンを記述することができる。これは、単に、属性名1が属性値1および属性名2が属性値2であるノード(self)が部分構造として存在することを条件とするパターンを示している。
アクション部には、例えば、“set(属性名3、属性値3)”の形式で、部分構造に対して適用する動作を記述する。これは、属性名3に属性値3を設定する動作を示している。
出力制御部107は、翻訳部106が出力した翻訳の目的言語による文である翻訳文を、液晶ディスプレイなどの表示手段や、スピーカなどの音声出力手段に出力する処理を制御するものである。
なお、翻訳文を目的言語による音声で出力する場合は、出力制御部107は、翻訳部106が出力した対訳文を目的言語である英語の合成音声として出力する処理を行う。音声合成処理は、音声素片編集音声合成、フォルマント音声合成などを用いたテキストトゥスピーチシステムなどの一般的に利用されているあらゆる方法を適用することができる。
次に、このように構成された第1の実施の形態にかかる機械翻訳装置100による機械翻訳処理について説明する。図7は、第1の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
まず、入力受付部101が、利用者により入力された入力文を受付ける(ステップS701)。本実施の形態では、利用者は音声により原言語文を入力するため、入力受付部101は、入力された音声を音声認識し、その結果である原言語文の入力を受付ける。
次に、単語分割部102が、入力受付部101により受付けられた入力文を形態素解析し、複数の単語に分割する(ステップS702)。
次に、直示表現検出部103が、分割した複数の単語から、直示表現パターン記憶部121を参照して直示表現である単語または単語列を検出する(ステップS703)。具体的には、直示表現検出部103は、単語列に含まれる単語または連続する複数の単語である単語列と、直示表現パターン記憶部121に記憶されている直示表現のパターンと照合し、一致するものが存在すれば、当該一致した単語または単語列を直示表現として検出する。
ここで、単語列に含まれる連続する複数の単語である単語列とは、“that hat”のように、指示限定詞(“that”)に普通名詞(“hat”)が結合した単語列などを指す。このような場合は、単一の単語ではなく、複数の単語により直示表現が表される場合があるからである。
次に、直示表現検出部103は、直示表現が検出されたか否かを判断する(ステップS704)。検出された場合は(ステップS704:YES)、指示対象同定部104は、指示対象検出部111が検出した指示対象と、直示表現検出部103が検出した直示表現とを対応づけることにより、指示対象を同定する(ステップS705)。
次に、意味クラス決定部105が、意味クラス情報記憶部122から指示対象に対応する意味クラスを取得する(ステップS706)。具体的には、意味クラス決定部105は、指示対象検出部111が検出した指示対象の固有情報を検索キーとして意味クラス情報記憶部122を検索し、当該固有情報に対応する意味クラスを取得する。
例えば、指示対象検出部111が、指示対象の固有情報として“shoes#123456789”を検出した場合、意味クラス決定部105は、図3に示すような意味クラス情報記憶部122から対応する意味クラスとして、“c#shoes”を取得する。取得した意味クラスは、後に翻訳部106が翻訳する際に参照できるように、直示表現である単語と対応づけて保存される。
次に、意味クラス決定部105は、取得した意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする(ステップS707)。
例えば、直示表現“this hat”が検出された場合、形態素解析時に当該直示表現の意味クラスとして、“c#hat”が付与されている。これに対し、指示対象検出部111が誤って近傍に存在するジャケットの固有情報“jacket#234567891”を検出したとすると、図3に示すような意味クラス情報記憶部122から、対応する意味クラスとして“c#clothes”が取得される。
意味クラス決定部105は、意味クラス階層記憶部123を参照し、上記2つの意味クラスが一致するか否か、および、一方が他方の下位概念に相当するか否かを判断する。そして、一致する、または、一方が他方の下位概念に相当する場合は、両者は整合性があると判断する。
例えば、意味クラス階層記憶部123に図4に示すような情報が格納されていたとすると、直示表現の意味クラス“c#hat”と、意味クラス決定部105が取得した意味クラス“c#clothes”とは、上位下位の関係が存在しない。すなわち、いわゆるis_a_kind_of(AKO)の関係が成立しない。このため、意味クラス決定部105は、意味クラス間に整合性がないと判断する。
なお、例えば、直示表現が指示代名詞“this”のみである場合のように、形態素解析で直示表現である単語に意味クラスが付与されないときは、意味クラスの整合性チェック処理(ステップS707、ステップS708)は省略される。
意味クラスの整合性のチェックの後(ステップS707)、意味クラス決定部105は、意味クラスに整合性があるか否かを判断し(ステップS708)、整合性がない場合は(ステップS708:NO)、指示対象検出部111が再度指示対象を検出しなおして処理を繰り返す(ステップS705)。
整合性がある場合は(ステップS708:YES)、翻訳部106が翻訳処理を行う。すなわち、翻訳部106は、まず分割した単語に対し、統語解析および依存構造解析を実行する(ステップS709)。
次に、翻訳部106は、翻訳規則記憶部124の翻訳規則に従い、単語の意味クラスに対応する訳語を選定する(ステップS710)。この際、直示表現の単語に意味クラスが付与されているため、適切な訳語を選択することが可能となる。
例えば、図5に示すような翻訳規則が翻訳規則記憶部124に記憶され、依存構造解析により、図6に示すような依存構造解析結果が得られたとする。この場合、図6の右側の矢印で結ばれる2つのノードを取り出した部分構造が、図5の条件部501のパターンと一致する。このため、図5のアクション部502の規則に従い、“try on”の訳語として日本語503(“履いてみる”)が選択される。
翻訳部106による翻訳処理の後(ステップS710)、出力制御部107が、翻訳部106が出力した翻訳文を、液晶ディスプレイなどの表示部(図示せず)や、スピーカなどの音声出力部(図示せず)に出力する処理を行い(ステップS711)、機械翻訳処理を終了する。
なお、ステップS705からステップS708では、指示対象検出部111が指示対象を1つ検出し、検出した指示対象ごとに意味クラスの整合性をチェックして適切な指示対象を取得するように構成していた。これに対し、指示対象検出部111が同時に複数の指示対象を検出し、検出した複数の指示対象から意味クラスの整合性の条件を満たす指示対象を選択するように構成してもよい。
次に、上述のように構成された機械翻訳装置100による機械翻訳処理の具体例について説明する。図8は、機械翻訳処理で処理される情報の一例を示した説明図である。
図8では、原言語として英語を発話する利用者が、日本の百貨店の靴売り場にて、”May I try this on?”と発話した場面の例を示している。この例では、機械翻訳装置100は、PDAとして実施されており、PDA本体には音声入出力デバイスが内蔵されて、英語音声を認識してこれを翻訳し、翻訳結果を日本語合成音として出力する。また、PDAの入力ペンが指示対象検出部111に相当し、入力ペンにはRFIDリーダーが内蔵されており、読み取ったRFIDタグの情報を本体へ無線送信する機能を有する。一方、靴売り場の各商品には、それぞれ固有の識別情報を記録したRFIDタグが添付されている。
同図に示すように、利用者が原言語文801(“May I try this on?”)を音声により入力し(ステップS701)、同時に入力ペンでRFIDタグが付された商品802を指し示したとする。
この場合、単語分割部102により、形態素解析結果として、単語列“May/EAV I/EP1 try/EVE this/EP3 on/ED3”が出力される(ステップS702)。また、この単語列から、直示表現のパターン“*/EP3”と一致する“this/EP3”が直示表現として検出され(ステップS704:YES)、商品802に付されたRFIDタグから指示対象検出部111が検出した固有情報803(“shoes#123456789”)と対応づけられる(ステップS705)。
意味クラス情報記憶部122に図3に示すような情報が登録されていた場合、固有情報803に対応する意味クラスとして“c#shoes”が取得される(ステップS706)。これにより、“try on”の目的語が意味クラス“c#shoes”を有する単語であるとして翻訳を行うことができる。すなわち、図5に示すような翻訳規則を参照し、“try on”の日本語訳として日本語503(“履いてみる”)を選択することができる(ステップS710)。
このような過程を模式的に示したのが図8の処理過程804である。処理過程804の上部は、指示対象の固有情報“shoes#123456789”から、指示対象が意味クラス“c#shoes”を有する対象物であると判断したことを示している。また、処理過程804の下部は、“try this on”がtry shoes on”を意味することから、日本語訳として日本語805(“を履いてみる”)が選択されたことを示している。
この結果、出力制御部107は、翻訳の目的言語である日本語の音声により、日本語806(“これを履いてみてもよいですか”)を出力する(ステップS711)。
上述の例では直示表現を目的語とする単語を翻訳する場合の例を記載したが、“これが動くと”のように直示表現が主語となる関係(主語-動詞の関係)や、“これの色”のように直示表現が名詞となる関係(名詞-属性の関係)など、直示表現と文法的または意味的に依存関係にある単語を翻訳する場合にも本提案の手法を適用することができる。
また、英日翻訳における動詞の訳し分けを示す例であったが、言語対や品詞はこれに限られるものではなく、他の言語対や他の品詞に対しても適用できる。図9は、日中翻訳、または、名詞を訳し分ける日英翻訳に適用した場合に処理されるデータの一例を示す説明図である。
例えば、日中翻訳では、日本語J901(“これを飲むと元気になるよ”)を直示表現の意味クラスを判別せずに翻訳すると、一般に中国語C902となる。すなわち、日本語の単語J903(“飲む”)の訳語として、標準の訳語である中国語の単語C904が出力される。しかし、この訳語は、指示対象が酒を意味するものであれば適切な訳語であるが、指示対象が薬を意味するものであれば適切な訳語ではない。
本実施の形態の機械翻訳装置100によれば、指示対象の意味クラスが酒(c#liqueur)であるか、薬(c#medicine)であるかを判別することができる。そして、図5に示すような翻訳規則が翻訳規則記憶部124に記憶されていた場合であれば、意味クラスに応じて適切な中国語の訳語を選択することができる。上述の例では、指示対象が薬であれば、日本語の単語J903に対する適切な訳語として、図5の中国語504を選択することができる。
名詞の訳し分けについては、以下のような日英翻訳を例として説明する。日本語では、縁があるか否かによって区別しないため、英語の“hat”および“cap”の両方を意味する単語として日本語J905(“帽子”)が存在する。従って、日本語J905が含まれる日本語の直示表現J906(“その帽子”)を、縁があるか否かによって“the hat"か”the cap"に訳し分けなければならない。
本実施の形態の機械翻訳装置100によれば、指示対象の意味クラスが縁あり帽子(c#hat)であるか、縁なし帽子(c#cap)であるかを判別することができる。そして、図5に示すような翻訳規則が翻訳規則記憶部124に記憶されていた場合であれば、意味クラスに応じて適切な英語の訳語を選択することができる。上述の例では、指示対象が縁あり帽子であれば、日本語の直示表現J906に対する適切な訳語として、図5の英語505(“hat”)を選択することができる。
このように、第1の実施の形態にかかる機械翻訳装置100では、利用者が指し示した対象に埋め込まれた情報を検出し、入力された音声に含まれる直示表現の指示対象として同定することができるため、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことができる。
現在、ユビキタス環境の整備は急ピッチで進んでおり、さまざまな製品等に固有情報が埋め込まれるようになっている。本実施の形態では、このようなユビキタス環境を利用して対象物の固有情報を特定し、入力された発話内の直示表現の指示対象を同定することができる。従って、先行する発話からの指示対象の推定等を行う必要がなく、翻訳品質を高めることができる。
また、開発コストおよび処理コストが高く、精度的にも十分でない照応参照等の文脈処理を回避できるので、低コスト・高品質な機械翻訳装置を実現することができる。さらに、指示対象を誤って同定する可能性が低いため、誤った翻訳規則の適用により誤訳が生じる可能性を低減することができる。この結果、幅広い使用環境で適切な訳し分けを実現する機械翻訳装置を提供することが可能になる。
(第2の実施の形態)
第2の実施の形態にかかる機械翻訳装置は、検出した指示対象の意味クラスを、ネットワークに接続された外部のサーバ装置から取得し、翻訳の際に利用するものである。
図10は、第2の実施の形態にかかる機械翻訳装置1000の構成を示すブロック図である。同図に示すように、機械翻訳装置1000は、指示対象検出部111と、通信部1012と、直示表現パターン記憶部121と、意味クラス階層記憶部123と、翻訳規則記憶部124と、入力受付部101と、単語分割部102と、直示表現検出部103と、指示対象同定部104と、意味クラス決定部1005と、翻訳部106と、出力制御部107とを備えている。
第2の実施の形態では、通信部1012を追加したこと、意味クラス情報記憶部122を削除したこと、および、意味クラス決定部1005の機能が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる機械翻訳装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
通信部1012は、インターネット等のネットワークを介して意味クラス管理サーバ1050と情報の送受信を行うものである。なお、ネットワークはインターネットに限られるものではなく、一般的に利用されているあらゆるネットワーク形態により構成することができる。
意味クラス管理サーバ1050は、第1の実施の形態における図3で示したような意味クラス情報を管理し、受信した対象物の固有情報に対応する意味クラスを取得し、要求元に返信する機能を有するものである。例えば、SOAP(Simple Object Access Protocol)等のプロトコールにより実現されたWebサービスとしてこのような機能を実現することができる。
このように、本実施の形態では、指示対象検出部111が検出した指示対象の意味クラスを取得する際に、外部システムで管理された意味クラスの情報を参照することができるため、自装置内に意味クラスを保存する必要がなくなるという利点がある。特に、ユビキタス環境では膨大な数の製品等の情報を管理する必要が生じるため、情報管理コストの削減の効果が大きい。
なお、翻訳時に毎回、意味クラス管理サーバ1050に意味クラスの問い合わせを行うのではなく、定期的に一括して意味クラス情報を意味クラス管理サーバ1050から読込み、読込んだ情報を参照して意味クラスを決定するように構成してもよい。これにより、通常の音声対話翻訳で使用する際の情報の送受信にかかる処理負荷を軽減することができる。
意味クラス決定部1005は、指示対象検出部111が検出した指示対象の固有情報を、通信部1012を介して意味クラス管理サーバ1050に送信し、送信した固有情報に対して意味クラス管理サーバ1050が返信した意味クラスを、通信部1012を介して取得し、取得した意味クラスを指示対象の意味クラスとして決定するものである。
なお、一括して意味クラス情報を意味クラス管理サーバ1050から読込む構成の場合は、第1の実施の形態と同様に意味クラス情報記憶部122を備え、意味クラス決定部1005は意味クラス情報記憶部122を参照することにより意味クラスを決定する。
次に、このように構成された第2の実施の形態にかかる機械翻訳装置1000による機械翻訳処理について説明する。図11は、第2の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
ステップS1101からステップS1105までの、入力受付処理、単語分割処理、直示表現検出処理、指示対象同定処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS701からステップS705までと同様の処理なので、その説明を省略する。
ステップS1105で指示対象同定部104が指示対象を同定した後、意味クラス決定部1005は、通信部1012を介して指示対象に対応する意味クラスを意味クラス管理サーバ1050から取得する(ステップS1106)。具体的には、指示対象検出部111が検出した指示対象の固有情報を意味クラス管理サーバ1050に送信し、返信された意味クラスを取得する。
ステップS1107からステップS1111までの意味クラスの整合性チェック処理、翻訳処理、出力処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS707からステップS711までと同様の処理なので、その説明を省略する。
このように、第2の実施の形態にかかる機械翻訳装置では、検出した指示対象の意味クラスを、ネットワークに接続された外部のサーバ装置から取得し、翻訳の際に利用することができる。このため、自装置内の記憶容量が制限される携帯型の機械翻訳装置であっても適切に意味クラスを取得し、高精度に翻訳を行うことができる。また、サーバ装置で情報を一元管理できるため、機械翻訳装置での更新が不要となり、常に最新の情報を利用することが可能となる。
(第3の実施の形態)
第3の実施の形態にかかる機械翻訳装置は、検出した指示対象までの距離が、入力音声に含まれる直示表現が表す距離の範囲内に含まれるか否かを判断し、含まれる場合に直示表現の指示対象として同定するものである。
図12は、第3の実施の形態にかかる機械翻訳装置1200の構成を示すブロック図である。同図に示すように、機械翻訳装置1200は、指示対象検出部1211と、直示表現パターン記憶部121と、意味クラス階層記憶部123と、翻訳規則記憶部124と、距離属性記憶部1225と、入力受付部101と、単語分割部102と、直示表現検出部103と、指示対象同定部1204と、意味クラス決定部1205と、翻訳部106と、出力制御部107とを備えている。
第3の実施の形態では、距離属性記憶部1225を追加したこと、意味クラス情報記憶部122を削除したこと、指示対象検出部1211の機能、指示対象同定部1204の機能および意味クラス決定部1205の機能が第1の実施の形態と異なっている。その他の構成および機能は、第1の実施の形態にかかる機械翻訳装置100の構成を表すブロック図である図1と同様であるので、同一符号を付し、ここでの説明は省略する。
距離属性記憶部1225は、直示表現が表す対象までの距離の範囲の情報を含む距離属性を記憶するものであり、HDD、光ディスク、メモリカードなどの一般的に利用されているあらゆる記憶媒体により構成することができる。
一般に、直示表現となる指示詞は、近称、中称、遠称などと呼ばれる距離の属性を有している。近称とは、発話者のすぐ近くに存在する対象物を指し示すものをいい、日本語の“これ”や英語の”this"などが該当する。また、遠称とは、発話者からやや離れた位置に存在する対象物を指し示すものをいい、日本語の“あれ”や英語の“that”などが該当する。中称とは、近称と遠称の中間程度の距離に存在するものをいい、日本語の“それ”などが該当する。
本実施の形態では、このような距離の属性を距離属性記憶部1225に記憶し、指示対象を同定する際に参照して、検出した指示対象までの実際の距離が、直示表現が示す距離の範囲に含まれる場合に、正しい指示対象が検出できたものとして処理を行う。
図13は、距離属性記憶部1225に記憶された距離属性のデータ構造の一例を示す説明図である。同図に示すように、距離属性記憶部1225は、直示表現と、当該直示表現が示す距離属性とを対応づけて格納している。距離属性としては、例えば、同図に示すように直示表現が表す距離の範囲を数値により指定する。
同図に示す例では、日本語および英語の直示表現だけを示したが、日本語以外のあらゆる言語の直示表現の距離属性を格納するように構成してもよい。また、複数の直示表現で距離の範囲が重なるような値を設定してもよい。
指示対象検出部1211は、撮像部1211aと、画像認識部1211bとを備えている。撮像部1211aは、CCDカメラなどの撮像装置であり、利用者は撮像部1211aにより対象物を含む画像を撮像することができる。なお、本実施の形態では、画像情報を参照して自装置から対象物までの距離を検出するため、撮像部1211aは2台のカメラでステレオ視により対象物を撮像する。
画像認識部1211bは、画像認識技術によって、撮像部1211aが撮像した対象物を特定するものである。ここで用いる画像認識技術は、パターン認識を利用した画像からの物体認識などの従来から用いられているあらゆる方法を適用することができる。
画像認識部1211bは、画像認識処理によって対象物の種別を判別することができるため、その時点で対象物に意味クラスを付与することができる。従って、本実施の形態では、第1の実施の形態のように、意味クラス情報記憶部122を参照して指示対象の意味クラスを取得する必要がない。
また、画像認識部1211bは、2台のカメラで撮像された画像情報を基に、従来から用いられているステレオ画像処理技術により、対象物までの距離を検出する。これにより、対象物までの距離と、直示表現が表す距離の範囲との整合性の確認を行うことが可能となる。
なお、撮像部1211aを1台のカメラで構成し、ミリ波レーダー、レーザレーダーなどの別途設けられた距離計測装置により対象物までの距離を検出するように構成してもよい。
指示対象同定部1204は、画像認識部1211bが認識した指示対象の情報と、直示表現検出部103が検出した直示表現とを対応づけることにより、入力された原言語文中の直示表現が指し示す対象を同定するものである。
この際、指示対象同定部1204は、距離属性記憶部1225を参照し、直示表現検出部103が検出した直示表現が表す距離の範囲に、画像認識部1211bが認識した対象物までの距離が含まれるか否かを判定し、含まれる場合にのみ、直示表現に認識した対象物を対応づける。直示表現が表す距離の範囲に、対象物までの距離が含まれない場合は、画像認識部1211bが再度認識処理を行い、距離の範囲に含まれるまで処理を繰り返す。
意味クラス決定部1205は、画像認識部1211bが認識した対象物の意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする。これにより、画像認識部1211bが指示対象を誤検出した場合であっても、誤った意味クラスにより誤った訳語を選択することを回避できる。
次に、このように構成された第3の実施の形態にかかる機械翻訳装置1200による機械翻訳処理について説明する。図14は、第3の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
ステップS1401からステップS1404までの、入力受付処理、単語分割処理、直示表現検出処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS701からステップS704までと同様の処理なので、その説明を省略する。
ステップS1404で直示表現が検出された場合(ステップS1404:YES)、画像認識部1211bが、撮像部1211aにより撮像された画像から指示対象を認識する(ステップS1405)。同時に、指示対象の意味クラスが付与され、指示対象までの距離が検出される。
次に、指示対象同定部1204が、画像認識部1211bが認識した指示対象と、直示表現検出部103が検出した直示表現とを対応づけることにより、指示対象を同定する(ステップS1406)。
次に、指示対象同定部1204が、画像認識部1211bが検出した指示対象までの距離が、直示表現の距離属性の示す範囲に含まれるか否かを判断する(ステップS1407)。例えば、直示表現が“this”であり、画像認識部1211bにより対象物までの距離が3mであると認識された場合、図13に示すような距離属性が定義されていたとすると、“this”が示す範囲1mに、認識した距離3mが含まれないと判断される。
指示対象までの距離が直示表現の距離属性の示す範囲に含まれないと判断した場合は(ステップS1407:NO)、画像認識部1211bが再度指示対象の認識処理を行い、処理を繰り返す(ステップS1405)。
指示対象までの距離が直示表現の距離属性の示す範囲に含まれると判断した場合は(ステップS1407:YES)、意味クラス決定部1205が、画像認識部1211bが認識した指示対象の意味クラスを取得する(ステップS1408)。
ステップS1409からステップS1413までの、意味クラス決定処理、翻訳処理、出力処理は、第1の実施の形態にかかる機械翻訳装置100におけるステップS707からステップS711までと同様の処理なので、その説明を省略する。
このように、第3の実施の形態にかかる機械翻訳装置では、検出した指示対象までの距離が、入力音声に含まれる直示表現が表す距離の範囲内に含まれるか否かを判断し、含まれる場合にのみ直示表現の指示対象として同定することができる。このため、指示対象を誤検出した場合であっても誤って翻訳する可能性を低減することができる。
(第4の実施の形態)
第4の実施の形態にかかる機械翻訳装置は、GPS機能により指示対象が存在する地点の位置情報を取得し、取得した位置情報を指示対象の固有情報として取得するものである。
図15は、第4の実施の形態にかかる機械翻訳装置1500の構成を示すブロック図である。同図に示すように、機械翻訳装置1500は、指示対象検出部1511と、通信部1512と、直示表現パターン記憶部121と、意味クラス階層記憶部123と、翻訳規則記憶部124と、入力受付部101と、単語分割部102と、直示表現検出部103と、意味クラス決定部1505と、翻訳部106と、出力制御部107とを備えている。
第4の実施の形態では、指示対象検出部1511、通信部1512および意味クラス決定部1505の機能が第2の実施の形態と異なっている。また、指示対象同定部104を削除したことが、第2の実施の形態と異なっている。その他の構成および機能は、第2の実施の形態にかかる機械翻訳装置1000の構成を表すブロック図である図10と同様であるので、同一符号を付し、ここでの説明は省略する。
指示対象検出部1511は、GPS受信機能により自装置が存在する位置を認識する位置情報受信部1511aを備えている。自装置が存在する位置の情報には、自装置の緯度および経度の情報を含む。
通信部1512は、インターネット等のネットワークを介して位置情報管理サーバ1560との間で情報の送受信を行うものである。
位置情報管理サーバ1560は、ネットワークに接続され、緯度および経度の情報を含む位置情報が示す位置に存在する店舗の店舗情報などの当該位置に関する情報を返信する機能を有するものである。
意味クラス決定部1505は、位置情報受信部1511aにより受信した自装置の緯度・経度を含む位置情報を位置情報管理サーバ1560に送信し、送信した位置情報に対して位置情報管理サーバ1560が返信した位置に関する情報を、通信部1512を介して取得し、取得した位置に関する情報から直示表現の意味クラスを決定するものである。
具体的には、例えば、位置情報管理サーバ1560から現在位置が靴屋であることを示す情報が返信された場合、意味クラス決定部1505は、利用者が発話した原言語文に含まれる直示表現の表す意味クラスは“c#shoes”であると推定する。
このように、本実施の形態では、指示対象の情報を直接取得することができない場合であっても、GPS受信機能などにより指示対象が存在する場所の位置に関する情報を取得し、取得した位置に関する情報を参照して直示表現が指し示す対象の意味クラスを推定することができる。これにより、直示表現をそのまま翻訳する場合に比較して、より適切な訳語を選択することが可能となる。
次に、このように構成された第4の実施の形態にかかる機械翻訳装置1500による機械翻訳処理について説明する。図16は、第4の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
ステップS1601からステップS1604までの、入力受付処理、単語分割処理、直示表現検出処理は、第2の実施の形態にかかる機械翻訳装置1000におけるステップS1101からステップS1104までと同様の処理なので、その説明を省略する。
ステップS1604で直示表現が検出された場合(ステップS1604:YES)、意味クラス決定部1505が、位置情報受信部1511aが受信した緯度・経度に対応する位置に関する情報を、通信部1512を介して位置情報管理サーバ1560から受信する(ステップS1605)。
次に、意味クラス決定部1505が、受信した位置に関する情報から直示表現の意味クラスを決定する(ステップS1606)。具体的には、例えば、店舗情報と、意味クラスとを対応づけた情報を記憶部(図示せず)に記憶し、この情報を参照して、受信した店舗情報に対する意味クラスを取得して、直示表現の意味クラスとして決定する。
また、位置情報管理サーバ1560から返信される位置に関する情報内に、意味クラスを含めるように構成してもよい。この場合、意味クラス決定部1505は、受信した位置に関する情報から意味クラスを抽出して、直示表現の意味クラスとして決定する。
ステップS1607からステップS1609までの、翻訳処理、出力処理は、第2の実施の形態にかかる機械翻訳装置1000におけるステップS1109からステップS1111までと同様の処理なので、その説明を省略する。
このように、第4の実施の形態にかかる機械翻訳装置では、GPS機能により取得した位置情報を参照して指示対象の意味クラスを決定することができる。このため、指示対象を特定できない場合であっても、意味クラスに応じて直示表現に対する適切な訳語を選択することができ、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことが可能となる。
なお、第1〜第4の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、ROM(Read Only Memory)等に予め組み込まれて提供される。
第1〜第4の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD−R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
さらに、第1〜第4の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第4の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。
第1〜第4の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、上述した各部(入力受付部、単語分割部、直示表現検出部、指示対象同定部、意味クラス決定部、翻訳部、出力制御部)を含むモジュール構成となっており、実際のハードウェアとしてはCPU(Central Processing Unit)が上記ROMから機械翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。
以上のように、本発明にかかる機械翻訳装置、機械翻訳方法および機械翻訳プログラムは、直示表現を含む入力文に対して適切な訳し分けを実現する機械翻訳装置に適している。
第1の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。 直示表現パターン記憶部に格納される直示表現のデータ構造の一例を示す説明図である。 意味クラス情報記憶部に格納される意味クラス情報のデータ構造の一例を示す説明図である。 意味クラス階層記憶部に格納される意味クラス間の階層関係のデータ構造の一例を示す説明図である。 翻訳規則記憶部に格納される翻訳規則のデータ構造の一例を示す説明図である。 依存構造解析結果のデータ構造の一例を示す説明図である。 第1の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。 機械翻訳処理で処理される情報の一例を示した説明図である。 日中翻訳、または、名詞を訳し分ける日英翻訳に適用した場合に処理されるデータの一例を示す説明図である。 第2の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。 第2の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。 第3の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。 距離属性記憶部に記憶された距離属性のデータ構造の一例を示す説明図である。 第3の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。 第4の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。 第4の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。
符号の説明
100、1000、1200、1500 機械翻訳装置
101 入力受付部
102 単語分割部
103 直示表現検出部
104 指示対象同定部
105 意味クラス決定部
106 翻訳部
107 出力制御部
111 指示対象検出部
121 直示表現パターン記憶部
122 意味クラス情報記憶部
123 意味クラス階層記憶部
124 翻訳規則記憶部
501 条件部
502 アクション部
503 日本語
504 中国語
505 英語
601 意味クラス
801 原言語文
802 商品
803 固有情報
804 処理過程
805 日本語
806 日本語
J901 日本語
C902 中国語
J903 単語
C904 単語
J905 日本語
J906 直示表現
1005 意味クラス決定部
1012 通信部
1050 意味クラス管理サーバ
1204 指示対象同定部
1205 意味クラス決定部
1211a 撮像部
1211b 画像認識部
1211 指示対象検出部
1225 距離属性記憶部
1505 意味クラス決定部
1511 指示対象検出部
1511a 位置情報受信部
1512 通信部
1560 位置情報管理サーバ

Claims (17)

  1. 指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段と、
    原言語文を受付ける受付手段と、
    前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、
    前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、
    前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける対応づけ手段と、
    前記直示表現に対して前記対応づけ手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、
    前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、
    を備えたことを特徴とする機械翻訳装置。
  2. 前記指示対象検出手段は、前記意味クラスを含む前記固有情報を検出し、
    前記意味クラス決定手段は、前記固有情報に含まれる前記意味クラスを取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項1に記載の機械翻訳装置。
  3. 前記指示対象物を一意に識別する識別子と、前記指示対象物の前記意味クラスとを対応づけた意味クラス情報を記憶する意味クラス情報記憶手段をさらに備え、
    前記指示対象検出手段は、前記識別子を含む前記固有情報を検出し、
    前記意味クラス決定手段は、前記固有情報に含まれる前記識別子に対応する前記意味クラスを前記意味クラス情報記憶手段から取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項1に記載の機械翻訳装置。
  4. ネットワークに接続され、前記指示対象物を一意に識別する識別子に対応する前記意味クラスを返信する意味クラス管理サーバに対して、前記識別子を送信し、前記意味クラス管理サーバから返信された前記意味クラスを受信する通信手段をさらに備え、
    前記指示対象検出手段は、前記識別子を含む前記固有情報を検出し、
    前記意味クラス決定手段は、前記通信手段を介して前記識別子を前記意味クラス管理サーバに送信し、送信した前記識別子に対して前記意味クラス管理サーバが返信した前記意味クラスを、前記通信手段を介して取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項1に記載の機械翻訳装置。
  5. 複数の前記意味クラス間の階層関係を記憶する意味クラス階層記憶手段をさらに備え、
    前記意味クラス決定手段は、前記意味クラス階層記憶手段を参照し、取得した前記意味クラスが前記直示表現に含まれる単語の前記意味クラスに含まれるか否かを判断し、含まれると判断した場合に、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項2〜4のいずれか1つに記載の機械翻訳装置。
  6. 前記対応づけ手段は、前記意味クラス決定手段が前記意味クラス階層記憶手段を参照して、取得した前記意味クラスが前記直示表現に含まれる単語の前記意味クラスに含まれないと判断した場合に、前記指示対象検出手段が再度検出した前記指示対象物に対して、前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づけることを特徴とする請求項5に記載の機械翻訳装置。
  7. 前記直示表現と、前記直示表現が表す対象までの距離の範囲の情報を含む距離属性とを対応づけて記憶した距離属性記憶手段をさらに備え、
    前記対応づけ手段は、前記直示表現検出手段が検出した前記直示表現に対応づけられた前記距離属性を前記距離属性記憶手段から取得し、取得した前記距離属性に含まれる前記距離の範囲に、前記指示対象検出手段から前記指示対象物までの距離が含まれるか否かを判断し、含まれると判断した場合に、前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づけることを特徴とする請求項1に記載の機械翻訳装置。
  8. 前記対応づけ手段は、取得した前記距離属性に含まれる前記距離の範囲に前記指示対象検出手段から前記指示対象物までの距離が含まれないと判断した場合に、前記指示対象検出手段が再度検出した前記指示対象物に対して、取得した前記距離属性に含まれる前記距離の範囲に前記指示対象検出手段から前記指示対象物までの距離が含まれるか否かを判断することを特徴とする請求項7に記載の機械翻訳装置。
  9. 原言語による単語と、該単語の前記意味クラスごとに予め定められた目的言語による単語とを対応づけた翻訳規則を記憶する翻訳規則記憶手段をさらに備え、
    前記翻訳手段は、前記直示表現に含まれる単語に対し、前記意味クラス決定手段が決定した前記意味クラスについて予め定められた目的言語による単語を前記翻訳規則記憶手段から取得し、取得した目的言語による単語を、前記直示表現に含まれる単語の訳語として翻訳を行うことを特徴とする請求項1に記載の機械翻訳装置。
  10. 原言語による単語と、該単語と文法的または意味的に依存関係にある単語の前記意味クラスごとに予め定められた目的言語による単語とを対応づけた翻訳規則を記憶する翻訳規則記憶手段をさらに備え、
    前記翻訳手段は、前記直示表現と文法的または意味的に依存関係にある単語に対し、前記意味クラス決定手段が決定した前記意味クラスについて予め定められた目的言語による単語を前記翻訳規則記憶手段から取得し、取得した目的言語による単語を、前記直示表現と文法的または意味的に依存関係にある単語の訳語として翻訳を行うことを特徴とする請求項1に記載の機械翻訳装置。
  11. 前記指示対象検出手段は、前記指示対象物に付された非接触ICタグから前記固有情報を検出することを特徴とする請求項1に記載の機械翻訳装置。
  12. 前記指示対象検出手段は、前記指示対象物に付されたバーコードから前記固有情報を検出することを特徴とする請求項1に記載の機械翻訳装置。
  13. 前記指示対象検出手段は、
    前記指示対象物の画像を撮像する撮像手段と、
    前記撮像手段が撮像した画像を解析して前記指示対象物の前記意味クラスを含む前記指示対象物の固有情報を取得する画像認識手段と、
    を備えたことを特徴とする請求項1に記載の機械翻訳装置。
  14. 前記指示対象検出手段は、前記指示対象物が存在する緯度および経度の情報を含む位置情報を受信し、受信した前記位置情報を前記固有情報として検出することを特徴とする請求項1に記載の機械翻訳装置。
  15. ネットワークに接続され、前記位置情報に対応する位置に関する情報を返信する位置情報管理サーバに対して、前記位置情報を送信し、前記位置情報管理サーバから返信された前記位置に関する情報を受信する通信手段をさらに備え、
    前記意味クラス決定手段は、前記通信手段を介して前記位置情報を前記位置情報管理サーバに送信し、送信した前記位置情報に対して前記位置情報管理サーバが返信した前記位置に関する情報を、前記通信手段を介して取得し、取得した前記位置に関する情報に基づき、前記意味クラスを決定することを特徴とする請求項14に記載の機械翻訳装置。
  16. 受付手段が、原言語文を受付ける入力受付ステップと、
    単語分割手段が、前記入力受付ステップが受付けた前記原言語文を形態素解析して単語に分割する単語分割ステップと、
    直示表現検出手段が、前記単語分割ステップが分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出ステップと、
    指示対象同定手段が、指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段が検出した前記固有情報と、前記直示表現検出ステップが検出した前記直示表現とを対応づける指示対象同定ステップと、
    意味クラス決定手段が、前記直示表現に対して前記指示対象同定ステップが対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定ステップと、
    翻訳手段が、前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳ステップと、
    を備えたことを特徴とする機械翻訳方法。
  17. コンピュータを、
    原言語文を受付ける受付手段と、
    前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、
    前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、
    指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける指示対象同定手段と、
    前記直示表現に対して前記指示対象同定手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、
    前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、
    として機能させるための機械翻訳プログラム。
JP2005313227A 2005-10-27 2005-10-27 機械翻訳装置、機械翻訳方法および機械翻訳プログラム Active JP4047885B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005313227A JP4047885B2 (ja) 2005-10-27 2005-10-27 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US11/446,961 US8060359B2 (en) 2005-10-27 2006-06-06 Apparatus, method and computer program product for optimum translation based on semantic relation between words
CNA2006101429645A CN1955953A (zh) 2005-10-27 2006-10-27 根据单词之间的语义关系优化翻译的装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005313227A JP4047885B2 (ja) 2005-10-27 2005-10-27 機械翻訳装置、機械翻訳方法および機械翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2007122383A JP2007122383A (ja) 2007-05-17
JP4047885B2 true JP4047885B2 (ja) 2008-02-13

Family

ID=37997624

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005313227A Active JP4047885B2 (ja) 2005-10-27 2005-10-27 機械翻訳装置、機械翻訳方法および機械翻訳プログラム

Country Status (3)

Country Link
US (1) US8060359B2 (ja)
JP (1) JP4047885B2 (ja)
CN (1) CN1955953A (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9235573B2 (en) 2006-10-10 2016-01-12 Abbyy Infopoisk Llc Universal difference measure
US9645993B2 (en) 2006-10-10 2017-05-09 Abbyy Infopoisk Llc Method and system for semantic searching
US20080086298A1 (en) * 2006-10-10 2008-04-10 Anisimovich Konstantin Method and system for translating sentences between langauges
US8145473B2 (en) 2006-10-10 2012-03-27 Abbyy Software Ltd. Deep model statistics method for machine translation
US8195447B2 (en) 2006-10-10 2012-06-05 Abbyy Software Ltd. Translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9633005B2 (en) 2006-10-10 2017-04-25 Abbyy Infopoisk Llc Exhaustive automatic processing of textual information
US9047275B2 (en) 2006-10-10 2015-06-02 Abbyy Infopoisk Llc Methods and systems for alignment of parallel text corpora
US8214199B2 (en) * 2006-10-10 2012-07-03 Abbyy Software, Ltd. Systems for translating sentences between languages using language-independent semantic structures and ratings of syntactic constructions
US9984071B2 (en) 2006-10-10 2018-05-29 Abbyy Production Llc Language ambiguity detection of text
US8548795B2 (en) * 2006-10-10 2013-10-01 Abbyy Software Ltd. Method for translating documents from one language into another using a database of translations, a terminology dictionary, a translation dictionary, and a machine translation system
JP5121252B2 (ja) * 2007-02-26 2013-01-16 株式会社東芝 原言語による音声を目的言語に翻訳する装置、方法およびプログラム
US8959011B2 (en) 2007-03-22 2015-02-17 Abbyy Infopoisk Llc Indicating and correcting errors in machine translation systems
US8812296B2 (en) 2007-06-27 2014-08-19 Abbyy Infopoisk Llc Method and system for natural language dictionary generation
JP5235344B2 (ja) * 2007-07-03 2013-07-10 株式会社東芝 機械翻訳を行う装置、方法およびプログラム
US8219399B2 (en) * 2007-07-11 2012-07-10 Garmin Switzerland Gmbh Automated speech recognition (ASR) tiling
EP2075713A1 (en) * 2007-12-17 2009-07-01 Alcatel Lucent A method and associated system for delivery of objects
US8583416B2 (en) * 2007-12-27 2013-11-12 Fluential, Llc Robust information extraction from utterances
US9436759B2 (en) 2007-12-27 2016-09-06 Nant Holdings Ip, Llc Robust information extraction from utterances
CN101246474B (zh) * 2008-02-18 2012-01-11 刘树根 一种基于语句构件的母语读外文方法
JP2009258871A (ja) * 2008-04-15 2009-11-05 Casio Comput Co Ltd 翻訳装置及びプログラム
EP2138971B1 (en) * 2008-06-26 2020-03-18 Alcatel Lucent Method for searching a product, a system for searching a product, a related product semantics determining device and a related product searching device
US9262409B2 (en) 2008-08-06 2016-02-16 Abbyy Infopoisk Llc Translation of a selected text fragment of a screen
KR101045955B1 (ko) * 2008-11-14 2011-07-04 한국과학기술정보연구원 문맥의 의미적 연관관계 추출 방법 및 그 장치와 그 프로그램 소스를 저장한 기록 매체
US8843359B2 (en) * 2009-02-27 2014-09-23 Andrew Nelthropp Lauder Language translation employing a combination of machine and human translations
WO2010135375A1 (en) * 2009-05-20 2010-11-25 Hotgrinds, Inc. Semiotic square search and/or sentiment analysis system and method
JP5471106B2 (ja) * 2009-07-16 2014-04-16 独立行政法人情報通信研究機構 音声翻訳システム、辞書サーバ装置、およびプログラム
US9063931B2 (en) * 2011-02-16 2015-06-23 Ming-Yuan Wu Multiple language translation system
JP5242726B2 (ja) * 2011-03-28 2013-07-24 株式会社東芝 外国語接客支援装置、外国語接客方法及びプログラム
CN102662937B (zh) * 2012-04-12 2016-03-02 传神联合(北京)信息技术有限公司 自动翻译系统及其自动翻译方法
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
CN103577397A (zh) * 2012-08-10 2014-02-12 阿里巴巴集团控股有限公司 计算机翻译数据处理方法及装置
RU2592395C2 (ru) 2013-12-19 2016-07-20 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Разрешение семантической неоднозначности при помощи статистического анализа
RU2586577C2 (ru) 2014-01-15 2016-06-10 Общество с ограниченной ответственностью "Аби ИнфоПоиск" Фильтрация дуг в синтаксическом графе
US9497153B2 (en) * 2014-01-30 2016-11-15 Google Inc. Associating a segment of an electronic message with one or more segment addressees
KR101864361B1 (ko) * 2014-04-08 2018-06-04 네이버 주식회사 다양한 의미 범주에 기반한 번역 결과 제공 방법 및 시스템
US9844723B2 (en) * 2014-07-25 2017-12-19 Zynga Inc. In-browser emulation of multiple technologies to create consistent visualization experience
RU2596600C2 (ru) 2014-09-02 2016-09-10 Общество с ограниченной ответственностью "Аби Девелопмент" Способы и системы обработки изображений математических выражений
JP6334354B2 (ja) * 2014-09-30 2018-05-30 株式会社東芝 機械翻訳装置、方法およびプログラム
US9626358B2 (en) 2014-11-26 2017-04-18 Abbyy Infopoisk Llc Creating ontologies by analyzing natural language texts
CN104485106B (zh) * 2014-12-08 2018-08-28 畅捷通信息技术股份有限公司 语音识别方法、语音识别系统和语音识别设备
US20170116194A1 (en) 2015-10-23 2017-04-27 International Business Machines Corporation Ingestion planning for complex tables
KR102195627B1 (ko) * 2015-11-17 2020-12-28 삼성전자주식회사 통역 모델 생성 장치 및 방법과, 자동 통역 장치 및 방법
US10073834B2 (en) * 2016-02-09 2018-09-11 International Business Machines Corporation Systems and methods for language feature generation over multi-layered word representation
US11093706B2 (en) 2016-03-25 2021-08-17 Raftr, Inc. Protagonist narrative balance computer implemented analysis of narrative data
US10467277B2 (en) 2016-03-25 2019-11-05 Raftr, Inc. Computer implemented detection of semiotic similarity between sets of narrative data
US9842100B2 (en) 2016-03-25 2017-12-12 TripleDip, LLC Functional ontology machine-based narrative interpreter
KR102052606B1 (ko) * 2017-07-25 2019-12-06 네이버 주식회사 주의 기반 인공 신경망 기계 번역의 상호작용 시각화와 조작을 위한 방법 및 시스템
CN110020440B (zh) * 2018-01-09 2023-05-23 深圳市腾讯计算机系统有限公司 一种机器翻译方法、装置、服务器及存储介质
JP7058574B2 (ja) * 2018-09-10 2022-04-22 ヤフー株式会社 情報処理装置、情報処理方法、およびプログラム
US11120224B2 (en) * 2018-09-14 2021-09-14 International Business Machines Corporation Efficient translating of social media posts
CN109800430B (zh) * 2019-01-18 2023-06-27 广东小天才科技有限公司 一种语义理解方法及系统

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3034295B2 (ja) * 1990-10-31 2000-04-17 株式会社東芝 機械翻訳方法及び機械翻訳装置
US7092928B1 (en) * 2000-07-31 2006-08-15 Quantum Leap Research, Inc. Intelligent portal engine
WO2002054265A1 (en) * 2001-01-02 2002-07-11 Julius Cherny Document storage, retrieval, and search systems and methods
US20020102988A1 (en) * 2001-01-26 2002-08-01 International Business Machines Corporation Wireless communication system and method for sorting location related information
US20030009462A1 (en) * 2001-07-03 2003-01-09 Burnham Guy L. Computer-readable designators and methods and systems of using the same
US6868383B1 (en) * 2001-07-12 2005-03-15 At&T Corp. Systems and methods for extracting meaning from multimodal inputs using finite-state devices
US7127261B2 (en) * 2002-02-22 2006-10-24 Julian Van Erlach Enhanced telecommunication services
JP2003302996A (ja) * 2002-04-11 2003-10-24 Yamagata Univ Research Institute 情報処理システム
US20030214523A1 (en) * 2002-05-16 2003-11-20 Kuansan Wang Method and apparatus for decoding ambiguous input using anti-entities
US7257575B1 (en) * 2002-10-24 2007-08-14 At&T Corp. Systems and methods for generating markup-language based expressions from multi-modal and unimodal inputs
JP2005275887A (ja) * 2004-03-25 2005-10-06 Nec Personal Products Co Ltd 自動翻訳システム及び自動翻訳方法
US20060074980A1 (en) * 2004-09-29 2006-04-06 Sarkar Pte. Ltd. System for semantically disambiguating text information
US7698336B2 (en) * 2006-10-26 2010-04-13 Microsoft Corporation Associating geographic-related information with objects

Also Published As

Publication number Publication date
JP2007122383A (ja) 2007-05-17
US20070100601A1 (en) 2007-05-03
CN1955953A (zh) 2007-05-02
US8060359B2 (en) 2011-11-15

Similar Documents

Publication Publication Date Title
JP4047885B2 (ja) 機械翻訳装置、機械翻訳方法および機械翻訳プログラム
US8924195B2 (en) Apparatus and method for machine translation
US6052656A (en) Natural language processing system and method for processing input information by predicting kind thereof
US8214197B2 (en) Apparatus, system, method, and computer program product for resolving ambiguities in translations
US20060224378A1 (en) Communication support apparatus and computer program product for supporting communication by performing translation between languages
US20090222257A1 (en) Speech translation apparatus and computer program product
JP5235344B2 (ja) 機械翻訳を行う装置、方法およびプログラム
JP2007141133A (ja) 用例翻訳装置、用例翻訳方法および用例翻訳プログラム
JP2007094086A (ja) 入力装置、入力方法および入力プログラム
KR20100134618A (ko) 정보 처리 장치, 방법 및 기록 매체
JP2003162527A (ja) コミュニケーション支援装置及びコミュニケーション支援方法
JP5002271B2 (ja) 入力された原言語文を目的言語に機械翻訳する装置、方法およびプログラム
CN110895961A (zh) 医疗数据中的文本匹配方法及装置
KR102304608B1 (ko) 동작인식장치와 아바타를 이용한 수어 통역/번역 서비스 시스템
KR101709693B1 (ko) 크라우드 소싱을 이용한 웹툰 언어 자동 번역 방법
CN111709431B (zh) 即时翻译方法、装置、计算机设备和存储介质
JP2006276903A (ja) 文書処理装置
CN110442877A (zh) 使用机器人规划作为平行语言语料库
JP7338328B2 (ja) データ構造、コンピュータプログラム及び画像処理装置
CN111552780A (zh) 医用场景的搜索处理方法、装置、存储介质及电子设备
CN114430832A (zh) 数据处理方法、装置、电子设备和存储介质
JP7115187B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP3906820B2 (ja) 翻訳支援装置および翻訳支援プログラム
JPH06243162A (ja) 機械翻訳装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070904

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071102

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071120

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071122

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4047885

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101130

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111130

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121130

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131130

Year of fee payment: 6