JP4047885B2

JP4047885B2 - 機械翻訳装置、機械翻訳方法および機械翻訳プログラム

Info

Publication number: JP4047885B2
Application number: JP2005313227A
Authority: JP
Inventors: 和広木村
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2005-10-27
Filing date: 2005-10-27
Publication date: 2008-02-13
Anticipated expiration: 2025-10-27
Also published as: JP2007122383A; US20070100601A1; CN1955953A; US8060359B2

Description

この発明は、単語間の意味関係に基づき最適な訳し分けを行う機械翻訳装置、機械翻訳方法および機械翻訳プログラムに関するものである。

従来、機械翻訳の適用領域は文型が限定された技術文書等に限られていたが、近年の機械翻訳技術の進展により、Ｗｅｂ文書等の幅広い分野の文書を扱えるようになった。また、機械翻訳技術と音声認識技術との融合により、人間の発話を実世界・実時間で翻訳する音声翻訳装置（通訳装置）の実用化が期待される状況になっている。

ところが、音声翻訳は話し言葉を扱う性格上、言葉の省略や助詞等の脱落、句や文の倒置、言い直し、不要語句の挿入など、書き言葉にはあまり現れなかった言語現象に対応する必要があり、実用化において克服すべき課題も多い。

このような課題の一つとして、話し言葉では直示表現（deixis）が多用されるという課題が存在する。直示表現とは、“this”、“that”などの指示詞や“I”、“you”などの代名詞によって直接発話の現場に存在する事物を指し示す表現である。直示表現が用いられた場合、その指示対象を同定せずに翻訳を行うと、適切な訳し分けが行えず、翻訳文の質が低下する。

例えば、直示表現“this”を含む”Can I take this?”という英語を日本語に翻訳する場合、指示対象を同定せずに翻訳すると、日本語で“これを取ってもいいですか？”と訳される。しかし、より正確に翻訳するには“take”の直接目的語である“this”の表すものを特定する必要がある。例えば、“this”がタクシーを表すことが特定できれば、“このタクシーに乗ってもいいですか？”と訳し、“this”が風呂を表すことが特定できれば、“お風呂に入ってもいいですか？”と訳すことができる。

このように、直示表現の指示対象を同定することにより、より適切な訳語に訳し分けることが可能となり、翻訳文の質を向上させることができる。従来、先行する発話を参照して直示表現の指示対象を推定する方法などが提案されていたが、実用に耐えうる推定の精度を得ることができなかった。

また、特許文献１では、ＰＤＡ（Personal Digital Assistance）等へ音声によりコマンドを入力すると同時に、マウスやペンを画面上で操作して音声に含まれる直示表現の指示対象を指定することにより、直示表現を含む入力音声の言語解釈を適切に行う技術が提案されている。この技術によれば、先行する発話が存在しない場合でも直示表現の指示対象を同定することが可能となる。

米国特許第６８６８３８３号明細書

しかしながら、特許文献１の技術では、指示対象がＰＤＡ上の画面という仮想空間に存在していることが前提とされているため、音声翻訳装置のようにさまざまな環境で使用され、指示対象が実世界上のあらゆる事物に対し想定されうる状況では、適用範囲が極めて限定されるという問題があった。

本発明は、上記に鑑みてなされたものであって、さまざまな状況で入力された直示表現を含む原言語文に対する翻訳の精度を向上させることができる機械翻訳装置、機械翻訳方法および機械翻訳プログラムを提供することを目的とする。

上述した課題を解決し、目的を達成するために、本発明は、指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段と、原言語文を受付ける受付手段と、前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける対応づけ手段と、前記直示表現に対して前記対応づけ手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、を備えたことを特徴とする。

また、本発明は、上記装置を実行することができる機械翻訳方法および機械翻訳プログラムである。

本発明によれば、利用者が指し示した対象に埋め込まれた情報を検出し、入力された音声に含まれる直示表現の指示対象として同定することができる。このため、指示対象が事前に登録されたものに限られることなく、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことができるという効果を奏する。

以下に添付図面を参照して、この発明にかかる機械翻訳装置、機械翻訳方法および機械翻訳プログラムの最良な実施の形態を詳細に説明する。

（第１の実施の形態）
第１の実施の形態にかかる機械翻訳装置は、利用者が発話すると同時に指し示した対象の情報を検出し、発話に含まれる直示表現の指示対象として同定して翻訳を行うものである。

図１は、第１の実施の形態にかかる機械翻訳装置１００の構成を示すブロック図である。同図に示すように、機械翻訳装置１００は、指示対象検出部１１１と、直示表現パターン記憶部１２１と、意味クラス情報記憶部１２２と、意味クラス階層記憶部１２３と、翻訳規則記憶部１２４と、入力受付部１０１と、単語分割部１０２と、直示表現検出部１０３と、指示対象同定部１０４と、意味クラス決定部１０５と、翻訳部１０６と、出力制御部１０７とを備えている。

指示対象検出部１１１は、対象物に埋め込まれた非接触ＩＣタグ（ＲＦＩＤ（Radio Frequency Identification）タグ）から当該対象物の情報を読み取るものであり、例えば、ＲＦＩＤリーダーなどにより構成する。ＲＦＩＤタグは、商品等の対象物に予め配置されており、当該対象物の固有情報を保持している。指示対象検出部１１１は、例えば、指示棒のような棒状の形態の先端に備えられ、利用者が当該指示棒で指し示した位置の近傍に存在するＲＦＩＤタグを認識し、ＲＦＩＤタグに記憶された対象物の固有情報を読み取る。

なお、固有情報には対象物を一意に識別するための情報が含まれる。また、固有情報内に、対象物の意味クラス自体を格納するように構成してもよい。この場合、固有情報から直接意味クラスを取得できるため、後述する意味クラス情報記憶部１２２は不要となる。

指示対象検出部１１１はＲＦＩＤタグから情報を読み取るものに限られず、利用者が指し示した対象の固有情報を検出するものであればあらゆる方法を適用することができる。例えば、対象物に付された２次元バーコードなどのバーコードから固有情報を読み取るように構成してもよい。

また、ＣＣＤ（Charge Coupled Devices）カメラにより近傍の画像を取得し、画像認識技術によって、撮影した対象物を特定するように構成してもよい。また、ＧＰＳ（Global Positioning System）受信機能により自装置が存在する位置を認識し、ネットワーク上に存在するサービスに問い合わせて現在地の位置情報（店舗情報等）を獲得し、対象物の情報として検出するように構成してもよい。さらに、指示対象検出部１１１は、上記方法を組み合わせて指示対象からの情報を取得するように構成してもよい。

直示表現パターン記憶部１２１は、対象を直接指示する表現である直示表現のパターンを記憶するものであり、直示表現検出部１０３が入力された原言語文中から直示表現を検出するときに参照される。

図２は、直示表現パターン記憶部１２１に格納される直示表現のデータ構造の一例を示す説明図である。同図に示すように、直示表現パターン記憶部１２１は、正規表現を用いて直示表現を示すパターンを格納している。

直示表現のパターンは、“単語１/品詞１”または“単語１/品詞１単語２/品詞２”のようなパターンで表される。前者は、品詞が“品詞１”である“単語１”が直示表現であることを示すパターンである。後者は、品詞が“品詞１”である“単語１”に続けて、品詞が“品詞２”である“単語２”が存在するとき、当該２つの単語を合わせた単語列が直示表現であることを示すパターンである。

具体的には、同図に示すように、“*/EP3”、“*/ET1 */EN1”のように直示表現のパターンが表わされる。ここで、“EP3”、“ET1”、“EN1”はそれぞれ、指示代名詞、指示限定詞、普通名詞を表す。なお、記号“*”は、任意の情報が該当することを示すものである。

例えば、単語“this”は指示代名詞（“EP3”）であるため、前者のパターンに該当し、当該単語“this”は直示表現として検出される。また、単語列“that hat”は、指示限定詞（“that”）に普通名詞（“hat”）が結合した単語列であるため、後者のパターンに該当し、直示表現として検出することができる。

なお、直示表現のパターンは上記例に限られるものではなく、一般的に直示表現であると認められているあらゆる単語または単語列のパターンを格納することができる。

意味クラス情報記憶部１２２は、対象物の固有情報と、対象物の意味属性を表す意味クラスとを対応づけた意味クラス情報を記憶するものであり、意味クラス決定部１０５が対象物の意味クラスを決定する際に参照される。

図３は、意味クラス情報記憶部１２２に格納される意味クラス情報のデータ構造の一例を示す説明図である。同図に示すように、意味クラス情報記憶部１２２は、対象物の固有情報と、対象物の意味クラスとを対応づけて格納している。

同図では、対象物の商品の種別を示す文字情報と、対象物を一意に識別する情報（数値）とを記号“＃”で区切った形式の固有情報の例が示されている。固有情報の形式はこれに限られるものではなく、少なくとも対象物を一意に識別することができる情報を含んでいればどのような形式でもよい。

意味クラス階層記憶部１２３は、複数の意味クラス間の階層関係を記憶するものであり、意味クラス決定部１０５が対象物の意味クラスと、直示表現に含まれる単語の意味クラスとの整合性を確認する際に参照される。

図４は、意味クラス階層記憶部１２３に格納される意味クラス間の階層関係のデータ構造の一例を示す説明図である。同図では、楕円で示されたノードの内部に記載された文言が意味クラスを表している。また、矢印はその始点に位置する意味クラスが、矢印の終点に位置する意味クラスの上位概念であることを示している。また、記号“・・・”は省略された部分を表している。

例えば同図では、意味クラス“c#dress"や、意味クラス“c#kimono"は、意味クラス“c#clothes”の下位概念であるという階層関係が記述されている。

翻訳規則記憶部１２４は、原言語による単語に対して、その単語の意味クラスまたはその単語が目的語とする単語の意味クラスに応じて、訳語をどのように決定するかを判断するための翻訳規則を記憶するものである。このように、翻訳規則記憶部１２４は、翻訳部１０６が、対象物の意味クラスに応じた適切な訳語を決定するために参照される。

なお、直示表現パターン記憶部１２１、意味クラス情報記憶部１２２、意味クラス階層記憶部１２３、および翻訳規則記憶部１２４は、ＨＤＤ（Hard Disk Drive）、光ディスク、メモリカードなどの一般的に利用されているあらゆる記憶媒体により構成することができる。

図５は、翻訳規則記憶部１２４に格納される翻訳規則のデータ構造の一例を示す説明図である。同図に示すように、翻訳規則記憶部１２４は、翻訳方向と、条件部と、アクション部とを対応づけた翻訳規則を格納している。

条件部は、翻訳部１０６が依存構造解析した結果に含まれる部分構造と照合するパターンを指定する。アクション部は、条件部に指定されたパターンと一致する部分構造に対して適用する動作を指定する。条件部、アクション部の詳細については、後述する翻訳部１０６の機能と合わせて説明する。

入力受付部１０１は、利用者が入力した音声による原言語文を受付けるものである。本実施の形態では、利用者は音声により原言語文を入力する。このため、入力受付部１０１は、入力された音声を音声認識し、その結果である原言語文の入力を受付ける。音声認識処理では、ＬＰＣ分析、隠れマルコフモデル（ＨＭＭ：Hidden Markov Model）、ダイナミックプログラミング、ニューラルネットワーク、Ｎグラム言語モデルなどを用いた、一般的に利用されているあらゆる音声認識方法を適用することができる。

なお、入力受付部１０１は、手書き文字認識、キー入力などにより入力された原言語文を受付けるように構成してもよい。

単語分割部１０２は、入力受付部１０１が受付けた原言語文を形態素解析し、単語列に分割するものである。形態素解析処理では、日本語に対しては、連接行列と文節数最小法を用いた形態素解析、英語に対しては、確率モデルとダイナミックプログラミング、Ａ＊アルゴリズムを用いた形態素解析を適用するなど、一般的に用いられているあらゆる方法を適用することができる。また、形態素情報、意味情報などを格納した辞書（図示せず）が、ＨＤＤ、光ディスク、メモリカードなどの一般的に利用されている記憶媒体に格納され、形態素解析処理で参照される。

形態素解析の結果、分割した各単語と、各単語の品詞とが対応づけて出力される。例えば、原言語文“May I try this on?”が入力された場合、形態素解析結果として、“May/EAV I/EP1 try/EVE this/EP3 on/ED3”が出力される。ここで、EAV、EP1、EVE、EP3、ED3はそれぞれ助動詞、人称代名詞、動詞、指示代名詞、副詞小辞を示す。

なお、形態素解析では、数、性、アスペクト、モダリティ、訳語などの品詞以外の情報も同時に得ることができるが、ここでは省略する。

直示表現検出部１０３は、単語分割部１０２が入力文を形態素解析して出力した単語列に含まれる各単語を、直示表現パターン記憶部１２１に記憶されている直示表現のパターンと照合することにより、単語列から直示表現を検出するものである。

指示対象同定部１０４は、指示対象検出部１１１が検出した指示対象の情報と、直示表現検出部１０３が検出した直示表現とを対応づけることにより、入力された原言語文中の直示表現が指し示す対象を同定するものである。

例えば、入力された原言語文に、直示表現“this”が含まれていることを直示表現検出部１０３が検出した場合、指示対象検出部１１１が検出した指示対象が、直示表現“this”の示す内容であるとして指示対象を特定する。

意味クラス決定部１０５は、指示対象同定部１０４により直示表現と対応づけられた指示対象の意味クラスを決定するものである。具体的には、意味クラス決定部１０５は、指示対象検出部１１１が検出した指示対象の固有情報を検索キーとして意味クラス情報記憶部１２２から対応する意味クラスを取得し、取得した意味クラスを指示対象の意味クラスとして決定する。

この際、意味クラス決定部１０５は、取得した意味クラスを指示対象の意味クラスとして決定する前に、取得した意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする。これにより、指示対象検出部１１１が誤って指示対象を検出した場合であっても、誤った意味クラスにより誤った訳語を選択することを回避できる。

なお、指示対象検出部１１１が検出した指示対象の情報内に意味クラス自体が含まれている場合は、指示対象の情報から意味クラスを抽出し、抽出した意味クラスを、指示対象の意味クラスとして決定する。

翻訳部１０６は、単語分割部１０２が形態素解析した結果である単語列に対して統語解析および依存構造解析を行い、翻訳の目的言語への構造変換規則や対訳辞書（図示せず）を参照して目的言語による翻訳文を出力するものである。翻訳部１０６により行われる翻訳処理は、トランスファ方式などの一般的なルールベース翻訳で利用されているあらゆる方法を適用することができる。

図６は、依存構造解析結果のデータ構造の一例を示す説明図である。翻訳部１０６は、同図に示すような木構造の依存構造解析結果を出力する。同図では、楕円で示されたノードは形態素解析結果の単語を表し、単語間を結ぶ矢印は単語間の関係を表す。

単語には、記号“［”、“］”で囲まれた単語属性が付与される。単語属性は形態素解析処理で得られたものに、依存構造解析の結果が反映されて出力される。単語属性には、“属性名:属性値”の形式で複数の属性を設定することができる。属性としては、例えば、原言語表記（sw）、品詞（cat）、目的言語表記（tw）、モダリティ（mod）、意味クラス（sem）などが与えられる。

目的言語表記（tw）には、翻訳の目的言語による訳語の候補が複数格納される。例えば、同図の上部の英語の単語“try on”に対しては、３つの日本語による訳語の候補が示されている。なお、目的言語表記の左端に記載された候補は、目的語の意味クラスが特定できなかった場合等に選択されるデフォルトの候補を表す。

なお、同図では、直示表現“this”を含む原言語文“May I try this on?”が入力されたときの依存構造解析結果の例が示されている。この場合、同図の“this”のノードに示すように、意味クラス決定部１０５が決定した意味クラス６０１が、対応する単語の単語属性に追加される。これにより、原言語文として“May I try shoes on?”が入力されたときと同様の依存構造が得られる。また、“May I”の語順から主動詞“try on”のモダリティ属性（mod）には疑問文属性（+qst）が加えられ、“May”自身のノードは消滅して、“try on”のモダリティ属性の許可属性（+permit）として書き換えられている。

ノードを結ぶ矢印には、単語間の文法的関係を表すラベルが付与される。例えば、動詞-主語の関係（subj）や動詞-目的語の関係（obj）などが与えられる。

翻訳部１０６は、依存構造解析結果から訳語を生成する際、翻訳規則記憶部１２４に記憶された翻訳規則を参照し、入力された原言語文中の単語間の文法的関係または意味的関係によって訳語を訳し分ける処理を行う。

具体的には、翻訳部１０６は、まず、依存構造解析結果に含まれる部分構造と一致するパターンが、翻訳規則記憶部１２４に記憶された翻訳規則の条件部に存在するか否かを検索する。一致するパターンが条件部に存在する場合、条件部に対応するアクション部を取得し、アクション部に記載された翻訳規則に従い、単語の訳語を決定する。

この際、直示表現である単語の属性に、意味クラス決定部１０５が決定した意味クラスが付与されているため、翻訳部１０６は直示表現である単語が当該意味クラスを有する単語であるものとして適切に訳語を選択することができる。

ここで、図５に示した条件部およびアクション部の形式について詳述する。条件部には、例えば、“self［属性名１：属性値１］、obj［属性名２：属性値２］”の形式で部分構造と照合するパターンを記述する。これは、属性名１が属性値１であるノード（self）に対し、属性名２が属性値２であるノードが目的語として対応づけられている部分構造のパターンを示している。

条件部の別の例としては、“self［属性名１：属性値１、属性名２：属性値２］”の形式でパターンを記述することができる。これは、単に、属性名１が属性値１および属性名２が属性値２であるノード（self）が部分構造として存在することを条件とするパターンを示している。

アクション部には、例えば、“set（属性名３、属性値３）”の形式で、部分構造に対して適用する動作を記述する。これは、属性名３に属性値３を設定する動作を示している。

出力制御部１０７は、翻訳部１０６が出力した翻訳の目的言語による文である翻訳文を、液晶ディスプレイなどの表示手段や、スピーカなどの音声出力手段に出力する処理を制御するものである。

なお、翻訳文を目的言語による音声で出力する場合は、出力制御部１０７は、翻訳部１０６が出力した対訳文を目的言語である英語の合成音声として出力する処理を行う。音声合成処理は、音声素片編集音声合成、フォルマント音声合成などを用いたテキストトゥスピーチシステムなどの一般的に利用されているあらゆる方法を適用することができる。

次に、このように構成された第１の実施の形態にかかる機械翻訳装置１００による機械翻訳処理について説明する。図７は、第１の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。

まず、入力受付部１０１が、利用者により入力された入力文を受付ける（ステップＳ７０１）。本実施の形態では、利用者は音声により原言語文を入力するため、入力受付部１０１は、入力された音声を音声認識し、その結果である原言語文の入力を受付ける。

次に、単語分割部１０２が、入力受付部１０１により受付けられた入力文を形態素解析し、複数の単語に分割する（ステップＳ７０２）。

次に、直示表現検出部１０３が、分割した複数の単語から、直示表現パターン記憶部１２１を参照して直示表現である単語または単語列を検出する（ステップＳ７０３）。具体的には、直示表現検出部１０３は、単語列に含まれる単語または連続する複数の単語である単語列と、直示表現パターン記憶部１２１に記憶されている直示表現のパターンと照合し、一致するものが存在すれば、当該一致した単語または単語列を直示表現として検出する。

ここで、単語列に含まれる連続する複数の単語である単語列とは、“that hat”のように、指示限定詞（“that”）に普通名詞（“hat”）が結合した単語列などを指す。このような場合は、単一の単語ではなく、複数の単語により直示表現が表される場合があるからである。

次に、直示表現検出部１０３は、直示表現が検出されたか否かを判断する（ステップＳ７０４）。検出された場合は（ステップＳ７０４：ＹＥＳ）、指示対象同定部１０４は、指示対象検出部１１１が検出した指示対象と、直示表現検出部１０３が検出した直示表現とを対応づけることにより、指示対象を同定する（ステップＳ７０５）。

次に、意味クラス決定部１０５が、意味クラス情報記憶部１２２から指示対象に対応する意味クラスを取得する（ステップＳ７０６）。具体的には、意味クラス決定部１０５は、指示対象検出部１１１が検出した指示対象の固有情報を検索キーとして意味クラス情報記憶部１２２を検索し、当該固有情報に対応する意味クラスを取得する。

例えば、指示対象検出部１１１が、指示対象の固有情報として“shoes#123456789”を検出した場合、意味クラス決定部１０５は、図３に示すような意味クラス情報記憶部１２２から対応する意味クラスとして、“c#shoes”を取得する。取得した意味クラスは、後に翻訳部１０６が翻訳する際に参照できるように、直示表現である単語と対応づけて保存される。

次に、意味クラス決定部１０５は、取得した意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする（ステップＳ７０７）。

例えば、直示表現“this hat”が検出された場合、形態素解析時に当該直示表現の意味クラスとして、“c#hat”が付与されている。これに対し、指示対象検出部１１１が誤って近傍に存在するジャケットの固有情報“jacket#234567891”を検出したとすると、図３に示すような意味クラス情報記憶部１２２から、対応する意味クラスとして“c#clothes”が取得される。

意味クラス決定部１０５は、意味クラス階層記憶部１２３を参照し、上記２つの意味クラスが一致するか否か、および、一方が他方の下位概念に相当するか否かを判断する。そして、一致する、または、一方が他方の下位概念に相当する場合は、両者は整合性があると判断する。

例えば、意味クラス階層記憶部１２３に図４に示すような情報が格納されていたとすると、直示表現の意味クラス“c#hat”と、意味クラス決定部１０５が取得した意味クラス“c#clothes”とは、上位下位の関係が存在しない。すなわち、いわゆるis＿a＿kind＿of（AKO）の関係が成立しない。このため、意味クラス決定部１０５は、意味クラス間に整合性がないと判断する。

なお、例えば、直示表現が指示代名詞“this”のみである場合のように、形態素解析で直示表現である単語に意味クラスが付与されないときは、意味クラスの整合性チェック処理（ステップＳ７０７、ステップＳ７０８）は省略される。

意味クラスの整合性のチェックの後（ステップＳ７０７）、意味クラス決定部１０５は、意味クラスに整合性があるか否かを判断し（ステップＳ７０８）、整合性がない場合は（ステップＳ７０８：ＮＯ）、指示対象検出部１１１が再度指示対象を検出しなおして処理を繰り返す（ステップＳ７０５）。

整合性がある場合は（ステップＳ７０８：ＹＥＳ）、翻訳部１０６が翻訳処理を行う。すなわち、翻訳部１０６は、まず分割した単語に対し、統語解析および依存構造解析を実行する（ステップＳ７０９）。

次に、翻訳部１０６は、翻訳規則記憶部１２４の翻訳規則に従い、単語の意味クラスに対応する訳語を選定する（ステップＳ７１０）。この際、直示表現の単語に意味クラスが付与されているため、適切な訳語を選択することが可能となる。

例えば、図５に示すような翻訳規則が翻訳規則記憶部１２４に記憶され、依存構造解析により、図６に示すような依存構造解析結果が得られたとする。この場合、図６の右側の矢印で結ばれる２つのノードを取り出した部分構造が、図５の条件部５０１のパターンと一致する。このため、図５のアクション部５０２の規則に従い、“try on”の訳語として日本語５０３（“履いてみる”）が選択される。

翻訳部１０６による翻訳処理の後（ステップＳ７１０）、出力制御部１０７が、翻訳部１０６が出力した翻訳文を、液晶ディスプレイなどの表示部（図示せず）や、スピーカなどの音声出力部（図示せず）に出力する処理を行い（ステップＳ７１１）、機械翻訳処理を終了する。

なお、ステップＳ７０５からステップＳ７０８では、指示対象検出部１１１が指示対象を１つ検出し、検出した指示対象ごとに意味クラスの整合性をチェックして適切な指示対象を取得するように構成していた。これに対し、指示対象検出部１１１が同時に複数の指示対象を検出し、検出した複数の指示対象から意味クラスの整合性の条件を満たす指示対象を選択するように構成してもよい。

次に、上述のように構成された機械翻訳装置１００による機械翻訳処理の具体例について説明する。図８は、機械翻訳処理で処理される情報の一例を示した説明図である。

図８では、原言語として英語を発話する利用者が、日本の百貨店の靴売り場にて、”May I try this on?”と発話した場面の例を示している。この例では、機械翻訳装置１００は、ＰＤＡとして実施されており、ＰＤＡ本体には音声入出力デバイスが内蔵されて、英語音声を認識してこれを翻訳し、翻訳結果を日本語合成音として出力する。また、ＰＤＡの入力ペンが指示対象検出部１１１に相当し、入力ペンにはＲＦＩＤリーダーが内蔵されており、読み取ったＲＦＩＤタグの情報を本体へ無線送信する機能を有する。一方、靴売り場の各商品には、それぞれ固有の識別情報を記録したＲＦＩＤタグが添付されている。

同図に示すように、利用者が原言語文８０１（“May I try this on?”）を音声により入力し（ステップＳ７０１）、同時に入力ペンでＲＦＩＤタグが付された商品８０２を指し示したとする。

この場合、単語分割部１０２により、形態素解析結果として、単語列“May/EAV I/EP1 try/EVE this/EP3 on/ED3”が出力される（ステップＳ７０２）。また、この単語列から、直示表現のパターン“*/EP3”と一致する“this/EP3”が直示表現として検出され（ステップＳ７０４：ＹＥＳ）、商品８０２に付されたＲＦＩＤタグから指示対象検出部１１１が検出した固有情報８０３（“shoes#123456789”）と対応づけられる（ステップＳ７０５）。

意味クラス情報記憶部１２２に図３に示すような情報が登録されていた場合、固有情報８０３に対応する意味クラスとして“c#shoes”が取得される（ステップＳ７０６）。これにより、“try on”の目的語が意味クラス“c#shoes”を有する単語であるとして翻訳を行うことができる。すなわち、図５に示すような翻訳規則を参照し、“try on”の日本語訳として日本語５０３（“履いてみる”）を選択することができる（ステップＳ７１０）。

このような過程を模式的に示したのが図８の処理過程８０４である。処理過程８０４の上部は、指示対象の固有情報“shoes#123456789”から、指示対象が意味クラス“c#shoes”を有する対象物であると判断したことを示している。また、処理過程８０４の下部は、“try this on”がtry shoes on”を意味することから、日本語訳として日本語８０５（“を履いてみる”）が選択されたことを示している。

この結果、出力制御部１０７は、翻訳の目的言語である日本語の音声により、日本語８０６（“これを履いてみてもよいですか”）を出力する（ステップＳ７１１）。

上述の例では直示表現を目的語とする単語を翻訳する場合の例を記載したが、“これが動くと”のように直示表現が主語となる関係（主語-動詞の関係）や、“これの色”のように直示表現が名詞となる関係（名詞-属性の関係）など、直示表現と文法的または意味的に依存関係にある単語を翻訳する場合にも本提案の手法を適用することができる。

また、英日翻訳における動詞の訳し分けを示す例であったが、言語対や品詞はこれに限られるものではなく、他の言語対や他の品詞に対しても適用できる。図９は、日中翻訳、または、名詞を訳し分ける日英翻訳に適用した場合に処理されるデータの一例を示す説明図である。

例えば、日中翻訳では、日本語Ｊ９０１（“これを飲むと元気になるよ”）を直示表現の意味クラスを判別せずに翻訳すると、一般に中国語Ｃ９０２となる。すなわち、日本語の単語Ｊ９０３（“飲む”）の訳語として、標準の訳語である中国語の単語Ｃ９０４が出力される。しかし、この訳語は、指示対象が酒を意味するものであれば適切な訳語であるが、指示対象が薬を意味するものであれば適切な訳語ではない。

本実施の形態の機械翻訳装置１００によれば、指示対象の意味クラスが酒（c#liqueur）であるか、薬（c#medicine）であるかを判別することができる。そして、図５に示すような翻訳規則が翻訳規則記憶部１２４に記憶されていた場合であれば、意味クラスに応じて適切な中国語の訳語を選択することができる。上述の例では、指示対象が薬であれば、日本語の単語Ｊ９０３に対する適切な訳語として、図５の中国語５０４を選択することができる。

名詞の訳し分けについては、以下のような日英翻訳を例として説明する。日本語では、縁があるか否かによって区別しないため、英語の“hat”および“cap”の両方を意味する単語として日本語Ｊ９０５（“帽子”）が存在する。従って、日本語Ｊ９０５が含まれる日本語の直示表現Ｊ９０６（“その帽子”）を、縁があるか否かによって“the hat"か”the cap"に訳し分けなければならない。

本実施の形態の機械翻訳装置１００によれば、指示対象の意味クラスが縁あり帽子（c#hat）であるか、縁なし帽子（c#cap）であるかを判別することができる。そして、図５に示すような翻訳規則が翻訳規則記憶部１２４に記憶されていた場合であれば、意味クラスに応じて適切な英語の訳語を選択することができる。上述の例では、指示対象が縁あり帽子であれば、日本語の直示表現Ｊ９０６に対する適切な訳語として、図５の英語５０５（“hat”）を選択することができる。

このように、第１の実施の形態にかかる機械翻訳装置１００では、利用者が指し示した対象に埋め込まれた情報を検出し、入力された音声に含まれる直示表現の指示対象として同定することができるため、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことができる。

現在、ユビキタス環境の整備は急ピッチで進んでおり、さまざまな製品等に固有情報が埋め込まれるようになっている。本実施の形態では、このようなユビキタス環境を利用して対象物の固有情報を特定し、入力された発話内の直示表現の指示対象を同定することができる。従って、先行する発話からの指示対象の推定等を行う必要がなく、翻訳品質を高めることができる。

また、開発コストおよび処理コストが高く、精度的にも十分でない照応参照等の文脈処理を回避できるので、低コスト・高品質な機械翻訳装置を実現することができる。さらに、指示対象を誤って同定する可能性が低いため、誤った翻訳規則の適用により誤訳が生じる可能性を低減することができる。この結果、幅広い使用環境で適切な訳し分けを実現する機械翻訳装置を提供することが可能になる。

（第２の実施の形態）
第２の実施の形態にかかる機械翻訳装置は、検出した指示対象の意味クラスを、ネットワークに接続された外部のサーバ装置から取得し、翻訳の際に利用するものである。

図１０は、第２の実施の形態にかかる機械翻訳装置１０００の構成を示すブロック図である。同図に示すように、機械翻訳装置１０００は、指示対象検出部１１１と、通信部１０１２と、直示表現パターン記憶部１２１と、意味クラス階層記憶部１２３と、翻訳規則記憶部１２４と、入力受付部１０１と、単語分割部１０２と、直示表現検出部１０３と、指示対象同定部１０４と、意味クラス決定部１００５と、翻訳部１０６と、出力制御部１０７とを備えている。

第２の実施の形態では、通信部１０１２を追加したこと、意味クラス情報記憶部１２２を削除したこと、および、意味クラス決定部１００５の機能が第１の実施の形態と異なっている。その他の構成および機能は、第１の実施の形態にかかる機械翻訳装置１００の構成を表すブロック図である図１と同様であるので、同一符号を付し、ここでの説明は省略する。

通信部１０１２は、インターネット等のネットワークを介して意味クラス管理サーバ１０５０と情報の送受信を行うものである。なお、ネットワークはインターネットに限られるものではなく、一般的に利用されているあらゆるネットワーク形態により構成することができる。

意味クラス管理サーバ１０５０は、第１の実施の形態における図３で示したような意味クラス情報を管理し、受信した対象物の固有情報に対応する意味クラスを取得し、要求元に返信する機能を有するものである。例えば、ＳＯＡＰ（Simple Object Access Protocol）等のプロトコールにより実現されたＷｅｂサービスとしてこのような機能を実現することができる。

このように、本実施の形態では、指示対象検出部１１１が検出した指示対象の意味クラスを取得する際に、外部システムで管理された意味クラスの情報を参照することができるため、自装置内に意味クラスを保存する必要がなくなるという利点がある。特に、ユビキタス環境では膨大な数の製品等の情報を管理する必要が生じるため、情報管理コストの削減の効果が大きい。

なお、翻訳時に毎回、意味クラス管理サーバ１０５０に意味クラスの問い合わせを行うのではなく、定期的に一括して意味クラス情報を意味クラス管理サーバ１０５０から読込み、読込んだ情報を参照して意味クラスを決定するように構成してもよい。これにより、通常の音声対話翻訳で使用する際の情報の送受信にかかる処理負荷を軽減することができる。

意味クラス決定部１００５は、指示対象検出部１１１が検出した指示対象の固有情報を、通信部１０１２を介して意味クラス管理サーバ１０５０に送信し、送信した固有情報に対して意味クラス管理サーバ１０５０が返信した意味クラスを、通信部１０１２を介して取得し、取得した意味クラスを指示対象の意味クラスとして決定するものである。

なお、一括して意味クラス情報を意味クラス管理サーバ１０５０から読込む構成の場合は、第１の実施の形態と同様に意味クラス情報記憶部１２２を備え、意味クラス決定部１００５は意味クラス情報記憶部１２２を参照することにより意味クラスを決定する。

次に、このように構成された第２の実施の形態にかかる機械翻訳装置１０００による機械翻訳処理について説明する。図１１は、第２の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。

ステップＳ１１０１からステップＳ１１０５までの、入力受付処理、単語分割処理、直示表現検出処理、指示対象同定処理は、第１の実施の形態にかかる機械翻訳装置１００におけるステップＳ７０１からステップＳ７０５までと同様の処理なので、その説明を省略する。

ステップＳ１１０５で指示対象同定部１０４が指示対象を同定した後、意味クラス決定部１００５は、通信部１０１２を介して指示対象に対応する意味クラスを意味クラス管理サーバ１０５０から取得する（ステップＳ１１０６）。具体的には、指示対象検出部１１１が検出した指示対象の固有情報を意味クラス管理サーバ１０５０に送信し、返信された意味クラスを取得する。

ステップＳ１１０７からステップＳ１１１１までの意味クラスの整合性チェック処理、翻訳処理、出力処理は、第１の実施の形態にかかる機械翻訳装置１００におけるステップＳ７０７からステップＳ７１１までと同様の処理なので、その説明を省略する。

このように、第２の実施の形態にかかる機械翻訳装置では、検出した指示対象の意味クラスを、ネットワークに接続された外部のサーバ装置から取得し、翻訳の際に利用することができる。このため、自装置内の記憶容量が制限される携帯型の機械翻訳装置であっても適切に意味クラスを取得し、高精度に翻訳を行うことができる。また、サーバ装置で情報を一元管理できるため、機械翻訳装置での更新が不要となり、常に最新の情報を利用することが可能となる。

（第３の実施の形態）
第３の実施の形態にかかる機械翻訳装置は、検出した指示対象までの距離が、入力音声に含まれる直示表現が表す距離の範囲内に含まれるか否かを判断し、含まれる場合に直示表現の指示対象として同定するものである。

図１２は、第３の実施の形態にかかる機械翻訳装置１２００の構成を示すブロック図である。同図に示すように、機械翻訳装置１２００は、指示対象検出部１２１１と、直示表現パターン記憶部１２１と、意味クラス階層記憶部１２３と、翻訳規則記憶部１２４と、距離属性記憶部１２２５と、入力受付部１０１と、単語分割部１０２と、直示表現検出部１０３と、指示対象同定部１２０４と、意味クラス決定部１２０５と、翻訳部１０６と、出力制御部１０７とを備えている。

第３の実施の形態では、距離属性記憶部１２２５を追加したこと、意味クラス情報記憶部１２２を削除したこと、指示対象検出部１２１１の機能、指示対象同定部１２０４の機能および意味クラス決定部１２０５の機能が第１の実施の形態と異なっている。その他の構成および機能は、第１の実施の形態にかかる機械翻訳装置１００の構成を表すブロック図である図１と同様であるので、同一符号を付し、ここでの説明は省略する。

距離属性記憶部１２２５は、直示表現が表す対象までの距離の範囲の情報を含む距離属性を記憶するものであり、ＨＤＤ、光ディスク、メモリカードなどの一般的に利用されているあらゆる記憶媒体により構成することができる。

一般に、直示表現となる指示詞は、近称、中称、遠称などと呼ばれる距離の属性を有している。近称とは、発話者のすぐ近くに存在する対象物を指し示すものをいい、日本語の“これ”や英語の”this"などが該当する。また、遠称とは、発話者からやや離れた位置に存在する対象物を指し示すものをいい、日本語の“あれ”や英語の“that”などが該当する。中称とは、近称と遠称の中間程度の距離に存在するものをいい、日本語の“それ”などが該当する。

本実施の形態では、このような距離の属性を距離属性記憶部１２２５に記憶し、指示対象を同定する際に参照して、検出した指示対象までの実際の距離が、直示表現が示す距離の範囲に含まれる場合に、正しい指示対象が検出できたものとして処理を行う。

図１３は、距離属性記憶部１２２５に記憶された距離属性のデータ構造の一例を示す説明図である。同図に示すように、距離属性記憶部１２２５は、直示表現と、当該直示表現が示す距離属性とを対応づけて格納している。距離属性としては、例えば、同図に示すように直示表現が表す距離の範囲を数値により指定する。

同図に示す例では、日本語および英語の直示表現だけを示したが、日本語以外のあらゆる言語の直示表現の距離属性を格納するように構成してもよい。また、複数の直示表現で距離の範囲が重なるような値を設定してもよい。

指示対象検出部１２１１は、撮像部１２１１ａと、画像認識部１２１１ｂとを備えている。撮像部１２１１ａは、ＣＣＤカメラなどの撮像装置であり、利用者は撮像部１２１１ａにより対象物を含む画像を撮像することができる。なお、本実施の形態では、画像情報を参照して自装置から対象物までの距離を検出するため、撮像部１２１１ａは２台のカメラでステレオ視により対象物を撮像する。

画像認識部１２１１ｂは、画像認識技術によって、撮像部１２１１ａが撮像した対象物を特定するものである。ここで用いる画像認識技術は、パターン認識を利用した画像からの物体認識などの従来から用いられているあらゆる方法を適用することができる。

画像認識部１２１１ｂは、画像認識処理によって対象物の種別を判別することができるため、その時点で対象物に意味クラスを付与することができる。従って、本実施の形態では、第１の実施の形態のように、意味クラス情報記憶部１２２を参照して指示対象の意味クラスを取得する必要がない。

また、画像認識部１２１１ｂは、２台のカメラで撮像された画像情報を基に、従来から用いられているステレオ画像処理技術により、対象物までの距離を検出する。これにより、対象物までの距離と、直示表現が表す距離の範囲との整合性の確認を行うことが可能となる。

なお、撮像部１２１１ａを１台のカメラで構成し、ミリ波レーダー、レーザレーダーなどの別途設けられた距離計測装置により対象物までの距離を検出するように構成してもよい。

指示対象同定部１２０４は、画像認識部１２１１ｂが認識した指示対象の情報と、直示表現検出部１０３が検出した直示表現とを対応づけることにより、入力された原言語文中の直示表現が指し示す対象を同定するものである。

この際、指示対象同定部１２０４は、距離属性記憶部１２２５を参照し、直示表現検出部１０３が検出した直示表現が表す距離の範囲に、画像認識部１２１１ｂが認識した対象物までの距離が含まれるか否かを判定し、含まれる場合にのみ、直示表現に認識した対象物を対応づける。直示表現が表す距離の範囲に、対象物までの距離が含まれない場合は、画像認識部１２１１ｂが再度認識処理を行い、距離の範囲に含まれるまで処理を繰り返す。

意味クラス決定部１２０５は、画像認識部１２１１ｂが認識した対象物の意味クラスと、形態素解析時に取得した指示対象の意味クラスとの整合性をチェックする。これにより、画像認識部１２１１ｂが指示対象を誤検出した場合であっても、誤った意味クラスにより誤った訳語を選択することを回避できる。

次に、このように構成された第３の実施の形態にかかる機械翻訳装置１２００による機械翻訳処理について説明する。図１４は、第３の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。

ステップＳ１４０１からステップＳ１４０４までの、入力受付処理、単語分割処理、直示表現検出処理は、第１の実施の形態にかかる機械翻訳装置１００におけるステップＳ７０１からステップＳ７０４までと同様の処理なので、その説明を省略する。

ステップＳ１４０４で直示表現が検出された場合（ステップＳ１４０４：ＹＥＳ）、画像認識部１２１１ｂが、撮像部１２１１ａにより撮像された画像から指示対象を認識する（ステップＳ１４０５）。同時に、指示対象の意味クラスが付与され、指示対象までの距離が検出される。

次に、指示対象同定部１２０４が、画像認識部１２１１ｂが認識した指示対象と、直示表現検出部１０３が検出した直示表現とを対応づけることにより、指示対象を同定する（ステップＳ１４０６）。

次に、指示対象同定部１２０４が、画像認識部１２１１ｂが検出した指示対象までの距離が、直示表現の距離属性の示す範囲に含まれるか否かを判断する（ステップＳ１４０７）。例えば、直示表現が“this”であり、画像認識部１２１１ｂにより対象物までの距離が３ｍであると認識された場合、図１３に示すような距離属性が定義されていたとすると、“this”が示す範囲１ｍに、認識した距離３ｍが含まれないと判断される。

指示対象までの距離が直示表現の距離属性の示す範囲に含まれないと判断した場合は（ステップＳ１４０７：ＮＯ）、画像認識部１２１１ｂが再度指示対象の認識処理を行い、処理を繰り返す（ステップＳ１４０５）。

指示対象までの距離が直示表現の距離属性の示す範囲に含まれると判断した場合は（ステップＳ１４０７：ＹＥＳ）、意味クラス決定部１２０５が、画像認識部１２１１ｂが認識した指示対象の意味クラスを取得する（ステップＳ１４０８）。

ステップＳ１４０９からステップＳ１４１３までの、意味クラス決定処理、翻訳処理、出力処理は、第１の実施の形態にかかる機械翻訳装置１００におけるステップＳ７０７からステップＳ７１１までと同様の処理なので、その説明を省略する。

このように、第３の実施の形態にかかる機械翻訳装置では、検出した指示対象までの距離が、入力音声に含まれる直示表現が表す距離の範囲内に含まれるか否かを判断し、含まれる場合にのみ直示表現の指示対象として同定することができる。このため、指示対象を誤検出した場合であっても誤って翻訳する可能性を低減することができる。

（第４の実施の形態）
第４の実施の形態にかかる機械翻訳装置は、ＧＰＳ機能により指示対象が存在する地点の位置情報を取得し、取得した位置情報を指示対象の固有情報として取得するものである。

図１５は、第４の実施の形態にかかる機械翻訳装置１５００の構成を示すブロック図である。同図に示すように、機械翻訳装置１５００は、指示対象検出部１５１１と、通信部１５１２と、直示表現パターン記憶部１２１と、意味クラス階層記憶部１２３と、翻訳規則記憶部１２４と、入力受付部１０１と、単語分割部１０２と、直示表現検出部１０３と、意味クラス決定部１５０５と、翻訳部１０６と、出力制御部１０７とを備えている。

第４の実施の形態では、指示対象検出部１５１１、通信部１５１２および意味クラス決定部１５０５の機能が第２の実施の形態と異なっている。また、指示対象同定部１０４を削除したことが、第２の実施の形態と異なっている。その他の構成および機能は、第２の実施の形態にかかる機械翻訳装置１０００の構成を表すブロック図である図１０と同様であるので、同一符号を付し、ここでの説明は省略する。

指示対象検出部１５１１は、ＧＰＳ受信機能により自装置が存在する位置を認識する位置情報受信部１５１１ａを備えている。自装置が存在する位置の情報には、自装置の緯度および経度の情報を含む。

通信部１５１２は、インターネット等のネットワークを介して位置情報管理サーバ１５６０との間で情報の送受信を行うものである。

位置情報管理サーバ１５６０は、ネットワークに接続され、緯度および経度の情報を含む位置情報が示す位置に存在する店舗の店舗情報などの当該位置に関する情報を返信する機能を有するものである。

意味クラス決定部１５０５は、位置情報受信部１５１１ａにより受信した自装置の緯度・経度を含む位置情報を位置情報管理サーバ１５６０に送信し、送信した位置情報に対して位置情報管理サーバ１５６０が返信した位置に関する情報を、通信部１５１２を介して取得し、取得した位置に関する情報から直示表現の意味クラスを決定するものである。

具体的には、例えば、位置情報管理サーバ１５６０から現在位置が靴屋であることを示す情報が返信された場合、意味クラス決定部１５０５は、利用者が発話した原言語文に含まれる直示表現の表す意味クラスは“c#shoes”であると推定する。

このように、本実施の形態では、指示対象の情報を直接取得することができない場合であっても、ＧＰＳ受信機能などにより指示対象が存在する場所の位置に関する情報を取得し、取得した位置に関する情報を参照して直示表現が指し示す対象の意味クラスを推定することができる。これにより、直示表現をそのまま翻訳する場合に比較して、より適切な訳語を選択することが可能となる。

次に、このように構成された第４の実施の形態にかかる機械翻訳装置１５００による機械翻訳処理について説明する。図１６は、第４の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。

ステップＳ１６０１からステップＳ１６０４までの、入力受付処理、単語分割処理、直示表現検出処理は、第２の実施の形態にかかる機械翻訳装置１０００におけるステップＳ１１０１からステップＳ１１０４までと同様の処理なので、その説明を省略する。

ステップＳ１６０４で直示表現が検出された場合（ステップＳ１６０４：ＹＥＳ）、意味クラス決定部１５０５が、位置情報受信部１５１１ａが受信した緯度・経度に対応する位置に関する情報を、通信部１５１２を介して位置情報管理サーバ１５６０から受信する（ステップＳ１６０５）。

次に、意味クラス決定部１５０５が、受信した位置に関する情報から直示表現の意味クラスを決定する（ステップＳ１６０６）。具体的には、例えば、店舗情報と、意味クラスとを対応づけた情報を記憶部（図示せず）に記憶し、この情報を参照して、受信した店舗情報に対する意味クラスを取得して、直示表現の意味クラスとして決定する。

また、位置情報管理サーバ１５６０から返信される位置に関する情報内に、意味クラスを含めるように構成してもよい。この場合、意味クラス決定部１５０５は、受信した位置に関する情報から意味クラスを抽出して、直示表現の意味クラスとして決定する。

ステップＳ１６０７からステップＳ１６０９までの、翻訳処理、出力処理は、第２の実施の形態にかかる機械翻訳装置１０００におけるステップＳ１１０９からステップＳ１１１１までと同様の処理なので、その説明を省略する。

このように、第４の実施の形態にかかる機械翻訳装置では、ＧＰＳ機能により取得した位置情報を参照して指示対象の意味クラスを決定することができる。このため、指示対象を特定できない場合であっても、意味クラスに応じて直示表現に対する適切な訳語を選択することができ、さまざまな状況で入力された原言語文に対して高精度に翻訳を行うことが可能となる。

なお、第１〜第４の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、ＲＯＭ（Read Only Memory）等に予め組み込まれて提供される。

第１〜第４の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、インストール可能な形式又は実行可能な形式のファイルでＣＤ−ＲＯＭ（Compact Disk Read Only Memory）、フレキシブルディスク（ＦＤ）、ＣＤ−Ｒ（Compact Disk Recordable）、ＤＶＤ（Digital Versatile Disk）等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。

さらに、第１〜第４の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第１〜第４の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。

第１〜第４の実施の形態にかかる機械翻訳装置で実行される機械翻訳プログラムは、上述した各部（入力受付部、単語分割部、直示表現検出部、指示対象同定部、意味クラス決定部、翻訳部、出力制御部）を含むモジュール構成となっており、実際のハードウェアとしてはＣＰＵ（Central Processing Unit）が上記ＲＯＭから機械翻訳プログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、各部が主記憶装置上に生成されるようになっている。

以上のように、本発明にかかる機械翻訳装置、機械翻訳方法および機械翻訳プログラムは、直示表現を含む入力文に対して適切な訳し分けを実現する機械翻訳装置に適している。

第１の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。直示表現パターン記憶部に格納される直示表現のデータ構造の一例を示す説明図である。意味クラス情報記憶部に格納される意味クラス情報のデータ構造の一例を示す説明図である。意味クラス階層記憶部に格納される意味クラス間の階層関係のデータ構造の一例を示す説明図である。翻訳規則記憶部に格納される翻訳規則のデータ構造の一例を示す説明図である。依存構造解析結果のデータ構造の一例を示す説明図である。第１の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。機械翻訳処理で処理される情報の一例を示した説明図である。日中翻訳、または、名詞を訳し分ける日英翻訳に適用した場合に処理されるデータの一例を示す説明図である。第２の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。第２の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。第３の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。距離属性記憶部に記憶された距離属性のデータ構造の一例を示す説明図である。第３の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。第４の実施の形態にかかる機械翻訳装置の構成を示すブロック図である。第４の実施の形態における機械翻訳処理の全体の流れを示すフローチャートである。

符号の説明

１００、１０００、１２００、１５００機械翻訳装置
１０１入力受付部
１０２単語分割部
１０３直示表現検出部
１０４指示対象同定部
１０５意味クラス決定部
１０６翻訳部
１０７出力制御部
１１１指示対象検出部
１２１直示表現パターン記憶部
１２２意味クラス情報記憶部
１２３意味クラス階層記憶部
１２４翻訳規則記憶部
５０１条件部
５０２アクション部
５０３日本語
５０４中国語
５０５英語
６０１意味クラス
８０１原言語文
８０２商品
８０３固有情報
８０４処理過程
８０５日本語
８０６日本語
Ｊ９０１日本語
Ｃ９０２中国語
Ｊ９０３単語
Ｃ９０４単語
Ｊ９０５日本語
Ｊ９０６直示表現
１００５意味クラス決定部
１０１２通信部
１０５０意味クラス管理サーバ
１２０４指示対象同定部
１２０５意味クラス決定部
１２１１ａ撮像部
１２１１ｂ画像認識部
１２１１指示対象検出部
１２２５距離属性記憶部
１５０５意味クラス決定部
１５１１指示対象検出部
１５１１ａ位置情報受信部
１５１２通信部
１５６０位置情報管理サーバ

Claims

指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段と、
原言語文を受付ける受付手段と、
前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、
前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、
前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける対応づけ手段と、
前記直示表現に対して前記対応づけ手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、
前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、
を備えたことを特徴とする機械翻訳装置。
前記指示対象検出手段は、前記意味クラスを含む前記固有情報を検出し、
前記意味クラス決定手段は、前記固有情報に含まれる前記意味クラスを取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項１に記載の機械翻訳装置。
前記指示対象物を一意に識別する識別子と、前記指示対象物の前記意味クラスとを対応づけた意味クラス情報を記憶する意味クラス情報記憶手段をさらに備え、
前記指示対象検出手段は、前記識別子を含む前記固有情報を検出し、
前記意味クラス決定手段は、前記固有情報に含まれる前記識別子に対応する前記意味クラスを前記意味クラス情報記憶手段から取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項１に記載の機械翻訳装置。
ネットワークに接続され、前記指示対象物を一意に識別する識別子に対応する前記意味クラスを返信する意味クラス管理サーバに対して、前記識別子を送信し、前記意味クラス管理サーバから返信された前記意味クラスを受信する通信手段をさらに備え、
前記指示対象検出手段は、前記識別子を含む前記固有情報を検出し、
前記意味クラス決定手段は、前記通信手段を介して前記識別子を前記意味クラス管理サーバに送信し、送信した前記識別子に対して前記意味クラス管理サーバが返信した前記意味クラスを、前記通信手段を介して取得し、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項１に記載の機械翻訳装置。
複数の前記意味クラス間の階層関係を記憶する意味クラス階層記憶手段をさらに備え、
前記意味クラス決定手段は、前記意味クラス階層記憶手段を参照し、取得した前記意味クラスが前記直示表現に含まれる単語の前記意味クラスに含まれるか否かを判断し、含まれると判断した場合に、取得した前記意味クラスを前記指示対象物の前記意味クラスとして決定することを特徴とする請求項２〜４のいずれか１つに記載の機械翻訳装置。
前記対応づけ手段は、前記意味クラス決定手段が前記意味クラス階層記憶手段を参照して、取得した前記意味クラスが前記直示表現に含まれる単語の前記意味クラスに含まれないと判断した場合に、前記指示対象検出手段が再度検出した前記指示対象物に対して、前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づけることを特徴とする請求項５に記載の機械翻訳装置。
前記直示表現と、前記直示表現が表す対象までの距離の範囲の情報を含む距離属性とを対応づけて記憶した距離属性記憶手段をさらに備え、
前記対応づけ手段は、前記直示表現検出手段が検出した前記直示表現に対応づけられた前記距離属性を前記距離属性記憶手段から取得し、取得した前記距離属性に含まれる前記距離の範囲に、前記指示対象検出手段から前記指示対象物までの距離が含まれるか否かを判断し、含まれると判断した場合に、前記指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づけることを特徴とする請求項１に記載の機械翻訳装置。
前記対応づけ手段は、取得した前記距離属性に含まれる前記距離の範囲に前記指示対象検出手段から前記指示対象物までの距離が含まれないと判断した場合に、前記指示対象検出手段が再度検出した前記指示対象物に対して、取得した前記距離属性に含まれる前記距離の範囲に前記指示対象検出手段から前記指示対象物までの距離が含まれるか否かを判断することを特徴とする請求項７に記載の機械翻訳装置。
原言語による単語と、該単語の前記意味クラスごとに予め定められた目的言語による単語とを対応づけた翻訳規則を記憶する翻訳規則記憶手段をさらに備え、
前記翻訳手段は、前記直示表現に含まれる単語に対し、前記意味クラス決定手段が決定した前記意味クラスについて予め定められた目的言語による単語を前記翻訳規則記憶手段から取得し、取得した目的言語による単語を、前記直示表現に含まれる単語の訳語として翻訳を行うことを特徴とする請求項１に記載の機械翻訳装置。
原言語による単語と、該単語と文法的または意味的に依存関係にある単語の前記意味クラスごとに予め定められた目的言語による単語とを対応づけた翻訳規則を記憶する翻訳規則記憶手段をさらに備え、
前記翻訳手段は、前記直示表現と文法的または意味的に依存関係にある単語に対し、前記意味クラス決定手段が決定した前記意味クラスについて予め定められた目的言語による単語を前記翻訳規則記憶手段から取得し、取得した目的言語による単語を、前記直示表現と文法的または意味的に依存関係にある単語の訳語として翻訳を行うことを特徴とする請求項１に記載の機械翻訳装置。
前記指示対象検出手段は、前記指示対象物に付された非接触ＩＣタグから前記固有情報を検出することを特徴とする請求項１に記載の機械翻訳装置。
前記指示対象検出手段は、前記指示対象物に付されたバーコードから前記固有情報を検出することを特徴とする請求項１に記載の機械翻訳装置。
前記指示対象検出手段は、
前記指示対象物の画像を撮像する撮像手段と、
前記撮像手段が撮像した画像を解析して前記指示対象物の前記意味クラスを含む前記指示対象物の固有情報を取得する画像認識手段と、
を備えたことを特徴とする請求項１に記載の機械翻訳装置。
前記指示対象検出手段は、前記指示対象物が存在する緯度および経度の情報を含む位置情報を受信し、受信した前記位置情報を前記固有情報として検出することを特徴とする請求項１に記載の機械翻訳装置。
ネットワークに接続され、前記位置情報に対応する位置に関する情報を返信する位置情報管理サーバに対して、前記位置情報を送信し、前記位置情報管理サーバから返信された前記位置に関する情報を受信する通信手段をさらに備え、
前記意味クラス決定手段は、前記通信手段を介して前記位置情報を前記位置情報管理サーバに送信し、送信した前記位置情報に対して前記位置情報管理サーバが返信した前記位置に関する情報を、前記通信手段を介して取得し、取得した前記位置に関する情報に基づき、前記意味クラスを決定することを特徴とする請求項１４に記載の機械翻訳装置。
受付手段が、原言語文を受付ける入力受付ステップと、
単語分割手段が、前記入力受付ステップが受付けた前記原言語文を形態素解析して単語に分割する単語分割ステップと、
直示表現検出手段が、前記単語分割ステップが分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出ステップと、
指示対象同定手段が、指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段が検出した前記固有情報と、前記直示表現検出ステップが検出した前記直示表現とを対応づける指示対象同定ステップと、
意味クラス決定手段が、前記直示表現に対して前記指示対象同定ステップが対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定ステップと、
翻訳手段が、前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳ステップと、
を備えたことを特徴とする機械翻訳方法。
コンピュータを、
原言語文を受付ける受付手段と、
前記受付手段が受付けた前記原言語文を形態素解析して単語に分割する単語分割手段と、
前記単語分割手段が分割した単語から、対象を直接指示する表現である直示表現を検出する直示表現検出手段と、
指示対象物から前記指示対象物の固有情報を検出する指示対象検出手段が検出した前記固有情報と、前記直示表現検出手段が検出した前記直示表現とを対応づける指示対象同定手段と、
前記直示表現に対して前記指示対象同定手段が対応づけた前記固有情報に基づき、前記指示対象物の意味属性を表す意味クラスを決定する意味クラス決定手段と、
前記意味クラスが前記直示表現に付与された前記原言語文を翻訳する翻訳手段と、
として機能させるための機械翻訳プログラム。