JP6144458B2 - 手話翻訳装置及び手話翻訳プログラム - Google Patents

手話翻訳装置及び手話翻訳プログラム Download PDF

Info

Publication number
JP6144458B2
JP6144458B2 JP2012049373A JP2012049373A JP6144458B2 JP 6144458 B2 JP6144458 B2 JP 6144458B2 JP 2012049373 A JP2012049373 A JP 2012049373A JP 2012049373 A JP2012049373 A JP 2012049373A JP 6144458 B2 JP6144458 B2 JP 6144458B2
Authority
JP
Japan
Prior art keywords
translation
sign language
word
statistical
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012049373A
Other languages
English (en)
Other versions
JP2013186189A (ja
Inventor
太郎 宮▲崎▼
太郎 宮▲崎▼
加藤 直人
直人 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2012049373A priority Critical patent/JP6144458B2/ja
Publication of JP2013186189A publication Critical patent/JP2013186189A/ja
Application granted granted Critical
Publication of JP6144458B2 publication Critical patent/JP6144458B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

本発明は、手話翻訳装置及び手話翻訳プログラムに係り、特に、高精度な手話翻訳を実現するための手話翻訳装置及び手話翻訳プログラムに関する。
従来では、原始言語から目的の用途に対応させて様々な目的言語等に翻訳する手法が知られている(例えば、特許文献1及び特許文献2参照)。
ここで、特許文献1に示されている手法では、辞書に登録がない場合でも翻字処理によって外国語の単語からカタカナの単語を生成することで、外国語から日本語へ機械翻訳する際の翻訳率を向上させている。また、特許文献2に示されている手法では、発音ベース及び綴りベースの翻字モデルを使用して名前付きエンティティの原始言語から目的言語へのポテンシャル翻訳を作成し、その目的言語の一言語資源を使用頻度に関する情報についてサーチし、次いで使用頻度に基づいて少なくとも1つのポテンシャル翻訳を含む出力を提供している。
また、最近では、目的言語の一つとして手話への翻訳が注目されている。手話は、聴覚障害者にとって重要なコミュニケーション手段である。特に、先天的或いは幼少期に聴覚を失った人にとって、手話は第一言語であり日本語よりも理解しやすい。そのため、日本語の文字より手話での情報を提示した方が好ましいとされている。なお、手話は、CG(Computer Graphics)等の映像を用いて提示されるのが好ましい。そのため、原始言語から手話に翻訳する際には、最初に原始言語から手話単語列を変換し、変換した手話単語列から各単語に対応するCGを抽出し、抽出したCGを連結して手話映像を生成する。
特開2005−92682号公報 特表2005−520251号公報
ここで、例えば日本語から手話に翻訳する場合、手話における固有名詞の翻訳では、読み仮名を使う場合が少なく、漢字1文字に手話単語一つが対応する「漢字手話」の手法が多く用いられる。例えば、「長崎」を手話に翻訳する場合には、「{長い}{崎}」という2つの手話単語を使って表される。なお、上述の{}は、手話の単語の表記(手話単語の日本語ラベル)を示し、以下も同様とする。また、日本語ラベルとは、手話単語の表す意味に近い日本語を利用したもので「米川明彦(監修),"新日本語−手話辞典",日本手話研究所(編),(財)全日本聾唖連盟出版局,2006.」に準拠している。
しかしながら、このような翻訳方法は、従来の手法で翻訳することが難しい。例えば、機械翻訳で多く用いられる統計的翻訳手法を用いる場合には、日本語の単語と手話の単語との対応は学習することができるが、日本語の文字と手話の単語との対応を学習することは難しい。例えば、従来では、「長野」(手話では{長い}{ノ}と表される)と「宮崎」(手話では{宮}{崎}と表される)を学習しても「長」と「崎」のそれぞれの字については学習ができないため、結果として「長崎」は翻訳できない。
また、従来の統計的翻訳手法では、学習データとなる対訳の量が翻訳精度に大きな影響を与えるが「日本語−手話」の対訳は,例えば「日本語−英語」の対訳と比べてはるかに少ない。そのため、「日本語−手話」翻訳においては、統計的翻訳手法を用いて高い翻訳精度を得ることが難しい。
本発明は、上述した問題点に鑑みなされたものであり、高精度な手話翻訳を実現するための手話翻訳装置及び手話翻訳プログラムを提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
本発明は、日本語の固有名詞である入力データに対する手話翻訳を行う手話翻訳装置において、前記入力データを所定の文字毎に分割する文字分割手段と、前記文字分割手段により得られる文字毎に、予め設定された統計的翻訳モデルを参照し、翻訳された文字と、翻訳できなかった未知語とを分類する統計的翻訳手段と、手話単語辞書に登録された単語のうち、前記統計的翻訳手段により分類された前記未知語に対して最長一致する単語を出力する最長一致文字分割手段と、前記最長一致文字分割手段により得られる単語の文字に対して、予め設定されたルールに基づく翻訳を行うルールベース翻訳手段と、前記統計的翻訳手段により得られる翻訳結果と、前記ルールベース翻訳手段により得られる翻訳結果とを、前記入力データに対応させて合成する翻訳結果合成手段とを有し、前記統計的翻訳手段は、前記統計的翻訳モデルを参照した結果、入力される文字に対応する翻訳結果が複数ある場合に、前記統計的翻訳モデルの翻訳結果毎に設けられたスコアに基づいて、所定の翻訳結果を出力することを特徴とする。


また、本発明は、コンピュータを、上述した手話翻訳装置として機能させることを特徴とする手話翻訳プログラムである。
なお、本発明の構成要素、表現又は構成要素の任意の組み合わせを、方法、装置、システム、コンピュータプログラム、記録媒体、データ構造等に適用したものも本発明の態様として有効である。
本発明によれば、高精度な手話翻訳を実現することができる。
第1実施形態における手話翻訳装置の機能構成の一例を示す図である。 第1実施形態における手話翻訳処理手順の一例を示すフローチャートである。 スコア化された統計的翻訳モデルの一例を示す図である。 第2実施形態における手話翻訳装置の機能構成の一例を示す図である。 第2実施形態における手話翻訳処理手順の一例を示すフローチャートである。 ルールベース翻訳処理手順の一例を示すフローチャートである。 手話単語辞書の具体例を示す図である。 第3実施形態における手話翻訳装置の機能構成の一例を示す図である。 第3実施形態における手話翻訳処理手順の一例を示すフローチャートである。 第1〜第3実施形態における手話翻訳の実行結果の比較例を示す図である。
<本発明について>
本発明は、例えば原始言語の一例である日本語を、目的言語の一例である自然な手話に翻訳するために、統計的手法又はルールベース手法、或いはその両方を併用した手法を用いて、例えば対訳に出現しない日本語に対しても高精度な漢字手話に翻訳することを可能にする。
ここで、日本手話における固有名詞の翻訳方法は、「1.固定訳」、「2.漢字手話による訳」、「3.指文字による訳」、「4.漢字手話と指文字の組み合わせによる訳」の4種類に分類できる。以下に、各分類について説明する。
<1.固定訳>
固定訳とは、その固有名詞を表す手話単語がすでに決まっている場合の翻訳を意味する。例えば、「広島」は、手話では厳島神社の鳥居の様子を手指動作で表現することによって表す。また、固定訳は、その地の特徴,特産物や市のシンボル等が用いられることが多い。また、固定訳は、非常に特徴的な表現であるため、確実に意味を伝えることができ、また簡潔に表現できるため、優先して使われることが多い。しかしながら、固定訳が決まっていない固有名詞が多く、決まっていてもその地域でしか通用しないものもある。
<2.漢字手話による訳>
漢字手話による訳は、固有名詞を文字毎に分割して、各文字を漢字手話で置き換えた場合の翻訳を意味する。また、漢字手話は、日本語の漢字1文字に対応した手話の単語である。その対応のさせ方は、例えば漢字から何らかの意味で連想される手話の単語を選択して行われている。例えば、日本語の漢字「福」に対応する漢字手話は、意味的に近い手話単語{幸せ}である。漢字手話は、慣習的に使われるものはあるものの、決まったものがあるわけではない。漢字手話を使うと、例えば、「福島」は、「福」と「島」の2つの文字に分けて、「福」は{幸せ}、「島」は{島}と表される。漢字手話は、指文字よりも簡潔に表現することができるため、固定訳がない場合に多く用いられる。
<3.指文字による訳>
指文字による訳は、固有名詞の読み仮名を指文字で表した場合の翻訳を意味する。手話では、日本語の50音が全て指文字として定義されている。指文字は、表現力は高いが1単語の表出に多くの時間がかかるという問題があるため、日本の地名ではあまり使われない。しかしながら、漢字手話による翻訳ができない外国の地名やカタカナ語によく用いられる。
<4.漢字手話と指文字の組み合わせによる訳>
漢字手話と指文字の組み合わせによる訳は、上述した漢字手話と指文字とを組み合わせた場合の翻訳を意味する。例えば、「長野」の場合は、「長」は手話単語の{長い}を使って表し、「野」は指文字の{ノ}を使って表す。読み仮名が短い漢字の場合には、漢字手話よりも指文字が使われやすい。
<翻訳手法の概略>
例えば、上述したような固有名詞の翻訳には、上述した4つの種類の場合を処理すればよい。このうち、「固定訳」は、地名の対訳辞書の拡張を行うことで対処せざるを得ず、「指文字による訳」は、単純に読み仮名を指文字に置き換えればよい。問題となるのは「漢字手話による訳」と「漢字手話と指文字の組み合わせによる訳」である。何れの場合も共通の問題となるのは「漢字手話」をどう決めるかである。したがって、本実施形態では、一例として、漢字手話の処理を中心に固有名詞の翻訳処理について、以下に説明する。
<第1実施形態:手話翻訳装置の機能構成例>
第1実施形態では、統計的手法を用いた翻訳を行う。第1実施形態において、固有名詞の翻訳は、一種の機械翻訳である。そこで、第1実施形態では、統計的機械翻訳手法を用いて、例えば固有名詞の翻訳を行う。なお、以下の説明では、固有名詞の一例として日本語の地名を用いることとするが、本発明においてはこれに限定されるものではなく、他の固有名詞でもよく、固有名詞でなくてもよい。例えば、日本語の地名については、翻訳単位を1文字とし,手話の地名では{}に囲まれた手話の1単語を翻訳単位として学習を行う。また、指文字で翻訳されている場合は、指文字の内容をカタカナで表現し、各文字を翻訳単位とする。
第1実施形態における手話翻訳装置の機能構成例について、図を用いて説明する。図1は、第1実施形態における手話翻訳装置の機能構成の一例を示す図である。図1に示す手話翻訳装置10は、地名入力装置11と、データ処理装置12と、記憶装置13と、翻訳結果出力装置14とを有するよう構成されている。また、データ処理装置12は、文字分割手段21と、統計的翻訳手段22と、統計的翻訳結果格納手段23と、漢字−読み変換手段24と、未知語部読み仮名格納手段25と、翻訳結果合成手段26とを有するよう構成されている。また、記憶装置13には、統計的翻訳モデル31を有するよう構成されている。
地名入力装置11は、手話翻訳するための対象のデータの一例として地名を入力する。なお、入力される対象の文字データは、地名に限定されるものではない。
また、データ処理装置12の文字分割手段21は、地名入力装置11から入力された地名に対して文字単位の分割を行う。
統計的翻訳手段22は、記憶装置13に記憶されている統計的翻訳モデル31に基づいて文字毎の手話翻訳を行う。統計的翻訳手段22は、文字に対する手話単語が統計的翻訳モデル31に含まれている場合には、翻訳された手話単語を翻訳結果として統計的翻訳結果格納手段23に出力する。また、統計的翻訳手段22は、統計的翻訳モデル31に含まれていない文字が存在する場合には、その文字を未知語として、漢字−読み変換手段24に出力する。また、統計的翻訳手段22は、入力された地名データ全体のうち、どの文字が翻訳されたかという情報とその翻訳された文字に対する読み仮名も漢字−読み変換手段24に出力する。
つまり、統計的翻訳手段22は、文字分割手段21により得られる文字毎に、予め設定された統計的翻訳モデル31を参照し、翻訳された文字と、翻訳できなかった未知語とに分類する。
漢字−読み変換手段24は、統計的翻訳手段22により得られる未知語に対して読み仮名変換を行う変換手段である。具体的には、漢字−読み変換手段24は、予め各地名データの読み仮名データが格納されており、その読み仮名データから入力された地名データの全体の読み仮名を取得し、取得した地名データの全体の読み仮名に対して、統計的翻訳手段22から得られる翻訳された部分の読み仮名を除くことにより、未知語の読み仮名を取得する。また、漢字−読み変換手段24は、取得した未知語部分の読み仮名を翻訳結果として未知語部読み仮名格納手段25に出力する。
漢字−読み変換手段24は、上述したように、予め各地名データの読み仮名データを記憶装置13に記憶させておき、必要に応じて読み出してもよい。また、漢字−読み変換手段24は、上述した読み仮名データが予め格納されていなくてもよく、その場合には、例えば地名入力装置11から読み仮名が入力され、その読み仮名を取得してもよく、また入力される地名データに対して形態素解析手法等を使って読み仮名を取得してもよい。
統計的翻訳結果格納手段23には、統計的翻訳手段22で得られた翻訳結果が格納され、未知語部読み仮名格納手段25には、未知語部分の翻訳結果が格納されている。なお、統計的翻訳結果格納手段23及び未知語部読み仮名格納手段25は、記憶装置13に記憶されていてもよく、一体の格納手段として形成されていてもよい。
翻訳結果合成手段26は、統計的翻訳結果格納手段23に格納された翻訳結果と、未知語部読み仮名格納手段25に格納された翻訳結果とを文字の順序に対応させて合成することで、最終的な翻訳結果である手話単語列を取得し、取得した手話単語列を翻訳結果出力装置14に出力する。
なお、記憶装置13は、例えばハードディスク等からなるが、これに限定されるものではない。また、翻訳結果出力装置14は、例えばディスプレイ等の表示手段であってもよく、データファイルとして出力される場合には、所定のストレージ手段であってもよい。更に、翻訳結果出力装置14は、翻訳により得られた手話単語列に基づいて対応する映像を取得し、その映像を繋げて手話映像を生成して表示させることもできる。なお、手話映像は、例えばCG等による手話等があるが、これに限定されるものではなく、実写の手話映像であってもよい。
なお、統計的翻訳モデル31は、事前に対訳を使って学習した結果を格納してある。学習には、例えば日本語(漢字、平仮名、カタカナを含む)を1文字毎に区切り、手話を1手話単語毎に区切った対訳を使用しているが、これに限定されるものではない。
<第1実施形態における手話翻訳処理手順>
ここで、第1実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図2は、第1実施形態における手話翻訳処理手順の一例を示すフローチャートである。
図2の例において、手話翻訳処理は、例えば原始言語である日本語で地名が入力されると(S01)、入力された地名の文字分割を行い(S02)、分割された文字毎に上述した統計的翻訳モデル31を用いた統計的翻訳を行う(S03)。
ここで、手話翻訳処理は、S03の処理の結果、翻訳できなかった文字(未知語)が存在するか否かを判断し(S04)、未知語がある場合(S04において、YES)、漢字−読み変換を行う(S05)。また、手話翻訳処理は、未知語がない場合(S04において、NO)、又はS05の処理が終了後、それぞれの翻訳結果の手話単語を合成し(S06)、合成した手話単語列を翻訳結果として出力する(S07)。なお、S07の処理では、上述したように手話単語列に対応する手話映像を出力してもよい。
ここで、手話翻訳処理は、処理を終了するか否かを判断し(S08)、処理を終了しない場合(S08において、NO)、S01の処理に戻る。また、手話翻訳処理は、ユーザ等の指示や入力する地名データがない場合等により処理を終了する場合(S08において、YES)、第1実施形態における手話翻訳処理を終了する。
<第1実施形態を用いた手話翻訳の具体例>
ここで、上述した第1実施形態を用いた手話翻訳の具体例について説明する。
<具体例1>
文字分割手段21は、例えば、「川越」のような地名データが入力された場合に、「川」、「越」のように各文字に分割し、分割した各文字を統計的翻訳手段22に出力する。統計的翻訳手段22は、「川」、「越」のような文字が入力された場合には、統計的翻訳モデル31を参照し、「川」に対応する{川}、「越」に対応する{越える}が統計的翻訳モデル31にある場合に、その結果を取得する。また、統計的翻訳手段22は、取得した{川},{越える}を統計的翻訳結果格納手段23に出力して格納させる。なお、上述の例では、「川」、「越」に対する翻訳結果が得られたため、未知語がない。そのため、統計的翻訳手段22は、漢字−読み変換手段24に何も出力しない。
ここで、統計的翻訳手段22に{川},{越える}が格納され、未知語部読み仮名格納手段25には何もないため、翻訳結果合成手段26では、「川越」に対応させて合成した「{川}{越える}」という手話単語列が翻訳結果出力装置14に出力される。
<具体例2>
文字分割手段21は、例えば「高槻」のような地名データが入力された場合に、「高」、「槻」ように各文字に分割し、分割した各文字を統計的翻訳手段22に出力する。統計的翻訳手段22は、統計的翻訳モデル31に基づいて翻訳が行われる。この場合、統計的翻訳モデル31には、「高」に対応する{高い}が存在し、「槻」は対応する手話が見つからなかったとする。そのため、統計的翻訳手段22は、{高い}を統計的翻訳結果格納手段23に格納し、漢字−読み変換手段24に「槻」を出力する。
漢字−読み変換手段24は、予め地名データから「高槻」の読みが「タカツキ」であることを認識している。また、漢字−読み変換手段24は、統計的翻訳手段22から、「高」が翻訳され、その読み仮名が「タカ」、「コウ」であるという情報を取得する。したがって、漢字−読み変換手段24は、「高」の読み仮名のうち、「タカツキ」に最長一致する「タカ」を取り除いた「ツキ」が「槻」の読み仮名であると判断し、未知語部読み仮名格納手段25に「ツキ」を出力する。
上述したように、漢字−読み変換手段24では、「(元の地名の読み仮名)−(統計的翻訳手段22で翻訳できた文字の読み仮名)=未知語の読み仮名」として変換しているが、これに限定されるものではない。なお、単純に未知語の読み仮名だけを使うという方法ではないのは、漢字に複数の読み仮名がある場合に対応できないからである。例えば,「高槻」の「槻」は、辞書では「キ」「ツキ」「ケヤキ」等があるが、その中から「高槻」の場合は「ツキ」であるということを確定することは「槻」の字だけからでは不可能だからである。つまり、統計的翻訳手段22で翻訳できた文字の読み仮名については、複数の読み仮名があっても、その中から最長一致するものを引けばよい。つまり、上述の例では、「「タカツキ」−(「タカ」or「コウ」)=ツキ」となり、この結果を用いて例えば「槻」⇒{ツキ}という指文字に変換することができる。
このとき、統計的翻訳結果格納手段23には{高い}が格納され,未知語部読み仮名格納手段25には「ツキ」が格納されている。そのため、翻訳結果合成手段26は、「高槻」に対応させて「{高い}ツキ」と合成し、合成された単語文字列を翻訳結果出力装置14に出力する(なお、上述した出力にある{}に括られていないカタカナは指文字であることを示している)。
なお、上述した地名の読み仮名は、人手で入力時に与えてもよく、又は、形態素解析手法等を使って取得してもよい。また、各漢字の読み仮名の複数の候補についても、形態素解析手法等を使って取得することができる。また、第1実施形態における統計的手法では、例えば入力された複数文字に対して手話1単語を割り当てることも可能である。そのため、例えば「九」「州」を入力して{九州}に翻訳することもできる。
<統計的翻訳モデル31のスコア例>
ここで、上述した第1実施形態においては、統計的翻訳手段22における統計的翻訳モデル31を用いた翻訳結果が1つの文字に対して複数になる場合がある。その場合には、統計的翻訳モデル31にスコアをセットしておき、そのセットされたスコアに基づいて、翻訳結果を出力する。
図3は、スコア化された統計的翻訳モデルの一例を示す図である。図3の例では、例えば「日本語(日本語ラベル)|||手話単語(手話単語の日本語ラベル)|||スコア…」の表記が並んでいるが、統計的翻訳モデル31のデータ例は、これに限定されるものではなく、他の項目等を含んでいてもよい。本実施形態では、入力の文字に対応する手話単語を統計的翻訳モデル31から探し、抽出された手話単語が複数ある場合に、そのスコアを元に翻訳する。なお、スコアは、予め統計的学習により取得することができ、また人手により設定してもよい。
図3の例では、文字の「松」に対する手話単語が、{松}とマツの2種類あるが、スコアの大きい{松}が抽出される。なお、スコアは、図3に示すように、複数設定することができ、例えば左からスコアを比較し、同一であれば、右側にある次のスコア同士を比較して手話単語を選択することができる。
また、図3の例では、「松山」等の1単語として学習させて統計的翻訳モデル31に格納させることもできる。この場合、例えば学習又は翻訳の際に、スペースで区切られていない単語を「1まとまり」として分割した処理は行わないように予め設定しておくことで、単語単位での手話翻訳等が可能になる。また、本実施形態における統計的翻訳モデル31は、例えば言語モデルと呼ばれる文法に対応したモデルも使用することができる。
<第2実施形態:手話翻訳装置の機能構成例>
次に、第2実施形態について説明する。上述した第1実施形態に示す統計的機械翻訳において、精度を高めるには、ある程度大規模なコーパス(学習データ)から作成した統計的手話モデルが必要となる。例えば、手話の地名については、「全国地名手話マップ」((財)全日本ろうあ連盟出版局(編)、2011)等があるが、そのサイズは非常に小さい。したがって、翻訳できない場合が多いことが予想される。そこで、第2実施形態では、漢字手話の処理を行うルールを予め人手等により設定しておき、そのルールを用いて翻訳を行う。
第2実施形態における手話翻訳装置の機能構成例について、図を用いて説明する。なお、上述した第1実施形態に示す手話翻訳装置と同一の構成については、同一の符号を付すものとし、ここでの具体的な説明は省略する。
図4は、第2実施形態における手話翻訳装置の機能構成の一例を示す図である。図4に示す手話翻訳装置40は、地名入力装置11と、データ処理装置41と、記憶装置13と、翻訳結果出力装置14とを有するよう構成されている。また、データ処理装置41は、最長一致文字分割手段51と、ルールベース翻訳手段52と、ルールベース翻訳結果格納手段53とを有するよう構成されている。また、記憶装置13は、手話単語辞書61を有するよう構成されている。
最長一致文字分割手段51は、地名入力装置11から地名データが入力されると、記憶装置13の手話単語辞書61を参照し、手話単語辞書61にある日本語見出しとの最長一致法により単語を分割する。また、最長一致文字分割手段51は、分割された最長となる単語をルールベース翻訳手段52に出力する。なお、最長一致文字分割手段51は、手話単語辞書61に一致する単語がない場合には、文字毎に分割する。
ルールベース翻訳手段52は、最長一致文字分割手段51で分割された単語を入力し、更に記憶装置13に記憶された手話単語辞書61を用いて予め設定されたルールベースによる翻訳を行う。また、ルールベース翻訳手段52は、翻訳結果をルールベース翻訳結果格納手段53に出力する。
ルールベース翻訳結果格納手段53は、ルールベース翻訳手段52の翻訳の結果を格納し、入力された地名データに対する全ての文字の翻訳が完了したら、入力された地名データに対する手話単語列を手話翻訳結果として出力する。
<第2実施形態における手話翻訳処理手順>
ここで、第2実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図5は、第2実施形態における手話翻訳処理手順の一例を示すフローチャートである。
図5の例において、手話翻訳処理は、例えば原始言語である日本語で地名が入力されると(S11)、手話単語辞書61を参照し、最長一致文字による分割を行う(S12)。次に、手話翻訳処理は、最長一致文字に対するルールベース翻訳処理を行う(S13)。なお、S13の処理の具体例については、後述する。
また、手話翻訳処理は、S13により得られた手話単語列を翻訳結果として出力する(S14)。なお、S14の処理では、上述したように手話単語列に対応する手話映像を出力してもよい。
ここで、手話翻訳処理は、処理を終了するか否かを判断し(S15)、処理を終了しない場合(S15において、NO)、S11の処理に戻る。また、手話翻訳処理は、ユーザ等の指示や入力する地名データがない場合等により処理を終了する場合(S15において、YES)、第2実施形態における手話翻訳処理を終了する。
<ルールベース翻訳処理手順>
ここで、上述したルールベース翻訳処理手順についてフローチャートを用いて説明する。図6は、ルールベース翻訳処理手順の一例を示すフローチャートである。図6の例において、ルールベース翻訳処理は、最長一致の文字を入力し(S21)し、手話単語辞書61を参照して、入力された文字が現れる単語のうち、入力漢字以外の漢字が使われていない単語があるか否かを判断する(S22)。
次に、ルールベース翻訳処理は、他の漢字が使われていない単語を手話単語辞書61から探し、他の漢字が使われていない単語がある場合(S22において、YES)、その中で最も文字数の少ない単語(手話単語)を出力して処理を終了する(S23)。
また、ルールベース翻訳処理は、S22の処理において、他の漢字が使われていない単語がない場合(S22において、NO)、入力された文字と同じ読み(読み仮名)を持つ単語があるか否かを判断し(S24)、読みが一致する単語がある場合(S24において、YES)、その中で最も文字数が少ない単語(手話単語)を出力して処理を終了する(S25)。
また、ルールベース翻訳処理は、読みが一致する単語がない場合(S24において、NO)、入力された文字と同様の漢字が使われている単語があるか否かを判断する(S26)。なお、S26の処理では、入力された文字が現れる単語のうち、S22の処理に該当しない単語を探すことになる。ルールベース翻訳処理は、入力された文字と同様の漢字が使われている単語がある場合(S26において、YES)、その中で、例えば所定の対訳の学習データ等を使ってその対訳中に最も多く出現する単語(頻度最大の手話単語)を出力して処理を終了する(S27)。
また、ルールベース翻訳処理は、入力された文字と同様の漢字が使われている単語がない場合(S26において、NO)、読み(読み仮名)が近い単語があるか否かを判断し(S28)、読みが近い単語がある場合(S28において、YES)、その中で学習データ中に最も多く出現する単語(頻度最大の手話単語)を出力して処理を終了する(S29)。また、ルールベース翻訳処理は、上述したS28の処理において、読みが近い単語がない場合(S28において、NO)、読み仮名を使った指文字用の単語(手話単語)を出力して処理を終了する(S30)。
<ルールベース翻訳処理の具体例>
ここで、上述したルールベース翻訳処理の具体例について説明する。上述したように、第2実施形態では、漢字手話を求めたい日本語漢字1文字(入力漢字)を、以下の4つのルールを順に適用して処理を行う。ルール1では、手話単語辞書61を参照し、入力漢字の日本語ラベルに含まれる手話単語を抽出する。ただし、日本語ラベルは、漢字1文字のみか、その漢字と平仮名のみの場合である。例えば、「美」の場合には、手話単語{美しい}が求められる。
次に、ルール2では、漢字の読み仮名と日本語ラベルの読み仮名とが同じ手話単語を求める。例えば、漢字「浦」の読み仮名「ウラ」と同じ読み仮名である手話単語「裏」が求められる。
また、ルール3では、翻訳したい漢字が日本語ラベルに含まれていれば、その手話単語を出力する。ただし、ルール1の「日本語ラベルの漢字を1文字に限る」という場合を除く。例えば、漢字「武」からは漢字手話{武士}が求められる。
また、ルール4では、入力漢字の別の読み仮名を使う。例えば、「高槻」は、「高」と「槻」に分割され、「高」は漢字手話{高い}に翻訳される。また、「槻」は「高槻」での読み仮名は「ツキ」であるが、別の読み仮名に「キ」がある。そこで、読み仮名「キ」を利用して、漢字手話{木}に翻訳するというものである。ルール4まで行った結果、翻訳ができなければ、漢字の読み仮名を使って指文字で翻訳する。また、各ルールで複数の翻訳候補がある場合は、ルール1及びルール2の場合では、例えば文字数が最も少ない手話単語を採用し、同じ文字数の単語があれば、所定の学習データ中で出現頻度が最大のものを採用する。更に、ルール3及びルール4の場合では、例えば学習データ中で出現頻度が最大の単語を採用する。
なお、上述したように、第2の実施形態では、ルールベース翻訳の前処理として入力単語の分割を行っている。具体的には、第2の実施形態では、手話単語辞書61にある日本語のラベルとの最長一致法で単語の分割を行い、一致する単語がない場合には、文字毎に分割する。
<手話単語辞書61の具体例>
ここで、上述した手話単語辞書61の具体例について説明する。図7は、手話単語辞書の具体例を示す図である。図7に示す手話単語辞書61は、手話単語とそれに対応する日本語ラベル(日本語見出し)、ラベルの読み仮名(カタカナ表記)と、上述した予め設定された各手話単語の学習データ中での出現頻度を格納してある。
具体的には、図7に示すように、「日本語ラベル,読み仮名,単語ID,出現頻度」の表記が並んでいるが、本発明においてはこれに限定されるものではなく、他の項目を有していてもよい。
ここで、単語IDとは、例えば手話映像と対応付けるために使用するIDである。翻訳自体には用いないが、最終的に手話映像を作成する際に、このIDに対応する手話映像を用いることで、翻訳結果を手話映像として出力することができる。なお、本実施形態では、図7の例に示すように、「真っ直ぐ」と「直線」とが同じ単語IDを用いている。これは、上記の2つの日本語ラベルが同じ手話表現で表されることを表している。
また、出現頻度は、同一の日本語ラベルが複数存在した場合に、その日本語ラベルに対応するそれぞれの出現頻度を参照し、例えば値の大きい出現頻度の方を採用して出力するために用いられる。
<第3実施形態:手話翻訳装置の機能構成例>
次に、第3実施形態について説明する。第3実施形態では、上述した2つの翻訳手法を融合して手話翻訳の翻訳精度を向上させる。例えば、第1実施形態に対応する統計的手法を用いた場合には、翻訳できる場合は精度が高いが、未知語が多かったり、手話固有名詞専用に翻訳の単位を単語毎ではなく文字毎に設計する必要がある。また、第2実施形態に対応するルールベース手法を用いた場合には、未知語が少ないが精度はやや低く、手話表現の分析により手話の固有名詞専用にルールを作成する必要がある。そこで、第3実施形態では、最初に統計的翻訳手法で翻訳を行い、その翻訳結果で未知語であったものに対してルールベース手法で翻訳を行うようにして、2段階で翻訳を行う融合法を用いる。
第3実施形態における手話翻訳装置の機能構成例について、図を用いて説明する。なお、上述した第1実施形態に示す手話翻訳装置10及び第2実施形態に示す手話翻訳装置40と同一の構成については、同一の符号を付すものとし、ここでの具体的な説明は省略する。
図8は、第3実施形態における手話翻訳装置の機能構成の一例を示す図である。図8に示す手話翻訳装置70は、地名入力装置11と、データ処理装置71と、記憶装置13と、翻訳結果出力装置14とを有するよう構成されている。また、データ処理装置71は、文字分割手段21と、統計的翻訳手段22と、統計的翻訳結果格納手段23と、最長一致文字分割手段51と、ルールベース翻訳手段52と、ルールベース翻訳結果格納手段53と、翻訳結果合成手段81とを有するよう構成されている。また、記憶装置13は、統計的翻訳モデル31と、手話単語辞書61とを有する。
地名入力装置11は、手話に翻訳したい地名データをデータ処理装置71に入力する。データ処理装置71は、地名入力装置11で入力された日本語を手話に翻訳する。文字分割手段21は、入力された単語を文字毎に分割する。統計的翻訳手段22は、文字分割手段21で分割された文字に対して、統計的翻訳モデル31にしたがって、それに対応する手話単語に翻訳する。通常の機械翻訳では、入力は単語毎に区切った文であるが、本実施形態では文字毎に区切った単語を入力する。統計的翻訳手段22は、翻訳に成功した場合に、その翻訳結果を統計的翻訳結果格納手段23に出力し、翻訳ができない単語(未知語)は、最長一致文字分割手段51に出力する。統計的翻訳結果格納手段23は、統計的翻訳手段22で得られた手話の単語を格納しておく。
最長一致文字分割手段51は、統計的翻訳手段22で翻訳できなかった文字を入力し、手話単語辞書61の手話単語辞書にある日本語見出しとの最長一致法により、単語を分割する。また、最長一致文字分割手段51は、分割した単語をルールベース翻訳手段52に出力する。
ルールベース翻訳手段52は、最長一致文字分割手段51で分割された単語を入力し、手話単語辞書61の手話単語辞書を用いて翻訳を行う。また、ルールベース翻訳手段52は、翻訳結果をルールベース翻訳結果格納手段53に出力する。
ルールベース翻訳結果格納手段53は、ルールベース翻訳手段52の翻訳の結果を格納しておく。
翻訳結果合成手段81は、統計的翻訳結果格納手段23に格納された翻訳結果(手話単語)と、ルールベース翻訳結果格納手段53に格納された翻訳結果(手話単語)とを、入力された地名データの文字順序に対応させて合成し、合成された手話単語列を翻訳結果出力装置14に出力する。
<第3実施形態における手話翻訳処理手順>
ここで、第3実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図9は、第3実施形態における手話翻訳処理手順の一例を示すフローチャートである。
図9の例において、手話翻訳処理は、例えば原始言語である日本語で地名が入力されると(S31)、入力された地名の文字分割を行い(S32)、分割された文字毎に、上述した統計的翻訳モデル31を用いた統計的翻訳を行う(S33)。
ここで、手話翻訳処理は、S33の処理の結果、翻訳できなかった文字(未知語)が存在するか否かを判断し(S34)、未知語がある場合(S34において、YES)、手話単語辞書61を参照し、最長一致文字による分割を行う(S35)。次に、手話翻訳処理は、最長一致文字に対するルールベース翻訳処理を行う(S36)。
手話翻訳処理は、未知語がない場合(S34において、NO)、又はS36の処理が終了後、それぞれの翻訳結果の手話単語を合成し(S37)、合成した手話単語列を翻訳結果として出力する(S38)。なお、S38の処理では、上述したように手話単語列に対応する手話映像を出力してもよい。
ここで、手話翻訳処理は、処理を終了するか否かを判断し(S39)、処理を終了しない場合(S39において、NO)、S31の処理に戻る。また、手話翻訳処理は、ユーザ等の指示や入力する地名データがない場合等により処理を終了する場合(S39において、YES)、第3実施形態における手話翻訳処理を終了する。
<手話翻訳の具体例>
ここで、第3実施形態における手話翻訳の具体例について説明する。なお、以下の例では、上述した「全国地名手話マップ」を用いて学習した統計的文字変換辞書と、本出願人が作成した日本語ラベル数6803の手話単語辞書を使った場合の動作例を示す。
まず、地名入力装置11は、例えば「北九州」と入力する。文字分割手段21は、「北九州」は「北」と「九」と「州」に分割し、統計的翻訳手段22で翻訳を行う。ここで、統計的翻訳モデル31には、漢字「北」を手話単語{北}に翻訳することが示されているものとする。したがって、統計的翻訳手段22は、漢字「北」を手話単語{北}に翻訳し、統計的翻訳結果格納手段23に出力する。
また、統計的翻訳手段22は、漢字「九」と「州」に対する翻訳が統計的翻訳モデル31にない場合には、「九」と「州」を未知語として最長一致文字分割手段51に出力する。
最長一致文字分割手段51は、「九」、「州」に対し、手話単語辞書61の日本語見出しとの最長一致法で分割を行う。「九州」という単語が、手話単語辞書61にある場合には、最長一致文字分割手段51から「九州」という単語がルールベース翻訳手段52に出力される。
ルールベース翻訳手段52は、例えば上述した図6に示すようなフローチャートにしたがって、ルールベース翻訳処理を行う。例えば「九州」の場合には、S22の処理で手話単語{九州}に翻訳され、ルールベース翻訳結果格納手段53に出力される。
この時点で、地名入力装置11に入った「北九州」という単語は、統計的翻訳結果格納手段23に「北」の翻訳である手話単語{北}が格納され、ルールベース翻訳結果格納手段53に「九州」の翻訳である手話単語{九州}が格納されている。
ここで、翻訳結果合成手段81は、上述した{北}と{九州}が合成し、{北}{九州}の手話単語列を翻訳結果出力装置14に出力する。これにより、「北九州」の翻訳結果として{北}{九州}が得られる。
このように、第3実施形態では、例えば統計的翻訳手段22において統計的翻訳モデル31中に現れない単語は翻訳できないが、その翻訳できない部分を手話の固有名詞に特化したルールベース翻訳手段51で翻訳することで、学習データ中に現れない文字に対しても高い精度で翻訳を行うことができる。
<比較結果>
次に、上述した第1〜第3実施形態における手話翻訳の実行結果について図を用いて説明する。図10は、第1〜第3実施形態における手話翻訳の実行結果の比較例を示す図である。
なお、比較例では、「全国地名手話マップ」の地名の中で、漢字手話か、漢字手話と指文字の組み合わせである地名のうち、市名に平仮名やカタカナが使われていない428語を用いた。評価は、47都道府県のうちの46都道府県を学習用データとし、残りの1つを評価データとするleave−one−out法により行った。
日本語−手話の対訳には、上述した「全国地名手話マップ」に掲載された全国の803の地名の手話表現について書き起こしたものを用いた。統計的手法の翻訳モデルには「GIZA++」を用い、デコードには「moses」を用い、言語モデルには「SRILM」を用いたが、これに限定されるものではない。
図10の例によれば、ルールベース手法(第2実施形態)よりも統計的手法(第1実施形態)の方が、精度が高いことがわかる。なお、比較結果では、学習データが小さいため、統計的手法では未知語が多いが、翻訳できた場合には高い精度が得られることがわかる。逆に、ルールベース手法では未知語は少ないが、翻訳結果の正解率が低いことがわかる。
また、2つの手法を融合した第3実施形態では、それぞれの手法を単独で用いる場合と比較して正解率が向上し、未知語数も減らすことができることがわかる。
<実行プログラム>
ここで、上述した手話翻訳装置10,40,70は、例えばCPU(Central Processing Unit)、RAM(Random Access Memory)等の揮発性の記憶媒体、ROM(Read Only Memory)等の不揮発性の記憶媒体、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータ等を表示する表示装置、並びに外部と通信するためのインタフェース装置を備えたコンピュータによって構成することができる。
したがって、手話翻訳装置10,40,70が有する上述した各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現可能となる。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記録媒体に格納して頒布することもできる。
つまり、上述した各構成における処理をコンピュータに実行させるための実行プログラム(手話翻訳プログラム)を生成し、例えば汎用のパーソナルコンピュータやサーバ等にそのプログラムをインストールすることにより、手話翻訳処理を実現することができる。なお、本発明における実行プログラムによる処理については、例えば上述した各処理を実現することができる。
上述したように本発明によれば、高精度な手話翻訳を実現することができる。具体的には、本発明は、例えば日本語の固有名詞の入力を自動で手話の単語列に翻訳する際、学習データに出てこない単語や文字に対しても高精度な翻訳を行うことができる。
また、本発明は、例えば日本語を手話に翻訳する際の固有名詞等の翻訳を自動で行い、手話通訳の支援やCGへの変換に利用する自然言語処理に広く適用することができる。そのため、本実施形態における手話翻訳装置の入力データとしては、上述した地名データに限定されず、あらゆる自然言語等にも適用することができる。
以上本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形、変更が可能である。
10,40,70 手話翻訳装置
11 地名入力装置
12,41,71 データ処理装置
13 記憶装置
14 翻訳結果出力装置
21 文字分割手段
22 統計的翻訳手段
23 統計的翻訳結果格納手段
24 漢字−読み変換手段
25 未知語部読み仮名格納手段
26,81 翻訳結果合成手段
31 統計的翻訳モデル
51 最長一致文字分割手段
52 ルールベース翻訳手段
53 ルールベース翻訳結果格納手段
61 手話単語辞書

Claims (3)

  1. 日本語の固有名詞である入力データに対する手話翻訳を行う手話翻訳装置において、
    前記入力データを所定の文字毎に分割する文字分割手段と、
    前記文字分割手段により得られる文字毎に、予め設定された統計的翻訳モデルを参照し、翻訳された文字と、翻訳できなかった未知語とを分類する統計的翻訳手段と、
    手話単語辞書に登録された単語のうち、前記統計的翻訳手段により分類された前記未知語に対して最長一致する単語を出力する最長一致文字分割手段と、
    前記最長一致文字分割手段により得られる単語に対して、予め設定されたルールに基づく翻訳を行うルールベース翻訳手段と、
    前記統計的翻訳手段により得られる翻訳結果と、前記ルールベース翻訳手段により得られる翻訳結果とを、前記入力データに対応させて合成する翻訳結果合成手段とを有し、
    前記統計的翻訳手段は、
    前記統計的翻訳モデルを参照した結果、入力される文字に対応する翻訳結果が複数ある場合に、前記統計的翻訳モデルの翻訳結果毎に設けられたスコアに基づいて、所定の翻訳結果を出力することを特徴とする手話翻訳装置。
  2. 前記翻訳結果合成手段により得られる翻訳結果の手話単語列に対応させた手話映像を出力することを特徴とする請求項1に記載の手話翻訳装置。
  3. コンピュータを、請求項1または2に記載の手話翻訳装置として機能させることを特徴とする手話翻訳プログラム。
JP2012049373A 2012-03-06 2012-03-06 手話翻訳装置及び手話翻訳プログラム Expired - Fee Related JP6144458B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012049373A JP6144458B2 (ja) 2012-03-06 2012-03-06 手話翻訳装置及び手話翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012049373A JP6144458B2 (ja) 2012-03-06 2012-03-06 手話翻訳装置及び手話翻訳プログラム

Publications (2)

Publication Number Publication Date
JP2013186189A JP2013186189A (ja) 2013-09-19
JP6144458B2 true JP6144458B2 (ja) 2017-06-07

Family

ID=49387687

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012049373A Expired - Fee Related JP6144458B2 (ja) 2012-03-06 2012-03-06 手話翻訳装置及び手話翻訳プログラム

Country Status (1)

Country Link
JP (1) JP6144458B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6325789B2 (ja) * 2013-09-27 2018-05-16 日本放送協会 翻訳装置及び翻訳プログラム
JP6607723B2 (ja) * 2014-08-28 2019-11-20 日本放送協会 固有名詞翻訳装置
CN112084796B (zh) * 2020-09-15 2021-04-09 南京文图景信息科技有限公司 一种基于Transformer深度学习模型的多语种地名词根汉译方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011175598A (ja) * 2010-02-25 2011-09-08 Nippon Hoso Kyokai <Nhk> 手話アニメーション生成装置及び手話アニメーション生成プログラム

Also Published As

Publication number Publication date
JP2013186189A (ja) 2013-09-19

Similar Documents

Publication Publication Date Title
US8935148B2 (en) Computer-assisted natural language translation
US8407040B2 (en) Information processing device, method and program
WO2003065245A1 (fr) Procede de traduction, procede de production de phrase traduite, support d&#39;enregistrement, programme et ordinateur
TW201250498A (en) Transliteration device, program, recording medium, and method
JP2021196708A (ja) 翻訳装置およびプログラム
JP6144458B2 (ja) 手話翻訳装置及び手話翻訳プログラム
Mammadzada A review of existing transliteration approaches and methods
US20120150530A1 (en) Information processing device and display control method
JP6160438B2 (ja) 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法
US8135573B2 (en) Apparatus, method, and computer program product for creating data for learning word translation
JP2013186673A (ja) 機械翻訳装置及び機械翻訳プログラム
JP6689466B1 (ja) 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム
JP5833087B2 (ja) 文字列処理装置、方法、及びプログラム
JP6325789B2 (ja) 翻訳装置及び翻訳プログラム
JP2019159743A (ja) 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム
JP4478042B2 (ja) 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置
JP2009157888A (ja) 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
JP2014021180A (ja) 手話翻訳装置及び手話翻訳プログラム
JP5398638B2 (ja) 記号入力支援装置、記号入力支援方法、及びプログラム
JP5298833B2 (ja) 翻訳装置及び翻訳プログラム
JP2006190072A (ja) 自動換言装置、自動換言方法及び換言処理プログラム
JP6373198B2 (ja) テキスト変換装置、方法、及びプログラム
JP4035111B2 (ja) 対訳語抽出装置、及び対訳語抽出プログラム
JP3961858B2 (ja) 翻字装置及びそのプログラム
WO2009144890A1 (ja) 翻訳前換言規則生成システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150202

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160525

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161004

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170411

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170511

R150 Certificate of patent or registration of utility model

Ref document number: 6144458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees