JP2014021180A - 手話翻訳装置及び手話翻訳プログラム - Google Patents

手話翻訳装置及び手話翻訳プログラム Download PDF

Info

Publication number
JP2014021180A
JP2014021180A JP2012157359A JP2012157359A JP2014021180A JP 2014021180 A JP2014021180 A JP 2014021180A JP 2012157359 A JP2012157359 A JP 2012157359A JP 2012157359 A JP2012157359 A JP 2012157359A JP 2014021180 A JP2014021180 A JP 2014021180A
Authority
JP
Japan
Prior art keywords
translation
sign language
character
word
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2012157359A
Other languages
English (en)
Inventor
Taro Miyazaki
太郎 宮▲崎▼
Naoto Kato
直人 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2012157359A priority Critical patent/JP2014021180A/ja
Publication of JP2014021180A publication Critical patent/JP2014021180A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】高精度な手話翻訳を実現する。
【解決手段】入力データに対する手話翻訳を行う手話翻訳装置において、前記入力データを所定の文字毎に分割する文字分割手段と、前記文字分割手段により得られる分割された文字に対して、予め設定された複数の翻訳手法のうち、少なくとも1つの翻訳手法を用いて手話翻訳を行う翻訳手段と、前記翻訳手法毎に予め設定されたスコア条件に基づいて、前記翻訳手段により得られる翻訳結果に対するスコアリングを行うスコアリング手段と、前記翻訳結果における同一単語毎に前記スコアリング手段により得られるスコア結果を統合する翻訳結果統合手段と、前記翻訳結果統合手段により得られる統合されたスコア結果に基づいて最終的な手話の翻訳結果を出力する翻訳結果出力手段とを有することにより、上記課題を解決する。
【選択図】図1

Description

本願は、手話翻訳装置及び手話翻訳プログラムに係り、特に、高精度な手話翻訳を実現するための手話翻訳装置及び手話翻訳プログラムに関する。
従来では、元言語から目的の用途に対応させて様々な目的言語等に翻訳する手法が知られている(例えば、特許文献1及び特許文献2参照)。特許文献1に示されている手法では、辞書に登録がない場合でも翻字処理によって外国語の単語からカタカナの単語を生成することで、外国語から日本語へ機械翻訳する際の翻訳率を向上させている。また、特許文献2に示されている手法では、発音ベース及び綴りベースの翻字モデルを使用して名前付きエンティティの元言語から目的言語へのポテンシャル翻訳を作成し、その目的言語の一言語資源を使用頻度に関する情報についてサーチし、次いで使用頻度に基づいて少なくとも1つのポテンシャル翻訳を含む出力を提供している。
また、近年では、目的言語の一つとして手話への翻訳が注目されている。手話は、聴覚障害者にとって重要なコミュニケーション手段である。特に、先天的或いは幼少期に聴覚を失った人等にとって、手話は第一言語であり、日本語よりも理解しやすい。そのため、日本語の文字より手話での情報を提示した方が好ましいとされている。なお、手話は、CG(Computer Graphics)等の映像を用いて提示されるのが好ましい。そのため、元言語から手話に翻訳する際には、最初に元言語から手話単語列を変換し、変換した手話単語列から各単語に対応するCGを抽出し、抽出したCGを連結して手話映像を生成する。
特開2005−92682号公報 特表2005−520251号公報
ここで、例えば日本語から手話に翻訳する場合、手話における固有名詞の翻訳では、読み仮名を使う場合が少なく、漢字1文字に手話単語一つが対応する「漢字手話」の手法が多く用いられる。例えば、「長崎」を手話に翻訳する場合には、「{長い}{崎}」という2つの手話単語を使って表される。なお、上述の{}は、手話の単語の表記(手話単語の日本語ラベル)を示し、以下も同様とする。また、日本語ラベルとは、手話単語の表す意味に近い日本語を利用したものであり、例えば「米川明彦(監修)、"新日本語−手話辞典"、日本手話研究所(編)、(財)全日本聾唖連盟出版局、2006.」等に準拠している。
しかしながら、このような翻訳方法は、従来の手法で翻訳することが難しい。例えば、機械翻訳で多く用いられる統計的翻訳手法を用いる場合には、日本語の単語と手話の単語との対応は学習することができるが、日本語の文字と手話の単語との対応を学習することは難しい。例えば、従来では、「長野」(手話では{長い}{ノ}と表される)と「宮崎」(手話では{宮}{崎}と表される)を学習しても「長」と「崎」のそれぞれの字については学習ができないため、結果として「長崎」は翻訳できない。
また、従来の統計的翻訳手法では、学習データとなる対訳の量が翻訳精度に大きな影響を与えるが「日本語−手話」の対訳は、例えば「日本語−英語」の対訳と比べてはるかに少ない。そのため、「日本語−手話」翻訳においては、統計的翻訳手法を用いて高い翻訳精度を得ることが難しい。
開示の技術は、かかる問題を鑑み、高精度な手話翻訳を実現するための手話翻訳装置及び手話翻訳プログラムを提供することを目的とする。
上記課題を解決するために、本件発明は、以下の特徴を有する課題を解決するための手段を採用している。
開示の一態様における手話翻訳装置は、入力データに対する手話翻訳を行う手話翻訳装置において、前記入力データを所定の文字毎に分割する文字分割手段と、前記文字分割手段により得られる分割された文字に対して、予め設定された複数の翻訳手法のうち、少なくとも1つの翻訳手法を用いて手話翻訳を行う翻訳手段と、前記翻訳手法毎に予め設定されたスコア条件に基づいて、前記翻訳手段により得られる翻訳結果に対するスコアリングを行うスコアリング手段と、前記翻訳結果における同一単語毎に前記スコアリング手段により得られるスコア結果を統合する翻訳結果統合手段と、前記翻訳結果統合手段により得られる統合されたスコア結果に基づいて最終的な手話の翻訳結果を出力する翻訳結果出力手段とを有する。
開示の技術によれば、高精度な手話翻訳を実現することができる。
手話翻訳装置の機能構成の一例を示す図である。 本実施形態における手話翻訳処理の一例を示すフローチャートである。 漢字手話のみを学習データとした統計的翻訳手段の機能構成の一例を示す図である。 漢字手話のみを学習データとした統計的翻訳に用いられる統計的翻訳モデルの一例を示す図である。 ルールベース翻訳手段の機能構成の一例を示す図である。 ルールベース翻訳に用いられる手話単語辞書の一例を示す図である。 文字単位の学習データを用いた統計的翻訳手段の機能構成の一例を示す図である。 文字単位の学習データを用いた統計的翻訳に用いられる統計的翻訳モデルの一例を示す図である。 単語単位の学習データを用いた統計的翻訳手段の機能構成の一例を示す図である。 単語単位の学習データを用いた統計的翻訳で用いられるコーパス内単語辞書の一例を示す図である。 単語単位の学習データを用いた統計的翻訳で用いられる統計的翻訳モデルの一例を示す図である。 ルールベース翻訳結果に対するスコアリングの一例を示す図である。 単語単位の学習データを用いた統計的翻訳に対応するスコアリングの一例を示す図である。
<開示の技術について>
開示の技術は、例えば複数の翻訳手法から得られる結果を組み合わせた手話翻訳を提供する。なお、複数の翻訳手法とは、例えば「漢字手話のみを学習データとした統計的翻訳」、「ルールベース翻訳」、「文字単位の学習データを用いた統計的翻訳」、及び「単語単位の学習データを用いた統計的翻訳」等を含む翻訳手法のうち、選択的に選ばれる少なくとも1つの翻訳手法を示すが、これに限定されるものではない。
ここで、開示の技術は、翻訳元の言語の一例として日本語を用いることができ、翻訳先の言語として手話言語を用いることができるが、これに限定されるものではなく、例えば外国言語から手話への翻訳や、所定の外国言語同士の翻訳にも適用することができる。
なお、手話翻訳する対象は、例えば日本語の地名や人名等の固有名詞等であるが、これに限定されるものではなく、他の言語やニュース原稿等の文章等であってもよい。ここで、例えば、日本手話における固有名詞の場合の翻訳方法は、(1)固定訳、(2)漢字手話による訳、(3)指文字による訳、(4)漢字手話と指文字の組み合わせによる訳の4種類に分類できる。以下に、各分類について説明する。
(1)固定訳
固定訳とは、ある固有名詞に対応する手話単語が既に決まっている場合を表す。例えば、「広島」であれば手話では、厳島神社の鳥居の形を手指動作で表現することで表すことができる。固定訳では、非常に特徴的な表現であることが多く、意味を確実に伝えることができ、かつ簡潔に表現できるため、固定訳がある場合は優先して使われることが多い。
(2)漢字手話
漢字手話による訳は、固有名詞を文字毎に分割し、各文字に対応する手話で置き換えた場合の翻訳を意味する。例えば、日本語の漢字「福」に対応する漢字手話は、意味的に近い手話単語である{幸せ}である。これを使って、「福島」であれば、「福」と「島」に分けて、「福」に対応する漢字手話{幸せ}と、「島」を表す漢字手話{島}の2単語で表現される。
漢字手話は、後述する指文字より簡潔に表現できることが多く、固定訳がない場合に多く用いられる。
(3)指文字
指文字による訳は、固有名詞の読みかなを指文字で表した場合の翻訳を意味する。手話では、日本語の50音が全て指文字として定義されている。指文字は、表現力は高いが1単語の表出に時間がかかるという問題がある。そのため、日本語の翻訳ではあまり使われない。しかしながら、漢字手話での翻訳がしづらい場合や外国の地名、カタカナ語等にはよく用いられる。
(4)漢字手話+指文字
「漢字手話+指文字」とは、上述した(2)の漢字手話と、(3)の指文字とを組み合わせた方法である。例えば「長野」であれば、「長」は手話単語の{長い}を使った漢字手話で表し、「野」は指文字の{ノ}で表す。「野」のように、読み仮名の短い漢字に対しては、指文字が使われることも多い。
以下に、手話翻訳装置及び手話翻訳プログラムを好適に実施した形態について、図面を用いて詳細に説明する。なお、以下の説明では、翻訳手法の一例として、例えば上述した(2)漢字手話と、(4)漢字手話+指文字とを対象とした機械翻訳手法について説明するが、これに限定されるものではなく、例えば他の翻訳手法を組み合わせてもよい。
<手話翻訳装置の機能構成例>
図1は、手話翻訳装置の機能構成の一例を示す図である。図1における手話翻訳装置10は、文字取得手段11と、文字分割手段12と、翻訳設定手段13と、翻訳手段14と、スコアリング手段15と、翻訳結果統合手段16と、翻訳結果出力手段17とを有するよう構成されている。
文字取得手段11は、手話翻訳するための対象のデータをユーザ等からの入力により取得する。なお、入力されるデータは、例えば元言語である日本語であってもよく他の言語でもよい。また、入力されるデータは、特に限定されるものではなく、例えばニュースや気象情報等で用いられる固有名詞であってもよいが、これに限定されるものではない。
また、文字取得手段11は、例えば、ユーザに操作されたキーボードやマウス等の入力装置によって入力された文字を取得してもよく、マイク等の入力装置によって入力された音声データから既存の音声認識手法等により文字を取得してもよい。なお、文字取得手段11における文字は、単語単位や文章単位でもよく、また既存の形態素解析処理等により得られる1単語の固有名詞であってもよい。なお、文字取得手段11により取得される文字は、意味のある所定のまとまりを単位とした文章やセリフ等の文字群であってもよい。
文字分割手段12は、入力された文字に対して少なくとも1文字単位の語に分割する。例えば、「宮崎」であれば「宮」、「崎」、「宮崎」に分割される。なお、文字分割手段12は、翻訳手法に応じて分割する内容を変更してもよい。具体的には、文字分割手段12は、予め設定された手話単語辞書等を用いて最長で一致した文字で分割するようにしてもよい。また、文字分割手段12は、手話単語辞書に一致する単語がない場合には、予め設定した文字毎に分割してもよい。
翻訳設定手段13は、予め設定された1又は複数の翻訳手法のうち、どの翻訳手法を用いて翻訳を行うのかを選択して設定する。なお、翻訳設定手段13は、文字取得手段11により取得した文字の内容に応じて翻訳手法を設定してもよく、文字の取得前に予めユーザ等により予め設定された複数の翻訳手法のうち、どの翻訳手法を用いるかを設定してもよい。
翻訳手段14は、翻訳設定手段13により設定された翻訳手法を用いて、文字分割手段12により分割された文字に対する翻訳処理を行う。なお、翻訳手段14として、図1の例では、漢字手話のみを学習データとした統計的翻訳手段14−1と、ルールベース翻訳手段14−2と、文字単位の学習データを用いた統計的翻訳手段14−3と、単語単位の学習データを用いた統計的翻訳手段14−4とを含むが、これに限定されるものではなく、例えば2つ以上の翻訳手法を有していればよい。翻訳手段14は、上述した各翻訳手段14−1〜14−4のうち、例えば翻訳設定手段13により選択的に選ばれる少なくとも1つの手法を用いて文字の翻訳を行う。翻訳手段14における具体的な翻訳手法については、後述する。
スコアリング手段15は、翻訳手段14により得られる翻訳結果に対して、予め設定されたスコア条件でスコアリングを行う。なお、スコアリング手段15は、図1に示すように、翻訳手段14における各翻訳手段14−1〜14−4に対応させてスコアリング手段15−1〜15−4を設定してもよく、1つのスコアリング手段14のみで各翻訳手段14−1〜14−4に対するスコアリングを行ってもよい。
翻訳結果統合手段16は、翻訳手段14において少なくとも1つの翻訳手法で翻訳され、スコアリング手段15でスコアリングされた翻訳結果を統合する。具体的には、翻訳結果統合手段16は、翻訳手段14で得られる翻訳結果に対して、例えば同一単語毎に、スコアリング手段15により得られるスコア結果を統合する。なお、統合とは、例えば各翻訳結果の各単語のスコアを加算する等の処理を行うが、これに限定されるものではない。例えば、翻訳結果統合手段16は、スコアの統合時に、予め設定された各翻訳手段14−1〜14−4の少なくとも1つに優先度を設定し、設定された優先度に基づき、各翻訳手段14−1〜14−4から得られるスコアリング結果に重み付けを行い、重み付けを行ったスコアで統合を行ってもよい。
翻訳結果出力手段17は、翻訳結果統合手段16により得られる統合結果に基づいて、文字取得手段11により取得した文字に対する最終的な翻訳結果(手話単語列)を出力する。なお、翻訳結果は、翻訳結果統合手段16により得られる統合結果のスコアが最も高かった翻訳結果の単語のみを出力してもよく、スコアの上位から所定数の翻訳結果の単語を出力してもよい。更に、全ての翻訳結果をスコアと共に出力してもよい。
なお、翻訳結果の出力は、例えばモニタ、ディスプレイ等の表示手段等に出力してもよく、所定の記憶手段や記録媒体にデータファイルとして出力してもよい。また、本実施形態では、スピーカ等の出力手段を用いた音声等による出力であってもよい。更に、他の例としては、例えばインターネット等に代表される通信ネットワークを介して接続されている外部装置に出力してもよいが、これに限定されるものではない。
更に、翻訳結果出力手段17は、例えば翻訳結果の単語(手話単語列)に基づいて対応する映像(例えば、手話CG映像や手話実写映像)を取得し、その映像を繋げて手話映像を生成し、表示手段等に表示させることもできる。なお、手話映像は、例えばCG等による手話等があるが、これに限定されるものではなく、実写の手話映像であってもよい。
<手話翻訳処理例>
ここで、本実施形態における手話翻訳処理の一例について、フローチャートを用いて説明する。図2は、本実施形態における手話翻訳処理の一例を示すフローチャートである。
図2の例において、手話翻訳処理は、例えば元言語である日本語で文字(例えば、固有名詞等)が入力されると(S01)、入力された文字に対する文字分割を行う(S02)。
次に、手話翻訳処理は、S02の処理により分割された各文字に対して翻訳を行うため、予め設定された複数の翻訳手法のうち、どの翻訳手法を用いるかを設定する(S03)。具体的には、予め設定された複数の翻訳手法のうち、少なくとも1つの翻訳手法を設定する。ここで、予め設定された複数の翻訳手法としては、例えば上述した漢字手話のみを学習データとした統計的翻訳、ルールベース翻訳、文字単位の学習データを用いた統計的翻訳、及び単語単位の学習データを用いた統計的翻訳等があるが、これに限定されるものではない。
次に、手話翻訳処理は、設定された少なくとも1つの翻訳手法を用いて翻訳を行う(S04)。また、手話翻訳処理は、S04の処理により得られる翻訳結果に対する翻訳文字毎のスコアリングを行い(S05)、スコアリングされた翻訳結果を翻訳文字毎に統合する(S06)。また、手話翻訳処理は、統合された翻訳結果から所定の条件に基づいて目的の翻訳結果(手話単語列)を出力する(S07)。
ここで、手話翻訳処理は、処理を終了するか否かを判断し(S08)、例えばユーザ等による終了指示等があった等により、処理を終了する場合(S08において、YES)、手話翻訳処理を終了する。また、手話翻訳処理は、処理を終了しない場合(S08において、NO)、S01の処理に戻り、他の文字を入力して上述した処理を行う。上述したように、本実施形態における手話翻訳によれば、高精度な手話翻訳を実現することができる。
<翻訳手段14について>
次に、上述した翻訳手段14における翻訳手法の具体例について説明する。
なお、本実施形態では、一例として、上述した(2)漢字手話と、(4)漢字手話+指文字とを対象とした機械翻訳手法について説明する。本実施形態における翻訳手法には、例えば上述したような4つの翻訳手法(例えば、漢字手話のみを学習データとした統計的翻訳、ルールベース翻訳、文字単位の学習データを用いた統計的翻訳、単語単位の学習データを用いた統計的翻訳、単語単位の学習データを用いた統計的翻訳)のうち、1又は複数を組み合わせて使用する。
なお、以下の説明では、入力データを「日本語の入力単語を分割した文字毎」に分割して処理を行っているが、本実施形態においてはこれに限定されるものではなく、例えば意味のある所定のまとまりを持った単位(単語や文章)の入力に対しても処理を行うことができる。上述の例としては、例えば「北九州」の場合に、文字毎にばらした「北」、「九」、「州」の他にも、意味のある所定のまとまりである「九州」についても翻訳手法の入力にすることができる。ここで、上述した4つの翻訳手法の一例について、具体的に説明する。
(1)漢字手話のみを学習データとした統計的翻訳
漢字手話のみを学習データとした統計的翻訳とは、予め「漢字手話」か「漢字手話+指文字」で表現された固有名詞のデータベースから、統計的機械翻訳の手法で学習を行う。なお、学習の際には、日本語は文字単位に分割し、手話は手話単語毎に分割する。
この手法では、学習データがもともと「漢字手話」、「漢字手話+指文字」に特化しているため、入力文字が翻訳できる場合には高い精度が期待できる。なお、漢字手話のみを学習データとした統計的翻訳手法では、適切な学習データの収集が困難である。また、漢字手話のみを学習データとした統計的翻訳は、学習データが足りないと学習データに現れない「未知語」の翻訳ができないため、翻訳精度が低下する可能性がある。
なお、漢字手話のみを学習データとした統計的翻訳では、例えば統計的翻訳でよく用いられる「N−Best解」と呼ばれる手法を用いることができる。なお、「N−Best解」とは、例えば複数の違う翻訳結果を、予想される精度順(スコア順)に並べて出力する手法である。これにより、精度が最も高い翻訳結果を出力することができる。
ここで、図3は、漢字手話のみを学習データとした統計的翻訳手段の機能構成の一例を示す図である。図3に示す漢字手話のみを学習データとした統計的翻訳手段14−1は、統計的翻訳手段21と、統計的翻訳モデル22と、統計的翻訳結果格納手段23と、漢字−読み変換手段24と、未知語部読み仮名格納手段25と、翻訳結果合成手段26とを有するよう構成されている。
統計的翻訳手段21は、上述した文字分割手段12により分割された文字(分割文字)を入力し、入力した分割文字に対して統計的翻訳モデル22に基づいて文字毎の手話翻訳を行う。
ここで、図4は、漢字手話のみを学習データとした統計的翻訳に用いられる統計的翻訳モデルの一例を示す図である。なお、図4では、一例として「全国地名手話マップ」((財)全日本ろうあ連盟出版局(編)、2011)等を学習データとした統計的翻訳手法のモデルを示しているが、これに限定されるものではない。また、図4に示す統計的翻訳モデル22は、例えば、「moses」等の所定の統計的翻訳手法のツールキットで用いられる「phrase table」と呼ばれるものを適用することができるが、これに限定されるものではない。
また、図4の統計的翻訳モデル22において、「|||」は項目の区切りを示しており、各項目は「(元言語(本実施形態では、日本語)の表記)|||(翻訳先言語(本実施形態では、手話言語)の表記)|||(確率値)||| |||(出現数)」を示しているが、統計的翻訳モデル22に含まれる項目の種類や内容、区切り文字の種類等についてはこれに限定されるものではない。
ここで、上述した確率値とは、例えば5個のパラメータがスペース区切りで並んでおり、それぞれが、「(i)翻訳先言語⇒元言語の方向への対応確率」「(ii)翻訳先言語⇒元言語の方向への各単語毎の共起確率の積」、「(iii)元言語⇒翻訳先言語の方向への対応確率」、「(iv)元言語⇒翻訳先言語の方向への各単語毎の共起確率の積」、「(v)一律に与えられた値」となっている。ここで、本実施形態では、上述した(i)を翻訳時に使うことが好ましいが、この値に限定されるものではない。
また、上述した出現数とは、例えば2個のパラメータがスペース区切りで並んでおり、例えば、「(i)「翻訳先言語の表記」に翻訳されるものが翻訳モデル中にいくつあるか」、「(ii)「元言語の表記」の翻訳候補が翻訳モデル中にいくつあるか」等を表している。
図3に示す統計的翻訳手段21は、文字に対応する手話単語が上述した統計的翻訳モデル22に含まれている場合には、翻訳された手話単語を翻訳結果として統計的翻訳結果格納手段23に出力する。また、統計的翻訳手段21は、統計的翻訳モデル22に含まれていない文字が存在する場合には、その文字を未知語として、漢字−読み変換手段24に出力する。
また、統計的翻訳手段21は、入力された分割文字のうち、どの文字が翻訳されたかという情報とその翻訳された文字に対する読み仮名も漢字−読み変換手段24に出力してもよい。
つまり、統計的翻訳手段21は、文字分割手段12により得られる文字毎に、予め設定された統計的翻訳モデル22を参照し、翻訳された文字と、翻訳できなかった未知語とに分類する。
統計的翻訳モデル22は、事前に対訳を使って学習した結果を格納してある。なお、学習には、例えば日本語(漢字、平仮名、カタカナを含む)を1文字毎に区切り、手話を1手話単語毎に区切った対訳を使用しているが、これに限定されるものではない。
漢字−読み変換手段24は、統計的翻訳手段21により得られる未知語に対して読み仮名変換を行う変換手段である。具体的には、漢字−読み変換手段24は、予め文字(例えば、地名データ等の固有名詞等)毎の読み仮名データが格納されており、その読み仮名データから入力された文字の全体の読み仮名を取得し、取得した文字の全体の読み仮名に対して、統計的翻訳手段21から得られる翻訳された部分の読み仮名を除くことにより、未知語の読み仮名を取得する。また、漢字−読み変換手段24は、取得した未知語部分の読み仮名を翻訳結果として未知語部読み仮名格納手段25に出力する。
ここで、漢字−読み変換手段24は、上述した読み仮名データをハードディスク等の記憶装置に記憶させておき、必要に応じてそのデータを読み出してもよい。また、漢字−読み変換手段24は、上述した読み仮名データを予め格納していなくてもよく、その場合には、例えば文字取得手段11から読み仮名が入力され、その読み仮名を取得してもよく、また入力される文字(未知語)に対して形態素解析手法等を使って読み仮名を取得してもよい。
統計的翻訳結果格納手段23には、統計的翻訳手段21で得られた翻訳結果が格納され、未知語部読み仮名格納手段25には、未知語部分の翻訳結果が格納されている。なお、統計的翻訳結果格納手段23及び未知語部読み仮名格納手段25は、所定の記憶手段に記憶されていてもよく、統計的翻訳結果格納手段23及び未知語部読み仮名格納手段25を一体の格納手段として形成されていてもよい。
翻訳結果合成手段26は、統計的翻訳結果格納手段23に格納された翻訳結果と、未知語部読み仮名格納手段25に格納された翻訳結果とを文字の順序に対応させて合成することで、最終的な翻訳結果である手話単語列を取得し、取得した手話単語列を翻訳結果として出力する。
(2)ルールベース翻訳
ルールベース翻訳は、例えば手話CG生成用にモーションキャプチャーした手話単語リスト等を用いて、予め設定されたルールに基づいて翻訳を行う手法である。なお、本実施形態における予め設定されたルールとしては、例えば以下に示す4つのルールが存在する。
例えば、ルールベース翻訳は、「(A)入力の漢字以外の漢字が使われていない単語があるか否か」で判断する。例えば、「美」を入力した場合には、{美しい}という「美」の文字と送りがなだけで構成された単語を、上述した手話単語リストから見つけ、それを出力する。
次に、ルールベース翻訳は、「(B)読みが一致する単語があるか否か」で判断する。例えば、「浦」を入力した場合には、「浦」の読みと一致する「ウラ」という読み方を持つ{裏}という単語を手話単語リストから見つけ出し、それを出力する。
次に、ルールベース翻訳は、「(C)入力した漢字が一部に使われている単語があるか否か」で判断する。例えば、「武」という文字を入力した場合には、「武」の文字が使われていて、かつ、上述した(A)の条件に合致しない単語である{武士}を手話単語リストから見つけ出し、それを出力する。
更に、ルールベース翻訳は、「(D)読みが近い単語はあるか否か」で判断する。例えば、「高槻」の「槻」が入力された場合には、「槻」に該当する読みは「ツキ」であるが「槻」という文字は、他に「キ」という読み方を持つ。そこで、この「キ」という翻訳元の単語での読みと、別の読みとを一致する手話単語である{木}を手話単語リストから見つけ出し、それを出力する。
本実施形態では、ルールベース翻訳において、上述した(A)〜(D)の4つのルールを用いて入力された文字に対し、該当する手話単語を見つけ出し、それを出力する。なお、本実施形態におけるルールベース翻訳におけるルールについては、これに限定されるものではない。
ここで、図5は、ルールベース翻訳手段の機能構成の一例を示す図である。図5に示すルールベース翻訳手段14−2は、手話単語辞書31と、ルールベース翻訳手段32と、ルールベース翻訳結果格納手段33とを有するよう構成されている。なお、上述した本実施形態の構成と同一の構成部分については、同一の符号を付するものとし、ここでの具体的な説明は省略する。図5の例では、説明の便宜上、文字分割手段12を示している。
図5に示すルールベース翻訳手段14−2は、例えば、漢字手話の処理を行うルールを、例えば所定の条件や予め人手等により設定しておき、そのルールを用いて翻訳を行う。文字分割手段12は、翻訳対象の文字が入力されると、ルールベース翻訳手段14−2に含まれる手話単語辞書31を用いて、手話単語辞書31にある日本語見出しとの最長一致法により単語を分割する。
ここで、図6は、ルールベース翻訳に用いられる手話単語辞書の一例を示す図である。図6に示す手話単語辞書31は、各項目がカンマ(,)で区切られたデータの集合であり、各項目が「(手話表記ラベル),(表記ラベルの読み方),(手話CGの番号)」を示しているが、手話単語辞書31に含まれる項目の種類や内容、区切り文字の種類等についてはこれに限定されるものではない。なお、上述した手話CGの番号は、翻訳には直接関係ないが、翻訳の結果を手話CGに変換する場合に、この手話単語辞書31を用いて、手話単語をCGの番号に変換し、対応する手話CG映像を抽出する。
図5において、文字分割手段12は、例えば図6に示す手話単語辞書31等を参照しながら、分割された最長となる単語をルールベース翻訳手段32に出力する。なお、文字分割手段12は、手話単語辞書31に一致する単語がない場合には、文字毎に分割する。
ルールベース翻訳手段32は、文字分割手段12で分割された単語を入力し、例えば図6に示す手話単語辞書31等を用いて、予め設定されたルールベースによる翻訳を行う。また、ルールベース翻訳手段32は、翻訳結果をルールベース翻訳結果格納手段33に出力する。つまり、手話単語辞書31は、文字分割手段12においては、辞書内に格納された単語を用いて、最長一致法により、入力された単語を分割するために参照される。また、手話単語辞書31は、ルールベース翻訳手段32においては、例えば予め設定されたルールベースにより、分割された単語を手話単語辞書31内の翻訳結果に変換するために参照される。
ルールベース翻訳結果格納手段33は、ルールベース翻訳手段32の翻訳の結果を格納し、入力された文字(例えば、固有名詞等)の全ての翻訳が完了したら、入力された文字に対する手話単語列を手話翻訳結果として出力する。
(3)文字単位の学習データを用いた統計的翻訳
文字単位の学習データを用いた統計的翻訳は、例えば予め設定された日本語(翻訳元の言語)と手話(翻訳先の言語)とが対応するコーパス(例えば、手話ニュースコーパス等)を用いて学習した統計的翻訳モデルを用いた翻訳手法である。ただし、一般の翻訳であれば、翻訳の際の元言語(例えば、日本語)、目的言語(例えば、手話)とも、単語毎に区切っての学習を行うが、この場合は漢字手話に対応させるために、元言語(日本語)を文字毎に区切って学習する。
なお、文字単位の学習データを用いた統計的翻訳は、上述した(1)の漢字手話のみを学習データとした統計的翻訳と異なり、学習データに漢字手話以外のものが多く含まれる。そのため、精度としては低くなることが予想されるが、学習データの収集が比較的簡単であるため、多くの学習データを用いることで翻訳の精度を向上させることができる。
また、文字単位の学習データを用いた統計的翻訳は、上述したように統計的翻訳でよく用いられる「N−Best解」と呼ばれる手法を用いることができる。したがって、文字単位の学習データを用いた統計的翻訳は、翻訳候補を複数出力し、他の手法と組み合わせてスコアが最大になるものを選ぶ用途に使うことで、単体での翻訳精度を補うことができる。
ここで、図7は、文字単位の学習データを用いた統計的翻訳手段の機能構成の一例を示す図である。図7に示す文字単位の学習データを用いた統計的翻訳手段14−3は、統計的翻訳モデル22と、対訳候補列挙手段41と、翻訳順位決定手段42とを有する。なお、上述した本実施形態の構成と同一の構成部分については、同一の符号を付するものとし、ここでの具体的な説明は省略する。
図7の例では、例えば固有名詞等が入力され、入力された各文字を分割した分割文字に対して、文字単位の学習データを用いた統計的翻訳を行う。
対訳候補列挙手段41は、統計的翻訳モデル22を用いて、分割された各文字に対する翻訳候補を列挙する。また、翻訳順位決定手段42は、対訳候補列挙手段41により得られる結果と、統計的翻訳モデル22と組み合わせて、手話らしい語順の翻訳結果(手話単語列)を出力する。
ここで、図8は、文字単位の学習データを用いた統計的翻訳に用いられる統計的翻訳モデルの一例を示す図である。なお、図8に示す統計的翻訳モデル22は、文字単位の学習データを用いたモデルであり、各項目は、上述した図4に示す統計的翻訳モデル22と同様であるため、ここでの具体的な説明は省略する。なお、例えば、図8の上から5個目のデータ例において、{N}は手話の文中に非常に多く出現するため、出現数の1個目のパラメータが非常に大きくなっている。また、図8の上から1〜5個目のデータ例は、全て「元言語の表記」が同じであるため、出現数の2個目のパラメータが同一である。
文字単位の学習データを用いた統計的翻訳手段14−3は、例えば他の手法と融合するために、上述した「N−Best解」を使う場合には、順位決定手段42で順位付けられた翻訳候補を上位から複数出力する。また、単独の手法として使う場合は、順位を決定して1番目の翻訳結果のみを出力する。
(4)単語単位の学習データを用いた統計的翻訳
単語単位の学習データを用いた統計的翻訳は、例えば予め設定された日本語(翻訳元の言語)と手話(翻訳先の言語)とが対応するコーパスから翻訳元となる漢字が使われている日本語単語を探し、その日本語単語に対応する手話が何であるかを計算する。単語単位の学習データを用いた統計的翻訳は、複数の日本語単語で同じ手話単語が使われるようであれば、その手話単語がその文字に対応する漢字手話である可能性が高くなる。
日本語単語は、漢字手話に使われやすい形容詞や名詞、漢字手話が使われやすい固有名詞を優先して探索する。日本語単語は、実験的に10個を抽出して翻訳を行っている。また、抽出は、品詞が「形容詞」か「名詞>固有名詞>その他」の順で優先順位を付け、同じ品詞であれば、コーパスに出現する回数が多い順に選んでいる。
ここで、上述した(4)の単語単位の学習データを用いた統計的翻訳手法について、具体的な例と挙げて説明する。例えば、「宮」が入力された場合には、コーパスを参照して、「宮」が現れる日本語単語として「宮崎」、「宮城」、「宮里」、「宮古」、「宮殿」、「宮内庁」、「宮古島」等が見つかる。それぞれを手話に翻訳すると、「宮崎」⇒{宮崎}、「宮城」⇒{宮城}、「宮里」⇒{宮}{農業}、「宮古」⇒{宮}{古い}、「宮殿」⇒{ハウス}、「宮内庁」⇒{宮}{省庁}、「宮古島」⇒{宮}{古い}{島}となる。この翻訳結果として現れる手話の単語を数えると、{宮}が4回、{古い}が2回、その他が各1回現れている。そこで、「宮」の翻訳としては、{宮}が最も可能性として高くなる。上述した(4)の単語単位の学習データを用いた統計的翻訳手法は、このようにして漢字手話を抽出する手法である。
ここで、図9は、単語単位の学習データを用いた統計的翻訳手段の機能構成の一例を示す図である。図9に示す単語単位の学習データを用いた統計的翻訳手段14−4は、文字使用単語列挙手段51と、コーパス内単語辞書52と、対訳候補列挙手段53と、最適翻訳決定手段54と、統計的翻訳モデル22とを有するよう構成されている。なお、上述した構成と同一の構成部分については、同一の符号を付するものとし、ここでの具体的な説明は省略する。
図9の例では、例えば固有名詞等が入力され、入力された各文字を分割した分割文字に対して、単語単位の学習データを用いた統計的翻訳を行う。文字使用単語列挙手段51は、予め設定されたコーパス内単語辞書52から、コーパスの中から翻訳したい文字が使われている単語を列挙する。このときに使うコーパス内単語辞書52は、例えば統計的翻訳モデル22等を作ったものと同一のコーパスを使用して作成することができる。また、列挙する際には、例えば「その漢字+送りがなだけでできた名詞、形容詞」>「固有名詞」>「名詞」>「形容詞」の順番で優先して出力する。
ここで、図10は、単語単位の学習データを用いた統計的翻訳で用いられるコーパス内単語辞書の一例を示す図である。図10に示すコーパス内単語辞書52は、各項目がカンマ(,)で区切られており、各項目は、「(単語ID),(単語表記),(出現頻度)」を示しているが、項目の種類や内容、区切り文字の種類等についてはこれに限定されるものではない。例えば、上述したように、日本語単語の抽出において、同じ品詞があった場合には、コーパス内単語辞書52に出現する回数(出現頻度)が多い順に抽出を行う。
その後、列挙された単語のそれぞれに対し、対訳候補列挙手段53は、文字使用単語結果に対して、統計的翻訳モデル22を用いて対訳候補を列挙する。
ここで、図11は、単語単位の学習データを用いた統計的翻訳で用いられる統計的翻訳モデルの一例を示す図である。なお、図11に示す統計的翻訳モデル22は、文字単位ではなく、単語単位の学習データを用いたモデルであり、各項目は、上述した図4に示す統計的翻訳モデル22と同様であるため、ここでの具体的な説明は省略する。また、本実施形態において、上述した各統計的翻訳手法で用いられる統計的翻訳モデル22は、例えば同一の統計的翻訳モデルとして構成されていてもよく、別々の統計的翻訳モデルとして構成されていてもよい。
最適翻訳決定手段54は、対訳候補列挙手段53により得られる対訳候補を図11に示す統計的翻訳モデル22に対応させて、最適翻訳を決定し、決定した翻訳結果を出力する。
<スコアリング手法及び統合手法>
次に、上述したスコアリング手段15及び翻訳結果統合手段16における処理内容について具体的に説明する。本実施形態では、上述した4つの翻訳手法のそれぞれの出力に対して所定のスコア条件による翻訳結果の文字毎のスコアリングを行う。
<(1)漢字手話のみを学習データとした統計的翻訳におけるスコア条件の例>
例えば、上述した(1)の漢字手話のみを学習データとした統計的翻訳による出力の場合には、翻訳結果の精度(スコア)順に、一番高いものに10、以下、順位が下がる毎に8、6、・・・と下げていく。本実施形態では、一例として翻訳結果を所定数(例えば、3つ)まで出力し、その出力結果の順位に対応して、10、8、6とスコアを付ける。なお、翻訳結果の出力数やスコアの付け方については、これに限定されるものではない。
<(2)ルールベース翻訳におけるスコア条件の例>
例えば、上述した(2)のルールベース翻訳による出力の場合には、予め設定されたそれぞれのルールに対応させてスコアを付ける。ここで、図12は、ルールベース翻訳結果に対するスコアリングの一例を示す図である。
図12に示すように、翻訳対象の文字を入力し、その文字が分割された分割文字に対して、予め設定された条件に当てはまる場合に、当てはまったルールに対応するスコアを出力する。例えば、ルール(A)の場合には、スコア8とする。ここで、ルール(A)に当てはまる場合とは、例えば入力漢字以外の漢字が使われていない単語がある場合等であるが、これに限定されるものではない。
また、ルール(B)に当てはまる場合には、スコア5とする。ここで、ルール(B)に当てはまる場合とは、例えば読みが一致する単語がある場合であるが、これに限定されるものではない。
また、ルール(C)に当てはまる場合には、スコア3又はスコア1とする。ここで、ルール(C)に当てはまる場合とは、例えば、入力漢字が含まれる単語があるか否かにより判断するが、これに限定されるものではない。また、本実施形態では、1つのルール内に複数のサブルール(詳細ルール)を設定することができ、例えば、ルール(C)の場合には、単語の先頭に翻訳対象の文字が現れるか否かを条件とすることができ、その条件に当てはまる場合には、スコア3とし、その条件に当てはまらない場合(入力文字が先頭以外に現れる場合)には、スコア1とする。
ルール(D)に当てはまる場合には、スコア1とする。ここで、ルール(D)に当てはまる場合とは、例えば読みが近い単語がある場合であるが、これに限定されるものではない。
また、上述したルールについては、これに限定されるものではなく、スコアの付け方については、これに限定されるものではない。また、本実施形態では、ルール(C)に示すように、複数の階層を有するルール(ルール、サブルール等)を設けることで、スコアを細かく設定することができる。
<(3)文字単位の学習データを用いた統計的翻訳におけるスコア条件の例>
例えば、上述した(3)の文字単位の学習データを用いた統計的翻訳による出力の場合には、翻訳結果の精度(スコア)順に、一番高いもので6、以下、順位が下がる毎に出力のスコアを5、4、3・・・と1ずつ下げていく。
ここで、(3)の文字単位の学習データを用いた統計的翻訳での出力の場合におけるスコアリングと、上述した(1)の漢字手話のみを学習データとした統計的翻訳での出力の場合におけるスコアリングとの違いは、(1)の手法では、学習データが少ないため、翻訳結果のうち順位が下の方の物の精度があまり高くない場合が多い。そのため、翻訳結果の順位が下のもののスコアの下がり方を急にしている。一方、(3)の文字単位の学習データを用いた統計的翻訳手法は、データが多いことやコーパスの特性上、複数の人が翻訳した結果をまとめているため、人による表現の違いがあり、どれでも意味が通じるという場合が多い。そのため、本実施形態では、翻訳結果の順位によるスコアの差を小さくしている。なお、スコアの付け方については、これに限定されるものではない。本実施形態では、スコアの付け方についても上述したように翻訳手法に応じて設定を変えることができる。
<(4)単語単位の学習データを用いた統計的翻訳におけるスコア条件の例>
例えば、上述した(4)の単語単位の学習データを用いた統計的翻訳による出力の場合には、翻訳結果として現れた同一の単語の数をカウントし、そのカウントした結果をスコアとして出力する。なお、本実施形態では、「(a)入力の漢字以外の漢字が使われていない手話単語の場合」には、スコアを3倍にしたり、「(b)翻訳に使った日本語単語の文字数と出力の手話単語数が同一の場合」には、スコアを2倍にしたりすることで、漢字手話らしい場合のスコアを上げることができる。なお、本実施形態において、上述した(a),(b)の条件の両方に当てはまる場合には、予め設定された何れか一方のスコアのみ(例えば、3倍)を適用してもよく、また両方(例えば、3倍×2倍)を適用してもよい。
ここで、図13は、単語単位の学習データを用いた統計的翻訳に対応するスコアリングの一例を示す図である。図13の例では、「宮」という翻訳元文字(分割文字)に対応して、予め設定されたコーパスから翻訳元文字が使われている単語を検索し、各単語を手話に翻訳する。
なお、図13の例では、単語毎にコーパス中の出現頻度が対応付けられた単語リストが示されているが、このような単語リストを用いてもよく、他の項目からなるコーパスを用いてもよい。また、単語の検索は、所定数(例えば、最大10単語)まで検索してもよく、その場合の優先順位は、「名詞or形容詞」>「固有名詞」>「その他」として設定することができ、また同じ品詞の場合には、コーパス中の出現回数順(出現頻度順)に設定することができるが、これに限定されるものではない。
単語単位の学習データを用いた統計的翻訳におけるスコア条件では、上述の手法にて得られた各単語の翻訳結果に現れる手話単語数をカウントし、カウント結果をスコアとして出力する。なお、スコアの付け方としては、例えば翻訳元文字(とその送りがな)を直接翻訳した結果である場合(図13の例では、翻訳元文字、翻訳結果が共に「宮」)には、スコアを3倍にする。また、日本語単語の文字数(図13の例では、「宮里」、「宮古」(共に、文字数2))と手話単語数(図13の例では、「宮里」に対して{宮}と{農業}、「宮古」に対して{宮}と{古い}(共に手話単語数2))が同一の場合には、スコアを2倍にすることができるが、スコアの付け方については、これに限定されるものではない。
つまり、スコアリング手段14は、上述したように、各翻訳手法からの出力にスコアを設定する。また、翻訳結果統合手段16は、図13に示すように、上述したスコアリング手段15によりスコアリングされたそれぞれの翻訳結果毎のスコアを加算し、例えば、そのスコアの和が最大になった手話単語列を最終的な翻訳結果として出力する。
なお、翻訳結果統合手段16は、スコアの和がある値を下回った場合には、例えば、対応する手話単語列が存在しなかったものとして、その旨を示すエラーメッセージを表示してもよく、また予め設定された指文字で表現した手話翻訳を出力するようにしてもよい。
具体的には、翻訳結果統合手段16は、例えばスコアの合計が7以下の場合に、指文字を出力するといった処理を行うことができる。なお、本実施形態では、各翻訳手法での出力が指文字になる場合もある。
更に、翻訳結果統合手段16は、スコアの和がある値を上回った場合は、その単語がスコア最大でなくても、翻訳結果の候補として出力することができる。つまり、翻訳結果統合手段16は、スコアが所定の閾値以上の全ての翻訳結果を出力する。これは、例えば「沢」の字のように、一般に使われる翻訳が一つに定まらない(「沢」であれば、{たくさん}や{流れる}が使われる)場合に対応している。このような場合には、複数の翻訳結果を出力しておき、CGを制作するソフトウェア上で、人の手により使う翻訳を切り替えることができるようにすることができる。
上述したように、本実施形態では、例えば複数の翻訳手法による翻訳結果を統合し、スコアが最大になるものを出力することで、各翻訳手法単体での翻訳精度を補うことができ、高精度な手話翻訳を実現することができる。
<実施例1>
ここで、上述した手話翻訳手法を用いた実施例について説明する。実施例1において、「宮崎」を入力した場合には、まず、漢字手話のみを学習データとした統計的翻訳において、「宮」⇒{宮}(スコア10)、「崎」⇒{崎}(スコア10)、「宮崎」⇒{宮}{崎}(スコア10)が得られる。
また、ルールベース翻訳手法において、ルール(A)に該当する場合には、例えば「宮」⇒{宮}(スコア10)となり、ルール(C)で「宮」が先頭にあるに該当する場合には、例えば{宮内庁}(スコア4)となり、ルール(C)で「宮」が先頭にないものに該当する場合には、例えば{宇都宮}(スコア2)が得られる。更に、ルール(D)に該当する場合には、例えば{みやげ}(スコア1)が得られる。
同様に、「崎」⇒{崎}(スコア10)及び「宮崎」⇒{宮崎}(スコア10)は、共にルール(A)に該当するとする。
また、文字単位の学習データを用いた統計的翻訳手法において、「宮」は、「{N}{宮}⇒{宮}(スコア6)」、「{宮}(スコア0)(上と同じ出力のため、ここではスコアを付けない)」、「{N}(スコア0)」、「{N}{前}⇒{前}(スコア3)」、「⇒{一番}(スコア2)」、「⇒{前}({前}はすでにスコア付け済みであるため、ここではスコアを付けない)」が得られる。
また、同様に、「崎」⇒{崎}{N}⇒{崎}(スコア6)、「⇒{長崎}(スコア5)」、「⇒{崎}({崎}はスコア付け済みであるため、ここではスコアを付けない」)、「⇒{崎}{男}⇒{男}(スコア3)({崎}はスコア付け済みであるため、ここでは{男}にのみスコアを付ける)」が得られる。また、「宮崎」については、「{宮崎}(スコア6)」、「{宮}{崎}(スコア5)」が得られる。なお、上述の{N}は、うなずきを表す。本実施形態において、うなずきは固有名詞中では使われないため、無視して翻訳を行うことができる。
更に、単語単位の学習データを用いた統計的翻訳において、「宮」が使われている単語は、「宮崎」、「宮城」、「宮里」、「宮古」、「宮殿」、「宮内庁」、「宮古島」であるとする。この場合、「宮崎」⇒{宮崎}、「宮城」⇒{宮城}、「宮里」⇒{宮}{農業}、「宮古」⇒{宮}{古い}、「宮殿」⇒{ハウス(アメリカ手話)}、「宮内庁」⇒{宮}{省庁}、「宮古島」⇒{宮}{古い}{島}をまとめて、{宮}(スコア12)({宮}の出現回数が4で、入力の漢字以外の漢字が使われていない手話単語の条件に合致するため、スコア3倍)とし、{古い}(スコア4)({古い}の出現回数が2で、翻訳に使った日本語単語の文字数と出力の手話単語数が同一であるため、スコア2倍)とし、{農業}(スコア2)(翻訳に使った日本語単語の文字数と出力の手話単語数が同一であるため、スコア2倍)とし、{島}(スコア2)等として設定する。
また、同様に、「崎」が使われている単語は「宮崎」、「長崎」、「山崎」、「川崎」、「浜崎」、「尼崎」であるとし、「宮崎」⇒{宮崎}、「長崎」⇒{長崎}、「山崎」⇒{山}{崎}、「川崎」⇒{川}{崎}、「浜崎」⇒{始まる}、「尼崎」⇒{尼崎}等をまとめて、{崎}(スコア3)({崎}の出現回数1で、入力漢字以外の漢字が使われていない手話単語の条件に合致するため、スコア3倍)、{山}(スコア2)、{川}(スコア2)等として設定する。
更に、上述した翻訳結果を統合してスコアをまとめると、「宮」⇒{宮}(スコア38)、{宮内庁}(スコア4)、{前}(スコア3)、宇都宮(スコア3)、「崎」⇒{崎}(スコア29)、{長崎}(スコア5)・・・宮崎⇒{宮崎}(スコア15)、{宮}{崎}(スコア14)となり、出力は「宮崎⇒{宮}{崎}」となる。
なお、翻訳結果出力手段17は、合計時には、{宮崎}(スコア15)と{宮}{崎}のスコアの平均を比較し、その比較結果に基づいて最終的な翻訳結果を出力する。上述の例では、{宮}{崎}の方が、スコアが高いため、{宮}{崎}が翻訳結果(手話単語列)として出力される。
<実施例2>
次に、実施例2について説明する。実施例2では、例えば「長友」を入力したとすると、漢字手話のみを学習データとした統計的翻訳により、「「長」⇒{長い}(スコア10)」、「「友」⇒(未知語)(学習データに現れないため、翻訳不能)」となる。
また、ルールベース翻訳手法では、「長」に対し「⇒{長い}(スコア10)」、「{長所}(スコア4)(ルール(C)のうち、先頭に「長」があるものに該当)」、「{長女}(スコア4)(ルール(C)のうち、先頭に「長」があるものに該当)」、「{長生き}(スコア4)(ルール(C)のうち、先頭に「長」があるものに該当)」、「{学長}(スコア1)」、「{会長}(スコア1)」等が得られる。
また、「友」については、「{友情}(スコア4)(ルール(C)のうち、先頭に「友」があるものに該当)」、「{友達}(スコア4)(ルール(C)のうち、先頭に「友」があるものに該当)」、「{友人}(スコア4)(ルール(C)のうち、先頭に「友」があるものに該当)」、{共に}(スコア1)(ルール(D)に該当)」等が得られる。
また、文字単位の学習データを用いた統計的翻訳手法では、「長」に対して「⇒{N}{彼}⇒{彼}(スコア6)」、「{彼}({彼}はすでにスコア付け済み)」、「{長い}(スコア4)」が得られる。また、「友」に対して「⇒{友達}{N}⇒{友達}(スコア6)」、「{友達}({友達}はすでにスコア付け済み)」、「{トモ[指文字]}(スコア4)」、「{三人}(スコア3)(翻訳ミス)」等が得られる。
更に、単語単位の学習データを用いた統計的翻訳手法では、「長」が使われている単語が「長い」、「長崎」、「長野」、「長嶋」、「長田」、「長友」であった場合、「長い」⇒{長い}、「長崎」⇒{長崎}、「長野」⇒{長野}、「長嶋」⇒{長い}{島}、「長田」⇒{長い}{田}、「長友」⇒{長い}{友達}等をまとめて、「{長い}(スコア12)(出現回数4、入力の漢字以外の漢字が使われていない手話単語の条件に合致するため、スコア3倍)」、「{島}(スコア2)」、「{田}(スコア2)(出現回数1、翻訳に使った日本語単語の文字数と出力の手話単語数が同一に該当するため、スコア2倍)」等が得られる。
更に、「友」が使われている単語が「住友」、「長友」、「友人」、「交友」である場合に、住友⇒{いる}{友達}、長友⇒{長い}{友達}、友人⇒{友達}、交友⇒{友達}等をまとめて、「{友達}(スコア8)」、「{いる}(スコア2)」、「{長い}(スコア2)」等が得られる。
更に、上述した翻訳結果を統合してスコアをまとめると、「長」⇒{長い}(スコア36)、{彼}(スコア6)、{長所}(スコア4)等となり、「友」⇒{友達}(スコア18)、{トモ[指文字]}(スコア4)、{友人}(スコア4)等となるため、出力は「長友」⇒{長い}{友達}となる。
本実施形態では、予め設定された複数の翻訳手法のうち、何れか1つを用いて単独で翻訳することは可能であるが、上述した実施例1,2に示すように、複数の翻訳手法を組み合わせて翻訳結果を出力することで、例えば上記の「友」の字のように、翻訳手法(1)では翻訳できず、翻訳手法(2)で複数の候補が得られた場合にも、翻訳手法(3),(4)の翻訳結果を融合することで、高精度な翻訳結果を得ることができる。
なお、実施例1、2では、上述した翻訳手法(1)〜(4)を全て行い、そのスコアを集計して翻訳結果を出力しているが、これに限定されるものではなく、少なくとも1つの結果を用いて出力してもよい。
<実行プログラム>
ここで、上述した手話翻訳装置10は、例えばCPU(Central Processing Unit)、RAM(Random Access Memory)等の揮発性の記憶装置、ROM(Read Only Memory)等の不揮発性の記憶装置、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータ等を表示する表示装置、並びに外部と通信するためのインタフェース装置を備えたコンピュータによって構成することができる。
したがって、手話翻訳装置10が有する上述した各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現可能となる。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記録媒体に格納して頒布することもできる。
つまり、上述した各構成における処理をコンピュータに実行させるための実行プログラム(手話翻訳プログラム)を生成し、例えば汎用のパーソナルコンピュータやサーバ等にそのプログラムをインストールすることにより、手話翻訳処理を実現することができる。なお、本実施形態における実行プログラムによる処理については、例えば上述した各処理を実現することができる。
上述したように開示の技術によれば、高精度な手話翻訳を実現することができる。具体的には、開示の技術は、例えば日本語の固有名詞の入力を自動で手話の単語列に翻訳する際、学習データに出てこない単語や文字に対しても高精度な翻訳を行うことができる。
また、開示の技術は、例えば日本語を手話に翻訳する際の固有名詞等の翻訳を自動で行い、手話通訳の支援やCGへの変換に利用する自然言語処理に広く適用することができる。そのため、本実施形態における手話翻訳装置の入力データとしては、上述した固有名詞に限定されず、あらゆる自然言語等にも適用することができる。
なお、従来では、例えば一部の番組等で手話での放送を行っているが、手話通訳者の確保が困難であり、CGを用いた手話映像も精度がよいとは言えないため、夜間等の突発的な災害等には、手話での情報提示が行えない場合があったが、開示の技術を適用することにより、高精度な手話映像を提供することができる。
以上、開示の技術の好ましい実施形態について詳述したが、開示の技術は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された開示の技術の要旨の範囲内において、種々の変形、変更が可能である。
10 手話翻訳装置
11 文字取得手段
12 文字分割手段
13 翻訳設定手段
14 翻訳手段
15 スコアリング手段
16 翻訳結果統合手段
17 翻訳結果出力手段
21 統計的翻訳手段
22 統計的翻訳モデル
23 統計的翻訳結果格納手段
24 漢字−読み変換手段
25 未知語部読み仮名格納手段
26 翻訳結果合成手段
31 手話単語辞書
32 ルールベース翻訳手段
33 ルールベース翻訳結果格納手段
41 対訳候補列挙手段
42 翻訳順位決定手段
51 文字使用単語列挙手段
52 コーパス内単語辞書
53 対訳候補列挙手段
54 最適翻訳決定手段

Claims (8)

  1. 入力データに対する手話翻訳を行う手話翻訳装置において、
    前記入力データを所定の文字毎に分割する文字分割手段と、
    前記文字分割手段により得られる分割された文字に対して、予め設定された複数の翻訳手法のうち、少なくとも1つの翻訳手法を用いて手話翻訳を行う翻訳手段と、
    前記翻訳手法毎に予め設定されたスコア条件に基づいて、前記翻訳手段により得られる翻訳結果に対するスコアリングを行うスコアリング手段と、
    前記翻訳結果における同一単語毎に前記スコアリング手段により得られるスコア結果を統合する翻訳結果統合手段と、
    前記翻訳結果統合手段により得られる統合されたスコア結果に基づいて最終的な手話の翻訳結果を出力する翻訳結果出力手段とを有することを特徴とする手話翻訳装置。
  2. 前記翻訳手段は、
    漢字手話のみを学習データとした統計的翻訳、ルールベース翻訳、文字単位の学習データを用いた統計的翻訳、及び単語単位の学習データを用いた統計的翻訳を含む翻訳手法のうち、選択的に選ばれる少なくとも1つの翻訳手法を用いて翻訳を行うことを特徴とする請求項1に記載の手話翻訳装置。
  3. 前記翻訳結果統合手段は、
    前記スコアリング手段により得られるスコアリング結果に対して所定の条件に対応させた重み付けを行い、重み付けを行ったスコアリング結果を用いて統合を行うことを特徴とする請求項1又は2に記載の手話翻訳装置。
  4. 前記漢字手話のみを学習データとした統計的翻訳は、
    前記文字分割手段により得られる文字毎に、予め設定された統計的翻訳モデルを参照し、翻訳された文字と、翻訳できなかった未知語とに分類し、前記未知語に対して読み仮名変換を行い、前記翻訳された文字と、前記読み仮名変換された文字とを前記入力データに対応させて合成した結果を翻訳結果として出力することを特徴とする請求項2に記載の手話翻訳装置。
  5. 前記ルールベース翻訳は、
    前記文字分割手段において、前記入力データに対して予め設定された手話単語辞書を参照し、最長一致文字に分割し、分割された文字に対して、予め設定されたルールに基づく翻訳を行うことを特徴とする請求項2に記載の手話翻訳装置。
  6. 前記文字単位の学習データを用いた統計的翻訳は、
    予め登録された翻訳元の言語と翻訳先の言語とを対応させて統計的に学習されたコーパスを用いて、前記分割された文字に対する翻訳を行うことを特徴とする請求項2に記載の手話翻訳装置。
  7. 前記単語単位の学習データを用いた統計的翻訳は、
    予め登録された翻訳元の言語と翻訳先の言語とを対応させて統計的に学習されたコーパスを用いて、前記分割された文字が使用されている単語を全て検索し、検索結果を翻訳結果として出力し、
    前記スコアリング手段は、
    前記翻訳結果として得られる同一単語数をカウントし、カウント結果をスコアとして出力することを特徴とする請求項2に記載の手話翻訳装置。
  8. コンピュータを、請求項1乃至7の何れか1項に記載の手話翻訳装置が有する各手段として機能させるための手話翻訳プログラム。
JP2012157359A 2012-07-13 2012-07-13 手話翻訳装置及び手話翻訳プログラム Pending JP2014021180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012157359A JP2014021180A (ja) 2012-07-13 2012-07-13 手話翻訳装置及び手話翻訳プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012157359A JP2014021180A (ja) 2012-07-13 2012-07-13 手話翻訳装置及び手話翻訳プログラム

Publications (1)

Publication Number Publication Date
JP2014021180A true JP2014021180A (ja) 2014-02-03

Family

ID=50196135

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012157359A Pending JP2014021180A (ja) 2012-07-13 2012-07-13 手話翻訳装置及び手話翻訳プログラム

Country Status (1)

Country Link
JP (1) JP2014021180A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015166902A (ja) * 2014-03-03 2015-09-24 日本放送協会 非手指動作検出装置及びプログラム
JP2016051171A (ja) * 2014-08-28 2016-04-11 日本放送協会 固有名詞翻訳装置および固有名詞翻訳方法
CN105565640A (zh) * 2015-12-28 2016-05-11 无锡国联环保科技股份有限公司 一种污泥均质浆化与热水解反应一体装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015166902A (ja) * 2014-03-03 2015-09-24 日本放送協会 非手指動作検出装置及びプログラム
JP2016051171A (ja) * 2014-08-28 2016-04-11 日本放送協会 固有名詞翻訳装置および固有名詞翻訳方法
CN105565640A (zh) * 2015-12-28 2016-05-11 无锡国联环保科技股份有限公司 一种污泥均质浆化与热水解反应一体装置

Similar Documents

Publication Publication Date Title
US11675977B2 (en) Intelligent system that dynamically improves its knowledge and code-base for natural language understanding
CN108287858B (zh) 自然语言的语义提取方法及装置
CN109416705B (zh) 利用语料库中可用的信息用于数据解析和预测
CN109844742B (zh) 分析系统
US10839155B2 (en) Text analysis of morphemes by syntax dependency relationship with determination rules
KR20160097352A (ko) 전자 디바이스로 이미지 또는 라벨을 입력하기 위한 시스템 및 방법
Seker et al. Extending a CRF-based named entity recognition model for Turkish well formed text and user generated content.
Reganti et al. Modeling satire in English text for automatic detection
CN110555440B (zh) 一种事件抽取方法及装置
Shyamasundar et al. Twitter sentiment analysis with different feature extractors and dimensionality reduction using supervised learning algorithms
JP2020140692A (ja) 文抽出システム、文抽出方法、及びプログラム
JP6320397B2 (ja) 音声選択支援装置、音声選択方法、およびプログラム
Serigos Applying corpus and computational methods to loanword research: new approaches to Anglicisms in Spanish
JP2014021180A (ja) 手話翻訳装置及び手話翻訳プログラム
Kirmani et al. ShortMail: an email summarizer system
KR20130075124A (ko) 텍스트의 정서 단어 추출을 통한 정서 분석 장치 및 방법, 그리고 그 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록매체
JP6144458B2 (ja) 手話翻訳装置及び手話翻訳プログラム
Jung et al. A corpus-based approach to classifying emotions using Korean linguistic features
US20200342176A1 (en) Variable data generating apparatus, prediction model generating apparatus, variable data generating method, prediction model generating method, program, and recording medium
JP6325789B2 (ja) 翻訳装置及び翻訳プログラム
Ulinski et al. Finding emotion in image descriptions
JP5320326B2 (ja) 記号変換装置、記号変換方法、記号変換プログラム
JP5339628B2 (ja) 未知語を含む文章を分類するための文章分類プログラム、方法及び文章解析サーバ
Shilpa et al. DR: Abs-Sum-Kan: an abstractive text summarization technique for an Indian regional language by induction of Tagging rules
JP6373198B2 (ja) テキスト変換装置、方法、及びプログラム