JP6144458B2 - 手話翻訳装置及び手話翻訳プログラム - Google Patents
手話翻訳装置及び手話翻訳プログラム Download PDFInfo
- Publication number
- JP6144458B2 JP6144458B2 JP2012049373A JP2012049373A JP6144458B2 JP 6144458 B2 JP6144458 B2 JP 6144458B2 JP 2012049373 A JP2012049373 A JP 2012049373A JP 2012049373 A JP2012049373 A JP 2012049373A JP 6144458 B2 JP6144458 B2 JP 6144458B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- sign language
- word
- statistical
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
Description
本発明は、例えば原始言語の一例である日本語を、目的言語の一例である自然な手話に翻訳するために、統計的手法又はルールベース手法、或いはその両方を併用した手法を用いて、例えば対訳に出現しない日本語に対しても高精度な漢字手話に翻訳することを可能にする。
固定訳とは、その固有名詞を表す手話単語がすでに決まっている場合の翻訳を意味する。例えば、「広島」は、手話では厳島神社の鳥居の様子を手指動作で表現することによって表す。また、固定訳は、その地の特徴,特産物や市のシンボル等が用いられることが多い。また、固定訳は、非常に特徴的な表現であるため、確実に意味を伝えることができ、また簡潔に表現できるため、優先して使われることが多い。しかしながら、固定訳が決まっていない固有名詞が多く、決まっていてもその地域でしか通用しないものもある。
漢字手話による訳は、固有名詞を文字毎に分割して、各文字を漢字手話で置き換えた場合の翻訳を意味する。また、漢字手話は、日本語の漢字1文字に対応した手話の単語である。その対応のさせ方は、例えば漢字から何らかの意味で連想される手話の単語を選択して行われている。例えば、日本語の漢字「福」に対応する漢字手話は、意味的に近い手話単語{幸せ}である。漢字手話は、慣習的に使われるものはあるものの、決まったものがあるわけではない。漢字手話を使うと、例えば、「福島」は、「福」と「島」の2つの文字に分けて、「福」は{幸せ}、「島」は{島}と表される。漢字手話は、指文字よりも簡潔に表現することができるため、固定訳がない場合に多く用いられる。
指文字による訳は、固有名詞の読み仮名を指文字で表した場合の翻訳を意味する。手話では、日本語の50音が全て指文字として定義されている。指文字は、表現力は高いが1単語の表出に多くの時間がかかるという問題があるため、日本の地名ではあまり使われない。しかしながら、漢字手話による翻訳ができない外国の地名やカタカナ語によく用いられる。
漢字手話と指文字の組み合わせによる訳は、上述した漢字手話と指文字とを組み合わせた場合の翻訳を意味する。例えば、「長野」の場合は、「長」は手話単語の{長い}を使って表し、「野」は指文字の{ノ}を使って表す。読み仮名が短い漢字の場合には、漢字手話よりも指文字が使われやすい。
例えば、上述したような固有名詞の翻訳には、上述した4つの種類の場合を処理すればよい。このうち、「固定訳」は、地名の対訳辞書の拡張を行うことで対処せざるを得ず、「指文字による訳」は、単純に読み仮名を指文字に置き換えればよい。問題となるのは「漢字手話による訳」と「漢字手話と指文字の組み合わせによる訳」である。何れの場合も共通の問題となるのは「漢字手話」をどう決めるかである。したがって、本実施形態では、一例として、漢字手話の処理を中心に固有名詞の翻訳処理について、以下に説明する。
第1実施形態では、統計的手法を用いた翻訳を行う。第1実施形態において、固有名詞の翻訳は、一種の機械翻訳である。そこで、第1実施形態では、統計的機械翻訳手法を用いて、例えば固有名詞の翻訳を行う。なお、以下の説明では、固有名詞の一例として日本語の地名を用いることとするが、本発明においてはこれに限定されるものではなく、他の固有名詞でもよく、固有名詞でなくてもよい。例えば、日本語の地名については、翻訳単位を1文字とし,手話の地名では{}に囲まれた手話の1単語を翻訳単位として学習を行う。また、指文字で翻訳されている場合は、指文字の内容をカタカナで表現し、各文字を翻訳単位とする。
ここで、第1実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図2は、第1実施形態における手話翻訳処理手順の一例を示すフローチャートである。
ここで、上述した第1実施形態を用いた手話翻訳の具体例について説明する。
文字分割手段21は、例えば、「川越」のような地名データが入力された場合に、「川」、「越」のように各文字に分割し、分割した各文字を統計的翻訳手段22に出力する。統計的翻訳手段22は、「川」、「越」のような文字が入力された場合には、統計的翻訳モデル31を参照し、「川」に対応する{川}、「越」に対応する{越える}が統計的翻訳モデル31にある場合に、その結果を取得する。また、統計的翻訳手段22は、取得した{川},{越える}を統計的翻訳結果格納手段23に出力して格納させる。なお、上述の例では、「川」、「越」に対する翻訳結果が得られたため、未知語がない。そのため、統計的翻訳手段22は、漢字−読み変換手段24に何も出力しない。
文字分割手段21は、例えば「高槻」のような地名データが入力された場合に、「高」、「槻」ように各文字に分割し、分割した各文字を統計的翻訳手段22に出力する。統計的翻訳手段22は、統計的翻訳モデル31に基づいて翻訳が行われる。この場合、統計的翻訳モデル31には、「高」に対応する{高い}が存在し、「槻」は対応する手話が見つからなかったとする。そのため、統計的翻訳手段22は、{高い}を統計的翻訳結果格納手段23に格納し、漢字−読み変換手段24に「槻」を出力する。
ここで、上述した第1実施形態においては、統計的翻訳手段22における統計的翻訳モデル31を用いた翻訳結果が1つの文字に対して複数になる場合がある。その場合には、統計的翻訳モデル31にスコアをセットしておき、そのセットされたスコアに基づいて、翻訳結果を出力する。
次に、第2実施形態について説明する。上述した第1実施形態に示す統計的機械翻訳において、精度を高めるには、ある程度大規模なコーパス(学習データ)から作成した統計的手話モデルが必要となる。例えば、手話の地名については、「全国地名手話マップ」((財)全日本ろうあ連盟出版局(編)、2011)等があるが、そのサイズは非常に小さい。したがって、翻訳できない場合が多いことが予想される。そこで、第2実施形態では、漢字手話の処理を行うルールを予め人手等により設定しておき、そのルールを用いて翻訳を行う。
ここで、第2実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図5は、第2実施形態における手話翻訳処理手順の一例を示すフローチャートである。
ここで、上述したルールベース翻訳処理手順についてフローチャートを用いて説明する。図6は、ルールベース翻訳処理手順の一例を示すフローチャートである。図6の例において、ルールベース翻訳処理は、最長一致の文字を入力し(S21)し、手話単語辞書61を参照して、入力された文字が現れる単語のうち、入力漢字以外の漢字が使われていない単語があるか否かを判断する(S22)。
ここで、上述したルールベース翻訳処理の具体例について説明する。上述したように、第2実施形態では、漢字手話を求めたい日本語漢字1文字(入力漢字)を、以下の4つのルールを順に適用して処理を行う。ルール1では、手話単語辞書61を参照し、入力漢字の日本語ラベルに含まれる手話単語を抽出する。ただし、日本語ラベルは、漢字1文字のみか、その漢字と平仮名のみの場合である。例えば、「美」の場合には、手話単語{美しい}が求められる。
ここで、上述した手話単語辞書61の具体例について説明する。図7は、手話単語辞書の具体例を示す図である。図7に示す手話単語辞書61は、手話単語とそれに対応する日本語ラベル(日本語見出し)、ラベルの読み仮名(カタカナ表記)と、上述した予め設定された各手話単語の学習データ中での出現頻度を格納してある。
次に、第3実施形態について説明する。第3実施形態では、上述した2つの翻訳手法を融合して手話翻訳の翻訳精度を向上させる。例えば、第1実施形態に対応する統計的手法を用いた場合には、翻訳できる場合は精度が高いが、未知語が多かったり、手話固有名詞専用に翻訳の単位を単語毎ではなく文字毎に設計する必要がある。また、第2実施形態に対応するルールベース手法を用いた場合には、未知語が少ないが精度はやや低く、手話表現の分析により手話の固有名詞専用にルールを作成する必要がある。そこで、第3実施形態では、最初に統計的翻訳手法で翻訳を行い、その翻訳結果で未知語であったものに対してルールベース手法で翻訳を行うようにして、2段階で翻訳を行う融合法を用いる。
ここで、第3実施形態における手話翻訳処理手順について、フローチャートを用いて説明する。図9は、第3実施形態における手話翻訳処理手順の一例を示すフローチャートである。
ここで、第3実施形態における手話翻訳の具体例について説明する。なお、以下の例では、上述した「全国地名手話マップ」を用いて学習した統計的文字変換辞書と、本出願人が作成した日本語ラベル数6803の手話単語辞書を使った場合の動作例を示す。
次に、上述した第1〜第3実施形態における手話翻訳の実行結果について図を用いて説明する。図10は、第1〜第3実施形態における手話翻訳の実行結果の比較例を示す図である。
ここで、上述した手話翻訳装置10,40,70は、例えばCPU(Central Processing Unit)、RAM(Random Access Memory)等の揮発性の記憶媒体、ROM(Read Only Memory)等の不揮発性の記憶媒体、マウスやキーボード、ポインティングデバイス等の入力装置、画像やデータ等を表示する表示装置、並びに外部と通信するためのインタフェース装置を備えたコンピュータによって構成することができる。
11 地名入力装置
12,41,71 データ処理装置
13 記憶装置
14 翻訳結果出力装置
21 文字分割手段
22 統計的翻訳手段
23 統計的翻訳結果格納手段
24 漢字−読み変換手段
25 未知語部読み仮名格納手段
26,81 翻訳結果合成手段
31 統計的翻訳モデル
51 最長一致文字分割手段
52 ルールベース翻訳手段
53 ルールベース翻訳結果格納手段
61 手話単語辞書
Claims (3)
- 日本語の固有名詞である入力データに対する手話翻訳を行う手話翻訳装置において、
前記入力データを所定の文字毎に分割する文字分割手段と、
前記文字分割手段により得られる文字毎に、予め設定された統計的翻訳モデルを参照し、翻訳された文字と、翻訳できなかった未知語とを分類する統計的翻訳手段と、
手話単語辞書に登録された単語のうち、前記統計的翻訳手段により分類された前記未知語に対して、最長一致する単語を出力する最長一致文字分割手段と、
前記最長一致文字分割手段により得られる単語に対して、予め設定されたルールに基づく翻訳を行うルールベース翻訳手段と、
前記統計的翻訳手段により得られる翻訳結果と、前記ルールベース翻訳手段により得られる翻訳結果とを、前記入力データに対応させて合成する翻訳結果合成手段とを有し、
前記統計的翻訳手段は、
前記統計的翻訳モデルを参照した結果、入力される文字に対応する翻訳結果が複数ある場合に、前記統計的翻訳モデルの翻訳結果毎に設けられたスコアに基づいて、所定の翻訳結果を出力することを特徴とする手話翻訳装置。 - 前記翻訳結果合成手段により得られる翻訳結果の手話単語列に対応させた手話映像を出力することを特徴とする請求項1に記載の手話翻訳装置。
- コンピュータを、請求項1または2に記載の手話翻訳装置として機能させることを特徴とする手話翻訳プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012049373A JP6144458B2 (ja) | 2012-03-06 | 2012-03-06 | 手話翻訳装置及び手話翻訳プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012049373A JP6144458B2 (ja) | 2012-03-06 | 2012-03-06 | 手話翻訳装置及び手話翻訳プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013186189A JP2013186189A (ja) | 2013-09-19 |
JP6144458B2 true JP6144458B2 (ja) | 2017-06-07 |
Family
ID=49387687
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012049373A Expired - Fee Related JP6144458B2 (ja) | 2012-03-06 | 2012-03-06 | 手話翻訳装置及び手話翻訳プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6144458B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6325789B2 (ja) * | 2013-09-27 | 2018-05-16 | 日本放送協会 | 翻訳装置及び翻訳プログラム |
JP6607723B2 (ja) * | 2014-08-28 | 2019-11-20 | 日本放送協会 | 固有名詞翻訳装置 |
CN112084796B (zh) * | 2020-09-15 | 2021-04-09 | 南京文图景信息科技有限公司 | 一种基于Transformer深度学习模型的多语种地名词根汉译方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011175598A (ja) * | 2010-02-25 | 2011-09-08 | Nippon Hoso Kyokai <Nhk> | 手話アニメーション生成装置及び手話アニメーション生成プログラム |
-
2012
- 2012-03-06 JP JP2012049373A patent/JP6144458B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013186189A (ja) | 2013-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8935148B2 (en) | Computer-assisted natural language translation | |
US8407040B2 (en) | Information processing device, method and program | |
WO2003065245A1 (fr) | Procede de traduction, procede de production de phrase traduite, support d'enregistrement, programme et ordinateur | |
TW201250498A (en) | Transliteration device, program, recording medium, and method | |
JP2021196708A (ja) | 翻訳装置およびプログラム | |
JP6144458B2 (ja) | 手話翻訳装置及び手話翻訳プログラム | |
Mammadzada | A review of existing transliteration approaches and methods | |
US20120150530A1 (en) | Information processing device and display control method | |
JP6160438B2 (ja) | 機械翻訳装置、機械翻訳プログラム及び機械翻訳方法 | |
US8135573B2 (en) | Apparatus, method, and computer program product for creating data for learning word translation | |
JP2013186673A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JP6689466B1 (ja) | 文構造ベクトル化装置、文構造ベクトル化方法、及び文構造ベクトル化プログラム | |
JP5833087B2 (ja) | 文字列処理装置、方法、及びプログラム | |
JP6325789B2 (ja) | 翻訳装置及び翻訳プログラム | |
JP2019159743A (ja) | 対応関係生成プログラム、対応関係生成装置、対応関係生成方法、及び翻訳プログラム | |
JP4478042B2 (ja) | 頻度情報付き単語集合生成方法、プログラムおよびプログラム記憶媒体、ならびに、頻度情報付き単語集合生成装置、テキスト索引語作成装置、全文検索装置およびテキスト分類装置 | |
JP2009157888A (ja) | 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム | |
JP2014021180A (ja) | 手話翻訳装置及び手話翻訳プログラム | |
JP5398638B2 (ja) | 記号入力支援装置、記号入力支援方法、及びプログラム | |
JP5298833B2 (ja) | 翻訳装置及び翻訳プログラム | |
JP2006190072A (ja) | 自動換言装置、自動換言方法及び換言処理プログラム | |
JP6373198B2 (ja) | テキスト変換装置、方法、及びプログラム | |
JP4035111B2 (ja) | 対訳語抽出装置、及び対訳語抽出プログラム | |
JP3961858B2 (ja) | 翻字装置及びそのプログラム | |
WO2009144890A1 (ja) | 翻訳前換言規則生成システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150202 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160325 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160405 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160525 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161004 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170411 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170511 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6144458 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |