JP2020177196A - 手話cg制作支援装置及びプログラム - Google Patents

手話cg制作支援装置及びプログラム Download PDF

Info

Publication number
JP2020177196A
JP2020177196A JP2019081341A JP2019081341A JP2020177196A JP 2020177196 A JP2020177196 A JP 2020177196A JP 2019081341 A JP2019081341 A JP 2019081341A JP 2019081341 A JP2019081341 A JP 2019081341A JP 2020177196 A JP2020177196 A JP 2020177196A
Authority
JP
Japan
Prior art keywords
sign language
label
candidates
japanese
label candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019081341A
Other languages
English (en)
Inventor
修一 梅田
Shuichi Umeda
修一 梅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2019081341A priority Critical patent/JP2020177196A/ja
Publication of JP2020177196A publication Critical patent/JP2020177196A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)

Abstract

【課題】手話に特化した評価指標に基づいて、適切、且つ高精度に手話単語のラベル候補を列挙して、手話コンピュータグラフィックス(CG)アニメーションの制作を支援する手話CG制作支援装置及びプログラムを提供する。【解決手段】本発明の手話CG制作支援装置10は、翻訳対象の日本語原文を手話単語ラベル羅列に初期変換する順方向機械翻訳部11と、その手話単語ラベル羅列について逆翻訳を行う逆方向機械翻訳部12と、日本語翻訳文と日本語原文との類似度判定を行う比較器13Aと、比較器13Aの制御によりラベル候補の候補順が自動修正された手話単語ラベル羅列を基に、編集可能とし、又は最も順位の高いラベル候補の組み合わせで手話CGアニメーションを生成する手話CG生成部14と、を備える。【選択図】図1

Description

本発明は、日本語原文から自動翻訳された日本手話の手話単語列に基づく手話コンピュータグラフィックス(CG)アニメーションの制作を支援する手話CG制作支援装置及びプログラムに関する。
現在の技術では日本語文章テキストの日本語原文から高品質な手話CGを全自動で生成することが難しいため、編集操作可能にする手話CG制作支援装置が用いられている。このような手話CG制作支援装置を用いる場合でも、編集或いは修正作業には手話について習熟している必要があることから、手話CG制作支援装置を構成する上では、できるだけ誰でも簡単に作業できることが望ましい。
そこで、手話CG制作支援装置として、日本語文章テキストから日本手話の手話単語列へと自動的に翻訳し、日本手話の形式で情報提示できる手話CGアニメーションを生成する際に、より簡単に手話CG制作に係る編集又は修正を可能とする技術が提案されている(例えば、特許文献1、非特許文献1参照)。
その他にも、手話CG制作に係る編集を可能とする種々の形態の手話CG制作支援装置があるが、総括すると、図10に示すように構成される。図10は、従来技術における手話CG制作支援装置100の概略構成を示すブロック図である。
図10に示す従来技術の手話CG制作支援装置100は、機械翻訳部111、学習データデータベース(DB)111a、手話CG生成部114、及びモーションデータデータベース(DB)114aを備える。
機械翻訳部111は、翻訳対象の日本語文章テキストにおける日本語原文を入力し、日本語原文における各単語について、学習データに基づく機械学習により学習データDB111aを参照し、所定数内でラベル候補を挙げて手話単語のラベルに変換し、所定数内でラベル候補を有する手話単語ラベルの羅列(以下、「手話単語ラベル羅列」と称する。)を手話CG生成部114に出力する。
例えば、機械翻訳部111は、事前学習済みのニューラルネットワークで構成することができ、予め多数の手話単語のラベル候補が保持されている学習データDB111aから、翻訳対象の日本語原文における各単語に対応付けられる可能性がある手話単語のラベル候補を所定数内で抽出する。
手話CG生成部114は、機械翻訳部111から得られる手話単語ラベル羅列を編集操作用にディスプレイ(図示略)に提示し、編集操作により、そのラベル候補の組み合わせを選択可能としている。そして、手話CG生成部114は、その組み合わせ選択による編集操作で決定されたラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB114aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する。
このように、機械翻訳部111により日本語原文における各単語を手話単語のラベルに変換する際、及び手話CG生成部114により各ラベルに応じたモーションデータを合成する際に誤りが含まれることがある。このため、従来技術の手話CG制作支援装置100では、当該ディスプレイに手話単語ラベル羅列や手話CGアニメーションを提示できるようになっており、特に、特許文献1又は非特許文献1に開示される技法では編集や修正が容易にできるようになっている。
ところで、或る原文の自動翻訳が人間が予め作成した参考翻訳にどれだけ近いかを示す評価指標を評価値として表すBLEU(Bilingal Evaluation Understudy)と称されるアルゴリズムが知られている(例えば、非特許文献2参照)。このBLEUアルゴリズムによる評価指標を手話CG制作支援装置100に適用すると、機械翻訳部111により日本語原文を所定数内でラベル候補を持つ手話単語ラベル羅列に変換し、その後、BLEUアルゴリズムによる評価指標が示す評価値順に当該ラベル候補の組み合わせを決定し、最も原文に類似する順序で手話単語列を提示することができるようになる。しかし、このBLEUアルゴリズムでは、予め正確な参考翻訳を多数用意する必要があり、現時点の日本手話では、そのような正確な参考翻訳もないことから、手話変換に用いる実用性に乏しい。
尚、日本手話ではないが、学習データに基づく機械学習により、手話映像データから手話単語ラベル羅列に変換するアルゴリズムが開示されている(例えば、非特許文献3参照)。このアルゴリズムでは、手話映像から言語文に自動変換するために、機械学習に基づき、手話映像上の各モーションが示すラベルを推定して抽出し、且つ抽出した各ラベルの並び順を言語文用に推定して並び替えるものとなっている。このような手話映像から言語文に自動変換する機械学習は、日本語についても、精度の向上に研究の余地があるものの同様に適用できる。
特開2018−128543号公報
日本放送協会,"スポーツ情報の手話CG制作システム",[online],[平成31年3月22日検索],NHK放送技術研究所,インターネット〈URL: https://www.nhk.or.jp/strl/open2018/tenji/6.html〉 Microsoft,"BLEU評価値とは",[online],[平成31年3月22日検索],Microsoft corporation,インターネット〈URL: http://docs.microsoft.com/ja-jp/azure/cognitive-services/translator/custom-translator/what-is-bleu-score〉 N. C. Camgoz, S.Hadfield, O. Koller, H. Ney, R. Bowden,"Neural SignLanguage Translation",[online],[平成31年3月22日検索],University of Surrey, RWTH Aachen University,インターネット〈URL: https://www-i6.informatik.rwth-aachen.de/publications/download/1064/CamgozCihanHadfieldSimonKollerOscarNeyHermannBowdenRichard--NeuralSignLanguageTranslation--2018.pdf〉
前述したように、現在の技術では日本語文章テキストから高品質な手話CGを全自動で生成することが難しいため、編集操作可能にする手話CG制作支援装置がある。
一般的には機械翻訳の精度が高くなっているが、機械棚訳の結果が誤っている場合があり、その編集や修正の作業を効率的に行えるようにするには、編集や修正用の代替の手話単語のラベルを適切、且つ高精度に候補として列挙できるようにする技法が望まれる。
更に、手話CGアニメーションが日本語原文の意味を伝えることは、日本語から手話への自動翻訳における必要条件である。また、正しい翻訳は必ずしも1つであることは限らず、できるだけ細かいニュアンスまで忠実に伝える翻訳文を生成することが求められる。
自然言語の機械翻訳における編集時には、一般に「流暢さ(Fluency)」と「適切性(Adequacy)」を人手により評価して、日本語から日本手話への機械翻訳も同様と考えらえる。しかし、実際に人手で評価しようとすると、手話においては他の自然言語と比較して次のような違いがある。
(1)文法構造の解明と評価の定式化が確立されていない。
(2)手話を表記したり、文字に書き起こしたりすることが一般的でないため、翻訳の正解データ(正確な参考翻訳)の収集規模が小さい。
(3)手話単語ラベルの羅列だけではなく、最終出力の手話CGアニメーションを比較する必要がある。他の言語では、単語ラベルの羅列を比較して評価を行っているが、手話においてはこの評価方法だけでは不十分である。
(4)手話CGアニメーション上のアバターの外見など主観的な要素が大きく、人によって好みが異なるため、手話CGアニメーションの客観的評価が確立されていない。
従って、手話には以上のような特徴があるために、他の自然言語間で用いられる翻訳手法や、評価手法がそのまま適用できない。例えば、自然言語の翻訳で一般的に使用される評価指標を示すBLEUでは、正解データと機械翻訳の結果とを比較することで評価するが、手話には正解データが少なく、そのまま適用することはできない。
そこで、他の自然言語と同等の翻訳品質を得るために、正解データがなくても評価することができる手話に特化した評価指標を確立し、この評価指標に基づいて、適切、且つ高精度に手話単語のラベル候補を列挙できるようにして、自動翻訳された日本手話の手話単語列に係る自動或いは手動での編集或いは修正を支援する技法が望まれる。
本発明の目的は、上述の問題に鑑みて、手話に特化した評価指標を確立し、この評価指標に基づいて、適切、且つ高精度に手話単語のラベル候補を列挙して、手話コンピュータグラフィックス(CG)アニメーションの制作を支援する手話CG制作支援装置及びプログラムを提供することにある。
本発明による第1態様の手話CG制作支援装置は、手話コンピュータグラフィックス(CG)アニメーションの制作を支援する手話CG制作支援装置であって、翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、当該所定数内でラベル候補を有する手話単語ラベル羅列について、当該初期変換された時点の候補順でラベル候補の組み合わせ毎の手話単語列を構成し、前記学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成する逆方向機械翻訳部と、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に、前記逆方向機械翻訳部から出力される日本語翻訳文を当該手話CG制作支援装置に入力して前記日本語原文と前記日本語翻訳文とを比較し、前記日本語原文と前記日本語翻訳文との類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するように前記順方向機械翻訳部及び前記逆方向機械翻訳部を制御する比較器と、前記比較器の制御によりラベル候補の候補順が自動修正された手話単語ラベル羅列を入力し、前記ラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成する手話CG生成部と、を備えることを特徴とする。
また、本発明による第2態様の手話CG制作支援装置は、手話CGアニメーションの制作を支援する手話CG制作支援装置であって、翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、前記順方向機械翻訳部から出力される手話単語ラベル羅列を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して前記日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記順方向機械翻訳部を制御する比較器と、前記比較器の制御によりラベル候補の候補順が自動修正された手話単語ラベル羅列を入力し、前記ラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成する手話CG生成部と、を備えることを特徴とする。
また、本発明による第3態様の手話CG制作支援装置は、手話CGアニメーションの制作を支援する手話CG制作支援装置であって、翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、前記順方向機械翻訳部から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成する手話CG生成部と、前記ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換する手話認識部と、前記手話認識部から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、前記順方向機械翻訳部から得られる当該初期変換された手話単語ラベル羅列と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記手話CG生成部及び前記手話認識部を制御する比較器と、を備え、前記手話CG生成部は、順方向機械翻訳部11から得られていた当該初期変換時点の所定数内でラベル候補を有する手話単語ラベル羅列について、前記比較器の制御によりラベル候補の候補順の修正を行い、当該修正後のラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成することを特徴とする。
本発明による第4態様の手話CG制作支援装置は、手話CGアニメーションの制作を支援する手話CG制作支援装置であって、翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、前記順方向機械翻訳部から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成する手話CG生成部と、前記ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換する手話認識部と、前記手話認識部から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成する逆方向機械翻訳部と、前記逆方向機械翻訳部12から得られる日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記順方向機械翻訳部、前記逆方向機械翻訳部、前記手話CG生成部、及び前記手話認識部を制御する比較器と、を備え、前記手話CG生成部は、前記順方向機械翻訳部11から得られる当該初期変換時点の所定数内でラベル候補の候補順が自動修正された手話単語ラベル羅列について、当該修正後のラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成することを特徴とする。
また、本発明のプログラムは、コンピュータを、本発明に係る手話CG制作支援装置として機能させるためのプログラムとして構成する。
本発明によれば、正解データがなくても適切、且つ高精度に手話単語のラベル候補を自動的に列挙できるようになるので、自動翻訳された日本手話の手話単語列に基づく手話CGアニメーションの自動生成の高精度化、又は編集・修正の効率化を図ることができるようになる。
本発明による第1実施形態の手話CG制作支援装置の概略構成を示すブロック図である。 (a)は従来技術(BLEU)における比較器の周辺構成を示すブロック図であり、(b)は本発明による第1実施形態の手話CG制作支援装置における比較器の周辺構成を示すブロック図である。 本発明による第1実施形態の手話CG制作支援装置の動作を示すフローチャートである。 本発明による第1実施形態の手話CG制作支援装置の動作説明図である。 (a),(b)は、それぞれ本発明による第1実施形態の手話CG制作支援装置の動作説明図である。 本発明による第1実施形態の手話CG制作支援装置の動作説明図である。 本発明による第2実施形態の手話CG制作支援装置の概略構成を示すブロック図である。 本発明による第3実施形態の手話CG制作支援装置の概略構成を示すブロック図である。 本発明による第4実施形態の手話CG制作支援装置の概略構成を示すブロック図である。 従来技術における手話CG制作支援装置の概略構成を示すブロック図である。
以下、図面を参照して、本発明による各実施形態の手話CG制作支援装置10について説明する。
〔第1実施形態〕
(装置構成)
図1は、本発明による第1実施形態の手話CG制作支援装置10の概略構成を示すブロック図である。本実施形態の手話CG翻訳編集装置10は、順方向機械翻訳部11、学習データDB11a、逆方向機械翻訳部12、学習データDB12a、比較器13A、手話CG生成部14、及びモーションデータDB14aを備える。本実施形態の手話CG翻訳編集装置10は、スマートフォンやタブレット、或いは汎用コンピュータ(以下、総括して「コンピュータ」と称する)により構成することができる。このコンピュータに設けられる記憶部(図示略)に、手話CG翻訳編集装置10における順方向機械翻訳部11、逆方向機械翻訳部12、比較器13A、及び手話CG生成部14の各機能を実現するプログラムを実現するプログラムを記憶保持させておき、更に、学習データDB11a,12a及びモーションデータDB14aの領域を当該記憶部に設けておく。そして、当該プログラムを実行することで手話CG翻訳編集装置10の各機能が作動するように構成される。
順方向機械翻訳部11は、翻訳対象の日本語文章テキストにおける日本語原文を入力し、日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語のラベルに初期変換し、一旦、所定数内でラベル候補を有する手話単語ラベル羅列を、初期変換した時点の候補順に、逆方向機械翻訳部12に出力する。
例えば、順方向機械翻訳部11は、事前学習済みのニューラルネットワークで構成することができ、予め多数の手話単語のラベル候補が保持されている学習データDB11aから、翻訳対象の日本語原文における各単語に対応付けられる可能性がある手話単語のラベル候補を所定数内で抽出して手話単語ラベル羅列に初期変換する。
逆方向機械翻訳部12は、順方向機械翻訳部11により初期変換された所定数内でラベル候補を有する手話単語ラベル羅列を入力し、当該初期変換された時点の候補順で、そのラベル候補の組み合わせ毎の手話単語列を構成し、学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成し、比較器13Aに出力する。尚、逆方向機械翻訳部12は、生成した当該ラベル候補の組み合わせ毎の日本語翻訳文をディスプレイ(図示略)に提示するよう外部出力してもよい。
例えば、逆方向機械翻訳部12は、事前学習済みのニューラルネットワークで構成することができ、予め多数の日本語の単語が保持されている学習データDB12aから、手話単語のラベルに対応付けられる可能性がある日本語の単語を所定数内で抽出する。
比較器13Aは、逆方向機械翻訳部12から得られる日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出する。そして、比較器13Aは、当該評価値に従い、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう順方向機械翻訳部11及び逆方向機械翻訳部12に対して修正用制御信号を出力して制御する。これにより順方向機械翻訳部11及び逆方向機械翻訳部12の各々は、ラベル候補の順位の分類を回帰学習する。尚、比較器13Aは、逆方向機械翻訳部12に対して修正用制御信号を出力せずともよいが、逆方向機械翻訳部12についても回帰学習させた方が、処理速度や精度が高くなる。
そして、順方向機械翻訳部11は、比較器13Aの制御によりラベル候補の候補順について自動修正した手話単語ラベル羅列を、手話CG生成部14に出力する。
手話CG生成部14は、順方向機械翻訳部11から得られる候補順が自動修正された手話単語ラベル羅列を編集操作用にディスプレイ(図示略)に提示し、編集操作により、そのラベル候補の組み合わせを選択可能としている。そして、手話CG生成部14は、その組み合わせ選択による編集操作で決定されたラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する。
尚、本実施形態においては、ラベル候補の候補順が高精度になるため、手話CG生成部14における編集操作を省略し、最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、モーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する構成としてもよい。
ここで、図2を参照して、図10に示す従来技術における手話CG制作支援装置100に、BLEUアルゴリズムによる評価指標を適用した場合と、本実施形態における手話CG制作支援装置10との対比について説明する。図2(a)は従来技術(BLEU)における比較器113の周辺構成を示すブロック図であり、図2(b)は本発明による第1実施形態の手話CG制作支援装置10における比較器13Aの周辺構成を示すブロック図である。
図2(a)に示すように、BLEUアルゴリズムによる評価指標を基にした比較器113を機械翻訳部111の後段に配置して、手話CG制作支援装置100に適用した場合を考える。この場合も、機械翻訳部111は、日本語原文を所定数内でラベル候補を持つ手話単語ラベル羅列に変換する。その後、比較器113は、所定数内でラベル候補を持つ手話単語ラベル羅列を入力し、正解データ(参考翻訳)として予め用意された手話単語ラベル羅列があると仮定して、この正解データ(参考翻訳)と比較し、BLEUアルゴリズムによる評価指標が示す評価値順に当該所定数内でラベル候補を持つ手話単語ラベル羅列におけるラベル候補の組み合わせを決定し、ラベル候補の候補順を修正した手話単語ラベル羅列を基に、最も原文に類似する順序で手話単語列を提示することができる。ただし、BLEUでは人間が作成した参考翻訳が必要となるため、予め人手により参考翻訳として作られたテストセットが用いられる。手話にはこのようなテストセットが用意されていない。従って、現時点では、このような正解データ(参考翻訳)を多数用意することができず、手話変換に用いる実用性に乏しい。
一方、図2(b)に示す比較器13Aは、上述したように、逆方向機械翻訳部12から出力される日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行う。そして、比較器13Aは、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう順方向機械翻訳部11及び逆方向機械翻訳部12に対して修正用制御信号を出力する。これにより順方向機械翻訳部11及び逆方向機械翻訳部12の各々は、ラベル候補の順位の分類を回帰学習し、順方向機械翻訳部11は、比較器13Aの制御によりラベル候補の候補順について自動修正した手話単語ラベル羅列を出力する。尚、比較器13Aは、逆方向機械翻訳部12に対して修正用制御信号を出力せずともよいが、逆方向機械翻訳部12についても回帰学習させた方が、処理速度や精度が高くなる。
即ち、本実施形態の手話CG制作支援装置10では、基本原埋として、日本語原文から日本手話への方向の機械翻訳(順方向機械翻訳)だけでなく、日本手話から日本語文に逆翻訳して原文と比較する。ここでは日本手話から日本語文に翻訳する処埋を逆翻訳と称するが、上述した説明では逆方向機械翻訳として説明している。最近の深層学習に関する研究で、自然言語の翻訳において逆翻訳の処理を加えることで大きく精度が改善することが確認されている。また、機械翻訳サイトを用いて人手で自然言語を翻訳する場合にも、機械翻訳の結果を逆翻訳して精度を高められることがあり、直感的にも翻訳品質の向上を予測できる。このため、本実施形態に係る比較器13Aは、逆方向機械翻訳部12についても回帰学習させることで、処理速度や精度が高くなる。
このように、本実施形態に係る比較器13Aは、人手による正解データ(参考翻訳)が不要であり、自動処理だけで評価可能となっている。比較器13Aにおいて比較に用いる類似度を表す予め定めた評価指標自体は、BLEUと同様に、原文中の単語列に一致する度数(分子)を日本語翻訳文中の単語列の総度数(分母)で除した割合で表した評価値とし、これによりn‐gram(n個の単語の連鎖)に対して、それぞれの評価指標を定めることができる。
(動作例)
以下、図4乃至図6を参照しながら、図3を基に、より具体的に、本実施形態の手話CG制作支援装置10における一動作例を説明する。図3は、本実施形態の手話CG制作支援装置10の動作を示すフローチャートである。また、図4乃至図6は、それぞれ本実施形態の手話CG制作支援装置10の動作説明図である。
まず、手話CG制作支援装置10における順方向機械翻訳部11は、日本語原文における各単語について、学習データに基づく機械学習により学習データDB11aを参照し、1個のラベル候補、又は置き換えや挿入して修正する複数個のラベル候補を挙げて手話単語のラベルに初期変換し、複数個のラベル候補については並列に接続する態様で、ラベル候補の候補順位に従って接続された全ての組み合わせの複数個の手話単語列が構成できるように逆方向機械翻訳部12に出力する(ステップS1)。
例えば、図4に示すように、順方向機械翻訳部11による変換対象の日本語原文:「前回は中学生で初出場した。」であるとする。順方向機械翻訳部11は、この日本語原文を機械翻訳により初期変換して、手話単語ラベル毎に候補順位を付与した所定数内でラベル候補(モーションデータが異なる)を挙げて、機械翻訳後の手話単語ラベル羅列:「過去」,「〜中」,「学生」,「最初」,「参加」,「した」を出力する。この例において、ラベルである“過去”,“最初”,“参加”について、複数個のラベル候補が得られたとすると、各ラベル候補には候補順位が付与される。例えば、“過去”については、第1候補のラベル候補(むかし)、第2候補のラベル候補(前回)が得られたとする。同様に、“最初”については、第1候補のラベル候補(初めて)、第2候補のラベル候補(まず)、第3候補のラベル候補(新たに)が得られたとする。同様に、“参加”については、第1候補のラベル候補(出場)、第2候補のラベル候補(出品)が得られたとする。
この結果、順方向機械翻訳部11は、初期変換として、図4における最下図に示すように、複数個のラベル候補については並列に接続する態様で、ラベル候補の候補順位に従って接続された全ての組み合わせの複数個の手話単語列が構成できるように逆方向機械翻訳部12に出力する。この複数個の手話単語列は、それぞれ手話CGアニメーションとして異なるものとなり、手話CGアニメーション候補となる手話単語列ともいえる。従って、編集操作にあたっては、より正確な手話単語列が候補順位として上位に位置する方が作業性が効率化するし、編集機能を省略するときも最上位の手話単語列で自動アニメーション化することで、その正確度が向上する。しかし、順方向機械翻訳部11による初期変換時には、必ずしも正確度が高い順にラベル候補の候補順位が定まっていない可能性がある。
そこで、手話CG制作支援装置10における順方向機械翻訳部11は、順方向機械翻訳部11により初期変換された所定数内でラベル候補を有する手話単語ラベル羅列を入力し、当該初期変換された時点の候補順で、そのラベル候補の組み合わせ毎の手話単語列を構成し、学習データに基づく機械学習により学習データDB12aを参照して逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成し、比較器13Aに出力する(ステップS2)。
比較器13Aは、逆方向機械翻訳部12から得られる日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出する(ステップS3)。
評価値の算出に関して、例えば、図5(a)に示すように、図4に示す手話単語ラベル羅列:「過去」,「〜中」,「学生」,「最初」,「参加」,「した」において、初期変換時点で或るラベル候補の組み合わせよりなる日本語翻訳文:「むかし」「中学生で」「まず」「出場」「した」に対する評価値が0.6として得られる。また、図5(b)に示すように、初期変換時点で別のラベル候補の組み合わせよりなる日本語翻訳文:「前回」「中学生で」「まず」「出場」「した」に対する評価値が0.8として得られる。
尚、評価値の実際の算出方法としては、全てのラベル候補の組み合わせについて逐次、手話単語列を構成し、その都度、日本語原文と比較して評価値を算出する方法(図4の例では2×3×2の12通り)や、文頭からラベル候補の組み合わせを変えながら評価値の算出を進めて、評価値が下がった時点でそれ以降はそのラベル候補を含む評価値の算出を省略する方法(例えば、「過去1」と「過去2」の評価値を算出して、「過去2」を含む手話単語列の方が評価値が高い場合は、以降、「過去1」を含む手話単語列の実計算は省略すると、2+(3−1)+(2−1)の5通り)がある。
そして、比較器13Aは、当該評価値に従い、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう順方向機械翻訳部11及び逆方向機械翻訳部12に対して修正用制御信号を出力して制御する。即ち、比較器13Aは、評価値の最も大きい手話単語列が、手話CGアニメーションの第1候補となるように、順方向機械翻訳部11及び逆方向機械翻訳部12に対しラベル候補の順位を修正するよう制御する。
最終的に、手話CG制作支援装置10における順方向機械翻訳部11は、比較器13Aの制御によりラベル候補の候補順について自動修正した手話単語ラベル羅列を、手話CG生成部14に出力する。尚、順方向機械翻訳部11及び逆方向機械翻訳部12は、それぞれの学習データDB11a,12aにおけるラベル候補の辞書順位を当該ラベル候補の候補順となるように入れ替えて、次回以降は初期翻訳時で正解の可能性が高いラベル候補を提示出力させるように更新する。
例えば、図6に示すように、順方向機械翻訳部11において、比較器13Aからの制御により、手話単語ラベルの羅列の候補順位が、最高の評価値(図6の例では、評価値1.0)が得られる手話単語列の順となるよう、学習データDB11a上で、ラベル“過去”について、第1候補のラベル候補は(前回)に、第2候補のラベル候補は(むかし)に入れ替えられる。
そして、手話CG生成部14は、候補順修正後の手話単語ラベル羅列を基に編集提示し(ステップS4)、その組み合わせ選択による編集操作で決定されたラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成するか、或いは最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、手話CGアニメーションを生成する(ステップS5)。
このように、比較器13Aによって評価した結果に基づく修正用制御伝号を順方向機械翻訳部11及び逆方向機械翻訳部12に対して修正用制御信号を出力して制御することで、手話CG生成部14における編集操作による手動修正、又は自動修正の支援が図られるようになる。
以上のように、本実施形態によれば、機械翻訳後、修正のために置き換える単語や挿入する単語を抽出する工程や、翻訳結果を評価する工程をできるだけ自動化することができ、手話CG制作の効率化に繋がるようになる。また、修正結果を記録して学習データに使用することで、次回以降に同様の文章を機械翻訳する際には精度が高くなるため、少ない手数での修正で済むようになる。
従って、本実施形態によれば、手話CG制作支援装置において、原文に忠実な手話CGを効率的に作成することができる。また、日本手話を十分習熟していない人問だけでも、手話CGの品質を評価することができる。手話CGの修正操作は、必ずしも手話が分かる人が行えるとは限らないためその効果が大きいことは容易に理解される。そして、手動修正を加えない自動生成システムでも、手話CGの品質向上が図れるようになる。
上述した第1実施形態の例では、手話CG制作支援装置10に比較器13Aを設け、比較器13Aにより逆方向機械翻訳部12から出力される日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行う例を説明した。以下、この応用例として、第2乃至第3実施形態の手話CG制作支援装置10を順に説明する。
〔第2実施形態〕
(装置構成)
図7は、本発明による第2実施形態の手話CG制作支援装置10の概略構成を示すブロック図である。尚、第2実施形態において、第1実施形態と同様な構成要素には同一の参照番号を付している。本実施形態の手話CG翻訳編集装置10は、順方向機械翻訳部11、学習データDB11a、比較器13B、手話CG生成部14、及びモーションデータDB14aを備える。本実施形態の手話CG翻訳編集装置10は、コンピュータにより構成することができる。このコンピュータに設けられる記憶部(図示略)に、手話CG翻訳編集装置10における順方向機械翻訳部11、比較器13B、及び手話CG生成部14の各機能を実現するプログラムを実現するプログラムを記憶保持させておき、更に、学習データDB11a及びモーションデータDB14aの領域を当該記憶部に設けておく。そして、当該プログラムを実行することで手話CG翻訳編集装置10の各機能が作動するように構成される。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、逆方向機械翻訳部12及び学習データDB12aの構成要素を省略し、比較器13Aの代わりに比較器13Bが設けられている点で相違している。
本実施形態の順方向機械翻訳部11は、翻訳対象の日本語文章テキストにおける日本語原文を入力し、日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語のラベルに初期変換し、一旦、所定数内でラベル候補を有する手話単語ラベル羅列を、初期変換した時点の候補順に、比較器13Bに出力する。
本実施形態の順方向機械翻訳部11は、第1実施形態と同様に、例えば事前学習済みのニューラルネットワークで構成することができ、予め多数の手話単語のラベル候補が保持されている学習データDB11aから、翻訳対象の日本語原文における各単語に対応付けられる可能性がある手話単語のラベル候補を所定数内で抽出して手話単語ラベル羅列に初期変換する。
比較器13Bは、順方向機械翻訳部11から出力される手話単語ラベル羅列を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出する。そして、比較器13Bは、当該評価値に従い、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう順方向機械翻訳部11に対して修正用制御信号を出力して制御する。これにより順方向機械翻訳部11は、ラベル候補の順位の分類を回帰学習する。
そして、順方向機械翻訳部11は、比較器13Bの制御によりラベル候補の候補順について自動修正した手話単語ラベル羅列を、手話CG生成部14に出力する。
手話CG生成部14は、第1実施形態と同様に動作して、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、ディスプレイ(図示略)に提示する。
尚、本実施形態においても、ラベル候補の候補順が高精度になるため、手話CG生成部14における編集操作を省略し、最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、モーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する構成としてもよい。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、逆方向機械翻訳部12及び学習データDB12aの構成要素を省略している分、ラベル候補の候補順の精度が劣化する可能性はあるものの、図10に示す従来技術と比較すれば、比較器13Bにより、第1実施形態と同様の作用・効果が得られるようになる。
〔第3実施形態〕
(装置構成)
図8は、本発明による第3実施形態の手話CG制作支援装置10の概略構成を示すブロック図である。尚、第3実施形態において、第1実施形態と同様な構成要素には同一の参照番号を付している。本実施形態の手話CG翻訳編集装置10は、順方向機械翻訳部11、学習データDB11a、逆方向機械翻訳部12、学習データDB12a、比較器13C、手話CG生成部14、モーションデータDB14a、手話認識部15、及び学習データDB15aを備える。尚、本実施形態においては、逆方向機械翻訳部12及び学習データDB12aについては必ずしも設けていなくともよい。本実施形態の手話CG翻訳編集装置10は、コンピュータにより構成することができる。このコンピュータに設けられる記憶部(図示略)に、手話CG翻訳編集装置10における順方向機械翻訳部11、逆方向機械翻訳部12、比較器13C、手話CG生成部14、及び手話認識部15の各機能を実現するプログラムを実現するプログラムを記憶保持させておき、更に、学習データDB11a,12a,15a及びモーションデータDB14aの領域を当該記憶部に設けておく。そして、当該プログラムを実行することで手話CG翻訳編集装置10の各機能が作動するように構成される。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、比較器13Aの代わりに比較器13Cが設けられ、手話認識部15及び学習データDB15aを更に備えている点で相違している。
本実施形態の順方向機械翻訳部11は、翻訳対象の日本語文章テキストにおける日本語原文を入力し、日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語のラベルに初期変換し、所定数内でラベル候補を有する手話単語ラベル羅列を、初期変換した時点の候補順に、手話CG生成部14及び比較器13Cに出力する。
本実施形態の順方向機械翻訳部11は、第1実施形態と同様に、例えば事前学習済みのニューラルネットワークで構成することができ、予め多数の手話単語のラベル候補が保持されている学習データDB11aから、翻訳対象の日本語原文における各単語に対応付けられる可能性がある手話単語のラベル候補を所定数内で抽出して手話単語ラベル羅列に初期変換する。
本実施形態の手話CG生成部14は、順方向機械翻訳部11から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することによりラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成し、手話認識部15に出力する。
手話認識部15は、手話CG生成部14から得られるラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、非特許文献3に開示されるアルゴリズムと同様に学習データが保持されている学習データDB15aを参照して、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換し、比較器13C及び逆方向機械翻訳部12に出力する。
逆方向機械翻訳部12は、手話認識部15から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成し、ディスプレイ(図示略)に提示するよう外部出力する。
例えば、逆方向機械翻訳部12は、事前学習済みのニューラルネットワークで構成することができ、予め多数の日本語の単語が保持されている学習データDB12aから、手話単語のラベルに対応付けられる可能性がある日本語の単語を所定数内で抽出する。
尚、本実施形態においては、逆方向機械翻訳部12及び学習データDB12aについては必ずしも設けていなくともよいが、例えば手話認識部15を経てどのように日本語翻訳文に逆翻訳されるかをユーザーが確認できるようになる。
比較器13Cは、手話認識部15から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、順方向機械翻訳部11から得られる当該初期変換された手話単語ラベル羅列と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出する。そして、比較器13Cは、当該評価値に従い、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう手話CG生成部14及び手話認識部15に対して修正用制御信号を出力して制御する。これにより手話CG生成部14及び手話認識部15の各々は、手話CGアニメーションの手話映像データの生成及び手話認識に係るラベル候補の順位の分類を回帰学習する。尚、比較器13Cは、手話認識部15に対して修正用制御信号を出力せずともよいが、手話認識部15についても回帰学習させた方が、処理速度や精度が高くなる。
最終的に、手話CG生成部14は、順方向機械翻訳部11から得られる当該初期変換時点の所定数内でラベル候補の候補順が自動修正された手話単語ラベル羅列について、第1候補のラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する。
尚、手話CG生成部14は、順方向機械翻訳部11から得られていた当該初期変換時点の所定数内でラベル候補を有する手話単語ラベル羅列について、比較器13Cの制御によりラベル候補の候補順を修正した上で、第1実施形態と同様に、編集操作可能としてもよい。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、日本語原文及び逆方向機械翻訳部12の出力である日本語翻訳部を比較器13Cで扱わない代わりに、順方向機械翻訳部11及び手話認識部15からそれぞれ得られるラベル候補の組み合わせ毎の手話単語列を構成する手話単語ラベル羅列を比較する。このため、第1実施形態と比較しての優劣は一意には断定できないが、図10に示す従来技術と比較すれば、比較器13Cにより、第1実施形態と同様の作用・効果が得られるようになる。
〔第4実施形態〕
(装置構成)
図9は、本発明による第4実施形態の手話CG制作支援装置10の概略構成を示すブロック図である。尚、第4実施形態において、第1実施形態と同様な構成要素には同一の参照番号を付している。本実施形態の手話CG翻訳編集装置10は、順方向機械翻訳部11、学習データDB11a、逆方向機械翻訳部12、学習データDB12a、比較器13D、手話CG生成部14、モーションデータDB14a、手話認識部15、及び学習データDB15aを備える。本実施形態の手話CG翻訳編集装置10は、コンピュータにより構成することができる。このコンピュータに設けられる記憶部(図示略)に、手話CG翻訳編集装置10における順方向機械翻訳部11、逆方向機械翻訳部12、比較器13D、手話CG生成部14、及び手話認識部15の各機能を実現するプログラムを実現するプログラムを記憶保持させておき、更に、学習データDB11a,12a,15a及びモーションデータDB14aの領域を当該記憶部に設けておく。そして、当該プログラムを実行することで手話CG翻訳編集装置10の各機能が作動するように構成される。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、比較器13Aの代わりに比較器13Dが設けられ、手話認識部15及び学習データDB15aを更に備えている点で相違している。
本実施形態の順方向機械翻訳部11は、翻訳対象の日本語文章テキストにおける日本語原文を入力し、日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語のラベルに初期変換し、一旦、所定数内でラベル候補を有する手話単語ラベル羅列を、初期変換した時点の候補順に、手話CG生成部14に出力する。
本実施形態の順方向機械翻訳部11は、第1実施形態と同様に、例えば事前学習済みのニューラルネットワークで構成することができ、予め多数の手話単語のラベル候補が保持されている学習データDB11aから、翻訳対象の日本語原文における各単語に対応付けられる可能性がある手話単語のラベル候補を所定数内で抽出して手話単語ラベル羅列に初期変換する。
本実施形態の手話CG生成部14は、順方向機械翻訳部11から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することによりラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成し、手話認識部15に出力する。
手話認識部15は、手話CG生成部14から得られるラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、非特許文献3に開示されるアルゴリズムと同様に学習データが保持されている学習データDB15aを参照して、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換し、逆方向機械翻訳部12に出力する。
逆方向機械翻訳部12は、手話認識部15から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成し、比較器13Dに出力する。尚、逆方向機械翻訳部12は、生成した当該ラベル候補の組み合わせ毎の日本語翻訳文をディスプレイ(図示略)に提示するよう外部出力してもよい。
例えば、逆方向機械翻訳部12は、事前学習済みのニューラルネットワークで構成することができ、予め多数の日本語の単語が保持されている学習データDB12aから、手話単語のラベルに対応付けられる可能性がある日本語の単語を所定数内で抽出する。
比較器13Dは、逆方向機械翻訳部12から得られる日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出する。そして、比較器13Dは、当該評価値に従い、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう順方向機械翻訳部11、逆方向機械翻訳部12、手話CG生成部14、及び手話認識部15に対して修正用制御信号を出力して制御する。これにより順方向機械翻訳部11及び逆方向機械翻訳部12の各々は、ラベル候補の順位の分類を回帰学習する。また、これにより手話CG生成部14及び手話認識部15の各々は、手話CGアニメーションの手話映像データの生成及び手話認識に係るラベル候補の順位の分類を回帰学習する。尚、比較器13Dは、逆方向機械翻訳部12、手話CG生成部14及び手話認識部15に対して修正用制御信号を出力せずともよいが、逆方向機械翻訳部12、手話CG生成部14及び手話認識部15についても回帰学習させた方が、処理速度や精度が高くなる。
そして、順方向機械翻訳部11は、比較器13Dの制御によりラベル候補の候補順について自動修正した手話単語ラベル羅列を、手話CG生成部14に出力する。
最終的に、手話CG生成部14は、順方向機械翻訳部11から得られる当該初期変換時点の所定数内でラベル候補の候補順が自動修正された手話単語ラベル羅列について、第1候補のラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成し、ラベル毎のモーションデータが保持されているモーションデータDB14aから、当該手話単語列を構成した各ラベルに対応するモーションデータを読み出し合成(ラベル/モーション変換)することにより手話CGアニメーションを生成し、当該ディスプレイに提示する。
尚、手話CG生成部14は、順方向機械翻訳部11から得られる候補順が自動修正された手話単語ラベル羅列について、第1実施形態と同様に、編集操作可能としてもよい。
本実施形態の手話CG翻訳編集装置10は、第1実施形態と比較して、手話CGアニメーションの生成までの系全体を経た上で、日本語原文及び逆方向機械翻訳部12の出力である日本語翻訳部を比較器13Dで扱うため、第1実施形態と比較して、より一層、第1実施形態の作用・効果を高めることができることが期待される。
上述した各実施形態では、代表的な例を説明したが、これらの実施形態の変形適用し、更なる実施形態とすることも可能である。例えば、各実施形態を組み合わせた手話CG制作支援装置10を構成することも可能である。従って、本発明に係る手話CG制作支援装置及びプログラムは、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。
本発明によれば、正解データがなくても適切、且つ高精度に手話単語のラベル候補を自動的に列挙できるようになるので、自動翻訳された日本手話の手話単語列に基づく手話CGアニメーションの自動生成の高精度化、又は編集・修正を行う用途に有用である。
10 手話CG翻訳編集装置
11 順方向機械翻訳部
12 逆方向機械翻訳部
11a,12a,15a 学習データデータベース(DB)
13A,13B,13C,13D 比較器
14 手話CG生成部
14a モーションデータDB
15 手話認識部
100 従来技術の手話CG翻訳編集装置
111 順方向機械翻訳部
111a 学習データDB
113 比較器
114 手話CG生成部
114a モーションデータDB

Claims (5)

  1. 手話コンピュータグラフィックス(CG)アニメーションの制作を支援する手話CG制作支援装置であって、
    翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、
    当該所定数内でラベル候補を有する手話単語ラベル羅列について、当該初期変換された時点の候補順でラベル候補の組み合わせ毎の手話単語列を構成し、前記学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成する逆方向機械翻訳部と、
    当該初期変換された時点の候補順でラベル候補の組み合わせ毎に、前記逆方向機械翻訳部から出力される日本語翻訳文を当該手話CG制作支援装置に入力して前記日本語原文と前記日本語翻訳文とを比較し、前記日本語原文と前記日本語翻訳文との類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するように前記順方向機械翻訳部及び前記逆方向機械翻訳部を制御する比較器と、
    前記比較器の制御によりラベル候補の候補順が自動修正された手話単語ラベル羅列を入力し、前記ラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成する手話CG生成部と、
    を備えることを特徴とする手話CG制作支援装置。
  2. 手話CGアニメーションの制作を支援する手話CG制作支援装置であって、
    翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、
    前記順方向機械翻訳部から出力される手話単語ラベル羅列を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して前記日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記順方向機械翻訳部を制御する比較器と、
    前記比較器の制御によりラベル候補の候補順が自動修正された手話単語ラベル羅列を入力し、前記ラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成する手話CG生成部と、
    を備えることを特徴とする手話CG制作支援装置。
  3. 手話CGアニメーションの制作を支援する手話CG制作支援装置であって、
    翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、
    前記順方向機械翻訳部から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成する手話CG生成部と、
    前記ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換する手話認識部と、
    前記手話認識部から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、前記順方向機械翻訳部から得られる当該初期変換された手話単語ラベル羅列と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記手話CG生成部及び前記手話認識部を制御する比較器と、を備え、
    前記手話CG生成部は、順方向機械翻訳部11から得られていた当該初期変換時点の所定数内でラベル候補を有する手話単語ラベル羅列について、前記比較器の制御によりラベル候補の候補順の修正を行い、当該修正後のラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成することを特徴とする手話CG制作支援装置。
  4. 手話CGアニメーションの制作を支援する手話CG制作支援装置であって、
    翻訳対象の日本語原文における各単語について、学習データに基づく機械学習により所定数内でラベル候補を挙げて手話単語ラベル羅列に初期変換する順方向機械翻訳部と、
    前記順方向機械翻訳部から得られる所定数内でラベル候補を有する手話単語ラベル羅列の各組み合わせに基づいて、一旦、ラベル候補の組み合わせ毎に当該日本語原文に対応させる手話単語列を構成し、ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データを生成する手話CG生成部と、
    前記ラベル候補の組み合わせ毎の手話CGアニメーションの手話映像データについて、学習データに基づく機械学習によりそれぞれラベル候補の組み合わせ毎の手話単語ラベル羅列に変換する手話認識部と、
    前記手話認識部から得られるラベル候補の組み合わせ毎の手話単語ラベル羅列について、学習データに基づく機械学習により逆翻訳を行い、当該ラベル候補の組み合わせ毎の日本語翻訳文を生成する逆方向機械翻訳部と、
    前記逆方向機械翻訳部12から得られる日本語翻訳文を、当該初期変換された時点の候補順でラベル候補の組み合わせ毎に入力して、対応して入力される日本語原文と比較し、類似度を表す予め定めた評価指標に基づいて日本語原文に対する類似度判定を行い、全てのラベル候補の組み合わせについての評価値を算出し、類似度の高いラベル候補が上位となるようにラベル候補の順位を修正するよう前記順方向機械翻訳部、前記逆方向機械翻訳部、前記手話CG生成部、及び前記手話認識部を制御する比較器と、を備え、
    前記手話CG生成部は、前記順方向機械翻訳部11から得られる当該初期変換時点の所定数内でラベル候補の候補順が自動修正された手話単語ラベル羅列について、当該修正後のラベル候補の候補順を編集操作可能に手話単語列を構成し、又は最も順位の高いラベル候補の組み合わせで当該日本語原文に対応させる手話単語列を構成して、手話CGアニメーションを生成することを特徴とする手話CG制作支援装置。
  5. コンピュータを、請求項1から4のいずれか一項に記載の手話CG制作支援装置として機能させるためのプログラム。
JP2019081341A 2019-04-22 2019-04-22 手話cg制作支援装置及びプログラム Pending JP2020177196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019081341A JP2020177196A (ja) 2019-04-22 2019-04-22 手話cg制作支援装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019081341A JP2020177196A (ja) 2019-04-22 2019-04-22 手話cg制作支援装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2020177196A true JP2020177196A (ja) 2020-10-29

Family

ID=72935644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019081341A Pending JP2020177196A (ja) 2019-04-22 2019-04-22 手話cg制作支援装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2020177196A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230001839A (ko) * 2021-06-29 2023-01-05 한국전자기술연구원 수어의 형태소 단위 분할 방법, 형태소 위치 예측 방법 및 데이터 증강 방법
KR102526772B1 (ko) * 2021-11-26 2023-04-26 광운대학교 산학협력단 맥락 정보 기반 보완 대체 의사소통 방법 및 장치

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230001839A (ko) * 2021-06-29 2023-01-05 한국전자기술연구원 수어의 형태소 단위 분할 방법, 형태소 위치 예측 방법 및 데이터 증강 방법
KR102624226B1 (ko) * 2021-06-29 2024-01-15 한국전자기술연구원 수어의 형태소 단위 분할 방법, 형태소 위치 예측 방법 및 데이터 증강 방법
KR102526772B1 (ko) * 2021-11-26 2023-04-26 광운대학교 산학협력단 맥락 정보 기반 보완 대체 의사소통 방법 및 장치

Similar Documents

Publication Publication Date Title
Oda et al. Learning to generate pseudo-code from source code using statistical machine translation
CN109783657A (zh) 基于受限文本空间的多步自注意力跨媒体检索方法及系统
US10217454B2 (en) Voice synthesizer, voice synthesis method, and computer program product
US20210097974A1 (en) Training method and apparatus for a speech synthesis model, and storage medium
CN102693309A (zh) 用于计算机辅助翻译的候选短语查询方法及辅助翻译系统
WO2019167600A1 (ja) 疑似対訳データ生成装置、機械翻訳処理装置、および疑似対訳データ生成方法
KR20140049150A (ko) 사용자 참여 기반의 자동 번역 생성 후처리 시스템
CN116596347B (zh) 基于云平台的多学科交互教学系统及教学方法
JP2020177196A (ja) 手話cg制作支援装置及びプログラム
Hirst ProZed: A speech prosody editor for linguists, using analysis-by-synthesis
CN106297766B (zh) 语音合成方法及系统
Gutkin et al. FonBund: A library for combining cross-lingual phonological segment data
CN112836525A (zh) 一种基于人机交互机器翻译系统及其自动优化方法
O’Brien Post-editing
Casado et al. SonoUno: a user-centred approach to sonification
JP2006236037A (ja) 音声対話コンテンツ作成方法、装置、プログラム、記録媒体
CN102156693B (zh) 一种盲文输入方法和系统
KR101201913B1 (ko) 사용자의 후보 합성단위 선택에 의한 음성 합성 방법 및 시스템
CN114185573A (zh) 一种人机交互机器翻译系统的实现和在线更新系统及方法
CN106446524A (zh) 智能硬件多模态级联建模方法及装置
Mohamed et al. A cascaded speech to Arabic sign language machine translator using adaptation
CN111090720A (zh) 一种热词的添加方法和装置
KR20200005925A (ko) 어휘 연관 이미지의 연속적 생성을 통한 어휘 및 문장 생성 방법
CN117035064B (zh) 一种检索增强语言模型的联合训练方法及存储介质
Meelberg Artistic Research. Eine epistemologische Ästhetik Bielefeld: Transcript Verlag, 2019 9783837646368