JP2011112675A - 対訳辞書拡張装置およびそのプログラム - Google Patents

対訳辞書拡張装置およびそのプログラム Download PDF

Info

Publication number
JP2011112675A
JP2011112675A JP2009266060A JP2009266060A JP2011112675A JP 2011112675 A JP2011112675 A JP 2011112675A JP 2009266060 A JP2009266060 A JP 2009266060A JP 2009266060 A JP2009266060 A JP 2009266060A JP 2011112675 A JP2011112675 A JP 2011112675A
Authority
JP
Japan
Prior art keywords
japanese
dictionary
bilingual dictionary
synonym
sign language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009266060A
Other languages
English (en)
Other versions
JP5113824B2 (ja
Inventor
Naoto Kato
直人 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2009266060A priority Critical patent/JP5113824B2/ja
Publication of JP2011112675A publication Critical patent/JP2011112675A/ja
Application granted granted Critical
Publication of JP5113824B2 publication Critical patent/JP5113824B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】本発明は、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、新たな日本語語彙の手話訳を得ることができる対訳辞書拡張装置を提供することを目的とする。
【解決手段】対訳辞書拡張装置1は、日本語−手話対訳辞書を拡張するものであり、類義語データが入力される入力端子10と、類義語データを記憶する対訳なし類義語記憶手段20と、日本語−手話対訳辞書を記憶する日本語−手話対訳辞書記憶手段30と、日本語−手話対訳辞書を拡張する日本語−手話対訳辞書拡張手段40と、更新信頼度を算出する更新信頼度算出手段50と、日本語−手話対訳辞書を出力する出力端子60とを備え、拡張した後の日本語−手話対訳辞書を繰り返し検索する。
【選択図】図1

Description

本発明は、手話学習、手話翻訳、手話辞書構築等の手話と日本語との自然言語処理技術に関し、特に、日本語−手話対訳辞書を拡張する技術に関する。
従来から、類義語のみを用いて、日本語−手話対訳辞書を拡張する技術が提案されている(例えば、非特許文献1〜3参照)。以下、従来技術の一例を詳細に説明する。
まず、従来技術で用いられる日本語−手話対訳辞書について説明する。
この例では、図9(a)に示すように、日本語−手話対訳辞書は、4件の辞書データが登録されている。
辞書データは、識別子と、日本語語彙と、この日本語語彙の手話訳(手話語彙)とを対応付けたものである。
識別子は、辞書データを一意に識別するものであり、例えば、対訳1a〜1dというように表される。
手話訳は、日本語語彙に意味が近い手話語彙である。
ここで、手話語彙は、その表記法がまだ確立されていないため、日本語語彙に括弧“<>”を付けて表す。以下の説明では、この括弧を日本語ラベルと呼ぶことにする。
なお、NULLは、その手話訳が日本語−手話対訳辞書に登録されていないことを表す。
例えば、辞書データ「対訳1a」は、日本語語彙「意味」の手話訳が、手話語彙<意味>であることを表している。一方、辞書データ「対訳1b」は、日本語語彙「意義」の手話訳が、日本語−手話対訳辞書に登録されていないことを表している。また同様に、辞書データ「対訳1c」および「対訳1d」は、日本語語彙「意図」および「趣旨」の手話訳が、それぞれ、日本語−手話対訳辞書に登録されていないことを表している。
次に、従来技術で用いられる類義語辞書について説明する。
この例では、図9(b)に示すように、類義語辞書は、3件の類義語データが登録されている。
類義語データは、識別子と、日本語語彙と、この日本語語彙の類義語とを対応づけたものである。
識別子は、類義語データを一意に識別するものであり、例えば、類義語1〜3というように表される。
例えば、類義語データ「類義語1」は、日本語語彙「意義」の類義語が「意味」であることを表している。また、類義語データ「類義語2」は、日本語語彙「意図」の類義語が、「意義」および「意思」であることを表している。さらに、類義語データ「類義語3」は、日本語語彙「趣旨」の類義語が「意図」であることを表している。
以下、従来技術において、日本語−手話対訳辞書を拡張する具体例を説明する。
従来技術では、日本語−手話対訳辞書に登録されている日本語語彙(辞書データ「対訳1b」の日本語語彙「意義」)を検索条件として類義語辞書を検索し、類義語辞書より類義語(類義語データ「類義語1」の類義語「意味」)を取得する。
そして、従来技術では、取得した類義語(類義語データ「類義語1」の類義語「意味」)を検索条件として日本語−手話対訳辞書を検索し、日本語−手話対訳辞書より手話語彙(辞書データ「対訳1a」の手話訳<意味>)を取得する。
さらに、図9(c)に示すように、従来技術では、検索条件とした日本語語彙(辞書データ「対訳1b」の日本語語彙「意義」)に、取得した手話語彙(辞書データ「対訳1a」の手話訳<意味>)を関連付けて辞書データを生成し、日本語−手話対訳辞書を拡張する。
つまり、前記した従来技術では、日本語−手話対訳辞書において、辞書データ「対訳1a」に手話訳<意味>が登録されているとき、類義語データ「類義語1」により新たな辞書データを得ることができる。
安達久博,下山豪彦,播磨良洋,松浦威日:"日本語・手話電子化辞書の構成法について",情報処理学会研究報告,NL96-3, pp.17-24, 1993. 安達久博:"www環境下での手話単語の検索システムの構築方法",情報処理学会研究報告,NL118-10, pp.61-66, 1997. 徳田昌晃,奥村学:"日本語から手話への機械翻訳における手話単語辞書の補完方法について", 情報処理学会論文誌,Vol.39, No.3 pp.542-550, 1998.
しかし、前記した従来技術では、日本語−手話対訳辞書に、手話訳<意義>、<意図>および<意思>が登録されていない場合、日本語語彙「意図」および「趣旨」の手話訳を得ることができないという問題があった。
以下、図9(a)および図9(b)を参照し、この問題を具体的に説明する。例えば、従来技術では、日本語−手話対訳辞書に登録されている日本語語彙(辞書データ「対訳1c」の日本語語彙「意図」)を検索条件として類義語辞書を検索し、類義語辞書より類義語(類義語データ「類義語2」の類義語「意義」および「意思」)を取得する。
そして、従来技術では、取得した類義語(類義語データ「類義語2」の類義語「意義」および「意思」)のそれぞれを検索条件として日本語−手話対訳辞書を検索する。ここで、図9(a)に示すように、辞書データ「対訳1b」は、日本語語彙「意義」の手話訳がNULLである。また、日本語−手話対訳辞書には、日本語語彙「意思」に該当する辞書データそのものが登録されていない。このため、従来技術では、日本語語彙「意義」および「意思」の両方とも、その手話訳を得ることができない。
そこで、本発明は、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、日本語語彙の手話訳を新たに得ることができる対訳辞書拡張装置およびそのプログラムを提供することを課題とする。
前記した課題を解決するため、本願第1発明に係る対訳辞書拡張装置は、日本語−手話対訳辞書の検索と登録とを予め設定された繰返回数だけ繰り返して、当該日本語−手話対訳辞書を拡張する対訳辞書拡張装置であって、入力手段と、類義語データ記憶手段と、対訳辞書記憶手段と、信頼度算出手段と、対訳辞書拡張手段とを備えることを特徴とする。
かかる構成によれば、対訳辞書拡張装置は、入力手段によって、日本語語彙と当該日本語語彙の類義語とを対応付けた類義語データが入力される。また、対訳辞書拡張装置は、類義語データ記憶手段によって、前記入力手段に入力された類義語データを記憶する。そして、対訳辞書拡張装置は、対訳辞書記憶手段によって、日本語語彙と当該日本語語彙の手話訳とを対応付けた辞書データが登録された前記日本語−手話対訳辞書を記憶する。さらに、対訳辞書拡張装置は、信頼度算出手段によって、前記日本語語彙に対する手話訳の信頼度を、繰り返し前の値より繰り返した後の値が小さくなるように算出する。
また、対訳辞書拡張装置は、対訳辞書拡張手段によって、前記繰返回数だけ繰り返し、前記類義語を検索条件として前記日本語−手話対訳辞書の手話訳を検索すると共に、前記検索条件とした類義語に対応付けられた前記類義語データの日本語語彙を前記日本語−手話対訳辞書より検索した手話訳に関連付けて、かつ、前記信頼度を付加した辞書データを生成し、当該辞書データを前記日本語−手話対訳辞書に登録する。
つまり、対訳辞書拡張装置は、新たな辞書データが登録された日本語−手話対訳辞書を繰り返し検索することで、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、日本語語彙の手話訳を新たに得えることができる。また、対訳辞書拡張装置は、日本語−手話対訳辞書の拡張を繰り返すほど信頼度を低くして、新たに得た手話訳の順序付けを行う。
なお、日本語−手話対訳辞書の拡張とは、新たな辞書データを日本語−手話対訳辞書に登録することを言う。
また、本願第2発明に係る対訳辞書拡張装置は、前記対訳辞書拡張手段が、繰返カウンタが前記繰返回数に等しくなるまで、前記日本語−手話対訳辞書の検索と登録とを繰り返すと共に、当該繰り返し毎に前記繰返カウンタをインクリメントし、前記信頼度算出手段が、前記繰返カウンタが1回目のときは、0を超え1未満の範囲内で予め設定された定数に予め設定された初期値を乗じて前記信頼度を算出し、前記繰返カウンタが2回目以降のときは、前回算出した信頼度に前記定数を乗じて前記信頼度を算出することを特徴とする。
かかる構成によれば、対訳辞書拡張装置は、簡易な演算で信頼度を算出することができる。
また、前記した課題を解決するため、本願第3発明に係る対訳辞書拡張プログラムは、日本語−手話対訳辞書の検索と登録とを予め設定された繰返回数だけ繰り返して、当該日本語−手話対訳辞書を拡張するために、日本語語彙と当該日本語語彙の類義語とを対応付けた類義語データを記憶する類義語データ記憶手段と、日本語語彙と当該日本語語彙の手話訳とを対応付けた辞書データが登録された前記日本語−手話対訳辞書を記憶する対訳辞書記憶手段とを備えるコンピュータを、信頼度算出手段、対訳辞書拡張手段、として機能させることを特徴とする。
かかる構成によれば、対訳辞書拡張プログラムは、信頼度算出手段によって、前記日本語語彙に対する手話訳の信頼度を、繰り返し前の値より繰り返した後の値が小さくなるように算出する。また、対訳辞書拡張プログラムは、対訳辞書拡張手段によって、前記繰返回数だけ繰り返し、前記類義語を検索条件として前記日本語−手話対訳辞書の手話訳を検索すると共に、前記検索条件とした類義語に対応付けられた前記類義語データの日本語語彙を前記日本語−手話対訳辞書より検索した手話訳に関連付けて、かつ、前記信頼度を付加した辞書データを生成し、当該辞書データを前記日本語−手話対訳辞書に登録する。
つまり、対訳辞書拡張プログラムは、新たな辞書データが登録された日本語−手話対訳辞書を繰り返し検索することで、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、日本語語彙の手話訳を新たに得えることができる。また、対訳辞書拡張プログラムは、日本語−手話対訳辞書の拡張を繰り返すほど信頼度を低くして、新たに得た手話訳の順序付けを行う。
本発明は、以下のような優れた効果を奏する。
本願第1,3発明は、新たな辞書データが登録された日本語−手話対訳辞書を繰り返し検索することで、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、日本語語彙の手話訳を新たに得えることができる。また、本願第1,3発明は、信頼度によって手話訳の順序付けを行うので、どの手話訳を用いればよいかを利用者が容易に判断でき、拡張した日本語−手話対訳辞書の利便性が向上する。
本願第2発明は、簡易な演算で信頼度を算出するので、演算処理を高速化できる。
本発明の第1実施形態に係る対訳辞書拡張装置の構成を示すブロック図である。 図1の対訳辞書拡張装置の動作を示すフローチャートである。 1回目の拡張における、日本語−手話対訳辞書および類義語データの内容を示す図であり、(a)は処理開始前の日本語−手話対訳辞書であり、(b)は入力された類義語データであり、(c)は置き換えられた類義語データであり、(d)は更新信頼度が算出された類義語データであり、(e)は1回目の拡張が終了したときの日本語−手話対訳辞書であり、(f)は1回目の拡張が終了したときの類義語データである。 2回目の拡張における、日本語−手話対訳辞書および類義語データの内容を示す図であり、(a)は2回目の拡張が終了したときの日本語−手話対訳辞書であり、(b)は2回目の拡張が終了したときの類義語データである。 3回目の拡張における、日本語−手話対訳辞書および類義語データの内容を示す図であり、(a)は3回目が終了したときの日本語−手話対訳辞書であり、(b)は3回目の拡張が終了したときの類義語データである。 図1の対訳辞書拡張装置を利用した辞書検索システムの構成を示すブロック図である。 図6の検索条件入力手段が提示する検索条件入力画面の図である。 図6の検索結果提示手段が提示する検索結果提示画面の図である。 日本語−手話対訳辞書を拡張する従来技術を説明する図である。
以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段には同一の符号を付し、説明を省略した。
(第1実施形態)
[対訳辞書拡張装置の構成]
以下、図1を参照し、本発明の第1実施形態に係る対訳辞書拡張装置1の構成について説明する。図1に示すように、対訳辞書拡張装置1は、日本語−手話対訳辞書を拡張するものであり、入力端子(入力手段)10と、対訳なし類義語記憶手段(類義語データ記憶手段)20と、日本語−手話対訳辞書記憶手段(対訳辞書記憶手段)30と、日本語−手話対訳辞書拡張手段(対訳辞書拡張手段)40と、更新信頼度算出手段(信頼度算出手段)50と、出力端子60とを備える。
入力端子10は、1件以上の類義語データを入力する端子である。そして、入力端子10は、入力された類義語データを対訳なし類義語記憶手段20に格納する。この類義語データは、予め手動で生成される。
対訳なし類義語記憶手段20は、手話の対訳が登録されていない類義語データ、すなわち、入力端子10から入力された類義語データを記憶するハードディスク、メモリ等の記憶装置である。
ここで、図3(b)を参照し、類義語記憶手段20が記憶する類義語データについて説明する。この例では、図3(b)に示すように、類義語記憶手段20は、説明を簡易にするために、3件の類義語データを記憶していることとする。
類義語データは、識別子と、日本語語彙と、この日本語語彙の類義語と、更新信頼度とを対応づけたものである。
識別子は、類義語データを一意に識別するものであり、例えば、類義語1〜3というように表される。
類義語は、日本語語彙に対する1語以上の類義語を表している。例えば、類義語データ「類義語1」では、日本語語彙「意義」に対して、1語の類義語「意味」が対応付けられている。また、例えば、類義語データ「類義語2」では、日本語語彙「意図」に対して、2語の類義語「意義」および「意思」が対応付けられている。
更新信頼度は、日本語語彙に対する手話訳の信頼度を示す値である。この更新信頼度は、後記する更新信頼度算出手段50によって算出される。なお、図3〜図5において、更新信頼度の“−”は、これが算出されていないことを示す。
以下、図1に戻り、対訳辞書拡張装置1の構成について説明を続ける。
日本語−手話対訳辞書記憶手段30は、日本語−手話対訳辞書を記憶するハードディスク、メモリ等の記憶装置である。この辞書データは、予め手動で登録される。
ここで、図3(a)を参照し、日本語−手話対訳辞書記憶手段30が記憶する日本語−手話対訳辞書について説明する。この例では、図3(a)に示すように、日本語−手話対訳辞書記憶手段30は、説明を簡易にするために、1件の辞書データを有する日本語−手話対訳辞書を記憶していることとする。
辞書データは、識別子と、日本語語彙と、この日本語語彙の手話訳(手話語彙)と、更新信頼度とを対応付けたものである。
識別子は、辞書データを一意に識別するものであり、例えば、対訳1aというように表される。
手話訳は、日本語語彙を手話語彙に訳したものであり、日本語語彙に意味が近い手話語彙である。なお、従来技術と同様、手話語彙は、日本語語彙に括弧“<>”を付けて表す。
更新信頼度は、類義語データと同様のものである。
以下、図1に戻り、対訳辞書拡張装置1の構成について説明を続ける。
日本語−手話対訳辞書拡張手段40は、日本語−手話対訳辞書を拡張する。具体的には、日本語−手話対訳辞書拡張手段40は、繰返回数Mだけ繰り返して、対訳なし類義語記憶手段20が記憶する類義語データの類義語を検索条件として、日本語−手話対訳辞書記憶手段30が記憶する日本語−手話対訳辞書を検索する。そして、日本語−手話対訳辞書拡張手段40は、検索条件とした類義語に対応する類義語データの日本語語彙を、日本語−手話対訳辞書より検索された手話訳に関連付ける。さらに、日本語−手話対訳辞書拡張手段40は、後記する更新信頼度算出手段50が算出した信頼度を付加して辞書データを生成し、この辞書データを日本語−手話対訳辞書記憶手段30が記憶する日本語−手話対訳辞書に登録する。なお、日本語−手話対訳辞書拡張手段40の詳細は、後記する。
なお、繰返回数Mは、日本語−手話対訳辞書を拡張する最大回数を示し、2以上の値で予め設定される。以下、繰返回数Mは、3回に設定されているとして説明する。
更新信頼度算出手段50は、日本語語彙に対する手話訳の更新信頼度(信頼度)を、繰り返し前の値より繰り返した後の値が小さくなるように算出する。具体的には、更新信頼度算出手段50は、後記する繰返カウンタiが1回目のときは、所定の定数に更新信頼度の初期値を乗じて更新信頼度を算出する(式(2)参照)。また、更新信頼度算出手段50は、繰返カウンタiが2回目以降のときは、前回の更新信頼度に定数を乗じて、更新信頼度を算出する(式(3)および式(4)参照)。そして、更新信頼度算出手段50は、算出した更新信頼度を日本語−手話対訳辞書拡張手段40に出力する。なお、更新信頼度算出手段50の詳細は、後記する。
出力端子60は、日本語−手話対訳辞書記憶手段30が記憶する日本語−手話対訳辞書を出力する端子である。
[対訳辞書拡張装置の動作]
以下、図2〜図5を参照し、図1の対訳辞書拡張装置1の動作について説明する(適宜図1参照)。この例では、対訳辞書拡張装置1は、日本語−手話対訳辞書を3回拡張するか、または、対訳なし類義語記憶手段20の類義語データがなくなるまで処理を行う。
<1回目の拡張>
まず、日本語−手話対訳辞書の1回目の拡張について説明する。
入力端子10は、入力された類義語データを対訳なし類義語記憶手段20に記憶する(ステップS1)。ここで、入力端子10は、図3(b)に示すように、3件の類義語データ「類義語1」〜「類義語3」を対訳なし類義語記憶手段20に記憶する。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiの値を1に初期化する(ステップS2)。なお、繰返カウンタiは、日本語−手話対訳辞書の拡張が現在何回目であるかを示すカウンタである。
日本語−手話対訳辞書拡張手段40は、対訳なし類義語記憶手段20が記憶する類義語データの類義語を検索条件として日本語−手話対訳辞書を検索する(ステップS3)。
以下、ステップS3の処理を具体的に説明する。
図3(b)に示すように、日本語−手話対訳辞書拡張手段40は、類義語データ「類義語1」の類義語「意味」を検索条件として日本語−手話対訳辞書を検索する。すると、図3(a)に示すように、日本語−手話対訳辞書拡張手段40は、辞書データ「対訳1a」が検索条件を満たすので、この辞書データ「対訳1a」を取得する。
そして、図3(c)に示すように、日本語−手話対訳辞書拡張手段40は、検索条件とした類義語データ「類義語1」の類義語「意味」を、取得した辞書データ「対訳1a」の手話訳<意味>で置き換える。言い換えると、日本語−手話対訳辞書拡張手段40は、検索条件とした類義語「意味」に対応付けられた日本語語彙「意義」を、日本語−手話対訳辞書より検索した辞書データ「対訳1a」の手話訳<意味>に関連付けている。このとき、日本語−手話対訳辞書拡張手段40は、類義語データ「類義語1」に更新信頼度の初期値(例えば、「1.0」)を付加する。この更新信頼度の初期値は、予め設定される。
なお、日本語−手話対訳辞書拡張手段40は、類義語データの全ての類義語を検索条件として日本語−手話対訳辞書を検索する。しかし、図3(a)および図3(b)に示すように、類義語データ「類義語2」の類義語「意義」および「意思」と、類義語データ「類義語3」の類義語「意図」との何れもが、日本語−手話対訳辞書に登録されていない。従って、日本語−手話対訳辞書拡張手段40は、これらに何の関連付けも行わない。
以下、ステップS4の処理を具体的に説明する。
更新信頼度算出手段50は、繰り返し前の値より繰り返した後の値が小さくなるように更新信頼度を算出する(ステップS4)。具体的には、更新信頼度算出手段50は、例えば、下記の式(1)を用いて、更新信頼度r´(w,w)を算出する。
r´(w,w)=γ・r(w,w)・・・式(1)
この式(1)は、日本語−手話対訳辞書の検索と登録とを繰り返すほど更新信頼度の値が小さくなることを示す。なお、式(1)において、wは日本語語彙(例えば、「意義」)であり、wは類義語(例えば、「意味」)であり、γは0を超え1未満の範囲内で予め設定された定数(例えば、「0.8」)である。また、r(w,w)は、更新信頼度(この場合、更新信頼度の初期値「1.0」)である。
つまり、1回目の拡張では、更新信頼度算出手段50は、下記の式(2)で示すように、更新信頼度「0.8」を算出する。
r´(意義,意味)=0.8×1.0
=0.8 ・・・式(2)
以下、ステップS5以降の処理について説明を続ける。
日本語−手話対訳辞書拡張手段40は、ステップS3で関連付けた日本語語彙「意義」と手話訳<意味>とにステップS4で算出した更新信頼度を付加し、辞書データ「対訳1b」を生成する。そして、日本語−手話対訳辞書拡張手段40は、図3(e)に示すように、1件の辞書データ「対訳1b」を日本語−手話対訳辞書に登録する。さらに、日本語−手話対訳辞書拡張手段40は、図3(f)に示すように、1件の類義語データ「類義語1」を削除する(ステップS5)。
日本語−手話対訳辞書拡張手段40は、拡張すべき類義語があるか判定する(ステップS6)。具体的には、日本語−手話対訳辞書拡張手段40は、対訳なし類義語記憶手段20の類義語データが残っている場合には、拡張する類義語があると判定する。一方、日本語−手話対訳辞書拡張手段40は、この類義語データが残っていない場合には、拡張する類義語がないと判定する。
ここでは、日本語−手話対訳辞書拡張手段40は、図3(f)に示すように、2件の類義語データが残っているので、ステップS7の処理に進む。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiが繰返回数Mと等しいかを判定する(ステップS7)。
ここでは、日本語−手話対訳辞書拡張手段40は、繰返カウンタi=1と、繰返回数M=3とが等しくないので、ステップS8の処理に進む。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiをインクリメントし、繰返カウンタi=2とする(ステップS8)。その後、ステップS3の処理に戻り、対訳辞書拡張装置1は、2回目の拡張を行う。
<2回目の拡張>
以下、日本語−手話対訳辞書の2回目の拡張について、1回目の拡張と異なる点を主に説明する。
図3(f)に示すように、日本語−手話対訳辞書拡張手段40は、類義語データ「類義語2」の類義語「意義」を検索条件として日本語−手話対訳辞書を検索する。すると、図3(e)に示すように、日本語−手話対訳辞書拡張手段40は、辞書データ「対訳1b」が検索条件を満たすので、この辞書データ「対訳1b」を取得する。そして、日本語−手話対訳辞書拡張手段40は、検索条件とした類義語データ「類義語2」の類義語「意義」を、取得した辞書データ「対訳1b」の手話訳<意味>で置き換える(ステップS3)。
更新信頼度算出手段50は、下記の式(3)で示すように、更新信頼度「0.64」を算出する(ステップS4)。なお、式(3)の更新信頼度は、前回の更新信頼度と同じ値、つまり、1回目の拡張を行った後の更新信頼度の値(例えば、「0.8」)である。
r´(意図,意味)=0.8×0.8
=0.64 ・・・式(3)
日本語−手話対訳辞書拡張手段40は、図4(a)に示すように、1件の辞書データ「対訳1c」を日本語−手話対訳辞書に登録する。また、日本語−手話対訳辞書拡張手段40は、図4(b)に示すように、類義語データ「類義語1」の類義語「意義」を削除する(ステップS5)。
日本語−手話対訳辞書拡張手段40は、拡張すべき類義語があるか判定する(ステップS6)。
ここでは、日本語−手話対訳辞書拡張手段40は、図4(b)に示すように、2件の類義語データが残っているので、ステップS7の処理に進む。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiが繰返回数Mと等しいかを判定する(ステップS7)。
ここでは、日本語−手話対訳辞書拡張手段40は、繰返カウンタi=2と、繰返回数M=3とが等しくないので、ステップS8の処理に進む。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiをインクリメントし、繰返カウンタi=3とする(ステップS8)。
つまり、2回目の拡張において、対訳辞書拡張装置1は、辞書データ「対訳1b」が登録された日本語−手話対訳辞書を1回目の拡張と同様に検索するので、日本語−手話対訳辞書に新たな辞書データ「対訳1c」を登録することができる。その後、ステップS3の処理に戻り、対訳辞書拡張装置1は、3回目の拡張を行う。
<3回目の拡張>
以下、日本語−手話対訳辞書の3回目の拡張について、1回目の拡張および2回目の拡張と異なる点を主に説明する。
図4(b)に示すように、日本語−手話対訳辞書拡張手段40は、類義語データ「類義語3」の類義語「意図」を検索条件として日本語−手話対訳辞書を検索する。すると、図4(a)に示すように、日本語−手話対訳辞書拡張手段40は、辞書データ「対訳1c」が検索条件を満たすので、この辞書データ「対訳1c」を取得する。そして、日本語−手話対訳辞書拡張手段40は、検索条件とした類義語データ「類義語3」の類義語「意図」を、取得した辞書データ「対訳1c」の手話訳<意味>で置き換える(ステップS3)。
更新信頼度算出手段50は、下記の式(4)で示すように、更新信頼度「0.512」を算出する(ステップS4)。なお、式(4)の更新信頼度は、前回の更新信頼度と同じ値、つまり、2回目の拡張を行った後の更新信頼度の値(例えば、「0.64」)である。
r´(趣旨,意味)=0.8×0.64
=0.512 ・・・式(4)
日本語−手話対訳辞書拡張手段40は、図5(a)に示すように、1件の辞書データ「対訳1d」を日本語−手話対訳辞書に登録する。また、日本語−手話対訳辞書拡張手段40は、図5(b)に示すように、類義語データ「類義語3」を削除する(ステップS5)。
日本語−手話対訳辞書拡張手段40は、拡張すべき類義語があるか判定する(ステップS6)。
ここでは、日本語−手話対訳辞書拡張手段40は、図5(b)に示すように、1件の類義語データが残っているので、ステップS7の処理に進む。
日本語−手話対訳辞書拡張手段40は、繰返カウンタiが繰返回数Mと等しいかを判定する(ステップS7)。
ここでは、日本語−手話対訳辞書拡張手段40は、繰返カウンタi=3と、繰返回数M=3とが等しいので、ステップS9の処理に進む。
出力端子60は、拡張した日本語−手話対訳辞書、つまり、図5(a)の日本語−手話対訳辞書を出力する(ステップS9)。
つまり、3回目の拡張において、対訳辞書拡張装置1は、辞書データ「対訳1c」が登録された日本語−手話対訳辞書を1回目の拡張および2回目の拡張と同様に検索するので、日本語−手話対訳辞書に新たな辞書データ「対訳1d」を登録することができる。
以上のように、本発明の第1実施形態に係る対訳辞書拡張装置1は、新たな辞書データが登録された日本語−手話対訳辞書を繰り返し検索することで、類義語の手話訳が日本語−手話対訳辞書に登録されていない場合でも、図5(a)に示すように、日本語語彙の手話訳を新たに得えることができる。また、対訳辞書拡張装置1は、信頼度によって手話訳の順序付けを行うので、どの手話訳を用いればよいかを利用者が容易に判断でき、拡張した日本語−手話対訳辞書の利便性を向上させることができる。さらに、対訳辞書拡張装置1は、式(1)のような簡易な演算式で更新信頼度を算出するので、演算処理を高速化できる。
なお、日本語−手話対訳辞書は、辞書データ「対訳1a」〜「対訳1d」として、日本語語彙「意思」が登録されていない。このため、仮に、繰返回数Mを4回以上としても、対訳辞書拡張装置1は、日本語−手話対訳辞書に日本語語彙「意図」の手話訳を登録することができない。
なお、第1実施形態では、本発明に係る対訳辞書拡張装置1を独立した装置として説明したが、本発明では、一般的なコンピュータを、前記した各手段として協調動作させるプログラムによって実現できる。このプログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。
なお、第1実施形態では、類義語データが識別子を含むものとして説明したが、類義語データは識別子を含まなくともよい。また、同様に、辞書データが識別子を含むものとして説明したが、辞書データは識別子を含まなくともよい。
(第2実施形態)
以下、図6〜図8を参照し、第2実施形態として、図1の対訳辞書拡張装置1を利用した辞書検索システム100を説明する(適宜図1参照)。図6に示すように、辞書検索システム100は、検索条件として入力された日本語語義の手話訳を利用者に提示するものであり、図1の対訳辞書拡張装置1と、検索条件入力手段70と、検索手段80と、検索結果提示手段90とを備える。
検索条件入力手段70は、図7に示すように、検索条件入力画面を利用者(不図示)に提示する。この検索条件入力画面は、利用者によって、テキストボックスTx1に、日本語語彙(例えば、「意味」)が入力される。そして、検索条件入力手段70は、利用者によって検索ボタンBt1がクリックされると、テキストボックスTx1の日本語語彙を検索条件として取得する。なお、図7では検索条件入力画面下側の図示を省略すると共に、検索条件に関係しない説明も省略した。
検索手段80は、対訳辞書拡張装置1から日本語−手話対訳辞書が入力されると共に、検索条件入力手段70から検索条件が入力される。そして、検索手段80は、この日本語−手話対訳辞書から、完全一致、前方一致および後方一致となる辞書データを検索し、検索結果提示手段90に出力する。
ここで、検索手段80は、図5(a)の日本語−手話対訳辞書と、検索条件「意味」とが入力されたとする。この場合、検索手段80は、完全一致となる辞書データ「対訳1a」に加え、前方一致となる辞書データ「対訳1b」および「対訳1c」を検索結果として取得する。そして、検索手段80は、これら辞書データ「対訳1a」〜「対訳1c」を検索結果提示手段90に出力する。言い換えると、検索手段80は、図5(a)の日本語−手話対訳辞書のうち、完全一致、前方一致および後方一致の何れにも該当しない辞書データ「対訳1d」を、検索結果提示手段90に出力しない。
検索結果提示手段90は、検索手段80からの検索結果(辞書データ)を一覧表示した検索結果提示画面を利用者に提示する。ここで、検索結果提示手段90は、検索結果提示画面の上側から更新信頼度が高い順に、検索結果となる辞書データ「対訳1a」〜「対訳1c」を提示する。具体的には、図8に示すように、この検索結果提示画面は、辞書データ「対訳1a」〜「対訳1c」のそれぞれに対応するように、日本語語彙αと、更新信頼度βと、その手話訳を示す動画γとを含んでいる。さらに、手話訳を示す動画γが利用者によってクリックされると、その動画γ(つまり、手話動作)が、再生される。
以上のように、図1の対訳辞書拡張装置1は、例えば、図6の辞書検索システム100の一部として利用することができる。この場合、対訳辞書拡張装置1は、更新信頼度を利用者に提示するので、利用者がどの手話訳が好ましいかを容易に判断でき、辞書検索システム100の利便性を向上させることができる。
なお、手話訳を示す動画γは、例えば、手話通訳者の手話動作をモーションキャプチャで捉え、これをTVML(TV program Making Language)で描写し、GCアニメーションとして生成できる。そして、手話訳を示す動画γは、MPEG−2(Moving Picture Experts Group)形式で符号化してもよい。さらに、この場合、対訳辞書拡張装置1は、この動画γそのものを手話訳として用いてもよい。
1 対訳辞書拡張装置
10 入力端子(入力手段)
20 対訳なし類義語記憶手段(類義語データ記憶手段)
30 日本語−手話対訳辞書記憶手段(対訳辞書記憶手段)
40 日本語−手話対訳辞書拡張手段(対訳辞書拡張手段)
50 更新信頼度算出手段(信頼度算出手段)
60 出力端子
70 検索条件入力手段
80 検索手段
90 検索結果提示手段
100 辞書検索システム

Claims (3)

  1. 日本語−手話対訳辞書の検索と登録とを予め設定された繰返回数だけ繰り返して、当該日本語−手話対訳辞書を拡張する対訳辞書拡張装置であって、
    日本語語彙と当該日本語語彙の類義語とを対応付けた類義語データが入力される入力手段と、
    前記入力手段に入力された類義語データを記憶する類義語データ記憶手段と、
    日本語語彙と当該日本語語彙の手話訳とを対応付けた辞書データが登録された前記日本語−手話対訳辞書を記憶する対訳辞書記憶手段と、
    前記日本語語彙に対する手話訳の信頼度を、繰り返し前の値より繰り返した後の値が小さくなるように算出する信頼度算出手段と、
    前記繰返回数だけ繰り返し、前記類義語を検索条件として前記日本語−手話対訳辞書の手話訳を検索すると共に、前記検索条件とした類義語に対応付けられた前記類義語データの日本語語彙を前記日本語−手話対訳辞書より検索した手話訳に関連付けて、かつ、前記信頼度を付加した辞書データを生成し、当該辞書データを前記日本語−手話対訳辞書に登録する対訳辞書拡張手段と、
    を備えることを特徴とする対訳辞書拡張装置。
  2. 前記対訳辞書拡張手段は、
    繰返カウンタが前記繰返回数に等しくなるまで、前記日本語−手話対訳辞書の検索と登録とを繰り返すと共に、当該繰り返し毎に前記繰返カウンタをインクリメントし、
    前記信頼度算出手段は、
    前記繰返カウンタが1回目のときは、0を超え1未満の範囲内で予め設定された定数に予め設定された初期値を乗じて前記信頼度を算出し、
    前記繰返カウンタが2回目以降のときは、前回算出した信頼度に前記定数を乗じて前記信頼度を算出することを特徴とする請求項1に記載の対訳辞書拡張装置。
  3. 日本語−手話対訳辞書の検索と登録とを予め設定された繰返回数だけ繰り返して、当該日本語−手話対訳辞書を拡張するために、日本語語彙と当該日本語語彙の類義語とを対応付けた類義語データを記憶する類義語データ記憶手段と、日本語語彙と当該日本語語彙の手話訳とを対応付けた辞書データが登録された前記日本語−手話対訳辞書を記憶する対訳辞書記憶手段とを備えるコンピュータを、
    前記日本語語彙に対する手話訳の信頼度を、繰り返し前の値より繰り返した後の値が小さくなるように算出する信頼度算出手段、
    前記繰返回数だけ繰り返し、前記類義語を検索条件として前記日本語−手話対訳辞書の手話訳を検索すると共に、前記検索条件とした類義語に対応付けられた前記類義語データの日本語語彙を前記日本語−手話対訳辞書より検索した手話訳に関連付けて、かつ、前記信頼度を付加した辞書データを生成し、当該辞書データを前記日本語−手話対訳辞書に登録する対訳辞書拡張手段、
    として機能させることを特徴とする対訳辞書拡張プログラム。
JP2009266060A 2009-11-24 2009-11-24 対訳辞書拡張装置およびそのプログラム Active JP5113824B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009266060A JP5113824B2 (ja) 2009-11-24 2009-11-24 対訳辞書拡張装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009266060A JP5113824B2 (ja) 2009-11-24 2009-11-24 対訳辞書拡張装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2011112675A true JP2011112675A (ja) 2011-06-09
JP5113824B2 JP5113824B2 (ja) 2013-01-09

Family

ID=44235087

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009266060A Active JP5113824B2 (ja) 2009-11-24 2009-11-24 対訳辞書拡張装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP5113824B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03206558A (ja) * 1989-10-30 1991-09-09 Ricoh Co Ltd 機械翻訳システム
JPH076175A (ja) * 1993-02-19 1995-01-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JP2000222405A (ja) * 1999-01-29 2000-08-11 Matsushita Electric Ind Co Ltd 辞書データ改良装置および方法ならびに情報記録媒体

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03206558A (ja) * 1989-10-30 1991-09-09 Ricoh Co Ltd 機械翻訳システム
JPH076175A (ja) * 1993-02-19 1995-01-10 Matsushita Electric Ind Co Ltd 機械翻訳装置
JP2000222405A (ja) * 1999-01-29 2000-08-11 Matsushita Electric Ind Co Ltd 辞書データ改良装置および方法ならびに情報記録媒体

Also Published As

Publication number Publication date
JP5113824B2 (ja) 2013-01-09

Similar Documents

Publication Publication Date Title
KR102565659B1 (ko) 정보 생성 방법 및 장치
JP6413256B2 (ja) 会議支援装置、会議支援装置の制御方法、及びプログラム
JP6415929B2 (ja) 音声合成装置、音声合成方法およびプログラム
JP2009187081A (ja) スクリーンショット管理装置、およびスクリーンショット管理プログラム
WO2019123854A1 (ja) 翻訳装置、翻訳方法、及びプログラム
JP5113824B2 (ja) 対訳辞書拡張装置およびそのプログラム
JP2019057095A (ja) 文章生成装置、モデル生成装置、校正装置及びコンピュータプログラム
JP4845523B2 (ja) 文字処理装置、方法、プログラムおよび記録媒体
JP5488792B2 (ja) データベース操作装置、データベース操作方法、及びプログラム
JP2012226697A (ja) Wbs作成システムおよびwbs作成方法
JP5302784B2 (ja) 機械翻訳方法、及びシステム
JP2010015394A (ja) リンク先提示装置およびコンピュータプログラム
JP2020173776A (ja) 映像を生成するための方法および装置
JP5600826B1 (ja) 非構造化データ処理システム、非構造化データ処理方法およびプログラム
JP2008299493A5 (ja)
JP6511874B2 (ja) コンピュータプログラム、検索装置及び検索方法
JP5060539B2 (ja) 文書処理装置およびプログラム
JP2008216397A (ja) 情報を提示する装置と方法及びその提示情報を作成する装置と方法
JP5182960B2 (ja) 店舗名曖昧性解消装置、その方法、プログラム及び記録媒体
JP2007164708A (ja) 変換データ生成装置、データ変換システム、及びこれらの方法並びにそのプログラム
JP2009266065A (ja) 関連語辞書作成方法及び装置、並びに関連語辞書作成プログラム
JPH11224264A (ja) 文書検索装置および記録媒体
JP2004117647A (ja) クラス言語モデル生成方法、クラス言語モデル生成装置及びクラス言語モデル生成プログラム
KR20230104434A (ko) 웹 기반의 이미지 텍스트 번역 방법, 장치 및 시스템
JP2006172029A (ja) 検索結果提示方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120321

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120918

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121012

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151019

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5113824

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250