JP6306899B2 - Non-finger movement detection device and program - Google Patents
Non-finger movement detection device and program Download PDFInfo
- Publication number
- JP6306899B2 JP6306899B2 JP2014040707A JP2014040707A JP6306899B2 JP 6306899 B2 JP6306899 B2 JP 6306899B2 JP 2014040707 A JP2014040707 A JP 2014040707A JP 2014040707 A JP2014040707 A JP 2014040707A JP 6306899 B2 JP6306899 B2 JP 6306899B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- japanese
- sign language
- words
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
この発明は、非手指動作検出装置及びプログラムに関する。 The present invention relates to a non-finger movement detection device and a program.
手話サービスの拡充をめざし、日本語から手話への自動翻訳の研究が進められている。手話では、手や指の動きなどの手指動作とともに、顔の表情や頭部の動きなどの非手指動作によって言語的情報を表出している。テキストから手話への翻訳は、日本語文と手話文との対訳コーパスに基づいて行われる。一般に、手話文で表記されるのは主に手指動作であり、非手指動作は一部のみしか書き起こされていない。これは、手指動作は単語の同定をしやすいが、非手指動作は難しいからである。非手指動作は言語的役割や音声言語のプロソディの役割もあり、その区別をつけて書き起こすことは人間でも容易ではない。 Research on automatic translation from Japanese into sign language is ongoing with the aim of expanding sign language services. In sign language, linguistic information is expressed by finger movements such as hand and finger movements as well as non-finger movements such as facial expressions and head movements. Translation from text to sign language is performed based on a bilingual corpus of Japanese sentences and sign language sentences. In general, the sign language sentence mainly describes finger movements, and only a part of non-hand movements is transcribed. This is because a finger movement is easy to identify a word, but a non-finger movement is difficult. Non-finger movements also have the role of linguistic and spoken language prosody, and it is not easy for humans to write with distinction.
従来、非手指動作を検出する技術としては、顔認識技術を使って顔の表情を自動認識し、その箇所を非手指動作として検出する技術がある(例えば、特許文献1〜3)。 Conventionally, as a technique for detecting a non-finger movement, there is a technique for automatically recognizing a facial expression using a face recognition technique and detecting the position as a non-finger movement (for example, Patent Documents 1 to 3).
しかしながら、手話では顔表情が音声言語のプロソディの役割も持っており、非手指動作以外でも顔表情が表出されることがある。したがって、顔表情があっても必ずしも言語的な意味を持つものではなく、正しく非手指動作が検出されない場合がある。 However, in sign language, facial expressions also have the role of a spoken language prosody, and facial expressions may appear even in non-finger movements. Therefore, even if there is a facial expression, it does not necessarily have a linguistic meaning, and a non-hand movement may not be detected correctly.
したがって、かかる点に鑑みてなされた本発明の目的は、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出する非手指動作検出装置及びプログラムを提供することである。 Accordingly, an object of the present invention made in view of such a point is to provide a non-hand movement detection device and a program for detecting a word to be non-hand movement based on a bilingual corpus of a Japanese sentence and a sign language sentence.
上述した諸課題を解決すべく、本発明に係る非手指動作検出装置は、日本語文と、前記日本語文に対応する手話文とを含む対訳コーパスを格納する格納部であって、前記日本語文を日本語単語に分割し、語順を示す番号と紐付けて格納すると共に、前記手話文を手指動作に対応する手話単語に分割し、語順を示す番号と紐付けて格納する前記格納部と、前記日本語文に含まれる前記日本語単語と、前記手話文に含まれる前記手話単語とを対応付けるアライメント部であって、前記日本語単語と前記手話単語との間の文字又は文字列の一致と、前記日本語単語と前記手話単語の文中距離に基づいて、前記日本語単語と前記手話単語とを対応付けることを含む、前記アライメント部と、前記日本語単語のうち、前記手話単語と対応付けられていない日本語単語から、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する非手指動作検出部と、を備える。 In order to solve the above-described problems, a non-finger movement detection device according to the present invention is a storage unit that stores a bilingual corpus including a Japanese sentence and a sign language sentence corresponding to the Japanese sentence, The storage unit is divided into Japanese words and stored in association with numbers indicating the word order, and the sign language sentence is divided into sign language words corresponding to finger movements, and stored in association with numbers indicating the word order , said Japanese words contained in Japanese sentences, a alignment unit for associating the said sign language word included in the sign language sentence, the matching character or string between the sign language words and the Japanese word, the based Japanese words and the sentence length of said sign language words comprises associating the said sign language word and the Japanese word, and the alignment portion, of the Japanese word, Do not associated with the sign language word From Japanese word comprises a non-finger movement detection unit for detecting the content words representing the lexical meaning as the Japanese word to be non-finger operation, the.
また、前記アライメント部は、前記日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、前記複数漢字から構成される日本語単語を各漢字に分割し、前記各漢字と前記手話単語との間の翻訳確率に基づき前記各漢字と前記手話単語との対応付けをさらに行う、ことが好ましい。 In addition, when the Japanese word composed of a plurality of kanji characters is translated into another language word that is equal to or more than the number of kanji characters of the Japanese word, the alignment unit is configured to include the plurality of kanji characters. Preferably, the word word is divided into kanji characters, and the kanji characters and the sign language words are further associated with each other based on the translation probabilities between the kanji characters and the sign language words.
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記非手指動作検出装置として機能させるものである。 In order to solve the above problems, a program according to the present invention causes a computer to function as the non-finger movement detection device.
本発明に係る非手指動作検出装置及びプログラムによれば、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出することが可能になる。 According to the non-finger movement detection apparatus and program according to the present invention, it is possible to detect a word that should be non-finger movement based on a bilingual corpus of a Japanese sentence and a sign language sentence.
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、手話には確立された表記法はないが、本稿においては、一般的に用いられる表記法である日本語ラベルを用いるものとする(非特許文献1参照)。日本語ラベルでは、手話単語は“{雨}”のように、手話単語と意味的に近い日本語の単語を括弧“{}”で括ることによって記述される。日本語ラベルは単語ごとの書き起こしであるので、機械翻訳で扱いやすいという利点がある。日本語文と手話文(日本語ラベル)との対訳コーパスの一例は、下記の通り表わされる。
[対訳コーパス]
日本語文:大雪や強い雷雨に注意するよう呼びかけています
手話文 :{とても} {降雪} {雷} {雨} {注意} {宣伝} {中}
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Here, there is no established notation for sign language, but in this paper, Japanese labels that are commonly used notation are used (see Non-Patent Document 1). In a Japanese label, a sign language word is described by enclosing a Japanese word semantically close to a sign language word in parentheses “{}”, such as “{rain}”. Japanese labels have the advantage that they are easy to handle in machine translation because they are written for each word. An example of a bilingual corpus of Japanese sentences and sign language sentences (Japanese labels) is expressed as follows.
[Bilingual Corpus]
Japanese sentence: Calling attention to heavy snow and heavy thunderstorms Sign language: {Very} {Snowfall} {Thunder} {Rain} {Caution} {Promotion} {Medium}
図1は、本発明の一実施形態に係る非手指動作検出装置の概略構成を示す図である。非手指動作検出装置は、形態素解析部11、単語プレアライメント部12、文字プレアライメント部13、文中距離計算部14、漢字分割部15、翻訳確率推定部16、翻訳確率アライメント部17、及び非手指動作検出部18を有する制御部10と、対訳コーパス格納部21及び翻訳確率格納部22を有する格納部20とを備える。制御部10において、単語プレアライメント部12、文字プレアライメント部13、文中距離計算部14、漢字分割部15、翻訳確率推定部16、翻訳確率アライメント部17は、アライメント部Aを構成する。制御部10の各処理部11〜18は好適なプロセッサにより構成され、各処理部11〜18を共通のプロセッサで実装したり、個別のプロセッサとして実装したりすることができる。格納部20は好適な記憶装置であって、非手指動作検出装置に内蔵されるものだけではなく、通信インタフェースを介した外部記憶装置を用いてもよい。
FIG. 1 is a diagram showing a schematic configuration of a non-finger movement detection device according to an embodiment of the present invention. The non-finger movement detection device includes a
形態素解析部11は、対訳コーパス中の日本語文を形態素解析して単語に分割する。また、形態素解析部11は、対訳コーパス中の手話文が日本語ラベルのように単語ごとに分かれていない場合、手話文を形態素解析して単語に分割することができる。これ以降、日本語文中の各単語を日本語単語、手話文中の各単語を手話単語と適宜称するものとする。
The
アライメント部Aは、日本語文に含まれる日本語単語と、手話文に含まれる手話単語とを対応付ける(アライメントする)ものである。 The alignment unit A associates (aligns) the Japanese words included in the Japanese sentence with the sign language words included in the sign language sentence.
単語プレアライメント部12は、日本語単語と手話単語との間で表層的に一致するもの同士を対応付ける。すなわち、単語プレアライメント部12は、文字(文字列)が完全に一致する日本語単語と手話単語とを対応付けるものである。 The word pre-alignment unit 12 associates Japanese words and sign language words that are superficially matched. That is, the word pre-alignment unit 12 associates Japanese words and sign language words whose characters (character strings) completely match.
文字プレアライメント部13は、日本語単語を構成する文字と手話単語との間で表層的に一致するもの同士を対応付ける。すなわち、文字プレアライメント部13は、日本語単語と、当該日本語単語を構成する文字と同じ手話単語とを対応付けるものである。 The character pre-alignment unit 13 associates the characters constituting the Japanese word and the sign language words that are superficially matched. That is, the character pre-alignment unit 13 associates a Japanese word with the same sign language word as the character constituting the Japanese word.
文中距離計算部14は、ある日本語単語が日本語文中で出現する位置と、ある手話単語が手話文中で出現する位置との近さ(文中距離)を計算する。一般的に日本語文と手話文との語順は似ているため、ある日本語単語とある手話単語との文中距離が近い場合、当該単語同士が対応する可能性も高くなる。また、ある日本語単語とある手話単語との文中距離が離れている場合、当該単語同士が対応する可能性は低くなる。そのため、文中距離が所定の閾値を超える単語同士については、アライメントの対象から除外することが可能となる。文中距離計算部14が計算する文中距離dist(jp,sq)は、式(1)のように定義される。ここで、NJは日本語文中の日本語単語数、jpはp番目の日本語単語、NSは手話文中の手話単語数、sqはq番目の手話単語である。
dist(jp,sq) = |p/NJ - q/NS| (1)
The in-sentence
dist (j p , s q ) = | p / N J -q / N S | (1)
漢字分割部15は、日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割する。ここで、他言語とは、例えば英語であって、漢字分割部15は、2文字の漢字から構成される日本語単語が2つ以上の英単語に翻訳される場合、当該日本語単語を各漢字に分割する。日本語単語の他言語への翻訳には種々の公知技術を用いることができ、例えば、漢字分割部15は、日本語単語から他言語への翻訳辞書等を備えているものとする。
When a Japanese word composed of a plurality of kanji characters is translated into another language word that is greater than or equal to the number of kanji in the Japanese word, the
翻訳確率推定部16は、日本語単語と手話単語との間の翻訳確率を推定する。翻訳確率の推定には種々の公知技術を用いることができ、例えば、翻訳確率推定部16は、EMアルゴリズムにより翻訳確率を推定することができる。なお、ここで言う日本語単語とは、漢字分割部15により分割された各漢字(1つの漢字からなる日本語単語)を含むものである。
The translation
翻訳確率アライメント部17は、日本語単語と手話単語との間の翻訳確率に基づき日本語単語と手話単語との対応付けを行う。翻訳確率に基づく対応付けには、種々の公知技術を用いることができ、例えば、翻訳確率アライメント部17は、Greedyアルゴリズムにより単語の対応付けを行うことができる。なお、日本語単語は漢字分割部15により分割された各漢字を含むものであるため、翻訳確率アライメント部17は、各漢字と手話単語との間の翻訳確率に基づき各漢字と手話単語との対応付けを行うものである。
The translation
非手指動作検出部18は、日本語単語のうち、手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。特に、非手指動作検出部18は、手話単語と対応付けられていない日本語単語のうち、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。
The
対訳コーパス格納部21は、日本語文と、日本語文に対応する手話文とを含む対訳コーパスを格納する。また、対訳コーパス格納部21は、アライメント部Aによる日本語単語と手話単語との対応付け結果を適宜格納する。
The bilingual
翻訳確率格納部22は、翻訳確率推定部16が推定した日本語単語と手話単語との間の翻訳確率を格納する。
The translation probability storage unit 22 stores the translation probability between the Japanese word and the sign language word estimated by the translation
図2は、非手指動作検出装置の処理を示すフローチャートである。本フローチャートでは、下記の対訳コーパス1を例に、各機能部の処理を説明する。
[対訳コーパス1]
日本語文:大雪や強い雷雨に注意するよう呼びかけています
手話文 :{とても} {降雪} {雷} {雨} {注意} {宣伝} {中}
FIG. 2 is a flowchart illustrating processing of the non-finger movement detection device. In this flowchart, the processing of each functional unit will be described using the following parallel corpus 1 as an example.
[Bilingual Corpus 1]
Japanese sentence: Calling attention to heavy snow and heavy thunderstorms Sign language: {Very} {Snowfall} {Thunder} {Rain} {Caution} {Promotion} {Medium}
S1では、日本語文と手話文とを含む対訳コーパスが入力されると、形態素解析部11は、対訳コーパスの日本語文を形態素解析して単語に分割し、分割結果を対訳コーパス格納部21に格納する。例えば、対訳コーパス1は、形態素解析部11により下記の通り単語に分割される。
[対訳コーパス1(単語分割例)]
日本語文:大雪1/や2/強い3/雷雨4/に5/注意6/する7/よう8/呼びかけ9/て10/い11/ます12
手話文 :{とても}1 {降雪}2 {雷}3 {雨}4 {注意}5 {宣伝}6 {中}7
In S <b> 1, when a bilingual corpus including a Japanese sentence and a sign language sentence is input, the
[Bilingual Corpus 1 (word division example)]
Japanese statement: heavy snow 1 / and 2 / strong 3 / thunderstorm 4/5 / Note 6 / to 7/8 so / called 9 / Te 10 / have 11 / mass 12
Sign language: {Very} 1 {Snowfall} 2 {Thunder} 3 {Rain} 4 {Caution} 5 {Promotion} 6 {Medium} 7
S2では、単語プレアライメント部12は、S1で分割された日本語単語及び手話単語の中で表層的に一致するもの同士を発見し、文中距離計算部14により計算された文中距離が閾値以下である場合には、当該単語同士を対応付けてアライメント結果を対訳コーパス格納部21に格納する。例えば、対訳コーパス1(単語分割例)の日本語単語及び手話単語の中で、表層的に一致する単語は「注意6」と{注意}5である。
In S2, the word pre-alignment unit 12 discovers the Japanese words and sign language words divided in S1 that match in the surface layer, and the in-sentence distance calculated by the in-sentence
ここで、文中距離計算部14は、「注意6」と{注意}5との文中距離dist(注意6,{注意}5)を計算する。文中距離の閾値を0.3とすると、下記の通り、dist(注意6,{注意}5)は閾値0.3を下回る値となるため、単語プレアライメント部12は、「注意6」と{注意}5とを対応付けてアライメント結果を対訳コーパス格納部21に格納する。
dist(注意6,{注意}5) = |6/12 - 5/7|= 0.21 ≦ 0.3
Here, the in-sentence
dist (Note 6 , {Note} 5 ) = | 6/ 12-5/7 | = 0.21 ≤ 0.3
S3では、文字プレアライメント部13は、アライメントされていない日本語単語を対象に、日本語単語を構成する文字と手話単語とが表層的に一致するもの同士を発見し、文中距離計算部14により計算された値が閾値以下である場合には、当該単語同士をアライメントしてアライメント結果を対訳コーパス格納部21に格納する。例えば、S2でアライメントされなかった対訳コーパス1(単語分割例)の日本語単語の中で、日本語単語を構成する文字と手話単語とが表層的に一致するものは次の単語となる。
雷雨4の雷 = {雷}3
雷雨4の雨 = {雨}4
In S3, the character pre-alignment unit 13 finds the characters that make up the Japanese words and the sign language words in a superficial manner for unaligned Japanese words, and the in-sentence
Thunder 4 Thunderstorm = {Thunder} 3
Thunderstorm 4 rain = {rain} 4
ここで、文中距離計算部14は、「雷雨4」と{雷}3との文中距離dist(雷雨4,{雷}3)及び「雷雨4」と{雨}4との文中距離dist(雷雨4,{雨}4)を計算する。下記の通り、dist(雷雨4,{雷}3)及びdist(雷雨4,{雨}4)はいずれも閾値0.3を下回る値となるため、文字プレアライメント部13は、雷雨4の「雷」と{雷}3、雷雨4の「雨」と{雨}4とを対応付けてアライメント結果を対訳コーパス格納部21に格納する。
dist(雷雨4,{雷}3) = |4/12 - 3/7|= 0.10 ≦ 0.3
dist(雷雨4,{雨}4) = |4/12 - 4/7|= 0.24 ≦ 0.3
Here, the sentence
dist (Thunderstorm 4 , {thunder} 3 ) = | 4/12-3/7 | = 0.10 ≦ 0.3
dist (Thunderstorm 4 , {Rain} 4 ) = | 4/12-4/7 | = 0.24 ≤ 0.3
S4では、漢字分割部15は、アライメントされていない日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割し、分割後の各漢字を対訳コーパス格納部21に格納する。例えば、S2及びS3でアライメントされなかった対訳コーパス1(単語分割例)の日本語単語の中で、複数漢字で構成される単語は「大雪1」である。漢字分割部15は、例えば日英対訳辞書を参照すると、「大雪1」は「heavy snow」という2つの英単語に翻訳されるため、「大雪1」を「大」と「雪」の各漢字に分割し、分割結果を対訳コーパス格納部21に格納する。
In S4, when the Japanese word composed of a plurality of kanji characters is translated into other language words equal to or more than the number of kanji of the Japanese word among the unaligned Japanese words, the
S5では、翻訳確率推定部16は、アライメントされていない日本語単語及び手話単語のうち、文中距離が閾値以下である単語の組を対象に、翻訳確率を推定して翻訳確率格納部22に格納する。ここで、対訳コーパス1(単語分割例)の中で、S2〜S4でアライメントされていない日本語単語及び手話単語は以下の通りである。
[対訳コーパス(アライメントされていない単語)]
日本語文:大1/雪1/や2/強い3/に5/する7/よう8/呼びかけ9/て10/い11/ます12
手話文 :{とても}1 {降雪}2 {宣伝}6 {中}7
In S <b> 5, the translation
[Bilingual corpus (unaligned words)]
Japanese statement: large 1 / snow 1 / and 2 / strong 3/5 / to 7/8 so / called 9 / Te 10 / have 11 / mass 12
Sign language: {Very} 1 {Snowfall} 2 {Promotion} 6 {Medium} 7
まず、文中距離計算部14は、各日本語単語と各手話単語との文中距離を計算する。例えば、日本語単語である「大1」と各手話単語との文中距離は、下記のように計算できる。この結果、「大1」に対して、翻訳確率推定部16により翻訳確率を推定する対象となるのは、文中距離が閾値(0.3)以下となる{とても}1と{降雪}2である。
dist(大1,{とても}1) = |1/12 - 1/7|= 0.20 ≦ 0.3
dist(大1,{降雪}2) = |1/12 - 2/7|= 0.20 ≦ 0.3
dist(大1,{宣伝}6) = |1/12 - 6/7|= 0.77 > 0.3
dist(大1,{中}7) = |1/12 - 3/7|= 0.92 > 0.3
First, the sentence
dist (large 1 , {very} 1 ) = | 1 /12-1/7 | = 0.20 ≤ 0.3
dist (large 1 , {snowfall} 2 ) = | 1 /12-2/7 | = 0.20 ≤ 0.3
dist (large 1 , {advertisement} 6 ) = | 1/12-6/7 | = 0.77> 0.3
dist (large 1 , {medium} 7 ) = | 1/12-3/ 7 | = 0.92> 0.3
翻訳確率推定部16は、文中距離が閾値以下となる日本語単語と手話単語の組について、例えばEMアルゴリズムにより以下のような翻訳確率を推定し、推定した翻訳確率を翻訳確率格納部22に格納する。
大1:{とても}1(翻訳確率=0.54)
雪1:{降雪}2(翻訳確率=0.83)
呼びかけ9:{宣伝}6(翻訳確率=0.65)
い11:{中}7(翻訳確率=0.16)
The translation
Large 1 : {very} 1 (translation probability = 0.54)
Snow 1 : {Snowfall} 2 (Translation probability = 0.83)
Call 9 : {Promotion} 6 (Translation probability = 0.65)
11 : {Medium} 7 (Translation probability = 0.16)
S6では、翻訳確率アライメント部17は、S5で推定された翻訳確率を用いて、まだアライメントされていない単語のアライメントを行い、アライメント結果を対訳コーパス格納部21に格納する。翻訳確率アライメント部17は、例えば、ある閾値以上の翻訳確率のみを用いたgreedyアルゴリズムにより下記のようなアライメントを行い、アライメント結果を対訳コーパス格納部21に格納する。
大1 = {とても}1
雪1 = {降雪}2
強い3 = (アライメントなし)
に5 = (アライメントなし)
する7 = (アライメントなし)
呼びかけ9 = {宣伝}6
い11 = {中}7
ます12 = (アライメントなし)
In S6, the translation
Large 1 = {Very} 1
Snow 1 = {Snowfall} 2
Strong 3 = (no alignment)
5 = (no alignment)
7 = (No alignment)
Call 9 = {Promotion} 6
11 = {Medium} 7
12 = (No alignment)
非手指動作検出部18は、S2〜6のアライメント後もまだ手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。特に、非手指動作検出部18は、アライメントされていない日本語単語のうち、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。例えば、上記例では、アライメントなしと判定された日本語単語は「強い3」、「に5」、「する7」、「ます12」である。非手指動作検出部18は、このうち内容語である「強い3」を非手指動作の対象となる日本語単語として検出する。
The
S8では、非手指動作検出部18は、S7で検出した非手指動作の対象となる日本語単語を後段の手話表示装置等(図示せず)に出力する。なお、例えば、対訳コーパス1の場合、日本語文において「強い3」は「雷雨4」に係るものであり、このような係り受け情報はS1の形態素解析により取得することができる。そのため、非手指動作検出部18は、非手指動作の対象となる日本語単語に加え、係り受けの情報を併せて出力することにより、後段の手話表示装置等において、「強い」という非手指動作を「雷雨」の手指動作のタイミングで行わせることが可能となる。
In S8, the non-finger
このように、本実施形態によれば、アライメント部Aは日本語文に含まれる日本語単語と、手話文に含まれる手話単語とを対応付け、非手指動作検出部18は日本語単語のうち、手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。これにより、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出することが可能となる。
Thus, according to the present embodiment, the alignment unit A associates the Japanese words included in the Japanese sentence with the sign language words included in the sign language sentence, and the non-finger
また、アライメント部Aは、日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割し、各漢字と手話単語との間の翻訳確率に基づき各漢字と手話単語との対応付けを行うことができる。これにより、表層的に一致しない日本語単語と手話単語であっても、日本語単語を構成する漢字と手話単語との意味が近い場合には、当該単語同士を対応づけることが可能となる。このため、対訳コーパス中の単語同士の対応精度を向上させることができ、結果的にアライメントされない単語が減少するため、より精度よく非手指動作すべき単語を検出することが可能となる。 The alignment unit A also includes a Japanese word composed of a plurality of kanji characters when a Japanese word composed of a plurality of kanji characters is translated into another language word equal to or more than the number of kanji in the Japanese word. Can be divided into each Chinese character, and each Chinese character can be associated with the sign language word based on the translation probability between each Chinese character and the sign language word. As a result, even if a Japanese word and a sign language word that do not coincide with each other on the surface layer, if the meanings of the kanji and the sign language word constituting the Japanese word are similar, the words can be associated with each other. For this reason, the correspondence accuracy between the words in the bilingual corpus can be improved, and as a result, the number of unaligned words is reduced, so that it is possible to detect a word that should be non-finger-operated more accurately.
また、アライメント部Aは、手話単語と対応付けられていない日本語単語のうち、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。これにより、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作により表現することが可能となる。 In addition, the alignment unit A detects a content word representing a lexical meaning among Japanese words that are not associated with a sign language word as a Japanese word that is a target of non-hand movement. This makes it possible to express content words that mainly represent lexical meaning, such as nouns, verbs, and adjectives, by non-finger movements.
なお、上述した非手指動作検出装置として機能させるためにコンピュータを用いることができ、そのようなコンピュータは、非手指動作検出装置の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。 Note that a computer can be used to function as the above-described non-finger movement detection device, and such a computer stores a program describing processing contents for realizing each function of the non-finger movement detection device. This program can be realized by reading out and executing this program by the CPU of the computer. This program can be recorded on a computer-readable recording medium.
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。 Although the present invention has been described based on the drawings and examples, it should be noted that those skilled in the art can easily make various modifications and corrections based on the present disclosure. Therefore, it should be noted that these variations and modifications are included in the scope of the present invention. For example, the functions included in each functional unit, each step, etc. can be rearranged so as not to be logically contradictory, and a plurality of means and steps can be combined into one or divided. is there.
10 制御部
11 形態素解析部
12 単語プレアライメント部
13 文字プレアライメント部
14 文中距離計算部
15 漢字分割部
16 翻訳確率推定部
17 翻訳確率アライメント部
18 非手指動作検出部
A アライメント部
20 格納部
21 対訳コーパス格納部
22 翻訳確率格納部
DESCRIPTION OF
Claims (3)
前記日本語文に含まれる前記日本語単語と、前記手話文に含まれる前記手話単語とを対応付けるアライメント部であって、前記日本語単語と前記手話単語との間の文字又は文字列の一致と、前記日本語単語と前記手話単語の文中距離に基づいて、前記日本語単語と前記手話単語とを対応付けることを含む、前記アライメント部と、
前記日本語単語のうち、前記手話単語と対応付けられていない日本語単語から、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する非手指動作検出部と、を備える非手指動作検出装置。 A storage unit for storing a bilingual corpus including a Japanese sentence and a sign language sentence corresponding to the Japanese sentence, the Japanese sentence is divided into Japanese words, stored in association with a number indicating a word order, and The storage unit that divides a sign language sentence into sign language words corresponding to finger movements and stores them in association with numbers indicating word orders ;
Said Japanese words contained in the Japanese sentence, said a alignment unit for associating the said sign language words included in the sign language sentence, match character or string between the sign language words and the Japanese word, The alignment unit includes associating the Japanese word with the sign language word based on a sentence distance between the Japanese word and the sign language word ;
A non-finger movement detector for detecting a content word representing a lexical meaning as a Japanese word to be subjected to a non-finger movement from a Japanese word that is not associated with the sign language word among the Japanese words ; A non-finger movement detection device provided.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014040707A JP6306899B2 (en) | 2014-03-03 | 2014-03-03 | Non-finger movement detection device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014040707A JP6306899B2 (en) | 2014-03-03 | 2014-03-03 | Non-finger movement detection device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015166902A JP2015166902A (en) | 2015-09-24 |
JP6306899B2 true JP6306899B2 (en) | 2018-04-04 |
Family
ID=54257752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014040707A Expired - Fee Related JP6306899B2 (en) | 2014-03-03 | 2014-03-03 | Non-finger movement detection device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6306899B2 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3623394B2 (en) * | 1999-03-30 | 2005-02-23 | 株式会社日立製作所 | Sign language recognition device and recording medium on which program for realizing the device is recorded |
JP4198737B2 (en) * | 2007-08-20 | 2008-12-17 | 株式会社東芝 | Machine translation program, machine translation device |
JP2014021180A (en) * | 2012-07-13 | 2014-02-03 | Nippon Hoso Kyokai <Nhk> | Sign language translation device and sign language translation program |
-
2014
- 2014-03-03 JP JP2014040707A patent/JP6306899B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2015166902A (en) | 2015-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10372821B2 (en) | Identification of reading order text segments with a probabilistic language model | |
Kim et al. | Two-stage multi-intent detection for spoken language understanding | |
CN107729313B (en) | Deep neural network-based polyphone pronunciation distinguishing method and device | |
Zhang et al. | Chinese segmentation with a word-based perceptron algorithm | |
JP5599662B2 (en) | System and method for converting kanji into native language pronunciation sequence using statistical methods | |
US8140332B2 (en) | Technique for searching out new words that should be registered in dictionary for speech processing | |
JP5389273B1 (en) | Context analysis device and context analysis method | |
WO2017177809A1 (en) | Word segmentation method and system for language text | |
CN105068997B (en) | The construction method and device of parallel corpora | |
US20110144992A1 (en) | Unsupervised learning using global features, including for log-linear model word segmentation | |
US10452785B2 (en) | Translation assistance system, translation assistance method and translation assistance program | |
Zitouni et al. | Arabic diacritic restoration approach based on maximum entropy models | |
JP5809381B1 (en) | Natural language processing system, natural language processing method, and natural language processing program | |
CN111079432A (en) | Text detection method and device, electronic equipment and storage medium | |
US9575957B2 (en) | Recognizing chemical names in a chinese document | |
US20230103728A1 (en) | Method for sample augmentation | |
Shu et al. | Word segmentation in Chinese language processing | |
Nehar et al. | Rational kernels for Arabic root extraction and text classification | |
WO2014189400A1 (en) | A method for diacritisation of texts written in latin- or cyrillic-derived alphabets | |
CN113657098A (en) | Text error correction method, device, equipment and storage medium | |
Mori et al. | Language Resource Addition: Dictionary or Corpus? | |
JP2011008784A (en) | System and method for automatically recommending japanese word by using roman alphabet conversion | |
JP6306899B2 (en) | Non-finger movement detection device and program | |
KR20120045906A (en) | Apparatus and method for correcting error of corpus | |
KR102355731B1 (en) | Analysis program, analysis method, and analysis device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20171128 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20180105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180126 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6306899 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |