JP2015166902A - 非手指動作検出装置及びプログラム - Google Patents

非手指動作検出装置及びプログラム Download PDF

Info

Publication number
JP2015166902A
JP2015166902A JP2014040707A JP2014040707A JP2015166902A JP 2015166902 A JP2015166902 A JP 2015166902A JP 2014040707 A JP2014040707 A JP 2014040707A JP 2014040707 A JP2014040707 A JP 2014040707A JP 2015166902 A JP2015166902 A JP 2015166902A
Authority
JP
Japan
Prior art keywords
japanese
word
sign language
words
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014040707A
Other languages
English (en)
Other versions
JP6306899B2 (ja
Inventor
加藤 直人
Naoto Kato
直人 加藤
太郎 宮▲崎▼
Taro Miyazaki
太郎 宮▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2014040707A priority Critical patent/JP6306899B2/ja
Publication of JP2015166902A publication Critical patent/JP2015166902A/ja
Application granted granted Critical
Publication of JP6306899B2 publication Critical patent/JP6306899B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Abstract

【課題】日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出する。
【解決手段】本発明に係る非手指動作検出装置は、日本語文と、前記日本語文に対応する手話文とを含む対訳コーパスを格納する格納部と、前記日本語文に含まれる日本語単語と、前記手話文に含まれる手話単語とを対応付けるアライメント部と、前記日本語単語のうち、前記手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する非手指動作検出部と、を備える。
【選択図】図1

Description

この発明は、非手指動作検出装置及びプログラムに関する。
手話サービスの拡充をめざし、日本語から手話への自動翻訳の研究が進められている。手話では、手や指の動きなどの手指動作とともに、顔の表情や頭部の動きなどの非手指動作によって言語的情報を表出している。テキストから手話への翻訳は、日本語文と手話文との対訳コーパスに基づいて行われる。一般に、手話文で表記されるのは主に手指動作であり、非手指動作は一部のみしか書き起こされていない。これは、手指動作は単語の同定をしやすいが、非手指動作は難しいからである。非手指動作は言語的役割や音声言語のプロソディの役割もあり、その区別をつけて書き起こすことは人間でも容易ではない。
従来、非手指動作を検出する技術としては、顔認識技術を使って顔の表情を自動認識し、その箇所を非手指動作として検出する技術がある(例えば、特許文献1〜3)。
特開2014−021896号公報 特開2014−021846号公報 特開2011−150381号公報
社会福祉法人全国手話研修センター日本手話研究所編、「新 日本語−手話辞典」、財団法人全日本聾唖連盟、2011年6月10日
しかしながら、手話では顔表情が音声言語のプロソディの役割も持っており、非手指動作以外でも顔表情が表出されることがある。したがって、顔表情があっても必ずしも言語的な意味を持つものではなく、正しく非手指動作が検出されない場合がある。
したがって、かかる点に鑑みてなされた本発明の目的は、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出する非手指動作検出装置及びプログラムを提供することである。
上述した諸課題を解決すべく、本発明に係る非手指動作検出装置は、日本語文と、前記日本語文に対応する手話文とを含む対訳コーパスを格納する格納部と、前記日本語文に含まれる日本語単語と、前記手話文に含まれる手話単語とを対応付けるアライメント部と、前記日本語単語のうち、前記手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する非手指動作検出部と、を備える。
また、前記アライメント部は、前記日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、前記複数漢字から構成される日本語単語を各漢字に分割し、前記各漢字と前記手話単語との間の翻訳確率に基づき前記各漢字と前記手話単語との対応付けを行う、ことが好ましい。
また、前記アライメント部は、前記手話単語と対応付けられていない日本語単語のうち、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する、ことが好ましい。
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記非手指動作検出装置として機能させるものである。
本発明に係る非手指動作検出装置及びプログラムによれば、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出することが可能になる。
本発明の一実施形態に係る非手指動作検出装置の概略構成を示す図である。 非手指動作検出装置の処理を示すフローチャートである。
以降、諸図面を参照しながら、本発明の実施態様を詳細に説明する。ここで、手話には確立された表記法はないが、本稿においては、一般的に用いられる表記法である日本語ラベルを用いるものとする(非特許文献1参照)。日本語ラベルでは、手話単語は“{雨}”のように、手話単語と意味的に近い日本語の単語を括弧“{}”で括ることによって記述される。日本語ラベルは単語ごとの書き起こしであるので、機械翻訳で扱いやすいという利点がある。日本語文と手話文(日本語ラベル)との対訳コーパスの一例は、下記の通り表わされる。
[対訳コーパス]
日本語文:大雪や強い雷雨に注意するよう呼びかけています
手話文 :{とても} {降雪} {雷} {雨} {注意} {宣伝} {中}
図1は、本発明の一実施形態に係る非手指動作検出装置の概略構成を示す図である。非手指動作検出装置は、形態素解析部11、単語プレアライメント部12、文字プレアライメント部13、文中距離計算部14、漢字分割部15、翻訳確率推定部16、翻訳確率アライメント部17、及び非手指動作検出部18を有する制御部10と、対訳コーパス格納部21及び翻訳確率格納部22を有する格納部20とを備える。制御部10において、単語プレアライメント部12、文字プレアライメント部13、文中距離計算部14、漢字分割部15、翻訳確率推定部16、翻訳確率アライメント部17は、アライメント部Aを構成する。制御部10の各処理部11〜18は好適なプロセッサにより構成され、各処理部11〜18を共通のプロセッサで実装したり、個別のプロセッサとして実装したりすることができる。格納部20は好適な記憶装置であって、非手指動作検出装置に内蔵されるものだけではなく、通信インタフェースを介した外部記憶装置を用いてもよい。
形態素解析部11は、対訳コーパス中の日本語文を形態素解析して単語に分割する。また、形態素解析部11は、対訳コーパス中の手話文が日本語ラベルのように単語ごとに分かれていない場合、手話文を形態素解析して単語に分割することができる。これ以降、日本語文中の各単語を日本語単語、手話文中の各単語を手話単語と適宜称するものとする。
アライメント部Aは、日本語文に含まれる日本語単語と、手話文に含まれる手話単語とを対応付ける(アライメントする)ものである。
単語プレアライメント部12は、日本語単語と手話単語との間で表層的に一致するもの同士を対応付ける。すなわち、単語プレアライメント部12は、文字(文字列)が完全に一致する日本語単語と手話単語とを対応付けるものである。
文字プレアライメント部13は、日本語単語を構成する文字と手話単語との間で表層的に一致するもの同士を対応付ける。すなわち、文字プレアライメント部13は、日本語単語と、当該日本語単語を構成する文字と同じ手話単語とを対応付けるものである。
文中距離計算部14は、ある日本語単語が日本語文中で出現する位置と、ある手話単語が手話文中で出現する位置との近さ(文中距離)を計算する。一般的に日本語文と手話文との語順は似ているため、ある日本語単語とある手話単語との文中距離が近い場合、当該単語同士が対応する可能性も高くなる。また、ある日本語単語とある手話単語との文中距離が離れている場合、当該単語同士が対応する可能性は低くなる。そのため、文中距離が所定の閾値を超える単語同士については、アライメントの対象から除外することが可能となる。文中距離計算部14が計算する文中距離dist(jp,sq)は、式(1)のように定義される。ここで、NJは日本語文中の日本語単語数、jpはp番目の日本語単語、NSは手話文中の手話単語数、sqはq番目の手話単語である。
dist(jp,sq) = |p/NJ - q/NS| (1)
漢字分割部15は、日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割する。ここで、他言語とは、例えば英語であって、漢字分割部15は、2文字の漢字から構成される日本語単語が2つ以上の英単語に翻訳される場合、当該日本語単語を各漢字に分割する。日本語単語の他言語への翻訳には種々の公知技術を用いることができ、例えば、漢字分割部15は、日本語単語から他言語への翻訳辞書等を備えているものとする。
翻訳確率推定部16は、日本語単語と手話単語との間の翻訳確率を推定する。翻訳確率の推定には種々の公知技術を用いることができ、例えば、翻訳確率推定部16は、EMアルゴリズムにより翻訳確率を推定することができる。なお、ここで言う日本語単語とは、漢字分割部15により分割された各漢字(1つの漢字からなる日本語単語)を含むものである。
翻訳確率アライメント部17は、日本語単語と手話単語との間の翻訳確率に基づき日本語単語と手話単語との対応付けを行う。翻訳確率に基づく対応付けには、種々の公知技術を用いることができ、例えば、翻訳確率アライメント部17は、Greedyアルゴリズムにより単語の対応付けを行うことができる。なお、日本語単語は漢字分割部15により分割された各漢字を含むものであるため、翻訳確率アライメント部17は、各漢字と手話単語との間の翻訳確率に基づき各漢字と手話単語との対応付けを行うものである。
非手指動作検出部18は、日本語単語のうち、手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。特に、非手指動作検出部18は、手話単語と対応付けられていない日本語単語のうち、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。
対訳コーパス格納部21は、日本語文と、日本語文に対応する手話文とを含む対訳コーパスを格納する。また、対訳コーパス格納部21は、アライメント部Aによる日本語単語と手話単語との対応付け結果を適宜格納する。
翻訳確率格納部22は、翻訳確率推定部16が推定した日本語単語と手話単語との間の翻訳確率を格納する。
図2は、非手指動作検出装置の処理を示すフローチャートである。本フローチャートでは、下記の対訳コーパス1を例に、各機能部の処理を説明する。
[対訳コーパス1]
日本語文:大雪や強い雷雨に注意するよう呼びかけています
手話文 :{とても} {降雪} {雷} {雨} {注意} {宣伝} {中}
S1では、日本語文と手話文とを含む対訳コーパスが入力されると、形態素解析部11は、対訳コーパスの日本語文を形態素解析して単語に分割し、分割結果を対訳コーパス格納部21に格納する。例えば、対訳コーパス1は、形態素解析部11により下記の通り単語に分割される。
[対訳コーパス1(単語分割例)]
日本語文:大雪1/や2/強い3/雷雨4/に5/注意6/する7/よう8/呼びかけ9/て10/い11/ます12
手話文 :{とても}1 {降雪}2 {雷}3 {雨}4 {注意}5 {宣伝}6 {中}7
S2では、単語プレアライメント部12は、S1で分割された日本語単語及び手話単語の中で表層的に一致するもの同士を発見し、文中距離計算部14により計算された文中距離が閾値以下である場合には、当該単語同士を対応付けてアライメント結果を対訳コーパス格納部21に格納する。例えば、対訳コーパス1(単語分割例)の日本語単語及び手話単語の中で、表層的に一致する単語は「注意6」と{注意}5である。
ここで、文中距離計算部14は、「注意6」と{注意}5との文中距離dist(注意6,{注意}5)を計算する。文中距離の閾値を0.3とすると、下記の通り、dist(注意6,{注意}5)は閾値0.3を下回る値となるため、単語プレアライメント部12は、「注意6」と{注意}5とを対応付けてアライメント結果を対訳コーパス格納部21に格納する。
dist(注意6,{注意}5) = |6/12 - 5/7|= 0.21 ≦ 0.3
S3では、文字プレアライメント部13は、アライメントされていない日本語単語を対象に、日本語単語を構成する文字と手話単語とが表層的に一致するもの同士を発見し、文中距離計算部14により計算された値が閾値以下である場合には、当該単語同士をアライメントしてアライメント結果を対訳コーパス格納部21に格納する。例えば、S2でアライメントされなかった対訳コーパス1(単語分割例)の日本語単語の中で、日本語単語を構成する文字と手話単語とが表層的に一致するものは次の単語となる。
雷雨4の雷 = {雷}3
雷雨4の雨 = {雨}4
ここで、文中距離計算部14は、「雷雨4」と{雷}3との文中距離dist(雷雨4,{雷}3)及び「雷雨4」と{雨}4との文中距離dist(雷雨4,{雨}4)を計算する。下記の通り、dist(雷雨4,{雷}3)及びdist(雷雨4,{雨}4)はいずれも閾値0.3を下回る値となるため、文字プレアライメント部13は、雷雨4の「雷」と{雷}3、雷雨4の「雨」と{雨}4とを対応付けてアライメント結果を対訳コーパス格納部21に格納する。
dist(雷雨4,{雷}3) = |4/12 - 3/7|= 0.10 ≦ 0.3
dist(雷雨4,{雨}4) = |4/12 - 4/7|= 0.24 ≦ 0.3
S4では、漢字分割部15は、アライメントされていない日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割し、分割後の各漢字を対訳コーパス格納部21に格納する。例えば、S2及びS3でアライメントされなかった対訳コーパス1(単語分割例)の日本語単語の中で、複数漢字で構成される単語は「大雪1」である。漢字分割部15は、例えば日英対訳辞書を参照すると、「大雪1」は「heavy snow」という2つの英単語に翻訳されるため、「大雪1」を「大」と「雪」の各漢字に分割し、分割結果を対訳コーパス格納部21に格納する。
S5では、翻訳確率推定部16は、アライメントされていない日本語単語及び手話単語のうち、文中距離が閾値以下である単語の組を対象に、翻訳確率を推定して翻訳確率格納部22に格納する。ここで、対訳コーパス1(単語分割例)の中で、S2〜S4でアライメントされていない日本語単語及び手話単語は以下の通りである。
[対訳コーパス(アライメントされていない単語)]
日本語文:大1/雪1/や2/強い3/に5/する7/よう8/呼びかけ9/て10/い11/ます12
手話文 :{とても}1 {降雪}2 {宣伝}6 {中}7
まず、文中距離計算部14は、各日本語単語と各手話単語との文中距離を計算する。例えば、日本語単語である「大1」と各手話単語との文中距離は、下記のように計算できる。この結果、「大1」に対して、翻訳確率推定部16により翻訳確率を推定する対象となるのは、文中距離が閾値(0.3)以下となる{とても}1と{降雪}2である。
dist(大1,{とても}1) = |1/12 - 1/7|= 0.20 ≦ 0.3
dist(大1,{降雪}2) = |1/12 - 2/7|= 0.20 ≦ 0.3
dist(大1,{宣伝}6) = |1/12 - 6/7|= 0.77 > 0.3
dist(大1,{中}7) = |1/12 - 3/7|= 0.92 > 0.3
翻訳確率推定部16は、文中距離が閾値以下となる日本語単語と手話単語の組について、例えばEMアルゴリズムにより以下のような翻訳確率を推定し、推定した翻訳確率を翻訳確率格納部22に格納する。
1:{とても}1(翻訳確率=0.54)
1:{降雪}2(翻訳確率=0.83)
呼びかけ9:{宣伝}6(翻訳確率=0.65)
11:{中}7(翻訳確率=0.16)
S6では、翻訳確率アライメント部17は、S5で推定された翻訳確率を用いて、まだアライメントされていない単語のアライメントを行い、アライメント結果を対訳コーパス格納部21に格納する。翻訳確率アライメント部17は、例えば、ある閾値以上の翻訳確率のみを用いたgreedyアルゴリズムにより下記のようなアライメントを行い、アライメント結果を対訳コーパス格納部21に格納する。
1 = {とても}1
1 = {降雪}2
強い3 = (アライメントなし)
5 = (アライメントなし)
する7 = (アライメントなし)
呼びかけ9 = {宣伝}6
11 = {中}7
ます12 = (アライメントなし)
非手指動作検出部18は、S2〜6のアライメント後もまだ手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。特に、非手指動作検出部18は、アライメントされていない日本語単語のうち、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。例えば、上記例では、アライメントなしと判定された日本語単語は「強い3」、「に5」、「する7」、「ます12」である。非手指動作検出部18は、このうち内容語である「強い3」を非手指動作の対象となる日本語単語として検出する。
S8では、非手指動作検出部18は、S7で検出した非手指動作の対象となる日本語単語を後段の手話表示装置等(図示せず)に出力する。なお、例えば、対訳コーパス1の場合、日本語文において「強い3」は「雷雨4」に係るものであり、このような係り受け情報はS1の形態素解析により取得することができる。そのため、非手指動作検出部18は、非手指動作の対象となる日本語単語に加え、係り受けの情報を併せて出力することにより、後段の手話表示装置等において、「強い」という非手指動作を「雷雨」の手指動作のタイミングで行わせることが可能となる。
このように、本実施形態によれば、アライメント部Aは日本語文に含まれる日本語単語と、手話文に含まれる手話単語とを対応付け、非手指動作検出部18は日本語単語のうち、手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する。これにより、日本語文と手話文との対訳コーパスに基づき非手指動作すべき単語を検出することが可能となる。
また、アライメント部Aは、日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、複数漢字から構成される日本語単語を各漢字に分割し、各漢字と手話単語との間の翻訳確率に基づき各漢字と手話単語との対応付けを行うことができる。これにより、表層的に一致しない日本語単語と手話単語であっても、日本語単語を構成する漢字と手話単語との意味が近い場合には、当該単語同士を対応づけることが可能となる。このため、対訳コーパス中の単語同士の対応精度を向上させることができ、結果的にアライメントされない単語が減少するため、より精度よく非手指動作すべき単語を検出することが可能となる。
また、アライメント部Aは、手話単語と対応付けられていない日本語単語のうち、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する。これにより、名詞、動詞、形容詞など、主として語彙的意味を表す内容語を非手指動作により表現することが可能となる。
なお、上述した非手指動作検出装置として機能させるためにコンピュータを用いることができ、そのようなコンピュータは、非手指動作検出装置の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録することができる。
本発明を諸図面や実施例に基づき説明してきたが、当業者であれば本開示に基づき種々の変形や修正を行うことが容易であることに注意されたい。従って、これらの変形や修正は本発明の範囲に含まれることに留意されたい。例えば、各機能部、各ステップなどに含まれる機能などは論理的に矛盾しないように再配置可能であり、複数の手段やステップなどを1つに組み合わせたり、或いは分割したりすることが可能である。
10 制御部
11 形態素解析部
12 単語プレアライメント部
13 文字プレアライメント部
14 文中距離計算部
15 漢字分割部
16 翻訳確率推定部
17 翻訳確率アライメント部
18 非手指動作検出部
A アライメント部
20 格納部
21 対訳コーパス格納部
22 翻訳確率格納部

Claims (4)

  1. 日本語文と、前記日本語文に対応する手話文とを含む対訳コーパスを格納する格納部と、
    前記日本語文に含まれる日本語単語と、前記手話文に含まれる手話単語とを対応付けるアライメント部と、
    前記日本語単語のうち、前記手話単語と対応付けられていない日本語単語から、非手指動作を行う日本語単語を検出する非手指動作検出部と、を備える非手指動作検出装置。
  2. 前記アライメント部は、前記日本語単語のうち、複数漢字から構成される日本語単語が当該日本語単語の漢字数以上の他言語単語に翻訳される場合、前記複数漢字から構成される日本語単語を各漢字に分割し、前記各漢字と前記手話単語との間の翻訳確率に基づき前記各漢字と前記手話単語との対応付けを行う、請求項1に記載の非手指動作検出装置。
  3. 前記アライメント部は、前記手話単語と対応付けられていない日本語単語のうち、語彙的意味を表す内容語を非手指動作の対象となる日本語単語として検出する、請求項1又は2に記載の非手指動作検出装置。
  4. コンピュータを、請求項1乃至3のいずれか一項に記載の非手指動作検出装置として機能させるためのプログラム。
JP2014040707A 2014-03-03 2014-03-03 非手指動作検出装置及びプログラム Expired - Fee Related JP6306899B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014040707A JP6306899B2 (ja) 2014-03-03 2014-03-03 非手指動作検出装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014040707A JP6306899B2 (ja) 2014-03-03 2014-03-03 非手指動作検出装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2015166902A true JP2015166902A (ja) 2015-09-24
JP6306899B2 JP6306899B2 (ja) 2018-04-04

Family

ID=54257752

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014040707A Expired - Fee Related JP6306899B2 (ja) 2014-03-03 2014-03-03 非手指動作検出装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6306899B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284682A (ja) * 1999-03-30 2000-10-13 Hitachi Ltd 手話認識方法および装置
JP2008027458A (ja) * 2007-08-20 2008-02-07 Toshiba Corp 機械翻訳プログラム、機械翻訳装置
JP2014021180A (ja) * 2012-07-13 2014-02-03 Nippon Hoso Kyokai <Nhk> 手話翻訳装置及び手話翻訳プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000284682A (ja) * 1999-03-30 2000-10-13 Hitachi Ltd 手話認識方法および装置
JP2008027458A (ja) * 2007-08-20 2008-02-07 Toshiba Corp 機械翻訳プログラム、機械翻訳装置
JP2014021180A (ja) * 2012-07-13 2014-02-03 Nippon Hoso Kyokai <Nhk> 手話翻訳装置及び手話翻訳プログラム

Also Published As

Publication number Publication date
JP6306899B2 (ja) 2018-04-04

Similar Documents

Publication Publication Date Title
US11501066B2 (en) System and method for unsupervised text normalization using distributed representation of words
US10372821B2 (en) Identification of reading order text segments with a probabilistic language model
Kim et al. Two-stage multi-intent detection for spoken language understanding
US10997964B2 (en) System and method for text normalization using atomic tokens
CN107729313B (zh) 基于深度神经网络的多音字读音的判别方法和装置
JP5901001B1 (ja) 音響言語モデルトレーニングのための方法およびデバイス
US8140332B2 (en) Technique for searching out new words that should be registered in dictionary for speech processing
US20160306783A1 (en) Method and apparatus for phonetically annotating text
JP5389273B1 (ja) 文脈解析装置および文脈解析方法
WO2017177809A1 (zh) 语言文本的分词方法和系统
JP5809381B1 (ja) 自然言語処理システム、自然言語処理方法、および自然言語処理プログラム
Zitouni et al. Arabic diacritic restoration approach based on maximum entropy models
CN105210055A (zh) 根据跨语种短语表的断词器
CN104182381A (zh) 文字输入用方法和系统
CN111079432A (zh) 文本检测方法、装置、电子设备及存储介质
US20230103728A1 (en) Method for sample augmentation
Shu et al. Word segmentation in Chinese language processing
CN113657098A (zh) 文本纠错方法、装置、设备及存储介质
Nehar et al. Rational kernels for Arabic root extraction and text classification
WO2014189400A1 (en) A method for diacritisation of texts written in latin- or cyrillic-derived alphabets
JP2011008784A (ja) ローマ字変換を用いる日本語自動推薦システムおよび方法
JP2015045689A (ja) 音声認識システムについての音声認識結果を評価する方法、並びに、そのコンピュータ及びコンピュータ・プログラム
JP6306899B2 (ja) 非手指動作検出装置及びプログラム
KR20120045906A (ko) 코퍼스 오류 교정 장치 및 그 방법
KR102552811B1 (ko) 클라우드 기반 문법 교정 서비스 제공 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170130

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20171120

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171128

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180126

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180309

R150 Certificate of patent or registration of utility model

Ref document number: 6306899

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees