JP2010067250A - 中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体 - Google Patents

中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体 Download PDF

Info

Publication number
JP2010067250A
JP2010067250A JP2008304955A JP2008304955A JP2010067250A JP 2010067250 A JP2010067250 A JP 2010067250A JP 2008304955 A JP2008304955 A JP 2008304955A JP 2008304955 A JP2008304955 A JP 2008304955A JP 2010067250 A JP2010067250 A JP 2010067250A
Authority
JP
Japan
Prior art keywords
character string
sentence
chinese
error
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008304955A
Other languages
English (en)
Other versions
JP4796118B2 (ja
Inventor
Tsun Ku
▲じゅん▼ 谷
Shih-Hung Wu
世弘 呉
Wen-Nan Wang
文男 王
Wen-Tai Hsieh
文泰 謝
Ta-Hung Hung
大弘 洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute for Information Industry
Original Assignee
Institute for Information Industry
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute for Information Industry filed Critical Institute for Information Industry
Publication of JP2010067250A publication Critical patent/JP2010067250A/ja
Application granted granted Critical
Publication of JP4796118B2 publication Critical patent/JP4796118B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/232Orthographic correction, e.g. spell checking or vowelisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Abstract

【課題】中国語文章誤り検出装置を提供する。
【解決手段】本発明の装置は、第1の誤り文字列を第1の文字の組に切り分ける文章切り分けモジュール、複数の第1の正しい文字列及び複数の第1のインデックスを有するデータベース、第1の文字の組に対応する第1のインデックスを得ると共に対応する第1の正しい文字列を得る候補語生成モジュール、最適候補センテンスを生成する候補センテンス生成及び得点付けモジュール、中国語文字と最適候補センテンスを表示する表示装置を有する。なお、第1の文字の組は第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなり、第1のインデックスは第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる。
【選択図】 図1

Description

本発明は、中国語文章誤り検出装置に関し、特にバイグラム(bi-gram)切り分けメカニズムの中国語文章誤り検出装置に関する。
コンピュータの使用がますます普及してきている昨今では、文書の作成もコンピュータに頼ることが多くなっている。中国語は、同音の文字が多く、また、同じパーツを持つ似通った文字も多い。このため、中国語の文字は煩瑣かつ複雑となっており、文書作成者は文章中に誤った文字を使い易い。
よって、中国語が煩瑣であることによって起こる誤記の問題を解決できるような中国語文章の誤りを検出可能なシステムおよび方法が必要である。
上述に鑑みて、本発明の目的は中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体を提供することにある。
本発明は、第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用される中国語文章誤り検出装置を開示する。該装置は、文章切り分けモジュール、データベース、候補語生成モジュール、候補センテンス生成および得点付けモジュール、ならびに表示装置を含む。文章切り分けモジュールは、第1の誤り文字列を複数の第1の文字の組に切り分ける。第1の文字の組は、第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる。データベースは、複数の第1の正しい文字列および第1の正しい文字列に対応する複数の第1のインデックスを有する。第1のインデックスは、第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる。候補語生成モジュールは、第1の文字の組に対応する第1のインデックスを得ると共に、得られた第1のインデックスに基づいて対応する第1の正しい文字列を得る。候補センテンス生成および得点付けモジュールは、得られた第1の正しい文字列に基づいて最適候補センテンスを生成する。表示装置は中国語文字列および上記最適候補センテンスを表示する。
また、本発明は、第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用される中国語文章誤り検出方法を提供する。該方法は次の工程を含む。第1の誤り文字列を複数の第1の文字の組に切り分ける。第1の文字の組は、第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる。複数の第1の正しい文字列、および第1の正しい文字列に対応する複数の第1のインデックスを有するデータベースを提供する。第1のインデックスは、第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる。第1の文字の組に基づいて第1の文字の組に対応する第1のインデックスを得ると共に、得られた第1のインデックスに基づいて対応する第1の正しい文字列を得る。得られた第1の正しい文字列に基づいて最適候補センテンスを生成する。最後に表示装置に中国語文字列および最適候補センテンスを表示する。
また本発明は、コンピュータシステムにロードされてコンピュータシステムに中国語文章誤り検出方法を実行させる複数のプログラムコードを含む中国語文章誤り検出プログラムを格納した記録媒体をも開示する。該中国語文章誤り検出方法は、第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用され、次の工程を含む。第1の誤り文字列を複数の第1の文字の組に切り分ける。第1の文字の組は、第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる。複数の第1の正しい文字列、および第1の正しい文字列に対応する複数の第1のインデックスを格納する。第1のインデックスは、第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる。第1の文字の組に基づいて第1の文字の組に対応する第1のインデックスを得ると共に、得られた第1のインデックスに基づいて対応する第1の正しい文字列を得る。得られた第1の正しい文字列に基づいて最適候補センテンスを生成する。最後に中国語文字列および最適候補センテンスを表示する。
本発明によれば、中国語が煩瑣であることに起因する誤記の問題を解決できる中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体を提供できる。
上述した本発明の目的、特徴および長所がより明りょうに理解されるよう、以下に好ましい実施形態を挙げ、添付の図面に対応させながら、本発明をより詳細に説明する。
図1は、本発明による中国語文章誤り検出装置100の実施形態を示している。中国語文章誤り検出装置100は、文章受信モジュール110、文章切り分けモジュール120、正用データベース130、誤用データベース140、候補語生成モジュール150、候補センテンス生成および得点付けモジュール160、類似文字データベース170、同音文字データベース180、言語モデルデータベース190、文章表示モジュール200、ならびに表示装置210を含む。
文章受信モジュール110は中国語文章Artを受け取ってから中国語文章Artを文章切り分けモジュール120へ伝送し、文章切り分けモジュール120が文章の切り分けを実行する。
正用データベース130は、成語、俗語、固有名詞、詩(これらは例示に過ぎない)の正しい表記を格納するものであり、かつ複数の第1の正しい文字列および第1の正しい文字列に対応する複数の第1のインデックスを有している。
誤用データベース140は、よく見られる語句の誤りとその正しい表記を格納するものであり、かつ複数の第2のインデックスおよび第2のインデックスと対応する複数の第2の正しい文字列を有している。
候補語生成モジュール150は、第1の正しい文字列を得ると共に第1の正しい文字列を第1の候補語として設定し、かつ第2の正しい文字列を得ると共に第2の正しい文字列を第2の候補語として設定する。
候補センテンス生成および得点付けモジュール160は、第1の候補語と第2の候補語に基づいて複数の候補センテンスを生成し、かつ候補センテンス得点付けメカニズムを用い、類似文字データベース170、同音文字データベース180および言語モデルデータベース190のデータに基づいて候補センテンスを得点付けすることにより最適候補センテンスを生成する。
文章表示モジュール200は、中国語文章Artおよび最適候補センテンスを表示装置210上に表示する。
以上は中国語文章誤り検出装置100の簡単な紹介である。そのすべての構成要素の動作の流れを以下詳細に説明する。
図2は、本発明による中国語文章誤り検出装置100の動作流れ図を示している。
工程S100において、文章受信モジュール110が中国語文章Artを受け取る。
工程S110において、文章切り分けモジュール120が文章Artの切り分けを実行する。文章切り分けモジュール120は先ず文章Artを句読点に基づいて複数の中国語センテンスに切り分ける。
各センテンスはそれぞれ中国語文字列である。例えば、中国語文章Artの記述が「外面的世界充滿旌旗,令他忍不住躍躍浴室,也因此▲ロ嘗▼扁各種酸甜苦臘。」である場合、文章切り分けモジュール120は句読点(この場合は読点と句点)に基づいて、中国語文章Artを3つの中国語文字列:「外面的世界充滿旌旗」、「令他忍不住躍躍浴室」、および「也因此▲ロ嘗▼扁各種酸甜苦臘」に切り分ける。中国語文章Artを複数の中国語文字列に切り分けたら、続いて個々の中国語文字列の切り分け処理を行う。
中国語文字列の切り分けに先立ち、先ずその関連する定義を説明する。中国語文字列Str「也因此▲ロ嘗▼扁各種酸甜苦臘」を例にとると、この文字列は、第1の位置に位置する第1の誤り文字列「酸甜苦臘」と第2の位置に位置する第2の誤り文字列「▲ロ嘗▼扁」とを有している。図3に示されるように、第1の位置は中国語文字列Str中の8から11個目の文字の位置を表し、第2の位置は中国語文字列Str中の4から5個目の文字の位置を表す。
本実施形態において、文章切り分けモジュール120は、スキップ式バイグラム(bi-gram)のメカニズムを用いて切り分けを行う。つまり、中国語文字列Str中の任意の2つの連続するおよび連続しない文字を複数の第1の文字の組に切り分ける。
中国語文字列Str中の任意の2つの連続する文字とは、次に挙げる第1の文字の組:12,23,34…のことである。このうち、12は中国語文字列Str中の1および2個目の文字からなる第1の文字の組を表し、23は中国語文字列Str中の2および3個目の文字からなる第1の文字の組を表す。以降についてはこれにしたがって類推されたい。
また、中国語文字列Str中の任意の2つの連続しない文字とは、次に挙げる第1の文字の組:13,35,57…24,46,68…のことであってよい。このうち、13は中国語文字列Str中の1および3個目の文字からなる第1の文字の組を表し、35は中国語文字列Str中の3および5個目の文字からなる第1の文字の組を表す。つまりは1文字おきの2つの文字である。
また、中国語文字列Str中の任意の2つの連続しない文字は、次に挙げる第1の文字の組:14,47…25,58…36,69…のことであってもよい。このうち、14は中国語文字列Str中の1および4個目の文字からなる第1の文字の組を表し、47は中国語文字列Str中の4および7個目の文字からなる第1の文字の組を表す。つまりは2文字おきの2つの文字である。
以上より、中国語文字列Str「也因此▲ロ嘗▼扁各種酸甜苦臘」を以下の第1の文字の組に切り分けることができる。
Figure 2010067250
表中、Nは、中国語文字列Strを第1の文字の組に切り分けるときに、中国語文字列Strにおける第1の文字の組の2つの文字の間にある文字の数を表す。N=0は中国語文字列Strにおける第1の文字の組の2つの文字の間にある文字の数が0であることを示し、N=1は中国語文字列Strにおける第1の文字の組の2つの文字の間にある文字の数が1であることを示し、N=2は中国語文字列Strにおける第1の文字の組の2つの文字の間にある文字の数が2であることを示す。
工程S110の中国語文章Artの切り分けが完了したら、続いて工程S120において正用データベース130および誤用データベース140を提供する。留意すべきは、工程S120においては、正用データベース130および誤用データベース140に格納される関連データを有した1つのデータベースだけを提供してもよいという点である。よって、上述の第1および第2のデータベースは説明の便宜上挙げたにすぎず、本発明を限定するものではない。
上述したように、正用データベース130は複数の第1の正しい文字列および第1の正しい文字列に対応する複数の第1のインデックスを有している。第1の正しい文字列に対応する複数の第1のインデックスは、文章切り分けモジュール120が中国語文字列Strを切り分けて表1に示した第1の文字の組を得たのと同じように、上記バイグラム(bi-gram)のメカニズムによって第1の正しい文字列を切り分けて得られるものである。
例えば、正用データベース130が成語「酸甜苦辣」および固有名詞「乙太網路」の2組の第1の正しい文字列(2組としたのは例示にすぎず、これより多くの組であってもよい)を有しているとする。この場合、正用データベース130に格納されるデータは表2に示すようになる。
Figure 2010067250
工程S130において、候補語生成モジュール150は、第1の文字の組に基づいて第1の文字の組に対応する第1のインデックスを得ると共に、得られた第1のインデックスに基づいて対応する第1の正しい文字列を得る。
より詳しく説明すると、候補語生成モジュール150は、表1に示された第1の文字の組に基づき、表2に同じ第1のインデックスがあるか否かをサーチし、ある場合はその第1のインデックスを得てから、その第1のインデックスと対応する第1の正しい文字列を得る。
例えば、候補語生成モジュール150は先ず表1における第1の文字の組「也因」に基づき、表2中にこれと同じ第1のインデックスがあるか否かをサーチする。表2には「也因」の第1のインデックスはないため、候補語生成モジュール150は引き続き次の第1の文字の組「因此」に基づいて、表2中にこれと同じ第1のインデックスがあるか否かをサーチする。同様に、表2には「因此」の第1のインデックスはないため、候補語生成モジュール150は引き続き次の第1の文字の組「此▲ロ嘗▼」に基づいて、表2中にこれと同じ第1のインデックスがあるか否かをサーチする。
このようにして、第1の文字の組すべてについてサーチが終わるまで上記工程を繰り返す。この期間において、第1の文字の組「酸甜」を処理するに至ったとき、候補語生成モジュール150は表2中に第1のインデックス「酸甜」を見つける。よって、候補語生成モジュール150は該第1のインデックス(つまり「酸甜」)を得る動作を実行する。
該第1のインデックスを得た後、候補語生成モジュール150は得られた第1のインデックス「酸甜」に基づいて、これに対応する第1の正しい文字列、つまり「酸甜苦辣」を得る。同様に、第1の文字の組「酸苦」を処理するに至ったとき、候補語生成モジュール150は表2中に第1のインデックス「酸苦」を見つけ、よって同じように第1の正しい文字列「酸甜苦辣」を得る。
対応する第1の正しい文字列「酸甜苦辣」を得たら、続いて工程S140において、得られた第1の正しい文字列に対し、元の語類似度によるフィルタリングを行い、抽出された第1の正しい文字列を第1の候補語として設定する。
フィルタリングの方式は、得られた第1の正しい文字列の、中国語文字列Str中に出現する文字の数によってその元の語類似度を決定し、その元の語類似度が経験的閾値よりも大きいか否かを判断するというものである。この例の場合、得られた4文字の第1の正しい文字列「酸甜苦辣」では、中国語文字列Str「也因此▲ロ嘗▼扁各種酸甜苦臘」中に「酸甜苦」の3文字が出現し、「辣」のみが出現しない。よってその元の語類似度は75%であり(4文字中3文字出現)であり、予め設定されていた経験的閾値は60%である(これに限定はされない)ので、得られた第1の正しい文字列「酸甜苦辣」の元の語類似度は経験的閾値よりも大きいということになる。したがって、得られた第1の正しい文字列「酸甜苦辣」を第1の候補語に設定することができる。
第1の候補語は図3における第1の誤り文字列および第1の位置に対応している。該第1の候補語は最適候補センテンスを決定するために用いられるが、この点については以下に詳しく説明する。
以上の処理プロセスは中国語文字列Str中の第1の誤り文字列「酸甜苦臘」についてのものである。以下に、中国語文字列Str中の第2の誤り文字列「▲ロ嘗▼扁」の処理について詳細に述べていく。
上述したように、誤用データベース140は、複数の第2のインデックスおよび第2のインデックスと対応する複数の第2の正しい文字列を有している。この場合に、下の表3に示されるように、誤用データベース140が5組の第2のインデックスおよびその対応する2組の第2の正しい文字列を格納しているとする(説明のための例示にすぎず、実際にはより多くの組であってもよい)。
Figure 2010067250
表中、第2のインデックスは一般ユーザーがよく書き誤る語句であり、第2の正しい文字列はそれらよく書き誤る語句と対応する正しい表記を表している。表3の場合では、第2の正しい文字列の「粽子」は正しい表記であり、ユーザーは「粽子」を「棕子」または「綜子」と書き誤ることが多い。かかる誤りの主な原因となっているのは、誤記である「棕子」または「綜子」と正しい表記「粽子」とが同形特性を有している(いずれも “宗”の パーツを有している)ことである。
同じように、ユーザーは「▲ロ嘗▼遍」を「▲ロ嘗▼扁」(同形特性のため)または「▲ロ嘗▼片」(同音特性のため)と書き誤ることも多い。こうした状況に際し、本発明では、書き誤ることの多い語句「棕子」および「綜子」を事前に第2のインデックスとして定義して誤用データベース140中に格納しておき、さらにその対応する正しい表記を第2の正しい文字列として定義し誤用データベース140中に格納する。
以上誤用データベース140に格納されるデータフォーマットを説明した。続いて工程S150に進む。
工程S150において、候補語生成モジュール150は第2のインデックスに基づいて第2の候補語を生成する。第2の候補語生成のプロセスは次のとおりである。
先ず、候補語生成モジュール150が、第2の誤り文字列が第2のインデックスと同じであるか否かを判断し、第2の誤り文字列が第2のインデックスのうちの1つと同じである場合、第2の誤り文字列と同じ第2のインデックスと対応する第2の正しい文字列を得ると共に、得られた第2の正しい文字列を第2の候補語として設定する。上述の例の場合、候補語生成モジュール150は先ず表1における第1の文字の組「也因」が表3における第2のインデックスと同じであるか否かを判断する。表3における5組の第2のインデックス中に「也因」と同じ文字はないので、候補語生成モジュール150は引き続き次の第1の文字の組「因此」が表3中の第2のインデックスと同じであるか否かを判断する。
同様に、表3における5組の第2のインデックス中に「因此」と同じ文字はないため、候補語生成モジュール150は引き続き次の第1の文字の組「此▲ロ嘗▼」が表3中の第2のインデックスと同じであるか否かを判断する。
このようにして、第1の文字の組すべてについて判断が終わるまで上記工程を繰り返す。この期間において、第1の文字の組「▲ロ嘗▼扁」(すなわち第2の誤り文字列)を処理するに至ったとき、候補語生成モジュール150は第2の誤り文字列(▲ロ嘗▼扁)が確かに第2のインデックスのうちの1つと同じであると判断し、これにより第2の誤り文字列と同じ第2のインデックスと対応する第2の正しい文字列を得る、つまり第2の正しい文字列「▲ロ嘗▼遍」を得る。
続いて、候補語生成モジュール150は得られた第2の正しい文字列「▲ロ嘗▼遍」を第2の候補語として設定する。この第2の候補語は図3における第2の誤り文字列および第2の位置に対応している。
第2の候補語が生成されたので、今、第1の候補語と第2の候補語が得られた。よって、続く工程S160において第1の候補語および第2の候補語の処理を行う。
工程S160において、候補センテンス生成および得点付けモジュール160が第1の誤り文字列、第2の誤り文字列、第1の候補語および第2の候補語に基づいて複数の候補センテンスを生成し、さらに最適候補センテンスを生成する。候補センテンス生成のプロセスは次のとおりである。候補センテンス生成および得点付けモジュール160は先ず、第1の誤り文字列、第2の誤り文字列、第1の候補語および第2の候補語をそれら各々の対応する位置に基づき中国語文字列Strにおける第1の位置および第2の位置へ置き換えて、各種可能な組み合わせの複数の候補センテンスを生成した後、候補センテンス得点付けメカニズムにより複数の候補センテンスを得点付けし、最高得点を得た候補センテンスを最適候補センテンスとして設定する。
図4は、本発明の1実施形態による中国語文字列Strのすべての可能な候補センテンスの組み合わせを示している。図4に示されるように、候補センテンス生成および得点付けモジュール160は、第1の誤り文字列、第2の誤り文字列、第1の候補語および第2の候補語に基づいて、次の4組の候補センテンス:「也因此▲ロ嘗▼扁各種酸甜苦臘」、「也因此▲ロ嘗▼扁各種酸甜苦辣」、「也因此▲ロ嘗▼遍各種酸甜苦臘」および「也因此▲ロ嘗▼遍各種酸甜苦辣」を生成することができる。
図5は、本発明による候補センテンス得点付けメカニズムの実施形態を示している。生成された4組の候補センテンスに基づき、候補センテンス生成および得点付けモジュール160は、候補センテンスの使用頻度(PPL)、候補センテンスと中国語文字列Str(元のセンテンス)との間のセンテンス類似度(SS)、音類似度(PS)、および形類似度(WS)を用いて4組の候補センテンスを得点付けすることができる。
ここで、候補センテンスの使用頻度は、例えば医学、天文学のような各種知識分野などの特定分野の言語モデルを表すものである。候補センテンスおよび元のセンテンスの間のセンテンス類似度は、候補センテンスの文字数と候補センテンスおよび元のセンテンスで異なる文字の数との差の、元のセンテンスの文字数に対する割合、つまり式(1)
Figure 2010067250
によって定義される。
候補センテンスおよび元のセンテンスの間の音類似度は、候補センテンスの文字数と候補センテンスおよび元のセンテンス間の非同音文字の数との差の、元のセンテンスの文字数に対する割合、つまり式(2)
Figure 2010067250
によって定義される。
候補センテンスおよび元のセンテンスの間の形類似度は、候補センテンスの文字数と候補センテンスおよび元のセンテンス間の非同形文字の数との差の、元のセンテンスの文字数に対する割合、つまり式(3)
Figure 2010067250
によって定義される。
以上より、上記4つの要素に基づいて候補センテンスを得点付けする。得点付けのSCORE計算式は次の式(4)のとおりである。
Figure 2010067250
式中、w1は候補センテンスの使用頻度の重みを表し、w2は候補センテンスと元のセンテンスとのセンテンス類似度の重みを表し、w3は候補センテンスと元のセンテンスとの音類似度の重みを表し、w4は候補センテンスと元のセンテンスとの形類似度の重みを表す。
また、候補センテンスの使用頻度は複数の分野の言語モデルを含んでいてもよい。したがって、図5によれば、候補センテンスの使用頻度PPLは次の式(5)により計算することができる。
Figure 2010067250
式中、PPLは第1の言語モデルを表し、PPLは第2の言語モデルを表す。
上式により候補センテンスを得点付けすると、実験で与えられるパラメータは次の式(6)のとおりとなる。
Figure 2010067250
そして図4におけるセンテンスD「也因此▲ロ嘗▼遍各種酸甜苦辣」が最高得点を得たため、続いて候補センテンス生成および得点付けモジュール160は該候補センテンスを最適候補センテンスとして設定する。
最後に、工程S170において、文章表示モジュール200が表示装置210上に元のセンテンスと最適候補センテンスとの間で修正された部分を表示する。
本発明の動作を上のように詳述したが、本発明の精神を逸脱しない限りにおいては、上に詳述した流れに変更を加えることができる点に注意されたい。例えば、必ずしも、先に第1の候補語を生成してから第2の候補語を生成しなければならないということはなく、第1および第2の候補語はこれと逆の順で生成されても、または同時に生成されてもよい。
さらに、上述した実施形態において、第2の誤り文字列は「▲ロ嘗▼扁」であって、2つの文字からなっている。しかし、別の状況においては、それはより多くの文字から構成されていることもある。例として、中国語文字列「想用著美味的佳▲食肴▼」を考えてみる。「想用」自体は正しい表現であるが、1センテンス中に「想用」と「佳▲食肴▼」が同時に出現する場合に、「想用」は誤りとなろう。正しい用法は「享用著美味的佳▲食肴▼」であるからである。「享」および「想」の同音特性のために、ユーザーは同音の誤った文字を使い易いのである。このような問題に対し、本発明の以下の実施形態は解決法を提供する。
本実施形態では、以下の表4に示すように、誤用データベース140の表3をそのまま用いると共に、新たなパラメータおよび内容を追加する。
Figure 2010067250
誤用データベース140中、1および2行目は表3にて示した元の内容であり、3および4行目は本実施形態で新たに追加した内容である。よって3および4行目の第2のインデックスは第2の正しい文字列と対応する他、コンテクストとも対応している。なお、当然に、以上のデータは説明のために挙げたにすぎず、本発明を限定するものではない。
上の中国語文字列「想用著美味的佳▲食肴▼」では、「佳佳」および「想用」はそれ自体単独で見ると正しい表現であるので、「▲ロ嘗▼扁」および「綜子」のようにそれ自体が誤りであって直ちに正しい表記「▲ロ嘗▼遍」および「粽子」を見つけることができるというものではない。こういった場合、「佳佳」および「想用」自体は正しい表現であるが、センテンス中に特定の文字列が出現したときに、「佳佳」および「想用」は誤った表現となる。よって本発明の実施形態では、それら特定の文字列をコンテクストと定義し(表4の3列目に示すとおり)、誤用データベース140に予め格納しておく。以下に本発明の誤り検出工程を説明する。
先ず、中国語文字列「想用著美味的佳▲食肴▼」には誤り文字列「想用」がある。上述したのと同じように、バイグラム(bi-gram)により複数の文字の組に切り分ける。切り分けの原理と結果は表1と同じであるので、その説明は省く。最初に、候補語生成モジュール150は、文字の組「想用」が表4の第2のインデックスと同じであるか否かを判断する。
表4には第2のインデックス「想用」があるため、候補語生成モジュール150は該第2のインデックスと対応するコンテクストを得る、つまり、コンテクスト「佳▲食肴▼」を得る。次いで、候補語生成モジュール150は中国語文字列中に得られたコンテクスト(佳▲食肴▼)が含まれているか否かを判断する。含まれていれば「想用」は誤り文字列ということであり、また、含まれていなければ「想用」は正しい文字列ということであるので、引き続いてその他の文字の組の処理を行う。
中国語文字列には確かに文字列「佳▲食肴▼」が含まれているので、候補語生成モジュール150は続いて誤り文字列(想用)と同じ第2のインデックス(想用)と対応する第2の正しい文字列(享用)を得ると共に、得られた第2の正しい文字列を第2の候補語として設定する。
本実施形態において、中国語文字列「想用著美味的佳▲食肴▼」には1つの誤り文字列「想用」があるだけなので、候補語を1つだけ生成することができる。上述の工程では第2の候補語を生成したが、第2の候補語は唯一の候補語でもある。本発明では、1中国語文字列中にN個の誤り文字列があったなら、N個の候補語を生成すると共にN個の候補語に基づいて2個の組み合わせの候補センテンス(元のセンテンスを含む)を生成するということを、当業者は理解するべきである。
また、本発明の中国語文章誤り検出方法は、上記フローの動作が実行できるようにプログラムの形式で記録媒体(例えば光ディスク、フレキシブルディスクディスクおよびリムーバブルハードディスクなど)に格納され得る。中国語文章誤り検出方法のプログラムは基本的に多数のプログラムコードから構成され、かつこれらプログラムコードの機能は上記方法の工程および上記システムの機能ブロック図に対応付けられる。
本発明を好適な実施形態により以上のように開示したが、これは本発明の範囲を限定するものではなく、当業者であれば、本発明の精神および範囲を逸脱しない限りにおいていくらかの変更や修飾を加えることができる。よって、本発明の保護範囲は添付の特許請求の範囲で定義されたものが基準となる。
図1は、本発明による中国語文章誤り検出装置100の実施形態を示す。 図2は、本発明による中国語文章誤り検出装置100の動作流れ図である。 図3は、本発明の1実施形態による中国語文字列Strの構造説明図である。 図4は、本発明の1実施形態による複数の候補センテンスの生成メカニズムを示す。 図5は、本発明の1実施形態による候補センテンス得点付けメカニズムの説明図である。
符号の説明
110 文章受信モジュール
120 文章切り分けモジュール
130 正用データベース
140 誤用データベース
150 候補語生成モジュール
160 候補センテンス生成および得点付けモジュール
170 類似文字データベース
180 同音文字データベース
190 言語モデルデータベース
200 文章表示モジュール
210 表示装置
Art 中国語文章
Str 中国語文字列

Claims (21)

  1. 第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用される中国語文章誤り検出方法であって、
    前記第1の誤り文字列を、それぞれが前記第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1の文字の組に切り分ける工程、
    複数の第1の正しい文字列と、前記第1の正しい文字列に対応し、それぞれが前記第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1のインデックスとを有するデータベースを提供する工程、
    前記第1の文字の組に基づいて前記第1の文字の組に対応する前記第1のインデックスを得ると共に、得られた前記第1のインデックスに基づいて対応する前記第1の正しい文字列を得る工程、
    得られた前記第1の正しい文字列に基づいて最適候補センテンスを生成する工程、ならびに、
    表示装置に前記中国語文字列および前記最適候補センテンスを表示する工程、
    を含む中国語文章誤り検出方法。
  2. 前記最適候補センテンスの生成が、前記中国語文字列中の前記第1の誤り文字列を、得られた前記第1の正しい文字列で置き換えることによってなされる請求項1記載の中国語文章誤り検出方法。
  3. 前記中国語文字列が第2の位置に位置する第2の誤り文字列をさらに含み、前記データベースが複数の第2のインデックスおよび前記第2のインデックスと対応する複数の第2の正しい文字列をさらに有し、前記方法がさらに、得られた前記第1の正しい文字列を第1の候補語として設定し、かつ前記第2のインデックスに基づいて第2の候補語を生成する請求項1記載の中国語文章誤り検出方法。
  4. 前記第2の誤り文字列が前記第2のインデックスと同じであるか否かを判断する工程をさらに含む請求項3記載の中国語文章誤り検出方法。
  5. 前記第2の誤り文字列と前記第2のインデックスのうちの1つとが同じであるときに、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記第2の正しい文字列を得ると共に、得られた前記第2の正しい文字列を前記第2の候補語として設定する請求項4記載の中国語文章誤り検出方法。
  6. 前記第1の誤り文字列、前記第2の誤り文字列、前記第1の候補語および前記第2の候補語をそれら各々の対応する位置に基づき前記中国語文字列中の前記第1の位置および前記第2の位置へ置き換えて、各種可能な組み合わせの複数の候補センテンスを生成する工程をさらに含む請求項5記載の中国語文章誤り検出方法。
  7. 候補センテンス得点付けメカニズムにより前記候補センテンスを得点付けして前記最佳候補センテンスを生成する工程をさらに含む請求項6記載の中国語文章誤り検出方法。
  8. 前記候補センテンス得点付けメカニズムが、前記候補センテンスの使用頻度、前記候補センテンスと前記中国語文字列との間のセンテンス類似度、音類似度、および形類似度によって前記候補センテンスを得点付けするものであり、かつ前記使用頻度が少なくとも1つの言語モデルを含む請求項7記載の中国語文章誤り検出方法。
  9. 前記データベースが、前記第2のインデックスと対応する複数のコンテクストをさらに有し、前記第2の誤り文字列と前記第2のインデックスのうちの1つとが同じであるときに、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記コンテクストを得ると共に、前記中国語文字列中に得られた前記コンテクストが含まれているか否かを判断する請求項4記載の中国語文章誤り検出方法。
  10. 前記中国語文字列中に得られた前記コンテクストが含まれているときに、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記第2の正しい文字列を得ると共に、得られた前記第2の正しい文字列を前記第2の候補語として設定する工程をさらに含む請求項9記載の中国語文章誤り検出方法。
  11. 第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用される中国語文章誤り検出装置であって、
    前記第1の誤り文字列を、それぞれが前記第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1の文字の組に切り分ける文章切り分けモジュール、
    複数の第1の正しい文字列と、前記第1の正しい文字列に対応し、それぞれが前記第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1のインデックスとを有するデータベース、
    前記第1の文字の組に基づいて前記第1の文字の組に対応する前記第1のインデックスを得ると共に、得られた前記第1のインデックスに基づいて対応する前記第1の正しい文字列を得る候補語生成モジュール、
    得られた前記第1の正しい文字列に基づいて最適候補センテンスを生成する候補センテンス生成および得点付けモジュール、ならびに、
    前記中国語文字列および前記最適候補センテンスを表示する表示装置、
    を含む中国語文章誤り検出装置。
  12. 前記最適候補センテンスの生成が、前記中国語文字列中の前記第1の誤り文字列を、得られた前記第1の正しい文字列で置き換えることによってなされる請求項11記載の中国語文章誤り検出装置。
  13. 前記中国語文字列が第2の位置に位置する第2の誤り文字列をさらに含み、前記データベースが複数の第2のインデックスおよび前記第2のインデックスと対応する複数の第2の正しい文字列をさらに有し、前記候補語生成モジュールがさらに、得られた前記第1の正しい文字列を第1の候補語として設定し、かつ前記第2のインデックスに基づいて第2の候補語を生成する請求項11記載の中国語文章誤り検出装置。
  14. 前記候補語生成モジュールがさらに、前記第2の誤り文字列が前記第2のインデックスと同じであるか否かを判断する請求項13記載の中国語文章誤り検出装置。
  15. 前記第2の誤り文字列と前記第2のインデックスのうちの1つとが同じであるときに、前記候補語生成モジュールが、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記第2の正しい文字列を得ると共に、得られた前記第2の正しい文字列を前記第2の候補語として設定する請求項14記載の中国語文章誤り検出装置。
  16. 前記候補センテンス生成および得点付けモジュールがさらに、前記第1の誤り文字列、前記第2の誤り文字列、前記第1の候補語および前記第2の候補語をそれら各々の対応する位置に基づき前記中国語文字列中の前記第1の位置および前記第2の位置へ置き換えて、各種可能な組み合わせの複数の候補センテンスを生成する請求項15記載の中国語文章誤り検出装置。
  17. 前記候補センテンス生成および得点付けモジュールがさらに、候補センテンス得点付けメカニズムにより前記候補センテンスを得点付けして前記最佳候補センテンスを生成する請求項16記載の中国語文章誤り検出装置。
  18. 類似文字データベース、同音文字データベースおよび少なくとも1つの言語モデルデータベースをさらに含み、前記候補センテンス得点付けメカニズムが、前記候補センテンスと前記中国語文字列との間のセンテンス類似度、前記類似文字データベース、前記同音文字データベースおよび少なくとも1つの前記言語モデルデータベースのデータによって前記候補センテンスを得点付けするものである請求項17記載の中国語文章誤り検出装置。
  19. 前記データベースが、前記第2のインデックスと対応する複数のコンテクストをさらに有し、前記第2の誤り文字列と前記第2のインデックスのうちの1つとが同じであるときに、前記候補語生成モジュールが、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記コンテクストを得ると共に、前記中国語文字列中に得られた前記コンテクストが含まれているか否かを判断する請求項14記載の中国語文章誤り検出装置。
  20. 前記中国語文字列中に得られた前記コンテクストが含まれているときに、前記候補語生成モジュールは、前記第2の誤り文字列と同じ前記第2のインデックスと対応する前記第2の正しい文字列を得ると共に、得られた前記第2の正しい文字列を前記第2の候補語として設定する請求項19記載の中国語文章誤り検出装置。
  21. コンピュータシステムにロードされて前記コンピュータシステムに中国語文章誤り検出方法を実行させる複数のプログラムコードを含む中国語文章誤り検出プログラムを格納した記録媒体であって、
    前記中国語文章誤り検出方法が、第1の位置に位置する第1の誤り文字列を含む中国語文字列を処理するのに適用され、
    前記第1の誤り文字列を、それぞれが前記第1の誤り文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1の文字の組に切り分ける工程、
    複数の第1の正しい文字列と、前記第1の正しい文字列に対応し、それぞれが前記第1の正しい文字列中の任意の2つの連続するおよび連続しない文字からなる複数の第1のインデックスとを格納する工程、
    前記第1の文字の組に基づいて前記第1の文字の組に対応する前記第1のインデックスを得ると共に、得られた前記第1のインデックスに基づいて対応する前記第1の正しい文字列を得る工程、
    得られた前記第1の正しい文字列に基づいて最適候補センテンスを生成する工程、ならびに、
    前記中国語文字列および前記最適候補センテンスを表示する工程、
    を含む、記録媒体。
JP2008304955A 2008-09-09 2008-11-28 中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体 Expired - Fee Related JP4796118B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
TW097134531 2008-09-09
TW097134531A TWI391832B (zh) 2008-09-09 2008-09-09 中文文章偵錯裝置、中文文章偵錯方法以及儲存媒體

Publications (2)

Publication Number Publication Date
JP2010067250A true JP2010067250A (ja) 2010-03-25
JP4796118B2 JP4796118B2 (ja) 2011-10-19

Family

ID=41800001

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008304955A Expired - Fee Related JP4796118B2 (ja) 2008-09-09 2008-11-28 中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体

Country Status (4)

Country Link
US (1) US8374847B2 (ja)
JP (1) JP4796118B2 (ja)
KR (1) KR101049525B1 (ja)
TW (1) TWI391832B (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210154755A (ko) * 2020-06-11 2021-12-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI403911B (zh) * 2008-11-28 2013-08-01 Inst Information Industry 中文辭典建置裝置和方法,以及儲存媒體
CN103714048B (zh) * 2012-09-29 2017-07-21 国际商业机器公司 用于校正文本的方法和系统
US20140136184A1 (en) * 2012-11-13 2014-05-15 Treato Ltd. Textual ambiguity resolver
TWI570578B (zh) * 2012-12-19 2017-02-11 英業達股份有限公司 中文詞句的詞彙查詢系統及其方法
CN103970798B (zh) * 2013-02-04 2019-05-28 商业对象软件有限公司 数据的搜索和匹配
US9442917B2 (en) * 2013-07-11 2016-09-13 University Of Oregon Detecting semantic errors in text using ontology-based extraction rules
CN104808806B (zh) * 2014-01-28 2019-10-25 北京三星通信技术研究有限公司 根据不确定性信息实现汉字输入的方法和装置
US9037967B1 (en) * 2014-02-18 2015-05-19 King Fahd University Of Petroleum And Minerals Arabic spell checking technique
CN107608963B (zh) * 2017-09-12 2021-04-16 马上消费金融股份有限公司 一种基于互信息的中文纠错方法、装置、设备及存储介质
CN109344387B (zh) * 2018-08-01 2023-12-19 北京奇艺世纪科技有限公司 形近字字典的生成方法、装置和形近字纠错方法、装置
CN110852087B (zh) * 2019-09-23 2022-02-22 腾讯科技(深圳)有限公司 中文纠错方法和装置、存储介质及电子装置
CN110852074B (zh) * 2019-11-07 2023-05-16 腾讯科技(深圳)有限公司 生成修正语句的方法和装置、存储介质和电子设备
CN112509581B (zh) * 2020-11-20 2024-03-01 北京有竹居网络技术有限公司 语音识别后文本的纠错方法、装置、可读介质和电子设备
CN113343678A (zh) * 2021-06-25 2021-09-03 北京市商汤科技开发有限公司 一种文本纠错的方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114831A (ja) * 1995-10-20 1997-05-02 Fujitsu Ltd 文章校正装置
JP2003288366A (ja) * 2002-03-28 2003-10-10 Fujitsu Ltd 類似テキスト検索装置
JP2006172231A (ja) * 2004-12-16 2006-06-29 Yoshikazu Miura 文書校正方法及び文書校正装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0793328A (ja) * 1993-09-24 1995-04-07 Matsushita Electric Ind Co Ltd 綴り不適切訂正装置
TW260772B (en) * 1994-04-25 1995-10-21 Ind Tech Res Inst Method for auto-correcting Chinese words and device thereof
US5761687A (en) * 1995-10-04 1998-06-02 Apple Computer, Inc. Character-based correction arrangement with correction propagation
CN1193779A (zh) * 1997-03-13 1998-09-23 国际商业机器公司 中文语句分词方法及其在中文查错系统中的应用
KR100509917B1 (ko) 2003-04-15 2005-08-25 한국전자통신연구원 어절 엔-그램을 이용한 띄어쓰기와 철자 교정장치 및 방법
KR100561227B1 (ko) * 2003-12-19 2006-03-15 한국전자통신연구원 한-중 기계번역시스템의 용언구 패턴 자동 확장 및 검증장치 및 방법
US20060271882A1 (en) * 2005-05-26 2006-11-30 Inventec Appliances Corp. Method for implementing a fuzzy spelling while inputting Chinese characters into a mobile phone
US20070005345A1 (en) * 2005-07-01 2007-01-04 Microsoft Corporation Generating Chinese language couplets
US7558725B2 (en) * 2006-05-23 2009-07-07 Lexisnexis, A Division Of Reed Elsevier Inc. Method and apparatus for multilingual spelling corrections
US7856598B2 (en) * 2006-07-06 2010-12-21 Oracle International Corp. Spelling correction with liaoalphagrams and inverted index

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114831A (ja) * 1995-10-20 1997-05-02 Fujitsu Ltd 文章校正装置
JP2003288366A (ja) * 2002-03-28 2003-10-10 Fujitsu Ltd 類似テキスト検索装置
JP2006172231A (ja) * 2004-12-16 2006-06-29 Yoshikazu Miura 文書校正方法及び文書校正装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210154755A (ko) * 2020-06-11 2021-12-21 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체
JP2021197175A (ja) * 2020-06-11 2021-12-27 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 文字誤り訂正方法、装置、電子デバイス及び記憶媒体
US11443100B2 (en) 2020-06-11 2022-09-13 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for correcting character errors, electronic device and storage medium
KR102541054B1 (ko) 2020-06-11 2023-06-05 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 문자 오류 수정 방법, 장치, 전자 기기 및 기록 매체

Also Published As

Publication number Publication date
KR101049525B1 (ko) 2011-07-15
TW201011566A (en) 2010-03-16
US8374847B2 (en) 2013-02-12
JP4796118B2 (ja) 2011-10-19
KR20100030547A (ko) 2010-03-18
TWI391832B (zh) 2013-04-01
US20100063798A1 (en) 2010-03-11

Similar Documents

Publication Publication Date Title
JP4796118B2 (ja) 中国語文章誤り検出装置、中国語文章誤り検出方法および記録媒体
JP4833476B2 (ja) モードレス入力で一方のテキスト形式を他方のテキスト形式に変換する言語入力アーキテクチャ
US7810030B2 (en) Fault-tolerant romanized input method for non-roman characters
JP4652737B2 (ja) 単語境界確率推定装置及び方法、確率的言語モデル構築装置及び方法、仮名漢字変換装置及び方法、並びに、未知語モデルの構築方法、
JP5535417B2 (ja) スペルミス、タイプミス、および変換誤りに耐性のある、あるテキスト形式から別のテキスト形式に変換する言語入力アーキテクチャ
TWI421708B (zh) 增進打字或按鍵輸入效率的候選字產生方法
JP4301515B2 (ja) 文章表示方法、情報処理装置、情報処理システム、プログラム
US20120166942A1 (en) Using parts-of-speech tagging and named entity recognition for spelling correction
JP2007004633A (ja) 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置
JP2017211993A (ja) 請求の範囲の中の請求の範囲構成要素名詞所属構成要素対応符号を対応検出する方法
Bhatti et al. Phonetic based soundex & shapeex algorithm for sindhi spell checker system
Barrett et al. Cross-lingual transfer of correlations between parts of speech and gaze features
Sakor et al. FALCON: an entity and relation linking framework over dbpedia
JP7102710B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
US20120265520A1 (en) Text processor and method of text processing
Chiu et al. Chinese spell checking based on noisy channel model
Syarafina et al. Designing a word recommendation application using the Levenshtein Distance algorithm
JP7302267B2 (ja) 検索プログラム、検索方法及び検索装置
Mon Spell checker for Myanmar language
JP7124358B2 (ja) 出力プログラム、情報処理装置及び出力制御方法
JP7095264B2 (ja) 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法
Lehal et al. A Hindi to Urdu transliteration system
CN101685438B (zh) 中文文章侦错装置以及中文文章侦错方法
JP2008090247A (ja) 和訳ローマ字略語を付加したゲルマン語群言語の辞書。
Bilac et al. Increasing the error coverage of the FOKS Japanese dictionary interface

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110608

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110628

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110728

R150 Certificate of patent or registration of utility model

Ref document number: 4796118

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees