JP3203544B2 - テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置 - Google Patents

テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置

Info

Publication number
JP3203544B2
JP3203544B2 JP01579296A JP1579296A JP3203544B2 JP 3203544 B2 JP3203544 B2 JP 3203544B2 JP 01579296 A JP01579296 A JP 01579296A JP 1579296 A JP1579296 A JP 1579296A JP 3203544 B2 JP3203544 B2 JP 3203544B2
Authority
JP
Japan
Prior art keywords
language
decoding
character string
code
likelihood
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP01579296A
Other languages
English (en)
Other versions
JPH09212334A (ja
Inventor
玄一郎 菊井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP01579296A priority Critical patent/JP3203544B2/ja
Publication of JPH09212334A publication Critical patent/JPH09212334A/ja
Application granted granted Critical
Publication of JP3203544B2 publication Critical patent/JP3203544B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト編集装
置、インターネット情報ブラウザ、テキスト情報検索装
置、テキスト解析装置等のテキスト情報を処理する方法
及び装置に係り、特に、文字に対応した文字コードから
なる符号列をテキストに復号する方法及び装置に関す
る。
【0002】更に、本発明は、送信側で符号系を用いて
通信文が符号化され、通信ネットワークを介して通信文
を受信した受信装置が通信文を復号する通信ネットワー
ク装置に関する。
【0003】
【従来の技術】従来のテキスト情報の処理方法及び装置
によれば、入力符号列は、文字と、文字を表わす文字コ
ードとの対応を規定した符号系を用いてテキストに復号
されている。上記テキスト情報処理装置をかかる符号系
が複数存在する環境で使用する場合、与えられた入力符
号列が何れの符号系に基づいているかを判定することが
必要である。そのため、従来、上記入力符号列の中に特
定のエスケープ信号が挿入されているかどうか、或い
は、符号の8ビット目に1がセットされているかどうか
に応じて、入力符号列の属する符号系を自動的に識別
し、識別された結果に従って入力された符号列をテキス
トに復号する方法及び装置が提案され、実用化されてい
る。例えば、日本語の場合、新JIS、旧JIS、SJ
IS(MS漢字コード)及びUJIS(EUC漢字コー
ド)を符号系として用いて、符号系を自動識別し、入力
符号列を復号する装置が開発され、テキスト編集プログ
ラム等に組み込まれている。
【0004】近年、種々の符号系で符号化されたテキス
トが国際的な通信ネットワークを介して通信される頻度
が増している。このため、符号化されたテキストを受信
した場合、ある符号系に従って符号化されたテキストを
復号する場合に、符号化に用いられた符号系を判定する
必要性は益々増大している。
【0005】
【発明が解決しようとする課題】しかし、上記符号系の
中には、一つの国のように使用される文字の種類や符号
系の種類が限定されているような範囲での情報流通の効
率性を考慮して設計されるために、国際的識別可能性が
考慮されていない符号系、或いは、エスケープ記号等の
記号が省略された符号系が含まれている場合がある。
【0006】このため、現在世界中で使用されている符
号系の中には、上記エスケープ記号の有無、或いは、符
号の8ビット目が1であるかどうかを手掛かりとして識
別し得ない符号系の組が存在する。例えば、「日本語E
UC」と「韓国語EUC」は同一の符号の値域を有する
ため、上記エスケープ記号の有無、或いは、符号の8ビ
ット目が1であるかどうかを手掛かりとして識別し得な
い。従って、国際的なネットワーク上で上記符号系によ
って符号化された情報が送られて来た場合、従来の復号
方法及び装置によれば、符号化の際に使用された符号系
を判定できないため、復号化の結果に誤りが生じる可能
性がある。
【0007】本発明は、上記従来技術の問題点に鑑み、
符号化の際に使用された符号系を判定して、テキストの
正確な復号を行なうテキストの復号方法及び復号装置の
提供を目的とする。更に、本発明は、通信ネットワーク
を介して通信される符号化された通信文を正確に復号す
る通信ネットワーク装置の提供を目的とする。
【0008】
【課題を解決するための手段】上記本発明の目的を達成
する本発明のテキストの最尤復号方法の原理説明図を図
1に示す。同図に示す如く、文字に対応した文字コード
からなる符号列を上記文字と上記文字コードの対応を表
わす符号系によってテキストに復号する本発明のテキス
トの最尤復号方法は、上記符号列を入力する段階(ステ
ップ1)と;所定の符号系の組の中から上記入力された
符号列を復号し得る上記符号系を選択し、上記選択され
た符号系と、上記選択された符号系による復号によって
得られた文字列の対を表わす情報の組を得る段階(ステ
ップ2)と;所定の言語に対し、上記復号結果の文字列
の上記言語の文字列としての尤もらしさを表わす尤度を
評価する段階(ステップ3)と;上記評価された尤度に
応じて、上記入力された符号列を復号する言語と、上記
言語による復号結果の文字列を選択する段階(ステップ
4)と;上記選択された文字列に対応するテキストを出
力する段階(ステップ5)とからなる。
【0009】本発明は、符号列の形に符号化されたテキ
ストは、言語、特に、自然言語を含んでいる可能性が高
いという原理に基づいている。この原理によれば、種々
の符号系を用いた復号に対応する復号結果の中で、最も
多くの自然言語を含んでいる復号結果が元のテキストで
あるという尤もらしさ、即ち、尤度が最も高いと判定さ
れるので、これにより、最も誤りの少ない復号結果が得
られる。
【0010】従って、本発明のテキストの最尤復号方法
によれば、最初、所定の符号系の組の中の符号系を用い
て入力符号列を復号して文字列を取得する。次に、すべ
ての符号系に対し得られた各文字列が所定の言語の文字
列であると見なし得る程度、即ち、尤度を評価する。か
かる尤度は、各文字列の自然言語としての尤もらしさを
表わしているので、最終的に、尤度に応じて文字列を選
択することにより、最も誤りの少ない復号結果として正
しいテキストが得られる。
【0011】図2は上記本発明のテキストの最尤復号方
法を行なう本発明のテキストの最尤復号装置の原理構成
図である。同図に示す如く、本発明のテキストの最尤復
号装置は:文字に対応した文字コードからなる符号列を
生成する入力手段(2)と;上記入力手段(2)に接続
され、上記入力手段(2)から上記符号列を受け、上記
文字と上記文字コードの対応を表わす符号系によってテ
キストに復号するテキスト復号手段(4)と;上記テキ
スト復号手段(4)に接続され、上記テキスト復号手段
(4)から上記復号されたテキストを受け出力する手段
(6)とからなる。上記テキスト復号手段(4)は:所
定の符号系の組の中の上記符号系を用いて上記入力手段
から受けた上記符号列を復号し、上記所定の符号系の組
の中から適当な文字列が得られた符号系を選択し、上記
選択された符号系と、上記選択された符号系による復号
によって得られた文字列の対を表わす情報の組を得る復
号手段(8)と;所定の言語に対し、上記復号結果の文
字列の上記言語の文字列としての尤もらしさを表わす尤
度を評価する言語識別手段(10)と;上記復号手段
(8)に接続され、上記復号手段(8)から得られた情
報の組の中の上記文字列を上記言語識別手段(10)に
供給し、上記言語識別手段(10)を作動させ、上記言
語識別手段(10)から得られた上記尤度に応じて、上
記入力された符号列を復号する言語と、上記言語による
復号結果の文字列を選択する最尤結果選択手段(12)
とを更に有する。
【0012】
【発明の実施の形態】以下、図面と共に本発明の実施の
形態を説明する。図3は本発明の一実施例のテキスト復
号装置の概要図である。同図に示す如く、本発明の一実
施例のテキストの最尤復号装置は:文字に対応した文字
コードからなる符号列を生成する入力装置2と;上記入
力装置2に接続され、上記入力装置2から上記符号列を
受け、上記文字と上記文字コードの対応を表わす符号系
によってテキストに復号するテキスト復号部4と;上記
テキスト復号部4に接続され、上記テキスト復号部4か
ら上記復号されたテキストを受け出力する装置6とから
なる。
【0013】上記テキスト復号部4は、上記選択された
符号系と、上記選択された符号系による復号によって得
られた文字列の対を表わす情報の組を得る復号部8と;
上記復号結果の文字列の所定の言語の文字列としての尤
もらしさを表わす尤度を評価する言語識別部10と;上
記言語識別部10から得られた上記評価された尤度に応
じて、上記入力された符号列を復号する言語と、上記言
語による復号結果の文字列を選択する最尤結果選択部1
2とを更に有する。
【0014】上記復号部8は:上記符号系に対応し、上
記符号系を用いて上記符号列を上記文字列に復号する少
なくとも一つの個別符号系復号部16と;上記少なくと
も一つの個別符号系復号部16に接続され、上記少なく
とも一つの個別符号系復号部16を作動させ、上記作動
された個別符号系復号部16によって得られた上記文字
列を受け、上記所定の符号系の組の中で適当な上記文字
列が得られた符号系を選択し、上記選択された符号系
と、上記選択された符号系による復号結果の文字列の対
を表わす情報の組を得る復号制御部14とを更に有す
る。尚、図面の簡単化のため、図3において、個別符号
系復号部16は一つしか図示しない。
【0015】上記最尤結果選択部12は、上記復号部8
に接続され、上記復号部8から得られた情報の組の中の
上記文字列を上記言語識別部10に供給し、上記言語識
別部10を作動させ、上記言語識別部10から得られた
上記評価された尤度に応じて、上記入力された符号列を
復号する言語と、上記言語による復号結果の文字列を選
択する。
【0016】上記言語識別部10は:上記各言語の特徴
データを格納する言語モデル保持部22と;上記文字列
と上記言語を表わす情報を受け、上記言語モデル保持部
から上記言語に対応する上記特徴データを受け、上記文
字列の上記言語の文字列としての尤度を評価する言語尤
度計算部20と;上記最尤結果選択部12と上記言語尤
度計算部20とに接続され、上記最尤結果選択部12か
ら上記文字列を受け、上記文字列の上記言語の文字列と
しての尤度を得るため上記文字列と上記言語を表わす情
報を上記言語尤度計算部20に供給して上記言語尤度計
算部20を作動し、上記言語尤度計算部20から評価さ
れた尤度を受け、上記言語を表わす情報と、上記文字列
の上記言語の文字列としての尤度を上記最尤結果選択部
12に送出する言語識別制御部18とを更に有する。
【0017】図4は図3に示した本発明の一実施例のテ
キストの復号装置の動作を示す概略的なフローチャート
である。以下、図3及び4を参照して本発明の一実施例
のテキストの復号装置の動作を説明する。最初、入力装
置2からテキストに含まれる文字に対応した文字コード
からなる符号列が復号制御部14に供給される(ステッ
プ10)。復号制御部14は、符号列を各個別符号系復
号部16に転送して、各個別符号系復号部16の動作を
開始させる(ステップ12)。各個別符号系復号部16
は、符号列を受け取り、各個別符号系復号部16に対応
する符号系の規定に従って符号列の符号を復号し、得ら
れた文字列を復号制御部14に返す(ステップ14)。
復号制御部14は、全ての符号系に対し、各個別符号系
復号部16の復号に関係する符号系と、各個別符号系復
号部16から得られた文字列との対の情報を生成し、生
成された文字列と符号系の対の情報のリストを最尤結果
選択部12に送出する(ステップ16)。
【0018】最尤結果選択部12は、復号制御部14か
ら文字列と符号系の対の情報のリストを受け、上記リス
トの中から各文字列を取り出し(ステップ18)、各文
字列を言語識別制御部18に供給して、言語識別部10
を動作させる(ステップ20)。言語識別制御部18
は、復号結果の文字列の自然言語としての尤度を評価す
るため、評価されるべき文字列と言語の言語名とを言語
尤度計算部20に転送する(ステップ22)。言語尤度
計算部20は、言語モデル保持部22から言語名が指定
された言語の特徴を表わす特徴データ、即ち、言語の特
徴を形式的に記述した言語モデルを取り出し(ステップ
24)、上記文字列と、上記特徴データとに基づいて上
記言語に属する度合いを示す尤度を計算し、得られた尤
度を言語識別制御部18に返す(ステップ26)。
【0019】以下、本発明による尤度の計算方法を説明
する。説明の便宜上、入力文字列をW、入力言語名をl
と表わす。入力文字列Wが言語lの文字列である尤度S
(l)は次の式:
【0020】
【数1】
【0021】によって計算する。式中、wi は文字列W
のi番目の文字、nは文字列Wの長さ、P(c,l)は
文字cの言語lにおける出現確率を表わしている。上記
言語モデル保持部22から得られる出現確率P(c,
l)は、言語lの多数のテキストの集まりからなるコー
パスを作成し、コーパスにおいて別個の各文字の全文字
に対する相対的な出現頻度によって近似的に得ることが
できる。即ち、言語lのコーパスに出現する文字cの数
をmc,l で表わすと、文字cの出現確率P(c,l)は
次式:
【0022】
【数2】
【0023】によって表わすことができる。式中、Cl
は言語lのコーパスに含まれる全文字数を表わしてい
る。言語識別制御部18は、評価すべき別の言語が未だ
存在するかどうかを判定し(ステップ28)、未だ評価
すべき別の言語がある場合、ステップ22に戻る。評価
すべき別の言語が存在しない場合、言語識別制御部18
は、最尤結果選択部12から与えられた文字列に対し、
評価された言語の中で最大の尤度が得られた言語名と、
そのときの尤度の対の情報を最尤結果選択部12に返す
(ステップ30)。
【0024】最尤結果選択部12は、次いで、上記文字
列と符号系の対の情報のリストの中に未だ尤度を評価し
ていない文字列が存在するかどうかを判定し(ステップ
32)、未だ尤度を評価していない文字列があれば、ス
テップ18に戻る。上記文字列と符号系の対の情報のリ
ストの中の全ての文字列に対する尤度が評価された場
合、最尤結果選択部12は、各文字列に対し言語識別制
御部18から得られた言語名と尤度の対の情報の中から
最大の尤度を有する情報を選択し(ステップ34)、最
大の尤度を有する情報に対応する文字列を最終的な復号
結果として出力装置6に送る(ステップ36)。出力装
置6は、この文字列をテキストの形で出力し(ステップ
38)、一連の動作が終了する。
【0025】
【実施例】以下、本発明の一実施例を詳細に説明する。
本発明の一実施例のテキスト復号装置に以下のような符
号列が入力された場合を想定する。入力符号列: b3c6 b8c0 b8ec a4cb c2d0 a4b7 a4c6 a4bd a4ce b8c0 b8ec a4ce c6c3 c4a7 a4f2 b7c1 bcb0 c5aa a4cb b5ad bdd2 a4b7 a4bf a1d6 b8c0 b8ec a5e2 a5c7 a5eb a1d7 0a00 上記符号列はある文字列を日本語EUC(UJISとも
呼ばれる)符号系によって符号化して得られたものであ
る。
【0026】図5は上記符号列が入力された場合の復号
部8の復号制御部14及び個別符号系復号部16の動作
フローチャートである。復号制御部14は、入力符号列
を受け取り、変数stringに代入し、更に、変数c
ode−listに上記復号部8において復号可能な符
号系の名前のリストをセットする(ステップ50)。か
かる実施例の場合、復号可能な符号系は、日本語EUC
と、韓国語EUCと、英語ASCIIと、Latin1
の4種類である。図6はこれら4種類の言語用の個別符
号系復号部161 、162 、16 3 及び164 よりなる
復号部の構成図である。
【0027】次に、code−listが空であるかど
うかを判定し(ステップ52)、空の場合、処理を終了
する。code−listが空ではない場合、変数co
de−listの中の先頭の要素を取り出して変数co
deにセットする(ステップ54)。この例の場合、最
初、日本語EUCが変数codeにセットされる。これ
により、復号可能な符号系のリスト変数code−li
stは、韓国語EUCと、英語ASCIIと、Lati
n1の3種類の符号系を含む。
【0028】ステップ56において、復号制御部14
は、上記入力符号列が格納された変数stringと、
日本語EUCがセットされた変数codeを日本語EU
C用個別符号系復号部161 に供給し、日本語EUC用
復号処理を呼び出す。次いで、個別符号系復号部161
は、上記変数stringに対し日本語EUC用復号処
理を正常に実行、即ち、復号によって文字列を生成する
ことができるので、復号結果である文字列を変数tex
tに代入し呼出し元の復号制御部14に戻る。
【0029】個別符号系復号部161 の日本語EUC用
復号処理は、例えば、UNIXにおける所謂nkfプロ
グラムのような既に実用化され、入手可能な計算機プロ
グラムを使用する。ここで、個別符号系復号部161
符号列を復号した結果として得られる文字列の各文字
は、実際上、符号で表わされる点に注意が必要である。
復号化前の元の符号列の各符号は、特定の文字に対応付
けられていないが、復号化によって得られた符号列は、
各符号が復号に用いられた符号系を介して特定の文字に
曖昧さを残すことなく対応付けられている点に更に注意
が必要である。その他の個別符号系復号部162 、16
3 及び164 は、夫々、韓国語EUC、英語ASCII
及びLatin1用の復号処理を行なう。
【0030】ステップ58において、復号制御部14
は、個別符号系復号部161 における復号処理は成功し
たかどうかを判定し(ステップ58)、復号結果の文字
列が得られているので、符号系を表わす変数code
と、復号結果文字列を表わす変数textの対の情報を
「符号系と文字列の対の情報のリスト」に加える(ステ
ップ60)。
【0031】尚、以下の説明では、上記復号処理におい
て、全ての符号が復号できたとき、復号処理が成功した
と判定し、文字列が得られる場合を想定しているが、符
号列の中の一部の符号だけが復号できたときにも復号処
理が成功したと判定し、復号できた符号に対する文字だ
けからなる文字列を生成してもよい。このように一部だ
けでも有効な文字が得られた場合にも処理を継続するこ
とにより、元の符号列に誤りが含まれている場合にもテ
キストの復号を行なうことができるようになる。
【0032】図7は復号部8の復号処理によって得られ
た符号系と文字列の対の情報のリストの内容の一例を示
す図である。第1列目は符号系の名前を表わし、第2列
目は復号結果の文字列を表わしている。同図の第1行目
は日本語EUCによる復号結果を表わし、第2行目及び
第3行目は、夫々、韓国語EUC及びLatin1によ
る復号結果を表わしている。
【0033】ステップ58において復号処理が不成功、
即ち、復号結果の文字列が得られなかった場合、或い
は、復号処理が成功し、ステップ60において「符号系
と文字列の対の情報のリスト」に情報が追加された後、
次の符号系に対する処理を行なうべくステップ52に戻
る。
【0034】上記例の場合、変数code−listは
空ではないので(ステップ52)、変数code−li
stの中の先頭の要素である韓国語EUCを取り出して
変数codeにセットする(ステップ54)。次いで、
韓国語EUC用の個別符号系復号部162 の復号処理が
行なわれる(ステップ56)。ステップ58において、
復号制御部14は、個別符号系復号部162 における復
号処理は成功したかどうかを判定し(ステップ58)、
韓国語EUCの復号結果の文字列が得られているので、
符号系を表わす変数codeと、復号結果文字列を表わ
す変数textの対の情報を「符号系と文字列の対の情
報のリスト」に加える(ステップ60)。これにより、
図7の第2行目に記載した情報が得られる。
【0035】次いで、別の符号系に対する処理を行なう
べくステップ52に戻る。上記例の場合、変数code
−listは空ではないので(ステップ52)、変数c
ode−listの中の先頭の要素である英語ASCI
Iを取り出して変数codeにセットする(ステップ5
4)。次いで、英語ASCII用の個別符号系復号部1
3 の復号処理が行なわれる(ステップ56)。ステッ
プ58において、復号制御部14は、個別符号系復号部
163 における復号処理は成功したかどうかを判定し
(ステップ58)、英語ASCIIの復号結果の文字列
は得られていないので、別の符号系に対する処理を行な
うべくステップ52に戻る。
【0036】上記例の場合、変数code−listは
空ではないので(ステップ52)、変数code−li
stの中の先頭の要素であるLatin1を取り出して
変数codeにセットする(ステップ54)。次いで、
Latin1用の個別符号系復号部163 の復号処理が
行なわれる(ステップ56)。ステップ58において、
復号制御部14は、個別符号系復号部163 における復
号処理は成功したかどうかを判定し(ステップ58)、
Latin1の復号結果の文字列が得られているので、
符号系を表わす変数codeと、復号結果文字列を表わ
す変数textの対の情報を「符号系と文字列の対の情
報のリスト」に加える(ステップ60)。これにより、
図7の第3行目に記載した情報が得られる。
【0037】次いで、別の符号系に対する処理を行なう
べくステップ52に戻る。上記例の場合、変数code
−listは空であるので(ステップ52)、復号処理
を終了する。以上の復号処理によって、図7に示したよ
うに、日本語EUCと、韓国語EUCと、Latin1
の3種類の符号系に対し、復号結果文字列が得られる。
【0038】図8に示した言語識別部10の動作を示す
フローチャートを参照して、図7に示した「符号系と文
字列の対の情報のリスト」が得られた場合における本発
明の一実施例の言語識別部10の動作を説明する。言語
識別部10の機能は、最尤結果選択部12から供給され
た文字列が所定の各言語の文字列である尤度を計算し、
供給された文字列に対する最大の尤度と、その最大の尤
度に対応する言語名の対の情報を最尤結果選択部12に
返すことである。
【0039】言語識別部10の言語識別制御部18は、
最尤結果選択部12から上記「符号系と文字列の対の情
報のリスト」の中の一つの符号系に対する文字列を受け
て、初期化処理を行なう(ステップ70)。上記例によ
れば、最初に言語識別制御部18に供給される文字列
は、日本語EUCに対する文字列“各言語に対してその
言語の特徴を形式的に記述した「言語モデル」”であ
る。ステップ70において、言語識別制御部18は、最
尤結果選択部12から受けた文字列を変数textにセ
ットし、言語識別部で識別可能な所定の言語のリストを
変数langsにセットし、更に、尤度の最大値を格納
する変数Smaxを適当な負の大きい値、例えば、−9
99999にセットする。この例の場合、識別可能な言
語は、日本語、中国語、韓国語及び英語である。
【0040】言語識別制御部18は言語のリストの変数
langsが空であるかどうかを判定し(ステップ7
2)、空の場合、ステップ82に進む。この例の場合、
変数langsは空ではないので、ステップ74に進
み、リスト変数langsの最初の要素である「日本
語」を変数langにセットする。次いで、言語識別制
御部18は、変数langと変数textを言語尤度計
算部20に供給し、言語尤度計算部20の処理を開始さ
せる(ステップ76)。
【0041】言語尤度計算部20は、言語識別制御部1
8から受けた文字列変数textと言語名変数lang
を受けて、変数textで表わされた文字列が変数la
ngで表わされた言語の文字列としてどの程度尤もらし
いかを表わす「尤度」を算出し、上記尤度の計算方法に
従って算出した尤度を言語識別制御部18に返す。
【0042】言語尤度計算部20は、最初、例えば、磁
気ディスク、或いは、RAMのような記憶装置からなる
言語モデル保持部22から言語「日本語」に対応する言
語モデルを得る。言語モデルには、具体的には、尤度計
算に使用される言語の特徴を表わすデータ、即ち、当該
言語langにおける別個の各文字の出現確率を含んで
いる。
【0043】図9は、上記式(1)及び(2)に従って
得られた復号結果の文字列の中の各文字の所定の言語に
おける出現確率を示す図である。同図の左側には日本語
EUCによる復号結果の文字列の中の各文字の日本語に
おける出現確率の対数値(即ち、log(P(c,日本
語)))が示され、右側には韓国語EUCによる復号結
果の文字列の中の各文字の韓国語における出現確率の対
数値(即ち、log(P(c,韓国語)))が示されて
いる。更に各列の最下段には、各文字に対する確率の対
数値の平均、即ち、上記式(1)に従って算出された尤
度が示されている。
【0044】尚、上記実施例では、尤度を表わす尺度と
して、各文字の当該言語における出現確率の積(所謂、
ユニグラム確率による尺度)を用いているが、上記の例
に限定されることはなく、パターン認識技術の分野で提
案されている種々の尺度を利用することが可能である。
【0045】次に、言語識別制御部18は、文字列te
xtの日本語に対し得られた尤度Sが格納された最大の
尤度Smaxよりも大きいかどうかを判定し(ステップ
78)、S=−6.27773・・・は、Smax=−
9999よりも大きいので、SをSmaxに代入し、現
在対象としている言語名langを最大尤度の言語を表
わす変数Lmaxに代入する(ステップ80)。
【0046】言語識別制御部18は、ステップ72に戻
り、別の言語が言語リスト変数langsにあるかどう
かを判定し、リストの先頭には「中国語」があるので、
変数langに「中国語」をセットし(ステップ7
4)、言語尤度計算部20をもう一度起動する(ステッ
プ76)。
【0047】言語尤度計算部20は、変数textに格
納された文字列“各言語に対してその言語の特徴を形式
的に記述した「言語モデル」”が指定された言語である
中国語の文字列である尤度Sを算出し、結果を言語識別
制御部18に返す。上記尤度Sと、先に日本語に対し得
られた現在の最大尤度Smaxを比較すると(ステップ
78)、S<Smaxであるので、ステップ72に戻
る。
【0048】リストlangs内に残っている言語であ
る韓国語と英語に対し、上記中国語の場合と同様の手順
で尤度Sの計算が繰り返されるが、尤度Sと、先に日本
語に対し得られた現在の最大尤度Smaxを比較すると
(ステップ78)、S<Smaxであるので最大尤度は
更新されない。
【0049】英語に対する処理の後、ステップ72にお
いて別の言語が言語リスト変数langsにあるかどう
かを判定すると、langsは空であるので、文字列t
extに対し得られた最大の尤度であるSmax=−
6.27773・・・と、最大の尤度に対応する言語名
Lmax、即ち、日本語を最尤結果選択部12に返し
(ステップ82)、最初に言語識別制御部18に供給さ
れた日本語EUCの文字列“各言語に対してその言語の
特徴を形式的に記述した「言語モデル」”に対する尤度
計算が終了する。
【0050】図8を参照して日本語EUCの文字列に対
し説明した言語識別部10の尤度計算処理は、図7に示
した「符号系と文字列の対の情報のリスト」の中の他の
符号系である韓国語EUC及びLatin1に対応する
夫々の文字列に対し繰り返される。このため、最尤結果
選択部12は、各文字列に対する上記尤度計算を繰り返
し行い、得られた尤度の中から最大の尤度を与える文字
列を選択する機能がある。以下、図10に示した最尤結
果選択部の動作フローチャートを参照して、最尤結果選
択部12の動作を説明する。
【0051】復号制御部14からの「符号系と文字列の
対の情報のリスト」を受けた最尤結果選択部12は、最
大の尤度を格納するメモリSmaxと、最大の尤度が得
られた文字列を格納するメモリTmaxを初期化する
(ステップ90)。例えば、Smaxには負の非常に大
きい値をセットする。
【0052】最尤結果選択部12は、上記「符号系と文
字列の対の情報のリスト」の中に未だ尤度計算を行なっ
ていない対の情報があるかどうかを判定し(ステップ9
2)、全ての対の情報に対する処理が終了している場
合、ステップ102に進む。尤度計算が実行されていな
い対の情報がある場合、該当する符号系と文字列の対の
情報をリストから読み出し、符号系を変数codeに設
定し、文字列を変数textに設定する(ステップ9
4)。図7に示したリストが得られた上記例の場合、最
初、変数codeには「日本語EUC」がセットされ、
変数textには、文字列“各言語に対してその言語の
特徴を形式的に記述した「言語モデル」”がセットされ
る。
【0053】最尤結果選択部12は、上記文字列変数t
extを言語識別制御部18に供給し、文字列“各言語
に対してその言語の特徴を形式的に記述した「言語モデ
ル」”に対する尤度の計算を開始させる(ステップ9
6)。言語識別部10は、図8を参照した上記説明に従
って得られた尤度と言語の対の情報、即ち、文字列“各
言語に対してその言語の特徴を形式的に記述した「言語
モデル」”対し得られた最大の尤度の値−6.2と、最
大の尤度に対応する言語である日本語の対の情報を最尤
結果選択部12に返す。
【0054】最尤結果選択部12は、日本語EUCの復
号結果文字列に対し得られた尤度−6.2を記憶してい
る最大尤度Smaxと比較し(ステップ98)、得られ
た尤度の方がSmaxよりも大きいので、得られた尤度
−6.2をSmaxに代入し、更に、最大の尤度に対応
する文字列“各言語に対してその言語の特徴を形式的に
記述した「言語モデル」”をTmaxにセットする(ス
テップ100)。
【0055】最尤結果選択部12は、ステップ92に戻
り、未だ処理していない別の符号系と文字列の対の情報
があるかどうかを判定する。上記例の場合、図7の第2
行目に示したように、韓国語EUCと、それに対応する
文字列の対の情報があるので、符号系と文字列をセット
して(ステップ94)、言語識別部10による尤度計算
処理を開始させる(ステップ96)。韓国語EUCの復
号結果の文字列に対する尤度計算によって、図9の右側
に示したような尤度−9.8が得られる。
【0056】最尤結果選択部12は、韓国語EUCの復
号結果文字列に対し得られた尤度−9.8を記憶してい
る最大尤度Smax=−6.2と比較し(ステップ9
8)、得られた尤度よりもSmaxの方が大きいのでス
テップ92に戻る。ステップ92において、最尤結果選
択部12は、未だ処理していない別の符号系と文字列の
対の情報があるかどうかを判定する。上記例の場合、図
7の第3行目に示したように、Latin1と、それに
対応する文字列の対の情報があるので、符号系と文字列
をセットして(ステップ94)、言語識別部10による
尤度計算処理を開始させる(ステップ96)。
【0057】言語識別制御部18は、符号系がLati
n1の場合、識別可能な言語として、上記日本語EUC
の識別の際に利用した日本語、中国語、韓国語及び英語
の他に、例えば、イタリア語を追加して識別処理を行な
う。これにより、Latin1の復号結果の文字列に対
する尤度計算によって、図7の第3行目に記載した文字
列に対しイタリア語の文字列である尤度−9.8が得ら
れ、この尤度はLatin1の文字列に対し識別可能な
言語の中で最大の尤度である。
【0058】最尤結果選択部12は、Latin1の復
号結果文字列に対し得られた尤度−9.8を記憶してい
る最大尤度Smax=−6.2と比較し(ステップ9
8)、得られた尤度よりもSmaxの方が大きいのでス
テップ92に戻る。最尤結果選択部12は、未だ処理し
ていない別の符号系と文字列の対の情報があるかどうか
を判定し(ステップ92)、全ての情報が処理されてい
るので、現在Tmaxに設定されている文字列、即ち、
日本語EUCの復号結果の文字列“各言語に対してその
言語の特徴を形式的に記述した「言語モデル」”を最尤
結果として選択し、出力装置6へ送出し(ステップ10
2)、処理を終了する。
【0059】上記の如く、図7に示した各符号系の文字
列に対する言語識別結果として、
【0060】
【表1】
【0061】が得られるので、全ての符号系の文字列に
対する言語識別処理後の最大の尤度は日本語EUCに対
応する尤度−6.2である。これにより、上記入力符号
列: b3c6 b8c0 b8ec a4cb c2d0 a4b7 a4c6 a4bd a4ce b8c0 b8ec a4ce c6c3 c4a7 a4f2 b7c1 bcb0 c5aa a4cb b5ad bdd2 a4b7 a4bf a1d6 b8c0 b8ec a5e2 a5c7 a5eb a1d7 0a00 に対する復号結果のテキストとして日本語EUCの復号
結果である文字列:“各言語に対してその言語の特徴を
形式的に記述した「言語モデル」”が出力される。
【0062】上記例では、最尤結果選択部12は、最大
の尤度を有する符号系の文字列を最終的な結果として出
力している。しかし、最尤結果選択部12は、言語識別
制御部18から得られた言語名と尤度の対の情報の中か
ら最大の尤度を有する情報を選択した後、得られた最大
の尤度を所定の閾値と比較し、所定の閾値を超える場
合、最大の尤度に対応する文字列を最終的な復号結果と
して出力してもよい。
【0063】図11は、本発明の他の実施例のデータ通
信ネットワーク装置の概要図である。上記データ通信ネ
ットワーク装置は、データ通信ネットワーク100と;
上記データ通信ネットワーク100に接続され、文字と
文字コードの対応を表わす符号系によって通信文を符号
化して送信する送信装置102と;上記データ通信ネッ
トワーク100に接続された受信装置104とからな
る。上記受信装置104は、上記送信装置102から送
信された上記通信文の符号列を受信する通信部112
と、符号列を所定の符号系に従って復号する復号部11
4と、所定の符号系に従う復号結果の文字列が所定の言
語の文字列である尤度を計算する言語識別部116と、
尤度の結果に従って上記通信文の符号化に用いられた符
号系を判定し、上記判定された符号系による復号結果の
文字列を元の通信文のテキストの復号結果として出力す
る最尤結果選択部118とからとからなる。
【0064】上記復号部114は、所定の符号系の組の
中の符号系を用いて上記符号列を復号し、適当な文字列
が得られた符号系を選択し、上記選択された符号系と、
上記選択された符号系による復号により得られた文字列
の対を表わす情報の組を得る。
【0065】上記言語識別部116は、上記得られた情
報の各組の上記選択された符号系によって表わされる各
言語に対し、上記復号結果の文字列の所定の言語の文字
列としての尤もらしさを表わす尤度を評価する。上記最
尤結果選択部118は、上記復号手段に接続され、上記
復号手段から得られた情報の組の中の上記文字列を上記
言語識別手段に供給し、上記言語識別手段を作動させ、
上記言語識別手段から得られた上記評価された尤度に応
じて、上記入力された符号列を復号する言語と、上記言
語による復号結果の文字列を選択する。
【0066】本発明の他の実施例のデータ通信ネットワ
ーク装置は、本発明のテキストの最尤復号方法及び最尤
復号装置の原理に基づいて構築されているので、データ
通信ネットワークを介して通信される符号化された通信
文を受信装置側で正確に復号することが可能になる。
【0067】
【発明の効果】上記の本発明のテキストの最尤復号方法
及び最尤復号装置によれば、入力符号列に対し、多数の
符号系の候補の中から入力符号列の符号化に利用された
符号系をより高い確度で選択することができるので、入
力符号列の復号化の際に誤りの低減した復号結果を得る
ことができるようになる。
【0068】更に、本発明のテキストの最尤復号方法及
び最尤復号装置によれば、入力符号列の符号化の際に利
用された符号系を符号列に基づいて自動的に判定するこ
とができるようになるので、ネットワークを介した通信
を行なう際に送信側で符号系を通知する必要がなくなる
ので、ネットワークを介した通信の際の制約が低減され
る利点がある。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の原理構成図である。
【図3】本発明の一実施例のテキスト復号装置の概要図
である。
【図4】本発明の一実施例のテキスト復号装置の動作を
示すフローチャートである。
【図5】本発明の一実施例による復号部の動作フローチ
ャートである。
【図6】本発明の一実施例による復号部の構成図であ
る。
【図7】復号部の復号結果文字列の説明図である。
【図8】本発明の一実施例の言語識別部の動作フローチ
ャートである。
【図9】復号結果の文字列の各文字の所定の言語におけ
る出現確率の説明図である。
【図10】本発明の一実施例の最尤結果選択部の動作フ
ローチャートである。
【図11】本発明の他の実施例のデータ通信ネットワー
ク装置の概要図である。
【符号の説明】
2 入力装置 4 テキスト復号部 6 出力装置 8 復号部 10 言語識別部 12 最尤結果選択部 14 復号制御部 16 個別符号系復号部 18 言語識別制御部 20 言語尤度計算部 22 言語モデル保持部
フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06F 5/00 G06F 17/21 H03M 7/00

Claims (15)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字に対応した文字コードからなる符号
    列を上記文字と上記文字コードの対応を表わす符号系に
    よってテキストに復号する方法において、 上記符号列を入力する段階と;所定の符号系の組の中か
    ら上記入力された符号列を復号し得る上記符号系を選択
    し、上記選択された符号系と、上記選択された符号系に
    よる上記符号列の復号により得られた復号結果の文字列
    の対を表わす情報の組を得る段階と;所定の言語に対
    し、上記復号結果の文字列の上記言語の文字列としての
    尤もらしさを表わす尤度を評価する段階と;上記評価さ
    れた尤度に応じて、上記入力された符号列を復号する言
    語と、上記言語による復号結果の文字列を選択する段階
    と;上記選択された文字列に対応するテキストを出力す
    る段階とからなるテキストの最尤復号方法。
  2. 【請求項2】 上記復号結果の文字列は上記符号列の符
    号の中で復号に成功した文字からなる請求項1記載のテ
    キストの最尤復号方法。
  3. 【請求項3】 上記選択された符号系は上記符号列の中
    の全ての符号を復号し得た符号系である請求項1記載の
    テキストの最尤復号方法。
  4. 【請求項4】 上記各言語としての尤度を評価する段階
    は:上記復号結果の文字列の中の各文字の上記各言語に
    おける出現確率を上記文字列の全体に亘って集計するこ
    とにより上記尤度を評価する段階を有する請求項1乃至
    3のうちいずれか1項記載のテキストの最尤復号方法。
  5. 【請求項5】 上記出現確率は、上記言語で表された多
    数のテキストからなるコーパスにおいて、夫々の文字の
    全文字に対する相対頻度によって表わされる請求項4記
    載のテキストの最尤復号方法。
  6. 【請求項6】 上記文字列を選択する段階は:上記尤度
    を評価する段階で得られた尤度の中で最大の尤度を選択
    し、上記最大の尤度に対応する上記言語と、上記言語に
    よる復号結果の文字列とを選択する段階を更に有する請
    求項1乃至3のうちいずれか1項記載のテキストの最尤
    復号方法。
  7. 【請求項7】 文字に対応した文字コードからなる符号
    列を生成する入力手段と;上記入力手段に接続され、上
    記入力手段から上記符号列を受け、上記文字と上記文字
    コードの対応を表わす符号系によってテキストに復号す
    るテキスト復号手段と;上記テキスト復号手段に接続さ
    れ、上記テキスト復号手段から受けた上記復号されたテ
    キストを出力する手段とからなるテキストの復号装置に
    おいて、 上記テキスト復号手段は:所定の符号系の組の中の上記
    符号系を用いて上記入力手段から受けた上記符号列を復
    号し、上記所定の符号系の組の中から適当な文字列が得
    られた符号系を選択し、上記選択された符号系と、上記
    選択された符号系による復号によって得られた文字列の
    対を表わす情報の組を得る復号手段と;所定の言語に対
    し、上記復号結果の文字列の上記言語の文字列としての
    尤もらしさを表わす尤度を評価する言語識別手段と;上
    記復号手段に接続され、上記復号手段から得られた情報
    の組の中の上記文字列を上記言語識別手段に供給し、上
    記言語識別手段を作動させ、上記言語識別手段によって
    評価された上記尤度に応じて、上記入力された符号列を
    復号する言語と、上記言語による復号結果の文字列を選
    択する最尤結果選択手段とを更に有するテキストの最尤
    復号装置。
  8. 【請求項8】 上記復号手段は:上記符号系に対応し、
    上記符号系を用いて上記符号列を上記文字列に復号する
    少なくとも一つの個別符号系復号手段と;上記少なくと
    も一つの個別符号系復号手段に接続され、上記少なくと
    も一つの個別符号系復号手段を作動させ、上記作動され
    た個別符号系復号手段によって得られた上記文字列を受
    け、上記所定の符号系の組の中で適当な上記文字列が得
    られた符号系を選択し、上記選択された符号系と、上記
    選択された符号系による復号結果の文字列の対を表わす
    情報の組を得る復号制御手段とを更に有する請求項7記
    載のテキストの最尤復号装置。
  9. 【請求項9】 上記言語識別手段は:上記各言語の特徴
    データを格納する言語モデル保持手段と;上記文字列と
    上記言語を表わす情報を受け、上記言語モデル保持手段
    から上記言語に対応する上記特徴データを受け、上記文
    字列の上記言語の文字列としての尤度を評価する言語尤
    度計算手段と;上記最尤結果選択手段と上記言語尤度計
    算手段とに接続され、上記最尤結果選択手段から上記文
    字列を受け、上記文字列の上記言語の文字列としての尤
    度を得るため上記文字列と上記言語を表わす情報を上記
    言語尤度計算手段に供給して上記言語尤度計算手段を作
    動し、上記言語尤度計算手段から評価された尤度を受
    け、上記言語を表わす情報と、上記文字列の上記言語の
    文字列としての尤度を上記最尤結果選択手段に送出する
    言語識別制御手段とを更に有する請求項7又は8記載の
    テキストの最尤復号装置。
  10. 【請求項10】 上記復号結果の文字列は上記符号列の
    符号の中で復号に成功した文字からなる請求項7乃至9
    のうちいずれか1記載のテキストの最尤復号装置。
  11. 【請求項11】 上記選択された符号系は上記符号列の
    中の全ての符号を復号し得た符号系である請求項7乃至
    9のうちいずれか1記載のテキストの最尤復号装置。
  12. 【請求項12】 上記言語尤度計算手段は:上記復号結
    果の文字列の中の各文字の上記各言語における出現確率
    を上記文字列の全体に亘って集計することにより上記尤
    度を評価する請求項9乃至11のうちいずれか1項記載
    のテキストの最尤復号装置。
  13. 【請求項13】 上記出現確率は、上記言語で表された
    多数のテキストからなるコーパスにおいて、夫々の文字
    の全文字に対する相対頻度によって表わされる請求項1
    2記載のテキストの最尤復号装置。
  14. 【請求項14】 上記最尤結果選択手段は:上記言語識
    別手段から得られた尤度の中で最大の尤度を選択し、上
    記最大の尤度に対応する上記言語と、上記言語による復
    号結果の文字列とを選択する請求項7乃至9のうちいず
    れか1項記載のテキストの最尤復号装置。
  15. 【請求項15】 データ通信ネットワークと;上記デー
    タ通信ネットワークに接続され、文字と文字コードの対
    応を表わす符号系によって通信文を符号化して送信する
    第1の装置と;上記データ通信ネットワークに接続さ
    れ、上記第1の装置から送信された上記通信文の符号列
    を受信する手段と、上記通信文の符号化に用いられた符
    号系を判定し、上記判定された符号系によって上記通信
    文をテキストに復号するテキスト復号手段とからなる第
    2の装置とを有するデータ通信ネットワーク装置であっ
    て、 上記第2の装置のテキスト復号手段は:所定の符号系の
    組の中の符号系を用いて上記符号列を復号し、適当な文
    字列が得られた符号系を選択し、上記選択された符号系
    と、上記選択された符号系による復号により得られた文
    字列の対を表わす情報の組を得る復号手段と;所定の言
    語に対し、上記復号結果の文字列の上記言語の文字列と
    しての尤もらしさを表わす尤度を評価する言語識別手段
    と;上記復号手段に接続され、上記復号手段から得られ
    た情報の組の中の上記文字列を上記言語識別手段に供給
    し、上記言語識別手段を作動させ、上記言語識別手段に
    よって評価された上記尤度に応じて、上記入力された符
    号列を復号する言語と、上記言語による復号結果の文字
    列を選択する最尤結果選択手段とを更に有する、データ
    通信ネットワーク装置。
JP01579296A 1996-01-31 1996-01-31 テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置 Expired - Lifetime JP3203544B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP01579296A JP3203544B2 (ja) 1996-01-31 1996-01-31 テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01579296A JP3203544B2 (ja) 1996-01-31 1996-01-31 テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置

Publications (2)

Publication Number Publication Date
JPH09212334A JPH09212334A (ja) 1997-08-15
JP3203544B2 true JP3203544B2 (ja) 2001-08-27

Family

ID=11898697

Family Applications (1)

Application Number Title Priority Date Filing Date
JP01579296A Expired - Lifetime JP3203544B2 (ja) 1996-01-31 1996-01-31 テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置

Country Status (1)

Country Link
JP (1) JP3203544B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4862079B2 (ja) * 2006-05-31 2012-01-25 サイトリックス システムズ, インコーポレイテッド ゲートウェイでのリクエスト提出復号用文字セット符号化決定のためのシステムおよび方法
CN104516862B (zh) 2013-09-29 2018-05-01 北大方正集团有限公司 一种选择读取目标文档的编码格式的方法及其系统
CN104361021B (zh) * 2014-10-21 2018-07-24 小米科技有限责任公司 网页编码识别方法及装置

Also Published As

Publication number Publication date
JPH09212334A (ja) 1997-08-15

Similar Documents

Publication Publication Date Title
CN110097085B (zh) 歌词文本生成方法、训练方法、装置、服务器及存储介质
CN1667699B (zh) 为字母-声音转换生成有互信息标准的大文法音素单元
CN111523306A (zh) 文本的纠错方法、装置和系统
US7925495B2 (en) System and method for distributing multilingual documents
CN111739514B (zh) 一种语音识别方法、装置、设备及介质
CN110895651A (zh) 地址标准化处理方法、装置、设备及计算机可读存储介质
CN108959388B (zh) 信息生成方法及装置
CN111539199A (zh) 文本的纠错方法、装置、终端、及存储介质
CN114528394B (zh) 一种基于掩码语言模型的文本三元组提取方法及装置
CN111782892B (zh) 基于前缀树的相似字符识别方法、设备、装置和存储介质
CN111680512A (zh) 命名实体识别模型、电话总机转接分机方法及系统
CN112800737B (zh) 自然语言文本生成方法和装置以及对话系统
CN115658898A (zh) 一种中英文本实体关系抽取方法、系统及设备
CN115034194A (zh) 一种摘要生成方法及相关装置
JP3203544B2 (ja) テキスト最尤復号方法及び最尤復号装置と、データ通信ネットワーク装置
CN111159394A (zh) 一种文本摘要生成方法和装置
CN111460109A (zh) 摘要及对话摘要生成方法和装置
CN112686030A (zh) 语法纠错方法、装置、电子设备和存储介质
EP1129537A1 (en) Processing received data in a distributed speech recognition process
JP2000148754A (ja) マルチリンガル・システム,マルチリンガル処理方法およびマルチリンガル処理のプログラムを記憶した媒体
JP3080066B2 (ja) 文字認識装置、方法及び記憶媒体
JP4718699B2 (ja) 文字認識装置、文字認識方法、プログラム、およびコンピュータ読み取り可能な記録媒体
CN104641367A (zh) 用于格式化电子字符序列的格式化模块、系统和方法
CN113220853B (zh) 一种法律提问自动生成方法及系统
CN115146630B (zh) 基于专业领域知识的分词方法、装置、设备及存储介质

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090629

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100629

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110629

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120629

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130629

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140629

Year of fee payment: 13

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term