JP3622841B2 - Kana-kanji conversion device and kana-kanji conversion method - Google Patents

Kana-kanji conversion device and kana-kanji conversion method Download PDF

Info

Publication number
JP3622841B2
JP3622841B2 JP2000304102A JP2000304102A JP3622841B2 JP 3622841 B2 JP3622841 B2 JP 3622841B2 JP 2000304102 A JP2000304102 A JP 2000304102A JP 2000304102 A JP2000304102 A JP 2000304102A JP 3622841 B2 JP3622841 B2 JP 3622841B2
Authority
JP
Japan
Prior art keywords
kana
character string
kanji
dictionary
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000304102A
Other languages
Japanese (ja)
Other versions
JP2002117025A (en
Inventor
敏久 田代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Priority to JP2000304102A priority Critical patent/JP3622841B2/en
Publication of JP2002117025A publication Critical patent/JP2002117025A/en
Application granted granted Critical
Publication of JP3622841B2 publication Critical patent/JP3622841B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、かな漢字変換装置およびかな漢字変換方法に関し、より詳細には、コンピュータ・システムに日本語を入力するために使用されているかな漢字変換装置およびかな漢字変換方法に関する。
【0002】
【従来の技術】
日本語の文字列を入力する装置として、キーボードから入力したい漢字列に対応するかな文字列を入力し、漢字変換キーの入力に応答して、かな文字列をかな漢字文字列に変換するパーソナル・コンピュータやワード・プロセッサなどのかな漢字変換装置が従来から知られている。この装置に入力したかな文字列をかな漢字文字列に変換する場合は、漢字変換用の特定の1つまたは複数のキーを組み合わせて押下し、かな漢字文字列の候補を表示する。また、連続して候補を表示することも可能であり、この場合直前の候補を呼び出すときは、前候補キーを押下するなどして、文章を入力することができる。かな文字列をカタカナ文字列に変換する場合や、ローマ字文字列に変換する場合も、上記と同様の手順で行われる。
【0003】
入力された文字列についてかな漢字変換を行うかな漢字変換装置では、文字列に対応する漢字を決定するのに、形態素や各フレームの解析情報を参照することによって、変換精度を高めている。ここで、形態素とは、一つ以上の音素からなる意味をもった最小の言語単位をいい、形態素解析では、文字列に含まれている形態素の切れ目を認識し、および形態素の品詞を認定する。
【0004】
また、格フレーム解析では、文字列に含まれている単語間の意味的な結合関係を「格文法」の考え方によって表現する。
【0005】
従来のかな漢字変換装置では、上述のような品詞に基く形態素解析と、格フレーム解析とを用いている場合が多い。
【0006】
【発明が解決しようとする課題】
しかし、上述した従来のかな漢字変換方式では、正確に変換することが難しい言語現象も存在する。また、従来のかな漢字変換方式の場合、特殊な語彙や表現についてもできる限り楽に変換できるように、文字列に対応する表現を広く認めると、そのような特殊な用語を使用しないユーザにとっては、不可解な単語の連続や、共起関係が薄い同音類義語の誤変換/学習等の副作用が生じるという問題があった。
【0007】
一方、音声認識システムにおいて使用されている言語モデルとして、トライグラムが知られている。このトライグラムでは、品詞に基く形態素解析や、格フレームでは正確に変換できないような言語現象にも対応出来るというメリットがある。
【0008】
しかし、トライグラムの計算量は極めて大きいので、かな漢字変換のような高速性が要求されるシステムにトライグラムをそのまま応用することは非常に困難であるという問題があった。
【0009】
本発明はこのような問題に鑑みてなされたものであり、その目的とするところは、従来のかな漢字変換において生じていた誤変換等の副作用を抑制することができるかな漢字変換装置およびかな漢字変換方法を提供することにある。
【0010】
【課題を解決するための手段】
本発明は、このような目的を達成するために、請求項1に記載の発明は、かな漢字変換の候補となる文字および該文字の優先度を記述する辞書、2つの品詞の接続の優先度を記述する品詞の接続表、文字列の中に含まれる語句の他の語句に対する意味的関係を記述する格フレーム辞書、および実際のテキストを含むテキストコーパスの中に単語のN(N≧3)個の連鎖が出現する確率を記述するNグラムデータを記憶する記憶装置と、該記憶装置に記憶された前記辞書、前記品詞の接続表、前記格フレーム辞書、および前記Nグラムデータに基づいて、入力装置から入力されたかな文字列をかな漢字文字列に変換するデータ処理装置とを備えたかな漢字変換装置であって、前記データ処理装置は、入力された前記かな文字列にマッチする前記文字を前記辞書から抽出する辞書引き手段と、前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記辞書引き手段により抽出された前記文字を組み合わせて、可能性が所定の基準以上であるかな漢字文字列の第1の候補を作成する形態素解析手段と、前記格フレーム辞書に基づき、前記第1の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えて、第2の候補を作成する格フレーム解析手段と、前記単語のN個の連鎖が出現する確率に基づいて、前記第2の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えるNグラム解析手段とを備えたことを特徴とする。
【0011】
また、請求項2に記載の発明は、請求項1に記載のかな漢字変換装置において、前記記憶装置は、ローマ字に対応するかな文字を記述するローマ字かな変換表を記憶し、前記データ処理装置は、前記入力装置から入力されたローマ字をローマ字かな変換表に基づいて前記かな文字列に変換するローマ字かな変換手段を備え、前記辞書引き手段は、前記ローマ字かな変換手段によって変換された前記かな文字列にマッチする前記文字を前記辞書から抽出することを特徴とする。
【0012】
また、請求項3に記載の発明は、記憶装置に記憶された、かな漢字変換の候補となる文字および該文字の優先度を記述する辞書、2つの品詞の接続の優先度を記述する品詞の接続表、文字列の中に含まれる語句の他の語句に対する意味的関係を記述する格フレーム辞書、および実際のテキストを含むテキストコーパスの中に単語のN(N≧3)個の連鎖が出現する確率を記述するNグラムデータに基づいて、入力装置から入力されたかな文字列をかな漢字文字列に変換するかな漢字変換方法であって、入力された前記かな文字列にマッチする前記文字を前記辞書から抽出する辞書引きステップと、前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記辞書引きステップにおいて抽出された前記文字を組み合わせて、可能性が所定の基準以上であるかな漢字文字列の第1の候補を作成する形態素解析ステップと、前記格フレーム辞書に基づき、前記第1の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えて、第2の候補を作成する格フレーム解析ステップと、前記単語のN個の連鎖が出現する確率に基づいて、前記第2の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えるNグラム解析ステップとを備えることを特徴とする。
【0013】
さらに、請求項4に記載の発明は、請求項3に記載のかな漢字変換方法であって、前記記憶装置は、ローマ字に対応するかな文字を記述するローマ字かな変換表を記憶し、前記入力装置から入力されたローマ字をローマ字かな変換表に基づいて前記かな文字列に変換するローマ字かな変換ステップを備え、前記辞書引きステップは、前記ローマ字かな変換ステップにおいて変換された前記かな文字列にマッチする前記文字を前記辞書から抽出することを特徴とする。
【0014】
この方法によれば、極度に長い時間および大きなディスク容量を必要とせずに、かな漢字変換の精度を上げることができる。
【0015】
【発明の実施の形態】
以下に、図面を参照し、本発明の実施の形態について詳細に説明する。
【0016】
図1は、本実施形態に係るかな漢字変換装置の機能ブロック図である。
図1の例に示すように、本実施形態のかな漢字変換装置は、入力装置101と、表示装置103と、データ処理装置105と、記憶装置117とを備えいる。入力装置101は、かな漢字変換をするためのかな文字列を入力したり、変換、確定等の各種指示を行うためのキーボード等によって構成される。
【0017】
表示装置103は、具体的にはCRTやLCD等によって構成され、入力装置101によって入力される文字列等が表示される。
【0018】
データ処理装置105は、中央演算処理装置(CPU)においてコンピュータ・プログラムを構成する命令の読みだし、および実行を行う基本処理装置(BPU)や制御装置によって構成されており、ローマ字かな変換手段107と、辞書引き手段109と、形態素解析手段111と、格フレーム解析手段113と、トライグラム解析手段115とによって構成されている。
【0019】
ローマ字かな変換手段107は、外部から入力されたローマ字をかな文字、すなわちひらがなまたはカタカナに変換する処理を行なう。辞書引き手段109は、かな漢字変換を行うことを目的としてかな漢字変換装置に記憶されている辞書から、ローマ字かな変換手段107により変換されたかな文字の読みに対応する漢字を見つけ出す。
【0020】
なお、入力装置101から、かな文字が直接入力された場合には、ローマ字かな変換手段107による処理を経ることなく辞書引き手段109による処理が行われることとなる。入力装置101からローマ字が入力されるか、あるいはかな文字が入力されるかは、かな漢字変換装置における、文字の入力モードによって決定される。
【0021】
形態素解析手段111は、入力された文字列をかな漢字混じりの文字列、すなわちかな漢字文字列に変換した場合に含まれる単語について、品詞の接続情報および語の優先順位を用いて各単語間のつながり安さを判定する。格フレーム解析手段113は、動詞とその主語、目的語との関係に基づいて、かな漢字混じりの文字列の候補についてより意味的に正しいと思われる順に文字列の候補の優先順位を変更する。
【0022】
トライグラム解析手段115は、テキストコーパスから抽出した3つの単語の組み(トライグラム)を用いて、格フレーム解析手段113により順位付けされた文字列の候補を改めて並べ替える。
【0023】
記憶装置117は、データを格納するための主記憶装置等によって構成されており、本発明に関係し、CPUによってアクセスされるデータが記憶されている。本実施形態において、記憶装置117には、かな漢字変換において参照されるデータとして、ローマ字かな変換表119、辞書121、品詞の接続表123、格フレーム辞書125、およびトライグラムデータ127が記憶されている。
【0024】
また、記憶装置117の図示しない領域には、入力された文字列や検索された漢字の候補、データ処理装置105を含むCPUによって実行されるコンピュータ・プログラムの実行命令が格納されている。そして、CPUはこの内容を直接アクセスして命令やデータをレジスタに入れ、プログラムの実行やデータに対する操作、あるいはデータに基づく操作を行うことができる。
【0025】
図2〜図6は、「ほんをに、さんさつよんだ」という文字列について、本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。以下、本実施形態に係るかな漢字変換装置の動作について説明する。
【0026】
まず、図2において、入力装置107から「honwoni,sannsatuyonda」というローマ字が入力されると、ローマ字かな変換手段107は、ローマ字の読みに対応するひらがなを選択する。ローマ字かな変換手段119は、ローマ字かな変換表119を参照し、
ho → ほ
n → ん
wo → を
などの対応関係から、「ほんをに、さんさつよんだ」というひらがな列を作成する。
【0027】
次に、辞書引き手段109が、このようにして変換されたひらがな列の読みにマッチする文字列を辞書121から抽出する。具体的には、「ほ」という読みに対応する語として「穂」、「歩」、「帆」、「ほ」を、「ほん」という読みに対応する語として「本」、「翻」という文字が抽出されており、この処理はひらがな列の終端まで続けられる。
【0028】
続いて、図4に示すように、形態素解析手段111が、辞書引き手段109によって見つけ出された語の集合について、品詞の接続表123に基づき、漢字を含む文字列の候補を作成し、各候補に優先順位を付ける。本実施形態において、文字列の候補は、辞書121に含まれている語の各々に付与されている優先度、および品詞の接続表123において、品詞の接続の種類毎に付与されている優先度を合計し、その合計点数の低い文字列が優先されるように順位付けがなされている。
【0029】
たとえば、「本を似、三冊呼んだ」という文字列の場合は、辞書121に基づいて、
(本)+(を)+(似)+(、)+(三)+(冊)+(呼)+(んだ)
という点数計算が行われ、単語の優先度として
10+5+10+5+10+2+20+5=85点
という点数が算出される。また、この文字列は、
名詞−助詞−一段活用動詞−読点−数詞−助数詞−バ行五段活用−語尾
という品詞の接続からなるため、品詞の接続表121に基づいて、
(名詞−助詞)+(助詞−一段活用助詞)+(一段活用助詞−読点)+(読点−数詞)+(数詞−助数詞)+(助数詞−バ行五段活用)+(バ行五段活用−語尾)
という点数計算が行われ、品詞の接続による優先度として、
30+20+30+40+10+40+30=200点
という点数が得られる。そして、単語の優先度と品詞の接続による優先度を合計し、優先度は285点と計算される。
【0030】
同様の計算を行うことにより、「本を似、三冊読んだ」というかな漢字文字列について290点、「本を二、三冊呼んだ」について295点、「本を二、三冊読んだ」というかな漢字文字列について300点という点数が算出される。したがって、これら4つの候補の優先順位は、
1.本を似、三冊呼んだ
2.本を似、三冊読んだ
3.本を二、三冊呼んだ
4.本を二、三冊読んだ
となる。そして、優先度を示す点数がある基準値以上の場合は、つながりにくい候補、すなわち可能性の低い候補として除外される。たとえば「翻を似、三冊呼んだ」など、他にも種々の語の組み合わせが可能であるが、このようなかな漢字文字列については、計算の結果優先度の点数が高くなるため、候補から除外される。
【0031】
続いて、図5に示すように、上述したように優先順位がつけられ絞込みが行われた候補について、格フレーム解析手段113が並べ替えを行う。格フレーム解析手段113は、格フレーム辞書125を参照し、以下のような判断処理を行う。
【0032】
たとえば、格フレーム辞書125によれば、「読」という語の前に「が」という助詞が位置する場合、主格が人であればその文字列は意味的に正しいと判断される。また、「を」という助詞が「読」の前に位置する場合、対象格が「本」であれば意味的に正しいと判断される。同様に、「呼」という語の前に「が」という助詞が位置する場合は主格が「人」である場合、また「を」が位置する場合は対象格が人である場合に意味的に正しいと判断される。従って、格フレーム解析手段113では、「本を似、三冊読んだ」および「本を二、三冊読んだ」といった候補の方が「本を似、三冊呼んだ」および「本を二、三冊呼んだ」よりもふさわしい、すなわち意味的に正しいものと判断され、優先順位は高くなる。
【0033】
このような順位付けによる結果、優先順位は
1.本を似、三冊読んだ
2.本を二、三冊読んだ
3.本を似、三冊呼んだ
4.本を二、三冊呼んだ
となる。
【0034】
続いて、トライグラム解析手段115がトライグラムデータ127を参照し、図6に示すように、格フレーム解析手段113によって順位付けされた候補の並べ替えを行う。
【0035】
トライグラムデータ127には、3個の単語の連鎖がテキストに出現する確率が記述されており、この確率は、実際のテキストコーパスから作成される。すなわち、トライグラムデータ127は、実際のテキストコーパスに含まれている大量のテキストのデータについて、当該テキストを単語毎に区切り、3個の連語が出現する確率を求めることにより作成される。
【0036】
トライグラムデータ127を参照した場合、「二」「、」「三」という語の並びが出現する確率が高い(言い換えれば、現実のテキストの中には、「二」「、」「三」という語の並びが多い)ので、「二」「、」「三」という単語の連鎖を多く含む候補が優先されるように文字列の候補が並べ替えられることとなる。なお、図6に示す例では、たとえば「似」「、」「三」という単語の並び等の、極めて確率の低い単語の連鎖については省略されている。
【0037】
したがって、トライグラム解析手段115による優先順位の並べ替えの結果は、
1.本を二、三冊読んだ
2.本を二、三冊呼んだ
3.本を似、三冊読んだ
4.本を似、三冊呼んだ
となる。
【0038】
以下、本実施形態に係るかな漢字変換装置を使用した実験の結果を記す。
【0039】
一回のかな漢字変換処理で文字列に含まれる文字が正しい文字に変換される確率(以下、char rateという)が94.09%、一回のかな漢字変換処理で文字列全体が正しい文字列に変換される確率(以下、sentence rateという)が46.05%である従来のかな漢字変換処理装置について、百数十MBの実際のテキストコーパスに基づいて作成した約80MBのトライグラムデータを使用したトライグラムによる解析処理を適用した結果、char rateは95.03%、sentence rateは52.68%であった。すなわち、文字単位においても、文単位においても、一回の変換処理で正しい文字列に変換される確率が上昇することが確認された。
【0040】
以上、本発明の好適な実施形態について説明したが、本発明はこれに限られず、他の種々の形態で実施することが可能である。
【0041】
たとえば、上述の実施形態では、実際のテキストコーパスに含まれるテキスト中に、3個の単語の連鎖が出現する確率を記述するトライグラムデータを作成することとしたが、単語の連鎖の数は3個に限定されず、任意のN(N≧2)個の単語の連鎖であってもよい。この場合、かな漢字変換装置の記憶装置には、N個の単語の連鎖がテキストコーパスに出現する確率を記述するNグラムデータが記憶される。すなわち、Nグラムデータは、実際のテキストコーパスに含まれている大量のテキストのデータについて、当該テキストを単語毎に区切り、N個の連語が出現する確率を求めることにより作成される。
【0042】
そして、上述の実施形態におけるトライグラム解析手段に代えて、Nグラム解析手段がNグラムデータを参照し、格フレーム解析手段により並べ替えられた文字列の候補の優先順位をさらに並べ替えることとなる。
【0043】
【発明の効果】
以上説明したように、本発明によれば、かな漢字変換の候補となる文字および該文字の優先度を記述する辞書、2つの品詞の接続の優先度を記述する品詞の接続表、文字列の中に含まれる語句の他の語句に対する意味的関係を記述する格フレーム辞書、および実際のテキストを含むテキストコーパスの中に単語のN(N≧2)個の連鎖が出現する確率を記述するNグラムデータを記憶する記憶装置と、該記憶装置に記憶された前記辞書、前記品詞の接続表、前記格フレーム辞書、および前記Nグラムデータに基づいて、入力装置から入力されたかな文字列をかな漢字文字列に変換するデータ処理装置とを備えたかな漢字変換装置であって、前記データ処理装置は、入力された前記かな文字列にマッチする前記文字を前記辞書から抽出する辞書引き手段と、前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記辞書引き手段により抽出された前記文字を組み合わせて、可能性が所定の基準以上であるかな漢字文字列の第1の候補を作成する形態素解析手段と、前記格フレーム辞書に基づき、前記第1の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えて、第2の候補を作成する格フレーム解析手段と、前記単語のN個の連鎖が出現する確率に基づいて、前記第2の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えるNグラム解析手段とを備えたので、従来のかな漢字変換が出力する候補にのみトライグラムを適用することにより、計算量を抑えながら変換精度の向上を図ることができる。
【0044】
また、前記記憶装置は、ローマ字に対応するかな文字を記述するローマ字かな変換表を記憶し、前記データ処理装置は、前記入力装置から入力されたローマ字をローマ字かな変換表に基づいて前記かな文字列に変換するローマ字かな変換手段を備え、前記辞書引き手段は、前記ローマ字かな変換手段によって変換された前記かな文字列にマッチする前記文字を前記辞書から抽出するので、ローマ字入力モードあるいはかな入力モードのいずれにおいても、極度に長い時間および大きなディスク容量を必要とせずに、かな漢字変換の精度を上げることができる。
【図面の簡単な説明】
【図1】本実施形態に係るかな漢字変換装置の機能ブロック図である。
【図2】本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。
【図3】本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。
【図4】本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。
【図5】本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。
【図6】本実施形態に係るかな漢字変換装置によるかな漢字変換の流れを説明するための図である。
【符号の説明】
101 入力装置
103 表示装置
105 データ処理装置
107 ローマ字かな変換手段
109 辞書引き手段
111 形態素解析手段
113 格フレーム解析手段
115 トライグラム解析手段
117 記憶装置
119 ローマ字かな変換表
121 辞書
123 品詞の接続表
125 格フレーム辞書
127 トライグラムデータ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a kana-kanji conversion device and a kana-kanji conversion method, and more particularly to a kana-kanji conversion device and a kana-kanji conversion method used for inputting Japanese into a computer system.
[0002]
[Prior art]
A personal computer that inputs a kana character string corresponding to the kanji character string you want to input from the keyboard as a device for inputting Japanese character strings, and converts the kana character string to a kana kanji character string in response to the input of the kanji conversion key. Conventionally, kana-kanji conversion devices such as word processors are known. In order to convert a kana character string input to this apparatus into a kana-kanji character string, a specific one or more keys for kanji conversion are pressed in combination to display kana-kanji character string candidates. It is also possible to display candidates in succession. In this case, when calling the immediately preceding candidate, it is possible to input a sentence by pressing the previous candidate key or the like. A procedure similar to the above is performed when a kana character string is converted into a katakana character string or when converted into a Roman character string.
[0003]
In a kana-kanji conversion apparatus that performs kana-kanji conversion on an input character string, conversion accuracy is improved by referring to morpheme and analysis information of each frame in order to determine a kanji corresponding to the character string. Here, a morpheme is the smallest linguistic unit that has a meaning consisting of one or more phonemes. In the morpheme analysis, a morpheme break in a character string is recognized and a morpheme part of speech is recognized. .
[0004]
In case frame analysis, a semantic connection relationship between words included in a character string is expressed by the concept of “case grammar”.
[0005]
Conventional Kana-Kanji conversion devices often use morphological analysis based on the part of speech as described above and case frame analysis.
[0006]
[Problems to be solved by the invention]
However, in the conventional Kana-Kanji conversion method described above, there is a language phenomenon that is difficult to convert accurately. In addition, in the case of the traditional Kana-Kanji conversion method, it is inexplicable for users who do not use such special terms if the expressions corresponding to the character strings are widely accepted so that special vocabulary and expressions can be converted as easily as possible. There is a problem that side effects such as incorrect word continuation and erroneous conversion / learning of synonym synonyms with a weak co-occurrence relationship occur.
[0007]
On the other hand, trigrams are known as language models used in speech recognition systems. This trigram has the merit of being able to deal with morphological analysis based on parts of speech and language phenomena that cannot be accurately converted with case frames.
[0008]
However, since the calculation amount of the trigram is extremely large, there is a problem that it is very difficult to apply the trigram as it is to a system that requires high speed such as kana-kanji conversion.
[0009]
The present invention has been made in view of such problems, and an object of the present invention is to provide a kana-kanji conversion apparatus and a kana-kanji conversion method capable of suppressing side effects such as erroneous conversion that have occurred in conventional kana-kanji conversion. It is to provide.
[0010]
[Means for Solving the Problems]
In order to achieve the above object, the present invention provides a dictionary that describes characters that are candidates for kana-kanji conversion and the priority of the characters, and the priority of connection of two parts of speech. A connection table of parts of speech to be described, a case frame dictionary that describes the semantic relationship of words contained in a character string to other words, and N (N ≧ 3) words in a text corpus containing actual text A storage device that stores the N-gram data describing the probability of occurrence of the chain, and the dictionary, the part-of-speech connection table, the case frame dictionary, and the N-gram data stored in the storage device. A kana-kanji conversion device comprising a data processing device for converting a kana character string input from a device into a kana-kanji character string, wherein the data processing device matches the input kana character string Based on the dictionary priority means for extracting characters from the dictionary, the priority of the characters, and the priority of connection of the parts of speech, the priority of the characters and the priority of connection of the parts of speech Based on the case frame dictionary and the first candidate based on the morpheme analysis unit that combines the characters extracted by the subtracting unit to create a first candidate for a kana-kanji character string whose possibility is greater than a predetermined criterion. Based on the case frame analysis means for rearranging the priorities of the candidates for the included Kana-Kanji character strings to create a second candidate, and the probability of occurrence of N chains of the word, the second candidate N-gram analyzing means for rearranging the priorities of the candidates of the included kana-kanji character strings.
[0011]
The invention according to claim 2 is the kana-kanji conversion device according to claim 1, wherein the storage device stores a roman character kana conversion table describing a kana character corresponding to a roman character, and the data processing device includes: Romaji-kana conversion means for converting a Roman character input from the input device into the kana character string based on a Roman-kana conversion table, and the dictionary lookup means converts the Roman character to the kana character string converted by the Roman character-kana conversion means. The matching character is extracted from the dictionary.
[0012]
Further, the invention according to claim 3 is a dictionary that describes characters that are candidates for kana-kanji conversion stored in a storage device and priority of the characters, and connection of parts of speech that describes the priority of connection of two parts of speech. N (N ≧ 3) word chains appear in tables, case frame dictionaries that describe the semantic relationship of words contained in a string to other words, and text corpora containing actual text A kana-kanji conversion method for converting a kana character string input from an input device into a kana-kanji character string based on N-gram data describing a probability, wherein the character that matches the input kana character string is retrieved from the dictionary. a dictionary step for extracting, the priority of the text, based on the priority of the connection of the parts of speech, a combination of the character extracted in the dictionary step, possibly of a predetermined A morphological analysis step of creating a first candidate for the kana-kanji character string is quasi more, based on the rated frame dictionary, rearrange the priority order of the candidate of the kana-kanji character string contained in the first candidate, the A case frame analysis step for generating two candidates, and an N-gram analysis for rearranging the priorities of the kana-kanji character string candidates included in the second candidate based on a probability that N chains of the word appear. And a step.
[0013]
The invention according to claim 4 is the kana-kanji conversion method according to claim 3, wherein the storage device stores a romaji kana conversion table describing kana characters corresponding to romaji, and is stored in the input device. A Romaji-kana conversion step of converting the input Romaji into the Kana character string based on a Romaji-Kana conversion table, wherein the dictionary lookup step matches the Kana character string converted in the Romaji-Kana conversion step. Is extracted from the dictionary.
[0014]
According to this method, the accuracy of kana-kanji conversion can be improved without requiring an extremely long time and a large disk capacity.
[0015]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below in detail with reference to the drawings.
[0016]
FIG. 1 is a functional block diagram of the kana-kanji conversion apparatus according to this embodiment.
As shown in the example of FIG. 1, the kana-kanji conversion device of the present embodiment includes an input device 101, a display device 103, a data processing device 105, and a storage device 117. The input device 101 is configured by a keyboard or the like for inputting a kana character string for kana-kanji conversion, or performing various instructions such as conversion and determination.
[0017]
The display device 103 is specifically composed of a CRT, LCD, or the like, and displays a character string or the like input by the input device 101.
[0018]
The data processing unit 105 includes a basic processing unit (BPU) and a control unit that read and execute instructions constituting a computer program in a central processing unit (CPU). , A dictionary lookup unit 109, a morpheme analysis unit 111, a case frame analysis unit 113, and a trigram analysis unit 115.
[0019]
The Romaji-kana conversion means 107 performs a process of converting a Roman character inputted from the outside into a Kana character, that is, hiragana or katakana. The dictionary lookup unit 109 finds a kanji character corresponding to the reading of the kana character converted by the roman character kana conversion unit 107 from the dictionary stored in the kana-kanji conversion device for the purpose of performing kana-kanji conversion.
[0020]
When a kana character is directly input from the input device 101, the process by the dictionary lookup unit 109 is performed without the process by the Roman character kana conversion unit 107. Whether Roman characters or Kana characters are input from the input device 101 is determined by the character input mode in the Kana-Kanji conversion device.
[0021]
The morpheme analyzing means 111 uses the connection information of the part of speech and the priority of the words for words included when the input character string is converted into a kana-kanji mixed character string, that is, a kana-kanji character string. Determine. The case frame analysis means 113 changes the priority order of the character string candidates in the order that the character string candidates mixed with kana-kanji are considered more semantically correct based on the relationship between the verb and its subject and object.
[0022]
The trigram analyzing unit 115 rearranges the character string candidates ranked by the case frame analyzing unit 113 using a set of three words (trigram) extracted from the text corpus.
[0023]
The storage device 117 is constituted by a main storage device or the like for storing data, and stores data accessed by the CPU in relation to the present invention. In the present embodiment, the storage device 117 stores a Romaji-kana conversion table 119, a dictionary 121, a part-of-speech connection table 123, a case frame dictionary 125, and trigram data 127 as data to be referred to in kana-kanji conversion. .
[0024]
Further, in an area (not shown) of the storage device 117, an input character string, a searched kanji candidate, and an execution instruction of a computer program executed by the CPU including the data processing device 105 are stored. Then, the CPU can directly access the contents and put an instruction or data into a register to execute a program, perform an operation on the data, or perform an operation based on the data.
[0025]
2-6 is a figure for demonstrating the flow of the kana-kanji conversion by the kana-kanji conversion apparatus based on this embodiment about the character string "Hon-san, Sansai-yoda". Hereinafter, the operation of the kana-kanji conversion apparatus according to this embodiment will be described.
[0026]
First, in FIG. 2, when a roman character “honwoni, sanstuyononda” is input from the input device 107, the romaji kana conversion unit 107 selects a hiragana corresponding to the reading of the roman character. The romaji-kana conversion means 119 refers to the romaji-kana conversion table 119,
From a correspondence such as ho → hon → nonwo →, a hiragana string “honsa ni san san sai san” is created.
[0027]
Next, the dictionary lookup unit 109 extracts from the dictionary 121 a character string that matches the reading of the hiragana string thus converted. Specifically, “ho”, “ho”, “sail”, “ho” are words corresponding to the reading “ho”, and “book”, “translation” are words corresponding to the reading “hon”. Characters have been extracted and this process continues until the end of the hiragana string.
[0028]
Subsequently, as shown in FIG. 4, the morpheme analyzing unit 111 creates character string candidates including kanji characters based on the part-of-speech connection table 123 for the set of words found by the dictionary searching unit 109. Prioritize candidates. In this embodiment, the character string candidates are given priority to each of the words included in the dictionary 121, and given priority for each type of part-of-speech connection in the part-of-speech connection table 123. Are ranked so that a character string with a low total score is given priority.
[0029]
For example, in the case of the character string “similar to a book and called three volumes”, based on the dictionary 121,
(Book) + (do) + (similar) + (,) + (three) + (book) + (call) + (do)
The score of 10 + 5 + 10 + 5 + 10 + 2 + 20 + 5 = 85 points is calculated as the word priority. This string is
Noun-Particulate-One-level inflection verb-Reading-Numeric-Numerical-Ba-line five-tier inflection-End of speech connection based on part-of-speech connection table 121,
(Noun-Participant) + (Participant-One-stage Inflection Particle) + (One-Step Inflection Particle-Reading Point) + (Reading-Numerical) + (Numerical-Numerical Word) + (Numerical Word-Five-Line Inflection) + (Bain Five-Line Inflection) -Ending)
As a priority by connecting parts of speech,
A score of 30 + 20 + 30 + 40 + 10 + 40 + 30 = 200 points is obtained. Then, the priority of the word and the priority based on the part-of-speech connection are summed, and the priority is calculated as 285 points.
[0030]
By performing the same calculation, 290 kana kanji strings that read “similar books, read three books”, 295 points for “call two or three books”, and “read two or three books” A score of 300 points is calculated for a kana character string. Therefore, the priority of these four candidates is
1. I called the book three times in the same way 2. I read three books in the same way. I called two or three books. I read a couple of books. If the score indicating priority is equal to or higher than a reference value, it is excluded as a candidate that is difficult to connect, that is, a candidate with low possibility. Various combinations of words are possible, for example, “Similar translations, called three volumes”. However, for such Kana-Kanji character strings, the priority score is high as a result of the calculation, so Excluded.
[0031]
Subsequently, as shown in FIG. 5, the case frame analysis unit 113 rearranges the candidates that have been prioritized and narrowed down as described above. The case frame analysis unit 113 refers to the case frame dictionary 125 and performs the following determination process.
[0032]
For example, according to the case frame dictionary 125, when the particle “ga” is positioned before the word “reading”, the character string is determined to be semantically correct if the main case is a person. In addition, when the particle “O” is positioned before “Reading”, it is determined that it is semantically correct if the target case is “Book”. Similarly, if the particle “ga” is located before the word “call”, the main case is “person”, and if “wa” is located, the case is semantically human. Judged to be correct. Therefore, in the case frame analysis means 113, candidates such as “similar book read three books” and “read two books three books” “similar books, called three books” and “two books read”. It is judged that it is more suitable than the three volumes, "that is, semantically correct, and the priority is higher.
[0033]
As a result of such ranking, the priority is 1. I read three books in the same way. 2. I read a few books. Called three books, similar 4 If you call two or three books.
[0034]
Subsequently, the trigram analyzing unit 115 refers to the trigram data 127 and rearranges the candidates ranked by the case frame analyzing unit 113 as shown in FIG.
[0035]
Trigram data 127 describes the probability that a chain of three words will appear in the text, and this probability is created from the actual text corpus. That is, the trigram data 127 is created by dividing the text into words for a large amount of text data included in the actual text corpus and determining the probability that three collocations will appear.
[0036]
When the trigram data 127 is referred to, there is a high probability that an arrangement of the words “2”, “,”, “three” will appear (in other words, “2”, “,” “three” are included in the actual text). Therefore, the character string candidates are rearranged so that a candidate including a lot of word chains of “two”, “,” “three” is prioritized. In the example shown in FIG. 6, for example, word chains with extremely low probabilities such as the arrangement of the words “similar”, “,” and “three” are omitted.
[0037]
Therefore, the result of the rearrangement of the priority order by the trigram analyzing means 115 is
1. I read a few books. 2. I called two or three books. I read three books in the same way. It looks like a book and three books are called.
[0038]
Hereinafter, the result of the experiment using the kana-kanji conversion apparatus according to this embodiment will be described.
[0039]
The probability that a character in a character string is converted to a correct character by one Kana-Kanji conversion process (hereinafter referred to as “char rate”) is 94.09%, and the entire character string is converted to a correct character string by one Kana-Kanji conversion process. Trigram using approximately 80 MB of trigram data created based on an actual text corpus of hundreds of MB for a conventional Kana-Kanji conversion processing device with a probability of being played (hereinafter referred to as “sence rate”) of 46.05% As a result of applying the analysis processing according to the above, char rate was 95.03% and sentence rate was 52.68%. That is, it has been confirmed that the probability of conversion to a correct character string by a single conversion process increases both in character units and sentence units.
[0040]
The preferred embodiment of the present invention has been described above, but the present invention is not limited to this and can be implemented in various other forms.
[0041]
For example, in the above-described embodiment, the trigram data describing the probability that a chain of three words appears in the text included in the actual text corpus is generated, but the number of word chains is three. The number of words is not limited, and a chain of arbitrary N (N ≧ 2) words may be used. In this case, the storage device of the Kana-Kanji conversion device stores N-gram data describing the probability that a chain of N words will appear in the text corpus. That is, the N-gram data is created by dividing the text into words for a large amount of text data included in the actual text corpus and determining the probability that N collocations will appear.
[0042]
Then, instead of the trigram analysis means in the above-described embodiment, the N-gram analysis means refers to the N-gram data, and further rearranges the priority order of the character string candidates rearranged by the case frame analysis means. .
[0043]
【The invention's effect】
As described above, according to the present invention, a dictionary that describes characters that are candidates for Kana-Kanji conversion and the priority of the characters, a part-of-speech connection table that describes the priority of connection of two parts of speech, and a character string A case frame dictionary that describes the semantic relationship of other words to other words, and an N-gram that describes the probability that N (N ≧ 2) chains of words will appear in the text corpus containing the actual text Based on the storage device for storing data, the dictionary stored in the storage device, the part-of-speech connection table, the case frame dictionary, and the N-gram data, a kana-kanji character is input from the input device. A kana-kanji conversion device comprising a data processing device for converting into a string, wherein the data processing device extracts from the dictionary the characters that match the input kana character string And can means, the priority of the text, based on the priority of the connection of the parts of speech, a combination of the character extracted by the dictionary means, the possibility of kana-kanji character string is equal to or greater than a predetermined reference a morphological analysis means for creating a first candidate, on the basis of the case frames dictionary, the sorted priority candidate kana-kanji character string included in the first candidate, case frame analysis to create a second candidate And N-gram analyzing means for rearranging the priorities of the kana-kanji character string candidates included in the second candidate based on the probability that N chains of the word appear. By applying a trigram only to candidates output by Kana-Kanji conversion, conversion accuracy can be improved while reducing the amount of calculation.
[0044]
The storage device stores a Roman-kana conversion table that describes a kana character corresponding to a Roman character, and the data processing device converts the Roman character input from the input device into the kana character string based on the Roman-kana conversion table. Romaji-kana conversion means for converting to kana, and the dictionary lookup means extracts from the dictionary the characters that match the kana character string converted by the romaji-kana conversion means. In any case, the accuracy of kana-kanji conversion can be improved without requiring an extremely long time and a large disk capacity.
[Brief description of the drawings]
FIG. 1 is a functional block diagram of a kana-kanji conversion apparatus according to an embodiment.
FIG. 2 is a diagram for explaining a flow of kana-kanji conversion by the kana-kanji conversion apparatus according to the present embodiment.
FIG. 3 is a diagram for explaining a flow of kana-kanji conversion by the kana-kanji conversion apparatus according to the present embodiment.
FIG. 4 is a diagram for explaining a flow of kana-kanji conversion by the kana-kanji conversion apparatus according to the present embodiment.
FIG. 5 is a diagram for explaining a flow of kana-kanji conversion by the kana-kanji conversion apparatus according to the present embodiment.
FIG. 6 is a diagram for explaining a flow of kana-kanji conversion by the kana-kanji conversion apparatus according to the present embodiment.
[Explanation of symbols]
101 Input Device 103 Display Device 105 Data Processing Device 107 Romaji Kana Conversion Unit 109 Dictionary Lookup Unit 111 Morphological Analysis Unit 113 Case Frame Analysis Unit 115 Trigram Analysis Unit 117 Storage Device 119 Romaji Kana Conversion Table 121 Dictionary 123 Part-of-Speech Connection Table 125 Case Frame dictionary 127 Trigram data

Claims (4)

かな漢字変換の候補となる文字および該文字の優先度を記述する辞書、2つの品詞の接続の優先度を記述する品詞の接続表、文字列の中に含まれる語句の他の語句に対する意味的関係を記述する格フレーム辞書、および実際のテキストを含むテキストコーパスの中に単語のN(N≧2)個の連鎖が出現する確率を記述するNグラムデータを記憶する記憶装置と、
該記憶装置に記憶された前記辞書、前記品詞の接続表、前記格フレーム辞書、および前記Nグラムデータに基づいて、入力装置から入力されたかな文字列をかな漢字文字列に変換するデータ処理装置と
を備えたかな漢字変換装置であって、前記データ処理装置は、
入力された前記かな文字列にマッチする前記文字を前記辞書から抽出する辞書引き手段と、
前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記辞書引き手段により抽出された前記文字を組み合わせて、可能性が所定の基準以上であるかな漢字文字列の第1の候補を作成する形態素解析手段と、
前記格フレーム辞書に基づき、前記第1の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えて、第2の候補を作成する格フレーム解析手段と、
前記単語のN個の連鎖が出現する確率に基づいて、前記第2の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えるNグラム解析手段と
を備えたことを特徴とするかな漢字変換装置。
A dictionary that describes characters that are candidates for Kana-Kanji conversion and the priority of the characters, a part-of-speech connection table that describes the priority of the connection of two parts of speech, and the semantic relationship of other words contained in the character string to other words A case frame dictionary that describes and a storage device that stores N-gram data that describes the probability of N (N ≧ 2) chains of words appearing in a text corpus that contains the actual text;
A data processing device for converting a kana character string input from an input device into a kana-kanji character string based on the dictionary, the part-of-speech connection table, the case frame dictionary, and the N-gram data stored in the storage device; A kana-kanji conversion device comprising the data processing device,
Dictionary lookup means for extracting from the dictionary the characters that match the input kana character string;
Based on the priority of the character and the priority of connection of the part of speech, combining the characters extracted by the dictionary lookup unit , a first candidate for a kana-kanji character string whose possibility is equal to or greater than a predetermined criterion is obtained. Morphological analysis means to create,
Based on the case frame dictionary, case frame analysis means for rearranging the priorities of the kana-kanji character string candidates included in the first candidate to create a second candidate;
Kana-Kanji conversion comprising: N-gram analyzing means for rearranging the priorities of the Kana-Kanji character string candidates included in the second candidate based on a probability that N chains of the word appear. apparatus.
前記記憶装置は、ローマ字に対応するかな文字を記述するローマ字かな変換表を記憶し、前記データ処理装置は、前記入力装置から入力されたローマ字をローマ字かな変換表に基づいて前記かな文字列に変換するローマ字かな変換手段を備え、前記辞書引き手段は、前記ローマ字かな変換手段によって変換された前記かな文字列にマッチする前記文字を前記辞書から抽出することを特徴とする請求項1に記載のかな漢字変換装置。The storage device stores a romaji kana conversion table describing kana characters corresponding to romaji, and the data processing device converts the romaji input from the input device into the kana character string based on the romaji kana conversion table. 2. The kana-kanji character according to claim 1, further comprising: a romaji kana conversion unit configured to extract the characters that match the kana character string converted by the romaji kana conversion unit. Conversion device. 記憶装置に記憶された、かな漢字変換の候補となる文字および該文字の優先度を記述する辞書、2つの品詞の接続の優先度を記述する品詞の接続表、文字列の中に含まれる語句の他の語句に対する意味的関係を記述する格フレーム辞書、および実際のテキストを含むテキストコーパスの中に単語のN(N≧2)個の連鎖が出現する確率を記述するNグラムデータに基づいて、入力装置から入力されたかな文字列をかな漢字文字列に変換するかな漢字変換方法であって、
入力された前記かな文字列にマッチする前記文字を前記辞書から抽出する辞書引きステップと、
前記文字の優先度と、前記品詞の接続の優先度とに基づき、前記辞書引きステップにおいて抽出された前記文字を組み合わせて、可能性が所定の基準以上であるかな漢字文字列の第1の候補を作成する形態素解析ステップと、
前記格フレーム辞書に基づき、前記第1の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えて、第2の候補を作成する格フレーム解析ステップと、
前記単語のN個の連鎖が出現する確率に基づいて、前記第2の候補に含まれる前記かな漢字文字列の候補の優先順位を並べ替えるNグラム解析ステップと
を備えることを特徴とするかな漢字変換装方法。
A dictionary that describes characters that are candidates for kana-kanji conversion and the priority of the characters stored in the storage device, a part-of-speech connection table that describes the connection priority of two parts of speech, and a phrase included in the character string Based on case frame dictionaries that describe semantic relationships to other phrases, and N-gram data that describes the probability of N (N ≧ 2) chains of words appearing in a text corpus containing actual text, A kana-kanji conversion method for converting a kana character string input from an input device into a kana-kanji character string,
A dictionary lookup step of extracting from the dictionary the characters that match the input kana character string;
Based on the priority of the character and the priority of connection of the part of speech, combining the characters extracted in the dictionary lookup step, a first candidate for a kana-kanji character string whose possibility is equal to or higher than a predetermined criterion is obtained. A morphological analysis step to create,
Based on the case frame dictionary, a case frame analysis step of rearranging the priorities of the kana-kanji character string candidates included in the first candidate to create a second candidate;
A kana-kanji conversion device comprising: an N-gram analysis step of rearranging the priorities of the kana-kanji character string candidates included in the second candidate based on a probability that N chains of the word appear. Method.
前記記憶装置は、ローマ字に対応するかな文字を記述するローマ字かな変換表を記憶し、前記入力装置から入力されたローマ字をローマ字かな変換表に基づいて前記かな文字列に変換するローマ字かな変換ステップを備え、前記辞書引きステップは、前記ローマ字かな変換ステップにおいて変換された前記かな文字列にマッチする前記文字を前記辞書から抽出することを特徴とする請求項3に記載のかな漢字変換方法。The storage device stores a romaji kana conversion table describing kana characters corresponding to romaji, and a romaji kana conversion step for converting romaji input from the input device into the kana character string based on the romaji kana conversion table. 4. The kana-kanji conversion method according to claim 3, wherein the dictionary lookup step extracts, from the dictionary, the characters that match the kana character string converted in the Roman character kana conversion step.
JP2000304102A 2000-10-03 2000-10-03 Kana-kanji conversion device and kana-kanji conversion method Expired - Fee Related JP3622841B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000304102A JP3622841B2 (en) 2000-10-03 2000-10-03 Kana-kanji conversion device and kana-kanji conversion method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000304102A JP3622841B2 (en) 2000-10-03 2000-10-03 Kana-kanji conversion device and kana-kanji conversion method

Publications (2)

Publication Number Publication Date
JP2002117025A JP2002117025A (en) 2002-04-19
JP3622841B2 true JP3622841B2 (en) 2005-02-23

Family

ID=18785198

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000304102A Expired - Fee Related JP3622841B2 (en) 2000-10-03 2000-10-03 Kana-kanji conversion device and kana-kanji conversion method

Country Status (1)

Country Link
JP (1) JP3622841B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5243325B2 (en) * 2009-03-30 2013-07-24 Kddi株式会社 Terminal, method and program using kana-kanji conversion system for speech recognition
JP2011210149A (en) * 2010-03-30 2011-10-20 Baidu Japan Inc Character string conversion device, retrieval device, character string conversion method, and character string conversion program

Also Published As

Publication number Publication date
JP2002117025A (en) 2002-04-19

Similar Documents

Publication Publication Date Title
EP0180888A2 (en) Method and apparatus for natural language processing
US7136803B2 (en) Japanese virtual dictionary
JP5231698B2 (en) How to predict how to read Japanese ideograms
Sharma et al. Word prediction system for text entry in Hindi
EP0310049A2 (en) Document generator and correction support device
JPH05120324A (en) Language processing system
Alqrainy A morphological-syntactical analysis approach for Arabic textual tagging
JP3622841B2 (en) Kana-kanji conversion device and kana-kanji conversion method
Saito et al. Multi-language named-entity recognition system based on HMM
Siddiqui et al. Effective word prediction in urdu language using stochastic model
Nowakowski et al. Applying support vector machines to POS tagging of the Ainu language
Aliprandi et al. An inflected-sensitive letter and word prediction system
Tolegen et al. A finite state transducer based morphological analyzer for the kazakh language
JP3952964B2 (en) Reading information determination method, apparatus and program
JP2621999B2 (en) Document processing device
JP3285149B2 (en) Foreign language electronic dictionary search method and apparatus
Myint et al. Morpheme-Based Myanmar Word Segmenter
Gondal et al. No Sql-Not Obligatory Sql (Natural Language To Sql Conversion)
Tesema et al. Enhancing the Text Production and Assisting Disable Users in Developing Word Prediction and Completion in Afan Oromo
JP2819766B2 (en) Foreign language electronic dictionary search method
JPS61260367A (en) Mechanical translating system
JPS63115264A (en) Document processor
JPS59103136A (en) Kana (japanese syllabary)/kanji (chinese character) processor
JPH0350668A (en) Character processor
JPS5998236A (en) Input device of japanese sentence

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041019

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20041117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041117

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3622841

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071203

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081203

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091203

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101203

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111203

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121203

Year of fee payment: 8

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121203

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131203

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees