JPH09288673A - 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置 - Google Patents

日本語形態素解析方法と装置及び辞書未登録語収集方法と装置

Info

Publication number
JPH09288673A
JPH09288673A JP8101496A JP10149696A JPH09288673A JP H09288673 A JPH09288673 A JP H09288673A JP 8101496 A JP8101496 A JP 8101496A JP 10149696 A JP10149696 A JP 10149696A JP H09288673 A JPH09288673 A JP H09288673A
Authority
JP
Japan
Prior art keywords
word
probability
sentence
dictionary
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8101496A
Other languages
English (en)
Other versions
JP3777456B2 (ja
Inventor
Masaaki Nagata
昌明 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10149696A priority Critical patent/JP3777456B2/ja
Publication of JPH09288673A publication Critical patent/JPH09288673A/ja
Application granted granted Critical
Publication of JP3777456B2 publication Critical patent/JP3777456B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 辞書に登録されていない単語が入力文に含ま
れている場合でも、確率が高い順番に入力文を構成する
単語列を提示可能とし、訓練テキスト集合における単語
仮説の頻度の期待値が大きい順番に任意の個数の単語仮
説を辞書未登録語として提示可能とする。 【解決手段】 本発明は、確率が高い順番に任意の個数
の形態素解析候補を求め、1つの文に対する複数の形態
素解析候補とその確率から単語の頻度の期待値を求め、
入力文が辞書未登録語であっても、確率が高い順番に形
態素解析候補が提示でき、提示された形態素候補をも用
いて、かつ、処理対象となる日本語テキストにおける辞
書未登録語を頻度の期待値が大きい順に提示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、日本語文を単語に分割
する日本語形態素解析方法と装置及び辞書未登録語収集
方法と装置に係り、特に、分かち書きされた日本語テキ
ストデータベースから統計的手法により求めた単語分割
モデルと単語モデルを用いることにより、入力文が辞書
未登録語を含む場合でも精度のよい形態素解析が可能な
日本語形態素解析方法と装置及び、形態素解析結果に基
づいて辞書未登録語を収集するための辞書未登録語収集
方法と装置に関する。
【0002】
【従来の技術】従来の第1の日本語形態素解析システム
は、文法規則と発見的探索に基づく方法が主流であっ
た。これらは、文法規則として品詞接続表を用い、形態
素解析候補の探索の際には、最長一致法や最小文節数法
などの発見的規則(heuristics)を用いて候補の順位付
けを行なう。しかし、発見的探索に基づく方式は、形態
素解析候補に与えられる優先順位の根拠が不明確であ
り、解析精度もあまり高くない。
【0003】近年では、従来の第1の日本語形態素解析
システムに代わって、第2の方法として、統計的言語モ
デルと動的計画法に基づく方法が主流になりつつある。
この方法では、大量のテキストデータから学習した統計
的な言語モデルを用いることにより、形態素解析候補の
優先度の根拠が明確になり、かつ、候補の詳細な順位付
けができるようになってきている。
【0004】また、動的計画法により、入力文の長さに
比例する計算量で効率的に最尤な形態素解析候補を求め
られるようになってきている。特に、前向きDP後向き
*アルゴリズムを用いれば、確率が高い順番に任意の
個数の形態素解析候補を求めることができる(永田「前
向きDP後向きA* アルゴリズムを用いた確率的日本語
形態素解析」情報処理学会研究報告94-NL-101-10,pp.73
-80,1994)。
【0005】しかし、上記の文法規則と発見的探索に基
づく方法、および、統計的言語モデルと動的計画法に基
づく方法のいずれも、入力文が辞書未登録語、すなわ
ち、未知語を多く含む場合には、解析精度が大きく低下
するという問題点がある。文法規則と発見的探索に基づ
く方法における未知語処理は、非常に「場あたり的(ad
hoc)」である。多くのシステムは、「同じ字種の文字
の連続が単語を構成することが多い」、あるいは、「カ
タカナの連続は外来語の名詞であることが多い」という
ような文字種に関する発見的規則を用いて、単語の分割
および、品詞の付与を行なう方法(吉村・武内・津田・
首藤「未登録語を含む日本語文の形態素解析」情処論Vo
l.30 No.3,pp.294-301,1989)がとられている。あるい
は、付属語列などから文節を推定し、そこから付属語を
取り除いた部分列を未知語とみなす方法が使われている
ことも多い。
【0006】前者は、未知語処理において、文字列の単
語らしさを評価する方法、後者は、ある文脈における文
字列の単語らしさを評価する方法とみなすことができる
が、どちらの場合も、尤度の根拠が不明確であり、単語
仮説の詳細な順位付けも難しい。
【0007】統計的言語モデルを用いた未知語処理とし
ては、まず、造語単位の二つ組を用いて単語の生起確率
を推定する方法が提案されている(永井・日高「日本語
における単語の造語モデルとその評価」情処論Vol.34 N
o.9,pp.1944-1955,1993)。この方法では、単語辞書の見
出し語から造語モデルのパラメータを推定する。この方
法は、未知語の単語らしさを評価する有力な手段を与え
るが、次のような問題点がある。 (1)漢字で表記される複合語に対する造語モデルであ
り、漢字文字列以外では、造語単位の設定基準が必ずし
も明確ではなく、自動的な処理が難しい。 (2)辞書の見出し語からモデルパラメータを推定する
ので、モデルパラメータが対象領域のテキストの性質を
反映しない。 (3)文字列の単語らしさを評価するだけて、その文字
列が現れた文脈(前後の文字列)の情報を使って、単語
としての尤もらしさを評価しているわけではない。
【0008】この三つの問題を解決する方法として、品
詞出現確率・品詞別単語長確率・品詞別文字三つ組確率
から構成される単語モデルを用いて文字列の単語らしさ
に基づいて単語仮説を生成し、前向きDP後向きA*
ルゴリズムを用いて前後の文脈を考慮した上で最尤な単
語仮説を決定する方法が提案されている(永田「文字認
識誤り訂正のための頑健な日本語形態素解析法」,情報
処理学会 自然言語処理の応用に関するシンポジウム,
p.17-24,1995) 。
【0009】
【発明が解決しようとする課題】しかしなら、上記の三
つ組確率よりなる単語モデルにより単語仮説を生成し、
前向きDP後向きA* アルゴリズムを用いて最尤な単語
仮説を決定する方法には次のような問題点がある。 (1)一つの文に対する単語分割に曖昧性がある場合、
互いに重なり合う単語仮説の尤もらしさを比較できな
い。また、異なる文に含まれている単語仮説の尤もらし
さを比較できない。 (2)未知語の品詞推定を単語分割と同時に行なう方法
は、一つの文字列に対して複数の品詞候補を割り当てる
ので、形態素解析の計算量が大幅に増加する。このため
に処理速度が遅く、より精緻な単語モデルを導入したり
探索範囲を広げることにより解析精度を上げることが難
しい。
【0010】本発明は、上記の点に鑑みなされたもの
で、(1)辞書に登録されていない入力文中の単語を正
しく同定できない、特に、未知語の品詞推定と単語分割
と同時に行なうために、計算量の制約から解析精度を向
上することが難しい、(2)同定された単語仮説の尤も
らしさを文内および文間で比較できない、という従来手
法の問題点を解決し、辞書に登録されていない単語が入
力文に含まれている場合でも、確率が高い順番に入力文
を構成する単語列が提示可能な日本語形態素解析方法及
び装置を提供することを目的する。
【0011】また、本発明の更なる目的は、訓練テキス
ト集合における単語仮説の頻度の期待値が大きい順番に
任意の個数の単語仮説を辞書未登録語として提示できる
辞書未登録語収集方法及び装置を提供することである。
【0012】
【課題を解決するための手段】図1は、本発明の原理を
説明するためのフローチャートである。本発明は、日本
語の形態素解析を行う日本語形態素解析方法及び辞書未
登録語収集方法において、日本語文が入力される(ステ
ップ1)と、単語2つ組確率から文を構成する単語列の
同時確率を与える単語分割モデルと、単語長確率と単語
内文字二つ組確率から単語を構成する文字列の同時確率
を与える単語モデルに基づいて、日本語文を構成する単
語列の候補を確率が高い順番に任意の個数求め(ステッ
プ2)、文を構成する単語列の候補を単語列の同時確率
が高い順番に任意の個数提示する(ステップ3)。
【0013】また、上記の日本語形態素解析方法に続い
て、日本語形態素解析方法により提示された形態素解析
候補を用いて、一つの文に対する複数の形態素解析候補
と該形態素解析候補の確率から、単語の頻度の期待値を
求め(ステップ4)、日本語テキストにおける単語仮説
の頻度の期待値が大きい順番に任意の個数の単語仮説を
辞書未登録語として提示する(ステップ5)。
【0014】また、上記のステップ2において、単語列
の候補を求める際に、辞書に登録されていない入力文中
の単語に対して単語モデルに基づいて単語仮説を生成す
る。図2は、本発明の原理構成図である。本発明は、日
本語テキストを入力として与えられた際に、入力文を構
成する単語列を出力する出力手段を有する日本語形態素
解析装置100であって、単語二つ組確率から文を構成
する単語列の同時確率を与える単語分割モデル130
と、単語長確率と単語内文字二つ組確率から単語を構成
する文字列の同時確率を与える単語モデル140と、単
語分割モデル130および単語モデル140に基づいて
単語列の同時確率を最大化する単語列を求める形態素解
析手段110とを有する。
【0015】また、上記の日本語形態素解析装置100
は、辞書に登録されていない入力文中の単語に対して単
語モデル140に基づいて、単語仮説を生成する単語仮
説生成手段120を含み、出力手段は、単語列の同時確
率が高い順番に任意の個数の形態素解析候補を提示する
形態素解析候補提示手段150を含む。
【0016】また、上記の形態素解析手段110は、入
力文のある文字位置から始まる全ての部分文字列を、辞
書の単語表記と照合し、単語候補として提案し、文頭か
らある単語に至るまでの単語列の同時確率を最大化する
最適部分経路の確率を、最後の単語が異なる場合ごとに
計算する前向きDP探索手段と、前向きDP探索手段と
計算結果を記録する最適経路スコアテーブルと、前向き
DP探索手段において、入力文のある文字位置から始ま
る部分文字列が辞書の内容と照合しなかった場合、その
部分文字列が単語を構成すると仮定した場合の単語出現
確率を求める単語仮説生成手段と、前向きDP探索手段
で計算された最適経路スコアテーブルの値をを入力と
し、文末から文頭へ一単語ずつ進むA* アルゴリズムを
用いて、単語二つ組確率の最も大きいものから順番に一
つずつ形態素解析候補を求める後向きA* 探索手段とを
含む。
【0017】また、本発明は、入力文に含まれる単語の
中で辞書に登録されていないものを出力する未登録語収
集装置200であって、前述の日本語形態素解析装置の
形態素解析候補提示手段150により出力された一つの
文に対する複数の形態素解析候補とその確率から単語の
頻度の期待値を求める単語頻度推定手段210を有す
る。
【0018】また、上記の単語頻度推定手段210は、
後向きA* 探索手段が出力した形態素解析候補中、上位
N個(Nは任意の整数)の形態素解析候補を入力とし、
単語仮説の頻度の期待値を求め、該頻度の期待値が大き
い順番に任意の個数の単語仮説を辞書未登録語として出
力する。
【0019】本発明にかかる日本語形態素解析装置は、
単語二つ組確率から構成される単語分割モデル、単語長
確率と単語内文字二つ組確率から構成される単語モデ
ル、確率が高い順番に任意の個数の形態素解析候補を求
める形態素解析手段、1つの文に対する複数の形態素解
析候補とその確率から単語の頻度の期待値を求める単語
頻度推定手段を用いて、入力文が辞書に登録されていな
い単語を含む場合でも、確率が高い順番に形態素解析候
補を提示できするとおが可能となる。
【0020】さらに、提示された形態素解析候補を用い
て、かつ、処理対象となる日本語テキストにおける辞書
未登録語を頻度の期待値が大きい順に提示可能な辞書未
登録語収集装置が提供可能となる。従って、このような
構成により、(1)辞書に登録されていない入力文中の
単語を正しく同定し、(2)同定された単語を最も尤も
らしい順に提示する、日本語形態素解析装置および辞書
未登録語収集装置が実現できる。
【0021】
【発明の実施の形態】図3は、本発明のシステム構成図
である。同図に示す日本語形態素解析装置100と当該
日本語形態素解析装置100(以下、形態素解析装置と
記す)を含む辞書未登録語収集装置200から構成され
る。
【0022】形態素解析装置100は、形態素解析部1
10、単語二つ組確率テーブルを有する単語分割モデル
130、単語長確率テーブル141と単語内文字二つ組
確率テーブル142を有する単語モデル140、形態素
解析部110の解析結果を格納する形態素解析候補テー
ブル150及び単語テーブル160より構成される。ま
た、辞書未登録語収集装置200は、上記の形態素解析
装置100に、単語頻度推定部210を加えた構成であ
る。
【0023】上記の構成の形態素装置の詳細を図4に示
す。図4は、この発明の一実施例の概略ブロック図であ
る。本発明の日本語形態素解析装置は、前向きDP探索
部111、最適経路スコアテーブル114、後向きA*
探索部113、形態素解析候補テーブル115、単語仮
説生成部112、単語長確率テーブル141、単語内文
字二つ組確率テーブル142、単語二つ組確率テーブル
130、単語テーブル160より構成される。
【0024】前向きDP探索部111は、入力文の文頭
から文末へ一文字ずつ進む動的計画法(Dynamic Progra
mming)を用いて、単語列の同時確率、すなわち、単語二
つ組確率の積を最大化するような、入力文の単語分割を
求める。単語二つ組確率テーブル130は、単語二つ組
確率を格納し、単語テーブル160は単語辞書を格納す
る。
【0025】前向きDP探索部111は、入力文のある
文字位置から始まる全ての部分文字列を、単語テーブル
160の単語表記と照合し、単語候補として提案する。
そして、文頭からある単語に至るまでの単語列の同時確
率を最大化する最適部分経路(単語列)の確率を、最後
の単語が異なる場合毎に計算し、最適経路スコアテーブ
ル114に記録する。
【0026】単語仮説生成部112は、前向きDP探索
部111において、入力文のある文字位置から始まる部
分文字列が単語テーブル160と照合しなかった場合、
その部分文字列が単語を構成すると仮定した場合の単語
出現確率を求める。単語出現確率は、単語長確率テーブ
ル7、単語内文字二つ組確率テーブル142の値を用い
て計算される。単語仮説生成部112が生成した単語の
表記と出現確率の組を単語仮説と呼ぶ。
【0027】後向きA* 探索部113は、前向きDP探
索部111で計算された最適経路スコアテーブル114
を入力とし、文末から文頭へ一単語ずつ進むA* アルゴ
リズムを用いて、単語二つ組確率の最も大きいものから
順番に一つずつ形態素解析候補を求める。
【0028】辞書未登録語収集装置200の単語頻度推
定部210は、後向きA* 探索部113が形態素解析候
補テーブル115に格納した上位N個(Nは任意の整
数)の形態素解析候補を入力とし、単語仮説の頻度の期
待値とする。そして、頻度の期待値が大きい順番に任意
の個数の単語仮説を、辞書未登録語として出力する。
【0029】以下では、単語分解モデル140、単語モ
デル13、前向きDP探索部111による前向きDP探
索、後向きA* 探索部113による後向きA* 探索、辞
書未登録語収集装置200の単語頻度推定部210によ
る単語頻度推定の順に説明する。
【0030】(1) 単語分割モデル 文字列C=c1 2 ・・・cm から構成される入力文
が、単語列W=1 2 ・・・wn に分割されるとする。
形態素解析は、文字列が与えられた時の単語列の同時確
率P(W|C)を最大化する単語列W’を求める問題で
ある。文字列Cはすべての形態素解析候補に共通なの
で、実際にはP(W)を最大化するものを求めればよ
い。
【0031】
【数1】
【0032】本発明では同時確率P(W)をマルコフモ
デルで近似する。すなわち、単語二つ組確率P(wi
i-1 )を用いて次式で表す。
【0033】
【数2】
【0034】図5に、単語二つ組頻度の例として、「言
語」という単語とこれに後続する単語の二つの組の出現
頻度を示す。単語二つ組確率P(wi |wi-1 )は、単
語二つ組頻度を先行する単語の出現頻度で割ることによ
り得られる。例えば、訓練テキスト集合における「言
語」の出現頻度が561で、「言語」および「が」の二
つ組の出現頻度が22ならば、P(が|言語)=22/
561=0.039である。
【0035】(2) 単語モデル 単語モデルは、辞書未登録語を構成する文字列の同時確
率分布として定義される。未知語(辞書未登録語)を
〈UNK〉で表すことにすると、単語モデルは、一般性
を失うことなく、以下のような単語長確率P(k)と単
語表記確率P(c 1 ・・・ck |k)の積に分解でき
る。
【0036】 P(wi |〈UNK〉) =P(c1 ・・・ck |〈UNK〉) =P(k)P(c1 ・・・ck |k) (3) ここでc1 ・・・ck は、単語を構成する長さkの文字
列である。
【0037】本発明では、未知語の単語長の分布P
(k)が訓練集合中の単語の平均文字長λをパラメータ
とするポワソン分布に従うと仮定する。
【0038】
【数3】
【0039】上式は、隠れた(長さゼロ)の単語境界標
識の間の距離を単語の長さと考え、この単語境界標識が
平均的には平均単語長と等しい間隔で無作為に文中に置
かれるものとみなしている。次に、単語長が与えられた
時の未知語の表記の確率P(c1 ・・・ck |k,T)
は、以下のように、訓練集合中の単語内文字二つ組確率
の積で近似する。
【0040】
【数4】
【0041】ここで“#”は、単語の先頭および末尾を
表す特別な記号である。図6に、単語内文字二つ組頻度
の例として、「永」という文字とこれに後続する文字の
二つ組の頻度を示す。単語内文字二つ組確率P(ci
i-2 )は、単語内文字二つ組頻度を先行する文字の出
現頻度で割ることにより得られる。例えば、訓練テキス
ト集合において、「永」という文字の出現頻度が334
で、「永」および「ら」の単語内文字二つ組の出現頻度
が8ならば、P(ら/永)=8/334=0.024で
ある。
【0042】入力文が未知語を含む場合でも、式(3)
の単語モデルを用いることにより、式(2)の単語分割
モデルのパラメータは次式のようにして求めることがで
きる。
【0043】
【数5】
【0044】ここでC(・)は、対応する事象の訓練集
合における頻度を表す。wi が未知語である場合の単語
二つ組頻度C(wi-1 ,wi )は、訓練集合においてw
i-1 の後に未知語が現れる頻度C(wi-1 ,〈UN
K〉)と表記がwi であるような未知語の出現確率P
(wi |〈UNK〉)の積で近似する。なお、未知語を
含む単語二つ組頻度C(wi-1 ,〈UNK〉)は、訓練
集合の中で一回しか現れなかった単語を未知語とみなす
ことにより求める。
【0045】(3) 前向きDP探索 前向きDP探索部111が、最適経路スコアテーブルを
計算する手順を示す。入力文を長さnの文字列C=c1
2 ・・・cn とし、部分文字列cp+1 ・・・cq をc
p q で表す。まず、任意の部分文字列cp q を単語候補
の集合{wi }に写像する関数Dを考える。関数Dは辞
書を一般化したものである。関数Dは、もしcp q と照
合する表記をもつ単語が辞書中にあればそれを返す。も
し照合しなければ、単語モデルを用いてcp q を表記と
する単語仮説を作成する。
【0046】次に、部分文字列cp q が最後の単語wi
であるような、部分文字列c0 q の最尤な単語分割の確
率(最適経路確率)φp q (wi )を考える。最適経路
確率φp q (wi )は、次式を用いて文頭から順番に計
算することができる。
【0047】
【数6】
【0048】前向きDP探索部111における式(7)
の計算は、図7のようなフローチャートで表せる。以下
では、この図7に従って、前向きDP探索部111の動
作を説明する。前向きDP探索は、入力文の先頭から始
まり、文末方向へ一文字ずつ進む。
【0049】ステップ101) 探索の開始位置を入力
文の先頭に設定する。 ステップ102) 探索が文末に達したかを判断する。
もし、文末に達していれば、前向き探索を終了する。そ
うでなければ、以下の処理を各文字位置で行なう。
【0050】ステップ103) 現在の文字位置に到達
する全ての部分解析を最適経路スコアテーブル114か
ら検索し、その中の一つを現在の部分解析として選ぶ。 ステップ104) 全ての部分解析を調べたかを判定す
る。もしそうならば、ステップ122において探索を次
の文字位置へ進める。そうでなければ、以下の処理を各
部分解析について行なう。
【0051】ステップ105) 現在の文字位置から始
まる最左部分文字列と照合する全ての単語候補を単語テ
ーブル160から検索する。また、照合しない時は、単
語モデル140を用いて単語仮説を作成する。そして、
その中の一つを現在の単語として選ぶ。
【0052】ステップ106) 全ての単語を調べたか
を判定する。もしそうならば、ステップ111に移行
し、次の部分解析を選ぶ。そうでなければ、以下の処理
を各単語について行なう。 ステップ107) 現在の単語とその直前の単語から構
成される単語二つ組確率を単語二つ組テーブル130か
ら検索する ステップ108) 単語二つ組確率がゼロかどうかを判
定する。もし単語二つ組確率が0ならば、ステップ11
0において次の単語を選ぶ。もしそうでなければ、以下
の処理を行なう。
【0053】ステップ109) まず、現在の部分解析
の末尾に現在の単語を付け加えた新しい部分解析を作成
する。新しい部分解析の(文頭から現在の単語の末尾ま
での)最適経路スコアは、現在の部分解析の最適経路ス
コアと単語二つ組確率の積である。次に、最適経路スコ
アテーブル114から、この新しい部分解析の最後の単
語と同じ単語を最後に持つ部分解析を検索する。もしこ
のような部分解析が存在しないか、あるいは、既に存在
する部分解析よりも新しい部分解析のスコアが良けれ
ば、新しい部分解析を最適経路スコアテーブル114に
登録する。
【0054】ステップ110) 次の単語を選び、ステ
ップ106へ戻る。 ステップ111) 次の部分解析を選び、ステップ10
4へ戻る。 ステップ112) 探索を次の文字位置へ進め、ステッ
プ102へ戻る。 (4) 後向きA* 探索 後向きA* 探索部113が、確率が高い順番に一つずつ
形態素解析候補を求める手順を示す。本発明の後向きA
* 探索では、前向きDP探索により求めた、文頭からあ
る単語までの部分解析を、A* アルゴリズムにおけるグ
ラフのノードと考える。そして、コストとしては、確率
の対数の絶対値を用いる。これにより、確率最大の解は
コスト最小の解に対応し、確率の積はコストの和に対応
する。
【0055】一般に、A* 探索では、ヒューリスティッ
ク関数f(n)を考える。ヒューリスティック関数f
(n)は、現在のノードnを生成した経路に沿って、初
期状態から最終状態へ至るまでのコストの推定値を与え
る。初期状態から現在のノードへ至るまでのコストを与
える関数をg(n)、現在のノードから最終状態へ至る
までのコストの推定値を与える関数をh(n)とする
と、ヒューリスティック関数f(n)は次式により与え
られる。
【0056】 f(n)=g(n)+h(n) (8) 本発明の後向き探索では、関数gとして、文末から現在
の単語に至るまでの単語二つ組確率の積の対数の絶対値
を用いる。また、関数hとしては、前向き探索で求め
た、文頭から現在の単語に至るまでの単語二つ組確率の
積の最大値の対数の絶対値を用いる。
【0057】A* 探索では、openとcloseとい
う二つのリストを用いる。リストopenは、既に生成
され、ヒューリスティック関数が適用されているが、ま
だ展開されて(調べられて)いないノードの集合であ
る。このリストは、ヒューリスティック関数の値に基づ
く優先度付きキューになっている。リストclose
は、既に展開された(調べられた)ノードの集合であ
る。
【0058】A* 探索では、目標状態に対応するノード
を生成するまで、各ステップで一つのノードを展開す
る。各ステップでは、既に生成されているが、まだ展開
されていない、最も有望なノードを展開する。すなわ
ち、選ばれたノードの後続のノードを生成し、ヒューリ
スティック関数を適用し、既に生成されていないかを検
査した後にリストopenに加える。この検査によっ
て、各ノードはグラフの中に一回だけ現れることが保証
される。また、二つ以上の経路が同じノードを生成する
時は、スコアの良い方だけを記録する。
【0059】本発明の後向き探索では、あるノードから
後続するノードへの遷移のコストとして、単語二つ組確
率の対数の絶対値を用いる。図8、図9は、本発明の後
向きA* 探索部の動作を説明するためのフローチャート
である。
【0060】以下では、この図8、図9に従って、後向
きA* 探索部113の動作を説明する。 ステップ201) 文末に到達した部分解析に対応する
ノードのリストをopneに代入する。また、clos
edには空リストを代入する。
【0061】ステップ202) openが空リストか
どうかを調べる。もしそうならば、解が見つからなかっ
たので探索が失敗したことを通知して探索を終了する。
そうでなければ、以下の処理を行なう。 ステップ203) openの先頭要素を取り出して変
数bestpathに代入する。
【0062】ステップ204) そして、探索が文頭に
達したかを調べる。もし、探索が文頭に達していれば、
bestpathが最適解であり、探索が成功したこと
を通知して探索を終了する。そうでなければ、以下の処
理を行なう。また、探索は成功したが、さらにその次に
確率が高い解を求めたい場合には、以下の処理を行な
う。
【0063】ステップ205) bestpathをリ
ストclosedへ挿入し、closedの要素を初期
状態から最終状態までのコストの推定値f(n)の順に
ソートする。 ステップ206) bestpathが表す部分解析の
左側に連接する全ての部分解析を最適部分経路スコアテ
ーブルから検索し、その中の一つを現在の部分解析とす
る。
【0064】ステップ207) 全ての部分解析を調べ
たかどうかを判定する。もしそうであれば、ステップ2
02へ進む。そうでなければ以下の処理を行なう。 ステップ208) bestpathから現在の部分解
析へ遷移する経路を表す新しいノードを作成し、これを
変数newpathに代入する。文末からこのノードま
でのコストg(newpath)は、文末からbest
pathへ至るまでのコストg(bestpath)
と、bestpathからnewpathへの遷移のコ
ストの和となる。また、このノードのヒューリスティッ
ク関数f(newpath)は、文末からこのノードま
でのコストg(newpath)と、前向き探索で求め
た文頭からこのノードまでの最適コストh(newpa
th)の和となる。
【0065】ステップ209) 現在の部分解析への遷
移を表すノードがopenに含まれているかどうかを検
査する。もし含まれていなければ、ステップ213へ進
む。含まれていれば、以下の処理を行なう。 ステップ210) 現在の部分解析への遷移を表すop
enの中のノードを変数oldpathに代入する。
【0066】ステップ211) newpathのコス
トf(newpath)とoldpathのコストf
(oldpath)を比較する。もし、newpath
のコストの方が大きければ、何もせずにステップ218
へ進む。 ステップ212) もし、newpathのコストの方
が小さければ、openからoldpathを削除し、
newpathをopenへ挿入した後にコストの順に
ソートする。そしてステップ218へ進む。
【0067】ステップ213) 現在の部分解析への遷
移を表すノードがclosedに含まれているかどうか
を検査する。もし含まれていなければ、ステップ217
へ進む。含まれていれば、以下の処理を行なう。 ステップ214) 現在の部分解析への遷移を表すcl
osedの中のpath構造を変数oldpathに代
入する。
【0068】ステップ215) newpathのコス
トf(newpath)とoldpathのコストf
(oldpath)を比較する。もし、newpath
のコストの方が大きければ、何もせずにステップ218
へ進む。 ステップ216) もし、newpathのコストの方
が小さければ、closedからoldpathを削除
し、neapathをclosedへ挿入した後にコス
トの順にソートする。そしてステップ218へ進む。
【0069】ステップ217) newpathをop
enへ挿入した後にコストの順にソートする。そしてス
テップ218へ進む。 ステップ218) 次の部分解析を選ぶ。 (5) 単語頻度推定 辞書未登録語収集装置200の単語頻度推定部210が
入力文に含まれる単語の頻度の期待値を求め、頻度の期
待値が大きい順番に辞書未登録語を出力する手順を示
す。
【0070】前向きDP探索に続いて後向きA* 探索を
行なえば、入力文に対する形態素解析候補を確率が高い
順番に任意の個数だけ得ることができる。ここで、訓練
テキストの集合の第i番目の文の第j番目の形態素解析
候補をOj i とする。形態素解析候補の確率P
(Oj i )は単語分割モデルと単語モデルから求められ
る。本発明では、第i番目の文における単語wαの頻度
の期待値Ci (wα)は次式により計算する。
【0071】
【数7】
【0072】ここでnj i (wα)は、第i番目の文の
第j番目の形態素解析候補に単語wαが出現した回数を
表す。
【0073】
【数8】
【0074】
【実施例】以下に本発明の実施例を図面と共に説明す
る。以下の実施例では、第1の実施例として、日本語形
態素解析装置を説明し、第2の実施例として辞書未登録
語収集装置を説明する。
【0075】[第1の実施例]図10は、本発明の第1
の実施例の形態素解析候補の例を示す。この例では、入
力文「キャノンゼロワンショップ横須賀からパワーマッ
クを買う。」に対する上位3個の形態素解析候補が示さ
れている。各形態素解析候補には、その対数確率が示さ
れており、この値が大きいほど尤もらしい。
【0076】この例では「キヤノンゼロワンショップ横
須賀」という文字列の単語分割に際して、本発明の日本
語形態素解析装置は、第1候補では、「キヤノン」「ゼ
ロワンショップ」「横須賀」第2候補では、「キヤノ
ン」「ゼロワン」「ショップ」「横須賀」第3候補で
は、「キヤノン」「ゼロ」「ワン」「ショップ」「横須
賀」という単語分割を提示している。この中で「ゼロワ
ンショップ」と「ゼロワン」は辞書には登録されておら
ず、未知語として提示されている。また、「パワーマッ
ク」という文字列も辞書には登録されていないので、未
知語として提示されている。
【0077】このように本実施例によれば、入力文が辞
書に登録されていない単語を含む場合でも、確率が高い
順番に任意の個数の形態素解析候補を提示できる。 [第2の実施例]本発明の辞書未登録語収集装置200
では、訓練テキスト集合における単語の頻度の期待値
を、入力文中の任意の部分文字列が単語を構成している
かどうかに関する確からしさの尺度として用いる。ここ
で、単語仮説を単語とみなすかどうかの閾値をθとす
る。本発明では、単語仮説の中で、その頻度の期待値が
閾値θよりも大きいものを辞書未登録語として収集す
る。
【0078】
【数9】
【0079】最後に、本発明における単語頻度推定部2
10の単語の頻度の期待値の計算手段を簡単な例を用い
て示す。入力テキストが5つの文字から構成される文字
列「言語学入門」であり、その上位3個の形態素解析候
補が図9に示すように「言語学/入門」「言/語学/入
門」「言語/学/入門」であるとする。図11の左端の
数字は形態素解析候補の相対確率であり、式(9)の
【0080】
【数10】
【0081】に相当する。式(9)に従って、第j番目
の形態素解析候補における単語wαの出現回数n
j i (wα)に、第j番目の形態素解析候補の相対確率
【0082】
【数11】
【0083】を掛けた値を全ての形態素解析候補に関し
て加えると、各単語候補の頻度の期待値は以下のように
なる。 C(入門)=0.7+0.2+0.1=1.0 C(言語学)=0.7 C(言語)=C(学)=0.2 C(言)=C(語学)=0.1 仮に、単語と同定するための頻度の期待値の閾値θを
0.15に設定したとする。もし仮に、「入門」「言語
学」「言語」「学」「言」「語学」の全ての文字列が辞
書に登録されていないのであれば、本発明の方法では、
「入門」「言語学」「言語」「学」の4つを辞書未登録
語として提示する。
【0084】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。
【0085】
【発明の効果】上述のように、本発明の日本語形態素解
析装置によれば、単語二つ組から構成される単語分割モ
デル、単語長確率と単語内文字二つ組確率から構成され
る単語モデル、動的計画法を用いた前向き探索とA*
ルゴリズムを用いた後ろ向き探索により、単語列の同時
確率が高い順番に任意の個数の形態素解析候補を提示す
る形態素解析処理により、辞書に登録されていない単語
が入力文に含まれている場合でも確率が高い順番に入力
文を構成する単語列を提示することが可能となる。
【0086】また、本発明の辞書未登録語収集装置によ
れば、複数の形態素解析候補とその確率から単語の頻度
で期待値を求める単語頻度推定処理により、訓練テキス
ト集合における単語仮説の頻度の期待が大きい順番に任
意の個数の単語仮説を辞書未登録語として提示すること
が可能となる。
【図面の簡単な説明】
【図1】本発明の原理を説明するためのフローチャート
である。
【図2】本発明の原理構成図である。
【図3】本発明のシステム構成図である。
【図4】本発明の日本語形態素解析装置及び辞書未登録
語収集装置の構成図である。
【図5】本発明の単語二つ組頻度の例である。
【図6】本発明の単語内文字二つ組頻度の例である。
【図7】本発明の前向きDP探索を示すフローチャート
である。
【図8】本発明の後ろ向きA* 探索を示すフローチャー
ト(その1)である。
【図9】本発明の後ろ向きA* 探索を示すフローチャー
ト(その2)である。
【図10】本発明の第1の実施例の形態素解析候補の例
である。
【図11】本発明の第2の実施例の単語頻度期待値計算
の例である。
【符号の説明】
100 日本語形態素解析装置 110 形態素解析手段 111 前向きDP探索部 112 単語仮説生成部 113 後ろ向きA* 探索部 114 最適経路スコアテーブル 115 形態素解析候補テーブル 120 単語仮説生成手段 130 単語分割モデル 140 単語モデル 141 単語長確率テーブル 142 単語内文字二つ組確率テーブル 150 形態素解析候補提示手段、形態素解析候補テー
ブル 160 単語テーブル(単語辞書) 200 辞書未登録語収集装置 210 単語推定手段

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 日本語の形態素解析を行う日本語形態素
    解析方法において、 日本語文が入力されると、 単語2つ組確率から文を構成する単語列の同時確率を与
    える単語分割モデルと、単語長確率と単語内文字二つ組
    確率から単語を構成する文字列の同時確率を与える単語
    モデルに基づいて、前記日本語文を構成する単語列の候
    補を、確率が高い順番に任意の個数求め、 文を構成する単語列の候補を単語列の同時確率が高い順
    番に任意の個数提示することを特徴とする日本語形態素
    解析方法。
  2. 【請求項2】 前記単語列の候補を求める際に、 辞書に登録されていない入力文中の単語に対して単語モ
    デルに基づいて単語仮説を生成する請求項1記載の日本
    語形態素解析方法。
  3. 【請求項3】 日本語の形態素解析結果に基づいて辞書
    未登録語を収集する辞書未登録語収集方法において、 日本語文が入力されると、 単語2つ組確率から文を構成する単語列の同時確率を与
    える単語分割モデルと、単語長確率と単語内文字二つ組
    確率から単語を構成する文字列の同時確率を与える単語
    モデルに基づいて、前記日本語文を構成する単語列の候
    補を確率が高い順番に任意の個数求め、 文を構成する単語列の候補を単語列の同時確率が高い順
    番に任意の個数提示し、 提示された前記形態素解析候補を用いて、一つの文に対
    する複数の形態素解析候補と該形態素解析候補の確率か
    ら、単語の頻度の期待値を求め、 日本語テキストにおける単語仮説の頻度の期待値が大き
    い順番に任意の個数の単語仮説を辞書未登録語として提
    示することを特徴とする辞書未登録語収集方法。
  4. 【請求項4】 前記単語列の候補を求める際に、 辞書に登録されていない入力文中の単語に対して単語モ
    デルに基づいて単語仮説を生成する請求項3記載の辞書
    未登録御収集方法。
  5. 【請求項5】 日本語テキストを入力として与えられた
    際に、入力文を構成する単語列を出力する出力手段を有
    する日本語形態素解析装置であって、 単語二つ組確率から文を構成する単語列の同時確率を与
    える単語分割モデルと、 単語長確率と単語内文字二つ組確率から単語を構成する
    文字列の同時確率を与える単語モデルと、 前記単語分割モデルおよび前記単語モデルに基づいて単
    語列の同時確率を最大化する単語列を求める形態素解析
    手段とを有することを特徴とする日本語形態素解析装
    置。
  6. 【請求項6】 辞書に登録されていない入力文中の単語
    に対して前記単語モデルに基づいて、単語仮説を生成す
    る単語仮説生成手段を更に有し、 前記出力手段は、 単語列の同時確率が高い順番に任意の個数の形態素解析
    候補を提示する形態素解析候補提示手段を含む請求項5
    記載の日本語形態素解析装置。
  7. 【請求項7】 前記形態素解析手段は、 入力文のある文字位置から始まる全ての部分文字列を、
    前記辞書の単語表記と照合し、単語候補として提案し、
    文頭からある単語に至るまでの単語列の同時確率を最大
    化する最適部分経路の確率を、最後の単語が異なる場合
    ごとに計算する前向きDP探索手段と、 前記前向きDP探索手段と計算結果を記録する最適経路
    スコアテーブルと、 前記前向きDP探索手段において、前記入力文のある文
    字位置から始まる部分文字列が前記辞書の内容と照合し
    なかった場合、その部分文字列が単語を構成すると仮定
    した場合の単語出現確率を求める単語仮説生成手段と、 前記前向きDP探索手段で計算された前記最適経路スコ
    アテーブルの値をを入力とし、文末から文頭へ一単語ず
    つ進むA* アルゴリズムを用いて、単語二つ組確率の最
    も大きいものから順番に一つずつ形態素解析候補を求め
    る後向きA* 探索手段とを含む請求項5記載の日本語形
    態素解析装置。
  8. 【請求項8】 入力文に含まれる単語の中で辞書に登録
    されていないものを出力する辞書未登録語収集装置であ
    って、 単語二つ組確率から文を構成する単語列の同時確率を与
    える単語分割モデルと、 単語長確率と単語内文字二つ組確率から単語を構成する
    文字列の同時確率を与える単語モデルと、 前記単語分割モデルおよび前記単語モデルに基づいて単
    語列の同時確率を最大化する単語列を求める形態素解析
    手段と、 前記形態素解析手段により求められた一つの文に対する
    複数の形態素解析候補とその確率から単語の頻度の期待
    値を求める単語頻度推定手段とを有することを特徴とす
    る辞書未登録語収集装置。
  9. 【請求項9】 前記形態素解析手段は、 入力文のある文字位置から始まる全ての部分文字列を、
    前記辞書の単語表記と照合し、単語候補として提案し、
    文頭からある単語に至るまでの単語列の同時確率を最大
    化する最適部分経路の確率を、最後の単語が異なる場合
    ごとに計算する前向きDP探索手段と、 前記前向きDP探索手段と計算結果を記録する最適経路
    スコアテーブルと、 前記前向きDP探索手段において、前記入力文のある文
    字位置から始まる部分文字列が前記辞書の内容と照合し
    なかった場合、その部分文字列が単語を構成すると仮定
    した場合の単語出現確率を求める単語仮説生成手段と、 前記前向きDP探索手段で計算された前記最適経路スコ
    アテーブルの値をを入力とし、文末から文頭へ一単語ず
    つ進むA* アルゴリズムを用いて、単語二つ組確率の最
    も大きいものから順番に一つずつ形態素解析候補を求め
    る後向きA* 探索手段とを含む請求項8記載の辞書未登
    録語収集装置。
  10. 【請求項10】 前記単語頻度推定手段は、 後向きA* 探索手段が出力した形態素解析候補中、上位
    N個(Nは任意の整数)の形態素解析候補を入力とし、
    単語仮説の頻度の期待値を求め、該頻度の期待値が大き
    い順番に任意の個数の単語仮説を辞書未登録語として出
    力する請求項8記載の辞書未登録語収集装置。
JP10149696A 1996-04-23 1996-04-23 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置 Expired - Lifetime JP3777456B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10149696A JP3777456B2 (ja) 1996-04-23 1996-04-23 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10149696A JP3777456B2 (ja) 1996-04-23 1996-04-23 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置

Publications (2)

Publication Number Publication Date
JPH09288673A true JPH09288673A (ja) 1997-11-04
JP3777456B2 JP3777456B2 (ja) 2006-05-24

Family

ID=14302266

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10149696A Expired - Lifetime JP3777456B2 (ja) 1996-04-23 1996-04-23 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置

Country Status (1)

Country Link
JP (1) JP3777456B2 (ja)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009048472A (ja) * 2007-08-21 2009-03-05 Nippon Hoso Kyokai <Nhk> 形態素候補生成装置およびコンピュータプログラム
WO2012081386A1 (ja) * 2010-12-17 2012-06-21 楽天株式会社 自然言語処理装置、方法、及びプログラム
WO2013128684A1 (ja) * 2012-02-28 2013-09-06 楽天株式会社 辞書生成装置、方法、及びプログラム
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法
WO2014030258A1 (ja) * 2012-08-24 2014-02-27 株式会社日立製作所 形態素解析装置、テキスト分析方法、及びそのプログラム
US8756058B2 (en) 2006-02-23 2014-06-17 Nec Corporation Speech recognition system, speech recognition result output method, and speech recognition result output program
KR20160066387A (ko) * 2014-12-02 2016-06-10 울산대학교 산학협력단 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법
US9934465B2 (en) 2005-03-30 2018-04-03 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US10248669B2 (en) 2010-06-22 2019-04-02 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
CN111339253A (zh) * 2020-02-25 2020-06-26 中国建设银行股份有限公司 一种抽取物品信息的方法和装置
CN114327090A (zh) * 2021-12-31 2022-04-12 吉林科讯信息科技有限公司 日文输入方法以及相关装置、设备

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9934465B2 (en) 2005-03-30 2018-04-03 Primal Fusion Inc. Systems and methods for analyzing and synthesizing complex knowledge representations
US10002325B2 (en) 2005-03-30 2018-06-19 Primal Fusion Inc. Knowledge representation systems and methods incorporating inference rules
US8756058B2 (en) 2006-02-23 2014-06-17 Nec Corporation Speech recognition system, speech recognition result output method, and speech recognition result output program
JP2009048472A (ja) * 2007-08-21 2009-03-05 Nippon Hoso Kyokai <Nhk> 形態素候補生成装置およびコンピュータプログラム
US10248669B2 (en) 2010-06-22 2019-04-02 Primal Fusion Inc. Methods and devices for customizing knowledge representation systems
WO2012081386A1 (ja) * 2010-12-17 2012-06-21 楽天株式会社 自然言語処理装置、方法、及びプログラム
CN103038762A (zh) * 2010-12-17 2013-04-10 乐天株式会社 自然语言处理装置、方法、以及程序
JP5314195B2 (ja) * 2010-12-17 2013-10-16 楽天株式会社 自然言語処理装置、方法、及びプログラム
JP2014501988A (ja) * 2011-01-07 2014-01-23 プライマル フュージョン インコーポレイテッド 複合的知識表現の解析及び合成を行うシステム及び方法
WO2013128684A1 (ja) * 2012-02-28 2013-09-06 楽天株式会社 辞書生成装置、方法、及びプログラム
KR101379128B1 (ko) * 2012-02-28 2014-03-27 라쿠텐 인코포레이티드 사전 생성 장치, 사전 생성 방법 및 사전 생성 프로그램을 기억하는 컴퓨터 판독 가능 기록 매체
TWI452475B (zh) * 2012-02-28 2014-09-11 Rakuten Inc A dictionary generating device, a dictionary generating method, a dictionary generating program product, and a computer readable memory medium storing the program
CN103608805A (zh) * 2012-02-28 2014-02-26 乐天株式会社 辞典产生装置、方法、及程序
JP5373998B1 (ja) * 2012-02-28 2013-12-18 楽天株式会社 辞書生成装置、方法、及びプログラム
WO2014030258A1 (ja) * 2012-08-24 2014-02-27 株式会社日立製作所 形態素解析装置、テキスト分析方法、及びそのプログラム
JPWO2014030258A1 (ja) * 2012-08-24 2016-07-28 株式会社日立製作所 形態素解析装置、テキスト分析方法、及びそのプログラム
KR20160066387A (ko) * 2014-12-02 2016-06-10 울산대학교 산학협력단 형태소 분석기를 위한 미등록 명사 추정 장치 및 방법
CN111339253A (zh) * 2020-02-25 2020-06-26 中国建设银行股份有限公司 一种抽取物品信息的方法和装置
CN114327090A (zh) * 2021-12-31 2022-04-12 吉林科讯信息科技有限公司 日文输入方法以及相关装置、设备

Also Published As

Publication number Publication date
JP3777456B2 (ja) 2006-05-24

Similar Documents

Publication Publication Date Title
US7689588B2 (en) Method of syntactic pattern recognition of sequences
US6873993B2 (en) Indexing method and apparatus
US5870706A (en) Method and apparatus for an improved language recognition system
EP1178466B1 (en) Recognition system using lexical trees
CN109902159A (zh) 一种基于自然语言处理的智能运维语句相似度匹配方法
CN110807102B (zh) 知识融合方法、装置、计算机设备和存储介质
CN106503231B (zh) 基于人工智能的搜索方法和装置
US20100042397A1 (en) Data processing apparatus and method
US5553284A (en) Method for indexing and searching handwritten documents in a database
JPH09288673A (ja) 日本語形態素解析方法と装置及び辞書未登録語収集方法と装置
Scha et al. A memory-based model of syntactic analysis: data-oriented parsing
JP5265445B2 (ja) 話題境界検出装置及びコンピュータプログラム
CN112711944B (zh) 一种分词方法、系统、分词器生成方法及系统
JPH11328317A (ja) 日本語文字認識誤り訂正方法及び装置、並びに、誤り訂正プログラムを記録した記録媒体
Ney A comparative study of two search strategies for connected word recognition: Dynamic programming and heuristic search
CN112884087A (zh) 一种生物增强子及其类型的识别方法
JP3309174B2 (ja) 文字認識方法及び装置
CN114757147B (zh) 一种基于bert的自动分层树扩展方法
Momenipour et al. PHMM: Stemming on Persian Texts using Statistical Stemmer Based on Hidden Markov Model.
Sfikas et al. A PHOC decoder for lexicon-free handwritten word recognition
Cotterell et al. Penalized expectation propagation for graphical models over strings
CN115146630B (zh) 基于专业领域知识的分词方法、装置、设备及存储介质
CN114297350B (zh) 一种面向自然语言的城市领域知识模型查询方法和装置
JP3915167B2 (ja) 日本語形態素解析方法及び装置及び日本語形態素解析プログラムを格納した記憶媒体
JP2005234800A (ja) 用例機械翻訳装置及び用例翻訳コンピュータプログラム、並びに用例検索装置及び用例検索コンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051108

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060131

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20060201

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060213

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090310

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100310

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110310

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110310

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120310

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130310

Year of fee payment: 7

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term