JP3813837B2 - データ分析装置及びデータ分析方法並びにプログラム - Google Patents

データ分析装置及びデータ分析方法並びにプログラム Download PDF

Info

Publication number
JP3813837B2
JP3813837B2 JP2001157198A JP2001157198A JP3813837B2 JP 3813837 B2 JP3813837 B2 JP 3813837B2 JP 2001157198 A JP2001157198 A JP 2001157198A JP 2001157198 A JP2001157198 A JP 2001157198A JP 3813837 B2 JP3813837 B2 JP 3813837B2
Authority
JP
Japan
Prior art keywords
time
documents
document
key
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001157198A
Other languages
English (en)
Other versions
JP2002351899A (ja
Inventor
茂明 櫻井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001157198A priority Critical patent/JP3813837B2/ja
Priority to US10/151,965 priority patent/US20020178155A1/en
Publication of JP2002351899A publication Critical patent/JP2002351899A/ja
Application granted granted Critical
Publication of JP3813837B2 publication Critical patent/JP3813837B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、テキストデータ及び時間情報を含むドキュメントを分析するデータ分析装置及びデータ分析方法に関する。
【0002】
【従来の技術】
データの電子媒体上への格納が進むに連れて、蓄積されている大量のデータの中から必要な情報を効率よく抽出することが必要になってきている。
【0003】
この問題に対して、特開2001−22776(以下、文献1)に開示されたルール生成結果通知システムでは、ある時点においてデータベースに格納されているデータを入力として与えることにより、データに内在する規則性を発見する一方、別時点において同様に規則性を発見し、それら規則性を比較することによって、時間変化に伴う規則性の推移を示すことができるようになっている。
【0004】
一方、「対話タスクモデルのサンプル単語時系列からの自己組織化」、電子情報通信学会J83−D−II、 No.2、 p.827−839(2000年)(以下、文献2)に開示された技術では、単語時系列とその応答を示す単語からなるデータを多数集めることにより、単語時系列とその応答を示す単語との間の関係をネットワーク構造にモデル化することができる。また、当該モデルを利用することにより、新たに与えられた単語時系列に対応する応答を示す単語を予測することができる。
【0005】
また、特開平11−123198(以下、文献3)に開示されたデータ処理装置では、時系列データを与えることにより、時系列データを意味のある単位に分割し、意味的に類似した単位ごとにモデルを学習することができる。また、当該モデルを利用することにより、新たに与えられた時系列データに対応する次の結果を予測することができる。
【0006】
【発明が解決しようとする課題】
文献1に開示された従来技術では、変化した規則をユーザに提示するだけであり、時間変化に伴って発生する現象を予測することはできなかった。また、文献2に開示された従来技術では、時系列データの一種である単語時系列を獲得する方法に関しては示されておらず、問題に応じて単語時系列の生成方法を設計する必要がある。また、文献3に開示された従来技術では、学習されるモデルがパターンに基づいてなされているため、モデルの意味を直感的に理解することができず、かつまた、時系列データに対する意味付けが明示的になされていないため、予測結果に意味付けを与えることができなかった。
【0007】
本発明は、上記事情を考慮してなされたもので、蓄積されたテキストデータ及び時間情報を含むドキュメントの集合から、規則性をモデル化するためのもととなる、単語(概念)時系列モデルを生成可能にするデータ分析装置及びデータ分析方法並びにプログラムを提供することを目的とする。
【0008】
また、本発明は、時間系列の中で与えられるテキストデータに対して、その一連のテキストデータに従って発生する結果を示す規則性をモデル化することを可能にするためのデータ分析装置及びデータ分析方法並びにプログラムを提供することを目的とする。
【0009】
また、本発明は、獲得されたモデルを利用することにより、時間情報を含んだ新たなテキストデータに対して、その後に発生する結果を予測し、ユーザの意思決定を支援することを可能にするためのデータ分析装置及びデータ分析方法並びにプログラムを提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明に係るデータ分析装置は、テキストデータと、時間情報と、時間情報以外の1又は複数の属性情報とを含むドキュメントの集合を格納するためのドキュメント格納手段と、前記ドキュメントのテキストデータから抽出すべきキー概念を含むキー概念辞書を格納するためのキー概念辞書格納手段と、前記属性情報に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、時間的に推移する一連のドキュメントであって最終結果を与えるものを含む部分集合を、複数選択するための選択手段と、選択された複数の前記部分集合の各々ごとに、前記キー概念辞書に基づいて、当該部分集合に属する複数のドキュメントの各々から、キー概念を抽出するための第1の抽出手段と、選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から、前記時間情報を抽出するための第2の抽出手段と、選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から抽出された前記キー概念及び該複数のドキュメントの各々に含まれる前記時間情報に基づいて、キー概念の時系列的な遷移を示す時系列データと該時系列データに対応する分類クラスとを含む概念時系列データを生成するための概念時系列データ生成手段と、選択された複数の前記部分集合の各々から生成された、複数の前記概念時系列データをもとにして、前記キー概念によって特徴付けられた有向アーク及び前記分類クラスによって特徴付けられた最終ノードを持つネットワーク表現によって構成されたモデルを生成するためのモデル生成手段とを備えたことを特徴とする。
【0014】
なお、装置に係る本発明は方法に係る発明としても成立し、方法に係る本発明は装置に係る発明としても成立する。
また、装置または方法に係る本発明は、コンピュータに当該発明に相当する手順を実行させるための(あるいはコンピュータを当該発明に相当する手段として機能させるための、あるいはコンピュータに当該発明に相当する機能を実現させるための)プログラムとしても成立し、該プログラムを記録したコンピュータ読取り可能な記録媒体としても成立する。
【0015】
本発明によれば、蓄積されたテキストデータ及び時間情報を含むドキュメントの集合から、規則性をモデル化するためのもととなる、単語(概念)時系列モデルを生成することが可能になる。
【0016】
また、本発明によれば、時間的に推移する一連のテキストデータの中から抽出されたキー概念の系列から、キー概念間の関係を記述するモデルを獲得することができる。
【0017】
また、本発明によれば、時間的に推移する一連のテキストデータの中から抽出されたキー概念の系列と一連のテキストデータの最後に抽出されるキー概念の系列を分類する分類クラスから、キー概念の系列とその分類クラスの関係を記述するモデルを獲得することができる。
【0018】
また、本発明によれば、獲得したモデルに基づいて、一連の新たなテキストデータから、引き続いて発生すると考えられるキー概念あるいは分類クラスを予測することができ、ユーザの意思決定を支援することができる。
【0019】
例えば、営業日報等の日々蓄積されるテキストデータに対して、時系列的な内容の推移に基づいて将来を予測するモデルを抽出し、そのモデルを利用した予測を行うことにより、利用者の意思決定を支援することができる。
【0020】
【発明の実施の形態】
以下、図面を参照しながら発明の実施の形態を説明する。
【0021】
(第1の実施形態)
図1に、本発明の第1の実施形態に係る時系列テキストデータ分析装置の構成例を示す。図1に示されるように、本時系列テキストデータ分析装置は、ドキュメント格納部1、キー概念辞書格納部2、概念抽出部3、ドキュメント時間抽出部4、概念時系列データ生成部5、概念時系列モデル学習部6、概念時系列モデル格納部7を備えている。
【0022】
この時系列テキストデータ分析装置は、ソフトウェアによって実現することができる(すなわち計算機上でプログラムを実行する形で実現することができる)。その際、そのソフトウェアの一部または全部の機能をチップ化あるいはボード化して該計算機に組み込んで実現することもできる。また、この時系列テキストデータ分析装置は、ソフトウェアによって実現する場合には、他のソフトウェアの一機能として組み込むようにすることも可能である。また、この時系列テキストデータ分析装置を専用のハードウェアとして構成することも可能である。
【0023】
ドキュメント格納部1、キー概念辞書格納部2、概念時系列モデル格納部7は、いずれも、例えばハードディスクや光ディスクや半導体メモリなどの記憶装置によって構成される。なお、各記憶部は、別々の記憶装置によって構成されていてもよいし、それらの全部または一部が同一の記憶装置によって構成されていてもよい。
【0024】
なお、図1では省略しているが、時系列テキストデータ分析装置は、外部とデータをやり取りするための入出力装置を備えている。もちろん、GUI(グラフィカル・ユーザ・インタフェース)を備えてもよいし、ネットワーク接続インタフェースを備えてもよい。
【0025】
ドキュメント格納部1に格納されるドキュメントは、それぞれ、テキストデータと、時間情報と、1又は複数の属性を含む。具体的には、小売業務における販売員の営業活動及び商品の売上動向を記載した時間的に推移する一連のテキスト、ヘルプデスク業務における顧客からの様々な問い合わせと回答内容を記載した時間的に推移する一連のテキストなど、種々の分野あるいは目的に適用可能である。
【0026】
以下、本時系列テキストデータ分析装置による処理について説明する。
【0027】
図2に、本時系列テキストデータ分析装置の処理手順の一例を示す。
【0028】
ここで、具体例として、ドキュメント格納部1には、図3に示すドキュメントの集合が格納されているものとする。なお、t1〜t21は、各ドキュメントの通し番号である。
【0029】
まず、ステップS11においては、ドキュメント格納部1に格納されているドキュメントを概念抽出部3に渡し、ドキュメントに付随する特徴に基づいて、関連するドキュメントからなるドキュメント部分集合を生成する。
【0030】
例えば、ドキュメントの特徴として、「相手先」、「担当」を選択した場合、「相手先」と「担当」とからなる組が一致するドキュメントごとに関連するドキュメントの集合を収集する。この場合、図3のドキュメントの集合から、図4〜図7に示す4種類のドキュメントの部分集合が生成される。
【0031】
なお、この関連するドキュメントを分類するキーは、例えば、外部から指定するようにしてもよい。また、クラスタリング手法を利用して、関連するドキュメントを集めるようにすることも可能である。その他にも、種々の方法が考えられる。
【0032】
ステップS12においては、概念抽出部3は、ステップS11で得られたドキュメントの部分集合の各々ごとに、当該ドキュメントの部分集合に属する各ドキュメントに付随する時間に関する情報(図3の例では、項目名「日時」の年月日のデータ)(例えば、当該ドキュメントが作成された年月日(年月日時分)、あるいは当該ドキュメントの本文に関係する年月日(年月日時分))を参照することにより、時間の早い順にドキュメントの並べ替えを行う。なお、図4〜図7の例においては、既にドキュメントは時間順に整列されているので、並べ替えによるドキュメントの格納位置の変更は発生しない。
【0033】
ステップS13においては、概念抽出部3は、ドキュメントの部分集合を一つ取り出す。このとき、取り出すドキュメントの部分集合が存在しなければ、ステップS19に処理を進める。一方、取り出すドキュメントの集合が存在する場合には、ステップS14に処理を進める。例えば、図4のドキュメント部分集合が取り出されたとする。
【0034】
ステップS14においては、概念抽出部3は、取り出したドキュメントの部分事例集合の中から、上から順に、ドキュメントを一つ取り出す(すなわち、時間の早い順に取り出されることになる)。このとき、取り出すドキュメントがない場合には、ステップS17に処理を進める。一方、取り出すドキュメントがある場合には、ステップS15に処理を進める。例えば、図4のドキュメント部分集合から、その先頭のドキュメントt1が取り出されたとする。
【0035】
ステップS15においては、概念抽出部3は、ステップS14にて取り出されたドキュメントに対して、形態素解析を適用して、ドキュメントを形態素に分割する。図8のl1に、この結果の一例を示す(なお、l1〜l5は、各ドキュメントを形態素解析した結果の通し番号である)。例えば、図4のドキュメントの部分集合の先頭のドキュメントt1の項目「本文」の内容(すなわち、“製品の売り込みに行ったところ手応えがあった。”)に対して、形態素解析を実施することにより、図8のl1に示す形態素の集合(すなわち、「製品」、「の」、「売り込み」、「に」、「行く」、「ところ」、「手応え」、「が」、「ある」、「。」)が得られる。
【0036】
ステップS16においては、概念抽出部3は、キー概念辞書格納部2に格納されているキー概念辞書とステップS15にて形態素解析された結果とを利用して、当該ドキュメントに対応する特徴を抽出して、当該ドキュメントに割り当てる。
【0037】
例えば、キー概念辞書格納部2に、図9に例示するキー概念辞書が格納されているものとして、図8のl1に示す形態素の集合に基づいて特徴を求める場合を考える。このとき、概念クラス「状況」、キー概念「売り込み」、表層表現「売り込み」が、形態素の集合の「売り込み」と一致するので、特徴「売り込み」が抽出される。また、概念クラス「印象」、キー概念「良好」、表層表現「手応えがある」が、形態素の集合の「手応え」、「が」、「ある」と一致するので、特徴「良好」が抽出される。図10に、この結果の一例を示す(なお、c1〜c5は、ドキュメントに対して生成される特徴量の集合の通し番号である)。
【0038】
以上は、繰り返し処理となり、図4の他のドキュメントについても同様に処理が行われる(図8のl2〜l5、図10のc2〜c5がこれに対応する)。
【0039】
さて、一つのドキュメント部分集合に属するすべてのドキュメントについて特徴の抽出が行われたならば、ステップS14からステップS17に移ることになる。
【0040】
ステップS17においては、概念時系列データ生成部5は、当該一つのドキュメント部分集合における時間的に最後のドキュメントを除いたドキュメントの集合に対して生成された特徴の集合と、ドキュメントに割り当てられている「時間」とを利用して、時系列データを生成する。なお、ドキュメントに割り当てられている「時間」は、ドキュメント時間抽出部4により与えられる。
【0041】
なお、ここでは、一例として、1日を基準として時系列データを生成するものとする。
【0042】
例えば、図4のドキュメントの部分集合の各ドキュメントに対して図10に例示する特徴量の集合が生成されているとすると、最後の特徴量の集合(c5)を除いた特徴量に対して、時系列データが生成される。すなわち、最初のドキュメントの時間を基準とし、特徴量の与えられている日には、特徴量の集合を与え、特徴量が与えられていない日には、特徴量が与えられていないことを示すデータ(例えば「しない」)を与えることにより、時系列データを生成する。
【0043】
この場合、図4のドキュメントの部分集合に対しては、図11(w1〜w4は、時系列データと分類クラスを組とした訓練事例の通し番号である)に例示する番号w1に対応する時系列データが生成される。この時系列データにおいて、特徴量の後に書かれている数値(例えば、(売り込み,良好)/1における1)が、当該特徴量が連続する回数を表している。
【0044】
ステップS18においては、概念時系列データ生成部5は、当該ドキュメントの部分集合における時間的に最後のドキュメントを利用して、ステップS17にて生成された時系列データに対応する分類クラスを生成する。なお、ドキュメントに割り当てられている「時間」は、ドキュメント時間抽出部4により与えられる。
【0045】
例えば、図4のドキュメントの部分集合から生成された図10の特徴量の集合において、番号c5の特徴量が最後の特徴量となるので、「受注成功」が分類クラスとなる。この場合、図11に例示する番号w1に対応する分類クラスが生成される。
【0046】
なお、これまでと同様の手順が、図5〜図7のドキュメントの部分集合に対しても実行され、ステップS13で処理ループを抜けた時点で、図11の時系列データと分類クラスの組が完成することになる(図11において番号w2〜w4の時系列データと分類クラスの組がそれぞれ図5〜図7に対応する)。
【0047】
ところで、上記の手順例では、時系列データとその分類クラスを生成する際に、時間的に最後のドキュメントから分類クラスを生成していたが、時間的に一連のドキュメントに対して、ユーザが分類クラスを指定するよう構成することも可能である。このような場合には、最後のドキュメントに対しても時系列データが生成されるようにして構わない。
【0048】
さて、ステップS19においては、概念時系列モデル学習部6は、図11に例示したような時系列データと分類クラスの組をもとに、モデルの自己組織化を行う。モデルの自己組織化が終了したら、当該モデルを概念時系列モデル格納部7に格納して、本モデル化処理を終了する。
【0049】
モデルの自己組織化の手法としては、ここでは、文献「対話タスクモデルのサンプル単語時系列からの自己組織化」、電子情報通信学会J83−D−II、 No.2、 p.827−839(2000年)に開示されている拡張画像オートマトンの自己組織化法を利用することができる。この手法は、6つの基本ルールと時系列データ間の関係に関する2種類の背景知識を利用することにより、モデルを自己組織化するものである。この手法を、時系列データとその分類クラスからなるデータに適用することによって、ネットワーク構造を持つモデルを自己組織化することができる。
【0050】
例えば、図11の4種類の時系列データと分類クラスの組が順に与えられるとすると、図12のモデルを得ることができる。ここで、Aa1〜Aa13は、概念時系列モデル格納部7に格納されるモデルを構成する通常アーク(意味的に類似した複数の単語を格納するアーク)を示す番号であり、Ab1,Ab2は、概念時系列モデル格納部7に格納されるモデルを構成するナル遷移アーク(単語を格納しないアーク)を示す番号であり、Na1〜Na6は、概念時系列モデル格納部7に格納されるモデルを構成する途中ノード(複数のアークの入力及び出力を可能としたノード)を示す番号であり、Nb1〜Nb3は、概念時系列モデル格納部7に格納されるモデルを構成する終了ノード(複数のアークの入力及び単語時系列に対応した応答の格納を可能としたノード)を示す番号である。
【0051】
ここで、上記文献に開示された拡張画像オートマトンの自己組織化法について簡単に説明する(詳しくは上記の文献に開示されている)。
【0052】
拡張画像オートマトンは、ネットワーク表現をもった知識表現であり、有向アークとノードから構成される。有向アークには、通常アーク及びナル遷移アークと呼ばれる2種類の有向アークが存在し、通常アークが意味的に類似した複数の単語を格納するのに対して、ナル遷移アークは単語を格納しない。また、通常アークを経由することにより、1単位時刻が経過するのに対して、ナル遷移アークを経由したとしても、時刻は経過しない。ここで、1単位時刻は、単語時系列における1単語の入力に対応する。このナル遷移アークを利用することにより、単語時系列に存在する複数種類の連続したノイズを表現することができる。
【0053】
一方、ノードには、途中ノード及び終了ノードと呼ばれる2種類のノードが存在する。途中ノードは、複数のアークの入力及び出力を可能としたノードであり、終了ノードは、複数のアークの入力及び単語時系列に対応した応答の格納を可能としたノードである。このようなノードに対して、ノードとノードとの間に多数のアークが存在すると、多数の単語の組合せを表現することができる。ただし、同一方向をもった複数のアークがノード間に存在すると、どのアークを利用したかが不明確になり、単語時系列の識別が困難になるため、単語時系列に対して、適切な応答を推論することが難しくなる。したがって、任意のノード間の同一方向に対しては、各アークの種類ごとに、せいぜい一つのアークしか設定しないものとしている。
【0054】
ここで、本手法においては、6つの基本ルールと時系列データ間の関係に関する2種類の背景知識を利用することにより、モデルを自己組織化する。
【0055】
まず、6つの基本ルールについて簡単に説明する。
【0056】
(1)アーク利用ルール:現在の状態に対応するノードを起点とする通常のアークに、入力された単語と同一の単語が割り当てられ、単語のタイプとアークの終点となるノードのタイプが同一ならば、当該アークを利用して、終点となるノードに状態を遷移する。
【0057】
(2)ナル遷移アーク利用ルール:現在の状態に対応するノードを起点とするナル遷移アークの終点となるノードを起点とする通常のアークに、入力された単語と同一の単語が割り当てられ、単語のタイプと到達するノードのタイプが同一ならば、これらのアークを利用して、通常のアークの終点となるノードに状態を遷移する。
【0058】
(3)自己ループ生成ルール:終端にない連続する二つの単語が同一であり、現在の状態に対応するノードに自己ループを生成可能であれば、当該ノードを起点かつ終点とする通常のアークを生成して、当該アークに一つの単語を割り当てる。このとき、状態の遷移は行われない。
【0059】
(4)先読みアーク利用ルール:現在の単語の次の単語と同一の単語が割り当てられたアークで、当該アークの終点となるノードのタイプが次の単語のタイプと一致し、現在のノードから当該アークの起点となるノードに通常のアークが生成可能ならば、現在のノードと当該アークの起点となるノードの間にアークを生成し、生成したアークに現在の単語を割り当て、当該アークの終点となるノードに状態を遷移する。
【0060】
(5)ナル遷移アーク生成ルール:現在の単語と同一の単語が割り当てられたアークで、当該アークの終点となるノードのタイプが次の単語のタイプと一致し、現在のノードから当該アークの起点となるノードにナル遷移アークが生成可能ならば、現在のノードと当該アークの起点となるノード間にナル遷移アークを生成し、当該アークの終点となるノードに状態を遷移する。
【0061】
(6)新規ノード生成ルール:新たにノードを一つ生成し、現在のノードとそのノードの間に現在の単語を割り当てた通常アークを生成し、生成したノードに状態を遷移する。
【0062】
次に、2種類の背景知識について簡単に説明する。
【0063】
(1)同一視可能知識:単語時系列の識別能力を保持しつつ、コンパクトなネットワーク表現を獲得するためには、同一のアークに割り当てられる単語を制限する必要がある。そこで、同一のアークに割当て可能な単語の組合せを同一視可能知識として記述する。このような単語に隣接する単語集合は、類似したものになると期待できるので、単語時系列の識別能力を保持しつつ、コンパクトなネットワーク表現を獲得することができる。また、同一視可能な単語と隣接する単語とのすべての組合せを入力しなくても、単語の組合せを表現することができるので、少ない単語時系列とその応答からネットワーク表現を自己組織化することができる。
【0064】
(2)交換可能知識:単語の出現順序を入れ替えた場合に、その応答が同じとなる単語時系列であったとしても、基本ルールを適用するだけでは、すべての出現順序の組合せを入力しないと、対応するネットワーク表現を自己組織化することができない。しかしながら、同じ応答に対応する類似した単語時系列を、個々に入力しなければならないとすれば、多くの単語時系列の入力が必要となる。そこで、単語の出現順序を入れ替えてもその応答が同じとなる単語を交換可能な単語として記述し、交換可能な単語の組合せが単語時系列内に出現した場合に、与えられている出現順序ばかりか、入れ替えた出現順序をも表現するネットワーク表現を自己組織化する。このとき、既存のネットワーク表現の中に交換可能な単語を格納する通常アークが存在する場合には、できるだけそのアークを利用するような自己組織化を行う。
【0065】
次に、自己組織化フローについて簡単に説明する。
【0066】
先の6つの基本ルールと2種類の背景知識を利用することにより、単語時系列とその応答からネットワーク表現を下記の手順にしたがって自己組織化する。
(ステップ1)単語時系列を入力する。
(ステップ2)単語時系列の中から次の単語を取り出し、現在の単語とする。取り出せない場合には、現在のノードを終了ノードとして、単語時系列とその応答を割当て、自己組織化を終了する。
(ステップ3)現在の単語が直前に適用した先読みアーク利用ルールにより、既に利用されている場合には、ステップ6に進む。また、直前に適用した自己ループ生成ルールにより、既に利用されている場合には、ステップ2に戻る。
(ステップ4)同一視可能知識を考慮して、基本ルールを評価する。
(ステップ5)条件が成立した最も上位の基本ルールを実行する。
(ステップ6)単語時系列における前出の単語を一つ取り出す。
(ステップ7)取り出す単語がない場合には、ステップ2に戻る。
(ステップ8)取り出した単語と現在の単語との間に交換可能性が成立しない場合には、ステップ6に戻る。
(ステップ9)取り出した単語と現在の単語との間で、交換可能知識による自己組織化を行い、ステップ6に戻る。
【0067】
この手順においては、基本ルールの判定に同一視可能知識を適用し、単語が一致するかどうかの判定の代わりに、単語が同一視可能かどうかの判定を行っている。また、単語時系列の最初の単語に対しては、起点となるノードを同時に決定する必要があるため、ナル遷移に関連する基本ルールが成立する場合には、アーク利用ルールが必ず成立する。したがって、最初の単語の場合には、ナル遷移に関連する基本ルールを判定する必要がない。最後に、交換可能知識に関しては、単語時系列に現れるすべての単語の組合せに対して、検討する必要があるので、現在の単語とそれ以前に出現しているすべての単語との間に交換可能性が成立するかどうかを判定し、交換可能性が成立する場合に、対応する自己組織化を行っている。
【0068】
以上が、拡張画像オートマトンの自己組織化法についての簡単な説明である。
【0069】
(第2の実施形態)
図13に、本発明の第2の実施形態に係る時系列テキストデータ分析装置の構成例を示す。図13に示されるように、本時系列テキストデータ分析装置は、ドキュメント格納部1、キー概念辞書格納部2、概念抽出部3、ドキュメント時間抽出部4、概念時系列データ生成部5、概念時系列モデル学習部6、概念時系列モデル格納部7、概念時系列予測部8を備えている。
【0070】
本時系列テキストデータ分析装置は、第1の実施形態の構成に、新たなドキュメントの系列に対して次に発生する状況を予測する処理等を行うための概念時系列予測部8を付加したものである。
【0071】
本実施形態においては、モデルの自己組織化を行う機能の部分は、第1の実施形態と同様であるので、以下では、第2の実施形態で付加した予測する処理等の機能の部分について説明する。
【0072】
図14に、本時系列テキストデータ分析装置の処理手順の一例を示す。
【0073】
ここで、第1の実施形態で説明したような処理によって、図12に例示したモデルが得られ、概念時系列モデル格納部7に格納されているものとする。
【0074】
また、予測のもとになる新たなドキュメント(評価対象のドキュメント)の系列として、図15に例示する関連するドキュメントが、ドキュメント格納部1に与えられているものとする。なお、e1,e2は、評価対象のドキュメントの通し番号である。
【0075】
まず、ステップS21においては、概念抽出部3により、評価対象となる関連するドキュメントに付随する時間に従って、ドキュメントを時間順に並べる。図15の例においては、既に時間順にドキュメントが与えられているので、本ステップにおいては特に何も行われない。
【0076】
ステップS22においては、概念抽出部3により、評価対象となる関連するドキュメントの中からドキュメントを一つ取り出す。このとき、取り出すドキュメントがなければ、ステップS25に処理を進める。また、取り出すドキュメントがあれば、ステップS23に処理を進める。
【0077】
ステップS23においては、概念抽出部3により、図2の処理手順のステップS15と同様の処理を行い、ドキュメントに対応する形態素の集合を生成する。
【0078】
ステップS24においては、概念抽出部3により、図2の処理手順のステップS16と同様の処理を行い、ドキュメントに対応する特徴を抽出し、ステップS22に処理を戻す。
【0079】
ステップS25においては、概念時系列データ生成部5(とドキュメント時間抽出部4)により、図2の処理手順のステップS17と同様の処理を行い、ドキュメントに対応する特徴と時間から時系列データを生成する。ただし、図2のステップS17においては、時間的に最後のドキュメントを処理対象としなかったが、このステップS25においては、最後のドキュメントも処理対象とする。従って、ここでは、図15の関連するドキュメントに対して、図16に示す時系列データが生成される。なお、x1は、評価対象のドキュメントから生成される時系列データの通し番号である。
【0080】
さて、ステップS26においては、概念時系列予測部8は、概念時系列モデル格納部7に格納されている自己組織化されたモデル(図12参照)と、ステップS25で得られた時系列データ(図16参照)をもとにして、推論を行う。
【0081】
推論の手法としては、文献「対話タスクモデルのサンプル単語時系列からの自己組織化」、電子情報通信学会J83−D−II、 No.2、 p.827−839(2000年)に開示されている拡張画像オートマトンの推論法に従った推論を利用することができる。この手法では、各時系列データを一つずつモデルに適用することにより、各ノードが保持する時系列データ及び時系列データに対応する評価値を更新する。
【0082】
例えば、図16の時系列データを図12のモデルに順次適用していくと、すべての時系列データを適用した段階で、ノードNa6にこの時系列データが伝播し、その評価値が1.0(最大値)となる。
【0083】
ステップS27においては、概念時系列予測部8は、時系列データが何もないという特別なデータをモデルに適用することにより、拡張画像オートマトンの推論法に従って、モデル内の時間を進める。また、末端ノードにおいて、到達した時系列データ及び評価値を評価し、評価値が高い場合に、当該末端ノードに対応する応答を出力する。また、概念時系列予測部8は、応答が出力される様子を観測することにより、発生しやすい状況を予測する。例えば、図16の時系列データをすべて図12に適用し、時間を進めると、本時系列データは、すべての末端ノードNb1〜Nb3に到達する。このとき、末端ノードNb2には、末端ノードNb1,Nb3よりも速い時間で、時系列データが到達する。従って、現状では、「受注失敗」に到達する可能性の方が高いことがわかる。この結果、それらの予測結果をユーザに呈示することができる。
【0084】
なお、上記の予測において、現在の時系列データから生じる可能性を示すだけでなく、望ましい方向あるいは目標とする方向に進むための方法をユーザに提示することも可能である。すなわち、ステップS27において、到達した末端ノードのうち、望ましい応答を与える末端ノードから、隣接するアーク及びノードを辿り、時間を遡っていくことにより、当該方向に進むための方法あるいは条件をユーザに提示することができる。
【0085】
なお、以上の各機能は、ソフトウェアとして実現可能である。
また、本実施形態は、コンピュータに所定の手段を実行させるための(あるいはコンピュータを所定の手段として機能させるための、あるいはコンピュータに所定の機能を実現させるための)プログラムとして実施することもでき、該プログラムを記録したコンピュータ読取り可能な記録媒体として実施することもできる。
【0086】
なお、この発明の実施の形態で例示した構成は一例であって、それ以外の構成を排除する趣旨のものではなく、例示した構成の一部を他のもので置き換えたり、例示した構成の一部を省いたり、例示した構成に別の機能あるいは要素を付加したり、それらを組み合わせたりすることなどによって得られる別の構成も可能である。また、例示した構成と論理的に等価な別の構成、例示した構成と論理的に等価な部分を含む別の構成、例示した構成の要部と論理的に等価な別の構成なども可能である。また、例示した構成と同一もしくは類似の目的を達成する別の構成、例示した構成と同一もしくは類似の効果を奏する別の構成なども可能である。
また、この発明の実施の形態で例示した各種構成部分についての各種バリエーションは、適宜組み合わせて実施することが可能である。
また、この発明の実施の形態は、装置全体としての発明、装置内部の構成部分についての発明、またはそれらに対応する方法の発明等、種々の観点、段階、概念またはカテゴリに係る発明を包含・内在するものである。
従って、この発明の実施の形態に開示した内容からは、例示した構成に限定されることなく発明を抽出することができるものである。
【0087】
本発明は、上述した実施の形態に限定されるものではなく、その技術的範囲において種々変形して実施することができる。
【0088】
【発明の効果】
本発明によれば、蓄積されたテキストデータ及び時間情報を含むドキュメントの集合から、規則性をモデル化するためのもととなる、単語(概念)時系列モデルを生成することが可能になる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る時系列テキストデータ分析装置の構成例を示す図
【図2】同実施形態に係る時系列テキストデータ分析装置の処理手順の一例を示すフローチャート
【図3】ドキュメント格納部に格納されているドキュメントの一例を示す図
【図4】ドキュメント格納部に格納されているドキュメント集合から抽出されたC1社かつM1氏に関連するドキュメント部分集合の一例を示す図
【図5】ドキュメント格納部に格納されているドキュメント集合から抽出されたC2社かつM2氏に関連するドキュメント部分集合の一例を示す図
【図6】ドキュメント格納部に格納されているドキュメント集合から抽出されたC3社かつM1氏に関連するドキュメント部分集合の一例を示す図
【図7】ドキュメント格納部に格納されているドキュメント集合から抽出されたC4社かつM2氏に関連するドキュメント部分集合の一例を示す図
【図8】図4のドキュメント部分集合に含まれる各ドキュメントの本文を形態素解析した結果の一例を示す図
【図9】キー概念辞書格納部に格納されるキー概念辞書の一例を示す図
【図10】図8の形態素解析結果を図9のキー概念定義辞書に適用することにより生成される特徴量の集合の一例を示す図
【図11】ドキュメント格納部に格納されるドキュメントに対して生成される時系列データと分類クラスの組の一例を示す図
【図12】自己組織化されたモデルの一例を示す図
【図13】同実施形態に係る時系列テキストデータ分析装置の他の構成例を示す図
【図14】同実施形態に係る時系列テキストデータ分析装置の自己組織化されたモデルに基づいて一連の新たなドキュメントから生じる結果を予測する処理手順の一例を示すフローチャート
【図15】評価対象となる関連するドキュメントの一例を示す図
【図16】図15の関連するドキュメントから生成される時系列データの一例を示す図
【符号の説明】
1…ドキュメント格納部
2…キー概念辞書格納部
3…概念抽出部
4…ドキュメント時間抽出部
5…概念時系列データ生成部
6…概念時系列モデル学習部
7…概念時系列モデル格納部
8…概念時系列予測部

Claims (14)

  1. テキストデータと、時間情報と、時間情報以外の1又は複数の属性情報とを含むドキュメントの集合を格納するためのドキュメント格納手段と、
    前記ドキュメントのテキストデータから抽出すべきキー概念を含むキー概念辞書を格納するためのキー概念辞書格納手段と、
    前記属性情報に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、時間的に推移する一連のドキュメントであって最終結果を与えるものを含む部分集合を、複数選択するための選択手段と、
    選択された複数の前記部分集合の各々ごとに、前記キー概念辞書に基づいて、当該部分集合に属する複数のドキュメントの各々から、キー概念を抽出するための第1の抽出手段と、
    選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から、前記時間情報を抽出するための第2の抽出手段と、
    選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から抽出された前記キー概念及び該複数のドキュメントの各々に含まれる前記時間情報に基づいて、キー概念時系列的な遷移を示す時系列データと該時系列データに対応する分類クラスとを含む概念時系列データを生成するための概念時系列データ生成手段と、
    選択された複数の前記部分集合の各々から生成された、複数の前記概念時系列データをもとにして、前記キー概念によって特徴付けられた有向アーク及び前記分類クラスによって特徴付けられた最終ノードを持つネットワーク表現によって構成されたモデルを生成するためのモデル生成手段とを備えたことを特徴とするデータ分析装置。
  2. 前記生成手段は、自己組織化法により、前記複数の前記概念時系列データをもとにして、前記モデルを生成することを特徴とする請求項1に記載のデータ分析装置。
  3. 前記キー概念辞書は、表層表現とキー概念との対応を示す情報を含み、
    前記第1の抽出手段は、前記ドキュメントの形態素解析結果と、前記キー概念辞書の表層表現を比較して、該表層表現に対応する前記キー概念を抽出することを特徴とする請求項1または2に記載のデータ分析装置。
  4. 記選択手段は、外部から指定された1又は複数の前記属性情報に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、前記部分集合を選択することを特徴とする請求項1または2に記載のデータ分析装置。
  5. 記選択手段は、前記属性情報の全部又は一部にクラスタリングを適用した結果に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、前記部分集合を選択することを特徴とする請求項1または2に記載のデータ分析装置。
  6. 前記概念時系列データのもととなった前記部分集合において時間的に最も遅い時間情報を持つ前記ドキュメントから抽出された前記キー概念を、該概念時系列データに対応する分類クラスとするものであることを特徴とする請求項1または2に記載のデータ分析装置。
  7. 前記時間情報は、前記ドキュメントが作成された日付又は日付及び時刻を示すものであることを特徴とする請求項1ないしのいずれか1項に記載のデータ分析装置。
  8. 前記時間情報は、前記ドキュメントに含まれる前記テキストデータの内容に関係する日付又は日付及び時刻を示すものであることを特徴とする請求項1ないしのいずれか1項に記載のデータ分析装置。
  9. 予測対象とする複数の前記ドキュメントから生成した前記概念時系列データに前記モデルを適用して、該概念時系列データの持つ時間情報より後に発生すると予測されるキー概念を抽出するための予測手段を更に備えたことを特徴とする請求項1ないし8のいずれか1項に記載のデータ分析装置。
  10. 前記予測手段は、前記発生すると予測されるキー概念が複数存在し、そのうちに目標とするキー概念と、それ以外のキー概念とが存在する場合に、目標とするキー概念に到達するための条件を抽出することを特徴とする請求項9に記載のデータ分析装置。
  11. テキストデータと、時間情報と、時間情報以外の1又は複数の属性情報とを含むドキュメントの集合を格納するためのドキュメント格納手段と、前記ドキュメントのテキストデータから抽出すべきキー概念を含むキー概念辞書を格納するためのキー概念辞書格納手段と、選択手段と、第1の抽出手段と、第2の抽出手段と、概念時系列データ生成手段と、モデル生成手段とを備えたデータ分析装置におけるデータ分析方法であって、
    前記ドキュメント格納手段が、前記ドキュメントの集合を格納するステップと
    前記選択手段が、前記属性情報に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、時間的に推移する一連のドキュメントであって最終結果を与えるものを含む部分集合を、複数選択するステップと
    前記第1の抽出手段が、選択された複数の前記部分集合の各々ごとに、前記キー概念辞書に基づいて、当該部分集合に属する複数のドキュメントの各々から、キー概念を抽出するとともに、前記第2の抽出手段において、選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から、前記時間情報を抽出するステップと
    前記概念時系列データ生成手段が、選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から抽出された前記キー概念及び該複数のドキュメントの各々に含まれる前記時間情報に基づいて、キー概念の時系列的な遷移を示す時系列データと該時系列データに対応する分類クラスとを含む概念時系列データを生成するステップと
    前記モデル生成手段が、選択された複数の前記部分集合の各々から生成された、複数の前記概念時系列データをもとにして、前記キー概念によって特徴付けられた有向アーク及び前記分類クラスによって特徴付けられた最終ノードを持つネットワーク表現によって構成されたモデルを生成するステップとを有することを特徴とするデータ分析方法。
  12. 前記データ分析装置は予測手段を更に備えるものであり、
    前記データ分析方法は、前記予測手段が、予測対象とする複数の前記ドキュメントから生成した前記概念時系列データに前記モデルを適用して、該概念時系列データの持つ時間情報より後に発生すると予測されるキー概念を抽出するステップを更に有するものであることを特徴とする請求項11に記載のデータ分析方法。
  13. テキストデータと、時間情報と、時間情報以外の1又は複数の属性情報とを含むドキュメントの集合を格納するためのドキュメント格納機能と、
    前記ドキュメントのテキストデータから抽出すべきキー概念を含むキー概念辞書を格納するためのキー概念辞書格納機能と、
    前記属性情報に基づいて、前記ドキュメント格納手段に蓄積された前記ドキュメントの集合から、時間的に推移する一連のドキュメントであって最終結果を与えるものを含む部分集合を、複数選択するための選択機能と、
    選択された複数の前記部分集合の各々ごとに、前記キー概念辞書に基づいて、当該部分集合に属する複数のドキュメントの各々から、キー概念を抽出するための第1の抽出機能と、
    選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から、前記時間情報を抽出するための第2の抽出機能と、
    選択された複数の前記部分集合の各々ごとに、当該部分集合に属する複数のドキュメントの各々から抽出された前記キー概念及び該複数のドキュメントの各々に含まれる前記時間情報に基づいて、キー概念時系列的な遷移を示す時系列データと該時系列データに対応する分類クラスとを含む概念時系列データを生成するための概念時系列データ生成機能と、
    選択された複数の前記部分集合の各々から生成された、複数の前記概念時系列データをもとにして、前記キー概念によって特徴付けられた有向アーク及び前記分類クラスによって特徴付けられた最終ノードを持つネットワーク表現によって構成されたモデルを生成するためのモデル生成機能とをコンピュータに実現させるためのプログラム。
  14. 予測対象とする複数の前記ドキュメントから生成した前記概念時系列データに前記モデルを適用して、該概念時系列データの持つ時間情報より後に発生すると予測されるキー概念を抽出するための予測機能を更に前記コンピュータに実現させるためのものであることを特徴とする請求項13に記載のプログラム。
JP2001157198A 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム Expired - Fee Related JP3813837B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001157198A JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム
US10/151,965 US20020178155A1 (en) 2001-05-25 2002-05-22 Data analyzer apparatus and data analytical method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001157198A JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2002351899A JP2002351899A (ja) 2002-12-06
JP3813837B2 true JP3813837B2 (ja) 2006-08-23

Family

ID=19001093

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001157198A Expired - Fee Related JP3813837B2 (ja) 2001-05-25 2001-05-25 データ分析装置及びデータ分析方法並びにプログラム

Country Status (2)

Country Link
US (1) US20020178155A1 (ja)
JP (1) JP3813837B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4202798B2 (ja) * 2003-03-20 2008-12-24 株式会社東芝 時系列パターン抽出装置および時系列パターン抽出プログラム
US8874561B2 (en) * 2003-03-31 2014-10-28 Sap Se Time series data management
JP4398777B2 (ja) * 2004-04-28 2010-01-13 株式会社東芝 時系列データ分析装置および方法
US7630987B1 (en) * 2004-11-24 2009-12-08 Bank Of America Corporation System and method for detecting phishers by analyzing website referrals
JP2007041683A (ja) * 2005-08-01 2007-02-15 Toshiba Corp 系列パターン抽出装置、系列パターン抽出方法、および系列パターン抽出プログラム
JP2007157058A (ja) * 2005-12-08 2007-06-21 Toshiba Corp 分類モデル学習装置、分類モデル学習方法、及び分類モデルを学習するためのプログラム
WO2008055034A2 (en) * 2006-10-30 2008-05-08 Noblis, Inc. Method and system for personal information extraction and modeling with fully generalized extraction contexts
JP5162151B2 (ja) * 2007-03-29 2013-03-13 株式会社中電シーティーアイ 入力情報分析装置
US8793264B2 (en) * 2007-07-18 2014-07-29 Hewlett-Packard Development Company, L. P. Determining a subset of documents from which a particular document was derived
US20110307488A1 (en) * 2009-02-27 2011-12-15 Mitsubishi Electric Corporation Information processing apparatus, information processing method, and program
JP5048852B2 (ja) * 2011-02-25 2012-10-17 楽天株式会社 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP5559352B2 (ja) * 2012-05-31 2014-07-23 株式会社東芝 知見抽出装置、知見更新装置、及びプログラム
US9400999B2 (en) * 2013-03-15 2016-07-26 Proofpoint, Inc. Detecting, classifying, and enforcing policies on social networking activity
US10169353B1 (en) * 2014-10-30 2019-01-01 United Services Automobile Association (Usaa) Grouping documents based on document concepts
JP7343311B2 (ja) * 2019-06-11 2023-09-12 ファナック株式会社 文書検索装置及び文書検索方法
US11551024B1 (en) * 2019-11-22 2023-01-10 Mastercard International Incorporated Hybrid clustered prediction computer modeling

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6076088A (en) * 1996-02-09 2000-06-13 Paik; Woojin Information extraction system and method using concept relation concept (CRC) triples

Also Published As

Publication number Publication date
JP2002351899A (ja) 2002-12-06
US20020178155A1 (en) 2002-11-28

Similar Documents

Publication Publication Date Title
Taymouri et al. Business process variant analysis: Survey and classification
Babu et al. Exploring big data-driven innovation in the manufacturing sector: evidence from UK firms
JP3813837B2 (ja) データ分析装置及びデータ分析方法並びにプログラム
Ngai et al. Application of data mining techniques in customer relationship management: A literature review and classification
Mishra et al. Predictive analytics: A survey, trends, applications, oppurtunities & challenges
US7777743B2 (en) Viewing multi-dimensional data through hierarchical visualization
Cheng et al. Probabilistic model for destination inference and travel pattern mining from smart card data
JP6937556B2 (ja) 複数のメディアソースからのコンテンツの組織化及び視覚化
WO2020174233A1 (en) Machine-learned model selection network planning
Seymen et al. Customer churn prediction using deep learning
Bouzidi et al. Deep learning-based automated learning environment using smart data to improve corporate marketing, business strategies, fraud detection in financial services, and financial time series forecasting
CN109710306A (zh) 源代码解析装置、源代码解析方法、计算机可读记录介质
Tsai et al. A dynamic web service based data mining process system
Nikiforova et al. Mapping of Source and Target Data for Application to Machine Learning Driven Discovery of IS Usability Problems.
Anitha Social media data analysis: rough set theory based innovative approach
KR102210772B1 (ko) 온라인 데이터에 기반한 사용자 성 정체성 예측 장치 및 방법
JP6360625B2 (ja) 検証支援システム及び方法
US11568177B2 (en) Sequential data analysis apparatus and program
CN105893343A (zh) 信息管理装置及信息管理方法
Hasan et al. Multi-criteria rating and review based recommendation model
Casabayó et al. Using AI techniques in the grocery industry: Identifying the customers most likely to defect
Johansson et al. Customer segmentation using machine learning
JP2002297387A (ja) 因果関係モデル生成方法および因果関係モデル生成装置および因果システムモデル構成装置および原因推定方法および原因推定装置およびプログラムおよび記録媒体
Chen et al. Customer segmentation and classification from blogs by using data mining: an example of VOIP phone
Farjoo et al. Design of a recommender system for online shopping using decision tree and Apriori algorithm

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060314

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060530

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060601

LAPS Cancellation because of no payment of annual fees