JP4146326B2 - 時系列活動データ分析装置、方法及びプログラム - Google Patents

時系列活動データ分析装置、方法及びプログラム Download PDF

Info

Publication number
JP4146326B2
JP4146326B2 JP2003365150A JP2003365150A JP4146326B2 JP 4146326 B2 JP4146326 B2 JP 4146326B2 JP 2003365150 A JP2003365150 A JP 2003365150A JP 2003365150 A JP2003365150 A JP 2003365150A JP 4146326 B2 JP4146326 B2 JP 4146326B2
Authority
JP
Japan
Prior art keywords
time
time series
series
pattern
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003365150A
Other languages
English (en)
Other versions
JP2005128887A (ja
Inventor
研 植野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2003365150A priority Critical patent/JP4146326B2/ja
Publication of JP2005128887A publication Critical patent/JP2005128887A/ja
Application granted granted Critical
Publication of JP4146326B2 publication Critical patent/JP4146326B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は日報、カルテあるいは活動履歴などの時系列活動データを分析する装置に関する。より具体的には、例えば時系列活動データから互いの過去の時系列的関係性を抽出することにより営業活動や研究プロジェクト、医療活動、日々のグループ活動などを円滑に進めるための意思決定を支援する技術に関する。
現在、営業などに関する日報データについて予め決められた項目内のカテゴリカルデータや数値データを分析したり、さらに日報データ中のテキストデータを解析するシステムも知られている。しかしながら、日報データ中のテキストデータを時系列的に分析するようなものは未だ存在しておらず、何らかの検索結果を時系列に並べるだけの冗長な情報提示にとどまっている。
例えば、特許文献1に開示されるような日報分析手法は、非テキストデータからの時系列情報の抽出にとどまっている。非特許文献1では、カテゴリカルデータからの検索方法が開示されているが、テキストデータから直接的に時系列的パターンを生成する方法については言及していない。非特許文献2には、系列データから頻出系列パターンを生成する方法について開示されているが、系列データをどのように生成するかということについては言及していない。
特開2000−242689公報 C. Bettini et.al. Time Granularities in Databases, Data Mining, and Temporal Reasoning, Springer, 2000. Ramakrishnan Srikant et.al. Mining Sequential Patterns: Generalizations and Performance Improvements, Proc. 5th Int. Conf. Extending Database Technology(EDBT),p.3-17,1996.
本発明の目的は、日報データのようなテキストデータを含む時系列活動データから活動内容の時系列な関係性を抽出することで、営業活動、研究プロジェクト、医療活動及び日々のグループ活動などを円滑に進めるための意思決定に有用な時系列活動データ分析装置、方法及びプログラムを提供することにある。
上記の課題を解決するため、本発明に従う時系列活動データ分析装置は、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力するデータ入力手段と、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する形態素解析手段と、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶したキー概念辞書記憶手段と、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出するキー概念抽出手段と、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する時系列データ生成手段と、前記複数の時系列データを記憶する時系列データ記憶手段と、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する時系列パターン生成手段と、前記時系列パターンを記憶する時系列パターン記憶手段と、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する手段であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な検索手段と、を具備する。
また、本発明によるとデータ入力手段が、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力する処理と、形態素解析手段が、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する処理と、キー概念辞書記憶手段が、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶する処理と、キー概念抽出手段が、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出する処理と、時系列データ生成手段が、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する処理と、時系列データ記憶手段が、前記複数の時系列データを記憶する処理と、時系列パターン生成手段が、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する処理と、時系列パターン記憶手段が、前記時系列パターンを記憶する処理と、検索手段が、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する処理であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な処理と、をコンピュータに行わせるためのプログラムを提供することができる。
本発明によると、複数の人の活動に関する時系列的な関係性を有する時系列パターンを生成できるため、営業活動、研究プロジェクト、医療活動及び日々のグループ活動などを円滑に進めるための意思決定に有用な情報を得ることができる。
以下、本発明を時系列活動データの典型的な例の一つである営業日報データの分析に適用した実施の形態について説明する。
図1に示されるように、本発明の一実施形態が適用されるシステムは端末T1〜TN、サーバS及び日報データベースDB1を有する。端末T1〜TNと日報データベースDB1は、インターネットまたはLAN(ローカルエリアネットワーク)のようなネットワークNWを介して接続される。日報データベースDB1は、ネットワークNWを介してサーバSに接続されてもよいし、直接サーバSに接続されていてもよい。端末T1〜TNは、具体的にはPDA(Personal Digital Assistant)、ノート型PC(Personal Computer)、携帯電話機のような携帯端末、あるいはデスクトップ型PCなどである。端末は一台でもよいし、複数台であってもよい。
本発明の実施形態に従う時系列活動データ分析装置(ここでは日報データを対象としているため、日報データ分析装置と呼ぶ)は、例えば企業の営業担当者から入力される日報データを主としてそれ以外の第三者、例えば複数の営業担当者を統括管理する管理者が日報データを参照して分析する場合に用いられる。勿論、営業担当者が、自身あるいは他の営業担当者を含む複数の営業担当者から入力される日報データを分析する場合にも利用できる。本実施形態でいうユーザとは、一般には営業担当者または管理者である。
端末T1は、図2に示すデータ入力部C1とパターン検索・表示部P1を有する。営業担当者は、データ入力部C1を用いて自身の営業活動に関する日報データを入力する。日報データとしては、少なくとも顧客名、担当者氏名または従業員番号、所属、活動日、案件名及び活動内容のテキストデータを含むものとする。入力された日報データは、日報データベースDB1に蓄積される。パターン検索・表示部P1については、後に詳しく説明する。
図2には、サーバSと端末T1の詳細な構成を示す。サーバSはコンピュータを用いて構成されており、処理機能要素として形態素解析部C2、概念抽出部C3、時系列データ生成部C4、時系列パターン生成部C5、頻度計算部C6、参照リンク生成部C7及びパターン検索部C8を有する。従って、これらの処理機能要素の処理は、記録媒体に記録されたコンピュータプログラムを読み出して実行することにより実現することができる。サーバSは、さらにハードディスク装置のような記憶装置により実現される記憶機能要素として形態素解析辞書DB2、キー概念辞書DB8、時系列属性値データベースDB3、時系列定義データベースDB4、概念データベースDB5、時系列データベースDB6、時系列パターンデータベースDB7及び参照リンクデータベースDB9を有する。一方、端末T1内のパターン検索・表示部P1は表示部C10、参照部C11及び検索入力部C12を有する。
次に、図3に沿って本実施形態に従う日報データ分析装置の処理の流れを図2中に示した各要素の詳細と共に説明する。日報データベースDB1には、例えば図4に示すような営業活動に関わる活動メタデータと活動内容を記した文章のデータ(テキストデータ)からなる日報データが格納されている。活動メタデータは、図4の例では少なくとも活動に関する時間情報である活動日、案件名、顧客名及び営業担当者氏名_所属を含む。活動内容のテキストデータは、例えば図5に示すような第三者向けの文章として記述される。さらに、それぞれの日報データには番号(No.)が付されている。
サーバSは日報データの分析に際して、まず日報データベースDB1から日報データ、すなわち図4に示すような活動メタデータと図5に示すような活動内容の文章のテキストデータを入力し(ステップS11)、形態素解析部C2によって形態素解析辞書DB2を用いてテキストデータについて形態素解析を行う(ステップS12)。図6に形態素解析辞書DB2の例、図7に形態素解析結果である形態素列の例をそれぞれ示す。図7は、図5中の文章1に対応して得られる形態素列である。
次に、生成された形態素列から概念抽出部C3によってキー概念辞書DB8を用いてキー概念系列を抽出し、概念データベースDB5へ格納する(ステップS13)。キー概念辞書DB8は、例えば図8に示すように形態素列中の単語・熟語を主体とした各表現(表層表現という)と、ある複数の表層表現に共通する概念あるいは上位の概念(これらをキー概念という)とを対応付けて記憶したデータベースであり、図8の例では例えば「メリット、有利、優る、良い点」という表層表現に対して、「利点」がキー概念として対応付けられている。図10に、このようなキー概念辞書DB8を用いて形態素列から抽出されるキー概念系列の例を示す。キー概念系列は、ある一つの文章から得られる形態素列中の各表層表現に対応するキー概念の集合である。図9には、実際に図7の形態素列から抽出されるキー概念系列の列を示す。図10では各キー概念系列に対してキー概念ID(データNo.)が付与されている。
次に、概念データベースDB5に格納されたキー概念系列から、時系列データ生成部C4によって時系列属性値データベースDB3、時系列定義データベースDB4及びキー概念辞書データベースDB8を用いて時系列データを生成し、時系列データベースDB6へ格納する(ステップS14)。ここで、時系列データとは後述するように、指定された集約条件に従ってキー概念を集約したキー概念の集合を指定された時間間隔で時系列に並べたものをいう。
時系列属性値データベースDB3には、後述する時系列データの属性値を表す時系列属性値が格納される。時系列属性値としては、この例では図11に示されるように前述の活動メタデータと同じ項目、すなわち活動日、案件名、顧客名及び営業担当者氏名_所属が記述される。
時系列定義データベースDB4には、時系列データをどのような基準で定義するかを示す時系列定義ファイルが格納される。時系列定義ファイルとしては、例えば図12に示されるように集約単位、時間間隔、順序基準及び最小支持度が記述される。図12は、あくまでも一つの例であり、各項目はユーザが自由に設定できるものとする。集約単位は、時系列データを定義するために図4中に示した活動メタデータのどの項目を集約するかを示す集約条件の一つであり、図12の例では「案件名」を集約単位としている。集約条件としては、さらに具体的な案件名や営業担当者名を集約単位に追加してもよいし、案件全体を集約条件としてもよい。
時間間隔及び順序基準は、時系列データを定義する際の時間的な区切りと順序に関する制約条件である。例えば、時間間隔が“2d,1w”と記述されている場合、2日未満、2日以上かつ1週間未満、及び1週間以上の3区間に分けることができる。図12においてdは日、wは週、mは月を示す。順序基準は、この例では実施日としている。最小支持度は、日報データ中に最低限どれだけの頻度で後述する時系列パターンが満たさなければならない確である。
なお、図12には示していないが、更に最小信頼度などの制約条件を付け加えても良い。最小信頼度とは、後述する時系列パターンの遷移確率が最低限満たさなければならない確率である。
図13に、時系列データ生成部C4によって生成され、時系列データベースDB6に格納される時系列データの例を示す。この例の時系列データにおいては、図9及び図10で説明したキー概念系列が図12に示した時系列定義に従って集約され、時系列に並べられて集約単位毎にまとめられている。さらに、時系列データに図11で説明した時系列属性値が対応付けられて時系列データベースDB6に記憶保持されている。集約単位毎の時系列データには識別IDが付与され、また時系列属性値にはデータNo.が付与されている。このデータNo.は、図11のNo.に対応している。
例えば、ID=t1の時系列データは、図12に示した時系列定義中に示す案件名=「データ分析システム」の集約単位でキー概念系列が集約され、この集約されたキー概念の集合が図12に示した時系列定義中に示される時間間隔で活動日に従って時系列に並べられている。同様に、ID=t2の時系列データは案件名=「勤務管理ソリューション」、ID=t3の時系列データは案件名=「ファイルサーバ」をそれぞれの集約単位として、時系列に並べられている。この例では案件名を集約単位としているが、例えば顧客名あるいは営業担当者氏名_所属を集約単位としてもよい。
次に、時系列パターン生成部C5によって時系列データベースDB6内の時系列データから、時系列定義データベースDB4によって予め設定された頻度閾値以上の頻度を持つデータを抽出して時系列パターンとして生成し、時系列パターンデータベースDB7へ格納する(ステップS15)。
より詳しくは、時系列パターン生成部C5は時系列データベースDB6内の時系列データから、時系列定義データベースDB4によって予め設定された第1の頻度閾値(第1の最小支持度)以上の頻度を持つキー概念集合をまず生成し、当該キー概念集合を時系列に並べたパターンのうち、第2の頻度閾値(第2の最小支持度)以上の頻度を持つ時系列パターンを生成する。まず、図13に示す時系列データの各キー概念集合から、新たにキー概念の部分集合を生成し、このキー概念部分集合が、各時系列データ中のいずれかのキー概念集合に含まれる時系列データが、全時系列データの中に存在する割合が、第1の頻度閾値(第1の最小支持度)を超える部分集合のみを時系列パターンにおけるキー概念集合とする。
例えば、元のキー概念集合の一つが{A,B}であった場合、キー概念部分集合は、{}、{A}、{B}、{A,B}の4つとなる。時系列データ中のキー概念集合に{A,C}、{A,B,D}、{A,B}がある場合、2つの全時系列データ集合中2つとも満たしているので、キー概念部分集合{A、B}の頻度は、約66.6%となる。
図13の例は、キー概念集合間の時間間隔を含んだ例であるが、説明を単純にするために、時間間隔を考慮しない場合の例を以下に示す。
このキー概念集合を図13における時系列属性値の活動日の順番を崩さない範囲で時系列的に並べる。このとき、系列の長さを2から順に増やしていき、系列長2のキー概念集合の並びが、図13における時系列データ中に含まれる確率、つまり図13においてはt1からt3までのデータのうち、いくつがこの並びを含んでいるかの確率を計算し、この確率が、第2の頻度閾値を超える時系列的な並びのみを残し、系列長2の時系列パターンとして抽出する。
例えば、系列長2のキー概念集合の並びを{A,B}→{C}とし、{A,B,C}→{C}、{A,C}→{B}、{A,B,D}→{C}の3つの時系列データがあったとする。
このキー概念集合の並びと時系列データを用いて、時系列的な並びを考慮した上で、キー概念が、時系列データの中に含まれているかどうかを調べと、{A,B}→{C}は、3つの時系列データ中、{A,B,C}→{C}と{A,B,D}→{C}の中の2つに含まれているので頻度は約66.6%である。
第2の頻度閾値は、第1の頻度閾値と同値でも構わない。この場合、時系列データベースDB6内の時系列データに対する時系列パターンの頻度は頻度計算部C6によって計算され、時系列パターン生成部C5に与えられる。
図13に示す時系列データ中の時間間隔を考慮する場合は、先に説明した、時間間隔なしでの時系列パターン生成方法により生成された時系列パターンのキー概念集合間の時間間隔の和を計算したものになる。この計算は、後述する(第3の検索方法)中の時間間隔の総和を求める方法にて実現される。
図14に、こうして生成される時系列パターンの例を示す。図13では、t1からtnまでの時系列データがあることを示しているが、ここでは、頻度の例を単純にするために、t1からt3までの3つの時系列データがあることにする。また、図14も同様に、p1からpmまでの時系列パターンがあることを示しているが、ここでも、頻度の例を単純にするために、p1からp2までの2つの時系列パターンがあることにする。この例では、第2の頻度閾値(第2の最小支持度)を10.0%としている。これは、ある10個の時系列データのうち1つ以上が合致するデータを時系列パターンとすることを意味している。例えば、図13に示したID=t1、ID=t2及びID=t3の3つの時系列データにおいては、ID=t1とID=t3の2つの時系列データ間でキー概念{提案、説明、要望、見積り}、{代行、ヒアリング、要望、宿題}及び{対策、提案、好評、成約}が合致し、かつ時間間隔(3週間以上1ヶ月未満)及び(2日未満)が合致しているため(頻度は2/3≒66.6%)、第2の頻度閾値(第2の最小支持度)の10.0%を超えているので、図14中のID=p1の時系列パターンが生成される。この場合、ID=p1の時系列パターンは、ID=t1とID=t3の時系列データのパターンが合致していることを示すパターン合致時系列データID{t1,t3}がID=p1の時系列パターンに対応して記述される。
一方、図14中のID=p2の時系列パターンは図13中のID=t2の時系列データの部分として合致している(頻度は1/3≒33.3%)。すなわち、第2の頻度閾値(第2の最小支持度)の10.0%を超えているので、ID=p2の時系列パターンもID=p1の時系列パターンと同様に可能性として高いパターンであり、このような確率の高いパターンがID=t2の時系列データに含まれていることを意味している。この場合、パターン合致(含有)時系列データID{t2}がID=p2の時系列パターンに対応して記述される。これは、ID=p2の時系列パターンが、ID=t2の時系列データに一部が合致していることを示す。
次に、参照リンク生成部C7によって時系列パターンデータベースDB7と日報データベースDB1との間のリンク(参照リンクという)を生成して、参照リンクを参照リンクデータベースDB8に格納する(ステップS16)。参照リンク生成部C7では、具体的には時系列データ生成部C4及び時系列パターン生成部C5により生成された時系列データ及び時系列パターンから、日報データベースDB1と時系列データベースDB6との間のリンク及び時系列データベースDB6と時系列パターンデータベースDB7との間のリンクを用いて参照リンクを生成することができる。図15は参照リンクの例であり、時系列パターンIDとそのIDで示される時系列パターンを含む日報データの番号(No.)(図4,11を参照)とを対応付けて格納している。
次に、時系列パターンデータベースDB7の内容を参照部C11が読み出して内部メモリに記憶する。表示部C10は、参照部C11に記憶されている時系列パターンの具体的なキー概念集合と、時間間隔を含む時系列的なつながりを示す時系列パターンと、時系列パターンIDを読み出して表示する。(ステップS17)。提示される時系列パターンは、要約された過去の日報データに関する時系列知識を示す。図16の例では、図14中に示したID=p1の時系列パターン1とID=p2の時系列パターン2が表示されている。さらに、この例では時系列パターン1と時系列パターン2の各々の表示に対応させて詳細データボタンB1と日報データボタンB2が表示され、また各時系列パターン1及び2に共通のパターン検索ボタンB3が表示されている。
ユーザ、例えば管理者が各時系列パターンを含む日報データを参照したい場合、ユーザは検索入力部C12を用いて図16中に示される日報データボタンB2を押すことにより参照指示を行う(ステップS18)。検索入力部C12は、押されたボタンに対応する時系列パターンIDを参照部C11に渡し、参照部C11は、この時系列パターンIDに基づいて参照リンクデータベースDB9を参照して該当する日報データを日報データベースDB1中より検索し(ステップS19)、検索結果を参照部C11を介して表示部C10に渡す。これにより表示部C10上で、例えば図17に示されるような日報データリストが管理ユーザにGUI(Graphical User Interface)画面として提示される(ステップS20)。GUI画面は、表示部C10上に生成される。
図17は図16上の時系列パターン1に対応する日報データボタンB2を押した場合の例であり、時系列パターン1、すなわち図14中に示したID=p1の時系列パターンを含む全ての日報データのリストが表示される。図25は、図16上の時系列パターン1に対応する詳細データボタンB1を押した場合の例である。ユーザが検索入力部C12を用いて図16に示す詳細データボタンB1を押すことにより、検索入力部C12は、参照部C11に記憶されている図24に示すような時系列パターンの具体的なキー概念集合および時間間隔を含む時系列的なつながりを示す時系列パターンと、時系列パターンIDとを読み出して、頻度計算部C6に渡す。
頻度計算部C6は、時系列パターン生成部C5を介して時系列データDB6のデータを参照し、検索入力部C12から渡された時系列パターンの詳細な頻度の値を再計算し、図25に示すような時系列パターンと当該時系列パターンの詳細な頻度の値と、時系列パターンIDとを頻度計算部C6に渡す。頻度計算部C6は、これらを参照部C11を介して表示部C10に渡し、表示部C10は、これらをユーザに提示する。
このように本実施形態によって生成される時系列パターンは、日報データに含まれるテキストデータを形態素解析して得られる形態素列中のキー概念の集合を時系列に並べた時系列データから、予め設定された第1の頻度閾値以上の頻度を持つキー概念の集合を第2の頻度閾値以上の頻度を持つ時間間隔で時系列に並べた時系列パターンを生成するため、複数の営業担当者の活動に関する時系列的な関係性を有する。従って、時系列パターンを利用して例えば日報データリストから所望のパターンを検索することにより、営業活動を円滑に進めるための意思決定に有用な情報を得ることができる。 以下、上記のようにして表示される日報データリストから所望のパターンを検索する方法を幾つか説明する。
(第1の検索方法)
図18に、第1の検索方法の手順を示す。ユーザ、例えば管理者は、図16のようなパターン生成結果に対してパターンの絞込みをかけたい場合、検索入力部C12を用いて所望とする時系列パターンの概略を表す検索用パターンを入力する(ステップS21)。検索用パターンは、例えば特定の異なる活動をそれぞれ示す少なくとも複数のキー概念(またはキー概念集合)と該複数のキー概念(またはキー概念集合)がそれぞれ示す活動間の時間間隔を示し、表示部C10で表示される。ユーザによる検索用パターンの入力方法としては、図22に示すプルダウンメニューから選択入力するようにしても良いし、直接キーボード等により入力するようにしても良い。
図19は、検索用パターンの具体的な一例であり、「見積り」から「1ヶ月以上2ヶ月未満」の時間間隔内に「成約」に達したパターンである。次に、ユーザが検索入力部C12を用いて図19に示す表示画面上の検索開始ボタンB4を押すと、この検索用パターンがパターン検索部C8に渡される。
パターン検索部C8は、検索用パターンに合致する時系列パターンを検索する(ステップS22)。パターン検索部C8は、この検索結果である時系列パターンの具体的なキー概念集合および時間間隔を含む時系列的なつながりを示す時系列パターンと、この時系列パターンの時系列パターンIDとを参照部C11に渡す。
参照部C11は、パターン検索部C8から渡された検索結果、すなわち、図24に示すような時系列パターンの具体的なキー概念集合および時間間隔を含む時系列的なつながりを示す時系列パターンと、この時系列パターンの時系列パターンIDとを内部メモリに記憶すると共に、表示部C10へ渡す。表示部C10は、参照部C11から渡された検索結果をユーザに提示する(ステップS23)。このステップS23の提示は、図24に示すパターン検索結果の画面が表示部C10により生成され表示される。
この時点でユーザが、検索入力部C12を用いて図24に示す日報データボタンB2を押すと、検索入力部C12は、この押されたボタンに対応する時系列パターンIDを参照部C11に渡す。参照部C11は、検索入力部C12から渡された時系列パターンIDに基づいて参照リンクデータベースDB9を参照して取得する必要がある日報データNo.を得、この日報データNo.に基づいて日報データベースDB1を参照して、検索用パターンに合致する時系列パターン及び該時系列パターンを含む集約単位の日報データをそれぞれ収集し表示部C10へ渡し、これを表示部C10は表示する。
この図24に示す例では、参照部C11は、検索された時系列パターンp1に基づいて参照リンクデータベースDB9を参照することにより取得する必要がある日報データNo.{6,7,8,12},{1,2,3,4,5}を得る。これら日報データNo.{6,7,8,12},{1,2,3,4,5}基づいて日報データベースDB1を参照して、日報データNo.{6,7,8,12},{1,2,3,4,5}の日報データを収集し、表示部C10へ渡す。表示部C10は、これを表示する。
この検索方法は、検索用パターンが多数出力された場合に利用すると、特に有用である。
さらに、このパターン全体または部分パターンが満たす確率を見たい場合は、ユーザは、図24のGUI画面上の詳細データボタンB1を押すことにより、頻度計算部C6の確率計算結果及び時系列パターンデータベースDB7の内容を、表示部C10を介して見ることができる。この場合、検索入力部C12を用いて図24に示す詳細データボタンB1を押すことにより、検索入力部C12は、参照部C11に記憶されている図24に示すような時系列パターンの具体的なキー概念集合と、時間間隔を含む時系列的なつながりを示す時系列パターンと、時系列パターンIDを読み出して、頻度計算部C6に渡す。頻度計算部C6は、時系列パターン生成部C5を介して時系列データDB6のデータを参照し、検索入力部C12から渡された時系列パターンの詳細な頻度の値を再計算し、図25に示すような時系列パターンと当該時系列パターンの詳細な頻度の値と、時系列パターンIDとを頻度計算部C6に渡す。頻度計算部C6は、これらを参照部C11を介して表示部C10に渡し、表示部C10はこれらをユーザに提示する。
(第2の検索方法)
図20に示される第2の検索方法の手順よると、検索入力部C12を用いて図16のパターン検索ボタンB3を押すことにより、図21に示すような第1の検索用ナビゲーション表示を行わせ、検索用パターンの状態数を入力する(ステップS31)。検索用パターンの状態数とは、最低限ユーザが指定したいキー概念、または属性、属性値を持つノードのことであり、この例ではキー概念の数に相当する。
次に、検索入力部C12はステップS31で入力された状態数に応じて検索用パターンの型を出力する(ステップS32)。ユーザは、検索入力部C12を用いて検索用パターンの型のノード部分及び時間間隔部分に所望の属性値を入力する(ステップS33)。ステップS33の処理に際して、検索入力部C12は表示部C10上に図22に示すような第2の検索用ナビゲーション表示を行わせることにより、ユーザは検索入力部C12を介して属性値をリストの中から選択できるようにする。
検索入力部C12は、ユーザが属性値を入力すると表示部C10上に図23に示すような第3の検索用ナビゲーション表示を行わせる。この例では、図22の検索用パターンの型のノード部分の属性値として「見積り」と「成約」が入力され、時間間隔部分の属性値として「1ヶ月以上2ヶ月未満」という値が入力されている。
ユーザは検索に必要な全ての条件、この例では上述した状態数及び属性値の入力を終えると、次に図23に示した第3の検索用ナビゲーション表示上にある検索開始ボタンを押すことにより、検索の開始を指示する(ステップS34)。この検索開始指示に従って検索入力部C12からパターン検索部C8に検索用パターンが渡されることにより、パターン検索部C8は参照部C11に記憶されている図24に示すような時系列パターンの具体的なキー概念集合と、時間間隔を含む時系列的なつながりを示す時系列パターンと、時系列パターンIDを読み出して、検索条件を満たすパターンを検索し(ステップS35)、該当するパターンのみを検索結果として表示部C10上に表示することでユーザ提示する(ステップS36)。
図24は、図23のように検索用パターンの属性値として「見積り」、「1ヶ月以上2ヶ月未満」及び「成約」が入力された場合に、ステップS36で表示されるパターン検索結果の例を示している。「見積り」から「成約」までの時間間隔は「1ヶ月以上2ヶ月未満」という条件に合致しているが、この例では「1ヶ月以上2ヶ月未満」の日付間隔は二つに分けられ、両者の間に「代行、ヒアリング、要望、宿題」というキー概念が挿入されている。
このような検索結果の表示から、検索を行ったユーザ(例えば管理者)は、検索結果に該当するユーザ(営業担当者)が「見積り」から「成約」までの間に「代行、ヒアリング、要望、宿題」といった営業活動の一環の活動をとっていることを認識することができる。すなわち、管理上より有用な情報を取得することが可能となる。
ここで、もしユーザ(例えば管理者)が検索結果のパターンを含む日報データを見たい場合は、日報データボタンB2を押すことより、図17に示したように当該パターンを含む全ての時系列データを日時順にソートして並べ、表示部C10を介してユーザに提示することができる。
また、もしユーザ(例えば管理者)が検索されたパターン全体または部分パターンの確率の詳細を見たい場合は、詳細データボタンB1を押すことにより、図25に示すように確率と時系列パターンを表示部C10を介してユーザに提示することができる。
(第3の検索方法)
次に、第3の検索方法によるパターン検索アルゴリズムを以下に示す。まず、時系列パターン集合TSP中の時系列パターンTSPidの各要素としてノード:X1,...,Xi、ノードにある値集合:Cx1,...,Cxi及び時間間隔:D1,...,Di-1を与える。このとき、時系列パターンは例えば図26に示すように表現することができる。
図27には、検索用パターンSearch Patternを示す。ただし、S1,...,Sjはノード、E1,...,Ej-1は時間間隔とする。これらのパラメータは、検索結果が出力された後でもスライダのようなGUIで変更可能なものとしておくことが望ましい。そして、以下のアルゴリズムにより条件を満たす全ての部分系列を生成する。
(1)時系列パターンTSPidのスコアSCを計算する。計算の仕方は後述する。;
(2)時系列パターンTSPidにおいて、スコアSCが最大になる図28に示すような部分系列パターンSubPatternを生成する。スコアSCが最大になるものを求めると、時間間隔制約に最も近い部分系列パターン群を限定して生成することができる。;
(3) (2)の計算で求まった全ての部分系列パターンを集め、集合TSPに格納する。
このアルゴリズムにより、時間間隔が条件中で最も近くなるようなパターンが生成される。ただし、最小支持度(MINSC)は全体のうち最低何件のデータに裏打ちされているかを表すパラメータであり、予めデフォルト値として設定しておくか、ユーザが入力しておき、図29に示すように検索結果毎にGUIにおけるスライダS1で変更可能なものとしておく。
SPidの計算は、以下の手順で実行する。
(I)Xi==Csjとなるパターンを収集する。この条件を満たすデータが全体で何件あるかをカウントし、このカウント件数の全体件数に対するパーセンテージをSSC1に記憶させておく。
(II) (I)で合致したパターン群から、Xi-1〜X1まで順番にXi==Csj-1を満たすパターンを検索する。
(III) (II)で合致したパターンの時間間隔におけるスコアSCcurrを以下の数式により計算する。
Figure 0004146326
時間間隔条件チェック計算方法は、たとえば以下のようにEj-1以下のもののみを選択するようにする。
Figure 0004146326
(IV) (II)(III)の手順をm=1になるまで繰り返す。全てのSCcurrを計算し、条件チェックを終えたら、条件チェックを満たす図28に示した全ての部分パターンを出力する。
(第4の検索方法)
第4の検索方法では、パターン検索部C8において特に誤差範囲指定ありの時間間隔を含んだ形でのパターンを生成する。すなわち、時間間隔を例えば1ヶ月〜2ヶ月という範囲に収めるのではなく、1ヶ月±1週間のような形で表現することで、より柔軟な時間間隔制約下でパターンを生成する。例えば、時間間隔に±1週間の誤差を許す場合には、Spidの計算手順の(III)における時間間隔条件チェック計算方法は、
Figure 0004146326
となる。1week(1週間:7日間)が許容誤差に相当する項であり、これは“Ej-1×10%”のようなパーセント指定(率による指定)での表現でもかまわない。
本実施形態の変形例として、時系列パターン生成部C5において複数の時系列パターンを生成した後、各時系列パターン間で重複する部分パターンを集約し、分岐パターン(分岐する部分パターン)に確率を割り当ててユーザに提示してもよい。例えば、図30に示す時系列パターン1と図31に示す時系列パターン2は、初めの2つの部分パターン(パターン1とパターン2)が重複しており、最後の部分パターンのみパターン3とパターン4のように異なったパターン集合となっている。
そこで、時系列パターン生成部C5では図32に示すように時系列パターン1と時系列パターン2を集約し、さらに部分パターン2から部分パターン3及び部分パターン3への各々の遷移確率を表す数値(この例ではパーセント表示)を付加したパターン(ここでは時系列集約パターンと呼ぶ)を生成する。こうして生成された時系列集約パターンを時系列パターンDB7に格納し、参照部C11を介して表示部C10がユーザに提示することにより、辿り着く可能性のある結果がどの程度の確率で過去に起こたかを示すことができる。この場合にも、参照リンク生成部C7は、時系列データDB6ならびに時系列パターン生成部C5を介してDB5、DB7より参照リンクを生成し、参照リンクDB9に格納する。ただし、集約されたパターンは、時系列パターン生成部が新たにIDを発行する。参照部C11は、新たに発行されたIDとともに、集約された時系列パターンの具体的なキー概念集合と、時間間隔を含む時系列的なつながりを示す時系列パターンを内部メモリに記憶する。
このような時系列集約パターンの表示からユーザ、すなわち営業担当者や管理者は、分岐の時点でどの分岐を進んでいけば確率的に成約に至るかを知ることができる。従って、現在までの営業活動履歴に応じた次の営業活動を計画することが容易になるため、過去の経験上、最も成功確率の高い活動予定を立てることができる。
この際、図33に示すように時系列集約パターン中の間隔日数をGUI上で修正するなどの変更を行ったり、あるいは図34に示すように表示される時系列集約パターンの要素を部分的に除去したりするなどの変更を行うことも可能である。
例えば、図33においては、図32のキー概念集合2から3、同じく2から4の時間間隔を変更した例である。また、図34においては、図32のキー概念集合2,3,4の要素を除去した例である。
このような時系列集約パターンの変更内容を検索入力部C12に伝達し、それに基づき頻度計算部C6を再度起動することで時系列パターンを生成し直すことにより、図33や図34に示すような亜種の時系列パターンにおける確率値を計算し直すことができる。
この場合にも、参照リンク生成部C7は、時系列データDB6ならびに時系列パターン生成部C5を介してDB5、DB7より参照リンクを生成し、参照リンクDB9に格納する。ただし、このような亜種パターンは、時系列パターン生成部が新たにIDを発行する。
参照部C11は、新たに発行されたIDとともに、亜種の時系列パターンの具体的なキー概念集合と、時間間隔を含む時系列的なつながりを示す時系列パターンを内部メモリに記憶する。
なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
例えば、上記実施形態では時系列活動データとして営業活動に関する日報データを対象としたが、カルテ(診療記録)、研究報告など、複数の人の時系列的な活動に関するデータ一般に本発明を適用することができる。
本発明の一実施形態が適用されるシステムの概略構成を示すブロック図 図1中の端末及びサーバの詳細な構成を示すブロック図 同実施形態における日報データ分析手順を示すフローチャート 日報データの例を示す図 図4中の活動内容を記したテキストデータの例を示す図 形態素解析辞書の例を示す図 形態素解析結果の例を示す図 キー概念辞書の例を示す図 形態素列と該形態素列から抽出されるキー概念の例を示す図 キー概念系列の例を示す図 時系列属性値の例を示す図 時系列定義の例を示す図 時系列データの例を示す図 時系列パターンの例を示す図 参照リンクの例を示す図 時系列パターンの表示例を示す図 時系列パターンを含む日報データリストの例を示す図 第1の検索方法の手順を示すフローチャート 第1の検索方法において表示される検索用パターンの例を示す図 第2の検索方法の手順を示すフローチャート 第2の検索方法における第1の検索用ナビゲーション表示を示す図 第2の検索方法における第2の検索用ナビゲーション表示を示す図 第2の検索方法における第3の検索用ナビゲーション表示を示す図 第2の検索方法によるパターン検索結果の例を示す図 第2の検索方法によるパターン検索結果の詳細データを示す図 第3の検索方法を説明するための時系列パターンを示す図 第3の検索方法における検索用パターンを示す図 第3の検索方法における部分系列パターンを示す図 第3の検索方法による時系列パターン生成結果を示す図 時系列パターン生成部で生成される第1の時系列パターンの例を示す図 時系列パターン生成部で生成される第2の時系列パターンを示す図 第1及び第2の時系列パターンを集約した時系列集約パターンの例を示す図 時系列集約パターンの他の例を示す図 時系列集約パターンのさらに別の例を示す図
符号の説明
T1〜TN…端末、S…サーバ、NW…ネットワーク、DB1…日報データベース、DB2…形態素解析辞書、DB3…時系列属性値データベース、DB4…時系列定義データベース、DB5…概念データベース、DB6…時系列データベース、DB7…時系列パターンデータベース、DB8…キー概念辞書、DB9…参照リンクデータベース、C1…データ入力部、C2…形態素解析部、C3…概念抽出部、C4…時系列データ生成部、C5…時系列パターン生成部、C6…頻度計算部、C7…参照リンク生成部、C8…パターン検索部、C10…表示部、C11…参照部、C12…検索入力部。

Claims (6)

  1. 人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力するデータ入力手段と、
    入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する形態素解析手段と、
    単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶したキー概念辞書記憶手段と、
    前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出するキー概念抽出手段と、
    抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する時系列データ生成手段と、
    前記複数の時系列データを記憶する時系列データ記憶手段と、
    前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する時系列パターン生成手段と、
    前記時系列パターンを記憶する時系列パターン記憶手段と、
    特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する手段であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な検索手段と、を具備する時系列活動データ分析装置。
  2. 前記時系列データ生成手段及び時系列パターン生成手段により生成された時系列データ及び時系列パターンから、前記時系列活動データ記憶手段と前記時系列データ記憶手段との間のリンク及び前記時系列データ記憶手段と前記時系列パターン記憶手段との間のリンクを用いて前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを生成する参照リンク生成手段と、
    前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを記憶するリンク記憶手段をさらに具備し、
    前記検索手段は、前記時系列パターン記憶手段から所望の時系列パターンを検索すると共に、前記リンク記憶手段に記憶されたリンクを参照して前記所望の時系列パターンに対応する時系列活動データを前記時系列活動データ記憶手段から検索する請求項1記載の時系列活動データ分析装置。
  3. 請求項1または2のいずれか1項に記載の時系列活動データ分析装置にネットワークを介して接続される端末装置であって、
    ユーザからの指示に従って前記検索用パターンまたは該検索用パターンの生成に必要な情報を前記検索手段に入力する検索入力手段と、
    前記検索手段により検索される時系列パターン、時系列データ及び時系列活動データをユーザに提示するために表示する表示手段とを具備する端末装置。
  4. データ入力手段が、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力するステップと、
    形態素解析手段が、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成するステップと、
    キー概念辞書記憶手段が、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶するステップと、
    キー概念抽出手段が、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出するステップと、
    時系列データ生成手段が、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成するステップと、
    時系列データ記憶手段が、前記複数の時系列データを記憶するステップと、
    時系列パターン生成手段が、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成するステップと、
    時系列パターン記憶手段が、前記時系列パターンを記憶するステップと、
    検索手段が、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索するステップであって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能なステップと、を具備する時系列活動データ分析方法。
  5. 参照リンク生成手段が、前記時系列データ生成手段及び時系列パターン生成手段により生成された時系列データ及び時系列パターンから、前記時系列活動データ記憶手段と前記時系列データ記憶手段との間のリンク及び前記時系列データ記憶手段と前記時系列パターン記憶手段との間のリンクを用いて前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを生成するステップと、
    リンク記憶手段が、前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを記憶するステップをさらに具備し、
    前記検索するステップは、前記時系列パターン記憶手段から所望の時系列パターンを検索すると共に、前記リンク記憶手段に記憶されたリンクを参照して前記所望の時系列パターンに対応する時系列活動データを前記時系列活動データ記憶手段から検索する請求項4記載の時系列活動データ分析方法。
  6. データ入力手段が、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力する処理と、
    形態素解析手段が、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する処理と、
    キー概念辞書記憶手段が、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶する処理と、
    キー概念抽出手段が、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出する処理と、
    時系列データ生成手段が、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する処理と、
    時系列データ記憶手段が、前記複数の時系列データを記憶する処理と、
    時系列パターン生成手段が、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する処理と、
    時系列パターン記憶手段が、前記時系列パターンを記憶する処理と、
    検索手段が、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する処理であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な処理と、をコンピュータに行わせるためのプログラム。
JP2003365150A 2003-10-24 2003-10-24 時系列活動データ分析装置、方法及びプログラム Expired - Fee Related JP4146326B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003365150A JP4146326B2 (ja) 2003-10-24 2003-10-24 時系列活動データ分析装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003365150A JP4146326B2 (ja) 2003-10-24 2003-10-24 時系列活動データ分析装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2005128887A JP2005128887A (ja) 2005-05-19
JP4146326B2 true JP4146326B2 (ja) 2008-09-10

Family

ID=34643921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003365150A Expired - Fee Related JP4146326B2 (ja) 2003-10-24 2003-10-24 時系列活動データ分析装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4146326B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101425065B (zh) * 2007-10-31 2013-01-09 日电(中国)有限公司 实体关系挖掘设备和方法
WO2010097945A1 (ja) * 2009-02-27 2010-09-02 三菱電機株式会社 情報処理装置及び情報処理方法及びプログラム
JP5170787B2 (ja) * 2010-01-28 2013-03-27 楽天株式会社 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム
JP5441173B2 (ja) * 2010-06-04 2014-03-12 日本電信電話株式会社 関係情報抽出装置、その方法及びプログラム
CN116342246B (zh) * 2023-03-06 2024-04-23 浙江孚临科技有限公司 违约风险评估方法、设备与存储介质

Also Published As

Publication number Publication date
JP2005128887A (ja) 2005-05-19

Similar Documents

Publication Publication Date Title
US7519589B2 (en) Method and apparatus for sociological data analysis
US8135711B2 (en) Method and apparatus for sociological data analysis
US8131684B2 (en) Adaptive archive data management
US9183281B2 (en) Context-based document unit recommendation for sensemaking tasks
US7792786B2 (en) Methodologies and analytics tools for locating experts with specific sets of expertise
Li et al. Extracting the significant-rare keywords for patent analysis
US20190005114A1 (en) Consensus sequence identification
US20130179381A1 (en) Frequent pattern extraction apparatus frequent pattern extraction method and program
Kumar et al. Exploration of sentiment analysis and legitimate artistry for opinion mining
US20030149586A1 (en) Method and system for root cause analysis of structured and unstructured data
US20100017431A1 (en) Methods and Systems for Social Networking
WO2007089274A2 (en) An improved method and apparatus for sociological data analysis
JP2015164022A (ja) マッチング装置、マッチング方法及びプログラム
Wu et al. Topic evolution based on LDA and HMM and its application in stem cell research
Kraker et al. Open knowledge maps: Creating a visual interface to the world’s scientific knowledge based on natural language processing
JP7375861B2 (ja) 関連スコア算出システム、方法およびプログラム
Ma et al. Improving prediction of student performance based on multiple feature selection approaches
CN112655047A (zh) 对医学记录分类的方法
JP4160462B2 (ja) 時系列行動パターンを生成して表示する装置およびプログラム
JP4146326B2 (ja) 時系列活動データ分析装置、方法及びプログラム
JP5017046B2 (ja) バリアンス原因フィルタリングシステム
Sarkar et al. Representing Tasks with a Graph-Based Method for Supporting Users in Complex Search Tasks
CN110059316A (zh) 一种基于数据感知的动态科技资源语义分析方法
Triki et al. Coupling case based reasoning and process mining for a web based crisis management decision support system
JP4134975B2 (ja) 話題文書提示方法及び装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080414

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080617

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080619

R151 Written notification of patent or utility model registration

Ref document number: 4146326

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110627

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120627

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130627

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees