JP4146326B2 - 時系列活動データ分析装置、方法及びプログラム - Google Patents
時系列活動データ分析装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4146326B2 JP4146326B2 JP2003365150A JP2003365150A JP4146326B2 JP 4146326 B2 JP4146326 B2 JP 4146326B2 JP 2003365150 A JP2003365150 A JP 2003365150A JP 2003365150 A JP2003365150 A JP 2003365150A JP 4146326 B2 JP4146326 B2 JP 4146326B2
- Authority
- JP
- Japan
- Prior art keywords
- time
- time series
- series
- pattern
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000000694 effects Effects 0.000 title claims description 107
- 238000000034 method Methods 0.000 title claims description 50
- 238000007405 data analysis Methods 0.000 title claims description 13
- 238000003860 storage Methods 0.000 claims description 34
- 230000002776 aggregation Effects 0.000 claims description 28
- 238000004220 aggregation Methods 0.000 claims description 28
- 238000013500 data storage Methods 0.000 claims description 27
- 238000004458 analytical method Methods 0.000 claims description 25
- 230000014509 gene expression Effects 0.000 claims description 20
- 230000000877 morphologic effect Effects 0.000 claims description 18
- 239000002344 surface layer Substances 0.000 claims description 17
- 230000008569 process Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 8
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims 1
- 238000004364 calculation method Methods 0.000 description 21
- 238000010586 diagram Methods 0.000 description 10
- 238000003825 pressing Methods 0.000 description 4
- 239000000470 constituent Substances 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000007721 medicinal effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 102100029464 Aquaporin-9 Human genes 0.000 description 1
- 101000771413 Homo sapiens Aquaporin-9 Proteins 0.000 description 1
- 101000921370 Homo sapiens Elongation of very long chain fatty acids protein 1 Proteins 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 101000993812 Mus musculus Protein inscuteable homolog Proteins 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 235000019580 granularity Nutrition 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
図1に示されるように、本発明の一実施形態が適用されるシステムは端末T1〜TN、サーバS及び日報データベースDB1を有する。端末T1〜TNと日報データベースDB1は、インターネットまたはLAN(ローカルエリアネットワーク)のようなネットワークNWを介して接続される。日報データベースDB1は、ネットワークNWを介してサーバSに接続されてもよいし、直接サーバSに接続されていてもよい。端末T1〜TNは、具体的にはPDA(Personal Digital Assistant)、ノート型PC(Personal Computer)、携帯電話機のような携帯端末、あるいはデスクトップ型PCなどである。端末は一台でもよいし、複数台であってもよい。
(第1の検索方法)
図18に、第1の検索方法の手順を示す。ユーザ、例えば管理者は、図16のようなパターン生成結果に対してパターンの絞込みをかけたい場合、検索入力部C12を用いて所望とする時系列パターンの概略を表す検索用パターンを入力する(ステップS21)。検索用パターンは、例えば特定の異なる活動をそれぞれ示す少なくとも複数のキー概念(またはキー概念集合)と該複数のキー概念(またはキー概念集合)がそれぞれ示す活動間の時間間隔を示し、表示部C10で表示される。ユーザによる検索用パターンの入力方法としては、図22に示すプルダウンメニューから選択入力するようにしても良いし、直接キーボード等により入力するようにしても良い。
図20に示される第2の検索方法の手順よると、検索入力部C12を用いて図16のパターン検索ボタンB3を押すことにより、図21に示すような第1の検索用ナビゲーション表示を行わせ、検索用パターンの状態数を入力する(ステップS31)。検索用パターンの状態数とは、最低限ユーザが指定したいキー概念、または属性、属性値を持つノードのことであり、この例ではキー概念の数に相当する。
次に、第3の検索方法によるパターン検索アルゴリズムを以下に示す。まず、時系列パターン集合TSP中の時系列パターンTSPidの各要素としてノード:X1,...,Xi、ノードにある値集合:Cx1,...,Cxi及び時間間隔:D1,...,Di-1を与える。このとき、時系列パターンは例えば図26に示すように表現することができる。
(2)時系列パターンTSPidにおいて、スコアSCが最大になる図28に示すような部分系列パターンSubPatternを生成する。スコアSCが最大になるものを求めると、時間間隔制約に最も近い部分系列パターン群を限定して生成することができる。;
(3) (2)の計算で求まった全ての部分系列パターンを集め、集合TSPに格納する。
(I)Xi==Csjとなるパターンを収集する。この条件を満たすデータが全体で何件あるかをカウントし、このカウント件数の全体件数に対するパーセンテージをSSC1に記憶させておく。
(II) (I)で合致したパターン群から、Xi-1〜X1まで順番にXi==Csj-1を満たすパターンを検索する。
(III) (II)で合致したパターンの時間間隔におけるスコアSCcurrを以下の数式により計算する。
第4の検索方法では、パターン検索部C8において特に誤差範囲指定ありの時間間隔を含んだ形でのパターンを生成する。すなわち、時間間隔を例えば1ヶ月〜2ヶ月という範囲に収めるのではなく、1ヶ月±1週間のような形で表現することで、より柔軟な時間間隔制約下でパターンを生成する。例えば、時間間隔に±1週間の誤差を許す場合には、Spidの計算手順の(III)における時間間隔条件チェック計算方法は、
Claims (6)
- 人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力するデータ入力手段と、
入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する形態素解析手段と、
単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶したキー概念辞書記憶手段と、
前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出するキー概念抽出手段と、
抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して、指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する時系列データ生成手段と、
前記複数の時系列データを記憶する時系列データ記憶手段と、
前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する時系列パターン生成手段と、
前記時系列パターンを記憶する時系列パターン記憶手段と、
特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する手段であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な検索手段と、を具備する時系列活動データ分析装置。 - 前記時系列データ生成手段及び時系列パターン生成手段により生成された時系列データ及び時系列パターンから、前記時系列活動データ記憶手段と前記時系列データ記憶手段との間のリンク及び前記時系列データ記憶手段と前記時系列パターン記憶手段との間のリンクを用いて前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを生成する参照リンク生成手段と、
前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを記憶するリンク記憶手段をさらに具備し、
前記検索手段は、前記時系列パターン記憶手段から所望の時系列パターンを検索すると共に、前記リンク記憶手段に記憶されたリンクを参照して前記所望の時系列パターンに対応する時系列活動データを前記時系列活動データ記憶手段から検索する請求項1記載の時系列活動データ分析装置。 - 請求項1または2のいずれか1項に記載の時系列活動データ分析装置にネットワークを介して接続される端末装置であって、
ユーザからの指示に従って前記検索用パターンまたは該検索用パターンの生成に必要な情報を前記検索手段に入力する検索入力手段と、
前記検索手段により検索される時系列パターン、時系列データ及び時系列活動データをユーザに提示するために表示する表示手段とを具備する端末装置。 - データ入力手段が、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力するステップと、
形態素解析手段が、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成するステップと、
キー概念辞書記憶手段が、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶するステップと、
キー概念抽出手段が、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出するステップと、
時系列データ生成手段が、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して、指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成するステップと、
時系列データ記憶手段が、前記複数の時系列データを記憶するステップと、
時系列パターン生成手段が、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成するステップと、
時系列パターン記憶手段が、前記時系列パターンを記憶するステップと、
検索手段が、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索するステップであって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能なステップと、を具備する時系列活動データ分析方法。 - 参照リンク生成手段が、前記時系列データ生成手段及び時系列パターン生成手段により生成された時系列データ及び時系列パターンから、前記時系列活動データ記憶手段と前記時系列データ記憶手段との間のリンク及び前記時系列データ記憶手段と前記時系列パターン記憶手段との間のリンクを用いて前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを生成するステップと、
リンク記憶手段が、前記時系列パターン記憶手段と前記時系列活動データ記憶手段との間のリンクを記憶するステップをさらに具備し、
前記検索するステップは、前記時系列パターン記憶手段から所望の時系列パターンを検索すると共に、前記リンク記憶手段に記憶されたリンクを参照して前記所望の時系列パターンに対応する時系列活動データを前記時系列活動データ記憶手段から検索する請求項4記載の時系列活動データ分析方法。 - データ入力手段が、人の活動に関する時間情報及び活動内容を示すテキストデータを含む時系列活動データを蓄積する時系列活動データ記憶手段から該時系列活動データを入力する処理と、
形態素解析手段が、入力される時系列活動データ中のテキストデータを形態素解析して形態素列を生成する処理と、
キー概念辞書記憶手段が、単語及び熟語により構成される表層表現と、該表層表現を含む複数の表層表現に共通するキー概念とを対応付けて記憶する処理と、
キー概念抽出手段が、前記キー概念辞書記憶手段を用いて前記形態素列中の各表層表現に対応する複数のキー概念を抽出する処理と、
時系列データ生成手段が、抽出された複数のキー概念を指定された集約条件に従って集約してキー概念集合を生成し、該キー概念集合に含まれるキー概念を前記入力される時系列活動データ中の時間情報を参照して、指定された時間間隔で時系列に並べることによって構成される複数の時系列データを生成する処理と、
時系列データ記憶手段が、前記複数の時系列データを記憶する処理と、
時系列パターン生成手段が、前記時系列データ記憶手段により記憶された複数の時系列データから該複数の時系列データの集合において第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合を生成して時系列に並べることによって構成され、かつ該第1の頻度閾値以上の頻度を持つキー概念からなるキー概念集合において第2の頻度閾値以上の頻度を持つ時系列パターンを生成する処理と、
時系列パターン記憶手段が、前記時系列パターンを記憶する処理と、
検索手段が、特定の異なる活動をそれぞれ示す複数のキー概念と該複数のキー概念がそれぞれ示す活動間の時間間隔を検索用パターンとして用いて前記時系列パターン記憶手段から所望の時系列パターンを検索する処理であって、前記検索用パターンに含まれるキー概念の数をユーザが指定可能な処理と、をコンピュータに行わせるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365150A JP4146326B2 (ja) | 2003-10-24 | 2003-10-24 | 時系列活動データ分析装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003365150A JP4146326B2 (ja) | 2003-10-24 | 2003-10-24 | 時系列活動データ分析装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005128887A JP2005128887A (ja) | 2005-05-19 |
JP4146326B2 true JP4146326B2 (ja) | 2008-09-10 |
Family
ID=34643921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003365150A Expired - Fee Related JP4146326B2 (ja) | 2003-10-24 | 2003-10-24 | 時系列活動データ分析装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4146326B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425065B (zh) * | 2007-10-31 | 2013-01-09 | 日电(中国)有限公司 | 实体关系挖掘设备和方法 |
WO2010097945A1 (ja) * | 2009-02-27 | 2010-09-02 | 三菱電機株式会社 | 情報処理装置及び情報処理方法及びプログラム |
JP5170787B2 (ja) * | 2010-01-28 | 2013-03-27 | 楽天株式会社 | 投稿文書分析装置、投稿文書分析方法、および、投稿文書分析装置用プログラム |
JP5441173B2 (ja) * | 2010-06-04 | 2014-03-12 | 日本電信電話株式会社 | 関係情報抽出装置、その方法及びプログラム |
CN116342246B (zh) * | 2023-03-06 | 2024-04-23 | 浙江孚临科技有限公司 | 违约风险评估方法、设备与存储介质 |
-
2003
- 2003-10-24 JP JP2003365150A patent/JP4146326B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005128887A (ja) | 2005-05-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7519589B2 (en) | Method and apparatus for sociological data analysis | |
US8135711B2 (en) | Method and apparatus for sociological data analysis | |
US8131684B2 (en) | Adaptive archive data management | |
US9183281B2 (en) | Context-based document unit recommendation for sensemaking tasks | |
US7792786B2 (en) | Methodologies and analytics tools for locating experts with specific sets of expertise | |
Li et al. | Extracting the significant-rare keywords for patent analysis | |
US20190005114A1 (en) | Consensus sequence identification | |
US20130179381A1 (en) | Frequent pattern extraction apparatus frequent pattern extraction method and program | |
Kumar et al. | Exploration of sentiment analysis and legitimate artistry for opinion mining | |
US20030149586A1 (en) | Method and system for root cause analysis of structured and unstructured data | |
US20100017431A1 (en) | Methods and Systems for Social Networking | |
WO2007089274A2 (en) | An improved method and apparatus for sociological data analysis | |
JP2015164022A (ja) | マッチング装置、マッチング方法及びプログラム | |
Wu et al. | Topic evolution based on LDA and HMM and its application in stem cell research | |
Kraker et al. | Open knowledge maps: Creating a visual interface to the world’s scientific knowledge based on natural language processing | |
JP7375861B2 (ja) | 関連スコア算出システム、方法およびプログラム | |
Ma et al. | Improving prediction of student performance based on multiple feature selection approaches | |
CN112655047A (zh) | 对医学记录分类的方法 | |
JP4160462B2 (ja) | 時系列行動パターンを生成して表示する装置およびプログラム | |
JP4146326B2 (ja) | 時系列活動データ分析装置、方法及びプログラム | |
JP5017046B2 (ja) | バリアンス原因フィルタリングシステム | |
Sarkar et al. | Representing Tasks with a Graph-Based Method for Supporting Users in Complex Search Tasks | |
CN110059316A (zh) | 一种基于数据感知的动态科技资源语义分析方法 | |
Triki et al. | Coupling case based reasoning and process mining for a web based crisis management decision support system | |
JP4134975B2 (ja) | 話題文書提示方法及び装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050209 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080617 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080619 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4146326 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110627 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120627 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130627 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |