JP2003122775A - データ分析方法及びプログラム並びにデータ分析装置 - Google Patents
データ分析方法及びプログラム並びにデータ分析装置Info
- Publication number
- JP2003122775A JP2003122775A JP2002214324A JP2002214324A JP2003122775A JP 2003122775 A JP2003122775 A JP 2003122775A JP 2002214324 A JP2002214324 A JP 2002214324A JP 2002214324 A JP2002214324 A JP 2002214324A JP 2003122775 A JP2003122775 A JP 2003122775A
- Authority
- JP
- Japan
- Prior art keywords
- information
- data
- text
- dictionary
- analysis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
作業を容易化する。 【解決手段】コンピュータシステム10により分析対象
データ17に所定のデータ要素が含まれているか否かを
判断する分析処理を実行するデータ分析方法において、
データ要素と少なくとも一つのグループ情報とを関連付
けた辞書情報G1を記憶し、グループ情報の指定を受け
付け、辞書情報G1に基づいて、指定されたグループ情
報に関連付けられているデータ要素を抽出し、この抽出
したデータ要素を所定のデータ要素として分析処理を実
行するデータ分析方法。
Description
などのようなデータ分析に利用されるデータ分析方法及
びプログラム並びにデータ分析装置に関する。
て、テキストデータに基づいて文脈を理解し、テキスト
データの要約抽出、テキストデータの分類、テキストデ
ータの検索などを行う技術、テキストデータから知識を
抽出する技術、テキストで記述されている情報(定性情
報)から数量化した情報(定量情報)を取得する技術な
どがある。広義には、テキストデータについてのデータ
マイニングにより得られる結果の分析を行う技術もテキ
ストマイニング技術に含まれる。
エンジン)は、概念定義辞書を利用して分析処理を実行
する。
ムの構成を例示するブロック図である。
に入力部2と、情報抽出部3と、出力部4と、概念定義
辞書5を具備している。
れる。概念定義辞書5には、テキストで記述される情報
の構成要素となる各種のテキスト要素とその属性情報
(例えば属性ID)とが登録される。概念定義辞書5に
登録されているテキスト要素と属性IDは、分析処理の
判断基準として利用される。なお、テキスト要素とし
て、例えば単語、句、節、文などが登録される。
素に属性ID「G001」が対応付けされている。また、
「POSは順調」というテキスト要素に属性ID「G00
9」が対応付けされている。各属性IDは、各テキスト
要素の性質を表し、分析処理に利用される。
された日報データ61〜6nを入力する。
1〜6nから概念定義辞書5に登録されているテキスト
要素を含む日報データを抽出する。そして、情報抽出部
3は、抽出した日報データとそれに含まれているテキス
ト要素の属性IDとに基づいて、テキストマイニングを
行う。例えば、属性IDが「良い情報」である旨を示す
テキスト要素を含んでいる日報データを、「良い日報」
と判断し、抽出する。
マイニング結果を表示する。
「良い日報」であると判断された日報データ7を表示す
ることが可能である。
1において、テキストマイニングの内容を変化させたい
場合には、概念定義辞書5の登録内容を変更(例えば修
正、訂正、補充、削除、編集など)する必要がある。
テキスト要素のうちいくつかのテキスト要素のみを利用
してテキストマイニングを行いたい場合がある。
テキスト要素に関する属性IDなどの情報のみからなる
辞書を新たに作成し、情報抽出部3がこの新たに作成さ
れた辞書をアクセスするように、辞書の指定を変更する
必要がある。
ばテキストエディタを利用して概念定義辞書プログラム
を編集する必要がある。又は辞書変更を指示するコマン
ドを入力する必要がある。
ステム1の構造を熟知していない者が概念定義辞書5の
内容、又は情報抽出部3がアクセスする辞書の設定を、
変更することは困難である。
キストエディタで変更する作業、コマンド入力により概
念定義辞書5を変更する作業、及び利用する辞書の指定
作業は、テキストマイニングシステム1の構造に熟知し
た技術者が行う必要がある。
造に熟知している者がテキストエディタ等によって編集
作業を行う場合であっても、コーディングミス等に基づ
くバグが発生することがある。
れたもので、データ分析に利用するデータ要素を容易に
変更可能とするデータ分析方法及びデータ分析プログラ
ム並びにデータ分析装置を提供することを目的とする。
って講じた具体的手段について以下に説明する。
析対象データに所定のデータ要素が含まれているか否か
を判断する分析処理を実行するデータ分析方法に関す
る。
少なくとも一つのグループ情報とを関連付けた辞書情報
を記憶し、グループ情報の指定を受け付け、辞書情報に
基づいて指定されたグループ情報に関連付けられている
データ要素を抽出し、この抽出したデータ要素を所定の
データ要素として分析処理を実行する。
受け付けてもよいし、外部の装置、プログラムなどから
受け付けてもよい。
連付けされているテキスト要素のみが抽出され、分析処
理に利用される。
もデータ分析に利用するデータ要素を容易に変更するこ
とができる。また、新たに辞書を作成し、この新たに作
成した辞書を分析処理に利用する辞書として指定する作
業も必要ない。
させるためのプログラム又はプログラムを記録したコン
ピュータ読み取り可能な記録媒体を、発明の対象として
もよい。
した記録媒体を用いることによって、計算機システム、
サーバやクライアント等の計算機に対して、簡単に上述
した動作を実施可能な機能を付加することができる。
可能な手段を具備したデータ分析装置を発明の対象とし
てもよい。
の実施の形態について説明する。
ては、テキストマイニングシステムの構造に詳しくない
者であっても、GUI(Graphical User Interface)を
使用し、テキストマイニングに利用するテキスト要素を
容易に指定可能とするデータ要素指定プログラムについ
て説明する。
析対象データがテキストデータの場合について説明して
いる。しかしながら、分析対象データは、例えば、画像
データ、音声データなどのようにテキストデータ以外の
データ、様々な種別のデータの組み合わせ、であっても
よい。
象データがテキストデータの場合について説明するた
め、辞書にはテキスト要素とその属性IDとが記録され
ている。しかしながら、例えば、分析対象のデータが画
像データ、音声データなどの場合、辞書には画像デー
タ、音声データであるデータ要素とその属性IDとが記
録される。このように、辞書に記録されるデータ要素の
種別は、分析対象データの種別と整合性があればよい。
定プログラムを実行する計算機システムの構成例を示す
ブロック図である。
9に記録されており、計算機システム10に読み込まれ
ることにより、計算機システム10上で記憶機能11、
グループ指定機能12、抽出機能13を実現する。
そのテキスト要素の属性IDとそのテキスト要素の属す
るグループを示すグループ情報とを関連付けた情報を概
念定義辞書14に記憶する。記憶機能11は、例えばユ
ーザ15又は他の装置からの入力にしたがって各情報の
関連付けを行い、登録を行う。
を用いて入力を行う。例えば、関連付けた情報を入力す
るためのテーブルを表示し、ユーザはそのテーブルに各
情報を記述する。記憶機能11は、テーブルに記述され
た内容を読み込み、概念定義辞書14に登録する。
情報がテーブル形式で管理される。本実施の形態におい
ては、概念定義辞書14内に複数の辞書情報G1、G2
が含まれているとする。
辞書情報G1を例示している。
書である。各テキスト要素が重要度「高」「中」「低」
でグループ分けされている。グループ情報は、重要度の
種別を表す。
して、「良い情報」を示す属性ID「G001」及びグルー
プ情報「低」が関連付けされている。他のテキスト要素
と属性IDとグループ情報についても同様の関係であ
る。
辞書情報G2を例示している。
である。各テキスト要素が品名「雑誌」「飲料」でグル
ープ分けされている。グループ情報は、品名の種別を表
す。
ングに利用するテキスト要素のグループ情報をユーザに
指定させるための画面を表示し、ユーザから指定を受け
付ける。
て表示される画面を例示する図である。
象とする日報データの日付の指定領域、概念定義辞書1
4に含まれている複数の辞書情報G1、G2のうちどの
辞書情報を利用するかを指定する領域、そしてグループ
情報を指定するためのチェックボックスが配置されてい
る。この例では、日付「1月22日」、辞書情報「G
1」、グループ情報「高」「中」が指定されている。
面16で指定された日付「1月22日」に関する日報デ
ータの入力命令を入力部2aに出力し、グループ指定画
面16で辞書情報「G1」とグループ情報「高」「中」
が指定されたことを示す通知を抽出機能13に提供す
る。
セスし、ユーザに指定された辞書情報G1からユーザに
指定されたグループ情報「高」「中」に関連付けされて
いるテキスト要素とその属性IDとを抽出し、情報抽出
部3aに提供する。
録する。
ている日報データの例を示す。
データは、日付「1月22日」に対応しているとする。
部2a、情報抽出部3a、出力部4aとを具備する。
の命令にしたがって、指定された日付「1月22日」に
関する日報データを日報データベース17から入力す
る。
た日報データに対して、上記抽出機能13から提供され
たテキスト要素と属性IDとに基づいて、先の図8で説
明した分析と同様のテキストマイニングを実行し、分析
結果ファイルを作成する。
分析結果ファイルの内容を示す。
報データ、分析結果情報とが関連付けされている。具体
的には、分析結果ファイルの内容は、「日報番号」、
「日報データ」、「分析結果情報」の項目を持つテーブ
ルである。
「1月22日」に関する日報データに含まれており、ユ
ーザに指定されたグループ情報「高」「中」に関連付け
されているテキスト要素の属性IDである。なお、ユー
ザに指定された日付の日報データであるが、ユーザに指
定されたグループ情報「高」「中」に関連付けされてい
るテキスト要素を含まない日報データの分析結果情報は
「NULL」となる。
果ファイルを入力し、分析結果情報が「NULL」でない日
報データ、すなわち分析結果情報に属性IDが挿入され
ている日報データのみを表示する。
と辞書情報「G1」とグループ情報「高」「中」を指定
した場合の分析結果を示す。
る日報データからグループ情報「高」「中」に関連付け
されているテキスト要素を含む日報データのみが抽出さ
れている。
書情報「G1」とグループ情報「中」を指定した場合の
分析結果を示す。
データからグループ情報「中」に関連付けされているテ
キスト要素を含む日報データが抽出されている。
とテキストマイニングシステム1aとにより実行される
データ分析方法に関するフロー図である。
要素に対してそのテキスト要素の属性IDとグループ情
報とを関連付けた情報が、計算機システム10の概念定
義辞書14に記憶される(S1)。
と、グループ指定機能12によってグループ指定画面1
6が表示される(S2)。
上で自己の望む分析に利用する各種情報を指定する。
指定機能12によって受け付けられる(S3)。
けされているテキスト要素と属性IDとが指定された辞
書情報から抽出機能13によって抽出され、情報抽出部
3aに提供される(S4)。
データベース17から入力部2aによって入力される
(S5)。
定の日付の日報データと抽出機能13から提供されたテ
キスト要素と属性IDとに基づいて、情報抽出部3aに
よってデータ分析が実行され(S6)、分析結果が出力
部4aによって出力される(S7)。
逆の順序で実行されてもよく、並列に実行されてもよ
い。
ては、テキスト要素とその属性IDに予めグループ情報
が関連付けされる。ユーザ15は、分析処理を実行する
場合にこの分析処理に利用するテキスト要素のグループ
情報を指定する。
ィタを用いて概念定義辞書14の内容を変更する必要が
なく、グループ情報を指定することにより分析に利用す
るテキスト要素を容易に切り換えることができる。
現することができる。
の分析処理を実行することができる。
機能11を利用することで、テキストマイニングシステ
ム1aの構造に詳しくない者であっても、GUIを利用
し、容易に概念定義辞書14を構成する各種辞書情報の
内容を分析内容に応じて変更できる。
易に概念定義辞書14を変更可能であるためコーディン
グミス等に基づくバグの発生を防止できる。
ては、上記第1の実施の形態の変形例について説明す
る。
定プログラムを実行する計算機システムの構成例を示す
ブロック図である。なお、この図4において図1と同一
の部分については同一の符号を付してその説明を省略
し、ここでは異なる部分についてのみ詳しく説明する。
ラム8は、グループ情報の指定又は概念定義辞書14の
変更内容を、ユーザ15から入力するのではなく分析結
果集計プログラム21によって実現される機能から入力
する点が異なる。
ステム10上で結果集計機能22、指定内容決定機能2
3を実現する。
ニング結果を入力し、このテキストマイニング結果に含
まれているテキスト要素を抽出する。
出は、テキストマイニング結果から概念定義辞書14に
記録されているテキスト要素を抽出する方法によって実
現してもよい。その他にも、結果集計機能22によるテ
キスト要素の抽出は、テキストマイニング結果に含まれ
ている日報データを所定の規則にしたがってテキスト要
素単位に分けて抽出する方法によって実現してもよい。
例えば所定の規則には、単語を切り出すための規則など
が利用される。
キスト要素がテキストマイニング結果に含まれる頻度を
示す出現頻度、抽出されたテキスト要素の出現時間など
の情報を集計する。
報やテキストマイニングの実行時間を示す情報は、抽出
されたテキスト要素の出現時間を示す情報として利用さ
れる。
に基づいて、過去のテキストマイニング結果に含まれて
いるテキスト要素にグループ情報を関連付ける。例え
ば、過去のテキストマイニング結果に含まれているある
テキスト要素に対し、その出現頻度に応じてグループ情
報「出現頻度多」「出現頻度中」「出現頻度少」のうち
のいずれかを関連付ける。また、過去のテキストマイニ
ング結果に含まれているあるテキスト要素に対し、出現
時刻に応じてグループ情報「所定期間内」「所定期間
外」のうちのいずれかを関連付ける。
連付けた内容を記憶機能11又はグループ指定機能12
に通知する。
とテキストマイニングシステム1aと分析結果集計プロ
グラム21とにより実行されるデータ分析方法に関する
フロー図である。
要素の属性IDとグループ情報とを関連付けた情報が計
算機システム10の概念定義辞書14に記憶される(T
1)。
ータ分析が実行されると(T2)、その分析結果が分析
結果集計プログラム21に入力され(T3)、この分析
結果集計プログラム21による集計処理が実行され(T
4)、分析結果に含まれているテキスト要素に対してグ
ループ情報を関連付けた情報が求められる(T5)。
付けた情報は、データ要素指定プログラム8の記憶機能
11によって計算機システム10の概念定義辞書14に
記憶される(T6)。
集計処理で扱われる所定のグループ情報がデータ要素指
定プログラム8のグループ指定機能12に対して指定さ
れる(T7)。
けされているテキスト要素が辞書情報から抽出機能13
によって抽出され、情報抽出部3aに提供される(T
8)。
から入力部2aによって入力される(T9)。
報データと抽出機能13から提供されたテキスト要素と
に基づいて、情報抽出部3aによってデータ分析が実行
され(T10)、分析結果が出力部4aによって出力さ
れる(T11)。
逆の順序で実行されてもよく、並列に実行されてもよ
い。
逆の順序で実行されてもよく、並列に実行されてもよ
い。
を表やグラフの形式でユーザ15に提示し、ユーザ15
は、その内容に基づいて指定内容決定機能23に対し、
グループ情報などの各種決定事項を入力するとしてもよ
い。
ログラム21によって自動的にテキスト要素がグループ
化され、所定のグループに属するテキスト要素のみを利
用してテキストマイニングを行うことができる。
れたテキスト要素のみを利用してテキストマイニングを
行い、それ以外の使用回数が一定レベルに満たないテキ
スト要素を排除してテキストマイニングを行うことがで
きる。
ては、上記第1又は第2の実施の形態に係るデータ要素
指定プログラム8の変形例について説明する。
定プログラムの記憶機能によって記憶される辞書情報の
内容を示す。
一以上のグループ情報を付した辞書情報が概念定義辞書
に記録される。
関する「高」「中」「低」、良否分類に関する「よい」
「悪い」、品名分類に関する「飲料」「雑誌」が利用さ
れる。
を含ませることで(上記第1の実施の形態における複数
の辞書情報を組み合わせることで)、一つの辞書情報で
様々な種別のデータ分析を行うことができる。
用意し、分析の内容に応じてテキストマイニングに利用
する辞書情報を切り換えていたが、本実施の形態におい
ては、一つの辞書情報を用いて様々なテキストマイニン
グを行うことができる。したがって、分析処理で利用す
る辞書情報をユーザが指定する必要がなく、ユーザの操
作を簡略化できる。
ては、上記第3の実施の形態に係るデータ要素指定プロ
グラムの変形例について説明する。本実施の形態の構成
には、上記図1又は図4と同様の構成を適用できる。
的に組み合わせてグループ情報が構成される。
定プログラムの記憶機能によって記憶される辞書情報の
内容を示す。
グループ情報をテキスト要素に付した辞書情報が概念定
義辞書に記憶される。
類に関するグループ「よい」「悪い」で分けられる。第
2に、グループ「よい」に属するテキスト要素は、重要
度分析に関する3つのグループ「高」「中」「低」に分
けられ、細分化される。
度の高いテキスト要素、低いテキスト要素などがある。
す辞書情報を適用することにより、ユーザは、例えばよ
い意味を示すテキスト要素の中から重要度の高いテキス
ト要素のみを用いてデータ分析を行うことができる。
素の属するグループの階層状態を表す。属性番号は、グ
ループ情報と同様にテキスト要素に関係付けされてい
る。
「G」が割り当てられる。グループ「高」には番号「H」
が割り当てられる。グループ「中」には番号「M」が割
り当てられる。グループ「低」には番号「L」が割り当
てられる。上位のグループの番号と下位のグループの番
号とは、「-」で結合される。
関連付けされ、辞書情報に記録されてもよい。
に対して、グループ情報「よい−低」と「悪い」を付し
てもよい。
を持つグループ情報と、階層構造を持たないグループ情
報とが、同じ辞書情報に登録されてもよい。
層構造を持たないグループ情報とが混在する辞書情報の
内容を示す。
第1に、グループ「飲料」「雑誌」「よい」「悪い」で
分けられる。第2に、グループ「飲料」に属するテキス
ト要素は、グループ「全般」「茶」「果物」に分けら
れ、グループ「よい」に属するテキスト要素は、グルー
プ「高」「中」「低」に分けられる。
「飲料」「よい」を表すグループ情報は階層構造を持
ち、グループ「雑誌」「悪い」を表すグループ情報は、
階層構造を持たない。
「悪い」には、それぞれ属性番号「D」「G」「MA」
「B」が割り当てられる。
物」「高」「中」「低」には、それぞれ属性番号「A」
「T」「F」「H」「M」「L」が割り当てられる。下位の
グループが存在しない場合には、属性番号「NULL」が割
り当てられる。
−高」のように2階層に限定されるものではなく、「よ
い−高−継続」「よい−高−短期」などのように3階層
以上としてもよい。
いて分析を行う場合に、ユーザからグループの指定を受
け付ける画面の一例を示す図である。
って、分析対象の日報データを指定し、分析に用いる辞
書情報を指定し、上位のグループを少なくとも一つ指定
する。指定された上位のグループが下位のグループを持
つ場合、本実施の形態に係るグループ指定機能は、下位
のグループを指定するための選択肢24a、24bを表
示する。
位のグループを指定する。
ープ指定画面24上で指定されたグループに属するテキ
スト要素を抽出する。抽出されたテキスト要素は、日報
データの分析に用いられる。
念定義辞書に登録されるテキスト要素に関連付けされる
グループ情報が階層構造を持つ。
ープのみを指定して分析を行い、さらにその分析結果に
応じて下位のグループを指定して分析を行うことがで
き、分析結果を絞り込むことができる。そして、ユーザ
は、自己の意思に沿った分析を行うことができる。
指定プログラムにより実行される各機能は、同様の作用
を実現可能であれば配置を変更させてもよく、また各機
能を自由に組み合わせてもよい。
システム10は複数の計算機により構成され、各プログ
ラムは複数の計算機に分散して配置され、互いに連携を
取りつつ処理を実行するとしてもよい。
ログラムは、例えば磁気ディスク(フレキシブルディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体9に書き込ん
でコンピュータに適用可能である。またこのプログラム
は、通信媒体により伝送してコンピュータに適用するこ
とも可能である。上記の各種機能を実現するコンピュー
タは、記録媒体に記録されたプログラムを読み込み、プ
ログラムによって動作が制御されることにより、上述し
た機能を実現する。
指定プログラムの実現する機能と同様の動作を行う手段
を備えたデータ分析装置を利用しても、同様の効果を得
ることができる。
ては、上記各実施の形態に係るデータ要素指定プログラ
ムの利用態様について説明する。
定プログラムの利用態様を例示するブロック図である。
この図7において、図1と同一の部分については同一の
符号を付している。
ステム1aにより実施されるサービスは、ASP(アプ
リケーション・サービス・プロバイダ)18によりユー
ザ15に提供される。
施されるサービスも、ASP18により提供される。
ら例えばインターネットなどのようなネットワーク20
を経由してASP18の管理するテキストマイニングシ
ステム1aを利用することで、日報データの分析を容易
に実施できる。
スト要素を変更したい場合又は辞書情報の内容を変更し
たい場合に、ASP18の管理するデータ要素指定プロ
グラム8を利用することで、容易にテキスト要素又は辞
書情報を変更することができる。
けることで、ユーザ15は、自己でテキストマイニング
システム1a及びデータ要素指定プログラム8を運用す
る場合よりも保守、運用の面で効率的に分析サービスを
利用できる。
データ要素とグループ情報とを予め関連付けておき、分
析処理を実行する場合にこの分析処理に利用するデータ
要素のグループ情報を指定する。
書情報をテキストエディタにより変更することなく、分
析に利用するデータ要素を変更できる。
の内容の分析処理を実行することができる。
定プログラムを実行する計算機システムの構成例を示す
ブロック図。
示する図。
とテキストマイニングシステムとにより実行されるデー
タ分析方法に関するフロー図。
定プログラムを実行する計算機システムの構成例を示す
ブロック図。
とテキストマイニングシステムと分析結果集計プログラ
ムとにより実行されるデータ分析方法に関するフロー
図。
機能によって表示される画面を例示する図。
定プログラムの利用態様を例示するブロック図。
示するブロック図。
Claims (3)
- 【請求項1】 コンピュータシステムにより分析対象デ
ータに所定のデータ要素が含まれているか否かを判断す
る分析処理を実行するデータ分析方法において、 データ要素と少なくとも一つのグループ情報とを関連付
けた辞書情報を記憶し、 グループ情報の指定を受け付け、 前記辞書情報に基づいて、指定されたグループ情報に関
連付けられているデータ要素を抽出し、この抽出したデ
ータ要素を前記所定のデータ要素として前記分析処理を
実行することを特徴とするデータ分析方法。 - 【請求項2】 コンピュータシステムにより分析対象デ
ータに所定のデータ要素が含まれているか否かを判断す
る分析処理を実行するために、コンピュータに、 データ要素と少なくとも一つのグループ情報とを関連付
けた辞書情報を記憶手段に記憶する機能、 グループ情報の指定を受け付ける機能、 前記辞書情報に基づいて、指定されたグループ情報に関
連付けられているデータ要素を抽出し、この抽出したデ
ータ要素を前記所定のデータ要素とする機能を実現させ
るためのプログラム。 - 【請求項3】 分析対象データに所定のデータ要素が含
まれているか否かを判断する分析処理を実行するデータ
分析装置において、 データ要素と少なくとも一つのグループ情報とを関連付
けた辞書情報を記憶する手段と、 グループ情報の指定を受け付ける手段と、 前記辞書情報に基づいて、指定されたグループ情報に関
連付けられているデータ要素を抽出し、この抽出したデ
ータ要素を前記所定のデータ要素として前記分析処理を
実行する手段に提供する手段とを具備したことを特徴と
するデータ分析装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002214324A JP4303921B2 (ja) | 2001-08-08 | 2002-07-23 | テキストマイニングシステム及び方法並びにプログラム |
US10/212,726 US20030041062A1 (en) | 2001-08-08 | 2002-08-07 | Computer readable medium, system, and method for data analysis |
CN02127761A CN1402153A (zh) | 2001-08-08 | 2002-08-08 | 数据分析系统和方法 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001-241131 | 2001-08-08 | ||
JP2001241131 | 2001-08-08 | ||
JP2002214324A JP4303921B2 (ja) | 2001-08-08 | 2002-07-23 | テキストマイニングシステム及び方法並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003122775A true JP2003122775A (ja) | 2003-04-25 |
JP4303921B2 JP4303921B2 (ja) | 2009-07-29 |
Family
ID=26620212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002214324A Expired - Fee Related JP4303921B2 (ja) | 2001-08-08 | 2002-07-23 | テキストマイニングシステム及び方法並びにプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20030041062A1 (ja) |
JP (1) | JP4303921B2 (ja) |
CN (1) | CN1402153A (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5359399B2 (ja) * | 2009-03-11 | 2013-12-04 | ソニー株式会社 | テキスト分析装置および方法、並びにプログラム |
JP5254402B2 (ja) | 2011-06-07 | 2013-08-07 | 株式会社東芝 | 注目評価対象抽出装置及びプログラム |
JP5656946B2 (ja) | 2012-09-27 | 2015-01-21 | 株式会社東芝 | データ分析装置及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5392428A (en) * | 1991-06-28 | 1995-02-21 | Robins; Stanford K. | Text analysis system |
US5758257A (en) * | 1994-11-29 | 1998-05-26 | Herz; Frederick | System and method for scheduling broadcast of and access to video programs and other data using customer profiles |
US5642502A (en) * | 1994-12-06 | 1997-06-24 | University Of Central Florida | Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text |
JP3597697B2 (ja) * | 1998-03-20 | 2004-12-08 | 富士通株式会社 | 文書要約装置およびその方法 |
US6510406B1 (en) * | 1999-03-23 | 2003-01-21 | Mathsoft, Inc. | Inverse inference engine for high performance web search |
AU2001234628A1 (en) * | 2000-01-28 | 2001-08-07 | Ibeam Broadcasting Corporation | Method and system for real-time distributed data mining and analysis for networks |
-
2002
- 2002-07-23 JP JP2002214324A patent/JP4303921B2/ja not_active Expired - Fee Related
- 2002-08-07 US US10/212,726 patent/US20030041062A1/en not_active Abandoned
- 2002-08-08 CN CN02127761A patent/CN1402153A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
US20030041062A1 (en) | 2003-02-27 |
CN1402153A (zh) | 2003-03-12 |
JP4303921B2 (ja) | 2009-07-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9336184B2 (en) | Representation of an interactive document as a graph of entities | |
US9304672B2 (en) | Representation of an interactive document as a graph of entities | |
WO2018072071A1 (zh) | 知识图谱构建系统及方法 | |
US10366154B2 (en) | Information processing device, information processing method, and computer program product | |
US10885263B2 (en) | Automatic document generation systems and methods | |
CN111782951B (zh) | 确定展示页面的方法和装置、以及计算机系统和介质 | |
CN1650327A (zh) | 可训练可扩充的自动数据-知识转换器 | |
CN104750776B (zh) | 使用元数据访问数据库平台中的信息内容 | |
JP5675676B2 (ja) | 業務分析設計支援装置、業務分析設計支援方法、および業務分析設計支援プログラム | |
US20170300461A1 (en) | Representation of an Interactive Document as a Graph of Entities | |
JP6898542B2 (ja) | 情報処理装置、その制御方法、及びプログラム | |
JP5786630B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20090228794A1 (en) | Business specification comprehension assistance system and method | |
JP6971719B2 (ja) | 情報処理装置、情報処理方法、及び情報処理プログラム | |
JP4303921B2 (ja) | テキストマイニングシステム及び方法並びにプログラム | |
JP4908024B2 (ja) | プロジェクト管理支援装置、プロジェクト管理支援方法、およびプロジェクト管理支援プログラム | |
KR20160129548A (ko) | 맞춤형 국가 연구개발 정보 제공을 위한 시스템 및 방법 | |
WO2020070906A1 (ja) | ワークショップ支援システム及びワークショップ支援方法 | |
JP6828287B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP4805491B2 (ja) | 辞書管理プログラム及びコンピュータシステム | |
CN116860227B (zh) | 一种基于大数据etl脚本编排的数据开发系统及方法 | |
JP4752293B2 (ja) | 提示装置および方法、プログラム、並びに記録媒体 | |
JP2002287964A (ja) | 画面入出力仕様設計システムと方法およびプログラム | |
JP2001184351A (ja) | 文書情報抽出装置および文書分類装置 | |
JP4181330B2 (ja) | 要約作成プログラム及びシステム並びにコンピュータによる要約作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050621 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080909 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080924 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090306 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090407 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090427 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4303921 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140501 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |