JP2010205077A - データ統合装置及びデータ統合プログラム及び記録媒体 - Google Patents
データ統合装置及びデータ統合プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2010205077A JP2010205077A JP2009051251A JP2009051251A JP2010205077A JP 2010205077 A JP2010205077 A JP 2010205077A JP 2009051251 A JP2009051251 A JP 2009051251A JP 2009051251 A JP2009051251 A JP 2009051251A JP 2010205077 A JP2010205077 A JP 2010205077A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- text
- analysis
- hierarchical structure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】非構造データ・構造化データ統合分析装置1001はテキストデータベース110のテキストデータからキーワードを抽出するテキスト解析部40、キーワードから重要キーワードを抽出し、構造化データベース130の構造化データから分析用階層構造を生成し、分析用階層構造の中から重要キーワードに基づき分析用階層構造を集計キー150として選択する集計キー抽出部20、集計キー150とキーワードから共起表160を作成する共起関係生成部50、共起表160に基づきテキストデータを集計する非構造データ集計部70、集計キー150に基づき構造化データを集計する構造化データ集計部80、集計されたテキストデータ及び構造化データを統合し、統合データベース140を作成する統合化データベース作成部140を備えた。
【選択図】図1
Description
非構造化データのテキストデータを格納したテキストデータベースの前記テキストデータからキーワードを抽出するテキスト解析部と、
前記テキスト解析部によって抽出されたキーワードの中から重要キーワードを抽出すると共に、構造化データを格納する構造化データベースの前記構造化データから少なくとも一つの階層構造を生成し、生成された前記階層構造の中から前記重要キーワードに基づいて、少なくとも一つの前記階層構造を集計キーとして選択する集計キー抽出部と、
前記集計キー抽出部によって選択された集計キーと、前記テキスト解析部によって抽出されたキーワードとから共起表を作成する共起関係生成部と、
前記共起関係生成部によって生成された前記共起表に基づいて、前記テキストデータベースに格納された前記テキストデータを集計する非構造データ集計部と、
前記集計キー抽出部によって選択された集計キーに基づいて、前記構造化データベースに格納された前記構造化データを集計する構造化データ集計部と、
前記非構造データ集計部により集計されたデータと、前記構造化データ集計部により集計されたデータとを統合することにより、統合化データベースを作成する統合化データベース作成部と
を備えたことを特徴とする。
図1〜図23を参照して実施の形態1における非構造データ・構造化データ統合分析装置1001を説明する。
図1は、非構造データ・構造化データ統合分析装置を示す。図1において、非構造データ・構造化データ統合分析装置1001は、企業内に存在するメールや文書などの非構造データおよびリレーショナルデータベースやデータウェアハウスで管理されている構造化データを統合して分析する。
(2)テキスト解析部40は、文書・メールなどのテキストデータからキーワードを抽出する。
(3)共起関係生成部50は、抽出したキーワードと集計キーを元に共起表を作成する。
(4)非構造データ集計部70は、共起表と集計キーを用いて非構造データを集計する。
(5)構造化データ集計部80は、構造化データに対して集計キーを用いて集計する。
(6)非構造データ・構造化データ統合部90は、非構造データと構造化データとを統合した統合データベースを作成する。
(7)分析部95は統合データベースを用いて分析を行なう。
テキスト解析部40は、メールや文書などのテキストを格納したテキストデータベース110からテキストを抽出し、形態素解析や文字種区切りなどのテキスト解析を行い、キーワードを切り出してキーワードデータベース120に格納する。
テキストデータベース110は、テキストを管理するマルチメディアデーターベース、もしくは単なるメールサーバやファイル共用サーバなどでも良い。
また、キーワードデータベース120は、リレーショナルデータベース、もしくは単なるCSVファイルなどでも良い。
図3は、集計キー抽出部20の構成図である。集計キー抽出部20は、出現率計算部21、重要キーワード抽出部22、分析用階層構造生成部23、カラムカバー率計算部24、テキストカバー率計算部25、集計キー決定部26を備える。
(1)出現率計算部21は、キーワードTが対象とする全文書Mのうちで幾つの文書に出現するかを計算する。
(2)重要キーワード抽出部22は、出現率をもとにキーワードから重要キーワード34を切り出す。
(3)分析用階層構造生成部23は、分析用階層構造35を生成する。
(4)カラムカバー率計算部24は、重要キーワードが構造化データベースの対応するカラムの全データ種類のどれくらいをカバーしているかを計算する。
(5)テキストカバー率計算部25は、構造化データベースの対応するカラムの全データ種類で、全文書Mのうちで幾つの文書をカバーしているかを計算する。
(6)集計キー決定部26は、カラムカバー率とテキストカバー率から集計キーを決定する。
図4は出現率計算部21が作成する出現キーワード表31を示している。出現率計算部21は、出現キーワード表31の作成において、一つの文書に出現したキーワードTを列挙し、2回以上出現したかどうかは考慮しない。全ての文書について出現したキーワードを列挙することで、図4の出現キーワード表31が作成される。
図5は、重要キーワード抽出部22によって抽出される重要キーワードを示す。重要キーワード抽出部22には、あらかじめ最高出現率32および最低出現率33が定義されている。最高出現率32が0%、最低出現率33が1%と定義された場合、重要キーワード抽出部22は図4に示すように、出現率が50%以下かつ1%以上のキーワードを重要キーワード34として抽出する。
分析用階層構造生成部23は、次のように分析用階層構造35を生成する。
図6は、構造化データベース130に格納されている各マスタテーブルを示す。構造化データベース130には、製品分類マスタテーブル131、製品マスタテーブル132、部品分類マスタテーブル133、部品マスタテーブル134の4つのテーブルが存在する。分析用階層構造生成部23は、それぞれのテーブルの外部キーの参照関係から階層構造を作成する。
図7は、製品分類マスタテーブル131と製品マスタテーブル132とから作成した分析用階層構造(35−a)を示す。
図8は、製品分類マスタテーブル131と部品分類マスタテーブル133と部品マスタテーブル134から作成した分析用階層構造(35−b)を示す。
図9は、構造化データベース130に格納された製品売上げデータウェアハウスのテーブル135を示す。テーブル135の分析に用いる階層構造としては、製品分類別、日付別、店舗別などが考えられる。例えば製品分類別に分析する場合には、分析用階層構造(35−a)を用いることができる。一方、分析用階層構造(35−b)であれば、製品分類コードは製品売上げデータウェアハウスのテーブル135に格納されているが、部品分類コードや部品型名は構造化データの集計とは異なることになる。このように全ての階層の値が同一である必要はなく、分析用階層構造生成部23は、上位の階層が構造化データの分析軸と同一となるように分析用階層構造35を生成する。
カラムカバー率計算部24は、次のように2つの方法でカラムカバー率を決定する。
第1の方法としては、カラムカバー率計算部24は、直接テーブルのカラムカバー率を次のように計算する。カラムカバー率計算部24は、図6に示す、構造化データベース130のマスタテーブルもしくは次元テーブルの主キーもしくは主キーにより一意に識別されるカラム(製品マスタテーブルであれば、主キーである製品型名および主キーにより一意に識別される製品名や原価など)を対象として、カラムの全値のどれだけの値が、テキストに出現したかを計算する。例えば、カラムカバー率計算部24は、製品分類マスタテーブル131に対しては、製品分類名のカラムに出現する値(液晶テレビ、DVDレコーダー、洗濯機、冷蔵庫など)、もしくは対応する製品分類コードの値の何パーセントが重要キーワードに出現したかを計算する。製品マスタテーブル132に対しては、カラムカバー率計算部24は、製品型名もしくは製品名もしくは原価の何パーセントが重要キーワードに出現したかを計算する。
第2の方法として、カラムカバー率計算部24は、分析用階層構造生成部23が作成した分析用階層構造35に従い、外部キーを用いて、親子関係にあるテーブルの子テーブルのカラムの出現率から親テーブルのカラムカバー率を計算する。例えば、製品分類マスタテーブル131に対しては、親子関係で子テーブルに該当する製品マスタテーブル132の外部キーである製品分類コードの単位でカラムカバー率を計算する。製品分類マスタテーブル131の製品分類名であれば、製品分類LCD−TV−001(液晶テレビ)に該当する製品型名が重要キーワードに含まれるかどうかでカラムカバー率を計算する。
テキストカバー率計算部25は、次のようにテキストカバー率を計算する。図6に示す、構造化データベース130のマスタテーブルもしくは次元テーブルの主キーもしくは主キーにより一意に識別されるカラムを対象として、テキストカバー率計算部25は、カラムに出現するいずれかの値が出現する文書が、全文書Mに占める割合を計算する。例えば、テキストカバー率計算部25は、製品分類マスタテーブル131に対しては、製品分類名のカラムに出現する値(液晶テレビ、DVDレコーダー、洗濯機、冷蔵庫など)、もしくは対応する製品分類コードのいずれかの値が出現する文書が全文書の何パーセントあるかを計算する。製品マスタテーブル132に対しては、製品型名もしくは製品名もしくは原価に出現する値を含む文書が全文書の何パーセントあるかを計算する。
集計キー決定部26は、予め設定されている
適正カラムカバー率36、
最低カラムカバー率37、
適正テキストカバー率38、
最低テキストカバー率39
に基づいて、適正カラムカバー率以上のカラム、適正テキストカバー率以上のカラム、および最低カラムカバー率以上且つ最低テキストカバー率以上のカラムを含む分析用階層構造35を、集計キーとして抽出する。
適正カラムカバー率36を75%、
最低カラムカバー率37を50%、
適正テキストカバー率38を75%、
最低テキストカバー率39を50%
とした設定の場合には、集計キー決定部26は、図10に示すようなカラムを含む分析用階層構造35を集計キー150として抽出する。
図11は、共起関係生成部50によって生成される共起表160を示す図である。共起関係生成部50は、集計キー150およびキーワードデータベース120を入力として、図11に示すような共起表160を作成する。共起表160には、集計キーとして抽出された分析用階層構造の各カラム用の領域を用意する。次に、重要キーワード34に抽出されて構造化データに含まれないキーワード用の領域をN個分用意する。図11では、集計キーとして製品マスタテーブルに基づく分析用階層構造(35−a)を抽出する例を示す。重要キーワードとしては、1つの領域を用意する。
図13は、共起表160cを示す図である。集計キーは、一般には複数選ばれる。図13では、集計キーとして部品マスタテーブルに基づく分析用階層構造(35−b)と店舗別分析用階層構造が集計キーとして抽出された場合を示す。この場合も、構造化データの分析で必要となる分析用階層構造(35−a)も同時に集計キーとして抽出する。重要キーワードとしては、2つの領域を用意する。例えばK1が名詞、K2に形容詞など品詞による分類を行なうことができる。また、重要キーワードをあらかじめポジティブなキーワードとネガティブなキーワードに分類しておき、一つの領域K1には、ポジティブなキーワード、もう一つの領域K2にはネガティブなキーワードを格納することもできる。
非構造データ集計部70は、共起表160に対して、キーワードで集計を行なうための、集計用テーブル165を作成する。集計用テーブル165は、共起表160の階層構造の空白項を埋めることで作成する。
部品型名が空白のレコードには、“その他”と記載する。
部品型名がその他以外のレコードについては、部品マスタテーブルに基づく分析用階層構造を用いて、製品分類コードおよび部品分類コードが空白であれば埋める。上記のステップを全ての行に対して繰り返す。
部品分類コードおよび部品分類名の両方が空白のレコードについては、部品分類コードに“その他”と記載する。
部品分類名が記載されているレコードについては、部品分類名に対応する部品分類コードの値を記載する。製品分類コードが空白であれば、部品マスタテーブルに基づく分析用階層構造を用いて埋める。上記のステップを全ての行に対して繰り返す。
製品分類コードが空白の行については、製品分類名が記載されているので、対応する値を記載する。
部品型名が空白の行については、“その他“と記載する。
(2)図18は、図12の共起表160−bを元に作成した集計用テーブル165−a(図15)を元に集計テーブルを作成して集計した結果を示す。
(3)図19は、図13の共起表160−cを元に作成した集計用テーブル165−b(図16)を元に集計テーブルを作成して集計した結果を示す。
構造化データ集計部80は、リレーショナルデータベースやデータウェアハウスで管理されている構造化データベース130に対して、集計キー150で集計を行う。
図20は、図9の製品売上げデータウェアハウスのテーブル135を分析用階層構造(35−a)で集計した例を示す。構造化データベースを集計するための集計キーは、非構造データ集計用のキーと同一である場合と同一でない場合があるが、同一でない場合でも上位階層での分類は同一となる。例えば、非構造データの集計用テーブルが図15の集計用テーブル165−aの場合には、集計キーは階層構造(35−b)であるが、構造化テーブルは、階層構造(35−b)では集計できないため、上位階層の分類が同一となる分析用階層構造(35−a)で集計を行なう。
図21は、図9の製品売上げデータウェアハウスのテーブル135を分析用階層構造(35−a)と店舗別分析用階層構造で集計した例を示す。
非構造データ・構造化データ統合部90は、非構造データ集計部70が作成した集計表と構造化データ集計部80が作成した集計表に対し、集計キーを用いてJOINすることにより、統合データベース140を作成する。
図24〜図29を参照して実施の形態2を説明する。実施の形態2は、実施の形態1で説明したシステムを電子メールに適用した実施形態である。
(1)テキストデータベース110には、メールを格納する。
(2)テキスト解析部40は、メールを格納したテキストデータベース110からヘッダ情報(送信日付、送信者、受信者、タイトルなど)およびメール本文を抽出し、形態素解析や文字種区切りなどのテキスト解析を行い、キーワードを切り出してキーワードデータベース120に格納する。キーワードは、ヘッダ情報とメール本文を分けて抽出する。
次に図30、図31を参照して実施の形態3を説明する。
文書・メールなどのテキストデータからキーワードを抽出するテキスト解析部40と、
非構造データと構造化データを統合して分析するための分析キーワードを抽出する集計キー抽出部20と、
抽出したキーワードと集計キーを元に共起表を作成する共起関係生成部50と、
共起表と集計キーを用いて非構造データを集計する非構造データ集計部70と、
構造化データに対して集計キーを用いて集計する構造化データ集計部80と、
非構造データと構造化データを統合した統合データベースを作成する非構造データ・構造化データ統合部90と、
および統合データベースを用いて分析を行なう分析部95と
を備え、
非構造データと構造化データを集計してから統合することを特徴とする非構造データ・構造化データ統合分析装置を説明した。
上記集計キー抽出部20が、
テキストファイルに出現するキーワードの出現率を計算する出現率計算部21、
最高出現率以下かつ最低出現率以上の出現頻度のキーワードを重要キーワードとして抽出する重要キーワード抽出部22、
分析用の階層構造を生成する分析用階層構造生成部23、
テキストファイルに出現するキーワードが構造化データのカラムに含まれるキーワードのどの程度をカバーしているかを計算するカラムカバー率計算部24、
構造化データのカラムに含まれる単語がテキストのどの程度をカバーしているかを計算するテキストカバー率計算部25、
カラムカバー率とテキストカバー率から集計キーを決定する集計キー決定部26
を備え、
構造化データのマスタテーブルに含まれるカラムのカラムカバー率または、テキストカバー率を元に、マスタテーブルを組み合わせて分析用の階層構造を生成することを特徴とする非構造データ・構造化データ統合分析装置を説明した。
テキスト解析部が抽出したキーワードを集計キーおよびその他のキーに分類し、集計キーのキーワードについては、集計キー抽出部が作成した階層構造に基づき共起表を作成し非構造化データを集計することを特徴とする非構造データ・構造化データ統合分析装置を説明した。
集計キーが非構造データ用の階層構造および構造化データ用の階層構造を持ち、上位のレベルで両階層構造が共通となることを特徴とする非構造データ・構造化データ統合分析装置を説明した。
メールの発信者、受信者、タイトルなどのヘッダ情報およびメール本文から、それぞれキーワードを抽出し、送受信者の属性に応じた階層構造により、送信メール、受信メールを分離して集計することを特徴とする非構造データ・構造化データ統合分析装置を説明した。
Claims (7)
- 非構造化データのテキストデータを格納したテキストデータベースの前記テキストデータからキーワードを抽出するテキスト解析部と、
前記テキスト解析部によって抽出されたキーワードの中から重要キーワードを抽出すると共に、構造化データを格納する構造化データベースの前記構造化データから少なくとも一つの階層構造を生成し、生成された前記階層構造の中から前記重要キーワードに基づいて、少なくとも一つの前記階層構造を集計キーとして選択する集計キー抽出部と、
前記集計キー抽出部によって選択された集計キーと、前記テキスト解析部によって抽出されたキーワードとから共起表を作成する共起関係生成部と、
前記共起関係生成部によって生成された前記共起表に基づいて、前記テキストデータベースに格納された前記テキストデータを集計する非構造データ集計部と、
前記集計キー抽出部によって選択された集計キーに基づいて、前記構造化データベースに格納された前記構造化データを集計する構造化データ集計部と、
前記非構造データ集計部により集計されたデータと、前記構造化データ集計部により集計されたデータとを統合することにより、統合化データベースを作成する統合化データベース作成部と
を備えたことを特徴とするデータ統合装置。 - 前記データ統合装置は、さらに、
前記統合化データベース作成部によって作成された統合データベースを対象として分析を実行する分析部を備えたことを特徴とする請求項1記載のデータ統合装置。 - 前記集計キー抽出部は、
テキストファイルに出現するキーワードの出現率を計算する出現率計算部と、
予め設定された最高出現率と最低出現率に対して最高出現率以下かつ最低出現率以上の出現率のキーワードを重要キーワードとして抽出する重要キーワード抽出部と、
分析用の階層構造を生成する分析用階層構造生成部と、
テキストファイルに出現するキーワードが構造化データのカラムに含まれるキーワードをどの程度をカバーしているかを示すカラムカバー率を計算するカラムカバー率計算部と、
構造化データのカラムに含まれる単語がテキストをどの程度をカバーしているかを示すテキストカバー率を計算するテキストカバー率計算部と、
構造化データベースに格納される複数のマスタテーブルに含まれるカラムのカラムカバー率とテキストカバー率とに基づきマスタテーブルを組み合わせることにより、前記分析用階層構造生成部によって生成された前記階層構造の中から集計キーとするべき前記階層構造を選択する集計キー決定部と
を備えたことを特徴とする請求項1または2のいずれかに記載のデータ統合装置。 - 前記集計キー抽出部は、
非構造データであるテキストデータ用の階層構造及び構造化データ用の階層構造であって、上位のレベルで両階層構造が共通となる階層構造を前記集計キーとして抽出することを特徴とする請求項1〜3のいずれかに記載のデータ統合装置。 - 前記テキスト解析部は、
電子メールのテキストデータを格納したテキストデータベースを対象として、前記キーワードを抽出し、
前記共起関係生成部は、
電子メールの送信者及び受信者の属性に応じた階層構造を集計キーとして用いて、送信メールと受信メールと共起表を生成することを特徴とする請求項1〜4のいずれかに記載のデータ統合装置。 - コンピュータを、
非構造化データのテキストデータを格納したテキストデータベースの前記テキストデータからキーワードを抽出するテキスト解析部、
前記テキスト解析部によって抽出されたキーワードの中から重要キーワードを抽出すると共に、構造化データを格納する構造化データベースの前記構造化データから少なくとも一つの階層構造を生成し、生成された前記階層構造の中から前記重要キーワードに基づいて、少なくとも一つの前記階層構造を集計キーとして選択する集計キー抽出部、
前記集計キー抽出部によって選択された集計キーと、前記テキスト解析部によって抽出されたキーワードとから共起表を作成する共起関係生成部、
前記共起関係生成部によって生成された前記共起表に基づいて、前記テキストデータベースに格納された前記テキストデータを集計する非構造データ集計部、
前記集計キー抽出部によって選択された集計キーに基づいて、前記構造化データベースに格納された前記構造化データを集計する構造化データ集計部、
前記非構造データ集計部により集計されたデータと、前記構造化データ集計部により集計されたデータとを統合することにより、統合化データベースを作成する統合化データベース作成部、
として機能させるデータ統合プログラム。 - 請求項6記載のデータ統合プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051251A JP5312102B2 (ja) | 2009-03-04 | 2009-03-04 | データ統合装置及びデータ統合プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009051251A JP5312102B2 (ja) | 2009-03-04 | 2009-03-04 | データ統合装置及びデータ統合プログラム及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010205077A true JP2010205077A (ja) | 2010-09-16 |
JP5312102B2 JP5312102B2 (ja) | 2013-10-09 |
Family
ID=42966473
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009051251A Expired - Fee Related JP5312102B2 (ja) | 2009-03-04 | 2009-03-04 | データ統合装置及びデータ統合プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5312102B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2750052A2 (en) | 2012-12-28 | 2014-07-02 | Fujitsu Limited | Information processing device, node extraction program, and node extraction method |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08161287A (ja) * | 1994-12-09 | 1996-06-21 | Hitachi Ltd | データ分析支援システム |
JP2000259666A (ja) * | 1999-03-11 | 2000-09-22 | Nippon Hoso Kyokai <Nhk> | トピック抽出装置 |
JP2000305937A (ja) * | 1999-04-21 | 2000-11-02 | Mitsubishi Electric Corp | 業務分析方法及び業務分析システム |
JP2004252946A (ja) * | 2003-01-27 | 2004-09-09 | Fuji Xerox Co Ltd | 評価装置およびその方法 |
JP2005135167A (ja) * | 2003-10-30 | 2005-05-26 | Toppan Printing Co Ltd | データ分析装置、データ分析方法及びデータ分析プログラム |
JP2005202535A (ja) * | 2004-01-14 | 2005-07-28 | Hitachi Ltd | 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体 |
JP2006171931A (ja) * | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニングプログラム |
-
2009
- 2009-03-04 JP JP2009051251A patent/JP5312102B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08161287A (ja) * | 1994-12-09 | 1996-06-21 | Hitachi Ltd | データ分析支援システム |
JP2000259666A (ja) * | 1999-03-11 | 2000-09-22 | Nippon Hoso Kyokai <Nhk> | トピック抽出装置 |
JP2000305937A (ja) * | 1999-04-21 | 2000-11-02 | Mitsubishi Electric Corp | 業務分析方法及び業務分析システム |
JP2004252946A (ja) * | 2003-01-27 | 2004-09-09 | Fuji Xerox Co Ltd | 評価装置およびその方法 |
JP2005135167A (ja) * | 2003-10-30 | 2005-05-26 | Toppan Printing Co Ltd | データ分析装置、データ分析方法及びデータ分析プログラム |
JP2005202535A (ja) * | 2004-01-14 | 2005-07-28 | Hitachi Ltd | 文書集計方法及び装置並びにそれらに用いるプログラムを記憶した媒体 |
JP2006171931A (ja) * | 2004-12-14 | 2006-06-29 | Mitsubishi Electric Corp | テキストマイニング装置およびテキストマイニングプログラム |
Non-Patent Citations (4)
Title |
---|
CSND200800156003; Jennifer McAdams 外3名: '"ビジネス・インテリジェンス [戦略的活用ガイド] Part 3 構造化/非構造化を問わず、あらゆる' COMPUTERWORLD Get Technology Right 第5巻,第4号, 20080401, p.52-59, (株)IDGジャパン * |
CSNJ199800003001; 林 杉 外2名: '"WebNR/SD異種情報源統合利用環境の研究-視覚的ユーザインタフェースを用いた統合利用支援-"' 第56回(平成10年前期)全国大会講演論文集(3) データベースとメディア ネットワーク , 19980319, p.3-254〜3-255, 社団法人情報処理学会 * |
JPN6013014103; Jennifer McAdams 外3名: '"ビジネス・インテリジェンス [戦略的活用ガイド] Part 3 構造化/非構造化を問わず、あらゆる' COMPUTERWORLD Get Technology Right 第5巻,第4号, 20080401, p.52-59, (株)IDGジャパン * |
JPN6013014106; 林 杉 外2名: '"WebNR/SD異種情報源統合利用環境の研究-視覚的ユーザインタフェースを用いた統合利用支援-"' 第56回(平成10年前期)全国大会講演論文集(3) データベースとメディア ネットワーク , 19980319, p.3-254〜3-255, 社団法人情報処理学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2750052A2 (en) | 2012-12-28 | 2014-07-02 | Fujitsu Limited | Information processing device, node extraction program, and node extraction method |
US9189530B2 (en) | 2012-12-28 | 2015-11-17 | Fujitsu Limited | Information processing device, computer-readable recording medium, and node extraction method |
Also Published As
Publication number | Publication date |
---|---|
JP5312102B2 (ja) | 2013-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8719308B2 (en) | Method and system to process unstructured data | |
KR101369020B1 (ko) | 보고명세로부터 olap 질의 생성시 불균형 계층에 대한 보상 | |
JP4482602B2 (ja) | データサマリテーブルにおけるフィールドの自動配置 | |
US8626702B2 (en) | Method and system for validation of data extraction | |
JP5313337B2 (ja) | モバイル・コンピューティング装置に対する検索結果の提供 | |
JP2013513144A (ja) | ビュー内でデータ項目の注釈を取り出すための方法、装置、およびコンピュータ・プログラム | |
US9922383B2 (en) | Patent claims analysis system and method | |
CN102959578B (zh) | 取证系统、取证方法及取证程序 | |
US8316026B2 (en) | Method and system for keyword management | |
US20130124957A1 (en) | Structured modeling of data in a spreadsheet | |
US20200097483A1 (en) | Novel olap pre-calculation model and method for generating pre-calculation result | |
CN102456071A (zh) | 文件管理装置以及文件管理方法 | |
CN111125266A (zh) | 数据处理方法、装置、设备及存储介质 | |
WO2012060152A1 (ja) | 数値集約計算における文字列集約方法 | |
Yu et al. | Piclean: A probabilistic and interactive data cleaning system | |
JP2005018778A (ja) | ディメンジョン属性およびディメンジョン当たり複数の階層を使用するオンライン分析処理のためのシステムおよび方法 | |
CN113553491A (zh) | 一种基于倒排索引的工业大数据搜索优化方法 | |
JP5312102B2 (ja) | データ統合装置及びデータ統合プログラム及び記録媒体 | |
US8250024B2 (en) | Search relevance in business intelligence systems through networked ranking | |
JP5845961B2 (ja) | 情報処理装置及び情報処理プログラム | |
Rahman et al. | NOAH: interactive spreadsheet exploration with dynamic hierarchical overviews | |
US8577862B2 (en) | Answer-augmented query suggestion | |
US11403654B2 (en) | Identifying competitors of companies | |
US20160042022A1 (en) | Data coordination support apparatus and data coordination support method | |
JP2010128870A (ja) | データ処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110928 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130326 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130604 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130702 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |