JP2004086350A - Text information analysis system and presentation method of analysis result - Google Patents

Text information analysis system and presentation method of analysis result Download PDF

Info

Publication number
JP2004086350A
JP2004086350A JP2002243973A JP2002243973A JP2004086350A JP 2004086350 A JP2004086350 A JP 2004086350A JP 2002243973 A JP2002243973 A JP 2002243973A JP 2002243973 A JP2002243973 A JP 2002243973A JP 2004086350 A JP2004086350 A JP 2004086350A
Authority
JP
Japan
Prior art keywords
analysis
text information
analysis result
result
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002243973A
Other languages
Japanese (ja)
Other versions
JP3831319B2 (en
Inventor
Ryohei Orihara
折原 良平
Kazuhiko Atsumi
渥美 一彦
Kouichi Sasaki
笹氣 光一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002243973A priority Critical patent/JP3831319B2/en
Publication of JP2004086350A publication Critical patent/JP2004086350A/en
Application granted granted Critical
Publication of JP3831319B2 publication Critical patent/JP3831319B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a text information analysis system used for presenting a plurality of results by analysis techniques different from one another by systematically combining them with one another. <P>SOLUTION: A knowledge analysis part 12 executes, for text information stored in a knowledge database 13, an analysis by a clustering part 121 and an analysis by a text mining part 122, and stores the results thereof (a clustering result 141 and a text mining result 142) in an analysis result storing database 14. A user interface part 11 receives, from a user, selections of a cluster of the clustering result 141 disposed on the longitudinal axis and the lateral axis, and of a category of the text mining result 142 by an analysis axis selection part 111, and carries out counting of the analysis results based on the selections by an analysis result counting part 112 to present the counting result to the user. <P>COPYRIGHT: (C)2004,JPO

Description

【0001】
【発明の属する技術分野】
この発明は、例えばLAN(Local Area Network)やイントラネット経由で収集・蓄積されたアンケートや日報などのテキスト情報を分析するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法に関する。
【0002】
【従来の技術】
近年、LANやイントラネットを敷設し、各社員がもつ情報、例えば業務上で発生するアンケートや日報などの非定型情報を部門を越えて収集・蓄積する企業が増えつつある。この収集・蓄積された情報は、全社員の知識として共有・活用されることを目的に、様々な分析が施されるのが一般的である。そして、その分析手法として、現在では、クラスタリング分析とテキストマイニング分析とがよく知られている。
【0003】
クラスタリング分析は、例えば特開2002−149670号公報に記載されているように、各単語の出現頻度や複数の単語間の関連度により、収集・蓄積された情報を分類するものである。ここで、複数の単語間の関連度とは、共起性の有無をいい、例えば「私はAとBを購入した。」といった、「A」と「B」を共に含むテキスト情報が多数存在する場合、この「A」と「B」は共起性があると判断する。
【0004】
その結果、「A」という単語の出現頻度が高い情報だけが同じクラスタに属するものとして取り扱われるだけでなく、「B」という単語の出現頻度が高い情報も同じクラスタに属するものとして取り扱われ、絞り込みを適切に行った精度の高い分類が自動的に実行されることになる。
【0005】
一方、テキストマイニング分析は、例えば特開2001−147937号公報に記載されているように、収集・蓄積された情報を利用者が望むカテゴリに分類するものである。例えば「C」、「D」、「F」製品に関する情報をそれぞれカテゴリに纏めたい場合、利用者は、どのような記述を含む場合に、その情報を各カテゴリに属するものと判断するのか、その条件を指定する。
【0006】
このクラスタリング分析およびテキストマイニング分析によれば、無秩序に収集・蓄積された大量の情報から何らかの傾向を掴むことが可能となる等、知識の共有・活用が有効に図られることになる。
【0007】
【発明が解決しようとする課題】
ところで、前述したクラスタリング分析およびテキストマイニング分析は、どちらもいずれのクラスタおよびカテゴリにも属さない情報を数多く発生させてしまうという欠点をもっている。したがって、いずれの分析手法を採用した場合であっても、極めて重要な情報を抽出することができずに、「その他」の多数の情報の中に埋もれさせてしまうおそれがあった。
【0008】
また、たとえ両方の分析手法を備える場合であっても、それらの分析結果を個別に参照するだけでは、例えば一方の分析で埋もれてしまった情報のみを対象とした傾向を他方の分析で認識することは難しく、また、いわゆる相乗効果を期待することもできない。
【0009】
この発明は、このような事情を考慮してなされたものであり、互いに異なる分析手法による複数の分析結果を有機的に結合させて提示するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
前述した目的を達成するために、この発明は、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段と、任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段と、同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段とを具備することを特徴とする。
【0011】
この発明のテキスト情報分析システムにおいては、クラスタリング分析の結果とテキストマイニング分析の結果とを、例えばそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示する等、この2つの分析結果を有機的に結合させて提示する。これにより、例えば一方の分析結果で埋もれてしまった情報のみを対象とした傾向を他方の分析結果で簡単に把握できるといった、それぞれの分析結果のみでは得られない付加価値の高い有益な分析結果の提示を実現する。
【0012】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態を説明する。
【0013】
図1は、この発明の実施形態に係る知識分析システムのネットワーク構成を示す図である。
【0014】
この知識分析システム1は、サーバ機などと称される高性能のコンピュータ上に構築され、複数のクライアントコンピュータ2とLANやイントラネットなどのネットワーク3を介して接続される。そして、知識分析システム1は、クライアントコンピュータ2からの分析要求を受け付け、その要求に基づく分析の結果を返却する。
【0015】
図2は、この知識分析システム1の機能ブロックを示す図である。図2に示すように、この知識分析システム1は、ユーザインタフェース部11および知識分析部12の処理部と、知識データベース13および分析結果格納データベース14のデータ部とを有している。なお、処理部は、この知識分析システム1が構築されるコンピュータに搭載されたCPUの動作手順を記述するプログラムにより構成されるものであり、データ部は、同コンピュータが備える磁気ディスク装置などの記憶媒体上に構成されるものである。
【0016】
ユーザインタフェース部11は、クライアントコンピュータ2の利用者に対する窓口の役割を担うものであり、分析軸選択部111および分析結果集計部112を有している。分析軸選択部111は、クライアントコンピュータ2からの指示の一部を受け付けるものであり、その詳細は後述する。一方、分析結果集計部112は、この分析軸選択部111により受け付けた指示に基づき、分析結果の集計を行ってクライアントコンピュータ2に返却するものである。この詳細についても後述する。
【0017】
知識分析部12は、例えば業務上で発生するアンケートや日報など、知識データベース13に蓄積された大量のテキスト情報を分析し、その結果を分析結果格納データベース14に格納するものであり、クラスタリング部121およびテキストマイニング部142を有している。クラスタリング部121は、各単語の出現頻度や複数の単語間の関連度により、知識データベース13のテキスト情報をクラスタに分類するものであり(クラスタリング分析)、これにより得られたクラスタリング結果141を分析結果格納データベース14に格納する。一方、テキストマイニング部142は、利用者から指定された条件に基づき、知識データベース13のテキスト情報を利用者が望むカテゴリに分類するものであり(テキストマイニング分析)、これにより得られたテキストマイニング結果142を分析結果格納データベース14に格納する。
【0018】
ここで、図3乃至図5を参照して、この知識分析システム1の特徴である分析結果の提示方法についての概略を説明する。
【0019】
いま、知識データベース13には、アンケートや日報、メールなどのテキスト情報が大量に蓄積されているものとする(図3のA)。そして、この同一のテキスト情報群に対して、一方では、クラスタリング部121がクラスタリング分析を実行し、クラスタリング結果141を得て(図3のB2)、他方では、テキストマイニング部122がテキストマイニング分析を実行し、テキストマイニング結果142を得たとする(図3のB1)。
【0020】
まず、クラスタリング結果141に着目すると、テキスト情報群は、C1,C2,C3,…と分類されているが、これらのいずれにも属さないテキスト情報も大量に発生する。同様に、テキストマイニング結果142に着目すると、テキスト情報群は、T1,T2,T3,…と分類されているが、これらのいずれにも属さないテキスト情報も大量に発生する。したがって、このままでは、いずれにも属さないテキスト情報は、「その他」の多数のテキスト情報と共にただ埋もれてしまうことになる。
【0021】
そこで、この知識分析システム1では、この2つの分析結果を有機的に連結させて、より具体的には、例えばクラスタリング結果141を縦軸、テキストマイニング結果142を横軸に割り当てた2次元配列の表形式に集計して、利用者に提示するようにした(図3のC)。図中、n11は、クラスタリング部121によるクラスタリング分析によってクラスタC1に属するとともに、テキストマイニング部122によるテキストマイニング分析によってカテゴリT1に属するテキスト情報の件数を示している。
【0022】
これにより、例えばクラスタリング結果141では「その他」として纏められたテキスト情報群を、テキストマイニング結果142のT1,T2,T3,…の分類で参照することができ(nx1,nx2,nx3,…)、同様に、テキストマイニング結果142では「その他」として纏められたテキスト情報群を、クラスタリング結果142におけるC1,C2,C3,…の分類で参照することができるようになる(n1y,n2y,n3y,…)。また、視点の異なる2つの分析結果を有機的に結合させることにより、一方の分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を期待することもできる。
【0023】
また、このクラスタリング部121のクラスタリング分析により得られるクラスタリング結果141と、テキストマイニング部142のテキストマイニング分析により得られるテキストマイニング結果142は、テキスト情報群を多階層のクラスタまたはカテゴリに分類されているのが一般的である。図5に、多階層のカテゴリに分類されたテキストマイニング結果142の一例を示す。そこで、この知識分析システム1では、縦軸および横軸の項目として配置するクラスタリング結果141およびテキストマイニング結果142のクラスタおよびカテゴリの階層を、利用者の指示に応じて各軸ごとに上下に移動できるようにした。
【0024】
例えば、図3に示した表(C)において、テキストマイニング結果142をT1に絞ってさらに詳細に参照したいという要求に対して、この知識分析システム1では、図5に示すように、横軸の項目として配置されたテキストマイニング結果142のカテゴリの階層を一段下に移動させるべく再集計して提示する。この移動は、その階層が続く限り可能であり、また、逆に下から上への移動も当然に可能である。
【0025】
次に、図6乃至図10を参照して、この知識分析システム1が分析結果の提示を行う際の動作原理について説明する。
【0026】
ネットワーク3を介して接続されるクライアントコンピュータ2に対して知識分析サービスを提供する際、ユーザインタフェース部11は、まず、図6に示す画面を表示させるための画面データを送信する。この画面には、テキストマイニング分析の実行を指示するボタンa1と、クラスタリング分析の実行を指示するボタンa2と、分析軸の選択作業に移行するためのボタンa3と、この分析軸の選択後に分析結果の集計を開始させるためのボタンa4とが配置される。この画面の提示を受けた利用者は、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、所望のボタンを選択する。
【0027】
ボタンa1の選択が通知されると、ユーザインタフェース部11は、テキストマイニング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、テキストマイニング部122が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果、つまりテキストマイニング結果142を分析結果格納データベース14に格納する。
【0028】
同様に、ボタンa2の選択が通知されると、ユーザインタフェース部11は、クラスタリング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、クラスタリング部121が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果、つまりクラスタリング結果141を分析結果格納データベース14に格納する。
【0029】
また、ボタンa3の選択が通知されると、ユーザインタフェース部11は、図7に示す画面を表示させるための画面データを送信する。この画面には、クラスタリング結果141が割り当てられる表の縦軸の選択作業に移行するためのボタンb1と、テキストマイニング結果142が割り当てられる表の横軸の選択作業に移行するためのボタンb2とが追加配置される。そして、このボタンb1またはボタンb2の選択が通知されると、ユーザインタフェース部11は、その通知された分析軸の選択処理を開始する。
【0030】
いま、ボタンb1の選択が通知されたとすると、ユーザインタフェース部11は、分析結果格納データベース14に格納されたクラスタリング結果141におけるクラスタの階層構造を分析軸選択部111に取得させる。そして、ユーザインタフェース部11は、その取得させたクラスタの階層構造を示した画面を表示させるための画面データを作成して送信する。図8に、この時に利用者に提示される画面を例示する。
【0031】
図8の例では、クラスタリング結果141におけるクラスタの階層構造は、最上位層にC1,C2,…が存在し、また、C1の1つ下の層には、C11,C12,…が存在する。さらに、C11の1つ下の層には、C111,C112,C113,C114,C115が存在する。そして、この画面の提示を受けた利用者が、この中からC11を選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、C11を選択した状態でボタンc1を選択する。一方、このC11の選択を通知されたユーザインタフェース部11は、図9に示す画面を表示させるための画面データを編集して送信する。図9に示すように、利用者が選択したC11が、表の縦軸として選択された旨が示されている(図9のd1)。
【0032】
また、同様に、利用者は、ボタンa3およびボタンb2を選択し、テキストマイニング結果142が割り当てられる表の横軸の選択作業を行う。そして、その作業完了後、利用者は、ボタンa4を選択し、分析結果の集計を開始させる。
【0033】
このボタンa4の選択が通知されると、ユーザインタフェース部11は、クラスタリング結果141とテキストマイニング結果142とを有機的に結合させるための集計を分析結果集計部112に行わせる。
【0034】
分析結果格納データベース14に格納されるクラスタリング結果141およびテキストマイニング結果142には、各クラスタおよび各カテゴリにどのテキスト情報が属しているのかを識別するための情報が含まれている。したがって、この情報を突き合わせることにより、クラスタリング結果141の任意のクラスタとテキストマイニング結果142の任意のカテゴリの双方に属するテキスト情報の件数を集計することができる。分析結果集計部112は、このような突き合わせを行っていくことにより、クラスタリング結果141を縦軸、テキストマイニング結果142を横軸に割り当てた分析結果の集計を実行する。そして、ユーザインタフェース部11は、この分析結果集計部112に集計させた分析結果を提示する画面を表示させるための画面データを作成して送信する。図10に、この時に利用者に提示される画面を例示する。
【0035】
図10に示すように、画面の上部には、利用者が選択した縦軸および横軸のクラスタおよびカテゴリがそれぞれ表示される(e1)。ここでは、表の縦軸にクラスタC1、表の横軸にカテゴリT11が選択されている。そして、この選択に基づき、画面の中央部には、クラスタC1の1つ下の階層のクラスタC11,C12,C13,…を縦軸の項目として配置し、カテゴリT11の1つ下の階層のカテゴリT111,T112,T113,T114,T115,…を横軸の項目として配置した表形式で集計されたクラスタリング結果141およびテキストマイニング結果142が表示される(E2)。なお、この表は、下方向および右方向にそれぞれスクロール可能であり、その末端には、いずれのクラスタおよびカテゴリにも属さないテキスト情報の件数がそれぞれ集計されて表示される。
【0036】
また、この縦軸の項目として配置されたクラスタ、または横軸の項目として配置されたカテゴリのいずれかを選択すると、その選択されたクラスタまたはカテゴリの1つ下の階層のクラスタまたはカテゴリを各軸に配置した状態で、クラスタリング結果141およびテキストマイニング結果142が再集計されて表示される(ドリルダウン)。例えば、クラスタC12が選択されたとすると、縦軸はクラスタC121,C122,…に置き換わり、表内の件数も更新される。
【0037】
さらに、画面の下部には、縦軸の項目として配置されたクラスタ、または横軸の項目として配置されたカテゴリの階層を1つ上のクラスタまたはカテゴリに移動させる(ドリルアップ)ためのボタンが配置される(e3)。例えば、図10の状態で表の横軸をドリルアップさせる旨が指示されると、横軸の項目として配置されるカテゴリは、カテゴリT11,T12,T13,…に置き換わり、表内の件数も更新される。
【0038】
図11は、この知識分析システム1が分析結果の提示を行う際の動作手順を示すフローチャートである。
【0039】
ユーザインタフェース部11は、まず、クライアントコンピュータ2の利用者が作業を選択するためのタスク選択画面を表示させる画面データを送信する(ステップA1)。次に、この画面の提示を受けた利用者が、「分析軸の選択」を選択すると(ステップA2のYES)、ユーザインタフェース部11は、縦軸および横軸のいずれかを選択するための選択画面を表示させる画像データを送信する(ステップA3)。そして、この画面の提示を受けた利用者が、「縦軸」を選択した場合(ステップA4のYES)、ユーザインタフェース部11は、分析軸選択部111を用いてクラスタ選択処理を実行し(ステップA5)、「横軸」を選択した場合には(ステップA4のNO)、分析軸選択部111を用いてカテゴリ選択処理を実行する(ステップA6)。
【0040】
また、「分析スタート」が選択された場合(ステップA2のNO,ステップA7のYES)、ユーザインタフェース部11は、分析結果集計部112を用いて選択されたクラスタおよびカテゴリを分析軸とした集計処理を実行し(ステップA8)、その集計結果を提示した分析結果画面を表示させる画像データを送信する(ステップA9)。
【0041】
さらに、この分析結果画面上で分析軸の階層移動が指示されると(ステップA10のYES)、ユーザインタフェース部11は、分析結果集計部112を用いて移動後のクラスタおよびカテゴリを分析軸とした集計処理を再実行する(ステップA8)。
【0042】
以上の手順により、この知識分析システム1は、クラスタリング部121のクラスタリング結果141とテキストマイニング部122のテキストマイニング結果142とを有機的に結合させて提示し、また、分析対象のクラスタまたはカテゴリの階層を指示に応じて上下に移動させる。これにより、例えば一方の分析で埋もれた情報の傾向を他方の分析で把握すること等を可能とし、また、一方の分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を期待することもできる。
【0043】
なお、ここでは、視点の異なる2つの分析結果を有機的に結合させる方法として、2次元配列の表形式に集計する例を示したが、この発明は、これに限られるものではなく、互いの関係を表現できれば、どのような形式を適用することも可能である。
【0044】
また、ここでは、図4に示すとおり、分析結果が多階層に整理されていることを前提に説明を行ったが、これは必ずしも必須ではなく、複数の分類観点を無理やりひとつの階層に押し込むことを強制するものではない。複数の分類観点は、それぞれ独立した平坦な分類体系として扱うことができ、たとえば表の2軸を利用してそれらを有機的に組み合わせることが可能である。
【0045】
つまり、本願発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。たとえば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0046】
【発明の効果】
以上のように、この発明によれば、互いに異なる分析手法による複数の分析結果を有機的に結合させて提示するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法を提供することが可能となる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る知識分析システムのネットワーク構成を示す図。
【図2】同実施形態の知識分析システムの機能ブロックを示す図。
【図3】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第1の図。
【図4】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第2の図。
【図5】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第3の図。
【図6】同実施形態の知識分析システムで表示される画面を例示する第1の図。
【図7】同実施形態の知識分析システムで表示される画面を例示する第2の図。
【図8】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図9】同実施形態の知識分析システムで表示される画面を例示する第4の図。
【図10】同実施形態の知識分析システムで表示される画面を例示する第5の図。
【図11】同実施形態の知識分析システムが分析結果の提示を行う際の動作手順を示すフローチャート。
【符号の説明】
1…知識分析システム
2…クライアントコンピュータ
3…ネットワーク
11…ユーザインタフェース
12…知識分析部
13…知識データベース
14…分析結果格納データベース
111…分析軸選択部
112…分析結果集計部
121…クラスタリング部
122…テキストマイニング部
141…クラスタリング結果
142…テキストマイニング結果
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a text information analysis system for analyzing text information such as questionnaires and daily reports collected and stored via a LAN (Local Area Network) or an intranet, and a method of presenting analysis results applied to the system.
[0002]
[Prior art]
2. Description of the Related Art In recent years, an increasing number of companies have laid a LAN or an intranet to collect and accumulate information held by each employee, for example, irregular information such as a questionnaire and a daily report generated during work, across departments. This collected and accumulated information is generally subjected to various analyzes in order to be shared and utilized as knowledge of all employees. At present, clustering analysis and text mining analysis are well known as the analysis methods.
[0003]
In the clustering analysis, as described in, for example, JP-A-2002-149670, information collected and stored is classified according to the appearance frequency of each word and the degree of association between a plurality of words. Here, the degree of relevance between a plurality of words refers to the presence or absence of co-occurrence. For example, there is a lot of text information including both “A” and “B” such as “I purchased A and B.” In this case, it is determined that “A” and “B” have co-occurrence.
[0004]
As a result, not only information with a high frequency of appearance of the word "A" is treated as belonging to the same cluster, but also information with a high frequency of appearance of the word "B" is treated as belonging to the same cluster. Is performed automatically and the classification with high accuracy is performed automatically.
[0005]
On the other hand, the text mining analysis classifies the collected and accumulated information into categories desired by the user, as described in, for example, JP-A-2001-147937. For example, when it is desired to group information on “C”, “D”, and “F” products into respective categories, the user may determine what kind of description is included in the category and determine whether the information belongs to each category. Specify conditions.
[0006]
According to the clustering analysis and the text mining analysis, knowledge sharing and utilization can be effectively achieved, for example, it is possible to grasp a certain tendency from a large amount of information collected and accumulated in a random manner.
[0007]
[Problems to be solved by the invention]
By the way, both the clustering analysis and the text mining analysis described above have a disadvantage that a large amount of information that does not belong to any cluster or category is generated. Therefore, no matter which analysis method is employed, extremely important information cannot be extracted, and may be buried in a large number of other information.
[0008]
Even if both analysis methods are provided, simply referring to the analysis results individually, for example, recognizes, in the other analysis, a tendency that targets only the information buried in one analysis. It's difficult, and you can't expect so-called synergy.
[0009]
The present invention has been made in view of such circumstances, and a text information analysis system that organically combines and presents a plurality of analysis results obtained by different analysis techniques and an analysis result analysis method applied to the text information analysis system. The purpose is to provide a presentation method.
[0010]
[Means for Solving the Problems]
In order to achieve the above-mentioned object, the present invention provides a text information analysis system for analyzing a large amount of text information collected and stored, based on the frequency of appearance of each word and the degree of association between a plurality of words. Clustering analysis means for analyzing a large amount of accumulated text information; text mining analysis means for analyzing the large amount of collected and accumulated text information based on arbitrarily specified conditions; and An analysis result presentation unit that organically combines and presents the analysis result of the clustering analysis unit and the analysis result of the text mining analysis unit is provided.
[0011]
In the text information analysis system according to the present invention, the results of the two analysis are presented, for example, by presenting the result of the clustering analysis and the result of the text mining analysis in the form of a two-dimensional array assigned to the vertical and horizontal axes, respectively. Are presented organically bound. As a result, for example, it is possible to easily grasp, using the other analysis results, the tendency for only the information that has been buried in one analysis result. Realize the presentation.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0013]
FIG. 1 is a diagram showing a network configuration of a knowledge analysis system according to an embodiment of the present invention.
[0014]
The knowledge analysis system 1 is built on a high-performance computer called a server or the like, and is connected to a plurality of client computers 2 via a network 3 such as a LAN or an intranet. Then, the knowledge analysis system 1 receives an analysis request from the client computer 2 and returns an analysis result based on the request.
[0015]
FIG. 2 is a diagram showing functional blocks of the knowledge analysis system 1. As shown in FIG. 2, the knowledge analysis system 1 has a processing unit of a user interface unit 11 and a knowledge analysis unit 12, and a data unit of a knowledge database 13 and an analysis result storage database 14. The processing unit is configured by a program that describes the operation procedure of a CPU mounted on a computer on which the knowledge analysis system 1 is constructed, and the data unit is a storage unit such as a magnetic disk device included in the computer. It is configured on a medium.
[0016]
The user interface unit 11 serves as a contact point for the user of the client computer 2, and has an analysis axis selection unit 111 and an analysis result totaling unit 112. The analysis axis selection unit 111 receives a part of the instruction from the client computer 2, and the details will be described later. On the other hand, the analysis result totaling unit 112 totals the analysis results based on the instruction received by the analysis axis selecting unit 111 and returns the result to the client computer 2. This will be described later in detail.
[0017]
The knowledge analysis unit 12 analyzes a large amount of text information accumulated in the knowledge database 13 such as a questionnaire and a daily report generated in business, and stores the analysis result in the analysis result storage database 14. The clustering unit 121 And a text mining unit 142. The clustering unit 121 classifies the text information of the knowledge database 13 into clusters based on the appearance frequency of each word and the degree of association between a plurality of words (clustering analysis). The clustering result 141 obtained by this is analyzed as a result of analysis. It is stored in the storage database 14. On the other hand, the text mining unit 142 classifies the text information in the knowledge database 13 into categories desired by the user based on the conditions specified by the user (text mining analysis), and obtains the text mining result obtained by this. 142 is stored in the analysis result storage database 14.
[0018]
Here, an outline of a method of presenting an analysis result, which is a feature of the knowledge analysis system 1, will be described with reference to FIGS.
[0019]
Now, it is assumed that a large amount of text information such as a questionnaire, a daily report, and an e-mail is stored in the knowledge database 13 (A in FIG. 3). Then, on the one hand, the clustering unit 121 performs a clustering analysis on the same text information group to obtain a clustering result 141 (B2 in FIG. 3), and on the other hand, the text mining unit 122 performs the text mining analysis. It is assumed that the text mining result 142 is obtained by the execution (B1 in FIG. 3).
[0020]
First, paying attention to the clustering result 141, the text information group is classified as C1, C2, C3,..., But a large amount of text information that does not belong to any of them is generated. Similarly, focusing on the text mining result 142, the text information group is classified as T1, T2, T3,..., But a large amount of text information that does not belong to any of them is generated. Therefore, as it is, text information that does not belong to any of them will be simply buried together with a large number of "other" text information.
[0021]
Therefore, in the knowledge analysis system 1, the two analysis results are organically connected, and more specifically, for example, a two-dimensional array in which the clustering result 141 is assigned to the vertical axis and the text mining result 142 is assigned to the horizontal axis. The data is tabulated and presented to the user (C in FIG. 3). In the figure, n11 indicates the number of pieces of text information that belong to the cluster C1 by the clustering analysis by the clustering unit 121 and belong to the category T1 by the text mining analysis by the text mining unit 122.
[0022]
Thereby, for example, the text information group grouped as “others” in the clustering result 141 can be referred to by the classification of T1, T2, T3,... Of the text mining result 142 (nx1, nx2, nx3,. Similarly, in the text mining result 142, the text information group summarized as “others” can be referred to by the classification of C1, C2, C3,... In the clustering result 142 (n1y, n2y, n3y,. ). By organically combining two analysis results from different viewpoints, a so-called synergistic effect can be expected, such as prompting a new discovery that cannot be obtained from only one analysis result.
[0023]
The clustering result 141 obtained by the clustering analysis of the clustering unit 121 and the text mining result 142 obtained by the text mining analysis of the text mining unit 142 classify the text information group into multi-level clusters or categories. Is common. FIG. 5 shows an example of a text mining result 142 classified into a multi-layer category. Therefore, in this knowledge analysis system 1, the cluster and category hierarchies of the clustering result 141 and the text mining result 142 arranged as items on the vertical axis and the horizontal axis can be moved up and down for each axis according to the user's instruction. I did it.
[0024]
For example, in the table (C) shown in FIG. 3, in response to a request to refer to the text mining result 142 in more detail by focusing on T1, the knowledge analysis system 1 uses the horizontal axis as shown in FIG. The category of the category of the text mining result 142 arranged as an item is re-aggregated and presented to be moved down one level. This movement is possible as long as the hierarchy continues, and conversely, movement from bottom to top is also possible.
[0025]
Next, with reference to FIGS. 6 to 10, an operation principle when the knowledge analysis system 1 presents an analysis result will be described.
[0026]
When providing the knowledge analysis service to the client computer 2 connected via the network 3, the user interface unit 11 first transmits screen data for displaying the screen shown in FIG. The screen includes a button a1 for instructing execution of text mining analysis, a button a2 for instructing execution of clustering analysis, a button a3 for shifting to an analysis axis selection operation, and an analysis result after selecting the analysis axis. And a button a4 for starting tallying. The user who has received this screen operates a pointing device such as a mouse provided in the client computer 2 and selects a desired button.
[0027]
When the selection of the button a1 is notified, the user interface unit 11 instructs the knowledge analysis unit 12 to execute the text mining analysis. On the other hand, in response to the instruction, the knowledge analysis unit 12 performs the text mining analysis on the latest text information group accumulated in the knowledge database 13 by the text mining unit 122, and the analysis result, that is, the text mining result 142 Is stored in the analysis result storage database 14.
[0028]
Similarly, when the selection of the button a2 is notified, the user interface unit 11 instructs the knowledge analysis unit 12 to execute the clustering analysis. On the other hand, in response to the instruction, the knowledge analysis unit 12 performs the text mining analysis on the latest text information group stored in the knowledge database 13 by the clustering unit 121, and analyzes the analysis result, that is, the clustering result 141. The result is stored in the result storage database 14.
[0029]
Further, when the selection of the button a3 is notified, the user interface unit 11 transmits screen data for displaying the screen shown in FIG. On this screen, a button b1 for shifting to a selection operation on the vertical axis of the table to which the clustering result 141 is assigned, and a button b2 for shifting to a selection operation on the horizontal axis of the table to which the text mining result 142 is assigned. It is additionally arranged. Then, when the selection of the button b1 or the button b2 is notified, the user interface unit 11 starts the notified analysis axis selection processing.
[0030]
Now, assuming that the selection of the button b1 has been notified, the user interface unit 11 causes the analysis axis selection unit 111 to acquire the hierarchical structure of the cluster in the clustering result 141 stored in the analysis result storage database 14. Then, the user interface unit 11 creates and transmits screen data for displaying a screen showing the hierarchical structure of the acquired cluster. FIG. 8 illustrates a screen presented to the user at this time.
[0031]
In the example of FIG. 8, in the hierarchical structure of the cluster in the clustering result 141, C1, C2,... Exist in the uppermost layer, and C11, C12,. Further, C111, C112, C113, C114, and C115 exist in a layer immediately below C11. Then, when the user who has been presented with this screen selects C11 from among them, the user operates a pointing device such as a mouse provided in the client computer 2 and selects the button c1 with C11 selected. On the other hand, the user interface unit 11 notified of the selection of C11 edits and transmits screen data for displaying the screen shown in FIG. As shown in FIG. 9, it is indicated that C11 selected by the user has been selected as the vertical axis of the table (d1 in FIG. 9).
[0032]
Similarly, the user selects the button a3 and the button b2, and performs the operation of selecting the horizontal axis of the table to which the text mining result 142 is assigned. Then, after the work is completed, the user selects the button a4 to start counting the analysis results.
[0033]
When notified of the selection of the button a4, the user interface unit 11 causes the analysis result totaling unit 112 to perform totalizing for organically combining the clustering result 141 and the text mining result 142.
[0034]
The clustering result 141 and the text mining result 142 stored in the analysis result storage database 14 include information for identifying which text information belongs to each cluster and each category. Therefore, by matching this information, the number of text information belonging to both the arbitrary cluster of the clustering result 141 and the arbitrary category of the text mining result 142 can be totaled. By performing such matching, the analysis result totaling unit 112 totalizes the analysis results in which the clustering result 141 is assigned to the vertical axis and the text mining result 142 is assigned to the horizontal axis. Then, the user interface unit 11 creates and transmits screen data for displaying a screen that presents the analysis results compiled by the analysis result compilation unit 112. FIG. 10 illustrates a screen presented to the user at this time.
[0035]
As shown in FIG. 10, the vertical and horizontal clusters and categories selected by the user are displayed at the top of the screen (e1). Here, the cluster C1 is selected on the vertical axis of the table, and the category T11 is selected on the horizontal axis of the table. Based on this selection, clusters C11, C12, C13,... Of the next lower layer of the cluster C1 are arranged in the center of the screen as items on the vertical axis, and the category of the next lower layer of the category T11 is arranged. The clustering result 141 and the text mining result 142 totaled in a table format in which T111, T112, T113, T114, T115,... Are arranged as items on the horizontal axis are displayed (E2). This table can be scrolled downward and to the right, respectively. At the end, the number of text information items that do not belong to any of the clusters and categories is totaled and displayed.
[0036]
When one of the clusters arranged as the items on the vertical axis and the categories arranged as the items on the horizontal axis is selected, the cluster or category in the hierarchy one level below the selected cluster or category is displayed on each axis. , The clustering result 141 and the text mining result 142 are re-aggregated and displayed (drill-down). For example, if cluster C12 is selected, the vertical axis is replaced with clusters C121, C122,... And the number of records in the table is updated.
[0037]
Further, at the bottom of the screen, a button for moving (drilling up) a cluster arranged as an item on the vertical axis or a hierarchy of a category arranged as an item on the horizontal axis to the next higher cluster or category is arranged. (E3). For example, when it is instructed to drill up the horizontal axis of the table in the state of FIG. 10, the categories arranged as the items of the horizontal axis are replaced with categories T11, T12, T13,... And the number of cases in the table is also updated. Is done.
[0038]
FIG. 11 is a flowchart showing an operation procedure when the knowledge analysis system 1 presents an analysis result.
[0039]
First, the user interface unit 11 transmits screen data for displaying a task selection screen for the user of the client computer 2 to select an operation (step A1). Next, when the user who has received the display of this screen selects “selection of analysis axis” (YES in step A2), the user interface unit 11 makes a selection for selecting one of the vertical axis and the horizontal axis. The image data for displaying the screen is transmitted (step A3). Then, when the user who receives the display of this screen selects “vertical axis” (YES in step A4), the user interface unit 11 executes a cluster selection process using the analysis axis selection unit 111 (step S4). A5) If “horizontal axis” is selected (NO in step A4), a category selection process is performed using the analysis axis selection unit 111 (step A6).
[0040]
When “start analysis” is selected (NO in step A2, YES in step A7), the user interface unit 11 uses the analysis result totaling unit 112 to perform a totaling process using the selected cluster and category as an analysis axis. Is executed (step A8), and the image data for displaying the analysis result screen presenting the tally result is transmitted (step A9).
[0041]
Further, when a hierarchical movement of the analysis axis is instructed on the analysis result screen (YES in step A10), the user interface unit 11 uses the analysis result totaling unit 112 to set the moved cluster and category as the analysis axis. The counting process is executed again (step A8).
[0042]
According to the above procedure, the knowledge analysis system 1 presents the clustering result 141 of the clustering unit 121 and the text mining result 142 of the text mining unit 122 in an organically combined manner, and furthermore, the hierarchy of the cluster or category to be analyzed. Is moved up and down according to the instruction. This enables the so-called synergistic effect, for example, to allow information in one analysis to grasp trends in the information buried in the other analysis, and to promote new discoveries that cannot be obtained from the results of only one analysis. You can also.
[0043]
Here, as an example of a method of organically combining two analysis results having different viewpoints, an example in which the results are tabulated in a two-dimensional array is shown. However, the present invention is not limited to this, and the present invention is not limited to this. Any form can be applied as long as the relationship can be expressed.
[0044]
Also, here, as shown in FIG. 4, the description has been made on the assumption that the analysis results are arranged in multiple hierarchies. However, this is not essential, and it is necessary to force a plurality of classification viewpoints into one hierarchy. Does not force. A plurality of classification viewpoints can be treated as independent flat classification systems, and can be organically combined using, for example, two axes in a table.
[0045]
That is, the present invention is not limited to the above-described embodiment, and can be variously modified in an implementation stage without departing from the gist of the invention. Furthermore, the embodiments include inventions at various stages, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. For example, even if some components are deleted from all the components shown in the embodiment, the problem described in the column of the problem to be solved by the invention can be solved, and the effects described in the column of the effect of the invention can be solved. Is obtained, a configuration from which this configuration requirement is deleted can be extracted as an invention.
[0046]
【The invention's effect】
As described above, according to the present invention, it is possible to provide a text information analysis system that organically combines and presents a plurality of analysis results obtained by different analysis methods and a method of presenting the analysis results applied to the system. It becomes possible.
[Brief description of the drawings]
FIG. 1 is a diagram showing a network configuration of a knowledge analysis system according to an embodiment of the present invention.
FIG. 2 is an exemplary view showing functional blocks of the knowledge analysis system according to the embodiment;
FIG. 3 is an exemplary first view for explaining an outline of a method of presenting an analysis result executed by the knowledge analysis system of the embodiment.
FIG. 4 is an exemplary second diagram for describing an outline of a method of presenting an analysis result executed by the knowledge analysis system of the embodiment.
FIG. 5 is an exemplary third diagram illustrating an outline of a method of presenting an analysis result executed by the knowledge analysis system according to the embodiment;
FIG. 6 is an exemplary first diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 7 is an exemplary second diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 8 is an exemplary third diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 9 is an exemplary fourth diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 10 is an exemplary fifth diagram illustrating a screen displayed by the knowledge analysis system of the embodiment.
FIG. 11 is an exemplary flowchart illustrating the operation procedure when the knowledge analysis system according to the embodiment presents an analysis result.
[Explanation of symbols]
1 ... Knowledge analysis system 2 ... Client computer 3 ... Network 11 ... User interface 12 ... Knowledge analysis unit 13 ... Knowledge database 14 ... Analysis result storage database 111 ... Analysis axis selection unit 112 ... Analysis result totaling unit 121 ... Clustering unit 122 ... Text Mining unit 141 Clustering result 142 Text mining result

Claims (15)

収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、
第1および第2の分析手段と、
同一のテキスト情報群に対する前記第1および第2の分析手段の2つの分析結果を有機的に結合させて提示する分析結果提示手段と
を具備することを特徴とするテキスト情報分析システム。
In a text information analysis system that analyzes a large amount of collected and stored text information,
First and second analysis means;
A text information analysis system, comprising: an analysis result presenting means for organically combining and presenting two analysis results of the first and second analysis means for the same text information group.
収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段と、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段と、
同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段と
を具備することを特徴とするテキスト情報分析システム。
In a text information analysis system that analyzes a large amount of collected and stored text information,
Clustering analysis means for analyzing the collected and accumulated large amount of text information based on the appearance frequency of each word and the degree of association between the plurality of words;
Text mining analysis means for analyzing the large amount of collected and accumulated text information based on arbitrarily specified conditions,
A text information analysis system, comprising: an analysis result presentation unit that organically combines and presents the analysis result of the clustering analysis unit and the analysis result of the text mining analysis unit for the same text information group.
前記テキストマイニング分析手段で指定される条件は、前記テキスト情報群を所望のカテゴリに分類するための条件であることを特徴とする請求項2記載のテキスト情報分析システム。The text information analysis system according to claim 2, wherein the condition specified by the text mining analysis means is a condition for classifying the text information group into a desired category. 前記分析結果提示手段は、前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とをそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項2記載のテキスト情報分析システム。The analysis result presentation means presents the analysis result of the clustering analysis means and the analysis result of the text mining analysis means in a two-dimensional array tabular form assigned to a vertical axis and a horizontal axis, respectively. Item 2. The text information analysis system according to Item 2. 前記クラスタリング分析手段および前記テキストマイニング分析手段は、前記テキスト情報群を多階層のクラスタおよびカテゴリに分類し、前記分析結果提示手段は、前記縦軸および前記横軸の項目として配置するクラスタおよびカテゴリの階層を各軸ごとに上下に移動させる手段を有することを特徴とする請求項4記載のテキスト情報分析システム。The clustering analysis means and the text mining analysis means classify the text information group into multi-level clusters and categories, and the analysis result presenting means includes a 5. The text information analysis system according to claim 4, further comprising means for moving the hierarchy up and down for each axis. 収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムとして動作させるコンピュータを、
第1および第2の分析手段、
同一のテキスト情報群に対する前記第1および第2の分析手段の2つの分析結果を有機的に結合させて提示する分析結果提示手段
として機能させるためのプログラム。
A computer that operates as a text information analysis system that analyzes a large amount of collected and accumulated text information,
First and second analysis means,
A program for functioning as analysis result presenting means for presenting two analysis results of the first and second analysis means for the same text information group in an organically combined manner.
収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムとして動作させるコンピュータを、
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段、
同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段
として機能させるためのプログラム。
A computer that operates as a text information analysis system that analyzes a large amount of collected and accumulated text information,
Clustering analysis means for analyzing the collected and accumulated large amount of text information based on the appearance frequency of each word and the degree of association between the plurality of words;
Text mining analysis means for analyzing a large amount of collected and accumulated text information based on arbitrarily specified conditions,
A program for functioning as analysis result presenting means for presenting an analysis result of the clustering analysis means and an analysis result of the text mining analysis means for the same text information group in an organically combined manner.
前記テキストマイニング分析手段で指定される条件は、前記テキスト情報群を所望のカテゴリに分類するための条件であることを特徴とする請求項7記載のプログラム。The program according to claim 7, wherein the condition specified by the text mining analysis unit is a condition for classifying the text information group into a desired category. 前記分析結果提示手段は、前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とをそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項7記載のプログラム。The analysis result presentation means presents the analysis result of the clustering analysis means and the analysis result of the text mining analysis means in a two-dimensional array tabular form assigned to a vertical axis and a horizontal axis, respectively. Item 7. The program according to Item 7. 前記クラスタリング分析手段および前記テキストマイニング分析手段は、前記テキスト情報群を多階層のクラスタおよびカテゴリに分類し、
前記分析結果提示手段は、前記縦軸および前記横軸の項目として配置するクラスタおよびカテゴリの階層を各軸ごとに上下に移動させる手段を有することを特徴とする請求項9記載のプログラム。
The clustering analysis unit and the text mining analysis unit classify the text information group into multi-level clusters and categories,
10. The program according to claim 9, wherein the analysis result presenting means includes means for moving a hierarchy of clusters and categories arranged as items of the vertical axis and the horizontal axis up and down for each axis.
収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムに適用される分析結果の提示方法であって、
第1および第2の分析ステップと、
同一のテキスト情報群に対する前記第1および第2の分析ステップの2つの分析結果を有機的に結合させて提示する分析結果提示ステップと
を具備することを特徴とする分析結果の提示方法。
A method of presenting an analysis result applied to a text information analysis system for analyzing a large amount of collected and accumulated text information,
First and second analysis steps;
An analysis result presentation step of organically combining and presenting the two analysis results of the first and second analysis steps for the same text information group.
収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムに適用される分析結果の提示方法であって、
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析ステップと、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析ステップと、
同一のテキスト情報群に対する前記クラスタリング分析ステップの分析結果と前記テキストマイニング分析ステップの分析結果とを有機的に結合させて提示する分析結果提示ステップと
を具備することを特徴とする分析結果の提示方法。
A method of presenting an analysis result applied to a text information analysis system for analyzing a large amount of collected and accumulated text information,
A clustering analysis step of analyzing the collected and accumulated large amount of text information based on an appearance frequency of each word and a degree of association between a plurality of words;
Based on arbitrarily specified conditions, a text mining analysis step of analyzing the collected and accumulated large amount of text information,
An analysis result presentation step of organically combining and presenting the analysis result of the clustering analysis step and the analysis result of the text mining analysis step for the same text information group, and presenting the analysis result. .
前記テキストマイニング分析ステップで指定される条件は、前記テキスト情報群を所望のカテゴリに分類するための条件であることを特徴とする請求項12記載の分析結果の提示方法。13. The method according to claim 12, wherein the condition specified in the text mining analysis step is a condition for classifying the text information group into a desired category. 前記分析結果提示ステップは、前記クラスタリング分析ステップの分析結果と前記テキストマイニング分析ステップの分析結果とをそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項12記載の分析結果の提示方法。The analysis result presenting step presents the analysis result of the clustering analysis step and the analysis result of the text mining analysis step in a two-dimensional array table format assigned to a vertical axis and a horizontal axis, respectively. Item 14. A method for presenting an analysis result according to Item 12. 前記クラスタリング分析ステップおよび前記テキストマイニング分析ステップは、前記テキスト情報群を多階層のクラスタおよびカテゴリに分類し、
前記分析結果提示ステップは、前記縦軸および前記横軸の項目として配置するクラスタおよびカテゴリの階層を各軸ごとに上下に移動させるステップを有することを特徴とする請求項14記載の分析結果の提示方法。
The clustering analysis step and the text mining analysis step classify the text information group into multi-level clusters and categories,
The analysis result presentation step according to claim 14, wherein the analysis result presentation step includes a step of moving up and down a hierarchy of clusters and categories arranged as items of the vertical axis and the horizontal axis for each axis. Method.
JP2002243973A 2002-08-23 2002-08-23 Text information analysis system and analysis result presentation method Expired - Fee Related JP3831319B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002243973A JP3831319B2 (en) 2002-08-23 2002-08-23 Text information analysis system and analysis result presentation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002243973A JP3831319B2 (en) 2002-08-23 2002-08-23 Text information analysis system and analysis result presentation method

Publications (2)

Publication Number Publication Date
JP2004086350A true JP2004086350A (en) 2004-03-18
JP3831319B2 JP3831319B2 (en) 2006-10-11

Family

ID=32052598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002243973A Expired - Fee Related JP3831319B2 (en) 2002-08-23 2002-08-23 Text information analysis system and analysis result presentation method

Country Status (1)

Country Link
JP (1) JP3831319B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323627A (en) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd Classification list creation support system and program
JP2008243127A (en) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd Input information analyzing device
JP2009128949A (en) * 2007-11-19 2009-06-11 Fuji Xerox Co Ltd Graphic display device and program
US8793266B2 (en) 2010-09-30 2014-07-29 International Business Machines Corporation Graphical user interface for a search query

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040050A (en) * 1996-07-22 1998-02-13 Fuji Xerox Co Ltd Table generation instructing device and table generating system
JP2001273458A (en) * 2000-03-24 2001-10-05 Ricoh Co Ltd Device and method for supporting document group analysis and recording medium
JP2002183175A (en) * 2000-12-08 2002-06-28 Hitachi Ltd Text mining method

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1040050A (en) * 1996-07-22 1998-02-13 Fuji Xerox Co Ltd Table generation instructing device and table generating system
JP2001273458A (en) * 2000-03-24 2001-10-05 Ricoh Co Ltd Device and method for supporting document group analysis and recording medium
JP2002183175A (en) * 2000-12-08 2002-06-28 Hitachi Ltd Text mining method

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006323627A (en) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd Classification list creation support system and program
JP4490871B2 (en) * 2005-05-19 2010-06-30 株式会社 日立東日本ソリューションズ Classification list creation support system and classification list creation support program
JP2008243127A (en) * 2007-03-29 2008-10-09 Chuden Cti Co Ltd Input information analyzing device
JP2009128949A (en) * 2007-11-19 2009-06-11 Fuji Xerox Co Ltd Graphic display device and program
US8793266B2 (en) 2010-09-30 2014-07-29 International Business Machines Corporation Graphical user interface for a search query

Also Published As

Publication number Publication date
JP3831319B2 (en) 2006-10-11

Similar Documents

Publication Publication Date Title
Gotz et al. Characterizing users’ visual analytic activity for insight provenance
Fisher et al. Interactions with big data analytics
US9069748B2 (en) Selective generation and display of data items associated with a spreadsheet
Marcus et al. Tweets as data: demonstration of tweeql and twitinfo
US20110179093A1 (en) Storing and Managing Information Artifacts Collected by Information Analysts Using a Computing Device
CN100449541C (en) Document group analyzing apparatus, a document group analyzing method, a document group analyzing system
CN109522357A (en) A kind of data processing method, device, server and storage medium
JP2004362043A (en) Project managing system
WO2011090519A1 (en) Accessing large collection object tables in a database
JP5535062B2 (en) Data storage and query method for time series analysis of weblog and system for executing the method
JP2007193685A (en) Program for displaying personal connection information, recording medium with the program recorded thereon, device for displaying personal connection information, and method for displaying personal connection information
KR20100101594A (en) Method, system and computer program for searching digital contents based on metadata of sample elements
US20120046937A1 (en) Semantic classification of variable data campaign information
US8495513B2 (en) Automated content generation through selective combination
Shieh The integration system for librarians' bibliomining
Kumar Knowledge discovery practices and emerging applications of data mining: Trends and new domains: Trends and new domains
JP2004086350A (en) Text information analysis system and presentation method of analysis result
KR101597143B1 (en) Information processing apparatus and information processing method
Elias Enhancing User Interaction with Business Intelligence Dashboards
CN111222166A (en) Method and device for sharing and managing design material in multi-user online collaboration
Zhang et al. An efficient data preprocessing method for mining customer survey data
Motahari et al. Process spaceship: discovering and exploring process views from event logs in data spaces
JP2001175672A (en) Information filtering system and its method, and computer-readable recording medium with recorded program for implementing same method
KR20050109106A (en) Internet search system and method for providing integrated search results efficiently
JP2002278983A (en) Summary extracting program, document analysis supporting program, summary extracting method and method and system for supporting document analysis

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060220

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060307

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060508

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060629

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060713

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090721

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100721

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110721

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120721

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130721

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees