JP2004086350A - Text information analysis system and presentation method of analysis result - Google Patents
Text information analysis system and presentation method of analysis result Download PDFInfo
- Publication number
- JP2004086350A JP2004086350A JP2002243973A JP2002243973A JP2004086350A JP 2004086350 A JP2004086350 A JP 2004086350A JP 2002243973 A JP2002243973 A JP 2002243973A JP 2002243973 A JP2002243973 A JP 2002243973A JP 2004086350 A JP2004086350 A JP 2004086350A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- text information
- analysis result
- result
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】
【発明の属する技術分野】
この発明は、例えばLAN(Local Area Network)やイントラネット経由で収集・蓄積されたアンケートや日報などのテキスト情報を分析するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法に関する。
【0002】
【従来の技術】
近年、LANやイントラネットを敷設し、各社員がもつ情報、例えば業務上で発生するアンケートや日報などの非定型情報を部門を越えて収集・蓄積する企業が増えつつある。この収集・蓄積された情報は、全社員の知識として共有・活用されることを目的に、様々な分析が施されるのが一般的である。そして、その分析手法として、現在では、クラスタリング分析とテキストマイニング分析とがよく知られている。
【0003】
クラスタリング分析は、例えば特開2002−149670号公報に記載されているように、各単語の出現頻度や複数の単語間の関連度により、収集・蓄積された情報を分類するものである。ここで、複数の単語間の関連度とは、共起性の有無をいい、例えば「私はAとBを購入した。」といった、「A」と「B」を共に含むテキスト情報が多数存在する場合、この「A」と「B」は共起性があると判断する。
【0004】
その結果、「A」という単語の出現頻度が高い情報だけが同じクラスタに属するものとして取り扱われるだけでなく、「B」という単語の出現頻度が高い情報も同じクラスタに属するものとして取り扱われ、絞り込みを適切に行った精度の高い分類が自動的に実行されることになる。
【0005】
一方、テキストマイニング分析は、例えば特開2001−147937号公報に記載されているように、収集・蓄積された情報を利用者が望むカテゴリに分類するものである。例えば「C」、「D」、「F」製品に関する情報をそれぞれカテゴリに纏めたい場合、利用者は、どのような記述を含む場合に、その情報を各カテゴリに属するものと判断するのか、その条件を指定する。
【0006】
このクラスタリング分析およびテキストマイニング分析によれば、無秩序に収集・蓄積された大量の情報から何らかの傾向を掴むことが可能となる等、知識の共有・活用が有効に図られることになる。
【0007】
【発明が解決しようとする課題】
ところで、前述したクラスタリング分析およびテキストマイニング分析は、どちらもいずれのクラスタおよびカテゴリにも属さない情報を数多く発生させてしまうという欠点をもっている。したがって、いずれの分析手法を採用した場合であっても、極めて重要な情報を抽出することができずに、「その他」の多数の情報の中に埋もれさせてしまうおそれがあった。
【0008】
また、たとえ両方の分析手法を備える場合であっても、それらの分析結果を個別に参照するだけでは、例えば一方の分析で埋もれてしまった情報のみを対象とした傾向を他方の分析で認識することは難しく、また、いわゆる相乗効果を期待することもできない。
【0009】
この発明は、このような事情を考慮してなされたものであり、互いに異なる分析手法による複数の分析結果を有機的に結合させて提示するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
前述した目的を達成するために、この発明は、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段と、任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段と、同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段とを具備することを特徴とする。
【0011】
この発明のテキスト情報分析システムにおいては、クラスタリング分析の結果とテキストマイニング分析の結果とを、例えばそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示する等、この2つの分析結果を有機的に結合させて提示する。これにより、例えば一方の分析結果で埋もれてしまった情報のみを対象とした傾向を他方の分析結果で簡単に把握できるといった、それぞれの分析結果のみでは得られない付加価値の高い有益な分析結果の提示を実現する。
【0012】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態を説明する。
【0013】
図1は、この発明の実施形態に係る知識分析システムのネットワーク構成を示す図である。
【0014】
この知識分析システム1は、サーバ機などと称される高性能のコンピュータ上に構築され、複数のクライアントコンピュータ2とLANやイントラネットなどのネットワーク3を介して接続される。そして、知識分析システム1は、クライアントコンピュータ2からの分析要求を受け付け、その要求に基づく分析の結果を返却する。
【0015】
図2は、この知識分析システム1の機能ブロックを示す図である。図2に示すように、この知識分析システム1は、ユーザインタフェース部11および知識分析部12の処理部と、知識データベース13および分析結果格納データベース14のデータ部とを有している。なお、処理部は、この知識分析システム1が構築されるコンピュータに搭載されたCPUの動作手順を記述するプログラムにより構成されるものであり、データ部は、同コンピュータが備える磁気ディスク装置などの記憶媒体上に構成されるものである。
【0016】
ユーザインタフェース部11は、クライアントコンピュータ2の利用者に対する窓口の役割を担うものであり、分析軸選択部111および分析結果集計部112を有している。分析軸選択部111は、クライアントコンピュータ2からの指示の一部を受け付けるものであり、その詳細は後述する。一方、分析結果集計部112は、この分析軸選択部111により受け付けた指示に基づき、分析結果の集計を行ってクライアントコンピュータ2に返却するものである。この詳細についても後述する。
【0017】
知識分析部12は、例えば業務上で発生するアンケートや日報など、知識データベース13に蓄積された大量のテキスト情報を分析し、その結果を分析結果格納データベース14に格納するものであり、クラスタリング部121およびテキストマイニング部142を有している。クラスタリング部121は、各単語の出現頻度や複数の単語間の関連度により、知識データベース13のテキスト情報をクラスタに分類するものであり(クラスタリング分析)、これにより得られたクラスタリング結果141を分析結果格納データベース14に格納する。一方、テキストマイニング部142は、利用者から指定された条件に基づき、知識データベース13のテキスト情報を利用者が望むカテゴリに分類するものであり(テキストマイニング分析)、これにより得られたテキストマイニング結果142を分析結果格納データベース14に格納する。
【0018】
ここで、図3乃至図5を参照して、この知識分析システム1の特徴である分析結果の提示方法についての概略を説明する。
【0019】
いま、知識データベース13には、アンケートや日報、メールなどのテキスト情報が大量に蓄積されているものとする(図3のA)。そして、この同一のテキスト情報群に対して、一方では、クラスタリング部121がクラスタリング分析を実行し、クラスタリング結果141を得て(図3のB2)、他方では、テキストマイニング部122がテキストマイニング分析を実行し、テキストマイニング結果142を得たとする(図3のB1)。
【0020】
まず、クラスタリング結果141に着目すると、テキスト情報群は、C1,C2,C3,…と分類されているが、これらのいずれにも属さないテキスト情報も大量に発生する。同様に、テキストマイニング結果142に着目すると、テキスト情報群は、T1,T2,T3,…と分類されているが、これらのいずれにも属さないテキスト情報も大量に発生する。したがって、このままでは、いずれにも属さないテキスト情報は、「その他」の多数のテキスト情報と共にただ埋もれてしまうことになる。
【0021】
そこで、この知識分析システム1では、この2つの分析結果を有機的に連結させて、より具体的には、例えばクラスタリング結果141を縦軸、テキストマイニング結果142を横軸に割り当てた2次元配列の表形式に集計して、利用者に提示するようにした(図3のC)。図中、n11は、クラスタリング部121によるクラスタリング分析によってクラスタC1に属するとともに、テキストマイニング部122によるテキストマイニング分析によってカテゴリT1に属するテキスト情報の件数を示している。
【0022】
これにより、例えばクラスタリング結果141では「その他」として纏められたテキスト情報群を、テキストマイニング結果142のT1,T2,T3,…の分類で参照することができ(nx1,nx2,nx3,…)、同様に、テキストマイニング結果142では「その他」として纏められたテキスト情報群を、クラスタリング結果142におけるC1,C2,C3,…の分類で参照することができるようになる(n1y,n2y,n3y,…)。また、視点の異なる2つの分析結果を有機的に結合させることにより、一方の分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を期待することもできる。
【0023】
また、このクラスタリング部121のクラスタリング分析により得られるクラスタリング結果141と、テキストマイニング部142のテキストマイニング分析により得られるテキストマイニング結果142は、テキスト情報群を多階層のクラスタまたはカテゴリに分類されているのが一般的である。図5に、多階層のカテゴリに分類されたテキストマイニング結果142の一例を示す。そこで、この知識分析システム1では、縦軸および横軸の項目として配置するクラスタリング結果141およびテキストマイニング結果142のクラスタおよびカテゴリの階層を、利用者の指示に応じて各軸ごとに上下に移動できるようにした。
【0024】
例えば、図3に示した表(C)において、テキストマイニング結果142をT1に絞ってさらに詳細に参照したいという要求に対して、この知識分析システム1では、図5に示すように、横軸の項目として配置されたテキストマイニング結果142のカテゴリの階層を一段下に移動させるべく再集計して提示する。この移動は、その階層が続く限り可能であり、また、逆に下から上への移動も当然に可能である。
【0025】
次に、図6乃至図10を参照して、この知識分析システム1が分析結果の提示を行う際の動作原理について説明する。
【0026】
ネットワーク3を介して接続されるクライアントコンピュータ2に対して知識分析サービスを提供する際、ユーザインタフェース部11は、まず、図6に示す画面を表示させるための画面データを送信する。この画面には、テキストマイニング分析の実行を指示するボタンa1と、クラスタリング分析の実行を指示するボタンa2と、分析軸の選択作業に移行するためのボタンa3と、この分析軸の選択後に分析結果の集計を開始させるためのボタンa4とが配置される。この画面の提示を受けた利用者は、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、所望のボタンを選択する。
【0027】
ボタンa1の選択が通知されると、ユーザインタフェース部11は、テキストマイニング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、テキストマイニング部122が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果、つまりテキストマイニング結果142を分析結果格納データベース14に格納する。
【0028】
同様に、ボタンa2の選択が通知されると、ユーザインタフェース部11は、クラスタリング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、クラスタリング部121が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果、つまりクラスタリング結果141を分析結果格納データベース14に格納する。
【0029】
また、ボタンa3の選択が通知されると、ユーザインタフェース部11は、図7に示す画面を表示させるための画面データを送信する。この画面には、クラスタリング結果141が割り当てられる表の縦軸の選択作業に移行するためのボタンb1と、テキストマイニング結果142が割り当てられる表の横軸の選択作業に移行するためのボタンb2とが追加配置される。そして、このボタンb1またはボタンb2の選択が通知されると、ユーザインタフェース部11は、その通知された分析軸の選択処理を開始する。
【0030】
いま、ボタンb1の選択が通知されたとすると、ユーザインタフェース部11は、分析結果格納データベース14に格納されたクラスタリング結果141におけるクラスタの階層構造を分析軸選択部111に取得させる。そして、ユーザインタフェース部11は、その取得させたクラスタの階層構造を示した画面を表示させるための画面データを作成して送信する。図8に、この時に利用者に提示される画面を例示する。
【0031】
図8の例では、クラスタリング結果141におけるクラスタの階層構造は、最上位層にC1,C2,…が存在し、また、C1の1つ下の層には、C11,C12,…が存在する。さらに、C11の1つ下の層には、C111,C112,C113,C114,C115が存在する。そして、この画面の提示を受けた利用者が、この中からC11を選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、C11を選択した状態でボタンc1を選択する。一方、このC11の選択を通知されたユーザインタフェース部11は、図9に示す画面を表示させるための画面データを編集して送信する。図9に示すように、利用者が選択したC11が、表の縦軸として選択された旨が示されている(図9のd1)。
【0032】
また、同様に、利用者は、ボタンa3およびボタンb2を選択し、テキストマイニング結果142が割り当てられる表の横軸の選択作業を行う。そして、その作業完了後、利用者は、ボタンa4を選択し、分析結果の集計を開始させる。
【0033】
このボタンa4の選択が通知されると、ユーザインタフェース部11は、クラスタリング結果141とテキストマイニング結果142とを有機的に結合させるための集計を分析結果集計部112に行わせる。
【0034】
分析結果格納データベース14に格納されるクラスタリング結果141およびテキストマイニング結果142には、各クラスタおよび各カテゴリにどのテキスト情報が属しているのかを識別するための情報が含まれている。したがって、この情報を突き合わせることにより、クラスタリング結果141の任意のクラスタとテキストマイニング結果142の任意のカテゴリの双方に属するテキスト情報の件数を集計することができる。分析結果集計部112は、このような突き合わせを行っていくことにより、クラスタリング結果141を縦軸、テキストマイニング結果142を横軸に割り当てた分析結果の集計を実行する。そして、ユーザインタフェース部11は、この分析結果集計部112に集計させた分析結果を提示する画面を表示させるための画面データを作成して送信する。図10に、この時に利用者に提示される画面を例示する。
【0035】
図10に示すように、画面の上部には、利用者が選択した縦軸および横軸のクラスタおよびカテゴリがそれぞれ表示される(e1)。ここでは、表の縦軸にクラスタC1、表の横軸にカテゴリT11が選択されている。そして、この選択に基づき、画面の中央部には、クラスタC1の1つ下の階層のクラスタC11,C12,C13,…を縦軸の項目として配置し、カテゴリT11の1つ下の階層のカテゴリT111,T112,T113,T114,T115,…を横軸の項目として配置した表形式で集計されたクラスタリング結果141およびテキストマイニング結果142が表示される(E2)。なお、この表は、下方向および右方向にそれぞれスクロール可能であり、その末端には、いずれのクラスタおよびカテゴリにも属さないテキスト情報の件数がそれぞれ集計されて表示される。
【0036】
また、この縦軸の項目として配置されたクラスタ、または横軸の項目として配置されたカテゴリのいずれかを選択すると、その選択されたクラスタまたはカテゴリの1つ下の階層のクラスタまたはカテゴリを各軸に配置した状態で、クラスタリング結果141およびテキストマイニング結果142が再集計されて表示される(ドリルダウン)。例えば、クラスタC12が選択されたとすると、縦軸はクラスタC121,C122,…に置き換わり、表内の件数も更新される。
【0037】
さらに、画面の下部には、縦軸の項目として配置されたクラスタ、または横軸の項目として配置されたカテゴリの階層を1つ上のクラスタまたはカテゴリに移動させる(ドリルアップ)ためのボタンが配置される(e3)。例えば、図10の状態で表の横軸をドリルアップさせる旨が指示されると、横軸の項目として配置されるカテゴリは、カテゴリT11,T12,T13,…に置き換わり、表内の件数も更新される。
【0038】
図11は、この知識分析システム1が分析結果の提示を行う際の動作手順を示すフローチャートである。
【0039】
ユーザインタフェース部11は、まず、クライアントコンピュータ2の利用者が作業を選択するためのタスク選択画面を表示させる画面データを送信する(ステップA1)。次に、この画面の提示を受けた利用者が、「分析軸の選択」を選択すると(ステップA2のYES)、ユーザインタフェース部11は、縦軸および横軸のいずれかを選択するための選択画面を表示させる画像データを送信する(ステップA3)。そして、この画面の提示を受けた利用者が、「縦軸」を選択した場合(ステップA4のYES)、ユーザインタフェース部11は、分析軸選択部111を用いてクラスタ選択処理を実行し(ステップA5)、「横軸」を選択した場合には(ステップA4のNO)、分析軸選択部111を用いてカテゴリ選択処理を実行する(ステップA6)。
【0040】
また、「分析スタート」が選択された場合(ステップA2のNO,ステップA7のYES)、ユーザインタフェース部11は、分析結果集計部112を用いて選択されたクラスタおよびカテゴリを分析軸とした集計処理を実行し(ステップA8)、その集計結果を提示した分析結果画面を表示させる画像データを送信する(ステップA9)。
【0041】
さらに、この分析結果画面上で分析軸の階層移動が指示されると(ステップA10のYES)、ユーザインタフェース部11は、分析結果集計部112を用いて移動後のクラスタおよびカテゴリを分析軸とした集計処理を再実行する(ステップA8)。
【0042】
以上の手順により、この知識分析システム1は、クラスタリング部121のクラスタリング結果141とテキストマイニング部122のテキストマイニング結果142とを有機的に結合させて提示し、また、分析対象のクラスタまたはカテゴリの階層を指示に応じて上下に移動させる。これにより、例えば一方の分析で埋もれた情報の傾向を他方の分析で把握すること等を可能とし、また、一方の分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を期待することもできる。
【0043】
なお、ここでは、視点の異なる2つの分析結果を有機的に結合させる方法として、2次元配列の表形式に集計する例を示したが、この発明は、これに限られるものではなく、互いの関係を表現できれば、どのような形式を適用することも可能である。
【0044】
また、ここでは、図4に示すとおり、分析結果が多階層に整理されていることを前提に説明を行ったが、これは必ずしも必須ではなく、複数の分類観点を無理やりひとつの階層に押し込むことを強制するものではない。複数の分類観点は、それぞれ独立した平坦な分類体系として扱うことができ、たとえば表の2軸を利用してそれらを有機的に組み合わせることが可能である。
【0045】
つまり、本願発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。たとえば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0046】
【発明の効果】
以上のように、この発明によれば、互いに異なる分析手法による複数の分析結果を有機的に結合させて提示するテキスト情報分析システムおよび同システムに適用される分析結果の提示方法を提供することが可能となる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る知識分析システムのネットワーク構成を示す図。
【図2】同実施形態の知識分析システムの機能ブロックを示す図。
【図3】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第1の図。
【図4】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第2の図。
【図5】同実施形態の知識分析システムが実行する分析結果の提示方法についての概略を説明するための第3の図。
【図6】同実施形態の知識分析システムで表示される画面を例示する第1の図。
【図7】同実施形態の知識分析システムで表示される画面を例示する第2の図。
【図8】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図9】同実施形態の知識分析システムで表示される画面を例示する第4の図。
【図10】同実施形態の知識分析システムで表示される画面を例示する第5の図。
【図11】同実施形態の知識分析システムが分析結果の提示を行う際の動作手順を示すフローチャート。
【符号の説明】
1…知識分析システム
2…クライアントコンピュータ
3…ネットワーク
11…ユーザインタフェース
12…知識分析部
13…知識データベース
14…分析結果格納データベース
111…分析軸選択部
112…分析結果集計部
121…クラスタリング部
122…テキストマイニング部
141…クラスタリング結果
142…テキストマイニング結果[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a text information analysis system for analyzing text information such as questionnaires and daily reports collected and stored via a LAN (Local Area Network) or an intranet, and a method of presenting analysis results applied to the system.
[0002]
[Prior art]
2. Description of the Related Art In recent years, an increasing number of companies have laid a LAN or an intranet to collect and accumulate information held by each employee, for example, irregular information such as a questionnaire and a daily report generated during work, across departments. This collected and accumulated information is generally subjected to various analyzes in order to be shared and utilized as knowledge of all employees. At present, clustering analysis and text mining analysis are well known as the analysis methods.
[0003]
In the clustering analysis, as described in, for example, JP-A-2002-149670, information collected and stored is classified according to the appearance frequency of each word and the degree of association between a plurality of words. Here, the degree of relevance between a plurality of words refers to the presence or absence of co-occurrence. For example, there is a lot of text information including both “A” and “B” such as “I purchased A and B.” In this case, it is determined that “A” and “B” have co-occurrence.
[0004]
As a result, not only information with a high frequency of appearance of the word "A" is treated as belonging to the same cluster, but also information with a high frequency of appearance of the word "B" is treated as belonging to the same cluster. Is performed automatically and the classification with high accuracy is performed automatically.
[0005]
On the other hand, the text mining analysis classifies the collected and accumulated information into categories desired by the user, as described in, for example, JP-A-2001-147937. For example, when it is desired to group information on “C”, “D”, and “F” products into respective categories, the user may determine what kind of description is included in the category and determine whether the information belongs to each category. Specify conditions.
[0006]
According to the clustering analysis and the text mining analysis, knowledge sharing and utilization can be effectively achieved, for example, it is possible to grasp a certain tendency from a large amount of information collected and accumulated in a random manner.
[0007]
[Problems to be solved by the invention]
By the way, both the clustering analysis and the text mining analysis described above have a disadvantage that a large amount of information that does not belong to any cluster or category is generated. Therefore, no matter which analysis method is employed, extremely important information cannot be extracted, and may be buried in a large number of other information.
[0008]
Even if both analysis methods are provided, simply referring to the analysis results individually, for example, recognizes, in the other analysis, a tendency that targets only the information buried in one analysis. It's difficult, and you can't expect so-called synergy.
[0009]
The present invention has been made in view of such circumstances, and a text information analysis system that organically combines and presents a plurality of analysis results obtained by different analysis techniques and an analysis result analysis method applied to the text information analysis system. The purpose is to provide a presentation method.
[0010]
[Means for Solving the Problems]
In order to achieve the above-mentioned object, the present invention provides a text information analysis system for analyzing a large amount of text information collected and stored, based on the frequency of appearance of each word and the degree of association between a plurality of words. Clustering analysis means for analyzing a large amount of accumulated text information; text mining analysis means for analyzing the large amount of collected and accumulated text information based on arbitrarily specified conditions; and An analysis result presentation unit that organically combines and presents the analysis result of the clustering analysis unit and the analysis result of the text mining analysis unit is provided.
[0011]
In the text information analysis system according to the present invention, the results of the two analysis are presented, for example, by presenting the result of the clustering analysis and the result of the text mining analysis in the form of a two-dimensional array assigned to the vertical and horizontal axes, respectively. Are presented organically bound. As a result, for example, it is possible to easily grasp, using the other analysis results, the tendency for only the information that has been buried in one analysis result. Realize the presentation.
[0012]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0013]
FIG. 1 is a diagram showing a network configuration of a knowledge analysis system according to an embodiment of the present invention.
[0014]
The
[0015]
FIG. 2 is a diagram showing functional blocks of the
[0016]
The
[0017]
The
[0018]
Here, an outline of a method of presenting an analysis result, which is a feature of the
[0019]
Now, it is assumed that a large amount of text information such as a questionnaire, a daily report, and an e-mail is stored in the knowledge database 13 (A in FIG. 3). Then, on the one hand, the
[0020]
First, paying attention to the
[0021]
Therefore, in the
[0022]
Thereby, for example, the text information group grouped as “others” in the
[0023]
The
[0024]
For example, in the table (C) shown in FIG. 3, in response to a request to refer to the
[0025]
Next, with reference to FIGS. 6 to 10, an operation principle when the
[0026]
When providing the knowledge analysis service to the
[0027]
When the selection of the button a1 is notified, the
[0028]
Similarly, when the selection of the button a2 is notified, the
[0029]
Further, when the selection of the button a3 is notified, the
[0030]
Now, assuming that the selection of the button b1 has been notified, the
[0031]
In the example of FIG. 8, in the hierarchical structure of the cluster in the
[0032]
Similarly, the user selects the button a3 and the button b2, and performs the operation of selecting the horizontal axis of the table to which the
[0033]
When notified of the selection of the button a4, the
[0034]
The
[0035]
As shown in FIG. 10, the vertical and horizontal clusters and categories selected by the user are displayed at the top of the screen (e1). Here, the cluster C1 is selected on the vertical axis of the table, and the category T11 is selected on the horizontal axis of the table. Based on this selection, clusters C11, C12, C13,... Of the next lower layer of the cluster C1 are arranged in the center of the screen as items on the vertical axis, and the category of the next lower layer of the category T11 is arranged. The
[0036]
When one of the clusters arranged as the items on the vertical axis and the categories arranged as the items on the horizontal axis is selected, the cluster or category in the hierarchy one level below the selected cluster or category is displayed on each axis. , The
[0037]
Further, at the bottom of the screen, a button for moving (drilling up) a cluster arranged as an item on the vertical axis or a hierarchy of a category arranged as an item on the horizontal axis to the next higher cluster or category is arranged. (E3). For example, when it is instructed to drill up the horizontal axis of the table in the state of FIG. 10, the categories arranged as the items of the horizontal axis are replaced with categories T11, T12, T13,... And the number of cases in the table is also updated. Is done.
[0038]
FIG. 11 is a flowchart showing an operation procedure when the
[0039]
First, the
[0040]
When “start analysis” is selected (NO in step A2, YES in step A7), the
[0041]
Further, when a hierarchical movement of the analysis axis is instructed on the analysis result screen (YES in step A10), the
[0042]
According to the above procedure, the
[0043]
Here, as an example of a method of organically combining two analysis results having different viewpoints, an example in which the results are tabulated in a two-dimensional array is shown. However, the present invention is not limited to this, and the present invention is not limited to this. Any form can be applied as long as the relationship can be expressed.
[0044]
Also, here, as shown in FIG. 4, the description has been made on the assumption that the analysis results are arranged in multiple hierarchies. However, this is not essential, and it is necessary to force a plurality of classification viewpoints into one hierarchy. Does not force. A plurality of classification viewpoints can be treated as independent flat classification systems, and can be organically combined using, for example, two axes in a table.
[0045]
That is, the present invention is not limited to the above-described embodiment, and can be variously modified in an implementation stage without departing from the gist of the invention. Furthermore, the embodiments include inventions at various stages, and various inventions can be extracted by appropriately combining a plurality of disclosed constituent elements. For example, even if some components are deleted from all the components shown in the embodiment, the problem described in the column of the problem to be solved by the invention can be solved, and the effects described in the column of the effect of the invention can be solved. Is obtained, a configuration from which this configuration requirement is deleted can be extracted as an invention.
[0046]
【The invention's effect】
As described above, according to the present invention, it is possible to provide a text information analysis system that organically combines and presents a plurality of analysis results obtained by different analysis methods and a method of presenting the analysis results applied to the system. It becomes possible.
[Brief description of the drawings]
FIG. 1 is a diagram showing a network configuration of a knowledge analysis system according to an embodiment of the present invention.
FIG. 2 is an exemplary view showing functional blocks of the knowledge analysis system according to the embodiment;
FIG. 3 is an exemplary first view for explaining an outline of a method of presenting an analysis result executed by the knowledge analysis system of the embodiment.
FIG. 4 is an exemplary second diagram for describing an outline of a method of presenting an analysis result executed by the knowledge analysis system of the embodiment.
FIG. 5 is an exemplary third diagram illustrating an outline of a method of presenting an analysis result executed by the knowledge analysis system according to the embodiment;
FIG. 6 is an exemplary first diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 7 is an exemplary second diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 8 is an exemplary third diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 9 is an exemplary fourth diagram illustrating a screen displayed by the knowledge analysis system according to the embodiment;
FIG. 10 is an exemplary fifth diagram illustrating a screen displayed by the knowledge analysis system of the embodiment.
FIG. 11 is an exemplary flowchart illustrating the operation procedure when the knowledge analysis system according to the embodiment presents an analysis result.
[Explanation of symbols]
1 ...
Claims (15)
第1および第2の分析手段と、
同一のテキスト情報群に対する前記第1および第2の分析手段の2つの分析結果を有機的に結合させて提示する分析結果提示手段と
を具備することを特徴とするテキスト情報分析システム。In a text information analysis system that analyzes a large amount of collected and stored text information,
First and second analysis means;
A text information analysis system, comprising: an analysis result presenting means for organically combining and presenting two analysis results of the first and second analysis means for the same text information group.
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段と、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段と、
同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段と
を具備することを特徴とするテキスト情報分析システム。In a text information analysis system that analyzes a large amount of collected and stored text information,
Clustering analysis means for analyzing the collected and accumulated large amount of text information based on the appearance frequency of each word and the degree of association between the plurality of words;
Text mining analysis means for analyzing the large amount of collected and accumulated text information based on arbitrarily specified conditions,
A text information analysis system, comprising: an analysis result presentation unit that organically combines and presents the analysis result of the clustering analysis unit and the analysis result of the text mining analysis unit for the same text information group.
第1および第2の分析手段、
同一のテキスト情報群に対する前記第1および第2の分析手段の2つの分析結果を有機的に結合させて提示する分析結果提示手段
として機能させるためのプログラム。A computer that operates as a text information analysis system that analyzes a large amount of collected and accumulated text information,
First and second analysis means,
A program for functioning as analysis result presenting means for presenting two analysis results of the first and second analysis means for the same text information group in an organically combined manner.
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析手段、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析手段、
同一のテキスト情報群に対する前記クラスタリング分析手段の分析結果と前記テキストマイニング分析手段の分析結果とを有機的に結合させて提示する分析結果提示手段
として機能させるためのプログラム。A computer that operates as a text information analysis system that analyzes a large amount of collected and accumulated text information,
Clustering analysis means for analyzing the collected and accumulated large amount of text information based on the appearance frequency of each word and the degree of association between the plurality of words;
Text mining analysis means for analyzing a large amount of collected and accumulated text information based on arbitrarily specified conditions,
A program for functioning as analysis result presenting means for presenting an analysis result of the clustering analysis means and an analysis result of the text mining analysis means for the same text information group in an organically combined manner.
前記分析結果提示手段は、前記縦軸および前記横軸の項目として配置するクラスタおよびカテゴリの階層を各軸ごとに上下に移動させる手段を有することを特徴とする請求項9記載のプログラム。The clustering analysis unit and the text mining analysis unit classify the text information group into multi-level clusters and categories,
10. The program according to claim 9, wherein the analysis result presenting means includes means for moving a hierarchy of clusters and categories arranged as items of the vertical axis and the horizontal axis up and down for each axis.
第1および第2の分析ステップと、
同一のテキスト情報群に対する前記第1および第2の分析ステップの2つの分析結果を有機的に結合させて提示する分析結果提示ステップと
を具備することを特徴とする分析結果の提示方法。A method of presenting an analysis result applied to a text information analysis system for analyzing a large amount of collected and accumulated text information,
First and second analysis steps;
An analysis result presentation step of organically combining and presenting the two analysis results of the first and second analysis steps for the same text information group.
各単語の出現頻度および複数の単語間の関連度に基づき、前記収集・蓄積された大量のテキスト情報を分析するクラスタリング分析ステップと、
任意に指定される条件に基づき、前記収集・蓄積された大量のテキスト情報を分析するテキストマイニング分析ステップと、
同一のテキスト情報群に対する前記クラスタリング分析ステップの分析結果と前記テキストマイニング分析ステップの分析結果とを有機的に結合させて提示する分析結果提示ステップと
を具備することを特徴とする分析結果の提示方法。A method of presenting an analysis result applied to a text information analysis system for analyzing a large amount of collected and accumulated text information,
A clustering analysis step of analyzing the collected and accumulated large amount of text information based on an appearance frequency of each word and a degree of association between a plurality of words;
Based on arbitrarily specified conditions, a text mining analysis step of analyzing the collected and accumulated large amount of text information,
An analysis result presentation step of organically combining and presenting the analysis result of the clustering analysis step and the analysis result of the text mining analysis step for the same text information group, and presenting the analysis result. .
前記分析結果提示ステップは、前記縦軸および前記横軸の項目として配置するクラスタおよびカテゴリの階層を各軸ごとに上下に移動させるステップを有することを特徴とする請求項14記載の分析結果の提示方法。The clustering analysis step and the text mining analysis step classify the text information group into multi-level clusters and categories,
The analysis result presentation step according to claim 14, wherein the analysis result presentation step includes a step of moving up and down a hierarchy of clusters and categories arranged as items of the vertical axis and the horizontal axis for each axis. Method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243973A JP3831319B2 (en) | 2002-08-23 | 2002-08-23 | Text information analysis system and analysis result presentation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243973A JP3831319B2 (en) | 2002-08-23 | 2002-08-23 | Text information analysis system and analysis result presentation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004086350A true JP2004086350A (en) | 2004-03-18 |
JP3831319B2 JP3831319B2 (en) | 2006-10-11 |
Family
ID=32052598
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002243973A Expired - Fee Related JP3831319B2 (en) | 2002-08-23 | 2002-08-23 | Text information analysis system and analysis result presentation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3831319B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323627A (en) * | 2005-05-19 | 2006-11-30 | Hitachi East Japan Solutions Ltd | Classification list creation support system and program |
JP2008243127A (en) * | 2007-03-29 | 2008-10-09 | Chuden Cti Co Ltd | Input information analyzing device |
JP2009128949A (en) * | 2007-11-19 | 2009-06-11 | Fuji Xerox Co Ltd | Graphic display device and program |
US8793266B2 (en) | 2010-09-30 | 2014-07-29 | International Business Machines Corporation | Graphical user interface for a search query |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1040050A (en) * | 1996-07-22 | 1998-02-13 | Fuji Xerox Co Ltd | Table generation instructing device and table generating system |
JP2001273458A (en) * | 2000-03-24 | 2001-10-05 | Ricoh Co Ltd | Device and method for supporting document group analysis and recording medium |
JP2002183175A (en) * | 2000-12-08 | 2002-06-28 | Hitachi Ltd | Text mining method |
-
2002
- 2002-08-23 JP JP2002243973A patent/JP3831319B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1040050A (en) * | 1996-07-22 | 1998-02-13 | Fuji Xerox Co Ltd | Table generation instructing device and table generating system |
JP2001273458A (en) * | 2000-03-24 | 2001-10-05 | Ricoh Co Ltd | Device and method for supporting document group analysis and recording medium |
JP2002183175A (en) * | 2000-12-08 | 2002-06-28 | Hitachi Ltd | Text mining method |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323627A (en) * | 2005-05-19 | 2006-11-30 | Hitachi East Japan Solutions Ltd | Classification list creation support system and program |
JP4490871B2 (en) * | 2005-05-19 | 2010-06-30 | 株式会社 日立東日本ソリューションズ | Classification list creation support system and classification list creation support program |
JP2008243127A (en) * | 2007-03-29 | 2008-10-09 | Chuden Cti Co Ltd | Input information analyzing device |
JP2009128949A (en) * | 2007-11-19 | 2009-06-11 | Fuji Xerox Co Ltd | Graphic display device and program |
US8793266B2 (en) | 2010-09-30 | 2014-07-29 | International Business Machines Corporation | Graphical user interface for a search query |
Also Published As
Publication number | Publication date |
---|---|
JP3831319B2 (en) | 2006-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gotz et al. | Characterizing users’ visual analytic activity for insight provenance | |
Fisher et al. | Interactions with big data analytics | |
US9069748B2 (en) | Selective generation and display of data items associated with a spreadsheet | |
Marcus et al. | Tweets as data: demonstration of tweeql and twitinfo | |
US20110179093A1 (en) | Storing and Managing Information Artifacts Collected by Information Analysts Using a Computing Device | |
CN100449541C (en) | Document group analyzing apparatus, a document group analyzing method, a document group analyzing system | |
CN109522357A (en) | A kind of data processing method, device, server and storage medium | |
JP2004362043A (en) | Project managing system | |
WO2011090519A1 (en) | Accessing large collection object tables in a database | |
JP5535062B2 (en) | Data storage and query method for time series analysis of weblog and system for executing the method | |
JP2007193685A (en) | Program for displaying personal connection information, recording medium with the program recorded thereon, device for displaying personal connection information, and method for displaying personal connection information | |
KR20100101594A (en) | Method, system and computer program for searching digital contents based on metadata of sample elements | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
US8495513B2 (en) | Automated content generation through selective combination | |
Shieh | The integration system for librarians' bibliomining | |
Kumar | Knowledge discovery practices and emerging applications of data mining: Trends and new domains: Trends and new domains | |
JP2004086350A (en) | Text information analysis system and presentation method of analysis result | |
KR101597143B1 (en) | Information processing apparatus and information processing method | |
Elias | Enhancing User Interaction with Business Intelligence Dashboards | |
CN111222166A (en) | Method and device for sharing and managing design material in multi-user online collaboration | |
Zhang et al. | An efficient data preprocessing method for mining customer survey data | |
Motahari et al. | Process spaceship: discovering and exploring process views from event logs in data spaces | |
JP2001175672A (en) | Information filtering system and its method, and computer-readable recording medium with recorded program for implementing same method | |
KR20050109106A (en) | Internet search system and method for providing integrated search results efficiently | |
JP2002278983A (en) | Summary extracting program, document analysis supporting program, summary extracting method and method and system for supporting document analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051220 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060220 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060307 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060508 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20060629 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060713 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090721 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100721 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100721 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110721 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120721 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130721 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |