JP2004086352A - テキスト情報分析システム、分析結果の格納方法および提示方法 - Google Patents
テキスト情報分析システム、分析結果の格納方法および提示方法 Download PDFInfo
- Publication number
- JP2004086352A JP2004086352A JP2002243975A JP2002243975A JP2004086352A JP 2004086352 A JP2004086352 A JP 2004086352A JP 2002243975 A JP2002243975 A JP 2002243975A JP 2002243975 A JP2002243975 A JP 2002243975A JP 2004086352 A JP2004086352 A JP 2004086352A
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- text information
- analysis results
- database
- analysis result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
【課題】同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とするテキスト情報分析システム。
【解決手段】テキストマイニング部121は、分析条件設定部111により設定された分析条件に基づき、知識データベース13に格納されたテキスト情報の分析を実行する。また、分析結果格納部122は、その分析結果を分析結果格納データベース14に格納する。この時、分析結果格納部122は、データ定義用のスキーマを有しないというXMLDBの特性を活かし、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を1データレコード内に同一の形式で格納する。そして、分析結果編集部113は、この1データレコード内に同一の形式で格納された複数の分析結果を有機的に結合すべく編集して利用者に提示する。
【選択図】 図2
【解決手段】テキストマイニング部121は、分析条件設定部111により設定された分析条件に基づき、知識データベース13に格納されたテキスト情報の分析を実行する。また、分析結果格納部122は、その分析結果を分析結果格納データベース14に格納する。この時、分析結果格納部122は、データ定義用のスキーマを有しないというXMLDBの特性を活かし、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を1データレコード内に同一の形式で格納する。そして、分析結果編集部113は、この1データレコード内に同一の形式で格納された複数の分析結果を有機的に結合すべく編集して利用者に提示する。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
この発明は、例えばLAN(Local Area Network)やイントラネット経由で収集・蓄積されたアンケートや日報などのテキスト情報を分析するテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法に関する。
【0002】
【従来の技術】
近年、LANやイントラネットを敷設し、各社員がもつ情報、例えば業務上で発生するアンケートや日報などの非定型情報を部門を越えて収集・蓄積する企業が増えつつある。この収集・蓄積された情報は、全社員の知識として共有・活用されることを目的に、様々な分析が施されるのが一般的である。そして、その分析手法として、現在では、クラスタリング分析とテキストマイニング分析とがよく知られている。
【0003】
クラスタリング分析は、例えば特開2002−149670号公報に記載されているように、各単語の出現頻度や複数の単語間の関連度により、収集・蓄積された情報を分類するものである。ここで、複数の単語間の関連度とは、共起性の有無をいい、例えば「私はAとBを購入した。」といった、「A」と「B」を共に含むテキスト情報が多数存在する場合、この「A」と「B」は共起性があると判断する。
【0004】
その結果、「A」という単語の出現頻度が高い情報だけが同じクラスタに属するものとして取り扱われるだけでなく、「B」という単語の出現頻度が高い情報も同じクラスタに属するものとして取り扱われ、絞り込みを適切に行った精度の高い分類が自動的に実行されることになる。
【0005】
一方、テキストマイニング分析は、例えば特開2001−147937号公報に記載されているように、収集・蓄積された情報を利用者が望むカテゴリに分類するものである。例えば「C」、「D」、「F」製品に関する情報をそれぞれカテゴリに纏めたい場合、利用者は、どのような記述を含む場合に、その情報を各カテゴリに属するものと判断するのか、その条件を指定する。
【0006】
このクラスタリング分析およびテキストマイニング分析によれば、無秩序に収集・蓄積された大量の情報から何らかの傾向を掴むことが可能となる等、知識の共有・活用が有効に図られることになる。
【0007】
【発明が解決しようとする課題】
ところで、前述したように、テキストマイニング分析では、利用者が指定した条件に基づいて、その処理が実行される。つまり、その条件が異なれば、同一の情報群に対する場合であっても、その分析結果は異なってくる。また、クラスタリング分析においても、単語間の関連度の計算の条件や単語の重要度を指定できる場合が一般的であり、こうした条件が異なれば、同一の情報群に対する場合であっても、その分析結果は異なってくる。したがって、同一の情報群に対して異なる条件で複数の分析を実施するということは、一般に行われることである。
【0008】
しかしながら、従来では、同一の情報群に対する場合であっても、異なる条件に基づく分析結果は、それぞれ別個のものとして扱われており、例えばそれらを組み合わせて利用するといったことは非常に困難であった。
【0009】
この発明は、このような事情を考慮してなされたものであり、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とするテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
前述した目的を達成するために、この発明は、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、データ定義用のスキーマを有しないデータベースと、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納する分析結果格納手段とを具備することを特徴とする。
【0011】
また、この発明のテキスト情報分析システムは、前記データベースの1データレコード内に格納された同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示する分析結果提示手段をさらに具備することを特徴とする。
【0012】
この発明のテキスト情報分析システムにおいては、例えばXML(eXtensibleMarkup Language)DBのように、例えばレコードの論理構造などを事前に定める必要のない、データ定義用のスキーマを有しないデータベースを用いて、同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納する。より具体的には、既にいくつかの分析結果が存在する同一のテキスト情報群について、異なる分析条件に基づく分析結果が新たに生成された場合には、例えば分析結果である旨を示す所定のタグを付して、その同一のテキスト情報群に対する他の分析結果が格納された同一データレコード内に挿入する。
【0013】
同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納すれば、これらを別個のものとして扱うのではなく、互いに関連する集まりとして管理できるため、例えば任意に選択された2つの分析結果をそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示する等、複数の分析結果を有機的に結合させて提示することも簡単に行える。
【0014】
このように、この発明のテキスト情報分析システムは、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とする。
【0015】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態を説明する。
【0016】
図1は、この発明の実施形態に係る知識分析システムのネットワーク構成を示す図である。
【0017】
この知識分析システム1は、サーバ機などと称される高性能のコンピュータ上に構築され、複数のクライアントコンピュータ2とLANやイントラネットなどのネットワーク3を介して接続される。そして、知識分析システム1は、クライアントコンピュータ2からの分析要求を受け付け、その要求に基づく分析の結果を返却する。
【0018】
図2は、この知識分析システム1の機能ブロックを示す図である。図2に示すように、この知識分析システム1は、ユーザインタフェース部11および知識分析部12の処理部と、知識データベース13、分析結果格納データベース14およびテンプレートデータベース15のデータ部とを有している。なお、処理部は、この知識分析システム1が構築されるコンピュータに搭載されたCPUの動作手順を記述するプログラムにより構成されるものであり、データ部は、同コンピュータが備える磁気ディスク装置などの記憶媒体上に構成されるものである。
【0019】
ユーザインタフェース部11は、クライアントコンピュータ2の利用者に対する窓口の役割を担うものであり、分析条件設定部111、分析軸選択部112および分析結果編集部113を有している。分析条件設定部111および分析軸選択部112は、クライアントコンピュータ2からの指示の一部を受け付けるものであり、その詳細は後述する。一方、分析結果編集部113は、分析軸選択部112により受け付けた指示に基づき、分析結果の編集を行ってクライアントコンピュータ2に返却するものである。この詳細についても後述する。
【0020】
知識分析部12は、例えば業務上で発生するアンケートや日報など、知識データベース13に蓄積された大量のテキスト情報を分析し、その結果を分析結果格納データベース14に格納するものであり、テキストマイニング部121および分析結果格納部122を有している。テキストマイニング部121は、利用者から指定された条件に基づき、知識データベース13のテキスト情報を利用者が望むカテゴリに分類するものである(テキストマイニング分析)。前述のユーザインタフェース部11の分析条件設定部111は、このテキストマイニング部121によるテキストマイニング分析で用いられる条件を設定するものである。
【0021】
前述のとおり、テキストマイニング分析、クラスタリング分析とも条件を変えての再分析が可能であるが、ここではテキストマイニング分析を例にとって説明を行う。これは、本発明の対象がテキストマイニング分析に限られることを意味するものではない。
【0022】
また、このテキストマイニング部121によるテキストマイニング分析によって得られたテキストマイニング結果は、分析結果格納部122が、分析結果格納データベース14に格納する。この分析結果格納データベース14は、XMLDBであり、データ定義用のスキーマを有しないという特性をもつ。そして、格納した文字列に意味付けするためのタグを独自に拡張できるため、このタグを定義して当該タグで挟み込めさえすれば、所望の意味付けをした文字列を事前の準備なしに適宜に格納することが可能である。
【0023】
ここで、図3を参照して、この知識分析システム1の特徴である分析結果の格納方法および提示方法についての概略を説明する。
【0024】
いま、知識データベース13には、アンケートや日報、メールなどのテキスト情報が大量に蓄積されているものとする(図3のA)。そして、この同一のテキスト情報群に対して、テキストマイニング部121は、まず、分析条件1に基づくテキストマイニング分析を実行して分析結果(1)を得(図3のB1)、さらに、分析条件2に基づくテキストマイニング分析を実行して分析結果(2)を得たとする(図3のB2)。
【0025】
このテキストマイニング部121によるテキストマイニング分析によって得られた分析結果は、分析結果格納データベース14に格納されるが、前述したように、この分析結果格納データベース14は、データ定義用のスキーマを有しないXMLDBである。そして、この知識分析システム1では、このXMLDBの特性を活かし、分析結果格納部122が、同一のテキスト情報群に対する分析結果である分析結果(1)および分析結果(2)を、1データレコード内に同一の形式で格納する。より具体的には、同一のデータ情報群に対する分析結果が新たに生成される度に、分析結果格納部122は、分析結果である旨を示すものとして予め定義されたタグを付して、その分析結果を追加していく。
【0026】
また、このように、同一のテキスト情報群に対する分析結果を1データレコード内に同一の形式で格納することにより、従来であれば別個に扱われていた複数の分析結果を互いに関連する集まりとして管理できるため、この知識分析システム1では、この同一のテキスト情報群に対する2つの分析結果(1)および分析結果(2)を有機的に連結させて、例えば一方の分析結果を縦軸、他方の分析結果を横軸に割り当てた2次元配列の表形式に集計して、利用者に提示するようにした(図3のC)。図中、n11は、分析結果(1)のカテゴリT1および分析結果(2)のカテゴリt1の双方に属するテキスト情報の件数を示している。前述のユーザインタフェース部11の分析軸選択部112は、この縦軸および横軸に割り当てる分析結果を選択するものである。
【0027】
つまり、この知識分析システム1は、XMLDBの特性に着目し、同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納することにより、分析条件の異なる2つの分析結果を有機的に結合させて提示するなど、従来では非常に困難であった、これら複数の分析結果を組み合わせて利用することを可能とした。
【0028】
次に、図4乃至図7を参照して、この知識分析システム1の動作原理について説明する。
【0029】
ネットワーク3を介して接続されるクライアントコンピュータ2に対して知識分析サービスを提供する際、ユーザインタフェース部11は、まず、図4に示す画面を表示させるための画面データを送信する。この画面には、テキストマイニング分析の実行を指示するボタンa1と、分析軸の選択作業に移行するためのボタンa2と、この分析軸の選択後に分析結果の編集を開始させるためのボタンa3とが配置される。この画面の提示を受けた利用者は、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、所望のボタンを選択する。
【0030】
ボタンa1の選択が通知されると、ユーザインタフェース部11は、テキストマイニング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、テキストマイニング部121が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果を分析結果格納部122が分析結果格納データベース14に格納する。
【0031】
また、ボタンa2の選択が通知されると、ユーザインタフェース部11は、分析結果格納データベース14に格納された各分析結果におけるカテゴリの一覧を分析軸選択部111に取得させる。そして、ユーザインタフェース部11は、その取得させたカテゴリの一覧を示した画面を表示させるための画面データを作成して送信する。図5に、この時に利用者に提示される画面を例示する。
【0032】
図5の例では、分析結果(1)のカテゴリとして、まず、「お客様の声」が存在し、その下位層に「問い合わせ」、「クレーム」、「要望」、…が存在している、また、分析結果(2)のカテゴリとして、まず、「年月」が存在し、その下位層に「2001/1」、「2001/2」、「2001/3」、…が存在している。そして、この画面の提示を受けた利用者が、この中からいずれかのカテゴリを縦軸に選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、そのカテゴリを選択した状態でボタンb1を選択する。同様に、いずれかのカテゴリを横軸に選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、そのカテゴリを選択した状態でボタンb2を選択する。そして、この縦軸および横軸の選択が完了すると、利用者は、ボタンa3を選択し、分析結果の編集を開始させる。
【0033】
このボタンa3の選択が通知されると、ユーザインタフェース部11は、縦軸および横軸に選択された2つの分析結果を有機的に結合させるための編集を分析結果編集部113に行わせる。
【0034】
分析結果格納データベース14に格納される分析結果には、各カテゴリにどのテキスト情報が属しているのかを識別するための情報が含まれている。したがって、この情報を突き合わせることにより、2つの分析結果の任意のカテゴリの双方に属するテキスト情報の件数を集計することができる。分析結果編集部113は、このような突き合わせを行っていくことにより、縦軸および横軸に割り当てた2つの分析結果の編集を実行する。そして、ユーザインタフェース部11は、この分析結果編集部113に編集させた分析結果を提示する画面を表示させるための画面データを作成して送信する。図6に、この時に利用者に提示される画面を例示する。
【0035】
図6に示すように、画面の上部には、利用者が選択した縦軸および横軸のカテゴリがそれぞれ表示される(c1,c2)。ここでは、表の縦軸には「お客様の声」、表の横軸には「年月」が選択されたものとする。そして、この選択に基づき、画面の中央部には、「お客様の声」の1つ下の階層の「問い合わせ」、「クレーム」、「要望」、…を縦軸の項目として配置し、「年月」の1つ下の階層の「2001/1」、「2001/2」、「2001/3」、…を横軸の項目として配置した表形式で集計された2つの分析結果が表示される。なお、この表は、下方向および右方向にそれぞれスクロール可能である。
【0036】
また、この縦軸の項目として配置されたカテゴリ、または横軸の項目として配置されたカテゴリのいずれかを選択すると、その選択されたカテゴリの1つ下の階層のカテゴリを各軸に配置した状態で、2つの分析結果が再集計されて表示される(ドリルダウン)。例えば、「問い合わせ」が選択されたとすると、縦軸はこの「問い合わせ」の1つ下の階層のカテゴリに置き換わり、表内の件数も更新される。図7は、この時に利用者に提示される画面を例示する図であり、縦軸の項目として配置されるカテゴリは、「問い合わせ」の1つ下の階層のカテゴリである「機能」、「製品」、「症状」、「値段」、「型番」…に置き換わり、表内の件数も更新されている。
【0037】
さらに、画面の下部には、縦軸の項目として配置されたカテゴリ、または横軸の項目として配置されたカテゴリの階層を1つ上のクラスタまたはカテゴリに移動させる(ドリルアップ)ためのボタンが配置される(c3,c4)。例えば、図7の状態で表の縦軸をドリルアップさせる旨が指示されると、移動前の図6の状態に復帰する。
【0038】
図8は、この知識分析システム1の動作手順を示すフローチャートである。
【0039】
この知識分析システム1では、まず、分析条件設定部111により分析条件を設定する(ステップA1)。次に、テキストマイニング部121が、この設定された条件に基づき、知識データベース13に蓄積されたテキスト情報群の分析を実行し(ステップA2)、分析結果格納部122が、その分析結果を分析結果格納データベース14に格納する(ステップA3)。
【0040】
また、このテキスト情報群の再分析を行う場合(ステップA4のYES)、分析条件設定部111により分析条件を更新し(ステップA5)、ステップA2,A3の処理を繰り返す。この時、分析結果格納部122は、データ定義用のスキーマを有しないというXMLDBの特性を活かし、分析結果を分析結果格納データベース14の1データレコード内に同一の形式で格納する。
【0041】
そして、このテキスト情報群の分析を終えると(ステップA4のNO)、分析結果編集部113は、この分析結果格納データベース14の1データレコード内に同一の形式で格納された複数の分析結果のうち、任意に選択された分析結果を融合させて編集・表示する(ステップA6)。
【0042】
このように、この知識分析システム1は、同一のテキスト情報群に対する分析結果を分析結果格納データベース14の1データレコード内に同一の形式で格納することにより、複数の分析結果を有機的に結合させて表示する等、組み合わせて利用することを実現する。その結果、例えば1つの分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を生み出すこともできる。
【0043】
なお、ステップA4における再分析有無の判断と、ステップA5における分析条件の更新とは、いずれも知識分析部12による自動化が可能である。まず、再分析を行うかどうかの判断は、例えば(1)決められた回数分析を行ったかどうかを調べる、(2)予め与えられたパラメタセットをすべて試したかどうかを調べる、(3)新たに行った分析結果と過去の分析結果との差異が所定の範囲以上かどうかを調べる等で行うことが可能である。一方、分析条件の更新は、(1)予め試すべきパラメータセットをすべて列挙しておく、(2)パラメタの更新方法を事前に定義しておく等で行うことが可能である。図9に、再分析有無の判断および分析条件の更新を自動化した場合のフローチャートを示す。
【0044】
また、ここでは、2つの分析結果を組み合わせて利用する方法として、2次元配列の表形式に編集する例を示したが、これに限らず、例えば柱グラフ形式や円グラフ形式など、互いの関係を表現できれば、どのような形式を適用することも可能である。そこで、この知識分析システム1では、この分析結果の表示形式を規定するテンプレートを複数用意し、これをテンプレートデータベース15に格納する。そして、分析結果編集部113は、利用者から選択されたテンプレートを用いて分析結果を編集・提示する。これにより、分析結果の表示形式を所望の形式に容易に変更することが可能となる。
【0045】
このように、本願発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。たとえば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0046】
【発明の効果】
以上のように、この発明によれば、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とするテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法を提供することができる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る知識分析システムのネットワーク構成を示す図。
【図2】同実施形態の知識分析システムの機能ブロックを示す図。
【図3】同実施形態の知識分析システムが実行する分析結果の格納方法および提示方法についての概略を説明するための図。
【図4】同実施形態の知識分析システムで表示される画面を例示する第1の図。
【図5】同実施形態の知識分析システムで表示される画面を例示する第2の図。
【図6】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図7】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図8】同実施形態の知識分析システムの動作手順を示す第1のフローチャート。
【図9】同実施形態の知識分析システムの動作手順を示す第2のフローチャート。
【符号の説明】
1…知識分析システム
2…クライアントコンピュータ
3…ネットワーク
11…ユーザインタフェース
12…知識分析部
13…知識データベース
14…分析結果格納データベース
15…テンプレートデータベース
111…分析条件設定部
112…分析軸選択部
113…分析結果編集部
121…テキストマイニング部
122…分析結果格納部
【発明の属する技術分野】
この発明は、例えばLAN(Local Area Network)やイントラネット経由で収集・蓄積されたアンケートや日報などのテキスト情報を分析するテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法に関する。
【0002】
【従来の技術】
近年、LANやイントラネットを敷設し、各社員がもつ情報、例えば業務上で発生するアンケートや日報などの非定型情報を部門を越えて収集・蓄積する企業が増えつつある。この収集・蓄積された情報は、全社員の知識として共有・活用されることを目的に、様々な分析が施されるのが一般的である。そして、その分析手法として、現在では、クラスタリング分析とテキストマイニング分析とがよく知られている。
【0003】
クラスタリング分析は、例えば特開2002−149670号公報に記載されているように、各単語の出現頻度や複数の単語間の関連度により、収集・蓄積された情報を分類するものである。ここで、複数の単語間の関連度とは、共起性の有無をいい、例えば「私はAとBを購入した。」といった、「A」と「B」を共に含むテキスト情報が多数存在する場合、この「A」と「B」は共起性があると判断する。
【0004】
その結果、「A」という単語の出現頻度が高い情報だけが同じクラスタに属するものとして取り扱われるだけでなく、「B」という単語の出現頻度が高い情報も同じクラスタに属するものとして取り扱われ、絞り込みを適切に行った精度の高い分類が自動的に実行されることになる。
【0005】
一方、テキストマイニング分析は、例えば特開2001−147937号公報に記載されているように、収集・蓄積された情報を利用者が望むカテゴリに分類するものである。例えば「C」、「D」、「F」製品に関する情報をそれぞれカテゴリに纏めたい場合、利用者は、どのような記述を含む場合に、その情報を各カテゴリに属するものと判断するのか、その条件を指定する。
【0006】
このクラスタリング分析およびテキストマイニング分析によれば、無秩序に収集・蓄積された大量の情報から何らかの傾向を掴むことが可能となる等、知識の共有・活用が有効に図られることになる。
【0007】
【発明が解決しようとする課題】
ところで、前述したように、テキストマイニング分析では、利用者が指定した条件に基づいて、その処理が実行される。つまり、その条件が異なれば、同一の情報群に対する場合であっても、その分析結果は異なってくる。また、クラスタリング分析においても、単語間の関連度の計算の条件や単語の重要度を指定できる場合が一般的であり、こうした条件が異なれば、同一の情報群に対する場合であっても、その分析結果は異なってくる。したがって、同一の情報群に対して異なる条件で複数の分析を実施するということは、一般に行われることである。
【0008】
しかしながら、従来では、同一の情報群に対する場合であっても、異なる条件に基づく分析結果は、それぞれ別個のものとして扱われており、例えばそれらを組み合わせて利用するといったことは非常に困難であった。
【0009】
この発明は、このような事情を考慮してなされたものであり、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とするテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法を提供することを目的とする。
【0010】
【課題を解決するための手段】
前述した目的を達成するために、この発明は、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、データ定義用のスキーマを有しないデータベースと、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納する分析結果格納手段とを具備することを特徴とする。
【0011】
また、この発明のテキスト情報分析システムは、前記データベースの1データレコード内に格納された同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示する分析結果提示手段をさらに具備することを特徴とする。
【0012】
この発明のテキスト情報分析システムにおいては、例えばXML(eXtensibleMarkup Language)DBのように、例えばレコードの論理構造などを事前に定める必要のない、データ定義用のスキーマを有しないデータベースを用いて、同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納する。より具体的には、既にいくつかの分析結果が存在する同一のテキスト情報群について、異なる分析条件に基づく分析結果が新たに生成された場合には、例えば分析結果である旨を示す所定のタグを付して、その同一のテキスト情報群に対する他の分析結果が格納された同一データレコード内に挿入する。
【0013】
同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納すれば、これらを別個のものとして扱うのではなく、互いに関連する集まりとして管理できるため、例えば任意に選択された2つの分析結果をそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示する等、複数の分析結果を有機的に結合させて提示することも簡単に行える。
【0014】
このように、この発明のテキスト情報分析システムは、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とする。
【0015】
【発明の実施の形態】
以下、図面を参照してこの発明の実施形態を説明する。
【0016】
図1は、この発明の実施形態に係る知識分析システムのネットワーク構成を示す図である。
【0017】
この知識分析システム1は、サーバ機などと称される高性能のコンピュータ上に構築され、複数のクライアントコンピュータ2とLANやイントラネットなどのネットワーク3を介して接続される。そして、知識分析システム1は、クライアントコンピュータ2からの分析要求を受け付け、その要求に基づく分析の結果を返却する。
【0018】
図2は、この知識分析システム1の機能ブロックを示す図である。図2に示すように、この知識分析システム1は、ユーザインタフェース部11および知識分析部12の処理部と、知識データベース13、分析結果格納データベース14およびテンプレートデータベース15のデータ部とを有している。なお、処理部は、この知識分析システム1が構築されるコンピュータに搭載されたCPUの動作手順を記述するプログラムにより構成されるものであり、データ部は、同コンピュータが備える磁気ディスク装置などの記憶媒体上に構成されるものである。
【0019】
ユーザインタフェース部11は、クライアントコンピュータ2の利用者に対する窓口の役割を担うものであり、分析条件設定部111、分析軸選択部112および分析結果編集部113を有している。分析条件設定部111および分析軸選択部112は、クライアントコンピュータ2からの指示の一部を受け付けるものであり、その詳細は後述する。一方、分析結果編集部113は、分析軸選択部112により受け付けた指示に基づき、分析結果の編集を行ってクライアントコンピュータ2に返却するものである。この詳細についても後述する。
【0020】
知識分析部12は、例えば業務上で発生するアンケートや日報など、知識データベース13に蓄積された大量のテキスト情報を分析し、その結果を分析結果格納データベース14に格納するものであり、テキストマイニング部121および分析結果格納部122を有している。テキストマイニング部121は、利用者から指定された条件に基づき、知識データベース13のテキスト情報を利用者が望むカテゴリに分類するものである(テキストマイニング分析)。前述のユーザインタフェース部11の分析条件設定部111は、このテキストマイニング部121によるテキストマイニング分析で用いられる条件を設定するものである。
【0021】
前述のとおり、テキストマイニング分析、クラスタリング分析とも条件を変えての再分析が可能であるが、ここではテキストマイニング分析を例にとって説明を行う。これは、本発明の対象がテキストマイニング分析に限られることを意味するものではない。
【0022】
また、このテキストマイニング部121によるテキストマイニング分析によって得られたテキストマイニング結果は、分析結果格納部122が、分析結果格納データベース14に格納する。この分析結果格納データベース14は、XMLDBであり、データ定義用のスキーマを有しないという特性をもつ。そして、格納した文字列に意味付けするためのタグを独自に拡張できるため、このタグを定義して当該タグで挟み込めさえすれば、所望の意味付けをした文字列を事前の準備なしに適宜に格納することが可能である。
【0023】
ここで、図3を参照して、この知識分析システム1の特徴である分析結果の格納方法および提示方法についての概略を説明する。
【0024】
いま、知識データベース13には、アンケートや日報、メールなどのテキスト情報が大量に蓄積されているものとする(図3のA)。そして、この同一のテキスト情報群に対して、テキストマイニング部121は、まず、分析条件1に基づくテキストマイニング分析を実行して分析結果(1)を得(図3のB1)、さらに、分析条件2に基づくテキストマイニング分析を実行して分析結果(2)を得たとする(図3のB2)。
【0025】
このテキストマイニング部121によるテキストマイニング分析によって得られた分析結果は、分析結果格納データベース14に格納されるが、前述したように、この分析結果格納データベース14は、データ定義用のスキーマを有しないXMLDBである。そして、この知識分析システム1では、このXMLDBの特性を活かし、分析結果格納部122が、同一のテキスト情報群に対する分析結果である分析結果(1)および分析結果(2)を、1データレコード内に同一の形式で格納する。より具体的には、同一のデータ情報群に対する分析結果が新たに生成される度に、分析結果格納部122は、分析結果である旨を示すものとして予め定義されたタグを付して、その分析結果を追加していく。
【0026】
また、このように、同一のテキスト情報群に対する分析結果を1データレコード内に同一の形式で格納することにより、従来であれば別個に扱われていた複数の分析結果を互いに関連する集まりとして管理できるため、この知識分析システム1では、この同一のテキスト情報群に対する2つの分析結果(1)および分析結果(2)を有機的に連結させて、例えば一方の分析結果を縦軸、他方の分析結果を横軸に割り当てた2次元配列の表形式に集計して、利用者に提示するようにした(図3のC)。図中、n11は、分析結果(1)のカテゴリT1および分析結果(2)のカテゴリt1の双方に属するテキスト情報の件数を示している。前述のユーザインタフェース部11の分析軸選択部112は、この縦軸および横軸に割り当てる分析結果を選択するものである。
【0027】
つまり、この知識分析システム1は、XMLDBの特性に着目し、同一のテキスト情報群に対する複数の分析結果を同一データレコード内に同一の形式で格納することにより、分析条件の異なる2つの分析結果を有機的に結合させて提示するなど、従来では非常に困難であった、これら複数の分析結果を組み合わせて利用することを可能とした。
【0028】
次に、図4乃至図7を参照して、この知識分析システム1の動作原理について説明する。
【0029】
ネットワーク3を介して接続されるクライアントコンピュータ2に対して知識分析サービスを提供する際、ユーザインタフェース部11は、まず、図4に示す画面を表示させるための画面データを送信する。この画面には、テキストマイニング分析の実行を指示するボタンa1と、分析軸の選択作業に移行するためのボタンa2と、この分析軸の選択後に分析結果の編集を開始させるためのボタンa3とが配置される。この画面の提示を受けた利用者は、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、所望のボタンを選択する。
【0030】
ボタンa1の選択が通知されると、ユーザインタフェース部11は、テキストマイニング分析の実行を知識分析部12に指示する。一方、この指示を受けた知識分析部12は、テキストマイニング部121が、知識データベース13に蓄積された最新のテキスト情報群を対象にテキストマイニング分析を実行し、その分析結果を分析結果格納部122が分析結果格納データベース14に格納する。
【0031】
また、ボタンa2の選択が通知されると、ユーザインタフェース部11は、分析結果格納データベース14に格納された各分析結果におけるカテゴリの一覧を分析軸選択部111に取得させる。そして、ユーザインタフェース部11は、その取得させたカテゴリの一覧を示した画面を表示させるための画面データを作成して送信する。図5に、この時に利用者に提示される画面を例示する。
【0032】
図5の例では、分析結果(1)のカテゴリとして、まず、「お客様の声」が存在し、その下位層に「問い合わせ」、「クレーム」、「要望」、…が存在している、また、分析結果(2)のカテゴリとして、まず、「年月」が存在し、その下位層に「2001/1」、「2001/2」、「2001/3」、…が存在している。そして、この画面の提示を受けた利用者が、この中からいずれかのカテゴリを縦軸に選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、そのカテゴリを選択した状態でボタンb1を選択する。同様に、いずれかのカテゴリを横軸に選択する場合、クライアントコンピュータ2が備えるマウス等のポインティングデバイスを操作し、そのカテゴリを選択した状態でボタンb2を選択する。そして、この縦軸および横軸の選択が完了すると、利用者は、ボタンa3を選択し、分析結果の編集を開始させる。
【0033】
このボタンa3の選択が通知されると、ユーザインタフェース部11は、縦軸および横軸に選択された2つの分析結果を有機的に結合させるための編集を分析結果編集部113に行わせる。
【0034】
分析結果格納データベース14に格納される分析結果には、各カテゴリにどのテキスト情報が属しているのかを識別するための情報が含まれている。したがって、この情報を突き合わせることにより、2つの分析結果の任意のカテゴリの双方に属するテキスト情報の件数を集計することができる。分析結果編集部113は、このような突き合わせを行っていくことにより、縦軸および横軸に割り当てた2つの分析結果の編集を実行する。そして、ユーザインタフェース部11は、この分析結果編集部113に編集させた分析結果を提示する画面を表示させるための画面データを作成して送信する。図6に、この時に利用者に提示される画面を例示する。
【0035】
図6に示すように、画面の上部には、利用者が選択した縦軸および横軸のカテゴリがそれぞれ表示される(c1,c2)。ここでは、表の縦軸には「お客様の声」、表の横軸には「年月」が選択されたものとする。そして、この選択に基づき、画面の中央部には、「お客様の声」の1つ下の階層の「問い合わせ」、「クレーム」、「要望」、…を縦軸の項目として配置し、「年月」の1つ下の階層の「2001/1」、「2001/2」、「2001/3」、…を横軸の項目として配置した表形式で集計された2つの分析結果が表示される。なお、この表は、下方向および右方向にそれぞれスクロール可能である。
【0036】
また、この縦軸の項目として配置されたカテゴリ、または横軸の項目として配置されたカテゴリのいずれかを選択すると、その選択されたカテゴリの1つ下の階層のカテゴリを各軸に配置した状態で、2つの分析結果が再集計されて表示される(ドリルダウン)。例えば、「問い合わせ」が選択されたとすると、縦軸はこの「問い合わせ」の1つ下の階層のカテゴリに置き換わり、表内の件数も更新される。図7は、この時に利用者に提示される画面を例示する図であり、縦軸の項目として配置されるカテゴリは、「問い合わせ」の1つ下の階層のカテゴリである「機能」、「製品」、「症状」、「値段」、「型番」…に置き換わり、表内の件数も更新されている。
【0037】
さらに、画面の下部には、縦軸の項目として配置されたカテゴリ、または横軸の項目として配置されたカテゴリの階層を1つ上のクラスタまたはカテゴリに移動させる(ドリルアップ)ためのボタンが配置される(c3,c4)。例えば、図7の状態で表の縦軸をドリルアップさせる旨が指示されると、移動前の図6の状態に復帰する。
【0038】
図8は、この知識分析システム1の動作手順を示すフローチャートである。
【0039】
この知識分析システム1では、まず、分析条件設定部111により分析条件を設定する(ステップA1)。次に、テキストマイニング部121が、この設定された条件に基づき、知識データベース13に蓄積されたテキスト情報群の分析を実行し(ステップA2)、分析結果格納部122が、その分析結果を分析結果格納データベース14に格納する(ステップA3)。
【0040】
また、このテキスト情報群の再分析を行う場合(ステップA4のYES)、分析条件設定部111により分析条件を更新し(ステップA5)、ステップA2,A3の処理を繰り返す。この時、分析結果格納部122は、データ定義用のスキーマを有しないというXMLDBの特性を活かし、分析結果を分析結果格納データベース14の1データレコード内に同一の形式で格納する。
【0041】
そして、このテキスト情報群の分析を終えると(ステップA4のNO)、分析結果編集部113は、この分析結果格納データベース14の1データレコード内に同一の形式で格納された複数の分析結果のうち、任意に選択された分析結果を融合させて編集・表示する(ステップA6)。
【0042】
このように、この知識分析システム1は、同一のテキスト情報群に対する分析結果を分析結果格納データベース14の1データレコード内に同一の形式で格納することにより、複数の分析結果を有機的に結合させて表示する等、組み合わせて利用することを実現する。その結果、例えば1つの分析結果のみからでは得られない新たな発見を促すなど、いわゆる相乗効果を生み出すこともできる。
【0043】
なお、ステップA4における再分析有無の判断と、ステップA5における分析条件の更新とは、いずれも知識分析部12による自動化が可能である。まず、再分析を行うかどうかの判断は、例えば(1)決められた回数分析を行ったかどうかを調べる、(2)予め与えられたパラメタセットをすべて試したかどうかを調べる、(3)新たに行った分析結果と過去の分析結果との差異が所定の範囲以上かどうかを調べる等で行うことが可能である。一方、分析条件の更新は、(1)予め試すべきパラメータセットをすべて列挙しておく、(2)パラメタの更新方法を事前に定義しておく等で行うことが可能である。図9に、再分析有無の判断および分析条件の更新を自動化した場合のフローチャートを示す。
【0044】
また、ここでは、2つの分析結果を組み合わせて利用する方法として、2次元配列の表形式に編集する例を示したが、これに限らず、例えば柱グラフ形式や円グラフ形式など、互いの関係を表現できれば、どのような形式を適用することも可能である。そこで、この知識分析システム1では、この分析結果の表示形式を規定するテンプレートを複数用意し、これをテンプレートデータベース15に格納する。そして、分析結果編集部113は、利用者から選択されたテンプレートを用いて分析結果を編集・提示する。これにより、分析結果の表示形式を所望の形式に容易に変更することが可能となる。
【0045】
このように、本願発明は、前記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で種々に変形することが可能である。更に、前記実施形態には種々の段階の発明が含まれており、開示される複数の構成要件における適宜な組み合わせにより種々の発明が抽出され得る。たとえば、実施形態に示される全構成要件から幾つかの構成要件が削除されても、発明が解決しようとする課題の欄で述べた課題が解決でき、発明の効果の欄で述べられている効果が得られる場合には、この構成要件が削除された構成が発明として抽出され得る。
【0046】
【発明の効果】
以上のように、この発明によれば、同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を組み合わせて利用することを容易に可能とするテキスト情報分析システム、同システムに適用される分析結果の格納方法および提示方法を提供することができる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る知識分析システムのネットワーク構成を示す図。
【図2】同実施形態の知識分析システムの機能ブロックを示す図。
【図3】同実施形態の知識分析システムが実行する分析結果の格納方法および提示方法についての概略を説明するための図。
【図4】同実施形態の知識分析システムで表示される画面を例示する第1の図。
【図5】同実施形態の知識分析システムで表示される画面を例示する第2の図。
【図6】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図7】同実施形態の知識分析システムで表示される画面を例示する第3の図。
【図8】同実施形態の知識分析システムの動作手順を示す第1のフローチャート。
【図9】同実施形態の知識分析システムの動作手順を示す第2のフローチャート。
【符号の説明】
1…知識分析システム
2…クライアントコンピュータ
3…ネットワーク
11…ユーザインタフェース
12…知識分析部
13…知識データベース
14…分析結果格納データベース
15…テンプレートデータベース
111…分析条件設定部
112…分析軸選択部
113…分析結果編集部
121…テキストマイニング部
122…分析結果格納部
Claims (15)
- 収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムにおいて、
データ定義用のスキーマを有しないデータベースと、
同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納する分析結果格納手段と
を具備することを特徴とするテキスト情報分析システム。 - 前記データベースは、XMLDBであることを特徴とする請求項1記載のテキスト情報分析システム。
- 前記データベースの1データレコード内に格納された同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示する分析結果提示手段をさらに具備することを特徴とする請求項1記載のテキスト情報分析システム。
- 前記分析結果提示手段は、任意に選択された2つの分析結果をそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項3記載のテキスト情報分析システム。
- 同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示するための表示形式を規定したテンプレートを保持するテンプレート保持手段をさらに具備し、
前記分析結果提示手段は、前記複数の分析結果の表示形式を前記テンプレート保持手段により保持されたテンプレートを用いて変更する手段を有することを特徴とする請求項3記載のテキスト情報分析システム。 - 予め定められた規則に基づき分析条件を自動的に更新しながら同一のテキスト情報群に対する分析を繰り返し実行する再分析実行手段をさらに具備することを特徴とする請求項1記載のテキスト情報分析システム。
- データ定義用のスキーマを有しないデータベースを備え、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムとして動作させるコンピュータを、
同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納する分析結果格納手段
として機能させるためのプログラム。 - 前記コンピュータを、
前記データベースの1データレコード内に格納された同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示する分析結果提示手段
としてさらに機能させる請求項7記載のプログラム。 - 前記分析結果提示手段は、任意に選択された2つの分析結果をそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項8記載のプログラム。
- 前記コンピュータを、
同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示するための表示形式を規定するテンプレートを保持するテンプレート保持手段としてさらに機能させ、
前記分析結果提示手段に、前記複数の分析結果の表示形式を前記テンプレート保持手段により保持されたテンプレートを用いて変更する手段を備えさせる請求項8記載のプログラム。 - 前記コンピュータを、
予め定められた規則に基づき分析条件を自動的に更新しながら同一のテキスト情報群に対する分析を繰り返し実行する再分析実行手段
としてさらに機能させる請求項7記載のプログラム。 - データ定義用のスキーマを有しないデータベースを備え、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムに適用される分析結果の格納方法であって、
同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納することを特徴とする分析結果の格納方法。 - データ定義用のスキーマを有しないデータベースを備え、収集・蓄積された大量のテキスト情報を分析するテキスト情報分析システムに適用される分析結果の提示方法であって、
同一のテキスト情報群に対する異なる分析条件に基づく複数の分析結果を前記データベースの1データレコード内に同一の形式で格納し、
前記データベースの1データレコード内に格納された同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示することを特徴とする分析結果の提示方法。 - 任意に選択された2つの分析結果をそれぞれ縦軸と横軸とに割り当てた2次元配列の表形式で提示することを特徴とする請求項13記載の分析結果の提示方法。
- 同一のテキスト情報群に対する複数の分析結果を有機的に結合させて提示するための表示形式を規定するテンプレートを保持し、
前記複数の分析結果の表示形式を前記保持したテンプレートを用いて変更することを特徴とする請求項13記載の分析結果の提示方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243975A JP2004086352A (ja) | 2002-08-23 | 2002-08-23 | テキスト情報分析システム、分析結果の格納方法および提示方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002243975A JP2004086352A (ja) | 2002-08-23 | 2002-08-23 | テキスト情報分析システム、分析結果の格納方法および提示方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004086352A true JP2004086352A (ja) | 2004-03-18 |
Family
ID=32052600
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002243975A Pending JP2004086352A (ja) | 2002-08-23 | 2002-08-23 | テキスト情報分析システム、分析結果の格納方法および提示方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004086352A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8676738B2 (en) | 2008-09-03 | 2014-03-18 | Nec Corporation | Relationship detector, relationship detection method, and recording medium |
-
2002
- 2002-08-23 JP JP2002243975A patent/JP2004086352A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8676738B2 (en) | 2008-09-03 | 2014-03-18 | Nec Corporation | Relationship detector, relationship detection method, and recording medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7610258B2 (en) | System and method for exposing a child list | |
JP4625337B2 (ja) | プロセス管理装置、プロセス管理方法及びプロセス管理プログラム | |
US7266773B2 (en) | System and method for creating a graphical presentation | |
US7774295B2 (en) | Database track history | |
US20120159312A1 (en) | Representation of an interactive document as a graph of entities | |
US7870476B2 (en) | System and method for creating a graphical presentation | |
US20120159333A1 (en) | Representation of an interactive document as a graph of entities | |
US20100042745A1 (en) | Workflow diagram generation program, apparatus and method | |
US10901699B2 (en) | Data analysis process assistance device and data analysis process assistance method | |
Singh et al. | Business Intelligence Basics | |
CN104182226B (zh) | 一种通用移动信息系统适配方法与装置 | |
JP2017045238A (ja) | 情報処理システム、情報処理装置、及び情報処理方法 | |
US20020180789A1 (en) | Framework for developing web-based and email-based collaborative programs | |
JP2000285128A (ja) | 業務分析システム | |
JP2010015458A (ja) | プログラム修正支援システム、プログラム修正支援方法、およびプログラム修正支援プログラム | |
EP2256677A1 (en) | Workflow processing program, method, and device | |
US20130290065A1 (en) | Method and System to Analyze Processes | |
JPH11316766A (ja) | 多次元分析構築システム及び分析処理用データベース | |
JP2003337725A (ja) | データベース登録装置および方法 | |
JP2004086352A (ja) | テキスト情報分析システム、分析結果の格納方法および提示方法 | |
US11113322B2 (en) | Dynamically generating strategic planning datasets based on collecting, aggregating, and filtering distributed data collections | |
JP5061996B2 (ja) | データベースの検索プログラム、検索装置及び検索方法 | |
JP2007249572A (ja) | プロジェクト管理支援装置、プロジェクト管理支援方法、およびプロジェクト管理支援プログラム | |
JP2004185346A (ja) | プロジェクト作業支援方法およびシステム | |
JP3831319B2 (ja) | テキスト情報分析システムおよび分析結果の提示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060124 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060327 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060418 |