JP2003044486A - 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム - Google Patents

知識分析システム、クラスタ管理方法およびクラスタ管理プログラム

Info

Publication number
JP2003044486A
JP2003044486A JP2001229501A JP2001229501A JP2003044486A JP 2003044486 A JP2003044486 A JP 2003044486A JP 2001229501 A JP2001229501 A JP 2001229501A JP 2001229501 A JP2001229501 A JP 2001229501A JP 2003044486 A JP2003044486 A JP 2003044486A
Authority
JP
Japan
Prior art keywords
cluster
knowledge
database
clusters
screen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001229501A
Other languages
English (en)
Inventor
Eiji Nagamura
栄治 永村
Naoaki Kondo
修明 近藤
Katsuhiko Takachio
勝彦 高知尾
Kazuhiko Atsumi
一彦 渥美
Atsuya Sasaki
淳哉 佐々木
Kazunori Shimakawa
和典 島川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001229501A priority Critical patent/JP2003044486A/ja
Publication of JP2003044486A publication Critical patent/JP2003044486A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】本発明は、知識データベースを単語により分類
し作成した複数のクラスタでなるクラスタデータベース
を対象に、任意クラスタの固定化並びにその解除指定機
能を実現することを課題とする。 【解決手段】クラスタリングモジュール1223は、ク
ラスタ編集画面(クラスタの固定化指定画面)上で、あ
るクラスタが固定化され、クラスタ固定化後の画面上で
「再分析」ボタンがクリックされると、固定クラスタを
除いたクラスタに対して再クラスタリング処理を実行す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ナレッジマネジメ
ントシステムに適用される、知識分析システム、クラス
タ管理方法、およびクラスタ管理プログラムに関する。
【0002】
【従来の技術】近年、企業を中心に複数のユーザ間で情
報共有を行うためのグループウェアの導入が進められて
いる。代表的なグループウェアとしては、電子メールシ
ステムやワークフローシステムなどが知られているが、
最近では、知識や情報の共有支援を図るためのナレッジ
マネジメントシステムも開発され始めている。
【0003】このナレッジマネジメントシステムは、W
eb情報や電子ファイル情報などに加え、個人のノウハ
ウなどを知識データベースとして蓄積し管理するための
ものであり、自然言語検索などの検索機能と組み合わせ
ることにより、知識、情報の効率的な活用が可能とな
る。
【0004】ところで、このようなナレッジマネジメン
トシステムにおいては、個人のノウハウなどの知識をど
のように収集し蓄積するかが重要となるが、個人のノウ
ハウなどの知識は所謂、暗黙知であって、Web情報や
電子ファイル情報などのように、形式化されたものでは
ないことから、これらの情報を自動的に収集し蓄積する
ことは困難である。
【0005】そこで、最近では、知識蓄積支援機能を持
つナレッジマネジメントシステムの開発が要求されてい
る。個人のノウハウなどの知識を自動的に収集し蓄積す
る仕組みを実現することにより、暗黙知としての知識を
もWeb情報や電子ファイル情報などのような形式化さ
れた形式知と同様に活用することが可能となる。
【0006】また、このようにして蓄積された知識や情
報を容易に検索するナレッジマネジメントシステムの開
発も並行して行われている。典型例としては、自然言語
の質問文を入力して、有用な知識や情報を検索する知識
検索支援機能を持つ自然言語検索システムが挙げられ
る。
【0007】しかしながら、従来のこの種自然言語検索
機能を持つナレッジマネジメントシステムでは、質問は
その答えが期待される状況で発せられるものであり、蓄
積された知識情報の全体像が開示されていないので、ど
のような質問に対処できるシステムであるかを予め把握
しておかないと期待する答えを得ることができない。ま
た知りたいことを言葉で端的に表現できればよいが、そ
うでない場合、あるいは、そもそも求める知識を明確に
意識していない若しくは意識できない段階では検索その
ものが役に立たない場合が生じ得る等、種々の問題があ
った。また、従来の分類技術を利用したシステムでは分
類するカテゴリが既知であることが前提となっており、
管理者への負担が大きいという問題もあった。さらに
は、知識データが増えるにつれ、知識データを格納する
文書を簡単に整理したり閲覧したり、初めて利用するユ
ーザに対しても、どのような知識情報が検索できるのか
を提示するなど、知識データの有効活用を図るために知
識の体系化が必要になった。
【0008】
【発明が解決しようとする課題】上述したように従来の
ナレッジマネジメントシステムに於いては、精度並びに
信頼性の面で期待に十分に応えることができず、効果的
かつ効率的な知識分析機能をもつシステムを構築する上
で種々の問題が山積していた。
【0009】本発明は上記実情に鑑みなされたもので、
知識情報が格納されている文書を自動的に効率よく分類
カテゴリ化し階層化する仕組みを実現できるようにし
て、様々な知識の効率的な分析を図ることを可能とした
知識分析システム、クラスタ管理方法、およびクラスタ
管理プログラムを提供することを目的とする。
【0010】更に、本発明は、ナレッジマネジメントシ
ステムに於いて、効果的かつ効率的な知識分析システム
を実現するため、知識データベースを単語により分類し
作成した複数のクラスタでなるクラスタデータベースを
対象に、任意クラスタの固定化並びにその解除指定機能
を実現して、知識分析に於ける再分析対象を自在に選択
できるようにした、知識分析システム、クラスタ管理方
法、およびクラスタ管理プログラムを提供することを目
的とする。
【0011】
【課題を解決するための手段】本発明は、ナレッジマネ
ジメントシステムに適用される知識分析システムに於い
て、効果的かつ効率的な知識分析機能を実現するため、
知識データベースを単語により分類し作成した複数のク
ラスタでなるクラスタデータベースを対象に、任意クラ
スタの固定化並びにその解除指定機能を実現して、任意
のクラスタの固定化により当該クラスタを再クラスタリ
ングの対象から除外し、固定を解除したクラスタを再ク
ラスタリングの対象に復帰させる機能をもたせたことを
特徴とする。これにより、知識分析に於ける再分析対象
クラスタを自在に選択できるようになり、分析の完成度
の高いクラスタを再分析から除外したり、あるいは、固
定クラスタの更新のために再分析の対象とすることが可
能となる。
【0012】即ち、本発明は、複数のクライアント端末
とネットワークを介して接続可能に構成され、知識デー
タベースに蓄積された知識に対する各クライアント端末
からの分析を支援する知識分析システムに於いて、前記
クライアント端末からの知識分析を許可するために、ア
クセス要求元のクライアント端末に対してユーザ認証を
行うアクセス制御手段と、前記アクセス制御手段によっ
てアクセス許可された各クライアント端末からの知識分
析に用いるクラスタデータベースであって、前記知識デ
ータベースに蓄積された知識をカテゴリ毎に定義される
クラスタ別にクラスタデータベースを作成する知識分析
手段とを具備し、前記知識分析手段は、前記クラスタデ
ータベースを再分析する際に、対象となるクラスタが固
定化されているか否かを判断し、固定化されていると
き、当該クラスタを再分析対象から除外する制御手段を
具備することを特徴とする。
【0013】このような本発明に係るクラスタの固定/
解除機能をもつことにより、知識分析に於ける再分析対
象を自在に選択できるようになり、分析の完成度の高い
クラスタを再分析から除外したり、あるいは、固定クラ
スタの更新のために再分析の対象とすることが可能とな
る。
【0014】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。
【0015】図1は本発明の第1実施形態に於ける装置
システムの構成を示すブロック図である。
【0016】以下、図面を参照してこの発明の実施形態
を説明する。
【0017】図1は本発明の実施形態に於ける知識分析
機能をもつナレッジマネジメントシステムの構成を示す
ブロック図である。この知識分析機能をもつナレッジマ
ネジメントシステムは、複数のクライアント端末11,
11,…と、これら各クライアント端末11,11,…
がLAN等の伝送路13を介して接続されるサーバコン
ピュータ12とにより構成され、当該サーバコンピュー
タ12上で知識分析システムが実現される。
【0018】この知識分析システムは、複数のクライア
ント端末11,11,…が共通に利用可能な知識データ
ベース1225を用いて知識の分析を行う。この知識分
析システムに於ける具体的な構成の説明を行う前に、ま
ず、図2乃至図9を用いて、この実施形態に係る知識分
析システムの概要を説明する。
【0019】この実施形態による知識分析システムは、
ある目的で集められた種々雑多な文書群、つまり知識群
から読み取れる傾向等の把握を支援するシステムであ
る。この知識分析システムは、知識クラスタの自動作成
機能、知識クラスタ一覧の表示機能、知識クラスタ内知
識の時系列グラフ表示機能とを有する。ここで、知識ク
ラスタの自動作成機能は、類似する知識を集め、知識ク
ラスタ(知識のグループ)に自動的に仕分けし、編集す
る機能である。また、知識クラスタ一覧の表示機能は、
仕分けられた知識クラスタ間での知識数などを比較する
機能である。また、知識クラスタ内知識の時系列グラフ
表示機能は、ある1つの知識クラスタでの知識の発生傾
向をみる機能である。
【0020】これらの各機能により、例えば、アンケー
ト等の分析、ヘルプデスクへの質問の傾向分析、アイデ
ィアの分類、営業日報からの売れ筋商品や要因分析、掲
示板からの最新話題の抽出、思わぬ発見/新たな気づき
(新たな知識の創造)等の各種の応用に役立てることが
できる。
【0021】以下、それぞれの機能について説明する。
【0022】先ず、知識クラスタの自動作成機能につい
て説明する。
【0023】知識クラスタの自動作成概念を図2に示
し、クラスタリングの流れ(クラスタ作成処理)を図3
に示している。
【0024】ナレッジマネジメントシステムのデータベ
ースに集められた大量の知識を、同じような語が使われ
ているか否かをもとに、似た内容同士のグループに仕分
けて、知識クラスタ(知識グループ)を作成する。ま
た、クラスタの中にクラスタがある、という階層として
仕分けることもでき、さらに、この作成した知識クラス
タ群を「分類」として名前(分類名)をつけて保存する
こともできる。
【0025】図2に於いて、検索時の指定手段として
は、検索条件の指定(キーワード検索)によるものと、
クラスタリング対象とする知識数(検索スコアの上位い
くつまでを使うか)の指定によるものとがある(図9乃
至図11参照)。
【0026】指定事項Aには、「重要語/不要語/同義
語の指定」(重要語:分析に重要と想定される単語。ク
ラスタリングで優先される。不要語:分析に不必要な単
語。クラスタリングで無視される。同義語:分析で同じ
意味を持つ単語群。クラスタリングで同じ単語として扱
われる。)、「作成する知識クラスタの個数(第1階
層)」「階層を1つとするか、階層数を特に指定しない
か」「知識が1つのクラスタにしか入らないか(1対
1)、複数に入るか(1対n)」「ラベルを名詞のみと
するか他の品詞も混ぜるか」「クラスタ全体の名前(分
類名)」等、各種の指定事項がある。
【0027】また、指定事項B(再クラスタリング時の
指定)には、「固定クラスタの指定(再クラスタリング
時でも壊れないクラスタ)」「統合するクラスタ(2つ
以上のクラスタ→1つのクラスタ)の指定」「重要語/
不要語の指定」「作成する知識クラスタの個数(第1階
層:再クラスタリング後にできるクラスタ数)」等、各
種の指定事項がある。
【0028】ここで、上記図2および図3を参照して、
知識クラスタの自動作成処理について説明する。
【0029】図1および図2に示す知識データベース1
225には、多くの知識が順序付けもなく、また整理も
なされずに格納されている。この知識データベース12
25から、クラスタリング対象としたい知識の条件を指
定して検索すると(図3ステップA1)、検索された知
識の集合が決定され(図3ステップA2)、図1および
図2に示す知識を集合した中間データベース(中間D
B)1226が作成される。
【0030】上記指定事項Aにより、図2に示すように
クラスタリングの際の条件を指定すると(図3ステップ
A3)、クラスタリング(自動グルーピング)が実行さ
れて、クラスタ名生成、階層構造決定、知識割り当て等
がなされ(図3ステップA4)、図2に示す知識クラス
タ1〜知識クラスタnが最初の知識クラスタ群として作
成され保存される(図3ステップA5,ステップA
6)。
【0031】このようにして最初にクラスタ群が作成さ
れるが、エンドユーザは異なる条件で、再度、クラスタ
リングしたい場合(図3ステップA7のYES)、必要
に応じて指定条件の調整(上記指定事項B)を行い(図
3ステップA8)、再クラスタリング(これをフィード
バックと称する)を実行する(図3ステップA9)。こ
れにより、再クラスタリングの結果として調整された知
識クラスタ群が作成され保存される(図3ステップA1
0,ステップA6)。
【0032】一方、再クラスタリングが当初より不要な
場合、または、これ以上の再クラスタリングが当初より
不要な場合は(ステップA7のNO)、このクラスタリ
ング処理を終了する。
【0033】次に、知識クラスタ一覧の表示機能につい
て説明する。
【0034】(1)一つの知識クラスタの表示 作成された知識クラスタで表示される内容は「クラスタ
名(ラベル(代表語)、共起語(異なる複数単語が共に
存在している場合これらの単語群を共起語と呼ぶ)、ま
たは一つの語、クラスタ作成時の中心の語)」「クラス
タ中の文書件数」「キーワード(関連語)(複数)」
「クラスタの下位に属するクラスタの階層の有無」「ク
ラスタ内文書数/全体の文書数(割合)」等があり、こ
れらが一つの行として表示される。関連語一覧(全キー
ワードの表示)などの詳細表示もされる。
【0035】(2)クラスタ一覧の表示 a.通常の表示(グラフでは表示されない) 表示は文書の件数順に行われる。図4は件数順のクラス
タ一覧の表示画面例を示している。特定の階層(第1階
層、第2階層、…、第n階層)での一覧表示と、階層を
無視した全クラスタの一覧表示の2種類がある。
【0036】b.件数のグラフ表示 通常の表示ではグラフが表示されないが、ここではグラ
フ表示される。特定の階層での一覧表示と、階層を無視
した全クラスタの一覧表示の2種類がある。
【0037】図4は分析により作成されたクラスタが階
層に関係なく一覧で表示されるクラスタ一覧表示画面
(クラスタ毎の件数のグラフ表示画面)の一構成例を示
している。この図4に示すクラスタ一覧表示画面には以
下の項目が表示される。
【0038】クラスタ名:クラスタ名が表示される。 件数:クラスタに所属する文章の件数が表示される。 キーワード:そのクラスタのキーワードが表示される。 グラフ:知識件数が棒グラフにて表示される。 尚、この図4に示すクラスタ一覧表示画面上で、「編
集」ボタンをクリックすることにより、後述する図12
に示すクラスタ編集画面(クラスタの固定化指定画面)
が表示され、固定クラスタ設定、およびその設定解除が
可能となる。
【0039】c.階層関係全体の表示 全てのクラスタに対して、階層関係を表示する方法には
次の2つがある。 ・階層関係全体の表示 ・階層を固定しての表示と階層無視での表示 図5は階層関係全体のクラスタ一覧表示画面(階層関係
全体の表示画面)の一構成例を示している。この図5に
示す階層関係全体表示画面には、分析結果が階層構造と
グラフで表示される。この図5に示す階層関係全体表示
画面には以下の項目が表示される。 ・クラスタ:分析されたクラスタと、そのクラスタのキ
ーワードが階層構造で表示される。 ・件数:クラスタ下の知識件数が表示される。 ・グラフ:知識件数が棒グラフにて表示される。階層ご
とに、違う色で表示される。 次に、クラスタ内知識の表示機能について説明する。
【0040】クラスタに登録された知識の数を時系列
(日ごと、月ごと)でグラフ表示する。
【0041】(1)時系列分析表示 クラスタ下の登録知識を、登録された時間情報に従って
月または日単位に表示する機能である。画面起動時は、
グラフは表示されておらず、表示単位および表示範囲を
指定することで指定範囲のグラフが表示される。
【0042】図6は指定範囲のグラフを月単位で表示し
た画面(月単位表示画面)の一構成例を示している。こ
の図6に示す月単位表示画面には以下の項目が表示され
る。 表示単位:するグラフの表示単位を月指定または日単位
に指定する。デフォルトは「月単位」。 表示範囲:表示する範囲を指定する。 グラフ表示:月単位の場合、表示範囲の指定年に適合す
る文章の件数を月単位に集計の上、グラフ表示する。こ
のとき、表示範囲の「月」の項目に数値を入力してもグ
ラフ表示に反映されない。日単位の場合、表示範囲の指
定年月に適合する文章の件数を日単位に集計の上、グラ
フ表示する。
【0043】(2)分類一覧 クラスタリングを行なった結果(知識クラスタの固ま
り)は分類として保存される。保存された分類の一覧表
示を行なう画面が分類一覧である。
【0044】図7はこの際の分類一覧の表示画面の一構
成例を示している。この画面が知識分析機能の初期画面
となる。
【0045】図7に示す分類一覧表示画面上で、分類を
選択し、その分類のなかのクラスタ一覧を見ることがで
きる。新規作成もこの画面からできる。知識分析機能を
起動すると、図7に示す分類一覧表示画面が表示され、
分析結果を選択する画面となる。この図7に示す画面に
は以下の項目が表示される。 分析結果:分析した結果の名称が表示される。この名称
は分析結果の作成時にユーザが指定する。 知識DB:分析に使用した知識DBの名称が表示され
る。 件数:分析したDBの全件数が表示される。 最上位クラスタ数:第一階層のクラスタ数が表示され
る。 更新日:分析結果を最後に更新した日付が表示される。 作成日:分析結果を作成した日付が表示される。 次に、知識データベースの選択機能について説明する。
【0046】図8は知識データベース(知識DB)選択
画面の一構成例を示している。この図8に示す知識デー
タベース選択画面には以下の項目が表示される。対象欄
をチェックし、選択ボタンをクリックする。 知識DB(コメント/件数):知識DBの名称、コメン
ト、件数 次に、分岐条件入力機能について説明する。
【0047】図9は、図8で選択した知識データベース
を分析する条件を入力するための分析条件指定画面であ
る。この図9に示す分析条件指定画面には以下の項目が
表示される。
【0048】分析対象DB:図10のDB選択画面で選
択したすべての知識DBの名称、コメント、全件数を表
示する。
【0049】分析結果名称:分析した結果が保存される
名称を入力する。尚、この名称が既に保存してある分析
結果と重複する場合は、「実行」ボタンをクリック後、
エラー表示ウィンドウに警告メッセージに従い、「保
存」を選択することにより、既存の分析結果に上書き保
存される。
【0050】分析対象期間:分析対象となる期間を入力
する。入力のない場合は全知識が分析対象になる。 絞込キーワード:分析のキーワードとなる語句を入力す
る。入力のない場合、全文章が分析対象になる。 絞込件数:分析結果に登録される最大件数を入力する。
分析結果が分析件数よりも大きくなった場合、分析条件
との適合度が高い方から指定件数分の知識が抽出され
る。入力のない場合は分析条件に適合する知識全てが抽
出される。 階層数:クラスタリングを行う階層数を指定する。デフ
ォルトは「多階層」 知識の重複:1つの知識が複数のクラスタに重複して登
録されることを認めるるかどうかを指定する。「あり」
を選択した場合、データは関連のあるクラスタすべてに
登録され、同じ知識が別の複数のクラスタ内に存在する
ことになる。このため、分析結果の合計は分析元DBの
全件数の和を上回る場合がある。「なし」を選択した場
合、データは最も関連の強いクラスタ1つにのみ登録さ
れる。デフォルトは「あり」 最上位クラスタの最大個数:最上位の階層に作成される
クラスタの最大個数を指定する。入力のない場合は指定
なしとしてクラスタリングを行う。 重要語:分析を行う上での重要語を入力する。入力はス
ペース区切りで入力する。
【0051】不要語:分析を行う上での不要語を入力す
る。入力はスペース区切りで入力する。
【0052】同義語:分析を行う上での同義語を入力す
る。
【0053】同義語同士を’=’で結んで記述し、セミ
コロン(;)で区切る。1項目に3つ以上の同義語を定
義することも可能。定義した同義語は、分析結果では一
番左に記述された単語に集約される。
【0054】次に、分析条件保存機能について説明す
る。
【0055】図10は、図9に示す分析条件指定画面上
で指定した知識データベースの分析条件を保存するため
の分析条件保存画面の一構成例を示している。この図1
0に示す画面には以下の項目が表示される。
【0056】・分析条件名:分析条件名を入力する ・すべての分析条件:分析対象期間、絞込キーワード、
絞込件数、階層数、重要語、不要語、同義語等 分析条件名を入力することにより、分析条件名と、その
すべての分析条件が表示される。
【0057】次に、分析条件読み込み機能について説明
する。
【0058】図11は、図10に示す分析条件保存画面
で保存した知識データベースの分析条件を読み込むため
の分析条件読み込み画面である。図11の画面には、分
析条件名と作成日時の項目が表示される。対象欄をチェ
ックし、選択ボタンをクリックする。尚、これらの各表
示画面は、それぞれナレッジサーバ122の制御の下に
表示モジュール1228により生成され、図示しない表
示装置の画面上に選択的に表示される。
【0059】次に、図1を参照して、この実施形態に係
る知識分析システムのシステム構成について説明する。
【0060】この実施形態に於ける知識分析システム
は、複数のクライアント端末11,11,…と、LAN
等のコンピュータネットワーク13を介して相互に接続
可能なサーバコンピュータ12とにより実現されてい
る。サーバコンピュータ12とクライアント端末11,
11,…には、それぞれ、図示しないが、CPU、メイ
ンメモリ、記憶装置としての磁気ディスク装置、及びキ
ーボードやマウスなどの入力部とディスプレイなどの表
示部とを持つ入出力装置が設けられている。
【0061】クライアント端末11では、Webブラウ
ザ111が動作している。サーバコンピュータ12上に
構築された知識分析のためのリソースを示すURL(Un
iform Resource Locator)をWebブラウザ111から
指定することにより、知識分析処理を各クライアント端
末11から利用することができる。
【0062】サーバコンピュータ12の知識分析機能
は、主に、Webサーバ121の制御モジュール121
1、ナレッジサーバ122の登録モジュール1221、
検索モジュール1222、クラスタリングモジュール1
223、表示モジュール1228等のソフトウェアと、
これらソフトフェアによって知識分析のために利用され
る管理情報と実データとによって実現される。管理情報
には、各クライアント端末11,11,…に対してユー
ザ認証を行うためのログイン管理情報1212が存在す
る。また、実データとしては、文書データベース(文書
DB)1224、知識データベース(知識DB)122
5、中間処理用のデータベース(中間DB)1226、
および分析結果データベース(クラスタDB)1227
等が存在する。
【0063】制御モジュール1211は、Webサーバ
121上で動作し、知識分析に関する全体の動作を制御
するもので、この知識分析システムの中核プログラムで
あるナレッジサーバ122と、Webサーバ121と、
Webブラウザ111の間の仲介機能をはじめ、各クラ
イアント端末11,11,…がナレッジサーバ122に
ログインする際のユーザ認証機能を持つ。このユーザ認
証のために、制御モジュール1211は、ログイン管理
情報1212を管理している。このログイン管理情報1
212には、この知識分析システムに参加しているユー
ザそれぞれのユーザIDとパスワード等が格納されてい
る。このユーザ認証により、各クライアント端末11,
11,…からの知識分析等のためになされるナレッジサ
ーバ122に対するアクセスの許可・禁止の制御が行わ
れる。
【0064】ナレッジサーバ122は、複数のクライア
ント端末11が分析可能な知識となる知識データベース
1225や分析結果データベース(クラスタDB)12
27の管理、運用を行うためのものであり、各クライア
ント端末11,11,…から指定された条件による知識
分析結果をクラスタとして分類し蓄積する。
【0065】ここで、ナレッジサーバ122のクラスタ
リングモジュール1223によって実行される、この知
識分析システムに於ける固定クラスタ設定及び解除処理
について説明する。
【0066】まず、図12乃至図15に示す画面の説明
を行う。尚、これらの各表示画面は、それぞれナレッジ
サーバ122に設けられたクラスタリングモジュール1
223の制御の下に表示モジュール1228により生成
され、図示しない表示装置の画面上に選択的に表示され
る。
【0067】図12は、図4のクラスタ一覧画面(クラ
スタ毎の件数のグラフ表示画面に同じ)で「編集」ボタ
ンがクリックされたときに表示されるクラスタ編集画面
(クラスタの固定化指定画面)の一構成例を示してい
る。この図12に示すクラスタ編集画面(クラスタの固
定化指定画面)は、固定化の対象となるクラスタ名を選
択する画面であり、以下の項目が表示される。尚、クラ
スタの固定化には、対象欄をチェックし、固定化対象の
クラスタを選択し、固定ボタンをクリックするという操
作を行う。
【0068】固定:そのクラスタが固定クラスタかどう
かを表示する。固定クラスタの場合、再分析を実行して
もそのクラスタ下は変更されない。 クラスタ名:クラスタ名を表示する。 キーワード:そのクラスタのキーワードを表示する。 件数:クラスタに所属する知識の件数を表示する。
【0069】図13は、上記図12に示すクラスタの固
定化指定画面上で、「固定」ボタンがクリックされたと
きに表示されるクラスタ編集画面(クラスタの固定化後
の画面)の一構成例を示している。ここでは、画面左側
の固定欄に「固定」表示がなされ、当該クラスタが固定
化されていることを示している。
【0070】図14は、上記図13に示すクラスタ編集
画面(クラスタの固定化後の画面)で固定化されたクラ
スタを解除するクラスタ編集画面(クラスタ解除指定画
面)の一構成例を示している。ここでは、対象欄がチェ
ックされ、固定解除ボタンがクリックされた状態を示し
ている。
【0071】図15は、上記図14に示すクラスタ編集
画面(クラスタ解除指定画面)で解除指定され、固定ク
ラスタが解除された後のクラスタ編集画面(クラスタ解
除後の画面)の一構成例を示している。
【0072】図16および図17は、上記図12乃至図
15に示したクラスタ編集画面によるクラスタの固定化
及びその解除指定に係る処理の手順を示すフローチャー
トである。
【0073】ここで、上記図12乃至図17を参照して
本発明の実施形態に於けるクラスタの固定化及びその解
除指定に係る処理動作を説明する。
【0074】ユーザがWebブラウザ111によりサー
バコンピュータ12の制御モジュール1211へログイ
ン要求すると(図16ステップB1)、制御モジュール
1211は、ユーザから入力されたユーザIDおよびパ
スワードが登録されているか否かを調べるためにログイ
ン管理情報1212にアクセスし(図16ステップB
2)、このログインを許可するかどうかを判定するため
のユーザ認証を行う(図16ステップB3)。
【0075】この際、ユーザIDおよびパスワードがロ
グイン管理情報1212に登録されておらず、ログイン
が失敗した場合(図16ステップB4のNO)、制御モ
ジュール1211は、ログイン失敗をWebサーバ12
1を通じてWebブラウザ111に返し、この処理を終
了する(図16ステップB5)。
【0076】一方、ユーザIDおよびパスワードがログ
イン管理情報1212に登録されており、ログインが成
功した場合には(図16ステップB4のYES)、図1
2に示すクラスタ編集画面(クラスタの固定化指定画
面)が表示されるので、当該画面上で固定化するクラス
タを選択し(図12ではクラスタ(キーワード)“ニュ
ーヨーク”、“ロンドン”が選択されている)、「固
定」ボタンをクリックすることにより(図16ステップ
B6)、図13に示すクラスタ編集画面(クラスタの固
定化後の画面)上に固定化されたクラスタが表示される
(図17ステップB7)。即ち、クラスタ(キーワー
ド)“ニューヨーク”、“ロンドン”に「固定」が表示
される。
【0077】この図13に示すクラスタの固定化後の画
面上で、「再分析」ボタンをクリックすると、クラスタ
リングモジュール1223は固定クラスタ以外のクラス
タに対して再クラスタリング処理を実行する(図17ス
テップB8)。
【0078】図14に示すクラスタ編集画面(クラスタ
解除指定画面)上で、固定クラスタを解除するため、対
象クラスタを選択し(この場合、クラスタ(キーワー
ド)“ニューヨーク”が選択されている)、「固定解
除」ボタンをクリックすることにより(図17ステップ
B9)、図15に示すクラスタ編集画面(クラスタ解除
後の画面)が表示され、固定化が解除されたクラスタが
表示される(図17ステップB10)。即ち、クラスタ
(キーワード)“ロンドン”は固定のままで、クラスタ
(キーワード)“ニューヨーク”が固定解除されたこと
を示している。この図15に示すクラスタ編集画面(ク
ラスタ解除後の画面)上で「再分析」ボタンをクリック
すると、クラスタリングモジュール1223は、解除さ
れたクラスタに対しても再クラスタリング処理を実行す
る(図17ステップB11)。
【0079】このようにして、クラスタデータベースの
再分析の際に、クラスタを固定化することにより、再ク
ラスタリング処理を固定クラスタに対しては制限するこ
とが可能となる。また、固定化されているクラスタを解
除することにより、再クラスタリングの対象とすること
が可能となる。これにより、知識分析における再分析対
象を自在に選択できるようになり、分析の完成度の高い
クラスタを再分析から除外したり、あるいは、固定クラ
スタの更新のために再分析の対象とすることが可能とな
る。
【0080】
【発明の効果】以上詳記したように本発明によれば、知
識情報が格納されている知識を自動的に効率よく分類カ
テゴリ化し階層化する仕組みを実現でき、これにより様
々な知識の効率的な分析を図ることを可能とした知識分
析システムが実現できる。
【0081】更に、本発明によれば、知識データベース
を単語により分類し作成した複数のクラスタでなるクラ
スタデータベースを対象に、任意クラスタの固定化並び
にその解除指定機能を実現したことにより、知識分析に
於ける再分析対象を自在に選択できるようになり、分析
の完成度の高いクラスタを再分析から除外したり、ある
いは、固定クラスタの更新のために再分析の対象とする
ことが可能となる。
【図面の簡単な説明】
【図1】本発明の実施形態に於ける知識分析システムの
構成を示すブロック図。
【図2】同実施形態の知識分析システムに於ける知識ク
ラスタの自動作成概念を説明するための図。
【図3】同実施形態の知識分析システムに於けるクラス
タの作成処理手順を示すフローチャート。
【図4】同実施形態に於けるクラスタ一覧表示画面(ク
ラスタ毎の件数のグラフ表示画面)の一構成例を示す
図。
【図5】同実施形態に於ける階層関係全体の表示画面の
一構成例を示す図。
【図6】同実施形態に於ける指定範囲のグラフを月単位
で表示した画面(月単位表示画面)の一構成例を示す
図。
【図7】同実施形態に於ける分類一覧の表示画面の一構
成例を示す図。
【図8】同実施形態に於ける知識データベース(知識D
B)選択画面の一構成例を示す図。
【図9】同実施形態に於ける知識データベースを分析す
る条件を入力する分析条件指定画面の一構成例を示す
図。
【図10】同実施形態に於ける分析条件保存画面の一構
成例を示す図。
【図11】同実施形態に於ける分析条件読み込み画面の
一構成例を示す図。
【図12】同実施形態に於けるクラスタ編集画面(クラ
スタの固定化指定画面)の一構成例を示す図。
【図13】同実施形態に於けるクラスタ編集画面(クラ
スタの固定化後の画面)の一構成例を示す図。
【図14】同実施形態に於けるクラスタ編集画面(クラ
スタ解除指定画面)の一構成例を示す図。
【図15】同実施形態に於けるクラスタ編集画面(クラ
スタ解除後の画面)の一構成例を示す図。
【図16】同実施形態に於けるクラスタ編集画面による
クラスタの固定化及びその解除指定に係る処理の手順を
示すフローチャート。
【図17】同実施形態に於けるクラスタ編集画面による
クラスタの固定化及びその解除指定に係る処理の手順を
示すフローチャート。
【符号の説明】
11…クライアント端末 12…サーバコンピュータ 13…コンピュータネットワーク(LAN) 111…Webブラウザ 121…Webサーバ 122…ナレッジサーバ 1211…制御モジュール 1212…ログイン管理情報 1221…登録モジュール 1222…検索モジュール 1223…クラスタリングモジュール 1224…文書データベース 1225…知識データベース 1226…中間処理用データベース 1227…分析結果データベース 1228…表示モジュール
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/00 537 G06F 12/00 537D (72)発明者 高知尾 勝彦 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 渥美 一彦 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 佐々木 淳哉 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 島川 和典 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 Fターム(参考) 5B075 KK02 KK42 ND03 NR12 5B082 AA09 EA12

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムであって、 クラスタデータベースを構成する全てのクラスタを対象
    に、任意のクラスタを固定化するための設定手段を具備
    し、 前記設定手段により固定化されたクラスタを再クラスタ
    リング処理の対象から除外することを特徴とする知識分
    析システム。
  2. 【請求項2】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムであって、 クラスタデータベースを構成する複数のクラスタを対象
    に、任意のクラスタを固定化するための設定手段と、 前記設定手段により固定化されたクラスタについて任意
    のクラスタの固定を解除する設定解除手段とを具備し、 前記設定手段により固定化されたクラスタを再クラスタ
    リング処理の対象から除外し、前記設定解除手段により
    固定解除されたクラスタを再クラスタリング処理の対象
    に復帰させることを特徴とする知識分析システム。
  3. 【請求項3】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムであって、 クラスタデータベースを構成する階層化された複数のク
    ラスタと、当該複数のクラスタを対象に任意のクラスタ
    を固定/解除指定する操作釦とを対応付けたクラスタの
    固定/解除指定画面を表示する処理手段と、 前記クラスタデータベースを構成する複数のクラスタ
    と、前記クラスタの固定/解除指定画面上で操作された
    固定/解除の指定内容とを対応付けた確認画面を表示す
    る処理手段とを具備したことを特徴とする知識分析シス
    テム。
  4. 【請求項4】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムであって、 クラスタデータベース、および当該クラスタデータベー
    スを構成する複数のクラスタと、当該各クラスタに対応
    して設けた固定/解除を指定する操作釦とを同時に表示
    するクラスタ編集画面を表示する画面制御手段と、 前記クラスタデータベースを再構築する再クラスタリン
    グ処理手段とを具備し、 前記再クラスタリング処理手段の実行時に於いて、前記
    クラスタ編集画面上で「固定」指定されたクラスタを前
    記再クラスタリング処理手段の実行対象から除外し、前
    記クラスタ編集画面上で「解除」指定されたクラスタを
    前記再クラスタリング処理手段の実行対象に復帰させる
    ことを特徴とする知識分析システム。
  5. 【請求項5】 複数のクライアント端末とネットワーク
    を介して接続可能に構成され、知識データベースに蓄積
    された知識に対する各クライアント端末からの分析を支
    援する知識分析システムであって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識をカテゴリ毎に定義されるクラスタ別にクラスタデー
    タベースを作成する知識分析手段とを具備し、 前記知識分析手段は、 前記クラスタデータベースを再分析する際に、対象とな
    るクラスタが固定化されているか否かを判断し、固定化
    されているとき、当該クラスタを再分析対象から除外す
    る制御手段を具備することを特徴とする知識分析システ
    ム。
  6. 【請求項6】 前記クラスタデータベースに含まれる任
    意のクラスタを固定化し、または固定化されたクラスタ
    の固定化を解除するための設定画面をもつクラスタ編集
    画面の表示手段を具備する請求項5記載の知識分析シス
    テム。
  7. 【請求項7】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムのクラスタ管理方法であって、 クラスタ編集画面上の選択操作で、クラスタデータベー
    スを構成する全てのクラスタを対象に任意のクラスタを
    予め固定化設定し、 当該固定化されたクラスタをクラスタリング処理の対象
    から除外して再クラスタリングを行うことを特徴とした
    知識分析システムのクラスタ管理方法。
  8. 【請求項8】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムのクラスタ管理方法であって、 クラスタデータベース、および当該クラスタデータベー
    スを構成する複数のクラスタと、当該各クラスタに対応
    して設けた固定/解除を指定する操作釦とを同時に表示
    するクラスタ編集画面を表示するステップと、 前記クラスタ編集画面上で固定化されたクラスタを再ク
    ラスタリング処理の対象から除外して再クラスタリング
    処理を実行するステップとを具備したことを特徴とする
    知識分析システムのクラスタ管理方法。
  9. 【請求項9】 ナレッジマネジメントシステムに適用さ
    れる知識分析システムのクラスタ管理プログラムであっ
    て、 クラスタ編集画面上の選択操作で、クラスタデータベー
    スを構成する全てのクラスタを対象に任意のクラスタを
    予め固定化する機能と、 前記固定化されたクラスタをクラスタリング処理の対象
    から除外して再クラスタリング処理を行う機能とを前記
    ナレッジマネジメントシステムに実現させるためのプロ
    グラム。
  10. 【請求項10】 ナレッジマネジメントシステムに適用
    される知識分析システムのクラスタ管理プログラムであ
    って、 クラスタデータベース、および当該クラスタデータベー
    スを構成する複数のクラスタと、当該各クラスタに対応
    して設けた固定/解除を指定する操作釦とを同時に表示
    するクラスタ編集画面を生成する機能と、 前記クラスタ編集画面上で固定化されたクラスタをクラ
    スタリング処理の対象から除外して再クラスタリング処
    理を実行する機能とを前記ナレッジマネジメントシステ
    ムに実現させるためのプログラム。
JP2001229501A 2001-07-30 2001-07-30 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム Pending JP2003044486A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001229501A JP2003044486A (ja) 2001-07-30 2001-07-30 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001229501A JP2003044486A (ja) 2001-07-30 2001-07-30 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム

Publications (1)

Publication Number Publication Date
JP2003044486A true JP2003044486A (ja) 2003-02-14

Family

ID=19061840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001229501A Pending JP2003044486A (ja) 2001-07-30 2001-07-30 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム

Country Status (1)

Country Link
JP (1) JP2003044486A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006065366A (ja) * 2004-08-24 2006-03-09 Nec Corp キーワード分類装置およびその方法、端末装置ならびにプログラム
JP2007156849A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
JP2007156848A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
WO2016147220A1 (ja) * 2015-03-18 2016-09-22 日本電気株式会社 テキスト可視化システム、テキスト可視化方法、及び、記録媒体

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006065366A (ja) * 2004-08-24 2006-03-09 Nec Corp キーワード分類装置およびその方法、端末装置ならびにプログラム
JP2007156849A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
JP2007156848A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
US8009919B2 (en) 2005-12-06 2011-08-30 Sony Corporation Image managing apparatus and image display apparatus
US8073265B2 (en) 2005-12-06 2011-12-06 Sony Corporation Image managing apparatus and image display apparatus
KR101290667B1 (ko) 2005-12-06 2013-07-30 소니 가부시키가이샤 화상 관리 장치, 화상 표시 장치 및 화상 표시 방법과 컴퓨터 판독가능한 기록 매체
WO2016147220A1 (ja) * 2015-03-18 2016-09-22 日本電気株式会社 テキスト可視化システム、テキスト可視化方法、及び、記録媒体
JPWO2016147220A1 (ja) * 2015-03-18 2017-12-07 日本電気株式会社 テキスト可視化システム、テキスト可視化方法、及び、プログラム

Similar Documents

Publication Publication Date Title
US11809432B2 (en) Knowledge gathering system based on user's affinity
US6990490B2 (en) Information management method and information management device
US7085755B2 (en) Electronic document repository management and access system
US7620648B2 (en) Universal annotation configuration and deployment
JP2003044491A (ja) 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法
US20060129538A1 (en) Text search quality by exploiting organizational information
US8407218B2 (en) Role based search
US20040267798A1 (en) Federated annotation browser
JP2008071372A (ja) データベースのデータを検索するための方法と装置
US20110004819A1 (en) Systems and methods for user-driven document assembly
US20210149979A1 (en) System and Method for Accessing and Managing Cognitive Knowledge
Nicholson Bibliomining for automated collection development in a digital library setting: Using data mining to discover Web‐based scholarly research works
JP2003044486A (ja) 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム
JP2003044331A (ja) 知識分析システム、クラスタデータベース表示方法および表示制御プログラム
Bae et al. Patterns of reading and organizing information in document triage
JP2003044490A (ja) 知識分析システムおよび同システムにおける知識重複登録設定方法
EP1672544A2 (en) Improving text search quality by exploiting organizational information
Hautapaakkanen Improving information retrieval in a company intranet
JP2003044485A (ja) 知識分析システムおよび同システムにおける最上位クラスタの最大個数設定方法
JP2023036180A (ja) 年史制作方法、プログラム、年史制作装置および年史制作システム
EA001895B1 (ru) Способ получения, обработки и хранения ссылок на информационные источники, списков ссылок и полных копий информационных источников
KR20010086191A (ko) 6하원칙과 계층 구조 표현에 의한 데이터 기술.인식 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070626

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070827

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070925