JP2003044491A - 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法 - Google Patents

知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法

Info

Publication number
JP2003044491A
JP2003044491A JP2001229500A JP2001229500A JP2003044491A JP 2003044491 A JP2003044491 A JP 2003044491A JP 2001229500 A JP2001229500 A JP 2001229500A JP 2001229500 A JP2001229500 A JP 2001229500A JP 2003044491 A JP2003044491 A JP 2003044491A
Authority
JP
Japan
Prior art keywords
knowledge
analysis
database
cluster
client terminal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001229500A
Other languages
English (en)
Inventor
Eiji Nagamura
栄治 永村
Naoaki Kondo
修明 近藤
Katsuhiko Takachio
勝彦 高知尾
Kazuhiko Atsumi
一彦 渥美
Atsuya Sasaki
淳哉 佐々木
Kazunori Shimakawa
和典 島川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2001229500A priority Critical patent/JP2003044491A/ja
Priority to US10/083,563 priority patent/US6895397B2/en
Publication of JP2003044491A publication Critical patent/JP2003044491A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification

Abstract

(57)【要約】 【課題】クラスタの軸となる重要語およびこの重要語と
組み合わせてクラスタリングを実行させるための不要語
および同義語を設定可能とした知識分析システムを提供
する。 【解決手段】ナレッジサーバ122は、クライアント端
末11から文書データベース1224に対して登録依頼
された文書を別途インデックス化した知識として知識デ
ータベース1225に蓄積し、この知識データベース1
225に蓄積した知識群から読み取れる傾向等の把握を
支援するものである。そして、ナレッジサーバ122
は、蓄積された知識群の内容的な偏りに左右されずに、
ユーザの意図した通りの分類を実現するために、クラス
タの軸となる重要語や不要語、同義語等をユーザに設定
させる仕組みをもち、その設定に基づき、蓄積された知
識群を知識クラスタに仕分けるいわゆるクラスタリング
処理を実行して、その結果を分析結果データベース12
27に格納する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ナレッジマネジ
メントシステムで用いられる知識分析システムならびに
同システムにおける分析条件設定方法、分析条件保存方
法および再分析処理方法に係り、特に、クラスタの軸と
なる重要語およびこの重要語と組み合わせてクラスタリ
ングを実行させるための不要語および同義語を設定可能
とするとともに、この重要語、不要語、同義語を含む分
析条件を保存して再クラスタリング時に利用することを
可能とした知識分析システムならびに同システムにおけ
る分析条件設定方法、分析条件保存方法および再分析処
理方法に関する。
【0002】
【従来の技術】近年、企業を中心に複数のユーザ間で情
報共有を行うためのグループウェアの導入が進められて
いる。代表的なグループウェアとしては、電子メールシ
ステムやワークフローシステムなどが知られているが、
最近では、知識や情報の共有支援を図るためのナレッジ
マネジメントシステムも開発され始めている。
【0003】このナレッジマネジメントシステムは、W
eb情報や電子ファイル情報などに加え、個人のノウハ
ウなどを知識データベースとして蓄積・管理するための
ものであり、自然言語検索などの検索機能と組み合わせ
ることにより、知識、情報の効率的な活用が可能とな
る。
【0004】ところで、このようなナレッジマネジメン
トシステムにおいては、個人のノウハウなどの知識をど
のように収集・蓄積するかが重要となる。個人のノウハ
ウなどの知識はいわゆる暗黙知であって、Web情報や
電子ファイル情報などのように形式化されたものではな
いため、それを自動的に収集、蓄積することは困難であ
るからである。
【0005】そこで、最近では、知識蓄積支援機能を持
つナレッジマネジメントシステムの開発が要求されてい
る。個人のノウハウなどの知識を自動的に収集・蓄積す
る仕組みを実現することにより、暗黙知としての知識を
もWeb情報や電子ファイル情報などのような形式化さ
れた形式知と同様に活用することが可能となる。
【0006】また、このようにして蓄積された知識や情
報を容易に検索するナレッジマネジメントシステムの開
発も並行して行われている。典型例としては、自然言語
の質問文を入力して、有用な知識や情報を検索する知識
検索支援機能を持つ自然言語検索システムが挙げられ
る。
【0007】
【発明が解決しようとする課題】ところで、この種のナ
レッジマネジメントシステムでは、知識や情報を簡単に
整理または閲覧したり、あるいは、初めて利用するユー
ザに対しても、どのような知識情報が検索できるのかを
わかりやすく提示する等、知識データの有効活用を図る
ための知識の体系化が強く求められる。これに伴い、蓄
積した知識をカテゴリ化し階層化することにより分類す
ること等が行われている。
【0008】大量に蓄積された知識の分類は、非常に手
間の掛かる作業であるため、たとえば形態素解析等の技
術を利用して自動化することが望ましい。しかしなが
ら、自動的に分類を行わせると、その分類時のカテゴリ
化および階層化が、その時点で蓄積された知識群の内容
的な偏りに大きく左右されてしまい、必ずしもユーザを
満足させる結果が得られないといった問題があった。
【0009】この発明は、このような事情を考慮してな
されたものであり、クラスタの軸を生成する重要語およ
びこの重要語と組み合わせてクラスタリングを実行させ
るための不要語および同義語を設定可能とするととも
に、この重要語、不要語、同義語を含む分析条件を保存
して再クラスタリング時に利用することを可能とした知
識分析システムならびに同システムにおける分析条件設
定方法、分析条件保存方法および再分析処理方法を提供
することを目的とする。
【0010】
【課題を解決するための手段】前述した目的を達成する
ために、この発明は、複数のクライアント端末とネット
ワークを介して接続可能に構成され、知識データベース
に蓄積された知識に対する各クライアント端末からの分
析を支援する知識分析システムであって、前記クライア
ント端末からの知識分析を許可するために、アクセス要
求元のクライアント端末に対してユーザ認証を行うアク
セス制御手段と、前記アクセス制御手段によってアクセ
ス許可された各クライアント端末からの知識分析に用い
るクラスタデータベースであって、前記知識データベー
スに蓄積された知識をカテゴリ毎に定義されるクラスタ
別にクラスタデータベースを作成する知識分析手段とを
具備し、前記知識分析手段は、前記クラスタデータベー
スの作成時に、クラスタリングで優先する重要語を設定
する手段を有し、前記重要語をもとにクラスタの軸を生
成するようにクラスタリングを実行することを特徴とす
る知識分析システムを提供する。
【0011】また、前記知識分析手段は、更にクラスタ
リングで無視する不要語を設定する手段を有し、前記重
要語と前記不要語をもとにクラスタリングを実行するこ
とを特徴とする。
【0012】また、前記知識分析手段は、更にクラスタ
リングで同じ単語として扱う同義語を設定する手段を有
し、前記重要語と前記不要語および前記同義語の組合せ
によってクラスタリングを実行することを特徴とする。
【0013】この知識分析システムにおいては、クラス
タの軸を生成する重要語やこの重要語と組み合わせてク
ラスタリングを行わせるための不要語および同義語を設
定する仕組みをもつことにより、その時点で蓄積された
知識群の内容的な偏りに左右されることなく、ユーザが
意図するカテゴリ化および階層化によって分類を実行す
ることを可能とする。
【0014】また、この発明は、複数のクライアント端
末とネットワークを介して接続可能に構成され、知識デ
ータベースに蓄積された知識に対する各クライアント端
末からの分析を支援する知識分析システムであって、前
記クライアント端末からの知識分析を許可するために、
アクセス要求元のクライアント端末に対してユーザ認証
を行うアクセス制御手段と、前記アクセス制御手段によ
ってアクセス許可された各クライアント端末からの知識
分析に用いるクラスタデータベースであって、前記知識
データベースに蓄積された知識を重要語、不要語、同義
語の分析条件をもとにカテゴリ毎に定義されるクラスタ
別にクラスタデータベースを作成する知識分析手段とを
具備し、前記知識分析手段は、前記クラスタデータベー
スの作成時に用いた前記分析条件を保存する手段を有す
ることを特徴とする知識分析システムを提供する。
【0015】また、前記知識分析手段は、前記保存した
分析条件を読み出し、変更を施した後の分析条件を用い
て、新たなクラスタデータベースを作成する手段を有す
ることを特徴とする。
【0016】この知識分析システムにおいては、クラス
タリング実行時の分析条件を保存しておき、この保存し
た分析条件を呼び出し、必要に応じて、重要語、不要語
および同義語を再設定して再クラスタリングを実行でき
るようにすることにより、より精度の高い分析を求める
ことを可能とし、かつ、再分析の操作性および効率を飛
躍的に向上させる。
【0017】
【発明の実施の形態】以下、図面を参照してこの発明の
一実施形態を説明する。
【0018】図1には、この発明の実施形態に係る知識
分析システムの構成が示されている。この知識分析シス
テムは、知識分析機能を持つナレッジマネジメントシス
テムとして利用されるものであり、複数のクライアント
端末11が共通に利用可能な知識データベース1225
を用いて、知識の分析を行う。具体的な構成の説明を行
う前に、まず、図2乃至図9を用いて、この実施形態に
係る知識分析システムの概要を説明することにする。
【0019】この実施形態の知識分析システムは、ある
目的で集められた雑多な文書群、つまり知識群から読み
取れる傾向等の把握を支援するシステムである。この知
識分析システムは次の3つの機能から構成される。
【0020】(1)知識クラスタの自動作成 類似する知識を集め、知識クラスタ(知識のグループ)
に自動的に仕分け、編集する機能。 (2)知識クラスタ一覧の表示 仕分けられた知識クラスタ間での知識数などを比較する
機能。 (3)知識クラスタ内知識の時系列グラフ表示 ある1つの知識クラスタでの知識の発生傾向を見る機
能。これらにより ・アンケート等の分析 ・ヘルプデスクへの質問の傾向分析 ・アイディアの分類、 営業日報からの売れ筋商品や要因分析 掲示板からの最新話題の抽出 思わぬ発見/新たな気づき(新たな知識の創造) などといった応用に役立てることができる。
【0021】以下、それぞれの機能説明をする。
【0022】<知識クラスタの自動作成>図2に、知識
クラスタの自動作成概念を、図3に、クラスタリングの
流れを示す。ナレッジマネジメントシステムのデータベ
ースに集められた大量の知識を、同じような語が使われ
ているかどうかをもとに、似た内容どうしのグループに
仕分けて、知識クラスタ(知識グループ)を作成する。
また、クラスタの中にクラスタがある、という階層とし
て仕分けることもでき、さらに、この作成した知識クラ
スタ群を「分類」として名前(分類名)をつけて保存す
ることもできる。
【0023】(1)検索時の指定 検索時の指定には、以下の2つが存在する。
【0024】・検索条件:キーワード検索。 ・クラスタリング対象とする知識数(検索スコアの上位
いくつまでを使うか)。 (2)指定事項A 指定項目Aには、以下の9つが存在する。
【0025】・重要語/不要語/同義語の指定。 ・重要語:分析に重要と想定される単語。クラスタリン
グで優先される。 ・不要語:分析に不必要な単語。クラスタリングで無視
される。 ・同義語:分析で同じ意味を持つ単語群。クラスタリン
グで同じ単語として扱われる。
【0026】・作成する知識クラスタの個数(第1階
層)。 ・階層を1つとするか、階層数を特に指定しないか。 ・知識が1つのクラスタにしか入らないか(1対1)、
複数に入るか(1対n)。 ・ラベルを名詞のみとするか他の品詞も混ぜるか。 ・クラスタ全体の名前(分類名)。 (3)指定事項B(再クラスタリング時の指定)。 指定項目Bには、以下の4つが存在する。
【0027】・固定クラスタの指定(再クラスタリング
時でも壊れないクラスタ)。 ・統合するクラスタ(2つ以上のクラスタ→1つのクラ
スタ)の指定。 ・重要語/不要語の指定。 ・作成する知識クラスタの個数(第1階層:再クラスタ
リング後にできるクラスタ数)。
【0028】図2の知識データベース1225には、多
くの知識が順序付けもなくまた整理もなされずに格納さ
れている。この知識データベース1225からクラスタ
リング対象としたい知識の条件を指定して検索すると
(図3ステップA1)、図2のように検索された知識の
集合が決定され(ステップA2)、上記の指定事項Aに
よりクラスタリングの際の条件を指定すると(ステップ
A3)、クラスタリング(自動グルーピング)が実行さ
れてクラスタ名生成、階層構造決定、知識割り当てがな
され(ステップA4)、図2の知識クラスタ1〜知識ク
ラスタnが最初の知識クラスタ群として作成・保存され
る(ステップA5,ステップA6)。
【0029】こうして最初にクラスタ群が作成される
が、エンドユーザは異なる条件で再度クラスタリングし
たい場合(ステップA7のYES)、必要に応じて指定
条件の調整(上記の指定事項B)を行い(ステップA
8)、再クラスタリング(これをフィードバックと称す
る)を実行する(ステップA9)。これにより、再クラ
スタリングの結果として調整された知識クラスタ群が作
成・保存される(ステップA10,ステップA6) 一方、再クラスタリングが当初より不要な場合、また
は、これ以上の再クラスタリングが不要な場合は(ステ
ップA7のNO)、このクラスタリング処理を終了す
る。
【0030】<知識クラスタ一覧の表示> (1)階層非表示&グラフ非表示 表示は知識の件数順に行われる。図4は、件数順の全ク
ラスタ一覧の表示画面例を示している。階層を無視した
全クラスタの一覧表示と、特定の階層(第1階層、第2
階層、…、第n階層)での一覧表示の2種類がある。以
下、図4の画面の説明を行う。
【0031】・クラスタ名:クラスタ名が表示される。 ・件数:クラスタに属する知識の件数が表示される。 ・キーワード:そのクラスタのキーワードが表示され
る。 (2)階層非表示&グラフ表示 図5は、階層に関係なく全クラスタが一覧で表示された
画面である。階層を無視した全クラスタの一覧表示と、
特定の階層での一覧表示との2種類がある。以下、図5
の画面の説明を行う。
【0032】・クラスタ名:クラスタ名が表示される。 ・件数:クラスタに属する知識の件数が表示される。 ・キーワード:そのクラスタのキーワードが表示され
る。 ・グラフ:知識件数が棒グラフにて表示される。
【0033】(3)階層表示&グラフ非表示 全てのクラスタに対して、階層関係を表示する方法には
次の2つがある。
【0034】(a)階層全体の表示 (b)階層を固定しての表示と階層無視での表示 図6は、階層全体の画面表示例を示している。これは、
分析結果が階層構造のみで表示される画面である。以
下、この画面の説明を行う。
【0035】・クラスタ:分析されたクラスタと、その
クラスタのキーワードが階層構造で表示される。
【0036】・件数:クラスタ下の知識件数が表示され
る。
【0037】(4)階層表示&グラフ表示 全てのクラスタに対して、階層関係を表示する方法には
次の2つがある。
【0038】(a)階層全体の表示 (b)階層を固定しての表示と階層無視での表示 図7は、階層全体の画面表示例を示している。これは、
分析結果が階層構造とグラフで表示される画面である。
以下、この画面の説明を行う。
【0039】・クラスタ:分析されたクラスタと、その
クラスタのキーワードが階層構造で表示される。 ・件数:クラスタ下の知識件数が表示される。
【0040】・グラフ:知識件数が棒グラフにて表示さ
れる。また、階層ごとに、違う色で表示される。 <知識クラスタ内知識の時系列グラフ表示>知識クラス
タに登録された知識の数を時系列(日ごと、月ごと)で
グラフ表示する。
【0041】(1)時系列分析表示 クラスタ下の登録知識を、登録された時間情報に従って
月または日単位に表示する機能である。画面起動時は、
グラフは表示されておらず、表示単位および表示範囲を
指定することで指定範囲のグラフが表示される。図8
は、月単位で表示した例である。以下、この画面の説明
を行う。
【0042】・表示単位:グラフを表示する単位を月単
位または日単位のいずれかに指定する。デフォルトは
「月単位」。 ・表示範囲:表示する範囲を指定する。 ・グラフ表示:月単位の場合、表示範囲の指定年に適合
する知識の件数を月単位に集計の上、グラフ表示する。
このとき、表示範囲の「月」の項目に数値を入力しても
グラフ表示には反映されない。一方、日単位の場合、表
示範囲の指定年月に適合する知識の件数を日単位に集計
の上、グラフ表示する。
【0043】(2)分類一覧 クラスタリングを行なった結果(知識クラスタの固ま
り)は、分類として保存される。保存された分類の一覧
表示を行なう画面が分類一覧である。図9の画面が知識
分析機能の初期画面となる。
【0044】図9の画面から分類を選択し、その分類の
なかのクラスタ一覧を見ることができる。新規作成もこ
の画面からできる。知識分析機能の起動時、この図9の
画面が表示され、分析結果を選択する画面となる。以
下、この画面の説明を行う。
【0045】・分析結果:分析した結果の名称が表示さ
れる。この名称は分析結果の作成時にユーザが指定す
る。 ・知識DB:分析に使用した知識DBの名称が表示され
る。 ・件数:分析したDBの全件数が表示される。 ・最上位クラスタ数:第1階層のクラスタ数が表示され
る。 ・更新日:分析結果を最後に更新した日付が表示され
る。 ・作成日:分析結果を作成した日付が表示される。 <システム構成>次に、図1を参照して、この実施形態
に係る知識分析システムのシステム構成について説明す
る。
【0046】この実施形態の知識分析システムは、複数
のクライアント端末11とLAN等のコンピュータネッ
トワーク13を介して相互に接続可能なサーバコンピュ
ータ12にて実現されている。サーバコンピュータ12
とクライアント端末11とには、それぞれ、図示しない
が、CPU、メインメモリ、記憶装置としての磁気ディ
スク装置およびキーボードやマウスなどの入力部とディ
スプレイなどの表示部とを持つ入出力装置が設けられて
いる。
【0047】クライアント端末11では、Webブラウ
ザ111が動作している。サーバコンピュータ12上に
構築された知識分析のためのリソースを示すURL(Un
iform Resource Locator)をWebブラウザ111から
指定することにより、知識分析処理を各クライアント端
末11から利用することができる。
【0048】サーバコンピュータ12の知識分析機能
は、主に、Webサーバ121の制御モジュール121
1、ナレッジサーバ122の登録モジュール1221、
検索モジュール1222およびクラスタリングモジュー
ル1223などのソフトウェアと、これらソフトフェア
によって知識分析のために利用される管理情報および実
データとによって実現されている。管理情報には、各ク
ライアント端末11に対してユーザ認証を行うためのロ
グイン管理情報1212が存在する。また、実データと
しては、文書データベース1224、知識データベース
1225、中間処理用データベース1226および分析
結果データベース1227が存在する。
【0049】制御モジュール1211は、知識分析に関
する全体の動作を制御するためのものであり、この知識
分析システムの中核プログラムであるナレッジサーバ1
22とWebサーバ121との間の仲介機能を初め、W
ebサーバ121を通じて各クライアント端末11がナ
レッジサーバ122にログインする際のユーザ認証機能
を持つ。このユーザ認証のために、制御モジュール12
11は、ログイン管理情報1212を管理している。こ
のログイン管理情報1212には、この知識分析システ
ムに参加しているユーザそれぞれのユーザIDとパスワ
ード等が格納されている。このユーザ認証により、各ク
ライアント端末11からの知識分析等の為になされるナ
レッジサーバ122に対するアクセスの許可・禁止の制
御が行われる。
【0050】ナレッジサーバ122は、複数のクライア
ント端末11が分析可能な知識となる知識データベース
1225や分析結果データベース1227の管理、運用
を行うためのものであり、各クライアント端末11から
指定された条件による知識分析結果を知識のクラスタと
して分類、蓄積する。
【0051】ここで、ナレッジサーバ122のクラスタ
リングモジュール1223によって実行される、この知
識分析システムにおける分析条件設定処理、分析条件保
存処理および再分析処理について説明する。分析条件設
定処理とは、クラスタの軸となる重要語およびこの重要
語と組み合わせてクラスタリングを実行させるための不
要語および同義語を設定する機能であり、また、分析条
件保存処理は、この重要語、不要語および同義語を含む
分析条件を保存する機能である。そして、再分析処理
は、保存された分析条件を用いて効率的に知識分析を再
実行するための機能である。
【0052】まず、図10乃至図15の説明を行う。図
10は、知識データベース選択画面である。図10には
以下の項目が表示される。
【0053】・知識DB(コメント/件数):知識デー
タベース1225の名称、コメントおよび件数。 なお、知識データベース1225は、文書データベース
1224と一対に設けられるものであり、文書データベ
ース1224に蓄積される文書、つまり知識に含まれる
語句の索引を格納するものである。クライアント端末1
1からいずれかの文書データベース1224に対する文
書の格納を依頼されると、ナレッジサーバ122の登録
モジュール1221は、この文書を指定された文書デー
タベース1224に格納するが、その際、この文書の内
容に対してたとえば形態素解析を施し、その文書に含ま
れる語句の索引を作成する。そして、その作成した索引
を知識データベース1225に格納する。
【0054】また、図11は、図10で選択した知識デ
ータベース1225を分析する条件を指定する画面であ
る。図11には、以下の項目が表示される。
【0055】・分析対象DB:図10の知識データベー
ス選択画面で選択したすべての知識データの名称、コメ
ントおよび 全件数を表示する。 ・分析結果名称:分析した結果を保存する際の名称を入
力する。本名称がすでに保存してある分析結果と重複す
る場合は、<実行>選択時に警告メッセージが表示さ
れ、そのメッセージ中の<保存>を選択すると、従来の
分析結果に上書きして保存される。 ・分析対象期間:分析対象となる期間を入力する。入力
のない場合は全知識が分析対象になる。 ・絞込キーワード:分析のキーワードとなる語句を入力
する。入力のない場合は、全知識が分析対象になる。 ・絞込件数:分析結果に登録される最大件数を入力す
る。分析結果が分析件数よりも大きくなった場合は、分
析条件との適合度が高い方から指定件数分の知識が抽出
される。入力のない場合は、分析条件に適合するすべて
の知識が抽出される。 ・階層数:クラスタリングを行う階層数を指定する。デ
フォルトは「多階層」。 ・知識の重複:1つの知識が複数のクラスタに重複して
登録されることを許可するかどうかを指定する。「あ
り」を選択した場合、各知識は関連のあるクラスタすべ
てに登録され、その結果、同じ知識が別の複数のクラス
タ内に存在することになる。このため、分析結果の合計
は、分析元DBの全件数の和を上回る場合がある。一
方、「なし」を選択した場合、各知識は最も関連の強い
クラスタ1つにのみ登録される。デフォルトは「あ
り」。 ・最上位クラスタの最大個数:最上位の階層に作成され
るクラスタの最大個数を指定する。入力のない場合は、
指定なしとしてクラスタリングを行う。
【0056】・重要語:分析を行う上での重要語を入力
する。複数入力する際は、スペース区切りで行う。 ・不要語:分析を行う上での不要語を入力する。複数入
力する際は、スペース区切りで行う。 ・同義語:分析を行う上での同義語を入力する。同義語
同士を“=”で結んで記述し、セミコロン(;)で区切
る。1項目に3つ以上の同義語を定義することも可能で
ある。また、定義した同義語は、分析結果では、一番左
に記述された単語に集約されることになる。
【0057】また、図12は、図11で指定した知識デ
ータベース1225の分析条件を保存する画面である。
図12には、以下の項目が表示される。
【0058】・分析条件名:すべての分析条件 また、図13は、図12で保存した知識データベース1
225の分析条件を読み出す画面である。図13には、
以下の項目が表示される。
【0059】・分析条件名 ・作成日時 また、図14は、図6のクラスタ一覧画面(クラスタ毎
の件数のグラフ表示画面に同じ)で編集ボタンがクリッ
クされたときに表示される画面であり、再分析の対象と
なるクラスタ名を選択する画面である。図11には、以
下の項目が表示される。
【0060】・固定:そのクラスタが固定クラスタかど
うかを表示する。固定クラスタの場合、再分析を実行し
てもそのクラスタ下は変更されない。 ・クラスタ名:クラスタ名を表示する。 ・キーワード:そのクラスタのキーワードを表示する。 ・件数:クラスタに所属する文書の件数を表示する。 さらに、図15は、図14のクラスタ編集画面で再分析
ボタンがクリックされたときに表示される画面であり、
再分析条件を指定する画面である。つまり、すでに作成
されている分析結果であるクラスタを再分析して上書き
するための分析条件を入力する画面である。図15に
は、以下の項目が表示される。なお、分析条件の各フィ
ールドには、前回の分析で用いられたパラメータが入力
された状態で表示される。このうち、最上位クラスタの
最大個数と重要語、不要語および同義語のみが再分析で
変更できる。
【0061】・分析対象DB:分析に使用した知識デー
タベース1225の名称が表示される。 ・分析結果名称:分析した結果が保存されている名称を
表示する。 ・分析対象期間:分析対象となる期間が表示される。 ・絞込キーワード:分析のキーワードとなる語句が表示
される。 ・絞込件数:分析結果に登録される最大件数が表示され
る。 ・階層数:クラスタリングを行う階層数を表示する。 ・知識の重複:1つの知識が複数のクラスタに重複して
登録されることを許可するかどうかを表示する。 ・最上位クラスタの最大個数:最上位の階層に作成され
るクラスタの最大個数を指定する。入力のない場合は、
指定なしとしてクラスタリングを行う。変更可能。
【0062】・重要語:分析を行う上での重要語を入力
する。複数入力する際は、スペース区切りで行う。
【0063】・不要語:分析を行う上での不要語を入力
する。複数入力する際は、スペース区切りで行う。
【0064】・同義語:分析を行う上での同義語を入力
する。同義語同士を“=”で結んで記述し、セミコロン
(;)で区切る。1項目に3つ以上の同義語を定義する
ことも可能である。また、定義した同義語は、分析結果
では、一番左に記述された単語に集約されることにな
る。
【0065】図16は、図10で選択した知識データベ
ース1225に対して図11の条件設定画面で指定した
重要語、不要語および同義語に基づく知識分析を実行
し、その際に指定した重要語、不要語および同義語を含
む分析条件を保存する手順を示すフローチャートであ
る。
【0066】ユーザがWebブラウザ111によりサー
バコンピュータ12の制御モジュール1211へログイ
ン要求すると(ステップB1)、制御モジュール121
1は、ユーザから入力されたユーザIDおよびパスワー
ドが登録されているか否かを調べるためにログイン管理
情報1212にアクセスし(ステップB2)、このログ
インを許可するかどうかを判定するためのユーザ認証を
行う(ステップB3)。ユーザIDおよびパスワードが
ログイン管理情報1212に登録されておらず、ログイ
ンが失敗した場合(ステップB3のNO)、制御モジュ
ール1211は、ログイン失敗をWebサーバ121を
通じてWebブラウザ111に返してこの処理を終了す
る(ステップB4)。
【0067】一方、ユーザIDおよびパスワードがログ
イン管理情報1212に登録されており、ログインが成
功した場合には(ステップB3のYES)、ナレッジサ
ーバ122のクラスタリングモジュール1223が、図
10に示す知識データベース選択画面を表示する(ステ
ップB5)。この知識データベース選択画面が表示され
ると、ユーザは、その画面上で分析対象の知識データベ
ース1225を選択する(ステップB6)。この選択が
行われると、ナレッジサーバ122のクラスタリングモ
ジュール1223は、今度は図11に示す分析条件指定
画面を表示する(ステップB7)。
【0068】また、この分析条件指定画面が表示される
と、ユーザは、この画面上で分析条件を指定する(ステ
ップB8)。この設定が行われると、ナレッジサーバ1
22の検索モジュール1222が、知識データベース選
択画面で選択された知識データベース1225に対し、
分析条件指定画面で指定された重要語、不要語および同
義語を用いた検索を行い、中間処理用データベース12
26を作成する(ステップB9)。次に、ナレッジサー
バ122のクラスタリングモジュール1223が、分析
条件指定画面で指定された分析条件に基づき、クラスタ
リング処理を実行する(ステップB10)。その後、ユ
ーザからの指示に従い、その分析条件を保存する場合に
は(ステップB11のYES)、図12に示す分析条件
保存画面で分析条件を保存した上でこの処理を終了する
(ステップB12)。一方、保存しない場合には(ステ
ップB11のNO)、そのままこの処理を終了する。
【0069】図17は、図10で選択した知識データベ
ース1225に対し、図11の分析条件指定画面で分析
条件読み込みボタンをクリックすることにより表示され
る分析条件読み込み画面(図13)において分析条件名
を選択し、それが読み込まれた後に表示される図11の
条件指定画面の分析条件を用いて新たにクラスタリング
する場合の処理の手順を示すフローチャートである。な
お、この分析条件の読み込みによるクラスタリング処理
では、既存のクラスタを上書きすることは行わず、異な
ったクラスタが新たに作成される。そのため、読み込ん
だ後に分析結果名を変更する。
【0070】ユーザがWebブラウザ111によりサー
バコンピュータ12の制御モジュール1211へログイ
ン要求すると(ステップC1)、制御モジュール121
1は、ユーザから入力されたユーザIDおよびパスワー
ドが登録されているか否かを調べるためにログイン管理
情報1212にアクセスし(ステップC2)、このログ
インを許可するかどうかを判定するためのユーザ認証を
行う(ステップC3)。ユーザIDおよびパスワードが
ログイン管理情報1212に登録されておらず、ログイ
ンが失敗した場合(ステップC3のNO)、制御モジュ
ール1211は、ログイン失敗をWebサーバ121を
通じてWebブラウザ111に返してこの処理を終了す
る(ステップC4)。
【0071】一方、ユーザIDおよびパスワードがログ
イン管理情報1212に登録されており、ログインが成
功した場合には(ステップC3のYES)、ナレッジサ
ーバ122のクラスタリングモジュール1223が、図
10に示す知識データベース選択画面を表示する(ステ
ップC6)。この知識データベース選択画面が表示され
ると、ユーザは、その画面上で分析対象の知識データベ
ース1225を選択する(ステップC6)。この選択が
行われると、ナレッジサーバ122のクラスタリングモ
ジュール1223は、今度は図11に示す分析条件指定
画面を表示する(ステップC7)。
【0072】また、この分析条件指定画面が表示される
と、ユーザは、この画面上で分析条件読み込みボタンを
クリックする(ステップC8)。これに応じて、ナレッ
ジサーバ122のクラスタリングモジュール1223
が、図13に示す分析条件読み込み画面を表示し(ステ
ップC9)、ユーザが、この画面上で所望の分析条件を
選択する(ステップC10)。
【0073】この選択が行われると、ナレッジサーバ1
22のクラスタリングモジュール1223が、先のクラ
スタリング時に保存した分析条件を埋め込んだ分析条件
指定画面を表示するので、ユーザは、分析結果名を変更
して新たに異なるクラスタを作成するために分析実行ボ
タンをクリックする。すると、ナレッジサーバ122の
検索モジュール1222が、知識データベース選択画面
で選択された知識データベース1225から分析条件指
定画面で指定された重要語、不要語および同義語を用い
た検索を行い、中間処理用データベース1226を作成
する(ステップC11)。そして、ナレッジサーバ12
2のクラスタリングモジュール1223が、分析条件指
定画面で指定された分析条件に基づき、クラスタリング
処理を実行する(ステップC12)。
【0074】図18は、図6で選択したクラスタに対
し、図14の画面で再分析ボタンをクリックすることに
より表示される再分析条件指定画面(図15)において
最上位クラスタの最大個数と重要語、不要語および同義
語のいずれかを再設定して新たに再分析(再クラスタリ
ングして既存のクラスタと置き換える)する場合の処理
の手順を示すフローチャートである。
【0075】ユーザがWebブラウザ111によりサー
バコンピュータ12の制御モジュール1211へログイ
ン要求すると(ステップD1)、制御モジュール121
1は、ユーザから入力されたユーザIDおよびパスワー
ドが登録されているか否かを調べるためにログイン管理
情報1212にアクセスし(ステップD2)、このログ
インを許可するかどうかを判定するためのユーザ認証を
行う(ステップD3)。ユーザIDおよびパスワードが
ログイン管理情報1212に登録されておらず、ログイ
ンが失敗した場合(ステップD3のNO)、制御モジュ
ール1211は、ログイン失敗をWebサーバ121を
通じてWebブラウザ111に返してこの処理を終了す
る(ステップD4)。
【0076】一方、ユーザIDおよびパスワードがログ
イン管理情報1212に登録されており、ログインが成
功した場合には(ステップD3のYES)、ナレッジサ
ーバ122のクラスタリングモジュール1223が、図
6に示すクラスタ一覧画面を表示する(ステップD
5)。このクラスタ一覧画面が表示されると、ユーザ
は、その画面上で再分析対象のクラスタを選択して選択
ボタンをクリックする(ステップD6)。この選択が行
われると、ナレッジサーバ122のクラスタリングモジ
ュール1223は、今度は図14に示すクラスタ編集画
面を表示する(ステップD7)。
【0077】また、このクラスタ編集画面が表示される
と、ユーザは、この画面上で再分析ボタンをクリックす
る(ステップD8)。これに応じて、ナレッジサーバ1
22のクラスタリングモジュール1223が、図15に
示す再分析条件指定画面を表示し(ステップD9)、ユ
ーザが、この画面上でたとえば重要語として新たに「金
融再生」と「不良債権」とを追加して再分析ボタンをク
リックする(ステップD10)。
【0078】この分析条件の再指定が行われると、ナレ
ッジサーバ122の検索モジュール1222が、その重
要語、不要語および同義語を用いた検索を行い、中間処
理用データベース1226を作成する(ステップD1
1)。そして、ナレッジサーバ122のクラスタリング
モジュール1223が、図15で指定されたクラスタリ
ングに関する条件に基づき、クラスタリング処理を実行
する(ステップD12)。
【0079】このように、この知識分析システムは、ク
ラスタの軸を生成する重要語やこの重要語と組み合わせ
てクラスタリングを行わせるための不要語および同義語
を設定する仕組みをもつことにより、その時点で蓄積さ
れた知識群の内容的な偏りに左右されることなく、ユー
ザが意図するカテゴリ化および階層化によって分類を実
行することを可能とする。
【0080】また、クラスタリング実行時の分析条件を
保存しておき、この保存した分析条件を呼び出し、必要
に応じて、重要語、不要語および同義語を再設定して再
クラスタリングを実行できるようにすることにより、よ
り精度の高い分析を求めることを可能とし、かつ、再分
析の操作性および効率を飛躍的に向上させる。
【0081】そして、このような構成をもつことによ
り、この知識分析システムは、図19に示すような処理
の流れを簡単に作り出すことが可能となる。
【0082】すなわち、導入時には、重要語や不要語、
同義語を設定した上で初期分類階層構造の自動生成
(1)を実行した後、この重要語、不要語および同義語
を再設定して再クラスタリング、つまりカテゴリと知識
の編集(2)を納得がいくまで実行することにより、ほ
ぼ理想に近い分類を実現する。また、運用時には、保存
しておいた分析条件を用いた再クラスタリングをたとえ
ば定期的に実行することにより、新着文書(知識)の自
動分類(3)を行い、必要に応じて、この重要語、不要
語および同義語を再設定して再クラスタリングを実行す
ることにより、カテゴリの細分化(4)を行う。
【0083】このように、この知識分析システムは、導
入時および運用時双方の操作を大幅に効率化することを
可能とする。
【0084】なお、本願発明は、前記実施形態に限定さ
れるものではなく、実施段階ではその要旨を逸脱しない
範囲で種々に変形することが可能である。更に、前記実
施形態には種々の段階の発明が含まれており、開示され
る複数の構成要件における適宜な組み合わせにより種々
の発明が抽出され得る。たとえば、実施形態に示される
全構成要件から幾つかの構成要件が削除されても、発明
が解決しようとする課題の欄で述べた課題が解決でき、
発明の効果の欄で述べられている効果が得られる場合に
は、この構成要件が削除された構成が発明として抽出さ
れ得る。
【0085】
【発明の効果】以上、詳述したように、この発明によれ
ば、クラスタの軸を生成する重要語やこの重要語と組み
合わせてクラスタリングを行わせるための不要語および
同義語を設定する仕組みをもつことにより、その時点で
蓄積された知識群の内容的な偏りに左右されることな
く、ユーザが意図するカテゴリ化および階層化によって
分類を実行することを可能とする。
【0086】また、クラスタリング実行時の分析条件を
保存しておき、この保存した分析条件を呼び出し、必要
に応じて、重要語、不要語および同義語を再設定して再
クラスタリングを実行できるようにすることにより、よ
り精度の高い分析を求めることを可能とし、かつ、再分
析の操作性および効率を飛躍的に向上させる。
【図面の簡単な説明】
【図1】この発明の実施形態に係る知識分析システムの
システム構成を示すブロック図。
【図2】同実施形態の知識分析システムにおける知識ク
ラスタの自動作成概念を説明するための図。
【図3】同実施形態の知識分析システムにおけるクラス
タリングの流れを示すフォローチャート。
【図4】同実施形態の知識分析システムにおけるクラス
タ一覧の表示画面(階層非表示&グラフ非表示)の一例
を示す図。
【図5】同実施形態の知識分析システムにおけるクラス
タ一覧の表示画面(階層非表示&グラフ表示)の一例を
示す図。
【図6】同実施形態の知識分析システムにおけるクラス
タ階層関係全体の表示画面(階層表示&グラフ非表示)
の一例を示す図。
【図7】同実施形態の知識分析システムにおけるクラス
タ階層関係全体の表示画面(階層表示&グラフ表示)の
一例を示す図。
【図8】同実施形態の知識分析システムにおける各クラ
スタの時系列表示画面の一例を示す図。
【図9】同実施形態の知識分析システムにおける分類一
覧の表示画面の一例を示す図。
【図10】同実施形態の知識分析システムにおける知識
データベース選択画面の一例を示す図。
【図11】同実施形態の知識分析システムにおける分析
条件指定画面の一例を示す図。
【図12】同実施形態の知識分析システムにおける分析
条件保存画面の一例を示す図。
【図13】同実施形態の知識分析システムにおける分析
条件読み込み画面の一例を示す図。
【図14】同実施形態の知識分析システムにおけるクラ
スタ編集画面の一例を示す図。
【図15】同実施形態の知識分析システムにおける再分
析条件指定画面の一例を示す図。
【図16】同実施形態の知識分析システムにおいて、知
識分析に設定した重要語、不要語および同義語を含む分
析条件を保存する手順を示すフローチャート。
【図17】同実施形態の知識分析システムにおいて、条
件設定画面の分析条件を用いて新たにクラスタリングす
る場合の処理の手順を示すフローチャート。
【図18】同実施形態の知識分析システムにおいて、再
分析条件指定画面において最上位クラスタの最大個数と
重要語、不要語および同義語のいずれかを再指定して新
たに再分析する場合の処理の手順を示すフローチャー
ト。
【図19】同実施形態の知識分析システムにより実現さ
れる知識分析の処理の流れを示すための図。
【符号の説明】
11…クライアント端末 12…サーバコンピュータ 13…LAN 111…Webブラウザ 121…Webサーバ 122…ナレッジサーバ 1211…制御モジュール 1212…ログイン管理情報 1221…登録モジュール 1222…検索モジュール 1223…クラスタリングモジュール 1224…文書データベース 1225…知識データベース 1226…中間データベース 1227…分析結果データベース
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 12/00 547 G06F 12/00 547Z (72)発明者 高知尾 勝彦 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 渥美 一彦 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 佐々木 淳哉 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 (72)発明者 島川 和典 東京都青梅市末広町2丁目9番地 株式会 社東芝青梅工場内 Fターム(参考) 5B075 KK44 ND35 NK02 NK33 NK35 NR12 PP02 PP03 PP13 PQ02 PQ46 5B082 AA09 GC04

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 複数のクライアント端末とネットワーク
    を介して接続可能に構成され、知識データベースに蓄積
    された知識に対する各クライアント端末からの分析を支
    援する知識分析システムであって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識をカテゴリ毎に定義されるクラスタ別にクラスタデー
    タベースを作成する知識分析手段とを具備し、 前記知識分析手段は、 前記クラスタデータベースの作成時に、クラスタリング
    で優先する重要語を設定する手段を有し、前記重要語を
    もとにクラスタの軸を生成するようにクラスタリングを
    実行することを特徴とする知識分析システム。
  2. 【請求項2】 前記知識分析手段は、更にクラスタリン
    グで無視する不要語を設定する手段を有し、前記重要語
    と前記不要語をもとにクラスタリングを実行することを
    特徴とする請求項1記載の知識システム。
  3. 【請求項3】 前記知識分析手段は、更にクラスタリン
    グで同じ単語として扱う同義語を設定する手段を有し、
    前記重要語と前記不要語および前記同義語の組合せによ
    ってクラスタリングを実行することを特徴とする請求項
    2記載の知識分析システム。
  4. 【請求項4】 複数のクライアント端末とネットワーク
    を介して接続可能に構成され、知識データベースに蓄積
    された知識に対する各クライアント端末からの分析を支
    援する知識分析システムであって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識を重要語、不要語、同義語の分析条件をもとにカテゴ
    リ毎に定義されるクラスタ別にクラスタデータベースを
    作成する知識分析手段とを具備し、 前記知識分析手段は、 前記クラスタデータベースの作成時に用いた前記分析条
    件を保存する手段を有することを特徴とする知識分析シ
    ステム。
  5. 【請求項5】 前記知識分析手段は、前記保存した分析
    条件を読み出し、変更を施した後の分析条件を用いて、
    新たなクラスタデータベースを作成する手段を有するこ
    とを特徴とする請求項4記載の知識分析システム。
  6. 【請求項6】 複数のクライアント端末とネットワーク
    を介して接続可能に構成され、知識データベースに蓄積
    された知識に対する各クライアント端末からの分析を支
    援する知識分析システムであって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識を重要語、不要語、同義語の分析条件をもとにカテゴ
    リ毎に定義されるクラスタ別にクラスタデータベースを
    作成する知識分析手段とを具備し、 前記知識分析手段は、 前記クラスタデータベースの作成時に用いた前記分析条
    件を取得し、前記重要語、前記不要語、前記同義語の少
    なくとも1つ以上を再設定した後の分析条件を用いて、
    クラスタデータベースを再作成して置換する手段を有す
    ることを特徴とする知識分析システム。
  7. 【請求項7】 複数のクライアント端末とネットワーク
    を介して接続可能に構成され、知識データベースに蓄積
    された知識に対する各クライアント端末からの分析を支
    援する知識分析システムにおける分析条件設定方法であ
    って、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御ステップと、 前記アクセス制御ステップによってアクセス許可された
    各クライアント端末からの知識分析に用いるクラスタデ
    ータベースであって、前記知識データベースに蓄積され
    た知識をカテゴリ毎に定義されるクラスタ別にクラスタ
    データベースを作成する知識分析ステップとを具備し、 前記知識分析ステップは、 前記クラスタデータベースの作成時に、クラスタリング
    で優先する重要語を設定する分析条件設定ステップを有
    することを特徴とする知識分析システムにおける分析条
    件設定方法。
  8. 【請求項8】 前記知識分析ステップは、更にクラスタ
    リングで無視する不要語を設定するステップを有し、前
    記重要語と前記不要語をもとにクラスタリングを実行す
    ることを特徴とする請求項7記載の知識システムにおけ
    る分析条件設定方法。
  9. 【請求項9】 前記知識分析ステップは、更にクラスタ
    リングで同じ単語として扱う同義語を設定するステップ
    を有し、前記重要語と前記不要語および前記同義語の組
    合せによってクラスタリングを実行することを特徴とす
    る請求項8記載の知識分析システムにおける分析条件設
    定方法。
  10. 【請求項10】 複数のクライアント端末とネットワー
    クを介して接続可能に構成され、知識データベースに蓄
    積された知識に対する各クライアント端末からの分析を
    支援する知識分析システムにおける分析条件保存方法で
    あって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御ステップと、 前記アクセス制御ステップによってアクセス許可された
    各クライアント端末からの知識分析に用いるクラスタデ
    ータベースであって、前記知識データベースに蓄積され
    た知識を重要語、不要語、同義語の分析条件をもとにカ
    テゴリ毎に定義されるクラスタ別にクラスタデータベー
    スを作成する知識分析ステップとを具備し、 前記知識分析ステップは、 前記クラスタデータベースの作成時に用いた前記分析条
    件を保存する分析条件保存ステップを有することを特徴
    とする知識分析システムにおける分析条件保存方法。
  11. 【請求項11】 複数のクライアント端末とネットワー
    クを介して接続可能に構成され、知識データベースに蓄
    積された知識に対する各クライアント端末からの分析を
    支援する知識分析システムにおける再分析処理方法であ
    って、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御ステップと、 前記アクセス制御ステップによってアクセス許可された
    各クライアント端末からの知識分析に用いるクラスタデ
    ータベースであって、前記知識データベースに蓄積され
    た知識を重要語、不要語、同義語の分析条件をもとにカ
    テゴリ毎に定義されるクラスタ別にクラスタデータベー
    スを作成する知識分析ステップとを具備し、 前記知識分析ステップは、 前記クラスタデータベースの作成時に用いた前記分析条
    件を取得し、前記重要語、前記不要語、前記同義語の少
    なくとも1つ以上を再設定した後の分析条件を用いて、
    クラスタデータベースを再作成して置換する再分析処理
    ステップを有することを特徴とする知識分析システムに
    おける再分析処理方法。
  12. 【請求項12】 複数のクライアント端末とネットワー
    クを介して接続可能に構成されたサーバコンピュータ
    に、知識データベースに蓄積された知識に対する各クラ
    イアント端末からの分析を支援する知識分析システムに
    おける分析条件設定機能を実現させるためのプログラム
    であって、 前記サーバコンピュータを、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識をカテゴリ毎に定義されるクラスタ別に分類するため
    のクラスタデータベースを作成する知識分析手段として
    機能させ、 前記知識分析手段に、 前記クラスタデータベースの作成時に、クラスタリング
    で優先する重要語、クラスタリングで無視する不要語お
    よびクラスタリングで同じ単語として扱う同義語を設定
    する分析条件設定手順を実行させることを特徴とするプ
    ログラム。
  13. 【請求項13】 複数のクライアント端末とネットワー
    クを介して接続可能に構成されたサーバコンピュータ
    に、知識データベースに蓄積された知識に対する各クラ
    イアント端末からの分析を支援する知識分析システムに
    おける分析条件保存機能を実現させるためのプログラム
    であって、 前記サーバコンピュータを、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識を重要語、不要語、同義語の分析条件をもとにカテゴ
    リ毎に定義されるクラスタ別にクラスタデータベースを
    作成する知識分析手段として機能させ、 前記知識分析手段に、 前記クラスタデータベースの作成時に用いた前記分析条
    件を保存する分析条件保存手順を実行させることを特徴
    とするプログラム。
  14. 【請求項14】 複数のクライアント端末とネットワー
    クを介して接続可能に構成され、知識データベースに蓄
    積された知識に対する各クライアント端末からの分析を
    支援する知識分析システムにおける再分析処理機能を実
    現させるためのプログラムであって、 前記クライアント端末からの知識分析を許可するため
    に、アクセス要求元のクライアント端末に対してユーザ
    認証を行うアクセス制御手段と、 前記アクセス制御手段によってアクセス許可された各ク
    ライアント端末からの知識分析に用いるクラスタデータ
    ベースであって、前記知識データベースに蓄積された知
    識を重要語、不要語、同義語の分析条件をもとにカテゴ
    リ毎に定義されるクラスタ別にクラスタデータベースを
    作成する知識分析手段として機能させ、 前記知識分析手段に、 前記クラスタデータベースの作成時に用いた前記分析条
    件を取得し、前記重要語、前記不要語、前記同義語の少
    なくとも1つ以上を再設定した後の分析条件を用いて、
    クラスタデータベースを再作成して置換する再分析処理
    手順を実行させることを特徴とするプログラム。
JP2001229500A 2001-07-30 2001-07-30 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法 Pending JP2003044491A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001229500A JP2003044491A (ja) 2001-07-30 2001-07-30 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法
US10/083,563 US6895397B2 (en) 2001-07-30 2002-02-27 Knowledge analysis system, knowledge analysis method, and knowledge analysis program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001229500A JP2003044491A (ja) 2001-07-30 2001-07-30 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法

Publications (1)

Publication Number Publication Date
JP2003044491A true JP2003044491A (ja) 2003-02-14

Family

ID=19061839

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001229500A Pending JP2003044491A (ja) 2001-07-30 2001-07-30 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法

Country Status (2)

Country Link
US (1) US6895397B2 (ja)
JP (1) JP2003044491A (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100363A (ja) * 2003-08-14 2005-04-14 Internatl Business Mach Corp <Ibm> オンラインならびにオフラインのコンポーネントを介した進展しているデータ・ストリームのクラスタリングのための方法および装置
JP2005165767A (ja) * 2003-12-03 2005-06-23 Canon Inc オブジェクト管理装置、方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP2006323627A (ja) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd 分類リスト作成支援システムおよび分類リスト作成支援プログラム
JP2007004233A (ja) * 2005-06-21 2007-01-11 Yamatake Corp 文章分類装置、文章分類方法、およびプログラム
JP2007156848A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
JP2007156849A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
JP2009110393A (ja) * 2007-10-31 2009-05-21 Toshiba Corp データ処理装置
JP2009288999A (ja) * 2008-05-29 2009-12-10 Fujitsu Ltd まとめ上げ作業支援処理方法、装置及びプログラム
JP2018018118A (ja) * 2016-07-25 2018-02-01 株式会社Screenホールディングス テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003044491A (ja) * 2001-07-30 2003-02-14 Toshiba Corp 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法
JP2003283545A (ja) * 2002-03-22 2003-10-03 Toshiba Corp 通信システム及び通信システムのコネクション制御方法
US7617176B2 (en) * 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7644373B2 (en) * 2006-01-23 2010-01-05 Microsoft Corporation User interface for viewing clusters of images
US20070209025A1 (en) * 2006-01-25 2007-09-06 Microsoft Corporation User interface for viewing images
US7836050B2 (en) * 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
US7814040B1 (en) 2006-01-31 2010-10-12 The Research Foundation Of State University Of New York System and method for image annotation and multi-modal image retrieval using probabilistic semantic models
US7707208B2 (en) * 2006-10-10 2010-04-27 Microsoft Corporation Identifying sight for a location
US7657504B2 (en) * 2006-10-10 2010-02-02 Microsoft Corporation User interface for displaying images of sights
US7552114B2 (en) * 2007-03-07 2009-06-23 International Business Machines Corporation System, and method for interactive browsing
US9363143B2 (en) * 2008-03-27 2016-06-07 International Business Machines Corporation Selective computation using analytic functions
US20090248722A1 (en) * 2008-03-27 2009-10-01 International Business Machines Corporation Clustering analytic functions
US8255914B1 (en) * 2008-09-25 2012-08-28 Emc Corporation Information retrieval techniques involving the use of prioritized object requests
US8560544B2 (en) * 2010-09-15 2013-10-15 International Business Machines Corporation Clustering of analytic functions
US8346772B2 (en) * 2010-09-16 2013-01-01 International Business Machines Corporation Systems and methods for interactive clustering
US11068532B2 (en) 2011-09-21 2021-07-20 Horsetooth Ventures, LLC Interactive image display and selection system
US9734167B2 (en) 2011-09-21 2017-08-15 Horsetooth Ventures, LLC Interactive image display and selection system
CN102314519B (zh) * 2011-10-11 2012-12-19 中国软件与技术服务股份有限公司 一种基于公安领域知识本体模型的信息搜索方法
US9141882B1 (en) 2012-10-19 2015-09-22 Networked Insights, Llc Clustering of text units using dimensionality reduction of multi-dimensional arrays
US9946971B1 (en) * 2013-12-20 2018-04-17 Massachusetts Mutual Life Insurance Company Method for the management of artifacts in knowledge ecosystems
US10536357B2 (en) * 2015-06-05 2020-01-14 Cisco Technology, Inc. Late data detection in data center
US10142353B2 (en) 2015-06-05 2018-11-27 Cisco Technology, Inc. System for monitoring and managing datacenters

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6206829B1 (en) * 1996-07-12 2001-03-27 First Opinion Corporation Computerized medical diagnostic and treatment advice system including network access
US6651058B1 (en) * 1999-11-15 2003-11-18 International Business Machines Corporation System and method of automatic discovery of terms in a document that are relevant to a given target topic
US6721726B1 (en) * 2000-03-08 2004-04-13 Accenture Llp Knowledge management tool
US6727927B1 (en) * 2000-03-08 2004-04-27 Accenture Llp System, method and article of manufacture for a user interface for a knowledge management tool
JP2003044491A (ja) * 2001-07-30 2003-02-14 Toshiba Corp 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005100363A (ja) * 2003-08-14 2005-04-14 Internatl Business Mach Corp <Ibm> オンラインならびにオフラインのコンポーネントを介した進展しているデータ・ストリームのクラスタリングのための方法および装置
JP2005165767A (ja) * 2003-12-03 2005-06-23 Canon Inc オブジェクト管理装置、方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP4630538B2 (ja) * 2003-12-03 2011-02-09 キヤノン株式会社 情報処理装置、情報処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体
JP4490871B2 (ja) * 2005-05-19 2010-06-30 株式会社 日立東日本ソリューションズ 分類リスト作成支援システムおよび分類リスト作成支援プログラム
JP2006323627A (ja) * 2005-05-19 2006-11-30 Hitachi East Japan Solutions Ltd 分類リスト作成支援システムおよび分類リスト作成支援プログラム
JP2007004233A (ja) * 2005-06-21 2007-01-11 Yamatake Corp 文章分類装置、文章分類方法、およびプログラム
JP2007156848A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
JP2007156849A (ja) * 2005-12-06 2007-06-21 Sony Corp 画像管理装置および画像表示装置
US8009919B2 (en) 2005-12-06 2011-08-30 Sony Corporation Image managing apparatus and image display apparatus
US8073265B2 (en) 2005-12-06 2011-12-06 Sony Corporation Image managing apparatus and image display apparatus
JP2009110393A (ja) * 2007-10-31 2009-05-21 Toshiba Corp データ処理装置
JP2009288999A (ja) * 2008-05-29 2009-12-10 Fujitsu Ltd まとめ上げ作業支援処理方法、装置及びプログラム
JP2018018118A (ja) * 2016-07-25 2018-02-01 株式会社Screenホールディングス テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
WO2018020842A1 (ja) * 2016-07-25 2018-02-01 株式会社Screenホールディングス テキストマイニング方法、テキストマイニングプログラム、および、テキストマイニング装置
KR20190018480A (ko) * 2016-07-25 2019-02-22 가부시키가이샤 스크린 홀딩스 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치
CN109478191A (zh) * 2016-07-25 2019-03-15 株式会社斯库林集团 文本挖掘方法、文本挖掘程序及文本挖掘装置
KR102180487B1 (ko) * 2016-07-25 2020-11-18 가부시키가이샤 스크린 홀딩스 텍스트 마이닝 방법, 텍스트 마이닝 프로그램, 및 텍스트 마이닝 장치
CN109478191B (zh) * 2016-07-25 2022-04-08 株式会社斯库林集团 文本挖掘方法、记录介质及文本挖掘装置

Also Published As

Publication number Publication date
US20030023600A1 (en) 2003-01-30
US6895397B2 (en) 2005-05-17

Similar Documents

Publication Publication Date Title
JP2003044491A (ja) 知識分析システムならびに同システムにおける分析条件設定方法、分析条件保存方法および再分析処理方法
US20220164401A1 (en) Systems and methods for dynamically creating hyperlinks associated with relevant multimedia content
US9659071B2 (en) Patent mapping
US7610279B2 (en) Filtering context-sensitive search results
JP2009238241A (ja) データベースのデータを検索するための方法と装置
WO2007113546A1 (en) Ranking of entities associated with stored content
CN113544689A (zh) 为文档的来源观点生成并提供附加内容
JPWO2004081822A1 (ja) キーワードを利用したデータの登録、検索を支援する装置
AU2013270517B2 (en) Patent mapping
EP1774432A2 (en) Patent mapping
JP2003196294A (ja) 知識分析システムおよび知識分析方法
KR100862565B1 (ko) 사용자 맞춤형 특허정보 데이터베이스 구축시스템
JP2003044490A (ja) 知識分析システムおよび同システムにおける知識重複登録設定方法
JP2003044331A (ja) 知識分析システム、クラスタデータベース表示方法および表示制御プログラム
JPH10228488A (ja) 情報検索収集方法およびそのシステム
JP2003044486A (ja) 知識分析システム、クラスタ管理方法およびクラスタ管理プログラム
JPH10162011A (ja) 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
JP2003044485A (ja) 知識分析システムおよび同システムにおける最上位クラスタの最大個数設定方法
JANKOWSKA QUALITY MEASURING WITH RESPECT TO ELECTRONIC INFORMATION MARKETS AND PARTICULARLY ONLINE DATABASES
JP2005092370A (ja) 情報管理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070619

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070925

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071126

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071218