JP2002014971A - 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体 - Google Patents

指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体

Info

Publication number
JP2002014971A
JP2002014971A JP2000198997A JP2000198997A JP2002014971A JP 2002014971 A JP2002014971 A JP 2002014971A JP 2000198997 A JP2000198997 A JP 2000198997A JP 2000198997 A JP2000198997 A JP 2000198997A JP 2002014971 A JP2002014971 A JP 2002014971A
Authority
JP
Japan
Prior art keywords
word
related person
document
designated
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000198997A
Other languages
English (en)
Other versions
JP3722672B2 (ja
Inventor
Masashi Okigami
昌史 沖上
Akira Hamada
明 濱田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2000198997A priority Critical patent/JP3722672B2/ja
Publication of JP2002014971A publication Critical patent/JP2002014971A/ja
Application granted granted Critical
Publication of JP3722672B2 publication Critical patent/JP3722672B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 複数人数から構成される組織において,知識
や情報に詳しい人物を特定しようと,所望の知識や情報
に関係する用語を用いて文書ファイルを検索しても,そ
の検索結果から,所定の知識や情報に対して見識の深い
人物を判断することは困難であった。 【解決手段】 本発明は,単語や分野を指定されると,
当該単語や分野に関係付けられた単語関係者とその度数
とを表示し得るようにすることによって,検索の結果特
定された単語関係者を前記度数により判断させることを
図ったものである。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は,文書に含まれる単
語から,ある知識や情報に詳しい人物を抽出する指定単
語関係者情報抽出装置,及び指定単語関係者情報抽出プ
ログラムに関するものである。
【0002】
【従来の技術】多人数で共同して作業を行っていれば,
全体としてはそこに多くの知識や情報が蓄積されている
はずである。ところが,それらの知識や情報が,集約的
に管理されることは少なく,個人又は小さなグループが
断片的に保持していることが多い。特に知識や情報の専
門性が増すと,すぐ近くで作業していながら,その知識
や情報が蓄積されていることすら,周辺の人にわからな
い場合も生じてくる。その場合には,折角近くに知識や
情報に詳しい人がいる場合でも,その人から効率的に知
識や情報を得たり,その人に合った作業を任せたりする
ことも難しくなってしまう。このような状況は,コンピ
ュータネットワークが活用されるようになって,少なく
なりつつある。各個人が作成した文書ファイルをデータ
ベース化しておき,知識や情報に関係する特定の用語で
もって,これらの文書ファイルを検索し得るように構成
しておけば,所望する知識や情報が蓄積されているか否
かなどを比較的簡単に把握することができるようになっ
た。文書ファイルの所有者や作成・編集者を確認すれ
ば,当該知識や情報に詳しい人の情報も得ることができ
るかもしれない。
【0003】
【発明が解決しようとする課題】しかしながら,多数の
文書ファイルが蓄積されるようになると,知識や情報に
関係する特定の用語でもって,当該知識や情報を記載し
た文書ファイルを検索しようとしても,ノイズが多くな
り,適切な文書ファイル,さらにはその文書ファイルの
所有者や作成・編集者を見つけることが難しくなる。ま
た,特定の用語が記載された文書ファイルが検索されて
も,その検索結果から,所望の知識や情報に対する見識
の深い人物を判断することは,実際には難しい場合が多
かった。本発明は,このような従来の技術における課題
を鑑みてなされたものであり,単語や分野を指定するこ
とによって,所望の知識や情報に詳しい人物をその詳し
さが判断し得るように検索することができる指定単語関
係者情報抽出装置,及び指定単語関係者情報抽出プログ
ラムを記録したコンピュータ読み取り可能な記録媒体に
関するものである。
【0004】
【発明が解決しようとする課題】上述の目的を達成する
ために,本発明は,予め設定した設定単語を文書から抽
出する設定単語抽出手段と,前記設定単語抽出手段によ
り抽出された前記設定単語に関係がある単語関係者を前
記文書から特定する単語関係者特定手段と,前記設定単
語抽出手段により抽出された各設定単語が,前記単語関
係者特定手段により特定された各単語関係者に関係付け
られた度数を集計する度数集計手段と,前記度数集計手
段により集計された各設定単語の前記単語関係者別の度
数を記憶する度数記憶手段を検索して,指定された前記
設定単語に関係付けられた前記単語関係者と前記度数を
抽出する指定単語関係者抽出手段と,前記指定単語関係
者抽出手段により抽出された前記単語関係者と前記度数
とを出力する指定単語関係者出力手段と,を具備してな
る指定単語関係者情報抽出装置として構成されている。
本発明では,まず予め設定した設定単語が文書から抽出
される。この際,抽出した設定単語に関係がある単語関
係者が,前記文書から特定される。その結果,様々な設
定単語と単語関係者とが関係付けられる。次に,各設定
単語が各単語関係者に関係付けられた度数が集計され
る。この状態で,ある設定単語を指定した上で検索が指
示されると,前記集計の結果を用いて,指定された前記
設定単語に関係付けられた前記単語関係者と前記度数と
が抽出される。前記度数は指定された前記設定単語が前
記単語関係者の関係した文書でどれだけ多く用いられた
かを表しており,前記単語関係者の前記設定単語に係る
知識や情報の詳しさにほぼ対応する。このため,複数の
前記単語関係者が検索結果として出力されたとしても,
利用者は,前記度数を指標として前記設定単語に係る知
識や情報に詳しい前記単語関係者を容易に判断すること
ができる。
【0005】さらに,前記指定単語関係者情報抽出装置
において,前記設定単語を抽出した文書を指し示す文書
指示情報を,各設定単語と各単語関係者とに対応付けて
記憶する文書指示情報記憶手段を具備し,前記指定単語
関係者抽出手段が,前記指定された前記設定単語に関係
付けられた前記単語関係者を抽出してから,前記指定さ
れた前記設定単語と前記抽出した前記単語関係者とを用
いて,前記文書指示情報記憶手段を検索して,前記抽出
した前記単語関係者が関係付けられた前記指定された前
記設定単語を抽出した文書を指し示す前記文書指示情報
も抽出し,前記指定単語関係者出力手段が,前記指定単
語関係者抽出手段により抽出された前記文書指示情報も
出力すれば,指定した設定単語に詳しい単語関係者を容
易に判断できるだけでなく,当該単語関係者が当該設定
単語を用いた様々な文書を指し示す文書指示情報を得る
ことができる。このため,利用者は,検索された単語関
係者に直接尋ねなくても,前記文書指示情報に従って,
必要な知識や情報を得ることができる可能性の高い文書
を特定することができる。
【0006】さらに,前記指定単語関係者情報抽出装置
において,前記設定単語を分類する設定単語分類と前記
設定単語との対応関係を記憶した設定単語分類記憶手段
を具備し,前記度数抽出手段が,前記設定単語分類記憶
手段に記憶された前記対応関係と各設定単語の前記単語
関係者別の度数を用いて,前記単語関係者が各設定単語
分類に属する設定単語と関係付けられた分類計度数と前
記単語関係者が各設定単語に関係付けられた総計度数と
の比率を各設定単語分類について前記単語関係者別に求
めて,前記度数記憶手段に記憶し,前記設定単語に代わ
って前記設定単語分類が指定された場合に,前記指定単
語関係者抽出手段が,前記指定された前記設定単語分類
と前記比率とに基づいて前記度数記憶手段を検索して,
前記指定された前記設定単語分類に関係がある前記単語
関係者を抽出し,前記指定単語関係者出力手段が,前記
指定された前記設定単語分類に関係がある前記単語関係
者と前記比率とを出力すれば,前記設定単語を分類する
設定単語分類を指定して検索が行われた場合にも,前記
設定単語分類に関係の深い単語関係者を容易に検索する
ことができる。前記設定単語分類は,前記設定単語より
も広い範囲の概念を含むものであり,前記設定単語ほど
流動的でないから,前記設定単語を知らなかったり,指
定した単語が前記設定単語に含まれていない場合でも,
前記比率を基準にして利用者が求めるのに近い知識や情
報に詳しい人物を容易に抽出することができる。
【0007】さらに,前記指定単語関係者情報抽出装置
において,前記設定単語抽出手段が,文書から切り出し
た単語を,前記設定単語を格納した設定単語辞書と前記
設定単語以外の予め知られた一般単語を格納した一般単
語辞書とを参照しながら,前記一般単語か前記設定単語
かに分類して,前記設定単語を抽出するものであって,
前記一般単語にも前記設定単語にも分類されない未知の
単語が前記文書から切り出された場合には,当該単語を
前記設定単語辞書に格納すれば,新たに生まれてくる単
語を設定単語として登録する作業負担が軽減される。さ
らに,前記指定単語関係者情報抽出装置において,前記
設定単語辞書に新たに前記未知の単語が格納された場合
に,前記度数記憶手段に各設定単語の前記単語関係者別
の度数を記憶するのにこれまで用いた文書について,前
記設定単語抽出手段が,前記未知の単語を抽出し,前記
単語関係者特定手段が,前記未知の単語に関係がある単
語関係者を特定し,前記度数集計手段が,前記未知の単
語が各単語関係者に関係付けられた度数を集計すれば,
新たに登録された設定単語についても,それまでに登録
されている設定単語と同様に,単語関係者を抽出するこ
とができる。さらに,前記指定単語関係者情報抽出装置
において,画像データ中から文字を認識する文字認識手
段を備え,前記文書を,前記文字認識手段により認識さ
れた文字から構成し得るようにすることによって,単語
関係者を抽出するための資源をより豊かにすることがで
きる。
【0008】さらに,前記指定単語関係者情報抽出装置
において,ネットワーク上で通信されている文書を取得
するネットワーク上文書取得手段を具備すれば,意図的
に文書を与える必要性が軽減される。さらに,前記ネッ
トワーク上文書取得手段を具備する場合において,前記
ネットワーク上文書取得手段が,前記文書がクラアイン
トから送信された場合にのみ,当該文書の取得を行え
ば,クライアントからサーバに送られた後,サーバから
他のホストに転送されるような場合でも,同じ文書につ
いて前記集計を重複して行うことが防止される。さら
に,前記指定単語関係者抽出手段が,ネットワークに接
続された複数の前記度数記憶手段を検索して,指定され
た前記設定単語に関係付けられた前記単語関係者と前記
度数を抽出すれば,比較的身近い単語関係者だけでな
く,より多くの単語関係者の中から所望の知識や情報に
詳しいと予想される単語関係者を抽出することができ
る。さらに,前記ネットワーク上文書取得手段が,前記
文書を発信した発信元を取得し,取得した前記発信元が
定められたグループ内に属している場合にのみ,当該文
書の取得を行えば,複数の前記指定単語関係者情報抽出
装置がネットワークに接続されている場合に,各指定単
語関係者情報抽出装置の集計処理が重複してしまう恐れ
がなく,また複数の前記度数記憶手段を検索したとき
も,単語関係者の所在を容易に把握することができる。
また,指定単語関係者情報抽出プログラムを記録したコ
ンピュータ読み取り可能な記録媒体を用いれば,上述の
ような各装置をコンピュータを用いて実現することがで
きる。
【0009】
【発明の実施の形態】以下,添付図面を参照して,本発
明の実施の形態につき説明し,本発明の理解に供する。
尚,以下の実施の形態は,本発明の好適な具体例であっ
て,本発明の技術的範囲を限定する性格のものではな
い。ここに,図1は本発明の実施の形態に係る指定単語
関係者情報抽出装置,及びそれに用いるコンピュータの
概略構成を示す図,図2は前記指定単語関係者情報抽出
装置が接続されるネットワークの接続構成を示す図であ
る。本発明の実施の形態に係る指定単語関係者情報抽出
装置は,例えばユーザI/F装置1,演算処理部2,記
憶部3,通信部4などの一般的な構成を有するコンピュ
ータ5を用いて具体化される。コンピュータ5における
前記演算処理部2は,プログラムの制御に従って,専門
語抽出部(設定単語抽出手段に対応)21,使用者特定
部(単語関係者特定手段に対応)22,集計部(度数集
計手段に対応)23,検索部(指定単語関係者抽出手段
に対応)24,文字認識部(文字認識手段に対応)2
5,ネットワークモニタ(ネットワーク上文書取得手
段)26などとして動作する。また,コンピュータ5に
おける前記記憶部3には,使用者別単語データベース
(度数記憶手段に対応)31,専門分野データベース
(設定単語分類記憶手段に対応)32,文書データベー
ス(文書指示情報記憶手段に対応)33などが構築され
る。そして,前記演算処理部2を制御し,前記記憶部3
に各データベースを構築しそれらを管理するプログラム
が,本発明に係る使用単語関係者情報抽出プログラムに
対応する。前記コンピュータ5の各構成について説明す
ると,前記ユーザI/F装置1は,例えばキーボード,
マウス,ディスプレイなど,利用者が,前記コンピュー
タ5を操作したり,前記コンピュータ5の処理結果を確
認するのに用いるものである。前記ユーザI/F装置1
のうち,前記コンピュータ5の処理結果を確認するため
の,ディスプレイや,プリンタなどの出力装置は,本発
明に係る指定単語関係者出力手段として用いられる。
【0010】前記演算処理部2は,例えば前記コンピュ
ータ5のCPUとして動作するマイクロプロセッサであ
る。前記マイクロプロセッサには,各種演算処理の際に
用いられるメモリが接続される。前記プログラムの待機
時,動作時には,前記プログラムは,前記メモリに読み
込まれ,前記マイクロプセッサを制御する。前記コンピ
ュータ5は,ある知識や情報に詳しい人物を専門語から
検索するサービスを提供するサーバとして動作し,前記
プログラムは,通常前記コンピュータ5の起動時に動作
するよう設定される。前記プログラムが,前記メモリに
読み込まれる前に格納されているのは,ハードディスク
ドライブなどの記憶装置である。この記憶装置には,前
記各種データベースが構築される前記記憶部3と同じハ
ードウェアを用いてもよいし,別個にしてもよい。前記
ハードディスクに前記プログラムを導入するために,C
D−ROMや,DVD−ROMなどのコンピュータ読み
取り可能な記録媒体が用いられる。例えば圧縮された状
態で前記CD−ROMに格納されている前記プログラム
を,前記CD−ROMに実行可能な状態で格納されてい
るセットアッププログラムを動作させることによって,
前記ハードディスクに前記プログラムが実行可能な状態
で導入するのである。このCD−ROMなどのコンピュ
ータ読み取り可能な記録媒体が,本発明に係る指定単語
関係者情報抽出プログラムを記録したコンピュータ読み
取り可能な記録媒体の具体例である。前記記憶部3は,
ハードディスクドライブなどの記憶装置である。前記記
憶部3上に,前記使用者別単語データベース31,専門
分野データベース32,文書データベース33を構築す
ることができれば,特にハードディスクドライブに限ら
れるものではないが,比較的大容量で高速動作が可能な
ものが好ましい。前記通信部4は,他のコンピュータと
通信するために用いるNICなどである。前記コンピュ
ータ5が接続されるネットワークの接続構成例を図2に
示す。
【0011】図2に示すネットワークでは,第1部門の
LAN,第2部門のLAN,管理部門のLANが,互い
にルータ6を介して接続されている。前記コンピュータ
5は,例えば前記第1部門のLANや,前記第2部門の
LANなどに,前記通信部4を用いてそれぞれ接続され
る。前記第1部門のLANや,前記第2部門のLANに
は,前記コンピュータ5の他,前記コンピュータ5をサ
ーバとしたときにそのクライアントとなるコンピュータ
7や,メールサーバ8,ネットワークプリンタ9,ネッ
トワークスキャナ10などが接続される。前記第1部門
のLANや,前記第2部門のLANに接続されるコンピ
ュータ5では,文書を管理する文書管理サーバ27も動
作している。前記第1部門のLANや,前記第2部門の
LANにそれぞれ接続された前記コンピュータ7などか
ら入力された文書ファイルは,前記コンピュータ5の前
記記憶部3内に蓄積され,前記文書管理サーバ27によ
って管理される。また,前記管理部門のLANにも,前
記コンピュータ5上で動作するサーバと類似のサーバと
して動作するコンピュータ5’が設置されている。前記
管理部門のLANには,前記コンピュータ5’の他,前
記コンピュータ5’をサーバとしたときにそのクライア
ントとなるコンピュータ7や,ネットワークプリンタ
9,ファックスサーバ11,外部のネットワークに対す
るファイアウォールとなるサーバ12などが接続されて
いる。
【0012】以下,前記指定単語関係者情報抽出装置の
詳細,及び動作について,前記第1部門のLANに接続
された前記コンピュータ5を例にして説明する。まず説
明するのが,前記コンピュータ5の前記記憶部3に前記
使用者別データベース31や前記専門分野データベース
32を構築するまでの詳細,及び動作である。前記コン
ピュータ5では,前記通信部4を介して,前記第1部門
のLANに接続された前記コンピュータ7にある文書フ
ァイルや,前記第1部門のLANに流れる文書ファイ
ル,或いは文書のイメージファイルなどが取り込まれ
る。前記ネットワークモニタ26は,前記通信部4が接
続されるネットワークを流れる文書ファイルや,文書の
イメージファイルなどを取得するためのものである。前
記通信部4が取得したものが文書ファイルに関するパケ
ットであれば,前記ネットワークモニタ26は,前記文
書ファイルに関する各パケットのデータロード部から文
字コードを抽出して,文書ファイル(文書データ自体や
当該ファイルの作成・編集者などを表す情報を含む前記
文書データの付随情報)を再構成する。再構成された文
書ファイルは,専門語抽出部21や,使用者特定部2
2,文書管理サーバ27などに出力される。前記文書フ
ァイルに関するパケットは,例えば前記コンピュータ7
で作成された文書ファイルを前記コンピュータ5の前記
記憶部3に格納しようとする場合や,前記コンピュータ
7で作成されたメールを前記メールサーバ8にスプール
しようとする場合などに,前記第1部門のLANに流れ
たパケットである。前記通信部4が取得したものが文書
のイメージファイルに関するパケットであれば,前記ネ
ットワークモニタ26は,前記イメージファイルに関す
る各パケットのデータロード部からイメージデータを抽
出して,前記イメージファイル(イメージデータ自体や
当該イメージデータの作成・編集者を表す情報などの付
随情報)を再構成する。再構成された前記イメージファ
イルは,前記文字認識部25,及び使用者特定部22に
出力される。
【0013】前記イメージファイルに関するパケット
は,例えば前記コンピュータ7で作成されたイメージフ
ァイルを前記コンピュータ5の前記記憶部3に格納しよ
うとする場合や,前記コンピュータ7で作成されたイメ
ージファイルを前記ネットワークプリンタ9を用いて印
刷しようとした場合や,ネットワークスキャナ10によ
り読み込まれたイメージファイルを前記コンピュータ5
の前記記憶部3に格納しようとする場合などに,前記第
1部門のLANに流れたパケットである。前記文字認識
部25には,文字切出モジュール251,文字認識エン
ジン252,文字認識用辞書253などが備えられてお
り,前記文字認識部25に前記イメージファイルが供給
されると,前記文字切出モジュール251によって前記
イメージファイルのうち文字と想定される部分が切り出
される。前記文字認識エンジン252は,前記文字切出
モジュール251によって切り出された部分に対して,
前記文字認識用辞書253を用いながら,文字認識を行
い,イメージデータを文字コードに変換する。これによ
って,イメージファイルから文書ファイルが構築され
る。構築された文書ファイルは,専門語抽出部22や,
文書管理サーバ27に供給される。なお,前記文字認識
部25に供給されるイメージファイルは,前記ネットワ
ークモニタ26を経由したものに限られるわけではな
く,前記コンピュータ5にローカルに接続されたスキャ
ナ51などを用いて取り込まれたものでもよい。前記専
門語抽出部21は,前記ネットワークモニタ26や前記
文字認識部25から供給された文書ファイルから専門語
を,前記記憶部3に格納されている一般単語辞書34や
専門語辞書35を用いながら抽出する。
【0014】一般単語辞書34,専門語辞書35の辞書
構成の具体例を,それぞれ図3(a),図3(b)に示
す。図3(a),図3(b)に示す如く,前記一般単語
辞書34や,前記専門語辞書35では,見出し語や,そ
の品詞などが,各単語を識別するためのキー毎に格納さ
れている。前記一般単語辞書34には,例えば図3
(a)のように,「さらに」,「ディスク」,「家
電」,「漢字」,「表現」などといった日常的に用いら
れる単語が格納される。これらの単語は,社会生活上必
要な知識があればそれほど理解に困難性がない単語など
であり,専門語でない単語の集まりとなる。また,文章
を構成する上で必要となる接続詞なども含まれる。一
方,前記専門語辞書35には,例えば図3(b)のよう
に,「EUC」,「SED/sed」,「ディスクアレ
イ」,「ユニコード」,「情報家電」,「正規表現」,
「第3水準」などといった専門語が格納される。これら
の専門語は,コンピュータや半導体など技術に関わる専
門語であったり,絵画や音楽など芸術に関わる専門語で
あったり,日常的に用いられることが少ない専門的な知
識として要求される単語である。この専門語は,利用者
が所望する専門知識を考慮して予め設定される。前記専
門語抽出部21は,前記一般単語辞書34や前記専門語
辞書35を用い,形態素解析などを行いながら,前記文
書ファイルから前記専門語辞書35に格納されている専
門語,又は前記一般単語辞書34,及び前記専門語辞書
35のいずれにも格納されていない未知語を抽出する。
本実施の形態においては,前記未知語が抽出されると,
当該未知語は前記専門語辞書35に格納される。すなわ
ち,前記未知語は,自動的に専門語であるとみなされ
る。これによって,新たに生まれてくる単語を専門語と
して登録する作業負担が軽減される。前記使用者特定部
22は,前記専門語抽出部21により専門語が抽出され
ている文書ファイル,或いはその元になったイメージフ
ァイルから当該ファイルの作成・編集者や所有者など,
当該ファイル,すなわち前記専門語抽出部21により抽
出されている専門語に関係がある使用者(単語関係者に
対応)を特定する。前記専門語抽出部21により抽出さ
れた前記専門語と,前記使用者特定部22により特定さ
れた使用者は対応付けられた状態で,前記記憶部3に格
納される。
【0015】前記集計部23は,前記記憶部3に格納さ
れた前記専門語と前記使用者との対応関係を参照しなが
ら,前記専門語抽出部21により抽出された各専門語
が,前記使用者特定部22により特定された各使用者に
関係付けられた度数を集計して,前記記憶部3に使用者
別単語データベース31を構築する。前記集計部23に
より前記記憶部3に構築される前記使用者別単語データ
ベース31の具体例を,図4に示す。図4に示す如く,
前記使用者別単語データベース31のキーは,専門語或
いはそれに代わるものによって与えられる。各専門語に
対して,「田中」,「高橋」,「中村」といった各使用
者毎に,各専門語と各使用者とが文書ファイルやイメー
ジファイルによって対応付けられた度数が集計されてい
る。例えば図4の例では,「ミラーディスク」という専
門語は,「田中」によって180回,「高橋」によって
18回,「中村」によって8回用いられていることが表
されている。また,「EUC」という専門語は,「田
中」によって8回,「高橋」によって149回,「中
村」によって100回用いられていることが表されてい
る。さらに,「正規表現」という専門語は,「田中」に
よって6回,「高橋」によって18回,「中村」によっ
て116回用いられていることが表されている。前記使
用者別単語データベース31を構築するにあたって,前
記記憶部3に格納される前記専門語と前記使用者との対
応関係は,例えば使用者が「田中」である文書ファイル
において,「ミラーディスク」という専門語が4回,
「RAID」という専門語が5回抽出されたというよう
なものである。前記集計部23は,このような前記対応
関係をもとに,「ミラーディスク」という専門語に対し
て,使用者「田中」の度数を4増加させ,「RAID」
という専門語に対して,使用者「田中」の度数を5増加
させるなどして,前記使用者別単語データベース31を
構築する。また,前記専門語抽出部21,及び使用者特
定部22によって,ある文書ファイルについて,前記専
門語と前記使用者との対応関係が定められたとき,前記
文書管理サーバ27は,前記文書ファイルやイメージフ
ァイルのデータや付随情報に含まれる前記文書ファイル
やイメージファイルを指し示す原典ポインタ(文書指示
情報に対応)を抽出すると共に,前記ネットワークモニ
タ26から各パケットが発生したLANを識別する部門
IDを抽出し,例えば図5に示すような,文書データベ
ース33を構築する。
【0016】前記文書データベース33では,前記専門
語に,部門IDや,使用者,原典ポインタが対応付けら
れた状態で格納される。例えば「ディスクアレイ」とい
う専門語については,第1部門,使用者「田中」,原典
ポインタ「週報1999/02/18」という対応関係
が格納される。前記文書データベース33には,このよ
うな構造のデータベースの他,前記文書ファイル自体が
格納されることもある。前記記憶部3に構築されるデー
タベースのうち,残りの専門分野データベース32は,
例えば図6に示すような専門語と専門分野とについて予
め定められた対応関係が登録されたものである。図6の
例では,「HDD分散多重化」という専門分野(設定単
語分類)には,「RAID」,「ディスクアレイ」,
「ミラーディスク」といった専門語が分類されている。
また,「文字コード標準化」という専門分野には,「E
UC」,「シフトJIS」,「ユニコード」,「第3水
準」,「補助漢字」といった専門語が分類される。前記
集計部23は,前記専門分野データベース32が存在し
ている場合には,各専門語についてだけでなく,各専門
分野についても集計を行って,前記使用者別単語データ
ベースを構築する。前記専門分野データベース32で
は,既述の通り,「RAID」,「ディスクアレイ」な
どといった専門語が「HDD分散多重化」という専門分
野に分類されている。「RAID」,「ディスクアレ
イ」などといった各専門語について各使用者別に度数が
定まっていれば,前記専門分野に分類される前記専門語
の度数を足し合わせることにより,前記専門分野に対す
る度数(分類計度数に対応)を定めることができる。
【0017】また,各使用者について度数を総計すれ
ば,各使用者が各専門語に関係付けられた総計度数が求
められる。前記集計部23は,前記分類計度数と前記総
計度数とを求めた後,前記分類計度数の前記総計度数に
対する比率,すなわち(分類計度数)/(総計度数)を
各専門分野に対して各使用者別に求める。各専門分野に
対して各使用者別に求めた前記比率の具体例を図7に示
す。例えば図7に示す如く,「HDD分散多重化」とい
う専門分野に対して,使用者「田中」の前記比率は,
「0.392」である。使用者「田中」が専門語に関係
付けられた全体の度数のうち,約4割が「HDD分散多
重化」に関するものである。また,「文字列処理」とい
う専門分野に対して,使用者「中村」の前記比率は,
「0.384」である。使用者「中村」が専門語に関係
付けられた全体の度数のうち,これも4割弱が「文字列
処理」に関するものである。このようにして,前記記憶
部3の各データベース31,32,33は構築される。
前記使用者別単語データベース31や,文書データベー
ス33は,随時更新されることが好ましい。前記度数の
大きさが増すと,それだけ専門知識の深さや経験の多さ
と前記度数との対応関係が明確になるし,新たな人物が
加わったり,未知語が増えても対応が可能となるからで
ある。これに比べると,前記専門語データベース32を
更新する頻度は少なくてよい。前記専門分野と前記専門
語との対応関係はある程度安定しており,未知語が現れ
たり,用法が変わった場合に更新するようにすればよ
い。なお,ある文書ファイルにおいて未知語が抽出され
た場合には,前記文書データベース33などに格納され
ている,前記使用者別単語データベース31を構築する
のにこれまで用いた文書ファイルについても,専門語抽
出部21により当該未知語を抽出し,前記使用者特定部
22により使用者を特定して,当該未知語と使用者との
対応関係を定め,前記集計部23により集計処理を行う
ことが好ましい。例えば「情報家電」という単語は,最
近生まれたものであるが,この単語を構成する「情
報」,及び「家電」という単語は,前記一般単語辞書3
4に格納されているものである。このため,「情報家
電」という単語が含まれているにも関わらず,専門語や
未知語であると認識されていない場合があることも考え
られる。このような場合には,「情報家電」を専門語と
して登録した後,再度これまでの文書ファイルについて
集計処理を行うことで,前記度数と専門知識の深さや経
験の多さとの対応関係をより明確にすることができる。
【0018】次に,利用者が,専門語や専門分野を指定
して検索を行う場合の前記コンピュータ5の動作につい
て説明する。利用者は,前記ユーザI/F装置1のキー
ボードやマウスなどを用いながら,利用者が所望する専
門知識や経験に関する情報に対応した専門語を入力す
る。利用者によって入力された専門語は,前記検索部2
4に供給される。専門語が供給されると,前記検索部2
4は,前記使用者別単語データベース31の検索を行
う。前記使用者別単語データベース31に対して,供給
された専門語と一致する,又は類似する専門語を探索
し,専門語と一致する,又は類似する専門語が探索され
たら,それに関係付けられた使用者を抽出するのであ
る。例えば利用者によって「PERL」という専門語が
指定された場合には,前記検索部24は,…,使用者
「田中」0回,…,使用者「高橋」15回,使用者「中
村」163回,…という検索結果を得る(図4参照)。
前記検索結果が得られると,例えば図8に示すように,
前記度数の多い順に前記検索結果をソートしてから,前
記ユーザI/F装置1のディスプレイにその結果を表示
させる。この場合,前記ユーザI/F装置1のディスプ
レイに表示されるのは,使用者「中村」163回,…使
用者「高橋」15回,…,使用者「田中」0回,…とい
う結果である。この結果を参照すれば,専門知識が深か
ったり経験が多いのは,使用者「中村」である可能性が
高いことを,利用者は容易に理解することができる。利
用者は,使用者「中村」に直接尋ねるなどすれば,高い
確率で所望の知識や情報などを得ることができる。
【0019】ただし,特定した使用者の都合などによっ
て直接尋ねることができない場合も考えられるし,使用
者だけでなく,使用者が専門語を使用した文書ファイル
自体の所在を知りたい場合もある。この場合には,利用
者は,専門語を指定する際に,前記ユーザI/F装置1
を用いて,文書ファイル自体の所在が知りたいことを予
め指定しておく。文書ファイル自体の所在が知りたいか
否かを選択する二者択一が可能なオブジェクトを検索画
面などに表示するようにしておけばよい。専門語を指定
する際に,利用者によって文書ファイル自体の所在が知
りたいということが指定されている場合には,専門語に
よって特定された使用者と,専門語とを用いて,前記検
索部24により,前記文書データベース33が検索され
る。前記文書データベース33には,既に図5を用いて
示した通り,専門語に対応付けられて,使用者や原典ポ
インタが記憶されているから,特定された使用者と,専
門語とを用いれば,それにあった原典ポインタを抽出す
ることができる。そして,例えば使用者「田中」が「デ
ィスクアレイ」という専門語を使用した文書ファイルの
原典が「週報1999/02/18」であることが,前
記ユーザI/F装置1のディスプレイに表示される。利
用者は,この原典ポインタを参考にして,前記文書ファ
イル自体の所在を容易に把握することができ,特定した
使用者に直接知識や情報を尋ねる必要性も少なくなる。
また,利用者がそれほど専門語を知らない場合には,専
門分野を用いて検索を行うことも可能である。専門分野
の概念は,各専門語よりも広く,専門語の数よりも専門
分野の数の方がかなり少なくなるため,「HDD分散多
重化」といった専門分野を利用者に入力させるのではな
く,複数の専門分野を選択肢として表示し,利用者にい
ずれかを選択させるようにすることも容易である。この
場合,専門分野を規定する特定の用語を知らなくても,
言葉の意味から所望の知識や情報に近い専門分野を指定
することが可能となる。この場合,利用者は,前記ユー
ザI/F装置1のキーボードやマウスなどを用いなが
ら,利用者が所望する専門知識や経験に関する情報に対
応した専門分野を入力又は選択する。
【0020】利用者によって指定された専門分野は,前
記検索部24に供給される。専門分野が供給されると,
前記検索部24は,前記使用者別単語データベース31
の検索を行う。前記使用者別単語データベース31に対
して,供給された専門分野と一致する,又は類似する専
門分野を探索し,専門分野と一致する,又は類似する専
門分野が探索されたら,それに関係付けられた使用者を
抽出するのである。例えば利用者によって「文字コード
標準化」という専門分野が指定された場合には,前記検
索部24は,…,使用者「田中」比率0.009,…,
使用者「高橋」比率0.209,使用者「中村」比率
0.122,…という検索結果を得る(図7参照)。前
記検索結果が得られると,例えば図9に示すように,前
記比率の高い順に前記検索結果をソートしてから,前記
ユーザI/F装置1のディスプレイにその結果を表示さ
せる。この場合,前記ユーザI/F装置1のディスプレ
イに表示されるのは,使用者「高橋」比率0.209,
…使用者「中村」比率0.122,…,使用者「田中」
比率0.009,…という結果である。この結果を参照
すれば,指定した専門分野に対して,専門知識が深かっ
たり経験が多いのは,使用者「高橋」である可能性が高
いことを,利用者は容易に理解することができる。利用
者は,使用者「高橋」に直接尋ねるなどすれば,高い確
率で所望の知識や情報などを得ることができる。
【0021】なお,ネットワーク上では,同じ文書が何
回も通信されることがある。このような文書についてま
で,専門語の集計処理を行っていると,使用者が実際に
専門語を使用した回数と集計処理した回数との間に乖離
が生じてしまい,深い見識を持つ人物の判断を謝ってし
まう可能性が高くなってしまう。例えば,あるコンピュ
ータ7からメールを送信してメールサーバ8にスプール
し,スプールされた同じメールを他のコンピュータ7が
受信するような場合である。そこで,前記ネットワーク
モニタ26によって,前記文書ファイルやイメージファ
イルの発信元を取得させ,その発信元がメールサーバ8
などのサーバである場合には,文書ファイルとして取得
しない。文書ファイルがクライアントから送信されてい
る場合にのみ,前記文書ファイルの取得を行えば,同じ
文書について集計を重複して行うことが防止され,検索
結果の信頼性をより高めることができる。また,図2に
示したように,接続されたネットワーク内に複数のコン
ピュータ5,5’が配置されている場合には,あるコン
ピュータ5,5’の検索部24を用いて,当該コンピュ
ータ5,5’のデータベースに加えて,他のコンピュー
タ5,5’のデータベースを検索するようにしてもよ
い。このようにすれば,利用者と比較的身近い使用者だ
けでなく,より多くの使用者の中から所望の知識や情報
に詳しいと予想される使用者を抽出することができる。
【0022】ただし,この場合,例えば第1部門のLA
Nに配置されているコンピュータ5が第2部門のLAN
で発生した文書ファイルに対しても集計処理を行うと,
第2部門のLANに配置されているコンピュータ5も同
じ文書に対して集計処理を行うので,集計処理が重複し
て行われてしまう。集計処理が重複して行われると,複
数のコンピュータ5,5’に対して検索を行った場合
に,検索結果として出力される度数と,使用者の知識や
情報との相関関係が歪んでしまう。そこで,図6で示し
たように,ネットワークモニタ26によって,文書ファ
イルを発信した発信元を取得し,取得した前記発信元が
定められたグループ内に属している場合にのみ,当該文
書を取得をコンピュータ5,5’が行うようにしてもよ
い。図6の例では,発信元は,部門毎に識別されるよう
になっており,発信元になったコンピュータ7などがあ
る部門内の文書のみが当該部門のコンピュータ5,5’
によって取得されることになる。このようにすれば,複
数のコンピュータ5,5’が重複して集計処理を行うこ
とを防止することができる。また,部門IDを取得し,
これを検索結果として,前記ユーザI/F装置1により
出力するようにしておけば,特定した使用者の所在を利
用者が容易に把握することができる。なお,前記コンピ
ュータ5’の構成は,前記コンピュータ5と同様の構成
でもよいが,例えば管理部門において,専門知識となる
文書がそれほど発生しないなどの事情があれば,前記文
書管理サーバ27や,前記文書データベース33を設け
なくともよい。また,この実施の形態では,専門語や専
門分野を用いて検索を行ったが,検索に用いる用語は,
利用者のニーズにあわせて予め設定するようにしておけ
ばよく,実際の専門語や専門分野に限られるものではな
い。さらに,前記コンピュータ5,5’がネットワーク
を用いて接続されている例を示したが,これに限られる
ものではない。前記コンピュータ5,5’がネットワー
クに接続されていなくても,前記データベースの構築は
可能である。
【0023】
【発明の効果】以上説明した通り,本発明では,各設定
単語が各単語関係者に関係付けられた度数が集計され
る。この状態で,ある設定単語を指定した上で検索が指
示されると,前記集計の結果を用いて,指定された前記
設定単語に関係付けられた前記単語関係者と前記度数と
が抽出される。前記度数は指定された前記設定単語が前
記単語関係者の関係した文書でどれだけ多く用いられた
かを表しており,前記単語関係者の前記設定単語に係る
知識や情報の詳しさにほぼ対応する。このため,複数の
前記単語関係者が検索結果として出力されたとしても,
利用者は,前記度数を指標として前記設定単語に係る知
識や情報に詳しい前記単語関係者を容易に判断すること
ができる。さらに,前記設定単語を抽出した文書を指し
示す文書指示情報を,各設定単語と各単語関係者とに対
応付けて記憶する文書指示情報記憶手段を具備し,前記
指定単語関係者抽出手段が,前記指定された前記設定単
語に関係付けられた前記単語関係者を抽出してから,前
記指定された前記設定単語と前記抽出した前記単語関係
者とを用いて,前記文書指示情報記憶手段を検索して,
前記抽出した前記単語関係者が関係付けられた前記指定
された前記設定単語を抽出した文書を指し示す前記文書
指示情報も抽出し,前記指定単語関係者出力手段が,前
記指定単語関係者抽出手段により抽出された前記文書指
示情報も出力すれば,指定した設定単語に詳しい単語関
係者を容易に判断できるだけでなく,当該単語関係者が
当該設定単語を用いた様々な文書を指し示す文書指示情
報を得ることができる。このため,利用者は,検索され
た単語関係者に直接尋ねなくても,前記文書指示情報に
従って,必要な知識や情報を得ることができる可能性の
高い文書を特定することができる。
【0024】さらに,前記設定単語を分類する設定単語
分類と前記設定単語との対応関係を記憶した設定単語分
類記憶手段を具備し,前記度数抽出手段が,前記設定単
語分類記憶手段に記憶された前記対応関係と各設定単語
の前記単語関係者別の度数を用いて,前記単語関係者が
各設定単語分類に属する設定単語と関係付けられた分類
計度数と前記単語関係者が各設定単語に関係付けられた
総計度数との比率を各設定単語分類について前記単語関
係者別に求めて,前記度数記憶手段に記憶し,前記設定
単語に代わって前記設定単語分類が指定された場合に,
前記指定単語関係者抽出手段が,前記指定された前記設
定単語分類と前記比率とに基づいて前記度数記憶手段を
検索して,前記指定された前記設定単語分類に関係があ
る前記単語関係者を抽出すれば,前記設定単語を分類す
る設定単語分類を指定して検索が行われた場合にも,前
記設定単語分類に関係の深い単語関係者を容易に検索す
ることができる。前記設定単語分類は,前記設定単語よ
りも広い範囲の概念を含むものであり,前記設定単語ほ
ど流動的でないから,前記設定単語を知らなかったり,
指定した単語が前記設定単語に含まれていない場合で
も,利用者が求めるのに近い知識や情報に詳しい人物を
容易に抽出することができる。
【0025】さらに,前記設定単語抽出手段が,文書か
ら切り出した単語を,前記設定単語を格納した設定単語
辞書と前記設定単語以外の予め知られた一般単語を格納
した一般単語辞書とを参照しながら,前記一般単語か前
記設定単語かに分類して,前記設定単語を抽出するもの
であって,前記一般単語にも前記設定単語にも分類され
ない未知の単語が前記文書から切り出された場合には,
当該単語を前記設定単語辞書に格納すれば,新たに生ま
れてくる単語を設定単語として登録する作業負担が軽減
される。さらに,前記設定単語辞書に新たに前記未知の
単語が格納された場合に,前記度数記憶手段に各設定単
語の前記単語関係者別の度数を記憶するのにこれまで用
いた文書について,前記設定単語抽出手段が,前記未知
の単語を抽出し,前記単語関係者特定手段が,前記未知
の単語に関係がある単語関係者を特定し,前記度数集計
手段が,前記未知の単語が各単語関係者に関係付けられ
た度数を集計すれば,新たに登録された設定単語につい
ても,それまでに登録されている設定単語と同様に,単
語関係者を抽出することができる。さらに,画像データ
中から文字を認識する文字認識手段を備え,前記文書
を,前記文字認識手段により認識された文字から構成し
得るようにすることによって,単語関係者を抽出するた
めの資源をより豊かにすることができる。さらに,ネッ
トワーク上で通信されている文書を取得するネットワー
ク上文書取得手段を具備すれば,意図的に文書を与える
必要性が軽減される。
【0026】さらに,前記ネットワーク上文書取得手段
を具備する場合において,前記ネットワーク上文書取得
手段が,前記文書がクラアイントから送信された場合に
のみ,当該文書の取得を行えば,クライアントからサー
バに送られた後,サーバから他のホストに転送されるよ
うな場合でも,同じ文書について前記集計を重複して行
うことが防止される。さらに,前記指定単語関係者抽出
手段が,ネットワークに接続された複数の前記度数記憶
手段を検索して,指定された前記設定単語に関係付けら
れた前記単語関係者と前記度数を抽出すれば,比較的身
近い単語関係者だけでなく,より多くの単語関係者の中
から所望の知識や情報に詳しいと予想される単語関係者
を抽出することができる。さらに,前記ネットワーク上
文書取得手段が,前記文書を発信した発信元を取得し,
取得した前記発信元が定められたグループ内に属してい
る場合にのみ,当該文書の取得を行えば,複数の前記指
定単語関係者情報抽出装置がネットワークに接続されて
いる場合に,各指定単語関係者情報抽出装置の集計処理
が重複してしまう恐れがなく,また複数の前記度数記憶
手段を検索したときも,単語関係者の所在を容易に把握
することができる。また,指定単語関係者情報抽出プロ
グラムを記録したコンピュータ読み取り可能な記録媒体
を用いれば,上述のような各装置をコンピュータを用い
て実現することができる。
【図面の簡単な説明】
【図1】 本発明の実施の形態に係る指定単語関係者情
報抽出装置の概略構成,及びそれに用いるコンピュータ
の構成を示す図。
【図2】 前記指定単語関係者情報抽出装置が接続され
るネットワークの接続構成例を示す図。
【図3】 前記指定単語関係者情報抽出装置において用
いられる一般単語辞書及び専門語辞書の構成の具体例を
示す図。
【図4】 前記指定単語関係者情報抽出装置において構
築される使用者別単語データベースの構成の具体例を示
す図。
【図5】 専門語と使用者と原典ポインタとの対応関係
を説明するための図。
【図6】 専門分野と専門語の対応関係を説明するため
の図。
【図7】 各専門分野に対して各使用者別に求めた比率
の具体例を示す図。
【図8】 前記指定単語関係者情報抽出装置に対して専
門語を指定して検索を行ったときの検索結果の一例を示
す図。
【図9】 前記指定単語関係者情報抽出装置に対して専
門分野を指定して検索を行ったときの検索結果の一例を
示す図。
【符号の説明】
1…ユーザI/F装置 21…専門語抽出部 22…使用者特定部 23…集計部 24…検索部 25…文字認識部 26…ネットワークモニタ 31…使用者別単語データベース 32…専門分野データベース 33…文書データベース 34…一般単語辞書 35…専門語辞書
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND03 ND20 ND23 NK10 NK13 NK24 NK32 NR05 NR12 PP02 PP10 PP12 PP30 PQ02 PQ27 PQ32 PR04 UU06

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 予め設定した設定単語を文書から抽出す
    る設定単語抽出手段と,前記設定単語抽出手段により抽
    出された前記設定単語に関係がある単語関係者を前記文
    書から特定する単語関係者特定手段と,前記設定単語抽
    出手段により抽出された各設定単語が,前記単語関係者
    特定手段により特定された各単語関係者に関係付けられ
    た度数を集計する度数集計手段と,前記度数集計手段に
    より集計された各設定単語の前記単語関係者別の度数を
    記憶する度数記憶手段を検索して,指定された前記設定
    単語に関係付けられた前記単語関係者と前記度数を抽出
    する指定単語関係者抽出手段と,前記指定単語関係者抽
    出手段により抽出された前記単語関係者と前記度数とを
    出力する指定単語関係者出力手段と,を具備してなる指
    定単語関係者情報抽出装置。
  2. 【請求項2】 前記設定単語を抽出した文書を指し示す
    文書指示情報を,各設定単語と各単語関係者とに対応付
    けて記憶する文書指示情報記憶手段を具備し,前記指定
    単語関係者抽出手段が,前記指定された前記設定単語に
    関係付けられた前記単語関係者を抽出してから,前記指
    定された前記設定単語と前記抽出した前記単語関係者と
    を用いて,前記文書指示情報記憶手段を検索して,前記
    抽出した前記単語関係者が関係付けられた前記指定され
    た前記設定単語を抽出した文書を指し示す前記文書指示
    情報も抽出し,前記指定単語関係者出力手段が,前記指
    定単語関係者抽出手段により抽出された前記文書指示情
    報も出力してなる請求項1記載の指定単語関係者情報抽
    出装置。
  3. 【請求項3】 前記設定単語を分類する設定単語分類と
    前記設定単語との対応関係を記憶した設定単語分類記憶
    手段を具備し,前記度数抽出手段が,前記設定単語分類
    記憶手段に記憶された前記対応関係と各設定単語の前記
    単語関係者別の度数を用いて,前記単語関係者が各設定
    単語分類に属する設定単語と関係付けられた分類計度数
    と前記単語関係者が各設定単語に関係付けられた総計度
    数との比率を各設定単語分類について前記単語関係者別
    に求めて,前記度数記憶手段に記憶し,前記設定単語に
    代わって前記設定単語分類が指定された場合に,前記指
    定単語関係者抽出手段が,前記指定された前記設定単語
    分類と前記比率とに基づいて前記度数記憶手段を検索し
    て,前記指定された前記設定単語分類に関係がある前記
    単語関係者を抽出し,前記指定単語関係者出力手段が,
    前記指定された前記設定単語分類に関係がある前記単語
    関係者と前記比率とを出力してなる請求項1記載の指定
    単語関係者情報抽出装置。
  4. 【請求項4】 前記設定単語抽出手段が,文書から切り
    出した単語を,前記設定単語を格納した設定単語辞書と
    前記設定単語以外の予め知られた一般単語を格納した一
    般単語辞書とを参照しながら,前記一般単語か前記設定
    単語かに分類して,前記設定単語を抽出するものであっ
    て,前記一般単語にも前記設定単語にも分類されない未
    知の単語が前記文書から切り出された場合には,当該単
    語を前記設定単語辞書に格納させてなる請求項1記載の
    指定単語関係者情報抽出装置。
  5. 【請求項5】 前記設定単語辞書に新たに前記未知の単
    語が格納された場合に,前記度数記憶手段に各設定単語
    の前記単語関係者別の度数を記憶するのにこれまで用い
    た文書について,前記設定単語抽出手段が,前記未知の
    単語を抽出し,前記単語関係者特定手段が,前記未知の
    単語に関係がある単語関係者を特定し,前記度数集計手
    段が,前記未知の単語が各単語関係者に関係付けられた
    度数を集計してなる請求項4記載の指定単語関係者情報
    抽出装置。
  6. 【請求項6】 画像データ中から文字を認識する文字認
    識手段を備え,前記文書を,前記文字認識手段により認
    識された文字から構成し得るようにした請求項1記載の
    指定単語関係者情報抽出装置。
  7. 【請求項7】 ネットワーク上で通信されている文書を
    取得するネットワーク上文書取得手段を具備してなる請
    求項1記載の指定単語関係者情報抽出装置。
  8. 【請求項8】 前記ネットワーク上文書取得手段が,前
    記文書がクラアイントから送信された場合にのみ,当該
    文書の取得を行う請求項7記載の指定単語関係者情報抽
    出装置。
  9. 【請求項9】 前記指定単語関係者抽出手段が,ネット
    ワークに接続された複数の前記度数記憶手段を検索し
    て,指定された前記設定単語に関係付けられた前記単語
    関係者と前記度数を抽出してなる請求項7記載の指定単
    語関係者情報抽出装置。
  10. 【請求項10】 前記ネットワーク上文書取得手段が,
    前記文書を発信した発信元を取得し,取得した前記発信
    元が定められたグループ内に属している場合にのみ,当
    該文書の取得を行う請求項9記載の指定単語関係者情報
    抽出装置。
  11. 【請求項11】 コンピュータを請求項1〜10のいず
    れか1項に記載の指定単語関係者情報抽出装置として機
    能させるための指定単語関係者情報抽出プログラムを記
    録したコンピュータ読み取り可能な記録媒体。
JP2000198997A 2000-06-30 2000-06-30 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体,及び設定単語関係者度数集計装置 Expired - Fee Related JP3722672B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000198997A JP3722672B2 (ja) 2000-06-30 2000-06-30 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体,及び設定単語関係者度数集計装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000198997A JP3722672B2 (ja) 2000-06-30 2000-06-30 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体,及び設定単語関係者度数集計装置

Publications (2)

Publication Number Publication Date
JP2002014971A true JP2002014971A (ja) 2002-01-18
JP3722672B2 JP3722672B2 (ja) 2005-11-30

Family

ID=18697080

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000198997A Expired - Fee Related JP3722672B2 (ja) 2000-06-30 2000-06-30 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体,及び設定単語関係者度数集計装置

Country Status (1)

Country Link
JP (1) JP3722672B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2012128785A (ja) * 2010-12-17 2012-07-05 Konica Minolta Business Technologies Inc 画像処理装置、有識者情報蓄積方法および有識者情報蓄積プログラム
JP2016071732A (ja) * 2014-09-30 2016-05-09 ダイキン工業株式会社 レコメンド作成装置
JP2016071731A (ja) * 2014-09-30 2016-05-09 ダイキン工業株式会社 人材検索装置
JPWO2015063873A1 (ja) * 2013-10-30 2017-03-09 株式会社日立製作所 情報検索システムおよび情報検索方法
JP2019086940A (ja) * 2017-11-06 2019-06-06 日本電気株式会社 関連スコア算出システム、方法およびプログラム
JP7369920B2 (ja) 2019-08-28 2023-10-27 株式会社野村総合研究所 サーバおよびコンピュータプログラム
JP7436012B2 (ja) 2019-09-24 2024-02-21 Necソリューションイノベータ株式会社 知識共有支援装置、知識共有支援方法、プログラム、および記録媒体

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991311A (ja) * 1995-09-26 1997-04-04 Canon Inc 情報蓄積検索装置およびその制御方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0991311A (ja) * 1995-09-26 1997-04-04 Canon Inc 情報蓄積検索装置およびその制御方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2012128785A (ja) * 2010-12-17 2012-07-05 Konica Minolta Business Technologies Inc 画像処理装置、有識者情報蓄積方法および有識者情報蓄積プログラム
JPWO2015063873A1 (ja) * 2013-10-30 2017-03-09 株式会社日立製作所 情報検索システムおよび情報検索方法
JP2016071732A (ja) * 2014-09-30 2016-05-09 ダイキン工業株式会社 レコメンド作成装置
JP2016071731A (ja) * 2014-09-30 2016-05-09 ダイキン工業株式会社 人材検索装置
JP2019086940A (ja) * 2017-11-06 2019-06-06 日本電気株式会社 関連スコア算出システム、方法およびプログラム
JP7375861B2 (ja) 2017-11-06 2023-11-08 日本電気株式会社 関連スコア算出システム、方法およびプログラム
JP7369920B2 (ja) 2019-08-28 2023-10-27 株式会社野村総合研究所 サーバおよびコンピュータプログラム
JP7436012B2 (ja) 2019-09-24 2024-02-21 Necソリューションイノベータ株式会社 知識共有支援装置、知識共有支援方法、プログラム、および記録媒体

Also Published As

Publication number Publication date
JP3722672B2 (ja) 2005-11-30

Similar Documents

Publication Publication Date Title
US20040133566A1 (en) Data searching apparatus capable of searching with improved accuracy
RU2501078C2 (ru) Ранжирование результатов поиска с использованием расстояния редактирования и информации о документе
TWI352904B (en) Method and computer readable medium for controllin
US8306933B2 (en) Information providing system, method of providing information and program for providing information
US8407781B2 (en) Information providing support device and information providing support method
CN106383836B (zh) 将可操作属性归于描述个人身份的数据
WO2007001128A1 (en) Method and system for determining relation between search terms in the internet search system
KR20060030014A (ko) 범용 주석의 구성 및 디플로이 방법 및 시스템
JP5452030B2 (ja) 統合ログ生成装置及び統合ログ生成プログラム及び記録媒体
US9552415B2 (en) Category classification processing device and method
JP2002014971A (ja) 指定単語関係者情報抽出装置,及び指定単語関係者情報抽出プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2006331001A (ja) 専門家抽出装置および辞書提供装置
JP2019121164A (ja) 文書作成装置、文書作成方法、データベース構築装置、データベース構築方法、およびプログラム
JP5031416B2 (ja) 検索方法および検索装置
JP3531344B2 (ja) 情報検索装置
JPH1139293A (ja) 文書管理方法、文書検索方法、及び文書検索装置
JP2012043258A (ja) 検索システム、検索装置、検索プログラム、記録媒体及び検索方法
JP3526198B2 (ja) データベース類似検索方法及び装置及び類似検索プログラムを格納した記憶媒体
JP7221665B2 (ja) データ管理システム
KR102183815B1 (ko) 데이터 관리 시스템 및 데이터 관리 방법
JP3998201B2 (ja) 文書検索方法
KR101096285B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
JP3578045B2 (ja) 全文検索方法及び装置及び全文検索プログラムを格納した記憶媒体
JP2007293746A (ja) ファイル管理システム、ファイル管理プログラム及びファイル管理方法
JP2006338114A (ja) データ管理装置およびデータ管理方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041214

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050210

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050405

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050602

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20050607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050913

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 3722672

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080922

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090922

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100922

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110922

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120922

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130922

Year of fee payment: 8

LAPS Cancellation because of no payment of annual fees