JP4378131B2 - 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム - Google Patents

情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム Download PDF

Info

Publication number
JP4378131B2
JP4378131B2 JP2003292210A JP2003292210A JP4378131B2 JP 4378131 B2 JP4378131 B2 JP 4378131B2 JP 2003292210 A JP2003292210 A JP 2003292210A JP 2003292210 A JP2003292210 A JP 2003292210A JP 4378131 B2 JP4378131 B2 JP 4378131B2
Authority
JP
Japan
Prior art keywords
keyword
client
information
search
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003292210A
Other languages
English (en)
Other versions
JP2005063138A (ja
Inventor
敬三 田淵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2003292210A priority Critical patent/JP4378131B2/ja
Priority to US10/911,305 priority patent/US20050038797A1/en
Priority to CNB200410056434XA priority patent/CN1279479C/zh
Publication of JP2005063138A publication Critical patent/JP2005063138A/ja
Application granted granted Critical
Publication of JP4378131B2 publication Critical patent/JP4378131B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes

Description

本発明は、データベースに対する情報検索を行う情報検索システムに関し、特にユーザにとって有用な知識・情報を自動的にデータベースから検索し提供する情報検索システムに関する。
ナレッジマネジメント等で利用される情報検索の手法として基本的なものに、組織の構成員等のユーザ各自が保有する情報資源(ナレッジ:knowledge)をデータベースに登録しておき、所定の知識・情報を必要とするユーザが当該データベースを検索して所望の知識・情報を得るという方法がある(例えば、特許文献1参照)。
さらに、データベース側からユーザが所望する情報を積極的に提供することにより、ユーザの手間を削減した従来技術もある。すなわち、予めユーザが自分の必要な情報を明らかにしておき、該当するカテゴリの情報がデータベースに登録された場合には、当該情報を自動的に当該ユーザに通知するシステムである(例えば、非特許文献1参照)。この従来技術によれば、ユーザが所望する情報がデータベースに登録されるたびにデータベース側から自動的に提供されるので、毎度ユーザが検索のための操作を行わなくてすむのみならず、ユーザが所望するカテゴリにおける最新の情報が随時提供されるので、効率の良い情報検索が可能である。
特開2001−282792号公報 "CIO Online Emerging Technology"、[online]、IDG Japan、[平成15年7月26日検索]、インターネット<URL : http://www.idg.co.jp/CIO/contents/emerging/emerging1.html>
上述したように、コンピュータを用いたデータベースに対する情報検索の手法は、従来から種々の手法が提案されている。しかしながら、上記従来の情報検索手法では、ユーザが所望の知識・情報を取得するために、データベースに対してどのような知識・情報を欲するのかを、カテゴリの種類やキーワードを入力することによって知らせる手間がかかっていた。
非特許文献1に開示された従来技術においても、ユーザが情報検索を行うたびにカテゴリの種類やキーワードといった検索用の情報を入力する必要はないものの、予めユーザ自身の積極的な操作によってこれらの情報を選択し、データベースに登録する必要があり、相応の手間を要する。
本発明は、上述した従来技術における課題に鑑み、情報検索において、ユーザが欲する知識・情報を特定するために行う操作を不要とし、ユーザの手間を削減することを目的とする。
また本発明は、上記の目的に加えて、当該ユーザの情報活動に基づいて当該ユーザにとって有用と考えられる知識・情報をデータベースから選択し、積極的に提供することが可能な情報処理システムを提供することを他の目的とする。
上記の目的を達成する本発明は、次のように構成された情報処理システムとして実現される。すなわち、この情報処理システムは、データベースサーバと、ネットワークを介してデータベースサーバに接続されたクライアントとを備え、このクライアントは、所定の情報活動により得られたテキストからデータベース検索に用いるキーワードを抽出してデータベースサーバへ送信し、このデータベースサーバは、クライアントから送信されたキーワードを受信し、キーワードを検索条件としてデータベース検索を行い、検索結果をクライアントに送信することを特徴とする。
より詳細には、このクライアントとして用いられる情報処理装置は、所定の情報活動により得られたテキストを保持するテキスト保持部と、この所定の情報活動のパターンを解析し、解析結果に基づいてデータベース検索に用いるキーワードの抽出方法を特定し、テキスト保持部に保持されているテキストから特定された抽出方法でキーワードを抽出するキーワード抽出部とを備える。そして、キーワード抽出部にて抽出されたキーワードを検索条件としてネットワーク上のデータベースサーバへ送信する通信制御部と、キーワード抽出部にて抽出されたキーワードを用いたデータベース検索の結果を出力する出力制御部とを備える。
また、より好ましくは、このキーワード抽出部は、情報活動のパターンの解析結果に基づいて、所定の情報を取得するために行われた情報活動により得られたと判断されるテキストをキーワードの抽出対象として選択し、キーワードを抽出する。更に具体的には、このキーワード抽出部は、テキスト保持部に保持されているテキストを形態素解析して得られた単語のうち、出現頻度の高い所定個数の単語をキーワードとして抽出する。
また一例として、テキスト保持部を、外部装置との間でやり取りした電子メールを格納したメールボックスにて構成し、キーワード抽出部は、情報活動のパターンとしてテキスト保持部に格納された電子メールの送受信アクションを解析し、解析結果に基づいてキーワードの抽出対象となる電子メールを選択して、キーワードを抽出する構成とすることができる。具体的には、所定のスレッドにおける電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合、このスレッド内の電子メールをキーワードの抽出対象として選択する。また、この送受信アクションを解析して、スレッドごとに所定の情報を提供するために行われた送受信か所定の情報を取得するために行われた送受信かを判断し、判断結果に基づいて所定の電子メールからキーワードを抽出することもできる。
他の一例としては、テキスト保持部を、チャットや掲示板等でやり取りされる非定型メッセージを格納するメッセージレポジトリにて構成し、キーワード抽出部は、情報活動のパターンとしてメッセージのツリー構造と非定型メッセージに含まれる疑問詞や疑問符の有無とを解析し、キーワードの抽出対象となるメッセージを選択して、キーワードを抽出する構成とすることができる。
さらにまた、この情報処理システムにおけるデータベースサーバは、クライアントから受信したキーワードを保持し、キーワードに関連する新規の情報がデータベースに登録された場合に、この新規の情報を検索してクライアントに送信する。また、このデータベースサーバは、このクライアントからの明示的な検索要求なしに、予め定められたタイミングで、保持されているキーワードを用いてデータベース検索を行い、検索結果をクライアントに送信する。
さらに、この情報処理システムにおいて、クライアントが、キーワードに関して、キーワードの抽出元であるテキストを取得した情報活動において自装置が情報の受容者であったか提供者であったかを示す情報を、データベースサーバへ送信し、データベースサーバが、クライアントから送られたキーワードのうちの所定のキーワードに関して、情報の受容者としてキーワードを送信したクライアントに対し、情報の提供者としてキーワードを送信したクライアントの情報を送信するように構成することもできる。
また、上記の目的を達成する他の本発明は、コンピュータを用いて構築された、次のようなデータベースの検索方法としても実現される。この検索方法は、所定の情報活動により得られたテキストの中から、かかる情報活動のパターンを解析した結果に基づいて特定されるキーワード抽出方法を用いて、データベース検索に用いるキーワードを抽出するステップと、抽出されたキーワードを所定のキーワード記憶手段に格納するステップと、キーワード記憶手段に格納されたキーワードを用いてデータベース検索を行うステップとを含むことを特徴とする。
さらに本発明は、コンピュータを制御して上述した情報処理装置として機能させるプログラム、あるいは上記のデータベース検索方法における各ステップに対応する処理をコンピュータに実行させるプログラムとしても実現される。このプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより、提供することができる。
以上のように構成された本発明は、クライアントにて抽出されたキーワードをサーバにて保持し、クライアントからの明示的な検索要求なしに、このキーワードに基づくデータベース検索を行って、検索結果をクライアントに提供することにより、ユーザによる検索要求の発行や検索条件の登録といった、ユーザが欲する知識・情報を特定するために行う操作を不要とし、ユーザの手間を大幅に削減することができる。
また本発明は、クライアントからの明示的な検索要求や検索条件の登録なしに、サーバにおいて自動的に検索を行い、検索結果をクライアントに提供するため、ユーザにとって有用と考えられる知識・情報を、情報処理システム側から積極的に提供できるという効果を有する。
以下、添付図面を参照して、本発明を実施するための最良の形態(以下、実施形態)について詳細に説明する。
図1は、本実施形態による情報処理が利用される情報処理システムの全体構成を示す図である。
図1に示すように、本実施形態は、情報資源を格納し蓄積するデータベースを備えたサーバ10と、ネットワーク50を介してサーバに接続し情報を取得するクライアント20とを備えて構成される。本実施形態の情報処理システムは、クライアント20において行われる情報活動に基づいて情報検索の検索条件を自動的に抽出し、抽出された検索条件に基づいてサーバ10におけるデータベース検索を行い、検索された情報(検索結果)をクライアント20へ送信するものである。
サーバ10は、ワークステーションやパーソナルコンピュータ、その他のコンピュータ装置にて実現されるデータベースサーバである。このサーバ10は、単に検索要求に応じて当該検索要求の検索条件に該当する情報をデータベースから読み出して応答するだけでなく、予め登録された検索条件に基づいて所定のタイミングでデータベース検索を行い、当該検索条件に対応するクライアント20へ送信する機能を有する。
クライアント20は、ワークステーションやパーソナルコンピュータ等のコンピュータ装置、ネットワーク機能を備えたPDA(Personal Digital Assistant)、携帯電話等の情報機器にて実現される。本実施形態におけるクライアント20とは、サーバ10との関係におけるクライアントであり、実際のシステム構成では、個々のエンドユーザが直接使用する端末装置の他、そのような端末装置間でのメッセージのやり取りを管理するメッセージサーバ等も含む。
ネットワーク50は、インターネットなどの公的、広域的なネットワークでもローカルなネットワークでも良い。すなわち、インターネット上に設けられた公的なデータベースサーバをサーバ10として本実施形態のシステムを構築することもできるし、企業内イントラネットのような閉じた形態で本実施形態のシステムを構築することもできる。
図2は、本実施形態のサーバ10やクライアント20を実現するのに好適なコンピュータ装置のハードウェア構成の例を模式的に示した図である。
図2に示すコンピュータ装置は、演算手段であるCPU(Central Processing Unit:中央処理装置)101と、M/B(マザーボード)チップセット102およびCPUバスを介してCPU101に接続されたメインメモリ103と、同じくM/Bチップセット102およびAGP(Accelerated Graphics Port)を介してCPU101に接続されたビデオカード104と、PCI(Peripheral Component Interconnect)バスを介してM/Bチップセット102に接続された磁気ディスク装置(HDD)105、ネットワークインターフェイス106と、さらにこのPCIバスからブリッジ回路107およびISA(Industry Standard Architecture)バスなどの低速なバスを介してM/Bチップセット102に接続されたフロッピーディスクドライブ108およびキーボード/マウス109とを備える。
なお、図2は本実施形態を実現するコンピュータ装置のハードウェア構成を例示するに過ぎず、本実施形態を適用可能であれば、他の種々の構成を取ることができる。例えば、ビデオカード104を設ける代わりに、ビデオメモリのみを搭載し、CPU101にてイメージデータを処理する構成としても良いし、外部記憶装置として、ATA(AT Attachment)やSCSI(Small Computer System Interface)などのインターフェイスを介してCD−R(Compact Disc Recordable)やDVD−RAM(Digital Versatile Disc Random Access Memory)のドライブを設けても良い。
本実施形態では、サーバ10における検索条件を抽出するためのクライアント20における情報活動として、所定の情報機器間でのメッセージのやり取りを考える。メッセージのやり取りを行う手段としては、電子メール、コラボレーションソフトを用いた共同作業におけるメッセージの送受信、チャット等、種々の手段が考えられるが、今日の企業における業務等では電子メールによる情報の授受が欠かせないものとなっていることに鑑み、本実施形態では電子メールを用いた場合を例として説明する。すなわち、クライアント20において送受信された電子メールからサーバ10における検索条件となる情報が抽出され、サーバ10に送られることとなる。
図3は、本実施形態におけるクライアント20の機能構成を示す図である。
図3を参照すると、クライアント20は、送受信した電子メールを格納したメールボックス21と、メールボックス21に格納された電子メールからサーバ10におけるデータベース検索の検索条件となるキーワードを抽出するキーワード抽出部22と、サーバ10との間でのデータ交換を制御する送受信制御部23と、送受信制御部23にて受信したサーバ10におけるデータベース検索の結果を出力する出力制御部24とを備える。
図3に示す構成のうち、メールボックス21は、例えば図2のコンピュータ装置におけるメインメモリ103や磁気ディスク装置105にて実現される。キーワード抽出部22は、例えば図2のコンピュータ装置のプログラム制御されたCPU101にて実現される。送受信制御部23は、例えば図2のコンピュータ装置のプログラム制御されたCPU101およびネットワークインターフェイス106にて実現される。出力制御部24は、例えば図2のコンピュータ装置のプログラム制御されたCPU101およびビデオカード104にて実現される。キーワード抽出部22や送受信制御部23、出力制御部24の機能をCPU101にて実現させるプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供される。
クライアント20の構成において、メールボックス21は、クライアント20が他の端末装置やサーバ等の情報機器とやり取りした電子メールをその通信履歴と共に蓄積している。メールボックス21としては、従来から用いられている電子メール用のソフトウェア(メーラ)における電子メールの管理機能を適用することができる。
キーワード抽出部22は、所定のタイミングで(例えばシステム起動時や定期的に)メールボックス21を探索して、格納されている電子メールからサーバ10におけるデータベース検索に用いられるキーワードを抽出する。
図4は、キーワード抽出部22によるキーワード抽出処理を説明するフローチャートである。
図4に示すように、キーワード抽出部22は、まず、メールボックス21に格納されている全ての電子メールをスレッド単位で再構成する。そして、各スレッドに関して、電子メールの送受信のパターンに基づき、クライアント20自身が当該スレッドにおいて情報の提供者(売り手)であるのか、情報の受容者(買い手)であるのかを分類する(ステップ401)。
具体的には、所定のスレッドに関して、最初のアクションが受信であり、その後のアクションがない場合、当該スレッドにおいてクライアント20は情報の受容者であったと判断される。このようなスレッドの例としては、メールマガジンのような情報配信サービスによるメールを受信した場合などが挙げられる。
最初のアクションが受信であり、その後のアクションが、発信(返信)−受信となっている場合、当該スレッドにおいてクライアント20は情報の提供者であったと判断される。このようなスレッドでは、ほとんどの場合、最初に問い合わせを受け(受信)、回答を行い(発信)、お礼の挨拶を受け取る(受信)といった経過で電子メールのやり取りがなされているためである。最初の受信の後、数回のやり取りがあって受信で終わっている場合も同様と考える。
最初のアクションが発信であり、その後のアクションがない場合、当該スレッドにおいてクライアント20は情報の提供者であったと判断される。このようなスレッドの例としては、クライアント20から他者への通知を行った場合などが挙げられる。
最初のアクションが発信であり、その後のアクションが受信−発信となっている場合、当該スレッドにおいてクライアント20は情報の受容者であったと判断される。先の受信−発信−受信の場合とは反対に、クライアント20から他者に問い合わせを行い(発信)、その回答を受け取り(受信)、お礼の挨拶を送信した(発信)といった経過で電子メールのやり取りがなされたと考えられるためである。最初の発信の後、数回のやり取りがあって発信で終わっている場合も同様と考える。
最初のアクションが発信であり、その後のアクションが、受信−発信−受信となっている場合、当該スレッドにおいてクライアント20は情報の提供者であったと判断される。このようなスレッドでは、クライアント20から何らかの通知を行い(発信)、その通知に対して問い合わせを受け(受信)、回答を行い(発信)、お礼の挨拶を受け取る(受信)といった経過で電子メールのやり取りがなされたと考えられるためである。最初の発信の後、数回のやり取りがあって受信で終わっている場合も同様と考える。
なお、最初のアクションが受信であって、その後のアクションが受信した電子メールの削除である場合、当該受信メールはバルク(Bulk)メール等の不要な電子メールであると考えられるので、クライアント20は情報の提供者でも受容者でもないものと判断する。
図5は、以上の電子メールの分類基準をまとめた図表である。
次に、キーワード抽出部22は、ステップ401でクライアント20が情報の受容者であると分類されたスレッドを選択し、選択された個々のスレッドに順次着目して、各スレッドに含まれる電子メールの文を形態素解析し、当該電子メールの文に含まれる名詞を抽出する(ステップ402)。そして、抽出された各名詞の頻出度を計算する(ステップ403)。名詞の頻出度は、例えば次のようにして計算することができる。
まず、各スレッドが持つ重要度を1とし、そのスレッドの中で出てきた名詞に対し、その出現個数に応じて重要度を割り振り、当該スレッドにおける頻出度(スレッド別頻出度)とする。そして、クライアント20が情報の受容者の立場であった全てのスレッドにおける同一の名詞のスレッド別頻出度を合計し、当該名詞の頻出度とする。
具体例を挙げて計算する。
クライアント20が情報の受容者であると判断された所定のスレッドAに関して、当該スレッドAに含まれる電子メールの文中に、「ナレッジマネジメント」という単語が全部で7回、「e-Learning」という単語が全部で3回出てきたとする。この場合、「ナレッジマネジメント」について、出現個数は7、抽出された単語が全部で10個(=7+3)なので、そのスレッドAにおけるスレッド別頻出度は、

7/(7+3)=0.7

となる。同様に、「e-Learning」のスレッドAにおけるスレッド別頻出度は、0.3(=3/(7+3))である。
また、同じくクライアント20が情報の受容者であると判断された他のスレッドBに関して、当該スレッドBに含まれる電子メールの文中に「ナレッジマネジメント」が全部で3回、「投資対効果」が全部で2回出てきたとする。この場合、「ナレッジマネジメント」のスレッドBにおけるスレッド別頻出度は、上記と同様に計算して、0.6(=3/(3+2))であり、「投資対効果」のスレッドBにおけるスレッド別頻出度は、0.4(=2/(3+2))である。
電子メールのやり取りにおいてクライアント20が情報の受容者の立場であったスレッドがスレッドA、Bのみであった場合、同一の名詞についてスレッドA、Bにおけるスレッド別頻出度を合計すると、「ナレッジマネジメント」については、スレッドAにおけるスレッド別頻出度が0.7、スレッドBにおけるスレッド別頻出度が0.6であるので、「ナレッジマネジメント」の頻出度は、

0.7+0.6=1.3

と算出される。また、「e-Learning」はスレッドAのみ、「投資対効果」はスレッドBのみにそれぞれ出現するので、スレッド別品種都度(「e-Learning」が0.3、「投資対効果」が0.4)がそのまま各名詞の頻出度となる。
次に、キーワード抽出部22は、ステップ402で形態素解析により抽出された電子メール文中の名詞の中から、極めて一般的な単語(例えば「会議」、「今日」、「本社」など)を除去し、残りの単語の中から頻出度の高いものをキーワードとして選択する(ステップ404)。一般的な単語の除去は、例えば、除去すべき単語リスト(辞書)を予め用意しておき、ステップ402で抽出された名詞を当該単語リストにマッチングさせることにより、行うことができる。なお、この単語リストを、キーワード抽出部22で抽出された名詞から自動的に作成することも可能である。例えば、情報の受容者であると提供者であるとに関わらず全てのユーザに共通して高い頻度で出現した単語を一般的な単語として選択し、単語リストに登録するといった方法を採ることができる(具体的には、全ユーザの50%以上において、情報の受容者と提供者の場合で共に頻出度の高い単語の上位数個を一般的な単語に選択するといった基準を設けることができる)。キーワードは、頻出度の高い単語から順に所定個数を選択する。いくつ選択するかは、任意であり変更も可能である。選択されたキーワードは、送受信制御部23によりサーバ10へ送信される。
なお、上述したキーワードの選択方法やその中で用いた単語の頻出度の計算方法は例示に過ぎず、メールボックス21に蓄積されている電子メールから、サーバ10におけるデータベース検索の検索条件として用いられるキーワードを適切に抽出できる方法であれば、他の任意の方法を採ることができる。
送受信制御部23は、ネットワーク50を介してサーバ10との間でデータの送受信を行い、上記のようにキーワード抽出部22にて抽出されたキーワードをサーバ10に送信したり、サーバ10から送信された検索情報(データベース検索の結果)を受信したりする。送受信制御部23にて受信されたサーバ10からの検索情報は、出力制御部24に送られる。
出力制御部24は、送受信制御部23から受け取ったサーバ10における検索情報をディスプレイ装置に表示出力する。
キーワード抽出部22にて抽出されたキーワードは、当該クライアント20における情報活動(電子メールのやり取り)によって得られたテキストから抽出されたものである。したがって、キーワードを送受信制御部23にてサーバ10へ送信する際には、サーバ10においてどのクライアント20にとってのキーワードであるかを認識するため、当該キーワードと当該クライアント20とを対応付ける情報を一緒にサーバ10へ送る必要がある。ここで、本実施形態ではクライアント20をエンドユーザが使用する情報機器としているが、データベース検索によって得られる情報を必要とするのは、情報機器よりもむしろエンドユーザ自身である。そこで、クライアント20ではなくこれを使用するエンドユーザを特定する情報をキーワードと対応付けることができる。具体的には、例えばエンドユーザの電子メールアドレスをキーワードと共にサーバ10へ送る。
図6は、本実施形態におけるサーバ10の機能構成を示す図である。
図6を参照すると、サーバ10は、情報資源を格納した情報資源管理DB(データベース)11と、情報資源管理DB11に対してデータベース検索を行う検索実行部12と、検索実行部12によるデータベース検索に用いられるキーワードを格納するキーワード管理DB(データベース)13と、クライアント20との間でのデータ交換を制御する送受信制御部14とを備える。
図6に示す構成のうち、情報資源管理DB11およびキーワード管理DB13は、例えば図2に示したコンピュータ装置におけるメインメモリ103や磁気ディスク装置105にて実現される。検索実行部12は、例えば図2のコンピュータ装置のプログラム制御されたCPU101にて実現される。送受信制御部14は、例えば図2のコンピュータ装置のプログラム制御されたCPU101およびネットワークインターフェイス106にて実現される。検索実行部12や送受信制御部14の機能をCPU101にて実現させるプログラムは、磁気ディスクや光ディスク、半導体メモリ、その他の記録媒体に格納して配布したり、ネットワークを介して配信したりすることにより提供される。
サーバ10の構成において、情報資源管理DB11は、サーバ10におけるデータベース検索の対象である情報資源を格納している。
検索実行部12は、キーワード管理DB13に格納されているキーワードを用いて情報資源管理DB11に対するデータベース検索を実行する。検索実行部12による情報資源管理DB11の検索は、所定のタイミングで(例えば定期的に)繰り返し実行される。これにより、所定のキーワードに該当する新規に登録された情報資源が情報資源管理DB11に存在する場合は、随時検索されることとなる。
キーワード管理DB13は、クライアント20から送られてくるキーワードを、電子メールのメールアドレスを用いてエンドユーザごとに分類して格納する。
送受信制御部14は、ネットワーク50を介してクライアント20との間でデータの送受信を行い、クライアント20から送信されたキーワードを受信してキーワード管理DB13に格納したり、検索実行部12にて検索された情報を該当するメールアドレス宛に送信したりする。
図7は、キーワード管理DB13に格納されるデータの構成例を示す図である。
図7に示すように、キーワード管理DB13は、情報の利用者であるエンドユーザを特定する社内メールID(電子メールアドレス)と、検索条件としてのキーワードと、当該キーワードについての最終検索日と、有効フラグとを関連づけて格納している。
ここで、エンドユーザを特定する情報としては、電子メールアドレス以外のID情報を用いることも可能であるが、電子メールアドレスを用いることにより、情報資源管理DB11の検索結果を通知する際に当該電子メールアドレス宛に送信することができる。電子メールアドレスは、例えばクライアント20からキーワードが送られる際に、一緒に取得することができる。
また、最終検索日とは、当該キーワードで最後に情報資源管理DB11の検索を行った日付であり、検索実行部12は、この最終検索日以降に情報資源管理DB11に登録された情報を検索する。これにより、過去に検索した情報を重複して検索し、クライアント20へ送信してしまうことを避けることができる。
有効フラグとは、検索実行部12が情報資源管理DB11に対する検索を行う際に実際に用いるキーワード(有効:True)と検索に用いないキーワード(無効:False)とを区別するフラグである。例えば、各電子メールアドレスに対して有効なキーワードを3個と設定した場合、同一の電子メールアドレスに対応付けられたキーワードのうち3個の有効フラグがTrueとなる(図示の例では、電子メールアドレス「aaa@jp.ibm.com」に対応付けられたキーワードのうち、「ナレッジマネジメント」、「Notes」、「コンサルティング」の3つのキーワードがTrueとなっている)。
さて、サーバ10のキーワード管理DB13に所定の電子メールアドレスに対応付けられたキーワードが格納されており、さらに送受信制御部14を介して当該電子メールアドレスに対応付けられたキーワードが新たに入力された場合を考える(上述したようにキーワードは、クライアント20から、例えばシステムを起動するたびに送られてくる)。この場合、キーワード管理DB13の当該電子メールアドレスに対応付けられたキーワードは、当該新たに入力されたキーワードに更新される。ここでは、例として、あるタイミングで電子メールアドレス「aaa@jp.ibm.com」で特定されるエンドユーザが使用するクライアント20から「ナレッジマネジメント」、「投資対効果」、「e-Learning」の3つのキーワードが送られてきたものとする。
図8は、図7のキーワード管理DB13において、電子メールアドレス「aaa@jp.ibm.com」に対応するキーワードが更新された様子を示す図である。
図8と図7とを比較すると、電子メールアドレス「aaa@jp.ibm.com」に対応するキーワードとして、「e-Learning」という単語が追加されている(新規に追加されたキーワードであるため、最終検索日はnull(空))。そして、追加された「e-Learning」と「ナレッジマネジメント」および「投資対効果」の3つのキーワードの有効フラグがTrueとなっている。また、キーワード「Notes」および「コンサルティング」の有効フラグがFalseに変更されている。すなわち、クライアント20から送られた最新の3つのキーワードが有効となり、当該最新のキーワードにも含まれている「ナレッジマネジメント」を除く2つが古いキーワードとして、無効となっている。
ここで、古くなったキーワードをキーワード管理DB13から削除してしまわずに、有効フラグによって有効・無効の切り替えを行うこととしたのは、後に再度最新のキーワードとして当該キーワードがクライアント20から送られた場合に、情報資源管理DB11を重複して検索することを防止するためである。
具体例として、有効フラグが図7でFalseであり、図8でTrueとなっているキーワード「投資対効果」について考える。
図7の時点で、「ナレッジマネジメント」、「Notes」、「コンサルティング」の3つのキーワードがTrueとなっており、キーワード「投資対効果」は古いキーワードとしてFalseになっている。このキーワード「投資対効果」をキーワード管理DB13から削除してしまった場合、次の更新で図8のようにキーワード「投資対効果」が最新のキーワードとしてクライアント20から送られてくるため、改めてこのキーワード「投資対効果」がキーワード管理DB13に登録されることとなる。すると、検索実行部12は、情報資源管理DB11に登録されている情報資源の中から、当該新しいキーワード「投資対効果」に該当する情報を改めて全て検索することとなる。
しかしながら、キーワード「投資対効果」は、以前にキーワードとして登録されており、その時点でこのキーワードに該当する情報は、既に検索されてクライアント20へ送られているため、当該キーワード「投資対効果」が再登録された際に情報資源管理DB11に登録されている情報資源を全て検索してクライアント20へ送るとすると、以前にクライアント20へ送られている情報が重複してしまうこととなる。そこで、本実施形態では、古くなったキーワードをキーワード管理DB13から削除せず、有効フラグをFalseとして検索条件から外すのみとし、当該キーワードで検索した最終検索日の情報を保持しておいて、当該キーワードが次にTrueとなった場合に、最終検索日以降に情報資源管理DB11に格納された情報資源のみを検索することとしている。図8に示す例では、キーワード「投資対効果」の最終検索日は2003年4月5日となっているので、この日以降に情報資源管理DB11に登録された情報資源が検索され、キーワード「投資対効果」に該当する情報があれば、クライアント20へ送信されることとなる。
以上のように構成された本実施形態の情報処理システムによれば、クライアント20からデータベース検索のための検索要求を送信することなく、クライアント20のエンドユーザにとって有用と考えられる情報が、随時サーバ10からクライアント20へ送られることとなる。
図9は、本実施形態の情報処理システムによる全体的な処理の流れを示すフローチャートである。
図9に示すように、クライアント20は、所定のタイミングで(システムの起動時や定期的に)、メールボックス21に格納されている電子メールのスレッドが解析され、クライアント20が情報の受容者(買い手)となっていると判断されるスレッドが選択されて、当該スレッドに含まれる電子メールのテキストが形態素解析される(ステップ901)。そして、単語に分解され、各単語(名詞)の頻出度が計算され、キーワードが選択されて、当該クライアント20のエンドユーザの電子メールアドレスと共にサーバ10へ送信される(ステップ902)。
クライアント20からサーバ10へ送られたキーワードは、当該キーワードと一緒に取得した電子メールアドレスで分類されて、サーバ10のキーワード管理DB13に格納される(ステップ903)。そして、予め設定された所定のタイミングで(例えば、毎日決まった時間に)、検索実行部12によりキーワード管理DB13に保持されているキーワードを検索条件として情報資源管理DB11の検索が行われ、検索結果として得られた情報がクライアント20へ送られる(ステップ904)。クライアント20では、サーバ10から送られた情報が表示出力され、エンドユーザに通知される(ステップ905)。
なお、上記の動作例において、サーバ10は、予め設定された所定のタイミングで情報資源管理DB11の検索を行うとしたが、クライアント20から新たにキーワードが送られた際に、当該新たなキーワードを用いてデータベース検索を行うことも可能である。
また、検索結果である情報を受け取ったクライアント20において、当該情報が表示出力されるとしたが、情報自体は所定の記憶手段に格納して、情報を受信したことのみを表示や音声でエンドユーザに通知するようにしても良い。さらに、検索結果である情報をキーワードに対応付けられた電子メールアドレス宛に送信するため、エンドユーザは、当該電子メールアドレスを用いることにより、自分のクライアント20以外の情報機器から当該情報を取得することも可能である。
さらにまた、本実施形態では、クライアント20がエンドユーザの使用する情報機器である場合を例として説明したが、電子メールのやり取りを管理するメールサーバをクライアント20とすることもできる。この場合、クライアント20であるメールサーバは、自身が管理する電子メールのやり取りのスレッドを解析し、キーワードを抽出してサーバ10に送信する。そして、サーバ10から送信された情報を、メールサーバにとってのクライアントであるユーザ端末のうち、当該キーワードを抽出したスレッドにおいて情報の受容者の立場であるユーザ端末に送信する。
上記の実施形態では、クライアント20の情報活動の例として電子メールのやり取りを考えた。しかしながら、本発明は、クライアントにおける情報活動によって得られたテキストからキーワードを抽出してサーバ10に送ることにより、クライアント20のエンドユーザが自身の積極的な操作によってデータベース検索における検索条件を設定しなくても、サーバ10において自動的に検索が行われ、当該エンドユーザに有用と考えられる情報が提供されるようにすることを、その本質としている。したがって、その情報活動の内容は、上述した電子メールのやり取りに限るものではない。以下では、クライアント20の情報活動として、コラボレーションソフトを用いて複数のコンピュータによって共同作業を考えた実施形態について説明する。
図10は、クライアントの情報活動をコラボレーションソフトによる複数コンピュータの共同作業とした場合のクライアントの機能構成を示す図、図11は、同様の場合におけるサーバの機能構成を示す図である。
図10に示すように、本実施形態のクライアント40は、図3に示したクライアント20と比較すると、メールボックス21の代わりにコラボレーションソフトによる共同作業において交換される非定型メッセージを格納したメッセージレポジトリ41を備える。その他の構成は、図3のクライアント20と同様である。
ただし、メッセージレポジトリ41に格納される非定型メッセージでは、電子メールのように、直接情報活動のパターンとして発信と受信のパターン(図5参照)を直接解析して、クライアント40が情報の提供者か受容者かを判断することができない。そこで、キーワード抽出部22は、クライアント40における情報活動のパターンを解析するために、まず前処理としてメッセージレポジトリ41に格納されている各非定型メッセージの文を解析して、「でしょうか。」、「ですか?」、「?」などの疑問詞や疑問符を検出する。次に、メッセージのツリー構造を参酌し、当該クライアント40が発信しているメッセージの中に現れる疑問詞や疑問符の数を数える。そして、疑問詞や疑問符の出現数が多い場合(例えば、予め定めた個数(閾値)以上ある場合など)に、その1つのメッセージ交換において、当該クライアント40が情報の受容者の立場であったと判断する。
その後、メッセージを形態素解析してキーワードを抽出する動作は、図4に示したキーワード抽出部22による処理とほぼ同様である。ただし、本実施形態では、クライアント40が情報の受容者であった場合だけでなく、情報の提供者であった場合についてもキーワードの抽出を行い、当該キーワードと共に、情報の受容者であるか提供者であるかを識別する識別情報をサーバ30へ送る。
一方、図11に示すように、本実施形態のサーバ30は、図6に示したサーバ10と同様に、情報資源管理DB11、検索実行部12および送受信制御部14を備える他、最適ネットワーク構成処理部31を備える。また、キーワード管理DB13に替えて、ユーザプロファイルDB32を備える。
最適ネットワーク構成処理部31は、例えば図2に示したコンピュータ装置におけるプログラム制御されたCPU101にて実現される。
ユーザプロファイルDB32は、図6に示したサーバ10におけるキーワード管理DB13と同様にキーワードを格納して保持する他、当該キーワードを送信したクライアント40が当該キーワードに対して情報の提供者であるのか受容者であるのかを示す識別情報を格納する。そして、検索実行部12による情報資源管理DB11の検索は、情報の受容者であるクライアント40から送られたキーワードに対してのみ実行される。
最適ネットワーク構成処理部31は、ユーザプロファイルDB32を検索して、所定のキーワードに関して、情報の受容者であるクライアント40からの送信による登録と、情報の提供者であるクライアント40からの送信による登録とがあるかどうかを調べる。そのようなキーワードの登録が存在する場合、最適ネットワーク構成処理部31は、当該キーワードにおける情報の受容者であるクライアント40に対して、情報の提供者であるクライアント40の情報(メッセージ交換を行うための宛先等)を送信する。この情報の提供者に関する情報の送信は、例えば、当該キーワードに関連する検索結果を送信する際に、一緒に行うことができる。
クライアント40は、キーワードに関連する検索結果と共に、当該キーワードに関して情報の提供者であるクライアント40の情報を得ることにより、当該情報の提供者であるクライアント40と直接メッセージ交換を行って、所望の情報を得ることが可能となる。
以上、本発明の実施形態について説明したが、本発明の技術的思想は上記実施形態に限定されるものでないことは言うまでもない。例えば、上記の実施形態では、キーワードを抽出する手段をクライアントが備えるものとしたが、クライアントにおける情報活動の結果として得られるテキストをサーバが管理するような情報処理システムでは、サーバ自身がキーワード抽出機能を備えても良い。このように、本発明の技術的思想を超えない範囲で、ハードウェアやソフトウェアを適宜組み合わせた種々のシステム構成を取ることができるものである。
本実施形態による情報処理が利用される情報処理システムの全体構成を示す図である。 本実施形態のサーバやクライアントを実現するのに好適なコンピュータ装置のハードウェア構成の例を模式的に示した図である。 本実施形態におけるクライアントの機能構成を示す図である。 本実施形態のキーワード抽出部によるキーワード抽出処理を説明するフローチャートである。 本実施形態において、クライアントが情報の受容者か提供者かに基づいて電子メールを分類するための分類基準を示す図表である。 本実施形態におけるサーバの機能構成を示す図である。 本実施形態のキーワード管理DBに格納されるデータの構成例を示す図である。 図7のキーワード管理DBにおいて、電子メールアドレス「aaa@jp.ibm.com」に対応するキーワードが更新された様子を示す図である。 本実施形態の情報処理システムによる全体的な処理の流れを示すフローチャートである。 クライアントの情報活動をコラボレーションソフトによる複数コンピュータの共同作業とした場合のクライアントの機能構成を示す図である。 クライアントの情報活動をコラボレーションソフトによる複数コンピュータの共同作業とした場合のサーバの機能構成を示す図である。
符号の説明
10、30…サーバ、11…情報資源管理DB(データベース)、12…検索実行部、13…キーワード管理DB、14…送受信制御部、20、40…クライアント、21…メールボックス、22…キーワード抽出部、23…送受信制御部、24…出力制御部、31…最適ネットワーク構成処理部、32…ユーザプロファイルDB、41…メッセージレポジトリ、50…ネットワーク、101…CPU(中央処理装置)、103…メインメモリ、105…磁気ディスク装置(HDD)、106…ネットワークインターフェイス

Claims (15)

  1. 外部装置との間でやり取りされた電子メールのテキストを保持するテキスト保持部と、
    所定のスレッドにおける前記電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合にのみ、当該スレッド内の当該電子メールを抽出対象として、データベース検索に用いるキーワードを抽出するキーワード抽出部と、
    前記キーワード抽出部にて抽出された前記キーワードを用いたデータベース検索の結果を出力する出力制御部と
    を備えることを特徴とする情報処理装置。
  2. 前記キーワード抽出部は、前記テキスト保持部に保持されている前記電子メールのテキストを形態素解析して得られた単語をキーワードとして抽出することを特徴とする請求項1に記載の情報処理装置。
  3. 前記キーワード抽出部は、前記テキストから得られた単語のうち、出現頻度の高い所定個数の単語をキーワードとして抽出することを特徴とする請求項2に記載の情報処理装置。
  4. 外部装置との間でやり取りされた電子メールのテキストを保持するテキスト保持部と、
    所定のスレッドにおける前記電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合にのみ、当該スレッド内の当該電子メールを抽出対象として、データベース検索に用いるキーワードを抽出するキーワード抽出部と、
    前記キーワード抽出部にて抽出されたキーワードを検索条件としてネットワーク上のデータベースサーバへ送信する通信制御部と
    を備えることを特徴とする情報処理装置。
  5. 前記キーワード抽出部は、前記テキスト保持部に保持されているテキストを形態素解析して得られた単語をキーワードとして抽出することを特徴とする請求項4に記載の情報処理装置。
  6. データベースサーバと、ネットワークを介して当該データベースサーバに接続されたクライアントとを備え、
    前記クライアントは、外部装置との間でやり取りされた電子メールのうち、所定のスレッドにおける前記電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合にのみ、当該スレッド内の当該電子メールを抽出対象として、データベース検索に用いるキーワードを抽出して前記データベースサーバへ送信し、
    前記データベースサーバは、前記クライアントから送信されたキーワードを受信し、当該キーワードを検索条件としてデータベース検索を行い、検索結果を当該クライアントに送信することを特徴とする情報処理システム。
  7. 前記データベースサーバは、前記クライアントから受信した前記キーワードを保持し、当該キーワードに関連する新規の情報がデータベースに登録された場合に、当該新規の情報を当該クライアントに送信することを特徴とする請求項6に記載の情報処理システム。
  8. 前記データベースサーバは、前記クライアントから受信した前記キーワードを保持し、予め定められたタイミングでデータベース検索を行い、検索結果を当該クライアントに送信することを特徴とする請求項6に記載の情報処理システム。
  9. 前記データベースサーバは、前記クライアントから受信した前記キーワードを、当該クライアントを使用したエンドユーザの電子メールアドレスに基づいて分類して保持し、当該キーワードに基づくデータベース検索の結果を当該電子メールアドレス宛で送信することを特徴とする請求項6に記載の情報処理システム。
  10. 外部装置との間でやり取りされた電子メールのテキストからキーワードを抽出するキーワード抽出部と、
    キーワードに基づくデータベース検索を行う検索実行部と、
    を備えたコンピュータによるデータベースの検索方法において、
    前記キーワード抽出部が、所定のスレッドにおける前記電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合にのみ、当該スレッド内の前記電子メールを抽出対象として、データベース検索に用いるキーワードを抽出するステップと、
    前記キーワード抽出部が、抽出した前記キーワードを所定のキーワード記憶手段に格納するステップと、
    前記検索実行部が、前記キーワード記憶手段に格納された前記キーワードを用いてデータベース検索を行うステップと
    を含むことを特徴とするデータベースの検索方法。
  11. 前記キーワード抽出部が前記キーワードを抽出するステップでは、前記電子メールのテキストを形態素解析して得られた単語をキーワードとして抽出することを特徴とする請求項10に記載のデータベースの検索方法。
  12. 前記キーワード抽出部がデータベース検索を行うステップは、予め定められた所定のタイミングで繰り返され、前記キーワードに該当する新規に登録された情報を随時検索することを特徴とする請求項10に記載のデータベースの検索方法。
  13. 外部装置との間でやり取りされた電子メールのテキストからデータベース検索に用いるキーワードを抽出するキーワード抽出部と、
    前記キーワードをデータベースサーバへ送信する送信制御部と、
    を備えたコンピュータにおいて、
    前記キーワード抽出部に、
    前記電子メールの送受信アクションのパターンを解析する処理と、
    前記送受信アクションのパターンが、所定のスレッドにおける前記電子メールの送受信アクションが受信のみまたは発信から始まって所定回数の送受信の後発信で終了している場合にのみ、当該スレッド内の当該電子メールを抽出対象として、前記キーワードを抽出する処理と、を実行させ、
    前記送信制御部に、前記キーワード抽出部により抽出された前記キーワードをデータベース検索の検索条件として前記データベースサーバへ送信する処理を実行させることを特徴とするプログラム。
  14. 前記キーワードを抽出する処理では、前記キーワード抽出部が、前記電子メールのテキストを形態素解析して得られた単語をキーワードとして抽出することを特徴とする請求項13に記載のプログラム。
  15. 前記キーワードを抽出する処理では、前記キーワード抽出部が、前記テキストから得られた単語のうち、出現頻度の高い所定個数の単語をキーワードとして抽出することを特徴とする請求項14に記載のプログラム。
JP2003292210A 2003-08-12 2003-08-12 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム Expired - Lifetime JP4378131B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2003292210A JP4378131B2 (ja) 2003-08-12 2003-08-12 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム
US10/911,305 US20050038797A1 (en) 2003-08-12 2004-08-04 Information processing and database searching
CNB200410056434XA CN1279479C (zh) 2003-08-12 2004-08-10 信息处理设备、信息处理系统、数据库搜索方法和程序

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003292210A JP4378131B2 (ja) 2003-08-12 2003-08-12 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム

Publications (2)

Publication Number Publication Date
JP2005063138A JP2005063138A (ja) 2005-03-10
JP4378131B2 true JP4378131B2 (ja) 2009-12-02

Family

ID=34131707

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003292210A Expired - Lifetime JP4378131B2 (ja) 2003-08-12 2003-08-12 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム

Country Status (3)

Country Link
US (1) US20050038797A1 (ja)
JP (1) JP4378131B2 (ja)
CN (1) CN1279479C (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7222297B2 (en) 2002-01-14 2007-05-22 International Business Machines Corporation System and method for using XML to normalize documents
CN1992613B (zh) * 2005-12-29 2010-09-08 腾讯科技(深圳)有限公司 一种即时通信号码索回的方法及其系统
KR100850848B1 (ko) * 2006-04-19 2008-08-06 주식회사 인터파크지마켓 웹사용자에 최적화된 광고 및 이벤트 제공 방법 및 시스템
US7503007B2 (en) * 2006-05-16 2009-03-10 International Business Machines Corporation Context enhanced messaging and collaboration system
CN100507915C (zh) * 2006-11-09 2009-07-01 华为技术有限公司 网络搜索方法、网络搜索设备和用户终端
CN100469006C (zh) * 2006-12-15 2009-03-11 腾讯科技(深圳)有限公司 一种网络信息推送方法及系统
DE102007007830A1 (de) * 2007-02-16 2008-08-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und Vorrichtung und Verfahren zum Lesen eines Datenstroms
JP2008257317A (ja) * 2007-04-02 2008-10-23 Fuji Xerox Co Ltd 情報処理装置、情報処理システム及びプログラム
JP5348754B2 (ja) * 2008-02-12 2013-11-20 西日本電信電話株式会社 検索支援装置及び方法、ならびに、コンピュータプログラム
JP5278997B2 (ja) * 2008-03-10 2013-09-04 裕行 森田 メール加工転送サーバ、メール中継方法、およびプログラム
JP5470868B2 (ja) * 2009-01-20 2014-04-16 日本電気株式会社 情報通信システム、情報収集推薦装置、情報推薦方法および制御プログラム
KR101576036B1 (ko) * 2009-05-06 2015-12-21 삼성전자주식회사 반도체 소자 및 이의 제조방법
US8977979B2 (en) * 2010-12-06 2015-03-10 International Business Machines Corporation Social network relationship mapping
JP5415499B2 (ja) * 2011-09-13 2014-02-12 ヤフー株式会社 情報表示装置、方法及びプログラム
JP5843710B2 (ja) * 2012-06-29 2016-01-13 Kddi株式会社 送信制御装置、送信制御方法、およびプログラム
CN102937975B (zh) * 2012-10-17 2016-06-29 奇飞翔艺(北京)软件有限公司 一种网页搜索设备和方法
CN103412852B (zh) * 2013-08-21 2017-12-15 广东电子工业研究院有限公司 一种自动提取英文文献关键信息的方法
CN103501241B (zh) * 2013-09-18 2017-02-01 华为技术有限公司 垃圾文件清理方法、装置和系统
JP2015038781A (ja) * 2014-11-25 2015-02-26 レノボ・イノベーションズ・リミテッド(香港) 情報処理装置、興味情報提供方法および興味情報提供プログラム
US10471348B2 (en) 2015-07-24 2019-11-12 Activision Publishing, Inc. System and method for creating and sharing customized video game weapon configurations in multiplayer video games via one or more social networks

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3622503B2 (ja) * 1998-05-29 2005-02-23 株式会社日立製作所 特徴文字列抽出方法および装置とこれを用いた類似文書検索方法および装置並びに特徴文字列抽出プログラムを格納した記憶媒体および類似文書検索プログラムを格納した記憶媒体
AU5910699A (en) * 1998-09-18 2000-04-10 Tacit Knowledge Systems Method of constructing and displaying an entity profile constructed utilizing input from entities other than the owner
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US6915308B1 (en) * 2000-04-06 2005-07-05 Claritech Corporation Method and apparatus for information mining and filtering
US8230323B2 (en) * 2000-12-06 2012-07-24 Sra International, Inc. Content distribution system and method
GB2375192B (en) * 2001-04-27 2003-04-16 Premier Systems Technology Ltd Search engine systems
US7222297B2 (en) * 2002-01-14 2007-05-22 International Business Machines Corporation System and method for using XML to normalize documents
CN1647073B (zh) * 2002-03-29 2010-05-26 索尼株式会社 信息搜索系统、信息处理设备和方法、及信息搜索设备和方法
US20040006547A1 (en) * 2002-07-03 2004-01-08 Dehlinger Peter J. Text-processing database
JP4226862B2 (ja) * 2002-08-29 2009-02-18 株式会社リコー 文書検索装置
JP4362311B2 (ja) * 2003-04-30 2009-11-11 富士通株式会社 電子メール装置および情報付加プログラム
JP2004348591A (ja) * 2003-05-23 2004-12-09 Canon Inc 文書検索方法及び装置
US8131756B2 (en) * 2006-06-21 2012-03-06 Carus Alwin B Apparatus, system and method for developing tools to process natural language text

Also Published As

Publication number Publication date
CN1581171A (zh) 2005-02-16
US20050038797A1 (en) 2005-02-17
JP2005063138A (ja) 2005-03-10
CN1279479C (zh) 2006-10-11

Similar Documents

Publication Publication Date Title
JP4378131B2 (ja) 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム
KR101031942B1 (ko) 접속 소스들로부터 수집된 접속 정보를 찾아내는 시스템 및방법
US6779021B1 (en) Method and system for predicting and managing undesirable electronic mail
JP5003271B2 (ja) 電子通信文書のコピーが格納されている電子通信文書を関係者に示す方法及びプログラム、ならびに、電子通信文書が格納されていることを関係者と寄稿者とのうちの少なくとも一方に示す方法、システム、及び機器
US7543237B2 (en) Dynamic collaboration assistant
US7580568B1 (en) Methods and systems for identifying an image as a representative image for an article
US20030074409A1 (en) Method and apparatus for generating a user interest profile
US20100070584A1 (en) Method and system for dynamic e-mail view conversion
CN1825311A (zh) 用于从多个联系人源聚集联系人信息的方法和系统
JP2006243802A (ja) 情報処理システム、プログラム及び情報処理方法
JP5187955B2 (ja) 電子メールの送信先の設定を支援する装置及び方法
CN114143282A (zh) 邮件处理方法、装置、设备及存储介质
US8805933B2 (en) System and method for building interest profiles from related messages
JPH11275137A (ja) 電子メール管理支援方法およびそのプログラム記録媒体
US20070150541A1 (en) Inbox management for threaded message views
JP2006252220A (ja) コミュニケーション分析装置、およびコミュニケーション分析方法、並びにコンピュータ・プログラム
JP4802523B2 (ja) 電子メッセージ分析装置および方法
KR20200020192A (ko) 대화방 제공 방법 및 단말
JP2010079674A (ja) ファイル関連付け装置、方法及びプログラム
JPH02116242A (ja) 電子メールシステム
JP6612542B2 (ja) マッチング装置、マッチングシステム、マッチング方法及びプログラム
KR100851434B1 (ko) 메타 데이터에 기반한 데이터 송수신 방법 및 시스템
KR20000050045A (ko) 전자 메시지 자동 응답 시스템 및 방법
JP2002342347A (ja) 知識蓄積支援システムおよび同システムにおける公開まとめ提供方法
JP5656254B2 (ja) コミュニケーションイベントログ作成システム、コミュニケーションイベントログ作成方法およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20030814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040614

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070326

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070619

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070710

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20070803

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20071029

RD13 Notification of appointment of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7433

Effective date: 20080124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090813

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20090903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090914

R150 Certificate of patent or registration of utility model

Ref document number: 4378131

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120918

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130918

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term