JP4802523B2 - 電子メッセージ分析装置および方法 - Google Patents
電子メッセージ分析装置および方法 Download PDFInfo
- Publication number
- JP4802523B2 JP4802523B2 JP2005068726A JP2005068726A JP4802523B2 JP 4802523 B2 JP4802523 B2 JP 4802523B2 JP 2005068726 A JP2005068726 A JP 2005068726A JP 2005068726 A JP2005068726 A JP 2005068726A JP 4802523 B2 JP4802523 B2 JP 4802523B2
- Authority
- JP
- Japan
- Prior art keywords
- electronic message
- cluster
- user
- sender
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000004458 analytical method Methods 0.000 title claims description 37
- 238000000034 method Methods 0.000 title description 78
- 230000005540 biological transmission Effects 0.000 claims description 52
- 239000013598 vector Substances 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 2
- 238000011144 upstream manufacturing Methods 0.000 claims 1
- 230000008569 process Effects 0.000 description 69
- 238000012545 processing Methods 0.000 description 32
- 238000001514 detection method Methods 0.000 description 11
- 230000008520 organization Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000007405 data analysis Methods 0.000 description 5
- 238000002360 preparation method Methods 0.000 description 3
- 239000008186 active pharmaceutical agent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000000877 morphologic effect Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
[ステップS11]:最初の形態素(トークン)をTに代入する。
[ステップS12]:Tが空かどうかを判別し、空であれば、メール本文中の最後の形態素も処理されているので、tfの計算処理を終了する。空でなければステップS13へ進む。
[ステップS13]:キーワード辞書DICTを表引きしてTと一致するキーワードがあるかどうかを判別する。あればステップS14へ進み、なければ、ステップS14をスキップしてステップS15へ進む。
[ステップS14]:該当するキーワードのカウンタを1だけ増分する。
[ステップS15]:つぎの形態素をTに代入してステップS12へ進み処理を繰り返す。
メールMSの本文キーワードTS1,TS2,…,TStに対する重みwS1,wS2,…,wStを前述の式(1)を用いて計算する。メールMの本文キーワードの重みも同様に計算される。
[ステップS21]:DSとDMとの類似度(sim)を式(2)で計算する。
[ステップS22]:類似度が閾値より大きければステップS23へ進み、閾値以下であるべステップS24へ進む。
[ステップS23]:イエス(類似)を出力する。
[ステップS24]:ノー(非類似)を出力する。
[ステップS31]:typei=typejであればステップS32に進み、そうでなければステップS36へ進み、同一でないと判別する。
[ステップS32]:メールiおよびメールjの添付文書名をそれぞれnameiおよびnamejに代入する。
[ステップS33]:namei=namejであればステップS34へ進み、そうでなければステップS36へ進み、同一でないと判別する。
[ステップS34]:メールiおよびメールjの添付文書サイズをそれぞれsizeiおよびsizejに代入する。
[ステップS35、S36]:namei=namejであればステップS36に進み同一であると判別し、そうでなければ同一でないと判別する。以上で処理を終了する。複数の添付文書がある場合には処理を繰り返す。
[ステップS41]:経路増分処理を行なう。経路増分処理は、当該メールの受信者が発信したメールが同一内容の情報を点々と流通させるものかどうかを判別し同一内容の場合には図8の経路テーブルを一マス増分させる処理である。具体的にはメール本文が類似しているか、あるいは添付文書が同一の場合には同一内容が流通していると判別するが、これに限定されない。この経路増分処理の詳細は図10に示す。
[ステップS42]:MIDを1だけ増分してそのメールをMSに代入する。
[ステップS43]:MSが最後であれば処理を終了し、残っていればステップS41に戻って処理を繰り返す。
[ステップS51]:Uが発信したログ内の次のメールを送受信者特定部13に問い合わせて取得する。
[ステップS52]:Mが最後かどうかを判別し、最後であれば処理を終了する。最後でなければ、ステップS53へ進む。
[ステップS53]:出発点のメールMSと当該メールMSの受信者から発信されたメールMのそれぞれの添付文書の同一性を添付文書同一性判定部15に問い合わせ、同一性が高ければそのままステップS55へ進む。同一性が低ければステップS54へ進んで、メール本文を参照して判断する。
[ステップS54]:出発点のメールMSと当該メールMSの受信者から発信されたメールMのそれぞれの題名・本文の類似性をメール本文類似性判定部14に問い合わせ、類似性がなければステップS56へ進み、類似性が高ければステップS55へ進む。
[ステップS55]:MSの情報の次にMの情報を出力して経路テーブルを増分していく。
[ステップS56]:MをMSに代入する。その後ステップS51に戻り処理を繰り返す。
[ステップS61]:M0の送信者をU0に代入し、U0の部門または拠点をS0に代入する。
[ステップS62]:つぎのエントリのメールをM1に代入する。
[ステップS63]:M1が最後のエントリかどうかを判別し、最後であれば処理を終了し、最後でなければステップS64へ進む。
[ステップS64]:M1の送信者をU1に代入し、U1の部門または拠点をS1に代入する。
[ステップS65]:S0=S1かを判別し、イエスであればステップS62に戻り処理を繰り返し、ノーであればステップS66へ進む。
[ステップS66]:当該エントリと次のエントリとの間を境界として検出する。その後ステップS62に戻り処理を繰り返す。
[ステップS71]:最初のメールデータをMに代入する。
[ステップS72]:Mが最後かどうかを判別し、最後であればステップS75へ進む。最後でなければステップS73へ進む。
[ステップS73]:クラスタ作成部22によりクラスタを作成する。その処理例は図15〜図17を用いて後に詳述する。
[ステップS74]:次のメールデータをMに代入する。
[ステップS75]:クラスタ内データ処理部23によりクラスタ内データ処理を行なう。クラスタ内データ処理の例については図18〜図20を参照して後に説明する。
[ステップS81]:つぎのメールをNに代入する。
[ステップS82]:Nが最後のメールまたは境界外であればステップS86へ進む。そうでなければステップS83へ進む。
[ステップS83]:メールMとNの類似度sim(M,N)をTに代入する。
[ステップS84]:T>Sかどうかを判別し、イエスであればステップS85へ進み、そうでなければステップS81へ戻って処理を繰り返す。
[ステップS85]:TをSに代入し、NをCに代入する。
[ステップS86]:T>TH(閾値)かどうかを判別し、イエスであればステップS87へ進み、そうでなければ処理を終了する。
[ステップS87]:MとCとを1つのクラスタに併合する。
[ステップS91]:メールMの差出人をUに代入し、Mの宛先をVに代入する。
[ステップS92]:Vが境界内かどうかを判別する。境界内であればステップS93へ進む。境界外であれば処理を終了する。
[ステップS93]:UからVへの送信確率をQに代入する。
[ステップS94]:Q>Pを判別して、イエスであればステップS95へ進み、ノーであればステップS96へ進む。
[ステップS95]:QをPに代入し、MをCに代入する。
[ステップS96]:次のメールをMに代入する。
[ステップS97]:Mが最後かどうかを判別し、最後であれば処理を終了し、最後でなければステップS91へ戻って処理を繰り返す。
[ステップS101]:メールMの差出人をUに代入し、Mの宛先をVに代入する。
[ステップS102]:Vが境界内かどうかを判別する。境界内であればステップS103へ進む。境界外であれば処理を終了する。
[ステップS103]:UからVへの送信間隔をSに代入する。
[ステップS104]:S<Tを判別してイエスであればステップS105に進み、ノーであればステップS106へ進む。
[ステップS105]:SをTに代入し、MをCに代入する。
[ステップS106]:次のメールをMに代入する。
[ステップS107]:Mが最後かどうかを判別し、最後であれば処理を終了し、最後でなければステップS101へ戻って処理を繰り返す。
[ステップS111]:ネットワーク指標計算を行なう。これについては図19を参照して後に詳述する。
[ステップS112]:平均時間間隔を計算する。これについては図20を参照して後に詳述する。
[ステップS121]:Mの送信者をUに代入し、Mの受信者数をD(U)に代入し、N(U)を1だけ増分する。
[ステップS122]:クラスタ内の次のメールをMに代入する。
[ステップS123]:Mが最後かどうかを判別し、最後であればステップS123に進み、最後でなければステップS121に戻り処理を繰り返す。
[ステップS124]:各ユーザについてD(U)/N(U)を算出してOD(U)に代入する。
[ステップS131]:Mの送信者をUに代入し、次のメールまでの時間間隔をT(U)に代入し、T(U)を1だけ増分する。
[ステップS132]:クラスタ内の次のメールをMに代入する。
[ステップS133]:Mが最後かどうかを判別し、最後であればステップS133に進み、最後でなければステップS131に戻り処理を繰り返す。
[ステップS134]:各ユーザについてT(U)/N(U)を算出してMT(U)に代入する。
11 名簿データベース
12 メールデータ解析部
13 送受信者特定部
14 メール本文類似性判定部
15 添付文書同一性判定部
16 流通経路特定部
17 閾値設定部
18 境界検出部
19 境界設定部
20 境界内流通情報特定部
21 ユーザインタフェース部
22 クラスタ作成部
22 クラスタ内データ処理部
23 クラスタ内データ処理部
1000 電子メール分析システム
1001 コンピュータ
1002 記録媒体
2000 メールシステム
Claims (8)
- 電子メッセージのメールアドレスから送受信者を特定する送受信者特定手段と、
前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の本文の類似性を判定する本文類似性判定手段と、
前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の添付文書の同一性を判定する添付文書同一性判定手段と、
前記本文類似性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に本文の類似性があると判定した場合、または、前記添付文書同一性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に添付文書の同一性があると判定した場合、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の経路を、電子メッセージによる情報の流通の流通経路の構成要素として特定する流通経路特定手段と、
所定の分析境界内を流通する電子メッセージを、前記流通経路特定手段で特定された前記構成要素から成る流通経路に含まれる電子メッセージの間の類似度、当該電子メッセージの宛先関係または当該メッセージの間の送信間隔に基づいて、分類して、1または複数のクラスタを、作成するクラスタ作成手段と、
前記クラスタ作成手段により作成されたクラスタと、当該クラスタの各々に含まれる電子メッセージとを表示する表示手段とを有することを特徴とする電子メッセージ分析装置。 - 前記電子メーセージの送信者について、部門、拠点、アドレスのドメイン、予め決められたユーザ群、またはこれらの論理和、または論理積の値により前記分析境界を設定する分析境界設定手段をさらに有し、前記流通特定手段で特定された流通経路に沿う隣接する電子メッセージの上流側の当該電子メッセージの送信者と下流側の当該電子メッセージの送信者が、前記分析境界設定手段により前記分析境界を設定するために用いた値が異なるときに他の分析境界に移ったと判定する請求項1記載の電子メッセージ分析装置。
- 前記クラスタ作成手段は、前記電子メッセージの送信先としての指定回数に基づく確率データを用いてクラスタ作成基準となる宛先関係を決定し当該宛先関係の電子メッセージを同一のクラスタに含ませる請求項1または2記載の電子メッセージ分析装置。
- 前記クラスタ作成手段は、前記流通経路に沿って流通する第1の電子メッセージの送信時間間隔が当該流通経路に沿って直前に先行して流通する第2の電子メッセージの送信時間間隔より小さい場合に第2の電子メッセージと第1の電子メッセージとを同一のクラスタに含ませる請求項1または2記載の電子メッセージ分析装置。
- 前記クラスタ作成手段により作成されたクラスタごとに、当該クラスタに含まれる電子メッセージのキーワード重みベクトルに基づいて、当該クラスタのキーワードを特定する分析手段をさらに有する請求項1〜4のいずれかに記載の電子メッセージ分析装置。
- 電子メッセージは電子メールである請求項1〜5のいずれかに記載の電子メッセージ分析装置。
- 送受信者特定手段が、電子メッセージのメールアドレスから送受信者を特定するステップと、
本文類似性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の本文の類似性を判定するステップと、
添付文書同一性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の添付文書の同一性を判定するステップと、
前記本文類似性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に本文の類似性があると判定した場合、または、前記添付文書同一性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に添付文書の同一性があると判定した場合、流通経路特定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の経路を、電子メッセージによる情報の流通の流通経路の構成要素として特定するステップと、
クラスタ作成手段が、所定の分析境界内を流通する電子メッセージを、前記流通経路特定手段で特定された前記構成要素から成る流通経路に含まれる電子メッセージの間の類似度、当該電子メッセージの宛先関係または当該メッセージの間の送信間隔に基づいて、分類して、1または複数のクラスタを、作成するステップと、
表示手段が、前記クラスタ作成手段により作成されたクラスタと、当該クラスタの各々に含まれる電子メッセージとを表示するステップとを有することを特徴とする電子メッセージ分析方法。 - コンピュータを、
電子メッセージのメールアドレスから送受信者を特定する送受信者特定手段、
前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の本文の類似性を判定する本文類似性判定手段、
前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の添付文書の同一性を判定する添付文書同一性判定手段、
前記本文類似性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に本文の類似性があると判定した場合、または、前記添付文書同一性判定手段が、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間に添付文書の同一性があると判定した場合、前記送受信者特定手段により特定したユーザが送信先の電子メッセージと当該ユーザが送信元の電子メッセージとの間の経路を、電子メッセージによる情報の流通の流通経路の構成要素として特定する流通経路特定手段、
所定の分析境界内を流通する電子メッセージを、前記流通経路特定手段で特定された前記構成要素から成る流通経路に含まれる電子メッセージの間の類似度、当該電子メッセージの宛先関係または当該メッセージの間の送信間隔に基づいて、分類して、1または複数のクラスタを、作成するクラスタ作成手段、
前記クラスタ作成手段により作成されたクラスタと、当該クラスタの各々に含まれる電子メッセージとを表示する表示手段
として機能させることを特徴とする電子メッセージ分析用コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005068726A JP4802523B2 (ja) | 2005-03-11 | 2005-03-11 | 電子メッセージ分析装置および方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005068726A JP4802523B2 (ja) | 2005-03-11 | 2005-03-11 | 電子メッセージ分析装置および方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006252242A JP2006252242A (ja) | 2006-09-21 |
JP4802523B2 true JP4802523B2 (ja) | 2011-10-26 |
Family
ID=37092666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005068726A Expired - Fee Related JP4802523B2 (ja) | 2005-03-11 | 2005-03-11 | 電子メッセージ分析装置および方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4802523B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010066938A (ja) * | 2008-09-10 | 2010-03-25 | Nec Corp | コンテンツ情報管理システム、方法、装置、及びプログラム |
JP5215160B2 (ja) * | 2008-12-17 | 2013-06-19 | キヤノンItソリューションズ株式会社 | 情報処理装置、その制御方法及びプログラム |
JP6432266B2 (ja) * | 2014-10-03 | 2018-12-05 | 富士通株式会社 | グループ化方法、グループ化装置、およびグループ化プログラム |
US10447635B2 (en) * | 2017-05-17 | 2019-10-15 | Slice Technologies, Inc. | Filtering electronic messages |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3914082B2 (ja) * | 2002-03-27 | 2007-05-16 | 株式会社東芝 | 情報提示システムと情報提示方法 |
JP4344922B2 (ja) * | 2003-01-27 | 2009-10-14 | 富士ゼロックス株式会社 | 評価装置およびその方法 |
-
2005
- 2005-03-11 JP JP2005068726A patent/JP4802523B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2006252242A (ja) | 2006-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7657603B1 (en) | Methods and systems of electronic message derivation | |
US8725711B2 (en) | Systems and methods for information categorization | |
US9633140B2 (en) | Automated contextual information retrieval based on multi-tiered user modeling and dynamic retrieval strategy | |
JP5208358B2 (ja) | ナレッジ交換プロファイルを生成する方法、システム、および装置 | |
CN1716294B (zh) | 用于检测外发通信何时包含特定内容的方法和系统 | |
US7222157B1 (en) | Identification and filtration of digital communications | |
US8768940B2 (en) | Duplicate document detection | |
CN100527117C (zh) | 在含多个反垃圾邮件模块的系统中确定消息的方法和系统 | |
JP5003271B2 (ja) | 電子通信文書のコピーが格納されている電子通信文書を関係者に示す方法及びプログラム、ならびに、電子通信文書が格納されていることを関係者と寄稿者とのうちの少なくとも一方に示す方法、システム、及び機器 | |
US8341232B2 (en) | Relationship identification based on email traffic | |
US8271597B2 (en) | Intelligent derivation of email addresses | |
Mock | An experimental framework for email categorization and management | |
US8600965B2 (en) | System and method for observing communication behavior | |
US20050222890A1 (en) | Instant meeting preparation architecture | |
US20030074409A1 (en) | Method and apparatus for generating a user interest profile | |
JP2006048698A (ja) | 人間関係に基づいて通信に優先順位を付与する方法およびシステム | |
US7720853B1 (en) | Flexible rule-based infrastructure for discussion board maintenance | |
US8856135B2 (en) | Intelligent sorting and correlation of email traffic | |
JP2005063138A (ja) | 情報処理装置、情報処理システムおよびデータベースの検索方法並びにプログラム | |
JP4802523B2 (ja) | 電子メッセージ分析装置および方法 | |
US8458224B2 (en) | Auditing search requests in a relationship analysis system | |
Dredze et al. | Intelligent email: Reply and attachment prediction | |
JP2006252223A (ja) | コミュニケーション分析装置、およびコミュニケーション分析方法、並びにコンピュータ・プログラム | |
JP5324824B2 (ja) | ネットワーク・ノードを分類する情報処理装置、情報処理システム、情報処理方法およびプログラム | |
JP3804017B2 (ja) | 電子メールシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080221 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100629 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110323 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110725 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4802523 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |