JP5665683B2 - 重要度判定装置、重要度判定方法およびプログラム - Google Patents
重要度判定装置、重要度判定方法およびプログラム Download PDFInfo
- Publication number
- JP5665683B2 JP5665683B2 JP2011167222A JP2011167222A JP5665683B2 JP 5665683 B2 JP5665683 B2 JP 5665683B2 JP 2011167222 A JP2011167222 A JP 2011167222A JP 2011167222 A JP2011167222 A JP 2011167222A JP 5665683 B2 JP5665683 B2 JP 5665683B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- category
- importance
- user
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
なお、本実施形態における構成要素は適宜、既存の構成要素等との置き換えが可能であり、また、他の既存の構成要素との組合せを含む様々なバリエーションが可能である。したがって、本実施形態の記載をもって、特許請求の範囲に記載された発明の内容を限定するものではない。
図1から図6を用いて、本発明の第1の実施形態に係る重要度判定装置について説明する。本実施形態に係る重要度判定装置は、図1に示すように、クライアントモジュール101〜105とサービス提供サーバ300との間に配置され、データを送受信するクライアントモジュール101とデータを送受信する他のクライアントモジュール102〜105からデータの重要度を判定するためのデータを受信して、利用者ごとに特徴ベクトルを作成し、新たに送られてくるデータXと作成した特徴ベクトルYとの類似度を演算式により、数値化し、評価してデータの重要度を判定するものである。つまり、クライアントモジュール101は、データを収集し、解析し、評価する機能を有する。
図2を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図2に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部612とから構成されている。
図6を用いて、本実施形態に係る重要度判定装置の処理について説明する。
まず、事前処理として、不要データの削除、データの抽象化、データの圧縮を行う。
<第2の実施形態>
図7を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図7に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部613とから構成されている。図7に示すように、なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
まず、ユーザがネットワークに送信するデータを受信し(ステップS201)、受信後のデータを各利用者ごとに分類する(ステップS202)。
図9を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図9に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部614とから構成されている。図9に示すように、なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
まず、ユーザがネットワークに送信するデータを受信し(ステップS301)、受信後のデータを各利用者ごとに分類する(ステップS302)。
<第4の実施形態>
図11を用いて、本実施形態に係る重要度判定装置の構成について説明する。本実施形態に係る重要度判定装置は、図11に示すように、制御部201と、データ読込処理部202と、データ出力処理部203と、通信モジュールドライバ204と、データ圧縮処理部205と、データ特徴量抽出処理部610と、木構造データ管理部215と、ユーザ設定パラメータ管理部216とから構成されている。また、データ特徴量抽出処理部610は、データ事前処理部212と、特徴ベクトル作成処理部611と、評価ポイント算出処理部615とから構成されている。図9に示すように、なお、第1の実施形態と同一の符号を付す構成要素は、同様の機能を有するものであるから、その詳細な説明は省略する。
まず、新規文書の語彙の集合m、既存文書の語彙の集合m´、カテゴリーcに所属している既存文書の数Nに対し、JN(c)を次の数12のように定義する。
まず、ユーザがネットワークに送信するデータを受信し(ステップS401)、受信後のデータを各利用者ごとに分類する(ステップS402)。次に、分類したデータについて、その重要度を判定できるように加工し(ステップS403)、加工したデータを保存し、保存したデータから利用者ごとに特徴ベクトルを作成する(ステップS404)。
102;クアントモジュール
103;クアントモジュール
104;クアントモジュール
105;クアントモジュール
200;重要度判定装置
201;制御部
202;データ読込処理部
203;データ出力処理部
204;通信モジュールドライバ
205;データ圧縮処理部
212;データ事前処理部
215;木構造データ管理部
216;ユーザ設定パラメータ管理部
300;サービス提供サーバ
610;データ特徴量抽出処理部
611;特徴ベクトル作成処理部
612;評価ポイント算出処理部
613;評価ポイント算出処理部
614;評価ポイント算出処理部
615;評価ポイント算出処理部
Claims (12)
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信後のデータを各利用者ごとに分類する分類手段と、
該分類したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータXと前記作成した特徴ベクトルYとからデータの重要度を判定する判定手段と、
を備え、
前記判定手段が、新規文書で初めて出現した語(新規語)の出現総数をnnew、新規文書とカテゴリーcに出現する語の全種類数をNとするとしたときに、数1の値が最小となるようなカテゴリーに前記新たに送られてくるデータXを分類するカテゴリー分類手段を備え、分類したデータX 1 と前記作成した特徴ベクトルYとの類似度を数2に示す演算式の値を求めて評価してデータの重要度を判定することを特徴とする重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信後のデータを各利用者ごとに分類する分類手段と、
該分類したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータXと前記作成した特徴ベクトルYとからデータの重要度を判定する判定手段と、
を備え、
前記判定手段が、数3におけるPが最小となるようなカテゴリーに新たに送られてくるデータXを分類するカテゴリー分類手段を備え、分類したデータX 2 と前記作成した特徴ベクトルYとの類似度を数4に示す演算式の値を求めて評価してデータの重要度を判定することを特徴とする重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信後のデータを各利用者ごとに分類する分類手段と、
該分類したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する演算手段と、
前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも大きく、かつ、他のカテゴリーについては、上記の関係と逆の関係である場合に、前記新たに送られてくるデータXが前記カテゴリーcに属すると判定するカテゴリー判定手段と、
前記判定したカテゴリーに分類したデータX 3 と前記作成した特徴ベクトルYとの類似度を数5に示す演算式の値を求めて評価してデータの重要度を判定する判定手段と、
を備えたことを特徴とする重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定装置であって、
前記ユーザから送られてくるネットワークを流れるデータを受信する受信手段と、
該受信後のデータを各利用者ごとに分類する分類手段と、
該分類したデータを保存する保存手段と、
該保存したデータから利用者ごとに特徴ベクトルを作成する特徴ベクトル作成手段と、
新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する演算手段と、
前記あるカテゴリーcに属する確率が、カテゴリーc以外の2以上のカテゴリーに属する確率よりも大きい、もしくは、前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも小さい場合に、前記新たに送られてくるデータXが前記演算手段で求める前記あるカテゴリーcに属する確率とカテゴリーc以外のカテゴリーに属する確率との差が最も大きなカテゴリーに属すると判定するカテゴリー判定手段と、
前記判定したカテゴリーに分類したデータX 4 と前記作成した特徴ベクトルYとの類似度を数6に示す演算式の値を求めて評価してデータの重要度を判定する判定手段と、を備えたことを特徴とする重要度判定装置。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法であって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
新規文書で初めて出現した語(新規語)の出現総数をnnew、新規文書とカテゴリーcに出現する語の全種類数をNとするとしたときに、数7の値が最小となるようなカテゴリーに新たに送られてくるデータXを分類する第4のステップと、
分類したデータX 5 と前記作成した特徴ベクトルYとの類似度を数8に示す演算式の値を求めて評価してデータの重要度を判定する第5のステップと、
を備えたことを特徴とする重要度判定方法。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法であって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
数9におけるPが最小となるようなカテゴリーに新たに送られてくるデータXを分類する第4のステップと、
分類したデータX 6 と前記作成した特徴ベクトルYとの類似度を数10に示す演算式の値を求めて評価してデータの重要度を判定する第5のステップと、
を備えたことを特徴とする重要度判定方法。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法であって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
前記新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する第4のステップと、
前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも大きく、かつ、他のカテゴリーについては、上記の関係と逆の関係である場合に、前記新たに送られてくるデータXが前記カテゴリーcに属すると判定する第5のステップと、
前記判定したカテゴリーに分類したデータX 7 と前記作成した特徴ベクトルYとの類似度を数11に示す演算式の値を求めて評価してデータの重要度を判定する第6のステップと、
を備えたことを特徴とする重要度判定方法。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法であって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
前記新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する第4のステップと、
前記あるカテゴリーcに属する確率が、カテゴリーc以外の2以上のカテゴリーに属する確率よりも大きい、もしくは、前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも小さい場合に、前記新たに送られてくるデータXが前記第4のステップで求める前記あるカテゴリーcに属する確率とカテゴリーc以外のカテゴリーに属する確率との差が最も大きなカテゴリーに属すると判定する第5のステップと、
前記判定したカテゴリーに分類したデータX 8 と前記作成した特徴ベクトルYとの類似度を数12に示す演算式の値を求めて評価してデータの重要度を判定する第6のステップと、
を備えたことを特徴とする重要度判定方法。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法をコンピュータに実行させるためのプログラムであって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
新規文書で初めて出現した語(新規語)の出現総数をnnew、新規文書とカテゴリーcに出現する語の全種類数をNとするとしたときに、数13の値が最小となるようなカテゴリーに新たに送られてくるデータXを分類する第4のステップと、
分類したデータX 9 と前記作成した特徴ベクトルYとの類似度を数14に示す演算式の値を求めて評価してデータの重要度を判定する第5のステップと、
をコンピュータに実行させるためのプログラム。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法をコンピュータに実行させるためのプログラムであって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
数15におけるPが最小となるようなカテゴリーに新たに送られてくるデータXを分類する第4のステップと、
分類したデータX 10 と前記作成した特徴ベクトルYとの類似度を数16に示す演算式の値を求めて評価してデータの重要度を判定する第5のステップと、
をコンピュータに実行させるためのプログラム。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法をコンピュータに実行させるためのプログラムであって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
前記新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する第4のステップと、
前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも大きく、かつ、他のカテゴリーについては、上記の関係と逆の関係である場合に、前記新たに送られてくるデータXが前記カテゴリーcに属すると判定する第5のステップと、
前記判定したカテゴリーに分類したデータX 11 と前記作成した特徴ベクトルYとの類似度を数17に示す演算式の値を求めて評価してデータの重要度を判定する第6のステップと、
をコンピュータに実行させるためのプログラム。
- ユーザが送受信するデータの重要度を判定する重要度判定装置における重要度判定方法をコンピュータに実行させるためのプログラムであって、
前記ユーザがネットワークに送信するデータを受信する第1のステップと、
該受信後のデータを各利用者ごとに分類する第2のステップと、
該分類したデータを保存し、該保存したデータから利用者ごとに特徴ベクトルを作成する第3のステップと、
前記新たに送られてくるデータXが、あるカテゴリーcに属する確率と該あるカテゴリーc以外のカテゴリーに属する確率とを演算する第4のステップと、
前記あるカテゴリーcに属する確率が、カテゴリーc以外の2以上のカテゴリーに属する確率よりも大きい、もしくは、前記あるカテゴリーcに属する確率が、カテゴリーc以外のカテゴリーに属する確率よりも小さい場合に、前記新たに送られてくるデータXが前記第4のステップで求める前記あるカテゴリーcに属する確率とカテゴリーc以外のカテゴリーに属する確率との差が最も大きなカテゴリーに属すると判定する第5のステップと、
前記判定したカテゴリーに分類したデータX 12 と前記作成した特徴ベクトルYとの類似度を数18に示す演算式の値を求めて評価してデータの重要度を判定する第6のステップと、
をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011167222A JP5665683B2 (ja) | 2011-07-29 | 2011-07-29 | 重要度判定装置、重要度判定方法およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011167222A JP5665683B2 (ja) | 2011-07-29 | 2011-07-29 | 重要度判定装置、重要度判定方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013030098A JP2013030098A (ja) | 2013-02-07 |
JP5665683B2 true JP5665683B2 (ja) | 2015-02-04 |
Family
ID=47787063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011167222A Expired - Fee Related JP5665683B2 (ja) | 2011-07-29 | 2011-07-29 | 重要度判定装置、重要度判定方法およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5665683B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106991092B (zh) * | 2016-01-20 | 2021-11-05 | 阿里巴巴集团控股有限公司 | 基于大数据挖掘相似裁判文书的方法和设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1115756A (ja) * | 1997-06-24 | 1999-01-22 | Omron Corp | 電子メール判別方法及び装置並びに記憶媒体 |
JPH1115848A (ja) * | 1997-06-26 | 1999-01-22 | Sharp Corp | 情報分類装置、文書情報分類方法及び同方法の実行に用いる記録媒体 |
JP2003122676A (ja) * | 2001-10-11 | 2003-04-25 | Nippon Telegr & Teleph Corp <Ntt> | メール送受信システム、モバイル端末及びメール送受信方法 |
-
2011
- 2011-07-29 JP JP2011167222A patent/JP5665683B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2013030098A (ja) | 2013-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112019569B (zh) | 恶意域名检测方法、装置及存储介质 | |
US11032304B2 (en) | Ontology based persistent attack campaign detection | |
US9372901B2 (en) | Searching for software applications based on application attributes | |
US11074310B2 (en) | Content-based management of links to resources | |
US10204386B2 (en) | Distance-based social message pruning | |
CN111597449B (zh) | 用于搜索的候选词构建方法、装置、电子设备及可读介质 | |
US12045843B2 (en) | Systems and methods for tracking data shared with third parties using artificial intelligence-machine learning | |
US20130041962A1 (en) | Information Filtering | |
US11507747B2 (en) | Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents | |
US20130103678A1 (en) | Processing Search Queries Using A Data Structure | |
CN110147223B (zh) | 组件库的生成方法、装置及设备 | |
JP5757208B2 (ja) | キーワード抽出システム、キーワード抽出方法及びプログラム | |
Fang et al. | Fine-grained HTTP web traffic analysis based on large-scale mobile datasets | |
JPWO2014203402A1 (ja) | 情報提供装置、情報提供方法及びプログラム | |
JP5665683B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
KR20220054814A (ko) | 시스템 보안 유지 | |
JP5555238B2 (ja) | ベイジアンネットワーク構造学習のための情報処理装置及びプログラム | |
JP5665685B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
JP5649466B2 (ja) | 重要度判定装置、重要度判定方法およびプログラム | |
KR20210000041A (ko) | 로그 데이터의 실시간 분석 방법 및 그 장치 | |
JP6274973B2 (ja) | ユーザ特定装置、ユーザ特定方法、およびプログラム | |
CN110263082B (zh) | 数据库的数据分布分析方法、装置、电子设备及存储介质 | |
JP6749865B2 (ja) | 情報収集装置、および、情報収集方法 | |
CN104462492B (zh) | 抓取问答类网页的方法和装置 | |
JP2006228141A (ja) | 情報推薦システム、管理装置、情報推薦方法およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140312 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140829 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140909 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141202 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5665683 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |