JP2009140437A - フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 - Google Patents
フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 Download PDFInfo
- Publication number
- JP2009140437A JP2009140437A JP2007318833A JP2007318833A JP2009140437A JP 2009140437 A JP2009140437 A JP 2009140437A JP 2007318833 A JP2007318833 A JP 2007318833A JP 2007318833 A JP2007318833 A JP 2007318833A JP 2009140437 A JP2009140437 A JP 2009140437A
- Authority
- JP
- Japan
- Prior art keywords
- discretization
- target data
- data
- processing target
- filtering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
【解決手段】フィルタリング装置200は、第1フィルタによって処理対象データ301を構成する各要素について前記処理対象データにおける出力確率を算出し、この出力確率に基づいて有効値/無効値に離散化する。そして、第2フィルタによって、第1フィルタによって有効値/無効値に離散化された要素を、処理対象データを構成する要素に追加し、当該追加された要素を含んだ各要素の出力確率を算出し、算出された出力確率に基づいて前記各要素を有効値/無効値に離散化することにより、処理対象データが所望のデータであるか否かを判定する。
【選択図】図3
Description
まず、本発明にかかるフィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置におけるフィルタリング処理の概要について説明する。図1は、本発明にかかるフィルタリング処理の概要を示す説明図である。
まず、本実施の形態にかかるフィルタリング装置のハードウェア構成について説明する。図2は、本実施の形態にかかるフィルタリング装置のハードウェア構成の一例を示すブロック図である。
つぎに、本実施の形態にかかるフィルタリング装置200の機能的構成について説明する。図3は、本実施の形態にかかるフィルタリング装置の機能的構成を示すブロック図である。図3に示すように、フィルタリング装置200は、解析部310と、第1算出部320および第1離散化部330からなる第1フィルタと、第2算出部340および第2離散化部350からなる第2フィルタと、受付部360と、調整部370とを含んで構成される。
つぎに、本実施の形態にかかるフィルタリング装置200の処理手順について説明する。図4は、本実施の形態にかかるフィルタリング装置の処理手順を示すフローチャートである。図4のフローチャートにおいて、まず、フィルタリング装置200に処理対象データ301が入力されたか否かを判定する(ステップS401)。
つぎに、第1離散化部330および第2離散化部350における離散化の手法について説明する。上述したように、第1離散化部330および第2離散化部350における離散化の手法に特に限定はない。ここで、簡易で効率的な手法の一例として、任意の関数に写像する手法を説明する。図5は、ある単語の出力確率を任意の関数により写像した図である。また、図6は、単語数ごとの出力確率を任意の関数により写像した図である。
201 CPU
202 ROM
203 RAM
204 HDD
205 HD
206 FDD
207 FD
208 CD−RWドライブ
209 CD−RW
210 ディスプレイ
211 キーボード
212 マウス
213 ネットワークI/F
214 通信ケーブル
215 プリンタ
220 バス
301 処理対象データ
302 ユーザ判定情報
310 解析部
320 第1算出部
330 第1離散化部
340 第2算出部
350 第2離散化部
360 受付部
370 調整部
Claims (8)
- 処理対象データがユーザの所望するデータであるか否かを判定するフィルタリング処理方法であって、
前記処理対象データを構成する要素を解析する解析工程と、
前記解析工程によって解析された各要素について前記処理対象データにおける出力確率を算出する第1の算出工程と、
前記解析工程によって解析された各要素を、前記第1の算出工程によって算出された出力確率に基づいて有効値/無効値に離散化する第1の離散化工程と、
前記第1の離散化工程によって有効値/無効値に離散化された要素を、前記処理対象データを構成する要素に追加し、当該追加された要素を含んだ各要素の出力確率を算出する第2の算出工程と、
前記第2の算出工程によって算出された出力確率に基づいて前記各要素を有効値/無効値に離散化することにより、処理対象データが所望のデータであるか否かを判定する第2の離散化工程と、
を含むことを特徴とするフィルタリング処理方法。 - 前記第2の離散化工程による判断の正誤を受け付ける受付工程と、
前記受付工程によって受け付けた誤判定とされた処理対象データを構成する各要素に関して、前記第1の算出工程にて算出される出力確率を調整する調整工程と、
を含むことを特徴とする請求項1に記載のフィルタリング処理方法。 - 前記第1の離散化工程および第2の離散化工程の少なくとも一方では、前記各要素を任意の関数に写像して得られた値を用いて離散化をおこなうことを特徴とする請求項1または2に記載のフィルタリング処理方法。
- 前記第1の離散化工程および第2の離散化工程の少なくとも一方では、前記各要素の出力確率と、あらかじめ設定した閾値との比較結果から有効値/無効値に離散化することを特徴とする請求項1または2に記載のフィルタリング処理方法。
- 前記解析工程では、前記処理対象データが電子メールデータである場合、当該電子メールデータのヘッダと本文に対して解析をおこなうことを特徴とする請求項1〜4のいずれか一つに記載のフィルタリング処理方法。
- 処理対象データがユーザの所望するデータであるか否かをコンピュータに判定させるフィルタリング処理プログラムであって、
前記処理対象データを構成する要素を解析させる解析工程と、
前記解析工程によって解析させた各要素について前記処理対象データにおける出力確率を算出させる第1の算出工程と、
前記解析工程によって解析させた各要素を、前記算出工程によって算出させた出力確率に基づいて有効値/無効値に離散化させる第1の離散化工程と、
前記第1の離散化工程によって有効値/無効値に離散化させた要素を、前記処理対象データを構成する要素に追加し、当該追加された要素を含んだ各要素の出力確率を算出させる第2の算出工程と、
前記第2の算出工程によって算出された出力確率に基づいて前記各要素を有効値/無効値に離散化させることにより、処理対象データが所望のデータであるか否かを判定させる第2の離散化工程と、
をコンピュータに実行させることを特徴とするフィルタリング処理プログラム。 - 前記第2の離散化工程による判断の正誤を受け付ける受付工程と、
前記受付工程によって受け付けた誤判定とされた処理対象データを構成する各要素に関して、前記第1の算出工程にて算出される出力確率を調整させる調整工程と、
をコンピュータに実行させることを特徴とする請求項6に記載のフィルタリング処理プログラム。 - 処理対象データがユーザの所望するデータであるか否かを判定するフィルタリング装置であって、
前記処理対象データを構成する要素を解析する解析手段と、
前記解析手段によって解析された各要素について前記処理対象データにおける出力確率を算出する第1の算出手段と、
前記解析手段によって解析された各要素を、前記第1の算出手段によって算出された出力確率に基づいて有効値/無効値に離散化する第2の離散化手段と、
前記第1の離散化手段によって有効値/無効値に離散化された要素を、前記処理対象データを構成する要素に追加し、当該追加された要素を含んだ各要素の出力確率を算出する第2の算出手段と、
前記第2の算出手段によって算出された出力確率に基づいて前記各要素を有効値/無効値に離散化することにより、処理対象データが所望のデータであるか否かを判定する第2の離散化手段と、
前記第2の離散化手段による判断の正誤を受け付ける受付手段と、
前記受付手段によって受け付けた誤判定とされた処理対象データを構成する各要素に関して、前記第1の算出手段にて算出される出力確率を調整する調整手段と、
を備えることを特徴とするフィルタリング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007318833A JP5032286B2 (ja) | 2007-12-10 | 2007-12-10 | フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007318833A JP5032286B2 (ja) | 2007-12-10 | 2007-12-10 | フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009140437A true JP2009140437A (ja) | 2009-06-25 |
JP5032286B2 JP5032286B2 (ja) | 2012-09-26 |
Family
ID=40870944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007318833A Expired - Fee Related JP5032286B2 (ja) | 2007-12-10 | 2007-12-10 | フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5032286B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011138260A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | メールチェック装置、メールチェックプログラム、およびメールチェック方法 |
JP2014502754A (ja) * | 2010-12-24 | 2014-02-03 | 北大方正集▲団▼有限公司 | インターネットにおける有害情報の遮断方法と装置 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001028006A (ja) * | 1999-07-15 | 2001-01-30 | Kdd Corp | 情報自動フィルタリング方法および装置 |
JP2004326485A (ja) * | 2003-04-25 | 2004-11-18 | Geo Japan Inc | 電話再診料精算システム |
JP2004348523A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書フィルタリングシステムとプログラム |
JP2005011326A (ja) * | 2003-06-20 | 2005-01-13 | Microsoft Corp | スパムフィルタの不明瞭化 |
JP2005115914A (ja) * | 2003-06-30 | 2005-04-28 | Microsoft Corp | 緊急度または重要度に関してメッセージを分類するシステムにおけるバルクメールフィルタの使用 |
JP2006514371A (ja) * | 2003-02-25 | 2006-04-27 | マイクロソフト コーポレーション | 適応型ジャンクメッセージフィルタリングシステム |
JP2007122146A (ja) * | 2005-10-25 | 2007-05-17 | Just Syst Corp | 電子メール評価装置および電子メール評価方法 |
JP2007122145A (ja) * | 2005-10-25 | 2007-05-17 | Just Syst Corp | 電子メール評価装置および電子メール評価方法 |
-
2007
- 2007-12-10 JP JP2007318833A patent/JP5032286B2/ja not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001028006A (ja) * | 1999-07-15 | 2001-01-30 | Kdd Corp | 情報自動フィルタリング方法および装置 |
JP2006514371A (ja) * | 2003-02-25 | 2006-04-27 | マイクロソフト コーポレーション | 適応型ジャンクメッセージフィルタリングシステム |
JP2004326485A (ja) * | 2003-04-25 | 2004-11-18 | Geo Japan Inc | 電話再診料精算システム |
JP2004348523A (ja) * | 2003-05-23 | 2004-12-09 | Nippon Telegr & Teleph Corp <Ntt> | 文書フィルタリングシステムとプログラム |
JP2005011326A (ja) * | 2003-06-20 | 2005-01-13 | Microsoft Corp | スパムフィルタの不明瞭化 |
JP2005115914A (ja) * | 2003-06-30 | 2005-04-28 | Microsoft Corp | 緊急度または重要度に関してメッセージを分類するシステムにおけるバルクメールフィルタの使用 |
JP2007122146A (ja) * | 2005-10-25 | 2007-05-17 | Just Syst Corp | 電子メール評価装置および電子メール評価方法 |
JP2007122145A (ja) * | 2005-10-25 | 2007-05-17 | Just Syst Corp | 電子メール評価装置および電子メール評価方法 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011138260A (ja) * | 2009-12-28 | 2011-07-14 | Fujitsu Ltd | メールチェック装置、メールチェックプログラム、およびメールチェック方法 |
JP2014502754A (ja) * | 2010-12-24 | 2014-02-03 | 北大方正集▲団▼有限公司 | インターネットにおける有害情報の遮断方法と装置 |
Also Published As
Publication number | Publication date |
---|---|
JP5032286B2 (ja) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110276446B (zh) | 模型训练和选择推荐信息的方法和装置 | |
Harrison et al. | A brief introduction to mixed effects modelling and multi-model inference in ecology | |
Escalona et al. | A comparison of tools for the simulation of genomic next-generation sequencing data | |
CN1457041B (zh) | 为一个自然语言理解系统用来自动注解训练数据的一个系统 | |
US10345922B2 (en) | Office system prediction configuration sharing | |
US20070250504A1 (en) | Office System Content Prediction Based On Regular Expression Pattern Analysis | |
JP2011222017A (ja) | 技術設計最適化における最も影響力のある設計変数の識別方法 | |
US9542381B2 (en) | Automatic training of a syntactic and semantic parser using a genetic algorithm | |
US20100325539A1 (en) | Web based spell check | |
US20070168959A1 (en) | Method and system for reviewing text files using distributable review data packets | |
JP2022501735A (ja) | コンピュータプログラムに組み込まれたデータを自動的に検証する方法 | |
JP4936295B2 (ja) | コンピュータ・システムにより実行されるアクセシビリティ・メタデータの作成・拡張・検証を支援する方法 | |
US11082369B1 (en) | Domain-specific chatbot utterance collection | |
US20160293045A1 (en) | Vocabulary learning support system | |
WO2021055096A1 (en) | Machine learning system for summarizing tax documents with non-structured portions | |
WO2024045527A1 (zh) | 词句的纠错方法、装置、可读存储介质和计算机程序产品 | |
KR102496030B1 (ko) | 데이터 분류를 위한 강화 학습 장치 및 방법 | |
WO2016200408A1 (en) | Hybrid classification system | |
JP2024096950A (ja) | 分散コンピューティングデバイスの自動制御 | |
JP5032286B2 (ja) | フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 | |
TW202219755A (zh) | 整合流程及自動資料分析的自動化流程機器人系統、方法、非暫態電腦可讀取記錄媒體、以及電腦程式產品 | |
JP5969734B2 (ja) | 分散モデル同定 | |
JP2020530629A (ja) | データレコード内のフォーマットを動的に定義する技術 | |
Golovko et al. | Slim-Filter: an interactive windows-based application for illumina genome analyzer data assessment and manipulation | |
CN109597638B (zh) | 基于实时计算引擎解决数据处理、设备联动的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120301 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120306 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120529 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5032286 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150706 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |