TWI393391B - 可適性垃圾訊息過濾系統與方法 - Google Patents
可適性垃圾訊息過濾系統與方法 Download PDFInfo
- Publication number
- TWI393391B TWI393391B TW093101775A TW93101775A TWI393391B TW I393391 B TWI393391 B TW I393391B TW 093101775 A TW093101775 A TW 093101775A TW 93101775 A TW93101775 A TW 93101775A TW I393391 B TWI393391 B TW I393391B
- Authority
- TW
- Taiwan
- Prior art keywords
- filter
- message
- rate
- user
- spam
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Economics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Information Transfer Between Computers (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
- Communication Control (AREA)
- Selective Calling Equipment (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Compounds Of Unknown Constitution (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Mobile Radio Communication Systems (AREA)
Description
本發明係關於辨識出不想要的資訊(如,垃圾郵件)的系統及方法,及更特定地係關於可促進此一辨識功能之可適性過濾器。
全球通信網路(如網際網路)的來臨提供了接觸大量潛在客戶的商業機會。電子訊息,特別是電子郵件(“e-mail”)變得已逐漸普遍成為將所不想要的廣告及推銷(亦被稱為”垃圾信(spam)”)散布給網路使用者的一種方法。
Radicati Group公司(一家顧問及市場調查公司)在2002年八月所作的評估中指出每一天約有兩十億封垃圾郵件被寄發,而此數字預計每兩年成長三倍。個人及實體(如,公司,政府機關等等)逐漸變得不便且經常受到垃圾郵件的侵犯。因此,垃圾電子郵件現在已成為或即將成為可信計算的一項主要的威脅。
一種用來阻礙垃圾電子郵件的關鍵技術為使用過濾系統/方法。一種經過證實的過濾技術是根據一種機器學習方式,機器學習式過濾器將訊息是垃圾的或然率指定給一進來的訊息。在此方式中,特徵典型地從兩類別之示例訊息
(如,垃圾及非垃圾訊息)中被擷取出,且一學習過濾器被用來在這兩類訊息之間作或然率的區別。既然許多訊息特徵與內容(如,該訊息的主題及/或主體內的文字及文詞)相關,此類過濾器被通稱為”以內容為基礎的過濾器”。
某些垃圾/垃圾信過濾器是可適性的,對於需要一種可適合特殊之需求的多語使用者及說稀有語言的使用者而言是很重要的。更進一步地,並不是所有的使用者都同意何種是垃圾/垃圾信又何種不是垃圾/垃圾信。因此,藉由一種可隱含地訓練(如,經由觀察使用的行為)的過濾器,各別的過濾器可動態地整修以符合一使用者特殊的訊息辨識需求。
用於過濾的可適性的方法係要求使用者將訊息標示為垃圾或非垃圾。很不幸地,此種密集的手動式訓練技術對於許多使用者而言由於複雜性而讓該方式成為所不想要的,該複雜性係關聯於為了達到適當的訓練效果所需的時間量。另一種可適性過濾器訓練方式為使用隱含的訓練提示。例如,如果使用者回覆或轉寄一訊息,則該方法假設該訊息為非垃圾。然而,只使用此種訊息提示會將統計上的偏見導入此訓練過程中,而導致過濾器具有較低之精確性。
另一種方法為,使用所有使用者的電子郵件來訓練,
其中最初的標籤是由一既有的過濾器來指定,使用者有時可用顯性的(explicit)提示(如,”使用者更正”方法)來覆蓋(override)這些指定--例如,選取”當作垃圾刪除”及”非垃圾”的選項-及/或用隱含的提示來覆蓋這些指定。雖然此種方法比前述的技術要來得好一些,但仍比本案所揭示及所請求的發明來得差。
下文所呈現的是本發明的一簡化的概要,係用以提供本發明的某些態樣的基本瞭解。此概要並非本發明的一廣泛性的綜覽。此概要並不是要指出本發明的關鍵/主要的元件或是要用來描繪本發明的範圍。此概要的唯一目的是要以一簡化的形式來呈現本發明的某些概念,詳細的說明將在稍後參照附圖加以說明。
本發明提供一種系統及方法來促進一可用的過濾器(如,種子過濾器或新的過濾器)的使用,該可用的過濾器最適合辨識出垃圾/垃圾信訊息。本發明利用一種子過濾器來過濾訊息,該種子過濾器具有與該種子過濾器相關聯的一誤正率(如,非垃圾郵件被錯誤地歸類為垃圾)及一誤負率(如,垃圾郵件被錯誤地歸類為非垃圾郵件)。一新的過濾器亦被用來過濾訊息-該新的過濾器係根據與該種子過
濾器相關聯的誤正率及誤負率來加以評估的。用來決定該種子過濾器的誤正率及誤負率的資料用來決定該新的過濾器之一新的誤正率及誤負率為閾限的一函數關係。
對於該新的過濾器而言,如果存在一閾限使得該新的誤正率及新的誤負率一起被考量時優於該種子過濾器之誤正率及誤負率,則用該新的過濾器取代該種子過濾器。根據被使用者標示為垃圾及非垃圾的訊息(如,經由使用使用者更正處理)來決定該新的誤正率及新的誤負率。該使用者更正處理包括覆蓋該訊息之最初的分類,當使用者接收到該訊息時,藉由該種子過濾器自動實施該最初的分類。該閾限可以是一單一閾限值,或是從複數個產生的閾限值中選取。如果使用複數個值,則可藉由選取有效的閾限值的範圍(如,具有最低誤正率之閾限值,或可將根據一p*實用函數之使用者預期效用最大化的閾限值)之內的一中位閾限值來決定選取的閾限值。或者,只有在該新的過濾器的誤正率及誤負率至少與該種子過濾器在選取的閾限值的誤正率及誤負率一樣好時才會選取該閾限值,且該新的過濾器的誤正率及誤負率之中的一個是較佳的。此外,可提供選擇準則以使得只有在新的過濾器的過濾率不只在該選取的閾限值處,更在附近的閾限值處都優於種子過濾器的過濾率時,才會選取該新的過濾器。
本發明的其它態樣提供一種圖形式的使用者介面,該圖形式的使用者介面可促進資料的過濾。該界面提供一可與一配置系統相溝通的過濾器介面,該配置系統與配置一過濾器有關。該介面提供複數個使用者可選擇的過濾器階層,該等使用者可選擇的過濾器階層包括有內定,加強,及獨家中之至少一者。該介面提供許多可用來實施本發明之上述系統及方法的工具。
為了要完成上述及相關的目的,本發明之某些舉例性態樣在本文中藉由參照附圖來加以說明。然而,這些態樣為可運用本發明的原理來實施的一些例子,且本發明包含這些態樣及等效物。本發明之其它的優點及新穎的特徵從以下參照附圖之本發明的詳細說明中將會變得很明顯。
本發明現將參照附圖來加以說明,其中在所有圖中相同的標號被用來表示相同的元件。在下面的說明中,為了說明的目的,有許多特定的細節被敘述用以提供對本發明之徹底的瞭解。然而,可在沒有這些特定的細節下操作本發明。在其它的例子中,習知的結構及裝置係以方塊圖的形式來表示以便於描述本發明。
在本文中所使用之「構件」及「系統」等詞係指一與
電腦相關的實體,為硬體,硬體與軟體的組合,軟體,或執行中的軟體。例如,一構件可以是,但並不侷限於,在一處理器上運行的處理,一處理器,一物件,一可執行的程式,一執行緒,一程式,及/或一電腦。舉例而言,在一伺服器上運行的應用程式及該伺服器兩者都可以是一構件。一或多個構件可位在一處理及/或執行緒內,且一構件可位在一構件上及/或分配在兩個或更多個構件之間。
本發明可將不同的干擾方案及/或與垃圾訊息過濾相關的技術相併合。在本文中所用之”干擾”一詞係指該系統,環境,及/或使用者從一組由事件及/或資料所攔截到的觀察而實施的推論處理或干擾狀態。舉例而言,干擾可被用來辨識一特定的上下文或動作,或可產生狀態的或然率分布。該干擾可以是或然性的,亦即,根據資料或事件的考量所進行之重要性狀態的或然率計算。干擾亦可指用來從一組事件及/或資料構成更高階事件的技術。此干擾的結果為從一組被觀察到的事件及/或被儲存的事件資料來建構新的事件或動作,不論事件是否是以短暫親近的關係相關連,及不論事件與資料是來自一或數個事件及資料源。
應被瞭解的是,雖然訊息一詞在整個說明書中被經常使用到,此用詞並不侷限於電子郵件本身,而是包括了可透過任何適當的通信架構散布之任何形式的電子訊息。例
如,因為不想要的文字會在使用者交換訊息時被電子地散置於正常的聊天訊息中,及/或如一前導訊息,一結束訊息般地被插入,促進兩個或多個人之間的會議進行之會議應用程式(如,互動式聊天程式,及立即傳訊程式)亦可運用本文所揭示之過濾的好處。在此特殊的應用中,一過濾器可配置成能夠自動地過濾特定的訊息內容(文字及影像)用以攔截不想要的內容(如廣告,推銷,或宣傳)並貼上垃圾標籤。
現參照第1圖,圖中顯示出依據本發明之一垃圾訊息偵測系統100。該系統100接收一串進來的訊息102,該串進來的訊息102被加以過濾用以促進垃圾訊息的偵測與移除。訊息102被收入到一過濾器控制器104,根據本發明的可適性態樣所決定的過濾規範,該過濾器控制器104,可將訊息102繞經一第一過濾器106(如,種子過濾器)與一第二過濾器108(如,新的過濾器)之間。因此,如果第一過濾器106在偵測垃圾訊息上是充分有效的,則第二過濾器108將不會被使用,且該過濾器控制器104將會持續將訊息102繞經該第一過濾器106。然而,如果第二過濾器108被認定為至少與第一過濾器106一樣有效的話,則該過濾器控制器104可決定將訊息102繞經該第二過濾器108。用來作出此一認定的規範將在下文中詳細說明。當最
初被使用時,該過濾器系統100可配置為一預設內定過濾器設定,使得訊息102會被繞經第一過濾器106以進行過濾(典型如,第一過濾器106為被明確地訓練的種子過濾器,並與與一特定產品一起交貨)。
根據第一過濾器106的設定,被接收至第一過濾器106中的訊息將會被詢問是否有與垃圾資料相關的垃圾資訊。該垃圾資訊可包括,但不侷限於,以下所列各者:傳送者資訊(來自於已知寄送垃圾郵件的寄送者),像是IP地址,傳送者名稱,傳送者e-mail地址,傳送者網域名稱,及在識別子欄位中之難理解的文字與數字串;經常使用在垃圾郵件中之訊息本文用字與用詞,像是”貸款”,”性愛”,”利率”,”限量供應”,”立即購買”,等等;訊息本文特徵,像是字型大小,字型顏色,特殊字母使用;及彈出式廣告之嵌入式鏈結。垃圾資料可至少部分地根據預設且動態決定垃圾之規範來加以決定。該訊息亦被詢問是否為”好的”資料,像是典型地不會出現在垃圾郵件中的字眼,如”天氣”及”隊伍”,或來自於已被認知為只會傳送好的郵件的傳送者或傳送者IP。應瞭解,如果該產品最初沒有與一種子過濾器一起交貨,且沒有任何建立的過濾規範,則所有的訊息都會未加標記地通過第一過濾器106而進入使用者的收件匣112(亦被稱為第一過濾器輸出)。應被瞭解的是,收件
匣112可以只是位在許多位置(如,伺服器,大量儲存單元,客戶端電腦,分散式網路,...)的資料儲存。又,應被瞭解的是,第一過濾器106及/或第二過濾器108可被複數個使用者/構件所使用,且該收件匣112可被分割用以將各別使用者/構件的訊息分開來儲存。另,該系統100可使用複數個第二過濾器108,以使得一個最適當的第二過濾器被使用在一特定的工作中。本發明的這些態樣將於下文中詳細說明。
當使用者檢閱過信箱中的訊息之後,某些訊息將會被決定為垃圾,其它的則不會。這一部分是根據使用者顯性地標記(如,按下按鈕)為垃圾郵件或非垃圾郵件,及經由使用者對特定的訊息所作的動作來隱含地標記該訊息。一訊息可根據下列的使用者動作或訊息處理而被隱含地決定為非垃圾:該訊息已被閱讀且仍被留在收件匣中;該信件已被閱讀且被轉寄;該信件已被閱讀且被放在除了垃圾檔案夾之外的其它檔案夾中;該訊息被回覆;或使用者開啟並編輯該訊息。使用者的其它動作亦可被定義為與非垃圾訊息相關聯。一訊息可根據以下的現象而被隱含地決定為垃圾,如該訊息一個星期沒有被閱讀,或沒閱讀該訊息即刪除該訊息。因此,系統100經由一使用者更正元件114來監視這些使用者動作(或訊息處理)。這些使用者動作或
訊息處理可被預先配置在使用者更正元件114中,使得使用者最初在檢閱並對訊息實施動作時,系統100即可開始發展出第一過濾器106的誤正率及誤負率。沒有被實質上預先配置至該使用者更正元件114中的任何使用者動作(或訊息處理)都將自動地允許該”未知的”之未標記訊息通過以到達過濾器輸出112,直到系統100被調適來應付此訊息類型為止。應被瞭解的是,本文中所用的”使用者”一詞是要包括:人類,一群人類,一構件以及人類與構件的組合。
當在使用者收信匣112中的一訊息接收以作為未標記訊息,但該訊息實際上是一垃圾訊息時,系統100會將該訊息當作一誤負資料值來處理。然後,該使用者更正元件114將此誤負資訊回授給該過濾器控制器104,以當作用來查明該第一過濾器106的有效性的資料值。在另一方面,如果該第一過濾器106將一訊息標記為垃圾郵件,而該訊息事實上並非一垃圾訊息時,系統100會將該訊息當作一誤正資料值來處理。然後,該使用者更正元件114將此誤正資訊回授給該過濾器控制104,以當作用來確定該第一過濾器106的有效性的資料值。因此,隨著使用者更正在使用者收信匣112中被接收的訊息,亦發展該第一過濾器106的誤正及誤負資料。
系統100決定第二過濾器108是否存在一閾限,以使得該第二過濾器的誤正及誤負率都比第一過濾器106的誤正及誤負率低(如,在一可接受的或然率的範圍內)。如果是如此的話,則系統100會選取一個可接受的閾限。該系統亦可在誤負率一樣好,但誤正率較佳時,或在誤負率一樣好但誤正率較佳時選取第二過濾器。因此,本發明決定該第二過濾器108是否存在閾限(及該閾限應為何),以保證在一可接受的或然率的範圍內,該第二過濾器可提供有關垃圾偵測之相等或更佳的實用性,無論一特定使用者的實用功能及該使用者是否已無誤地更正第一過濾器106的錯誤。
有鑑於誤正及誤負識別的使用者確認,系統100根據對於新的訓練的需求來訓練新的(或第二)過濾器108。詳言之,系統100使用經由使用者更正方法決定以標記垃圾及非垃圾的資料。藉由使用此資料,決定該第一(既有或種子)過濾器106的誤正(如,被錯誤地標示為垃圾之非垃圾訊息)率及誤負(如,被錯誤地標示為非垃圾之垃圾訊息)率。相同的資料被用來學習(或”訓練”)該新的(如,第二)過濾器108,該資料亦被使用在與該第二過濾器的誤正及誤負率為一閾限的函數有關的決定上。既然評估資料與訓練第二過濾器所用的資料相同,所以最好是使用一交叉確
認方法(交叉確認是一種熟習此技藝者所習知的技術),這將於下文中被詳細說明。如果第二組資料被決定為至少與第一組一樣好的話,則啟用第二過濾器108。該控制構件104接著將所有進來的訊息繞經該第二過濾器108,直到比率比較處理因為第一過濾器具有較佳的過濾實用性而決定過濾應被移回到第一過濾器106為止。
本發明的一特殊的態樣依賴兩項保證。第一項保證為第一確認(如,使用者更正)不會有錯誤(如,使用者不會將非垃圾訊息當作垃圾訊息加以刪除)。在此保證之下,資料標籤雖然不是永遠正確,但”至少”與該第一過濾器106所指定的標籤一樣正確。因此,根據此等標籤,如果第二過濾器108的實用性不低於既有過濾器的話,該第二過濾器108之真實的預期實用性不會比第一過濾器106的實性性差。第二項保證為,降低誤正及誤負率是所想要的。有關此項保證,如果第二過濾器108的兩個錯誤率都不會比第一過濾器106的兩個錯誤率大的話,則第二過濾器108在垃圾偵測上至少與第一過濾器106一樣好,而與使用者的特定實用函數無關。
第二過濾器108不會永遠與第一過濾器106一樣有效的一個原因為,第二過濾器所依據的資料比第一過濾器106少。第一過濾器106可以是一”種子”過濾器,種子過
濾器具有由其它使用者的資料所產生的的種子資料。如果不是全部也是絕大部分的可適性過濾器都是與一種子過濾器一起交貨,因而提供一過濾器配置給使用者,該過濾器配置可辨識出典型的垃圾電子郵件訊息且無需使用者來配置該過濾器,此舉提供了沒有經驗的電腦使用者一良好的”即開即用(out-of-the-box)”的經驗。第二過濾器108不會永遠與第一過濾器106一樣有效的另一個原因為,第二過濾器108更為敏感。這與兩個因子有關:過濾器是不完美的,及無法被校準。這兩個因子都將依次被討論,然後將再回到決定第二過濾器108是否較佳的議題上。
現參照第2圖,第2圖圖示性能取捨(tradeoff)與攔截率(被正確標示的垃圾信的百分比,等於1減掉誤負率)及誤正率(標示為垃圾的非垃圾訊息的百分比)之間的關係的圖表。如在本文中所顯示的,且將為熟習此技藝者所瞭解的,沒有過濾器是完美的。因此,在辨識並攔截更多的垃圾訊息與意外地將非垃圾訊息誤標示為垃圾之間存在著取捨。此性能取捨(在本文中亦被稱為正確率)係描述為習知之接收者-操作者曲線(ROC)200。在該曲線上的每一點對應於一不同的取捨。一使用者藉由調整一或然率閾限來為一過濾器選取一”操作點”,或該或然率閾限可被預設。當一訊息為垃圾(被過濾器所認定)的或然率p超過此閾限
時,該訊息即被標示為垃圾。因此,如果使用者決定要在一高正確率的體系下操作的話(如,誤正數目與正確標示的訊息數比較起來很低),則在曲線200上的操作點會靠近原點。例如,如果使用者選取ROC曲線200上的操作點A的話,則誤正率約為0.0007且代表正確標示的訊息數之相應的y軸值約為0.45。該使用者將會約有一0.45/0.0007=643的過濾器正確率,亦即,大約每六百四十三個正確標示的訊息會有一個誤正訊息。在另一方面,如果操作點為點B的話,計算出之較低的正確率約為0.72/0.01=72,亦即,大約每七十二個正確標示的訊息會有一個誤正訊息。
因為語言的決定理論,不同的人具有不同的實用函數來過濾垃圾訊息,不同的使用者將會依據他們各自獨特的偏好來作出取捨。例如,有一類別的使用者可能對於不正確地標示一非垃圾訊息及無法攔截N個垃圾訊息毫不在意。對於此類別使用者而言,用於垃圾之最佳的或然率閾限(p*)可用以下的關係式來定義:
其中N為訊息數,且N可隨著不同類別的使用者而改變。
因此,此類別的使用者被說成是具有”p*實用函數”。在此一瞭解之下,如果一使用者具有一p*實用函數且第二
過濾器被校準,則一最佳閾限可被自動地選取,亦即,該閾限應被設定為p*。另一類別的使用者可能想要讓他或她的非垃圾訊息只有不大於X%的比例被標示為垃圾。對於該等使用者而言,最佳閾限係依附於第二過濾器108指定給訊息的或然率分布。
第二註記係為過濾器可以或不可以被校準。經過校準的過濾器具有的特性係為,當決定一組電子郵件訊息是垃圾的或然率為p時,則這些訊息中的p個即為垃圾。許多機器學習方法會產生經過校準的過濾器,並使使用者教條式地更正既有過濾器的錯誤。如果使用者只有在有些時候(如,少於80%)才更正錯誤的話,則過濾器將不再是經過校準的過濾器,亦即,關於不正確的標籤,這些過濾器將是經過校準的,但關於正確的標籤,則是未校準的。另一方面,本發明提供一種決定第二過濾器108是否存在閾限(及該閾限應為何)的方式,並可保證(在某些或然率內)第二過濾器108供應與第一過濾器106相同或更佳的實用性,無論該使用者的實用函數為何,及該使用者是否已無誤地更正第一過濾器106的錯誤。
現參照第3圖,第3圖圖示依據本發明的一態樣的處理的流程圖。為了簡化說明的目的,該方法被顯示及描述為一連串的動作,應被瞭解及認知的是,本發明並不侷限
於動作的順序,依據本發明,有些動作可以不同的順序發生及/或與其它的動作同時發生。例如,熟習此技藝者將可瞭解及認知的是,一方法可用一連串互相關聯的狀態或事件(如在一狀態圖中者)來代表。又,根據本發明,並非需要所有圖示的動作以實施該方法。
基本的方法依賴兩個假設。一個假設為,使用者更正不包含錯誤(一個錯誤例為使用者將一非垃圾的訊息當作垃圾刪除掉)。在此一假設下,該資料上的標籤雖然不是永遠都是正確的,但”至少”是跟第一/種子過濾器所指定的標籤一樣正確。因此,根據這些標籤,如果第二過濾器所具有的實用性不會比第一過濾器的實用性低的話,第二過率器的真正被預期的實用性並不會比第一過濾器差。第二個假設為,所有使用者都喜好低的誤正率及低的誤負率。在此假設下,如果第二過濾器的兩個錯誤率都不會比第一過濾器的兩個錯誤率高的話,則第二過濾器即不會比第一過濾器差,而不論使用者的特定實用函數為何。
在300,提供一介面構件至第一及第二過濾器(如,用來改變設定,及控制過濾器的安排及配置)。在302,第一過濾器被配置成可根據一或多個過濾器設定自動地過濾進來的訊息。這些設定可包括由製造商所提供之內定的設定。一旦接收經過濾的訊息(如,進入到收件匣中),在304
該等訊息被檢閱並作出(如,藉由使用者更正方法)哪些非垃圾的訊息被錯誤地標記為垃圾(如,誤正訊息)及哪些垃圾訊息被錯誤地標記為非垃圾(如,誤負訊息)的決定。在306,可藉由顯性地或隱含地將誤負訊息標記為垃圾郵件,及去除誤正訊息之標籤以標記為非垃圾來實施使用者更正功能。此使用者更正功能藉由決定第一過濾器之誤正及誤負率資料來提供一正確率給第一過濾器。在308,第二過濾器依據該第一過濾器106之使用者更正過的資料來加以訓練。在310,相同的資料被用來決定第二過濾器的誤正及誤負率為一閾限的函數關係。在312,該閾限被決定。作出關於第二過濾器是否存在一閾限的決定,以使得與第二過濾器相關的誤正率及誤負率低於第一過濾器的誤正率及誤負率(在某些合理的或然率範圍內)。亦即,在314會決定第二過濾器的正確率(AccuracySF)是否優於第一過濾器的正確率(AccuracyFF)。如果是的話,則該適當的閾限被選取且該第二過濾器被用來過濾進來的訊息,如316所示。如果不是的話,則該處理前進至318,其中該第一過濾器被保留以實施訊息的過濾。在必要時,該處理可動態地循環前述的動作。
正確性分析處理可在每一次使用者更正功能發生時,使得第二過濾器可在任何時間根據閾限的決定而被使用或
被解除作用。因為第一過濾器的評估資料與用來訓練第二過濾器的資料相同,所以一交叉確認方法被使用。亦即,資料被分段成k個區段(k為整數)以用於每一使用者更正處理,且對於每一區段而言,第二過濾器係使用其它k-1個區段內的資料來訓練。第二過濾器的性能(或正確性)係針對從該k-1個區段中被選取的區段來加以評估。另一種可能為等待,直到具有垃圾及非垃圾標籤的訊息分別被累積到N1及N2的數目(如,N1=N2=1000),並在每次額外的垃圾及非垃圾訊息被累積到N3及N4個訊息時(如,N3=N4=100)再實施一遍。另一種方式為根據行事曆時間來安排此一處理。
如果有多於一個的閾限值可讓第二過濾器不會比第一過濾器差的話,則選取哪一個閾限值來使用存在多種可能。其中一種可能係為選取在使用者具有一P*實用函數的假設下,可讓使用者的預期實用性最大化的閾限。另一種可能係為選取具有最低的誤正率的閾限。再另一種可能係為選取合格閾限值範圍內的中間點。
關於在經測量的錯誤率中的不確定性,設k1及k2為分別來自於第一及第二過濾器之誤標示為非垃圾(或垃圾)的錯誤數目。顯示一簡單的統計分析,如果:
則可假定約可x%確定第二過濾器的錯誤率不會比第一過濾器差(如,當f=2,x=97.5;當f=0,x=50)。保守一些,如果k1或k2等於0的話,則1值應被使用在該平方根(sqrt)項中。應注意的是,x為一保守性的調整,當x接近100時,第二過濾器的確定性必定優於第一過濾器在使用第二過濾器之前的確定性。此確定性(或不確定性)計算包括假設介於第一過濾器與第二過濾器之間的錯誤是獨立的。避免此一假設的一種方法為評估共同錯誤的數目,亦即,在該獨立的假設下應有的錯誤數目。如果發現比此數目多出k個錯誤的話,則用在上述計算中的(k1-k)及(k2-k)來取代k1及k2。此外,隨著在訓練資料內的訊息數增加,則第二過濾器(在任何的閾限都)將更可能比第一過濾器正確。上述的不確定性評估忽略此”先前知識”。熟悉Bayesian機率學/統計學之熟習此技藝者將會瞭解到,存在著將此先前知識結合至不確定性評估中的方法。
在此基本方法的一個態樣中,想像一垃圾訊息被第一過濾器標示為非垃圾訊息。又,假設使用者並沒有更正此一錯誤,所以該系統內定將此訊息決定為非垃圾。具有更精確的訓練資料的第二過濾器可能將此訊息標示為垃圾。因此,第一過濾器的誤正率將被低估,而第二過濾器的誤正率則被高估。在一閾限處,許多垃圾訊息標示為非垃圾,
以保持低的誤正率,而因為大多數的垃圾電子郵件過濾器的操作是在該閾限處實施,而由此事實會擴大此效應。
有數種方法可被組合使用,以應付此基本方法的態樣。第一種方法係為假設使用者具有p*實用函數(如,N=20),並在可找到讓第二過濾器不比第一過濾器差的閾限的任何時候佈署該第二過濾器。在此處,在第二過濾器的誤正率大於第一過濾器的誤正率時,可佈署第二過濾器。亦即,在此方法中,第二過濾器更可能被佈署。
第二種方法係為,限制測試組,使得標示為非垃圾的訊息以一極高的確定程度被確定為不是垃圾。例如,該測試組包括被使用者按下”非垃圾”按鈕而加以標記的訊息,被閱讀且沒有被刪除的訊息,被轉寄的訊息,及使用者已回覆的訊息。
第三種方法係為,該系統可使用由一經過校準的過濾器(如,第一過濾器)所產生的或然率來產生第二過濾器之誤正率的較佳預估。亦即,該系統可將每一正常(非垃圾)訊息的或然率(根據一經過校準的過濾器)加總起來,而不是簡單地計算在該資料中具有一非垃圾標籤的訊息數及具有來自第一過濾器的垃圾標籤的訊息數。此加總將小於該計數,且將會是比讓使用者更正所有的訊息的計數還要好的預估。
在一相較簡單的第四種方法中,使用者使用”非垃圾”及”垃圾”按鈕來更正標籤的預期次數被加以監視。在此處,預期係與一經過校準的過濾器有關(如,第一/種子過濾器)。如果實際的更正次數落在(絕對數字或百分比)預期的次數之下的話,則該系統並沒有訓練第二過濾器。
在使用時,使用者介面可提供數個閾限來讓使用者選擇。在此情況中,只有當在使用者所選定的閾限下,新的過濾器的性能表現優於種子過濾器時,才會佈署新的過濾器。此外,想要該新的過濾器在其它的閾限設定下,特別是在使用者目前的選擇值附近的設定亦優於該種子過濾器。下面的演算法則為可促進此法的方式。輸入一被稱為SliderHalfLife(SHL)的參數,該參數為具有一內定值為0.25的實數。針對每一閾限值來決定該新的過濾器是否優於第一過濾器或與第一過濾器一樣好。然後使用目前選取的閾限值。然而,如果新的過濾器在目前的閾限設定上優於第一/種子過濾器且如下文所說明的總權重值(TotalWeight,w)大於或等於0,則切換新的過濾器。最初,總權重值=0。對於每一非目前的閾限設定而言:
根據每一非目前的閾限設定與目前的設定的距離來指定一權值
d=距離
IS=設定的指標
ICS=目前設定的指標
IMAX=最大設定的指標
IMIN=最小設定的指標
w=0.5(d/SHL)
如果新的過濾器在此設定下比較好的話,則將新的過濾器之權值加至總權重值;否則的話將新的過濾器之權值從總權重值中減掉。
應注意的是,此演算法只決定該新的過濾器在每一閾限設定是否比較好。而並未考慮第二過濾器比第一/種子過濾器好多少或差多少。該演算法可使用以下的功能來加以修改用以考慮改進或惡化的程度:新及舊的誤負率,誤正率,誤負數及/或誤正數。
現參照第4a圖,第4a圖圖示一舉例性的使用者介面400,使用者介面400可呈現給使用者進行本文中所揭示之可適性垃圾過濾器系統及使用者電子信箱的基本配置。介面400包括一帶有選單列402之垃圾郵件頁面(或視窗)401,該標題列包括但不侷限於下列下拉式選單標頭:檔案,編輯,檢視,登出,及說明&設定。視窗401亦包括一鏈結列404,該鏈結列404可促進向前及向後導航,
以允許使用者導航至其它的頁面、工具、及介面400的能力,介面400的能力包括首頁、我的最愛、搜尋、郵件及其它、即時通訊、娛樂、理財、購物、人物&聊天、學習及相片。一選單列406可促進選取該垃圾電子郵件配置視窗401的一或多個配置視窗。如所圖示的,一設定子視窗408允許使用者選擇數個過濾垃圾電子郵件的基本配置選項。第一個選項410允許使用者能夠啟動垃圾電子郵件過濾。使用者亦可選擇不同等級的電子郵件保護。例如,第二選項412允許使用者選取一內定的過濾器設定,而該內定的過濾器設定只會攔截最明顯的垃圾郵件。第三選項414允許使用者選擇更多進階的過濾功能,使得更多的垃圾郵件被攔截並丟棄。第四選項416允許使用者可選取只從被信賴的一方,例如從列在使用者的通訊錄上及安全名單上的一方,收取郵件。一相關的設定區418提供一導航至這些表列區的構件,包括垃圾郵件過濾器,安全名單,郵寄名單,及封鎖寄件人名單。
現參照第4b圖,第4b圖圖示呈現使用者信箱外貌的該使用者介面400的一使用者信箱視窗420。該信箱視窗420包括該選單列402,該選單列402包括但不侷限於下列下拉式選單標頭:檔案,編輯,檢視,登出,及說明&設定。該信箱視窗420亦包括該鏈結列404,鏈結列404可
促進向前及向後導航,以允許使用者導航至其它的頁面、工具、及介面400的能力,介面400的能力包括首頁、我的最愛、搜尋、郵件及其它、即時通訊、娛樂、理財、購物、人物&聊天、學習及相片。視窗420亦包括電子郵件控制工具列422,電子郵件控制工具列422包括以下所列:允許使用者建立新的訊息的一寫訊息選項;用以刪除一訊息的一刪除選項;用以將一訊息標記為垃圾的一垃圾選項;用以回覆一訊息的一回覆選項;用以將一訊息移動至其它檔案夾的一放入檔案夾選項;及用以轉寄一訊息的一轉寄圖像。
視窗420亦包括一檔案夾選項子視窗424,該檔案夾選項子視窗424提供顯示收信匣、垃圾筒、及垃圾郵件檔案夾的內容的選項給使用者。使用者亦可存取不同檔案夾內的內容,不同檔案夾內的內容包括被儲存的訊息、寄件匣、送出的訊息、垃圾筒、草稿匣、一示範程式及一舊的垃圾郵件檔案夾。在垃圾郵件及舊的垃圾郵件檔案夾內每一者的訊息數目亦被列在各自的檔案夾名稱旁邊。根據在檔案夾選項子視窗424內的檔案夾選項,在一訊息列子視窗426中呈現一列接收到的訊息。在一訊息預覽子視窗428中,呈現選取的訊息的部分內容給使用者看以進行預覽。視窗420可被修改用以包括使用者偏好的資訊,使用者偏
好的資訊係呈現在一使用者偏好子視窗(未示出)中。該偏好子視窗可被包括在所圖示的視窗420的右側的一部分內,如第4a圖所示。這包括但不侷限於天氣資訊、股票市場資訊、喜愛的網路連結等等。
圖示的介面400並不侷限在圖中所示者,而是可包括其它傳統的圖形、影像、說明性文字、選單選項等等,介面400可被實施用以進一步幫助使用者來進行過濾器選擇及導航至該介面的其它頁面。
現參照第5圖,第5圖圖示一利用所揭示的過濾技術的架構的示意方塊圖。一網路500被提供來促進電子郵件來回於一或多個客戶端502,504及506(亦被標記為客戶端1,客戶端2,...,客戶端N)之間的通信。網路500可以是一全球通信網路(GCN)(如網際網路)、或一WAN(廣域網路)、LAN(地區網路)、或其它的網路架構。在此特定的應用例子中,一SMTP(簡單郵件傳送通信協定)閘道伺服器508界接至該網路500,以提供SMTP服務給一LAN510。一可操作地設置在該LAN510上的電子郵件伺服器512界接至該閘道508,以控制並處理客戶端502,504及506的進來及出去的電子郵件,其中客戶端502,504及506亦被設置在該LAN510上,以至少存取被提供於該LAN510上的郵件服務。
客戶端502包括一中央處理單元(CPU)514,CPU514控制著客戶端處理,應被瞭解的是,CPU514可包含多個處理器。CPU514執行指令,這些指令與提供上述的一或多個過濾功能有關。該等指令包括,但不侷限於:至少執行上述的基本過濾方法之經過解碼的指令、讓使用者實施使用者更正以應付錯誤而被組合地使用之任何或所有方法、不確定性的決定、閾限的決定、使用誤正及誤負率資料的正確性計算、及使用者互動性選擇。一使用者介面518被提供來促進CPU514與客戶端作業系統之間的溝通,使得使用者可互動地配置過濾器設定並存取電子郵件。
客戶端502亦包括至少一第一過濾器520(與第一過濾器106相似)及一第二過濾器522(與第二過濾器108類似),第一過濾器520與第二過濾器522可依據上文所述的過濾器描述來操作。客戶端502亦包括一電子郵件收件匣儲存位置(或檔案夾)524,電子郵件收件匣儲存位置(或檔案夾)524用來接收來自於第一過濾器520及第二過濾器522中至少一者之經過過濾的電子郵件及預期已適當地標示的電子郵件訊息。一第二電子郵件儲存位置(或檔案夾)526可被提供來容納垃圾郵件,該垃圾郵件已被使用者決定為垃圾郵件,且被使用者選擇儲存在第二電子郵件儲存位置(或檔案夾)526內,此第二電子郵件儲存位置(或檔
案夾)526亦可以是一垃圾筒檔案夾。如上文提及的,收件匣檔案夾524可包括已被第一過濾器520或第二過濾器522過濾的電子郵件,而電子郵件經過何者過濾是依據是否使用第二過濾器522代替第一過濾器520提供相同或更佳的電子郵件過濾。
一旦使用者接收來自電子郵件伺服器512的電子郵件,使用者會瀏覽收件匣檔案夾524的電子郵件,以閱讀並決定該等經過濾的收件匣電子郵件訊息之實際狀態。如果一垃圾電子郵件通過了第一過濾器520的話,則使用者將實施一顯性或隱含的使用者更正功能,以對該系統表明該訊息實際上應為垃圾電子郵件。然後根據此使用者更正資料訓練第一及第二過濾器(520及522)。如果決定該第二過濾器522具有比第一過濾器520更佳的正確率的話,第二過濾器522將被用來取代第一過濾器520用以提供相同或更佳的過濾。如在上文中提及的,如果第二過濾器522具有一實質上相等於第一過濾器520的正確率的話,則第二過濾器522可被使用,也可以不被使用。根據上述的數個預定的規範,過濾器訓練可由使用者選擇而發生。
現參照第6圖,第6圖圖示具有一或多個客戶端電腦602的系統600,該一或多個客戶端電腦602可供多個使用者登入,並根據本發明的過濾技術來過濾進來的訊息。客
戶端602包括多人登入的能力,而使得一第一過濾器604及一第二過濾器606分別提供訊息過濾給每一登入到該電腦602上之不同的使用者。因此,提供一使用者介面608,該使用者介面608呈現一登入畫面作為該電腦作業系統開機處理的一部分,或當有需要時,在使用者可存取他或她的進來的訊息之前接觸有關使用者的簡介。因此,當一第一使用者610(亦被標示為使用者1)選擇存取訊息,第一使用者610藉由使用者介面608的登入畫面612輸入存取資訊(通常為使用者名稱及密碼的形式),以登入到該客戶端電腦602上。CPU514處理此存取資訊以允許第一使用者透過一訊息通信應用程式(如,一郵件客戶端)而只能存取第一使用者收件匣位置614(亦被標記為使用者1收件匣)及第一使用者垃圾訊息位置616(亦被標記為使用者1垃圾訊息)。
當CPU514接收到使用者登入存取資訊時,CPU514存取第一使用這過濾器偏好資訊,以使用第一過濾器604及第二過濾器606來過濾下載至該客戶端電腦602的進來訊息。允許登入到該電腦的所有使用者(使用者1,使用者2,...,使用者N)的過濾器偏好可被儲存在本地的一過濾器偏好表中。當第一使用者登入到電腦602上或接觸與第一使用者有關的簡介時,CPU514可存取該過濾器偏好資
訊。因此,處理第一使用者610之第一及第二過濾器(604及606)的誤負及誤正率資料,以決定使用第一過濾器604或第二過濾器606來過濾下載的訊息。如在上文中所揭示說明的,誤正率及誤負率資料至少是從使用者更正處理中衍生出來的。一旦第一使用者610下載訊息,即可根據錯誤地標記之訊息來更新誤負及誤正率資料。在另一使用者登入到電腦602上之前的某一時間點,該第一使用者之經更新的資料會被存回到過濾器偏好表中以供未來參考之用。
當一第二使用者618登入時,該誤負及誤正率資料會根據與該第二使用者618相關的過濾偏好而改變。在第二使用者618進入他或她的登入資訊之後,CPU514存取第二使用者的過濾器偏好資訊,並據以接觸第一過濾器604或第二過濾器606。結合該電腦訊息應用程式的電腦作業系統限制訊息服務,以讓第二使用者618只存取第二使用者收件匣620(亦被標記為使用者2收件匣)及第二使用者垃圾訊息位置622(亦被標記為使用者2垃圾訊息)。處理第二使用者618之第一過濾器及第二過濾器(604及606)的誤負及誤正率資料,以決定使用第一過濾器604或第二過濾器606來過濾第二使用者618下載的訊息。如在上文中所揭示說明的,誤負及誤正率資料至少是從使用者更正
處理中衍生出來的。一旦第二使用者618下載訊息時,即可根據錯誤地標記之訊息來更新誤負及誤正率資料。
第N個使用者624(被標記為使用者N)的操作是以與第一及第二使用者(610及618)相類似的方式提供。與所有其他的使用者一樣,第N個使用者624被限制只能存取與第N個使用者624相關的使用者資訊,因此第N個使用者624只被允許可存取第N個使用者收件匣626及第N個使用者垃圾訊息位置628,且在使用該訊息應用程式時,不能存取其它的收件匣(614及620)及垃圾訊息位置(616及622)。
電腦602被適當地配置以與該LAN510上的其它客戶端通信,並藉由利用一客戶端網路介面630來存取位於LAN510上的網路服務。因此,提供該訊息伺服器512從SMTP(或訊息)閘道508接收訊息,以控制及處理客戶端(602及632(亦被標記為使用者N)),及其它有線或無線裝置的進來和出去的訊息,該有線或無線裝置可透過LAN510經操作來與訊息伺服器512通信訊息。客戶端(602及632)被設置以可經操作與LAN510通信的方式,以至少存取提供於LAN510上的訊息服務。該SMTP閘道508界接至該GCN500,以在GCN500的網路裝置與LAN510上的訊息實體之間提供相容的SMTP訊息服務。
應被瞭解的是,如上所述之比率資料平均值可被用來決定使用過濾器604及606的最佳平均設定。相似地,允許登入到電腦602上的使用者的最佳比率資料亦可用來配置可登入的所有使用者的過濾器。
現參照第7圖,第7圖圖示一系統700,其中最初的過濾係實施在一訊息伺服器702上及第二次過濾是實施在一或多個客戶端上。提供該GCN500以促進來回於一或多個客戶端(704、706及708)(亦被標記為客戶端1,客戶端2,...,客戶端N)之間的訊息溝通。該SMTP閘道508界接至該GCN500,以在該GCN500上的網路裝置與LAN510上的訊息實體之間提供與SMTP相容的訊息服務。
訊息伺服器702可操作地設置在該LAN510上,並與閘道508相界接以控制並處理客戶端704、706及708,及其它有線或無線裝置的進來與出去的訊息,該無線或有線裝置可操作以透過LAN510來與訊息伺服器702通信訊息。客戶端(704、706及708)(如,有線或無線裝置)設置成可操作地與LAN510通信,以至少存取提供於LAN510上的訊息服務。
依據本發明的一個態樣,訊息伺服器702藉由使用一第一過濾器710(與第一過濾器106類似)來實施最初的過濾,及客戶端使用第二過濾器712(與第二過濾器108類似)
來實施第二過濾。因此,隨著第一過濾器710處理訊息以決定進來的訊息是垃圾或非垃圾訊息,進來的訊息從閘道508被接收到該訊息伺服器702的一進來訊息的緩衝器714中作為暫時儲存處。緩衝器714可以是一單純的FIFO(先進先出)架構,使得所有訊息都以先到先服務的方式被處理。然而,應被瞭解的是,訊息伺服器702可根據一已標記的優先權來過濾處理緩衝訊息。因此,緩衝器714被適當地配置以提供訊息優先順序,使得被傳送者標記為較高優先權的訊息從緩衝器714轉寄,以在其他標記為較低優先權的訊息之前過濾,。優先權標記可根據與傳送者優先權標記無關的其它規範來實施,與傳送者優先權標記無關的其它規範包括但不侷限於:訊息的大小、該訊息傳送的日期、該訊息是否有附件、附件的大小、該訊息在緩衝器714中的時間有多長等等。
為了要發展出第一過濾器710的誤正及誤負率資料,一管理者可對第一過濾器710的輸出取樣用以決定有多少正常的訊息被錯誤地標示為垃圾及有多少垃圾訊息被錯誤地標示為正常。如在上文中參照本發明的一個態樣所作的說明,第一過濾器710的此一比率資料接著被用來當作第二過濾器712之新的誤正及誤負率資料的基礎。
無論如何,一旦第一過濾器710已將訊息過濾,根據
客戶目的地IP地址該訊息繞從伺服器702通過一伺服器網路介面716跨越網路510至適當的客戶端(如,第一客戶端704)。第一客戶端704包括控制所有客戶端處理的CPU514。CPU514與訊息伺服器702相通信用以獲得第一過濾器710的誤正及誤負率資料,並實施與第二過濾器712的誤正及誤負率資料的比較,以決定何時應使用第二過濾器712。如果比較結果為第二過濾器的比率資料不比第一過濾器的比率資料差的話,則第二過濾器712會被使用,且CPU514會與訊息伺服器702通信以允許預定到第一過濾器710的訊息未過濾地通過伺服器702。
當第一客戶端704的使用者檢閱接收到的訊息並實施使用者更正時,第二過濾器712之新的誤正及誤負率資料會被更新。如果新的比率資料比第一比率資料差的話,則第一過濾器710將重新被使用,以提供過濾功能給第一客戶端704。CPU514持續作比率資料比較,以決定何時為該特定的客戶端704切換第一及第二過濾器(710及712)。
CPU514根據提供上文中所述的任何一或多個過濾功能之指令來執行一可操作的演算法。該演算法包括但不侷限於:可至少執行上述的基本過濾方法之經過解碼的指令、讓使用者實施使用者更正以應付錯誤而被組合地使用之任何或所有方法、不確定性的決定、閾限的決定、使用
誤正及誤負率資料的正確性計算、及使用者互動性選擇。使用者介面518被提供來促進CPU514與客戶端作業系統之間的溝通,使得使用者可互動地配置過濾器設定並存取電子郵件。
客戶端502亦包括至少該第二過濾器712,該第二過濾器712可根據上文所描述的過濾器說明來操作。客戶端502亦包括訊息收件匣儲存位置(或檔案夾)524,該訊息收件匣儲存位置(或檔案夾)524從第一過濾器710及第二過濾器712中至少一者街收經過濾的訊息及預期已被適當地標記的訊息。該第二訊息儲存位置(或檔案夾)526可提供來容納垃圾郵件,該垃圾郵件已被使用者決定為垃圾郵件,且被使用者選擇儲存在第二電子郵件儲存位置(或檔案夾)526內,此亦可以是一垃圾筒檔案夾。如上文提及的,收件匣檔案夾524可包括已被第一過濾器710或第二過濾器712過濾的訊息,而電子郵件經過何者過濾是依據是否使用第二過濾器712代替第一過濾器710來提供相同或更佳的進來的訊息的過濾。
如上文中提及的,一旦使用者從訊息伺服器702下載訊息,使用者會瀏覽收件匣檔案夾524的訊息,以閱讀並決定該等經過濾的收件匣訊息之實際狀態。如果一垃圾訊息通過了第一過濾器710的話,則使用者將實施一顯性或
隱含的使用者更正功能,以對該系統表明該訊息實際上應為垃圾訊息。然後根據此使用者更正資料訓練。如果決定該第二過濾器712具有比第一過濾器710更佳的正確率的話,第二過濾器712將被用來取代第一過濾器710用以提供相同或更佳的過濾。如在上文中提及的,如果第二過濾器712具有一實質上相等於第一過濾器710的正確率的話,則第二過濾器712可被使用,也可以不被使用。根據上述的數個預定的規範,過濾器訓練可由使用者選擇而發生。
應被瞭解的是,因為其它客戶端(706及708)使用訊息伺服器702來過濾訊息,所以各別客戶端(706及708)的新的誤正及誤負率資料將會影響到第一過濾器710的過濾操作。因此,各別客戶端(706及708)亦與訊息伺服器702溝通,以依據這些客戶端(706及708)各別的新的誤正及誤負率資料來使用或不使用第一過濾器710。訊息伺服器702可包括與各別客戶過濾器要求相關的客戶端偏好的過濾器偏好表。因此,每一緩衝訊息被詢問目的地IP位址,且依據與儲存在過濾器表內的該目的地IP位址相關之過濾器偏好來加以處理。因此,雖然根據第一客戶端704的比率資料比較結果,預定給該第一客戶端704之一廣播的垃圾訊息會被要求由第一客戶704的第二過濾器712處理,但
根據所獲得的比率資料比較結果,亦同樣預定給該第二客戶706之垃圾訊息可被要求由訊息伺服器702的第一過濾器710來處理。
應進一步被瞭解的是,客戶端(704,706及708)獨立的新的比率資料可同時被伺服器702接收及處理以決定平均值。然後,此平均值可被用來決定是要獨立地或成群地使用該等客戶端的第一過濾器710或第二過濾器712。或者,客端戶(704、706及708)的最佳比率資料可由伺服器702來決定,且被用來獨立地或成群地在第一過濾器710及第二過濾器712之間切換。
現參照第8圖,第8圖圖示使用本發明的過濾態樣之大規模的過濾系統800的另一實施例。在以一大規模的方式被全系統的郵件系統(如一網際網路服務提供者)所實施訊息過濾之更為堅實的應用中,多個過濾系統可被用來處理大量的進來的訊息。大量的進來的訊息802被接收並被送至許多不同的使用者目的地。訊息802經由SMTP閘道804進入該提供者系統,然後被發送至一系統訊息途徑(routing)元件806,以繞經不同的過濾器系統808、810及812(亦分別被標記為過濾器系統1、過濾器系統2...、過濾器系統N)。
每一過濾器系統(808、810及812)都包括一途徑控制
元件、一第一過濾器、一第二過濾器、及一輸出緩衝器。過濾器系統808包括一途徑控制構件814,該途徑控制構件814用來將訊息繞經第一系統過濾器816與第二系統過濾器818之間。第一及第二過濾器(816及818)的輸出被連接至一輸出緩衝器820,在訊息被發送至一使用者收件匣途徑元件822之前暫時地儲存訊息。該使用者收件匣途徑元件822對從第一過濾器系統808的輸出緩衝器820接收到的每一訊息詢問使用者目的地地址,且將該訊息繞經多個使用者收件匣824(亦被標記為收件匣1、收件匣2、...、收件匣N)中適當的使用者收件匣處。
該系統訊息途徑元件806包括一負荷平衡能力,根據過濾器系統(808、810及812)的可用頻寬將訊息繞經過濾器系統(808、810及812)之間來容納訊息處理。因此,如果第一過濾器系統808的一進來的訊息佇列(未示出,但為途徑元件814的一部分)被備份且無法容納系統800所需的產出時,此佇列的狀態資訊從該途徑控制元件814回授至該系統途徑元件806,使得進來的訊息802繞至其它的過濾器系統(810及812),直到系統814之進來的佇列能夠接收進一步的訊息為止。其餘的每一個過濾器系統(810及812)都包括此進來的佇列回授能力,使得該系統途徑元件806可處理所有可用的過濾器系統(過濾器系統1、過濾器
系統2、...、過濾器系統N)之間的訊息負荷。
第一系統過濾器808的可適性過濾能力現將詳細地加以說明。在此特定的系統實施中,藉由提供有關過濾器的正確性的回授來對訊息標記/去除標記,系統管理員將擔任起決定是什麼構成系統800的垃圾郵件的工作。亦即,管理員實施使用者更正以產生每一系統(808、810及812)的FN及FP資訊。由於進來的訊息的數量龐大,這可根據一統計取樣方法來實施,該取樣方法可數學上地提供該被取出的樣本有一高程度的或然率,可反應出各別過濾器系統(808、810及812)所實施在決定何者是一垃圾訊息及何者為非垃圾訊息的過濾上的正確性。
又,管理員將經由一系統控制元件826從該緩衝器820取出一樣本,並驗證在該樣本上之訊息標籤的正確性。該系統控制元件826可以是一硬體及/或軟體處理系統,並連接至該等過濾器系統(808、810及812)以監視及控制它們。任何錯誤地標記的訊息都將用來建立第一過濾器816的誤負(FN)及誤正(FP)率資料。然後,此FN/FP率資料用在第二過濾器818上。如果該第一過濾器816的比率資料落在一閾限值以下的話,則第二過濾器818即可用來提供至少與第一過濾器816一樣好的過濾。當管理員再次從緩衝器820實施使用者更正取樣時,如果第二過濾器818的
FN/FP資料比第一過濾器816差的話,則該途徑控制元件814將會處理第二過濾器818的此FN/FP資料,並決定該訊息的途徑應被交換回到第一過濾器816。
該系統控制元件826界接至該系統訊息途徑元件806,以在系統控制元件826與系統訊息途徑元件806之間交換資料,並透過該管理員來提供管理。該系統控制元件826亦界接至其餘的系統(如過濾器系統2、...、過濾器系統N)的輸出緩衝器,以提供這些系統的取樣能力。管理員亦可透過系統控制元件826存取使用者收件匣途徑構件822,以監督使用者收件匣途徑構件822之操作。
一如上文中參照第1圖所述之過濾器的正確性可延申為複數個過濾器系統的正確性。該第一過濾器系統808的FN/FP率資料可用來訓練第二過濾器系統810及第三過濾器系統812的過濾器,以進一步加強整個系統800的過濾能力。相同地,可依據特定系統的FN/FP率資料來實施負荷控制。亦即,如果第一系統808的整體FN/FP資料比第二系統810的FN/FP資料差的話,則繞至第二系統810的訊息會比繞至第一系統808的多。
應被瞭解的是,過濾器系統(808、810及812)可以是獨立的過濾演算法,每一演算法在專屬電腦或電腦組合上執行。或者,當有足夠的硬體能力時,演算法可一起在一
單一電腦上執行以使得所有的過濾功能被實施在一單一的堅實機器上。
現參照第9圖,第9圖圖示一可執行上述架構的電腦的方塊圖。為了要提供本發明的不同態樣的額外脈絡,第9圖及以下的討論的目的是要提供適合的計算環境900的簡短且一般性的描述,而本發明的不同態樣可在計算環境900上實施。雖然本發明已經在上文中用電腦可執行的指令的一般性內容來加以說明,而電腦可執行的指令可在一或多台電腦上運行,但熟習此技藝者將可瞭解到本發明亦可用與其它程式模組相組合及/或硬體與軟體的組合的形式來實施。大體上,可執行特定工作或實施特定的抽象資料種類之程式模組包括常式,程式,元件,資料結構等等。又,熟習此技藝者將可瞭解到,本發明的方法可用其它電腦系統配置來實施,包括單一處理器或多處理器電腦系統、迷你電腦、主機型電腦(即個人電腦)、手持式計算裝置、以微處理器為基礎或可程式的消費性電子裝置及類似者,上述的每一種裝置都可操作地耦合至一或多個相關的裝置上。本發明之所舉出的態樣亦可在分散式計算環境上實施,其中某些工作是由透過一通信網路連接之遠端處理裝置來實施。在一分散式計算環境中,程式模組可位在本地及遠端記憶儲存裝置上。
再次參照第9圖,用來實施本發明的不同態樣之該舉例性的環境900包括一電腦902,該電腦902包括一處理單元904、一系統記憶體906及一系統匯流排908。該系統匯流排908將系統元件(包括但不侷限於系統記憶體906)耦接至處理單元904。處理單元904可以是任何市面上可購得的處理器。雙微處理器及其它多處理器架構亦可作為該處理單元904。
系統匯流排908可以是數種匯流排結構中的任何一種,包括使用市面上任何一種的匯流排架構之一記憶體匯流排或記憶體控制器、週邊匯流排及本地匯流排。該系統記憶體906包括唯讀記憶體(ROM)910及隨機存取記憶體(RAM)912。一基本輸入/輸出系統(BIOS)被儲存在ROM910中,該BIOS包含可在開機期間幫助傳輸資訊於電腦902內的部件之間的常式。
電腦902進一步包括一硬碟機914、一磁碟機916(如,從一可移除碟片918讀取或寫入)及一光碟機920(如讀取一CD-ROM碟片922或從其它光學媒體讀取或寫入)。硬碟機914、磁碟機916及光碟機920可分別藉由一硬碟機介面924、一磁碟機介面926及一光碟機介面928而連接至該系統匯流排908。該等裝置及與該等裝置相關的電腦可讀取媒體提供,資料、資料結構、電腦可執行的指令等
等的非揮發性儲存。對於電腦902而言,該等裝置及媒體容納以一適當的數位格式來儲存程式設計。雖然上文中有關電腦可讀取媒體的說明係指一硬碟、一可移除磁碟及一CD,但熟習此技藝者可瞭解的是,其它可被電腦所讀取之媒體,ZIP機、磁帶匣、快閃記憶卡、數位視訊碟片、卡匣、及類似者,亦可被使用在此舉例性的環境中,且任何這些媒體都可包含電腦可執行的指令用以實施本發明的方法。
許多電腦程式模組(包括作業系統930、一或多個應用程式932、其它程式模組934及程式資料936)都可被儲存在該等裝置及RAM912中。應被瞭解的是,本發明可用許多市面上可購得的作業系統或作業系統的組合來實施。
一使用者可經由一鍵盤938及一指標裝置,如一滑鼠940,來將命令及資訊輸入電腦902。其它的輸入裝置(未示出)可包括一麥克風、一紅外線(IR)遙控器、一搖桿、一遊戲盤、一衛星圓盤、一掃描器或類似者。這些及其它輸入裝置通常是經由串接埠介面942連接至處理單元904,而該串接埠介面942耦接至該系統匯流排908,但亦可經由其它界面來連接,如一平行埠、一遊戲埠、一萬用串接匯流排(“USB”)、一IR介面等。一監視器944或其它種類的顯示裝置亦經由一介面,如一視訊配接器946,而
被連接至該系統匯流排908。除了監視器944之外,一電腦典型地包括其它的週邊輸出裝置(未示出),如喇叭、印表機等等。
電腦902可在一網路環境中操作,並使用邏輯連線至一或多個遠端電腦,如一遠端電腦948。遠端電腦948可以是一工作站、一伺服器電腦、一路由器、一個人電腦、可攜式電腦、以微處理器為基礎的娛樂裝置、一同級裝置或其它共同的網路節點,且典型地包括許多或所有與電腦902相關的元件,然而,為了清晰起見,只有記憶儲存裝置950被示出。上述的邏輯連線包括一LAN952及一WAN954。此等網路環境在辦公室中、在企業內的電腦網路中、在網際網路中是很常見的。
當在一LAN網路環境中使用時,電腦902是透過一網路介面或配接器956而連接至區域網路952。當在WAN網路環境中使用時,電腦902典型地包括一數據機958,或是連接至LAN上的一通信伺服器,或具有其它的構件來在WAN954(如網際網路)上建立通信。數據機958(可以是內建或是外接)是經由串接埠介面942而連接至系統匯流排908。在一網路化的環境中,與電腦902相關的程式模組或程式模組的一部分可被儲存在遠端記憶儲存裝置950上。應被瞭解的是,所示的網路連線是舉例性,且建立通
信鏈於電腦之間的其它機構亦可被使用。
依據本發明的一個態樣,過濾器架構可適應使用過濾之系統的特定使用者所想要的過濾程度。然而,應被瞭解的是,此”可適性”之面向可從地區性使用者系統環境延伸至該系統供應商的製造過程,特定種類使用者的過濾程度可在工廠中被加以選擇用以實施在販售的系統中。例如,如果一購買者決定一第一批採購的系統是要提供給不需要存取垃圾郵件的使用者的話,則此批系統在工廠的內定設定可設定為高,而供第二類別之使用者使用之第二批系統則可配置為為較低的設定,以檢閱更多的垃圾郵件。在任何一種情形下,本發明之可適性的本質可被局部地建立,以允許任何類別的獨立使用者來調整過濾程度,或者如果禁止的話,可完全防止對內定的設定值作任何的變更。同樣應被瞭解的是,網路管理員執行比較存取權利來配置一或多個系統,以使得一或多個系統適當地與用本文所揭示之過濾器架構一起配置,而該網路管理員亦可局部地實施此一類別的配置。
上文中所揭示的包括了本發明的例子。當然不可能針對本發明之目的描述出所有可想出來的元件或方法組合,但熟習此技藝者可瞭解到本發明仍有許多其它進一步的組合及變更的可能。因此,本發明包含了落在由申請專利範
圍所界定的精神與範圍內的所有這些變化,修改及變更。又,在上文中或在申請專利範圍中所用之”包括”一詞,該詞之意義與”包含”的意義是相同的,而”包含”是申請專利範圍中的傳統用詞。
100‧‧‧垃圾訊息偵測系統
102‧‧‧訊息
104‧‧‧過濾器控制構件
106‧‧‧第一(種子)過濾器
108‧‧‧第二(新的)過濾器
112‧‧‧收件匣
114‧‧‧使用者更正元件
400‧‧‧使用者介面
200‧‧‧接收者-操作者曲線(ROC)
401‧‧‧垃圾郵件頁面
402‧‧‧選單列
404‧‧‧鏈結列
408‧‧‧設定子視窗
410‧‧‧第一選項
412‧‧‧第二選項
414‧‧‧第三選項
416‧‧‧第四選項
418‧‧‧相關設定區
420‧‧‧信箱視窗
422‧‧‧電子郵件控制工具列
424‧‧‧檔案夾選擇子視窗
426‧‧‧訊息
428‧‧‧訊息預覽子視窗
500‧‧‧網路
502,504,506‧‧‧客戶端
508‧‧‧閘道伺服器
510‧‧‧區域網路(LAN)
512‧‧‧電子郵件伺服器
514‧‧‧中央處理單元(CPU)
518‧‧‧使用者介面
520‧‧‧第一過濾器
522‧‧‧第二過濾器
524‧‧‧電子郵件收件匣位置(檔案夾)
526‧‧‧第二電子郵件收件匣位置(檔案夾)
600‧‧‧系統
602‧‧‧客戶端電腦
604‧‧‧第一過濾器
606‧‧‧第二過濾器
608‧‧‧使用者介面
610‧‧‧第一使用者
612‧‧‧登入畫面
618‧‧‧第二使用者
614‧‧‧第一使用者收件匣位置(檔案夾)
616‧‧‧第一使用者垃圾訊息位置(檔案夾)
620‧‧‧第二使用者收件匣
624‧‧‧第N個使用者
622‧‧‧第二使用者垃圾訊息位置
626‧‧‧第N個使用者收件匣
630‧‧‧客戶端網路介面
628‧‧‧第N個使用者垃圾訊息位置
632‧‧‧客戶端
700‧‧‧系統
702‧‧‧訊息伺服器
704,706,708‧‧‧客戶端
710‧‧‧第一過濾器
712‧‧‧第二過濾器
714‧‧‧緩衝器
716‧‧‧伺服器網路介面
800‧‧‧大規模過濾系統
802‧‧‧進來的訊息
804‧‧‧SMTP閘道
806‧‧‧系統訊息途徑元件
808,810,812‧‧‧過濾器系統
814‧‧‧途徑控制系統
816‧‧‧第一系統過濾器
818‧‧‧第二系統過濾器
820‧‧‧輸出緩衝器
822‧‧‧使用者收信匣途徑元件
824‧‧‧使用者收件匣
826‧‧‧系統控制構件
900‧‧‧環境
902‧‧‧電腦
904‧‧‧處理單元
906‧‧‧系統記憶體
908‧‧‧系統匯流排
910‧‧‧唯讀記憶體(ROM)
912‧‧‧隨機存取記憶體(RAM)
914‧‧‧硬碟機
916‧‧‧磁碟機
918‧‧‧可移除碟片
920‧‧‧光碟機
922‧‧‧CD-ROM碟片
924‧‧‧硬碟機介面
926‧‧‧磁碟機介面
928‧‧‧光碟機介面
930‧‧‧作業系統
932‧‧‧應用程式
934‧‧‧程式模組
936‧‧‧程式資料
938‧‧‧鍵盤
940‧‧‧滑鼠
942‧‧‧串接埠介面
944‧‧‧監視器
946‧‧‧視訊配接器
948‧‧‧遠端電腦
950‧‧‧記憶儲存裝置
952‧‧‧區域網路(LAN)
954‧‧‧廣域網路(WAN)
956‧‧‧網路配接器
958‧‧‧數據機
第1圖顯示依據本發明的過濾器系統的一般方塊圖。
第2圖為性能取捨(tradeoff)與攔截率之間的關係的圖表。
第3圖為依據本發明的方法的流程圖。
第4A及4B顯示依據本發明之用來配置可適性垃圾郵件過濾系統的舉例性使用者界面。
第5圖顯示運用本發明之訊息處理架構的一般方塊圖。
第6圖顯示具有一或更多台客戶電腦以促進多個使用者登入的系統,並依據本發明的技術來過濾進來的訊息。
第7圖顯示依據本發發明的系統,其中最初的過濾是實施在一訊息伺服器上,且輔助過濾係實施在一或多個客戶上。
第8圖顯示用在大規模應用上之可適性過濾系統的方塊圖。
第9圖顯示一電腦的方塊圖,該電腦可被操作用以執行本文所揭示的架構。
100‧‧‧垃圾訊息偵測系統
102‧‧‧訊息
104‧‧‧過濾器控制器構件
106‧‧‧第一(種子)過濾器
108‧‧‧第二(新的)過濾器
112‧‧‧收件匣
114‧‧‧使用者更正元件
Claims (29)
- 一種資料過濾系統,該資料過濾系統包含:一第一過濾器,該第一過濾器經配置以至少部分地依據垃圾資訊來標記訊息為垃圾,該垃圾資訊與該等訊息相關聯,該第一過濾器具有與該第一過濾器相關聯的一誤正率及一誤負率;一或更多第二過濾器,該一或更多第二過濾器經配置以至少部分地依據垃圾資訊來標記該等訊息為垃圾,該垃圾資訊與該等訊息相關聯,該一或更多第二過濾器最初與該第一過濾器的該誤正率及該誤負率相關聯;一過濾器輸出,該過濾器輸出經配置以從該第一過濾器與該一或更多第二過濾器接收已標記與未標記之訊息;一使用者更正元件,該使用者更正元件經配置以接收與已傳送至該過濾器輸出的已標記與未標記之該等訊息相關之使用者動作,並依據與已傳送至該過濾器輸出的已標記與未標記之該等訊息相關之使用者動作來輸出誤正資料與誤負資料;以及一過濾器控制器,該過濾器控制器經配置以執行下列步驟:接收該誤正資料與該誤負資料;依據該一或更多第二過濾器之至少一者之該誤正資 料或該誤負資料或兩者,調整該一或更多第二過濾器之至少一者之該誤正率或該誤負率或兩者;以及根據一閾限與該第一過濾器與該一或更多第二過濾器各別的誤正率、誤負率或兩者,將接收訊息依序繞經該第一過濾器與該一或更多第二過濾器之間。
- 如申請專利範圍第1項所述之系統,該等使用者動作包含隱含地標記該等訊息。
- 如申請專利範圍第1項所述之系統,該等使用者動作包含顯性地標記該等訊息為垃圾。
- 如申請專利範圍第1項所述之系統,該第一過濾器與該一或更多第二過濾器更進一步經配置以至少部分地依據好的資料,標記該等訊息為垃圾。
- 如申請專利範圍第1項所述之系統,其中該過濾器控制器更進一步經配置以依據其他使用者訊息之該內容,調整該至少一或更多第二過濾器之該誤正率與該誤負率。
- 如申請專利範圍第1項所述之系統,其中經配置以根據一 閾限與該第一過濾器與該一或更多第二過濾器各別的誤正率、誤負率或兩者,將接收訊息依序繞經該第一過濾器與該一或更多第二過濾器之間之步驟,包含經配置以將該等訊息繞經具有一最佳誤正率之一過濾器之步驟。
- 如申請專利範圍第1項所述之系統,其中該過濾器控制器更進一步經配置以在已標記一預定數量之訊息之後、已發生一預定時間之後或兩者皆發生之後,調整該至少一或更多第二過濾器之該誤正率與該誤負率或兩者。
- 如申請專利範圍第1項所述之系統,其中該系統更進一步經配置以從複數個產生閾限值中選取該閾限,該複數個產生的閾限值包含:超出合格閾限值的一平均閾限值、具有最低誤正率的一閾限值、以及最佳的或然率閾限(p*)之一閾限值,其中p*=N/(N+1),N為一數量之訊息。
- 如申請專利範圍第1項所述之系統,其中該系統更進一步經配置以從複數個閾限值中選取該閾限。
- 一種電腦可讀取媒體,該電腦可讀取媒體具有電腦可執行指令,當該等電腦可執行指令藉由一電腦執行時,可實行 以下步驟:藉由一第一過濾器,至少部分地依據垃圾資訊來標記訊息為垃圾,該垃圾資訊與該等訊息相關聯,該第一過濾器具有與該第一過濾器相關聯的一誤正率及一誤負率;藉由一或更多第二過濾器,至少部分地依據垃圾資訊來標記該等訊息為垃圾,該垃圾資訊與該等訊息相關聯,該一或更多第二過濾器最初與該第一過濾器的該誤正率及該誤負率相關聯;藉由一過濾器輸出,從該第一過濾器與該一或更多第二過濾器接收已標記與未標記之訊息;藉由一使用者更正元件,接收與已傳送至該過濾器輸出的已標記與未標記之該等訊息相關之使用者動作,並依據與已傳送至該過濾器輸出的已標記與未標記之該等訊息相關之使用者動作來輸出誤正資料與誤負資料;以及藉由一過濾器控制器,引導下列步驟:接收該誤正資料與該誤負資料;依據該一或更多第二過濾器之至少一者之該誤正資料或該誤負資料或兩者,調整該一或更多第二過濾器之至少一者之該誤正率或該誤負率或兩者;以及根據一閾限與該第一過濾器與該一或更多第二過濾器各別的誤正率、誤負率或兩者,將接收訊息依序 繞經該第一過濾器與該一或更多第二過濾器之間。
- 一種電腦,該電腦包含如申請專利範圍第1項所述的系統。
- 一種電腦網路系統,該電腦網路系統包含如申請專利範圍第1項所述的系統。
- 一種可攜式計算裝置,該可攜式計算裝置包含如申請專利範圍第1項所述的系統。
- 如申請專利範圍第13項所述之裝置,該裝置係為個人資料助理、電話或膝上型電腦。
- 一種促進可適性資料過濾之系統,該系統包含:一處理器;一記憶體,該記憶體通訊式耦接至該處理器,該記憶體具有儲存於該記憶體中之電腦可執行指令,該等電腦可執行指令經配置以實施該資料過濾系統,包括:一第一過濾器,該第一過濾器經配置以依據垃圾資訊來標示訊息為垃圾,該垃圾資訊與該等訊息相關聯,其中該第一過濾器與一第一正確率相關聯; 一第二過濾器,該第二過濾器經配置以依據垃圾資訊來標示該等訊息為垃圾,該垃圾資訊與該等訊息相關聯,其中該第二過濾器最初與該第一正確率相關聯;一過濾器輸出,該過濾器輸出經配置從該第一過濾器與該第二過濾器接收已標示與未標示之訊息;一使用者更正元件,該使用者更正元件經配置以接收使用者動作,並依據該等使用者動作來計算該第一正確率,且該等使用者動作覆蓋(override)在該過濾器輸出處接收之該等訊息之最初標示;以及一過濾器控制元件,該過濾器控制元件經配置以執行下列步驟:利用一閾限與該等使用者動作來訓練該第二過濾器,其中若一訊息為垃圾之或然率超過該閾限,則訓練該過濾器來標示該訊息為垃圾;計算該第二過濾器之一第二正確率;若該第二正確率優於該第一正確率,則將接收訊息依序繞經該第二過濾器,取代繞經該第一過濾器。
- 如申請專利範圍第15項所述之系統,其中該第二過濾器係與該第一過濾器結合。
- 如申請專利範圍第15項所述之系統,其中該垃圾資訊係包括下列之至少一者:傳送者資訊、來源IP位址、傳送者名稱、傳送者電子郵件位址、傳送者網域名稱、在識別子欄位中之難理解之文字與數字串、訊息本文中之用字與用詞、訊息本文中之特徵、或彈出式附加廣告之嵌入式鏈結。
- 如申請專利範圍第15項所述之系統,其中該第一正確率及該第二正確率包含一誤正率及一誤負率。
- 如申請專利範圍第15項所述之系統,其中該第二正確率係為該閾限之一函數。
- 如申請專利範圍第15項所述之系統,其中該第一過濾器係為一種子過濾器,且該種子過濾器經配置以根據歷史資料來識別一般垃圾訊息。
- 如申請專利範圍第15項所述之系統,其中該等使用者動作包括至少顯性或隱含地標記該訊息為一垃圾訊息或一非垃圾訊息中之一者。
- 如申請專利範圍第15項所述之系統,其中該等使用者動作 包括下列至少一者:標記一訊息為一非垃圾訊息、閱讀並刪除一訊息、轉寄一訊息、或回覆一訊息。
- 如申請專利範圍第15項所述之系統,其中該閾限係為一最佳的或然率閾限(p*),其中p*=N/(N+1),N為一數量之訊息。
- 一種促進資料過濾的方法,該方法包含以下步驟:根據一種子過濾器之一誤正率與一誤負率,自動地過濾輸入訊息;接收關於至少一已過濾訊息之使用者更正資料;依據關於至少一已過濾訊息之該使用者更正資料,決定該種子過濾器之一正確性;使用該使用者更正資料來訓練一新過濾器;決定該新過濾器的一誤正率及一誤負率;依據該新過濾器的該誤正率及該誤負率,決定該新過濾器之一正確性;以及若該新過濾器的正確性優於該種子過濾器的正確性,則用該新過濾器取代該種子過濾器。
- 如申請專利範圍第24項所述之方法,其中該使用者更正資 料包含關於覆蓋至少一已過濾之該訊息之最初分類。
- 如申請專利範圍第24項所述之方法,其中決定該新過濾器的該誤正率及該誤負率之步驟包含以下步驟:在藉由一使用者標記一預定數量的垃圾及非垃圾訊息之後、已發生一預定的時間之後、或兩者皆發生之後,決定該新過濾器的該誤正率及該誤負率。
- 一種電腦可讀取媒體,該電腦可讀取媒體具有儲存在該電腦可讀取媒體上之電腦可執行指令,當該等電腦可執行指令藉由一電腦執行時,可實施如申請專利範圍第24項之方法。
- 一種資料過濾系統,該資料過濾系統包含:用於過濾訊息的一第一構件,過濾該等訊息的一第一構件具有與該第一構件相關聯的一誤正率及一誤負率;過濾該等訊息之一新構件,過濾該等訊息之該新構件係根據與過濾該等訊息之該第一構件相關聯的該誤正率及該誤負率來加以訓練;一決定構件,該決定構件係用於決定與過濾該等訊息之該新構件相關聯之一新誤正率及一新誤負率與一閾限的函數關係;一決定閾限構件,該決定閾限構件係用於決定過濾該等 訊息之該新構件之一閾限;一取代構件,該取代構件係用在對於過濾該等訊息之該新構件而言,若存在一閾限使得與過濾該等訊息之該新構件相關聯之該新誤正率及該新誤負率一起考量時優於過濾該等訊息之該第一構件之該誤正率及該誤負率的話,則用過濾該等訊息之該新構件取代過濾該等訊息之該第一構件。
- 一種具有已儲存之電腦可執行指令之方法,已儲存之該等電腦可執行指令在一處理器上執行以促進可適性資料處理,該方法包含以下步驟:藉由一第一過濾器,依據垃圾資訊來標示訊息為垃圾,該垃圾資訊與該等訊息相關聯,其中該第一過濾器與一第一正確率相關聯;藉由一第二過濾器,依據垃圾資訊來標示該等訊息為垃圾,該垃圾資訊與該等訊息相關聯,其中該第二過濾器最初與該第一正確率相關聯;藉由一過濾器輸出,從該第一過濾器與該第二過濾器接收已標示與未標示之訊息;藉由一使用者更正元件,接收使用者動作,並依據該等使用者動作來計算該第一正確率,且該等使用者動作覆蓋在該過濾器輸出處接收之該等訊息之最初標示;以及 包括一過濾器輸出,該過濾器輸出經配置以:利用一閾限與該等使用者動作來訓練該第二過濾器,其中若一訊息為垃圾之或然率超過該閾限,則訓練該過濾器來標示該訊息為垃圾;計算該第二過濾器之一第二正確率;以及若該第二正確率優於該第一正確率,則將接收訊息依序繞經該第二過濾器,取代繞經該第一過濾器;其中該垃圾資訊係包括下列之至少一者:傳送者資訊、來源IP位址、傳送者名稱、傳送者電子郵件位址、傳送者網域名稱、在識別子欄位中之難理解之文字與數字串、訊息本文中之用字與用詞、訊息本文中之特徵、或彈出式附加廣告之嵌入式鏈結。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/374,005 US7249162B2 (en) | 2003-02-25 | 2003-02-25 | Adaptive junk message filtering system |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200423643A TW200423643A (en) | 2004-11-01 |
TWI393391B true TWI393391B (zh) | 2013-04-11 |
Family
ID=32868786
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093101775A TWI393391B (zh) | 2003-02-25 | 2004-01-27 | 可適性垃圾訊息過濾系統與方法 |
Country Status (19)
Country | Link |
---|---|
US (2) | US7249162B2 (zh) |
EP (1) | EP1597645B1 (zh) |
JP (1) | JP4524192B2 (zh) |
KR (1) | KR101076908B1 (zh) |
CN (1) | CN100437544C (zh) |
AT (1) | ATE464722T1 (zh) |
AU (1) | AU2003300051B2 (zh) |
BR (1) | BR0318024A (zh) |
CA (1) | CA2512821C (zh) |
DE (1) | DE60332168D1 (zh) |
HK (1) | HK1085286A1 (zh) |
IL (1) | IL169885A (zh) |
MX (1) | MXPA05008205A (zh) |
NO (1) | NO20053915L (zh) |
NZ (1) | NZ541391A (zh) |
RU (1) | RU2327205C2 (zh) |
TW (1) | TWI393391B (zh) |
WO (1) | WO2004079501A2 (zh) |
ZA (1) | ZA200505907B (zh) |
Families Citing this family (189)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999955B1 (en) * | 1999-04-20 | 2006-02-14 | Microsoft Corporation | Systems and methods for estimating and integrating measures of human cognitive load into the behavior of computational applications and services |
US7640305B1 (en) * | 2001-06-14 | 2009-12-29 | Apple Inc. | Filtering of data |
US7849141B1 (en) | 2001-06-14 | 2010-12-07 | Apple Inc. | Training a computer storage system for automatic filing of data using graphical representations of storage locations |
US7155608B1 (en) * | 2001-12-05 | 2006-12-26 | Bellsouth Intellectual Property Corp. | Foreign network SPAM blocker |
US8046832B2 (en) | 2002-06-26 | 2011-10-25 | Microsoft Corporation | Spam detector with challenges |
US8396926B1 (en) | 2002-07-16 | 2013-03-12 | Sonicwall, Inc. | Message challenge response |
US8924484B2 (en) * | 2002-07-16 | 2014-12-30 | Sonicwall, Inc. | Active e-mail filter with challenge-response |
US7908330B2 (en) | 2003-03-11 | 2011-03-15 | Sonicwall, Inc. | Message auditing |
US7539726B1 (en) | 2002-07-16 | 2009-05-26 | Sonicwall, Inc. | Message testing |
US8266215B2 (en) | 2003-02-20 | 2012-09-11 | Sonicwall, Inc. | Using distinguishing properties to classify messages |
US7406502B1 (en) | 2003-02-20 | 2008-07-29 | Sonicwall, Inc. | Method and system for classifying a message based on canonical equivalent of acceptable items included in the message |
US7299261B1 (en) * | 2003-02-20 | 2007-11-20 | Mailfrontier, Inc. A Wholly Owned Subsidiary Of Sonicwall, Inc. | Message classification using a summary |
US7249162B2 (en) * | 2003-02-25 | 2007-07-24 | Microsoft Corporation | Adaptive junk message filtering system |
US7219148B2 (en) * | 2003-03-03 | 2007-05-15 | Microsoft Corporation | Feedback loop for spam prevention |
US7543053B2 (en) | 2003-03-03 | 2009-06-02 | Microsoft Corporation | Intelligent quarantining for spam prevention |
US20050091320A1 (en) * | 2003-10-09 | 2005-04-28 | Kirsch Steven T. | Method and system for categorizing and processing e-mails |
US7856477B2 (en) * | 2003-04-04 | 2010-12-21 | Yahoo! Inc. | Method and system for image verification to prevent messaging abuse |
US7680886B1 (en) * | 2003-04-09 | 2010-03-16 | Symantec Corporation | Suppressing spam using a machine learning based spam filter |
US7483947B2 (en) | 2003-05-02 | 2009-01-27 | Microsoft Corporation | Message rendering for identification of content features |
US7272853B2 (en) | 2003-06-04 | 2007-09-18 | Microsoft Corporation | Origination/destination features and lists for spam prevention |
US20050044153A1 (en) * | 2003-06-12 | 2005-02-24 | William Gross | Email processing system |
US7711779B2 (en) | 2003-06-20 | 2010-05-04 | Microsoft Corporation | Prevention of outgoing spam |
US9715678B2 (en) | 2003-06-26 | 2017-07-25 | Microsoft Technology Licensing, Llc | Side-by-side shared calendars |
US7155484B2 (en) | 2003-06-30 | 2006-12-26 | Bellsouth Intellectual Property Corporation | Filtering email messages corresponding to undesirable geographical regions |
US7707255B2 (en) | 2003-07-01 | 2010-04-27 | Microsoft Corporation | Automatic grouping of electronic mail |
US8214437B1 (en) * | 2003-07-21 | 2012-07-03 | Aol Inc. | Online adaptive filtering of messages |
US7814545B2 (en) | 2003-07-22 | 2010-10-12 | Sonicwall, Inc. | Message classification using classifiers |
US7835294B2 (en) * | 2003-09-03 | 2010-11-16 | Gary Stephen Shuster | Message filtering method |
US20050071432A1 (en) * | 2003-09-29 | 2005-03-31 | Royston Clifton W. | Probabilistic email intrusion identification methods and systems |
US20050080642A1 (en) * | 2003-10-14 | 2005-04-14 | Daniell W. Todd | Consolidated email filtering user interface |
US7930351B2 (en) * | 2003-10-14 | 2011-04-19 | At&T Intellectual Property I, L.P. | Identifying undesired email messages having attachments |
US7451184B2 (en) * | 2003-10-14 | 2008-11-11 | At&T Intellectual Property I, L.P. | Child protection from harmful email |
US7664812B2 (en) * | 2003-10-14 | 2010-02-16 | At&T Intellectual Property I, L.P. | Phonetic filtering of undesired email messages |
US7610341B2 (en) * | 2003-10-14 | 2009-10-27 | At&T Intellectual Property I, L.P. | Filtered email differentiation |
US7921159B1 (en) * | 2003-10-14 | 2011-04-05 | Symantec Corporation | Countering spam that uses disguised characters |
US7715059B2 (en) * | 2003-10-22 | 2010-05-11 | International Business Machines Corporation | Facsimile system, method and program product with junk fax disposal |
US7590694B2 (en) | 2004-01-16 | 2009-09-15 | Gozoom.Com, Inc. | System for determining degrees of similarity in email message information |
EP1716676B1 (en) * | 2004-02-17 | 2012-06-13 | Cisco Technology, Inc. | Collecting, aggregating, and managing information relating to electronic messages |
US8214438B2 (en) | 2004-03-01 | 2012-07-03 | Microsoft Corporation | (More) advanced spam detection features |
US7644127B2 (en) * | 2004-03-09 | 2010-01-05 | Gozoom.Com, Inc. | Email analysis using fuzzy matching of text |
US7631044B2 (en) | 2004-03-09 | 2009-12-08 | Gozoom.Com, Inc. | Suppression of undesirable network messages |
US8918466B2 (en) * | 2004-03-09 | 2014-12-23 | Tonny Yu | System for email processing and analysis |
DE102004014139B4 (de) * | 2004-03-23 | 2006-07-20 | Vodafone Holding Gmbh | System und Verfahren zum Klassifizieren von elektronischen Nachrichten |
US20050223074A1 (en) * | 2004-03-31 | 2005-10-06 | Morris Robert P | System and method for providing user selectable electronic message action choices and processing |
US20090100523A1 (en) * | 2004-04-30 | 2009-04-16 | Harris Scott C | Spam detection within images of a communication |
US20050254100A1 (en) * | 2004-05-17 | 2005-11-17 | Venali, Inc. | Ticket exchange for combating fax spam |
US7461063B1 (en) * | 2004-05-26 | 2008-12-02 | Proofpoint, Inc. | Updating logistic regression models using coherent gradient |
US7756930B2 (en) * | 2004-05-28 | 2010-07-13 | Ironport Systems, Inc. | Techniques for determining the reputation of a message sender |
US7873695B2 (en) | 2004-05-29 | 2011-01-18 | Ironport Systems, Inc. | Managing connections and messages at a server by associating different actions for both different senders and different recipients |
US7849142B2 (en) * | 2004-05-29 | 2010-12-07 | Ironport Systems, Inc. | Managing connections, messages, and directory harvest attacks at a server |
US20060031318A1 (en) * | 2004-06-14 | 2006-02-09 | Gellens Randall C | Communicating information about the content of electronic messages to a server |
US7664819B2 (en) * | 2004-06-29 | 2010-02-16 | Microsoft Corporation | Incremental anti-spam lookup and update service |
US7904517B2 (en) | 2004-08-09 | 2011-03-08 | Microsoft Corporation | Challenge response systems |
US7660865B2 (en) * | 2004-08-12 | 2010-02-09 | Microsoft Corporation | Spam filtering with probabilistic secure hashes |
US7895531B2 (en) | 2004-08-16 | 2011-02-22 | Microsoft Corporation | Floating command object |
US8146016B2 (en) | 2004-08-16 | 2012-03-27 | Microsoft Corporation | User interface for displaying a gallery of formatting options applicable to a selected object |
US7703036B2 (en) | 2004-08-16 | 2010-04-20 | Microsoft Corporation | User interface for displaying selectable software functionality controls that are relevant to a selected object |
US8255828B2 (en) | 2004-08-16 | 2012-08-28 | Microsoft Corporation | Command user interface for displaying selectable software functionality controls |
US9015621B2 (en) | 2004-08-16 | 2015-04-21 | Microsoft Technology Licensing, Llc | Command user interface for displaying multiple sections of software functionality controls |
FI20041159A0 (fi) | 2004-09-07 | 2004-09-07 | Nokia Corp | Menetelmä viestien suodattamiseksi tietoverkossa |
FR2875317A1 (fr) * | 2004-09-10 | 2006-03-17 | France Telecom | Procede de surveillance de couriers electroniques emis et/ou recus par un client d'un fournisseur d'acces internet au sein d'un reseau de telecommunication |
US20060075048A1 (en) * | 2004-09-14 | 2006-04-06 | Aladdin Knowledge Systems Ltd. | Method and system for identifying and blocking spam email messages at an inspecting point |
EP1672936B1 (en) * | 2004-12-16 | 2018-12-05 | Sony Mobile Communications Inc. | Prevention of unsolicited messages |
KR100641410B1 (ko) | 2004-12-17 | 2006-11-01 | 엔에이치엔(주) | 특수 문자를 이용하여 편집한 단문 메시지의 필터링 방법및 이를 이용한 이동통신 단말기 |
US8396927B2 (en) * | 2004-12-21 | 2013-03-12 | Alcatel Lucent | Detection of unwanted messages (spam) |
US7752272B2 (en) * | 2005-01-11 | 2010-07-06 | Research In Motion Limited | System and method for filter content pushed to client device |
US8874646B2 (en) * | 2005-02-28 | 2014-10-28 | Nhn Corporation | Message managing system, message managing method and recording medium storing program for that method execution |
US8930261B2 (en) * | 2005-04-21 | 2015-01-06 | Verint Americas Inc. | Method and system for generating a fraud risk score using telephony channel based audio and non-audio data |
US8639757B1 (en) | 2011-08-12 | 2014-01-28 | Sprint Communications Company L.P. | User localization using friend location information |
US9571652B1 (en) | 2005-04-21 | 2017-02-14 | Verint Americas Inc. | Enhanced diarization systems, media and methods of use |
US7854007B2 (en) | 2005-05-05 | 2010-12-14 | Ironport Systems, Inc. | Identifying threats in electronic messages |
US8078740B2 (en) | 2005-06-03 | 2011-12-13 | Microsoft Corporation | Running internet applications with low rights |
US7865830B2 (en) | 2005-07-12 | 2011-01-04 | Microsoft Corporation | Feed and email content |
US7930353B2 (en) * | 2005-07-29 | 2011-04-19 | Microsoft Corporation | Trees of classifiers for detecting email spam |
US9542667B2 (en) | 2005-09-09 | 2017-01-10 | Microsoft Technology Licensing, Llc | Navigating messages within a thread |
US8627222B2 (en) | 2005-09-12 | 2014-01-07 | Microsoft Corporation | Expanded search and find user interface |
US20070118759A1 (en) * | 2005-10-07 | 2007-05-24 | Sheppard Scott K | Undesirable email determination |
US8065370B2 (en) | 2005-11-03 | 2011-11-22 | Microsoft Corporation | Proofs to filter spam |
US8272064B2 (en) * | 2005-11-16 | 2012-09-18 | The Boeing Company | Automated rule generation for a secure downgrader |
US7451145B1 (en) * | 2005-12-13 | 2008-11-11 | At&T Corp. | Method and apparatus for recursively analyzing log file data in a network |
EP1806885A1 (en) * | 2006-01-05 | 2007-07-11 | Alcatel Lucent | Electronic messaging management method and system |
US8131805B2 (en) * | 2006-03-01 | 2012-03-06 | Research In Motion Limited | Multilevel anti-spam system and method with load balancing |
US7685271B1 (en) * | 2006-03-30 | 2010-03-23 | Symantec Corporation | Distributed platform for testing filtering rules |
US8417783B1 (en) * | 2006-05-31 | 2013-04-09 | Proofpoint, Inc. | System and method for improving feature selection for a spam filtering model |
US9727989B2 (en) | 2006-06-01 | 2017-08-08 | Microsoft Technology Licensing, Llc | Modifying and formatting a chart using pictorially provided chart elements |
US8185737B2 (en) | 2006-06-23 | 2012-05-22 | Microsoft Corporation | Communication across domains |
CN104918240A (zh) * | 2006-06-29 | 2015-09-16 | 卢森特技术有限公司 | 用于sms垃圾过滤的smpp消息处理 |
US20080005238A1 (en) * | 2006-06-29 | 2008-01-03 | Microsoft Corporation | Roaming consistent user representation information across devices and applications |
US8166113B2 (en) * | 2006-08-02 | 2012-04-24 | Microsoft Corporation | Access limited EMM distribution lists |
JP4405500B2 (ja) * | 2006-12-08 | 2010-01-27 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 傾向分析システムの評価方法および装置 |
US7606214B1 (en) * | 2006-09-14 | 2009-10-20 | Trend Micro Incorporated | Anti-spam implementations in a router at the network layer |
CN101166159B (zh) * | 2006-10-18 | 2010-07-28 | 阿里巴巴集团控股有限公司 | 一种确定垃圾信息的方法及系统 |
US20080096592A1 (en) * | 2006-10-19 | 2008-04-24 | Waytena William L | Systems and Methods for Providing Communications Services Using Assigned Codes |
US8224905B2 (en) | 2006-12-06 | 2012-07-17 | Microsoft Corporation | Spam filtration utilizing sender activity data |
US7921176B2 (en) * | 2007-01-03 | 2011-04-05 | Madnani Rajkumar R | Mechanism for generating a composite email |
WO2008101838A2 (en) | 2007-02-22 | 2008-08-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Group access to ip multimedia subsystem service |
US8381096B2 (en) * | 2007-03-15 | 2013-02-19 | Yahoo! Inc. | Managing list tailoring for a mobile device |
US20080235246A1 (en) * | 2007-03-20 | 2008-09-25 | Arun Hampapur | Filter sequencing based on a publish-subscribe architecture for digital signal processing |
JP4904466B2 (ja) * | 2007-04-26 | 2012-03-28 | キヤノンItソリューションズ株式会社 | 情報処理装置、情報処理装置の制御方法、プログラム、及び記録媒体 |
US10019570B2 (en) | 2007-06-14 | 2018-07-10 | Microsoft Technology Licensing, Llc | Protection and communication abstractions for web browsers |
US8201103B2 (en) | 2007-06-29 | 2012-06-12 | Microsoft Corporation | Accessing an out-space user interface for a document editor program |
US8762880B2 (en) | 2007-06-29 | 2014-06-24 | Microsoft Corporation | Exposing non-authoring features through document status information in an out-space user interface |
US8484578B2 (en) | 2007-06-29 | 2013-07-09 | Microsoft Corporation | Communication between a document editor in-space user interface and a document editor out-space user interface |
US7890590B1 (en) * | 2007-09-27 | 2011-02-15 | Symantec Corporation | Variable bayesian handicapping to provide adjustable error tolerance level |
US20090089381A1 (en) * | 2007-09-28 | 2009-04-02 | Microsoft Corporation | Pending and exclusive electronic mail inbox |
JP4963099B2 (ja) * | 2007-10-23 | 2012-06-27 | Kddi株式会社 | 電子メールフィルタリング装置、電子メールのフィルタリング方法およびプログラム |
JP5032286B2 (ja) * | 2007-12-10 | 2012-09-26 | 株式会社ジャストシステム | フィルタリング処理方法、フィルタリング処理プログラムおよびフィルタリング装置 |
US20090183227A1 (en) * | 2008-01-11 | 2009-07-16 | Microsoft Corporation | Secure Runtime Execution of Web Script Content on a Client |
US7996897B2 (en) * | 2008-01-23 | 2011-08-09 | Yahoo! Inc. | Learning framework for online applications |
US9588781B2 (en) | 2008-03-31 | 2017-03-07 | Microsoft Technology Licensing, Llc | Associating command surfaces with multiple active components |
US8655954B2 (en) * | 2008-05-20 | 2014-02-18 | Raytheon Company | System and method for collaborative messaging and data distribution |
EP2304567A2 (en) * | 2008-05-20 | 2011-04-06 | Raytheon Company | Method and apparatus for providing a synchronous interface for an asynchronous service |
EP2301208A1 (en) * | 2008-05-20 | 2011-03-30 | Raytheon Company | System and method for dynamic contact lists |
US8112487B2 (en) * | 2008-05-20 | 2012-02-07 | Raytheon Company | System and method for message filtering |
EP2304924A1 (en) | 2008-05-20 | 2011-04-06 | Raytheon Company | System and method for maintaining stateful information |
TW200949570A (en) * | 2008-05-23 | 2009-12-01 | Univ Nat Taiwan Science Tech | Method for filtering e-mail and mail filtering system thereof |
US9665850B2 (en) | 2008-06-20 | 2017-05-30 | Microsoft Technology Licensing, Llc | Synchronized conversation-centric message list and message reading pane |
US8402096B2 (en) | 2008-06-24 | 2013-03-19 | Microsoft Corporation | Automatic conversation techniques |
US8490185B2 (en) * | 2008-06-27 | 2013-07-16 | Microsoft Corporation | Dynamic spam view settings |
US8554847B2 (en) * | 2008-07-15 | 2013-10-08 | Yahoo! Inc. | Anti-spam profile clustering based on user behavior |
US20100070372A1 (en) * | 2008-09-17 | 2010-03-18 | Yahoo! Inc. | Using spam and user actions to infer advertisements |
US20100211641A1 (en) * | 2009-02-16 | 2010-08-19 | Microsoft Corporation | Personalized email filtering |
US9046983B2 (en) | 2009-05-12 | 2015-06-02 | Microsoft Technology Licensing, Llc | Hierarchically-organized control galleries |
US7930430B2 (en) | 2009-07-08 | 2011-04-19 | Xobni Corporation | Systems and methods to provide assistance during address input |
US9021028B2 (en) | 2009-08-04 | 2015-04-28 | Yahoo! Inc. | Systems and methods for spam filtering |
US9152952B2 (en) * | 2009-08-04 | 2015-10-06 | Yahoo! Inc. | Spam filtering and person profiles |
US9529864B2 (en) | 2009-08-28 | 2016-12-27 | Microsoft Technology Licensing, Llc | Data mining electronic communications |
US8205264B1 (en) * | 2009-09-04 | 2012-06-19 | zScaler | Method and system for automated evaluation of spam filters |
US9183544B2 (en) | 2009-10-14 | 2015-11-10 | Yahoo! Inc. | Generating a relationship history |
US8959159B2 (en) * | 2010-04-01 | 2015-02-17 | Microsoft Corporation | Personalized email interactions applied to global filtering |
US8843568B2 (en) * | 2010-05-17 | 2014-09-23 | Microsoft Corporation | Email tags |
TWI423636B (zh) * | 2010-05-19 | 2014-01-11 | Chunghwa Telecom Co Ltd | 即時的郵件封包檢測系統及方法 |
US8880622B2 (en) * | 2010-06-30 | 2014-11-04 | International Business Machines Corporation | Message thread management using dynamic pointers |
US8635289B2 (en) | 2010-08-31 | 2014-01-21 | Microsoft Corporation | Adaptive electronic message scanning |
US8464342B2 (en) * | 2010-08-31 | 2013-06-11 | Microsoft Corporation | Adaptively selecting electronic message scanning rules |
US8849732B2 (en) * | 2010-09-28 | 2014-09-30 | Siemens Aktiengesellschaft | Adaptive remote maintenance of rolling stocks |
JP5025776B2 (ja) * | 2010-09-28 | 2012-09-12 | 株式会社東芝 | 異常診断フィルタ生成装置 |
US8589732B2 (en) | 2010-10-25 | 2013-11-19 | Microsoft Corporation | Consistent messaging with replication |
US9209993B2 (en) * | 2010-11-16 | 2015-12-08 | Microsoft Technology Licensing, Llc | Cooperative session-based filtering |
CN102480705B (zh) * | 2010-11-26 | 2015-11-25 | 卓望数码技术(深圳)有限公司 | 一种根据号码关系图过滤垃圾短信的方法及系统 |
US8744979B2 (en) * | 2010-12-06 | 2014-06-03 | Microsoft Corporation | Electronic communications triage using recipient's historical behavioral and feedback |
CN102567304B (zh) * | 2010-12-24 | 2014-02-26 | 北大方正集团有限公司 | 一种网络不良信息的过滤方法及装置 |
US8620836B2 (en) * | 2011-01-10 | 2013-12-31 | Accenture Global Services Limited | Preprocessing of text |
US8504492B2 (en) | 2011-01-10 | 2013-08-06 | Accenture Global Services Limited | Identification of attributes and values using multiple classifiers |
BR112013017705A2 (pt) * | 2011-01-14 | 2016-10-11 | Koninkl Philips Electronics Nv | aparelho |
US8635291B2 (en) * | 2011-02-18 | 2014-01-21 | Blackberry Limited | Communication device and method for overriding a message filter |
US9294306B2 (en) * | 2011-03-11 | 2016-03-22 | Shutterfly, Inc. | Intelligent prevention of spam emails at share sites |
RU2453919C1 (ru) * | 2011-03-28 | 2012-06-20 | Закрытое акционерное общество "Лаборатория Касперского" | Способ выявления спама в растровом изображении |
US9519682B1 (en) | 2011-05-26 | 2016-12-13 | Yahoo! Inc. | User trustworthiness |
US10277452B2 (en) * | 2011-07-08 | 2019-04-30 | Gree, Inc. | Message processing system and message processing method |
WO2013073639A1 (ja) | 2011-11-15 | 2013-05-23 | 日本電気株式会社 | ネットワーク通信装置、及び転送フレーム優先的帯域制限方法 |
US8954519B2 (en) * | 2012-01-25 | 2015-02-10 | Bitdefender IPR Management Ltd. | Systems and methods for spam detection using character histograms |
US9256862B2 (en) * | 2012-02-10 | 2016-02-09 | International Business Machines Corporation | Multi-tiered approach to E-mail prioritization |
US9152953B2 (en) * | 2012-02-10 | 2015-10-06 | International Business Machines Corporation | Multi-tiered approach to E-mail prioritization |
RU2510982C2 (ru) | 2012-04-06 | 2014-04-10 | Закрытое акционерное общество "Лаборатория Касперского" | Система и способ оценки пользователей для фильтрации сообщений |
US9876742B2 (en) * | 2012-06-29 | 2018-01-23 | Microsoft Technology Licensing, Llc | Techniques to select and prioritize application of junk email filtering rules |
TWI516158B (zh) | 2012-07-19 | 2016-01-01 | 葉宏堯 | 可攜式電子接入裝置以及無線數據網路系統 |
US9368116B2 (en) | 2012-09-07 | 2016-06-14 | Verint Systems Ltd. | Speaker separation in diarization |
US8938796B2 (en) | 2012-09-20 | 2015-01-20 | Paul Case, SR. | Case secure computer architecture |
US10134401B2 (en) | 2012-11-21 | 2018-11-20 | Verint Systems Ltd. | Diarization using linguistic labeling |
US9424213B2 (en) | 2012-11-21 | 2016-08-23 | Coherent Logix, Incorporated | Processing system with interspersed processors DMA-FIFO |
US9575633B2 (en) * | 2012-12-04 | 2017-02-21 | Ca, Inc. | User interface utility across service providers |
US8966203B2 (en) * | 2013-01-04 | 2015-02-24 | Microsoft Corporation | Shared and managed memory unified access |
CN103970801B (zh) * | 2013-02-05 | 2019-03-26 | 腾讯科技(深圳)有限公司 | 微博广告博文识别方法及装置 |
US9460722B2 (en) | 2013-07-17 | 2016-10-04 | Verint Systems Ltd. | Blind diarization of recorded calls with arbitrary number of speakers |
US9984706B2 (en) | 2013-08-01 | 2018-05-29 | Verint Systems Ltd. | Voice activity detection using a soft decision mechanism |
RU2638634C2 (ru) * | 2014-01-23 | 2017-12-14 | Общество с ограниченной ответственностью "Аби Продакшн" | Автоматическое обучение программы синтаксического и семантического анализа с использованием генетического алгоритма |
CN103793838A (zh) * | 2014-01-26 | 2014-05-14 | 宇龙计算机通信科技(深圳)有限公司 | 拦截广告的方法及其装置 |
US10931692B1 (en) * | 2015-01-22 | 2021-02-23 | Cisco Technology, Inc. | Filtering mechanism to reduce false positives of ML-based anomaly detectors and classifiers |
US9875742B2 (en) | 2015-01-26 | 2018-01-23 | Verint Systems Ltd. | Word-level blind diarization of recorded calls with arbitrary number of speakers |
US20160335432A1 (en) * | 2015-05-17 | 2016-11-17 | Bitdefender IPR Management Ltd. | Cascading Classifiers For Computer Security Applications |
WO2017018926A1 (en) * | 2015-07-24 | 2017-02-02 | Certis Cisco Security Pte Ltd | System and method for high speed threat intelligence management using unsupervised machine learning and prioritization algorithms |
US20170222960A1 (en) * | 2016-02-01 | 2017-08-03 | Linkedin Corporation | Spam processing with continuous model training |
US10063435B2 (en) * | 2016-04-11 | 2018-08-28 | The Boeing Company | System and method for context aware network filtering |
CN106201829B (zh) * | 2016-07-18 | 2019-01-22 | 中国银联股份有限公司 | 监控阈值确定方法及装置、监控报警方法、装置及系统 |
CN107040450B (zh) * | 2016-07-20 | 2018-06-01 | 平安科技(深圳)有限公司 | 自动回复方法和装置 |
US10838584B2 (en) | 2016-10-31 | 2020-11-17 | Microsoft Technology Licensing, Llc | Template based calendar events with graphic enrichment |
US10911382B2 (en) * | 2017-01-30 | 2021-02-02 | Futurewei Technologies, Inc. | Personalized message priority classification |
US11232369B1 (en) * | 2017-09-08 | 2022-01-25 | Facebook, Inc. | Training data quality for spam classification |
CN107798390B (zh) | 2017-11-22 | 2023-03-21 | 创新先进技术有限公司 | 一种机器学习模型的训练方法、装置以及电子设备 |
US11544577B1 (en) * | 2018-01-26 | 2023-01-03 | Amazon Technologies, Inc. | Adaptable filtering for edge-based deep learning models |
US11538128B2 (en) | 2018-05-14 | 2022-12-27 | Verint Americas Inc. | User interface for fraud alert management |
US10887452B2 (en) | 2018-10-25 | 2021-01-05 | Verint Americas Inc. | System architecture for fraud detection |
IL303147B2 (en) | 2019-06-20 | 2024-09-01 | Verint Americas Inc | Systems and methods for verification and fraud detection |
US11868453B2 (en) | 2019-11-07 | 2024-01-09 | Verint Americas Inc. | Systems and methods for customer authentication based on audio-of-interest |
CN111221970B (zh) * | 2019-12-31 | 2022-06-07 | 论客科技(广州)有限公司 | 基于行为结构和语义内容联合分析的邮件分类方法及装置 |
US11847537B2 (en) * | 2020-08-12 | 2023-12-19 | Bank Of America Corporation | Machine learning based analysis of electronic communications |
US11558335B2 (en) | 2020-09-23 | 2023-01-17 | International Business Machines Corporation | Generative notification management mechanism via risk score computation |
US11528242B2 (en) * | 2020-10-23 | 2022-12-13 | Abnormal Security Corporation | Discovering graymail through real-time analysis of incoming email |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619648A (en) * | 1994-11-30 | 1997-04-08 | Lucent Technologies Inc. | Message filtering techniques |
US5884033A (en) * | 1996-05-15 | 1999-03-16 | Spyglass, Inc. | Internet filtering system for filtering data transferred over the internet utilizing immediate and deferred filtering actions |
EP1003308A1 (en) * | 1998-10-21 | 2000-05-24 | Lucent Technologies Inc. | Priority and security coding system for electronic mail messages |
US6072942A (en) * | 1996-09-18 | 2000-06-06 | Secure Computing Corporation | System and method of electronic mail filtering using interconnected nodes |
US6101531A (en) * | 1995-12-19 | 2000-08-08 | Motorola, Inc. | System for communicating user-selected criteria filter prepared at wireless client to communication server for filtering data transferred from host to said wireless client |
US6199102B1 (en) * | 1997-08-26 | 2001-03-06 | Christopher Alan Cobb | Method and system for filtering electronic messages |
US6314421B1 (en) * | 1998-05-12 | 2001-11-06 | David M. Sharnoff | Method and apparatus for indexing documents for message filtering |
US6424997B1 (en) * | 1999-01-27 | 2002-07-23 | International Business Machines Corporation | Machine learning based electronic messaging system |
US6477551B1 (en) * | 1999-02-16 | 2002-11-05 | International Business Machines Corporation | Interactive electronic messaging system |
US20030009698A1 (en) * | 2001-05-30 | 2003-01-09 | Cascadezone, Inc. | Spam avenger |
Family Cites Families (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US184315A (en) * | 1876-11-14 | Improvement in combined stopper and dropper for bottles | ||
US199095A (en) * | 1878-01-08 | Improvement in amalgamators | ||
GB8918553D0 (en) | 1989-08-15 | 1989-09-27 | Digital Equipment Int | Message control system |
US5845077A (en) | 1995-11-27 | 1998-12-01 | Microsoft Corporation | Method and system for identifying and obtaining computer software from a remote computer |
ATE191819T1 (de) | 1995-12-29 | 2000-04-15 | Tixi Com Gmbh | Verfahren und mikrocomputersystem zur automatischen, sicheren und direkten datenübertragung |
EP1012730A1 (en) | 1996-01-31 | 2000-06-28 | Ipsilon Networks, Inc. | Improved method and apparatus for dynamically shifting between routing and switching packets in a transmission network |
US5704017A (en) | 1996-02-16 | 1997-12-30 | Microsoft Corporation | Collaborative filtering utilizing a belief network |
US6151643A (en) | 1996-06-07 | 2000-11-21 | Networks Associates, Inc. | Automatic updating of diverse software products on multiple client computer systems by downloading scanning application to client computer and generating software list on client computer |
US6453327B1 (en) | 1996-06-10 | 2002-09-17 | Sun Microsystems, Inc. | Method and apparatus for identifying and discarding junk electronic mail |
US5905859A (en) | 1997-01-09 | 1999-05-18 | International Business Machines Corporation | Managed network device security method and apparatus |
US5805801A (en) | 1997-01-09 | 1998-09-08 | International Business Machines Corporation | System and method for detecting and preventing security |
US6742047B1 (en) | 1997-03-27 | 2004-05-25 | Intel Corporation | Method and apparatus for dynamically filtering network content |
EP0881559B1 (en) | 1997-05-28 | 2003-08-20 | Siemens Aktiengesellschaft | Computer system for protecting software and a method for protecting software |
US7117358B2 (en) | 1997-07-24 | 2006-10-03 | Tumbleweed Communications Corp. | Method and system for filtering communication |
JP3932319B2 (ja) * | 1997-07-24 | 2007-06-20 | タンブルウィード コミュニケーションズ コーポレイション | 格納された鍵による暗号化/暗号解読を用いた電子メール用ファイアウォール |
US6195686B1 (en) * | 1997-09-29 | 2001-02-27 | Ericsson Inc. | Messaging application having a plurality of interfacing capabilities |
US6393465B2 (en) | 1997-11-25 | 2002-05-21 | Nixmail Corporation | Junk electronic mail detector and eliminator |
US6023723A (en) * | 1997-12-22 | 2000-02-08 | Accepted Marketing, Inc. | Method and system for filtering unwanted junk e-mail utilizing a plurality of filtering mechanisms |
WO1999032985A1 (en) | 1997-12-22 | 1999-07-01 | Accepted Marketing, Inc. | E-mail filter and method thereof |
US6052709A (en) * | 1997-12-23 | 2000-04-18 | Bright Light Technologies, Inc. | Apparatus and method for controlling delivery of unsolicited electronic mail |
GB2334116A (en) | 1998-02-04 | 1999-08-11 | Ibm | Scheduling and dispatching queued client requests within a server computer |
US6484261B1 (en) | 1998-02-17 | 2002-11-19 | Cisco Technology, Inc. | Graphical network security policy management |
US6504941B2 (en) | 1998-04-30 | 2003-01-07 | Hewlett-Packard Company | Method and apparatus for digital watermarking of images |
US6074942A (en) * | 1998-06-03 | 2000-06-13 | Worldwide Semiconductor Manufacturing Corporation | Method for forming a dual damascene contact and interconnect |
US6308273B1 (en) | 1998-06-12 | 2001-10-23 | Microsoft Corporation | Method and system of security location discrimination |
US6192360B1 (en) | 1998-06-23 | 2001-02-20 | Microsoft Corporation | Methods and apparatus for classifying text and for building a text classifier |
US6161130A (en) | 1998-06-23 | 2000-12-12 | Microsoft Corporation | Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set |
US6167434A (en) | 1998-07-15 | 2000-12-26 | Pang; Stephen Y. | Computer code for removing junk e-mail messages |
US6112227A (en) | 1998-08-06 | 2000-08-29 | Heiner; Jeffrey Nelson | Filter-in method for reducing junk e-mail |
US6434600B2 (en) | 1998-09-15 | 2002-08-13 | Microsoft Corporation | Methods and systems for securely delivering electronic mail to hosts having dynamic IP addresses |
GB2343529B (en) | 1998-11-07 | 2003-06-11 | Ibm | Filtering incoming e-mail |
US6546416B1 (en) | 1998-12-09 | 2003-04-08 | Infoseek Corporation | Method and system for selectively blocking delivery of bulk electronic mail |
US6643686B1 (en) | 1998-12-18 | 2003-11-04 | At&T Corp. | System and method for counteracting message filtering |
US6615242B1 (en) | 1998-12-28 | 2003-09-02 | At&T Corp. | Automatic uniform resource locator-based message filter |
US6266692B1 (en) | 1999-01-04 | 2001-07-24 | International Business Machines Corporation | Method for blocking all unwanted e-mail (SPAM) using a header-based password |
US6330590B1 (en) | 1999-01-05 | 2001-12-11 | William D. Cotten | Preventing delivery of unwanted bulk e-mail |
US6732149B1 (en) * | 1999-04-09 | 2004-05-04 | International Business Machines Corporation | System and method for hindering undesired transmission or receipt of electronic messages |
US6370526B1 (en) | 1999-05-18 | 2002-04-09 | International Business Machines Corporation | Self-adaptive method and system for providing a user-preferred ranking order of object sets |
US6592627B1 (en) | 1999-06-10 | 2003-07-15 | International Business Machines Corporation | System and method for organizing repositories of semi-structured documents such as email |
US6728690B1 (en) | 1999-11-23 | 2004-04-27 | Microsoft Corporation | Classification system trainer employing maximum margin back-propagation with probabilistic outputs |
US6321267B1 (en) | 1999-11-23 | 2001-11-20 | Escom Corporation | Method and apparatus for filtering junk email |
US6633855B1 (en) | 2000-01-06 | 2003-10-14 | International Business Machines Corporation | Method, system, and program for filtering content using neural networks |
US6701440B1 (en) | 2000-01-06 | 2004-03-02 | Networks Associates Technology, Inc. | Method and system for protecting a computer using a remote e-mail scanning device |
US7072942B1 (en) * | 2000-02-04 | 2006-07-04 | Microsoft Corporation | Email filtering methods and systems |
US6691156B1 (en) | 2000-03-10 | 2004-02-10 | International Business Machines Corporation | Method for restricting delivery of unsolicited E-mail |
US6684201B1 (en) | 2000-03-31 | 2004-01-27 | Microsoft Corporation | Linguistic disambiguation system and method using string-based pattern training to learn to resolve ambiguity sites |
US7210099B2 (en) | 2000-06-12 | 2007-04-24 | Softview Llc | Resolution independent vector display of internet content |
US20040073617A1 (en) | 2000-06-19 | 2004-04-15 | Milliken Walter Clark | Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail |
WO2001098936A2 (en) | 2000-06-22 | 2001-12-27 | Microsoft Corporation | Distributed computing services platform |
US6779021B1 (en) | 2000-07-28 | 2004-08-17 | International Business Machines Corporation | Method and system for predicting and managing undesirable electronic mail |
US6842773B1 (en) | 2000-08-24 | 2005-01-11 | Yahoo ! Inc. | Processing of textual electronic communication distributed in bulk |
US6971023B1 (en) | 2000-10-03 | 2005-11-29 | Mcafee, Inc. | Authorizing an additional computer program module for use with a core computer program |
US6757830B1 (en) | 2000-10-03 | 2004-06-29 | Networks Associates Technology, Inc. | Detecting unwanted properties in received email messages |
US7243125B2 (en) | 2000-12-08 | 2007-07-10 | Xerox Corporation | Method and apparatus for presenting e-mail threads as semi-connected text by removing redundant material |
US6775704B1 (en) | 2000-12-28 | 2004-08-10 | Networks Associates Technology, Inc. | System and method for preventing a spoofed remote procedure call denial of service attack in a networked computing environment |
US6901398B1 (en) * | 2001-02-12 | 2005-05-31 | Microsoft Corporation | System and method for constructing and personalizing a universal information classifier |
GB2373130B (en) | 2001-03-05 | 2004-09-22 | Messagelabs Ltd | Method of,and system for,processing email in particular to detect unsolicited bulk email |
US6928465B2 (en) | 2001-03-16 | 2005-08-09 | Wells Fargo Bank, N.A. | Redundant email address detection and capture system |
US6751348B2 (en) | 2001-03-29 | 2004-06-15 | Fotonation Holdings, Llc | Automated detection of pornographic images |
US7188106B2 (en) | 2001-05-01 | 2007-03-06 | International Business Machines Corporation | System and method for aggregating ranking results from various sources to improve the results of web searching |
US6768991B2 (en) | 2001-05-15 | 2004-07-27 | Networks Associates Technology, Inc. | Searching for sequences of character data |
US7103599B2 (en) | 2001-05-15 | 2006-09-05 | Verizon Laboratories Inc. | Parsing of nested internet electronic mail documents |
US7502829B2 (en) | 2001-06-21 | 2009-03-10 | Cybersoft, Inc. | Apparatus, methods and articles of manufacture for intercepting, examining and controlling code, data and files and their transfer |
US7328250B2 (en) | 2001-06-29 | 2008-02-05 | Nokia, Inc. | Apparatus and method for handling electronic mail |
TW533380B (en) | 2001-07-23 | 2003-05-21 | Ulead Systems Inc | Group image detecting method |
US6769016B2 (en) | 2001-07-26 | 2004-07-27 | Networks Associates Technology, Inc. | Intelligent SPAM detection system using an updateable neural analysis engine |
JP2003067304A (ja) * | 2001-08-27 | 2003-03-07 | Kddi Corp | 電子メールフィルタリングシステム、電子メールフィルタリング方法、電子メールフィルタリングプログラム及びそれを記録した記録媒体 |
JP2003085079A (ja) * | 2001-09-12 | 2003-03-20 | Xaxon R & D Corp | コンピュータネットワークにおけるコンテンツフィルタリング装置及びフィルタパターンファイルの配信方法並びに記憶媒体、プログラム |
US20060036701A1 (en) | 2001-11-20 | 2006-02-16 | Bulfer Andrew F | Messaging system having message filtering and access control |
CN1350246A (zh) * | 2001-12-03 | 2002-05-22 | 上海交通大学 | 智能化的电子邮件内容过滤方法 |
CN1350247A (zh) * | 2001-12-03 | 2002-05-22 | 上海交通大学 | 针对邮件内容的监管系统 |
US20030204569A1 (en) | 2002-04-29 | 2003-10-30 | Michael R. Andrews | Method and apparatus for filtering e-mail infected with a previously unidentified computer virus |
US7522910B2 (en) * | 2002-05-31 | 2009-04-21 | Oracle International Corporation | Method and apparatus for controlling data provided to a mobile device |
US20030229672A1 (en) | 2002-06-05 | 2003-12-11 | Kohn Daniel Mark | Enforceable spam identification and reduction system, and method thereof |
US8046832B2 (en) | 2002-06-26 | 2011-10-25 | Microsoft Corporation | Spam detector with challenges |
US20040003282A1 (en) * | 2002-06-28 | 2004-01-01 | Smith Alrick Lockhart | Method of storing data |
US8924484B2 (en) | 2002-07-16 | 2014-12-30 | Sonicwall, Inc. | Active e-mail filter with challenge-response |
US20040019651A1 (en) * | 2002-07-29 | 2004-01-29 | Andaker Kristian L. M. | Categorizing electronic messages based on collaborative feedback |
US7363490B2 (en) | 2002-09-12 | 2008-04-22 | International Business Machines Corporation | Method and system for selective email acceptance via encoded email identifiers |
US20040083270A1 (en) * | 2002-10-23 | 2004-04-29 | David Heckerman | Method and system for identifying junk e-mail |
US7149801B2 (en) | 2002-11-08 | 2006-12-12 | Microsoft Corporation | Memory bound functions for spam deterrence and the like |
US6732157B1 (en) | 2002-12-13 | 2004-05-04 | Networks Associates Technology, Inc. | Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages |
WO2004059506A1 (en) | 2002-12-26 | 2004-07-15 | Commtouch Software Ltd. | Detection and prevention of spam |
US7533148B2 (en) | 2003-01-09 | 2009-05-12 | Microsoft Corporation | Framework to enable integration of anti-spam technologies |
US7171450B2 (en) | 2003-01-09 | 2007-01-30 | Microsoft Corporation | Framework to enable integration of anti-spam technologies |
US7219131B2 (en) * | 2003-01-16 | 2007-05-15 | Ironport Systems, Inc. | Electronic message delivery using an alternate source approach |
US7249162B2 (en) * | 2003-02-25 | 2007-07-24 | Microsoft Corporation | Adaptive junk message filtering system |
US20040177120A1 (en) | 2003-03-07 | 2004-09-09 | Kirsch Steven T. | Method for filtering e-mail messages |
US20050015455A1 (en) | 2003-07-18 | 2005-01-20 | Liu Gary G. | SPAM processing system and methods including shared information among plural SPAM filters |
-
2003
- 2003-02-25 US US10/374,005 patent/US7249162B2/en not_active Expired - Fee Related
- 2003-12-31 BR BR0318024-7A patent/BR0318024A/pt not_active IP Right Cessation
- 2003-12-31 CN CNB2003801091949A patent/CN100437544C/zh not_active Expired - Fee Related
- 2003-12-31 NZ NZ541391A patent/NZ541391A/en not_active IP Right Cessation
- 2003-12-31 DE DE60332168T patent/DE60332168D1/de not_active Expired - Lifetime
- 2003-12-31 WO PCT/US2003/041526 patent/WO2004079501A2/en active Search and Examination
- 2003-12-31 MX MXPA05008205A patent/MXPA05008205A/es active IP Right Grant
- 2003-12-31 CA CA2512821A patent/CA2512821C/en not_active Expired - Fee Related
- 2003-12-31 RU RU2005126821/09A patent/RU2327205C2/ru not_active IP Right Cessation
- 2003-12-31 JP JP2004569229A patent/JP4524192B2/ja not_active Expired - Fee Related
- 2003-12-31 ZA ZA200505907A patent/ZA200505907B/en unknown
- 2003-12-31 AT AT03800310T patent/ATE464722T1/de active
- 2003-12-31 KR KR1020057012680A patent/KR101076908B1/ko active IP Right Grant
- 2003-12-31 AU AU2003300051A patent/AU2003300051B2/en not_active Ceased
- 2003-12-31 EP EP03800310A patent/EP1597645B1/en not_active Expired - Lifetime
-
2004
- 2004-01-27 TW TW093101775A patent/TWI393391B/zh not_active IP Right Cessation
-
2005
- 2005-07-26 IL IL169885A patent/IL169885A/en unknown
- 2005-08-22 NO NO20053915A patent/NO20053915L/no not_active Application Discontinuation
-
2006
- 2006-05-04 HK HK06105267.9A patent/HK1085286A1/xx not_active IP Right Cessation
-
2007
- 2007-07-17 US US11/779,263 patent/US7640313B2/en not_active Expired - Fee Related
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5619648A (en) * | 1994-11-30 | 1997-04-08 | Lucent Technologies Inc. | Message filtering techniques |
US6101531A (en) * | 1995-12-19 | 2000-08-08 | Motorola, Inc. | System for communicating user-selected criteria filter prepared at wireless client to communication server for filtering data transferred from host to said wireless client |
US5884033A (en) * | 1996-05-15 | 1999-03-16 | Spyglass, Inc. | Internet filtering system for filtering data transferred over the internet utilizing immediate and deferred filtering actions |
US6072942A (en) * | 1996-09-18 | 2000-06-06 | Secure Computing Corporation | System and method of electronic mail filtering using interconnected nodes |
US6199102B1 (en) * | 1997-08-26 | 2001-03-06 | Christopher Alan Cobb | Method and system for filtering electronic messages |
US6314421B1 (en) * | 1998-05-12 | 2001-11-06 | David M. Sharnoff | Method and apparatus for indexing documents for message filtering |
EP1003308A1 (en) * | 1998-10-21 | 2000-05-24 | Lucent Technologies Inc. | Priority and security coding system for electronic mail messages |
US6424997B1 (en) * | 1999-01-27 | 2002-07-23 | International Business Machines Corporation | Machine learning based electronic messaging system |
US6477551B1 (en) * | 1999-02-16 | 2002-11-05 | International Business Machines Corporation | Interactive electronic messaging system |
US20030009698A1 (en) * | 2001-05-30 | 2003-01-09 | Cascadezone, Inc. | Spam avenger |
Also Published As
Publication number | Publication date |
---|---|
HK1085286A1 (en) | 2006-08-18 |
IL169885A0 (en) | 2007-07-04 |
WO2004079501A2 (en) | 2004-09-16 |
ZA200505907B (en) | 2007-03-28 |
AU2003300051B2 (en) | 2009-02-19 |
TW200423643A (en) | 2004-11-01 |
US7249162B2 (en) | 2007-07-24 |
EP1597645A4 (en) | 2009-03-18 |
US7640313B2 (en) | 2009-12-29 |
NO20053915D0 (no) | 2005-08-22 |
CA2512821A1 (en) | 2004-09-16 |
EP1597645A2 (en) | 2005-11-23 |
WO2004079501A3 (en) | 2005-10-06 |
CN1742266A (zh) | 2006-03-01 |
JP4524192B2 (ja) | 2010-08-11 |
EP1597645B1 (en) | 2010-04-14 |
AU2003300051A1 (en) | 2004-09-28 |
KR20060006767A (ko) | 2006-01-19 |
CA2512821C (en) | 2012-12-18 |
JP2006514371A (ja) | 2006-04-27 |
MXPA05008205A (es) | 2005-09-30 |
ATE464722T1 (de) | 2010-04-15 |
RU2327205C2 (ru) | 2008-06-20 |
BR0318024A (pt) | 2005-12-06 |
US20080010353A1 (en) | 2008-01-10 |
DE60332168D1 (de) | 2010-05-27 |
RU2005126821A (ru) | 2006-01-20 |
NZ541391A (en) | 2008-08-29 |
KR101076908B1 (ko) | 2011-10-25 |
IL169885A (en) | 2010-11-30 |
NO20053915L (no) | 2005-09-22 |
CN100437544C (zh) | 2008-11-26 |
US20040167964A1 (en) | 2004-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI393391B (zh) | 可適性垃圾訊息過濾系統與方法 | |
US7890585B2 (en) | Second person review of email | |
JP5047624B2 (ja) | アンチスパム技法の組込みを可能にするフレームワーク | |
KR101965023B1 (ko) | 시간 관리형 전자 메일 메시지 처리 기법 | |
JP6246591B2 (ja) | 電子通信のトリアージ | |
US7543031B2 (en) | Publication to shared content sources using natural language electronic mail destination addresses and interest profiles registered by the shared content sources | |
US6732157B1 (en) | Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages | |
US7222157B1 (en) | Identification and filtration of digital communications | |
US20060168046A1 (en) | Managing periodic electronic messages | |
US7933961B2 (en) | Email rating system and method | |
US20100088380A1 (en) | Message rendering for identification of content features | |
US20070073816A1 (en) | Method and system for providing increased information and improved user controls for electronic mail return receipts | |
US20050283519A1 (en) | Methods and systems for combating spam | |
US8990315B2 (en) | Sending messages with limited awareness of recipients | |
WO2007071588A1 (en) | Publication to shared content sources using natural language electronic mail destination addresses and interest profiles registered by the shared content sources | |
US20080059586A1 (en) | Method and apparatus for eliminating unwanted e-mail | |
JP2005182154A (ja) | メッセージ処理システムおよびメッセージ処理方法 | |
JP2022105616A (ja) | サーバ装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |