TWI353146B - Origination/destination features and lists for spa - Google Patents

Origination/destination features and lists for spa Download PDF

Info

Publication number
TWI353146B
TWI353146B TW093113883A TW93113883A TWI353146B TW I353146 B TWI353146 B TW I353146B TW 093113883 A TW093113883 A TW 093113883A TW 93113883 A TW93113883 A TW 93113883A TW I353146 B TWI353146 B TW I353146B
Authority
TW
Taiwan
Prior art keywords
features
address
message
feature
spam
Prior art date
Application number
TW093113883A
Other languages
English (en)
Other versions
TW200509615A (en
Inventor
Joshua T Goodman
Robert L Rounthwaite
Daniel Gwozdz
John D Mehr
Nathan D Howell
Micah C Rupersburg
Bryan T Starbuck
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of TW200509615A publication Critical patent/TW200509615A/zh
Application granted granted Critical
Publication of TWI353146B publication Critical patent/TWI353146B/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Information Transfer Between Computers (AREA)
  • Image Analysis (AREA)

Description

1353146 九、發明說明: 【發明所屬之技術領域】 本發明係關於識別合法(例如好的郵件)以及不要郵 件的系統與方法’尤其係關於處理電子訊息來擷取資料, 以幫助防治垃圾郵件。 【先前技術】 像是網際網路這種全球通訊'網路的出現展現出接觸到 大量潛在客戶的商機。電子傳訊,尤其是電子郵件 ("email")已經成為將不要的廣告與促銷(也稱為「垃圾郵 件」)傳播給網路使用者的普遍媒介。
Radic at i Group. Inc.這豕諮詢與市場研究公司估計 到2 0 0 2年8月每天傳送的垃圾郵件訊息有二十億射,而 此數據預期每兩年會變成三倍。垃圾訊息對於個人與實體 (例如公司、政府機構)造成相當多的不方便與時間浪費。 因此,垃圾郵件遲早會變成可靠計算能力的主要威脅。 用於妨礙垃圾郵件的關鍵技術為過濾系統/方法的利 用》—種防治垃圾郵件的過濾技術係以機器學習方式為基 礎,機器學習過濾器將此訊息為垃圾郵件的可能性指定給 一傳入訊息。在此方式中,特色通常從兩種範例訊息等級 (例如垃圾郵件與非垃圾郵件)中擷取,並且學習過濾器運 用以區分兩種等級之間的可能性。因為許多訊息特色都與 内容有關(例如主題内的字與詞彙以及/或郵件本體)。這 1353146 種過濾器一般稱為「内 在有了這種垃圾郵 件者都苦思許多方法偽 垃圾郵件過遽器。因此 無法有效識別並阻擋偽 容式過濾器」。 +過濾技術之後,許多垃圾郵件寄 裝他们的識別,以避免以及/或繞過 傳統内容式以及適應式過濾器就 裝過的垃圾郵件。 下文中論及本發明的簡單 要徒供對本發明一此凝 域的基本了解。此摘要並非^ ^ 並非本發明的廣泛簡介, 識別本發明的關鍵/重要开彼+ *·' ^ 安70件或描述本發明的領域。其目的 在於以一種簡單的方式呈、 八呈現本發明某些領域 詳細說明的前言。 #局稍後更 垃圾郵件寄件者幾乎 卞了將郵件内所有資訊都 來。例如,他們可嵌入影像,. 坶裒起 m 故樣就不能使用文字奋撼哭 學習系統的特色。影像其s 7 田機盗 像甚至可以扭曲使其難以 軟體’或至少用起來相當缸吐 ㈣《耗時。另外,不管寄件者 多少特色,仍舊還是有可用 除了 頁Λ。首先,垃圾郵件 者必須從某處寄出郵件,我彳門π社 干奇件 我們可偵測到寄發自某些 址的郵件。第二,垃圾郵件岑 仇 坤仟寄件者幾乎都是試圖販賣 物品’因此必須包含聯絡方彳 _ '、二 々式,廷有可能是免付費電話, 不過因為成本過高所以垃极郵件寄件者可能不願意使用 也有可能是-般電話,不過因為回應率過低所以 寄件者可能不願意使用。 ^ 另外’有可能是URL (例如 1353146 r h 11 p . / / w w v. s p a m c 〇 r p · c 〇 m / b u y e η 1 a r e e r _ h t m )。此 入影像讓它難以過濾’以及/或讓軟體難以偵測 為使用者必須在瀏覽器内手動輸入URL而降伯 所以垃圾郵件寄件者可能不願意使用此方法。 垃圾郵件寄件者最可能使用的聯絡方式是内 或透過歲入式的一些種類的電子郵件地址。例如 解更多j ’其令「按此」包含:依照本發明一個態 學習系統會偵測並使用的特定網ί連結。相同地 為回覆{例如一般是「寄件地址」,但有時為「回邏 任合嵌入的maUt(K連結(按下就可讓郵件寄亡 或其他任何嵌入的電子郵件地址。此外,垃圾郵 通常在郵件内包含影像。因為一再傳遞大量影 貴,所以垃圾郵件寄件者通常只會嵌入影像的特 讓影像可以下載。這些連結指向的位置也可用來十 有關從郵件寄件地址、郵件回覆地址、嵌入备 地址、外部連結以及外部影像連結中取得的資訊 訊至少有一部分可作為機器學習系統的特色其 於權值或可能,fi,或可將資訊加入清單中。例如 只保留傳送垃圾郵件的IP&址或寄件人地址清 保留良好郵件 '或超過9〇 Λ的良好郵件清單等 上,位於該清單上的特定連結或位址可用 =統的特色,《料任何垃圾郵件過據系統的— 這兩者。 本發明提供一種藉由試驗郵件特 定部分,來 URL可嵌 5不過,因 «回應率, 嵌連結, ’ 按此了 樣的機器 ,地址可 L地址」卜 ^的連結) 件寄件者 像相當昂 殊連結, b為特色。 ^ mailto: ,這些資 中可相關 ’我們可 單’或只 專。事實 機器學習 部分,或 幫助識別 1353146 已偽裝的垃圾郵件之系統與方法。尤其是,本發明牽涉到 處理像是電子郵件 (email)這類訊息,以擷取來源地以及 /或目的地資料來分辨合法訊息與垃圾郵件訊息。此處理包 含許多技術,用於識別與剖析IP位址資訊、電子郵件地 址資訊、以及/或一致資源定址器(URL)資訊,並且將擷 取的資料附加為垃圾郵件屬性(例如良好使用者對不良使 用者,良好寄件者對不良寄件者)。例如,可考慮將不良使 用者或不良寄件者作為垃圾郵件寄件者(例如傳送垃圾郵 件的人)。 擷取的資料或至少一部分可用來產生機器學習系統使 用的特色集合。機器學習技術會試驗訊息的内容,決定該 訊息是否為垃圾郵件。垃圾郵件寄件者會將大多數訊息内 容弄混,像是將其大部分資訊放入難以處理的影像中。不 過,因為垃圾郵件寄件者需要提供收件者容易與之接觸的 方式,所以無法完全偽裝訊息出處。範例包含像是使用連 結(例如 U R L)以及/或電子郵件地址(例如 IP位址)。 這種資訊或變數或部分可用來作為垃圾郵件偵測器的特 色。尤其是,藉由機器學習系統可用這些資訊來訓練垃圾 郵件偵測器以及/或垃圾郵件過濾器。 本發明也與親代控制系統共同運作。親代控制系統可 告知使用者該訊息是否合適,也可指出不合適的理由,像 是「内含色情成份」。根據本發明的一個態樣,一或多個擷 取或正規化的特色(例如 URL)可通過親代控制系統或 過濾器,獲得親代控制系統的區分。此區分可用來作為機 8 1353146 器學習系統的額外特色,幫助建立以及/或改善垃圾郵件過 渡器。 更進一步,可依照類型區分的擷取特色可根據垃圾郵 件散佈程度加上權值,並且可指定成為正(例如不太像垃 圾郵件)或負(例如很像垃圾郵件)特色。特色也可用於 建立像是非垃圾郵件寄件者清單與垃圾郵件清單這些清 單。 若要達成前述與相關目的,在此將結合下列說明與附 錄圖式來說明本發明的特定說明態樣,不過這些領域只由 一些運用本發明原理的方式來指示,並且本發明包含所有 這些態樣與其等效態樣。在考慮到附圖時,從下列本發明 的實施方式中將會對本發明的其他優點與創新特色有通盤 的了解。 【實施方式】 此時將參考圖式來說明本發明,其中相同的參考號碼 用來指示相同的元件。在下列說明中,用於解釋說明,將 公佈許多設定細節以提供對本發明通盤的了解。不過,吾 人可瞭解到,在沒有這些特定細節的情況下也可實施本發 明》在其他實例中,已知的結構與裝置都以方塊圖來顯示, 以幫助說明本發明。 如本申請書内所使用,「組件j與「系統」這兩詞用於 表示電腦相關實體、硬體、硬體與軟體的組合、軟體或執 9 1353146 行中的軟體。例如,組件可為但不受限於處理器上執行的 處理、處理器、物件、可執行物、執行緒、程式以及/或電 腦。藉由說明,伺服器上執行的應用程式以及伺服器都可 為組件。行程以及/或執行緒内可以有一或多個組件,並且 組件可位於一部電腦上以及/或分布在兩或多部電腦之間。 本發明併入許多推論演算法以及/或技術,與產生用於 機器學習垃圾郵件過濾的訓練資料結合。如此處所用,「推 論」一詞通常表示推理的處理,或從觀察中作為事件以及/ 或資料内擷取之系統、環境以及/或使用者的推論狀態。推 論可運用來識別特殊情況或動作,或可產生狀態上的機率 分配。推論可為可能性,也就是根據資料與事件的考量, 相關狀態上機率分布的計算。推論也可是用於組成來自一 組事件以及/或資料的較高等級事件之技術。這種推論產生 來自.一組觀察事件以及/或儲存事件資料的新事件或動作 結構,不管事件是否是在最近修正過,並且事件與資料是 否來自一或多個事件與資料源。 吾人可瞭解到,雖然在本說明書内廣泛使用到訊息一 詞,這詞並不受限於電子郵件,而可合適調整為包含可在 任何合適的通訊架構内散佈的任何形式電子訊息。例如, 幫助兩人以上進行會議的會議應用程式(例如互動式交談 程式以及即時傳訊程式)也可利用此處公佈的過濾優點, 因為在使用者交換訊息以及/或插入作為前導訊息、結束訊 息或上述訊息時,可在正常交談訊息中散佈不要的文字。 在此特定應用情況中,可訓練過濾器以自動地過濾特定訊 10 1353146 息内容(文字與影像),以便擷取不想要的内容並記錄為垃 圾郵件(例如商業、促銷或廣告)。 在本發明中,「收件人」一詞代表傳入訊息或郵件項目 的地址。「使用者」一詞根據前後文可表示收件人或寄件 人。例如,使用者可代表傳送垃圾郵件的電子郵件使用者, 以及/或使用者可代表接收垃圾郵件的電子郵件收件者,這 取決於該詞的上下文關係與應用情況。 網際網路通訊協定 (IP)位址為 3 2位元數,通常代 表網際網路上的機器。在兩部機器通訊時就會用到這些數 字。通常以 "XXX.XXX.XXX.XXX"的形式來表示,其中每個 XXX介於 0與 25 5之間。不幸的是,IP位址非常難記。 因為如此,所以建立了 「網域名稱」以及「主機名稱」轉 換。「網域名稱」是網際網路上一組機器的名稱(可能是單 一部機器),並且常見的形式為 "x.com”、My.edu·,或 "coinls.wa.gov" ° 「全合格網域名稱 (FQDN)」是網際網路上一特定機 器,例如 ”b.x.com"、"c.y.edu"或"www.courts_wa.gov", 而網域名稱部分分別為 π X · c 〇 m ” 、 " y. e d u" 或 "Courts.wa.gov"。”b"、"c"與"www"部分分別稱為 FQDN 的主機名稱部分。一般來說,IP位址可用於網路名稱可使 用的任何情況(例如 nDN/IP"表示這兩種可能性都存 在)。也是一般來說,IP位址可用於FQDN可使用的任何 情況(例如"FQDN/IP”表示這兩種可能性都存在)。電子 郵件地址由使用者名稱以及網域名稱或 IP位址 (DN/IP) 11 1353146 所組成’例如"a@)c.com,·或"a@l .2.3.4"。在這兩範例中, 使用者名稱為V。 —致資源定址器 (URL)通常為 「服務名 稱:FQDN/IP/url-path j 的 形 式 。 例 如 "http://www.microsoft.com/windovvs/help.htm" 就 是 URL。"http"這個部分為服務名稱,'_wvvw.microsoft.com” 這個部分為 FQDN ,並且 "windows/he lp.htm"這個部分 為 URL路徑。這是簡單的 URL,但已經足夠本發明探討。 此時請參閱第1圖,其說明依照本發明一個態樣的特 色擷取與訓練系統1 〇〇之一般方塊圖。特色擷取與訓練系 統1 0 0牽涉到處理傳入訊息丨1 〇 ’以從訊息中擷取資料或 特色。這種特色可從訊息以及/或其變化中提供的至少部分 來源地以及/或目的地資訊中擷取。尤其是系統1〇〇可透 過訊息接收組件1 2 0接收一或多個傳入訊息]1 〇。訊息接 收組件1 2 0可位於電子郵件或訊息伺服器上,來接收傳入 訊息11 〇。雖然某些訊息(例如至少一種)容易遭受現有 過濾器(例如垃圾郵件、垃圾信件 '親代控制過滤器)的 攻擊,而歸類到垃圾夹或垃圾郵件資料夾,並且可擷取至 >部分來源地以及/或目的地資料,並去除使用障礙與機器 學習系統或傳播特色清單結合。 訊息接收組件120可將傳入訊息或訊息的子集傳到 特色擷取組件13〇。特色擷取組件丨3〇可從個別訊息11〇 内擷取資料,以便產生特色集合幫助過濾器訓練並且最終 幫助偵測垃圾郵件。在此可發現以及/或嵌入從訊息中擷取 12 1353146 與來源地以及/或目的地資訊有關的資料或特色。資料或特 色的範例包含:寄件人IP位址、回覆電子郵件地址、CC: (例如副本抄送)電子郵件地址。許多種URL (包含文字式 連结、影像式連結、以及文字形式的URL或部分)、付費 電話號瑪(例如特別是區域碼)、免付費電話號瑪、rnailt〇: 電子郵件地址連結、文字形式的電子郵件地址、SMTP HELO指令中的FQDN ' SMTP MAIL FROM地址/返回路 徑地址、以及/或至少上述任何部分。 特色擷取組件130可執行任何合適數量的處理,以 從訊息1 1 0中擷取許多組特色來用於機器學習系統内。此 外’特色組合可用於傳播其他過濾器訓練技術的清單。 例如像是 a.x.com的 FQDN可轉換成通常代表 ip 位址的數字。IP位址由四組小數點分開的數字組成。每一 組都由小數點分隔,並且數字範圍介於〇到 2 5 5,其中每 個數字變化對應到不同的網介網路名稱。例如,a.x.c〇m可 轉譯成 123.124.125.126,而 121.124.125.126 則代表 qrsluv.com·。而因為數字並不如文字這般容易識別和記 憶,所以IP位址通常由個別 FQDN來表示。相同的小數 點區分之ΪΡ位址也可表示成另一種形式,以下將封論之。 根據本發明的一個態樣,特色擷取組件1 3 0焦點放在 訊息Π 0内含的寄件人IP位址》寄件人IP位址係根據 昱少部分收件人的IP資訊。一般而言,透過網際綱路傳 送的郵件會從伺服器傳輸到伺服器,一次至少牽涉到兩個 伺服器(例如一個寄件伺服器以及一個收件伺服器)。在極 13 1353146 為少見的情況中,用戶端可直接傳送到伺服器。在某些情 況下,由於存在著防火牆,所以會牽涉到許多伺服器,這 樣郵件或訊息才能從一個伺服器傳送到其他伺服器。尤其 是,某些伺服器位於防火牆之内,因此只能與防火牆外面 的指定伺服器通訊。這導致訊息從傳送器到接收器之間的 跳躍數量增加。寄件人行包含 IP位址,幫助追蹤訊息的 路徑確定訊息來自何方。 當訊息1 1 0從伺服器移動到伺服器,每個聯絡的伺服 器會將 IP位址(接收訊息用的)的識別事先規劃到訊息 的寄件人欄位(即是 ” R e c e i v e d : ”欄位),以及其交談的祠 服器所謂之 FQDN名稱。此 FQDN由傳送伺服器透過 SMTP通訊協定的 HELO指令告知接收伺服器,因此若傳 送伺服器位於組織之外就不可信任。例如,訊息可具有五 行擁有 5個IP位址與事先規劃 FQDN的寄件人行,這 表示此訊息已經通過六個不同的伺服器(即是已經通過 5 次),而且以其事先規劃的反向順序排列(即是最後一個排 第一)。不過,每個伺服器都具有修改任何較低(較早規劃) 行的能力。這在訊息於多個伺服器之間傳遞時,特別有問 題。因為每個中間伺服器都可改變任何較早寫入(較低) 的寄件人行,垃圾郵件寄件人可偽造IP位址成為訊息的 寄件人行,將寄件人 IP資訊或垃圾郵件訊息的寄件人偽 裝起來。例如,垃圾郵件訊息初次出現時是傳送自 trusleddomain.com,如此會誤報真實的訊息來源給收件人。 對於垃圾郵件軟體最重要的就是迅速識別傳送到組織 14 1353146 内伺服器的組織外 ip位址,因為此 ip位址由組織内的 接收伺服器撰寫,因此可看待成正確的 IP位址。組織外 的所有其他 IP位址都不可信賴,因為其由組織外的伺服 器所撰寫,因此可能修改過了。在收件人組織路徑内可能 牽涉到傳送伺服器的許多IP位址,但是因為只有一個可 以信賴,我們將這個可以信賴的稱為「寄件人J IP位址。
讓垃圾郵件過濾軟體發現此寄件人IP位址的方式就 是知道組織内的郵件伺服器組態,一般而言,若知道在哪 種情況下由哪個機器傳遞到其他機器,如此就可決定出寄 件人的 IP位址。不過,尤其是對於安裝在電子郵件用戶 端内的垃圾郵件過濾軟體來說,並不方便說明伺服器的組 態。另一種方式牽涉到利用 MX記錄來決定訊息的真實來 源。對於每個網域名稱而言,MX記錄清單,就是該網域 的電子郵件收件人之 FQDN。吾人可透過從清單所接收的 往回追蹤,直到發現 IP位址對應到網域的 MX記錄内實 體所對應的 FQDN。此機器接收的IP位址為寄件人的IP 位址。想像 1 · 2.3 · 1 0 1 為 X · c 〇 m唯一的 Μ X記錄。然後 找出接收自1.2.3.101這一行,吾人可瞭解下一行就對應 到 X . c 〇 m的傳入郵件伺服器,如此該行内的 IΡ位址就對 應到傳送至 X.com的 IP位址。 下表說明上面討論用於決定真實訊息來源的範例分 析: 行 註解 Received: from a.x.com x.com内部寄送 15 1353146 ([1.2.3.100]) by b.x.com Tue? 22 Apr 200313:11:48-4700 Received: from mailservenx.com 1.2.3.101為x.com的MX記錄,所以我們 ({1.2.3.101 })by b.x.com Tue5 22 Apr 2003 12:11:48-0700 知道下一行為x.com内部 Received: from outside.com 此為x.com接收訊息的地方: ({4.5.6.7})by mailserver.x.com 此為最真實的一行,使用4.5.6.7作為寄件 Tue, 22 Apr 2003 11:11:48-0700 人的IP位址 β Received: fromtrustedsender.com ({8.9.10.11 })by outside.com Tue,22 Apr 2003 10:11:48-0700 此行為4.5.6.7上伺服器偽造的結構
目前來說,列示外送郵件伺服器並無可接受的標準, 並且有可能失敗,舉例而言,組織内部的 IP位址與組織 外部的不同,或若是組織從Μ X記錄内列的一部機器間接 傳送郵件到 MX記錄内列的其他機器。進一步,在發現以 上述方式發現的寄件人 IP位址位於組織内部之特殊案例 中,若 MX記錄内的一部機器傳送至 MX記錄内的其他 機器,就會發生此情況,處理會繼續。此外,特定IP位 址可偵測為内部(因為其為 1 Ο X · y. z或 1 7 2 · 1 6 _ y z到 172.31.y.z 或 1 92.1 68.0.Z 到 1 92.1 68.255.Z 的形式,此 為只有内部 IP位址會使用的形式);組織内部的任何位址 都可信賴。最後,若寄件人行為 "Received from a.x.com [1.2_3.100]"的形式,並且 a.x.com的 IP位址查找可得 16 1353146 出 1.2.3.100 或 1.2.3.100 的逆向 IP位址查找得出 a. X . c 〇 m,並且若 X . c 〇 m為組織的話,則下一行也可信賴。 使用這些結果,這樣通常可發現寄件人的IP位址。 範例虛擬碼如下: bool fFoundHostlnMX;
if (external IP address of MX records matches internal IP address of MX records)} fFoundHost.InHX = FALSE; # it's worth looking for> else } fFoundHostlnMX =TRUE; # it's not worth looking for, pretend we already found it) for each received from line of the form Received from a.b.c [ij.k.l] { if i.j,kJ in MX records of receiver domain fFoundHostlnMX = TRUE; { continue; }
If not fFoundHostlnMX { # Has not yet gone through an MX record, must be internal continue; ) if i.j.k.l is of form 10 . x . y . z or 17 1353146 172.16-y.zto 172.31.y.zor 192.168.0.2 to 192.1G8.255.Z ( # Must be internal continue; }
if DNS lookup of a.b.c yields i.j.k.l and b.c is receiver domain #Must be internal continue; }Output sender’s alleged FQDH a.b.c and sender’s actual IP address i. j.k.k }
If we reach here, then Error: unable to identify sender’s alleged F&DM and sender's, actual IP address
使用寄件人的 IP位置搭配其他來源地與目的地特色 可以做很多事情。首先,可將此位置新增至一致不良寄件 人清單,也就是「黑名單」。之後可使用「黑名單」過濾、 阻擋或間接不信任訊息到可以進一步調查的適當資料夾或 位置。 另外也可產生與實施其他清單種類,而成為主從式架 構的過濾器。在用戶端架構中,使用者可通知要接收郵件 18 1353146
(即是郵寄清單、個人等等)的用戶端電子郵件軟體。使用 者可手動或自動產生對應至可信賴電子郵件地址的記錄清 單。因此,可想像具有電子郵件地址 "b@zyx.com"的寄 件人寄給使用者一封電子郵件訊息。寄件人的電子郵件地 址 b@zyx.com 由使用者名稱 'b' 以及 FQDN/IP 'zyx.com'構成。當用戶端接收來自寄件人 (b@zyx.com) 的傳入訊息11 0,其會在可信賴的寄件人清單中搜尋使用 者的電子郵件地址,判斷使用者是否指示'b@zyx.com'為 有效並且可信賴的地址。針對伺服器架構,清單可直接位 於伺服器内。因此,當訊息到達訊息伺服器,其個別特色 (例如寄件人的 IP位址、MAIL FROM 或 HEL0欄位内 的網域名稱,以及其他來源地與/或目的地資訊)可與訊息 伺服器上的清單做比較。判斷來自有效寄件人的訊息可根 據用戶端式或伺服端式遞送通訊協定,遞送給所要的收件 人。不過,判斷包含問題清單内來源地或目的地特色或不 良特色的訊息則會移到垃圾郵件丟棄,或者另外地進行特 殊處理。 另外可傳播信賴或不良來源地特色的清單,可擷取寄 件人的來源地特色(例如 IP位址、所謂的 F r 〇 m位址) 作為一或多個特色,並稍後與機器學習技術結合用於建立 與/或訓練過濾器。 從訊息標題任何部分内的電子郵件地址(例如寄件人 的地址或回覆地址 FQDN上之 IP查找表),或從嵌入於 訊息本體内 URL連結網域名稱部分之IP位址查找表, 19 1353146 獲得IP位址’或若是URL的 FQDN/IP部分時’從ip 位址直接獲得。更進一步’如稍後會說明’ IP位址具有許 多屬性,每一個都可用來作為機器學習系統的特色,或作 為使用者傳播清單上的元件。如此,在第二方式中,特色 擷取組件13 0可利用IP位址的許多子部分來產生額外 特色。 從每個傳入訊息11 〇中都可獲得上述任何特色組 合。訊息可隨機、自動與/或手動選擇參與特色擷取,不過 通常是全部訊息都參與擷取。之後’擷取的特色集合會套 用到過濾器命名組件140 ’這樣機器學習系統或任何其他 系統會建立與/或訓練過濾器15 0成為垃圾郵件過濾器。 此時請參閱第2圖,其中說明依照本發明一個態樣, 有助於將傳入訊息 210的一或多個特色去除障礙或正規 化之特色擷取系統200。最終’根據至少部分一或多個正 規化的特色可建立過濾器。系統200包含:一特色擷取器 組件 220,其用於如所示直接接收傳入訊息 210,或利用 訊息接收器(第1圖)間接接收。選擇用於或參與特色擷 取的傳入訊息可根據使用者的喜好設定加入系統200。另 外,之後所有傳入訊息都可用於並參與特色擷取。 特色擷取牽涉到從訊息 2 1 0取出相關來源地以及/或 目的地資訊的一或多個特色 230 (也稱為 FEATHRE1 232 ' FEATURE2 234 以及 FE ATUREM 23 6,其中 Μ 為大 於等於一的整數)。來源地資訊與指示訊息寄件人的元件以 及伺服器網域名稱有關,以及與指定訊息來自何方的相關 20 1353146 識另1丨資訊有關。目的地資訊可與指示收件人可將其回覆訊 息寄給誰或何處的元件有關。在訊息的標題内以及訊息本 體内都可發現來源地與目的地資訊,讓訊息收件人可看見 或隱藏起來(例如嵌入作為文字或嵌入影像内)。 因為垃圾郵件寄件人經常試圖偽裝以及或混淆其識 別,避免傳統垃圾郵件過濾器偵測到,系统2 0 0包含特色 正規化器組件 240,其幫助讓一或多個擷取的特色 230消 除障礙,或讓至少部分特色消除障礙。特色正規化器組件 2 4 0可處理以及/或細分擷取的特色 2 3 0,這樣利用分析擷 取的特色 23 0 (例如 FQDN -參照區塊以及 MX記錄的 目錄,以及/或根據其目前的格式轉譯 FQDN),然後將其 與現有垃圾郵件寄件人清單的資料庫,以及/或親代控制清 單做比較。在以下第 4圖内討論的某些案例中,像是當擷 取的特色為 URL字首以及/或字尾時也可移除,以幫助將 特色正規化,並識別 URL是否指向垃圾郵件寄件人的網 站或合法來源。 一旦特色已經正規化,則訓練系統 2 6 0可運用 250 至少一子集,如此機器訊息系統就可建立以及/或更新過濾 器 2 7 0。過濾器可訓練用於作為垃圾郵件過濾器。更進一 步,過濾器可利用正面特色建立以及/或訓練,例如指出非 垃圾郵件來源(例如寄件人的 From電子郵件地址、寄件 人的IP位址、嵌入的電話號碼以及/或 URL)以及/或非 垃圾郵件寄件人,以及利用負面特色,例如識別相關垃圾 郵件寄件人。 21 1353146 另外或此外,特色的集合可用於傳播新的或新增至現 有的垃圾郵件特色清單280。其他清單也可產生對應至特 定擷取特色,像是良好位址清單、不良位址清單、良好URL 清單、不良URL清單、良好電話號碼清單、以及不良電 話號碼清單。良好特色清單可識別非垃圾郵件寄件人、過 去合法的寄件人、以及/或與非垃圾郵件相似性非常高的寄 件人(例如有〜9 0 %機會不是垃圾郵件來源)。反過來說, 不良特色清單對應至垃圾郵件寄件人、潛在的垃圾郵件寄 件人、以及/或與垃圾郵件相似性非常高的寄件人(例如有 ~90%是垃圾郵件來源)。 此時請參閱第3 -6圖,其中說明根據本發明許多態 樣,可分別從 IP位址、FQDN '電子郵件地址、以及 URL 取得與擷取來幫助偵測並防治垃圾郵件的範例特色。 第 3圖說明依照本發明一個態樣的IP位址 3 00之 範例分類。當表示成小數形式時(例如四個區塊,每個區 塊 3位數,其令每個區塊由句點區分,並且其中每個區塊 3位數為介於 0與 255之間的任何數),IP位址 300的 長度有 3 2位元並且分配成區塊(例如網路區塊)。區塊依 照等級指派,像是 Class A、Class B以及 Class C。每個 區塊包含一組IP位址數字,其中每區塊的IP位址數字 依照等級變化。也就是根據等級(即是 A、B或 C ),每 個區塊可指派更多或更少位址。區塊的大小通常是 2的乘 幕,並且相同區塊内的IP位址組會共享第一 k二進位數, 並且在之後的 32-k (例如 32減去 k)個二進位數内不同。 22 1353146 如此,每個區塊都可根據其共享的第一 k位原來識別(區塊 ID 302)。為了判斷區塊 ID 302相關特定 IP位址 300,使 用者可參照區塊的目錄,像是 arin.net。再者,可裸取區塊 ID 3 02並運用作為特色。 不過在某些情況下,因為區塊内IP位址群組可進行 區分,並且不限次數重新區分,所以參考 arin.net也無法 迅速判斷區塊 ID 3 0 2。在此案例中,使用者或擷取系統可 對個別 IP位址的區塊 ID 3 0 2進行一或多次猜測。例 如,使用者可擷取至少一第一 1位元 304、至少一第一 2 位元 306、至少一第一 3位元 308、至少一第一 Μ位元 310 (即 Μ為大於等於一的整數)以及/或最多至少一第 一 3 1位元3 12作為個別特色,由機器學習系統共同使用 以及/或作為特色清單(例如良好特色清單、垃圾郵件特色 清單等等)上的元件。 在實施方面,例如可擷取 IP位址的第一 1位元並用 來作為特色,以判斷 IP位址是否指向垃圾郵件寄件人或 非垃圾郵件寄件人。可與從其他訊息擷取來自其他IP位 址的該第一 1位元做比較,以幫助判斷至少一個區塊 ID。然後識別至少一個區塊ID可幫助察覺訊息是否來自 垃圾郵件寄件人。再者,共享第一 Μ位元的 IP位址可 分別與其他擷取的特色比較,以確定IP位址是否來自合 法的寄件人以及/或個別訊息是否為垃圾郵件。 IP位址也可依照階級配置(3 1 4 ),也就是,一組較高 階的位元可分配到特定國家内。此國家可分配一子集給 23 1353146 IS P (網際網路服務供應商),然後該I s P分配子集 公司。因此,許多等級對於相同的 IP位址來說都有 例如,事實上來自分配給韓國的區塊之 IP位址對 IP位址是否相關垃圾郵件寄件人非常有用。若 IP 配置給具備嚴格防禦垃圾郵件寄件人的 ISP之 塊,這在判斷 IP位址並未相關垃圾郵件寄件人也 用。因此,運用 IP位址的每個第一 1 - 3 1位元結 IP位址子集的階層配置 3 1 4,使用者可自動學習不 上的資訊,而不需要確實知道配置IP位址的意義 不需要知道區塊ID)。 除了上述討論過的特色外,利用執行合適的計: 或利用比較特色出現在傳入訊息取樣内的頻率或次 計資料,來決定特色的稀有項 3 1 6 (例如特色的發 常見)。實際上,非常見IP位址 300可為用於傳 郵件的撥接線路範例,這是垃圾郵件寄件人常用的 垃圾郵件寄件人經常試圖修改其識別以及/或位置。 事實上特色常見或非常見是有用的資訊。因此,特 有項 3 1 6可用來作為機器學習系統的特色以及/或 份清單的一部分(例如稀有特色清單)。 第 4圖展示 FQDN 400的範例特色分類,像 b.x.com。FQDN 400可從 HELO欄位中擷取(例如 的稱謂 FQDN),並且通常包含主機名稱402以及 稱 404。主機名稱 402就是特定電腦,在此範 "b "。網域名稱 4 0 4就是網際網路上至少一部機器 給特定 '意義。 於判斷 位址為 部分區 非常有 合至少 同等級 (例如 暮以及/ 數的統 生並不 遞電子 手法。 如此, 色的稀 至少一 是範例 寄件人 網域名 例中為 或一組 24 1353146 機器的名稱。在範例中,"x.com”代表網域名稱404。FQDN 400的階層分類由 406表示。尤其是,B.X.COM 408 (全 FQDN 400)可部分分離成 X.COM 410 (部分 FQDN),然 後可分離成COM412(部分FQDN),藉此每個部分FQDN 都可運來作為特色。 某些特色,像是寄件人資訊,主要用於作為IP位址。 如此,將FQDN 400轉換成可分解成額外特色的Ip位址 300 (如第3圖内所示)就非常有用,因此相當容易建立 新的主機名稱與網域名稱,但是相當難以獲得新的Ip位 址。 不幸的是’網域的所有人會將明顯不同的機器全都映 射到相同的地方。例如’名為 "a.x ·c 〇 m "的機器之所有人 與"b-x.com"的所有人相同,而又與"x.c〇m”為同一個 所有人。如此,垃圾郵件寄件人可輕易誤導傳統過滅器, 讓它相信訊息來自FQDN 400 "b.x.com"而非來自網域 4 0 4 ” X . c 〇 m ”,藉此讓訊息通過垃圾郵件過濾器,音取p柳 身I緊上網 域 404 "X.com"已指出:訊息為垃圾郵件戋非蚩細, τ凡井常類似垃圾 郵件。因此,當裸取訊息的來源地以及/或目的地資^^時 將位址分離來簡化網域名稱4 04就非常有用。此外,可拍員 取完整 FQDN 400作為特色。 在某些情況中’可有額外資源,像是親代控制系統。 這些資源通常對主機名稱以及/或URL指派—「括相 + 裡類」或 品質評估,像是色情或暴力。擷取的特色可進—步使用這 種資源,其係依照種類區分。然後可使用特色的特色種類 25 1353146 4 1 4作為相關於建立以及/或訓練改善的垃圾郵件相關的過 濾器的額外特色。另外,可產生對應到不同特色種類(之 前已經識別過)的清單。特色種類4 1 4包含但不受限於性 或色情相關特色、種族以及/或仇視語言相關特色、身體增 進特色、收入或財務特色、家庭購物特色等等,一般以訊 息的標題來識別。 最後,特色或特色種類的稀有項 316 (請參閱以上第 3圖)可為上面第 3圖内討論的其他特色。例如,從訊息 中擷取的特色,像是從 FQDN 400 "b.x.com"中擷取的主 機名稱"B" 402可為特色種類:色情内容的常見範例。因 此,當從訊息中擷取此特色並且在色情内容特色清單上發 現此特色,可得出結論,此訊息非常類似垃圾郵件,或者 不適合/不合適所有年齡,或構成成人内容(例如成人分級) 等等。如此,每個清單都可包含:許多特定種類的常見特 色。另外,常在垃圾郵件訊息中發現對應的IP位址,就 可指定成為垃圾郵件的常見特色。再者,可運用特色的共 通性以及/或稀有性作為機器循係或其他規則系統的個別 特色。 第 5圖展示電子郵件地址 500: a@b.x.com的範例 特色分類,其包含 :FQDN 400以及一些額外特色,像是 使用者名稱502。電子郵件地址 500可從訊息的 From欄 位、c c (副本抄送)欄位,以及 r e p 1 y -1 〇攔位中擷取,以 及從訊息本體中的任何 m a i 11 〇 : 連結中棟取(例如 mailto:連结為按下時會產生郵件寄送至特定地址的特殊 26 1353146 種類的連結),並且若可用的話,則從 SMTP通訊協定内 使用的 MAIL FROM指令中擷取。電子郵件地址 500也 可嵌入作為訊息本體内的文字。在某些情況中,訊息内容 會在回應訊息時引導收件人使用’reply all·功能。在此情 況下,cc欄位以及/或至少'to'欄位中(若列出超過一個 收件人的話)所包含的地址也都會回覆。如此,這些地址 每一個都可擷取作為一或多個特色,以幫助識別與防治垃 圾郵件寄件人。 電子郵件地址 500 "a@b.x.comn可分成許多元件或 子部分,並且這些元件可擷取出來並且用來作為特色。尤 其是,電子郵件地址包含:使用者名稱502,以及FQDN 504 (例如請參閱第 4 圖内的 FQDN 400),其可進一步分 成額外特色。針對許多實際上的原因,像是容易使用承認 以及重新收集,通常使用 FQDN而不是 IP位址來表示電 子郵件地址。 在目前的範例中,na@b.x.com”包含使用者名稱 502 "a"。如此,可擷取 "aM作為一個特色。相同地,FQDN 504 "b.x.com”可從電子郵件地址擷取出來作為至少另一個特 色。電子郵件地址 500的 FQDN 504部分可通過親代控 制過濾器,以幫助判斷先前第4圖内詳細說明過的特色種 類414。因此,與電子郵件地址 500的 FQDN部分有關 的特色種類可用來作為額外特色。 除了電子郵件地址以外,垃圾郵件寄件人通常透過 U R L來聯絡。第 6圖依照本發明一個態樣說明複數個擷 27 1353146 取特色的範例 URL 600 (例如 x y.com/a/b/c;)。URL 600 可丧入作為訊息本體内的文字,以及/或作為訊息本體内的 影像。例如’垃圾郵件寄件人可包含:到網站的指標器, 藉此導引收件人到垃圾郵件寄件人的網頁或相關網站。 URL可用類似IP位址的方式消除阻礙。一開始可在 消除URL 600的阻礙之前移除任何字首(例如服務名 稱)’像是 1^卩://、1^?3://、〇13://、^11^1://。此外,若,,@,, 符號(例如十六進制符號中的%4〇)出現在URL之中, 則字首(例如 http://)與符號之間的任何東西都可 在將URL 4 00正規化之前移除。在字首與"符號之間 插入文字是垃圾郵件寄件人的另一項技倆,用於混淆訊息 收件人其所導引到的真實網頁位置。 例 如 ,顯示 htip:"wwvv.amazon.c〇m@12 1.122.123.124/info.htm 給訊 息收件人,就像此網頁位於 www.amazon.com —樣。如 此’收件人就會更傾向相信此連結,更重要的是更相信訊 息寄件人。相反的,真實網頁位置位於 " 121.122.123.124”,這實際上對應到垃圾郵件相關的網 頁。不過在某些情況下,合法寄件人會在此URL 400部 分内併入授權資訊,像是登入名稱與密碼,以幫助自動登 入0 一旦正規化並且解除阻礙,基本上 URL 600可表示 為 x.y.com/a/b/c,其中 χ·y·com 63 0 為機器的名稱 (FQDN),並且a/b/c (例如字尾)為機器上檔案的位置。 28 1353146 若將x.y.com/a/b/c 600識別為垃圾郵件寄件人’然後也 非常有可能將x y.com/a/b 610 ,以及x.y.com/a 620識 別為相同或相關垃圾郵件寄件人。如此’ URL 600通道的 末端部分可一次分離一個部分,以獲得機器學習系統或清 單的額外特色。這讓垃圾郵件寄件人難以用不引起注意的 方式,建立許多實際上導引至其所在地的不同位置。 當分離字尾時,FQDN 630可進一步剖析,以獲得先 前第 4圖内討論的額外特色。更進一步,FQDN 630也可 轉換成 IP位址,如先前第 3圖内所展示。因此,與 IP位 址有關的許多特色也可用來作為特色。 某些 URL寫入 IP位址代替 FQDN (例如小數點形 式)’像是 nnn.nnn.nnn.nnn/a/b/c »字尾可從 "c" 開始連 續移除’並且在每個階段上,結果(部分)URL可用來作 為特色(例如 nnn,niin.nnn.nnn/a/b、nnn.nnn.nnn.niin/a 以 及nnn.nnn.nnn.nnn都是從小數點形式的URL·内擷取出 來的可能特色)。之後’可使用I p位址(例如無字首與字 尾)作為特色。然後可映射到其網路區塊^若網路區塊無 法確定’則使用IP位址的每一1、2.··.到第一 η位元 作為分離特色(請參閱第3圖),來進行多重猜測。 除了小數點形式以外,IP位址可表示為dw〇rd (雙重
字元)格式(例如以10為底的、< - A 句低的16位兀之兩個二進位字 元)、八進位形式(例如以8為&、 、,丄 , 马底)以及十六進位格式(例 如以16為底)。實際上,垃圾齙技史讲, 紙郵件寄件人可使用%nn符 號(其中 nn為一對六進位勃 疋仪数)對網域名稱部分編碼,來 29 1353146 混淆 IP位址、URL、MAILTO連結、以及/或 FQDN。 某些 URL可包含用於混淆或欺騙使用者的重新導引 器。重新導引器為跟隨在URL的IP位址内"?"之後的 參數或一組參數,其指示瀏覽器重新導引至其他網頁。例 如 ’ URL 可 能像是 'www.intendedpage.com7vwvw.actualpage.com" > 其中劉覽 器實際指向”wvvw.actualpage.com",並載入該網頁,而 非預期的"www.intendedpage.com”網頁。因此,URL内 含的參數也可考慮擷取作為特色。 此時將透過一連串動作來說明依照本發明的許多方 法。吾人可瞭解並明白,本發明並不受限於動作的順序, 而依照本發明的某些動作的發生順序以及/或時機可能與 此處顯示與說明的其他動作不同。例如,某些精通此技術 的人士就可瞭解,可另外以一連串相關聯的狀態或事件來 表示方法。再者’實施依照本發明的方法時並非所有說明 的動作都需要。 此時請參閱第7圖,其説明幫助訓練依照本發明—個 態樣的過濾器之範例處理700流程圖。處理700在7 〇 上開始接收訊息(例如至少一個訊息)。訊息可由伺服器接 收,其中現有的過濾器(例如垃圾郵件過濾器)可根據至 少部分之前學習的準則集合來區分訊息像是垃圾郵件、或 不像垃圾郵件。在 720上將訊息剖析以擷取一或多個特 色。擷取的特色進一步詳細說明於725 (之後的第圖 上)》特色的範例包含:位於寄件人欄位、回覆欄位、副本 30 1353146 抄送攔位、郵寄至欄位、MAIL FROM SMTP指令、 位、嵌入文字或作為圖片的 URL位址、以及/或 號碼(例如區碼以映射地理區域)以及訊息主體 内之資訊(例如寄件人的IP位址)。 在 730上可將擷取(以及/或正規化)特色 的區分(例如垃圾郵件或非垃圾郵件)新增至資 集合上。在 7 4 0上,上述流程(例如 7 1 0、7 2 0與 重複用於後續傳入的所有訊息上,直到依此處理 上,可從訓練集合中選擇像是有用或最有用的特ί 上,可運用這些選取的特色,而利用機器學習演 練過濾器,像是機器學習過濾器。 一旦訓練過,機器學習過濾器就可用於幫助 郵件,如第 8圖内範例方法 800所說明。方A 8 1 0上開始接收訊息。在 8 2 0上,從訊息中擷取 特色,如底下關於第11圖之說明。在 830上, 色通過由機器學習系統所訓練的過濾器。之後, 習系統獲得像是「垃圾郵件」、「非垃圾郵件」或 是垃圾郵件的裁決。一旦獲得裁決,不管訊息的 採取適當的動作。動作種類包括但不受限於:刪 將訊息移動到特殊資料夾、隔離訊息、以及允許 取訊息。 另外,利用從訊息擷取特色可執行清單式活 閱第 9圖,其說明範例處理 9 0 0的流程圖,此 根據至少部分擷取的特色建立與傳播清單,並且 HELO 欄 一般電話 内的文字 以及訊息 料的訓練 730)可 。在 750 ^。在 760 算法來訓 偵測垃圾 :800 於 一或多個 擷取的特 從機器學 訊息可能 内容都會 除訊息、 收件人存 動。請參 處理用於 發生:接 31 1353146 收已經區分為垃圾郵件或非垃圾郵件(或像是或 圾郵件)的訊息。處理 900於 910上開始接收 後,在 9 2 0上擷取某些相關特色,像是訊息寄4 位址。在接收訊息後的某個時間上,訊息可利用 濾器區分成垃圾郵件或非垃圾郵件。在 9 3 0上, 的區分(例如垃圾郵件或非垃圾郵件),可遞增 數。在 9 4 0上會重複此流程,直到後續所有訊息 理(例如在 910、920與 930上)。此後在 950 色的清單。例如,可建立一份其中90%是良好 IP位址清單(例如 90%的時間不是垃圾郵件 的傳入訊息不是垃圾郵件)。相同地,可建立一份 是不良(垃圾郵件)的寄件人IP位址其他清單 色的其他清單可用類似方式建立。 吾人可明白,這些清單可為動態。也就是, 新訊息群組的處理來更新。因此,寄件人的 IP 初次在良好清單中發現,並且在某些時間之後, 垃圾郵件寄件人常用來傳送良好郵件(例如增加 及收件人的「信賴」),然後開始只有傳送垃圾郵 發現位於不良清單中。 這些清單可有許多利用方法。例如,可用來 學習系統所使用的訓練集合以訓練過濾器。接Ί 圖内將說明範例處理 1 0 0 0。根據第1 〇圖,處理 在 1 0 1 0上開始接收訊息。訊息可區分成垃圾郵 圾郵件。在 1 0 2 0上,特色包含但不受限於:可 不像是垃 訊息。之 年人的 IP 現有的過 根據訊息 特色的計 都已經處 上建立特 的寄件人 ,或 9 0 % 其中 9 0 % 。其他特 其可隨著 位址可能 隨著某些 過渡器以 件後,就 產生機器 「來第 10 1 000 可 件或非垃 從訊息内 32 1353146 擷取出來的寄件人 IP位址。在 1030上,擷取的特色與 訊息的區分會新增到訓練集合内,後續用於訓練機器學習 系統。
之後在 1 0 4 0上,對應至其上有寄件人IP位址這個 特定清單的特殊特色包含在訓練集合内。例如,若寄件人 IP位址位於「90% 良好」清單上,然後新增至訓練集合 的特色就會是「90% 良好清單」。在 1 050上,重複之前 的步驟(例如 10 10、1 020、1 03 0與 1 040)來處理後續所 有傳入的訊息。因為某些特色比其他特色對於過濾器訓練 目的來說更有用,最有用的特色就是在 1060上部分根據 使用者的喜好設定來選擇,並且使用機器學習演算法來訓 練過遽器,像是垃圾郵件過遽器。
再者,IP位址的動態清單可架構來與測試訊息、新訊 息、以及/或猜疑訊息做比較。不過,在此實例中 IP位址 本身並非特色。取而代之的是,IP位址的品質才是特色。 此外,該清單只能用於其他方法。事實上,猜疑 IP位址 的清單可用於將寄件人標示為不良,並因此猜疑他們的訊 息。 此時請參閱第1 1圖,其中說明分別與上述第 7-10 圖内說明的處理 700、800、900與 1000結合,從訊息擷 取特色的範例方法1 1 〇 〇之流程圖。方法1 1 〇 〇 —開始時 在 1110上擷取並正規化寄件人 IP位址或一部分。另外 在 1 1 1 0上,IP位址可進行位元式處理(例如如第 3圖 内所說明的第一 1位元、第一 2位元、...多至第一 31位 33 1353146 元),以便從寄件人 IP位址中擷取額外特色。更進一步, 在 1110上也可擷取寄件人所謂的主機名稱。此時將正規 化的寄件人 IP位址以及寄件人主機名稱特色作為機器學 習系統或相關訓練系統的特色。 選擇性,在 1120上,可擷取以及/或正規化 "From··" 行的内容,並且後續用來作為特色。在 1 13 0上,可簡單 擷取以及/或正規化 "MAIL FROM SMTP”指令的内容,來 作為特色。 然後方法 1 1 0 0可前往尋找訊息内可能包含的其他可 能特色。例如,在 1 1 4 0上可選擇性擷取與正規化(若需 要的話)回覆欄位内的内容。在 1150上,可選擇性擷取 以及/或正規化 cc欄位的内容,用來作為至少一個特色。 在 11 6 0上,可選擇性從訊息本體擷取一般電話號碼,並 指派作為特色。非電話號碼對於識別垃圾郵件寄件人非常 有用,因為電話號碼的區碼以及/或頭三個數字可用來找出 垃圾郵件寄件人的位置。若訊息内存在超過一個一般電話 號碼,則會在 1 1 6 0上擷取每個號碼並且用來作為特色 。 相同地,分別在 1 1 7 0與 1 1 8 0上可選擇性擷取以及/ 或正規化一或多個 URL以及/或 MAILTO 連結或一部 分。尤其是,URL可進行通道分離(例如 URL的檔名部 分),其中可去除附加到 URL的 FQDN部分末端之一或 多個字尾。這會導致一或多個部分URL,根據通道内字尾 的數量。根據本發明,每個部分 URL都可用來作為個別 特色。 34 1353146 方法11 Ο 0繼續掃描訊息本體來找尋其他電子郵件地 址,以及垃圾郵件訊息内常見的關鍵字以及/或片語(例如 之前選擇或決定的),反之亦然。每個字或片語都可擷取並 且用來作為機器學習系統的特色或清單的元件,或這兩者。 如先前討論過的,透過網際網路傳送的訊息可以只牽 涉到兩部伺服器,從伺服器寄送至伺服器。接觸過訊息的 伺服器數量會隨著防火牆的存在以及相關網路架構而增 加。當訊息從伺服器傳遞到伺服器,每個伺服器會將其IP 位址規劃成為寄件人欄位,每個伺服器也具有修改任何較 早規劃的寄件人位址的能力。不幸的是,垃圾郵件寄件人 可利用這項能力,在寄件人欄位内輸入偽造的位址來偽裝 其位置以及/或識別,誤導收件人以為到達訊息的來源。 第 1 2圖說明範例處理 1 2 0 0的流程圖,此處理用於 在傳入訊息的寄件人行内分辨合法與偽裝(例如垃圾郵件 寄件人)事先規劃的伺服器IP位址。事先規劃的寄件人 地址可用其加入的順序(例如第一個是最近加入的)來規 劃。如此,使用者就可透過傳送伺服器IP位址鏈往回追 蹤,在 1 2 1 0上判斷最後信賴的伺服器IP位址。在 1 220 上,最後信賴的伺服器IP位址(位於組織之外)可擷取 作為機器學習系統使用的特色。在最後信賴IP位址之後 的其他任何位址都可考慮為有問題或不受信賴並且可忽 略,但是可與良好IP位址(最多)與不良IP位址(最多) 清單做比較。 在 1 230上,也可擷取寄件人所謂的 FQDN以幫助 35 1353146 判斷寄件人是否為合法或垃圾郵件寄件人。尤其是,所謂 的 FQDN 可利用網域剪去法分離,以產生多個部分 FQDN。例如,想像所謂的 FQDN為 a.b.c.x.com。此所謂 的 FQDN可用下列方式分離來產生:b.c.x com ->c.x.com ->x.com·〉com。如此,每個部分 FQDN區段以及完整的 FQDN都可用來作為個別特色,以幫助判斷偽造或合法寄 件人。 本發明也運用到親代控制系統,親代控制系統根據至 少部分訊息某些内容將訊息區分為不適合觀看,並提供不 適合觀看的區分理由。例如,URL可嵌入訊息内作為可按 的連結(不管是文字或影像式),或作為訊息本體内的文 字。親代控制系統可將嵌入的 URL與其儲存的一或多個 良好以及/或不良 URL清單做比較,以判斷訊息的正確區 分,或使用其他親代控制區分技術。此區分可用來作為機 器學習系統或特色清單上或這兩者的額外特色。 在第1 3圖内,展現將親代控制系統至少一態樣併入 本發明内的範例處理 1 3 0 0之流程圖。在 1 3 1 0上接收一 組訊息之後,會在 1 320上掃描訊息的 URL、郵寄至連結 或可重新組合成郵寄至連結、URL或 URL某部分的其他 文字。在 1 3 3 0上,若訊息未出現包含上述任何一種,則 處理 1 3 0 0會返回 1 3 1 0。不過,若訊息有上述情況,然後 在 1 3 4 0上會將至少部分偵測到的字元送至至少部分親代 控制系統。 在 1 3 5 0上,親代控制系統可利用參照一或多個 36 1353146 URL、郵寄至連結、URL服務名稱、URL路徑以 (例如像是 URL的 FQDN部分、電子郵件地址 料庫,來區分郵寄至連結或其部分。例如,訊息 包含至少一色情圖片、償清債務、賭博以及其他藥 在 1360上可擷取這種區分作為特色。因為垃圾 的主要主題發信者包含這些題材,在獲得額外特 學習系統用來訓練與建立改良式過濾器而言,併 制系統就非常有用。其他存在的區分包含但不受 言語、色情題材、搶砲暴力以及毒品相關題材, 區分可用來作為特色。垃圾郵件訊息可以或不牽 些題材種類有關的主題發信者,但是使用者仍舊 些訊息。 實際上,不同的區分可指示不同的垃圾郵件 如,區分為仇恨語言的訊息表示沒有明顯垃圾郵 (例如因為其並不像垃圾郵件)。相對的,區分為 材的訊息可反出相當高的垃圾郵件程度(例如 定該訊息為垃圾郵件)。機器學習系統可建立會考 件程度的過濾器。如此過濾器就可客製化並個人 使用者的喜好設定。 如已經討論過的,從訊息中可擷取無數的特 於作為機器學習系統的訓練資料或識別良好與不 清單上之元件。除了特色本身以外,特色的品質 與防治垃圾郵件非常有用。例如,想像一個特色 的電子郵件地址。電子郵件地址可用來作為一個 及 FQDN 等等)資 可區分成 丨似題材。 郵件訊息 色讓機器 入親代控 限於仇恨 其中這種 涉到與這 要阻擋這 程度。例 件的程度 t内容/題 〜90%確 慮垃圾郵 化來滿足 色,並用 良特色的 對於偵測 為寄件人 特色,並 37 郵件地址出現在新傳人訊息内的頻率或次數可用 术作為其他特色。 圖說明用於擷取這種特色(例如與擷取特色的 通用性或稀有性古 有關)的範例處理〗4〇〇之流程圖。垃圾 件寄件人通常試圖快速改變其位置,結果通常快過大多 數使用者從之前未見過的地址傳送料,或用指向之前未 知機器的 URL來值·^翻彼 m f 傳运郵件。因此,針對每種已經擷取的 特色種類(例如寄件人IP &址、URL、電子郵件地址、 網域名稱等等),假設已經保留每種特色的清單特定特色 發生的機率或可追蹤的次數。 處理丨4〇〇在M10上開始從傳入訊息以及/或特色 正規化中掘取一或多個特色。然後在1420上將特色與一 或多個在複數個先前訊息中擷取與觀察到的特色清單做比 較。然後處理1 4 〇 〇可判斷本特色是否常見。利用計算特 色出現在最近以及/或之前傳入訊息的頻率,就可判斷特色 的常見性。若在1 430上訊息不常見或不充分常見(例如無 法滿足常見性臨限),則其稀有性可在1 440上作為額外特 色。否則,在 1450上特色的常見性也可用來作為特色。 依照上述的本發明,下列虛擬碼可用來執行本發明至 少一個態樣。變數名稱全部用大寫表示。另外請注意’在 虛擬碼末端上定義了兩個函數,add_machine_features以 及 add-ip-features。像是"PREFIX-machine-MACHINE" 的表示法用來指示字串由PREFIX變數連結"machine” 這個字益連結 MACHINE變數所組成。最後’函數 38 1353146 add-to-feature-list寫出目前訊息相關的特色清單之特色。 範例虛擬碼如下: #for a given message, extract all the features IPADDRESS : = the last external IP address in the received-from list; add-ipfeatures(received, IPADDFESS);
SEHDERS-ALLEGED-FQDN : = FQDN in the last external IP address in the received-from list; add-machine-features (sendersfqdn, SENDER -ALLEGED-FQDN); for each email address type TYPE in (from, CC, to, reply-to, embedded-mailto-Iink, embedded-address, and SMTP MAIL FROM) {
for each address ADDRESS of type TYPE in the message { decbfuscate ADDRESS if necessary; add-to-feat lire-list TYPE-ADDRESS; if ADDRESS is of the form NAMEMMA.CHIME then { add-machine-features(TYPE, MACHINE); } else { #ADDRESS is of form NAME@IPADDRESS add-ip-features(TYPE5 IFADDRESS); 39 1353146 for each url type TYPE in (clickable-links, text-based-1 inks, embedded-image-links) {
for each URL in the message of type TYPE {
deobfiiscate URL; add-to-feat Lire-list TYPE-URL; set PARENTALCLASS :- parental control system class of URL; add-to-feature-list TY PE-class-PARENTCLASS; while UF'L has a location suffix { remove location suffix from UF;L? i.e. x.y/a/b/c -> x.y/a/b; x-y/a/b -> x.y/a; x.y/a;
} # All suffixes have been removed; URL is now either machine name or IP address if URL is machine name { add-machine-features (T'YPE, URL); } else 40 1353146 add-ip-features(TYPE, URL); } }
} function add-machine-features(PREFIX, MACHINE) add-ip-feature$(PREFlx-ip, nslookup(MACHINE); while MACHINE not equalMM { add-to-feature-list PREFIX-machine-MACHINE; remove beginning from MACHINE # {i.e. a.x.com—> x.com, or x.com -> com); } } function add-ip-features(PREFIX, IPADDPESS) {
add-to-feature-list PREFIX-ipaddress-IPADDPESS; find netblock METBLOCK of IPADDRESS; add-to-feat Lire-list PREFIX-netblock-NETBLOCK; for M = 1 to 31 1 MASKED = first N bits of IPADDP.ESS; add-to-feature-list PREFImasked -M- MAS Γ EF'; 41 1353146 第f丨i3g?3號專利案I從年^月修$ 為了提供本發明許多態樣的額外内容。第15圖以及 下列討論用於提供合適的操作環境 1 5 1 0之簡要、一般說 明,其中可實施許多本發明的態樣。雖然以一般電腦可執 行指令的上下文關係來說明本發明,像是可由一或多部電 腦或其他裝置執行的程式模組,精通此技術的人士會瞭 解,結合其他程式模式以及/或結合硬體與軟體也可實施本 發明。 不過一般而言,程式模組包含執行特定工作或實施特 定資料種類的常式、程式、物件、組件、資料結構等等。 操作環境 1 5 1 0只為合適操作環境的一個範例,並且不對 本發明的使用態樣或功能性建議任何限制。其他適合用於 本發明的已知電腦系統、環境以及/或組態包含,但不受限 於個人電腦、手持式或膝上型裝置、多處理器系統、微處 理器式系統、可程式消費者電器、網路 PC、迷你電腦、 大型主機電腦、包含上述系統或裝置的分散式計算環境等 等。 請參閱第1 5圖,其為實施本發明許多態樣的範例環 境 1510,包含電腦 1512。電腦 1512 包含處理單元 1 5 1 4、系統記憶體 1 5 1 6 、以及系統匯流排 1 5 1 8。系統匯 流排 1 5 1 8耦合系統組件,包含但不受限於將系統記憶體 1516耦合至處理單元 1514。處理單元 1514可為許多任 何可用的處理器。雙微處理器以及其他多處理器架構也可 用來作為處理單元1514。 系統匯流排 1 5 1 8可以是許多種匯流排結構,包含記 42 1353146 憶體匯流排或記憶體控制器、週邊匯流排以及/或使用許多 匯流排架構的本機匯流排,其中這許多種架構包含但不受 限於1 1位元匯流排、工業標準架構(ISA)、微通道架構 (MSA)、延伸ISA (EISA)、智慧驅動電子(IDE)、VESA本 機匯流排(VIB)、週邊組件互連(PCI)、萬用序列匯流排 (USB) '先進圖形連接槔(AGP)、個人電腦記憶體卡國際 協會匯流排(PCMCIA)以及小型電腦系統介面(SCSI)。 系統記憶體 1 5 1 6包含揮發性記憶體1 5 2 0以及非揮 發性記憶體1 522。基本輸入/輸出系統(BIOS)包含在電 腦15 22内元件之間(像是啟動時)傳輸資訊的基本常 式,其儲存在非揮發性記憶體1 522内。藉由說明但不受 限於此’非揮發性記憶體 1 522可包含唯讀記憶體 (ROM)、可程式 R〇m (PROM)、電氣可程式 R0M (EPROM)、電氣可抹除ROM (EEPROM)或快閃記憶體。 揮發性記憶體1 520包含隨機存取記憶體(RAM),用來作 為外部快取記憶體。藉由說明並且不受限於此,ram可 有許多形式,像是同步 RAM (SRAM)、動態 Ram (DRAM)、同步 DRAM (SDRAM)、雙資料率 SDRAM (DDR SDRAM)、增強型 SDRAM (ESDRAM) ' 同步連結 DRam (SLDRAM)以及直接 Rambus。 電腦1512也包含可移除/不可移除、揮發性/非揮發 性電腦儲存媒體。第1 5圖說明範例磁碟儲存體丨524 ^ 碟儲存體1524包含但不受限於像是磁碟機、軟碟機、磁 帶機、JaZ磁碟機、Zip磁碟機、LS-1〇〇磁碟機、快閃呓 43 1353146 憶卡或記憶棒。此外,磁碟储存體i 5 2 4可包含名 其他儲存媒體結合的儲存媒體,包含但不受限於片 像是小型碟片R〇M裝置(CD-ROM)、CD燒錄機 Drive)、CD可重複抹寫燒錄機(CDRW如叫^ 像光碟ROM裝置(DVD_R〇M)。若要幫助將磁窄 置1 524連接到系統匯流排1518,通常使用可移孩 移除介面,像是介面1526。 吾人可瞭解,第15圖說明用來作為使用者與 腦資源(說明於合適操作環境151〇内)之間中^ 體。這種軟體包含作業系統1 528。作業系統i52Y 在磁碟儲存體1 524上’其用來控制與分配電腦系 的資源。系統應用程式153〇透過程式模組m2 存在系統記憶冑1516或磁碟儲存體1 524上的港 1 534,利用作業系統1 528管 s埋貢源的優點。吾人- 可用許多作業系統或作業系蛴 耒乐統的組合來實施本發明 使用者透過輪入裝置 牧罝1 536將指令或資訊輪 1512。輸入裝置1 53 6包含 不丈限於像是滑鼠# 置、軌跡球、觸控筆、觸控板、 鍵盤、麥克風、相 戲控制器、衛星碟、掃描器、
色視凋諧卡、數位爲 位攝影機、網路攝影機等等。這些與其他輸入裝S 面連接崞1 53 8通過系統㈣排1518連接到處 1514。介面連接埠1 5 3 8包含彻丄产 ^ 3例如序列埠、並列马 埠、以及萬用序列匯流排 1 ^ B )。輸出裝置1 5 4 〇 些與輸入裝置1536相同的連扭造 接淳。如此,例如 '離或與 :·碟機, (CD-R :數位影 :儲存裝 =或不可 ^基本電 '物的軟 可儲存 統 1 5 1 2 以及儲 ‘式資料 T瞭解, 〇 入電腦 1指標裝 f桿、遊 L機、數 :透過介 理單元 ^遊戲 使用某 U S B連 44 1353146 接埠可用於提供輸入至雷腮 一 彻主电腦15丨2,以及從電腦15丨2輸出 育讯到輸出裝置1540。提佴蛉山邮拉上 杈供輸出配接卡1S42說明 出裝置1 540,像是β葙s ‘丨Λ „ 乃呆些輪 喇叭與印表機以及需要特殊配 接卡的其他輸出裝i 1 540。輪出配接+ 1 542包含但不受 限於視訊與音效卡,提供輪出裝χ 154〇與系統匯流: bU之間的連接方式。吾人應該注意到其他裝置以及, 或裝置系統同時提供輸入與輸出能力,像是遠端電腦 1 5 44。 β電腦1512可使用邏輯連接至一或多部遠端電腦,像 是遠端電腦1 544來在網路環境内運作。遠端電腦1544 可為個人電腦、伺服器、路由器、網路pc、工作站、微 處理器式設備、點裝置或其他常見網路節點等等,並且通 *包含上述有關電腦1512的許多或全部元件。為了簡化 起見,遠端電腦1 544上只顯示記憶體儲存裝置i 546。遠 端電腦1 544透過網路介面1 548邏輯上連接到電腦 1512’然後實體上透過通訊連接155〇來連接。網路介面 15 4.8容納像是區域網路(LAN)以及廣域網路(WAN)的 通訊網路。LAN技術包含光纖分布資料介面(FDDI)、網 線分布資料截面(CDDI)、乙太網路/IEEE 1 102.3、Token Ring/IEEE 1102.5等等。WAN技術包含但不受限於點對 點連結、電路交換式網路(像是整合服務數位網路(ISDN) 以及其變化)、封包交換式網路以及數位用戶端迴路 (DSL)。 通訊連接1550就是用於將網路介面1548連接到匯 45 1353146 流排 1 5 1 8的硬體/軟體。雖然為了簡化將通訊連接 1 5 5 Ο 顯示在電腦 1512裡面,其也可位於電腦 1512之外。連 接到網路介面 1548所需的硬體/軟體包含(僅為範例)内 部與外部技術,像是包含一般電話規格的數據機、纜線數 據機以及 DSL數據機、ISDN配接卡以及乙太網路卡。 上面的說明已經包含本發明範例,當然並不可能說明 每個可想像的組件組合或說明本發明的方法,但是精通此 技術的人士會瞭解,本發明的許多進一步組合與排列是可 行的。因此,本發明將包含位於申請專利範圍的範疇與精 神内之所有這種變化、修改以及改變。更進一步,在詳細 說明或申請專利範圍内都使用到「包含」一詞,這個詞的 意義類似於「包括」一詞,用於在申請專利範圍中作為轉 換字。 【圖式簡單說明】 第 1圖為依照本發明一個態樣並有助於防治垃圾郵 件的系統之高階方塊圖。 第 2圖為依照本發明一個態樣並從傳入訊息中擷取 一或多個特色,而有助於防治垃圾郵件的系統之方塊圖。 第 3圖為依照本發明一個態樣可從 IP位址中擷取 到的複數個特色之圖解圖。 第4圖為依照本發明一個態樣可從FQDN中擷取到 的複數個特色之圖解圖。 46 1353146 第 5圖為依照本發明一個態樣可從電子郵件地址中 擷取到的複數個特色之圖解圖。 第 6圖為依照本發明一個態樣可從 URL或網址中 擷取到的複數個特色之圖解圖。 第 7圖為依照本發明一個態樣相關於訓練過濾器的 範例方法之流程圖。 第 8圖為依照本發明一個態樣相關於運用已訓練的 過濾器之範例方法流程圖。 第 9圖為依照本發明一個態樣相關於建立清單的範 例方法之流程圖。 第1 0圖為依照本發明一個態樣相關於運用清單來訓 練過滤器之範例方法流程圖。 第1 1圖為依照本發明一個態樣並參閱至少第 7圖 與第 8圖的方法之處理流程圖。 第1 2圖為依照本發明一個態樣幫助識別合法與偽裝 收件者 IP位址之處理流程圖。 第1 3圖為依照本發明一個態樣將親代控制系統併入 從傳入訊息中產生與/或擷取特色之方法流程圖。 第1 4圖為依照本發明一個態樣有助於建立特色集合 來運用於機器學習系統内之方法流程圖。 第1 5圖為實施本發明許多態樣的範例環境。 【主要元件符號說明】 47 1353146 1 Ο 0特色擷取與訓練系統11 0傳入訊息 1 2 0訊息接收組件 1 3 0特色擷取組件 140過濾器命名組件 1 5 0訓練過濾器 2 0 0特色擷取系統 2 1 0傳入訊息 220特色擷取器組件 φ 230特色 232 FEATHRE, 234 FEATURE2 236 FEATUREm 2 4 0特色正規化器組件 2 5 0正規化特色集合 - 2 60訓練系統 2 7 0過濾器 2 8 0垃圾郵件特色清單 ·
3 Ο 0 IP位址 302區塊 ID 3 04至少第一 1位元 306至少第一 2位元 3 0 8至少第一 3位元 3 1 0至少第一 Μ位元 3 1 2至少第一 3 1位元 48 1353146 3 1 4階層配置
3 ] 6稀有項 400 FQDN
4 02主機名稱 4 04網域名稱 4 0 6階層分類 408 B.X.COM 410 X.COM 412 COM 4 1 4特色種類 5 0 0電子郵件地址
5 0 2使用者名稱 504 FQDN
600 URL 610 x_y.eom/a/b
6 2 0 X . y. c 〇 ra/a 630 x.y.com 7 0 0範例處理 7 1 0接收訊息 7 2 0從訊息擷取一或多個特色 7 3 0新增特色並將訊息區分到訓練集合 7 4 0所有訊息都重覆執行 750選擇最有用的特色 7 6 0使用機器學習演算法訓練過濾器 49 1353146 725到第丨1圖 8 0 0範例處理 8 1 0接收訊息 8 2 0從訊息擷取一或多個特色 8 3 0將擷取的特色傳遞到用機器學習系統訓練過的過濾器 840從機器學習系統獲得裁決 8 5 0根據裁決採取適當行動 9 0 0範例處理 9 1 0接收訊息 920擷取某些相關的特色(例如寄件者的IP位址) 9 3 0用訊息的區分增加特色的次數 940重覆直到所有訊息都已經處理過 950建立90 %不良,90%良好等等的特色清單 1 0 0 0範例處理 1 0 1 0接收訊息 1 0 2 0從包含寄件人IP位址的訊息中擷取特色 1 0 3 0將訊息的特色與區分新增至訓練集合 1 040包含開啟寄件人IP位址清單的特殊特色 1 0 5 0重複直到所有訊息都已經處理 1 0 6 0選擇有用的特色與訓練過濾器 1 1 ] 0將其收件人 IP位址或部分以及寄件人主機名稱正 規化,並且執行位元處理 1120選擇性擷取以及/或正規化 "FROM:"行的内容 1 1 30擷取以及/或正規化 "MAIL FROM SMTP"指令的内 11401353146 1150 1160 1 170 1180 12 10 1220 1230 13 10 1330 1320 1340 1350 13 60 14 10 1420 1430 容 選擇性擷取以及/或正規化回覆地址或部分 選擇性擷取以及/或正規化副本抄送地址或部分 選擇性掏*以及/或域號瑪以及/或冑話號瑪作 為特色 選擇性擷取以及/或正規化URL或部分 選擇性擷取以及/或正規化郵寄連結或部分 追鞭(收件人)伺服器 不戈信賴的IP位址 指派最後受信賴的ip 略所有其他位置伺服器 位址與清單比較來幫助識別 裸取偽裝的寄件人FQDN並且 用來作為特色
1 p位址’直到追蹤到未知或 位址作為正面特色以及/或忽 IP位址’並且/或將未知IP 或執行網域剝離並
接收訊息 訊息是否包含至少一 URL, 以及/或郵寄連結? 掃描URL以及/或郵寄連結的訊息 通過至少部分URL以及/或郵寄連结 控制系統 到至少一親代
區分URL以及/或郵寄連結 指派已區分的URL/郵寄連結作為特色 擷取(並常化)一或多個特色 比較特色類型與常見特色清單 特色是否常見? 51 1353146 1440運用特色的稀有性作為特色 1 4 6 0運用常見性作為特色 15 10操作環境 1 5 1 2電腦 1 5 1 4處理單元 1 5 1 6系統記憶體 1 5 1 8系統匯流排 1 5 2 0揮發性記憶體 φ 1 5 2 2非揮發性記憶體 1524磁碟儲存體 1 526介面 1 5 28作業系統 1 5 3 0應用程式 1 5 3 2程式模組 * 1 5 3 4程式資料 1 5 3 6輸入裝置 1 5 3 8介面連接4 · 1 540輸出裝置 1 5 4 2輸出配接卡 1 5 4 4遠端電腦 1 5 4 6記憶體儲存裝置 1 5 4 8網路介面 1 5 5 0通訊連接 52

Claims (1)

1353146 十、申請專利範圍: 1. 一種幫助擷取與垃圾郵件處理有關之資料的系統,該系 統實施於一或多個電腦上,其包含:
一組件,其實施於一或多個處理器上及接收一項目 並擷取與一訊息來源地或其部分相關的一組特色,以及 (或)讓一所欲接收者接觸、回覆或接收與該訊息相關 的資訊,其中該組特色包含:一主機名稱與一網域名 稱;以及 一組件,其運用與建立一過濾器相關的該等擷取的 特色之一子集,其中該過濾器係儲存於一電腦可讀取儲 存媒體、顯示於一顯上裝置上、或可由在一或多個處理 器上執行的組件來運用的至少一者。
2.如申請專利範圍第1項所述之系統,進一步包含:一 正規化組件,其消除該等特色的一子集之阻礙 (deofuscate) 〇 3. 如申請專利範圍第1項所述之系統,該過濾器為一垃 圾郵件過濾器。 4. 如申請專利範圍第1項所述之系統,該過濾器為一親 代控制過渡器。 53 1353146 5.如申請專利範圍第1項所述之系統,進一步包含一機 器學習系統組件,其運用該等特色來學習垃圾郵件或非 垃圾郵件的至少一者。
6.如申請專利範圍第1項所述之系統,該等特色的該子 集包含:至少一 IP位址,該至少一 IP位址為位在該 訊息中的一回覆地址、一副本抄送地址、一郵寄地址、 —寄件人地址、以及一 URL的任何一者之至少一部 分。 7.如申請專利範圍第 6項所述之系統,該 IP位址包含 一區塊ID,其中可擷取該區塊ID作為至少一特色。 8.如申請專利範圍第 7項所述之系統,其中至少部分地 藉由參照一區塊目錄來判斷該區塊ID。
9.如申請專利範圍第 8項所述之系統,其中該區塊目錄 為 arin.net 〇 1 〇.如申請專利範圍第7項所述之系統,其中至少部分藉 由猜測來判斷該區塊 ID,藉此擷取該 IP位址的至少 一第一 1位元、至少一第一 2位元、至少一第一 3位 元以及最高至少一第一 3 1位元之任何一者作為特色。 54 1353146 1 1 .如申請專利範圍第1項所述之系統,其中該等擷取的 特色的該子集包含:IP位址的一第一 1至一第一 31 位元的每一者。 1 2 _如申請專利範圍第1項所述之系統,該等擷取的特色 之一子集特色的該子集包含:一 URL。
1 3 .如申請專利範圍第 1 2項所述之系統,其中該 URL位 址位於下列至少一者中:該訊息本體、嵌入作為該訊息 内的文字或嵌入該訊息的影像。 1 4 _如申請專利範圍第 1項所述之系統,更包含一組件, 其利用該擷取的特色之至少一子集,來傳播至少一特色 清單。
1 5 .如申請專利範圍第1 4項所述之系統,該至少一特色清 單為一良好使用者清單、一垃圾郵件寄件人清單、一指 出合法寄件者的正面特色清單、或一指出垃圾郵件的特 色清單的任一者。 1 6.如申請專利範圍第1項所述之系統,其中該等擷取的 特色的該子集包含:至少一 URL。 55 1353146 1 7.如申請專利範圍第1 6項所述之系統,其中該 URL嵌 入作為該訊息本體内的文字。 1 8 ·如申請專利範圍第1 6項所述之系統,其中該 URL為 該訊息本體内的連結之至少一部分。 1 9 ·如申請專利範圍第1 6項所述之系統,其中該 URL為 嵌入作為該訊息内影像的連結之至少一部分。 2 0.如申請專利範圍第1項所述之系統,該等擷取的特色 的該子集包含:從一電子郵件地址擷取出來的一主機名 稱與一網域名稱的至少一者。 2 1 _如申請專利範圍第1項所述之系統,該等擷取的特色 的該子集包含:從一電子郵件地址與一 URL的任何一 者之中擷取出來FQDN的至少一部分。 22.如申請專利範圍第1項所述之系統,該等擷取的特色 的該子集包含:從一電子郵件地址與一 URL任何一者 之中擷取出來的網域名稱之至少一部分。 2 3 _如申請專利範圍第1項所述之系統,其中該等擷取特 56 1353146 色的該子集的至少一部分在與一機器學習系統共同使 用之前會先正規化。 2 4 ·如申請專利範圍第1項所述之系統,其中該等擷取特 色的該子集的至少一部分在用來傳播至少一特色清單 之前會先正規化。
2 5.如申請專利範圍第1項所述之系統,更包含:一區分 組件,其將一 URL、一電子郵件地址以及一 IP位址 的至少一者的至少一部分區分為:成人、成人内容、不 適合、不適合某些年齡、不適合所有年齡、不合適或合 適之任何一者。 2 6 _如申請專利範圍第 2 5項所述之系統,其中該區分組件 為一親代控制系統。
2 7.如申請專利範圍第2 5項所述之系統,其中該區分組件 指派至少一特色種類到該 URL、該網站位址或該 IP 位址的至少一者的該區分部分。 2 8 .如申請專利範圍第1項所述之系統,其中該組特色包 含:至少一付費電話號瑪,該電話號碼包含:一區碼, 以幫助映射一寄件者或與該訊息相關的聯絡人的一地 57 1353146 理位置。 2 9. —種儲存指令的電腦可讀取媒體,該等指令由電腦 時可進行以下步驟: 接收一項目並擷取與一訊息來源地或其部分相關的 特色,以及(或)讓一所欲接收者接觸、回覆或接收 訊息相關的資訊,其中該組特色包含:一主機名稱與 域名稱; 運用與建立一過濾器相關的該等擷取的特色之一子 其中該過濾器係儲存於一電腦可讀取儲存媒體、顯示 顯上裝置上、或可由在一或多個處理器上執行的組件 用的至少一者。 執行 一組 與該 一網
集, 於一 來運 30. —種幫助擷取與垃圾郵件處理有關之資料的方法, 法包含以下步驟: 接收一訊息; 擷取與該訊息來源地或其部分相關的一組特爸 及(或)讓一所欲使用者接觸、回覆或接收與該訊 關的資訊,其中該組特色包含:一 IP位址的至少 分,其中擷取該IP位址的至少一部分之步驟包含 行至少下列步驟之一者:參照一區塊ID目錄來判 應至該IP位址的至少一區塊ID,如此該區塊ID 該方
,以 息相 一部 :執 斷對 被擷 58 1353146 « 取作為額外特色;或自該i p位址擷取至少前1位元到 前31位元之每一者;以及 運用與建立一過濾器相關的該等擷取的特色之一 子集。 31.如申請專利範圍第 30項所述之方法,其中至少一擷取 的IP位址對應於至少一伺服器。
32.如申請專利範圍第 31項所述之方法,更包含擷取該至 少一伺服器作為一額外特色。 3 3 ·如申請專利範圍第 3 0項所述之方法,更包含:消除從 該訊息擷取出來的該等特色之至少一子集之阻礙。
3 4 ·如申請專利範圍第3 0項所述之方法,更包含:消除從 該訊息擷取出來的至少一特色的至少一部分之阻礙。 3 5 ·如申請專利範圍第 3 4項所述之方法,其中消除從該訊 息擷取出來的一寄件人 IP位址之阻礙的步驟包含以 下步驟:往回追蹤複數附加的寄件 IP位址,來確認該 附加的寄件 IP位址的身分。 36.如申請專利範圍第 34項所述之方法,更包含以下步 59 1353146 < 驟:從一網站位址擷取出額外特色,該步驟包含執 少下列動作之至少一者: 一次移除至少一字尾,藉此產生個別額外特έ —次移除至少一字首,藉此產生個別額外特g 3 7.如申請專利範圍第 3 4項所述之方法,其中該組特 含:一回覆地址、一副本抄送地址、一郵寄地址 U R L、一連結或一寄件人地址之任何一者的至少 分。 3 8 .如申請專利範圍第3 0項所述之方法,其中該等擷 特色的至少一子集嵌入作為該訊息本體内文字與 之一者。 3 9 .如申請專利範圍第3 0項所述之方法,其中該組特 含:一主機名稱與一網域名稱。 40. 如申請專利範圍第30項所述之方法,更包含:區 或多個擷取的特色以及(或)其部分,以指示與該 相關的合適與不合適内容之任何一者,並使用該區 為一額外特色。 41. 如申請專利範圍第30項所述之方法,更包含:指 行至 ;或 〇 色包 一部 取的 影像 色包
分一 訊息 分作 派一 60 1353146 特色種類給該個別擷取的特色,以至少部分地根據個別 擷取的特色來通知訊息内容的使用者,並使用該特色種 類作為一額外特色。 42.如申請專利範圍第 41項所述之方法,更包含:判斷一 特色種類與一特色的至少一者為稀有與常見之任何一 者,並使用一特色的一稀有性與一常見性作為一額外特
43.如申請專利範圍第30項所述之方法,其中該等擷取的 特色的該子集經使用以透過一機器學習系統與建立一 過濾器相關聯。 44.如申請專利範圍第3 0項所述之方法,其中該過濾器為 一垃圾郵件過濾器。
4 5 .如申請專利範圍第3 0項所述之方法,其中該過濾器為 一親代控制過濾器。 46.如申請專利範圍第30項所述之方法,更包含:運用從 該訊息擷取出來的該等特色的至少一子集來傳播一或 多特色清單。 61 1353146 47.如申請專利範圍第46項所述之方法,其中該特色清單 包含:指出非垃圾郵件寄件人的正面特色與指出垃圾郵 件寄件人的負面特色之至少一者。 48.如申請專利範圍第 30項所述之方法,其中該等擷取的 特色,在用來作為一機器學習系統的特色之前,先至少 部分消除阻礙。
49.如申請專利範圍第 30項所述之方法,其中該等擷取的 特色,在用來作為特色以傳播特色清單之前,先至少部 分消除阻礙。 5 0 · —種適於在兩或多個幫助從訊息中擷取資料的電腦程 序之間傳輸的資料封包結構產品’該貧料封包結構產品 包含:
一第一資料欄位,其包含:與接收一訊息相關的資 訊,擷取與該訊息來源地或其部分相關的一組特色,以 及(或)讓一所欲使用者接觸、回覆或接收與該訊息相 關的資訊,其中該組特色包含:一主機名稱與一網域名 稱;以及 一第二資料欄位,其包含:關聯於運用與建立一過 濾器相關的該等擷取的特色之一子集的資訊。 62 1353146 5 1 . —種幫助擷取與垃圾郵件處理相關之資料的系統,該系 統包含: 用於接收一訊息的構件;
用於擷取與該訊息來源地或其部分相關的一組特 色,以及(或)讓一所欲使用者接觸、回覆或接收與該 訊息相關的資訊的構件,其中該組特色包含:一主機名 稱與一網域名稱;以及 用以運用與建立一過濾器相關的該等擷取的特色 之一子集的構件。
63
TW093113883A 2003-06-04 2004-05-17 Origination/destination features and lists for spa TWI353146B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/454,168 US7272853B2 (en) 2003-06-04 2003-06-04 Origination/destination features and lists for spam prevention

Publications (2)

Publication Number Publication Date
TW200509615A TW200509615A (en) 2005-03-01
TWI353146B true TWI353146B (en) 2011-11-21

Family

ID=33159539

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093113883A TWI353146B (en) 2003-06-04 2004-05-17 Origination/destination features and lists for spa

Country Status (14)

Country Link
US (4) US7272853B2 (zh)
EP (1) EP1484893B1 (zh)
JP (1) JP4672285B2 (zh)
KR (1) KR101137065B1 (zh)
CN (1) CN1573784B (zh)
AU (1) AU2004202268B2 (zh)
BR (1) BRPI0401849B1 (zh)
CA (1) CA2467869C (zh)
MX (1) MXPA04005335A (zh)
MY (1) MY142668A (zh)
PL (1) PL368364A1 (zh)
RU (1) RU2378692C2 (zh)
TW (1) TWI353146B (zh)
ZA (1) ZA200404018B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI549464B (zh) * 2013-10-30 2016-09-11 騰訊科技(深圳)有限公司 一種短url服務的實現方法及裝置

Families Citing this family (426)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643686B1 (en) * 1998-12-18 2003-11-04 At&T Corp. System and method for counteracting message filtering
US9699129B1 (en) * 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US6408277B1 (en) 2000-06-21 2002-06-18 Banter Limited System and method for automatic task prioritization
US20100042565A1 (en) * 2000-09-25 2010-02-18 Crossbeam Systems, Inc. Mezzazine in-depth data analysis facility
US20110213869A1 (en) * 2000-09-25 2011-09-01 Yevgeny Korsunsky Processing data flows with a data flow processor
US20110238855A1 (en) * 2000-09-25 2011-09-29 Yevgeny Korsunsky Processing data flows with a data flow processor
US20110231564A1 (en) * 2000-09-25 2011-09-22 Yevgeny Korsunsky Processing data flows with a data flow processor
US8010469B2 (en) * 2000-09-25 2011-08-30 Crossbeam Systems, Inc. Systems and methods for processing data flows
US20110214157A1 (en) * 2000-09-25 2011-09-01 Yevgeny Korsunsky Securing a network with data flow processing
US20110219035A1 (en) * 2000-09-25 2011-09-08 Yevgeny Korsunsky Database security via data flow processing
US9800608B2 (en) * 2000-09-25 2017-10-24 Symantec Corporation Processing data flows with a data flow processor
US9525696B2 (en) 2000-09-25 2016-12-20 Blue Coat Systems, Inc. Systems and methods for processing data flows
US7644057B2 (en) * 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
US7155608B1 (en) * 2001-12-05 2006-12-26 Bellsouth Intellectual Property Corp. Foreign network SPAM blocker
US8578480B2 (en) 2002-03-08 2013-11-05 Mcafee, Inc. Systems and methods for identifying potentially malicious messages
US8561167B2 (en) 2002-03-08 2013-10-15 Mcafee, Inc. Web reputation scoring
US20060015942A1 (en) * 2002-03-08 2006-01-19 Ciphertrust, Inc. Systems and methods for classification of messaging entities
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US7743045B2 (en) * 2005-08-10 2010-06-22 Google Inc. Detecting spam related and biased contexts for programmable search engines
US7693830B2 (en) 2005-08-10 2010-04-06 Google Inc. Programmable search engine
US20080196099A1 (en) * 2002-06-10 2008-08-14 Akonix Systems, Inc. Systems and methods for detecting and blocking malicious content in instant messages
US7428590B2 (en) * 2002-06-10 2008-09-23 Akonix Systems, Inc. Systems and methods for reflecting messages associated with a target protocol within a network
AU2003288515A1 (en) * 2002-12-26 2004-07-22 Commtouch Software Ltd. Detection and prevention of spam
US7533148B2 (en) * 2003-01-09 2009-05-12 Microsoft Corporation Framework to enable integration of anti-spam technologies
US7219131B2 (en) * 2003-01-16 2007-05-15 Ironport Systems, Inc. Electronic message delivery using an alternate source approach
US7760729B2 (en) 2003-05-28 2010-07-20 Citrix Systems, Inc. Policy based network address translation
US7376652B2 (en) * 2003-06-17 2008-05-20 The Hayes-Roth Family Trust Personal portal and secure information exchange
US8145710B2 (en) * 2003-06-18 2012-03-27 Symantec Corporation System and method for filtering spam messages utilizing URL filtering module
US7155484B2 (en) * 2003-06-30 2006-12-26 Bellsouth Intellectual Property Corporation Filtering email messages corresponding to undesirable geographical regions
US7526730B1 (en) * 2003-07-01 2009-04-28 Aol Llc Identifying URL target hostnames
US9412123B2 (en) 2003-07-01 2016-08-09 The 41St Parameter, Inc. Keystroke analysis
US8214437B1 (en) * 2003-07-21 2012-07-03 Aol Inc. Online adaptive filtering of messages
US7814545B2 (en) * 2003-07-22 2010-10-12 Sonicwall, Inc. Message classification using classifiers
US7421498B2 (en) * 2003-08-25 2008-09-02 Microsoft Corporation Method and system for URL based filtering of electronic communications and web pages
US7835294B2 (en) * 2003-09-03 2010-11-16 Gary Stephen Shuster Message filtering method
US8271588B1 (en) * 2003-09-24 2012-09-18 Symantec Corporation System and method for filtering fraudulent email messages
US20070275739A1 (en) * 2003-10-08 2007-11-29 Three B Technologies Pyt Ltd Method and System for Authorising Short Message Service Messages
US7610341B2 (en) * 2003-10-14 2009-10-27 At&T Intellectual Property I, L.P. Filtered email differentiation
US20050080642A1 (en) * 2003-10-14 2005-04-14 Daniell W. Todd Consolidated email filtering user interface
US7664812B2 (en) * 2003-10-14 2010-02-16 At&T Intellectual Property I, L.P. Phonetic filtering of undesired email messages
US7930351B2 (en) * 2003-10-14 2011-04-19 At&T Intellectual Property I, L.P. Identifying undesired email messages having attachments
US7451184B2 (en) * 2003-10-14 2008-11-11 At&T Intellectual Property I, L.P. Child protection from harmful email
US7673066B2 (en) * 2003-11-07 2010-03-02 Sony Corporation File transfer protocol for mobile computer
US7978716B2 (en) 2003-11-24 2011-07-12 Citrix Systems, Inc. Systems and methods for providing a VPN solution
US7444403B1 (en) 2003-11-25 2008-10-28 Microsoft Corporation Detecting sexually predatory content in an electronic communication
US20050160258A1 (en) * 2003-12-11 2005-07-21 Bioobservation Systems Limited Detecting objectionable content in displayed images
US8984640B1 (en) * 2003-12-11 2015-03-17 Radix Holdings, Llc Anti-phishing
US7590694B2 (en) 2004-01-16 2009-09-15 Gozoom.Com, Inc. System for determining degrees of similarity in email message information
JP2005208780A (ja) * 2004-01-21 2005-08-04 Nec Corp メールフィルタリングシステム及びそれに用いるurlブラックリスト動的構築方法
US7184929B2 (en) * 2004-01-28 2007-02-27 Microsoft Corporation Exponential priors for maximum entropy models
US8856239B1 (en) 2004-02-10 2014-10-07 Sonicwall, Inc. Message classification based on likelihood of spoofing
US7653695B2 (en) * 2004-02-17 2010-01-26 Ironport Systems, Inc. Collecting, aggregating, and managing information relating to electronic messages
US7617531B1 (en) * 2004-02-18 2009-11-10 Citrix Systems, Inc. Inferencing data types of message components
US8214438B2 (en) * 2004-03-01 2012-07-03 Microsoft Corporation (More) advanced spam detection features
US10999298B2 (en) 2004-03-02 2021-05-04 The 41St Parameter, Inc. Method and system for identifying users and detecting fraud by use of the internet
US8918466B2 (en) * 2004-03-09 2014-12-23 Tonny Yu System for email processing and analysis
US7644127B2 (en) * 2004-03-09 2010-01-05 Gozoom.Com, Inc. Email analysis using fuzzy matching of text
US7631044B2 (en) * 2004-03-09 2009-12-08 Gozoom.Com, Inc. Suppression of undesirable network messages
US20050289239A1 (en) * 2004-03-16 2005-12-29 Prakash Vipul V Method and an apparatus to classify electronic communication
WO2005103960A1 (en) * 2004-04-20 2005-11-03 The Boeing Company Apparatus and method for redirecting unresolvable addresses using a local care-of ip address
US7870608B2 (en) 2004-05-02 2011-01-11 Markmonitor, Inc. Early detection and monitoring of online fraud
US8769671B2 (en) 2004-05-02 2014-07-01 Markmonitor Inc. Online fraud solution
US7992204B2 (en) * 2004-05-02 2011-08-02 Markmonitor, Inc. Enhanced responses to online fraud
US8041769B2 (en) 2004-05-02 2011-10-18 Markmonitor Inc. Generating phish messages
US7913302B2 (en) * 2004-05-02 2011-03-22 Markmonitor, Inc. Advanced responses to online fraud
US9203648B2 (en) 2004-05-02 2015-12-01 Thomson Reuters Global Resources Online fraud solution
US7457823B2 (en) 2004-05-02 2008-11-25 Markmonitor Inc. Methods and systems for analyzing data related to possible online fraud
US7941490B1 (en) * 2004-05-11 2011-05-10 Symantec Corporation Method and apparatus for detecting spam in email messages and email attachments
US7734093B2 (en) * 2004-05-20 2010-06-08 Ricoh Co., Ltd. Paper-based upload and tracking system
US7523498B2 (en) * 2004-05-20 2009-04-21 International Business Machines Corporation Method and system for monitoring personal computer documents for sensitive data
JP4829223B2 (ja) * 2004-05-25 2011-12-07 グーグル インコーポレイテッド 電子メッセージソース評判情報システム
US7756930B2 (en) 2004-05-28 2010-07-13 Ironport Systems, Inc. Techniques for determining the reputation of a message sender
US8166310B2 (en) * 2004-05-29 2012-04-24 Ironport Systems, Inc. Method and apparatus for providing temporary access to a network device
US7849142B2 (en) 2004-05-29 2010-12-07 Ironport Systems, Inc. Managing connections, messages, and directory harvest attacks at a server
US7917588B2 (en) 2004-05-29 2011-03-29 Ironport Systems, Inc. Managing delivery of electronic messages using bounce profiles
US7870200B2 (en) * 2004-05-29 2011-01-11 Ironport Systems, Inc. Monitoring the flow of messages received at a server
US7873695B2 (en) 2004-05-29 2011-01-18 Ironport Systems, Inc. Managing connections and messages at a server by associating different actions for both different senders and different recipients
US7748038B2 (en) * 2004-06-16 2010-06-29 Ironport Systems, Inc. Method and apparatus for managing computer virus outbreaks
US20050283519A1 (en) * 2004-06-17 2005-12-22 Commtouch Software, Ltd. Methods and systems for combating spam
US8739274B2 (en) 2004-06-30 2014-05-27 Citrix Systems, Inc. Method and device for performing integrated caching in a data communication network
US7580981B1 (en) 2004-06-30 2009-08-25 Google Inc. System for determining email spam by delivery path
US7757074B2 (en) 2004-06-30 2010-07-13 Citrix Application Networking, Llc System and method for establishing a virtual private network
US8495305B2 (en) 2004-06-30 2013-07-23 Citrix Systems, Inc. Method and device for performing caching of dynamically generated objects in a data communication network
EP1771998B1 (en) 2004-07-23 2015-04-15 Citrix Systems, Inc. Systems and methods for optimizing communications between network nodes
KR20070037650A (ko) 2004-07-23 2007-04-05 사이트릭스 시스템스, 인크. 종단에서 게이트웨이로 패킷을 라우팅하기 위한 방법 및시스템
US7711679B2 (en) 2004-07-26 2010-05-04 Google Inc. Phrase-based detection of duplicate documents in an information retrieval system
US7702618B1 (en) 2004-07-26 2010-04-20 Google Inc. Information retrieval system for archiving multiple document versions
US7567959B2 (en) 2004-07-26 2009-07-28 Google Inc. Multiple index based information retrieval system
US7580921B2 (en) * 2004-07-26 2009-08-25 Google Inc. Phrase identification in an information retrieval system
US20070204026A1 (en) * 2004-07-27 2007-08-30 U.S. Telecom Inc. Method For Blocking Unwanted E-Mail Based On Proximity Detection
US20060069667A1 (en) * 2004-09-30 2006-03-30 Microsoft Corporation Content evaluation
US8799465B2 (en) * 2004-10-13 2014-08-05 International Business Machines Corporation Fake web addresses and hyperlinks
US8635690B2 (en) 2004-11-05 2014-01-21 Mcafee, Inc. Reputation based message processing
US7711781B2 (en) * 2004-11-09 2010-05-04 International Business Machines Corporation Technique for detecting and blocking unwanted instant messages
US8032594B2 (en) * 2004-11-10 2011-10-04 Digital Envoy, Inc. Email anti-phishing inspector
US20060168066A1 (en) * 2004-11-10 2006-07-27 David Helsper Email anti-phishing inspector
US7580982B2 (en) * 2004-12-14 2009-08-25 The Go Daddy Group, Inc. Email filtering system and method
US7734670B2 (en) * 2004-12-15 2010-06-08 Microsoft Corporation Actionable email documents
US20060168030A1 (en) * 2004-12-21 2006-07-27 Lucent Technologies, Inc. Anti-spam service
US20060168032A1 (en) * 2004-12-21 2006-07-27 Lucent Technologies, Inc. Unwanted message (spam) detection based on message content
US8549149B2 (en) 2004-12-30 2013-10-01 Citrix Systems, Inc. Systems and methods for providing client-side accelerated access to remote applications via TCP multiplexing
US8706877B2 (en) 2004-12-30 2014-04-22 Citrix Systems, Inc. Systems and methods for providing client-side dynamic redirection to bypass an intermediary
US7810089B2 (en) 2004-12-30 2010-10-05 Citrix Systems, Inc. Systems and methods for automatic installation and execution of a client-side acceleration program
US8700695B2 (en) 2004-12-30 2014-04-15 Citrix Systems, Inc. Systems and methods for providing client-side accelerated access to remote applications via TCP pooling
US8954595B2 (en) 2004-12-30 2015-02-10 Citrix Systems, Inc. Systems and methods for providing client-side accelerated access to remote applications via TCP buffering
US20060168042A1 (en) * 2005-01-07 2006-07-27 International Business Machines Corporation Mechanism for mitigating the problem of unsolicited email (also known as "spam"
US8255456B2 (en) 2005-12-30 2012-08-28 Citrix Systems, Inc. System and method for performing flash caching of dynamically generated objects in a data communication network
US8281401B2 (en) * 2005-01-25 2012-10-02 Whitehat Security, Inc. System for detecting vulnerabilities in web applications using client-side application interfaces
US20060230039A1 (en) * 2005-01-25 2006-10-12 Markmonitor, Inc. Online identity tracking
DE102005004464A1 (de) 2005-01-31 2006-10-26 Robert Bosch Gmbh Verfahren zur Speicherung von Botschaften in einem Botschaftsspeicher und Botschaftsspeicher
US7647380B2 (en) * 2005-01-31 2010-01-12 Microsoft Corporation Datacenter mail routing
US7962510B2 (en) * 2005-02-11 2011-06-14 Microsoft Corporation Using content analysis to detect spam web pages
JP4670049B2 (ja) * 2005-02-16 2011-04-13 国立大学法人豊橋技術科学大学 電子メールフィルタリングプログラム、電子メールフィルタリング方法、電子メールフィルタリングシステム
DE102005011169B4 (de) * 2005-03-09 2010-09-30 1&1 Internet Ag Verfahren und System für einen E-Mail-Dienst mit Aufbereitung von Informations-E-Mails eines weiteren Internet-Dienstes
US7590698B1 (en) * 2005-03-14 2009-09-15 Symantec Corporation Thwarting phishing attacks by using pre-established policy files
US7975010B1 (en) * 2005-03-23 2011-07-05 Symantec Corporation Countering spam through address comparison
US20060224677A1 (en) * 2005-04-01 2006-10-05 Baytsp Method and apparatus for detecting email fraud
US8898162B2 (en) * 2005-04-01 2014-11-25 International Business Machines Corporation Methods, systems, and computer program products for providing customized content over a network
GB2424969A (en) * 2005-04-04 2006-10-11 Messagelabs Ltd Training an anti-spam filter
GB2425855A (en) * 2005-04-25 2006-11-08 Messagelabs Ltd Detecting and filtering of spam emails
CN101495969B (zh) * 2005-05-05 2012-10-10 思科埃恩波特系统有限公司 识别电子消息中的威胁
JP4559295B2 (ja) * 2005-05-17 2010-10-06 株式会社エヌ・ティ・ティ・ドコモ データ通信システム及びデータ通信方法
US20070097976A1 (en) * 2005-05-20 2007-05-03 Wood George D Suspect traffic redirection
US8583827B2 (en) * 2005-05-26 2013-11-12 Citrix Systems, Inc. Dynamic data optimization in data network
US20060277259A1 (en) * 2005-06-07 2006-12-07 Microsoft Corporation Distributed sender reputations
US8010609B2 (en) * 2005-06-20 2011-08-30 Symantec Corporation Method and apparatus for maintaining reputation lists of IP addresses to detect email spam
US7739337B1 (en) 2005-06-20 2010-06-15 Symantec Corporation Method and apparatus for grouping spam email messages
GB0512744D0 (en) * 2005-06-22 2005-07-27 Blackspider Technologies Method and system for filtering electronic messages
US7636734B2 (en) * 2005-06-23 2009-12-22 Microsoft Corporation Method for probabilistic analysis of most frequently occurring electronic message addresses within personal store (.PST) files to determine owner with confidence factor based on relative weight and set of user-specified factors
US8645683B1 (en) 2005-08-11 2014-02-04 Aaron T. Emigh Verified navigation
US7809156B2 (en) 2005-08-12 2010-10-05 Ricoh Company, Ltd. Techniques for generating and using a fingerprint for an article
US8166068B2 (en) * 2005-09-02 2012-04-24 Qwest Location based authorization of financial card transactions systems and methods
US7487170B2 (en) * 2005-09-02 2009-02-03 Qwest Communications International Inc. Location information for avoiding unwanted communications systems and methods
US8176077B2 (en) 2005-09-02 2012-05-08 Qwest Communications International Inc. Location based access to financial information systems and methods
US7697942B2 (en) * 2005-09-02 2010-04-13 Stevens Gilman R Location based rules architecture systems and methods
US20070061402A1 (en) * 2005-09-15 2007-03-15 Microsoft Corporation Multipurpose internet mail extension (MIME) analysis
US8117267B2 (en) 2005-09-29 2012-02-14 Teamon Systems, Inc. System and method for provisioning an email account using mail exchange and address records
US8078681B2 (en) 2005-09-29 2011-12-13 Teamon Systems, Inc. System and method for provisioning an email account using mail exchange records
US20070078934A1 (en) * 2005-09-30 2007-04-05 Teamon Systems, Inc. System and method for provisioning an email account hosted on an assured email service provider
US20070118759A1 (en) * 2005-10-07 2007-05-24 Sheppard Scott K Undesirable email determination
US7912907B1 (en) * 2005-10-07 2011-03-22 Symantec Corporation Spam email detection based on n-grams with feature selection
US20070088789A1 (en) * 2005-10-18 2007-04-19 Reuben Berman Method and system for indicating an email sender as spammer
WO2007050244A2 (en) 2005-10-27 2007-05-03 Georgia Tech Research Corporation Method and system for detecting and responding to attacking networks
US8272064B2 (en) * 2005-11-16 2012-09-18 The Boeing Company Automated rule generation for a secure downgrader
US11301585B2 (en) 2005-12-16 2022-04-12 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US8938671B2 (en) 2005-12-16 2015-01-20 The 41St Parameter, Inc. Methods and apparatus for securely displaying digital images
US7921184B2 (en) 2005-12-30 2011-04-05 Citrix Systems, Inc. System and method for performing flash crowd caching of dynamically generated objects in a data communication network
US8301839B2 (en) 2005-12-30 2012-10-30 Citrix Systems, Inc. System and method for performing granular invalidation of cached dynamically generated objects in a data communication network
US7475118B2 (en) * 2006-02-03 2009-01-06 International Business Machines Corporation Method for recognizing spam email
US7827280B2 (en) * 2006-02-28 2010-11-02 Red Hat, Inc. System and method for domain name filtering through the domain name system
US7627641B2 (en) * 2006-03-09 2009-12-01 Watchguard Technologies, Inc. Method and system for recognizing desired email
US8689102B2 (en) * 2006-03-31 2014-04-01 Ricoh Company, Ltd. User interface for creating and using media keys
US20070233612A1 (en) * 2006-03-31 2007-10-04 Ricoh Company, Ltd. Techniques for generating a media key
US8151327B2 (en) 2006-03-31 2012-04-03 The 41St Parameter, Inc. Systems and methods for detection of session tampering and fraud prevention
US9525547B2 (en) * 2006-03-31 2016-12-20 Ricoh Company, Ltd. Transmission of media keys
US8554690B2 (en) * 2006-03-31 2013-10-08 Ricoh Company, Ltd. Techniques for using media keys
US7809796B1 (en) * 2006-04-05 2010-10-05 Ironport Systems, Inc. Method of controlling access to network resources using information in electronic mail messages
US7849502B1 (en) * 2006-04-29 2010-12-07 Ironport Systems, Inc. Apparatus for monitoring network traffic
US20080082662A1 (en) * 2006-05-19 2008-04-03 Richard Dandliker Method and apparatus for controlling access to network resources based on reputation
US8489689B1 (en) * 2006-05-31 2013-07-16 Proofpoint, Inc. Apparatus and method for obfuscation detection within a spam filtering model
US8112484B1 (en) * 2006-05-31 2012-02-07 Proofpoint, Inc. Apparatus and method for auxiliary classification for generating features for a spam filtering model
US8307038B2 (en) * 2006-06-09 2012-11-06 Microsoft Corporation Email addresses relevance determination and uses
US8020206B2 (en) 2006-07-10 2011-09-13 Websense, Inc. System and method of analyzing web content
US8615800B2 (en) 2006-07-10 2013-12-24 Websense, Inc. System and method for analyzing web content
US8646071B2 (en) * 2006-08-07 2014-02-04 Symantec Corporation Method and system for validating site data
US20100205123A1 (en) * 2006-08-10 2010-08-12 Trustees Of Tufts College Systems and methods for identifying unwanted or harmful electronic text
US20080052360A1 (en) * 2006-08-22 2008-02-28 Microsoft Corporation Rules Profiler
US8078625B1 (en) * 2006-09-11 2011-12-13 Aol Inc. URL-based content categorization
US7606214B1 (en) * 2006-09-14 2009-10-20 Trend Micro Incorporated Anti-spam implementations in a router at the network layer
CN101155182A (zh) * 2006-09-30 2008-04-02 阿里巴巴公司 一种基于网络的垃圾信息过滤方法和装置
US7882187B2 (en) * 2006-10-12 2011-02-01 Watchguard Technologies, Inc. Method and system for detecting undesired email containing image-based messages
GB2443469A (en) * 2006-11-03 2008-05-07 Messagelabs Ltd Detection of image spam
US8577968B2 (en) * 2006-11-14 2013-11-05 Mcafee, Inc. Method and system for handling unwanted email messages
US8590002B1 (en) 2006-11-29 2013-11-19 Mcafee Inc. System, method and computer program product for maintaining a confidentiality of data on a network
US9654495B2 (en) 2006-12-01 2017-05-16 Websense, Llc System and method of analyzing web addresses
US8135780B2 (en) * 2006-12-01 2012-03-13 Microsoft Corporation Email safety determination
US8280978B2 (en) * 2006-12-29 2012-10-02 Prodea Systems, Inc. Demarcation between service provider and user in multi-services gateway device at user premises
US9497205B1 (en) * 2008-05-19 2016-11-15 Emc Corporation Global commonality and network logging
US9152706B1 (en) 2006-12-30 2015-10-06 Emc Corporation Anonymous identification tokens
GB2458094A (en) 2007-01-09 2009-09-09 Surfcontrol On Demand Ltd URL interception and categorization in firewalls
DK2122503T3 (da) * 2007-01-18 2013-02-18 Roke Manor Research Fremgangsmåde til filtrering af sektioner af en datastrøm
US20080177843A1 (en) * 2007-01-22 2008-07-24 Microsoft Corporation Inferring email action based on user input
US8763114B2 (en) 2007-01-24 2014-06-24 Mcafee, Inc. Detecting image spam
US7779156B2 (en) 2007-01-24 2010-08-17 Mcafee, Inc. Reputation based load balancing
US8214497B2 (en) 2007-01-24 2012-07-03 Mcafee, Inc. Multi-dimensional reputation scoring
US7716297B1 (en) 2007-01-30 2010-05-11 Proofpoint, Inc. Message stream analysis for spam detection and filtering
US8356076B1 (en) 2007-01-30 2013-01-15 Proofpoint, Inc. Apparatus and method for performing spam detection and filtering using an image history table
US7849193B1 (en) 2007-02-01 2010-12-07 Adobe Systems Incorporated Multiple hyperlinks in a uniform resource locator
US20080201722A1 (en) * 2007-02-20 2008-08-21 Gurusamy Sarathy Method and System For Unsafe Content Tracking
US8291021B2 (en) * 2007-02-26 2012-10-16 Red Hat, Inc. Graphical spam detection and filtering
US20080222725A1 (en) * 2007-03-05 2008-09-11 Microsoft Corporation Graph structures and web spam detection
US8756673B2 (en) * 2007-03-30 2014-06-17 Ricoh Company, Ltd. Techniques for sharing data
US20080243702A1 (en) * 2007-03-30 2008-10-02 Ricoh Company, Ltd. Tokens Usable in Value-Based Transactions
US20080250106A1 (en) * 2007-04-03 2008-10-09 George Leslie Rugg Use of Acceptance Methods for Accepting Email and Messages
US7861260B2 (en) 2007-04-17 2010-12-28 Almondnet, Inc. Targeted television advertisements based on online behavior
US8725597B2 (en) * 2007-04-25 2014-05-13 Google Inc. Merchant scoring system and transactional database
US20080270549A1 (en) * 2007-04-26 2008-10-30 Microsoft Corporation Extracting link spam using random walks and spam seeds
US8621008B2 (en) 2007-04-26 2013-12-31 Mcafee, Inc. System, method and computer program product for performing an action based on an aspect of an electronic mail message thread
GB0709527D0 (en) 2007-05-18 2007-06-27 Surfcontrol Plc Electronic messaging system, message processing apparatus and message processing method
US9083556B2 (en) * 2007-05-31 2015-07-14 Rpx Clearinghouse Llc System and method for detectng malicious mail from spam zombies
US7693806B2 (en) * 2007-06-21 2010-04-06 Microsoft Corporation Classification using a cascade approach
US8856360B2 (en) * 2007-06-22 2014-10-07 Microsoft Corporation Automatically identifying dynamic internet protocol addresses
US7899870B2 (en) * 2007-06-25 2011-03-01 Microsoft Corporation Determination of participation in a malicious software campaign
US7882177B2 (en) * 2007-08-06 2011-02-01 Yahoo! Inc. Employing pixel density to detect a spam image
US8199965B1 (en) 2007-08-17 2012-06-12 Mcafee, Inc. System, method, and computer program product for preventing image-related data loss
US20090063481A1 (en) * 2007-08-31 2009-03-05 Faus Norman L Systems and methods for developing features for a product
US20130276061A1 (en) 2007-09-05 2013-10-17 Gopi Krishna Chebiyyam System, method, and computer program product for preventing access to data with respect to a data access attempt associated with a remote data sharing session
US8117223B2 (en) * 2007-09-07 2012-02-14 Google Inc. Integrating external related phrase information into a phrase-based indexing information retrieval system
DE102007045909A1 (de) * 2007-09-26 2009-08-06 T-Mobile Internationale Ag Verfahren zum Schutz vor Viren/Spam in Mobilfunknetzen
US20090089859A1 (en) * 2007-09-28 2009-04-02 Cook Debra L Method and apparatus for detecting phishing attempts solicited by electronic mail
US8446607B2 (en) * 2007-10-01 2013-05-21 Mcafee, Inc. Method and system for policy based monitoring and blocking of printing activities on local and network printers
US8185930B2 (en) 2007-11-06 2012-05-22 Mcafee, Inc. Adjusting filter or classification control settings
CN101163161B (zh) * 2007-11-07 2012-02-29 福建星网锐捷网络有限公司 统一资源定位器地址过滤方法及中间传输设备
US8479284B1 (en) * 2007-12-20 2013-07-02 Symantec Corporation Referrer context identification for remote object links
JP2009157510A (ja) * 2007-12-25 2009-07-16 Nec Corp スパム情報判別システム、スパム情報判別方法、およびスパム情報判別プログラム
ATE516655T1 (de) * 2007-12-31 2011-07-15 Telecom Italia Spa Verfahren zur detektion von anomalien in einem kommunikationssystem, das symbolische paketmerkmale verwendet
WO2009083022A1 (en) * 2007-12-31 2009-07-09 Telecom Italia S.P.A. Method of detecting anomalies in a communication system using numerical packet features
US20090171906A1 (en) * 2008-01-02 2009-07-02 Research In Motion Limited System and method for providing information relating to an email being provided to an electronic device
US20090216875A1 (en) * 2008-02-26 2009-08-27 Barracuda Inc. Filtering secure network messages without cryptographic processes method
US8370930B2 (en) * 2008-02-28 2013-02-05 Microsoft Corporation Detecting spam from metafeatures of an email message
US20090228438A1 (en) * 2008-03-07 2009-09-10 Anirban Dasgupta Method and Apparatus for Identifying if Two Websites are Co-Owned
US8107670B2 (en) * 2008-03-11 2012-01-31 Symantec Corporation Scanning images for pornography
US7996900B2 (en) 2008-03-14 2011-08-09 Microsoft Corporation Time travelling email messages after delivery
US8893285B2 (en) 2008-03-14 2014-11-18 Mcafee, Inc. Securing data using integrated host-based data loss agent with encryption detection
US20090240670A1 (en) * 2008-03-20 2009-09-24 Yahoo! Inc. Uniform resource identifier alignment
US8745731B2 (en) * 2008-04-03 2014-06-03 Microsoft Corporation Clustering botnet behavior using parameterized models
US8589503B2 (en) 2008-04-04 2013-11-19 Mcafee, Inc. Prioritizing network traffic
US8108323B2 (en) * 2008-05-19 2012-01-31 Yahoo! Inc. Distributed spam filtering utilizing a plurality of global classifiers and a local classifier
US8291054B2 (en) 2008-05-27 2012-10-16 International Business Machines Corporation Information processing system, method and program for classifying network nodes
JP5324824B2 (ja) * 2008-05-27 2013-10-23 インターナショナル・ビジネス・マシーンズ・コーポレーション ネットワーク・ノードを分類する情報処理装置、情報処理システム、情報処理方法およびプログラム
US20090300012A1 (en) * 2008-05-28 2009-12-03 Barracuda Inc. Multilevel intent analysis method for email filtration
US20090300127A1 (en) * 2008-06-03 2009-12-03 Qiang Du E-mail forwarding method and system
US8812377B2 (en) 2008-06-25 2014-08-19 Telefonaktiebolaget Lm Ericsson (Publ) Service brokering using domain name servers
US20090327849A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Link Classification and Filtering
CN102077201A (zh) 2008-06-30 2011-05-25 网圣公司 用于网页的动态及实时归类的系统及方法
US20100011420A1 (en) * 2008-07-02 2010-01-14 Barracuda Networks Inc. Operating a service on a network as a domain name system server
US8219644B2 (en) * 2008-07-03 2012-07-10 Barracuda Networks, Inc. Requesting a service or transmitting content as a domain name system resolver
US9077684B1 (en) 2008-08-06 2015-07-07 Mcafee, Inc. System, method, and computer program product for determining whether an electronic mail message is compliant with an etiquette policy
US10027688B2 (en) * 2008-08-11 2018-07-17 Damballa, Inc. Method and system for detecting malicious and/or botnet-related domain names
US20100042687A1 (en) * 2008-08-12 2010-02-18 Yahoo! Inc. System and method for combating phishing
US7818686B2 (en) 2008-09-04 2010-10-19 International Business Machines Corporation System and method for accelerated web page navigation using keyboard accelerators in a data processing system
US8826450B2 (en) * 2008-09-19 2014-09-02 Yahoo! Inc. Detecting bulk fraudulent registration of email accounts
US20100082749A1 (en) * 2008-09-26 2010-04-01 Yahoo! Inc Retrospective spam filtering
CN101364955B (zh) * 2008-09-28 2010-10-20 杭州电子科技大学 一种分析和提取电子邮件客户端证据的方法
US9070116B2 (en) * 2008-10-09 2015-06-30 At&T Mobility Ii Llc On-demand spam reporting
JP5366504B2 (ja) * 2008-11-05 2013-12-11 Kddi株式会社 メール受信サーバ、スパムメールの受信拒否方法およびプログラム
US8364765B2 (en) * 2008-11-13 2013-01-29 International Business Machines Corporation Prioritizing electronic messages based upon geographical location of the recipient
US8447856B2 (en) * 2008-11-25 2013-05-21 Barracuda Networks, Inc. Policy-managed DNS server for to control network traffic
US20100174829A1 (en) * 2009-01-06 2010-07-08 Barracuda Networks, Inc Apparatus for to provide content to and query a reverse domain name system server
US20100229236A1 (en) * 2009-02-08 2010-09-09 Rybak Michal Andrzej Method and system for spam reporting with a message portion
US8631080B2 (en) * 2009-03-12 2014-01-14 Microsoft Corporation Email characterization
US8166104B2 (en) * 2009-03-19 2012-04-24 Microsoft Corporation Client-centered usage classification
US9112850B1 (en) 2009-03-25 2015-08-18 The 41St Parameter, Inc. Systems and methods of sharing information through a tag-based consortium
US20100257035A1 (en) * 2009-04-07 2010-10-07 Microsoft Corporation Embedded content brokering and advertisement selection delegation
US20100262547A1 (en) * 2009-04-14 2010-10-14 Microsoft Corporation User information brokering
US20100281224A1 (en) * 2009-05-01 2010-11-04 International Buisness Machines Corporation Prefetching content from incoming messages
CN102598007B (zh) 2009-05-26 2017-03-01 韦伯森斯公司 有效检测采指纹数据和信息的系统和方法
US8549627B2 (en) * 2009-06-13 2013-10-01 Microsoft Corporation Detection of objectionable videos
US8925087B1 (en) * 2009-06-19 2014-12-30 Trend Micro Incorporated Apparatus and methods for in-the-cloud identification of spam and/or malware
US8959157B2 (en) * 2009-06-26 2015-02-17 Microsoft Corporation Real-time spam look-up system
JP2011034416A (ja) * 2009-08-04 2011-02-17 Kddi Corp 電子メール分類装置及び電子メール分類方法及び電子メール分類プログラム
JP2011034417A (ja) * 2009-08-04 2011-02-17 Kddi Corp 迷惑メール判定装置及び迷惑メール判定方法及び迷惑メール判定プログラム
CN102045667A (zh) * 2009-10-23 2011-05-04 中兴通讯股份有限公司 防范垃圾电子邮件的实现方法和系统
US8654655B2 (en) * 2009-12-17 2014-02-18 Thomson Licensing Detecting and classifying anomalies in communication networks
US8578497B2 (en) 2010-01-06 2013-11-05 Damballa, Inc. Method and system for detecting malware
US8826438B2 (en) 2010-01-19 2014-09-02 Damballa, Inc. Method and system for network-based detecting of malware from behavioral clustering
US8316094B1 (en) * 2010-01-21 2012-11-20 Symantec Corporation Systems and methods for identifying spam mailing lists
US9838349B2 (en) 2010-03-08 2017-12-05 Microsoft Technology Licensing, Llc Zone classification of electronic mail messages
US20110225076A1 (en) * 2010-03-09 2011-09-15 Google Inc. Method and system for detecting fraudulent internet merchants
US9652802B1 (en) 2010-03-24 2017-05-16 Consumerinfo.Com, Inc. Indirect monitoring and reporting of a user's credit data
US9049247B2 (en) 2010-04-01 2015-06-02 Cloudfare, Inc. Internet-based proxy service for responding to server offline errors
US8751633B2 (en) 2010-04-01 2014-06-10 Cloudflare, Inc. Recording internet visitor threat information through an internet-based proxy service
US8086684B2 (en) 2010-04-20 2011-12-27 The Go Daddy Group, Inc. Detecting and mitigating undeliverable email
US8621638B2 (en) 2010-05-14 2013-12-31 Mcafee, Inc. Systems and methods for classification of messaging entities
US20110289434A1 (en) * 2010-05-20 2011-11-24 Barracuda Networks, Inc. Certified URL checking, caching, and categorization service
US8707420B2 (en) * 2010-05-21 2014-04-22 Microsoft Corporation Trusted e-mail communication in a multi-tenant environment
EP2593873B1 (en) * 2010-07-16 2022-08-10 First Wave Technology Pty Ltd Methods and systems for analysis and/or classification of information
US9516058B2 (en) 2010-08-10 2016-12-06 Damballa, Inc. Method and system for determining whether domain names are legitimate or malicious
WO2012033563A1 (en) 2010-09-10 2012-03-15 Darren Gardner System and method for providing a plurality of prioritised email domain names
US8498998B2 (en) * 2010-10-11 2013-07-30 International Business Machines Corporation Grouping identity records to generate candidate lists to use in an entity and relationship resolution process
US9148432B2 (en) * 2010-10-12 2015-09-29 Microsoft Technology Licensing, Llc Range weighted internet protocol address blacklist
US8396876B2 (en) 2010-11-30 2013-03-12 Yahoo! Inc. Identifying reliable and authoritative sources of multimedia content
US8695092B2 (en) 2010-12-06 2014-04-08 Microsoft Corporation Host IP reputation
US8885931B2 (en) * 2011-01-26 2014-11-11 Microsoft Corporation Mitigating use of machine solvable HIPs
US9461878B1 (en) 2011-02-01 2016-10-04 Palo Alto Networks, Inc. Blocking download of content
US8631489B2 (en) 2011-02-01 2014-01-14 Damballa, Inc. Method and system for detecting malicious domain names at an upper DNS hierarchy
US8554907B1 (en) * 2011-02-15 2013-10-08 Trend Micro, Inc. Reputation prediction of IP addresses
EP2676197B1 (en) 2011-02-18 2018-11-28 CSidentity Corporation System and methods for identifying compromised personally identifiable information on the internet
US8626856B2 (en) * 2011-04-11 2014-01-07 Microsoft Corporation Geo-data spam filter
RU2453916C1 (ru) * 2011-05-05 2012-06-20 Игорь Викторович Лебедев Способ поиска информационных ресурсов с использованием переадресаций
US9117074B2 (en) 2011-05-18 2015-08-25 Microsoft Technology Licensing, Llc Detecting a compromised online user account
US8285808B1 (en) 2011-05-20 2012-10-09 Cloudflare, Inc. Loading of web resources
US8621556B1 (en) * 2011-05-25 2013-12-31 Palo Alto Networks, Inc. Dynamic resolution of fully qualified domain name (FQDN) address objects in policy definitions
US9087324B2 (en) 2011-07-12 2015-07-21 Microsoft Technology Licensing, Llc Message categorization
US9065826B2 (en) 2011-08-08 2015-06-23 Microsoft Technology Licensing, Llc Identifying application reputation based on resource accesses
US9442881B1 (en) 2011-08-31 2016-09-13 Yahoo! Inc. Anti-spam transient entity classification
US11030562B1 (en) 2011-10-31 2021-06-08 Consumerinfo.Com, Inc. Pre-data breach monitoring
US10754913B2 (en) 2011-11-15 2020-08-25 Tapad, Inc. System and method for analyzing user device information
US8954492B1 (en) * 2011-11-30 2015-02-10 F5 Networks, Inc. Methods for inlining content externally referenced in a web page prior to providing the web page to a requestor and devices thereof
KR101253616B1 (ko) * 2011-12-09 2013-04-11 한국인터넷진흥원 네트워크 경로 추적 장치 및 방법
US9633201B1 (en) 2012-03-01 2017-04-25 The 41St Parameter, Inc. Methods and systems for fraud containment
US8819227B1 (en) * 2012-03-19 2014-08-26 Narus, Inc. Discerning web content and services based on real-time DNS tagging
US9521551B2 (en) 2012-03-22 2016-12-13 The 41St Parameter, Inc. Methods and systems for persistent cross-application mobile device identification
TWI478561B (zh) * 2012-04-05 2015-03-21 Inst Information Industry 網域追蹤方法與系統及其電腦可讀取記錄媒體
US8396935B1 (en) * 2012-04-10 2013-03-12 Google Inc. Discovering spam merchants using product feed similarity
EP2880619A1 (en) 2012-08-02 2015-06-10 The 41st Parameter, Inc. Systems and methods for accessing records via derivative locators
US10547674B2 (en) 2012-08-27 2020-01-28 Help/Systems, Llc Methods and systems for network flow analysis
US10084806B2 (en) 2012-08-31 2018-09-25 Damballa, Inc. Traffic simulation to identify malicious activity
US9166994B2 (en) 2012-08-31 2015-10-20 Damballa, Inc. Automation discovery to identify malicious activity
US9680861B2 (en) 2012-08-31 2017-06-13 Damballa, Inc. Historical analysis to identify malicious activity
US9894088B2 (en) 2012-08-31 2018-02-13 Damballa, Inc. Data mining to identify malicious activity
US8667074B1 (en) * 2012-09-11 2014-03-04 Bradford L. Farkas Systems and methods for email tracking and email spam reduction using dynamic email addressing schemes
US8898272B1 (en) 2012-10-02 2014-11-25 Amazon Technologies, Inc. Identifying information in resource locators
US9326218B2 (en) 2012-11-02 2016-04-26 Telefonaktiebolaget L M Ericsson (Publ) Base-station-to-base-station gateway and related devices, methods, and systems
WO2014078569A1 (en) 2012-11-14 2014-05-22 The 41St Parameter, Inc. Systems and methods of global identification
US9241259B2 (en) 2012-11-30 2016-01-19 Websense, Inc. Method and apparatus for managing the transfer of sensitive information to mobile devices
US9531736B1 (en) 2012-12-24 2016-12-27 Narus, Inc. Detecting malicious HTTP redirections using user browsing activity trees
US9027128B1 (en) * 2013-02-07 2015-05-05 Trend Micro Incorporated Automatic identification of malicious budget codes and compromised websites that are employed in phishing attacks
US8812387B1 (en) 2013-03-14 2014-08-19 Csidentity Corporation System and method for identifying related credit inquiries
CN103179024B (zh) * 2013-03-18 2016-01-20 北京二六三企业通信有限公司 邮件过滤方法及装置
CN103198396A (zh) * 2013-03-28 2013-07-10 南通大学 基于社会网络行为特征的邮件分类方法
US9571511B2 (en) 2013-06-14 2017-02-14 Damballa, Inc. Systems and methods for traffic classification
ITTO20130513A1 (it) * 2013-06-21 2014-12-22 Sisvel Technology Srl Sistema e metodo per il filtraggio di messaggi elettronici
US9811830B2 (en) 2013-07-03 2017-11-07 Google Inc. Method, medium, and system for online fraud prevention based on user physical location data
US9258260B2 (en) 2013-08-19 2016-02-09 Microsoft Technology Licensing, Llc Filtering electronic messages based on domain attributes without reputation
US10902327B1 (en) 2013-08-30 2021-01-26 The 41St Parameter, Inc. System and method for device identification and uniqueness
RU2595533C2 (ru) * 2013-10-02 2016-08-27 Общество С Ограниченной Ответственностью "Яндекс" Система отображения почтовых вложений на странице веб-почты
US9239737B2 (en) 2013-11-15 2016-01-19 Sap Se Concise resource addressing
CN103634422B (zh) * 2013-11-29 2017-03-08 北京奇安信科技有限公司 一种cdn源站的ip地址识别方法及装置
US11568280B1 (en) * 2019-01-23 2023-01-31 Amdocs Development Limited System, method, and computer program for parental controls and recommendations based on artificial intelligence
US10778618B2 (en) * 2014-01-09 2020-09-15 Oath Inc. Method and system for classifying man vs. machine generated e-mail
JP5986338B2 (ja) * 2014-03-13 2016-09-06 日本電信電話株式会社 監視装置、監視方法、および、監視プログラム
KR101561289B1 (ko) 2014-03-13 2015-10-16 (주)코리아센터닷컴 메시지 편집 장치
US10079791B2 (en) * 2014-03-14 2018-09-18 Xpedite Systems, Llc Systems and methods for domain- and auto-registration
US20180053114A1 (en) 2014-10-23 2018-02-22 Brighterion, Inc. Artificial intelligence for context classifier
US10896421B2 (en) 2014-04-02 2021-01-19 Brighterion, Inc. Smart retail analytics and commercial messaging
US9928465B2 (en) * 2014-05-20 2018-03-27 Oath Inc. Machine learning and validation of account names, addresses, and/or identifiers
US10027702B1 (en) 2014-06-13 2018-07-17 Trend Micro Incorporated Identification of malicious shortened uniform resource locators
US10078750B1 (en) 2014-06-13 2018-09-18 Trend Micro Incorporated Methods and systems for finding compromised social networking accounts
US9571452B2 (en) * 2014-07-01 2017-02-14 Sophos Limited Deploying a security policy based on domain names
US11838851B1 (en) 2014-07-15 2023-12-05 F5, Inc. Methods for managing L7 traffic classification and devices thereof
US9280661B2 (en) 2014-08-08 2016-03-08 Brighterion, Inc. System administrator behavior analysis
US20150339673A1 (en) 2014-10-28 2015-11-26 Brighterion, Inc. Method for detecting merchant data breaches with a computer network server
US20160055427A1 (en) 2014-10-15 2016-02-25 Brighterion, Inc. Method for providing data science, artificial intelligence and machine learning as-a-service
US20150032589A1 (en) 2014-08-08 2015-01-29 Brighterion, Inc. Artificial intelligence fraud management solution
US20150066771A1 (en) 2014-08-08 2015-03-05 Brighterion, Inc. Fast access vectors in real-time behavioral profiling
US9560074B2 (en) * 2014-10-07 2017-01-31 Cloudmark, Inc. Systems and methods of identifying suspicious hostnames
US10091312B1 (en) 2014-10-14 2018-10-02 The 41St Parameter, Inc. Data structures for intelligently resolving deterministic and probabilistic device identifiers to device profiles and/or groups
US11080709B2 (en) 2014-10-15 2021-08-03 Brighterion, Inc. Method of reducing financial losses in multiple payment channels upon a recognition of fraud first appearing in any one payment channel
US20160071017A1 (en) 2014-10-15 2016-03-10 Brighterion, Inc. Method of operating artificial intelligence machines to improve predictive model training and performance
US20160063502A1 (en) 2014-10-15 2016-03-03 Brighterion, Inc. Method for improving operating profits with better automated decision making with artificial intelligence
US20160078367A1 (en) 2014-10-15 2016-03-17 Brighterion, Inc. Data clean-up method for improving predictive model training
US10546099B2 (en) 2014-10-15 2020-01-28 Brighterion, Inc. Method of personalizing, individualizing, and automating the management of healthcare fraud-waste-abuse to unique individual healthcare providers
US10290001B2 (en) 2014-10-28 2019-05-14 Brighterion, Inc. Data breach detection
US10339527B1 (en) 2014-10-31 2019-07-02 Experian Information Solutions, Inc. System and architecture for electronic fraud detection
TWI544764B (zh) 2014-11-17 2016-08-01 緯創資通股份有限公司 垃圾郵件判定方法及其郵件伺服器
RU2580424C1 (ru) * 2014-11-28 2016-04-10 Общество С Ограниченной Ответственностью "Яндекс" Способ выявления незначащих лексических единиц в текстовом сообщении и компьютер
US10182013B1 (en) 2014-12-01 2019-01-15 F5 Networks, Inc. Methods for managing progressive image delivery and devices thereof
US20200067861A1 (en) * 2014-12-09 2020-02-27 ZapFraud, Inc. Scam evaluation system
US11895138B1 (en) 2015-02-02 2024-02-06 F5, Inc. Methods for improving web scanner accuracy and devices thereof
US10701085B2 (en) * 2015-03-05 2020-06-30 Nippon Telegraph And Telephone Corporation Communication partner malignancy calculation device, communication partner malignancy calculation method, and communication partner malignancy calculation program
US9930065B2 (en) 2015-03-25 2018-03-27 University Of Georgia Research Foundation, Inc. Measuring, categorizing, and/or mitigating malware distribution paths
US9736185B1 (en) 2015-04-21 2017-08-15 Infoblox Inc. DNS or network metadata policy for network control
US9521157B1 (en) * 2015-06-24 2016-12-13 Bank Of America Corporation Identifying and assessing malicious resources
US11151468B1 (en) 2015-07-02 2021-10-19 Experian Information Solutions, Inc. Behavior analysis using distributed representations of event data
US10671915B2 (en) 2015-07-31 2020-06-02 Brighterion, Inc. Method for calling for preemptive maintenance and for equipment failure prevention
US9762542B2 (en) * 2015-08-04 2017-09-12 Farsight Security, Inc. Parallel detection of updates to a domain name system record system using a common filter
US10057198B1 (en) 2015-11-05 2018-08-21 Trend Micro Incorporated Controlling social network usage in enterprise environments
US10305839B2 (en) * 2015-11-17 2019-05-28 Clover Leaf Environmental Solutions, Inc. Electronic information system enabling email-based transactions with forms
US11856260B2 (en) * 2016-03-30 2023-12-26 Covenant Eyes, Inc. Applications, systems and methods to monitor, filter and/or alter output of a computing device
CN107294834A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 一种识别垃圾邮件的方法和装置
CN105912674A (zh) * 2016-04-13 2016-08-31 精硕世纪科技(北京)有限公司 数据降噪及分类方法、装置及系统
CN106028297B (zh) * 2016-04-28 2019-11-08 北京小米移动软件有限公司 携带网址的短信处理方法及装置
US10397256B2 (en) * 2016-06-13 2019-08-27 Microsoft Technology Licensing, Llc Spam classification system based on network flow data
EP3297221B1 (en) 2016-09-19 2018-11-14 retarus GmbH Technique for detecting suspicious electronic messages
US10313348B2 (en) * 2016-09-19 2019-06-04 Fortinet, Inc. Document classification by a hybrid classifier
US10346223B1 (en) * 2016-11-23 2019-07-09 Google Llc Selective obfuscation of notifications
US10284579B2 (en) * 2017-03-22 2019-05-07 Vade Secure, Inc. Detection of email spoofing and spear phishing attacks
EP3389237B1 (de) * 2017-04-10 2019-04-03 ise Individuelle Software und Elektronik GmbH Verfahren, vorrichtung, computerlesbares medium und system zum aufbau von verbindungen zwischen einem client und einem ziel- oder endgerät
US11757914B1 (en) * 2017-06-07 2023-09-12 Agari Data, Inc. Automated responsive message to determine a security risk of a message sender
US10805259B2 (en) 2017-06-30 2020-10-13 Microsoft Technology Licensing, Llc Geolocation using reverse domain name server information
CN109218162B (zh) * 2017-07-05 2021-04-27 北京二六三企业通信有限公司 邮件投递方法及装置
US10708297B2 (en) 2017-08-25 2020-07-07 Ecrime Management Strategies, Inc. Security system for detection and mitigation of malicious communications
US10778717B2 (en) 2017-08-31 2020-09-15 Barracuda Networks, Inc. System and method for email account takeover detection and remediation
US11665195B2 (en) 2017-08-31 2023-05-30 Barracuda Networks, Inc. System and method for email account takeover detection and remediation utilizing anonymized datasets
US11563757B2 (en) 2017-08-31 2023-01-24 Barracuda Networks, Inc. System and method for email account takeover detection and remediation utilizing AI models
US10891373B2 (en) * 2017-08-31 2021-01-12 Micro Focus Llc Quarantining electronic messages based on relationships among associated addresses
JP6698952B2 (ja) * 2017-09-14 2020-05-27 三菱電機株式会社 メール検査装置、メール検査方法およびメール検査プログラム
US10699028B1 (en) 2017-09-28 2020-06-30 Csidentity Corporation Identity security architecture systems and methods
US10896472B1 (en) 2017-11-14 2021-01-19 Csidentity Corporation Security and identity verification system and architecture
RU2672616C1 (ru) * 2017-11-22 2018-11-16 Акционерное общество "МаксимаТелеком" Комплекс и способ для предотвращения блокировки рекламного контента
US11044213B2 (en) * 2017-12-19 2021-06-22 Nice Ltd. Systems and methods for invisible identification of agents participating in on-line communication sessions
US20190342297A1 (en) 2018-05-01 2019-11-07 Brighterion, Inc. Securing internet-of-things with smart-agent technology
EP3614280A1 (de) * 2018-08-20 2020-02-26 Siemens Aktiengesellschaft Bestimmen eines ergebniswerts einer uniform resource identifier-, uri, zeichenfolge
US10965691B1 (en) * 2018-09-28 2021-03-30 Verizon Media Inc. Systems and methods for establishing sender-level trust in communications using sender-recipient pair data
US11431738B2 (en) 2018-12-19 2022-08-30 Abnormal Security Corporation Multistage analysis of emails to identify security threats
US11824870B2 (en) 2018-12-19 2023-11-21 Abnormal Security Corporation Threat detection platforms for detecting, characterizing, and remediating email-based threats in real time
US11050793B2 (en) 2018-12-19 2021-06-29 Abnormal Security Corporation Retrospective learning of communication patterns by machine learning models for discovering abnormal behavior
US10686826B1 (en) * 2019-03-28 2020-06-16 Vade Secure Inc. Optical scanning parameters computation methods, devices and systems for malicious URL detection
WO2021025785A1 (en) * 2019-08-07 2021-02-11 Acxiom Llc System and method for ethical collection of data
US11710137B2 (en) 2019-08-23 2023-07-25 Yandex Europe Ag Method and system for identifying electronic devices of genuine customers of organizations
US11411919B2 (en) 2019-10-01 2022-08-09 EXFO Solutions SAS Deep packet inspection application classification systems and methods
CN111046283A (zh) * 2019-12-04 2020-04-21 深圳前海微众银行股份有限公司 特征选择方法、装置、设备及存储介质
RU2752241C2 (ru) 2019-12-25 2021-07-23 Общество С Ограниченной Ответственностью «Яндекс» Способ и система для выявления вредоносной активности предопределенного типа в локальной сети
US11050879B1 (en) * 2019-12-31 2021-06-29 First Orion Corp. Call traffic data monitoring and management
CN110874531B (zh) * 2020-01-20 2020-07-10 湖南蚁坊软件股份有限公司 一种话题分析方法、装置和存储介质
US11784948B2 (en) * 2020-01-29 2023-10-10 International Business Machines Corporation Cognitive determination of message suitability
US11252189B2 (en) 2020-03-02 2022-02-15 Abnormal Security Corporation Abuse mailbox for facilitating discovery, investigation, and analysis of email-based threats
WO2021178423A1 (en) 2020-03-02 2021-09-10 Abnormal Security Corporation Multichannel threat detection for protecting against account compromise
US10945051B1 (en) 2020-04-06 2021-03-09 Bank Of America Corporation System and method for intentionally distorting digital media to reduce the accuracy of generative machine learning algorithms
WO2021217049A1 (en) 2020-04-23 2021-10-28 Abnormal Security Corporation Detection and prevention of external fraud
US11108714B1 (en) * 2020-07-29 2021-08-31 Vmware, Inc. Integration of an email client with hosted applications
KR102527260B1 (ko) * 2020-09-15 2023-04-27 주식회사 카카오 스팸 url을 판단하는 방법 및 시스템
US11563659B2 (en) 2020-10-13 2023-01-24 Vmware, Inc. Edge alert coordinator for mobile devices
US11528242B2 (en) * 2020-10-23 2022-12-13 Abnormal Security Corporation Discovering graymail through real-time analysis of incoming email
US11687648B2 (en) 2020-12-10 2023-06-27 Abnormal Security Corporation Deriving and surfacing insights regarding security threats
CN112733898A (zh) * 2020-12-30 2021-04-30 光通天下网络科技股份有限公司 基于特征权重的数据鉴别方法、装置、电子设备及介质
US11882131B1 (en) * 2020-12-31 2024-01-23 Proofpoint, Inc. Systems and methods for prioritizing URL review for sandboxing based on accelerated velocities of URL features in network traffic
US11277375B1 (en) * 2021-01-04 2022-03-15 Saudi Arabian Oil Company Sender policy framework (SPF) configuration validator and security examinator
US11570149B2 (en) 2021-03-30 2023-01-31 Palo Alto Networks, Inc. Feedback mechanism to enforce a security policy
US11831661B2 (en) 2021-06-03 2023-11-28 Abnormal Security Corporation Multi-tiered approach to payload detection for incoming communications
US11829423B2 (en) * 2021-06-25 2023-11-28 Microsoft Technology Licensing, Llc Determining that a resource is spam based upon a uniform resource locator of the webpage
TWI774582B (zh) 2021-10-13 2022-08-11 財團法人工業技術研究院 惡意超文本傳輸協定請求的偵測裝置和偵測方法
WO2023096964A1 (en) * 2021-11-23 2023-06-01 Insurance Services Office, Inc. Systems and methods for automatic url identification from data
US20230336571A1 (en) * 2022-04-19 2023-10-19 Akamai Technologies, Inc. Real-time detection and prevention of online new-account creation fraud and abuse
KR102472447B1 (ko) * 2022-06-13 2022-11-30 (주)유알피시스템 머신러닝을 이용한 복합 문서내 특정 콘텐츠 자동 차단 시스템 및 방법

Family Cites Families (153)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8918553D0 (en) 1989-08-15 1989-09-27 Digital Equipment Int Message control system
US5758257A (en) 1994-11-29 1998-05-26 Herz; Frederick System and method for scheduling broadcast of and access to video programs and other data using customer profiles
US5619648A (en) 1994-11-30 1997-04-08 Lucent Technologies Inc. Message filtering techniques
US5638487A (en) 1994-12-30 1997-06-10 Purespeech, Inc. Automatic speech recognition
WO1996035994A1 (en) 1995-05-08 1996-11-14 Compuserve Incorporated Rules based electronic message management system
US5845077A (en) 1995-11-27 1998-12-01 Microsoft Corporation Method and system for identifying and obtaining computer software from a remote computer
US6101531A (en) 1995-12-19 2000-08-08 Motorola, Inc. System for communicating user-selected criteria filter prepared at wireless client to communication server for filtering data transferred from host to said wireless client
US5704017A (en) 1996-02-16 1997-12-30 Microsoft Corporation Collaborative filtering utilizing a belief network
US5884033A (en) 1996-05-15 1999-03-16 Spyglass, Inc. Internet filtering system for filtering data transferred over the internet utilizing immediate and deferred filtering actions
US6151643A (en) 1996-06-07 2000-11-21 Networks Associates, Inc. Automatic updating of diverse software products on multiple client computer systems by downloading scanning application to client computer and generating software list on client computer
US6453327B1 (en) 1996-06-10 2002-09-17 Sun Microsystems, Inc. Method and apparatus for identifying and discarding junk electronic mail
US6072942A (en) 1996-09-18 2000-06-06 Secure Computing Corporation System and method of electronic mail filtering using interconnected nodes
DE69607166T2 (de) * 1996-10-15 2000-12-14 St Microelectronics Srl Elektronische Anordnung zur Durchführung von Konvolutionsoperationen
US5905859A (en) 1997-01-09 1999-05-18 International Business Machines Corporation Managed network device security method and apparatus
US5805801A (en) 1997-01-09 1998-09-08 International Business Machines Corporation System and method for detecting and preventing security
US6122657A (en) 1997-02-04 2000-09-19 Networks Associates, Inc. Internet computer system with methods for dynamic filtering of hypertext tags and content
US6742047B1 (en) 1997-03-27 2004-05-25 Intel Corporation Method and apparatus for dynamically filtering network content
DE69724235T2 (de) 1997-05-28 2004-02-26 Siemens Ag Computersystem und Verfahren zum Schutz von Software
US7117358B2 (en) 1997-07-24 2006-10-03 Tumbleweed Communications Corp. Method and system for filtering communication
US20050081059A1 (en) * 1997-07-24 2005-04-14 Bandini Jean-Christophe Denis Method and system for e-mail filtering
US6199102B1 (en) 1997-08-26 2001-03-06 Christopher Alan Cobb Method and system for filtering electronic messages
US6041324A (en) 1997-11-17 2000-03-21 International Business Machines Corporation System and method for identifying valid portion of computer resource identifier
RU2127959C1 (ru) 1997-11-17 1999-03-20 Борис Семенович Пинскер Способ исключения нежелательной информации в режиме приема программ телевизионным приемником и устройство для его осуществления
US6003027A (en) 1997-11-21 1999-12-14 International Business Machines Corporation System and method for determining confidence levels for the results of a categorization system
US6393465B2 (en) 1997-11-25 2002-05-21 Nixmail Corporation Junk electronic mail detector and eliminator
US6351740B1 (en) * 1997-12-01 2002-02-26 The Board Of Trustees Of The Leland Stanford Junior University Method and system for training dynamic nonlinear adaptive filters which have embedded memory
US6023723A (en) 1997-12-22 2000-02-08 Accepted Marketing, Inc. Method and system for filtering unwanted junk e-mail utilizing a plurality of filtering mechanisms
WO1999032985A1 (en) 1997-12-22 1999-07-01 Accepted Marketing, Inc. E-mail filter and method thereof
US6052709A (en) * 1997-12-23 2000-04-18 Bright Light Technologies, Inc. Apparatus and method for controlling delivery of unsolicited electronic mail
GB2334116A (en) 1998-02-04 1999-08-11 Ibm Scheduling and dispatching queued client requests within a server computer
US6484261B1 (en) 1998-02-17 2002-11-19 Cisco Technology, Inc. Graphical network security policy management
US6504941B2 (en) 1998-04-30 2003-01-07 Hewlett-Packard Company Method and apparatus for digital watermarking of images
US6314421B1 (en) 1998-05-12 2001-11-06 David M. Sharnoff Method and apparatus for indexing documents for message filtering
US6074942A (en) * 1998-06-03 2000-06-13 Worldwide Semiconductor Manufacturing Corporation Method for forming a dual damascene contact and interconnect
US6308273B1 (en) 1998-06-12 2001-10-23 Microsoft Corporation Method and system of security location discrimination
US6192360B1 (en) 1998-06-23 2001-02-20 Microsoft Corporation Methods and apparatus for classifying text and for building a text classifier
US6161130A (en) 1998-06-23 2000-12-12 Microsoft Corporation Technique which utilizes a probabilistic classifier to detect "junk" e-mail by automatically updating a training and re-training the classifier based on the updated training set
US7275082B2 (en) * 1998-07-15 2007-09-25 Pang Stephen Y F System for policing junk e-mail messages
US6167434A (en) 1998-07-15 2000-12-26 Pang; Stephen Y. Computer code for removing junk e-mail messages
US6112227A (en) 1998-08-06 2000-08-29 Heiner; Jeffrey Nelson Filter-in method for reducing junk e-mail
US6434600B2 (en) 1998-09-15 2002-08-13 Microsoft Corporation Methods and systems for securely delivering electronic mail to hosts having dynamic IP addresses
US6732273B1 (en) 1998-10-21 2004-05-04 Lucent Technologies Inc. Priority and security coding system for electronic mail messages
GB2343529B (en) 1998-11-07 2003-06-11 Ibm Filtering incoming e-mail
US6546416B1 (en) 1998-12-09 2003-04-08 Infoseek Corporation Method and system for selectively blocking delivery of bulk electronic mail
US6643686B1 (en) * 1998-12-18 2003-11-04 At&T Corp. System and method for counteracting message filtering
US6615242B1 (en) 1998-12-28 2003-09-02 At&T Corp. Automatic uniform resource locator-based message filter
US6654787B1 (en) 1998-12-31 2003-11-25 Brightmail, Incorporated Method and apparatus for filtering e-mail
US6266692B1 (en) 1999-01-04 2001-07-24 International Business Machines Corporation Method for blocking all unwanted e-mail (SPAM) using a header-based password
US6330590B1 (en) 1999-01-05 2001-12-11 William D. Cotten Preventing delivery of unwanted bulk e-mail
US6424997B1 (en) 1999-01-27 2002-07-23 International Business Machines Corporation Machine learning based electronic messaging system
US6449634B1 (en) 1999-01-29 2002-09-10 Digital Impact, Inc. Method and system for remotely sensing the file formats processed by an E-mail client
US6477551B1 (en) 1999-02-16 2002-11-05 International Business Machines Corporation Interactive electronic messaging system
US7032030B1 (en) 1999-03-11 2006-04-18 John David Codignotto Message publishing system and method
US6732149B1 (en) 1999-04-09 2004-05-04 International Business Machines Corporation System and method for hindering undesired transmission or receipt of electronic messages
US6370526B1 (en) 1999-05-18 2002-04-09 International Business Machines Corporation Self-adaptive method and system for providing a user-preferred ranking order of object sets
US6592627B1 (en) 1999-06-10 2003-07-15 International Business Machines Corporation System and method for organizing repositories of semi-structured documents such as email
EP1232431A4 (en) * 1999-09-01 2005-06-08 Peter L Katsikas UNAUTHORIZED ELECTRONIC MAIL REMOVAL SYSTEM
US6449636B1 (en) 1999-09-08 2002-09-10 Nortel Networks Limited System and method for creating a dynamic data file from collected and filtered web pages
US6321267B1 (en) 1999-11-23 2001-11-20 Escom Corporation Method and apparatus for filtering junk email
US6728690B1 (en) 1999-11-23 2004-04-27 Microsoft Corporation Classification system trainer employing maximum margin back-propagation with probabilistic outputs
US6915344B1 (en) * 1999-11-30 2005-07-05 Microsoft Corporation Server stress-testing response verification
US6633855B1 (en) 2000-01-06 2003-10-14 International Business Machines Corporation Method, system, and program for filtering content using neural networks
US6701440B1 (en) 2000-01-06 2004-03-02 Networks Associates Technology, Inc. Method and system for protecting a computer using a remote e-mail scanning device
US7822977B2 (en) 2000-02-08 2010-10-26 Katsikas Peter L System for eliminating unauthorized electronic mail
US6438584B1 (en) * 2000-03-07 2002-08-20 Letter Services, Inc. Automatic generation of graphically-composed correspondence via a text email-interface
US6691156B1 (en) 2000-03-10 2004-02-10 International Business Machines Corporation Method for restricting delivery of unsolicited E-mail
US6684201B1 (en) 2000-03-31 2004-01-27 Microsoft Corporation Linguistic disambiguation system and method using string-based pattern training to learn to resolve ambiguity sites
US7210099B2 (en) 2000-06-12 2007-04-24 Softview Llc Resolution independent vector display of internet content
US20040073617A1 (en) 2000-06-19 2004-04-15 Milliken Walter Clark Hash-based systems and methods for detecting and preventing transmission of unwanted e-mail
US6990513B2 (en) 2000-06-22 2006-01-24 Microsoft Corporation Distributed computing services platform
US7003555B1 (en) * 2000-06-23 2006-02-21 Cloudshield Technologies, Inc. Apparatus and method for domain name resolution
TW533702B (en) * 2000-07-28 2003-05-21 Wistron Corp Network communication system and dynamic message routing method therefor
US6779021B1 (en) 2000-07-28 2004-08-17 International Business Machines Corporation Method and system for predicting and managing undesirable electronic mail
US6842773B1 (en) 2000-08-24 2005-01-11 Yahoo ! Inc. Processing of textual electronic communication distributed in bulk
US6757830B1 (en) 2000-10-03 2004-06-29 Networks Associates Technology, Inc. Detecting unwanted properties in received email messages
US6971023B1 (en) 2000-10-03 2005-11-29 Mcafee, Inc. Authorizing an additional computer program module for use with a core computer program
US6748422B2 (en) 2000-10-19 2004-06-08 Ebay Inc. System and method to control sending of unsolicited communications relating to a plurality of listings in a network-based commerce facility
US7243125B2 (en) 2000-12-08 2007-07-10 Xerox Corporation Method and apparatus for presenting e-mail threads as semi-connected text by removing redundant material
JP3554271B2 (ja) 2000-12-13 2004-08-18 パナソニック コミュニケーションズ株式会社 情報通信装置
US6775704B1 (en) 2000-12-28 2004-08-10 Networks Associates Technology, Inc. System and method for preventing a spoofed remote procedure call denial of service attack in a networked computing environment
US20050159136A1 (en) * 2000-12-29 2005-07-21 Andrew Rouse System and method for providing wireless device access
US20020129111A1 (en) * 2001-01-15 2002-09-12 Cooper Gerald M. Filtering unsolicited email
US6941466B2 (en) * 2001-02-22 2005-09-06 International Business Machines Corporation Method and apparatus for providing automatic e-mail filtering based on message semantics, sender's e-mail ID, and user's identity
US20020124025A1 (en) 2001-03-01 2002-09-05 International Business Machines Corporataion Scanning and outputting textual information in web page images
GB2373130B (en) 2001-03-05 2004-09-22 Messagelabs Ltd Method of,and system for,processing email in particular to detect unsolicited bulk email
US6928465B2 (en) 2001-03-16 2005-08-09 Wells Fargo Bank, N.A. Redundant email address detection and capture system
US6751348B2 (en) 2001-03-29 2004-06-15 Fotonation Holdings, Llc Automated detection of pornographic images
US8949878B2 (en) 2001-03-30 2015-02-03 Funai Electric Co., Ltd. System for parental control in video programs based on multimedia content information
US6920477B2 (en) 2001-04-06 2005-07-19 President And Fellows Of Harvard College Distributed, compressed Bloom filter Web cache server
US7188106B2 (en) 2001-05-01 2007-03-06 International Business Machines Corporation System and method for aggregating ranking results from various sources to improve the results of web searching
US8095597B2 (en) 2001-05-01 2012-01-10 Aol Inc. Method and system of automating data capture from electronic correspondence
US7103599B2 (en) 2001-05-15 2006-09-05 Verizon Laboratories Inc. Parsing of nested internet electronic mail documents
US6768991B2 (en) 2001-05-15 2004-07-27 Networks Associates Technology, Inc. Searching for sequences of character data
US20030009698A1 (en) * 2001-05-30 2003-01-09 Cascadezone, Inc. Spam avenger
US7502829B2 (en) 2001-06-21 2009-03-10 Cybersoft, Inc. Apparatus, methods and articles of manufacture for intercepting, examining and controlling code, data and files and their transfer
US7328250B2 (en) 2001-06-29 2008-02-05 Nokia, Inc. Apparatus and method for handling electronic mail
US20030009495A1 (en) 2001-06-29 2003-01-09 Akli Adjaoute Systems and methods for filtering electronic content
TW533380B (en) 2001-07-23 2003-05-21 Ulead Systems Inc Group image detecting method
US6769016B2 (en) * 2001-07-26 2004-07-27 Networks Associates Technology, Inc. Intelligent SPAM detection system using an updateable neural analysis engine
US7146402B2 (en) 2001-08-31 2006-12-05 Sendmail, Inc. E-mail system providing filtering methodology on a per-domain basis
KR100369282B1 (ko) 2001-09-28 2003-01-24 주식회사 케이티 가상 전자우편주소를 이용한 스팸메일 방지 서비스 시스템및 그 방법
JP3590936B2 (ja) 2001-10-06 2004-11-17 テラス テクノロジーズ,インコーポレイテッド 動的ipフィルタリングモジュールを有する電子メールサービスシステム及び動的ipアドレスフィルタリング方法
US20060036701A1 (en) * 2001-11-20 2006-02-16 Bulfer Andrew F Messaging system having message filtering and access control
US8561167B2 (en) * 2002-03-08 2013-10-15 Mcafee, Inc. Web reputation scoring
JP2003263391A (ja) 2002-03-11 2003-09-19 Nec Corp 迷惑メールのフィルタリング方式
US6785820B1 (en) 2002-04-02 2004-08-31 Networks Associates Technology, Inc. System, method and computer program product for conditionally updating a security program
US20030204569A1 (en) 2002-04-29 2003-10-30 Michael R. Andrews Method and apparatus for filtering e-mail infected with a previously unidentified computer virus
US20030229672A1 (en) 2002-06-05 2003-12-11 Kohn Daniel Mark Enforceable spam identification and reduction system, and method thereof
US8046832B2 (en) 2002-06-26 2011-10-25 Microsoft Corporation Spam detector with challenges
US8924484B2 (en) 2002-07-16 2014-12-30 Sonicwall, Inc. Active e-mail filter with challenge-response
US7363490B2 (en) 2002-09-12 2008-04-22 International Business Machines Corporation Method and system for selective email acceptance via encoded email identifiers
US7188369B2 (en) 2002-10-03 2007-03-06 Trend Micro, Inc. System and method having an antivirus virtual scanning processor with plug-in functionalities
US20040083270A1 (en) 2002-10-23 2004-04-29 David Heckerman Method and system for identifying junk e-mail
US7149801B2 (en) 2002-11-08 2006-12-12 Microsoft Corporation Memory bound functions for spam deterrence and the like
US6732157B1 (en) 2002-12-13 2004-05-04 Networks Associates Technology, Inc. Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages
AU2003288515A1 (en) 2002-12-26 2004-07-22 Commtouch Software Ltd. Detection and prevention of spam
US7533148B2 (en) 2003-01-09 2009-05-12 Microsoft Corporation Framework to enable integration of anti-spam technologies
US7171450B2 (en) 2003-01-09 2007-01-30 Microsoft Corporation Framework to enable integration of anti-spam technologies
US7725544B2 (en) * 2003-01-24 2010-05-25 Aol Inc. Group based spam classification
US7249162B2 (en) 2003-02-25 2007-07-24 Microsoft Corporation Adaptive junk message filtering system
US7543053B2 (en) 2003-03-03 2009-06-02 Microsoft Corporation Intelligent quarantining for spam prevention
US7219148B2 (en) 2003-03-03 2007-05-15 Microsoft Corporation Feedback loop for spam prevention
US7366761B2 (en) * 2003-10-09 2008-04-29 Abaca Technology Corporation Method for creating a whitelist for processing e-mails
US20040177120A1 (en) 2003-03-07 2004-09-09 Kirsch Steven T. Method for filtering e-mail messages
US7320020B2 (en) * 2003-04-17 2008-01-15 The Go Daddy Group, Inc. Mail server probability spam filter
US7653698B2 (en) 2003-05-29 2010-01-26 Sonicwall, Inc. Identifying e-mail messages from allowed senders
US7293063B1 (en) 2003-06-04 2007-11-06 Symantec Corporation System utilizing updated spam signatures for performing secondary signature-based analysis of a held e-mail to improve spam email detection
US7263607B2 (en) 2003-06-12 2007-08-28 Microsoft Corporation Categorizing electronic messages based on trust between electronic messaging entities
US8533270B2 (en) * 2003-06-23 2013-09-10 Microsoft Corporation Advanced spam detection techniques
US7155484B2 (en) 2003-06-30 2006-12-26 Bellsouth Intellectual Property Corporation Filtering email messages corresponding to undesirable geographical regions
US7051077B2 (en) 2003-06-30 2006-05-23 Mx Logic, Inc. Fuzzy logic voting method and system for classifying e-mail using inputs from multiple spam classifiers
US20050015455A1 (en) 2003-07-18 2005-01-20 Liu Gary G. SPAM processing system and methods including shared information among plural SPAM filters
US20050060643A1 (en) * 2003-08-25 2005-03-17 Miavia, Inc. Document similarity detection and classification system
US20050050150A1 (en) * 2003-08-29 2005-03-03 Sam Dinkin Filter, system and method for filtering an electronic mail message
US7451487B2 (en) 2003-09-08 2008-11-11 Sonicwall, Inc. Fraudulent message detection
US7257564B2 (en) 2003-10-03 2007-08-14 Tumbleweed Communications Corp. Dynamic message filtering
US7930351B2 (en) 2003-10-14 2011-04-19 At&T Intellectual Property I, L.P. Identifying undesired email messages having attachments
US7451184B2 (en) * 2003-10-14 2008-11-11 At&T Intellectual Property I, L.P. Child protection from harmful email
US7610341B2 (en) * 2003-10-14 2009-10-27 At&T Intellectual Property I, L.P. Filtered email differentiation
US7373385B2 (en) 2003-11-03 2008-05-13 Cloudmark, Inc. Method and apparatus to block spam based on spam reports from a community of users
US20050102366A1 (en) 2003-11-07 2005-05-12 Kirsch Steven T. E-mail filter employing adaptive ruleset
US20050120019A1 (en) 2003-11-29 2005-06-02 International Business Machines Corporation Method and apparatus for the automatic identification of unsolicited e-mail messages (SPAM)
US7359941B2 (en) * 2004-01-08 2008-04-15 International Business Machines Corporation Method and apparatus for filtering spam email
US7590694B2 (en) 2004-01-16 2009-09-15 Gozoom.Com, Inc. System for determining degrees of similarity in email message information
US7693943B2 (en) 2004-01-23 2010-04-06 International Business Machines Corporation Classification of electronic mail into multiple directories based upon their spam-like properties
US20050182735A1 (en) * 2004-02-12 2005-08-18 Zager Robert P. Method and apparatus for implementing a micropayment system to control e-mail spam
WO2005082101A2 (en) 2004-02-26 2005-09-09 Truefire, Inc. Systems and methods for producing, managing, delivering, retrieving, and/or tracking permission based communications
US20050204159A1 (en) * 2004-03-09 2005-09-15 International Business Machines Corporation System, method and computer program to block spam
US7627670B2 (en) * 2004-04-29 2009-12-01 International Business Machines Corporation Method and apparatus for scoring unsolicited e-mail
EP1767010B1 (en) 2004-06-15 2015-11-11 Tekelec Global, Inc. Method, system, and computer program products for content-based screening of MMS messages
US20060123083A1 (en) * 2004-12-03 2006-06-08 Xerox Corporation Adaptive spam message detector
US7937480B2 (en) * 2005-06-02 2011-05-03 Mcafee, Inc. Aggregation of reputation data
US7971137B2 (en) * 2005-12-14 2011-06-28 Google Inc. Detecting and rejecting annoying documents

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI549464B (zh) * 2013-10-30 2016-09-11 騰訊科技(深圳)有限公司 一種短url服務的實現方法及裝置
US9544355B2 (en) 2013-10-30 2017-01-10 Tencent Technology (Shenzhen) Company Limited Methods and apparatus for realizing short URL service

Also Published As

Publication number Publication date
CA2467869C (en) 2013-03-19
US7409708B2 (en) 2008-08-05
EP1484893A2 (en) 2004-12-08
AU2004202268B2 (en) 2009-12-03
BRPI0401849B1 (pt) 2017-04-11
RU2004116904A (ru) 2005-11-10
RU2378692C2 (ru) 2010-01-10
US7464264B2 (en) 2008-12-09
KR101137065B1 (ko) 2012-07-02
EP1484893A3 (en) 2006-05-24
ZA200404018B (en) 2005-05-20
MY142668A (en) 2010-12-15
JP2004362559A (ja) 2004-12-24
US20050022031A1 (en) 2005-01-27
AU2004202268A1 (en) 2004-12-23
US7665131B2 (en) 2010-02-16
BRPI0401849A (pt) 2005-02-09
PL368364A1 (en) 2004-12-13
EP1484893B1 (en) 2017-07-05
US20070118904A1 (en) 2007-05-24
KR20040104902A (ko) 2004-12-13
CA2467869A1 (en) 2004-12-04
JP4672285B2 (ja) 2011-04-20
US20040260922A1 (en) 2004-12-23
CN1573784A (zh) 2005-02-02
MXPA04005335A (es) 2005-03-31
TW200509615A (en) 2005-03-01
US20050022008A1 (en) 2005-01-27
CN1573784B (zh) 2012-11-07
US7272853B2 (en) 2007-09-18

Similar Documents

Publication Publication Date Title
TWI353146B (en) Origination/destination features and lists for spa
US9501746B2 (en) Systems and methods for electronic message analysis
JP4546761B2 (ja) 高度なスパム検出技法
US20210152551A9 (en) Domain-based Isolated Mailboxes
US8266215B2 (en) Using distinguishing properties to classify messages
US20160226897A1 (en) Risk Ranking Referential Links in Electronic Messages
US11736521B2 (en) Systems and methods for detecting domain impersonation
Alghamdi et al. Toward detecting malicious links in online social networks through user behavior
US8291024B1 (en) Statistical spamming behavior analysis on mail clusters
US20050289239A1 (en) Method and an apparatus to classify electronic communication
Msongaleli et al. Electronic mail forensic algorithm for crime investigation and dispute settlement
Saxena et al. Spamizer: An approach to handle web form spam
Barbar et al. Image spam detection using FENOMAA technique
Patel Recognizing Spam Domains by Extracting Features from Spam Emails using Data Mining
Biggs YOU MayHAVE Alredy I!: Spam

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees