WO2014079257A1 - 基于部分哈希值对有限项目的排除 - Google Patents

基于部分哈希值对有限项目的排除 Download PDF

Info

Publication number
WO2014079257A1
WO2014079257A1 PCT/CN2013/082904 CN2013082904W WO2014079257A1 WO 2014079257 A1 WO2014079257 A1 WO 2014079257A1 CN 2013082904 W CN2013082904 W CN 2013082904W WO 2014079257 A1 WO2014079257 A1 WO 2014079257A1
Authority
WO
WIPO (PCT)
Prior art keywords
user
hash value
limited
items
url
Prior art date
Application number
PCT/CN2013/082904
Other languages
English (en)
French (fr)
Inventor
高剑青
Original Assignee
Gao Jianqing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201210582239.5A external-priority patent/CN103020287B/zh
Application filed by Gao Jianqing filed Critical Gao Jianqing
Publication of WO2014079257A1 publication Critical patent/WO2014079257A1/zh

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the phishing website is excluded by submitting the user's URL or the full hash value of the URL (eg md5) and then comparing it with the phishing url blacklist in the database. If the server calculates the hash value for all the URLs of the global website, the server can still query the website that the user actually opens from the hash value submitted by the user, which is not conducive to the protection of user privacy.
  • Hash value characteristics (A- refers to the data source, B- refers to the hash value obtained after the A operation):
  • B can be obtained from A, but cannot be calculated back from A to B;
  • the user can download the same hash value of these parts and compare it locally.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

部分哈希值对有限项目的排除,是通过用户提交项目的部分哈希值与服务商数据库里面黑(白)名单的哈希值进行比较排除,有利于保护用户的隐私。

Description

基于部分哈希值对有限项目的排除 技术领域
计算机、互联网、密码学。
背景技术
目前对钓鱼网站的排除都是通过提交用户的网址或网址的完整哈希值(如:md5)然后和数据库里面的钓鱼网址黑名单比较进行排除。而如果服务器对全球所有网址域名计算哈希值做成查询数据库,服务器还是可以从用户提交的哈希值中查询到用户实际打开的网站,不利于用户隐私的保护。
常见哈希值:MD5、SHA
哈希值特性(以下A-指代数据源,B-指代A运算后获得的哈希值):
1.单向性:从A可以运算获得B,但从B不能运算回A;
2.数据源A发生微小变化,结果B发生巨大变化。
3.无碰撞:不同数据源A会获得不同结果B,但B的长度是有限的,而数据源A是无限的,因此发生碰撞是一定存在的。
这些特性常被用于文件、字符串的特征识别(杀毒、反钓鱼网址)。
发明内容
将用户网址计算出来的哈希值部分提交给服务商,
a)如果用户提交的部分哈希值已经不在黑名单里面,就已经排除了钓鱼网址的可能。
b)如果用户提交的部分哈希值在服务商数据库里面存在可下载数量(如:1000个),用户可以下载这些部分相同的哈希值,在本地进行比较。
c)如果前2项还无法达到,增加用户提交的哈希值部分数量(长度),继续前2项判断直至完成。

Claims (4)

  1. 部分哈希值对有限项目的排除:其技术特征是:将用户项目计算出来的哈希值部分提交给服务商,a)如果用户提交的部分哈希值已经不在黑名单里面,就已经排除了钓鱼网址的可能;如果用户提交的部分哈希值在服务商数据库里面存在可下载数量(如:1000个),用户可以下载这些部分相同的哈希值,在本地进行比较;如果前2项还无法达到,增加用户提交的哈希值部分数量(长度),继续前2项判断,直至完成。
  2. 包括:如果用户提交有限项目(包括但不限于:用户网址)的部分哈希值已经不在黑(白)名单里面,就已经排除了存在于黑(白)名单(包括但不限于:钓鱼网址)的可能。
  3. 包括:如果用户提交有限项目(包括但不限于:用户网址)的 的部分哈希值在服务商数据库里面存在可下载数量(如:1000个),用户可以下载这些部分相同的哈希值,在本地进行比较。
  4. 包括:如果前2项还无法达到,增加用户提交有限项目(包括但不限于:用户网址)的 的哈希值部分数量(长度),继续前2项判断,直至完成。
PCT/CN2013/082904 2012-11-20 2013-09-04 基于部分哈希值对有限项目的排除 WO2014079257A1 (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CN201210470121.3 2012-11-20
CN201210470121 2012-11-20
CN201210582239.5A CN103020287B (zh) 2012-11-20 2012-12-28 基于部分哈希值对有限项目的排除
CN201210582239.5 2012-12-28

Publications (1)

Publication Number Publication Date
WO2014079257A1 true WO2014079257A1 (zh) 2014-05-30

Family

ID=50775485

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/082904 WO2014079257A1 (zh) 2012-11-20 2013-09-04 基于部分哈希值对有限项目的排除

Country Status (1)

Country Link
WO (1) WO2014079257A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079042A (zh) * 2006-12-28 2007-11-28 腾讯科技(深圳)有限公司 一种快速查询黑白名单的系统及方法
CN102082792A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 钓鱼网页检测方法及设备
CN102098285A (zh) * 2010-12-14 2011-06-15 成都市华为赛门铁克科技有限公司 一种防范钓鱼攻击的方法及装置
CN103020287A (zh) * 2012-11-20 2013-04-03 高剑青 基于部分哈希值对有限项目的排除

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079042A (zh) * 2006-12-28 2007-11-28 腾讯科技(深圳)有限公司 一种快速查询黑白名单的系统及方法
CN102098285A (zh) * 2010-12-14 2011-06-15 成都市华为赛门铁克科技有限公司 一种防范钓鱼攻击的方法及装置
CN102082792A (zh) * 2010-12-31 2011-06-01 成都市华为赛门铁克科技有限公司 钓鱼网页检测方法及设备
CN103020287A (zh) * 2012-11-20 2013-04-03 高剑青 基于部分哈希值对有限项目的排除

Similar Documents

Publication Publication Date Title
US10667101B2 (en) Contextual deep linking of applications
US10614142B2 (en) Personalized search results
US10785246B2 (en) Mining attack vectors for black-box security testing
WO2017166630A1 (zh) 一种任务优先级修正方法和装置
US20150006506A1 (en) Evaluation of web pages
JP2022533355A (ja) ブロックチェーン・トランザクションのデータ・フィールドの検証
RU2012151502A (ru) Служба репутации контента на основе декларации
HK1166162A1 (en) Method and apparatus for ordering search results
US10127382B2 (en) Malware detection method
CN104063318A (zh) Android应用相似性快速检测方法
US20110314077A1 (en) Identification of compatible products for use with mobile devices
US20140156687A1 (en) Identifying duplicate files
JP2012190458A5 (zh)
US10691669B2 (en) Big-data processing method and apparatus
WO2015198112A8 (en) Processing search queries and generating a search result page including search object related information
KR20170088950A (ko) 검색 엔진으로 웹 사이트 인증 데이터를 제공하기 위한 방법 및 장치
JP2017516172A (ja) クエリに基づいて普及度情報を提供するための複数の命令のプログラム、クエリに基づいて普及度情報を提供するための装置、クエリに基づいて普及度情報を提供するための方法、および、機械可読非一時的記録媒体
WO2019127660A1 (zh) 一种基于用户id识别有害图片的方法及其系统
US10505739B2 (en) Prefix fingerprint
CN103020287B (zh) 基于部分哈希值对有限项目的排除
WO2014079257A1 (zh) 基于部分哈希值对有限项目的排除
JP2016503201A5 (zh)
JP2019505009A5 (zh)
US10606844B1 (en) Method and apparatus for identifying legitimate files using partial hash based cloud reputation
WO2019127652A1 (zh) 基于用户id和片尾内容的识别有害视频的方法及系统

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13857217

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13857217

Country of ref document: EP

Kind code of ref document: A1