KR101565957B1 - 제품 피드 유사성을 사용하는 스팸 상인 발견 - Google Patents
제품 피드 유사성을 사용하는 스팸 상인 발견 Download PDFInfo
- Publication number
- KR101565957B1 KR101565957B1 KR1020147031049A KR20147031049A KR101565957B1 KR 101565957 B1 KR101565957 B1 KR 101565957B1 KR 1020147031049 A KR1020147031049 A KR 1020147031049A KR 20147031049 A KR20147031049 A KR 20147031049A KR 101565957 B1 KR101565957 B1 KR 101565957B1
- Authority
- KR
- South Korea
- Prior art keywords
- merchant
- computer
- signature
- product
- data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Development Economics (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Game Theory and Decision Science (AREA)
- Computer Security & Cryptography (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
제품 피드 비교를 사용하여 스팸 상인을 발견하는 것은 상인에 의해 제출된 제안 데이터를 사용하여 상인 서명이 비교 시스템에 의해 컴퓨팅되는 것을 포함한다. 상인은 제품 비교 웹사이트 상에서의 사용을 위해 파일을 비교 시스템에 제출한다. 비교 시스템은 그 파일을 프로세싱하고 모든 제안에 공통인 특정 특징을 파싱함으로써 상인 서명을 계산한다. 비교 시스템은 제안의 각각에 포함된 특정 특징의 각각에 데이터 값을 배정하고 배정된 데이터 값의 스트링을 발생시킨다. 비교 시스템은 상인 서명을 획드가기 위해 데이터 값의 스트링에 대하여 해시 알고리즘을 실행한다. 상인 서명은 알려진 스팸 상인의 서명과 비교되고 상인 서명이 알려진 스팸 상인 서명의 미리 규정된 임계값 내에 있으면, 상인은 거절되고 그 서명은 스팸 상인으로서 마킹된다.
Description
관련 출원
본 출원은 미국 출원 제13/443,675호(출원일: 2012년 4월 10일, 발명의 명칭: "Discovering Spam Merchants Using Product Feed Similarity")에 대한 우선권을 주장한다. 상기 우선권 출원의 전체 내용은 참조로 본 명세서에 완전히 편입되는 것이다.
기술분야
본 발명은 일반적으로는 온라인 쇼핑에 관한 것이고, 더 구체적으로는 제품 피드(product feed)를 사용하여 악성 또는 사기성 상인의 식별을 가능하게 하는 방법 및 시스템에 관한 것이다.
온라인 쇼핑과 같은 전자 상거래는 인터넷의 출현 이후로 점차로 흔하게 되었다. 상인은 고객이 구매할 제품을 선택하고 그 후 그들의 주문이 상인에 의해 직접 또는 제3자 중개인에 의해 프로세싱되게 하는 사용자 인터페이스를 제공하는 온라인 쇼핑 웹사이트를 개발 및 유지할 수 있다. 그렇지만, 사용자는 제품을 검색하고 궁극적으로 구매하기 위해 상인의 온라인 쇼핑 웹사이트를 돌아다녀야 한다.
사용자를 상인의 온라인 쇼핑 웹사이트로 가게 하는 제품 비교 웹사이트가 개발되어 왔다. 제품 비교 웹사이트는 사용자가 제품 질의를 타이핑할 수 있는 양식 필드를 포함하는 인터페이스를 사용자에게 제공한다. 제품 비교 웹사이트는 질의를 실행하고 그 제품을 판매하는 상인의 리스트와 더불어 가격책정 정보를 반환한다. 사용자는 리스트에 디스플레이되는 제품을 클릭하여 상인의 웹사이트로 가게 될 수 있다.
상인은 하나 이상의 제품에 대하여 제안 피드(offer feed)를 제출함으로써 제품 비교 웹사이트에 의해 그에 포함되도록 선출된다. 그렇지만, 부당한 사용자 트래픽을 얻을 의도로 악성 또는 사기성 제안 피드를 업로드하는 스팸 상인이 존재한다. 스팸 상인은 사용자가 실제 제품 페이지에 도달하기 위해 무익한 중간 스팸 페이지를 클릭하여 가야 함을 요구할 수 있다. 사용자는 위조 상품 또는 무면허 약국으로부터의 불법 의약품을 구매할 수 있다. 아니면, 스팸 상인은 잘못된 제품을 보내거나, 제품을 아예 보내지 않거나, 또는 그들은 사용자의 신용 카드 정보를 훔칠 수 있다.
스팸 상인이 식별되고 나면, 그것은 제품 비교 웹사이트 질의로부터 제거된다. 그렇지만, 스팸 상인은 그들의 웹사이트 주소, 그들 사이트의 외관을 변경하거나, 또는 제출된 제안 피드에 다른 사소한 변경을 한 후에 제품 비교 웹사이트에 새로운 계정을 재개하려는 경향이 있다.
특정 예시적 태양에 있어서, 스팸 상인을 발견하는 방법 및 시스템은 상인에 의해 제출된 제안 피드 파일 데이터를 사용하여 상인 서명이 상인 비교 시스템에 의해 컴퓨팅되는 것을 포함한다. 상인은 제품 비교 웹사이트 상에서의 사용을 위해 파일을 상인 비교 시스템에 제출한다. 파일은 상인에 의한 판매를 위한 하나 이상의 제품에 대한 제안 데이터를 포함한다. 상인 비교 시스템은 파일을 프로세싱하고 표제, 제품 설명, 가격 또는 사진과 같이 모든 제안에 공통인 특정 특징을 파싱(parsing)함으로써 상인 서명을 계산한다. 상인 비교 시스템은 제안의 각각에 포함된 특정 특징의 각각에 데이터 값을 배정하고 배정된 데이터 값의 스트링을 발생시킨다. 그 후 상인 비교 시스템은 상인 서명을 획득하기 위해 특정 특징에 배정된 데이터 값의 스트링에 대하여 해시 알고리즘(hash algorithm)을 실행한다. 상인 서명은 알려진 스팸 상인의 서명과 비교되고, 그 서명이 알려진 스팸 상인 서명의 미리 규정된 임계값 내에 있지 않으면, 그 상인은 수락되고 제안 데이터는 사용자 질의에서의 디스플레이에 이용가능하게 된다. 상인 서명이 알려진 스팸 상인 서명의 미리 규정된 임계값 내에 있으면, 그 상인은 거절되고 그 서명은 스팸 상인으로서 마킹된다. 그 후 상인의 제안 데이터는 사용자 질의에서의 디스플레이에 이용가능하지 않게 된다.
예시적 실시예의 이들 및 다른 태양, 목적, 특징 및 이점은 현재 제시되는 바와 같은 본 발명을 수행하는 최상 모드를 포함하는 도시되는 예시적 실시예의 이하의 상세한 설명을 고려하여 당업자에게 명백하게 될 것이다.
도 1은 일례의 실시예에 따라 제품 피드 유사성을 사용하여 스팸 상인을 검출하기 위한 시스템에 대한 동작 환경을 묘사하는 블록 선도;
도 2는 일례의 실시예에 따라 스팸 상인 시스템을 검출하기 위한 방법을 묘사하는 블록 흐름 선도;
도 3은 일례의 실시예에 따라 상인 시스템으로부터 수신되는 제안 피드 파일 데이터를 프로세싱하기 위한 방법을 묘사하는 블록 흐름 선도;
도 4는 일례의 실시예에 따라 상인 서명을 검출하기 위한 방법을 묘사하는 블록 흐름 선도.
도 2는 일례의 실시예에 따라 스팸 상인 시스템을 검출하기 위한 방법을 묘사하는 블록 흐름 선도;
도 3은 일례의 실시예에 따라 상인 시스템으로부터 수신되는 제안 피드 파일 데이터를 프로세싱하기 위한 방법을 묘사하는 블록 흐름 선도;
도 4는 일례의 실시예에 따라 상인 서명을 검출하기 위한 방법을 묘사하는 블록 흐름 선도.
개관
예시적 실시예는 상인 비교 시스템이 제품 피드 비교를 사용하여 스팸 상인을 발견 가능하게 하는 방법 및 시스템을 제공한다. 상인 서명은 상인에 의해 제출된 제안 피드 파일 데이터를 사용하여 상인 비교 시스템에 의해 컴퓨팅된다. 상인은 제품 비교 웹사이트 상에서의 사용을 위해 데이터 파일을 상인 비교 시스템에 제출한다. 데이터 파일은 상인에 의한 판매를 위한 하나 이상의 제품에 대한 제안 데이터를 포함한다. 상인 비교 시스템은 상인으로부터 파일을 수신하고 그것을 분석하여 모든 필요한 데이터 필드가 확실히 포함되어 있게 한다. 예를 들어, 상인 비교 시스템은 제품 표제와 같이 모든 제안에 공통인 기정 특정 특징이 제안 데이터와 확실히 제출되게 한다. 필수 필드가 포함되어 있지 않으면, 데이터 파일은 거절된다. 모든 필수 필드가 파일 데이터에 포함되어 있으면, 상인 비교 시스템은 데이터를 컴포넌트 제안으로 파싱한다. 예를 들어, 파일 데이터는 여러 다른 제품에 대한 다수의 제안을 포함할 수 있다. 상인 비교 시스템은 상인의 서명을 컴퓨팅하는데 사용하기 위해 그리고 사용자 질의에 응답하여 상인의 제안을 디스플레이하는데 사용하기 위해 데이터를 단일 컴포넌트 제안으로 파싱한다. 컴포넌트 제안은 데이터 저장 유닛에 저장된다.
상인 비교 시스템은 상인의 서명을 계산하기 위해 컴포넌트 제안을 검색한다. 상인 비교 시스템은 컴포넌트 제안을 제안의 특징으로 파싱하고 표제, 제품 설명, 가격, 사진 또는 다른 적합한 특징과 같이 모든 제안에 공통인 기정 특정 특징을 검색한다. 상인 비교 시스템은 제안의 각각에 포함된 특정 특징의 각각에 데이터 값을 배정하고 배정된 데이터 값의 스트링을 발생시킨다. 일례의 실시예에 있어서, 데이터 값은 수치 값이다. 예를 들어, 상인 비교 시스템은 수치 값을 발생시키도록 해시 함수를 사용한다. 배정된 데이터 값의 스트링이 발생되고 나면, 상인 비교 시스템은 상인 서명을 획득하기 위해 특정 특징에 배정된 데이터 값의 스트링에 대하여 해시 알고리즘을 실행한다. 대안의 일례의 실시예에 있어서, 상인 비교 시스템은 제안의 각각에 포함된 2개 이상의 특정 특징에 데이터 값을 배정한다. 그것은 특정 특징의 각각에 대하여 배정된 데이터 값의 별개의 스트링을 발생시킨다. 이것은 상인에 대하여 하나보다 많은 서명의 발생을 가능하게 한다.
알려진 스팸 상인의 서명이 마킹된다. 알려진 스팸 상인은 사용자에 의해 수신된 불만(들), 분석가에 의한 검토, 또는 새롭게 컴퓨팅된 상인 시스템 서명이 알려진 스팸 상인 시스템 서명의 지정된 임계값 내에 있을 때 등 어느 적합한 수단에 의해서라도 발견될 수 있다. 상인 서명은 알려진 스팸 상인의 서명과 비교된다. 그 서명이 알려진 스팸 상인 서명의 미리 규정된 임계값 내에 있지 않으면, 그 상인은 수락되고 제안 데이터는 사용자 질의에서의 디스플레이에 이용가능하게 된다. 상인 서명이 알려진 스팸 상인 서명의 미리 규정된 임계값 내에 있으면, 그 상인은 거절되고 그 서명은 스팸 상인으로서 마킹된다. 그 후 상인의 제안 데이터는 사용자 질의에서의 디스플레이에 이용가능하지 않게 된다. 상인은 거절을 통지받고 그 거절에 이의를 제기할 기회가 제공된다. 그때 분석가는 상인 데이터를 검토하여 그 상인이 스팸 상인인지를 결정할 것이다. 분석가가 그 상인이 스팸 상인이 아니라고 결정하면, 그 상인의 서명은 알려진 스팸 상인의 것들로부터 제거되고, 상인의 제안 데이터는 상인 비교 시스템에 의해 수락되게 되고, 상인의 제안 데이터는 사용자 질의에서의 디스플레이에 이용가능하게 될 것이다.
본 발명의 진보적 기능성은 프로그램 순서도를 예시하는 도면과 함께 읽혀지는 다음 설명에서 더 상세하게 설명될 것이다.
시스템 아키텍처
유사한 숫자가 도면 곳곳에서 유사한(반드시 똑같지는 않은) 구성요소를 나타내는 도면을 이제 보면, 전형적 실시예가 상세하게 설명된다.
도 1은 제품 피드 유사성을 사용하여 스팸 상인을 검출하기 위한 시스템에 대한 동작 환경(100)을 묘사하는 블록 선도이다. 도 1에 묘사된 바와 같이, 예시적 동작 환경(100)은 하나 이상의 네트워크(120)를 통하여 서로 통신하도록 구성되는 하나 이상의 상인 시스템(110), 상인 비교 시스템(130) 및 사용자 시스템(140)을 포함한다.
네트워크(120)는 네트워크 디바이스(디바이스(110, 130, 140)를 포함)가 데이터를 교환할 수 있는 전기통신 수단을 포함한다. 예를 들어, 네트워크(120)는 스토리지 에어리어 네트워크(storage area network: "SAN"), 퍼스널 에어리어 네트워크(personal area network: "PAN"), 근거리 통신망(local area network: "LAN"), 도시권 통신망(metropolitan area network: "MAN"), 광역 통신망(wide area network: "WAN"), 무선 근거리 통신망(wireless local area network: "WLAN"), 가상 사설 통신망(virtual private network: "VPN"), 인트라넷, 인터넷, 블루투스, NFC, 또는 신호, 데이터 및/또는 메시지(일반적으로는 데이터라고 지칭)의 통신을 용이하게 하는 어느 다른 적합한 아키텍처 또는 시스템으로서 구현될 수 있거나, 그 일부분일 수 있다. 대안의 일례의 실시예에 있어서, 네트워크(120)는 셀룰러 네트워크를 포함할 수 있다.
일례의 상인 시스템(110)는 상인 디바이스(115)를 포함한다. 상인 디바이스(115)는 웹 서버(117)(예를 들어, 구글 크롬, 마이크로소프트 인터넷 익스플로러, 넷스케이프, 사파리, 파이어폭스, 또는 웹 페이지 파일과 상호작용하기 위한 다른 적합한 애플리케이션)에 결합되거나 포함할 수 있는 컴퓨터, 모바일 디바이스(예를 들어, 노트북, 컴퓨터, 태블릿 컴퓨터, 넷북 컴퓨터, 개인용 정보 단말("PDA"), 비디오 게임 디바이스, GPS 로케이터 디바이스, 셀룰러 전화기, 스마트폰, 또는 다른 모바일 디바이스), 또는 다른 적합한 기술일 수 있다.
상인은 사용자에 의해 요청되는 제품 질의에서의 포함을 위하여 제안 피드를 생성하여 상인 비교 시스템(130)에 제출하도록 상인 디바이스(115)를 사용할 수 있다. 일례의 실시예에 있어서, 다수의 상인 시스템(110-1, 110-2, ...110-N)은 제안 피드를 생성하여 상인 비교 시스템(130)에 제출한다. 일례의 제안 피드는 제품(예를 들어, "카메라")의 표제 및 제안 가격을 포함한다. 대안의 일례의 실시예에 있어서, 제안 피드는 제품 설명, 제품 사진, 상인 명칭, 잔여 수량, 할인 가격, 원래 가격, 온라인 가용성, 범용 제품 코드, 컬러, 사이즈 및 다른 관련 있는 판매 정보와 같은 부가적 필드를 포함한다. 상인 비교 시스템(130)에 제출되는 제안 피드는 또한 사용자가 상인의 웹사이트로 가게 될 수 있게 하는 상인 식별 정보를 포함한다.
일례의 상인 비교 시스템(130)은 상인 서명 발생기(131), 데이터 저장 유닛(133), 제품 제안 모듈(135) 및 비교 모듈(137)을 포함한다. 상인 시스템(110)에 의해 제출된 제안 피드는 제품 제안 모듈(135)에 의해 수신된다. 제품 제안 모듈(135)은 상인 서명 발생기(131) 및 비교 엔진(137)에 의한 사용을 위해 데이터 저장 유닛(133)에 제안 피드를 저장한다.
일례의 사용자 시스템(140)은 사용자 디바이스(145)를 포함한다. 사용자 디바이스(145)는 웹 서버(예를 들어, 구글 크롬, 마이크로소프트 인터넷 익스플로러, 넷스케이프, 사파리, 파이어폭스, 또는 웹 페이지 파일과 상호작용하기 위한 다른 적합한 애플리케이션)에 결합되거나 포함할 수 있는 퍼스널 컴퓨터, 모바일 디바이스(예를 들어, 노트북, 컴퓨터, 태블릿 컴퓨터, 넷북 컴퓨터, 개인용 정보 단말("PDA"), 비디오 게임 디바이스, GPS 로케이터 디바이스, 셀룰러 전화기, 스마트폰, 또는 다른 모바일 디바이스), 또는 다른 적합한 기술일 수 있다.
사용자는 제품 질의를 발행하도록 사용자 디바이스(145)를 사용하여 상인 비교 시스템(130)에 액세스할 수 있다. 사용자는 상인 비교 시스템(130) 웹사이트로 돌아다니고 사용자 디바이스(145) 상의 사용자 인터페이스(도시하지 않음)를 사용하여 검색어를 입력한다. 상인 비교 시스템(130)의 비교 엔진(137)은 사용자의 질의에 응답하여 상인 시스템(110)에 의해 제출된 제출 제안을 검색하고 사용자의 질의에 대응하는 결과적 제품 리스트를 출력한다. 사용자는 결과적 리스트로부터 제품을 선택할 수 있고 제안 피드를 제출한 상인의 웹사이트로 가게 될 수 있다.
상인 비교 시스템(130)은 제출된 제안 피드에 기반하여 각각의 상인 시스템(110)에 대한 서명을 컴퓨팅함으로써 비교 엔진(137)에 의해 그에 포함되지 않게 스팸 상인을 식별하고 제거할 수 있다. 상인 서명 발생기(131)는 데이터 저장 유닛(133)으로부터 제안 피드를 검색하고 컴퓨팅된 알려진 스팸 상인 서명을 사용하여 그 상인이 스팸 상인인지를 결정한다. 상인은 상인 서명 발생기(131)에 의해 스팸 상인으로서 분류되는 것에 이의를 제기하여 분석가(139)에 의한 검토를 요청할 수 있다. 스팸 상인을 결정하는 방법은 도 2 내지 도 4에 설명되는 방법을 참조하여 이후에 더 상세하게 설명된다.
시스템 프로세스
도 2는 일례의 실시예에 따라 스팸 상인 시스템(110)을 검출하기 위한 방법을 묘사하는 블록 흐름 선도이다. 방법(200)은 도 1에 예시된 컴포넌트를 참조하여 설명된다.
블록(210)에서, 상인 비교 시스템(130)은 상인 시스템(110)으로부터 수신된 제안 피드를 프로세싱한다. 상인 시스템(110-1)으로부터 수신된 제안 피드 데이터를 프로세싱하는 방법은 도 3에 설명되는 방법을 참조하여 이후에 더 상세하게 설명된다.
도 3은 도 2의 블록(210)에서 참조되는 바와 같이 일례의 실시예에 따라 상인 시스템(110-1)으로부터 수신된 제안 피드 파일 데이터를 프로세싱하기 위한 방법을 묘사하는 블록 흐름 선도이다. 방법(210)은 도 1에 예시된 컴포넌트를 참조하여 설명된다.
블록(310)에서, 상인 시스템(110-1)은 제안 피드 파일 데이터를 상인 비교 시스템(130)에 업로드 또는 제출한다. 일례의 실시예에 있어서, 제안 피드 파일 데이터는 XML 파일 데이터를 포함한다. 일례의 실시예에 있어서, 제품 제안 모듈(135)은 상인 시스템(110-1)으로부터 제안 피드 파일 데이터를 수신하고 상인 서명 발생기(131) 및 비교 모듈(137)에 의한 사용을 위해 데이터 저장 유닛(133)에 그 데이터를 저장한다. 일례의 실시예에 있어서, 상인 시스템(110-1)은 다수의 제안이 단일 제출로 제출되는 것인 벌크 파일 업로드로서 상인 비교 시스템(130)에 제안 피드 파일 데이터를 업로드 또는 제출한다. 대안의 일례의 실시예에 있어서, 상인 시스템(110-1)은 한번에 하나의 제안씩 상인 비교 시스템(130)에 제안 피드 파일 데이터를 업로드 또는 제출한다. 이러한 실시예에 있어서, 상인 시스템(110-1)의 제안은 상인 서명의 프로세싱 및 계산 전에 컴파일링될 수 있다. 대안의 일례의 실시예에 있어서, 상인 시스템(110-1)의 제안은 그것들이 제출되는 대로 프로세싱되고 추후에 상인 서명의 계산을 위해 이전에 제출된 어느 제안과 조합될 수 있다.
블록(320)에서, 상인 비교 시스템(130)은 제안 피드 파일 데이터를 분석한다. 일례의 실시예에 있어서, 데이터는 데이터 저장 유닛(133)으로부터 검색되고 상인 서명 발생기(131)에 의해 분석된다. 대안의 일례의 실시예에 있어서, 데이터는 데이터 저장 유닛(133)에 저장되기 이전에 제품 제안 모듈(135)에 의해 분석된다.
블록(330)에서, 상인 비교 시스템(130)은 제안 피드 파일 데이터가 필수 데이터 필드를 포함하는지를 결정한다. 일례의 실시예에 있어서, 상인 비교 시스템(130)은 상인 시스템(110-1)에 의한 제출 이전에 필수 데이터 필드를 정의한다. 일례의 실시예에 있어서, 필수 데이터 필드는 상인의 서명을 계산하는데 사용되도록 상인 비교 시스템(130)에 의해 정의되는 특징을 포함한다. 예를 들어, 제품 표제, 제품 설명, 제품 사진 또는 제품 가격이다. 일례의 실시예에 있어서는, 제품 표제 및 제품 가격이 필수 데이터 필드이다.
제안 피드 파일 데이터가 필수 데이터 필드를 포함하고 있지 않으면, 상인 비교 시스템(130)은 블록(340)에서 데이터 파일을 거절한다. 일례의 실시예에 있어서는, 제안 피드 데이터가 데이터 저장 유닛(133)으로부터 제거되고 상인 비교 시스템(130)으로부터 제거된다.
블록(350)에서, 상인 비교 시스템(130)은 상인 시스템(110-1)에 통지한다. 일례의 실시예에 있어서, 상인 비교 시스템(130)은 상인 시스템(110-1)에 흠결을 통지한다. 대안의 일례의 실시예에 있어서, 상인 비교 시스템(130)은 상인 시스템(110-1)에 파일이 거절되었음을 통지한다.
도 3의 블록(330)으로 되돌아가서, 상인 비교 시스템(130)이 제안 피드 파일 데이터가 필수 필드를 포함하고 있다고 결정하면, 그 방법은 블록(360)으로 진행한다(도 3).
블록(360)에서, 상인 비교 시스템(130)은 제안 피드 파일 데이터를 제품에 대한 컴포넌트 제안으로 파싱한다. 일례의 실시예에 있어서, 제품 제안 모듈(135)은 데이터를 데이터 저장 유닛(133)에 저장하기 이전에 데이터를 파싱한다. 대안의 일례의 실시예에 있어서는, 상인 서명 발생기(131)가 데이터를 파싱한다. 일례의 실시예에 있어서, 컴포넌트 제안은, 도 3의 블록(330)에서 결정되는 바와 같이, 필수 데이터 필드를 각각 포함하고 있다. 예를 들어, 상인 시스템(110-1)이 카메라 및 페이퍼클립에 대한 제안 피드를 제출하면, 상인 비교 시스템(130)은 제안 피드를 컴포넌트 제안으로 분리할 것이다:
컴포넌트 제안
표제
가격
제안 #1: 카메라 $99
제안 #2: 페이퍼클립 $1
일례의 실시예에 있어서, 컴포넌트 제안은 사용자 질의에 응답하여 비교 모듈(137)에 의해 검색된다. 다수의 상인 시스템(110)으로부터의 컴포넌트 제안은 제품 리스트 또는 검색 결과의 형태로 질의에 응답하여 사용자에게 반환된다. 일례의 실시예에 있어서, 반환되는 결과는 사용자의 질의에 대응하는 컴포넌트 제안을 디스플레이한다. 상인 시스템(110-1)의 제안 피드 파일 데이터에 들어있는 부가적 컴포넌트 제안은 디스플레이되지 않는다.
블록(370)에서, 컴포넌트 제안은 데이터 저장 유닛(133)에 저장된다. 일례의 실시예에 있어서, 제안은 제품 제안 모듈(135)에 의해 저장된다.
방법(210)(도 3)은 그 후 도 2의 블록(220)으로 진행한다.
도 2로 되돌아가서, 블록(220)에서, 상인 비교 시스템(130)은 상인 시스템(110-1) 서명을 결정한다. 상인 시스템(110-1) 서명을 결정하는 방법은 도 4에서 설명되는 방법을 참조하여 이후에 더 상세하게 설명된다.
도 3은, 도 2의 블록(220)에서 참조되는 바와 같이, 일례의 실시예에 따라 상인 시스템(110-1) 서명을 결정하는 방법을 묘사하는 블록 흐름 선도이다. 방법(220)은 도 1에 예시된 컴포넌트를 참조하여 설명된다.
블록(410)에서, 상인 비교 시스템(130)은 데이터 저장 유닛(133)으로부터 컴포넌트 제안을 검색한다. 일례의 실시예에 있어서는, 상인 서명 발생기(131)가 컴포넌트 제안을 검색하고 블록(410) 내지 블록(460)에서 이후 설명되는 방법을 수행한다.
블록(420)에서, 상인 비교 시스템(130)은 컴포넌트 제안의 각각에 포함된 특정 특징을 파싱한다. 상인 비교 시스템(130)은 도 3의 블록(360)에서 제안 피드 파일 데이터로부터 검색된 컴포넌트 제안의 각각을 파싱한다. 일례의 실시예에 있어서, 특정 특징은 상인 시스템(110) 서명을 컴퓨팅하도록 사용되는 바와 같은 상인 비교 시스템(130)에 의해 지정된 특징을 포함한다.
일례의 실시예에 있어서, 상인 시스템(110-1) 서명을 컴퓨팅하도록 사용되고 있는 상인 비교 시스템(130)에 의해 지정된 특징은 제품의 표제이다. 상인 비교 시스템(130)은 상인에 의해 제출된 각각의 컴포넌트 제안의 표제 필드를 검토하고 관련 있는 부분(즉, 표제)을 뽑아낸다. 예를 들어, 상인 시스템(110-1)은 제품의 표제 내에 가외 문자 또는 기호를 삽입할 수 있다. 상인 비교 시스템(130)은 제품의 표제의 가능한 변형에 대항하여 더 강건하도록 n-그램 모델(n-gram model)을 실행할 수 있다. 상인 비교 시스템(130)은 제안 피드 파일 데이터 내 상인 시스템(110-1)에 의해 제출된 컴포넌트 제안의 각각에 대한 표제를 뽑아낼 것이다. 위 예로 계속해서, 상인 시스템(110-1)이 카메라 및 페이퍼클립에 대한 제안 피드를 제출하면, 상인 비교 시스템은 표제 "카메라" 및 표제 "페이퍼클립"을 뽑아낼 것이다:
컴포넌트 제안
표제
제안 #1: 카메라
제안 #2: 페이퍼클립
블록(430)에서, 상인 비교 시스템(130)이 컴포넌트 제안의 각각에 포함된 특정 특징에 데이터 값을 배정한다. 일례의 실시예에 있어서, 데이터 값은 2진수이다. 일례의 실시예에 있어서, 특정 특징은 제품의 표제이고 상인 비교 시스템은 데이터 값을 발생시키도록 해시 함수를 사용한다. 해시 함수는 가변 길이의 데이터 세트를 고정 길이의 더 작은 데이터 세트에 매핑하는 어느 알고리즘 또는 서브루틴이라도 포함한다. 위 예로 계속해서, 상인 비교 시스템(130)은 고정 해시 값을 각각의 표제에 배정할 것이다:
컴포넌트 제안
표제
해시 값
제안 #1: 카메라 1100
제안 #2: 페이퍼클립 001
블록(440)에서, 상인 비교 시스템(130)은 제안의 각각에 대하여 배정된 데이터 값의 스트링을 발생시킨다. 일례의 실시예에 있어서, 각각의 표제에 대하여 배정된 해시 값은 "논리합"(or) 함수에 의해 분리되는 값의 스트링으로 배열된다. 일례의 실시예에 있어서, 해시 값은, 그것들이 "논리합" 함수에 의해 분리되는 한, 어떠한 순서로라도 놓일 수 있다. 위 예로 계속해서, 상인 비교 시스템(130)은 해시 값의 스트링을 발생시킬 것이다:
컴포넌트 제안
표제
해시 값
제안 #1: 카메라 1100
제안 #2: 페이퍼클립 001
스트링:
1100
[논리합]
001
블록(450)에서, 상인 비교 시스템(130)은 서명을 획득하기 위해 해시 값의 스트링에 대하여 단일 수치 값을 컴퓨팅할 것이다. 일례의 실시예에 있어서, 상인 비교 시스템(130)은 해시 값을 함께 "논리합" 할 것이다. 위 예로 계속해서, 상인에 의해 제출된 모든 제안 표제에 기반하여 상인 시스템(110-1)에 대하여 고유한 값을 컴퓨팅한다:
컴포넌트 제안
표제
해시 값
제안 #1: 카메라 1100
제안 #2: 페이퍼클립 001
스트링: 1100 [논리합] 001
상인 시스템(110-1) 서명:
1101
블록(460)에서, 상인 비교 시스템(130)은 상인 시스템(110-1) 서명을 데이터 저장 유닛(135)에 저장한다.
일례의 실시예에 있어서, 방법(210, 220)은 제안 피드를 제출하는 상인 시스템(110-1, 110-2, ...110-N)의 각각에 대하여 필요에 따라 반복될 수 있다. 일례의 실시예에 있어서, 방법(210, 220)은 새로운 제안 피드가 수신될 때마다 수행된다.
방법(220)(도 4)은 그 후 도 2에서의 블록(230)으로 진행한다.
도 2로 되돌아가서, 블록(230)에서, 상인 비교 시스템(130)은 알려진 스팸 상인 시스템(110-2)의 서명을 마킹한다. 일례의 실시예에 있어서, 알려진 스팸 상인 시스템(110-2)의 컴포넌트 제안은 질의에 응답하여 사용자에게 출력되도록 비교 모듈(137)에 의한 사용에 이용가능하지 않다. 그렇지만, 알려진 스팸 상인 시스템(110-2)의 서명은 상인 시스템(110-1) 서명과의 비교를 위해 데이터 저장 유닛(113)에 저장된다.
일례의 실시예에 있어서, 스팸 상인 시스템(110-2)은 사용자에 의해 수신된 불만(들), 분석가(139)에 의한 검토, 또는 새롭게 컴퓨팅된 상인 시스템(110-1) 서명이 알려진 스팸 상인 시스템(110-2) 서명의 지정된 임계값 내에 있을 때 등 어느 적합한 수단에 의해서라도 발견될 수 있다.
블록(240)에서, 상인 비교 시스템(130)은 새롭게 컴퓨팅된 상인 시스템(110-1) 서명을 알려진 스팸 상인 시스템(110-2) 서명과 비교한다. 일례의 실시예에 있어서, 알려진 스팸 상인 시스템(110-2)의 서명은 새롭게 컴퓨팅된 상인 시스템(110-1) 서명과 클러스터링된다. 일례의 실시예에 있어서는, 상인 서명 발생기(131)가 블록(230 내지 260)에 설명된 방법을 수행한다. 위 예로 계속해서, 알려진 스팸 상인 시스템(110-2)의 서명은 새롭게 컴퓨팅된 상인 시스템(110-1)과 클러스터링된다:
상인 시스템(110-1) 서명:
1101
알려진 스팸 상인 시스템(110-2) 서명:
1100
블록(245)에서, 상인 비교 시스템(130)은 새롭게 컴퓨팅된 상인 시스템(110-1) 서명이 알려진 스팸 상인 시스템(110-2) 서명(들)의 미리 결정된 임계값 내에 있는지를 결정한다. 예를 들어, 새롭게 컴퓨팅된 상인 시스템(110-1) 서명을 갖는 상인은 그것이 알려진 스팸 상인 시스템(110-2) 서명에 95% 이상 매칭하는 것이면 스팸 상인이라고 여겨질 수 있다. 일례의 실시예에 있어서, 임계값은 구성가능하고 소망에 따라 감도를 갖도록 선택될 수 있다. 예를 들어, 임계값이 더 낮을수록 스팸 상인 시스템(110-2)이 더 많이 식별될 것이다. 그리고 반대로, 임계값이 더 높을수록 스팸 상인 시스템(110-2)이 더 적게 식별될 것이다.
새롭게 컴퓨팅된 상인 시스템(110-1) 서명이 알려진 스팸 상인 시스템(110-2) 서명의 임계값 내에 있지 않다(즉, 서명 값들 간 거리가 너무 커서 상인 시스템(110-1, 110-2)이 유사한 제안 피드를 제출하지 않았다)고 상인 비교 시스템(130)이 결정하면, 그 상인 시스템(110-1)은 수락된다. 일례의 실시예에 있어서, 상인 시스템(110-1) 제안은 질의에 응답하여 사용자에게 출력되도록 비교 모듈(137)에 의한 사용에 이용가능하게 되고 그 상인의 서명은 데이터 저장 유닛(133)에 저장된다.
블록(245)(도 2)으로 되돌아가서, 새롭게 컴퓨팅된 상인 시스템(110-1) 서명이 알려진 스팸 상인 시스템(110-2) 서명의 임계값 내에 있다(즉, 서명 값들 간 거리가 작아서 상인 시스템(110-1, 110-2)이 유사한 제안 피드를 제출하였다)고 상인 비교 시스템(130)이 결정하면, 그 상인 시스템(110-1)은 거절된다. 일례의 실시예에 있어서, 상인 시스템(110-1) 제안은 데이터 저장 유닛(133)으로부터 제거되고 비교 모듈(137)에 의한 사용에 이용가능하지 않다.
블록(260)에서, 상인 비교 시스템(130)은 새롭게 컴퓨팅된 상인 시스템(110-1) 서명을 알려진 스팸 상인으로서 마킹한다. 일례의 실시예에 있어서, 상인 시스템(110-1) 서명은 다른 알려진 스팸 상인 시스템(110-2) 서명을 갖는 데이터 저장 유닛(133)에 저장된다.
블록(270)에서, 상인 비교 시스템(130)은 제안 피드 파일 데이터의 거절 및 제거를 상인 시스템(110-1)에 통지한다.
블록(280)에서, 상인 시스템(110-1)은 거절에 이의를 제기할 수 있다. 일례의 실시예에 있어서, 상인 시스템(110-1)에는 그것이 스팸 상인 시스템으로서의 지정에 항의할 수 있는 메커니즘이 제공되어 있다.
블록(290)에서는, 제출된 상인 시스템(110-1) 제안 피드 파일 데이터를 검토하고 상인 시스템(110-1)이 스팸 상인 시스템인지를 결정하도록 분석가(139)가 배정된다. 일례의 실시예에 있어서, 분석가(139)는 제안 데이터 및 상인 시스템(110-1) 서명의 계산을 검토한다. 대안의 일례의 실시예에 있어서, 분석가(139)는 또한 알려진 스팸 상인 시스템(110-2)에 의해 제출된 데이터를 검토한다.
블록(295)에서, 상인 비교 시스템(130)은 분석가(139)의 검토 결과를 상인 시스템(110-1)에 통지한다. 일례의 실시예에 있어서, 상인 시스템(110-1)은 블록(250)(도 2)을 참조하여 설명된 바와 같이 적법한 상인 시스템으로서 수락되고 상인 시스템(110-1)은 알려진 스팸 상인 시스템(110-2) 서명으로부터 제거된다. 대안의 일례의 실시예에 있어서, 상인 시스템(110-1)은 여전히 스팸 상인 시스템으로서 거절되어 있고 상인 시스템(110-1) 서명은 여전히 알려진 스팸 상인 시스템(110-2) 서명의 리스트에 있다.
일반론
예시적 실시예들의 하나 이상의 태양은 여기에서 설명 및 예시되는 기능을 구체화하는 컴퓨터 프로그램을 포함할 수 있되, 컴퓨터 프로그램은 머신-판독 가능 매체에 저장된 명령어 및 그 명령어를 실행하는 프로세서를 포함하는 컴퓨터 시스템에서 구현된다. 그렇지만, 컴퓨터 프로그래밍에 있어서 예시적 실시예들을 구현하는 여러 다른 방법이 있을 수 있고 그 예시적 실시예들이 어느 하나의 컴퓨터 프로그램 명령어 세트로 한정되는 것으로 해석되어서는 아니됨은 명백한 것이다. 더욱, 숙련된 프로그래머는 첨부 순서도 및 출원 명세서 내 연관 설명에 기반하는 실시예를 구현하도록 그러한 컴퓨터 프로그램을 작성할 수 있을 것이다. 그래서, 특정 프로그램 코드 명령어 세트의 개시는 예시적 실시예를 어떻게 만들고 사용하는지의 충분한 이해에 필수적이라고 생각되지는 않는다. 더욱, 컴퓨터에 의해 수행 중인 행위에 대한 어떠한 언급도 하나보다 많은 컴퓨터가 그 행위를 수행할 수 있으므로 단일 컴퓨터에 의해 수행 중인 것으로 해석되어서는 안 된다.
앞서 제시된 실시예에서 설명된 예시적 시스템, 방법 및 블록은 예시적인 것이고, 그리고, 대안의 실시예에서, 소정 블록은 다른 순서로, 서로 병렬로, 전적으로 생략되어, 그리고/또는 다른 예시적 실시예 사이에 조합되어 수행될 수 있고, 그리고/또는 소정 부가적 블록이 본 발명의 취지 및 범위로부터 벗어남이 없이 수행될 수 있다. 따라서, 그러한 대안의 실시예가 여기에서 설명되는 발명에 포함된다.
본 발명은 위에서 설명된 방법 및 프로세싱 기능을 수행하는 컴퓨터 하드웨어 및 소프트웨어와 사용될 수 있다. 여기에서 설명되는 시스템, 방법 및 프로시저는 프로그램가능한 컴퓨터, 컴퓨터 실행가능한 소프트웨어 또는 디지털 회로로 구체화될 수 있음을 당업자는 인식할 것이다. 소프트웨어는 컴퓨터-판독 가능 매체 상에 저장될 수 있다. 예를 들어, 컴퓨터 판독 가능 매체는 플로피 디스크, RAM, ROM, 하드 디스크, 착탈식 매체, 플래시 메모리, 메모리 스틱, 광학 매체, 자기-광학 매체, CD-ROM 등을 포함할 수 있다. 디지털 회로는 집적 회로, 게이트 어레이, 빌딩 블록 로직, 필드 프로그램가능한 게이트 어레이(field programmable gate array: "FPGA") 등을 포함할 수 있다.
본 발명의 특정 실시예가 상세하게 위에서 설명되었지만, 그 설명은 단지 예시의 목적을 위한 것이다. 위에서 설명된 것들에 부가하여, 예시적 실시예의 개시된 태양의 각종 수정 및 해당 태양에 대응하는 균등 블록은, 이하의 특허청구범위에서 정의되는 본 발명의 취지 및 범위로부터 벗어남이 없이, 당업자에 의해 이루어질 수 있고, 이러한 특허청구범위의 범주는 그러한 수정 및 균등 구조를 망라하도록 가장 넓은 해석에 부합되어야 한다.
Claims (28)
- 스팸 상인을 검출하기 위한 컴퓨터-구현 방법으로서,
상인 비교 시스템에 의해 동작되는 컴퓨터에 의해, 상인으로부터 수신되는 제안 피드(offer feed)를 프로세싱하는 단계로서, 상기 제안 피드는 복수의 제품 제안에 대한 파일 데이터를 포함하고, 상기 제품 제안의 각각은 상기 상인에 의한 판매를 위한 제품에 대한 파일 데이터를 포함하는 것인, 상기 프로세싱하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 제품 제안의 각각으로부터의 엘리먼트를 파싱(parsing)하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 제품 제안의 각각에 대하여, 대응하는 제품 제안에 대한 파싱된 엘리먼트에 데이터 값을 배정함으로써, 복수의 데이터 값을 생성하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 상인으로부터 수신된 상기 제안 피드 데이터로부터 파싱된 상기 제품 제안의 각각에 대하여 대응하는 엘리먼트에 배정된 상기 데이터 값에 기반하여 상기 상인에 대해 상기 데이터 값의 스트링을 발생시키는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 상인에 대한 상인 서명으로서 상기 데이터 값의 상기 스트링으로부터 컴퓨팅된 수치 값인 상기 상인 서명을 계산하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 알려진 스팸 상인들의 서명들을 마킹하는 단계로서, 상기 스팸 상인들은 이전에 제출된 악성 또는 사기성 파일 데이터를 갖는 것으로 알려져 있는 것인, 상기 마킹하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 계산된 상인 서명을 상기 알려진 스팸 상인들의 서명들과 비교하는 단계;
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 계산된 상인 서명의 상기 알려진 스팸 상인들의 서명들과의 비교에 기반하여 상기 계산된 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 하나의 서명의 지정된 임계값 내에 있는지를 결정하는 단계; 및
상기 상인 비교 시스템에 의해 동작되는 상기 컴퓨터에 의해, 상기 계산된 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 하나의 서명의 상기 임계값 내에 있다고 결정하는 것에 응답하여 상기 계산된 상인 서명과 연관된 상기 상인을 스팸 상인이라고 식별하는 단계를 포함하는 컴퓨터-구현 방법. - 제1항에 있어서, 상기 컴퓨터는 제품 비교 웹사이트를 관리하는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 데이터 값의 각각은 2진수를 포함하고, 상기 데이터 값의 상기 스트링은 논리합(OR) 함수에 의해 분리되는 상기 2진수를 포함하는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 상인으로부터의 상기 파일 데이터를 프로세싱하는 단계는,
상기 컴퓨터에 의해, 상기 상인으로부터의 상기 제안 피드를 수신하는 단계; 및
상기 컴퓨터에 의해, 상기 제안 피드를 제품에 대한 상기 복수의 제품 제안으로 파싱하는 단계를 포함하되, 상기 복수의 제품 제안의 각각은 제품에 대한 표제 및 가격을 포함하는 것인 컴퓨터-구현 방법. - 제1항에 있어서, 상기 복수의 제품 제안의 각각으로부터의 상기 엘리먼트를 파싱할 때 n-그램 모델(n-gram model)이 사용되는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 서명은 해시 알고리즘(hash algorithm)을 사용하여 계산되는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 복수의 제품 제안의 각각의 상기 엘리먼트는 제품 표제를 포함하는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 복수의 제품 제안의 각각의 상기 엘리먼트는 제품 설명을 포함하는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 상인 서명을 상기 알려진 스팸 상인들의 서명들과 비교하는 단계는 상기 알려진 스팸 상인들의 서명들을 클러스터링하는 단계를 더 포함하는 것인 컴퓨터-구현 방법.
- 제1항에 있어서, 상기 스팸 상인은 사기성 상인 및 악성 상인 중 하나인 것인 컴퓨터-구현 방법.
- 컴퓨터에 의해 실행될 때 스팸 상인을 검출하기 위한 방법을 수행하는 컴퓨터-판독 가능 프로그램 코드가 수록되어 있는 비-일시적 컴퓨터-판독 가능 매체로서, 상기 컴퓨터-판독 가능 프로그램 코드는,
상인으로부터 수신된 제안 피드를 프로세싱하기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 제안 피드는 상기 상인에 의한 판매를 위한 복수의 제품에 대한 파일 데이터를 포함하는 것인, 상기 프로세싱하기 위한 컴퓨터-판독 가능 프로그램 코드;
상기 상인에 대한 상인 서명을 계산하기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 상인 서명은 상기 상인으로부터 수신된 상기 제안 피드 내 복수의 제품 제안의 각각의 엘리먼트로부터 컴퓨팅된 수치 값인 것인, 상기 계산하기 위한 컴퓨터-판독 가능 프로그램 코드;
알려진 스팸 상인들의 서명들을 마킹하기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 스팸 상인들은 이전에 제출된 악성 또는 사기성 파일 데이터를 갖는 것으로 알려져 있는 것인, 상기 마킹하기 위한 컴퓨터-판독 가능 프로그램 코드;
상기 상인 서명을 상기 알려진 스팸 상인들의 서명들과 비교하기 위한 컴퓨터-판독 가능 프로그램 코드;
상기 상인 서명의 상기 알려진 스팸 상인들의 서명들과의 비교에 기반하여 상기 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 하나의 서명의 지정된 임계값 내에 있다고 결정하기 위한 컴퓨터-판독 가능 프로그램 코드; 및
상기 컴퓨터에 의해, 상기 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 하나의 서명의 상기 지정된 임계값 내에 있다고 결정하는 것에 응답하여 상기 상인 서명과 연관된 상기 상인을 스팸 상인이라고 식별하기 위한 컴퓨터-판독 가능 프로그램 코드를 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체. - 제11항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 제품 제안의 각각의 상기 엘리먼트는 제품 표제를 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체.
- 제11항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 제품 제안의 각각의 상기 엘리먼트는 제품 설명을 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체.
- 제11항에 있어서, 상기 상인으로부터의 상기 파일 데이터를 프로세싱하기 위한 상기 컴퓨터-판독 가능 프로그램 코드는,
상기 상인에 대한 상기 제안 피드를 수신하기 위한 컴퓨터-판독 가능 프로그램 코드; 및
상기 제안 피드를 제품에 대한 복수의 제품 제안으로 파싱하기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 복수의 제품 제안의 각각은 제품에 대한 표제 및 가격을 포함하는 것인, 상기 파싱하기 위한 컴퓨터-판독 가능 프로그램 코드를 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체. - 제11항에 있어서, 상기 상인 서명을 계산하기 위한 상기 컴퓨터-판독 가능 프로그램 코드는,
상기 복수의 제품 제안의 각각으로부터의 상기 엘리먼트를 파싱하기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 엘리먼트는 상기 제품 제안의 필수 엘리먼트인 것인, 상기 파싱하기 위한 컴퓨터-판독 가능 프로그램 코드;
데이터 값을 상기 복수의 제품 제안의 각각에 대한 상기 엘리먼트에 배정함으로써 복수의 데이터 값을 발생시키기 위한 컴퓨터-판독 가능 프로그램 코드로서, 상기 데이터 값의 각각은 2진수를 포함하는 것인, 상기 복수의 데이터 값을 발생시키기 위한 컴퓨터-판독 가능 프로그램 코드; 및
상기 복수의 제품 제안의 각각에 대한 상기 데이터 값의 스트링을 발생시키기 위한 컴퓨터-판독 가능 프로그램 코드를 포함하되, 상기 데이터 값의 스트링은 상기 2진수 및 논리합 함수를 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체. - 제15항에 있어서, 상기 제품 제안의 각각으로부터의 상기 엘리먼트를 파싱할 때 n-그램 모델이 사용되는 것인 비-일시적 컴퓨터-판독 가능 매체.
- 제11항에 있어서, 상기 상인 서명을 상기 알려진 스팸 상인들의 서명들과 비교하기 위한 상기 컴퓨터-판독 가능 프로그램 코드는 상기 알려진 스팸 상인들의 서명들을 클러스터링하기 위한 컴퓨터-판독 가능 프로그램 코드를 포함하는 것인 비-일시적 컴퓨터-판독 가능 매체.
- 스팸 상인을 검출하기 위한 시스템으로서, 상기 시스템은,
프로그램을 실행하기 위한 하나 이상의 정보 프로세싱 유닛; 및
상기 하나 이상의 정보 프로세싱 유닛 상에서 실행가능한 엔진을 포함하되, 상기 엔진은,
상인 서명을 계산하기 위한 명령어로서, 상기 상인 서명은 상인에 대하여 제출된 복수의 제안의 각각의 엘리먼트로부터 컴퓨팅된 수치 값인 것인, 상기 계산하기 위한 명령어;
알려진 스팸 상인들의 서명들을 마킹하기 위한 명령어로서, 상기 스팸 상인들은 악성 또는 사기성 파일 데이터를 제공한 것으로 알려져 있는 것인, 상기 마킹하기 위한 명령어;
상기 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 적어도 하나의 서명의 임계값 내에 있는지를 결정하기 위한 명령어; 및
상기 상인 서명이 상기 알려진 스팸 상인들의 서명들 중 적어도 하나의 서명의 상기 임계값 내에 있다고 결정하는 것에 응답하여 상기 상인 서명과 연관된 상기 상인을 스팸 상인이라고 식별하기 위한 명령어를 포함하는 것인 시스템. - 제18항에 있어서, 상기 엔진은 상기 상인에 대하여 수신된 파일 데이터를 프로세싱하기 위한 명령어를 더 포함하되, 상기 파일 데이터는 상기 복수의 제안을 포함하는 것인 시스템.
- 제19항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 복수의 제안의 각각의 엘리먼트는 제품 표제를 포함하는 것인 시스템.
- 제19항에 있어서, 상기 상인 서명을 계산하도록 사용되는 상기 복수의 제안의 각각의 엘리먼트는 제품 설명을 포함하는 것인 시스템.
- 제18항에 있어서, 상기 엔진은,
상기 상인에 대한 파일 데이터를 수신하기 위한 명령어로서, 상기 파일 데이터는 복수의 제안을 포함하는 것인, 상기 수신하기 위한 명령어; 및
상기 파일 데이터를 제품에 대한 상기 복수의 제안으로 파싱하는 명령어를 포함하되, 상기 제품에 대한 복수의 제안은 각각의 제품에 대한 표제 및 가격을 포함하는 것인 시스템. - 제18항에 있어서, 상기 엔진은,
상기 복수의 제안의 각각으로부터의 엘리먼트를 파싱하기 위한 명령어로서, 상기 엘리먼트는 대응하는 제안의 필수 엘리먼트인 것인, 상기 파싱하기 위한 명령어;
상기 복수의 제안의 각각으로부터의 상기 엘리먼트에 데이터 값을 배정하기 위한 명령어로서, 상기 데이터 값은 2진수를 포함하는 것인, 상기 배정하기 위한 명령어; 및
상기 복수의 제안의 각각에 대한 상기 데이터 값의 스트링을 발생시키기 위한 명령어를 더 포함하되, 상기 데이터 값의 스트링은 상기 2진수 및 논리합 함수를 포함하는 것인 시스템. - 제18항에 있어서, 상기 엔진은 상기 상인 서명을 상기 알려진 스팸 상인들의 서명들과 비교하기 위한 명령어를 더 포함하는 것인 시스템.
- 제18항에 있어서, 상기 복수의 제안의 각각으로부터의 상기 엘리먼트를 파싱하도록 n-그램 모델이 사용되는 것인 시스템.
- 제18항에 있어서, 상기 엔진은 상기 알려진 스팸 상인들의 서명들을 클러스터링하기 위한 명령어를 더 포함하는 것인 시스템.
- 제11항에 있어서, 상기 서명은 해시 알고리즘을 사용하여 계산되는 것인 비-일시적 컴퓨터-판독 가능 매체.
- 제18항에 있어서, 상기 서명은 해시 알고리즘을 사용하여 계산되는 것인 시스템.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/443,675 US8396935B1 (en) | 2012-04-10 | 2012-04-10 | Discovering spam merchants using product feed similarity |
US13/443,675 | 2012-04-10 | ||
PCT/US2013/035688 WO2013155022A1 (en) | 2012-04-10 | 2013-04-08 | Discovering spam merchants using product feed similarity |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140139623A KR20140139623A (ko) | 2014-12-05 |
KR101565957B1 true KR101565957B1 (ko) | 2015-11-06 |
Family
ID=47780552
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147031049A KR101565957B1 (ko) | 2012-04-10 | 2013-04-08 | 제품 피드 유사성을 사용하는 스팸 상인 발견 |
Country Status (7)
Country | Link |
---|---|
US (1) | US8396935B1 (ko) |
EP (1) | EP2686821A4 (ko) |
JP (1) | JP5728628B1 (ko) |
KR (1) | KR101565957B1 (ko) |
AU (1) | AU2013246140B2 (ko) |
CA (1) | CA2869888C (ko) |
WO (1) | WO2013155022A1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021021174A1 (en) * | 2019-07-29 | 2021-02-04 | Intuit Inc. | Method and system for real-time automated identification of fraudulent invoices |
US11087334B1 (en) | 2017-04-04 | 2021-08-10 | Intuit Inc. | Method and system for identifying potential fraud activity in a tax return preparation system, at least partially based on data entry characteristics of tax return content |
US11829866B1 (en) | 2017-12-27 | 2023-11-28 | Intuit Inc. | System and method for hierarchical deep semi-supervised embeddings for dynamic targeted anomaly detection |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8059011B2 (en) | 2006-09-15 | 2011-11-15 | Itron, Inc. | Outage notification system |
US8725597B2 (en) * | 2007-04-25 | 2014-05-13 | Google Inc. | Merchant scoring system and transactional database |
US20110225076A1 (en) * | 2010-03-09 | 2011-09-15 | Google Inc. | Method and system for detecting fraudulent internet merchants |
US9811830B2 (en) | 2013-07-03 | 2017-11-07 | Google Inc. | Method, medium, and system for online fraud prevention based on user physical location data |
CN110163714A (zh) * | 2019-04-01 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 一种基于相似度算法挖掘隐藏风险商户的方法和装置 |
US12051071B2 (en) | 2020-08-26 | 2024-07-30 | Capital One Services, Llc | System, method and computer-accessible medium for impaired mode spend protection |
US11604731B2 (en) * | 2020-12-21 | 2023-03-14 | Seagate Technology Llc | Systems and methods for maintaining cache coherency |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090106397A1 (en) | 2007-09-05 | 2009-04-23 | O'keefe Sean Patrick | Method and apparatus for interactive content distribution |
US20090187575A1 (en) * | 2008-01-18 | 2009-07-23 | Sony Corporation | Method and apparatus for use in providing information to accessing content |
US20110225076A1 (en) * | 2010-03-09 | 2011-09-15 | Google Inc. | Method and system for detecting fraudulent internet merchants |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129590A (ja) * | 1994-11-01 | 1996-05-21 | Matsuya Jidosha Kk | 売買契約を推進するための通信システム |
US7403922B1 (en) | 1997-07-28 | 2008-07-22 | Cybersource Corporation | Method and apparatus for evaluating fraud risk in an electronic commerce transaction |
US6199102B1 (en) * | 1997-08-26 | 2001-03-06 | Christopher Alan Cobb | Method and system for filtering electronic messages |
US6546416B1 (en) * | 1998-12-09 | 2003-04-08 | Infoseek Corporation | Method and system for selectively blocking delivery of bulk electronic mail |
US7249175B1 (en) * | 1999-11-23 | 2007-07-24 | Escom Corporation | Method and system for blocking e-mail having a nonexistent sender address |
US6658394B1 (en) | 2000-08-08 | 2003-12-02 | Squaretrade, Inc. | Electronic seals |
KR100800420B1 (ko) * | 2000-09-18 | 2008-02-04 | 엘지전자 주식회사 | 온라인상에서 구매자와 판매자의 인증 서비스 시스템 및그 제어방법 |
US7809650B2 (en) | 2003-07-01 | 2010-10-05 | Visa U.S.A. Inc. | Method and system for providing risk information in connection with transaction processing |
JP2002342611A (ja) * | 2001-05-16 | 2002-11-29 | Nec Corp | オークション代行サーバ及びそれを用いた出品物管理方法並びに出品物管理プログラム |
US20030009698A1 (en) * | 2001-05-30 | 2003-01-09 | Cascadezone, Inc. | Spam avenger |
US20030187759A1 (en) | 2002-03-27 | 2003-10-02 | First Data Corporation | Systems and methods for electronically monitoring fraudulent activity |
JPWO2003098510A1 (ja) * | 2002-05-15 | 2005-11-17 | イーレディー株式会社 | 売買仲介システム及び売買仲介の方法 |
US8046832B2 (en) * | 2002-06-26 | 2011-10-25 | Microsoft Corporation | Spam detector with challenges |
JP2004287966A (ja) * | 2003-03-24 | 2004-10-14 | Nippon Telegr & Teleph Corp <Ntt> | 電子商取引システム、電子商取引装置及び電子商取引プログラム |
US7272853B2 (en) * | 2003-06-04 | 2007-09-18 | Microsoft Corporation | Origination/destination features and lists for spam prevention |
US20050015455A1 (en) * | 2003-07-18 | 2005-01-20 | Liu Gary G. | SPAM processing system and methods including shared information among plural SPAM filters |
US7181761B2 (en) * | 2004-03-26 | 2007-02-20 | Micosoft Corporation | Rights management inter-entity message policies and enforcement |
US7457823B2 (en) * | 2004-05-02 | 2008-11-25 | Markmonitor Inc. | Methods and systems for analyzing data related to possible online fraud |
US7552186B2 (en) * | 2004-06-28 | 2009-06-23 | International Business Machines Corporation | Method and system for filtering spam using an adjustable reliability value |
KR20060020874A (ko) * | 2004-09-01 | 2006-03-07 | 주식회사 케이티 | 구매자 신용등급에 따른 동종 판매자 평가 시스템 및 방법 |
US7822620B2 (en) * | 2005-05-03 | 2010-10-26 | Mcafee, Inc. | Determining website reputations using automatic testing |
US7668769B2 (en) | 2005-10-04 | 2010-02-23 | Basepoint Analytics, LLC | System and method of detecting fraud |
US8065370B2 (en) * | 2005-11-03 | 2011-11-22 | Microsoft Corporation | Proofs to filter spam |
US20070129999A1 (en) | 2005-11-18 | 2007-06-07 | Jie Zhou | Fraud detection in web-based advertising |
JP2007241350A (ja) | 2006-03-06 | 2007-09-20 | Oki Electric Ind Co Ltd | 不正取引防止システム,不正取引防止装置,およびコンピュータプログラム |
JP5217041B2 (ja) * | 2006-10-10 | 2013-06-19 | 日立情報通信エンジニアリング株式会社 | オンライン商取引システム |
KR20100011393A (ko) | 2008-07-25 | 2010-02-03 | 김화랑 | 사기 방지 방법 및 그 장치 |
JP2010123038A (ja) * | 2008-11-21 | 2010-06-03 | Nippon Telegr & Teleph Corp <Ntt> | 関連ウェブページ発見装置、関連ウェブページ発見方法および関連ウェブページ発見プログラム |
US20100161734A1 (en) * | 2008-12-22 | 2010-06-24 | Yahoo! Inc. | Determining spam based on primary and secondary email addresses of a user |
-
2012
- 2012-04-10 US US13/443,675 patent/US8396935B1/en active Active
-
2013
- 2013-04-08 KR KR1020147031049A patent/KR101565957B1/ko active IP Right Grant
- 2013-04-08 WO PCT/US2013/035688 patent/WO2013155022A1/en active Application Filing
- 2013-04-08 AU AU2013246140A patent/AU2013246140B2/en active Active
- 2013-04-08 CA CA2869888A patent/CA2869888C/en active Active
- 2013-04-08 JP JP2015505841A patent/JP5728628B1/ja active Active
- 2013-04-08 EP EP13744415.4A patent/EP2686821A4/en not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090106397A1 (en) | 2007-09-05 | 2009-04-23 | O'keefe Sean Patrick | Method and apparatus for interactive content distribution |
US20090187575A1 (en) * | 2008-01-18 | 2009-07-23 | Sony Corporation | Method and apparatus for use in providing information to accessing content |
US20110225076A1 (en) * | 2010-03-09 | 2011-09-15 | Google Inc. | Method and system for detecting fraudulent internet merchants |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11087334B1 (en) | 2017-04-04 | 2021-08-10 | Intuit Inc. | Method and system for identifying potential fraud activity in a tax return preparation system, at least partially based on data entry characteristics of tax return content |
US11829866B1 (en) | 2017-12-27 | 2023-11-28 | Intuit Inc. | System and method for hierarchical deep semi-supervised embeddings for dynamic targeted anomaly detection |
WO2021021174A1 (en) * | 2019-07-29 | 2021-02-04 | Intuit Inc. | Method and system for real-time automated identification of fraudulent invoices |
Also Published As
Publication number | Publication date |
---|---|
CA2869888A1 (en) | 2013-10-17 |
JP5728628B1 (ja) | 2015-06-03 |
JP2015521306A (ja) | 2015-07-27 |
WO2013155022A1 (en) | 2013-10-17 |
US8396935B1 (en) | 2013-03-12 |
AU2013246140A1 (en) | 2014-10-30 |
EP2686821A1 (en) | 2014-01-22 |
EP2686821A4 (en) | 2014-04-02 |
CA2869888C (en) | 2015-07-28 |
KR20140139623A (ko) | 2014-12-05 |
AU2013246140B2 (en) | 2014-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101565957B1 (ko) | 제품 피드 유사성을 사용하는 스팸 상인 발견 | |
US11830031B2 (en) | Methods and apparatus for detection of spam publication | |
KR102285263B1 (ko) | 제품 타이틀 선택 기법 | |
US11308174B2 (en) | Systems and methods to identify a filter set in a query comprised of keywords | |
KR102035435B1 (ko) | 검색을 시드하는 시스템 및 방법 | |
CN107798571B (zh) | 恶意地址/恶意订单的识别系统、方法及装置 | |
US8412718B1 (en) | System and method for determining originality of data content | |
KR20170052667A (ko) | 향상된 검색 질의어 제안 | |
CN113191838A (zh) | 一种基于异质图神经网络的购物推荐方法及系统 | |
CN114969566B (zh) | 一种距离度量的政务服务事项协同过滤推荐方法 | |
US9086825B2 (en) | Providing supplemental content based on a selected file | |
US8577814B1 (en) | System and method for genetic creation of a rule set for duplicate detection | |
CN110009056B (zh) | 一种社交账号的分类方法及分类装置 | |
CN107665442A (zh) | 获取目标用户的方法及装置 | |
CN116010707A (zh) | 商品价格异常识别方法、装置、设备和存储介质 | |
CN113065573B (zh) | 用户分类方法、用户分类装置及电子设备 | |
JP2017076376A (ja) | 算出装置、算出方法および算出プログラム | |
JP6007300B1 (ja) | 算出装置、算出方法および算出プログラム | |
KR101578606B1 (ko) | Sns 기반 선물 추천 장치 및 방법 | |
Minu et al. | Detecting online spams through supervised learning techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |