CN108431854B - 检测垃圾信息发布 - Google Patents
检测垃圾信息发布 Download PDFInfo
- Publication number
- CN108431854B CN108431854B CN201680076869.1A CN201680076869A CN108431854B CN 108431854 B CN108431854 B CN 108431854B CN 201680076869 A CN201680076869 A CN 201680076869A CN 108431854 B CN108431854 B CN 108431854B
- Authority
- CN
- China
- Prior art keywords
- item
- attribute
- attributes
- image
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 claims abstract description 130
- 238000000034 method Methods 0.000 claims abstract description 103
- 230000004044 response Effects 0.000 claims abstract description 14
- 238000012790 confirmation Methods 0.000 claims description 9
- 230000008859 change Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 21
- 230000015654 memory Effects 0.000 description 17
- 238000000605 extraction Methods 0.000 description 12
- 230000006855 networking Effects 0.000 description 12
- 238000004364 calculation method Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000007726 management method Methods 0.000 description 8
- 238000012549 training Methods 0.000 description 7
- 238000004422 calculation algorithm Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000003086 colorant Substances 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000008451 emotion Effects 0.000 description 2
- 230000002996 emotional effect Effects 0.000 description 2
- 238000007477 logistic regression Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0248—Avoiding fraud
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
- G06Q30/0625—Directed, with specific intent or strategy
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/56—Extraction of image or video features relating to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/64—Three-dimensional objects
- G06V20/653—Three-dimensional objects by matching three-dimensional models, e.g. conformal mapping of Riemann surfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
- G06V40/173—Classification, e.g. identification face re-identification, e.g. recognising unknown faces across different face tracks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L63/00—Network architectures or network communication protocols for network security
- H04L63/14—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
- H04L63/1408—Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
- H04L63/1425—Traffic logging, e.g. anomaly detection
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Multimedia (AREA)
- Marketing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computer Security & Cryptography (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Hardware Design (AREA)
- Signal Processing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
在各种示例实施例中,介绍了使用垃圾信息检测系统来确定垃圾信息发布的系统和方法。垃圾信息检测系统从设备接收物品的图像和该物品的物品属性。此外,垃圾信息检测系统基于接收到的图像来提取图像属性,并比较物品属性和图像属性。此外,垃圾信息检测系统基于该比较来计算置信度分数。此外,垃圾信息检测系统基于置信度分数违反预定阈值来确定物品属性不正确。响应于确定物品属性不正确,垃圾信息检测系统使得在设备的显示器上呈现通知。
Description
相关申请的引用
本申请要求于2015年12月29日提交的美国申请No.14/983,074的优先权,通过引用方式将其全文并入本文中。
技术领域
本公开的实施例通常涉及数据处理的技术领域,具体地,涉及确定发布的准确性。更具体地,但不作为限制,描述了检测垃圾信息发布的技术。
背景技术
常规地,发布可以在在线市场上列出。在一些情况下,发布可以是在线市场上的物品列表。在线市场可以提供针对要购买的和要出售的物品的列表服务。例如,卖家可以在市场上列出待售物品。此外,买家可以浏览在线市场的网站并购买物品。
在线市场可以允许卖家通过下述方式列出物品:向在线市场上传物品的图像,输入物品的物品属性,以及输入关于物品的其它产品信息。具有准确物品属性(例如,产品信息)和准确图像的物品可能具有更大的销售可能性。
附图说明
各附图仅示出了本公开的示例实施例,并且不能被认为是限制其范围。
图1是示出了根据一些示例实施例的联网系统的方框图。
图2是示出了图1的垃圾信息检测系统的示例实施例的方框图,其包括形成图1的客户端-服务器系统的至少一部分的多个模块。
图3示出了根据一些实施例的使用垃圾信息检测系统来确定物品属性的准确性的示例过程图。
图4示出了根据一些实施例的用于由垃圾信息检测系统训练机器学习模型的示例过程。
图5示出了根据一些实施例的使用垃圾信息检测系统的示例销售流程。
图6示出了根据一些实施例的使用垃圾信息检测系统的示例搜索流程。
图7是示出了根据一些实施例的确定与所列待售物品相关联的信息的准确性的示例方法的流程图。
图8是示出了根据一些实施例的计算用于图7中确定信息的准确性的置信度分数的示例方法的流程图。
图9是示出了根据一些示例实施例的机器的组件的方框图,所述机器能够从机器可读介质读取指令并执行本文讨论的方法中的任何一个或多个。
具体实施方式
以下描述包括具体实施示例说明性实施例的系统、方法、技术、指令序列和计算机器程序产品。在以下描述中,出于解释的目的,阐述了许多具体细节以提供对本文讨论的主题的各种实施例的理解。然而,对于本领域技术人员来说明显的是,可以在没有这些具体细节的情况下实践本发明主题的实施例。一般而言,众所周知的指令实例、协议、结构和技术不一定详细示出。
根据一些实施例,发布系统包括已经由发布系统的用户创建的发布。用户可以在发布系统上发布内容。例如,卖家可以通过生成物品列表而在发布系统中列出待售物品。物品列表是发布的示例。卖家可以通过列出待售物品(例如,产品)来开始在线市场上的销售体验。卖家可以从在线市场指定的预定义的类别层次结构列表中选择物品的产品类别。在线市场中的产品类别可以表示按组分层的分类系统中的产品列表的组织。此外,在一些情况下,在类别选择之后,卖家输入产品标题、描述或物品属性(例如,品牌、型号、颜色、样式)。此外,卖家可以上传物品的图像,并选择销售该待售物品的价格。
一旦物品被列出,该物品可供用户从在线市场进行搜索和购买。买家的购物体验可以通过发出搜索查询或通过浏览在线市场的产品目录来开始。在任一种情况下,买家都可能看到符合其标准的物品列表,这可以称为发现尝试。在一些情况下,买家可以使用带有自由格式文本的查询来输入搜索条件。搜索条件可以由应用服务器利用以呈现搜索结果。搜索条件可以包括买家的位置、产品类别、产品属性、品牌、颜色等。基于搜索条件,由应用服务器从存储库或存储索引中检索产品列表。此外,可以基于搜索上下文(例如,搜索条件)中存在的各种因素对产品列表进行排名,并且将排名的产品列表作为搜索结果页面中的有序列表显示给用户。
在一些情况下,搜索结果页面也可以被视为产品描述页面的精简版本的列表。例如,买家可以通过点击搜索结果页面中存在的产品列表中的一个来导航到产品描述页面。买家可以针对给定的搜索上下文在搜索结果页面与产品描述页面之间来回导航。
在常规在线市场中,当同一卖家输入重复列表时,简单地标识垃圾信息列表。在线市场试图阻止卖家列出相同物品或者降低所述物品在搜索结果页面中的排名。
此外,虽然大多数卖家提供有关产品的有效信息,但有一定比例的卖家无意或故意为所列待售物品提供不准确的信息。垃圾信息物品列表可以包括带有不正确、误导性或伪造产品信息的任何物品列表。
当卖家无意或故意为所列待售物品提供不准确的信息时,在线市场上可能出现三种不同的垃圾信息物品列表示例。在第一示例中,卖家张贴品牌X的图片,并填写品牌Y的产品信息,从而操纵或利用搜索引擎在买家搜索品牌Y时返回该物品。在第二示例中,卖家上传产品的产品配件的错误图像,同时提供实际的关于产品的产品信息。在第三示例中,卖家在实际产品的类别中列出产品配件。继续在第三示例中,卖家可能在实际的智能手机类别中列出待售的智能手机外壳,而不是在智能手机外壳类别中列出该物品。
根据一些实施例,本文描述的技术可以通过引入垃圾信息检测框架(例如,垃圾信息检测系统)来减少不正确的列表。垃圾信息检测框架可以使用在列出物品时接收到的物品图像来验证物品的物品属性。此外,基于来自垃圾信息检测框架的确定,可以修改与所列物品相关联的搜索排名。搜索排名可被用于基于来自用户的搜索请求返回搜索结果。
在一些情况下,垃圾信息检测框架从卖家上传的图像中提取信息,并且使用机器学习和自然语言处理技术来根据上传图像确定图像属性。图像属性可以与卖家已经输入的物品属性(例如,物品描述)进行比较。此外,垃圾信息检测框架可以计算表示物品属性不正确(例如,垃圾信息)的可能性的置信度分数。
置信度分数可以表示物品属性与图像属性的重叠度。此外,置信度分数可用于基于提取的图像属性和卖家提供的物品属性将该物品分类为垃圾信息或非垃圾信息。例如,当置信度分数违反预定阈值(例如,置信度分数高于预定阈值,置信度分数低于预定阈值)时,则物品属性与图像属性的重叠度较低,这增加了该物品属性不正确的可能性。此外,当置信度分数高时,则该物品可被标记为垃圾信息列表。
参考图1,示出了基于高级别的客户端-服务器的网络架构105的示例实施例。呈基于网络的发布系统142或支付系统144的示例形式的联网系统102经由网络104(例如,互联网或广域网(WAN))向一个或多个用户设备110(也被称为“客户端设备”)提供服务器端功能。图1示出了例如在用户设备110上执行的网络客户端112、客户端应用程序114和编程客户端116。网络104的一个或多个部分可以是自组织网络、内联网、外联网、虚拟私人网络(VPN)、局域网(LAN)、无线局域网(WLAN)、广域网(WAN),无线广域网(WWAN)、城域网(MAN)、互联网的一部分、公共交换电话网络(PSTN)的一部分、蜂窝电话网络、无线网络、WiFi网络、WiMax网络、另一种类型的网络或者两个或更多个这些网络的组合。
用户设备110可以包括但不限于移动电话、台式计算机、膝上型计算机、便携式数字助理(PDA)、智能手机、平板计算机、超簿本、上网本、膝上型计算机、多处理器系统、基于微处理器的或可编程的消费电子器件、游戏控制台、机顶盒或用户可用来访问联网系统102的任何其它通信设备。在一些实施例中,用户设备110可以包括显示模块以显示信息(例如,呈用户界面的形式)。在另外的示例实施例中,用户设备110可以包括触摸屏、加速度计、陀螺仪、摄像头、麦克风、全球定位系统(GPS)设备等中的一个或多个。用户设备110可以是由用户106用来执行涉及联网系统102内的物品的交易的设备。在一个实施例中,联网系统102是基于网络的市场,其响应对产品列表的请求,发表包括在基于网络的市场上可购得的产品的产品列表(例如,物品列表)的发布,并且管理这些市场交易的支付。
每个用户设备110可以包括一个或多个应用(也称为“应用程序”),诸如但不限于网络浏览器、消息应用程序、电子邮件(email)应用程序、电子商务网站应用程序(也称为作为市场应用)等。在一些实施例中,如果电子商务网站(例如,在线市场)应用程序被包括在给定用户设备110中,则该应用程序被配置成在本地提供用户界面和至少一些功能,在所述功能中该应用程序被配置成根据需要针对本地不可用的数据或处理能力(例如,访问可供销售的物品的数据库、认证用户、验证支付方法等)与联网系统102通信。相反地,如果电子商务网站应用程序没被包括在用户设备110中,则用户设备110可以使用其网络浏览器来访问托管在联网系统102中的电子商务网站(或其变体)。
一个或多个用户106可以是与用户设备110交互的人、机器或其它手段。在示例实施例中,用户106不是网络架构105的一部分,而是可以经由用户设备110或其它手段与网络架构105交互。例如,用户106向用户设备110提供输入(例如,触摸屏输入或字母数字输入),并且所述输入经由网络104传递到联网系统102。在这种情况下,联网系统102响应于从用户106接收到输入而经由网络104将信息传递到用户设备110以呈现给用户106。如此,用户106使用用户设备110与联网系统102交互。
应用程序接口(API)服务器120和网络服务器122耦合到一个或多个应用服务器140,并分别向一个或多个应用服务器140提供编程和网络接口。应用服务器140托管发布系统142、支付系统144以及垃圾信息检测系统150,其中每个系统可以包括一个或多个模块或应用程序,并且其中每个系统可以具体实施为硬件、软件、固件或其任何组合。又将应用服务器140示出为耦合到一个或多个数据库服务器124,该数据库服务器利于访问信息存储库(例如,物品数据库126、卖家数据库127、列表数据库128、离线排名数据库)。在一些情况下,数据库服务器124可以访问离线排名数据库,如稍后在图6中所述。
在一些情况下,列表数据库128是存储要张贴到发布系统142的信息(例如,发布或列表)的存储设备。根据示例实施例,列表数据库128包括当前在线市场上列出的物品的信息,诸如历史价格数据。
物品数据库126可以包括特定物品的物品属性。例如,物品数据库126可以包括特定物品的产品信息和产品描述。
卖家数据库127存储在线市场中的每个卖家的卖家信息。卖家信息可以包括基于先前交易的卖家评级、卖家收到的正面反馈的数量、收到的负面反馈的数量、与买家或潜在买家的沟通消息、先前售出的物品数量、正确运送的物品数量、请求或给出的退款数量或其它派生信息。例如,其它派生信息可以包括基于买家反馈的情绪分析。情绪分析可以基于用于确定买家反馈的文本识别技术。
此外,在一个或多个销售商服务器130上执行的销售商应用程序132被示出为经由API服务器120提供的编程接口对联网系统102进行编程访问。例如,销售商应用程序132利用从联网系统102检索的信息支持由销售商托管的网站上的一个或多个特征或功能。例如,销售商网站提供由联网系统102的相关应用程序支持的一个或多个促销功能、市场功能或支付功能。
发布系统142向访问联网系统102的用户106提供许多发布功能和服务。支付系统144同样提供许多功能来执行或利于支付和交易。虽然发布系统142和支付系统144在图1中示出为两者形成联网系统102的一部分,但应该理解的是,在替代实施例中,每一个系统142和144可以形成与联网系统102分离且不同的服务的一部分。在一些实施例中,支付系统144可以形成发布系统142的一部分。
垃圾信息检测系统150提供可用于使用从发布中列出的物品的图像提取的图像信息来执行各种垃圾信息检测技术的功能。例如,垃圾信息检测系统150接收物品的图像,并从接收图像中提取图像属性。垃圾信息检测系统150使用提取的图像属性来确定卖家输入的物品属性是准确的还是不准确的。可以从物品数据库126、卖家数据库127、列表数据库128或销售商服务器130获得用于确定物品属性的准确性的一些信息。
此外,垃圾信息检测系统150提供对应于事件的通知服务。例如,垃圾信息检测系统150可以基于确定物品属性不正确来向用户106发送通知。当所计算的与物品属性相关联的置信度分数违反预定阈值时,物品属性可能不正确。因此,响应于检测到通知事件(例如,当置信度分数违反预定阈值时),垃圾信息检测系统150向与用户106相关联的用户设备110提供通知消息。在示例实施例中,通知消息包括文本、图形或可听消息,其向用户106提供通知以更新物品属性或物品列表信息。
此外,虽然图1中示出的基于客户端-服务器的网络架构100采用客户端-服务器架构,但是本主题当然不限于这种架构,并且例如可以同样在分布式或对等架构系统中得以良好应用。发布系统142、支付系统144或垃圾信息检测系统150也可以实现为独立软件程序,其不一定具有联网能力。例如,当垃圾信息检测系统150不具有联网能力时,垃圾信息检测系统150可以在不访问应用服务器140的情况下确定不正确的物品属性。
在示例实施例中,网络客户端112经由网络服务器122支持的网络接口访问垃圾信息检测系统150。类似地,编程客户端116经由API服务器120提供的编程接口访问由垃圾信息检测系统150提供的各种服务和功能。编程客户端116例如可以是卖家应用程序(例如,由加利福尼亚州圣何塞市的公司开发的Turbo Lister应用程序)以使卖家能够以离线方式发起并管理联网系统102上的列表,并且执行编程客户端116与联网系统102之间的批量模式通信。
图2是示出图1的垃圾信息检测系统150的示例实施例的方框图,其包括形成图1的网络架构105的至少一部分的多个模块。示出的垃圾信息检测系统150的模块210-270包括应用接口模块210、数据存储接口模块220、图像提取模块230、比较模块240、列表生成模块250、置信度分数计算模块260以及通知管理模块270。在一些实施例中,垃圾信息检测系统150的各组件被包括在图1的应用服务器140中。然而,应该理解的是,在替代实施例中,下文所描述的垃圾信息检测系统150的一个或多个组件另外或可选地包括在其它设备中,所述其他设备如图1的用户设备110或销售商服务器130中的一个或多个。还应该理解的是,垃圾信息检测系统150可被部署在除在线市场之外的系统中。
垃圾信息检测系统150的模块210-270被托管在专用或共享服务器机器上,其通信地耦合以实现服务器机器之间的通信。模块210-270中的一个或多个被部署在一个或多个数据中心中。每个模块210-270通信地耦合到其它模块210-270和各种数据源,以便允许信息在垃圾信息检测系统150的模块210-270之间传递,或者以便允许模块210-270共享和访问公共数据。
应用接口模块210是利于垃圾信息检测系统150与用户设备110、销售商服务器130以及连接到网络104的其它设备之间的数据通信的硬件实现的模块。具体地,应用接口模块210提供用于与一个或多个用户设备110连接的面向用户的图形用户界面(GUI),从而提供双向接口。例如,应用接口模块210与API服务器120接口以向用户设备110提供编程接口或向用户设备110提供网络接口。如此,应用接口模块210利于在垃圾信息检测系统150和用户设备110之间提供功能、网页、数据、代码或其它网络资源。
在操作中,垃圾信息检测系统150(例如,经由应用接口模块210)从一个或多个用户设备110接收数据。从用户设备110接收到的数据对应于与例如图像、物品属性、其它物品信息有关的多个输入或请求;认证;创建或编辑用户帐户;添加、移除或编辑列表数据库128;或共享数据(例如,共享选定的物品或通知),如下面更详细描述。
数据存储接口模块220是利于访问垃圾信息检测系统150的数据的硬件实现的模块。在示例实施例中,数据存储接口模块220与图1的物品数据库126、卖家数据库127以及列表数据库128连接以访问一个或多个用户帐户、销售商帐户、先前列出的物品或当前列出的物品。
图像提取模块230是从接收到的图像中提取图像属性的硬件实现的模块。提取技术在图3、图4和图8中进一步描述。在操作中,图像提取模块230从诸如但不限于图1的用户设备110或销售商服务器130的设备接收与所列待售物品相关联的图像。
比较模块240是将提取的图像属性与从卖家接收的物品属性进行比较以确定物品列表的准确性的硬件实现的模块。比较技术在图3至图8中进一步描述。在操作中,比较模块240从用户设备110接收物品属性并从图像提取模块230接收图像属性以执行比较。
列表生成模块250是利于自动生成在线市场上的列表的硬件实现的模块。基于接收到的指示来更新不正确的物品属性或确定物品列表不是垃圾信息,列表生成模块250生成在线市场上的物品列表。图7进一步描述了由列表生成模块250执行的动作。
置信度分数计算模块260是基于由比较模块240执行的比较来计算置信度分数的硬件实现的模块。置信度分数计算模块260还可以响应于搜索请求对在线市场中的物品列表进行排名。在图7和图8中进一步描述用于置信度分数计算的技术。
通知管理模块270是利于提供与确定物品属性不正确或物品列表是垃圾信息相关的用户通知的硬件实现的模块。在操作中,通知管理模块270基于该确定向用户设备110发送通知以更新物品列表或物品属性。一旦从用户设备110接收到更新物品列表或物品属性的指示,通知管理模块270就向列表生成模块250发信号以在线市场中列出具有正确物品属性的物品列表。
检测垃圾信息列表
常规垃圾信息检测技术基于物品文本信息和列出物品的类别。然而,常规垃圾信息检测技术可能无法过滤出错误的产品。此外,物品图像与物品属性之间的潜在差异可能无法使用基于物品文本信息的常规垃圾信息检测技术来解决。
图3示出了根据一些实施例的使用垃圾信息检测系统150确定物品属性的准确性的示例过程300。在示例实施例中,通过比较由卖家发送的确定的图像属性和接收到的物品属性来识别垃圾信息列表。在操作310处,用户(例如,卖家)可以上传图像以开始销售过程。垃圾信息检测系统150使用图像提取模块230从卖家接收上传的图像,并且根据上传的图像确定(例如,提取)图像属性320。此外,在一些情况下,在操作330处,垃圾信息检测系统150可以使用应用接口模块210来从卖家接收物品属性。例如,卖家可以在生成发布时输入物品属性。
在示例实施例中,在操作320处确定的图像属性是使用图像提取技术获得的。图像提取技术可以包括使用尺度不变特征变换(SIFT)算法技术,使用图像梯度技术,机器视觉算法(例如ImageNet)或使用图像数据库。图像属性可以对应于所列待售物品的物品属性。
在示例实施例中,在操作340处,垃圾信息检测系统150使用比较模块240,通过比较物品属性与提取的图像属性来确定由卖家提供的物品属性的准确性。图像属性可以包括产品属性、物品标题、物品描述、物品颜色、物品品牌等,其已由图像提取模块230在操作320处确定。可使用预训练语言模型来确定(例如,预测)图像属性。预训练语言模型的示例包括递归神经网络(RNN)模型、长期短期记忆(LSTM)模型、隐马尔可夫模型(HMM)等。此外,图像属性可以包括与该物品相关联的物品类别。预训练语言模型可以基于预训练分类器(诸如卷积神经网络(CNN)模型、支持向量机(SVM)或逻辑回归模型)来预测物品类别。
类似地,物品属性可以包括由卖家输入的物品属性、物品标题、物品描述、物品颜色、物品品牌等。
此外,垃圾信息检测系统150使用图像属性和物品属性的比较来确定(例如,预测)物品列表是否是垃圾信息或者从卖家接收到的物品属性是否不正确。在一些情况下,使用物品属性和图像属性来确定列表的准确性基于在操作340处计算的置信度分数(例如,重叠分数)。置信度分数可以由图2中的置信度分数计算模块260计算。可以通过比较图像属性与物品属性来计算置信度分数(例如,重叠分数)。比较和置信度分数计算可以基于基本相似性度量或机器学习分类器。基本相似性度量可以包括余弦相似性、哈希函数、Jaccard相似性等。如前所述,机器学习分类器可以基于SVM模型、逻辑回归模型、神经网络模型等。
随后,垃圾信息检测系统150可以在操作350处使用置信度分数来确定从卖家接收到的物品属性的准确性。例如,当置信度分数违反(例如,高于、低于)预定阈值时,物品属性被确定为不准确。
此外,垃圾信息检测系统150被训练成基于机器学习模型来识别存在于所列物品中的垃圾信息的类型,诸如配件品性被破坏、物品的错误归属或物品的不正确图像。在图4中进一步描述训练由垃圾信息检测系统150使用的机器学习模型的过程。
图4示出了根据一些实施例的用于由垃圾信息检测系统150训练机器学习模型的示例过程400。过程400包括物品属性准确性训练405和垃圾信息检测训练455。
在物品信息训练405示例中,垃圾信息检测系统150从图像410中提取图像属性420。如前所述,当创建物品列表时,可以由卖家上传图像410。此外,垃圾信息检测系统150从多个物品属性430中选择物品属性440。如前所述,当生成发布时,用户可以输入多个物品属性。例如,物品属性可以由卖家在创建物品列表时输入。随后,在操作450处,垃圾信息检测系统150训练机器学习模型以确定选择的物品属性的准确性。例如,提取的图像属性可以是第一品牌名称的标识,而所选择的物品属性可以是第二个品牌名称。假定第一品牌名称与第二品牌名称不同,则垃圾信息检测系统150可以确定他选择的物品属性不正确。或者,提取的图像属性可以是第一品牌名称的标识,并且所选择的物品属性可以是第一品牌名称。假定提取的图像属性和选择的物品属性相同,则垃圾信息检测系统150可以确定他选择的物品属性正确。
在垃圾信息检测训练455的示例中,在操作460处,垃圾信息检测系统150接收图像属性。此外,在操作470处,垃圾信息检测系统150接收物品属性。随后,在操作480处,垃圾信息检测系统150训练分类器以确定物品列表是垃圾信息或物品属性不正确的可能性。在一些情况下,垃圾信息检测系统150可以使用相似性度量技术来确定物品列表是垃圾信息或物品属性不正确的可能性。
将该框架并入电子商务平台
根据一些实施例,垃圾信息检测系统150可以并入到在线市场的销售流程过程中以及在线市场的搜索流程过程中。图5示出了根据一些实施例的使用垃圾信息检测系统150的示例销售流程过程500。图6示出了根据一些实施例的使用垃圾信息检测系统150的示例搜索流程过程600。
在销售流程500的示例中,卖家在市场中列出物品以供销售。在操作510处,卖家捕捉所列待售物品的图像。例如,可以使用用户设备110(例如,膝上型计算机、智能手机、摄像头和平板计算机)来捕捉图像。
在操作520处,卖家通过将物品的图像和物品属性(例如,标题、物品类别、品牌、型号、尺寸、颜色)上传到应用服务器140来生成物品列表。图像和物品属性可由应用服务器140从用户设备110接收。列表生成模块250获取图像和物品属性并生成物品列表。
在操作530处,将生成的物品列表发送到垃圾信息检测系统150,以确定生成的列表是否是垃圾信息。例如,由垃圾信息检测系统150提取图像属性(例如,标题、物品类别和物品属性)并将其发送到机器学习模型以确定由用户输入的物品属性的准确性。垃圾信息检测系统150比较图像属性和物品属性,以确定列表是否是垃圾信息。此外,垃圾信息检测系统150确定由卖家输入的物品属性的准确性。如稍后讨论,图7是示出了根据示例实施例的确定物品列表是否是垃圾信息的示例方法的流程图。
当在操作530处确定生成的物品列表不是垃圾信息时,发布系统142或垃圾信息检测系统150在操作540处将物品列表列出在在线市场上。或者,当在操作530处确定生成的物品列表是垃圾信息时,发布系统142或垃圾信息检测系统150在操作550处防止将发布发表在在线市场上的生成列表上。此外,在操作550之后,垃圾信息检测系统150可以在操作560处使用规则引擎预测模型来确定垃圾信息类别。基于从所生成的列表接收或导出的信息来更新规则引擎预测模型。例如,规则引擎预测模型可以确定图像、物品属性(例如,品牌、颜色)或类别列表是否不正确。使用通知管理模块270将预测的不正确信息的通知发送给卖家。销售可以纠正不正确的信息,以便应用服务器140移除垃圾信息分类器并在在线市场中发布物品列表。
在常规系统中,当搜索结果中存在垃圾信息列表时,往往会降低客户体验。因此,使用本文描述的技术,垃圾信息检测系统150检测垃圾信息列表,并且使垃圾信息物品在显示给用户106的最终排名结果中降级或移除。
现在参考图6,在搜索流程600的示例中,用户(例如,买家)可以在操作610处搜索要购买的物品。搜索请求由用户使用另一个用户设备605发送。另一用户设备605可以类似于用户设备110,但由买家使用。在操作620处,应用服务器140可运行搜索模型以基于搜索请求识别要向用户显示的排名最高的物品列表。随后,垃圾信息检测系统150基于来自排名靠前的物品列表的图像将每个物品列表分类为垃圾信息或非垃圾信息。在操作630处,搜索结果可以基于物品的排名,其中垃圾信息列表可以在排名中降级或者可以从搜索结果中移除。例如,垃圾信息检测系统150可以基于图5和图7中描述的方法将在线市场上的所列待售物品分类作为垃圾信息列表。当物品被分类为垃圾信息时,运行时搜索模型可以使用该信息将物品从排名靠前的物品列表中降级或移除。或者,垃圾信息检测系统150可以在操作650处存储离线排名过程以加快搜索过程。例如,可以对发布进行排名并存储在离线排名数据库中。离线排名数据库可用于离线确定每个列出物品的准确性,从而加快运行时搜索结果。
在操作640处,应用服务器140使用模型特征计算技术向用户呈现搜索结果排名。例如,当用户发布搜索请求(例如,搜索查询)以浏览在线市场中存在的物品列表时,搜索引擎基于各因素和预训练机器学习模型返回经排名的物品列表。如之前在操作630处所述,垃圾信息列表可从操作640处呈现的搜索结果中降级或移除。
图7是示出了根据示例实施例的确定与所列待售物品相关联的信息的准确性的示例方法700的流程图。在该实施例中,方法700包括诸如接收图像和物品属性的操作(操作710),提取图像属性(操作720),基于物品属性和图像属性计算置信度分数(操作730),基于置信度分数确定物品属性不正确(操作740),以及基于比较呈现通知(操作750)。下面将通过解释将示例方法700描述为由某些模块执行。然而,应该理解的是,示例方法700的操作可以通过图2和图9中所示的任意数量的模块以任何合适的顺序执行。除非另有明确说明,否则如在专利文献中常见的那样,在本文使用的术语“一”或“一个”包括一个或一个以上实例。最后,如本文所使用,除非另有明确说明,否则连词“或”是指非排它性的“或”,诸如“和/或”。
在示例实施例中,方法700从操作710处开始,其中垃圾信息检测系统150从用户设备110接收在线市场中所列待售物品的图像(例如,图3中上传的图像310)。此外,垃圾信息检测系统150接收该物品的物品属性(例如,图3中的物品属性330)。在一些情况下,可以从销售商服务器130或连接到网络104的另一设备接收图像或物品属性。例如,图像或物品属性可以由用户设备110,由用户设备110上的API,由用户106,由销售商服务器130或由网络传输。在一些情况下,图像和物品属性由图2的应用接口模块210接收。
在一些情况下,物品属性包括类别分类器。例如,卖家可能会错误地在智能手机类别中列出智能手机外壳。如在方法700和方法800中进一步描述,垃圾信息检测系统150可以基于置信度分数来确定该外壳的正确的类别分类器是智能手机配件。
在操作720处,垃圾信息检测系统150基于在操作710处接收的图像提取图像属性。操作320和340描述了在操作720处执行的提取的示例。在一些情况下,由图2的图像提取模块230执行提取。
在操作730处,垃圾信息检测系统150使用处理器基于物品属性与图像属性的比较来计算置信度分数。可以在操作720处获得图像属性,并且可以在操作710处接收物品属性。例如,该比较使用重叠技术来确定图像属性和物品属性相同或相似的可能性。在一些情况下,物品属性可以在一个范围内以便匹配图像属性。类似地,图像属性可以在一个范围内以便匹配物品属性。例如,当图像属性被确定为第一品牌名称的标识,而物品属性是第二品牌名称时,则计算的置信度分数可以较高(例如,大于0.1)以指示该物品属性不正确。或者,当图像属性被确定为第一品牌名称的标识,并且物品属性是第一品牌名称时,则计算的置信度分数可以较低(例如,小于0.1)以指示该物品属性正确。此外,当置信度分数高于第二预定阈值(例如,大于0.5)时,则该列表可被确定为垃圾信息。
图3中的过程300描述了用于比较图像属性和物品属性以计算置信度分数的技术。此外,图8中的方法800进一步描述了根据一些实施例的用于计算置信度分数的技术。处理器可以被包括在置信度分数计算模块260中。在一些情况下,处理器可以是稍后在图9中描述的处理器902。在一些情况下,比较是基于重叠技术。
在操作740处,垃圾信息检测系统150基于置信度分数违反预定阈值来确定物品属性不正确。例如,当第一预定阈值是0.1并且置信度分数高于0.1时,则垃圾信息检测系统150将物品属性分类为不正确。在一些情况下,当物品属性不正确时,物品列表可简单地在搜索结果排名中降级,如图6的操作630所示。在一些情况下,操作740处的确定由图2的比较模块240和置信度分数计算模块执行。
此外,当置信度分数违反第二预定阈值时,则该列表可以被分类为垃圾信息列表。在一个实施例中,在操作740处,第二预定阈值高于预定阈值。继续在操作740处的示例中,当第二预定阈值为0.5并且置信度分数高于0.5时,则垃圾信息检测系统150可以将物品列表分类为垃圾信息。在一些情况下,当物品列表被分类为垃圾信息时,物品列表可以从搜索结果排名中移除,如图6的操作630所示。
而且,操作740处的确定可以进一步确定与物品列表相关联的错误信息的类型。错误信息的类型可以包括不正确的图像、不正确的物品类别、不正确的物品属性(例如,品牌名称、颜色)等。
响应于在操作740处确定物品属性不正确,垃圾信息检测系统150在操作750处在用户设备110的显示器上呈现通知。例如,通知可以包括到用户设备110的用户106的消息,以基于图像属性将不正确的物品属性修改为建议属性。在一些情况下,通知消息由图2的通知管理模块270发送。
在一些情况下,通知可以指示图像不正确,与所列待售物品相关联的列表类别不正确,与物品相关联的品牌不正确,或者与物品相关联的颜色不正确。
在一些情况下,通知包括将物品属性改变为新属性的请求。此外,垃圾信息检测系统150可以被进一步配置成接收指示将物品属性改变为新属性的响应;基于接收到的确认将物品属性改变为新属性;或者使用新属性在在线市场上发布所列待售物品。例如,新属性可以基于图像属性。或者,新属性基于建议物品属性(例如,邻居属性),建议物品属性是从类似于所列待售物品的另一所列待售物品导出的。可以使用数据存储接口模块220从物品数据库126访问与所列待售物品类似的其它所列待售物品。
在一些情况下,垃圾信息检测系统150可以接收指示拒绝将物品属性改变为新属性的拒绝;并基于接收到的拒绝从在线市场中移除所列待售物品。
在一些情况下,垃圾信息检测系统150可以被进一步配置成从另一个设备接收搜索请求,该搜索请求与该物品属性相关联。垃圾信息检测系统150响应于搜索请求生成与物品属性相关联的搜索结果,该搜索结果具有物品列表,并且基于确定所列待售物品的物品属性不正确来从物品列表中移除所列待售物品。例如,垃圾信息检测系统150可以使用发布系统142生成搜索结果。发布系统142可以生成搜索结果,并且垃圾信息检测系统150可以通过从物品列表中移除所列待售物品或使所列待售物品降级来更新搜索结果。
此外,通知管理模块270可以基于从用户设备110接收到的用于更新不正确的物品属性的指示,通知用户106物品列表正在生成并且被自动张贴到在线市场上。通知消息可以是但不限于文本消息、电话、电子邮件和其它类型的消息。此外,垃圾信息检测系统150可以使得在用户设备110的显示器上呈现通知消息。
此外,通知管理模块270可以基于操作740处的确定向用户设备110呈现与物品列表相关联的错误信息的类型。错误信息的类型可以包括不正确的图像、不正确的物品类别、不正确的物品属性(例如,品牌名称、颜色)等等。
在一些情况下,响应于从用户设备110接收到的用于更新物品列表的指示,垃圾信息检测系统150可以使用更新后的物品信息为在线市场上的物品生成列表。
在一些情况下,用户106经由网站或在线市场的应用程序发起认证过程。应该理解的是,在示例实施例中,用户106以多种附加或替代方式生成认证请求。例如,在线市场链接垃圾信息检测系统150,使得当用户106请求登录列表服务时,在线市场将用户106传送到垃圾信息检测系统150进行认证。即,在示例实施例中,垃圾信息检测系统150向用户106提供网页以认证用户106而不是销售商服务器130的在线市场。因此,垃圾信息检测系统150直接提示用户106进行认证请求,接收认证请求,处理认证请求,并向销售商服务器130提供认证的结果(例如,通过或失败)。在另一个示例中,在用户设备110上执行的应用程序(例如,用于移动设备或台式计算机的软件应用程序)向用户106提供用于认证用户106的GUI。该应用程序对应于专用于用于提供对垃圾信息检测系统150的直接访问的在线市场。垃圾信息检测系统150从应用程序接收认证数据,处理应用程序数据并将结果返回给应用程序。
图8是示出了计算在图7的操作730处使用的置信度分数的示例方法800的流程图。根据一些实施例,置信度分数用于确定图7中信息的准确性。下面将通过解释将方法800描述为由某些模块执行。然而,应该理解的是,方法800的操作可以由图2中所示的任何数量的模块以任何适当的顺序执行。
在操作810处,垃圾信息检测系统150使用数据存储接口模块220从卖家数据库127、物品数据库126或列表数据库128访问附加信息。
列表数据库128可以包括具有销售价格数据的价格数据库。销售价格数据可以包括基于质量、状况或位置的物品的价格范围和平均价格。例如,销售价格数据可以包括所列物品的历史销售价格信息。此外,销售价格数据可以包括过去十二个月或另一时间范围的销售价格信息。时间范围可以由垃圾信息检测系统150预先确定或由用户106选择。
在一些情况下,垃圾信息检测系统150使用用户标识符从卖家数据库127访问关于卖家的卖家信息。例如,可以从用户设备110接收用户标识符以及在方法700的操作710处接收到的其它信息。如前所述,卖家数据库127中的卖家信息包括基于先前交易的卖家评级、卖家收到的正面反馈的数量、收到的负面反馈的数量、与买家或潜在买家的沟通消息、先前售出的物品数量、正确运送的物品数量、请求或给出的退款数量或其它派生信息。例如,其它派生信息可以包括基于买家反馈的情绪分析。情绪分析可以基于用于确定买家反馈的文本识别技术。
此外,列表数据库128可以包括特定物品的产品信息和产品描述。根据一些实施例,垃圾信息检测系统150可以使用类似列出的物品的物品属性来确定在操作710处接收到的物品属性的准确性。此外,垃圾信息检测系统150可以基于在操作810处从物品数据库126访问的信息针对所列待售物品提出建议物品属性。
在操作820处,垃圾信息检测系统150可以基于所访问的信息来更新置信度分数。可以基于卖家信息(例如,卖家的信誉评分)、建议物品属性或建议价格来更新置信度分数。操作820可以通过由置信评分计算模块260配置的处理器来执行。在一些情况下,处理器可以是稍后在图9中描述的处理器902。
在一些情况下,垃圾信息检测系统150可以从卖家数据库127访问列出物品的卖家的卖家信息。此外,垃圾信息检测系统150可以基于卖家信息来更新置信度分数。卖家信息可以包括与正面反馈、与顾客的消息数量、不良的买家体验、先前销售的物品数量、退款请求数量、正确运送的物品等等相关的信息。
在一些情况下,垃圾信息检测系统150可以从物品数据库126访问所列待售物品的建议物品属性,并且基于建议物品属性来更新置信度分数。在一些情况下,建议物品属性是从相似的物品列表中获得的。例如,所列待售物品是具有第一品牌名称的钱包,并且类似物品列表是具有相同第一品牌名称的类似钱包的另一物品列表。建议物品属性可以从类似物品列表的描述中获得。因此,当建议物品属性与物品属性相似时,则物品属性不准确的置信度分数降低。或者,当建议物品属性与物品属性不相似时,则物品属性不准确的置信度分数增加。
在一些情况下,垃圾信息检测系统150可以从列表数据库128或价格数据库中访问所列待售物品的建议价格,并且基于建议价格更新置信度分数。建议价格可以包括类似物品列表的平均价格或价格范围。例如,如果所列待售物品被归类为智能手机,但价格低于在线市场中列出的类似智能手机的平均价格(例如,在价格范围之外),则物品属性(例如,物品类别)不准确的置信度分数降低。当价格超出价格范围时,则列出的物品可能属于错误的类别,因为该物品被确定为智能手机外壳而不是真正的智能手机。
在一些情况下,垃圾信息检测系统150可以从离线排名数据库访问与物品属性相关联的垃圾信息检测分类器,其中该比较还基于垃圾信息检测分类器。例如,图6中的离线排名数据库650可以包括与物品属性或物品列表相关联的垃圾信息检测分类器。
图9是示出根据一些示例实施例的机器900的各组件的方框图,该机器能够从机器可读介质922(例如,非暂时性机器可读介质、机器可读存储介质、计算机可读存储介质或其任何合适的组合)读取指令924并且全部或部分地执行本文讨论的任何一个或多个方法。具体而言,图9示出了呈计算机系统(例如,计算机)的示例形式的机器900,在其内可全部或部分地执行用于使机器900执行本文讨论的任何一个或多个方法的指令924(例如,软件、程序、应用程序、小应用程序、计算机应用程序或其它可执行代码)。垃圾信息检测系统150可以是机器900的示例。
在替代实施例中,机器900作为独立设备进行操作或者可以连接(例如,联网)到其它机器。在联网部署中,机器900可以在服务器-客户端网络环境中以服务器机器或客户端机器的资格进行操作,或者在分布式(例如,对等)网络环境中作为对等机器进行操作。机器900可以是服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、蜂窝电话、智能手机、机顶盒(STB)、个人数字助理(PDA)、网络器械、网络路由器、网络交换机、网络桥接器或能够按顺序或以其它方式执行指定要由该机器执行的动作的指令924的任何机器。此外,虽然仅示出了单个机器,但术语“机器”也应被理解为包括单独或联合执行指令924以执行本文讨论的任何一个或多个方法中的全部或部分的机器的任何集合。
机器900包括处理器902(例如,中央处理单元(CPU)、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)或其任何合适的组合),主存储器904和静态存储器906,其被配置成经由总线908彼此通信。处理器902可以包含由指令924中的一些或全部暂时或永久地可配置的微电路,使得处理器902可配置成全部或部分地执行本文所述的任何一个或多个方法。例如,处理器902的一组一个或多个微电路可经配置以执行本文中所描述的一个或多个模块(例如,软件模块)。
机器900还可以包括图形显示器910(例如,等离子显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪、阴极射线管(CRT)或任何其它能够显示图形或视频的显示器)。机器900还可以包括字母数字输入设备912(例如,键盘或小键盘)、光标控制设备914(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器、眼睛跟踪设备或其它指向仪器)、存储单元916、音频生成设备918(例如,声卡、放大器、扬声器、耳机插孔或其任何适当的组合)以及网络接口设备920。
存储单元916包括机器可读介质922(例如,有形和非暂时性机器可读存储介质),其上存储具体实施本文描述的方法或功能中的任何一个或多个的指令924。指令924还可以在由机器900执行之前或期间,完全或至少部分地驻留在主存储器904内,在处理器902内(例如,处理器的高速缓冲存储器内)或两者内。因此,主存储器904和处理器902可以被认为是机器可读介质922(例如,有形和非暂时性机器可读介质)。指令924可以经由网络接口设备920通过网络34进行传输或接收。例如,网络接口设备920可以使用任何一个或多个传送协议(例如,超文本传送协议(HTTP))来传递指令924。
机器可读介质922可以包括磁性或光盘存储设备、诸如闪存的固态存储设备,或者其它或多个非易失性存储设备。存储在计算机可读存储介质922上的计算机可读指令924是源代码、汇编语言代码、目标代码或由一个或多个处理器902解译的另一种指令格式。
在一些示例实施例中,机器900可以是便携式计算设备,诸如智能手机或平板计算机,并且具有一个或多个附加输入组件930(例如,传感器或仪表)。这类输入组件930的示例包括图像输入组件(例如,一个或多个摄像头)、音频输入组件(例如,麦克风)、方向输入组件(例如,罗盘)、位置输入组件(例如,全球定位系统(GPS)接收器)、定向组件(例如,陀螺仪)、运动检测组件(例如,一个或多个加速度计)、高度检测组件(例如,高度计)和气体检测组件(例如,气体传感器)。由这些输入组件中的任何一个或多个收集的输入可以由本文描述的任何模块访问和使用。
如本文所使用,术语“存储器”是指能够暂时或永久存储数据的机器可读介质922,并且可以被认为包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪存和高速缓冲存储器。虽然机器可读介质922在示例实施例中被示出为单个介质,但是术语“机器可读介质”应该被理解为包括能够存储指令924的单个介质或多个介质(例如,集中式或分布式数据库,或者相关联的高速缓存)。术语“机器可读介质”还应被理解为包括任何介质或多个介质的组合,其能够存储由机器900执行的指令924,使得当指令924由机器900的一个或多个处理器902(例如,处理器902)执行时,使机器900全部或部分地执行本文描述的任何一个或多个方法。因此,“机器可读介质”是指单个存储装置或设备,以及包括多个存储装置或设备的基于云的存储系统或存储网络。因此,术语“机器可读介质”应被理解为包括但不限于以固态存储器、光学介质、磁性介质或其任何适当组合的形式的一个或多个有形(例如,非暂时性)数据存储库。
为了解释的目的,已经参考具体实施例描述了上述描述。然而,上面的说明性讨论并非旨在穷举或将本发明限制于所公开的确切形式。鉴于上述教导,许多修改和变化是可能的。选择并描述实施例以便最好地解释本发明的原理及其实际应用,从而使本领域的其它技术人员能够最佳地利用本发明和各种实施例,其中各种修改适合于预期的特定使用。
在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或结构。虽然一个或多个方法的单独操作被示出和描述为单独的操作,但是单个操作中的一个或多个可以同时执行,并且可以以与所示不同的顺序执行操作。在示例配置中作为独立组件呈现的结构和功能可以实现为组合结构或组件。类似地,作为单个组件呈现的结构和功能可以被实现为单独的组件。这些和其它变化、修改、添加和改进落入本文主题的范围内。
本文将某些实施例描述为包括逻辑或许多组件、模块或机制。模块可以构成软件模块(例如,存储或以其它方式具体实施或携带在包括传输介质的机器可读介质922上的代码)、硬件模块或其任何适当的组合。“硬件模块”是能够执行某些操作并且可以以某种物理方式配置或布置的有形(例如,非暂时性)单元。在各种示例实施例中,一个或多个计算机系统(例如,独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如,处理器或一组处理器902)可以由软件(例如,应用程序或应用程序部分)配置成硬件模块,该硬件模块用于执行如本文所述的某些操作。
在一些实施例中,硬件模块可以机械地、电子地或其任何适当的组合来实现。例如,硬件模块可以包括被永久配置成执行某些操作的专用电路或逻辑。例如,硬件模块可以是专用处理器,诸如现场可编程门阵列(FPGA)或ASIC。硬件模块还可以包括由软件临时配置以执行某些操作的可编程逻辑或电路。例如,硬件模块可以包括包含在通用处理器902或其它可编程处理器902内的软件。将理解,在专用和永久配置的电路中,或者在临时配置的电路中(例如,由软件配置的)机械地实现硬件模块的决定可以由成本和时间考虑因素来驱使。
因此,短语“硬件模块”应该被理解为包括有形实体,并且这类有形实体可以物理构造、永久配置(例如,硬连线)或临时配置(例如,编程)成以某种方式操作或执行本文描述的某些操作。如本文所使用,“硬件实现的模块”是指硬件模块。考虑到其中硬件模块被临时配置(例如,编程)的实施例,每个硬件模块不需要在任何一个时刻被配置或例示。例如,在硬件模块包括由软件配置成专用处理器的通用处理器902的情况下,通用处理器902可以在不同的时间被配置成各自不同的专用处理器(例如,包括不同的硬件模块)。软件(例如,软件模块)可以相应地将一个或多个处理器902配置成例如在一个时刻构成特定的硬件模块并且在不同的时刻构成不同的硬件模块。
硬件模块可以向其它硬件模块提供信息并从其接收信息。因此,所描述的硬件模块可以被视为通信地耦合。在同时存在多个硬件模块的情况下,可以通过两个或更多个硬件模块之间或其中的信号传输(例如,通过适当的电路和总线)来实现通信。在其中多个硬件模块在不同时间被配置或例示的实施例中,可以例如通过存储和检索多个硬件模块可访问的存储器结构中的信息来实现这类硬件模块之间的通信。例如,一个硬件模块可以执行操作并将该操作的输出存储在其通信地耦合到的存储器设备中。然后另一个硬件模块可以在稍后时间访问存储器设备以检索和处理存储的输出。硬件模块也可以启动与输入或输出设备的通信,并且可以对资源(例如,信息的集合)进行操作。
本文描述的示例方法的各种操作可以至少部分地由临时配置(例如,通过软件)或永久配置成执行相关操作的一个或多个处理器902来执行。无论是临时配置还是永久配置,这类处理器902都可以构成处理器实现的模块,其操作来执行本文描述的一个或多个操作或功能。如这里所使用,“处理器实现的模块”是指使用一个或多个处理器902实现的硬件模块。
类似地,本文描述的方法可以至少部分地由处理器实现,处理器902是硬件的示例。例如,方法的至少一些操作可以由一个或多个处理器902或处理器实现的模块来执行。如本文所使用,“处理器实现的模块”是指其中硬件包括一个或多个处理器902的硬件模块。此外,一个或多个处理器902还可以操作以支持“云计算”环境中的相关操作的执行或作为“软件即服务”(SaaS)。例如,可以执行至少一些操作通过一组计算机(作为包括处理器902的机器的示例),这些操作可经由网络104(例如,互联网)以及经由一个或多个适当的接口(例如,应用程序接口(API))来访问。
某些操作的执行可以分布在一个或多个处理器902中,不仅驻留在单个机器内,而且跨多个机器部署。在一些示例实施例中,一个或多个处理器902或处理器实现的模块可以位于单个地理位置中(例如,在家庭环境、办公室环境或服务器场内)。在其它示例实施例中,一个或多个处理器902或处理器实现的模块可以分布在多个地理位置。
以下编号的示例是实施例。
1.一种方法,包括:
从设备接收物品的图像;
接收该物品的物品属性;
基于接收到的图像来提取图像属性,该图像属性与物品属性相关联;
比较物品属性和图像属性;
使用处理器基于该比较来计算置信度分数;
基于置信度分数违反预定阈值来确定物品属性不正确;以及
响应于确定物品属性不正确,使得在设备的显示器上呈现通知。
2.根据示例1的方法,还包括:
从卖家数据库访问列出物品的卖家的卖家信息;以及
基于卖家信息来更新置信度分数。
3.根据示例1或示例2的方法,还包括:
从物品数据库访问所列待售物品的建议物品属性;以及
根据建议物品属性来更新置信度分数。
4.根据示例1至3中任一项的方法,还包括:
从价格数据库中访问所列待售物品的建议价格;以及
基于建议价格来更新置信度分数。
5.根据示例1至3中任一项的方法,其中该物品属性是类别分类器。
6.根据示例1至4中任一项的方法,其中该比较基于重叠技术。
7.根据示例1至5中任一项的方法,还包括:
从离线排名数据库访问与物品属性相关联的垃圾信息检测分类器,并且其中该比较还基于垃圾信息检测分类器。
8.根据示例1至7中任一项的方法,其中该通知包括将物品属性改变为新属性的请求。
9.根据示例8的方法,还包括:
接收针对将物品属性改变为新属性的确认;
基于接收到的确认将物品属性改变为新属性;以及
使用新属性为物品发表发布。
10.根据示例8或示例9的方法,其中该新属性基于图像属性。
11.根据示例8至10中任一项的方法,其中该新属性基于邻居属性,该邻居属性是从类似于该物品的另一物品导出的。
12.根据示例8至11中任一项的方法,还包括:
接收针对将物品属性改变为新属性的拒绝;以及
根据接收到的拒绝来移除物品的发布。
13.根据示例1至12中任一项的方法,还包括:
从第二设备接收搜索请求,该搜索请求与物品属性相关联;
响应于搜索请求生成与物品属性相关联的搜索结果,该搜索结果包括多个物品发布;以及
基于确定物品的物品属性不正确而从搜索结果中移除物品的发布。
14.根据示例1至13中任一项的方法,其中该通知指示图像不正确。
15.根据示例1至14中任一项的方法,其中该通知指示与物品相关联的列表类别不正确。
16.根据示例1至15中任一项的方法,其中该通知指示与物品相关联的品牌不正确,或者与物品相关联的颜色不正确。
17.一种包括指令的机器可读存储介质,该指令在由机器的一个或多个处理器执行时使该机器执行包括操作,所述操作包括:
从设备接收物品的图像;
接收物品的物品属性;
基于接收到的图像来提取图像属性,该图像属性与物品属性相关联;
比较物品属性和图像属性;
使用处理器基于该比较来计算置信度分数;
基于置信度分数违反预定阈值来确定物品属性不正确;以及
响应于确定物品属性不正确,使得在设备的显示器上呈现通知。
18.根据示例17的存储介质,其中该操作还包括:
从卖家数据库访问卖家信息;
从物品数据库访问所列待售物品的建议物品属性;
从列表数据库访问所列待售物品的建议价格;以及
基于卖家信息、建议物品属性或建议价格来更新置信度分数。
19.一种系统,包括:
垃圾信息检测系统,其具有一个或多个处理器,被配置成至少:
从设备接收物品的图像和物品属性;
基于接收到的图像来提取图像属性,该图像属性与物品属性相关联;
比较物品属性和图像属性;
基于该比较来计算置信度分数;
基于置信度分数违反预定阈值来确定物品属性不正确;以及
响应于确定物品属性不正确,使得在设备的显示器上呈现通知。
20.根据示例19的系统,其中垃圾信息检测系统还被配置成:
从卖家数据库访问卖家信息;
从物品数据库中访问所列待售物品的建议物品属性;
从列表数据库访问所列待售物品的建议价格;以及
基于卖家信息、建议物品属性或建议价格来更新置信度分数。
21.一种装置,其包括用于执行根据示例1至16中任一项要求的方法的单元。
22.一种携带机器可读指令的机器可读介质,当该机器可读介质被执行时,实现根据示例1至16中任一项要求的方法。
可以根据对作为位或二进制数字信号存储在机器存储器(例如,计算机存储器)内的数据的操作的算法或符号表示来呈现本文讨论的主题的一些部分。这类算法或符号表示是数据处理领域的普通技术人员用来将他们的工作的实质内容传达给本领域其它技术人员的技术的示例。如本文所使用,“算法”是导致期望结果的操作或类似处理的自洽序列。在该上下文中,算法和操作涉及物理量的物理操纵。典型地但不一定地,这类量可以采取能够被机器存储、访问、传递、组合、比较或以其它方式操纵的电、磁或光信号的形式。有时主要出于常用的原因,使用诸如“数据”、“内容”、“位”、“值”、“元素”、“符号”、“字符”、“术语”、“数字”、“数值”等词语来提及这类信号是很方便的。然而,这些词语只是方便的标签,并且与适当的物理量相关联。
除非另有特别说明,否则本文中使用诸如“处理”、“计算”、“估算”、“确定”、“呈现”、“显示”等的词语的讨论可以指机器(例如,计算机)的动作或过程,其操纵或转换在一个或多个存储器(例如,易失性存储器、非易失性存储器或其任何适当的组合)、寄存器,或接收、存储、传输或显示信息的其它机器组件内表示为物理(例如,电子、磁或光)量的数据。此外,除非另有特别说明,否则如在专利文献中所常见,本文使用的术语“一”或“一个”包括一个或多于一个的实例。最后,如本文所使用,连词“或”是指非排它性的“或”,诸如“和/或”,除非另有特别说明。
Claims (13)
1.一种用于确定要在在线市场上列出的物品的物品属性的方法,包括:
从设备接收物品的图像;
接收所述物品的物品属性,所述物品属性包括类别分类器;
基于所接收的图像来提取图像属性,所述图像属性与所述物品属性相关联;
比较所述物品属性和所述图像属性;
从离线排名数据库访问与所述物品属性相关联的垃圾信息检测分类器,其中所述比较还基于所述垃圾信息检测分类器;
使用处理器基于所述比较来计算置信度分数,并基于列出所述物品的卖家的卖家信息、所列待售物品的建议物品属性或所列待售物品的建议价格来更新所述置信度分数;
基于所述置信度分数违反预定阈值来确定所述物品属性不正确;
基于所述置信度分数来确定所述物品正确的类别分类器;
至少响应于确定所述物品属性不正确,使得在所述设备的显示器上呈现通知,所述通知包括将所述物品属性改变为新属性的请求;
接收针对将所述物品属性改变为所述新属性的确认;
基于所接收的确认将所述物品属性改变为所述新属性;以及
在所述在线市场上发布具有所述新属性的物品列表。
2.根据权利要求1所述的方法,其中所述比较基于重叠技术。
3.根据权利要求1所述的方法,其中所述新属性基于所述图像属性。
4.根据权利要求1所述的方法,其中所述新属性基于邻居属性,所述邻居属性是从类似于所述物品的另一物品导出的。
5.根据权利要求1所述的方法,还包括:
接收针对将所述物品属性改变为所述新属性的拒绝;以及
根据所接收的拒绝来移除所述物品的发布。
6.根据权利要求1所述的方法,还包括:
从第二设备接收搜索请求,所述搜索请求与所述物品属性相关联;
响应于所述搜索请求生成与所述物品属性相关联的搜索结果,所述搜索结果包括多个物品发布;以及
基于确定所述物品的物品属性不正确而从所述搜索结果中移除所述物品的发布。
7.根据权利要求1所述的方法,其中所述通知指示所述图像不正确。
8.根据权利要求1所述的方法,其中所述通知指示与所述物品相关联的列表类别不正确。
9.根据权利要求1所述的方法,其中所述通知指示与所述物品相关联的品牌不正确,或者与所述物品相关联的颜色不正确。
10.一种包括指令的机器可读存储介质,所述指令在由机器的一个或多个处理器执行时使所述机器执行包括操作,所述操作包括:
从设备接收物品的图像;
接收所述物品的物品属性,所述物品属性包括类别分类器;
基于所接收的图像提取图像属性,所述图像属性与所述物品属性相关联;
比较所述物品属性和所述图像属性;
从离线排名数据库访问与所述物品属性相关联的垃圾信息检测分类器,其中所述比较还基于所述垃圾信息检测分类器;
使用处理器基于所述比较来计算置信度分数,并基于列出所述物品的卖家的卖家信息、所列待售物品的建议物品属性或所列待售物品的建议价格来更新所述置信度分数;
基于所述置信度分数违反预定阈值来确定所述物品属性不正确;
基于所述置信度分数来确定所述物品正确的类别分类器;
至少响应于确定所述物品属性不正确,使得在所述设备的显示器上呈现通知,所述通知包括将所述物品属性改变为新属性的请求;
接收针对将所述物品属性改变为所述新属性的确认;
基于所接收的确认将所述物品属性改变为所述新属性;以及
在在线市场上发布具有所述新属性的物品列表。
11.一种用于确定要在在线市场上列出的物品的物品属性的系统,包括:
垃圾信息检测系统,其具有一个或多个处理器,被配置成至少:
从设备接收物品的图像和物品属性,所述物品属性包括类别分类器;
基于所接收的图像来提取图像属性,所述图像属性与所述物品属性相关联;
比较所述物品属性和所述图像属性;
从离线排名数据库访问与所述物品属性相关联的垃圾信息检测分类器,其中所述比较还基于所述垃圾信息检测分类器;
基于所述比较来计算置信度分数,并基于列出所述物品的卖家的卖家信息、所列待售物品的建议物品属性或所列待售物品的建议价格来更新所述置信度分数;
基于所述置信度分数违反预定阈值来确定物品属性不正确;
基于所述置信度分数来确定所述物品正确的类别分类器;
至少响应于确定所述物品属性不正确,使得在所述设备的显示器上呈现通知,所述通知包括将所述物品属性改变为新属性的请求;
接收针对将所述物品属性改变为所述新属性的确认;
基于所接收的确认将所述物品属性改变为所述新属性;以及
在所述在线市场上发布具有所述新属性的物品列表。
12.一种用于确定要在在线市场上列出的物品的物品属性的装置,包括用于执行根据权利要求1至9中任一项所述的方法的单元。
13.一种携带机器可读指令的机器可读介质,所述机器可读指令在被执行时,实现根据权利要求1至9中任一项所述的方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/983,074 US11244349B2 (en) | 2015-12-29 | 2015-12-29 | Methods and apparatus for detection of spam publication |
US14/983,074 | 2015-12-29 | ||
PCT/US2016/068831 WO2017117194A1 (en) | 2015-12-29 | 2016-12-28 | Detection of spam publication |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108431854A CN108431854A (zh) | 2018-08-21 |
CN108431854B true CN108431854B (zh) | 2023-11-17 |
Family
ID=57799916
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680076869.1A Active CN108431854B (zh) | 2015-12-29 | 2016-12-28 | 检测垃圾信息发布 |
Country Status (5)
Country | Link |
---|---|
US (3) | US11244349B2 (zh) |
EP (1) | EP3398150A1 (zh) |
KR (2) | KR102163505B1 (zh) |
CN (1) | CN108431854B (zh) |
WO (1) | WO2017117194A1 (zh) |
Families Citing this family (30)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11244349B2 (en) | 2015-12-29 | 2022-02-08 | Ebay Inc. | Methods and apparatus for detection of spam publication |
US9996590B2 (en) | 2015-12-31 | 2018-06-12 | Ebay Inc. | System and method for identifying miscategorization |
US10438264B1 (en) * | 2016-08-31 | 2019-10-08 | Amazon Technologies, Inc. | Artificial intelligence feature extraction service for products |
US10504172B2 (en) * | 2017-01-09 | 2019-12-10 | Walmart Apollo, Llc | Systems and methods for collecting and updating online product content |
US10275820B2 (en) | 2017-01-31 | 2019-04-30 | Walmart Apollo, Llc | Systems and methods for utilizing a convolutional neural network architecture for visual product recommendations |
US11010643B1 (en) * | 2017-05-10 | 2021-05-18 | Waylens, Inc | System and method to increase confidence of roadway object recognition through gamified distributed human feedback |
CA3075233C (en) * | 2017-09-07 | 2024-03-19 | Studeo Realty Marketing Inc. | Generating sequential visual narratives |
US11438346B2 (en) | 2017-12-08 | 2022-09-06 | Google Llc | Restrict transmission of manipulated content in a networked environment |
US11356474B2 (en) | 2017-12-08 | 2022-06-07 | Google Llc | Restrict transmission of manipulated content in a networked environment |
WO2019133862A1 (en) | 2017-12-29 | 2019-07-04 | Ebay Inc. | Computer vision for unsuccessful queries and iterative search |
US11334612B2 (en) * | 2018-02-06 | 2022-05-17 | Microsoft Technology Licensing, Llc | Multilevel representation learning for computer content quality |
US10861025B2 (en) * | 2018-03-02 | 2020-12-08 | Capital One Services, Llc | Systems and methods of photo-based fraud protection |
US11164300B2 (en) | 2018-08-23 | 2021-11-02 | Walmart Apollo, Llc | System and method for automated electronic catalogue management and electronic image quality assessment |
KR102192327B1 (ko) * | 2018-09-17 | 2020-12-17 | 한국과학기술원 | 스몰 데이터를 이용한 신뢰지수 평가 및 예측 방법 |
US11238507B2 (en) | 2018-12-12 | 2022-02-01 | International Business Machines Corporation | Extracting, validating, and correcting item attribute values in a database |
US10664527B1 (en) * | 2019-01-18 | 2020-05-26 | PolyAI Limited | Response retrieval system and method |
US11042594B2 (en) * | 2019-02-19 | 2021-06-22 | Hearst Magazine Media, Inc. | Artificial intelligence for product data extraction |
US11544331B2 (en) | 2019-02-19 | 2023-01-03 | Hearst Magazine Media, Inc. | Artificial intelligence for product data extraction |
US11605094B2 (en) * | 2019-04-22 | 2023-03-14 | Target Brands, Inc. | System for third party sellers in online retail environment |
US11037207B2 (en) | 2019-08-20 | 2021-06-15 | Shopify Inc. | Channel synchronization engine with call control |
US11164194B2 (en) * | 2019-08-20 | 2021-11-02 | Shopify Inc. | Ecommerce storefront marketing channel synchronization management |
US11386485B2 (en) * | 2019-09-09 | 2022-07-12 | Ebay Inc. | Capture device based confidence indicator |
CN112570287B (zh) * | 2019-09-27 | 2023-05-30 | 北京京东尚科信息技术有限公司 | 一种垃圾分类方法和装置 |
US11238521B2 (en) * | 2019-12-11 | 2022-02-01 | Microsoft Technology Licensing, Llc | Text-based similarity system for cold start recommendations |
US20210233130A1 (en) * | 2020-01-29 | 2021-07-29 | Walmart Apollo, Llc | Automatically determining the quality of attribute values for items in an item catalog |
KR102455321B1 (ko) * | 2020-08-06 | 2022-10-14 | 김진선 | 오픈마켓 상품 페이지의 저작권 가이드 위반 탐지 서비스 장치 및 방법 |
US11868723B2 (en) * | 2021-03-30 | 2024-01-09 | Microsoft Technology Licensing, Llc. | Interpreting text-based similarity |
US20220327550A1 (en) * | 2021-04-07 | 2022-10-13 | Ebay Inc. | Item feature accuracy operations and interfaces in an item listing system |
CN114495103B (zh) * | 2022-01-28 | 2023-04-04 | 北京百度网讯科技有限公司 | 文本识别方法、装置、电子设备和介质 |
KR20230146833A (ko) * | 2022-04-13 | 2023-10-20 | 쿠팡 주식회사 | 아이템 판매를 위한 정보를 처리하는 전자 장치 및 그 방법 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090029145A (ko) * | 2007-09-17 | 2009-03-20 | 주식회사 신한은행 | 서식 이미지 품질 검사방법 및 시스템과 이를 위한 기록매체 |
CN101751642A (zh) * | 2008-12-03 | 2010-06-23 | 清华大学 | 电子商务市场产品/服务信息管理与监测平台 |
CN102262765A (zh) * | 2010-05-27 | 2011-11-30 | 阿里巴巴集团控股有限公司 | 一种发布商品信息的方法及装置 |
CN102339289A (zh) * | 2010-07-21 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 文字信息与图像信息的匹配识别方法及服务器 |
CN103310343A (zh) * | 2012-03-15 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 商品信息发布方法和装置 |
CN103345645A (zh) * | 2013-06-27 | 2013-10-09 | 复旦大学 | 面向网购平台的商品图像类别预测方法 |
CN103458300A (zh) * | 2013-08-28 | 2013-12-18 | 天津三星电子有限公司 | 电视机虚假广告提示方法及系统 |
CN104866468A (zh) * | 2015-04-08 | 2015-08-26 | 清华大学深圳研究生院 | 一种中文虚假顾客评论识别方法 |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7117358B2 (en) | 1997-07-24 | 2006-10-03 | Tumbleweed Communications Corp. | Method and system for filtering communication |
US20030144922A1 (en) * | 2002-01-28 | 2003-07-31 | Schrantz John Paul | Method and system for transactions between persons not sharing a common language, currency, and/or country |
AU2003297295A1 (en) * | 2002-12-30 | 2004-07-29 | Fannie Mae | System and method of processing data pertaining to financial assets |
US7130819B2 (en) | 2003-09-30 | 2006-10-31 | Yahoo! Inc. | Method and computer readable medium for search scoring |
US20050216564A1 (en) * | 2004-03-11 | 2005-09-29 | Myers Gregory K | Method and apparatus for analysis of electronic communications containing imagery |
US7577709B1 (en) * | 2005-02-17 | 2009-08-18 | Aol Llc | Reliability measure for a classifier |
US7751620B1 (en) * | 2007-01-25 | 2010-07-06 | Bitdefender IPR Management Ltd. | Image spam filtering systems and methods |
US8244599B2 (en) * | 2007-02-28 | 2012-08-14 | Ebay Inc. | Methods and systems for social shopping on a network-based marketplace |
US10410161B2 (en) * | 2007-06-14 | 2019-09-10 | The Boeing Company | Method and apparatus for a receiving, inspection, and supplier quality system |
US20130215116A1 (en) * | 2008-03-21 | 2013-08-22 | Dressbot, Inc. | System and Method for Collaborative Shopping, Business and Entertainment |
JP5154364B2 (ja) | 2008-10-24 | 2013-02-27 | 株式会社マキタ | ギヤ室のシール構造 |
US8520909B2 (en) * | 2009-03-11 | 2013-08-27 | Hong Kong Baptist University | Automatic and semi-automatic image classification, annotation and tagging through the use of image acquisition parameters and metadata |
KR101425170B1 (ko) | 2010-11-16 | 2014-08-04 | 한국전자통신연구원 | 영상 촬영 장치의 객체 추적 장치 및 방법과 보안 관리 시스템의 객체 추적 장치 |
US9041707B2 (en) * | 2011-06-01 | 2015-05-26 | Rbm Technologies | Confirming compliance with a configuration |
US8908962B2 (en) * | 2011-09-30 | 2014-12-09 | Ebay Inc. | Item recommendations using image feature data |
US8849911B2 (en) * | 2011-12-09 | 2014-09-30 | Facebook, Inc. | Content report management in a social networking system |
WO2013176761A1 (en) * | 2012-05-25 | 2013-11-28 | Brand Enforcement Services Limited | Systems and methods for determining advertising compliance |
US9396622B2 (en) | 2012-11-02 | 2016-07-19 | Tyco Fire & Security Gmbh | Electronic article surveillance tagged item validation prior to deactivation |
KR101420543B1 (ko) | 2012-12-31 | 2014-08-13 | 삼성전기주식회사 | 다층기판 |
US9892447B2 (en) * | 2013-05-08 | 2018-02-13 | Ebay Inc. | Performing image searches in a network-based publication system |
US9384422B2 (en) * | 2014-04-04 | 2016-07-05 | Ebay Inc. | Image evaluation |
US10043184B2 (en) * | 2014-05-30 | 2018-08-07 | Paypal, Inc. | Systems and methods for implementing transactions based on facial recognition |
US20160005050A1 (en) * | 2014-07-03 | 2016-01-07 | Ari Teman | Method and system for authenticating user identity and detecting fraudulent content associated with online activities |
US10217147B2 (en) * | 2014-09-12 | 2019-02-26 | Ebay Inc. | Mapping products between different taxonomies |
US20170046768A1 (en) * | 2015-08-10 | 2017-02-16 | SVG Media Pvt Ltd | Hybrid recommendation system for recommending product advertisements |
US11244349B2 (en) | 2015-12-29 | 2022-02-08 | Ebay Inc. | Methods and apparatus for detection of spam publication |
-
2015
- 2015-12-29 US US14/983,074 patent/US11244349B2/en active Active
-
2016
- 2016-12-28 KR KR1020187021829A patent/KR102163505B1/ko active Application Filing
- 2016-12-28 EP EP16826641.9A patent/EP3398150A1/en not_active Withdrawn
- 2016-12-28 WO PCT/US2016/068831 patent/WO2017117194A1/en active Application Filing
- 2016-12-28 KR KR1020207027894A patent/KR102326652B1/ko active IP Right Grant
- 2016-12-28 CN CN201680076869.1A patent/CN108431854B/zh active Active
-
2021
- 2021-12-28 US US17/564,000 patent/US11830031B2/en active Active
-
2023
- 2023-10-16 US US18/487,629 patent/US20240046306A1/en active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090029145A (ko) * | 2007-09-17 | 2009-03-20 | 주식회사 신한은행 | 서식 이미지 품질 검사방법 및 시스템과 이를 위한 기록매체 |
CN101751642A (zh) * | 2008-12-03 | 2010-06-23 | 清华大学 | 电子商务市场产品/服务信息管理与监测平台 |
CN102262765A (zh) * | 2010-05-27 | 2011-11-30 | 阿里巴巴集团控股有限公司 | 一种发布商品信息的方法及装置 |
CN102339289A (zh) * | 2010-07-21 | 2012-02-01 | 阿里巴巴集团控股有限公司 | 文字信息与图像信息的匹配识别方法及服务器 |
CN103310343A (zh) * | 2012-03-15 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 商品信息发布方法和装置 |
CN103345645A (zh) * | 2013-06-27 | 2013-10-09 | 复旦大学 | 面向网购平台的商品图像类别预测方法 |
CN103458300A (zh) * | 2013-08-28 | 2013-12-18 | 天津三星电子有限公司 | 电视机虚假广告提示方法及系统 |
CN104866468A (zh) * | 2015-04-08 | 2015-08-26 | 清华大学深圳研究生院 | 一种中文虚假顾客评论识别方法 |
Non-Patent Citations (2)
Title |
---|
中文网络产品评论欺诈性问题研究;胡新海;;内江师范学院学报(第06期);第25-28页 * |
基于Web的智能信息采集及处理系统设计与实现;张帆;李琳娜;杨炳儒;;计算机工程(第18期);第265-267页 * |
Also Published As
Publication number | Publication date |
---|---|
EP3398150A1 (en) | 2018-11-07 |
KR20180100159A (ko) | 2018-09-07 |
US11830031B2 (en) | 2023-11-28 |
US20240046306A1 (en) | 2024-02-08 |
KR102163505B1 (ko) | 2020-10-08 |
KR20200115679A (ko) | 2020-10-07 |
CN108431854A (zh) | 2018-08-21 |
WO2017117194A1 (en) | 2017-07-06 |
KR102326652B1 (ko) | 2021-11-17 |
US20170186032A1 (en) | 2017-06-29 |
US20220122122A1 (en) | 2022-04-21 |
US11244349B2 (en) | 2022-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108431854B (zh) | 检测垃圾信息发布 | |
US20220391646A1 (en) | Image evaluation | |
CN108701014B (zh) | 用于尾部查询的查询数据库 | |
CN108701118B (zh) | 语义类别分类 | |
US10601929B2 (en) | Systems and methods for presenting a state of a communication session | |
US10489842B2 (en) | Large-scale recommendations for a dynamic inventory | |
CN108829808B (zh) | 一种页面个性化排序方法、装置及电子设备 | |
US10324987B2 (en) | Application search using device capabilities | |
US20200394666A1 (en) | Machine Generated Recommendation and Notification Models | |
US20200020000A1 (en) | Generating product descriptions from user reviews | |
US10031976B2 (en) | Personalization platform | |
US20150254680A1 (en) | Utilizing product and service reviews | |
CN109076098B (zh) | 跨不同站点采用数据的方法、系统及介质 | |
US20140280098A1 (en) | Performing application search based on application gaminess | |
WO2023069330A1 (en) | Searching for products through a social media platform | |
KR20220081624A (ko) | 진정 리뷰 선별 방법, 전자기기 및 컴퓨터에서 판독가능한 저장매체에 저장된 프로그램 | |
WO2014193585A1 (en) | Recommendation machine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |