CN107710186A - 通过选择性索引进行的搜索引擎优化 - Google Patents
通过选择性索引进行的搜索引擎优化 Download PDFInfo
- Publication number
- CN107710186A CN107710186A CN201680038393.2A CN201680038393A CN107710186A CN 107710186 A CN107710186 A CN 107710186A CN 201680038393 A CN201680038393 A CN 201680038393A CN 107710186 A CN107710186 A CN 107710186A
- Authority
- CN
- China
- Prior art keywords
- product
- machine
- learning model
- data object
- model data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005457 optimization Methods 0.000 title abstract description 7
- 238000000034 method Methods 0.000 claims abstract description 44
- 238000010801 machine learning Methods 0.000 claims description 63
- 230000006399 behavior Effects 0.000 claims description 2
- 230000006872 improvement Effects 0.000 abstract description 4
- 239000000047 product Substances 0.000 description 99
- 230000006870 function Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 19
- 238000003860 storage Methods 0.000 description 17
- 238000005516 engineering process Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 238000001514 detection method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 108010022579 ATP dependent 26S protease Proteins 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 230000000712 assembly Effects 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 238000013480 data collection Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000006855 networking Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 206010021703 Indifference Diseases 0.000 description 1
- 240000002853 Nelumbo nucifera Species 0.000 description 1
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 1
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 239000006227 byproduct Substances 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- 230000008921 facial expression Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0623—Item investigation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
示例实施例涉及识别有价值的查看项目页面以用于搜索引擎优化的系统和方法。该系统和方法提供了对现有系统的改进,现有系统不会识别或选择用于驱动来自显示站点的流量的有价值的查看项目页面。本文描述的系统和方法通过如下方式来改善较早的系统:基于作为输入变量的多个产品等级因子,预测给定产品的未来流量的概率,并且识别对对应于具有最高未来流量的概率的产品的视图项目页面的选择,以便最大化去往对应视图项目页面的链接站点的驱动自然搜索流量。
Description
要求优先权
本申请要求2016年4月18日提交的美国申请No.15/131,139的权益,该美国申请要求2015年6月30日提交的美国临时申请No.62/187,016的优先权权益,其各自通过引用整体并入本文。
技术领域
本申请涉及用于搜索引擎优化的系统和方法。
背景技术
搜索引擎索引收集、分析和存储数据,以促进快速和准确的信息检索。存储索引的目的是优化在寻找搜索查询的相关文档时的速度和性能。如果没有索引,搜索引擎会扫描语料库中的每个文档,这将需要相当多的时间和计算能力。例如,虽然可以在毫秒内查询10,000个文档的索引,但是对10,000个大文档中的每个词的顺序扫描可能需要几个小时。为了在信息检索期间节省时间,对存储索引所需的额外计算机存储器以及进行更新所需的显著增加的时间进行了折中。
附图说明
在附图中通过举例说明而非限制性的方式示出了一些实施例,在附图中:
图1是描绘可以在其中部署一个示例实施例的客户端-服务器系统的网络示图。
图2是示出根据一些示例实施例的适用于针对选择性索引选择有价值的查看项目页面的选择性索引系统的组件的框图。
图3是示出根据一些示例实施例的选择性索引系统在基于被索引的项目来识别有价值的查看项目页面时的操作的流程图。
图4是机器学习(ML)模型的性能如何随决策阈值而变化的图示。
图5是示出了具有计算机系统的示例形式的机器的示图表示,在所述计算机系统中,可以执行一组指令以使所述机器执行本文讨论的方法中的任意一个或多个方法。
具体实施方式
现在将具体参照用于执行本发明主题的具体示例实施例。实施例可以在没有这些细节中的一部分或全部的情况下被实施。将会理解,前述公开不旨在将权利要求的范围限制为所描述的实施例。相反,其旨在涵盖包括在所附权利要求所限定的本公开的范围内的备选方案、修改方案和等同方案。此外,可能没有详细描述公知的特征,以避免不必要地使主题模糊不清。
示例实施例涉及一种用于识别有价值的查看项目页面(VIP)以改善(例如,增加)从搜索引擎(例如,GOOGLETM、BINGTM)去往链接到VIP的站点(例如,链接的站点、EBAYTM等)的流量(traffic)的系统和方法。该系统和方法提供了对现有系统的改善,所述现有系统不会识别或选择在驱动来自显示站点的流量时使用的有价值的VIP。本文所述的系统和方法通过如下方式来改善较早的系统:基于作为输入变量的多个产品等级因子,预测给定产品的未来流量的概率,并且识别对与具有最高未来流量的概率的产品相对应的VIP的选择,以便最大化去往相应VIP(例如EBAY)的链接站点的驱动自然搜索流量。
通过建立机器学习(ML)模型来确定给定项目的未来流量的概率。ML模型基于一组输入来做出数据驱动的预测和决策。在一些示例实施例中,通过梯度提升机器学习技术(GBM)来产生ML模型。GBM是用于回归和分类的机器学习技术,其以弱预测模型(例如,决策树)的组合体(ensemble)的形式产生预测模型。通过提供目标变量(例如,自然搜索流量值)和作为输入数据的样本数据来训练和测试ML模型。ML模型然后可以在样本数据与目标变量输出之间做出相关。
ML模型基于输入变量计算给定产品(或产品集合)的未来流量的概率,该输入变量包括与产品或产品集合对应的VIP的项目等级因子和先前的搜索引擎优化(SEO)性能度量。先前的SEO性能度量包括:例如,自然搜索流量、查看计数、列表类型(例如,取消前有效、拍卖格式、荷式拍卖、现在购买等)、排名加权印象计数、元类别、观看计数、预测质量、类似产品的中间价格、价格、产品销售者列表的数量、在现场的时间、卖家反馈分数、退回计数(例如,用户从入口页面离开站点而没有与页面交互的会话数量)、先前的退回计数、产品的数量、状况和销售数量。在一些实施例中,通过VIP的自然搜索流量被ML模型用作目标变量,以基于GBM技术来计算未来流量的概率。自然搜索流量是将产品作为自然搜索结果返回而不是作为广告呈现的频率。基于通过ML模型计算的自然搜索流量,所述系统被配置为对产品(或产品集合)做出索引或无索引决策。
在计算了一组VIP的未来流量的概率,并且对产品(或产品集合)做出索引和无索引决策之后,ML模型基于索引和无索引决策,从该组VIP中识别多个VIP中的一个,以最大化去往(例如,VIP的)链接站点的流量。例如,系统可访问已经被分类为“索引”的产品的VIP,并且在VIP内插入HTML元标签,指示该VIP是索引页面。搜索引擎使用元标签来确定是否将页面作为搜索结果返回。因此,包括“索引”元标签的网页(例如,产品列表页面,VIP)将被检索并被包括在搜索结果集合中,而包括“无索引”标签的页面将不被示出在搜索结果集合中。因此,通过包括适当的标签(索引或无索引),可以指定在搜索结果集合中是否可以返回页面(例如,VIP)。
图1示出了高级的基于客户端-服务器的网络架构100的示例实施例。具有基于网络的发布或支付系统的示例形式的联网系统102经由网络104(例如互联网或广域网(WAN))向一个或多个客户端设备110提供服务器侧功能。图1示出了例如在客户端设备110上执行的网络客户端112(例如浏览器,比如由华盛顿州雷德蒙德的微软公司开发的浏览器)、客户端应用114和VIP定位器应用116。
客户端设备110可以包括但不限于:可穿戴设备、移动电话、台式计算机、膝上型计算机、便携式数字助理(PDA)、智能电话、平板计算机、超级本、上网本、笔记本计算机、多处理器系统、基于微处理器或可编程的消费电子产品、游戏机、机顶盒或用户可以用来访问联网系统102的任何其他通信设备。在一些实施例中,客户端设备110包括显示模块(未示出)以显示信息(例如,以用户界面的形式)。在另一些实施例中,客户端设备110包括触摸屏、加速度计、陀螺仪、相机、麦克风、全球定位系统(GPS)设备等中的一个或多个。客户端设备110可以是用于执行涉及联网系统102内的数字项目的交易的用户设备。在一个实施例中,联网系统102是基于网络的发布系统,该发布系统响应于对产品清单的请求,发布包括在基于网络的发布系统上可用的产品的项目清单的出版物,并且管理这些交易的支付。网络104的一个或多个部分可以是adhoc网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网的一部分、公共电话交换网(PSTN)的一部分、蜂窝电话网、无线网、WiFi网、WiMax网、另一类型的网络或两个或更多个这样的网络的组合。
客户端设备110可以包括一个或多个客户端应用114(也称作“app”),例如但不限于web浏览器、消息传送应用、电子邮件(email)应用、电子商务站点应用(也称作市场应用)等。在一些实施例中,如果电子商务站点应用被包括在客户端设备110中,则该客户端应用114被配置为本地提供用户界面以及功能中的至少一些,其中该客户端应用114被配置为根据需要与联网系统102通信,以获得本地不可用的数据或处理能力(例如,访问可供销售的项目的数据库、认证用户、验证支付方法)。相反,如果电子商务站点应用未被包括在客户端设备110中,则客户端设备110可以使用其web浏览器来访问联网系统102上容纳的电子商务站点(或其变型)。
一个或多个用户106可以是人、机器或与客户端设备110交互的其他装置。在示例实施例中,用户106不是网络架构100的一部分,但可以经由客户端设备110或其它装置与网络架构100进行交互。例如,用户106向客户端设备110提供输入(例如,触摸屏输入或字母数字输入),并且该输入经由网络104传送给网络系统102。在该实例中,联网系统102响应于接收到来自用户106的输入,经由网络104将信息传送给客户端设备110以呈现给用户106。以这种方式,用户106可以使用客户端设备110与联网系统102交互。
应用程序接口(API)服务器120和web服务器122耦接至一个或多个应用服务器140,并分别向一个或多个应用服务器140提供编程和web接口。应用服务器140可以容纳一个或多个发布系统142和支付系统144,发布系统142和支付系统144中的每一个可以包括一个或多个模块或应用,并且可以以硬件、软件、固件或它们的任意组合来实现。相应地,应用服务器140被示为耦接到一个或多个数据库服务器124,所述数据库服务器便于对一个或多个信息存储库或数据库126的访问。在示例实施例中,数据库126是存储要被发布到发布系统142的信息(例如,发布或列表)的存储设备。根据示例实施例,数据库126还可以存储数字项目信息。
另外,在第三方服务器130上执行的第三方应用132被示为具有经由API服务器120提供的编程接口对联网系统102的编程访问。例如,第三方应用132利用从联网系统102获取的信息,支持第三方所拥有的网站上的一个或多个特征或功能。例如,第三方网站提供由联网系统102的相关应用支持的一个或多个促销的发布、市场或支付功能。
发布系统142向访问联网系统102的用户106提供多个发布功能和服务。支付系统144同样提供多个功能以执行或便于支付和交易。虽然发布系统142和支付系统144在图1中都被示为形成联网系统102的一部分,但是应当理解,在备选实施例中,每个系统142和144可以形成与联网系统102分离且不同的支付服务的一部分。在一些实施例中,支付系统144可以形成发布系统142的一部分。
选择性索引系统150提供可操作来计算给定产品的未来流量的概率的功能,并且基于该概率,选择与具有最高流量的概率的产品对应的查看项目页面集合。例如,选择性索引系统150访问项目集合,生成ML模型,并且基于ML模型预测项目集合中的项目的未来流量的概率。在一些示例实施例中,选择性索引系统150是发布系统142的一部分。
此外,虽然图1示出的基于客户端-服务器的网络架构100采用了客户端-服务器架构,但是本发明主题当然不限于此种架构,并且可以同样良好地应用于例如分布式或对等架构系统。各个发布系统142、支付系统144和选择性索引系统150还可以被实现为独立的软件程序,所述独立的软件程序不一定具有联网能力。
web客户端112可以经由web服务器122所支持的web接口来访问各个发布系统142和支付系统144。类似地,VIP定位器应用116通过API服务器120提供的编程接口来访问由发布系统142和支付系统144提供的各种服务和功能。VIP定位器应用116可以例如生成ML模型以使用户能够预测项目集合中的特定项目的未来流量的概率,并且选择与具有最大未来流量概率的项目对应的查看项目页面,用于以离线的方式通过联网系统102在显示站点处显示,并且执行VIP定位器应用116和联网系统102之间的批量模式通信。
图2是示出根据一些示例实施例的选择性索引系统150的组件的框图,其中将选择性索引系统150配置为识别针对选择性索引的有价值的查看项目页面。示出的选择性索引系统150包括数据收集模块202、建模模块204、索引模块206和项目页面选择模块208,全部模块被配置为彼此通信(例如,经由总线、共享存储器、或交换机)。这些模块202-208中的任何一个或多个可以使用一个或多个处理器210来实现(例如,通过配置这样的一个或多个处理器210来执行针对该模块描述的功能),并且因此可以包括一个或多个处理器210。
所描述的模块202-208中的任何一个或多个可以单独使用硬件(例如,机器的一个或多个处理器210)或硬件和软件的组合来实现。例如,所描述的选择性索引系统150的任何模块可以物理地包括被配置为执行本文描述的针对该模块的操作的处理器210中的一个或多个的布置(例如,机器的一个或多个处理器的子集或其中的部分)。作为另一个示例,选择性索引系统150的任何模块可以包括软件、硬件或两者,其配置具有一个或多个处理器210(例如,机器的一个或多个处理器中的一个)的布置以执行本文描述的针对该模块的操作。因此,选择性索引系统150的不同模块可以包括并且配置这样的处理器210的不同布置或者在不同的时间点配置这样的处理器210的单个布置。此外,选择性索引系统150的任何两个或更多个模块可以被组合成单个模块,并且本文中针对单个模块描述的功能可以在多个模块之间进行细分。此外,根据各种示例实施例,本文描述为在单个机器、数据库或设备中实施的模块可以分布在多个机器、数据库或设备中。
图3是示出根据一些示例实施例的选择性索引系统150在执行基于索引项目来识别有价值的查看项目页面的方法300时的操作的流程图。如图3所示,根据一些示例实施例,作为方法300的一部分(例如前驱任务、子例程或部分),可以执行一个或多个操作302、304、306、308和310。
在操作302中,选择性索引系统150的数据收集模块202访问数据库(例如数据库126)以收集与产品(或产品集合)相关联的输入变量。输入变量包括项目等级因子。例如,所采集的项目等级因子包括产品的自然搜索流量(即,产品作为自然搜索结果被返回而不是作为广告来呈现的频率)、产品的查看计数(即产品列表获得多少“点击”)、价格、产品列表的数量(即在基于网络的发布系统内)、退回计数、提供产品的独家销售商的数量、销售产品的数量、产品在站点上的持续时间、以及搜索引擎优化因子(例如在包括产品列表的发布的标题中的关键词)。
在一些示例实施例中,项目等级因子可以位于本地数据库(例如,数据库126)内或位于第三方服务器130内。例如,数据收集模块202可以从转储(例如数据库转储)中检索项目等级因子作为原始的未编辑数据。
在操作304中,建模模块204使用梯度提升机器(GBM)建模技术来基于输入变量生成机器学习(ML)模型数据对象,以计算产品的未来流量的概率。梯度提升是用于回归和分类问题的机器学习技术,其以弱预测模型(例如,决策树)的组合体(ensemble)的形式产生预测模型。。梯度提升以互动的方式将弱学习者融合为单个强大的学习者。在一些示例实施例中,建模模块204可以另外使用产品的先前的SEO性能来计算概率。
在操作306中,建模模块204基于由收集模块202采集的输入变量来训练ML模型。监督学习技术可以用来使用输入变量训练ML模型。在有监督的学习场景中,模型被提供有示例输入(例如,输入变量)及其期望的输出(例如目标变量),目标是将输入映射到期望的输出。收集模块202可以在预定的时间段(例如,3个月)内访问并监测产品的样本集合(在数据库126内或者在第三方服务器130处)以识别产品的样本集合的搜索流量值。产品的样本集合可以包括具有零搜索流量值(完全没有流量)的产品的一部分以及具有大于零的搜索流量值(任何流量)的一部分。然后可以基于产品的样本集合的搜索流量值来确定目标变量,并将其应用于ML模型。
建模模块204向ML模型提供输入变量和作为目标变量的产品的自然搜索流量。基于输入变量和目标变量,建模模块204训练ML模型以通过识别对应于流量增加的项目等级因子(在输入变量内)使将自然搜索驱动到链接站点的概率最大化。例如,建模模块204可以识别对应于自然搜索流量净增长的项目等级因子集合。
在操作308中,索引模块206基于ML模型向(产品集合中的)产品指派索引状态(例如,“索引”或“无索引”)。例如,索引模块206可以基于由ML模型计算的自然搜索流量的概率将产品索引为“索引”或“无索引”。在一些示例实施例中,索引模块206接收阈值自然搜索流量值,并且基于产品的对应自然搜索流量值和项目等级因子对产品进行索引。例如,阈值自然搜索流量值可以基于由收集模块202监测的产品样本集合的自然搜索流量值。在进一步的示例实施例中,索引模块206可以接收指示该产品集合的自然搜索流量的值,并将该产品集合的自然搜索流量用作阈值。
在操作310中,项目页面选择模块208基于索引的产品来选择有价值的项目页面(VIP)。VIP可以对应于具有最大自然搜索流量概率的产品(根据基于ML模型计算的自然搜索流量值概率)。
在操作312中,项目页面选择模块208向VIP指派“索引”HTML标签。例如,项目页面选择模块可以用“索引”HTML标签简单地标记VIP,其中“索引”HTML标签使VIP通过搜索引擎显示在搜索结果集合中。没有被项目页面选择模块208识别的页面被标记有“无索引”HTML标签,以便防止搜索引擎针对搜索请求来检索页面。
图4是示出机器学习模型的性能如何随着决策阈值(例如,阈值)变化的图表400。如图4所示,x轴402对应于由建模模块204计算的阈值,并且y轴404对应于百分比(例如增益或损失)。如图表400所示,随着阈值增加,沿着y轴404的百分比增加。
在一些实施例中,为了验证ML模型的性能,系统创建验证数据集。验证数据集是通过对产品的无差别随机采样(其不同于产品样本组,不是产品样本集合的一部分)产生的。为了测量ML模型的性能,考虑了验证度量,包括决策阈值,以及预测流量和实际流量之间的相关性。
对于给定的决策阈值,可以从验证数据集中检索以下值:总VIP减少的百分比;由于减少造成的流量损失的百分比;错误否定百分比;购买项目损失的百分比;以及GBM损失的百分比。
图5是示出根据一些示例实施例的识别和索引有价值的查看项目页面的方法500的处理流程的图。参考选择性索引系统150和数据库126之间的交互来描述图5的方法500。数据库126可以存储查看项目页面的语料库。
模块、组件和逻辑
某些实施例在本文中被描述为包括逻辑或多个组件、模块或机制。模块可以构成软件模块(例如在机器可读介质上或在传输信号中体现的代码)或硬件模块。“硬件模块”是能够执行某些操作并可以按特定物理方式来配置或布置的有形单元。在示例实施例中,一个或多个计算机系统(例如独立计算机系统、客户端计算机系统或服务器计算机系统)或计算机系统的一个或多个硬件模块(例如处理器或处理器组)可以由软件(例如,应用或应用部分)配置为进行操作以执行本文描述的某些操作的硬件模块。
在各实施例中,硬件模块可以用机械方式或电子方式来实现。例如,硬件模块可以包括永久地被配置为执行某些操作的专用电路或逻辑(例如,硬件模块可以是专用处理器,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC))。硬件模块还可以包括由软件暂时配置以执行某些操作的可编程逻辑或电路(例如,包含在通用处理器或其它可编程处理器中的可编程逻辑或电路)。应理解:以机械方式、以专用和永久配置的电路或以临时配置的电路(例如由软件配置)实现硬件模块的决策可出于成本和时间的考虑。
因此,短语“硬件模块”应当被理解为包含有形实体,应当是物理构成的、永久配置(例如硬连线的)或暂时配置(例如编程的)以在特定方式下工作或以执行本文描述的特定操作的实体。考虑临时配置(例如编程)硬件模块的实施例,无需在任一时刻配置或实例化硬件模块中的每一个。例如,在硬件模块包括由软件配置的通用处理器的情况下,通用处理器就可以在不同时间被配置为各自不同的硬件模块。因此,软件可以将处理器例如配置为在一个时刻构成特定硬件模块并在另一时刻构成不同的硬件模块。
硬件模块可以向其他硬件模块提供信息并从其他硬件模块接收信息。因此,所描述的硬件模块可以被看作通信地耦接。在多个这种硬件模块同时存在的情况下,可以通过连接硬件模块的信号传输(例如在适当的电路和总线上)来实现通信。在多个硬件模块在不同时间配置或实例化的实施例中,可以例如通过存储并获取多个硬件模块可访问的存储器结构中的信息来实现这样的硬件模块之间的通信。例如,一个硬件模块可以执行操作并在与其通信耦接的存储设备中存储该操作的输出。另一硬件模块接着可以稍后访问存储器设备,以取得并处理所存储的输出。硬件模块还可以发起与输入或输出设备的通信,并且能够对资源(例如信息的集合)进行操作。
此处描述的示例方法的各种操作可以至少部分地由临时配置(例如通过软件)或永久配置为执行相关操作的一个或多个处理器执行。无论是暂时地还是永久地配置,这样的处理器可以构成进行操作以执行一个或多个操作或功能的处理器实现的模块。在一些示例实施例中,本文中提及的“模块”包括处理器实现的模块。
类似地,本文中描述的方法可以至少部分由处理器实现。例如,方法的至少一些操作可由一个或多个处理器或处理器实现的模块执行。某些操作的执行可以分布在一个或多个处理器中,并不只驻留在单个机器中,而是跨多个机器来部署。在一些示例实施例中,处理器可以位于单个位置(例如在家庭环境、办公室环境或服务器群中),而在其他实施例中,处理器可以分布在多个位置。
一个或多个处理器还可以操作以支持在“云计算”环境下的相关操作的执行或作为“软件即服务”(SaaS)的相关操作的执行。例如,至少一些操作可以由一组计算机(例如,包括处理器的机器)来完成,这些操作是可经由网络(例如,互联网)以及经由一个或多个适当的接口(例如,应用程序接口(API))来访问的。
电子装置和系统
示例实施例可以用数字电子电路或者用计算机硬件、固件、软件或它们的组合来实现。示例实施例可以使用计算机程序产品(例如在信息载体中有形地表示的计算机程序)来实现,信息载体例如是由数据处理装置执行的机器可读介质或用于控制数据处理装置的操作的机器可读介质,数据处理装置例如是可编程处理器、计算机或多个计算机。
可以用任何形式的编程语言来编写计算机程序,该编程语言包括:编译或解释语言,并且可以用任何形式来部署计算机程序,包括部署为独立的程序或者部署为适合用于计算环境的模块、子例程、或者其他单元。计算机程序可以被配置为在一个计算机执行或在位于一个地点处的多个计算机上执行或者在分布在多个地点上并通过通信网络互连的多个计算机上执行。
在示例实施例中,操作可以通过一个或多个可编程处理器执行计算机程序来执行,以通过操作输入数据并产生输出来执行功能。方法操作还可以通过由专用逻辑电路(例如,现场可编程门阵列(FPGA)或专用集成电路(ASIC))来执行,并且示例实施例的装置可以实现为专用逻辑电路。
计算系统可以包括客户端和服务器。客户端和服务器一般相互远离并且通常通过通信网络进行交互。客户端和服务器的关系通过在相应计算机上运行并且相互具有客户端-服务器关系的计算机程序来产生。在使用可编程计算系统的实施例中,将清楚的是,需要考虑硬件架构和软件架构二者。具体地,将清楚的是,在永久配置的硬件(例如ASIC)中、在暂时配置的硬件中(例如软件与可编程处理器的组合)、或是在永久配置的与暂时配置的硬件的组合中实现特定功能可以是设计选择。下文阐述了可以在各种示例实施例中部署的硬件架构(例如机器)和软件架构。
示例机器架构和机器可读介质
图5是示出了根据一些示例实施例的能够从机器可读介质(例如,机器可读存储介质)中读取指令并执行本文所讨论的方法中的任何一个或多个的机器500的组件的框图。具体地,图5示出了计算机系统的示例形式的机器500的示意图,其中可以执行指令516(例如,软件、程序、应用、小应用、app或其他可执行代码)以使机器500执行本文讨论的任何一种或多种方法。另外或可选地,所述指令可以实现图2的模块。所述指令将通用的未编程的机器转换成被编程为以所描述的方式执行所描述和示出的功能的特定配置的机器。在备选实施例中,机器500作为独立设备操作或可以耦接(例如,联网)到其他机器。在联网部署中,机器500可以在服务器-客户端网络环境中以服务器机器或客户端机器的能力进行操作,或者在对等(或分布式)网络环境中作为对等机器进行操作。
机器500可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如智能手表)、智能家居设备(例如智能家电)、其它智能设备、web设备、网络路由器、网络交换机、网络桥接器、或能够顺序地或以其它方式执行指定机器500要采取的动作的指令516的任意机器。此外,尽管仅示出了单个机器500,但是术语“机器”也将被认为包括机器500的集合,机器800单独地或联合地执行指令516以执行本文讨论的方法中的任何一个或多个。
机器500包括可被配置为诸如经由总线502彼此通信的处理器510、存储器530和I/O组件550。在示例实施例中,处理器510(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、专用集成电路(ASIC)、射频集成电路(RFIC)、其他处理器或其任何适当组合)可以包括例如可以执行指令516的处理器512和处理器514。术语“处理器”旨在包括可以包括可以同时执行指令的两个或更多个独立处理器(有时称为“核”)的多核处理器。尽管图5示出了多个处理器,但是机器500可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理)、具有单个核的多个处理器、具有多个核的多个处理器或其任意组合。
存储器/存储设备530可以包括存储器532(比如,主存储器或其它存储储存设备)、以及存储单元536,存储器器932和存储单元936两者都可例如经由总线502由处理器510访问。存储单元536和存储器532存储体现本文所述的任何一种或多种方法或功能的指令516。在机器500执行指令516期间,指令516还可以完全地或部分地驻留在存储器532内、存储单元536内、处理器510(例如,在处理器的高速缓存存储器内)的至少一个内、或其任何合适的组合内。因此,存储器532、存储单元536和处理器510的存储器是机器可读介质的示例。
如本文所使用,“机器可读介质”是指能够暂时或永久地存储指令和数据的设备,并且可以包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪速存储器、光学介质、磁性介质、高速缓冲存储器、其它类型的存储器(例如,可擦除可编程只读存储器(EEPROM))和/或其任何合适的组合。术语“机器可读介质”应被视为包括能够存储指令516的单个介质或多个介质(例如集中式或分布式数据库、或相关联的缓存和服务器)。术语“机器可读介质”还将被认为包括能够存储被机器(例如机器500)执行的指令(例如,指令516)的任何介质或多个介质的组合,使得指令在被机器500的一个或多个处理器(例如,处理器510)执行时,使机器500执行本文所描述的方法中的任何一个或多个。因此,“机器可读介质”指单个存储装置或设备、以及包括多个存储装置或设备的“基于云”的存储系统或存储网络。
I/O组件550可以包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量等的各种组件。包括在特定机器中的特定I/O组件550将取决于机器的类型。例如,诸如移动电话的便携式机器可能会包括触摸输入设备或其它这样的输入机构,而无头服务器机器可能不包括这样的触摸输入设备。应当理解,I/O组件550可以包括图5中未示出的许多其他组件。可以根据功能将I/O组件550分组,以仅用于简化以下讨论,并且分组不以任何方式进行限制。在各种示例实施例中,I/O组件550可以包括输出组件552和输入组件554。输出组件552可以包括可视组件(例如显示器,比如等离子体显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学组件(例如,扬声器)、触觉组件(例如,振动马达、阻抗机构)、其他信号发生器等。输入组件554可以包括字母数字输入组件(例如,键盘、被配置为接收字母数字输入的触摸屏、光电键盘或其他字母数字输入组件)、基于点的输入组件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他定点仪器)、触觉输入组件(例如,物理按钮、提供触摸或触摸手势的位置和力的触摸屏、或其他触觉输入组件)、音频输入组件(例如,麦克风)等。
在另一些示例实施例中,I/O组件550可以包括生物测定组件556、运动组件558、环境组件560或位置组件562、以及许多其他组件。例如,生物测定组件556可包括用于检测表达(例如,手表达、面部表情、语音表达、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、汗水或脑波)、识别人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的组件。运动组件558可包括加速度传感器组件(例如,加速度计)、重力传感器组件、旋转传感器组件(例如,陀螺仪)等。环境组件560可以包括例如照度传感器组件(例如,光度计)、温度传感器组件(例如,检测环境温度的一个或多个温度计)、湿度传感器组件、压力传感器组件(例如气压计)、声学传感器组件(例如,检测背景噪声的一个或多个麦克风)、接近传感器组件(例如,检测附近物体的红外传感器)、气体传感器(例如,为安全而检测有害气体浓度或测量大气中的污染物的气体检测传感器)、或可以提供对应于周围物理环境的指示、测量或信号的其他组件。定位组件562可以包括位置传感器组件(例如,全球定位系统(GPS)接收机组件)、高度传感器组件(例如,高度计或检测气压的气压计(根据气压可以导出高度))、取向传感器组件(例如,磁力计)等。
可以使用各种各样的技术来实现通信。I/O组件550可以包括通信组件564,通信组件564可操作以分别经由耦接582和耦接572来将机器500耦接到网络580或设备570。例如,通信组件564可以包括网络接口组件或与网络580接口连接的其他合适设备。在另一些示例中,通信组件564可以包括有线通信组件、无线通信组件、蜂窝通信组件、近场通信(NFC)组件、组件(例如低能耗)、组件、以及经由其他模态提供通信的其他通信组件。设备570可以是另一机器或各种外围设备中的任一种(例如,经由通用串行总线(USB)耦接的外围设备)。
此外,通信组件564可以检测标识符或包括可操作以检测标识符的组件。例如,通信组件564可以包括射频识别(RFID)标签读取器组件、NFC智能标签检测组件、光学读取器组件(例如,用于检测一维条形码(如通用产品代码(UPC)条形码)、多维条形码(如快速响应(QR)码)、Aztec码、数据矩阵(Data Matrix)、数据字(Dataglyph)、MaxiCode、PDF417、超级码、统一商业码缩减空间符号(UCC RSS)-2D条形码、以及其他光学代码)的光学传感器)、或声学检测组件(例如,识别带标签的音频信号的麦克风)。此外,可以经由通信组件564来导出各种信息,例如经由互联网协议(IP)地理位置的位置、经由信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等等。
传输介质
在各种示例实施例中,网络580的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网,互联网的一部分、公共交换电话网络(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、另一类型的网络、或两个或更多个这样的网络的组合。例如,网络580或网络580的一部分可以包括无线或蜂窝网络,并且耦接582可以是码分多址(CDMA)连接、全球移动通信系统(GSM)连接或其他类型的蜂窝或无线耦接。在该示例中,耦接582可以实现各种类型的数据传输技术中的任何一种,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、GSM演进增强数据速率(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他标准、其他远程协议或其他数据传输技术。
指令516可以经由网络接口设备(例如,包括在通信组件564中的网络接口组件)使用传输介质并且利用多个公知的传输协议(例如,超文本传输协议(HTTP))通过网络580发送或接收。类似地,可以使用传输介质经由耦接572(例如,对等耦接)向设备570发送或从其接收指令516。术语“传输介质”应被认为包括能够存储、编码或承载用于被机器500执行的指令516的任意无形介质,并且包括用于促进该软件的通信的数字或模拟通信信号或其他无形介质。传输介质是机器可读介质的一个实施例。
下面的编号示例是实施例。
1.一种系统,包括:
一个或多个处理器;以及
存储指令的存储器,所述指令在由所述一个或多个处理器中的至少一个处理器执行时,使所述系统执行包括以下各项的操作:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;
将目标变量指派给所述机器学习模型数据对象;基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
2.根据示例1所述的系统,其中,所述机器学习模型数据对象是梯度提升的机器模型。
3.根据示例1或示例2所述的系统,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;以及
售出的产品数量。
4.根据示例1至3中任一项所述的系统,其中,所述目标变量包括自然搜索流量值。
5.根据示例1至4中任一项所述的系统,其中,所述指令使得所述系统执行还包括以下各项的操作:基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
6.根据示例1至5中任一项所述的系统,根据权利要求1所述的系统,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括:基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
7.根据示例1至6中任一项所述的系统,根据权利要求1所述的系统,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象的指令包括:将所述输入变量中的一组输入变量与所述目标变量相关联。
8.一种计算机实现的方法,包括:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;将目标变量指派给所述机器学习模型数据对象;
基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
9.根据示例8所述的方法,其中,所述机器学习模型数据对象是梯度提升的机器模型。
10.根据示例8或示例9所述的方法,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;
售出的产品数量。
11.根据示例8至10中任一项所述的方法,其中,所述目标变量包括自然搜索流量值。
12.根据示例8至11中任一项所述的方法,其中,所述方法还包括:
基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
13.根据示例8至12中任一项所述的方法,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引包括:
基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
14.根据示例8至13中任一项所述的方法,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象包括:
将所述输入变量中的一组输入变量与所述目标变量相关联。
15.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;
将目标变量指派给所述机器学习模型数据对象;
基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
16.根据示例15所述的机器可读介质,其中,所述机器学习模型数据对象是梯度提升的机器模型。
17.根据示例15或示例16所述的机器可读介质,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;
售出的产品数量。
18.根据示例15至17中任一项所述的机器可读介质,其中,所述目标变量包括自然搜索流量值。
19.根据示例15至18中任一项所述的机器可读介质,其中,所述指令使得所述系统执行还包括以下各项的操作:
基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
20.根据示例15至19中任一项所述的机器可读介质,其中,用于基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括使所述系统执行包括以下各项的操作:
基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
语言
在整个说明书中,多个实例可以实现被描述为单个实例的组件、操作或构造。虽然一个或多个方法的各个操作被示意和描述为分离的操作,但是各个操作中的一个或多个可以同时执行,并且无需按所示顺序执行操作。在示例配置中被示为分离组件的结构和功能可以被实现为组合结构或组件。类似地,被示为单个组件的结构和功能可以被实现为分离的组件。这些和其他变型、修改、添加和改进落入本主题的范围内。
尽管已经参考具体示例实施例描述了本发明主题的概述,但是在不脱离本公开的实施例的更宽范围的情况下,可以对这些实施例进行各种修改和改变。本发明主题的这些实施例在本文中可以单独地或共同地由术语“发明”提及,以仅仅为了方便,并且不旨在自动地将本申请的范围限制为任何单个公开或发明构思(如果事实上公开了一个以上)。
本文充分详细地描述了示出的实施例以使得本领域技术人员能够实现公开的教导。可以利用并根据这些实施例得出其他实施例,从而可以在不脱离本公开的范围的情况下做出结构和逻辑上的替换和改变。因此,该“具体实施方式”不应当看做是限制意义,并且各种实施例的范围仅通过所附权利要求以及权利要求的等同物的全部范围来限定。
如本文所使用的,术语“或”可以被解释为包括性或排他性的意义。此外,可以针对本文中描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、模块、引擎和数据存储之间的边界在某种程度上是任何的,并且在具体说明性配置的上下文中示出了特定操作。设想了功能的其他分配,并且这些指派可以落入本公开的各种实施例的范围内。一般来说,在示例配置中作为单独资源呈现的结构和功能可以被实现为组合的结构或资源。类似地,作为单个资源呈现的结构和功能可以被实现为单独的资源。这些和其他变型、修改、添加和改进落入由所附权利要求表示的本公开的实施例的范围内。因此,说明书和附图应当被看做说明性的而不是限制意义的。
Claims (20)
1.一种系统,包括:
一个或多个处理器;以及
存储指令的存储器,所述指令在由所述一个或多个处理器中的至少一个处理器执行时,使所述系统执行包括以下各项的操作:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;
将目标变量指派给所述机器学习模型数据对象;
基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
2.根据权利要求1所述的系统,其中,所述机器学习模型数据对象是梯度提升的机器模型。
3.根据权利要求1所述的系统,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;以及
售出的产品数量。
4.根据权利要求1所述的系统,其中,所述目标变量包括自然搜索流量值。
5.根据权利要求1所述的系统,其中,所述指令使得所述系统执行还包括以下各项的操作:
基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
6.根据权利要求1所述的系统,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括:
基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
7.根据权利要求1所述的系统,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象的指令包括:
将所述输入变量中的一组输入变量与所述目标变量相关联。
8.一种计算机实现的方法,包括:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;
将目标变量指派给所述机器学习模型数据对象;
基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
9.根据权利要求8所述的方法,其中,所述机器学习模型数据对象是梯度提升的机器模型。
10.根据权利要求8所述的方法,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;
售出的产品数量。
11.根据权利要求8所述的方法,其中,所述目标变量包括自然搜索流量值。
12.根据权利要求8所述的方法,其中,所述方法还包括:
基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
13.根据权利要求8所述的方法,其中,基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引包括:
基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
14.根据权利要求8所述的方法,其中,基于所述目标变量和所述输入变量训练所述机器学习模型数据对象包括:
将所述输入变量中的一组输入变量与所述目标变量相关联。
15.一种承载指令的机器可读介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项的操作:
从数据库收集输入变量,所述输入变量包括产品的项目等级因子;
基于所述输入变量生成机器学习模型数据对象;
将目标变量指派给所述机器学习模型数据对象;
基于所述目标变量和所述输入变量来训练所述机器学习模型数据对象;
基于已训练的机器学习模型数据对象来计算产品的自然搜索流量概率;以及
基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引。
16.根据权利要求15所述的机器可读介质,其中,所述机器学习模型数据对象是梯度提升的机器模型。
17.根据权利要求15所述的机器可读介质,其中,所述项目等级因子包括:
产品的先前自然搜索流量;
产品的查看计数;
产品的观看计数;
产品的退回计数;
售出的产品数量。
18.根据权利要求15所述的机器可读介质,其中,所述目标变量包括自然搜索流量值。
19.根据权利要求15所述的机器可读介质,其中,所述指令使所述系统执行还包括以下各项的操作:
基于产品的所述自然搜索流量概率和所述项目等级因子来识别与产品对应的有价值的项目页面。
20.根据权利要求15所述的机器可读介质,其中,用于基于产品的所述自然搜索流量概率和所述项目等级因子对产品进行索引的指令包括使所述系统执行包括以下各项的操作:
基于产品的自然搜索流量和所述项目等级因子为产品指派索引状态。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562187016P | 2015-06-30 | 2015-06-30 | |
US62/187,016 | 2015-06-30 | ||
US15/131,139 | 2016-04-18 | ||
US15/131,139 US10846276B2 (en) | 2015-06-30 | 2016-04-18 | Search engine optimization by selective indexing |
PCT/US2016/032065 WO2017003564A1 (en) | 2015-06-30 | 2016-05-12 | Search engine optimization by selective indexing |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107710186A true CN107710186A (zh) | 2018-02-16 |
CN107710186B CN107710186B (zh) | 2024-06-07 |
Family
ID=57608874
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680038393.2A Active CN107710186B (zh) | 2015-06-30 | 2016-05-12 | 通过选择性索引进行的搜索引擎优化 |
Country Status (5)
Country | Link |
---|---|
US (3) | US10846276B2 (zh) |
EP (1) | EP3317781A4 (zh) |
KR (1) | KR102224731B1 (zh) |
CN (1) | CN107710186B (zh) |
WO (1) | WO2017003564A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10846276B2 (en) | 2015-06-30 | 2020-11-24 | Ebay Inc. | Search engine optimization by selective indexing |
CN113518983A (zh) * | 2018-12-14 | 2021-10-19 | 泰必高软件公司 | 用于处理大宽数据的过程控制工具 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102013017085A1 (de) * | 2012-10-15 | 2014-04-17 | Wixpress Ltd. | System für eine tiefe Verknüpfung und Suchmaschinenunterstützung für Webseiten, in die eine Drittanwendung und Komponenten integriert sind |
US10540263B1 (en) * | 2017-06-06 | 2020-01-21 | Dorianne Marie Friend | Testing and rating individual ranking variables used in search engine algorithms |
RU2720954C1 (ru) | 2018-12-13 | 2020-05-15 | Общество С Ограниченной Ответственностью "Яндекс" | Способ и система построения поискового индекса с использованием алгоритма машинного обучения |
CN111859078B (zh) * | 2019-04-29 | 2024-04-12 | 百度在线网络技术(北京)有限公司 | 一种信息识别方法、装置及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100198772A1 (en) * | 2009-02-05 | 2010-08-05 | Google Inc. | Determining conversion probability using session metrics |
US20110264609A1 (en) * | 2010-04-22 | 2011-10-27 | Microsoft Corporation | Probabilistic gradient boosted machines |
CN103778548A (zh) * | 2012-10-19 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息与关键词匹配方法、商品信息投放方法及装置 |
CN103942704A (zh) * | 2013-01-18 | 2014-07-23 | 福特全球技术公司 | 用于广告筛选的方法和设备 |
US20140324537A1 (en) * | 2006-11-22 | 2014-10-30 | Proclivity Media, Inc. | E-Commerce Consumer-Based Behavioral Target Marketing Reports |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6708161B2 (en) * | 2000-09-26 | 2004-03-16 | I2 Technologies Us, Inc. | System and method for selective database indexing |
US7707059B2 (en) * | 2002-11-22 | 2010-04-27 | Accenture Global Services Gmbh | Adaptive marketing using insight driven customer interaction |
US20050091580A1 (en) * | 2003-10-25 | 2005-04-28 | Dave Kamholz | Method and system for generating a Web page |
US20070168465A1 (en) * | 2005-12-22 | 2007-07-19 | Toppenberg Larry W | Web Page Optimization Systems |
US7698329B2 (en) * | 2007-01-10 | 2010-04-13 | Yahoo! Inc. | Method for improving quality of search results by avoiding indexing sections of pages |
US8396742B1 (en) * | 2008-12-05 | 2013-03-12 | Covario, Inc. | System and method for optimizing paid search advertising campaigns based on natural search traffic |
US8583502B2 (en) * | 2010-07-16 | 2013-11-12 | Yahoo! Inc. | Value maximizing recommendation systems |
US8386447B2 (en) * | 2010-09-03 | 2013-02-26 | International Business Machines Corporation | Allocating and managing random identifiers using a shared index set across products |
US8589429B1 (en) * | 2011-07-11 | 2013-11-19 | Amazon Technologies, Inc. | System and method for providing query recommendations based on search activity of a user base |
US9798753B1 (en) * | 2011-08-11 | 2017-10-24 | IVP Holding III, LLC | Search result snapshot histories |
US8700583B1 (en) * | 2012-07-24 | 2014-04-15 | Google Inc. | Dynamic tiermaps for large online databases |
US9213749B1 (en) * | 2013-03-15 | 2015-12-15 | Google Inc. | Content item selection based on presentation context |
US20160162596A1 (en) * | 2014-09-05 | 2016-06-09 | Hamlet Francisco Batista Reyes | System and Method for Real-time Search Engine Optimization Issue Detection and Correction |
US10242395B1 (en) * | 2015-04-30 | 2019-03-26 | Amazon Technologies, Inc. | Providing shopping links to items on a network page |
US10846276B2 (en) * | 2015-06-30 | 2020-11-24 | Ebay Inc. | Search engine optimization by selective indexing |
US20170148051A1 (en) * | 2015-11-19 | 2017-05-25 | Groupm Worldwide Llc | Systems and methods for one-to-one advertising management |
CA3177392A1 (en) * | 2020-10-04 | 2022-04-07 | Strong Force Iot Portfolio 2016, Llc | Industrial digital twin systems and methods with echelons of executive, advisory and operations messaging and visualization |
-
2016
- 2016-04-18 US US15/131,139 patent/US10846276B2/en active Active
- 2016-05-12 KR KR1020187002930A patent/KR102224731B1/ko active IP Right Grant
- 2016-05-12 CN CN201680038393.2A patent/CN107710186B/zh active Active
- 2016-05-12 WO PCT/US2016/032065 patent/WO2017003564A1/en active Application Filing
- 2016-05-12 EP EP16818388.7A patent/EP3317781A4/en not_active Ceased
-
2020
- 2020-11-17 US US16/950,636 patent/US11860842B2/en active Active
-
2023
- 2023-11-21 US US18/516,184 patent/US20240086383A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140324537A1 (en) * | 2006-11-22 | 2014-10-30 | Proclivity Media, Inc. | E-Commerce Consumer-Based Behavioral Target Marketing Reports |
US20100198772A1 (en) * | 2009-02-05 | 2010-08-05 | Google Inc. | Determining conversion probability using session metrics |
US20110264609A1 (en) * | 2010-04-22 | 2011-10-27 | Microsoft Corporation | Probabilistic gradient boosted machines |
CN103778548A (zh) * | 2012-10-19 | 2014-05-07 | 阿里巴巴集团控股有限公司 | 商品信息与关键词匹配方法、商品信息投放方法及装置 |
CN103942704A (zh) * | 2013-01-18 | 2014-07-23 | 福特全球技术公司 | 用于广告筛选的方法和设备 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10846276B2 (en) | 2015-06-30 | 2020-11-24 | Ebay Inc. | Search engine optimization by selective indexing |
US11860842B2 (en) | 2015-06-30 | 2024-01-02 | Ebay Inc. | Search engine optimization by selective indexing |
CN113518983A (zh) * | 2018-12-14 | 2021-10-19 | 泰必高软件公司 | 用于处理大宽数据的过程控制工具 |
Also Published As
Publication number | Publication date |
---|---|
WO2017003564A1 (en) | 2017-01-05 |
EP3317781A1 (en) | 2018-05-09 |
US20210073192A1 (en) | 2021-03-11 |
KR102224731B1 (ko) | 2021-03-08 |
US11860842B2 (en) | 2024-01-02 |
CN107710186B (zh) | 2024-06-07 |
EP3317781A4 (en) | 2018-05-09 |
US20240086383A1 (en) | 2024-03-14 |
US10846276B2 (en) | 2020-11-24 |
KR20180022943A (ko) | 2018-03-06 |
US20170004159A1 (en) | 2017-01-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108431809A (zh) | 使用语义含义向量的跨语言搜索 | |
CN107710186A (zh) | 通过选择性索引进行的搜索引擎优化 | |
US20170293695A1 (en) | Optimizing similar item recommendations in a semi-structured environment | |
CN110199276A (zh) | 用方面标记查询 | |
CN107430691A (zh) | 识别图像中描绘的物品 | |
US20170372398A1 (en) | Vector representation of descriptions and queries | |
CN110019348A (zh) | 扩展搜索查询 | |
CN110622153A (zh) | 用于查询分割的方法和系统 | |
CN107534586A (zh) | 网站流量控制的系统和方法 | |
US11741112B2 (en) | Identification of intent and non-intent query portions | |
CN108027930A (zh) | 用于个性化的可操作的通知的系统和方法 | |
US11775601B2 (en) | User electronic message system | |
US20210165838A1 (en) | Context Identification For Content Generation | |
CN108140026A (zh) | 搜索中的多面实体识别 | |
CN109154945A (zh) | 基于数据属性的新连接推荐 | |
CN107851086A (zh) | 使用用户隐式数据增强搜索查询 | |
CN108780440A (zh) | 类别管理 | |
CN108292318A (zh) | 生成概念图 | |
CN110140141A (zh) | 社交网络发起的列表 | |
CN107463590A (zh) | 自动的对话阶段发现 | |
KR20230051361A (ko) | 선택적 인덱싱을 통한 검색 엔진 최적화 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |