CN116628101A - 使用频繁模式挖掘的浏览节点创建方法和系统 - Google Patents
使用频繁模式挖掘的浏览节点创建方法和系统 Download PDFInfo
- Publication number
- CN116628101A CN116628101A CN202310546391.6A CN202310546391A CN116628101A CN 116628101 A CN116628101 A CN 116628101A CN 202310546391 A CN202310546391 A CN 202310546391A CN 116628101 A CN116628101 A CN 116628101A
- Authority
- CN
- China
- Prior art keywords
- browsing
- items
- node
- nodes
- potential
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000005065 mining Methods 0.000 title claims abstract description 23
- 230000000135 prohibitive effect Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 34
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 10
- 230000007717 exclusion Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000008878 coupling Effects 0.000 description 7
- 238000010168 coupling process Methods 0.000 description 7
- 238000005859 coupling reaction Methods 0.000 description 7
- 239000002184 metal Substances 0.000 description 7
- 229910052751 metal Inorganic materials 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000001413 cellular effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003068 static effect Effects 0.000 description 4
- 239000008186 active pharmaceutical agent Substances 0.000 description 3
- 229910000906 Bronze Inorganic materials 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 239000010974 bronze Substances 0.000 description 2
- KUNSUQLRTQLHQQ-UHFFFAOYSA-N copper tin Chemical compound [Cu].[Sn] KUNSUQLRTQLHQQ-UHFFFAOYSA-N 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 230000001815 facial effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013442 quality metrics Methods 0.000 description 2
- -1 14K) Chemical compound 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000036772 blood pressure Effects 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000003344 environmental pollutant Substances 0.000 description 1
- GVVPGTZRZFNKDS-JXMROGBWSA-N geranyl diphosphate Chemical compound CC(C)=CCC\C(C)=C\CO[P@](O)(=O)OP(O)(O)=O GVVPGTZRZFNKDS-JXMROGBWSA-N 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000007620 mathematical function Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000005693 optoelectronics Effects 0.000 description 1
- 231100000719 pollutant Toxicity 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000004266 retinal recognition Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 229910001174 tin-lead alloy Inorganic materials 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2228—Indexing structures
- G06F16/2272—Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/51—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- User Interface Of Digital Computer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了使用频繁模式挖掘的浏览节点创建方法和系统。浏览节点页面是通过其路径来寻址的。结果,与相应的基于参数的搜索页面相比,网络爬虫有更大可能找到浏览节点。可以通过使用标题或标头元标签来进一步区分浏览节点和搜索结果页面,该标题或标头元标签指示关于浏览节点的信息并且将浏览节点与一般搜索结果页面区分开。关键字、类别和关键字‑值对的组合的数量使得在除了最简单的应用之外的所有应用中针对每个可能的组合创建浏览节点都是令人望而却步的。本文公开了用于识别哪些搜索结果页面应被转换为浏览节点的方法和系统。
Description
本申请是申请日为2017年8月16日并且于2019年2月15日向中国专利局递交并进入中国国家阶段的题为“使用频繁模式挖掘的浏览节点创建”的发明专利申请No.201780050415.1(PCT国际申请No.PCT/U S2017/047041)的分案申请。
相关申请的交叉引用
本申请要求于2016年8月18日提交的美国申请No.15/240,841的优先权,该申请的全部内容通过引用并入本文。
技术领域
本文公开的主题总体上涉及数据处理。具体地,在一些示例实施例中,本公开涉及使用频繁模式挖掘来进行浏览节点创建的系统和方法。
附图说明
在附图中以示例而非限制的方式示出了一些实施例。
图1是示出了根据一些示例实施例的适合于使用频繁模式挖掘来创建浏览节点的网络环境的网络图。
图2是示出了根据一些示例实施例的适合于使用频繁模式挖掘来创建浏览节点的搜索服务器的组件的框图。
图3是示出了根据一些示例实施例的适合于提交查询和显示结果的客户端设备的组件的框图。
图4是示出了根据一些示例实施例的适合于显示搜索结果的用户界面的框图。
图5是示出了根据一些示例实施例的适合于显示浏览节点的用户界面的框图。
图6是示出了根据一些示例实施例的浏览节点的层级结构的框图。
图7是示出了根据一些示例实施例的应用服务器在执行使用频繁模式挖掘来创建浏览节点的方法的过程中的操作的流程图。
图8是示出了根据一些示例实施例的应用服务器在执行使用频繁模式挖掘来创建浏览节点的方法的过程中的操作的流程图。
图9是示出了根据一些示例实施例的应用服务器在执行使用频繁模式挖掘来创建浏览节点的方法的过程中的操作的流程图。
图10是示出了根据一些示例实施例的应用服务器在执行使用频繁模式挖掘来创建浏览节点的方法的过程中的操作的流程图。
图11是示出了根据一些示例实施例的应用服务器在执行使用频繁模式挖掘来创建浏览节点的方法的过程中的操作的流程图。
图12是示出了根据一些示例实施例的示例项目集合和创建的浏览节点的表。
图1 3是示出了根据一些示例实施例的一组示例浏览节点和标题的表。
图14是示出了根据一些示例实施例的可以安装在机器上的软件架构的示例的框图。
图15是根据示例实施例的具有计算机系统的形式的机器的示图表示,在所述计算机系统中可以执行一组指令以使所述机器执行本文讨论的方法中的任意一个或多个方法。
具体实施方式
示例方法和系统涉及使用频繁模式挖掘(frequent pattern mining)来创建浏览节点。示例仅代表可能的变型。除非另行明确声明,否则组件和功能是可选的,且可被合并或细分,且操作可以在顺序上变化或被组合或细分。在以下描述中,出于解释的目的,对多个具体细节进行阐述,以提供对示例实施例的透彻理解。然而,对于本领域技术人员将显而易见的是:本主题可以在没有这些具体细节的情况下实施。
方面是可用于过滤搜索结果的属性,所述属性被存储为关键字-值对。方面不同于搜索结果的内容(例如,搜索结果中显示的文本或图像)且不同于搜索结果的类别。类别是以树结构组织的,其中每个搜索结果属于树的最多一个叶节点。与之相比,每个搜索结果可以与多个方面相关联。例如,“品牌=耐克”和“状况=新”两者都可以与单个项目相关联。为清楚起见,术语“方面类型”可用于指代关键字-值对中的关键字,并且“方面值”用于指代值。
用户可以向搜索引擎(例如,在应用服务器上运行的搜索应用)提交搜索查询。搜索引擎可以处理搜索查询并生成结果集合。不同搜索引擎针对相同搜索查询生成的结果可能不同。例如,一个搜索引擎可以适合于提供图像结果,而另一搜索引擎适合于提供购物结果。继续该示例,向两个引擎提交包括“钱包”的搜索查询可能导致来自第一引擎的钱包的图像和来自第二引擎的到钱包零售商的链接。
搜索引擎结果被呈现在搜索结果页面和浏览节点页面上。搜索结果页面是响应于特定搜索而生成的,除了通过运行搜索之外无法访问该页面。例如,“http://scarehengine.com/search.cgi?key=brand&value=nike”可以是一个统一资源定位器(URL),它向搜索引擎的搜索脚本提交“brand=nike”的关键字-值对。将响应于该查询而动态地创建所得到的网页,并且无法通过静态URL访问该网页。在这种情况下,关键字-值对变元(argument)作为参数被发送给域“searchengine.com”中的路径“search.cgi”。与之相比,浏览节点页面是通过其路径来寻址的。例如,“http://searchengine.com/Nike”可以是也提供“brand=nike”的搜索结果的URL。结果,与相应的基于参数的搜索页面相比,网络爬虫有更大可能找到浏览节点。在一些示例实施例中,通过使用标题或标头元标签(headermetatag)来进一步辨识浏览节点,该标题或标头元标签指示关于浏览节点的信息并且将浏览节点与一般搜索结果页面区分开。例如,一般搜索结果页面可以具有“品牌=耐克的搜索结果”的标头(例如,具有<H1>超文本标记语言(HTML)标签的形式),而相应的浏览节点可以具有“耐克品牌商品”的标头。在一些示例实施例中,浏览节点的标题或标头由人制作,而搜索结果页面的标题或标头是基于搜索标准自动生成的。
自动过程可用于针对搜索结果页面创建浏览节点。然而,关键字、类别和关键字-值对的组合的数量使得在除了最简单的应用之外的所有应用中针对每个可能的组合创建浏览节点都是令人望而却步的。本文公开了用于识别哪些搜索结果页面应被转换为浏览节点的方法和系统。
图1是示出了根据一些示例实施例的适合于使用频繁模式挖掘来创建浏览节点的网络环境100的网络图。网络环境100包括电子商务服务器120和140、搜索服务器130以及设备150A、150B和150C,它们都经由网络170彼此通信耦合。设备150A、150B和150C可以被统称为“设备150”,或者一般性称为“设备150”。电子商务服务器120以及搜索服务器130可以是基于网络的系统110的一部分。备选地,设备150可以直接连接到搜索服务器130,或者通过本地网络连接到搜索服务器130,所述本地网络不同于用于连接到电子商务服务器120或140的网络170。如以下参照图14-15所描述的,电子商务服务器120和140、搜索服务器130以及设备150均可以整体地或部分地在计算机系统中实现。
电子商务服务器120和140经由网络170向其他机器(例如,设备150)提供电子商务应用。电子商务服务器120和140还可以直接连接到搜索服务器130,或者与搜索服务器130集成在一起。在一些示例实施例中,一个电子商务服务器120和搜索服务器130是基于网络的系统110的一部分,而其他电子商务服务器(例如,电子商务服务器140)与基于网络的系统110分离。电子商务应用可以向用户提供直接从彼此购买项目和直接向彼此出售项目、从电子商务应用提供商购买项目和向电子商务应用提供商出售项目、或者以上二者的途径。
图1中还示出了用户160。用户160可以是人类用户(例如,人类)、机器用户(例如,通过软件程序配置的与设备150和电子商务或搜索服务器120、130、140交互的计算机)或者它们的任意合适组合(例如,机器辅助的人或者人监管的机器)。用户160不是网络环境100的一部分,但与设备150相关联并且可以是设备150的用户。例如,设备150可以是属于用户160的传感器、台式计算机、车载计算机、平板计算机、导航设备、便携媒体设备或智能电话。
在一些示例实施例中,搜索服务器130从用户接收搜索查询。搜索服务器130执行用户提供的搜索查询或识别相应的浏览节点。搜索查询被发送到电子商务服务器120或140,该电子商务服务器120或140为用户生成结果列表。
图1中所示的机器、数据库或设备中的任意一个可以用通用计算机来实现,所述通用计算机通过软件修改(例如,配置或编程)为专用计算机,以执行本文针对所述机器、数据库或设备描述的功能。例如,以下参照图14-15讨论能够实现本文描述的方法中的任意一种或多种方法的计算机系统。如本文所使用的,“数据库”是数据存储资源并可以存储结构化为文本文件、表格、电子表格、关系数据库(例如,对象关系数据库)、三元组存储、分层数据存储或它们的任意合适组合的数据。此外,图1中示出的机器、数据库或设备中的任意两个或更多个可以组合到单个机器、数据库或设备中,并且本文针对任意单个机器、数据库或设备描述的功能可以细分到多个机器、数据库或设备中。
网络170可以是实现机器、数据库和设备(例如,电子商务或搜索服务器120、130、140和设备150)之间或之中的通信的任意网络。因此,网络170可以是有线网络、无线网络(例如,移动或蜂窝网络)、或其任意合适组合。网络170可以包括构成私有网络、公共网络(例如,互联网)或其任意合适组合的一个或多个部分。
图2是示出了根据一些示例实施例的搜索服务器130的组件的框图。搜索服务器130被示出为包括全都被配置为彼此通信(例如,经由总线、共享存储器、交换机、或者应用程序接口(API))的通信模块210、搜索模块220、浏览模块230和存储模块240。本文描述的任何一个或多个模块可以使用硬件(例如,机器的处理器)或硬件与软件的组合来实现。例如,本文描述的任何模块可以将处理器配置为执行本文中针对该模块描述的操作。此外,这些模块中的任何两个或更多个模块可被合并为单个模块,且本文中针对单个模块描述的功能可以细分到多个模块中。此外,根据各种示例实施例,本文描述为在单个机器、数据库或设备中实施的模块可以分布在多个机器、数据库或设备中。在一些示例实施例中,使用由ApacheTM 驱动的硬件计算机集群来实现模块,从而允许对本文描述的方法的可扩展和可并行化的实现。
通信模块210被配置为发送和接收数据。例如,通信模块210可以从设备150接收搜索查询。在接收到搜索查询时,通信模块210可以向浏览模块230发送搜索查询以确定该搜索查询是否对应于浏览节点。
搜索模块220被配置为评估搜索查询。在一些示例实施例中,评估搜索查询包括向电子商务服务器120或140转发搜索查询。在其他示例实施例中,评估搜索查询包括在搜索服务器130上搜索数据库以获得结果。
搜索结果可以具有方面和类别两者。作为示例,考虑是针对特定的一双鞋子的列表的搜索结果。鞋子可以属于服饰类别,而列表可以具有用于拍卖的方面。作为另一示例,考虑是包括关于经济政策的文章的网页的搜索结果。该文章可以属于经济学类别,而文章的呈现模式(搜索结果的方面)是网页。
浏览模块230被配置为查找输入查询的浏览节点并响应于该查询而提供浏览节点。例如,浏览模块230可以从通信模块210接收搜索查询,并访问数据库以识别浏览节点。在上面的示例的基础上,可以用包含“服饰>鞋子”类别中具有“品牌=耐克”方面的所有项目的浏览节点来替代针对“耐克鞋”的搜索。浏览节点的标题可以是“耐克鞋子”。通信模块210可以向电子商务服务器120或140发送与浏览节点相关联的查询,以生成要向用户发送的搜索结果。
存储模块240可以存储与查询用户和其他用户进行的先前搜索有关的数据,存储浏览模块230的浏览节点查找数据,或存储两者。例如,历史查询数据、用户建模数据、上下文建模数据和查询建模数据都可以由存储模块240存储。附加地或备选地,存储模块240可以访问其他设备上的数据存储,例如外部数据库。
图3是示出了根据一些示例实施例的适合于提交查询和显示结果的客户端设备(例如,设备150)的组件的框图。设备150被示为包括被配置为(例如,经由总线、共享存储器或交换机)彼此通信的通信模块310和用户界面模块320。
通信模块310可以与电子商务服务器120或140、搜索服务器130或其任何适当的组合进行通信。经由通信模块310接收的信息可以经由用户界面模块320来呈现(例如,在显示设备上显示)。可以由用户使用用户界面来选择信息或者输入搜索查询,所述用户界面是通过用户界面模块320呈现的。可以经由通信模块310向电子商务或搜索服务器120、130、140传送搜索查询。通信模块310可以从电子商务或搜索服务器120、130、140接收包括一组结果的响应。可以通过用户界面模块320向用户呈现搜索结果。例如,可以以列表视图或图库视图的方式呈现搜索结果。
图4是示出了根据一些示例实施例的适合于呈现搜索结果的用户界面400的框图。从图4中可以看出,用户界面400包括标题410“搜索结果”;结果计数420;类别430;方面440;和四个搜索结果450-480。
可以响应于用户查询来显示用户界面400。例如,如果用户在设备150上输入针对“索尼相机”的查询,则可以从设备150向搜索服务器130发送该查询。搜索服务器130确定应该在不进行改变的情况下由电子商务服务器120或140来处理该查询,并向电子商务服务器120或140转发该查询。电子商务服务器120或140执行该查询并向设备150发送搜索结果450-480以向用户显示。
每个搜索结果450-480可操作用于查看与搜索结果有关的附加信息。例如,搜索结果可以是待售项目,并且初始搜索结果屏幕可以示出项目的图像和标签。点击或以其他方式激活项目的图像可以使得显示新页面,该新页面显示与该项目有关的附加信息,诸如项目描述、附加图像、价格等。
结果可以包括项目、事件、地点、人员等。项目可以是待售项目或想要购买的项目。事件可以是音乐会、节日、电影、体育赛事等。地点可以是纪念碑、商店、加油站、餐馆、体育馆等。人员可以是用户的朋友、名人或其他人员。在一些示例实施例中,基于所支付的广告费来选择所显示的项目、事件、地点或人员中的一项或多项。
图5是示出了根据一些示例实施例的适合于显示浏览节点的用户界面500的框图。可以看出,用户界面500包括标题510“索尼牌便携式摄像机”;结果计数520;和四个搜索结果530-560。
可以响应于用户查询来显示用户界面500。例如,如果用户在设备150上输入针对“索尼相机”的查询,则可以从设备150向搜索服务器130发送该查询。搜索服务器130确定应该用浏览节点来响应该查询,并向电子商务服务器120或140发送对浏览节点的请求。电子商务服务器120或140通过向设备150发送浏览节点(包括搜索结果530-560)以供向用户显示来响应该请求。通过比较用户界面500和用户界面400可以看出,通用标题410“搜索结果”已经被标题510“索尼牌便携式摄像机”所替代,该标题510特定于与浏览节点相关联的查询。
图6是示出了根据一些示例实施例的在使用模式(pattern)挖掘创建浏览节点时适用的浏览节点的层级结构的框图600。浏览节点是用户可以浏览的特定项目组。在一些示例实施例中,借助于所提供的页面中的HTML标签、所提供的页面的URL的特征、或这两者,将浏览节点与搜索结果页面区分开。例如,搜索结果页面具有的URL可以指示搜索查询词为给CGI脚本的变元,而浏览节点页面具有的URL可以指示搜索查询词为URL的路径部分的一部分。作为另一示例,搜索结果页面可以具有用于许多搜索查询的通用标题(例如,使用<标题>或<H1>HTML标签),而浏览节点页面可以具有专门反映浏览节点的标题。如框图600中所示,浏览节点可以存在于层级结构中的不同级别。在最高级别,用户可以查看整个产品类型的信息。从产品类型视图,用户可以深入查看类别和子类别。在一个类别或子类别内,可以存在针对特定方面值和组合的其他浏览节点。例如,可以针对“品牌=索尼”、“颜色=黑色”或这两者,创建浏览节点。由于因不同方面的可能组合的数量引起的组合激增,通常希望避免针对每个可能的方面组合来创建浏览节点。例如,如果存在品牌、颜色和尺寸这些方面,并且每个方面具有10个可能的值(绝不是上限),则为了针对每个组合提供一个浏览节点,将需要针对各种组合创建1000个不同的浏览节点。选择性地创建浏览节点可以以最小的成本提供大部分益处。例如,如果10个浏览节点覆盖80%的用户兴趣,则将浏览节点限制为这10个浏览节点将以创建所有1000个浏览节点的成本的1%提供80%的益处。
方面受限的浏览节点由产品系列节点进一步细化。产品系列节点包含策划的密切相关项目的列表。例如,具有“品牌=索尼”和“颜色=黑色”的“相机和照片>胶片摄影>胶片相机”类别的方面受限的浏览节点将包含与这些标准匹配的所有项目。作为另一示例,“令人惊异的胶片相机”的产品系列节点将包含在策划者(curator)的判断中符合该标准的项目集合。
针对特定类别/方面组合创建浏览节点可以提供更好的浏览体验。例如,浏览节点可以与普通的方面过滤器相区别地向用户进行呈现,允许用户更容易地找到当前浏览类别的受欢迎的方面集合。另外,浏览节点可以提高站点在其他搜索引擎中的排名。例如,如果站点为网络爬虫提供了找到每个浏览节点的自然方式,则针对特定类别/方面的浏览节点页面可能比针对相同组合的搜索结果页面具有更高的页面排名。
图7是示出了根据一些示例实施例的搜索服务器130在执行使用频繁模式挖掘来创建浏览节点的方法700的过程中的操作的流程图。方法700中的操作可以由搜索服务器130使用上文参照图2描述的模块来执行。
在操作710中,浏览模块230访问类别中的项目的关键字-值对。例如,可以访问图12中所示的关键字-值对。
在操作720中,浏览模块230确定与满足或超过阈值的数量的项目相关联的关键字-值对(或关键字-值对的组合)。例如,在图12中所示的五个项目中,四个项目与关键字-值对“品牌=三星”相关联。因此,如果阈值是2,则“品牌=三星”将是所确定的关键字-值对之一。类似地,图12中的项目中的两个项目与“型号=S3”和“品牌=三星”两者相关联。因此,关键字-值对将被确定为各自满足阈值。此外,关键字-值对的组合“品牌=三星;型号=S3”也将被确定为满足阈值。
在操作730中,浏览模块230针对一个或多个所识别的关键字-值对(或其组合)创建浏览节点。继续上面的示例,可以针对“品牌=三星”、“型号=S3”和“品牌=三星;型号=S3”中的任何一个或全部创建浏览节点。
图8是示出了根据一些示例实施例的搜索服务器130在执行使用频繁模式挖掘来创建浏览节点的方法800的过程中的操作的流程图。方法800中的操作可以由搜索服务器130使用上文参照图2描述的模块来执行。可以以与上述操作710和720类似的方式执行操作810和820。
在操作830中,针对在操作820中确定的每个关键字-值对(或关键字-值对的组合)开始循环。因此,针对每个这样确定的关键字-值对或其组合执行操作840-860中的适当操作。为方便起见,每个这样确定的关键字-值对或其组合将被称为具有一个或多个成员的关键字-值对集合。
在操作840中,浏览模块230确定该关键字-值对集合中的任何值是否在排除值列表中。例如,可以排除对应于类别的值和不太可能有意义的值(例如,“垃圾”、“临时”或“糟糕(foo)”)。
在操作850中,如果没有值在排除值列表中,则针对该关键字-值对集合创建浏览节点。然而,在操作860中,如果一个或多个值在排除值列表中,则不针对该关键字-值对集合创建浏览节点。
图9是示出了根据一些示例实施例的搜索服务器130在执行使用频繁模式挖掘来创建浏览节点的方法900的过程中的操作的流程图。方法900中的操作可以由搜索服务器130使用上文参照图2描述的模块来执行。
在操作910中,浏览模块230访问类别的潜在浏览节点。例如,从操作720得到的每个关键字-值对集合可以定义潜在的浏览节点并在操作910中被访问。
在操作920中,浏览模块230针对每对潜在的浏览节点开始循环。因此,针对每个潜在的浏览节点对执行操作930-960中的适当操作。考虑图12中所示的数据,识别出六个潜在的浏览节点,产生15个浏览节点对。
在操作930中,浏览模块230确定与两个潜在的浏览节点相关联的项目之间的重叠程度。重叠程度可以被确定为项目的计数,确定为较大项目集合的百分比,确定为较小项目集合的百分比,或其任何适当的组合。例如,参考图12的前两个潜在的浏览节点,项目1-4与“品牌=三星”的潜在浏览节点相关联,并且项目1和3与“型号=S3”的潜在浏览节点相关联。因此,重叠程度是两个项目,较大项目集合的50%,或较小项目集合的100%。
在操作940中,浏览模块230将重叠程度与阈值进行比较以确定是否满足或超过阈值。可以根据项目数量或百分比来定义阈值。例如,如果阈值是较小项目集合的75%,则图12中“品牌=三星”和“型号=S3”的对将满足该阈值。如果满足阈值,则处理继续进行操作960。否则,处理继续进行操作950。
在操作950中,重叠程度不满足阈值,并且将两个浏览节点都留在潜在浏览节点的列表中。然而,在操作960中,重叠程度满足阈值,并且从列表中移除潜在浏览节点之一。例如,可以从列表中移除具有较小的关联项目集合的浏览节点。在一些示例实施例中,应用可配置的级联规则集合以确定哪个浏览节点被移除以及哪个浏览节点存活(即,未被移除)。管理员可以按顺序或使用权重来选择要应用的标准。例如,具有较大数量的方面关键字-值的浏览节点可以是幸存者,但是如果该数量相等,则具有较大数量的关联项目的浏览节点存活,并且如果两个浏览节点仍然绑定,则第一节点按字母顺序存活。作为另一示例,浏览节点中的项目的平均受欢迎程度可以被赋予25%的权重,浏览节点中的项目的平均受益被赋予25%的权重,方面关键字-值的数量被赋予10%的权重,并且关联项目的数量被赋予40%的权重。在此示例中,具有最高加权分数的浏览节点将是幸存者。
在操作970中,在循环完成之后,针对列表中剩余的潜在浏览节点创建浏览节点。例如,将较小项目集合的75%的阈值应用于图12中的数据将导致“型号=S3”和“品牌=三星;型号=S3”由于与“品牌=三星”的过度重叠而从列表中删除。剩余的三个潜在浏览节点仅有50%与“品牌=三星”重叠,因此与该潜在浏览节点相比不会被移除。然而,“OS=安卓”、“存储=8GB”和“0S=安卓;存储=8GB”100%重叠。因此,将仅创建三个潜在浏览节点中的一个。在一些示例实施例中,选择具有最大数量的关键字-值对的潜在浏览节点。因此,“品牌=三星”和“OS=安卓;存储=8GB”将是基于图12中的数据在该示例实施例中创建的两个浏览节点。
图10是示出了根据一些示例实施例的搜索服务器130在执行使用频繁模式挖掘来创建浏览节点的方法1000的过程中的操作的流程图。方法1000中的操作可以由搜索服务器130使用上文参照图2描述的模块来执行。
在操作1010中,浏览模块230访问类别的潜在浏览节点。在操作1020中,浏览模块230针对潜在浏览节点发起循环。因此,针对每个潜在浏览节点执行操作1030-1060中的适当操作。
在操作1030中,验证潜在浏览节点以确定是否应该创建潜在浏览节点。在不同的示例实施例中使用不同的标准及其组合。
在一些示例实施例中,执行允许的关键字检查。为了检查允许的关键字,将潜在浏览节点的关键字-值对中的关键字与允许的关键字的列表进行比较。如果所有关键字都在允许列表中,则通过允许的关键字检查。如果一个或多个关键字不在允许列表中,则没有通过允许的关键字检查。
在一些示例实施例中,执行重复关键字检查。为了检查重复关键字,将潜在浏览节点的关键字-值对中的关键字相互比较。如果任何关键字出现两次,则没有通过重复关键字检查。否则,通过重复关键字检查。
在一些示例实施例中,执行重复值检查。为了检查重复值,将潜在浏览节点的关键字-值对中的值相互比较。如果任何值出现两次,则没有通过重复值检查。否则,通过重复值检查。
在一些示例实施例中,执行排除的关键字检查。为了检查排除的关键字,将潜在浏览节点的关键字-值对中的关键字与排除的关键字的列表中的关键字进行比较。如果潜在浏览节点的关键字没有出现在排除的关键字的列表中,则通过排除的关键字检查。否则,没有通过排除的关键字检查。
在一些示例实施例中,执行排除值检查。要检查排除值,可以将潜在浏览节点的关键字-值对中的值与排除值列表中的值进行比较。如果潜在浏览节点的值未出现在排除值列表中,则通过排除值检查。否则,没有通过排除值检查。
在一些示例实施例中,执行值相关性检查。为了检查排除值关系,将潜在浏览节点的关键字-值对与无效的关键字-值对的模式进行比较。例如,在“珠宝”类别中,“金属纯度”关键字可以具有银和金的有效值(例如,14K),但对于青铜或锡铅合金不具有意义。因此,具有关键字-值对“金属=青铜”和“金属纯度”关键字的浏览节点是不合需要的。因此,如果潜在浏览节点的关键字-值对与无效关键字-值对的模式匹配,则没有通过值相关性检查。否则,通过值相关性检查。
当不存在特定的其他关键字时,值相关性检查还可以排除关键字-值对。例如,如果“金属纯度”关键字仅在存在“金属”关键字时具有含义,则如果不存在“金属”关键字则排除“金属纯度”关键字。
在一些示例实施例中,执行关键字-值对数量检查。为了执行该检查,将潜在浏览节点的关键字-值对的数量与允许的关键字-值对数量的范围进行比较。例如,具有1到4个关键字-值对、2到5个关键字-值对或某个其他范围的浏览节点可以是优选的。如果潜在浏览节点的关键字-值对的数量在允许的关键字-值对数量的范围内,则通过该检查。否则,没有通过该检查。
一旦执行了针对特定实施例实施的检查,浏览模块230就在操作1040中进行检查以确定潜在浏览节点是否被确认。仅当潜在浏览节点通过所有适用的检查时,该潜在浏览节点才被确认。在操作1050中,如果潜在浏览节点被确认,则针对潜在浏览节点创建浏览节点。在操作1060中,如果潜在浏览节点未被确认,则不针对潜在浏览节点创建浏览节点。
图11是示出了根据一些示例实施例的搜索服务器130在执行使用频繁模式挖掘来创建浏览节点的方法1100的过程中的操作的流程图。方法110()中的操作可以由搜索服务器130使用上文参照图2描述的模块来执行。
在操作1110中,浏览模块230访问针对某个类别的潜在浏览节点。在操作1120中,浏览模块230针对潜在浏览节点发起循环。因此,针对每个潜在浏览节点执行操作1130。
在操作1130中,浏览模块230从与潜在浏览节点相关联的项目所关联的图像中选择潜在浏览节点的一个或多个显示图像。例如,由于12个项目和特定的潜在浏览节点与相同的关键字-值对相关联,该12个项目可以与该潜在浏览节点相关联。12个项目中的每个项目与图像集合相关联(例如,每个项目平均1.5个图像,总共18个图像)。在操作1130中选择的组合集合中的一个或多个图像直接与潜在浏览节点相关联。例如,一旦创建了浏览节点,就可以在浏览节点页面的顶部显示所选图像。作为另一示例,可以创建具有到多个浏览节点的链接的页面,其中每个浏览节点由所选图像来表示。
在各种示例实施例中,使用各种图像选择方法。例如,可以选择与浏览节点中的大多数项目相关联的图像。作为另一示例,可以选择与浏览节点中的项目相关联的随机图像。在一些示例实施例中,数据库存储关于图像的信息,并且关于图像的信息用于允许或禁止相应的图像。例如,图像的创建者可能已经授予或拒绝将图像用于除了与项目直接呈现之外的目的的许可。因此,可以根据需要通过在用于与浏览节点相关联的可能的图像集合中排除或包括图像来遵守许可。
附加地或备选地,图像质量度量可以用作选择过程的一部分。例如,可以自动计算前景对象和背景对象之间的对比度。可以不考虑具有低于阈值的对比度的图像。可以选择具有最高对比度的图像。
在一些示例实施例中,使用利用机器学习算法训练的分类模型来应用图像质量度量。在被注释为“好”或“坏”的学习图像集合上训练该模型。得到的模型能够为输入的图像提供“良好”的概率。以这种方式,来自模型的输出概率可用于确定最可能“好”的与浏览节点相关联的图像。
图12示出了示例项目集合和关联的关键字-值对的表1210以及创建的示例对应浏览节点的列表1220。表1210中所示的数据可以被存储模块240访问,用于浏览模块230。表1210包括五个项目中的每个项目的唯一标识符和五个项目中的每个项目的关键字-值对的集合。列表1220通过相应的关键字-值对集合来识别六个创建的浏览节点。
图13是示出了根据一些示例实施例的一组示例浏览节点和标题的表1310。针对每个浏览节点,表1310中的数据包括唯一标识符、关联的关键字-值对的集合和标题。
虽然本发明的以上描述以举例的方式使用网上市场中的项目,但是使用方面的其他类型的搜索也可以利用所描述的方法。例如,网页可以具有创建日期、最后修改日期、大小、作者和主题的方面。一些搜索引擎对网页进行分类(例如,以提供允许用户通过类别层级结构查找页面的深入查看界面)。因此,可以通过针对特定类别识别受欢迎的网页的方面并针对这些方面和方面组合创建浏览节点来改进对分类网页的搜索查询。所创建的浏览节点可以作为类别层级结构的一部分在用户界面中呈现,即使这些方面从数据的角度来看不是类别层级结构的一部分。类似的益处来自本地硬盘驱动器文件搜索、电子邮件存档搜索等。
根据各种示例实施例,本文描述的方法中的一种或多种方法可以使用数据挖掘来促进对浏览节点的创建。因此,本文描述的一种或多种方法可以促进搜索引擎优化,这进一步有利于一般搜索引擎的用户查找期望的项目而无需首先输入对网上市场或其他专用搜索引擎的搜索查询。例如,本文描述的方法中的一种或多种方法可以促进对用户感兴趣的结果的检索和呈现,而不需要用户明确地进行一系列查询。
当总体来考虑这些效果时,本文描述的一个或多个方法可以消除针对某些工作量或资源的需求,该某些工作量或资源原本在其他情况下将在搜索中涉及。通过本文描述的一种或多种方法,可以减少用户在识别相关查询时所花费的努力。类似地,可以减少(例如在网络环境100中的)一个或多个机器、数据库或设备使用的计算资源。这样的计算资源的示例包括处理器循环、网络流量、存储器使用状况、数据存储容量、功耗以及冷却能力。
模块、组件和逻辑
某些实施例在本文中被描述为包括逻辑或多个组件、模块或机构。模块可以构成软件模块(例如,机器可读介质上体现的代码)或硬件实现的模块。硬件实施的模块是能够执行某些操作且可以用某种方式来配置或布置的有形单元。在示例实施例中,一个或多个计算机系统(例如,独立、客户端或服务器计算机系统)或一个或多个处理器可以被软件(例如,应用或应用部分)配置为硬件实施的模块,该模块进行操作以执行如本文所述的某些操作。
在各实施例中,硬件实现的模块可以用机械方式或电子方式来实现。例如,硬件实现的模块可以包括永久地被配置为执行某些操作的专用电路或逻辑(例如,硬件实现的模块可以是专用处理器,例如现场可编程门阵列(FPGA)或专用集成电路(ASIC))。硬件实施的模块还可以包括暂时由软件配置以执行某些操作的可编程逻辑或电路(例如,配置为被包含在通用处理器或其它可编程处理器中)。将清楚的是,对以机械方式在专用且永久配置的电路中或在暂时配置的电路(例如由软件配置)中实现硬件实现的模块的决定可能受到成本和时间考虑的驱动。
因此,短语“硬件实现的模块”应当被理解为包含有形实体,应当是物理构成的、永久配置(例如硬连线的)或暂时或瞬时配置(例如编程的)以在特定方式下工作以执行本文描述的特定操作的实体。考虑到其中硬件实现的模块是暂时配置的(例如编程的)实施例,每个硬件实现的模块不需要是在任意时刻都是已配置或已实例化的。例如,在硬件实施的模块包括使用软件来配置的通用处理器的情况下,通用处理器可以在不同时间被配置为各不同的硬件实施的模块。软件可以因此配置处理器,以例如在一个时刻构成特定硬件实施的模块,以及在不同时刻构成不同的硬件实施的模块。
硬件实现的模块可以向其它硬件实现的模块提供信息,并且可以从其它硬件实现的模块接收信息。因此,描述的硬件实现的模块可被看做是通信耦合的。在多个这种硬件实现的模块同时存在的情况下,可以通过信号传输(例如在连接硬件实现的模块的适当的电路和总线上)来实现通信。在多个硬件实现的模块在不同的时间被配置或实例化的实施例中,可以例如通过在多个硬件实现的模块可访问的存储器结构中对信息的存储和检索来实现这样的硬件实现的模块之间的通信。例如,一个硬件实现的模块可以执行操作,并且将该操作的输出存储在与该硬件实现的模块通信耦合的存储设备中。然后另一硬件实现的模块可以在之后的时间访问该存储设备以检索并处理所存储的输出。硬件实现的模块还可以发起与输入或输出设备的通信,并且能够对资源(例如信息的集合)执行操作。
本文描述的示例方法的各种操作可以至少部分地由临时配置(例如,通过软件)或永久配置为执行相关操作的一个或多个处理器执行。无论是临时还是永久地配置,这样的处理器可以构成进行操作以执行一个或多个操作或功能的处理器实现的模块。在一些示例实施例中,如本文中使用的“模块”包括处理器实现的模块。
类似地,本文中描述的方法可以至少部分由处理器实现。例如,方法的至少一些操作可由一个或多个处理器或处理器实现的模块执行。某些操作的执行可以分布在一个或多个处理器中,并不只驻留在单个机器中,而是跨多个机器来部署。在一些示例实施例中,一个或多个处理器或处理器可以位于单个地点(例如在家庭环境、办公室环境或服务器群中),而在其他实施例中,处理器可以分布在多个地点。
一个或多个处理器还可以操作以支持在“云计算”环境下的相关操作的执行或作为“软件即服务”(SaaS)的相关操作的执行。例如,至少一些操作可以由一组计算机(例如,包括处理器的机器)来完成,这些操作是可经由网络(例如,互联网)以及经由一个或多个适当的接口(例如,API)访问的。
电子装置和系统
示例实施例可以用数字电子电路、用计算机硬件、固件或软件或它们的组合来实现。示例实施例可以使用计算机程序产品(例如在信息载体中有形地表示的计算机程序)来实现,信息载体例如是由数据处理装置执行的机器可读介质或用于控制数据处理装置的操作的机器可读介质,数据处理装置例如是可编程处理器、计算机或多个计算机。
可以以任何形式的编程语言来编写计算机程序,该编程语言包括:编译或解释语言,并且可以以任何形式来部署计算机程序,包括部署为独立的程序或者部署为适合于用于计算环境的模块、子例程,或者其它单元。计算机程序可以被配置为在一个计算机执行或在位于一个地点处的多个计算机上执行或者在分布在多个地点上并通过通信网络互连的多个计算机上执行。
在示例实施例中,操作可以通过一个或多个可编程处理器执行计算机程序来执行,以通过操作输入数据并产生输出来执行功能。方法操作还可以通过由专用逻辑电路(例如,FPGA或ASIC)来执行,并且示例实施例的装置可以实现为专用逻辑电路。
计算系统可以包括客户端和服务器。客户端和服务器一般相互远离并且通常通过通信网络进行交互。客户端和服务器的关系通过在相应计算机上运行并且相互具有客户端-服务器关系的计算机程序来生成。在使用可编程计算系统的实施例中,将清楚的是,需要考虑硬件架构和软件架构二者。具体地,将清楚的是,在永久配置的硬件(例如ASIC)中、在暂时配置的硬件中(例如软件与可编程处理器的组合)、或是在永久配置的与暂时配置的硬件的组合中实现特定功能可以是设计选择。下文是在各种示例实施例中可以部署的硬件架构(例如机器)和软件架构。
软件架构
图14是示出了软件1402的架构的框图1400,所述软件可以安装在上述任意一个或多个设备上。图14仅仅是软件架构的非限制性示例,并且将理解的是,可以实现许多其他架构以促进实现本文描述的功能。软件架构1402可以由诸如图15的机器1500之类的硬件来实现,机器1500包括处理器1510、存储器1530以及I/O组件1550。在该示例架构中,软件1402可被概念化为层的堆栈,其中每层可以提供特定的功能。例如,软件1402包括诸如操作系统1404、库1406、框架1408和应用1410的层。在操作上,根据一些实现,应用1410通过软件栈调用应用编程接口(API)调用1412,并响应于API调用1412接收消息1414。
在各种实现中,操作系统1404管理硬件资源并提供公共服务。操作系统1404包括例如内核1420、服务1422和驱动1424。在一些实现中,内核1420用作硬件和其他软件层之间的抽象层。例如,内核1420尤其提供存储器管理、处理器管理(例如,调度)、组件管理、联网和安全设置等的功能。服务1422可以针对其他软件层提供其他公共服务。驱动器1424可以负责控制底层硬件或与底层硬件接口连接。例如,驱动1424可以包括显示驱动、相机驱动、驱动、闪存驱动、串行通信驱动(例如通用串行总线(USB)驱动)、/>驱动、音频驱动、电源管理驱动等等。
在一些实现中,库1406提供可以被应用1410使用的低级公共基础设施。库1406可以包括:可以提供诸如存储器分配功能、串操纵功能、数学功能等功能的系统库1430(例如,C标准库)。另外,库1406可以包括API库1432,例如媒体库(例如,支持各种媒体格式的呈现和操纵的库,所述格式诸如运动图像专家组4(MPEG4)、高级视频编码(H.264或AVC)、运动图像专家组层3(MP3)、高级音频编码(AAC)、自适应多速率(AMR)音频编解码器、联合图像专家组(JPEG或JPG)、或便携式网络图形(PN G))、图形库(例如,用于在显示器上的图形背景中以二维(2D)和三维(3D)渲染的OpenGL框架)、数据库(例如,提供各种关系数据库函数的SQLite)、web库(例如,提供网络浏览功能的WebKit)等。库1406还可以包括各种各样的其他库1434,以向应用1410提供许多其他API。
根据一些实现,框架1408提供可以被应用1410使用的高级公共基础设施。例如,框架1408提供各种图形用户界面(GUI)功能、高级资源管理、高级位置服务等。框架1408可以提供可以被应用1410使用的广泛的其他API,其中一些可以专用于特定的操作系统或平台。
在示例实施例中,应用1410包括主页应用1450、联系人应用1452、浏览器应用1454、书阅读器应用1456、位置应用1458、媒体应用1460、消息应用1462、游戏应用1464、以及诸如第三方应用1466之类的各种各样的其他应用。根据一些实施例,应用1410是执行在程序中定义的功能的程序。可以采用各种编程语言来创建以各种方式结构化的应用1410中的一个或多个,诸如面向对象的编程语言(例如,0bjective-C,Java或C++)或过程编程语言(例如C或汇编语言)。在具体示例中,第三方应用1466(例如,由与特定平台的供应商不同的实体使用AndroidTM或iOSTM软件开发工具包(SDK)而开发的应用)可以是在移动操作系统(诸如iOSTM、AndroidTM、Phone或其他移动操作系统)上运行的移动软件。在该示例中,第三方应用1466可以调用由诸如操作系统1404之类的移动操作系统提供的API调用1412,以促进实现本文描述的功能。
示例机器架构和机器可读介质
图15是示出了根据一些示例实施例的能够从机器可读介质(例如,机器可读存储介质)中读取指令并执行本文所讨论的方法中的任何一个或多个的机器1500的组件的框图。具体地,图15示出了计算机系统的示例形式的机器1500的示意图,其中可以执行指令1516(例如,软件、程序、应用、小应用、app或其他可执行代码)以使机器1500执行本文讨论的任何一种或多种方法。在备选的实施例中,机器1500作为独立设备操作或可以耦接(例如,联网)到其他机器。在联网部署中,机器1500可以在服务器-客户端网络环境中以服务器机器或客户端机器的能力进行操作,或者在对等(或分布式)网络环境中作为对等机器进行操作。机器1500可以包括但不限于服务器计算机、客户端计算机、个人计算机(PC)、平板计算机、膝上型计算机、上网本、机顶盒(STB)、个人数字助理(PDA)、娱乐媒体系统、蜂窝电话、智能电话、移动设备、可穿戴设备(例如智能手表)、智能家居设备(例如智能家电)、其他智能设备、网络设备、网络路由器、网络交换机、网桥、或能够顺序地或以其他方式执行指定机器1500要采取的动作的指令1516的任何机器。此外,尽管仅示出了单个机器1500,但是术语“机器”也将被认为包括机器1500的集合,其单独地或联合地执行指令1516以执行本文讨论的方法中的任何一个或多个。
机器1500可以包括处理器1510、存储器1530和I/O组件1550,其可被配置为经由总线1502彼此通信。在示例实施例中,处理器1510(例如,中央处理单元(CPU)、精简指令集计算(RISC)处理器、复杂指令集计算(CISC)处理器、图形处理单元(GPU)、数字信号处理器(DSP)、ASIC、射频集成电路(RFIC)、另一处理器或其任何适当组合)包括例如可以执行指令1516的处理器1512和处理器1514。术语“处理器”旨在包括可以包括可以同时执行指令的两个或更多个独立处理器(也称为“核”)的多核处理器。尽管图15示出了多个处理器,但是机器1500可以包括具有单个核的单个处理器、具有多个核的单个处理器(例如,多核处理器)、具有单个核的多个处理器、具有多个核的多个处理器或其任何组合。
存储器1530可包括经由总线1502可被处理器1510访问的主存储器1532、静态存储器1534和存储单元1536。存储单元1536可以包括机器可读介质1538,其上存储体现本文描述的方法或功能中的任何一个或多个的指令1516。在机器1500执行指令期间,指令1516还可以完全地或至少部分地驻留在主存储器1532、静态存储器1534、处理器1510中的至少一个内(例如,处理器的高速缓存存储器内)或其任何合适的组合内。因此,在各种实施方式中,主存储器1532、静态存储器1534和处理器1510被认为是机器可读介质1538。
如本文所使用的,术语“存储器”指能够临时或永久地存储数据的机器可读介质1538,并且可以被看作包括但不限于随机存取存储器(RAM)、只读存储器(ROM)、缓冲存储器、闪存以及高速缓存存储器。虽然机器可读介质1538在示例实施例中被示为是单个介质,但是术语“机器可读介质”应当被认为包括能够存储指令1516的单个介质或多个介质(例如,集中式或分布式数据库或相关联的高速缓存和服务器)。术语“机器可读存储介质”还将被认为包括能够存储被机器(例如机器1500)执行的指令(例如,指令1516)的任何介质或多个介质的组合,使得指令在被机器的一个或多个处理器(例如,处理器1510)执行时,使机器执行本文所描述的方法中的任何一个或多个。因此,“机器可读存储介质”指单个存储装置或设备、以及包括多个存储装置或设备的“基于云”的存储系统或存储网络。因此,术语“机器可读存储介质”应被理解为包括但不限于具有固态存储器(例如,闪存)、光介质、磁介质、其他非易失性存储器(例如,可擦除可编程只读存储器(EPROM))或其任何合适组合等的形式的一个或多个数据储存库。术语“机器可读介质”包括机器可读存储介质和传输介质或信号。
I/O组件1550包括用于接收输入、提供输出、产生输出、发送信息、交换信息、捕获测量等的各种组件。通常,应当理解,I/O组件1550可以包括图15中未示出的许多其他组件。可以根据功能将I/O组件1550分组,以仅用于简化以下讨论,并且分组不以任何方式进行限制。在各种示例实施例中,I/O组件1550包括输出组件1552和输入组件1554。输出组件1552包括可视组件(例如显示器,比如等离子体显示面板(PDP)、发光二极管(LED)显示器、液晶显示器(LCD)、投影仪或阴极射线管(CRT))、声学组件(例如,扬声器)、触觉组件(例如,振动马达)、其他信号发生器等。输入组件1554包括字母数字输入组件(例如,键盘、被配置为接收字母数字输入的触摸屏、光电键盘或其他字母数字输入组件)、基于点的输入组件(例如,鼠标、触摸板、轨迹球、操纵杆、运动传感器或其他定点仪器)、触觉输入组件(例如,物理按钮、提供触摸或触摸手势的位置和力的触摸屏或其他触觉输入组件)、音频输入组件((例如,麦克风)等。
在另一些示例实施例中,I/O组件1550尤其包括生物测定组件15556、运动组件1558、环境组件1560或位置组件1562等的组件。例如,生物测定组件1556包括用于检测表现(例如,手表现、面部表现、语音表现、身体姿势或眼睛跟踪)、测量生物信号(例如,血压、心率、体温、汗水或脑波)、标识人(例如,语音识别、视网膜识别、面部识别、指纹识别或基于脑电图的识别)等的组件。运动组件1558包括加速度传感器组件(例如,加速度计)、重力传感器组件、旋转传感器组件(例如,陀螺仪)等。环境组件1560包括例如照度传感器组件(例如,光度计)、温度传感器组件(例如,检测环境温度的一个或多个温度计)、湿度传感器组件、压力传感器组件(例如气压计)、声学传感器组件(例如,检测背景噪声的一个或多个麦克风)、接近传感器组件(例如,检测附近物体的红外传感器)、气体传感器(例如,机器嗅觉检测传感器、为安全而检测有害气体浓度或测量大气中的污染物的气体检测传感器)、或可以提供对应于周围物理环境的指示、测量或信号的其他组件。位置组件1562包括位置传感器组件(例如,全球定位系统(GPS)接收机组件)、高度传感器组件(例如,高度计或检测气压的气压计(根据气压可以导出高度))、方位传感器组件(例如,磁力计)等。
可以使用各种各样的技术来实现通信。I/O组件1550可以包括通信组件764,通信组件1564可操作以分别经由耦接1582和耦接1572将机器1500耦接到网络1580或设备1570。例如,通信组件1564包括网络接口组件或与网络1580接口连接的另一合适设备。在另一些示例中,通信组件1564包括有线通信组件、无线通信组件、蜂窝通信组件、近场通信(NF C)组件、组件(例如/>低能)、/>组件、以及经由其他模态提供通信的其他通信组件。设备1570可以是另一机器或各种外围设备中的任一种(例如,经由USB耦合的外围设备)。
此外,在一些实现中,通信组件1564检测标识符或包括可操作以检测标识符的组件。例如,通信组件1564包括射频识别(RFID)标签读取器组件、NFC智能标签检测组件、光学读取器组件(例如,用于检测一维条形码(如通用产品代码(UPC)条形码)、多维条形码(如快速响应(QR)码、Aztec码、数据矩阵、数据字、MaxiCode、PDF 417、超级码、统一商业码缩减空间符号(UCC RSS)-2D条形码以及其他光学代码)的光学传感器)、声学检测组件(例如,识别带标签的音频信号的麦克风)或其任何合适的组合。另外,可以经由通信组件1564导出各种信息,诸如经由互联网协议(IP)地理位置的位置、经由信号三角测量的位置、经由检测可以指示特定位置的NFC信标信号的位置等等。
传输介质
在各种示例实施例中,网络1580的一个或多个部分可以是自组织网络、内联网、外联网、虚拟专用网(VPN)、局域网(LAN)、无线LAN(WLAN)、广域网(WAN)、无线WAN(WWAN)、城域网(MAN)、互联网,互联网的一部分、公共交换电话网络(PSTN)的一部分、普通老式电话服务(POTS)网络、蜂窝电话网络、无线网络、网络、另一类型的网络、或两个或更多个这样的网络的组合。例如,网络1580或网络1580的一部分可以包括无线或蜂窝网络,并且耦接1582可以是码分多址(CDMA)连接、全球移动通信系统(GSM)连接或另一类型的蜂窝或无线耦接。在该示例中,耦接1582可以实现各种类型的数据传输技术中的任何一种,例如单载波无线电传输技术(1xRTT)、演进数据优化(EVDO)技术、通用分组无线电服务(GPRS)技术、GSM演进增强数据速率(EDGE)技术、包括3G的第三代合作伙伴计划(3GPP)、第四代无线(4G)网络、通用移动电信系统(UMTS)、高速分组接入(HSPA)、全球微波接入互操作性(WiMAX)、长期演进(LTE)标准、由各种标准设置组织定义的其他标准、其他远程协议或其他数据传输技术。
在示例实施例中,使用传输介质在网络1580上经由网络接口设备(例如,通信组件1564中包括的网络接口组件)并利用多个公知传输协议(例如,超文本传输协议(HTTP))中的任何一个来发送或接收指令1516。类似地,在其他示例实施例中,使用传输介质经由耦接1572(例如,对等耦接)向设备1570发送或接收指令1516。术语“传输介质”应被认为包括能够存储、编码或承载用于被机器1500执行的指令1516的任何无形介质,并且包括用于促进该软件的通信的数字或模拟通信信号或其他无形介质。传输介质是机器可读介质的实施例。
语言
在整个说明书中,复数实例可以实现被描述为单数实例的组件、操作或结构。虽然一个或多个方法的各个操作被示意和描述为分离的操作,但是各个操作中的一个或多个可以同时执行,并且无需按所示顺序执行操作。在示例配置中被示为分离组件的结构和功能可以被实现为组合结构或组件。类似地,被示为单个组件的结构和功能可以被实现为分离的组件。这些和其它变型、修改、添加和改进落入本主题的范围内。
尽管已经参考具体示例实施例描述了本发明主题的概述,但是在不脱离本公开的实施例的更宽范围的情况下,可以对这些实施例进行各种修改和改变。本发明主题的这些实施例在本文中可以单独地或共同地由术语“发明”提及,以仅仅为了方便,并且不旨在自动地将本申请的范围限制为任何单个公开或发明构思(如果事实上公开了一个以上)。
充分详细地描述了本文示出的实施例以使本领域技术人员能够实现所公开的教导。可以利用其他实施例并根据这些实施例导出其他实施例,从而可以在不脱离本公开的范围的情况下做出结构和逻辑上的替换和改变。因此,该“具体实施方式”不应当看做是限制意义,并且各种实施例的范围仅通过所附权利要求以及权利要求的等同物的全部范围来限定。
如本文所使用的,术语“或”可以被解释为包括性或排他性的意义。此外,可以针对本文中描述为单个实例的资源、操作或结构提供多个实例。另外,各种资源、操作、模块、引擎和数据存储之间的边界在某种程度上是任何的,并且在具体说明性配置的上下文中示出了特定操作。设想了功能的其他分配,并且这些分配可以落入本公开的各种实施例的范围内。一般来说,在示例配置中作为分离资源呈现的结构和功能可以被实现为组合的结构或资源。类似地,作为单个资源呈现的结构和功能可以被实现为分离的资源。这些和其他变型、修改、添加和改进落入由所附权利要求表示的本公开的实施例的范围内。因此,说明书和附图应当被看做说明性的而不是限制意义的。
以下列举的示例定义了本文讨论的方法、机器可读介质和系统(即,装置)的各种示例实施例:
示例1:一种方法,包括:
访问表示多个项目的数据;
针对所述多个项目中的每个项目,访问与所述项目相关联的关键字-值对集合;
从所述关键字-值对集合中选择第一关键字-值对;
确定所述多个项目中与所述第一关键字-值对相关联的第一数量的项目;
由机器的处理器将所述第一数量与阈值进行比较以生成结果;以及
基于所述结果,针对所述第一关键字-值对创建浏览节点,所述浏览节点包括引用所述第一关键字-值对的值的标题。
示例2:根据示例1所述的方法,还包括:
从所述关键字-值对集合中选择第二关键字-值对;
确定所述多个项目中与所述第一关键字-值对和所述第二关键字-值对两者相关联的第二数量的项目;
由机器的处理器将所述第二数量与所述阈值进行比较以生成第二结果;以及
基于所述第二结果,创建第二浏览节点,所述第二浏览节点包括引用所述第一关键字-值对的值和所述第二关键字-值对的值的标题。
示例3:根据示例1至2中任一项或多项所述的方法,还包括:
将所述第一关键字-值对的值与排除值集合进行比较,以确定所述值不在所述排除值集合中;以及
其中,针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的值不在所述排除值集合中。
示例4:根据示例1至3中任一项或多项所述的方法,还包括:
从所述多个项目中确定第一项目集合,所述第一项目集合与所述第一关键字-值对相关联;
从所述关键字-值对集合中选择第二关键字-值对;
从所述多个项目中确定第二项目集合,所述第二项目集合与所述第二关键字-值对相关联;
确定所述第一项目集合和所述第二项目集合之间的交集程度;以及
基于所述交集程度和第二阈值,放弃针对所述第二关键字-值对创建浏览节点。
示例5:根据示例1至4中任一项或多项所述的方法,还包括:
将所述第一关键字-值对的关键字与允许的关键字的集合进行比较,以确定所述关键字在所述允许的关键字的集合中;以及
其中,针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的关键字在所述允许的关键字的集合中。
示例6:根据示例1至5中任一项或多项所述的方法,其中:
所述多个项目与单个类别相关联;
所述方法还包括:
将所述第一关键字-值对的值与所述单个类别的名称进行比较,以确定所述值与所述单个类别的名称不匹配;以及
其中,针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的值与所述单个类别的名称不匹配。
示例7:根据示例1至6中任一项或多项所述的方法,其中:针对所述第一关键字-值对创建所述浏览节点包括创建所述浏览节点的统一资源定位符URL,所述URL包括所述第一关键字-值对的值。
示例8:根据示例1至7中任一项或多项所述的方法,还包括:
从所述多个项目中确定第一项目集合,所述第一项目集合与所述第一关键字-值对相关联;
从与所述第一关键字-值对相关联的所述第一项目集合中的项目所关联的图像中选择图像;以及
将所选图像与针对所述第一关键字-值对的浏览节点相关联。
示例9:根据示例1至8中任一项或多项所述的方法,其中:
所述第一项目集合中的每个项目具有相关联的量;以及
对所述图像的选择基于与所述第一项目集合中的每个项目相关联的量。
示例10:根据示例1至9中任一项或多项所述的方法,其中:
所述第一项目集合中的每个项目具有相关联的用户;以及
对所述图像的选择基于与所选图像相关联的项目相关联的用户的属性。
示例11:一种系统,包括:
存储器,存储指令;以及
处理器,由所述指令配置为执行以下操作:
访问表示多个项目的数据;
针对所述多个项目中的每个项目,访问与所述项目相关联的关键字-值对集合;
从所述关键字-值对集合中选择第一关键字-值对;
确定所述多个项目中与所述第一关键字-值对相关联的第一数量的项目;
将所述第一数量与阈值进行比较以生成结果;以及
基于所述结果,针对所述第一关键字-值对创建浏览节点,所述浏览节点包括引用所述第一关键字-值对的值的标题。
示例12:根据示例11所述的系统,其中,所述操作还包括:
从所述关键字-值对集合中选择第二关键字-值对;
确定所述多个项目中与所述第一关键字-值对和所述第二关键字-值对两者相关联的第二数量的项目;
将所述第二数量与所述阈值进行比较以生成第二结果;以及
基于所述第二结果,创建第二浏览节点,所述第二浏览节点包括引用所述第一关键字-值对的值和所述第二关键字-值对的值的标题。
示例13:根据示例11至12中任一项或多项所述的系统,其中,所述操作还包括:
将所述第一关键字-值对的值与排除值集合进行比较,以确定所述值不在所述排除值集合中;以及
其中,针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的值不在所述排除值集合中。
示例14:根据示例11至13中任一项或多项所述的系统,其中,所述操作还包括:
从所述多个项目中确定第一项目集合,所述第一项目集合与所述第一关键字-值对相关联;
从所述关键字-值对集合中选择第二关键字-值对;
从所述多个项目中确定第二项目集合,所述第二项目集合与所述第二关键字-值对相关联;
确定所述第一项目集合和所述第二项目集合之间的交集程度;以及
基于所述交集程度和第二阈值,放弃针对所述第二关键字-值对创建浏览节点。
示例15:根据示例11至14中任一项或多项所述的系统,其中,所述操作还包括:
将所述第一关键字-值对的关键字与允许的关键字的集合进行比较,以确定所述关键字在所述允许的关键字的集合中;以及
其中,针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的关键字在所述允许的关键字的集合中。
示例16:根据示例11至15中任一项或多项所述的系统,其中:
所述多个项目与单个类别相关联;以及
所述操作还包括:
将所述第一关键字-值对的值与所述单个类别的名称进行比较,以确定所述值与所述单个类别的名称不匹配;以及
针对所述第一关键字-值对创建所述浏览节点还基于确定所述第一关键字-值对的值与所述单个类别的名称不匹配。
示例17:根据示例11至16中任一项或多项所述的系统,其中:针对所述第一关键字-值对创建所述浏览节点包括创建所述浏览节点的统一资源定位符URL,所述URL包括所述第一关键字-值对的值。
示例18:根据示例11至17中任一项或多项所述的系统,其中,所述操作还包括:
从所述多个项目中确定第一项目集合,所述第一项目集合与所述第一关键字-值对相关联;
从与所述第一关键字-值对相关联的所述第一项目集合中的项目所关联的图像中选择图像;以及
将所选图像与针对所述第一关键字-值对的浏览节点相关联。
示例19:根据示例11至18中任一项或多项所述的系统,其中:
所述第一项目集合中的每个项目具有相关联的量;以及
对所述图像的选择基于与所述第一项目集合中的每个项目相关联的量。
示例20:一种存储指令的机器可读存储介质,所述指令在被机器的一个或多个处理器执行时使得所述机器执行包括以下各项在内的操作:
访问表示多个项目的数据;
针对所述多个项目中的每个项目,访问与所述项目相关联的关键字-值对集合;
从所述关键字-值对集合中选择第一关键字-值对;
确定所述多个项目中与所述第一关键字-值对相关联的第一数量的项目;
将所述第一数量与阈值进行比较以生成结果;以及
基于所述结果,针对所述第一关键字-值对创建浏览节点,所述浏览节点包括引用所述第一关键字-值对的值的标题。
示例21:一种承载指令的机器可读介质,所述指令能够由机器的一个或多个处理器执行以完成根据示例1至10中任一项所述的方法。
Claims (9)
1.一种使用频繁模式挖掘的浏览节点创建方法,包括:
访问表示潜在浏览节点的列表的数据,所述列表至少包括第一潜在浏览节点和第二潜在浏览节点,所述第一潜在浏览节点包含第一项目集合,所述第二潜在浏览节点包含第二项目集合;
确定所述第一项目集合和所述第二项目集合之间的重叠程度;
确定所述重叠程度超过阈值重叠程度;
至少部分地基于所述重叠程度超过阈值重叠程度,将所述第一潜在浏览节点和所述第二潜在浏览节点之一从所述列表中移除;以及
针对所述列表中剩余的潜在浏览节点创建浏览节点。
2.根据权利要求1所述的方法,其中,创建浏览节点包括生成浏览节点的统一资源定位符URL。
3.根据权利要求2所述的方法,其中,生成的URL包括指示关于浏览节点的信息的标题或标头元标签。
4.根据权利要求1所述的方法,其中,所述重叠程度被确定为项目的计数、较大项目集合的百分比、或者较小项目集合的百分比。
5.一种使用频繁模式挖掘的浏览节点创建系统,包括:
存储器,存储指令;以及
处理器,由所述指令配置为执行操作,所述操作包括:
访问表示潜在浏览节点的列表的数据,所述列表至少包括第一潜在浏览节点和第二潜在浏览节点,所述第一潜在浏览节点包含第一项目集合,所述第二潜在浏览节点包含第二项目集合;
确定所述第一项目集合和所述第二项目集合之间的重叠程度;
确定所述重叠程度超过阈值重叠程度;
至少部分地基于所述重叠程度超过阈值重叠程度,将所述第一潜在浏览节点和所述第二潜在浏览节点之一从所述列表中移除;以及
针对所述列表中剩余的潜在浏览节点创建浏览节点。
6.根据权利要求5所述的系统,其中,创建浏览节点包括生成浏览节点的统一资源定位符URL。
7.根据权利要求6所述的系统,其中,其中,生成的URL包括指示关于浏览节点的信息的标题或标头元标签。
8.根据权利要求5所述的系统,其中,所述重叠程度被确定为项目的计数、较大项目集合的百分比、或者较小项目集合的百分比。
9.一种承裁指令的机器可读介质,所述指令能够由机器的一个或多个处理器执行以完成根据权利要求1至4中任一项所述的方法。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/240,841 | 2016-08-18 | ||
US15/240,841 US10838984B2 (en) | 2016-08-18 | 2016-08-18 | Browse node creation using frequent pattern mining |
CN201780050415.1A CN109564570B (zh) | 2016-08-18 | 2017-08-16 | 使用频繁模式挖掘的浏览节点创建 |
PCT/US2017/047041 WO2018035179A1 (en) | 2016-08-18 | 2017-08-16 | Browse node creation using frequent pattern mining |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780050415.1A Division CN109564570B (zh) | 2016-08-18 | 2017-08-16 | 使用频繁模式挖掘的浏览节点创建 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116628101A true CN116628101A (zh) | 2023-08-22 |
Family
ID=61191900
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310546391.6A Pending CN116628101A (zh) | 2016-08-18 | 2017-08-16 | 使用频繁模式挖掘的浏览节点创建方法和系统 |
CN201780050415.1A Active CN109564570B (zh) | 2016-08-18 | 2017-08-16 | 使用频繁模式挖掘的浏览节点创建 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780050415.1A Active CN109564570B (zh) | 2016-08-18 | 2017-08-16 | 使用频繁模式挖掘的浏览节点创建 |
Country Status (4)
Country | Link |
---|---|
US (2) | US10838984B2 (zh) |
EP (1) | EP3500955A4 (zh) |
CN (2) | CN116628101A (zh) |
WO (1) | WO2018035179A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10838984B2 (en) | 2016-08-18 | 2020-11-17 | Ebay Inc. | Browse node creation using frequent pattern mining |
US11907267B2 (en) * | 2018-05-25 | 2024-02-20 | Salesforce Inc. | User interface for frequent pattern analysis |
US10523742B1 (en) * | 2018-07-16 | 2019-12-31 | Brandfolder, Inc. | Intelligent content delivery networks |
US10963519B2 (en) * | 2019-03-18 | 2021-03-30 | Salesforce.Com, Inc. | Attribute diversity for frequent pattern analysis |
US11301913B1 (en) * | 2019-08-14 | 2022-04-12 | Amazon Technologies, Inc. | Type completeness detection system |
US11113575B2 (en) | 2019-09-10 | 2021-09-07 | Ebay Inc. | Automatic image selection for online product catalogs |
US20220092046A1 (en) * | 2020-09-18 | 2022-03-24 | Kioxia Corporation | System and method for efficient expansion of key value hash table |
JP7262871B2 (ja) * | 2020-11-04 | 2023-04-24 | データ・サイエンティスト株式会社 | 検索ニーズ評価プログラム、検索ニーズ評価装置および検索ニーズ評価方法、ならびに、評価プログラム、評価装置および評価方法 |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6317722B1 (en) | 1998-09-18 | 2001-11-13 | Amazon.Com, Inc. | Use of electronic shopping carts to generate personal recommendations |
US6397228B1 (en) | 1999-03-31 | 2002-05-28 | Verizon Laboratories Inc. | Data enhancement techniques |
WO2002059793A2 (en) * | 2000-10-31 | 2002-08-01 | Michael Philip Kaufman | System and method for generating automatic user interface for arbitrarily complex or large databases |
US7331038B1 (en) * | 2003-07-02 | 2008-02-12 | Amazon.Com, Inc. | Predictive prefetching to improve parallelization of document generation subtasks |
US20050222987A1 (en) * | 2004-04-02 | 2005-10-06 | Vadon Eric R | Automated detection of associations between search criteria and item categories based on collective analysis of user activity data |
US7865495B1 (en) | 2004-10-06 | 2011-01-04 | Shopzilla, Inc. | Word deletion for searches |
US8131271B2 (en) | 2005-11-05 | 2012-03-06 | Jumptap, Inc. | Categorization of a mobile user profile based on browse behavior |
US7603367B1 (en) | 2006-09-29 | 2009-10-13 | Amazon Technologies, Inc. | Method and system for displaying attributes of items organized in a searchable hierarchical structure |
US8560398B1 (en) * | 2007-03-29 | 2013-10-15 | Amazon Technologies, Inc. | Method and system for providing item recommendations |
US7647309B1 (en) | 2007-03-29 | 2010-01-12 | A9.Com, Inc. | Browse relevance |
US8019766B2 (en) | 2007-03-30 | 2011-09-13 | Amazon Technologies, Inc. | Processes for calculating item distances and performing item clustering |
US7904440B2 (en) * | 2007-04-26 | 2011-03-08 | Microsoft Corporation | Search diagnostics based upon query sets |
US8738733B1 (en) * | 2007-09-25 | 2014-05-27 | Amazon Technologies, Inc. | Dynamic control system for managing redirection of requests for content |
US20090299978A1 (en) * | 2008-05-28 | 2009-12-03 | Alexander Farfurnik | Systems and methods for keyword and dynamic url search engine optimization |
US8117216B1 (en) * | 2008-08-26 | 2012-02-14 | Amazon Technologies, Inc. | Automated selection of item categories for presenting item recommendations |
US8301649B1 (en) | 2008-09-04 | 2012-10-30 | Amazon Technologies, Inc. | Dynamic categorizations for electronic advertising |
US8463769B1 (en) * | 2009-09-16 | 2013-06-11 | Amazon Technologies, Inc. | Identifying missing search phrases |
US9298851B2 (en) * | 2011-05-06 | 2016-03-29 | Microsoft Technology Licensing, Llc | Presenting related searches on a toolbar |
US9298776B2 (en) * | 2011-06-08 | 2016-03-29 | Ebay Inc. | System and method for mining category aspect information |
CN102521251B (zh) * | 2011-11-16 | 2015-04-01 | 北京搜狗科技发展有限公司 | 个性化搜索直达的方法、实现该方法的装置和搜索服务器 |
CN103020207B (zh) * | 2012-12-06 | 2017-02-08 | 优视科技有限公司 | 浏览器标签页分组管理方法及装置 |
US9053327B2 (en) * | 2013-02-19 | 2015-06-09 | Xerox Corporation | Method and system for distributed control of user privacy preferences |
US20140372956A1 (en) * | 2013-03-04 | 2014-12-18 | Atigeo Llc | Method and system for searching and analyzing large numbers of electronic documents |
AU2014274688B2 (en) * | 2013-06-06 | 2019-02-07 | Facebook, Inc. | Generating a feed of content items associated with a topic from multiple content sources |
US9665900B1 (en) * | 2013-06-07 | 2017-05-30 | Amazon Technologies, Inc. | Item-specific sales ranking systems and methods |
CN103631875B (zh) * | 2013-11-08 | 2017-04-12 | 北京奇虎科技有限公司 | 在浏览器侧进行网络搜索的方法与浏览器 |
WO2015113167A1 (en) * | 2014-02-03 | 2015-08-06 | Synergy Medical Brg Inc. | System for assisting the preparation of medication dose packs and methods |
CN103853822A (zh) * | 2014-02-24 | 2014-06-11 | 北京奇虎科技有限公司 | 一种在浏览器中推送新闻信息的方法和装置 |
CN103942712A (zh) * | 2014-05-09 | 2014-07-23 | 北京联时空网络通信设备有限公司 | 基于产品相似度的电子商务推荐系统及其方法 |
US10325304B2 (en) * | 2014-05-23 | 2019-06-18 | Ebay Inc. | Personalizing alternative recommendations using search context |
US10387934B1 (en) * | 2014-06-12 | 2019-08-20 | Amazon Technologies, Inc. | Method medium and system for category prediction for a changed shopping mission |
US9894119B2 (en) * | 2014-08-29 | 2018-02-13 | Box, Inc. | Configurable metadata-based automation and content classification architecture for cloud-based collaboration platforms |
US10838984B2 (en) | 2016-08-18 | 2020-11-17 | Ebay Inc. | Browse node creation using frequent pattern mining |
-
2016
- 2016-08-18 US US15/240,841 patent/US10838984B2/en active Active
-
2017
- 2017-08-16 CN CN202310546391.6A patent/CN116628101A/zh active Pending
- 2017-08-16 EP EP17842031.1A patent/EP3500955A4/en not_active Ceased
- 2017-08-16 CN CN201780050415.1A patent/CN109564570B/zh active Active
- 2017-08-16 WO PCT/US2017/047041 patent/WO2018035179A1/en unknown
-
2020
- 2020-10-06 US US17/064,538 patent/US11397758B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US11397758B2 (en) | 2022-07-26 |
WO2018035179A1 (en) | 2018-02-22 |
EP3500955A4 (en) | 2020-04-22 |
US10838984B2 (en) | 2020-11-17 |
US20180052905A1 (en) | 2018-02-22 |
CN109564570A (zh) | 2019-04-02 |
US20210019337A1 (en) | 2021-01-21 |
CN109564570B (zh) | 2023-05-30 |
EP3500955A1 (en) | 2019-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110199276B (zh) | 用于搜索的方法、系统和介质 | |
CN109564570B (zh) | 使用频繁模式挖掘的浏览节点创建 | |
US9965704B2 (en) | Discovering visual concepts from weakly labeled image collections | |
CN113348650B (zh) | 交互信息界面的显示方法、系统及机器可读存储介质 | |
US11334768B1 (en) | Ephemeral content management | |
US11775601B2 (en) | User electronic message system | |
CN110785755B (zh) | 用于内容生成的上下文识别 | |
US20220114631A1 (en) | Social network initiated listings | |
WO2017160722A1 (en) | Catalogue management | |
US20230237087A1 (en) | System to generate contextual queries | |
US10929411B2 (en) | Precedence-based fast and space-efficient ranking | |
US20240127052A1 (en) | Data management using multimodal machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |