CN105095416B - 一种在搜索中实现内容推广的方法和装置 - Google Patents

一种在搜索中实现内容推广的方法和装置 Download PDF

Info

Publication number
CN105095416B
CN105095416B CN201510409012.4A CN201510409012A CN105095416B CN 105095416 B CN105095416 B CN 105095416B CN 201510409012 A CN201510409012 A CN 201510409012A CN 105095416 B CN105095416 B CN 105095416B
Authority
CN
China
Prior art keywords
promotional content
search
popularization
content
picture
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510409012.4A
Other languages
English (en)
Other versions
CN105095416A (zh
Inventor
黄凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Qizhi Software Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd, Qizhi Software Beijing Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201510409012.4A priority Critical patent/CN105095416B/zh
Publication of CN105095416A publication Critical patent/CN105095416A/zh
Application granted granted Critical
Publication of CN105095416B publication Critical patent/CN105095416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0263Targeted advertisements based upon Internet or website rating

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种在搜索中实现内容推广的方法和装置,该方法包括:提供不同的用于定制推广内容的模板以供不同推广用户选择;各个推广用户根据所选择模板的规范定制自身的推广内容并保存到服务器上;分别从各推广用户的服务器爬取并保存对应的推广内容;在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容并展现在搜索结果页面中。本发明提供的技术方案在搜索服务与内容推广服务之间建立起关联,针对搜索用户的搜索需求在搜索结果页面上展示匹配的推广内容,使得推广服务更具定向性和灵活性,不仅满足了推广用户的内容推广需求,也满足了搜索用户的搜索需求,极大程度地提高了内容推广服务的价值与意义。

Description

一种在搜索中实现内容推广的方法和装置
技术领域
本发明涉及搜索技术领域,具体涉及一种在搜索中实现内容推广的方法和装置。
背景技术
随着互联网技术的不断发展,互联网用户日益增多,形成巨大的推广受众,越来越多具有内容推广需求的用户希望通过利用互联网平台进行推广和宣传,来提高内容推广的效率。然而现有技术中,内容推广服务并未形成合理规范的体系,导致推广内容和推广方式的不合理,例如,在互联网用户浏览网页时,网页的某位置突然弹出推广内容,该推广内容与当前网页毫无关系,且对用户的浏览行为造成了不良的影响,该无针对性且出现方式不合理的推广对当前浏览用户来说毫无意义,不仅降低了当前浏览用户的体验,也无法满足推广用户的内容推广需求,内容推广的有效性极差。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种在搜索中实现内容推广的方法和装置。
依据本发明的一个方面,提供了一种在搜索中实现内容推广的方法,该方法包括:
提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存所爬取到的推广内容;
在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
可选地,所述分别从各推广用户的服务器爬取对应的推广内容包括:
从推广用户的服务器地址列表获得各推广用户的服务器地址;
根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
可选地,所述分别从各推广用户的服务器爬取对应的推广内容包括:
将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;
调度多个进程来完成任务队列中的任务。
可选地,所述调度多个进程来完成任务队列中的任务包括:
在一台或多台机器上启动进程,其中每个机器上启动了多个进程;
从任务队列中取任务,并使用一致性哈希算法调度所述一台或多台机器上的进程来完成任务。
可选地,所述保存所爬取到的推广内容包括:
从爬取到的推广内容的每一项中抽取关键词;其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;
对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
可选地,所述对该项进行保存处理包括:
将该项的结构化的推广数据中的图片保存到图片服务器中;
将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
可选地,所述根据搜索关键词从所保存的推广内容中查找到匹配的推广内容包括:
根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;
根据图片在图片服务器上的地址获取相应的图片;
图片、文本和URL地址为最终推广内容。
可选地,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中包括:
在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
依据本发明的另一个方面,提供了一种在搜索中实现内容推广的装置,该装置包括:
模板处理单元,适于提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
爬取处理单元,适于根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存处理单元,适于保存所爬取到的推广内容;
搜索处理单元,适于在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
可选地,所述爬取处理单元,适于从推广用户的服务器地址列表获得各推广用户的服务器地址;根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
可选地,所述爬取处理单元,适于将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;调度多个进程来完成任务队列中的任务。
可选地,所述爬取处理单元,适于从任务队列中取任务,并使用一致性哈希算法调度一台或多台机器上的进行来完成任务;
其中,所述一台或多台机器中的每个机器上都启动了多个进程。
可选地,所述保存处理单元,适于从爬取到的推广内容的每一项中抽取关键词,其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;以及适于对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
可选地,所述保存处理单元,适于将该项的结构化的推广数据中的图片保存到图片服务器中;以及适于将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
可选地,所述搜索处理单元,适于根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;根据图片在图片服务器上的地址获取相应的图片;图片、文本和URL地址为最终推广内容。
可选地,所述搜索处理单元,适于在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
由上述可知,本发明提供的技术方案在搜索服务与内容推广服务之间建立起关联,通过推广用户所选择的模板统一双方交互规范,依据该交互规范从推广用户的服务器爬取并保存推广内容,当接收到搜索用户发出的搜索关键词时,查找与搜索关键词匹配的推广内容并在搜索结果页面上进行展示。该方案针对搜索用户的搜索需求在搜索结果页面上展示匹配的推广内容,使得推广服务更具定向性和灵活性,不仅满足了推广用户的内容推广需求,也满足了搜索用户的搜索需求,极大程度地提高了内容推广服务的价值与意义。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种在搜索中实现内容推广的方法的流程图;
图2示出了根据本发明一个实施例的从推广用户的服务器爬取对应推广内容的方法的流程图;
图3示出了根据本发明一个实施例的保存所爬取到的推广内容的方法的流程图
图4示出了根据本发明一个实施例的一种在搜索中实现内容推广的装置的示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
图1示出了根据本发明一个实施例的一种在搜索中实现内容推广的方法的流程图。如图1所示,该方法包括:
步骤S110,提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板。
本步骤中,每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上。
步骤S120,根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容。
步骤S130,保存所爬取到的推广内容。
步骤S140,在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
可见,图1所示的方法在搜索服务与内容推广服务之间建立起关联,通过推广用户所选择的模板统一双方交互规范,依据该交互规范从推广用户的服务器爬取并保存推广内容,当接收到搜索用户发出的搜索关键词时,查找与搜索关键词匹配的推广内容并在搜索结果页面上进行展示。该方案针对搜索用户的搜索需求在搜索结果页面上展示匹配的推广内容,使得推广服务更具定向性和灵活性,不仅满足了推广用户的内容推广需求,也满足了搜索用户的搜索需求,极大程度地提高了内容推广服务的价值与意义。
在本发明的一个实施例中,可以预先获取推广用户的服务器地址列表,该列表中记录了所有推广用户的服务器地址,则图1所示方法的步骤S120,分别从各推广用户的服务器爬取对应的推广内容包括:从推广用户的服务器地址列表获得各推广用户的服务器地址;根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
上述方法中,为了保证推广内容爬取过程的有效性、可靠性以及效率,在本发明的一个实施例中,图1所示方法的步骤S120,从各推广用户的服务器爬取对应的推广内容包括:将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列,调度多个进程来完成任务队列中的任务。
进一步地,由于进程是运行在机器上的,考虑到单一机器发生故障的可能性以及负荷的有限性,本发明提供了由多台机器组成多节点任务执行系统的方案,即上述方法中所述调度多个进程来完成任务队列中的任务包括:在一台或多台机器上启动进程,其中每个机器上启动了多个进程;从任务队列中取任务,并使用一致性哈希算法调度所述一台或多台机器上的进程来完成任务。
本实施例中的多台机器组成了一个多节点任务执行系统,用于完成任务队列中的任务,通过使用一致性哈希算法,能够将任务队列中的任务尽可能平衡地分配到多台机器中的去,使得所有机器都能得到利用,并且当其中一台机器出现故障失效后,能够动态地将该故障机器的任务转移分配给临近的机器,保证了当多节点任务执行系统的机器数目发生变化时仍然能够对外提供良好的推广内容的爬取服务;与现有技术中只使用单一机器启动进程执行爬取任务的方案相比,本实施例中的爬取任务调度方案具有更好的容错性和可扩展性。
图2示出了根据本发明一个实施例的从推广用户的服务器爬取对应推广内容的方法的流程图。在本实施例中,推广用户根据所选择模板的规范定制自身的推广内容,以网站地图(Sitemap)的形式保存到自身的服务器上,该网站地图中包括多个XML文件,其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),使得推广内容的爬取更加智能。则如图2所示,从推广用户的服务器爬取对应推广内容的方法包括:
步骤S210,网站地图提取:从推广用户的服务器上提取网站地图,依据该网站地图,执行步骤S220。
步骤S220,频度判断:判断该网站地图的推广内容是否爬取过且与前一次爬取过的该网站地图的推广内容相同,否则执行步骤S230,是则执行步骤S250。
本步骤中的判断可以每隔预定时间执行一次,能够有效追踪推广用户对推广内容的更新。本步骤所述的判断该网站地图的推广内容是否爬取过且与前一次爬取过的该网站地图的推广内容相同包括:依次判断网站地图的推广内容中的XML文件是否爬取过且与前一次爬取过的该XML文件相同,其中判断XML文件是否相同的依据包括:该XML文件的URL地址、该XML文件的最近更改时间等信息,如果这些信息都相同则认为是相同的XML文件。
步骤S230,任务队列设置:如果网站地图中的推广内容不超过预定任务负荷,则将爬取该推广内容作为一个任务,放入任务队列中;如果网站地图中的推广内容超过预定任务负荷,则将爬取该推广内容作为多个任务,放入任务队列中,执行步骤S240。
步骤S240,任务调度:从任务队列中取任务,使用一致性哈希算法调度一台或多台机器上的进程来完成爬取任务。
步骤S250,结束:结束爬取过程。
需要说明的是,本实施例中的推广用户以网站地图保存多个XML文件的格式保存推广内容,使得本方案最终爬取到的推广内容是多个XML文件,不应当作为对本发明提供的在搜索中实现内容推广的方案的限制。
在本发明的一个实施例中,图1所示方法的步骤S130,保存所爬取到的推广内容包括:
步骤S131,从爬取到的推广内容的每一项中抽取关键词。
本步骤中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据。
步骤S132,对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
本步骤中,所述对该项进行保存处理包括:将该项的结构化的推广数据中的图片保存到图片服务器中;将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
基于上述对爬取到的推广内容的保存过程,则图1所示方法的步骤S140,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容包括:
步骤S141,根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址。
步骤S142,根据图片在图片服务器上的地址获取相应的图片。
步骤S143,将图片、文本和URL地址作为最终推广内容。
图3示出了根据本发明一个实施例的保存所爬取到的推广内容的方法的流程图。本实施例与图2所示的实施例相同,推广用户以网站地图(Sitemap)保存多个XML文件的格式保存推广内容,使得最终爬取到的推广内容是多个XML文件,其中,一个XML文件中包括多个项(Item),每项包括关键词(Key)和结构化的推广数据(Display)。对于爬取到的推广内容的每一项,如图3所示,保存所爬取到的推广内容的方法包括:
步骤S310,Key抽取:从该项中抽取关键词;
步骤S320,Bidword(竞价词)判断:判断抽取的关键词是否属于竞价词库中的词,如果不属于则执行步骤S330,如果属于则执行步骤S340。
本步骤中所述的竞价词库中的词是预先设置好的,不同的词有不同的优先级,在最初提供给推广用户定制模板的同时,还将该竞价词库提供给推广用户,用户可以根据自身需求按照该竞价词库设置推广内容中各项中的关键词,即属于竞价词库的关键词被认为可以被推广,且根据不同的竞价词的优先级能够给不同的推广用户的推广内容进行排序,在需要展示多个推广内容的情况下,按照该排序进行展示。
步骤S330,丢弃:丢弃该项。
步骤S340,Display抽取:从该项中抽取结构化的推广数据。
步骤S350,指纹对比:利用指纹对比方法(如MD5方法)判断结构化的推广数据与前一次爬取过的该结构化的推广数据相同,是则执行步骤S330,否则执行步骤S360。
步骤S360,Pic抽取和保存:抽取该项的结构化的推广数据中的图片;将该项的结构化的推广数据中的图片保存到图片服务器中。
步骤S370,TXT/URL/Key抽取和保存:抽取该项的结构化的推广数据中的文本和URL地址;将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
步骤S370,结束:结束对该项的保存。
需要说明的是,本实施例中的推广用户以网站地图保存多个XML文件的格式保存推广内容,使得本方案最终爬取到的推广内容是多个XML文件,以及XML文件中的关键词与结构化的推广数据不应当作为对本发明提供的在搜索中实现内容推广的方案的限制。
在本发明的一个实施例中,图1所示方法的步骤S140,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中包括:在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
图4示出了根据本发明一个实施例的一种在搜索中实现内容推广的装置的示意图。如图4所示,该在搜索中实现内容推广的装置400包括:
模板处理单元410,适于提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板。
其中,每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上。
爬取处理单元420,适于根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容。
保存处理单元430,适于保存所爬取到的推广内容。
搜索处理单元440,适于在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
可见,图4所示的装置在搜索服务与内容推广服务之间建立起关联,通过推广用户所选择的模板统一双方交互规范,依据该交互规范从推广用户的服务器爬取并保存推广内容,当接收到搜索用户发出的搜索关键词时,查找与搜索关键词匹配的推广内容并在搜索结果页面上进行展示。该方案针对搜索用户的搜索需求在搜索结果页面上展示匹配的推广内容,使得推广服务更具定向性和灵活性,不仅满足了推广用户的内容推广需求,也满足了搜索用户的搜索需求,极大程度地提高了内容推广服务的价值与意义。
在本发明的一个实施例中,图4所示装置的爬取处理单元420,适于从推广用户的服务器地址列表获得各推广用户的服务器地址;根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
在本发明的一个实施例中,图4所示装置的爬取处理单元420,适于将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;调度多个进程来完成任务队列中的任务。
具体地,爬取处理单元420,适于从任务队列中取任务,并使用一致性哈希算法调度一台或多台机器上的进行来完成任务;其中,所述一台或多台机器中的每个机器上都启动了多个进程。
在本发明的一个实施例中,图4所示装置的保存处理单元430,适于从爬取到的推广内容的每一项中抽取关键词,其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;以及适于对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
具体地,保存处理单元430,适于将该项的结构化的推广数据中的图片保存到图片服务器中;以及适于将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
基于保存处理单元430的上述保存过程,则搜索处理单元440,适于根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;根据图片在图片服务器上的地址获取相应的图片;将图片、文本和URL地址作为最终推广内容。
在本发明的一个实施例中,图4所示装置的搜索处理单元440,适于在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
需要说明的是,图4所示的装置的各实施例与图1-图3所示的方法的各实施例对应相同,上文中已有详细说明,在此不再赘述。
综上所述,本发明提供的技术方案在搜索服务与内容推广服务之间建立起关联,通过推广用户所选择的模板统一双方交互规范,依据该交互规范从推广用户的服务器爬取并保存推广内容,当接收到搜索用户发出的搜索关键词时,查找与搜索关键词匹配的推广内容并在搜索结果页面上进行展示。该方案针对搜索用户的搜索需求在搜索结果页面上展示匹配的推广内容,使得推广服务更具定向性和灵活性,不仅满足了推广用户的内容推广需求,也满足了搜索用户的搜索需求,极大程度地提高了内容推广服务的价值与意义。
需要说明的是:
在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的在搜索中实现内容推广的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种在搜索中实现内容推广的方法,其中,该方法包括:
提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存所爬取到的推广内容;
在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
A2、如A1所述的方法,其中,所述分别从各推广用户的服务器爬取对应的推广内容包括:
从推广用户的服务器地址列表获得各推广用户的服务器地址;
根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
A3、如A1所述的方法,其中,所述分别从各推广用户的服务器爬取对应的推广内容包括:
将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;
调度多个进程来完成任务队列中的任务。
A4、如A3所述的方法,其中,所述调度多个进程来完成任务队列中的任务包括:
在一台或多台机器上启动进程,其中每个机器上启动了多个进程;
从任务队列中取任务,并使用一致性哈希算法调度所述一台或多台机器上的进程来完成任务。
A5、如A1所述的方法,其中,所述保存所爬取到的推广内容包括:
从爬取到的推广内容的每一项中抽取关键词;其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;
对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
A6、如A5所述的方法,其中,所述对该项进行保存处理包括:
将该项的结构化的推广数据中的图片保存到图片服务器中;
将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
A7、如A6所述的方法,其中,所述根据搜索关键词从所保存的推广内容中查找到匹配的推广内容包括:
根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;
根据图片在图片服务器上的地址获取相应的图片;
图片、文本和URL地址为最终推广内容。
A8、如A1所述的方法,其中,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中包括:
在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
本发明还公开了B9、一种在搜索中实现内容推广的装置,其中,该装置包括:
模板处理单元,适于提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
爬取处理单元,适于根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存处理单元,适于保存所爬取到的推广内容;
搜索处理单元,适于在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中。
B10、如B9所述的装置,其中,
所述爬取处理单元,适于从推广用户的服务器地址列表获得各推广用户的服务器地址;根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
B11、如B9所述的装置,其中,
所述爬取处理单元,适于将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;调度多个进程来完成任务队列中的任务。
B12、如B11所述的装置,其中,
所述爬取处理单元,适于从任务队列中取任务,并使用一致性哈希算法调度一台或多台机器上的进行来完成任务;
其中,所述一台或多台机器中的每个机器上都启动了多个进程。
B13、如B9所述的装置,其中,
所述保存处理单元,适于从爬取到的推广内容的每一项中抽取关键词,其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;以及适于对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
B14、如B13所述的装置,其中,
所述保存处理单元,适于将该项的结构化的推广数据中的图片保存到图片服务器中;以及适于将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
B15、如B14所述的装置,其中,
所述搜索处理单元,适于根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;根据图片在图片服务器上的地址获取相应的图片;图片、文本和URL地址为最终推广内容。
B16、如B9所述的装置,其中,
所述搜索处理单元,适于在搜索结合页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。

Claims (14)

1.一种在搜索中实现内容推广的方法,其中,该方法包括:
提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存所爬取到的推广内容;
在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中;
所述保存所爬取到的推广内容包括:
从爬取到的推广内容的每一项中抽取关键词;其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;
对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
2.如权利要求1所述的方法,其中,所述分别从各推广用户的服务器爬取对应的推广内容包括:
从推广用户的服务器地址列表获得各推广用户的服务器地址;
根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
3.如权利要求1所述的方法,其中,所述分别从各推广用户的服务器爬取对应的推广内容包括:
将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;
调度多个进程来完成任务队列中的任务。
4.如权利要求3所述的方法,其中,所述调度多个进程来完成任务队列中的任务包括:
在一台或多台机器上启动进程,其中每个机器上启动了多个进程;
从任务队列中取任务,并使用一致性哈希算法调度所述一台或多台机器上的进程来完成任务。
5.如权利要求1所述的方法,其中,所述对该项进行保存处理包括:
将该项的结构化的推广数据中的图片保存到图片服务器中;
将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
6.如权利要求5所述的方法,其中,所述根据搜索关键词从所保存的推广内容中查找到匹配的推广内容包括:
根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;
根据图片在图片服务器上的地址获取相应的图片;
图片、文本和URL地址为最终推广内容。
7.如权利要求1所述的方法,其中,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中包括:
在搜索结果页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
8.一种在搜索中实现内容推广的装置,其中,该装置包括:
模板处理单元,适于提供不同的用于定制推广内容的模板,以供不同推广用户选择并记录各推广用户所选择的模板;其中每个推广用户根据所选择模板的规范定制自身的推广内容并保存到自身的服务器上;
爬取处理单元,适于根据各推广用户各自选择的模板,分别从各推广用户的服务器爬取对应的推广内容;
保存处理单元,适于保存所爬取到的推广内容;
搜索处理单元,适于在接收搜索关键词时,根据搜索关键词从所保存的推广内容中查找到匹配的推广内容,将匹配的推广内容作为搜索结果的一部分展现在搜索结果页面中;
所述保存处理单元,适于从爬取到的推广内容的每一项中抽取关键词,其中,爬取的推广内容包括一个或多个项,每项包括关键词和结构化的推广数据;以及适于对于推广内容中的每一项,判断抽取的关键词是否属于竞价词库中的词,如果不属于则丢弃该项,如果属于则对该项进行保存处理。
9.如权利要求8所述的装置,其中,
所述爬取处理单元,适于从推广用户的服务器地址列表获得各推广用户的服务器地址;根据获得地址访问各推广用户的服务器,并爬取对应的推广内容。
10.如权利要求8所述的装置,其中,
所述爬取处理单元,适于将从每个推广用户的服务器爬取推广内容的一个或多个任务放入任务队列;调度多个进程来完成任务队列中的任务。
11.如权利要求10所述的装置,其中,
所述爬取处理单元,适于从任务队列中取任务,并使用一致性哈希算法调度一台或多台机器上的进程来完成任务;
其中,所述一台或多台机器中的每个机器上都启动了多个进程。
12.如权利要求8所述的装置,其中,
所述保存处理单元,适于将该项的结构化的推广数据中的图片保存到图片服务器中;以及适于将图片在图片服务器上的地址、该项的结构化的推广数据中的文本和URL地址,以该项的关键词为索引保存到推广内容库中。
13.如权利要求12所述的装置,其中,
所述搜索处理单元,适于根据搜索关键词从推广内容库中查找匹配的索引关键词,获得相应的图片在图片服务器上的地址、文本和URL地址;根据图片在图片服务器上的地址获取相应的图片;图片、文本和URL地址为最终推广内容。
14.如权利要求8所述的装置,其中,
所述搜索处理单元,适于在搜索结果页面的指定位置处展现一个应用盒子,在该应用盒子中展现匹配的推广内容。
CN201510409012.4A 2015-07-13 2015-07-13 一种在搜索中实现内容推广的方法和装置 Active CN105095416B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510409012.4A CN105095416B (zh) 2015-07-13 2015-07-13 一种在搜索中实现内容推广的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510409012.4A CN105095416B (zh) 2015-07-13 2015-07-13 一种在搜索中实现内容推广的方法和装置

Publications (2)

Publication Number Publication Date
CN105095416A CN105095416A (zh) 2015-11-25
CN105095416B true CN105095416B (zh) 2018-12-07

Family

ID=54575853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510409012.4A Active CN105095416B (zh) 2015-07-13 2015-07-13 一种在搜索中实现内容推广的方法和装置

Country Status (1)

Country Link
CN (1) CN105095416B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108255831B (zh) * 2016-12-28 2021-12-17 航天信息股份有限公司 一种用于为网站生成网站地图的方法及系统
CN107424002A (zh) * 2017-04-26 2017-12-01 网易传媒科技(北京)有限公司 图片搜索结果的展示方法、设备和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514209A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 基于对象信息库生成待推广对象的推广信息的方法与设备
CN103544176A (zh) * 2012-07-13 2014-01-29 百度在线网络技术(北京)有限公司 用于生成多个页面所对应的页面结构模板的方法和设备
CN103678511A (zh) * 2013-11-25 2014-03-26 北京奇虎科技有限公司 根据可视化模板进行网页内容抽取的方法及装置
CN103761330A (zh) * 2014-02-10 2014-04-30 赛特斯信息科技股份有限公司 基于模版配置实现互联网信息自动提取的系统及方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103514209A (zh) * 2012-06-27 2014-01-15 百度在线网络技术(北京)有限公司 基于对象信息库生成待推广对象的推广信息的方法与设备
CN103544176A (zh) * 2012-07-13 2014-01-29 百度在线网络技术(北京)有限公司 用于生成多个页面所对应的页面结构模板的方法和设备
CN103678511A (zh) * 2013-11-25 2014-03-26 北京奇虎科技有限公司 根据可视化模板进行网页内容抽取的方法及装置
CN103761330A (zh) * 2014-02-10 2014-04-30 赛特斯信息科技股份有限公司 基于模版配置实现互联网信息自动提取的系统及方法

Also Published As

Publication number Publication date
CN105095416A (zh) 2015-11-25

Similar Documents

Publication Publication Date Title
EP2946316B1 (en) Indexing application pages of native applications
US11580168B2 (en) Method and system for providing context based query suggestions
US8762360B2 (en) Integrating applications within search results
CN104036011B (zh) 网页元素的显示方法以及浏览器装置
CN110209827B (zh) 搜索方法、装置、计算机可读存储介质和计算机设备
US20130282709A1 (en) Method and system for query suggestion
US20120124547A1 (en) Development artifact searching in an integrated development environment
CN106687949A (zh) 本地应用的搜索结果
WO2014193439A1 (en) Application installation from search results
CN106980700A (zh) 在浏览器侧进行网络搜索的方法与浏览器
CN107463592B (zh) 用于将内容项目与图像匹配的方法、设备和数据处理系统
US20180189359A1 (en) Systems and Methods for Harvesting Data Associated with Fraudulent Content in a Networked Environment
WO2011116082A2 (en) Indexing and searching employing virtual documents
US10579687B2 (en) Providing native application search results with web search results
CN105183890A (zh) 基于浏览器的网页加载方法和浏览器装置
JP6517437B2 (ja) 自動化された情報取得
CN109977318B (zh) 书籍搜索方法、电子设备及计算机存储介质
RU2693193C1 (ru) Автоматизированное извлечение информации
CN105183749B (zh) 一种爬取推广内容并供搜索使用的方法和装置
CN105095416B (zh) 一种在搜索中实现内容推广的方法和装置
CN113010814A (zh) 网页内容的处理方法、计算设备及计算机存储介质
CN108491423B (zh) 一种排序方法及装置
CN114546220A (zh) 页面配置方法及装置、存储介质、计算机设备
CN110502690B (zh) 分类搜索方法和设备
CN111491198B (zh) 一种小视频搜索方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20220801

Address after: Room 801, 8th floor, No. 104, floors 1-19, building 2, yard 6, Jiuxianqiao Road, Chaoyang District, Beijing 100015

Patentee after: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Address before: 100088 room 112, block D, 28 new street, new street, Xicheng District, Beijing (Desheng Park)

Patentee before: BEIJING QIHOO TECHNOLOGY Co.,Ltd.

Patentee before: Qizhi software (Beijing) Co.,Ltd.

TR01 Transfer of patent right