CN103020226A - 一种获取搜索结果的方法和装置 - Google Patents
一种获取搜索结果的方法和装置 Download PDFInfo
- Publication number
- CN103020226A CN103020226A CN2012105375936A CN201210537593A CN103020226A CN 103020226 A CN103020226 A CN 103020226A CN 2012105375936 A CN2012105375936 A CN 2012105375936A CN 201210537593 A CN201210537593 A CN 201210537593A CN 103020226 A CN103020226 A CN 103020226A
- Authority
- CN
- China
- Prior art keywords
- book
- search results
- query
- user
- described query
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 37
- 238000006116 polymerization reaction Methods 0.000 claims description 32
- 230000008859 change Effects 0.000 claims description 10
- 238000012550 audit Methods 0.000 claims description 6
- 230000000379 polymerizing effect Effects 0.000 abstract 1
- 239000000203 mixture Substances 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000001125 extrusion Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000006855 networking Effects 0.000 description 2
- 241000239290 Araneae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2455—Query execution
- G06F16/24553—Query execution of query operations
- G06F16/24554—Unary operations; Data partitioning operations
- G06F16/24556—Aggregation; Duplicate elimination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/137—Hierarchical processing, e.g. outlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种获取搜索结果的方法和装置,其中方法包括:获取用户在搜索引擎输入的query;对所述query的搜索结果进行聚合生成与所述query相关联的电子书后,向用户展现与所述query相关联的电子书。本发明通过将搜索结果的内容进行聚合后以电子书的形式提供给用户,方便用户随时随地通过电子书阅读之前搜索得到的搜索结果,实现了搜索结果的异步查看功能,满足用户的异步查看需求。
Description
【技术领域】
本发明涉及计算机应用技术领域,特别涉及一种获取搜索结果的方法和装置。
【背景技术】
随着计算机网络技术的迅猛发展,搜索引擎逐渐成为人们获取信息的最主要、最快捷、最方便的手段,用户在搜索引擎中输入检索项(query)后,能够向用户返回该query的搜索结果。
现有搜索引擎的模式不论是在PC上还是在移动终端上,都停留在实时同步检索的方式上,即提供给用户的搜索结果通过必须通过浏览器实时查看,然而在很多场景或对于很多用户来说,希望在获取搜索结果后能够通过异步的方式查看,也就是说,希望获取搜索结果后在想查看或者方便的时候查看搜索结果。对于这方面的需求可以举以下几个例子:
例子1:用户需要撰写某类知识的论文,因此需要查看大量的资料做积累,假设其通过搜索引擎输入“拉格朗日”,获取到的大量搜索结果中用户需要花费大量时间去浏览并找到自己需要的资料,但现有的搜索引擎模式只能够在浏览器上实时展现搜索结果,一方面不方便用户长时间或任意时间查看搜索结果,另一方面也不方便用户对搜索结果的保留。
例子2:用户通过诸如手机等移动终端搜索query,为了节约手机流量,希望在wifi环境下进行搜索,但现有方式中获取到的搜索结果也限制了用户必须在wifi环境下进行查看,否则就会浪费大量的手机流量。此时用户就有获取搜索结果后能够异步查看的需求。
例子3:用户通过PC等固定终端搜索query后,就必须通过PC继续查看搜索结果,但往往用户会希望在PC上得到的搜索结果能够随时随地进行查看,例如希望在出差过程中通过移动终端查看这些搜索结果,现有的方式显然不能够满足该异步查看搜索结果的需求。
【发明内容】
有鉴于此,本发明提供了一种获取搜索结果的方法和装置,以便于实现搜索结果的异步查看功能,满足用户的异步查看需求。
具体技术方案如下:
一种获取搜索结果的方法,该方法包括:
S1、获取用户在搜索引擎输入的query;
S2、对所述query的搜索结果进行聚合生成与所述query相关联的电子书后,向用户展现与所述query相关联的电子书。
根据本发明一优选实施例,在所述步骤S2之前还包括:
判断是否已经存在与所述query相关联的电子书,如果是,直接向用户展现与所述query相关联的电子书;否则,继续执行所述步骤S2。
根据本发明一优选实施例,对所述query的搜索结果进行聚合生成与所述query相关联的电子书具体包括:
从所述query的搜索结果中挑选搜索结果;
对挑选的搜索结果进行去重和去除无关内容后,进行自动排版生成与所述query相关联的电子书。
根据本发明一优选实施例,从所述query的搜索结果中挑选搜索结果包括:
按照各搜索结果与所述query之间的相似度,挑选相似度满足预设相似度要求的搜索结果;或者,
按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果;或者,
按照搜索引擎对搜索结果的排序结果,挑选排在前M个的搜索结果,M为预设的正整数。
根据本发明一优选实施例,该方法还包括:在所述电子书中进一步聚合所述query的同义query或扩展query的搜索结果,并将所述同义query或扩展query与所述电子书相关联。
根据本发明一优选实施例,该方法还包括:
对版权方提供的内容进行审核后,将审核通过的内容添加至所述电子书;或者,
对版权方提供的内容与所述query进行相似度计算后,将满足相似度要求的版权方提供的内容添加至所述电子书。
根据本发明一优选实施例,该方法还包括:在生成电子书后,为电子书分配唯一的编号PKN;
如果电子书发生更新,则变更电子书的版本号,电子书的PKN保持不变。
根据本发明一优选实施例,向用户展现与所述query相关联的电子书具体包括:
在搜索结果页面上向用户提供所述电子书的阅读或下载标识,其中所述阅读或下载标识为二维码或链接的形式。
根据本发明一优选实施例,对于下载量或阅读量达到一定数量的电子书,形成一个小型社区供下载或阅读该电子书的用户之间进行交流;或者,
对于下载量或阅读量达到一定数量的电子书,通过为该电子书购买的国际书号进行发行。
根据本发明一优选实施例,当电子书发生更新,则向下载该电子书的用户发送更新通知;如果用户选择下载更新,则向用户推送更新后的电子书。
一种获取搜索结果的装置,该装置包括:
输入单元,用于获取用户在搜索引擎输入的query;
生成单元,用于对所述query的搜索结果进行聚合生成与所述query相关联的电子书后,将生成的电子书提供给展现单元;
展现单元,用于向用户展现所述生成单元提供的电子书。
根据本发明一优选实施例,该装置还包括:判断单元,用于判断是否已经存在与所述query相关联的电子书,如果是,触发所述展现单元向用户展现与所述query相关联的电子书;否则,触发所述生成单元执行对所述query的搜索结果进行聚合生成与所述query相关联的电子书的操作。
根据本发明一优选实施例,所述生成单元在对所述query的搜索结果进行聚合生成与所述query相关联的电子书时,具体执行:
从所述query的搜索结果中挑选搜索结果;
对挑选的搜索结果进行去重和去除无关内容后,进行自动排版生成与所述query相关联的电子书。
根据本发明一优选实施例,所述生成单元在从所述query的搜索结果中挑选搜索结果时,按照各搜索结果与所述query之间的相似度,挑选相似度满足预设相似度要求的搜索结果;或者,
按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果;或者,
按照搜索引擎对搜索结果的排序结果,挑选排在前M个的搜索结果,M为预设的正整数。
根据本发明一优选实施例,所述生成单元在所述电子书中进一步聚合所述query的同义query或扩展query的搜索结果,并将所述同义query或扩展query与所述电子书相关联。
根据本发明一优选实施例,该装置还包括:版权方接口,用于接收版权方提供的内容;
所述生成单元,还用于在对所述版权方提供的内容进行审核后,将审核通过的内容添加至所述电子书;或者,对所述版权方提供的内容与所述query进行相似度计算后,将满足相似度要求的版权方提供的内容添加至所述电子书。
根据本发明一优选实施例,所述生成单元,还用于在生成电子书后,为电子书分配唯一的编号PKN;
如果电子书发生更新,则变更电子书的版本号,电子书的PKN保持不变。
根据本发明一优选实施例,所述展现单元在向用户展现与所述query相关联的电子书时,在搜索结果页面上向用户提供所述电子书的阅读或下载标识,其中所述阅读或下载标识为二维码或链接的形式。
根据本发明一优选实施例,该装置还包括:社区创建单元,用于对下载量或阅读量达到一定数量的电子书,形成一个小型社区供下载或阅读该电子书的用户之间进行交流。
根据本发明一优选实施例,所述生成单元,还用于在电子书发生更新时,通过所述展现单元向下载该电子书的用户发送更新通知;如果用户选择下载更新,则通过所述展现单元向用户推送更新后的电子书。
由以上技术方案可以看出,本发明通过将搜索结果的内容进行聚合后以电子书的形式提供给用户,方便用户随时随地通过电子书阅读之前搜索得到的搜索结果,实现了搜索结果的异步查看功能,满足用户的异步查看需求。
【附图说明】
图1为本发明实施例一提供的主要方法流程图;
图2为本发明实施例一提供的一个电子书展示实例图;
图3为本发明实施例二提供的装置结构图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
本发明提供了一种新模式的搜索结果获取方式,不再局限于在浏览器上实时获取搜索结果的方式,而是将搜索结果的内容进行聚合后以电子书的形式提供给用户,方便用户进行异步查看。下面通过实施例一对本发明提供的方法进行描述。
实施例一、
图1为本发明实施例一提供的主要方法流程图,如图1所示,该方法可以包括以下步骤:
步骤101:获取用户在搜索引擎输入的query。
步骤102:判断是否已经存在与该query相关联的电子书,如果是,执行步骤104;否则,执行步骤103。
步骤103:对该query的搜索结果进行聚合生成与该query相关联的电子书,执行步骤104。
在步骤中,具体挑选搜索结果中哪些搜索结果进行聚合生成与该query相关联的电子书,可以采用多种策略,包括但不限于以下策略中的至少一种:
策略1:按照各搜索结果与query之间的相似度,挑选相似度满足预设相似度要求的搜索结果,例如挑选相似度排在前M1个的搜索结果,M1为预设正整数,或者挑选相似度达到预设阈值的搜索结果。这里搜索结果与query之间相似度的计算方式可以采用现有搜索引擎对搜索结果与query之间相似度的计算方式。
策略2:按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果,例如设置一些网站具有较高的权威,诸如将一些包含论文的网站、一些著名的网站、与搜索引擎属于同一运营公司的网站等等。
策略3:依照搜索引擎的排序结果,挑选排在前M2个的搜索结果,M2为预设正整数。这种情况就是按照搜索引擎本身的排序结果进行聚合,例如将搜索结果中前20个搜索结果聚合成电子书。
在挑选完搜索结果后对这些搜索结果进行去重和去除无关内容,其中去重指的是将具有相同内容的搜索结果仅保留其中一个,其他去除;无关内容例如网页的导航条、网页底部的版权信息等。当然,也可以仅挑选网页中一些预设位置的内容,例如仅提取其中的标题和正文。上述网页中的内容可以从spider抓取到的网页所形成的快照中获得,也可以根据url实时获取。
另外,在电子书中可以保留具体搜索结果的url,当用户在后续下载电子书至移动终端并点击相应的url后,如果移动终端处于联网状态,则可以通过移动终端中的浏览器打开并浏览该url所对应的页面。或者,但给用户在PC上在线阅读电子书时,如果点击相应的url也可以通过PC中的浏览器打开并浏览该url所对应的页面。
总的来说,本发明实施例中上述用于聚合形成电子书的搜索结果可以包括url、摘要、标题、网页快照内容、由url实时获取到的网页内容中的一种或任意组合,甚至可以包括一些可编辑或可交互的模块,例如百度框计算中实现的搜索结果直接展现的、能与用户直接交互的应用,将这种应用或者应用的链接嵌入电子书,用户在后续在线阅读或者下载电子书后,能够通过点击电子书中的应用或应用的链接实现与对应应用的交互。
最后将这些搜索结果进行自动排版后生成与该query相关联的电子书。其中自动排版所使用的程序可以采用开源的xelatex排版程序,也可以使用诸如方正书版,aode的indesign排版程序等。排版后将排版信息进行保存,这里排版信息在xelatex排版程序中叫做逆向引用语法文件,这一排版信息可以用于重新找回排版源代码。
排版得到的电子书格式可以包括但不限于:PDF、epub或mobi格式等。其中PDF格式支持格式和版面重排,作为一种优选的格式。epub格式可以根据阅读器的分辨率大小自动重新排版,但失去了页码的概念,且各种载体上看到的结果不一致,会使得协同编辑变得复杂,作为一种次优的格式。当然还可以采用其他电子书格式,在此不再一一列举。
在排版时,可以采用多种方式区分不同的搜索结果,例如可以将各搜索结果分别作为独立的章节,或者将各搜索结果采用分隔符进行区分等等。
为了更加丰富电子书的内容,更方便用户获取想要的信息,通过上述方式形成的电子书还可以进行扩展,即还可以进一步聚合用户输入的query的同义query或扩展query的搜索结果,进行扩展后,将该电子书也与参与聚合的同义query或扩展query相关联。所谓同义query很好理解,就是搜索日志中与该query具有相同含义的query,例如用户输入query“拉格朗日”,除了将“拉格朗日”对应的搜索结果进行聚合生成电子书之外,“拉格朗日”对应的同义query“Lagrange”对应的搜索结果也可以参与该电子书的聚合。所谓扩展query就是用户在搜索引擎输入query后,向用户推荐的相关query,该扩展query通常在搜索引擎中会以下拉框的形式提示给用户,或者在相关搜索项中提示给用户,更简单地,还可以直接采用百科中的相关词条或推荐词条。例如用户输入query“拉格朗日”,除了将“拉格朗日”对应的搜索结果进行聚合生成电子书之外,“拉格朗日”对应的扩展query“拉格朗日函数”对应的搜索结果也参与该电子书的聚合。这样,该电子书生成后与其相关联的query就包括“拉格朗日”、“Lagrange”和“拉格朗日函数”。后续其他用户无论输入“拉格朗日”还是“Lagrange”或“拉格朗日函数”都能够命中该电子书。
除了上述扩展方式之外,还可以向诸如出版商或者作者等版权方提供接口,版权方能够通过该接口提供内容,经过相似度计算后,对满足相似度要求的内容添加至电子书;或者经过人为审核通过的内容添加至电子书。通过这种方式,版权方可以通过提供著作中优质章节的方式添加至电子书,用户查看该电子书时,如果对该优质章节感兴趣就会激发用户购买该著作的热情,为版权方带来益处和潜在收益。更进一步地,还可以将出版商或者作者的信息一并添加至电子书,例如可以将出版商或作者的联系方式以链接的形式在电子书中显示,当用户点击诸如出版商的客服电话或QQ等,可以触发移动终端向客服电话拨号,或者通过QQ客户端向客服QQ发起连接请求,以与出版商客服进行联系询问具体购买事宜。
在电子书生成后,会被保存在服务器中,并为各电子书分配唯一的编号(PKN),方便后期进行校对、更新、引用和参考。即便后续对电子书的内容进行更新,该PKN也不会发生变化,影响的仅是电子书的版本号。用户通过PKN可以找到对应的电子书,对电子书进行阅读、下载、评论、引用等。
步骤104:向用户展现与该query相关联的电子书。
上述展现的方式可以为:在搜索结果页面上向用户提供该电子书的阅读或下载标识,该阅读或下载标识可以以链接的形式,用户点击该链接后能够阅读或下载该电子书;优选地,该阅读或下载标识也可以是二维码等形式,用户用终端扫描该二维码后能够阅读或下载该电子书;当然也可以是其他形式,在此不再一一赘述。
在搜索结果页面上展现时,展现的位置可以多种多样,只要方便用户查看到该电子书即可,例如,将电子书的阅读或下载标识放置在搜索结果的首位,或者放置在搜索结果右侧突出位置,或者防止在搜索结果中间的突出位置,等等。举个例子,如图2所示,用户输入query“拉格朗日”后,得到的搜索结果的右侧显示与“拉格朗日”相关联的电子书,用户使用移动终端扫描二维码后,就能够在移动终端下载该电子书。
这样只要安装了电子书阅读器,用户就能够通过移动终端在任何时候打开下载的电子书进行查看。
对于热门的电子书,例如下载量或阅读量达到一定数量的电子书,可以自动形成一个诸如贴吧式的小型社区,供用户之间进行交流。
对于热门的电子书,例如下载量或阅读量达到一定数量的电子书,还可以为该电子书购买国际书号,进行出版发行。
由于互联网的信息瞬息万变,信息量往往成爆炸量的增长,因此可以周期性地对电子书进行更新,例如每隔一周就利用与电子书相关联的query的搜索结果对电子书进行更新,每次更新后可以更改电子书的版本号,但保持电子书的PKN不变。当电子书版本更新后,会向下载了该电子书的用户发送更新通知,供用户选择是否更新电子书的内容。如果用户选择下载更新,则向用户推送更新后的电子书。
还有一些情况,诸如版权方对其中部分信息进行了更改时,例如仅仅修改了错别字、或者添加了新页或删除了某页等,可以不进行版本号的更新,仅更新电子书中对应页的内容即可,这样更加节省用户的流量。
以上是对本发明所提供的方法进行的详细描述,下面通过实施例二对本发明提供的装置进行详细描述。
实施例二、
图3为本发明实施例二提供的装置结构图,如图3所示,该装置可以包括:输入单元301、生成单元303和展现单元304。
输入单元301用于获取用户在搜索引擎输入的query。
生成单元303用于对query的搜索结果进行聚合生成与query相关联的电子书后,将生成的电子书提供给展现单元304。
展现单元304用于向用户展现生成单元提供的电子书。
优选地,该装置还可以包括:判断单元302用于判断是否已经存在与query相关联的电子书,如果是,触发展现单元304直接向用户展现与所述query相关联的电子书;否则,触发生成单元303执行对该query的搜索结果进行聚合生成与该query相关联的电子书的操作。本发明实施例中由搜索结果聚合而生成的电子书存储在服务器中,且每个电子书都存在与其关联的query,通过查询其关联关系就能够确定是否存在与query相关联的电子书。
具体地,生成单元303在对query的搜索结果进行聚合生成与query相关联的电子书时,先从query的搜索结果中挑选搜索结果,然后对挑选的搜索结果进行去重和去除无关内容后,进行自动排版生成与query相关联的电子书。
其中在从query的搜索结果中挑选搜索结果时,可以采用但不限于以下策略中的至少一种:
策略1:按照各搜索结果与query之间的相似度,挑选相似度满足预设相似度要求的搜索结果,例如挑选相似度排在前M1个的搜索结果,M1为预设正整数,或者挑选相似度达到预设阈值的搜索结果。
策略2:按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果,例如设置一些网站具有较高的权威,诸如将一些包含论文的网站、一些著名的网站、与搜索引擎属于同一运营公司的网站等等。
策略3:依照搜索引擎的排序结果,挑选排在前M2个的搜索结果,M2为预设正整数。这种情况就是按照搜索引擎本身的排序结果进行聚合,例如将搜索结果中前20个搜索结果聚合成电子书。
在进行自动排版时所使用的程序可以采用开源的xelatex排版程序,也可以使用诸如方正书版,aode的indesign排版程序等。排版后将排版信息进行保存,这里排版信息在xelatex排版程序中叫做逆向引用语法文件,这一排版信息可以用于重新找回排版源代码。排版得到的电子书格式可以包括但不限于:PDF、epub或mobi格式等。
为了更加丰富电子书的内容,更方便用户获取想要的信息,通过上述方式形成的电子书还可以进行扩展,具体地,生成单元303在电子书中进一步聚合query的同义query或扩展query的搜索结果,并将同义query或扩展query与电子书相关联。
除了上述扩展方式之外,还可以向诸如出版商或者作者等版权方提供接口,即该装置还包括:版权方接口305,用于接收版权方提供的内容。这种情况下,生成单元303在对版权方提供的内容进行审核后,将审核通过的内容添加至电子书;或者,对版权方提供的内容与query进行相似度计算后,将满足相似度要求的版权方提供的内容添加至电子书。通过这种方式,版权方可以通过提供著作中优质章节的方式添加至电子书,用户查看该电子书时,如果对该优质章节感兴趣就会激发用户购买该著作的热情,为版权方带来益处和潜在收益。
另外,生成单元303在生成电子书后,可以为电子书分配唯一的编号PKN,如果电子书发生更新,则变更电子书的版本号,电子书的PKN保持不变。用户通过PKN可以找到对应的电子书,对电子书进行阅读、下载、评论、引用等。
具体地,展现单元304在向用户展现与query相关联的电子书时,可以在搜索结果页面上向用户提供电子书的阅读或下载标识,其中阅读或下载标识为二维码或链接的形式。在搜索结果页面上展现时,展现的位置可以多种多样,只要方便用户查看到该电子书即可,例如,将电子书的阅读或下载标识放置在搜索结果的首位,或者放置在搜索结果右侧突出位置,或者防止在搜索结果中间的突出位置,等等。
更进一步地,该装置还可以包括社区创建单元306,用于对下载量或阅读量达到一定数量的电子书,形成一个小型社区供下载或阅读该电子书的用户之间进行交流。另外,对于下载量或阅读量达到一定数量的电子书,还可以为该电子书购买国际书号,进行出版发行。
考了到电子书内容的更新问题,生成单元303还可以在电子书发生更新时,通过展现单元304向下载该电子书的用户发送更新通知;如果用户选择下载更新,则通过展现单元向用户推送更新后的电子书。
由以上技术方案可以看出,本发明提供的上述方法和装置具备以下优点:
1)本发明通过将搜索结果的内容进行聚合后以电子书的形式提供给用户,方便用户随时随地通过电子书阅读之前搜索得到的搜索结果,实现了搜索结果的异步查看功能,满足用户的异步查看需求。
2)搜索结果聚合成书后,能够提高用户的使用效率,经过demo的实测,快速翻页带来的使用效率提升高达3倍,经过专业排版软件处理后,页面可以美轮美奂,大大增加用户的阅读欲望。
3)互联网本身最大的问题就是越少大量的优质内容,这种将电子书的内容整合出版商、作者等版权方提供的内容,一方面实现了将耗费了大量精力的优质内容纳入互联网,另一方面也刺激了用户对实体著作的阅读和购买欲望,为版权方也带来了益处。
4)移动搜索和PC搜索在需求上和优缺点上存在很大不同,对于在PC上的搜索结果能够方便的移到移动终端,使得用户无论何时何地都能够进行阅读,且展现更加个性化,也节省用户流量。
5)基于上述技术方案可以进行一些信息推广,例如将电子书作为一种优质平台插入推广信息,这种推广信息的展现可以类似于杂志中的精美插图,自然与内容融合,比起搜索结果中插入的推广信息更容易让用户接受,不易引起用户反感,也为推广信息的展现形式提供巨大空间。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
Claims (20)
1.一种获取搜索结果的方法,其特征在于,该方法包括:
S1、获取用户在搜索引擎输入的query;
S2、对所述query的搜索结果进行聚合生成与所述query相关联的电子书后,向用户展现与所述query相关联的电子书。
2.根据权利要求1所述的方法,其特征在于,在所述步骤S2之前还包括:
判断是否已经存在与所述query相关联的电子书,如果是,直接向用户展现与所述query相关联的电子书;否则,继续执行所述步骤S2。
3.根据权利要求1所述的方法,其特征在于,对所述query的搜索结果进行聚合生成与所述query相关联的电子书具体包括:
从所述query的搜索结果中挑选搜索结果;
对挑选的搜索结果进行去重和去除无关内容后,进行自动排版生成与所述query相关联的电子书。
4.根据权利要求3所述的方法,其特征在于,从所述query的搜索结果中挑选搜索结果包括:
按照各搜索结果与所述query之间的相似度,挑选相似度满足预设相似度要求的搜索结果;或者,
按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果;或者,
按照搜索引擎对搜索结果的排序结果,挑选排在前M个的搜索结果,M为预设的正整数。
5.根据权利要求1至4任一权项所述的方法,其特征在于,该方法还包括:在所述电子书中进一步聚合所述query的同义query或扩展query的搜索结果,并将所述同义query或扩展query与所述电子书相关联。
6.根据权利要求1或2所述的方法,其特征在于,该方法还包括:
对版权方提供的内容进行审核后,将审核通过的内容添加至所述电子书;或者,
对版权方提供的内容与所述query进行相似度计算后,将满足相似度要求的版权方提供的内容添加至所述电子书。
7.根据权利要求1或2所述的方法,其特征在于,该方法还包括:在生成电子书后,为电子书分配唯一的编号PKN;
如果电子书发生更新,则变更电子书的版本号,电子书的PKN保持不变。
8.根据权利要求1或2所述的方法,其特征在于,向用户展现与所述query相关联的电子书具体包括:
在搜索结果页面上向用户提供所述电子书的阅读或下载标识,其中所述阅读或下载标识为二维码或链接的形式。
9.根据权利要求8所述的方法,其特征在于,对于下载量或阅读量达到一定数量的电子书,形成一个小型社区供下载或阅读该电子书的用户之间进行交流;或者,
对于下载量或阅读量达到一定数量的电子书,通过为该电子书购买的国际书号进行发行。
10.根据权利要求1或2所述的方法,其特征在于,当电子书发生更新,则向下载该电子书的用户发送更新通知;如果用户选择下载更新,则向用户推送更新后的电子书。
11.一种获取搜索结果的装置,其特征在于,该装置包括:
输入单元,用于获取用户在搜索引擎输入的query;
生成单元,用于对所述query的搜索结果进行聚合生成与所述query相关联的电子书后,将生成的电子书提供给展现单元;
展现单元,用于向用户展现所述生成单元提供的电子书。
12.根据权利要求11所述的装置,其特征在于,该装置还包括:判断单元,用于判断是否已经存在与所述query相关联的电子书,如果是,触发所述展现单元向用户展现与所述query相关联的电子书;否则,触发所述生成单元执行对所述query的搜索结果进行聚合生成与所述query相关联的电子书的操作。
13.根据权利要求11所述的装置,其特征在于,所述生成单元在对所述query的搜索结果进行聚合生成与所述query相关联的电子书时,具体执行:
从所述query的搜索结果中挑选搜索结果;
对挑选的搜索结果进行去重和去除无关内容后,进行自动排版生成与所述query相关联的电子书。
14.根据权利要求13所述的装置,其特征在于,所述生成单元在从所述query的搜索结果中挑选搜索结果时,按照各搜索结果与所述query之间的相似度,挑选相似度满足预设相似度要求的搜索结果;或者,
按照各搜索结果的来源权威状况,挑选来源权威状况满足预设要求的搜索结果;或者,
按照搜索引擎对搜索结果的排序结果,挑选排在前M个的搜索结果,M为预设的正整数。
15.根据权利要求11至14任一权项所述的装置,其特征在于,所述生成单元在所述电子书中进一步聚合所述query的同义query或扩展query的搜索结果,并将所述同义query或扩展query与所述电子书相关联。
16.根据权利要求11或12所述的装置,其特征在于,该装置还包括:版权方接口,用于接收版权方提供的内容;
所述生成单元,还用于在对所述版权方提供的内容进行审核后,将审核通过的内容添加至所述电子书;或者,对所述版权方提供的内容与所述query进行相似度计算后,将满足相似度要求的版权方提供的内容添加至所述电子书。
17.根据权利要求11或12所述的装置,其特征在于,所述生成单元,还用于在生成电子书后,为电子书分配唯一的编号PKN;
如果电子书发生更新,则变更电子书的版本号,电子书的PKN保持不变。
18.根据权利要求11或12所述的装置,其特征在于,所述展现单元在向用户展现与所述query相关联的电子书时,在搜索结果页面上向用户提供所述电子书的阅读或下载标识,其中所述阅读或下载标识为二维码或链接的形式。
19.根据权利要求18所述的装置,其特征在于,该装置还包括:社区创建单元,用于对下载量或阅读量达到一定数量的电子书,形成一个小型社区供下载或阅读该电子书的用户之间进行交流。
20.根据权利要求11或12所述的装置,其特征在于,所述生成单元,还用于在电子书发生更新时,通过所述展现单元向下载该电子书的用户发送更新通知;如果用户选择下载更新,则通过所述展现单元向用户推送更新后的电子书。
Priority Applications (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105375936A CN103020226A (zh) | 2012-12-12 | 2012-12-12 | 一种获取搜索结果的方法和装置 |
CN201310538387.1A CN103559268A (zh) | 2012-12-12 | 2013-11-04 | 电子书的提供方法、系统及云端服务器 |
KR1020147037024A KR101696174B1 (ko) | 2012-12-12 | 2013-12-06 | 전자책을 제공하기 위한 방법 및 클라우드 서버 |
PCT/CN2013/088803 WO2014090119A1 (zh) | 2012-12-12 | 2013-12-06 | 电子书的提供方法、系统及云端服务器 |
EP13863553.7A EP2881866A4 (en) | 2012-12-12 | 2013-12-06 | METHOD, SYSTEM AND CLOUD SERVER FOR CREATING AN ELECTRONIC BOOK |
US14/408,938 US9946793B2 (en) | 2012-12-12 | 2013-12-06 | Method for providing electronic book and cloud server |
JP2015518842A JP5937274B2 (ja) | 2012-12-12 | 2013-12-06 | 電子書籍の提供方法、システム及びクラウドサーバ |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2012105375936A CN103020226A (zh) | 2012-12-12 | 2012-12-12 | 一种获取搜索结果的方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103020226A true CN103020226A (zh) | 2013-04-03 |
Family
ID=47968830
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2012105375936A Pending CN103020226A (zh) | 2012-12-12 | 2012-12-12 | 一种获取搜索结果的方法和装置 |
CN201310538387.1A Pending CN103559268A (zh) | 2012-12-12 | 2013-11-04 | 电子书的提供方法、系统及云端服务器 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310538387.1A Pending CN103559268A (zh) | 2012-12-12 | 2013-11-04 | 电子书的提供方法、系统及云端服务器 |
Country Status (6)
Country | Link |
---|---|
US (1) | US9946793B2 (zh) |
EP (1) | EP2881866A4 (zh) |
JP (1) | JP5937274B2 (zh) |
KR (1) | KR101696174B1 (zh) |
CN (2) | CN103020226A (zh) |
WO (1) | WO2014090119A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103294834A (zh) * | 2013-06-28 | 2013-09-11 | 百度在线网络技术(北京)有限公司 | 通过二维码进行搜索的方法及搜索引擎 |
CN103383704A (zh) * | 2013-08-02 | 2013-11-06 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
CN103412906A (zh) * | 2013-08-01 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 信息传输方法和系统 |
CN103559268A (zh) * | 2012-12-12 | 2014-02-05 | 北京百度网讯科技有限公司 | 电子书的提供方法、系统及云端服务器 |
CN104156404A (zh) * | 2014-03-11 | 2014-11-19 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
CN104572230A (zh) * | 2015-02-13 | 2015-04-29 | 小米科技有限责任公司 | 脚本文件的加载方法、脚本文件生成方法及装置 |
CN105335522A (zh) * | 2015-11-27 | 2016-02-17 | 腾讯科技(深圳)有限公司 | 资源聚合方法和装置 |
CN106407311A (zh) * | 2016-08-30 | 2017-02-15 | 北京百度网讯科技有限公司 | 获取搜索结果的方法和装置 |
CN108846071A (zh) * | 2018-06-05 | 2018-11-20 | 上海木木机器人技术有限公司 | 一种应用于机场的机器人信息查询方法及机器人 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8688674B2 (en) * | 2008-02-14 | 2014-04-01 | Beats Music, Llc | Fast search in a music sharing environment |
CN104166641B (zh) * | 2014-08-06 | 2017-04-19 | 方卿 | 一种电子书生成方法及装置 |
CN104391886B (zh) * | 2014-11-07 | 2018-10-23 | 武汉大学 | 一种电子书发送方法及装置 |
CN104703039A (zh) * | 2015-03-13 | 2015-06-10 | 天脉聚源(北京)传媒科技有限公司 | 一种视频信息获取方法及装置 |
CN105224595B (zh) * | 2015-08-26 | 2019-07-02 | 北京京东尚科信息技术有限公司 | 一种客户端的电子书检索方法及装置 |
CN106056423B (zh) * | 2016-05-18 | 2020-02-07 | 北京京东尚科信息技术有限公司 | 一种用于存储数据的方法及系统 |
CN106909603A (zh) * | 2016-08-31 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 搜索信息处理方法及装置 |
US10325033B2 (en) | 2016-10-28 | 2019-06-18 | Searchmetrics Gmbh | Determination of content score |
US10467265B2 (en) * | 2017-05-22 | 2019-11-05 | Searchmetrics Gmbh | Method for extracting entries from a database |
CN107544734A (zh) * | 2017-08-30 | 2018-01-05 | 咪咕数字传媒有限公司 | 一种信息展示方法、装置和存储介质 |
CN110364027A (zh) * | 2019-06-27 | 2019-10-22 | 中国人民解放军92859部队 | 一种提供航海通告信息的方法及其系统 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6029182A (en) | 1996-10-04 | 2000-02-22 | Canon Information Systems, Inc. | System for generating a custom formatted hypertext document by using a personal profile to retrieve hierarchical documents |
JP2002108903A (ja) * | 2000-09-29 | 2002-04-12 | Toshiba Corp | データ収集システムおよびデータ収集方法およびプログラムを記録した媒体およびプログラム製品 |
JP4070643B2 (ja) * | 2002-03-29 | 2008-04-02 | 株式会社リコー | 表示用データ生成装置、表示用データ生成システム、データ管理装置、表示用データ生成方法、プログラム及び記録媒体 |
JP2003337825A (ja) * | 2002-05-22 | 2003-11-28 | Nec Corp | オンラインデータベースによる情報供給方法 |
AU2004207347A1 (en) * | 2003-01-21 | 2004-08-12 | E-Book Systems Pte Ltd. | A programmable virtual book system |
JP2007522545A (ja) * | 2004-01-20 | 2007-08-09 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 電子ブック自動作成装置及び方法 |
US20080140608A1 (en) * | 2004-09-13 | 2008-06-12 | Toyo Engineering Corporation | Information Managing Apparatus, Method, and Program |
US20070255702A1 (en) * | 2005-11-29 | 2007-11-01 | Orme Gregory M | Search Engine |
US7925645B2 (en) * | 2007-07-19 | 2011-04-12 | Microsoft Corporation | Dynamic metadata filtering for classifier prediction |
CN101334784B (zh) * | 2008-07-30 | 2011-06-15 | 施章祖 | 计算机辅助报告与知识库产生的方法 |
CN102687182A (zh) * | 2009-11-10 | 2012-09-19 | 杜尔塞塔有限公司 | 用于电子视觉作品的配音的动态音频重放 |
JP5533281B2 (ja) * | 2010-06-03 | 2014-06-25 | 大日本印刷株式会社 | 電子書籍提供システム、記録媒体、サーバ |
US20120109884A1 (en) * | 2010-10-27 | 2012-05-03 | Portool Ltd. | Enhancement of user created documents with search results |
US20130041879A1 (en) * | 2011-08-08 | 2013-02-14 | George Moser | Integral search engine |
US20130173408A1 (en) * | 2011-11-18 | 2013-07-04 | Joakim F. Lindblom | System and Method for Dynamic Cross Publishing of Content Across Multiple Sites |
KR20120119885A (ko) * | 2012-09-17 | 2012-10-31 | 삼성전자주식회사 | 사용자의 검색 히스토리를 이용한 컨텐츠 분류 방법 및 시스템 |
CN103020226A (zh) * | 2012-12-12 | 2013-04-03 | 北京百度网讯科技有限公司 | 一种获取搜索结果的方法和装置 |
CN103077238B (zh) * | 2013-01-09 | 2017-04-05 | 百度在线网络技术(北京)有限公司 | 电子文档的提供方法、系统、母书服务器及子书客户端 |
-
2012
- 2012-12-12 CN CN2012105375936A patent/CN103020226A/zh active Pending
-
2013
- 2013-11-04 CN CN201310538387.1A patent/CN103559268A/zh active Pending
- 2013-12-06 JP JP2015518842A patent/JP5937274B2/ja active Active
- 2013-12-06 EP EP13863553.7A patent/EP2881866A4/en not_active Ceased
- 2013-12-06 KR KR1020147037024A patent/KR101696174B1/ko active IP Right Grant
- 2013-12-06 WO PCT/CN2013/088803 patent/WO2014090119A1/zh active Application Filing
- 2013-12-06 US US14/408,938 patent/US9946793B2/en active Active
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9946793B2 (en) | 2012-12-12 | 2018-04-17 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method for providing electronic book and cloud server |
WO2014090119A1 (zh) * | 2012-12-12 | 2014-06-19 | 北京百度网讯科技有限公司 | 电子书的提供方法、系统及云端服务器 |
CN103559268A (zh) * | 2012-12-12 | 2014-02-05 | 北京百度网讯科技有限公司 | 电子书的提供方法、系统及云端服务器 |
CN103294834B (zh) * | 2013-06-28 | 2016-06-15 | 百度在线网络技术(北京)有限公司 | 通过二维码进行搜索的方法及搜索引擎 |
CN103294834A (zh) * | 2013-06-28 | 2013-09-11 | 百度在线网络技术(北京)有限公司 | 通过二维码进行搜索的方法及搜索引擎 |
CN103412906A (zh) * | 2013-08-01 | 2013-11-27 | 百度在线网络技术(北京)有限公司 | 信息传输方法和系统 |
CN103412906B (zh) * | 2013-08-01 | 2017-06-20 | 百度在线网络技术(北京)有限公司 | 信息传输方法和系统 |
CN103383704B (zh) * | 2013-08-02 | 2017-03-15 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
CN103383704A (zh) * | 2013-08-02 | 2013-11-06 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
CN104156404A (zh) * | 2014-03-11 | 2014-11-19 | 百度在线网络技术(北京)有限公司 | 搜索结果的提供方法和装置 |
CN104572230A (zh) * | 2015-02-13 | 2015-04-29 | 小米科技有限责任公司 | 脚本文件的加载方法、脚本文件生成方法及装置 |
CN105335522A (zh) * | 2015-11-27 | 2016-02-17 | 腾讯科技(深圳)有限公司 | 资源聚合方法和装置 |
CN105335522B (zh) * | 2015-11-27 | 2020-05-12 | 腾讯科技(深圳)有限公司 | 资源聚合方法和装置 |
CN106407311A (zh) * | 2016-08-30 | 2017-02-15 | 北京百度网讯科技有限公司 | 获取搜索结果的方法和装置 |
CN106407311B (zh) * | 2016-08-30 | 2020-07-24 | 北京百度网讯科技有限公司 | 获取搜索结果的方法和装置 |
CN108846071A (zh) * | 2018-06-05 | 2018-11-20 | 上海木木机器人技术有限公司 | 一种应用于机场的机器人信息查询方法及机器人 |
Also Published As
Publication number | Publication date |
---|---|
KR101696174B1 (ko) | 2017-01-13 |
EP2881866A4 (en) | 2016-03-30 |
KR20150095560A (ko) | 2015-08-21 |
US9946793B2 (en) | 2018-04-17 |
CN103559268A (zh) | 2014-02-05 |
US20150293999A1 (en) | 2015-10-15 |
JP5937274B2 (ja) | 2016-06-22 |
WO2014090119A1 (zh) | 2014-06-19 |
JP2015521776A (ja) | 2015-07-30 |
EP2881866A1 (en) | 2015-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103020226A (zh) | 一种获取搜索结果的方法和装置 | |
JP6814298B2 (ja) | 警告するための方法と装置 | |
CN101517967B (zh) | 网站的流量预测 | |
US20190012392A1 (en) | Method and device for pushing information | |
CN106649543B (zh) | 记录阅读进度的方法、装置及终端 | |
JP5916959B2 (ja) | 動的データ取得方法およびシステム | |
CN105247507A (zh) | 品牌的影响力得分 | |
CN105556512A (zh) | 用于分析关注实体特性的设备、系统以及方法 | |
KR20090092341A (ko) | 디지털 매체 개체들의 링크 개선 | |
WO2014107682A1 (en) | Method and apparatus for generating webpage content | |
US20140089080A1 (en) | Advertisement choosing device and advertisement choosing method | |
CN101416187A (zh) | 提供集中的搜索结果的方法和系统 | |
CN101971205A (zh) | 可移植程序模块的外部引用 | |
CN102591971A (zh) | 一种网页信息提取的方法和设备 | |
CN105183912A (zh) | 异常日志确定方法和装置 | |
US20180096067A1 (en) | Creation and optimization of resource contents | |
CN108074172B (zh) | 电商商品信息发布方法和系统 | |
CN113536098A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
EP2423837B1 (en) | Method and system for viewing web page and computer program product thereof | |
CN103150339A (zh) | 产品说明书的提供方法、系统及母书服务器 | |
CN103455938B (zh) | 一种数据处理方法、装置及服务器设备 | |
JP2013218482A (ja) | 電子書籍表示装置、蔵書情報表示プログラム及び蔵書情報表示方法 | |
CN105808636A (zh) | 一种基于app信息数据的超文本链接推送系统 | |
CN104484415A (zh) | 提供电子书的方法及装置 | |
EP4123545A1 (en) | Advertisement delivery method and advertisement delivery system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130403 |