CN106708885A - 一种实现搜索的方法和装置 - Google Patents

一种实现搜索的方法和装置 Download PDF

Info

Publication number
CN106708885A
CN106708885A CN201510789725.8A CN201510789725A CN106708885A CN 106708885 A CN106708885 A CN 106708885A CN 201510789725 A CN201510789725 A CN 201510789725A CN 106708885 A CN106708885 A CN 106708885A
Authority
CN
China
Prior art keywords
search
information
word
user
auxiliary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510789725.8A
Other languages
English (en)
Inventor
鞠训卓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510789725.8A priority Critical patent/CN106708885A/zh
Publication of CN106708885A publication Critical patent/CN106708885A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/04847Interaction techniques to control parameter settings, e.g. interaction with sliders or dials

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种实现搜索的方法和装置,其中实现搜索的方法包括:在阅读器界面下监听用户对阅读内容的搜索操作并获得搜索词,调用搜索插件以获取所述搜索词的搜索结果,将所述搜索结果显示在所述阅读器界面上。本发明通过在阅读器中调用搜索插件,利用搜索插件所提供的搜索功能直接获得阅读内容中的搜索词并执行搜索,从而避免了当用户在阅读器中产生搜索需求时,需要在阅读器以及搜索模块/应用间切换所带来的不便,使用户能够在当前的阅读中进行连续搜索,降低了搜索操作的复杂度,节省了搜索时间,同时提高了搜索的准确度。

Description

一种实现搜索的方法和装置
【技术领域】
本发明涉及移动设备应用领域,特别涉及一种实现搜索的方法和装置。
【背景技术】
随着移动设备性能越来越好及其携带便利、使用快捷的特点,越来越多的用户开始使用例如手机等移动设备来阅读书籍。在阅读的过程中,不同的用户会有不同的搜索需求。现有技术中植入了阅读器的应用通常为以下两种,一种为具备搜索能力的应用,另一种为不具备搜索能力的应用。
对于具备搜索能力的应用:常见的在该应用中实现搜索的方法如附图1所示,其具体流程包括:
101:将搜索菜单(搜索菜单也可以替换为直接显示的搜索框)和阅读器菜单分别置于应用的菜单栏内并同时显示给用户,用户在阅读器模式下阅读;
102:当用户在阅读过程中产生搜索需求时,首先记住搜索词并退出阅读器模式;
103:然后通过选择菜单栏提供的搜索菜单,切换到搜索模式并进行搜索词的输入,从而发起搜索;
104:搜索模式从搜索框内获取搜索词执行搜索并呈现搜索结果;
105:用户查看搜索结果后从搜索结果页退出;
106:用户重新返回阅读器模式,打开阅读的书籍继续阅读。
对于不具备搜索能力的应用,即阅读器应用和搜索应用属于两个不同的应用程序,则常见的在该应用中实现搜索的方法如附图2所示,其具体流程包括:
201:用户启动阅读器应用并阅读;
202:当用户在阅读过程中产生搜索需求时,首先记住搜索词,然后将阅读器应用进入后台;
203:启动新的搜索应用,在搜索框输入搜索词发起搜索;
204:搜索应用获取搜索词执行搜索并呈现搜索结果;
205:用户查看搜索结果,将搜索应用进入后台;
206:重新打开阅读器应用并继续阅读。
可见,在现有的两种发起搜索的方法中,阅读器本身并不具备搜索能力,当用户在阅读过程中产生搜索需求时,均需要记住搜索词并从当前的阅读器模式或者阅读器应用中退出,然后进入搜索模式或者搜索应用中进行进一步的搜索,即需要在阅读与搜索之间进行切换,其主要存在如下问题:(1)严重打断了阅读流程;(2)需要在阅读器和搜索两种模式或者应用下反复切换,导致操作路径较长;(3)对于一些生僻字或者较难输入的搜索词,进一步加大搜索时间。
【发明内容】
本发明基于现有技术中存在的在当前的阅读器模式或阅读器应用下无法进行直接搜索,需要用户记住搜索词并且在阅读和搜索间反复切换的技术问题,从而提供了一种实现搜索的方法和装置,以便于用户能够从阅读器界面下直接进行所阅读内容的搜索。
具体技术方案如下:
一种实现搜索的方法,所述方法包括:
在阅读器界面下监听用户对阅读内容的搜索操作并获得搜索词;
调用搜索插件以获取所述搜索词的搜索结果;
将所述搜索结果显示在所述阅读器界面上。
根据本发明一优选实施例,所述用户对阅读内容的搜索操作包括:用户在阅读器界面选中待搜索内容的操作,或者点击阅读器界面提供的搜索选项的操作。
根据本发明一优选实施例,所述获得搜索词包括:从用户选中的待搜索内容中识别关键词,将识别的关键词作为搜索词。
根据本发明一优选实施例,该方法还包括:获取搜索词的辅助搜索信息,所述辅助搜索信息用于确定所述搜索词的搜索类型。
根据本发明一优选实施例,所述调用搜索插件以获取所述搜索词的搜索结果包括:
调用所述搜索插件以向阅读服务器发送包含所述搜索词的搜索请求,并获取所述阅读服务器返回的阅读服务类搜索结果;或者,
调用所述搜索插件以向阅读服务器以外的其它信息搜索服务器发送包含所述搜索词的搜索请求,并获取所述其它信息搜索服务器返回的信息搜索结果。
根据本发明一优选实施例,所述获取辅助搜索信息包括:
获取阅读内容中包含所述搜索词的上下文内容,将所述上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息;或者,
为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息;或者,
基于用户的操作历史信息确定所述辅助搜索信息。
根据本发明一优选实施例,该方法还包括:
利用辅助搜索信息确定待搜索的服务器和/或搜索结果的权重。
根据本发明一优选实施例,在当前的阅读器界面上:
通过弹出新建窗口的方式,或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
根据本发明一优选实施例,该方法中,在阅读器界面上,通过用户点击返回按钮,或者点击所显示的搜索结果以外的区域的方式退出搜索结果的显示,以返回阅读器界面。
一种实现搜索的装置,所述装置包括:
监听模块,用于在阅读器界面下监听用户的操作;
调用模块,用于在所述监听模块监听到用户对阅读内容的搜索操作时,获得搜索词,并调用搜索插件以获取所述搜索词的搜索结果;
显示模块,用于将所述搜索结果显示在所述阅读器界面上。
根据本发明一优选实施例,当用户在阅读器界面选中待搜索内容,或者当用户点击阅读器界面提供的搜索选项时,所述监听模块监听到用户对阅读内容的搜索操作。
根据本发明一优选实施例,所述调用模块从用户选中的待搜索内容中识别关键词,将识别的关键词作为搜索词。
根据本发明一优选实施例,该装置还包括辅助搜索信息获取模块,所述辅助搜索信息获取模块用于获取搜索词的辅助搜索信息,所述辅助搜索信息用于确定所述搜索词的搜索类型。
根据本发明一优选实施例,所述调用模块调用搜索插件以获取所述搜索词的搜索结果具体包括:
调用所述搜索插件以向阅读服务器发送包含所述搜索词的搜索请求,并获取所述提供阅读服务的服务器返回的阅读服务类搜索结果;或者,
调用所述搜索插件以向阅读服务器以外的其它信息搜索服务器发送包含所述搜索词的搜索请求,并获取所述其它信息搜索服务器返回的信息搜索结果。
根据本发明一优选实施例,所述辅助搜索信息获取模块获取辅助搜索信息具体包括:
获取阅读内容中包含所述搜索词的上下文内容,将所述上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息;或者,
为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息;或者,
基于用户的操作历史信息确定所述辅助搜索信息。
根据本发明一优选实施例,该装置还包括辅助搜索信息利用模块,用于利用辅助搜索信息确定待搜索的服务器和/或搜索结果的权重。
根据本发明一优选实施例,所述显示模块用于在当前的阅读器界面上,通过弹出新建窗口的方式或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
根据本发明一优选实施例,所述显示模块还用于在所述监听模块监听到在阅读器界面上包含用户点击返回按钮,或者点击所显示的搜索结果以外的区域的操作时,退出搜索结果的显示,以返回阅读器界面。
由以上技术方案可以看出,本发明通过在阅读器中调用搜索插件,利用搜索插件所提供的搜索功能直接获得阅读内容中的搜索词并执行搜索,从而避免了当用户在阅读器中产生搜索需求时,需要在阅读器以及搜索模块/应用间切换所带来的不便,使用户能够在当前的阅读中进行连续搜索,降低了搜索操作的复杂度,节省了搜索时间,同时提高了搜索的准确度。
【附图说明】
图1:现有技术中常见的在具备搜索能力的应用中实现搜索的方法;
图2:现有技术中常见的在不具备搜索能力的应用中实现搜索的方法;
图3:本发明实施例一提供的一种实现搜索的方法的流程图;
图4:本发明实施例二提供的一种实现搜索的装置的结构示意图。
【具体实施方式】
为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
实施例一、
参照图3,示出了根据本发明实施例一的一种实现搜索的方法的流程图,具体流程为:
301:在阅读器界面下监听用户对阅读内容的搜索操作并获得搜索词。
当用户对阅读器中所阅读内容产生搜索需求时,可以在阅读器界面下直接选定阅读内容中的待搜索内容,其中用户的选定方式可以包括但不限于用户点击触摸屏上的搜索内容而进行选定、通过手势划定待搜索内容的范围、或者点击快捷键的方式进行选定。
接收到用户对阅读器内容的选定操作后,可以直接将选定待搜索内容的操作作为监听的搜索操作,或者可以在选定的内容旁边为用户弹出包含搜索选项的选择菜单项,可以将用户点击搜索选项的操作作为监听的搜索操作。
由于阅读器可以支持PDF或者TXT等多种文件格式,而例如PDF格式等部分文件不能直接进行文字获取,因此在监听到用户对阅读内容的搜索操作后,可以对用户所选中的待搜索内容通过屏幕取词等方式先进行文字识别,从而将识别的文字作为搜索词。用户所选中的待搜索内容可以是一个关键词,或者是一段语句,本发明的实施例中以待搜索内容为关键词为例进行进一步描述,然而待搜索内容为一段语句也包含在本发明所保护的范围内。
为了保证对搜索词进行搜索的准确性,在获得搜索词的过程中还可以获取搜索词的辅助搜索信息,该辅助搜索信息用于确定搜索词的搜索类型。
本发明获取辅助搜索信息的方式包括:
第一种方式:获取阅读内容中包含所述搜索词的上下文内容,将上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息。
具体地,由于包含搜索词的上下文内容中通常会出现体现该搜索词类型的信息,例如在用户选中关键词“伪装者”时,包含该“伪装者”的完整语段内容为“近日,由胡歌、靳东、王鸥、王凯主演的抗日谍战剧《伪装者》抢占荧屏,自开播以来,一直稳居收视榜首”,从该关键词的上下文可以得知,用户想要搜索的“伪装者”其搜索类型很有可能属于电视剧名称的《伪装者》,因此可以通过在获取搜索词的同时,获取包含该搜索词的上下文内容,将所述上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息。以获取的上述上下文内容为例,从该上下文内容中得到的搜索词的辅助搜索信息为进行“电视剧”类型的搜索。
本发明使用的分词方法可以包括以下几种并列的方式:
(1)基于字符串匹配的分词方法:是指按照一定的策略将待分析的汉字串与一个预置的机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
(2)基于特征扫描或标志切分的分词方法:是指优先在待分析字符串中识别和切分出一些带有明显特征的词,以这些词作为断点,可将原字符串分为较小的串再进行机械分词,从而减少匹配的错误率;或者将分词和词类标注结合起来,利用丰富的词类信息对分词决策提供帮助,并且在标注过程中又反过来对分词结果进行检验、调整,从而提高切分的准确率。
(3)基于理解的分词方法:是指通过让计算机模拟人对句子的理解,达到识别词的效果。其基本思想是,在分词的同时进行句法、语义分析,利用句法信息和语义信息来处理歧义现象。这种分词方法需要使用大量的语言知识和信息。
(4)基于统计的分词方法:中文信息中由于字与字相邻共现的频率或概率能够较好的反映出词的可信度,所以可以对语料中相邻共现的各个字的组合频度进行统计,计算它们的互现信息,以及计算两个汉字X、Y的相邻贡献概率。互现信息可以体现汉字之间结合关系的紧密程度,当紧密程度高于某一个阈值时,便可以认为此字组可能构成了一个词。这种方法对语料中的字组频度进行统计,不需要切分词典。
第二种方式:为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息。
当在阅读器界面下监听到用户对阅读内容的搜索操作并获得搜索词时,可以为用户提供预先设置的辅助搜索信息的选项,该预先设置的辅助搜索信息的选项可以具体包括在线翻译、名词解释、阅读服务以及网页搜索等多种类型,通过用户对所提供的选项的选择从而确定辅助搜索信息,例如当用户选择了在线翻译时,则根据该辅助搜索信息确定仅对搜索词进行在线翻译的搜索,从而提高了搜索的效率,增加了搜索的准确率。
其中,为用户提供的辅助搜索信息选项可以在所选定的搜索词旁边,以弹出窗口的滑动列表的方式实时显示,或者可以在新建视图上,在阅读器界面的固定位置预先显示该选项,在此不再一一列举。
第三种方式:基于使用阅读器的用户的操作历史信息确定所述辅助搜索信息。
为了给特定用户提供个性化的搜索服务,因此可以依据用户使用阅读器进行阅读时的操作历史信息来确定辅助搜索信息,该历史信息包括用户曾经使用阅读器进行搜索的历史搜索词、对搜索结果的查看率、用户的阅读习惯、阅读书籍的种类(例如武侠类、科技类、时装类等)等,基于上述历史信息来确定当前进行搜索的辅助搜索信息。
举个例子,如果一个用户使用阅读器阅读的书籍大多为计算机类的图书,则表明该用户对计算机类图书具有特别的偏好,相应的,将“计算机”确定为搜索词的辅助搜索信息,当用户在使用阅读器阅读并选择搜索关键词“鼠标”时,则基于上述用户偏好而搜索与计算机的“鼠标”相关的搜索结果,相反的,如果用户在阅读中其操作历史信息反映了对于翻译类型图书的偏好时,则将“翻译”确定为搜索词的辅助搜索信息,当用户选择同样的搜索词“鼠标”时,更容易引导搜索引擎搜索与“鼠标”的翻译内容相关的信息,前者的用户可能更想看到鼠标的操作说明这一搜索结果,而后者的用户可能更想看到“mouse”这一搜索结果。
本发明中,可以使用上述三种方式中的一种或多种方式的组合来获取辅助搜索信息,从而帮助有效的进行搜索词的搜索。
302:调用搜索插件以获取搜索词的搜索结果。
当监听到搜索操作时,阅读器中的插件管理器可以扫描在插件文件(plugin.ini)中指定的所有插件路径从而调用与搜索操作有关的搜索插件。
本发明的插件管理器不仅可以连接搜索插件,还可以连接包括书签/目录插件、阅读器内的离线书籍插件以及搜索插件等可扩展的多种插件实现,以通过不同的插件对阅读器功能进行扩展。
当调用搜索插件(plug-ins)时,搜索插件可以将获得的搜索词组装成搜索请求并发送给搜索引擎,以通过搜索引擎搜索与该搜索词相关的信息。
其中该搜索请求可以发送给提供阅读服务的服务器,该提供阅读服务的服务器是与阅读器相关的,用于维护阅读器中相关阅读书籍内容的服务器,并获取该提供阅读服务的服务器返回的阅读服务类搜索结果;
或者,该搜索请求可以发送给提供阅读服务以外的其它提供搜索服务的信息搜索服务器,该信息搜索服务器包括翻译服务器、词典服务器、同义词服务器等,并获取信息搜索服务器返回的信息搜索结果。其中在该搜索结果中可以包括一个或多个搜索结果项。
本实施例优选地,在搜索请求中还可以包括辅助搜索信息,利用辅助搜索信息确定待搜索的服务器和/或各搜索结果项的权重。
利用辅助搜索信息确定待搜索的服务器的方式可以为:用户在预先设置的辅助搜索信息选项中选定“阅读服务”的搜索类型,阅读器在获取该“阅读服务”的辅助搜索信息后,可以确定能够提供阅读服务的阅读服务器为待搜索的服务器,从而直接在阅读服务器中进行搜索,并提供获得搜索结果。通过辅助搜索信息,可以确定在提供特定服务的服务器中先进行搜索并提供搜索结果,由于不涉及其它的信息搜索服务器,从而提高了操作的简便性,减少了搜索引擎和带宽消耗,提高了搜索效率和准确性。
利用辅助搜索信息确定各搜索结果项的权重可以为:在用户选中搜索词“伪装者”时,通过包含该“伪装者”的完整语段的上下文“近日,由胡歌、靳东、王鸥、王凯主演的抗日谍战剧《伪装者》抢占荧屏,自开播以来,一直稳居收视榜首”,获得了与该搜索词相关的辅助搜索信息为“电视剧”的搜索类型,则在搜索结果项中的电视剧类型与该“伪装者”匹配时,可以提高该搜索结果项的权重,当从待搜索服务器中找到符合该搜索词的所有相关网页,按照权重排序,最后,将搜索结果的链接地址和页面内容摘要等内容组织起来,并返回相应的搜索结果。
进一步地,还可以结合多个辅助搜索信息来确定待搜索的服务器或者调整搜索结果的权重,根据辅助搜索信息的获取方式来确定多个辅助搜索信息的优先级,再根据具有不同优先级的辅助搜索信息来帮助进行搜索。
例如,将用户通过选择预先设置的辅助搜索信息的选项获得的辅助搜索信息的优先级设为最高,将通过用户的操作历史信息获得的辅助搜索信息的优先级设为第二,假设用户在预先设置的辅助搜索信息选项中已选定阅读服务的搜索类型,且从该用户的操作历史中获知其习惯进行翻译类的搜索,则同样以用户选中阅读内容“近日,由胡歌、靳东、王鸥、王凯主演的抗日谍战剧《伪装者》抢占荧屏,自开播以来,一直稳居收视榜首”中的搜索词“伪装者”为例,针对该搜索词获得的辅助搜索信息包括“阅读服务”、“翻译”、以及“电视剧”等多个,由于“阅读服务”的优先级最高,从而提高搜索结果中与“阅读服务”相关的搜索结果项的权重,将从提供阅读服务的服务器中所获得的名为《伪装者》的书籍作为首先需要显示的搜索结果提供给用户,次之为对于搜索词“伪装者”的英文翻译,从而为用户提供精确的搜索结果。
303:将搜索结果显示在阅读器界面上。
当获取搜索结果后,在当前的阅读器界面下,通过弹出新建窗口的方式,或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
在HTTP协议下,阅读器可以从搜索引擎所在的服务器接收到超文本标记语言HTML类型的文档。阅读器可以解析HTML文档,生成树状结构的对象,即文件对象模型DOM,每个对象是DOM上的一个节点,而这些对象可以代表文字、图片等网页资源。阅读器可以开始显示此HTML文档,并获取其中内嵌的网页资源的地址,然后浏览器再向服务器发起请求来获取这些网页资源,并在阅读器的新建HTML文档窗口中显示搜索结果。
当然,由于手机显示屏幕的局限性,用户可能不想看搜索网页的全部内容,而仅想浏览文字信息,因此可以对HTML文件进行解析以提取出摘要信息,并显示在阅读器界面新生成的视图中。
当用户查看完搜索结果后,可以在阅读器界面上提供返回按钮,通过用户点击返回按钮的方式以返回阅读器界面,或者还可以提供其他返回阅读器界面的方式,例如当用户点击所显示的搜索结果以外的区域时,则退出搜索结果的显示并返回阅读器界面。
实施例二、
参照图4,示出了根据本发明实施例二的一种实现搜索的装置的结构示意图。如图4所示,本发明的一种实现搜索的装置可以包括监听模块401,调用模块402,显示模块403,以及辅助搜索信息获取模块404。
其中,监听模块401可以用于在阅读器界面下监听用户操作。
具体地,当用户对阅读器中所阅读的内容产生搜索需求时,可以在阅读器界面下直接选定阅读内容中的待搜索内容,其中用户的选定方式可以包括但不限于用户点击触摸屏上的搜索内容而进行选定、通过手势划定待搜索内容的范围、或者点击快捷键的方式进行选定。
当接收到用户对阅读器内容的选定操作后,监听模块可以直接将选定待搜索内容的操作作为监听的搜索操作,或者可以在选定的内容旁边为用户弹出包含搜索选项的选择菜单项,监听模块将用户点击搜索选项的操作作为监听的搜索操作。
在通过监听模块监听到用户对阅读内容的搜索操作时,可以通过调用模块402获得搜索词,并调用搜索插件以获取所述搜索词的搜索结果。
具体地,由于阅读器可以支持PDF或者TXT等多种文件格式,而例如PDF格式等部分文件不能直接进行文字获取,因此在监听到用户对阅读内容的搜索操作时,调用模块可以对用户所选中的待搜索内容通过屏幕取词等方式先进行文字识别,从而将识别的文字作为搜索词。用户所选中的待搜索内容可以是一个关键词,或者是一段语句,本发明的实施例中以待搜索内容为关键词为例进行进一步描述,然而待搜索内容为一段语句也包含在本发明所保护的范围内。
为了保证对搜索词进行搜索的准确性,在获得搜索词的过程中,还可以通过辅助搜索信息获取模块404获取搜索词的辅助搜索信息,该辅助搜索信息用于确定搜索词的搜索类型。
其中辅助搜索信息获取模块可以通过以下方式获取辅助搜索信息:
第一种方式:获取阅读内容中包含所述搜索词的上下文内容,将上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息。
第二种方式:为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息。
其中,为用户提供的辅助搜索信息选项可以在所选定的搜索词旁边,以弹出窗口的滑动列表的方式实时显示,或者可以在新建视图上,在阅读器界面的固定位置预先显示该选项,在此不再一一列举。
第三种方式:基于使用阅读器的用户的操作历史信息确定所述辅助搜索信息。
为了给特定用户提供个性化的搜索服务,因此可以依据用户使用阅读器进行阅读时的操作历史信息来确定辅助搜索信息,该历史信息包括用户曾经使用阅读器进行搜索的历史搜索词、对搜索结果的查看率、用户的阅读习惯、阅读书籍的种类(例如武侠类、科技类、时装类等)等,基于上述历史信息来确定当前进行搜索的辅助搜索信息。
本发明中,可以使用上述三种方式中的一种或多种方式的组合来获取辅助搜索信息,从而帮助有效的进行搜索词的搜索。
当监听模块监听到搜索操作时,阅读器中的插件管理器可以扫描在插件文件(plugin.ini)中指定的所有插件路径从而调用与搜索操作有关的搜索插件。
本发明的插件管理器不仅可以连接搜索插件,还可以连接包括书签/目录插件、阅读器内的离线书籍插件以及搜索插件等可扩展的多种插件实现,以通过不同的插件对阅读器功能进行扩展。
当调用搜索插件(plug-ins)时,搜索插件可以将获得的搜索词组装成搜索请求并发送给搜索引擎,以通过搜索引擎搜索与该搜索词相关的信息。
其中该搜索请求可以发送给提供阅读服务的服务器,该提供阅读服务的服务器是与阅读器相关的,用于维护阅读器中相关阅读书籍内容的服务器,并获取该提供阅读服务的服务器返回的阅读服务类搜索结果;
或者,该搜索请求可以发送给提供阅读服务以外的其它提供搜索服务的服务器,该提供搜索服务的服务器包括翻译服务器、词典服务器、同义词服务器等其他信息搜索服务器,并获取其它信息搜索服务器返回的信息搜索结果。其中在该搜索结果中可以包括一个或多个搜索结果项。
本实施例优选地,还可以包括辅助搜索信息利用模块405,当在搜索请求中包括辅助搜索信息时,辅助搜索信息利用模块利用辅助搜索信息确定待搜索的服务器或者各搜索结果项的权重。
辅助搜索信息利用模块利用辅助搜索信息确定待搜索的服务器的方式可以为:用户在预先设置的辅助搜索信息选项中选定“阅读服务”的搜索类型,在获取该“阅读服务”的辅助搜索信息后,可以确定能够提供阅读服务的阅读服务器为待搜索的服务器,从而直接在阅读服务器中进行搜索,并提供获得搜索结果。通过辅助搜索信息,可以确定在提供特定服务的服务器中进行搜索,而不涉及其它的信息搜索服务器,从而提高了操作的简便性,减少了搜索引擎和带宽消耗,提高了搜索效率和准确性。
利用辅助搜索信息确定各搜索结果项的权重可以为:在用户选中搜索词“伪装者”时,通过包含该“伪装者”的完整语段的上下文“近日,由胡歌、靳东、王鸥、王凯主演的抗日谍战剧《伪装者》抢占荧屏,自开播以来,一直稳居收视榜首”,获得了与该搜索词相关的辅助搜索信息为“电视剧”的搜索类型,则在搜索结果项中的电视剧类型与该“伪装者”匹配时,可以提高该搜索结果项的权重,当从待搜索服务器中找到符合该搜索词的所有相关网页,按照权重排序,最后,将搜索结果的链接地址和页面内容摘要等内容组织起来,并返回相应的搜索结果。
进一步地,辅助搜索信息利用模块还可以结合多个辅助搜索信息来确定待搜索的服务器或者调整搜索结果的权重,根据辅助搜索信息的获取方式来确定多个辅助搜索信息的优先级,再根据具有不同优先级的辅助搜索信息来帮助进行搜索。
在通过调用模块402调用搜索插件以获取所述搜索词的搜索结果后,通过显示模块403将搜索结果显示在阅读器界面上。
具体地,当获取搜索结果后,在当前的阅读器界面下,通过弹出新建窗口的方式,或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
在HTTP协议下,阅读器可以从搜索引擎所在的服务器接收到超文本标记语言HTML类型的文档。阅读器可以解析HTML文档,生成树状结构的对象,即文件对象模型DOM,每个对象是DOM上的一个节点,而这些对象可以代表文字、图片等网页资源。阅读器可以开始显示此HTML文档,并获取其中内嵌的网页资源的地址,然后浏览器再向服务器发起请求来获取这些网页资源,并在阅读器的新建HTML文档窗口中显示搜索结果。
当然,由于手机显示屏幕的局限性,用户可能不想看搜索网页的全部内容,而仅想浏览文字信息,因此可以对HTML文件进行解析以提取出摘要信息,并显示在阅读器界面新生成的视图中。
当用户查看完搜索结果后,可以在阅读器界面上提供返回按钮,通过用户点击返回按钮的方式以返回阅读器界面,或者还可以提供其他返回阅读器界面的方式,例如当用户点击所显示的搜索结果以外的区域时,则退出搜索结果的显示并返回阅读器界面。
基于本发明实施例所提供的实现搜索的方法和装置,可以通过调用搜索插件而在阅读器界面上直接进行搜索,该搜索与阅读器之间不需要进行切换,同时,由于在实现搜索的过程中使用了辅助搜索信息来帮助进行服务器的选择和搜索结果的排序,可以在阅读器中更加有针对性的为相应阅读器的用户服务,因此在提高了阅读器的扩展能力的同时,提高了搜索效率和准确度。
在本发明所提供的几个实施例中,应该理解到,所揭露的方法和装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (18)

1.一种实现搜索的方法,其特征在于,所述方法包括:
在阅读器界面下监听用户对阅读内容的搜索操作并获得搜索词;
调用搜索插件以获取所述搜索词的搜索结果;
将所述搜索结果显示在所述阅读器界面上。
2.根据权利要求1所述的方法,其特征在于,所述用户对阅读内容的搜索操作包括:用户在阅读器界面选中待搜索内容的操作,或者点击阅读器界面提供的搜索选项的操作。
3.根据权利要求1所述的方法,其特征在于,所述获得搜索词包括:从用户选中的待搜索内容中识别关键词,将识别的关键词作为搜索词。
4.根据权利要求3所述的方法,其特征在于,该方法还包括:获取搜索词的辅助搜索信息,所述辅助搜索信息用于确定所述搜索词的搜索类型。
5.根据权利要求1所述的方法,其特征在于,所述调用搜索插件以获取所述搜索词的搜索结果包括:
调用所述搜索插件以向阅读服务器发送包含所述搜索词的搜索请求,并获取所述阅读服务器返回的阅读服务类搜索结果;或者,
调用所述搜索插件以向阅读服务器以外的其它信息搜索服务器发送包含所述搜索词的搜索请求,并获取所述其它信息搜索服务器返回的信息搜索结果。
6.根据权利要求4所述的方法,其特征在于,所述获取辅助搜索信息包括:
获取阅读内容中包含所述搜索词的上下文内容,将所述上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息;或者,
为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息;或者,
基于用户的操作历史信息确定所述辅助搜索信息。
7.根据权利要求4或6所述的方法,其特征在于,该方法还包括:
利用辅助搜索信息确定待搜索的服务器和/或搜索结果的权重。
8.根据权利要求1所述的方法,其特征在于,在当前的阅读器界面上:
通过弹出新建窗口的方式,或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
9.根据权利要求1所述的方法,其特征在于,在阅读器界面上,通过用户点击返回按钮,或者点击所显示的搜索结果以外的区域的方式退出搜索结果的显示,以返回阅读器界面。
10.一种实现搜索的装置,其特征在于,所述装置包括:
监听模块,用于在阅读器界面下监听用户的操作;
调用模块,用于在所述监听模块监听到用户对阅读内容的搜索操作时,获得搜索词,并调用搜索插件以获取所述搜索词的搜索结果;
显示模块,用于将所述搜索结果显示在所述阅读器界面上。
11.根据权利要求10所述的装置,其特征在于,当用户在阅读器界面选中待搜索内容,或者当用户点击阅读器界面提供的搜索选项时,所述监听模块监听到用户对阅读内容的搜索操作。
12.根据权利要求10所述的装置,其特征在于,所述调用模块从用户选中的待搜索内容中识别关键词,将识别的关键词作为搜索词。
13.根据权利要求12所述的装置,其特征在于,该装置还包括辅助搜索信息获取模块,所述辅助搜索信息获取模块用于获取搜索词的辅助搜索信息,所述辅助搜索信息用于确定所述搜索词的搜索类型。
14.根据权利要求10所述的装置,其特征在于,所述调用模块调用搜索插件以获取所述搜索词的搜索结果具体包括:
调用所述搜索插件以向阅读服务器发送包含所述搜索词的搜索请求,并获取所述提供阅读服务的服务器返回的阅读服务类搜索结果;或者,
调用所述搜索插件以向阅读服务器以外的其它信息搜索服务器发送包含所述搜索词的搜索请求,并获取所述其它信息搜索服务器返回的信息搜索结果。
15.根据权利要求13所述的装置,其特征在于,所述辅助搜索信息获取模块获取辅助搜索信息具体包括:
获取阅读内容中包含所述搜索词的上下文内容,将所述上下文内容进行分词处理,根据分词处理的结果得到所述辅助搜索信息;或者,
为用户提供辅助搜索信息的选项,根据用户的选择来获取所述辅助搜索信息;或者,
基于用户的操作历史信息确定所述辅助搜索信息。
16.根据权利要求13或15所述的装置,其特征在于,该装置还包括辅助搜索信息利用模块,用于利用辅助搜索信息确定待搜索的服务器和/或搜索结果的权重。
17.根据权利要求10所述的装置,其特征在于,所述显示模块用于在当前的阅读器界面上,通过弹出新建窗口的方式或者通过在阅读器界面上生成新的视图的方式来显示搜索结果。
18.根据权利要求10所述的装置,其特征在于,所述显示模块还用于在所述监听模块监听到在阅读器界面上包含用户点击返回按钮,或者点击所显示的搜索结果以外的区域的操作时,退出搜索结果的显示,以返回阅读器界面。
CN201510789725.8A 2015-11-17 2015-11-17 一种实现搜索的方法和装置 Pending CN106708885A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510789725.8A CN106708885A (zh) 2015-11-17 2015-11-17 一种实现搜索的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510789725.8A CN106708885A (zh) 2015-11-17 2015-11-17 一种实现搜索的方法和装置

Publications (1)

Publication Number Publication Date
CN106708885A true CN106708885A (zh) 2017-05-24

Family

ID=58933242

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510789725.8A Pending CN106708885A (zh) 2015-11-17 2015-11-17 一种实现搜索的方法和装置

Country Status (1)

Country Link
CN (1) CN106708885A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463704A (zh) * 2017-08-16 2017-12-12 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN107807784A (zh) * 2017-10-30 2018-03-16 四川长虹电器股份有限公司 基于内嵌文本阅读器的显示方法
CN108268585A (zh) * 2017-08-29 2018-07-10 广州市动景计算机科技有限公司 新闻内容关联检索方法、装置及终端
CN108363795A (zh) * 2017-12-14 2018-08-03 凉山彝族自治州科学技术情报研究所 一种计算机信息检索方法及系统
CN110019682A (zh) * 2017-12-28 2019-07-16 北京京东尚科信息技术有限公司 用于处理信息的系统、方法和装置
CN110390051A (zh) * 2019-07-19 2019-10-29 北京字节跳动网络技术有限公司 一种搜索实现方法、装置、电子设备及存储介质
CN110489032A (zh) * 2019-08-14 2019-11-22 掌阅科技股份有限公司 用于电子书的词典查询方法及电子设备
WO2023051076A1 (zh) * 2021-09-29 2023-04-06 北京字跳网络技术有限公司 一种搜索结果展现方法、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN102314456A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 网页划词搜索方法及系统
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN102929925A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的搜索方法及装置
CN103631887A (zh) * 2013-11-15 2014-03-12 北京奇虎科技有限公司 浏览器侧进行网络搜索的方法与浏览器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1797301A (zh) * 2004-12-30 2006-07-05 陈沛 数字化信息搜索方法及其系统
CN102314456A (zh) * 2010-06-30 2012-01-11 百度在线网络技术(北京)有限公司 网页划词搜索方法及系统
CN102929924A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的取词搜索结果生成方法及装置
CN102929925A (zh) * 2012-09-20 2013-02-13 百度在线网络技术(北京)有限公司 一种基于浏览内容的搜索方法及装置
CN103631887A (zh) * 2013-11-15 2014-03-12 北京奇虎科技有限公司 浏览器侧进行网络搜索的方法与浏览器

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107463704A (zh) * 2017-08-16 2017-12-12 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN108268585A (zh) * 2017-08-29 2018-07-10 广州市动景计算机科技有限公司 新闻内容关联检索方法、装置及终端
CN107807784A (zh) * 2017-10-30 2018-03-16 四川长虹电器股份有限公司 基于内嵌文本阅读器的显示方法
CN108363795A (zh) * 2017-12-14 2018-08-03 凉山彝族自治州科学技术情报研究所 一种计算机信息检索方法及系统
CN110019682A (zh) * 2017-12-28 2019-07-16 北京京东尚科信息技术有限公司 用于处理信息的系统、方法和装置
CN110390051A (zh) * 2019-07-19 2019-10-29 北京字节跳动网络技术有限公司 一种搜索实现方法、装置、电子设备及存储介质
CN110390051B (zh) * 2019-07-19 2021-12-28 北京字节跳动网络技术有限公司 一种搜索实现方法、装置、电子设备及存储介质
CN110489032A (zh) * 2019-08-14 2019-11-22 掌阅科技股份有限公司 用于电子书的词典查询方法及电子设备
WO2023051076A1 (zh) * 2021-09-29 2023-04-06 北京字跳网络技术有限公司 一种搜索结果展现方法、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN106708885A (zh) 一种实现搜索的方法和装置
US8874542B2 (en) Displaying browse sequence with search results
US7617202B2 (en) Systems and methods that employ a distributional analysis on a query log to improve search results
US8335787B2 (en) Topic word generation method and system
WO2015167855A1 (en) Providing search results corresponding to displayed content
CN110297880B (zh) 语料产品的推荐方法、装置、设备及存储介质
KR20110039233A (ko) 입력 문자 시퀀스로부터의 리소스 로케이터 제안들
US20110316796A1 (en) Information Search Apparatus and Information Search Method
CN107992523B (zh) 移动应用的功能选项查找方法及终端设备
JP2002197104A (ja) 情報検索処理装置,情報検索処理方法および情報検索処理プログラムを記録した記録媒体
CN107622044A (zh) 字符串的分词方法、装置及设备
CN109634436A (zh) 输入法的联想方法、装置、设备及可读存储介质
CN107656997A (zh) 自然语言处理方法、装置、存储介质及终端设备
US20150161279A1 (en) Displaying Local Site Name Information with Search Results
US10303747B2 (en) Method, apparatus and system for controlling address input
CN106919593B (zh) 一种搜索的方法和装置
CN104778232B (zh) 一种基于长查询的搜索结果的优化方法和装置
CN112861510A (zh) 纪要处理方法、装置、设备和存储介质
US9336317B2 (en) System and method for searching aliases associated with an entity
US20190303364A1 (en) Searching method and apparatus, device and non-volatile computer storage medium
JP2005202924A (ja) 対訳判断装置、方法及びプログラム
JP4484957B1 (ja) 検索式生成装置、検索式生成方法、およびプログラム
CN104268195A (zh) 终端中的本地资源的处理方法和装置
CN111444707B (zh) 一种标题生成方法、设备及计算机可读存储介质
CN104778156B (zh) 文本输入方法、文本输入装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170524

RJ01 Rejection of invention patent application after publication