CN109299244A - 一种在线文档检索方法、装置、存储介质及电子设备 - Google Patents

一种在线文档检索方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN109299244A
CN109299244A CN201811357676.0A CN201811357676A CN109299244A CN 109299244 A CN109299244 A CN 109299244A CN 201811357676 A CN201811357676 A CN 201811357676A CN 109299244 A CN109299244 A CN 109299244A
Authority
CN
China
Prior art keywords
online document
content
search
hyperlink
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811357676.0A
Other languages
English (en)
Inventor
彭龙腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin ByteDance Technology Co Ltd
Original Assignee
Tianjin ByteDance Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin ByteDance Technology Co Ltd filed Critical Tianjin ByteDance Technology Co Ltd
Priority to CN201811357676.0A priority Critical patent/CN109299244A/zh
Publication of CN109299244A publication Critical patent/CN109299244A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种在线文档检索方法、装置、存储介质及电子设备。该在线文档检索方法包括:接收检索关键字;根据检索关键字,在搜索系统中确定与检索关键字对应的链接内容以及链接内容对应的链接;根据链接确定检索关键字对应的在线文档;显示包含在线文档的检索结果。通过实施本公开,在编辑过程汇中将超链接对应的内容加入到在线文档中,成为在线文档的一部分;进而在后续检索过程中,实现对在线文档内容以及超链接内容的检索,提高检索效率和用户体验。

Description

一种在线文档检索方法、装置、存储介质及电子设备
技术领域
本公开涉及在线文档编辑领域,更具体地说,涉及一种在线文档检索方法、装置、存储介质及电子设备。
背景技术
用户使用在线文档编辑,将自己的信息以及知识点记录到文案中,避免信息的遗忘以及方便后期信息的获取。用户输入的文档中可能包含超链接,超链接里面有用户需要的具体信息。随着文档数目的增多,后期用户再次想要找到相关信息的时候,会使用现有工具提供的检索模块,通过匹配用户输入的关键词,在用户的文档中与之匹配的内容,然后将相关文档推荐给用户,方便用户去定位到包含关键词的文档,找到想要的文档。
现有技术中,在线文档检索都是基于文档中已有的内容,对于文档中包含的超链接所附带的信息不具备检索能力,凭记忆去点击超链接去访问内容来验证,影响用户体验,耗费用户的时间。
发明内容
本公开要解决的技术问题在于,针对现有技术的上述在线文档检索时不能检索超链接所附带信息的缺陷,提供一种在线文档检索方法、装置、存储介质及电子设备。
本公开的一个实施例解决其技术问题所采用的技术方案是:构造一种在线文档检索方法,包括:
接收检索关键字;
根据所述检索关键字,在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接;
根据所述链接确定所述检索关键字对应的在线文档;
显示包含所述在线文档的检索结果。
进一步,本公开实施例所述的在线文档检索方法,在所述接收检索关键字之前还包括在线文档编辑过程:
对在线文档进行编辑;
若编辑内容中包含超链接,则自动获取所述超链接对应的链接内容;
将所述链接内容进行存储。
进一步,本公开实施例所述的在线文档检索方法,所述将所述链接内容进行存储包括:
将所述链接内容与在线文档的文档ID进行关联,并将关联后的所述链接内容和文档ID进行存储。
进一步,本公开实施例所述的在线文档检索方法,所述将所述链接内容与在线文档的文档ID进行关联包括:
将所述链接内容与在线文档ID及用户ID进行关联;
所述将关联后的所述链接内容和文档ID进行存储包括:将关联后的所述链接内容和文档ID及用户ID进行存储。
进一步,本公开实施例所述的在线文档检索方法,所述自动获取所述超链接对应的链接内容包括:
抓取所述超链接对应的标题标签中的内容;
抓取所述超链接对应的内容标签下的目录的内容;
抓取所述超链接对应的描述标签里的内容。
进一步,本公开实施例所述的在线文档检索方法,若所述标题标签中无内容,则填写所述超链接的链接地址;
若所述标题标签中的内容大于第一预设字节长度,则仅截取所述标题标签中第一预设字节长度的内容;
若所述内容标签中无内容,则不存储;
若所述内容标签中的内容大于第二预设字节长度,则仅截取所述内容标签中第二预设字节长度的内容。
进一步,本公开实施例所述的在线文档检索方法,所述将所述链接内容进行存储包括:将所述在线文档内容和链接内容存储到所述搜索系统中;
所述在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接包括:
使用Elasticsearch搜索引擎在所述搜索系统中检索与所述检索关键字对应的链接内容以及所述链接内容对应的链接。
另,本公开另一实施例还提供一种在线文档检索装置,包括:
接收单元,用于接收检索关键字;
关键字检索单元,用于根据所述检索关键字,在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接;
文档检索单元,用于根据所述链接确定所述检索关键字对应的在线文档;
显示单元,用于显示包含所述在线文档的检索结果。
另,本公开另一实施例还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的在线文档检索方法。
另,本公开另一实施例还提供一种电子设备,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序实现如上述的在线文档检索方法。
本公开实施例提供的一种在线文档检索方法、装置、存储介质及电子设备,具有以下有益效果:该在线文档检索方法包括:接收检索关键字;根据检索关键字,在搜索系统中确定与检索关键字对应的链接内容以及链接内容对应的链接;根据链接确定检索关键字对应的在线文档;显示包含在线文档的检索结果。通过实施本公开,在编辑过程汇中将超链接对应的内容加入到在线文档中,成为在线文档的一部分;进而在后续检索过程中,实现对在线文档内容以及超链接内容的检索,提高检索效率和用户体验。
附图说明
下面将结合附图及实施例对本公开作进一步说明,附图中:
图1是本公开一实施例提供的在线文档检索方法的流程图;
图2是本公开一实施例提供的在线文档检索装置的结构示意图;
图3是本公开一实施例提供的电子设备的结构示意图。
具体实施方式
为了对本公开的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本公开的具体实施方式。
参考图1,本公开实施例提供一种在线文档检索方法,应用于在线文档中,在线文档包含至少一个超链接。本实施例的编辑对象是在线文档,在线文档指的是存储在服务器上或云端、且运行在浏览器或特定应用程序上的文档,该文档需通过联网才能实现访问和在线编辑。该方法包括:
S101、接收检索关键字。
具体的,用户通过鼠标、键盘、触摸屏、摄像头、麦克风等输入设备输入检索关键字,系统接收该搜索关键字。需要说明的是,在接收检索关键字之前,需要选定检索范围。本实施例中的检索对象为在线文档,在线文档既可以是一个,也可以是多个。若在线文档有一个,在该在线文档即为检索范围。若在线文档有多个,需选定要检索的对象,作为搜索范围;或者通过文件夹或存储位置划定搜索范围。进一步,在线文档既可以处于打开状态,也可以是未打开状态。若在检索过程中在线文档未打开,则从后台自动打开在线文档并进行检索。优选地,在后台打开的在线文档在前端是不显示的,用户不能看到被打开的在线文档。
S102、根据检索关键字,在搜索系统中确定与检索关键字对应的链接内容以及链接内容对应的链接。
具体的,对在线文档进行检索过程中,可先检索在线文档内容,然后检索超链接内容;或者先检索超链接内容,再检索在线文档内容。此处对超链接的连接内容已经提前存储到在线文档中,所以在搜索时并不需要再次访问超链接,不需要用户打开超链接,大大提高了搜索效率。
本实施例在搜索前对在线文档进行了预处理,将在线文档中的超链接对应的内容存储到在线文档中,并建立超链接内容与超链接的对应关系。在根据搜索关键字进行搜索时,若搜索关键字在超链接内容中,则可通过超链接内容确定对应的超链接。
作为选择,可使用Elasticsearch搜索引擎在搜索系统中检索与检索关键字对应的链接内容以及链接内容对应的链接。使用Elasticsearch搜索引擎的具体搜索步骤可参考现有技术,本实施例在此不再赘述。
S103、根据链接确定检索关键字对应的在线文档。
具体的,本实施例在搜索前对在线文档进行了预处理,将在线文档中的超链接对应的内容存储到在线文档中,并建立超链接内容与超链接的对应关系,以及超链接与所属在线文档的对应关系。若搜索关键字在超链接内容中,则可通过超链接内容确定对应的超链接,进而通过超链接确定对应的在线文档。
S104、显示包含在线文档的检索结果。
具体的,通过检索关键字搜索,得到与该检索关键字对应的检索结果,本实施例中显示包含在线文档的检索结果包括:
检索对象为多个未打开的在线文档,则显示包含检索关键字的在线文档,例如在20篇在线文档中检索到2篇包含检索关键字的在线文档,则显示这两篇在线文档,可以以打开形式显示,也可只显示在线文档文件。
一些实施例中,显示包含检索关键字的在线文档的存储位置信息,即搜索结果为在线文档的存储位置信息,用户根据该存储位置信息即可找到所需在线文档。
一些实施例中,若在线文档处于打开状态,在在线文档中突出显示检索关键字的位置,例如通过增加背景颜色、高亮方式突出显示检索关键字的位置。
作为选择,显示包含在线文档的检索结果包括:通过浮动窗口显示检索结果。
作为选择,显示包含在线文档的检索结果包括:若检索关键字位于链接内容中,则根据链接内容对应的超链接打开对应网页;并显示检索关键字在网页中的位置,方便用户直接查看所需内容的原始出处。
本实施例在检索过程中,实现对在线文档内容以及超链接内容的检索,即使检索关键字在超链接过程中也可检索到,提高检索效率和用户体验。
在上述实施例实施前,需要对在线文档进行预处理,将在线文档中的超链接对应的内容存储到在线文档中,具体预处理过程包括下述步骤:
S201、对在线文档进行编辑。
具体的,用户通过鼠标、键盘、触摸屏、摄像头、麦克风等输入设备输入编辑信息,或通过粘贴动作粘贴内容作为编辑信息,该编辑信息用于对在线文档进行编辑。在输入编辑信息后,系统自动识别编辑信息中是否包含超链接,具体判断过程为:预存网络连接的标准格式信息,可能有多种,通过标准格式信息查找编辑信息中是否有匹配的字段。若有匹配字段,则说明编辑信息中包含超链接,并找出该超链接;若没有匹配字段,则说明编辑信息中没有超链接,将该编辑信息作为在线文档内容进行存储。
S202、若编辑内容中包含超链接,则自动获取超链接对应的链接内容。
具体的,通过上述判断,若编辑内容中包含超链接,则自动访问超链接的网络地址,并利用爬取系统自动获取超链接对应的网页内容,作为超链接内容。现以某一网页类型为例进行说明,抓取过程包括:
抓取超链接对应的标题标签中的内容,作为对在线文档的描述;
抓取超链接对应的内容标签下的目录(content)的内容;
抓取超链接对应的描述标签里h标签和p标签的内容,作为对在线文档的描述。
以上抓取内容可能未覆盖到超链接对应网页内的所有内容,本领域技术人员可根据本实施例的原则进行抓取,获取其他需要的信息,都属于本公开实施例的保护范围。可以理解,不同平台系统或网页结构的网页,在内容定义上会有不同,本实施例列举的例子用于说明抓取过程,并不用于限定仅仅只存在这一种抓取方式,其他抓取方式的实质都是在抓取超链接内容的,都属于本公开实施例的保护范围。作为选择,若超链接内容中还包含超链接,则可设置继续进行内容抓取,或禁止继续进行内容抓取。
进一步,抓取超链接对应的内容后,按照以下格式对超链接内容进行排序,将标题标签中的内容放在链接内容的第一行。若标题标签中无内容,则填写超链接的链接地址;若标题标签中的内容大于第一预设字节长度,则仅截取标题标签中第一预设字节长度的内容。
将内容标签下的目录的内容放在链接内容的第二行。若内容标签中无内容,则不存储;若内容标签中的内容大于第二预设字节长度,则仅截取内容标签中第二预设字节长度的内容。
将描述标签里h标签和p标签的内容作为对链接内容的描述。
S203、将链接内容进行存储。
具体的,获取超链接内容后,将链接内容进行存储,包括:将链接内容和在线文档内容一起存放,即存储在同一地址,其中在线文档内容为在线文档中不包括超链接的内容。
优选地,可将链接内容位于在线文档内容的下方,此处的下方是指对于整个在线文档来说,在线文档包括在线文档内容(即不包含超链接内容)和超链接内容,作为编辑格式,可将在线文档内容存储在前(上方),将超链接内容存储在后(下方)。具体编辑格式可根据需要进行设定,但只要在线文档包括在线文档内容和超链接内容,都属于本实施例的设计思想,均为本实施例的保护范围。
进一步,将链接内容进行存储包括:将链接内容与在线文档的文档ID进行关联,并将关联后的链接内容和文档ID进行存储。
进一步,若有多个用户ID,将链接内容与在线文档的文档ID进行关联包括:将链接内容与在线文档ID及用户ID进行关联。
将关联后的链接内容和文档ID进行存储包括:将关联后的链接内容和文档ID及用户ID进行存储,即同时将用户ID、在线文档ID、以及超链接内容这三个字段作为一条标记记录标识,存入检索数据库中供后续检索使用。
优选地,将链接内容进行存储包括:将在线文档内容和链接内容存储到基于Elasticsearch搭建的搜索系统中。在后续根据检索关键字检索过程中,使用Elasticsearch搜索引擎在搜索系统中检索在线文档内容和超链接对应的链接内容,Elasticsearch搜索引擎是一个实时的分布式搜索分析引擎,可用于全文检索、结构化检索、分析以及这三个功能的组合。Elasticsearch搜索系统可参考现有技术,本实施例在此不再赘述。
优选地,若一篇在线文档按照现有技术已经完成编辑,其内部的超链接仅仅是以文字形式记载,未记载该超链接对应的链接内容,则可将整片文档作为编辑信息,使用本实施例的方法将该在线文档进行转化。具体转化过程为:自动扫描该在线文档的内容,并根据上述步骤中超链接的判断标准判断在线文档的内容中是否包含超链接。若包含超链接,则自动获取超链接对应的链接内容,并将链接内容进行存储到原有在线文档中,具体过程可参考上文,即完成对现有技术中在线文档的转换。通过转换,现有技术中包含超链接的在线文档也可提供超链接内容搜索功能。
通过实施本实施例,在在线文档编辑过程中即自动获取超链接内容,并作为在线文档内容的一部分,方便后续用户进行查看和检索。
参考图2,本公开实施例提供一种在线文档检索装置,应用于在线文档中,在线文档包含至少一个超链接。本实施例的编辑对象是在线文档,在线文档指的是存储在服务器上或云端、且运行在浏览器或特定应用程序上的文档,该文档需通过联网才能实现访问和在线编辑。也就是说,本公开实施例中的在线文档不同于存储在本地计算机上、在本地进行编辑的文档。具体的,该在线文档检索装置20包括:
接收单元201,用于接收检索关键字。
具体的,用户通过鼠标、键盘、触摸屏、摄像头、麦克风等输入设备输入检索关键字,系统接收该搜索关键字。需要说明的是,在接收检索关键字之前,需要选定检索范围。本实施例中的检索对象为在线文档,在线文档既可以是一个,也可以是多个。若在线文档有一个,在该在线文档即为检索范围。若在线文档有多个,需选定要检索的对象,作为搜索范围;或者通过文件夹或存储位置划定搜索范围。进一步,在线文档既可以处于打开状态,也可以是未打开状态。若在检索过程中在线文档未打开,则从后台自动打开在线文档并进行检索。优选地,在后台打开的在线文档在前端是不显示的,用户不能看到被打开的在线文档。
关键字检索单元202,用于根据检索关键字,在搜索系统中确定与检索关键字对应的链接内容以及链接内容对应的链接。
具体的,对在线文档进行检索过程中,可先检索在线文档内容,然后检索超链接内容;或者先检索超链接内容,再检索在线文档内容。此处对超链接的连接内容已经提前存储到在线文档中,所以在搜索时并不需要再次访问超链接,不需要用户打开超链接,大大提高了搜索效率。
本实施例在搜索前对在线文档进行了预处理,将在线文档中的超链接对应的内容存储到在线文档中,并建立超链接内容与超链接的对应关系。在根据搜索关键字进行搜索时,若搜索关键字在超链接内容中,则可通过超链接内容确定对应的超链接。
作为选择,可使用Elasticsearch搜索引擎在搜索系统中检索与检索关键字对应的链接内容以及链接内容对应的链接。使用Elasticsearch搜索引擎的具体搜索步骤可参考现有技术,本实施例在此不再赘述。
文档检索单元203,用于根据链接确定检索关键字对应的在线文档。
具体的,本实施例在搜索前对在线文档进行了预处理,将在线文档中的超链接对应的内容存储到在线文档中,并建立超链接内容与超链接的对应关系,以及超链接与所属在线文档的对应关系。若搜索关键字在超链接内容中,则可通过超链接内容确定对应的超链接,进而通过超链接确定对应的在线文档。
显示单元204,用于显示包含在线文档的检索结果。
具体的,通过检索关键字搜索,得到与该检索关键字对应的检索结果,本实施例中显示包含在线文档的检索结果包括:
检索对象为多个未打开的在线文档,则显示包含检索关键字的在线文档,例如在20篇在线文档中检索到2篇包含检索关键字的在线文档,则显示这两篇在线文档,可以以打开形式显示,也可只显示在线文档文件。
一些实施例中,显示包含检索关键字的在线文档的存储位置信息,即搜索结果为在线文档的存储位置信息,用户根据该存储位置信息即可找到所需在线文档。
一些实施例中,若在线文档处于打开状态,在在线文档中突出显示检索关键字的位置,例如通过增加背景颜色、高亮方式突出显示检索关键字的位置。
作为选择,显示包含在线文档的检索结果包括:通过浮动窗口显示检索结果。
作为选择,显示包含在线文档的检索结果包括:若检索关键字位于链接内容中,则根据链接内容对应的超链接打开对应网页;并显示检索关键字在网页中的位置,方便用户直接查看所需内容的原始出处。
本实施例在检索过程中,实现对在线文档内容以及超链接内容的检索,即使检索关键字在超链接过程中也可检索到,提高检索效率和用户体验。
在上述实施例实施前,需要对在线文档进行预处理,将在线文档中的超链接对应的内容存储到在线文档中,具体预处理过程通过以下单元实现:
编辑单元,用于对在线文档进行编辑。
具体的,用户通过鼠标、键盘、触摸屏、摄像头、麦克风等输入设备输入编辑信息,或通过粘贴动作粘贴内容作为编辑信息,该编辑信息用于对在线文档进行编辑。在输入编辑信息后,系统自动识别编辑信息中是否包含超链接,具体判断过程为:预存网络连接的标准格式信息,可能有多种,通过标准格式信息查找编辑信息中是否有匹配的字段。若有匹配字段,则说明编辑信息中包含超链接,并找出该超链接;若没有匹配字段,则说明编辑信息中没有超链接,将该编辑信息作为在线文档内容进行存储。
内容获取单元,用于若编辑内容中包含超链接,则自动获取超链接对应的链接内容。
具体的,通过上述判断,若编辑内容中包含超链接,则自动访问超链接的网络地址,并利用爬取系统自动获取超链接对应的网页内容,作为超链接内容。现以某一网页类型为例进行说明,抓取过程包括:
抓取超链接对应的标题标签中的内容,作为对在线文档的描述;
抓取超链接对应的内容标签下的目录(content)的内容;
抓取超链接对应的描述标签里h标签和p标签的内容,作为对在线文档的描述。
以上抓取内容可能未覆盖到超链接对应网页内的所有内容,本领域技术人员可根据本实施例的原则进行抓取,获取其他需要的信息,都属于本公开实施例的保护范围。可以理解,不同平台系统或网页结构的网页,在内容定义上会有不同,本实施例列举的例子用于说明抓取过程,并不用于限定仅仅只存在这一种抓取方式,其他抓取方式的实质都是在抓取超链接内容的,都属于本公开实施例的保护范围。作为选择,若超链接内容中还包含超链接,则可设置继续进行内容抓取,或禁止继续进行内容抓取。
进一步,抓取超链接对应的内容后,按照以下格式对超链接内容进行排序,将标题标签中的内容放在链接内容的第一行。若标题标签中无内容,则填写超链接的链接地址;若标题标签中的内容大于第一预设字节长度,则仅截取标题标签中第一预设字节长度的内容。
将内容标签下的目录的内容放在链接内容的第二行。若内容标签中无内容,则不存储;若内容标签中的内容大于第二预设字节长度,则仅截取内容标签中第二预设字节长度的内容。
将描述标签里h标签和p标签的内容作为对链接内容的描述。
存储单元,用于将链接内容进行存储。
具体的,获取超链接内容后,将链接内容进行存储,包括:将链接内容和在线文档内容一起存放,即存储在同一地址,其中在线文档内容为在线文档中不包括超链接的内容。
优选地,可将链接内容位于在线文档内容的下方,此处的下方是指对于整个在线文档来说,在线文档包括在线文档内容(即不包含超链接内容)和超链接内容,作为编辑格式,可将在线文档内容存储在前(上方),将超链接内容存储在后(下方)。具体编辑格式可根据需要进行设定,但只要在线文档包括在线文档内容和超链接内容,都属于本实施例的设计思想,均为本实施例的保护范围。
进一步,将链接内容进行存储包括:将链接内容与在线文档的文档ID进行关联,并将关联后的链接内容和文档ID进行存储。
进一步,若有多个用户ID,将链接内容与在线文档的文档ID进行关联包括:将链接内容与在线文档ID及用户ID进行关联。
将关联后的链接内容和文档ID进行存储包括:将关联后的链接内容和文档ID及用户ID进行存储,即同时将用户ID、在线文档ID、以及超链接内容这三个字段作为一条标记记录标识,存入检索数据库中供后续检索使用。
优选地,将链接内容进行存储包括:将在线文档内容和链接内容存储到基于Elasticsearch搭建的搜索系统中。在后续根据检索关键字检索过程中,使用Elasticsearch搜索引擎在搜索系统中检索在线文档内容和超链接对应的链接内容,Elasticsearch搜索引擎是一个实时的分布式搜索分析引擎,可用于全文检索、结构化检索、分析以及这三个功能的组合。Elasticsearch搜索系统可参考现有技术,本实施例在此不再赘述。
优选地,若一篇在线文档按照现有技术已经完成编辑,其内部的超链接仅仅是以文字形式记载,未记载该超链接对应的链接内容,则可将整片文档作为编辑信息,使用本实施例的装置将该在线文档进行转化。具体转化过程为:自动扫描该在线文档的内容,并根据上述步骤中超链接的判断标准判断在线文档的内容中是否包含超链接。若包含超链接,则自动获取超链接对应的链接内容,并将链接内容进行存储到原有在线文档中,具体过程可参考上文,即完成对现有技术中在线文档的转换。通过转换,现有技术中包含超链接的在线文档也可提供超链接内容搜索功能。
通过实施本实施例,在在线文档编辑过程中即自动获取超链接内容,并作为在线文档内容的一部分,方便后续用户进行查看和检索。
参考图3,本公开实施例还提供一种电子设备,包括存储器和处理器;
存储器用于存储计算机程序;
处理器用于执行计算机程序实现如上述的在线文档检索方法。
优选地,电子设备包括但不限于包括手机、平板电脑、笔记本电脑、服务器等。
下面参考图3,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储器(ROM)302中的程序或者从存储装置308加载到随机访问存储器(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置308被安装,或者从ROM302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开实施例提供的上述计算机可读介质可以是计算机可读信号介质或者计算机存储介质或者是上述两者的任意组合。计算机存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开实施例中,计算机存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括至少两个网际协议地址的节点评价请求,其中,节点评价设备从至少两个网际协议地址中,选取网际协议地址并返回;接收节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开实施例的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开实施例各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。
通过实施本公开,在编辑过程汇中将超链接对应的内容加入到在线文档中,成为在线文档的一部分;进而在后续检索过程中,实现对在线文档内容以及超链接内容的检索,提高检索效率和用户体验。
以上实施例只为说明本公开的技术构思及特点,其目的在于让熟悉此项技术的人士能够了解本公开的内容并据此实施,并不能限制本公开的保护范围。凡跟本公开权利要求范围所做的均等变化与修饰,均应属于本公开权利要求的涵盖范围。

Claims (10)

1.一种在线文档检索方法,其特征在于,包括:
接收检索关键字;
根据所述检索关键字,在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接;
根据所述链接确定所述检索关键字对应的在线文档;
显示包含所述在线文档的检索结果。
2.根据权利要求1所述的在线文档检索方法,其特征在于,在所述接收检索关键字之前还包括在线文档编辑过程:
对在线文档进行编辑;
若编辑内容中包含超链接,则自动获取所述超链接对应的链接内容;
将所述链接内容进行存储。
3.根据权利要求2所述的在线文档检索方法,其特征在于,所述将所述链接内容进行存储包括:
将所述链接内容与在线文档的文档ID进行关联,并将关联后的所述链接内容和文档ID进行存储。
4.根据权利要求3所述的在线文档检索方法,其特征在于,所述将所述链接内容与在线文档的文档ID进行关联包括:
将所述链接内容与在线文档ID及用户ID进行关联;
所述将关联后的所述链接内容和文档ID进行存储包括:将关联后的所述链接内容和文档ID及用户ID进行存储。
5.根据权利要求2所述的在线文档检索方法,其特征在于,所述自动获取所述超链接对应的链接内容包括:
抓取所述超链接对应的标题标签中的内容;
抓取所述超链接对应的内容标签下的目录的内容;
抓取所述超链接对应的描述标签里的内容。
6.根据权利要求5所述的在线文档检索方法,其特征在于,若所述标题标签中无内容,则填写所述超链接的链接地址;
若所述标题标签中的内容大于第一预设字节长度,则仅截取所述标题标签中第一预设字节长度的内容;
若所述内容标签中无内容,则不存储;
若所述内容标签中的内容大于第二预设字节长度,则仅截取所述内容标签中第二预设字节长度的内容。
7.根据权利要求2所述的在线文档检索方法,其特征在于,所述将所述链接内容进行存储包括:将所述在线文档内容和链接内容存储到所述搜索系统中;
所述在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接包括:
使用Elasticsearch搜索引擎在所述搜索系统中检索与所述检索关键字对应的链接内容以及所述链接内容对应的链接。
8.一种在线文档检索装置,其特征在于,包括:
接收单元,用于接收检索关键字;
关键字检索单元,用于根据所述检索关键字,在搜索系统中确定与所述检索关键字对应的链接内容以及所述链接内容对应的链接;
文档检索单元,用于根据所述链接确定所述检索关键字对应的在线文档;
显示单元,用于显示包含所述在线文档的检索结果。
9.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任意一项所述的在线文档检索方法。
10.一种电子设备,其特征在于,包括存储器和处理器;
所述存储器用于存储计算机程序;
所述处理器用于执行所述计算机程序实现如权利要求1-7任一项所述的在线文档检索方法。
CN201811357676.0A 2018-11-15 2018-11-15 一种在线文档检索方法、装置、存储介质及电子设备 Pending CN109299244A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811357676.0A CN109299244A (zh) 2018-11-15 2018-11-15 一种在线文档检索方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811357676.0A CN109299244A (zh) 2018-11-15 2018-11-15 一种在线文档检索方法、装置、存储介质及电子设备

Publications (1)

Publication Number Publication Date
CN109299244A true CN109299244A (zh) 2019-02-01

Family

ID=65144286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811357676.0A Pending CN109299244A (zh) 2018-11-15 2018-11-15 一种在线文档检索方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN109299244A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977279A (zh) * 2019-03-15 2019-07-05 天津字节跳动科技有限公司 在套件中搜索在线文档方法及装置
CN110222252A (zh) * 2019-06-14 2019-09-10 宜春宜联科技有限公司 信息检索方法、装置和设备
CN110765357A (zh) * 2019-10-24 2020-02-07 北京字节跳动网络技术有限公司 在线文档的搜索方法、装置、设备及存储介质
WO2020200173A1 (zh) * 2019-04-02 2020-10-08 北京字节跳动网络技术有限公司 文档输入内容的处理方法、装置、电子设备和存储介质
CN111914522A (zh) * 2020-06-20 2020-11-10 北京海金格医药科技股份有限公司 无效超链接修复方法、装置、电子设备和可读存储介质
CN112347324A (zh) * 2019-08-08 2021-02-09 珠海金山办公软件有限公司 一种文档查询方法、装置、电子设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190446A1 (en) * 2005-02-22 2006-08-24 Taiwan Semiconductor Manufacturing Co., Ltd. Web search system and method thereof
CN101599069A (zh) * 2009-07-10 2009-12-09 腾讯科技(深圳)有限公司 电子文档的搜索方法及系统
CN101639838A (zh) * 2008-07-31 2010-02-03 深圳龙媒网络技术有限公司 一种资源搜索方法和资源搜索系统
CN107943893A (zh) * 2017-11-16 2018-04-20 北京奇安信科技有限公司 一种基于互联网的搜索处理方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060190446A1 (en) * 2005-02-22 2006-08-24 Taiwan Semiconductor Manufacturing Co., Ltd. Web search system and method thereof
CN101639838A (zh) * 2008-07-31 2010-02-03 深圳龙媒网络技术有限公司 一种资源搜索方法和资源搜索系统
CN101599069A (zh) * 2009-07-10 2009-12-09 腾讯科技(深圳)有限公司 电子文档的搜索方法及系统
CN107943893A (zh) * 2017-11-16 2018-04-20 北京奇安信科技有限公司 一种基于互联网的搜索处理方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109977279A (zh) * 2019-03-15 2019-07-05 天津字节跳动科技有限公司 在套件中搜索在线文档方法及装置
CN109977279B (zh) * 2019-03-15 2022-09-27 天津字节跳动科技有限公司 在套件中搜索在线文档方法及装置
WO2020200173A1 (zh) * 2019-04-02 2020-10-08 北京字节跳动网络技术有限公司 文档输入内容的处理方法、装置、电子设备和存储介质
US11423112B2 (en) 2019-04-02 2022-08-23 Beijing Bytedance Network Technology Co., Ltd. Document input content processing method and apparatus, electronic device, and storage medium
CN110222252A (zh) * 2019-06-14 2019-09-10 宜春宜联科技有限公司 信息检索方法、装置和设备
CN112347324A (zh) * 2019-08-08 2021-02-09 珠海金山办公软件有限公司 一种文档查询方法、装置、电子设备及存储介质
CN110765357A (zh) * 2019-10-24 2020-02-07 北京字节跳动网络技术有限公司 在线文档的搜索方法、装置、设备及存储介质
CN111914522A (zh) * 2020-06-20 2020-11-10 北京海金格医药科技股份有限公司 无效超链接修复方法、装置、电子设备和可读存储介质

Similar Documents

Publication Publication Date Title
CN109299244A (zh) 一种在线文档检索方法、装置、存储介质及电子设备
CN109492210A (zh) 一种在线文档内容展示方法、装置、存储介质及电子设备
US10169475B2 (en) Pattern for navigating content in a portal
CN109344336A (zh) 搜索方法、搜索集生成方法、装置、介质、终端及服务器
EP2431938A2 (en) Location-based data service apparatus and method
CN105426508B (zh) 网页生成方法和装置
US10031920B1 (en) Third-party indexable text
CN109661662A (zh) 利用外部上下文针对相关性将查询结果进行排名
CN109542578A (zh) 一种列表界面的显示方法、装置、设备及存储介质
WO2022111591A1 (zh) 页面生成方法和装置、存储介质和电子设备
CN110413872A (zh) 用于展示信息的方法和装置
CN109992498A (zh) 测试用例的生成方法及系统、计算机系统
CN106951495A (zh) 用于呈现信息的方法和装置
CN110889263A (zh) 文档的待办事项生成方法、装置、设备及存储介质
CN109862100A (zh) 用于推送信息的方法和装置
CN109508361A (zh) 用于输出信息的方法和装置
CN107315833A (zh) 基于应用程序的检索与下载的方法和装置
CN106716413A (zh) 个人计算设备上的统一搜索
CN109726380A (zh) 表格编辑方法及装置
CN110390051A (zh) 一种搜索实现方法、装置、电子设备及存储介质
CN110489041A (zh) 小程序拖动元素自动对齐的方法、装置、设备及介质
CN110119386A (zh) 数据处理方法、数据处理装置、介质和计算设备
CN109902245A (zh) 交互式的信息提供方法及装置
CN107704104A (zh) 表单输入项联想方法、系统、设备及存储介质
CN116578712A (zh) 一种基于知识图谱领域知识库的检索和图谱分析方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination