CN105005562B - 检索结果的显示处理方法及装置 - Google Patents

检索结果的显示处理方法及装置 Download PDF

Info

Publication number
CN105005562B
CN105005562B CN201410151752.8A CN201410151752A CN105005562B CN 105005562 B CN105005562 B CN 105005562B CN 201410151752 A CN201410151752 A CN 201410151752A CN 105005562 B CN105005562 B CN 105005562B
Authority
CN
China
Prior art keywords
document
keyword
paragraph
information
display
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410151752.8A
Other languages
English (en)
Other versions
CN105005562A (zh
Inventor
裘钢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suoyi Interactive Beijing Information Technology Co ltd
Original Assignee
Suoyi Interactive Beijing Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suoyi Interactive Beijing Information Technology Co ltd filed Critical Suoyi Interactive Beijing Information Technology Co ltd
Priority to CN201410151752.8A priority Critical patent/CN105005562B/zh
Publication of CN105005562A publication Critical patent/CN105005562A/zh
Application granted granted Critical
Publication of CN105005562B publication Critical patent/CN105005562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供了一种检索结果的显示处理方法及装置,其中,该方法包括:按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及文档中包括至少一个关键词的段落,其中,查询表达式与关键词组是对应的;在显示界面上按照预设显示模式同时显示多个文档的文档信息、每个文档中多个段落的段落信息和关键词,其中,不同预设显示模式中文档信息、关键词和段落信息在显示界面的组合排列方式不同,采用本发明提供的上述技术方案,解决了相关技术中,现有的检索方案存在人工工作量较大,检索效率低等问题,从而可以使得检索人员快速查找到与查询表达式相关的文档和段落信息,减少了检索人员的工作量,提高了检索效率。

Description

检索结果的显示处理方法及装置
技术领域
本发明涉及检索领域,具体而言,涉及一种检索结果的显示处理方法及装置。
背景技术
目前,随着电子技术的发展,各类数据库内包含的信息量巨大,当使用者需要在数据库内找出所需要的数据常需花费大量时间,因此各类检索工具应运而生,例如,对于从事与专利相关工作的人员,常采用专利检索平台在专利数据库内进行检索,其方法通常是先设置检索条件,然后对专利检索平台检索出的结果进行人工审阅以找出最为需要的专利数据。由于检索出的数据比较多,使得检索人员的人工审阅工作量增加,降低检索效率。
图1为根据相关先知技术的检索实现原理示意图。如图1所示,在相关先知技术中,查询表达式指示的对应关键词组为关键词0、关键词1、……、关键词β,包含对应关键词组的文档分别为文档0、文档1、……、文档a,和包含对应的关键词组段落,其中,a和β为自然数。如图1所示,此处不再赘述。从图1中可以看出,相关技术中检索方式中的结果显示为仅显示包含一个或数个关键词对应的每一个文档的一个段落。当检索关键词数β较大时,检索系统无法发现包括全部关键词的文档,同时用户无法获知哪些关键词被包括在哪些文档中,哪些关键词没有被包括在哪些文档中。更进一步,用户无法获知哪些文档虽然不包括这些关键词,但包括另外一些相关词。更进一步,用户无法定位哪些文档在哪些段落中包含哪些关键词。这样不利于检索人员查询到所有感兴趣的包含这些关键词和相关词的段落及包含这些段落的文档,增加了检索工作量。
又例如,为了满足在专利审查过程中对现有技术搜索的解析需要,需要从多维度关系检索、浏览、跟踪、理解现有技术文档:被审查专利中的技术特征(例如一组关键词中的多个关键词及与其相关的其它关键词),该技术特征所在的多个相关文档,更重要的是,为了对基于检索到的多个相关文档对被审查专利的创造性和新颖性进行分析,还需要审阅上述技术特征在上述多个相关文档中的多个相关段落内容,即专利审查员还需要查阅与技术特征相关的多个段落中的每个段落,以便于准确理解上述技术特征在多个相关文档中的含义。而现有技术中则不能自动发现、跟踪、显示多文档-多段落-多关键词关系,即上述多个关键词及与其相关的其它关键词与包含上述多个关键词及与其相关的其它关键词的多个相关文档,以及在多个相关文档中包含上述多个关键词及与其相关的其它关键词的多个相关段落,需要在查阅上述相关文档时借助人工浏览、搜索、剔除不相关内容,以实现记录、跟踪相关关键词、相关段落与相关文档的复杂关系,增加了工作量,降低了检索效率。
针对相关技术中的上述问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中,现有的检索方案存在人工工作量较大,检索效率低等问题,本发明提供了一种检索结果的显示处理方法及装置,以至少解决上述问题。
为了达到上述目的,根据本发明的一个方面,提供了一种检索结果的显示处理方法,包括:按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落,其中,所述查询表达式与所述关键词组是对应的;在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,其中,不同所述预设显示模式中所述文档信息、所述关键词和所述段落信息在所述显示界面的组合排列方式不同。
优选地,所述预设显示模式包括以下至少之一:第一显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词在其所属文档中所在段落的段落信息以及所述关键词;第二显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词所属文档的文档信息和所述关键词在其所属文档中所在段落的段落信息;第三显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词以及所述关键词在其所属文档中所在段落的段落信息;第四显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词在其所属文档中所在段落的段落信息以及所述关键词所属文档的文档信息。
优选地,上述技术方案还包括:将所述文档信息按照以下之一规则依次排列:按照所述关键词或所述关键词组在所述文档中的出现频率;按照所述关键词或所述关键词组与所述文档的相关度;和/或,将所述关键词按照以下之一规则依次排列:按照所述关键词在所述预设数据库的出现个数;按照所述关键词在所述文档中的出现个数;按照所述关键词与所述查询表达式所指示文档的相关度;和/或,将所述段落信息按照以下之一规则依次排列:按照所述关键词或所述关键词组在所述段落的出现频率;按照所述关键词或所述关键词组与所述段落的相关度;按照所述段落在所属文档中的出现顺序。
优选地,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:接收用户的切换指令;按照所述切换指令执行在不同所述预设显示模式之间的切换。
优选地,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:在显示所述关键词、所述文档信息时,对每个所述文档,仅显示在每个所述文档中查询得到的全部段落中的部分段落信息。
优选地,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:接收用户对所述显示界面上第一控件的第一操作指令;在所述第一操作指令的触发下,将所述部分段落信息替换为指定段落的段落信息,其中,所述指定段落为所述全部段落中当前未显示的段落。
优选地,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:接收用户对所述显示界面上第二控件的第二操作指令;在所述第二操作指令的触发下,对于每个所述文档,显示在每个所述文档中所述全部段落的段落信息。
优选地,按照查询表达式在预设数据库中查询包括所述查询表达式对应的关键词组中至少一个关键词的文档时,还包括:对于每个所述文档,查询每个所述文档中与所述关键词的相关度大于预设阈值的相关词;在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词时,还包括:显示所述相关词。
优选地,显示所述相关词包括:将所述关键词的显示区域划分为第一区域和第二区域;在所述第一区域显示所述关键词,在所述第二区域显示所述关键词的相关词。
优选地,在显示所述相关词时,还包括:对每个所述文档,在所述显示界面上显示与每个所述文档中各个词语的所述相关度小于所述预设阈值的所述关键词组中的关键词。
优选地,所述段落信息包括以下至少之一:所述段落信息所对应段落的标识、所述段落信息所对应的段落、所述段落信息所对应的段落内容、所述段落内容的内容提取信息、所述段落内容在所述文档中的位置。
优选地,按照查询表达式在预设数据库中查询包括所述查询表达式指示的关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落之前,包括:根据所述查询表达式查询与所述查询表达式对应的指定文档;从所述指定文档中获取指定关键词,得到所述关键词组。
优选地,在显示界面上按照预设显示模式同时显示所述关键词组中的多个关键词、多个所述文档的文档信息和多个所述段落的段落信息时,所述方法还包括:接收用户对所述显示界面上第三控件的第三操作指令;在所述第三操作指令的触发下,在所述显示界面上按照预设显示模式同时显示所述指定文档的文档信息。
优选地,在所述显示界面上按照预设显示模式同时显示所述指定文档的文档信息时,所述方法还包括:接收用户对指定段落中显示的所述关键词的触发指令;在所述触发指令的触发下,将所述指定文档的文档信息的显示区域移至所述指定段落的邻近区域。
优选地,所述指定文档的文档信息在所述显示区域内以滚动条的形式显示。
为了达到上述目的,根据本发明的再一个方面,提供了一种检索结果的显示处理装置,包括:查询模块,用于按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落,其中,所述查询表达式与所述关键词组是对应的;显示模块,用于在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,其中,不同所述预设显示模式中所述文档信息、所述关键词和所述段落信息在所述显示界面的组合排列方式不同。
优选地,所述显示模块,用于在所述预设显示模式包括以下至少之一显示模式时,同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词:第一显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词在其所属文档中所在段落的段落信息以及所述关键词;第二显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词所属文档的文档信息和所述关键词在其所属文档中所在段落的段落信息;第三显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词以及所述关键词在其所属文档中所在段落的段落信息;第四显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词在其所属文档中所在段落的段落信息以及所述关键词所属文档的文档信息。
通过本发明,采用按照查询表达式在预设数据库中查询包括所述查询表达式对应的关键词组中至少一个关键词的文档,以及该文档中包括至少一个上述关键词的段落并同时显示上述关键词、段落信息和文档信息的技术手段,解决了相关技术中,现有的检索方案存在人工工作量较大,检索效率低等问题,从而可以使得检索人员快速查找到与查询表达式相关的文档和段落信息,减少了检索人员的工作量,提高了检索效率。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为根据相关技术的检索实现原理示意图;
图2为根据本发明实施例的检索结果的显示处理方法的流程图;
图3为根据本发明优选实施例的检索结果的第一展示示意图;
图4为根据本发明优选实施例的检索结果的第二展示示意图;
图5为根据本发明优选实施例的检索结果的第三展示示意图;
图6为根据本发明优选实施例的检索结果的第四展示示意图;
图7为根据本发明优选实施例的显示界面的示意图;
图8为根据本发明优选实施例的显示界面的另一示意图;
图9为根据本发明优选实施例的检索结果的显示处理方法的第一流程图;
图10为根据本发明优选实施例的检索结果显示过程的第一流程图;
图11为根据本发明优选实施例的检索结果的显示处理方法的第二流程图;
图12为根据本发明优选实施例的检索结果显示过程的第二流程图;
图13为根据本发明实施例的检索结果的显示处理装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
文本处理,通称“非结构化”处理。现有文本显示都是单一、无结构。本发明实施例披露的文本处理是通过建立文本多维(Multi-Dimension)多视角(Multi-View)关系模式,为用户构建出多维文本解析模型,并通过多视角展示。图2为根据本发明实施例的检索结果的显示处理方法的流程图。如同2所示,该方法包括:
步骤S202,按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落,其中,所述查询表达式与所述关键词组是对应的;
步骤S204,在显示界面上按照预设显示模式同时显示多个文档的文档信息、每个文档中多个段落的段落信息和上述关键词,其中,不同预设显示模式中上述文档信息、上述关键词和上述段落信息在显示界面的组合排列方式不同。
通过上述各个处理步骤,由于可以按照查询表达式查询包括与其对应的关键词组中的关键词的多个文档以及多个文档中的一个或多个段落信息并同时显示,因此,可以使得检索人员快速查找到相关文档和段落信息,提高了检索效率。
优选地,该预设数据库可以为本地服务器上的数据库,也可以为网络侧的数据库(即可以从网络上获取符合查询表达式的数据),关键词组中可以包括一个关键词或多个关键词,优选地,可以包括至少两个关键词。
在本实施例的一个优选实施方式中,可以在步骤S204之前,根据上述多个文档信息、上述段落信息以及上述关键词生成显示界面,以实现同时显示包括关键词的文档、该文档中包括至少一个关键词的段落,以及关键词组中的所有关键词。
在本实施例中,上述查询表达式可以是关键词集合,或者,基于多个关键词的查询表达式:例如采用包括以下关键词“烹饪视频、制作、辅助和控制”的查询表达式:烹饪视频AND(制作OR辅助OR控制)。需要说明的是,上述查询表达式的表现形式仅是例举,并不限于此。步骤S202中“该查询表达式对应的关键词组”的含义可以为:查询表达式中所直接指示的关键词组(即查询表达式为关键词组),也可以为查询表达式的逻辑结果所指示的关键词组。在本实施例的一个优选实施方式中,上述查询表达式可以表现为文件标识:例如专利局审查员在检索待审查专利是否被其它技术文献(包括专利文件和技术期刊等)所揭露时,可以通过被审查专利的专利申请号或公开号来确定被审查专利的关键词组,以及包括该关键词组中关键词的文档和段落等,即此时查询表达式可以为被审查专利的专利申请号或公开号。
步骤S204中,可以在上述显示界面上的不同指定区域分别显示上述文档信息、上述关键词和上述段落信息,其中,上述文档信息、上述关键词和上述段落信息各自对应的指定区域存在对应关系,即文档信息所对应文档中包括的关键词和段落按照一定的对应关系显示,例如,在上述指定区域为表格(或者为隐性显示的表格)时,该对应关系可以为每一行对应一个文档以及该文档所包括的关键词和/或段落,即对于每个关键词,横向显示每个文档的文档信息,该每个文档中包括关键词的段落信息,以及该关键词。
优选地,上述预设显示模式的设计规则可以表现为但不限于以下形式:在显示界面上的不同指定区域,从左至右按照上述文档信息、上述关键词和上述段落信息的任意排列顺序依次显示,例如按照以下顺序显示:文档信息-关键词-段落信息;关键词-文档信息-段落信息;文档信息-段落信息-关键词;段落信息-关键词-文档信息;关键词-段落信息-文档信息。当然,也可以在显示界面上按照从上到下的顺序依次显示上述内容,但不限于此。具体地,上述指定区域可以表现为表格(可以为隐性显示的表格)的形式,即上述文档信息、上述关键词和上述段落信息分别占有表格中的一列,并且,上述文档信息、上述关键词和上述段落信息在表格中的横向上(即表格中的行)是对应的,具体表现形式可以参见图3-图8,此处不再赘述。
基于上述规则,上述预设显示模式,可以包括但不限于以下至少之一显示模式:
第一显示模式,用于在显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列关键词所属文档的文档信息、关键词在其所属文档中所在段落的段落信息以及关键词。具体可以参见图3,图3示出了按照文档(Document,简称为D)-关键词(Keyword,简称为K)-段落(Paragraph)的顺序显示上述文档信息、关键词、和段落信息,其中,a,b,β为下标序号,为包括0的整数;m、n、i、j、b、k、r、s、c、p、l以及t也为包括0的整数,以下所涉及的上述字母的含义和取值与上面所述相同。
第二显示模式,用于在显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列上述关键词、上述关键词所属文档的文档信息和上述关键词在其所属文档中所在段落的段落信息。具体可以参见图4,图4示出了按照关键词-文档-段落的顺序从左至右进行显示。
第三显示模式,用于在显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列所述关键词所属文档的文档信息、上述关键词在其所属文档中所在段落的段落信息以及上述关键词;具体可以参见图5,图5示出了按照文档(D)-段落(P)-关键词(K)的顺序显示上述文档信息、关键词和段落信息ε、λ、t均为包括0的整数。
第四显示模式,用于在所述显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列所述关键词、所述关键词在其所属文档中所在段落的段落信息以及所述关键词所属文档的文档信息。具体可以参见图6,图6示出了按照关键词-段落-文档的顺序显示上述文档信息、关键词和段落信息。
在本实施例中,为了满足检索人员的不同显示需求,上述各个显示模式可以互相切换。在本实施例的一个优选实施方式中,可以通过以下处理过程实现:接收用户的切换指令;按照该切换指令执行在不同预设显示模式之间的切换。
为了更直观地表示,图7和图8分别示出了以关键词-文档-段落以及文档-关键词-段落的显示顺序的显示界面。从图7和图8中可以看出,上述文档信息、关键词、和段落信息是以表格的形式显示的,并且,在显示界面中可以控制段落的显示方式(可以采用控件触发的方式,但不限于此):例如可以在其所属文档中按序显示部分段落(一个或多个段落)或者同时全部显示。
在每个显示模式中,可以以某一类信息的排序规则为基准,对上述关键词、文档信息和段落信息进行排序显示:例如对于文档信息,可以将所述文档信息按照以下之一规则从上到下(也可以从左到右,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列:按照关键词或关键词组在所述文档中的出现频率;按照关键词或关键词组与所述文档的相关度;当然用户还可以指定其它的排序规则,并不限于此。
和/或,将关键词按照以下之一规则从上到下依次排列:按照关键词在预设数据库的出现个数;按照所述关键词在所述文档中的出现个数;按照所述关键词与所述查询表达式所指示文档的相关度(此时,查询表达式可以用于指示文档,关键词组为从该指示的文档中获取的关键词,但不限于此);当然用户还可以指定其它的排序规则,并不限于此。
和/或,将上述段落信息按照以下之一规则从上到下依次排列:按照关键词或关键词组在所述段落的出现频率;按照关键词或关键词组与段落的相关度;按照段落在所属文档中的出现顺序。当然用户还可以指定其它的排序规则,并不限于此。
其中,对于上述相关度,可以采用相关技术中相关度计算的向量处理方法,例如,对于关键词与段落间的相关度,即将关键词、段落都表示为向量,关键词与段落间的相关度为关键词向量与段落向量间的内积值。由于上述计算方法可以从相关技术中查询得知,此处不再赘述。
出于节省显示空间的目的,可以在显示上述关键词、上述文档信息时,对于每个文档,仅显示在每个文档中查询得到的全部段落中的部分段落信息(对于部分段落信息,可以按照预设规则确定,例如可以按照该部分段落信息的重要性,按照该部分段落信息与上述关键词的相关度等,但不限于此)。其中,对于上述查询得到的全部段落的含义可以为:在每个文档中,包括上述关键词的全部段落。
当然,如果显示空间允许,为了节省阅读时间,也可以设置为显示上述全部段落信息。其中,对于前者,在阅读完当前部分段落信息时,如果需要阅读该文档中其它包括上述关键词的段落信息,也可以通过触发操作的方式显示其余段落中的指定段落,例如可以通过以下方式实现:接收用户对显示界面上第一控件的第一操作指令;在第一操作指令的触发下,将上述部分段落信息替换为指定段落的段落信息,其中,该指定段落为上述全部段落中当前未显示的段落(可以为从未显示的所有段落中按照预设规则选择的段落);对于上述指定段落的段落信息,可以按照预设优先级进行显示,还可以按照文档中包括上述关键词的段落中与该关键词的相关度大小确定,并不限于此。
在本实施例中,可以实现部分段落信息显示和上述全部段落信息显示的切换,在本实施例的一个优选实施方式中,可以采用以下方式实现:接收用户对显示界面上第二控件的第二操作指令;在该第二操作指令的触发下,对于每个文档,显示在每个文档中上述全部段落的段落信息。
为了提高检索结果的覆盖性,避免漏检现象的出现,按照查询表达式在预设数据库中查询包括所述查询表达式对应的关键词组中至少一个关键词的文档时,对于每个文档,查询每个文档中与上述关键词的相关度大于预设阈值的相关词(可以为近义词,但不限于此),在显示界面上同时显示多个文档的文档信息、每个文档中多个段落的段落信息和关键词时,还显示上述相关词。在显示上述相关词时,为了便于观察,可以将显示上述关键词的显示区域划分为第一区域和第二区域;在第一区域显示上述关键词,在上述第二区域显示关键词的相关词。
对于每个文档,为了便于检索人员获知当前文档中所不包括的关键词或其相关词,还可以采用以下处理过程:对每个文档,在显示界面上显示与每个文档中各个词语的相关度小于预设阈值的关键词组中的关键词。这样,检索人员便可以知晓当前文档中不包括哪些关键词或者其相关词。
在本实施例中,上述段落信息包括以下至少之一,但不限于此:上述段落信息所对应段落的标识、上述段落信息所对应的段落、上述段落信息所对应的段落内容、上述段落内容的内容提取信息、上述段落内容在文档中的位置。即可以显示以上之一段落信息,也可以同时显示以上任意数量个段落信息。在一个优选实施方式中,上述段落信息通过以下方式在上述显示界面上显示:按照各个上述段落信息所对应段落在所属文档中的出现顺序显示。
在步骤S202之前,还可以先获取上述关键词组,获取该关键词组的形式有多种,例如可以用上述查询表达式直接表示上述关键词组或查询表达式的逻辑结构表示上述关键词组,在本实施例的一个优选实施方式中,可以通过以下方式得到上述关键词组:根据上述查询表达式查询与上述查询表达式对应的指定文档;从该指定文档中获取指定关键词,得到关键词。
此时,查询表达式可以表现为上述指定文档的标识,例如可以为专利文件的申请号或公开号等。并且,优选地,可以从上述指定文档的指定位置获取上述指定关键词,例如可以从专利申请文件的“权利要求书”部分获取,或者,进一步可以从独立权利要求中获取等,但不限于此。
为了便于对比查询结果和上述指定文档,可以在显示关键词、文档信息以及段落信息时,同时显示上述指定文档,具体地可以通过以下过程实现:接收用户对显示界面上第三控件的第四操作指令;在第三操作指令的触发下,在显示界面上按照预设显示模式同时显示上述指定文档的文档信息。
在同时显示上述指定文档的文档信息时,还可以接收用户对指定段落中显示的关键词的触发指令;在上述触发指令的触发下,将上述指定文档的文档信息的显示区域移至上述指定段落的邻近区域。这样,便可以更直观地方便检索人员对被查询文件和查询到的文件进行对比。优选地,上述触发指令可以表示为在显示界面上对上述关键词的单击或双击等,但不限于此。
为了节省显示空间,可以将上述指定文档的文档信息在某一预设区域进行显示,当该预设区域相对于要显示的上述指定文档的文档信息较小时,可以将上述指定文档的文档信息在显示区域内以滚动条的形式显示。
在本实施例中,上述文档信息包括但不限于以下至少之一:上述文档的标识、上述文档的摘要、上述文档的公开日期。在上述文档信息所对应的文档为专利文件时,上述文档信息所对应的文档的标识可以为专利申请号、专利公开号等;上述文档的公开日期可以为专利的公开日期或授权公告日期;此时,上述关键词可以包括专利文件中的技术特征,但不限于此。当然在关键词为专利文件中的技术特征时,查询到的文档也可以为非专利技术文献。
为便于检索人员快速查阅,在上述显示界面上同时显示上述文档信息、上述段落信息和上述关键词时,还可以在上述显示界面上标示上述关键词。
为了更好地理解上述实施例,以下以优选实施例详细说明。
图9示出了按照关键词-文档-段落顺序显示时的检索处理流程,如图9所示,包括以下处理步骤:
步骤S902,获取关键词集K,即{Ki,i∈[0,β]},β为自然数;
步骤S904,获取包含关键词集K中至少一个关键词Ki的文档集,{Dj,j∈[0,C],andK∩Pj≠0},i、j为文档序号,取自然数,P表示文档集中文档的段落,C为自然数;
步骤S906,根据每个关键词Ki,对文档集中每一文档Dj,分别获取包含Ki的段落Pijk,{Pijk,k∈[0,t]},其中,ijk表示段落序号;
步骤S908,关键词-文档-段落(K-D-P)立体关系图显示。
图10示出了按照关键词-文档-段落(K-D-P)顺序的显示流程,如图10所示,包括以下处理步骤:
步骤S1002,第一列表元按序显示关键词{Ki};
步骤S1004,相对每一关键词表元Ki,第二列表元按序显示包含该关键词Ki的文档{Dij};
步骤S1006,相对每一文档表元,第三列表元按序显示包含该关键词Ki的文档Dij中的所有段落{Pijk}。
图11示出了按照文档-关键词-段落顺序显示时的检索处理流程,如图11所示,包括以下处理步骤:
步骤S1102,获取关键词集K,即{Ki,i∈[0,β]},β为自然数;
步骤S1104,获取包含关键词集K中至少一个关键词Ki的文档集{Dj,j∈[0,C],andK∩Pj≠0},i、j为文档序号,取自然数,P表示文档集中文档的段落,C为自然数;
步骤S1106,根据每个关键词Ki,对文档集中每一文档Dj,分别获取包含Ki的段落Pijk,{Pijk,k∈[0,t]},其中,t为自然数,i、j、k(均为自然数)表示段落序号;
步骤S1108,文档-关键词-段落(D-K-P)立体关系图显示。
图12示出了按照关键词-文档-段落(D-K-P)顺序的显示流程,如图12所示,包括以下处理步骤:
步骤S1202,第一列表元按序显示文档集{Dj};
步骤S1204,相对每一文档集表元Dj,第二列表元按序显示包含在文档Dj中的关键词集{Kji};
步骤S1206,相对每关键词表元,第三列表元按序显示包含该关键词Kji的所有段落集{Pjik}。
在本实施例中还提供了一种检索结果的显示处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述,下面对该装置中涉及到的模块进行说明。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图13为根据本发明实施例的检索结果的显示处理装置的结构框图。如图13所示,该装置包括:
查询模块130,用于按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及该文档中包括至少一个关键词的段落,其中,所述查询表达式与所述关键词组是对应的;
显示模块132,连接至查询模块130,用于在显示界面上按照预设显示模式同时显示多个文档的文档信息、每个文档中多个段落的段落信息和上述关键词,其中,不同预设显示模式中上述文档信息、上述关键词和上述段落信息在显示界面的组合排列方式不同。
优选地,显示模块132,还用于在上述预设显示模式包括以下至少之一显示模式时,同时显示多个上述文档的文档信息、每个上述文档中多个上述段落的段落信息和上述关键词:
第一显示模式,用于在上述显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列上述关键词所属文档的文档信息、上述关键词在其所属文档中所在段落的段落信息以及上述关键词;
第二显示模式,用于在上述显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列上述关键词、上述关键词所属文档的文档信息和上述关键词在其所属文档中所在段落的段落信息;
第三显示模式,用于在上述显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列上述关键词所属文档的文档信息、上述关键词以及上述关键词在其所属文档中所在段落的段落信息;
第四显示模式,用于在上述显示界面上从左至右(也可以从上到下,具体排列规则可以根据实际需要确定,此处并不作限定)依次排列上述关键词、上述关键词在其所属文档中所在段落的段落信息以及上述关键词所属文档的文档信息。
正如上面所述,本实施例中涉及到的上述各个模块可以通过相应地硬件来实现。例如,上述各个模块均可以处在处理器中,例如:上述各个模块均处于一个处理器中:一种处理器,包括:查询模块130、显示模块132;上述各个模块分别处于一个对应的处理器中:查询模块130,位于第一处理器中;显示模块132位于第二处理器中。
在另外一个实施例中,还提供了一种软件,该软件用于执行上述实施例及优选实施方式中描述的技术方案。
在另外一个实施例中,还提供了一种存储介质,该存储介质中存储有上述软件,该存储介质包括但不限于:光盘、软盘、硬盘、可擦写存储器等。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (16)

1.一种检索结果的显示处理方法,其特征在于,包括:
按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落,其中,所述查询表达式与所述关键词组是对应的;
在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,其中,不同所述预设显示模式中所述文档信息、所述关键词和所述段落信息在所述显示界面的组合排列方式不同;
按照查询表达式在预设数据库中查询包括所述查询表达式对应的关键词组中至少一个关键词的文档时,还包括:对于每个所述文档,查询每个所述文档中与所述关键词的相关度大于预设阈值的相关词;
在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词时,还包括:显示所述相关词。
2.根据权利要求1所述的方法,其特征在于,所述预设显示模式包括以下至少之一:
第一显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词在其所属文档中所在段落的段落信息以及所述关键词;
第二显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词所属文档的文档信息和所述关键词在其所属文档中所在段落的段落信息;
第三显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词以及所述关键词在其所属文档中所在段落的段落信息;
第四显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词在其所属文档中所在段落的段落信息以及所述关键词所属文档的文档信息。
3.根据权利要求1所述的方法,其特征在于,还包括:
将所述文档信息按照以下之一规则依次排列:按照所述关键词或所述关键词组在所述文档中的出现频率;按照所述关键词或所述关键词组与所述文档的相关度;和/或,
将所述关键词按照以下之一规则依次排列:按照所述关键词在所述预设数据库的出现个数;按照所述关键词在所述文档中的出现个数;按照所述关键词与所述查询表达式所指示文档的相关度;和/或,
将所述段落信息按照以下之一规则依次排列:按照所述关键词或所述关键词组在所述段落的出现频率;按照所述关键词或所述关键词组与所述段落的相关度;按照所述段落在所属文档中的出现顺序。
4.根据权利要求1所述的方法,其特征在于,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:
接收用户的切换指令;
按照所述切换指令执行在不同所述预设显示模式之间的切换。
5.根据权利要求1所述的方法,其特征在于,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:在显示所述关键词、所述文档信息时,对每个所述文档,仅显示在每个所述文档中查询得到的全部段落中的部分段落信息。
6.根据权利要求5所述的方法,其特征在于,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:
接收用户对所述显示界面上第一控件的第一操作指令;
在所述第一操作指令的触发下,将所述部分段落信息替换为指定段落的段落信息,其中,所述指定段落为所述全部段落中当前未显示的段落。
7.根据权利要求5所述的方法,其特征在于,在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,包括:
接收用户对所述显示界面上第二控件的第二操作指令;
在所述第二操作指令的触发下,对于每个所述文档,显示在每个所述文档中所述全部段落的段落信息。
8.根据权利要求1所述的方法,其特征在于,显示所述相关词包括:
将所述关键词的显示区域划分为第一区域和第二区域;
在所述第一区域显示所述关键词,在所述第二区域显示所述关键词的相关词。
9.根据权利要求1所述的方法,其特征在于,在显示所述相关词时,还包括:
对每个所述文档,在所述显示界面上显示与每个所述文档中各个词语的所述相关度小于所述预设阈值的所述关键词组中的关键词。
10.根据权利要求1所述的方法,其特征在于,所述段落信息包括以下至少之一:所述段落信息所对应段落的标识、所述段落信息所对应的段落、所述段落信息所对应的段落内容、所述段落内容的内容提取信息、所述段落内容在所述文档中的位置。
11.根据权利要求1至10任一项所述的方法,其特征在于,按照查询表达式在预设数据库中查询包括所述查询表达式指示的关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落之前,包括:
根据所述查询表达式查询与所述查询表达式对应的指定文档;从所述指定文档中获取指定关键词,得到所述关键词组。
12.根据权利要求11所述的方法,其特征在于,在显示界面上按照预设显示模式同时显示所述关键词组中的多个关键词、多个所述文档的文档信息和多个所述段落的段落信息时,所述方法还包括:
接收用户对所述显示界面上第三控件的第三操作指令;
在所述第三操作指令的触发下,在所述显示界面上按照预设显示模式同时显示所述指定文档的文档信息。
13.根据权利要求12所述的方法,其特征在于,在所述显示界面上按照预设显示模式同时显示所述指定文档的文档信息时,所述方法还包括:
接收用户对指定段落中显示的所述关键词的触发指令;
在所述触发指令的触发下,将所述指定文档的文档信息的显示区域移至所述指定段落的邻近区域。
14.根据权利要求12或13所述的方法,其特征在于,所述指定文档的文档信息在所述显示区域内以滚动条的形式显示。
15.一种检索结果的显示处理装置,其特征在于,包括:
查询模块,用于按照查询表达式在预设数据库中查询包括关键词组中至少一个关键词的文档,以及所述文档中包括至少一个所述关键词的段落,其中,所述查询表达式与所述关键词组是对应的;
显示模块,用于在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词,其中,不同所述预设显示模式中所述文档信息、所述关键词和所述段落信息在所述显示界面的组合排列方式不同;
其中,所述检索结果的显示处理装置,还用于在按照查询表达式在预设数据库中查询包括所述查询表达式对应的关键词组中至少一个关键词的文档时,对于每个所述文档,查询每个所述文档中与所述关键词的相关度大于预设阈值的相关词;以及在显示界面上按照预设显示模式同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词时,显示所述相关词。
16.根据权利要求15所述的装置,其特征在于,所述显示模块,用于在所述预设显示模式包括以下至少之一显示模式时,同时显示多个所述文档的文档信息、每个所述文档中多个所述段落的段落信息和所述关键词:
第一显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词在其所属文档中所在段落的段落信息以及所述关键词;
第二显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词所属文档的文档信息和所述关键词在其所属文档中所在段落的段落信息;
第三显示模式,用于在所述显示界面上依次排列所述关键词所属文档的文档信息、所述关键词以及所述关键词在其所属文档中所在段落的段落信息;
第四显示模式,用于在所述显示界面上依次排列所述关键词、所述关键词在其所属文档中所在段落的段落信息以及所述关键词所属文档的文档信息。
CN201410151752.8A 2014-04-15 2014-04-15 检索结果的显示处理方法及装置 Active CN105005562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410151752.8A CN105005562B (zh) 2014-04-15 2014-04-15 检索结果的显示处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410151752.8A CN105005562B (zh) 2014-04-15 2014-04-15 检索结果的显示处理方法及装置

Publications (2)

Publication Number Publication Date
CN105005562A CN105005562A (zh) 2015-10-28
CN105005562B true CN105005562B (zh) 2018-09-21

Family

ID=54378238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410151752.8A Active CN105005562B (zh) 2014-04-15 2014-04-15 检索结果的显示处理方法及装置

Country Status (1)

Country Link
CN (1) CN105005562B (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836453A (zh) * 2016-03-17 2021-12-24 创新先进技术有限公司 一种文本展示方法和装置
CN106021404B (zh) * 2016-05-12 2019-09-03 北京北大英华科技有限公司 检索方法
CN107273254B (zh) * 2017-06-16 2021-03-12 苏州浪潮智能科技有限公司 一种在windows下筛选文本的系统和方法
CN110532834B (zh) * 2018-05-24 2022-12-23 北京庖丁科技有限公司 基于富文本格式文档的表格提取方法、装置、设备和介质
CN110929019B (zh) * 2018-08-30 2022-06-10 北京蓝灯鱼智能科技有限公司 信息的展示方法和装置、存储介质、电子装置
CN109299214B (zh) * 2018-11-09 2022-04-08 医渡云(北京)技术有限公司 文本信息提取方法、装置、介质及电子设备
CN109933702B (zh) * 2019-03-11 2022-12-16 智慧芽信息科技(苏州)有限公司 一种检索展示方法、装置、设备及存储介质
CN110110238B (zh) * 2019-03-14 2022-11-25 厦门天锐科技股份有限公司 一种敏感信息展示方法及装置
CN110046243A (zh) * 2019-04-23 2019-07-23 北京恒冠网络数据处理有限公司 一种基于大数据的专利个性化检索分析系统
CN112269869A (zh) * 2019-07-08 2021-01-26 珠海金山办公软件有限公司 一种查询关键词的方法及装置
CN110825283A (zh) * 2019-09-18 2020-02-21 云知声智能科技股份有限公司 一种缺陷文书展示方法及装置
CN113641783A (zh) * 2020-04-27 2021-11-12 北京庖丁科技有限公司 基于关键语句的内容块检索方法、装置、设备和介质
CN114995691B (zh) * 2021-03-01 2024-03-08 北京字跳网络技术有限公司 一种文档处理方法、装置、设备和介质
CN113157869A (zh) * 2021-05-06 2021-07-23 日照蓝鸥信息科技有限公司 一种文档精准定位检索方法及系统
CN113448984B (zh) * 2021-07-15 2024-03-26 中国银行股份有限公司 文档定位展示方法、装置、服务器及电子设备
CN113885743A (zh) * 2021-09-07 2022-01-04 维沃移动通信有限公司 文本内容选取方法和装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1363069A (zh) * 1999-05-20 2002-08-07 伊夫色什有限公司 信息管理、检索和显示系统以及相关方法
CN1871608A (zh) * 2003-10-27 2006-11-29 皇家飞利浦电子股份有限公司 搜索结果的逐屏幕呈现
CN101061479A (zh) * 2004-09-27 2007-10-24 Google公司 基于文档结构的搜索结果的呈现
CN101359330A (zh) * 2008-05-04 2009-02-04 索意互动(北京)信息技术有限公司 内容扩展的方法和系统
CN102023989A (zh) * 2009-09-23 2011-04-20 阿里巴巴集团控股有限公司 一种信息检索方法及其系统
US8145617B1 (en) * 2005-11-18 2012-03-27 Google Inc. Generation of document snippets based on queries and search results
CN102419760A (zh) * 2005-11-15 2012-04-18 谷歌公司 显示紧凑的以及展开的数据项目

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1363069A (zh) * 1999-05-20 2002-08-07 伊夫色什有限公司 信息管理、检索和显示系统以及相关方法
CN1871608A (zh) * 2003-10-27 2006-11-29 皇家飞利浦电子股份有限公司 搜索结果的逐屏幕呈现
CN101061479A (zh) * 2004-09-27 2007-10-24 Google公司 基于文档结构的搜索结果的呈现
CN102419760A (zh) * 2005-11-15 2012-04-18 谷歌公司 显示紧凑的以及展开的数据项目
US8145617B1 (en) * 2005-11-18 2012-03-27 Google Inc. Generation of document snippets based on queries and search results
CN101359330A (zh) * 2008-05-04 2009-02-04 索意互动(北京)信息技术有限公司 内容扩展的方法和系统
CN102023989A (zh) * 2009-09-23 2011-04-20 阿里巴巴集团控股有限公司 一种信息检索方法及其系统

Also Published As

Publication number Publication date
CN105005562A (zh) 2015-10-28

Similar Documents

Publication Publication Date Title
CN105005562B (zh) 检索结果的显示处理方法及装置
US20170286501A1 (en) Data set preview technology
US8683389B1 (en) Method and apparatus for dynamic information visualization
Pospiech et al. Big data–a state-of-the-art
AU2013352541B2 (en) Systems and methods for identifying and visualizing elements of query results
EP2840515A1 (en) Method, device and computer storage media for user preferences information collection
US20140229476A1 (en) System for Information Discovery & Organization
KR101538998B1 (ko) 지식 구조를 기반으로 한 검색 서비스 제공 방법 및 장치
KR101502671B1 (ko) 상관된 정보의 온라인 분석 및 디스플레이
CN107710201A (zh) 存储数据和从位向量搜索索引取回数据
CN106156111B (zh) 专利文件检索方法、装置和系统
JP2020135891A (ja) 検索提案を提供する方法、装置、機器及び媒体
KR101441219B1 (ko) 정보 엔터티들의 자동 연관
JP5494493B2 (ja) 情報検索装置、情報検索方法、及びプログラム
Cuenca et al. VERTIGo: A visual platform for querying and exploring large multilayer networks
CN111428120B (zh) 一种信息确定方法、装置、电子设备及存储介质
JP6234978B2 (ja) 情報処理装置、情報処理システム、およびプログラム
JP6275758B2 (ja) 情報処理システム、情報処理方法、およびプログラム
Karimzadehgan et al. A learning approach to optimizing exploration–exploitation tradeoff in relevance feedback
Huang et al. Rough-set-based approach to manufacturing process document retrieval
CN109213830A (zh) 专业性技术文档的文档检索系统
Khan et al. Model-based diversification for sequential exploratory queries
JP2005056081A (ja) 文書管理装置及び記録媒体
JP6325502B2 (ja) 情報処理装置、情報処理システムおよび情報処理方法
Khan Scalable diversification for data exploration platforms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant