CN106547917A - 一种信息处理方法及电子设备 - Google Patents

一种信息处理方法及电子设备 Download PDF

Info

Publication number
CN106547917A
CN106547917A CN201611078499.3A CN201611078499A CN106547917A CN 106547917 A CN106547917 A CN 106547917A CN 201611078499 A CN201611078499 A CN 201611078499A CN 106547917 A CN106547917 A CN 106547917A
Authority
CN
China
Prior art keywords
information
association
degree
spacing
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201611078499.3A
Other languages
English (en)
Inventor
吴凯峰
王全喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baoding Dawei Computer Software Development Co ltd
State Grid Corp of China SGCC
State Grid Information and Telecommunication Co Ltd
Original Assignee
BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co Ltd
State Grid Information and Telecommunication Co Ltd
Beijing China Power Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co Ltd, State Grid Information and Telecommunication Co Ltd, Beijing China Power Information Technology Co Ltd filed Critical BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co Ltd
Priority to CN201611078499.3A priority Critical patent/CN106547917A/zh
Publication of CN106547917A publication Critical patent/CN106547917A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries

Abstract

本发明公开了一种信息处理方法及电子设备,所述信息处理方法包括:获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。本发明提供的上述方法,解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。

Description

一种信息处理方法及电子设备
技术领域
本发明涉及电子技术领域,特别涉及一种信息处理方法及电子设备。
背景技术
随着科技的迅速发展,随着信息处理技术发展,丰富多样的信息充斥着人们的生活,为人们的生活带来了极大的便利。在用户从对各种各样的信息处筛选出想要的信息时,需要输入信息进行检索。在检索系统中,检索结果与用户输入的检索词密切相关,但现有技术中检索存在着漏检的可能性,例如:输入关键词A能够找到用户预期的结果,而当输入关键词B,即使关键词A和关键词B很近似,也可能找不到用户想要的结果。会造成用户的困扰,特别是对于专业检索人员,例如:技术查新,论文查新,专利查新等,漏检可能会带来非常严重的后果。目前的一些检索系统,例如搜索引擎,当用户输入一个词后,具有关键词推荐功能,其策略包括:输入拼音推荐汉字;输入关键词的局部后,推荐搜索次数最多(最热)的词;输入错别字后推荐正确的文字。现有技术仅限于减少用户的输入次数,检查用户的输入、发现输入的错误,不能有效的进行扩展和限定以影响检索结果,不能有效地提高检索效率。可见,现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。
发明内容
本发明实施例提供一种信息处理方法及电子设备,用于解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。
本发明实施例一方面提供了一种信息处理方法,包括:
获得用户输入的待检索的第一信息;
基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
可选的,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
可选的,在获得用户输入的待检索的第一信息之前,所述方法还包括:
对所述数据库中信息进行分解,获得分解后的信息;
确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
可选的,所述确定所述分解后的任意两个信息间的关联度,具体包括:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
可选的,所述确定所述去除无用信息后的信息中任意两个信息间的关联度,具体包括:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
可选的,所述基于所述词间距,确定所述第三信息与所述第四信息的关联度,具体包括:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
可选的,所述输出所述第二信息,具体包括:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
本发明实施例另一方面提供一种电子设备,包括:
存储单元,用于存储至少一个程序模块;
至少一个处理器,所述至少一个处理器通过获得并运行所述至少一个程序模块,用于获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
可选的,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
可选的,所述至少一个处理器还用于:
在获得用户输入的待检索的第一信息之前,对所述数据库中信息进行分解,获得分解后的信息;确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
可选的,所述至少一个处理器还用于:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
可选的,所述至少一个处理器还用于:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
可选的,所述至少一个处理器还用于:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
可选的,所述至少一个处理器还用于:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
本发明实施例另一方面提供一种电子设备,包括:
第一获取单元,用于获得用户输入的待检索的第一信息;
第二获取单元,用于基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
第一输出单元,用于输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:
1、由于在本申请实施例中的技术方案中,采用了获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索的技术手段。这样,在用户进行信息检索时,电子设备能够根据用户输入的信息,为用户推荐与该信息相关联的其它信息供用户进行检索,并且,由于关联信息是基于数据库统计获得的,与用户输入的信息相关性强,用户同时选择关联信息进行检索时,能够检索出用户期望的结果,减少了漏检的可能性。所以,能有效解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。实现检索方式更加精确,更满足用户需求的技术效果。
2、由于在本申请实施例中的技术方案中,采用了基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果的技术手段。这样,用户在检索信息时,可以对需要检索的信息进行扩展或者限制,提高了检索的效率,并且有效确保了检索结果的精度。
附图说明
为了更清楚地说明本申请实施例或现有技术方案中的技术方案,下面对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1为本申请实施例一中信息处理方法的流程图;
图2为本申请实施例一中第二信息输出方式示意图;
图3为本申请实施例二中一种电子设备的结构图;
图4为本申请实施例三中一种电子设备的结构图。
具体实施方式
本发明实施例提供一种信息处理方法及电子设备,用于解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。
为解决上述的技术问题,本发明实施例提供一种信息处理方法,总体思路如下:
获得用户输入的待检索的第一信息;
基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
这样,在用户进行信息检索时,电子设备能够根据用户输入的信息,为用户推荐与该信息相关联的其它信息供用户进行检索,并且,由于关联信息是基于数据库统计获得的,与用户输入的信息相关性强,用户同时选择关联信息进行检索时,能够检索出用户期望的结果,减少了漏检的可能性。所以,能有效解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。实现检索方式更加精确,更满足用户需求的技术效果。
下面结合附图对本申请实施例技术方案的主要实现原理、具体实施方式及其对应能够达到的有益效果进行详细的阐述。
实施例一
在具体实施过程中,该信息处理方法可应用于电子设备中,所述电子设备可以是服务器、电脑、手机等电子设备,也可以是别的电子设备,在此,就不一一举例了。
请参考图1,本发明实施例提供一种信息处理方法,包括:
S101:获得用户输入的待检索的第一信息;
S102:基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
S103:输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索;
其中,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
具体的,在本实施例,用户需要在一数据库中进行信息检索时,首先需要输入待检索的信息。进而,电子设备在确定待检索的信息后,会基于该待检索的信息为用户推荐其它的与之相关联的信息供用户选择,与待检索的信息相关联的信息是基于数据库统计出来的,更能够真实地反应与待检索信息之间的相关性,因此,在用户利用与待检索信息对应的关联信息进行信息检索时,能够进一步确保检索出用户想要的结果。当然,为用户推荐的与待检索信息相关的信息还包括预先设定的信息,预先设定的信息可以包括是待检索信息对应的同义词、反义词等信息,当然,还可以是其它信息,在此,本申请不做限定。
比如:进行专利文献检索的专业技术人员,需要在专利数据库中检索出相关领域的对比文件,在专利检索系统中输入待检索信息。电子设备可预先对专利数据库中的专利文献中的信息进行处理,按预设的策略确定信息与信息间的关联性。进而,专业人员在检索A信息时,能够基于信息与信息间的关联性,确定为该专业人员推荐的与A信息存在关联性的B信息、C信息以及与A信息预先设置的存在预设关系的D信息等,电子设备输出该B信息、C信息供该专业人员选择,专业人员可以选择B信息、C信息、D信息中的全部或部分与A信息进行组合后检索,为专业人员提供了扩展的检索内容,使得检索出的专利文献能够更准确,更加满足专业人员的检索需求。
通过上述这样的方式,在用户进行信息检索时,电子设备能够根据用户输入的信息,为用户推荐与该信息相关联的其它信息供用户进行检索,并且,由于关联信息是基于数据库真实数据统计获得的,即通过文献数据进行统计获得,而不是基于多数用户的检索内容获得,与用户输入的信息相关性强,用户同时选择关联信息进行检索时,能够检索出用户期望的结果,减少了漏检的可能性。所以,能有效解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。实现检索方式更加精确,更满足用户需求的技术效果。
进一步,为了确定信息与信息间的关联性,本实施例中的信息处理方法在步骤:获得用户输入的待检索的第一信息之前,还包括如下步骤:
对所述数据库中信息进行分解,获得分解后的信息;
确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
其中,所述确定所述分解后的任意两个信息间的关联度,具体包括:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
其中,所述确定所述去除无用信息后的信息中任意两个信息间的关联度,具体包括:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
具体的,在本实施例中,需要统计数据库中各个样本中各个信息间的关联度。可以依次对数据库中的每一个样本中的信息进行处理,对样本中每一个自然句进行词的拆分,分解为多个单词。进而对分解后的单词进行处理,去除掉无用的单词。具体的,电子设备中预设有一无用单词库,里面包含了预先设定的无用的单词,比如:所述、基于、第一、第二、等等。无用单词库中预设的单词可根据实际需要进行设定,在此,本申请不作限定。进而,在对句子进行拆分后,判断获得的单词中是否包含无用单词库的单词,进而去除掉该句子中包含的无用单词。
或者,在对句子进行拆分后,对拆分后的单词进行词性的分析,获得每个词的词性,进而去除掉预设词性的单词,比如:去除掉语助词、停用词等词性的单词。在具体实施过程中,去除无用信息的方式可根据实际需要进行设定,在此,本申请不作限定。
进而,在确定信息间的关联度时,仅对去除无用信息后的信息进行确定,有效降低了信息处理量。在确定去除无用信息后的任意两个信息的关联度时,可通过词间距来确定两个信息间的关联度。比如:确定任意的两个词A与词B在一个样本中同时出现在同一句或同一自然段时词A与词B间的词间距。电子设备判断词A与词B是否小于预设词间距,如果小于预设词间距,则确定词A与词B间存在相关性,进而,根据词A与词B间的词间距来定义词A与词B间的关联度。如:当预设词间距为5时,当确定出的词A与词B间的词间距为1时,由于词A与词B间的词间距小于预设词间距5,表明词A与词B存在相关性,定义词A与词B间的关联度为0.8。当确定出的词A与词B间的词间距为2时,由于词A与词B间的词间距小于预设词间距5,表明词A与词B存在相关性,定义词A与词B间的关联度为0.6。当确定出的词A与词B间的词间距为8时,由于词A与词B间的词间距大于预设词间距5,表明词A与词B不存在相关性。进而,当词A与词B每同时出现一次,即可获得词A与词B在该次在该样本中对应的关联度,这样可以获得词A与词B在数据库中所有样本中的关联度,进而通过关联度求和取平均的方式来确定词A与词B在数据库中的关联度。通过这样的方式,可以定义数据库中任意两个信息间的关联度,进而,在为用户推荐关联信息时,可将关联度较高的信息推荐给用户选择。
进一步,为了更精确地确定信息间的关联度,步骤:基于所述词间距,确定所述第三信息与所述第四信息的关联度,在具体实施过程中还可以包括如下步骤:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
具体的,在本实施例中,还可以依次对数据库中的每一个样本中的词进行处理,通过词间距与信息同时出现的次数来确定两个信息间的关联度。比如:在数据库的一个样本里,词A与词B在一个自然段里同时出现3次,第一次出现时词A与词B间的词间距为4,第二次出现时词A与词B间的词间距为8,第三次出现时词A与词B间的词间距为2。当预设词间距为5时,可以确定词A与词B在该样本中按小于预设词间距出现2次,进而,可求得词A与词B在数据库中所有样本中按小于预设词间距出现的次数。即:将词A与词B出现在数据库中每一个样本中的次数相加即可获得。进而,当词与词间在数据库中按小于预设词间距出现的次数越大,则这两个词间的关联度越大。通过这样的方式,可以定义数据库中任意两个信息间的关联度。进而,在为用户推荐关联信息时,可将关联度较高的信息推荐给用户选择。当然,在具体实施过程中,还可以采用其他方式来确定任意两个信息间的关联度,在此,本申请不做限定。
进一步,在本实施例中,步骤:输出所述第二信息,在具体实施过程中可通过如下步骤实现:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
具体的,在本实施例中,电子设备在确定为用户推荐的第二信息后,可基于第二信息确定出供用户选择的限定信息和/或扩展信息,进而输出限定信息和/或扩展信息。如示意图2所示,当用户输入待检索信息“发烧”时,可获得预设的与“发烧”的同义词“发热”,以及基于数据库统计出来的与“发烧”相关联的词为“着凉”、“高烧”、“体温”、“患者”、“病理”。电子设备可以从这些词中确定出扩展信息与限定信息,其中,扩展信息可以是“发热”、“着凉”、“高烧”,限定信息可以是“体温”、“患者”、“病理”。当用户选择扩展信息为“着凉”,选择的限定信息为“体温”时,表明检索结果中必须包含用户输入的待检索信息“发烧”和限定信息“体温”,可包括扩展信息“体温”。通过这样的方式,推荐待检索信息的关联信息进行扩展检索,有效地降低了漏检的可能。并且,通过推荐限定信息的方式,可以避免检索结果过多,减少检索次数,提高了检索的效率。用户输入待检索信息后,输出的与待检索信息相关的信息具有提醒、提示、启发用户的功能,更好地满足了用户的需求。
实施例二
请参考图3,基于与实施例一中信息处理方法同样的发明构思,本申请实施例还提供一种电子设备,包括:
存储单元301,用于存储至少一个程序模块;
至少一个处理器302,所述至少一个处理器通过获得并运行所述至少一个程序模块,用于用于获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
可选的,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
可选的,所述至少一个处理器还用于:
在获得用户输入的待检索的第一信息之前,对所述数据库中信息进行分解,获得分解后的信息;确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
可选的,所述至少一个处理器还用于:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
可选的,所述至少一个处理器还用于:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
可选的,所述至少一个处理器还用于:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
可选的,所述至少一个处理器还用于:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
实施例三
请参考图4,基于与实施例一中信息处理方法同样的发明构思,本申请实施例还提供一种电子设备,包括:
第一获取单元401,用于获得用户输入的待检索的第一信息;
第二获取单元402,用于基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
第一输出单元403,用于输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
可选的,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
可选的,所述电子设备还包括:
第一分解单元,用于对所述数据库中信息进行分解,获得分解后的信息;
第一确定单元,用于确定所述分解后的任意两个信息间的关联度;
第二确定单元,用于基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
可选的,所述第一确定单元具体包括:
第一获取模块,用于对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
第一确定模块,用于确定所述去除无用信息后的信息中任意两个信息间的关联度。
可选的,所述第一确定单元还包括:
第一确定模块,用于确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
第一判断模块,用于判断所述词间距是否小于预设词间距;
第二确定模块,用于如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
可选的,所述第二确定模块具体包括:
第一获取子单元,用于获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
第一确定子单元,用于基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
可选的,所述第一输出单元具体包括:
第三确定模块,用于基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
第一输出模块,用于输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
通过本申请实施例中的一个或多个技术方案,可以实现如下一个或多个技术效果:
1、由于在本申请实施例中的技术方案中,采用了获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索的技术手段。这样,在用户进行信息检索时,电子设备能够根据用户输入的信息,为用户推荐与该信息相关联的其它信息供用户进行检索,并且,由于关联信息是基于数据库统计获得的,与用户输入的信息相关性强,用户同时选择关联信息进行检索时,能够检索出用户期望的结果,减少了漏检的可能性。所以,能有效解决现有技术中存在信息检索方式效率低,容易出现漏检的技术问题。实现检索方式更加精确,更满足用户需求的技术效果。
2、由于在本申请实施例中的技术方案中,采用了基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果的技术手段。这样,用户在检索信息时,可以对需要检索的信息进行扩展或者限制,提高了检索的效率,并且有效确保了检索结果的精度。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
具体来讲,本申请实施例中的信息处理方法对应的计算机程序指令可以被存储在光盘,硬盘,U盘等存储介质上,当存储介质中的与信息处理方法对应的计算机程序指令被电子设备读取或被执行时,包括如下步骤:
获得用户输入的待检索的第一信息;
基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
可选的,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
可选的,所述存储介质中还存储有另外一些计算机程序指令,该另外一些计算机程序指令执行过程中包括如下步骤:
对所述数据库中信息进行分解,获得分解后的信息;
确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
可选的,所述存储介质中存储的与步骤:确定所述分解后的任意两个信息间的关联度对应的计算机程序指令在被执行时,具体包括如下步骤:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
可选的,所述存储介质中存储的与步骤:确定所述去除无用信息后的信息中任意两个信息间的关联度对应的计算机程序指令在被执行时,具体包括如下步骤:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
可选的,所述存储介质中存储的与步骤:基于所述词间距,确定所述第三信息与所述第四信息的关联度对应的计算机程序指令在被执行时,具体包括如下步骤:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
可选的,所述存储介质中存储的与步骤:输出所述第二信息对应的计算机程序指令在被执行时,具体包括如下步骤:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (15)

1.一种信息处理方法,包括:
获得用户输入的待检索的第一信息;
基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
2.如权利要求1所述的方法,其特征在于,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
3.如权利要求1所述的方法,其特征在于,在获得用户输入的待检索的第一信息之前,所述方法还包括:
对所述数据库中信息进行分解,获得分解后的信息;
确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
4.如权利要求3所述的方法,其特征在于,所述确定所述分解后的任意两个信息间的关联度,具体包括:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
5.如权利要求4所述的方法,其特征在于,所述确定所述去除无用信息后的信息中任意两个信息间的关联度,具体包括:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
6.如权利要求5所述的方法,其特征在于,所述基于所述词间距,确定所述第三信息与所述第四信息的关联度,具体包括:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
7.如权利要求1-6中任一权利要求所述的方法,其特征在于,所述输出所述第二信息,具体包括:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
8.一种电子设备,包括:
存储单元,用于存储至少一个程序模块;
至少一个处理器,所述至少一个处理器通过获得并运行所述至少一个程序模块,用于获得用户输入的待检索的第一信息;基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
9.如权利要求8所述的电子设备,其特征在于,所述第二信息还包括预先设定的与所述第一信息存在预设关系的预设信息。
10.如权利要求8所述的电子设备,其特征在于,所述至少一个处理器还用于:
在获得用户输入的待检索的第一信息之前,对所述数据库中信息进行分解,获得分解后的信息;
确定所述分解后的任意两个信息间的关联度;
基于所述数据库中任意两个信息间的关联度,确定所述数据库中每个信息对应的关联信息。
11.如权利要求10所述的电子设备,其特征在于,所述至少一个处理器还用于:
对所述分解后的信息处理,去除无用信息,获得去除无用信息后的信息;
确定所述去除无用信息后的信息中任意两个信息间的关联度。
12.如权利要求11所述的电子设备,其特征在于,所述至少一个处理器还用于:
确定所述去除无用信息后的信息中任意的第三信息与第四信息间的词间距;
判断所述词间距是否小于预设词间距;
如果是,确定所述第三信息与所述第四信息存在相关性,基于所述词间距,确定所述第三信息与所述第四信息的关联度;其中,在所述词间距越小时,所述第三信息与所述第四信息的关联度越高。
13.如权利要求12所述的电子设备,其特征在于,所述至少一个处理器还用于:
获得所述第三信息与所述第四信息在所述数据库中按小于所述预设词间距出现的次数;
基于所述次数,确定所述第三信息与所述第四信息的关联度;其中,在所述次数越大时,所述第三信息与所述第四信息的关联度越高。
14.如权利要求8-13中任一权利要求所述的电子设备,其特征在于,所述至少一个处理器还用于:
基于所述第二信息,确定检索时供所述用户选择的限定信息和/或扩展信息;
输出所述限定信息和/或所述扩展信息;其中,当所述用户选择限定信息时,检索结果为包含所述第一信息与所述限定信息的结果;当所述用户选择扩展信息时,检索结果为包含所述第一信息或所述限定信息的结果。
15.一种电子设备,包括:
第一获取单元,用于获得用户输入的待检索的第一信息;
第二获取单元,用于基于所述第一信息,获得与所述第一信息对应的第二信息;其中,所述第二信息至少包括基于数据库统计的与所述第一信息相关联的关联信息,所述数据库包括至少一篇文献数据;
第一输出单元,用于输出所述第二信息,以使得所述用户能够选择所述第二信息中的全部或部分信息进行检索。
CN201611078499.3A 2016-11-29 2016-11-29 一种信息处理方法及电子设备 Pending CN106547917A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611078499.3A CN106547917A (zh) 2016-11-29 2016-11-29 一种信息处理方法及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611078499.3A CN106547917A (zh) 2016-11-29 2016-11-29 一种信息处理方法及电子设备

Publications (1)

Publication Number Publication Date
CN106547917A true CN106547917A (zh) 2017-03-29

Family

ID=58396511

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611078499.3A Pending CN106547917A (zh) 2016-11-29 2016-11-29 一种信息处理方法及电子设备

Country Status (1)

Country Link
CN (1) CN106547917A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117435A (zh) * 2017-06-22 2019-01-01 索意互动(北京)信息技术有限公司 一种客户端、服务器、检索方法及其系统
CN111651580A (zh) * 2020-06-04 2020-09-11 天启黑马信息科技(北京)有限公司 一种用于文献检索的方法与设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1918571A (zh) * 2004-10-29 2007-02-21 松下电器产业株式会社 信息检索装置
CN101246492A (zh) * 2008-02-26 2008-08-20 华中科技大学 基于自然语言的全文检索系统
CN101539916A (zh) * 2008-03-17 2009-09-23 亿维讯软件(北京)有限公司 初次专利检索装置、二次专利检索装置和专利检索系统
CN102053977A (zh) * 2009-11-04 2011-05-11 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN103473283A (zh) * 2013-08-29 2013-12-25 中国测绘科学研究院 一种文本案例匹配方法
CN104239300A (zh) * 2013-06-06 2014-12-24 富士通株式会社 从文本中挖掘语义关键词的方法和设备
CN104516902A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 语义信息获取方法及其对应的关键词扩展方法和检索方法
CN105279270A (zh) * 2015-10-28 2016-01-27 丽水市睿鼎知识产权咨询有限公司 一种专利检索装置及其检索方法
CN105956206A (zh) * 2016-07-04 2016-09-21 Tcl集团股份有限公司 一种基于关键词树的视频检索方法及系统
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN106095912A (zh) * 2016-06-08 2016-11-09 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1918571A (zh) * 2004-10-29 2007-02-21 松下电器产业株式会社 信息检索装置
CN101246492A (zh) * 2008-02-26 2008-08-20 华中科技大学 基于自然语言的全文检索系统
CN101539916A (zh) * 2008-03-17 2009-09-23 亿维讯软件(北京)有限公司 初次专利检索装置、二次专利检索装置和专利检索系统
CN102053977A (zh) * 2009-11-04 2011-05-11 阿里巴巴集团控股有限公司 一种搜索结果生成方法及信息搜索系统
CN103425687A (zh) * 2012-05-21 2013-12-04 阿里巴巴集团控股有限公司 一种基于关键词的检索方法和系统
CN104239300A (zh) * 2013-06-06 2014-12-24 富士通株式会社 从文本中挖掘语义关键词的方法和设备
CN103473283A (zh) * 2013-08-29 2013-12-25 中国测绘科学研究院 一种文本案例匹配方法
CN104516902A (zh) * 2013-09-29 2015-04-15 北大方正集团有限公司 语义信息获取方法及其对应的关键词扩展方法和检索方法
CN105279270A (zh) * 2015-10-28 2016-01-27 丽水市睿鼎知识产权咨询有限公司 一种专利检索装置及其检索方法
CN106055540A (zh) * 2016-06-01 2016-10-26 比美特医护在线(北京)科技有限公司 一种数据处理方法及装置
CN106095912A (zh) * 2016-06-08 2016-11-09 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置
CN105956206A (zh) * 2016-07-04 2016-09-21 Tcl集团股份有限公司 一种基于关键词树的视频检索方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109117435A (zh) * 2017-06-22 2019-01-01 索意互动(北京)信息技术有限公司 一种客户端、服务器、检索方法及其系统
CN111651580A (zh) * 2020-06-04 2020-09-11 天启黑马信息科技(北京)有限公司 一种用于文献检索的方法与设备

Similar Documents

Publication Publication Date Title
CN103577558B (zh) 一种优化问答对的搜索排名的装置和方法
US20110302168A1 (en) Graphical models for representing text documents for computer analysis
EP2801917A1 (en) Method, apparatus, and computer storage medium for automatically adding tags to document
Luo et al. Summarizing student responses to reflection prompts
Abdi et al. A question answering system in hadith using linguistic knowledge
US20120124467A1 (en) Method for automatically generating descriptive headings for a text element
Hanum et al. Using topic analysis for querying halal information on Malay documents
JP5718405B2 (ja) 発話選択装置、方法、及びプログラム、対話装置及び方法
US20140289260A1 (en) Keyword Determination
WO2014201833A1 (en) Method and device for processing data
CN106547917A (zh) 一种信息处理方法及电子设备
JP2018517968A (ja) 文書コーパスから概念を生成するためのシステム及び方法
Perea-Ortega et al. Application of text summarization techniques to the geographical information retrieval task
CN102016782A (zh) 操作支援装置以及操作支援方法
CN110263312B (zh) 文章生成方法、装置、服务器和计算机可读介质
Kim et al. Design of question answering system with automated question generation
JP6188222B2 (ja) トピック抽出装置、及びプログラム
CN108920610B (zh) 一种小说索引方法及设备
CN108415959B (zh) 一种文本分类方法及装置
JP2009265770A (ja) 重要文提示システム
CN113032436B (zh) 基于文章内容和标题的搜索方法和装置
JPH06215035A (ja) テキスト検索装置
JP2009122337A (ja) クイズ問題作成装置
Karsdorp et al. The love equation: Computational modeling of romantic relationships in french classical drama
Schmidt et al. A concept for plagiarism detection based on compressed bitmaps

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20170327

Address after: 100761 Beijing Xicheng District city two, Baiguang Road

Applicant after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant after: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Applicant after: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

Applicant after: State Grid Corporation of China

Address before: 100761 Beijing Xicheng District city two, Baiguang Road

Applicant before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant before: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Applicant before: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100761 Beijing Xicheng District city two, Baiguang Road

Applicant after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant after: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Applicant after: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

Applicant after: STATE GRID CORPORATION OF CHINA

Address before: 100761 Beijing Xicheng District city two, Baiguang Road

Applicant before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant before: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Applicant before: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

Applicant before: State Grid Corporation of China

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20190729

Address after: 100033 West Chang'an Avenue, Beijing, No. 86, No.

Applicant after: STATE GRID CORPORATION OF CHINA

Applicant after: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant after: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

Address before: 100761 Beijing Xicheng District city two, Baiguang Road

Applicant before: STATE GRID INFORMATION & TELECOMMUNICATION GROUP Co.,Ltd.

Applicant before: BEIJING CHINA POWER INFORMATION TECHNOLOGY Co.,Ltd.

Applicant before: BAODING DAWEI COMPUTER SOFTWARE DEVELOPMENT Co.,Ltd.

Applicant before: STATE GRID CORPORATION OF CHINA

WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170329