CN110765233A - 基于深度挖掘和知识管理技术的智能信息检索服务系统 - Google Patents

基于深度挖掘和知识管理技术的智能信息检索服务系统 Download PDF

Info

Publication number
CN110765233A
CN110765233A CN201911094385.1A CN201911094385A CN110765233A CN 110765233 A CN110765233 A CN 110765233A CN 201911094385 A CN201911094385 A CN 201911094385A CN 110765233 A CN110765233 A CN 110765233A
Authority
CN
China
Prior art keywords
retrieval
information
knowledge
classification
theme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911094385.1A
Other languages
English (en)
Inventor
王伟
程永军
李兵
林旺群
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Evaluation Argument Research Center Academy Of Military Sciences Pla China
Original Assignee
Evaluation Argument Research Center Academy Of Military Sciences Pla China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Evaluation Argument Research Center Academy Of Military Sciences Pla China filed Critical Evaluation Argument Research Center Academy Of Military Sciences Pla China
Priority to CN201911094385.1A priority Critical patent/CN110765233A/zh
Publication of CN110765233A publication Critical patent/CN110765233A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/38Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/387Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了基于深度挖掘和知识管理技术的智能信息检索服务系统,该系统包括:主题提取单元,实现检索主体的构建、提取、反馈学习完善;信息分类单元,实现不同主题的分类管理;知识关联展示单元,为知识信息的关联提供展示及分类关联支持;检索输入单元,设定输入的不同检索词和逻辑关系,利用前述构建的主题提取单元、信息分类单元实现检索分析过程;检索结果组织和输出单元:对检索结果输出。本申请的信息检索服务系统通过专家及专题知识对数据资源整合与动态关联,充分挖掘和利用资源间的语义关系,最大程度优化资源搜索粒度和深度,使系统在支持原数据存储、访问等功能的基础上,实现关联知识的智能检索、延伸阅读与动态展示等强化功能。

Description

基于深度挖掘和知识管理技术的智能信息检索服务系统
技术领域
本发明属于信息挖掘、管理、检索、分析领域,其主要针对信息网络中的各类数据进行进行深入处理和检索,其具体为一种基于深度挖掘和知识管理技术的智能信息检索服务系统。
背景技术
信息检索系统(Information Retrieval System)是指根据特定的信息需求而建立起来的一种有关信息搜集、加工、存储和检索的程序化系统,其主要目的是为人们提供信息服务。所以可以说任何具有信息存储与信息检索功能的系统都可以称为信息检索系统。信息检索系统可以理解为一种可以向用户提供信息检索服务的系统。
信息检索工具的发展从无到有,经历了手工、自动化、计算机检索,计算机网络检索4个主要阶段。(1)手工阶段,所谓手工检索工具,信息载体基本上是以纸质为主,其工具本身是某类形式的印刷出版物,以手工进行查阅,从而得到所需的文献。这种方式经历了相当长的历史时期,大约有2000多年的时间,虽然后期出现了缩微(胶片)型的检索工具,但基本上还是通过手工来完成检索任务手工检索工具种类繁多,功能也比较齐全,各种文摘、题录、书目、索引等都属于手工检索工具。(2)自动化阶段,随着科学技术的发展,文献量随之增长,特别是到了20世纪三四十年代,自然科学的发展进入了一个前所未有的历史时期,老的学科得到了迅速发展,同时涌现出了很多新的学科,出版的刊物也随之大量增加,文献量急剧增长,依靠原有的手工检索方法往往要花去大量的时间,还不一定得到满意的检索效果。为了提高检索效率,人们开始利用光电技术、机械技术,设计制造了检索工具。但这种检索工具还没有广泛地推开,就被计算机检索系统所代替了。(3)计算机检索阶段,以计算机技术为主的现代信息技术的发展是计算机信息检索进步的基础。1946年第一台电子计算机诞生以后不久,就将其用于了信息检索,开创了现代信息检索的先河。自那以后,出现了一系列信息存储与检索的新理论和新方法,已经逐渐成为一门独立的科学分支。(4)计算机网络检索,随着网络技术的发展,更多的信息数据都弥漫在互联网上,从而信息的检索方式从单一的数据库转换为网络数据库中的检索,从而信息检索和存储进入到了网络联机检索阶段。
随着大数据分析、挖掘技术的发展,在信息检索和分析领域如何利用该技术实现信息的深度分析和管理是信息检索方向发展的重要领域,本申请发明人结合相关技术开发了一套高效智能信息检索服务系统。
发明内容
本申请的发明目的在于将现有的主题题知识对数据资源进行有效整合与动态关联,优化资源搜索粒度和深度,从而实现原有数据存储、访问的基础上,进一步达到关联知识的智能检索、延伸阅读与动态展示等强化功能,从而为用户提供更为准确和智能的信息资源检索查询帮助。
为了实现上述目的,本发明提供基于深度挖掘和知识管理技术的智能信息检索服务系统,该系统包括如下单元:主题提取单元,实现检索主体的构建、提取、反馈学习完善;信息分类单元,该单元实现不同主题的分类管理;知识关联展示单元:为知识信息的关联提供展示及分类关联支持;检索输入单元:该单元通过设定输入的不同检索词和逻辑关系,利用前述构建的主题提取单元、信息分类单元实现检索分析过程;检索结果组织和输出单元:该单元对检索结果进行输出。本申请上述各个组成单元构成了整个系统有机整体,每个单元实现不同的功能和作用,通过检索过程将各个单元之间的功能实现关联,从而达到最终的检索分析效果。
上述主题提取单元包括:专题主题关键词库构建模块,该模块根据不同专题的主题、内容及指标特征属性,通过各个领域专家或互联网搜索关键字的排序方法,针对不同行业部门常用的主题信息内容,搜集和整理主题相关的关键词汇,构建各个专题主题的关键词库;主题关键词提取模块,对各专题文本进行摘要及关键字提取,同时将该文档归类到相应的主题类别下,并结合主题关键词库中的主题关键词特征,过滤和提炼主题相关的重要关键词;主题词的反馈和学习模块,该模块根据主题关键词提取模块的结果,结合用户对结果的满意程度及用户自身检索的主题关键词,自动形成主题词的样本示例库,通过主题关键词样本库的测试,采用机器学习算法设计实现主题词库更新,从而达到及时修正和补充各专题主题的特征关键词,完善专题主题关键词库,提高主题关键词提取的准确率;热点词构建提取模块,通过记录登录用户的搜索痕迹,阶段性地统计近期发布的新闻、报道等热点事件及用户检索的热点词汇与资料等信息,返回某段时间内系统的热点词汇,形成该时间段内的系统热点词汇集合,构建相应的热点词汇库。上述主题提取单元的模块构成能够有效建立不同主题的提取和数据库的重建,并通过机器学习的方式实现主题提取过程的自我更新和升级,更好满足了检索过程中主题更新和升级要求。
上述热点词构建提取模块在进行热点词汇库的构建中采用了机器学习方法自动进行热点词汇的更新和汇总。本申请将机器学习的算法融入词汇更新和汇总中,保证了数据库主题的同步性,实现了检索主题的智能化。
上述所述信息分类单元包括:知识信息分类体系构建模块,该模块通过梳理不同知识信息的主题,构架不同类型知识信息的指标因子,并利用该指标因子进行相互之间的关联,实现统一的体系构建;知识信息文档分类模块,该模块自动提取信息文档属性信息,将其划分至知识信息分类体系构建模块的各个分类节点/栏目中;知识信息分类自学习模块,该模块通过用户对分类结果的评价形成分类样本集合,通过自学习算法对分类模块的分类规则进行调整,提高知识信息分类的准确性。上述信息分类单元的各个模块通过机器自学习算法将拨通主题的信息和稳定实现了有效的分类和组合,不仅能提高检索过程中的准确性和高效性,而且为检索完成后的分析提供了技术逻辑框架上的保证。
上述信息分类单元的知识信息文档分类模块所自动提取信息文档属性信息包括:主题类型、内容特征、主体/客体对象信息。利用上述文档属性信息进行文档分类在分类准确性、效率上实现了提升。
所述知识关联展示单元包括:知识地图展示模块,该模块利用图形化界面表达方式,针对知识分类/栏目之间包含、具备的关联关系以图形化方式进行展示,方便用户查看、识别;智能推荐模块,该模块根据用户日常查询和关注信息类型及其搜索的时间区间,利用知识库中不同知识类别之间的关联关系,对用户可能感兴趣的其他相关分类进行智能推荐;检索结果的分类显示模块,该模块利用信息分类单元所构建的关联关系,对用户搜索的结果进行有序排列和显示。上述知识关联展示单元中的各个模块,根据用户输入的检索信息,结合信息分类进行知识之间的关联,在完成相关信息的关联后将关联结果给予用户展示,这种关联、展示的方式更有利于用户对信息的全面分析和了解,提高了用户对知识知晓的广泛度。
上述检索输入单元的检索词逻辑关系包括多字段之间或多字段内与、或、非、异或逻辑关系;其检索方式包括:时间范围检索,指定资源库检索,文件格式定制检索及结果二次检索。上述不同检索方式的综合使用和选择,可以提高用户检索入口的灵活度,实现为有效的不同信息组合式检索。
上述检索输入单元还包括热门信息检索,热门信息检索排行及热门短语维护。热门信息的检索设置,适应了技术和时代发展的需要,保证了检索与潮流的同步性。
上述检索结果组织和输出单元实现了推荐词相关搜索、主题分类统计、关联电子地图、关联专题、展示相关专题链接及自动排序。该输出方式保证了检索界面对用户使用的友好度,更便于用户直观了解检索结果和关联关系。
本发明所采用的技术方案实现了专家及专题知识对数据资源的有效整合与动态关联,充分挖掘和利用资源之间的语义关系,最大程度优化资源搜索粒度和深度,使检索系统在支持原始数据存储、访问等功能的基础上,还能够实现关联知识的智能检索、延伸阅读与动态展示的强化功能。利用应用支撑平台中跨库检索引擎来建设相关资源信息检索系统,不仅实现在已有系统中各类信息资源的统一检索,还为用户提供了信息资源检索查询帮助。通过对系统中数据的抽取,建立索引,建设综合信息资源数据库,为方便统一检索提供了数据依据。,
附图说明
图1为本发明的信息检索服务系统实现检索分析过程的流程示意图。
具体实施方式
以下结合实施例对本发明作出进一步的说明。本发明申请所提出的基于深度挖掘和知识管理技术的智能信息检索服务系统方案包括如下单元:
主题提取单元:实现检索主体的构建、提取、反馈学习完善;该单元包括专题主题关键词库构建模块,该模块根据不同专题的主题、内容及指标特征属性,通过各个领域专家或互联网搜索关键字的排序方法,针对不同行业部门常用的主题信息内容,搜集和整理主题相关的关键词汇,构建各个专题主题的关键词库;主题关键词提取模块,对各专题文本进行摘要及关键字提取,同时将该文档归类到相应的主题类别下,并结合主题关键词库中的主题关键词特征,过滤和提炼主题相关的重要关键词;主题词的反馈和学习模块,该模块根据主题关键词提取模块的结果,结合用户对结果的满意程度及用户自身检索的主题关键词,自动形成主题词的样本示例库,通过主题关键词样本库的测试,采用机器学习算法设计实现主题词库更新,从而达到及时修正和补充各专题主题的特征关键词,完善专题主题关键词库,提高主题关键词提取的准确率;热点词构建提取模块,通过记录登录用户的搜索痕迹,阶段性地统计近期发布的新闻、报道等热点事件及用户检索的热点词汇与资料等信息,返回某段时间内系统的热点词汇,形成该时间段内的系统热点词汇集合,构建相应的热点词汇库。上述主题提取单元的模块构成能够有效建立不同主题的提取和数据库的重建,并通过机器学习的方式实现主题提取过程的自我更新和升级,更好满足了检索过程中主题更新和升级要求。在热点词构建提取模块进行热点词汇库的构建中采用了机器学习方法自动进行热点词汇的更新和汇总。本申请将机器学习的算法融入词汇更新和汇总中,保证了数据库主题的同步性,实现了检索主题的智能化。
信息分类单元,该单元实现不同主题的分类管理。该单元包括:知识信息分类体系构建模块,该模块根据整合与梳理的业务部门现有各个系统的栏目、目录等信息,利用目录组件中构建的各类型的指标因子,设计知识分类体系构建模块,实现各栏目类型之间的语义关联及每个分类类别与其设计的语义因子的动态关联,完成相关部门整合系统后的平台统一的知识分类体系的构建;知识信息文档分类模块,该模块自动提取文档信息中主题类型、内容特征、主体/客体对象等关键属性信息,设计综合的文本语义相似度计算方法,实现基于各部分不同权重动态设计的文档自定分类,使得文档能够自动归类到按照事先划分好的知识分类体系中的各个分类节点/栏目中,而针对无法归类的文档,则根据文本聚类方法,对这些文档集进行自动聚类,从而实现多源、多维文档知识的归类整理;知识信息分类自学习模块,该模块根据自动分类结果,用户可以修改分类或者是对分类结果进行评价,使得能够通过人工对自动分类结果进行修改和校正,自动形成各类别的文档分类样本库,然后利用已有分类样本集合,对文档归类算法进行自我学习和阈值调整,提高文档归类的正确率。
知识关联展示单元:为知识信息的关联提供展示及分类关联支持。该单元包括:知识地图展示模块,该模块根据知识库中各类别知识的相互关联和文档实例归类集合,利用图形化界面表达方式,针对知识分类/栏目之间的包含、相关等关联关系以树状/图状的图形化方式进行友好展示,使得用户能够根据自己需要,查看相关文档所属的类别及与此类别相关的其他相关知识,为用户对知识库的关联提供图形化学习方法;智能推荐模块,该模块根据用户日常查询和关注信息类型及某段时间内搜索的相关文档,利用知识库中不同知识类别之间的关联关系,对用户可能感兴趣的其他相关分类进行智能推荐,使得用户能够在查询某类信息的同时,能够方便随时查看其相关的信息内容,实现面向用户的知识智能化的有效应用。检索结果的分类显示模块,该模块利用知识库中知识分类体系的关联关系,根据系统默认/用户自身设定显示模式和排序方式,针对用户搜索的结果,按照用户感兴趣的知识分类/栏目的程度,进行有序的排列和显示,实现信息结果的分类、模块等方式的友好显示。
检索输入单元:该单元通过设定输入的不同检索词和逻辑关系,利用前述构建的主题提取单元、信息分类单元实现检索分析过程。该单元包括了多关键词检索、限定时间检索、限定数据库检索、检索结果二次检索、文件格式定制检索等。1)多关键词关联检索:为了提供更加准确的检索方式,需要支持复杂表达式,支持多字段之间或多字段内与、或、非、异或等查询。2)时间范围检索:限定时间检索可以把检索范围锁定在某个时间段内,根据选定时间范围结合数据创建时间进行检索,可以是检索出来的结果更加准确。3)指定资源库检索功能:信息资源库很多,系统提供用户可选择特定数据库进行检索。4)结果二次检索:根据检索出来的结果,用户可以在结果中进行第二次检索,二次检索是通过在检索结果中通过修改条件进一步展开检索。5)文件格式定制检索:系统可支持对文件进行检索,可以按照文件的格式进行检索,比如可以检索视频类、文档类等的文件。该检索输入单元还包括热门信息检索,热门信息检索排行及热门短语维护。热门检索顾名思义是检索目前或者时下正在热议的新闻或话题等信息资源,用户输入热门词汇或标题进行热点资源检索,把检索出来的热点信息结果呈现给用户。热门检索包括热门短语的维护管理、热门信息检索以及热门检索排行。1)热门短语维护:系统维护人员根据近期社会关注的热门事件对检索系统页面中的热门短语链接提供维护,在更新相关数据库内容后,系统自动更新显示热门短语链接。2)热门信息检索:系统根据最近导入的信息资源实现相关热门专题信息的搜索。用户点击页面中热门短语超链接后,系统将自动进行热门信息检索。3)热门检索排行:系统根据每周的日志记录,统计分析热门主题检索频率,实现热门信息检索排行功能。通过热门检索可以统计出用户最感兴趣的热点信息资源。
检索结果组织和输出单元:该单元对检索结果进行输出。检索服务系统检索出来的结果包含各个方面的数据来源,是错乱无章的,跟用户阅读带来不变。所以要针对检索结果进行重新组织、排序等等处理,已达到检索结果合理、有序。该单元具备如下功能:(1)相关搜索:检索服务系统根据检索结果组织生成相关搜索和推荐词。这些是和用户输入的关键词内容相近、相同或具有主题范畴关系的搜索内容,这些推荐词和相关词用户可能感兴趣,为用户提供方便检索模式。(2)主题分类统计:在分析检索结果时,可以按照资源主题进行自动划分,按照不同的主题统计相关的结果。(3)关联电子地图:检索资源中有关相关地图方面的信息,包括了省市县镇村等地名信息以及其他地名信息。针对这些信息进行检索,检索出来的结果与电子地图关联。以地图定位的方式展现给用户,用户点击定名信息或地图时,系统将自动调取相应的电子地图服务,为用户提供空间地理信息服务。(4)关联专题:针对现有的专题系统进行检索关联,根据用户输入的专题关键词进行检索,并将检索出来的专题标题结果与相关专题进行关联。(5)在检索页面中展示相关专题链接。用户只需要点击专题标题就可以进入想对应的专题系统,为用户提供快捷服务。(6)自动排序:可以根据检索结果可以按照设定的排序原则进行自动排序。例如可以按照日期排序、可以按照数据资源系统进行排序,也可与主题描述系统中的相关主题进行等多种方式排序组合。
图1给出了本信息检索服务系统的工作过程,首先用户通过检索输入单元输入需要检索的信息,该信息在检索系统内部经过主题抽取、信息分类、知识关联模块的操作后实现了索引和分析、同时通过内部的机器自主学习对上述各个模块进行更新,完成上述检索和分析过程后,通过检索结果组织和输出单元,依据定制的结果输出模板将检索结果完整的输出及显示。整个过程实现了信息的深度整合、关联,同时检索系统内部通过机器学习实现数据库的更新。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,该系统包括如下单元:
主题提取单元:实现检索主体的构建、提取、反馈学习完善;
信息分类单元:该单元实现不同主题的分类管理;
知识关联展示单元:为知识信息的关联提供展示及分类关联支持;
检索输入单元:该单元通过设定输入的不同检索词和逻辑关系,利用前述构建的主题提取单元、信息分类单元实现检索分析过程;
检索结果组织和输出单元:该单元对检索结果进行输出。
2.根据权利要求1所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述主题提取单元包括:
专题主题关键词库构建模块,该模块根据不同专题的主题、内容及指标特征属性,通过各个领域专家或互联网搜索关键字的排序方法,针对不同行业部门常用的主题信息内容,搜集和整理主题相关的关键词汇,构建各个专题主题的关键词库;
主题关键词提取模块,对各专题文本进行摘要及关键字提取,同时将该文档归类到相应的主题类别下,并结合主题关键词库中的主题关键词特征,过滤和提炼主题相关的重要关键词;
主题词的反馈和学习模块,该模块根据主题关键词提取模块的结果,结合用户对结果的满意程度及用户自身检索的主题关键词,自动形成主题词的样本示例库,通过主题关键词样本库的测试,采用机器学习算法设计实现主题词库更新,从而达到及时修正和补充各专题主题的特征关键词,完善专题主题关键词库,提高主题关键词提取的准确率;
热点词构建提取模块,通过记录登录用户的搜索痕迹,阶段性地统计近期发布的新闻、报道等热点事件及用户检索的热点词汇与资料等信息,返回某段时间内系统的热点词汇,形成该时间段内的系统热点词汇集合,构建相应的热点词汇库。
3.根据权利要求2所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,热点词构建提取模块在进行热点词汇库的构建中采用了机器学习方法自动进行热点词汇的更新和汇总。
4.根据权利要求1所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述信息分类单元包括:
知识信息分类体系构建模块,该模块通过梳理不同知识信息的主题,构架不同类型知识信息的指标因子,并利用该指标因子进行相互之间的关联,实现统一的体系构建;
知识信息文档分类模块,该模块自动提取信息文档属性信息,将其划分至知识信息分类体系构建模块的各个分类节点/栏目中;
知识信息分类自学习模块,该模块通过用户对分类结果的评价形成分类样本集合,通过自学习算法对分类模块的分类规则进行调整,提高知识信息分类的准确性。
5.根据权利要求4所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,信息分类单元的知识信息文档分类模块所自动提取信息文档属性信息包括:主题类型、内容特征、主体/客体对象信息。
6.根据权利要求1所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述知识关联展示单元包括:
知识地图展示模块,该模块利用图形化界面表达方式,针对知识分类/栏目之间包含、具备的关联关系以图形化方式进行展示,方便用户查看、识别;
智能推荐模块,该模块根据用户日常查询和关注信息类型及其搜索的时间区间,利用知识库中不同知识类别之间的关联关系,对用户可能感兴趣的其他相关分类进行智能推荐;
检索结果的分类显示模块,该模块利用信息分类单元所构建的关联关系,对用户搜索的结果进行有序排列和显示。
7.根据权利要求1所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述检索输入单元的检索词逻辑关系包括多字段之间或多字段内与、或、非、异或逻辑关系;其检索方式包括:时间范围检索,指定资源库检索,文件格式定制检索及结果二次检索。
8.根据权利要求7所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述检索输入单元还包括热门信息检索,热门信息检索排行及热门短语维护。
9.根据权利要求1所述的基于深度挖掘和知识管理技术的智能信息检索服务系统,其特征在于,所述检索结果组织和输出单元实现推荐词相关搜索、主题分类统计、关联电子地图、关联专题、在检索页面中展示相关专题链接及自动排序。
CN201911094385.1A 2019-11-11 2019-11-11 基于深度挖掘和知识管理技术的智能信息检索服务系统 Pending CN110765233A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911094385.1A CN110765233A (zh) 2019-11-11 2019-11-11 基于深度挖掘和知识管理技术的智能信息检索服务系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911094385.1A CN110765233A (zh) 2019-11-11 2019-11-11 基于深度挖掘和知识管理技术的智能信息检索服务系统

Publications (1)

Publication Number Publication Date
CN110765233A true CN110765233A (zh) 2020-02-07

Family

ID=69337309

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911094385.1A Pending CN110765233A (zh) 2019-11-11 2019-11-11 基于深度挖掘和知识管理技术的智能信息检索服务系统

Country Status (1)

Country Link
CN (1) CN110765233A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538741A (zh) * 2020-03-23 2020-08-14 重庆特斯联智慧科技股份有限公司 一种面向警情大数据的深度学习分析方法及系统
CN112785400A (zh) * 2021-01-12 2021-05-11 四川天行健穗金科技有限公司 一种用于去财税数据的智能检索方法及系统
CN113282827A (zh) * 2021-05-31 2021-08-20 倪泽 一种双钻石模型系统
CN115391616A (zh) * 2022-06-10 2022-11-25 深圳市生态环境智能管控中心 一种固定污染源的资源库查询检索系统及方法
CN115982429A (zh) * 2023-03-21 2023-04-18 中交第四航务工程勘察设计院有限公司 一种基于流程控制的知识管理方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609512A (zh) * 2012-02-07 2012-07-25 北京中机科海科技发展有限公司 异构信息知识挖掘与可视化分析系统及方法
CN106649255A (zh) * 2015-11-04 2017-05-10 江苏引跑网络科技有限公司 一种对短文本自动分类和识别主题词的方法
CN108345694A (zh) * 2018-03-19 2018-07-31 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
CN108846029A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 基于知识图谱的情报关联分析方法
CN109635107A (zh) * 2018-11-19 2019-04-16 北京亚鸿世纪科技发展有限公司 多数据源的语义智能分析及事件场景还原的方法及装置
CN109992645A (zh) * 2019-03-29 2019-07-09 国家计算机网络与信息安全管理中心 一种基于文本数据的资料管理系统及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102609512A (zh) * 2012-02-07 2012-07-25 北京中机科海科技发展有限公司 异构信息知识挖掘与可视化分析系统及方法
CN106649255A (zh) * 2015-11-04 2017-05-10 江苏引跑网络科技有限公司 一种对短文本自动分类和识别主题词的方法
CN108345694A (zh) * 2018-03-19 2018-07-31 华北电力大学(保定) 一种基于主题数据库的文献检索方法及系统
CN108846029A (zh) * 2018-05-28 2018-11-20 哈尔滨工程大学 基于知识图谱的情报关联分析方法
CN109635107A (zh) * 2018-11-19 2019-04-16 北京亚鸿世纪科技发展有限公司 多数据源的语义智能分析及事件场景还原的方法及装置
CN109992645A (zh) * 2019-03-29 2019-07-09 国家计算机网络与信息安全管理中心 一种基于文本数据的资料管理系统及方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111538741A (zh) * 2020-03-23 2020-08-14 重庆特斯联智慧科技股份有限公司 一种面向警情大数据的深度学习分析方法及系统
CN111538741B (zh) * 2020-03-23 2021-04-02 重庆特斯联智慧科技股份有限公司 一种面向警情大数据的深度学习分析方法及系统
CN112785400A (zh) * 2021-01-12 2021-05-11 四川天行健穗金科技有限公司 一种用于去财税数据的智能检索方法及系统
CN113282827A (zh) * 2021-05-31 2021-08-20 倪泽 一种双钻石模型系统
CN115391616A (zh) * 2022-06-10 2022-11-25 深圳市生态环境智能管控中心 一种固定污染源的资源库查询检索系统及方法
CN115391616B (zh) * 2022-06-10 2024-02-06 深圳市生态环境智能管控中心 一种固定污染源的资源库查询检索系统及方法
CN115982429A (zh) * 2023-03-21 2023-04-18 中交第四航务工程勘察设计院有限公司 一种基于流程控制的知识管理方法及系统
CN115982429B (zh) * 2023-03-21 2023-08-01 中交第四航务工程勘察设计院有限公司 一种基于流程控制的知识管理方法及系统

Similar Documents

Publication Publication Date Title
CN110765233A (zh) 基于深度挖掘和知识管理技术的智能信息检索服务系统
US7836083B2 (en) Intelligent search and retrieval system and method
US7885918B2 (en) Creating a taxonomy from business-oriented metadata content
US7707210B2 (en) System and method for multi-dimensional foraging and retrieval of documents
US20130282693A1 (en) Object oriented data and metadata based search
US20060074883A1 (en) Systems, methods, and interfaces for providing personalized search and information access
EP1342177A1 (en) Method for structuring and searching information
US20070271228A1 (en) Documentary search procedure in a distributed system
CN101201838A (zh) 利用词组索引技术对基于关键词索引的搜索引擎进行改进的方法
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
US11308177B2 (en) System and method for accessing and managing cognitive knowledge
US8204895B2 (en) Apparatus and method for receiving a report
CN102591897A (zh) 文件检索装置以及文件检索方法
KR20110133909A (ko) 모든 자연어 표현의 각각의 의미마다 별도의 용어를 동적으로 생성하는 방법 및 이를 기반으로 하는 사전 관리기,문서작성기, 용어 주석기, 검색 시스템 및 문서정보체계 구축장치
TWI290684B (en) Incremental thesaurus construction method
WO2019142094A1 (en) System and method for semantic text search
Ahmad et al. A comparative study on text mining techniques
Wurzer et al. Towards an automatic semantic integration of information
CN105912584B (zh) 一种基于网页信息数据的数据索引系统
Al-Hamami et al. Development of an opinion blog mining system
WO2002069186A1 (en) A method and system for archiving and retrieving data in an electronic document management system
TWI423053B (zh) Domain Interpretation Data Retrieval Method and Its System
Popov et al. Co-occurrence and ranking of entities
SENNOUNI et al. Implementation of a new Knowledge Management mechanism in Competitive Intelligence using Data Science and recommendation techniques
Nussbaumer et al. CONCEPTUAL DESIGN AND IMPLEMENTATION OF A PROTOTYPE SEARCH APPLICATION USING THE OPEN WEB SEARCH INDEX

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200207