CN105335487A - 基于农业技术信息本体库的农业专家信息检索系统及方法 - Google Patents

基于农业技术信息本体库的农业专家信息检索系统及方法 Download PDF

Info

Publication number
CN105335487A
CN105335487A CN201510674305.5A CN201510674305A CN105335487A CN 105335487 A CN105335487 A CN 105335487A CN 201510674305 A CN201510674305 A CN 201510674305A CN 105335487 A CN105335487 A CN 105335487A
Authority
CN
China
Prior art keywords
ontology
information
retrieval
agrotechnique
storehouse
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510674305.5A
Other languages
English (en)
Inventor
李飞飞
吴华瑞
孙想
顾静秋
李庆学
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Center for Information Technology in Agriculture
Original Assignee
Beijing Research Center for Information Technology in Agriculture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Center for Information Technology in Agriculture filed Critical Beijing Research Center for Information Technology in Agriculture
Priority to CN201510674305.5A priority Critical patent/CN105335487A/zh
Publication of CN105335487A publication Critical patent/CN105335487A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2452Query translation
    • G06F16/24522Translation of natural language queries to structured queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于农业技术信息本体库的农业专家信息检索方法以及系统。所述方法包括:获取自然语言形式的农业技术查询语句;对所述自然语言查询语句进行切分词处理以及地域和领域信息提取以获取检索关键词;根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;在判断所述检索关键词存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。本发明通过根据具体需求,从检索信息中提取特定领域和地域信息,提高了待检索信息与专家信息的匹配度。

Description

基于农业技术信息本体库的农业专家信息检索系统及方法
技术领域
本发明涉及检索领域,具体地,涉及一种基于农业技术信息本体库的农业专家信息检索系统及方法。
背景技术
相对于我国农业生产的规模和特点来说,农业专家的数量难以满足现场解决农业问题的需求,在农业生产中出现的许多问题(如病虫害诊断、种植品种和密度选择、种养殖环境的规划等)难以获得农业专家的技术支持。因此,而针对基层农技人员无法解决的生产实际问题,通过与农业专家进行匹配,推荐出能解决该问题最适合的专家;农技人员获得该领域专家的快速连通,实现农业专家生产动态与技术措施情况信息交流与报送可以为农技人员提供更加有效的农技指导。
许多通用搜索引擎,如Google、百度等在一定程度上为信息资源的检索提供了解决方案。但是,一方面通用搜索引擎面向的是所有行业,针对特定行业和特定信息检索准确性和相关性都较差,特别是针对专家人物的检索,效果不理想;另一方面通用搜索引擎采用的是基于关键词的检索技术,只是将分词后的关键词和索引库中的词语进行匹配,无法正确理解和处理用户检索语义和意图,存在着检索结果不准确、无关信息过多等问题。因此,面向农业行业的专家信息检索,利用基于本体的语义检索技术,并通过对检索信息进行领域和地域信息提取,成为提高农业专家信息搜索和匹配效率的有效途径。
目前现有技术中提供有一种基于农业技术信息领域本体的智能检索方法。图1是应用该智能检索方法的智能检索系统。如图1所示,该智能检索系统包括:查询接口、查询预处理模块、语义本体推理引擎、传统搜索引擎以及结果返回接口。查询接口获取查询信息,将其发送给查询预处理模块。查询预处理模块分析查询信息,提取领域信息和地域信息,并通过切分词技术,将其切分成查询关键词,并发送给语义本体推理引擎。语义本体推理引擎根据标注本体库中定义的本体概念词汇与概念之间的关系,匹配推理出查询关键词所对应的本体概念词汇,并将其返回给查询预处理模块。查询预处理模块将语义本体推理引擎返回的本体概念词汇发送给传统搜索引擎,并指示传统搜索引擎按照语义搜索。这里所说的按照语义搜索是指在网页已被标注语义的情况下,按照网页标注的语义概念进行字符串匹配,而不是直接对网页自身的内容进行字符串匹配。传统搜索引擎进行语义搜索,并将搜索结果发送给结果返回接口。结果返回接口再将搜索结果返回给用户。现有的技术方案充分利用了领域本体库中的概念及其相互关系,能够正确理解用户需求,优化检索结果,更全、更准地返回专业领域信息。
然而,现有技术方案并未涉及对基础数据资源的预处理。一方面基础数据资源中往往含有大量无关的冗余信息,比如网页中往往还有广告、导航、版权等垃圾信息,如果不对这些垃圾信息进行清洗处理,将对后期的检索带来极大噪声干扰;另一方面,网页中包含的都是半结构化数据,真正有用的数据和html标签混合在一起,这也大大降低了检索的精准度。
同时,现有技术方案在对用户输入的自然查询语言进行处理时,如果用户输入的自然查询语句中包括本体概念,则进行句型模式的匹配判断,无论匹配成功与否,都是直接对匹配上或进行语义扩展后的本体概念进行查询。由于整个过程缺少用户的参与,而通过对用户输入的自然查询语言进行语义分析并不能完全和精准地理解用户查询意图。并且,由于人物信息检索的特殊性以及农技人员对农业专家的特殊需求,从检索信息中提取特定领域信息、地域信息,有利于检索到更符合要求的专家信息。
发明内容
本发明的目的是提供一种基于农业技术信息本体库的农业专家信息检索方法以及系统。其中,所述方法通过对网页信息进行清洗和结构化整理以及引入用户交互式参与模式,以及对检索信息进行领域和地域信息的提取,提高了检索的查准率和查全率。
为了实现上述目的,本发明提供一种基于农业技术信息本体库的农业专家信息检索方法。所述方法包括:获取待查询的自然语言形式的农业技术查询语句;对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。
优选地,所述预设的专家信息索引库包括专家信息全文索引库,所述方法还包括:在判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行全文检索以生成第一检索结果。
优选地,所述预设的专家信息索引库还包括专家信息语义本体索引库,在获得所述本体语义扩展集之后,所述方法还包括:对所述本体语义扩展集进行过滤和权重标识处理;将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式;以及根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。
优选地,所述方法还包括:根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。
优选地,建立所述专家信息语义本体索引库和所述专家信息全文索引库包括:读取预设的本体语义资源库中的文本数据;判断所述文本数据中是否存在语义标注信息;在判断所述文本数据中存在所述语义标注信息的情况下,读取所述语义标注信息,并根据所述语义标注信息提取语义概念本体词汇以建立所述专家信息语义本体索引库;以及在判断所述文本数据中不存在所述语义标注信息的情况下,建立包括所述文本数据索引的专家信息全文索引库。
优选地,生成所述本体语义资源库包括:从网络中获取农业技术相关信息;对获取信息进行结构化处理以生成农业技术信息资源库;根据预设的农业技术信息本体库标注所述农业技术信息资源库中的资源数据的本体语义;计算标注本体的语义向量空间;将所述语义向量空间中的标注本体词汇与已标注处理的资源数据相关联;以及将所述语义向量空间中的标注本体词汇与已标注处理的资源数据一起存入数据库以生成所述本体语义资源库。
相应地,本发明还提供一种基于农业技术信息本体库的农业专家信息检索系统。所述系统包括:分词处理单元,用于接收待查询的自然语言形式的农业技术信息语句,并对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;语义本体推理引擎,用于根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;本体语义扩展处理单元,用于在所述语义本体推理引擎判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及检索处理单元,用于根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。
优选地,所述检索处理单元包括全文检索单元,且所述预设的专家信息索引库包括专家信息全文索引库,所述专家信息全文检索单元用于在所述语义本体推理引擎判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行专家信息全文检索以生成第一检索结果。
优选地,所述检索处理单元还包括语义本体检索单元,且所述预设的专家信息索引库还包括专家信息语义本体索引库,所述本体语义扩展处理单元还用于对所述本体语义扩展集进行过滤和权重标识处理;以及所述语义本体检索单元用于将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式,并根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。
优选地,所述检索处理单元还包括排名处理单元,所述排名处理单元用于根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。
通过上述技术方案,在根据预设的农业技术信息本体库判断获取的检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集,并根据所述本体语义扩展集访问预设的专家信息索引库进行检索以生成检索结果,提高了农业专家信息检索精度,特别是提高了农业专家与检索的农技信息的匹配度。
附图说明
图1是应用现有技术中的智能检索方法的智能检索系统;
图2是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的流程图;
图3是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的有关建立专家信息语义本体索引库和专家信息全文索引库的流程图;
图4是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的有关生成本体语义资源库的流程图;以及
图5是本发明提供的基于农业技术信息本体库的农业专家信息检索系统的结构示意图。
附图标记说明
10分词处理单元20语义本体推理引擎
30本体语义扩展处理单元40语义本体检索单元
50全文检索单元60排名处理单元
70检索处理单元80爬虫抓取单元
90信息抽取单元100本体语义标注单元
110语义向量空间计算单元120语义索引处理单元
具体实施方式
以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。
针对现有语义检索方法以及系统所存在的检索精度较低等问题,以及根据农业技术信息检索相关专家信息的具体需求,本发明提供一种语义检索方法以及系统,通过改进现有语义检索方法以及系统所存在的数据来源的结构性和准确性的问题,建立农业技术信息本体库,以及引入用户交互式参与模式,从而达到提高检索的查准率和查全率的目标。提高了农业专家信息检索精度,特别是提高了农业专家与检索的农技信息的匹配度。图2是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的流程图。如图2所示,本发明提供的基于农业技术信息本体库的农业专家信息检索方法包括:在步骤S101中,获取待查询的自然语言形式的农业技术查询语句;在步骤S102中,对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词。例如,用户提交的自然语言查询语句为“浙江黄瓜病虫害防治”,经过切分词处理后的结果为“浙江/黄瓜/病虫害防治”,其中领域信息提取为“黄瓜”,地域信息为“浙江”。在步骤S103中,根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇。在步骤S104中,在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集。在步骤S105中,根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。具体地,在获得所述本体语义扩展集之后,对所述本体语义扩展集进行过滤和权重标识处理,并将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式,以及根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。在步骤S106中,在判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行全文检索以生成第一检索结果。在步骤S107中,根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。具体地,第二检索结果按照本体语义扩展集的本体词汇权重标识进行排名,且第一检索结果排在第二检索结果的后面。
在具体的实施方式中,在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,可以根据用户需求只进行全文检索。在判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,还可以指示用户,要求其重新提交自然语言查询语句。
其中,所述预设的专家信息索引库包括专家信息全文索引库和专家信息语义本体索引库。此外,采用本发明研究过程中自主开发的一套本体构建工具构建所述预设的农业技术信息本体库。该本体构建工具以本体库构建平台KAON为基础,并结合对农业技术信息叙词表的数据分析,实现了针对农业技术信息结构化数据构建农业技术信息本体库的半自动化。
在具体的应用中,用户输入“夏天黄瓜病虫防治”进行相关检索,分词处理后的结果为“夏天/t黄瓜/n病虫害防治/n”。判断分词处理后的结果是否存在与本体语义概念相关的词汇。在判断分词处理后的结果存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对其进行本体语义扩展以获得本体语义扩展集。所述本体语义扩展集为“青瓜、生物、中农2、津春3号、白粉病、炭疽病...”。结合用户的参与对所述本体语义扩展集进行过滤和权重标识处理。在本实施例中,可以过滤掉所述本体语义扩展集中的非本体核心词汇“中农2”和“津春3号”,而保留本体相关的核心词汇,并对保留的本体核心词汇进行权重标识,从而得到处理后的本体语义扩展集为“{青瓜,1.0}、{生物,0.3}、{白粉病,0.5}、{炭疽病,0.5}...”。本体语义扩展集的本体词汇权重标识主要通过本体相关度和相似度来判断本体语义扩展集中的词汇与文本信息的语义的相似性。本体词汇权重标识可以作为检索结果处理和排序的参考指标。然后,将处理后的本体语义扩展集转化为语义查询检索式,并根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成检索结果。最后,根据处理后的本体语义扩展集的本体词汇权重标识对所述检索结果进行排名处理,获得农业专家信息检索最终结果。
图3是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的有关建立专家信息语义本体索引库和专家信息全文索引库的流程图。如图3所示,建立所述专家信息语义本体索引库和所述专家信息全文索引库包括:在步骤S201中,读取预设的本体语义资源库中的文本数据。在步骤S202中,判断所述文本数据中是否存在语义标注信息。在步骤S203中,在判断所述文本数据中不存在所述语义标注信息的情况下,建立包括所述文本数据索引的专家信息全文索引库。在步骤S204中,在判断所述文本数据中存在所述语义标注信息的情况下,读取所述语义标注信息。在步骤S205中,根据所述语义标注信息提取语义概念本体词汇以建立所述专家信息语义本体索引库。
图4是本发明提供的基于农业技术信息本体库的农业专家信息检索方法的有关生成本体语义资源库的流程图。如图4所示,生成所述本体语义资源库包括:在步骤S301中,从网络中获取农业技术相关信息。具体地,使用网络爬虫抓取工具获取互联网上指定的与农业技术相关的网页信息。在步骤S302中,对获取的信息进行结构化处理以生成农业技术信息资源库。在步骤S303中,根据预设的农业技术信息本体库标注所述农业技术信息资源库中的资源数据的本体语义。具体地,将资源数据中与本体语义概念相关的词汇做上标记,即与本体语义概念建立映射关系,然后以文本格式存储。如果资源数据中的某个词汇没有被收录到预设的农业技术信息本体库之中或找不到与之相关的本体语义概念,则该词汇对于农业技术专业信息检索而言,属于干扰信息或不相关信息,也就没有必要为该词汇建立语义索引。在步骤S304中,计算标注本体的语义向量空间。在步骤S305中,将所述语义向量空间中的标注本体词汇与已标注处理的资源数据相关联。在步骤S306中,将所述语义向量空间中的标注本体词汇与已标注处理的资源数据一起存入数据库以生成所述本体语义资源库。
相应地,本发明还提供一种基于农业技术信息本体库的农业专家信息检索系统。图5是本发明提供的基于农业技术信息本体库的农业专家信息检索系统的结构示意图。如图5所示,本发明提供的语义检索系统包括:分词处理单元10,分词处理单元,用于接收待查询的自然语言形式的农业技术信息语句,并对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;语义本体推理引擎20,用于根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;本体语义扩展处理单元30,用于在所述语义本体推理引擎判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及检索处理单元70,用于根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。
在具体的实施方式中,所述检索处理单元70包括全文检索单元50,且所述预设的专家信息索引库包括专家信息全文索引库,所述全文检索单元50用于在所述语义本体推理引擎20判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行全文检索以生成第一检索结果。
在具体的实施方式中,所述检索处理单元70还包括语义本体检索单元40,且所述预设的专家信息索引库还包括专家信息语义本体索引库,所述本体语义扩展处理单元30还用于对所述本体语义扩展集进行过滤和权重标识处理;以及所述语义本体检索单元40用于将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式,并根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。具体地,所述本体语义扩展处理单元30结合用户的参与对所述本体语义扩展集进行过滤和权重标识处理。藉此,对检索输入的自然语言进行进一步分解处理,确认最终的本体语义扩展集。这一交互过程能够更加明确用户查询的重点,提高检索的准确性和有效性。
可选择地,所述检索处理单元70还包括排名处理单元60,所述排名处理单元60用于根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。藉此,有利于提高了农业专家信息检索精度,特别是提高了农业专家与检索的农技信息的匹配度。
在具体的应用中,所述系统还包括:爬虫抓取单元80,用于获取与农业相关的网页信息;信息抽取单元90,用于对获取的网页信息进行结构化处理以生成农业技术信息资源库;本体语义标注单元100,用于根据预设的农业技术信息本体库标注所述农业技术信息资源库中的资源数据的本体语义;语义向量空间计算单元110,用于计算标注本体的语义向量空间,并将所述语义向量空间中的标注本体词汇与已标注处理的资源数据相关联,以及将所述语义向量空间中的标注本体词汇与已标注处理的资源数据一起存入数据库以生成所述本体语义资源库。藉此,对网页信息进行预处理,并将网页中包含的半结构化数据进行筛选和处理,有利于数据检索的准确性。此外,生成的本体语义资源库,有助于用户查询到更加准确的检索信息。
在一种可能的实施方式中,所述系统还包括:语义索引处理单元120,用于读取预设的本体语义资源库中的文本数据;判断所述文本数据中是否存在语义标注信息;在判断所述文本数据中存在所述语义标注信息的情况下,读取所述语义标注信息,并根据所述语义标注信息提取语义概念本体词汇以建立所述专家信息语义本体索引库;以及在判断所述文本数据中不存在所述语义标注信息的情况下,建立包括所述文本数据索引的专家信息全文索引库。藉此,建立专家信息语义本体索引库和专家信息全文索引库,有助于用户查询到更加准确的检索信息。
本发明所公开的语义检索方法以及系统利用信息抽取技术将网页中的结构化数据抽取出来作为基础资源,然后利用农业技术信息本体库和用户的适当参与来实现精准而又高效的农业技术领域信息语义检索。具体来说,(1)该技术方案基于农业技术信息本体的信息抽取技术,针对从网络上抓取到的HTML网页,在清洗无用冗余信息后,仅仅将析取出有用的结构化的数据信息作为检索的基础资源,因此在数据基础资源阶段大大保证了检索的准确性;(2)该技术方案在语义检索阶段,引入用户交互式参与模式,根据用户的查询请求进行语义扩展和推理,并对用户输入的自然语言查询语句进行处理或者将扩展后的结果再次返回给用户,使得用户在参与的过程中能比较准确地确定扩展语义集中各个本体实例的权重,直到扩展后的本体实例集符合用户的查询需求,因此大大提高最终检索结果的准确性。(3)考虑人物信息检索的特殊性以及农技人员对农业专家的特殊需求,从检索信息中提取特定领域信息、地域信息,有利于检索到更符合要求的专家信息,实现检索信息与专家的良好匹配。
以上结合附图详细描述了本发明的优选实施方式,但是,本发明并不限于上述实施方式中的具体细节,在本发明的技术构思范围内,可以对本发明的技术方案进行多种简单变型,这些简单变型均属于本发明的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。
此外,本发明的各种不同的实施方式之间也可以进行任意组合,只要其不违背本发明的思想,其同样应当视为本发明所公开的内容。

Claims (10)

1.一种基于农业技术信息本体库的农业专家信息检索方法,其特征在于,所述方法包括:
获取待查询的自然语言形式的农业技术查询语句;
对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;
根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;
在判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及
根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。
2.根据权利要求1所述的基于农业技术信息本体库的农业专家信息检索方法,其特征在于,所述预设的专家信息索引库包括专家信息全文索引库,所述方法还包括:
在判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述专家信息全文索引库进行全文检索以生成第一检索结果。
3.根据权利要求2所述的基于农业技术信息本体库的农业专家信息检索方法,其特征在于,所述预设的专家信息索引库还包括专家信息语义本体索引库,在获得所述本体语义扩展集之后,所述方法还包括:
对所述本体语义扩展集进行过滤和权重标识处理;
将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式;以及
根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。
4.根据权利要求3所述的基于农业技术信息本体库的农业专家信息检索方法,其特征在于,所述方法还包括:
根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。
5.根据权利要求2所述的基于农业技术信息本体库的农业专家信息检索方法,其特征在于,建立所述专家信息语义本体索引库和所述专家信息全文索引库包括:
读取预设的本体语义资源库中的文本数据;
判断所述文本数据中是否存在语义标注信息;
在判断所述文本数据中存在所述语义标注信息的情况下,读取所述语义标注信息,并根据所述语义标注信息提取语义概念本体词汇以建立所述专家信息语义本体索引库;以及
在判断所述文本数据中不存在所述语义标注信息的情况下,建立包括所述文本数据索引的专家信息全文索引库。
6.根据权利要求5所述的基于农业技术信息本体库的农业专家信息检索方法,其特征在于,生成所述本体语义资源库包括:
从网络中获取农业技术相关信息;
对获取的信息进行结构化处理以生成农业技术信息资源库;
根据预设的农业技术信息本体库标注所述农业技术信息资源库中的资源数据的本体语义;
计算标注本体的语义向量空间;
将所述语义向量空间中的标注本体词汇与已标注处理的资源数据相关联;以及
将所述语义向量空间中的标注本体词汇与已标注处理的资源数据一起存入数据库以生成所述本体语义资源库。
7.一种基于农业技术信息本体库的农业专家信息检索系统,其特征在于,所述系统包括:
分词处理单元,用于接收待查询的自然语言形式的农业技术信息语句,并对所述自然语言查询语句进行切分词处理、提取领域信息和地域信息以获取检索关键词;
语义本体推理引擎,用于根据预设的农业技术信息本体库判断所述检索关键词中是否存在与本体语义概念相关的词汇;
本体语义扩展处理单元,用于在所述语义本体推理引擎判断所述检索关键词中存在与本体语义概念相关的词汇的情况下,根据所述预设的农业技术信息本体库对所述检索关键词进行本体语义扩展以获得本体语义扩展集;以及
检索处理单元,用于根据所述本体语义扩展集访问预设的专家信息索引库进行专家信息检索以生成专家信息检索结果。
8.根据权利要求7所述的基于农业技术信息本体库的农业专家信息检索系统,其特征在于,所述检索处理单元包括全文检索单元,且所述预设的专家信息索引库包括专家信息全文索引库,
所述全文检索单元用于在所述语义本体推理引擎判断所述检索关键词中不存在与本体语义概念相关的词汇的情况下,根据所述检索关键词访问所述全文专家信息索引库进行全文检索以生成第一检索结果。
9.根据权利要求8所述的基于农业技术信息本体库的农业专家信息检索系统,其特征在于,所述检索处理单元还包括语义本体检索单元,且所述预设的专家信息索引库还包括专家信息语义本体索引库,
所述本体语义扩展处理单元还用于对所述本体语义扩展集进行过滤和权重标识处理;以及
所述语义本体检索单元用于将过滤和权重标识处理后的本体语义扩展集转化为语义查询检索式,并根据所述语义查询检索式访问所述专家信息语义本体索引库进行检索以生成第二检索结果。
10.根据权利要求9所述的基于农业技术信息本体库的农业专家信息检索系统,其特征在于,所述检索处理单元还包括排名处理单元,
所述排名处理单元用于根据所述本体语义扩展集的本体词汇权重标识对所述第一检索结果和所述第二检索结果进行排名处理,获得农业专家信息检索最终结果。
CN201510674305.5A 2015-10-16 2015-10-16 基于农业技术信息本体库的农业专家信息检索系统及方法 Pending CN105335487A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510674305.5A CN105335487A (zh) 2015-10-16 2015-10-16 基于农业技术信息本体库的农业专家信息检索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510674305.5A CN105335487A (zh) 2015-10-16 2015-10-16 基于农业技术信息本体库的农业专家信息检索系统及方法

Publications (1)

Publication Number Publication Date
CN105335487A true CN105335487A (zh) 2016-02-17

Family

ID=55286014

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510674305.5A Pending CN105335487A (zh) 2015-10-16 2015-10-16 基于农业技术信息本体库的农业专家信息检索系统及方法

Country Status (1)

Country Link
CN (1) CN105335487A (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956168A (zh) * 2016-05-20 2016-09-21 北京市农林科学院 一种信息检索方法及信息检索装置
CN106095912A (zh) * 2016-06-08 2016-11-09 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置
CN106294569A (zh) * 2016-07-27 2017-01-04 北京奇虎科技有限公司 一种定制搜索方法及装置
CN106372099A (zh) * 2016-07-07 2017-02-01 安徽农业大学 一种农业领域本体有效性评估方法
CN107704602A (zh) * 2017-10-16 2018-02-16 西南大学 基于agrovoc的大规模农业语义本体匹配方法
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN107918658A (zh) * 2017-11-20 2018-04-17 金蝶软件(中国)有限公司 一种商机生成方法及系统
CN110199354A (zh) * 2017-01-09 2019-09-03 金善中 生物体系信息检索系统以及方法
CN111259041A (zh) * 2020-02-26 2020-06-09 山东理工大学 一种科技专家资源虚拟化与语义推理检索方法
CN111859055A (zh) * 2020-07-01 2020-10-30 江苏智岭技术咨询有限公司 一种基于大数据的数据智能检索匹配系统
WO2023030126A1 (en) * 2021-09-01 2023-03-09 International Business Machines Corporation Context-driven analytics selection, routing, and management
CN116578677A (zh) * 2023-07-14 2023-08-11 高密市中医院 一种针对医疗检验信息的检索系统和方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
CN102073692A (zh) * 2010-12-16 2011-05-25 北京农业信息技术研究中心 基于农业领域本体库的语义检索系统和方法
CN102955848A (zh) * 2012-10-29 2013-03-06 北京工商大学 一种基于语义的三维模型检索系统和方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081774A (en) * 1997-08-22 2000-06-27 Novell, Inc. Natural language information retrieval system and method
CN102073692A (zh) * 2010-12-16 2011-05-25 北京农业信息技术研究中心 基于农业领域本体库的语义检索系统和方法
CN102955848A (zh) * 2012-10-29 2013-03-06 北京工商大学 一种基于语义的三维模型检索系统和方法

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956168A (zh) * 2016-05-20 2016-09-21 北京市农林科学院 一种信息检索方法及信息检索装置
CN105956168B (zh) * 2016-05-20 2019-05-28 北京市农林科学院 一种信息检索方法及信息检索装置
CN106095912A (zh) * 2016-06-08 2016-11-09 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置
CN106095912B (zh) * 2016-06-08 2020-12-08 北京百度网讯科技有限公司 用于生成扩展查询词的方法和装置
CN106372099A (zh) * 2016-07-07 2017-02-01 安徽农业大学 一种农业领域本体有效性评估方法
CN106294569A (zh) * 2016-07-27 2017-01-04 北京奇虎科技有限公司 一种定制搜索方法及装置
CN110199354A (zh) * 2017-01-09 2019-09-03 金善中 生物体系信息检索系统以及方法
CN110199354B (zh) * 2017-01-09 2023-08-04 金善中 生物体系信息检索系统以及方法
CN107704602A (zh) * 2017-10-16 2018-02-16 西南大学 基于agrovoc的大规模农业语义本体匹配方法
CN107704602B (zh) * 2017-10-16 2021-02-02 西南大学 基于agrovoc的大规模农业语义本体匹配方法
CN107862000A (zh) * 2017-10-22 2018-03-30 北京市农林科学院 一种农业技术咨询人机对话方法
CN107918658A (zh) * 2017-11-20 2018-04-17 金蝶软件(中国)有限公司 一种商机生成方法及系统
CN107918658B (zh) * 2017-11-20 2021-05-07 金蝶软件(中国)有限公司 一种商机生成方法及系统
CN111259041A (zh) * 2020-02-26 2020-06-09 山东理工大学 一种科技专家资源虚拟化与语义推理检索方法
CN111859055A (zh) * 2020-07-01 2020-10-30 江苏智岭技术咨询有限公司 一种基于大数据的数据智能检索匹配系统
WO2023030126A1 (en) * 2021-09-01 2023-03-09 International Business Machines Corporation Context-driven analytics selection, routing, and management
US11941364B2 (en) 2021-09-01 2024-03-26 International Business Machines Corporation Context-driven analytics selection, routing, and management
CN116578677A (zh) * 2023-07-14 2023-08-11 高密市中医院 一种针对医疗检验信息的检索系统和方法
CN116578677B (zh) * 2023-07-14 2023-09-15 高密市中医院 一种针对医疗检验信息的检索系统和方法

Similar Documents

Publication Publication Date Title
CN105335487A (zh) 基于农业技术信息本体库的农业专家信息检索系统及方法
CN102073692B (zh) 基于农业领域本体库的语义检索系统和方法
CN110633409B (zh) 一种融合规则与深度学习的汽车新闻事件抽取方法
Cafarella et al. Structured data on the web
CN110990590A (zh) 一种基于强化学习和迁移学习的动态金融知识图谱构建方法
CN102456018B (zh) 一种交互搜索方法及装置
CN103092979B (zh) 遥感数据检索自然语言的处理方法
WO2016112679A1 (zh) 实现智能问答的方法、系统和存储介质
CN106649768A (zh) 基于深度问答的问答澄清方法和装置
CN109800284A (zh) 一种面向任务的非结构化信息智能问答系统构建方法
CN103886099B (zh) 一种模糊概念的语义检索系统及方法
CN101251852B (zh) 面向领域的Web数据集成系统和方法
CN103823824A (zh) 一种借助互联网自动构建文本分类语料库的方法及系统
CN103593412B (zh) 一种基于树形结构问题的应答方法及系统
CN102402561B (zh) 一种搜索方法和装置
CN101655862A (zh) 信息对象搜索的方法和装置
CN103198136B (zh) 一种基于时序关联的个人电脑文件查询方法
CN103440287A (zh) 一种基于产品信息结构化的Web问答检索系统
CN103324700A (zh) 一种基于Web信息的本体概念属性学习方法
CN101393565A (zh) 基于本体的面向虚拟博物馆的搜索方法
CN104484380A (zh) 个性化搜索方法及装置
CN114090861A (zh) 一种基于知识图谱的教育领域搜索引擎构建方法
CN103310013A (zh) 一种面向主题的网页采集系统
CN111966787A (zh) 一种基于知识图谱的智能渔业问答机器人的构建方法
CN106202467A (zh) 一种面向对等网络的可定义搜索重点的网络爬虫方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20160217