CN105868381A - 用于农业信息服务的知识库检索系统 - Google Patents
用于农业信息服务的知识库检索系统 Download PDFInfo
- Publication number
- CN105868381A CN105868381A CN201610211925.XA CN201610211925A CN105868381A CN 105868381 A CN105868381 A CN 105868381A CN 201610211925 A CN201610211925 A CN 201610211925A CN 105868381 A CN105868381 A CN 105868381A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- agricultural
- layer
- knowledge base
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000284 extract Substances 0.000 claims abstract description 7
- 238000009313 farming Methods 0.000 claims description 17
- 239000000463 material Substances 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 239000002244 precipitate Substances 0.000 claims description 2
- 238000005516 engineering process Methods 0.000 abstract description 9
- 238000011161 development Methods 0.000 abstract description 6
- 230000008093 supporting effect Effects 0.000 abstract description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000000034 method Methods 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012271 agricultural production Methods 0.000 description 1
- 238000012550 audit Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Tourism & Hospitality (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Computational Linguistics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种用于农业信息服务的知识库检索系统,所述用于农业信息服务的知识库检索系统,包括用于获取原始农业信息资料的知识录入层以及用于对知识录入层获取的原始农业信息资料进行审核的知识审核层,所述知识审核层对原始农业信息资料审核后,以将审核通过的原始农业信息资料转化为显性农业知识存储在知识库内,所述知识库与用于接收检索词的知识检索层连接,知识检索层根据接收的检索词从知识库内提取并输出相应的农业知识。本发明充分发挥信息技术在农业中的支撑作用,缓解庞大的信息资源与用户有效接收能力之间的矛盾,适应用户的现实信息需求及其发展变化。
Description
技术领域
本发明涉及一种检索系统,尤其是一种用于农业信息服务的知识库检索系统,属于农业知识检索的技术领域。
背景技术
目前,信息知识已成为农业生产活动的基本资源和发展动力,信息和技术咨询服务业也相应成为整个农业结构的基础产业之一。农业知识检索在近年来也受到了较多的关注,然而我国农业信息化服务平台起步较晚,基于现代信息技术的农业信息服务基础设施薄弱,农业信息的规范化程度不高,当前农业数字资源的组织依旧停留在信息层面上。尽管一些数字资源检索系统引入了主题词典或概念词典,但是其描述知识的能力十分有限,众多资源系统是异构多源分布的,给人们接收甄别有效信息带来阻碍。因此,创新农业知识检索的方法与技术势在必行。
发明内容
本发明的目的是克服现有技术中存在的不足,提供一种用于农业信息服务的知识库检索系统,其充分发挥信息技术在农业中的支撑作用,缓解庞大的信息资源与用户有效接收能力之间的矛盾,适应用户的现实信息需求及其发展变化。
按照本发明提供的技术方案,所述用于农业信息服务的知识库检索系统,包括用于获取原始农业信息资料的知识录入层以及用于对知识录入层获取的原始农业信息资料进行审核的知识审核层,所述知识审核层对原始农业信息资料审核后,以将审核通过的原始农业信息资料转化为显性农业知识存储在知识库内,所述知识库与用于接收检索词的知识检索层连接,知识检索层根据接收的检索词从知识库内提取并输出相应的农业知识。
所述知识录入层获取原始农业信息资料的方式包括撰写知识块、利用网络爬虫收集农业知识和/或从知识沉淀中提取知识。
所述知识录入层包括用于减少冗余的查重分析器、用于关键词提取的分词器以及用于索引的索引器,所述索引器采用开源搜索引擎框架lueene。
本发明的优点:充分发挥信息技术在农业中的支撑作用,缓解庞大的信息资源与用户有效接收能力之间的矛盾,适应用户的现实信息需求及其发展变化。
附图说明
图1为本发明的使用示意图。
图2为本发明知识录入层的时序图。
图3为本发明知识审核层的时序图。
图4为本发明知识检索层的时序图。
具体实施方式
下面结合具体附图和实施例对本发明作进一步说明。
如图1所示:为了充分发挥信息技术在农业中的支撑作用,缓解庞大的信息资源与用户有效接收能力之间的矛盾,适应用户的现实信息需求及其发展变化,本发明包括用于获取原始农业信息资料的知识录入层以及用于对知识录入层获取的原始农业信息资料进行审核的知识审核层,所述知识审核层对原始农业信息资料审核后,以将审核通过的原始农业信息资料转化为显性农业知识存储在知识库内,所述知识库与用于接收检索词的知识检索层连接,知识检索层根据接收的检索词从知识库内提取并输出相应的农业知识。
如图2所示,本发明实施例中,知识录入层获取原始农业信息资料的方式包括:聘请有经验的权威专家撰写知识块、利用网络爬虫从网络上收集部分知识、从农民提问和专家解答的知识沉淀中提取知识。知识录入层获取的原始农业信息资料,都必须经过专门的审核专家审核后才能进入正式知识库。
进一步地,相似甚至雷同的知识只能使知识库臃肿,达不到丰富知识库的目的,所以录入系统需要设计一个查重分析器,判断问题的相似度,从而减少知识库冗余;当检索或者查重时,系统需要对问句或者知识条目进行关键词提取,特别是农业关键词、方言关键词的提取,从而能最大程度地理解问句的语义,这就离不开针对农业的专业分词器。本发明实施例中,使用目前主流的开源搜索引擎框架lueene与分词器对接,并使用开源搜索引擎框架lueene的索引器对知识库记录建立倒排索引,为以后实现高效的检索提供必要条件。
如图3所示,为了减少知识库冗余,知识审核层用于把已经录入到临时知识库的知识进行审核,审核通过后自动录入到正式知识库,主要审核的步骤是先由系统管理员初审临时知识库的知识,然后由专家组复审临时知识库里的知识,最后由系统管理员终审临时知识库里的知识并使之进入正式知识库。具体过程为:农业专家和农技人员将知识录入层获取的农业隐性知识通过获取、分析、处理和重构组织及提炼分类等方式转化为农业科学知识,即显性知识。转化过程中应注意剔除错误知识、纠正知识,然后反馈给信息管理专家,由信息管理专家经过科学解释、标准编码和合理分类等信息化技术知识处理操作转化为可管理的农业实用科学知识,存储中实现农业知识的显性化。
如图4所示,农业专家、农技人员和农户等可通过计算机、信息机、触摸屏等终端浏览、查询知识服务系统或通过报刊、报告、短信、电子邮件和电话等得到知识数据工程,指导农户进行更为高效、科学的农事活动,实现农业标准化生产。
具体地,在知识库构建完成后,用户提出问题,发送请求,查询器发送数据给分词器,并由分词器进行分词。首先,分词器查阅农业专业词库,分析词汇是否为专业词汇;然后,分词器查阅近义词库,分析词汇是否为近义词;最后,分词词库对农民问题进行分词。综合以上三个词库进行分词,形成分词结果集并返回分词结果。检索器根据分词结果发出请求,查询种类器,确认问题所属类别,并返回类别;然后,检索器根据类别查询相应的索引库,索引器对结果进行相关性分析,并排序和返回结果集。
本发明充分发挥信息技术在农业中的支撑作用,缓解庞大的信息资源与用户有效接收能力之间的矛盾,适应用户的现实信息需求及其发展变化。
Claims (3)
1.一种用于农业信息服务的知识库检索系统,其特征是:包括用于获取原始农业信息资料的知识录入层以及用于对知识录入层获取的原始农业信息资料进行审核的知识审核层,所述知识审核层对原始农业信息资料审核后,以将审核通过的原始农业信息资料转化为显性农业知识存储在知识库内,所述知识库与用于接收检索词的知识检索层连接,知识检索层根据接收的检索词从知识库内提取并输出相应的农业知识。
2.根据权利要求1所述的用于农业信息服务的知识库检索系统,其特征是:所述知识录入层获取原始农业信息资料的方式包括撰写知识块、利用网络爬虫收集农业知识和/或从知识沉淀中提取知识。
3.根据权利要求1或2所述的用于农业信息服务的知识库检索系统,其特征是:所述知识录入层包括用于减少冗余的查重分析器、用于关键词提取的分词器以及用于索引的索引器,所述索引器采用开源搜索引擎框架lueene。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610211925.XA CN105868381A (zh) | 2016-04-06 | 2016-04-06 | 用于农业信息服务的知识库检索系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610211925.XA CN105868381A (zh) | 2016-04-06 | 2016-04-06 | 用于农业信息服务的知识库检索系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105868381A true CN105868381A (zh) | 2016-08-17 |
Family
ID=56636069
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610211925.XA Pending CN105868381A (zh) | 2016-04-06 | 2016-04-06 | 用于农业信息服务的知识库检索系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105868381A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667606A (zh) * | 2021-01-15 | 2021-04-16 | 中国科学院空天信息创新研究院 | 一种基于多源知识采集技术的知识库系统及其构建方法 |
CN113393336A (zh) * | 2021-04-30 | 2021-09-14 | 广州法通网络科技有限公司 | 一种基于互联网的为农综合服务平台 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2806356A1 (en) * | 2013-05-24 | 2014-11-26 | Tata Consultancy Services Limited | Internet of things (iot) application development |
CN105160273A (zh) * | 2015-09-17 | 2015-12-16 | 西安未来国际信息股份有限公司 | 一种基于访问控制和智能检索的知识管理方法 |
CN105335488A (zh) * | 2015-10-16 | 2016-02-17 | 中国南方电网有限责任公司电网技术研究中心 | 一种知识库构建方法 |
-
2016
- 2016-04-06 CN CN201610211925.XA patent/CN105868381A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2806356A1 (en) * | 2013-05-24 | 2014-11-26 | Tata Consultancy Services Limited | Internet of things (iot) application development |
CN105160273A (zh) * | 2015-09-17 | 2015-12-16 | 西安未来国际信息股份有限公司 | 一种基于访问控制和智能检索的知识管理方法 |
CN105335488A (zh) * | 2015-10-16 | 2016-02-17 | 中国南方电网有限责任公司电网技术研究中心 | 一种知识库构建方法 |
Non-Patent Citations (1)
Title |
---|
胡毅等: ""农业知识库知识检索系统研究与实现"", 《农机化研究》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112667606A (zh) * | 2021-01-15 | 2021-04-16 | 中国科学院空天信息创新研究院 | 一种基于多源知识采集技术的知识库系统及其构建方法 |
CN113393336A (zh) * | 2021-04-30 | 2021-09-14 | 广州法通网络科技有限公司 | 一种基于互联网的为农综合服务平台 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109992645B (zh) | 一种基于文本数据的资料管理系统及方法 | |
US10339453B2 (en) | Automatically generating test/training questions and answers through pattern based analysis and natural language processing techniques on the given corpus for quick domain adaptation | |
CN109614432B (zh) | 一种基于语法分析的获取数据血缘关系的系统及方法 | |
CN102789464B (zh) | 基于语意识别的自然语言处理方法、装置和系统 | |
CN104572849A (zh) | 基于文本语义挖掘的标准化自动建档方法 | |
CN104216913A (zh) | 问题回答框架 | |
CN111899089A (zh) | 基于知识图谱的企业风险预警方法及系统 | |
CN111967761A (zh) | 一种基于知识图谱的监控预警方法、装置及电子设备 | |
CN103886011A (zh) | 一种基于索引文件的社会关系网络创建与检索系统及方法 | |
CN104573009A (zh) | 一种领域知识库属性扩展的方法 | |
CN115422155A (zh) | 一种数据湖元数据模型的建模方法 | |
CN112000929A (zh) | 一种跨平台数据分析方法、系统、设备及可读存储介质 | |
CN115132366A (zh) | 基于健康医疗大数据标准库的多源数据处理方法与系统 | |
CN105868381A (zh) | 用于农业信息服务的知识库检索系统 | |
CN109710730B (zh) | 一种基于自然语言分析处理的巡视信息系统及分析方法 | |
KR101880474B1 (ko) | 고부가 가치화 콘텐츠 정보서비스를 위한 키워드 기반 서비스 제공 방법, 이를 구현하기 위한 프로그램이 저장된 기록매체 및 이를 구현하기 위해 매체에 저장된 컴퓨터프로그램 | |
Wang et al. | A government policy analysis platform based on knowledge graph | |
Dede et al. | Scalable and distributed processing of scientific XML data | |
KR101162468B1 (ko) | 자동적인 데이터 저장소 아키텍처 검출 | |
Shao et al. | An improved approach to the recovery of traceability links between requirement documents and source codes based on latent semantic indexing | |
Mimouni et al. | A relational approach for information retrieval on XML legal sources | |
Wang et al. | Ontology-assisted deep Web source selection | |
Lincheng | A large-scale full-text search engine using DotLuence | |
Xie | The application of artificial intelligence technology in public library information retrieval | |
CN116881538A (zh) | 一种基于大数据应用的短文本信息检索系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160817 |