CN114860917A - 农业知识问答方法、装置、电子设备和存储介质 - Google Patents
农业知识问答方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN114860917A CN114860917A CN202210786940.2A CN202210786940A CN114860917A CN 114860917 A CN114860917 A CN 114860917A CN 202210786940 A CN202210786940 A CN 202210786940A CN 114860917 A CN114860917 A CN 114860917A
- Authority
- CN
- China
- Prior art keywords
- question
- agricultural
- answer
- knowledge
- answering
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 238000003860 storage Methods 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims description 46
- 238000012937 correction Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000012545 processing Methods 0.000 claims description 9
- 241000209094 Oryza Species 0.000 description 29
- 235000007164 Oryza sativa Nutrition 0.000 description 29
- 235000009566 rice Nutrition 0.000 description 29
- 238000005516 engineering process Methods 0.000 description 19
- 201000010099 disease Diseases 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 239000013598 vector Substances 0.000 description 14
- 241000607479 Yersinia pestis Species 0.000 description 12
- 240000002319 Citrus sinensis Species 0.000 description 10
- 235000005976 Citrus sinensis Nutrition 0.000 description 10
- 238000000605 extraction Methods 0.000 description 9
- 241000196324 Embryophyta Species 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 241000207199 Citrus Species 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- 235000021307 Triticum Nutrition 0.000 description 4
- 238000012271 agricultural production Methods 0.000 description 4
- 235000020971 citrus fruits Nutrition 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 206010037660 Pyrexia Diseases 0.000 description 3
- 240000008042 Zea mays Species 0.000 description 3
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 3
- 235000005822 corn Nutrition 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 239000003337 fertilizer Substances 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 239000000575 pesticide Substances 0.000 description 3
- 244000062720 Pennisetum compressum Species 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 241000220225 Malus Species 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 206010035148 Plague Diseases 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/232—Orthographic correction, e.g. spell checking or vowelisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Marine Sciences & Fisheries (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Human Computer Interaction (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- Evolutionary Computation (AREA)
- Mining & Mineral Resources (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及农业知识推荐技术领域,提供一种农业知识问答方法、装置、电子设备和存储介质,其中方法包括:获取用户问题;将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;其中,所述农业知识问答模型包括第一问答模型和第二问答模型;所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。本发明可以提高农业知识问答的效率。
Description
技术领域
本发明涉及农业知识推荐技术领域,尤其涉及一种农业知识问答方法、装置、电子设备和存储介质。
背景技术
随着农业技术和科技的迅速发展,智慧农业的应用范围越来越广。在农业生产中,农户存在大量关于农业知识的问题。例如,农户存在关于种植技术的问答需求,该种植技术可以为选种技术、病虫害防治技术、施肥灌溉技术等等。
目前,农业知识问答服务包括向农技专家现场咨询和电话咨询,以及网络查询等。然而,农技专家资源紧缺,难以满足大量农户的咨询需求,导致无法及时满足用户的问答需求;同时,网络资源存在内容稂莠不齐、维护不及时、时效性差、知识获取效率低等问题,导致无法高效地满足用户的问答需求。
综上,如何提高农业知识问答的效率,是目前亟需解决的问题。
发明内容
本发明提供一种农业知识问答方法、装置、电子设备和存储介质,用以解决现有技术中农业知识问答的效率低的缺陷,实现高效率的农业知识问答。
本发明提供一种农业知识问答方法,包括:
获取用户问题;
将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
根据本发明提供的一种农业知识问答方法,所述第一问答模型基于如下步骤确定回答结果:
将所述用户问题输入至所述第一问答模型的意图识别层,得到所述意图识别层输出的问题所属领域;
从所述农业问答知识库中确定出所述问题所属领域对应的问题集;
将所述用户问题和所述问题集输入至所述第一问答模型的第一相似度判别层,得到所述第一相似度判别层输出的最大相似问题,所述最大相似问题为所述问题集中与所述用户问题最相似的问题,所述最大相似问题与所述用户问题的相似度大于第一设定阈值;
从所述农业问答知识库中确定出所述最大相似问题对应的回答结果。
根据本发明提供的一种农业知识问答方法,所述第二问答模型基于如下步骤确定回答结果:
将所述用户问题输入至所述第二问答模型的实体识别层,得到所述实体识别层输出的目标实体;
从所述目标实体中确定出中心实体,所述中心实体为所述目标实体中置信度最高的实体;
将所述中心实体输入至所述第二问答模型的子图检索层,对所述农业知识图谱进行检索,得到所述子图检索层输出的三元组集,所述三元组集中任一三元组包括实体、属性名和属性值;
将所述用户问题与所述三元组集输入至所述第二问答模型的第二相似度判别层,得到所述第二相似度判别层输出的目标三元组,所述目标三元组为所述三元组集中与所述用户问题最相似的三元组,所述目标三元组与所述用户问题的相似度大于第二设定阈值;
将所述目标三元组输入至所述第二问答模型的输出层,得到所述输出层输出的回答结果。
根据本发明提供的一种农业知识问答方法,所述将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果,包括:
将所述用户问题输入至所述第一问答模型;
在所述第一问答模型输出结果的情况下,确定所述回答结果为所述第一问答模型输出的结果;
在所述第一问答模型未输出结果的情况下,将所述用户问题输入至所述第二问答模型,得到所述第二问答模型输出的回答结果。
根据本发明提供的一种农业知识问答方法,所述农业知识问答模型还包括第三问答模型;
所述将所述用户问题输入至所述第二问答模型,之后还包括:
在所述第二问答模型未输出结果的情况下,将所述用户问题输入至所述第三问答模型,得到所述第三问答模型输出的回答结果,所述回答结果包括预设回答结果和关联问题;
所述关联问题基于如下至少一种方式确定:
基于所述用户问题的语义识别结果,确定与所述用户问题语义相似的关联问题;
基于所述用户问题的输入时间,确定与所述输入时间匹配的关联问题;
确定输入所述用户问题的用户终端,基于所述用户终端的终端位置,确定与所述终端位置匹配的关联问题。
根据本发明提供的一种农业知识问答方法,所述将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果,之前还包括:
基于文本纠错算法,对所述用户问题进行文本纠错处理,以供将纠错后的用户问题输入至所述农业知识问答模型;
其中,所述文本纠错算法中使用的词典是基于对所述农业知识图谱获取的实体名词确定的。
根据本发明提供的一种农业知识问答方法,还包括:
确定所述农业问答知识库中未存在所述用户问题,将所述用户问题分别与所述农业问答知识库中各问题进行相似度计算,确定所述农业问答知识库中与所述用户问题相似的目标问题;
将所述用户问题添加至所述农业问答知识库中,并将所述用户问题确定为所述目标问题的相似问题。
根据本发明提供的一种农业知识问答方法,所述农业问答知识库基于如下步骤构建:
获取问答数据样本,所述问答数据样本包括样本问题及对应的答案;
对所述问答数据样本中各样本问题进行语义相似度计算,得到第一语义相似度计算结果;
基于所述第一语义相似度计算结果,从所述问答数据样本确定出各相似问题集,任一所述相似问题集包括相似的样本问题;
在所述各相似问题集中分别确定出各标准样本问题,并基于所述问答数据样本确定所述各标准样本问题的答案;
基于所述各标准样本问题与所述各标准样本问题的答案,构建所述农业问答知识库。
根据本发明提供的一种农业知识问答方法,所述农业知识图谱基于如下步骤构建:
获取农业知识数据;
对所述农业知识数据进行知识抽取,得到农业知识图谱对应的数据层;
对所述数据层中各实体进行语义相似度计算,得到第二语义相似度计算结果;
基于所述第二语义相似度计算结果,对所述数据层中相似的实体进行合并处理;
基于农业知识图谱对应的模式层和实体合并处理后的数据层,构建所述农业知识图谱。
根据本发明提供的一种农业知识问答方法,所述农业问答知识库包括地理位置信息,所述农业知识图谱包括地理位置信息。
本发明还提供一种农业知识问答装置,包括:
获取模块,用于获取用户问题;
问答模块,用于将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述农业知识问答方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述农业知识问答方法。
本发明提供的农业知识问答方法、装置、电子设备和存储介质,获取用户问题;将用户问题输入至农业知识问答模型,得到农业知识问答模型输出的回答结果。通过上述方式,通过农业知识问答模型,可以自动返回用户问题的回答结果,相比向农技专家咨询更为快速便捷;同时,农业知识问答模型包括第一问答模型和第二问答模型,从而通过两个问答模型可以提供更为准确且有效的回答结果;此外,第一问答模型是基于农业问答知识库获取问题答案,第二问答模型是基于农业知识图谱获取问题答案,而农业问答知识库用于存储非结构化数据,农业知识图谱用于存储结构化数据,从而对于不同类型的问题,可以分别通过第一问答模型和第二问答模型进行回答处理,可以快速且准确地输出用户问题的回答结果;此外,非结构化数据包括农业常见问题及农业常见问题的答案,从而只将农业常见问题进行收纳,可以进一步提高第一问答模型的回答效率。综上,本发明可以提高农业知识问答的效率。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的农业知识问答方法的流程示意图之一;
图2为本发明提供的农业知识问答方法的流程示意图之二;
图3为本发明提供的农业知识问答方法的流程示意图之三;
图4为本发明提供的农业知识问答装置的结构示意图;
图5为本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着农业技术和科技的迅速发展,智慧农业的应用范围越来越广。智慧农业可以提升农业生产效率。在农业生产中,农户存在大量关于农业知识的问题。例如,农户存在关于种植技术的问答需求,该种植技术可以为选种技术、病虫害防治技术、施肥灌溉技术等等。
目前,农业知识问答服务包括向农技专家现场咨询和电话咨询,以及网络查询等。然而,农技专家资源紧缺,难以满足大量农户的咨询需求,导致无法及时满足用户的问答需求;同时,网络资源存在内容稂莠不齐、维护不及时、时效性差、知识获取效率低等问题,导致无法高效地满足用户的问答需求。
此外,现有技术中采用模板的方法从知识图谱中检索答案,该方法存在召回率低的问题,进而导致农业知识问答的准确性降低。
针对上述问题,本发明提出以下各实施例。图1为本发明提供的农业知识问答方法的流程示意图之一,如图1所示,该农业知识问答方法包括:
步骤110,获取用户问题。
在本发明实施例中,该农业知识问答方法的执行主体可以为农业知识问答设备,该农业知识问答设备可以包括但不限于:服务器、台式电脑、笔记本电脑、平板电脑、手机等等。该农业知识问答方法的执行主体还可以为农业知识问答系统,该农业知识问答系统归属于该农业知识问答设备。
此处,用户问题由用户输入,可以为文字输入或者语音输入,本发明实施例对此不作限定。在一实施例中,用于输入该用户问题的输入端可以为该农业知识问答设备。在另一实施例中,用于输入该用户问题的输入端可以为另一输入设备,该输入设备可以为用户终端,该用户终端可以包括但不限于:台式电脑、笔记本电脑、平板电脑、手机、服务器等等。若用于输入该用户问题的输入端为另一输入设备,则该农业知识问答设备可以获取该输入设备的用户问题。
步骤120,将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果。
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
此处,农业知识问答模型用于获取该用户问题的答案。该农业知识问答模型除了包括第一问答模型和第二问答模型,还可以包括更多的问答模型,本发明实施例对此不作限定。
此处,第一问答模型用于从农业问答知识库中检索该用户问题的答案。在一实施例中,该第一问答模型为FAQ(frequently-asked questions,常见问题解答)问答模型。
此处,第二问答模型用于从农业知识图谱中检索该用户问题的答案。具体地,基于信息检索方法,从农业知识图谱中检索候选答案,再对候选答案进行打分和排序,最后将最佳答案作为该用户问题的答案。在一实施例中,该第二问答模型为KBQA(Knowledge BaseQuestion Answering,基于知识库问答)问答模型。
此处,农业问答知识库用于存储较常发生变动的,以及难以结构化的农业知识数据。例如,非结构化数据可以为作物的栽种技术、施肥技术、灌溉技术等。进一步地,农业问答知识库用于存储农业常见问题及农业常见问题的答案。
此处,农业常见问题可以为农户的常见问题,即农户咨询频率较高的问题。
此处,农业知识图谱用于存储较为固定的,以及结构化的农业知识数据。例如,结构化数据可以为作物的品种特性知识、作物的品质特性知识、作物的病虫害防治知识等。进一步地,农业知识图谱可以用于存储较为常见的农业知识。
需要说明的是,农业问答知识库和农业知识图谱,涵盖了水稻、玉米、小麦、柑橘、苹果等作物的品种信息,以及施肥技术、灌溉技术、栽培技术、耕作技术、病虫草害防治技术知识等。进一步地,支持对各知识添加属地特征,满足农业种植品种与区域相适宜的个性化需求。
在一具体实施例中,农业问答知识库为农业种植问答知识库,即农业种植问答知识库用于存储有关作物种植相关的问题及其答案。农业知识图谱为农业种植知识图谱,即农业种植知识图谱用于存储有关作物种植相关的种植知识。基于此,农业知识问答模型为农业种植问答模型,该农业种植问答模型用于提供关于农业种植问题的问题答案。
在一实施例中,先将用户问题输入至第一问答模型,在第一问答模型未输出结果的情况下,再将用户问题输入至第二问答模型。在另一实施例中,先将用户问题输入至第二问答模型,在第二问答模型未输出结果的情况下,再将用户问题输入至第一问答模型。
本发明实施例提供的农业知识问答方法,获取用户问题;将用户问题输入至农业知识问答模型,得到农业知识问答模型输出的回答结果。通过上述方式,通过农业知识问答模型,可以自动返回用户问题的回答结果,相比向农技专家咨询更为快速便捷;同时,农业知识问答模型包括第一问答模型和第二问答模型,从而通过两个问答模型可以提供更为准确且有效的回答结果;此外,第一问答模型是基于农业问答知识库获取问题答案,第二问答模型是基于农业知识图谱获取问题答案,而农业问答知识库用于存储非结构化数据,农业知识图谱用于存储结构化数据,从而对于不同类型的问题,可以分别通过第一问答模型和第二问答模型进行回答处理,可以快速且准确地输出用户问题的回答结果;此外,非结构化数据包括农业常见问题及农业常见问题的答案,从而只将农业常见问题进行收纳,可以进一步提高第一问答模型的回答效率。综上,本发明可以提高农业知识问答的效率。
基于上述实施例,图2为本发明提供的农业知识问答方法的流程示意图之二,如图2所示,所述第一问答模型基于如下步骤确定回答结果:
步骤210,将所述用户问题输入至所述第一问答模型的意图识别层,得到所述意图识别层输出的问题所属领域。
此处,意图识别层用于识别用户问题所属的领域。具体地,意图识别层包括语义识别层,通过语义识别层对用户问题的语义信息,即对用户问题的文本语义编码进行分析,从而得到问题所属领域。
在一实施例中,可以采用FastText分类模型识别出用户问题所属的领域。
为便于理解,例如,用户问题为“小麦适宜用哪种叶面肥”,此时,通过意图识别可将用户问题确定为小麦的施肥技术领域下。
步骤220,从所述农业问答知识库中确定出所述问题所属领域对应的问题集。
具体地,基于问题所属领域,将问题搜索范围从整体的农业问答知识库缩小到问题所属领域对应的问题集,以供后续在相对较小的范围内进行问题答案的搜索匹配,从而加快问题匹配速度,并提升问题匹配准确率。
此处,问题集中各问题为相同领域的问题。
步骤230,将所述用户问题和所述问题集输入至所述第一问答模型的第一相似度判别层,得到所述第一相似度判别层输出的最大相似问题,所述最大相似问题为所述问题集中与所述用户问题最相似的问题,所述最大相似问题与所述用户问题的相似度大于第一设定阈值。
此处,第一相似度判别层用于将用户问题分别与问题集中每一问题进行相似度计算。具体地,通过第一相似度判别层,得到用户问题与问题集中每一问题的相似度,之后,基于各相似度确定与用户问题最为相似的最大相似问题。
更为具体地,通过第一相似度判别层的向量化层,将用户问题与问题集中各问题进行向量化,之后,基于用户问题的特征向量,以及问题集中各问题的特征向量,进行相似度计算,从而从问题集中选择相似度最大的问题。
此处,第一设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
在一实施例中,相似度计算可以采用余弦相似度计算方法,当然也可以为其他相似度计算方法。
进一步地,最大相似问题与用户问题的相似度大于第一设定阈值,即只检索与用户问题的相似度大于第一设定阈值的问题,若问题集中所有问题与用户问题的相似度均小于或等于第一设定阈值,则第一问答模型不输出回答结果。
步骤240,从所述农业问答知识库中确定出所述最大相似问题对应的回答结果。
具体地,从农业问答知识库中确定出最大相似问题对应的回答结果(问题答案),从而供第一问答模型输出该回答结果。
本发明实施例提供的农业知识问答方法,通过意图识别层,确定用户问题的问题所属领域,从而将问题检索范围从农业问答知识库缩小至问题所属领域对应的问题集,从而加快问题检索速度,并提升问题匹配准确率;同时,通过第一相似度判别层,将用户问题分别与问题集中各问题进行相似度计算,确定问题集中与用户问题最相似,且与用户问题的相似度大于第一设定阈值的最大相似问题,从而确保最终输出的回答结果最为准确,进而提高农业知识问答的准确性。综上,本发明实施例可以进一步提高农业知识问答的效率,并进一步提高农业知识问答的准确性。
基于上述任一实施例,图3为本发明提供的农业知识问答方法的流程示意图之三,如图3所示,所述第二问答模型基于如下步骤确定回答结果:
步骤310,将所述用户问题输入至所述第二问答模型的实体识别层,得到所述实体识别层输出的目标实体。
此处,实体识别层用于识别出用户问题中代表实体的短语,从而将这些短语映射到特定的实体上,进而得到目标实体。具体地,通过实体识别层对用户问题中每个词的语义信息,即每个词的词语义编码进行识别分析,从而得到用户问题中每个词的实体识别结果,进而得到目标实体。
该目标实体可以包括多个实体或一个实体,即用户问题中可以包括多个实体或一个实体。
在一实施例中,可以采用BERT+BiLSTM+CRF的方式构建该实体识别层。
步骤320,从所述目标实体中确定出中心实体,所述中心实体为所述目标实体中置信度最高的实体。
具体地,若目标实体包括多个实体,则选择其中置信度最高的实体作为中心实体。若目标实体包括1个实体,则选择该实体作为中心实体。
步骤330,将所述中心实体输入至所述第二问答模型的子图检索层,对所述农业知识图谱进行检索,得到所述子图检索层输出的三元组集,所述三元组集中任一三元组包括实体、属性名和属性值。
此处,子图检索层用于截取农业知识图谱中离中心实体预设距离之内的子图,进而基于该子图确定三元组集。
其中,预设距离可以根据实际需要进行设定,例如2步、3步等等。
在一实施例中,在农业知识图谱中,将中心实体2步之内的相邻节点都作为候选答案,即将各相邻节点作为三元组集。
需要说明的是,农业知识图谱以三元组形式进行存储,具体地,三元组包括实体、属性名和属性值,例如,某一三元组为(稻瘟病,危害对象,水稻),稻瘟病为实体,危害对象为属性名,水稻为属性值。
步骤340,将所述用户问题与所述三元组集输入至所述第二问答模型的第二相似度判别层,得到所述第二相似度判别层输出的目标三元组,所述目标三元组为所述三元组集中与所述用户问题最相似的三元组,所述目标三元组与所述用户问题的相似度大于第二设定阈值。
此处,第二相似度判别层用于将用户问题分别与三元组集中每一三元组进行相似度计算。具体地,通过第二相似度判别层,得到用户问题与三元组集中每一三元组的相似度,之后,基于各相似度确定与用户问题最为相似的目标三元组。也就是说,计算用户问题与三元组集对应的各候选答案的相似度。
更为具体地,通过第二相似度判别层的向量化层,将用户问题与三元组集中各三元组进行向量化,之后,基于用户问题的特征向量,以及三元组集中各三元组的特征向量,进行相似度计算,从而从三元组集中选择相似度最大的目标三元组。
此处,第二设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
在一实施例中,相似度计算可以采用余弦相似度计算方法,当然也可以为其他相似度计算方法。
进一步地,目标三元组与用户问题的相似度大于第二设定阈值,即只检索与用户问题的相似度大于第二设定阈值的三元组,若三元组集中所有三元组与用户问题的相似度均小于或等于第二设定阈值,则第二问答模型不输出回答结果。
步骤350,将所述目标三元组输入至所述第二问答模型的输出层,得到所述输出层输出的回答结果。
此处,输出层用于将目标三元组转换为回答结果(问题答案),从而供第二问答模型输出该回答结果。例如,用户问题为“稻瘟病的危害对象是什么”,则目标三元组为(稻瘟病,危害对象,水稻),进而输出的回答结果为“稻瘟病的危害对象是水稻”。
本发明实施例提供的农业知识问答方法,通过实体识别层,确定用户问题对应的目标实体,进而确定出置信度较高的中心实体,进而基于中心实体,将问题答案检索范围从农业知识图谱缩小至三元组集,从而加快问题答案检索速度,并提升问题答案匹配准确性;同时,通过第二相似度判决层,确定三元组集中与用户问题最相似,且与用户问题的相似度大于第二设定阈值的目标三元组,从而确保最终输出的回答结果最为准确,进而提高农业知识问答的准确性。综上,本发明实施例可以进一步提高农业知识问答的效率,并进一步提高农业知识问答的准确性。
基于上述任一实施例,该方法中,上述步骤120包括:
将所述用户问题输入至所述第一问答模型;
在所述第一问答模型输出结果的情况下,确定所述回答结果为所述第一问答模型输出的结果;
在所述第一问答模型未输出结果的情况下,将所述用户问题输入至所述第二问答模型,得到所述第二问答模型输出的回答结果。
需要说明的是,农业常见问题为经过人工审核的高质量常见问题,因此,优先将用户问题输入至第一问答模型,确保得到的回答结果更为准确;只有当第一问答模型无答案输出时,再将用户问题输入至第二问题模型以获取回答结果。
本发明实施例提供的农业知识问答方法,通过上述方式,优先将用户问题输入至第一问答模型,确保得到的回答结果更为准确,从而进一步提高农业知识问答的准确性。
基于上述任一实施例,该方法中,所述农业知识问答模型还包括第三问答模型;所述将所述用户问题输入至所述第二问答模型,之后还包括:
在所述第二问答模型未输出结果的情况下,将所述用户问题输入至所述第三问答模型,得到所述第三问答模型输出的回答结果,所述回答结果包括预设回答结果和关联问题。
此处,第三问答模型用于在第一问答模型和第二问答模型均无法输出回答结果时,由第三问答模型输出用户问题的问答结果。
需要说明的是,该第三问答模型是用于兜底的,即基于兜底策略,给用户反馈相应的回答结果。
此处,预设回答结果可以根据实际需要进行设定,其为特定答复。例如,预设回答结果为“抱歉暂时无法回复您的问题”,或者,预设回答结果为“抱歉暂时无法回复您的问题,为您推荐以下关联问题”。
此处,关联问题为与用户问题相关联的问题,该关联问题用于供用户选择,若用户选择其中一关联问题,则可以给出该关联问题的回答结果。
该关联问题可以为一个问题或多个问题,本发明实施例对此不作限定。
其中,所述关联问题基于如下至少一种方式确定:
第一种方式:基于所述用户问题的语义识别结果,确定与所述用户问题语义相似的关联问题。
具体地,通过语义识别模型,对用户问题的语义信息,即对用户问题的文本语义编码进行分析,从而得到语义识别结果,进而基于语义识别结果,从预设问题库中筛选出与用户问题语义相似的关联问题。
其中,预设问题库可以为单独构建的问题库,也可以为上述的农业问答知识库。
在一具体实施例中,将用户问题和预设问题库输入至第三相似度判别层,得到第三相似度判别层输出的关联问题。
其中,第三相似度判别层用于将用户问题分别与预设问题库中每一问题进行相似度计算。具体地,通过第三相似度判别层,得到用户问题与预设问题库中每一问题的相似度,之后,基于各相似度确定与用户问题较为相似的关联问题。进一步地,可以将相似度大于第三设定阈值的问题确定为关联问题,并按照相似度大小对关联问题进行排序。其中,第三设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
更为具体地,通过第三相似度判别层的向量化层,将用户问题与预设问题库中各问题进行向量化,之后,基于用户问题的特征向量,以及预设问题库中各问题的特征向量,进行相似度计算,从而从预设问题库中选择相似度大于第三设定阈值的关联问题。
在一实施例中,相似度计算可以采用余弦相似度计算方法,当然也可以为其他相似度计算方法。
第二种方式:基于所述用户问题的输入时间,确定与所述输入时间匹配的关联问题。
具体地,基于用户输入该用户问题的输入时间,从预设问题库中筛选出与输入时间匹配的关联问题。
其中,预设问题库可以为单独构建的问题库,也可以为上述的农业问答知识库。
第三种方式:确定输入所述用户问题的用户终端,基于所述用户终端的终端位置,确定与所述终端位置匹配的关联问题。
具体地,确定用户输入该用户问题的用户终端,基于该用户终端的终端位置,可以确定用户所处的位置,进而可以确定用户所咨询的问题是针对其所处位置来问的,基于此,从预设问题库中筛选出与终端位置匹配的关联问题。
需要说明的是,不同区域的作物习性、环境影响因素等不一样,因此,针对特定区域匹配特定问题,可以更加准确地满足用户的农业知识问答需求。
其中,预设问题库可以为单独构建的问题库,也可以为上述的农业问答知识库。
当然,还可以包括其他方式确定关联问题,本发明实施例不再一一赘述。
本发明实施例提供的农业知识问答方法,通过上述方式,增加第三问题模型,以在第一问答模型和第二问答模型均无法输出回答结果时,可以输出相应的回答结果,从而提升用户的使用体验;同时,第三问答模型输出的回答结果包括关联问题,即可以向用户推荐相关联的问题,以供用户进行问题选择,从而进一步提升用户的使用体验。
基于上述任一实施例,在上述步骤120之前,该方法还包括:
基于文本纠错算法,对所述用户问题进行文本纠错处理,以供将纠错后的用户问题输入至所述农业知识问答模型;
其中,所述文本纠错算法中使用的词典是基于对所述农业知识图谱获取的实体名词确定的。
此处,文本纠错算法可以根据实际需要设定,在一实施例中,文本纠错算法为pycorrector算法。
本发明实施例提供的农业知识问答方法,通过上述方式,在将用户问题输入至农业知识问答模型之前,先对用户问题进行预处理,以将用户问题中存在的错别字进行纠正,从而确保农业知识问答模型正常输出回答结果,进而进一步提高农业知识问答的准确性;同时文本纠错算法中使用的词典是基于对农业知识图谱获取的实体名词确定的,可以使纠正后的用户问题中存在的实体与农业知识图谱更为匹配,从而进一步提高农业知识问答的准确性。
基于上述任一实施例,该方法还包括:
确定所述农业问答知识库中未存在所述用户问题,将所述用户问题分别与所述农业问答知识库中各问题进行相似度计算,确定所述农业问答知识库中与所述用户问题相似的目标问题;
将所述用户问题添加至所述农业问答知识库中,并将所述用户问题确定为所述目标问题的相似问题。
具体地,将用户问题分别与农业问答知识库中各问题进行相似度计算,得到用户问题与各问题的相似度,之后,基于各相似度确定与用户问题较为相似的目标问题。
更为具体地,将用户问题与农业问答知识库中各问题进行向量化,之后,基于用户问题的特征向量,以及农业问答知识库中各问题的特征向量,进行相似度计算,从而从农业问答知识库中选择相似度较大的目标问题。
在一实施例中,目标问题只包括1个,则确定与用户问题最相似的问题为目标问题。
在另一实施例中,目标问题包括多个,则确定与用户问题的相似度大于第四设定阈值的问题为目标问题。该第四设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
在一实施例中,相似度计算可以采用余弦相似度计算方法,当然也可以为其他相似度计算方法。
本发明实施例提供的农业知识问答方法,通过上述方式,基于用户输入的历史问题数据,对农业问答知识库进行优化,将用户问题确定为目标问题的相似问题,以使后续在检索农业问题知识库时,无论是目标问题或者是相似问题,均可以快速定位到该目标问题,进而快速定位到对应的答案,从而进一步提高农业知识问答的效率。
基于上述任一实施例,该方法还包括:
确定所述农业问答知识库中未存在所述用户问题,将所述用户问题添加至所述农业问答知识库中。
本发明实施例提供的农业知识问答方法,通过上述方式,统计未命中的用户问题,将未命中的用户问题添加至农业问答知识库,从而基于用户输入的历史问题数据,不断对农业问答知识库进行优化,进而进一步提高农业知识问答的准确性。
基于上述任一实施例,该方法还包括:
确定所述用户问题的出现频次;基于所述出现频次确定高频问题。
具体地,确定用户问题在历史问题中出现的次数,从而将出现频次大于设定次数阈值的问题确定为高频问题。该设定次数阈值可以根据实际需要进行设定。
需要说明的是,确定高频问题之后,可以对农业问答知识库中该高频问题对应的答案进行维护,从而提高农业问答知识库的准确性。
本发明实施例提供的农业知识问答方法,通过上述方式,统计用户问题的出现频次,进而确定高频问题,以供后续对高频问题进行维护,从而提高农业问答知识库的准确性,进而进一步提高农业知识问答的准确性。
基于上述任一实施例,该方法中,所述农业问答知识库基于如下步骤构建:
获取问答数据样本,所述问答数据样本包括样本问题及对应的答案;
对所述问答数据样本中各样本问题进行语义相似度计算,得到第一语义相似度计算结果;
基于所述第一语义相似度计算结果,从所述问答数据样本确定出各相似问题集,任一所述相似问题集包括相似的样本问题;
在所述各相似问题集中分别确定出各标准样本问题,并基于所述问答数据样本确定所述各标准样本问题的答案;
基于所述各标准样本问题与所述各标准样本问题的答案,构建所述农业问答知识库。
此处,问答数据样本为与农业知识相关的问答数据。
在一具体实施例中,该问答数据样本可以从农业专业网站获取得到。更为具体地,可以编写爬虫从农技推广信息平台等农业专业网站获取农业种植问答数据,并通过人工采集方式收集农户常问问题及答案。其中,答案数据涵盖多种类型,包括文字、图片、视频、网页链接等等。
具体地,将问答数据样本中各样本问题进行语义相似度计算,得到各样本问题彼此之间的相似度,之后,基于各相似度确定各相似问题集,任一相似问题集包括彼此之间相似的样本问题,之后,分别将各相似问题集中相似问题进行合并,即在每一个相似问题集中确定对应的标准样本问题,即一个相似问题集确定一个标准样本问题,最后,基于各标准样本问题及各标准样本问题的答案,构建农业问答知识库。
更为具体地,将问答数据样本中各样本问题进行向量化,之后,基于问答数据样本中各样本问题的特征向量,彼此之间进行相似度计算,从而从问答数据样本中确定出各相似问题集。
此处,各相似问题集可以包括多个相似问题集,也可以包括1个相似问题集。
在一实施例中,确定各样本问题中彼此之间的相似度大于第五设定阈值的两个问题为相似的问题。该第五设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
进一步地,将相似问题集中除标准样本问题之外的其他问题,标记为标准样本问题的相似问题,以使后续在检索农业问题知识库时,无论是标准样本问题或者是标准样本问题的相似问题,均可以快速定位到该标准样本问题,进而快速定位到对应的答案,从而进一步提高农业知识问答的效率。
进一步地,确定问答数据样本中每一样本问题的出现频次;基于每一样本问题的出现频次,对问答数据样本进行过滤,以过滤掉出现频次少于设定次数阈值的低频问题,保留出现频次大于或等于设定次数阈值的高频问题,以供后续对农业问答知识库进行检索时,可以更加快速准确地定位到用户问题对应的答案,进而进一步提高农业知识问答的准确性和效率。
进一步地,对问答数据样本的各样本问题进行分类。具体地,可以基于作物品种进行分类,例如作物品种分为水稻、玉米、小麦等;或者基于问题的类型进行分类,例如问题类型分为病虫草害防治、施肥技术、栽种技术等等,或者基于问题所属的地理位置进行分类,例如地理位置分为黑龙江、山东、河北等。可以理解的是,对问答数据样本的各样本问题进行分类,可以使后续对农业问答知识库进行检索时,可以更加快速准确地定位到用户问题对应的答案,进而进一步提高农业知识问答的准确性和效率。
本发明实施例提供的农业知识问答方法,通过上述方式,将问答数据样本中各相似问题进行合并,从而减少问答数据样本中的问题数,进而使构建的农业问答知识库更为精简,从而进一步提高农业问答知识库的准确性,进而进一步提高农业知识问答的准确性和效率。
基于上述任一实施例,该方法中,所述农业知识图谱基于如下步骤构建:
获取农业知识数据;
对所述农业知识数据进行知识抽取,得到农业知识图谱对应的数据层;
对所述数据层中各实体进行语义相似度计算,得到第二语义相似度计算结果;
基于所述第二语义相似度计算结果,对所述数据层中相似的实体进行合并处理;
基于农业知识图谱对应的模式层和实体合并处理后的数据层,构建所述农业知识图谱。
此处,农业知识数据可以通过编写爬虫、下载、人工等方式进行采集。该农业知识数据可以包括结构化数据和非结构化数据。
在一具体实施例中,该结构化数据可以从中国种业大数据平台、农业农村部肥料登记与备案数据库、农业病虫害数据集、中国农药信息网、农业叙词表AGROVOC等处获取得到。
在一具体实施例中,该非结构化数据可以从农业种植技术文档、农业技术视频等处获取得到。
在本发明实施例中,采用自顶向下的方式构建农业知识图谱,即先构建模式层,再构建数据层。该农业知识图谱以三元组形式进行存储。
其中,模式层是对农业知识的抽象描述,例如,对农业种植场景中知识的抽象描述。模式层由实体类型及其属性和关系组成,如水稻病虫草害防治场景中,可抽象出实体类型水稻品种、病害、虫害、草害、农药等,水稻品种具有品种名称、原产地、品质指标等属性,水稻品种与病害、虫害、草害之间存在“危害对象”关系。
具体地,进行知识建模构建农业知识图谱的模式层。更为具体地,通过领域专家进行知识建模构建农业知识图谱的模式层,即定义农业知识图谱中的实体类型及其属性和关系。例如,核心实体类型包括:作物、病害、虫害、草害、农药、肥料、生态区等;属性包括:作物名称、生长习性、栽培技巧等;关系包括:适宜种植区域、危害对象、防治对象等。
其中,数据层是对模式层的实例化,各实体类型包含多个实例,如实体类型玉米品种包含深两优534、荃优822、连粳11号、龙粳39等实例。
具体地,对农业知识数据进行知识抽取,构建农业知识图谱对应的数据层。更为具体地,对农业知识数据进行数据清洗、实体抽取、属性抽取、关系抽取、数据融合及审校等处理,从而生成由(实体,属性名,属性值)组成的三元组数据集,例如,(稻瘟病,危害对象,水稻)。
在一具体实施例中,对农业知识数据中的结构化数据进行知识抽取的步骤如下:使用基于规则映射的方法,将结构化数据批量转化为三元组。例如,对于农业病虫草害多媒体数据库中的数据,“稻瘟病 异名:稻热病;火烧瘟 简介:水稻三大主要病害之一,各稻区普遍方式…”,将“稻瘟病”映射为一个实体,其实体类型为“病害”;“稻热病”、“火烧瘟”映射为实体“稻瘟病”的属性“别称”;“水稻三大主要病害之一,各稻区普遍方式……”映射为实体“稻瘟病”的简介;并建立“稻瘟病”与“水稻”之间的关系,关系名称为“危害对象”。
在一具体实施例中,对农业知识数据中的非结构化数据进行知识抽取的步骤如下:实体抽取使用实体抽取模型(如BERT+BiLSTM+CRF),关系抽取可以采取基于模板的方法、基于 BERT 语言预训练模型的关系抽取模型。例如,对于一段文本“甜橙的品种数量多,特征特性差异较大,根据品种的主要特性可以分为三个类型:普通甜橙、脐橙和血橙”,可从中抽取出以下三元组:<普通甜橙><是一种><甜橙>、<脐橙><是一种><甜橙>、<血橙><是一种><甜橙>。
具体地,将数据层中各实体进行语义相似度计算,得到各实体彼此之间的相似度,之后,基于各相似度确定各相似实体集,任一相似实体集包括彼此之间相似的实体,之后,分别将各相似实体集中相似实体进行合并,即在每一个相似实体集中确定对应的标准实体,即一个相似实体集确定一个标准实体,最后,基于各标准实体所对应的数据层,以及知识建模确定的模式层,构建农业知识图谱。
更为具体地,将数据层中各实体进行向量化,之后,基于数据层中各实体的词向量,彼此之间进行相似度计算,从而从数据层中确定出各相似实体集。
在一具体实施例中,利用训练后的Bert词向量模型获取实体的词向量表示,再计算各词向量彼此之间的余弦相似度。
在一实施例中,确定各词向量中彼此之间的相似度大于第六设定阈值的两个实体为相似的实体。该第六设定阈值可以根据实际需要进行设定,本发明实施例对此不作限定。
此处,各相似实体集可以包括多个相似实体集,也可以包括1个相似实体集。
在一具体实施例中,实体合并处理是将相似实体集中除标准实体之外的其他实体,作为标准实体的别称。为便于理解,例如,对抽取出的病害实体“柑桔黄龙病”、“黄梢病”,两者实际为同一种柑橘病害,因此进行合并,将“黄梢病”作为实体“柑桔黄龙病”的别称。
其中,审校是对非结构化数据的知识抽取结果进行审核,以将正确结果添加到农业知识图谱数据集中。
本发明实施例提供的农业知识问答方法,通过上述方式,对数据层中相似的实体进行合并处理,以使后续在检索农业知识图谱时,无论是标准实体或者是标准实体的别称,均可以快速定位到该标准实体,进而快速定位到对应的实体,从而进一步提高农业知识问答的效率。
基于上述任一实施例,该方法中,所述农业问答知识库包括地理位置信息,所述农业知识图谱包括地理位置信息。
具体地,农业问答知识库中包括了相关的地理位置信息。更为具体地,农业问答知识库中问题包括了相关的地理位置信息,农业问答知识库中答案包括了相关的地理位置信息。
例如,农业种植场景中,作物种植与所属生态区强相关,因此构建的农业问答知识库中包括了相关的地理位置信息。
具体地,农业知识图谱中包括了相关的地理位置信息。更为具体地,农业知识图谱中实体包括了相关的地理位置信息,农业知识图谱中属性包括了相关的地理位置信息,农业知识图谱中关系包括了相关的地理位置信息。
本发明实施例提供的农业知识问答方法,通过上述方式,对农业问答知识库和农业知识图谱添加属地特征,可以满足不同种植区域的问答需求,从而使农业问答知识库和农业知识图谱更为准确,进而进一步提高农业知识问答的准确性。
在该方法的实际应用过程中,能够采集沉淀农业知识,为农户提供便捷有效的农业智能问答服务,帮助农户快速获取农业种植技术,提升种植水平,提高农业生产效率,助力农业智慧升级。
下面对本发明提供的农业知识问答装置进行描述,下文描述的农业知识问答装置与上文描述的农业知识问答方法可相互对应参照。
图4为本发明提供的农业知识问答装置的结构示意图,如图4所示,该农业知识问答装置,包括:
获取模块410,用于获取用户问题;
问答模块420,用于将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行农业知识问答方法,该方法包括:获取用户问题;将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;其中,所述农业知识问答模型包括第一问答模型和第二问答模型;所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的农业知识问答方法,该方法包括:获取用户问题;将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;其中,所述农业知识问答模型包括第一问答模型和第二问答模型;所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的农业知识问答方法,该方法包括:获取用户问题;将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;其中,所述农业知识问答模型包括第一问答模型和第二问答模型;所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (13)
1.一种农业知识问答方法,其特征在于,包括:
获取用户问题;
将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
2.根据权利要求1所述的农业知识问答方法,其特征在于,所述第一问答模型基于如下步骤确定回答结果:
将所述用户问题输入至所述第一问答模型的意图识别层,得到所述意图识别层输出的问题所属领域;
从所述农业问答知识库中确定出所述问题所属领域对应的问题集;
将所述用户问题和所述问题集输入至所述第一问答模型的第一相似度判别层,得到所述第一相似度判别层输出的最大相似问题,所述最大相似问题为所述问题集中与所述用户问题最相似的问题,所述最大相似问题与所述用户问题的相似度大于第一设定阈值;
从所述农业问答知识库中确定出所述最大相似问题对应的回答结果。
3.根据权利要求1所述的农业知识问答方法,其特征在于,所述第二问答模型基于如下步骤确定回答结果:
将所述用户问题输入至所述第二问答模型的实体识别层,得到所述实体识别层输出的目标实体;
从所述目标实体中确定出中心实体,所述中心实体为所述目标实体中置信度最高的实体;
将所述中心实体输入至所述第二问答模型的子图检索层,对所述农业知识图谱进行检索,得到所述子图检索层输出的三元组集,所述三元组集中任一三元组包括实体、属性名和属性值;
将所述用户问题与所述三元组集输入至所述第二问答模型的第二相似度判别层,得到所述第二相似度判别层输出的目标三元组,所述目标三元组为所述三元组集中与所述用户问题最相似的三元组,所述目标三元组与所述用户问题的相似度大于第二设定阈值;
将所述目标三元组输入至所述第二问答模型的输出层,得到所述输出层输出的回答结果。
4.根据权利要求1所述的农业知识问答方法,其特征在于,所述将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果,包括:
将所述用户问题输入至所述第一问答模型;
在所述第一问答模型输出结果的情况下,确定所述回答结果为所述第一问答模型输出的结果;
在所述第一问答模型未输出结果的情况下,将所述用户问题输入至所述第二问答模型,得到所述第二问答模型输出的回答结果。
5.根据权利要求4所述的农业知识问答方法,其特征在于,所述农业知识问答模型还包括第三问答模型;
所述将所述用户问题输入至所述第二问答模型,之后还包括:
在所述第二问答模型未输出结果的情况下,将所述用户问题输入至所述第三问答模型,得到所述第三问答模型输出的回答结果,所述回答结果包括预设回答结果和关联问题;
所述关联问题基于如下至少一种方式确定:
基于所述用户问题的语义识别结果,确定与所述用户问题语义相似的关联问题;
基于所述用户问题的输入时间,确定与所述输入时间匹配的关联问题;
确定输入所述用户问题的用户终端,基于所述用户终端的终端位置,确定与所述终端位置匹配的关联问题。
6.根据权利要求1所述的农业知识问答方法,其特征在于,所述将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果,之前还包括:
基于文本纠错算法,对所述用户问题进行文本纠错处理,以供将纠错后的用户问题输入至所述农业知识问答模型;
其中,所述文本纠错算法中使用的词典是基于对所述农业知识图谱获取的实体名词确定的。
7.根据权利要求1所述的农业知识问答方法,其特征在于,还包括:
确定所述农业问答知识库中未存在所述用户问题,将所述用户问题分别与所述农业问答知识库中各问题进行相似度计算,确定所述农业问答知识库中与所述用户问题相似的目标问题;
将所述用户问题添加至所述农业问答知识库中,并将所述用户问题确定为所述目标问题的相似问题。
8.根据权利要求1至7中任一项所述的农业知识问答方法,其特征在于,所述农业问答知识库基于如下步骤构建:
获取问答数据样本,所述问答数据样本包括样本问题及对应的答案;
对所述问答数据样本中各样本问题进行语义相似度计算,得到第一语义相似度计算结果;
基于所述第一语义相似度计算结果,从所述问答数据样本确定出各相似问题集,任一所述相似问题集包括相似的样本问题;
在所述各相似问题集中分别确定出各标准样本问题,并基于所述问答数据样本确定所述各标准样本问题的答案;
基于所述各标准样本问题与所述各标准样本问题的答案,构建所述农业问答知识库。
9.根据权利要求1至7中任一项所述的农业知识问答方法,其特征在于,所述农业知识图谱基于如下步骤构建:
获取农业知识数据;
对所述农业知识数据进行知识抽取,得到农业知识图谱对应的数据层;
对所述数据层中各实体进行语义相似度计算,得到第二语义相似度计算结果;
基于所述第二语义相似度计算结果,对所述数据层中相似的实体进行合并处理;
基于农业知识图谱对应的模式层和实体合并处理后的数据层,构建所述农业知识图谱。
10.根据权利要求1至7中任一项所述的农业知识问答方法,其特征在于,所述农业问答知识库包括地理位置信息,所述农业知识图谱包括地理位置信息。
11.一种农业知识问答装置,其特征在于,包括:
获取模块,用于获取用户问题;
问答模块,用于将所述用户问题输入至农业知识问答模型,得到所述农业知识问答模型输出的回答结果;
其中,所述农业知识问答模型包括第一问答模型和第二问答模型;
所述第一问答模型用于基于农业问答知识库获取问题答案,所述农业问答知识库用于存储非结构化数据,所述非结构化数据包括农业常见问题及所述农业常见问题的答案;
所述第二问答模型用于基于农业知识图谱获取问题答案,所述农业知识图谱用于存储结构化数据。
12.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至10任一项所述农业知识问答方法。
13.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至10任一项所述农业知识问答方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210786940.2A CN114860917B (zh) | 2022-07-06 | 2022-07-06 | 农业知识问答方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210786940.2A CN114860917B (zh) | 2022-07-06 | 2022-07-06 | 农业知识问答方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114860917A true CN114860917A (zh) | 2022-08-05 |
CN114860917B CN114860917B (zh) | 2022-10-18 |
Family
ID=82625617
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210786940.2A Active CN114860917B (zh) | 2022-07-06 | 2022-07-06 | 农业知识问答方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114860917B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117216194A (zh) * | 2023-11-08 | 2023-12-12 | 天津恒达文博科技股份有限公司 | 文博领域知识问答方法及装置、设备和介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
US20190171656A1 (en) * | 2017-05-10 | 2019-06-06 | Boe Technology Group Co., Ltd. | Traditional chinese medicine knowledge graph and establishment method therefor, and computer system |
CN110597969A (zh) * | 2019-08-12 | 2019-12-20 | 中国农业大学 | 一种农业知识智能问答方法、系统以及电子设备 |
CN111831794A (zh) * | 2020-07-10 | 2020-10-27 | 杭州叙简科技股份有限公司 | 一种基于知识图谱的综合管廊行业知识问答系统构建方法 |
CN113468304A (zh) * | 2021-06-28 | 2021-10-01 | 哈尔滨工程大学 | 一种基于知识图谱的船舶靠离泊知识问答查询系统的构建方法 |
CN114328946A (zh) * | 2021-11-19 | 2022-04-12 | 杭州派尼澳电子科技有限公司 | 一种基于知识图谱的隐患处理方法 |
CN114490964A (zh) * | 2021-12-22 | 2022-05-13 | 安徽省农业科学院农业经济与信息研究所 | 基于知识图谱的土壤肥力知识问答方法、系统、设备及介质 |
-
2022
- 2022-07-06 CN CN202210786940.2A patent/CN114860917B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190171656A1 (en) * | 2017-05-10 | 2019-06-06 | Boe Technology Group Co., Ltd. | Traditional chinese medicine knowledge graph and establishment method therefor, and computer system |
CN108804521A (zh) * | 2018-04-27 | 2018-11-13 | 南京柯基数据科技有限公司 | 一种基于知识图谱的问答方法及农业百科问答系统 |
CN110597969A (zh) * | 2019-08-12 | 2019-12-20 | 中国农业大学 | 一种农业知识智能问答方法、系统以及电子设备 |
CN111831794A (zh) * | 2020-07-10 | 2020-10-27 | 杭州叙简科技股份有限公司 | 一种基于知识图谱的综合管廊行业知识问答系统构建方法 |
CN113468304A (zh) * | 2021-06-28 | 2021-10-01 | 哈尔滨工程大学 | 一种基于知识图谱的船舶靠离泊知识问答查询系统的构建方法 |
CN114328946A (zh) * | 2021-11-19 | 2022-04-12 | 杭州派尼澳电子科技有限公司 | 一种基于知识图谱的隐患处理方法 |
CN114490964A (zh) * | 2021-12-22 | 2022-05-13 | 安徽省农业科学院农业经济与信息研究所 | 基于知识图谱的土壤肥力知识问答方法、系统、设备及介质 |
Non-Patent Citations (1)
Title |
---|
廖开际 等: "在线医疗社区问答文本的知识图谱构建研究", 《情报科学》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117216194A (zh) * | 2023-11-08 | 2023-12-12 | 天津恒达文博科技股份有限公司 | 文博领域知识问答方法及装置、设备和介质 |
CN117216194B (zh) * | 2023-11-08 | 2024-01-30 | 天津恒达文博科技股份有限公司 | 文博领域知识问答方法及装置、设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
CN114860917B (zh) | 2022-10-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20200301954A1 (en) | Reply information obtaining method and apparatus | |
CN110597969B (zh) | 一种农业知识智能问答方法、系统以及电子设备 | |
CN110162593A (zh) | 一种搜索结果处理、相似度模型训练方法及装置 | |
CN110750649A (zh) | 知识图谱构建及智能应答方法、装置、设备及存储介质 | |
CN113360616A (zh) | 自动问答处理方法、装置、设备及存储介质 | |
CN110209839B (zh) | 农业知识图谱构建装置、方法及计算机可读存储介质 | |
CN108154198A (zh) | 知识库实体归一方法、系统、终端和计算机可读存储介质 | |
CN112633504A (zh) | 一种基于知识图谱的果树病虫害智慧云知识服务系统及方法 | |
CN109408811A (zh) | 一种数据处理方法及服务器 | |
Sultanov et al. | Application of swarm techniques to requirements tracing | |
Jain et al. | AgriBot: agriculture-specific question answer system | |
Godara et al. | Sequential pattern mining combined multi-criteria decision-making for farmers’ queries characterization | |
CN114860917B (zh) | 农业知识问答方法、装置、电子设备和存储介质 | |
Deepa et al. | An effective automated ontology construction based on the agriculture domain | |
Wang et al. | Mushroom toxicity recognition based on multigrained cascade forest | |
CN113673246A (zh) | 语义融合和知识蒸馏的农业实体识别方法和装置 | |
CN113434644B (zh) | 一种农技知识服务方法及系统 | |
Usip et al. | A machine learning-based mobile Chatbot for crop farmers | |
Kovvuri et al. | Disruptive technologies for smart farming in developing countries: Tomato leaf disease recognition systems based on machine learning | |
Chen et al. | RoBERT-Agr: An Entity Relationship Extraction Model of Massive Agricultural Text Based on the RoBERTa and CRF Algorithm | |
Suganya et al. | Ontology based information extraction-a review | |
CN116049376A (zh) | 一种信创知识检索回复的方法、装置和系统 | |
CN114153946A (zh) | 一种智能检索方法、装置、设备及存储介质 | |
CN113724817A (zh) | 基于人工智能的知识推荐方法、装置、计算机设备及介质 | |
Wilson et al. | User Needs-driven Enrichment of Ontology: A case study in Sri Lankan Agriculture |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |