CN114021546A - 迁移语境网络的大桃生产知识开放问答方法及装置 - Google Patents
迁移语境网络的大桃生产知识开放问答方法及装置 Download PDFInfo
- Publication number
- CN114021546A CN114021546A CN202111051429.XA CN202111051429A CN114021546A CN 114021546 A CN114021546 A CN 114021546A CN 202111051429 A CN202111051429 A CN 202111051429A CN 114021546 A CN114021546 A CN 114021546A
- Authority
- CN
- China
- Prior art keywords
- question
- network
- knowledge
- matching
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 235000006040 Prunus persica var persica Nutrition 0.000 title claims abstract description 93
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 90
- 240000005809 Prunus persica Species 0.000 title description 9
- 244000144730 Amygdalus persica Species 0.000 claims abstract description 84
- 230000004044 response Effects 0.000 claims abstract description 39
- 238000013508 migration Methods 0.000 claims abstract description 33
- 230000005012 migration Effects 0.000 claims abstract description 33
- 238000012549 training Methods 0.000 claims description 69
- 238000005457 optimization Methods 0.000 claims description 28
- 238000002372 labelling Methods 0.000 claims description 24
- 230000015654 memory Effects 0.000 claims description 16
- 238000005065 mining Methods 0.000 claims description 13
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 9
- 238000013136 deep learning model Methods 0.000 claims description 9
- 238000013140 knowledge distillation Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 8
- 230000002688 persistence Effects 0.000 claims description 4
- 230000010076 replication Effects 0.000 claims description 4
- 238000007418 data mining Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000003860 storage Methods 0.000 description 7
- 238000012271 agricultural production Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000007547 defect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009313 farming Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000009331 sowing Methods 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 240000002381 Prunus davidiana Species 0.000 description 1
- 235000015533 Prunus davidiana Nutrition 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000009412 basement excavation Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 244000144972 livestock Species 0.000 description 1
- 238000003754 machining Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 244000144977 poultry Species 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/242—Dictionaries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种迁移语境网络的大桃生产知识开放问答方法及装置,所述方法包括:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。本发明提供的迁移语境网络的大桃生产知识开放问答方法及装置,通过知识迁移有效构建生产知识库,通过数据挖掘与清晰、问句意图分类、问句语义理解以及应答匹配等方式,立体化提升生产知识问答的准确性和鲁棒性,能最大程度满足用户对生产知识的获取。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种迁移语境网络的大桃生产知识开放问答方法及装置。
背景技术
随着信息技术算力的持续发展,人工智能领域发展迅猛,特别是自然语言处理中的智能问答,在医学、法律、互联网相关的客服领域发挥着重要作用。针对任一农业产品的产业发展的过程,贯穿生产、加工、销售的经验和技术决定着农户的实际收成。
目前,是由农业技术专家通过现场服务、技术培训、网络视频课件制作以及远程服务等手段提供生产知识服务,能够解决一部分农户的生产问题,但毕竟专家数目、精力有限,面向关键农时的海量需求无法快速地精确地提供指导服务。因此,利用人工智能服务及平台化应用,让机器像农业专家一样学习知识,通过云服务分发给用户,解决专家响应不及时、知识服务效率受限的问题,成为主流选择。
但由于在数据预处理方面,准确率较高的处理模型复杂度高,通常需要配套高性能云服务器(GPU Cloud Computing,GPU),较高的成本需求应用难以适应农业领域的需求;在知识库体量方面,需要人工进行大量的数据采集、筛选、清洗、入库,费时费力,且需要专人执行。且垂直领域的问答系统,通常难以满足农户问答习惯,在应用中过于生硬,常常出现“答非所问”的情况,从而降低了使用者对问答系统的兴趣;此外,大部分问答系统的服务模式比较单一,在跨平台服务方面不够理想。
发明内容
本发明提供一种迁移语境网络的大桃生产知识开放问答方法及装置,用以解决或部分解决现有技术所存在的缺陷。
第一方面,本发明提供一种迁移语境网络的大桃生产知识开放问答方法,包括:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,在将获取的问句文本输入至训练好的问句意图分类网络之前,包括:
进行多源数据采集,构建农业知识库;利用预先训练好的生成对抗网络对所述农业知识库进行语料扩充,获取增强农业知识库;对所述增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典;利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,以获取所述训练好的问句意图分类网络。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,所述对所述增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典,包括:
对所述增强农业知识库进行语料清洗,获取目标产业知识库;基于左右熵及互信息提取所述目标产业知识库中的种子词汇;以所述种子词汇为标注样本,对预先构建的深度学习模型进行训练,并利用训练好的深度学习模型对所述目标产业知识库进行迭代挖掘,构建目标产业词典;采用人机辅助聚类标注法,对所述目标产业词典中的所有语料进行聚合处理,以获取所述目标产业优化词典。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,所述问句意图分类网络是基于卷积神经网络模型构建的;所述利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,包括:
从所述目标产业优化词典中随机挑选出多个语料样本,并为每个所述语料样本标注对应的分类标签;将每个所述语料样本和对应的分类标签的组合作为一个训练样本,获得多个训练样本;利用所述多个训练样本对预先构建的问句意图分类网络进行预训练。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,所述将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句,包括:
选择知识增强的语义表示网络ERNIE模型作为教师模型,选择文本卷积网络TextCNN模型作为学生模型;通过知识蒸馏层连接所述ERNIE模型和所述TextCNN模型,以搭建教师-学生网络作为所述问句相似度匹配网络;将所述问句语义信息输入至所述教师-学生网络,以获取有所述教师-学生网络输出的匹配问句。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,在将所述问句语义信息输入至所述教师-学生网络之前,还包括:
利用全网公共问答数据集,对所述ERNIE模型进行预训练,直至达到第一预设训练次数;利用所述目标产业优化词典,对预训练后的ERNIE模型进行精调训练,直至训练结果收敛或达到第二预设训练次数。
根据本发明提供的一种迁移语境网络的大桃生产知识开放问答方法,在将所述匹配应答反馈给用户之后,还包括:
接收所述用户对所述匹配应答的反馈信息;在所述反馈信息满足预设条件的情况下,将所述问句文本作为样本,将所述匹配应答作为所述问句文本对应的标签,构建反馈样本;将所述句意图分类网络与所述问句相似度匹配网络作为整体网络,并利用所述反馈样本对所述整体网络进行训练。
第二方面,本发明还提供一种迁移语境网络的大桃生产知识开放问答装置,包括:语义分类单元,用于将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;问句匹配单元,用于将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;应答匹配单元,用于根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
第三方面,本发明还提供一种迁移语境网络的大桃生产知识开放问答系统,包括:语音识别装置、搜索服务器、中控业务调度服务器、 Redis服务器、API接口调用服务器以及上述的迁移语境网络的大桃生产知识开放问答装置。
所述语音识别装置,实现语音识别服务,用于接收用户输入的问句语音生成所述问句文本;所述搜索服务器是基于Lucene实现的,采用RESTful web接口以提供分布式多用户能力全文搜索引擎;所述中控业务调度服务器,构建所述Redis服务器与所述API接口调用服务器之间的连接,用于实现不同类型的业务数据的调度;所述Redis 服务器,用于通过主从数据复制方法提供高可用分布式服务,并采用 RDB和AOF两种持久化方案,将内存数据保存到硬盘中;所述内存数据包括问答数据库和目标产业优化词典;所述API接口调用服务器,用于提供所述语音识别装置与所述大桃生产知识开放问答装置之间的连接,并为所述大桃生产知识开放问答系统互联网数据接口调用服务。
第四方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述迁移语境网络的大桃生产知识开放问答方法的步骤。
第五方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述迁移语境网络的大桃生产知识开放问答方法的步骤。
本发明提供的迁移语境网络的大桃生产知识开放问答方法及装置,通过知识迁移有效构建生产知识库,通过数据挖掘与清晰、问句意图分类、问句语义理解以及应答匹配等方式,立体化提升生产知识问答的准确性和鲁棒性,能最大程度满足用户对生产知识的获取。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的大桃生产知识开放问答方法的流程示意图之一;
图2是本发明提供的大桃生产知识开放问答方法的流程示意图之二;
图3是本发明提供的问句意图分类网络的运行示意图;
图4是本发明提供的一种基于生成对抗网络实现语料控制的流程示意图;
图5是本发明提供的一种知识蒸馏流程示意图;
图6是本发明提供的大桃生产知识开放问答装置的结构示意图;
图7是本发明提供的大桃生产知识开放问答系统的结构示意图;
图8是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
生产知识开放问答,例如大桃生产知识开放问答的核心要素有以下几个方面:相关语料的精确与充分、问答系统的准确度与实时响应、专业知识的跨平台一致性等,本发明的目的主要是在问答系统模型构建和服务过程中减少非必要人工参与,降低模型训练过程中的载体成本,进而通过多类型平台服务以满足农业生产过程中大部分场景的知识获取需求。
下面结合图1-图8描述本发明实施例所提供的迁移语境网络的大桃生产知识开放问答方法及装置。
图1是本发明提供的大桃生产知识开放问答方法的流程示意图之一,如图1所示,包括但不限于以下步骤:
步骤101:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;
步骤102:将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;
步骤103:根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
为便于清楚的展示本发明提供的生产知识开放问答方法,在后续实施例中均以农业生产场景,特别是以大桃种植相关的大桃生产知识开放问答为例进行说明,其不视为对本发明保护范围的具体限定,例如:这一知识开放问答的领域还可以涉及机械加工、交通运行等涉及人工智能相关的人机智能交互场景,在农业生产场景下,可以与用于大桃种植、柑橘种植、家禽(家畜)养殖等所有农产品相关的生产知识开放问答。
本发明提供的迁移语境网络的大桃生产知识开放问答方法,能有效针对农业生产场景中,因多源知识数据智能化利用率低、数据价值赋能慢、数据分布孤岛严重以及服务质量残次不齐等,造成生产知识服务的形式杂乱、服务的及时性和准确性难以保障等方面不足,进而造成本来较少接触互联网特别是农业智能系统的用户使用粘度低,甚至错误的反馈对生产环节相关工作造成负面影响的问题。
图2是本发明提供的大桃生产知识开放问答方法的流程示意图之二,如图2所示,在接收到用户输入的对生产知识进行的提问语音后,可以借助开源的语音转文字软件,将提问语音转换成问句文本。
针对农业生产知识问答场景中所涉及问题的复杂性和多样性,例如:桃树的品种、病虫害、生长环境、销售价格等相关场景,本发明通过将问句文本输入至预先训练好的问句意图分类网络,以利用问句意图分类网络解决问答过程中用户提问的复杂性和多样性。针对不同层级的分类,利用局部感知的思想,有效提取出问句文本中的关键特征,以降低问句识别的复杂度,以有效地提升用户对话意图分类的准确性。
通过问句意图分类网络对问句文本进行问句意图分类之后,输出带有分类标签的问句语义信息。
假设用户输入的提问语音所对应的问句文本为:“你好,请问一下,我种植的桃树在几月前出现了流胶病,通常是如何防治?”,将这一问句文本输入至则预先训练好的问句意图分类网络,则可以确定出其分类标签的问句语义信息包括:“桃树的流胶病通常出现在几月前,如何防治?”,其对应的标签可以是“桃树”、“流胶病”、“防治”中的至少一个,通过提取出来的问句语义信息能够更明确的获知用户提问的真实意图。
进一步地,在获取到问句语义信息之后,将其输入至预先训练好的问句相似度匹配网络,以获取与之对应的至少一个匹配问句。
由于用户的口语表达是灵活多变的,甚至在不同语境下,相同的问句语义信息实际上是对应着不同的问句。本发明通过引入基于词隐藏原理的问句相似度匹配网络,针对不同表达方式下,每个问句语义信息所蕴含的真实语义进行准确的理解。
考虑到常用的卷积循环神经网络(Recurrent Neural Network, RNN)、双向长短期记忆神经网络(Bi-directional Long Short-Term Memory,Bi-LSTM)等深度学习模型经常存在标注困难、信息泄露等问题,本发明以带有语义理解特性的知识增强的语义表示模型 (Enhanced Representation from knowledge Integration,ERNIE)为基础训练、构建问句相似度匹配网络,采用对话语言模型(Dialogue Language Model,DLM)进行语义建模,学习语料建隐式关系。通过对预先构建的ERNIE模型进行预训练以及精调优化作为训练好的问句相似度匹配网络,通过建模海量数据中的实体概念等先验语义知识,学习显示对话的语义关系,并通过先验语义知识单元进行建模,增强了语义表示能力,进一步地提升了语义理解的准确度。
具体来说,将问句语义信息输入至训练好的问句相似度匹配网络后,自动从预先构建的问答数据库中筛选出与之匹配度最高的至少一个匹配问句。
图3是本发明提供的问句意图分类网络的运行示意图,如图3所示,在问句语义信息为:“桃树的流胶病通常出现在几月前,如何防治?”的情况下,将其输入至问句相似度匹配网络,通过获取问句语义信息中的关键字,如“流胶病”、“几月前”则能够获取到由其输出的至少一个匹配问句为:“如何进行桃树流胶病防治?”,其可能输出的另一个匹配问句为:“何时进行桃树流胶病防治?”,或者其输出的另一个匹配问句为:“进行桃树流胶病防治的药物有哪些?”等。
进一步地,在获取到用户提问相关的匹配问句之后,可以根据匹配问句自动从预先构建的问答数据库中,找出与每个匹配问句相对应的匹配应答。
最后将所有的匹配应答反馈给该用户。
作为一种可选的反馈方式,可以将匹配应答通过开源的文字转语音软件,转换成对应的应答语音输出,以供用户接受参考。
本发明提供的迁移语境网络的大桃生产知识开放问答方法及装置,通过知识迁移有效构建生产知识库,通过数据挖掘与清晰、问句意图分类、问句语义理解以及应答匹配等方式,立体化提升生产知识问答的准确性和鲁棒性,能最大程度满足用户对生产知识的获取。
基于上述实施例的内容,作为一种可选实施例,在将获取的问句文本输入至训练好的问句意图分类网络之前,包括:
进行多源数据采集,构建农业知识库;
利用预先训练好的生成对抗网络对所述农业知识库进行语料扩充,获取增强农业知识库;
对所述增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典;
利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,以获取所述训练好的问句意图分类网络。
本发明提供的大桃生产知识开放问答方法,在正式投入运行之前,还包括:进行多源数据采集,并由采集到的所有多源数据,构建农业知识库,并基于序列对抗网络对采集的数据进行扩充;然后,采用定向挖掘与知识聚类,构建用于解决目标产业的专业词典,以缩小知识库的规模。另外,还包括利用所获取到的专业词典中的语料,对问句意图分类网络以及问句相似度匹配网络进行预训练,以提高各网络的识别鲁棒性以及识别效率和识别精度。
下面以大桃生产知识开放问答为例进行说明,上述实现多源数据采集,构建农业知识库的步骤,包括但不限于:
通过不同渠道开展广泛的数据挖掘,按照大桃生产知识类型采集语料,构建农业知识库。
基础的,Scrapy是一个适用爬取网站数据、提取结构性数据的应用程序框架,本发明通过Scrapy框架,实现一个爬虫,在可知识共享的平台、论坛、社区以及问答网站进行数据采集和清洗,形成覆盖范围广泛的农业知识库。
深入地,本发明还通过对问答类型标准形式的平台,进行多元素记录,包括问题上报时间、地点等,以为季节性、周期性的共性问句提供基础语料支撑。
重要地,由于用户的对话、提问数据具有日常化、口语化的表达特征,因此本发明采集这类数据作为基础数据,为后续的问句语义理解奠定基础。
图4是本发明提供的一种基于生成对抗网络实现语料控制的流程示意图,如图4所示,为解决现有语料数量有限、采集费事费力的缺陷,本发明借助预先训练好的生成对抗网络,例如训练后的序列对抗网络(Sequence Generative Adversarial Networks,seqGAN)在原有的农业知识库(即图4中的真实样本集)的基础上生成更多的无标签数据样本,并将由seqGAN所制造的样本集与原有的真实样本集共同构成增强农业知识库(即图4中的合成数据集)。
如图4所示,本发明可以进一步将知识蒸馏与seqGAN相结合,以降低了硬件载体性能的要求,有效降低seqGAN的模型部署的门槛。
例如,可以利用循环神经网络(Recurrent Neural Network,RNN) 作为seqGAN的生成模型,以卷积神经网络(Convolutional Neural Networks,CNN)作为seqGAN的判断模型。
而在构建、训练生成模型RNN时,可有采用知识蒸馏的方式,即通过对一个参数量大、学习能力较强的教师模型进行预训练,并将预训练后学习到的特征再传递给参数量较小、学习能力较弱的学生模型,在实际运行语料扩充的过程中,由其生成假样本集。
一方面,将生成的假样本集中的一部分语料(例如20%)直接加入至制造的样本集中;另一方面,利用判别模型CNN对假样本集中剩余的一部分语料进行判别,并将其中正确的加入至制造的样本集中;最后,将制造的样本集中的所有语料与真实样本集中的所有语料一起构成合成数据集作为最终的增强农业知识库。
进一步地,本发明通过对所述增强农业知识库进行定向挖掘与知识聚类,以获取目标产业优化词典,以针对增强农业知识库中可能出现的无效语料、重复含义等语料的删除。
本发明提供的大桃生产知识开放问答方法,为避免农业部分类型的语料单一,特别是生僻知识以及采集过程中数据源以及采集方式原因导致样本数据覆盖率低的情况,通过GAN网络采用博弈的思想形成相似数据样本,增加训练基础语料库大小。
作为一种可选实施例,本发明提供一种大桃生产知识开放问答方法,所述对增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典,包括:
对增强农业知识库进行语料清洗,获取目标产业知识库;
基于左右熵及互信息提取所述目标产业知识库中的种子词汇;
以所述种子词汇为标注样本,对预先构建的深度学习模型进行训练,并利用训练好的深度学习模型对所述目标产业知识库进行迭代挖掘,构建目标产业词典;
采用人机辅助聚类标注法,对所述目标产业词典中的所有语料进行聚合处理,以获取所述目标产业优化词典。
(1)对获取到的大桃产业相关的增强农业知识库进行语料清洗,包括但不限于:筛选掉闲聊语料或和大桃产业无关的语料,减少其对大桃生产知识开放问答的干扰,最终获取到精简后的目标产业知识库 (此处可以称作大桃知识库)。
其中,筛选的方式可以采用人工标注方式,或者借助现有的自动识别标注的方式,对此本发明不作具体的限定。
(2)通过左右熵、互信息手段,从大桃知识库中的所有语料中,挑选出种子词汇,种子词汇的获取能够为后续的迭代挖掘的产出质量起关键性作用,可以采用人工标注方式进行。
例如,可以将与大桃种植、采摘、销售、存储等相关的语料设置为种子词汇,可以是名词、动词、介词。对此可以根据实际产业的不同进行设置。
其中,互信息体现了两个变量之间的相互依赖程度,如:二元互信息是指两个事件(记为事件X和事件Y)相关性的量。互信息的值越高,表明事件X和事件Y相关性越高,则事件X和事件Y组成短语的可能性越大;反之,互信息值越低,事件X和事件Y之间相关性越低,则事件X和事件Y之间存在短语边界的可能性越大。
信息熵是表示随机变量不确定性的量度,具体表述如下:
一般地,设事件X是取有限个值的随机变量(或者说X是有限个离散事件的概率场),事件X取值x的概率为P(x),则由这一概率可以事件X的熵,对此定义跟发明不作具体的限定。
左右熵是指多字词表达的左边界的熵和右边界的熵,以左熵的计算为例,对一个多字词左边所有可能的词以及词频,计算信息熵,然后求和。
基于左右熵及互信息提取所述目标产业知识库中的种子词汇的步骤,可以是:
(1)先将目标产业知识库中需要计算的任一语料(称作目标领域词表)和其他领域词表中的词按频次排序,即计算每个领域词和其他领域词的左右熵及互信息,并按照计算结果进行排序。
(2)再将目标领域词表同其他领域词表导入同一个数据表中,对同一个语料在两表中的排序位次值做除法。
(3)在目标领域词表中按照位序比值设定阈值抽取词汇。
通过上述位序比的方法,抽取种子词汇,例如:将目标领域和其它领域共有的按照频次排序前5000词作为种子词汇。
(4)播撒种子、迭代挖掘:以上述方式获取到种子词汇之后,以种子词汇为标注样本,采用CRF++、Bi-LSTM等深度学习模型进行多轮迭代挖掘,形成目标产业词典(此处可以称作大桃产业词典),保证准确识别农业知识主体的同时,提高智能问答机器人的对话可持续性。
进一步地,为了解决大桃产业词典中存在重复相似问答造成数据的冗余,或者可能会造成用户体验的不一致性,采用人机辅助聚类标注的方法,对目标产业词典中所涉及的所有知识(语料)进行有效聚合,以降低目标产业词典的规模。
具体地,从目标产业词典中挑选当前一组数据,并将这一组数据中可以归为一类的问题,设置为当前问题的中心问题,并设置当前中心问题。其中,中心问题又指最能简要描述这一组数据中占比最大的问题。
考虑到语料的定向挖掘是保障语料库有效的核心法,也是问答模型训练的基础,本发明提供的迁移语境网络的大桃生产知识开放问答方法,提出通过农业语料清洗,左右熵、互信息种子词汇获取并进行种子播撒利用深度学习模型进行多轮迭代挖掘的手段最大程度保障农业主体被识别。
作为一种可选实施例,本发明提供一种采用人机辅助聚类标注法,对所述目标产业词典中的所有语料进行聚合处理,以获取所述目标产业优化词典的方法,包括但不限于以下步骤:
(1)由领域专家制定分类标准和标注规范,并给出样例作为第一数据;
(2)以第一数据作为聚类的中心点对目标产业词典中的所有语料进行聚类处理,选出第二数据来训练标注人员,利用第一数据对标注人员进行测试,测试通过即可进行下一步的标注;
(3)利用第一数据和第二数据作为训练集,对未分类的所有语料再次进行分类,得到的置信度高的语料可直接采用,并将其加入训练数据集重新训练分类器;
(4)从目标产业词典中选取出最值得标注的数据,分发给标注人员进行标注,将得到的标注结果加入训练集重新训练分类器;
(5)迭代步骤(3)和(4),直至分类器的精度达到预设的阈值。
(6)利用分类器完成对目标产业词典中的所有语料的集合。
基于上述实施例的内容,作为一种可选实施例,所述问句意图分类网络是基于CNN构建的;
所述利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,包括:
从所述目标产业优化词典中随机挑选出多个语料样本,并为每个所述语料样本标注对应的分类标签;
将每个所述语料样本和对应的分类标签的组合作为一个训练样本,获得多个训练样本;
利用所述多个训练样本对预先构建的问句意图分类网络进行预训练。
针对大桃生产相关的生产知识问答场景中所涉及问题的复杂性和多样性,例如桃树的品种、病虫害、生长环境、销售价格等,本发明通过局部感知的思想,有效提取问句中的关键特征,采用CNN模型作为问句意图分类网络的基础模型框架,以实现用户较好的对话意图的准确分类。
在模型预训练阶段,从目标产业优化词典中随机挑选出的训练语料在15万个以上,利用训练语料作为语料样本,采用人机协同数据标注分别为每个语料样本设置分类标签,完成对初始的CNN模型参数的定义与训练,并根据实际对话意图分类效果分析,对初始CNN 模型不断迭代优化,获取到问句意图分类网络。
基于上述实施例的内容,作为一种可选实施例,所述将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句,包括:
选择知识增强的语义表示网络ERNIE模型作为教师模型,选择文本卷积网络TextCNN模型作为学生模型;
通过知识蒸馏层连接所述ERNIE模型和所述TextCNN模型,以搭建教师-学生网络作为所述问句相似度匹配网络;
将所述问句语义信息输入至所述教师-学生网络,以获取有所述教师-学生网络输出的匹配问句。
图5是本发明提供的一种知识蒸馏流程示意图,如图5所示,本发明为了在有效提升模型训练效率的基础上,降低模型的复杂度,采用知识蒸馏的方法构建问句相似度匹配网络,主要表现在:
利用大型复杂的神经网络,如参数量大、学习能力较强的ERNIE 模型,作为教师模型。通过对ERNIE模型进行训练,并将其训练获取到的特征传递给小型圣经网络,如参数量较小、学习能力较弱的 TextCNN模型,在对模型进行有效压缩的同时,降低了硬件载体性能的要求,有效降低模型部署的门槛。
本发明提供的迁移语境网络的大桃生产知识开放问答方法,能有效地降低高精确度模型带来的高复杂度弊端,通过知识蒸馏原理利用 ERNIE模型的先验知识,作为学生模型的输入,使低复杂度的学生模型具有与教师模型相似的能力,使深度网络在用户端部署成为可能。
基于上述实施例的内容,作为一种可选实施例,在将所述问句语义信息输入至所述教师-学生网络之前,还包括:
利用全网公共问答数据集,对所述ERNIE模型进行预训练,直至达到第一预设训练次数;
利用所述目标产业优化词典,对预训练后的ERNIE模型进行精调训练,直至训练结果收敛或达到第二预设训练次数。
ERNIE模型通过建模海量数据中的实体概念等先验语义知识,学习真实世界的语义关系。具体来说,ERNIE模型通过对词、实体等语义单元的掩码,使得模型学习完整概念的语义表示。相较于BERT 学习原始语言信号,ERNIE模型直接对先验语义知识单元进行建模,增强了模型语义表示能力。
由于用户的口语表达灵活多变,为问句相似度匹配网络根据识别到的问句语义信息匹配出正确的匹配问句提出了较大的挑战,为解决这一问题,本发明通过带有语义理解特性的ERNIE模型,采用DLM 进行语义建模,学习语料建隐式关系,其具体的训练步骤包括:
(1)预训练阶段:引入多源数据知识,采用约10亿量级的全网公共问答数据,在高性能GPU集群上训练ERNIE模型,训练次数可以设置为200万步。
ERNIE模型的训练语料引入了多源数据知识。除了百科类文章建模,还可以对新闻资讯类、论坛对话类数据进行学习,以论坛对话建模为例:
对于对话数据的学习是语义表示的重要途径,往往相同回复对应的Query语义相似。基于该假设,ERINE模型采用DLM建模 Query-Response对话结构,将对话Pair对作为输入,引入Dialogue Embedding标识对话的角色,利用Dialogue Response Loss学习对话的隐式关系,通过该方法建模进一步提升ERINE模型的语义表示能力。
(2)精调阶段:在预训练ERNIE模型的基础上,迁移其学习语境,采用大桃生产场景所对应的大桃知识词典中的十万级别的问答语料,对ERNIE模型进行精调,以显著提升大桃问答场景下的语义理解泛化能力。
本发明提供的迁移语境网络的大桃生产知识开放问答方法,经过迭代优化的ERNIE模型,通过建模海量数据中的实体概念等先验语义知识,学习显示对话的语义关系,并通过先验语义知识单元进行建模,增强了语义表示能力,在农业问答灵活多变的问题表达场景中,具有较高的语义理解准确率。
另外,对不同语境下问句蕴含的语义的差异,利用公网大型语料首先通过基于词隐藏原理的ERNIE模型获取更丰富的语义信息,面向中文能够进一步提升语义理解的准确度。
基于上述实施例的内容,作为一种可选实施例,在将所述匹配应答反馈给用户之后,还包括:
接收所述用户对所述匹配应答的反馈信息;
在所述反馈信息满足预设条件的情况下,将所述问句文本作为样本,将所述匹配应答作为所述问句文本对应的标签,构建反馈样本;
将所述句意图分类网络与所述问句相似度匹配网络作为整体网络,并利用所述反馈样本对所述整体网络进行训练。
本发明提供的迁移语境网络的大桃生产知识开放问答方法,在提供服务的过程中,提供对于用户提问后所反馈的答案进行标注的功能,按照用户反馈信息的满意程度分为:非常满意、满意、一般、不满意和非常不满意(可以根据用户的打分进行判断),并将用户的反馈信息所对应的反馈样本作为新一次迭代考虑因素之一。
对于非常满意和满意的反馈对应问题,入库训练语料,对于一般、不满意和非常不满意的反馈对应问题,进行每个环节处理情况排查,根据反馈内容从语音识别准确性、语料充分性和匹配模型算法及参数等方面进行分析,提升模型的泛化性。
本发明提供的迁移语境网络的大桃生产知识开放问答方法,在测试阶段、平台化运行阶段,提供用户反馈机制,对历史问答进行有效标注,在平台和用户共同作用下,实现模型的循环性迭代训练。
例如,面向迁移语境网络的大桃知识开放问答方法,规划和实践各环节的处理机制与模式,分配其权重并进行有效的衔接,形成系统化的问答服务,为农业问答的鲁棒性、泛化性提供坚实的保障。
图6是本发明提供的大桃生产知识开放问答装置的结构示意图,如图6所示,主要包括:语义分类单元61、问句匹配单元62和应答匹配单元63,其中:
语义分类单元61主要用于将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;问句匹配单元 62主要用于将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;应答匹配单元63 主要用于根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
本发明提供的迁移语境网络的大桃生产知识开放问答装置,通过知识迁移有效构建生产知识库,通过数据挖掘与清晰、问句意图分类、问句语义理解以及应答匹配等方式,立体化提升生产知识问答的准确性和鲁棒性,能最大程度满足用户对生产知识的获取。
图7是本发明提供的大桃生产知识开放问答系统的结构示意图,如图7所示,主要包括:语音识别装置、搜索服务器(如ElasticSearch)、中控业务调度服务器、Redis服务器、API接口调用服务器以及上述大桃生产知识开放问答装置,其中:
所述语音识别装置能实现语音识别服务,用于接收用户输入的问句语音生成所述问句文本;所述ElasticSearch是基于Lucene实现的,采用RESTful web接口以提供分布式多用户能力全文搜索引擎;所述中控业务调度服务器通过构建所述Redis服务器与所述API接口调用服务器之间的连接,用于实现不同类型的业务数据的调度;所述Redis 服务器用于通过主从数据复制方法提供高可用分布式服务,并采用 RDB和AOF两种持久化方案,将内存数据保存到硬盘中;所述内存数据包括问答数据库和目标产业优化词典;所述API接口调用服务器,用于提供所述语音识别装置与所述大桃生产知识开放问答装置之间的连接,并为所述大桃生产知识开放问答系统互联网数据接口调用服务。
具体来说,将训练后的问句意图分类网络以及问句相似度匹配网络分别集成至大桃生产知识开放问答系统中,面向平台端、APP端、 ROS机器人操作系统提供服务,并面向农业智能系统开发者提供API 服务接口。平台化服务通过以下几个方面完成趋近与人类交流的自然语言服务:
(1)语音识别:集成大平台公开的语音识别服务,将语音转换为文字,字符串类型数据结构;
(2)ElasticSearch服务:基于Lucene实现,利用RESTful web 接口,提供分布式多用户能力全文搜索引擎,具有快速索引能力和可扩展性,大大提升数据抓取效率。
其中,Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。
(3)中控业务调度服务:调度不同类型的业务数据,包括专业的大桃生产语料,天气、旅游、市场价格以及闲聊服务,使用户在对话过程中更加自然。
(4)Redis服务:通过主从数据复制方法提供高可用分布式服务,利用RDB和AOF两种策略将内存数据保存到硬盘中,以保证数据可持久性,且访问速度快,有效支撑高并发问答数据请求。
(5)API接口调用服务:提供互联网数据接口调用服务,输出系统处理后的回答。
本发明提供的迁移语境网络的大桃生产知识开放问答系统,从农业生产实际场景出发,考虑用户在各作业场景下,特别是农忙时期,对知识反馈的及时性和精确性的要求,结合对农业先验知识有效性应用,提出迁移语境网络大桃生产知识开放问答系统。以语音或文本的提问为起点,通过问答对语料库构建、意图分类、问句相似度匹配、回答准确度反馈、文字语音转换等步骤实现了大桃生产问答模型整体化构建。分别利用Redis服务器提供高速、安全、持久化、高并发的数据服务,利用ElasticSearch提供分布式、高扩展、高实时的数据搜索与分析,利用API接口调用服务提供源问答对自动入库,为平台化服务提供坚实的支撑。
不仅如此,在模型训练层面,提出了ERNIE模型、知识蒸馏、 GAN相结合的方法,分别从模型精确性、服务载体便捷性和语料扩充高效性保障了系统化服务的可靠。
具体实现过程中,通过中控业务调度服务有效调度垂直领域的农业语料以及贴近生活的天气、市场、旅游和日常聊天语料,保障了更加自然的人机交互方式。
此外,系统从语料源、训练样本标注、平台服务形式方面均提供了可扩展服务,特别是用户对匹配应答的反馈可在交互过程中记录,为知识库的准确性迭代升级提供最有效的保障。
需要说明的是,本发明实施例提供的大桃生产知识开放问答装置、系统,在具体运行时,可以执行上述任一实施例所述的迁移语境网络的大桃生产知识开放问答方法,对此本实施例不作赘述。
图8是本发明提供的电子设备的结构示意图,如图8所示,该电子设备可以包括:处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行迁移语境网络的大桃生产知识开放问答方法,该方法包括:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的迁移语境网络的大桃生产知识开放问答方法,该方法包括:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的迁移语境网络的大桃生产知识开放问答方法,该方法包括:将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (10)
1.一种迁移语境网络的大桃生产知识开放问答方法,其特征在于,包括:
将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;
将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;
根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
2.根据权利要求1所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,在将获取的问句文本输入至训练好的问句意图分类网络之前,包括:
进行多源数据采集,构建农业知识库;
利用预先训练好的生成对抗网络对所述农业知识库进行语料扩充,获取增强农业知识库;
对所述增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典;
利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,以获取所述训练好的问句意图分类网络。
3.根据权利要求2所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,所述对所述增强农业知识库进行定向挖掘与知识聚类,获取目标产业优化词典,包括:
对所述增强农业知识库进行语料清洗,获取目标产业知识库;
基于左右熵及互信息提取所述目标产业知识库中的种子词汇;
以所述种子词汇为标注样本,对预先构建的深度学习模型进行训练,并利用训练好的深度学习模型对所述目标产业知识库进行迭代挖掘,构建目标产业词典;
采用人机辅助聚类标注法,对所述目标产业词典中的所有语料进行聚合处理,以获取所述目标产业优化词典。
4.根据权利要求2所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,所述问句意图分类网络是基于卷积神经网络模型构建的;
所述利用所述目标产业优化词典对预先构建的问句意图分类网络进行预训练,包括:
从所述目标产业优化词典中随机挑选出多个语料样本,并为每个所述语料样本标注对应的分类标签;
将每个所述语料样本和对应的分类标签的组合作为一个训练样本,获得多个训练样本;
利用所述多个训练样本对预先构建的问句意图分类网络进行预训练。
5.根据权利要求2所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,所述将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句,包括:
选择知识增强的语义表示网络ERNIE模型作为教师模型,选择文本卷积网络TextCNN模型作为学生模型;
通过知识蒸馏层连接所述ERNIE模型和所述TextCNN模型,以搭建教师-学生网络作为所述问句相似度匹配网络;
将所述问句语义信息输入至所述教师-学生网络,以获取有所述教师-学生网络输出的匹配问句。
6.根据权利要求5所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,在将所述问句语义信息输入至所述教师-学生网络之前,还包括:
利用全网公共问答数据集,对所述ERNIE模型进行预训练,直至达到第一预设训练次数;
利用所述目标产业优化词典,对预训练后的ERNIE模型进行精调训练,直至训练结果收敛或达到第二预设训练次数。
7.根据权利要求1所述的迁移语境网络的大桃生产知识开放问答方法,其特征在于,在将所述匹配应答反馈给用户之后,还包括:
接收所述用户对所述匹配应答的反馈信息;
在所述反馈信息满足预设条件的情况下,将所述问句文本作为样本,将所述匹配应答作为所述问句文本对应的标签,构建反馈样本;
将所述句意图分类网络与所述问句相似度匹配网络作为整体网络,并利用所述反馈样本对所述整体网络进行训练。
8.一种迁移语境网络的大桃生产知识开放问答装置,其特征在于,包括:
语义分类单元,用于将获取的问句文本输入至训练好的问句意图分类网络,获取带有分类标签的问句语义信息;
问句匹配单元,用于将所述问句语义信息输入至训练好的问句相似度匹配网络,获取所述问句文本对应的至少一个匹配问句;
应答匹配单元,用于根据所述匹配问句从预先构建的问答数据库中确定与所述问句文本对应的匹配应答,并将所述匹配应答反馈给用户。
9.一种迁移语境网络的大桃生产知识开放问答系统,其特征在于,包括:语音识别装置、搜索服务器、中控业务调度服务器、Redis服务器、API接口调用服务器以及权利要求8所述的大桃生产知识开放问答装置;
所述语音识别装置,实现语音识别服务,用于接收用户输入的问句语音生成所述问句文本;
所述搜索服务器是基于Lucene实现的,采用RESTful web接口以提供分布式多用户能力全文搜索引擎;
所述中控业务调度服务器,构建所述Redis服务器与所述API接口调用服务器之间的连接,用于实现不同类型的业务数据的调度;
所述Redis服务器,用于通过主从数据复制方法提供高可用分布式服务,并采用RDB和AOF两种持久化方案,将内存数据保存到硬盘中;所述内存数据包括问答数据库和目标产业优化词典;
所述API接口调用服务器,用于提供所述语音识别装置与所述大桃生产知识开放问答装置之间的连接,并为所述大桃生产知识开放问答系统互联网数据接口调用服务。
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述迁移语境网络的大桃生产知识开放问答方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111051429.XA CN114021546A (zh) | 2021-09-08 | 2021-09-08 | 迁移语境网络的大桃生产知识开放问答方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111051429.XA CN114021546A (zh) | 2021-09-08 | 2021-09-08 | 迁移语境网络的大桃生产知识开放问答方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114021546A true CN114021546A (zh) | 2022-02-08 |
Family
ID=80054236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111051429.XA Pending CN114021546A (zh) | 2021-09-08 | 2021-09-08 | 迁移语境网络的大桃生产知识开放问答方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114021546A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116578667A (zh) * | 2023-07-13 | 2023-08-11 | 湖南惠农科技有限公司 | 一种基于农业大数据管理的农业信息服务终端 |
CN117591661A (zh) * | 2024-01-18 | 2024-02-23 | 之江实验室 | 一种基于大语言模型的问答数据构建方法及装置 |
CN118193486A (zh) * | 2024-03-19 | 2024-06-14 | 北京环球医疗救援有限责任公司 | 一种问答模型数据库的构建方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
CN111046133A (zh) * | 2019-10-29 | 2020-04-21 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN112905795A (zh) * | 2021-03-11 | 2021-06-04 | 证通股份有限公司 | 文本意图分类的方法、装置和可读介质 |
CN113360616A (zh) * | 2021-06-04 | 2021-09-07 | 科大讯飞股份有限公司 | 自动问答处理方法、装置、设备及存储介质 |
-
2021
- 2021-09-08 CN CN202111051429.XA patent/CN114021546A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109522393A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 智能问答方法、装置、计算机设备和存储介质 |
CN111046133A (zh) * | 2019-10-29 | 2020-04-21 | 平安科技(深圳)有限公司 | 基于图谱化知识库的问答方法、设备、存储介质及装置 |
CN112905795A (zh) * | 2021-03-11 | 2021-06-04 | 证通股份有限公司 | 文本意图分类的方法、装置和可读介质 |
CN113360616A (zh) * | 2021-06-04 | 2021-09-07 | 科大讯飞股份有限公司 | 自动问答处理方法、装置、设备及存储介质 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116578667A (zh) * | 2023-07-13 | 2023-08-11 | 湖南惠农科技有限公司 | 一种基于农业大数据管理的农业信息服务终端 |
CN117591661A (zh) * | 2024-01-18 | 2024-02-23 | 之江实验室 | 一种基于大语言模型的问答数据构建方法及装置 |
CN117591661B (zh) * | 2024-01-18 | 2024-04-26 | 之江实验室 | 一种基于大语言模型的问答数据构建方法及装置 |
CN118193486A (zh) * | 2024-03-19 | 2024-06-14 | 北京环球医疗救援有限责任公司 | 一种问答模型数据库的构建方法和装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106503055B (zh) | 一种从结构化文本到图像描述的生成方法 | |
CN114021546A (zh) | 迁移语境网络的大桃生产知识开放问答方法及装置 | |
CN109271506A (zh) | 一种基于深度学习的电力通信领域知识图谱问答系统的构建方法 | |
CN110597969B (zh) | 一种农业知识智能问答方法、系统以及电子设备 | |
CN110516245A (zh) | 细粒度情感分析方法、装置、计算机设备及存储介质 | |
CN109918489A (zh) | 一种多策略融合的知识问答方法和系统 | |
CN110222163A (zh) | 一种融合cnn与双向lstm的智能问答方法及系统 | |
CN110033022A (zh) | 文本的处理方法、装置和存储介质 | |
Arora et al. | Agribot: a natural language generative neural networks engine for agricultural applications | |
CN109063164A (zh) | 一种基于深度学习的智能问答方法 | |
CN109635108A (zh) | 一种基于人机交互的远程监督实体关系抽取方法 | |
CN109614618A (zh) | 基于多语义的集外词处理方法及装置 | |
Witten et al. | Using concept learning for knowledge acquisition | |
CN114238653B (zh) | 一种编程教育知识图谱构建、补全与智能问答的方法 | |
Momaya et al. | Krushi–the farmer chatbot | |
CN112115242A (zh) | 一种基于朴素贝叶斯分类算法的智能客服问答系统 | |
Chandiok et al. | CIT: Integrated cognitive computing and cognitive agent technologies based cognitive architecture for human-like functionality in artificial systems | |
CN109635294A (zh) | 基于单语义的未登录词处理方法、智能问答方法及装置 | |
CN117909458A (zh) | 基于llm模型的模具专业问答系统的构建方法 | |
CN115223021A (zh) | 一种基于视觉问答的果树全生长期农事作业决策方法 | |
CN114239599A (zh) | 一种机器阅读理解的实现方法、系统、设备及介质 | |
CN113434644A (zh) | 一种农技知识服务方法及系统 | |
CN114239605A (zh) | 辅助沟通内容生成方法、装置、设备及存储介质 | |
CN114417880A (zh) | 一种基于电网实训问答知识库的交互式智能问答方法 | |
CN109657047B (zh) | 一种基于爬虫技术和机器学习的语音自动问答方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |