CN113434644B - 一种农技知识服务方法及系统 - Google Patents

一种农技知识服务方法及系统 Download PDF

Info

Publication number
CN113434644B
CN113434644B CN202110572743.6A CN202110572743A CN113434644B CN 113434644 B CN113434644 B CN 113434644B CN 202110572743 A CN202110572743 A CN 202110572743A CN 113434644 B CN113434644 B CN 113434644B
Authority
CN
China
Prior art keywords
agricultural
question
user
technical problem
resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110572743.6A
Other languages
English (en)
Other versions
CN113434644A (zh
Inventor
孙想
朱华吉
吴华瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Research Center for Information Technology in Agriculture
Original Assignee
Beijing Research Center for Information Technology in Agriculture
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Research Center for Information Technology in Agriculture filed Critical Beijing Research Center for Information Technology in Agriculture
Priority to CN202110572743.6A priority Critical patent/CN113434644B/zh
Publication of CN113434644A publication Critical patent/CN113434644A/zh
Application granted granted Critical
Publication of CN113434644B publication Critical patent/CN113434644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Agronomy & Crop Science (AREA)
  • Animal Husbandry (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Mining & Mineral Resources (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种农技知识服务方法及系统,包括:从问答社区中提取任一农技问题,以生成特征分类词向量;基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;将关联资源数据推送至问答社区;在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。本发明提供的农技知识服务方法及系统,针对问答社区中的农技问题,在知识图谱库中准确及时地提取相关农业知识资源,并匹配到相应的专家,以及时解答农民用户所提问题,同时也将有价值的农业科技知识信息送达到需要的用户手中。

Description

一种农技知识服务方法及系统
技术领域
本发明涉及计算机技术领域,尤其涉及一种农技知识服务方法及系统。
背景技术
随着我国现代农业和新农村建设的快速发展,数字化技术在农业领域广泛应用,农业科技数据资源呈海量增长态势。在农村科技信息服务过程中,如何提高信息服务的精度和效率,是各类农业综合信息服务平台运维管理人员需要解决的重要问题。
目前,协同过滤算法、知识图谱、图搜索、语义计算等方法的推荐系统能够根据用户潜在特征为用户提供针对性信息服务。
但在农村科技信息服务过程中,已有技术方法并不适用于目前农业农村科技信息服务专业场景需求。一方面,农技问题得不到解答,由于农业科技互联网平台技术问答更新与刷屏过快,导致急需解决的问题还没被发现就被淹没;另一方面,农业科技服务信息投放和推荐精准度难以满足实际要求。
发明内容
针对上述现有技术存在农技问题得不到解答以及信息推荐不精准的问题,本发明实施例提供一种农技知识服务方法及系统。
本发明提供一种农技知识服务方法,包括:
从问答社区中提取任一农技问题,以生成特征分类词向量;
基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标农技专家用户;
将所述关联资源数据推送至所述问答社区;
在预设时间段内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户。
根据本发明提供的一种农技知识服务方法,从问答社区中提取任一农技问题,以生成特征分类词向量,包括:
基于农技问答词库字典,对所述任一农技问题进行中文分词和向量表示,获取初始词向量组;
基于所述初始词向量组,根据所述任一农技问题的上下文信息和领域信息,获取文本向量组;
基于改进的多尺度卷积循环神经网络模型,对所述文本向量组进行分解处理,以生成所述特征分类词向量。
根据本发明提供的一种农技知识服务方法,在根据所述特征分类词向量,获取关联资源数据和目标农技专家用户之前,还包括:
根据用户对象,构建用户模型;所述用户对象包括农民用户和农技专家用户;
对用户动作进行赋值处理,以获取用户行为兴趣度;所述用户动作包括浏览栏目、历史问答发布和社区参与行为;
基于所述用户模型,结合农业季节,构建用户农技服务兴趣模型;
根据用户农技服务兴趣模型,构建由兴趣向量组成的用户兴趣向量矩阵,所述兴趣向量包括农民用户兴趣向量和农技专家用户兴趣向量。
根据本发明提供的一种农技知识服务方法,基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标农技专家用户,包括:
基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农民用户兴趣向量进行农村科技信息资源服务计算,获取所述关联资源数据;
相应地,基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农技专家用户兴趣向量进行农业专家推荐服务计算,获取所述目标农技专家用户。
根据本发明提供的一种农技知识服务方法,将所述关联资源数据推送至所述问答社区之后,还包括:
将所述关联资源数据关联至所述农技问题;
并将所述关联资源数据推送至与所述农技问题相对应的农民用户。
根据本发明提供的一种农技知识服务方法,在预设时间段内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户,包括:
在第一预设时长内,若所述农技问题未被解答,则将所述农技问题推送至本地域的目标农技专家用户;所述第一预设时长为所述农技问题的发布时长;
在第二预设时长内,若所述农技问题未被解答,则将所述农技问题推送至所有的农技专家用户;所述第二预设时长为所述农技问题的推送时长。
根据本发明提供的一种农技知识服务方法,在将所述农技问题推送至目标农技专家用户之后,还包括:
接收由所述目标农技专家用户发送的农技问题解答,并将所述农技问题解答发送给与所述农技问题相对应的农民用户;
接收由所述农民用户对所述农技问题解答的反馈意见;
在确定所述反馈意见为满意的情况下,将所述农技问题和所述农技问题解答组成的问答对加入至农技资源数据库,以用于更新所述农技资源知识图谱库;
在确定所述反馈意见为不满意的情况下,提高所述农技问题的优先级别,直至确定所述反馈意见为满意、或所述农技问题的发布时长超过第三预设时长,则取消所述农技问题的优先级别。
根据本发明提供的一种农技知识服务方法,在基于农技资源知识图谱库,根据所述目标特征分类词向量,获取目标关联资源数据和目标专家用户数据之前,还包括:
对农技资源数据库中相关异构数据进行加工处理,构建本体分类树;
基于所述本体分类树,对所述农技资源数据库进行信息重组处理,以获取用户相关实体;
将所述用户相关实体与所述本体分类树进行链接处理,以获取所述农技资源知识图谱库。
根据本发明提供的一种农技知识服务方法,在获取所述农技资源知识图谱库之后,还包括:
步骤1,在所述农技资源数据库中获取原始问答对集合;
步骤2,对所述原始问答对集合进行过滤处理,获取问答对语料,并从所述问答对语料中筛选出典型问答对语料;
步骤3,并对典型问答对语料进行标记处理,构建测试评估集;
步骤4,基于左右熵和互信息方法,利用所述测试评估集,生成启动种子词;
步骤5,利用所述启动种子词从所述问答对语料中确定训练集和验证集;
步骤6,利用所述训练集和所述验证集对初始实体概念挖掘模型进行训练,获取实体概念挖掘模型;所述初始实体概念挖掘模型是基于双向变化的编码器模型和条件随机场模型构建的;
步骤7,基于实体概念挖掘模型,对所述问答对语料进行实体概念挖掘,获取新的启动种子词;
步骤8,迭代执行步骤5至步骤7,直至重新挖掘出的启动种子词低于预设数量,则停止迭代,并获取实体概念集合;所述实体概念集合是由所有启动种子词组构成的集合;
步骤9,将所述实体概念集合加入至所述农技资源数据库,以更新所述农技资源知识图谱库。
根据本发明提供的一种农技知识服务方法,在将所述关联资源数据推送至所述问答社区之后,还包括:
根据农民用户的社区参与行为,从所述关联资源数据中,确定有效农技信息关联资源;
将所述有效农技信息关联资源加入至所述农技资源数据库,以用于更新所述农技资源知识图谱库。
本发明还提供一种农技知识服务系统,包括:提取生成单元,用于从问答社区中提取任一农技问题,以生成特征分类词向量;
获取单元,用于基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;
第一推送单元,用于将关联资源数据推送至问答社区;
第二推送单元,用于在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述农技知识服务方法的步骤。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述农技知识服务方法的步骤。
本发明提供的农技知识服务方法及系统,针对问答社区中的农技问题,在知识图谱库中准确及时地提取相关农业知识资源,并匹配到相应的专家,以及时解答农民用户所提问题,同时也将有价值的农业科技知识信息送达到需要的用户手中。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的农技知识服务方法的流程示意图;
图2是本发明提供的农技问题预处理的流程示意图;
图3是本发明提供的用户兴趣度计算的流程示意图;
图4是本发明提供的农技知识服务系统的结构示意图之一;
图5是本发明提供的农技知识服务系统的结构示意图之二;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
目前,在农村知识服务方面,农业科技资源数据呈海量增长的趋势,以国家农业数据中心为例,目前中心现已集聚了来自26个采集渠道的数据,包含农村经济、农产品贸易、农产品价格等23个数据集市,存量数据超过27亿条,150多个主要农业信息系统实现了数据资源的汇集,汇聚的农业资源基础数据近PB,农业管理及科技数据年增长超50GB。与此同时,农业科技信息传播与应用对乡村发展的影响愈加深刻,特别是850多万农民工返乡创业潮对农村科技信息服务提出了更加迫切的需求。三农12316、农村科技信息12396、全国农业科教云等信息平台直接为农民提供科技、市场、政策、价格等信息服务,平均日访问用户200余万人,技术交互过程的数据更新频率以毫秒计算。
有鉴于此,亟需一种面向海量农村科技资源的知识服务方法。
下面结合图1至图6描述本发明实施例所提供的农技知识服务方法和系统。
图1是本发明提供的农技知识服务方法的流程示意图,如图1所示,包括但不限于以下步骤:
S1,从问答社区中提取任一农技问题,以生成特征分类词向量;
S2,基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;
S3,将关联资源数据推送至问答社区;
S4,在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
需要说明的是,问答社区内主要存在两类群体用户,分别为农民用户和农技专家用户,其中农民用户将农技问题发布至公开的问答社区,由农技专家用户根据专业方向等情况酌情对农民用户所提出的农技问题进行解答。
首先,在步骤S1中,从问答社区中提取任一农民用户提出的农技问题,可以利用深度学习的神经网络对农技问题进行分解和特征提取,生成特征分类词向量。
进一步地,在步骤S2中,利用农技问题的特征分类词向量,在农技资源知识图谱库中通过特征匹配,得到关联资源数据和目标专家用户。
关联资源数据可以包括:与农技问题具有部分相同特征的农技问答对和农业科技知识。
目标农技专家用户为问答社区中与农技问题领域相关的农技专家用户,目标农技专家用户还可以根据地域特征进行进一步区分。
进一步地,在步骤S3中,在农技问题发布后,可以立即将获取到的关联资源数据推送至问答社区,公开发布在农技问题的关联内容区域,以向问答社区的用户进行公布,使其他有同样疑问的农民用户在发布问题之前就可以得到相关资料,既可以及时解决问题,又能有效避免大量重复问题导致的数据冗余。
进一步地,在步骤S4中,由于在农技问题发布后,对问答社区的所有用户均为可见,农技专家用户在浏览社区时,可以对自己看到的农技问题进行解答。在预设时间段内,如果农技问题未被任何农技专家解答,则将农技问题推送至目标农技专家用户。其中,预设时间段的时长可以根据实际需求灵活设置。
例如,农技问题为“白菜叶片萎缩的原因是病虫害吗?”,首先通过深度学习的神经网络进行特征提取,可以提取到“白菜”、“病虫害”等特征项,并形成特征分类词向量。根据农技资源知识图谱库,匹配到同样具有“白菜”、“病虫害”等特征的关联资源数据,以及“白菜”、“病虫害”领域的目标专家用户。在完成匹配后,立即将具有“白菜”、“病虫害”等特征的关联资源数据推送至问答社区,公开发布在农技问题的关联内容区域。如果在预设时间段内,农技问题未被任何农技专家解答,则将“白菜叶片萎缩的原因是病虫害吗?”的农技问题推送至“白菜”、“病虫害”领域的目标农技专家用户。
本发明提供的农技知识服务方法,针对问答社区中的农技问题,在知识图谱库中准确及时地提取相关农业知识资源,并匹配到相应的专家,以及时解答农民用户所提问题,同时也将有价值的农业科技知识信息送达到需要的用户手中。
面对网络中农技问答数据量大、特征稀疏性强、规范性差的特点,传统的筛查方法需要消耗大量的人力、物力,并且很难及时高效的完成对无效数据的处理,本实施例采用多尺度卷积循环神经网络模型对农技问题及解答内容进行分类解析,生成特征分类向量。作为一种可选的实施例,从问答社区中提取任一农技问题,以生成特征分类词向量,包括:
基于农技问答词库字典,对所述任一农技问题进行中文分词和向量表示,获取初始词向量组;
基于所述初始词向量组,根据所述任一农技问题的上下文信息和领域信息,获取文本向量组;
基于改进的多尺度卷积循环神经网络模型,对所述文本向量组进行分解处理,以生成所述特征分类词向量。
图2是本发明提供的农技问题预处理的流程示意图,如图2所示,首先,对农民用户发布的农技问题进行文本预处理,包括:基于农技问答词库字典,对任一农机问题去除虚词及标点符号后,进行中文分词,使用Word2vec向量化文本对农技问题词语进行词向量表示,形成农技问题文本的初始词向量组。
进一步地,挖掘农技问题词语的上下文信息,完善初始词向量组,此处读取根据问题领域设置词库词语重要程度加权值wi,形成农技问答的文本向量组。
进一步地,利用改进的多尺度卷积循环神经网络模型自动获取特征表达,完成当前农技问题分解,形成农技问答文本的特征分类词向量D=D(t1,w1;t2,w2;...;tn,wn)作为农村科技信息资源服务计算和农业专家推荐服务计算的输入,其中,ti为特征项,wi为特征项ti的权重,且i满足1≤i≤n。
本实施例通过将农技问题进行分解,得到农技问答文本的特征分类词向量,并为每个特征项赋予权重,能更加精准地匹配相关资源数据以及相关领域的专家,进而优化推荐效果。
基于上述实施例,作为一个可选的实施例,在根据所述特征分类词向量,获取关联资源数据和目标农技专家用户之前,还包括:
根据用户对象,构建用户模型;所述用户对象包括农民用户和农技专家用户;
对用户动作进行赋值处理,以获取用户行为兴趣度;所述用户动作包括浏览栏目、历史问答发布和社区参与行为;
基于所述用户模型,结合农业季节,构建用户农技服务兴趣模型;
根据用户农技服务兴趣模型,构建由兴趣向量组成的用户兴趣向量矩阵,所述兴趣向量包括农民用户兴趣向量和农技专家用户兴趣向量。
首先,对农民和农技专家两类用户行为进行建模,构建用户模型。用户模型包括农民用户模型和农技专家用户模型。
可选地,农民用户模型包括基本特征模型、产业特征模型以及行为模型。
其中,农民用户的基本特征模型包括B={性别,年龄,地域,关注内容}。
农民用户的产业特征模型包括A={产业类型,生产流通环节,品种}。
农民用户的行为模型包括C={浏览栏目,历史问答,社区参与行为}。
可选地,农技专家用户模型包括基本特征模型、专业特征模型以及行为模型。
农技专家用户的基本特征模型包括B={性别,年龄,地域,关注内容}。
农技专家用户的专业特征模型包括A={职称,专业方向,领域特长}。
农技专家用户的行为模型包括C={浏览栏目,历史问答,社区参与行为}。
进一步地,图3是本发明提供的用户兴趣度计算的流程示意图,如图3所示。从用户浏览栏目(保存、复制、收藏、打印),历史问答发布,社区参与行为(点赞、评论、回复)等相关动作,进行用户兴趣度的计算的公式可以是:
其中,ci为调整因子,根据用户相应操作,赋予一定权值。当发生点赞、评论、回复,保存、复制、收藏、打印等重要操作时,用户行为兴趣度赋予权值1;n为用户浏览的页面总数,pi是用户点赞、评论、回复综述,ki是用户历史问答数量;ti是浏览第i个网页所用的时间,li表示页面额外的加载消耗时间,ui是根据文本长度计算出来的最大预期阅读时间。
作为一种可选的实施例,其设定规则如下,如果用户浏览页面的时间过长,超过了最大预期阅读时间,同时页面没有交互操作,则推测用户没有浏览该页面。若浏览页面的时间低于3秒,认为用户对此页面不感兴趣,用户行为兴趣度为0。
其次,建立用户农技服务兴趣模型URi=f(u,s,b,a,c),其中,u是农民和农技专家用户对象,s为农业季节,b为用户基本特征,a为用户产业/专业特征,c为用户行为特征。综合计算用户的兴趣度,从而更全面地建立农民和农技专家用户的兴趣偏好。
根据用户农技服务兴趣模型URi,构建农民和农技专家用户的兴趣向量矩阵T,并在农民和农技专家用户的兴趣向量矩阵T中确定兴趣向量E。其中,兴趣向量E作为农村科技信息资源服务计算和农业专家推荐服务计算的输入。
本实施例通过对不同的用户对象进行建模,并根据用户行为动作、区域位置和农业季节,计算得到用户的兴趣度,能更加精准地匹配相关资源数据以及相关领域的专家,进而优化推荐效果。
目前在海量农业科技信息资源的个性化信息推荐方面,知识图谱技术已在商品信息推荐等场景中得到应用,用于解决数据稀疏带来的准确度低问题。
有一种知识推荐方法,将知识图谱与评论内容作为多源数据,并使用不同算法对数据进行处理,并采用动态融合方法进行结合,为用户提供推荐服务。
有另一种方法,通过将用户历史行为数据生成商品知识图,采用机器学习中表示学习方法,获得协同知识图中节点和关系的向量嵌入表示,通过图卷积神经网络模型输出的融合邻域信息的用户、商品向量嵌入表示,计算用户喜欢商品的概率,根据预测结果,排序获得推荐列表。
还有一种方法,通过挖掘用户历史喜好利用丰富的知识关联信息,深度挖掘用户的喜好,以解决协同过滤等传统推荐方式中存在的数据稀疏性和冷启动技术问题。
在互联网多用户个性化信息匹配服务方面,有一种方法,以社交网络微博作为平台,改进Jaccard相似度计算方法、PageRank算法,分析用户的多属性信息,用以改善传统的个性化推荐算法得出结果的不精确性问题。
此外,还有一种体系,能够将采购信息和供应商匹配,将具有推荐特征的采购信息推荐给供应商。
基于上述实施例,作为一个可选的实施例,基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标农技专家用户,包括:
基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农民用户兴趣向量进行农村科技信息资源服务计算,获取所述关联资源数据;
相应地,基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农技专家用户兴趣向量进行农业专家推荐服务计算,获取所述目标农技专家用户。
农技资源知识图谱库包括:知识图谱应用访问接口和知识图谱;知识图谱包括农技资源知识图谱和专家历史问答知识图谱,农技资源知识图谱和专家历史问答知识图谱之间互为交叉关联。
可选地,基于农村科技资源知识图谱库,根据农技问答文本特征分类词向量D、用户的兴趣向量E,进行农村科技信息资源获取服务计算。具体计算过程如下所述。
输入融合农技问答文本特征分类词向量D和用户的兴趣向量E进行问答文本语义相关性计算,采用余弦相似度,通过测量两个向量的夹角的余弦值来度量他们之间的相似性。两个向量所指的方向相同,他们的余弦相似度的值为1;两个向量互相垂直,余弦相似度的值为0;两个向量所指方向相反,余弦相似度的值为-1。农技问答文本特征分类词向量D=(D1,D2,…,Dn),兴趣向量E=(E1,E2,…,En),cosθ为D、E之间的余弦值,具体计算公式为:
以词向量的形式表示问答文本和兴趣文本信息,对两个词向量之间的余弦相似度进行计算就可以得到两个文本之间的相似程度。农技问答文本和用户的兴趣文本的余弦相似度取值范围为[0,1],且词向量夹角不能大于90°。
基于语义的相似度计算,其中Ei为D中每个元素Di在E中通过WordVec模型计算出语义相关度最高的词的相关度Ri,更新E=(E1×R1,E2×R2,…,En×Rn),再计算余弦相关度cosθ:
农技问答中每个特征词所占的权重(w1,w2,…,wn),则该条问答项对于此用户的兴趣度为τ,具体计算公式为:
该条问答项和用户的兴趣相关性为:
兴趣相关性simH(d,r),涵盖了语义相似度、行为相似度、农时与地域相似度、产业相似度等方面的信息,根据simH(d,r)的计算结果,可以获取农业问答相关的信息资源Ntop推荐列表。
以信息资源Ntop推荐列表为索引,通过农村科技资源知识图谱接口进行快速检索计算,获得农村科技资源知识图谱库中的相关资源实体推荐集合。
以实体推荐集合数据上下文关联关系为服务资源网,定位并精确获取相关科技信息关联资源。其中,定位相关的实体,根据各实体之间的上下文关联关系,可以获取相关的资源。
相应地,基于农村科技资源知识图谱库,根据农技问答文本特征分类词向量、农技专家用户的特征向量,进行农业专家推荐服务计算。具体计算过程如下所述。
首先,融合农技问答文本特征分类词向量和农技专家用户的特征向量进行专家匹配度相关性计算;本领域专家用户的权重值可以为1,非本领域专家用户的权重值可以为0。
其中,根据农技专家用户的基本特征模型B={性别,年龄,地域,关注内容}中,确定专家地域信息,由于相同地域的专家对相关地域的情况更加了解,故农业专家的地域和专业比较关键,可以根据实际需求加大地域和专业在计算参数中的权重。
其次,以相关性数值最高的特征分类词向量为索引,通过农村科技资源知识图谱接口进行快速检索计算,在所述知识图谱中定位至领域相关的目标农技专家用户,并获取目标农技专家用户的相关数据。相关数据包括农技专家用户模型中包含的性别,年龄,地域,职称,专业方向,领域特长等信息。
本实施例通过对农村科技信息资源服务计算和农业专家推荐服务计算,能更加精准地匹配相关资源数据以及相关领域的专家,进而优化推荐效果。
基于上述实施例,作为一个可选的实施例,将所述关联资源数据推送至所述问答社区之后,还包括:
将所述关联资源数据关联至所述农技问题;
并将所述关联资源数据推送至与所述农技问题相对应的农民用户。
可选地,关联资源数据包括:相关联的问题、问题相关知识资源、类似问题及解答。
作为一个可选的实施例,根据获得用户问题最相关的专家信息,以及已有的相关知识资源,将关联资源数据公开发布在农技问题的关联内容区域,以向问答社区的用户进行公布;并将关联资源数据推送至提出农技问题的农民用户。
本实施例通过将关联资源数据进行公布和推送,使提出农技问题的农民用户得到及时的资料反馈;也使其他有同样疑问的农民用户在发布问题之前就可以得到相关资料,既可以及时解决问题,又能有效避免大量重复问题导致的数据冗余。
基于上述实施例,作为一个可选的实施例,在预设时间段内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户,包括:
在第一预设时长内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户;所述第一预设时长为所述农技问题的发布时长;
在第二预设时长内,若所述农技问题未被解答,则将所述农技问题推送至所有的农技专家用户;所述第二预设时长为所述农技问题的推送时长。
作为一个可选的实施例,第一预设时长设置为1小时,考虑到相同地域的专家对相关地域的情况更加了解,将发布后1小时内未获解答的问题将被推送到本地域的目标农技专家用户;第二预设时长设置为2小时,本地域专家在2小时未对农技问题进行解答,则将该农技问题推送给所有的目标农技专家用户。
本实施例通过,设置预设时长和区域信息,在不同的时间段对农技问题做不同的处理,使农技问题得到的解答尽量符合农民用户实际需求,也能够有效缓解农业科技资源行业性、地域性和多渠道等信息孤岛特征突出等问题。
基于上述实施例,作为一个可选的实施例,在将所述农技问题推送至目标农技专家用户之后,还包括:
接收由所述目标农技专家用户发送的农技问题解答,并将所述农技问题解答发送给与所述农技问题相对应的农民用户;
接收由所述农民用户对所述农技问题解答的反馈意见;
在确定所述反馈意见为满意的情况下,将所述农技问题和所述农技问题解答组成的问答对加入至农技资源数据库,以用于更新所述农技资源知识图谱库;
在确定所述反馈意见为不满意的情况下,提高所述农技问题的优先级别,直至确定所述反馈意见为满意、或所述农技问题的发布时长超过第三预设时长,则取消所述农技问题的优先级别。
可选地,在农技专家用户对农技问题进行解答后,农技专家用户的解答内容也会公布在农技问题的解答区域。
可选地,提高优先级别可以是根据时间倒序优先排列在问答社区空间,也可以在问答社区置顶标红处理,还可以再次向所有的农技专家用户推送农技问题。
第三预设时长可以根据实际需求灵活选取,在本实施例中可以取24小时。
根据专家解答是否解决提问的农民实际问题的情况,农民进行线上反馈,反馈结果满意的问答将作为输入,更新对应知识图谱。
该流程以农民获得解答,并线上反馈对问答结果满意为终止条件,否则该问题根据时间倒序优先排列在问答社区空间,自发布问题的24小时后取消优先级别。
本实施例根据农技问题的解答情况,及时调整农技问题的优先级别,并设置时间阈值的方式保证农技问题不会长时间占据问答社区资源。解决了现有农业科技互联网平台技术问答更新与刷屏过快,急需解决的问题还没被发现就被淹没、有价值的技术解答还没来得及分享传播就被覆盖的问题。
基于上述实施例,作为一个可选的实施例,在基于农技资源知识图谱库,根据所述目标特征分类词向量,获取目标关联资源数据和目标专家用户数据之前,还包括:
对农技资源数据库中相关异构数据进行加工处理,构建本体分类树;
基于所述本体分类树,对所述农技资源数据库进行信息重组处理,以获取用户相关实体;
将所述用户相关实体与所述本体分类树进行链接处理,以获取所述农技资源知识图谱库。
其中,专家历史问答知识图谱包括:专家的基本信息、专家对问题作出的解答信息
农技资源数据库中现有的数据,包括平台库中现有的信息资源数据问答文本,农技专家的文献资料,论文以及出版刊物等;
相关异构数据为内容相关但格式、类型和来源不同的数据;包括:图片、视频、文件中的相关链接。
可选地,信息重组处理包括识别、关联关系抽取和知识融合等处理。
首先,构建农村科技资源知识本体。在农技资源数据库中,需要对相关异构数据进行加工处理,根据实体的层级以及关联关系,构建本体分类树。实体包括品种名称、病害名称、农药名称等。
例如:“农业科技资源分类”作为一级概念,下一级概念可以包含“种植业、畜牧业、渔业、加工业、农业机械、食用菌、再生能源、生态”等,还涵盖专家历史问答知识子图谱。
“种植业”包含“品类(蔬菜、果树、大田作物、食用菌、花卉)、农资、栽培模式、栽培管理、病虫害防治、机械化作业、采收、加工、运输”等概念。
“果树”概念可以包含“品种、树龄、病虫害、肥料投入、生长环境”等属性,苹果作为果树下位概念,继承了其属性。
“病虫害”包含“病害名称、危害类型、危害部位、危害症状、防治方法”等概念;“病虫害”和“果树”其关系为病虫害侵害果树。
数据支持农村科技资源知识图谱库包含农技专家历史问答知识图谱,领域下位概念增加专家实例,包括“专家姓名,地域,职称,专业方向,领域特长,历史问答”等属性。
进一步地,基于农村科技资源知识本体分类树和农村科技资源数据,识别概念实体、属性、关系等,并抽取上下文关联信息,通过知识融合对概念实体进行对齐、匹配,将与科技信息服务用户相关的实体链接到本体分类树,结合知识图谱应用访问接口,从而形成面向知识资源服务的农技资源知识图谱库,每个实体都关联了上下文语义相关的知识资源。其中,知识图谱应用访问接口提供知识图谱检索信息输入和结果信息输出。
本实施例通过构建农技资源知识图谱库,用于匹配相关领域专家和查找关联资源数据,
基于上述实施例,作为一个可选的实施例,在获取农技资源知识图谱库之后,还包括:
步骤1,在农技资源数据库中获取原始问答对集合;
步骤2,对原始问答对集合进行过滤处理,获取问答对语料,并从问答对语料中筛选出典型问答对语料;
步骤3,并对典型问答对语料进行标记处理,构建测试评估集;
步骤4,基于左右熵和互信息方法,利用测试评估集,生成启动种子词;
步骤5,利用启动种子词从问答对语料中确定训练集和验证集;
步骤6,利用训练集和验证集对初始实体概念挖掘模型进行训练,获取实体概念挖掘模型;初始实体概念挖掘模型是基于双向变化的编码器模型和条件随机场模型构建的;
步骤7,基于实体概念挖掘模型,对问答对语料进行实体概念挖掘,获取新的启动种子词;
步骤8,迭代执行步骤5至步骤7,直至重新挖掘出的启动种子词低于预设数量,则停止迭代,并获取实体概念集合;实体概念集合是由所有启动种子词组构成的集合;
步骤9,将实体概念集合加入至农技资源数据库,以更新农技资源知识图谱库。
对于问答社区中的农技问答知识,将作为实例反馈每月(千万条以上)定期自动抽取加入到知识图谱中对应位置,实现农村科技知识图谱的自动更新。
通过左右熵互信息方式产生种子词汇,种子词汇指通过基础手段先挖掘一些领域特征比较强的农村科技信息服务词汇,这些词汇的主要特点是在问答语料中出现较频繁,而且其出现场合的上下文具有特定规律。
然后将种子词撒入语料作为正例,加入适量的通用语料作为负例,训练BERT+CRF模型,迭代发现更多的农村科技知识图谱实例词。经过多轮迭代后,如果新发现的实例词达不到所设阈值,则终止迭代,实例挖掘结束。
首先,在步骤1中,在农技资源数据库中获取原始问答对集合。
进一步地,在步骤2中,对原始问答对集合进行数据清洗,把领域无关的数据过滤掉,包括全角汉字与半角汉字统一化、消除乱码、去标点、分词等,获取问答对语料,并从问答对语料中筛选出典型问答对语料。
进一步地,在步骤3中,对典型问答对语料进行实例标记,形成测试评估集,用于实体概念挖掘模型的效果评估。
进一步地,在步骤4中,基于左右熵和互信息方法,利用测试评估集,生成一批初始的二元语法模型(Bi-Gram)和三元语法模型(Tri-Gram),经过筛选后得到启动种子词;启动种子词可以人工筛选,也可以是通过映射关系得到的。
进一步地,在步骤5中,用启动种子词与问答对语料进行匹配,获取一批匹配合格的问答对语料并随机打乱顺序,分别作为问答对抽取的文本训练集和验证集数据,对训练集和验证集进行实体概念标记,训练集用来训练初始实体概念挖掘模型。初始实体概念挖掘模型是基于双向变化的编码器模型(Bidirectional Encoder Representation fromTransformers,BERT)和条件随机场模型(Conditional Random Fields,CRF)构建的。
进一步地,在步骤6中,构建BERT+CRF模型作为初始实体概念挖掘模型,通过初始实体概念挖掘模型对训练集进行多轮迭代实体概念挖掘训练,根据训练结果改善模型在验证集上的性能,通过测试评估集对模型性能进行评估,直至模型性能评估合格,获取实体概念挖掘模型。
进一步地,在步骤7中,基于实体概念挖掘模型,对问答对语料进行实体概念挖掘,将训练得到的新挖掘的实体概念继续人工标注,获取新的启动种子词;
进一步地,在步骤8中,迭代执行步骤5至步骤7,直至重新挖掘出的启动种子词低于预设数量,则停止迭代,并获取实体概念集合;实体概念集合是由所有启动种子词组构成的集合;
进一步地,在步骤9中,将实体概念集合加入至农技资源数据库,以更新农技资源知识图谱库。
本实施例利用神经网络模型,对农技资源数据库中现有的问答对进行实体概念挖掘,以实现对农技资源知识图谱库的补充和更新,解决了农业科技资源行业性、区域性和多渠道等信息孤岛特征突出等问题,提高了农业科技服务信息投放和推荐精准度,为农民提供了精准信息提取的便捷方法和知识服务。
基于上述实施例,作为一个可选的实施例,在将所述关联资源数据推送至所述问答社区之后,还包括:
根据农民用户的社区参与行为,从所述关联资源数据中,确定有效农技信息关联资源;
将所述有效农技信息关联资源加入至所述农技资源数据库,以用于更新所述农技资源知识图谱库。
可选地,对于关联资源数据中的问答知识以及关联推送的知识资源,用户可以通过点赞、点评的方式进行评价,获得点赞的问答资源、关联农业科技知识将作为知识图谱更新来源,通过自动实例抽取的方式加入到知识图谱中对应位置,实现农村科技知识图谱的自动更新。
本实施例通过将被认可的关联资源数据加入到知识图谱中对应位置,实现对农技资源知识图谱库的补充和更新,解决了农业科技资源行业性、区域性和多渠道等信息孤岛特征突出等问题,提高了农业科技服务信息投放和推荐精准度,为农民提供了精准信息提取的便捷方法和知识服务。
图4是本发明提供的农技知识服务系统的结构示意图之一,作为一个可选实施例,如图4所示,主要包括但不限于以下单元:
提取生成单元401,用于从问答社区中提取任一农技问题,以生成特征分类词向量;
获取单元402,用于基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;
第一推送单元403,用于将关联资源数据推送至问答社区;
第二推送单元404,用于在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
需要说明的是,问答社区有两类群体的用户,分别为农民用户和农技专家用户,其中农民用户将农技问题发布至公开的问答社区,而农技专家用户则是解答农技问题。
在系统运行过程中,首先,提取生成单元401从问答社区中提取任一农民用户提出的农技问题,可以利用深度学习的神经网络对农技问题进行分解和特征提取,生成特征分类词向量。
进一步地,获取单元402利用农技问题的特征分类词向量,在农技资源知识图谱库中通过特征匹配,得到关联资源数据和目标专家用户。
关联资源数据可以包括:与农技问题具有部分相同特征的农技问答对和农业科技知识。
目标农技专家用户为问答社区中与农技问题领域相关的农技专家用户,目标农技专家用户还可以根据地域特征进行进一步区分。
进一步地,在农技问题发布后,第一推送单元403可以立即将获取到的关联资源数据推送至问答社区,公开发布在农技问题的关联内容区域,以向问答社区的用户进行公布,使其他有同样疑问的农民用户在发布问题之前就可以得到相关资料,既可以及时解决问题,又能有效避免大量重复问题导致的数据冗余。
进一步地,由于在农技问题发布后,对问答社区的所有用户均为可见,农技专家用户在浏览社区时,可以对自己看到的农技问题进行解答。在预设时间段内,如果农技问题未被任何农技专家解答,第二推送单元404则将农技问题推送至目标农技专家用户。其中,预设时间段的时长可以根据实际需求灵活设置。
例如,农技问题为“白菜叶片萎缩的原因是病虫害吗?”,首先通过深度学习的神经网络进行特征提取,可以提取到“白菜”、“病虫害”等特征项,并形成特征分类词向量。根据农技资源知识图谱库,匹配到同样具有“白菜”、“病虫害”等特征的关联资源数据,以及“白菜”、“病虫害”领域的目标专家用户。在完成匹配后,立即将具有“白菜”、“病虫害”等特征的关联资源数据推送至问答社区,公开发布在农技问题的关联内容区域。如果在预设时间段内,农技问题未被任何农技专家解答,则将“白菜叶片萎缩的原因是病虫害吗?”的农技问题推送至“白菜”、“病虫害”领域的目标农技专家用户。
本发明提供的农技知识服务系统,针对问答社区中的农技问题,在知识图谱库中准确及时地提取相关农业知识资源,并匹配到相应的专家,以及时解答农民用户所提问题,同时也将有价值的农业科技知识信息送达到需要的用户手中。
图5是本发明提供的农技知识服务系统的结构示意图之二,作为一个可选实施例,如图5所示,主要包括但不限于以下模块:
农技问题分类处理模块,用于将问答平台中的农技问题进行分类处理;
用户行为兴趣识别模块,用于根据不同类型的用户特征,进行用户行为兴趣识别;
科技资源知识图谱库模块,用于根据多来源的农业科技资源,构建科技资源知识图谱库;
知识资源服务计算模块,用于基于科技资源知识图谱库,根据农技问题分类结果和用户行为兴趣识别结果,进行知识资源服务计算;
专家推荐信息知识推送模块,用于匹配相关领域的目标农技专家和关联资源数据;并将关联资源数据推送给农民用户,将农技问题推送给目标农技专家;
科技知识服务评价模块,用于将农民用户对相关推送的反馈,发送至知识资源服务计算模块;
图谱反馈更新模块,用于根据反馈意见为满意的解答和关联资源数据,更新科技资源知识图谱库。
需要说明的是,本发明实施例提供的农技知识服务系统,在具体执行时,可以基于上述任一实施例所述的农技知识服务方法来实现,对此本实施例不作赘述。
图6是本发明提供的电子设备的结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行农技知识服务方法,该方法包括:从问答社区中提取任一农技问题,以生成特征分类词向量;基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;将关联资源数据推送至问答社区;在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的农技知识服务方法,该方法包括:从问答社区中提取任一农技问题,以生成特征分类词向量;基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;将关联资源数据推送至问答社区;在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的农技知识服务方法,该方法包括:从问答社区中提取任一农技问题,以生成特征分类词向量;基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;将关联资源数据推送至问答社区;在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种农技知识服务方法,其特征在于,包括:
从问答社区中提取任一农技问题,以生成特征分类词向量;
基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标农技专家用户;
将所述关联资源数据推送至所述问答社区;
在预设时间段内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户;
在根据所述特征分类词向量,获取关联资源数据和目标农技专家用户之前,还包括:
根据用户对象,构建用户模型;所述用户对象包括农民用户和农技专家用户;
对用户动作进行赋值处理,以获取用户行为兴趣度;所述用户动作包括浏览栏目、历史问答发布和社区参与行为;
基于所述用户模型,结合农业季节,构建用户农技服务兴趣模型;
根据所述用户农技服务兴趣模型,构建由兴趣向量组成的用户兴趣向量矩阵,所述兴趣向量包括农民用户兴趣向量和农技专家用户兴趣向量;
基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标农技专家用户,包括:
基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农民用户兴趣向量进行农村科技信息资源服务计算,获取所述关联资源数据;
相应地,基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农技专家用户兴趣向量进行农业专家推荐服务计算,获取所述目标农技专家用户;
在将所述农技问题推送至目标农技专家用户之后,还包括:
接收由所述目标农技专家用户发送的农技问题解答,并将所述农技问题解答发送给与所述农技问题相对应的农民用户;
接收由所述农民用户对所述农技问题解答的反馈意见;
在确定所述反馈意见为满意的情况下,将所述农技问题和所述农技问题解答组成的问答对加入至农技资源数据库,以用于更新所述农技资源知识图谱库;
在确定所述反馈意见为不满意的情况下,提高所述农技问题的优先级别,直至确定所述反馈意见为满意、或所述农技问题的发布时长超过第三预设时长,则取消所述农技问题的优先级别;
在基于农技资源知识图谱库,根据所述特征分类词向量,获取关联资源数据和目标专家用户数据之前,还包括:
对农技资源数据库中相关异构数据进行加工处理,构建本体分类树;
基于所述本体分类树,对所述农技资源数据库进行信息重组处理,以获取用户相关实体;
将所述用户相关实体与所述本体分类树进行链接处理,以获取所述农技资源知识图谱库;
在获取所述农技资源知识图谱库之后,还包括:
步骤1,在所述农技资源数据库中获取原始问答对集合;
步骤2,对所述原始问答对集合进行过滤处理,获取问答对语料,并从所述问答对语料中筛选出典型问答对语料;
步骤3,并对典型问答对语料进行标记处理,构建测试评估集;
步骤4,基于左右熵和互信息方法,利用所述测试评估集,生成启动种子词;
步骤5,利用所述启动种子词从所述问答对语料中确定训练集和验证集;
步骤6,利用所述训练集和所述验证集对初始实体概念挖掘模型进行训练,获取实体概念挖掘模型;所述初始实体概念挖掘模型是基于双向变化的编码器模型和条件随机场模型构建的;
步骤7,基于实体概念挖掘模型,对所述问答对语料进行实体概念挖掘,获取新的启动种子词;
步骤8,迭代执行步骤5至步骤7,直至重新挖掘出的启动种子词低于预设数量,则停止迭代,并获取实体概念集合;所述实体概念集合是由所有启动种子词组构成的集合;
步骤9,将所述实体概念集合加入至所述农技资源数据库,以更新所述农技资源知识图谱库。
2.根据权利要求1所述的农技知识服务方法,其特征在于,从问答社区中提取任一农技问题,以生成特征分类词向量,包括:
基于农技问答词库字典,对所述任一农技问题进行中文分词和向量表示,获取初始词向量组;
基于所述初始词向量组,根据所述任一农技问题的上下文信息和领域信息,获取文本向量组;
基于改进的多尺度卷积循环神经网络模型,对所述文本向量组进行分解处理,以生成所述特征分类词向量。
3.根据权利要求1所述的农技知识服务方法,其特征在于,将所述关联资源数据推送至所述问答社区之后,还包括:
将所述关联资源数据关联至所述农技问题;
并将所述关联资源数据推送至与所述农技问题相对应的农民用户。
4.根据权利要求1所述的农技知识服务方法,其特征在于,在预设时间段内,若所述农技问题未被解答,则将所述农技问题推送至目标农技专家用户,包括:
在第一预设时长内,若所述农技问题未被解答,则将所述农技问题推送至本地域的目标农技专家用户;所述第一预设时长为所述农技问题的发布时长;
在第二预设时长内,若所述农技问题未被解答,则将所述农技问题推送至所有的农技专家用户;所述第二预设时长为所述农技问题的推送时长。
5.根据权利要求1所述的农技知识服务方法,其特征在于,在将所述关联资源数据推送至所述问答社区之后,还包括:
根据农民用户的社区参与行为,从所述关联资源数据中,确定有效农技信息关联资源;
将所述有效农技信息关联资源加入至所述农技资源数据库,以用于更新所述农技资源知识图谱库。
6.一种农技知识服务系统,其特征在于,包括:
提取生成单元,用于从问答社区中提取任一农技问题,以生成特征分类词向量;
获取单元,用于基于农技资源知识图谱库,根据特征分类词向量,获取关联资源数据和目标农技专家用户;
第一推送单元,用于将关联资源数据推送至问答社区;
第二推送单元,用于在预设时间段内,若农技问题未被解答,则将农技问题推送至目标农技专家用户;
所述获取单元具体用于:
根据用户对象,构建用户模型;所述用户对象包括农民用户和农技专家用户;
对用户动作进行赋值处理,以获取用户行为兴趣度;所述用户动作包括浏览栏目、历史问答发布和社区参与行为;
基于所述用户模型,结合农业季节,构建用户农技服务兴趣模型;
根据所述用户农技服务兴趣模型,构建由兴趣向量组成的用户兴趣向量矩阵,所述兴趣向量包括农民用户兴趣向量和农技专家用户兴趣向量;
所述获取单元还用于:
基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农民用户兴趣向量进行农村科技信息资源服务计算,获取所述关联资源数据;
相应地,基于所述农技资源知识图谱库,根据所述特征分类词向量、所述农技专家用户兴趣向量进行农业专家推荐服务计算,获取所述目标农技专家用户;
所述第二推送单元具体用于:
接收由所述目标农技专家用户发送的农技问题解答,并将所述农技问题解答发送给与所述农技问题相对应的农民用户;
接收由所述农民用户对所述农技问题解答的反馈意见;
在确定所述反馈意见为满意的情况下,将所述农技问题和所述农技问题解答组成的问答对加入至农技资源数据库,以用于更新所述农技资源知识图谱库;
在确定所述反馈意见为不满意的情况下,提高所述农技问题的优先级别,直至确定所述反馈意见为满意、或所述农技问题的发布时长超过第三预设时长,则取消所述农技问题的优先级别;
所述获取单元还用于:
对农技资源数据库中相关异构数据进行加工处理,构建本体分类树;
基于所述本体分类树,对所述农技资源数据库进行信息重组处理,以获取用户相关实体;
将所述用户相关实体与所述本体分类树进行链接处理,以获取所述农技资源知识图谱库;
所述获取单元还用于:
步骤1,在所述农技资源数据库中获取原始问答对集合;
步骤2,对所述原始问答对集合进行过滤处理,获取问答对语料,并从所述问答对语料中筛选出典型问答对语料;
步骤3,并对典型问答对语料进行标记处理,构建测试评估集;
步骤4,基于左右熵和互信息方法,利用所述测试评估集,生成启动种子词;
步骤5,利用所述启动种子词从所述问答对语料中确定训练集和验证集;
步骤6,利用所述训练集和所述验证集对初始实体概念挖掘模型进行训练,获取实体概念挖掘模型;所述初始实体概念挖掘模型是基于双向变化的编码器模型和条件随机场模型构建的;
步骤7,基于实体概念挖掘模型,对所述问答对语料进行实体概念挖掘,获取新的启动种子词;
步骤8,迭代执行步骤5至步骤7,直至重新挖掘出的启动种子词低于预设数量,则停止迭代,并获取实体概念集合;所述实体概念集合是由所有启动种子词组构成的集合;
步骤9,将所述实体概念集合加入至所述农技资源数据库,以更新所述农技资源知识图谱库。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述农技知识服务方法步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述农技知识服务方法步骤。
CN202110572743.6A 2021-05-25 2021-05-25 一种农技知识服务方法及系统 Active CN113434644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110572743.6A CN113434644B (zh) 2021-05-25 2021-05-25 一种农技知识服务方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110572743.6A CN113434644B (zh) 2021-05-25 2021-05-25 一种农技知识服务方法及系统

Publications (2)

Publication Number Publication Date
CN113434644A CN113434644A (zh) 2021-09-24
CN113434644B true CN113434644B (zh) 2023-09-12

Family

ID=77803325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110572743.6A Active CN113434644B (zh) 2021-05-25 2021-05-25 一种农技知识服务方法及系统

Country Status (1)

Country Link
CN (1) CN113434644B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117132239B (zh) * 2023-09-25 2024-05-14 孟子研究院 数据资源动态交互综合管理系统与方法
CN117273411B (zh) * 2023-11-23 2024-02-02 杨凌职业技术学院 一种基于农业大数据管理的农业信息服务系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075942A (zh) * 2007-06-22 2007-11-21 清华大学 基于专家值传播算法的社会网络专家信息处理系统及方法
CN106294616A (zh) * 2016-08-02 2017-01-04 长江大学 一种基于移动互联网的智能问答机器人系统
GB201717959D0 (en) * 2016-11-18 2017-12-13 Lionbridge Tech Inc Collection strategies that facilitate arranging portions of documents into content collections
CN109447266A (zh) * 2018-03-12 2019-03-08 南京农业大学 一种基于大数据的农业科技服务智能分拣方法
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置
CN111371830A (zh) * 2019-11-26 2020-07-03 航天科工网络信息发展有限公司 一种万网融合场景下基于数据驱动的智能协同云架构
CN111444334A (zh) * 2019-01-16 2020-07-24 阿里巴巴集团控股有限公司 数据处理方法、文本识别方法、装置及计算机设备
CN112115379A (zh) * 2020-09-18 2020-12-22 吉林农业大学 基于知识图谱的水稻品种选择方法和装置
CN112733065A (zh) * 2021-01-15 2021-04-30 海南金垦赛博信息科技有限公司 一种热带农业专家信息管理方法及系统

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101075942A (zh) * 2007-06-22 2007-11-21 清华大学 基于专家值传播算法的社会网络专家信息处理系统及方法
CN106294616A (zh) * 2016-08-02 2017-01-04 长江大学 一种基于移动互联网的智能问答机器人系统
GB201717959D0 (en) * 2016-11-18 2017-12-13 Lionbridge Tech Inc Collection strategies that facilitate arranging portions of documents into content collections
CN109447266A (zh) * 2018-03-12 2019-03-08 南京农业大学 一种基于大数据的农业科技服务智能分拣方法
CN111444334A (zh) * 2019-01-16 2020-07-24 阿里巴巴集团控股有限公司 数据处理方法、文本识别方法、装置及计算机设备
CN110245240A (zh) * 2019-05-31 2019-09-17 国网电子商务有限公司 一种问题数据答案的确定方法及装置
CN111371830A (zh) * 2019-11-26 2020-07-03 航天科工网络信息发展有限公司 一种万网融合场景下基于数据驱动的智能协同云架构
CN112115379A (zh) * 2020-09-18 2020-12-22 吉林农业大学 基于知识图谱的水稻品种选择方法和装置
CN112733065A (zh) * 2021-01-15 2021-04-30 海南金垦赛博信息科技有限公司 一种热带农业专家信息管理方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
paraphrase-focused learning to rank for domain-specific frequently asked questions retrieval;Mladen Karan等;expert systems with applications;第91卷;418-433 *

Also Published As

Publication number Publication date
CN113434644A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
Drury et al. A survey of the applications of text mining for agriculture
CN107944986B (zh) 一种o2o商品推荐方法、系统及设备
CN114595344B (zh) 面向农作物品种管理的知识图谱构建方法及装置
CN104199833B (zh) 一种网络搜索词的聚类方法和聚类装置
CN112231460B (zh) 一种基于农业百科知识图谱的问答系统的构建方法
CN110209839B (zh) 农业知识图谱构建装置、方法及计算机可读存储介质
CN113434644B (zh) 一种农技知识服务方法及系统
CN110597969A (zh) 一种农业知识智能问答方法、系统以及电子设备
CN107895303B (zh) 一种基于ocean模型的个性化推荐的方法
CN112199508B (zh) 一种基于远程监督的参数自适应农业知识图谱推荐方法
CN110321421A (zh) 用于网站知识社区系统的专家推荐方法及计算机存储介质
Velásquez Web site keywords: A methodology for improving gradually the web site text content
CN108446333B (zh) 一种大数据文本挖掘处理系统及其方法
Deepa et al. An effective automated ontology construction based on the agriculture domain
CN113673246A (zh) 语义融合和知识蒸馏的农业实体识别方法和装置
Reyes-Magana et al. Designing an electronic reverse dictionary based on two word association norms of English language
CN117786185A (zh) 农业知识推送方法、装置、电子设备及存储介质
CN117131383A (zh) 一种提高双塔模型搜索精排性能的方法
CN114860917B (zh) 农业知识问答方法、装置、电子设备和存储介质
Zhu et al. Question answering on agricultural knowledge graph based on multi-label text classification
CN115640439A (zh) 一种网络舆情监控的方法、系统及存储介质
Joglekar et al. Search engine optimization using unsupervised learning
CN101751409A (zh) 免疫系统在搜索引擎中的应用
Wang et al. Intelligent Information extraction algorithm of Agricultural text based on Machine Learning method
Nayak et al. A Semi-automatic Data Extraction System for Heterogeneous Data Sources: a Case Study from Cotton Industry

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant