CN109447266A - 一种基于大数据的农业科技服务智能分拣方法 - Google Patents
一种基于大数据的农业科技服务智能分拣方法 Download PDFInfo
- Publication number
- CN109447266A CN109447266A CN201811127718.1A CN201811127718A CN109447266A CN 109447266 A CN109447266 A CN 109447266A CN 201811127718 A CN201811127718 A CN 201811127718A CN 109447266 A CN109447266 A CN 109447266A
- Authority
- CN
- China
- Prior art keywords
- expert
- model
- agricultural
- experts
- big data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
- G06N5/025—Extracting rules from data
Abstract
本发明公开了基于大数据的农业科技服务智能分拣方法,实现农技问题能够精准推送给农业专家,包括关键步骤为:基于问题文本语料库的大数据挖掘和农业知识图谱分析,构建农技问题模型Q和专家模型E,计算当前农户问题Q与历史推送问题Q的相似度H;计算历史推送问题Q与历史农业专家E的契合度R;计算历史农业专家E与当前备选专家E相近度P;最后将相似度H、契合度R、相近度P加权求和,计算当前农户问题Q分拣推送给某个农业专家Q的概率S。本发明的优势在于:通过文本大数据构建的问题模型和专家模型,设计农技问题智能分拣算法,克服了传统以协同推送、内容推荐等单个算法的缺陷(如数据稀疏、冷启动等问题),其精度和效率更高,在农技服务领域将具有很好的应用前景。
Description
技术领域
本发明属于数据处理模型领域,尤其涉及一种基于大数据的农业科技服务智能分拣方法。
技术背景
我国农村科技服务过程中的“最后一米”问题日益明显,现代农业发展急需建立以需求为导向的农村科技服务体系。由于现有供给模式粗放,保障机制不完善,科技资源整合乏力,需求洞察不足,信息化平台与系统服务系统紊乱,供给主体与服务农户供需信息对接效率不高,满足不了农户对多环节、个性化、地域性、专业化的技术需求。因此,在我省现代农业发展升级加快的背景下,内容服务、手段服务、服务方式发生深刻变化。
目前农村科技服务过程中的“最后一米”问题日趋严重,导致供给成本偏高而农户满意度较低,具体表现在一下三方面。第一,农村科技服务信息的采集利用水平低,可靠性不高。与发达国家相比,我国农村信息化和数据应用还处于探索阶段,技术水平较低,数据缺乏系统性、及时性,数据整合难度大等。第二,缺少能精准洞察农户需求的信息化平台,个性化不足。农户需求预测等相关服务功能有待加强,建设进程满足不了农户对农村科技服务的及时需求。第三,缺少能够支持人机智能互动的高尖技术,服务成本高。目前的智能问答系统是以互联网语料库及农户点击日志为基础,缺少专业化知识库的支撑,无法针对农业领域的问题实现精准回答。因此,现代农业发展急需建立以需求为导向的农村科技服务体系。
发明内容
本发明公开了基于大数据的农业科技服务智能分拣方法(S-HRP算法),实现农技问题能够精准推送给农业专家,包括关键步骤为:基于问题文本语料库的大数据挖掘和农业知识图谱分析,构建农技问题模型Q和专家模型E,计算当前农户问题Q与历史推送问题Q的相似度H;计算历史推送问题Q与历史农业专家E的契合度R;计算历史农业专家E与当前备选专家E相近度P;最后将相似度H、契合度R、相近度P加权求和,计算当前农户问题Q分拣推送给某个农业专家Q的概率S。本发明的优势在于:通过文本大数据构建的问题模型和专家模型,设计农技问题智能分拣算法,克服了传统以协同推送、内容推荐等单个算法的缺陷(如数据稀疏、冷启动等问题),其精度和效率更高,在农技服务领域将具有很好的应用前景。
为解决上述技术问题,本发明采用的技术方案是:本发明公开了一种基于大数据的农业科技服务智能分拣方法,包括操作平台、大数据处理中心、知识数据库以及后台处理系统;
所述操作平台用于接收反馈用户的请求与结果,
所述大数据中心用于套嵌知识数据库,对数据进行分析处理转化建立深度学习及判定模型,
所述知识数据库用于将索引转化为机器语言,与同义词数据库建立关联规则反馈至农科词典,从而一一对应匹配问答库中现有答案;进一步与专家库配型指定对应的多位专家进行人工服务,
所述后台处理系统用于建立数据库之间的业务逻辑关系规则,以及数据提取规则;
用户通过操作平台录入问题,问题通过索引数据提取关键词,关键词通过机器语言翻译后,上报至后台处理系统的业务逻辑进行处理数据提取,与知识数据库进行匹配计算后,反馈至大数据处理中心,同时推送至操作平台,得出多个结果反馈至操作平台。
进一步地,建立知识数据库:所述知识数据库包括索引、问答库、专家库、农科词典及同义词数据库;
所述索引通过业务逻辑处理后与同义词数据库进行匹配,关联农科词典的数据信息,与问答库进行基于语义排序的专家推理机模型与问答库进行一一关联匹配,生成数据库中最优答案;用户对答案不满意时,再次重复上述过程后,与问答模型Q进行匹配,专家库与大数据平台匹配关系,安排指定的专家进行解答,生成结果反馈至操作平台;
构建索引,其中,用于业务逻辑处理包括分词处理、词语抽取、关联查询模型,构建专家属性与互动特性关联规则进行用户需求匹配,
构建所述的农科词典的数据库,有一数据样本集;所述的数据样本集有若干农科的专有名词以及自然词汇;从所述的数据样本集中,提取关键词图谱,通过深度学习,转换为机器语言得出词向量,形成农科词典;所述农科词典的数据模型包括作物类类别库、价格数据库、用户行为库以及销售信息库;
构建所述的同义词词典的数据库,其中,同义词为与农科词典相同或相似意义的词汇数据;
构建基于语义排序的专家推理机模型与问答库进行一一关联匹配;
构建问答模型Q:其中,构建时空密度聚类方法实现问题分拣,问答模型Q由问题和专家解答数据组合及农科问题;所述专家解答数据组合中含有多个专家;
构建向量的相似度匹配模型实现科技成果精准推送结果反馈列表;
进一步地,精准分拣参数的设定根据所述专家模型E和Hadoop框架的MapReduce算法,基于用户关键词搜索行为系数、个性化科技服务需求参数、农村科技服务数据仓库,对用户相关科技服务咨询问题进行无人值守问答,并精准的转向人工客服。
更进一步地,所述专家库与大数据平台匹配关系计算为
(1)首先构建专家模型E和问题模型Q,利用语义关联度进行计算匹配度H(i),
(2)用户提出问题q,问题q通过索引与问答模型Q进行匹配,然后通过索引得出的关键词,与专家库E匹配度H(i)=V(q,Ei),
(3)当H(A)大于精准分拣参数a时,问题q推送给专家库中的专家A,当所有H(i)<a时,问题q需要人工干预分发给专家E。
本发明公开了一种基于大数据的农业科技服务智能分拣方法,其特征在于包括如下步骤:
步骤1,用户通过操作平台提出问题;
步骤2,后台处理系统对用户所提的问题进行自动检索匹配问答库的高相识度的答案反馈;
步骤3,用户接收操作平台的答案反馈后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4;
步骤4,将问题进行分析后,精准推送给相关专家进行解答;
步骤5,专家在规定时间内未做出回答,则执行步骤4,推送给其他专家解答;若专家做出相关回答,则执行步骤6;
步骤6,用户接收答案后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4,推送给其他专家进行解答。
进一步地,步骤1,基于文本语料库的大数据挖掘和分析构建农技问题模型Q:利用分词系统对农技问题的标题、主题词、摘要、内容、区域等进行关键词大数据特征提取,利用TF-IDF算法、农业知识图谱方法建立农户问题向量模型Q;
步骤2,基于文本语料库的大数据挖掘和分析构建农业专家模型E,利用分词系统对农业专家的学科、职称、领域、成果、描述、关注度等进行关键词大数据特征提取,利用TF-IDF算法、农业知识图谱方法建立农业专家的词向量模型E;
步骤3,计算当前农户问题Q与历史推送问题Q的相似度H:根据农技问题模型Q,利用向量夹角余弦相似度法计算当前问题Q与历史推送问题Q的语义相似度H;
步骤4,计算历史推送问题Q与历史农业专家E的契合度R:根据农技问题模型Q,利用Softmax模型计算历史推送问题Q对于历史农业专家E的契合度R;
步骤5,计算历史农业专家E与当前备选专家E相近度P:根据农业专家模型E,利用向量夹角余弦相似度法计算历史农业专家E与当前备选专家E特征相近度P;
步骤6,将步骤3、步骤4、步骤5的相似度H、契合度R、相近度P进行加权求和,计算当前农户问题Q分拣推送给某个农业专家Q的概率S。
进一步地,所述步骤1中,利用自然语言处理中的TF-IDF(“逆频率指数”)算法,对问题文档语料库进行大数据特征提取,计算问题文档Q中的关键词wij及权重sij,公式如下:
式中TFij、ITFij分别为问题文档中含关键词wij的词频和逆向词频,sij表示wij在问题文档语料库的重要性测度,nij为wij在问题文档出现的次数,N为问题库中问题文档数,n则表示包含wij的问题文档数,建立问题向量模型为:
式中qT、qK、qA、qC分别为问题文档中的标题(T)、主题词(K)、摘要(A)、内容(C)等文档结构在农业知识图谱中的关联性测度,公式如下:
式中dij表示wij在农业知识图谱中语义长度(wij在知识图谱中到根节点的最短距离);
所述步骤2中,在农业专家信息库中进行关键词大数据特征提取,方法参考(式1),建立农业专家的向量模型为:
式中eS、eP、eF、eM分别为农业专家信息中的学科(S)、职称(P)、领域(F)、描述(M)等专家属性在农业知识图谱关联性测度,公式如下:
所述步骤3中,根据农技问题模型利用向量夹角余弦法计算当前问题Qi与历史推送问题Qh的语义相似度H(Qi,Qh),公式为:
所述步骤4中,根据农技问题模型利用Softmax分类函数计算历史推送问题Qh对于历史农业专家Ek的契合度R(Qh,Ek),公式为:
式中A为参数,表示问题文档分给第j专家的概率,为问题向量对于专家向量基于农业知识图谱的特征向量,公式如下:
式中对称矩阵D为历史问题Q与历史农业专家E所含关键词的语义长度;
所述步骤5中,根据农业专家模型利用向量夹角余弦法计算历史农业专家当前备选专家的相近度P(Eh,Em),公式为:
所述步骤6中,当前农户问题Qi分拣推送给某个农业专家Em的概率S(Qi,Em),公式为:
S(Qi,Em)=a·H(Qi,Qm)+b·R(Qi,Em)+c·P(Qi,Em) (式8)
其中:a+b+c=1
式中a、b、c为相似度H、契合度R、相近度P的权重。
本发明的有益效果是:通过大数据处理高度运算以及建立专家库匹配模型,深度学习建立对应的数据库更新,使得咨询结果更精准,解决农村科技服务咨询的高效性。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1为本发明的工作流程图;
图2为本发明的专家库与大数据平台关联关系图;
图3为本发明的数据处理流程图;
图4为本发明工作流程示意图。
具体实施方式
下面结合附图和具体较佳实施方式对本发明做进一步详细的说明。
实施例1
如图1-3所示,本发明提供了一种基于大数据的农业科技服务智能分拣方法,包括操作平台、大数据处理中心、知识数据库以及后台处理系统;
所述操作平台用于接收反馈用户的请求与结果,
所述大数据中心用于套嵌知识数据库,对数据进行分析处理转化建立深度学习及判定模型,
所述知识数据库用于将索引转化为机器语言,与同义词数据库建立关联规则反馈至农科词典,从而一一对应匹配问答库中现有答案;进一步与专家库配型指定对应的多位专家进行人工服务;
所述后台处理系统用于建立数据库之间的业务逻辑关系规则,以及数据提取规则。
用户通过操作平台录入问题,问题通过索引数据提取关键词,关键词通过机器语言翻译后,上报至后台处理系统的业务逻辑进行处理数据提取,与知识数据库进行匹配计算后,反馈至大数据处理中心,同时推送至操作平台,得出多个结果反馈至操作平台。
建立知识数据库:所述知识数据库包括索引、问答库、专家库、农科词典及同义词数据库;
所述索引通过业务逻辑处理后与同义词数据库进行匹配,关联农科词典的数据信息,与问答库进行基于语义排序的专家推理机模型与问答库进行一一关联匹配,生成数据库中最优答案;用户对答案不满意时,再次重复上述过程后,与问答模型Q进行匹配,专家库与大数据平台匹配关系,安排指定的专家进行解答,生成结果反馈至操作平台;
构建索引,其中,用于业务逻辑处理包括分词处理、词语抽取、关联查询模型,构建专家属性与互动特性关联规则进行用户需求匹配,
构建所述的农科词典的数据库,有一数据样本集;所述的数据样本集有若干农科的专有名词以及自然词汇;从所述的数据样本集中,提取关键词图谱,通过深度学习,转换为机器语言得出词向量,形成农科词典;所述农科词典的数据模型包括作物类类别库、价格数据库、用户行为库以及销售信息库;
构建所述的同义词词典的数据库,其中,同义词为与农科词典相同或相似意义的词汇数据;
构建基于语义排序的专家推理机模型与问答库进行一一关联匹配;
构建问答模型Q:其中,构建时空密度聚类方法实现问题分拣,问答模型Q由问题和专家解答数据组合及农科问题;所述专家解答数据组合中含有多个专家;
构建向量的相似度匹配模型实现科技成果精准推送结果反馈列表;
精准分拣参数的设定根据所述专家模型E和Hadoop框架的MapReduce算法,基于用户关键词搜索行为系数、个性化科技服务需求参数、农村科技服务数据仓库,对用户相关科技服务咨询问题进行无人值守问答,并精准的转向人工客服。
所述专家库与大数据平台匹配关系计算为
(1)首先构建专家模型E和问题模型Q,利用语义关联度进行计算匹配度H(i),
(2)用户提出问题q,问题q通过索引与问答模型Q进行匹配,然后通过索引得出的关键词,与专家库E匹配度H(i)=V(q,Ei),
(3)当H(A)大于精准分拣参数a时,问题q推送给专家库中的专家A,当所有H(i)<a时,问题q需要人工干预分发给专家E。
本发明提供了一种基于大数据的农业科技服务智能分拣方法,包括如下步骤:
步骤1,用户通过操作平台提出问题。
步骤2,后台处理系统对用户所提的问题进行自动检索匹配问答库的高相识度的答案反馈。
步骤3,用户接收操作平台的答案反馈后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4。
步骤4,将问题进行分析后,精准推送给相关专家进行解答。
步骤5,专家在规定时间内未做出回答,则执行步骤4,推送给其他专家解答;若专家做出相关回答,则执行步骤6。
步骤6,用户接收答案后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4,推送给其他专家进行解答。
实施例2
如图4所示,一种基于大数据的农业技术服务问题智能分拣方法,包括以下步骤。步骤1,建立农户问题向量模型Q。
利用自然语言中的TF-IDF(“逆频率指数”)算法,对问题文档语料库进行大数据特征提取,计算文档Q中的关键词wij及权重sij,并建立问题模型向量Q。
第一步,利用TF-IDF(“逆频率指数”)对问题文档语料库进行大数据特征提取。
利用TF-IDF(“逆频率指数”)算法对问题语料库进行大数据特征提取,简称特征提取,计算问题文档Q中的关键词wij及权重sij,公式如下:
下面详细介绍利用TF-IDF(“逆频率指数”)算法,对问题文档语料库进行大数据特征提取。
首先统计问题文档中的关键词wij的词频,然后计算该关键词的逆向文档频率IDFij,其中nij为wij在问题文档出现的次数,N为问题库中的问题文档数,n则表示含wij的问题文档书,为了防止分母n为0,则将分母n加1后取其对数,最后将词频TFij与逆文档频率IDFij的乘积记为关键词wij在问题文档语料库中的重要性测度sij。
第二步,建立问题模型向量。
利用上述TF-IDF(“逆频率指数”)算法,分别将为问题文档中的标题(T)、主题词(K)、摘要(A)、内容(C)等文档结构在农业知识图谱中的关联性测度,建立问题向量模型为:
式中qT、qK、qA、qC分别为问题文档中的标题(T)、主题词(K)、摘要(A)、内容(C)等文档结构在农业知识图谱中的关联性测度,公式如下:
式中dij表示wij在农业知识图谱中语义长度(wij在知识图谱中到根节点的最短距离)。
步骤2,建立农业专家的词向量模型E。
利用TF-IDF(“逆频率指数”)对专家信息库中进行关键词大数据特征提取,具体方法参照步骤1中第一步,分别为农业专家信息中的学科(S)、职称(P)、领域(F)、描述(M)等专家属性在农业知识图谱关联性测度,建立农业专家向量模型为:
式中eS、eP、eF、eM分别为农业专家信息中的学科(S)、职称(P)、领域(F)、描述(M)等专家属性在农业知识图谱关联性测度,公式如下:
式中dij表示wij在农业知识图谱中语义长度(wij在知识图谱中到根节点的最短距离)。
步骤3,计算计算当前问题Qi与历史推送问题Qh的语义相似度H(Qi,Qh)。
利用步骤1中所建立的问题文档向量模型,采用余弦相似度定理计算当前问题Qi与历史推送问题Qh的语义相似度H(Qi,Qh),公式为:
下面详细介绍采用余弦相似度定理计算当前问题Qi与历史推送问题Qh的语义相似度H(Qi,Qh)。
首先将当前问题向量与历史问题文档向量提取备用。然后计算当前问题向量与历史问题文档向量的乘积与当前问题向量与历史问题文档向量模的乘积的比值,即为H(Qi,Qh)。
步骤4,计算历史推送问题Qh对于历史农业专家Ek的契合度R(Qh,Ek)。
利用Softmax分类函数计算历史推送问题Qh对于历史农业专家Ek的契合度R(Qh,Ek),公式为:
式中A为参数,表示问题文档分给第j专家的概率,为问题向量对于专家向量基于农业知识图谱的特征向量,公式如下:
式中对称矩阵D为历史问题Q与历史农业专家E所含关键词的语义长度。
步骤5,计算计算历史农业专家当前备选专家的相近度P(Eh,Em)。
根据农业专家模型利用向量夹角余弦法计算历史农业专家当前备选专家的相近度P(Eh,Em),公式为:
步骤6,计算当前农户问题Qi分拣推送给某个农业专家Em的概率S(Qi,Em)。
当前农户问题Qi分拣推送给某个农业专家Em的概率S(Qi,Em),
公式为:
S(Qi,Em)=a·H(Qi,Qm)+b·R(Qi,Em)+c·P(Qi,Em) (式8)
其中:a+b+c=1
式中a、b、c为相似度H、契合度R、相近度P的权重。
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,本发明要求保护范围由所附的权利要求书、说明书及其等效物界定。
Claims (7)
1.一种基于大数据的农业科技服务智能分拣方法,其特征在于:所述的基于大数据的农业科技服务智能分拣方法包括操作平台、大数据处理中心、知识数据库以及后台处理系统;所述操作平台用于接收反馈用户的请求与结果,所述大数据中心用于套嵌知识数据库,对数据进行分析处理转化建立深度学习及判定模型,
所述知识数据库用于将索引转化为机器语言,与同义词数据库建立关联规则反馈至农科词典,从而一一对应匹配问答库中现有答案;进一步与专家库配型指定对应的多位专家进行人工服务,所述后台处理系统用于建立数据库之间的业务逻辑关系规则,以及数据提取规则;
用户通过操作平台录入问题,问题通过索引数据提取关键词,关键词通过机器语言翻译后,上报至后台处理系统的业务逻辑进行处理数据提取,与知识数据库进行匹配计算后,反馈至大数据处理中心,同时推送至操作平台,得出多个结果反馈至操作平台。
2.根据权利要求1的所述的一种基于大数据的农业科技服务智能分拣方法,其特征在于:建立知识数据库:
所述知识数据库包括索引、问答库、专家库、农科词典及同义词数据库;所述索引通过业务逻辑处理后与同义词数据库进行匹配,关联农科词典的数据信息,与问答库进行基于语义排序的专家推理机模型与问答库进行一一关联匹配,生成数据库中最优答案;
用户对答案不满意时,再次重复上述过程后,与问答模型Q进行匹配,专家库与大数据平台匹配关系,安排指定的专家进行解答,生成结果反馈至操作平台;
构建索引,其中,用于业务逻辑处理包括分词处理、词语抽取、关联查询模型,构建专家属性与互动特性关联规则进行用户需求匹配,构建所述的农科词典的数据库,有一数据样本集;
所述的数据样本集有若干农科的专有名词以及自然词汇;从所述的数据样本集中,提取关键词图谱,通过深度学习,转换为机器语言得出词向量,形成农科词典;
所述农科词典的数据模型包括作物类类别库、价格数据库、用户行为库以及销售信息库;
构建所述的同义词词典的数据库,其中,同义词为与农科词典相同或相似意义的词汇数据;
构建基于语义排序的专家推理机模型与问答库进行一一关联匹配;
构建问答模型Q:其中,构建时空密度聚类方法实现问题分拣,问答模型Q由问题和专家解答数据组合及农科问题;
所述专家解答数据组合中含有多个专家;
构建向量的相似度匹配模型实现科技成果精准推送结果反馈列表。
3.根据权利要求1所述的一种基于大数据的农业科技服务智能分拣方法,其特征在于:精准分拣参数的设定根据所述专家模型E和Hadoop框架的MapReduce算法,基于用户关键词搜索行为系数、个性化科技服务需求参数、农村科技服务数据仓库,对用户相关科技服务咨询问题进行无人值守问答,并精准的转向人工客服。
4.根据权利要求1的所述的一种基于大数据的农业科技服务智能分拣方法,其特征在于:所述专家库与大数据平台匹配关系计算为
(1)首先构建专家模型E和问题模型Q,利用语义关联度进行计算匹配度H(i),
(2)用户提出问题q,问题q通过索引与问答模型Q进行匹配,然后通过索引得出的关键词,与专家库E匹配度H(i)=V(q,Ei),
(3)当H(A)大于精准分拣参数a时,问题q推送给专家库中的专家A,当所有H(i)<a时,问题q需要人工干预分发给专家E。
5.根据权利要求1-4所述的基于大数据的农业科技服务智能分拣方法,其特征在于包括如下步骤:
步骤1,用户通过操作平台提出问题;
步骤2,后台处理系统对用户所提的问题进行自动检索匹配问答库的高相识度的答案反馈;
步骤3,用户接收操作平台的答案反馈后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4;
步骤4,将问题进行分析后,精准推送给相关专家进行解答;
步骤5,专家在规定时间内未做出回答,则执行步骤4,推送给其他专家解答;若专家做出相关回答,则执行步骤6;
步骤6,用户接收答案后,对答案是否满意做出反馈,若满意,则该流程结束;若不满意,则执行步骤4,推送给其他专家进行解答。
6.根据权利要求5所述的基于大数据的农业科技服务智能分拣方法,其特征在于:
步骤1,基于文本语料库的大数据挖掘和分析构建农技问题模型Q:利用分词系统对农技问题的标题、主题词、摘要、内容、区域等进行关键词大数据特征提取,利用TF-IDF算法、农业知识图谱方法建立农户问题向量模型Q;
步骤2,基于文本语料库的大数据挖掘和分析构建农业专家模型E,利用分词系统对农业专家的学科、职称、领域、成果、描述、关注度等进行关键词大数据特征提取,利用TF-IDF算法、农业知识图谱方法建立农业专家的词向量模型E;
步骤3,计算当前农户问题Q与历史推送问题Q的相似度H:根据农技问题模型Q,利用向量夹角余弦相似度法计算当前问题Q与历史推送问题Q的语义相似度H;
步骤4,计算历史推送问题Q与历史农业专家E的契合度R:根据农技问题模型Q,利用Softmax模型计算历史推送问题Q对于历史农业专家E的契合度R;
步骤5,计算历史农业专家E与当前备选专家E相近度P:根据农业专家模型E,利用向量夹角余弦相似度法计算历史农业专家E与当前备选专家E特征相近度P;
步骤6,将步骤3、步骤4、步骤5的相似度H、契合度R、相近度P进行加权求和,计算当前农户问题Q分拣推送给某个农业专家Q的概率S。
7.根据权利要求6所述的基于大数据的农业科技服务智能分拣方法(S-HRP算法),其特征在于:
所述步骤1中,利用自然语言处理中的TF-IDF(“逆频率指数”)算法,对问题文档语料库进行大数据特征提取,计算问题文档Q中的关键词wij及权重sij,公式如下:
式中TFij、ITFij分别为问题文档中含关键词wij的词频和逆向词频,sij表示wij在问题文档语料库的重要性测度,nij为wij在问题文档出现的次数,N为问题库中问题文档数,n则表示包含wij的问题文档数,建立问题向量模型为:
式中qT、qK、qA、qC分别为问题文档中的标题(T)、主题词(K)、摘要(A)、内容(C)等文档结构在农业知识图谱中的关联性测度,公式如下:
式中dij表示wij在农业知识图谱中语义长度(wij在知识图谱中到根节点的最短距离);
所述步骤2中,在农业专家信息库中进行关键词大数据特征提取,方法参考(式1),建立农业专家的向量模型为:
式中eS、eP、eF、eM分别为农业专家信息中的学科(S)、职称(P)、领域(F)、描述(M)等专家属性在农业知识图谱关联性测度,公式如下:
所述步骤3中,根据农技问题模型利用向量夹角余弦法计算当前问题Qi与历史推送问题Qh的语义相似度H(Qi,Qh),公式为:
所述步骤4中,根据农技问题模型利用Softmax分类函数计算历史推送问题Qh对于历史农业专家Ek的契合度R(Qh,Ek),公式为:
式中A为参数,表示问题文档分给第j专家的概率,为问题向量对于专家向量基于农业知识图谱的特征向量,公式如下:
式中对称矩阵D为历史问题Q与历史农业专家E所含关键词的语义长度;
所述步骤5中,根据农业专家模型利用向量夹角余弦法计算历史农业专家当前备选专家的相近度P(Eh,Em),公式为:
所述步骤6中,当前农户问题Qi分拣推送给某个农业专家Em的概率S(Qi,Em),公式为:
S(Qi,Em)=a·H(Qi,Qm)+b·R(Qi,Em)+c·P(Qi,Em) (式8)
其中:a+b+c=1
式中a、b、c为相似度H、契合度R、相近度P的权重。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2018101991423 | 2018-03-12 | ||
CN201810199142 | 2018-03-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109447266A true CN109447266A (zh) | 2019-03-08 |
CN109447266B CN109447266B (zh) | 2021-10-01 |
Family
ID=65544428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811127718.1A Active CN109447266B (zh) | 2018-03-12 | 2018-09-27 | 一种基于大数据的农业科技服务智能分拣方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109447266B (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947947A (zh) * | 2019-03-29 | 2019-06-28 | 北京泰迪熊移动科技有限公司 | 一种文本分类方法、装置及计算机可读存储介质 |
CN110490547A (zh) * | 2019-08-13 | 2019-11-22 | 北京航空航天大学 | 办公系统智能化技术 |
CN110765248A (zh) * | 2019-10-14 | 2020-02-07 | 桂林理工大学 | 一种基于云计算的中小企业智能咨询服务平台 |
CN111159355A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 客户投诉单处理方法及装置 |
CN111680977A (zh) * | 2020-06-02 | 2020-09-18 | 北京大学 | 基于gis一张图管理系统的安全生产问题解决方法及平台 |
CN112733065A (zh) * | 2021-01-15 | 2021-04-30 | 海南金垦赛博信息科技有限公司 | 一种热带农业专家信息管理方法及系统 |
CN113434644A (zh) * | 2021-05-25 | 2021-09-24 | 北京农业信息技术研究中心 | 一种农技知识服务方法及系统 |
CN113689418A (zh) * | 2021-09-01 | 2021-11-23 | 北京云蝶智学科技有限公司 | 基于图像识别的公式计算方法 |
CN117273411A (zh) * | 2023-11-23 | 2023-12-22 | 杨凌职业技术学院 | 一种基于农业大数据管理的农业信息服务系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081674A (zh) * | 2011-01-27 | 2011-06-01 | 中国农业大学 | 农业知识咨询系统及方法 |
CN102142973A (zh) * | 2010-02-03 | 2011-08-03 | 湖南城市学院 | 农村信息服务与综合管理的系统及方法 |
CN104050256A (zh) * | 2014-06-13 | 2014-09-17 | 西安蒜泥电子科技有限责任公司 | 基于主动学习的问答方法及采用该方法的问答系统 |
CN105069720A (zh) * | 2015-08-25 | 2015-11-18 | 长沙市麓智信息科技有限公司 | 专利知识系统 |
CN105468648A (zh) * | 2014-09-11 | 2016-04-06 | 北大方正集团有限公司 | 一种专业知识问答系统的生成方法及装置 |
CN106686054A (zh) * | 2016-11-18 | 2017-05-17 | 深圳市芭田生态工程股份有限公司 | 一种策略模型解决种植问题的服务系统 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
-
2018
- 2018-09-27 CN CN201811127718.1A patent/CN109447266B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102142973A (zh) * | 2010-02-03 | 2011-08-03 | 湖南城市学院 | 农村信息服务与综合管理的系统及方法 |
CN102081674A (zh) * | 2011-01-27 | 2011-06-01 | 中国农业大学 | 农业知识咨询系统及方法 |
CN104050256A (zh) * | 2014-06-13 | 2014-09-17 | 西安蒜泥电子科技有限责任公司 | 基于主动学习的问答方法及采用该方法的问答系统 |
CN105468648A (zh) * | 2014-09-11 | 2016-04-06 | 北大方正集团有限公司 | 一种专业知识问答系统的生成方法及装置 |
CN105069720A (zh) * | 2015-08-25 | 2015-11-18 | 长沙市麓智信息科技有限公司 | 专利知识系统 |
CN106686054A (zh) * | 2016-11-18 | 2017-05-17 | 深圳市芭田生态工程股份有限公司 | 一种策略模型解决种植问题的服务系统 |
CN106951558A (zh) * | 2017-03-31 | 2017-07-14 | 广东睿盟计算机科技有限公司 | 一种基于深度搜索的税务智能咨询平台的数据处理方法 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109947947A (zh) * | 2019-03-29 | 2019-06-28 | 北京泰迪熊移动科技有限公司 | 一种文本分类方法、装置及计算机可读存储介质 |
CN110490547A (zh) * | 2019-08-13 | 2019-11-22 | 北京航空航天大学 | 办公系统智能化技术 |
CN110765248A (zh) * | 2019-10-14 | 2020-02-07 | 桂林理工大学 | 一种基于云计算的中小企业智能咨询服务平台 |
CN111159355A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 客户投诉单处理方法及装置 |
CN111680977A (zh) * | 2020-06-02 | 2020-09-18 | 北京大学 | 基于gis一张图管理系统的安全生产问题解决方法及平台 |
CN112733065A (zh) * | 2021-01-15 | 2021-04-30 | 海南金垦赛博信息科技有限公司 | 一种热带农业专家信息管理方法及系统 |
CN112733065B (zh) * | 2021-01-15 | 2022-10-04 | 海南金垦赛博信息科技有限公司 | 一种热带农业专家信息管理方法及系统 |
CN113434644A (zh) * | 2021-05-25 | 2021-09-24 | 北京农业信息技术研究中心 | 一种农技知识服务方法及系统 |
CN113434644B (zh) * | 2021-05-25 | 2023-09-12 | 北京农业信息技术研究中心 | 一种农技知识服务方法及系统 |
CN113689418A (zh) * | 2021-09-01 | 2021-11-23 | 北京云蝶智学科技有限公司 | 基于图像识别的公式计算方法 |
CN117273411A (zh) * | 2023-11-23 | 2023-12-22 | 杨凌职业技术学院 | 一种基于农业大数据管理的农业信息服务系统 |
CN117273411B (zh) * | 2023-11-23 | 2024-02-02 | 杨凌职业技术学院 | 一种基于农业大数据管理的农业信息服务系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109447266B (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109447266A (zh) | 一种基于大数据的农业科技服务智能分拣方法 | |
CN110457442B (zh) | 面向智能电网客服问答的知识图谱构建方法 | |
CN109684448B (zh) | 一种智能问答方法 | |
CN109815308B (zh) | 意图识别模型的确定及检索意图识别方法、装置 | |
CN109408622B (zh) | 语句处理方法及其装置、设备和存储介质 | |
CN101286161B (zh) | 一种基于概念的智能中文问答系统 | |
CN109960786A (zh) | 基于融合策略的中文词语相似度计算方法 | |
CN109255031A (zh) | 基于知识图谱的数据处理方法 | |
CN110807091B (zh) | 一种酒店智能问答推荐与决策支持分析方法及系统 | |
GB2561660A (en) | Computer-implemented method of querying a dataset | |
CN106951558B (zh) | 一种基于深度搜索的税务智能咨询平台的数据处理方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的系统及方法 | |
CN113032418B (zh) | 一种基于树状模型的复杂自然语言查询转sql方法 | |
CN104899231A (zh) | 基于细粒度属性分类的感情分析引擎 | |
CN116166782A (zh) | 一种基于深度学习的智能问答方法 | |
CN109508441B (zh) | 通过自然语言实现数据统计分析的方法、装置及电子设备 | |
CN114997288A (zh) | 一种设计资源关联方法 | |
CN107679124B (zh) | 一种基于动态规划算法的知识图谱中文问答检索方法 | |
CN111666374A (zh) | 一种在深度语言模型中融入额外知识信息的方法 | |
CN114238653A (zh) | 一种编程教育知识图谱构建、补全与智能问答的方法 | |
CN113139558B (zh) | 确定物品的多级分类标签的方法和装置 | |
Alshammari et al. | TAQS: an Arabic question similarity system using transfer learning of BERT with BILSTM | |
Karpagam et al. | Deep learning approaches for answer selection in question answering system for conversation agents | |
Ivanov et al. | Automatic generation of a large dictionary with concreteness/abstractness ratings based on a small human dictionary | |
CN111581326B (zh) | 一种基于异构外部知识源图结构抽取答案信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |