CN116957740B - 一种基于词特征的农产品推荐系统 - Google Patents
一种基于词特征的农产品推荐系统 Download PDFInfo
- Publication number
- CN116957740B CN116957740B CN202310958555.6A CN202310958555A CN116957740B CN 116957740 B CN116957740 B CN 116957740B CN 202310958555 A CN202310958555 A CN 202310958555A CN 116957740 B CN116957740 B CN 116957740B
- Authority
- CN
- China
- Prior art keywords
- word
- agricultural product
- user
- emotion
- emotion tendency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000008451 emotion Effects 0.000 claims abstract description 68
- 238000011156 evaluation Methods 0.000 claims description 49
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 17
- 230000011218 segmentation Effects 0.000 claims description 12
- 239000013598 vector Substances 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000010276 construction Methods 0.000 claims description 4
- 238000000034 method Methods 0.000 abstract description 8
- 238000004883 computer application Methods 0.000 abstract description 2
- 240000007594 Oryza sativa Species 0.000 description 13
- 235000007164 Oryza sativa Nutrition 0.000 description 13
- 235000009566 rice Nutrition 0.000 description 12
- 208000013036 Dopa-responsive dystonia due to sepiapterin reductase deficiency Diseases 0.000 description 8
- 238000013528 artificial neural network Methods 0.000 description 8
- 201000001195 sepiapterin reductase deficiency Diseases 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 235000013305 food Nutrition 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 3
- 235000013339 cereals Nutrition 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 230000009977 dual effect Effects 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 235000010777 Arachis hypogaea Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- 241000239290 Araneae Species 0.000 description 1
- 241000371652 Curvularia clavata Species 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 235000007189 Oryza longistaminata Nutrition 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 240000006394 Sorghum bicolor Species 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008909 emotion recognition Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 235000020232 peanut Nutrition 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
- G06N3/0442—Recurrent networks, e.g. Hopfield networks characterised by memory or gating, e.g. long short-term memory [LSTM] or gated recurrent units [GRU]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Finance (AREA)
- Data Mining & Analysis (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Biomedical Technology (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Development Economics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
一种基于词特征的农产品推荐系统,涉及计算机应用技术领域,针对现有推荐系统推荐信息不准确的问题,本申请通过获取用户历史农产品评价数据及对应的评价对象,之后获取用户历史农产品评价数据情感倾向值,以此通过用户针对该农产品的评价,得到用户针对该产品的喜好。然后本申请通过对用户当前浏览农产品简介文本进行分词,并通过词语、与情感倾向值之间的对应关系,得到用户对当前浏览农产品的喜好程度,进而进行推荐。
Description
技术领域
本发明涉及计算机应用技术领域,具体为一种基于词特征的农产品推荐系统。
背景技术
农产品是指农业中生产的物品,如高粱、稻子、花生、玉米、小麦以及各个地区土特产等,随着信息时代的发展,线上购买农产品成为一种趋势。而线上购买农产品时,针对性的对用户当前浏览的农产品进行同类型农产品的推荐,可以极大地提升用户购物效率,减少用户购物前对农产品进行了解的时间,提升用户的选择性。
现有推荐系统通常根据用户历史农产品购物记录,对用户偏好进行分析,进而向用户推荐农产品。但是用户历史农产品购物记录,仅能说明用户购买过该农产品,并不能体现用户对该农产品的喜好,因此导致现有推荐系统推荐的产品并不是用户喜好的产品,即现有推荐系统推荐信息不准确。
发明内容
本发明的目的是:针对现有推荐系统推荐信息不准确的问题,提出一种基于词特征的农产品推荐系统。
本发明为了解决上述技术问题采取的技术方案是:
一种基于词特征的农产品推荐系统,所述系统包括数据获取模块、情感倾向模块、词库调取模块、匹配模块以及农产品推荐模块;
所述数据获取模块用于获取用户历史农产品评价数据及对应的评价对象,所述评价对象为农产品的具体品种;
所述情感倾向模块用于加载情感分析模型,将用户历史农产品评价数据输入情感分析模型,得到输出的用户历史农产品评价数据的情感倾向值,之后将用户历史农产品评价数据的情感倾向值的二分之一作为该农产品具体品种的情感倾向阈值;
所述词库调取模块用于获取用户当前浏览农产品简介文本,并利用中文关键词提取器Jieba进行关键词提取,之后根据关键词确定用户当前浏览农产品的种类,并根据确定的种类调取对应的词库组;
所述词库组的构建步骤具体为:
将用户历史农产品评价数据利用Biaffine句法分析器得到表示评论数据的依存句法结构图,之后利用依存句法结构图计算不同词之间的相对依存距离,并根据相对依存距离得到评论数据中不同词语相对于评价对象的重要性权重,之后根据重要性权重以及评价数据的情感倾向值,得到评价数据中每个词语对应的情感倾向值,最后利用农产品的具体品种、词语、每个词语对应的情感倾向值以及情感倾向阈值构建一个词库,并将隶属于同一种类的农产品的具体品种划分为一组,即词库组;
所述匹配模块用于将中文关键词提取器Jieba提取的关键词分别与对应的词库组中每个词库进行匹配,之后获取每个词库匹配成功的关键词,并将词库中每个匹配成功的关键词对应的情感倾向值进行求和,并将求和结果与该词库对应的情感倾向阈值进行比较,若求和结果大于情感倾向阈值,则将该词库对应的农产品的具体品种作为待推荐项,否则,不作为待推荐项;
所述农产品推荐模块用于将匹配模块中得到的所有待推荐项向用户进行推荐。
进一步的,所述情感分析模型的训练步骤具体为:
步骤一:加载预训练中文分词模型embedding,并获取训练集;
步骤二:利用正则表达式去除训练集语料中的标点符号;
步骤三:利用jieba库将去除标点符号的语料进行分词;
步骤四:利用embedding将分词结果转化为词向量,进而构建词向量矩阵;
步骤五:利用词向量矩阵训练LSTM模型,训练好的模型即为情感分析模型。
进一步的,所述LSTM模型包括两层,具体为:
第一层为embedding,第一层利用BiLSTM返回sequences;
第二层为16个单元的LSTM,第二层16个单元的LSTM不返回sequences,只返回最终结果;
最后一层为全链接层,利用sigmoid激活函数输出结果。
进一步的,所述依存句法结构图以邻接矩阵D的形式表示,D中的每一个元素可表示为:
其中,i表示矩阵的行索引,j表示矩阵的列索引,wi和wj表示评论句中任意的两个词语。
进一步的,所述利用依存句法结构图计算相对依存距离的具体步骤为:
基于邻接矩阵D,利用Dijkstra算法通过不同词在邻接矩阵上的最短距离得到不同词之间的相对依存距离。
进一步的,所述用户历史农产品评价数据及对应的评价对象利用scrapy框架爬取。
本发明的有益效果是:
本申请通过获取用户历史农产品评价数据及对应的评价对象,之后获取用户历史农产品评价数据情感倾向值,以此通过用户针对该农产品的评价,得到用户针对该产品的喜好。然后本申请通过对用户当前浏览农产品简介文本进行分词,并通过词语、与情感倾向值之间的对应关系,得到用户对当前浏览农产品的喜好程度,进而进行推荐。
具体来说,本申请将用户历史评价中的所有单词直接与评价对象联系起来,为了区分不同词的重要性,并继承句法结构带来的优势,本申请根据相对依存距离对每个词赋予了不同的权重。并根据不同的权重得到不同词的情感倾向,极大地提升了农产品推荐信息的准确性。并且本申请可以极大地提升用户购物效率,减少了用户购物前对农产品进行了解的时间,提升用户购物体验。
附图说明
图1为本申请整理流程图;
图2为依存句法结构图。
具体实施方式
需要特别说明的是,在不冲突的情况下,本申请公开的各个实施方式之间可以相互组合。
具体实施方式一:参照图1具体说明本实施方式,本实施方式所述的一种基于词特征的农产品推荐系统,所述系统包括数据获取模块、情感倾向模块、词库调取模块、匹配模块以及农产品推荐模块;
所述数据获取模块用于获取用户历史农产品评价数据及对应的评价对象,所述评价对象为农产品的具体品种;
所述情感倾向模块用于加载情感分析模型,将用户历史农产品评价数据输入情感分析模型,得到输出的用户历史农产品评价数据的情感倾向值,之后将用户历史农产品评价数据的情感倾向值的二分之一作为该农产品具体品种的情感倾向阈值;
所述词库调取模块用于获取用户当前浏览农产品简介文本,并利用中文关键词提取器Jieba进行关键词提取,之后根据关键词确定用户当前浏览农产品的种类,并根据确定的种类调取对应的词库组;
所述词库组的构建步骤具体为:
将用户历史农产品评价数据利用Biaffine句法分析器得到表示评论数据的依存句法结构图,之后利用依存句法结构图计算不同词之间的相对依存距离,并根据相对依存距离得到评论数据中不同词语相对于评价对象的重要性权重,之后根据重要性权重以及评价数据的情感倾向值,得到评价数据中每个词语对应的情感倾向值,最后利用农产品的具体品种、词语、每个词语对应的情感倾向值以及情感倾向阈值构建一个词库,并将隶属于同一种类的农产品的具体品种划分为一组,即词库组;
所述匹配模块用于将中文关键词提取器Jieba提取的关键词分别与对应的词库组中每个词库进行匹配,之后获取每个词库匹配成功的关键词,并将词库中每个匹配成功的关键词对应的情感倾向值进行求和,并将求和结果与该词库对应的情感倾向阈值进行比较,若求和结果大于情感倾向阈值,则将该词库对应的农产品的具体品种作为待推荐项,否则,不作为待推荐项;
所述农产品推荐模块用于将匹配模块中得到的所有待推荐项向用户进行推荐。
具体实施方式二:本实施方式是对具体实施方式一的进一步说明,本实施方式与具体实施方式一的区别是所述情感分析模型的训练步骤具体为:
步骤一:加载预训练中文分词模型embedding,并获取训练集;
步骤二:利用正则表达式去除训练集语料中的标点符号;
步骤三:利用jieba库将去除标点符号的语料进行分词;
步骤四:利用embedding将分词结果转化为词向量,进而构建词向量矩阵;
步骤五:利用词向量矩阵训练LSTM模型,训练好的模型即为情感分析模型。
S1、基于神经网络的评论情感倾向分析;
S11、情感分析模型的建立;
S12、加载预训练中文分词模型embedding;
S13、用正则表达式去除训练集语料中的标点符号;
S14、用jieba库进行分词,将上述预料分为多个词语的列表;
S15、用预加载模型将分词结果转化为词向量,并转化为词向量矩阵;
S16、使用LSTM模型进行训练,模型第一层为embedding,之后第一层我们用BiLSTM返回sequences,然后第二层16个单元的LSTM不返回sequences,只返回最终结果,最后一个是全链接层,用sigmoid激活函数输出结果;
S17、将评论内容放入训练好的情感分析模型内,输出情感倾向,统计负面情感的言论的数量;
S18、对于一个用户的全部的评论数据,计算其情感倾向的均值。
具体实施方式三:本实施方式是对具体实施方式二的进一步说明,本实施方式与具体实施方式二的区别是所述LSTM模型包括两层,具体为:
第一层为embedding,第一层利用BiLSTM返回sequences;
第二层为16个单元的LSTM,第二层16个单元的LSTM不返回sequences,只返回最终结果;
最后一层为全链接层,利用sigmoid激活函数输出结果。
神经网络:人工神经网络也简称为神经网络或称作连接模型,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。
LSTM:长短期记忆网络,是一种时间循环神经网络,是为了解决一般的RNN(循环神经网络)存在的长期依赖问题而专门设计出来的。
sigmoid激活函数:sigmoid函数也叫Logistic函数,用于隐层神经元输出,取值范围为(0,1),它可以将一个实数映射到(0,1)的区间,可以用来做二分类。在特征相差比较复杂或是相差不是特别大时效果比较好。Sigmoid函数由下列公式定义:
具体实施方式四:本实施方式是对具体实施方式三的进一步说明,本实施方式与具体实施方式三的区别是所述依存句法结构图以邻接矩阵D的形式表示,D中的每一个元素可表示为:
其中,i表示矩阵的行索引,j表示矩阵的列索引,wi和wj表示评论句中任意的两个词语。英文句的翻译是:如果i=j或wi和wj这两个词在依存句法树上有连接的边。
具体实施方式五:本实施方式是对具体实施方式四的进一步说明,本实施方式与具体实施方式四的区别是所述利用依存句法结构图计算相对依存距离的具体步骤为:
基于邻接矩阵D,利用Dijkstra算法通过不同词在邻接矩阵上的最短距离得到不同词之间的相对依存距离。
具体实施方式六:本实施方式是对具体实施方式五的进一步说明,本实施方式与具体实施方式五的区别是所述用户历史农产品评价数据及对应的评价对象利用scrapy框架爬取。
网络爬虫:又称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。
如图2中所示句子的句法结构,对于apple-OS这个方面,happy这个词是最能提供情感线索的,应该被更多的考虑。但从句法结构的角度来看,apple-OS这个词需要通过三个中间语境词to、back和be与它的情感词happy联系起来。由于复杂和冗余的句法结构,当happy通过长的依赖路径传递信息时,中间词和它们的邻接词的信息就会被纳入,而这些信息对于情感识别是没有用的。这导致意见词happy在传递到apple-OS方面时只占一小部分权重。因此,happy和apple-OS之间复杂的句法结构使得传播距离太远,削弱了它们之间的交互。
本申请基于相对依存距离来继承句法结构所提供的优势,本申请对词赋予了不同的重要性权重。
首先,通过神经句法分析器Biaffine得到原始的依存句法树。Biaffine是一种基于图的神经网络句法分析模型,其最大的模型结构特点是使用双仿射分类器来预测依存关系和依存边,并且抛弃了传统的基于多层感知机的注意力计算方法,而是引入双仿射注意力机制,而多层感知机仅用来为LSTM层的输入进行降维。由依存句法分析器Biaffine的输出可以得到依存图,并以邻接矩阵D的形式表示。D中的每一个元素可表示为:
基于上一小节得到的邻接矩阵D,对于Aspect中的每一个词,可以视其为一个起点来计算它与句中其他词语的相对依存距离(Syntactic Relative Distance,SRD)。不同词之间的相对依存距离可以通过它们在邻接矩阵上的最短距离,由Dijkstra算法计算得到。关于SRD的计算,通过下面的例子来简要阐述。
任意两词语间的相对依存距离即为从一个节点出发,经由数条依存边到达另一节点,途中经过依存边的数量即为相对依存距离。由依存句法图是无环连通图的特性,任意两节点间的距离都可由Dijkstra算法计算而得。对于这句话中的Aspect词food,其与句中其余语境词的相对依存距离的计算结果如下所示。
SRD(food,great)=1
SRD(food,but)=1
SRD(food,service)=1
SRD(food,was)=1
SRD(food,dreadful)=2
通过原始的依存句法树得到了SRDs∈Rm×n来依据相对依存距离表示不同词对于Aspect的重要程度。
本申请将一个句子中的所有单词直接与评价对象联系起来。此外,为了区分不同词的重要性,并继承句法结构带来的优势,本申请根据相对依存距离对每个词赋予了不同的权重。在此基础上,本申请评价对象为中心的图卷积网,将用户对评级俺对象的情感特征与上下文信息进行交互,有效捕捉评价对象和用户潜在情感词之间的关联,在用户选择产品时,本申请可以根据用户以往对当前用户浏览的产品对应的下属类别的具体评价进行分析,得到用户针对该类别产品的喜好程度,进而针对用户当前浏览产品进行推荐。
例如,用户当前浏览的产品为大米,本申请技术方案首先识别用户当前浏览的内容,并根据当前浏览的内容基于文本匹配或文字识别,得到用于当前浏览内容对应的农产品种类,然后根据农产品种类调取对应的词库组。
所述词库组的构建过程为,获取用户历史针对大米(包括各种类型的大米,如长粒米、中粒米、短粒米、玫瑰米、珍珠米、红米、黑米等)的评价记录,并针对每个评价提取情感倾向值,并以情感倾向值的一半作为阈值。之后提取用户当前浏览内容的关键词,并将关键词与词库组中的每个词库进行匹配,并将每个词库匹配成功的关键词对应的情感倾向值分别与对应的情感倾向阈值进行对比。由于每个词库是根据针对每个类型大米的评价数据进行提取的,因此,针对每个词库匹配成功的关键词所对应的情感倾向值若大于该词库的情感倾阈值,则该用户对这个类型的大米是喜好的,因此向用户推荐该类型的大米。
需要注意的是,具体实施方式仅仅是对本发明技术方案的解释和说明,不能以此限定权利保护范围。凡根据本发明权利要求书和说明书所做的仅仅是局部改变的,仍应落入本发明的保护范围内。
Claims (6)
1.一种基于词特征的农产品推荐系统,其特征在于所述系统包括数据获取模块、情感倾向模块、词库调取模块、匹配模块以及农产品推荐模块;
所述数据获取模块用于获取用户历史农产品评价数据及对应的评价对象,所述评价对象为农产品的具体品种;
所述情感倾向模块用于加载情感分析模型,将用户历史农产品评价数据输入情感分析模型,得到输出的用户历史农产品评价数据的情感倾向值,之后将用户历史农产品评价数据的情感倾向值的二分之一作为该农产品具体品种的情感倾向阈值;
所述词库调取模块用于获取用户当前浏览农产品简介文本,并利用中文关键词提取器Jieba进行关键词提取,之后根据关键词确定用户当前浏览农产品的种类,并根据确定的种类调取对应的词库组;
所述词库组的构建步骤具体为:
将用户历史农产品评价数据利用Biaffine句法分析器得到表示评论数据的依存句法结构图,之后利用依存句法结构图计算不同词之间的相对依存距离,并根据相对依存距离得到评论数据中不同词语相对于评价对象的重要性权重,之后根据重要性权重以及评价数据的情感倾向值,得到评价数据中每个词语对应的情感倾向值,最后利用农产品的具体品种、词语、每个词语对应的情感倾向值以及情感倾向阈值构建一个词库,并将隶属于同一种类的农产品的具体品种划分为一组,即词库组;
所述匹配模块用于将中文关键词提取器Jieba提取的关键词分别与对应的词库组中每个词库进行匹配,之后获取每个词库匹配成功的关键词,并将词库中每个匹配成功的关键词对应的情感倾向值进行求和,并将求和结果与该词库对应的情感倾向阈值进行比较,若求和结果大于情感倾向阈值,则将该词库对应的农产品的具体品种作为待推荐项,否则,不作为待推荐项;
所述农产品推荐模块用于将匹配模块中得到的所有待推荐项向用户进行推荐。
2.根据权利要求1所述的一种基于词特征的农产品推荐系统,其特征在于所述情感分析模型的训练步骤具体为:
步骤一:加载预训练中文分词模型embedding,并获取训练集;
步骤二:利用正则表达式去除训练集语料中的标点符号;
步骤三:利用jieba库将去除标点符号的语料进行分词;
步骤四:利用embedding将分词结果转化为词向量,进而构建词向量矩阵;
步骤五:利用词向量矩阵训练LSTM模型,训练好的模型即为情感分析模型。
3.根据权利要求2所述的一种基于词特征的农产品推荐系统,其特征在于所述LSTM模型包括两层,具体为:
第一层为embedding,第一层利用BiLSTM返回sequences;
第二层为16个单元的LSTM,第二层16个单元的LSTM不返回sequences,只返回最终结果;
最后一层为全链接层,利用sigmoid激活函数输出结果。
4.根据权利要求3所述的一种基于词特征的农产品推荐系统,其特征在于所述依存句法结构图以邻接矩阵D的形式表示,D中的每一个元素可表示为:
其中,i表示矩阵的行索引,j表示矩阵的列索引,wi和wj表示评论句中任意的两个词语。
5.根据权利要求4所述的一种基于词特征的农产品推荐系统,其特征在于所述利用依存句法结构图计算相对依存距离的具体步骤为:
基于邻接矩阵D,利用Dijkstra算法通过不同词在邻接矩阵上的最短距离得到不同词之间的相对依存距离。
6.根据权利要求5所述的一种基于词特征的农产品推荐系统,其特征在于所述用户历史农产品评价数据及对应的评价对象利用scrapy框架爬取。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310958555.6A CN116957740B (zh) | 2023-08-01 | 2023-08-01 | 一种基于词特征的农产品推荐系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310958555.6A CN116957740B (zh) | 2023-08-01 | 2023-08-01 | 一种基于词特征的农产品推荐系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116957740A CN116957740A (zh) | 2023-10-27 |
CN116957740B true CN116957740B (zh) | 2024-01-05 |
Family
ID=88442503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310958555.6A Active CN116957740B (zh) | 2023-08-01 | 2023-08-01 | 一种基于词特征的农产品推荐系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116957740B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102020756B1 (ko) * | 2018-10-23 | 2019-11-04 | 주식회사 리나소프트 | 머신러닝을 이용한 리뷰 분석 방법 |
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
CN111523055A (zh) * | 2020-04-28 | 2020-08-11 | 安徽农业大学 | 一种基于农产品特征属性评论倾向的协同推荐方法及系统 |
CN112667894A (zh) * | 2020-12-25 | 2021-04-16 | 特赞(上海)信息科技有限公司 | 内容推荐方法、装置、设备和存储介质 |
CN113641822A (zh) * | 2021-08-11 | 2021-11-12 | 哈尔滨工业大学 | 一种基于图神经网络的细粒度情感分类方法 |
CN113673239A (zh) * | 2021-07-03 | 2021-11-19 | 桂林理工大学 | 一种基于情感词典加权的酒店评论情感极性分类方法 |
CN114942974A (zh) * | 2022-05-24 | 2022-08-26 | 黄华 | 电商平台商品用户评价情感倾向分类方法 |
-
2023
- 2023-08-01 CN CN202310958555.6A patent/CN116957740B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102020756B1 (ko) * | 2018-10-23 | 2019-11-04 | 주식회사 리나소프트 | 머신러닝을 이용한 리뷰 분석 방법 |
CN110517121A (zh) * | 2019-09-23 | 2019-11-29 | 重庆邮电大学 | 基于评论文本情感分析的商品推荐方法及商品推荐装置 |
CN111523055A (zh) * | 2020-04-28 | 2020-08-11 | 安徽农业大学 | 一种基于农产品特征属性评论倾向的协同推荐方法及系统 |
CN112667894A (zh) * | 2020-12-25 | 2021-04-16 | 特赞(上海)信息科技有限公司 | 内容推荐方法、装置、设备和存储介质 |
CN113673239A (zh) * | 2021-07-03 | 2021-11-19 | 桂林理工大学 | 一种基于情感词典加权的酒店评论情感极性分类方法 |
CN113641822A (zh) * | 2021-08-11 | 2021-11-12 | 哈尔滨工业大学 | 一种基于图神经网络的细粒度情感分类方法 |
CN114942974A (zh) * | 2022-05-24 | 2022-08-26 | 黄华 | 电商平台商品用户评价情感倾向分类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116957740A (zh) | 2023-10-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110717098B (zh) | 基于元路径的上下文感知用户建模方法、序列推荐方法 | |
CN111222332B (zh) | 一种结合注意力网络和用户情感的商品推荐方法 | |
CN110458627B (zh) | 一种面向用户动态偏好的商品序列个性化推荐方法 | |
Daud et al. | Using machine learning techniques for rising star prediction in co-author network | |
CN111460130A (zh) | 信息推荐方法、装置、设备和可读存储介质 | |
CN112991017A (zh) | 基于用户评论解析的标签体系精准推荐方法 | |
CN109584006B (zh) | 一种基于深度匹配模型的跨平台商品匹配方法 | |
CN113268656A (zh) | 一种用户推荐方法、装置、电子设备及计算机存储介质 | |
CN111737578A (zh) | 一种推荐方法及系统 | |
Malik et al. | EPR-ML: E-Commerce Product Recommendation Using NLP and Machine Learning Algorithm | |
CN115688024A (zh) | 基于用户内容特征和行为特征的网络异常用户预测方法 | |
CN114077661A (zh) | 信息处理装置、信息处理方法和计算机可读介质 | |
CN113761347A (zh) | 一种商品推荐方法、装置、存储介质及系统 | |
CN114861050A (zh) | 一种基于神经网络的特征融合推荐方法及系统 | |
CN116542738A (zh) | 一种基于电子商务大数据的信息推送方法 | |
CN114942974A (zh) | 电商平台商品用户评价情感倾向分类方法 | |
Ghobakhloo et al. | Design of a personalized recommender system using sentiment analysis in social media (case study: banking system) | |
Agustyaningrum et al. | Online shopper intention analysis using conventional machine learning and deep neural network classification algorithm | |
Nazari et al. | Scalable and data-independent multi-agent recommender system using social networks analysis | |
CN113971599A (zh) | 广告投放选品方法及其装置、设备、介质、产品 | |
CN109344319B (zh) | 一种基于集成学习的线上内容热度预测方法 | |
Ren et al. | A co-attention based multi-modal fusion network for review helpfulness prediction | |
CN116957740B (zh) | 一种基于词特征的农产品推荐系统 | |
Sales et al. | Multimodal deep neural networks for attribute prediction and applications to e-commerce catalogs enhancement | |
Anuradha et al. | Fuzzy based summarization of product reviews for better analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |