CN116703509A - 一种针对直播营销商品质量感知分析的网购助手构建方法 - Google Patents
一种针对直播营销商品质量感知分析的网购助手构建方法 Download PDFInfo
- Publication number
- CN116703509A CN116703509A CN202310638956.3A CN202310638956A CN116703509A CN 116703509 A CN116703509 A CN 116703509A CN 202310638956 A CN202310638956 A CN 202310638956A CN 116703509 A CN116703509 A CN 116703509A
- Authority
- CN
- China
- Prior art keywords
- model
- information
- commodity
- task
- quality
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 12
- 230000008447 perception Effects 0.000 title claims abstract description 10
- 238000010276 construction Methods 0.000 title claims abstract description 8
- 230000006870 function Effects 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 24
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000013528 artificial neural network Methods 0.000 claims abstract description 13
- 230000008569 process Effects 0.000 claims abstract description 9
- 230000003993 interaction Effects 0.000 claims abstract description 7
- 238000013441 quality evaluation Methods 0.000 claims abstract description 3
- 238000012545 processing Methods 0.000 claims description 18
- 230000011218 segmentation Effects 0.000 claims description 14
- 230000004044 response Effects 0.000 claims description 13
- 238000003058 natural language processing Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 5
- 230000006978 adaptation Effects 0.000 claims description 4
- 230000002776 aggregation Effects 0.000 claims description 3
- 238000004220 aggregation Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000010200 validation analysis Methods 0.000 claims 1
- 230000000007 visual effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000004931 aggregating effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明专利提出了一种针对直播营销商品质量感知分析的网购助手构建方法,旨在帮助用户深入了解直播营销商品的质量、评论真实性、商家信誉等信息,从而做出合理的购物决策。该方法首先综合多维度数据(包括商品评论信息、店铺信息和直播间信息),并采用BERT模型与图神经网络(GNN)相结合的方式提取关键质量特征,进而训练一个多任务学习(Multi‑taskLearning)模型,以评估商品质量、识别虚假评论等任务。接下来,将训练好的多任务学习模型与现有的自然语言模型进行集成。设计贪婪解码方法,基于预训练模型针对特定任务(如商品质量评价、虚假评论识别等)进行任务适应性调整,使生成模型能够理解和处理商品、店铺和直播间信息。最后,将集成后的模型部署到直播营销网购平台上的智能助手中,实现有关商品质量分析结果的自然语言呈现及与用户的交互功能。该网购助手能够为用户提供更丰富、更直观的商品质量信息,提升用户购物体验,降低购买风险,提高消费者的满意度。
Description
技术领域
本发明涉及电子商务技术领域,尤其是一种针对直播营销商品质量感知分析的网购助手构建方法。
背景技术
随着互联网和电商行业的迅速发展,网购成为日常生活中的重要组成部分。然而,在线购物平台上商品种类繁多,商品质量参差不齐,消费者在购物过程中很难准确判断商品的质量。虽然大部分电商平台提供了用户评论和评分机制,但这些信息往往受主观因素影响较大,不能全面客观地反映商品质量。此外,恶意商家可能会通过刷单、虚假评论等手段来误导消费者,进一步降低消费者对商品质量了解的全面性、客观性、准确性。目前针对电商商品质量感知分析现有的网购助手工具仅能提供价格比较和优惠信息,较少涉及对商品质量的全面评估,难以为消费者提供有价值的帮助。
发明内容
为解决上述问题,本发明提出了一种针对直播营销商品质量感知分析的网购助手构建方法,该方法首先综合多维度数据(商品评论信息、店铺信息和直播间信息),并使用Bert模型与图神经网络(GNN)结合的方法提取关键质量特征,训练一个多任务学习(Multi-task Learning)模型,用于评估商品质量、识别虚假评论等。接来下,将训练好的多任务学习模型与已有的自然语言模型集成。通过设计贪婪解码方法,在预训练模型基础上针对任务进行微调,使集成模型能理解和处理商品、店铺和直播间信息。最后将集成后的模型部署到直播营销网购平台上的智能助手中,实现自然语言呈现及与用户的交互功能,使用户可以全面了解商品质量、虚假评论等各类信息,做出更合理的购物决策。
根据本申请的一个方面,提出一种针对直播营销商品质量感知分析的网购助手构建方法:
S1、首先,通过爬虫技术收集商品评论信息、店铺信息和直播间信息,并对数据进行预处理。
S2、结合获取到的商品评论信息、店铺信息和直播间信息这三维数据,使用Bert模型与图神经网络结合的方法提取关键质量特征,训练一个用于评估商品质量、识别虚假评论等的多任务学习(Multi-task Learning)模型。
具体的,步骤S2具体为:
S201、将采集到的商品评论信息、直播间的弹幕信息进行分词处理,把自建的一套完整词典加入到jieba分词库,运用jieba分词系统进行分词。
S202、使用停用词表对商品评论信息和直播间的弹幕信息进行停用词去除。
S203、对于商品评论信息和直播间的弹幕信息,使用Bert模型提取语义特征,将Bert模型的最后一层隐藏状态作为文本表示:
h=BERT(text)
S204、对于店铺信息和除弹幕外的直播间信息,根据其结构化特征(如店铺口碑、商品服务分、服务体验分、物流体验分、粉丝数、粉丝团数、直播观看人数、小黄车信息等)构建如图2所示的图结构。
S205、对于每个节点v,聚合其邻居节点的特征表示,通过求和聚合函数实现,具体公式如下:
其中,表示节点v在第t层的特征表示,N(v)表示节点v的邻居节点集合。
S206、将聚合到的邻居信息与节点自身的特征表示相结合,通过ReLU非线性激活函数进行节点特征更新,具体的公式如下:
其中,ReLU表示非线性激活函数,W表示可学习的权重矩阵,CONCAT表示连接操作。
S207、多次迭代步骤S205和步骤S206,图神经网络(GNN)提取到图中的节点特征,使用读出函数将所有节点特征融合为图特征。
S208、将BERT模型提取的文本特征与图神经网络(GNN)提取的图特征进行融合,形成一个综合特征表示:
hcombined=[hBERT;hGNN]
S209、基于融合后的特征表示,构建一个多任务学习模型,包括多个任务相关的输出层,如商品质量评估、虚假评论识别、近三天的好评率和差评率、商家刷单的概率、商品的优惠力度等。设有m个任务,每个任务有一个任务相关的输出层,对于任务k使用如下公式计算任务k的输出:
yk=Wk*hcombined+bk
其中,Wk和bk分别表示任务k的权重矩阵和偏置向量。
S210、在训练过程中使用多任务损失函数来优化模型参数,如:
其中,Lk表示任务k的损失函数,表示任务k的真是标签,λk为任务k的权重。
S211、在验证集上评估多任务学习模型性能,如准确率、召回率、F1值等。如果模型性能不佳,手动设置学习率、批次大小、优化器类型、权重衰减系数,提升模型的训练速度和收敛能力,使模型在验证集上达到满意的性能。
S3、将训练好的多任务学习模型与已有的自然语言模型集成。通过设计贪婪解码方法,在集成模型上针对任务进行任务适应调整,使集成模型能理解和处理商品、店铺和直播间信息。
具体的,步骤S3具体为:
S301、根据多任务学习模型的输出结果,构建结构化文本模板。例如,将商品质量评分和虚假识别等数值和类别结果转换为类似于“商品质量评分为8.5分,30%的评论可能是虚假的,近三天内好评20条,差评5条,退货概率为10%等”这样的文本。
S302、基于步骤S301构建多个结构化文本模板,用于将多任务模型的输出结果转换为描述性结构化文本。每个模板都针对某种特定的用户需求,包含相关的变量占位符。
S303、分析用户需求和之前的对话记录、购物历史等上下文信息,引入动态、柔性的语义推理逻辑。根据用户交流需求,动态选择和填充结构化文本模板,生成针对用户需求的个性化描述性结构化文本。
S304、选择一个已有预训练好的自然语言模型作为基础,用于处理描述性结构化文本。
S305、将描述性结构化文本输入自然语言模型,以生成更详细的回应或解释。把文本转换为token序列:X={x1,x2,…,xn}
其中xi是文本中的第i个token。
自然语言模型根据概率分布P(xi|X1:i-1)预测下一个token。
S306、自然语言模型根据输入的描述性结构化文本,使用贪婪解码方法生成相应的文本回应,这些回应是关于商品质量、虚假评论、好评率和差评率等方面的详细描述。
S4、将集成后的模型部署到直播营销网购平台上的智能助手中,实现自然语言呈现及与用户的交互功能,使用户可以轻松了解商品质量、各类信息,做出更合理的购物决策。
具体的,步骤S4具体为:
S401、为集成后的模型创建一个API接口,使得直播营销网购平台可以通过网络调用该模型。这个API接口的接收输入为(用户查询、商品ID等),并返回模型的输出结果(描述性结构化文本、商品质量评价等)。
S402、使用Flask框架在服务器上搭建后端服务,用于处理用户请求、调用API接口,并将模型输出返回给直播营销网购平台。
S403、将后端服务与直播营销网购平台集成,使得平台可以根据用户输入调用智能助手。
S404、设计并实现智能助手的用户界面,使用户能够通过自然语言与助手进行交互。该界面包括文本输入框、聊天窗口等UI组件。
S405、在用户向智能助手发送查询时,将输入数据传递给后端服务,然后调用模型API接口。根据用户需求和之前的对话记录、购物历史等上下文信息,动态选择和填充结构化文本模板处理模型输出,将其转换为易于理解的描述性结构化文本,并在智能助手界面中呈现给用户。
S406、收集用户反馈和模型输出结果,以持续改进模型性能和智能助手的用户体验。
本发明有益效果:本发明采用一种针对直播营销商品质量感知分析的网购助手构建方法,该方法综合利用商品评论、店铺信息和直播间信息,通过结合BERT模型和图神经网络构建一个多任务学习模型,用于评估商品质量、识别虚假评论等。该模型的输出结果可以转换为描述性结构化文本,并与自然语言处理模型集成,实现自然语言呈现及与用户的交互功能,最后将集成后的模型部署到直播营销网购平台上的智能助手中,用户可以轻松了解商品质量、各类信息,从而做出更合理的购物决策,降低购买风险,提高消费者的满意度。
根据下文结合附图对本发明的具体描述,本领域的技术人员将会更加明了本发明的上述以及其他目的、优点和特征。
附图说明
图1为本申请一个实施例的一种针对直播营销商品质量感知分析的网购助手构建方法流程图。
图2为本申请一个实施例的数据信息节点图实例图。
图3为本申请一个实施例的多任务学习模型训练流程图。
图4为本申请一个实施例的多任务学习模型与自然语言模型集成流程图。
具体实施方式
实施过程主要包括一下四个步骤:首先,收集直播营销平台的商品评论、店铺信息和直播间信息。然后,利用BERT模型与图神经网络结合,构建一个多任务学习模型,用于评估商品质量和识别虚假评论等。接着,将模型的输出结果转化为描述性文本,并与自然语言处理模型集成。最后,将集成后的模型部署到直播营销网购平台的智能助手中,实现自然语言呈现及与用户的交互功能,帮助用户轻松了解商品质量、各类信息,从而做出更明智的购物决策。
S1、首先,通过爬虫技术收集商品评论信息、店铺信息和直播间信息,并对数据进行预处理。
具体的,步骤S1具体为:
S101、编写爬虫程序,抓取商品评论信息、店铺信息和直播间信息,并保存到MySQL数据库中。信息包括评论文本、评论id、商品评分、购买时间、店铺评分、销售额、直播间观众数量,直播间粉丝团数等。
S202、对爬取到的数据,根据评论文本id过滤删除重复评论。
S203、对爬取到的数据,将多余的标点符号、多余空格删除。
S204、对爬取到的数据,移除无效字符、表情符号和单字的重复评论。
S2、结合获取到的商品评论信息、店铺信息和直播间信息这三维数据,利用BERT模型与图神经网络结合,构建一个多任务学习模型,用于评估商品质量和识别虚假评论等。
具体的、步骤S2具体为:
S201、将采集到的商品评论信息、直播间的弹幕信息进行分词处理,把自建的一套完整词典加入到jieba分词库,运用jieba分词系统进行分词。例如:商品质量很好物美价廉可分词成:商品,质量,很,好,物美价廉。
S202、使用停用词表对商品评论信息和直播间的弹幕信息进行停用词去除。停用词具体有:啊、唉、嗯、的、么、在、于、从等。
S203、将分词和停用词去除后的评论和弹幕信息,添加特殊标记(CLS)并将词汇转化为词汇表中的索引。
设输入文本为x,经过处理后得到整数序列x‘。
S204、将x‘输入到BERT模型,经过多层Transformer编码器处理,输出最后一层隐藏状态h。
h=BERT(x‘)
S205、对于店铺信息和除弹幕外的直播间信息,根据其结构化特征(如店铺口碑、商品服务分、服务体验分、物流体验分、粉丝数、粉丝团数、直播观看人数、小黄车信息等)构建如图2所示的图结构。节点表示店铺、商品、直播间等实体,边表示实体之间的关系。并将实体的结构化特征作为图节点的初始特征表示。
S206、对于每个节点v,聚合其邻居节点的特征表示。在第t层,使用相邻节点的特征表示计算消息传递。具体的,使用如下求和聚合函数实现:
其中,表示节点v在第t层接收到的聚合消息,/>表示邻居节点u在第t层的特征表示,N(v)表示节点v的邻居节点集合。
S207、将聚合到的邻居信息与节点自身的特征表示相结合,然后通过ReLU非线性激活函数进行节点特征更新。具体公式如下:
其中,表示节点v在第t+1层的特征表示,Wt表示可学习的权重矩阵,ReLU表示非线性激活函数,CONCAY表示连接操作。
S208、多次迭代步骤S206和步骤S207,图神经网络(GNN)提取到图中的节点特征。迭代T次后,得到所有节点在第T层的特征表示。接下来,使用读出函数将所有节点特征融合为图特征。具体的公式如下:
其中,g表示图特征,V表示图中所有节点的集合,READOUT表示读出函数。
S209、将BERT模型提取的文本特征hBERT与图神经网络(GNN)提取的图特征hGNN进行融合,形成一个综合特征表示f:
f=CONCAT(hBERT,hGNN)
其中,CONCAT表示连接操作。
S210、基于融合后的特征表示f,构建一个多任务学习模型。设有m个任务,分别为任务1,任务2,...,任务m。针对每个任务k,设计一个任务相关的输出层,使用如下公式计算任务k的输出:
输出k=softmax(Wk*f+bk)
其中,Wk和bk分别表示任务k的权重矩阵和偏置向量。
S211、在训练过程中,使用多任务损失函数来优化模型参数。对于每个任务k,计算其损失函数,其中/>表示任务k的真实标签,/>表示任务k的预测输出,最后计算加权总损失:
其中,L表示总损失,λk表示任务k的权重,用于平衡各任务之间的重要性。
S12、在验证集上评估多任务学习模型性能,包括准确率、召回率、F1值等。如果模型性能不佳,手动设置学习率、批次大小、优化器类型、权重衰减系数,提升模型的训练速度和收敛能力,使模型在验证集上达到满意的性能。
S3、将模型的输出结果转化为描述性结构化文本,并与自然语言处理模型集成。
具体的,步骤S3具体为:
S301、根据多任务学习模型的输出结果生成结构化文本。设有m个任务的输出结果分别为{y1,y2,...,ym},针对任务k的输出结果yk,使用模板将其转换为结构化文本Tk。例如,将商品质量评分和虚假识别等数值和类别结果转换为类似于“商品质量评分为8.5分,30%的评论可能是虚假的,近三天内好评20条,差评5条,退货概率为10%等”这样的文本。转换公式如下:
Tk=template(yk)
S302、构建结构化文本模板库:基于步骤S301构建多个结构化文本模板,用于将多任务学习模型的输出结果转换为描述性结构化文本。每个模板都针对某种特定的用户需求,包含相关的变量占位符。
S303、通过对用户输入的问题或需求进行自然语言处理,提取关键信息和意图,以便了解用户希望了解的商品质量方面的具体内容。例如,用户可能关心商品的质量评分、好评率或退货概率等。
S304、分析用户之前的对话记录、购物历史等上下文信息,以提供更加准确和个性化的回应。
S305、根据用户需求,从结构化文本模板库中动态选择一个或多个最相关的模板。例如,如果用户关心商品的质量评分和退货概率,可以选择一个包含这两个信息的模板。
S306、根据用户需求,仅填充模板中与用户关心的信息相关的变量占位符。例如,如果用户只关心质量评分和退货概率,可以只填充{quality_score}和{return_rate}变量占位符。
S307、使用填充后的结构化文本,添加解释性描述和用户特定问题的回答,最终生成个性化的描述性结构化文本。
S308、选择一个已有训练好的自然语言模型作为基础,用于处理描述性结构化文本。
S309、将描述性结构化文本Tk输入自然语言模型,对文本进行如上述步骤S203处理。例如,假设描述性结构化文本为Tk,处理后的形式为P(Tk)。
P(Tk)=preprocess(Tk)
自然语言模型根据概率分布预测下一个token,输入自然语言模型的描述性结构化文本P(Tk),输出概率分布为p(xi|P(Tk)),其中xi表示第i个token。
p(xi|P(Tk))=NLP(P(Tk))
S310、自然语言模型根据输入的描述性结构化文本使用贪婪解码方法生成相应的文本回应。贪婪解码是一种选择概率最高的下一个token的解码方法。在每个时间步t,选择具有最高概率token的xt:
xt=argmax(p(xi|P(Tk)))
继续解码直至生成结束标记或达到最大文本长度。最终生成的回应文本为Rk:
Rk=greedydecode(NLP(P(Tk)))
S310、最终生成关于商品质量、虚假评论、好评率和差评率等方面详细描述的回应。
S4、将集成后的模型部署到直播营销网购平台的智能助手中,实现自然语言呈现及与用户的交互功能,帮助用户轻松了解商品质量、各类信息,从而做出更合理的购物决策。
S401、为集成后的模型创建一个API接口。这个API接口的接收输入为(用户查询、商品ID等),并返回模型的输出结果(描述性文本、商品质量评价等)。在服务器上部署这个API,使用RESTful风格的设计,并为不同的请求提供适当的HTTP方法,如GET和POST。
S402、使用Flask框架在服务器上搭建后台服务。设计和实现适当的路由以处理用户请求,在处理用户请求时,后端服务将用户输入和商品ID等信息传递给API接口,并接收返回的模型输出结果。
S403、将后端服务与网购平台集成。在网购平台的前端代码中,实现一个函数来调用后端服务。当用户在智能助手中提出查询时,调用该函数并将用户输入作为参数发送给后端服务。
S404、设计并实现智能助手的用户界面。使用HTML、CSS和JavaScript等前端技术创建交互式界面。界面包括文本输入框用于用户输入查询、聊天窗口用于呈现助手的回应等UI组件。实现用户界面的响应式设计,以适应不同尺寸的屏幕和设备。
S405、在用户向智能助手发送查询时,将输入数据传递给后端服务,然后调用模型API接口。处理模型输出,根据用户需求和之前的对话记录、购物历史等上下文信息,动态选择和填充结构化文本模板处理模型输出,将其转换为易于理解的描述性结构化文本。在JavaScript中编写逻辑处理函数,将输出结果添加到聊天窗口中,并在智能助手界面中呈现给用户。
S406、收集用户反馈和模型输出结果。在直播营销智能助手界面中,设计一个简单的反馈表单,让用户提供关于直播营销智能助手回应的评价和建议。将用户反馈与模型输出结果一起存储,以便进行数据分析和模型优化。定期评估模型性能和用户体验,根据反馈调整模型参数和助手功能,以持续改进模型性能和直播营销智能助手的用户体验。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序商品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
以上所述仅为本发明的最有效实施方案,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明工作原理的前提下,还可以做出适当的改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (3)
1.一种针对直播营销商品质量感知分析的网购助手构建方法,其特征在于所述方法包括:
(1)综合多维度数据(包括商品评论信息、店铺信息和直播间信息),采用BERT模型与图神经网络(GNN)相结合的方式提取关键质量特征,训练一个多任务学习(Multi-taskLearning)模型,以评估商品质量、识别虚假评论等任务。
(2)将训练好的多任务学习模型的输出结果转化为描述性结构化文本,并与现有的自然语言模型进行集成。通过设计贪婪解码方法,基于预训练模型针对特定任务(如商品质量评价、虚假评论识别等)进行任务适应调整,使生成模型能够理解和处理商品、店铺和直播间信息。
(3)将集成后的模型部署到直播营销网购平台上的智能助手中,实现有关商品质量分析结果的自然语言呈现及与用户的交互功能,使用户可以轻松了解商品质量、虚假评论等各类信息,做出更合理的购物决策。
2.根据权力要求1所述的训练多任务学习模型,其特征在于:所述训练多任务学习模型步骤具体包括:
(1)将采集到的商品评论信息、直播间的弹幕信息进行分词处理,把自建的一套完整词典加入到jieba分词库,运用jieba分词系统进行分词。例如:商品质量很好物美价廉可分词成:商品,质量,很,好,物美价廉。
(2)使用停用词表对商品评论信息和直播间的弹幕信息进行停用词去除。停用词有:啊、唉、嗯、的、么、在、于、从等。
(3)将分词和停用词去除后的评论和弹幕信息,添加特殊标记(CLS)并将词汇转化为词汇表中的索引。设输入文本为x,经过处理后得到整数序列x‘。将x‘输入到BERT模型,经过多层Transformer编码器处理,输出最后一层隐藏状态h:
h=BERT(x‘)
(4)对于店铺信息和除弹幕外的直播间信息,根据其结构化特征(如店铺口碑、商品服务分、服务体验分、物流体验分、粉丝数、粉丝团数、直播观看人数、小黄车信息等)构建如图2所示的图结构。节点表示店铺、商品、直播间等实体,边表示实体之间的关系。并将实体的结构化特征作为图节点的初始特征表示。
对于每个节点v,聚合其邻居节点的特征表示。在第t层,使用相邻节点的特征表示计算消息传递。具体的,使用如下求和聚合函数实现:
其中,表示节点v在第t层接收到的聚合消息,/>表示邻居节点u在第t层的特征表示,N(v)表示节点v的邻居节点集合。
(5)将聚合到的邻居信息与节点自身的特征表示相结合,然后通过ReLU非线性激活函数进行节点特征更新。具体公式如下:
其中,表示节点v在第t+1层的特征表示,Wt表示可学习的权重矩阵,ReLU表示非线性激活函数,CONCAT表示连接操作。
(6)多次迭代步骤(4)和步骤(5),图神经网络(GNN)提取到图中的节点特征。迭代T次后,得到所有节点在第T层的特征表示。接下来,使用读出函数将所有节点特征融合为图特征。具体的公式如下:
其中,g表示图特征,V表示图中所有节点的集合,READOUT表示读出函数。
(7)将BERT模型提取的文本特征hBERT与图神经网络(GNN)提取的图特征hGNN进行融合,形成一个综合特征表示f:
f=CONCAT(hBERT,hGNN)
其中,CONCAT表示连接操作。
(8)基于融合后的特征表示f,构建一个多任务学习模型。设有m个任务,分别为任务1,任务2,...,任务m。针对每个任务k,设计一个任务相关的输出层,使用如下公式计算任务k的输出:
输出k=softmax(Wk*f+bk)
其中,Wk和bk分别表示任务k的权重矩阵和偏置向量。
(9)在训练过程中,使用多任务损失函数来优化模型参数。对于每个任务k,计算其损失函数其中/>表示任务k的真实标签,/>表示任务k的预测输出,最后计算加权总损失:
其中,L表示总损失,λk表示任务k的权重,用于平衡各任务之间的重要性。
(10)在验证集上评估多任务学习模型性能,包括准确率、召回率、F1值等。如果模型性能不佳,手动设置学习率、批次大小、优化器类型、权重衰减系数,提升模型的训练速度和收敛能力,使模型在验证集上达到满意的性能。
3.根据权力要求1所述的集成多任务学习模型和自然语言模型,其特征在于:所述集成多任务学习模型和自然语言模型步骤具体包括:
(1)根据多任务学习模型的输出结果生成结构化文本。设有m个任务的输出结果分别为{y1,y2,...,ym},针对任务k的输出结果yk,使用模板将其转换为描述性文本Tk。例如,将商品质量评分和虚假识别等数值和类别结果转换为类似于“商品质量评分为8.5分,30%的评论可能是虚假的,近三天内好评20条,差评5条,退货概率为10%等”这样的文本。转换公式如下:
Tk=template(yk)
(2)构建结构化文本模板库:基于上述(1)构建多个结构化文本模板,用于将多任务学习模型的输出结果转换为描述性结构化文本。每个模板都针对某种特定的用户需求,包含相关的变量占位符。
(3)通过对用户输入的问题或需求进行自然语言处理,提取关键信息和意图,以便了解用户希望了解的商品质量方面的具体内容。例如,用户可能关心商品的质量评分、好评率或退货概率等。
(4)分析用户之前的对话记录、购物历史等上下文信息,以提供更加准确和个性化的回应。
(5)根据用户需求,从结构化文本模板库中动态选择一个或多个最相关的模板。例如,如果用户关心商品的质量评分和退货概率,可以选择一个包含这两个信息的模板。
(6)根据用户需求,仅填充模板中与用户关心的信息相关的变量占位符。例如,如果用户只关心质量评分和退货概率,可以只填充{quality_score}和{return_rate}变量占位符。
(7)使用填充后的结构化文本,添加解释性描述和用户特定问题的回答,最终生成个性化的描述性结构化文本。
(8)选择一个已有训练好的自然语言模型作为基础,用于处理描述性结构化文本。将描述性结构化文本Tk输入自然语言模型,对文本进行如上述权力要求2的步骤(1)处理。例如,假设描述性结构化文本为Tk,处理后的形式为P(Tk)。
P(Tk)=preprocess(Tk)
自然语言模型根据概率分布预测下一个token,输入自然语言模型的描述性结构化文本P(Tk),输出概率分布为p(xi|P(Tk)),其中xi表示第i个token。
p(xi|P(Tk))=NLP(P(Tk))
(9)自然语言模型根据输入的描述性结构化文本使用贪婪解码方法生成相应的文本回应。贪婪解码是一种选择概率最高的下一个token的解码方法。在每个时间步t,选择具有最高概率token的xt:
xt=argmax(p(xi|P(Tk)))
继续解码直至生成结束标记或达到最大文本长度。最终生成的回应文本为Rk:
Rk=greedydecode(NLP(P(Tk)))
最终生成关于商品质量、虚假评论、好评率和差评率等方面详细描述的回应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310638956.3A CN116703509A (zh) | 2023-05-31 | 2023-05-31 | 一种针对直播营销商品质量感知分析的网购助手构建方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310638956.3A CN116703509A (zh) | 2023-05-31 | 2023-05-31 | 一种针对直播营销商品质量感知分析的网购助手构建方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116703509A true CN116703509A (zh) | 2023-09-05 |
Family
ID=87838591
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310638956.3A Pending CN116703509A (zh) | 2023-05-31 | 2023-05-31 | 一种针对直播营销商品质量感知分析的网购助手构建方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116703509A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473284A (zh) * | 2023-11-20 | 2024-01-30 | 灏冉舟网络有限公司 | 一种基于人工智能的三方交易平台及其方法 |
-
2023
- 2023-05-31 CN CN202310638956.3A patent/CN116703509A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473284A (zh) * | 2023-11-20 | 2024-01-30 | 灏冉舟网络有限公司 | 一种基于人工智能的三方交易平台及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN105095444A (zh) | 信息获取方法和装置 | |
CN111625632A (zh) | 一种问答对推荐方法、装置、设备及存储介质 | |
US20230121711A1 (en) | Content augmentation with machine generated content to meet content gaps during interaction with target entities | |
CN111639247B (zh) | 用于评估评论的质量的方法、装置、设备以及计算机可读存储介质 | |
US20220138770A1 (en) | Method and apparatus for analyzing sales conversation based on voice recognition | |
CN115952291B (zh) | 基于多头自注意力及lstm的金融舆情分类方法及系统 | |
CN108845986A (zh) | 一种情感分析方法、设备及系统、计算机可读存储介质 | |
CN109903099B (zh) | 用于评分预测的模型构建方法和系统 | |
CN110827115B (zh) | 基于注意力机制的产品推荐方法和系统 | |
CN112925911B (zh) | 基于多模态数据的投诉分类方法及其相关设备 | |
CN112307168A (zh) | 基于人工智能的问诊会话处理方法、装置和计算机设备 | |
JP2020135135A (ja) | 対話コンテンツ作成支援方法およびシステム | |
CN116703509A (zh) | 一种针对直播营销商品质量感知分析的网购助手构建方法 | |
JP2013033376A (ja) | 情報処理装置、情報処理方法、および、プログラム | |
CN113821588A (zh) | 文本处理方法、装置、电子设备及存储介质 | |
CN116501840B (zh) | 一种用于获客营销的nlp智能分析方法 | |
CN112182126A (zh) | 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质 | |
KR20210009266A (ko) | 음성 인식 기반의 세일즈 대화 분석 방법 및 장치 | |
CN112800230B (zh) | 文本处理方法、装置、计算机可读存储介质及电子设备 | |
CN116010696A (zh) | 融合知识图谱和用户长短期兴趣的新闻推荐方法、系统及介质 | |
CN115186179A (zh) | 保险产品推送方法和装置 | |
CN116150470A (zh) | 内容推荐方法、装置、设备、存储介质及程序产品 | |
CN113254788A (zh) | 一种基于大数据的推荐方法、系统及可读存储介质 | |
CN112559905A (zh) | 一种基于双模式注意力机制和社交相似度的会话推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |