CN111310971B - 一种o2o商业模式的前景分析方法、装置及设备 - Google Patents
一种o2o商业模式的前景分析方法、装置及设备 Download PDFInfo
- Publication number
- CN111310971B CN111310971B CN202010047164.5A CN202010047164A CN111310971B CN 111310971 B CN111310971 B CN 111310971B CN 202010047164 A CN202010047164 A CN 202010047164A CN 111310971 B CN111310971 B CN 111310971B
- Authority
- CN
- China
- Prior art keywords
- target
- comment data
- analysis
- result
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 103
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000000034 method Methods 0.000 claims abstract description 19
- 239000013598 vector Substances 0.000 claims description 111
- 230000006870 function Effects 0.000 claims description 75
- 239000011159 matrix material Substances 0.000 claims description 33
- 230000015654 memory Effects 0.000 claims description 20
- 238000011176 pooling Methods 0.000 claims description 11
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 238000011156 evaluation Methods 0.000 claims description 5
- 230000002776 aggregation Effects 0.000 claims description 4
- 238000004220 aggregation Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 6
- 238000004364 calculation method Methods 0.000 description 10
- 238000011161 development Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000012552 review Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- JEIPFZHSYJVQDO-UHFFFAOYSA-N iron(III) oxide Inorganic materials O=[Fe]O[Fe]=O JEIPFZHSYJVQDO-UHFFFAOYSA-N 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Entrepreneurship & Innovation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Data Mining & Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种O2O商业模式的前景分析方法、装置及设备,其中,该方法包括:获取目标商业对象的目标评论数据;将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,第二预测结果表征所述目标商业对象的前景差;当预测结果为第二预测结果时,获取预测结果对应的第一损失函数;将第一损失函数输入到前景分析模型,得到分析结果。通过实施本发明,克服了可使用的金融数据集难以获取的缺陷,进而提高了O2O商业模式前景分析的准确性和有效性。
Description
技术领域
本发明涉及信息处理技术领域,具体涉及一种O2O商业模式的前景分析方法、装置及设备。
背景技术
随着互联网技术的发展,O2O商业模式随之发展起来,O2O商业模式的前景发展如何则是商户最为关心的事情。然而,现有技术中,对O2O商业模式的前景分析通常是基于流动的金融数据进行分析的,获取金融数据对O2O商业的偿付能力和可盈利性等金融因素进行分析,然而获取金融数据是一项很困难的任务,通常获取的可使用的数据集很小,严重限制了O2O商业模式前景分析的准确性和有效性。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中的数据集获取困难而导致O2O商业模式前景分析的准确性和有效性受限的缺陷,从而提供一种O2O商业模式的前景分析方法、装置和设备。
根据第一方面,本发明实施例提供了一种O2O商业模式的前景分析方法,包括:获取目标商业对象的目标评论数据;将所述目标评论数据输入至预测模型进行处理,得到预测结果,所述预测模型的预测结果包括第一预测结果和第二预测结果,所述第二预测结果表征所述目标商业对象的前景差;当所述预测结果为第二预测结果时,获取所述预测结果对应的第一损失函数;将所述第一损失函数输入到前景分析模型,得到分析结果。
结合第一方面,在第一方面的第一实施方式中,所述获取目标商业对象的目标评论数据,包括:获取评论数据;提取所述评论数据中多个关键词;根据每一个关键词的词频大小,得到目标关键词;根据所述评论数据和所述目标关键词,得到所述目标评论数据。
结合第一方面,在第一方面的第二实施方式中,所述将所述第一损失函数输入到前景分析模型,得到分析结果,包括:根据目标算法,对所述第二预测结果进行处理,得到第二损失函数;将所述第一损失函数和所述第二损失函数输入到所述前景分析模型,得到所述分析结果。
结合第一方面的第一实施方式,在第一方面的第三实施方式中,所述根据所述评论数据和所述目标关键词,得到所述目标评论数据,包括:对所述评论数据和所述目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量;根据所述嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵;对所述评论数据权重矩阵和所述目标关键词权重矩阵进行池化处理,得到池化处理数据;根据所述池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量;在所述更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量;将所述更新后的评论数据嵌入向量和目标关键词嵌入向量以及所述噪声向量进行聚合,得到目标评论数据。
根据第二方面,本发明实施例提供了一种O2O商业模式的前景分析装置,包括:第一获取模块,用于获取目标商业对象的目标评论数据;预测模块,用于将所述目标评论数据输入至预测模型进行处理,得到预测结果,所述预测模型的预测结果包括第一预测结果和第二预测结果,所述第二预测结果表征所述目标商业对象的前景差;第二获取模块,用于当所述预测结果为第二预测结果时,获取所述预测结果对应的第一损失函数;分析模块,用于将所述第一损失函数输入到前景分析模型,得到分析结果。
结合第二方面,在第二方面的第一实施方式中,所述获取模块,包括:数据获取子模块,用于获取评论数据;提取子模块,用于提取所述评论数据中多个关键词;第一确定子模块,用于根据每一个关键词的词频大小,得到目标关键词;第二确定子模块,用于根据所述评论数据和所述目标关键词,得到所述目标评论数据。
结合第二方面,在第二方面的第二实施方式中,所述分析模块,包括:处理子模块,用于根据目标算法,对所述第二预测结果进行处理,得到第二损失函数;分析子模块,用于将所述第一损失函数和所述第二损失函数输入到所述前景分析模型,得到所述分析结果。
结合第二方面的第一实施方式,在第二方面的第三实施方式中,所述第二确定子模块,包括:向量处理子模块,用于对所述评论数据和所述目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量;第一计算子模块,用于根据所述嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵;池化处理子模块,用于对所述评论数据权重矩阵和所述目标关键词权重矩阵进行池化处理,得到池化处理数据;第二计算子模块,用于根据所述池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量;添加子模块,用于在所述更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量;聚合子模块,用于将所述更新后的评论数据嵌入向量和目标关键词嵌入向量以及所述噪声向量进行聚合,得到目标评论数据。
根据第三方面,本发明实施例提供了一种计算机设备,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行第一方面或第一方面任一实施方式所述的O2O商业模式的前景分析方法。
根基第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行第一方面或第一方面任一实施方式所述的O2O商业模式的前景分析方法。
本发明的技术方案,具有如下优点:
1.本发明提供的O2O商业模式的前景分析方法、装置及设备,通过获取目标商业对象的目标评论数据;将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,且第二预测结果表征目标商业对象的前景差,当预测结果为第二预测结果时,获取该预测结果对应的第一损失函数,将第一损失函数输入到前景分析模型,得到分析结果。该技术方案克服了可使用的金融数据集难以获取的缺陷,对获取的目标商业对象的目标评论数据进行处理分析,得到分析结果,提高了O2O商业模式前景分析的准确性和有效性。
2.本发明提供的O2O商业模式的前景分析方法、装置及设备,通过根据目标算法,对第二预测结果进行处理,得到第二损失函数,将第一损失函数和第二损失函数输入到前景分析模型,得到分析结果。将第一损失函数和第二损失函数进行结合,提高了预测O2O商业模式前景的准确性和解释性。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中O2O商业模式的前景分析方法的流程图;
图2为本发明实施例中O2O商业模式的前景分析装置的原理框图;
图3为本发明实施例中计算机设备的结构示意图。
具体实施方式
下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,还可以是两个元件内部的连通,可以是无线连接,也可以是有线连接。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
本实施例提供一种O2O商业模式的前景分析方法,可用于对O2O商业模式前景的准确分析,本实施例以具有O2O商业模式的餐厅为例,预测餐厅在未来发展中倒闭或存活,并对倒闭的原因给出解释,预测模型的输入包括用户集U、餐厅集V、输出包括餐厅v的前景预测。该方法包括:
S11,获取目标商业对象的目标评论数据。
示例性地,目标评论数据可以分为用户目标评论数据和餐厅收到的目标评论数据。如果用户集U中的用户u对餐厅集V中的餐厅v进行评论,则两者之间的评论结果eu,v∈E,给定餐厅v,对于所有用户ui∈U,所有用户发出的所有评论构成餐厅v对应的用户评论,将该用户评论表示为:(Ru,1,……,Ru,lr),其中,lr表示最大的评论数目。餐厅v收到的评论表示为:(Rv,1,……,Rv,lr),分别对用户评论数据和餐厅收到的评论数据进行分割,得到评论文本中的关键词,将其作为目标评论数据,用户u的目标评论数据可以表示为:(Cu,1,……,Cu,lr),餐厅v的目标评论数据可以表示为:(Cv,1,……,Cv,lr)。
评论数据可以通过餐厅的评论平台进行获取,也可以通过互联网平台将该餐厅的名称作为关键词进行搜索,获取与该餐厅对应的评论数据,再对评论数据进行处理得到目标评论数据。本申请对评论数据的获取方式不作限定,本领域技术人员可以根据实际需要进行确定。
S12,将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,第二预测结果表征目标商业对象的前景差。
示例性地,该预测模型可以为二分类模型,分类结果对应第一预测结果和第二预测结果。以餐厅为例,第一预测结果可以为餐厅存活,第二预测结果可以为餐厅倒闭,将餐厅倒闭作为,即对餐厅前景发展的第二预测结果比第一预测结果差。预测模型可以预先根据输入的评论数据以及输出的预测结果进行训练得到,将目标评论数据输入到训练好的预测模型,得到与该目标评论数据对应的预测结果。
S13,当预测结果为第二预测结果时,获取预测结果对应的第一损失函数。
示例性地,预测模型可以使用FM模型得到预测结果,如下式所示:
其中,是x=[xu,xv]的第i项;xu,xv为根据评论集(Ru,1,……,Ru,lr)和(Rv,1,……,Rv,lr)得到的协同注意力嵌入向量;<,>是向量的点乘;/>是偏差值;/>是通过学习得到的权值参数,/>是通过学习得到的隐向量表示参数,pi=[pi,1,pi,2,...,pi,f]是xi的隐向量表示,pj=[pj,1,pj,2,...,pj,f]是xj的隐向量表示。对wi、pi和pj分别赋予初始值,得到对应的初始预测值/>将预测值/>与真实值y进行比较,若预测值/>与真实值y之间差值为0,则为最优的预测结果。预测值/>与真实值y之间的比较关系可以使用梯度进行计算,根据预测值/>与真实值y之间的梯度关系,更新参数wi、pi和pj。利用梯度下降法,通过求损失函数对特征(输入项)的导数计算出梯度,从而更新权重。模型各个参数的梯度如下:
其中,pi,f是xi的第f个元素,pj,f是xj的第f个元素。
比如,将wi的初始值设置为0,将pi和pj的初始值设置为1,将其代入公式得到预测值/>将预测值/>与真实值y进行比较,得到对应的梯度表示,根据计算得到的梯度,调整参数值wi、pi和pj以使预测值/>与真实值y之间最接近。
餐厅第二预测结果为倒闭,可以使用sigmod交叉熵损失函数得到,计算公式如下:
其中,Ly表示第一损失函数,y表示预先设定的餐厅倒闭标签,比如(0,1),Ω表示训练集。
S14,将第一损失函数输入到前景分析模型,得到分析结果。
示例性地,前景分析模型可以预先根据输入的损失函数以及对应输出的分析结果多次训练得到。将第一损失函数输入至该训练好的前景分析模型,可以得到对应第一损失函数的分析结果。该分析结果可以包含餐厅倒闭原因分析。
本实施例提供的O2O商业模式的前景分析方法,通过获取目标商业对象的目标评论数据,将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,且第二预测结果表征目标商业对象的前景差,当预测结果为第二预测结果时,获取该预测结果对应的第一损失函数,将第一损失函数输入到前景分析模型,得到分析结果。通过使用评论数据代替金融数据预测商业的发展前景,对获取的目标商业对象的目标评论数据进行处理分析,得到分析结果,克服了可使用的金融数据集难以获取的缺陷,进而提高了O2O商业模式前景分析的准确性和有效性。
作为本申请一个可选的实施方式,步骤S11,包括:
首先,获取评论数据。
示例性地,以餐厅为例,评论数据为用户对餐厅的评价,评论数据可以包括用户评论数据和餐厅接收到的评论数据两部分。对评论数据获取方式的具体说明参见上述实施方式相关部分的描述,此处不再赘述。
其次,提取评论数据中多个关键词。
示例性地,评论数据是由多个词构成的评论文本,对评论数据进行分割,可以得到一组词,并对得到的词作词性标注,可以选取其中的名词和形容词作为关键词,比如“餐厅”、“餐馆”等名词,“环境好”、“菜品口味好”等形容词。本申请对词性的选择不作限定,本领域技术人员可以根据实际需要确定。
再次,根据每一个关键词的词频大小,得到目标关键词。
示例性地,词频为关键词出现的目标次数,以选取名词和形容词为例,将评论数据进行分割得到一组关键词之后,将所述关键词按照词频降序排列,并过滤掉与评论数据的数据集依赖关系太大的词,比如在餐厅的评论数据集中的“餐厅”、“餐馆”等这些词。排序和过滤完成后,可以选择排名前k个位置的关键词,将前k个排名位置的关键词作为目标关键词。本申请对k不作限定,本领域技术人员可以根据数据集的大小决定。
再次,根据评论数据和目标关键词,得到目标评论数据。
示例性地,对目标评论数据的具体说明参见上述实施方式对应部分的相关描述。根据获得的评论数据以及目标关键词,可以分别得到对用户和餐厅都很重要的评论数据和目标关键词,进而得到用户目标评论数据和餐厅目标评论数据。
作为本申请一个可选的实施方式,步骤S14,包括:
首先,根据目标算法,对第二预测结果进行处理,得到第二损失函数。
示例性地,目标算法可以为长短期记忆网络(Long Short-Term Memory,LSTM)算法,也可以为门循环单元(gated recurrent unit,GRU)神经网络算法,本申请对目标算法不作限定,本领域技术人员可以根据实际需要确定。以GRU算法为例,使用GRU算法得到第二损失函数的步骤如下:
其中,lt是t时刻生成的关键词;是为预测模型的预测结果;ht是t时刻的隐藏状态,依赖于t-1时刻的状态,计算如下:
ht=GRU(ht-1,lt)
初始值h0的隐藏状态可以表示为:
其中,是预测结果/>的向量表示,它是由预测结果先整数化,再向量化得到的,例如,/>将/>整数化为1,然后转化为向量的形式/>
ξ()是softmax损失函数,计算如下:
得到所有的隐藏状态后,将所有的隐藏状态输入至预测模型,以生成单词的概率分布,表示如下:
其中,()是softmax损失函数;/>|V|是单词总数量。
接下来,使用beam search通过最大对数似然估值法从所得到的dt中选择出第二预测结果对应的最优的分析结果L=(l1,l2,……,lt)。分析结果可以由第二损失函数构成,第二损失函数由评论数据相似性损失和关键词相关损失组成。评论数据相似性损失可以采用负对数似然估值来评估,具体计算方式如下:
其中,是t时刻的实际关键词。
关键词相关损失的计算方式如下:
其中,δi为0或1。当评论文本中包含的第i个词至少被一个指针选择为关键词时,δi=1,否则为0。
其次,将第一损失函数和第二损失函数输入到前景分析模型,得到分析结果。
示例性地,对前景分析模型的具体说明参见上述实施方式的具体说明,此处不再赘述。将第一损失函数和第二损失函数输入至前景分析模型,得到最终目标函数,表示如下:
其中,Ly是第一损失函数的损失值,L0和Lc分别是评论数据相似性损失和关键词相关损失。λl、λc和λ0是平衡不同损失重要性的权重。Θ包含所有模型的参数。通过多次实验,确定具有最优性能的模型的各个参数。λl=10-8,λ0=1.0,λc需要根据不同数据集确定。使用上海、北京和广州的大众点评的数据进行实验,得到具有最优性能的模型的各参数为:上海,λc=0.008;北京,λc=0.01;广州,λc=0.02。另外,将模型的学习率设置为10-8,训练的轮数是50,生成的分析结果的最大长度为40,嵌入向量的维度为30;数据集的训练集、测试集和验证集的比例为7:1.5:1.5。
第一损失函数对应预测结果,第二损失函数对应预测的处理结果,将第一损失函数和第二损失函数聚合起来输入至前景分析模型,得到最终目标函数,进而得到分析结果。通过将第一损失函数和第二损失函数进行结合,即将预测结果和对应预测结果的分析结果进行结合,提高了预测O2O商业模式发展前景的准确性。
作为本申请一个可选的实施方式,根据评论数据和目标关键词,得到目标评论数据,包括:
首先,对评论数据和目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量。
示例性地,对评论数据和目标关键词进行向量化处理的方式可以是利用预先建立的用于评论数据向量化处理的单词编码器和评论编码器进行向量化处理。以评论数据为(R1,......,Rx),可以通过单词编码器将评论数据(R1,......,Rx)中包含的单词Ri转化为lq维的嵌入向量r,此处x是每条评论数据中包含单词的最大数目。对于给定评论Ru,i,可以通过评论编码器将评论数据里面的相关单词进行嵌入求和,计算公式可以表达为:根据词频可以在评论数据中选择出目标关键词,关键词向量化的处理方式与评论数据向量化处理方式一致,此处不再赘述。
其次,根据嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵。
示例性地,根据得到的嵌入向量,可以利用协同注意力机制,计算评论数据权重矩阵。比如,给定一组用户评论嵌入向量ru.i 和一组餐厅收到的评论嵌入向量rv.i 则用户和餐厅之间的评论数据权重矩阵计算如下:
ARi,j=F(ru,i)TMrF(rv,j)
其中,F()是具有目标层数的前馈神经网络,本申请实施例中目标层数为1层。
根据词频从用户评论数据和餐厅收到的评论数据中选择出目标关键词,将选出来的目标关键词进行单词级别的建模。比如用cu.i 表示用户评论数据中的第i个概念,用cv.j/>表示餐厅收到的评论数据中的第j个关键词,lc表示每条评论数据中最多的关键词的数目,目标关键词权重矩阵计算方法与评论数据权重矩阵相似,计算表达式如下:
ACi,j=F(cu,i)TMcF(cv,j)
其中,F()是具有1层的前馈神经网络。
再次,对评论数据权重矩阵和目标关键词权重矩阵进行池化处理,得到池化处理数据。
示例性地,获取评论数据权重矩阵的行最大值和列最大值,并使用行最大值和列最大值分别加权评论数据ru.i和rv.i。为获取评论数据权重矩阵的行最大值和列最大值,可以使用最大池化方式对评论数据权重矩阵进行处理,得到最大池化数据,计算公式如下:
ui=(G(maxcol(AR)))Tru,i
vj=(G(maxrow(AR)))Tru,i
其中,G()是将输入用户评论数据向量和餐厅收到的评论数据向量转换为概率分布的函数。
为获取目标关键词权重矩阵的行平均值和列平均值,可以使用平均池化方式对目标关键词权重矩阵进行处理,得到平均池化数据,计算公式如下:
其中,G()是将输入用户目标关键词向量和餐厅收到的目标关键词向量/>转换为概率分布的函数。
再次,根据池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量。
示例性地,将得到的池化处理数据通过Straight-Through Gumbel-Softmax函数来计算概率分布,计算公式如下:
其中,bi是ui经过Straight-Through Gumbel-Softmax函数得到的概率分布,τ是一个用于控制输出向量与独热向量接近程度的参数,τ越接近0,bi越接近独热向量,gi是Gumbel噪声,在前馈传递过程中,通过arg max来将bi转化为一个独热向量xi,计算如下:
在反向传播时,Straight-Through Gumbel-Softmax函数的梯度是连续的,从而进行端到端的模型训练,使用Straight-Through Gumbel-Softmax函数计算更新后的评论数据嵌入向量,计算方式如下:
ru'=(Gumbel(u))TRu
rv'=(Gumbel(v))TRv
其中,ru'和rv'分别为更新后的用户评论嵌入向量和餐厅收到的评论嵌入向量。
使用Straight-Through Gumbel-Softmax函数计算更新后的目标关键词嵌入向量,计算方式如下:
c'u=Gumbel(avgcol(AC))Tu
c'v=Gumbel(avgrow(AC))Tv
其中,c'u和c'v分别为更新后的用户目标关键词嵌入向量和餐厅目标关键词嵌入向量。
再次,在更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量。
示例性地,在更新后的评论数据嵌入向量和目标关键词嵌入向量中添加Gumbel噪声向量,多次改变Gumbel噪声向量,分别得到一组用户嵌入向量表示和餐厅嵌入向量表示。以用户u为例,多指针协同注意力的用户嵌入向量可以表示为:多次改变Gumbel噪声向量,得到一组用户嵌入向量可以表示为:/>类似的,一组餐厅嵌入向量可以表示为:/>
再次,将更新后的评论数据嵌入向量和目标关键词嵌入向量以及噪声向量进行聚合,得到目标评论数据。
示例性地,将添加了Gumbel噪声向量的用户嵌入向量表示和餐厅嵌入向量表示进行聚合,即可得到目标评论数据。将用户嵌入向量和餐厅嵌入向量/>进行非线性层聚合,得到一组聚合向量,则用户和餐厅最终的协同注意力嵌入向量可以表示为:
其中,将用户和餐厅最终的协同注意力嵌入向量表示用以评估预测结果以及对应预测结果的解释性。
对上述O2O商业模式的前景分析方法用于点评O2O商业模式。使用大众点评数据集中上海、北京和广州三座城市的数据进行实验分析,并和几种先进的算法进行比较,使用AUC指标评估算法的准确性,使用BLEU和ROUGE指标评估解释性,这三种指标均是分值越高,表明效果越好。表1是准确性的比较结果,表2A、表2B和表2C分别是上海、北京和广州三座城市的解释性比较结果,其中Our-C方法表示将本模型中的概念模块移除。从表中可以看出,本技术方案在准确性和解释性上较对比算法表现更好,证明了本技术方案算法的有效性。
表1餐厅预测结果的准确性(AUC)
算法 | 上海 | 北京 | 广州 |
NRT | 0.5689±0.001 | 0.5539±0.002 | 0.5705±0.003 |
XGBoost | 0.6402±0.001 | 0.5549±0.001 | 0.5486±0.001 |
GBDT | 0.5734±0.001 | 0.6003±0.001 | 0.5869±0.004 |
SVM | 0.7081±0.001 | 0.7049±0.001 | 0.6583±0.006 |
LR | 0.8203±0.001 | 0.7592±0.001 | 0.7129±0.003 |
Our-C | 0.8125±0.005 | 0.8573±0.006 | 0.8313±0.004 |
Our | 0.8508±0.008 | 0.8827±0.004 | 0.8379±0.007 |
表2A广州餐厅在不同方法下的解释性
表2B北京餐厅在不同方法下的解释性
表2C上海餐厅在不同方法下的解释性
本发明实施例提供一种O2O商业模式的前景分析装置,可用于O2O商业模式的前景分析,包括:
第一获取模块21,用于获取目标商业对象的目标评论数据。
预测模块22,用于将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,第二预测结果表征目标商业对象的前景差。
第二获取模块23,用于当预测结果为第二预测结果时,获取预测结果对应的第一损失函数。
分析模块24,用于将第一损失函数输入到前景分析模型,得到分析结果。
本实施例提供的O2O商业模式的前景分析装置,通过第一获取模块获取目标商业对象的目标评论数据,由预测模块将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,且第二预测结果表征目标商业对象的前景差,当预测结果为第二预测结果时,通过第二获取模块获取该预测结果对应的第一损失函数,再由分析模块将第一损失函数输入到前景分析模型,得到分析结果。通过使用评论数据代替金融数据预测商业的发展前景,对获取的目标商业对象的目标评论数据进行处理分析,得到分析结果,克服了可使用的金融数据集难以获取的缺陷,进而提高了O2O商业模式前景分析的准确性和有效性。
作为本申请一个可选的实施方式,获取模块21,包括:
数据获取子模块,用于获取评论数据。
提取子模块,用于提取评论数据中多个关键词。
第一确定子模块,用于根据每一个关键词的词频大小,得到目标关键词。
第二确定子模块,用于根据评论数据和目标关键词,得到目标评论数据。
作为本申请一个可选的实施方式,分析模块24,包括:
处理子模块,用于根据目标算法,对第二预测结果进行处理,得到第二损失函数。
分析子模块,用于将第一损失函数和第二损失函数输入到前景分析模型,得到分析结果。
作为本申请一个可选的实施方式,第二确定子模块,包括:
向量处理子模块,用于对评论数据和目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量。
第一计算子模块,用于根据嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵。
池化处理子模块,用于对评论数据权重矩阵和目标关键词权重矩阵进行池化处理,得到池化处理数据。
第二计算子模块,用于根据池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量。
添加子模块,用于在更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量。
聚合子模块,用于将更新后的评论数据嵌入向量和目标关键词嵌入向量以及噪声向量进行聚合,得到目标评论数据。
本发明实施例还提供了一种计算机设备,如图3所示,该设备包括处理器31和存储器32,其中处理器31和存储器32可以通过总线或者其他方式连接,图3中以通过总线30连接为例。
处理器31可以为中央处理器(Central Processing Unit,CPU)。处理器31还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、图形处理器(Graphics Processing Unit,GPU)、嵌入式神经网络处理器(Neural-network ProcessingUnit,NPU)或者其他专用的深度学习协处理器、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器32作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施例中的O2O商业模式的前景分析方法对应的程序指令/模块(例如,图2所示的第一获取模块21、预测模块22、第二获取模块23和分析模块24)。处理器31通过运行存储在存储器32中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施例中的O2O商业模式的前景分析方法。
存储器32可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器31所创建的数据等。此外,存储器32可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器32可选包括相对于处理器31远程设置的存储器,这些远程存储器可以通过网络连接至处理器31。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个模块存储在所述存储器32中,当被所述处理器31执行时,执行如图1所示实施例中的O2O商业模式的前景分析方法。
通过获取目标商业对象的目标评论数据,将目标评论数据输入至预测模型进行处理,得到预测结果,预测模型的预测结果包括第一预测结果和第二预测结果,且第二预测结果表征目标商业对象的前景差,当预测结果为第二预测结果时,获取该预测结果对应的第一损失函数,将第一损失函数输入到前景分析模型,得到分析结果。通过使用评论数据代替金融数据预测商业的发展前景,对获取的目标商业对象的目标评论数据进行处理分析,得到分析结果,克服了可使用的金融数据集难以获取的缺陷,进而提高了O2O商业模式前景分析的准确性和有效性。
上述计算机设备具体细节可以对应参阅图1至图2所示的实施例中对应的相关描述和效果进行理解,此处不再赘述。
本发明实施例还提供一种非暂态计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意方法实施例中的O2O商业模式的前景分析方法。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random Access Memory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
Claims (4)
1.一种O2O商业模式的前景分析方法,其特征在于,包括:
获取目标商业对象的目标评论数据;
将所述目标评论数据输入至预测模型进行处理,得到预测结果,所述预测模型的预测结果包括第一预测结果和第二预测结果,所述第二预测结果表征所述目标商业对象的前景差;
当所述预测结果为第二预测结果时,获取所述预测结果对应的第一损失函数;
将所述第一损失函数输入到前景分析模型,得到分析结果;
其中,所述获取目标商业对象的目标评论数据,包括:获取评论数据;提取所述评论数据中多个关键词;根据每一个关键词的词频大小,得到目标关键词;根据所述评论数据和所述目标关键词,得到所述目标评论数据;
所述根据所述评论数据和所述目标关键词,得到所述目标评论数据,包括:对所述评论数据和所述目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量;根据所述嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵;对所述评论数据权重矩阵和所述目标关键词权重矩阵进行池化处理,得到池化处理数据;根据所述池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量;在所述更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量;将所述更新后的评论数据嵌入向量和目标关键词嵌入向量以及所述噪声向量进行聚合,得到目标评论数据;
其中,所述将所述第一损失函数输入到前景分析模型,得到分析结果,包括:根据目标算法,对所述第二预测结果进行处理,得到第二损失函数;将所述第一损失函数和所述第二损失函数输入到所述前景分析模型,得到所述分析结果。
2.一种O2O商业模式的前景分析装置,其特征在于,包括:
第一获取模块,用于获取目标商业对象的目标评论数据;
预测模块,用于将所述目标评论数据输入至预测模型进行处理,得到预测结果,所述预测模型的预测结果包括第一预测结果和第二预测结果,所述第二预测结果表征所述目标商业对象的前景差;
第二获取模块,用于当所述预测结果为第二预测结果时,获取所述预测结果对应的第一损失函数;
分析模块,用于将所述第一损失函数输入到前景分析模型,得到分析结果;
其中,所述第一获取模块,包括:数据获取子模块,用于获取评论数据;提取子模块,用于提取所述评论数据中多个关键词;第一确定子模块,用于根据每一个关键词的词频大小,得到目标关键词;第二确定子模块,用于根据所述评论数据和所述目标关键词,得到所述目标评论数据;
所述第二确定子模块,包括:向量处理子模块,用于对所述评论数据和所述目标关键词进行向量化处理,得到评论数据嵌入向量和目标关键词嵌入向量;第一计算子模块,用于根据所述嵌入向量,计算评论数据权重矩阵和目标关键词权重矩阵;池化处理子模块,用于对所述评论数据权重矩阵和所述目标关键词权重矩阵进行池化处理,得到池化处理数据;第二计算子模块,用于根据所述池化处理数据,计算更新后的评论数据嵌入向量和目标关键词嵌入向量;添加子模块,用于在所述更新后的评论数据嵌入向量和目标关键词嵌入向量中添加噪声向量;聚合子模块,用于将所述更新后的评论数据嵌入向量和目标关键词嵌入向量以及所述噪声向量进行聚合,得到目标评论数据;
其中,所述分析模块,包括:处理子模块,用于根据目标算法,对所述第二预测结果进行处理,得到第二损失函数;分析子模块,用于将所述第一损失函数和所述第二损失函数输入到所述前景分析模型,得到所述分析结果。
3.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1所述的O2O商业模式的前景分析方法。
4.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1所述的O2O商业模式的前景分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010047164.5A CN111310971B (zh) | 2020-01-16 | 2020-01-16 | 一种o2o商业模式的前景分析方法、装置及设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010047164.5A CN111310971B (zh) | 2020-01-16 | 2020-01-16 | 一种o2o商业模式的前景分析方法、装置及设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111310971A CN111310971A (zh) | 2020-06-19 |
CN111310971B true CN111310971B (zh) | 2023-11-21 |
Family
ID=71160362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010047164.5A Active CN111310971B (zh) | 2020-01-16 | 2020-01-16 | 一种o2o商业模式的前景分析方法、装置及设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111310971B (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944674A (zh) * | 2017-11-10 | 2018-04-20 | 华中科技大学 | 一种利用线上线下数据评估商业规划的方法 |
WO2019059717A1 (ko) * | 2017-09-22 | 2019-03-28 | 김민준 | 기업 분석 기반 연계 서비스 매칭 플랫폼 제공 시스템 |
CN109801094A (zh) * | 2018-12-07 | 2019-05-24 | 珠海中科先进技术研究院有限公司 | 一种商业分析管理推荐预测模型的方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120259676A1 (en) * | 2011-04-07 | 2012-10-11 | Wagner John G | Methods and apparatus to model consumer choice sourcing |
-
2020
- 2020-01-16 CN CN202010047164.5A patent/CN111310971B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019059717A1 (ko) * | 2017-09-22 | 2019-03-28 | 김민준 | 기업 분석 기반 연계 서비스 매칭 플랫폼 제공 시스템 |
CN107944674A (zh) * | 2017-11-10 | 2018-04-20 | 华中科技大学 | 一种利用线上线下数据评估商业规划的方法 |
CN109801094A (zh) * | 2018-12-07 | 2019-05-24 | 珠海中科先进技术研究院有限公司 | 一种商业分析管理推荐预测模型的方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN111310971A (zh) | 2020-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11693388B2 (en) | Methods and apparatus for machine learning predictions of manufacturing processes | |
US20230350380A1 (en) | Methods and apparatus for machine learning predictions of manufacture processes | |
CN104834747B (zh) | 基于卷积神经网络的短文本分类方法 | |
CN114048331A (zh) | 一种基于改进型kgat模型的知识图谱推荐方法及系统 | |
WO2023065859A1 (zh) | 物品推荐方法、装置及存储介质 | |
CN109471982B (zh) | 一种基于用户和服务聚类QoS感知的Web服务推荐方法 | |
Azzouz et al. | Steady state IBEA assisted by MLP neural networks for expensive multi-objective optimization problems | |
CN112084307B (zh) | 一种数据处理方法、装置、服务器及计算机可读存储介质 | |
CN107943897B (zh) | 一种用户推荐方法 | |
CN109710760A (zh) | 短文本的聚类方法、装置、介质及电子设备 | |
US11977978B2 (en) | Finite rank deep kernel learning with linear computational complexity | |
US20230306505A1 (en) | Extending finite rank deep kernel learning to forecasting over long time horizons | |
CN110222838B (zh) | 文档排序方法、装置、电子设备及存储介质 | |
Gilan et al. | Sustainable building design: A challenge at the intersection of machine learning and design optimization | |
WO2022100607A1 (zh) | 一种神经网络结构确定方法及其装置 | |
Zarzour et al. | Sentiment analysis based on deep learning methods for explainable recommendations with reviews | |
Du et al. | Image recommendation algorithm combined with deep neural network designed for social networks | |
CN111310971B (zh) | 一种o2o商业模式的前景分析方法、装置及设备 | |
Xu et al. | Research on context-aware group recommendation based on deep learning | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
Mao et al. | An XGBoost-assisted evolutionary algorithm for expensive multiobjective optimization problems | |
Dominguez-Olmedo et al. | On data manifolds entailed by structural causal models | |
He et al. | Recommendation algorithm based on restricted Boltzmann machine and item type | |
Kim et al. | COVID-19 outbreak prediction using Seq2Seq+ Attention and Word2Vec keyword time series data | |
CN112241811B (zh) | “互联网+”环境下定制产品的分层混合性能预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |