CN111191444B - 品牌定位方法和系统 - Google Patents
品牌定位方法和系统 Download PDFInfo
- Publication number
- CN111191444B CN111191444B CN201911323374.6A CN201911323374A CN111191444B CN 111191444 B CN111191444 B CN 111191444B CN 201911323374 A CN201911323374 A CN 201911323374A CN 111191444 B CN111191444 B CN 111191444B
- Authority
- CN
- China
- Prior art keywords
- brand
- text data
- word
- words
- topic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种品牌定位方法和系统,涉及数据处理技术领域。本发明首先获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对待定位的品牌文本数据和处于同一竞争空间的品牌文本集合进行预处理,待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;再基于预处理后的待定位的品牌文本数据获取品牌感知差值;基于处于同一竞争空间的品牌文本集合和待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;最后基于品牌感知差值和待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。本发明在品牌与用户相结合、品牌与竞品相结合的统一框架下,考虑品牌定位的问题,提高品牌定位的准确度。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种品牌定位方法和系统。
背景技术
品牌定位是建立一个与目标市场有关的品牌形象的过程和结果。在大数据时代,借助海量非结构化文本数据提取有价值的信息,测评品牌定位,可以帮助企业有效地监测品牌建设情况并做出合理的品牌战略建议。
现有的品牌定位方法主要包括基于战略定位、基于品牌资产和基于品牌个性这三种。战略定位认为企业的地位是通过其在价值链上的活动实现的,无差异竞争对手数量的增加会削弱企业的盈利能力。企业需要不断调整定位,拉开与竞争对手的距离,从而保持持续的竞争优势。品牌资产归纳起来有三个维度:财务概念、市场概念和消费者概念。品牌个性是指用户不断致力于构建自己的身份,产品的象征性是用户购买的主要原因。强大积极的品牌个性能提高消费者的偏好和使用,提高消费者的信任和忠诚度,为产品差异化提供基础,从品牌个性的视角通过调查分析品牌的个性,理解品牌的定位。
然而,基于战略或者品牌资产、品牌个性维度的品牌定位测评往往是从公司或用户视角考虑,视角单一,导致品牌定位准确度较低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种品牌定位方法和系统,解决了现有的品牌定位方法准确度较低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种品牌定位方法,所述方法由计算机执行,包括以下步骤:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对所述待定位的品牌文本数据和所述处于同一竞争空间的品牌文本集合进行预处理,所述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的所述待定位的品牌文本数据获取品牌感知差值;
S3、基于所述处于同一竞争空间的品牌文本集合和所述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
优选的,所述预处理包括:
对文本进行分词以及词性标注;
去掉文本的标点符号、特殊字符和作为语法填充作用的停用词;
使用hownet词典进行同义词替换;
检测词语在语料中出现的频率,使用截止规则,去掉频率表首尾两端的词语。
优选的,所述S2具体包括:
S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题;
S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异。
优选的,所述S201具体包括:
品牌文本数据中文档d的主题先验分布θd和主题k对应词的先验分布βk均服从Dirichlet分布:
θd~Dirichlet(α)
βk~Dirichlet(η)
其中:
α和η分别是θd和βk的超参数;
主题k∈{1,2,…,K};
基于θd确定文档d中的第i个单词wdi的主题zdi,zdi服从多项式分布:
zdi~Mult(θd)
其中:
zdi∈{1,2,…,K},K为整个品牌文本数据中的主题总数目;
在确定主题zdi和主题词分布βk的基础上,生成文档d中的第i个单词wdi,wdi服从多项式分布:
其中:wdi=v∈{1,2,…,V},V为整个品牌文本数据中不重复的单词数目;
基于贝叶斯法则,得到文档d中的第i个单词wdi对应主题zdi的后验概率:
p(zdi=k|z-di,w-di,wdi=v)∝p(wdi|zdi=k,z-di,w-di)p(zdi=k|z-di)
其中:
z-di表示去除单词wdi后,整个品牌文本数据中其他单词对应的主题;
w-di表示去除单词wdi后,整个品牌文本数据中剩余的所有单词;
p(zdi=k|z-di,w-di,wdi=v)表示在z-di、w-di和wdi已知的条件下,产生单词wdi对应主题zdi的条件后验概率;
p(wdi|zdi=k,z-di,w-di)表示在w-di、z-di和zdi已知的条件下,生成单词wdi的似然概率;
p(zdi=k|z-di)表示在z-di已知的条件下,产生单词wdi对应主题zdi的先验概率;
p(wdi|zdi=k,z-di,w-di)通过如下公式计算:
其中:
p(wdi|zdi=k,βk)表示在主题zdi和主题词分布βk已知的情况下,产生单词wdi的概率;
p(βk|z-di,w-di)表示在z-di和w-di已知的情况下,产生βk的概率;
p(zdi=k|z-di)通过如下公式计算:
其中:
p(zdi=k|θd)表示在θd已知的条件下产生k的概率;
p(θd|z-di)表示在z-di已知的条件下产生θd的概率;
联合p(wdi|zdi=k,z-di,w-di)和p(zdi=k|z-di)计算得到:
基于p(zdi=k|z-di,w-di,wdi=v)公式,采用Gibbs采样方法迭代至收敛,确定品牌发布的文本数据中每个单词对应的主题,统计主题k对应的v词汇的数量主题k对应的所有单词的数量/>文档d中主题k生成的单词总数/>和文档d中单词总/>通过如下公式估计品牌文本数据中文档d中主题分布θd和主题词分布βk:
其中:
θdk表示主题k在文档d中所占权重;
βkv表示词汇v在主题k中所占权重;
基于βkv和θdk选取权重为Top-N个代表性的词汇描述品牌文本数据中的每个主题;
计算用户生成的文本数据的每个单词对应的主题,选取Top-N个代表性的词汇描述用户生成的文本数据中的每个主题。
优选的,所述S202具体包括:
令MP_perception表示品牌定位感知维度的测量结果,其衡量了品牌自身发声和用户感知的差异,计算公式如下:
其中:
K是S201中主题的个数;
zi和z′i是用代表性的词汇表示的N维向量;
cos(zi,z′i)表示在用户感知主题和品牌自定义主题之间的相似性。
优选的,所述S3具体包括:
S301、{Vbrand1,Vbrand2,…,Vbrandl}是处于同一竞争空间的品牌集合,令是待定位的品牌i的品牌发布的文本数据向量表示,/>是品牌j的品牌发布的文本数据向量表示,则品牌i和品牌j的品牌自身标签差异度为:
其中:
S302、品牌i的用户生成的文本数据隐含主题为z1brandi,z2brandi,…,zKbrandi,品牌j的用户生成的文本数据的隐含主题为z′1brandi,z′2brandi,…,z′Kbrandi,则品牌i和品牌j的用户感知差异度为:
其中:
cos(zibrand1,z′ibrand1)表示zibrand1和z′ibrand1之间的余弦相似度;
K表示品牌i的用户生成的文本数据隐含主题个数;
S303、取品牌自身标签差异度和用户感知差异度加权平均,品牌i相对其竞争品牌j的差异度为:
sim(Vbrandi,Vbrandj)=λ1sbrand(Vbrandi,Vbrandj)+λ2sbrand(Vbrandi,Vbrandj)′
其中:λ1,λ2表示品牌自我定位标签和用户感知标签的重要程度,品牌在竞争空间中的相对位置为MP_location,
其中:
l表示在该竞争空间中品牌的个数。
优选的,所述S4具体包括:
根据品牌生命周期、所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌在品牌生命周期的不同阶段的品牌定位。
优选的,所述方法还包括:
TF-IDF(w,d)=TF(w,d)×IDF(w)
其中:
TF(w,d)表示单词w在文档d中出现的频率,n为包含单词w的文档个数,m为语料中文档总数;
使用余弦距离计算文本之间的相似性,计算公式如下:
按时间序列计算不同文本之间的相似性变化,获取在生命周期的不同阶段品牌对自身进行目标定位的变迁。
本发明还提供一种品牌定位系统,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对所述待定位的品牌文本数据和所述处于同一竞争空间的品牌文本集合进行预处理,所述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的所述待定位的品牌文本数据获取品牌感知差值;
S3、基于所述处于同一竞争空间的品牌文本集合和所述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
(三)有益效果
本发明提供了一种品牌定位方法和系统。与现有技术相比,具备以下有益效果:
本发明首先获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理,上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;再基于预处理后的上述待定位的品牌文本数据获取品牌感知差值;基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;最后基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。本发明在品牌与用户相结合、品牌与竞品相结合的统一框架下,考虑品牌定位的问题,提高品牌定位的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一种品牌定位方法的框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种品牌定位方法和系统,解决了现有的品牌定位方法准确度较低的技术问题,实现提高品牌定位的准确度。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下,考虑品牌定位的问题,提高品牌定位的准确度。本发明实施例全面考量品牌自身声音、品牌在用户心中的感知,了解品牌与其他品牌的差异化程度,能够帮助企业有效地监测品牌建设情况并做出合理的品牌战略建议。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明实施例提供一种品牌定位方法,如图1所示,上述方法由计算机执行,包括步骤S1~S4:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理,上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的上述待定位的品牌文本数据获取品牌感知差值;
S3、基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下,考虑品牌定位的问题,提高品牌定位的准确度。
下面对各个步骤进行详细描述:
在步骤S1中,获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理,上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据。具体为:
通过网络爬虫技术获取社会化媒体上待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,然后对待定位的品牌文本数据和处于同一竞争空间的品牌文本集合中的文本进行预处理,预处理的过程如下:
首先,对文本进行分词以及词性标注,考虑涉及专业词汇时的特定表达方式,视名词性短语为一个分析单元。其次,去掉标点符号、特殊字符以及作为语法填充作用的停用词。然后,使用hownet词典进行同义词替换,降低维度。最后,考察词语在语料中出现的频率,使用截止规则,去掉频率表首尾两端的词语。
在步骤S2中,基于预处理后的上述待定位的品牌文本数据获取品牌感知差值。具体为:
S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题。具体实施过程如下:
品牌文本数据中文档d的主题先验分布θd和主题k对应词的先验分布βk均服从Dirichlet分布:
θd~Dirichlet(α)
βk~Dirichlet(η)
其中:
α和η分别是θd和βk的超参数;主题k∈{1,2,…,K}。
基于θd,进一步确定文档d中的第i个单词wdi的主题zdi,即服从多项式分布:
zdi~Mult(θd)
其中:
zdi∈{1,2,…,K},K为整个品牌文本数据中的主题总数目。
在确定主题zdi和主题词分布βk的基础上,生成文档d中的第i个单词wdi,即服从多项式分布:
其中:wdi=v∈{1,2,…,V},V为整个品牌文本数据中不重复的单词数目。
下面使用Gibbs抽样算法,近似估计文档主题分布θd和主题词分布βk;
基于贝叶斯法则,得到文档d中的第i个单词wdi对应主题zdi的后验概率:
p(zdi=k|z-di,w-di,wdi=v)∝p(wdi|zdi=k,z-di,w-di)p(zdi=k|z-di)
其中:
z-di表示去除单词wdi后,整个品牌文本数据中其他单词对应的主题;
w-di表示去除单词wdi后,整个品牌文本数据中剩余的所有单词;
p(zdi=k|z-di,w-di,wdi=v)表示在z-di、w-di和wdi已知的条件下,产生单词wdi对应主题zdi的条件后验概率;
p(wdi|zdi=k,z-di,w-di)表示在w-di、z-di和zdi已知的条件下,生成单词wdi的似然概率;
p(zdi=k|z-di)表示在z-di已知的条件下,产生单词wdi对应主题zdi的先验概率。
p(wdi|zdi=k,z-di,w-di)可通过如下公式计算:
其中:
p(wdi|zdi=k,βk)表示在主题zdi和主题词分布βk已知的情况下,产生单词wdi的概率;
p(βk|z-di,w-di)表示在z-di和w-di已知的情况下,产生βk的概率;
p(zdi=k|z-di)可通过如下公式计算:
其中:
p(zdi=k|θd)表示在θd已知的条件下产生k的概率;
p(θd|z-di)表示在z-di已知的条件下产生θd的概率;
联合p(wdi|zdi=k,z-di,w-di)和p(zdi=k|z-di)可计算得到p(zdi=k|z-di,w-di,wdi=v):
基于p(zdi=k|z-di,w-di,wdi=v)公式,采用Gibbs采样方法迭代至收敛,可确定品牌发布的文本数据中每个单词对应的主题,统计主题k对应的v词汇的数量主题k对应的所有单词的数量/>文档d中主题k生成的单词总数/>和文档d中单词总/>可通过如下公式估计文档主题分布θd和主题词分布βk:
其中:
θdk表示主题k在文档d中所占权重;
βkv表示词汇v在主题k中所占权重;
基于βkv和θdk选取权重为Top-N个代表性的词汇描述品牌文本数据中的每个主题;
利用相同的方法,计算用户生成的文本数据的每个单词对应的主题,选取权重为Top-N个代表性的词汇描述用户生成的文本数据中的每个主题。
S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异。具体实施过程如下:
令MP_perception表示品牌定位感知维度的测量结果,其衡量了品牌自身发声和用户感知的差异,计算公式如下:
其中:
K是S201中主题的个数;
zi和z′i是用代表性的词汇表示的N维向量;
cos(zi,z′i)表示在用户感知主题和品牌自定义主题之间的相似性。
MP_perception值越高,说明用户的感知偏离品牌初衷越远。
在步骤S3中,基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置。
具体为:
S301、{Vbrand1,Vbrand2,…,Vbrandl}是处于同一竞争空间的品牌集合,令是待定位的品牌i的品牌发布的文本数据向量表示,/>是品牌j的品牌发布的文本数据向量表示,则品牌i和品牌j的品牌自身标签差异度为:
其中:
S302、品牌i的用户生成的文本数据隐含主题为z1brandi,z2brandi,…,zKbrandi,品牌j的用户生成的文本数据的隐含主题为z′1brandi,z′2brandi,…,z′Kbrandi,则品牌i和品牌j的用户感知差异度为:
其中:
cos(zibrand1,z′ibrand1)表示zibrand1和z′ibrand1之间的余弦相似度;
K表示品牌i的用户生成的文本数据隐含主题主题个数;
S303、取品牌自身标签差异度和用户感知差异度加权平均,品牌i相对其竞争品牌j的差异度为:
sim(Vbrandi,Vbrandj)=λ1sbrand(Vbrandi,Vbrandj)+λ2sbrand(Vbrandi,Vbrandj)′
其中:λ1,λ2表示品牌自我定位标签和用户感知标签的重要程度,品牌在竞争空间中的相对位置为MP_location,
其中:
l表示在该竞争空间中品牌的个数。
在步骤S4中,基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。具体为:
根据品牌生命周期、组合向量[MP_perception,MP_location]获取待定位的品牌在品牌生命周期的不同阶段的品牌定位。其中品牌生命周期的不同阶段包括:品牌的创立阶段、稳固阶段、差异化阶段、模仿阶段、分化阶段和两极分化阶段。
同时,本发明实施例在具体实施过程中,还包括:将品牌发布的文本数据表示为词向量,用表示文档d,每个单词w都是向量空间中的一个特征,向量的维数|d|是语料中出现唯一单词的个数,每个维度的权重ω代表这个单词在语料中的重要程度,权重的计算公式如下:
TF-IDF(w,d)=TF(w,d)×IDF(w)
其中:
TF(w,d)表示单词w在文档d中出现的频率,n为包含单词w的文档个数,m为语料中文档总数;
使用余弦距离计算文本之间的相似性,计算公式如下:
按时间序列计算不同文本之间的相似性变化,获取在生命周期的不同阶段品牌对自身进行目标定位的变迁。
本发明实施例还提供一种品牌定位系统,上述系统包括计算机,上述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,上述至少一个存储单元中存储有至少一条指令,上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理,上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的上述待定位的品牌文本数据获取品牌感知差值;
S3、基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
可理解的是,本发明实施例提供的上述品牌定位系统与上述品牌定位方法相对应,其有关内容的解释、举例、有益效果等部分可以参考品牌定位方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
1、本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下,考虑品牌定位的问题,提高品牌定位的准确度。同时,可发明还考虑了在生命周期的不同阶段品牌对自身进行目标定位的变迁,进一步提高品牌定位的准确度。
2、本发明实施例充分利用了社会化媒体中的海量碎片化数据,在获取更精准的品牌定位上节省了大量的人力和财力成本。
3、本发明实施例的操作范式可以很容易的推广到品牌战略管理的其他核心问题,为大数据环境下数据驱动的研究范式在战略管理研究领域的应用,提供了深层次、不同角度的信息洞察。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (6)
1.一种品牌定位方法,其特征在于,所述方法由计算机执行,包括以下步骤:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对所述待定位的品牌文本数据和所述处于同一竞争空间的品牌文本集合进行预处理,所述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的所述待定位的品牌文本数据获取品牌感知差值,包括:
S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题,包括:
品牌文本数据中文档d的主题先验分布θd和主题k对应词的先验分布βk均服从Dirichlet分布:
θd~Dirichlet(α)
βk~Dirichlet(η)
其中:
α和η分别是θd和βk的超参数;
主题k∈{1,2,…,K};
基于θd确定文档d中的第i个单词wdi的主题zdi,zdi服从多项式分布:
zdi~Mult(θd)
其中:
zdi∈{1,2,…,K},K为整个品牌文本数据中的主题总数目;
在确定主题zdi和主题词分布βk的基础上,生成文档d中的第i个单词wdi,wdi服从多项式分布:
其中:wdi=v∈{1,2,…,V},V为整个品牌文本数据中不重复的单词数目;
基于贝叶斯法则,得到文档d中的第i个单词wdi对应主题zdi的后验概率:
p(zdi=k|z-di,w-di,wdi=v)∝p(wdi|zdi=k,z-di,w-di)p(zdi=k|z-di)
其中:
z-di表示去除单词wdi后,整个品牌文本数据中其他单词对应的主题;
w-di表示去除单词wdi后,整个品牌文本数据中剩余的所有单词;
p(zdi=k|z-di,w-di,wdi=v)表示在z-di、w-di和wdi已知的条件下,产生单词wdi对应主题zdi的条件后验概率;
p(wdi|zdi=k,z-di,w-di)表示在w-di、z-di和zdi已知的条件下,生成单词wdi的似然概率;
p(zdi=k|z-di)表示在z-di已知的条件下,产生单词wdi对应主题zdi的先验概率;
p(wdi|zdi=k,z-di,w-di)通过如下公式计算:
其中:
p(wdi|zdi=k,βk)表示在主题zdi和主题词分布βk已知的情况下,产生单词wdi的概率;
p(βk|z-di,w-di)表示在z-di和w-di已知的情况下,产生βk的概率;
p(zdi=k|z-di)通过如下公式计算:
其中:
p(zdi=k|θd)表示在θd已知的条件下产生k的概率;
p(θd|z-di)表示在z-di已知的条件下产生θd的概率;
联合p(wdi|zdi=k,z-di,w-di)和p(zdi=k|z-di)计算得到:
基于p(zdi=k|z-di,w-di,wdi=v)公式,采用Gibbs采样方法迭代至收敛,确定品牌发布的文本数据中每个单词对应的主题,统计主题k对应的v词汇的数量主题k对应的所有单词的数量/>文档d中主题k生成的单词总数/>和文档d中单词总/>通过如下公式估计品牌文本数据中文档d中主题分布θd和主题词分布βk:
其中:
θdk表示主题k在文档d中所占权重;
βkv表示词汇v在主题k中所占权重;
基于βkv和θdk选取权重为Top-N个代表性的词汇描述品牌文本数据中的每个主题;
计算用户生成的文本数据的每个单词对应的主题,选取Top-N个代表性的词汇描述用户生成的文本数据中的每个主题;
S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异,包括:
令MP_perception表示品牌定位感知维度的测量结果,其衡量了品牌自身发声和用户感知的差异,计算公式如下:
其中:
K是S201中主题的个数;
zi和zi′是用代表性的词汇表示的N维向量;
cos(zi,zi′)表示在用户感知主题和品牌自定义主题之间的相似性;
S3、基于所述处于同一竞争空间的品牌文本集合和所述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
2.如权利要求1所述的品牌定位方法,其特征在于,所述预处理包括:
对文本进行分词以及词性标注;
去掉文本的标点符号、特殊字符和作为语法填充作用的停用词;
使用hownet词典进行同义词替换;
检测词语在语料中出现的频率,使用截止规则,去掉频率表首尾两端的词语。
3.如权利要求2所述的品牌定位方法,其特征在于,所述S3具体包括:
S301、{Vbrand1,Vbrand2,…,Vbrandl}是处于同一竞争空间的品牌集合,令是待定位的品牌i的品牌发布的文本数据向量表示,/>是品牌j的品牌发布的文本数据向量表示,则品牌i和品牌j的品牌自身标签差异度为:
其中:
S302、品牌i的用户生成的文本数据隐含主题为z1brandi,z2brandi,…,zKbrandi,品牌j的用户生成的文本数据的隐含主题为z′1brandi,z′2brandi,…,z′Kbrandi,则品牌i和品牌j的用户感知差异度为:
其中:
cos(zibrand1,z′ibrand1)表示zibrand1和z′ibrand1之间的余弦相似度;
K表示品牌i的用户生成的文本数据隐含主题个数;
S303、取品牌自身标签差异度和用户感知差异度加权平均,品牌i相对其竞争品牌j的差异度为:
sim(Vbrandi,Vbrandj)=λ1sbrand(Vbrandi,Vbrandj)+λ2sbrand(Vbrandi,Vbrandj)′
其中:λ1,λ2表示品牌自我定位标签和用户感知标签的重要程度,品牌在竞争空间中的相对位置为MP_location,
其中:
l表示在该竞争空间中品牌的个数。
4.如权利要求1所述的品牌定位方法,其特征在于,所述S4具体包括:
根据品牌生命周期、所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌在品牌生命周期的不同阶段的品牌定位。
6.一种品牌定位系统,其特征在于,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合,并对所述待定位的品牌文本数据和所述处于同一竞争空间的品牌文本集合进行预处理,所述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据;
S2、基于预处理后的所述待定位的品牌文本数据获取品牌感知差值,S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题,包括:
品牌文本数据中文档d的主题先验分布θd和主题k对应词的先验分布βk均服从Dirichlet分布:
θd~Dirichlet(α)
βk~Dirichlet(η)
其中:
α和η分别是θd和βk的超参数;
主题k∈{1,2,…,K};
基于θd确定文档d中的第i个单词wdi的主题zdi,zdi服从多项式分布:
zdi~Mult(θd)
其中:
zdi∈{1,2,…,K},K为整个品牌文本数据中的主题总数目;
在确定主题zdi和主题词分布βk的基础上,生成文档d中的第i个单词wdi,wdi服从多项式分布:
其中:wdi=v∈{1,2,…,V},V为整个品牌文本数据中不重复的单词数目;
基于贝叶斯法则,得到文档d中的第i个单词wdi对应主题zdi的后验概率:
p(zdi=k|z-di,w-di,wdi=v)∝p(wdi|zdi=k,z-di,w-di)p(zdi=k|z-di)
其中:
z-di表示去除单词wdi后,整个品牌文本数据中其他单词对应的主题;
w-di表示去除单词wdi后,整个品牌文本数据中剩余的所有单词;
p(zdi=k|z-di,w-di,wdi=v)表示在z-di、w-di和wdi已知的条件下,产生单词wdi对应主题zdi的条件后验概率;
p(wdi|zdi=k,z-di,w-di)表示在w-di、z-di和zdi已知的条件下,生成单词wdi的似然概率;
p(zdi=k|z-di)表示在z-di已知的条件下,产生单词wdi对应主题zdi的先验概率;
p(wdi|zdi=k,z-di,w-di)通过如下公式计算:
其中:
p(wdi|zdi=k,βk)表示在主题zdi和主题词分布βk已知的情况下,产生单词wdi的概率;
p(βk|z-di,w-di)表示在z-di和w-di已知的情况下,产生βk的概率;
p(zdi=k|z-di)通过如下公式计算:
其中:
p(zdi=k|θd)表示在θd已知的条件下产生k的概率;
p(θd|z-di)表示在z-di已知的条件下产生θd的概率;
联合p(wdi|zdi=k,z-di,w-di)和p(zdi=k|z-di)计算得到:
基于p(zdi=k|z-di,w-di,wdi=v)公式,采用Gibbs采样方法迭代至收敛,确定品牌发布的文本数据中每个单词对应的主题,统计主题k对应的v词汇的数量主题k对应的所有单词的数量/>文档d中主题k生成的单词总数/>和文档d中单词总/>通过如下公式估计品牌文本数据中文档d中主题分布θd和主题词分布βk:
其中:
θdk表示主题k在文档d中所占权重;
βkv表示词汇v在主题k中所占权重;
基于βkv和θdk选取权重为Top-N个代表性的词汇描述品牌文本数据中的每个主题;
计算用户生成的文本数据的每个单词对应的主题,选取Top-N个代表性的词汇描述用户生成的文本数据中的每个主题;
S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异,包括:
令MP_perception表示品牌定位感知维度的测量结果,其衡量了品牌自身发声和用户感知的差异,计算公式如下:
其中:
K是S201中主题的个数;
zi和z′i是用代表性的词汇表示的N维向量;
cos(zi,z′i)表示在用户感知主题和品牌自定义主题之间的相似性;
S3、基于所述处于同一竞争空间的品牌文本集合和所述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置;
S4、基于所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911323374.6A CN111191444B (zh) | 2019-12-20 | 2019-12-20 | 品牌定位方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911323374.6A CN111191444B (zh) | 2019-12-20 | 2019-12-20 | 品牌定位方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111191444A CN111191444A (zh) | 2020-05-22 |
CN111191444B true CN111191444B (zh) | 2023-06-09 |
Family
ID=70707461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911323374.6A Active CN111191444B (zh) | 2019-12-20 | 2019-12-20 | 品牌定位方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111191444B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766550A (zh) * | 2019-01-07 | 2019-05-17 | 有米科技股份有限公司 | 一种文本品牌识别方法、识别装置和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10387894B2 (en) * | 2015-08-28 | 2019-08-20 | International Business Machines Corporation | Brand personality comparison engine |
US11315149B2 (en) * | 2015-08-28 | 2022-04-26 | International Business Machines Corporation | Brand personality inference and recommendation system |
-
2019
- 2019-12-20 CN CN201911323374.6A patent/CN111191444B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109766550A (zh) * | 2019-01-07 | 2019-05-17 | 有米科技股份有限公司 | 一种文本品牌识别方法、识别装置和存储介质 |
Non-Patent Citations (1)
Title |
---|
任金 ; .面向共现关系和情感分析的品牌竞争优势研究.图书情报导刊.2019,(05),全文. * |
Also Published As
Publication number | Publication date |
---|---|
CN111191444A (zh) | 2020-05-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kang et al. | Natural language processing (NLP) in management research: A literature review | |
US11281739B1 (en) | Computer with enhanced file and document review capabilities | |
US8713017B2 (en) | Summarization of short comments | |
Liu et al. | Riding the tide of sentiment change: sentiment analysis with evolving online reviews | |
CN112069312B (zh) | 一种基于实体识别的文本分类方法及电子装置 | |
Luo et al. | Entity sentiment analysis in the news: A case study based on negative sentiment smoothing model (nssm) | |
Jacobs et al. | Extracting fine-grained economic events from business news | |
Luo et al. | Product named entity recognition using conditional random fields | |
CN108536671B (zh) | 文本数据的情感指数识别方法和系统 | |
CN107291686B (zh) | 情感标识的辨识方法和情感标识的辨识系统 | |
CN111191444B (zh) | 品牌定位方法和系统 | |
CN107729509B (zh) | 基于隐性高维分布式特征表示的篇章相似度判定方法 | |
Yu et al. | Research on intelligence computing models of fine-grained opinion mining in online reviews | |
Wei et al. | Stock trend prediction using financial market news and BERT | |
Jain et al. | Knowledge-based data processing for multilingual natural language analysis | |
CN110929513A (zh) | 基于文本的标签体系构建方法及装置 | |
Seki et al. | S-APIR: news-based business sentiment index | |
Yuan et al. | Target-based sentiment annotation in Chinese financial news | |
Jadon et al. | Sentiment analysis for movies prediction using machine leaning techniques | |
JP2017188025A (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
Mehrban et al. | evaluating bert and parsbert for analyzing persian advertisement data | |
Al-Hagree et al. | Arabic Sentiment Analysis Based Machine Learning for Measuring User Satisfaction with Banking Services' Mobile Applications: Comparative Study | |
Filippou et al. | The FOMC versus the Staff: Do Policymakers Add Value in Their Tales? | |
Weerasinghe et al. | Novel Method to Analyze and Forecast Social Impact on Macro-and Micro-Economies Using Social Media Data | |
Mamatha et al. | Supervised aspect category detection of co-occurrence data using conditional random fields |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |