CN111191444B

CN111191444B - 品牌定位方法和系统

Info

Publication number: CN111191444B
Application number: CN201911323374.6A
Authority: CN
Inventors: 杜亚楠; 袁敏; 孙江洁; 高健; 智丽萍; 刘国旗
Original assignee: Anhui Medical University
Current assignee: Anhui Medical University
Priority date: 2019-12-20
Filing date: 2019-12-20
Publication date: 2023-06-09
Anticipated expiration: 2039-12-20
Also published as: CN111191444A

Abstract

本发明提供一种品牌定位方法和系统，涉及数据处理技术领域。本发明首先获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，并对待定位的品牌文本数据和处于同一竞争空间的品牌文本集合进行预处理，待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据；再基于预处理后的待定位的品牌文本数据获取品牌感知差值；基于处于同一竞争空间的品牌文本集合和待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置；最后基于品牌感知差值和待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。本发明在品牌与用户相结合、品牌与竞品相结合的统一框架下，考虑品牌定位的问题，提高品牌定位的准确度。

Description

品牌定位方法和系统

技术领域

本发明涉及数据处理技术领域，具体涉及一种品牌定位方法和系统。

背景技术

品牌定位是建立一个与目标市场有关的品牌形象的过程和结果。在大数据时代，借助海量非结构化文本数据提取有价值的信息，测评品牌定位，可以帮助企业有效地监测品牌建设情况并做出合理的品牌战略建议。

现有的品牌定位方法主要包括基于战略定位、基于品牌资产和基于品牌个性这三种。战略定位认为企业的地位是通过其在价值链上的活动实现的，无差异竞争对手数量的增加会削弱企业的盈利能力。企业需要不断调整定位，拉开与竞争对手的距离，从而保持持续的竞争优势。品牌资产归纳起来有三个维度：财务概念、市场概念和消费者概念。品牌个性是指用户不断致力于构建自己的身份，产品的象征性是用户购买的主要原因。强大积极的品牌个性能提高消费者的偏好和使用，提高消费者的信任和忠诚度，为产品差异化提供基础，从品牌个性的视角通过调查分析品牌的个性，理解品牌的定位。

然而，基于战略或者品牌资产、品牌个性维度的品牌定位测评往往是从公司或用户视角考虑，视角单一，导致品牌定位准确度较低。

发明内容

(一)解决的技术问题

针对现有技术的不足，本发明提供了一种品牌定位方法和系统，解决了现有的品牌定位方法准确度较低的技术问题。

(二)技术方案

为实现以上目的，本发明通过以下技术方案予以实现：

本发明提供一种品牌定位方法，所述方法由计算机执行，包括以下步骤：

S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，并对所述待定位的品牌文本数据和所述处于同一竞争空间的品牌文本集合进行预处理，所述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据；

S2、基于预处理后的所述待定位的品牌文本数据获取品牌感知差值；

S3、基于所述处于同一竞争空间的品牌文本集合和所述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置；

S4、基于所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。

优选的，所述预处理包括：

对文本进行分词以及词性标注；

去掉文本的标点符号、特殊字符和作为语法填充作用的停用词；

使用hownet词典进行同义词替换；

检测词语在语料中出现的频率，使用截止规则，去掉频率表首尾两端的词语。

优选的，所述S2具体包括：

S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题；

S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异。

优选的，所述S201具体包括：

品牌文本数据中文档d的主题先验分布θ_d和主题k对应词的先验分布β_k均服从Dirichlet分布：

θ_d～Dirichlet(α)

β_k～Dirichlet(η)

其中：

α和η分别是θ_d和β_k的超参数；

主题k∈{1,2,…,K}；

基于θ_d确定文档d中的第i个单词w_di的主题z_di，z_di服从多项式分布：

z_di～Mult(θ_d)

其中：

z_di∈{1,2,…,K},K为整个品牌文本数据中的主题总数目；

在确定主题z_di和主题词分布β_k的基础上，生成文档d中的第i个单词w_di，w_di服从多项式分布：

其中：w_di＝v∈{1,2,…,V}，V为整个品牌文本数据中不重复的单词数目；

基于贝叶斯法则，得到文档d中的第i个单词w_di对应主题z_di的后验概率：

p(z_di＝k|z_-di,w_-di,w_di＝v)∝p(w_di|z_di＝k,z_-di,w_-di)p(z_di＝k|z_-di)

其中：

z_-di表示去除单词w_di后，整个品牌文本数据中其他单词对应的主题；

w_-di表示去除单词w_di后，整个品牌文本数据中剩余的所有单词；

p(z_di＝k|z_-di,w_-di,w_di＝v)表示在z_-di、w_-di和w_di已知的条件下，产生单词w_di对应主题z_di的条件后验概率；

p(w_di|z_di＝k,z_-di,w_-di)表示在w_-di、z_-di和z_di已知的条件下，生成单词w_di的似然概率；

p(z_di＝k|z_-di)表示在z_-di已知的条件下，产生单词w_di对应主题z_di的先验概率；

p(w_di|z_di＝k,z_-di,w_-di)通过如下公式计算：

其中：

p(w_di|z_di＝k,β_k)表示在主题z_di和主题词分布β_k已知的情况下，产生单词w_di的概率；

p(β_k|z_-di,w_-di)表示在z_-di和w_-di已知的情况下，产生β_k的概率；

表示除去当前单词w_di，主题k生成单词v的数量；/>

表示除去当前单词w_di，主题k生成单词的总量；

p(z_di＝k|z_-di)通过如下公式计算：

其中：

p(z_di＝k|θ_d)表示在θ_d已知的条件下产生k的概率；

p(θ_d|z_-di)表示在z_-di已知的条件下产生θ_d的概率；

表示去除当前单词w_di，文档d中第k个主题生成的单词数量；/>

表示去除当前单词w_di，文档d中的单词总量；

联合p(w_di|z_di＝k,z_-di,w_-di)和p(z_di＝k|z_-di)计算得到：

基于p(z_di＝k|z_-di,w_-di,w_di＝v)公式，采用Gibbs采样方法迭代至收敛，确定品牌发布的文本数据中每个单词对应的主题，统计主题k对应的v词汇的数量

主题k对应的所有单词的数量/>

文档d中主题k生成的单词总数/>

和文档d中单词总/>

通过如下公式估计品牌文本数据中文档d中主题分布θ_d和主题词分布β_k：

其中：

θ_dk表示主题k在文档d中所占权重；

β_kv表示词汇v在主题k中所占权重；

基于β_kv和θ_dk选取权重为Top-N个代表性的词汇描述品牌文本数据中的每个主题；

计算用户生成的文本数据的每个单词对应的主题，选取Top-N个代表性的词汇描述用户生成的文本数据中的每个主题。

优选的，所述S202具体包括：

令MP_perception表示品牌定位感知维度的测量结果，其衡量了品牌自身发声和用户感知的差异，计算公式如下：

其中：

K是S201中主题的个数；

z_i和z′_i是用代表性的词汇表示的N维向量；

cos(z_i,z′_i)表示在用户感知主题和品牌自定义主题之间的相似性。

优选的，所述S3具体包括：

S301、{V_brand1,V_brand2,…,V_brandl}是处于同一竞争空间的品牌集合，令

是待定位的品牌i的品牌发布的文本数据向量表示，/>

是品牌j的品牌发布的文本数据向量表示，则品牌i和品牌j的品牌自身标签差异度为：

其中：

表示/>

和/>

之间的余弦相似度；

S302、品牌i的用户生成的文本数据隐含主题为z_1brandi,z_2brandi,…,z_Kbrandi，品牌j的用户生成的文本数据的隐含主题为z′_1brandi,z′_2brandi,…,z′_Kbrandi，则品牌i和品牌j的用户感知差异度为：

其中：

cos(z_ibrand1,z′_ibrand1)表示z_ibrand1和z′_ibrand1之间的余弦相似度；

K表示品牌i的用户生成的文本数据隐含主题个数；

S303、取品牌自身标签差异度和用户感知差异度加权平均，品牌i相对其竞争品牌j的差异度为：

sim(V_brandi,V_brandj)＝λ₁sbrand(V_brandi,V_brandj)+λ₂sbrand(V_brandi,V_brandj)′

其中：λ₁，λ₂表示品牌自我定位标签和用户感知标签的重要程度，品牌在竞争空间中的相对位置为MP_location，

其中：

l表示在该竞争空间中品牌的个数。

优选的，所述S4具体包括：

根据品牌生命周期、所述品牌感知差值和所述待定位的品牌在竞争空间中的相对位置获取待定位的品牌在品牌生命周期的不同阶段的品牌定位。

优选的，所述方法还包括：

将品牌发布的文本数据表示为词向量，用

表示文档d，每个单词w都是向量空间中的一个特征，向量的维数|d|是语料中出现唯一单词的个数，每个维度的权重ω代表这个单词在语料中的重要程度，权重的计算公式如下：

TF-IDF(w,d)＝TF(w,d)×IDF(w)

其中：

TF(w,d)表示单词w在文档d中出现的频率，n为包含单词w的文档个数，m为语料中文档总数；

使用余弦距离计算文本之间的相似性，计算公式如下：

按时间序列计算不同文本之间的相似性变化，获取在生命周期的不同阶段品牌对自身进行目标定位的变迁。

本发明还提供一种品牌定位系统，所述系统包括计算机，所述计算机包括：

至少一个存储单元；

至少一个处理单元；

其中，所述至少一个存储单元中存储有至少一条指令，所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤：

(三)有益效果

本发明提供了一种品牌定位方法和系统。与现有技术相比，具备以下有益效果：

本发明首先获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理，上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据；再基于预处理后的上述待定位的品牌文本数据获取品牌感知差值；基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置；最后基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。本发明在品牌与用户相结合、品牌与竞品相结合的统一框架下，考虑品牌定位的问题，提高品牌定位的准确度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例一种品牌定位方法的框图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本申请实施例通过提供一种品牌定位方法和系统，解决了现有的品牌定位方法准确度较低的技术问题，实现提高品牌定位的准确度。

本申请实施例中的技术方案为解决上述技术问题，总体思路如下：

本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下，考虑品牌定位的问题，提高品牌定位的准确度。本发明实施例全面考量品牌自身声音、品牌在用户心中的感知，了解品牌与其他品牌的差异化程度，能够帮助企业有效地监测品牌建设情况并做出合理的品牌战略建议。

为了更好的理解上述技术方案，下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。

本发明实施例提供一种品牌定位方法，如图1所示，上述方法由计算机执行，包括步骤S1～S4：

S1、获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理，上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据；

S2、基于预处理后的上述待定位的品牌文本数据获取品牌感知差值；

S3、基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置；

S4、基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。

本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下，考虑品牌定位的问题，提高品牌定位的准确度。

下面对各个步骤进行详细描述：

在步骤S1中，获取待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，并对上述待定位的品牌文本数据和上述处于同一竞争空间的品牌文本集合进行预处理，上述待定位的品牌文本数据包括品牌发布的文本数据和用户生成的文本数据。具体为：

通过网络爬虫技术获取社会化媒体上待定位的品牌文本数据和处于同一竞争空间的品牌文本集合，然后对待定位的品牌文本数据和处于同一竞争空间的品牌文本集合中的文本进行预处理，预处理的过程如下：

首先，对文本进行分词以及词性标注，考虑涉及专业词汇时的特定表达方式，视名词性短语为一个分析单元。其次，去掉标点符号、特殊字符以及作为语法填充作用的停用词。然后，使用hownet词典进行同义词替换，降低维度。最后，考察词语在语料中出现的频率，使用截止规则，去掉频率表首尾两端的词语。

在步骤S2中，基于预处理后的上述待定位的品牌文本数据获取品牌感知差值。具体为：

S201、基于主题模型和预处理后的品牌文本数据抽取品牌文本数据的隐含主题。具体实施过程如下：

θ_d～Dirichlet(α)

β_k～Dirichlet(η)

其中：

α和η分别是θ_d和β_k的超参数；主题k∈{1,2,…,K}。

基于θ_d，进一步确定文档d中的第i个单词w_di的主题z_di，即服从多项式分布：

z_di～Mult(θ_d)

其中：

z_di∈{1,2,…,K},K为整个品牌文本数据中的主题总数目。

在确定主题z_di和主题词分布β_k的基础上，生成文档d中的第i个单词w_di，即服从多项式分布：

其中：w_di＝v∈{1,2,…,V},V为整个品牌文本数据中不重复的单词数目。

下面使用Gibbs抽样算法，近似估计文档主题分布θ_d和主题词分布β_k；

其中：

p(z_di＝k|z_-di)表示在z_-di已知的条件下，产生单词w_di对应主题z_di的先验概率。

p(w_di|z_di＝k,z_-di,w_-di)可通过如下公式计算：

其中：

表示除去当前单词w_di，主题k生成单词v的数量；/>

表示除去当前单词w_di，主题k生成单词的总量。

p(z_di＝k|z_-di)可通过如下公式计算：

其中：

p(z_di＝k|θ_d)表示在θ_d已知的条件下产生k的概率；

p(θ_d|z_-di)表示在z_-di已知的条件下产生θ_d的概率；

表示去除当前单词w_di，文档d中的单词总量。

联合p(w_di|z_di＝k,z_-di,w_-di)和p(z_di＝k|z_-di)可计算得到p(z_di＝k|z_-di,w_-di,w_di＝v)：

基于p(z_di＝k|z_-di,w_-di,w_di＝v)公式，采用Gibbs采样方法迭代至收敛，可确定品牌发布的文本数据中每个单词对应的主题，统计主题k对应的v词汇的数量

主题k对应的所有单词的数量/>

文档d中主题k生成的单词总数/>

和文档d中单词总/>

可通过如下公式估计文档主题分布θ_d和主题词分布β_k：

其中：

θ_dk表示主题k在文档d中所占权重；

β_kv表示词汇v在主题k中所占权重；

利用相同的方法，计算用户生成的文本数据的每个单词对应的主题，选取权重为Top-N个代表性的词汇描述用户生成的文本数据中的每个主题。

S202、基于品牌文本数据的隐含主题衡量品牌自身发声和用户感知的差异。具体实施过程如下：

其中：

K是S201中主题的个数；

z_i和z′_i是用代表性的词汇表示的N维向量；

MP_perception值越高，说明用户的感知偏离品牌初衷越远。

在步骤S3中，基于上述处于同一竞争空间的品牌文本集合和上述待定位的品牌文本数据获取待定位的品牌在竞争空间中的相对位置。

具体为：

是待定位的品牌i的品牌发布的文本数据向量表示，/>

其中：

表示/>

和/>

之间的余弦相似度；

其中：

K表示品牌i的用户生成的文本数据隐含主题主题个数；

其中：

l表示在该竞争空间中品牌的个数。

在步骤S4中，基于上述品牌感知差值和上述待定位的品牌在竞争空间中的相对位置获取待定位的品牌的品牌定位。具体为：

根据品牌生命周期、组合向量[MP_perception，MP_location]获取待定位的品牌在品牌生命周期的不同阶段的品牌定位。其中品牌生命周期的不同阶段包括：品牌的创立阶段、稳固阶段、差异化阶段、模仿阶段、分化阶段和两极分化阶段。

同时，本发明实施例在具体实施过程中，还包括：将品牌发布的文本数据表示为词向量，用

TF-IDF(w,d)＝TF(w,d)×IDF(w)

其中：

使用余弦距离计算文本之间的相似性，计算公式如下：

本发明实施例还提供一种品牌定位系统，上述系统包括计算机，上述计算机包括：

至少一个存储单元；

至少一个处理单元；

其中，上述至少一个存储单元中存储有至少一条指令，上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤：

可理解的是，本发明实施例提供的上述品牌定位系统与上述品牌定位方法相对应，其有关内容的解释、举例、有益效果等部分可以参考品牌定位方法中的相应内容，此处不再赘述。

综上所述，与现有技术相比，具备以下有益效果：

1、本发明实施例在品牌与用户相结合、品牌与竞品相结合的统一框架下，考虑品牌定位的问题，提高品牌定位的准确度。同时，可发明还考虑了在生命周期的不同阶段品牌对自身进行目标定位的变迁，进一步提高品牌定位的准确度。

2、本发明实施例充分利用了社会化媒体中的海量碎片化数据，在获取更精准的品牌定位上节省了大量的人力和财力成本。

3、本发明实施例的操作范式可以很容易的推广到品牌战略管理的其他核心问题，为大数据环境下数据驱动的研究范式在战略管理研究领域的应用，提供了深层次、不同角度的信息洞察。

需要说明的是，通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。