CN111611795A - 一种自动化品牌形象分析方法和系统 - Google Patents

一种自动化品牌形象分析方法和系统 Download PDF

Info

Publication number
CN111611795A
CN111611795A CN202010289857.5A CN202010289857A CN111611795A CN 111611795 A CN111611795 A CN 111611795A CN 202010289857 A CN202010289857 A CN 202010289857A CN 111611795 A CN111611795 A CN 111611795A
Authority
CN
China
Prior art keywords
brand image
brand
dimension
image analysis
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010289857.5A
Other languages
English (en)
Inventor
何宇轩
牟昊
徐亚波
李旭日
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Datastory Information Technology Co ltd
Original Assignee
Guangzhou Datastory Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Datastory Information Technology Co ltd filed Critical Guangzhou Datastory Information Technology Co ltd
Priority to CN202010289857.5A priority Critical patent/CN111611795A/zh
Publication of CN111611795A publication Critical patent/CN111611795A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种自动化品牌形象分析方法,通过人工设定品牌形象维度的方式对目标品牌形象进行自动化分析,设定方式上具有针对性和灵活性,可以针对不同的目标品牌合理地设定分析内容和参数,分析结果更为准确和具有参考性;前期采集少量数据进行训练建立分析模块即可进行后续的自动品牌分析,减少人工操作量,降低了分析的人力成本,提高分析效率;以大规模中文预训练模型为基础,训练品牌形象分析模型;将大量指定品牌的相关文本输入品牌形象分析模型,统计各个维度出现的次数,得到该品牌的品牌形象分析结果,能从公开文本中快速挖掘出品牌的优势方面和劣势方面,帮助企业更好地把握和经营自己的品牌形象。

Description

一种自动化品牌形象分析方法和系统
技术领域
本发明涉及计算机文本处理技术领域,特别是一种自动化品牌形象分析方法和系统。
背景技术
品牌形象是消费者对品牌的认知和评价,是企业致力于打造和优化的形象工程,是精准营销的重要组成部分。在电子商务时代,及时了解自身品牌形象对企业管理者做出决策尤为重要。
目前,品牌形象分析主要通过问卷方案实现,这种方案效率低下。另外,也有一些品牌形象分析方法通过无监督的方法,譬如聚类,提取意思相近的文本,再进行分析。这种方法难以确保聚类的质量和方向,不一定能分析到指定品牌形象维度的结果。
发明内容
本发明针对上述问题,提供一种自动化品牌形象分析方法,包括以下步骤:
S001,设定一个品牌形象维度表,该表包含若干个品牌形象维度,一个所述品牌形象维度对应该品牌形象的一个方面。
S002,获取训练文本,对所述训练文本进行标注,得到标注文本。
S003,构建品牌形象分析模型神经网络结构,以步骤S002中所得的标注文本输入到所述品牌形象分析模型神经网络结构中进行训练,得到品牌形象分析模型。具体地:将标注数据输入到上一步构建好的模型神经网络结构中进行训练。训练结束后,得到品牌形象分析模型。当品牌形象分析模型训练完成后,在后续的自动分析步骤中可多次使用,无需重新训练。
S004,收集目标品牌的公开文本。在完成上述品牌形象分析模型的训练后即可开始进行目标品牌形象的自动化分析,首先需要收集目标品牌一定量的相关公开文本,这些相关的公开文本在现有公开的数据中获取。该步骤中,作为分析对象的目标品牌,可以是指定的某个品牌,也可以是指定某些品牌。
S005,模型预测,将上述收集目标品牌的公开文本输入到所述品牌形象分析模型进行预测,得到模型预测结果。参见附图2,所述品牌形象分析模型输出的模型预测结果为一品牌形象维度标签列表,列表长度和输入文本字符数一致。
S006,对模型预测结果进行统计分析,得到指定品牌在各个维度的品牌分析结果。
作为本发明的进一步说明,所述品牌形象维度的数量和方面内容由人为主观设定。
更进一步地,所述品牌形象维度设定为具有情感倾向性时,则在所述品牌形象维度表中包含该品牌形象维度的正面维度和负面维度。
更进一步地,步骤S002中包含过滤步骤,对获取的训练文本进行相似过滤操作。
更进一步地,所述标注为人工标注,采用BIO的序列标注方式,对所述标注文本中最能代表该品牌形象维度的关键短语的全部字符进行标注,所述关键短语开始字符打上“B+品牌形象维度”的标签,其余字符打上“I+品牌形象维度”的标签,若字符没有被打上任何品牌形象维度标签,则打上“O”标签。
更进一步地,所述品牌形象分析模型神经网络结构以大规模中文预训练模型的Fine-tune方式训练。
更进一步地,所述大规模中文预训练模型的神经网络输出输入到条件随机场层中,再由条件随机场层的输出预测各个字符的品牌形象维度标签。
更进一步地,所述S006步骤包括以模型预测结果中连续打上同一个品牌形象维度标签的字符组合成短语,统计各个品牌形象维度中各个词语出现的次数。
更进一步地,以统计出词语出现最多的若干个品牌形象维度作为目标品牌最突出的品牌形象;单个品牌形象维度中以统计出现最多的若干个词语作为对目标品牌在该品牌形象维度中公众的具体感受。
本发明的的自动化品牌形象分析系统,包括:
文件获取模块,用于从公开数据文献中获取训练文本和目标品牌的公开文本;
品牌形象分析模块,通过计算机系统或网络服务器构建的分析模型神经网络结构,包含经过数据训练形成的品牌形象分析模型,用于对获取的目标品牌公开文本进行自动分析,输出模型预测结果;
操作模块,用于输入操作指令,执行系统的设定操作、标注操作、统计分析操作等。
本发明的有益效果:
本发明通过人工设定品牌形象维度的方式对目标品牌形象进行自动化分析,设定方式上具有针对性和灵活性,可以针对不同的目标品牌合理地设定分析内容和参数,分析结果更为准确和具有参考性;前期采集少量数据进行训练建立分析模块即可进行后续的自动品牌分析,减少人工操作量,降低了分析的人力成本,提高分析效率;以大规模中文预训练模型为基础,训练品牌形象分析模型;将大量指定品牌的相关文本输入品牌形象分析模型,统计各个维度出现的次数,得到该品牌的品牌形象分析结果,能从公开文本中快速挖掘出品牌的优势方面和劣势方面,帮助企业更好地把握和经营自己的品牌形象。
附图说明
图1为本发明方法的流程图;
图2为本发明标注结果示意图;
图3为本发明品牌形象分析模型网络结构示意图。
具体实施方式
下面结合附图对本发明的具体实施例详细的说明,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
如图1所示的流程图,一种自动化品牌形象分析方法,包括以下步骤:
S001,设定一个品牌形象维度表,该表包含若干个品牌形象维度。品牌形象维度由市场营销专家或品牌形象专家人工设计,通过用尽量少而精准的词汇概况品牌形象的各个方面和所关注的方面。设计过程中,品牌形象的一个方面被设定为所述品牌形象维度表中的一个品牌形象维度。在该品牌形象维度表的设定中,其所包含的品牌形象维度数量并不固定,不同的目标品牌形象分析可以设定不同数量的品牌形象维度,而且品牌形象维度所指的方面也可以不同,可以根据实际应用中针对的目标品牌具体进行设定。
此外需要说明的是,在该步骤中,对于具有情感倾向性的品牌形象维度,所述品牌形象维度表中则至少包含该品牌形象维度的正面维度和负面维度。
在本发明的一个实施例中,若干具有相似属性的品牌形象维度可以在所述品牌形象维度表中形成一个维度大类。如表一所示,为本发明实施例的一个品牌形象维度表示例(部分)
表一:某品牌形象维度表
Figure BDA0002449997810000031
S002,获取训练文本,对训练文本进行标注,得到标注文本。该步骤所得的标注文本用于训练后续的分析模型。获取的文本应该包含上述品牌形象维度表中所有品牌形象维度对应的文本,并确保文档有一定多样性,以提高后续的训练效果;此外,为提高标注文本的多样性,可以对获取的训练文本进行去重操作。
获取多样性的训练文本后对所有的训练文本进行人工标注。具体标注方法可参见附图2。若训练文本中出现上述品牌形象维度表中任意品牌形象维度的相关描述,将最能代表该品牌形象维度的关键短语的全部字符标注出来,开始字符打上“B+品牌形象维度”的标签,其余字符打上“I+品牌形象维度”的标签。需要说明的是,每个字符最多只能打上一个标签。若字符没有被打上任何品牌形象维度标签,则需打上“O”标签
S003,参见附图3所示,构建品牌形象分析模型神经网络结构:以大规模中文预训练模型为基础,以其Fine-tune的方式构建网络,将其输出层输入到条件随机场中,再通过softmax操作得到模型输出,得到品牌形象分析模型神经网络结构;以步骤S002中所得的标注文本输入到构建好的模型神经网络结构中进行训练。训练结束后,得到品牌形象分析模型。当品牌形象分析模型训练完成后,在后续的自动分析步骤中可多次使用,无需重新训练。
S004,收集目标品牌的公开文本。在完成上述品牌形象分析模型的训练后即可开始进行目标品牌形象的自动化分析,首先需要收集目标品牌一定量的相关公开文本,这些相关的公开文本在现有公开的数据中获取。该步骤中,作为分析对象的目标品牌,可以是指定的某个品牌,也可以是指定某些品牌。
S005,模型预测,将上述收集目标品牌的公开文本输入到所述品牌形象分析模型进行预测,得到模型预测结果。参见附图2,所述品牌形象分析模型输出的模型预测结果为一品牌形象维度标签列表,列表长度和输入文本字符数一致。
S006,对模型预测结果进行统计分析。逐一对输入文本及其对应的模型输出进行分析,若模型输出中,品牌形象维度标签列表中均为“O”。则说明此文本中无任何品牌形象维度的相关文本,可跳过。
若模型输出中,品牌形象维度标签中出现以“B”开头的标签,则找出该标签后紧接着的,以“I”开头的,同属一个品牌形象维度的标签,得到一个以“B”开头的,长度不定的品牌形象维度标签序列。将该序列对应的文本找出,即为模型预测出的描述该品牌形象维度的关键短语。
将所有指定品牌文本的模型输出做完上述处理后,得到品牌形象维度及其对应关键短语列表。
统计各个品牌形象维度中,关键短语列表的长度。长度最大的若干个品牌形象维度,即为大众对指定品牌的品牌形象认识。统计各个品牌形象维度中,关键短语列表中出现频数最多的若干个关键短语,即为指定品牌在该品牌形象维度中,大众的具体描述。
本实施例用于进行上述自动化品牌形象分析的系统,包括:
文件获取模块,用于从公开数据文献中获取训练文本和目标品牌的公开文本;
品牌形象分析模块,通过计算机系统或网络服务器构建的分析模型神经网络结构,包含经过数据训练形成的品牌形象分析模型,用于对获取的目标品牌公开文本进行自动分析,输出模型预测结果;
操作模块,用于输入操作指令,执行系统的设定操作、标注操作、统计分析操作等。
以上仅就本发明较佳的实施例作了说明,但不能理解为是对权利要求的限制。本发明不仅局限于以上实施例,其具体结构允许有变化,总之,凡在本发明独立权利要求的保护范围内所作的各种变化均在本发明的保护范围内。

Claims (10)

1.一种自动化品牌形象分析方法,其特征在于:包括以下步骤:
S001,设定一个品牌形象维度表,该表包含若干个品牌形象维度,一个所述品牌形象维度对应该品牌形象的一个方面。
S002,获取训练文本,对所述训练文本进行标注,得到标注文本。
S003,构建品牌形象分析模型神经网络结构,以步骤S002中所得的标注文本输入到所述品牌形象分析模型神经网络结构中进行训练,得到品牌形象分析模型。
S004,收集目标品牌的公开文本。
S005,模型预测,将上述收集目标品牌的公开文本输入到所述品牌形象分析模型进行预测,得到模型预测结果;所述品牌形象分析模型输出的模型预测结果为一品牌形象维度标签列表,所述列表长度和输入文本字符数一致。
S006,对模型预测结果进行统计分析,得到指定品牌在各个维度的品牌分析结果。
2.根据权利要求1所述的自动化品牌形象分析方法,其特征在于:所述品牌形象维度的数量和方面内容由人为主观设定。
3.根据权利要求1所述的自动化品牌形象分析方法,其特征在于:所述品牌形象维度设定为具有情感倾向性时,则在所述品牌形象维度表中包含该品牌形象维度的正面维度和负面维度。
4.根据权利要求1所述的自动化品牌形象分析方法,其特征在于:步骤S002中包含过滤步骤,对获取的训练文本进行相似过滤操作。
5.根据权利要求1所述的自动化品牌形象分析方法,其特征在于:所述标注为人工标注,采用BIO的序列标注方式,对所述标注文本中最能代表该品牌形象维度的关键短语的全部字符进行标注,所述关键短语开始字符打上“B+品牌形象维度”的标签,其余字符打上“I+品牌形象维度”的标签,若字符没有被打上任何品牌形象维度标签,则打上“O”标签。
6.根据权利要求1所述的自动化品牌形象分析方法,其特征在于:所述品牌形象分析模型神经网络结构以大规模中文预训练模型的Fine-tune方式训练。
7.根据权利要求6所述的自动化品牌形象分析方法,其特征在于:所述大规模中文预训练模型的神经网络输出输入到条件随机场层中,再由条件随机场层的输出预测各个字符的品牌形象维度标签。
8.根据权利要求5所述的自动化品牌形象分析方法,其特征在于:所述S006步骤包括以模型预测结果中连续打上同一个品牌形象维度标签的字符组合成短语,统计各个品牌形象维度中各个词语出现的次数。
9.根据权利要求8所述的自动化品牌形象分析方法,其特征在于:以统计出词语出现最多的若干个品牌形象维度作为目标品牌最突出的品牌形象;单个品牌形象维度中以统计出现最多的若干个词语作为对目标品牌在该品牌形象维度中公众的具体感受。
10.一种自动化品牌形象分析系统,其特征在于:包括:
文件获取模块,用于从公开数据文献中获取训练文本和目标品牌的公开文本;
品牌形象分析模块,通过计算机系统或网络服务器构建的分析模型神经网络结构,包含经过数据训练形成的品牌形象分析模型,用于对获取的目标品牌公开文本进行自动分析,输出模型预测结果;
操作模块,用于输入操作指令,执行系统的设定操作、标注操作、统计分析操作等。
CN202010289857.5A 2020-04-14 2020-04-14 一种自动化品牌形象分析方法和系统 Pending CN111611795A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010289857.5A CN111611795A (zh) 2020-04-14 2020-04-14 一种自动化品牌形象分析方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010289857.5A CN111611795A (zh) 2020-04-14 2020-04-14 一种自动化品牌形象分析方法和系统

Publications (1)

Publication Number Publication Date
CN111611795A true CN111611795A (zh) 2020-09-01

Family

ID=72203726

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010289857.5A Pending CN111611795A (zh) 2020-04-14 2020-04-14 一种自动化品牌形象分析方法和系统

Country Status (1)

Country Link
CN (1) CN111611795A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697232A (zh) * 2018-12-28 2019-04-30 四川新网银行股份有限公司 一种基于深度学习的中文文本情感分析方法
CN109815952A (zh) * 2019-01-24 2019-05-28 珠海市筑巢科技有限公司 品牌名称识别方法、计算机装置及计算机可读存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109697232A (zh) * 2018-12-28 2019-04-30 四川新网银行股份有限公司 一种基于深度学习的中文文本情感分析方法
CN109815952A (zh) * 2019-01-24 2019-05-28 珠海市筑巢科技有限公司 品牌名称识别方法、计算机装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107608956B (zh) 一种基于cnn-grnn的读者情绪分布预测算法
CN107122416B (zh) 一种中文事件抽取方法
CN108073568B (zh) 关键词提取方法和装置
CN108614875B (zh) 基于全局平均池化卷积神经网络的中文情感倾向性分类方法
CN110020437B (zh) 一种视频和弹幕相结合的情感分析及可视化方法
CN105279495B (zh) 一种基于深度学习和文本总结的视频描述方法
CN105260356B (zh) 基于多任务学习的中文交互文本情感与话题识别方法
CN109862397B (zh) 一种视频分析方法、装置、设备和存储介质
CN108845988B (zh) 一种实体识别方法、装置、设备及计算机可读存储介质
CN111159414B (zh) 文本分类方法及系统、电子设备、计算机可读存储介质
CN107239564B (zh) 一种基于监督主题模型的文本标签推荐方法
CN110807314A (zh) 文本情感分析模型训练方法、装置、设备及可读存储介质
CN109766435A (zh) 弹幕类别识别方法、装置、设备及存储介质
CN109359296B (zh) 舆情情感识别方法、装置及计算机可读存储介质
CN110910175A (zh) 一种旅游门票产品画像生成方法
CN111160034B (zh) 一种实体词的标注方法、装置、存储介质及设备
CN112182237A (zh) 题目知识点关联方法、题目知识点关联系统和存储介质
CN113342942B (zh) 语料自动化获取方法、装置、计算机设备及存储介质
CN110688471A (zh) 训练样本获取方法、装置及设备
CN112995690B (zh) 直播内容品类识别方法、装置、电子设备和可读存储介质
CN107783958B (zh) 一种目标语句识别方法及装置
CN110472231B (zh) 一种识别法律文书案由的方法和装置
CN115906835B (zh) 一种基于聚类和对比学习的中文问句文本表示学习的方法
CN110750712A (zh) 基于数据驱动的软件安全需求推荐方法
CN111611795A (zh) 一种自动化品牌形象分析方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination