CN104063479A - 一种基于社会网络的品牌网络热度计算方法 - Google Patents

一种基于社会网络的品牌网络热度计算方法 Download PDF

Info

Publication number
CN104063479A
CN104063479A CN201410311999.1A CN201410311999A CN104063479A CN 104063479 A CN104063479 A CN 104063479A CN 201410311999 A CN201410311999 A CN 201410311999A CN 104063479 A CN104063479 A CN 104063479A
Authority
CN
China
Prior art keywords
brand
network
comment
node
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410311999.1A
Other languages
English (en)
Other versions
CN104063479B (zh
Inventor
曾途
周涛
夏虎
高辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Business Big Data Technology Co Ltd
Original Assignee
Chengdu Business Big Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Business Big Data Technology Co Ltd filed Critical Chengdu Business Big Data Technology Co Ltd
Priority to CN201410311999.1A priority Critical patent/CN104063479B/zh
Publication of CN104063479A publication Critical patent/CN104063479A/zh
Application granted granted Critical
Publication of CN104063479B publication Critical patent/CN104063479B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于社会网络的品牌网络热度计算方法,首先通过微博用户对相关品牌的评论信息建立与品牌相关的社会网络,再根据所建立的社会网络的情况分析计算相关品牌的网络热度情况。本发明基于社会网络的品牌网络热度获取方法在建立品牌社会网络时,使用LDA模型计算品牌相似度,该方法在计算相似度时,将文字背后的语义关联也考虑在内,提高了社会网络建立的准确性。在计算品牌的网络热度时所使用的Cluster Rank算法不仅仅以当前节点和他的相邻节点影响力为依据,同时以节点的集聚系数为依据,提高了品牌网络热度的计算准确性。

Description

一种基于社会网络的品牌网络热度计算方法
技术领域
本发明属于互联网技术领域,更为具体地讲,涉及一种基于社会网络的品牌网络热度计算方法
背景技术
随着互联网的迅速发展,网络媒体也相应的发展迅速,而相关的评论也随之表现出新的特质和发展空间。随着互联网技术的日益普及,越来越多的网友习惯于在网络上发表自己对各种新闻信息的看法和见解。这些看法和见解常常以帖子、评论、网络日志等形式出现于网络,当下各新闻网站纷纷设立了专门的网络评论栏目,搜集各路网友的网络评论文字,及时整合后发出自己的声音,成为重要的舆论导向工具。
目前评价网络中相关信息的网络热度的方法是:利用传统的人工方法,通过各大搜索引擎观察其涉及或者相关链接的点击转载情况做出汇总统计。
我们发现现有的方法虽然比较普遍,但至少有如下缺点:耗时较长且效率低,数据统计不准确。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于社会网络的品牌网络热度计算方法,以提高计算效率和数据统计的准确性。
为实现上述发明目的,本发明基于社会网络的品牌网络热度计算方法,其特征在于,包括以下步骤:
(1)、通过网络爬虫技术获取微博用户关于品牌的评论,即包括各个品牌信息的用户评论;
(2)、根据步骤(1)中获取的评论应用LDA模型计算评论中所涉及品牌之间的相似度;
(3)、将各个品牌对应为社会网络中的各个节点,根据步骤2中得到的品牌相似度当且仅当品牌之间相似度超过所设定的阈值时,将社会网络中对应两个节点进行连边,构成关于品牌的社会网络;
(4)、根据步骤(3)中得到的社会网络,利用计算Cluster Rank的方法计算该网络中各个节点所对应品牌的网络热度。
作为进一步的改进,步骤(2)中提到根据微博用户评论的内容计算品牌相似度,步骤如下:
2.1)、对微博用户的评论使用LDA提取评论主题和评论关键词,并由此得到品牌评论关键词的概率矩阵;
2.2)、根据2.1)中的概率矩阵可以计算得到品牌相似度。
作为进一步的改进,步骤(4)中提到利用计算Cluster Rank的方法计算社会网络中品牌的网络热度,其步骤如下:
4.1)、由步骤3中构建的社会网络,利用Cluster Rank方法计算社会网络中品牌的网络热度si,网络热度计算方法如下:
s i = f ( c i ) Σ j ∈ τ i ( k j + 1 )
其中,f(ci)表示i节点在局部聚类中的影响力,此处f(ci)定义如下:
f ( c i ) = 10 - c i
其中ci的定义如下:
c i = | { e jk | j , k ∈ τ i } | k i ( k i - 1 )
其中ki表示节点i的度,即节点i的相邻节点的个数,τi表示节点i的相邻节点的集合,|{ejk|j,k∈τi}|表示i的相邻节点间的连边数,当ki≤1时,令ci=0。
本发明的目的是这样实现的:
本发明基于社会网络的品牌网络热度计算方法是一种基于微博用户对相关品牌的评价为依据的品牌网络热度计算方法,首先通过微博用户对相关品牌的评论信息建立与品牌相关的社会网络,再根据所建立的社会网络的情况分析计算相关品牌的网络热度情况。
本发明基于社会网络的品牌网络热度计算方法在建立品牌社会网络时,使用LDA模型计算品牌相似度,该方法在计算相似度时,将文字背后的语义关联也考虑在内,提高了社会网络建立的准确性。在计算品牌的网络热度时所使用的Cluster Rank算法不仅仅以当前节点和他的相邻节点影响力为依据,同时以节点的集聚系数为依据,提高了品牌网络热度的计算准确性。
附图说明
图1是本发明基于社会网络的品牌网络热度计算方法一种具体实施方式流程图;
图2是图1中所述品牌社会网络示意图;
图3是品牌评论关键词概率矩阵图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
本发明涉及一种基于社会网络的品牌网络热度计算方法,包括以下几个部分:数据采集单元,对互联网上和品牌网络热度相关的数据进行采集;社会网络构建单元,根据数据采集单元获取的数据建立互联网中品牌相似度相关的社会网络;品牌网络热度计算单元,根据社会网络构建单元建立的社会网络计算该社会网络中品牌的网络热度。其步骤如下:
S1.通过网络爬虫技术获取微博用户关于品牌的评论,即包括品牌信息的用户评论;
S2.根据S1中获取的评论应用LDA模型计算评论中所涉及品牌之间的相似度;
S3.根据S2中得到的品牌相似度建立品牌网络图,设定品牌相似度阈值,保留品牌网络图中相似度大于设定的品牌相似度阈值的边,此处设定为0.2,构成关于品牌的社会网络,如附图2所示;
S4.根据S3中得到的社会网络,利用计算Cluster Rank方法计算该网络中品牌的网络热度。
S2中提到根据微博用户评论的内容判定品牌相似度,步骤如下:
S21.对微博用户的评论使用LDA提取评论主题和评论关键词,并由此得到品牌评论关键词的概率矩阵,矩阵如附图3所示。
S22.根据2.1中的概率矩阵可以计算得到品牌相似度;
计算相似度的方法如下:
品牌A的概率矩阵为SA,品牌B的概率矩阵为SB,将SA和SB分别转换为一维向量rA和rB,则品牌A和品牌B的品牌相似度simAB为:
sim AB = r A · r B r A · r A * r B · r B - - - ( 1 )
S4中提到利用Cluster Rank算法计算社会网络中品牌的网络热度,其步骤如下:
S41.由S3中构建的社会网络,利用计算Cluster Rank方法计算社会网络中品牌的网络热度si,网络热度计算的方法如下:
s i = f ( c i ) Σ j ∈ τ i ( k j + 1 ) - - - ( 2 )
其中,f(ci)表示i节点在局部聚类中的影响力,此处f(ci)定义如下:
f ( c i ) = 10 - c i - - - ( 3 )
其中ci的定义如下:
c i = | { e jk | j , k ∈ τ i } | k i ( k i - 1 ) - - - ( 4 )
其中ki表示节点i的度,即节点i的相邻节点的个数,τi表示节点i的相邻节点的集合,{ejk|j,k∈τi}表示i的相邻节点间的连边数,当ki≤1时,令ci=0。
针对附图2中的品牌0和品牌37,利用公式4可得c0=0.4,c37=0.2;将c0和c37带入公式2计算可得,计算结果中s37>s0,因此对应品牌37的网络热度高于品牌0的网络热度。虽然品牌0与品牌37的度相同,但是品牌37的相邻节点连接到非品牌37的相邻节点的概率大于品牌0的相邻节点连接到非品牌0的相邻节点的概率,也就是品牌37节点的向外扩散的可能性高于品牌0的节点,因此,本方法的品牌网络热度计算比较准确。。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (3)

1.一种基于社会网络的品牌网络热度计算方法,其特征在于,包括以下步骤:
(1)、通过网络爬虫技术获取微博用户关于品牌的评论,即包括各个品牌信息的用户评论;
(2)、根据步骤(1)中获取的评论应用LDA模型计算评论中所涉及品牌之间的相似度;
(3)、将各个品牌对应为社会网络中的各个节点,根据步骤2中得到的品牌相似度当且仅当品牌之间相似度超过所设定的阈值时,将社会网络中对应两个节点进行连边,构成关于品牌的社会网络;
(4)、根据步骤(3)中得到的社会网络,利用计算Cluster Rank的方法计算该网络中各个节点所对应品牌的网络热度。
2.根据权利要求1所述的基于社会网络的品牌网络热度计算方法,其特征在于,步骤(2)中提到根据微博用户评论的内容计算品牌相似度,步骤如下:
2.1)、对微博用户的评论使用LDA提取评论主题和评论关键词,并由此得到品牌评论关键词的概率矩阵;
2.2)、根据2.1)中的概率矩阵可以计算得到品牌相似度。
3.根据权利要求1所述的基于社会网络的品牌网络热度计算方法,其特征在于,步骤(4)中所述的利用计算Cluster Rank的方法计算社会网络中品牌的网络热度,其步骤如下:
4.1)、由步骤3中构建的社会网络,利用Cluster Rank方法计算社会网络中品牌的网络热度si,网络热度计算方法如下:
s i = f ( c i ) Σ j ∈ τ i ( k j + 1 )
其中,此处f(ci)定义如下:
f ( c i ) = 10 - c i
其中ci的定义如下:
c i = | { e jk | j , k ∈ τ i } | k i ( k i - 1 )
其中ki表示节点i的度,即节点i的相邻节点的个数,τi表示节点i的相邻节点的集合,|{ejk|j,k∈τi}|表示i的相邻节点间的连边数,当ki≤1时,令ci=0。
CN201410311999.1A 2014-07-02 2014-07-02 一种基于社会网络的品牌网络热度计算方法 Active CN104063479B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410311999.1A CN104063479B (zh) 2014-07-02 2014-07-02 一种基于社会网络的品牌网络热度计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410311999.1A CN104063479B (zh) 2014-07-02 2014-07-02 一种基于社会网络的品牌网络热度计算方法

Publications (2)

Publication Number Publication Date
CN104063479A true CN104063479A (zh) 2014-09-24
CN104063479B CN104063479B (zh) 2017-08-11

Family

ID=51551193

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410311999.1A Active CN104063479B (zh) 2014-07-02 2014-07-02 一种基于社会网络的品牌网络热度计算方法

Country Status (1)

Country Link
CN (1) CN104063479B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989143A (zh) * 2015-02-28 2016-10-05 科大讯飞股份有限公司 网络实体热度分析方法及系统
CN106485507A (zh) * 2015-09-01 2017-03-08 阿里巴巴集团控股有限公司 一种软件推广作弊的检测方法、装置及系统
CN107861945A (zh) * 2017-11-01 2018-03-30 平安科技(深圳)有限公司 金融数据分析方法、应用服务器及计算机可读存储介质
CN113254747A (zh) * 2021-06-09 2021-08-13 南京北斗创新应用科技研究院有限公司 基于分布式网络爬虫的地理空间数据获取系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980199A (zh) * 2010-10-28 2011-02-23 北京交通大学 基于态势评估的网络热点话题发现方法及系统
US20140089323A1 (en) * 2012-09-21 2014-03-27 Appinions Inc. System and method for generating influencer scores
CN103745000A (zh) * 2014-01-24 2014-04-23 福州大学 一种中文微博客的热点话题检测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101980199A (zh) * 2010-10-28 2011-02-23 北京交通大学 基于态势评估的网络热点话题发现方法及系统
US20140089323A1 (en) * 2012-09-21 2014-03-27 Appinions Inc. System and method for generating influencer scores
CN103745000A (zh) * 2014-01-24 2014-04-23 福州大学 一种中文微博客的热点话题检测方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105989143A (zh) * 2015-02-28 2016-10-05 科大讯飞股份有限公司 网络实体热度分析方法及系统
CN105989143B (zh) * 2015-02-28 2019-09-03 科大讯飞股份有限公司 网络实体热度分析方法及系统
CN106485507A (zh) * 2015-09-01 2017-03-08 阿里巴巴集团控股有限公司 一种软件推广作弊的检测方法、装置及系统
CN106485507B (zh) * 2015-09-01 2019-10-18 阿里巴巴集团控股有限公司 一种软件推广作弊的检测方法、装置及系统
CN107861945A (zh) * 2017-11-01 2018-03-30 平安科技(深圳)有限公司 金融数据分析方法、应用服务器及计算机可读存储介质
CN113254747A (zh) * 2021-06-09 2021-08-13 南京北斗创新应用科技研究院有限公司 基于分布式网络爬虫的地理空间数据获取系统及方法
CN113254747B (zh) * 2021-06-09 2021-10-15 南京北斗创新应用科技研究院有限公司 基于分布式网络爬虫的地理空间数据获取系统及方法

Also Published As

Publication number Publication date
CN104063479B (zh) 2017-08-11

Similar Documents

Publication Publication Date Title
CN103092911B (zh) 一种融合社会标签相似度基于k近邻的协同过滤推荐系统
US10216724B2 (en) Performing semantic analyses of user-generated textual and voice content
CN102214241B (zh) 一种基于图聚类的用户生成文本流中的突发话题检测方法
CN105260474A (zh) 一种基于信息交互网络的微博用户影响力计算方法
CN104268271A (zh) 一种兴趣和网络结构双内聚的社交网络社区发现方法
CN104008109A (zh) 基于用户兴趣的Web信息推送服务系统
CN102346766A (zh) 基于极大团发现的网络热点话题检测方法及装置
CN106484764A (zh) 基于人群画像技术的用户相似度计算方法
CN105045931A (zh) 一种基于Web挖掘的视频推荐方法和系统
CN104268230B (zh) 一种基于异质图随机游走的中文微博客观点探测方法
CN103559197A (zh) 基于上下文预过滤的实时音乐推荐方法
CN102622396A (zh) 一种基于标签的web服务聚类方法
CN102750336A (zh) 一种基于用户关联性的资源个性化推荐方法
CN104063479A (zh) 一种基于社会网络的品牌网络热度计算方法
CN102262681A (zh) 一种博客信息传播中识别关键博客集的方法
CN105389329A (zh) 一种基于群体评论的开源软件推荐方法
CN104537096A (zh) 一种基于微博消息传播树的微博消息影响力度量方法
CN104133897A (zh) 一种基于话题影响力的微博话题溯源方法
CN104615627A (zh) 一种基于微博平台的事件舆情信息提取方法及系统
CN105653640A (zh) 一种基于信任机制的协同过滤推荐方法
US9268861B2 (en) Method and system for recommending relevant web content to second screen application users
CN104765882A (zh) 一种基于网页特征字符串的互联网网站统计方法
CN104199838A (zh) 一种基于标签消歧的用户模型建构方法
CN104156431A (zh) 一种基于实体图社团结构的rdf关键词查询方法
JP2012008900A (ja) 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Brand network popularity computing method based on social network

Effective date of registration: 20200608

Granted publication date: 20170811

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2020980002850

PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20200701

Granted publication date: 20170811

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2020980002850

PC01 Cancellation of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: Brand network popularity computing method based on social network

Effective date of registration: 20200722

Granted publication date: 20170811

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2020980004255

PC01 Cancellation of the registration of the contract for pledge of patent right
PC01 Cancellation of the registration of the contract for pledge of patent right

Date of cancellation: 20210812

Granted publication date: 20170811

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2020980004255

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A brand network heat calculation method based on social network

Effective date of registration: 20210818

Granted publication date: 20170811

Pledgee: The Agricultural Bank of Chengdu branch of Limited by Share Ltd. Chinese Sichuan

Pledgor: CHENGDU BUSINESS BIG DATA TECHNOLOGY Co.,Ltd.

Registration number: Y2021980007811

PP01 Preservation of patent right
PP01 Preservation of patent right

Effective date of registration: 20240428

Granted publication date: 20170811