CN112084324A - 基于bert和dnn模型的交通社交媒体数据处理方法 - Google Patents
基于bert和dnn模型的交通社交媒体数据处理方法 Download PDFInfo
- Publication number
- CN112084324A CN112084324A CN202010798461.3A CN202010798461A CN112084324A CN 112084324 A CN112084324 A CN 112084324A CN 202010798461 A CN202010798461 A CN 202010798461A CN 112084324 A CN112084324 A CN 112084324A
- Authority
- CN
- China
- Prior art keywords
- social media
- media data
- traffic
- bert
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000004458 analytical method Methods 0.000 claims abstract description 28
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims description 16
- 238000012795 verification Methods 0.000 claims description 11
- 238000012360 testing method Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010845 search algorithm Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims 4
- 238000012217 deletion Methods 0.000 claims 1
- 230000037430 deletion Effects 0.000 claims 1
- 238000007405 data analysis Methods 0.000 abstract description 4
- 238000011160 research Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 210000002569 neuron Anatomy 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0125—Traffic data processing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于BERT和DNN模型的交通社交媒体数据处理方法,具体包括以下步骤:步骤S1:获取交通领域的社交媒体数据或与交通相关的社交媒体数据,并对交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理;步骤S2:调整BERT模型和DNN模型;步骤S3:通过调整后的BERT模型和DNN模型构建分析框架,根据分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。与现有技术相比,本发明具有提高社交媒体数据分析的效率和准确度等优点。
Description
技术领域
本发明涉及交通数据分析领域,尤其是涉及一种基于BERT和DNN模型的交通社交媒体数据处理方法。
背景技术
社交媒体数据作为目前主要的数据来源之一,提供了新角度的用户信息和新方向的分析视角。与传统的统计数据相比较,社交媒体数据为各个领域提供了用户主观的数据信息,同时社交媒体平台的特性使得所获取到的社交媒体数据可以涵盖极大的用户规模和范围,包含多种用户类型和社会关系,动态更新的社交媒体数据还具有很好的时效性,这些都是传统调查统计手段及其获取的数据所无法比拟的。
社交媒体数据在交通领域的应用是较新的尝试,近年来,主要包括关于出行需求模型的研究、关于集计出行行为的研究、关于个人出行行为的研究、关于公共交通的评估研究、关于交通情况的研究以及关于自然灾害下交通系统的研究几个方面,在以上研究领域中,针对社交媒体数据的内容分析是研究社交媒体数据的基础技术。
BERT是一种新语言表示模型,具有以下特点:
一、具有Transformer机制,即双向编码器表示机制,与现有的标准语言模型不同,其摒弃了从左至右的单向性模型训练方式,而是结合左右上下文语境共同进行模型的预处理,能够实现这样的预处理功能,是因为BERT模型中的Transformer包含一个encoder机制,采用一次性读取整个文本序列的方式,使得模型可以基于每个词组的两侧进行学习;
二、仅需一个输出层就可以对预处理后的模型进行微调,对于语言环境丰富、表述方式丰富的公共交通舆情领域,可以较为轻松地构建适用于不同任务的BERT模型,而不需要针对具体任务进行大量的模型体系修改。
多层感知机(MLP)也被称为全连接神经网络(DNN),其工作机制模拟了生物大脑。感知机只有输入层和输出层,没有隐藏层,其学习能力较弱,无法完成线性不可分的任务,但多层感知机中某个神经元节点的值受其他多个神经元节点的影响。在多层感知机中,神经元节点被分成不同的层,包括输出层、以及若干个隐藏层组成,隐藏层越多,模型复杂度越高,也越能拟合更加复杂的分布。
发明内容
本发明的目的就是为了克服上述现有技术存在的社交媒体数据分析的效率和准确度较低、不适用于复杂分布的缺陷而提供一种基于BERT和DNN模型的交通社交媒体数据处理方法。
本发明的目的可以通过以下技术方案来实现:
一种基于BERT和DNN模型的交通社交媒体数据处理方法,具体包括以下步骤:
步骤S1:获取交通领域的社交媒体数据或与交通相关的社交媒体数据,并对所述交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理;
步骤S2:调整BERT模型和DNN模型;
步骤S3:通过调整后的所述BERT模型和DNN模型构建分析框架,根据所述分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。
所述交通领域的社交媒体数据或与交通相关的社交媒体数据具体为从社交媒体平台上获取的基于交通领域的交通社交媒体数据。
所述数据预处理的操作包括删除无用字符、文本向量化、数据过滤和数据特征提取。
进一步地,所述数据过滤的公式具体如下:
其中,similarity为过滤后的交通领域的社交媒体数据或与交通相关的社交媒体数据,tar_vec为与交通领域相关的文本对应的向量,ori_vec为与要过滤的文本对应的向量。
进一步地,所述数据特征提取的公式具体如下:
其中,Content_feature是数据特征,n是输入文本数据的字符数,word_veci是输入中的第i个特征字符对应的特征向量。
每个特征字符对应的是1*768维度的特征向量。
所述删除无用字符的过程包括通过编写正则表达式来匹配和消除html标记元素、特殊符号或多余字符。
所述文本向量化的过程包括通过word2vec对获取的所述交通领域的社交媒体数据或与交通相关的社交媒体数据进行文本向量化。
所述步骤S2中对BERT模型进行调整的过程具体为:
步骤S201:根据设定的训练集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为训练数据集,对BERT模型进行训练;
步骤S202:根据设定的验证集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为验证数据集,在训练模型的过程中对模型的性能进行验证;
步骤S203:根据设定的测试集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为测试数据集,在模型调整完毕后对调整后的BERT模型进行测试。
所述步骤S2中对DNN模型进行调整的过程具体包括超参数调优和模型内部结构调优。
进一步地,所述超参数调优的过程包括确定初始参数和确定网络结构。
所述初始参数通过全局优化法进行选取,所述网络结构通过设置网络结构隐藏层的个数以及每个隐层的节点个数进行确定,并且通过dropout方法避免DNN模型过度拟合。
进一步地,所述超参数调优的最优超参数通过网格搜索算法进行确定,所述网格搜索算法的具体过程为穷举所有指定参数的候选值的组合,然后遍历所有组合作为超参数取值,生成相应模型在训练集上进行训练,通过评估指标评估模型在验证集上的预测效果,其中在验证集上预测效果最好的模型对应的超参数取值即为最终的最优超参数。
进一步地,所述模型内部结构调优的过程具体为选择一个初始点进行迭代,在迭代过程中决定梯度下降的方向,根据梯度下降的方向最终确定权重参数的数值。
所述分析框架为双层分析框架,第一层级为粗粒度内容分析框架,分析输出模型的标签值;第二层级为细粒度内容分析框架,对标签值的内容进行细化。
与现有技术相比,本发明具有以下有益效果:
1.本发明通过BERT模型和DNN模型对交通社交媒体数据进行内容分析,对社交媒体数据的文本内容进行过滤并提取特征向量,有效提升了对社交媒体数据分析的效率和准确度。
2.本发明实用性强,通过对交通领域社交媒体数据进行内容分析,可以有效获知出行者对于交通服务品质的主观评价,促进交通领域服务品质升级。
3.本发明应用性广,获取的社交媒体数据覆盖交通的多个领域、时间和事件,针对多样的需求选取数据进行分析。
4.本发明节约成本,利用数据和模型,相比于传统的交通调查获取数据,无需其他人工调查和硬件设施。
附图说明
图1为本发明的流程示意图;
图2为本发明实施例一的社交媒体数据的内容反馈的时间变化图;
图3为本发明实施例一的粗粒度分析层面结果饼图;
图4为本发明实施例一的细粒度分析层面结果饼图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例一
如图1所示,一种基于BERT和DNN模型的交通社交媒体数据处理方法,具体包括以下步骤:
步骤S1:获取交通领域的社交媒体数据或与交通相关的社交媒体数据,并对交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理;
步骤S2:调整BERT模型和DNN模型;
步骤S3:通过调整后的BERT模型和DNN模型构建分析框架,根据分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。
交通领域的社交媒体数据或与交通相关的社交媒体数据具体为从社交媒体平台上获取的基于交通领域的交通社交媒体数据,本实施例中具体为深圳地铁提价事件有关的社交媒体数据,观测数据的时间范围为2019年1月1日至2019年4月1日。
数据预处理的操作包括删除无用字符、文本向量化、数据过滤和数据特征提取。
数据过滤的公式具体如下:
其中,similarity为过滤后的交通领域的社交媒体数据或与交通相关的社交媒体数据,tar_vec为与交通领域相关的文本对应的向量,ori_vec为与要过滤的文本对应的向量。
数据特征提取的公式具体如下:
其中,Content_feature是数据特征,n是输入文本数据的字符数,word_veci是输入中的第i个特征字符对应的特征向量。
每个特征字符对应的是1*768维度的特征向量。
删除无用字符的过程包括通过编写正则表达式来匹配和消除html标记元素、特殊符号或多余字符。
文本向量化的过程包括通过word2vec对获取的交通领域的社交媒体数据或与交通相关的社交媒体数据进行文本向量化。
步骤S2中对BERT模型进行调整的过程具体为:
步骤S201:根据设定的训练集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为训练数据集,对BERT模型进行训练;
步骤S202:根据设定的验证集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为验证数据集,在训练模型的过程中对模型的性能进行验证;
步骤S203:根据设定的测试集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为测试数据集,在模型调整完毕后对调整后的BERT模型进行测试。
步骤S2中对DNN模型进行调整的过程具体包括超参数调优和模型内部结构调优。
训练集比例为70%,验证集比例为20%,测试集比例为10%。
超参数调优的过程包括确定初始参数和确定网络结构。
初始参数通过全局优化法进行选取,网络结构通过设置网络结构的隐藏层的个数以及每个隐层的节点个数进行确定,本实施例中隐藏层的个数为10个,并且通过dropout方法避免DNN模型过度拟合。
超参数调优的最优超参数通过网格搜索算法进行确定,网格搜索算法的具体过程为穷举所有指定参数的候选值的组合,然后遍历所有组合作为超参数取值,生成相应模型在训练集上进行训练,通过评估指标评估模型在验证集上的预测效果,其中在验证集上预测效果最好的模型对应的超参数取值即为最终的最优超参数。
模型内部结构调优的过程具体为选择一个初始点进行迭代,在迭代过程中决定梯度下降的方向,根据梯度下降的方向最终确定权重参数的数值。
步骤S3中对交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析如图2所示,包括安全、便捷、舒适和经济共4个标签值。
分析框架为双层分析框架,第一层级为粗粒度内容分析框架,分析输出模型的标签值,如图3所示,可负担性在交通社交媒体数据中的占比最多,达到92.51%;第二层级为细粒度内容分析框架,对标签值的内容进行细化,如图4所示,可负担性的细粒度分析显示,对于地铁涨价,抱怨乘坐地铁的价格的相关交通社交媒体数据的占比达到93.54%,关于价格折扣的相关交通社交媒体数据的占比为6.46%。
此外,需要说明的是,本说明书中所描述的具体实施例子,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。
Claims (10)
1.一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,具体包括以下步骤:
步骤S1:获取交通领域的社交媒体数据或与交通相关的社交媒体数据,并对所述交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理;
步骤S2:调整BERT模型和DNN模型;
步骤S3:通过调整后的所述BERT模型和DNN模型构建分析框架,根据所述分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。
2.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述交通领域的社交媒体数据或与交通相关的社交媒体数据具体为从社交媒体平台上获取的基于交通领域的交通社交媒体数据。
3.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述数据预处理的操作包括删除无用字符、文本向量化、数据过滤和数据特征提取。
6.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述步骤S2中对BERT模型进行调整的过程具体为:
步骤S201:根据设定的训练集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为训练数据集,对BERT模型进行训练;
步骤S202:根据设定的验证集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为验证数据集,在训练模型的过程中对模型的性能进行验证;
步骤S203:根据设定的测试集比例从交通领域的社交媒体数据或与交通相关的社交媒体数据中选取相应比例的交通领域的社交媒体数据或与交通相关的社交媒体数据作为测试数据集,在模型调整完毕后对调整后的BERT模型进行测试。
7.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述步骤S2中对DNN模型进行调整的过程具体包括超参数调优和模型内部结构调优。
8.根据权利要求7所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述超参数调优的过程包括确定初始参数和确定网络结构。
9.根据权利要求8所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述超参数调优的最优超参数通过网格搜索算法进行确定。
10.根据权利要求7所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法,其特征在于,所述模型内部结构调优的过程具体为选择一个初始点进行迭代,在迭代过程中决定梯度下降的方向,根据梯度下降的方向最终确定权重参数的数值大小。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010798461.3A CN112084324B (zh) | 2020-08-11 | 2020-08-11 | 基于bert和dnn模型的交通社交媒体数据处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010798461.3A CN112084324B (zh) | 2020-08-11 | 2020-08-11 | 基于bert和dnn模型的交通社交媒体数据处理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112084324A true CN112084324A (zh) | 2020-12-15 |
CN112084324B CN112084324B (zh) | 2024-06-04 |
Family
ID=73734944
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010798461.3A Active CN112084324B (zh) | 2020-08-11 | 2020-08-11 | 基于bert和dnn模型的交通社交媒体数据处理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084324B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140040371A1 (en) * | 2009-12-01 | 2014-02-06 | Topsy Labs, Inc. | Systems and methods for identifying geographic locations of social media content collected over social networks |
US20170243120A1 (en) * | 2016-02-23 | 2017-08-24 | Salesforce.Com, Inc. | Data analytics systems and methods with personalized sentiment models |
CN107437100A (zh) * | 2017-08-08 | 2017-12-05 | 重庆邮电大学 | 一种基于跨模态关联学习的图像位置预测方法 |
US20170372206A1 (en) * | 2016-06-23 | 2017-12-28 | Tata Consultancy Services Limited | Systems and methods for predicting gender and age of users based on social media data |
CN107577702A (zh) * | 2017-07-28 | 2018-01-12 | 中南大学 | 一种社交媒体中交通信息的辨别方法 |
CN108399575A (zh) * | 2018-01-24 | 2018-08-14 | 大连理工大学 | 一种基于社交媒体文本的大五人格预测方法 |
CN110322263A (zh) * | 2018-03-30 | 2019-10-11 | 香港纺织及成衣研发中心有限公司 | 基于机器学习的服装销售的预测方法和预测装置 |
WO2020000847A1 (zh) * | 2018-06-25 | 2020-01-02 | 中译语通科技股份有限公司 | 一种基于新闻大数据的恐慌指数监测分析方法及系统 |
CN110781393A (zh) * | 2019-10-23 | 2020-02-11 | 中南大学 | 基于图模型和膨胀卷积神经网络的交通事件要素抽取算法 |
CN110969836A (zh) * | 2018-09-28 | 2020-04-07 | 广州威阿科技有限公司 | 基于网络大数据的路况实时分析系统 |
CN110990676A (zh) * | 2019-11-28 | 2020-04-10 | 福建亿榕信息技术有限公司 | 一种社交媒体热点主题提取方法与系统 |
-
2020
- 2020-08-11 CN CN202010798461.3A patent/CN112084324B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140040371A1 (en) * | 2009-12-01 | 2014-02-06 | Topsy Labs, Inc. | Systems and methods for identifying geographic locations of social media content collected over social networks |
US20170243120A1 (en) * | 2016-02-23 | 2017-08-24 | Salesforce.Com, Inc. | Data analytics systems and methods with personalized sentiment models |
US20170372206A1 (en) * | 2016-06-23 | 2017-12-28 | Tata Consultancy Services Limited | Systems and methods for predicting gender and age of users based on social media data |
CN107577702A (zh) * | 2017-07-28 | 2018-01-12 | 中南大学 | 一种社交媒体中交通信息的辨别方法 |
CN107437100A (zh) * | 2017-08-08 | 2017-12-05 | 重庆邮电大学 | 一种基于跨模态关联学习的图像位置预测方法 |
CN108399575A (zh) * | 2018-01-24 | 2018-08-14 | 大连理工大学 | 一种基于社交媒体文本的大五人格预测方法 |
CN110322263A (zh) * | 2018-03-30 | 2019-10-11 | 香港纺织及成衣研发中心有限公司 | 基于机器学习的服装销售的预测方法和预测装置 |
WO2020000847A1 (zh) * | 2018-06-25 | 2020-01-02 | 中译语通科技股份有限公司 | 一种基于新闻大数据的恐慌指数监测分析方法及系统 |
CN110969836A (zh) * | 2018-09-28 | 2020-04-07 | 广州威阿科技有限公司 | 基于网络大数据的路况实时分析系统 |
CN110781393A (zh) * | 2019-10-23 | 2020-02-11 | 中南大学 | 基于图模型和膨胀卷积神经网络的交通事件要素抽取算法 |
CN110990676A (zh) * | 2019-11-28 | 2020-04-10 | 福建亿榕信息技术有限公司 | 一种社交媒体热点主题提取方法与系统 |
Non-Patent Citations (2)
Title |
---|
于营;: "基于Twitter数据的文本情感分析研究", 信息与电脑(理论版), no. 19 * |
蓝娅萍;: "信息生态理论视角下移动社交媒体使用行为生命周期画像研究", 情报探索, no. 12 * |
Also Published As
Publication number | Publication date |
---|---|
CN112084324B (zh) | 2024-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | A feature selection and multi-model fusion-based approach of predicting air quality | |
Yu et al. | Prediction of highway tunnel pavement performance based on digital twin and multiple time series stacking | |
CN104318340B (zh) | 基于文本履历信息的信息可视化方法及智能可视分析系统 | |
CN109284506A (zh) | 一种基于注意力卷积神经网络的用户评论情感分析系统及方法 | |
CN109034448A (zh) | 基于车辆轨迹语义分析和深度信念网络的轨迹预测方法 | |
CN111709575A (zh) | 基于c-lstm的学业成绩预测方法 | |
CN109189862A (zh) | 一种面向科技情报分析的知识库构建方法 | |
CN110362797B (zh) | 一种研究报告生成方法及相关设备 | |
CN110413768A (zh) | 一种文章题目自动生成方法 | |
CN112232483A (zh) | 一种结合cnn和lstm的航班平均票价预测方法 | |
Peng et al. | A forecast model of tourism demand driven by social network data | |
CN116257759A (zh) | 一种深度神经网络模型的结构化数据智能分类分级系统 | |
CN115391553A (zh) | 一种自动搜索时序知识图谱补全模型的方法 | |
CN113920379A (zh) | 一种基于知识辅助的零样本图像分类方法 | |
CN111141879A (zh) | 一种深度学习的空气质量监测方法以及装置、设备 | |
Jiang et al. | Learning social meta-knowledge for nowcasting human mobility in disaster | |
CN110019796A (zh) | 一种用户文本信息分析方法及装置 | |
Lukauskas et al. | Economic activity forecasting based on the sentiment analysis of news | |
CN112885378B (zh) | 一种语音情感识别方法、装置及存储介质 | |
Chen et al. | Application of Improved Algorithm Based on Four‐Dimensional ResNet in Rural Tourism Passenger Flow Prediction | |
Yang et al. | A novel PM2. 5 concentrations probability density prediction model combines the least absolute shrinkage and selection operator with quantile regression | |
CN111966828B (zh) | 一种基于文本上下文结构和属性信息叠加网络的报刊新闻分类方法 | |
CN111538849B (zh) | 一种基于深度学习的人物关系图谱构建方法及系统 | |
CN117390198A (zh) | 构建电力领域科技知识图谱的方法、装置、设备及介质 | |
CN112084324B (zh) | 基于bert和dnn模型的交通社交媒体数据处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |