CN108345662A - 一种考虑用户分布区域差异的签到微博数据加权统计方法 - Google Patents

一种考虑用户分布区域差异的签到微博数据加权统计方法 Download PDF

Info

Publication number
CN108345662A
CN108345662A CN201810101398.6A CN201810101398A CN108345662A CN 108345662 A CN108345662 A CN 108345662A CN 201810101398 A CN201810101398 A CN 201810101398A CN 108345662 A CN108345662 A CN 108345662A
Authority
CN
China
Prior art keywords
registering
formula
microblogging
data
microblog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810101398.6A
Other languages
English (en)
Other versions
CN108345662B (zh
Inventor
梁春阳
林广发
罗尊骅
彭俊超
梁丽娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Normal University
Original Assignee
Fujian Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Normal University filed Critical Fujian Normal University
Priority to CN201810101398.6A priority Critical patent/CN108345662B/zh
Publication of CN108345662A publication Critical patent/CN108345662A/zh
Application granted granted Critical
Publication of CN108345662B publication Critical patent/CN108345662B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/52Network services specially adapted for the location of the user terminal

Abstract

本发明涉及一种考虑用户分布区域差异的签到微博数据加权统计方法。该方法在分析微博用户签到量概率分布规律的基础上,提出了一种基于泊松分布的区域间用户分布差异加权模型;利用微博位置服务接口获取指定区域在某一时间段的签到用户量时间序列值,确定泊松分布的参数并计算出各个区域的相对签到强度权重;在此基础上,进一步计算修正实际签到量的区域差异。本发明方法经实例验证发现,可以明显改进基于微博的舆情分析、事件抽取结果的空间分析精度。

Description

一种考虑用户分布区域差异的签到微博数据加权统计方法
技术领域
本发明涉及计算机应用,应急管理学与地理信息系统等专业领域,更具体地为一种利用加权模型消除微博用户活跃度的地区差异,从而改进基于微博的突发事件抽取、空间统计分析与舆情研判精度的方法,即一种考虑用户分布区域差异的签到微博数据加权统计方法。
背景技术
传统微博是最常见且具有开放性的一种社交媒体,因其用户覆盖范围广、信息量大、获取方法遍历,近年来得到广泛应用。微博文本短小,信息密度大,特别是与基于手机的各种移动定位技术结合起来,在舆情统计分析、用户画像、突发事件跟踪等方面具有巨大的应用价值。与传统的基于行政体系的自下而上的统计方法不同,微博等众包数据以公众参与代替政府主导、以自发报道代替逐级上报、以快速感知代替灾后统计、以广域覆盖代替逐点调查,被称为是突发事件的“传感网络”,或“社会感知”的重要工具。但是,这种数据源也有其自身的缺陷,如信息的真实性问题、专题信息提取的完备性问题、统计区域的代表性问题等等,近年来,许多研究人员针对微博等社交媒体的信息抽取、数据挖掘技术进行研究。
发明内容
本发明的目的在于针对新浪微博区域间用户量的差异对微博签到量统计分析的影响,以签到位置点所在县市级行政单元为基本空间单元,根据每个基本空间单元在指定访问时间段内的用户签到次数来计算其用户分布权重,以此来校正每个空间单元的微博用户的真实签到情况,进而提出一种考虑用户分布区域差异的签到微博数据加权统计方法。
为实现上述目的,本发明的技术方案是:一种考虑用户分布区域差异的签到微博数据加权统计方法,包括如下步骤,
步骤S1、将需要采集的签到位置名称之间以逗号作为分隔符隔开,存为TXT格式文件;对组织好的TXT文件进行读取并将签到位置名称存入数组中;
步骤S2、遍历步骤S1得到的数组并构造相应的HTTP请求,而后以模拟登陆的方式对该URL访问;将返回的HTML数据采用正则表达式匹配签到位置相应的ID,并将其ID存入签到位置ID数组中;
步骤S3、遍历签到位置ID数组并构造相应的HTTP请求并进行访问,将返回的HTML数据采用正则表达式匹配每个签到位置的用户签到次数,将其记为Ni,即签到位置i的签到次数;
步骤S4、当事件发生时,微博社交网络中可能产生了具有相应关键词的微博数据,其中部分微博数据包含了签到地理位置数据;将含有签到地理位置数据的微博出现的集合定义为P(Check_inSet),其公式可以定义为一种联合概率链的形式:
P(Check_inSet)=P(C1)P(C2/C1)......P(Cn/C1,C2...Cn-1) (1)
在该种情况下由于签到位置之间的条件概率难以计算,因此假设签到位置之间相互独立:
P(Check_inSet)=P(C1)P(C2)......P(Cn) (2)
其中P(Ci)即签到位置i的签到概率:
P(Ci)=Ni/T (3)
其中,Ni即由步骤S3得到的第i个签到位置在正常情况下的签到次数,T为所有签到位置签到次数的求和:
现实情况下当事件发生时,微博用户会在相同的位置进行签到,即公式(2)中的P(Ci)各项存在同类项,将这些同类项进行合并得到如下公式:
P(Check_inSet)=P(C1)n1P(C2)n2...P(Ci)ni (5)
再对公式(5)两边取对数进一步化简:
其中,事件相关微博在签到位置i的条数,即该事件在签到位置i的签到量ni;Ln(T/Ni)项将其记为用户分布反权重项。
在本发明一实施例中,该方法还包括如下步骤:
步骤S5、虽然Ni可以由步骤S3直接得到每个签到位置的签到次数,但是存在较大的随机性;为了获得较为可靠的Ni的值,进行了如下步骤的推导;
S5A,微博中存在海量的签到点,即用户在一个签到位置进行签到的概率为一种小概率事件,记为Px,同时微博的用户为较大的群体;该种情况满足泊松过程,其数学形式可以表达为公式7,其概率函数为公式8:
S5B,基于泊松分布对公式(6)中的Ni采用极大似然估计的方法得到该项在统计学意义上的无偏估计值λ:
其中,Ni连续n天的观测序列为{x1,x2,…,xn},其联合概率分布函数为:
步骤S6、将数据采集的结果{x1,x2,x3…,xn}通过公式(9)进行参数估计后,得到每个签到位置的出现概率最大的签到次数,计算Ln(T/Ni)项的值,输出为Excel格式文件,利用常规地理信息系统软件读取属性数据并进行表连接;
步骤S7、通过微博开放平台API或模拟登陆网页爬虫的方式,获取事件特征关键词的相关微博数据,筛选出其中含有签到位置信息的部分,根据指定的空间单元使用R-Tree建立相应的空间索引来加速判断每个空间单元的签到位置个数,完成ni的计算;
步骤S8、将步骤S6中的Ln(T/Ni)项采用公式(6)推导的加权公式对微博签到量ni进行校正。
相较于现有技术,本发明具有以下有益效果:本发明在分析微博用户签到量概率分布规律的基础上,提出了一种基于泊松分布的区域间用户分布差异加权模型,根据从网页实时获取指定签到位置在某一时间段的签到次数时间观测序列值,定义了泊松分布的参数λ的含义,并计算出各个签到位置的相对签到强度权重。以此来消除微博用户的空间异质性,为基于微博的舆情分析和事件抽取的空间分析提高精度。
附图说明
图1自定义空间单元的签到量折线统计图。
图2事件相关的签到点签到量ni与签到点日常状态下签到量Ni的获取方式对比图。
图3本发明总体技术路线。
图4自定义空间单元的用户分布权重。
图5事件相关的签到微博量空间分布图。
图6经加权处理后事件相关的签到数据的空间分布图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
如图3所示,本发明的一种考虑用户分布区域差异的签到微博数据加权统计方法,包括如下步骤,
步骤S1、将需要采集的签到位置名称之间以逗号作为分隔符隔开,存为TXT格式文件;对组织好的TXT文件进行读取并将签到位置名称存入数组中;
步骤S2、遍历步骤S1得到的数组并构造相应的HTTP请求,如:“http://s.weibo.com/apps/+签到位置名称+&page type=poi”,而后以模拟登陆的方式对该URL访问;将返回的HTML数据采用正则表达式匹配签到位置相应的ID,并将其ID存入签到位置ID数组中;
步骤S3、遍历签到位置ID数组并构造相应的HTTP请求并进行访问,格式如:http://weibo/com/p/+ID,将返回的HTML数据采用正则表达式匹配每个签到位置的用户签到次数,将其记为Ni,即签到位置i的签到次数;
步骤S4、当事件发生时,微博社交网络中可能产生了具有相应关键词的微博数据,其中部分微博数据包含了签到地理位置数据;将含有签到地理位置数据的微博出现的集合定义为P(Check_inSet),其公式可以定义为一种联合概率链的形式:
P(Check_inSet)=P(C1)P(C2/C1)......P(Cn/C1,C2...Cn-1) (1)
在该种情况下由于签到位置之间的条件概率难以计算,因此假设签到位置之间相互独立:
P(Check_inSet)=P(C1)P(C2)......P(Cn) (2)
其中P(Ci)即签到位置i的签到概率:
P(Ci)=Ni/T (3)
其中,Ni即由步骤S3得到的第i个签到位置在正常情况下的签到次数,T为所有签到位置签到次数的求和:
现实情况下当事件发生时,微博用户会在相同的位置进行签到,即公式(2)中的P(Ci)各项存在同类项,将这些同类项进行合并得到如下公式:
P(Check_inSet)=P(C1)n1P(C2)n2...P(Ci)ni (5)
再对公式(5)两边取对数进一步化简:
其中,事件相关微博在签到位置i的条数,即该事件在签到位置i的签到量ni;Ln(T/Ni)项将其记为用户分布反权重项;
步骤S5、虽然Ni可以由步骤S3直接得到每个签到位置的签到次数(图1),但是存在较大的随机性;为了获得较为可靠的Ni的值,进行了如下步骤的推导;
S5A,微博中存在海量的签到点,即用户在一个签到位置进行签到的概率为一种小概率事件,记为Px,同时微博的用户为较大的群体;该种情况满足泊松过程,其数学形式可以表达为公式7,其概率函数为公式8:
S5B,基于泊松分布对公式(6)中的Ni采用极大似然估计的方法得到该项在统计学意义上的无偏估计值λ:
其中,Ni连续n天的观测序列为{x1,x2,…,xn},其联合概率分布函数为:
步骤S6、将数据采集的结果{x1,x2,x3…,xn}通过公式(9)进行参数估计后,得到每个签到位置的出现概率最大的签到次数,计算Ln(T/Ni)项的值,输出为Excel格式文件,利用常规地理信息系统软件读取属性数据并进行表连接;
步骤S7、通过微博开放平台API或模拟登陆网页爬虫的方式,获取事件特征关键词的相关微博数据,筛选出其中含有签到位置信息的部分,根据指定的空间单元使用R-Tree建立相应的空间索引来加速判断每个空间单元的签到位置个数,完成ni的计算;
步骤S8、将步骤S6中的Ln(T/Ni)项采用公式(6)推导的加权公式对微博签到量ni进行校正。
特别地,S1中可以设置签到位置名称,并以设置的名称为采集对象获取签到位置i的用户签到次数即Ni项;
特别地,S4假设签到点之间相互独立,并给出了任意一个签到点的签到概率公式记签到点之间的联合概率公式;
特别地,S5中提出对于大量微博用户产生的独立签到事件符合泊松过程的特征,利用极大似然法对泊松分布的λ参数进行无偏估计,推导了签到数据的区域权重计算公式;
特别地,S7中使用R-tree建立相应的空间索引来加速判断每个空间单元的签到点个数,完成ni项的计算;
以下为本发明的具体实施例。
实施案例为2016年登陆厦门的14号台风“莫兰蒂”的相关微博数据。
本发明中所需数据信息描述:为构建签到点名称数组,需要包含签到点名称的TXT格式文件,并通过该TXT文件中的签到点名称得到签到点ID数组,来计算Ni项;具体事件(台风,停电,大雨)等相关签到微博数据,为计算ni项;图2为事件相关的签到点签到量ni与签到点日常状态下签到量Ni的获取方式对比图;
根据用户自定义的TXT格式文件,其中文件中的文本内容组织为签到点名称1,签到点名称2,…,签到点名称n的数据格式。读取TXT文件并以“,”为分隔符获得签到点名称数组。遍历数组中的签到点名称,构造相应的HTTP请求并返回各个签到点的签到次数即Ni项,然后利用公式6中的Ln(T/Ni)项得到各个签到点的用户分布权重值(图4),返回的数据如{厦门=3.88,福州=3.86,…,泉州=5.02}。
根据具体的事件,如2016年台风“莫兰蒂”人为设定关键词和微博爬取的起止时间,来获取含有签到位置信息的此次事件相关微博,然后将这些签到点存贮在PostgreSQL数据库中。由于本例为台风,影响范围较大,签到点代表空间单元设置为地市为单位,读取该数据库中签到位置数据,采用该数据库的空间拓展PostGIS,以市为单元链接到行政区划图为的面状地理要素图斑,属性数据包含签到点,用于统计签到次数,返回的数据如:{厦门=4212,泉州=3311,…,福州=1232},完成ni项的计算(图5);基于Ln(T/Ni)项与ni项计算每个签到点加权后的数值,作为签到点属性值写入Excel文件中,输出结果。
图6为经加权处理后事件相关的签到数据的空间分布图。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (2)

1.一种考虑用户分布区域差异的签到微博数据加权统计方法,其特征在于,包括如下步骤,
步骤S1、将需要采集的签到位置名称之间以逗号作为分隔符隔开,存为TXT格式文件;对组织好的TXT文件进行读取并将签到位置名称存入数组中;
步骤S2、遍历步骤S1得到的数组并构造相应的HTTP请求,而后以模拟登陆的方式对该URL访问;将返回的HTML数据采用正则表达式匹配签到位置相应的ID,并将其ID存入签到位置ID数组中;
步骤S3、遍历签到位置ID数组并构造相应的HTTP请求并进行访问,将返回的HTML数据采用正则表达式匹配每个签到位置的用户签到次数,将其记为Ni,即签到位置i的签到次数;
步骤S4、当事件发生时,微博社交网络中可能产生了具有相应关键词的微博数据,其中部分微博数据包含了签到地理位置数据;将含有签到地理位置数据的微博出现的集合定义为P(Check_inSet),其公式可以定义为一种联合概率链的形式:
P(Check_inSet)=P(C1)P(C2/C1)......P(Cn/C1,C2...Cn-1) (1)
在该种情况下由于签到位置之间的条件概率难以计算,因此假设签到位置之间相互独立:
P(Check_inSet)=P(C1)P(C2)......P(Cn) (2)
其中P(Ci)即签到位置i的签到概率:
P(Ci)=Ni/T (3)
其中,Ni即由步骤S3得到的第i个签到位置在正常情况下的签到次数,T为所有签到位置签到次数的求和:
现实情况下当事件发生时,微博用户会在相同的位置进行签到,即公式(2)中的P(Ci)各项存在同类项,将这些同类项进行合并得到如下公式:
P(Check_inSet)=P(C1)n1P(C2)n2...P(Ci)ni (5)
再对公式(5)两边取对数进一步化简:
其中,事件相关微博在签到位置i的条数,即该事件在签到位置i的签到量ni;Ln(T/Ni)项将其记为用户分布反权重项。
2.根据权利要求1所述的一种考虑用户分布区域差异的签到微博数据加权统计方法,其特征在于,还包括如下步骤:
步骤S5、虽然Ni可以由步骤S3直接得到每个签到位置的签到次数,但是存在较大的随机性;为了获得较为可靠的Ni的值,进行了如下步骤的推导;
S5A,微博中存在海量的签到点,即用户在一个签到位置进行签到的概率为一种小概率事件,记为Px,同时微博的用户为较大的群体;该种情况满足泊松过程,其数学形式可以表达为公式7,其概率函数为公式8:
S5B,基于泊松分布对公式(6)中的Ni采用极大似然估计的方法得到该项在统计学意义上的无偏估计值λ:
其中,Ni连续n天的观测序列为{x1,x2,…,xn},其联合概率分布函数为:
步骤S6、将数据采集的结果{x1,x2,x3…,xn}通过公式(9)进行参数估计后,得到每个签到位置的出现概率最大的签到次数,计算Ln(T/Ni)项的值,输出为Excel格式文件,利用常规地理信息系统软件读取属性数据并进行表连接;
步骤S7、通过微博开放平台API或模拟登陆网页爬虫的方式,获取事件特征关键词的相关微博数据,筛选出其中含有签到位置信息的部分,根据指定的空间单元使用R-Tree建立相应的空间索引来加速判断每个空间单元的签到位置个数,完成ni的计算;
步骤S8、将步骤S6中的Ln(T/Ni)项采用公式(6)推导的加权公式对微博签到量ni进行校正。
CN201810101398.6A 2018-02-01 2018-02-01 一种考虑用户分布区域差异的签到微博数据加权统计方法 Active CN108345662B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810101398.6A CN108345662B (zh) 2018-02-01 2018-02-01 一种考虑用户分布区域差异的签到微博数据加权统计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810101398.6A CN108345662B (zh) 2018-02-01 2018-02-01 一种考虑用户分布区域差异的签到微博数据加权统计方法

Publications (2)

Publication Number Publication Date
CN108345662A true CN108345662A (zh) 2018-07-31
CN108345662B CN108345662B (zh) 2022-08-12

Family

ID=62959785

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810101398.6A Active CN108345662B (zh) 2018-02-01 2018-02-01 一种考虑用户分布区域差异的签到微博数据加权统计方法

Country Status (1)

Country Link
CN (1) CN108345662B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190017A (zh) * 2018-08-02 2019-01-11 腾讯科技(北京)有限公司 热点信息的确定方法、装置、服务器及存储介质
CN110046174A (zh) * 2019-03-07 2019-07-23 特斯联(北京)科技有限公司 一种基于大数据的人口迁移分析方法和系统
CN110222278A (zh) * 2019-06-18 2019-09-10 东北大学 综合因素下用户位置的获取方法
CN111445594A (zh) * 2020-04-02 2020-07-24 上海钧正网络科技有限公司 一种基于智能硬件的打卡方法、设备和系统

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999617A (zh) * 2012-11-29 2013-03-27 华东师范大学 一种基于流体模型的微博传播分析方法
CN103150374A (zh) * 2013-03-11 2013-06-12 中国科学院信息工程研究所 一种识别微博异常用户的方法和系统
CN103440139A (zh) * 2013-09-11 2013-12-11 北京邮电大学 一种面向主流微博网站微博id的采集方法及工具
CN103745105A (zh) * 2014-01-06 2014-04-23 中国科学院计算技术研究所 一种社交网络中用户属性的预测方法及系统
CN103955505A (zh) * 2014-04-24 2014-07-30 中国科学院信息工程研究所 一种基于微博的事件实时监测方法及系统
CN104317880A (zh) * 2014-10-22 2015-01-28 浪潮软件集团有限公司 一种专门针对微博数据采集方式的方法
CN104573031A (zh) * 2015-01-14 2015-04-29 哈尔滨工业大学深圳研究生院 一种微博突发事件检测方法
CN105069071A (zh) * 2015-07-30 2015-11-18 清华大学 微博数据的地理位置信息提取方法
CN105183870A (zh) * 2015-09-17 2015-12-23 武汉大学 一种利用微博位置信息的城市功能区探测方法及系统
CN106021290A (zh) * 2016-04-29 2016-10-12 中国科学院信息工程研究所 一种基于多尺度地理信息的社交网络关联挖掘方法
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法
CN107194011A (zh) * 2017-06-23 2017-09-22 重庆邮电大学 一种基于社交网络的位置预测系统及方法

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102999617A (zh) * 2012-11-29 2013-03-27 华东师范大学 一种基于流体模型的微博传播分析方法
CN103150374A (zh) * 2013-03-11 2013-06-12 中国科学院信息工程研究所 一种识别微博异常用户的方法和系统
CN103440139A (zh) * 2013-09-11 2013-12-11 北京邮电大学 一种面向主流微博网站微博id的采集方法及工具
CN103745105A (zh) * 2014-01-06 2014-04-23 中国科学院计算技术研究所 一种社交网络中用户属性的预测方法及系统
CN103955505A (zh) * 2014-04-24 2014-07-30 中国科学院信息工程研究所 一种基于微博的事件实时监测方法及系统
CN104317880A (zh) * 2014-10-22 2015-01-28 浪潮软件集团有限公司 一种专门针对微博数据采集方式的方法
CN104573031A (zh) * 2015-01-14 2015-04-29 哈尔滨工业大学深圳研究生院 一种微博突发事件检测方法
CN105069071A (zh) * 2015-07-30 2015-11-18 清华大学 微博数据的地理位置信息提取方法
CN105183870A (zh) * 2015-09-17 2015-12-23 武汉大学 一种利用微博位置信息的城市功能区探测方法及系统
CN106021290A (zh) * 2016-04-29 2016-10-12 中国科学院信息工程研究所 一种基于多尺度地理信息的社交网络关联挖掘方法
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法
CN107194011A (zh) * 2017-06-23 2017-09-22 重庆邮电大学 一种基于社交网络的位置预测系统及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHUNYANG LIANG 等: ""Discover the Spatio-temporal Process of Typhoon Disaster Using Micro blog Data"", 《RESEARCHGATE》 *
CHUNYANG LIANG 等: ""Discover the Spatio-temporal Process of Typhoon Disaster Using Micro blog Data"", 《RESEARCHGATE》, 31 January 2018 (2018-01-31), pages 1 - 7 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109190017A (zh) * 2018-08-02 2019-01-11 腾讯科技(北京)有限公司 热点信息的确定方法、装置、服务器及存储介质
CN110046174A (zh) * 2019-03-07 2019-07-23 特斯联(北京)科技有限公司 一种基于大数据的人口迁移分析方法和系统
CN110046174B (zh) * 2019-03-07 2020-01-31 特斯联(北京)科技有限公司 一种基于大数据的人口迁移分析方法和系统
CN110222278A (zh) * 2019-06-18 2019-09-10 东北大学 综合因素下用户位置的获取方法
CN110222278B (zh) * 2019-06-18 2022-05-17 东北大学 综合因素下用户位置的获取方法
CN111445594A (zh) * 2020-04-02 2020-07-24 上海钧正网络科技有限公司 一种基于智能硬件的打卡方法、设备和系统

Also Published As

Publication number Publication date
CN108345662B (zh) 2022-08-12

Similar Documents

Publication Publication Date Title
CN104050196B (zh) 一种兴趣点数据冗余检测方法及装置
CN101350012B (zh) 一种地址匹配的方法和系统
US8401771B2 (en) Discovering points of interest from users map annotations
Zhang et al. The Traj2Vec model to quantify residents’ spatial trajectories and estimate the proportions of urban land-use types
JP6689515B2 (ja) ユーザ地理的ロケーションのタイプを識別するための方法および装置
US11681927B2 (en) Analyzing geotemporal proximity of entities through a knowledge graph
CN108345662A (zh) 一种考虑用户分布区域差异的签到微博数据加权统计方法
CN110472066A (zh) 一种城市地理语义知识图谱的构建方法
US20190034816A1 (en) Methods and system for associating locations with annotations
CN111159973B (zh) 一种中文地址的行政区划补齐及标准化方法
Ying et al. Semantic trajectory-based high utility item recommendation system
CN104199938A (zh) 基于rss的农用土地信息发送方法和系统
CN103324749B (zh) 一种基于标准文本地址的空间化解析及纠偏方法
Kashian et al. Automatic analysis of positional plausibility for points of interest in OpenStreetMap using coexistence patterns
CN110134883A (zh) 一种异构社交网络位置实体锚链接识别方法
Zhang et al. An improved probabilistic relaxation method for matching multi-scale road networks
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
Wu et al. Research themes of geographical information science during 1991–2020: a retrospective bibliometric analysis
Hristova et al. Mapping community engagement with urban crowd-sourcing
Wu et al. Improving tourism analytics from climate data using knowledge graphs
Zou et al. An innovative GPS trajectory data based model for geographic recommendation service
Liao et al. Fusing geographic information into latent factor model for pick-up region recommendation
CN107463559A (zh) 一种企业位置信息获取分析及存储系统
Wachowicz et al. Developing a streaming data processing workflow for querying space–time activities from geotagged tweets
CN104166659A (zh) 一种地图数据判重的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant