CN116304594B - 一种基于通信数据的用户区域识别方法、系统及介质 - Google Patents

一种基于通信数据的用户区域识别方法、系统及介质 Download PDF

Info

Publication number
CN116304594B
CN116304594B CN202310523906.0A CN202310523906A CN116304594B CN 116304594 B CN116304594 B CN 116304594B CN 202310523906 A CN202310523906 A CN 202310523906A CN 116304594 B CN116304594 B CN 116304594B
Authority
CN
China
Prior art keywords
base station
information
communication data
data
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310523906.0A
Other languages
English (en)
Other versions
CN116304594A (zh
Inventor
于笑博
成立立
张广志
刘增礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beiling Rongxin Datalnfo Science and Technology Ltd
Original Assignee
Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beiling Rongxin Datalnfo Science and Technology Ltd filed Critical Beiling Rongxin Datalnfo Science and Technology Ltd
Priority to CN202310523906.0A priority Critical patent/CN116304594B/zh
Publication of CN116304594A publication Critical patent/CN116304594A/zh
Application granted granted Critical
Publication of CN116304594B publication Critical patent/CN116304594B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

本申请实施例提供了一种基于通信数据的用户区域识别方法、系统及介质,该方法包括:通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;提取基站节点的通信数据的特征向量;将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,判断偏差率是否大于或等于预设偏差率阈值;若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别;通过基站节点数据与用户通信数据进行匹配,实现基站节点的活跃度对行为区域的密集度进行智能识别。

Description

一种基于通信数据的用户区域识别方法、系统及介质
技术领域
本申请涉及用户区域识别领域,具体而言,涉及一种基于通信数据的用户区域识别方法、系统及介质。
背景技术
随着智能手机的发展和普及,适应用户各种需求的APP不断涌现,人们越来越习惯于随身携带和使用智能手机,这使得以智能手机的通信数据作为媒介来刻画用户行为的研究方法得以实现。同时,手机上集成了更多 的传感器,如WIFI、GPS、蓝牙、加速度计、陀螺仪等,这些传感器为记录用户的区域识别及位置判断和行为提供了便利,现有技术缺乏一种可靠有效的用户区域识别的技术手段。
针对上述问题,目前亟待有效的技术解决方案。
发明内容
本申请实施例的目的在于提供一种基于通信数据的用户区域识别方法、系统及介质,可以通过基站节点数据与用户通信数据进行匹配,实现基站节点的活跃度对行为区域的密集度进行智能识别的技术。
本申请实施例还提供了一种基于通信数据的用户区域识别方法,包括:
通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
提取基站节点的通信数据的特征向量;
将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,所述通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
将区域内用户密集度与预设的密集度阈值进行比较;
若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;
若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,所述原始日志数据包括通话信息、短信或上网流量的数据记录;
所述原始日志数据包括业务发起时间或基站节点的编号信息;
所述通话信息包括通话时长、通话记录,所述上网流量的数据记录包括访问目标数据或网络参数;
所述短信包括短信的收发位置信息、短信收发过程中耗用流量信息,以及短信的字符量、短信的收发人位于基站覆盖区域的位置;
所述网络参数包括网络延迟或网络吞吐量。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,所述APP信息包括APP的简介、APP类型、APP评分、APP运行时间,APP运行过程中的使用流量记录以及访问记录;
所述基站信息通过运营商提供的基站信息表,得到基站的经纬度与覆盖区域面积或基站方向角、基站发射功率或基站天线增益或基站的安装高度中的一种或两种以上的组合。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,获取APP类型,将APP进行类别划分,形成多个子类别;
根据APP信息建立活跃度系数,并得到子类别的APP重要度;
根据APP重要度对子类别进行重要性排序;
获取子类别流量数据的使用节点信息;根据使用节点信息进行区域分割;
根据重要性排序将对应的子类别流量数据的使用节点信息进行重要区域识别。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,还包括:
获取基站节点的通信数据,建立行为信息;
根据行为信息提取行为特征;
根据行为特征比例,生成区域活跃度信息;
根据区域活跃度信息对区域进行分类。
可选地,在本申请实施例所述的基于通信数据的用户区域识别方法中,所述区域活跃度信息包括基站的数据调用频率,APP注册时间、有效记录的个数、区域内用户密集度。
所述行为信息包括网络访问信息、通信行为、APP使用信息;
所述通信行为包括通话记录、通信对象数量数或主被叫记录及短信收发信息。
第二方面,本申请实施例提供了一种基于通信数据的用户区域识别系统,该系统包括:存储器及处理器,所述存储器中包括基于通信数据的用户区域识别方法的程序,所述基于通信数据的用户区域识别方法的程序被所述处理器执行时实现以下步骤:
通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
提取基站节点的通信数据的特征向量;
将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别。
可选地,在本申请实施例所述的基于通信数据的用户区域识别系统中,所述通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
将区域内用户密集度与预设的密集度阈值进行比较;
若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;
若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类。
第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中包括基于通信数据的用户区域识别方法程序,所述基于通信数据的用户区域识别方法程序被处理器执行时,实现如上述任一项所述的基于通信数据的用户区域识别方法的步骤。
由上可知,本申请实施例提供的一种基于通信数据的用户区域识别方法、系统及介质,通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;提取基站节点的通信数据的特征向量;将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;判断所述偏差率是否大于或等于预设偏差率阈值;若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别;通过基站节点数据与用户通信数据进行匹配,实现基站节点的活跃度对行为区域的密集度进行智能识别的技术。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的基于通信数据的用户区域识别方法的流程图;
图2为本申请实施例提供的基于通信数据的用户区域识别方法的重要区域划分流程图;
图3为本申请实施例提供的基于通信数据的用户区域识别方法的根据APP重要度对重要区域识别方法流程图;
图4为本申请实施例提供的基于通信数据的用户区域识别方法的根据区域活跃度对区域进行分类流程图;
图5为本申请实施例提供的基于通信数据的用户区域识别系统的结构示意图。
具体实施方式
下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到,相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
请参照图1,图1是本申请一些实施例中的一种基于通信数据的用户区域识别方法的流程图。该基于通信数据的用户区域识别方法用于终端设备中,例如电脑、手机终端等。该基于通信数据的用户区域识别方法,包括以下步骤:
S101,通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
S102,获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
S103,提取基站节点的通信数据的特征向量;
S104,将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
S105,判断偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别。
需要说明的是,首先根据基站对用户的通信数据进行整理,从中抽取出用户在每个基站的特征向量,用来刻画用户在这个基站的行为 ;根据各个特征向量对基站进行聚类分析,被分在同一类的基站具有相似的特征向量,认为用户在其中的行为也是相似的;聚类结果中的每个特殊位置附近可能存在重要位置。
请参照图2,图2是本申请一些实施例中的一种基于通信数据的用户区域识别方法的重要区域划分流程图。根据本发明实施例,通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
S201,通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
S202,将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
S203,通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
S204,根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
S205,将区域内用户密集度与预设的密集度阈值进行比较;
S206,若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类。
根据本发明实施例,原始日志数据包括通话信息、短信或上网流量的数据记录;
原始日志数据包括业务发起时间或基站节点的编号信息;
通话信息包括通话时长、通话记录,上网流量的数据记录包括访问目标数据或网络参数;
短信包括短信的收发位置信息、短信收发过程中耗用流量信息,以及短信的字符量、短信的收发人位于基站覆盖区域的位置;
网络参数包括网络延迟或网络吞吐量。
根据本发明实施例,APP信息包括APP的简介、APP类型、APP评分、APP运行时间,APP运行过程中的使用流量记录以及访问记录;
基站信息通过运营商提供的基站信息表,得到基站的经纬度与覆盖区域面积或基站方向角、基站发射功率或基站天线增益或基站的安装高度中的一种或两种以上的组合。
请参照图3,图3是本申请一些实施例中的一种基于通信数据的用户区域识别方法的根据APP重要度对重要区域识别方法流程图。根据本发明实施例,S301,获取APP类型,将APP进行类别划分,形成多个子类别;
S302,根据APP信息建立活跃度系数,并得到子类别的APP重要度;
S303,根据APP重要度对子类别进行重要性排序;
S304,获取子类别流量数据的使用节点信息;根据使用节点信息进行区域分割;
S305,根据重要性排序将对应的子类别流量数据的使用节点信息进行重要区域识别。
需要说明的是,根据APP重要度对子类别进行重要性排序可以理解为根据APP的重要度对子类别按照升序的方式进行排序或按照降序的方式进行排序,两种排序方式任选其一均可,APP使用场景和用户行为之间存在联系,在不同场景下用户对APP的使用情况也不同,如在办公场景,可能会使用办公类的APP; 在通勤途中,可能使用导航类的APP;居家情况下,休闲娱乐类的APP可能使用更多。因此获取用户的APP使用情况,因此分析用户行为以及寻找重要位置提供依据。
请参照图4,图4是本申请一些实施例中的一种基于通信数据的用户区域识别方法的根据区域活跃度对区域进行分类流程图。根据本发明实施例,还包括:
S401,获取基站节点的通信数据,建立行为信息;
S402,根据行为信息提取行为特征;
S403,根据行为特征比例,生成区域活跃度信息;
S404,根据区域活跃度信息对区域进行分类。
根据本发明实施例,区域活跃度信息包括基站的数据调用频率,APP注册时间、有效记录的个数、区域内用户密集度。
行为信息包括网络访问信息、通信行为、APP使用信息;
通信行为包括通话记录、通信对象数量数或主被叫记录及短信收发信息。
需要说明的是,APP注册时间包括注册天数或注册小时数或注册小时的平均值。
根据本发明实施例,还包括:S301,获取通信数据,提取通信数据特征,获得用户在不同基站位置的行为信息;
根据用户在不同基站位置的行为信息提取行为特征;
根据行为特征得到行为模式;
根据行为模式对重要区域及特殊区域进行划分。
请参照图5,图5是本申请一些实施例中的一种基于通信数据的用户区域识别系统的结构示意图。第二方面,本申请实施例提供了一种基于通信数据的用户区域识别系统5,该系统包括:存储器51及处理器52,存储器51中包括基于通信数据的用户区域识别方法的程序,基于通信数据的用户区域识别方法的程序被处理器执行时实现以下步骤:
通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
提取基站节点的通信数据的特征向量;
将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
判断偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别。
需要说明的是,首先根据基站对用户的通信数据进行整理,从中抽取出用户在每个基站的特征向量,用来刻画用户在这个基站的行为 ;根据各个特征向量对基站进行聚类分析,被分在同一类的基站具有相似的特征向量,认为用户在其中的行为也是相似的;聚类结果中的每个特殊位置附近可能存在重要位置。
根据本发明实施例,通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
将区域内用户密集度与预设的密集度阈值进行比较;
若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;
若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类。
根据本发明实施例,原始日志数据包括通话信息、短信或上网流量的数据记录;
原始日志数据包括业务发起时间或基站节点的编号信息;
通话信息包括通话时长、通话记录,上网流量的数据记录包括访问目标数据或网络参数;
短信包括短信的收发位置信息、短信收发过程中耗用流量信息,以及短信的字符量、短信的收发人位于基站覆盖区域的位置;
网络参数包括网络延迟或网络吞吐量。
根据本发明实施例,APP信息包括APP的简介、APP类型、APP评分、APP运行时间,APP运行过程中的使用流量记录以及访问记录;
基站信息通过运营商提供的基站信息表,得到基站的经纬度与覆盖区域面积或基站方向角、基站发射功率或基站天线增益或基站的安装高度中的一种或两种以上的组合。
根据本发明实施例,获取APP类型,将APP进行类别划分,形成多个子类别;
根据APP信息建立活跃度系数,并得到子类别的APP重要度;
根据APP重要度对子类别进行重要性排序;
获取子类别流量数据的使用节点信息;根据使用节点信息进行区域分割;
根据重要性排序将对应的子类别流量数据的使用节点信息进行重要区域识别。
需要说明的是,根据APP重要度对子类别进行重要性排序可以理解为根据APP的重要度对子类别按照升序的方式进行排序或按照降序的方式进行排序,两种排序方式任选其一均可,APP使用场景和用户行为之间存在联系,在不同场景下用户对APP的使用情况也不同,如在办公场景,可能会使用办公类的APP; 在通勤途中,可能使用导航类的APP;居家情况下,休闲娱乐类的APP可能使用更多。因此获取用户的APP使用情况,因此分析用户行为以及寻找重要位置提供依据。
根据本发明实施例,还包括:
获取基站节点的通信数据,建立行为信息;
根据行为信息提取行为特征;
根据行为特征比例,生成区域活跃度信息;
根据区域活跃度信息对区域进行分类。
根据本发明实施例,区域活跃度信息包括基站的数据调用频率,APP注册时间、有效记录的个数、区域内用户密集度。
行为信息包括网络访问信息、通信行为、APP使用信息;
通信行为包括通话记录、通信对象数量数或主被叫记录及短信收发信息。
需要说明的是,APP注册时间包括注册天数或注册小时数或注册小时的平均值。
根据本发明实施例,还包括:获取通信数据,提取通信数据特征,获得用户在不同基站位置的行为信息;
根据用户在不同基站位置的行为信息提取行为特征;
根据行为特征得到行为模式;
根据行为模式对重要区域及特殊区域进行划分。
本发明第三方面提供了一种计算机可读存储介质,可读存储介质中包括基于通信数据的用户区域识别方法程序,基于通信数据的用户区域识别方法程序被处理器执行时,实现如上述任一项的基于通信数据的用户区域识别方法的步骤。
本发明公开的一种基于通信数据的用户区域识别方法、系统及介质,通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;提取基站节点的通信数据的特征向量;将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;判断所述偏差率是否大于或等于预设偏差率阈值;若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别;通过基站节点数据与用户通信数据进行匹配,实现基站节点的活跃度对行为区域的密集度进行智能识别的技术。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (6)

1.一种基于通信数据的用户区域识别方法,其特征在于,包括:
通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
提取基站节点的通信数据的特征向量;
将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别;
所述通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
将区域内用户密集度与预设的密集度阈值进行比较;
若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;
若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类;
所述APP信息包括APP的简介、APP类型、APP评分、APP运行时间,APP运行过程中的使用流量记录以及访问记录;
所述基站信息通过运营商提供的基站信息表,得到基站的经纬度与覆盖区域面积或基站方向角、基站发射功率或基站天线增益或基站的安装高度中的一种或两种以上的组合;
获取APP类型,将APP进行类别划分,形成多个子类别;
根据APP信息建立活跃度系数,并得到子类别的APP重要度;
根据APP重要度对子类别进行重要性排序;
获取子类别流量数据的使用节点信息;根据使用节点信息进行区域分割;
根据重要性排序将对应的子类别流量数据的使用节点信息进行重要区域识别。
2.根据权利要求1所述的基于通信数据的用户区域识别方法,其特征在于,所述原始日志数据包括通话信息、短信或上网流量的数据记录;
所述原始日志数据包括业务发起时间或基站节点的编号信息;
所述通话信息包括通话时长、通话记录,所述上网流量的数据记录包括访问目标数据或网络参数;
所述短信包括短信的收发位置信息、短信收发过程中耗用流量信息,以及短信的字符量、短信的收发人位于基站覆盖区域的位置;
所述网络参数包括网络延迟或网络吞吐量。
3.根据权利要求1所述的基于通信数据的用户区域识别方法,其特征在于,还包括:
获取基站节点的通信数据,建立行为信息;
根据行为信息提取行为特征;
根据行为特征比例,生成区域活跃度信息;
根据区域活跃度信息对区域进行分类。
4.根据权利要求3所述的基于通信数据的用户区域识别方法,其特征在于,所述区域活跃度信息包括基站的数据调用频率,APP注册时间、有效记录的个数、区域内用户密集度;
所述行为信息包括网络访问信息、通信行为、APP使用信息;
所述通信行为包括通话记录、通信对象数量数或主被叫记录及短信收发信息。
5.一种基于通信数据的用户区域识别系统,其特征在于,该系统包括:存储器及处理器,所述存储器中包括基于通信数据的用户区域识别方法的程序,所述基于通信数据的用户区域识别方法的程序被所述处理器执行时实现以下步骤:
通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息;
获取基站节点,将结果信息与基站节点进行对比,将通信数据与基站节点进行匹配;
提取基站节点的通信数据的特征向量;
将不同基站节点的通信数据的特征向量与预设的特征向量进行比较,得到偏差率;
判断所述偏差率是否大于或等于预设偏差率阈值;
若大于或等于,则生成修正信息,通过修正信息对通信数据与基站节点进行重新匹配;
若小于,则将基站节点进行聚类分析,根据聚类分析的结果对行为区域进行识别;
所述通过大数据获取用户通信数据,对通信数据进行预处理,得到结果信息,包括:
通过大数据获取原始日志数据、APP信息与基站信息,将原始日志数据、APP信息与基站信息进行合成用户通信数据;
将用户通信数据进行统计筛选,获得有效记录数据及有效记录条数;
通过有效记录数据及有效记录条数绘制有效记录数据的分布图;
根据有效记录数据分布图构建用户行为信息,并采集区域内用户密集度;
将区域内用户密集度与预设的密集度阈值进行比较;
若区域内用户密集度大于或等于预设的密集度阈值,则将对应的用户区域进行重要区域划分;
若区域内用户密集度小于预设的密集度阈值,则将对应的用户区域进行次要区域归类;
所述APP信息包括APP的简介、APP类型、APP评分、APP运行时间,APP运行过程中的使用流量记录以及访问记录;
所述基站信息通过运营商提供的基站信息表,得到基站的经纬度与覆盖区域面积或基站方向角、基站发射功率或基站天线增益或基站的安装高度中的一种或两种以上的组合;
获取APP类型,将APP进行类别划分,形成多个子类别;
根据APP信息建立活跃度系数,并得到子类别的APP重要度;
根据APP重要度对子类别进行重要性排序;
获取子类别流量数据的使用节点信息;根据使用节点信息进行区域分割;
根据重要性排序将对应的子类别流量数据的使用节点信息进行重要区域识别。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括基于通信数据的用户区域识别方法程序,所述基于通信数据的用户区域识别方法程序被处理器执行时,实现如权利要求1至4中任一项所述的基于通信数据的用户区域识别方法的步骤。
CN202310523906.0A 2023-05-11 2023-05-11 一种基于通信数据的用户区域识别方法、系统及介质 Active CN116304594B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310523906.0A CN116304594B (zh) 2023-05-11 2023-05-11 一种基于通信数据的用户区域识别方法、系统及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310523906.0A CN116304594B (zh) 2023-05-11 2023-05-11 一种基于通信数据的用户区域识别方法、系统及介质

Publications (2)

Publication Number Publication Date
CN116304594A CN116304594A (zh) 2023-06-23
CN116304594B true CN116304594B (zh) 2023-09-08

Family

ID=86781705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310523906.0A Active CN116304594B (zh) 2023-05-11 2023-05-11 一种基于通信数据的用户区域识别方法、系统及介质

Country Status (1)

Country Link
CN (1) CN116304594B (zh)

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001465A (zh) * 2006-12-30 2007-07-18 华为技术有限公司 一种寻呼被叫用户的方法、系统和msc/vlr
CN106547894A (zh) * 2016-11-03 2017-03-29 浙江夏农信息技术有限公司 基于移动通信信令大数据挖掘职住位置标签的系统及方法
CN106714104A (zh) * 2016-12-08 2017-05-24 深圳先进技术研究院 一种用户活动区域基站点的识别方法及装置
CN107135170A (zh) * 2017-04-28 2017-09-05 中国人民解放军信息工程大学 一种内容中心网络的高质量QoS保证方法
CN109063931A (zh) * 2018-09-06 2018-12-21 盈盈(杭州)网络技术有限公司 一种预测货运物流司机违约概率的模型方法
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN110874609A (zh) * 2018-09-04 2020-03-10 武汉斗鱼网络科技有限公司 基于用户行为的用户聚类方法、存储介质、设备及系统
CN111491366A (zh) * 2020-03-06 2020-08-04 西安电子科技大学 基于无线通信基站修正目标三维定位方法、无线通信系统
CN111901750A (zh) * 2020-09-11 2020-11-06 中国联合网络通信集团有限公司 一种定位方法、装置、电子设备以及存储介质
CN111949889A (zh) * 2020-09-16 2020-11-17 苏州众智诺成信息科技有限公司 一种基于大数据的共享平台智能推荐方法、系统及可读存储介质
CN112084225A (zh) * 2020-09-16 2020-12-15 苏州众智诺成信息科技有限公司 一种基于大数据的共享平台的智能处理方法、系统及可读存储介质
CN112506972A (zh) * 2020-12-15 2021-03-16 中国联合网络通信集团有限公司 用户常驻区域定位方法、装置、电子设备以及存储介质
CN112686483A (zh) * 2019-10-17 2021-04-20 中国移动通信集团陕西有限公司 预警区域识别方法、装置、计算设备及计算机存储介质
CN112966750A (zh) * 2021-03-08 2021-06-15 东南大学 一种利用k均值聚类算法识别就业地的方法
CN114339586A (zh) * 2020-09-28 2022-04-12 中国电信股份有限公司 终端定位方法、装置以及存储介质
CN116017333A (zh) * 2022-12-14 2023-04-25 北京市大数据中心 基于大数据信令处理的人口识别方法、系统及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105873194A (zh) * 2015-11-30 2016-08-17 乐视网信息技术(北京)股份有限公司 一种移动终端行为上报方法和装置
CN106980745B (zh) * 2016-06-30 2019-02-26 平安科技(深圳)有限公司 数据展示方法和装置

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101001465A (zh) * 2006-12-30 2007-07-18 华为技术有限公司 一种寻呼被叫用户的方法、系统和msc/vlr
CN106547894A (zh) * 2016-11-03 2017-03-29 浙江夏农信息技术有限公司 基于移动通信信令大数据挖掘职住位置标签的系统及方法
CN106714104A (zh) * 2016-12-08 2017-05-24 深圳先进技术研究院 一种用户活动区域基站点的识别方法及装置
CN107135170A (zh) * 2017-04-28 2017-09-05 中国人民解放军信息工程大学 一种内容中心网络的高质量QoS保证方法
CN110874609A (zh) * 2018-09-04 2020-03-10 武汉斗鱼网络科技有限公司 基于用户行为的用户聚类方法、存储介质、设备及系统
CN109063931A (zh) * 2018-09-06 2018-12-21 盈盈(杭州)网络技术有限公司 一种预测货运物流司机违约概率的模型方法
CN110020980A (zh) * 2019-04-08 2019-07-16 江苏号百信息服务有限公司 基于手机信令数据的机场到发旅客识别与客情分析方法
CN112686483A (zh) * 2019-10-17 2021-04-20 中国移动通信集团陕西有限公司 预警区域识别方法、装置、计算设备及计算机存储介质
CN111491366A (zh) * 2020-03-06 2020-08-04 西安电子科技大学 基于无线通信基站修正目标三维定位方法、无线通信系统
CN111901750A (zh) * 2020-09-11 2020-11-06 中国联合网络通信集团有限公司 一种定位方法、装置、电子设备以及存储介质
CN111949889A (zh) * 2020-09-16 2020-11-17 苏州众智诺成信息科技有限公司 一种基于大数据的共享平台智能推荐方法、系统及可读存储介质
CN112084225A (zh) * 2020-09-16 2020-12-15 苏州众智诺成信息科技有限公司 一种基于大数据的共享平台的智能处理方法、系统及可读存储介质
CN114339586A (zh) * 2020-09-28 2022-04-12 中国电信股份有限公司 终端定位方法、装置以及存储介质
CN112506972A (zh) * 2020-12-15 2021-03-16 中国联合网络通信集团有限公司 用户常驻区域定位方法、装置、电子设备以及存储介质
CN112966750A (zh) * 2021-03-08 2021-06-15 东南大学 一种利用k均值聚类算法识别就业地的方法
CN116017333A (zh) * 2022-12-14 2023-04-25 北京市大数据中心 基于大数据信令处理的人口识别方法、系统及存储介质

Also Published As

Publication number Publication date
CN116304594A (zh) 2023-06-23

Similar Documents

Publication Publication Date Title
CN104980997B (zh) 一种网络接入方法及移动通信终端
CN106570014B (zh) 用于确定用户的家庭属性信息的方法与设备
CN106028279B (zh) 一种网络注册方法及装置
WO2021008116A1 (zh) 一种身份识别预处理、身份识别方法及系统
CN111757464B (zh) 一种区域轮廓提取方法及装置
CN106973379B (zh) 重入网识别方法和装置
CN101557582B (zh) 一种移动通信用户信息统计方法及装置
CN112214677B (zh) 一种兴趣点推荐方法、装置、电子设备及存储介质
CN113412607B (zh) 内容推送方法、装置、移动终端及存储介质
EP3193521A1 (en) Method and server for saving standard format page
CN112469092A (zh) 多卡移动终端最佳网络选择方法、装置、计算机设备和存储介质
EP1336317A1 (en) System and method for identifying the position of mobile terminals
CN110765842B (zh) 一种身份识别预处理、身份识别方法及设备
CN110650438B (zh) 用户常住区域相似度判断方法、装置、设备及介质
CN116304594B (zh) 一种基于通信数据的用户区域识别方法、系统及介质
CN113691483B (zh) 异常用户设备的检测方法、装置、设备及存储介质
CN103268584B (zh) 流动人口的籍贯判别方法和装置
CN109756887B (zh) 高铁伴随移动端识别方法、装置及计算机可读存储介质
CN112970276B (zh) 通信处理方法、装置、移动终端及存储介质
CN109672587B (zh) 公共终端的识别方法、识别系统、服务器、计算机可读介质
CN116471582A (zh) 一种基于人工智能的一人多卡用户识别方法及装置
CN105959911A (zh) 识别用户的方法及装置
CN113873495B (zh) eSIM卡的网络接入方法和装置
CN107770734B (zh) 移动用户常驻地识别方法及装置
CN110708665B (zh) 接入网设备归属区域的确定方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant