CN117726369A

CN117726369A - 一种基于手机信令数据的商业区域选址方法及系统

Info

Publication number: CN117726369A
Application number: CN202311777108.7A
Authority: CN
Inventors: 张珣; 丛杨潇; 邹进; 石金莲; 杨迪
Original assignee: Hotan Teachers College; Beijing Technology and Business University
Current assignee: Hotan Teachers College; Beijing Technology and Business University
Priority date: 2023-12-22
Filing date: 2023-12-22
Publication date: 2024-03-19

Abstract

本发明公布了一种基于手机信令数据的商业区域选址方法及系统，包括：手机信令数据预处理模块、用户行为模式决策模块、用户位置预测模块、推荐商业选址候选地点模块和商业选址决策模块；通过获取手机信令数据、城市道路信息，对手机信令数据进行清洗和预处理；获取手机人群的移动行为、习惯和趋势；设计强化学习算法预测未来的人群分布，考虑区域吸引力、商店的类型和位置。对强化学习算法的预测结果应用核密度分析，生成未来时刻的人群密度，识别热点区域；针对人群密度与道路信息，设计商业选址算法，确定最佳商业选址区域。采用本发明的技术方案，能够更准确地进行商业选址决策，最大程度地满足商业选址的应用需求。

Description

一种基于手机信令数据的商业区域选址方法及系统

技术领域

本发明涉及基于移动手机信息的选址技术，尤其涉及一种基于手机信令数据的商业区域选址方法及系统。

背景技术

商业选址一直是市场开发中至关重要的一步。传统的商业选址方法通常依赖于市场研究、地理分析和试错。然而，这些方法往往昂贵、耗时费力且不一定能够充分利用可用数据。如何能更智能、数据驱动的方法来辅助商业选址决策，使其提高效率和准确性，是一个需要不断研究的问题。

手机信令数据包括用户的位置信息、用户时间信息。这些数据提供了有关用户行为和位置的详细信息，可以用于深入了解人口密度、移动趋势和用户活动，能够更好地理解消费者行为和需求，可用于商业选址决策。

商业选址至关重要，直接关系到企业的成功与否。现有的商业选址方法存在一些不足，商业选址通常依赖各种数据源，这些数据会存在不准确、过时的问题，最终影响选址准确性。同时商业环境是动态变化的，选址时考虑的因素可能在未来发生变化，因此需要及时调整，现有技术难以准确预测未来的市场趋势。

发明内容

本发明的目的是提出一种基于手机信令数据的商业选址方法，以解决传统商业选址方法的不足，通过使用强化学习算法为商业选址提供更准确的解决方案。

本发明采用手机信令数据作为数据源，解决商业选址时人口流动数据不准确以及过时的问题。同时，将强化学习算法应用于商业选址问题中，根据众多用户的历史移动数据预测未来某一时段人群的分布情况，解决商业选址预测未来市场趋势的不足，可提供更准确的商业选址决策，有助于最大程度地满足应用需求。

本发明的技术方案如下：

一种基于手机信令数据的商业区域选址方法，包括如下步骤：

步骤一、获取手机信令数据，城市道路数据、所在城市POI(兴趣点，Point ofInterest)数据，对这些数据进行清洗和预处理；

步骤二、结合POI数据与手机信令数据，设计用户行为模式计算方法，分析用户行为模式，将用户活动划分为娱乐、住宿、工作和餐饮四大类；

步骤三、根据用户的行为模式和地理位置信息，构建强化学习算法的训练数据集，包括了用户在不同地点和时间的行为历史，以及与每个行为相关的奖励信息；

步骤四、构建强化学习模型算法，基于历史数据和奖励信息，预测出用户在不同地点的分布情况，并计算每个地区内未来时间段的用户数量；

步骤五、采用核密度分析方法对各地区用户数量进行核密度分析，选定人群密度高的地区作为商业选址的候选区域；

使用ArcGis软件中的核密度分析工具，对各个地区的用户数量进行核密度分析，选出人群密度较高的地区作为商业选址的候选区域；

步骤六、利用城市道路数据、候选区域POI数据与商业选址候选区域数据，基于商店类型、竞争对手、交通情况和人群密度设计商业选址算法，计算出最合适的选址策略，包括商业建设位置(如在何处建设店铺)、商业类型(店铺类型)和运营时间等。

进一步地，所述步骤一中收集数据、数据清洗和预处理的具体步骤如下：

11)用户的手机信令数据包括，身份标识符、出行序号、出行时间、经纬度信息。根据出行时间按照从早到晚进行排序，获得用户一天的位置移动轨迹。城市道路数据包括道路类型、道路连接等。使用高德地图API提供的POI数据，分成娱乐、住宿、工作和餐饮四大类。POI数据包括名称、经纬度和区域名称。本发明具体实施时，其中POI类型进一步包括餐饮美食、公司企业、购物消费、交通设施、金融机构、酒店住宿、科教文化、旅游景点、商务住宅、生活服务、休闲娱乐、医疗保健和运动健身。

12)每个用户的手机的信令数据序列：

<uid,move_id,move_vp_id,stime,grid_id,lat,lon>

其中，uid表示用户的身份标识符，move_id表示运营商根据日期划分的用户出行序号即出行顺序的标识符，move_vp_id表示用户在本次出行的序号，stime表示用户的出行时间，grid_id表示用户出行所在的网格信息，lat表示运营商在时间段内记录用户所在位置的纬度，lon表示运营商在时间段内记录到用户所在位置的经度。对于单个用户的手机信令数据序列，包括用户身份标识符、出行序号、时间戳、所在经纬度等信息。

13)对于单个用户的手机信令数据存在短时间内在两个基站来回切换，即标注为乒乓数据，对于此类数据，保留记录中的第一条数据和最后一条数据，其余数据记录作删除处理。

对于单个用户的手机信令数据存在短暂间隔后出现在较远的基站，即标注为漂移数据，对于此类数据，设置时间窗口，删除在时间窗口内速度v大于阈值的数据。

进一步的，所述步骤二中用户行为模式计算的具体步骤如下：

用户出行轨迹的语义特征是根据附近POI集合，基于距离与时间给予不同权重进行计算，其中POI与用户的所在地区越近，权重越大；用户轨迹中记录的时间与生活中的住宿、工作、餐饮娱乐时间越接近、权重越大。其语义特征计算公式如下：

其中Feature_ij表示第i个用户的第j条数据所代表的语义特征，即行为模式；n表示POI类型集合中的数量，α_n表示第n个POI类型集合中的距离权重，β_n表示第n个POI类型集合中的时间权重，Distance表示第n个POI地点与用户位置的距离，Time表示用户语义轨迹中的起始时间与当前POI工作时间的交集时长。

POI类型集合是用户位置附近的POI点位的集合，具体是通过获取用户的当前位置，在POI数据中找到附近的POI，并生成集合。

进一步的，所述步骤三中构建强化学习算法训练集的具体步骤如下：

根据识别出的用户行为与手机信令中的位置和时间信息构建强化学习算法训练集；

通过步骤一中得到的手机信令数据的位置信息与时间信息，与步骤二中得到的用户语义特征相结合，得到当前用户一天的轨迹与行为模式序列，将每个用户的轨迹与行为模式序列，作为训练数据。每条训练数据包含的字段有：<uid,lat,lon,feature>；其中uid表示用户的身份标识符，lat表示运营商在时间段内记录用户所在位置的纬度，lon表示运营商在时间段内记录到用户所在位置的经度，feature为该用户当前的行为模式。

在训练数据中为每个用户的轨迹与行为模式序列设置奖励。奖励为一个数值，用于衡量行为的好坏。奖励根据用户所在当前区域的特性，如该地区偏向：办公、餐饮、娱乐或商业，以及用户的行为模式来进行动态调整。

进一步的，步骤四中基于强化学习构建用户出行分布强化学习预测模型，实现在未来时间用户位置分布情况；具体步骤如下：

41)使用用户出行的轨迹与行为模式作为训练数据集，每个用户当天最后的位置作为预测目标，训练一个拥有注意力机制的LSTM(长短期记忆网络，Long Short-TermMemory)模型，作为位置预测模型。

42)对位置预测模型定义强化学习算法中的环境、智能体、智能体的动作、奖励，用于对位置预测模型进行调整，以提升模型的预测性能。

其中，环境指的是用户的历史移动轨迹以及位置预测模型的结果。环境是动态的，根据输入的历史轨迹以及预测模型给出不同的输出结果。位置预测模型是智能体优化的对象。智能体是强化学习中做出决策的实体。智能体的任务是在当前环境下，判断是否保留由位置预测模型提供的输出结果。动作是智能体在环境中执行的操作。在本发明中，动作是一个二进制序列，表示是否保留位置预测模型计算出的移动轨迹预测结果。二进制中的1表示保留，0表示不保留。奖励是在执行智能体的动作后获得的反馈。在本发明中，奖励是根据位置预测结果的正确性而分配的值(骤三构建训练集中设置的奖励)。如果保留的预测结果是正确的，则智能体获得相应的奖励值。

通过上述强化学习算法指导智能体学习在不同情境下做出的决策，以提升模型的预测性能。

43)利用训练好的用户位置预测模型，输入单个用户出行的轨迹信息，并调用用户位置预测模型，得到最终结果，即利用用户的轨迹进行未来位置的预测。对所有用户的出行进行预测，即可得到用户出行分布的结果。

进一步的，所述步骤五中对各地区用户数量进行核密度分析，并挑选出商业选址的候选区域的具体步骤如下：

51)使用Arcgis软件加载用户出行分布结果，用户出行分布结果即预测出的每个用户未来时段的所在位置，其中，用户出行分布结果包含每个用户预测位置的经纬度信息；

52)将所在地区的城市道路数据与每个用户预测的经纬度信息绘制在Arcgis软件的地图当中；

53)使用核密度分析工具，配置核密度分析参数，包括输入点图层、输出密度表面、和函数类型、搜索半径等。

54)对预测的用户经纬度进行核密度计算，计算点密度并生成密度表面。密度表面将显示在Arcgis地图上，使用可视化工具对结果调整颜色和透明度，更清晰地可视化高密度和低密度区域。

55)将密度表面中的高密度区域进行统计汇总，针对高密度地区进行商业选址推荐。

进一步的，所述步骤六中构建商业选址算法具体步骤如下：

定义影响商业选址的有以下四种因素：繁荣度、竞争度、客流量、交通可达度。

其中，繁荣度通过附近POI侧面反映出该地区的繁荣性，该地区越繁华，越吸引游客，因此繁荣度对商业选址是正相关作用，对繁荣度采用以下公式表示：

其中P_l,p表示单元格l的繁荣度，k表示单元格内POI种类，N_l表示单元格l内所有类型POI数量的总和，N_l,k表示单元格l内属于k类POI的数量。

竞争度为该地区中待选POI类型与当前相同POI之间的关系，相同种类POI个数越多，竞争越激烈，因此竞争度对商业选址为负相关作用，对竞争度的公式定义如下：

其中P_l,c表示单元格l的竞争度，α为常数，N_l,k表示单元格l内属于k类POI的数量，N为当前单元格内相同种类POI的数量，。

客流量为步骤五中计算出的人群密度，客流量越大，在该地区进行选址的收益越高，因此客流量对商业选址是正相关作用，对客流量的公式定义如下：

Pl_,f＝α*count(n)

其中P_l,f表示单元格l的客流量，α为常数，count(n)表示预测单元格l内的人口数量。

交通可达度为该地区在指定地区进行选址推荐与主干道之间的距离，若距离越远越不易吸引用户，因此交通可达度对商业选址是正相关作用，对交通可达度的公式定义如下：

其中P_l,t表示单元格l内的交通可达性，α为常数，distance表示选址地点与主干道的距离。

商业选址评分算法定义为：

P＝αP_l,p+βP_l,c+χP_l,f+δP_l,t

其中，α、β、χ、δ均为权重系数，为取值为[-1,1]的常数，P表示在该区域建立某种商业POI获取的得分，评分越高代表该地区使某种商业POI的利润概率越高。

最终，根据商业选址算法对目标地址的评分进行计算，确定评分最高的地址作为目标门店地址。

利用上述方法，本发明实现了一种基于手机信令数据的商业选址方法系统。包括：手机信令数据预处理模块、用户行为模式决策模块、用户位置预测模块、推荐商业选址候选地点模块、商业选址决策模块。

本发明的系统结合了多个模块，包括信令数据预处理、用户行为模式决策、用户位置预测和商业选址推荐，综合利用不同数据和算法，提高了商业选址决策的准确性和可行性。手机信令数据预处理模块用于获取数据并对数据进行清洗和预处理。通过用户行为模式决策模块，系统可以识别用户的不同行为类别，如娱乐、住宿、工作、餐饮等。这有助于更好地了解用户需求，为商业选址提供定制化建议。用户位置预测模块使用强化学习算法构建用户出行分布强化学习预测模型，可以预测未来某一时刻的人群分布情况，有助于商业决策者在未来做出更准确的选址决策。推荐商业选址候选地点模块通过核密度分析等工具，系统可以推荐人群密度高的地区作为商业选址的候选区域。商业选址决策模块使用综合的数据和分析结果，帮助商业决策者做出明智的商业选址决策，最大程度地满足市场需求。

综上，本发明提供的基于手机信令数据的商业区域选址方法及系统，通过获取手机信令数据、城市道路信息；对手机信令数据进行清洗和预处理；对清洗后的数据进行分析，获取手机人群的移动行为、习惯和趋势；使用强化学习算法来预测未来的人群分布，考虑不同区域的吸引力、商店的类型和位置；对强化学习算法的预测结果应用核密度分析，生成下一时刻的人群密度，识别热点区域；根据人群密度与道路信息设计商业选址算法，确定最佳商业选址区域。本发明对于城市规划、商业发展和资源利用具有重要的社会和经济意义，可用于更好地了解市场需求，提高商业效率。

附图说明

图1是本发明实施例的基于手机信令数据的商业选址方法的流程框图。

图2是本发明实施例的基于强化学习预测用户移动轨迹模型的训练流程框图。

图3本发明实施例的基于手机信令数据的商业选址系统的结构框图。

具体实施方式

为了本发明的目的、技术方案及优点更加清楚，下面结合附图，通过实施例进一步描述本发明，但不以任何方式限制本发明的范围。

参见图1，是本发明的一种基于手机信令数据的商业选址方法及系统的流程示意图，所述方法包括步骤一至步骤六。

步骤一：从运营商获取手机信令数据，其中手机信令数据包括了：用户id、出行id、出行顺序id、起始时间、基站id、经纬度信息，包含了每个用户全天的出行轨迹时空信息。其中，每个用户的手机的信令数据序列为：

<uid,move_id,move_vp_id,stime,grid_id,lat,lon>

获取到的手机信令数据存在大量的问题数据，包括四个类型分别是：缺失数据、重复数据、乒乓数据以及漂移数据。针对缺失数据、重复数据、乒乓数据进行删除处理。针对漂移数据进行速度计算，删除速度不合理的数据。

对城市道路数据检查数据的完整性，包括缺失、错误或重复的道路信息。确保道路信息的字段格式正确，如道路名称、道路类型等。保证数据包含地理坐标并能导入到Arcgis中。

对所在城市POI数据进行分类并根据地区进行整合，其中POI数据类型包括餐饮美食、公司企业、购物消费、交通设施、金融机构、酒店住宿、科教文化、旅游景点、商务住宅、生活服务、休闲娱乐、医疗保健和运动健身。将上述POI类型按照住宿、工作、餐饮和娱乐四大类进行分类。保留POI的经纬度和分类结果，对相同地区的POI数据进行整合。

步骤二：计算用户出行轨迹的语义特征。用户出行轨迹的语义特征是根据附近POI集合，基于距离与时间给予不同权重进行计算，其中POI与用户的所在地区越近，权重越大；用户轨迹中记录的时间与生活中的住宿、攻错、餐饮娱乐时间越接近、权重越大。其语义特征计算公式如下：

其中Feature_ij表示第i个用户的第j条数据所代表的语义特征，n表示PoiType[]集合中的数量，α_n表示第n个POI类型集合中的距离权重，β_n表示第n个POI类型集合中的时间权重，Distance表示第n个POI地点与用户位置的距离，Time表示用户语义轨迹中的起始时间与当前POI工作时间的交集时长。

步骤三：根据识别出的用户行为与手机信令中的位置和时间信息构建强化学习算法训练集。

通过步骤一中得到的手机信令数据的位置信息与时间信息，与步骤二中得到的用户语义特征相结合，得到当前用户一天的轨迹与行为模式序列，将每个用户的轨迹与行为模式序列作为训练数据。

每条训练数据包含的字段有：<uid,lat,lon,feature>；其中uid表示用户的身份标识符，lat表示运营商在时间段内记录用户所在位置的纬度，lon表示运营商在时间段内记录到用户所在位置的经度，feature为该用户当前的行为。

为了进行强化学习模型的训练，需要在训练数据中为每个用户的轨迹与行为模式序列设置奖励。奖励为一个数值，用于衡量行为的好坏。奖励根据用户所在当前区域的特性，如该地区偏向：办公、餐饮、娱乐或商业，以及用户的行为模式来进行动态调整。

步骤四：构建基于强化学习的手机用户位置预测模型。

本发明具体实施时，基于强化学习预测用户移动轨迹模型的训练流程如图2所示。使用用户出行的轨迹与行为模式作为数据集，每个用户当天最后的位置作为预测目标，训练一个拥有注意力机制的LSTM模型，作为位置预测模型。

对强化学习定义，其中包括环境、智能体、动作、奖励。环境是用户的历史移动轨迹与预测模型，环境与智能体进行交互，通过智能体的动作来进行更新状态。智能体的动作决定是否保留位置预测模型计算出的移动轨迹预测结果，动作是二进制序列，如果保留位置预测模型提供的结果，则设置其二进制为1，不保留则为0。奖励为步骤三中设置的奖励，如果保留的预测结果正确，则获得相应的奖励值。在每一个时间步中，模型会计算当前行动的奖励，并将其进行累计，以调整模型的性能。

预测用户出行的强化学习模型，经过测试后得到最终结果，即用户的轨迹进行位置预测。对所有用户的出行进行预测，得到用户出行分布的结果。

步骤五：对各地区用户数量进行核密度分析，并挑选出商业选址的候选区域。

55)将密度表面中的高密度区域进行统计汇总，针对高密度地区进行商业选址推荐，高密度区域即为候选区域。

步骤六：构建商业选址算法并选出选址地点。

其中，繁荣度通过附近POI侧面反映出该地区的繁荣性，该地区越繁华，越吸引游客，因此繁荣度对商业选址是正相关作用，对繁荣度的公式定义如下：

竞争度为该地区中待选POI类型与当前相同POI见的关系，相同种类POI个数越多，竞争越激烈，因此竞争度对商业选址为负相关作用，对竞争度的公式定义如下：

P_l,f＝α*count(n)

商业选址评分算法定义为：

P＝αP_l,p+βP_l,c+χP_l,f+δP_l,t

其中P表示在该区域建立某种商业POI获取的得分，评分越高代表该地区使某种商业POI的利润概率越高。

如图3所示，本发明公开了一种基于手机信令数据的商业选址方法系统。包括：手机信令数据预处理模块、用户行为模式决策模块、用户位置预测模块、推荐商业选址候选地点模块、商业选址决策模块。

本发明的系统结合了多个模块，包括信令数据预处理、用户行为模式决策、用户位置预测和商业选址推荐，综合利用不同数据和算法，提高了商业选址决策的准确性和可行性。通过用户行为模式决策模块，系统可以识别用户的不同行为类别，如娱乐、住宿、工作、餐饮等。这有助于更好地了解用户需求，为商业选址提供定制化建议。用户行为模式决策模块使用强化学习算法可以预测未来某一时刻的人群分布情况，有助于商业决策者在未来做出更准确的选址决策。推荐商业选址候选地点模块通过核密度分析等工具，系统可以推荐人群密度高的地区作为商业选址的候选区域。商业选址决策模块使用综合的数据和分析结果，帮助商业决策者做出明智的商业选址决策，最大程度地满足市场需求。

本发明对于城市规划、商业发展和资源利用具有重要的社会和经济意义，有助于用户更好地了解市场需求，提高商业效率。

需要注意的是，公布实施例的目的在于帮助进一步理解本发明，但是本领域的技术人员可以理解：在不脱离本发明及所附权利要求的范围内，各种替换和修改都是可能的。因此，本发明不应局限于实施例所公开的内容，本发明要求保护的范围以权利要求书界定的范围为准。

Claims

1.一种基于手机信令数据的商业区域选址方法，其特征是，包括如下步骤：

步骤一、获取手机信令数据、城市道路数据、城市POI数据，对数据进行清洗和预处理；

步骤二、根据POI数据与手机信令数据，设计用户行为模式计算方法，根据计算得到的语义特征，将用户行为模式划分为多个类别；计算方法表示为：

其中，Featur_ij表示第i个用户的第j条数据所代表的语义特征；n表示POI类型集合中数据的数量；α_n表示第n个POI类型集合中数据的距离权重；β_n表示第n个POI类型集合中数据的时间权重；Distance表示第n个POI地点与用户位置的距离；Time表示用户语义轨迹中的起始时间与当前POI工作时间的交集时长；

步骤三、根据用户的行为模式和手机信令数据，构建强化学习算法的训练数据集，包括用户在不同地点和时间的行为历史，以及每个行为的奖励信息；包括如下过程：

31)根据步骤一中得到的手机信令数据的位置信息与时间信息，与步骤二中得到的用户语义特征，得到当前用户的移动轨迹与行为模式序列；

32)将每个用户的轨迹与行为模式序列，作为训练数据；每条训练数据包含的字段为：<uid,lat,lon,feature>；其中，uid表示用户的身份标识符，lat表示运营商在时间段内记录用户所在位置的纬度，lon表示运营商在时间段内记录到用户所在位置的经度，feature为用户的行为模式；

33)对训练数据中每个用户的轨迹与行为模式序列设置奖励数值，用于表示用户行为的好坏；

步骤四、构建用户出行分布强化学习位置预测模型，实现用户位置未来分布情况的预测；基于历史数据和奖励信息，预测得到用户在不同地点的分布情况，以及每个地区内未来时间段的用户数量；包括：

41)基于注意力机制的长短期记忆网络构建用户出行分布强化学习位置预测模型，并使用用户出行的轨迹与行为模式作为训练数据集，将每个用户当天最后的位置作为模型预测目标，对位置预测模型进行训练；

42)针对位置预测模型定义强化学习算法中的环境、智能体、动作、奖励,用于在模型训练中对模型进行调整；

环境是用户的历史移动轨迹与预测模型的结果，环境与智能体进行交互，通过智能体的动作来进行更新状态；智能体的动作决定是否保留位置预测模型计算出的移动轨迹预测结果，动作是二进制序列，如果保留位置预测模型提供的结果，则设置其二进制为1，不保留则为0；奖励是根据位置预测结果的正确性进行分配的值；如果保留的预测结果正确，则获得相应的奖励值；在每一个时间步中，计算当前行动的奖励，并将其进行累计；

43)利用训练好的用户出行分布强化学习位置预测模型，基于用户的轨迹进行未来位置的预测；即输入单个用户出行的轨迹信息，模型预测得到用户未来的位置；对所有用户的出行进行预测，即可得到用户出行分布结果；

步骤六、利用城市道路数据、候选区域POI数据与商业选址候选区域数据，基于商业选址的影响因素设计商业选址算法，获得商业选址策略，包括商业建设位置、商业类型和运营时间；包括如下过程：

61)定义商业选址的影响因素，包括：繁荣度、竞争度、客流量、交通可达度；

其中，繁荣度基于POI反映该地区的繁荣性，表示为：

其中，P_l,p表示单元格l的繁荣度；k表示单元格内POI种类；N_l表示单元格l内所有类型POI数量的总和；N_l,k表示单元格l内属于k类POI的数量；

竞争度表示该地区中待选POI类型与当前相同POI的关系，表示为：

其中，P_l,c表示单元格l的竞争度，α为权重系数，N_l,k表示单元格l内属于k类POI的数量，N为当前单元格内相同种类POI的数量；

客流量为人群密度，表示为：

P_l,f＝α*count(n)

其中，P_l,f表示单元格l的客流量，count(n)表示预测单元格l内的人口数量；

交通可达度为该地区在指定地区进行选址推荐与主干道之间的距离，表示为：

其中，P_l,t表示单元格l内的交通可达性，distance表示选址地点与主干道的距离；

62)商业选址评分算法定义为：

P＝αP_l,p+βP_l,c+χP_l,f+δP_l,t

其中，α、β、χ、δ均为权重系数，取值为[-1,1]；P表示在该区域建立某种商业POI获取的得分，代表该地区使某种商业POI的利润概率；

63)根据商业选址算法对目标地址的评分，确定评分最高的地址作为目标门店地址；

通过上述步骤，即可实现基于手机信令数据的商业区域选址。

2.如权利要求1所述基于手机信令数据的商业区域选址方法，其特征是，步骤一中收集数据、数据清洗和预处理包括如下具体步骤：

11)根据用户出行时间将用户手机信令数据按照从早到晚进行排序，获得用户一天的轨迹；用户的手机信令数据包括，身份标识符、出行序号、出行时间、经纬度信息；

城市道路数据包括道路类型、道路连接；

POI数据包括娱乐、住宿、工作和餐饮四大类；POI数据包括名称、经纬度和区域名称；

POI类型包括：餐饮美食、公司企业、购物消费、交通设施、金融机构、酒店住宿、科教文化、旅游景点、商务住宅、生活服务、休闲娱乐、医疗保健和运动健身；

12)每个用户的手机的信令数据序列表示为：<uid,move_id,move_vp_id,stime,grid_id,lat,lon>，其中，uid表示用户的身份标识符，move_id表示运营商根据日期划分的用户出行序号即出行顺序的标识符，move_vp_id表示用户在本次出行的序号，stime表示用户的出行时间，grid_id表示用户出行所在的网格信息，lat表示运营商在时间段内记录用户所在位置的纬度，lon表示运营商在时间段内记录到用户所在位置的经度；对于单个用户的手机信令数据序列，包括用户身份标识符、出行序号、时间戳、所在经纬度信息；

13)对于单个用户的手机信令数据存在短时间内在两个基站来回切换，即标注为乒乓数据；保留数据记录中的第一条数据和最后一条数据，其余数据记录删除；

3.如权利要求1所述基于手机信令数据的商业区域选址方法，其特征是，步骤二中，用户行为模式划分为娱乐类、住宿类、工作类和餐饮类。

4.如权利要求1所述基于手机信令数据的商业区域选址方法，其特征是，步骤33)中，所述奖励数值根据用户所在当前区域的特性以及用户的行为模式来进行动态调整。

5.如权利要求1所述基于手机信令数据的商业区域选址方法，其特征是，步骤五具体是使用ArcGis软件中的核密度分析工具，对各区域用户数量进行核密度分析，选出人群密度高的区域作为商业选址的候选区域。

6.如权利要求5所述基于手机信令数据的商业区域选址方法，其特征是，步骤五具体包括如下过程：

53)使用核密度分析工具，配置核密度分析参数，包括输入点图层、输出密度表面、和函数类型、搜索半径；

54)对预测的用户经纬度进行核密度计算，计算点密度并生成密度表面；密度表面显示在Arcgis地图上，使用可视化工具对结果调整颜色和透明度，从而可视化高密度和低密度区域；

55)将密度表面中的高密度区域进行统计汇总，高密度区域即为候选区域。

7.一种利用权利要求1所述基于手机信令数据的商业区域选址方法实现的系统，其特征是，系统包括：手机信令数据预处理模块、用户行为模式决策模块、用户位置预测模块、推荐商业选址候选地点模块和商业选址决策模块；其中：

手机信令数据预处理模块用于获取数据并对数据进行清洗和预处理；

用户行为模式决策模块用于识别用户的不同行为类别；

用户位置预测模块通过强化学习算法构建用户出行分布强化学习预测模型，并预测未来某一时刻的人群分布情况；

推荐商业选址候选地点模块通过核密度分析工具，并将人群密度高的地区作为商业选址的候选区域进行推荐；

商业选址决策模块用于对数据进行综合和分析，得到商业选址决策。