CN109977178A - 基于社交关系亲密度的车主判断系统及方法 - Google Patents
基于社交关系亲密度的车主判断系统及方法 Download PDFInfo
- Publication number
- CN109977178A CN109977178A CN201910238729.5A CN201910238729A CN109977178A CN 109977178 A CN109977178 A CN 109977178A CN 201910238729 A CN201910238729 A CN 201910238729A CN 109977178 A CN109977178 A CN 109977178A
- Authority
- CN
- China
- Prior art keywords
- data
- car owner
- cohesion
- vehicle
- track
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于社交关系亲密度的车主判断系统,包括数据准备,接收车辆人员信息、车主社会关系数据、车主社交行为数据、车辆行为轨迹数据、车主和关系人行为轨迹数据;数据清洗,如果数据准备模块中的数据中存在缺失,则通过已有的关联数据进行填补;数据归一化,对数据进行归一化处理,使得数据符合后续处理所需的标准;数据关联,对于亲密度数据集,通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集,对于轨迹数据集,用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶;模型训练,为亲密度数据集中各关系属性和社交行为在亲密度中所占权重的训练。
Description
技术领域
本发明属于大数据技术领域,特别涉及一种基于社交关系亲密度的车主判断系统及方法。
背景技术
车辆作为一种交通工具和资产持有早已经融入人类生活,也正是因为它的普及,围绕着车辆产生的交通事故和车辆归属纠纷等案件也越来越多。对于此类案件,实际车主毫无疑问是其中的关键角色。传统的处理方式,一般都是通过执法人员按照个人经验对车辆归属进行判断,或是直接将登记车主作为真实车主进行处理。这对于交通事故和车辆归属纠纷的判断和解决带来了局限性和主观性。在另外一些业务场景下,需要关注人员的行为轨迹以及对其的财产进行划分,这时也需要将被关注人实际控制的车辆清点出来。上述情况都需要有技术手段支撑,但是,现实中的方法都不能满足对于准确度的要求。
发明内容
本发明提供一种基于社交关系亲密度的车主判断系统及方法,目的是解决现有的车辆事件中真实车主判断困难的问题。
本发明的实施例之一,一种基于社交关系亲密度的车主判断系统,包括,
数据准备模块,该模块接收车辆人员信息、车主社会关系数据、车主地社交行为数据、车辆行为轨迹数据、车主和关系人行为轨迹数据;
数据清洗模块,如果数据准备模块中的数据中存在缺失,则通过已有的关联数据进行填补;
数据归一化模块,对经过数据清洗模块处理过的数据,进行归一化处理,使得数据符合后续处理所需的标准;
数据关联模块,包括:
对于亲密度数据集,通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集,
对于轨迹数据集,用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶。
模型训练模块,为亲密度数据集中各关系属性和社交行为在亲密度中所占权重的训练。
本发明的友谊效果包括:
1,提升了车辆相关事件处理的客观性和精准度。通过算法计算出的亲密度,能将人们考虑不到的因素挖掘出来加入判断依据,并且找到各个维度与最终结果之间的参数关系,相比传统处理方式更加精准且更具客观性;
2,提升了处理效率。相比遍历所有的关系人,通过计算人与人之间的亲密度关系再降序进行轨迹匹配,极大提升了模型的计算效率。且亲密度作为关键维度之一,也为预测真实车主提供了重要的判断依据。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1是本发明实施例中基于社交关系亲密度的车主判断方法示意图。
图2是本发明实施例中模型训练原理示意图。
具体实施方式
根据一个或者多个实施例,一种基于社交关系亲密度的车主判断系统,包括,
数据准备模块,该模块接收车辆人员信息、车主社会关系数据、车主社交行为数据、车辆行为轨迹数据、车主和关系人行为轨迹数据;
数据清洗模块,如果数据准备模块中的数据中存在缺失,则通过已有的关联数据进行填补;
数据归一化模块,对经过数据清洗模块处理过的数据,进行归一化处理,使得数据符合后续处理所需的标准;
数据关联模块,包括:对于亲密度数据集,通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集,对于轨迹数据集,用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶;
模型训练模块,为亲密度数据集中各关系属性和社交行为在亲密度中所占权重的训练。
根据一个或者多个实施例,如图1所示,一种基于社交关系亲密度的车主判断方法,包括步骤,
数据准备:
1)登记车辆人员的基本信息,信息字段主要包括姓名、车牌号、职业等;
2)登记车主的社会关系数据(主要为直系亲属、旁系亲属、同乡、同学、同事等);
3)登记车主地社交行为数据(同网吧上网、同旅店、同房间住店、同车次乘车、同航班飞机、同案件、同团伙等);
4)车辆行为轨迹数据(包含车牌号,收费站,卡口数据等);
5)登记车主和关系人行为轨迹数据(包含人员住店、上网、巡逻盘查等相关数据);
数据清洗:处理源数据中存在的缺失值,通过已有的数据进行关联,例如登记车主信息中只有身份证没有姓名,则可通过身份证关联姓名。若缺失人员之间的关系,则可通过身份证号前6位判断其是否同乡等。若缺失行为轨迹数据,则利用最近邻方法进行填充,例如缺失一条轨迹信息,则可通过获该时间点上最近的轨迹点进行填充;
数据归一化:
1)由于数据集维度偏多,而每个维度的数据标准不同,例如同网吧上网这类数据,区间范围在0~500之间,而同航班、同案件这些维度的数据,范围则基本都是在0~10之间,为了使得最后结果不受数值大的维度影响而产生偏差,所以采用Min-Max-Normalization进行归一化,将数值投影在0~1之间。Min-Max-Normalization具体方法为:找到数据的最小值Min和最大值Max,再将原始值x通过min-max标准化映射成在区间[0,1]中。Min-Max-Normalization是归一化方法,公式为:(原数据-最小值)/(最大值-最小值)。
2)还有一些维度涉及到一些非连续性的值,例如关系数据,不是具体的数值而是类型值,则采用labelencoding的方式,将类型值转化为0和1这种连续值,以便建模使用。Labelencoding的中文术语是标签编码,是指将不连续的数字或文本转化为连续数值型变量。
数据关联:分为两块数据的关联,
1)亲密度数据集:通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集;
2)轨迹数据集:用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶。
模型训练:主要为亲密度数据集中各关系属性和社交行为在亲密度中所占权重的训练,该步骤进一步包括有
步骤1,打标签::
考虑到关系属性和社交行为维度较多,人工直接对其权重赋值具有一定的主观性,所以我们采用有监督训练的方式,将已经确定登记车主与实际车主为不同人员的这部分label标记为1,另外正常车主与其关系人标记为0;
步骤2,模型训练:
1)拆分训练集与测试集:以3:3:4的比例分配数据集进行交叉训练和验证;
2)构建线性回归,其中
前向传播:先人为给一个权重参数值,再将训练数据集向量化放入模型,初步计算出的亲密度得分,再将亲密度得分放入sigmod函数将其映射到0~1之间,然后再设定一个阈值将数据分为0、1这两类,这样就完成了一次前向传播。
反向传播:根据前向传播的结果与真实值做对比,计算损失函数,使用随机梯度下降的方法反向传播优化各权重参数和阈值。
具体流程如2所示;
3)计算登记车主与关系人对车辆历史轨迹匹配度
根据三方的轨迹判断车辆的真实驾驶人,三方轨迹包含车辆行为轨迹、登记车主行为轨迹、关系人行为轨迹,拿到这些轨迹之后再分别计算车辆与登记车主的行为轨迹匹配情况、关系人与车辆的轨迹匹配情况,最终判断车辆历史驾驶次数进行真实的划分
步骤3,轨迹匹配:将以上算法训练出的去权重乘以系数得到登记车主与关系人之间的亲密度得分,再用车辆轨迹与人员的历史行为轨迹做匹配,若同时满足以下3个条件的关系人则被列入极有可能是真实车主的列表,
1)关系人与登记车主亲密度高(亲密度前10);
2)登记车主行为轨迹与车辆行驶轨迹匹配度低于50%;
3)关系人行为轨迹与车辆行驶轨迹重匹配度高于50%;
若以上无人满足,则取与车辆轨迹匹配度最高者为真实车主。
值得说明的是,虽然前述内容已经参考若干具体实施方式描述了本发明创造的精神和原理,但是应该理解,本发明并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (7)
1.一种基于社交关系亲密度的车主判断系统,包括,
数据准备模块,该模块接收车辆人员信息、车主社会关系数据、车主社交行为数据、车辆行为轨迹数据、车主和关系人行为轨迹数据;
数据清洗模块,如果数据准备模块中的数据中存在缺失,则通过已有的关联数据进行填补;
数据归一化模块,对经过数据清洗模块处理过的数据,进行归一化处理,使得数据符合后续处理所需的标准;
数据关联模块,包括:
对于亲密度数据集,通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集,
对于轨迹数据集,用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶;
模型训练模块,为亲密度数据集中各关系属性和社交行为在亲密度中所占权重的训练。
2.根据权利要求1所述的基于社交关系亲密度的车主判断系统,其特征在于,所述数据归一化模块的归一化采用Min-Max-Normalization方式进行归一化。
3.根据权利要求2所述的基于社交关系亲密度的车主判断系统,其特征在于,所述数据归一化模块对于关系数据,采用标签编码的方式,将类型值转化为0和1这种连续值,用于建模使用。
4.计算登记车主与关系人对车辆历史轨迹匹配度:
匹配度公式为:对车辆历史真实驾驶次数/总出行次数
核心思想:根据三方的轨迹判断车辆的真实驾驶人,三方轨迹包含车辆行为轨迹、登记车主行为轨迹、关系人行为轨迹,拿到这些轨迹之后再分别计算车辆与登记车主的行为轨迹匹配情况、关系人与车辆的轨迹匹配情况,最终判断车辆历史驾驶次数进行真实的划分。例如张三名下的车辆一共出行10次,其中有9次与李四实名制行为轨迹吻合,则李四对车辆轨迹匹配度为90%。
5.根据权利要求1所述的基于社交关系亲密度的车主判断系统,其特征在于,所述模型训练模块的过程包括:
步骤1,打标签,采用有监督训练的方式,将已经掌握登记车主与实际车主为不同人员的这部分车主数据标记为1,其他的登记车主与实际车主为同一人的正常车主与其关系人标记为0;
步骤2,模型训练,包括步骤
(1)拆分训练集与测试集,以3:3:4的比例分配数据集进行交叉训练和验证;
(2)构建线性回归,其中对于,
前向传播,先人为给一个权重参数值,再将训练数据集向量化放入模型,初步计算出的亲密度得分,再将亲密度得分放入sigmod函数将其映射到0~1之间,然后再设定一个阈值将数据分为0、1这两类,完成了一次前向传播;
反向传播,根据前向传播的结果与真实值做对比,计算损失函数,使用随机梯度下降的方法反向传播优化各权重参数。
步骤3,轨迹匹配,将经过前述步骤已经迭代训练出的权重参数乘以系数得到登记车主与关系人之间的亲密度得分,再用车辆轨迹与人员的行为轨迹做匹配,若同时满足以下3个条件的关系人则被列入真实车主列表,3个条件是,
1)关系人与登记车主亲密度高(亲密度前10);
2)登记车主行为轨迹与车辆行驶轨迹匹配度低于50%;
3)关系人行为轨迹与车辆行驶轨迹重匹配度高于50%;
若以上无人满足,则取与车辆轨迹匹配度最高者为真实车主。
6.一种基于社交关系亲密度的车主判断方法,包括步骤,
数据准备,包括:登记车辆人员的基本信息,登记车主的社会关系数据,登记车主地社交行为数据,记录车辆行为轨迹数据,记录车主和关系人行为轨迹数据;
数据清洗,处理源数据中存在的缺失值,通过已有的数据进行关联;
数据归一化,用Min-Max-Normalization进行归一化,将数值投影在0~1之间;
数据关联,对于亲密度数据集,通过身份证号关联人员基本信息、社会关系数据、社交行为数据作为亲密度训练数据集,对于轨迹数据集,用车牌号关联车辆轨迹数据,用身份证号关联人员轨迹数据,两个数据拟合判断车辆的实际驾驶;
模型训练,对亲密度数据集中各关系属性和社交行为在亲密度中所占权重做训练。
7.根据权利要求6所述的基于社交关系亲密度的车主判断方法,其特征在于,对于模型训练的步骤,进一步包括
步骤1,打标签,采用有监督训练的方式,将已经确定登记车主与实际车主不相同的人员标记为1,另外正常车主与其关系人标记为0;
步骤2,模型训练,
拆分训练集与测试集:以3:3:4的比例分配数据集进行交叉训练和验证;
构建线性回归,其中,
前向传播,先人为给一个权重参数值,再将训练数据集向量化放入模型,初步计算出的亲密度得分,再将亲密度得分放入sigmod函数将其映射到0~1之间,然后再设定一个阈值将数据分为0、1这两类,这样就完成了一次前向传播,
反向传播,根据前向传播的结果与真实值做对比,计算损失函数,使用随机梯度下降的方法反向传播优化各权重参数和阈值;
步骤3,轨迹匹配,将训练出的去权重乘以系数得到登记车主与关系人之间的亲密度得分,再用车辆轨迹与人员的历史行为轨迹做匹配,若同时满足以下3个条件的关系人则被列入真实车主的列表,这3个条件是,
1)关系人与登记车主亲密度高(亲密度前10);
2)登记车主行为轨迹与车辆行驶轨迹匹配度低于50%;
3)关系人行为轨迹与车辆行驶轨迹重匹配度高于50%;
若以上无人满足,则取与车辆轨迹匹配度最高者为真实车主。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910238729.5A CN109977178A (zh) | 2019-03-27 | 2019-03-27 | 基于社交关系亲密度的车主判断系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910238729.5A CN109977178A (zh) | 2019-03-27 | 2019-03-27 | 基于社交关系亲密度的车主判断系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109977178A true CN109977178A (zh) | 2019-07-05 |
Family
ID=67081022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910238729.5A Pending CN109977178A (zh) | 2019-03-27 | 2019-03-27 | 基于社交关系亲密度的车主判断系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109977178A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915368A (zh) * | 2020-07-30 | 2020-11-10 | 上海数策软件股份有限公司 | 汽车行业客户id识别系统、方法及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016177066A1 (zh) * | 2015-08-06 | 2016-11-10 | 中兴通讯股份有限公司 | 一种人员潜在关系分析方法和装置 |
CN108897780A (zh) * | 2018-06-06 | 2018-11-27 | 山东合天智汇信息技术有限公司 | 一种分析计算人员亲密度的方法及系统 |
CN109376278A (zh) * | 2018-08-27 | 2019-02-22 | 中国电子科技集团公司电子科学研究院 | 人车全息档案研判搜索系统 |
-
2019
- 2019-03-27 CN CN201910238729.5A patent/CN109977178A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016177066A1 (zh) * | 2015-08-06 | 2016-11-10 | 中兴通讯股份有限公司 | 一种人员潜在关系分析方法和装置 |
CN108897780A (zh) * | 2018-06-06 | 2018-11-27 | 山东合天智汇信息技术有限公司 | 一种分析计算人员亲密度的方法及系统 |
CN109376278A (zh) * | 2018-08-27 | 2019-02-22 | 中国电子科技集团公司电子科学研究院 | 人车全息档案研判搜索系统 |
Non-Patent Citations (1)
Title |
---|
赵伟强等: "一种基于真实车辆轨迹的车辆关系挖掘方法", 《电脑编程技巧与维护》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111915368A (zh) * | 2020-07-30 | 2020-11-10 | 上海数策软件股份有限公司 | 汽车行业客户id识别系统、方法及介质 |
CN111915368B (zh) * | 2020-07-30 | 2024-02-20 | 上海数策软件股份有限公司 | 汽车行业客户id识别系统、方法及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109887292B (zh) | 车辆类型的识别方法及系统 | |
CN109903553B (zh) | 多源数据挖掘的公交车上下车站点识别和检验方法 | |
CN109145982A (zh) | 驾驶员的身份识别方法及装置、存储介质、终端 | |
CN105678457A (zh) | 基于地点挖掘的用户行为评估方法 | |
CN108803623A (zh) | 一种自动驾驶车辆个性化行车的方法和行车合法化的系统 | |
CN110884535A (zh) | 一种智能列车系统实现方法 | |
CN113627438B (zh) | 基于票据识别和配置引擎自动报销差旅费的方法及系统 | |
JP2021044005A (ja) | 歩行中または運転中に使用者端末の動作を制限する方法、使用者端末、サービスサーバおよび補償サーバ | |
CN111027929A (zh) | 地铁票务清分方法及装置 | |
CN111584091B (zh) | 一种城轨线路级密切接触者交叉感染风险辨识方法和装置 | |
CN109545027A (zh) | 一种实训台、乘务员仿真实训方法及装置 | |
CN109977178A (zh) | 基于社交关系亲密度的车主判断系统及方法 | |
CN116564551B (zh) | 一种数据-知识驱动的城市轨道交通风险辨识方法 | |
CN110942158B (zh) | 铁路列车添乘检查系统 | |
Katrakazas et al. | Big data and emerging transportation challenges: Findings from the noesis project | |
CN114331181A (zh) | 基于大数据的车辆驾驶行为风险分析方法 | |
CN115817587A (zh) | 用于解决列车运行延时的实时重调度方法和装置 | |
CN114742293A (zh) | 一种驾驶人交通安全风险评价与人车伴随分析方法及系统 | |
Nishida et al. | Modeling of a mode choice behavior toward agent-based mobility as a service simulation | |
CN113393080A (zh) | 公共交通客运机构乘客信息管理系统及方法 | |
Dong | Analysis of urban rail transit station planning combining simulated annealing algorithm | |
CN115034622B (zh) | 一种公交系统输入输出风险量化评估方法 | |
Uriesi | Passenger Perceptions of Metrorail Services in Johannesburg | |
CN117290618B (zh) | 城市、城际轨道交通的时空伴随人群搜寻方法及系统 | |
Karlsen et al. | Customer segmentation of wireless trajectory data |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
AD01 | Patent right deemed abandoned | ||
AD01 | Patent right deemed abandoned |
Effective date of abandoning: 20230609 |