CN113344056A - 一种人员移动性预测模型的训练方法及装置 - Google Patents

一种人员移动性预测模型的训练方法及装置 Download PDF

Info

Publication number
CN113344056A
CN113344056A CN202110597962.XA CN202110597962A CN113344056A CN 113344056 A CN113344056 A CN 113344056A CN 202110597962 A CN202110597962 A CN 202110597962A CN 113344056 A CN113344056 A CN 113344056A
Authority
CN
China
Prior art keywords
track information
trained
prediction model
information
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110597962.XA
Other languages
English (en)
Other versions
CN113344056B (zh
Inventor
乔媛媛
缪庆
李爱民
张宇中
杨洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN202110597962.XA priority Critical patent/CN113344056B/zh
Publication of CN113344056A publication Critical patent/CN113344056A/zh
Application granted granted Critical
Publication of CN113344056B publication Critical patent/CN113344056B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • G06F30/27Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Geometry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供的一种人员移动性预测模型的训练方法及装置,应用于信息技术领域,通过在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息并进行分析,得到各自对应的质量分数,对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,可以避免质量较差的样本数据对预测模型的训练过程的影响,提高训练号的模型的质量。

Description

一种人员移动性预测模型的训练方法及装置
技术领域
本发明涉及信息技术领域,特别是涉及一种人员移动性预测模型的训练方法及装置。
背景技术
目前,基于深度学习的城市人群移动性预测已经有着广泛的应用,在实际生产中,通过收集人群的轨迹样本数据,并对人群的未来活动轨迹进行预测,可以便于根据预测结果提前进行指挥、疏导等工作。
然而,在进行人群移动性预测时,由于收集到的轨迹样本数据往往存在数据精度不高、样本质量偏差大等问题,从而导致所得到的预测结果准确度较低。
发明内容
本发明实施例的目的在于提供一种人员移动性预测模型的训练方法及装置。,用以解决轨迹样本数据精度不高导致的预测结果准确度较低问题。具体技术方案如下:
本申请实施的第一方面,首先提供了一种人员移动性预测模型的训练方法,上述方法包括:
获取样本人员的多条轨迹信息;
在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;
将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
可选的,将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,包括:
将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果;
计算对应预测结果的损失;
计算并以预测结果对应的损失和质量分数之积作为目标损失;
根据目标损失,对待训练的预测模型的参数进行更新,返回将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果的步骤继续执行,直至预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
可选的,将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数之后,上述方法还包括:
将多条轨迹信息中,对应的质量分数不大于第一预设阈值的轨迹信息抛弃。
可选的,上述方法还包括:
获取目标人员的轨迹信息;
将目标人员的轨迹信息输入训练好的预测模型,计算得到目标用户预测轨迹。
本申请实施的第二方面,提供了一种人员移动性预测模型的训练装置,上述装置包括:
信息获取模块,用于获取样本人员的多条轨迹信息;
样本设置模块,用于在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
校验模型获取模块,用于将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
质量分数获取模块,用于将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;
预测模型获取模块,用于将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
可选的,预测模型获取模块,包括:
预测结果获取子模块,用于将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果;
预测损失计算子模块,用于计算对应预测结果的损失;
目标损失计算子模块,用于计算并以预测结果对应的损失和质量分数之积作为目标损失;
根据目标损失,对待训练的预测模型的参数进行更新,返回将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果的步骤继续执行,直至预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
可选的,上述装置还包括:
信息抛弃模型,用于将多条轨迹信息中,对应的质量分数不大于第一预设阈值的轨迹信息抛弃。
可选的,上述装置还包括:
轨迹信息获取模块,用于获取目标人员的轨迹信息;
预测轨迹计算模块,用于将目标人员的轨迹信息输入训练好的预测模型,计算得到目标用户预测轨迹。
本申请实施的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一人员移动性预测模型的训练方法。
本申请实施的另一方面,还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一人员移动性预测模型的训练方法。
本发明实施的另一方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一人员移动性预测模型的训练方法。
本发明实施例有益效果:
本发明实施例提供的人员移动性预测模型的训练方法,通过获取样本人员的多条轨迹信息;在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。通过将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,可以避免质量较差的样本数据对预测模型的训练过程的影响,提高训练号的模型的质量。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
图1为本申请实施例提供的人员移动性预测模型的训练方法的一种流程示意图;
图2为本申请实施例提供的校验网络的一种结构示意图;
图3为本申请实施例提供的预测模型的一种结构示意图;
图4为本申请实施例提供的通过轨迹信息训练预测模型的一种流程示意图;
图5为本申请实施例提供的人员移动性预测模型的训练方法的一种实例图;
图6为本申请实施例提供的人员移动性预测模型的训练装置的一种结构示意图;
图7为本申请实施例提供的电子设备的一种结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员基于本申请所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施的第一方面,首先提供了一种人员移动性预测模型的训练方法,上述方法包括:
获取样本人员的多条轨迹信息;
在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;
将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
通过本申请实施例的人员移动性预测模型的训练方法,可以将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,可以避免质量较差的样本数据对预测模型的训练过程的影响,提高训练号的模型的质量。目前,人员移动性预测模型一般均是通过循环神经网络的方法进行预测,然而该方法并没有考虑数据质量的问题,因为在实际的生产生活过程中,基于GPS(Global Positioning System,全球定位系统)和基站捕获的轨迹数据,往往会存在定位误差和位置跳变等问题,例如当GPS定位的用户在不断更换速度较快交通工具时,由于移动速度不断发生改变,非常容易产生定位误差。而位置跳变则可能是在地铁等信号较弱或信号难以覆盖的区域,乘坐交通工具的用户发生高速移动后,从一个位置跳变到另外一个较远的位置。如果使用这种存在定位误差和位置跳变数据样本,则很容易导致模型性能变差,难以收敛到较高的精确度。而如果人工清洗这些存在问题的数据,难以清洗完成所有的坏样本,并且需要对于每一种误差作单独的处理,效率较低,工作量较大。本申请实施例的人员移动性预测模型的训练方法,通过基于深度学习的质量校验网络训练负样本的方式,使得模型能够无监督的对抗负样本,并且输出评价每一个样本质量的权重指标,对于表现评分较好样本给予更高的权重,而评分较低的样本给予较低的权重。这样权重大的样本在进行梯度更新时所学习到的更多,权重小的样本在进行梯度更新时则更新值较少。通过这样的方式无需人工清洗数据,而是赋予每一个数据质量权重,通用性更高,效果更稳定。
以下进行详细说明,参见图1,图1为本申请实施例提供的人员移动性预测模型的训练方法的一种流程示意图,包括:
步骤S11,获取样本人员的多条轨迹信息。
获取样本人员的多条轨迹信息,可以为获取样本人员过去的多个时间段的多条轨迹信息。例如,获取获取样本人员过去一周内每一天的轨迹信息,得到七条轨迹信息。
本申请实施例的人员移动性预测模型,应用于对模型进行训练的智能终端,具体的,该智能终端可以是电脑或服务器等。
步骤S12,在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息。
其中,上述选取指定比例可以是根据实际使用过情况设置的某一数值,轨迹变换可以为通过替换的方式进行替换。选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,可以通过将指定比例的轨迹信息替换为某一制定信息或其他人员的信息的方式进行轨迹变换。例如,选取样本人员过去一周内的轨迹信息中任意两天的轨迹信息,并替换为其他人员的轨迹信息的方式进行轨迹变换。
步骤S13,将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型。
其中,将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,可以通过sigmoid激活函数对负样本轨迹信息及正样本轨迹信息进行分析,得到最终范围在(0,1)之间的质量评分。
可选的,将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数之后,上述方法还包括:将多条轨迹信息中,对应的质量分数不大于第一预设阈值的轨迹信息抛弃。
本申请实施例中的校验网络可以参见图2,其中,图中带质量校验的移动性预测网络主体分为两大部分,一部分是图中左下角方块中的校验网络另一部分则是图中右上角的预测模型。校验网络对训练好的网络模型进行校验,预测网络根据训练轨迹和训练目标计算得到当前的损失,并根据当前损失和权重系数继续进行训练。
例如,本申请实施例中的校验网络对于输入到校验网络中的轨迹训练数据,首先,会经过一个词嵌入向量的编码过程,将离散的数据类型转化为连续的词嵌入向量,之后通过随机替换模块制造负样本,最终输出一个质量评分,作为每一条数据的权重。如,用户数据首先通过词嵌入模块转为连续型的词向量,如输入的是周一到周日七天的数据,因此可以转化为七条RNN(Recurrent Neural Network,循环神经网络)序列,之后经过随机替换模块,这个模块的功能是从七条RNN序列中随机选择两条替换为其他用户的RNN序列,通过该方式生成具有对抗意义的负样本,从而增强模型的鲁棒性。原始样本的质量得分应当比该负样本的得分要高,并以此对检验网络的参数进行更新。经过随机替换的七条RNN序列最终合并在一起输入到一个全连接神经网络,并经过sigmoid激活函数以得到最终范围在(0,1)之间的质量评分。
步骤S14,将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数。
其中,将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数,可以参见步骤S13,通过sigmoid激活函数对负样本轨迹信息及正样本轨迹信息进行分析,得到最终范围在(0,1)之间的质量评分。
步骤S15,将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
本申请实施例中的预测模型可以参见图3。例如,预测模型对于输入到校验网络中的轨迹训练数据,可以经过一个词嵌入的过程,将离散的数据类型转化为连续的词嵌入向量,之后输入到循环神经网络或者其变种中,得到一个损失函数,通过先将这个损失与校验网络中得到的权重进行乘积,将乘积后得到的值作为新的损失训练我们的预测网络。通过在预测模型中应用质量校验网络中的权重输出值,每一次梯度更新都会根据样本质量的好坏来采取更新策略,从而可以考虑每一个样本质量的区别,得到更好更好的效果。
可选的,上述方法还包括:获取目标人员的轨迹信息;将目标人员的轨迹信息输入训练好的预测模型,计算得到目标用户预测轨迹。
通过本申请实施例的人员移动性预测模型的训练方法,可以将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,可以避免质量较差的样本数据对预测模型的训练过程的影响,提高训练号的模型的质量。
可选的,参见图4,步骤S15将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,包括:
步骤S151,将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果。
其中,对应样本人员的预测结果可以为样本人员在未来一段时间的预测轨迹,例如,当多条轨迹信息为样本人员再过去一周内的轨迹信息时,对应样本人员的预测结果可以为对应样本人员在未来一天内的预测轨迹。
步骤S152,计算对应预测结果的损失。
步骤S153,计算并以预测结果对应的损失和质量分数之积作为目标损失。
步骤S154,根据目标损失,对待训练的预测模型的参数进行更新,返回将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果的步骤继续执行,直至预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
可见,通过本申请实施例的方法,可以根据目标损失,对待训练的预测模型的参数进行更新,直至预测结果对应的损失小于第二预设阈值,得到训练好的预测模型,从而可以通过训练好的预测模型对人员的轨迹进行预测。
参见图5,图5为本申请实施例提供的人员移动性预测模型的训练方法的一种实例图。
在系统部署完成之后,预测系统就可以根据使用者的实际需求进行预测。系统分为两种模式,一种是主动预测模式,一种是被动命令模式。在主动预测模式下,该系统可以实时地监控数据采集范围内所有用户的轨迹状态与流动性情况,并作出相应预测。当处于被动命令模式时,则会根据系统使用者的指令来输出相应的预测结果。
具体的,预测的步骤包括:
1、获取用户数据,系统通过多种渠道(如基站信号塔、手机GPS定位信息来观测用户的轨迹与流动性情况,并将这些数据返回到数据中心进行处理,整理归档后提交给预测主系统。获取用户数据后,可以判断当前是否有空闲资源,若有则执行最后一步,若没有则直接执行最后一步返回结果。
2、聚合用户轨迹,如果当前系统资源状态空闲,那么就会将上传到主系统的用户数据按照用户标识ID(Identity document,身份标识)进行聚合,得到每个用户的连续时间轨迹。
3、得到输入数据,聚合完毕的数据并不能直接拿来使用,因为此时的数据可能存在如信息缺失严重、样本质量较低等问题,如果直接用来预测轨迹会导致较大的误差,需要先输入到校验模型中进行数据质量的判别工作。得到输入数据后还可以运行预测模型。
4、校验模型,得到的数据首先要输入到校验模型中,判断数据的质量是否合格。校验模型会输出一个质量分数,并将质量分数通过一个门限来判断是否舍弃,对于质量较低的样本会进行舍弃,而对于质量较高的样本则予以保留。
5、判断质量是否达标,根据校验模型以往的结果综合判断来确定一个门限,只有达标通过的样本才会保留,并且输入到预测模型之中,预测模型会根据这个质量权重与损失求乘积,作为新的损失来进行梯度更新,若模型质量达标则执行运行预测模型的步骤,若未达标则直接执行最后一步返回结果。
6、运行预测模型,在接收到质量合格的样本后,会通过预测模型进行预测,最后预测模型会生成一条表示未来用户状态的RNN序列,相当于对未来用户的轨迹作出了一种估计,若无法运行则直接执行最后一步返回结果。
7、返回结果,得到的RNN序列最终会转变为未来用户状态的文本表示,也可以输出到用户轨迹图中,通过这种可视化的轨迹预测直观的反应出预测效果。
为了表示本申请的人员移动性预测模型的训练方法的效果,本申请的又一实施例中,还通过上述任一实施例训练得到的预测模型进行预测,得到的结果如下:
表1为本申请实施例提供的预测模型的预测结果的对比表
Figure BDA0003091878400000111
其中,Markov(马尔可夫模型)、PMM(一种通用性的流动性框架)、RNN、RNN withCalibration(带校准的循环神经网络)、Deep Transport、Deep Transport withCalibration、Deep Move、Deep Move with Calibration,分别表示不同的网络模型,从表中可以看到不同网络模型预测不同数据时的准确率。传统的马可夫模型缺少对于长期的依赖关系,而循环神经网络在应用于人群轨迹预测时则会碰到由于人类移动的随机性和无目的性以及信号强弱变化导致的位置跳变和定位误差等一系列问题。本申请实施例通过质量校验网络根据样本好坏,无监督的给予每一个样本一个质量评分,通过这个质量评分修改得到的损失,更有效果的进行神经网络的梯度更新,从而达到了更好的效果。
通过上述表1的实验可知,本申请的预测模型在多个预测模型上具有普适性,添加校验网络模板相较于未添加有3%左右的准确度提升。同时校验网络可以在预测之前提前预训练完成,在实际的预测过程中几乎不占用额外的时间开销。根据表1可知:添加校验模块后预测网络的效果,一共完成了三次添加校验网络模块的实验,分别是添加校验网络的RNN模型、添加校验网络的DeepTransport模型以及添加了校验网络的DeepMove模型,在四个数据集上都取得了更为优秀的准确率,与未添加校验网络相比基本上都提升了2~3%的准确率。因为校验网络只是作为预测模型的前置网络出现,因此在实际的预测过程中并不会有额外的时间开销。
本申请实施的第二方面,提供了一种人员移动性预测模型的训练装置,图6为本申请实施例提供的人员移动性预测模型的训练装置的一种结构示意图,上述装置包括:
信息获取模块601,用于获取样本人员的多条轨迹信息;
样本设置模块602,用于在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
校验模型获取模块603,用于将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
质量分数获取模块604,用于将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;
预测模型获取模块605,用于将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
可选的,预测模型获取模块605,包括:
预测结果获取子模块,用于将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果;
预测损失计算子模块,用于计算对应预测结果的损失;
目标损失计算子模块,用于计算并以预测结果对应的损失和质量分数之积作为目标损失;
根据目标损失,对待训练的预测模型的参数进行更新,返回将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应样本人员的预测结果的步骤继续执行,直至预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
可选的,上述装置还包括:
信息抛弃模型,用于将多条轨迹信息中,对应的质量分数不大于第一预设阈值的轨迹信息抛弃。
可选的,上述装置还包括:
轨迹信息获取模块,用于获取目标人员的轨迹信息;
预测轨迹计算模块,用于将目标人员的轨迹信息输入训练好的预测模型,计算得到目标用户预测轨迹。
通过本申请实施例的人员移动性预测模型的训练装置,可以将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型,可以避免质量较差的样本数据对预测模型的训练过程的影响,提高训练号的模型的质量。
本发明实施例还提供了一种电子设备,如图7所示,包括处理器701、通信接口702、存储器703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信,
存储器703,用于存放计算机程序;
处理器701,用于执行存储器703上所存放的程序时,实现如下步骤:
获取样本人员的多条轨迹信息;
在多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
将负样本轨迹信息及正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照正样本轨迹信息对应的质量分数高于负样本轨迹信息对应的质量分数的调整方式对待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
将样本人员的多条轨迹信息输入训练好的校验网络模型,得到对应各轨迹信息的质量分数;
将多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对待训练的预测模型进行训练,得到训练好的预测模型。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一人员移动性预测模型的训练方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一人员移动性预测模型的训练方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备、存储介质及计算机程序产品实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种人员移动性预测模型的训练方法,其特征在于,所述方法包括:
获取样本人员的多条轨迹信息;
在所述多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
将所述负样本轨迹信息及所述正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照所述正样本轨迹信息对应的质量分数高于所述负样本轨迹信息对应的质量分数的调整方式对所述待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
将所述样本人员的多条轨迹信息输入所述训练好的校验网络模型,得到对应各轨迹信息的质量分数;
将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对所述待训练的预测模型进行训练,得到训练好的预测模型。
2.根据权利要求1所述的方法,其特征在于,所述将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对所述待训练的预测模型进行训练,得到训练好的预测模型,包括:
将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应所述样本人员的预测结果;
计算对应所述预测结果的损失;
计算并以所述预测结果对应的损失和所述质量分数之积作为目标损失;
根据所述目标损失,对所述待训练的预测模型的参数进行更新,返回所述将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应所述样本人员的预测结果的步骤继续执行,直至所述预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
3.根据权利要求1所述的方法,其特征在于,所述将所述样本人员的多条轨迹信息输入所述训练好的校验网络模型,得到对应各轨迹信息的质量分数之后,所述方法还包括:
将所述多条轨迹信息中,对应的质量分数不大于所述第一预设阈值的轨迹信息抛弃。
4.根据权利要求1-3任一所述的方法,其特征在于,所述方法还包括:
获取目标人员的轨迹信息;
将所述目标人员的轨迹信息输入所述训练好的预测模型,计算得到所述目标用户预测轨迹。
5.一种人员移动性预测模型的训练装置,其特征在于,所述装置包括:
信息获取模块,用于获取样本人员的多条轨迹信息;
样本设置模块,用于在所述多条轨迹信息中,选取指定比例的轨迹信息进行轨迹变换作为负样本轨迹信息,将未进行轨迹变换的轨迹信息作为正样本轨迹信息;
校验模型获取模块,用于将所述负样本轨迹信息及所述正样本轨迹信息分别输入到待训练的校验网络模型中进行分析,得到各自对应的质量分数,并按照所述正样本轨迹信息对应的质量分数高于所述负样本轨迹信息对应的质量分数的调整方式对所述待训练的校验网络模型的参数进行调整,得到训练好的校验网络模型;
质量分数获取模块,用于将所述样本人员的多条轨迹信息输入所述训练好的校验网络模型,得到对应各轨迹信息的质量分数;
预测模型获取模块,用于将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,对所述待训练的预测模型进行训练,得到训练好的预测模型。
6.根据权利要求5所述的装置,其特征在于,所述预测模型获取模块,包括:
预测结果获取子模块,用于将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应所述样本人员的预测结果;
预测损失计算子模块,用于计算对应所述预测结果的损失;
目标损失计算子模块,用于计算并以所述预测结果对应的损失和所述质量分数之积作为目标损失;
根据所述目标损失,对所述待训练的预测模型的参数进行更新,返回所述将所述多条轨迹信息中,对应的质量分数大于第一预设阈值的轨迹信息输入待训练的预测模型,得到对应所述样本人员的预测结果的步骤继续执行,直至所述预测结果对应的损失小于第二预设阈值,得到训练好的预测模型。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
信息抛弃模型,用于将所述多条轨迹信息中,对应的质量分数不大于所述第一预设阈值的轨迹信息抛弃。
8.根据权利要求5-7任一所述的装置,其特征在于,所述装置还包括:
轨迹信息获取模块,用于获取目标人员的轨迹信息;
预测轨迹计算模块,用于将所述目标人员的轨迹信息输入所述训练好的预测模型,计算得到所述目标用户预测轨迹。
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-4任一所述的方法步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-4任一所述的方法步骤。
CN202110597962.XA 2021-05-31 2021-05-31 一种人员移动性预测模型的训练方法及装置 Active CN113344056B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110597962.XA CN113344056B (zh) 2021-05-31 2021-05-31 一种人员移动性预测模型的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110597962.XA CN113344056B (zh) 2021-05-31 2021-05-31 一种人员移动性预测模型的训练方法及装置

Publications (2)

Publication Number Publication Date
CN113344056A true CN113344056A (zh) 2021-09-03
CN113344056B CN113344056B (zh) 2022-11-22

Family

ID=77472317

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110597962.XA Active CN113344056B (zh) 2021-05-31 2021-05-31 一种人员移动性预测模型的训练方法及装置

Country Status (1)

Country Link
CN (1) CN113344056B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180277098A1 (en) * 2017-03-23 2018-09-27 Samsung Electronics Co., Ltd. Training method and apparatus for speech recognition
CN109684916A (zh) * 2018-11-13 2019-04-26 恒睿(重庆)人工智能技术研究院有限公司 基于路径轨迹数据异常检测方法、系统、设备及存储介质
US20190133468A1 (en) * 2017-11-03 2019-05-09 Samsung Electronics Co., Ltd. Method and apparatus for high accuracy photoplethysmogram based atrial fibrillation detection using wearable device
US20190355134A1 (en) * 2018-05-16 2019-11-21 Nec Laboratories America, Inc. Balancing diversity and precision of generative models with complementary density estimators
CN111127452A (zh) * 2019-12-27 2020-05-08 上海箱云物流科技有限公司 一种基于云端处理的集装箱智能ocr识别方法
CN111462069A (zh) * 2020-03-30 2020-07-28 北京金山云网络技术有限公司 目标对象检测模型训练方法、装置、电子设备及存储介质
CN111583229A (zh) * 2020-05-09 2020-08-25 江苏野马软件科技有限公司 一种基于卷积神经网络路面故障检测方法
CN111767475A (zh) * 2020-03-20 2020-10-13 吉利汽车研究院(宁波)有限公司 一种目标行人轨迹预测模型训练方法、装置、电子设备及存储介质
CN112733908A (zh) * 2020-12-31 2021-04-30 大连海事大学 一种高精度的车辆轨迹多模态预测方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180277098A1 (en) * 2017-03-23 2018-09-27 Samsung Electronics Co., Ltd. Training method and apparatus for speech recognition
US20190133468A1 (en) * 2017-11-03 2019-05-09 Samsung Electronics Co., Ltd. Method and apparatus for high accuracy photoplethysmogram based atrial fibrillation detection using wearable device
US20190355134A1 (en) * 2018-05-16 2019-11-21 Nec Laboratories America, Inc. Balancing diversity and precision of generative models with complementary density estimators
CN109684916A (zh) * 2018-11-13 2019-04-26 恒睿(重庆)人工智能技术研究院有限公司 基于路径轨迹数据异常检测方法、系统、设备及存储介质
CN111127452A (zh) * 2019-12-27 2020-05-08 上海箱云物流科技有限公司 一种基于云端处理的集装箱智能ocr识别方法
CN111767475A (zh) * 2020-03-20 2020-10-13 吉利汽车研究院(宁波)有限公司 一种目标行人轨迹预测模型训练方法、装置、电子设备及存储介质
CN111462069A (zh) * 2020-03-30 2020-07-28 北京金山云网络技术有限公司 目标对象检测模型训练方法、装置、电子设备及存储介质
CN111583229A (zh) * 2020-05-09 2020-08-25 江苏野马软件科技有限公司 一种基于卷积神经网络路面故障检测方法
CN112733908A (zh) * 2020-12-31 2021-04-30 大连海事大学 一种高精度的车辆轨迹多模态预测方法

Also Published As

Publication number Publication date
CN113344056B (zh) 2022-11-22

Similar Documents

Publication Publication Date Title
CN110147456B (zh) 一种图像分类方法、装置、可读存储介质及终端设备
CN110928993A (zh) 基于深度循环神经网络的用户位置预测方法及系统
CN108108808B (zh) 一种基于深度信念网络的位置预测方法及装置
CN109214446B (zh) 潜力绩优人员类型识别方法、系统、终端及计算机可读存储介质
CN108229718A (zh) 一种信息预测方法及装置
CN111753076B (zh) 对话方法、装置、电子设备及可读存储介质
CN111435463A (zh) 数据处理方法及相关设备、系统
CN111078847A (zh) 电力用户意图识别方法、装置、计算机设备和存储介质
CN111259647A (zh) 基于人工智能的问答文本匹配方法、装置、介质及电子设备
CN116822651A (zh) 基于增量学习的大模型参数微调方法、装置、设备及介质
CN116258056A (zh) 多模态知识水平评估与学习表现预测方法、系统及介质
PIAD DETERMINING THE DOMINANT ATTRIBUTES OF INFORMATION TECHNOLOGY GRADUATES EMPLOYABILITY PREDICTION USING DATA MINING CLASSIFICATION TECHNIQUES.
CN112420125A (zh) 分子属性预测方法、装置、智能设备和终端
CN116684330A (zh) 基于人工智能的流量预测方法、装置、设备及存储介质
CN115187772A (zh) 目标检测网络的训练及目标检测方法、装置及设备
CN111461353A (zh) 一种模型训练的方法和系统
CN112766402A (zh) 算法选择方法、装置和电子设备
CN113344056B (zh) 一种人员移动性预测模型的训练方法及装置
WO2020135054A1 (zh) 视频推荐方法、装置、设备及存储介质
CN113689959B (zh) 基于人工智能的疫情防控决策方法、装置、设备及介质
CN111414990B (zh) 卷积神经网络处理方法、装置、电子设备及存储介质
CN114648688A (zh) 高铁沿线景观等级评估方法、系统、设备及可读存储介质
CN113961765A (zh) 基于神经网络模型的搜索方法、装置、设备和介质
CN114238106A (zh) 测试时间预测方法及装置、电子设备、存储介质
Jerome et al. Forecasting and anomaly detection on application metrics using lstm

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant