CN111432347B - 信息处理方法、装置、存储介质及电子设备 - Google Patents

信息处理方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111432347B
CN111432347B CN202010527240.2A CN202010527240A CN111432347B CN 111432347 B CN111432347 B CN 111432347B CN 202010527240 A CN202010527240 A CN 202010527240A CN 111432347 B CN111432347 B CN 111432347B
Authority
CN
China
Prior art keywords
track
trace
point
fusion
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010527240.2A
Other languages
English (en)
Other versions
CN111432347A (zh
Inventor
吴鸽鹏
孙福宁
夏彤
司向辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010527240.2A priority Critical patent/CN111432347B/zh
Publication of CN111432347A publication Critical patent/CN111432347A/zh
Application granted granted Critical
Publication of CN111432347B publication Critical patent/CN111432347B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/029Location-based management or tracking services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了信息处理方法、装置、存储介质及电子设备。该方法包括:获取当前时间周期内的待补全轨迹;确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系;根据第一相关关系将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;确定目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系;根据第二相关关系和待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,得到补全轨迹。本方案中,通过对用户轨迹大数据的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性和信息准确性。

Description

信息处理方法、装置、存储介质及电子设备
技术领域
本申请涉及信息处理技术领域,具体涉及一种信息处理方法、装置、存储介质及电子设备。
背景技术
随着移动设备的普及、移动互联网技术、包括LBS(Location Based Services,基于位置的服务)的兴起,基于LBS的服务呈现着欣欣向荣的生态发展。例如,通过用户的位置搜索,可以更好的向用户进行基于LBS的线下推荐;通过用户的社交定位数据,可以提供更好的线下社交体验等。
然而,虽然基于智能终端的移动数据采集方式比以往基于问卷的方法有效率更高、更广覆盖范围的优点,但与此同时隐私保护也越来越受到重视,采集到的数据面临着稀疏性的问题,极大的限制了移动建模相关研究的进展。
发明内容
本申请实施例提供一种信息处理方法、装置、存储介质及电子设备,可以提升轨迹信息的稠密性和信息准确性。
本申请实施例提供了一种信息处理方法,包括:
获取当前时间周期内的待补全轨迹;
确定所述待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,所述历史融合轨迹基于历史时间段内的轨迹信息得到;
根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹;
确定所述目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系;
根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
相应的,本申请实施例还提供了一种信息处理装置,包括:
获取单元,用于获取当前时间周期内的待补全轨迹;
第一确定单元,用于确定所述待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,所述历史融合轨迹基于历史时间段内的轨迹信息得到;
融合单元,用于根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹;
第二确定单元,用于确定所述目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系;
处理单元,用于根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
相应的,本申请实施例还提供了一种计算机可读存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行如上所述的信息处理方法。
相应的,本申请实施例还提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述的信息处理方法。
本申请实施例中,通过获取当前时间周期内的待补全轨迹,并根据待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;根据目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系、及待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,以得到补全轨迹。本方案中,通过对用户轨迹的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性;另外,结合轨迹中点迹特征之间的关联性,并利用此关联性提升对有用信息的关注、降低对无用信息的关注,提升了轨迹补全信息的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的系统架构示意图。
图2是本申请实施例提供的信息处理方法的流程示意图。
图3是本申请实施例提供的轨迹增强模块的处理流程示意图。
图4是本申请实施例提供的信息处理方法的应用场景示意图。
图5是本申请实施例提供的信息处理装置的结构示意图。
图6是本申请实施例提供的电子设备的结构示意图。
图7是本申请实施例提供的服务器的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
大数据(Big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着云时代的来临,大数据也吸引了越来越多的关注,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。而云技术(Cloudtechnology)正是适用于大数据的处理技术。
其中,云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。实际应用中,云技术可以是基于云计算平台的网络技术、信息技术、整合技术、管理平台技术、应用技术等的总称,可以组成资源池,按需所用,灵活便利。
人工智能(Artificial Intelligence, AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统,使机器具有感知、推理与决策的功能。本申请中,正是将人工智能与云技术结合起来,实现对用户轨迹大数据的有效处理。
现有技术实现主要存在两个方面的问题,一是对轨迹内部的时空相关性建模不充分,在轨迹连续缺失的情况下,缺失时刻前后所在的位置对要插值时刻的空间约束较弱,难以取得理想的结果。另外一问题是,忽略了使用每个用户的长移动历史。因此,如果移动数据非常稀疏(例如,每天少于5个点),则无法以精细的时间粒度(例如,每30分钟)恢复丢失的位置。有基于此,本申请提供了如图1所示的系统架构示意图,目的是在给定的时间间隔的情况下,考虑用户历史移动模式,从稀疏的记录中恢复用户的整体移动数据。
在本申请中,将轨迹增强看成是一个文本增强的问题。在本系统中,由于学习的“语料”是海量的轨迹,其基础“词典”是由轨迹点组成的。首先没有直接可用的词向量,其次随着业务的精细化需要,网格化规模精细到百米后,一个城市的网格将会达到几十万级规模。因此,本系统首先构建一个预训练模块实现对点迹的向量表示,该模块对用户的特征进行提取并嵌入,特征包括但不限于点迹经纬度、点迹在整条轨迹中的序号、轨迹日期、用户脱敏ID等。具体实施时,将这些特征通过一个全连接的转换神经网络,将其转换为一个维度在[50,100]的定长向量。
对于预训练模块,主要提供降低输入规模的作用,从而保证系统随着轨迹数据的增加而能够稳定运行,确保系统的鲁棒性和扩展性。在预训练模块中,可采用引入重要POI(Point of Interest)数据的方式,对整体由点迹组成的“词典”进行适度降维。例如,可采用公交站点、地铁站点、重要十字路口等对待补全轨迹和历史轨迹中的“重要词”进行提取并构建向量表示。其原理类似于保留句子中的名词,谓词等,而去掉与句意关系不大的虚词、冠词等,而对句意不太有影响。
对于轨迹增强模块,其本质原理来源于文本增强。在文本增强模型中,通过对不同类型海量文本的学习,可以学到词汇在不同上下文语境中的规律,从而通过训练好的网络模型,实现对缺失句子的补全。基于此,本申请中通过对用户历史轨迹信息的大数据筛选和收集,可以逐渐获得某区域内用户的常用出行模式,这些模式鉴于其区域环境、出行时间、出行方式的不同,可以被看作是不同主题的文本语料,基于对所采集到的语料的训练学习,得到的模型可以有效学习到不同点迹间上下文规律,从而实现轨迹缺失处的补全。
对于语料补全模块,由于轨迹增强的技术理论来自于自然语言处理领域,因此其增强的点迹只可能来自于“语料”。而语料的覆盖范围在一定程度上决定了系统的可用性。例如,如果本系统中的所有“语料”要求是来自于A市B区的用户行动轨迹,则对于业务侧提供的一条来自于A市C区的稀疏轨迹,无论如何进行增强都是不对的。因此,为了保证系统的可用性,提供系统对全量用户的覆盖性,系统需要架构一个轨迹语料补全模块,不断的与其他系统(例如车载导航系统,手机地图导航系统)等进行信息交互,通过不断的更新和补充用户的轨迹来使得系统对不同类型的稀疏轨迹可以做到准确补全,使得整个系统学习得到的模型具有更好的泛化能力。
对于轨迹存储与访问模块,用于存储通过得到的增强轨迹,以对诸如人员出行画像、智能交通等业务提供基础数据支撑。例如,在该模块中每一条轨迹可以存储为“轨迹ID,轨迹时间,轨迹”格式,其中轨迹ID作为键值对中唯一的主key(键)用来进行检索和查询,从而获得轨迹时间和相关的具体点迹集合。
本申请实施例中,通过上述系统架构对用户轨迹进行增强,即使是用户没有开启定位服务,平台可以对用户所在的位置进行估计,从而缩小用户当前可能感兴趣的空间范围,提升推荐命中率。通过挖掘出用户的日常出行轨迹,极大丰富具体用户的画像体系,从而可以实现对用户的出行路线推荐等服务,以及对用户诸如购物、旅游、休闲等行为的到访偏好进行推断,从而进行相应服务推荐。
本申请实施例提供一种信息处理方法、装置、存储介质及电子设备。其中,该信息处理装置具体可以集成在平板PC(Personal Computer)、手机等具备储存单元并安装有微处理器而具有运算能力的电子设备或服务器中。
以下分别进行详细说明。需说明的是,以下实施例的序号不作为对实施例优选顺序的限定。在本方案中,引入了自注意力机制(self-attention),其可模仿生物观察行为的内部过程,即可将内部经验和外部感觉对齐从而增加部分区域的观察精细度的机制。通过自注意力机制可以快速提取轨迹大数据中稀疏数据的重要特征,捕捉数据或特征的内部相关性对轨迹大数据进行分析处理,从而达到智能化复盘用户轨迹目的。请参阅图2,图2为本申请实施例提供的信息处理方法的流程示意图。该信息处理方法的具体流程可以如下:
101、获取当前时间周期内的待补全轨迹。
其中,当前时间周期可以为需要对用户行动轨迹进行轨迹有效补全的时段,如一天、一小时等。该待补全轨迹则为需要进行轨迹有效补全的稀疏轨迹,可以包括一个或多个已知位置信息的点迹。实际应用中,该点迹可以基于用户终端设备的LBS的定位数据得到。例如,LBS的定位数据可以为用户通过各种移动端设备进行诸如位置搜索、定位分享等应用时,通过移动设备上报其相关位置而产生的数据。
在一些实施例中,可以通过自注意力机制对待补全轨迹进行轨迹内部信息融合,此次融合基于当前时间周期内轨迹中有记录的位置信息进行轨迹的初次补全,以加强各时间片下已知点迹的空间关联。也即,在获取当前时间周期内的待补全轨迹时,可以包括以下流程:
获取当前时间周期内的已知点迹;
至少基于当前时间周期内的已知点迹确定初始轨迹;
通过自注意力机制对初始轨迹进行轨迹内部信息融合,得到待补全轨迹。
在一实施方式中,当前时间周期内已知点迹构成的轨迹中,有的时间切片内可能没有一个点迹,则在初次补全时可以通过周边几个有点的特征进行一个加权求和,得到的新点迹作为这个点的一个初次补全。
由于时间和地点是离散的表达,不利于深度学习进行梯度更新。因此,在本实施例中,则是将点迹的位置信息转换成自然语言处理时在句中的“词”的问题,将点迹的时间信息转换成在句中的“位置次序”问题,将每个离散值隐身成一个高维的连续向量,以便直接参与后续网络计算。也即,在一些实施例中,在通过自注意力机制对初始轨迹进行轨迹内部信息融合得到待补全轨迹时,可以包括以下流程:
构建初始轨迹中已知点迹的向量表示;
根据已知点迹的向量表示,确定初始轨迹中已知点迹两两之间的相似度;
基于已知点迹两两之间的相似度,确定初始轨迹内每一已知点迹关于其他已知点迹的第三注意力值,其中,第三注意力值用于反映初始轨迹中每一点迹对其轨迹内其他已知点迹的关注度;
根据第三注意力值对初始轨迹中的已知点迹的向量表示进行调整,得到待补全轨迹。
具体的,参考图3,图3为本实施例提供的轨迹增强模块的处理流程示意图。该轨迹增强模块主要通过注意力机制的神经网络,对输入的词向量(可以为one-hot格式的词向量,亦或者是经过预训练模块生成的定长词嵌入向量)进行学习训练,得到一个可以用于轨迹增强的模型。轨迹增强模块主要包括三个部分:历史编码器(History Encoder)、自编码模块(Current Encoder)及解码模块(Current Encoder)。三个模块的核心结构皆采用的注意力机制,其注意力函数被设计成将一个查询和一组键值对映射到一个输出,该输出是这些值的加权和,权重由查询用相应的键计算。轨迹嵌入模块用于生成轨迹中的点迹的向量表示,例如可将点迹的空间维度、时间维度上的特征转换成固定长度的向量表示。其中,轨迹嵌入模块可以集成在轨迹增强模块内,也可作为单独的一个模块。
参考图3中当前编码器部分,在构建初始轨迹中已知点迹的向量表示时,具体可以分别构建每个点迹的时间表征向量和地点表征向量,然后通过每一点迹的时间表征向量和地点表征向量相加进行融合得到每一点迹的向量表示。
由于原始的时间特征向量和地点表征向量确实不是一个维度的,比如时间可以是(小时,分钟),地点就是经纬度等。因此,可以通过一个简单的神经网络,通过指定一个相同的神经元个数变成相同维度的向量。例如,可以直接把每个点的时间表征向量和地点表征向量表示成同一个维度的,如时间表征向量就是点在轨迹中的次序位置,第一个点就是“1”,地点就是一个网格的ID。
在对初始轨迹进行轨迹内部信息融合时,通过引入自注意力机制从初始轨迹中获得需要重点关注的特征,也就是一般所说的注意力焦点,而后对这一特征投入更多注意力资源,以获取更多所需要关注目标的细节信息,而抑制其他无用信息,以从众多信息中选择出对当前轨迹的向量表示更关键的信息,从而更好的表达各点迹以及点迹之间的关系。
参考图4,具体实施时首先对待补全轨迹构建其中点迹经纬度(即空间位置)的嵌入向量、及点迹在轨迹中所在位置(即时间)的嵌入向量,然后输入至多头注意力自学习模块自学习轨迹中点迹之间的关系,随后将输出向量进行多头向量聚合和标准化。其中,在进行向量聚合时,可采用Python中的concat方法,将向量进行横向拼接或纵向拼接,得到拼接向量。在执行向量标准化时,可以采用softmax激活函数对输出向量进行归一化处理,以把分量转变成一个[0,1]之间的数值。
在注意力机制中,每个点迹有3个不同的向量,它们分别是Query向量(Q),Key向量(K)和Value向量(V),长度均是64。它们是通过3个不同的权值矩阵由该单词的嵌入向量X乘以三个不同的权值矩阵WQ、WK、WV得到。其中,三个权值矩阵WQ、WK、WV的尺寸都是相同的,例如尺寸可以为:512 x 64。
具体实施时,可将输入的点迹转化成嵌入向量,然后根据嵌入向量得到Q,K,V三个向量。将每个点迹计算一个与其他点迹相关度score(代表相似度),即socre = Q * K 。为了梯度的稳定,可以利用激活函数softmax对每个score进行数值归一化处理。将归一化处理后的值点乘每个点迹的Value向量V,得到加权的每个输入向量的评分V,并相加之后得到最终的输出结果:Z= sum(V),作为所述输入点迹注意力向量,通过对该注意力向量进行处理可以得到每一点迹对应的注意力值。
102、确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,历史融合轨迹基于历史时间段内的轨迹信息确定。
在本实施例中,历史融合轨迹与待补全轨迹的周期长度相同。例如,都为一天、一天中的某个时间段(如星期四的8:00至20:00)等。待补全轨迹的轨迹特征可以包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序。历史融合轨迹的轨迹特征包括:历史融合轨迹中每一点迹的空间标识信息、及在历史融合轨迹中的位置排序。其中,空间标识信息可以为地理位置,如经纬度信息。位置排序则可以表征点迹在轨迹中的时序信息。
在确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系时,具体可以构建待补全轨迹和历史融合轨迹中每一点迹的向量表示,得到多个第一特征向量和多个第二特征向量,然后确定每一第一特征向量与每一第二特征向量之间的第一相似度,并基于该第一相似度确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系。
本实施例中,在基于历史时间段内的轨迹信息确定历史融合轨迹的方式可以有多种。例如,在一实施方式中,在基于历史时间段内的轨迹信息确定历史融合轨迹时,包括:
采集历史时间段内的轨迹信息;
按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
将多条历史轨迹按时间对齐,从对齐后的多条历史轨迹中确定出同一时间片下出现频率最高的点迹,并根据同一时间片下出现频率最高的点迹构建得到目标历史轨迹;
通过自注意力机制对目标历史轨迹进行轨迹内部信息融合,得到历史融合轨迹。
具体的,可以对长期的历史轨迹信息进行融合处理。其中,该历史时段可以为过去一个月、过去一周等。例如,历史时段为过去一个月,则指定时间周期可以为一天。
由于历史轨迹也具有稀疏性,因此可以采用挖掘历史中的频繁模式,即先提取出历史轨迹每个时间片出现次数最多的轨迹点组成一条目标历史轨迹。例如,参考图3历史编码器部分,给出了轨迹P1、P2、P(m-1)等三天的历史轨迹。其中,轨迹P(m-1)表示历史时段内除轨迹P1、P2外任意一天的轨迹,m为大于2的整数。轨迹P1包含已知点迹T5、T9、T13;轨迹P2包含已知点迹T3、T7、T11;轨迹P(m-1)包含已知点迹T1、T5、T9、T13、T16。首先,对用户每天的轨迹按时间对齐,然后抽取出每个时间片访问频率最高的地点得到目标历史轨迹。由于P1、P2、P(m-1)等历史轨迹来自不同天,空间关联被减弱,因此再通过自注意力机制对历史轨迹进行轨迹内部信息融合,以从众多信息中选择出对历史轨迹的向量表示更关键的信息。
在本实施例中,通过自注意力机制对目标历史轨迹进行轨迹内部信息融合得到历史融合轨迹时,具体可以构建目标历史轨迹中每一点迹的向量表示,然后根据每一点迹的向量表示确定目标历史轨迹中两两点迹之间的相似度,并基于两两点迹之间的相似度,确定目标历史轨迹中每一点迹关于其他点迹的第四注意力值的第四注意力值,其中,第四注意力值用于反映所述目标历史轨迹中每一点迹对其轨迹内其他点迹的关注度,最后,根据所述第四注意力值对目标历史轨迹中的点迹的向量表示进行调整,得到历史融合轨迹。
其中,在构建目标历史轨迹中点迹的向量表示时,具体可以分别构建每个点迹的时间表征向量和地点表征向量,然后通过每一点迹的时间表征向量和地点表征向量相加进行融合得到每一点迹的向量表示。
参考图4,具体实施时首先可对历史轨迹构建其中点迹经纬度的嵌入向量、及点迹在轨迹中所在位置的嵌入向量,然后输入至多头注意力自学习模块中学习其轨迹中点迹之间的关系,将输出向量进行多头向量聚合和标准化进行多头向量聚合和标准化。接着,通过前馈神经网络将输出结果传递到下一阶段,并输出得到历史轨迹自学习后的增强向量(即历史融合轨迹)。
在一实施方式中,在基于历史时间段内的轨迹信息确定历史融合轨迹时,具体可以包括:
采集历史时间段内的轨迹信息;
按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
通过注意力机制将多条历史轨迹进行融合,得到历史融合轨迹。
具体的,可以直接利用注意力机制对按指定时间周期划分得到的多条历史轨迹进行内部信息融合,以获得历史轨迹中需要重点关注的特征,而后对这一特征投入更多注意力资源,以获取更多所需要关注目标的细节信息而抑制其他无用信息,以从众多信息中选择出对历史轨迹的向量表示更关键的信息。
103、根据第一相关关系将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹。
实际应用中,由于观测的稀疏性,基于已知点迹而得到的待补全轨迹的可信度较低,因此可以再通过注意力机制处理,对待补全轨迹和历史融合轨迹进行轨迹间的信息融合,显式地利用历史轨迹的特征提取满足当前时间周期下空间约束的信息。也即,在根据第一相关关系将历史融合轨迹和待补全轨迹进行融合时,可以从历史融合轨迹中提取满足待补全轨迹空间约束的候选点迹,得到第一候选点迹集合,然后根据第一相关关系和第一候选点迹集合对待补全轨迹进行处理,从而得到目标融合轨迹。
进一步的,在根据第一相关关系和第一候选点迹集合对待补全轨迹进行处理时,具体可以基于第一相关关系从第一候选点迹集合中确定第一目标点迹,并根据第一目标点迹对待补全轨迹的点迹信息进行调整,以得到目标融合轨迹。在一实施方式中,在根据第一目标点迹对待补全轨迹的点迹信息进行调整时,具体可以包括以下流程:
基于第一相似度,确定待补全轨迹中每一点迹关于历史融合轨迹中每一点迹的第一注意力值,其中,第一注意力值用于反映待补全轨迹中每一点迹对历史融合轨迹中每一点迹的关注度;
按照第一注意力值由高到低的顺序从第一候选点迹集合中确定相应的候选点迹,作为第一目标点迹;
根据第一目标点迹在历史融合轨迹中的位置排序、及第一目标点对应的空间标识信息,在待补全轨迹中的相应位置生成对应点迹。
其中,空间标识信息可以为地理位置,如经纬度信息;位置排序则可以表征该第一目标点迹在历史融合轨迹中的时序信息。
具体的,基于待补全轨迹中每一点迹关于历史融合轨迹中每一点迹的注意力值的大小,从第一候选点迹集合中确定出待补全轨重点关注的点迹,并基于所筛选出点迹在历史融合轨迹中的特征(即时间信息和空间位置信息),在待补全轨迹中确定出的相应位置以构建新的点迹。
继续参考图4,可将待补全轨迹和历史融合轨迹同时输入到多头向量解码编码注意力学习模块中学习轨迹之间各点迹的关系,将输出向量进行多头向量聚合和标准化。接着,通过前馈神经网络将输出结果传递到下一阶段,并输出得到融合历史轨迹特征后的待补全轨迹(即目标融合轨迹)。
104、确定目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系。
在本实施例中,待补全轨迹的轨迹特征包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序;所述目标融合轨迹的轨迹特征包括:目标融合轨迹中每一点迹的空间标识信息、及在目标融合轨迹中的位置排序。其中,空间标识信息可以为地理位置,如经纬度信息。位置排序则可以表征点迹在轨迹中的时序信息。
在确定目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系时,具体可以分别构建待补全轨迹和目标融合轨迹中每一点迹的向量表示,得到多个第三特征向量和多个第四特征向量,然后确定每一第三特征向量与每一第四特征向量之间的第二相似度,并基于该第二相似度确定目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间第二相关关系。
105、根据第二相关关系和待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,得到补全轨迹。
具体的,参考图3,该补全处理是对缺失点迹进行补全,可通过将编码模块输出的目标融合轨迹与原始待补全轨迹进行互注意力机制处理,以输出补全轨迹。在一些实施例中,在根据第二相关关系和待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,得到补全轨迹时,具体可以包括:
根据第二相关关系和目标融合轨迹中点迹的位置排序,从目标融合轨迹中确定候选点迹,得到第二候选点迹集合;
根据该采样时间和第二候选点迹集合,对待补全轨迹进行点迹补全处理,得到补全轨迹。
具体的,在根据所述第二相关关系和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合时,可基于第二相似度确定待补全轨迹中每一点迹关于目标融合轨迹中每一点迹的第二注意力值,其中,第二注意力值用于反映待补全轨迹中每一点迹对所述目标融合轨迹中每一点迹的关注度。然后,根据第二注意力值和目标融合轨迹中点迹的位置排序,从目标融合轨迹中确定候选点迹,得到第二候选点迹集合。
在根据所述采样时间和所述第二候选点迹集合,对待补全轨迹进行点迹补全处理时,可基于所述待补全轨迹中的已知点迹和所述采样时间,从所述第二候选点迹集合中确定第二目标点迹,然后基于采样时间和第二目标点迹对应的空间标识信息,在待补全轨迹中的相应位置生成对应点迹,以对待补全轨迹进行点迹补全处理。
继续参考图4,可将待补全轨迹和目标融合轨迹同时输入到多头向量解码编码注意力学习模块中学习轨迹之间各点迹的关系,并将输出向量进行多头向量聚合和标准化。接着,通过前馈神经网络将输出结果传递到下一阶段进行向量聚合和标准化,并通过归一化函数(如softmax激活函数)对输出向量进行归一化处理,选取归一化后分量对应的点迹作为输出,得到增强后的轨迹(即补全轨迹)。
本方案中以待补全轨迹点的采样时间作为输入注意力机制中的其中一个输入,将融合过历史信息的待补全轨迹作为注意力机制中的另一输入,将补全轨迹中点迹的采样时间与缺失的点迹进行注意力机制处理,得到对缺失轨迹点的补全值。其中,补全值是一个特征分量,代表缺失点迹在整个点迹集合中的索引,根据该索引可以查找唯一的一个实际的地理位置点即该点迹的地理位置,如 (东经113.935,北纬22.542)。 具体计算时,缺失轨迹点可用一个特殊字符“unknown”来表示,它的特征可以理解为是一个全为0的向量。
例如,用户的轨迹共有四天,前三天的历史轨迹很稠密、第四天的轨迹很稀疏,希望通过对前三天历史轨迹的学习,以推测他第四天轨迹中没有出现的点的位置。那么,可以第四天的轨迹作为目标,按照每10分钟取一个点,将这条轨迹改成了一个句子,例如早上9:00出发,大约10:00到目的地的这条轨迹,按照10分钟取样则该轨迹就是一个6个词的句子。但是由于轨迹稀疏,其中部分词可能没有,这些没有的词就需要从历史轨迹中进行学习。而另外一方面,前三天的历史轨迹不一定是早上9:00到10:00这个时间,因此,可以把历史数据按照它当天时间每10分钟取样一次,然后按照它在句子中的排列次序,并以第四天的点迹采样时间作为输入,以补全第四天的轨迹。
本申请实施例提供的信息处理方法,通过获取当前时间周期内的待补全轨迹,并根据待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;根据目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系、及待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,以得到补全轨迹。本方案中,通过对用户轨迹的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性;另外,结合轨迹中点迹特征之间的关联性,并利用此关联性提升对有用信息的关注、降低对无用信息的关注,提升了轨迹补全信息的准确性。
本申请中通过对轨迹进行增强,提高了位置数据的可用性。对个体而言,可以促进基于位置的个性化推荐、广告投放的精度;对城市而言,可用于城市人口监测、人流预测,对缓解交通拥堵、异常事件、环境污染等有重要作用。为了支持更多面向移动性的应用,此发明点将详细阐述一个轨迹增强系统的组成架构和主要技术原理,通过从收集的稀疏记录中恢复缺失的移动性数据来增强移动性数据的可用性。
为便于更好的实施本申请实施例提供的信息处理方法,本申请实施例还提供一种基于上述信息处理方法的装置。其中名词的含义与上述信息处理方法中相同,具体实现细节可以参考方法实施例中的说明。
请参阅图5,图5为本申请实施例提供的信息处理装置的结构示意图,其中该处理装置可以包括:获取单元301、第一确定单元302、融合单元303、第二确定单元304、及处理单元305。具体可以如下:
获取单元301,用于获取当前时间周期内的待补全轨迹;
第一确定单元302,用于确定所述待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,所述历史融合轨迹基于历史时间段内的轨迹信息得到;
融合单元303,用于根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹;
第二确定单元304,用于确定所述目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系;
处理单元305,用于根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
在一些实施例中,所述融合单元303,可以用于:
从所述历史融合轨迹中提取满足所述待补全轨迹空间约束的候选点迹,得到第一候选点迹集合;
根据所述第一相关关系和所述第一候选点迹集合对所述待补全轨迹进行处理,得到目标融合轨迹。
在一些实施例中,在根据所述第一相关关系和所述第一候选点迹集合对所述待补全轨迹进行处理时,融合单元303具体可以用于:
基于所述第一相关关系从所述第一候选点迹集合中确定第一目标点迹,并根据所述第一目标点迹对所述待补全轨迹的点迹信息进行调整。
在一些实施例中,所述待补全轨迹的轨迹特征包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序;所述历史融合轨迹的轨迹特征包括:历史融合轨迹中每一点迹的空间标识信息、及在历史融合轨迹中的位置排序;第一确定单元302可以用于:
分别构建所述待补全轨迹和历史融合轨迹中每一点迹的向量表示,得到多个第一特征向量和多个第二特征向量;
确定每一第一特征向量与每一第二特征向量之间的第一相似度,得到所述第一相关关系;
在基于所述第一相关关系从所述第一候选点迹集合中确定第一目标点迹,并根据所述第一目标点迹对所述待补全轨迹的点迹信息进行调整时,融合单元303进一步可以用于:
基于所述第一相似度,确定所述待补全轨迹中每一点迹关于所述历史融合轨迹中每一点迹的第一注意力值,其中,第一注意力值用于反映所述待补全轨迹中每一点迹对所述历史融合轨迹中每一点迹的关注度;
按照第一注意力值由高到低的顺序从所述第一候选点迹集合中确定相应的候选点迹,作为第一目标点迹;
根据所述第一目标点迹在所述历史融合轨迹中的位置排序、及第一目标点对应的空间标识信息,在所述待补全轨迹中的相应位置生成对应点迹。
在一些实施例中,处理单元305可以用于:
根据所述第二相关关系和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合;
根据所述采样时间和所述第二候选点迹集合,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
在一些实施例中,所述待补全轨迹的轨迹特征包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序;所述目标融合轨迹的轨迹特征包括:目标融合轨迹中每一点迹的空间标识信息、及在目标融合轨迹中的位置排序;第二确定单元304可以用于:
分别构建所述待补全轨迹和目标融合轨迹中每一点迹的向量表示,得到多个第三特征向量和多个第四特征向量;
确定每一第三特征向量与每一第四特征向量之间的第二相似度,得到所述第二相关关系;
在根据所述第二相关关系和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合时,处理单元305具体可以用于:
基于所述第二相似度,确定所述待补全轨迹中每一点迹关于所述目标融合轨迹中每一点迹的第二注意力值,其中,第二注意力值用于反映所述待补全轨迹中每一点迹对所述目标融合轨迹中每一点迹的关注度;
根据所述第二注意力值和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合。
在一些实施例中,在根据所述采样时间和所述第二候选点迹集合,对所述待补全轨迹进行点迹补全处理时,处理单元305进一步可以用于:
基于所述待补全轨迹中的已知点迹和所述采样时间,从所述第二候选点迹集合中确定第二目标点迹;
基于所述采样时间和第二目标点迹对应的空间标识信息,在所述待补全轨迹中的相应位置生成对应点迹,以对所述待补全轨迹进行点迹补全处理。
在一些实施例中,获取单元301可以用于:
获取当前时间周期内的已知点迹;
至少基于当前时间周期内的已知点迹确定初始轨迹;
通过自注意力机制对初始轨迹进行轨迹内部信息融合,得到待补全轨迹。
在一些实施例中,所述通过自注意力机制对初始轨迹进行轨迹内部信息融合得到待补全轨迹时,获取单元301进一步可以用于:
获取所述初始轨迹中已知点迹的向量表示;
根据已知点迹的向量表示,确定所述初始轨迹中已知点迹两两之间的相似度;
基于已知点迹两两之间的相似度,确定所述初始轨迹内每一已知点迹关于其他已知点迹的第三注意力值,其中,第三注意力值用于反映所述初始轨迹中每一点迹对其轨迹内其他已知点迹的关注度;
根据所述第三注意力值对所述初始轨迹中的已知点迹的向量表示进行调整,得到待补全轨迹。
在一些实施例中,该信息处理装置还可以包括:
第一采集单元,用于采集历史时间段内的轨迹信息;
第一构建单元,用于按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
第二构建单元,用于将所述多条历史轨迹按时间对齐,从对齐后的多条历史轨迹中确定出同一时间片下出现频率最高的点迹,并根据同一时间片下出现频率最高的点迹构建得到目标历史轨迹;
第一轨迹融合单元,用于通过自注意力机制对目标历史轨迹进行轨迹内部信息融合,得到历史融合轨迹。
在一些实施例中,第一轨迹融合单元具体可以用于:
构建所述目标历史轨迹中每一点迹的向量表示;
根据每一点迹的向量表示,确定所述目标历史轨迹中两两点迹之间的相似度;
基于两两点迹之间的相似度,确定所述目标历史轨迹中每一点迹关于其他点迹的第四注意力值,其中,第四注意力值用于反映所述目标历史轨迹中每一点迹对其轨迹内其他点迹的关注度;
根据所述第四注意力值对所述目标历史轨迹中的点迹的向量表示进行调整,得到历史融合轨迹。
在一些实施例中,该信息处理装置还可以包括:
第二采集单元,用于采集历史时间段内的轨迹信息;
第三构建单元,用于按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
第二轨迹融合单元,用于通过注意力机制将所述多条历史轨迹进行融合,得到融合轨迹。
本实施例提供的信息处理装置,通过获取当前时间周期内的待补全轨迹,并根据待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;根据目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系、及待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,以得到补全轨迹。本方案中,在该方法通过对用户轨迹的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性;另外,结合轨迹中点迹特征之间的关联性,并利用此关联性提升对有用信息的关注、降低对无用信息的关注,提升了轨迹补全信息的准确性。
本申请实施例还提供一种电子设备,该电子设备具体可以是智能手机、平板电脑等终端设备。如图6所示,该电子设备可以包括射频(RF,Radio Frequency)电路601、包括有一个或一个以上计算机可读存储介质的存储器602、输入单元603、显示单元604、传感器605、音频电路606、无线保真(WiFi,Wireless Fidelity)模块607、包括有一个或者一个以上处理核心的处理器608、以及电源609等部件。本领域技术人员可以理解,图6中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路601可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器608处理;另外,将涉及上行的数据发送给基站。通常,RF电路601包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM, Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路601还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统 (GSM,Global System of Mobile communication)、通用分组无线服务(GPRS ,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器602可用于存储软件程序以及模块,处理器608通过运行存储在存储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器602可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以包括存储器控制器,以提供处理器608和输入单元603对存储器602的访问。
输入单元603可用于接收输入的数字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地,在一个具体的实施例中,输入单元603可包括触敏表面以及其他输入设备。触敏表面,也称为触摸显示屏或者触控板,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面上或在触敏表面附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触敏表面可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器608,并能接收处理器608发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面。除了触敏表面,输入单元603还可以包括其他输入设备。具体地,其他输入设备可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元604可用于显示由用户输入的信息或提供给用户的信息以及电子设备的各种图形用户接口,这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元604可包括显示面板,可选的,可以采用液晶显示器(LCD,Liquid CrystalDisplay)、有机发光二极管(OLED,Organic Light-Emitting Diode)等形式来配置显示面板。进一步的,触敏表面可覆盖显示面板,当触敏表面检测到在其上或附近的触摸操作后,传送给处理器608以确定触摸事件的类型,随后处理器608根据触摸事件的类型在显示面板上提供相应的视觉输出。虽然在图6中,触敏表面与显示面板是作为两个独立的部件来实现输入和输入功能,但是在某些实施例中,可以将触敏表面与显示面板集成而实现输入和输出功能。
电子设备还可包括至少一种传感器605,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等; 至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路606、扬声器,传声器可提供用户与电子设备之间的音频接口。音频电路606可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路606接收后转换为音频数据,再将音频数据输出处理器608处理后,经RF电路601以发送给比如另一电子设备,或者将音频数据输出至存储器602以便进一步处理。音频电路606还可能包括耳塞插孔,以提供外设耳机与电子设备的通信。
WiFi属于短距离无线传输技术,电子设备通过WiFi模块607可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图6示出了WiFi模块607,但是可以理解的是,其并不属于电子设备的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器608是电子设备的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块,以及调用存储在存储器602内的数据,执行电子设备的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器608可包括一个或多个处理核心;优选的,处理器608可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器608中。
电子设备还包括给各个部件供电的电源609(比如电池),优选的,电源可以通过电源管理系统与处理器608逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源609还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
尽管未示出,电子设备还可以包括摄像头、蓝牙模块等,在此不再赘述。具体在本实施例中,电子设备中的处理器608会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器602中,并由处理器608来运行存储在存储器602中的应用程序,从而实现各种功能:
获取当前时间周期内的待补全轨迹;确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,历史融合轨迹基于历史时间段内的轨迹信息得到;根据第一相关关系将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;确定目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系;根据第二相关关系和待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,得到补全轨迹。
本申请实施例提供的电子设备,通过对用户轨迹的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性;另外,结合轨迹中点迹特征之间的关联性,并利用此关联性提升对有用信息的关注、降低对无用信息的关注,提升了轨迹补全信息的准确性。
本申请实施例还提供一种服务器,该服务器具体可以是应用服务器。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。如图7所示,该服务器可以包括射频(RF,Radio Frequency)电路701、包括有一个或一个以上计算机可读存储介质的存储器702、包括有一个或者一个以上处理核心的处理器704、以及电源703等部件。本领域技术人员可以理解,图7中示出的服务器结构并不构成对服务器的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
RF电路701可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,交由一个或者一个以上处理器704处理;另外,将涉及上行的数据发送给基站。通常,RF电路701包括但不限于天线、至少一个放大器、调谐器、一个或多个振荡器、用户身份模块(SIM, Subscriber Identity Module)卡、收发信机、耦合器、低噪声放大器(LNA,Low Noise Amplifier)、双工器等。此外,RF电路701还可以通过无线通信与网络和其他设备通信。所述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统 (GSM,Global System of Mobile communication)、通用分组无线服务(GPRS ,GeneralPacket Radio Service)、码分多址(CDMA,Code Division Multiple Access)、宽带码分多址(WCDMA,Wideband Code Division Multiple Access)、长期演进(LTE,Long TermEvolution)、电子邮件、短消息服务(SMS,Short Messaging Service)等。
存储器702可用于存储软件程序以及模块,处理器704通过运行存储在存储器702的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器702可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据服务器的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器702可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器702还可以包括存储器控制器,以提供处理器704和输入单元703对存储器702的访问。
处理器704是服务器的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器702内的软件程序和/或模块,以及调用存储在存储器702内的数据,执行服务器的各种功能和处理数据,从而对手机进行整体监控。可选的,处理器704可包括一个或多个处理核心;优选的,处理器704可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器704中。
服务器还包括给各个部件供电的电源703(比如电池),优选的,电源可以通过电源管理系统与处理器704逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源703还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
具体在本实施例中,服务器中的处理器704会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器702中,并由处理器704来运行存储在存储器702中的应用程序,从而实现各种功能:
获取当前时间周期内的待补全轨迹;确定待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,其中,历史融合轨迹基于历史时间段内的轨迹信息得到;根据第一相关关系将历史融合轨迹和待补全轨迹进行融合,得到目标融合轨迹;确定目标融合轨迹的轨迹特征与待补全轨迹的轨迹特征之间的第二相关关系;根据第二相关关系和待补全轨迹中点迹的采样时间,对待补全轨迹进行点迹补全处理,得到补全轨迹。
本申请实施例提供的服务器,通过对用户轨迹的学习,实现对相类似的轨迹进行轨迹的缺失值补全,从而提高轨迹中点迹信息的稠密性;另外,结合轨迹中点迹特征之间的关联性,并利用此关联性提升对有用信息的关注、降低对无用信息的关注,提升了轨迹补全信息的准确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请实施例提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请实施例所提供的任一种信息处理方法中的步骤。例如,该指令可以执行如下步骤:
基于预设知识库确定与第一文本关联的第一组实体和与第二文本关联的第二组实体,所述预设知识库括由实体、实体之间的关系及实体属性构成的知识表示;根据所述知识表示确定所述第一组实体与所述第二组实体之间的实体相关度;根据所述第一文本中每个单词之间的关联关系、所述第二文本中每个单词之间的关联关系以及所述第一文本中单词与所述第二文本中单词之间的关联关系,确定所述第一文本和所述第二文本中每一单词关于其他单词的注意力值,其中,所述注意力值用于反映所述第一文本和所述第二文本中每一单词对其他单词的关注度;至少根据所述注意力值和所述实体相关度,确定所述第一文本与所述第二文本的文本相关度。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该存储介质中所存储的指令,可以执行本申请实施例所提供的任一种信息处理方法中的步骤,因此,可以实现本申请实施例所提供的任一种信息处理方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
以上对本申请实施例所提供的一种信息处理方法、装置、存储介质及电子设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (15)

1.一种信息处理方法,其特征在于,包括:
获取当前时间周期内的待补全轨迹;
确定所述待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,包括:分别构建所述待补全轨迹和历史融合轨迹中每一点迹的向量表示,得到多个第一特征向量和多个第二特征向量,确定每一第一特征向量与每一第二特征向量之间的第一相似度,得到所述第一相关关系,其中,所述历史融合轨迹基于历史时间段内的轨迹信息确定;
根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹;
确定所述目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系,包括:分别构建所述待补全轨迹和目标融合轨迹中每一点迹的向量表示,得到多个第三特征向量和多个第四特征向量,确定每一第三特征向量与每一第四特征向量之间的第二相似度,得到所述第二相关关系;
根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
2.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹,包括:
从所述历史融合轨迹中提取满足所述待补全轨迹空间约束的候选点迹,得到第一候选点迹集合;
根据所述第一相关关系和所述第一候选点迹集合对所述待补全轨迹进行处理,得到目标融合轨迹。
3.根据权利要求2所述的信息处理方法,其特征在于,所述根据所述第一相关关系和所述第一候选点迹集合对所述待补全轨迹进行处理,包括:
基于所述第一相关关系从所述第一候选点迹集合中确定第一目标点迹,并根据所述第一目标点迹对所述待补全轨迹的点迹信息进行调整。
4.根据权利要求3所述的信息处理方法,其特征在于,所述待补全轨迹的轨迹特征包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序;所述历史融合轨迹的轨迹特征包括:历史融合轨迹中每一点迹的空间标识信息、及在历史融合轨迹中的位置排序;
所述基于所述第一相关关系从所述第一候选点迹集合中确定第一目标点迹,并根据所述第一目标点迹对所述待补全轨迹的点迹信息进行调整,包括:
基于所述第一相似度,确定所述待补全轨迹中每一点迹关于所述历史融合轨迹中每一点迹的第一注意力值,其中,第一注意力值用于反映所述待补全轨迹中每一点迹对所述历史融合轨迹中每一点迹的关注度;
按照第一注意力值由高到低的顺序从所述第一候选点迹集合中确定相应的候选点迹,作为第一目标点迹;
根据所述第一目标点迹在所述历史融合轨迹中的位置排序、及第一目标点对应的空间标识信息,在所述待补全轨迹中的相应位置生成对应点迹。
5.根据权利要求1所述的信息处理方法,其特征在于,所述根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹,包括:
根据所述第二相关关系和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合;
根据所述采样时间和所述第二候选点迹集合,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
6.根据权利要求5所述的信息处理方法,其特征在于,所述待补全轨迹的轨迹特征包括:待补全轨迹中每一已知点迹的空间标识信息、及在待补全轨迹中的位置排序;所述目标融合轨迹的轨迹特征包括:目标融合轨迹中每一点迹的空间标识信息、及在目标融合轨迹中的位置排序;
根据所述第二相关关系和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合,包括:
基于所述第二相似度,确定所述待补全轨迹中每一点迹关于所述目标融合轨迹中每一点迹的第二注意力值,其中,第二注意力值用于反映所述待补全轨迹中每一点迹对所述目标融合轨迹中每一点迹的关注度;
根据所述第二注意力值和所述目标融合轨迹中点迹的位置排序,从所述目标融合轨迹中确定候选点迹,得到第二候选点迹集合。
7.根据权利要求6所述的信息处理方法,其特征在于,所述根据所述采样时间和所述第二候选点迹集合,对所述待补全轨迹进行点迹补全处理,包括:
基于所述待补全轨迹中的已知点迹和所述采样时间,从所述第二候选点迹集合中确定第二目标点迹;
基于所述采样时间和第二目标点迹对应的空间标识信息,在所述待补全轨迹中的相应位置生成对应点迹,以对所述待补全轨迹进行点迹补全处理。
8.根据权利要求1所述的信息处理方法,其特征在于,所述获取当前时间周期内的待补全轨迹,包括:
获取当前时间周期内的已知点迹;
至少基于当前时间周期内的已知点迹确定初始轨迹;
通过自注意力机制对初始轨迹进行轨迹内部信息融合,得到待补全轨迹。
9.根据权利要求8所述的信息处理方法,其特征在于,所述通过自注意力机制对初始轨迹进行轨迹内部信息融合,得到待补全轨迹,包括:
构建所述初始轨迹中已知点迹的向量表示;
根据已知点迹的向量表示,确定所述初始轨迹中已知点迹两两之间的相似度;
基于已知点迹两两之间的相似度,确定所述初始轨迹内每一已知点迹关于其他已知点迹的第三注意力值,其中,第三注意力值用于反映所述初始轨迹中每一点迹对其轨迹内其他已知点迹的关注度;
根据所述第三注意力值对所述初始轨迹中的已知点迹的向量表示进行调整,得到待补全轨迹。
10.根据权利要求1所述的信息处理方法,其特征在于,基于历史时间段内的轨迹信息确定历史融合轨迹,包括:
采集历史时间段内的轨迹信息;
按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
将所述多条历史轨迹按时间对齐,从对齐后的多条历史轨迹中确定出同一时间片下出现频率最高的点迹,并根据同一时间片下出现频率最高的点迹构建得到目标历史轨迹;
通过自注意力机制对目标历史轨迹进行轨迹内部信息融合,得到历史融合轨迹。
11.根据权利要求10所述的信息处理方法,其特征在于,所述通过自注意力机制对目标历史轨迹进行轨迹内部信息融合,得到历史融合轨迹,包括:
构建所述目标历史轨迹中每一点迹的向量表示;
根据每一点迹的向量表示,确定所述目标历史轨迹中两两点迹之间的相似度;
基于两两点迹之间的相似度,确定所述目标历史轨迹中每一点迹关于其他点迹的第四注意力值,其中,第四注意力值用于反映所述目标历史轨迹中每一点迹对其轨迹内其他点迹的关注度;
根据所述第四注意力值对所述目标历史轨迹中的点迹的向量表示进行调整,得到历史融合轨迹。
12.根据权利要求1所述的信息处理方法,其特征在于,基于历史时间段内的轨迹信息确定历史融合轨迹,包括:
采集历史时间段内的轨迹信息;
按照指定时间周期和所述轨迹信息,构建多条历史轨迹;
通过注意力机制将所述多条历史轨迹进行融合,得到历史融合轨迹。
13.一种信息处理装置,其特征在于,包括:
获取单元,用于获取当前时间周期内的待补全轨迹;
第一确定单元,用于确定所述待补全轨迹的轨迹特征与历史融合轨迹的轨迹特征之间的第一相关关系,具体为:分别构建所述待补全轨迹和历史融合轨迹中每一点迹的向量表示,得到多个第一特征向量和多个第二特征向量,确定每一第一特征向量与每一第二特征向量之间的第一相似度,得到所述第一相关关系,其中,所述历史融合轨迹基于历史时间段内的轨迹信息得到;
融合单元,用于根据所述第一相关关系将所述历史融合轨迹和所述待补全轨迹进行融合,得到目标融合轨迹;
第二确定单元,用于确定所述目标融合轨迹的轨迹特征与所述待补全轨迹的轨迹特征之间的第二相关关系,具体为:分别构建所述待补全轨迹和目标融合轨迹中每一点迹的向量表示,得到多个第三特征向量和多个第四特征向量,确定每一第三特征向量与每一第四特征向量之间的第二相似度,得到所述第二相关关系;
处理单元,用于根据所述第二相关关系和所述待补全轨迹中点迹的采样时间,对所述待补全轨迹进行点迹补全处理,得到补全轨迹。
14.一种计算机可读存储介质,其特征在于,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1-12任一项所述的信息处理方法。
15.一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-12任一项所述信息处理方法。
CN202010527240.2A 2020-06-11 2020-06-11 信息处理方法、装置、存储介质及电子设备 Active CN111432347B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010527240.2A CN111432347B (zh) 2020-06-11 2020-06-11 信息处理方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010527240.2A CN111432347B (zh) 2020-06-11 2020-06-11 信息处理方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111432347A CN111432347A (zh) 2020-07-17
CN111432347B true CN111432347B (zh) 2020-09-08

Family

ID=71559073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010527240.2A Active CN111432347B (zh) 2020-06-11 2020-06-11 信息处理方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111432347B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112650949B (zh) * 2020-12-31 2023-12-29 东北大学 基于多源特征融合协同过滤的区域poi需求识别方法
CN113514069B (zh) * 2021-03-23 2023-08-01 重庆兰德适普信息科技有限公司 一种实时自动驾驶定位方法及系统
CN113395664B (zh) * 2021-08-16 2021-11-05 智道网联科技(北京)有限公司 用于高精地图绘制的车辆位置信息确定方法、装置及设备
CN114004330B (zh) * 2021-09-26 2023-11-14 苏州浪潮智能科技有限公司 一种基于特征值补全的推荐系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106646518A (zh) * 2016-11-18 2017-05-10 北京创业公社征信服务有限公司 基于三阶贝塞尔曲线及插值的gps轨迹数据补全方法
CN108345666A (zh) * 2018-02-06 2018-07-31 南京航空航天大学 一种基于时间-空间孤立点的车辆异常轨迹检测方法
CN108416376A (zh) * 2018-02-27 2018-08-17 北京东方天得科技有限公司 一种基于svm的在途物流人车跟踪监控管理系统及方法
CN109584553A (zh) * 2018-11-29 2019-04-05 中电海康集团有限公司 一种基于时空信息的路段关联度缺失补全方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10692370B2 (en) * 2014-03-03 2020-06-23 Inrix, Inc. Traffic obstruction detection
US20180284735A1 (en) * 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for industrial internet of things data collection in a network sensitive upstream oil and gas environment
CN110176142B (zh) * 2019-05-17 2020-08-07 佳都新太科技股份有限公司 车辆轨迹预测模型建立及预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106646518A (zh) * 2016-11-18 2017-05-10 北京创业公社征信服务有限公司 基于三阶贝塞尔曲线及插值的gps轨迹数据补全方法
CN108345666A (zh) * 2018-02-06 2018-07-31 南京航空航天大学 一种基于时间-空间孤立点的车辆异常轨迹检测方法
CN108416376A (zh) * 2018-02-27 2018-08-17 北京东方天得科技有限公司 一种基于svm的在途物流人车跟踪监控管理系统及方法
CN109584553A (zh) * 2018-11-29 2019-04-05 中电海康集团有限公司 一种基于时空信息的路段关联度缺失补全方法

Also Published As

Publication number Publication date
CN111432347A (zh) 2020-07-17

Similar Documents

Publication Publication Date Title
CN111432347B (zh) 信息处理方法、装置、存储介质及电子设备
CN111553162B (zh) 一种意图识别的方法以及相关装置
CN108280458B (zh) 群体关系类型识别方法及装置
CN110209810B (zh) 相似文本识别方法以及装置
CN113515942A (zh) 文本处理方法、装置、计算机设备及存储介质
CN111539212A (zh) 文本信息处理方法、装置、存储介质及电子设备
CN111597804B (zh) 一种实体识别模型训练的方法以及相关装置
CN111368525A (zh) 信息搜索方法、装置、设备及存储介质
CN113723378B (zh) 一种模型训练的方法、装置、计算机设备和存储介质
CN113204577A (zh) 信息推送方法、装置、电子设备和计算机可读介质
CN111914180B (zh) 基于图结构的用户特征确定方法、装置、设备及介质
CN112328911B (zh) 地点推荐方法、装置、设备及存储介质
CN113822460A (zh) 一种交通流量预测方法、装置、电子设备和存储介质
CN114722937A (zh) 一种异常数据检测方法、装置、电子设备和存储介质
CN114862488A (zh) 一种资源消耗异常对象的识别方法以及相关装置
CN112862021B (zh) 一种内容标注方法和相关装置
CN113766633A (zh) 数据处理方法、装置、电子设备以及存储介质
CN112907255A (zh) 一种用户分析方法和相关装置
CN111553163A (zh) 文本相关度的确定方法、装置、存储介质及电子设备
CN113486260B (zh) 互动信息的生成方法、装置、计算机设备及存储介质
CN116933149A (zh) 一种对象意图预测方法、装置、电子设备和存储介质
CN111612280B (zh) 一种数据分析方法和装置
CN113569043A (zh) 一种文本类别确定方法和相关装置
CN113822435A (zh) 一种用户转化率的预测方法及相关设备
CN113515943A (zh) 自然语言处理方法及其模型的获取方法、装置、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40025784

Country of ref document: HK