CN114443983A - 模型训练、应用方法及计算机存储介质 - Google Patents

模型训练、应用方法及计算机存储介质 Download PDF

Info

Publication number
CN114443983A
CN114443983A CN202210119301.0A CN202210119301A CN114443983A CN 114443983 A CN114443983 A CN 114443983A CN 202210119301 A CN202210119301 A CN 202210119301A CN 114443983 A CN114443983 A CN 114443983A
Authority
CN
China
Prior art keywords
text
training
model
machine learning
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210119301.0A
Other languages
English (en)
Inventor
郝亮
崔健
冯奕程
李政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba China Co Ltd
Original Assignee
Alibaba China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba China Co Ltd filed Critical Alibaba China Co Ltd
Priority to CN202210119301.0A priority Critical patent/CN114443983A/zh
Publication of CN114443983A publication Critical patent/CN114443983A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Remote Sensing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种模型训练、应用方法及计算机存储介质,其中,模型训练方法包括:获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息;根据所述搜索文本和所述地理位置信息构建训练样本;使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练。通过本申请实施例,可训练获得能进行较为准确的地图搜索的机器学习模型。

Description

模型训练、应用方法及计算机存储介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种模型训练、应用方法及计算机存储介质。
背景技术
随着通信技术和地理信息技术的发展,越来越多的地图搜索功能及提供地图搜索功能的应用被广泛使用。
通常,地图搜索的目的是要先搜索到一个地理区域,以便进一步确定搜索目标所在的地理位置,以及搜索目标周边情况或者导航路线等等。但与其它搜索类似,地图搜索同样通过输入搜索文本来进行搜索,也即,同样使用文本搜索的方式进行。传统的文本搜索是基于文本的语义进行query(查询)分析、召回和排序等操作的,常见的方案有基于人工规则、统计特征、机器学习的query分析、基于term匹配和语义向量的召回、基于机器学习的语义相关性排序等。
但是,这些方式均把一切文本搜索都当作自然语言文本来处理,将其应用于地图搜索场景下时,其不会考虑地图搜索的上述特殊需求,从而使得进行地图搜索的模型无法获得准确的搜索结果,无法满足实际的地图搜索需求。
发明内容
有鉴于此,本申请实施例提供一种模型训练及应用方案,以至少部分解决上述问题。
根据本申请实施例的第一方面,提供了一种模型训练方法,包括:获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息;根据所述搜索文本和所述地理位置信息构建训练样本;使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练。
根据本申请实施例的第二方面,提供了一种模型应用方法,包括:获取地图搜索请求,根据所述地图搜索请求确定所请求的POI位置信息;将所述地图搜索请求及所述POI位置信息输入预设的第一机器学习模型,其中,所述第一机器学习模型为用于进行地图搜索的模型;获取所述第一机器学习模型输出的所述地图搜索请求的搜索文本特征及对应的地理空间特征;基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果。
根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
根据本申请实施例提供的模型训练方案,在对应用于地图搜索过程的第一机器学习模型进行训练时,与传统的仅使用搜索文本作为训练样本不同,本申请实施例还将可反映地理空间信息的数据即地理位置信息,融合入训练样本中,由此,训练样本中既包含搜索文本的信息,还包含有地理空间信息,从而使得这些信息充分融入到模型的训练过程,训练获得的模型参数能够更好地处理携带有地理空间信息的地图搜索文本,获得更为准确的地图搜索结果,满足实际的地图搜索需求。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例一的一种模型训练方法的步骤流程图;
图2A为根据本申请实施例二的一种模型训练方法的步骤流程图;
图2B为图2A所示实施例中的一种模型结构示意图;
图3为根据本申请实施例三的一种模型应用方法的步骤流程图;
图4为根据本申请实施例四的一种模型训练装置的结构框图;
图5为根据本申请实施例五的一种模型应用装置的结构框图;
图6为根据本申请实施例六的一种地图搜索系统的结构示意图;
图7为根据本申请实施例七的一种电子设备的结构示意图。
具体实施方式
为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
下面结合本申请实施例附图进一步说明本申请实施例具体实现。
实施例一
参照图1,示出了根据本申请实施例一的一种模型训练方法的步骤流程图。
本实施例的模型训练方法包括以下步骤:
步骤S102:获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息。
其中,搜索文本可在获得使用授权或许可的情况下,采用任意适当方式获取,如在线挖掘或者历史搜索文本收集等,搜索文本可以为自然语言的文本,也可以为处理成格式化数据的文本,只要携带有地理要素如POI的信息即可。例如:搜索文本可以为“故宫附近有停车场吗?”,或者为类似des=停车场where location=“故宫”的形式等。
本申请实施例中,在一方面获取搜索文本的同时,另一方面还可获取基于历史地图搜索行为数据和POI(Point Of Interest,兴趣点)信息得到的地理位置信息。通常用户的历史地图搜索行为数据都会对应有搜索的目标地点,可将其看作POI,又因POI具有地理位置信息,因此,可基于搜索文本中携带的POI信息,和,历史地图搜索行为数据对应的POI,和预先采集或存储的POI信息来确定地理位置信息。其中,在本步骤中,地理位置信息可以与搜索文本具有匹配关系,也可不具有匹配关系。所述匹配关系意指该地理位置信息即为搜索文本对应的POI的地理位置信息。如,搜索文本为“故宫附近有停车场吗?”,若地理位置信息为“北纬39度54分26.37秒,东经116度23分29.22秒”,则认为二者匹配;若为“北纬89度54分26.37秒,东经116度23分29.22秒”,则认为二者不匹配。需要说明的是,地理位置信息也可为地理区域信息,或为地理区域或地理位置名称等,在此不作限制。
步骤S104:根据所述搜索文本和所述地理位置信息构建训练样本。
搜索文本可表征用户的地图搜索意图,而地理位置信息可表征地理空间位置,因此,基于搜索文本和地理位置信息构建训练样本,使得构建生成的训练样本除包含常规的地图搜索意图的语义信息外,还包含有地理空间信息。
假设,多个历史地图搜索行为数据显示一些用户搜索了“故宫最近的停车场”,并最终选择了天安门西停车场C,该天安门西停车场C的地理位置信息为“北纬39度54分26.37秒,东经116度23分29.22秒”;另外的多个历史地图搜索行为数据显示有用户搜索了“环球度假城”,并最终选择了环球度假城北门,该环球度假城北门的地理位置信息为“北纬37度14分26.17秒,东经110度10分29.32秒”;再多个历史地图搜索行为数据显示有用户搜索了“北京南站”,并最终选择了北京南站北1进站口,该北京南站北1进站口的地理位置信息为“北纬32度54分26.27秒,东经120度30分29.02秒”。基于此,示例性地,构建出的训练样本可如下表一所示:
表一
Figure BDA0003497744540000031
Figure BDA0003497744540000041
由上表可见,针对每个搜索文本,可基于其对应的目标地点的POI(如故宫附近停车场、环球度假村入口、北京南站等)与历史地图搜索行为数据中POI的对应关系,确定正确的地理位置信息。进而,基于该搜索文本及其对应的正确的地理位置信息构建正样本。而对于针对某个搜索文本来说正确的地理位置信息又可与其它的搜索文本组合成负样本。需要说明的是,上述仅为简单示意说明,在实际应用中,确定与搜索文本对应的正确的地理位置信息的方式可能更为复杂,数据量也可能更大,确定的地理位置信息也可能有多个候选地理位置信息(可按数据统计结果排序并从中选择)。但基于上述示例性原则,均可实现基于搜索文本和地理位置信息的正、负样本的构建,其均在本申请的保护范围内。
此外,还需要说明的是,本申请实施例中,若无特殊说明,“多个”、“多种”等与“多”有关的数量均意指两个及两个以上。
步骤S106:使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练。
因训练样本中既包含了搜索文本又包含了地理位置信息,因此,基于该种训练样本进行训练的第一机器学习模型可同时学习到搜索文本的语义信息和地理空间信息,可有效应用于地图搜索,输出准确的地图搜索结果。
其中,该第一机器学习模型可为任意的、能以本申请实施例中的训练样本为输入,以文本特征和地理空间特征为输出的模型,包括但不限于CNN模型等。
在一种优选方式中,该第一机器学习模型为包括文本特征分支和空间特征分支的模型。则,本步骤可实现为:使用所述训练样本中的所述搜索文本作为第一机器学习模型中的文本特征分支的输入,使用所述训练样本中的所述地理位置信息作为所述第一机器学习模型中的空间特征分支的输入,对所述第一机器学习模型进行训练,得到能输出用于进行地图搜索的地图搜索文本特征及与地图搜索文本特征相匹配的地理空间特征的模型。
也即,本申请实施例中的第一机器学习模型包括两个分支,分别为文本特征分支和空间特征分支,因使用训练样本同时对这两个分支进行训练,因此,任何一个分支模型参数的调整同时受两个分支训练结果的影响,使得训练完成的模型可在有效处理不同信息的同时,还能融合另一分支的信息。
其中,文本特征分支以训练样本中的搜索文本部分为输入,主要用于搜索文本的语义特征(或称文本特征)的提取;而空间特征分支则以训练样本中的地理位置信为输入,主要用于获得地理空间特征,包括但不限于经纬度特征。
在一种可行的实现方式中,所述第一机器学习模型可实现为双塔模型。双塔模型是一种分别用两个网络对输入进行建模,在最后的交叉层进行相似度计算的模型,其中的两个独立的网络形成了两个“塔”。本实施例中,文本特征分支和空间特征分支形成了双塔模型的两个“塔”,且两个分支各使用训练样本中的不同部分进行训练,最终获得能输出地图搜索文本特征及对应的地理空间特征的模型。需要说明的是,双塔模型的具体实现形式可由本领域技术人员根据实际需求采用适当的形式实现,包括但不限于DSSM双塔模型等。
可选地,文本特征分支可采用可进行文本特征提取的任意适当模型形式,包括但不限于transformer形式、CNN形式、RNN形式等;而空间特征分支同样可采用可进行地理空间特征提取的任意适当模型形式,包括但不限于CNN形式、RNN形式等。
因第一机器学习模型采用了双分支结构,在训练过程中,一方面,每个分支针对自身所需要的功能进行针对性训练,如文本特征分支着重进行文本特征提取训练,空间特征分支着重进行空间特征提取训练;另一方面,又因第一机器学习模型的参数调整是基于训练结果进行整体调整,即,对文本特征分支的训练会影响到空间特征分支,相应地,对空间特征分支的训练也同样会影响到文本特征分支,两个分支的模型参数是进行整体调整的。因此,第一机器学习模型实现了通过两个分支既分别进行不同类型的数据的针对性处理,又可对另一分支的训练产生影响,以使最终获得的模型可更为有效地处理搜索文本中的文本语义信息及地理空间信息。当将训练完成的该第一机器学习模型应用于地图搜索场景下时,则可获得更为准确的地图搜索结果,满足实际的地图搜索需求。
通过本实施例,在对应用于地图搜索过程的第一机器学习模型进行训练时,与传统的仅使用搜索文本作为训练样本不同,本实施例还将可反映地理空间信息的数据即地理位置信息,融合入训练样本中,由此,训练样本中既包含搜索文本的信息,还包含有地理空间信息,从而使得这些信息充分融入到模型的训练过程,训练获得的模型参数能够更好地处理携带有地理空间信息的地图搜索文本,获得更为准确的地图搜索结果,满足实际的地图搜索需求。
本实施例的模型训练方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例二
参照图2A,示出了根据本申请实施例二的一种模型训练方法的步骤流程图。
本实施例的模型训练方法包括以下步骤:
步骤S202:获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息。
其中,获取搜索文本和获取地理位置信息在具体执行时可以不分先后顺序,也可并行执行。
在一种可行方式中,可根据历史地图搜索行为数据获得对应的历史地图搜索文本,以及,获得历史地图搜索行为数据对应的POI的地理位置信息;对地理位置信息指示的地理位置进行离散化处理,获得地理区域信息。通过对地理位置进行离散化处理,既降低了数据处理量,又方便了对数据的管理。
例如,可以通过线上搜索日志里的搜索点击行为和POI库里的POI名称、地址与地理位置的对应关系,挖掘出搜索文本和地理位置的对应关系,再将地理位置离散化成一定规格如1km*1km或5km*5km的粒度的geohash地理区域,构建搜索文本-geohash二分图。其中,geohash意指把地理位置的坐标按一定粒度离散化后得到的区域,如1km*1km或5km*5km的粒度的区域。也即,在一种可行方式中,基于地理位置获得地理区域信息的方式可采用geohash编码的方式实现。geohash编码可以将二维的经纬度转换成字符串,每一个字符串代表了某一个地理区域,该地理区域内所有的点(经纬度坐标)共享该地理区域的geohash编码字符串。字符串越长,表示的范围越精确。由此,既可以保护隐私,又容易进行数据缓存及后续处理。具体的基于地理位置信息生成geohash编码的实现手段可参照相关技术中的描述,在此不再赘述。
步骤S204:根据所述搜索文本和所述地理位置信息构建训练样本。
通过本步骤,使得构建出的训练样本既包含有搜索文本,又包含有以地理位置信息为代表的地理空间信息。
在一种可行方式中,可以分别确定与获取的搜索文本相匹配的地理位置信息和不匹配的地理位置信息;基于获取的搜索文本与相匹配的地理位置信息,及获取的搜索文本与不匹配的地理位置信息,构建训练样本。其中,与获取的搜索文本相匹配的地理位置信息可以认为是正样本,与获取的搜索文本不匹配的地理位置信息可以认为是负样本,一种示例训练样本如上述表一中所示。基于正负样本构建训练样本,以保证构建出的训练样本的全面性和有效性。当对地理位置进行了离散化处理获得了地理区域信息的情况下,本步骤则可以实现为:根据搜索文本和所述地理区域信息构建训练样本。示例性地,假设基于上述表一中的地理位置信息指示的地理位置获得的地理区域信息(示意为geohash编码)如下表二所示,则基于其构建的训练样本示例性如下表三所示:
表二
地理位置信息 Geohash编码
北纬39度54分26.37秒,东经116度23分29.22秒 WX4ER
北纬32度54分26.27秒,东经120度30分29.02秒 WX4G2
北纬37度14分26.17秒,东经110度10分29.32秒 WX4G3
表三
Figure BDA0003497744540000061
Figure BDA0003497744540000071
由上可见,采用地理区域信息如geohash编码的方式来构建训练样本,可以大大减少训练样本的数据量,也便于后续训练中的数据处理。
此外,在另一种可行方式中,还可以根据纠错对齐信息(如纠错对齐概率等),对获取的搜索文本进行编辑操作,其中,所述编辑操作包括对获取的所述搜索文本进行字符增加、字符删除、字符替换、原字符保留的操作中的至少一种;根据进行了编辑操作后的搜索文本,及地理位置信息,构建训练样本。通过这种方式,可以高效、快速且低成本地扩展训练样本,使得训练样本的样本数据更为丰富,进而可以使得训练出的模型容错和纠错能力也更强。
其中,纠错对齐信息如纠错对齐概率可基于线上大数据的统计结果获得,以纠错对齐概率为依据进行搜索文本的编辑操作,可使得生成的新搜索文本与实际错误分布一致,更符合实际的搜索文本出现错误的情况,满足实际纠错需求。
示例性地,假设搜索文本query=振泰路万科四季花城,根据纠错对齐信息确定其在道路名称及小区名称两处出错概率较大,则可对其进行字符增加,如query’=振泰路万科四季花园城;对其进行字符替换,如query’=正泰路万科四季花城;或者,也可对其进行字符删除,如query’=振泰路万科四季城,等等。
步骤S206:使用训练样本中的搜索文本作为第一机器学习模型中的文本特征分支的输入,使用训练样本中的地理位置信息作为第一机器学习模型中的空间特征分支的输入,对第一机器学习模型进行训练,得到能输出用于进行地图搜索的地图搜索文本特征及与地图搜索文本特征相匹配的地理空间特征的模型。
如前所述,本申请实施例中的第一机器学习模型为双分支的模型,在一种可行方式中,该双分支模型可以实现为双塔机器学习模型,其中,文本特征分支为用于获取搜索文本的文本特征的语言模型分支,空间特征分支为用于获取地理位置信息的地理空间特征的特征向量分支。由此,该第一机器学习模型即可充分学习训练样本中的多种信息,又可输出符合需求的各种特征向量,以灵活地满足不同需求。
例如,本申请实施例中,采用DSSM结构的双塔模型,且其中的文本特征分支采用transformer模型结构。transformer模型结构中引入了自注意力机制,可以更有效地实现特征提取。
例如,在一个示例中,第一机器学习模型采用DSSM结构,左侧分支用transformer对搜索文本编码并输出相应特征,右侧分支对geohash进行特征提取,直接输出geohash的embedding。
具体地,一方面,可以根据线上挖掘获得的纠错对齐概率,随机对搜索文本中的词进行编辑操作,包括增、删、改及保留原词。然后,编辑操作后的搜索文本输入transformer编码器进行处理,获得输出的文本特征,以及,搜索文本中的每个词的词向量,及每个词的输出结果的分类,总共4类,对应增、删、改及保留。
另一方面,可根据geohash对空间特征分支进行训练,获得输出的geohash的embedding。但不限于此,在另一种可行方式中,还可以把地理位置信息中的经度和纬度分别离散化后,再输入模型计算出embedding,同样可适用本申请实施例的方案。
此外,本申请实施例中的第一机器学习模型在训练中使用的损失函数包括:用于指示所述搜索文本和所述地理位置信息的相似度的损失函数、用于指示相邻地理区域在空间位置上的相似度的损失函数、和用于指示所述搜索文本的编辑操作类型的损失函数;其中,所述编辑操作类型包括:字符增加类型、字符删除类型、字符替换类型、原字符保留类型中的至少一种。
仍以上述采用DSSM结构的第一机器学习模型为例,通过上述损失函数获得的对应的模型训练的loss(损失)分三项:第一项是搜索文本-geohash相似度的交叉熵loss,用于表达搜索文本和geohash的相似度;第二项是geohash和邻接geohash相似度的交叉熵loss,用于表达相邻geohash在空间位置上的相似度;第三项是文本特征分支的loss,用多分类的交叉熵loss,表达对应的词的来源(原词还是编辑过的)。
对第一机器学习模型的训练是一个循环迭代过程,在对每一个训练样本进行学习获得loss后,都可基于此进行模型调整,包括但不限于模型参数调整,直至达到训练终止条件,例如,达到预设训练次数或loss达到预设目标等。
通过上述过程,本申请实施例中第一机器学习模型通过包含搜索文本及地理位置信息的训练样本的训练和学习,可至少输出搜索文本的文本特征、搜索文本中每个词的词特征、以及地理空间特征如geohash embedding。从而,为地图搜索提供有效且准确的搜索基础和依据。
在训练完成,获得能输出地图搜索文本特征及对应的地理空间特征的第一机器学习模型后,可选地,还可执行以下操作。
步骤S208:基于训练完成的第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练。
虽然训练完成的第一机器学习模型已可以输出用于地图搜索的相应数据,但为了应对实际的地图搜索中可能出现的各种情况,并提高更为高效的地图搜索功能,本申请实施例中,还会基于训练完成的第一机器学习模型的输出,来对第二机器学习模型进行训练。可选地,该第二机器学习模型可以为排序模型、纠错模型和实体识别模型中的任意一种。
以下,分别对排序模型、纠错模型和实体识别模型的训练进行说明。但本领域技术人员应当明了的是,在实际应用中,可采用本申请实施例中的方案仅对这些模型中的部分模型进行训练,而其它模型仍采用传统方式进行训练,相较于全部模型均采用传统方式训练,仍具有较好的效果。但若三个模型均采用本申请实施例的方案进行训练,将取得更好的效果。
(一)基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的排序模型进行训练,包括:
(1)构建用于进行排序模型训练的第一训练样本和第二训练样本,其中,第一训练样本包括:地图搜索文本样本和地图搜索文本样本所要搜索的POI的属性数据样本;第二训练样本包括:地图搜索文本样本对应的搜索发起位置数据样本、和POI位置数据样本。
(2)将第一训练样本输入文本特征分支,获得用于指示地图搜索文本样本的语义的特征向量、和用于指示POI的属性数据样本的属性特征的特征向量;将第二训练样本输入空间特征分支,获得用于指示搜索发起位置的特征向量和用于指示POI位置的特征向量。
可选地,POI的属性数据样本包括:POI的名称数据样本和地址数据样本,用于指示POI的属性数据样本的属性特征的特征向量包括:用于指示POI的名称的特征向量和用于指示POI的地理位置的特征向量。
本步骤中,使用已训练完成的第一机器学习模型中的分支,可有效提取地图搜索文本样本的特征和表征位置的特征,且节约实现成本。并且,提取的地图搜索文本样本的特征中因模型关系还能携带有地理空间信息。
(3)根据获得的各特征向量,计算地图搜索文本样本和POI的相关度。
(4)根据所述相关度,对排序模型进行训练。
在一个具体示例中,上述过程可实现为:一方面,输入query(地图搜索文本样本)和POI名称、地址(POI的属性数据样本),经过训练完成的第一机器学习模型中的transformer编码器,得到文本特征向量vt_q(地图搜索文本样本的文本特征),vt_pn(POI的名称特征),vt_pa(POI的地理位置特征)。另一方面,输入用户发起query的位置(搜索发起位置数据样本)和POI的位置(POI位置数据样本),经过训练完成的第一机器学习模型的geohash embedding的空间特征分支,得到用户和POI的位置表示的特征向量,记作vg_q(搜索发起位置),vg_p(POI位置)。然后,根据vt_q,vt_pn,vt_pa,vg_q,vg_p,一起计算出query和POI的相关性打分score。例如,在一种可行方式中,可将vt_q和vg_q拼接形成第一拼接向量,将vt_pn,vt_pa,和vg_p拼接形成第二拼接向量,再将第一拼接向量和第二拼接向量进行内积运算,获得相关性打分score。在另一种可行方式中,可将vt_q,vt_pn,vt_pa,vg_q,vg_p一起拼接形成拼接向量,再将该拼接向量输入用于进行相关度计算的模型(包括但不限于transformer结构的模型)中,获得相关性打分score。但不限于此,其它计算所述相关性打分score的方式也同样适用于本申请实施例的方案。
与前述第一机器学习模型的训练类似,排序模型的训练也需循环迭代进行,直至达到预设训练次数或score达到预设目标等。
本实施例中的排序模型同时利用了搜索文本和地理空间信息如geohash的信息,可有效计算出query和POI的相关性。
(二)基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的纠错模型进行训练,包括:
(1)以地图搜索文本样本为输入,通过用于进行文本纠错的文本翻译模型获得对应的纠错文本和所述纠错文本对应的置信度;以及,以所述地图搜索文本样本为输入,通过训练完成的第一机器学习模型中的文本特征分支,获得对应的样本搜索文本特征。
本申请实施例中,对排序模型、纠错模型和实体识别模型进行训练的样本中的部分样本数据可能存在重叠。而本步骤中,文本翻译模型可采用传统方式下的文本翻译模型,本实施例中,该文本翻译模型用于文本纠错,当输入地图搜索文本样本时,可输出相对应的纠错文本及纠错文本的置信度。
此外,与排序模型的训练类似,纠错模型的训练过程中,使用已训练完成的第一机器学习模型中的分支,可有效提取地图搜索文本样本,且节约实现成本。并且,提取的地图搜索文本样本的特征中因模型关系还能携带有地理空间信息。
(2)将所述纠错文本输入所述文本特征分支,获得对应的纠错文本特征。
将传统文本翻译模型输出的纠错文本再次输入训练完成的第一机器学习模型的文本特征分支进行特征提取,能够获得携带地理空间信息的纠错文本特征。
(3)根据所述样本搜索文本特征和所述纠错文本特征的相似度,对所述纠错模型进行训练。
在一种可行方式中,本步骤可实现为:获得所述样本搜索文本特征和所述纠错文本特征的相似度;根据所述相似度和所述纠错文本对应的置信度,对所述纠错文本重新排序,根据重新排序结果对所述纠错模型进行训练,以达到更好的训练效果。
在一个具体示例中,上述过程可实现为:一方面,输入原始query(地图搜索文本样本),经过传统的文本翻译模型,得到top k的纠错query和对应的文本打分(即置信度),分别记作query’和st’。其中,k可由本领域技术人员根据实际需求适当设置。另一方面,输入原始query(地图搜索文本样本),经过训练完成的第一机器学习模型中的transformer编码器,得到对应的特征向量vg(样本搜索文本特征),如前所述,这个特征向量中同时包含语义特征和地理空间特征。然后,输入传统的文本翻译模型输出的纠错query’,经过训练完成的第一机器学习模型中的transformer编码器,得到对应的特征向量vg’(纠错文本特征),这个特征向量中也同时包含语义特征和地理空间特征。接着,对vg和vg’求cos相似度,输出空间匹配打分sg’。根据sg’和之前的文本打分st’,对纠错query’重新排序,排序打分s=a*sg’+(1-a)*st’。其中,a表示权重,其具体数值可由本领域技术人员根据实际需求适当设置,一般来说,使sg’的权重大于st’的权重即可。
可见,本示例中的纠错模型对传统的文本翻译模型输出的query’增加了空间一致性校验,以实现更为准确的纠错。
(三)基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的实体识别模型进行训练,包括:
(1)以地图搜索文本样本为输入,通过训练完成的第一机器学习模型中的文本特征分支,获得对应的词向量。
如前所述,第一机器学习模型的文本特征分支不仅可输出整个地图搜索文本样本的文本特征,还可输出其中的每个词对应的词向量,并且,该词向量也同时包含语义特征和地理空间特征。
(2)根据所述词向量进行实体识别,获得实体识别结果。
(3)根据所述实体识别结果,对所述实体识别模型进行训练。
在一个具体示例中,上述过程可实现为:输入query(地图搜索文本样本),经过训练完成的第一机器学习模型中的transformer编码器,得到每个词的编码向量vw。对每个vw,用一层全连接算出tag(实体识别标签)及其打分(置信度)。再用CRF解码,得到最终的实体识别结果。
需要说明的是,本实施例中,不对排序模型、纠错模型及实体识别模型采用的具体结构进行限定,能够实现相应功能的任意适当模型均可。
通过本实施例中所描述的上述过程训练获得的各个模型均可有效考虑地理空间信息,更为适用于地图搜索场景,为用户提供准确的地图搜索结果,提升用户体验。
以下,以一个示例性模型结构,对上述过程中涉及的模型间关系进行说明,如图2B所示。
图2B中,第一机器学习模型采用双塔模型结构,其包括transformer编码器和geohash embedding这个分支。其中,transformer编码器用于输出文本特征,geohashembedding分支可采用任意适当结构,包括但不限于CNN、RNN等,用于输出地理空间特征。本示例中,第一机器学习模型可输出搜索文本的文本特征、搜索文本中每个词的特征,以及geohash embedding特征。
在训练完成的第一机器学习模型的基础上,再对排序模型、纠错模型和实体识别模型进行训练,在这些模型的训练过程中,会使用训练完成的第一机器学习模型的两个分支进行相应的数据处理,以使这些模型也可充分处理地理空间信息。
其中,在对排序模型进行训练时,使用了训练完成的transformer编码器和geohash embedding分支;在对纠错模型进行训练时,使用了transformer编码器;在对实体识别模型进行训练时,也使用了transformer编码器。这些模型的具体训练过程如上所述,在此不再赘述。
基于前述训练完成的、可输出地图搜索文本特征及与地图搜索文本特征相匹配的地理空间特征的第一机器学习模型、排序模型、纠错模型和实体识别模型构建的地图搜索系统,可真实反映用户的地图搜索意图,反馈更为准确的地图搜索结果。
通过本实施例,在对应用于地图搜索过程的第一机器学习模型进行训练时,与传统的仅使用搜索文本作为训练样本不同,本实施例还将可反映地理空间信息的数据即地理位置信息,融合入训练样本中,由此,训练样本中既包含搜索文本的信息,还包含有地理空间信息,从而使得这些信息充分融入到模型的训练过程,训练获得的模型参数能够更好地处理携带有地理空间信息的地图搜索文本,获得更为准确的地图搜索结果,满足实际的地图搜索需求。此外,本实施例中的第一机器学习模型采用了双分支结构,一个分支用于获得搜索文本的文本特征,另一分支用于获得地理空间特征,两个分支既分别进行不同类型的数据的针对性处理,又可对另一分支的训练产生影响,以使最终获得的模型可更为有效地处理搜索文本中的文本语义信息及地理空间信息。由此,可将该第一机器学习模型应用于地图搜索场景下,有效满足地图搜索的实际需求,反映用户的真实地图搜索意图。
本实施例的模型训练方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例三
参照图3,示出了根据本申请实施例三的一种模型应用方法的步骤流程图。
本实施例的模型应用方法为对前述实施例一和二所训练获得的机器学习模型的应用,该模型应用方法包括以下步骤:
步骤S302:获取地图搜索请求,根据所述地图搜索请求确定所请求的POI位置信息。
地图搜索请求通常采用搜索文本的形式,其中通常都携带有相应的POI(可以为具体地点或区域)的信息,基于该信息可从预设的数据库中检索出POI对应的地理位置信息。
步骤S304:将所述地图搜索请求及所述POI位置信息输入预设的第一机器学习模型。
其中,所述第一机器学习模型为通过前述实施例一或二训练获得的模型。
步骤S306:获取所述第一机器学习模型输出的所述地图搜索请求的搜索文本特征及对应的地理空间特征。
经过训练的第一机器学习模型可输出相应的搜索文本特征及地理空间特征。
步骤S308:基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果。
虽然基于第一机器学习模型的输出也可获得与地图搜索请求对应的地图搜索结果,但在实际应用中,通常需要对结果进行排序、对地图搜索请求中可能出现的错误进行纠错、且需基于对地图搜索请求进行实体识别,才可系统性地获得地图搜索结果。
因此,在一种可行方式中,所述基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果,包括:基于所述搜索文本特征和所述地理空间特征,使用通过实施例二中训练获得的排序模型,获得搜索排序结果。
例如,用户输入地图搜索请求“复兴路玉海花园小区”,在确定其对应的POI位置信息后,输入第一机器学习模型,经处理获得对应的搜索文本特征和地理空间特征后,输入排序模型。排序模型基于这两部分特征将按照被用户选择的概率高低依次给出四个候选结果,如“复兴路玉海花园小区北门”、“复兴路玉海花园小区南门”、“复兴路玉海花园小区东门”、“复兴路玉海花园小区西门”。也即,“复兴路玉海花园小区北门”的排序最高,“复兴路玉海花园小区东门”的排序最低。则,用户可基于该排序进行后续的选择和处理。
或者,在另一种可行方式中,所述基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果,包括:基于所述搜索文本特征和所述地理空间特征,使用通过实施例二中训练获得的纠错模型对所述地图搜索请求进行纠错处理,并根据纠错处理后的地图搜索请求获得地图搜索结果。
例如,用户输入地图搜索请求“复兴路玉海花园小区”,在确定其对应的POI位置信息后,输入第一机器学习模型,经处理获得对应的搜索文本特征和地理空间特征后,将其中的搜索文本特征输入纠错模型,经纠错模型处理后输出为“复兴路玉海园小区”对应的文本特征。则,将基于该纠错后的搜索文本特征和第一机器学习模型输出的地理空间特征进行地图搜索,获得最终的搜索结果。
或者,在再一种可行方式中,所述基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果,包括:基于所述搜索文本特征和所述地理空间特征,使用通过实施例二中训练获得的实体识别模型对所述地图搜索请求进行实体识别,并根据实体识别结果获得地图搜索结果。
例如,用户输入地图搜索请求“复兴路玉海花园小区”,在确定其对应的POI位置信息后,输入第一机器学习模型,经处理获得对应的搜索文本特征和地理空间特征后,将其中的搜索文本特征输入实体识别模型,获得对应的实体识别结果,如“复兴路”、“玉海花园小区”等。进而,基于该实体识别结果和第一机器学习模型输出的地理空间特征进行地图搜索,获得最终的搜索结果。
传统的地图搜索方式中,只对搜索文本处理而没考虑到地图搜索的特性,没有考虑地理空间相关的信息,因而不能很好地反映用户的真实意图。而本实施例的方案,可使用训练完成的、包括文本特征分支和空间特征分支的第一机器学习模型,构成搜索引擎的通用平台,把搜索文本和地理位置信息同时引入query分析和排序,更准确地反映用户的真实意图。同时,在使用地理空间信息的情况下,可以不必再考虑城市分析,也即由地理空间分析代替传统的城市分析,简化了地图搜索系统的方案实现,避免了由于系统中间加入城市一级带来的精度问题和响应时间的问题。而且,本方案中,基于纠错对齐概率形成训练样本进行训练获得的文本特征分支可以显式地模拟输入错误的query,从而能更准确地学习到其背后的真实意图。
本实施例的模型训练方法可以由任意适当的具有数据处理能力的电子设备执行,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。
实施例四
参照图4,示出了根据本申请实施例四的一种模型训练装置的结构框图。
本实施例的模型训练装置包括:获取模块402,用于获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息;构建模块404,用于根据所述搜索文本和所述地理位置信息构建训练样本;训练模块406,用于使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练。
可选地,第一机器学习模型包括文本特征分支和空间特征分支;训练模块406,用于使用所述训练样本中的所述搜索文本作为第一机器学习模型中的文本特征分支的输入,使用所述训练样本中的所述地理位置信息作为所述第一机器学习模型中的空间特征分支的输入,对所述第一机器学习模型进行训练,得到能输出用于进行地图搜索的地图搜索文本特征及与所述地图搜索文本特征相匹配的地理空间特征的模型。
可选地,构建模块404,用于分别确定与获取的所述搜索文本相匹配的地理位置信息和不匹配的地理位置信息;基于获取的所述搜索文本与相匹配的地理位置信息,及获取的所述搜索文本与不匹配的地理位置信息,构建训练样本。
可选地,构建模块404,用于分别确定与获取的所述搜索文本相匹配的地理位置信息和不匹配的地理位置信息;根据纠错对齐信息,对获取的所述搜索文本进行编辑操作,其中,所述编辑操作包括对获取的所述搜索文本进行字符增加、字符删除、字符替换、原字符保留的操作中的至少一种;根据进行了编辑操作后的所述搜索文本,及所述地理位置信息,构建训练样本。
可选地,获取模块402,用于获取用于进行地图搜索的搜索文本,以及,根据历史地图搜索行为数据获得对应的历史地图搜索文本,以及,获得所述历史地图搜索行为数据对应的POI的地理位置信息;对所述地理位置信息指示的地理位置进行离散化处理,获得地理区域信息;构建模块404根据所述搜索文本和所述地理区域信息构建训练样本。
可选地,所述第一机器学习模型为双塔机器学习模型,所述文本特征分支为用于获取所述搜索文本的文本特征的语言模型分支,所述空间特征分支为用于获取所述地理位置信息的地理空间特征的特征向量分支。
可选地,所述文本特征分支采用transformer模型结构。
可选地,训练模块406对所述第一机器学习模型进行训练包括:基于预设的损失函数对用于进行地图搜索的所述第一机器学习模型进行训练,其中,所述损失函数包括:用于指示所述搜索文本和所述地理位置信息的相似度的损失函数、用于指示相邻地理区域在空间位置上的相似度的损失函数、和用于指示所述搜索文本的编辑操作类型的损失函数;其中,所述编辑操作类型包括:字符增加类型、字符删除类型、字符替换类型、原字符保留类型中的至少一种。
可选地,本实施例的模型训练装置还包括:输出应用模块408,用于基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练。
可选地,所述第二机器学习模型为排序模型;输出应用模块408基于训练完成的所述第一机器学习模型的输出,对用于进行地图搜索的第二机器学习模型模型进行训练,包括:构建用于进行所述排序模型训练的第一训练样本和第二训练样本,其中,所述第一训练样本包括:地图搜索文本样本和所述地图搜索文本样本所要搜索的POI的属性数据样本;所述第二训练样本包括:所述地图搜索文本样本对应的搜索发起位置数据样本、和POI位置数据样本;将所述第一训练样本输入所述文本特征分支,获得用于指示所述地图搜索文本样本的语义的特征向量、和用于指示所述POI的属性数据样本的属性特征的特征向量;将所述第二训练样本输入所述空间特征分支,获得用于指示搜索发起位置的特征向量和用于指示POI位置的特征向量;根据获得的各特征向量,计算所述地图搜索文本样本和所述POI的相关度;根据所述相关度,对所述排序模型进行训练。
可选地,所述POI的属性数据样本包括:所述POI的名称数据样本和地址数据样本,所述用于指示所述POI的属性数据样本的属性特征的特征向量包括:用于指示所述POI的名称的特征向量和用于指示所述POI的地理位置的特征向量。
可选地,所述第二机器学习模型为纠错模型;输出应用模块408基于训练完成的所述第一机器学习模型的输出,对用于进行地图搜索的第二机器学习模型进行训练,包括:以地图搜索文本样本为输入,通过用于进行文本纠错的文本翻译模型获得对应的纠错文本和所述纠错文本对应的置信度;以及,以所述地图搜索文本样本为输入,通过训练完成的所述第一机器学习模型中的文本特征分支,获得对应的样本搜索文本特征;将所述纠错文本输入所述文本特征分支,获得对应的纠错文本特征;根据所述样本搜索文本特征和所述纠错文本特征的相似度,对所述纠错模型进行训练。
可选地,输出应用模块408在根据所述样本搜索文本特征和所述纠错文本特征的相似度,对所述纠错模型进行训练时:获得所述样本搜索文本特征和所述纠错文本特征的相似度;根据所述相似度和所述纠错文本对应的置信度,对所述纠错文本重新排序,根据重新排序结果对所述纠错模型进行训练。
可选地,所述第二机器学习模型为实体识别模型;输出应用模块408基于训练完成的所述第一机器学习模型的输出,对用于进行地图搜索的第二机器学习模型进行训练,包括:以所述地图搜索文本样本为输入,通过训练完成的所述第一机器学习模型中的文本特征分支,获得对应的词向量;根据所述词向量进行实体识别,获得实体识别结果;根据所述实体识别结果,对所述实体识别模型进行训练。
本实施例的模型训练装置用于实现前述多个方法实施例中相应的模型训练方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的模型训练装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例五
参照图5,示出了根据本申请实施例五的一种模型应用装置的结构框图。
本实施例的模型应用装置包括:数据确定模块502,用于获取地图搜索请求,根据所述地图搜索请求确定所请求的POI位置信息及所述地图搜索请求与所述POI位置信息;输入模块504,用于将所述地图搜索请求及所述POI位置信息输入预设的第一机器学习模型,其中,所述第一机器学习模型为用于进行地图搜索的模型;特征获取模块506,用于获取所述第一机器学习模型输出的所述地图搜索请求的搜索文本特征及对应的地理空间特征;结果模块508,用于基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果。其中,所述第一机器学习模型可以为根据实施例四的模型训练装置训练完成的模型。
可选地,在一种方式中,结果模块508,用于基于所述搜索文本特征和所述地理空间特征,使用通过实施例四中所述的模型训练装置训练获得的排序模型,获得搜索排序结果。
可选地,在一种方式中,结果模块508,用于基于所述搜索文本特征和所述地理空间特征,使用通过实施例四中所述的模型训练装置训练获得的纠错模型对所述地图搜索请求进行纠错处理,并根据纠错处理后的地图搜索请求获得地图搜索结果。
可选地,在一种方式中,结果模块508,用于基于所述搜索文本特征和所述地理空间特征,使用通过实施例四中所述的模型训练装置训练获得的实体识别模型对所述地图搜索请求进行实体识别,并根据实体识别结果获得地图搜索结果。
本实施例的模型应用装置用于实现前述多个方法实施例中相应的模型应用方法,并具有相应的方法实施例的有益效果,在此不再赘述。此外,本实施例的模型应用装置中的各个模块的功能实现均可参照前述方法实施例中的相应部分的描述,在此亦不再赘述。
实施例六
参照图6,示出了根据本申请实施例六的一种地图搜索系统的结构示意图。
本实施例的地图搜索系统包括线下部分和线上部分,线下部分中,用于输出地图搜索文本特征及与所述地图搜索文本特征相匹配的地理空间特征的第一机器学习模型部分基于对线上日志和POI数据进行数据处理后构建的训练样本预先进行训练,并在训练完成后,再以其为基础,进行第二机器学习模型部分,包括但不限于排序模型、纠错模型和实体识别模型的训练。这些模型的具体训练过程可参见前述多个实施例中相关部分的相应描述,在此不再赘述。
用于输出地图搜索文本特征及与所述地图搜索文本特征相匹配的地理空间特征的第一机器学习模型、第二机器学习模型如排序模型、纠错模型、实体识别模型训练完成后,即可部署至具有地图搜索功能的平台或应用或搜索引擎等中,以提供线上地图搜索服务。相应地,本实施例的地图搜索系统中的线上部分基于这些训练完成的模型,可提供包括实体识别、纠错、排序、文本召回、空间召回等多种与地图搜索有关的功能。
可见,通过本实施例的地图搜索系统,可提供高效、完善的地图搜索服务,满足不同地图搜索需求。
实施例七
参照图7,示出了根据本申请实施例七的一种电子设备的结构示意图,本申请具体实施例并不对电子设备的具体实现做限定。
如图7所示,该电子设备可以包括:处理器(processor)702、通信接口(Communications Interface)704、存储器(memory)706、以及通信总线708。
其中:
处理器702、通信接口704、以及存储器706通过通信总线708完成相互间的通信。
通信接口704,用于与其它电子设备或服务器进行通信。
处理器702,用于执行程序710,具体可以执行上述模型训练方法实施例或模型应用方法实施例中的相关步骤。
具体地,程序710可以包括程序代码,该程序代码包括计算机操作指令。
处理器702可能是CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器706,用于存放程序710。存储器706可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序710具体可以用于使得处理器702执行如实施例一或二中所述的模型训练方法,或者,执行如实施例三中所述的模型应用方法。
程序710中各步骤的具体实现可以参见上述模型训练方法实施例或模型应用方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,并具有前述方法实施例对应的效果,在此不再赘述。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的模型训练或应用方法。此外,当通用计算机访问用于实现在此示出的模型训练或应用方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的模型训练或应用方法的专用计算机。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请实施例的范围。
以上实施方式仅用于说明本申请实施例,而并非对本申请实施例的限制,有关技术领域的普通技术人员,在不脱离本申请实施例的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本申请实施例的范畴,本申请实施例的专利保护范围应由权利要求限定。

Claims (16)

1.一种模型训练方法,包括:
获取用于进行地图搜索的搜索文本,以及获取基于历史地图搜索行为数据和POI信息得到的地理位置信息;
根据所述搜索文本和所述地理位置信息构建训练样本;
使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练。
2.根据权利要求1所述的方法,其中,所述第一机器学习模型包括文本特征分支和空间特征分支;
所述使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练,包括:
使用所述训练样本中的所述搜索文本作为所述第一机器学习模型中的文本特征分支的输入,使用所述训练样本中的所述地理位置信息作为所述第一机器学习模型中的空间特征分支的输入,对所述第一机器学习模型进行训练,得到能输出用于进行地图搜索的地图搜索文本特征及与所述地图搜索文本特征相匹配的地理空间特征的模型。
3.根据权利要求1或2所述的方法,其中,所述根据所述搜索文本和所述地理位置信息构建训练样本,包括:
分别确定与获取的所述搜索文本相匹配的地理位置信息和不匹配的地理位置信息;
基于获取的所述搜索文本与相匹配的地理位置信息,及获取的所述搜索文本与不匹配的地理位置信息,构建训练样本。
4.根据权利要求1或2所述的方法,其中,所述根据所述搜索文本和所述地理位置信息构建训练样本,包括:
根据纠错对齐信息,对获取的所述搜索文本进行编辑操作,其中,所述编辑操作包括对获取的所述搜索文本进行字符增加、字符删除、字符替换、原字符保留的操作中的至少一种;
根据进行了编辑操作后的所述搜索文本,及所述地理位置信息,构建训练样本。
5.根据权利要求1或2所述的方法,其中,
所述获取基于历史地图搜索行为数据和POI信息得到的地理位置信息,包括:根据历史地图搜索行为数据获得对应的历史地图搜索文本,以及,获得所述历史地图搜索行为数据对应的POI的地理位置信息;对所述地理位置信息指示的地理位置进行离散化处理,获得地理区域信息;
所述根据所述搜索文本和所述地理位置信息构建训练样本,包括:根据所述搜索文本和所述地理区域信息构建训练样本。
6.根据权利要求2所述的方法,其中,所述第一机器学习模型为双塔机器学习模型,所述文本特征分支为用于获取所述搜索文本的文本特征的语言模型分支,所述空间特征分支为用于获取所述地理位置信息的地理空间特征的特征向量分支。
7.根据权利要求6所述的方法,其中,所述文本特征分支采用transformer模型结构。
8.根据权利要求6所述的方法,其中,所述使用所述训练样本对用于进行地图搜索的第一机器学习模型进行训练,包括:
基于预设的损失函数对用于进行地图搜索的所述第一机器学习模型进行训练,其中,所述损失函数包括:用于指示所述搜索文本和所述地理位置信息的相似度的损失函数、用于指示相邻地理区域在空间位置上的相似度的损失函数、和用于指示所述搜索文本的编辑操作类型的损失函数;其中,所述编辑操作类型包括:字符增加类型、字符删除类型、字符替换类型、原字符保留类型中的至少一种。
9.根据权利要求1或2所述的方法,其中,所述方法还包括:
基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练。
10.根据权利要求9所述的方法,其中,所述第二机器学习模型为排序模型;
所述基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练,包括:
构建用于进行所述排序模型训练的第一训练样本和第二训练样本,其中,所述第一训练样本包括:地图搜索文本样本和所述地图搜索文本样本所要搜索的POI的属性数据样本;所述第二训练样本包括:所述地图搜索文本样本对应的搜索发起位置数据样本、和POI位置数据样本;
将所述第一训练样本输入所述文本特征分支,获得用于指示所述地图搜索文本样本的语义的特征向量、和用于指示所述POI的属性数据样本的属性特征的特征向量;将所述第二训练样本输入所述空间特征分支,获得用于指示搜索发起位置的特征向量和用于指示POI位置的特征向量;
根据获得的各特征向量,计算所述地图搜索文本样本和所述POI的相关度;
根据所述相关度,对所述排序模型进行训练。
11.根据权利要求10所述的方法,其中,
所述POI的属性数据样本包括:所述POI的名称数据样本和地址数据样本,所述用于指示所述POI的属性数据样本的属性特征的特征向量包括:用于指示所述POI的名称的特征向量和用于指示所述POI的地理位置的特征向量。
12.根据权利要求9所述的方法,其中,所述第二机器学习模型为纠错模型;
所述基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练,包括:
以地图搜索文本样本为输入,通过用于进行文本纠错的文本翻译模型获得对应的纠错文本和所述纠错文本对应的置信度;以及,以所述地图搜索文本样本为输入,通过训练完成的所述第一机器学习模型中的文本特征分支,获得对应的样本搜索文本特征;
将所述纠错文本输入所述文本特征分支,获得对应的纠错文本特征;
根据所述样本搜索文本特征和所述纠错文本特征的相似度,对所述纠错模型进行训练。
13.根据权利要求12所述的方法,其中,所述根据所述样本搜索文本特征和所述纠错文本特征的相似度,对所述纠错模型进行训练,包括:
获得所述样本搜索文本特征和所述纠错文本特征的相似度;
根据所述相似度和所述纠错文本对应的置信度,对所述纠错文本重新排序,根据重新排序结果对所述纠错模型进行训练。
14.根据权利要求9所述的方法,其中,所述第二机器学习模型为实体识别模型;
所述基于训练完成的所述第一机器学习模型的输出,对用于辅助地图搜索的第二机器学习模型进行训练,包括:
以所述地图搜索文本样本为输入,通过训练完成的所述第一机器学习模型中的文本特征分支,获得对应的词向量;
根据所述词向量进行实体识别,获得实体识别结果;
根据所述实体识别结果,对所述实体识别模型进行训练。
15.一种模型应用方法,包括:
获取地图搜索请求,根据所述地图搜索请求确定所请求的POI位置信息;
将所述地图搜索请求及所述POI位置信息输入预设的第一机器学习模型,其中,所述第一机器学习模型为用于进行地图搜索的模型;
获取所述第一机器学习模型输出的所述地图搜索请求的搜索文本特征及对应的地理空间特征;
基于所述搜索文本特征和所述地理空间特征,获得地图搜索结果。
16.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-14中任一项所述的模型训练方法;或者,该程序被处理器执行时实现如权利要求15所述的模型应用方法。
CN202210119301.0A 2022-02-08 2022-02-08 模型训练、应用方法及计算机存储介质 Pending CN114443983A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210119301.0A CN114443983A (zh) 2022-02-08 2022-02-08 模型训练、应用方法及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210119301.0A CN114443983A (zh) 2022-02-08 2022-02-08 模型训练、应用方法及计算机存储介质

Publications (1)

Publication Number Publication Date
CN114443983A true CN114443983A (zh) 2022-05-06

Family

ID=81370874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210119301.0A Pending CN114443983A (zh) 2022-02-08 2022-02-08 模型训练、应用方法及计算机存储介质

Country Status (1)

Country Link
CN (1) CN114443983A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540828A (zh) * 2024-01-10 2024-02-09 中国电子科技集团公司第十五研究所 作训科目推荐模型训练方法、装置、电子设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090265388A1 (en) * 2008-04-22 2009-10-22 Microsoft Corporation Discovering co-located queries in geographic search logs
CN111737383A (zh) * 2020-05-21 2020-10-02 百度在线网络技术(北京)有限公司 提取地理位置点空间关系的方法、训练提取模型的方法及装置
CN112381166A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 信息点识别方法、装置及电子设备
CN113642313A (zh) * 2021-09-02 2021-11-12 阿里巴巴达摩院(杭州)科技有限公司 地址文本的处理方法、装置、设备、存储介质及程序产品
CN113987333A (zh) * 2021-09-26 2022-01-28 北京三快在线科技有限公司 一种目的地区域的推荐方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090265388A1 (en) * 2008-04-22 2009-10-22 Microsoft Corporation Discovering co-located queries in geographic search logs
CN111737383A (zh) * 2020-05-21 2020-10-02 百度在线网络技术(北京)有限公司 提取地理位置点空间关系的方法、训练提取模型的方法及装置
CN112381166A (zh) * 2020-11-20 2021-02-19 北京百度网讯科技有限公司 信息点识别方法、装置及电子设备
CN113642313A (zh) * 2021-09-02 2021-11-12 阿里巴巴达摩院(杭州)科技有限公司 地址文本的处理方法、装置、设备、存储介质及程序产品
CN113987333A (zh) * 2021-09-26 2022-01-28 北京三快在线科技有限公司 一种目的地区域的推荐方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DAVIS LIANG等: "Embedding-based Zero-shot Retrieval through Query Generation", Retrieved from the Internet <URL:https://arxiv.org/abs/2009.10270> *
史名君: "非规范中文地址的智能匹配研究", 《中国优秀硕士学位论文全文数据库 基础科学辑》, 15 March 2021 (2021-03-15), pages 008 - 76 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117540828A (zh) * 2024-01-10 2024-02-09 中国电子科技集团公司第十五研究所 作训科目推荐模型训练方法、装置、电子设备和存储介质
CN117540828B (zh) * 2024-01-10 2024-06-04 中国电子科技集团公司第十五研究所 作训科目推荐模型训练方法、装置、电子设备和存储介质

Similar Documents

Publication Publication Date Title
US9014511B2 (en) Automatic discovery of popular landmarks
CN101350012B (zh) 一种地址匹配的方法和系统
CN112069276B (zh) 地址编码方法、装置、计算机设备及计算机可读存储介质
CN111898364B (zh) 神经网络关系抽取方法、计算机设备及可读存储介质
CN108304423A (zh) 一种信息识别方法及装置
CN110502599A (zh) 地图数据的查询方法、装置和计算机可读存储介质
CN110866093A (zh) 机器问答方法及装置
CN116414823A (zh) 一种基于分词模型的地址定位方法和装置
CN114443983A (zh) 模型训练、应用方法及计算机存储介质
CN110060472B (zh) 道路交通事件定位方法、系统、可读存储介质和设备
CN116188995A (zh) 一种遥感图像特征提取模型训练方法、检索方法及装置
CN108984640A (zh) 一种基于web数据挖掘的地理信息获取方法
Cheng et al. Quickly locating POIs in large datasets from descriptions based on improved address matching and compact qualitative representations
CN112579816B (zh) 遥感图像的检索方法、装置、电子设备及存储介质
CN113642313A (zh) 地址文本的处理方法、装置、设备、存储介质及程序产品
CN112632406B (zh) 查询方法、装置、电子设备及存储介质
CN116701734A (zh) 地址文本的处理方法、设备及计算机可读存储介质
CN117093686A (zh) 智能问答匹配方法、装置、终端及存储介质
CN111177585A (zh) 地图poi反馈方法及装置
Schockaert et al. Mining topological relations from the web
CN113074735B (zh) 一种地图数据结构的处理方法
CN115292962A (zh) 基于轨迹抽稀的路径相似度匹配方法、设备及存储介质
CN114003812A (zh) 地址匹配方法、系统、设备及存储介质
CN114491056A (zh) 数字警务场景下的改进poi搜索的方法和系统
Loai Ali et al. Towards rule-guided classification for volunteered geographic information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination