CN114510658A - 推荐上车点的确定方法、装置、服务器和终端设备 - Google Patents
推荐上车点的确定方法、装置、服务器和终端设备 Download PDFInfo
- Publication number
- CN114510658A CN114510658A CN202210124410.1A CN202210124410A CN114510658A CN 114510658 A CN114510658 A CN 114510658A CN 202210124410 A CN202210124410 A CN 202210124410A CN 114510658 A CN114510658 A CN 114510658A
- Authority
- CN
- China
- Prior art keywords
- candidate
- word
- points
- data
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000013598 vector Substances 0.000 claims abstract description 191
- 238000012360 testing method Methods 0.000 claims description 40
- 238000012545 processing Methods 0.000 claims description 36
- 238000012216 screening Methods 0.000 claims description 13
- 230000011218 segmentation Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 8
- 238000012163 sequencing technique Methods 0.000 claims description 6
- 238000004891 communication Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 12
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0639—Item locations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/40—Business processes related to the transportation industry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Molecular Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Development Economics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Navigation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书提供了推荐上车点的确定方法、装置、服务器和终端设备。基于该方法,服务器可以先获取多个候选上车点的位置名称的文本数据,以及相应的关联数据;并确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;再综合利用上述候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点推荐给用户。通过引入并利用候选上车点的位置名称的文本数据结合关联数据,能够综合更多维度的特征信息,准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐上车点的成功率,使用户获得较好的使用体验。
Description
技术领域
本说明书属于互联网技术领域,尤其涉及推荐上车点的确定方法、装置、服务器和终端设备。
背景技术
通常用户在利用打车软件进行打车操作时,平台服务器会搜索用户周边的若干个位置点作为推荐上车点推送给用户,以供用户选择。
但是,基于上述方法推送给用户的上车点往往不一定适合用户,推荐成功率相对较低。用户往往还需要另外重新输入满足自己需求的上车点,导致用户的使用体验相对较差。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书提供了一种推荐上车点的确定方法、装置、服务器和终端设备,能够综合更多维度的特征信息,准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐的成功率,使用户获得较好的使用体验。
本说明书实施例提供了一种推荐上车点的确定方法,应用于服务器,包括:获取多个候选上车点的位置名称的文本数据,以及关联数据;确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
本说明书实施例还提供了一种推荐上车点的确定方法,应用于终端设备,包括:向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;向用户展示所述推荐上车点。
本说明书实施例还提供了一种推荐上车点的确定装置,包括:获取模块,用于获取多个候选上车点的位置名称的文本数据,以及关联数据;第一确定模块,用于确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;第二确定模块,用于利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
本说明书实施例还提供了一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述推荐上车点的确定方法的相关步骤。
本说明书实施例还提供了一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述推荐上车点的确定方法的相关步骤。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被处理器执行时实现所述推荐上车点的确定方法的相关步骤。
基于本说明书提供的推荐上车点的确定方法、装置、服务器和终端设备,服务器可以先获取多个候选上车点的位置名称的文本数据,以及相应的关联数据;并确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;再综合利用上述候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点推荐给用户。通过引入并利用候选上车点的位置名称的文本数据,结合关联数据,能够综合更多维度的特征信息,准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐上车点的成功率,使用户获得较好的使用体验。
附图说明
为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是应用本说明书实施例提供的推荐上车点的确定方法的系统的结构组成的一个实施例的示意图;
图2是在一个场景示例中,应用本说明书实施例提供的推荐上车点的确定方法的一种实施例的示意图;
图3是本说明书的一个实施例提供的推荐上车点的确定方法的流程示意图;
图4是本说明书的一个实施例提供的推荐上车点的确定方法的流程示意图;
图5是本说明书的一个实施例提供的服务器的结构组成示意图;
图6是本说明书的一个实施例提供的推荐上车点的确定装置的结构组成示意图;
图7是本说明书的一个实施例提供的推荐上车点的确定装置的结构组成示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供了一种推荐上车点的确定方法,参阅图1所示,该方法具体可以应用于包含有服务器和终端设备的系统中。
在本实施例中,所述服务器具体可以包括一种应用于网络平台(例如,XX乘车服务平台)一侧,能够实现数据传输、数据处理等功能的后台服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
在本实施例中,所述终端设备具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的客户端。具体的,所述终端设备例如可以为台式电脑、平板电脑、笔记本电脑、智能手机等电子设备。或者,所述终端设备也可以为能够运行于上述电子设备中的软件应用。例如,可以是在智能手机上运行的XX乘车APP等。
在本实施例中,当用户有乘车需求时,可以在终端设备的XX乘车APP的打车界面中进行相应操作。
终端设备可以响应用户的上述操作,生成对应的乘车请求(例如,乘车订单等)。终端设备在生成乘车请求的同时,还可以采集用户当前的位置参数(例如,用户当前位置的经纬度数据等);进而可以将至少携带有用户的位置参数的乘车请求发送至服务器。
首先,在接收到乘车请求之后,服务器可以响应该乘车请求,先根据用户的位置参数,确定出用户的当前位置。再查询地图数据,找出与用户的当前位置距离较近(例如,距离小于等于200米等)的且允许乘车的多个位置点作为候选上车点。服务器可以根据地图数据,确定出上述多个候选上车点的位置名称的文本数据(例如,poi地址名称等)。
同时,服务器可以确定并利用各个候选上车点与用户当前位置之间的距离、乘车请求的接收时间或用户指示的乘车时间、当前的天气参数等,并结合用户的当前位置作为关联数据。
接着,服务器可以根据预设的处理规则,确定出多个候选上车点的位置名称的文本数据所对应的候选上车点的位置名称词向量。
具体的,服务器可以先对多个候选上车点的位置名称的文本数据分别进行分词处理,得到多个词组组合;其中,一个词组组合对应一个候选上车点的位置名称的文本数据,一个词组组合可以包括一个或多个词组。再利用预设的词向量数据库,通过确定并利用词组的词向量,得到多个候选上车点的位置名称词向量;其中,所述预设的词向量数据库存储有与多个预设词组对应的词向量;所述预设的词向量数据库为基于第一模型规则使用第一模型处理语料文本数据构建得到的。所述第一模型具体可以为skip-gram模型;所述第一模型规则具体可以包括以下所列举的一种或多种:预设的词频参数规则、预设的前后文参数规则、预设的词向量维度参数规则。
进一步,服务器可以将各个候选上车点的位置名称词向量与对应的关联数据分别进行拼接,得到多个数据组;其中,每一个数据组对应一个候选上车点。再调用预先训练好的处理模型处理多个数据组,预测出用户针对各个候选上车点的接受概率,作为处理结果。其中所述第二模型具体可以为基于LightGBM算法的模型。
进而,服务器可以根据处理结果,将多个候选上车点按照接受概率数值由大到小的顺序进行排列,得到排序后的多个候选上车点;并筛选出排序靠前的指定数量(例如,3)个候选上车点作为推荐上车点;并将上述推荐上车点发送给终端设备。
相应的,参阅图2所示,终端设备可以通过XX乘车APP的乘车订单设置界面展示出上述推荐上车点,以供用户选择。
用户可以根据具体情况,通过在上述乘车订单设置界面中进行点击操作,以从所展示的推荐上车点中选中最适合自己的推荐上车点,作为实际上车点。同时,用户还可以在目的地输入框内输入目的地的地址。
相应的,终端设备可以获取并利用上述实际上车点的位置参数和目标地的地址的位置参数,生成对应的乘车订单;并将该乘车订单发送给服务器。
服务器再将上述乘车订单分发给位于用户的当前位置附近的司机,以等待司机接单。
接受该乘车订单的司机可以根据乘车订单中上车点的位置参数,前往对应的上车点,以等待用户上车。
通过上述实施例,充分考虑了候选上车点的位置名称对用户选择上车点时所产生的影响,通过引入并利用候选上车点的位置名称的文本数据,结合其他关联数据,能够综合更多维度的特征信息,更加准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐的成功率,使用户获得较好的使用体验。
参阅图3所示,本说明书实施例提供了一种推荐上车点的确定方法。其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。
S301:获取多个候选上车点的位置名称的文本数据,以及关联数据。
S302:确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量。
S303:利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
在一些实施例中,上述候选上车点具体可以理解为在用户的当前位置的邻近范围区域内且允许用户上车的位置点。
在一些实施例中,上述候选上车点的位置名称的文本数据具体可以包括使用中文或者其他非字母语言描述的位置名称文本,例如“莘庄中心西门”、“东方医院民族街西站”等。当然,具体实施时,根据具体情况,上述候选上车点的位置名称的文本数据还可以包括使用其他语言描述的位置名称文本。
需要说明的是,基于现有的推荐上车点的确定方法往往没有考虑到候选上车点的位置名称的文本数据对用户选择上车点时所产生的影响。实际上,候选上车点的位置名称的文本数据是用户在选择上车点时最先接收到的与候选上车点相关信息之一;并且,区别于其他信息候选上车点的位置名称的文本数据还是一种较为直观的信息,会对用户的最终选择产生较大影响。例如,用户基于某些偏好习惯,可能会倾向选择例如“某某公交站”、“某某路口”等作为实际的上车点。现有方法由于忽略了候选上车点的位置名称的文本数据对用户选择上车点时所产生的影响,使得在预测用户针对候选上车点的接受概率时,所考虑的维度特征不够全面、准确,进而导致推荐用户的上车点的推荐成功率不高、影响用户的使用体验。
在一些实施例中,上述关联数据具体可以理解为除候选上车点的位置名称的文本数据以外其他可能影响用户选择上车点的信息中的一种或多种。
在一些实施例中,上述关联数据具体可以包括以下至少之一:用户的当前位置、用户的当前位置与候选上车点之间的距离、乘车时间等等。
当然,需要说明的是,上述所列举的关联数据只是一种示意性说明。具体实施时,根据具体情况和处理需求,上述关联数据还可以包括其他类型的信息数据,例如,接收到用户所发起的乘车请求的接收时间;又例如,当前的天气参数;再例如,用户的年龄、性别等等。
在一些实施例中,上述获取多个候选上车点的位置名称的文本数据,具体实施时,可以包括以下内容:
S1:确定用户的当前位置;
S2:查询地图数据,筛选出与用户的当前位置邻近的多个位置点,作为候选上车点;
S3:根据地图数据,获取多个候选上车点的位置名称的文本数据。
在一些实施例中,当用户有乘车需求时,可以通过终端设备生成并向服务器发送相应的乘车请求。其中,所述乘车请求至少携带有用户的位置参数。
具体的,例如,用户可以通过在安装于终端设备的XX乘车app的主界面中点击“叫车”图标,以发起触发操作。相应的,终端设备可以接收并响应上述触发操作,生成对应的乘车请求。同时,终端设备还可以获取用户当前所在位置的经纬度数据,作为用户的位置参数;再将携带有用户的位置参数的乘车请求发送给服务器。
需要说明的是,在本说明书中出现的获取与用户相关的数据的行为均为在用户知晓且同意的情况下,采用合规手段实现;并且,在获取与用户相关的数据的过程中,还会采用相应的加密手段,对用户的数据隐私进行妥善保护。
在一些实施例中,服务器可以先从乘车请求中提取出用户的位置参数;再根据用户的位置参数,确定出该用户的当前位置。
在一些实施例中,具体实施时,首先,服务器可以根据用户的当前位置,从地图数据库中查询到与用户的当前位置相匹配的地图数据,例如,用户当前所在街区的区域地图等。
接着,服务器可以按照以下方式查询该地图数据:在该地图数据中以当前位置作为范围中心,划出对应的邻近范围,例如,以用户的当前位置为圆心,200米为半径的圆形范围;再对该邻近范围内地图数据中具有位置名称的位置点进行检索,筛选出允许上车的位置点,作为候选上车点。
进一步,服务器可以根据地图数据,查询得到上述候选上车点的位置名称的文本数据。
在一些实施例中,服务器可以先将候选上车点的位置名称的文本数据先转换成对应的词向量,进而可以通过词向量的形式来有效地利用候选上车点的位置名称的文本数据中所包含的能够对用户选择上车点产生影响的信息,以便准确地预测出用户针对所待推荐的候选上车点的接受概率。
在一些实施例中,上述确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量,具体实施时,可以包括:按照以下方式,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量:
S1:对当前候选上车点的位置名称的文本数据进行分词处理,得到多个词组;
S2:利用预设的词向量数据库,确定出多个词组所分别对应的多个词组的词向量;其中,所述预设的词向量数据库存储有与多个预设词组对应的词向量;所述预设的词向量数据库为基于第一模型规则使用第一模型处理语料文本数据构建得到的;
S3:根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量。
按照上述方式,根据预设的处理规则,处理其他候选上车点的位置名称的文本数据,可以得到与其他候选上车点的位置名称的文本数据对应的其他候选上车点的位置名称词向量,从而可以有效地将多个候选上车点的位置名称的文本数据准确地转换为对应的多个候选上车点的位置名称词向量。
在一些实施例中,具体实施时,服务器可以利用jieba库对当前候选上车点的位置名称的文本数据进行具体的分词处理,以得到与当前候选上车点的位置名称对应的多个词组。
其中,上述jieba库具体可以理解为一个中文自然语言处理分词库。
具体实施时,可以利用jieba库对当前候选上车点的位置名称的文本数据进行具体的分词处理时,可以基于jieba库生成针对前候选上车点的位置名称的文本数据的多个切分方案,并计算各个切分方案的评分值;筛选出评分值最高的切分方案所对应的切分结果,得到对应的多个词组。
具体的,例如,可以利用jieba库对当前候选上车点的位置名称的文本数据“东方医院民族街西站”进行分词处理,得到如下所示的多个词组:东方、医院、民族街、西站。
在一些实施例中,上述预设的词向量数据库具体可以为预先构建好的,与位置名称相关的,存储有与多个预设词组对应的词向量的数据库。
进一步,上述预设的词向量数据库还可以存储有预设词组与词向量的对应关系,以及默认词组的词向量。
在一些实施例中,上述预设的词向量数据库具体可以是预先基于第一模型规则,通过使用第一模型处理大量的语料文本数据所构建得到的。
在一些实施例中,所述第一模型具体可以包括skip-gram模型;相应的,所述第一模型规则具体可以包括以下至少之一:预设的词频参数规则、预设的前后文参数规则、预设的词向量维度参数规则。
其中,上述skip-gram模型具体可以理解为Word2Vec模型中的一种,是基于前馈神经网络模型改进得到的。上述skip-gram模型可以理解为一个简化的神经网络,可以通过输入上下文的两个词去预测当前词,即把上下文的词作为输入传入模型,再经过神经网络的隐含层处理,最终输出到输出层,然后再进行归一化得到词的分布概率。
其中,所述第一模型规则具体可以理解为控制第一模型学习和生成词向量的规则。所述词频参数具体可以记为:min_count;所述前后文参数具体可以记为:window;所述词向量维度参数具体可以记为:vector_size。
在一些实施例中,构建预设的词向量数据库所使用的语料文本数据具体可以包括与位置名称相关的语料文本。
在一些实施例中,具体实施时,可以基于第一模型规则,通过使用第一模型处理大量的语料文本数据学习和训练与位置名称相关的词向量,来构建预设的词向量数据库。
具体实施,基于预设的词频参数规则,可以将词频参数设置为1,例如,min_count=1。即,控制第一模型对语料文本中词频大于等于1的词向量进行学习训练。
这是考虑到通常与位置名称或地址名称相关的语料文本中词组的词频往往较低,如果像常规方法那样将词频参数设置为2或者更大的值,容易导致第一模型学习相关词向量不全面。基于上述预设的词频参数规则,可以控制第一模型对语料文本中的全部词向量都进行较为全面的学习和训练。
具体实施时,基于预设的前后文参数规则,可以将前后文参数设置为m,例如,window=m。即,控制第一模型从上下文中取前后各m个词组进行学习训练,且m的取值根据该词组所在的上下文所包含词组的实际数量确定。
例如,对于如下所示的位置名称的文本数据“莘庄中心西站”中的词组“西站”,分词处理后就可以确定该词组所在的上下文所包含词组的实际数量为3(即,分别为:莘庄、中心、西站),这时可以自动将window设置为3。
这样可以基于预设的前后文参数规则自动地设置前后文参数的具体值,区别于常规的设置固定的前后文参数,能够更加智能、准确地控制第一模型进行词向量的学习和训练。
具体实施时,预设的词向量维度参数规则,可以将词向量维度参数设置与与前后文参数和词频参数关联的数据值,例如,vector_size=min_count*window*10。即,根据上下文中的词组数window,以及词频数min_count来设定实际的词向量维度参数,这样可以控制第一模型自动确定出关于词向量合适的词向量维度参数。
在一些实施例中,上述利用预设的词向量数据库,确定出多个词组所分别对应的多个词组的词向量,具体实施实施,可以包括:按照以下方式,确定出多个词组中的当前词组的词向量:查询预设的词向量数据库,确定出与当前词组相匹配的预设词组作为匹配词组;并将该匹配词组的词向量确定为当前词组的词向量。
具体的,可以根据当前词组,查询预设的词向量数据库中是否存在与当前词组的差异值小于等于预设的差异阈值的预设词组,作为与当前词组相匹配的匹配词组;在查询到上述匹配词组的情况下,可以根据预设词组与词向量的对应关系,获取并将该匹配词组的词向量确定为当前词组的词向量。例如,可以按照上述方式,通过查询预设的词向量数据库,确定出“莘庄中心西站”中词组“西站”的词向量为:[0.7655,-0.574,1.9122,0.1493]。
在一些实施例中,在查询预设的词向量数据库之后,所述方法具体实施时,还可以包括:在预设的词向量数据库中未找到与当前词组相匹配的预设词组的情况下,使用预设的词向量数据库中的默认词组的词向量作为当前词组的词向量。
具体的,在预设的词向量数据库中没有找到与当前词组的差异值小于等于预设的差异阈值的预设词组的情况下,可以直接使用预设的词向量数据中存储的默认词组的词向量作为当前词组的词向量。其中,上述默认词组具体可以为基于大量与位置名称相关的语料文本统计出的不具有明确语义的词组。当然,还可以从预设的词向量数据库中找到与当前词组的差异值最小的预设词组的词向量,作为当前词组的词向量。
在一些实施例中,具体实施时,可以将与当前候选上车点的位置名称对应的多个词向量进行组合,以得到当前候选上车点的位置名称词向量。例如,将多个词组的词向量相加得到和作为当前候选上车点的位置名称词向量。又例如,对多个词组的词向量进行加和求平均,将得到的平均值作为候选上车点的位置名称词向量。
在一些实施例中,具体实施时,上述根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量,可以包括以下内容:根据当前候选上车点的位置名称的文本数据中词组的排序,排列多个词组的词向量,得到排序后的多个词组的词向量;从排序后的多个词组的词向量中筛选出排序靠后的预设数量个词组的词向量进行组合,得到当前候选上车点的位置名称词向量。例如,可以将排序靠后的预设数量个词组的词向量相加,得到向量和作为当前候选上车点的位置名称词向量。
其中,上述预设数量的取值可以为2。当然,具体实施时,根据具体情况和精度要求,设置其他取值作为预设数量。
在本实施例中,进一步考虑到用户在选择上车点时,往往更注重和关心候选上车点的位置名称的文本数据中的后几个词组。因此,为了减少数据处理量,提高整体的处理效率,可以通过上述方式从排序后的多个词组的词向量中筛选出排序靠后的预设数量个词组的词向量进行拼接得到当前候选上车点的位置名称词向量。
按照上述确定当前候选上车点的位置名称词向量的方式,可以依次其他候选上车点的位置名称的词向量,从而可以得到多个候选上车点的位置名称词向量。
在一些实施例中,上述利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点,具体实施时,可以包括以下内容:
S1:将多个候选上车点的位置名称词向量和对应的关联数据分别进行组合,得到多个数据组;其中,一个数据组对应一个候选上车点;
S2:利用第二模型处理多个数据组,得到对应的处理结果;
S3:根据所述处理结果,从多个候选上车点中筛选出符合要求的推荐上车点。
通过上述实施例,可以利用第二模型同时处理候选上车点的位置名称词向量和对应的关联数据,来有效地综合使用多维度的特征信息,较为全面、准确地确定出用户大概率会接受的上车点作为符合要求的推荐上车点。
在一些实施例中,上述第二模型具体可以为基于LightGBM算法(或LightGBM/LR融合算法)的概率预测模型。
在一些实施例中,具体进行拼接时,可以将候选上车点的位置名称词向量,以及与该候选上车点对应的关联数据,例如,用户当前位置与候选上车点之间的距离等进行拼接得到针对该候选上车点的数据组。
进一步,还可以将用户的当前位置、接收乘车请求的接收时间、用户指示的乘车时间、天气参数等其他关联数据融合再该数据组中,得到针对该候选上车点的,特征信息相对更加丰富、全面的数据组。
在一些实施例中,具体实施时,可以将上述数据组作为模型输入,输入至第二模型中;并运行第二模型处理该数据组,以输出用户针对该候选上车点的接受概率,作为处理结果。
在一些实施例中,所述第二模型具体可以按照以下方式训练得到:
S1:获取测试用户针对测试上车点的操作记录,以及测试上车点的位置名称的文本数据、关联数据;
S2:确定出测试上车点的位置名称的文本数据所对应的测试上车点的位置名称词向量;
S3:将测试上车点的位置名称词向量与对应的关联数据进行组合,得到样本数据;
S4:根据测试用户针对测试上车点的操作记录,对样本数据进行标注,得到标注后的样本数据;
S5:利用所述标注后的样本数据进行模型训练,以得到所述第二模型。
在一些实施例中,上述操作记录具体可以包括测试用户针对所推荐的测试上车点的点击操作记录。基于上述操作记录,可以根据测试用户针对所推荐的测试上车点的具体操作,准确地确定出测试用户是否接受了所推荐的测试上车点。
在一些实施例中,具体实施时,可以根据预设的处理规则,利用预设的词向量数据通过处理测试上车点的位置名称的文本数据,以得到对应的测试上车点的位置名称词向量。
在一些实施例中,可以将测试上车点的位置名称词向量,与对应的关联数据进行组合,得到一个数据组,作为与该测试上车点对应的样本数据。
在一些实施例中,具体进行标注时,可以根据操作记录,确定测试用户是否接受了所推荐的测试上车点,在确定用户接受了所推荐的测试上车点的情况下,可以将与该测试上车点对应的样数据标记为正样本;相反,在确定用没有接受所推荐的测试上车点的情况下,可以将与该测试上车点对应的样本数据标记为负样本。
通过上述实施例,可以对样本数据进行较为精细的标注,得到精度较高、效果较好的标注后的样本数据。
在一些实施例中,具体实施时,可以构建基于LightGBM算法的初始模型作为初始的第二模型;再利用上述标注后的样本数据,通过对初始的第二模型不断进行学习训练,以得到精度符合要求的第二模型。
在一些实施例中,具体实施时,可以根据处理结果,按照概率值由大到小的顺序排列用户针对不同候选上车点的接受概率;再筛选出排序靠前的指定个数(例如,3个)概率值所对应的候选上车点,作为适合用户的符合要求的推荐上车点。也可以根据处理结果,筛选出概率值大于等于预设的概率阈值的候选上车点,作为推荐上车点。
在一些实施例中,服务器在确定出推荐上车点之后,可以将上述推荐上车点发送给终端设备。相应的,终端设备接收并向用户展示上述推荐上车点,以供用户选择。
用户可以根据具体情况,从终端设备所展示的推荐上车点中找到满足自己需求的推荐上车点进行选择操作,以将该推荐上车点确定为实际的上车点。
如果用户觉得终端设备所展示的推荐上车点都不符合自己需求,可以自行另外输入或设置实际的上车点。这时终端设备可以上述操作记录,以及所推荐的推荐上车点等,构建对应的上车点推荐记录,并将该上车点推荐记录标记为推荐失败。接着,终端设备可以将推荐失败的上车点推荐记录反馈给服务器。
相应的,服务器可以每隔预设的时间段(例如,1周等)综合该预设的时间段内所收集到的推荐失败的上车点推荐记录,对第二模型进行针对性的调整和更新,以提高第二模型的准确度,以便后续能够更加精准地确定出适合于用户的推荐上车点。
由上可见,基于本说明书实施例提供的推荐上车点的确定方法,服务器可以先获取多个候选上车点的位置名称的文本数据,以及相应的关联数据;并确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;再综合利用上述候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点推荐给用户。通过引入并利用候选上车点的位置名称的文本数据,结合关联数据,能够综合更多维度的特征信息,准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐的成功率,使用户获得较好的使用体验。
参阅图4所示,本说明书实施例还提供了推荐上车点的确定方法。该方法具体应用于终端设备一侧。具体实施时,该方法可以包括以下内容:
S401:向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;
S402:接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;
S403:向用户展示所述推荐上车点。
通过上述实施例,用户在有乘车需求时,可以通过上述终端设备与服务器进行交互,得到针对性较强、具有较高参考价值、适合用户的推荐上车点,使得用户不需要自己再另外确定和输入上车点,简化了用户操作,提高了用户的使用体验。
本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取多个候选上车点的位置名称的文本数据,以及关联数据;确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
为了能够更加准确地完成上述指令,参阅图5所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口501、处理器502以及存储器503,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
其中,所述网络通信端口501,具体可以用于获取多个候选上车点的位置名称的文本数据,以及关联数据。
所述处理器502,具体可以用于确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
所述存储器503,具体可以用于存储相应的指令程序。
在本实施例中,所述网络通信端口501可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的端口,也可以是负责进行FTP数据通信的端口,还可以是负责进行邮件数据通信的端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
在本实施例中,所述处理器502可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
在本实施例中,所述存储器503可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
本说明书实施例还提供一种终端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;向用户展示所述推荐上车点。
本说明书实施例还提供了一种基于上述推荐上车点的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取多个候选上车点的位置名称的文本数据,以及关联数据;确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
本说明书实施例还提供了一种基于上述推荐上车点的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;向用户展示所述推荐上车点。
在本实施例中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
参阅图6所示,在软件层面上,本说明书实施例还提供了一种推荐上车点的确定装置,该装置具体可以包括以下的结构模块:
获取模块601,具体可以用于获取多个候选上车点的位置名称的文本数据,以及关联数据;
第一确定模块602,具体可以用于确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;
第二确定模块603,具体可以用于利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
在一些实施例中,所述获取模块601具体实施时,可以按照以下方式获取多个候选上车点的位置名称的文本数据:确定用户的当前位置;查询地图数据,筛选出与用户的当前位置邻近的多个位置点,作为候选上车点;根据地图数据,获取多个候选上车点的位置名称的文本数据。
在一些实施例中,所述第一确定模块602具体实施时,可以按照以下方式确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量:按照以下方式,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量:对当前候选上车点的位置名称的文本数据进行分词处理,得到多个词组;利用预设的词向量数据库,确定出多个词组所分别对应的多个词组的词向量;其中,所述预设的词向量数据库存储有与多个预设词组对应的词向量;所述预设的词向量数据库为基于第一模型规则使用第一模型处理语料文本数据构建得到的;根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量。
在一些实施例中,所述第一确定模块602具体实施时,可以按照以下方式,确定出多个词组中的当前词组的词向量:查询预设的词向量数据库,确定出与当前词组相匹配的预设词组作为匹配词组;并将该匹配词组的词向量确定为当前词组的词向量。
在一些实施例中,所述第一确定模块602具体实施时,在查询预设的词向量数据库之后,还可以在预设的词向量数据库中未找到与当前词组相匹配的预设词组的情况下,使用预设的词向量数据库中的默认词组的词向量作为当前词组的词向量。
在一些实施例中,所述第一确定模块602具体实施时,可以按照以下方式,根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量:根据当前候选上车点的位置名称的文本数据中词组的排序,排列多个词组的词向量,得到排序后的多个词组的词向量;从排序后的多个词组的词向量中筛选出排序靠后的预设数量个词组的词向量进行组合,得到当前候选上车点的位置名称词向量。
在一些实施例中,所述第一模型具体可以包括skip-gram模型;相应的,所述第一模型规则具体可以包括以下至少之一:预设的词频参数规则、预设的前后文参数规则、预设的词向量维度参数规则等。
在一些实施例中,所述关联数据具体可以包括以下至少之一:用户的当前位置、用户的当前位置与候选上车点之间的距离、乘车时间等。
在一些实施例中,所述第二确定模块603具体实施时,可以按照以下方式利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点:将多个候选上车点的位置名称词向量和对应的关联数据分别进行组合,得到多个数据组;其中,一个数据组对应一个候选上车点;利用第二模型处理多个数据组,得到对应的处理结果;根据所述处理结果,从多个候选上车点中筛选出符合要求的推荐上车点。
在一些实施例中,所述装置具体还可以包括建模模块,具体可以用于获取测试用户针对测试上车点的操作记录,以及测试上车点的位置名称的文本数据、关联数据;确定出测试上车点的位置名称的文本数据所对应的测试上车点的位置名称词向量;将测试上车点的位置名称词向量与对应的关联数据进行组合,得到样本数据;根据测试用户针对测试上车点的操作记录,对样本数据进行标注,得到标注后的样本数据;利用所述标注后的样本数据进行模型训练,以得到所述第二模型。
参阅图7所示,本说明书实施例还提供了另一种推荐上车点的确定装置,具体可以包括以下结构模块:
发送模块701,具体可以用于向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;
接收模块702,具体可以用于接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;
展示模块703,具体可以用于向用户展示所述推荐上车点。
需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
基于上述推荐上车点的确定装置,通过先获取多个候选上车点的位置名称的文本数据,以及相应的关联数据;并确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;再综合利用上述候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点推荐给用户。通过引入并利用候选上车点的位置名称的文本数据,结合关联数据,能够综合更多维度的特征信息,准确地预测出适合于用户的上车点推荐给用户,从而可以提高推荐的成功率,使用户获得较好的使用体验。
虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (15)
1.一种推荐上车点的确定方法,其特征在于,应用于服务器,包括:
获取多个候选上车点的位置名称的文本数据,以及关联数据;
确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;
利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
2.根据权利要求1所述的方法,其特征在于,获取多个候选上车点的位置名称的文本数据,包括:
确定用户的当前位置;
查询地图数据,筛选出与用户的当前位置邻近的多个位置点,作为候选上车点;
根据地图数据,获取多个候选上车点的位置名称的文本数据。
3.根据权利要求1所述的方法,其特征在于,确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量,包括:
按照以下方式,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量:
对当前候选上车点的位置名称的文本数据进行分词处理,得到多个词组;
利用预设的词向量数据库,确定出多个词组所分别对应的多个词组的词向量;其中,所述预设的词向量数据库存储有与多个预设词组对应的词向量;所述预设的词向量数据库为基于第一模型规则使用第一模型处理语料文本数据构建得到的;
根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量。
4.根据权利要求3所述的方法,其特征在于,利用预设的词向量数据库,确定出多个词组所分别对应的多个词组的词向量,包括:
按照以下方式,确定出多个词组中的当前词组的词向量:
查询预设的词向量数据库,确定出与当前词组相匹配的预设词组作为匹配词组;并将该匹配词组的词向量确定为当前词组的词向量。
5.根据权利要求4所述的方法,其特征在于,在查询预设的词向量数据库之后,所述方法还包括:
在预设的词向量数据库中未找到与当前词组相匹配的预设词组的情况下,使用预设的词向量数据库中的默认词组的词向量作为当前词组的词向量。
6.根据权利要求3所述的方法,其特征在于,根据所述多个词组的词向量,确定出当前候选上车点的位置名称的文本数据所对应的当前候选上车点的位置名称词向量,包括:
根据当前候选上车点的位置名称的文本数据中词组的排序,排列多个词组的词向量,得到排序后的多个词组的词向量;
从排序后的多个词组的词向量中筛选出排序靠后的预设数量个词组的词向量进行组合,得到当前候选上车点的位置名称词向量。
7.根据权利要求3所述的方法,其特征在于,所述第一模型包括skip-gram模型;
相应的,所述第一模型规则包括以下至少之一:预设的词频参数规则、预设的前后文参数规则、预设的词向量维度参数规则。
8.根据权利要求1所述的方法,其特征在于,所述关联数据包括以下至少之一:用户的当前位置、用户的当前位置与候选上车点之间的距离、乘车时间。
9.根据权利要求8所述的方法,其特征在于,利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点,包括:
将多个候选上车点的位置名称词向量和对应的关联数据分别进行组合,得到多个数据组;其中,一个数据组对应一个候选上车点;
利用第二模型处理多个数据组,得到对应的处理结果;
根据所述处理结果,从多个候选上车点中筛选出符合要求的推荐上车点。
10.根据权利要求9所述的方法,其特征在于,所述第二模型按照以下方式训练得到:
获取测试用户针对测试上车点的操作记录,以及测试上车点的位置名称的文本数据、关联数据;
确定出测试上车点的位置名称的文本数据所对应的测试上车点的位置名称词向量;
将测试上车点的位置名称词向量与对应的关联数据进行组合,得到样本数据;
根据测试用户针对测试上车点的操作记录,对样本数据进行标注,得到标注后的样本数据;
利用所述标注后的样本数据进行模型训练,以得到所述第二模型。
11.一种推荐上车点的确定方法,其特征在于,应用于终端设备,包括:
向服务器发送乘车请求;其中,所述乘车请求至少携带有用户的位置参数;
接收服务器反馈的推荐上车点;其中,所述推荐上车点为服务器响应所述乘车请求,获取并利用候选上车点的位置名称的文本数据和相应的关联数据所确定的;
向用户展示所述推荐上车点。
12.一种推荐上车点的确定装置,其特征在于,包括:
获取模块,用于获取多个候选上车点的位置名称的文本数据,以及关联数据;
第一确定模块,用于确定出多个候选上车点的位置名称的文本数据所对应的多个候选上车点的位置名称词向量;
第二确定模块,用于利用候选上车点的位置名称词向量和对应的关联数据,从多个候选上车点中确定出符合要求的推荐上车点。
13.一种服务器,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至10中任一项所述方法的步骤。
14.一种终端设备,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求11所述方法的步骤。
15.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被处理器执行时实现权利要求1至10或11中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210124410.1A CN114510658A (zh) | 2022-02-10 | 2022-02-10 | 推荐上车点的确定方法、装置、服务器和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210124410.1A CN114510658A (zh) | 2022-02-10 | 2022-02-10 | 推荐上车点的确定方法、装置、服务器和终端设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114510658A true CN114510658A (zh) | 2022-05-17 |
Family
ID=81552226
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210124410.1A Pending CN114510658A (zh) | 2022-02-10 | 2022-02-10 | 推荐上车点的确定方法、装置、服务器和终端设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114510658A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145294A (zh) * | 2018-08-07 | 2019-01-04 | 北京三快在线科技有限公司 | 文本实体识别方法及装置、电子设备、存储介质 |
CN110782308A (zh) * | 2019-09-20 | 2020-02-11 | 北京三快在线科技有限公司 | 推荐套餐的推送方法、装置、电子设备及可读存储介质 |
CN111931081A (zh) * | 2020-08-10 | 2020-11-13 | 北京嘀嘀无限科技发展有限公司 | 一种上车点推荐方法及系统 |
CN112926875A (zh) * | 2021-03-23 | 2021-06-08 | 广州宸祺出行科技有限公司 | 一种缓解高峰期拥堵的智能调度方法及系统 |
-
2022
- 2022-02-10 CN CN202210124410.1A patent/CN114510658A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109145294A (zh) * | 2018-08-07 | 2019-01-04 | 北京三快在线科技有限公司 | 文本实体识别方法及装置、电子设备、存储介质 |
CN110782308A (zh) * | 2019-09-20 | 2020-02-11 | 北京三快在线科技有限公司 | 推荐套餐的推送方法、装置、电子设备及可读存储介质 |
CN111931081A (zh) * | 2020-08-10 | 2020-11-13 | 北京嘀嘀无限科技发展有限公司 | 一种上车点推荐方法及系统 |
CN112926875A (zh) * | 2021-03-23 | 2021-06-08 | 广州宸祺出行科技有限公司 | 一种缓解高峰期拥堵的智能调度方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110741367B (zh) | 用于实时交互式推荐的方法和装置 | |
CN110619076B (zh) | 一种搜索词推荐方法、装置、计算机及存储介质 | |
CN109634698B (zh) | 菜单显示方法、装置、计算机设备及存储介质 | |
JP5859611B2 (ja) | 意味的地域に基づいて検索語を推薦する方法およびシステム | |
CN111597445B (zh) | 信息推荐方法及装置 | |
US20170061482A1 (en) | Focal-point based recommendation method and system | |
CN112241327B (zh) | 分享信息处理方法、装置、存储介质与电子设备 | |
JP4950508B2 (ja) | 施設情報管理システム、施設情報管理装置、施設情報管理方法および施設情報管理プログラム | |
CN110126843A (zh) | 行车服务推荐方法、装置、设备和介质 | |
CN111291071A (zh) | 数据处理方法、装置及电子设备 | |
EP3961426A2 (en) | Method and apparatus for recommending document, electronic device and medium | |
CN110968801A (zh) | 地产产品搜索方法、存储介质及电子设备 | |
CN112989188A (zh) | 推荐订单的确定方法、装置和服务器 | |
US20220164524A1 (en) | Modifying a document content section of a document object of a graphical user interface (gui) | |
CN115017400A (zh) | 一种应用app推荐方法及电子设备 | |
CN105229638A (zh) | 作为对内容的收集的贡献者的自动化的库管理员 | |
JP2020080145A (ja) | 情報提供システム、情報提供装置及びコンピュータプログラム | |
CN114510658A (zh) | 推荐上车点的确定方法、装置、服务器和终端设备 | |
CN105843887B (zh) | 信息处理方法及电子设备 | |
JP2010113432A (ja) | 変換候補表示装置、および変換候補表示装置の制御方法 | |
CN114779986A (zh) | 用于导航数字地图的页面的系统和方法 | |
CN103473290A (zh) | Poi的属性数据的处理方法及装置 | |
CN113378082A (zh) | 一种信息推荐方法、装置、电子设备以及存储介质 | |
CN109325198B (zh) | 一种资源展示方法、装置和存储介质 | |
CN113868532B (zh) | 一种地点推荐方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |