CN108446280A - 数据更新方法及装置 - Google Patents
数据更新方法及装置 Download PDFInfo
- Publication number
- CN108446280A CN108446280A CN201710065798.1A CN201710065798A CN108446280A CN 108446280 A CN108446280 A CN 108446280A CN 201710065798 A CN201710065798 A CN 201710065798A CN 108446280 A CN108446280 A CN 108446280A
- Authority
- CN
- China
- Prior art keywords
- poi
- transit point
- target text
- target
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
- G06F16/2379—Updates performed during online database operations; commit processing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3679—Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/23—Updating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/254—Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/687—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/01—Detecting movement of traffic to be counted or controlled
- G08G1/0104—Measuring and analyzing of parameters relative to traffic conditions
- G08G1/0108—Measuring and analyzing of parameters relative to traffic conditions based on the source of data
- G08G1/0112—Measuring and analyzing of parameters relative to traffic conditions based on the source of data from the vehicle, e.g. floating car data [FCD]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Remote Sensing (AREA)
- Economics (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Radar, Positioning & Navigation (AREA)
- Health & Medical Sciences (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Computing Systems (AREA)
- Automation & Control Theory (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Navigation (AREA)
- Traffic Control Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种数据更新方法及装置,涉及互联网技术领域,该方法包括:获得用于描述目标行程的语音数据;根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;获得所述途经点的位置信息;根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。由此可见,本申请实施例可以使用出行相关的语音数据作为POI数据更新的数据源,而无需专业人员前往实地采集,节省了人力和物力,从而降低POI数据更新的成本,提高了更新的效率。
Description
技术领域
本申请实施例涉及互联网技术领域,特别涉及一种数据更新方法及装置。
背景技术
随着卫星定位技术、无线通信技术的发展及各类智能终端设备的普及,LBS(Location Based Service,基于位置服务)在电子地图、O2O(Online To Offline,线上到线下)及社交服务等领域得到了广泛应用。POI(Point Of Interest,兴趣点)作为位置信息的重要载体,目前被广泛应用于LBS业务中,由于POI数据的实时性、数据来源的可靠性和广泛性直接影响着LBS业务的发展,因此POI数据的更新已成为一项关键的工作。
现有技术中,主要通过以下方式实现POI数据的更新:专业人员定期前往实地考察,如果考察发现实地的情况相较之前发生了变化,则进行数据采集,利用采集到的数据更新POI数据,但是,该方式比较费时费力,导致效率低下。
发明内容
为了解决上述问题,本申请实施例提供了一种数据更新方法及装置。
具体地,本申请实施例是通过如下技术方案实现的:
根据本申请实施例的第一方面,提供一种数据更新方法,所述方法包括:
获得用于描述目标行程的语音数据;
根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
获得所述途经点的位置信息;
根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本,包括:
将所述语音数据识别为文本;
从所述文本中提取用于描述所述目标行程的途经点的名称的目标文本。
本申请实施例中,所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本,包括:
从所述语音数据中,获得用于描述所述目标行程的途经点的目标语音数据;
将所述目标语音数据识别为目标文本。
本申请实施例中,所述获得所述途经点的位置信息,包括:
在完成所述目标行程的过程中,分别获取所述途经点的位置信息。
本申请实施例中,所述将所述目标文本补充到所述预设的POI数据库中,包括:
根据预设的文本相似度计算规则,计算所述目标文本与所述途经点的POI名称的相似度;
在计算得到的相似度达到预设第一阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,在所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本之后,还包括:
将表示所述途经点的名称被标记为所述目标文本的次数的第一次数加1,将表示所述途经点的名称被标记过的总次数的第二次数加1;
所述方法还包括:
在计算得到的相似度低于所述预设第一阈值的情况下,获得所述途经点的所述第一次数和所述途经点的所述第二次数;
计算所述第一次数与所述第二次数的比值;
在所述比值达到预设第二阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述方法还包括:
在所述相似度低于所述预设第一阈值或所述比值低于所述预设第二阈值的情况下,发送用于请求人工检查的指令;
接收人工检查的结果;
在所述结果为确认所述目标文本属于所述途经点的别名的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述将所述目标文本补充到所述预设的POI数据库中,包括:
将所述目标文本作为所述途经点的POI名称的补充。
本申请实施例中,所述预设的POI数据库中记录有POI信息,每条POI信息中包括POI的属性信息,所述属性信息包括:位置信息及POI名称。
根据本申请实施例的第二方面,提供一种数据更新装置,所述装置包括:
语音数据获得模块,用于获得用于描述目标行程的语音数据;
目标文本获得模块,用于根据所述语音数据获得模块获得的语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
位置信息获得模块,用于获得所述途经点的位置信息;
POI名称查找模块,用于根据所述位置信息获得模块获得的位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
更新模块,用于在所述目标文本与所述POI名称查找模块查找到的途经点的POI名称不相同的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述目标文本获得模块,包括:
第一语音识别子模块,用于将所述语音数据获得模块获得的语音数据识别为文本;
目标文本获得子模块,用于从所述第一语音识别子模块识别出的文本中提取用于描述所述目标行程的途经点的名称的目标文本。
本申请实施例中,所述目标文本获得模块,包括:
目标语音数据获得子模块,用于从所述语音数据获得模块获得的语音数据中,获得用于描述所述目标行程的途经点的目标语音数据;
第二语音识别子模块,用于将所述目标语音数据获得子模块获得的目标语音数据识别为目标文本。
本申请实施例中,所述位置信息获得模块,包括:
位置信息获得子模块,用于在完成所述目标行程的过程中,分别获取所述途经点的位置信息。
本申请实施例中,所述更新模块,包括:
第一计算子模块,用于在所述目标文本与所述POI名称查找模块查找到的途经点的POI名称不相同的情况下,根据预设的文本相似度计算规则,计算所述目标文本与所述途经点的POI名称的相似度;
第一更新子模块,用于在所述第一计算子模块计算得到的相似度达到预设第一阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述装置还包括:
标记次数计数模块,用于将表示所述途经点的名称被标记为所述目标文本的次数的第一次数加1,将表示所述途经点的名称被标记过的总次数的第二次数加1;
所述更新模块还包括:
标记次数获得子模块,用于在所述第一计算子模块计算得到的相似度低于所述预设第一阈值的情况下,获得所述途经点的所述第一次数和所述途经点的所述第二次数;
第二计算子模块,用于计算所述第一次数与所述第二次数的比值;
第二更新子模块,用于在所述第二计算子模块计算出的比值达到预设第二阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述更新模块还包括:
指令发送子模块,用于在所述第一计算子模块计算得到的相似度低于所述预设第一阈值或所述第二计算子模块计算得到的比值低于所述预设第二阈值的情况下,发送用于请求人工检查的指令;
接收子模块,用于接收人工检查的结果;
第三更新子模块,用于在所述接收子模块接收到的人工检查的结果为确认所述目标文本属于所述途经点的别名的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,所述更新模块,包括:
POI名称补充子模块,用于将所述目标文本作为所述途经点的POI名称的补充。
本申请实施例中,所述预设的POI数据库中记录有POI信息,每条POI信息中包括POI的属性信息,所述属性信息包括:位置信息及POI名称。
根据本申请实施例的第三方面,提供一种计算机存储介质,所述存储介质中存储有程序指令,所述程序指令包括:
获得用于描述目标行程的语音数据;
根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
获得所述途经点的位置信息;
根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
本申请实施例可以使用出行相关的语音数据作为POI数据更新的数据源,而无需专业人员前往实地采集,节省了人力和物力,从而降低POI数据更新的成本,提高了更新的效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请实施例。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请实施例,并与说明书一起用于解释本发明的原理。
图1是本申请实施例根据一示例性实施例示出的一种数据更新方法的流程图;
图2是本申请实施例根据一示例性实施例示出的图1所示方法中步骤105的一种实施方式的流程图;
图3是本申请实施例根据一示例性实施例示出的一种数据更新装置的框图;
图4是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图5是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图6是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图7是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图8是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图9是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图10是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图;
图11是本申请实施例根据一示例性实施例示出的一种用于数据更新装置的一结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请实施例相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请实施例的一些方面相一致的装置和方法的例子。
在本申请实施例使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请实施例。在本申请实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请实施例可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请实施例范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
目前,POI数据库中的POI数据,大部分是经过专业人士收集整理,会结合POI的类型,从专业的机构获取非常正式的名称。但是,在实际生活中,为了便于使用,有些POI名称会被简化、甚至采用别名,因此POI的附加信息往往非常重要,是改善其应用效果的重要手段。此外,对于有些地点,约定俗成的称呼可能与POI数据库中的记录的POI名称完全不同,这部分数据的收集更加困难。
为了获得这些缩略名、别名或者需要新增的POI,需要大量的人力物力收集、整理数据,以实现POI数据库中POI数据的更新。但是依赖人工更新POI数据费时费力,效率比较低。为了解决上述问题,本申请实施例提供了一种数据更新方法及装置。
为了便于描述,下面以“网约车”应用场景为例对方案进行说明。
如图1所示,图1是本申请实施例根据一示例性实施例示出的一种数据更新方法的流程图,该方法可以包括以下步骤:
在步骤101中,获得用于描述目标行程的语音数据。
在使用“网约车”出行的场景下,乘客可以通过在终端设备中输入语音来发布出行需求,终端设备将乘客输入的语音发送给服务器,服务器在接收到终端设备发送的语音后,基于该语音中描述的出发地和目的地生成订单,并发布,司机通过终端设备接单。
本申请实施例中,用于描述目标行程的语音数据指的是乘客在终端设备输入的用于发布出行需求的语音片段。
在第一种应用场景中,用于描述目标行程的语音数据可以为一段完整的语音,例如,网约车乘客端软件的用户界面中提供一个完整行程信息输入接口,乘客通过该接口输入语音片段“我在数字山谷B区2号楼,我要去北大西门”,那么此时获得的用于描述目标行程的语音数据就为语音片段“我在数字山谷B区2号楼,我要去北大西门”。
在第二种应用场景中,用于描述目标行程的语音数据还可以为多段语音,例如,网约车乘客端软件的用户界面中提供两个地点输入接口:出发点地点输入接口和目的地地点输入接口,乘客首先通过出发点地点输入接口语音输入语音片段“数字山谷B区2号楼”,之后通过目的地地点输入接口语音输入语音片段“北大西门”,那么此时获得的用于描述目标行程语音数据就为语音片段“数字山谷B区2号楼”和语音片段“北大西门”。
在步骤102中,根据该语音数据,获得用于描述目标行程的途经点的名称的目标文本。
本申请实施例中,目标行程的途经点可以包括:乘客描述的出发地和目的地,或者仅包括:乘客描述的目的地。
在一可选的实施方式中,上述步骤102可以包括:S10和S11,其中,
在S10中,将语音数据识别为文本;
在S11中,从该文本中提取用于描述目标行程的途经点的名称的目标文本。
例如,以语音“我在数字山谷B区2号楼,我要去北大西门”为例,可以使用现有技术中的任一种语音识别算法,将语音转换为文本,之后利用文本处理技术,提取其中的出发地(数字山谷B区2号楼)和目的地(北大西门)。
考虑到步骤101中提及的第二种应用场景,在另一可选的实施方式中,上述步骤102可以包括:S20和S21,其中,
在S20中,从语音数据中,获得用于描述目标行程的途经点的目标语音数据;
在S21中,将该目标语音数据识别为目标文本。
对于步骤101中提及的第二种应用场景,该应用场景下,获得的用于描述目标行程的语音数据为多段语音,且多段语音之间存在时序关系,本申请实施例中,可以依据多段语音之间的时序关系,获得用于描述目标行程的途经点的目标语音数据。
例如,用于描述目标行程的语音数据为语音片段一“数字山谷B区2号楼”和语音片段二“北大西门”,可以根据语音片段一和语音片段二的时序关系,例如语音片段一的输入时间早于语音片段二的输入时间,此时,可以从用于描述目标行程的语音数据中提取描述出发地的语音为“数字山谷B区2号楼”,提取出描述目的地的语音为“北大西门”,之后将提取出的各语音转换为文本。
在步骤103中,获得途经点的位置信息。
本申请实施例中,在完成目标行程的过程中,分别获取各途经点的位置信息。其中,位置信息可以为GPS位置,具体的,可以指的是经纬度坐标。
在使用“网约车”出行的场景中,司机在接单后,驾车去接乘客,在司机抵达乘客位置、乘客上车后,司机会启动计费,此时系统将获取乘客实际上车点的经纬度坐标,当抵达目的地后,司机结束行程计费,系统将获取乘客实际下车点的经纬度坐标。
在步骤104中,根据该位置信息,从预设的POI数据库中查找途经点的至少一个POI名称。
本申请实施例中,预设的POI数据库中记录可以有POI信息,每条POI信息中包括POI的属性信息,该属性信息包括:位置信息及POI名称。
具体的,预设的POI数据库可以为记录有目标行程所在国家的POI信息的POI数据库,也可以为记录有目标行程所在城市的POI信息的POI数据库,本申请实施例对此不作限定。
在步骤105中,在目标文本与途经点的POI名称不相同的情况下,将目标文本补充到预设的POI数据库中。
本申请实施例中,在目标文本与途经点的POI名称不相同的情况下,将该目标文本作为途经点的POI名称的补充,此时,该途经点又多了一个POI名称,即所述目标文本添加到所述途经点对应的POI信息的属性信息中的POI名称中。
本申请实施例中,可以将乘客输入的语音中的出发地名称与实际上车点的位置信息对应的POI名称进行匹配,将乘客输入的语音中的目的地名称与实际下车点的位置信息对应的POI名称进行匹配,如果完全匹配(即完全相同),则无需对预设的POI数据库进行补充;如果发现不能完全匹配,则语音中描述的出发地名称或者目的地名称可能是POI的缩略名或别名,此时将语音中描述的出发地名称或者目的地名称补充到对应的POI信息中,或者新建POI条目。
例如,以语音“我在数字山谷B区2号楼,我要去北大西门”为例,通过语音识别、文本处理、出发地和目的地提取等处理步骤后,获得了出发地名称“数字山谷B区2号楼”和目的地名称“北大西门”。
在订单执行的过程中,分布获得了实际上车点的位置信息和实际下车点的位置信息,利用实际上车点的位置信息,检索POI数据库,可以获得对应的POI名称为“数字山谷B区2号楼”,将出发地名称和POI检索结果进行匹配,发现均为“数字山谷B区2号楼”,两者完全匹配,不能获得额外的POI名称,所以无需更新POI数据库。
利用实际下车点的位置信息,检索POI数据库,可以获得对应的POI名称为“北京大学西门”,将目的地名称和POI检索结果进行匹配,发现两者不能完全匹配,但两者有较高的匹配度,所以可以将语音描述的目的地名称“北大西门”作为POI名称“北京大学西门”的补充,更新到POI数据库中,以便丰富POI数据的描述,使后续请求可以更好地匹配,从而改善利用POI数据进行导航、直接利用语音生成文本订单等其他任务的效果。
此外,在利用位置信息检索POI名称的过程中,如果发现一个位置信息对应多个POI名称,则可以根据语音中的信息(对应的出发地名称或者目的地名称),分别进行匹配度排序,根据最高匹配度的情况进行处理。
由上述实施例可见,该实施例可以使用出行相关的语音数据作为POI数据更新的数据源,而无需专业人员前往实地采集,节省了人力和物力,从而降低POI数据更新的成本,提高了更新的效率。此外,也可以改善用户的与地图相关的使用体验。
为了进一步提高POI数据库中POI数据的质量,本申请实施例中,当目标文本与途经点的POI名称不相同时,可以计算两者的匹配度(包括相似度和比值),只有当匹配度高于一定值时,才将目标文本补充到预设的POI数据库中,否则,不将目标文本补充到预设的POI数据库中。本申请实施例中,在图1所示实施例的步骤102之后,还包括以下步骤:将表示途经点的名称被标记为目标文本的次数的第一次数加1,将表示该途经点的名称被标记过的总次数的第二次数加1;此时,如图2所示,图2是本申请实施例根据一示例性实施例示出的图1所示方法中步骤105的一种实施方式的流程图,该步骤105可以包括以下步骤:
在步骤201中,在目标文本与途经点的POI名称不相同的情况下,根据预设的文本相似度计算规则,计算目标文本与该途经点的POI名称的相似度。
本申请实施例中,文本相似度计算规则可以为现有技术中任一种文本相似度计算方法,例如基于空间向量的余弦算法,计算目标文本与途经点的POI名称的相似度。
在步骤202中,在该相似度达到预设第一阈值的情况下,将目标文本补充到预设的POI数据库中。
本申请实施例中,可以通过计算目标文本与途经点的POI名称的相似度,来判断目标文本是否为该途经点的缩略名,如果相似度大于预设第一阈值(例如0.5),则认为目标文本为该途经点的缩略名,此时,将目标文本补充到该POI对应的POI信息中。
在步骤203中,在该相似度低于预设第一阈值的情况下,获得途经点的第一次数和该途经点的第二次数。
例如,以北京大学西门对应的POI为例,途经点的第一次数指的是该POI被标记为“北大西门”的次数,途经点的第二次数指的是该POI历史被标记的总的次数。
在步骤204中,计算第一次数与第二次数的比值。
本申请实施例中,比值=(途经点的第一次数)/(途经点的第二次数)。
在步骤205中,在该比值达到预设第二阈值的情况下,将目标文本补充到预设的POI数据库中。
本申请实施例中,可以通过途经点的第一次数与该途经点的第二次数的比值,来判断目标文本是否为该途经点的别名,如果该比值大于预设第二阈值(例如0.45),则认为目标文本为途经点的别名,此时,将目标文本补充到该POI对应的POI信息中。
在步骤206中,在该相似度低于预设第一阈值或该比值低于预设第二阈值时,发送用于请求人工检查的指令。
在步骤207中,接收人工检查的结果,在该结果为确认目标文本属于途经点的别名的情况下,将目标文本补充到预设的POI数据库中。
由上述实施例可见,该实施例可以通过计算相似度、比值及人工检查等多种方式,验证语音中描述的出发地名称和目的地名称是否为缩略名或别名,只有验证通过时,才补充到对应的POI信息中,因此可以提高POI数据库中POI数据的质量。
应当注意,尽管在附图中以特定顺序描述了本申请实施例方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
与前述数据更新方法的实施例对应,本申请实施例还提供了数据更新装置的实施例。
如图3所示,图3是本申请实施例根据一示例性实施例示出的一种数据更新装置的框图,所述装置可以包括:
语音数据获得模块310,用于获得用于描述目标行程的语音数据;
在使用“网约车”出行的场景下,乘客可以通过在终端设备中输入语音来发布出行需求,终端设备将乘客输入的语音发送给服务器,服务器在接收到终端设备发送的语音后,基于该语音中描述的出发地和目的地生成订单,并发布,司机通过终端设备接单。
本申请实施例中,用于描述目标行程的语音数据指的是乘客在终端设备输入的用于发布出行需求的语音片段。
在第一种应用场景中,用于描述目标行程的语音数据可以为一段完整的语音,例如,网约车乘客端软件的用户界面中提供一个完整行程信息输入接口,乘客通过该接口语音输入语音片段“我在数字山谷B区2号楼,我要去北大西门”,那么此时获得的用于描述目标行程的语音数据就为语音片段“我在数字山谷B区2号楼,我要去北大西门”。
在第二种应用场景中,用于描述目标行程的语音数据还可以为多段语音,例如,网约车乘客端软件的用户界面中提供两个地点输入接口:出发点地点输入接口和目的地地点输入接口,乘客首先通过出发点地点输入接口语音输入语音片段“数字山谷B区2号楼”,之后通过目的地地点输入接口语音输入语音片段“北大西门”,那么此时获得的用于描述目标行程语音数据就为语音片段“数字山谷B区2号楼”和语音片段“北大西门”。
目标文本获得模块320,用于根据所述语音数据获得模块310获得的语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
本申请实施例中,目标行程的途经点可以包括:乘客描述的出发地和目的地,或者仅包括:乘客描述的目的地。
位置信息获得模块330,用于获得所述途经点的位置信息;
本申请实施例中,位置信息可以为GPS位置,具体的,可以指的是经纬度坐标。
在使用“网约车”出行的场景中,司机在接单后,驾车去接乘客,在司机抵达乘客位置、乘客上车后,司机会启动计费,此时系统将获取乘客实际上车点的经纬度坐标,当抵达目的地后,司机结束行程计费,系统将获取乘客实际下车点的经纬度坐标。
POI名称查找模块340,用于根据所述位置信息获得模块330获得的位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
本申请实施例中,预设的POI数据库中记录可以有POI信息,每条POI信息中包括POI的属性信息,该属性信息包括:位置信息及POI名称。
具体的,预设的POI数据库可以为记录有目标行程所在国家的POI信息的POI数据库,也可以为记录有目标行程所在城市的POI信息的POI数据库,本申请实施例对此不作限定。
更新模块350,用于在所述目标文本与所述POI名称查找模块340查找到的途经点的POI名称不相同的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,可以将乘客输入的语音中的出发地名称与实际上车点的位置信息对应的POI名称进行匹配,将乘客输入的语音中的目的地名称与实际下车点的位置信息对应的POI名称进行匹配,如果完全匹配(即完全相同),则无需对预设的POI数据库进行补充;如果发现不能完全匹配,则语音中描述的出发地名称或者目的地名称可能是POI的缩略名或别名,此时将语音中描述的出发地名称或者目的地名称补充到对应的POI信息中,或者新建POI条目。
例如,以语音“我在数字山谷B区2号楼,我要去北大西门”为例,通过语音识别、文本处理、出发地和目的地提取等处理步骤后,获得了出发地名称“数字山谷B区2号楼”和目的地名称“北大西门”。
在订单执行的过程中,分布获得了实际上车点的位置信息和实际下车点的位置信息,利用实际上车点的位置信息,检索POI数据库,可以获得对应的POI名称为“数字山谷B区2号楼”,将出发地名称和POI检索结果进行匹配,发现均为“数字山谷B区2号楼”,两者完全匹配,不能获得额外的POI名称,所以无需更新POI数据库。
利用实际下车点的位置信息,检索POI数据库,可以获得对应的POI名称为“北京大学西门”,将目的地名称和POI检索结果进行匹配,发现两者不能完全匹配,但两者有较高的匹配度,所以可以将语音描述的目的地名称“北大西门”作为POI名称“北京大学西门”的补充,更新到POI数据库中,以便丰富POI数据的描述,使后续请求可以更好地匹配,从而改善利用POI数据进行导航、直接利用语音生成文本订单等其他任务的效果。
此外,在利用位置信息检索POI名称的过程中,如果发现一个位置信息对应多个POI名称,则可以根据语音中的信息(对应的出发地名称或者目的地名称),分别进行匹配度排序,根据最高匹配度的情况进行处理。
由上述实施例可见,该实施例可以使用出行相关的语音数据作为POI数据更新的数据源,而无需专业人员前往实地采集,节省了人力和物力,从而降低POI数据更新的成本,提高了更新的效率。此外,也可以改善用户的与地图相关的使用体验。
如图4所示,图4是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图3所示实施例的基础上,所述目标文本获得模块320,可以包括:
第一语音识别子模块321,用于将所述语音数据获得模块310获得的语音数据识别为文本;
目标文本获得子模块322,用于从所述第一语音识别子模块321识别出的文本中提取用于描述所述目标行程的途经点的名称的目标文本。
例如,以语音“我在数字山谷B区2号楼,我要去北大西门”为例,可以使用现有技术中的任一种语音识别算法,将语音转换为文本,之后利用文本处理技术,提取其中的出发地(数字山谷B区2号楼)和目的地(北大西门)。
如图5所示,图5是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图3所示实施例的基础上,所述目标文本获得模块320,可以包括:
目标语音数据获得子模块323,用于从所述语音数据获得模块310获得的语音数据中,获得用于描述所述目标行程的途经点的目标语音数据;
第二语音识别子模块324,用于将所述目标语音数据获得子模块323获得的目标语音数据识别为目标文本。
对于图3所示实施例中提及的第二种应用场景,该应用场景下,获得的用于描述目标行程的语音数据为多段语音,且多段语音之间存在时序关系,本申请实施例中,可以依据多段语音之间的时序关系,获得用于描述目标行程的途经点的目标语音数据。
例如,用于描述目标行程的语音数据为语音片段一“数字山谷B区2号楼”和语音片段二“北大西门”,可以根据语音片段一和语音片段二的时序关系,例如语音片段一的输入时间早于语音片段二的输入时间,此时,可以从用于描述目标行程的语音数据中提取描述出发地的语音为“数字山谷B区2号楼”,提取出描述目的地的语音为“北大西门”,之后将提取出的各语音转换为文本。
如图6所示,图6是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图3~图5所示任一实施例的基础上,所述位置信息获得模块330,可以包括:
位置信息获得子模块331,用于在完成所述目标行程的过程中,分别获取所述途经点的位置信息。
如图7所示,图7是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图3~图6所示任一实施例的基础上,所述更新模块350,可以包括:
第一计算子模块351,用于在所述目标文本与所述POI名称查找模块340查找到的途经点的POI名称不相同的情况下,根据预设的文本相似度计算规则,计算所述目标文本与所述途经点的POI名称的相似度;
本申请实施例中,文本相似度计算规则可以为现有技术中任一种文本相似度计算方法,例如基于空间向量的余弦算法,计算目标文本与途经点的POI名称的相似度。
第一更新子模块352,用于在所述第一计算子模块351计算得到的相似度达到预设第一阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,可以通过计算目标文本与途经点的POI名称的相似度,来判断目标文本是否为该途经点的缩略名,如果相似度大于预设第一阈值(例如0.5),则认为目标文本为该途经点的缩略名,此时,将目标文本补充到该POI对应的POI信息中。
如图8所示,图8是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,所述装置还可以包括:标记次数计数模块,用于将表示所述途经点的名称被标记为所述目标文本的次数的第一次数加1,将表示所述途经点的名称被标记过的总次数的第二次数加1;此时,该实施例可以在图7所示实施例的基础上,所述更新模块350还可以包括:
标记次数获得子模块353,用于在所述第一计算子模块351计算得到的相似度低于所述预设第一阈值的情况下,获得所述途经点的所述第一次数和所述途经点的所述第二次数;
例如,以北京大学西门对应的POI为例,途经点的第一次数指的是该POI被标记为“北大西门”的次数,途经点的第二次数指的是该POI历史被标记的总的次数。
第二计算子模块354,用于计算所述第一次数与所述第二次数的比值;
本申请实施例中,比值=(途经点的第一次数)/(途经点的第二次数)。
第二更新子模块355,用于在所述第二计算子模块354计算出的比值达到预设第二阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
本申请实施例中,可以通过途经点的第一次数与该途经点的第二次数的比值,来判断目标文本是否为该途经点的别名,如果该比值大于预设第二阈值(例如0.45),则认为目标文本为途经点的别名,此时,将目标文本补充到该POI对应的POI信息中。
如图9所示,图9是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图7或图8所示实施例的基础上,所述更新模块350还可以包括:
指令发送子模块356,用于在所述第一计算子模块351计算得到的相似度低于所述预设第一阈值或所述第二计算子模块354计算得到的比值低于所述预设第二阈值的情况下,发送用于请求人工检查的指令;
接收子模块357,用于接收人工检查的结果;
第三更新子模块358,用于在所述接收子模块357接收到的人工检查的结果为确认所述目标文本属于所述途经点的别名的情况下,将所述目标文本补充到所述预设的POI数据库中。
由上述实施例可见,该实施例可以通过计算相似度、比值及人工检查等多种方式,验证语音中描述的出发地名称和目的地名称是否为缩略名或别名,只有验证通过时,才补充到对应的POI信息中,因此可以提高POI数据库中POI数据的质量。
如图10所示,图10是本申请实施例根据一示例性实施例示出的另一种数据更新装置的框图,该实施例可以在图3~图9所示任一实施例的基础上,所述更新模块350,可以包括:
POI名称补充子模块359,用于将所述目标文本作为所述途经点的POI名称的补充。此时,该途经点又多了一个POI名称。
上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本申请实施例还提供了一种计算机存储介质,所述存储介质中存储有程序指令,所述程序指令包括:获得用于描述目标行程的语音数据;根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;获得所述途经点的位置信息;根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
本申请实施例可采用在一个或多个其中包含有程序代码的存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机可用存储介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括但不限于:相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
如图11所示,图11是本申请实施例根据一示例性实施例示出的一种用于数据更新装置的一结构示意图。例如,装置1100可以被提供为一服务器。参照图11,装置1100包括处理组件1122,其进一步包括一个或多个处理器,以及由存储器1132所代表的存储器资源,用于存储可由处理部件1122的执行的指令,例如应用程序。存储器1132中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1122被配置为执行指令,以执行本申请实施例提供的数据更新方法,方法包括:获得用于描述目标行程的语音数据;根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;获得所述途经点的位置信息;根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
装置1100还可以包括一个电源组件1126被配置为执行装置1100的电源管理,一个有线或无线网络接口1150被配置为将装置1100连接到网络,和一个输入输出(I/O)接口1158。装置1100可以操作基于存储在存储器1132的操作系统,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1132,上述指令可由装置1100的处理组件1122执行以完成本申请实施例提供的上述出行提示方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本申请实施例的其它实施方案。本申请实施例旨在涵盖本申请实施例的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请实施例未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请实施例的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请实施例并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请实施例的范围仅由所附的权利要求来限制。
Claims (19)
1.一种数据更新方法,其特征在于,所述方法包括:
获得用于描述目标行程的语音数据;
根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
获得所述途经点的位置信息;
根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本,包括:
将所述语音数据识别为文本;
从所述文本中提取用于描述所述目标行程的途经点的名称的目标文本。
3.根据权利要求1所述的方法,其特征在于,所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本,包括:
从所述语音数据中,获得用于描述所述目标行程的途经点的目标语音数据;
将所述目标语音数据识别为目标文本。
4.根据权利要求1所述的方法,其特征在于,所述获得所述途经点的位置信息,包括:
在完成所述目标行程的过程中,分别获取所述途经点的位置信息。
5.根据权利要求1所述的方法,其特征在于,所述将所述目标文本补充到所述预设的POI数据库中,包括:
根据预设的文本相似度计算规则,计算所述目标文本与所述途经点的POI名称的相似度;
在计算得到的相似度达到预设第一阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
6.根据权利要求5所述的方法,其特征在于,在所述根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本之后,还包括:
将表示所述途经点的名称被标记为所述目标文本的次数的第一次数加1,将表示所述途经点的名称被标记过的总次数的第二次数加1;
所述方法还包括:
在计算得到的相似度低于所述预设第一阈值的情况下,获得所述途经点的所述第一次数和所述途经点的所述第二次数;
计算所述第一次数与所述第二次数的比值;
在所述比值达到预设第二阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
7.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:
在所述相似度低于所述预设第一阈值或所述比值低于所述预设第二阈值的情况下,发送用于请求人工检查的指令;
接收人工检查的结果;
在所述结果为确认所述目标文本属于所述途经点的别名的情况下,将所述目标文本补充到所述预设的POI数据库中。
8.根据权利要求1所述的方法,其特征在于,所述将所述目标文本补充到所述预设的POI数据库中,包括:
将所述目标文本作为所述途经点的POI名称的补充。
9.根据权利要求1所述的方法,其特征在于,所述预设的POI数据库中记录有POI信息,每条POI信息中包括POI的属性信息,所述属性信息包括:位置信息及POI名称。
10.一种数据更新装置,其特征在于,所述装置包括:
语音数据获得模块,用于获得用于描述目标行程的语音数据;
目标文本获得模块,用于根据所述语音数据获得模块获得的语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
位置信息获得模块,用于获得所述途经点的位置信息;
POI名称查找模块,用于根据所述位置信息获得模块获得的位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
更新模块,用于在所述目标文本与所述POI名称查找模块查找到的途经点的POI名称不相同的情况下,将所述目标文本补充到所述预设的POI数据库中。
11.根据权利要求10所述的装置,其特征在于,所述目标文本获得模块,包括:
第一语音识别子模块,用于将所述语音数据获得模块获得的语音数据识别为文本;
目标文本获得子模块,用于从所述第一语音识别子模块识别出的文本中提取用于描述所述目标行程的途经点的名称的目标文本。
12.根据权利要求10所述的装置,其特征在于,所述目标文本获得模块,包括:
目标语音数据获得子模块,用于从所述语音数据获得模块获得的语音数据中,获得用于描述所述目标行程的途经点的目标语音数据;
第二语音识别子模块,用于将所述目标语音数据获得子模块获得的目标语音数据识别为目标文本。
13.根据权利要求10所述的装置,其特征在于,所述位置信息获得模块,包括:
位置信息获得子模块,用于在完成所述目标行程的过程中,分别获取所述途经点的位置信息。
14.根据权利要求10所述的装置,其特征在于,所述更新模块,包括:
第一计算子模块,用于在所述目标文本与所述POI名称查找模块查找到的途经点的POI名称不相同的情况下,根据预设的文本相似度计算规则,计算所述目标文本与所述途经点的POI名称的相似度;
第一更新子模块,用于在所述第一计算子模块计算得到的相似度达到预设第一阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
15.根据权利要求14所述的装置,其特征在于,所述装置还包括:
标记次数计数模块,用于将表示所述途经点的名称被标记为所述目标文本的次数的第一次数加1,将表示所述途经点的名称被标记过的总次数的第二次数加1;
所述更新模块还包括:
标记次数获得子模块,用于在所述第一计算子模块计算得到的相似度低于所述预设第一阈值的情况下,获得所述途经点的所述第一次数和所述途经点的所述第二次数;
第二计算子模块,用于计算所述第一次数与所述第二次数的比值;
第二更新子模块,用于在所述第二计算子模块计算出的比值达到预设第二阈值的情况下,将所述目标文本补充到所述预设的POI数据库中。
16.根据权利要求14或15所述的装置,其特征在于,所述更新模块还包括:
指令发送子模块,用于在所述第一计算子模块计算得到的相似度低于所述预设第一阈值或所述第二计算子模块计算得到的比值低于所述预设第二阈值的情况下,发送用于请求人工检查的指令;
接收子模块,用于接收人工检查的结果;
第三更新子模块,用于在所述接收子模块接收到的人工检查的结果为确认所述目标文本属于所述途经点的别名的情况下,将所述目标文本补充到所述预设的POI数据库中。
17.根据权利要求10所述的装置,其特征在于,所述更新模块,包括:
POI名称补充子模块,用于将所述目标文本作为所述途经点的POI名称的补充。
18.根据权利要求10所述的装置,其特征在于,所述预设的POI数据库中记录有POI信息,每条POI信息中包括POI的属性信息,所述属性信息包括:位置信息及POI名称。
19.一种计算机存储介质,其特征在于,所述存储介质中存储有程序指令,所述程序指令包括:
获得用于描述目标行程的语音数据;
根据所述语音数据,获得用于描述所述目标行程的途经点的名称的目标文本;
获得所述途经点的位置信息;
根据所述位置信息,从预设的POI数据库中查找所述途经点的至少一个POI名称;
若所述目标文本与所述途经点的POI名称不相同,则将所述目标文本补充到所述预设的POI数据库中。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710065798.1A CN108446280A (zh) | 2017-02-06 | 2017-02-06 | 数据更新方法及装置 |
AU2017396932A AU2017396932A1 (en) | 2017-02-06 | 2017-09-28 | Systems and methods for data updating |
EP17895251.1A EP3566149B1 (en) | 2017-02-06 | 2017-09-28 | Systems and methods for updating poi information |
CN201780085674.8A CN110249357B (zh) | 2017-02-06 | 2017-09-28 | 用于数据更新的系统和方法 |
PCT/CN2017/103885 WO2018141159A1 (en) | 2017-02-06 | 2017-09-28 | Systems and methods for data updating |
US16/520,343 US20190370251A1 (en) | 2017-02-06 | 2019-07-23 | Systems and methods for data updating |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710065798.1A CN108446280A (zh) | 2017-02-06 | 2017-02-06 | 数据更新方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN108446280A true CN108446280A (zh) | 2018-08-24 |
Family
ID=63040278
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710065798.1A Pending CN108446280A (zh) | 2017-02-06 | 2017-02-06 | 数据更新方法及装置 |
CN201780085674.8A Active CN110249357B (zh) | 2017-02-06 | 2017-09-28 | 用于数据更新的系统和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780085674.8A Active CN110249357B (zh) | 2017-02-06 | 2017-09-28 | 用于数据更新的系统和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20190370251A1 (zh) |
EP (1) | EP3566149B1 (zh) |
CN (2) | CN108446280A (zh) |
AU (1) | AU2017396932A1 (zh) |
WO (1) | WO2018141159A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109817210A (zh) * | 2019-02-12 | 2019-05-28 | 百度在线网络技术(北京)有限公司 | 语音写作方法、装置、终端和存储介质 |
CN109858005A (zh) * | 2019-03-07 | 2019-06-07 | 百度在线网络技术(北京)有限公司 | 基于语音识别的文档更新方法、装置、设备及存储介质 |
WO2020041945A1 (en) * | 2018-08-27 | 2020-03-05 | Beijing Didi Infinity Technology And Development Co., Ltd. | Artificial intelligent systems and methods for displaying destination on mobile device |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111259018B (zh) * | 2020-01-08 | 2023-03-21 | 北京百度网讯科技有限公司 | 生效验证方法、装置、电子设备及存储介质 |
CN111309843B (zh) * | 2020-03-06 | 2023-09-05 | 斑马网络技术有限公司 | 车机地图系统测试方法、装置、电子设备及存储介质 |
CN111782973A (zh) * | 2020-06-04 | 2020-10-16 | 汉海信息技术(上海)有限公司 | 兴趣点状态预测方法、装置、电子设备及存储介质 |
CN111915344A (zh) * | 2020-06-20 | 2020-11-10 | 武汉海云健康科技股份有限公司 | 一种基于医疗大数据的新会员催熟方法和装置 |
CN116932526B (zh) * | 2023-09-19 | 2023-11-24 | 天泽智慧科技(成都)有限公司 | 一种面向开源情报的文本去重方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110196602A1 (en) * | 2010-02-08 | 2011-08-11 | Navteq North America, Llc | Destination search in a navigation system using a spatial index structure |
CN102750949A (zh) * | 2012-07-16 | 2012-10-24 | 深圳市车音网科技有限公司 | 语音识别方法和装置 |
CN103853740A (zh) * | 2012-11-29 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种基于用户定位请求的poi数据更新方法和装置 |
CN104951466A (zh) * | 2014-03-28 | 2015-09-30 | 高德软件有限公司 | 一种poi信息搜索方法、装置、系统及相关设备 |
WO2016113957A1 (ja) * | 2015-01-16 | 2016-07-21 | クラリオン株式会社 | Poi情報提供サーバ、poi情報提供装置、poi情報提供システムおよびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3908056B2 (ja) * | 2002-02-26 | 2007-04-25 | アルパイン株式会社 | 車載用ナビゲーション装置 |
JP4271456B2 (ja) * | 2003-02-05 | 2009-06-03 | アルパイン株式会社 | 車載用ナビゲーション装置 |
CN101000717A (zh) * | 2006-01-13 | 2007-07-18 | 朗迅科技公司 | 具有地理位置数据的基于道路的交通控制信息的集成访问 |
US8849567B2 (en) * | 2012-05-31 | 2014-09-30 | Google Inc. | Geographic data update based on user input |
US9066206B2 (en) * | 2012-07-03 | 2015-06-23 | Uber Technologies, Inc. | System and method for providing dynamic supply positioning for on-demand services |
CA3007343A1 (en) * | 2015-01-08 | 2016-07-14 | Uber Technologies, Inc. | Providing information about a proposed service for a user based on user-specific location information |
-
2017
- 2017-02-06 CN CN201710065798.1A patent/CN108446280A/zh active Pending
- 2017-09-28 AU AU2017396932A patent/AU2017396932A1/en not_active Withdrawn
- 2017-09-28 EP EP17895251.1A patent/EP3566149B1/en active Active
- 2017-09-28 WO PCT/CN2017/103885 patent/WO2018141159A1/en unknown
- 2017-09-28 CN CN201780085674.8A patent/CN110249357B/zh active Active
-
2019
- 2019-07-23 US US16/520,343 patent/US20190370251A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110196602A1 (en) * | 2010-02-08 | 2011-08-11 | Navteq North America, Llc | Destination search in a navigation system using a spatial index structure |
CN102750949A (zh) * | 2012-07-16 | 2012-10-24 | 深圳市车音网科技有限公司 | 语音识别方法和装置 |
CN103853740A (zh) * | 2012-11-29 | 2014-06-11 | 北京百度网讯科技有限公司 | 一种基于用户定位请求的poi数据更新方法和装置 |
CN104951466A (zh) * | 2014-03-28 | 2015-09-30 | 高德软件有限公司 | 一种poi信息搜索方法、装置、系统及相关设备 |
WO2016113957A1 (ja) * | 2015-01-16 | 2016-07-21 | クラリオン株式会社 | Poi情報提供サーバ、poi情報提供装置、poi情報提供システムおよびプログラム |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020041945A1 (en) * | 2018-08-27 | 2020-03-05 | Beijing Didi Infinity Technology And Development Co., Ltd. | Artificial intelligent systems and methods for displaying destination on mobile device |
CN109817210A (zh) * | 2019-02-12 | 2019-05-28 | 百度在线网络技术(北京)有限公司 | 语音写作方法、装置、终端和存储介质 |
CN109817210B (zh) * | 2019-02-12 | 2021-08-17 | 百度在线网络技术(北京)有限公司 | 语音写作方法、装置、终端和存储介质 |
CN109858005A (zh) * | 2019-03-07 | 2019-06-07 | 百度在线网络技术(北京)有限公司 | 基于语音识别的文档更新方法、装置、设备及存储介质 |
CN109858005B (zh) * | 2019-03-07 | 2024-01-12 | 百度在线网络技术(北京)有限公司 | 基于语音识别的文档更新方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2018141159A1 (en) | 2018-08-09 |
US20190370251A1 (en) | 2019-12-05 |
CN110249357B (zh) | 2023-04-04 |
EP3566149A4 (en) | 2019-12-25 |
CN110249357A (zh) | 2019-09-17 |
AU2017396932A1 (en) | 2019-09-05 |
EP3566149A1 (en) | 2019-11-13 |
EP3566149B1 (en) | 2022-11-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446280A (zh) | 数据更新方法及装置 | |
US11537719B2 (en) | Deep neural network system for similarity-based graph representations | |
US11698261B2 (en) | Method, apparatus, computer device and storage medium for determining POI alias | |
CN104462190B (zh) | 一种基于海量空间轨迹挖掘的在线的位置预测方法 | |
CN106033416A (zh) | 一种字符串处理方法及装置 | |
US20160055177A1 (en) | Search recommendation method and apparatus for map search, computer storage medium, and device | |
CN111143680A (zh) | 路线的推荐方法、系统、电子设备及计算机存储介质 | |
US11861516B2 (en) | Methods and system for associating locations with annotations | |
CN107590123B (zh) | 车载中地点上下文指代消解方法及装置 | |
Shang et al. | Planning unobstructed paths in traffic-aware spatial networks | |
CN109661659B (zh) | 视觉定位地图存储及加载方法、装置、系统及存储介质 | |
CN110866093A (zh) | 机器问答方法及装置 | |
CN111382212B (zh) | 关联地址获取方法、装置、电子设备及存储介质 | |
Shang et al. | Finding traffic-aware fastest paths in spatial networks | |
CN113254630B (zh) | 一种面向全球综合观测成果的领域知识图谱推荐方法 | |
Ozdemir et al. | A hybrid HMM model for travel path inference with sparse GPS samples | |
CN104778235A (zh) | 一种基于MapReduce云计算模型的树遍历搜索方法 | |
Zhou et al. | HIMM: An HMM-based interactive map-matching system | |
CN110795547B (zh) | 文本识别方法和相关产品 | |
Chandio et al. | An approach for map-matching strategy of GPS-trajectories based on the locality of road networks | |
CN104615620A (zh) | 地图搜索类型识别方法及装置、地图搜索方法及系统 | |
Santos et al. | GBUS-Route GeoTracer | |
CN111125272B (zh) | 一种区域特征获取方法、装置、计算机设备及介质 | |
CN111859191A (zh) | Gis服务聚合方法、装置、计算机设备和存储介质 | |
CN111198912A (zh) | 一种地址数据处理方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180824 |