TWI661317B - 地圖興趣點簡稱獲取方法和裝置 - Google Patents
地圖興趣點簡稱獲取方法和裝置 Download PDFInfo
- Publication number
- TWI661317B TWI661317B TW105142522A TW105142522A TWI661317B TW I661317 B TWI661317 B TW I661317B TW 105142522 A TW105142522 A TW 105142522A TW 105142522 A TW105142522 A TW 105142522A TW I661317 B TWI661317 B TW I661317B
- Authority
- TW
- Taiwan
- Prior art keywords
- name
- short
- word
- interest
- point
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01C—MEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
- G01C21/00—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
- G01C21/26—Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
- G01C21/34—Route searching; Route guidance
- G01C21/36—Input/output arrangements for on-board computers
- G01C21/3679—Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Remote Sensing (AREA)
- Data Mining & Analysis (AREA)
- Radar, Positioning & Navigation (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Automation & Control Theory (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Instructional Devices (AREA)
- Navigation (AREA)
Abstract
本發明是關於一種地圖興趣點簡稱獲取方法和裝置,其中方法包括:根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;在距離該興趣點的預設範圍內,獲取含有該興趣點全稱或是任一待評估簡稱的多個地址名稱;根據該地址名稱,計算目標詞的詞狀態向量,該詞狀態向量用於表示該目標詞在該地址名稱中的位置狀態,該目標詞是該興趣點全稱該或是任一該待評估簡稱;分別計算該興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;將高於預設閾值的相似度對應的待評估簡稱,確定為該興趣點全稱對應的興趣點簡稱。本發明提高了地圖興趣點簡稱的獲取效率。
Description
本發明涉及電腦技術,尤其涉及一種地圖興趣點簡稱獲取方法和裝置。
地圖興趣點即POI(Point of Interest),例如,一個POI可以是一棟房子、一個商鋪、一座學校、一個公車站等。當在地圖中搜尋某個POI時,利用該POI的簡稱進行搜尋也是一種常用的搜尋方式,例如,當在地圖中搜尋查找“北京師範大學”時,也可以輸入該北京師範大學的簡稱“北師大”進行搜尋,也可以找到該大學在地圖中所處的位置。因此,為了支持這種利用POI簡稱進行搜尋的方式,需要獲取一些POI全稱對應的簡稱,建立全稱與簡稱的對應關係,這樣才能根據地圖使用者輸入的簡稱準確確定對應的全稱,並回饋使用者搜尋的目標地址給使用者。相關技術中,興趣點的簡稱通常是由人工標注得到,但是這種方式的人工工作量較大,效率也較低,當地圖資料量逐漸增大時,人工標注方式的低效率問題將更加顯著。
為克服相關技術中存在的問題,本發明提供一種地圖興趣點簡稱獲取方法和裝置,以提高地圖興趣點簡稱的獲取效率。
根據本發明實施例的第一方面,提供一種地圖興趣點簡稱獲取方法,包括:根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;在距離所述興趣點的預設範圍內,獲取含有所述興趣點全稱或是任一待評估簡稱的多個地址名稱;根據所述地址名稱,計算目標詞的詞狀態向量,所述詞狀態向量用於表示所述目標詞在所述地址名稱中的位置狀態,所述目標詞是所述興趣點全稱或是任一所述待評估簡稱;分別計算所述興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;將高於預設閾值的相似度對應的待評估簡稱,確定為所述興趣點全稱對應的興趣點簡稱。
根據本發明實施例的第二方面,提供一種地圖興趣點簡稱獲取裝置,包括:評估簡稱生成模組,用於根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;相關地址獲取模組,用於在距離所述興趣點的預設範圍內,獲取含有所述興趣點全稱或是任一待評估簡稱的多
個地址名稱;詞狀態計算模組,用於根據所述地址名稱,分別計算目標詞的詞狀態向量,所述詞狀態向量用於表示所述目標詞在所述地址名稱中的位置狀態,所述目標詞是所述興趣點全稱或是任一所述待評估簡稱;相似度計算模組,用於分別計算所述興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;簡稱確定模組,用於將高於預設閾值的相似度對應的待評估簡稱,確定為所述興趣點全稱對應的興趣點簡稱。
本發明的實施例提供的技術方案可以包括以下有益效果:透過在給出一個興趣點的興趣點全稱時,利用該方法,可以自動從地圖地指庫中獲取該興趣點附近的相關地址名稱,並根據該地址名稱計算出所有可能的待評估簡稱中,哪一個簡稱有可能是全稱的簡稱,從而自動完成簡稱的確定,使得簡稱獲取的效率提高,提高了地圖興趣點簡稱的獲取效率。
應當理解的是,以上的一般描述和後文的細節描述僅是示例性和解釋性的,並不能限制本發明。
101~105‧‧‧步驟
31‧‧‧評估簡稱生成模組
32‧‧‧相關地址獲取模組
33‧‧‧詞狀態計算模組
34‧‧‧相似度計算模組
35‧‧‧簡稱確定模組
此處的圖式被併入說明書中並構成本說明書的一部分,示出了符合本發明的實施例,並與說明書一起用於解釋本發明的原理。
圖1是根據一示例性實施例示出的興趣點簡稱獲取方
法的流程圖;圖2是根據一示例性實施例示出的二維空間餘弦相似度的計算原理圖;圖3是根據一示例性實施例示出的一種地圖興趣點簡稱獲取裝置。
這裡將詳細地對示例性實施例進行說明,其示例表示在圖式中。下面的描述涉及圖式時,除非另有表示,不同圖式中的相同數字表示相同或相似的要素。以下示例性實施例中所描述的實施方式並不代表與本發明相一致的所有實施方式。相反,它們僅是與如申請專利範圍中所詳述的、本發明的一些方面相一致的裝置和方法的例子。
本申請實施例提供了一種地圖興趣點簡稱獲取方法,該方法是一種根據興趣點全稱自動獲取對應簡稱的方案,不再需要借助人工標注,以提高簡稱獲取的效率。
該簡稱獲取方法是基於如下原理:興趣點POI在用於地址名稱的命名時,不論全稱還是簡稱,在地址名稱中的位置狀態應該一致,並且全稱和簡稱通常在同一地點或相近地理位置附近使用。
例如,以興趣點是一個學校為例,假設該學校的全稱是北京師範大學,那麼,通常在大學內部或是大學的周邊會有很多使用學校名稱的地址名稱,比如,北京師範大學食堂、北師大書店、北京師範宿舍樓A區、北師教研室等
(需要說明的是,以上名稱只是為了舉例說明本發明的方案,實際中可能不存在)。可以看到,有的地址名稱中使用了全稱,例如,北京師範大學食堂中的“北京師範大學”;有的地址名稱中使用了簡稱,例如,北師大書店中的“北師大”,北師教研室中的“北師”。
上述的例子即是將興趣點POI的全稱或是簡稱,應用於某個地址名稱中,並且,全稱和簡稱在應用時滿足上面提到的兩個方面的一致性:第一、在同一地點或相近地理位置附近使用。例如,北京師範大學食堂、北師大書店、北京師範宿舍樓A區等,這些地址都是在北京師範大學的學校內部或是學校周邊。
第二、全稱和簡稱在詳細地址字串中的位置狀態基本一致。例如,以“北京師範大學”為例,對於其簡稱“北師大”,如果存在某一詳細地址字串是這樣描述的:“北京市新街口外大街19號北京師範大學圖書館”,則地址庫中也會存在較大的可能出現這樣描述的地址字串“北京市新街口外大街19號北師大圖書館”,或是是類似的“北京新街口外大街北師大圖書館”這樣的字串,這表明POI的全稱和簡稱對在地址庫中出現的位置狀態是基本一致的,也可稱為上下文環境基本一致。
例如,對於大規模的地址文本庫,一對全稱和簡稱,有可能出現相同的前後詞,比如,在上面的例子的地址庫中,全稱“北京師範大學”和對應的簡稱“北師大”,前
後詞都出現了“新街口外大街”和“圖書館”。以一對全稱和簡稱的前後詞包括“食堂”、“圖書館”和“教學樓”為例,這些詞可以組成一個向量{食堂、圖書館、教學樓},每個詞是該向量的一個維度。
如上表1的示例,在包含全稱的詳細地址字串中,“食堂”出現了117次,在包含簡稱的詳細地址字串中,“食堂”出現了32次;同樣對於全稱和簡稱,“圖書館”分別出現267次、71次,“教學樓”分別出現422次、112次,可以看到,這三個維度的出現次數基本上是等比例的。即對於全稱“北京師範大學”,其對應的向量是{117、267、422},對於簡稱“北師大”,其對應的向量是{32、71、112},如果計算這兩個向量的餘弦相似度,可以得知該餘弦值是一個非常接近於1的值。
基於以上原理,本申請興趣點簡稱獲取方法的流程可以參見圖1,包括:在步驟101中,根據地圖興趣點的興趣點全稱,生成
多個待評估簡稱。
本步驟可以將興趣點全稱中包括的各個單字,按照單字排列順序進行任意單字數量的組合,每一組合為一個簡稱,得到多個簡稱。
例如,仍以“北京師範大學”為例,該全稱中包括六個單字,分別為“北”、“京”、“師”、“範”、“大”、“學”;然後將這些單字進行任意單字數量的組合,當單字數量為2時,即兩個單字進行組合,例如,“北京”、“京師”、“師範”、“范大”、“大學”、“北師”、“北範”等,並且可以看到,在組合時按照各個單字在全稱中的排列順序進行組合,即組合中的各個單字的前後順序與在全稱中的前後順序一致。當單字數量為3時,即三個單字進行組合,例如,“北京師”、“京師範”、“北師範”等。
再進行任意組合得到多個簡稱後,還可以從多個簡稱中剔除單字和確認非興趣點簡稱的雜訊詞,剩餘的簡稱即待評估簡稱,這樣使得參與後續處理步驟的待評估簡稱的數量得到減少,有助於提高該流程的處理效率。單字即上述的“北”、“京”、“師”等,雜訊詞例如包括:“北京”、“師範”、“大學”等,這些常用詞通常不可能被使用者作為北京師範大學的簡稱輸入。
在步驟102中,在距離興趣點的預設範圍內,獲取含有興趣點全稱或是任一待評估簡稱的多個地址名稱。
例如,預設範圍可以是興趣點附近500公尺內,比如
上面列舉的北京師範大學食堂、北師大書店、北京師範宿舍樓A區、北師教研室等,這些地址名稱中要麼含有興趣點全稱“北京師範大學”,要麼含有待評估簡稱,例如“北師大”,該待評估簡稱即為在步驟101中確定的地圖興趣點的待評估簡稱。
在步驟103中,根據地址名稱,計算目標詞的詞狀態向量,詞狀態向量用於表示目標詞在地址名稱中的位置狀態,目標詞是興趣點全稱或是任一待評估簡稱。
本步驟中計算的詞狀態向量,可以是一個高維度向量,比如,可以是n維向量(A1,A2,.....An);並且,興趣點全稱或是任一待評估簡稱中的每一個都可以計算得到一個對應的詞狀態向量,比如,全稱“北京師範大學”對應的詞狀態向量是(A1,A2,.....An),其中一個待評估簡稱“北師大”對應的詞狀態向量是(B1,B 2,.....B n)。
詞狀態向量的計算,可以結合在步驟102中獲取的多個地址名稱來進行,並且,興趣點全稱和待評估簡稱的詞狀態向量的計算方法是相同的。如果將興趣點全稱或任一待評估簡稱稱為目標詞,那麼其中一個目標詞的詞狀態向量可以按照如下方式計算:在步驟102獲取的地址名稱可以有多個,例如,北師大書店、北師教研室等,對於某個目標詞,比如,該目標詞是“北師大”,查找哪些地址名稱中包含了“北師大”,例如“北師大書店”,可能有多個地址名稱中都包
含該目標詞。對於每一個包含目標詞的地址名稱,獲取目標詞的相鄰詞,該相鄰詞包括前一個詞和後一個詞。
例如,在包含目標詞“北師大”的地址名稱“北師大書店”中,目標詞的前一個詞是“空”(即前面沒有詞),後一個詞是“書店”。又例如,在包含目標詞“北師大”的地址名稱“博文北師大書房”中,目標詞的前一個詞是“博文”,後一個詞是“書房”。經過統計後,所有包含目標詞的地址名稱中,目標詞的相鄰詞可以有多個,例如上述列舉的“空”、“書店”、“博文”、“書房”,假設只有這四個相鄰詞(實際可能更多),那麼該四個詞可以分別對應目標詞的詞狀態向量的一個向量維度,該向量(空、書店、博文、書房)是一個四維向量。
每一個向量維度的維度數值,可以是對應該維度的詞在所有地址名稱中的出現頻率,例如,以“書店”為例,假設在步驟102中獲取的地址名稱共有10個,而“書店”出現了2次,那麼“書店”的出現頻率是2。其他維度的維度數值計算同理,不再描述。
在步驟104中,分別計算興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度。
例如,在步驟103中計算出興趣點全稱的詞狀態向量、以及任一個待評估簡稱的詞狀態向量後,將興趣點全稱的詞狀態向量分別與各個待評估簡稱的詞狀態向量計算相似度,本例子計算的相似度可以是餘弦相似度。
參見圖2所示,示例了二維空間的餘弦相似度的計
算,a、b是兩個二維向量,並假設a的座標是(x1,y1),b的座標是(x2,y2)。將這兩個向量根據座標值繪製到向量空間中即圖2。然後計算a、b這兩個二維向量的夾角對應的餘弦值,此餘弦值就可以用來表示這兩個向量的相似性,如果兩個向量越相似,它們的夾角越小,餘弦值越接近1,它們的方向更加吻合。
根據向量內積公式,夾角餘弦值計算如下:
將上述公式擴展到多維向量的餘弦相似度的計算,如果興趣點全稱的詞狀態向量A=(A1,A2,...,An),其中一個待評估簡稱的詞狀態向量B=(B1,B2,...,Bn),那麼這兩個向量的餘弦相似度計算如下:
在步驟105中,將高於預設閾值的相似度對應的待評估簡稱,確定為興趣點全稱對應的興趣點簡稱。
例如,如果將預設閾值設為0.42,那麼經過計算的餘弦相似度的數值大於或等於該0.42時,就可以將相似度對應的待評估簡稱確定為興趣點全稱對應的興趣點簡稱。
比如,如果興趣點全稱“北京師範大學”的詞狀態向量A與其中一個待評估簡稱“北師大”的詞狀態向量B的餘弦相似度是0.7,那麼可以確定將待評估簡稱“北師大”作為全稱“北京師範大學”的簡稱。
本例子中,高於預設閾值的待評估簡稱的數量為至少一個,比如,全稱“北京師範大學”的簡稱可以包括“北師大”、“北師”、“北京師範”等多個簡稱。
上述的地圖興趣點簡稱獲取方法,當給出一個興趣點的興趣點全稱時,利用該方法,可以自動從地圖地址庫中獲取該興趣點附近的相關地址名稱,並根據該地址名稱計算出所有可能的待評估簡稱中,哪一個簡稱有可能是全稱的簡稱,從而自動完成簡稱的確定,使得簡稱獲取的效率提高。此外,可以將該方法的執行安排到分散式運算平臺處理,以進一步提高處理速度。
在確定興趣點的全稱與簡稱的對應關係後,可以將該對應關係應用到地圖興趣點的搜尋中,或是應用到其他涉及到地址輸入的場景。例如,使用者輸入“東外大街”時,透過全簡稱對比可知,“東外大街”的全稱為“東直門外大街”,則可提醒使用者“您要輸入的是否是東直門大街?”,而且在地址自動聯想填充中,把相關的全稱東直門外大街的後續可能的詳細地址提供給使用者選擇,比如位於東直門外大街附近的餐館、酒店等地址。
本發明實施例還提供了一種地圖興趣點簡稱獲取裝置,如圖3所示,該裝置可以包括:評估簡稱生成模組
31、相關地址獲取模組32、詞狀態計算模組33、相似度計算模組34和簡稱確定模組35。其中,評估簡稱生成模組31,用於根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;相關地址獲取模組32,用於在距離所述興趣點的預設範圍內,獲取含有所述興趣點全稱或是任一待評估簡稱的多個地址名稱;詞狀態計算模組33,用於根據所述地址名稱,分別計算目標詞的詞狀態向量,所述詞狀態向量用於表示所述目標詞在所述地址名稱中的位置狀態,所述目標詞是所述興趣點全稱或是任一所述待評估簡稱;相似度計算模組34,用於分別計算所述興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;簡稱確定模組35,用於將高於預設閾值的相似度對應的待評估簡稱,確定為所述興趣點全稱對應的興趣點簡稱。
一個例子中,評估簡稱生成模組31,在用於根據地圖興趣點的興趣點全稱生成多個待評估簡稱時,包括:將所述興趣點全稱中包括的各個單字,按照單字排列順序進行任意單字數量的組合,每一組合為一個簡稱,得到多個所述簡稱;從多個簡稱中剔除單字和確定是非興趣點簡稱的雜訊詞,剩餘的簡稱即所述待評估簡稱。
一個例子中,詞狀態計算模組33,在用於根據地址
名稱計算目標詞的詞狀態向量時,包括:在所述多個地址名稱中,獲取目標詞在任一地址名稱中的相鄰詞;每個所述相鄰詞在所述多個地址名稱中的出現頻率,作為所述目標詞的詞狀態向量中的其中一個向量維度的維度數值。
一個例子中,相似度計算模組34,用於計算所述興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的餘弦相似度。
一個例子中,高於預設閾值的相似度對應的待評估簡稱數量為至少一個。
本領域具有通常知識者在考慮說明書及實踐這裡公開的發明後,將容易想到本發明的其它實施方案。本揭露旨在涵蓋本發明的任何變型、用途或是適應性變化,這些變型、用途或是適應性變化遵循本發明的一般性原理並包括本發明未公開的本技術領域中的通常知識或慣用技術手段。說明書和實施例僅被視為示例性的,本發明的真正範圍和精神由下面的申請專利範圍指出。
應當理解的是,本發明並不局限於上面已經描述並在圖式中示出的精確結構,並且可以在不脫離其範圍進行各種修改和改變。本發明的範圍僅由所附的申請專利範圍來限制。
Claims (10)
- 一種地圖興趣點簡稱獲取方法,其中,包括:根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;在距離該興趣點的預設範圍內,獲取含有該興趣點全稱或是任一待評估簡稱的多個地址名稱;根據該等地址名稱,計算目標詞的詞狀態向量,該詞狀態向量用於表示該目標詞在該等地址名稱中的位置狀態,該目標詞是該興趣點全稱或是任一該等待評估簡稱;分別計算該興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;將高於預設閾值的相似度對應的待評估簡稱,確定為該興趣點全稱對應的興趣點簡稱。
- 根據申請專利範圍第1項所述的方法,其中,該根據地圖興趣點的興趣點全稱,生成多個待評估簡稱,包括:將該興趣點全稱中包括的各個單字,按照單字排列順序進行任意單字數量的組合,每一組合為一個簡稱,得到多個該簡稱;從多個簡稱中剔除單字和確定是非興趣點簡稱的雜訊詞,剩餘的簡稱即該等待評估簡稱。
- 根據申請專利範圍第1項所述的方法,其中,該根據地址名稱,計算目標詞的詞狀態向量,該詞狀態向量用於表示該目標詞在該等地址名稱中的位置狀態,包括:在該多個地址名稱中,獲取目標詞在任一地址名稱中的相鄰詞;每個該相鄰詞在該多個地址名稱中的出現頻率,作為該目標詞的詞狀態向量中的其中一個向量維度的維度數值。
- 根據申請專利範圍第1項所述的方法,其中,該計算興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度,包括:計算該興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的餘弦相似度。
- 根據申請專利範圍第1項所述的方法,其中,該高於預設閾值的相似度對應的待評估簡稱的數量為至少一個。
- 一種地圖興趣點簡稱獲取裝置,其中,包括:評估簡稱生成模組,用於根據地圖興趣點的興趣點全稱,生成多個待評估簡稱;相關地址獲取模組,用於在距離該興趣點的預設範圍內,獲取含有該興趣點全稱或是任一待評估簡稱的多個地址名稱;詞狀態計算模組,用於根據該等地址名稱,分別計算目標詞的詞狀態向量,該詞狀態向量用於表示該目標詞在該等地址名稱中的位置狀態,該目標詞是該興趣點全稱或是任一該等待評估簡稱;相似度計算模組,用於分別計算該興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的相似度;簡稱確定模組,用於將高於預設閾值的相似度對應的待評估簡稱,確定為該興趣點全稱對應的興趣點簡稱。
- 根據申請專利範圍第6項所述的裝置,其中,該評估簡稱生成模組,在用於根據地圖興趣點的興趣點全稱生成多個待評估簡稱時,包括:將該興趣點全稱中包括的各個單字,按照單字排列順序進行任意單字數量的組合,每一組合為一個簡稱,得到多個該簡稱;從多個簡稱中剔除單字和確定是非興趣點簡稱的雜訊詞,剩餘的簡稱即該等待評估簡稱。
- 根據申請專利範圍第6項所述的裝置,其中,該詞狀態計算模組,在用於根據地址名稱計算目標詞的詞狀態向量時,包括:在該多個地址名稱中,獲取目標詞在任一地址名稱中的相鄰詞;每個該相鄰詞在該多個地址名稱中的出現頻率,作為該目標詞的詞狀態向量中的其中一個向量維度的維度數值。
- 根據申請專利範圍第6項所述的裝置,其中,該相似度計算模組,用於計算該興趣點全稱的詞狀態向量與任一待評估簡稱的詞狀態向量之間的餘弦相似度。
- 根據申請專利範圍第6項所述的裝置,其中,該高於預設閾值的相似度對應的待評估簡稱的數量為至少一個。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
??201610015852.7 | 2016-01-11 | ||
CN201610015852.7A CN106959958B (zh) | 2016-01-11 | 2016-01-11 | 地图兴趣点简称获取方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW201740289A TW201740289A (zh) | 2017-11-16 |
TWI661317B true TWI661317B (zh) | 2019-06-01 |
Family
ID=59310764
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW105142522A TWI661317B (zh) | 2016-01-11 | 2016-12-21 | 地圖興趣點簡稱獲取方法和裝置 |
Country Status (10)
Country | Link |
---|---|
US (2) | US10816355B2 (zh) |
EP (1) | EP3404559A4 (zh) |
JP (1) | JP6877464B2 (zh) |
KR (1) | KR102157428B1 (zh) |
CN (1) | CN106959958B (zh) |
MY (1) | MY192478A (zh) |
PH (1) | PH12018501475A1 (zh) |
SG (1) | SG11201805938XA (zh) |
TW (1) | TWI661317B (zh) |
WO (1) | WO2017121262A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106959958B (zh) * | 2016-01-11 | 2020-04-07 | 阿里巴巴集团控股有限公司 | 地图兴趣点简称获取方法和装置 |
CN107491537A (zh) * | 2017-08-23 | 2017-12-19 | 北京百度网讯科技有限公司 | Poi数据挖掘、信息检索方法、装置、设备及介质 |
CN108171529B (zh) * | 2017-12-04 | 2021-09-14 | 昆明理工大学 | 一种地址相似度评估方法 |
CN110008300B (zh) * | 2019-04-11 | 2021-07-09 | 北京百度网讯科技有限公司 | Poi别名的确定方法、装置、计算机设备和存储介质 |
CN110543593B (zh) * | 2019-08-01 | 2021-04-09 | 北京三快在线科技有限公司 | 数据处理方法、装置、电子设备及可读存储介质 |
CN111026937B (zh) * | 2019-11-13 | 2021-02-19 | 百度在线网络技术(北京)有限公司 | 提取poi名称的方法、装置、设备和计算机存储介质 |
CN113495997B (zh) * | 2020-04-01 | 2024-08-06 | 北京四维图新科技股份有限公司 | Poi别名的探索方法、装置和车辆 |
CN112001172A (zh) * | 2020-08-25 | 2020-11-27 | 杭州橙鹰数据技术有限公司 | 识别方法及装置 |
WO2022131740A1 (en) * | 2020-12-14 | 2022-06-23 | Samsung Electronics Co., Ltd. | Methods and systems for generating abbreviations for a target word |
CN113515944A (zh) * | 2021-03-23 | 2021-10-19 | 汉海信息技术(上海)有限公司 | 兴趣点的别名挖掘方法、装置、设备及存储介质 |
CN113688628B (zh) * | 2021-07-28 | 2023-09-22 | 上海携宁计算机科技股份有限公司 | 文本识别方法、电子设备和计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023259A1 (en) * | 2008-07-22 | 2010-01-28 | Microsoft Corporation | Discovering points of interest from users map annotations |
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
US20140278291A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Discovering functional groups |
CN104216895A (zh) * | 2013-05-31 | 2014-12-17 | 高德软件有限公司 | 一种生成poi数据的方法及装置 |
CN104933171A (zh) * | 2015-06-30 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 兴趣点数据关联方法和装置 |
TWI506247B (zh) * | 2013-09-29 | 2015-11-01 | Tencent Tech Shenzhen Co Ltd | 地理位置顯示方法及裝置 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS513051B1 (zh) | 1969-04-04 | 1976-01-30 | ||
CN100559463C (zh) * | 2002-11-11 | 2009-11-11 | 松下电器产业株式会社 | 声音识别用辞典编制装置和声音识别装置 |
US20070185650A1 (en) * | 2006-02-04 | 2007-08-09 | Tatsuo Yokota | Method and apparatus for searching point of interest by name or phone number |
US20070220037A1 (en) * | 2006-03-20 | 2007-09-20 | Microsoft Corporation | Expansion phrase database for abbreviated terms |
KR100849497B1 (ko) * | 2006-09-29 | 2008-07-31 | 한국전자통신연구원 | 온톨로지 매핑을 이용한 단백질 이름 정규화 방법 |
JP5103051B2 (ja) | 2007-04-17 | 2012-12-19 | 株式会社日立製作所 | 情報処理システム及び情報処理方法 |
US8892455B2 (en) * | 2007-09-28 | 2014-11-18 | Walk Score Management, LLC | Systems, techniques, and methods for providing location assessments |
JP4953459B2 (ja) * | 2008-03-11 | 2012-06-13 | ヤフー株式会社 | 文字ベクトルを用いた略語生成装置、方法及びプログラム |
KR101590624B1 (ko) * | 2009-02-20 | 2016-02-03 | 팅크웨어(주) | 관심지점 시설물의 대표화 장치 및 그 방법 |
CN102460430B (zh) * | 2009-04-29 | 2014-02-19 | 谷歌公司 | 简短兴趣点标题生成 |
US8583638B2 (en) * | 2009-08-27 | 2013-11-12 | Apple Inc. | Adaptive mapping of search results |
US8510348B2 (en) * | 2010-03-03 | 2013-08-13 | Wgrs Licensing Company, Llc | Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses |
CN102789473A (zh) * | 2011-05-18 | 2012-11-21 | 国际商业机器公司 | 标识符检索方法和设备 |
US8521539B1 (en) * | 2012-03-26 | 2013-08-27 | Nuance Communications, Inc. | Method for chinese point-of-interest search |
CN103390004B (zh) * | 2012-05-11 | 2018-03-02 | 北京百度网讯科技有限公司 | 一种语义冗余的确定方法和装置、对应的搜索方法和装置 |
CN103885950B (zh) * | 2012-12-19 | 2017-07-28 | 高德软件有限公司 | 一种获取缩略词与poi间对应关系的方法和装置 |
JP6044422B2 (ja) | 2013-03-29 | 2016-12-14 | 富士通株式会社 | 略称生成方法および略称生成装置 |
CN105808609B (zh) * | 2014-12-31 | 2020-04-14 | 高德软件有限公司 | 一种信息点数据冗余的判别方法和设备 |
CN105224660A (zh) * | 2015-09-30 | 2016-01-06 | 北京奇虎科技有限公司 | 一种地图兴趣点poi数据的处理方法和装置 |
CN106959958B (zh) | 2016-01-11 | 2020-04-07 | 阿里巴巴集团控股有限公司 | 地图兴趣点简称获取方法和装置 |
CN106909600A (zh) * | 2016-07-07 | 2017-06-30 | 阿里巴巴集团控股有限公司 | 用户背景信息的收集方法及装置 |
-
2016
- 2016-01-11 CN CN201610015852.7A patent/CN106959958B/zh active Active
- 2016-12-21 TW TW105142522A patent/TWI661317B/zh active
-
2017
- 2017-01-03 SG SG11201805938XA patent/SG11201805938XA/en unknown
- 2017-01-03 KR KR1020187022277A patent/KR102157428B1/ko active IP Right Grant
- 2017-01-03 MY MYPI2018702412A patent/MY192478A/en unknown
- 2017-01-03 EP EP17738076.3A patent/EP3404559A4/en not_active Ceased
- 2017-01-03 WO PCT/CN2017/000018 patent/WO2017121262A1/zh active Application Filing
- 2017-01-03 JP JP2018554614A patent/JP6877464B2/ja active Active
-
2018
- 2018-07-10 US US16/031,507 patent/US10816355B2/en active Active
- 2018-07-11 PH PH12018501475A patent/PH12018501475A1/en unknown
-
2020
- 2020-10-26 US US17/080,357 patent/US11255690B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100023259A1 (en) * | 2008-07-22 | 2010-01-28 | Microsoft Corporation | Discovering points of interest from users map annotations |
CN103514199A (zh) * | 2012-06-25 | 2014-01-15 | 高德软件有限公司 | Poi数据处理方法及其装置、poi检索方法及其装置 |
US20140278291A1 (en) * | 2013-03-14 | 2014-09-18 | Microsoft Corporation | Discovering functional groups |
CN104216895A (zh) * | 2013-05-31 | 2014-12-17 | 高德软件有限公司 | 一种生成poi数据的方法及装置 |
TWI506247B (zh) * | 2013-09-29 | 2015-11-01 | Tencent Tech Shenzhen Co Ltd | 地理位置顯示方法及裝置 |
CN104933171A (zh) * | 2015-06-30 | 2015-09-23 | 百度在线网络技术(北京)有限公司 | 兴趣点数据关联方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2019503025A (ja) | 2019-01-31 |
PH12018501475A1 (en) | 2019-03-11 |
CN106959958B (zh) | 2020-04-07 |
US20210055124A1 (en) | 2021-02-25 |
EP3404559A1 (en) | 2018-11-21 |
MY192478A (en) | 2022-08-23 |
US11255690B2 (en) | 2022-02-22 |
JP6877464B2 (ja) | 2021-05-26 |
US20180335313A1 (en) | 2018-11-22 |
TW201740289A (zh) | 2017-11-16 |
KR20180101443A (ko) | 2018-09-12 |
SG11201805938XA (en) | 2018-08-30 |
US10816355B2 (en) | 2020-10-27 |
EP3404559A4 (en) | 2019-08-21 |
WO2017121262A1 (zh) | 2017-07-20 |
CN106959958A (zh) | 2017-07-18 |
KR102157428B1 (ko) | 2020-09-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI661317B (zh) | 地圖興趣點簡稱獲取方法和裝置 | |
Achilleos | The Inverse Distance Weighted interpolation method and error propagation mechanism–creating a DEM from an analogue topographical map | |
CN107832325B (zh) | 一种poi数据校验方法与设备 | |
US7539573B2 (en) | Enhanced positional accuracy in geocoding by dynamic interpolation | |
US20150356088A1 (en) | Tile-based geocoder | |
Safra et al. | Ad hoc matching of vectorial road networks | |
EP2991037B1 (en) | Method of generating three-dimensional scene model | |
US11676315B2 (en) | Generating simplified map shapes | |
JP6136702B2 (ja) | 場所推定方法、場所推定装置および場所推定プログラム | |
US11455552B2 (en) | Intelligent design platform using industrialized experience in product designs | |
US20150371430A1 (en) | Identifying Imagery Views Using Geolocated Text | |
WO2016192284A1 (zh) | 一种用于获取地图中的候选地址信息的方法和装置 | |
Claridades et al. | Developing a data model of indoor points of interest to support location‐based services | |
Heinz et al. | A data model for moving regions of fixed shape in databases | |
CN110930217A (zh) | 装修推荐方法、装置、可读存储介质及处理器 | |
Velsink | Extendable linearised adjustment model for deformation analysis | |
US11537622B2 (en) | K-nearest neighbour spatial queries on a spatial database | |
WO2016028696A1 (en) | Interpreting user queries based on nearby locations | |
CN111737374A (zh) | 位置坐标确定方法、装置、电子设备及存储介质 | |
Chang et al. | An authoring system of creating graphic map for item search based on library OPACs | |
US8751526B1 (en) | Efficient range unions in SQL | |
Wang et al. | A proposal of spatial operators for a collaborative map search system | |
Hasanzadeh | A Spatio-qualitative Knowledge Discovery Paradigm | |
Arslan et al. | The determination of the true geometrical form of Great Ephesus theater, Turkey by using field surveys | |
Tashenova | Dinara Mamrayeva |