KR102157428B1 - 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치 - Google Patents

맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치 Download PDF

Info

Publication number
KR102157428B1
KR102157428B1 KR1020187022277A KR20187022277A KR102157428B1 KR 102157428 B1 KR102157428 B1 KR 102157428B1 KR 1020187022277 A KR1020187022277 A KR 1020187022277A KR 20187022277 A KR20187022277 A KR 20187022277A KR 102157428 B1 KR102157428 B1 KR 102157428B1
Authority
KR
South Korea
Prior art keywords
name
poi
phrase
names
abbreviated
Prior art date
Application number
KR1020187022277A
Other languages
English (en)
Other versions
KR20180101443A (ko
Inventor
관하이 종
후이 리
Original Assignee
알리바바 그룹 홀딩 리미티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 알리바바 그룹 홀딩 리미티드 filed Critical 알리바바 그룹 홀딩 리미티드
Publication of KR20180101443A publication Critical patent/KR20180101443A/ko
Application granted granted Critical
Publication of KR102157428B1 publication Critical patent/KR102157428B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01CMEASURING DISTANCES, LEVELS OR BEARINGS; SURVEYING; NAVIGATION; GYROSCOPIC INSTRUMENTS; PHOTOGRAMMETRY OR VIDEOGRAMMETRY
    • G01C21/00Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00
    • G01C21/26Navigation; Navigational instruments not provided for in groups G01C1/00 - G01C19/00 specially adapted for navigation in a road network
    • G01C21/34Route searching; Route guidance
    • G01C21/36Input/output arrangements for on-board computers
    • G01C21/3679Retrieval, searching and output of POI information, e.g. hotels, restaurants, shops, filling stations, parking facilities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Radar, Positioning & Navigation (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)
  • Navigation (AREA)

Abstract

본원은 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치에 관한 것이다. 상기 방법은, 맵 상에서의 관심 지점의 전체 명칭에 기초하여 평가될 복수의 축약 명칭을 생성하는 단계와, 상기 관심 지점의 미리 정해진 영역으로부터, 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나를 포함하는 복수의 주소 명칭을 취득하는 단계와, 상기 주소 명칭에 기초하여 타겟 어구의 어구 상태 벡터를 산출하는 단계―상기 어구 상태 벡터는 상기 주소 명칭에서 상기 타겟 어구의 위치 상태를 나타내는데 사용되고, 상기 타겟 어구는 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나임―와, 상기 관심 지점의 전체 명칭의 어구 상태 벡터와 상기 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하는 단계와, 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을, 상기 관심 지점의 전체 명칭에 대응하는 상기 관심 지점의 축약 명칭으로서 결정하는 단계를 포함한다. 본원에 따르면, 맵 상에서 관심 지점의 축약 명칭을 취득하는 효율이 향상된다.

Description

맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치
본 출원은 2016년 1월 11일에 출원한 발명의 명칭이 "METHOD AND APPARATUS FOR OBTAINING ABBREVIATED NAME OF POINT OF INTEREST ON MAP"인 중국 특허 출원 제201610015852.7호에 대해 우선권을 주장하며, 그 전체 내용은 본 명세서에 참고로 포함된다.
<기술 분야>
본 개시내용은 컴퓨터 기술에 관한 것이며, 구체적으로는 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치에 관한 것이다.
맵 상에서의 관심 지점(POI, point of interest)은 집, 상점, 학교, 버스 정류소 등일 수 있다. 맵에서 POI가 검색될 때에, 주로 사용되는 검색 방법은 POI의 축약 명칭을 사용하여 POI를 검색하는 것이다. 예를 들어, 맵에서 "Beijing Normal University"이 검색될 때에, 맵 상에서 이 학교를 찾기 위해 "Beijing Normal University"의 축약 명칭인 "BNU"이 입력될 수도 있다. 이에, POI의 축약 명칭을 사용하여 POI를 검색하는 방법을 지원하려면, 전체 명칭과 축약 명칭 간의 매핑 관계를 확립하기 위해 POI의 전체 명칭에 대응하는 일부 축약 명칭을 취득해야 한다. 이 경우, 맵 사용자가 입력한 축약 명칭에 기초하여 대응하는 전체 명칭이 결정될 수 있고, 사용자가 검색하는 타겟 주소가 사용자에게 피드백될 수 있다. 기존의 기술에서는, 관심 지점의 축약 명칭이 대개 수동 라벨링(manual labeling)을 통해 취득되지만, 수동 라벨링에 드는 작업부하는 비교적 높고 효율은 비교적 낮다. 맵의 데이터량이 증가함에 따라, 수동 라벨링의 효율은 더 낮아질 수 있다.
기존 기술의 문제점을 해결하기 위해, 본 개시내용은 맵 상에서의 관심 지점의 축약 명칭의 취득 효율을 높일 수 있는, 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치를 제공한다.
본 개시내용의 구현예의 일 양태에 따르면, 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법이 제공되며, 이 방법은, 맵 상에서의 관심 지점의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성하는 단계와, 상기 관심 지점의 미리 정해진 영역으로부터, 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나를 포함하는 복수의 주소명을 취득하는 단계와, 상기 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출하는 단계―상기 어구 상태 벡터는 상기 주소명에서 상기 타겟 어구의 위치 상태를 나타내는데 사용되고, 상기 타겟 어구는 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나임―와, 상기 관심 지점의 전체 명칭의 어구 상태 벡터와 상기 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하는 단계와, 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을, 상기 관심 지점의 전체 명칭에 대응하는 상기 관심 지점의 축약 명칭으로서 결정하는 단계를 포함한다.
본 개시내용의 구현예의 제2 양태에 따르면, 맵 상에서 관심 지점의 축약 명칭을 취득하는 장치가 제공되며, 이 장치는, 맵 상에서의 관심 지점의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성하도록 구성되는 평가 대상 축약 명칭 생성 모듈과, 상기 관심 지점의 미리 정해진 영역으로부터, 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나를 포함하는 복수의 주소명을 취득하도록 구성되는 관련 주소 취득 모듈과, 상기 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출하도록 구성되는 어구 상태 산출 모듈로서, 상기 어구 상태 벡터는 상기 주소명에서 상기 타겟 어구의 위치 상태를 나타내는데 사용되고, 상기 타겟 어구는 상기 관심 지점의 전체 명칭 또는 상기 평가될 축약 명칭들 중 어느 하나인 것인, 상기 어구 상태 산출 모듈과, 상기 관심 지점의 전체 명칭의 어구 상태 벡터와 상기 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하도록 구성되는 유사도 산출 모듈과, 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을, 상기 관심 지점의 전체 명칭에 대응하는 상기 관심 지점의 축약 명칭으로서 결정하도록 구성되는 축약 명칭 결정 모듈을 포함한다.
본 개시내용의 구현예에서 제공되는 기술적 솔루션은 다음과 같은 유리한 효과를 포함할 수 있다. 상기 방법을 사용하면, 관심 지점의 전체 명칭이 제공될 경우, 그 관심 지점 근처의 관련 주소명이 맵 어드레스 라이브러리부터 자동으로 취득될 수 있고, 축약 명칭을 자동으로 결정하기 위하여, 그 주소명에 기초하여, 가능한 모든 평가 대상 축약 명칭들 중 그 전체 명칭의 축약 명칭일 수 있는 축약 명칭이 산출됨에 따라, 맵 상에서 관심 지점의 축약 명칭을 취득하는 효율을 높일 수 있다.
이상의 개괄적인 기재와 이어지는 상세한 기재는 예시 및 설명을 위한 것일 뿐이며, 본 개시내용을 제한하려는 의도가 없음이 이해되어야 한다.
여기에 첨부하는 도면은 명세서에 통합되어 명세서의 일부를 구성하고, 본 개시내용에 따른 구현예를 보여주며, 본 개시내용의 원리를 설명하는 명세서와 함께 사용된다.
도 1은 예시적인 구현에 따라, 맵 상에서 관심 지점의 축약 명칭을 취득하기 위한 방법을 나타내는 흐름도이다.
도 2는 예시적인 구현에 따라, 2차원 공간에서 코사인 유사도를 산출하는 원리를 보여준다.
도 3은 예시적인 구현에 따라, 맵 상에서 관심 지점의 축약 명칭을 취득하기 위한 장치를 보여준다.
예시적인 구현예를 여기에 상세히 설명하며, 그 예는 첨부 도면에 제시되어 있다. 이하의 설명에서 첨부 도면을 언급할 때, 다르게 특정하지 않는다면, 상이한 도면에서의 동일한 참조 번호는 동일하거나 유사한 요소를 나타낸다. 다음의 예시적인 구현에서 설명하는 구현예는 본 개시내용과 부합하는 모든 구현예를 나타내지는 않는다. 반면, 이들은 첨부하는 청구범위에 기재된 장치 및 방법의 예일 뿐이며, 본 개시내용의 일부 양태와 부합하는 것일 뿐이다.
본원의 구현예는 맵 상에서 관심 지점(POI)의 축약 명칭을 취득하는 방법을 제공한다. 이 방법은 축약 명칭의 취득 효율을 높이기 위해, 수동 라벨링 없이 POI의 전체 명칭에 기초하여 대응하는 축약 명칭을 자동으로 취득하는 솔루션이다.
축약 명칭 취득 방법은 다음의 원리에 기초한다. POI가 주소 네이밍에 사용될 경우, POI의 전체 명칭과 축약 명칭은 상세한 주소에서 실질적으로 유사한 위치에 등장한다. 전체 명칭과 축약 명칭은 동일한 위치 또는 지리적으로 근접한 위치에 대응하는 주소명에 대개 사용된다.
예를 들어, POI가 학교라고 하기로 한다. 이 학교의 전체 명칭이 Beijing Normal University라면, 보통 대학 내부 또는 주변에는 예컨대 Beijing Normal University Cafeteria, BNU Bookstore, Beijing Normal Dormitory Section A, BN Education Center 등, 학교명을 사용한 주소가 많다. (이 이름들은 본원의 솔루션을 설명하기 위해 사용하는 예일 뿐이며, 실제로 존재하지 않을 수도 있음을 알아야 한다.) 일부 주소명은 예컨대 "Beijing Normal University Cafeteria"에서 "Beijing Normal University"와 같이 전체 명칭을 사용하고, 일부 주소명은 "BNU Bookstore"에서 "BNU", 그리고 "BN Education Center"에서 "BN"처럼 축약 명칭을 사용하는 것을 볼 수 있다.
앞의 예에서는, 관심 지점(POI)의 전체 명칭 또는 축약 명칭이 주소명에 적용되며, 전체 명칭과 축약 명칭은 전술한 두 양태를 충족한다.
첫째, 전체 명칭과 축약 명칭은 동일한 위치 또는 지리적으로 근접한 위치에 대응하는 주소명에 사용된다. 예를 들어, "Beijing Normal University Cafeteria", "BNU Bookstore", 및 "Beijing Normal Dormitory Section A"은 모두 "Beijing Normal University"의 내부나 주변에 위치한다.
둘째, POI의 전체 명칭과 축약 명칭은 상세한 주소에서 실질적으로 유사한 위치에 등장한다. "Beijing Normal University"가 예로서 사용된다. "Beijing Normal University"의 축약 명칭 "BNU"의 경우, library 주소에 있어서, 상세한 주소 문자열이 어드레스 라이브러리에 "19 Xinjiekou Street, Beijing Normal University Library, Beijing"로 기재되어 있다면, "19 Xinjiekou Street, BNU Library, Beijing"로서 기재된 주소 문자열이나 "Xinjiekou Street, BNU Library, Beijing"과 유사한 문자열이 있을 수도 있다. 그것은 POI의 전체 명칭 및 축약 명칭의 위치가 library 주소에서 실질적으로 유사함을, 다시 말해 컨텍스트가 실질적으로 유사함을 나타낸다.
예를 들어, 대규모 어드레스 텍스트 라이브러리의 경우, 전체 명칭과 축약 명칭의 쌍은 전후에 동일한 어구(phrase)를 가질 수 있다. 예를 들어, 앞의 예의 library 주소에 있어서, 전체 명칭 "Beijing Normal University" 및 대응하는 축약 명칭 "BNU"은 모두 앞에 "Xinjiekou Street"라는 어구와 뒤에 "Library"라는 어구를 갖는다. 예를 들어, 한 쌍의 전체 명칭과 축약 명칭의 앞뒤에 사용되는 어구는 "Cafeteria", "Library" 및 "Building"을 포함한다. 이들 어구는 벡터 {Cafeteria, Library, Building}를 형성하고, 각 어구가 그 벡터의 차원이다.
차원 전체 명칭:
Beijing Normal University
축약 명칭:
BNU
Cafeteria 117 32
Library 267 71
Building 422 112
코사인 유사도 0.999977577
전체 명칭과 축약 명칭에 대응하는 벡터 차원
표 1에 나타내는 예에서, "Cafeteria"는 전체 명칭을 포함하는 상세한 주소 문자열에서 117회 등장하고, "Cafeteria"는 축약 명칭을 포함하는 상세한 주소 문자열에서 32회 등장한다. 마찬가지로, 전체 명칭 및 축약 명칭에 있어서, "Library"는 각각 267회 및 71회 등장하며, "Building"은 각각 422회 및 112회 등장한다. 3차원의 등장 회수가 기본적으로 비례하는 것을 볼 수 있다. 즉, 전체 명칭 "Beijing Normal University"에 대응하는 벡터는 {117, 267, 422}이고, "BNU"에 대응하는 벡터는 {32, 71, 112}이다. 두 벡터 간의 코사인 유사도가 산출되면, 코사인 값은 1에 매우 근접함을 볼 수 잇다.
앞의 원리에 기초하여, POI의 축약 명칭을 취득하는 절차에 있어서, 도 1을 참조한다. 이 방법은 다음의 단계를 포함한다.
단계 101: 맵 상에서의 POI의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성
이 단계에서는, POI의 전체 명칭에 포함되는 단일 단어들을 단일 단어 배열 순서로 조합하여 임의 개의 단일 단어들의 조합을 형성하는데, 이 경우 각 조합은 축약 명칭이고, 복수의 축약 명칭들이 취득된다.
계속 "Beijing Normal University"가 예로서 사용된다. 중국어 병음의 전체 명칭은 6개의 단일 단어를 포함하는데, "Bei", "Jing", "Shi", "Fan", "Da", 및 "Xue"이다. 이들 6개의 단어를 조합하여 임의 개의 단일 단어들의 조합을 형성한다. 단일 단어 수가 2개인 경우, 2개의 단일 단어가 조합되는데, 예컨대, "Beijing", "Jingshi", "Shifan", "Fanda", "Daxue", "Beishi", "Beifan" 등이다. 조합하는 중에, 단일 단어들은 전체 명칭에서의 단일 단어들의 배열 순서로 조합되는 것을 볼 수 있다. 즉, 조합에 있어서 각 단일 단어의 순서는 전체 명칭에서의 단일 단어의 순서와 동일하다. 단일 단어 수가 3개인 경우에, 3개의 단일 단어가 조합되는데, 예컨대 "Beijingshi", "Jingshifan", "Beishifan" 등이다.
임의의 조합을 통해 복수의 축약 명칭들이 취득된 후에, 복수의 축약 명칭들 중에서, 비POI의 축약 명칭으로서 결정된 단일 단어 및 노이즈 어구를 더 제거할 수 있고, 잔여 축약 명칭이 평가될 축약 명칭이다. 이와 같이, 후속 프로세싱 단계에 참여하는 평가될 축약 명칭의 양이 저감하고, 그에 따라 절차의 프로세싱 효율을 높일 수 있다. 단일 단어는 앞의 "Bei", "Jing", "Shi"등이고, 노이즈 어구는 "Beijing", "Shifan", "Daxue" 등을 포함한다. 사용자가 이들 자주 사용하는 어구를 "Beijing Normal University"의 축약 명칭으로서 입력하는 것은 대체로 불가능하다.
단계 102: POI의 미리 정해진 영역으로부터, POI의 전체 명칭 또는 평가될 축약 명칭들 중 어느 하나를 포함하는 복수의 주소명을 취득.
예를 들어, 미리 정해진 영역은 앞에서 열거한 "Beijing Normal University Cafeteria", "BNU Bookstore", "Beijing Normal Dormitory Section A", 및 "BN Education Center" 등의 POI 근처의 500 미터 내의 영역일 수 있다. 이들 주소명은 POI의 전체 명칭 "Beijing Normal University" 또는 "BNU" 등의 평가될 축약 명칭들 중 하나를 포함한다. 평가될 축약 명칭은 단계 101에서 결정된 맵 상에서의 POI의 축약 명칭이다.
단계 103: 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출, 여기서 어구 상태 벡터는 주소명에서 타겟 어구의 위치 상태를 나타내는데 사용되고, 타겟 어구는 POI의 전체 명칭 또는 평가될 축약 명칭들 중 어느 하나임.
이 단계에서 산출된 어구 상태 벡터는 다차원 벡터, 예컨대 n차원 벡터 (A1, A2, …, An)일 수 있다. 또한, 대응하는 어구 상태 벡터는 POI의 전체 명칭 및 평가될 축약 명칭들의 각각마다 산출을 통해 취득될 수 있다. 예를 들어, 전체 명칭 "Beijing Normal University"에 대응하는 어구 상태 벡터는 (A1, A2, …, An)이고, 축약 명칭들 중 하나인 "BNU"에 대응하는 어구 상태 벡터는 (B1, B2, …, Bn)이다.
어구 상태 벡터는 단계 102에서 취득된 복수의 주소명을 참조하여 산출될 수 있으며, POI의 전체 명칭의 어구 상태 벡터를 산출하는 방법은 평가될 축약 명칭의 어구 상태 벡터를 산출하는 것과 동일하다. POI의 전체 명칭 또는 축약 명칭들 중 어느 하나가 타겟 어구로서 인용되면, 타겟 어구 중 하나의 어구 상태 벡터가 다음의 방법으로 산출될 수 있다.
예컨대, "BNU Bookstore", "BN Education Center" 등의 복수의 주소명이 단계 102에서 취득될 수 있다. 타겟 어구에 있어서, 예컨대 타겟 어구가 "BNU"이고,"BNU Bookstore"와 같은 "BNU"를 포함하는 주소명이 발견된다. 타겟 어구를 포함하는 복수의 주소명이 있을 수 있다. 타겟 어구를 포함하는 각 주소명으로부터 타겟 어구의 인접한 어구가 취득될 수 있는데, 인접한 어구는 앞뒤의 어구를 포함한다.
예를 들어, 타겟 어구 "BNU"를 포함하는 주소명 "BNU Bookstore"에 있어서, 타겟 어구 앞의 어구는 "null"이고(즉, 타겟 어구 앞의 어구가 없다), 뒤의 어구는 "Bookstore"이다. 또 다른 예로서, 타겟 어구 "BNU"를 포함하는 주소명 "Bowen BNU Bookstore"에 있어서, 타겟 어구 앞의 어구는 "Bowen"이고, 뒤의 어구는 "Bookstore"이다. 통계 수집 후에, 타겟 어구를 포함하는 모든 주소명에 있어서, 앞에서 열거한 "null", "Bookstore", "Bowen" 및 "Bookstore" 등의, 타겟 어구의 인접 어구는 복수 개 있을 수 있다. 인접 어구가 4개뿐이라고 하면(실제로는 인접 어구가 더 많을 수 있음), 4개의 어구 각각은 타겟 어구의 어구 상태 벡터의 벡터 차원에 대응할 수 있고, 벡터 (null, Bookstore, Bowen, Bookstore)는 4차원 벡터이다.
어구의 차원 값은 주소명에 그 어구가 등장하는 빈도일 수 있다. 예로서, "Bookstore"를 사용하기로 한다. 단계 102에서 10개의 주소명이 취득된다고 하고, "Bookstore"가 2회 등장한다고 하면, "Bookstore"의 빈도 또는 차원 값은 2이다. 다른 차원 값도 마찬가지로 산출될 수 있으며, 다시 설명하지는 않는다.
단계 104: POI의 전체 명칭의 어구 상태 벡터와 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출.
예를 들어, POI의 전체 명칭의 어구 상태 벡터와 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터가 단계 103에서 산출된 후에, POI의 전체 명칭의 어구 상태 벡터와 평가될 각 축약 명칭의 어구 상태 벡터 간의 유사도가 산출된다. 이 예에서 산출되는 유사도는 코사인 유사도(cosine similarity)일 수 있다.
도 2를 참조하면, 도 2는 2차원 공간에서의 코사인 유사도의 산출을 보여주며, a와 b는 2개의 2차원 벡터이다. a의 좌표가 (x1, y1)이고, b의 좌표가 (x2, y2)인 것으로 한다. 두 벡터는 도 2에 도시하는 바와 같이, 좌표값에 기초하여 벡터 공간에 그려진다. 그런 다음 두 2차원 벡터 a와 b 간의 각도에 대응하는 코사인값이 산출되고, 그 코사인값은 두 벡터 간의 유사도를 나타내는데 사용될 수 있다. 두 벡터가 더 유사할수록, 두 벡터 간의 각도가 더 작고, 코사인값은 1에 가까울 것이며, 이들의 방향은 더 유사할 것이다.
각도의 코사인값은 다음과 같이 표현되는 벡터 내적식(vector dot product equation)에 기초하여 산출된다.
Figure 112018076247896-pct00001
앞의 식은 확장되어 다차원 벡터 간의 코사인 유사도를 산출할 수 있다. POI의 전체 명칭의 어구 상태 벡터가 A = (A1, A2, ..., An)이고, 평가될 축약 명칭들 중 하나의 어구 상태 벡터가 (B1, B2, ..., Bn)이면, 두 벡터 간의 코사인 유사도는 다음과 같이 산출된다.
Figure 112018076247896-pct00002
단계 105: 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을 POI의 전체 명칭에 대응하는 POI의 축약 명칭으로서 결정한다.
예를 들어, 미리 정해진 임계치가 0.42이면, 코사인 유사도의 산출값이 0.42 이상인 경우, 그 유사도에 대응하는 평가될 축약 명칭은 POI의 전체 명칭에 대응하는 POI의 축약 명칭으로서 결정될 수 있다. 예를 들어, POI의 전체 명칭 "Beijing Normal University"의 어구 상태 벡터 A와 축약 명칭 중 하나인 "BNU"의 어구 상태 벡터 B 간의 코사인 유사도가 0.7이라면, 축약 명칭 BNU"이 전체 명칭 "Beijing Normal University"의 축약 명칭으로서 사용된다고 결정될 수 있다.
이 예에서는, 미리 정해진 임계치보다 큰 축약 명칭이 적어도 하나 있다. 예를 들어, 전체 명칭 "Beijing Normal University"의 축약 명칭은 "BNU", "BN", 및 "Beijing Normal" 등의 복수의 축약 명칭들을 포함할 수 있다.
맵 상에서 POI의 축약 명칭을 취득하는 방법에 있어서, POI의 전체 명칭이 제공될 때에, POI 근처의 관련된 주소명이 맵 어드레스 라이브러리로부터 자동으로 취득될 수 있고, 축약 명칭을 자동으로 결정으로 결정하기 위하여, 그 주소에 기초하여 가능한 모든 축약 명칭 중의 축약 명칭이 산출될 수 있다. 이와 같이, 축약 명칭을 취득하는 효율이 향상될 수 있다. 또한, 프로세싱 속도를 더욱 높이기 위하여 상기 방법은 분산형 컴퓨팅 플랫폼 상에서 수행될 수 있다.
POI의 전체 명칭과 축약 명칭 간의 매핑 관계가 결정된 후에, 그 매핑 관계는 맵 상에서의 POI 또는 주소 입력과 관련된 다른 시나리오를 검색하는데 사용될 수 있다. 예를 들어, 사용자가 "Dongwai Avenue"를 입력할 경우, 전체 명칭과 축약 명칭의 비교를 통해, "Dongwai Avenue"의 전체 명칭이 "Dongzhimen Avenue"인 것을 알 수 있다. 그런 다음, 사용자에게 Dongzhimen Avenue의 입력 여부를 물을 수 있다. 또한, Dongzhimen Avenue에 관한 후속의 가능한 상세 주소, 예컨대 Dongzhimen Avenue 근처의 레스토랑 및 호텔과 같은 주소는 사용자가 선택할 수 있는 자동 완성 옵션으로서 제공된다.
본원의 구현예는 또한 맵 상에서 POI의 축약 명칭을 취득하는 장치를 제공한다. 도 3에 도시하는 바와 같이, 상기 장치는 평가 대상 축약 명칭 생성 모듈(31), 관련 주소 취득 모듈(32), 어구 상태 산출 모듈(33), 유사도 산출 모듈(34), 및 축약 명칭 결정 모듈(35)을 포함할 수 있다.
평가 대상 축약 명칭 생성 모듈(31)은 맵 상에서의 POI의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성하도록 구성된다.
관련 주소 취득 모듈(32)은 POI의 미리 정해진 영역으로부터, POI의 전체 명칭 또는 평가될 축약 명칭들 중 어느 하나를 포함하는 복수의 주소명을 취득하도록 구성된다.
어구 상태 산출 모듈(33)은 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출하도록 구성되며, 여기서 어구 상태 벡터는 주소명에서 타겟 어구의 위치 상태를 나타내는데 사용되고, 타겟 어구는 POI의 전체 명칭 또는 평가될 축약 명칭들 중 어느 하나이다.
유사도 산출 모듈(34)은 POI의 전체 명칭의 어구 상태 벡터와 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하도록 구성된다.
축약 명칭 결정 모듈(35)은 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을, POI의 전체 명칭에 대응하는 POI의 축약 명칭으로서 결정하도록 구성된다.
일례에 있어서, 맵 상에서의 POI의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성할 때에, 평가 대상 축약 명칭 생성 모듈(31)은, POI의 전체 명칭에 포함된 단일 단어들을 단일 단어 배열 순서로 조합하여, 임의 개의 단일 단어들의 조합을 형성하며―각 조합은 축약 명칭이고, 복수의 축약 명칭들이 취득됨―, 평가 대상 축약 명칭 생성 모듈(31)은 또한, 복수의 축약 명칭들 중에서, 비(non)POI의 축약 명칭으로서 결정된 단일 단어 및 노이즈 어구를 제거하도록 구성되며, 잔여 축약 명칭은 평가될 축약 명칭이다.
일례에 있어서, 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출할 때에, 어구 상태 산출 모듈(33)은 복수의 주소명 중 어느 하나로부터 타겟 어구의 인접 어구를 취득하고, 각 인접 어구가 복수의 주소명에 등장하는 빈도를, 타겟 어구의 어구 상태 벡터의 벡터 차원의 차원 값으로서 사용하도록 구성된다.
일례에 있어서, 유사도 산출 모듈(34)은 POI의 전체 명칭의 어구 상태 벡터와 평가될 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 코사인 유사도를 산출하도록 구성된다.
일례에 있어서, 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭은 적어도 하나 있다.
당업자라면 명세서를 고려하고 본 개시내용을 실시한 후에 본 개시내용의 다른 구현 솔루션도 쉽게 이해할 수 있다. 본원은 본 개시내용의 임의의 변형, 기능 또는 적응적 변경을 포함하는 것이 의도된다. 이들 변형, 기능 또는 적응적 변경은 본 개시내용의 일반적인 원리를 따르며, 본원에 개시하지 않는 기술 분야에서의 통상적 지식 또는 통상적으로 사용되는 기술적 수단을 포함한다. 명세서 및 구현예는 예시로서만 고려되어야 하며, 본 개시내용의 실제 범위 및 사상은 다음의 청구범위에서 기술된다.
본 개시내용은 전술하고 첨부 도면에 도시하는 구조에 제한되지 않으며, 본 개시내용의 범위를 벗어나지 않고서 수정 및 변경이 이루어질 수 있음을 이해해야 한다. 본 개시내용의 보호 범위는 첨부하는 청구범위에 의해 정해진다.

Claims (10)

  1. 컴퓨터로 구현되는(computer-implemented) 방법에 있어서,
    전자 맵 상에서 관심 지점(POI, point of interest)의 축약 명칭을 취득하는 단계로서,
    상기 전자 맵 상에서의 POI의 전체 명칭(full name)에 기초하여 평가될 복수의 축약 명칭(abbreviated name)들을 생성하는 단계와,
    상기 POI의 미리 정해진 거리 내의 영역으로부터, 상기 POI의 전체 명칭 또는 상기 평가될 복수의 축약 명칭들 중 어느 하나를 포함하는 복수의 주소명을 취득하는 단계와,
    상기 주소명에 기초하여 타겟 어구의 어구 상태 벡터(phase status vector)를 산출하는 단계―상기 어구 상태 벡터는 상기 주소명에서 상기 타겟 어구의 위치 상태를 나타내는데 사용되고, 상기 타겟 어구는 상기 POI의 전체 명칭 또는 상기 평가될 복수의 축약 명칭들 중 어느 하나임―와,
    상기 POI의 전체 명칭의 어구 상태 벡터와 상기 평가될 복수의 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하는 단계와,
    미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭을, 상기 POI의 전체 명칭에 대응하는 상기 POI의 축약 명칭으로서 결정하는 단계
    를 포함하는, 상기 축약 명칭을 취득하는 단계;
    상기 POI의 전체 명칭 및 상기 POI의 결정된 축약 명칭 간의 매핑 관계를 결정하는 단계;
    상기 POI의 축약 명칭을 포함하는 주소 검색 질의(query)를 전자 맵 사용자로부터 수신하는 단계;
    상기 매핑 관계를 사용하여 상기 POI의 전체 명칭을 식별하는 단계; 및
    상기 POI의 식별된 전체 명칭에 대응하는 주소를 상기 전자 맵 사용자에게 제공하는 단계
    를 포함하는, 컴퓨터로 구현되는 방법.
  2. 제1항에 있어서, 상기 전자 맵 상에서의 POI의 전체 명칭에 기초하여 평가될 복수의 축약 명칭들을 생성하는 단계는,
    상기 POI의 전체 명칭에 포함되는 단일 단어들을 단일 단어 배열 순서로 조합하여 임의 개의 단일 단어들의 조합을 형성하는 단계―각 조합은 축약 명칭이고, 복수의 축약 명칭들이 취득됨―와,
    상기 POI를 검색할 때 전자 맵 사용자가 입력하지 않을 하나 이상의 단일 단어 또는 노이즈 어구를 식별하는 것을 포함하는, 상기 POI의 축약 명칭들이 아닌 하나 이상의 단일 단어와 노이즈 어구를 결정하는 단계와,
    상기 복수의 축약 명칭들 중에서, 상기 결정된 단일 단어 및 노이즈 어구를 제거하는 단계를 포함하고, 남은 축약 명칭은 상기 평가될 축약 명칭인 것인 컴퓨터로 구현되는 방법.
  3. 제1항에 있어서, 상기 주소명에 기초하여 타겟 어구의 어구 상태 벡터를 산출하는 단계―상기 어구 상태 벡터는 상기 주소명에서 상기 타겟 어구의 위치 상태를 나타내는데 사용됨―는,
    상기 복수의 주소명 중 어느 하나로부터 상기 타겟 어구의 인접 어구를 취득하는 단계와,
    상기 복수의 주소명에 각 인접 어구가 등장하는 빈도를, 상기 타겟 어구의 어구 상태 벡터의 벡터 차원의 차원 값으로서 사용하는 단계를 포함하는 것인 컴퓨터로 구현되는 방법.
  4. 제1항에 있어서, 상기 POI의 전체 명칭의 어구 상태 벡터와 상기 평가될 복수의 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 유사도를 개별적으로 산출하는 단계는,
    상기 POI의 전체 명칭의 어구 상태 벡터와 상기 평가될 복수의 축약 명칭들 중 어느 하나의 어구 상태 벡터 간의 코사인 유사도(cosine similarity)를 산출하는 단계를 포함하는 것인 컴퓨터로 구현되는 방법.
  5. 제1항에 있어서, 상기 미리 정해진 임계치보다 큰 유사도에 대응하는 평가될 축약 명칭은 적어도 하나 존재하는 것인 컴퓨터로 구현되는 방법.
  6. 제1항에 있어서, 전자 맵 사용자에게, 상기 전자 맵 사용자가 상기 POI의 식별된 전체 명칭을 후속 주소 검색 질의로서 입력하기를 원하는지 여부를 묻는 프롬프트를 제공하는 단계를 더 포함하는 컴퓨터로 구현되는 방법.
  7. 제6항에 있어서,
    상기 결정된 POI의 대응하는 전체 명칭에 관련된 주소를 포함하는 하나 이상의 사용자 선택 가능한 자동 완성 옵션을 상기 전자 맵 사용자에게 제공하는 단계를 더 포함하는 컴퓨터로 구현되는 방법.
  8. 제1항 내지 제7항 중 어느 한 항에 기재된 방법을 수행하도록 구성된 복수의 모듈을 포함하는 장치.
  9. 삭제
  10. 삭제
KR1020187022277A 2016-01-11 2017-01-03 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치 KR102157428B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201610015852.7 2016-01-11
CN201610015852.7A CN106959958B (zh) 2016-01-11 2016-01-11 地图兴趣点简称获取方法和装置
PCT/CN2017/000018 WO2017121262A1 (zh) 2016-01-11 2017-01-03 地图兴趣点简称获取方法和装置

Publications (2)

Publication Number Publication Date
KR20180101443A KR20180101443A (ko) 2018-09-12
KR102157428B1 true KR102157428B1 (ko) 2020-09-18

Family

ID=59310764

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187022277A KR102157428B1 (ko) 2016-01-11 2017-01-03 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치

Country Status (10)

Country Link
US (2) US10816355B2 (ko)
EP (1) EP3404559A4 (ko)
JP (1) JP6877464B2 (ko)
KR (1) KR102157428B1 (ko)
CN (1) CN106959958B (ko)
MY (1) MY192478A (ko)
PH (1) PH12018501475A1 (ko)
SG (1) SG11201805938XA (ko)
TW (1) TWI661317B (ko)
WO (1) WO2017121262A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106959958B (zh) * 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN107491537A (zh) * 2017-08-23 2017-12-19 北京百度网讯科技有限公司 Poi数据挖掘、信息检索方法、装置、设备及介质
CN108171529B (zh) * 2017-12-04 2021-09-14 昆明理工大学 一种地址相似度评估方法
CN110008300B (zh) * 2019-04-11 2021-07-09 北京百度网讯科技有限公司 Poi别名的确定方法、装置、计算机设备和存储介质
CN110543593B (zh) * 2019-08-01 2021-04-09 北京三快在线科技有限公司 数据处理方法、装置、电子设备及可读存储介质
CN111026937B (zh) * 2019-11-13 2021-02-19 百度在线网络技术(北京)有限公司 提取poi名称的方法、装置、设备和计算机存储介质
CN113495997B (zh) * 2020-04-01 2024-08-06 北京四维图新科技股份有限公司 Poi别名的探索方法、装置和车辆
CN112001172A (zh) * 2020-08-25 2020-11-27 杭州橙鹰数据技术有限公司 识别方法及装置
WO2022131740A1 (en) * 2020-12-14 2022-06-23 Samsung Electronics Co., Ltd. Methods and systems for generating abbreviations for a target word
CN113515944A (zh) * 2021-03-23 2021-10-19 汉海信息技术(上海)有限公司 兴趣点的别名挖掘方法、装置、设备及存储介质
CN113688628B (zh) * 2021-07-28 2023-09-22 上海携宁计算机科技股份有限公司 文本识别方法、电子设备和计算机可读存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070185650A1 (en) 2006-02-04 2007-08-09 Tatsuo Yokota Method and apparatus for searching point of interest by name or phone number
JP5103051B2 (ja) 2007-04-17 2012-12-19 株式会社日立製作所 情報処理システム及び情報処理方法
JP2014199580A (ja) 2013-03-29 2014-10-23 富士通株式会社 略称生成方法および略称生成装置

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS513051B1 (ko) 1969-04-04 1976-01-30
CN100559463C (zh) * 2002-11-11 2009-11-11 松下电器产业株式会社 声音识别用辞典编制装置和声音识别装置
US20070220037A1 (en) * 2006-03-20 2007-09-20 Microsoft Corporation Expansion phrase database for abbreviated terms
KR100849497B1 (ko) * 2006-09-29 2008-07-31 한국전자통신연구원 온톨로지 매핑을 이용한 단백질 이름 정규화 방법
US8892455B2 (en) * 2007-09-28 2014-11-18 Walk Score Management, LLC Systems, techniques, and methods for providing location assessments
JP4953459B2 (ja) * 2008-03-11 2012-06-13 ヤフー株式会社 文字ベクトルを用いた略語生成装置、方法及びプログラム
US8401771B2 (en) * 2008-07-22 2013-03-19 Microsoft Corporation Discovering points of interest from users map annotations
KR101590624B1 (ko) * 2009-02-20 2016-02-03 팅크웨어(주) 관심지점 시설물의 대표화 장치 및 그 방법
CN102460430B (zh) * 2009-04-29 2014-02-19 谷歌公司 简短兴趣点标题生成
US8583638B2 (en) * 2009-08-27 2013-11-12 Apple Inc. Adaptive mapping of search results
US8510348B2 (en) * 2010-03-03 2013-08-13 Wgrs Licensing Company, Llc Systems and methods for creating and using imbedded shortcodes and shortened physical and internet addresses
CN102789473A (zh) * 2011-05-18 2012-11-21 国际商业机器公司 标识符检索方法和设备
US8521539B1 (en) * 2012-03-26 2013-08-27 Nuance Communications, Inc. Method for chinese point-of-interest search
CN103390004B (zh) * 2012-05-11 2018-03-02 北京百度网讯科技有限公司 一种语义冗余的确定方法和装置、对应的搜索方法和装置
CN103514199A (zh) * 2012-06-25 2014-01-15 高德软件有限公司 Poi数据处理方法及其装置、poi检索方法及其装置
CN103885950B (zh) * 2012-12-19 2017-07-28 高德软件有限公司 一种获取缩略词与poi间对应关系的方法和装置
US9123259B2 (en) * 2013-03-14 2015-09-01 Microsoft Technology Licensing, Llc Discovering functional groups of an area
CN104216895B (zh) * 2013-05-31 2018-01-30 高德软件有限公司 一种生成poi数据的方法及装置
CN104035948B (zh) * 2013-09-29 2016-04-06 腾讯科技(深圳)有限公司 地理位置显示方法及装置
CN105808609B (zh) * 2014-12-31 2020-04-14 高德软件有限公司 一种信息点数据冗余的判别方法和设备
CN104933171B (zh) * 2015-06-30 2019-06-18 百度在线网络技术(北京)有限公司 兴趣点数据关联方法和装置
CN105224660A (zh) * 2015-09-30 2016-01-06 北京奇虎科技有限公司 一种地图兴趣点poi数据的处理方法和装置
CN106959958B (zh) 2016-01-11 2020-04-07 阿里巴巴集团控股有限公司 地图兴趣点简称获取方法和装置
CN106909600A (zh) * 2016-07-07 2017-06-30 阿里巴巴集团控股有限公司 用户背景信息的收集方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070185650A1 (en) 2006-02-04 2007-08-09 Tatsuo Yokota Method and apparatus for searching point of interest by name or phone number
JP5103051B2 (ja) 2007-04-17 2012-12-19 株式会社日立製作所 情報処理システム及び情報処理方法
JP2014199580A (ja) 2013-03-29 2014-10-23 富士通株式会社 略称生成方法および略称生成装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
양승원 외 2인, POI 이형태 데이타베이스 구축 시스템, 정보과학회논문지: 소프트웨어 및 응용 36(2), 2009.3. 226-235페이지.*

Also Published As

Publication number Publication date
JP2019503025A (ja) 2019-01-31
PH12018501475A1 (en) 2019-03-11
CN106959958B (zh) 2020-04-07
US20210055124A1 (en) 2021-02-25
EP3404559A1 (en) 2018-11-21
MY192478A (en) 2022-08-23
US11255690B2 (en) 2022-02-22
JP6877464B2 (ja) 2021-05-26
US20180335313A1 (en) 2018-11-22
TW201740289A (zh) 2017-11-16
KR20180101443A (ko) 2018-09-12
SG11201805938XA (en) 2018-08-30
US10816355B2 (en) 2020-10-27
EP3404559A4 (en) 2019-08-21
TWI661317B (zh) 2019-06-01
WO2017121262A1 (zh) 2017-07-20
CN106959958A (zh) 2017-07-18

Similar Documents

Publication Publication Date Title
KR102157428B1 (ko) 맵 상에서 관심 지점의 축약 명칭을 취득하는 방법 및 장치
CA2909524C (en) A method and apparatus for identifying and communicating locations
US20210360368A1 (en) Indoor Positioning Method, Indoor Positioning System, Indoor Positioning Apparatus and Computer Readable Medium
US20130132438A1 (en) Systems, methods, and computer program products for searching for space of interest (SOI)
EP2991037B1 (en) Method of generating three-dimensional scene model
JP2019503025A5 (ko)
JP6136702B2 (ja) 場所推定方法、場所推定装置および場所推定プログラム
CN105608113B (zh) 判断文本中poi数据的方法及装置
CN113359986B (zh) 增强现实数据展示方法、装置、电子设备及存储介质
US9098107B2 (en) Proximity determination method, proximity determination device, and proximity determination system
US20150371430A1 (en) Identifying Imagery Views Using Geolocated Text
US20210319605A1 (en) Generating simplified map shapes
CN110928964A (zh) 行政区域定位方法、装置、计算机设备及存储介质
WO2016192284A1 (zh) 一种用于获取地图中的候选地址信息的方法和装置
JPWO2017104043A1 (ja) 画像処理装置、画像検索インタフェース表示装置、及び画像検索インタフェースの表示方法
CN107621265A (zh) 一种用于进行室内导航的方法和装置
KR101642598B1 (ko) 공간 분할 방법, 공간 분할 장치 및 기억 매체
CN106568435A (zh) 一种室内定位方法及系统
KR102054211B1 (ko) 이미지 쿼리 기반의 영상 검색 방법 및 시스템
JP7435907B2 (ja) 画像マッチング装置、制御方法、及びプログラム
Bhattacharyya et al. Effective GIS Mobile Query System
CN118760796A (zh) 地址落位方法和装置
OA17572A (en) A method and apparatus for identifying and communicating locations.

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right