KR102185703B1 - 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치 - Google Patents

공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치 Download PDF

Info

Publication number
KR102185703B1
KR102185703B1 KR1020190040174A KR20190040174A KR102185703B1 KR 102185703 B1 KR102185703 B1 KR 102185703B1 KR 1020190040174 A KR1020190040174 A KR 1020190040174A KR 20190040174 A KR20190040174 A KR 20190040174A KR 102185703 B1 KR102185703 B1 KR 102185703B1
Authority
KR
South Korea
Prior art keywords
group
semantic
spatial
keyword
query
Prior art date
Application number
KR1020190040174A
Other languages
English (en)
Other versions
KR20200117691A (ko
Inventor
이경호
김웅남
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020190040174A priority Critical patent/KR102185703B1/ko
Publication of KR20200117691A publication Critical patent/KR20200117691A/ko
Application granted granted Critical
Publication of KR102185703B1 publication Critical patent/KR102185703B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Remote Sensing (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 실시예들은 사용자가 요구하는 위치, 복수의 공간 키워드, 및 출력 결과의 개수를 제한하는 집단 키워드 질의를 통하여 유효 그룹의 키워드 관련도 및 공간적 근접도를 측정하도록 랭킹 함수를 설계함으로써, 집단적으로 질의 키워드를 커버하여 사용자의 요구사항을 높은 확률로 만족시키는 공간 영역을 검색할 수 있는 집단 키워드 질의 처리 방법 및 장치를 제공한다.

Description

공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치 {Method and Apparatus for Processing Group Keyword Query Based on Spatial Knowledge Base}
본 실시예가 속하는 기술 분야는 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치에 관한 것이다.
이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.
지식 공유 커뮤니티의 증가 및 자동 정보 추출 기술의 발전에 따라 대규모 지식 베이스가 구축되고 있다. 예컨대 DBpedia, YAGO, Freebase 등의 지식 베이스는 방대한 양의 고품질의 의미적 데이터(Semantic Data)를 유지관리하고 의미적 데이터는 WWW 표준인 RDF 데이터 모델을 준수한다.
지식 베이스는 공간 데이터로 보강되고 있다. DBpedia의 11%은 공간 데이터를 포함하고 YAGO2의 59%는 공간 데이터를 포함한다. 공간 데이터의 증가는 지식 그래프를 대상으로 위치 기반 질의를 수행 가능하게 한다.
GeoSPARQL은 의미적 웹(Semantic Web) 상의 공간 데이터를 위한 표준 질의 언어이다. GeoSPARQL과 같은 구조적인 언어는 사용자가 질의 언어의 문법 및 대상 데이터의 스키마를 숙지해야 하는 문제가 있다.
한국공개공보 제10-2012-0104650호 (2012.09.24)
본 발명의 실시예들은 사용자가 요구하는 위치, 공간 키워드, 및 출력 결과의 개수를 제한하는 집단 키워드 질의를 통하여 유효 그룹의 키워드 관련도 및 공간적 근접도를 측정하도록 랭킹 함수를 설계함으로써, 집단적으로 질의 키워드를 커버하여 사용자의 요구사항을 높은 확률로 만족시키는 공간 영역을 검색하는 데 주된 목적이 있다.
본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.
본 실시예의 일 측면에 의하면, 컴퓨팅 디바이스에 의한 집단 키워드 질의 처리 방법에 있어서, 공간 지식 그래프를 위한 집단 키워드 질의를 획득하는 단계, 및 상기 집단 키워드 질의를 기반으로 랭킹 점수를 갖는 유효 그룹을 출력하는 단계를 포함하는 것을 특징으로 하는 집단 키워드 질의 처리 방법을 제공한다.
본 실시예의 다른 측면에 의하면, 하나 이상의 프로세서 및 상기 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하는 집단 키워드 질의 처리 장치에 있어서, 상기 프로세서는 공간 지식 그래프를 위한 집단 키워드 질의를 획득하고, 상기 프로세서는 상기 집단 키워드 질의를 기반으로 랭킹 점수를 갖는 유효 그룹을 출력하는 것을 특징으로 하는 집단 키워드 질의 처리 장치를 제공한다.
이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 사용자가 요구하는 위치, 복수의 공간 키워드, 및 출력 결과의 개수를 제한하는 집단 키워드 질의를 통하여 유효 그룹의 키워드 관련도 및 공간적 근접도를 측정하도록 랭킹 함수를 설계함으로써, 집단적으로 질의 키워드를 커버하여 사용자의 요구사항을 높은 확률로 만족시키는 공간 영역을 검색할 수 있는 효과가 있다.
여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.
도 1은 본 발명의 일 실시예에 따른 집단 키워드 질의 처리 장치를 예시한 블록도이다.
도 2는 의미적 장소를 예시한 지도이다.
도 3은 유효 그룹 1 및 유효 그룹 2를 예시한 지도이다.
도 4는 RDF 데이터를 예시한 도면이다.
도 5는 본 발명의 다른 실시예에 따른 집단 키워드 질의 처리 방법을 예시한 흐름도이다.
도 6은 본 발명의 다른 실시예에 따른 집단 키워드 질의 처리 방법에서 랭킹 점수를 갖는 유효 그룹을 출력하는 단계를 예시한 흐름도이다.
이하, 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하고, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 집단 키워드 질의 처리 장치를 예시한 블록도이다.
집단 키워드 질의 처리 장치(110)는 적어도 하나의 프로세서(120), 컴퓨터 판독 가능한 저장매체(130) 및 통신 버스(170)를 포함한다.
프로세서(120)는 집단 키워드 질의 처리 장치(110)로 동작하도록 제어할 수 있다. 예컨대, 프로세서(120)는 컴퓨터 판독 가능한 저장 매체(130)에 저장된 하나 이상의 프로그램들을 실행할 수 있다. 하나 이상의 프로그램들은 하나 이상의 컴퓨터 실행 가능 명령어를 포함할 수 있으며, 컴퓨터 실행 가능 명령어는 프로세서(120)에 의해 실행되는 경우 집단 키워드 질의 처리 장치(110)로 하여금 예시적인 실시예에 따른 동작들을 수행하도록 구성될 수 있다.
컴퓨터 판독 가능한 저장 매체(130)는 컴퓨터 실행 가능 명령어 내지 프로그램 코드, 프로그램 데이터 및/또는 다른 적합한 형태의 정보를 저장하도록 구성된다. 컴퓨터 판독 가능한 저장 매체(130)에 저장된 프로그램(140)은 프로세서(120)에 의해 실행 가능한 명령어의 집합을 포함한다. 일 실시예에서, 컴퓨터 판독한 가능 저장 매체(130)는 메모리(랜덤 액세스 메모리와 같은 휘발성 메모리, 비휘발성 메모리, 또는 이들의 적절한 조합), 하나 이상의 자기 디스크 저장 디바이스들, 광학 디스크 저장 디바이스들, 플래시 메모리 디바이스들, 그 밖에 집단 키워드 질의 처리 장치(110)에 의해 액세스되고 원하는 정보를 저장할 수 있는 다른 형태의 저장 매체, 또는 이들의 적합한 조합일 수 있다.
통신 버스(170)는 프로세서(120), 컴퓨터 판독 가능한 저장 매체(140)를 포함하여 집단 키워드 질의 처리 장치(110)의 다른 다양한 컴포넌트들을 상호 연결한다.
집단 키워드 질의 처리 장치(110)는 또한 하나 이상의 입출력 장치(24)를 위한 인터페이스를 제공하는 하나 이상의 입출력 인터페이스(150) 및 하나 이상의 통신 인터페이스(160)를 포함할 수 있다. 입출력 인터페이스(150) 및 통신 인터페이스(160)는 통신 버스(170)에 연결된다. 입출력 장치(미도시)는 입출력 인터페이스(150)를 통해 집단 키워드 질의 처리 장치(110)의 다른 컴포넌트들에 연결될 수 있다.
집단 키워드 질의 처리 장치(110)는 공간 지식 베이스 또는 공간 지식 그래프를 대상으로 키워드 기반의 공간 질의인 kSP(top-k Semantic Place Retrieval)를 활용한다. kSP 질의는 공간 정점을 루트로 하는 서브 트리인 의미적 장소(Semantic Place, SP)를 찾는다.
의미적 장소는 사용자 질의의 모든 키워드를 포함하면서 랭킹 함수의 값을 최소화하여야 한다. 랭킹 함수는 그룹 내 하나의 공간 오브젝트에서 출발하여 기타 공간 오브젝트를 모두 방문하는데 소요하는 최단 거리, 즉 허브 기반 거리를 측정한다.
하지만 실제 공간에서 하나의 의미적 장소가 복수의 키워드를 모두 포함할 확률은 희박하고, 의미적 장소가 사용자가 요구한 위치 근처에 존재할 확률은 더욱 희박하다. 만약 출력한 그룹에 속하는 장소가 서로 인접하더라도 사용자가 요구하는 위치와는 멀리 떨어져 있을 수 있다.
비 의미적 데이터를 대상으로 검색하는 방식은 사용자가 '음식점'이라고 키워드를 입력했을 때 '한식집'이라는 키워드를 포함하고 있는 장소를 후보로 선정할 수 없어서 결과의 정확도가 높지 않다.
공간 정보가 사용자의 모든 키워드를 포함하지 않는 문제를 해결하기 위해서 집단 키워드 질의 처리 장치(110)는 사용자가 요구하는 위치, 복수의 공간 키워드, 및 출력 결과의 개수를 제한하는 집단 키워드 질의를 통하여 유효 그룹의 키워드 관련도 및 공간적 근접도를 측정하도록 랭킹 함수를 설계함으로써, 집단적으로 질의 키워드를 커버하여 사용자의 요구사항을 높은 확률로 만족시키는 공간 영역을 검색한다.
도 2 내지 도 4를 참조하여 장소 검색 시나리오를 설명하기로 한다.
도 2는 의미적 장소를 예시한 지도이고, 도 3은 유효 그룹 1 및 유효 그룹 2를 예시한 지도이고, 도 4는 RDF 데이터를 예시한 도면이다.
뉴욕 시티와 같은 특정 공간 영역에서 식당(Restaurant), 호텔(Hotel), 공원(Park), 및 박물관(Museum)을 찾을 때, 각각의 장소는 서로 인접하고 지하철역에서 멀지 않아야 한다.
도 2에서는 RDF(Resource Description Framework) 그래프에 기반한 키워드 {Restaurant, Hotel, Park, Museum}를 적어도 하나 포함하는 장소(p)가 41개 도시되어 있다.
도 3에 도시된 유효 그룹 1(vg1)은 p1(Hotel), p2(Restaurant), p3(Park), p4(Museum)를 포함하고, 유효 그룹 2(vg2)는 p5(Hotel), p6(Park), p7(Restaurant, Museum)을 포함한다.
적합한 장소를 선택하기 위해서 집단 키워드 질의 처리 장치(110)는 키워드 관련도 및 공간적 근접도를 기준으로 유효 그룹을 평가한다. 집단 키워드 질의 처리 장치(110)는 지식 베이스 내의 정점 사이의 관계를 분석하고 허브 기반의 최대합(MaxSum) 거리를 산출하고, 질의 위치를 인식하여 공간적 근접도를 산출한다.
Figure 112019035196008-pat00001
표 1을 참조하면, 유효 그룹 2는 유효 그룹 1보다 작은 허브 기반의 최대합 거리 값을 갖는다. 유효 그룹 1은 유효 그룹 2보다 작은 쌍방 거리 값을 갖는다. 유효 그룹 1에서 장소의 개수(Cardinality)는 유효 그룹 2보다 크다.
집단 키워드 질의 처리 장치(110)는 최단 경로의 길이(Length of Shortest Path, LSP)를 누적하여 키워드 관련도를 산출한다. 도 4를 참조하면, 유효 그룹 1의 키워드 관련도는 (1+1+1+1)+1=5 이고, 유효 그룹 2의 키워드 관련도는 (1+1+2)+1=5 이다. p7의 최단 경로의 길이는 2이고 나머지는 1이다.
집단 키워드 질의 처리 장치(110)는 의미적 장소, 질의 거리, 장소의 개수, 쌍방 거리를 종합적으로 평가하여 키워드 관련도 및 공간적 근접도의 관계를 기반으로 유효 그룹 2를 출력한다. 사용자 입장에서 이동 거리가 가까운 유효 그룹 2가 유효 그룹 1보다 정답에 가깝다.
도 5는 본 발명의 다른 실시예에 따른 집단 키워드 질의 처리 방법을 예시한 흐름도이다. 집단 키워드 질의 처리 방법은 컴퓨팅 디바이스에 의하여 수행될 수 있으며, 집단 키워드 질의 처리 장치와 동일한 방식으로 동작한다.
집단 키워드 질의 처리 방법은 하나의 공간 지식 베이스 및 질의를 입력으로 받고, Top k 랭킹 점수를 갖는 유효 그룹을 출력한다.
단계 S210에서 프로세서는 공간 지식 그래프를 위한 집단 키워드 질의를 획득한다. 집단 키워드 질의(q)는 (i) 질의 장소(q.λ), (ii) 복수의 의미적 공간 키워드(q.
Figure 112019035196008-pat00002
), 및 (iii) 유효 그룹의 선별 개수(k)를 포함한다.
단계 S210에서 프로세서는 집단 키워드 질의를 기반으로 랭킹 점수를 갖는 유효 그룹을 출력한다. 유효 그룹은 의미적 장소 정보의 집합으로 각각의 의미적 장소 정보가 모여 전체 키워드의 조건을 최대한 만족시킨다. 의미적 장소 정보는 공간 지식 그래프의 서브 트리(
Figure 112019035196008-pat00003
)를 의미하고, 공간 지식 그래프는 의미적 공간 키워드를 포함한다.
유효 그룹을 출력하는 단계(S210)는, 키워드 관련도 및 공간적 근접도를 기준으로 유효 그룹을 평가하는 랭킹 함수를 이용하여 복수의 의미적 공간 키워드 중에서 적어도 일부를 만족하는 의미적 장소 정보의 위치를 검색한다. 낮은 랭킹 점수를 갖는 유효 그룹은 사용자의 요구사항에 매칭한 확률이 높다.
랭킹 함수 f는 수학식 1과 같이 표현된다.
Figure 112019035196008-pat00004
수학식 1에서 랭킹 함수는 키워드 관련도 및 공간적 근접도의 곱으로 정의된다. kr은 키워드 관련도(Keyword Relevance)이고, sd는 공간적 근접도(Spatial Distance)이다. vg은 유효 그룹(Valid Group)이고, q는 질의(query)이다.
키워드 관련도는 수학식 2와 같이 표현된다.
Figure 112019035196008-pat00005
키워드 관련도는 유효 그룹에 속하는 의미적 장소 정보마다 의미적 공간 키워드에 대한 최단 경로의 길이(LSP)의 합으로 산출된다. 최단 경로의 길이는 RDF 그래프에서 관련된 의미적 장소에 매칭하는 깊이를 의미한다. 키워드 관련도가 0이 되지 않도록 키워드 관련도에 1을 가산한다.
공간적 근접도는 (i) 유효 그룹 내의 의미적 장소 정보 및 질의 장소 간의 질의 거리, (ii) 유효 그룹 내의 의미적 장소 정보의 개수, 및 (iii) 유효 그룹 내의 의미적 장소 정보 간의 쌍방 거리를 기반으로 산출된다. 공간적 근접도는 수학식 3과 같이 표현된다.
Figure 112019035196008-pat00006
공간적 근접도는 제1 거리와 제2 거리의 합으로 정의된다. 제1 거리는 유효 그룹에 속하는 의미적 장소 정보 및 질의 장소 간의 최대 거리이고, 제2 거리는 유효 그룹에 속하는 의미적 장소 정보 간의 최대 쌍방 거리에 의미적 장소 정보의 개수에서 1을 감산한 값을 곱한 값이다. |vg|는 의미적 장소 정보의 개수(Cardinality)이다.
최대 쌍방 거리는 수학식 4와 같이 표현된다.
Figure 112019035196008-pat00007
최대 쌍방 거리는 유효 그룹 내의 복수의 장소 간의 거리 중에서 최대값을 의미한다.
프로세서는 4개의 요소를 고려하여 랭킹 함수를 산출한다. 프로세서는 키워드 관련도, 질의 거리, 쌍방 거리, 및 의미적 장소 정보의 개수를 기준으로 순위를 판단한다.
프로세서는 질의 거리와 쌍방 거리를 고정한 상태에서 유효 그룹의 선별 개수에 따라 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 질의 거리의 한계를 설정할 수 있다. 프로세서는 질의 거리의 한계에 따라 후보 유효 그룹을 필터링하고 랭킹 점수를 갱신하여 유효 그룹을 출력할 수 있다.
프로세서는 질의 거리와 상기 쌍방 거리를 고정한 상태에서 상기 유효 그룹의 선별 개수에 따라 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 쌍방 거리의 한계를 설정할 수 있다. 프로세서는 쌍방 거리의 한계에 따라 후보 유효 그룹을 필터링하고 랭킹 점수를 갱신하여 유효 그룹을 출력할 수 있다.
도 6은 집단 키워드 질의 처리 방법에서 랭킹 점수를 갖는 유효 그룹을 출력하는 단계를 예시한 흐름도이다.
집단 키워드 질의 처리 방법은 정확도에 집중한 제1 검색 방식과 속도에 집중한 제2 검색 방식으로 동작할 수 있다.
제1 검색 방식은 지식 베이스 내의 후보 서브 트리를 검색하여 정확한 Top k 결과를 출력한다. 제1 검색 방식은 모든 후보 서브 트리를 검색하지 않고, 랭킹 함수를 분할하여 질의 거리 한계와 쌍방 거리 한계를 결정하는 중요 의미적 장소를 찾는다. 중요 의미적 장소에 기반하여 검색 공간을 줄이는 필터링을 수행한다. 중요 의미적 장소는 질의 키워드를 적어도 하나를 포함하고 있는 의미적 장소를 나타낸다.
단계 S310에서 프로세서는 공간 지식 그래프를 탐색하는 과정에서 좌표 유무를 기준으로 후보 유효 그룹을 필터링하고 의미적 공간 키워드를 기준으로 후보 유효 그룹을 필터링하여 서브 트리를 추출한다.
단계 S320에서 프로세서는 질의 거리와 쌍방 거리를 고정한 상태에서 유효 그룹의 선별 개수에 따라 마지막 순위에 해당하는 유효 그룹을 선택한다.
단계 S330에서 프로세서는 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 질의 거리의 한계를 설정한다.
단계 S340에서 프로세서는 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 쌍방 거리의 한계를 설정한다. 단계 S350에서 프로세서는 후보 유효 그룹을 필터링하고 랭킹 점수를 갱신한다.
제2 검색 방식은 추가적으로 트리 깊이 한계를 통해 필터링을 수행한다. 적당한 트리 깊이 한계는 정확도를 희생하면서 검색 공간을 획기적으로 줄일 수 있다. 예를 들어, 트리 깊이 한계를 8로 설정했을 때 DBpedia의 경우 검색 공간이 감소하여 질의 처리 시간은 50% 이상 감소하였으나 정확도는 4% 정도 감소하였다.
제2 검색 방식은 알고리즘의 조기 종료를 위한 질의 거리, 쌍방 거리, 및 장소의 개수를 동적으로 제한하여 질의 처리 시간을 단축한다.
표 2는 제2 검색 방식의 알고리즘을 예시한다.
Figure 112019035196008-pat00008
표 2에서 RSP는 의미적 장소이고, T는 서브 트리이고, kVG는 Top k의 해당하는 유효 그룹이고,
Figure 112019035196008-pat00009
는 현재 의미적 장소 정보의 개수이고, θ는 유효 그룹의 랭킹 점수이고, δ는 현재 Top k의 랭킹 점수이다.
제2 검색 방식의 알고리즘 6 내지 9 라인에서 프로세서는 공간 지식 그래프를 탐색하는 과정에서 트리 깊이의 한계를 설정하여 후보 유효 그룹을 필터링하여 유효 그룹을 출력한다.
제2 검색 방식의 알고리즘 14 내지 15 라인에서 프로세서는 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 질의 거리의 한계를 동적으로 설정하여 후보 유효 그룹을 필터링하여 유효 그룹을 출력한다.
제2 검색 방식의 알고리즘 26 내지 27 라인에서 프로세서는 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 쌍방 거리의 한계를 동적으로 설정하여 후보 유효 그룹을 필터링하여 유효 그룹을 출력한다.
제2 검색 방식의 알고리즘 32 내지 40 라인에서 프로세서는 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹의 랭킹 점수를 참조하여 의미적 장소 정보의 개수 제한을 동적으로 설정하여 후보 유효 그룹을 필터링하여 유효 그룹을 출력한다.
본 실시예에서 정의된 질의는 사용자가 문법을 숙지해야 하는 구조적 언어가 아니라 사용자한테 친숙한 키워드 기반의 질의이다. 키워드 질의는 사용자의 공간 지식 베이스에 대한 접근 장벽을 낮추고, 집단 공간 키워드 질의로 여러 개의 장소를 그룹화하여 사용자의 요구를 만족시키므로 대량의 키워드에 대해서 정확한 결과를 반환할 수 있다.
집단 키워드 질의 처리 장치는 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합에 의해 로직회로 내에서 구현될 수 있고, 범용 또는 특정 목적 컴퓨터를 이용하여 구현될 수도 있다. 장치는 고정배선형(Hardwired) 기기, 필드 프로그램 가능한 게이트 어레이(Field Programmable Gate Array, FPGA), 주문형 반도체(Application Specific Integrated Circuit, ASIC) 등을 이용하여 구현될 수 있다. 또한, 장치는 하나 이상의 프로세서 및 컨트롤러를 포함한 시스템온칩(System on Chip, SoC)으로 구현될 수 있다.
집단 키워드 질의 처리 장치는 하드웨어적 요소가 마련된 컴퓨팅 디바이스 또는 서버에 소프트웨어, 하드웨어, 또는 이들의 조합하는 형태로 탑재될 수 있다. 컴퓨팅 디바이스 또는 서버는 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신장치, 프로그램을 실행하기 위한 데이터를 저장하는 메모리, 프로그램을 실행하여 연산 및 명령하기 위한 마이크로프로세서 등을 전부 또는 일부 포함한 다양한 장치를 의미할 수 있다.
도 5 및 도 6에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나 이는 예시적으로 설명한 것에 불과하고, 이 분야의 기술자라면 본 발명의 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 5 및 도 6에 기재된 순서를 변경하여 실행하거나 또는 하나 이상의 과정을 병렬적으로 실행하거나 다른 과정을 추가하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이다.
본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 매체에 기록될 수 있다. 컴퓨터 판독 가능한 매체는 실행을 위해 프로세서에 명령어를 제공하는 데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예를 들면, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.
본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (15)

  1. 컴퓨팅 디바이스에 의한 집단 키워드 질의 처리 방법에 있어서,
    공간 지식 그래프를 위한 집단 키워드 질의를 획득하는 단계; 및
    장소 정보가 상기 집단 키워드 질의에 속하는 공간 키워드 전부가 아닌 공간 키워드 일부에 해당하는 상황에서, 상기 집단 키워드 질의를 기반으로 랭킹 점수를 갖는 유효 그룹을 출력하는 단계를 포함하며,
    상기 집단 키워드 질의는 (i) 질의 장소, (ii) 복수의 의미적 공간 키워드, 및 (iii) 상기 유효 그룹의 선별 개수를 포함하며, 상기 유효 그룹은 의미적 장소 정보의 집합이며, 상기 의미적 장소 정보는 상기 공간 지식 그래프의 서브 트리를 의미하고, 상기 공간 지식 그래프는 상기 의미적 공간 키워드를 포함하며,
    상기 유효 그룹을 출력하는 단계는, 상기 유효 그룹에 대한 키워드 관련도 및 상기 유효 그룹에 대한 공간적 근접도를 기준으로 상기 유효 그룹을 평가하는 랭킹 함수를 이용하여 상기 복수의 의미적 공간 키워드 중에서 적어도 일부를 만족하는 의미적 장소 정보의 위치를 검색하며,
    상기 유효 그룹에 대한 상기 키워드 관련도는 상기 유효 그룹에 속하는 의미적 장소 정보마다 의미적 공간 키워드에 대한 최단 경로 길이의 합으로 산출되고,
    상기 유효 그룹에 대한 상기 공간적 근접도는, (i) 상기 유효 그룹 내의 의미적 장소 정보 및 질의 장소 간의 질의 거리, (ii) 상기 유효 그룹 내의 의미적 장소 정보의 개수, 및 (iii) 상기 유효 그룹 내의 의미적 장소 정보 간의 최대 쌍방 거리를 기반으로 산출되며,
    상기 최대 쌍방 거리는 상기 유효 그룹 내의 복수의 의미적 장소 정보 간의 쌍방 거리 중에서 최대값을 의미하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 제1항에 있어서,
    상기 랭킹 함수는 상기 키워드 관련도 및 상기 공간적 근접도의 곱으로 정의되며, 상기 키워드 관련도가 0이 되지 않도록 상기 키워드 관련도에 1을 가산한 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  6. 삭제
  7. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는
    상기 공간적 근접도는 제1 거리와 제2 거리의 합으로 정의되며,
    상기 제1 거리는 상기 유효 그룹에 속하는 의미적 장소 정보 및 질의 장소 간의 최대 거리이고, 상기 제2 거리는 상기 유효 그룹에 속하는 의미적 장소 정보 간의 최대 쌍방 거리에 의미적 장소 정보의 개수에서 1을 감산한 값을 곱한 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  8. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 공간 지식 그래프를 탐색하는 과정에서 좌표 유무를 기준으로 후보 유효 그룹을 필터링하고 상기 의미적 공간 키워드를 기준으로 후보 유효 그룹을 필터링하여 서브 트리를 추출하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  9. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 질의 거리와 상기 쌍방 거리를 고정한 상태에서 상기 유효 그룹의 선별 개수에 따라 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 상기 질의 거리의 한계를 설정하여 후보 유효 그룹을 필터링하고 상기 랭킹 점수를 갱신하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  10. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 질의 거리와 상기 쌍방 거리를 고정한 상태에서 상기 유효 그룹의 선별 개수에 따라 선택된 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 상기 쌍방 거리의 한계를 설정하여 후보 유효 그룹을 필터링하고 상기 랭킹 점수를 갱신하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  11. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 공간 지식 그래프를 탐색하는 과정에서 트리 깊이의 한계를 설정하여 후보 유효 그룹을 필터링하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  12. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 상기 질의 거리의 한계를 동적으로 설정하여 후보 유효 그룹을 필터링하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  13. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹에 속하는 의미적 장소 정보를 기준으로 상기 쌍방 거리의 한계를 동적으로 설정하여 후보 유효 그룹을 필터링하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  14. 제1항에 있어서,
    상기 유효 그룹을 출력하는 단계는,
    상기 유효 그룹의 선별 개수의 범위를 만족하는 현재 마지막 순위에 해당하는 유효 그룹의 랭킹 점수를 참조하여 상기 의미적 장소 정보의 개수 제한을 동적으로 설정하여 후보 유효 그룹을 필터링하는 것을 특징으로 하는 집단 키워드 질의 처리 방법.
  15. 하나 이상의 프로세서 및 상기 하나 이상의 프로세서에 의해 실행되는 하나 이상의 프로그램을 저장하는 메모리를 포함하는 집단 키워드 질의 처리 장치에 있어서,
    상기 프로세서는 공간 지식 그래프를 위한 집단 키워드 질의를 획득하고,
    상기 프로세서는 장소 정보가 상기 집단 키워드 질의에 속하는 공간 키워드 전부가 아닌 공간 키워드 일부에 해당하는 상황에서, 상기 집단 키워드 질의를 기반으로 랭킹 점수를 갖는 유효 그룹을 출력하며,
    상기 집단 키워드 질의는 (i) 질의 장소, (ii) 복수의 의미적 공간 키워드, 및 (iii) 상기 유효 그룹의 선별 개수를 포함하며, 상기 유효 그룹은 의미적 장소 정보의 집합이며, 상기 의미적 장소 정보는 상기 공간 지식 그래프의 서브 트리를 의미하고, 상기 공간 지식 그래프는 상기 의미적 공간 키워드를 포함하며,
    상기 프로세서는, 키워드 관련도 및 공간적 근접도를 기준으로 상기 유효 그룹을 평가하는 랭킹 함수를 이용하여 상기 복수의 의미적 공간 키워드 중에서 적어도 일부를 만족하는 의미적 장소 정보의 위치를 검색하여 상기 유효 그룹을 출력하며,
    상기 키워드 관련도는 상기 유효 그룹에 속하는 의미적 장소 정보마다 의미적 공간 키워드에 대한 최단 경로 길이의 합으로 산출되고,
    상기 공간적 근접도는, (i) 상기 유효 그룹 내의 의미적 장소 정보 및 질의 장소 간의 질의 거리, (ii) 상기 유효 그룹 내의 의미적 장소 정보의 개수, 및 (iii) 상기 유효 그룹 내의 의미적 장소 정보 간의 최대 쌍방 거리를 기반으로 산출되며,
    상기 최대 쌍방 거리는 상기 유효 그룹 내의 복수의 의미적 장소 정보 간의 쌍방 거리 중에서 최대값을 의미하는 것을 특징으로 하는 집단 키워드 질의 처리 장치.
KR1020190040174A 2019-04-05 2019-04-05 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치 KR102185703B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190040174A KR102185703B1 (ko) 2019-04-05 2019-04-05 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190040174A KR102185703B1 (ko) 2019-04-05 2019-04-05 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20200117691A KR20200117691A (ko) 2020-10-14
KR102185703B1 true KR102185703B1 (ko) 2020-12-02

Family

ID=72847260

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190040174A KR102185703B1 (ko) 2019-04-05 2019-04-05 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102185703B1 (ko)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232179A1 (en) 2009-09-25 2016-08-11 Microsoft Technology Licensing, Llc Recommending points of interests in a region

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8346770B2 (en) * 2003-09-22 2013-01-01 Google Inc. Systems and methods for clustering search results
KR101221959B1 (ko) * 2010-12-21 2013-01-15 한국항공대학교산학협력단 맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색방법
KR20120104650A (ko) 2011-02-25 2012-09-24 주식회사 솔트룩스 Rdf에 기반한 지리공간정보의 sparql 질의 처리 방법 및 장치
CN103577413B (zh) * 2012-07-20 2017-11-17 阿里巴巴集团控股有限公司 搜索结果排序方法及系统、搜索结果排序优化方法及系统

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160232179A1 (en) 2009-09-25 2016-08-11 Microsoft Technology Licensing, Llc Recommending points of interests in a region

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Jieming Shi et al., Top-k Relevant Semantic Place Retrieval on Spatial RDF Data, SIGMOD’16, 1977-1990pages (2016.07.01) 1부.*

Also Published As

Publication number Publication date
KR20200117691A (ko) 2020-10-14

Similar Documents

Publication Publication Date Title
JP7021228B2 (ja) ブロックチェーンベースのデータ記憶および照会方法およびデバイス
CA2767277C (en) Method of searching a data base, navigation device and method of generating an index structure
JP4878178B2 (ja) データ処理方法および装置並びにその処理プログラム
CN103927310B (zh) 一种地图数据搜索建议生成方法及装置
US8468146B2 (en) System and method for creating search index on cloud database
US11556534B2 (en) Subquery predicate generation to reduce processing in a multi-table join
CN107783985B (zh) 一种分布式数据库查询方法、装置及管理系统
CN103914483B (zh) 文件存储方法、装置及文件读取方法、装置
US20170083553A1 (en) Tiering of posting lists in search engine index
JP6982049B2 (ja) インデックスを管理するための方法、装置、設備及び記憶媒体
US8880553B2 (en) Redistribute native XML index key shipping
US20140229496A1 (en) Information processing device, information processing method, and computer program product
CN110889023A (zh) 一种elasticsearch的分布式多功能搜索引擎
US20150213107A1 (en) Apparatus of managing data and method for managing data for supporting mixed workload
Theocharidis et al. SRX: efficient management of spatial RDF data
KR101747532B1 (ko) 여행성 질의에 대응하는 검색 결과로 코스를 추천하는 방법 및 시스템
CN105447064B (zh) 一种电子地图数据制作及其使用方法和装置
KR102185703B1 (ko) 공간 지식 베이스 기반의 집단 키워드 질의 처리 방법 및 장치
KR101772333B1 (ko) 이종 NoSQL 데이터베이스들간의 지능적 조인 전략 제공 방법 및 시스템
US20160004749A1 (en) Search system and search method
JP6615420B1 (ja) エッジシステム、情報処理方法及び情報処理プログラム
CN110889424B (zh) 向量索引建立方法及装置和向量检索方法及装置
KR101615164B1 (ko) 엔-그램 기반의 질의 처리 장치 및 그 방법
KR101693108B1 (ko) 읽기 성능 개선을 위한 티-트리 인덱스를 이용한 데이터베이스 읽기 방법 및 그 장치
KR102086610B1 (ko) 다중 키워드 도메인 기반 공간-키워드 검색 장치 및 방법, 이를 기록한 기록매체

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant