KR20110070057A - 자연어 기반 여행 추천 장치 및 방법 - Google Patents

자연어 기반 여행 추천 장치 및 방법 Download PDF

Info

Publication number
KR20110070057A
KR20110070057A KR1020090126711A KR20090126711A KR20110070057A KR 20110070057 A KR20110070057 A KR 20110070057A KR 1020090126711 A KR1020090126711 A KR 1020090126711A KR 20090126711 A KR20090126711 A KR 20090126711A KR 20110070057 A KR20110070057 A KR 20110070057A
Authority
KR
South Korea
Prior art keywords
travel
information
destination
document
unit
Prior art date
Application number
KR1020090126711A
Other languages
English (en)
Inventor
이충희
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020090126711A priority Critical patent/KR20110070057A/ko
Priority to US12/969,489 priority patent/US20110153654A1/en
Publication of KR20110070057A publication Critical patent/KR20110070057A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Abstract

본 발명은 여행 정보를 묻는 자연어 질문에 대하여 가장 알맞은 여행지 정보를 추천하는 방법에 관한 것으로, 지역, 테마, POI (Point of Interest) 등의 정보를 언어분석을 통해 추출하여 사용자 의도를 파악한 후 최적의 여행지를 추천기반 여행 추천 장치는, 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB로부터 사용자의 의도 파악을 위한 적어도 하나 이상의 질문 분석 정보들을 추출하는 질문 분석부; 추출된 적어도 하나 이상의 질문 분석 정보들을 이용해서 사용자를 위한 적어도 하나 이상의 추천 여행지들을 여행지 DB로부터 검색하는 여행지 검색부; 및 검색된 적어도 하나 이상의 추천 여행지들을 사용자에게 제공하는 여행 추전 정보 제공부를 포함하는 것을 특징으로 한다.
여행추천, 자연어, 지역, 테마, POI, 언어분석

Description

자연어 기반 여행 추천 장치 및 방법{Natural language based Travel recommendation apparatus and method using location and theme information}
본 발명은 지역과 테마정보를 이용한 자연어 기반 여행 추천 장치 및 방법에 관한 것으로, 보다 상세하게는, 여행 정보를 원하는 사용자 질문을 분석해서 지역정보, 테마정보, 그리고 기타 정보를 추출하고, 질문분석 결과를 이용해서 사용자가 원하는 지역과 테마의 여행지를 검색하고, 질문에 나온 기타 정보와 문서 검색 결과, 그리고 미리 구축된 여행지 신뢰도 정보를 이용해서 사용자 의도에 가장 적합한 여행지를 순위화해서 추천하는 지역과 테마정보를 이용한 자연어 기반 여행 추천 장치 및 방법에 관한 것이다.
본 발명은 지식경제부의 IT성장동력기술개발의 일환으로 수행한 연구로부터 도출된 것이다(과제관리번호: 2008-S-020-02, 과제명: 웹 QA 기술개발).
일반적으로, 네비게이션 시스템(Navigation System)과 같은 정보 제공 시스템은 전체 지도에 대한 지도 정보와 전체 지도상의 유명 지역이나, 건물, 도로 정보를 나타내는 POI(Point Of Interest) 정보를 내부에 저장하고 이러한 지도 정보 및 POI 정보를 사용자에게 제공하게 된다.
그리고, 이러한 네비게이션 시스템이 보편화됨에 따라 다양한 정보를 제공하기 위한 방법들이 제안되고 있다. 특히, 여행지 추천 방법은 미리 정의한 프로파일 정보나 일정 정보가 네비게이션과 같은 시스템 상에 채워져 있으면, 여행 정보를 검색할 수 있게 된다. 또는 대화 시스템을 통한 단순 비행기 예약 기능 등의 부가 정보를 제공하기도 한다.
예를 들어, 종래의 여행지 추천 방법은 추천 여행지 정보를 전달받아 추천 여행지 정보를 IP기반으로 이동통신망에 제공하는 방식을 취하게 된다. 이러한 방법은 특정 시스템에 가입한 사용자만을 대상으로 하고, 가입자의 개인 일정 및 포털 검색 이력 정보만을 기반으로 추천 여행지를 선정하는 제약이 있다. 또, 종래의 다른 여행지 추천 방법은 사용자 인터페이스를 통해 지역별 여행코스 및 각 코스별 POI (Point of Interest) 정보를 제공하게 된다. 이 기술은 네비게이션에 특화해서 여행 경로에 따른 주변 POI만을 추천해 주게 된다.
따라서, 종래의 여행지 추천 방법은 개인 일정이나 프로파일, 포털 검색 이력 등의 미리 구축된 개인 정보에만 기반해서 여행 정보를 검색하고 추천함으로써 많은 제약을 갖게 된다.
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출한 것으로서, 본 발명의 목적은 사용자가 원하는 정보를 자연어로 물어보면 언어분석을 통해 사용자 의도를 분석해서, 사용자가 원하는 지역과 테마에 기반해서 여행지를 검색하여 추 천하는 자연어 기반 여행 추천 장치 및 방법을 제공하는 것이다.
또, 본 발명의 다른 목적은 검색된 여행지를 문서 검색 결과와 미리 정의된 여행지 신뢰도 정보를 이용해서 여행지를 순위화 함으로써 최적의 여행지를 추천하는 자연어 기반 여행 추천 장치 및 방법을 제공함에 있다.
상술한 목적을 달성하기 위한 본 발명에 따른 자연어 기반 여행 추천 장치는, 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB로부터 사용자의 의도 파악을 위한 적어도 하나 이상의 질문 분석 정보들을 추출하는 질문 분석부; 추출된 적어도 하나 이상의 질문 분석 정보들을 이용해서 사용자를 위한 적어도 하나 이상의 추천 여행지들을 여행지 DB로부터 검색하는 여행지 검색부; 및 검색된 적어도 하나 이상의 추천 여행지들을 사용자에게 제공하는 여행 추전 제공부를 포함하는 것을 특징으로 한다.
여기서, 적어도 하나 이상의 질문 분석 정보들은, POI 정보, 테마 정보, 지역 정보 및 기타 정보 중 적어도 하나 이상을 포함하는 것이 바람직하다.
또, 적어도 하나 이상의 추천 여행지들은, 지역별 여행지, 테마별 여행지 및 문서 검색 기반 여행지 중 적어도 하나 이상을 포함하는 것이 바람직하다.
또한, 적어도 하나 이상의 추천 여행지들을 문서 색인 DB의 신뢰도 정보를 이용하여 순위화하는 여행지 순위화부를 더 포함하는 것이 바람직하다.
여기서, 신뢰도 정보는, 문서 유사도 점수, POI 추출 신뢰도 점수, 여행지 평판 점수, 여행정보 제공 CP 신뢰도 점수, 여행문서 유형 신뢰도 점수, 및 기타 신뢰도 점수 중 적어도 하나 이상을 포함하는 것이 바람직하다.
또, 여행지 순위화부는, 적어도 하나 이상의 추천 여행지들 중에서 사용자의 여행 관련 질문에 해당되지 않는 여행지를 필터링하는 것이 바람직하다.
또한, 여행 문서를 대상으로 색인어, 대표 POI, 문서 신뢰도 및 평판 정보 중 적어도 하나 이상을 추출해서 문서 색인 DB를 구축하는 문서 색인부를 더 포함하는 것이 바람직하다.
또, 질문 분석부는, 사용자의 여행 관련 질문을 형태소 분석 및 개체명 인식을 이용하여 언어 분석하는 질문 언어 분석부; 언어 분석 결과를 이용해서 사용자의 여행 관련 질문에 출현한 POI를 추출하는 POI추출부; 언어 분석 결과를 이용해서 사용자의 여행 관련 질문의 테마 정보를 추출하는 테마 추출부; 및 언어 분석 결과를 이용해서 사용자의 여행 관련 질문의 지역 제약 정보를 추출하는 지역 추출부를 포함하는 것이 바람직하다.
또, 질문 분석부는, 언어 분석 결과를 이용해서 사용자의 여행 관련 질문의 문서 검색에 이용할 수 있도록 질의어 또는 불용어를 추출하는 기타 정보 추출부(105)를 더 포함하는 것이 바람직하다.
또, 여행지 검색부는, 사용자의 여행 관련 질문의 지역 제약 정보를 기반으로 해당 지역의 여행지를 검색하는 지역기반 여행지 검색부; 및 사용자의 여행 관련 질문의 테마 정보를 기반으로 해당 테마의 여행지를 검색하는 테마기반 여행지 검색부를 포함하는 것이 바람직하다.
또, 여행지 검색부는, 사용자의 여행 관련 질문의 질의어 또는 불용어 정보 를 기반으로 대응되는 여행 문서의 대표POI를 검색하는 문서기반 여행지 검색부를 더 포함하는 것이 바람직하다.
또, 여행지 검색부는, 검색된 여행지 결과들에 공통적으로 포함되지 않는 여행지를 필터링하는 여행지 필터링부를 더 포함하는 것이 바람직하다.
또, 여행지 순위화부(30)는, 여행 문서의 유사도 점수를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 문서 유사도 기반 순위화부; 여행 문서에서 추출된 POI의 추출 신뢰도를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 POI 추출 신뢰도 기반 순위화부; 문서에서의 여행지에 대한 평판 정보를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행지 평판 기반 순위화부; 여행지 정보를 제공한 전문 여행업체의 신뢰도 정보를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행정보 제공 CP 기반 순위화부; 문서 기반 여행지 검색부(203)로부터 검색된 문서의 유형에 따라 미리 정해진 신뢰도 점수를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행문서 유형 기반 순위화부; 및 이미지 정보, 주소 정보, 사용자 리뷰 정보, 사용자 평점 정보 등의 여행지 관련 추가정보를 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 기타정보 기반 순위화부를 포함하는 것이 바람직하다.
또, 문서 색인부는, 여행 전문업체에서 제공하는 정제된 문서 또는 웹으로부터 자동으로 모아진 웹 여행 문서를 대상으로 형태소 분석 및 개체명 인식을 수행하는 문서 언어 분석부; 언어 분석 결과를 이용해서 검색에 유용한 의미있는 키워드를 추출하는 색인어 추출부; 문서에 출현한 모든 POI를 추출하고 추출된 POI를 순위화해서 문서를 대표할 수 있는 주요 POI를 뽑는 대표POI 추출부; 문서의 출처, 날짜, 문서 품질 점수에 기반해서 문서 자체의 신뢰도를 계산하는 문서 신뢰도 추출부; 및 문서에 나온 객체를 대상으로 사용자 평판 정보를 추출해서 POI의 평판 점수를 계산하는 평판 정보 추출부;를 포함하는 것이 바람직하다.
또 문서 색인부는, 추출된 모든 정보를 검색에 이용할 수 있도록 역색인 DB를 구축하는 역색인DB 생성부를 더 포함하는 것이 바람직하다.
한편, 본 발명에 따른 자연어 기반 여행 추천 방법은, 질문 분석부가, 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB로부터 사용자의 의도 파악을 위한 적어도 하나 이상의 질문 분석 정보들을 추출하는 단계; 여행지 검색부가, 추출된 적어도 하나 이상의 질문 분석 정보들을 이용해서 사용자를 위한 적어도 하나 이상의 추천 여행지들을 여행지 DB로부터 검색하는 단계; 및 여행 추전 정보 제공부가, 검색된 적어도 하나 이상의 추천 여행지들을 사용자에게 제공하는 단계를 포함하는 것을 특징으로 한다.
여기서, 적어도 하나 이상의 질문 분석 정보들은, POI 정보, 테마 정보, 지역 정보 및 기타 정보 중 적어도 하나 이상을 포함하는 것이 바람직하다.
또, 적어도 하나 이상의 추천 여행지들은, 지역별 여행지, 테마별 여행지 및 문서 검색 기반 여행지 중 적어도 하나 이상을 포함하는 것이 바람직하다.
또한, 여행지 순위화부가, 적어도 하나 이상의 추천 여행지들을 문서 색인 DB의 신뢰도 정보를 이용하여 순위화하는 단계를 더 포함하는 것이 바람직하다.
본 발명에 따르면, 사용자의 자연어 기반 여행 관련 질문을 언어 분석하여 자연어 기반으로 검색된 추천 여행지 등의 여행 정보를 제공할 수 있기 때문에 사용자에게 편의를 제공할 수 있는 효과를 갖는다.
또, 본 발명은 언어 분석 결과로부터 추출된 POI 정보, 테마 정보, 지역 정보 등의 질문 분석 정보를 이용하여 사용자 의도에 적합한 여행지를 검색할 수 있기 때문에 보다 유용한 여행 정보를 제공할 수 있는 효과를 갖는다.
이를 통해, 본 발명에서는 검색된 추천 여행지별로 문서 유사도 점수, POI 추출 신뢰도, 여행지 평판 정보, CP 신뢰도, 문서 신뢰도 등의 다양한 신뢰도 점수를 기반으로 순위화하여 사용자 의도에 가장 적합한 여행지를 제시할 수 있는 효과를 갖는다.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 보다 상세하게 설명한다. 하기 설명 및 첨부 도면은 본 발명의 전반적인 이해를 돕기 위한 것이며 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.
개략적으로 설명하면, 본 발명에서는 여행지 추천에 필요한 정보들을 미리 DB화하고, 사용자 질문이 입력되면 사용자 질문을 분석해서 가장 적합한 여행지를 실시간으로 검색하고 순위화해서 추천한다. 검색에 사용되는 DB에는 구조화된 정보로부터 추출되는 지역별 여행지 또는 테마별 여행지 등의 여행지 DB가 있고, 여행 에 대한 텍스트 문서의 타이틀과 본문 내용을 언어분석하여 추출된 의미있는 정보들에 대한 문서색인 DB가 있다. 여행 추천 장치는 질문 분석 결과를 이용해서 사용자 질문과 관련된 여행지를 검색하고, 여행지 추천에 필요한 정보를 DB 검색을 통해 찾은 후에, 미리 정의된 순위화 정책에 따라 검색된 여행지를 순위화해서 최종적으로 사용자 의도에 가장 적합한 여행지를 상위에 위치시켜서 추천한다.
이하, 본 발명의 실시예에 따른 자연어 기반 여행 추천 방법이 적용된 자연어 기반 여행 추천 장치에 대해 첨부한 도면을 참조하여 설명하면 다음과 같다.
도 1은 본 발명에 따른 자연어 기반 여행 추천 장치를 나타낸 전체 구성도이다.
본 발명의 실시예에 따른 자연어 기반 여행 추천 방법이 적용된 자연어 기반 여행 추천 장치는 질문 분석부(10), 여행지 검색부(20), 여행지 순위화부(30), 여행정보 추출부(40), 문서 색인부(50), 데이터 베이스(60), 여행 추천 제공부(70)를 포함하여 구성된다. 간략하게 설명하면, 본 발명의 실시예에 따른 자연어 기반 여행 추천 장치는 지역 및 테마 정보에 따른 자연어(언어) 분석을 이용하여 사용자에게 여행 추천을 수행하도록 구성된다.
질문 분석부(10)는 사용자가 입력한 여행 관련 질문을 자연어(언어) 분석해서 사용자 의도 분석에 필요한 적어도 하나 이상의 질문 분석 정보들을 추출한다. 즉, 질문 분석부(10)는 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB(620)로부터 사용자의 의도를 파악하기 위한 적어도 하나 이상의 질문 분석 정보 들을 추출하게 된다.
여기서, 자연어는 사람들이 일상적으로 쓰는 언어를 인공적으로 만들어진 언어인 인공어와 구분하여 부르는 개념인 것으로 한다. 즉, 시용자의 여행 관련 질문은 자연어를 바탕으로 입력될 수 있을 것이다. 예를 들어, '일본에서 가족과 갈 만한 계곡을 추천해줘' 등이 될 수 있을 것이다.
또, 적어도 하나 이상의 질문 분석 정보들은 POI 정보, 테마 정보, 지역 정보 및 기타 정보 등을 포함할 수 있을 것이다. 그래서, 질문 분석부(10)는 자연어로 입력된 사용자의 여행 관련 질문을 하술된 자연어(언어) 분석을 통해 사용자의 의도를 파악하기 위한 질문 분석 정보들을 추출하게 된다.
또, 사용자의 여행 관련 질문은 사용자 인터페이스(미도시) 등을 통해 입력받을 수 있을 것이다. 예를 들어, 네비게이션 또는 여행 소프트웨어 등에 적용된 경우, 키패드 또는 터치패드 등을 채용할 수 있을 것이다.
여행지 검색부(20)는 추출된 질문 분석 결과를 이용해서 관련 여행지들을 검색한다. 즉, 여행지 검색부(20)는 추출된 질문 분석 정보들을 이용하여 여행지 DB(610)에서 사용자의 의도에 적합한 적어도 하나 이상의 추천 여행지들을 검색하게 된다.
여기서, 적어도 하나 이상의 추천 여행지들은 지역별 여행지, 테마별 여행지 및 문서 검색 기반 여행지 등을 포함할 수 있을 것이다. 그래서, 여행지 검색부(20)는 질문 분석정보들 각각에 대응되는 여행지 정보들을 상술한 여행지 DB(610)에서 검색하게 된다.
여행지 순위화부(30)는 검색된 여행지를 다양한 문서 분석 결과와 미리 계산된 여행지 신뢰도 정보를 이용해서 순위를 결정한다. 즉, 여행지 순위화부(30)는 상술한 적어도 하나 이상의 추천 여행지들을 문서 색인 DB(620)의 신뢰도 정보를 이용하여 순위화 하게 된다. 이에 따라 여행지 순위화부(30)는 최종적으로 사용자 질문에 적합한 여행지를 제시할 수 있다.
여기서, 신뢰도 정보는 문서 유사도 점수, POI 추출 신뢰도 점수, 여행지 평판 점수, 여행정보 제공 CP 신뢰도 점수, 여행문서 유형 신뢰도 점수, 및 기타 신뢰도 점수 등을 포함할 수 있다.
또한, 여행지 순위화부(30)는, 적어도 하나 이상의 추천 여행지들 중에서 사용자의 여행 관련 질문에 해당되지 않는 여행지를 필터링하는 것이 바람직하다. 여기서, 필터링은 상술한 질문 분석 정보들간의 교집합을 이용할 수 있을 것이다. 예컨대, 지역, 테마, 문서 기반 여행지 결과의 AND 조건 등.
여행 추천 제공부(70)는 최종적으로 상술한 사용자의 여행 관련 질문에 적합한 추천 여행지들을 제공하게 된다. 여행 추천 제공부(70)는 사용자에게 추천 여행지를 제공할 수 있는 방식이라면 어떠한 방식이라도 가능할 것이다. 예컨대, 모니터에 표시된 추천 여행지 목록 등
데이터 베이스(60)는 문서 색인 DB(620) 및 여행지 DB(610)를 포함하여 구성되며, 상술한 본 발명에 이용되는 지역 및 테마 기반 여행 정보 등을 수록하게 된다.
여행 정보 추출부(40)는 여행 검색에 필요한 여행지 DB(610)를 구축한다. 여행 정보 추출부(40)는 전문 여행업체로부터 제공된 여행 정보 및 웹으로부터 자동으로 추출된 구조화 정보로부터 테마별 여행지 및 지역별 여행지 정보를 추출한다. 그리고, 여행 정보 추출부(40)는 추출된 정보들을 구축하여 여행지 DB(610)에 저장한다. 즉, 여행 정보 추출부(40)는 전문 여행업체에서 제공하는 정제된 구조정보 또는 웹으로부터 자동으로 추출된 구조정보를 기반으로 여행지를 테마별 또는 지역별로 구분해서 여행지 DB(610)를 구축하게 된다.
문서 색인부(50)는 사용자 질문에 적합한 문서를 검색하기 위해서 보유하고 있는 여행 문서를 대상으로 미리 언어 분석하여 색인어 및 기타 여행 문서 정보를 구축하여 문서 색인 DB(620)에 저장한다. 즉, 문서 색인부(50)는 전문 여행업체에서 제공하거나 웹으로부터 모아진 여행 문서를 대상으로 색인어, 대표 POI, 문서 신뢰도 및 평판 정보 중 적어도 하나 이상을 추출해서 문서 색인 DB(620)를 구축하게 된다.
도 2는 질문 분석부의 세부 구성을 도시한 도면이고, 도 3은 POI 추출부에서 추출된 POI의 구분 예를 도시한 도면이고, 도 4는 테마 추출부에서 분류된 1차 및 2차 테마 분류의 구조 정보를 예시한 도면이며, 도 5는 질문 분석부에 의한 질문분석 결과의 예를 도시한 도면이다.
도 2를 참조하면, 질문 분석부(10)는 질문 언어 분석부(101), POI 추출부(102), 테마 추출부(103), 지역 추출부(104), 기타 정보 추출부(105)를 포함하여 구성된다.
여기서, 여행지 DB(610)는 언어분석 사전(611), POI 사전(612), 테마 사전(613), 지역사전(614)등으로 분류되어 구성되는 것이 바람직하다. 따라서, 질문 분석부(10) 각 구성부 별로 검색을 위한 데이터 그룹을 분류하여 검색시 속도 및 정확성을 높이도록 하게 된다. 이에 대한 설명은 자명하게 이해될 수 있으므로 상세한 설명은 생략한다.
질문 언어 분석부(101)는 사용자의 여행 관련 질문을 형태소 분석 또는 개체명 인식한다. 즉, 질문 언어 분석부(101)는 사용자의 여행 관련 질문을 형태소 별로 구분하거나, 각 단어별 개체명을 매칭시키는 방식으로 언어 분석을 수행하게 된다.
POI 추출부(102)는 상술한 사용자의 여행 관련 질문에 대한 언어 분석 결과를 이용해서 질문에 출현한 POI를 추출한다. 통상 POI(Point Of Interest)는 유명 지역이나, 건물, 도로 정보 등을 대표하는 용어를 의미하게 된다.
또, 도 3에 도시된 바와 같이, 본 발명에서 추출된 POI는 일반 POI와 주소 POI로 크게 구분된다. 즉, 주소 POI는 사용자가 관심 있어 하는 나라, 섬, 시/군/구 등의 주소와 관련된 POI(예: 한국, 하와이, 상하이, 뉴욕 등)으로 분류하게 된다. 또, 일반 POI는 사용자가 관심 있어 하는 주소 POI 이외의 관심 지역( 예: 앙코르와트, 하롱베 등) 이는 일례로서 이에 한정되지는 않는다.
테마 추출부(103)는 질문의 테마를 미리 정의된 테마 분류 중에서 1개를 선택하는 기능을 수행한다. 즉, 테마 추출부(103)은 상술한 사용자의 여행 관련 질문에 대한 언어 분석 결과를 이용해서 테마 정보를 추출하게 된다.
여기서, 테마 분류는 도 4에 도시된 바와 같이, 1차 및 2차 테마의 구조 정보로 되어 있을 수 있다. 예컨대, 테마 추출부(103)는 사용자의 여행 관련 질문에 호텔, 펜션, 리조트/콘도, 유스 호스텔,레지던스, 민박 및 숙박에 대응되는 결과를 포함할 경우, 1차 테마로는 숙박으로 분류하게 된다. 이러한 테마의 구조는 일례로서 이에 한정되지는 않는다.
지역 추출부(104)는 언어분석 결과를 이용해서 질문에 출현한 지역 정보를 추출한다. 즉, 지역 추출부(104)는 언어 분석 결과를 이용해서 사용자의 여행 관련 질문의 지역 제약 정보를 추출하게 된다. 또, 지역 추출부(104)는 미리 정의된 동 코드 값을 저장할 수 있다.
기타정보 추출부(105)는 문서 검색이나 필터링에 사용될 수 있는 키워드 정보를 저장한다. 즉, 기타 정보 추출부(105)는 언어 분석 결과를 이용해서 사용자의 여행 관련 질문의 문서 검색에 이용할 수 있도록 질의어 또는 불용어를 추출하게 된다.
상술한 질문 분석부에 의한 질문분석 결과의 예는 도 5에 도시된 바와 같다. 즉, 사용자의 여행 관련 질문이 '일본에서 가족과 갈 만한 계곡을 추천해줘'을 입력되었다고 가정한다. 그러면, POI 추출부(102)는 해당 여행 관련 질문에서 <주소 POI=일본>를 추출하고, 테마 추출부(103)는 <관광-가족여행>, <관광-계곡>를 추출한다. 그리고, 지역 추출부(104)는 <일본: 8203000100>을 추출하며, 8203000100는 '일본'의 동 코드 값이다. 또, 기타정보 추출부(105)는 질의어: 일본, 가족, 가다, 계곡, 추천, 불용어: 추천을 추출하게 된다.
도 6은 여행지 검색부의 내부 구성을 도시한 도면이다.
도 6을 참조하면, 여행지 검색부(20)는 지역기반 여행지 검색부(201), 테마기반 여행지 검색부(202), 문서기반 여행지 검색부(203), 여행지 필터링부(204)를 포함하여 구성된다.
지역기반 여행지 검색부(201)는 질문 분석결과 중 지역정보를 이용해서 여행지 DB(610)로부터 해당 지역의 여행지를 검색한다. 즉, 지역기반 여행지 검색부(201)는 사용자의 여행 관련 질문의 지역 제약 정보를 기반으로 해당 지역의 여행지를 검색하게 된다.
테마기반 여행지 검색부(202)는 질문 분석 결과 중 테마정보를 이용해서 여행지 DB(610)로부터 질문 테마의 여행지를 검색한다. 즉, 테마기반 여행지 검색부(202)는 사용자의 여행 관련 질문의 테마 정보를 기반으로 해당 테마의 여행지를 검색한다.
문서기반 여행지 검색부(203)는 질문의 기타 정보를 이용해서 문서를 검색하 고 문서에 달린 대표 POI를 여행지로 검색한다. 즉, 문서기반 여행지 검색부(203)는 사용자의 여행 관련 질문의 질의어 또는 불용어 정보를 기반으로 여행 관련 질문에 적합한 여행 문서를 검색해서 해당 여행 문서의 대표 POI를 여행지 검색결과로 제시하게 된다.
여행지 필터링부(204)는 상술한 3가지 검색 결과를 이용해서 사용자의 여행 관련 질문과 관련이 없는 여행지를 제거한다. 여기서, 현재 필터링 조건은 지역, 테마, 문서 기반 여행지 결과의 AND 조건을 만족시키는 여행지만 남긴다. 즉, 여행지 필터링부(204)는 검색된 여행지 결과들에 공통적으로 포함되지 않는 여행지를 필터링하게 된다.
도 7은 여행지 순위화부의 내부 구성을 나타낸 도면이다.
도 7을 참조하면, 여행지 순위화부(30)는 문서 유사도 기반 순위화부(301), POI 추출 신뢰도 기반 순위화부(302), 여행지 평판 기반 순위화부(303), 여행정보 제공 CP 기반 순위화부(304), 여행문서 유형 기반 순위화부(305)를 포함하여 구성된다.
문서유사도 기반 순위화부(301)는 상술한 질의어에 대한 여행 문서 검색결과의 문서 유사도 점수를 검색된 여행지별로 반영한다. 즉, 문서 유사도 기반 순위화부(301)은 여행 문서의 유사도 점수를 여행지 신뢰도에 반영한다.
POI 추출 신뢰도 기반 순위화부(302)는 문서로부터 추출된 POI의 추출 신뢰 도 점수를 검색된 여행지별로 반영한다. 즉, POI 추출 신뢰도 기반 순위화부(302)은 여행 문서에서 추출된 POI의 추출 신뢰도를 여행지 신뢰도에 반영하게 된다.
여행지 평판 기반 순위화부(303)는 문서의 여행지별 평판 정보를 검색된 여행지별로 반영한다. 즉, 여행지 평판 기반 순위화부(303)는 문서에서의 여행지에 대한 평판 정보를 여행지 신뢰도에 반영하게 된다.
여행정보 제공 CP 기반 순위화부(304)는 유명세, 순위, 평판 정보에 따라 미리 계산된 전문 여행업체별 점수를 검색된 여행지 정보를 제공한 업체에 따라 반영한다. 즉, 여행정보 제공 CP 기반 순위화부(304)는 여행지 정보를 제공한 전문 여행업체의 신뢰도 정보를 여행지 신뢰도에 반영한다.
여행문서 유형 기반 순위화부(305)는 여행 문서의 출처 유형에 따라 다음과 같은 레벨 점수를 부여한다. 즉, 여행문서 유형 기반 순위화부(305)는 문서 기반 여행지 검색부(203)로부터 검색된 문서의 유형에 따라 미리 정해진 신뢰도 점수를 여행지 신뢰도에 반영한다.
예를 들어, 여행 문서의 출처 유형에 대한 레벨 점수는 아래와 같이 표시할 수 있을 것이나 이에 한정되지는 않는다.
→ Level1: 여행 전문업체 제공 문서
→ Level2: 블로그 문서
→ Level3: 인터넷 일반 웹 문서
기타 정보 기반 순위화부(306)는 여행지 정보 중 추천에 유용한 정보를 이용 해서 추가 점수를 부여하는 기능을 수행한다. 여기서, 유용한 정보로는 이미지 정보, 주소 정보, 사용자 리뷰 정보, 사용자 평점 정보 등을 포함하게 된다. 즉, 기타정보 기반 순위화부(306)는 이미지 정보, 주소 정보, 사용자 리뷰 정보, 사용자 평점 정보 등의 여행지 관련 추가정보를 여행지 신뢰도에 반영한다.
도 8은 여행 정보 추출부의 내부 구성을 나타낸 도면이다.
도 8을 참조하면, 여행 정보 추출부(40)는 테마별 여행지 정보 추출부(401), 지역별 여행지 정보 추출부(402)를 포함하여 구성된다. 여기서, 추출 대상은 전문 여행업체로부터 획득된 정제된 정보 및 웹으로부터 자동으로 추출된 구조 정보를 대상으로 할 수 있다.
테마별 여행지 정보 추출부(401)는 여행지명, 주소, 테마 등의 여행지 정보를 테마별로 추출해서 여행지 DB(610)로 구축한다. 지역별 여행지 정보 추출부(402)는 여행지명, 주소, 테마 등의 여행지 정보를 지역별로 추출해서 여행지 DB(610)로 구축한다.
도 9는 문서 색인부의 내부 구성을 도시한 도면이다.
도 9를 참조하면, 문서 색인부(50)는 문서 언어 분석부(501), 색인어 추출 부(502), 대표 POI 추출부(503), 문서 신뢰도 추출부(504), 평판 정보 추출부(505), 역색인DB 생성부(506)를 포함하여 구성된다. 여기서, 색인 대상은 전문 여행업체에서 구축하거나 웹으로부터 자동으로 모아진 여행 문서를 대상으로 할 수 있다.
문서 언어 분석부(501)는 문서의 타이틀과 본문 내용에 대해서 언어 분석 기술을 적용하는 단계이며 형태소 분석과 개체명 인식을 수행한다. 즉, 문서 언어 분석부(501)는 여행 전문업체에서 제공하는 정제된 문서 또는 웹으로부터 자동으로 모아진 웹 여행 문서를 대상으로 형태소 분석 및 개체명 인식을 수행하게 된다.
색인어 추출부(502)는 언어분석 결과를 이용해서 의미 있는 색인어로 명사, 용언, 부사 등을 추출한다. 즉, 색인어 추출부(502)는 언어 분석 결과를 이용해서 검색에 유용한 의미있는 키워드를 추출한다.
대표 POI 추출부(503)는 문서에 출현한 POI를 분석해서 그 중에서 문서를 대표할 수 있는 주요 POI를 추출한다. 즉, 대표POI 추출부(503)는 문서에 출현한 모든 POI를 추출하고 추출된 POI를 순위화해서 문서를 대표할 수 있는 주요 POI를 뽑는다.
문서 신뢰도 추출부(504)는 문서의 출처, 날짜, 문서 품질 점수에 기반해서 문서 자체의 신뢰도를 계산한다. 즉, 문서 신뢰도 추출부(504)는 문서의 출처, 날짜, 문서 품질 점수에 기반해서 문서 자체의 신뢰도를 계산한다.
평판 정보 추출부(505)는 문서에 나온 객체를 대상으로 사용자 평판 정보를 추출해서 POI의 평판 점수를 계산한다. 즉, 평판 정보 추출부(505)는 문서에 나온 객체를 대상으로 사용자 평판 정보를 추출해서 POI의 평판 점수를 계산한다.
역색인DB 생성부(506)는 앞에서 추출된 모든 정보를 검색할 수 있도록 역색인DB(미도시)를 생성한다. 즉, 역색인DB 생성부(506)는 추출된 모든 정보를 검색에 이용할 수 있도록 역색인 DB를 구축하게 된다.
이처럼 본 발명에서는, 자연어 기반으로 찾고자하는 여행지 정보를 검색할 수 있는 효과를 갖는다.
또, 시스템이 미리 정의한 구조 정보에 사용자가 값을 채워서 여행 정보를 검색하지 않고 자연어로 자유롭게 질문을 할 수 있으므로 사용자가 쉽게 원하는 질문을 할 수 있는 효과가 있다.
또한, 본 발명에서는 사용자의 자연어 질문을 언어분석하여 POI 정보, 테마 정보, 지역 정보 등을 추출해서 사용자 의도에 적합한 여행지를 검색할 수 있고, 문서 유사도 점수, POI 추출 신뢰도, 여행지 평판 정보, CP 신뢰도, 문서 신뢰도 등의 다양한 신뢰도 점수를 기반으로 최종적으로 사용자 의도에 가장 적합한 여행지를 순위화해서 제시화 함으로써, 신뢰성(또는 정확성)을 높일 수 있는 효과를 갖는다.
이하, 본 발명의 실시예에 따른 자연어 기반 여행 추천 방법에 따른 여행 추천 과정을 첨부된 도면을 참조하여 보다 상세히 설명하도록 한다. 설명에 있어서, 도 1 내지 도 9에 도시된 동일한 구성은 같은 기능을 수행하는 것으로 한다. 아울 러, 설명에 있어서 도 5에 예시된 예시를 기준으로 설명하도록 한다.
도 10은 본 발명에 따른 자연어 기반 여행 추천 방법의 순서를 도시한 도면이고, 도 11은 도 10의 단계 'S10'의 세부 순서를 도시한 도면이고, 도 12는 도 10의 단계 'S20'의 세부 순서를 도시한 도면이고, 도 13은 도 10의 단계 'S30'의 세부 순서를 도시한 도면이다.
우선, 도 10을 참조하면, 사용자 인터페이스(미도시) 등을 통해 사용자의 여행 관련 질문이 입력된다(S1). 예를 들어, 사용자는 키패드 또는 터치패드 등을 이용하여 자연어(언어)로 질문을 입력하게 된다. 예를 들어, '일본에서 가족과 갈 만한 계곡을 추천해줘' 등을 입력한다.
다음, 질문 분석부(10)는 입력된 사용자의 여행 관련 질문을 언어 분석한 후 단계별로 문서 색인 DB(620)를 검색하는 방식으로 언어 분석 결과에 매칭되는 질문 분석 정보들을 추출하게 된다(S10). 예를 들어, '일본에서 가족과 갈만한 계곡을 추천해줘'에 대한 여행 관련 질문에 대하여 <주소 POI=일본>, <관광-가족여행>, <관광-계곡>, <일본: 8203000100>, 질의어: 일본, 가족, 가다, 계곡, 추천, 불용어: 추천 등의 질문 분석 정보들을 추출한다.
이어, 여행지 검색부(20)는 추출된 질문 분석 정보들 각각에 대해 매칭되는 추천 여행지들을 여행지 DB(610)에서 검색한다(S20). 예를 들어, 지역별 여행지(일본에 대응되는 여행지), 테마별 여행지(관광-가족여행, 관광-계곡 등에 대응되는 여행지), 문서 검색 기반 여행지( 질의어: 일본, 가족, 가다, 계곡, 추천, 불용어: 추천 등에 대응되는 여행지) 등을 검색한다.
다음, 여행지 순위화부(30)는 검색된 여행지를 다양한 문서 분석 결과 및 미리 계산된 여행지 신뢰도 정보를 이용해서 순위화 하게 된다(S30). 예를 들어, 검색된 추천 여행지별로 대응되는 신뢰도 정보, 즉 문서 유사도 점수, POI 추출 신뢰도 점수, 여행지 평판 점수, 여행정보 제공 CP 신뢰도 점수, 여행문서 유형 신뢰도 점수, 및 기타 신뢰도 점수 등을 기초로 가점 또는 레벨링하게 되는 것이다.
한편, 여행지 순위화부는, 검색된 추천 여행지들 중에서 사용자의 여행 관련 질문에 해당되지 않는 추천 여행지들은 필터링하여 제거하게 된다. 예를 들어, 지역, 테마, 문서 기반 여행지별로 검색된 추천 여행지 그룹 결과들을 AND 조건을 적용하여 공통적으로 검색되지 않은 추천 여행지들은 삭제하게 된다.
마지막으로, 여행 추천 제공부(40)는 최종적으로 상술한 사용자의 여행 관련 질문에 적합한 추천 여행지들을 제공하게 된다(S40). 예를 들어, 사용자의 여행 관련 질문에 대응되는 다수의 추천 여행지들을 순위화한 결과를 추천 여행지 목록으로 제공하게 된다.
도 11을 참조하여 상술한 단계 'S10'을 보다 상세히 설명하면,
우선, 질문 언어 분석부(101)는 사용자의 여행 관련 질문을 형태소 별로 구분하거나, 각 단어별 개체명을 매칭시키는 방식으로 언어 분석을 수행한다(S11).
이어, POI 추출부(102)는 상술한 사용자의 여행 관련 질문에 대한 언어 분석 결과를 이용해서 질문에 출현한 POI를 추출한다(S12). 예를 들어, <주소 POI=일본> 등.
다음, 테마 추출부(103)는 질문의 테마를 미리 정의된 테마 분류 중에서 1개를 선택한다(S13). 예를 들어, <관광-가족여행> 또는 <관광-계곡> 등.
또, 지역 추출부(104)는 언어분석 결과를 이용해서 질문에 출현한 지역 정보를 추출한다(S14). 예를 들어, <일본: 8203000100>
기타정보 추출부(105)는 언어 분석 결과를 이용해서 문서 검색이나 필터링에 사용될 수 있는 질의어 또는 불용어를 추출 한다(S15). 예를 들어, 질의어: 일본, 가족, 가다, 계곡, 추천, 불용어: 추천 등.
도 12를 참조하여 단계 'S20'을 보다 상세히 설명하면 다음과 같다.
우선, 지역기반 여행지 검색부(201)는 질문 분석결과 중 지역정보를 이용해서 여행지 DB(610)로부터 해당 지역의 여행지를 검색한다(S21).
다음, 테마기반 여행지 검색부(202)는 질문 분석 결과 중 테마정보를 이용해서 여행지 DB(610)로부터 질문 테마의 여행지를 검색한다(S22).
이어, 문서기반 여행지 검색부(203)는 질문의 기타 정보를 이용해서 문서를 검색하고 문서에 달린 대표 POI를 여행지로 검색한다(S23).
마지막으로, 여행지 필터링부(204)는 상술한 3가지 검색 결과를 이용해서 사용자의 여행 관련 질문과 관련이 없는 여행지를 제거한다(S24).
도 13을 참조하여 단계 'S30'을 보다 상세히 설명하면 다음과 같다.
우선, 문서유사도 기반 순위화부(301)는 상술한 질의어에 대한 여행 문서 검색결과의 문서 유사도 점수를 검색된 여행지별로 반영한다(S31).
다음, POI 추출 신뢰도 기반 순위화부(302)는 문서로부터 추출된 POI의 추출 신뢰도 점수를 검색된 여행지별로 반영한다(S32).
이어, 여행지 평판 기반 순위화부(303)는 문서의 여행지별 평판 정보를 검색된 여행지별로 반영한다(S33).
또, 여행정보 제공 CP 기반 순위화부(304)는 유명세, 순위, 평판 정보에 따라 미리 계산된 전문 여행업체별 점수를 검색된 여행지 정보를 제공한 업체에 따라 반영한다(S34).
이어, 여행문서 유형 기반 순위화부(305)는 여행 문서의 출처 유형에 따라 다음과 같은 레벨 점수를 부여한다(S35). 예를 들어, Level1: 여행 전문업체 제공 문서, Level2: 블로그 문서, Level3: 인터넷 일반 웹 문서 등.
마지막으로, 기타 정보 기반 순위화부(306)는 여행지 정보 중 추천에 유용한 정보를 이용해서 추가 점수를 부여한다(S36). 예를 들어, 이미지 정보, 주소 정보, 사용자 리뷰 정보, 사용자 평점 정보 등.
이처럼, 본 발명에서는 사용자의 자연어 기반 여행 관련 질문을 언어 분석하여 자연어 기반으로 검색된 추천 여행지 등의 여행 정보를 제공할 수 있기 때문에 사용자에게 편의를 제공할 수 있는 효과를 갖는다.
또, 본 발명은 언어 분석 결과로부터 추출된 POI 정보, 테마 정보, 지역 정보 등의 질문 분석 정보를 이용하여 사용자 의도에 적합한 여행지를 검색할 수 있 기 때문에 보다 유용한 여행 정보를 제공할 수 있는 효과를 갖는다.
아울러, 본 발명에서는 검색된 추천 여행지별로 문서 유사도 점수, POI 추출 신뢰도, 여행지 평판 정보, CP 신뢰도, 문서 신뢰도 등의 다양한 신뢰도 점수를 기반으로 순위화하여 사용자 의도에 가장 적합한 여행지를 제시할 수 있는 효과를 갖는다.
이상 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시예들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
도 1은 본 발명에 따른 자연어 기반 여행 추천 장치를 나타낸 전체 구성도.
도 2는 질문 분석부의 세부 구성을 도시한 도면이고, 도 3은 POI 추출부에서 추출된 POI의 구분 예를 도시한 도면.
도 4는 테마 추출부에서 분류된 1차 및 2차 테마 분류의 구조 정보를 예시한 도면.
도 5는 질문 분석부에 의한 질문분석 결과의 예를 도시한 도면.
도 6은 여행지 검색부의 내부 구성을 도시한 도면.
도 7은 여행지 순위화부의 내부 구성을 나타낸 도면.
도 8은 여행 정보 추출부의 내부 구성을 나타낸 도면.
도 9는 문서 색인부의 내부 구성을 도시한 도면.
도 10은 본 발명에 따른 자연어 기반 여행 추천 방법의 순서를 도시한 도면.
도 11은 도 10의 단계 'S10'의 세부 순서를 도시한 도면.
도 12는 도 10의 단계 'S20'의 세부 순서를 도시한 도면.
도 13은 도 10의 단계 'S30'의 세부 순서를 도시한 도면.
*도면의 주요부분에 대한 부호의 설명*
10 : 질문 분석부 20 : 여행지 검색부
30 : 여행지 순위화부 40 : 여행정보 추출부
50 : 문서 색인부 60 : 데이터 베이스
70 : 여행 추천 제공부 610 : 여행지 DB
620 : 문서 색인 DB

Claims (20)

  1. 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB로부터 상기 사용자의 의도 파악을 위한 적어도 하나 이상의 질문 분석 정보들을 추출하는 질문 분석부;
    추출된 상기 적어도 하나 이상의 질문 분석 정보들을 이용해서 상기 사용자를 위한 적어도 하나 이상의 추천 여행지들을 여행지 DB로부터 검색하는 여행지 검색부; 및
    검색된 상기 적어도 하나 이상의 추천 여행지들을 상기 사용자에게 제공하는 여행 추천 제공부를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  2. 청구항 1에 있어서,
    상기 적어도 하나 이상의 질문 분석 정보들은,
    POI 정보, 테마 정보, 지역 정보 및 기타 정보 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  3. 청구항 1에 있어서,
    상기 적어도 하나 이상의 추천 여행지들은,
    지역별 여행지, 테마별 여행지 및 문서 검색 기반 여행지 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  4. 청구항 1에 있어서,
    상기 적어도 하나 이상의 추천 여행지들을 상기 문서 색인 DB의 신뢰도 정보를 이용하여 순위화하는 여행지 순위화부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  5. 청구항 4에 있어서,
    상기 신뢰도 정보는,
    문서 유사도 점수, POI 추출 신뢰도 점수, 여행지 평판 점수, 여행정보 제공 CP 신뢰도 점수, 여행문서 유형 신뢰도 점수, 및 기타 신뢰도 점수 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  6. 청구항 4에 있어서,
    상기 여행지 순위화부는,
    상기 적어도 하나 이상의 추천 여행지들 중에서 상기 사용자의 여행 관련 질문에 해당되지 않는 여행지를 필터링하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  7. 청구항 1에 있어서,
    여행지를 테마별 또는 지역별로 구분해서 상기 여행지DB를 구축하는 여행 정 보 추출부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  8. 청구항 1에 있어서,
    여행 문서를 대상으로 색인어, 대표 POI, 문서 신뢰도 및 평판 정보 중 적어도 하나 이상을 추출해서 상기 문서 색인 DB를 구축하는 문서 색인부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  9. 청구항 1에 있어서,
    상기 질문 분석부는,
    상기 사용자의 여행 관련 질문을 형태소 분석 및 개체명 인식을 이용하여 언어 분석하는 질문 언어 분석부;
    상기 언어 분석 결과를 이용해서 상기 사용자의 여행 관련 질문에 출현한 POI를 추출하는 POI추출부;
    상기 언어 분석 결과를 이용해서 상기 사용자의 여행 관련 질문의 테마 정보를 추출하는 테마 추출부; 및
    상기 언어 분석 결과를 이용해서 상기 사용자의 여행 관련 질문의 지역 제약 정보를 추출하는 지역 추출부를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  10. 청구항 9에 있어서,
    상기 질문 분석부는,
    상기 언어 분석 결과를 이용해서 상기 사용자의 여행 관련 질문의 문서 검색에 이용할 수 있도록 질의어 또는 불용어를 추출하는 기타 정보 추출부(105)를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  11. 청구항 1에 있어서,
    상기 여행지 검색부는,
    상기 사용자의 여행 관련 질문의 지역 제약 정보를 기반으로 해당 지역의 여행지를 검색하는 지역기반 여행지 검색부; 및
    상기 사용자의 여행 관련 질문의 테마 정보를 기반으로 해당 테마의 여행지를 검색하는 테마기반 여행지 검색부를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  12. 청구항 11에 있어서,
    상기 여행지 검색부는,
    상기 사용자의 여행 관련 질문의 질의어 또는 불용어 정보를 기반으로 대응되는 여행 문서의 대표POI를 검색하는 문서기반 여행지 검색부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  13. 청구항 12에 있어서,
    상기 여행지 검색부는,
    검색된 여행지 결과들에 공통적으로 포함되지 않는 여행지를 필터링하는 여행지 필터링부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  14. 청구항 4에 있어서,
    상기 여행지 순위화부(30)는,
    여행 문서의 유사도 점수를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 문서 유사도 기반 순위화부;
    여행 문서에서 추출된 POI의 추출 신뢰도를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 POI 추출 신뢰도 기반 순위화부;
    문서에서의 여행지에 대한 평판 정보를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행지 평판 기반 순위화부;
    여행지 정보를 제공한 전문 여행업체의 신뢰도 정보를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행정보 제공 CP 기반 순위화부;
    문서 기반 여행지 검색부(203)로부터 검색된 문서의 유형에 따라 미리 정해진 신뢰도 점수를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 여행문서 유형 기반 순위화부; 및
    이미지 정보, 주소 정보, 사용자 리뷰 정보, 사용자 평점 정보 등의 여행지 관련 추가정보를 상기 적어도 하나 이상의 추천 여행지들 각각의 신뢰도에 반영하는 기타정보 기반 순위화부를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  15. 청구항 8에 있어서,
    상기 문서 색인부는,
    여행 전문업체에서 제공하는 정제된 문서 또는 웹으로부터 자동으로 모아진 웹 여행 문서를 대상으로 형태소 분석 및 개체명 인식을 수행하는 문서 언어 분석부;
    언어 분석 결과를 이용해서 검색에 유용한 의미있는 키워드를 추출하는 색인어 추출부;
    문서에 출현한 모든 POI를 추출하고 추출된 POI를 순위화해서 문서를 대표할 수 있는 주요 POI를 뽑는 대표POI 추출부;
    문서의 출처, 날짜, 문서 품질 점수에 기반해서 문서 자체의 신뢰도를 계산하는 문서 신뢰도 추출부; 및
    문서에 나온 객체를 대상으로 사용자 평판 정보를 추출해서 POI의 평판 점수를 계산하는 평판 정보 추출부;를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  16. 청구항 15에 있어서,
    상기 문서 색인부는,
    추출된 모든 정보를 검색에 이용할 수 있도록 역색인 DB를 구축하는 역색인 DB 생성부를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 장치.
  17. 질문 분석부가, 사용자의 여행 관련 질문을 언어 분석하여 문서 색인 DB로부터 상기 사용자의 의도 파악을 위한 적어도 하나 이상의 질문 분석 정보들을 추출하는 단계;
    여행지 검색부가, 추출된 상기 적어도 하나 이상의 질문 분석 정보들을 이용해서 상기 사용자를 위한 적어도 하나 이상의 추천 여행지들을 여행지 DB로부터 검색하는 단계; 및
    여행 추전 정보 제공부가, 검색된 상기 적어도 하나 이상의 추천 여행지들을 상기 사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 방법.
  18. 청구항 17에 있어서,
    상기 적어도 하나 이상의 질문 분석 정보들은,
    POI 정보, 테마 정보, 지역 정보 및 기타 정보 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 방법.
  19. 청구항 17에 있어서,
    상기 적어도 하나 이상의 추천 여행지들은,
    지역별 여행지, 테마별 여행지 및 문서 검색 기반 여행지 중 적어도 하나 이 상을 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 방법.
  20. 청구항 17에 있어서,
    여행지 순위화부가, 상기 적어도 하나 이상의 추천 여행지들을 상기 문서 색인 DB의 신뢰도 정보를 이용하여 순위화하는 단계를 더 포함하는 것을 특징으로 하는 자연어 기반 여행 추천 방법.
KR1020090126711A 2009-12-18 2009-12-18 자연어 기반 여행 추천 장치 및 방법 KR20110070057A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020090126711A KR20110070057A (ko) 2009-12-18 2009-12-18 자연어 기반 여행 추천 장치 및 방법
US12/969,489 US20110153654A1 (en) 2009-12-18 2010-12-15 Natural language-based tour destination recommendation apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090126711A KR20110070057A (ko) 2009-12-18 2009-12-18 자연어 기반 여행 추천 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20110070057A true KR20110070057A (ko) 2011-06-24

Family

ID=44152566

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090126711A KR20110070057A (ko) 2009-12-18 2009-12-18 자연어 기반 여행 추천 장치 및 방법

Country Status (2)

Country Link
US (1) US20110153654A1 (ko)
KR (1) KR20110070057A (ko)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002771A1 (en) * 2011-06-28 2013-01-03 Hewlett-Packard Development Company, L.P. Capturing intentions within online text
KR101348877B1 (ko) * 2012-04-27 2014-01-08 숙명여자대학교산학협력단 집합 기반의 검색 장치 및 방법
KR101409863B1 (ko) * 2012-08-21 2014-06-20 주식회사 솔트룩스 대용량 소셜 데이터 처리 장치
KR101494363B1 (ko) * 2014-07-21 2015-02-24 (주)문화마케팅연구소 지역별 호감도에 따른 관광 정보 제공 시스템 및 제공방법
KR20150143971A (ko) * 2014-06-13 2015-12-24 (주)달팽이 위치 기반의 여행용 빅데이터를 처리하기 위한 모바일 소셜 네트워크 서비스 시스템 및 그의 처리 방법
US9304984B2 (en) 2012-03-26 2016-04-05 Hewlett Packard Enterprise Development Lp Intention statement visualization
KR101627976B1 (ko) 2015-08-20 2016-06-08 심기평 여행자를 위한 맞춤형 서비스 제공 시스템 및 방법
KR20170067503A (ko) * 2015-12-08 2017-06-16 삼성전자주식회사 단말장치, 서버 및 이벤트 제안방법
KR101859052B1 (ko) * 2017-11-01 2018-05-18 주식회사 씨디에스 기상 기후 정보 기반의 관광 정보 연계 시스템 및 관광 정보의 제공 방법
KR20210009436A (ko) * 2013-04-17 2021-01-26 톰톰 네비게이션 비.브이. 디지털 맵에 관련된 위치들의 탐색 및 디스플레이를 용이하게 하는 방법, 기기 및 컴퓨터 소프트웨어
US11443116B2 (en) 2018-11-05 2022-09-13 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
KR102470207B1 (ko) * 2022-08-19 2022-11-23 주식회사 마이데이터랩 자연어 의도 분류를 이용한 문서 관리 장치 및 방법
KR102507077B1 (ko) * 2022-01-26 2023-03-07 웨이즈플랜 유한회사 여행 일정 검색 및 관리 방법 및 이를 이용하는 장치
US11741950B2 (en) 2019-11-19 2023-08-29 Samsung Electronics Co., Ltd. Method and apparatus with speech processing

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9378504B2 (en) * 2012-07-18 2016-06-28 Google Inc. Highlighting related points of interest in a geographical region
US20140214624A1 (en) * 2013-01-31 2014-07-31 Google Inc. Method And Interface For Comparing Costs Of Vacation Components
GB201306942D0 (en) * 2013-04-17 2013-05-29 Tomtom Int Bv Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
GB201306944D0 (en) 2013-04-17 2013-05-29 Tomtom Int Bv Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
US9317608B2 (en) * 2013-05-03 2016-04-19 Mapquest, Inc. Systems and methods for parsing search queries
KR102215815B1 (ko) * 2013-07-24 2021-02-16 엘지전자 주식회사 단말기 및 이의 제어방법
CN103678489A (zh) * 2013-11-12 2014-03-26 中国联合网络通信有限公司广东省分公司 智慧城市出行信息推荐方法及装置
JP6328260B2 (ja) * 2015-01-28 2018-05-23 三菱電機株式会社 意図推定装置及び意図推定方法
US20160306876A1 (en) * 2015-04-07 2016-10-20 Metalogix International Gmbh Systems and methods of detecting information via natural language processing
US10078858B2 (en) 2015-08-05 2018-09-18 Amadeus S.A.S. Systems, methods, and computer program products for implementing a free-text search database
KR102018331B1 (ko) 2016-01-08 2019-09-04 한국전자통신연구원 음성 인식 시스템에서의 발화 검증 장치 및 그 방법
CN106095762A (zh) * 2016-02-05 2016-11-09 中科鼎富(北京)科技发展有限公司 一种基于本体模型库的新闻推荐方法及装置
CN107609003B (zh) * 2017-07-20 2020-07-03 中国农业大学 一种乡村旅游推荐信息可视化方法及装置
CN107977883A (zh) * 2017-11-24 2018-05-01 清华大学 旅行包的推荐方法、装置及计算机设备
CN109508428B (zh) * 2019-01-21 2021-03-12 宿州学院 基于兴趣点真流行度与隐式信任挖掘的兴趣点推荐方法
US10852155B2 (en) * 2019-02-04 2020-12-01 Here Global B.V. Language density locator
US11586973B2 (en) 2019-03-22 2023-02-21 International Business Machines Corporation Dynamic source reliability formulation
US11238027B2 (en) * 2019-03-22 2022-02-01 International Business Machines Corporation Dynamic document reliability formulation
CN109949183A (zh) * 2019-04-04 2019-06-28 河南城建学院 共享体验式旅游系统
CN110471963B (zh) * 2019-08-14 2022-04-05 北京市商汤科技开发有限公司 数据处理方法、装置及存储介质
CN110659428A (zh) * 2019-09-18 2020-01-07 四川省绵阳太古软件有限公司 适用于阳虚体质的环境查询系统
TWI742450B (zh) 2019-10-16 2021-10-11 財團法人工業技術研究院 企劃書的自動化產生系統及其方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6526351B2 (en) * 2001-07-09 2003-02-25 Charles Lamont Whitham Interactive multimedia tour guide
US20040243307A1 (en) * 2003-06-02 2004-12-02 Pieter Geelen Personal GPS navigation device
US20080046298A1 (en) * 2004-07-29 2008-02-21 Ziv Ben-Yehuda System and Method For Travel Planning
US7835859B2 (en) * 2004-10-29 2010-11-16 Aol Inc. Determining a route to a destination based on partially completed route
US7831384B2 (en) * 2004-10-29 2010-11-09 Aol Inc. Determining a route to destination based on partially completed route
US7463977B2 (en) * 2006-02-24 2008-12-09 Barz Adventures Lp Location-relevant real-time multimedia delivery and control and editing systems and methods
US20080091482A1 (en) * 2006-03-31 2008-04-17 Travelocity.Com Lp System, method, and computer program product for reducing the burden on an inventory system by assembling a suggested themed travel itinerary in response to minimal user input
US20080195597A1 (en) * 2007-02-08 2008-08-14 Samsung Electronics Co., Ltd. Searching in peer-to-peer networks
US20090157664A1 (en) * 2007-12-13 2009-06-18 Chih Po Wen System for extracting itineraries from plain text documents and its application in online trip planning
US20090210262A1 (en) * 2008-02-15 2009-08-20 Remotian Systems, Inc. (Delaware Corporation) Methods and apparatus for automated travel
US20100257234A1 (en) * 2009-04-03 2010-10-07 Caughey David Method and apparatus for providing content to mobile recipients

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013002771A1 (en) * 2011-06-28 2013-01-03 Hewlett-Packard Development Company, L.P. Capturing intentions within online text
US9411860B2 (en) 2011-06-28 2016-08-09 Hewlett Packard Enterprise Development Lp Capturing intentions within online text
US9304984B2 (en) 2012-03-26 2016-04-05 Hewlett Packard Enterprise Development Lp Intention statement visualization
KR101348877B1 (ko) * 2012-04-27 2014-01-08 숙명여자대학교산학협력단 집합 기반의 검색 장치 및 방법
KR101409863B1 (ko) * 2012-08-21 2014-06-20 주식회사 솔트룩스 대용량 소셜 데이터 처리 장치
KR20210009436A (ko) * 2013-04-17 2021-01-26 톰톰 네비게이션 비.브이. 디지털 맵에 관련된 위치들의 탐색 및 디스플레이를 용이하게 하는 방법, 기기 및 컴퓨터 소프트웨어
KR20150143971A (ko) * 2014-06-13 2015-12-24 (주)달팽이 위치 기반의 여행용 빅데이터를 처리하기 위한 모바일 소셜 네트워크 서비스 시스템 및 그의 처리 방법
KR101494363B1 (ko) * 2014-07-21 2015-02-24 (주)문화마케팅연구소 지역별 호감도에 따른 관광 정보 제공 시스템 및 제공방법
KR101627976B1 (ko) 2015-08-20 2016-06-08 심기평 여행자를 위한 맞춤형 서비스 제공 시스템 및 방법
KR20170067503A (ko) * 2015-12-08 2017-06-16 삼성전자주식회사 단말장치, 서버 및 이벤트 제안방법
KR101859052B1 (ko) * 2017-11-01 2018-05-18 주식회사 씨디에스 기상 기후 정보 기반의 관광 정보 연계 시스템 및 관광 정보의 제공 방법
US11443116B2 (en) 2018-11-05 2022-09-13 Samsung Electronics Co., Ltd. Electronic apparatus and control method thereof
US11741950B2 (en) 2019-11-19 2023-08-29 Samsung Electronics Co., Ltd. Method and apparatus with speech processing
KR102507077B1 (ko) * 2022-01-26 2023-03-07 웨이즈플랜 유한회사 여행 일정 검색 및 관리 방법 및 이를 이용하는 장치
KR102470207B1 (ko) * 2022-08-19 2022-11-23 주식회사 마이데이터랩 자연어 의도 분류를 이용한 문서 관리 장치 및 방법

Also Published As

Publication number Publication date
US20110153654A1 (en) 2011-06-23

Similar Documents

Publication Publication Date Title
KR20110070057A (ko) 자연어 기반 여행 추천 장치 및 방법
KR101173561B1 (ko) 질문 형태 및 도메인 인식 장치 및 그 방법
CN107391706B (zh) 一种基于移动互联网的城市旅游问答系统
CN103678576B (zh) 基于动态语义分析的全文检索系统
JP7023821B2 (ja) 情報検索システム
KR101042515B1 (ko) 사용자의 의도에 기반한 정보 검색방법 및 정보 제공방법
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
WO2016107417A1 (zh) 基于旅游目标地域来挖掘旅游路线的方法和设备
US20040049499A1 (en) Document retrieval system and question answering system
JP2010039710A (ja) 情報収集装置、旅行案内装置、旅行案内システム及びコンピュータプログラム
CN103353894A (zh) 一种基于语义分析的数据搜索方法和系统
Binucci et al. Designing the content analyzer of a travel recommender system
Egbert et al. The role of the text in corpus and discourse analysis: Missing the trees for the forest
US20080270375A1 (en) Local news search engine
EP2306333A1 (en) Offline software library
US7257766B1 (en) Site finding
KR20120014458A (ko) 연관 규칙 마이닝을 이용한 주제어 기반 인터넷 정보 검색 방법
EP2251797A2 (en) Recognition of addresses from the body of arbitrary text
WO2007046445A1 (ja) 検索装置及び検索方法
JP4324650B2 (ja) 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム
Pan et al. Travel information search on the Internet: a preliminary analysis
Evensen et al. Voyageur: An experiential travel search engine
US9792378B2 (en) Computerized systems and methods for identifying a character string for a point of interest
KR101732873B1 (ko) 사용자 맞춤형 인기장소 추천 방법 및 시스템
KR100572751B1 (ko) 웹 기반의 지리정보 검색 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E601 Decision to refuse application