CN107391706A - 一种基于移动互联网的城市旅游问答系统 - Google Patents

一种基于移动互联网的城市旅游问答系统 Download PDF

Info

Publication number
CN107391706A
CN107391706A CN201710632353.7A CN201710632353A CN107391706A CN 107391706 A CN107391706 A CN 107391706A CN 201710632353 A CN201710632353 A CN 201710632353A CN 107391706 A CN107391706 A CN 107391706A
Authority
CN
China
Prior art keywords
scenic spot
information
poi
user
subsystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710632353.7A
Other languages
English (en)
Other versions
CN107391706B (zh
Inventor
王峰
谷琼
杭波
康长青
张其林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yiwang (Beijing) Enterprise Management Co.,Ltd.
Original Assignee
Hubei University of Arts and Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei University of Arts and Science filed Critical Hubei University of Arts and Science
Priority to CN201710632353.7A priority Critical patent/CN107391706B/zh
Publication of CN107391706A publication Critical patent/CN107391706A/zh
Application granted granted Critical
Publication of CN107391706B publication Critical patent/CN107391706B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/14Travel agencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Human Resources & Organizations (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于移动互联网的城市旅游问答系统,包括景区原始信息收集子系统、景区信息采集与融合子系统、景区信息关联子系统、用户查询与知识库匹配子系统、旅游问答知识库;景区原始信息收集子系统用于采集景区的原始信息;景区信息采集与融合子系统用于后期采集针对景区原始信息的补充信息;景区信息关联子系统用于将景区原始信息收集子系统、景区信息采集与融合子系统获得的景点信息间建立关联关系;用户查询与知识库匹配子系统用于给用户提供字段匹配与关键词查询;旅游问答知识库用于给出针对用户关于景区信息提问的相关问题回答。本专利可以辅助来旅游城市市内及其周边旅游的游客,能做到随时随地了解旅游景点及其周边环境。

Description

一种基于移动互联网的城市旅游问答系统
技术领域
本发明属于智慧城市技术领域,具体涉及一种基于移动互联网平台的为区域 性旅游业服务的城市旅游问答系统。
背景技术
智慧旅游的研究是当前科研领域的一大研究热点。当前,国内外学者针对问 答系统领域的研究做了很多相关工作,虽然鲜有直接针对旅游行业进行研究的问 答系统,但它们仍能对本专利的研究提供一些思路和参考性价值。现把与本专利 密切相关的研究进行总结,主要可概括为以下几个方面:
问答系统架构:商业智能应用允许用户查询、理解和分析组织中已存在的数 据以获取有用的知识和更好的决策。商业智能应用的核心是数据仓库,它用于在 公共数据存储中集成几种异构数据源。因此,在下一代商业智能应用中公共协议 应该被考虑:不仅来自于内部数据源,而且来自于不同的外部数据源(例如,大 数据,博客,社交网络等)。这些来自于竞争对手的相关更新信息可能为正确的 决策提供关键性的信息。这些外部数据通常通过传统Web搜索引擎获得,随着 用户在分析返回信息和把这些信息集成到商业智能上做出的巨大努力。Antonio Ferrández等人提出了一种集成数据仓库内部结构化数据和从问答系统获得的外 部非结构化数据的技术(文献1)。该集成通过数据仓库和问答系统的返回数据 展示到仪表盘上使得用户能处理各种类型的数据。另外,问答结果通过一种新数 据仓库以一种持久的方式存储以方便所得结果和不同问题,或相同问题与不同日 期的比较。
基于问答系统的用户兴趣模型:Jonathan Bergeron等人探索性的建立一种自 适应的用户兴趣模型(文献2)。他们提出的模型从用户搜索查询中利用隐含的 数据用于从DBpedia中选择类别信息。通过联合从多个查询收集到的类别信息并 利用这些类别间的语义关系,从而使得Jonathan Bergeron等人的系统建立用户兴 趣模型成为可能。这个模型通过包含年龄和有效期的概念,而被设计成能够对用 户随时间变化的兴趣产生应答。当查询一个歧义词时,该系统也包含了准确查找 到正确类别的机制。
搜索个性化的行为建模:用户行为为通过个性化改进搜索结果的相关性提供 了许多线索。一方面,用户行为为传递更好的相关性提供了特别强烈的信号。该 信号是一种单个用户的查询历史和被点击的文档。Paul N.Bennett等人是首先评 估短期(会话)行为和长期(历史)行为如何相互影响和如何可能被孤立或联合 使用,从而通过搜索个性化而最优化收益相关性贡献的学者(文献3)。他们关 键性的发现包括:在搜索会话开始的时候历史行为提供实质性利益;在扩展搜索 会话中,短期会话行为为大多数收益做出贡献;会话和历史行为的联合比使用其 中一个更优。他们同样也描述了在一个会话时间周期内每个模型改变的相对个性 的特征。他们的发现暗含了搜索系统的设计,这样就使用户个性化搜索行为得到 平衡。
个性化Web搜索:在Web搜索中,搜索结果的个性化提供了潜在的重大改 进。在许多可观测的用户属性中,近似的用户位置能特别容易让搜索引擎获得并 让首次进行Web搜索的用户允许其个性化。然而,作用于用户位置信息是不同 的,因为几乎没有Web文档包含一个地址,而该地址能够被解释成约束相关文 档的地址。此外,许多文档(如当地新闻报道,彩票结果,体育团的粉丝专页) 可能对物理地址没有响应。但在文档相关性中,用户位置的相关性仍旧发挥了重 要作用。Paul N.Bennett等人展示了如何使用物理地址和更多一般兴趣地址的概 念为网页推断出更多一般相关性的地址(文献4)。他们使用隐含用户行为的数 据计算这些信息,描述大多数以位置为中心的页面,表明位置信息能够被纳入到Web搜索排名中。
以词汇驱动的开源问答系统:在海量数据集中对知识表示进行访问是一件非 常有挑战性的事情。问答的目标在于通过简单易用的接口了解数据。然而,问答 系统非常复杂并且早期的方法在某个特定领域的问答显得非常单一。因而,特别 是许多组件被重新利用来设计和实施为新的改进方法往往显得笨重且无效率。因 此,强烈需要组合式的问答系统得以实现,使得表现最好的组件能够联合起来在 指定领域实现最大价值。考虑到功能的高变体可能在一个问答系统中被利用和在 新问答系统中被重新利用,Andreas Both等人提供了一种通过问答词汇驱动的方 法与现有方法进行比较(文献5),该方法由特定领域社区提供了强大的知识本 体。他们通过绑定现有词汇到核心问答词汇上而不再创造由外部组件提供的信息 的方法来实现。因此,他们为快速建立新的(特定领域的)问答系统提供了一种 实用的方法,而且通过多个领域核心问答词汇得到了重新利用。
问答系统的互操作性:问答系统对于理解数据来说是最大的挑战之一。数据 网吸引了问答社区的注意并且最近,许多模式感知的问答系统被介绍,而且研究 成果都是有意义的。然而,由于缺乏概念性描述问答系统的系统性方法,集成不 同方法是不太可能的。Kuldeep Singh等人展示了一种建立在摘要层上的消息驱 动词汇(文献6)。这种词汇从不同问答系统的概念图中得出结论,这样他们使 研究人员和工厂能实施消息驱动的问答系统并重新利用和扩展不同方法,而不存 在互操作性和扩展性的担忧。
医学问答系统:设计问答系统对自然语言问题的深度分析和有效性提出了要 求。这个设计任务的关键是将问题中表达的语义关系转化为可用计算机处理的表 示方法。Asma Ben Abacha等人在医学领域处理问题分析(文献7)。更准确地说, 他们研究如何将一个自然语言问题转化为一个可用计算机处理的表示。潜在的转 换过程要求决定性的三个关键点:1、什么是医学问题的主要特征;2、哪些方法 最适用于这些特征的抽取;3、怎样把抽取信息转换成一个机器可理解的表示。 他们展示了一个完整的问题分析方法,包括医学实体识别,语义关系抽取和自动 转换为SPARQL查询。研究支持SPARQL在问答的角度中能表示内容广泛的自 然语言问题的事实。
链接数据上的问答系统:问答系统是一种基于知识库,并将自然语言问题转 换为SPARQL的智能系统。为了改善实体、关系和自然语言文本之间的匹配程 度,Stefan Ruseti等人利用维基百科来抽取DBpedia实体的词汇,然后将它们和 问题进行匹配(文献8)。这些实体在本体论上得到了验证,并且缺失的实体能 够得到验证。
基于关系模式的问答系统:Elena Cabrio等人展示了一种叫做QAKiS的系统 (文献9),该系统用于链接数据上的开放域问答。它提出问题解释作为一种基 于关系匹配的挑战,其问题碎片被匹配为三元组存储的二元关系,并利用关系文 本模式自动收集。为了演示,关系模式可从维基百科中自动抽取,而DBpedia 是采用一种自然语言接口进行查询的RDF数据集。
特定领域的多语言问答架构:O′scar Ferra′ndez等人展示了一种叫做 QALL-ME的架构(文献10),该架构是一种可重用架构,它通过一种本体论建 模可在结构化数据上建立多种跨语言的问答系统。它是一种带一系列演示组件和 扩展文档的免费开源软件,这样能够使这款软件使用和采纳变得容易。QALL-ME 架构的主要特征如下:1、领域可移植性,通过本体论可将模型建立在目标领域 中;2、关于时间和空间问题的上下文感知;3、文本蕴含引擎作为问题解释核心 的使用;4、作为一种基于面向服务的架构,它为架构组件采用可交换的网络服 务来实现。另外,O′scar Ferra′ndez等人展示了一种运行实例阐述架构是如何处 理问题,并且一个案例研究表明,以QALL-ME架构为实例的问答应用的建立广 泛运用于旅游领域中的电影事件。
问答系统与语义Web的契合:随着当前语义Web的快速发展,搜索和查询 内容的处理在规模上和异质上变得日益具有挑战性。人性化的界面能够在查询和 探索新颖性、多样性和结构化的信息空间中支持终端用户,而这些需要语义Web 的可视化得以实现。VanessaLopez等人展现了一个基于问答系统的本体论调查 (文献11),该调查显示近些年来由Web上结构化语义信息提供的探索机遇。首 先,从上世纪70年代和其后几十年人工智能和数据库社区中具有影响力的研究 工作进展来看,在跟踪当前针对语义Web的开放人性化设计界面中的最先进技 术之前,通过利用1999年TREC的质量跟踪仿真的开放领域QA仿真,到最新商业语义QA解决方案,他们通过分析问答系统研究领域的整体背景和历史提供 了一个综合性的视角。其次,超出最先进技术之外,他们检验了在重用和查询语 义Web内容方面,该技术对终端用户支持的潜在性。
开放问答系统架构:与众多领域相关的数十亿个事实现在能够作为RDF数 据在Web上获得。然而,对于非专业用户来说,访问这些数据仍旧是一种挑战。 为了改善对数据的访问,方法对用户实施最小的障碍是必须的。虽然,许多链接 数据上的问答系统被提出,然而检索期望的数据仍旧是一个重大挑战。另外,开 发和评估问答系统仍旧是一项非常复杂的任务。为了克服这些障碍,Edgard Marx 等人提出了一种模块和可扩展开源的问答系统架构(文献12)。他们阐述了该架 构通过如何整合两种最先进的问答系统而被使用。评估结果表明,通过使用整合 的系统比单独系统整体实验结果要好一些。
互联数据上的问答系统:潜在关联数据架构的选择导致了一种数据源的概要, 它们在许多领域上包含了冗余和片段信息。使非专业用户访问该数据概要的一种 方法是提供关键词搜索架构,该方法能利用链接数据的固有特征。开发这些系统 因为三个原因而成为一项挑战性任务。首先,跨不同数据集或在同一数据集中的 资源可以是同音异议的。其次,不同数据集采用异构模式和实例的水平。Saeedeh Shekarpour等人提出了SINA(一种可扩展的关键词搜索系统)(文献13),它通 过在一系列互联数据源上,将用户提供的关键词和自然语言查询转换为连接的 SPARQL查询,能够回答用户的查询。SINA采用一种隐式马尔科夫模型并针对 一种来自不同数据集且用户支持的查询来决定最适合的资源。另外,该架构能通 过消除歧义资源和平衡链接结构作为数据集查询的基础来构造联合查询。
开放域问答系统:在解析和将自然语言问题转换为知识库可执行形式(例如, 逻辑形式)之后,大多数当前的问答系统查询知识库来回答问题。作为一个众所 周知的事实,知识库还远不够完整,因此用于回答问题的所需信息可能在知识库 中并不存在。Huan Sun等人开发了一种新问答系统(文献14),它能够直接从 Web中挖掘答案并同时将知识库作为一种进一步改善问答系统性能的重大辅助 而加以利用。Huan Sun等人首次尝试在Freebase中的候选答案阶段,将候选答 案链接到实体上。几个特别的优势可列举如下:1、候选答案中的冗余可被自动 降低;2、通过Freebase中那些对应的实体,一个答案的候选类型可毫不费力的 被确定;3、在Freebase中针对实体有效利用丰富的信息,他们在将候选答案链 接到Freebase后为每个候选答案开发了语义特征。特别地,他们构造了答案相关 类型的特征和两个新颖的概率模型,这些能在一个给定问题之下,直接评估一个 候选答案类型的契合程度。总的来说,这些语义特征在从大型候选答案池中确定 真实的答案方面发挥了重大作用。
基于模板的问答系统:当越来越多的RDF数据作为链接数据被发布的时候, 访问这些数据直观的方式变得越来越重要。作为一种直觉性和表现度的较好折衷 方式,问答方法被提出来了。大多数问答系统将问题转换为三元组,这样可为检 索答案进行RDF数据匹配,特别是在一些相似性标准中。然而,在许多情况下, 三元组并没有真实展现自然语言问题的语义结构,从而导致更多的表达查询不能 被回答。为了规避这个问题,ChristinaUnger等人提出了一种依赖于问题解析产 生SPARQL模板的新方法(文献15),该方法可直接映射问题的内部结构。这种 模板之后可利用统计实体识别和谓语探测被实例化。
已存在的问答系统虽各有特色,且功能已逐渐完备,但其研究与功能并不具 备较好的移植性,即无法被很好的应用于本专利的实际问题中。因此,迄今为止 暂不存在一种特定问答系统是基于移动互联网平台,且应用于城市智慧旅游的移 动端应用。由此可见,针对基于移动互联网平台下并辅助游客旅游的城市旅游问 答系统的研究及其应用,将具有其特色并具备较高的实际应用价值。
参考文献:
[1]Antonio Ferrández,Alejandro Maté,Jesús Peral et al.A framework forenriching Data Warehouse analysis with Question Answering systems[J].Journalof Intelligent Information Systems,46(1):61-82,2016.
[2]Jonathan Bergeron,Aron Schmidt,Richard Khoury et al.Building UserInterest Profiles Using DBpedia in a Question Answering System.In Proceedingsof the 29th International Florida Artificial Intelligence Research SocietyConference (2016):14-19.
[3]Paul N.Bennett,Ryen W.White,Wei Chu et al.Modeling the Impact ofShort-and Long-Term Behavior on Search Personalization.In Proceedings of the35th International Conference on Research on Development in InformationRetrieval, SIGIR 2012,pages 185-194,Portland,Oregon,USA,2012.
[4]Paul N.Bennett,Filip Radlinski,Ryen W.White et al.Inferring andusing location metadata to per-sonalize web search.In Proceedings of the 34thInternational Conference on Research on Development in Information Retrieval,SIGIR 2011, pages 135-144,Beijing,China,2011.
[5]Andreas Both,Dennis Diefenbach,Kuldeep Singh et al.Qanary-AMethodology for Vocabulary-driven Open Question Answering Systems.InProceedings of the 13th International Conference on The Semantic Web.LatestAdvances and New Domains,ESWC 2016,pages 625-641,Heraklion,Crete,Greece,2016.
[6]Kuldeep Singh,Andreas Both,Dennis Diefenbach et al.Towards aMessage-Driven Vocabulary forPromoting the Interoperability of QuestionAnswering Systems.Tenth IEEE International Conference on Semantic Computing,ICSC 2016, pages 386-389,Laguna Hills,CA,USA,2016.
[7]Asma Ben Abacha and Pierre Zweigenbaum.Medical question answering:translating medical questions into sparql queries.In ACM International HealthInformatics Symposium,IHI’12,Miami,FL,USA,January 28-30,2012,pages 41–50,2012.
[8]Stefan Ruseti,Alexandru Mirea,Traian Rebedea,and Stefan Trausan-Matu. Qanswer-enhanced entity matching for question answering over linkeddata.CLEF, 2015.
[9]Elena Cabrio,Julien Cojan,Alessio Palmero Aprosio,BernardoMagnini, Alberto Lavelli,and Fabien Gandon.Qakis:an open domain QA systembased on relational patterns.In Proceedings of the ISWC 2012 Posters&Demonstrations Track, Boston,USA,2012.
[10]O′scar Ferra′ndez,Christian Spurk,Milen Kouylekov,IustinDornescu, Sergio Ferr′andez,Matteo Negri,Rub′en Izquierdo,David Tom′as,Constantin Orasan,Guenter Neumann,Bernardo Magnini,and Jos′e Luis VicedoGonz′alez.The QALL-ME framework:A specifiable domain multilingual questionanswering architecture.J.Web Sem.,9(2):137–145,2011.
[11]Vanessa Lopez,Victoria Uren,Marta Sabou,and Enrico Motta.Isquestion answering fit for the se-mantic web?a survey.Semantic Web,2(2):125–155,2011.
[12]Edgard Marx,Ricardo Usbeck,Axel-Cyrille Ngonga Ngomo,Konrad H¨offner,Jens Lehmann,and S¨oren Auer.Towards an open question answeringarchitecture.In Proceedings of the 10th Int.Conf.on Semantic Systems,SEMANTiCS 2014,Leipzig,Germany,pages 57–60,2014.
[13]Saeedeh Shekarpour,Edgard Marx,Axel-Cyrille Ngonga Ngomo,and SrenAuer.Sina:Semantic interpretation of user queries for question answering oninterlinked data.Web Semantics:Science,Services and Agents on the World WideWeb,30:39–51,2015.Semantic Search.
[14]Huan Sun,Hao Ma,Wen-tau Yih,Chen-Tse Tsai,Jingjing Liu,and Ming-Wei Chang.Open domain question answering via semantic enrichment.InProceedings of the 24th International Conference on World Wide Web,WWW 2015,Florence,Italy,pages 1045–1055,2015.
[15]Christina Unger,Lorenz B¨uhmann,Jens Lehmann,Axel-Cyrille NgongaNgomo,Daniel Gerber,and Philipp Cimiano.Template-based question answeringover RDF data.In Proceedings of the 21st World Wide Web Conference 2012,WWW2012,Lyon,France,pages 639–648,2012.
发明内容
针对现有技术的缺陷,本专利提出了一种基于移动互联网的城市旅游问答系 统,用于辅助游客更优质、更便捷的享受旅行过程中的配套服务,更合理的规划 旅行路径和安排旅游行程。
本发明所采用的技术方案是:一种基于移动互联网的城市旅游问答系统,其 特征在于:包括景区原始信息收集子系统、景区信息采集与融合子系统、景区信 息关联子系统、用户查询与知识库匹配子系统、旅游问答知识库;
所述景区原始信息收集子系统,用于采集景区的原始信息;
所述景区信息采集与融合子系统,用于后期根据用户满意度反馈,采集针对 景区原始信息的补充信息;
所述景区信息关联子系统,用于将景区原始信息收集子系统、景区信息采集 与融合子系统获得的景点信息间建立关联关系;
所述用户查询与知识库匹配子系统,用于给用户提供字段匹配与关键词查询;
所述旅游问答知识库,用于给出针对用户关于景区信息提问的相关问题回答。
本发明的研究内容包括:
1、问答系统知识库的景点信息融合;
2、基于特定景区的知识库信息搜索;
3、基于区域位置的景区周边设施服务与推荐;
4、基于景区热度的视频网络信息采集与融合技术;
5、基于众包和视频采集的POI兴趣点融合方法。
本发明的有益效果为:
1、解决了旅游景点信息过时且无法实时更新的问题;
2、解决了搜索引擎信息量大带给游客筛选旅游信息费时费力的困扰;
3、使游客能查询旅游景点周边的配套设施的有效信息;
4、解决了搜索引擎无法提供旅游的实时相关信息,如某景点当前时段的游 客人数、到达某景点必经之路的拥堵情况;
5、解决了百度、高德等地图采用人工搜集POI兴趣点的方式,且无法针对 性搜索襄阳市内及其周边景区的问题。
附图说明
图1为本发明实施例的系统原理图;
图2为本发明实施例的3D网络拓扑树形结构模型示意图;
图3为本发明实施例的旅游问答知识库原理图。
图4为本发明实施例的旅游问答系统知识库的矩阵描述示意图。
具体实施方式
为了便于本领域普通技术人员理解和实施本发明,下面结合附图及实施例对 本发明作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解 释本发明,并不用于限定本发明。
随着移动互联网的发展和移动APP的普及,用户可利用城市旅游问答系统 的APP随时随地查询襄阳市内及周边热门景点的相关信息,以实时了解旅游过 程中的动态。例如,景点简介、旅游费用计算、旅游路线推荐、旅游旺季景点附 近停车场的使用情况、旅游热度、游客实时推送信息(文字、图片、声音等)和 旅途见闻、游客评价等。用户只需输入相应的关键词,即可方便获取上述旅游信 息。
本专利的研究目的旨在辅助来旅游城市市内及其周边旅游的游客,能做到随 时随地了解旅游景点及其周边环境。已存在的搜索引擎虽然可搜索到与旅游景点 相关的信息,但仍旧存在如下问题亟待解决:
1、旅游景点信息已过时且无法实时更新;
2、旅行景点信息的介绍信息量较大,且需通过人为去筛选和判断,费时费 力;
3、旅游景点周边的配套设施信息分布于互联网各处,对于从未到过该景点 的游客而言,可能很难搜集到有用信息,更有甚者可能搜集到错误的过时信息, 例如景区周边的美食和住宿的质量、价格、服务和推荐信息等;
4、搜索引擎无法提供旅游的实时相关信息,如某景点当前时段的游客人数、 到达某景点必经之路的拥堵情况。因此,如果游客有几个景区要游玩,有可能在 不知情的情况下选择其中一个景区的高峰时段游览。这样不仅会造成人山人海, 而且极有可能造成交通堵塞,引发交通事故;
5、由于百度、高德等地图采用人工搜集POI兴趣点的方式,往往无法全面 搜索全国所有景区内部的具体细节和配套设施,因此缺乏襄阳市内及其周边景区 的针对性搜索;
正是由于上述未解决问题的存在,从而为本专利的研究提供了契机。由此可 得出本专利研究的目的和意义:
1、当旅游景点信息已过时且无法实时更新时,本专利拟采用众包搜集、即 时审核的方式做到对景点信息的实时更新;
2、为了避免搜索引擎信息量大带给游客的困扰,本专利研究的问答系统拟 采用游客(语音或文字)输入关键词的直击游客感兴趣的信息,如游客的关键词 为“××景区景点”,就会列出景点列表供游客进一步筛选;
3、针对景点周边配套设施信息,拟采用基于区域位置服务的做法,将景区 周边的服务信息类似于美团、百度糯米一样,对配套信息进行集成并由商家自主 更新,系统即时审核;
4、利用高清监控网实时采集景区热度,包括景区内某时段某景点的游客人 数、景区必经之路的道路拥堵状况,除了能使游客掌握景区的实时相关信息,还 能监控景区及其周边情况,保证游客安全;
5、为了弥补百度、高德地图等移动APP对特定景区搜索信息量不足造成的 遗憾,本专利拟采用众包,并结合商家上传信息和高清摄像头视频采集的方法尽 可能地完善景区POI兴趣点。
本专利基于移动互联网平台,以襄阳市内及其周边的旅游景点为例对本发做 进一步的阐述。
本专利涉及的研究内容主要包括:
1、问答系统知识库的景点信息融合。
该信息的融合是知识库中原始资料逐步完善的过程,也是本专利研究的前提 条件。而信息的来源依照当前技术尚不能自动完成,因此仍旧需要依靠众包和系 统集成的方式来手动完成。需要融合的信息拟包含如下四类:
①景区基本信息,包括景区的位置、景区由哪些景点构成、各景点简介、 景区的历史和文化背景、景区的级别等;
②景区中各景点的POI信息,包括各景点名称、景点的GPS经纬度坐标、 景点周边一定距离内的配套设施(洗手间、餐厅、乘车点、休息点等)、景点热 度统计,具体统计信息可按年、月、周和日的景点热度进行划分;
③景区中各景点在景区地图上的路径规划,包括各景点在景区内的分布和 格局、各景点与景区出入口的远近关系、景区内部的路网信息;
④景区周边的配套设施信息,包括景区周边的停车场位置、酒店住宿的POI 信息、餐饮美食的POI信息、购物娱乐的POI信息,医院或急救点的POI信息, 等等。
2、基于特定景区的知识库信息搜索。
用户得到的搜索反馈信息是否是用户预期的满意信息,是该阶段研究的关键 性问题。解决该问题的关键在于建立符合用户喜好和搜索习惯的个性化搜索、知 识关联规则和满意度反馈机制。例如,用户搜索的关键词为“隆中风景区”,但 并未指定具体的内容。对于不同用户,他们会具有不同的喜好和搜索习惯。有些 用户习惯于漫无目的的获取与隆中风景区相关的所有信息,然后挑选感兴趣的内 容进一步细化阅读,针对这类用户则需要列出与关键词相关的二级词条“景点构 成”、“景区位置”、“历史背景”和它们的摘要信息,供用户进一步选择性细化阅 读。而有些用户的搜索具有针对性,那么针对这类用户则需要采用关键词提示的 方法供用户进一步确认搜索的关键词内容。无论用户具备哪些喜好或搜索习惯, 在后台知识库中,本专利都需对知识库中的相关知识做关键词提取、词条索引和知识规则的关联。然后,再赋予搜索引擎的接口,包括语音输入和识别的关键词 接口和纯文本输入的关键词接口。最后,还可增加用户满意度的反馈机制,让用 户对系统反馈的搜索结果进行评价,以期使得系统更加符合不同用户的个性化喜 好和搜索习惯。
3、基于区域位置的景区周边设施服务与推荐。
景区周边设施在设置上的合理性和完备性,与景区的游客数量具有不可割舍 的关联。影响乘客对周边服务设施的选择主要来源于以下因素:
①与用户游览所处当前位置的距离远近。用户在游览过程中若对美食或住 宿有强烈需求时,往往会选择离自己当前位置较近的餐厅或酒店,通常为步行距 离在1公里左右(按步行1公里15分钟计),车行距离10公里以内(按时速50 公里计)的POI兴趣点。用户食宿的结果往往也会呈现距离当前位置由近及远 的趋势。因此,距离是景区周边设施部署的重要因素;
②提供服务的及时性和便利性。不同年龄和层次的用户对服务的需求强烈 程度不同。例如,年老体弱和小朋友在旅游过程中对观光车或观光缆车的需求程 度较高。一旦这类人群对服务有需求时,往往要求服务能够具备及时性和便利性 的特点。同时,在针对这类用户或众多游客群中含有这类用户做路径规划与推荐 时,应考虑人群需求的特殊性;
③提供服务的品质和综合性。该因素是用户旅行过程中对周边服务提出的 又一重要性考量因素。在考虑距离因素的基础上,用户往往会对服务的品质和综 合性提出要求。例如,距离用户当前位置差别不大的两家酒店,酒店B服务态 度好,且具备饮食和娱乐等附加功能,酒店A虽然离用户当前位置稍近,尽管 酒店B的费用与酒店A相比略贵一点,用户在综合考虑后往往会选择酒店B;
④用户体验与大众游客评价。该因素对新游客和回头客的服务具有很重要 的影响。例如,餐厅A和餐厅B在美食品质、服务态度、大众评价和用户体验 等多方面进行比较,它们各方面的条件都差不多的前提下,若餐厅B善于利用 用户体验和大众游客评价,那么它就有可能吸引更多的新游客和回头客,从而在 美食方面略胜一筹。
在综合考虑上述因素的前提下,就可依据用户喜好进行个性化推荐服务。而 筛选条件,可参考上述列出的影响用户对服务需求的若干因素进行判断。
4、基于景区热度的视频网络信息采集与融合技术。
所谓景区热度,在本专利中主要特指单位时间(年、月、周或日)在景区内 的单位面积上容纳的游客人数。景区热度越高,表明单位时间内景区的游客量越 高。因此,它是衡量景区受游客欢迎程度的核心指标。以景区热度为度量指标, 利用高清视频设备对景区内的游客访问行为进行联网监控和信息采集,不仅能保 证景区内的游客安全和游览秩序,更能实时和有针对性的把握景区的游客群体和 数量。例如,什么时段年老体弱或低龄儿童游客较多,应适时提醒景区相关部门 注意或提前采取防范措施,以特别关注这类人群的需求;什么时段访问景区内某 景点的人数较多,可为景区内游客提供游览的合理化建议,以更改游览线路和景 点游玩次序,从而达到平均化景区内人群密度的目的。
5、基于众包和视频采集的POI兴趣点融合方法。视频采集除了上述4的应 用外,还可用于与众包技术结合,应用于POI兴趣点的采集与融合。由于景区 内及其周边的POI兴趣点数目众多,且会随着时间的推移有所增减和变化,利 用专人去做POI兴趣点的采集和核实工作往往费事费力,且无法及时更新。但 采用众包和视频采集相结合的采集技术则弥补了上述不足。例如,景区周边的酒 店价格调整可调动住宿的游客或商家去完成,只需在线上进行审核和发布即可。 景区周边某餐厅进行拆迁或位置迁移,通过该餐厅附近的高清摄像头就可即时察 觉,并对POI的状态信息进行更新,从而达到提醒游客关注实时变化的目的。
针对现有技术的缺陷,本专利提出的一种基于移动互联网的城市旅游问答系 统,用于辅助游客更优质、更便捷的享受旅行过程中的配套服务,更合理的规划 旅行路径和安排旅游行程。例如,作为一名初到襄阳市的游客,他可能对襄阳市 内和周边的景点并不熟悉,所有能获取的景点信息大都来源于百度等搜索引擎, 能获取的食宿信息大都来源于美团等移动客户端,能获取的地图服务大多来源于 高德等APP。而从上述移动端服务得到的信息大都具有一般性的特点,即这些服 务总体而言是针对全国范围而言,由此便必然导致这些服务可能无法针对特定地 域的旅游及周边配套服务提供专属功能。即便偶尔能够从互联网的海量信息中获 取到与旅游景点相关的若干零散信息,也极有可能是错误的过时信息。因此,给 用户带来不便和误导的实例不胜枚举。正是由于这些问题的存在,便给本专利研 究的必要性提供了契机。同时,也印证了本专利的研究成果将具有显著的实际应 用价值。
本专利基于移动互联网平台,为用户(游客)提供一种以城市旅游知识库为 基础的综合性问答系统服务。服务的对象主要为首次到景区旅游的游客、老弱病 残孕等社会广泛关注的特殊游客群体、安全防范意识薄弱的游客群体等。首次到 景区旅游的游客,由于对景区及其周边情况不熟悉,再加上从已存在的手机移动 端获取信息量不足,因此本专利研究的系统能够为新游客旅行带来便利;老弱病 残孕作为特殊游客群体,利用该问答系统同样会感觉人性化。特别地,当他们在 景区受伤时,根据问答系统的指引,他们会节约不少宝贵时间,并找到最近的医 院或急救点。接下来,将对本专利的研究方法与技术路线进行详细的阐述。
如图1所示,本发明提供的一种基于移动互联网的城市旅游问答系统,包括 景区原始信息收集子系统、景区信息采集与融合子系统、景区信息关联子系统、 用户查询与知识库匹配子系统、旅游问答知识库;
景区原始信息收集子系统,用于采集景区的原始信息;景区的原始信息包括 景区基本信息、景点POI信息、景区内各景点POI信息、周边POI信息、景区路 网信息;
景区基本信息,包括景区的位置、景区由哪些景点构成、各景点简介、景区 的历史和文化背景、景区的级别;
景点POI信息包含景区内各景点POI信息、景区内美食POI信息、景区内住 宿POI信息、景区内乘车点POI信息、景区内医疗点POI信息、景区内超市POI 信息、景区内停车场POI信息;
景区内各景点POI信息,包括各景点名称、景点的GPS经纬度坐标、景点周 边一定距离内的配套设施、景点热度统计;
周边POI信息,包括景区周边的停车场位置、酒店住宿的POI信息、餐饮美 食的POI信息、购物娱乐的POI信息,医院或急救点的POI信息;
景区路网信息,包括各景点在景区内的分布和格局、各景点与景区出入口的 远近关系、景区内部的路网信息;
景区信息采集与融合子系统包括视频信息采集模块、众包信息采集模块、POI 融合与标注模块;
视频信息采集模块,利用高清视频设备对景区内的游客访问行为进行联网监 控和信息采集,经过分析处理,合理规划游客游览线路和景点游玩次序,提前采 取防范措施,从而达到平均化景区内人群密度、特别关注特殊群体的需求;
众包信息采集与融合模块,此处的众包特指大众群体以个体行为的形式参与 到信息采集的活动中。其主要作用在于利用群体自发的积极行为以较短的时间采 集所需信息;
所谓众包就是利用大家作为志愿者,就像维基百科一样,共同采集和上传 POI信息,但是众包上传的POI信息中不乏有虚假信息,那么怎么确认信息的真 实性呢,(传统的搞法是打电话或者到找人实地确认,这里可利用景区监控的特 殊性,因为景区安装摄像头除了监控的作用以外,肯定也会采集到景区内的其它 信息,比如景区中建起了一个临时停车场,就可以通过监控识别到,同时结合并 认证众包上传的POI信息,大大节省了经济和人工成本,与传统方法相比,哪怕 众包没有上传变化信息,通过视频采集同样也可以确认POI的变化情况)这里就 利用视频采集和识别技术对众包POI的真实性进行认证,确认POI真实后,再标 注到景区地图上。
POI融合与标注模块,POI信息融合指的是同种POI信息融合或同类POI信 息的融合。例如,“隆中风景区”和“古隆中风景区”虽然说法不同,但二者在 POI信息融合的视角来看,属于同种POI信息;又如,“古隆中风景区”以主要 景点“古隆中”命名,且“古隆中”景点在景区地图上位于整个景区的中间位置, 因此二者属于同类POI信息,因此在地图上进行标注时可将二者进行融合。
景区信息关联子系统,用于将景区原始信息收集子系统、景区信息采集与融 合子系统获得的景点信息间建立关联关系;景区信息关联子系统,采用3D网络 拓扑树形结构模型将景区原始信息收集子系统、景区信息采集与融合子系统获得 的景点信息间建立关联关系;
3D网络拓扑树形结构模型包括三个维度:第1维为树层次、第2维为树分 叉序号、第3维为以分叉节点为根节点构建的子树;3D网络拓扑树形结构模型 中的节点是旅游景区信息内容的关键性词汇和分类依据;
3D网络拓扑树形结构模型依照维度的不同,各节点形成唯一的查询编码格 式;以3D3D网络拓扑树形结构模型中的各节点为查询关键词建立查询索引,索 引规则即查询编码,且每个关键词的索引存在且唯一;查询编码既代表节点标识, 又代表查询遍历路径。
用户查询与知识库匹配子系统,用于给用户提供字段匹配与关键词查询;用 户查询与知识库匹配子系统包括文本查询模块和语音查询模块,当用户进行文本 查询时,对文本进行中文分词,中文的语法分析和语义分析处理;当用户进行语 音查询时,则对语音进行识别,包括噪声处理、静音切除、语种识别、语音分帧、 特征提取、音素建模、单词组合,然后将语音转换为文本,最后对文本进行中文 分词,中文的语法分析和语义分析处理。
旅游问答知识库,其构建过程包括以下步骤:
步骤1:收集景区信息,构建知识库,包括问题知识库和答案知识库;
步骤2:提取和标记候选关键词,建立候选关键词索引,建立候选关键词模 型;
步骤3:通过对候选答案与问题进行问答匹配度评估在问题知识库和答案知 识库之间建立起关联关系;
步骤3:对候选答案与问题的匹配程度进行排名,并将排名靠前的若干个候 选答案提供给用户进行选择,同时让用户对问题的答案进行评价,并将评价的结 果及时反馈给城市旅游问答系统进行问答匹配度的修正和旅游问答知识库中知 识的替换与更新。
系统还包括旅游服务推荐模块,用于依据用户喜好向用户进行个性化推荐服 务。
本实施例在建立知识库之前,首先需要完成对景区原始信息的收集过程。为 了保证知识库系统中原始知识的准确性,故采用人工收集整理的方式进行。一方 面,可确保原始素材的可靠性;另一方面,可保证原始素材作为被学习知识的完 整性。此外,由于景区原始信息的收集过程需要反复与相关旅游景点交涉,需要 进行景点的实地考察,因此这也导致了原始数据积累不能采用机器学习的技术手 段进行。
本实施例的景区信息的采集与融合过程是对旅游问答知识库阶段的原始数 据收集工作的完善。以原始数据为参考依据,利用视频网络对景区及其周边的信 息变化进行捕获,与众包方式上传的同类信息进行交叉验证,从而完成众包数据 的审核过程。例如,景区内新开张了一家酒店,酒店持有人作为商家在本专利研 究的系统中注册并上传了该酒店(以POI形式)的相关信息。同时通过对该时 段前后的视频进行调用而不用亲历现场,就可快速审核众包方式上传数据的真伪, 从而大大节省全程手工更新POI最新数据的人工成本和时间成本。POI的融合与 标注表明,若众包上传数据为不存在数据,需对POI信息添加并在景区路网地 图上添加标注;若上传数据为已存在数据,则只需替换原始POI信息的内容,POI词条、索引和关键规则等均保持不变。
本实施例的景区信息关联规则的建立阶段整体上是在上述景点信息间建立 关系的阶段,同时这个阶段又为后面信息关键词的提取和建立信息查询的索引打 下基础。信息关联规则的模型拟采用3D网络拓扑树形结构(简称3D树)模型。 接下来以“隆中风景区”为例进行详细说明建模过程。如图2所示,为拟建立的3D树模型示例。
从图2中可以看出,以“(古)隆中风景区”为例的旅游景区信息以3D树模 型进行展示的部分示例。图中对旅游景区的所有信息通过关键词提取,并将这些 关键词作为词条进行编码,编码的作用在于它为信息查询索引做铺垫工作。图中 的关联规则详述如下:
1、3D树模型在图中可分为三个维度:树层次(第1维)、树分叉序号(第2 维)和以分叉节点为根节点构建的子树(第3维),这也就是3D树的由来。例 如,图中的第1维“(古)隆中风景区”,第2维“(古)隆中风景区-历史-简介”,第 3维“(古)隆中风景区-景点-古隆中-草庐亭-历史”,或者“(古)隆中风景区-交通- 市内交通-公交车-价格”;
2、3D树模型依照维度的不同,树中的各节点形成唯一的查询编码格式,默 认“(古)隆中风景区”作为根节点的编码为S。例如,“(古)隆中风景区-历史”和 “(古)隆中风景区-景点-古隆中-草庐亭-历史”,两种查询规则的查询编码分别为 “”和“”。虽然其最后一个节点都是“历史”,但由于查询编码不同,当用户输 入的关键词为“历史”时,系统会给出不同的查询提示供用户最终确认;
3、查询编码既代表节点标识,又代表查询遍历路径。例如,查询编码“” 和“”既标识节点“市内公交车价格”和“景区缆车价格”,又代表遍历路径“(古) 隆中风景区-交通-市内交通-公交车-价格”和“(古)隆中风景区-交通-景区交通- 缆车-价格”;
4、由于3D树模型中的节点是景区旅游信息内容的关键性词汇和分类依据, 因此信息关键词提取规则可直接参照3D树模型的节点规则;
5、以3D树模型中的各节点为查询关键词建立查询索引,索引规则即查询编 码,且每个关键词的索引存在且唯一。例如,虽然规则3中举例的关键词“价格” 有多个,但由于查询索引不同,返回给用户的查询结果也不同。
本实施例的旅游问答系统提供给用户的查询方式有两种:文本查询和语音查 询。即根据用户性格和偏好的不同,有些用户个性张扬且喜欢表现自我,他们通 常喜欢与大家分享自己的想法,因此他们多半青睐于语音查询方式;而有些用户 性格内敛,不喜将自己内心的想法曝露出去,他们则更加青睐于文本查询方式。 无论用户选择哪种查询方式,本专利研究所涉及的智能问答系统都要将用户的查 询内容进行分解,即需要经过中文分词、语义分析和语法分析等一系列文本挖掘 和处理的过程。此外,如果用户选择语音查询方式,则还需对用户语音输入的内 容进行语音识别。
旅游问答知识库的建立是城市旅游问答系统能高效、准确的回答游客作为系 统用户所提出问题的核心与关键,因此这对这类知识库的完整性、精度等度量指 标提出了较高要求。除了利用已存在的先进字段匹配与关键词查询技术外,综合 优化问答知识库的性能也是需要考虑的主要关键技术。接下来,将采用图3所示 的内容,详细介绍旅游问答知识库从建库、问答到答案给出,并反馈用户满意度 等一系列过程。
如图3所示,为旅游问答系统知识库的实现思路和过程的详细描述。从图中 可以看出,用户通过界面进行问题输入后,首先系统会通过问题的表述方式进行 问题查询方式判断。(判断提问方式是文本或语音)。如果是文本查询,则需对问 题内容进行文本挖掘的处理(即中文分词,中文的语法分析和语义分析等);如 果是语音问题,则需对语音进行识别,包括噪声处理、静音切除、语种识别、语 音分帧、特征提取、音素建模、单词组合等一系列子过程。然后,在后台将其转 换为文本内容。在此之后,进行图1中的字段匹配与关键词的查询过程。
在建立问答知识库前,首先需对知识库中知识的组成内容进行素材搜集和整 理,待知识库建立后,对知识库中的素材内容需要进行相应的处理。即,需对素 材提取候选关键词,并对关键词的内容进行人工标记,以便进行后续的关键词索 引过程。一般而言,只有建立关键词索引才能对用户问题实施关键词的查询过程。 既然是问答系统,就需对知识库的内容进行拆分,即将知识库根据实际需要拆分 为问题知识库和答案知识库,其中问题知识库中存放用户提出的各种需求和问题, 问题知识库中的问题来源于对用户历史问题的内容记录、频次统计和整理。答案 知识库中存放与问题知识库中的需求和问题相匹配的解答内容、解答思路和解答 详细过程。同时,在二者之间建立问答匹配度评估的关联。这一关联用于度量问 题与答案之间的匹配程度,并将这一过程与后续的用户满意度反馈相结合,共同 用于对知识库的优化,和对问题知识库和答案知识库中相关内容的更新与优化。
通过问答匹配度评估过程后的问题与答案间就建立了较高的匹配映射关系, 在此之后可对候选答案与问题的匹配程度进行排名,并将排名靠前的若干个候选 答案提供给用户进行选择,同时让用户对问题的答案进行评价,并将评价的结果 及时反馈给问答系统进行问答匹配度的修正和知识库中知识的替换与更新。
为了更直观的描述上文中的叙述过程,可将整个描述过程采用矩阵映射的方 式加以形式化表述,用以直观表述旅游问答系统知识库的运转机制。本专利研究 的矩阵描述方式请见图4,图中,Mq,k表示问题知识库与问题关键词之间的映射 关系矩阵,其中Rq→k表示二者之间的映射关系,Qi(i=1...n)表示问题及其个 数,Kj(j=1...m)表示问题关键词及其个数。从这里可以看出,一个问题可以 被拆解为多个关键词加以描述,同时一个关键词也可以运用于多个问题中。 Tij(i=1...n,j=1...m)表示问题i由问题关键词j所组成的文本内容。
Mk,k'表示问题关键词与答案关键词之间的映射关系矩阵,其中Rk→k'表示二 者之间的映射关系,Ki(i=1…n)表示问题关键词及其个数,K'j(j=1…m)表 示答案关键词及其个数。从这里可以看出,一个问题关键词可以对应于多个问题 答案关键词,同时一个答案关键词也可以运用于多个问题关键词中。 Tij(i=1…n,j=1…m)表示问题关键词i由答案关键词j予以解答的文本内 容。
Mk',a表示答案关键词与答案之间的映射关系矩阵,其中Rk'→a表示二者之间 的映射关系,K'i(i=1…n)表示答案关键词及其个数,Aj(j=1…m)表示答 案及其个数。从这里可以看出,一个答案关键词可以用以描述多个答案,同时一 个答案也可以运用多个答案关键词进行描述。Tij(i=1…n,j=1…m)表示答 案关键词i对答案j进行描述的文本内容。
Ma,rank表示答案与答案排名之间的映射关系矩阵,其中Ra→rank表示二者之间 的映射关系,Ai(i=1…n)表示答案及其个数,表示答案i的排 名。
表示答案与用户满意度之间的映射关系矩阵,其中表示二者之间 的映射关系,Ai(i=1…n)表示答案及其个数,Us,j(j=1…m)表示用户满意 度及其个数。从这里可以看出,一个答案可以被多个用户进行评价,可以拥有多 个用户满意度。同时一个用户也可以对多个答案进行评价,分别给出多个答案的 用户满意度评价。Pij(i=1…n,j=1…m)表示答案i由用户j予以评价的用 户满意度。
本专利解决的关键问题如下:
1、基于特定景区的问答系统知识库研究。
该知识库的建立需要存储特定景区中尽可能分布且与之密切相关的知识信 息。例如,某景区的细节地图及地图上标注的各种POI信息。当用户身处景区 并点击某POI位置点的时候,即可显示用户关注的POI信息,若用户有必要深 入了解,则景区地图上的POI点可对用户关注的景点做更详细的信息反馈,如 景点简介、景点周边服务、景点周边的关联景点;
2、基于特定景区的知识库信息融合与搜索。
当知识库建立后,用户可通过语音和文字输入两种关键词搜索的方式对本专 利研究的问答系统进行提问,系统会根据语音或文字输入进行识别与关联匹配, 即时反馈用户需要的搜索信息。当然,在此之前,需要对知识库中的相关信息间 建立关联规则和索引;
3、基于区域位置的景区周边设施服务与推荐。
同样地,用户可根据自身喜好和需求对景区周边的服务进行筛选,这种筛选 方式可以根据用户习惯的差异,采用1中的POI兴趣点方式和2中的关键词搜 索方式;
4、基于景区热度的视频网络信息采集与融合技术。
所谓景区热度主要指的是,某时段景区内部在单位面积所容纳的游客人数和 旅游车辆数目的总和。景区热度越高,单位面积的游客人数越多,旅游车辆的数 目也越多。由此,可判断该时段景区的游客拥堵程度和道路拥塞情况;
5、基于众包和视频采集的POI兴趣点融合方法。
其中,众包的POI兴趣点采集分为游客采集和商家采集两种上传更新方式。 通过视频采集的方式,可针对视频图像的识别,从视频信息中亦可提取景区周边 的POI兴趣点用于景区地图的标注。
本项目的创新之处主要可概括为如下几点:
1、利用众包技术采集并完善景区旅游信息,并结合视频网络信息审核认证 的思路是本专利研究的一大特色;
2、旅游问答系统中将知识库与景区地图进行关联,通过点击地图上的POI 兴趣点也可以得到知识库的知识反馈;
3、引入用户反馈机制,可将旅游问答系统的用户个性化功能得到逐步优化;
4、根据收集的景区旅游信息,提取关键词对信息分门别类,并依照关键词 建立了以关键词为节点的3D树模型;
5、3D树模型的节点存在且唯一的节点标识,既可作为查询关键词提示,又 可作为建立信息查询索引的参考依据;
应当理解的是,本说明书未详细阐述的部分均属于现有技术。
应当理解的是,上述针对较佳实施例的描述较为详细,并不能因此而认为是 对本发明专利保护范围的限制,本领域的普通技术人员在本发明的启示下,在不 脱离本发明权利要求所保护的范围情况下,还可以做出替换或变形,均落入本发 明的保护范围之内,本发明的请求保护范围应以所附权利要求为准。

Claims (8)

1.一种基于移动互联网的城市旅游问答系统,其特征在于:包括景区原始信息收集子系统、景区信息采集与融合子系统、景区信息关联子系统、用户查询与知识库匹配子系统、旅游问答知识库;
所述景区原始信息收集子系统,用于采集景区的原始信息;
所述景区信息采集与融合子系统,用于后期根据用户满意度反馈,采集针对景区原始信息的补充信息;
所述景区信息关联子系统,用于将景区原始信息收集子系统、景区信息采集与融合子系统获得的景点信息间建立关联关系;
所述用户查询与知识库匹配子系统,用于给用户提供字段匹配与关键词查询;
所述旅游问答知识库,用于给出针对用户关于景区信息提问的相关问题回答。
2.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述景区的原始信息包括景区基本信息、景点POI信息、景区内各景点POI信息、周边POI信息、景区路网信息;
所述景区基本信息,包括景区的位置、景区由哪些景点构成、各景点简介、景区的历史和文化背景、景区的级别;
所述景点POI信息包含景区内各景点POI信息、景区内美食POI信息、景区内住宿POI信息、景区内乘车点POI信息、景区内医疗点POI信息、景区内超市POI信息、景区内停车场POI信息;
所述景区内各景点POI信息,包括各景点名称、景点的GPS经纬度坐标、景点周边一定距离内的配套设施、景点热度统计;
所述周边POI信息,包括景区周边的停车场位置、酒店住宿的POI信息、餐饮美食的POI信息、购物娱乐的POI信息,医院或急救点的POI信息;
所述景区路网信息,包括各景点在景区内的分布和格局、各景点与景区出入口的远近关系、景区内部的路网信息。
3.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述景区信息采集与融合子系统,包括视频信息采集模块、众包信息采集模块、POI融合与标注模块;
所述视频信息采集模块,利用高清视频设备对景区内的游客访问行为进行联网监控和信息采集,经过分析处理,合理规划游客游览线路和景点游玩次序,提前采取防范措施,从而达到平均化景区内人群密度、特别关注特殊群体的需求;
所述众包信息采集与融合模块,用于大众群体以个体行为的形式参与信息采集,并对众包POI的真实性进行认证,确认POI真实后,再标注到景区地图上;
所述POI融合与标注模块,用于同种POI信息融合或同类POI信息的融合,融合后再标注到景区地图上。
4.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述景区信息关联子系统,采用3D网络拓扑树形结构模型将景区原始信息收集子系统、景区信息采集与融合子系统获得的景点信息间建立关联关系;
所述3D网络拓扑树形结构模型包括三个维度:第1维为树层次、第2维为树分叉序号、第3维为以分叉节点为根节点构建的子树;3D网络拓扑树形结构模型中的节点是旅游景区信息内容的关键性词汇和分类依据;
所述3D网络拓扑树形结构模型依照维度的不同,各节点形成唯一的查询编码格式;以3D3D网络拓扑树形结构模型中的各节点为查询关键词建立查询索引,索引规则即查询编码,且每个关键词的索引存在且唯一;查询编码既代表节点标识,又代表查询遍历路径。
5.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述用户查询与知识库匹配子系统,包括文本查询模块和语音查询模块。
6.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述用户查询与知识库匹配子系统,当用户进行文本查询时,对文本进行中文分词,中文的语法分析和语义分析处理;当用户进行语音查询时,则对语音进行识别,包括噪声处理、静音切除、语种识别、语音分帧、特征提取、音素建模、单词组合,然后将语音转换为文本,最后对文本进行中文分词,中文的语法分析和语义分析处理。
7.根据权利要求1所述的基于移动互联网的城市旅游问答系统,其特征在于:所述旅游问答知识库,其构建过程包括以下步骤:
步骤1:收集景区信息,构建知识库,包括问题知识库和答案知识库;
步骤2:提取和标记候选关键词,建立候选关键词索引,建立候选关键词模型;
步骤3:通过对候选答案与问题进行问答匹配度评估在所述问题知识库和答案知识库之间建立起关联关系;
步骤4:对候选答案与问题的匹配程度进行排名,并将排名靠前的若干个候选答案提供给用户进行选择,同时让用户对问题的答案进行评价,并将评价的结果及时反馈给城市旅游问答系统进行问答匹配度的修正和旅游问答知识库中知识的替换与更新。
8.根据权利要求1-7任意一项所述的基于移动互联网的城市旅游问答系统,其特征在于:所述系统还包括旅游服务推荐模块,用于依据用户喜好向用户进行个性化推荐服务。
CN201710632353.7A 2017-07-28 2017-07-28 一种基于移动互联网的城市旅游问答系统 Active CN107391706B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710632353.7A CN107391706B (zh) 2017-07-28 2017-07-28 一种基于移动互联网的城市旅游问答系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710632353.7A CN107391706B (zh) 2017-07-28 2017-07-28 一种基于移动互联网的城市旅游问答系统

Publications (2)

Publication Number Publication Date
CN107391706A true CN107391706A (zh) 2017-11-24
CN107391706B CN107391706B (zh) 2020-06-23

Family

ID=60341399

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710632353.7A Active CN107391706B (zh) 2017-07-28 2017-07-28 一种基于移动互联网的城市旅游问答系统

Country Status (1)

Country Link
CN (1) CN107391706B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107944735A (zh) * 2017-12-06 2018-04-20 国云科技股份有限公司 一种基于古诗词的旅游景区品牌价值分析方法
CN108010531A (zh) * 2017-12-14 2018-05-08 南京美桥信息科技有限公司 一种可视智能问询方法及系统
CN108038558A (zh) * 2017-11-29 2018-05-15 广西博点旅游产业发展有限公司 一种旅游协助系统
CN108416060A (zh) * 2018-03-23 2018-08-17 芜湖乐锐思信息咨询有限公司 一种基于移动互联的城市旅游问答系统
CN108491514A (zh) * 2018-03-26 2018-09-04 清华大学 对话系统中提问的方法及装置、电子设备、计算机可读介质
WO2019114430A1 (zh) * 2017-12-15 2019-06-20 王碧波 自然语言提问的理解方法、装置及电子设备
CN109919657A (zh) * 2019-01-24 2019-06-21 珠海格力电器股份有限公司 用户需求信息的获取方法、装置、存储介质及语音设备
CN110362658A (zh) * 2019-07-15 2019-10-22 义乌工商职业技术学院 基于知识库的智能学习机辅导系统
CN110598154A (zh) * 2019-09-16 2019-12-20 新疆银狐数据科技有限公司 一种基于融合多渠道数据的旅游综合统计大数据平台
CN110992215A (zh) * 2019-12-10 2020-04-10 浙江力石科技股份有限公司 基于语义分析的旅游服务推荐系统、数据库和推荐方法
CN111090724A (zh) * 2019-11-21 2020-05-01 新华智云科技有限公司 一种基于深度学习的可评判文本内容与实体相关性的实体抽取方法
CN111161706A (zh) * 2018-10-22 2020-05-15 阿里巴巴集团控股有限公司 交互方法、装置、设备和系统
CN111275586A (zh) * 2020-03-26 2020-06-12 海南鸿达盛创网络信息科技有限公司 一种全域旅游数据分析平台
CN111310448A (zh) * 2020-02-10 2020-06-19 江苏满运软件科技有限公司 数据增补方法、系统、设备和存储介质
CN112820288A (zh) * 2020-12-31 2021-05-18 北京搜狗科技发展有限公司 一种交互方法和耳机设备
CN112863509A (zh) * 2021-01-04 2021-05-28 高悦 设备租赁式智能旅游伴行平台
CN113407716A (zh) * 2021-05-14 2021-09-17 桂林电子科技大学 一种基于众包的人类行为文本数据集的构造以及处理方法
CN114297362A (zh) * 2021-12-31 2022-04-08 浙江力石科技股份有限公司 一种基于文旅行业结合算法对问答系统
CN114418533A (zh) * 2022-01-13 2022-04-29 北京声智科技有限公司 问卷处理方法、装置、设备、存储介质和计算机程序产品
CN118521437A (zh) * 2024-07-24 2024-08-20 南京信息工程大学 一种基于协同演化多目标算法的跨城旅游规划方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
CN104732351A (zh) * 2015-04-02 2015-06-24 江苏有客网络科技有限公司 一种省市县三级分布式并行管理旅游数字化信息系统
US20160314114A1 (en) * 2013-12-09 2016-10-27 International Business Machines Corporation Testing and Training a Question-Answering System
CN106294616A (zh) * 2016-08-02 2017-01-04 长江大学 一种基于移动互联网的智能问答机器人系统
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101373532A (zh) * 2008-07-10 2009-02-25 昆明理工大学 旅游领域faq中文问答系统实现方法
US20160314114A1 (en) * 2013-12-09 2016-10-27 International Business Machines Corporation Testing and Training a Question-Answering System
CN104732351A (zh) * 2015-04-02 2015-06-24 江苏有客网络科技有限公司 一种省市县三级分布式并行管理旅游数字化信息系统
CN106777274A (zh) * 2016-06-16 2017-05-31 北京理工大学 一种中文旅游领域知识图谱构建方法及系统
CN106294616A (zh) * 2016-08-02 2017-01-04 长江大学 一种基于移动互联网的智能问答机器人系统

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038558A (zh) * 2017-11-29 2018-05-15 广西博点旅游产业发展有限公司 一种旅游协助系统
CN107944735A (zh) * 2017-12-06 2018-04-20 国云科技股份有限公司 一种基于古诗词的旅游景区品牌价值分析方法
CN108010531A (zh) * 2017-12-14 2018-05-08 南京美桥信息科技有限公司 一种可视智能问询方法及系统
WO2019114430A1 (zh) * 2017-12-15 2019-06-20 王碧波 自然语言提问的理解方法、装置及电子设备
CN108416060A (zh) * 2018-03-23 2018-08-17 芜湖乐锐思信息咨询有限公司 一种基于移动互联的城市旅游问答系统
CN108491514A (zh) * 2018-03-26 2018-09-04 清华大学 对话系统中提问的方法及装置、电子设备、计算机可读介质
CN108491514B (zh) * 2018-03-26 2020-12-01 清华大学 对话系统中提问的方法及装置、电子设备、计算机可读介质
CN111161706A (zh) * 2018-10-22 2020-05-15 阿里巴巴集团控股有限公司 交互方法、装置、设备和系统
CN109919657A (zh) * 2019-01-24 2019-06-21 珠海格力电器股份有限公司 用户需求信息的获取方法、装置、存储介质及语音设备
CN110362658A (zh) * 2019-07-15 2019-10-22 义乌工商职业技术学院 基于知识库的智能学习机辅导系统
CN110598154A (zh) * 2019-09-16 2019-12-20 新疆银狐数据科技有限公司 一种基于融合多渠道数据的旅游综合统计大数据平台
CN110598154B (zh) * 2019-09-16 2023-04-07 新疆银狐数据科技有限公司 一种基于融合多渠道数据的旅游综合统计大数据系统
CN111090724A (zh) * 2019-11-21 2020-05-01 新华智云科技有限公司 一种基于深度学习的可评判文本内容与实体相关性的实体抽取方法
CN110992215A (zh) * 2019-12-10 2020-04-10 浙江力石科技股份有限公司 基于语义分析的旅游服务推荐系统、数据库和推荐方法
CN110992215B (zh) * 2019-12-10 2023-10-13 浙江力石科技股份有限公司 基于语义分析的旅游服务推荐系统、数据库和推荐方法
CN111310448A (zh) * 2020-02-10 2020-06-19 江苏满运软件科技有限公司 数据增补方法、系统、设备和存储介质
CN111310448B (zh) * 2020-02-10 2023-10-31 江苏满运软件科技有限公司 数据增补方法、系统、设备和存储介质
CN111275586A (zh) * 2020-03-26 2020-06-12 海南鸿达盛创网络信息科技有限公司 一种全域旅游数据分析平台
CN112820288A (zh) * 2020-12-31 2021-05-18 北京搜狗科技发展有限公司 一种交互方法和耳机设备
CN112863509A (zh) * 2021-01-04 2021-05-28 高悦 设备租赁式智能旅游伴行平台
CN113407716B (zh) * 2021-05-14 2022-08-19 桂林电子科技大学 一种基于众包的人类行为文本数据集的构造以及处理方法
CN113407716A (zh) * 2021-05-14 2021-09-17 桂林电子科技大学 一种基于众包的人类行为文本数据集的构造以及处理方法
CN114297362A (zh) * 2021-12-31 2022-04-08 浙江力石科技股份有限公司 一种基于文旅行业结合算法对问答系统
CN114418533A (zh) * 2022-01-13 2022-04-29 北京声智科技有限公司 问卷处理方法、装置、设备、存储介质和计算机程序产品
CN118521437A (zh) * 2024-07-24 2024-08-20 南京信息工程大学 一种基于协同演化多目标算法的跨城旅游规划方法
CN118521437B (zh) * 2024-07-24 2024-09-17 南京信息工程大学 一种基于协同演化多目标算法的跨城旅游规划方法

Also Published As

Publication number Publication date
CN107391706B (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
CN107391706A (zh) 一种基于移动互联网的城市旅游问答系统
CN106294616B (zh) 一种基于移动互联网的智能问答机器人系统
US20100211308A1 (en) Identifying interesting locations
US20110231353A1 (en) Artificial intelligence application in human machine interface for advanced information processing and task managing
JP2019504410A (ja) 旅行ガイド生成方法及びシステム
CN107407572A (zh) 沿路线搜索
CN104903886A (zh) 基于社交图谱信息的结构化搜索查询
CN110413886A (zh) 一种兴趣点展示方法及装置
JP6968897B2 (ja) 登録されていないリソースによるオーディオベースのネットワークセッションの確立
JP2007219655A (ja) 施設情報管理システム、施設情報管理方法および施設情報管理プログラム
Tulić Ceballos The impact of web 3.0 technologies on tourism information systems
CN105678383B (zh) 基于本体模型的移动知识服务系统
CN112084401A (zh) 一种旅游路线定制装置及方法
JP5839978B2 (ja) ナビゲーション装置
JP6932162B2 (ja) 地域に基づくアイテム推薦端末装置及びアイテム推薦情報提供方法。
KR20190107252A (ko) 가상 캐릭터의 커스터마이징 학습을 통한 ar기반 테마여행 ai 큐레이션 제공시스템
Akbar et al. Design Website for Digital Promotion SMEs Product by Optimize SEO Techniques
JP6457058B1 (ja) 知的財産システム、知的財産支援方法および知的財産支援プログラム
US11954608B2 (en) Generating comparison information
KR101734970B1 (ko) 사용자 검색의도에 부합하는 검색 결과 제공 방법 및 시스템
Sun et al. Urban region function mining service based on social media text analysis
Khairkar et al. Travelling Chatbot Using Android Application
JP2013045182A (ja) 情報検索装置及び方法及びプログラム
Sánchez Comparison of memorable tourist experiences based on collections of reviews from trip advisor: Acropolis of Athens and Royal Alcazar of Seville
Visuwasam et al. Smart personalised recommendation system for wanderer using prediction analysis

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20201217

Address after: NO.402, 4th floor, 157 Dongsi South Street, Dongcheng District, Beijing

Patentee after: Yiwang (Beijing) Enterprise Management Co.,Ltd.

Address before: No. 296, Longzhong Road, Xiangcheng District, Xiangyang City, Xiangfan City, Hubei Province 441053

Patentee before: HUBEI University OF ARTS AND SCIENCE

TR01 Transfer of patent right