CN107368923A - 景点热度预测方法及装置 - Google Patents
景点热度预测方法及装置 Download PDFInfo
- Publication number
- CN107368923A CN107368923A CN201710599020.9A CN201710599020A CN107368923A CN 107368923 A CN107368923 A CN 107368923A CN 201710599020 A CN201710599020 A CN 201710599020A CN 107368923 A CN107368923 A CN 107368923A
- Authority
- CN
- China
- Prior art keywords
- sight spot
- predicted
- feature
- theme
- temperature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000008859 change Effects 0.000 claims abstract description 78
- 230000004927 fusion Effects 0.000 claims abstract description 60
- 238000002372 labelling Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 abstract description 11
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 230000018109 developmental process Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 241000282326 Felis catus Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000004549 pulsed laser deposition Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/14—Travel agencies
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Development Economics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种景点热度预测方法及装置。所述方法包括:获取待预测景点的景点信息;对该景点的文本信息进行分析,从景点层级模型的主题层中获取到与该景点对应的主题;根据所述主题从景点层级模型的标签层中获取与所述主题对应的热度变化标签模型;分别从该景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;根据所述融合特征及热度变化标签模型,对该景点进行标签分类,得到该景点对应的热度变化标签,以完成对待预测景点的热度预测。所述方法能够进行准确性高的热度预测,提高景点推荐范围,利于对具有潜在价值的冷门景点的挖掘工作,提高旅游业的发展速度。
Description
技术领域
本发明涉及景点热度预测技术领域,具体而言,涉及一种景点热度预测方法及装置。
背景技术
随着旅游业的不断发展,景点推荐技术也得到了巨大的提升,但就目前而言,景点推荐技术采用的景点热度预测技术的预测准确性不高,主要集中于对游客选择不同景点的事件进行分析,以此实现相应的热度预测,使得景点推荐的范围往往被限制于当前被选择次数多的景点,忽略了很多在后续发展中具有巨大商业价值的冷门景点,限制了旅游业的发展。
发明内容
为了克服现有技术中的上述不足,本发明的目的在于提供一种景点热度预测方法及装置。所述景点热度预测方法的预测准确性高,是基于景点本身特点进行分析预测的,能够大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。
就景点热度预测方法而言,本发明较佳的实施例提供一种景点热度预测方法。所述方法包括:
获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息;
对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,其中,所述主题层包括多个用于对景点进行聚类的主题;
根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;
分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;
根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
就景点热度预测装置而言,本发明较佳的实施例提供一种景点热度预测装置。所述装置包括:
信息获取模块,用于获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息;
主题获取模块,用于对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,其中,所述主题层包括多个用于对景点进行聚类的主题;
模型获取模块,用于根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;
特征融合模块,用于分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;
标签分类模块,用于根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
相对于现有技术而言,本发明较佳的实施例提供的景点热度预测方法及装置具有以下有益效果:所述景点热度预测方法的预测准确性高,是基于景点本身特点进行分析预测的,能够大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。具体地,所述方法通过获取待预测景点对应的景点信息,得到待预测景点的文本信息及图片信息;通过对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,并根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;通过分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;通过待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以对待预测景点进行预测准确性高的热度预测,从而在景点推荐过程中大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对本发明权利要求保护范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明较佳的实施例提供的服务器的一种方框示意图。
图2为本发明较佳的实施例提供的景点热度预测方法的一种流程示意图。
图3为图2中步骤S240包括的子步骤的流程示意图。
图4为本发明较佳的实施例提供的景点热度预测方法的另一种流程示意图。
图5为图4中步骤S260包括的子步骤的流程示意图。
图6为本发明较佳的实施例提供的图1中所示的景点热度预测装置的一种方框示意图。
图7为本发明较佳的实施例提供的图1中所示的景点热度预测装置的另一种方框示意图。
图标:10-服务器;11-数据库;12-处理器;13-通信单元;100-景点热度预测装置;110-信息获取模块;120-主题获取模块;130-模型获取模块;140-特征融合模块;150-标签分类模块;160-模型建立模块。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
下面结合附图,对本发明的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
请参照图1,是本发明较佳的实施例提供的服务器10的一种方框示意图。在本发明实施例中,所述服务器10用于对待预测景点的景点信息进行分析,对所述待预测景点进行预测准确性高的热度预测,从而在景点推荐过程中大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。其中,所述景点信息包括待预测景点对应的文本信息及图片信息,所述文本信息为用于对所述待预测景点进行描述的文字描述信息,所述图片信息为用于对所述待预测景点进行描述的图片描述信息。在本实施例中,所述服务器10可以包括景点热度预测装置100、数据库11、处理器12及通信单元13。所述景点数据库11、所述处理器12及所述通信单元13各个元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
其中,所述数据库11包括用于存储数据的存储器,所述存储器可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除可编程只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。在本实施例中,所述数据库11可通过所述存储器对由所述服务器10根据不同景点对应的景点数据生成的景点层级模型进行存储。其中,所述景点数据包括不同景点对应的文本信息、图片信息及点评信息,所述点评信息为游客对所述对应景点进行点评时表现出来的信息,所述景点层级模型可以表征不同景点对应特点之间的联系,所述服务器10可根据待预测景点的景点信息与所述景点层级模型对所述待预测景点进行预测准确性高的热度预测。在本实施例中,所述数据库11包括的存储器还用于存储程序,所述处理器12在接收到执行指令后,可相应地执行所述程序。
所述处理器12可以是一种具有信号的处理能力的集成电路芯片。所述处理器12可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述通信单元13用于通过网络建立所述服务器10与用户终端或云端服务器之间的通信连接,以通过所述网络从所述用户终端或云端服务器处获取到不同景点对应的景点数据或待预测景点对应的景点信息。其中,所述用户终端可以是,但不限于,个人电脑(personal computer,PC)、平板电脑、个人数字助理(personal digital assistant,PDA)、移动上网设备(mobile Internet device,MID)等。所述网络可以是,但不限于,有线网络或无线网络。
所述景点热度预测装置100包括至少一个能够以软件或固件(firmware)的形式存储于所述数据库11的存储器中或固化在所述服务器10的操作系统(Operating System,OS)中的软件功能模块。所述处理器12可用于执行所述存储器中存储的可执行模块,例如所述景点热度预测装置100所包括的软件功能模块及计算机程序等。在本实施例中,所述景点热度预测装置100可通过所述通信单元13获取不同景点对应的景点数据,并根据所述景点数据建立景点层级模型,然后根据所述景点层级模型对待预测景点的景点信息进行处理,实现基于待预测景点本身特点进行的准确性高的热度预测,从而在景点推荐过程中大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度,具体的景点热度预测方法在后文中进行详细描述。
可以理解的是,,图1所示的结构仅为服务器10的一种结构示意图,所述服务器10还可包括比图1中所示更多或更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
请参照图2,是本发明较佳的实施例提供的景点热度预测方法的一种流程示意图。在本发明实施例中,所述景点热度预测方法应用于图1所示的服务器10,所述服务器10的数据库11中存储有用于表征不同景点对应特点之间的联系的景点层级模型,下面对图2所示的景点热度预测方法的具体流程和步骤进行详细阐述。
在本发明实施例中,所述景点热度预测方法包括以下步骤:
步骤S210,获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息。
在本实施例中,当所述服务器10的数据库11中存储有与所述待预测景点对应的景点信息时,所述服务器10可通过在数据库11中进行查找的方式得到所述待预测景点的景点信息;当所述服务器10的数据库11中未存储有与所述待预测景点对应的景点信息时,所述服务器10可通过所述通信单元13从与所述服务器10通信连接的用户终端或云端服务器处获取所述待预测景点的景点信息,也可通过网页爬取器从至少一个旅游网站处爬取到所述待预测景点对应的景点信息。其中,所述旅游网站可以是,但不限于,大众点评网、猫途鹰网、去哪儿网及蚂蜂窝网等。
步骤S220,对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题。
在本实施例中,所述景点层级模型包括主题层、景点层、特征层及标签层,所述主题层用于存放能够对各景点进行聚类的主题,所述景点层用于表征各景点与所述主题层中各主题之间的联系,所述特征层用于容纳各景点对应的融合特征,所述标签层用于存放能够描述各景点热度变化的热度变化标签。其中,所述主题层中的主题数目为多个,所述融合特征能够对各自对应景点的特点进行表征。
在本实施例中,所述景点层与主题层之间的联系是基于所述主题层中各主题与对应关键词之间的联系建立而成的,因此,所述服务器10对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题的步骤包括:
根据主题层中各主题对应的关键词在待预测景点的文本信息中的出现概率,对所述待预测景点在不同主题下的聚类概率进行计算,并选取概率最大的主题作为所述待预测景点对应的主题。
其中,所述服务器10在对待预测景点在不同主题下的聚类概率进行计算,得到所述待预测景点在不同主题下的聚类概率时,通过将各聚类概率进行比较的方式,从各主题中选取概率数值最大的主题作为所述待预测景点对应的主题。
步骤S230,根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型。
在本实施例中,所述热度变化标签模型用于描述对应主题下不同景点的热度变化标签之间的对应关系,所述热度变化标签包括热门到热门、热门到冷门、冷门到热门、冷门到冷门四种标签,所述热度变化标签模型在所述标签层中的数目与所述主题层中主题的数目相同,每个主题均对应着一个热度变化标签模型。所述服务器10在得到待预测景点对应的主题后,可在所述标签层中查找与所述主题对应的热度变化标签模型,从而得到所述待预测景点所属主题对应的热度变化标签模型。
步骤S240,分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征。
请参照图3,是图2中步骤S240包括的子步骤的流程示意图。在本发明实施例中,所述步骤S240可以包括子步骤S241及子步骤S242。其中,所述子步骤S241及子步骤S242如下所示:
子步骤S241,分别从待预测景点的文本信息及图片信息中提取出对应的文本特征向量及图片特征向量,并分别对所述文本特征向量及所述图片特征向量进行聚类,对聚类后的文本特征向量及图片特征向量进行归一化处理,得到所述待预测景点对应的文本特征及图片特征。
在本实施例中,所述服务器10可通过Word2Vec模型从待预测景点的文本信息中提取出对应的文本特征向量,通过VGGNet模型从待预测景点的图片信息中提取出对应的图片特征向量,其中,所述文本特征向量及图片特征向量的数目为多个。所述服务器10在获取到待预测景点对应的文本特征向量及图片特征向量后,可通过与词袋模型(BOVW,bag ofview word)思想类似的模型按照特定的码字分别对所述文本特征向量及图片特征向量进行聚类,生成相应的两个码本,然后分别对聚类后的文本特征向量及图片特征向量进行归一化处理,得到用于表征所述待预测景点的文本特征和图片特征的文本特征矩阵及图片特征矩阵。
子步骤S242,将所述待预测景点对应的文本特征及图片特征映射到同一特征空间中,并在所述特征空间中对映射的文本特征及图片特征进行线性融合,以得到对应的融合特征。
在本实施例中,所述服务器10可通过将所述文本特征及图片特征进行直接拼接(即特征之间的取并处理)的方式,得到对应的融合特征;所述服务器10也可通过查找所述文本特征与所述图片特征映射到所述特征空间的映射方向,以最大化所述文本特征与图片特征之间的线性相关性,从而将所述文本特征与所述图片特征进行融合,得到对应的融合特征;所述服务器10还可通过使用成对约束分别从文本空间及视觉空间中导出所述文本特征和所述图片特征,然后寻求所述文本特征与所述图片特征之间的线性转换,使得所述文本特征与所述图片特征可比,从而统一所述文本特征与所述图片特征生成对应的融合特征。
步骤S250,根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
在本实施例中,所述服务器10根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测的步骤包括:
将待预测景点的融合特征输入到与所述待预测景点的主题对应的热度变化标签模型中,以通过所述热度变化标签模型生成与所述融合特征对应的热度变化标签。
其中,所述热度变化标签模型通过建立不同景点的融合特征与该景点的热度变化标签之间的联系,来描述对应主题下不同景点的热度变化标签之间的对应关系,因此,所述热度变化标签模型可以表征融合特征到热度变化标签的转换过程。所述服务器10可通过得到待预测景点对应的热度变化标签的方式,实现对待预测景点的热度预测。
请参照图4,是本发明较佳的实施例提供的景点热度预测方法的另一种流程示意图。在本发明实施例中,所述景点热度预测方法还可以包括:
步骤S260,建立景点层级模型。
在本实施例中,所述服务器10可在对待预测景点进行热度预测前,建立所述景点层级模型,以在对待预测景点进行热度预测时使用。具体地,请参照图5,是图4中步骤S260包括的子步骤的流程示意图。所述步骤S260可以包括子步骤S261~子步骤S265。其中,所述子步骤S261~子步骤S265如下所示:
子步骤S261,获取不同景点对应的景点数据,其中,所述景点数据包括该景点的文本信息、图片信息及点评信息。
在本实施例中,所述服务器10可通过网页爬取器从与所述服务器10通信连接的用户终端或云端服务器处爬取到目标旅游网站上不同景点对应的景点数据。具体地,所述服务器10获取目标旅游网站上不同景点对应的景点数据的步骤包括:
根据目标旅游网站对应的链接地址,对目标旅游网站进行访问,并对目标旅游网站对应网页上的页面内容进行采集;
对采集到的页面内容进行解析,并从所述页面内容中提取出与各景点对应的景点数据。
其中,所述目标旅游网站可以是,但不限于,大众点评网、猫途鹰网、去哪儿网及蚂蜂窝网等。
子步骤S262,对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层。
在本实施例中,所述服务器10可通过隐含狄利克雷分布(LDA,Latent DirichletAllocation)主题概率模型获取到用于对各景点进行聚类的主题,以形成对应的主题层,并通过将各景点按照得到的主题进行聚类的方式,将各景点划分到对应主题下,以形成所述景点层。
具体地,所述服务器10对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层的步骤包括:
通过隐含狄利克雷分布主题概率模型对各景点的文本信息进行分析,从所述文本信息中提取出相应的主题及与所述主题对应的关键词,形成主题层;
根据各景点的文本信息中所述关键词的出现频率,对各景点在不同主题下的聚类概率进行计算,并选取各景点对应的概率最大的主题作为该景点所属的主题,以将各景点划分到对应主题下,形成景点层。
其中,所述服务器10可在对各景点的文本信息进行停用词、无用符号去除及单词分割等处理后,通过使用LDA主题概率模型的方式从处理后的文本信息中提取出能够用于景点聚类的主题,同时也从所述主题中提取出几组关键词,建立关键词与相应主题之间的对应关系。所述服务器10将对每个景点的文本信息中出现各主题对应的关键字的频率进行统计,然后根据所述频率对该景点在不同主题下发生聚类的聚类概率进行计算,得到该景点在不同主题下的聚类概率。所述服务器10将该景点在不同主题下的聚类概率进行比较,并从中选取概率数值最大的主题作为该景点所属的主题,从而将各景点划分到对应主题下,形成景点层。
子步骤S263,分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征,以形成用于容纳各景点对应的融合特征的特征层。
在本实施例中,与获取待预测景点的融合特征类似,所述服务器10得到各景点对应的融合特征,形成所述特征层的步骤包括:
分别从各景点的文本信息及图片信息中提取出对应的文本特征向量及图片特征向量,并分别对所述文本特征向量及所述图片特征向量进行聚类,并对聚类后的文本特征向量及图片特征向量进行归一化处理,得到各景点对应的文本特征及图片特征;
将每个景点对应的文本特征及图片特征映射到同一特征空间中,并在所述特征空间中对映射的文本特征及图片特征进行线性融合,得到各景点对应的融合特征,形成特征层。
其中,所述服务器10可获取每个景点对应的文本特征及图片特征的方式与获取待预测景点的文本特征及图片特征的方式类似,对每个景点对应的文本特征及图片特征进行处理得到对应融合特征的方式也与得到待预测景点的融合特征的方式类似,在此就不再一一论述了。
子步骤264,对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层。
在本实施例中,所述点评信息包括点评时间、点评数目及点评评分,所述服务器10可通过对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,形成对应的标签层。具体地,所述服务器10对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层的步骤包括:
根据各景点对应的点评时间对预设点评时间范围内的点评数目及点评评分进行统计,得到点评评分大于预设评分阈值的点评数目在所述预设点评时间范围内的变化曲线;
对所述变化曲线进行分析,并根据分析结果为各景点设置对应的热度变化标签,形成对应的标签层。
其中,所述服务器10可根据各景点对应的点评信息中的点评时间对处于预设点评时间范围内的点评数目及点评评分进行统计,得到各景点对应的点评数目及点评评分,并从所述点评数目及点评评分中获取到评分值大于预设评分阈值的点评评分对应的点评数目,以生成每个景点对应的点评评分大于预设评分阈值的点评数目在所述预设点评时间范围内的变化曲线。所述服务器10对所述变化曲线进行分析,并根据分析结果为各景点设置对应的热度变化标签的步骤包括:
将变化曲线上各时间点对应的点评数目与预设数目阈值进行比较,若点评数目小于预设数目阈值时,判定对应时间点下的景点处于冷门状态,否则判定所述景点处于热门状态;
根据所述变化曲线下的景点状态的变化情况,将所述景点的热度变化标签设置为热门到热门、热门到冷门、冷门到热门及冷门到冷门的其中一个。
子步骤S265,根据同一主题下各景点的融合特征与热度变化标签之间的对应关系,建立并存储不同主题对应的热度变化标签模型。
在本实施例中,所述服务器10可通过同一主题下不同景点的融合特征与该景点的热度变化标签之间的联系,来描述对应主题下不同景点的热度变化标签之间的对应关系,得到不同主题对应的热度变化标签模型,并将所述热度变化标签模型存储在标签层中,以形成所述景点层级模型。
请参照图6,是本发明较佳的实施例提供的图1中所示的景点热度预测装置100的一种方框示意图。在本发明实施例中,所述景点热度预测装置100包括:信息获取模块110、主题获取模块120、模型获取模块130、特征融合模块140及标签分类模块150。
所述信息获取模块110,用于获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息。
在本实施例中,所述信息获取模块110可以执行图2中的步骤S210,具体的描述可参照上文中对步骤S210的详细描述。
所述主题获取模块120,用于对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题。
在本实施例中,所述主题获取模块120可以执行图2中的步骤S220,具体的描述可参照上文中对步骤S220的详细描述。
所述模型获取模块130,用于根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型。
在本实施例中,所述模型获取模块130可以执行图2中的步骤S230,具体的描述可参照上文中对步骤S230的详细描述。
所述特征融合模块140,用于分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征。
在本实施例中,所述特征融合模块140可以执行图2中的步骤S240及图3中的子步骤S241和子步骤S242,具体的描述可参照上文中对步骤S240、子步骤S241和子步骤S242的详细描述。
所述标签分类模块150,用于根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
在本实施例中,所述标签分类模块150可以执行图2中的步骤S250,具体的描述可参照上文中对步骤S250的详细描述。
请参照图7,是本发明较佳的实施例提供的图1中所示的景点热度预测装置100的另一种方框示意图。在本发明实施例中,所述景点热度预测装置100还可以包括模型建立模块160。
所述模型建立模块160,用于建立景点层级模型。
在本实施例中,所述模型建立模块160建立景点层级模型的方式包括:
获取不同景点对应的景点数据,其中,所述景点数据包括该景点的文本信息、图片信息及点评信息;
对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层;
分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征,以形成用于容纳各景点对应的融合特征的特征层;
对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层;
根据同一主题下各景点的融合特征与热度变化标签之间的对应关系,建立并存储不同主题对应的热度变化标签模型。
其中,所述模型建立模块160可以执行图5中的子步骤S261~子步骤S265,具体的描述可参照上文中对子步骤S261~子步骤S265的详细描述。
综上所述,在本发明较佳的实施例提供的景点热度预测方法及装置中,所述景点热度预测方法的预测准确性高,是基于景点本身特点进行分析预测的,能够大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。具体地,所述方法通过获取待预测景点对应的景点信息,得到待预测景点的文本信息及图片信息;通过对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,并根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;通过分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;通过待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以对待预测景点进行预测准确性高的热度预测,从而在景点推荐过程中大大地提高景点推荐范围,挖掘出更多的具有巨大商业价值的冷门景点,提高旅游业的发展速度。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种景点热度预测方法,其特征在于,所述方法包括:
获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息;
对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,其中,所述主题层包括多个用于对景点进行聚类的主题;
根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;
分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;
根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
建立景点层级模型;
所述建立景点层级模型的步骤包括:
获取不同景点对应的景点数据,其中,所述景点数据包括该景点的文本信息、图片信息及点评信息;
对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层;
分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征,以形成用于容纳各景点对应的融合特征的特征层;
对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层;
根据同一主题下各景点的融合特征与热度变化标签之间的对应关系,建立并存储不同主题对应的热度变化标签模型。
3.根据权利要求2所述的方法,其特征在于,所述对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层的步骤包括:
通过隐含狄利克雷分布主题概率模型对各景点的文本信息进行分析,从所述文本信息中提取出相应的主题及与所述主题对应的关键词,形成主题层;
根据各景点的文本信息中所述关键词的出现频率,对各景点在不同主题下的聚类概率进行计算,并选取各景点对应的概率最大的主题作为该景点所属的主题,以将各景点划分到对应主题下,形成景点层。
4.根据权利要求3所述的方法,其特征在于,所述对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题的步骤包括:
根据主题层中各主题对应的关键词在待预测景点的文本信息中的出现概率,对所述待预测景点在不同主题下的聚类概率进行计算,并选取概率最大的主题作为所述待预测景点对应的主题。
5.根据权利要求2所述的方法,其特征在于,所述点评信息包括点评时间、点评数目及点评评分,所述对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层的步骤包括:
根据各景点对应的点评时间对预设点评时间范围内的点评数目及点评评分进行统计,得到点评评分大于预设评分阈值的点评数目在所述预设点评时间范围内的变化曲线;
对所述变化曲线进行分析,并根据分析结果为各景点设置对应的热度变化标签,形成对应的标签层。
6.根据权利要求5所述的方法,其特征在于,所述对所述变化曲线进行分析,并根据分析结果为各景点设置对应的热度变化标签的步骤包括:
将变化曲线上各时间点对应的点评数目与预设数目阈值进行比较,若点评数目小于预设数目阈值时,判定对应时间点下的景点处于冷门状态,否则判定所述景点处于热门状态;
根据所述变化曲线下的景点状态的变化情况,将所述景点的热度变化标签设置为热门到热门、热门到冷门、冷门到热门及冷门到冷门的其中一个。
7.根据权利要求1所述的方法,其特征在于,所述分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征的步骤包括:
分别从待预测景点的文本信息及图片信息中提取出对应的文本特征向量及图片特征向量,并分别对所述文本特征向量及所述图片特征向量进行聚类,对聚类后的文本特征向量及图片特征向量进行归一化处理,得到所述待预测景点对应的文本特征及图片特征;
将所述待预测景点对应的文本特征及图片特征映射到同一特征空间中,并在所述特征空间中对映射的文本特征及图片特征进行线性融合,以得到对应的融合特征。
8.根据权利要求1所述的方法,其特征在于,所述根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签的步骤包括:
将待预测景点的融合特征输入到与所述待预测景点的主题对应的热度变化标签模型中,以通过所述热度变化标签模型生成与所述融合特征对应的热度变化标签。
9.一种景点热度预测装置,其特征在于,所述装置包括:
信息获取模块,用于获取待预测景点对应的景点信息,其中,所述景点信息包括待预测景点对应的文本信息及图片信息;
主题获取模块,用于对待预测景点的文本信息进行分析,从景点层级模型的主题层中获取到与待预测景点对应的主题,其中,所述主题层包括多个用于对景点进行聚类的主题;
模型获取模块,用于根据待预测景点对应的主题从所述景点层级模型的标签层中获取到与所述主题对应的热度变化标签模型;
特征融合模块,用于分别从待预测景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将所述文本特征及图片特征进行融合,得到对应的融合特征;
标签分类模块,用于根据待预测景点的融合特征及所述热度变化标签模型,对待预测景点进行标签分类,得到待预测景点对应的热度变化标签,以完成对待预测景点的热度预测。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括:
模型建立模块,用于建立景点层级模型;
所述模型建立模块建立景点层级模型的方式包括:
获取不同景点对应的景点数据,其中,所述景点数据包括该景点的文本信息、图片信息及点评信息;
对各景点对应的文本信息进行分析,从所述文本信息中提取用于对各景点进行聚类的主题,并将各景点划分到对应主题下,以形成主题层及用于表征各景点的景点层;
分别从各景点的文本信息及图片信息中提取对应的文本特征及图片特征,并将每个景点对应的文本特征及图片特征进行融合,得到各景点对应的融合特征,以形成用于容纳各景点对应的融合特征的特征层;
对各景点对应的点评信息进行分析,为各景点设置对应的热度变化标签,以形成用于描述各景点热度变化的标签层;
根据同一主题下各景点的融合特征与热度变化标签之间的对应关系,建立并存储不同主题对应的热度变化标签模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599020.9A CN107368923B (zh) | 2017-07-21 | 2017-07-21 | 景点热度预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710599020.9A CN107368923B (zh) | 2017-07-21 | 2017-07-21 | 景点热度预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107368923A true CN107368923A (zh) | 2017-11-21 |
CN107368923B CN107368923B (zh) | 2020-12-22 |
Family
ID=60306990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710599020.9A Active CN107368923B (zh) | 2017-07-21 | 2017-07-21 | 景点热度预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107368923B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944735A (zh) * | 2017-12-06 | 2018-04-20 | 国云科技股份有限公司 | 一种基于古诗词的旅游景区品牌价值分析方法 |
CN110155050A (zh) * | 2018-03-07 | 2019-08-23 | 陈磊 | 一种基于图片挖掘的无人驾驶游览车速度控制方法 |
CN110910175A (zh) * | 2019-11-26 | 2020-03-24 | 上海景域文化传播股份有限公司 | 一种旅游门票产品画像生成方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537027A (zh) * | 2014-12-19 | 2015-04-22 | 百度在线网络技术(北京)有限公司 | 信息推荐方法及装置 |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
-
2017
- 2017-07-21 CN CN201710599020.9A patent/CN107368923B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104537027A (zh) * | 2014-12-19 | 2015-04-22 | 百度在线网络技术(北京)有限公司 | 信息推荐方法及装置 |
CN106156204A (zh) * | 2015-04-23 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 文本标签的提取方法和装置 |
Non-Patent Citations (2)
Title |
---|
于兆鹏: ""互联网中事件检测与跟踪系统设计与实现"", 《中国优秀硕士学位论文全文数据库》 * |
沈钧戈: "基于社会媒体的旅游数据挖掘与个性化推荐", 《中国博士学位论文全文数据库》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944735A (zh) * | 2017-12-06 | 2018-04-20 | 国云科技股份有限公司 | 一种基于古诗词的旅游景区品牌价值分析方法 |
CN110155050A (zh) * | 2018-03-07 | 2019-08-23 | 陈磊 | 一种基于图片挖掘的无人驾驶游览车速度控制方法 |
CN110155050B (zh) * | 2018-03-07 | 2022-07-12 | 北京鑫洋浩海科技有限公司 | 一种基于图片挖掘的无人驾驶游览车速度控制方法 |
CN110910175A (zh) * | 2019-11-26 | 2020-03-24 | 上海景域文化传播股份有限公司 | 一种旅游门票产品画像生成方法 |
CN110910175B (zh) * | 2019-11-26 | 2023-07-28 | 上海景域文化传播股份有限公司 | 一种旅游门票产品画像生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107368923B (zh) | 2020-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107220094A (zh) | 页面加载方法、装置和电子设备 | |
CN108536813B (zh) | 轨迹查询方法、电子设备及存储介质 | |
CN107105031A (zh) | 信息推送方法和装置 | |
CN104750754A (zh) | 网站所属行业的分类方法和服务器 | |
CN103189836A (zh) | 用于对图数据流中的对象分类的方法 | |
CN105718533A (zh) | 信息推送方法和装置 | |
CN106844407A (zh) | 基于数据集相关性的标签网络产生方法和系统 | |
CN107368923A (zh) | 景点热度预测方法及装置 | |
CN106959971A (zh) | 用户行为数据的处理方法及装置 | |
CN106095939B (zh) | 账户权限的获取方法和装置 | |
CN103177096B (zh) | 基于文本属性的页面元素定位方法及设备 | |
CN103248677A (zh) | 互联网行为分析系统及其工作方法 | |
CN112862092A (zh) | 一种异构图卷积网络的训练方法、装置、设备和介质 | |
CN104298780B (zh) | 一种浏览器网页信息的预获取方法及系统 | |
CN114416900A (zh) | 一种轨迹停留点分析的方法和装置 | |
CN109150817A (zh) | 一种网页请求识别方法及装置 | |
CN115757991A (zh) | 一种网页识别方法、装置、电子设备和存储介质 | |
CN110399564B (zh) | 帐号分类方法和装置、存储介质及电子装置 | |
CN104021124A (zh) | 用于处理网页数据的方法、装置和系统 | |
CN107402999A (zh) | 景点数据库建立方法及装置 | |
CN106874340A (zh) | 一种网页地址分类方法及装置 | |
CN113569118A (zh) | 自媒体推送方法、装置、计算机设备及存储介质 | |
CN111489196B (zh) | 基于深度学习网络的预测方法、装置、电子设备及介质 | |
CN108182496A (zh) | 一种城市互联网开放数据获取处理分析方法 | |
CN103473290B (zh) | 兴趣点的属性数据的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |