CN107122420A - 一种旅游热点事件检测方法及系统 - Google Patents

一种旅游热点事件检测方法及系统 Download PDF

Info

Publication number
CN107122420A
CN107122420A CN201710214385.5A CN201710214385A CN107122420A CN 107122420 A CN107122420 A CN 107122420A CN 201710214385 A CN201710214385 A CN 201710214385A CN 107122420 A CN107122420 A CN 107122420A
Authority
CN
China
Prior art keywords
mrow
hot spot
cluster
text data
network text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710214385.5A
Other languages
English (en)
Inventor
李震川
庞子龙
曹磊
王子剑
陈龙
严武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Connaught Intelligent Technology Co Ltd
Original Assignee
Shanghai Connaught Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Connaught Intelligent Technology Co Ltd filed Critical Shanghai Connaught Intelligent Technology Co Ltd
Priority to CN201710214385.5A priority Critical patent/CN107122420A/zh
Publication of CN107122420A publication Critical patent/CN107122420A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种旅游热点事件检测方法及系统,其中方法包括:预先设置旅游专业知识库,获取网络文本数据;根据所述网络文本数据聚类热点词汇;匹配所述热点词汇和所述旅游专业知识库,计算相似度;根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。本方案能够使得最终的热点聚类结果更加准确。

Description

一种旅游热点事件检测方法及系统
技术领域
本发明涉及数据检测技术领域,尤其涉及一种旅游热点事件检测方法及系统。
背景技术
当前国内经济形势呈上升趋势,旅游业也随之蓬勃发展,旅游行业信息成为炙手可热的商业数据。对旅游行业信息进行数据挖掘,可以为旅游从业者提供策略咨询,可以为旅游监管部门提供宏观分析,还可以对整个旅游行业做前景预测,具有非常大的市场意义。
当前旅游业发展出现游客量随旅游热点事件井喷式爆发的趋势,挖掘旅游热点事件成为热门的研究课题。目前,现有的旅游热点事件检测大多数采用对网络文本数据进行文本聚类的方法,从聚类结果中提取出热点信息。然而,大多数的热点提取过程,并没有采用专业的旅游专业知识为指导,使得最终的热点聚类结果不够准确。
发明内容
有鉴于此,本发明要解决的技术问题是提供一种旅游热点事件检测方法及系统,能够使得最终的热点聚类结果更加准确。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供了一种旅游热点事件检测方法,包括:预先设置旅游专业知识库,还包括以下步骤:
步骤1:获取网络文本数据;
步骤2:根据所述网络文本数据聚类热点词汇;
步骤3:匹配所述热点词汇和所述旅游专业知识库,计算相似度;
步骤4:根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
优选的,在所述步骤2之前,还包括:
清洗所述网络文本数据。
优选的,在所述清洗所述网络文本数据之后,还包括:
将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
优选的,所述根据所述网络文本数据聚类热点词汇包括:
根据划分聚类算法,将所述数值向量聚类出热点词汇。
优选的,所述相似度计算方法为:
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
第二方面,本发明实施例提供了一种旅游热点事件检测系统,包括:
设置模块,用于预先设置旅游专业知识库;
获取模块,用于获取网络文本数据并发送至聚类模块;
所述聚类模块,用于根据所述网络文本数据聚类热点词汇;
计算模块,用于匹配所述热点词汇和所述旅游专业知识库,计算相似度;
预测模块,用于根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
优选的,还包括清洗模块,
所述清洗模块,用于清洗所述网络文本数据。
优选的,还包括分词模块
所述分词模块,用于将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
优选的,所述聚类模块包括聚类单元;
所述聚类单元,用于根据划分聚类算法,将所述数值向量聚类出热点词汇。
优选的,所述预测模块包括预测单元;
所述计算单元用于计算相似度,所述相似度计算如下:
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
本发明提出的旅游热点事件检测方法及系统,通过在聚类热点词汇之后,根据旅游专业知识库计算热点词汇相似度并分配权重,使得旅游热点词汇能够在聚类过程中,占有更高的聚类权重,从而明确了旅游热点聚类的需求方向,保证了聚类分析结果的准确性。
附图说明
图1为本发明实施例提出的旅游热点事件检测方法的流程图;
图2为本发明另一实施例提出的旅游热点事件检测方法的流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提出了一种旅游热点事件检测方法,包括以下步骤:
步骤101:预先设置旅游专业知识;
步骤102:获取网络文本数据;
步骤103:根据所述网络文本数据聚类热点词汇;
步骤104:匹配所述热点词汇和所述旅游专业知识库,计算相似度;
步骤105:根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
可见,本发明实施例提出的旅游热点事件检测方法,通过在聚类热点词汇之后,根据旅游专业知识库计算热点词汇相似度并分配权重,使得旅游热点词汇能够在聚类过程中,占有更高的聚类权重,从而明确了旅游热点聚类的需求方向,保证了聚类分析结果的准确性。
在本发明的一个优选实施例中,由于无用字符会对聚类结果产生噪声影响,提升聚类的维度,占用系统内存,降低算法效率,因此可以在聚类文本之前,清洗所述网络文本数据。
其中,清洗所述网络文本数据包括将emoji、网络标号、标点、连词、介词、特殊字符等从文本中去除。
在本发明的一个优选实施例中,在所述清洗所述网络文本数据之后,还包括:
将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
在本发明的一个优选实施例中,根据所述网络文本数据聚类热点词汇包括:
根据划分聚类算法,将所述数值向量聚类出热点词汇。
在本发明的一个优选实施例中,相似度计算方法为:
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
本发明实施例提出了一种旅游热点事件检测方法,如图2所示,包括以下步骤:
步骤201:预先设置旅游专业知识。
步骤202:获取网络文本数据。
其中,可以采用网络爬虫工具从各大网络新闻平台、社交平台等爬取海量的旅游热点新闻数据。
步骤203:清洗所述网络文本数据。
由于无用字符会对聚类结果产生噪声影响,提升聚类的维度,占用系统内存,降低算法效率,因此可以在聚类文本之前,清洗所述网络文本数据。
其中,清洗所述网络文本数据包括将emoji、网络标号、标点、连词、介词、特殊字符等从文本中去除。
步骤204:将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
其中,将词向量转换为数值向量可以采用TF-IDF算法。TF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力。TF-IDF实际上是:TF*IDF,TF词频(Term Frequency),IDF逆向文件频率(Inverse Document Frequency)。TF表示词条在文档d中出现的频率。IDF的主要思想是:如果包含词条t的文档越少,也就是n越小,IDF越大,则说明词条t具有很好的类别区分能力。TF和IDF的计算方法如下:
其中,nij代表词ti在文档dj中的出现的次数,分母则是所有词在文档dx中出现的次数之和。而
其中,|D|指语料库中出现的文件总数,而|{j:ti∈dj}|指包含词ti的文件数目,为保证分母不为零,一般使用1+|{j:ti∈dj}|。最后,计算
TF-IDFij=TFij×IDFi
某一特定文件内的高词语频率,以及该词语在整个文件集合中的低文件频率,可以产生出高权重的TF-IDF。因此,TF-IDF倾向于过滤掉常见的词语,保留重要的词语。
步骤205:根据所述网络文本数据聚类热点词汇。
其中,本实施例中可以采用K-means聚类算法,K-means均值算法是一种典型的划分聚类算法,即将所有样本划分到距离最近的均值中心点。算法先设初始聚类个数K和K个中心点,将所有样本划分到距离最近的中心点所在的簇,然后更新中心点,中心点即所有簇内样本的总和均值。重复上述过程,直到中心点不再变化,即表示聚类结束。其中,距离一般采用欧式距离计算:
其中,dij表示n维向量Xi和n维向量Yi之间的欧氏距离。
聚类算法的结果需要进行分析,主要是评价聚类性能和聚类结果的意义。现有的聚类算法的评价标准有很多种,本专利使用簇内距离和轮廓系数评价聚类性能。簇内距离即统计聚类结果所有簇包含的样本到该簇中心的距离总和,计算公式如下:
其中,dj(xj-mi)表示第i类内的第j个样本xj,到均值中心mi的欧式距离dj。当簇内距离总和S越小,表示聚类各簇越紧凑,聚类效果越强。轮廓系数在簇内距离的基础上还考虑了簇间关系,计算步骤如下:
其中,a(i)表示第i个样本xi到他所在簇的其他样本xj距离总和的均值。再计算:
其中,b(i)表示第i个样本xi到他最近的非所在簇,所包含所有样本yj距离总和的均值。那么,第i个样本的轮廓系数即:
显然,S(i)值在区间[-1,1],该值越趋近于1,表示聚类效果越好,聚类簇间距离更远,簇内更加紧凑。通过多次调整K值,计算簇内距离和轮廓系数,即可以找到最佳的K值点,该点即最佳的聚类效果点。通过分析最佳效果点的聚类结果,可以统计出每个簇的热点词汇,这些热点词汇即该块模块最终的输出结果。
步骤206:匹配所述热点词汇和所述旅游专业知识库,计算相似度。
聚类出来的热点词汇组,即可以和旅游专业知识库相匹配。旅游专业知识库中,包含了大量旅游信息和客流量之间的规则关系,可以通过聚类各簇的热点词汇组和旅游知识规则前件之间的相似度匹配,即可以分析出各个聚类簇热点词汇组的权重关系。其中相似度计算如下:
same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。相似度越高,表示该簇热点的可信度越高。可以选取n个相似度最高的热点词汇组,设置权重w,与对应词汇的TF-IDF值相乘,提高该热点词汇在样本数值向量中的重要性比重,然后重新聚类,即可以得到更加准确的热点聚类结果。
步骤207:根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
本发明实施例还提出了一种旅游热点事件检测系统,包括:
设置模块,用于预先设置旅游专业知识库;
获取模块,用于获取网络文本数据并发送至聚类模块;
所述聚类模块,用于根据所述网络文本数据聚类热点词汇;
计算模块,用于匹配所述热点词汇和所述旅游专业知识库,计算相似度;
预测模块,用于根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
在本发明的一个优选实施例中,旅游热点事件检测系统还包括清洗模块,
所述清洗模块,用于清洗所述网络文本数据。
在本发明的一个优选实施例中,旅游热点事件检测系统还包括分词模块;
所述分词模块,用于将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
在本发明的一个优选实施例中,所述聚类模块包括聚类单元;
所述聚类单元,用于根据划分聚类算法,将所述数值向量聚类出热点词汇。
在本发明的一个优选实施例中,所述预测模块包括预测单元;
所述计算单元用于计算相似度,所述相似度计算如下:
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
本发明针对旅游热点聚类这一课题,在以往传统的文本聚类基础上加入了旅游知识库的规则权重,对于最终聚类热点的分析,具有重要的指导意义。传统的文本聚类方法往往存在聚类性能过拟合的问题,分析结果往往比实际需求更加细化,需要人工介入重新整合。而加入了旅游知识库的规则权重,使得旅游热点信息能够在聚类过程中,占有更高的聚类权重,从而明确了旅游热点聚类的需求方向,保证了聚类分析结果的准确性。
本发明通过对北京、巴西奥运会旅游数据的热点聚类,准确的找出了奥运期间游客关心的旅游热点验证了本发明对旅游业营销策略的实际指导意义,也有利于政府监管部门的宏观调控和市场前景预测。
综上所述,本发明实施例至少可以实现如下效果:
在本发明实施例中,通过在聚类热点词汇之后,根据旅游专业知识库计算热点词汇相似度并分配权重,使得旅游热点词汇能够在聚类过程中,占有更高的聚类权重,从而明确了旅游热点聚类的需求方向,保证了聚类分析结果的准确性。
在本发明实施例中,通过清洗所述网络文本数据,从而可以降低聚类的维度,较少占用系统的内存,提高算法效率。
在本发明实施例中,通过将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量,可以提高聚类的效率。
最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种旅游热点事件检测方法,其特征在于,包括:预先设置旅游专业知识库,还包括以下步骤:
步骤1:获取网络文本数据;
步骤2:根据所述网络文本数据聚类热点词汇;
步骤3:匹配所述热点词汇和所述旅游专业知识库,计算相似度;
步骤4:根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
2.如权利要求1所述的旅游热点事件检测方法,其特征在于,在所述步骤2之前,还包括:
清洗所述网络文本数据。
3.如权利要求2所述的旅游热点事件检测方法,其特征在于,在所述清洗所述网络文本数据之后,还包括:
将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
4.如权利要求3所述的旅游热点事件检测方法,其特征在于,所述根据所述网络文本数据聚类热点词汇包括:
根据划分聚类算法,将所述数值向量聚类出热点词汇。
5.如权利要求1-4任一项所述的旅游热点事件检测方法,其特征在于,所述相似度计算方法为:
<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mi>i</mi> <mi>l</mi> <mi>a</mi> <mi>r</mi> <mi>i</mi> <mi>t</mi> <mi>y</mi> <mo>=</mo> <mfrac> <mrow> <mi>s</mi> <mi>a</mi> <mi>m</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>u</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
6.一种旅游热点事件检测系统,其特征在于,包括:
设置模块,用于预先设置旅游专业知识库;
获取模块,用于获取网络文本数据并发送至聚类模块;
所述聚类模块,用于根据所述网络文本数据聚类热点词汇;
计算模块,用于匹配所述热点词汇和所述旅游专业知识库,计算相似度;
预测模块,用于根据所述相似度设置热点词汇的权重,重新聚类,获取旅游热点事件。
7.如权利要求6所述的旅游热点事件检测系统,其特征在于,还包括清洗模块,
所述清洗模块,用于清洗所述网络文本数据。
8.如权利要求7所述的旅游热点事件检测系统,其特征在于,还包括分词模块
所述分词模块,用于将所述网络文本数据进行分词,生成词向量,并将所述词向量转换为数值向量。
9.如权利要求6所述的旅游热点事件检测系统,其特征在于,所述聚类模块包括聚类单元;
所述聚类单元,用于根据划分聚类算法,将所述数值向量聚类出热点词汇。
10.如权利要求6-9任一项所述的旅游热点事件检测系统,其特征在于,所述预测模块包括预测单元;
所述计算单元用于计算相似度,所述相似度计算如下:
<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mi>i</mi> <mi>l</mi> <mi>a</mi> <mi>r</mi> <mi>i</mi> <mi>t</mi> <mi>y</mi> <mo>=</mo> <mfrac> <mrow> <mi>s</mi> <mi>a</mi> <mi>m</mi> <mi>e</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mi>s</mi> <mi>u</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>a</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
其中,same(a,b)表示集合a和b之间的共有元素数量,sum(a,b)表示集合a和b非重复元素总和。
CN201710214385.5A 2017-04-01 2017-04-01 一种旅游热点事件检测方法及系统 Pending CN107122420A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710214385.5A CN107122420A (zh) 2017-04-01 2017-04-01 一种旅游热点事件检测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710214385.5A CN107122420A (zh) 2017-04-01 2017-04-01 一种旅游热点事件检测方法及系统

Publications (1)

Publication Number Publication Date
CN107122420A true CN107122420A (zh) 2017-09-01

Family

ID=59725655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710214385.5A Pending CN107122420A (zh) 2017-04-01 2017-04-01 一种旅游热点事件检测方法及系统

Country Status (1)

Country Link
CN (1) CN107122420A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287338A (zh) * 2019-06-21 2019-09-27 北京百度网讯科技有限公司 行业热点确定方法、装置、设备和介质
CN110348133A (zh) * 2019-07-15 2019-10-18 西南交通大学 一种高速列车三维产品结构技术功效图构建系统及方法
CN111832815A (zh) * 2020-07-02 2020-10-27 山东电力研究院 科研热点预测方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059805A (zh) * 2007-03-29 2007-10-24 复旦大学 基于网络流和分层知识库的动态文本聚类方法
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104239436A (zh) * 2014-08-27 2014-12-24 南京邮电大学 一种基于文本分类和聚类分析的网络热点事件发现方法
US20170091274A1 (en) * 2015-09-30 2017-03-30 Linkedin Corporation Organizational data enrichment

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101059805A (zh) * 2007-03-29 2007-10-24 复旦大学 基于网络流和分层知识库的动态文本聚类方法
CN103699663A (zh) * 2013-12-27 2014-04-02 中国科学院自动化研究所 一种基于大规模知识库的热点事件挖掘方法
CN104239436A (zh) * 2014-08-27 2014-12-24 南京邮电大学 一种基于文本分类和聚类分析的网络热点事件发现方法
US20170091274A1 (en) * 2015-09-30 2017-03-30 Linkedin Corporation Organizational data enrichment

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287338A (zh) * 2019-06-21 2019-09-27 北京百度网讯科技有限公司 行业热点确定方法、装置、设备和介质
CN110287338B (zh) * 2019-06-21 2022-04-29 北京百度网讯科技有限公司 行业热点确定方法、装置、设备和介质
CN110348133A (zh) * 2019-07-15 2019-10-18 西南交通大学 一种高速列车三维产品结构技术功效图构建系统及方法
CN110348133B (zh) * 2019-07-15 2022-08-19 西南交通大学 一种高速列车三维产品结构技术功效图构建系统及方法
CN111832815A (zh) * 2020-07-02 2020-10-27 山东电力研究院 科研热点预测方法及系统
CN111832815B (zh) * 2020-07-02 2023-12-05 国网山东省电力公司电力科学研究院 科研热点预测方法及系统

Similar Documents

Publication Publication Date Title
CN107220295B (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN104008165B (zh) 一种基于网络拓扑结构和节点属性的社团检测方法
CN105183833B (zh) 一种基于用户模型的微博文本推荐方法及其推荐装置
CN109165294A (zh) 一种基于贝叶斯分类的短文本分类方法
CN110321925A (zh) 一种基于语义聚合指纹的文本多粒度相似度比对方法
CN107291886A (zh) 一种基于增量聚类算法的微博话题检测方法及系统
CN103646080A (zh) 基于倒序索引的微博去重方法和系统
CN104866558B (zh) 一种社交网络账号映射模型训练方法及映射方法和系统
CN104462053A (zh) 一种文本内的基于语义特征的人称代词指代消解方法
CN104199822A (zh) 一种识别搜索对应的需求分类的方法和系统
CN102012915A (zh) 一种文档共享平台的关键词推荐方法及系统
CN111324801B (zh) 基于热点词的司法领域热点事件发现方法
CN107832467A (zh) 一种基于改进的Single‑pass聚类算法的微博话题检测方法
CN112559684A (zh) 一种关键词提取及信息检索方法
CN109597995A (zh) 一种基于bm25加权结合词向量的文本表示方法
CN117314266B (zh) 一种基于超图注意力机制的新型科技人才智能评价方法
CN107122420A (zh) 一种旅游热点事件检测方法及系统
CN109949174A (zh) 一种异构社交网络用户实体锚链接识别方法
CN109359299A (zh) 一种基于商品数据的物联网设备能力本体自构建方法
CN102521402B (zh) 文本过滤系统及方法
CN104731811A (zh) 一种面向大规模动态短文本的聚类信息演化分析方法
CN109344248B (zh) 一种基于科技文献摘要聚类的学术主题生命周期分析方法
CN104778205B (zh) 一种基于异构信息网络的移动应用排序和聚类方法
CN112417322B (zh) 一种面向兴趣点名称文本的类型判别方法及系统
CN111767404B (zh) 一种事件挖掘方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20170901