CN106407181B - 旅游目的地中的数据语义关联分析方法及系统 - Google Patents
旅游目的地中的数据语义关联分析方法及系统 Download PDFInfo
- Publication number
- CN106407181B CN106407181B CN201610806298.4A CN201610806298A CN106407181B CN 106407181 B CN106407181 B CN 106407181B CN 201610806298 A CN201610806298 A CN 201610806298A CN 106407181 B CN106407181 B CN 106407181B
- Authority
- CN
- China
- Prior art keywords
- noun
- adjective
- association
- comment content
- subelement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
一种旅游目的地中的数据语义关联分析方法,包括:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;并进行相应的显示。
Description
技术领域
本发明涉及信息数据处理技术领域,特别涉及一种旅游目的地中的数据语义关联分析方法及系统。
背景技术
目前,旅游行业有很多信息服务商以及OTA,对外提供了许多景区的评论,门票信息,攻略信息等,形成了旅游方向的网络舆情,但是这些信息目前采用了诸如打标签的方式进行了数据分类。现有技术无法获得这些评论数据中内在的信息关联,从而也无法从中提取出对景区发展有指导意义的数据。
发明内容
有鉴于此,本发明提出一种旅游目的地中的数据语义关联分析方法及系统。
一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。
同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。
附图说明
图1是本发明实施例的旅游目的地中的数据语义关联分析系统结构框图。
图2是图1中第一处理单元结构框图;
图3是图1中第二处理单元结构框图;
图4是图1中第三处理单元结构框图;
图5是图1中第四处理单元结构框图。
具体实施方式
一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
如图1所示,本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
如图2所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
如图3所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
如图4所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
如图5所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。
同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其它各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。
Claims (10)
1.一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
2.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
3.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
4.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
5.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
6.一种旅游目的地中的数据语义关联分析系统,其特征在于,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
7.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
8.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
9.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
10.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806298.4A CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806298.4A CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106407181A CN106407181A (zh) | 2017-02-15 |
CN106407181B true CN106407181B (zh) | 2019-05-14 |
Family
ID=57998783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610806298.4A Active CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106407181B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423837A (zh) * | 2017-04-12 | 2017-12-01 | 宁夏丝路风情旅游网络股份有限公司 | 旅游路线的智能规划方法及系统 |
CN112559862B (zh) * | 2020-12-11 | 2022-04-29 | 芜湖汽车前瞻技术研究院有限公司 | 一种基于邻近词相似度的产品特征聚类方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246164A (zh) * | 2008-12-11 | 2011-11-16 | 有限公司呢哦派豆 | 基于用户意图的信息搜索方法以及信息提供方法 |
CN102760264A (zh) * | 2011-04-29 | 2012-10-31 | 国际商业机器公司 | 为互联网上的评论生成摘录的计算机实现的方法和系统 |
CN102937954A (zh) * | 2011-08-16 | 2013-02-20 | 同程网络科技股份有限公司 | 一站式旅游信息搜索方法 |
CN103853824A (zh) * | 2014-03-03 | 2014-06-11 | 沈之锐 | 一种基于深度语义挖掘的内文广告发布方法与系统 |
KR101485940B1 (ko) * | 2013-08-23 | 2015-01-27 | 네이버 주식회사 | 시멘틱 뎁스 구조 기반의 검색어 제시 시스템 및 방법 |
CN105528410A (zh) * | 2015-12-05 | 2016-04-27 | 浙江大学 | 一种对医院的在线评论进行归纳和分类的方法 |
-
2016
- 2016-09-07 CN CN201610806298.4A patent/CN106407181B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246164A (zh) * | 2008-12-11 | 2011-11-16 | 有限公司呢哦派豆 | 基于用户意图的信息搜索方法以及信息提供方法 |
CN102760264A (zh) * | 2011-04-29 | 2012-10-31 | 国际商业机器公司 | 为互联网上的评论生成摘录的计算机实现的方法和系统 |
CN102937954A (zh) * | 2011-08-16 | 2013-02-20 | 同程网络科技股份有限公司 | 一站式旅游信息搜索方法 |
KR101485940B1 (ko) * | 2013-08-23 | 2015-01-27 | 네이버 주식회사 | 시멘틱 뎁스 구조 기반의 검색어 제시 시스템 및 방법 |
CN103853824A (zh) * | 2014-03-03 | 2014-06-11 | 沈之锐 | 一种基于深度语义挖掘的内文广告发布方法与系统 |
CN105528410A (zh) * | 2015-12-05 | 2016-04-27 | 浙江大学 | 一种对医院的在线评论进行归纳和分类的方法 |
Non-Patent Citations (1)
Title |
---|
网络评论观点知识发现研究;陈晓美;《中国博士学位论文全文数据库 信息科技辑》;20140915;正文第1-109页 |
Also Published As
Publication number | Publication date |
---|---|
CN106407181A (zh) | 2017-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104778209B (zh) | 一种针对千万级规模新闻评论的观点挖掘方法 | |
Hai et al. | Implicit feature identification via co-occurrence association rule mining | |
Glance et al. | Blogpulse: Automated trend discovery for weblogs | |
EP2041669B1 (en) | Text categorization using external knowledge | |
US9477747B2 (en) | Method and apparatus for acquiring hot topics | |
US8126897B2 (en) | Unified inverted index for video passage retrieval | |
CN103064880B (zh) | 一种基于搜索信息向用户提供网站选择的方法、装置和系统 | |
CN103885934A (zh) | 一种专利文献关键短语自动提取方法 | |
CN105868177A (zh) | 一种通用公式搜索方法 | |
Šember et al. | Croatian medical journal citation score in web of science, scopus, and google scholar | |
US11669567B2 (en) | Method and system for providing audio content | |
CN106407181B (zh) | 旅游目的地中的数据语义关联分析方法及系统 | |
CN103853746A (zh) | 词库生成方法及其系统、输入法及输入系统 | |
CN109299235A (zh) | 知识库搜索方法、装置及计算机可读存储介质 | |
CN108920576A (zh) | 一种自适应文本检索方法 | |
Ng | Information fusion for spoken document retrieval | |
CN107315799A (zh) | 一种互联网重复信息筛选方法及系统 | |
Campbell et al. | Content+ context networks for user classification in twitter | |
CN110990587B (zh) | 基于主题模型的企业关系发现方法及系统 | |
CN110837553A (zh) | 搜索邮件的方法及相关产品 | |
CN110555199B (zh) | 基于热点素材的文章生成方法、装置、设备及存储介质 | |
Sood et al. | Reasoning through search: a novel approach to sentiment classification | |
Hattab et al. | Arabic content classification system using statistical Bayes classifier with words detection and correction | |
CN107203620A (zh) | 主题词分类号的确定方法和确定装置 | |
De la Peña Sarracén et al. | PRHLT-UPV at SemEval-2020 Task 8: Study of Multimodal Techniques for Memes Analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 430000 7th Floor, Urban Partner Base, No. 122 North Road, Wuhan District, Hubei Province, with No. 88, 90000 Li Applicant after: Wuhan Zhong Hui Huitong Technology Co., Ltd. Address before: 430000 2nd Floor of Laohuo Science and Technology Building, 88 Academy Road, Hongshan District, Wuhan City, Hubei Province Applicant before: Earth view (Wuhan) Information Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |