CN106407181A - 旅游目的地中的数据语义关联分析方法及系统 - Google Patents
旅游目的地中的数据语义关联分析方法及系统 Download PDFInfo
- Publication number
- CN106407181A CN106407181A CN201610806298.4A CN201610806298A CN106407181A CN 106407181 A CN106407181 A CN 106407181A CN 201610806298 A CN201610806298 A CN 201610806298A CN 106407181 A CN106407181 A CN 106407181A
- Authority
- CN
- China
- Prior art keywords
- noun
- adjective
- association
- word
- subelement
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种旅游目的地中的数据语义关联分析方法,包括:S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;并进行相应的显示。
Description
技术领域
本发明涉及信息数据处理技术领域,特别涉及一种旅游目的地中的数据语义关联分析方法及系统。
背景技术
目前,旅游行业有很多信息服务商以及OTA,对外提供了许多景区的评论,门票信息,攻略信息等,形成了旅游方向的网络舆情,但是这些信息目前采用了诸如打标签的方式进行了数据分类。现有技术无法获得这些评论数据中内在的信息关联,从而也无法从中提取出对景区发展有指导意义的数据。
发明内容
有鉴于此,本发明提出一种旅游目的地中的数据语义关联分析方法及系统。
一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。
同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。
附图说明
图1是本发明实施例的旅游目的地中的数据语义关联分析系统结构框图。
图2是图1中第一处理单元结构框图;
图3是图1中第二处理单元结构框图;
图4是图1中第三处理单元结构框图;
图5是图1中第四处理单元结构框图。
具体实施方式
一种旅游目的地中的数据语义关联分析方法,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
在本发明所述的旅游目的地中的数据语义关联分析方法中,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
如图1所示,本发明还提供一种旅游目的地中的数据语义关联分析系统,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
如图2所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
如图3所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
如图4所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
如图5所示,在本发明所述的旅游目的地中的数据语义关联分析系统中,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
实施本发明提供的旅游目的地中的数据语义关联分析方法及系统与现有技术相比具有以下有益效果:能够通过用户的对于旅游目的地大量网络评论的内容,分析出网络舆情中的最热名词和形容词,并且能够计算和分析出最热的前预设位(比如20位)个名词和形容词关联的热词。从而获得舆情最关注的情感和内容集中在哪些方面。
同时,本发明还提供了计算同某个名词有关联关系的形容词的计算处理,以及同某个名词有关联关系的形容词的计算处理和统计的处理方法,这样用户可以获得和某个名词以及某个形容词之间的对应关联关系。
可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其它各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。
Claims (10)
1.一种旅游目的地中的数据语义关联分析方法,其特征在于,其包括如下步骤:
S1、对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
S2、建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到步骤S3,在为名词时跳转到步骤S4,在为与名词相关的形容词时,跳转到步骤S5,在为与形容词相关的名词时,跳转到步骤S6;
S3、根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
S4、根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
S5、查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
S6、查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
2.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S3包括:
S31、返回拥有该形容词的所有评论内容列表;
S32、获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
S33、如果一个名词在名词临时表中已经出现,则归并该名词,增加该名词出现次数;
S34、列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
3.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S4包括:
S41、返回拥有该名词的所有评论内容列表;
S42、获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
S43、如果一个形容词在形容词临时表出现,则归并该形容词,增加该形容词的出现次数;
S44、列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
4.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S5包括:
S51、选定该名词,查找包含该名词的评论内容;
S52、对每个评论内容内的所有词汇进行词性和顺序分解;
S53、对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
S54、将找到的形容词放入关联形容词暂存表,重复步骤S52直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在步骤S55中进行统计排序;
S55、将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
5.如权利要求1所述的旅游目的地中的数据语义关联分析方法,其特征在于,所述步骤S6包括:
S61、选定该形容词,查找包含该形容词的评论内容;
S62、对每个评论内容内的所有词汇进行词性和顺序分解;
S63、对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
S64、将找到的名词放入关联名词暂存表,重复步骤S62直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在步骤S65中进行统计排序;
S65、将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
6.一种旅游目的地中的数据语义关联分析系统,其特征在于,其包括如下单元:
归类单元,用于对采集的用户评论内容的数据进行基于句子的词法分析;并对分析结果按照形容词、名词进行数据归类;
统计分析跳转单元,用于建立批数据入库统计表,数据统计表记录基本处理算法是对每一句评论,建立热词分析;并对一批热词,进行去重、归并以及计数;在计数完毕后,根据时间段内的某个词汇出现的频率做降序排列,以获得热词的分类排序,分类分为名词、形容词;得到最热形容词列表以及最热名词列表;获取用户的点击信息,在为形容词时跳转到第一处理单元,在为名词时跳转到第二处理单元,在为与名词相关的形容词时,跳转到第三处理单元,在为与形容词相关的名词时,跳转到第四处理单元;
第一处理单元,用于根据最热形容词列表,进行算法处理,获得并显示与该形容词相关联的名词;
第二处理单元,用于根据最热名词列表,进行算法处理,获得并显示与该名词相关联的形容词;
第三处理单元,用于查找该名词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该名词前面的最接近的形容词放入关联形容词暂存表中,根据关联形容词暂存表获得并显示与该名词关联的形容词的结果;
第四处理单元,用于查找该形容词相关的评论内容,并重复对每个评论内容内的所有词汇进行词性和顺序分解,将该形容词前面的最接近的名词放入关联名词暂存表中,根据关联名词暂存表获得并显示与该形容词关联的名词的结果。
7.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第一处理单元包括:
第一返回子单元,用于返回拥有该形容词的所有评论内容列表;
第一记录统计子单元,用于获得该形容词后的最近的名词,并记录入名词临时表,并记录名词出现次数;
第一归并子单元,用于在一个名词在名词临时表中已经出现时,则归并该名词,增加该名词出现次数;
第一显示子单元,用于列出该名词临时表中的前预设位的名词;这些名词即为该形容词的关联热词。
8.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第二处理单元包括:
第二返回子单元,用于返回拥有该名词的所有评论内容列表;
第二记录统计子单元,用于获得该名词前的所有形容词,并记录入形容词临时表,并记录形容词出现次数;
第二归并子单元,用于在如果一个形容词在形容词临时表出现时,则归并该形容词,增加该形容词的出现次数;
第二显示子单元,用于列出该形容词临时表中的前预设位的形容词;这些形容词即为该名词的关联热词。
9.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第三处理单元包括:
第一查找子单元,用于选定该名词,查找包含该名词的评论内容;
第一分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第一排序子单元,用于对选定名词在评论内容中分解的词性和顺序进行排序,确认该名词前面的最接近的形容词;
第一重复子单元,用于将找到的形容词放入关联形容词暂存表,重复第一分解子单元直到所有包含该名词的评论内容全部处理完毕,某个形容词在关联形容词暂存表中重复出现时,在第三显示子单元中进行统计排序;
第三显示子单元,用于将形容词的关联形容词暂存表中的数据,按照出现次数进行排序;排序结果就是同该名词关联的形容词的结果。
10.如权利要求6所述的旅游目的地中的数据语义关联分析系统,其特征在于,所述第四处理单元包括:
第二查找子单元,用于选定该形容词,查找包含该形容词的评论内容;
第二分解子单元,用于对每个评论内容内的所有词汇进行词性和顺序分解;
第二排序子单元,用于对选定形容词在评论内容中分解的词性和顺序进行排序,确认该形容词前面的最接近的名词;
第二重复子单元,用于将找到的名词放入关联名词暂存表,重复第二分解子单元直到所有包含该形容词的评论内容全部处理完毕,某个名词在关联名词暂存表中重复出现时,在第四显示子单元进行统计排序;
第四显示子单元,用于将名词的关联名词暂存表中的数据,按照出现次数进行排序;排序结果就是同该形容词关联的名词的结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806298.4A CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610806298.4A CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106407181A true CN106407181A (zh) | 2017-02-15 |
CN106407181B CN106407181B (zh) | 2019-05-14 |
Family
ID=57998783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610806298.4A Active CN106407181B (zh) | 2016-09-07 | 2016-09-07 | 旅游目的地中的数据语义关联分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106407181B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423837A (zh) * | 2017-04-12 | 2017-12-01 | 宁夏丝路风情旅游网络股份有限公司 | 旅游路线的智能规划方法及系统 |
CN112559862A (zh) * | 2020-12-11 | 2021-03-26 | 芜湖汽车前瞻技术研究院有限公司 | 一种基于邻近词相似度的产品特征聚类方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246164A (zh) * | 2008-12-11 | 2011-11-16 | 有限公司呢哦派豆 | 基于用户意图的信息搜索方法以及信息提供方法 |
CN102760264A (zh) * | 2011-04-29 | 2012-10-31 | 国际商业机器公司 | 为互联网上的评论生成摘录的计算机实现的方法和系统 |
CN102937954A (zh) * | 2011-08-16 | 2013-02-20 | 同程网络科技股份有限公司 | 一站式旅游信息搜索方法 |
CN103853824A (zh) * | 2014-03-03 | 2014-06-11 | 沈之锐 | 一种基于深度语义挖掘的内文广告发布方法与系统 |
KR101485940B1 (ko) * | 2013-08-23 | 2015-01-27 | 네이버 주식회사 | 시멘틱 뎁스 구조 기반의 검색어 제시 시스템 및 방법 |
CN105528410A (zh) * | 2015-12-05 | 2016-04-27 | 浙江大学 | 一种对医院的在线评论进行归纳和分类的方法 |
-
2016
- 2016-09-07 CN CN201610806298.4A patent/CN106407181B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102246164A (zh) * | 2008-12-11 | 2011-11-16 | 有限公司呢哦派豆 | 基于用户意图的信息搜索方法以及信息提供方法 |
CN102760264A (zh) * | 2011-04-29 | 2012-10-31 | 国际商业机器公司 | 为互联网上的评论生成摘录的计算机实现的方法和系统 |
CN102937954A (zh) * | 2011-08-16 | 2013-02-20 | 同程网络科技股份有限公司 | 一站式旅游信息搜索方法 |
KR101485940B1 (ko) * | 2013-08-23 | 2015-01-27 | 네이버 주식회사 | 시멘틱 뎁스 구조 기반의 검색어 제시 시스템 및 방법 |
CN103853824A (zh) * | 2014-03-03 | 2014-06-11 | 沈之锐 | 一种基于深度语义挖掘的内文广告发布方法与系统 |
CN105528410A (zh) * | 2015-12-05 | 2016-04-27 | 浙江大学 | 一种对医院的在线评论进行归纳和分类的方法 |
Non-Patent Citations (1)
Title |
---|
陈晓美: "网络评论观点知识发现研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107423837A (zh) * | 2017-04-12 | 2017-12-01 | 宁夏丝路风情旅游网络股份有限公司 | 旅游路线的智能规划方法及系统 |
CN112559862A (zh) * | 2020-12-11 | 2021-03-26 | 芜湖汽车前瞻技术研究院有限公司 | 一种基于邻近词相似度的产品特征聚类方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106407181B (zh) | 2019-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kochkina et al. | All-in-one: Multi-task learning for rumour verification | |
Ye et al. | Sentiment classification for movie reviews in Chinese by improved semantic oriented approach | |
Hai et al. | Implicit feature identification via co-occurrence association rule mining | |
EP2041669B1 (en) | Text categorization using external knowledge | |
CN101119326B (zh) | 一种即时通信会话记录的管理方法及装置 | |
CN110334178B (zh) | 数据检索方法、装置、设备及可读存储介质 | |
Li et al. | Generating aspect-oriented multi-document summarization with event-aspect model | |
US9477747B2 (en) | Method and apparatus for acquiring hot topics | |
CN105243143A (zh) | 基于即时语音内容检测的推荐方法及系统 | |
CN104809108B (zh) | 信息监测分析系统 | |
CN106126619A (zh) | 一种基于视频内容的视频检索方法及系统 | |
CN101950309A (zh) | 一种面向学科领域的新专业词汇识别方法 | |
CN105843796A (zh) | 一种微博情感倾向分析方法及装置 | |
CN109299235A (zh) | 知识库搜索方法、装置及计算机可读存储介质 | |
CN109446393B (zh) | 一种网络社区话题分类方法及装置 | |
CN114817575B (zh) | 基于扩展模型的大规模电力事理图谱处理方法 | |
Rakesh et al. | Location-specific tweet detection and topic summarization in twitter | |
CN106407181A (zh) | 旅游目的地中的数据语义关联分析方法及系统 | |
CN107632974A (zh) | 适用于多领域的中文分析平台 | |
JP5364010B2 (ja) | 検索キーワード辞書に対する非検索キーワード辞書を用いた文章検索プログラム、サーバ及び方法 | |
CN106570058A (zh) | 一种搜索方法和搜索引擎 | |
CN110837553A (zh) | 搜索邮件的方法及相关产品 | |
JP2012043286A (ja) | 検索キーワード辞書及び係り受けキーワード辞書を用いた文章検索プログラム、装置、サーバ及び方法 | |
CN106919700B (zh) | 基于并行化cep处理的语义驱动犯罪线索实时推荐方法 | |
CN107203620A (zh) | 主题词分类号的确定方法和确定装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 430000 7th Floor, Urban Partner Base, No. 122 North Road, Wuhan District, Hubei Province, with No. 88, 90000 Li Applicant after: Wuhan Zhong Hui Huitong Technology Co., Ltd. Address before: 430000 2nd Floor of Laohuo Science and Technology Building, 88 Academy Road, Hongshan District, Wuhan City, Hubei Province Applicant before: Earth view (Wuhan) Information Technology Co., Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |