CN109344150A - 一种基于fp-树的时空数据挖掘分析方法 - Google Patents

一种基于fp-树的时空数据挖掘分析方法 Download PDF

Info

Publication number
CN109344150A
CN109344150A CN201810877226.8A CN201810877226A CN109344150A CN 109344150 A CN109344150 A CN 109344150A CN 201810877226 A CN201810877226 A CN 201810877226A CN 109344150 A CN109344150 A CN 109344150A
Authority
CN
China
Prior art keywords
data
item
tree
support
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810877226.8A
Other languages
English (en)
Inventor
宋耀莲
田榆杰
龙华
王慧东
徐文林
武双新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810877226.8A priority Critical patent/CN109344150A/zh
Publication of CN109344150A publication Critical patent/CN109344150A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于FP‑树的时空数据挖掘分析方法,属于时空数据挖掘技术领域。先建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表;对事务表进行第一次扫描,计算并保留频繁项;然后,对事务表进行第二次扫描,构建频繁模式树FP‑树,并提取出频繁3‑项集;其次,由各频繁3‑项集产生相应的强时空关联规则,并计算出各强时空关联规则的置信度大小;最后,将强时空关联规则按照其置信度的大小进行排序,生成时空关联规则表。本发明与现有技术相比,主要将单维度的FP‑树算法扩展到了三维时空数据的关联规则分析中,从而对数据间的关联关系起到了更加精准、深层次的分析作用。

Description

一种基于FP-树的时空数据挖掘分析方法
技术领域
本发明涉及一种基于FP-树的时空数据挖掘分析方法,属于时空数据挖掘技术领域。
背景技术
FP-树算法是韩家炜等人在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-树),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(Frequent Pattern Tree)的数据结构。FP-树是一种特殊的前缀树,由频繁项头表和项前缀树构成。
FP-树算法基于以上的结构加快整个挖掘过程,而且算法已经被广泛的应用到商业、网络安全等各个领域。但原始FP-树算法仅能应用到单维度数据领域,无法对时空类的三维数据进行准确的挖掘分析。
发明内容
本发明要解决的技术问题是提供一种基于FP-树的时空数据挖掘分析方法,将单维度的FP-树算法扩展到了三维时空数据的关联规则分析中,从而对数据间的关联关系起到了更加精准、深层次的分析作用。
本发明的技术方案是:一种基于FP-树的时空数据挖掘分析方法,包括如下步骤:
Step1、建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表,表中主要包括以下字段:事务编号ID、空间谓词、属性值、时间值;
Step2、设置最小支持度阈值min_sup和最小置信度阈值min_conf,对事务表进行第一次扫描,去除掉事务表中所有支持度计数support_count_x小于最小支持度阈值的数据项,记录剩余数据项的支持度计数并按降序排序,生成频繁1-项集的新事务表;
Step3、对新事务表进行第二次扫描,初始化FP-树。以字符null做为根节点,按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表。项头表中,在加入数据项节点时需统计其出现的次数,形式为(Xi,N),Xi为第i个数据项,N为出现的次数;
Step4、从FP-树的每条路径的结尾节点依次向上提取出相应的3-项集,3-项集的支持度计数support_count_xj大于等于min_sup时,该3-项集作为频繁3-项集l保留,反之剔除;
Step5、设每个频繁3-项集l中的空间谓词为子集s,若属性值与时间值的集合(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强时空关联规则该强规则的置信度大小为l与s的支持度计数之比的值将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表;
Step6、将时空关联规则表结合实验数据的背景知识,对该结果进行相应的意义分析、比较。
具体地,所述步骤Step1中,收集到的时空数据包括名称、属性值、地址和发生时间,对其进行数据的转换处理,以使得数据可以更好的进行计算,主要包括以下几个步骤:
(1)对收集的数据进行预处理,过滤掉不相关的冗余数据,包括不在研究目标时间与空间范围内的数据;
(2)对空间数据进行形式化处理,按各对象与某一目标对象的空间距离关系来对各个对象数据赋予相应的空间谓词;
(3)接着按事务具体发生的时间点,生成事务表来存储处理过的时空数据,事务表包括以下几个字段:事务ID、空间谓词、属性值、时间点。
具体地,所述步骤Step2中,最小支持度阈值min_sup和最小置信度阈值min_conf的大小由用户根据自己的需求自行设置。事务表中每个类型的空间谓词、属性值、时间值都分别作为一个数据项,数据项的支持度计数就是该数据项出现的总个数。
具体地,所述步骤Step3中,分支路径由根节点null和对应的数据项节点组成,其中数据项节点的路径顺序为Step2中的频繁项支持度计数降序排序。
对于要插入的每个数据项节点,其添加方式分为两种情况:(1)若插入的数据项与之前插入的数据项有共同的前缀,则合并该前缀数据项并将该项出现的次数加1,然后为余下不同的数据项添加新的分支并记录N为1;(2)若插入的数据项与之前插入的数据项没有共同的前缀,则在根节点建立新的分支,并记录N为1。
项头表分别存储了数据项、支持度数和头节点指针,头节点指针指向由相同数据项组成节点链的第一项的位置。
具体地,所述步骤Step5的强时空关联规则置信度大小的计算公式如公式(1)所示:
其中:
式中,min_conf为最小置信度阈值;l为频繁3-项集,s为l的空间谓词非空子集;support_count(l)、support_count(s)、support_count(l-s)分别为括号内字母的支持度计数,为强时空关联规则。
本发明的有益效果是:将单维度的FP-树算法扩展到了三维时空数据的关联规则分析中,从而对数据间的关联关系起到了更加精准、深层次的分析作用。
附图说明
图1是本发明总体流程图;
图2是本发明步骤Step1流程图;
图3是本发明步骤Step3流程图;
图4是本发明具体实施方式中所举例子中Step3的FP-树结果图。
具体实施方式
下面结合附图和具体实施方式,对本发明作进一步说明。
实施例1:如图1-4所示,一种基于FP-树的时空数据挖掘分析方法,包括如下步骤:
Step1、建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表,表中主要包括以下字段:事务编号ID、空间谓词、属性值、时间值;
Step2、设置最小支持度阈值min_sup和最小置信度阈值min_conf,对事务表进行第一次扫描,去除掉事务表中所有支持度计数support_count_x小于最小支持度阈值的数据项,记录剩余数据项的支持度计数并按降序排序,生成频繁1-项集的新事务表;
Step3、对新事务表进行第二次扫描,初始化FP-树。以字符null做为根节点,按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表。项头表中,在加入数据项节点时需统计其出现的次数,形式为(Xi,N),Xi为第i个数据项,N为出现的次数;
Step4、从FP-树的每条路径的结尾节点依次向上提取出相应的3-项集,3-项集的支持度计数support_count_xj大于等于min_sup时,该3-项集作为频繁3-项集l保留,反之剔除;
Step5、设每个频繁3-项集l中的空间谓词为子集s,若属性值与时间值的集合(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强时空关联规则该强规则的置信度大小为l与s的支持度计数之比的值将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表;
Step6、将时空关联规则表结合实验数据的背景知识,对该结果进行相应的意义分析、比较。
进一步地,所述步骤Step1中,收集到的时空数据包括名称、属性值、地址和发生时间,对其进行数据的转换处理,以使得数据可以更好的进行计算,主要包括以下几个步骤:
(1)对收集的数据进行预处理,过滤掉不相关的冗余数据,包括不在研究目标时间与空间范围内的数据;
(2)对空间数据进行形式化处理,按各对象与某一目标对象的空间距离关系来对各个对象数据赋予相应的空间谓词;
(3)接着按事务具体发生的时间点,生成事务表来存储处理过的时空数据,事务表包括以下几个字段:事务ID、空间谓词、属性值、时间点。
进一步地,所述步骤Step2中,最小支持度阈值min_sup和最小置信度阈值min_conf的大小由用户根据自己的需求自行设置。事务表中每个类型的空间谓词、属性值、时间值都分别作为一个数据项,数据项的支持度计数就是该数据项出现的总个数。
进一步地,所述步骤Step3中,分支路径由根节点null和对应的数据项节点组成,其中数据项节点的路径顺序为Step2中的频繁项支持度计数降序排序。
对于要插入的每个数据项节点,其添加方式分为两种情况:(1)若插入的数据项与之前插入的数据项有共同的前缀,则合并该前缀数据项并将该项出现的次数加1,然后为余下不同的数据项添加新的分支并记录N为1;(2)若插入的数据项与之前插入的数据项没有共同的前缀,则在根节点建立新的分支,并记录N为1。
项头表分别存储了数据项、支持度数和头节点指针,头节点指针指向由相同数据项组成节点链的第一项的位置。
进一步地,所述步骤Step5的强时空关联规则置信度大小的计算公式如公式(1)所示:
其中:
式中,min_conf为最小置信度阈值;l为频繁3-项集,s为l的空间谓词非空子集;support_count(l)、support_count(s)、support_count(l-s)分别为括号内字母的支持度计数,为强时空关联规则。
举例说明:对于所提出的基于FP-树的时空数据挖掘分析方法,下面结合酒店实例来说明该方法执行的有效性。酒店产业中住宿价格、地理位置和所处时间段都影响着酒店的整体发展前景。所以,本例通过对实地酒店位置的考察,模拟了某市的一所学校及其附近1000m内7家酒店的空间分布信息。详细说明本发明的方案:
一种基于FP-树的时空数据挖掘分析方法,所述方法的具体步骤如下:
Step1、建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表,表中主要包括以下字段:事务编号ID、空间谓词、属性值、时间值;具体地:
为方便阐述本发明,提取酒店三天的交易数据,如下:
根据酒店与学校的距离,将酒店和学校的位置关系用三种空间谓词表示,如下表所示:
根据酒店住宿的价格可以把价格抽象地分成三个量级,如下表所示:
通过以上关系的转换,将原始数据转换生成新的时空事务表,如下表所示:
Step2、设置最小支持度阈值min_sup和最小置信度阈值min_conf,对事务表进行第一次扫描,去除掉事务表中所有支持度计数support_count_x小于最小支持度阈值的数据项,记录剩余数据项的支持度计数并按降序排序,生成频繁1-项集的新事务表;具体地:
设置本案例中的最小支持度阈值为3,去除掉事务表中所有支持度计数小于3的数据项,生成频繁1-项集,并按其支持度计数降序排序,生成新事务表,如下表所示:
Step3、对新事务表进行第二次扫描,初始化FP-树。以字符null做为根节点,按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表。项头表中,在加入数据项节点时需统计其出现的次数,形式为(Xi,N),Xi为第i个数据项,N为出现的次数;具体地:
以字符等于null为根节点,同时按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表,FP-树和项头表如图4所示;
Step4、从FP-树的每条路径的结尾节点依次向上提取出相应的3-项集,3-项集的支持度计数support_count_xj大于等于min_sup时,该3-项集作为频繁3-项集l保留,反之剔除;具体地:
首先,从图4中FP-树的结尾节点开始提取相应的3-项集,该3-项集作为频繁3-项集l保留,如下表所示:
Step5、设每个频繁3-项集l中的空间谓词为子集s,若属性值与时间值的集合(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强时空关联规则该强规则的置信度大小为l与s的支持度计数之比的值将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表;具体地:
设置最小置信度阈值min_conf=0.4。将频繁3-项集l中的空间谓词作为前项的频繁项集s,并计算(l-s)与s的支持度计数之比大于等于0.4则输出强时空关联规则,同时计算该强规则的置信度大小。将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表,如下表所示:
Step6、将时空关联规则表结合实验数据的背景知识,对该结果进行相应的意义分析、比较。具体地:
从时空关联规则表中可以看出:在8/30到9/1这三天内,距离学校300m以内的酒店,价格较高,在241元以上。但是第2条和第1条规则发生了明显变化,第2条规则表示了在8/30,距离学校301m-700m之间的酒店,其价格适中,在151元至240元之间,第1条规则表示了在9/1,距离学校301m-700m之间的酒店,其价格较高,241元以上。同时,第1条规则的置信度高于第2条规则的置信度。通过比较第2条和第1条规则呈现的变化规律,再结合实际情况,可以判断出在8/30到9/1这三天,距离学校301m-700m之间的酒店价格呈现出了上涨现象。比较第3条和第1条规则,可以发现酒店与学校的距离影响着酒店的价格定位,并且价格随着距离的增长呈反比。所以,可得出在9/1这天,距离学校700m内的酒店其价格较高且都在241元以上的结论。
以上结合附图对本发明的具体实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下作出各种变化。

Claims (4)

1.一种基于FP-树的时空数据挖掘分析方法,其特征在于:
Step1、建立一个时空数据信息记录的数据库,并对数据进行转换处理后生成新的事务表,表中包括以下字段:事务编号ID、空间谓词、属性值、时间值;
Step2、设置最小支持度阈值min_sup和最小置信度阈值min_conf,对事务表进行第一次扫描,去除掉事务表中所有支持度计数support_count_x小于最小支持度阈值的数据项,记录剩余数据项的支持度计数并按降序排序,生成频繁1-项集的新事务表;
Step3、对新事务表进行第二次扫描,初始化FP-树,以字符null做为根节点,按照新事务表顺序依次插入每条事务的数据项作为节点,生成对应的分支路径同时建立项头表,项头表中,在加入数据项节点时需统计其出现的次数,形式为(Xi,N),Xi为第i个数据项,N为出现的次数;
Step4、从FP-树的每条路径的结尾节点依次向上提取出相应的3-项集,3-项集的支持度计数support_count_xj大于等于min_sup时,该3-项集作为频繁3-项集l保留,反之剔除;
Step5、设每个频繁3-项集l中的空间谓词为子集s,若属性值与时间值的集合(l-s)与s的支持度计数之比大于等于最小置信度阈值min_conf,则输出强时空关联规则该强规则的置信度大小为l与s的支持度计数之比的值将所计算出来的所有强时空关联规则按照其置信度confidence的大小进行排序,生成时空关联规则表;
Step6、将时空关联规则表结合实验数据的背景知识,对该结果进行相应的意义分析、比较。
2.根据权利要求1所述的基于FP-树的时空数据挖掘分析方法,其特征在于:所述步骤Step1中,收集到的时空数据包括名称、属性值、地址和发生时间,对其进行数据的转换处理,具体步骤为:
(1)对收集的数据进行预处理,过滤掉不相关的冗余数据,包括不在研究目标时间与空间范围内的数据;
(2)对空间数据进行形式化处理,按各对象与某一目标对象的空间距离关系来对各个对象数据赋予相应的空间谓词;
(3)接着按事务具体发生的时间点,生成事务表来存储处理过的时空数据,事务表包括以下几个字段:事务ID、空间谓词、属性值、时间点。
3.根据权利要求1所述的基于FP-树的时空数据挖掘分析方法,其特征在于:所述步骤Step3中,分支路径由根节点null和对应的数据项节点组成,其中数据项节点的路径顺序为Step2中的频繁项支持度计数降序排序。
4.根据权利要求1所述的基于FP-树的时空数据挖掘分析方法,其特征在于:所述步骤Step5的强时空关联规则置信度大小的计算公式如公式(1)所示:
其中:
式中,min_conf为最小置信度阈值;l为频繁3-项集,s为l的空间谓词非空子集;support_count(l)、support_count(s)、support_count(l-s)分别为括号内字母的支持度计数,为强时空关联规则。
CN201810877226.8A 2018-08-03 2018-08-03 一种基于fp-树的时空数据挖掘分析方法 Pending CN109344150A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810877226.8A CN109344150A (zh) 2018-08-03 2018-08-03 一种基于fp-树的时空数据挖掘分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810877226.8A CN109344150A (zh) 2018-08-03 2018-08-03 一种基于fp-树的时空数据挖掘分析方法

Publications (1)

Publication Number Publication Date
CN109344150A true CN109344150A (zh) 2019-02-15

Family

ID=65296674

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810877226.8A Pending CN109344150A (zh) 2018-08-03 2018-08-03 一种基于fp-树的时空数据挖掘分析方法

Country Status (1)

Country Link
CN (1) CN109344150A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136008A (zh) * 2019-04-15 2019-08-16 深圳壹账通智能科技有限公司 利用大数据的产品数据推送方法、装置、设备和存储介质
CN110992109A (zh) * 2019-12-16 2020-04-10 重庆锐云科技有限公司 基于关联规则的房地产客户分析方法、装置及存储介质
CN111127408A (zh) * 2019-12-12 2020-05-08 广州柏视医疗科技有限公司 基于GrowCut的鼻咽癌原发病灶临床靶区自动勾画方法及系统
CN111241668A (zh) * 2020-01-07 2020-06-05 湖南大唐先一科技有限公司 一种电厂受热面失效分析方法、装置、设备及存储介质
CN111261255A (zh) * 2020-01-08 2020-06-09 广东工业大学 一种处方推荐方法和装置
CN112434104A (zh) * 2020-12-04 2021-03-02 东北大学 面向关联规则挖掘的冗余规则筛除方法及装置
CN113239127A (zh) * 2021-05-13 2021-08-10 北方工业大学 科技服务关联网络的构建、依赖关系的识别方法及计算机产品
CN113781138A (zh) * 2020-09-29 2021-12-10 北京沃东天骏信息技术有限公司 一种信息推送的方法、装置和存储介质
CN114839601A (zh) * 2022-07-04 2022-08-02 中国人民解放军国防科技大学 基于频繁项分析的雷达信号高维时序特征提取方法及装置
CN110297853B (zh) * 2019-07-01 2023-11-14 创新先进技术有限公司 频繁集挖掘方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127037A (zh) * 2006-08-15 2008-02-20 临安微创网格信息工程有限公司 基于时序向量差异序列法聚类的周期关联规则发现算法
CN106650225A (zh) * 2016-10-25 2017-05-10 康美药业股份有限公司 基于fp增长算法模型的中药配方数据挖掘方法及系统
CN107145609A (zh) * 2017-06-13 2017-09-08 上海应用技术大学 基于FP‑Growth算法的隧道交通事故关联规则算法
CN107526721A (zh) * 2017-06-21 2017-12-29 深圳美云智数科技有限公司 一种对电商产品评论词汇的歧义消除方法及装置
US20180107695A1 (en) * 2016-10-19 2018-04-19 Futurewei Technologies, Inc. Distributed fp-growth with node table for large-scale association rule mining

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101127037A (zh) * 2006-08-15 2008-02-20 临安微创网格信息工程有限公司 基于时序向量差异序列法聚类的周期关联规则发现算法
US20180107695A1 (en) * 2016-10-19 2018-04-19 Futurewei Technologies, Inc. Distributed fp-growth with node table for large-scale association rule mining
CN106650225A (zh) * 2016-10-25 2017-05-10 康美药业股份有限公司 基于fp增长算法模型的中药配方数据挖掘方法及系统
CN107145609A (zh) * 2017-06-13 2017-09-08 上海应用技术大学 基于FP‑Growth算法的隧道交通事故关联规则算法
CN107526721A (zh) * 2017-06-21 2017-12-29 深圳美云智数科技有限公司 一种对电商产品评论词汇的歧义消除方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李围成: ""基于FP-树的时空数据挖掘算法研究"", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110136008A (zh) * 2019-04-15 2019-08-16 深圳壹账通智能科技有限公司 利用大数据的产品数据推送方法、装置、设备和存储介质
CN110297853B (zh) * 2019-07-01 2023-11-14 创新先进技术有限公司 频繁集挖掘方法和装置
CN111127408A (zh) * 2019-12-12 2020-05-08 广州柏视医疗科技有限公司 基于GrowCut的鼻咽癌原发病灶临床靶区自动勾画方法及系统
CN111127408B (zh) * 2019-12-12 2021-06-15 广州柏视医疗科技有限公司 基于GrowCut的鼻咽癌原发病灶临床靶区自动勾画方法及系统
CN110992109B (zh) * 2019-12-16 2022-09-02 重庆锐云科技有限公司 基于关联规则的房地产客户分析方法、装置及存储介质
CN110992109A (zh) * 2019-12-16 2020-04-10 重庆锐云科技有限公司 基于关联规则的房地产客户分析方法、装置及存储介质
CN111241668A (zh) * 2020-01-07 2020-06-05 湖南大唐先一科技有限公司 一种电厂受热面失效分析方法、装置、设备及存储介质
CN111261255B (zh) * 2020-01-08 2023-03-31 广东工业大学 一种处方推荐方法和装置
CN111261255A (zh) * 2020-01-08 2020-06-09 广东工业大学 一种处方推荐方法和装置
CN113781138A (zh) * 2020-09-29 2021-12-10 北京沃东天骏信息技术有限公司 一种信息推送的方法、装置和存储介质
CN112434104A (zh) * 2020-12-04 2021-03-02 东北大学 面向关联规则挖掘的冗余规则筛除方法及装置
CN112434104B (zh) * 2020-12-04 2023-10-20 东北大学 面向关联规则挖掘的冗余规则筛除方法及装置
CN113239127A (zh) * 2021-05-13 2021-08-10 北方工业大学 科技服务关联网络的构建、依赖关系的识别方法及计算机产品
CN113239127B (zh) * 2021-05-13 2024-02-09 北方工业大学 科技服务关联网络的构建、依赖关系的识别方法及计算机产品
CN114839601A (zh) * 2022-07-04 2022-08-02 中国人民解放军国防科技大学 基于频繁项分析的雷达信号高维时序特征提取方法及装置
CN114839601B (zh) * 2022-07-04 2022-09-16 中国人民解放军国防科技大学 基于频繁项分析的雷达信号高维时序特征提取方法及装置

Similar Documents

Publication Publication Date Title
CN109344150A (zh) 一种基于fp-树的时空数据挖掘分析方法
CN101853299B (zh) 一种基于感性认知的图像检索结果排序方法
CN102201001B (zh) 基于倒排技术的快速检索方法
CN102364498B (zh) 一种基于多标签的图像识别方法
US20050289448A1 (en) System and method for gathering, indexing, and supplying publicly available data charts
CN107346550B (zh) 一种针对具有颜色信息的三维点云数据快速配准方法
CN103778262B (zh) 基于叙词表的信息检索方法及装置
CN104077407B (zh) 一种智能数据搜索系统及方法
CN107341199A (zh) 一种基于文献信息共性模式的推荐方法
CN104281713A (zh) 数据汇总方法和数据汇总装置
CN105095436B (zh) 数据源数据自动建模方法
CN103336771A (zh) 基于滑动窗口的数据相似检测方法
CN103324929B (zh) 基于子结构学习的手写中文识别方法
CN107291895A (zh) 一种快速的层次化文档查询方法
CN108132964A (zh) 一种基于用户对项目类评分的协同过滤方法
CN102867065B (zh) 基于关系型数据库的数据汇总装置和方法
CN109359135A (zh) 一种基于分段权重的时间序列相似性搜索方法
CN109492022A (zh) 基于语义的改进的k-means算法的搜索方法
CN106970938A (zh) 面向聚焦的Web网页获取和信息抽取方法
CN109145161A (zh) 中文地名查询方法、装置及设备
CN108566620A (zh) 一种基于wifi的室内定位方法
CN110059755B (zh) 一种多特征评价准则融合的地震属性优选方法
CN105447633A (zh) 一种科研机构综合评价方法及系统
CN109741832A (zh) 一种基于兼存率与FP-growth的心理行为分析方法
CN106649264B (zh) 一种基于篇章信息的中文水果品种信息抽取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190215

RJ01 Rejection of invention patent application after publication