CN106776672A - 技术发展脉络图确定方法 - Google Patents

技术发展脉络图确定方法 Download PDF

Info

Publication number
CN106776672A
CN106776672A CN201610746522.5A CN201610746522A CN106776672A CN 106776672 A CN106776672 A CN 106776672A CN 201610746522 A CN201610746522 A CN 201610746522A CN 106776672 A CN106776672 A CN 106776672A
Authority
CN
China
Prior art keywords
technology
analysis
altogether
document
citation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610746522.5A
Other languages
English (en)
Inventor
程传旭
陈庆荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201610746522.5A priority Critical patent/CN106776672A/zh
Publication of CN106776672A publication Critical patent/CN106776672A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种技术发展脉络图确定方法,通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上时间维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据时间关系上的技术关系关联程度,加上时间维度,确定技术发展脉络。本发明的专利技术发展脉络图可以反映出某技术领域的研究热点和核心技术,准确掌握专利技术被引用的发展态势,从而可以有效获取技术前沿的变化信息,具有重要意义。

Description

技术发展脉络图确定方法
技术领域
本发明涉及专利情报研究领域,特别是涉及一种技术发展脉络图确定方法。
背景技术
作为专利情报不仅是简单整理和加工,更主要的是进行深加工而获得深层情报。作为专利情报研究,一般主要应用技术、人、时间和地点四个主要的要素,进行二维和多维组配,然后进行定性、定量、矢量、模型和数学相关分析,从而获得隐含的技术情报,经营情报,权利情报以及有关规律性。
技术发展脉络研究方法是选择与研究主题相关的专利文献类型,统计分析在某一时期内的专利文献中已解决的技术问题,组成不同类型和层次的技术群。在时序上绘制主要技术发展脉络图,可以掌握技术发展动向,预测未来,推测开发倾向以及研究技术发展脉络的规律性。
可以采用科学计量学中的共现分析方法、社会网络分析方法和信息可视化技术,建立大型技术共现矩阵,从而构建技术共现网络,绘制技术共现图谱。在此基础上,分析不同领域之间技术发展的联系,识别关键技术领域以及同一领域内的技术发展脉络和技术网络结构。
共现分析方法主要包括共引分析、共词分析与共类分析三种。共引分析是目前在专利计量中采用较为广泛的分析方法,共引分析建立在文献之间的引用关系上,但由于中国专利数据库缺乏引文数据,只能限于对国外专利数据库中所收录的专利进行引文分析。
共类分析法则针对专利所属的主题技术类别。一般认为,同一论文、期刊和专利可能归属于多个不同的主题类别和技术领域,由于技术竞争情报和产业技术政策制定的需要,分析技术网络结构,描绘产业科学技术中的概念和问题之间的关系很重要。可利用德温特手工代码,采用共类分析的方法来研究技术与技术间的网络结构,通过对该技术网络进行细致分析,可以进一步判断每一个技术集群中的关键技术,但有一定的计算量和复杂度。但从专利分类号入手探讨领域的技术关联度,由于专利分类号的信息容量极为有限,难以准确反映技术间的真实关联度。
而共词分析采用单词或词组的共现来描述概念之间的关系,具有更好的适用性,但在专利计量中并不多见,这是由于在专利文献中没有关键词,所以取词还是一个难点。现有的德温特分析家软件虽然可以对德温特专利数据库中的专利文献进行截词,但要从截取的海量词汇中挑选出能反映出相关技术的词,又需要分析者除了具有情报分析能力以外,还具有较高的专业知识,这给分析带来了一定的困难。
上述方法各有利弊,需要一种综合考虑上述方法来确定技术发展脉络图的方法。
发明内容
基于综合各种因素确定技术发展脉络图的考虑,本申请提出了一种技术发展脉络图确定方法,通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上时间维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据时间关系上的技术关系关联程度,加上时间维度,确定技术发展脉络。
可选地,所述进行共现分析方法选择是根据技术领域对重点专利文献进行统计分析,若重点文献引证关系复杂且引证文献数目较多,则选择共引分析方法;若重点文献分类号类似,并具有不同的细分,则选择共类分析方法;若重点文献之间关键词匹配程度高,文献间语义匹配高,宜选择共词分析方法。
可选地,所述技术发展脉络图可以是技术路线图、技术发展图、技术拓扑图、技术演进图。
可选地,若增加某企业的限定条件,则可以具体到特定企业的整体技术发展路线、特定技术的发展脉络。
可选地,所述引证关系是同族扩展引证。
可选地,所述引证、技术关联度基于分类号或者关键词分析得到。
可选地,共引分析方法主要包括专利情报采集、建立专利引文数据库、专利情报再整理、绘制专利技术/功效分布图、专利引用路径分析、绘制专利技术演进图6个步骤
可选地,共类分析方法包括以下步骤:以专利数据为研究对象,进行技术分类号的共类检索,构建大型专利共被引矩阵,进行技术共类分析,探究专利技术网络结构及其发展脉络。
可选地,共词分析方法包括以下步骤:首先采用文本挖掘技术对某一技术领域发明专利进行分析,从中提取到多个技术性关键词,并记录每个关键词出现的次数;以关键词出现次数为特征向量,采用余弦夹角计算子领域间的技术关联矩阵;然后使用社会网络分析方法对上述技术领域内部的技术关联度进行了分析, 从而绘制技术发展脉络图。
可选地,进一步还可以运用平均技术共类伙伴和平均技术共类指数两个指标,分析和测度技术关联度的演变过程。
从上述技术方案可以看出,本发明的技术发展脉络图确定方法能根据领域的特点确定技术发展脉络图,具有相对较好的效果。
附图说明
图1是本发明技术发展脉络图确定方法的流程图。
图2是根据本发明一实施例的共引分析方法确定技术发展脉络图的流程图。
图3是根据本发明一实施例的共类分析方法确定技术发展脉络图的流程图。
图4是根据本发明一实施例的共词分析方法确定技术发展脉络图的流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
附图1是本发明技术发展脉络图确定方法的流程图,通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上时间维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据时间关系上的技术关系关联程度,加上时间维度,确定技术发展脉络。
在重点文献的查找过程中,除了常见的诸如被引用率或者其他已经被标引的特定指标之外,还可以采用如下方式来产生重点专利文献:
a).样本采集,从现有多类文档库中采集足够数量的、已明确类别的重点专利文献,作为训练样本;并获取样本的文本内容;
该步骤中,所述的获取样本的文本内容包括抽取文档文本和预处理,在抽取文档文本的过程中,对pdf、doc和html格式的文档分别采用相关的PDFBox插件、javadoc插件和HTMlParser解析文档以获取文档文本;预处理为将获取的文档文本中的无关信息进行去除,对于html文档应将与主题无关的诸如等广告、友情链接、同类推荐垃圾信息过滤掉。
对步骤a)所抽取的文档内容进行量化,也即是为文档构建特征集合,用可以量化的特征集合描述文档。文档特征集合的构建有多种方法,如文档频率法、信息增益法、开方拟合检验法、互信息法等,一个具体的例子采用最简单的文档频率法表示文档。首先对文档的文本进行分词处理,其次对分词的词性进行分析,再次去除其中的虚词和人名,最后统计各个分词出现的频率,构建由分词和分词的词频组成的向量,作为文档的特征集合表征文档作为后续处理的基础。其具体通过步骤b)至步骤f)来实现。
b).文本分词,采用现有基于词典的分词方法对每篇文档进行分词,获取文档所包含的词汇;
该步骤中,所采用的分词方法为采用最大匹配法从文档中获取其所包含的词汇;
c).词性分析,在分词的过程中,同时为文档的每个句子构建语法树,分析句子中每个分词的词性,并对分词的词性进行标注;
该步骤中,所述的词性分析为使用现有技术词汇词典中的词性标记符号,对获取的分词进行词性标注;
d).去除虚词和人名,为了突出文档所要表达的语义,将词汇中的虚词和人名去除,以获取不包含虚词和人名的文档词汇;
实词有实在意义,能够单独充当句子成分一般能单独回答问题。而虚词没有完整的词汇意义,但有语法意义或功能意义的词。在一篇文档中对文档的核心内容起说明作用的一般是文档中的实词,因此为了能更好的突出文档所要表达的语义,应去除词汇中的虚词。
e).统计词频,统计步骤d)中所获取的不包含虚词和人名的词汇中每个分词出现的次数,获取分词的词频,将分词和对应的词频作为文档的特征;
f).构建特征集合,为了尽可能多的涵盖文本内容并减小构建网络的计算量,对每篇文档按词频数量从多至少选取前25%~45%的分词作为文档的特征集合;
g)对分词进行取舍,选取前25%~45%的高频词作为文档的特征集合,如选取的前35%的分词,将选定的分词特征集合与预先设定的重点专利文档中提取的特征集合对照,计算其欧式距离,或者汉明距离,将所得距离小于预定设定阈值对应的文档选择为重点专利文献。
在产生重点专利文献之后,分析各重点文献之间的关联特征,根据关联特征,确定重点专利文献之间的共现强度,如果文献之间的共现强度越高,说明该技术类别被应用得越为广泛,越容易与其他技术类别结合而形成专利,投入实际应用。共现强度低,说明该技术类别目前比较独立,未与其他技术类别产生很强的联系。这类技术一部分专业性很强,不易与其他技术共同应用;另一部分则处于开发的初始阶段,今后会出现更多的技术联系。通过共现网络可以反映技术类别之间的联系。在网络中可以较为清晰地看到技术与技术之间的相互联系和过渡,因此可以大致分析出技术的发展脉络和趋势。如果将时间段划分得更细,则可以观察到技术发展的演化情况;如果在更加细分的技术领域内部进行分析,则技术联系的脉络将更加清晰。此种分析方法可以为宏观科技决策提供线性支持,为科技规划与评估提供基础。
特别地,当进行共现分析方法分析重点专利文献时,根据技术领域对重点专利文献进行统计分析,若重点文献引证关系复杂且引证文献数目较多,则选择共引分析方法;若重点文献分类号类似,并具有不同的细分,则选择共类分析方法;若重点文献之间关键词匹配程度高,文献间语义匹配高,则选择共词分析方法。
其中,所述技术发展脉络图可以是技术路线图、技术发展图、技术拓扑图、技术演进图。特别地,当增加某企业的限定条件,例如,以企业名称作为限定条件时,则可以具体到该特定企业的整体技术发展路线;相类似的,以特定技术描述作为限定条件时,则可以得出该特定技术的发展脉络。
其中,所述引证关系是同族扩展引证。
其中,所述引证、技术关联度基于分类号或者关键词分析得到。
通过对共现分析方法的具体实现过程,根据重点专利文献的特点,选择针对性的分析方法,从而能够更好的贴近技术领域特点,确定的技术发展脉络图能够更加直观、准确的表征技术的发展过程,具有良好的呈现和展示效果。
图2是根据共引分析方法确定技术发展脉络图的流程图。专利技术发展脉络图是由通过审查被频繁引证专利内部的关系建立起来的。高被引专利在全部专利中所占比例很小。一般来说近70%的专利从未被引用,或仅被引用1-2次。因此被引5次的专利即可称作高被引专利,只有极少数的专利被引次数超过6次,这类专利约占所有专利的10%。虽然专利被引用的绝对量不高,但从相对的角度来说,能够被引用的专利必定是比较重要的技术。因此,通过对引文路径和引用频次的分析,专利技术发展脉络图可以反映出某技术领域的研究热点和核心技术,准确掌握专利技术被引用的发展态势,从而可以有效获取技术前沿的变化信息。
通过对专利引文路径的分析,专利技术发展脉络图能够沿着引用路径揭示某一行业的整体或者某一具体技术的发展脉络,能够为技术人员探究或回溯技术起源、发展提供可靠的帮助。基于引文路径分析的专利技术发展脉络图,是将专利引文路径的可视化分析与专利技术地图结合,并加入专利技术在时间序列上的发展状况分析,来绘制专利技术演进图。这使得专利技术演进图别于已有的专利地图,可以梳理技术发展脉络、挖掘技术热点,预测技术发展方向,确定竞争对手。
通过专利引文的分析,对专利引用路径进行可视化研究,同时结合时间序列,分析这种引用关系的发展,可以清晰地将某一技术领域的几大不同类型的技术演进,即“起源”、“发展”和相应的“技术产品”体现出来。
为了制作专利技术发展脉络图需要构建专题专利引文数据库。基于引文路径分析的专利技术发展脉络图的绘制,主要包括专利情报采集、建立专利引文数据库、专利情报再整理、绘制专利技术/功效分布图、专利引用路径分析、绘制专利技术演进图6个步骤。
图3是根据本发明实施例的共类分析方法确定技术发展脉络图的流程图。共类分析方法以专利数据为研究对象,进行技术分类号的共类检索,构建大型专利共被引矩阵,进行技术共类分析,探究专利技术网络结构及其发展脉络。进一步还可以借助技术共类分析方法,运用平均技术共类伙伴和平均技术共类指数两个指标,分析和测度技术关联度的演变过程。常见的数据库有德温特创新专利引文索引数据库,其分类号有德温特手工代码,也可根据不同的数据库使用IPC、EC、UC分类号。
图4是根据本发明实施例的共词分析方法确定技术发展脉络图的流程图。许多学者使用专利引文分析,或通过考察域专利的引用和被引用情况,分析专利间的关联程度或分析专利代表的技术和专利引文及非专利引文代表的科学之间的关联来建立技术路线图,预测公司的技术及商业机会。而我国专利数据库中没有专利引文等系列统计,上述诸多引文分析无从研究。本发明具体的实施方式将文本挖掘方法运用到专利分析当中,使用文本挖掘技术对专利文本中的关键词进行了分析。文本挖掘技术,包括文本分词、摘要提取、主题识别、信息地图绘制等。这些基于文本处理的技术可以用来复原并概括文本中的信息,进行技术趋势分析,以及划分技术领域。
专利文本中包含着大量有用信息,但由于文件过于冗长,仅依靠人力是难以对其进行有效分析。本发明的一个具体实施方式使用的是社会网络分析法。社会网络分析早先集中用于科学计量学。科学计量学家们将数学、图形学、信息可视化等理论方法与引文分析结合,用图谱形象地展示各学科的发展情况。随后,它被广泛运用于科学社会、合作网络领域。最近,将网络图谱运用到专利合作分析的学者使用公司的引用和被引专利,将技术路线分为行动者-相似图、技术-产业图等,寻找公司的技术及市场机会。
更优选地,综合使用文本挖掘与社会网络分析技术,对中国某一领域的发明专利摘要文本数据进行了研究,首先采用文本挖掘技术对某一技术领域发明专利进行分析,从中提取到多个技术性关键词,并记录每个关键词出现的次数;以关键词出现次数为特征向量,采用余弦夹角计算子领域间的技术关联矩阵;然后使用社会网络分析方法对上述技术领域内部的技术关联度进行了分析, 从而绘制技术发展脉络图。
在另一个优先实施例中,首先从国家知识产权局网站上收集某一领域发明专利摘要数据,这时的初始专利数据仅是用文本表达的非结构化数据,需要将其转化为结构化数据。首先按照专利前3位主分类号(IPC)对专利细分技术进行分类。专利摘要中包含着能够反映其技术领域特征的关键词。使用文本挖掘软件对摘要进行分词处理,得到大量关键词后,再对关键词进行一一分析判断,去掉非专业性词汇,保留专用词汇,并对同义词进行合并。记录每个关键词在每个子领域中出现的次数。Tj表示第j个子领域文本文档的关键词向量,Tj=(d1j,d2j,…,dnj)。其中dij为第i个关键词在第j个子领域中的权重。dij在计算文档间关联度时可以使用的方法是计算关键词向量间的余弦夹角,很明显当两个文档中共同出的关键词数量越多,文档相似度越高,得到各子领域间的技术相似度后,即可根据相似度矩阵绘制专利地图。根据技术相关度矩阵能绘制出某领域内子领域间的技术关联图,并将关联度临界值设定为0.1,即只有当关联度大于0.1时才会在图中标出,以排除不重要的关联性,使技术关联图更加简洁直观。将同其他5个以上子领域具有关联性的子领域定义为核心技术领域。
结合上述公开的实施例所描述的方法的步骤可直接体现为硬件、由处理器执行的软件模块或者这二者的组合。软件模块可能存在于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其他形式的存储媒质中。一种典型存储媒质与处理器耦合,从而使得处理器能够从该存储媒质中读信息,且可向该存储媒质写信息。在替换实例中,存储媒质是处理器的组成部分。处理器和存储媒质可能存在于一个ASIC中。该ASIC可能存在于一个用户站中。在一个替换实例中,处理器和存储媒质可以作为用户站中的分立组件存在。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种技术发展脉络图确定方法,其特征在于:通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上时间维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据时间关系上的技术关系关联程度,加上时间维度,确定技术发展脉络。
2.根据权利要求1所述的方法,其特征在于:所述进行共现分析方法选择是根据技术领域对重点专利文献进行统计分析,若重点文献引证关系复杂且引证文献数目较多,则选择共引分析方法;若重点文献分类号类似,并具有不同的细分,宜选择共类分析方法;若重点文献之间关键词匹配程度高,文献间语义匹配高,宜选择共词分析方法。
3.根据权利要求1所述的方法,其特征在于:所述技术发展脉络图可以是技术路线图、技术发展图、技术拓扑图、技术演进图。
4.根据权利要求1所述的方法,其特征在于:若增加某企业的限定条件,则可以具体到特定企业的整体技术发展路线、特定技术的发展脉络。
5.根据权利要求1所述的方法,其特征在于:所述引证关系是同族扩展引证。
6.根据权利要求1所述的方法,其特征在于:所述引证、技术关联度基于分类号或者关键词分析得到。
7.根据权利要求1所述的方法,其特征在于:共引分析方法主要包括专利情报采集、建立专利引文数据库、专利情报再整理、绘制专利技术/功效分布图、专利引用路径分析、绘制专利技术演进图6个步骤。
8.根据权利要求1所述的方法,其特征在于:共类分析方法包括以下步骤:以专利数据为研究对象,进行技术分类号的共类检索,构建大型专利共被引矩阵,进行技术共类分析,探究专利技术网络结构及其发展脉络。
9.根据权利要求1所述的方法,其特征在于:共词分析方法包括以下步骤:首先采用文本挖掘技术对某一技术领域发明专利进行分析,从中提取到多个技术性关键词,并记录每个关键词出现的次数;以关键词出现次数为特征向量,采用余弦夹角计算子领域间的技术关联矩阵;然后使用社会网络分析方法对上述技术领域内部的技术关联度进行了分析, 从而绘制技术发展脉络图。
10.根据权利要求8所述的方法,其特征在于,进一步还可以运用平均技术共类伙伴和平均技术共类指数两个指标,分析和测度技术关联度的演变过程。
CN201610746522.5A 2016-08-30 2016-08-30 技术发展脉络图确定方法 Pending CN106776672A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610746522.5A CN106776672A (zh) 2016-08-30 2016-08-30 技术发展脉络图确定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610746522.5A CN106776672A (zh) 2016-08-30 2016-08-30 技术发展脉络图确定方法

Publications (1)

Publication Number Publication Date
CN106776672A true CN106776672A (zh) 2017-05-31

Family

ID=58972119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610746522.5A Pending CN106776672A (zh) 2016-08-30 2016-08-30 技术发展脉络图确定方法

Country Status (1)

Country Link
CN (1) CN106776672A (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784087A (zh) * 2017-10-09 2018-03-09 东软集团股份有限公司 一种热词确定方法、装置及设备
CN109344261A (zh) * 2018-10-30 2019-02-15 沈阳师范大学 一种基于共词和共引分析的中小学教育知识图谱分析系统
CN109509121A (zh) * 2018-04-26 2019-03-22 国网电力科学研究院武汉南瑞有限责任公司 技术发展趋势分析方法及系统
CN109582957A (zh) * 2018-11-15 2019-04-05 苏州征之魂专利技术服务有限公司 一种专利文件技术特征高速标定及其存储方法
CN112232072A (zh) * 2020-10-27 2021-01-15 上海安畅网络科技股份有限公司 质性分析方法、装置、电子设备及计算机可读存储介质
CN112612785A (zh) * 2020-11-20 2021-04-06 北京理工大学 一种非常规能源技术关键发展路径动态监测方法
CN112633011A (zh) * 2020-12-30 2021-04-09 清华大学 融合词语义与词共现信息的研究前沿识别方法及设备
CN112673366A (zh) * 2018-10-01 2021-04-16 Eta瑞士钟表制造股份有限公司 用于数据库的通信方法
CN113722472A (zh) * 2021-09-16 2021-11-30 北京市科学技术情报研究所 一种技术文献信息提取方法、系统及存储介质
CN114218361A (zh) * 2021-11-12 2022-03-22 杭州未名信科科技有限公司 一种基于医学研究文献的医学路径推荐方法和系统
CN114817567A (zh) * 2022-04-28 2022-07-29 清华大学 分类号共现网络的构建方法、技术机会识别方法和系统
CN117112784A (zh) * 2023-07-13 2023-11-24 南京理工大学紫金学院 一种文献识别与技术路径演化的实现方法
CN119293342A (zh) * 2024-12-10 2025-01-10 中国科学技术大学 一种面向科学领域的智能技术动态追踪系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004738A (zh) * 2009-08-31 2011-04-06 上海汉光知识产权数据科技有限公司 专利技术引证分析系统及方法
CN102110095A (zh) * 2009-12-25 2011-06-29 上海汉光知识产权数据科技有限公司 专利申请人技术发展趋势分析方法
CN102262639A (zh) * 2010-05-28 2011-11-30 真理大学 技术文件分析方法与技术文件分析系统
CN103164540A (zh) * 2013-04-15 2013-06-19 武汉大学 一种专利热点发现与趋势分析方法
CN105069712A (zh) * 2015-08-25 2015-11-18 长沙市麓智信息科技有限公司 专利分析系统及分析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102004738A (zh) * 2009-08-31 2011-04-06 上海汉光知识产权数据科技有限公司 专利技术引证分析系统及方法
CN102110095A (zh) * 2009-12-25 2011-06-29 上海汉光知识产权数据科技有限公司 专利申请人技术发展趋势分析方法
CN102262639A (zh) * 2010-05-28 2011-11-30 真理大学 技术文件分析方法与技术文件分析系统
CN103164540A (zh) * 2013-04-15 2013-06-19 武汉大学 一种专利热点发现与趋势分析方法
CN105069712A (zh) * 2015-08-25 2015-11-18 长沙市麓智信息科技有限公司 专利分析系统及分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
朱明: "《数据挖掘导论》", 31 January 2012 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784087A (zh) * 2017-10-09 2018-03-09 东软集团股份有限公司 一种热词确定方法、装置及设备
CN109509121A (zh) * 2018-04-26 2019-03-22 国网电力科学研究院武汉南瑞有限责任公司 技术发展趋势分析方法及系统
CN112673366A (zh) * 2018-10-01 2021-04-16 Eta瑞士钟表制造股份有限公司 用于数据库的通信方法
CN109344261A (zh) * 2018-10-30 2019-02-15 沈阳师范大学 一种基于共词和共引分析的中小学教育知识图谱分析系统
CN109344261B (zh) * 2018-10-30 2021-10-01 沈阳师范大学 一种基于共词和共引分析的中小学教育知识图谱分析系统
CN109582957A (zh) * 2018-11-15 2019-04-05 苏州征之魂专利技术服务有限公司 一种专利文件技术特征高速标定及其存储方法
CN112232072A (zh) * 2020-10-27 2021-01-15 上海安畅网络科技股份有限公司 质性分析方法、装置、电子设备及计算机可读存储介质
CN112612785A (zh) * 2020-11-20 2021-04-06 北京理工大学 一种非常规能源技术关键发展路径动态监测方法
CN112612785B (zh) * 2020-11-20 2023-11-17 北京理工大学 一种非常规能源技术关键发展路径动态监测方法
CN112633011A (zh) * 2020-12-30 2021-04-09 清华大学 融合词语义与词共现信息的研究前沿识别方法及设备
CN113722472A (zh) * 2021-09-16 2021-11-30 北京市科学技术情报研究所 一种技术文献信息提取方法、系统及存储介质
CN114218361A (zh) * 2021-11-12 2022-03-22 杭州未名信科科技有限公司 一种基于医学研究文献的医学路径推荐方法和系统
CN114218361B (zh) * 2021-11-12 2024-08-23 杭州未名信科科技有限公司 一种基于医学研究文献的医学路径推荐方法和系统
CN114817567A (zh) * 2022-04-28 2022-07-29 清华大学 分类号共现网络的构建方法、技术机会识别方法和系统
CN117112784A (zh) * 2023-07-13 2023-11-24 南京理工大学紫金学院 一种文献识别与技术路径演化的实现方法
CN119293342A (zh) * 2024-12-10 2025-01-10 中国科学技术大学 一种面向科学领域的智能技术动态追踪系统

Similar Documents

Publication Publication Date Title
CN106776672A (zh) 技术发展脉络图确定方法
CN109189942B (zh) 一种专利数据知识图谱的构建方法及装置
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN108197117B (zh) 一种基于文档主题结构与语义的中文文本关键词提取方法
CN102332028B (zh) 一种面向网页的不良Web内容识别方法
CN104820629B (zh) 一种智能的舆情突发事件应急处理系统及方法
CN110472203B (zh) 一种文章的查重检测方法、装置、设备及存储介质
CN106997382A (zh) 基于大数据的创新创意标签自动标注方法及系统
CN107220295A (zh) 一种人民矛盾调解案例搜索和调解策略推荐方法
CN114265935B (zh) 一种基于文本挖掘的科技项目立项管理辅助决策方法及系统
CN104915446A (zh) 基于新闻的事件演化关系自动提取方法及其系统
Das et al. A graph based clustering approach for relation extraction from crime data
CN103823896A (zh) 一种学科特征值算法及基于其的项目评审专家推荐算法
CN103914478A (zh) 网页训练方法及系统、网页预测方法及系统
KR102126911B1 (ko) KeyplayerRank를 이용한 소셜 미디어상의 주제별 키플레이어 탐지 방법
CN114265931B (zh) 基于大数据文本挖掘的消费者政策感知分析方法及系统
CN113641788B (zh) 一种基于无监督的长短影评细粒度观点挖掘方法
Mohemad et al. Performance analysis in text clustering using k-means and k-medoids algorithms for Malay crime documents
Gutsche Automatic weak signal detection and forecasting
CN118733860A (zh) 一种基于多维特征优化的媒体影响力评估模型构建方法
Ezzat et al. Topicanalyzer: A system for unsupervised multi-label arabic topic categorization
CN112667819A (zh) 一种实体描述推理知识库构建与推理证据量化信息获取方法和装置
KR20200088164A (ko) 소셜 네트워크 서비스 메시지의 감정 분석을 위한 POS(part of speech) 특징기반의 감정 분석 방법 및 이를 수행하는 감정 분석 장치
CN115409006A (zh) 一种监管报表的预处理方法和装置
Mallek et al. An unsupervised approach for precise context identification from unstructured text documents

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication