CN117634502A - 技术机会识别方法、装置、计算机设备及存储介质 - Google Patents

技术机会识别方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN117634502A
CN117634502A CN202410111452.0A CN202410111452A CN117634502A CN 117634502 A CN117634502 A CN 117634502A CN 202410111452 A CN202410111452 A CN 202410111452A CN 117634502 A CN117634502 A CN 117634502A
Authority
CN
China
Prior art keywords
technical
entity
field
analyzed
opportunity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410111452.0A
Other languages
English (en)
Inventor
孙巍
吴蕾
项芮
李周晶
杨璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Information Institute of CAAS
Original Assignee
Agricultural Information Institute of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Information Institute of CAAS filed Critical Agricultural Information Institute of CAAS
Priority to CN202410111452.0A priority Critical patent/CN117634502A/zh
Publication of CN117634502A publication Critical patent/CN117634502A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及大数据技术领域,公开了技术机会识别方法、装置、计算机设备及存储介质,包括:根据待分析技术领域,采集待分析技术领域对应的初始文献数据集;对初始文献数据集进行预处理,得到预分析数据集;对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径;计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段;基于确定出的发展阶段,确定待分析技术领域的潜在技术机会,本发明有助于自动揭示出具有重要技术价值和技术发展潜力的技术机会,且通过多步骤多模式对数据集进行层层筛选,更适合基于大量级的领域数据集来揭示相对宏观的技术机会,提升了对领域技术机会识别的有效性和准确性。

Description

技术机会识别方法、装置、计算机设备及存储介质
技术领域
本发明涉及大数据技术领域,具体涉及技术机会识别方法、装置、计算机设备及存储介质。
背景技术
当今世界知识更新步伐加快,产品生命周期缩短。市场机遇稍纵即逝,企业一旦在关键领域技术机会识别与分析上出现错误,不仅会浪费宝贵、有限的资源,而且会导致技术机会丧失,甚至直接影响企业未来发展。技术机会是指未来可能发生且可以利用的技术变化,是企业进行技术创新的关键。技术机会的核心是利用文本挖掘技术对学术论文、专利信息、网络资源等进行深度挖掘,识别出现有技术之间的相互关系及横向发展趋势,技术机会分析实质上是技术知识的挖掘,已被广泛应用于科技发展态势评价与技术机会分析。
相关技术中,现有的技术机会识别方法大多依赖专家进行人工识别,宏观技术领域适用性差且运算效率低下,很难适用于现今宏观技术领域、面向大数据的使用场景,难以满足大数据环境的信息量对技术机会识别的需求。
发明内容
有鉴于此,本发明提供了一种技术机会识别方法、装置、计算机设备及存储介质,以解决现有技术机会识别适用性差、人工依赖性强且工作效率低的问题。
第一方面,本发明提供了一种技术机会识别方法,方法包括:
根据待分析技术领域,采集待分析技术领域对应的初始文献数据集;
对初始文献数据集进行预处理,得到预分析数据集;
对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,其中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程;
计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;
基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。
在本发明中,通过采集技术领域内的文献数据集,预处理并筛选得到技术领域对应的技术主题的演进发展历程对应的技术主路径,计算技术主路径的发展成熟度,确定主路径的发展程度,识别并描述出领域现存的潜在技术机会,有助于自动揭示出具有重要技术价值和技术发展潜力的技术机会,且通过多步骤多模式对数据集进行层层筛选,更适合基于大量级的领域数据集来揭示相对宏观的技术机会,提升了对领域技术机会识别的有效性和准确性。
在一种可选的实施方式中,对初始文献数据集进行预处理,得到预分析数据集,包括:
对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合;
将技术实体集合划分为若干时间窗,对各时间窗的技术实体进行实体语义关联计算和聚类,得到预分析数据集。
在该方式中,通过对文献数据集进行技术实体及实体关联抽取,划分时间窗,进行实体语义关联计算及聚类分析,实现了对文献数据集的进一步筛选与过滤,确保预分析数据集涵盖的技术实体内容相对准确完整。
在一种可选的实施方式中,对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合,包括:
基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,得到初始文献数据集对应的主谓宾结构;
利用通用信息抽取框架,结合知识增强语义表示模型,抽取得到待分析技术领域对应的不同类型的技术实体集合及实体关联。
在该方式中,通过基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,利用通用信息抽取框架结合知识增强语义表示模型,实现实体及实体关联抽取,具备良好的迁移和泛化能力,一定程度上实现了领域实体及实体关联的自动化。
在一种可选的实施方式中,对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,包括:
基于预分析数据集中相邻时间窗的实体类的主谓宾结构,计算预分析数据集中相邻时间窗的实体类之间的互信息量,筛选得到相邻时间窗的实体类之间的互信息量大于互信息量阈值的实体类作为核心技术主题;
基于核心技术主题,构建核心技术主题对应的时序关联网络;
基于时序关联网络,识别待分析技术领域对应的技术主路径。
在该方式中,通过构建时序关联网络,利用时序关联网络识别技术实体的演化主路径,便于找到技术价值高、且有发展前景的技术路径。
在一种可选的实施方式中,基于时序关联网络,识别待分析技术领域对应的技术主路径,包括:
基于共有主谓宾结构,遍历计算得到时序关联网络中所有路径的技术权重;
筛选得到技术权重不小于预设技术权重阈值且路径终点在当前时间点的路径作为待分析技术领域对应的技术主路径。
在该方式中,由于主题关联网络包含关联信息较强的演化路径,因而主路径的选择可以在主题关联网络的基础上进行,便于进一步筛选具有发展空间的技术主路径。
在一种可选的实施方式中,基于确定出的发展阶段,确定待分析技术领域的潜在技术机会,包括:
基于确定出的发展阶段,对技术主路径进行发展阶段筛选,得到第一主路径集合;
对第一主路径集合进行排序,得到第二主路径集合,利用第二主路径集合中的实体主题类构建实体类关联矩阵;
基于主谓宾结构,筛选得到备选技术机会集合;
计算备选技术机会集合中各实体的技术机会值,确定待分析技术领域的潜在技术机会。
在该方式中,针对当前筛选出的具有发展潜力的各类型技术主路径,进而得到覆盖各类型技术实体的主路径的多个重要技术实体聚类集合,并基于此构建有限数量的实体类关联矩阵,通过实体语义关联计算挖掘具有潜在关联的实体类对,进而识别并描述出该领域现存的潜在技术机会。
在一种可选的实施方式中,基于主谓宾结构,筛选得到备选技术机会集合,包括:
基于主谓宾结构,计算得到实体类关联矩阵中实体类之间的关联强度;
将实体类之间的关联强度低于关联矩阵值阈值的实体类对纳入备选技术机会集合。
在该方式中,通过依据实体类关联强度识别出技术未实现或较少实现的功能或应用领域,从关联矩阵中获取备选技术机会集合,进而完成技术领域内的技术机会的自动识别。
第二方面,本发明提供了一种技术机会识别装置,装置包括:
数据采集模块,用于根据待分析技术领域,采集待分析技术领域对应的初始文献数据集;
数据预处理模块,用于对初始文献数据集进行预处理,得到预分析数据集;
技术路径确定模块,用于对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,其中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程;
发展阶段确定模块,用于计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;
技术机会确定模块,用于基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。
第三方面,本发明提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的技术机会识别方法。
第四方面,本发明提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的技术机会识别方法。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的技术机会识别方法的流程示意图。
图2是根据本发明实施例的“包膜缓控释肥”领域专题信息的示意图。
图3是根据本发明实施例的基于统计的专题专利记录筛选过滤的示意图。
图4是根据本发明实施例的“包膜缓控释肥”领域材料实体聚类结果(2001-2020年)。
图5是根据本发明实施例的“包膜缓控释肥”领域基于实体类的专利记录过滤筛选的示意图。
图6是根据本发明实施例的“包膜缓控释肥”领域基于实体关联的专利记录过滤筛选的示意图。
图7是根据本发明实施例的技术要素关联度计算的示意图。
图8是根据本发明实施例的“包膜缓控释肥”领域材料实体类时序关联网络系统截图示例的示意图。
图9是根据本发明实施例的包膜缓控释肥领域材料实体类时序关联网络中“麸皮(bran)”与“结合剂(binding agent)” 实体类间关联强度系统截图示例的示意图。
图10是根据本发明实施例的包膜缓控释肥专题领域材料主题关联时序网络中的路径信息的示意图。
图11是根据本发明实施例的“包膜缓控释肥”专题领域材料主题关联时序网络的聚类信息示例的示意图。
图12是根据本发明实施例的“包膜缓控释肥”专题领域材料主题关联时序网络中聚类节点专利列表信息示例的示意图。
图13是根据本发明实施例的“包膜缓控释肥”专题领域材料主题演化主路径的示意图。
图14是根据本发明实施例的“包膜缓控释肥”材料主题演化主路径成熟度的示意图。
图15是根据本发明实施例的“包膜缓控释肥”专题领域材料主题演化主路径的详细信息入口的示意图。
图16是根据本发明实施例的“包膜缓控释肥”领域材料-功能应用领域矩阵图。
图17是根据本发明实施例的“包膜缓控释肥”领域“材料-功能”和“材料-应用领域”技术机会雷达图。
图18是根据本发明实施例的另一技术机会识别方法的流程示意图。
图19是根据本发明实施例的技术机会识别装置的结构框图。
图20是本发明实施例的计算机设备的硬件结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
相关技术中,现有的技术机会识别方法大多依赖专家进行人工识别,宏观技术领域适用性差且运算效率低下,很难适用于现今宏观技术领域、面向大数据的使用场景,难以满足大数据环境的信息量对技术机会识别的需求。
为解决上述问题,本发明实施例中提供一种技术机会识别方法,用于计算机设备中,需要说明的是,其执行主体可以是技术机会识别装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是终端或客户端或服务器,服务器可以是一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑等其他智能硬件设备。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。
本实施例中的计算机设备,适用于面向大数据、宏观领域,对技术领域进行技术机会识别的使用场景。通过本发明提供技术机会识别方法,通过采集技术领域内的文献数据集,预处理并筛选得到技术领域对应的技术主题的演进发展历程对应的技术主路径,计算技术主路径的发展成熟度,确定主路径的发展程度,识别并描述出领域现存的潜在技术机会,有助于自动揭示出具有重要技术价值和技术发展潜力的技术机会,且通过多步骤多模式对数据集进行层层筛选,更适合基于大量级的领域数据集来揭示相对宏观的技术机会,提升了对领域技术机会识别的有效性和准确性。
根据本发明实施例,提供了一种技术机会识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在本实施例中提供了一种技术机会识别方法,可用于上述的计算机设备,图1是根据本发明实施例的技术机会识别方法的流程图,如图1所示,该流程包括如下步骤:
步骤S101,根据待分析技术领域,采集待分析技术领域对应的初始文献数据集。
在一示例中,以专利文献为例,用户按照既定的分析需求确定分析涵盖的技术领域内容,在系统中创建技术领域的专题题录信息,借助权威专利数据库构造领域专利检索式,初步生成专利数据集,并将其导入创建的系统专题中,初步形成自己的预分析专题数据集。随后,用户可借助系统对预分析专题数据集进行两个层级的专利数据记录筛选过滤预处理操作,具体可以包括:统计层面的专利记录筛选过滤和技术实体层面的专利内容抽取及记录筛选过滤。
步骤S102,对初始文献数据集进行预处理,得到预分析数据集。
在一示例中,用户针对导入系统的预分析专题专利数据集的主题结构及元数据信息,借助系统对数据集进行内容的分面浏览,进而对专利数据集记录进行反复筛选,删除过滤噪音记录,确保数据集涵盖的专利内容相对准确完整。实现技术实体层面的专利内容抽取及记录筛选过滤,需要完成专利数据集的技术实体及实体关联抽取、实体语义关联计算与聚类分析和技术实体层面的专利记录筛选过滤3个步骤。
步骤S103,对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径。
在本发明实施例中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程。
在一示例中,假设链路上的共有信息量越大,且共有信息的技术性越强,说明其更具有参考价值,主路径识别的目的就是为找到技术价值高、且有发展前景的技术路径,通过使用共有信息来源专利的价值,衡量共有信息的技术性。
步骤S104,计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段。
在本发明实施例中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段。
在一示例中,每条技术主路径都是相关的技术主题发展演化而成的,依据技术成熟度的相关理论,显然每条技术主路径(包含多个主题)通常都会经历发展的萌芽期、膨胀期、转折期、稳步上升期和成熟期这样一个技术成熟周期。因此发展阶段可以包括:萌芽期、膨胀期、转折期、稳步上升期和成熟期。通过计算各技术主路径的专利价值度、发明人数量、专利被引次数、专利交易次数、同族专利数量、权利要求数量指标值,依据各指标权重计算得出各技术主路径的成熟度值,并将其划分到技术生命周期中,根据技术生命周期性发展特征可知,并非处于各周期中的技术主题都有很大发展潜力,只有部分技术主题是发展的重点,在本发明中,将处于萌芽期和稳步上升期两个周期的技术主路径确定为具有较大发展潜力的技术主题。
步骤S105,基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。
在一示例中,依据实体类关联强度识别出技术未实现或较少实现的功能或应用领域,从实体关联矩阵中获取备选技术机会集合,以完成潜在的技术机会识别。
在一实施场景中,以“包膜缓控释肥”专题领域为例,图2是根据本发明实施例的“包膜缓控释肥”领域专题信息的示意图,如图2所示,首先,用户根据专题内容,在系统现有“纳米技术在农业领域的应用”(一级分类)——“农业环境领域”(二级分类)下,自主创建“包膜缓控释肥”领域专题信息。图3是根据本发明实施例的基于统计的专题专利记录筛选过滤的示意图,如图3所示,构建该专题专利数据集共计1301条,当前页面所呈现的CN110540470A专利的摘要新颖性内容为“缓释肥料包括30-45分。尿素重量,10-12分。氯化铵,12-15分。硫酸钾,4-8分。植物灰重量,25-30分。重量有机堆肥,4-9分。重量贝壳粉,2-7分。重量硅藻土,3-7分。重量腐殖酸,1-3分。重量硅酸钙矿石,5-10分。重量改性木质素,0.01-0.02磅重量苯甲酸钠,2-7磅。硅胶乳液,5-6分。棕榈叶重量,0.1-0.2磅过磷酸钙重量,1-3磅。竹根重量,3-5分。铝土矿和0.005-0.01磅重量的稀土”,摘要优势内容为“缓释肥料营养成分释放缓慢,长期保持营养土的活性和营养土的营养循环,克服了植物生长初期营养物质浪费过多、后期供给不足的缺陷,提高了利用率,降低了用量”。系统后台数据库会存储相应的专题信息和专题专利数据集。
S2、用户可通过系统提供的基于专利记录字段的统计计量信息过滤筛选功能,根据分析需要对专题专利数据集进行过滤和筛选,从专利字段内容层面明确所需专利记录集。
S3、用户导入专利数据后,会自动触发系统采用专利实体及实体关联抽取方法,基于领域训练集对该专题专利数据进行实体及实体关联抽取,获取的实体及实体关联抽取结果均存储于数据库中,表2是“包膜缓控释肥”领域实体及实体关联数据存储结果示例,其中,S、A和O(Subject- Action-Object)为主谓宾,包膜缓控释肥领域实体及实体关联数据存储结果如表1所示,
表1
<b>SAO</b><b>结构编号</b> <b>S</b><b>实体</b> <b>O</b><b>实体</b> <b>句子编号</b> <b>所属专利</b><b>公开号</b> <b>S</b><b>实体</b><b>类型</b> <b>S</b><b>实体起始位置</b> <b>S</b><b>实体结束位置</b> <b>O</b><b>实体类型</b> <b>O</b><b>实体起始位置</b> <b>O</b><b>实体结束位置</b>
925325 氯化铵 苯甲酸钠 1 CN110540470A 材料 71 87 材料 340 354
925336 有机硅乳液 过磷酸钙 1 CN110540470A 材料 371 387 材料 270 291
925522 缓释肥料 利用率 2 CN110540470A 产品 5 27 功能 312 327
S4、在实体抽取结果的基础上,系统采用基于无监督学习中最小熵原理的多级网络聚类模型对各时间窗的实体进行聚类,关联计算结果和实体聚类结果存储如表2及图4所示,表2是“包膜缓控释肥”领域实体关联计算结果(实体关联矩阵)数据示例,图4是根据本发明实施例的“包膜缓控释肥”领域材料实体聚类结果(2001-2020年),图中呈现的是“包膜缓控释肥”领域材料实体聚类得到的实体类名称,其中TOP20实体类名称分别为 “氯化钾、锌、生物可降解剂、肥料芯、涂层、氮营养素、粘合剂、磷肥、固化剂、硫、复合肥料、壳聚糖、硬脂酸、丙烯酸、枯草芽孢杆菌、肥料颗粒、肥料颗粒、粒状尿素、内层、氧化镁”。
表2
<b>实体</b><b>A</b><b>名称</b> <b>实体</b><b>B</b><b>名称</b> <b>实体共结构频次</b> <b>实体共句频次</b> <b>实体共篇频次</b> <b>实体关联度</b> <b>起始时间</b> <b>结束时间</b>
缓释肥料 缓释肥料 296 591 3769 4094.10 2001 2001
缓释肥料 控释肥料 4 4 4 6.40 2001 2001
缓释肥料 新型颗粒包衣缓释肥料 1 0 0 0.10 2001 2001
控释肥料 缓释肥料 4 4 4 6.40 2001 2001
控释肥料 控释肥料 156 337 1435 1619.10 2001 2001
新型颗粒包衣缓释肥料 缓释肥料 1 0 0 0.10 2001 2001
新型颗粒包衣缓释肥料 新型颗粒包衣缓释肥料 1 1 2 2.60 2001 2001
质量 质量 152 152 158 249.20 2001 2001
质量 环境友好型 32 32 0 19.20 2001 2001
质量 吸附性能 10 10 0 6.00 2001 2001
质量 保水性 3 3 0 1.80 2001 2001
环境友好型 质量 32 32 0 19.20 2001 2001
环境友好型 环境友好型 281 281 313 481.60 2001 2001
环境友好型 吸附性能 15 15 0 9.00 2001 2001
缓释肥料 缓释肥料 296 591 3769 4094.10 2001 2001
S5、系统完成实体及实体关联抽取和实体聚类后,用户可通过系统提供的实体类筛选和实体关联筛选功能,筛选过滤所需的各类型实体,或者指定实体关联度阈值,对专题专利记录进行进一步筛选过滤,图5是根据本发明实施例的“包膜缓控释肥”领域基于实体类的专利记录过滤筛选的示意图。图6是根据本发明实施例的“包膜缓控释肥”领域基于实体关联的专利记录过滤筛选的示意图,具体筛选页面如图5及图6所示,其中,图5呈现的是该领域可供筛选的TOP15实体关联,实体A的产品与实体B的材料之间的关联对及实体AB关联度,具体地,实体A的产品与实体B的材料之间的关联对包括:“产品:尿素基缓释肥料—材料:碱性油组分;产品:复合硫包膜缓释肥料—材料:肥料芯;产品:复合硫包膜缓释肥料—材料:包络层;产品:环保型包衣剂可降解缓释肥料—材料:甲基丙烯酸甲酯;产品:环保型包衣剂可降解缓释肥料—材料:聚乙烯醇;产品:环保型包衣剂可降解缓释肥料—材料:十二烷基醇酯;产品:环保型包衣剂可降解缓释肥料—材料:水稀释树脂;产品:环保型包衣剂可降解缓释肥料—材料:脂肪醇;产品:环保型包衣剂可降解缓释肥料—材料:抹灰剂;产品:环保型包衣剂可降解缓释肥料—功能:使用率;产品:环保型包衣剂可降解缓释肥料—功能:环境友好型;产品:生物降解自控缓释肥料—材料:纤维素;产品:生物降解自控缓释肥料—材料:氧化淀粉;产品:生物降解自控缓释肥料—材料:聚乙烯醇;产品:生物降解自控缓释肥料—材料:聚氨酯预聚物”,图6中实体类筛选窗口呈现的是该领域可供筛选的TOP10产品实体类“控释肥料、包衣颗粒缓释肥料、有机-无机缓释肥料、速效缓释复合肥、特殊控释肥料、缓释有机肥料、缓释肥料、缓释复合肥料、包膜控释肥料、包膜缓释肥料”。
S6、在实体聚类的基础上,系统会自动对各类型实体相邻时间片中实体类间的关联度进行计算。图7是根据本发明实施例的技术要素关联度计算的示意图,计算示例如图7所示,2001-2005和2006-2010两个相邻时间片之间,2001-2005时间片中cluster1(硫化膜、中间层、内层、聚合物薄膜)和2006-2010时间片中cluster1(硫化膜、中间层、涂层)的共现强度为0.283224+0.0244009。2001-2005时间片中的cluster2(涂层、池塘污泥、氮肥)和2006-2010时间片中的cluster1(硫化膜、中间层、涂层)的共现强度等于0.0352941。
S7、系统会自动按照当前专题中各类型实体类间互信息量(关联度)的大小,对实体类进行筛选,该步骤在技术实体时序关联网络构建(S8)过程中进行。系统使用技术实体时序关联网络构建方法构建各类实体时序关联网络,去除关联网络中实体类间关联度等于0的无效路径,得到构建主题关联网络的基础数据集,完成核心实体类筛选,表3示出了材料实体类筛选前部分数据集(包括筛选前路径上的所有实体类),表 4示出了实体类筛选后的部分数据集(包括路径上的所有筛选后的实体类),其中,flowWeight即为实体类间的关联度值。
表3
<b>路径唯一标识号</b> <b>父节点</b><b>ID</b> <b>起始时间</b> <b>结束时间</b> <b>聚类唯一标识号</b> <b>实体类间关联度</b>
2249 2005 2005 5 0.000
2249 7781 2006 2006 16 0.041
2250 2007 2007 30 0.000
2250 7783 2008 2008 32 0.003
2251 2008 2008 41 0.000
2251 7785 2009 2009 8 0.013
2252 2011 2011 23 0.000
2252 7787 2012 2012 21 0.009
2253 2012 2012 10 0.000
2253 7789 2013 2013 34 0.005
2254 2010 2010 28 0.000
2254 7791 2011 2011 38 0.008
2255 2013 2013 29 0.000
2255 7793 2014 2014 33 0.003
2256 2018 2018 36 0.000
2256 7795 2019 2019 35 0.002
2257 2011 2011 24 0.000
2257 7797 2012 2012 14 0.010
2258 2005 2005 3 0.000
2258 7799 2006 2006 6 0.130
2259 2008 2008 15 0.000
2259 7801 2009 2009 15 0.031
2260 2007 2007 28 0.000
2260 7803 2008 2008 34 0.007
2261 2018 2018 29 0.000
2261 7805 2019 2019 35 0.002
2262 2011 2011 42 0.000
2262 7807 2012 2012 43 0.008
2263 2011 2011 21 0.000
2263 7809 2012 2012 55 0.005
2264 2006 2006 3 0.000
2264 7811 2007 2007 2 0.064
2265 2007 2007 25 0.000
2265 7813 2008 2008 39 0.006
2266 2011 2011 2 0.000
2266 7815 2012 2012 39 0.013
2267 2013 2013 51 0.000
2267 7817 2014 2014 33 0.001
2268 2012 2012 56 0.000
2268 7819 2013 2013 32 0.003
2269 2018 2018 26 0.000
2269 7821 2019 2019 31 0.004
2270 2012 2012 40 0.000
2270 7823 2013 2013 47 0.003
2271 2016 2016 21 0.000
2271 7825 2017 2017 36 0.002
2272 2005 2005 1 0.000
2272 7827 2006 2006 4 0.050
2273 2006 2006 15 0.000
2273 7829 2007 2007 43 0.007
2253 2018 2018 11 0.000
2253 7831 2019 2019 15 0.006
2274 2011 2011 44 0.000
2274 7833 2012 2012 66 0.001
2259 2011 2011 19 0.000
2259 7835 2012 2012 20 0.019
2275 2007 2007 15 0.000
2275 7837 2008 2008 33 0.008
2276 2008 2008 10 0.000
2276 7839 2009 2009 2 0.060
2277 2007 2008 61 0.000
2277 7841 2009 2010 25 0.007
2278 2005 2006 21 0.000
2278 7843 2007 2008 65 0.004
2279 2001 2002 2 0.000
2279 7845 2003 2004 8 0.069
2280 2017 2018 25 0.000
2280 7847 2019 2020 49 0.001
2281 2011 2012 35 0.000
表4
<b>路径唯一标识号</b> <b>父节点</b><b>ID</b> <b>起始时间</b> <b>结束时间</b> <b>聚类唯一标识号</b> <b>实体类间关联度</b>
2249 7781 2006 2006 16 0.041
2250 7783 2008 2008 32 0.003
2251 7785 2009 2009 8 0.013
2252 7787 2012 2012 21 0.009
2253 7789 2013 2013 34 0.005
2254 7791 2011 2011 38 0.008
2255 7793 2014 2014 33 0.003
2256 7795 2019 2019 35 0.002
2257 7797 2012 2012 14 0.010
2258 7799 2006 2006 6 0.130
2259 7801 2009 2009 15 0.031
2260 7803 2008 2008 34 0.007
2261 7805 2019 2019 35 0.002
2262 7807 2012 2012 43 0.008
2263 7809 2012 2012 55 0.005
2264 7811 2007 2007 2 0.064
2265 7813 2008 2008 39 0.006
2266 7815 2012 2012 39 0.013
2267 7817 2014 2014 33 0.001
2268 7819 2013 2013 32 0.003
2269 7821 2019 2019 31 0.004
2270 7823 2013 2013 47 0.003
2271 7825 2017 2017 36 0.002
2272 7827 2006 2006 4 0.050
2273 7829 2007 2007 43 0.007
2253 7831 2019 2019 15 0.006
2274 7833 2012 2012 66 0.001
2259 7835 2012 2012 20 0.019
2275 7837 2008 2008 33 0.008
2276 7839 2009 2009 2 0.060
2277 7841 2009 2010 25 0.007
2278 7843 2007 2008 65 0.004
2279 7845 2003 2004 8 0.069
2280 7847 2019 2020 49 0.001
S8、系统使用深度优先搜索算法构建实体主题时序关联网络。图8是根据本发明实施例的“包膜缓控释肥”领域材料实体类时序关联网络系统截图示例的示意图,如图8所示,“包膜缓控释肥”专题领域材料实体主题关联网络中的每一个方块表示该专题的一个材料主题类,主题类由聚类分析得到,展示了该专题领域各材料随时间的演变发展过程。其中,方块间的连线表示材料主题的流向,同一材料主题路径上的主题类间连线的宽度代表主题类关联度,连线越宽代表主题类之间的关联程度越高,通过主题时序关联网络有利于进一步揭示方法的核心发展主路径,以及材料的最新发展趋势。图8中,2001-2005和2006-2010连续两个时间片的材料演化路径包括:“正离子吸附剂-聚合物、麸皮-结合剂、壳聚糖-有机涂层材料-尿素颗粒、牡蛎粉-环氧树脂、磷矿粉-甲基丙烯酸甲酯、氮磷钾肥-正离子吸附剂、控释层-正离子吸附剂、涂膜-聚合物、牡蛎粉-抗生素的作用、桐油-聚合物、蜡-正离子吸附剂、结合剂-正离子吸附剂”,2006-2010和2011-2015连续两个时间片的材料演化路径包括:“缓释控制腐殖酸-颗粒填料、粉末状尼姆籽饼-环氧树脂、壳聚糖-胶片、脲酶抑制剂-甲基丙烯酸甲酯、牡蛎粉-粉末状尼姆籽饼、麸皮-胶片、粉末状尼姆籽饼-负离子吸附剂、颗粒填料-填料”,2011-2015和2016-2020连续两个时间片的材料演化路径包括:“分层尿素-颗粒填料、聚合物-壳聚糖、保护膜层-氮气、分层尿素-壳聚糖、混合物-壳聚糖、负离子吸附剂-壳聚糖、热塑性树脂-聚合物”。图9是根据本发明实施例的包膜缓控释肥领域材料实体类时序关联网络中“麸皮(bran)”与“结合剂(binding agent)” 实体类间关联强度系统截图示例的示意图,如图9所示,用户通过点击主题类间的连线(路径)可以显示相邻时间窗两个材料主题类之间的关联度数值,了解各材料主题之间的关联强弱。图9中展示的正是突出显示的2001-2005和2006-2010连续两个时间片的“麸皮-结合剂”一条材料演化路径。图10是根据本发明实施例的包膜缓控释肥专题领域材料主题关联时序网络中的路径信息的示意图,图中展示的正是图9中可视化演化路径的基础数据内容。图11是根据本发明实施例的“包膜缓控释肥”专题领域材料主题关联时序网络的聚类信息示例的示意图,如图10及图11所示,用户点击查看详细信息可以看到路径信息和组成该路径的聚类节点信息。图12是根据本发明实施例的“包膜缓控释肥”专题领域材料主题关联时序网络中聚类节点专利列表信息示例的示意图,如图12所示,每一个主题类由若干个SAO(Subject- Action-Object主谓宾)结构组成,而SAO结构来源于该专题的专利数据,用户通过点击“查看详情”还可以进一步查看每一个主题的相关专利详细信息。
S9、依据技术主路径识别方法识别出各类技术实体的主题演化主路径,包括:方法主题演化主路径、材料主题演化主路径、产品主题演化主路径,并以可视的方式展示路径流信息,用户可以与系统界面进行交互,查看实体类主题详细信息。表 5展示了“包膜缓控释肥”专题领域材料主题关联网络中路径的技术权重示例信息。系统自动设定技术权重阈值,筛选出大于等于技术权重阈值的路径,并根据用户预分析的技术发展时间段设定路径终端所在的时间点。图13是根据本发明实施例的“包膜缓控释肥”专题领域材料主题演化主路径的示意图,如图13所示,设定技术阈值为100,且路径终端设为当前时间点,得到的“包膜缓控释肥”专题领域材料主题演化主路径包括:2001-2005和2006-2010连续两个时间片的“结合剂-正离子吸附剂”、2006-2010和2011-2015连续两个时间片的“壳聚糖-胶片”、2011-2015和2016-2020连续两个时间片的“聚合物-壳聚糖、保护膜层-氮气、分层尿素-壳聚糖、混合物-壳聚糖、负离子吸附剂-壳聚糖”。
表5
<b>路径唯一标识号</b> <b>父节点</b><b>ID</b> <b>起始时间</b> <b>结束时间</b> <b>聚类唯一标识号</b> <b>路径技术权重</b>
2249 2005 2005 5 0
2249 7781 2006 2006 16 8
2250 2007 2007 30 0
2250 7783 2008 2008 32 0
2251 2008 2008 41 0
2251 7785 2009 2009 8 71
2252 2011 2011 23 0
2252 7787 2012 2012 21 2
2253 2012 2012 10 0
2253 7789 2013 2013 34 41
2254 2010 2010 28 0
2254 7791 2011 2011 38 102
2255 2013 2013 29 0
2255 7793 2014 2014 33 10
2256 2018 2018 36 0
2256 7795 2019 2019 35 4
2257 2011 2011 24 0
2257 7797 2012 2012 14 11
2258 2005 2005 3 0
2258 7799 2006 2006 6 68
2259 2008 2008 15 0
2259 7801 2009 2009 15 0
2260 2007 2007 28 0
2260 7803 2008 2008 34 0
2261 2018 2018 29 0
2261 7805 2019 2019 35 0
2262 2011 2011 42 0
2262 7807 2012 2012 43 0
2263 2011 2011 21 0
2263 7809 2012 2012 55 140
2264 2006 2006 3 0
2264 7811 2007 2007 2 60
2265 2007 2007 25 0
2265 7813 2008 2008 39 0
2266 2011 2011 2 0
2266 7815 2012 2012 39 28
2267 2013 2013 51 0
2267 7817 2014 2014 33 4
2268 2012 2012 56 0
2268 7819 2013 2013 32 102
2269 2018 2018 26 0
2269 7821 2019 2019 31 30
2270 2012 2012 40 0
2270 7823 2013 2013 47 10
2271 2016 2016 21 0
2271 7825 2017 2017 36 7
2272 2005 2005 1 0
2272 7827 2006 2006 4 55
2273 2006 2006 15 0
2273 7829 2007 2007 43 2
2253 2018 2018 11 0
2253 7831 2019 2019 15 20
2274 2011 2011 44 0
2274 7833 2012 2012 66 1
2259 2011 2011 19 0
2259 7835 2012 2012 20 1
2275 2007 2007 15 0
2275 7837 2008 2008 33 34
S10、系统采用技术主路径成熟度计算方法,计算各类型实体技术主路径的技术成熟度,并以可视形式展示分布在不同发展阶段的技术主路径,直观揭示出具有高发展潜力的技术主路径。图14是本发明实施例的“包膜缓控释肥”材料主题演化主路径成熟度的示意图,图中展示了处于技术发展转折期的“外涂层、无机肥料、瓜尔胶”技术主路径和处理技术发展萌芽期的“氯化钾、改性环氧树脂包覆硫酸钾镁”技术主路径。图15是根据本发明实施例的“包膜缓控释肥”专题领域“氮磷钾肥”材料主题演化主路径的详细信息入口的示意图,如图14及图15所示,“包膜缓控释肥”专题领域材料技术主路径的成熟度区间分布情况,可以看出该领域处于技术发展转折期和稳步上升期的材料技术主路径,这些路径具有较高的发展潜力,路径的详细信息、组成路径的所有聚类详细信息,以及相关专利信息均可通过点击“查看详细信息”了解。
依据产品、材料、方法实体类信息量分别遴选出主路径中TOP10产品、TOP10材料和TOP10方法领域实体类,形成各类型实体关联矩阵的横坐标集合。同理,依据主路径技术权重(techweight)和技术成熟度发展阶段得到功能和应用领域主路径,依据实体类信息量遴选主路径中TOP10功能和TOP10应用领域实体类,形成纵坐标集合,表 6 是“包膜缓控释肥”专题领域产品实体top10聚类集表,表7是“包膜缓控释肥”专题领域方法实体top10聚类集表,表8是“包膜缓控释肥”专题领域材料实体top10聚类集表,表9是“包膜缓控释肥”专题领域功能实体top10聚类集表,表10是“包膜缓控释肥”专题领域应用领域实体top10聚类集表,实体类及实体类名称等详细信息如表6至表10所示。
表6
表7
表8
表9
表10
S12、系统自动查询各类实体矩阵中实体对间的共现专利数量,并将计算结果填充至各类实体关联矩阵中。图16是根据本发明实施例的“包膜缓控释肥”领域材料-功能应用领域矩阵图,如图 16所示,“包膜缓控释肥”领域TOP10材料“肥料颗粒、壳聚糖、肥料芯、涂层、混合物、氯化钾、胶粘剂、磷肥、肥料、氮营养素”和TOP10功能“养分释放、退化特性、产量、养分需求、缓释效应、释放速率、吸附性能、环境友好型、氮营养素、利用率”两类实体的关联度构成的二维矩阵结果。关注存在于密集区域中的少数空白点,这些存在于密集区域中的空白点存在技术瓶颈的可能性较小,更容易发现相关技术机会。
S13、自动计算实体类间关联度,获取各类实体关联矩阵中的备选技术机会。表 11仅展示“包膜缓控释肥”领域材料-功能实体关联矩阵中实体类间的关联度(clusterRelationValue)示例数据,关联度等于0表明实体对间可能存在潜在技术机会,存入备选技术机会集合。
表11
<b>实体类关联ID</b> <b>实体类A唯一标识</b> <b>实体类B唯一标识</b> <b>实体类间关联度</b> <b>实体类间关联机会值</b> <b>实体类A实体类型</b> <b>实体类B实体类型</b> <b>实体类A名称</b> <b>实体类B名称</b>
8888 1 1 8 0 2 6 控释肥料 养分释放
8889 1 2 5 0 2 6 控释肥料 退化特性
8890 1 3 56 0 2 6 控释肥料 产量
8891 1 4 13 0 2 6 控释肥料 养分需求
8892 1 5 4 0 2 6 控释肥料 缓释效应
8893 1 6 13 0 2 6 控释肥料 释放速率
8894 1 7 5 0 2 6 控释肥料 吸附性能
8895 1 8 60 0 2 6 控释肥料 环境友好型
8896 1 9 32 0 2 6 控释肥料 氮营养素
8897 1 10 28 0 2 6 控释肥料 利用率
8898 2 1 0 0.22 2 6 环保型缓释肥料 养分释放
8899 2 2 0 0.23 2 6 环保型缓释肥料 退化特性
8900 2 3 2 0 2 6 环保型缓释肥料 产量
8901 2 4 0 0.23 2 6 环保型缓释肥料 养分需求
8902 2 5 2 0 2 6 环保型缓释肥料 缓释效应
8903 2 6 1 0 2 6 环保型缓释肥料 释放速率
8904 2 7 0 0.23 2 6 环保型缓释肥料 吸附性能
8905 2 8 8 0 2 6 环保型缓释肥料 环境友好型
8906 2 9 0 0.22 2 6 环保型缓释肥料 氮营养素
8907 2 10 0 0.23 2 6 环保型缓释肥料 利用率
8908 3 1 1 0 2 6 特种缓释肥料 养分释放
8909 3 2 0 0.28 2 6 特种缓释肥料 退化特性
8910 3 3 10 0 2 6 特种缓释肥料 产量
8911 3 4 0 0.28 2 6 特种缓释肥料 养分需求
8912 3 5 0 0.28 2 6 特种缓释肥料 缓释效应
8913 3 6 2 0 2 6 特种缓释肥料 释放速率
8914 3 7 0 0.28 2 6 特种缓释肥料 吸附性能
8915 3 8 7 0 2 6 特种缓释肥料 环境友好型
8916 3 9 1 0 2 6 特种缓释肥料 氮营养素
8917 3 10 3 0 2 6 特种缓释肥料 利用率
8918 4 1 5 0 2 6 特殊控释肥料 养分释放
8919 4 2 0 0.26 2 6 特殊控释肥料 退化特性
8920 4 3 10 0 2 6 特殊控释肥料 产量
8921 4 4 2 0 2 6 特殊控释肥料 养分需求
8922 4 5 0 0.26 2 6 特殊控释肥料 缓释效应
8923 4 6 0 0.27 2 6 特殊控释肥料 释放速率
S14、系统计算各备选技术机会中实体对间的技术机会值,通过技术机会雷达图可视揭示可能的技术机会。表 11仅展示“包膜缓控释肥”领域材料-功能实体关联矩阵中实体类间的技术机会值(clusterOppValue)示例数据,技术机会值越大,实体对间可能的技术机会越大。图17是根据本发明实施例的“包膜缓控释肥”领域“材料-功能”和“材料-应用领域”技术机会雷达图,如图17所示,“包膜缓控释肥”领域“材料-功能”和“材料-应用领域”技术机会雷达图,图中,多条极轴代表不同的材料,技术机会值的大小用功能或应用领域所在坐标点到中心点的距离表示, 技术机会值越小,功能或应用领域坐标点越靠近中心。将各材料实体的功能和应用领域分别进行连线,空间较大说明该材料具有较大的技术发展空间,反之则具有较小的技术发展空间,图17中体现了该专题领域TOP10材料“肥料颗粒、壳聚糖、肥料芯、涂层、混合物、氯化钾、胶粘剂、磷肥、肥料、氮营养素”在功能和应用领域两方面存在的技术发展空间。
本实施例提供的技术机会识别方法,通过采集技术领域内的文献数据集,预处理并筛选得到技术领域对应的技术主题的演进发展历程对应的技术主路径,计算技术主路径的发展成熟度,确定主路径的发展程度,识别并描述出领域现存的潜在技术机会,有助于自动揭示出具有重要技术价值和技术发展潜力的技术机会,且通过多步骤多模式对数据集进行层层筛选,更适合基于大量级的领域数据集来揭示相对宏观的技术机会,提升了对领域技术机会识别的有效性和准确性。
在本实施例中提供了一种技术机会识别方法,可用于上述的计算机设备,图18是根据本发明实施例的另一技术机会识别方法的流程图,如图18所示,该流程包括如下步骤:
步骤S1801,根据待分析技术领域,采集待分析技术领域对应的初始文献数据集。详细请参见图1所示实施例的步骤S101,在此不再赘述。
步骤S1802,对初始文献数据集进行预处理,得到预分析数据集。
具体地,上述步骤S1802包括:
步骤S18021,对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合。
在一些可选的实施方式中,上述步骤S18021包括:
步骤a1,基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,得到初始文献数据集对应的主谓宾结构。
步骤a2,利用通用信息抽取框架,结合知识增强语义表示模型,抽取得到待分析技术领域对应的不同类型的技术实体集合及实体关联。
步骤S18022,将技术实体集合划分为若干时间窗,对各时间窗的技术实体进行实体语义关联计算和聚类,得到预分析数据集。
在一示例中,以专利文献为例,预分析数据集构建的过程可以包括:
S1、预分析专题数据集初步构建:根据既定的分析需求确定分析涵盖的主题内容,在系统中创建专题题录信息,借助系统外权威专利数据库构造领域专利检索式,初步生成专利数据集,并将其导入创建的系统专题中,初步形成预分析专题数据集。随后,对预分析专题数据集进行两个层级的专利数据记录筛选过滤预处理操作,具体包括:统计层面的专利记录筛选过滤和技术实体层面的专利内容抽取及记录筛选过滤。
S2、统计层面的专利记录筛选过滤:针对导入系统的预分析专题数据集的主题结构及元数据信息,对预分析专题数据集进行内容的分面浏览,进而对专利数据集记录进行反复筛选,删除过滤噪音记录,确保预分析专题数据集涵盖的专利内容相对准确完整。
实现技术实体层面的专利内容抽取及记录筛选过滤,需要完成预分析专题数据集的技术实体及实体关联抽取(S3)、实体语义关联计算与聚类分析(S4)和技术实体层面的专利记录筛选过滤(S5)3个步骤。
S3、预分析专题数据集技术实体及实体关联抽取:首先,对预分析专题数据集进行技术实体及实体关联抽取,形成该专题的专利关联实体库。技术实体是指构成技术系统的基本单元,在本发明中,技术实体具体是指利用自然语言处理技术,通过特征识别从专利技术方案文本中获取的技术实体信息。依据发明问题解决理论(Theory of InventiveProblem Solving,TRIZ)在宏观和微观层面对技术分析维度进行定义,通常涉及多种技术实体。在本发明中,通过典型专利剖析,确定以材料、产品、方法、功效、应用领域5类技术领域进行通用实体以及两类实体关联,提出了包括文本预处理、数据标注和模型训练三个步骤的多类型实体及实体关联抽取方法,具体包括如下内容:
多类型实体及实体关联抽取过程中,首先针对预分析专题数据集的摘要(权利要求字段)文本进行分词、降噪、词形还原及归并等文本“规范化”处理;其次,基于预先定义的材料、产品、方法、功效、应用领域5类技术领域进行实体及两类实体关联,采用基于子句的开放信息抽取方法(Clause-based open information extraction,ClauseIE)对“规范化”文本进行S、A和O(Subject- Action-Object主谓宾)的抽取,并在此基础上,对部分清洗后的SAO进行实体及实体关联类型标注,生成训练集;最后,采用通用信息抽取框架(Universal Information Extraction,UIE),并结合知识增强语义表示模型(EnhancedRepresentation through Knowledge Integration3.0,ERNIE3.0),实现实体及实体关联抽取。该方法在不同任务间具备良好的迁移和泛化能力,一定程度上实现了领域实体及实体关联的自动化。
多类型技术实体及实体关联抽取完成后,需要将各类型技术实体集合按照来源专利的申请年划分为多个时间窗,划分的时间窗应符合等长的连续不相交或连续相交时间窗条件。例如:预分析专题数据集申请时间跨度为2001-2020年,定义时间片长度为5年,那么对2001-2020年间专利数据进行实体抽取后,可按实体的来源专利申请年将时间窗划分成2001-2005年,2006-2010年,2011-2015年,2016-2020年4个时间窗,即等长不相交时间窗,也可以划分成2001-2005年,2004-2009年,2008-2013年,2012-2017年,2016-2020年5个时间窗,即等长相交时间窗。
S4、实体语义关联计算与聚类分析:依次对全时间窗以及划分好的各时间窗下的各类型实体进行实体语义关联计算和聚类操作。
实体语义关联计算算法包括:从实体语义关联上看,SAO结构内部实体共现所体现的关联最强,语句内其次,篇章内则最弱。单纯选择采用篇章内共现,有可能会导致大量共现关系出现,致使网络中产出大量的边,而选择SAO结构内共现时,会使得共现关系对极为稀少,导致网络中大量无关联节点产生。为了保障实体网络中节点关联信息的完整性,将多类型共现关系引入实体关联计算中,且对不同的共现关系赋予了不同的权重,任意两个实体间的关联即为上述3种共现强度累加之和。权重设置具体为:篇章内为0.1,句子内为0.5,SAO结构内为1,实体类之间的关联强度由共现频次与权重系数的乘积和来确定。
完成同类实体(如:产品、材料等)间的关联计算,并对同类实体进行聚类,形成了全时间窗的实体类集合以及分布在多个时间窗内的实体类集合。在本发明中,利用基于映射方程的多级网络聚类模型(InfoMap(Map Equation)),依据无监督学习中最小熵原理,通过最大限度压缩网络上信息流,将网络分解为模块,能够简化并突出显示聚类图中的结构规律及节点关系。
S5、技术实体层面的专利记录筛选与过滤:可通过浏览全时间窗的各类型实体类集合,筛选过滤实体名称,实现专利记录集合的进一步筛选与过滤,得到预分析数据集,完成预分析数据集的构建。
步骤S1803,对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径。
具体地,上述步骤S1803包括:
步骤S18031,基于预分析数据集中相邻时间窗的实体类的主谓宾结构,计算预分析数据集中相邻时间窗的实体类之间的互信息量,筛选得到相邻时间窗的实体类之间的互信息量大于互信息量阈值的实体类作为核心技术主题。
步骤S18032,基于核心技术主题,构建核心技术主题对应的时序关联网络。
步骤S18033,基于时序关联网络,识别待分析技术领域对应的技术主路径。
在一些可选的实施方式中,上述步骤S18033包括:
步骤b1,基于共有主谓宾结构,遍历计算得到时序关联网络中所有路径的技术权重。
步骤b2,筛选得到技术权重不小于预设技术权重阈值且路径终点在当前时间点的路径作为待分析技术领域对应的技术主路径。
在一示例中,为了进一步筛选预分析数据集中与核心技术发展密切相关的重要技术实体,提出了基于技术主路径的核心技术实体筛选方法,具体包括:
S6、相邻时间窗实体类之间互信息量测度:此步骤是构建时序技术实体关联网络的基础,主要是用于解决相邻时间窗实体类之间的互信息量测度问题。相邻时间窗实体类之间的互信息量可以间接揭示实体的技术流向、流量及发展变化情况。两个实体类之间的互信息量和实体类之间的共有实体数量以及这些实体对各自实体类的贡献度存在正相关关系。任意两个实体类共有的实体词越多,且这些实体词对各自实体类的贡献度越大,则这两个实体类之间的互信息量就越大,实体类之间的互信息量的具体计算方法如下:
首先,计算各实体类内的每个SAO结构与其他SAO结构的语义相似度,将此结果作为每个SAO结构在此实体类中的权重;再使用由类内的所有SAO结构组成的向量来表示实体类的主题,将任意两个实体类间的互信息量转化为共有SAO结构信息的权重平均数。例如:实体类包含m个SAO结构,记作:/>,实体类/>包含n个SAO结构,记作:/>,且m>n。假设/>与/>是完全相同的SAO结构,/>和/>分别为/>与/>在实体类/>和/>中的权重。则实体类和/>的互信息量值可表示为:/>
S7、重要技术主题互信息对筛选:重要技术主题(实体类)互信息对筛选操作可以去除关系较弱的无效路径,保留主题间较强的关联关系,进而可以更清晰地展示技术演化路径和特征。通过设定相邻时间窗实体类间的互信息量阈值α,时间窗T与时间窗T+1间互信息量大于等于α的技术主题(实体类)对将被筛选出来,被筛选出的技术主题即为核心技术主题(实体类)。
S8、技术实体时序关联网络构建:基于筛选后的重要技术主题构建主题关联无向关系图,再使用深度优先搜索算法求取无向关系图中任意两顶点间所有路径,并存储每条路径上的信息量总和。若一条路径经过的实体类节点集合属于其他路径的实体类节点集合,则将此条路径舍去,由此可得到核心技术主题(实体类)的时序关联网络。完成重要技术实体时序关联网络构建后,便可以基于实体类间共有来源专利中的高价值专利数量来识别技术实体演化主路径。
S9、技术演化主路径识别:假设链路上的共有信息量越大,且共有信息的技术性越强,说明技术演化路径更具有参考价值,主路径识别的目的是为了找到技术价值高、且有发展前景的技术路径。通过使用共有信息来源专利的价值来衡量共有信息的技术性。由于主题(实体类)可以由若干个SAO结构组成的向量来表示,将基于共有的SAO结构来判断主题间的共有信息量及信息的技术性强度。现有主题和主题/>和/>分别为它们所包含的SAO结构。假设两技术主题中/>与/>为相同的SAO结构,统计相同SAO结构所有来源专利,并将专利集合中高价值发明专利的数量作为两主题间关联子路径的技术权重(techWeight)。由于主题关联网络包含关联信息较强的演化路径,因而主路径的选择可以在主题关联网络的基础上进行。采用遍历计数和深度优先搜索算法,首先遍历主题关联网络的所有路径来计算每条路径的总技术权重,然后通过设定路径技术权重阈值b,筛选出技术权重大于等于b且路径终端在当前时间点的路径为主路径。
步骤S1804,计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段。详细请参见图1所示实施例的步骤S104,在此不再赘述。
步骤S1805,基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。
具体地,上述步骤S1805包括:
步骤S18051,基于确定出的发展阶段,对技术主路径进行发展阶段筛选,得到第一主路径集合。
步骤S18052,对第一主路径集合进行排序,得到第二主路径集合,利用第二主路径集合中的实体主题类构建实体类关联矩阵。
步骤S18053,基于主谓宾结构,筛选得到备选技术机会集合。
在一些可选的实施方式中,上述步骤S18053包括:
步骤c1,基于主谓宾结构,计算得到实体类关联矩阵中实体类之间的关联强度。
步骤c2,将实体类之间的关联强度低于关联矩阵值阈值的实体类对纳入备选技术机会集合。
步骤S18054,计算备选技术机会集合中各实体的技术机会值,确定待分析技术领域的潜在技术机会。
在一示例中,提出技术主路径成熟度测度方法,用于进一步筛选具有发展空间的技术主路径,进而筛选出这些主路径中的实体聚类集合,具体方法步骤如下:
S10、技术主路径成熟度计算及高发展潜力技术主路径筛选,包括:每条技术主路径都是相关的技术主题发展演化而成的,依据技术成熟度的相关理论,显然每条技术主路径(包含多个主题)通常都会经历发展的萌芽期、膨胀期、转折期、稳步上升期和成熟期的一个技术成熟周期。明确技术主题的技术成熟度有助于技术人员重点关注有潜力的技术主题。通过将成熟度测度算法用于技术主路径的成熟度测度中,计算各技术主路径的专利价值度、发明人数量、专利被引次数、专利交易次数、同族专利数量、权利要求数量指标值,依据各指标权重计算得出各技术主路径的成熟度值,并将其划分到技术生命周期中。根据技术生命周期性发展特征可知,并非处于各周期中的技术主题都有很大发展潜力,只有部分技术主题是发展的重点,因此,将处于萌芽期和稳步上升期两个周期的技术主路径确定为具有较大发展潜力的技术主题。
针对当前筛选出的具有发展潜力的各类型技术主路径,进而得到覆盖各类型技术实体主路径的多个重要技术实体聚类集合,并基于此构建有限数量(阈值)的实体类关联矩阵,通过实体语义关联计算挖掘具有潜在关联的实体对,进而识别并描述出该领域现存的潜在技术机会。具体包括步骤S11-S14。
S11、从具有发展潜力的技术主路径中再次筛选出高技术价值主路径,并将其覆盖的重要实体类填充至实体类关联矩阵中,包括:通过成熟度曲线指示的技术所处的发展阶段(萌芽期、膨胀期、转折期、稳步上升期和成熟期),过滤掉部分无价值或价值较低的主路径,筛选出具有发展潜力的主路径,这些主路径包括产品主路径、方法主路径、材料主路径、功能主路径和应用领域主路径5种类型。
对这些路径总技术权重进行排序,遴选出总技术权重大于所有路径总技术权重平均值的路径,记为具有高技术价值的主路径,依据主路径中各实体主题类涵盖的信息量,即高价值专利数量,计量获取这些路径覆盖的总技术权重最高的TOPN实体主题类,以实体主题类为单元,分别将实体主题类名称填充至各实体类关联矩阵的横轴与纵轴中,完成实体类关联矩阵中实体类集合构建。
S12、计算技术轴(产品、方法、材料)和功效轴(功能、应用领域)各交点共现的专利数量,并填充至实体类关联矩阵,包括:实体类关联矩阵中技术维与功效维的交点数值表示共现的专利数量。依据SAO结构来计算共现关系,因为从实际语义关联度上看,相对于段落和篇章,SAO结构共现所体现的关联性最强。
具体的方法是,如果从专利抽取到的SAO结构同时包含某一技术主题和功效主题,则认为该专利的技术主题具有相应的功效特征。若多个专利中均具有该SAO结构则进行数量累加,最终得到共现专利总数并填入实体类关联矩阵中。
S13、计算实体类关联强度,获取各实体类关联矩阵的备选技术机会集合,包括:此步骤是技术机会识别的核心与关键,主要是依据实体类关联强度识别出技术未实现或较少实现的功能或应用领域,从关联矩阵中获取备选技术机会集合。
在实体类关联矩阵构建完成的基础上,计算矩阵中实体类间的关联强度(relationAB)。关联强度取决于技术类A和功效类B涉及到的专利重叠程度,是通过共现关系得到的。依据语义关系可得SAO结构内的实体共现所体现的关联最强,段落内实体共现关联强度其次,篇章内则最弱,故设置不同的权重来计算关联强度值。
其中,SAO语义关联(coocurrStruFreq)最强赋予权重1,段落语义关联(coocurrSentenceFreq)一般赋予权重0.5,篇章语义关联(coocurrArticleFreq)最差设为0.1,得到每个交点处的关联矩阵值。具体计算公式为:
relationAB=0.1*coocurrArticleFreq+0.5*coocurrSentenceFreq+1*coocurrStruFreq
潜在的技术机会合集是从实体对关联强度为0或者较低的关系对中获取,通过设定关联矩阵值的阈值,将低于阈值的技术功效实体对纳入备选技术机会集合。
S14、计算备选技术机会集合中各技术实体对的技术机会值,完成技术机会的自动识别,包括:依次计算遴选出的备选技术机会的技术机会值,该值越大,说明技术实体对组合的机率越大,技术机会也就越大。
针对矩阵中的每一个备选技术机会,即筛选出的具有潜在技术机会的、且由技术-功效两类实体形成的实体关联对,分别查询对应的SAO结构集合,并从中筛选出对应的技术实体和功效实体,存入不同的实体集合。如:材料功能矩阵中,针对每个材料实体类Mi,需在材料来源专利中找到所有包含材料和功能的SAO结构,将SAO结构中的实体名称按照实体类型分别存入不同的实体类型集合,得到功效集合Fi1、材料集合Mi1。针对每个功效实体类Fj,同样按照上述方式进行操作,最终得到功效集合Fj2、材料集合Mj2。
对以上两个集合相同类型技术实体进行语义相似度计算,再对计算结果进行加权求和得到技术机会值,最终依据技术机会值,得到技术机会较大的实体类关联对,即技术主题关联组合,完成领域技术机会的自动识别。技术机会值计算公式如下:
其中,为材料实体类Mi与功效实体类Fj之间的技术机会值,为材料实体类与功效实体类/>之间的语义相似度,为材料实体类/>与功效实体类/>之间的语义相似度。
本实施例提供的技术机会识别方法,通过对文献数据集进行技术实体及实体关联抽取,划分时间窗,进行实体语义关联计算及聚类分析,实现了对文献数据集的进一步筛选与过滤,确保预分析数据集涵盖的技术实体内容相对准确完整。通过基于材料、产品、方法、功效及应用领域,对初始文献数据集进行主谓宾结构抽取,利用通用信息抽取框架,结合知识增强语义表示模型,实现实体及实体关联抽取,具备良好的迁移和泛化能力,一定程度上实现了领域实体及实体关联的自动化。通过构建时序关联网络,利用时序关联网络识别技术实体的演化的主路径,便于找到技术价值高、且有发展前景的技术路径。由于主题关联网络包含关联信息较强的演化路径,因而主路径的选择可以在主题关联网络的基础上进行,便于进一步筛选具有发展空间的技术主路径。针对当前筛选出的具有发展潜力的各类型技术主路径,进而得到覆盖各类型技术实体的主路径的多个重要技术实体聚类集合,并基于此构建有限数量的实体类关联矩阵,通过实体语义关联计算挖掘具有潜在关联的实体对,进而识别并描述出该领域现存的潜在技术机会。通过依据实体类关联强度识别出技术未实现或较少实现的功能或应用领域,从关联矩阵中获取备选技术机会集合,进而完成技术领域内的技术机会的自动识别。
在本实施例中还提供了一种技术机会识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬+件,或者软件和硬件的组合的实现也是可能并被构想的。
本实施例提供一种技术机会识别装置,如图19所示,包括:
数据采集模块1901,用于根据待分析技术领域,采集待分析技术领域对应的初始文献数据集。详细请参见图1所示实施例的步骤S101,在此不再赘述。
数据预处理模块1902,用于对初始文献数据集进行预处理,得到预分析数据集。详细请参见图1所示实施例的步骤S102,在此不再赘述。
技术路径确定模块1903,用于对预分析数据集进行筛选,确定待分析技术领域对应的技术主路径,其中,技术主路径是指一个待分析技术领域中一个技术主题的演进发展历程。详细请参见图1所示实施例的步骤S103,在此不再赘述。
发展阶段确定模块1904,用于计算技术主路径的发展成熟度,确定技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段。详细请参见图1所示实施例的步骤S104,在此不再赘述。
技术机会确定模块1905,用于基于确定出的发展阶段,确定待分析技术领域的潜在技术机会。详细请参见图1所示实施例的步骤S105,在此不再赘述。
在一些可选的实施方式中,数据预处理模块1902包括:
实体关联抽取单元,用于对初始文献数据集进行实体关联抽取,得到待分析技术领域对应的技术实体集合。
时间窗划分单元,用于将技术实体集合划分为若干时间窗,对各时间窗的技术实体进行实体语义关联计算和聚类,得到预分析数据集。
在一些可选的实施方式中,实体关联抽取单元包括:
主谓宾结构抽取子单元,用于基于材料、产品、方法、功效及应用领域技术实体类型,对初始文献数据集进行主谓宾结构抽取,得到初始文献数据集对应的主谓宾结构。
实体及实体关联抽取子单元,用于利用通用信息抽取框架,结合知识增强语义表示模型,抽取得到待分析技术领域对应的不同类型的技术实体集合及实体关联。
在一些可选的实施方式中,技术路径确定模块1903包括:
核心技术主题筛选单元,用于基于预分析数据集中相邻时间窗的实体类的主谓宾结构,计算预分析数据集中相邻时间窗的实体类之间的互信息量,筛选得到相邻时间窗的实体类之间的互信息量大于互信息量阈值的实体类作为核心技术主题。
时序关联网络构建单元,用于基于核心技术主题,构建核心技术主题对应的时序关联网络。
技术主路径识别单元,用于基于时序关联网络,识别待分析技术领域对应的技术主路径。
在一些可选的实施方式中,技术主路径识别单元包括:
技术权重计算子单元,用于基于共有主谓宾结构,遍历计算得到时序关联网络中所有路径的技术权重。
技术主路径筛选子单元,用于筛选得到技术权重不小于预设技术权重阈值且路径终点在当前时间点的路径作为待分析技术领域对应的技术主路径。
在一些可选的实施方式中,技术机会确定模块1905包括:
发展阶段筛选单元,用于基于确定出的发展阶段,对技术主路径进行发展阶段筛选,得到第一主路径集合。
实体类关联矩阵构建单元,用于对第一主路径集合进行排序,得到第二主路径集合,利用第二主路径集合中的实体主题类构建实体类关联矩阵。
备选技术机会筛选单元,用于基于主谓宾结构,筛选得到备选技术机会集合。
潜在技术机会计算单元,用于计算备选技术机会集合中各实体的技术机会值,确定待分析技术领域的潜在技术机会。
在一些可选的实施方式中,备选技术机会筛选单元包括:
关联强度计算子单元,用于基于主谓宾结构,计算得到实体类关联矩阵中实体类之间的关联强度。
备选技术机会筛选子单元,用于将实体类之间的关联强度低于关联矩阵值阈值的实体类对纳入备选技术机会集合。
上述各个模块和单元的更进一步的功能描述与上述对应实施例相同,在此不再赘述。
本实施例中的技术机会识别装置是以功能单元的形式来呈现,这里的单元是指ASIC(Application Specific Integrated Circuit,专用集成电路)电路,执行一个或多个软件或固定程序的处理器和存储器,和/或其他可以提供上述功能的器件。
本发明实施例还提供一种计算机设备,具有上述图19所示的技术机会识别装置。
请参阅图20,图20是本发明可选实施例提供的一种计算机设备的结构示意图,如图20所示,该计算机设备包括:一个或多个处理器10、存储器20,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相通信连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在计算机设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在一些可选的实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个计算机设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图20中以一个处理器10为例。
处理器10可以是中央处理器,网络处理器或其组合。其中,处理器10还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路,可编程逻辑器件或其组合。上述可编程逻辑器件可以是复杂可编程逻辑器件,现场可编程逻辑门阵列,通用阵列逻辑或其任意组合。
其中,所述存储器20存储有可由至少一个处理器10执行的指令,以使所述至少一个处理器10执行实现上述实施例示出的方法。
存储器20可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器20可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些可选的实施方式中,存储器20可选包括相对于处理器10远程设置的存储器,这些远程存储器可以通过网络连接至该计算机设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
存储器20可以包括易失性存储器,例如,随机存取存储器;存储器也可以包括非易失性存储器,例如,快闪存储器,硬盘或固态硬盘;存储器20还可以包括上述种类的存储器的组合。
该计算机设备还包括通信接口30,用于该计算机设备与其他设备或通信网络通信。
本发明实施例还提供了一种计算机可读存储介质,上述根据本发明实施例的方法可在硬件、固件中实现,或者被实现为可记录在存储介质,或者被实现通过网络下载的原始存储在远程存储介质或非暂时机器可读存储介质中并将被存储在本地存储介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件的存储介质上的这样的软件处理。其中,存储介质可为磁碟、光盘、只读存储记忆体、随机存储记忆体、快闪存储器、硬盘或固态硬盘等;进一步地,存储介质还可以包括上述种类的存储器的组合。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件,当软件或计算机代码被计算机、处理器或硬件访问且执行时,实现上述实施例示出的方法。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种技术机会识别方法,其特征在于,所述方法包括:
根据待分析技术领域,采集所述待分析技术领域对应的初始文献数据集;
对所述初始文献数据集进行预处理,得到预分析数据集;
对所述预分析数据集进行筛选,确定所述待分析技术领域对应的技术主路径,其中,所述技术主路径是指一个所述待分析技术领域中一个技术主题的演进发展历程;
计算所述技术主路径的发展成熟度,确定所述技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;
基于确定出的所述发展阶段,确定所述待分析技术领域的潜在技术机会。
2.根据权利要求1所述的方法,其特征在于,所述对所述初始文献数据集进行预处理,得到预分析数据集,包括:
对所述初始文献数据集进行实体关联抽取,得到所述待分析技术领域对应的技术实体集合;
将所述技术实体集合划分为若干时间窗,对各时间窗的技术实体进行实体语义关联计算和聚类,得到预分析数据集。
3.根据权利要求2所述的方法,其特征在于,所述对所述初始文献数据集进行实体关联抽取,得到所述待分析技术领域对应的技术实体集合,包括:
基于材料、产品、方法、功效及应用领域技术实体类型,对所述初始文献数据集进行主谓宾结构抽取,得到所述初始文献数据集对应的主谓宾结构;
利用通用信息抽取框架,结合知识增强语义表示模型,抽取得到所述待分析技术领域对应的不同类型的所述技术实体集合及实体关联。
4.根据权利要求3所述的方法,其特征在于,所述对所述预分析数据集进行筛选,确定所述待分析技术领域对应的技术主路径,包括:
基于所述预分析数据集中相邻时间窗的实体类的主谓宾结构,计算所述预分析数据集中相邻时间窗的实体类之间的互信息量,筛选得到所述相邻时间窗的实体类之间的互信息量大于互信息量阈值的实体类作为核心技术主题;
基于所述核心技术主题,构建所述核心技术主题对应的时序关联网络;
基于所述时序关联网络,识别所述待分析技术领域对应的技术主路径。
5.根据权利要求4所述的方法,其特征在于,所述基于所述时序关联网络,识别所述待分析技术领域对应的技术主路径,包括:
基于共有主谓宾结构,遍历计算得到所述时序关联网络中所有路径的技术权重;
筛选得到技术权重不小于预设技术权重阈值且路径终点在当前时间点的路径作为所述待分析技术领域对应的技术主路径。
6.根据权利要求5所述的方法,其特征在于,所述基于确定出的所述发展阶段,确定所述待分析技术领域的潜在技术机会,包括:
基于确定出的所述发展阶段,对所述技术主路径进行发展阶段筛选,得到第一主路径集合;
对所述第一主路径集合进行排序,得到第二主路径集合,利用所述第二主路径集合中的实体主题类构建实体类关联矩阵;
基于主谓宾结构,筛选得到备选技术机会集合;
计算所述备选技术机会集合中各实体的技术机会值,确定所述待分析技术领域的潜在技术机会。
7.根据权利要求6所述的方法,其特征在于,所述基于主谓宾结构,筛选得到备选技术机会集合,包括:
基于主谓宾结构,计算得到所述实体类关联矩阵中实体类之间的关联强度;
将所述实体类之间的关联强度低于关联矩阵值阈值的实体类对纳入备选技术机会集合。
8.一种技术机会识别装置,其特征在于,所述装置包括:
数据采集模块,用于根据待分析技术领域,采集所述待分析技术领域对应的初始文献数据集;
数据预处理模块,用于对所述初始文献数据集进行预处理,得到预分析数据集;
技术路径确定模块,用于对所述预分析数据集进行筛选,确定所述待分析技术领域对应的技术主路径,其中,所述技术主路径是指一个所述待分析技术领域中一个技术主题的演进发展历程;
发展阶段确定模块,用于计算所述技术主路径的发展成熟度,确定所述技术主路径所处的发展阶段,其中,预先根据技术演进发展的阶段将技术主题演进发展历程划分为多个发展阶段;
技术机会确定模块,用于基于确定出的所述发展阶段,确定所述待分析技术领域的潜在技术机会。
9.一种计算机设备,其特征在于,包括:
存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1至7中任一项所述的技术机会识别方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令,所述计算机指令用于使计算机执行权利要求1至7中任一项所述的技术机会识别方法。
CN202410111452.0A 2024-01-26 2024-01-26 技术机会识别方法、装置、计算机设备及存储介质 Pending CN117634502A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410111452.0A CN117634502A (zh) 2024-01-26 2024-01-26 技术机会识别方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410111452.0A CN117634502A (zh) 2024-01-26 2024-01-26 技术机会识别方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN117634502A true CN117634502A (zh) 2024-03-01

Family

ID=90032506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410111452.0A Pending CN117634502A (zh) 2024-01-26 2024-01-26 技术机会识别方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN117634502A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118194865A (zh) * 2024-05-20 2024-06-14 南京大学 基于科学-技术路径多维交互的技术发展轨迹识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010033521A2 (en) * 2008-09-16 2010-03-25 Quantum Leap Research, Inc. Methods for enabling a scalable transformation of diverse data into hypotheses, models and dynamic simulations to drive the discovery of new knowledge
CN113761313A (zh) * 2021-08-19 2021-12-07 淮阴工学院 基于国家基金课题挖掘的科技前沿研究热点分析方法及装置
CN116340535A (zh) * 2023-03-06 2023-06-27 荃豆数字科技有限公司 一种中药饮片行业热点分析方法、装置、设备和介质
CN117112784A (zh) * 2023-07-13 2023-11-24 南京理工大学紫金学院 一种文献识别与技术路径演化的实现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010033521A2 (en) * 2008-09-16 2010-03-25 Quantum Leap Research, Inc. Methods for enabling a scalable transformation of diverse data into hypotheses, models and dynamic simulations to drive the discovery of new knowledge
CN113761313A (zh) * 2021-08-19 2021-12-07 淮阴工学院 基于国家基金课题挖掘的科技前沿研究热点分析方法及装置
CN116340535A (zh) * 2023-03-06 2023-06-27 荃豆数字科技有限公司 一种中药饮片行业热点分析方法、装置、设备和介质
CN117112784A (zh) * 2023-07-13 2023-11-24 南京理工大学紫金学院 一种文献识别与技术路径演化的实现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
孙蓉;杨国林;叶媛;李双;施彦岑;: "国内混合式教育研究的文献计量分析――基于Cite Space知识图谱分析", 当代教育实践与教学研究, no. 07, 10 April 2020 (2020-04-10) *
李璞 著: "大规模语义数据计算及检索方法", 30 June 2022, 河南大学出版社, pages: 198 - 200 *
罗家豪 等: "基于专利价值的技术成熟度测度与分析方法研究", 数字图书馆论坛, 25 January 2022 (2022-01-25), pages 17 - 25 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118194865A (zh) * 2024-05-20 2024-06-14 南京大学 基于科学-技术路径多维交互的技术发展轨迹识别方法

Similar Documents

Publication Publication Date Title
CN117634502A (zh) 技术机会识别方法、装置、计算机设备及存储介质
Wieland et al. Using Shapley additive explanations to interpret extreme gradient boosting predictions of grassland degradation in Xilingol, China
CN114598631B (zh) 面向神经网络计算的分布式数据路由的建模方法和装置
CN110826173A (zh) 一种土壤水分数据获取方法、系统、存储介质及设备
CN105389336A (zh) 大量数据关系的表示
Lacoste et al. Geo-bench: Toward foundation models for earth monitoring
Fullman et al. Predicting shifts in large herbivore distributions under climate change and management using a spatially-explicit ecosystem model
Ngo et al. Data warehouse and decision support on integrated crop big data
van Velzen et al. OpenDA-NEMO framework for ocean data assimilation
Palepu et al. An analysis of agricultural soils by using data mining techniques
Todeschini et al. Biips: software for Bayesian inference with interacting particle systems
Leimer et al. Biodiversity effects on nitrate concentrations in soil solution: a Bayesian model
Ayal et al. An appraisal on the determinants of adaptation responses to the impacts of climate variability on coffee Production: Implication to household food security in Nensebo Woreda, Ethiopia
Nielsen et al. The layout and internal development of celtic fields: structural and relative chronological analyses of three danish field systems
CN116703638A (zh) 大棚蔬菜种植管理系统及其方法
Taylor et al. Code modernization and modularization of APEX and SWAT watershed simulation models
Cassell et al. Dynamic simulation modelling for evaluating water quality response to agricultural BMP implementation
CN116795933A (zh) 产品设计工时的生成方法、装置、存储介质及程序产品
Lawler et al. starve: An R package for spatio‐temporal analysis of research survey data using nearest‐neighbour Gaussian processes
Tasoulis et al. Novel approaches to unsupervised clustering through k-windows algorithm
Babovic et al. Rainfall–runoff modeling based on genetic programming
Singh et al. Application of geospatial techniques in hydrological modelling
CN114722645B (zh) 影响径流变化的因素贡献率获取方法、系统、介质和设备
Meng et al. A SysML-based simulation model aggregation framework for seedling propagation system
Bacigál et al. Analysis of Relationship Among V4 Countries and Germany by Their Gross Domestic Products and Copula Models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination