CN114860227A - 基于刻面的构件描述与检索方法、设备及介质 - Google Patents

基于刻面的构件描述与检索方法、设备及介质 Download PDF

Info

Publication number
CN114860227A
CN114860227A CN202210377322.2A CN202210377322A CN114860227A CN 114860227 A CN114860227 A CN 114860227A CN 202210377322 A CN202210377322 A CN 202210377322A CN 114860227 A CN114860227 A CN 114860227A
Authority
CN
China
Prior art keywords
description
component
facet
retrieval
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210377322.2A
Other languages
English (en)
Other versions
CN114860227B (zh
Inventor
苏欣
阎德劲
赖复尧
王棕世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CETC 10 Research Institute
Original Assignee
CETC 10 Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CETC 10 Research Institute filed Critical CETC 10 Research Institute
Priority to CN202210377322.2A priority Critical patent/CN114860227B/zh
Publication of CN114860227A publication Critical patent/CN114860227A/zh
Application granted granted Critical
Publication of CN114860227B publication Critical patent/CN114860227B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/36Software reuse
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Warehouses Or Storage Devices (AREA)

Abstract

本发明公开了一种基于刻面的构件描述与检索方法、设备及介质,属于构件检索技术领域,包括步骤:构件描述,将刻面描述实体作为构件描述的基础,以刻面描述作为标签,以构件描述作为具体内容,将两者之间相互关联实现对一个构件进行完整描述;基于所述构件描述进入构件入库与分类过程,然后进入构件检索过程。本发明能够有效地发现相应的目标构件,检索效率高。

Description

基于刻面的构件描述与检索方法、设备及介质
技术领域
本发明涉及构件检索技术领域,更为具体的,涉及基于刻面的构件描述与检索方法、设备及介质。
背景技术
随着软件复用实践的深入和新技术的出现,不同研究学者已经提出了许多构件检索的方案,主要有关键字查找、刻面分类、签名匹配、行为匹配和基于语义的方法。但单一的构件检索方案都具有一定的局限性,难以保证较高的查全率和查准率,也难以适应日益复杂的构件检索要求。
传统的构件聚类树中构件仅具有单一的刻面描述维度,但是实际单一的刻面描述往往无法满足构件的整体情况,同一个构件可能同时能满足多个刻面的描述要求,即具有多义性。
基于多刻面的构件描述方法是将多维度刻面与相关术语进行结合,来实现对构件本质特性的精细描述和分类。但当前该方法描述的构件在检索时主要以传统数据库检索技术为主。这种检索过程是通过检索描述与构件描述进行强匹配,来实现构件的检索。但实际应用中,用户对构件的相关术语不会完全掌握,其检索条件会比较模糊,从而导致检索结果的查全率和查准率都比较低。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于刻面的构件描述与检索方法、设备及介质,能够有效地发现相应的目标构件,检索效率高。
本发明的目的是通过以下方案实现的:
一种基于刻面的构件描述与检索方法,包括以下步骤:
构件描述,将刻面描述实体作为构件描述的基础,以刻面描述作为标签,以构件描述作为具体内容,将两者之间相互关联实现对一个构件进行完整描述;
基于所述构件描述进入构件入库与分类过程,然后进入构件检索过程。
进一步地,在构件描述步骤中,包括子步骤:
建立一个刻面描述的实体树,提取刻面描述树中每个子刻面的描述实体,形成刻面描述向量;
依靠专家经验结合模糊分析法计算每个子刻面对应向量的影响权重;
计算刻面描述统计指标。
进一步地,所述基于所述构件描述进入构件入库与分类,包括子步骤:
按照刻面描述树中每一子刻面对当前构件进行自然语言描述,提取当前构件描述语句中的描述实体,形成构件描述向量;
将刻面描述的影响权重作为当前子刻面下构件描述向量的影响权重,并计算构件描述统计指标;
形成结合刻面描述和构件描述的综合描述向量;
按照综合描述向量的相似度对现有构件进行聚类,完成构件入库和分类过程。
进一步地,在构件检索过程中,包括子步骤:
用户输入构件检索条件,提取实体后转化成检索向量;
分别比较检索向量与刻面描述向量、检索向量与构件检索向量之间的相似度,利用比较结果判断满足条件的构件,完成构件检索的过程。
进一步地,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与刻面描述向量相似度更高时,表明当前查询的是刻面,则按照刻面描述树种每个子刻面的影响权重大小逐次检索向量与子刻面的相似度,并设计相似度阈值,将相似度阈值超过设定范围的子刻面取并集,最终得到含有这些子刻面的全部构件并完成构件检索的过程。
进一步地,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与构件描述向量更接近时,表明当前查询的是具体构件,按照构件描述树中每个描述的影响权重大小逐次计算相似度,并设计相似度阈值,将相似度阈值超过设定范围的构件描述取并集,最终得到满足构件描述条件的全部构件并完成构件检索的过程。
一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如上任一项所述的方法。
一种计算机可读存储介质,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行如上任一项所述的方法。
本发明的有益效果包括:
(1)描述完整,本发明将刻面描述实体作为构件描述的基础,以刻面描述作为标签,以构件描述作为具体内容,两者之间相互关联实现了对一个构件进行完整描述。
(2)检索准确,本发明利用权重和语义相似度相结合的方法实现刻面和构件描述的检索,能够有效地发现相应的目标构件,检索效率高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的方法流程示意图。
具体实施方式
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
实施例1
一种基于刻面的构件描述与检索方法,包括以下步骤:
构件描述,将刻面描述实体作为构件描述的基础,以刻面描述作为标签,以构件描述作为具体内容,将两者之间相互关联实现对一个构件进行完整描述;
基于所述构件描述进入构件入库与分类过程,然后进入构件检索过程。
实施例2
在实施例1的基础上,在构件描述步骤中,包括子步骤:
建立一个刻面描述的实体树,提取刻面描述树中每个子刻面的描述实体,形成刻面描述向量;
依靠专家经验结合模糊分析法计算每个子刻面对应向量的影响权重;
计算刻面描述统计指标。
实施例3
在实施例2的基础上,所述基于所述构件描述进入构件入库与分类,包括子步骤:
按照刻面描述树中每一子刻面对当前构件进行自然语言描述,提取当前构件描述语句中的描述实体,形成构件描述向量;
将刻面描述的影响权重作为当前子刻面下构件描述向量的影响权重,并计算构件描述统计指标;
形成结合刻面描述和构件描述的综合描述向量;
按照综合描述向量的相似度对现有构件进行聚类,完成构件入库和分类过程。
实施例4
在任一实施例1~实施例3的基础上,在构件检索过程中,包括子步骤:
用户输入构件检索条件,提取实体后转化成检索向量;
分别比较检索向量与刻面描述向量、检索向量与构件检索向量之间的相似度,利用比较结果判断满足条件的构件,完成构件检索的过程。
实施例5
在实施例4的基础上,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与刻面描述向量相似度更高时,表明当前查询的是刻面,则按照刻面描述树种每个子刻面的影响权重大小逐次检索向量与子刻面的相似度,并设计相似度阈值,将相似度阈值超过设定范围的子刻面取并集,最终得到含有这些子刻面的全部构件并完成构件检索的过程。
实施例6
在实施例4的基础上,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与构件描述向量更接近时,表明当前查询的是具体构件,按照构件描述树中每个描述的影响权重大小逐次计算相似度,并设计相似度阈值,将相似度阈值超过设定范围的构件描述取并集,最终得到满足构件描述条件的全部构件并完成构件检索的过程。
实施例7
一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如任一实施例1~实施例6中所述的方法。
实施例8
一种计算机可读存储介质,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行如任一实施例1~实施例6所述的方法。
实施例9
如图1所示,本实施例中,按照下述步骤实现:
S1,建立一个刻面描述的实体树,提取刻面描述树中每个子刻面的描述实体,形成刻面描述向量Dfa={dfa1,dfa2,...,dfan};
S2,依靠专家经验结合模糊分析法计算每个子刻面对应向量的影响权重,W={w1,w2,...,wn}且
Figure BDA0003591217900000071
S3,计算刻面描述统计指标
Figure BDA0003591217900000072
S4,进入构件入库及分类流程,按照刻面描述树中每一子刻面对当前构件进行自然语言描述,提取当前构件描述语句中的描述实体,形成构件描述向量
Figure BDA0003591217900000073
S5,将刻面描述的影响权重作为当前子刻面下构件描述向量的影响权重,并计算构件描述统计指标
Figure BDA0003591217900000074
S6,形成结合刻面描述和构件描述的综合描述向量
Figure BDA0003591217900000075
S7,按照综合描述向量的相似度对现有构件进行聚类,完成构件入库和分类过程;
S8,进入构件检索过程,用户输入构件检索条件,提取实体后转化成检索向量;
S9,分别比较检索向量与刻面描述向量、检索向量与构件检索向量之间的相似度,此时存在两种情况:
当检索向量与刻面描述向量相似度更高时,表明当前查询的是刻面,则按照刻面描述树种每个子刻面的影响权重大小逐次检索向量与子刻面的相似度,并设计相似度阈值,将相似度阈值超过一定范围的子刻面取并集,最终得到含有这些子刻面的全部构件并完成构件检索的过程;
当检索向量与构件描述向量更接近时,表明当前查询的是具体构件,同样按照构件描述树中每个描述的影响权重大小逐次计算相似度,并设计相似度阈值,将相似度阈值超过一定范围的构件描述取并集,最终得到满足构件描述条件的全部构件并完成构件检索的过程。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
本发明未涉及部分均与现有技术相同或可采用现有技术加以实现。
上述技术方案只是本发明的一种实施方式,对于本领域内的技术人员而言,在本发明公开了应用方法和原理的基础上,很容易做出各种类型的改进或变形,而不仅限于本发明上述具体实施方式所描述的方法,因此前面描述的方式只是优选的,而并不具有限制性的意义。
除以上实例以外,本领域技术人员根据上述公开内容获得启示或利用相关领域的知识或技术进行改动获得其他实施例,各个实施例的特征可以互换或替换,本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (8)

1.一种基于刻面的构件描述与检索方法,其特征在于,包括以下步骤:
构件描述,将刻面描述实体作为构件描述的基础,以刻面描述作为标签,以构件描述作为具体内容,将两者之间相互关联实现对一个构件进行完整描述;
基于所述构件描述进入构件入库与分类过程,然后进入构件检索过程。
2.根据权利要求1所述的基于刻面的构件描述与检索方法,其特征在于,在构件描述步骤中,包括子步骤:
建立一个刻面描述的实体树,提取刻面描述树中每个子刻面的描述实体,形成刻面描述向量;
依靠专家经验结合模糊分析法计算每个子刻面对应向量的影响权重;
计算刻面描述统计指标。
3.根据权利要求2所述的基于刻面的构件描述与检索方法,其特征在于,所述基于所述构件描述进入构件入库与分类,包括子步骤:
按照刻面描述树中每一子刻面对当前构件进行自然语言描述,提取当前构件描述语句中的描述实体,形成构件描述向量;
将刻面描述的影响权重作为当前子刻面下构件描述向量的影响权重,并计算构件描述统计指标;
形成结合刻面描述和构件描述的综合描述向量;
按照综合描述向量的相似度对现有构件进行聚类,完成构件入库和分类过程。
4.根据权利要求1~3任一项所述的基于刻面的构件描述与检索方法,其特征在于,在构件检索过程中,包括子步骤:
用户输入构件检索条件,提取实体后转化成检索向量;
分别比较检索向量与刻面描述向量、检索向量与构件检索向量之间的相似度,利用比较结果判断满足条件的构件,完成构件检索的过程。
5.根据权利要求4所述的基于刻面的构件描述与检索方法,其特征在于,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与刻面描述向量相似度更高时,表明当前查询的是刻面,则按照刻面描述树种每个子刻面的影响权重大小逐次检索向量与子刻面的相似度,并设计相似度阈值,将相似度阈值超过设定范围的子刻面取并集,最终得到含有这些子刻面的全部构件并完成构件检索的过程。
6.根据权利要求4所述的基于刻面的构件描述与检索方法,其特征在于,所述利用比较结果判断满足条件的构件,包括子步骤:
当检索向量与构件描述向量更接近时,表明当前查询的是具体构件,按照构件描述树中每个描述的影响权重大小逐次计算相似度,并设计相似度阈值,将相似度阈值超过设定范围的构件描述取并集,最终得到满足构件描述条件的全部构件并完成构件检索的过程。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时并执行如权利要求1~6任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,在可读存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行如权利要求1~6任一项所述的方法。
CN202210377322.2A 2022-04-12 2022-04-12 基于刻面的构件描述与检索方法、设备及介质 Active CN114860227B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210377322.2A CN114860227B (zh) 2022-04-12 2022-04-12 基于刻面的构件描述与检索方法、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210377322.2A CN114860227B (zh) 2022-04-12 2022-04-12 基于刻面的构件描述与检索方法、设备及介质

Publications (2)

Publication Number Publication Date
CN114860227A true CN114860227A (zh) 2022-08-05
CN114860227B CN114860227B (zh) 2023-05-30

Family

ID=82629143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210377322.2A Active CN114860227B (zh) 2022-04-12 2022-04-12 基于刻面的构件描述与检索方法、设备及介质

Country Status (1)

Country Link
CN (1) CN114860227B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092666A (ja) * 1999-09-20 2001-04-06 Nippon Telegr & Teleph Corp <Ntt> プロセス記述方法及びプロセス記述検索方法及びプロセス実行プログラムを格納した記憶媒体及びプロセス記述検索プログラムを格納した記憶媒体
CN1877523A (zh) * 2006-06-23 2006-12-13 清华大学 一种支持异构构件的构件库统一管理方法
US20110072001A1 (en) * 2009-09-20 2011-03-24 Amit Jyoti Basu Systems and methods for providing advanced search result page content
CN101996257A (zh) * 2010-11-30 2011-03-30 中国人民解放军信息工程大学 可重构路由交换平台构件的检索方法
CN105373537A (zh) * 2014-08-20 2016-03-02 西安慧泽知识产权运营管理有限公司 一种智能构件库管理方法
AU2014339736A1 (en) * 2013-10-24 2016-06-02 Carsales.Com Ltd System and method for implementing multi-faceted search queries
CN109408713A (zh) * 2018-10-09 2019-03-01 哈尔滨工程大学 一种基于用户反馈信息的软件需求检索系统
CN110851644A (zh) * 2019-11-04 2020-02-28 泰康保险集团股份有限公司 图像检索方法及装置、计算机可读存储介质、电子设备

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001092666A (ja) * 1999-09-20 2001-04-06 Nippon Telegr & Teleph Corp <Ntt> プロセス記述方法及びプロセス記述検索方法及びプロセス実行プログラムを格納した記憶媒体及びプロセス記述検索プログラムを格納した記憶媒体
CN1877523A (zh) * 2006-06-23 2006-12-13 清华大学 一种支持异构构件的构件库统一管理方法
US20110072001A1 (en) * 2009-09-20 2011-03-24 Amit Jyoti Basu Systems and methods for providing advanced search result page content
CN101996257A (zh) * 2010-11-30 2011-03-30 中国人民解放军信息工程大学 可重构路由交换平台构件的检索方法
AU2014339736A1 (en) * 2013-10-24 2016-06-02 Carsales.Com Ltd System and method for implementing multi-faceted search queries
CN105373537A (zh) * 2014-08-20 2016-03-02 西安慧泽知识产权运营管理有限公司 一种智能构件库管理方法
CN109408713A (zh) * 2018-10-09 2019-03-01 哈尔滨工程大学 一种基于用户反馈信息的软件需求检索系统
CN110851644A (zh) * 2019-11-04 2020-02-28 泰康保险集团股份有限公司 图像检索方法及装置、计算机可读存储介质、电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
XIANGLI QU: "Research on Component Retrieval and Matching Methods" *
宋士涛: "基于本体与刻面相结合的构件检索研究" *
董跃华;马亚飞;: "基于刻面权重的构件检索方法的研究" *
钱晓捷;杜胜浩;: "基于刻面分类标识和聚类树的构件检索方法" *

Also Published As

Publication number Publication date
CN114860227B (zh) 2023-05-30

Similar Documents

Publication Publication Date Title
US7130849B2 (en) Similarity-based search method by relevance feedback
CN112257419B (zh) 一种基于词频和语义计算专利文献相似度的智能检索方法、装置、电子设备及其存储介质
CN112035599B (zh) 基于垂直搜索的查询方法、装置、计算机设备及存储介质
US20120117090A1 (en) System and method for managing digital contents
CN115203421A (zh) 一种长文本的标签生成方法、装置、设备及存储介质
CN111325033B (zh) 实体识别方法、装置、电子设备及计算机可读存储介质
CN117349406A (zh) 基于大数据的专利信息检索系统及方法
CN113032573B (zh) 一种结合主题语义与tf*idf算法的大规模文本分类方法及系统
Yin et al. Sentence-bert and k-means based clustering technology for scientific and technical literature
CN114461783A (zh) 关键词生成方法、装置、计算机设备、存储介质和产品
CN112579783B (zh) 基于拉普拉斯图谱的短文本聚类方法
CN112148938B (zh) 一种跨域异构数据检索系统及检索方法
CN105512270B (zh) 一种确定相关对象的方法和装置
CN110209895B (zh) 向量检索方法、装置和设备
CN114860227A (zh) 基于刻面的构件描述与检索方法、设备及介质
CN115455249A (zh) 双引擎驱动的多模态数据检索方法、设备及系统
CN113010669B (zh) 一种新闻分类方法和系统
CN111242152A (zh) 基于目标提取的图像检索方法
CN118069852B (zh) 一种多模型融合的数据分类预测方法与系统
CN112579841B (zh) 一种多模态数据库建立方法、检索方法及系统
CN118093805A (zh) 一种问答方法、装置、电子设备及存储介质
CN114860923A (zh) 基于大数据的多维属性标签提取方法、系统、终端及介质
Kumar et al. Complementary feature extraction approach in CBIR
CN117891920A (zh) 一种建筑材料检索方法、装置、电子设备及存储介质
CN115017384A (zh) 物品类目识别方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant