CN113836863B - 一种Logisim电路图的查重方法及系统 - Google Patents
一种Logisim电路图的查重方法及系统 Download PDFInfo
- Publication number
- CN113836863B CN113836863B CN202111157834.XA CN202111157834A CN113836863B CN 113836863 B CN113836863 B CN 113836863B CN 202111157834 A CN202111157834 A CN 202111157834A CN 113836863 B CN113836863 B CN 113836863B
- Authority
- CN
- China
- Prior art keywords
- logisim
- maximum connected
- circuit diagram
- node
- connected subgraph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000010586 diagram Methods 0.000 title claims abstract description 162
- 238000000034 method Methods 0.000 title claims abstract description 51
- 238000001914 filtration Methods 0.000 claims abstract description 7
- 239000013598 vector Substances 0.000 claims description 22
- 230000009191 jumping Effects 0.000 claims description 16
- 238000004364 calculation method Methods 0.000 claims description 7
- 230000000694 effects Effects 0.000 abstract description 5
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 6
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 6
- 101100524516 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) RFA2 gene Proteins 0.000 description 1
- 239000004020 conductor Substances 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/39—Circuit design at the physical level
- G06F30/394—Routing
- G06F30/3947—Routing global
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/30—Circuit design
- G06F30/39—Circuit design at the physical level
- G06F30/398—Design verification or optimisation, e.g. using design rule check [DRC], layout versus schematics [LVS] or finite element methods [FEM]
Landscapes
- Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Geometry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种Logisim电路图的查重方法及系统,属于数据处理技术领域,解决如何有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰的问题,包括以下步骤:将Logisim电路图视作以元件为节点、以导线为边的无向图,然后将无向图划分为若干最大连通子图,得到最大连通子图集合,从而创建最大连通子图集合数据集;通过计算最大连通子图的相似度,从而计算最大连通子图集合的重复率;根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图;本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。
Description
技术领域
本发明属于数字电路技术领域,涉及一种Logisim电路图的查重方法及系统。
背景技术
Logisim是用于设计和仿真数字逻辑电路的教育工具。在教育领域,Logisim电路图已经成为了电路设计的主要形式之一。如何发现学生提交的Logisim电路图的抄袭行为,成为了一个亟需研究的问题。
Logisim电路图可以保存为XML格式的文本文件,也可以渲染为PNG格式的图像文件。针对这两种表示方式,目前已经有许多查重系统或查重方法,如WCopyfind、JPlag、SSIM等。然而这两种Logisim电路图表示方法存在着缺陷,导致相应的Logisim电路图查重方法无法取得好的效果。将Logisim电路图表示为文本时,由于文本中包含大量的标签,现有的查重方法无法有效地捕捉到关键信息,容易将不重复的电路图错误地标记为重复;将Logisim电路图表示为图像时,拖拽电路图的部分元件就可以使得图像差异较大,查重方法无法抵御这种干扰,容易将重复的电路图错误地标记为不重复。
现有技术中,申请公布日2013年04月03日、申请公布号为CN103020086A的中国发明专利申请《一种图片查重的方法及装置》包括:获取待录入图片库的图片;将所述获取待录入图片库的图片与图片库中的图片按照预设参数进行比对;根据比对结果,决定是否将所述待录入图片库的图片录入所述图片库。该技术方案在图片查重时效率高、准确率高,且实现了图片查重由计算机执行。但是该技术方案并未解决如何提高Logisim电路图查重的效果的问题。
发明内容
本发明所要解决的问题在于如何设计一种Logisim电路图的查重方法及系统,从而有效地捕捉到Logisim电路图的关键信息,减少拖拽电路图的部分元件或部分最大连通子图对查重的干扰。
本发明是通过以下技术方案解决上述技术问题的:
一种Logisim电路图的查重方法,包括以下步骤:
A1、获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集;
A2、通过计算最大连通子图的相似度,从而计算每一个最大连通子图集合与其他最大连通子图集合的重复率;
A3、根据步骤A2中计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图。
本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。
作为本发明技术方案的进一步改进,步骤A1中所述的获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集的具体流程为:
A11、读取Logisim电路图的元件和导线;
A12、将Logisim电路图转化为无向图,无向图由节点集合和边集合组成;
A13、将无向图划分为最大连通子图集合,最大连通子图由节点集合和边集合组成;
A14、重新计算每一个最大连通子图中的节点的位置属性。
作为本发明技术方案的进一步改进,步骤A12中所述的将Logisim电路图转化为无向图的方法为:
A121、为每一个元件创建一个节点,节点有类型属性和位置属性,对应元件的类型和位置;
A122、为每一根导线创建一条边,边连接的节点与导线连接的元件对应。
作为本发明技术方案的进一步改进,步骤A13中所述的将无向图划分为最大连通子图集合,最大连通子图由节点集合和边集合组成的方法为:
A131、为每一个节点创建一个只包含它本身的节点集合;
A132、遍历所有边,合并边连接的节点所在的节点集合;
A133、根据边连接的节点所在的节点集合,为每一个节点集合分配边集合。
作为本发明技术方案的进一步改进,步骤A14中所述的重新计算每一个最大连通子图中的节点的位置属性的方法为:
A141、遍历所有节点,找到最小的横坐标X_min和最小的纵坐标Y_min;
A142、将每一个节点的横坐标减去X_min,将每一个节点的纵坐标减去Y_min。
作为本发明技术方案的进一步改进,步骤A2中所述的通过计算最大连通子图的相似度,从而计算每一个最大连通子图集合与其他最大连通子图集合的重复率的方法为:
A21、对最大连通子图集合L中的每一个最大连通子图,计算它与最大连通子图集合R中所有最大连通子图的相似度的最大值;
所述的最大连通子图的相似度的计算方法为:
A211、初始化相似值为0,相似值上限为0;
A212、获取一个最大连通子图G1中未被访问过的节点V1,根据节点V1的类型属性,增加相似值上限;
A213、找到另一个最大连通子图G2中具有相同类型属性的节点集合S1,如果节点集合S1为空,跳转到步骤A217;
A214、找到节点集合S1中具有相似位置属性的节点集合S2,如果节点集合S2为空,跳转到步骤A217;
A215、找到节点集合S2中具有相似邻居关系的节点集合S3,如果节点集合S3为空,跳转到步骤A217;
A216、根据节点V1的类型属性,增加相似值;
A217、如果所有节点均已被访问,那么计算相似值与相似值上限的比值,比值即为最大连通子图G1与最大连通子图G2的相似度,否则跳转到步骤A212;
A22、计算相似度的最大值超过阈值的最大连通子图的个数K与最大连通子图集合L中的最大连通子图的个数N的比值,比值K/N即为L与R的重复率。
作为本发明技术方案的进一步改进,步骤A215中所述的相似邻居关系判断的方法为:判断两个节点的度是否相同。
作为本发明技术方案的进一步改进,步骤A3中所述的采用阈值过滤的方法从Logisim电路图数据集找到重复的Logisim电路图的过程具体如下:
从Logisim电路图数据集中确定重复的Logisim电路图的方法为:对每一个Logisim电路图,选择与它对应的最大连通子图集合的重复率超过阈值的最大连通子图集合对应的Logisim电路图作为重复的Logisim电路图。
作为本发明技术方案的进一步改进,步骤A3中所述的采用聚类的方法从Logisim电路图数据集找到重复的Logisim电路图的过程具体如下:
A31、提取最大连通子图集合数据集中的所有最大连通子图,创建最大连通子图数据集;
A32、合并数据集中相似度超过阈值的最大连通子图,创建相似最大连通子图数据集;
A33、为每一个Logisim电路图生成一个特征向量,特征向量的第k个元素表示相似最大连通子图数据集的第k项中的最大连通子图在Logisim电路图对应的最大连通子图集合中出现的次数;
A34、对生成的所有特征向量执行聚类算法,得到每一个特征向量的类别,特征向量的类别同时也是特征向量对应的Logisim电路图的类别;
A35、对每一个Logisim电路图,选择与它类别相同的Logisim电路图集合,去除Logisim电路图自身后作为重复的Logisim电路图。
一种Logisim电路图的查重系统,包括:最大连通子图集合数据集创建模块、重复率计算模块、重复的Logisim电路图查找模块;
所述的最大连通子图集合数据集创建模块用于获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集;
所述的重复率计算模块用于通过计算最大连通子图的相似度,从而计算每一个最大连通子图集合与其他最大连通子图集合的重复率;
所述的重复的Logisim电路图查找模块用于根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图。
本发明的优点在于:
(1)本发明的技术方案将Logisim电路图表示为最大连通子图集合,有效地捕捉到Logisim电路图的关键信息,减少多种作弊手段对查重的干扰,从而提高查重的效果。
(2)本发明的技术方案将最大连通子图“对齐到”坐标原点,有效地减少了拖拽最大连通子图对查重的干扰。
(3)本发明的技术方案综合计算最大连通子图的相似度,有效地减少了拖拽部分元件对查重的干扰。
附图说明
图1为本发明实施例一的一种Logisim电路图的查重方法的流程示意图;
图2为本发明实施例一的一个Logisim电路图样例图;
图3为本发明实施例一的Logisim电路图转化的无向图的示意图;
图4为本发明实施例一的无向图划分的最大连通子图集合的示意图;
图5为本发明实施例一的另一个Logisim电路图样例图;
图6为本发明实施例一的另一个Logisim电路图对应的最大连通子图集合的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合说明书附图以及具体的实施例对本发明的技术方案作进一步描述:
实施例一
如图1所示,本实施例提供了一种Logisim电路图的查重方法,包括以下步骤:
A1、获取Logisim电路图数据集,创建最大连通子图集合数据集
在步骤A1中,将Logisim电路图数据集中的每一个Logisim电路图转化为最大连通子图集合,从而得到最大连通子图集合数据集,转化方法包括以下步骤:
(1)读取Logisim电路图的元件和导线。举例说明:如图2所示,一个Logisim电路图由4个IN元件、2个AND元件、1个NOR元件、1个BUF元件、4个T元件和11根导线组成。需要说明的是,两个相同名称的T元件表示它们逻辑上相连,本实施例将它们看作两个无关的元件,在后续步骤中使用不同的编号区分它们;
(2)将Logisim电路图转化为无向图。举例说明:如图3所示,Logisim电路图中的每一个元件对应无向图中的一个节点,每一根导线对应无向图中的一条边,节点有类型属性和位置属性,对应元件的类型和位置,边连接的节点与导线连接的元件对应;
(3)将无向图划分为最大连通子图集合。举例说明:如图3所示,无向图共有12个节点,为它们分别创建一个节点集合。然后,依次访问11条边,合并边连接的节点所在的节点集合,例如:当访问到1号边时,合并IN1和AND1所在的节点集合;当访问到2号边时,合并IN2和AND1所在的节点集合……最终得到4个节点集合“IN1,IN2,AND1,T1+”、“IN3,IN4,AND2,T2+”、“T1-,T2-,OR1,T3+”、“T3-,BUF1,OUT”。最后,根据边连接的节点所在的节点集合,为每一个节点集合分配边集合,得到如图4所示的4个最大连通子图集合C1、C2、C3、C4;
(4)重新计算每一个最大连通子图中的节点的位置属性。举例说明:最大连通子图C1中,节点IN1的位置属性为“5,1”,节点IN2的位置属性为“5,5”,节点AND1的位置属性为“11.5,3”,节点T1的位置属性为“19,3”,其中最小的横坐标为5,最小的纵坐标为1。将每一个节点的横坐标减去5,每一个节点的纵坐标减去1,使得节点的位置属性表示节点在自己的最大连通子图中的相对位置而非在Logisim电路图中的绝对位置。
A2、计算每一个最大连通子图集合与其他最大连通子图集合的重复率
在步骤A2中,计算两个最大连通子图集合L与R的重复率的方法包括以下步骤:
(1)对L中的每一个最大连通子图,计算它与R中所有最大连通子图的相似度的最大值。举例说明:L与R如图4和图6所示,L中的最大连通子图C1与R中的最大连通子图D1、D2、D3的相似度分别为0.375、0.375、0,相似度的最大值为0.375;
(2)计算相似度的最大值超过阈值的最大连通子图的个数K与L中的最大连通子图的个数N的比值,比值K/N即为L与R的重复率。举例说明:L中的最大连通子图C1、C2、C3、C4的相似度的最大值分别为0.375、0.375、0.875、0.143,本实施例选取阈值为0.5,超过阈值的最大连通子图的个数K为1,L中的最大连通子图的个数N为4,因此L与R的重复率为K/N=0.25。
计算两个最大连通子图G1与G2的相似度的方法包括以下步骤:
(1)初始化相似值为0,相似值上限为0;
(2)获取一个G1中未被访问过的节点V1,根据V1的类型属性,增加相似值上限;
(3)找到G2中具有相同类型属性的节点集合S1,如果S1为空,跳转到步骤(7);
(4)找到S1中具有相似位置属性的节点集合S2,如果S2为空,跳转到步骤(7);
(5)找到S2中具有相似邻居关系的节点集合S3,如果S3为空,跳转到步骤(7);
(6)根据V1的类型属性,增加相似值;
(7)如果所有节点均已被访问,那么计算相似值与相似值上限的比值,比值即为G1与G2的相似度,否则跳转到步骤(2)。
举例说明:计算L中的最大连通子图C1与R中的最大连通子图D1的相似度。C1包含4个节点IN1(C1)、IN2(C1)、AND1(C1)、T1(C1),它们的类型属性分别为“IN”、“IN”、“AND”、“T”,它们的位置属性分别为“0,0”、“0,4”、“6.5,2”、“14,2”。D1包含4个节点IN1(D1)、IN2(D1)、NAND1(D1)、T1(D1),它们的类型属性分别为“IN”、“IN”、“NAND”、“T”,它们的位置属性分别为“0,0”、“0,4”、“4.5,2”、“12,2”。首先,初始化相似值为0,相似值上限为0;接下来,访问节点IN1(C1),本实施例中,类型属性为“IN”、“T”、“OUT”的节点增加的相似值和相似值上限为5,其他节点增加的相似值和相似值上限为1,因此相似值上限增加1;接下来,找到D1中具有相同类型属性的节点集合S1=“IN1(D1),IN2(D1)”;接下来,找到S1中具有相似位置属性的节点集合S2,本实施例中,横坐标的差值的绝对值和纵坐标的差值的绝对值都不超过2的节点被认为具有相似位置属性,因此S2=“IN1(D1)”;接下来,找到S2中具有相似邻居关系的节点集合S3=“IN1(D1)”;接下来,由于IN1(C1)的类型属性为“IN”,相似值增加1;最后,对IN2(C1)、AND1(C1)、T1(C1)重复上述步骤,得到相似值为3,相似值上限为8,因此C1与D1的相似度为0.375。
A3、根据重复率,从Logisim电路图数据集中确定重复的Logisim电路图
步骤A3中的一种实现方式为:对每一个Logisim电路图,选择与它对应的最大连通子图集合的重复率超过阈值的最大连通子图集合对应的Logisim电路图作为重复的Logisim电路图。
举例说明:Logisim电路图数据集由如图2和图5所示的两个Logisim电路图组成,它们对应的最大连通子图集合为L和R,L与R的重复率为0.25,本实施例选取阈值为0.5,因此L对应的Logisim电路图的重复的Logisim电路图为空集;R与L的重复率为0.33,因此R对应的Logisim电路图的重复的Logisim电路图也为空集。
步骤A3的另一种实现方式为:
(1)提取最大连通子图集合数据集中的所有最大连通子图,创建最大连通子图数据集;
(2)合并数据集中相似度超过阈值的最大连通子图,创建相似最大连通子图数据集;
(3)为每一个Logisim电路图生成一个特征向量,特征向量的第k个元素表示相似最大连通子图数据集的第k项中的最大连通子图在Logisim电路图对应的最大连通子图集合中出现的次数;
(4)对生成的所有特征向量执行聚类算法,得到每一个特征向量的类别,特征向量的类别同时也是特征向量对应的Logisim电路图的类别;
(5)对每一个Logisim电路图,选择与它类别相同的Logisim电路图集合,去除Logisim电路图自身后作为重复的Logisim电路图。
举例说明:Logisim电路图数据集由如图2和图5所示的两个Logisim电路图组成,它们对应的最大连通子图集合为L和R。首先,提取所有最大连通子图,创建最大连通子图数据集为“C1,C2,C3,C4,D1,D2,D3”;接下来,合并数据集中相似度超过阈值的最大连通子图,创建相似最大连通子图数据集为“C1(C2),C3(D3),C4,D1(D2)”;接下来,为每一个Logisim电路图生成一个特征向量,L对应的Logisim电路图的特征向量为“2,1,1,0”,R对应的Logisim电路图的特征向量为“0,1,0,2”;接下来,对生成的所有特征向量执行聚类算法,得到L对应的Logisim电路图的类别为0,R对应的Logisim电路图的类别为1;最后,选择类别为0的Logisim电路图作为L对应的Logisim电路图的重复的Logisim电路图,除去它自身的结果为空集,选择类别为1的Logisim电路图作为R对应的Logisim电路图的重复的Logisim电路图,除去它自身的结果也为空集。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种Logisim电路图的查重方法,其特征在于,包括以下步骤:
A1、获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集;
A2、通过计算最大连通子图的相似度,从而计算每一个最大连通子图集合与其他最大连通子图集合的重复率,具体方法为:
A21、对最大连通子图集合L中的每一个最大连通子图,计算它与最大连通子图集合R中所有最大连通子图的相似度的最大值;
所述的最大连通子图的相似度的计算方法为:
A211、初始化相似值为0,相似值上限为0;
A212、获取一个最大连通子图G1中未被访问过的节点V1,根据节点V1的类型属性,增加相似值上限;
A213、找到另一个最大连通子图G2中具有相同类型属性的节点集合S1,如果节点集合S1为空,跳转到步骤A217;
A214、找到节点集合S1中具有相似位置属性的节点集合S2,如果节点集合S2为空,跳转到步骤A217;
A215、找到节点集合S2中具有相似邻居关系的节点集合S3,如果节点集合S3为空,跳转到步骤A217;
A216、根据节点V1的类型属性,增加相似值;
A217、如果所有节点均已被访问,那么计算相似值与相似值上限的比值,比值即为最大连通子图G1与最大连通子图G2的相似度,否则跳转到步骤A212;
A22、计算相似度的最大值超过阈值的最大连通子图的个数K与最大连通子图集合L中的最大连通子图的个数N的比值,比值K/N即为L与R的重复率;
A3、根据步骤A2中计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图。
2.根据权利要求1所述的一种Logisim电路图的查重方法,其特征在于,步骤A1中所述的获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集的具体流程为:
A11、读取Logisim电路图的元件和导线;
A12、将Logisim电路图转化为无向图,无向图由节点集合和边集合组成;
A13、将无向图划分为最大连通子图集合,最大连通子图由节点集合和边集合组成;
A14、重新计算每一个最大连通子图中的节点的位置属性。
3.根据权利要求2所述的一种Logisim电路图的查重方法,其特征在于,步骤A12中所述的将Logisim电路图转化为无向图的方法为:
A121、为每一个元件创建一个节点,节点有类型属性和位置属性,对应元件的类型和位置;
A122、为每一根导线创建一条边,边连接的节点与导线连接的元件对应。
4.根据权利要求2所述的一种Logisim电路图的查重方法,其特征在于,步骤A13中所述的将无向图划分为最大连通子图集合,最大连通子图由节点集合和边集合组成的方法为:
A131、为每一个节点创建一个只包含它本身的节点集合;
A132、遍历所有边,合并边连接的节点所在的节点集合;
A133、根据边连接的节点所在的节点集合,为每一个节点集合分配边集合。
5.根据权利要求2所述的一种Logisim电路图的查重方法,其特征在于,步骤A14中所述的重新计算每一个最大连通子图中的节点的位置属性的方法为:
A141、遍历所有节点,找到最小的横坐标X_min和最小的纵坐标Y_min;
A142、将每一个节点的横坐标减去X_min,将每一个节点的纵坐标减去Y_min。
6.根据权利要求1所述的一种Logisim电路图的查重方法,其特征在于,步骤A215中所述的相似邻居关系判断的方法为:判断两个节点的度是否相同。
7.根据权利要求1所述的一种Logisim电路图的查重方法,其特征在于,步骤A3中所述的采用阈值过滤的方法从Logisim电路图数据集找到重复的Logisim电路图的过程具体如下:
从Logisim电路图数据集中确定重复的Logisim电路图的方法为:对每一个Logisim电路图,选择与它对应的最大连通子图集合的重复率超过阈值的最大连通子图集合对应的Logisim电路图作为重复的Logisim电路图。
8.根据权利要求1所述的一种Logisim电路图的查重方法,其特征在于,步骤A3中所述的采用聚类的方法从Logisim电路图数据集找到重复的Logisim电路图的过程具体如下:
A31、提取最大连通子图集合数据集中的所有最大连通子图,创建最大连通子图数据集;
A32、合并数据集中相似度超过阈值的最大连通子图,创建相似最大连通子图数据集;
A33、为每一个Logisim电路图生成一个特征向量,特征向量的第k个元素表示相似最大连通子图数据集的第k项中的最大连通子图在Logisim电路图对应的最大连通子图集合中出现的次数;
A34、对生成的所有特征向量执行聚类算法,得到每一个特征向量的类别,特征向量的类别同时也是特征向量对应的Logisim电路图的类别;
A35、对每一个Logisim电路图,选择与它类别相同的Logisim电路图集合,去除Logisim电路图自身后作为重复的Logisim电路图。
9.一种Logisim电路图的查重系统,其特征在于,包括:最大连通子图集合数据集创建模块、重复率计算模块、重复的Logisim电路图查找模块;
所述的最大连通子图集合数据集创建模块用于获取Logisim电路图数据集,通过将Logisim电路图转化为最大连通子图集合,从而创建最大连通子图集合数据集;
所述的重复率计算模块用于通过计算最大连通子图的相似度,从而计算每一个最大连通子图集合与其他最大连通子图集合的重复率,具体方法为:
A21、对最大连通子图集合L中的每一个最大连通子图,计算它与最大连通子图集合R中所有最大连通子图的相似度的最大值;
所述的最大连通子图的相似度的计算方法为:
A211、初始化相似值为0,相似值上限为0;
A212、获取一个最大连通子图G1中未被访问过的节点V1,根据节点V1的类型属性,增加相似值上限;
A213、找到另一个最大连通子图G2中具有相同类型属性的节点集合S1,如果节点集合S1为空,跳转到步骤A217;
A214、找到节点集合S1中具有相似位置属性的节点集合S2,如果节点集合S2为空,跳转到步骤A217;
A215、找到节点集合S2中具有相似邻居关系的节点集合S3,如果节点集合S3为空,跳转到步骤A217;
A216、根据节点V1的类型属性,增加相似值;
A217、如果所有节点均已被访问,那么计算相似值与相似值上限的比值,比值即为最大连通子图G1与最大连通子图G2的相似度,否则跳转到步骤A212;
A22、计算相似度的最大值超过阈值的最大连通子图的个数K与最大连通子图集合L中的最大连通子图的个数N的比值,比值K/N即为L与R的重复率;
所述的重复的Logisim电路图查找模块用于根据计算的重复率采用阈值过滤或聚类的方法从Logisim电路图数据集找到重复的Logisim电路图。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111157834.XA CN113836863B (zh) | 2021-09-30 | 2021-09-30 | 一种Logisim电路图的查重方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111157834.XA CN113836863B (zh) | 2021-09-30 | 2021-09-30 | 一种Logisim电路图的查重方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113836863A CN113836863A (zh) | 2021-12-24 |
CN113836863B true CN113836863B (zh) | 2024-05-28 |
Family
ID=78967933
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111157834.XA Active CN113836863B (zh) | 2021-09-30 | 2021-09-30 | 一种Logisim电路图的查重方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113836863B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105468677A (zh) * | 2015-11-13 | 2016-04-06 | 国家计算机网络与信息安全管理中心 | 一种基于图结构的日志聚类方法 |
WO2017080320A1 (zh) * | 2015-11-09 | 2017-05-18 | 北京奇虎科技有限公司 | 书籍库中相似书的挖掘、净化方法和装置 |
CN108491586A (zh) * | 2018-03-02 | 2018-09-04 | 盛科网络(苏州)有限公司 | 检查印制电路板中重复电阻的方法和装置 |
DE102018100423A1 (de) * | 2018-01-10 | 2019-07-11 | Dspace Digital Signal Processing And Control Engineering Gmbh | Inkrementelles Generieren einer FPGA Implementierung mit Graphen-basierter Ähnlichkeitssuche |
CN111460234A (zh) * | 2020-03-26 | 2020-07-28 | 平安科技(深圳)有限公司 | 图查询方法、装置、电子设备及计算机可读存储介质 |
-
2021
- 2021-09-30 CN CN202111157834.XA patent/CN113836863B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017080320A1 (zh) * | 2015-11-09 | 2017-05-18 | 北京奇虎科技有限公司 | 书籍库中相似书的挖掘、净化方法和装置 |
CN105468677A (zh) * | 2015-11-13 | 2016-04-06 | 国家计算机网络与信息安全管理中心 | 一种基于图结构的日志聚类方法 |
DE102018100423A1 (de) * | 2018-01-10 | 2019-07-11 | Dspace Digital Signal Processing And Control Engineering Gmbh | Inkrementelles Generieren einer FPGA Implementierung mit Graphen-basierter Ähnlichkeitssuche |
CN108491586A (zh) * | 2018-03-02 | 2018-09-04 | 盛科网络(苏州)有限公司 | 检查印制电路板中重复电阻的方法和装置 |
CN111460234A (zh) * | 2020-03-26 | 2020-07-28 | 平安科技(深圳)有限公司 | 图查询方法、装置、电子设备及计算机可读存储介质 |
Non-Patent Citations (1)
Title |
---|
面向信息隐藏的二维工程图相似度方法;龙敏;彭飞;李帅军;;长沙理工大学学报(自然科学版);20110928(03);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113836863A (zh) | 2021-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
He et al. | Enhanced boundary learning for glass-like object segmentation | |
US9734247B2 (en) | Topology service using closure tables and metagraphs | |
US20180253852A1 (en) | Method and device for locating image edge in natural background | |
WO2020125100A1 (zh) | 一种图像检索方法、装置以及设备 | |
KR20190081907A (ko) | 멀티 심도 이미지의 자동 생성 방법 | |
CN114037912A (zh) | 遥感图像的变化检测方法、装置及计算机可读存储介质 | |
CN112750065B (zh) | 载体对象处理和水印嵌入方法、装置及电子设备 | |
CN113836863B (zh) | 一种Logisim电路图的查重方法及系统 | |
KR20200103204A (ko) | 딥러닝 기반 학습 데이터 생성 방법 및 학습 데이터 생성 시스템 | |
US20120136911A1 (en) | Information processing apparatus, information processing method and information processing program | |
CN111460629B (zh) | 图形数据校核方法、装置、电子设备和计算机存储介质 | |
US8489537B2 (en) | Segmenting sequential data with a finite state machine | |
JP6603194B2 (ja) | 画面認識装置、画面認識方法、および、画面認識プログラム | |
JP6660501B1 (ja) | データ抽出装置、データ抽出方法及びデータ抽出プログラム | |
CN111191647A (zh) | 一种基于图像处理的标准公式识别方法 | |
KR102644097B1 (ko) | 멀티 심도 이미지의 자동 변환 방법 | |
CN105354833A (zh) | 一种阴影检测的方法和装置 | |
CN110147516A (zh) | 页面设计中前端代码的智能识别方法及相关设备 | |
JP2020525963A (ja) | メディア特徴の比較方法及び装置 | |
CN115204318A (zh) | 事件自动层级分类方法及电子设备 | |
US20230044011A1 (en) | Method of identifying an abridged version of a video | |
JP2018077763A (ja) | オブジェクト検索装置、オブジェクト検索方法、および、オブジェクト検索プログラム | |
CN113704108A (zh) | 一种相似代码检测方法及装置、电子设备、存储介质 | |
US20230047459A1 (en) | Method and system for analyzing viewing direction of electronic component, computer program product with stored program, and computer readable medium with stored program | |
Tamagawa et al. | Table reference based acceleration of a lithography hotspot detection method based on approximate string search |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |