CN111159499B - 一种基于字符串间相似性的电力系统模型搜索排序方法 - Google Patents

一种基于字符串间相似性的电力系统模型搜索排序方法 Download PDF

Info

Publication number
CN111159499B
CN111159499B CN201911423962.7A CN201911423962A CN111159499B CN 111159499 B CN111159499 B CN 111159499B CN 201911423962 A CN201911423962 A CN 201911423962A CN 111159499 B CN111159499 B CN 111159499B
Authority
CN
China
Prior art keywords
character
character string
similarity
string
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911423962.7A
Other languages
English (en)
Other versions
CN111159499A (zh
Inventor
赵增涛
张豪
李定林
佘俊
陈满
高彦明
彭煜民
贺儒飞
王文辉
向正林
叶复萌
毛允娴
王方
谢天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peak and Frequency Regulation Power Generation Co of China Southern Power Grid Co Ltd
Original Assignee
Peak and Frequency Regulation Power Generation Co of China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Peak and Frequency Regulation Power Generation Co of China Southern Power Grid Co Ltd filed Critical Peak and Frequency Regulation Power Generation Co of China Southern Power Grid Co Ltd
Priority to CN201911423962.7A priority Critical patent/CN111159499B/zh
Publication of CN111159499A publication Critical patent/CN111159499A/zh
Application granted granted Critical
Publication of CN111159499B publication Critical patent/CN111159499B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • G06F16/90344Query processing by using string matching techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于字符串间相似性的电力系统模型搜索排序方法,包括采集具有相似性的两个字符串;构造两个分别与两个字符串长度相等的权重数组,初始化后计算各个权重数组各元素之和;遍历两个字符串,获取字符在两个字符串中的重现范围,并根据重现情况调整其中一权重数组中字符对应的相似权重值;再根据字符串T2中每个字符在字符串T1的重现范围分别计算每个字符的权重乘积和,由字符的权重乘积和计算两个字符串的相似性,根据相似性值O的大小在电力系统模型搜索中进行字符串排序。本发明显著提升电网模型数据搜索结果排序的准确性。

Description

一种基于字符串间相似性的电力系统模型搜索排序方法
技术领域
本发明涉及计算机数据处理领域,特别涉及一种基于字符串间相似性的电力系统模型搜索排序方法。
背景技术
电力系统模型数据是电力企业的核心数据,调控、监测、运维、建设等各项生产活动都需要借助模型数据,将各项其它数据关联起来。一个适用于电力系统模型数据搜索的搜索服务,能帮助用户从繁多的模型数据中快速搜索、定位数据将非常有意义。而搜索结果排序是搜索服务中直接影响搜索结果好坏的一个重要环节,其中字符串相似性是排序中的一项重要因素。一般的按关键词命中次数,或者常见的字符串相似性计算方法(比如,cosine距离,Jaro-Winkler距离等)都不能很好的体现电力系统模型数据的相似性特点。这些特点总体可归纳为以下几点:
(1)相同的字词,越多越相似;
(2)相同字词之间的顺序,越相同越相似;
(3)字数越接近越相似;
(4)连续相同的字数,越多越相似;
(5)字符串右侧字符匹配比左段字符匹配具有更高的相似性。
上述第(5)条源自电力模型搜索的一个特点。电力模型的搜索中很大一部分是用根据名称和路径名来搜索功能位置。这部分数据一般是以类型结尾,比如“XXX开关”、“XXX开关间隔”、“XXX开关柜”。用户以名称来搜索时,往往也会在搜索字符串的最后出现类型。当用户输入“ABC开关”搜索时,“ABCD开关”比“ABC开关柜”,“XXX站/35kV/XXX开关间隔/ABC开关”比“XXX站/35kV/ABC开关间隔/XXX开关”更接近期望,更应该排在前面。描述成字符串相似性上的期望即上述第(5)条。本发明所描述的字符串相似性计算方法,能在计算过程和结果中很好体现上述特点。
发明内容
本发明的主要目的是提出一种基于字符串间相似性的电力系统模型搜索排序方法,旨在克服以上问题。
为实现上述目的,本发明提出的一种基于字符串间相似性的电力系统模型搜索排序方法,包括如下步骤:
S10采集电力系统模型中彼此具有相似性的文本分别为字符串T1和字符串T2,字符串T1中第j个字符为T1[j],共有L1个字符;字符串T2中第i个字符为T2[i],共有L2个字符,其中L1≤L2
S20定义字符串T1中第j个字符的相似权重值为W1[j],得到字符串T1的相似权重数组W1;定义字符串T2中第i个字符的相似权重值为W2[i],得到字符串T2的相似权重数组W2,初始化相似权重数组W1和W2
S30计算相似权重数组W1初始化的和
Figure BDA0002353080570000021
计算相似权重数组W2初始化的和
Figure BDA0002353080570000022
S40遍历字符串T1和T2的字符,并获取字符串T2中每个字符在字符串T1的重现范围,根据所获取的重现情况调整相似权重数组W2中字符对应的相似权重值;
S50遍历字符串T1和T2的字符,并根据字符串T2中每个字符在字符串T1的重现范围分别计算每个字符的权重乘积和;
S60构建字符串T1与字符串T2的相似性目标函数并计算相似性值O:
O=sum(Q)/(SW1*SW2),其中sum(Q)为所有字符的权重乘积和的累加值;
S70根据相似性值O的大小在电力系统模型搜索中进行字符串排序。
优选地,所述S40中遍历字符串T1和T2的字符,并获取字符串T2中每个字符在字符串T1的重现范围的方法包括:
S401遍历字符串T1和T2的字符,若字符T2[i]≠T1[j],则T2[i]对应的权重值W2[i]记作W2i;若字符串T2中第i个字符T2[i]=T1[j],则字符T2[i]对应的权重值不变;
S402若T2[i]=T1[j],则分别比较字符串T1中从第j个字符起的向前字符和字符串T2中从第i个字符起的向前字符是否相同;及比较字符串T1中从第j个字符起的向后字符和字符串T2中从第i个字符起的向后字符是否相同;
S403若字符串T1中从第j个字符起向前第d个字符和字符串T2中从第i个字符起向前的第d个字符不相同,则停止当前比较,得到字符重现范围的下确界d;若字符串T1中从第j个字符起向后第u个字符和字符串T2中从第i个字符起向后第u个字符不相同,则停止当前比较,得到字符重现范围的上确界u;由字符重现范围的下确界d和上确界u,得到字符在字符串T2中重现范围[i+d,i+u]。
优选地,所述S40中根据所获取的重现情况调整相似权重数组W2中字符对应的相似权重值的方法包括:
S404若T2[i]是字符串T2中第k个在字符串T1中不存在的字符,则将T2[i]对应的权重值W2[i]调整为k;
S405若i<L2,则将权重数组W2中第i个之后的所有权重值W2[r]设置为W2[r]+(W2i-W2[i])/(L2-i),i<r≤L2
优选地,所述S50中每个字符的权重乘积和,具体计算公式如下:
Q[j]=W1[j]*sum(W2i,i+d,i+u),
其中,sum(W2i,i+d,i+u)为第i个字符在字符串T2的重现范围[i+d,i+u]内的相似权重值之和。
优选地,若所述字符串T2中的字符在字符串T1中多次重现,则分别计算字符的所有重现情况的权重乘积和并取其中最大的计算结果为该字符的权重乘积和。
优选地,若所述字符串T2中的字符在字符串T1中找不到相同的字符,则视该字符的权重乘积和为0。
优选地,所述初始化相似权重数组W1和W2的方法为:
权重数组W1中第j个相似权重值W1j取值为L1+j;
权重数组W2中第i个相似权重值W2i取值为L2+i。
优选地,所述初始化相似权重数组W1和W2后。W1的权重值大于W2的权重值。
优选地,所述Q[j]的长度与字符串T1的字符数量L1相同。
优选地,所述S10之后,所述S20之前还包括:
S80若字符串T1的字符数量L1大于字符串T2的字符数量L2,则交换字符串T1和字符串T2的位置。
本发明技术方案借用乘法分配律的思想,将两个字符串T1和T2对应看成乘法分配律中的两组字符组合,两组字符之间相乘如同两个字符串的相互比较,以此来计算两个字符串T1和T2间的相似性。两个字符串计算相似性的时候,需要给两个字符串分别构造出与其长度相同的权重数组,然后通过比较两个字符串中的字符匹配与否,调整相关字符的权重,以及控制一个字符的权重和另一组字符串的权重数组的哪些元素相乘来计算电力系统模型中字符串的相似性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图示出的结构获得其他的附图。
图1为本发明一实施例的方法流程图;
图2为本发明的权重数组初始化示例图;
图3为本发明的权重衰减、分摊和计算示例图,
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,若本发明实施例中有涉及方向性指示(诸如上、下、左、右、前、后……),则该方向性指示仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,若本发明实施例中有涉及“第一”、“第二”等的描述,则该“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
如图1-2所示,本发明提出的一种基于字符串间相似性的电力系统模型搜索排序方法,包括如下步骤:
S10采集电力系统模型中彼此具有相似性的文本分别为字符串T1和字符串T2,字符串T1中第j个字符为T1[j],共有L1个字符;字符串T2中第i个字符为T2[i],共有L2个字符,其中L1≤L2
S20定义字符串T1中第j个字符的相似权重值为W1[j],得到字符串T1的相似权重数组W1;定义字符串T2中第i个字符的相似权重值为W2[i],得到字符串T2的相似权重数组W2,初始化相似权重数组W1和W2
S30计算相似权重数组W1初始化的和
Figure BDA0002353080570000051
计算相似权重数组W2初始化的和
Figure BDA0002353080570000052
S40遍历字符串T1和T2的字符,并获取字符串T2中每个字符在字符串T1的重现范围,根据所获取的重现情况调整相似权重数组W2中字符对应的相似权重值;
S50遍历字符串T1和T2的字符,并根据字符串T2中每个字符在字符串T1的重现范围分别计算每个字符的权重乘积和;
S60构建字符串T1与字符串T2的相似性目标函数并计算相似性值O:
O=sum(Q)/(SW1*SW2),其中sum(Q)为所有字符的权重乘积和的累加值;
S70根据相似性值O的大小在电力系统模型搜索中进行字符串排序。
在本发明实施例中,本发明;
优选地,所述S40中遍历字符串T1和T2的字符,并获取字符串T2中每个字符在字符串T1的重现范围的方法包括:
S401遍历字符串T1和T2的字符,若字符T2[i]≠T1[j],则T2[i]对应的权重值W2[i]记作W2i;若字符串T2中第i个字符T2[i]=T1[j],则字符T2[i]对应的权重值不变;
S402若T2[i]=T1[j],则分别比较字符串T1中从第j个字符起的向前字符和字符串T2中从第i个字符起的向前字符是否相同;及比较字符串T1中从第j个字符起的向后字符和字符串T2中从第i个字符起的向后字符是否相同;
S403若字符串T1中从第j个字符起向前第d个字符和字符串T2中从第i个字符起向前的第d个字符不相同,则停止当前比较,得到字符重现范围的下确界d;若字符串T1中从第j个字符起向后第u个字符和字符串T2中从第i个字符起向后第u个字符不相同,则停止当前比较,得到字符重现范围的上确界u;由字符重现范围的下确界d和上确界u,得到字符在字符串T2中重现范围[i+d,i+u]。
优选地,所述S40中根据所获取的重现情况调整相似权重数组W2中字符对应的相似权重值的方法包括:
S404若T2[i]是字符串T2中第k个在字符串T1中不存在的字符,则将T2[i]对应的权重值W2[i]调整为k;
S405若i<L2,则将权重数组W2中第i个之后的所有权重值W2[r]设置为W2[r]+(W2i-W2[i])/(L2-i),i<r≤L2
优选地,所述S50中每个字符的权重乘积和,具体计算公式如下:
Q[j]=W1[j]*sum(W2i,i+d,i+u),
其中,sum(W2i,i+d,i+u)为第i个字符在字符串T2的重现范围[i+d,i+u]内的相似权重值之和。
优选地,若所述字符串T2中的字符在字符串T1中多次重现,则分别计算字符的所有重现情况的权重乘积和并取其中最大的计算结果为该字符的权重乘积和。
优选地,若所述字符串T2中的字符在字符串T1中找不到相同的字符,则视该字符的权重乘积和为0。
优选地,所述初始化相似权重数组W1和W2的方法为:
权重数组W1中第j个相似权重值W1j取值为L1+j;
权重数组W2中第i个相似权重值W2i取值为L2+i。
优选地,所述初始化相似权重数组W1和W2后。W1的权重值大于W2的权重值。
优选地,所述Q[j]的长度与字符串T1的字符数量L1相同。
优选地,所述S10之后,所述S20之前还包括:
S80若字符串T1的字符数量L1大于字符串T2的字符数量L2,则交换字符串T1和字符串T2的位置。
结合图1和图2,本发明的实操实例:
(1.1)设字符串T1为“变压器”,字符串T2为“#2变压器”,字符串T1的字符数量L1=3,字符串T2的字符数量L2=5,满足要求L1≤L2;
(1.2)构造字符串T1对应的权重数组W1并初始化,使得W1=[4,5,6];构造字符串T2对应的权重数组W2并初始化,使得W2=[6,7,8,9,10],计算出权重数组W1的各个元素之和sw1=15,计算出权重数组W2的各个元素之和sw2=40,如图1所示;
(1.3)遍历字符串T2中的字符,根据字符在字符串T1中存在与否,调整权重数组W2中的各个权重值。字符串T2中的第1个字符“#”在字符串T1中不存在,所以将权重数组W2的第1个元素赋值为1,与原来的6相比,减少了5,将5平分给后面的4个元素,每个元素得到1.25,所以现在权重数组W2={1,8.25,9.25,10.25,11.25};字符串T2中的第2个字符“1”在字符串T1中不存在,它是第2个不匹配的字符,所以将权重数组W2的第2个元素赋值为2,与上一步的8.25相比,减少了6.25,将6.25平分给后面的3个元素,每个元素得到约2.08(这里为了表示方便采用了约等于来精简小数,在计算机计算过程中不用进行约等于操作),所以现在权重数组W2={1,2,11.33,12.33,13.33};后面三个字符“变”、“压”、“器”都能匹配上,相应的权重值不用调整;
(1.4)遍历字符串T1中的字符,分别计算每个字符的权重乘积和。字符串T1中的第1个字符“变”和字符串T2中的第3个字符相同,且右侧的两个字符“压”和“器”连续相匹配,所以字符“变”的乘积和为4×11.33+4×12.33+4×13.33=4×(11.33+12.33+13.33)≈4×37=148;字符串T1中的第2个字符“压”和字符串T2中的第4个字符相同,且左侧的“变”和右侧的“器”都能匹配上,所有字符“压”的乘积和为5×11.33+5×12.33+5×13.33=5×(11.33+12.33+13.33)≈5×37=185;字符串T1中的第3个字符“器”和字符串T2中的第5个字符相同,且左侧的“压”和“变”连续都能匹配上,所以字符“器”的乘积和为6×11.33+6×12.33+6×13.33=6×(11.33+12.33+13.33)≈6×37=222。得到乘积和数组Q={148,185,222};
(1.5)相似性计算结果O=sum(Q)/(sw1×sw2)=555/(15×40)=0.925。
至此,得到了字符串“变压器”和字符串“#1变压器”的相似性计算结果为0.925。为了对比,按上述步骤,再计算出“变压器”和“变压器套管”的相似性计算结果为315/(15×40)=0.525。所以当用户搜“变压器”的时候,根据相似性计算结果,“#1变压器”将排在“变压器套管”前面。
可见,本发明提供一种电力系统模型字符串相似性的计算方法,通过设置权重数组的初始化值右侧比左侧大,以及不匹配字符的权重衰减和衰减掉的部分权重在右侧均分的权重调整方法,实现了“右侧字符匹配上比左侧字符匹配上更相似”的目标,符合电力系统模型数据右侧通常是类型数据以及搜索过程中强调类型的特点,能显著提升电网模型数据搜索结果排序的准确性。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是在本发明的发明构思下,利用本发明说明书及附图内容所作的等效结构变换,或直接/间接运用在其他相关的技术领域均包括在本发明的专利保护范围内。

Claims (10)

1.一种基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,包括如下步骤:
S10采集电力系统模型中彼此具有相似性的文本分别为字符串T 1和字符串T 2,字符串T 1中第j个字符为T 1[j],共有L 1个字符;字符串T 2中第i个字符为T 2[i],共有L 2个字符,其中L 1L 2
S20定义字符串T 1中第j个字符的相似权重值为W 1[j],得到字符串T 1的相似权重数组W 1;定义字符串T 2中第i个字符的相似权重值为W 2[i],得到字符串T 2的相似权重数组W 2,初始化相似权重数组W 1W 2
S30计算相似权重数组W 1初始化的和
Figure 556815DEST_PATH_IMAGE001
,计算相似权重数组W 2初始化的和
Figure 753441DEST_PATH_IMAGE002
S40遍历字符串T 1T 2的字符,并获取字符串T 2中每个字符在字符串T 1的重现范围,根据所获取的重现情况调整相似权重数组W 2中字符对应的相似权重值;
S50遍历字符串T 1T 2的字符,并根据字符串T 2中每个字符在字符串T 1的重现范围分别计算每个字符的权重乘积和;
S60构建字符串T 1与字符串T 2的相似性目标函数并计算相似性值O:
Figure 773350DEST_PATH_IMAGE003
,其中
Figure 838258DEST_PATH_IMAGE004
为所有字符的权重乘积和的累加值;
S70根据相似性值O的大小在电力系统模型搜索中进行字符串排序。
2.如权利要求1所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述S40中遍历字符串T 1T 2的字符,并获取字符串T 2中每个字符在字符串T 1的重现范围的方法包括:
S401遍历字符串T 1T 2的字符,若字符
Figure 627222DEST_PATH_IMAGE005
,则T 2[i]对应的权重值W 2[i]记作W 2i ;若字符串T 2中第i个字符
Figure 260329DEST_PATH_IMAGE006
,则字符T 2[i]对应的权重值不变;
S402若
Figure 501954DEST_PATH_IMAGE007
,则分别比较字符串T 1中从第j个字符起的向前字符和字符串T 2中从第i个字符起的向前字符是否相同;及比较字符串T 1中从第j个字符起的向后字符和字符串T 2中从第i个字符起的向后字符是否相同;
S403若字符串T 1中从第j个字符起向前第d个字符和字符串T 2中从第i个字符起向前的第d个字符不相同,则停止当前比较,得到字符重现范围的下确界d;若字符串T 1中从第j个字符起向后第u个字符和字符串T 2中从第i个字符起向后第u个字符不相同,则停止当前比较,得到字符重现范围的上确界u;由字符重现范围的下确界d和上确界u,得到字符在字符串T 2中重现范围
Figure 42657DEST_PATH_IMAGE008
3.如权利要求2所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述S40中根据所获取的重现情况调整相似权重数组W 2中字符对应的相似权重值的方法包括:
S404若T 2[i]是字符串T 2中第k个在字符串T 1中不存在的字符,则将T 2[i]对应的权重值W 2[i]调整为k;
S405若
Figure 764756DEST_PATH_IMAGE009
,则将权重数组W 2中第i个之后的所有权重值W 2[r]设置为
Figure 365502DEST_PATH_IMAGE010
Figure 297686DEST_PATH_IMAGE011
4.如权利要求2所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述S50中每个字符的权重乘积和,具体计算公式如下:
Figure 642080DEST_PATH_IMAGE012
其中,
Figure 467953DEST_PATH_IMAGE013
为第i个字符在字符串T 2的重现范围
Figure 505179DEST_PATH_IMAGE014
内的相似权重值之和。
5.如权利要求4所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,若所述字符串T 2中的字符在字符串T 1中多次重现,则分别计算字符的所有重现情况的权重乘积和并取其中最大的计算结果为该字符的权重乘积和。
6.如权利要求4所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,若所述字符串T 2中的字符在字符串T 1中找不到相同的字符,则视该字符的权重乘积和为0。
7.如权利要求1所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述初始化相似权重数组W 1W 2的方法为:
权重数组W 1中第j个相似权重值W 1j取值为
Figure 659080DEST_PATH_IMAGE015
权重数组W 2中第i个相似权重值W 2i 取值为
Figure 541585DEST_PATH_IMAGE016
8.如权利要求7所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述初始化相似权重数组W 1W 2后,W 1的权重值大于W 2的权重值。
9.如权利要求4所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述
Figure 159649DEST_PATH_IMAGE017
的长度与字符串T 1的字符数量L 1相同。
10.如权利要求1所述的基于字符串间相似性的电力系统模型搜索排序方法,其特征在于,所述S10之后,所述S20之前还包括:
S80若字符串T 1的字符数量L 1大于字符串T 2的字符数量L 2,则交换字符串T 1和字符串T 2的位置。
CN201911423962.7A 2019-12-31 2019-12-31 一种基于字符串间相似性的电力系统模型搜索排序方法 Active CN111159499B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911423962.7A CN111159499B (zh) 2019-12-31 2019-12-31 一种基于字符串间相似性的电力系统模型搜索排序方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911423962.7A CN111159499B (zh) 2019-12-31 2019-12-31 一种基于字符串间相似性的电力系统模型搜索排序方法

Publications (2)

Publication Number Publication Date
CN111159499A CN111159499A (zh) 2020-05-15
CN111159499B true CN111159499B (zh) 2022-04-29

Family

ID=70560645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911423962.7A Active CN111159499B (zh) 2019-12-31 2019-12-31 一种基于字符串间相似性的电力系统模型搜索排序方法

Country Status (1)

Country Link
CN (1) CN111159499B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718325B1 (en) * 2000-06-14 2004-04-06 Sun Microsystems, Inc. Approximate string matcher for delimited strings
CN105630767A (zh) * 2015-12-22 2016-06-01 北京奇虎科技有限公司 一种文本相似性的比较方法以及装置
EP3107006A1 (en) * 2015-06-18 2016-12-21 Baidu Online Network Technology (Beijing) Co., Ltd Search engine and method for implementing the same
CN108132929A (zh) * 2017-12-25 2018-06-08 上海大学 一种海量非结构化文本的相似性计算方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005051617B4 (de) * 2005-10-27 2009-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Automatisches, computerbasiertes Ähnlichkeitsberechnungssystem zur Quantifizierung der Ähnlichkeit von Textausdrücken

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6718325B1 (en) * 2000-06-14 2004-04-06 Sun Microsystems, Inc. Approximate string matcher for delimited strings
EP3107006A1 (en) * 2015-06-18 2016-12-21 Baidu Online Network Technology (Beijing) Co., Ltd Search engine and method for implementing the same
CN105630767A (zh) * 2015-12-22 2016-06-01 北京奇虎科技有限公司 一种文本相似性的比较方法以及装置
CN108132929A (zh) * 2017-12-25 2018-06-08 上海大学 一种海量非结构化文本的相似性计算方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于敏感信息的藏文文本摘要提取的研究;南奎娘若等;《网络安全技术与应用》;20160430;第58-59页 *

Also Published As

Publication number Publication date
CN111159499A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
CN106547871B (zh) 基于神经网络的搜索结果的召回方法和装置
CN100476814C (zh) 用于识别与Web站点内容相关的项的方法和计算设备
CA2340008C (en) Method and apparatus for retrieving, accumulating, and sorting table-formatted data
US20150081683A1 (en) Ranking search results based on word weight
CN107704102B (zh) 一种文本输入方法及装置
US20030115193A1 (en) Information searching method of profile information, program, recording medium, and apparatus
CN111538908A (zh) 搜索排序方法、装置、计算机设备和存储介质
US11386081B2 (en) System and method for facilitating efficient indexing in a database system
WO2014160648A1 (en) Ranking product search results
CN101496003A (zh) 社交网络中用户的兼容性评分
CN111291165B (zh) 训练词向量嵌入模型的方法及装置
CN107220368B (zh) 图像检索方法及装置
US8732187B1 (en) Link-based ranking of objects that do not include explicitly defined links
CN111159499B (zh) 一种基于字符串间相似性的电力系统模型搜索排序方法
CN114175017A (zh) 模型构建方法、分类方法、装置、存储介质及电子设备
US7805667B2 (en) System and method for identifying target node graphs from predetermined seed node subsets
KR20210090706A (ko) 정렬
CN112925872A (zh) 一种数据搜索方法和装置
CN112241407B (zh) 高尔夫球场会员数据处理方法、客户管理系统及存储介质
CN115391659A (zh) 新闻推荐方法、装置、电子设备及计算机可读存储介质
JP7302229B2 (ja) データ管理システム、データ管理方法、およびデータ管理プログラム
CN109857859B (zh) 新闻信息的处理方法、装置、设备以及存储介质
KR20150008635A (ko) 핵심 키워드 선정 장치, 핵심 키워드 선정 방법 및 이를 이용한 검색 서비스 제공 방법
CN114385714A (zh) 基于反馈的多排序融合方法、装置、设备及可读存储介质
CN108470181B (zh) 一种基于加权序列关系的Web服务替换方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20200515

Assignee: WEIHAI CIMSTECH Co.,Ltd.

Assignor: Energy Storage Research Institute of China Southern Power Grid Peak Regulation and Frequency Regulation Power Generation Co.,Ltd.

Contract record no.: X2024980001725

Denomination of invention: A Search and Sorting Method for Power System Models Based on the Similarity between Strings

Granted publication date: 20220429

License type: Common License

Record date: 20240131

Application publication date: 20200515

Assignee: BEIJING HUAKE TONGAN MONITOR TECHNOLOGY CO.,LTD.

Assignor: Energy Storage Research Institute of China Southern Power Grid Peak Regulation and Frequency Regulation Power Generation Co.,Ltd.

Contract record no.: X2024980001724

Denomination of invention: A Search and Sorting Method for Power System Models Based on the Similarity between Strings

Granted publication date: 20220429

License type: Common License

Record date: 20240131