CN109740125B - 用于文件比较的更新查找方法、装置、存储介质和设备 - Google Patents

用于文件比较的更新查找方法、装置、存储介质和设备 Download PDF

Info

Publication number
CN109740125B
CN109740125B CN201811625251.3A CN201811625251A CN109740125B CN 109740125 B CN109740125 B CN 109740125B CN 201811625251 A CN201811625251 A CN 201811625251A CN 109740125 B CN109740125 B CN 109740125B
Authority
CN
China
Prior art keywords
file
common
elements
gap
common element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811625251.3A
Other languages
English (en)
Other versions
CN109740125A (zh
Inventor
韩志刚
宋洋
于广伟
姜楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Neusoft Corp
Original Assignee
Neusoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Neusoft Corp filed Critical Neusoft Corp
Priority to CN201811625251.3A priority Critical patent/CN109740125B/zh
Publication of CN109740125A publication Critical patent/CN109740125A/zh
Application granted granted Critical
Publication of CN109740125B publication Critical patent/CN109740125B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开涉及一种用于文件比较的更新查找方法、装置、存储介质和设备,该方法包括:在第一文件和第二文件中以每个预设单位的内容作为一个元素,对第一文件和第二文件进行对比,以获取第一文件与第二文件的最长公共子序列;在根据最长公共子序列将第一文件中的共通元素与第二文件中的共通元素进行索引对齐后,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和所述第二文件中的更新元素。能够不依赖于复杂算法实现文件之间的对比和共通内容的对齐,从而能够根据对齐的共通内容查找文件之间的更新内容,能够降低实现难度,易于实现。

Description

用于文件比较的更新查找方法、装置、存储介质和设备
技术领域
本公开涉及文本处理技术领域,具体地,涉及一种用于文件比较的更新查找方法、装置、存储介质和电子设备。
背景技术
在日常应用中,文件或文本的比较在很多领域都是一个比较常见的需求。例如对比两个文件中的两篇文章(例如对比两个word文件),或者对比两个文件中的代码(例如两个脚本中的代码差异)等等。进行文件比对的目的通常是为了实现两个文件的行或段落的对齐,从而找到内容相关性和差异。
由于通过文件对比能够帮助用户快速地找到两个文件中的相关性和差异,因此无论是对于个人还是多人协作,文件对比都是日常应用中的一个重要功能,能够提高用户的工作效率。例如在目前的软件开发中,基本都是由多人协作开发完成,因此对于其他人修改的文件,通过文件比较可以快速地找到相同的内容,并定位差异的位置,从而方便协作人员进行后续处理,降低开发人员的工作量。
目前,现有的通过进行文件对比来查找两个文件之间更新的部分(更新可以理解为两个文件之间的完全不同的内容,以及不完全相同的内容,即两个文件部分相同内容相同,但也存在部分内容或属性不同的地方),基本都是基于比较复杂的算法实现,实现难度大。
发明内容
本公开的目的是提供一种用于文件比较的更新查找方法、装置、存储介质和电子设备,用于解决现有的更新查找方法的算法复杂,实现难度大的问题。
为了实现上述目的,本公开的第一方面,提供一种用于文件比较的更新查找方法,所述方法包括:
在第一文件和第二文件中以每个预设单位的内容作为一个元素,对所述第一文件和所述第二文件进行对比,以获取所述第一文件与所述第二文件的最长公共子序列;
在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
可选地,所述方法还包括:
将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同;
通过将所述第一文件和所述第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定所述每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
可选地,所述在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素,包括:
根据所述最长公共子序列,确定所述第一文件中的共通元素和删除元素,以及所述第二文件中的共通元素和添加元素,所述删除元素为所述第一文件中除所述共通元素之外的其他元素,所述添加元素为所述第二文件中除所述共通元素之外的其他元素;
通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐;
在所述第一文件中的共通元素与所述第二文件中的共通元素索引对齐后,确定所述第一文件中共通元素间隙与所述第二文件中的共通元素间隙的位置对应关系;
根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
可选地,所述根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素,包括:
当在所述第一文件中的共通元素的第一间隙处存在n个删除元素,且在所述第二文件中的共通元素的第二间隙处存在m个添加元素时,将所述第一间隙中的所述n个删除元素和所述第二间隙中的所述m个添加元素确定为更新元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;
将所述第一间隙中的所述n个删除元素的索引与所述第二间隙中的所述m个添加元素的索引建立对应关系。
可选地,所述将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同,包括:
将所述第一文件中的第一共通元素中的每个字符与所述第二文件中的第二共通元素中的对应字符进行属性对比,以确定所述第一共通元素与所述第二共通元素中是否存在属性不同的字符,所述第一共通元素为所述第一文件中的任一共通元素,所述第二共通元素是所述第二文件中与所述第一共通元素索引对齐的共通元素;
当所述第一共通元素与所述第二共通元素中存在至少一个属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为属性更新;
当所述第一共通元素与所述第二共通元素中不存在属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为完全相同。
可选地,所述通过将所述第一文件和所述第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定所述每对共通元素间隙中的更新元素的共通内容、删除内容、添加内容和更新内容,包括:
将所述第一文件中的共通元素的第一间隙中的n个删除元素合并为第一元素;
将所述第二文件中的共通元素的第二间隙中的m个添加元素合并为第二元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;
将所述第一元素和所述第二元素进行字符对比,以确定所述第一元素和所述第二元素的共通字符、删除字符、添加字符和更新字符。
第二方面,提供一种用于文件比较的更新查找装置,所述装置包括:
对比模块,用于在第一文件和第二文件中以每个预设单位的内容作为一个元素,对所述第一文件和所述第二文件进行对比,以获取所述第一文件与所述第二文件的最长公共子序列;
更新确定模块,用于在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
可选地,所述装置还包括:
第一更新识别模块,用于将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同;
第二更新识别模块,用于将所述第一文件和第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定所述每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
可选地,所述更新确定模块,包括:
元素识别子模块,用于根据所述最长公共子序列,确定所述第一文件中的共通元素和删除元素,以及所述第二文件中的共通元素和添加元素,所述删除元素为所述第一文件中除所述共通元素之外的其他元素,所述添加元素为所述第二文件中除所述共通元素之外的其他元素;
元素对齐子模块,用于通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐;
间隙对应子模块,用于在所述第一文件中的共通元素与所述第二文件中的共通元素索引对齐后,确定所述第一文件中共通元素间隙与所述第二文件中的共通元素间隙的位置对应关系;
元素确定子模块,用于根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
可选地,所述元素确定子模块,用于:
当在所述第一文件中的共通元素的第一间隙处存在n个删除元素,且在所述第二文件中的共通元素的第二间隙处存在m个添加元素时,将所述第一间隙中的所述n个删除元素和所述第二间隙中的所述m个添加元素确定为更新元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;
将所述第一间隙中的所述n个删除元素的索引与所述第二间隙中的所述m个添加元素的索引建立对应关系。
可选地,所述第一更新识别模块,包括:
属性对比子模块,用于将所述第一文件中的第一共通元素中的每个字符与所述第二文件中的第二共通元素中的对应字符进行属性对比,以确定所述第一共通元素与所述第二共通元素中是否存在属性不同的字符,所述第一共通元素为所述第一文件中的任一共通元素,所述第二共通元素是所述第二文件中与所述第一共通元素索引对齐的共通元素;
确定子模块,用于当所述第一共通元素与所述第二共通元素中存在至少一个属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为属性更新;
所述确定子模块,还用于当所述第一共通元素与所述第二共通元素中不存在属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为完全相同。
可选地,所述第二更新识别模块,包括:
合并子模块,用于将所述第一文件中的共通元素的第一间隙中的n个删除元素合并为第一元素;
所述合并子模块,还用于将所述第二文件中的共通元素的第二间隙中的m个添加元素合并为第二元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;
字符对比子模块,用于将所述第一元素和所述第二元素进行字符对比,以确定所述第一元素和所述第二元素的共通字符、删除字符、添加字符和更新字符。
第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的第一方面所述方法的步骤。
第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现上述的第一方面所述方法的步骤。
在上述技术方案中,通过在第一文件和第二文件中以每个预设单位的内容作为一个元素,对第一文件和第二文件进行对比,以获取第一文件与第二文件的最长公共子序列;在根据最长公共子序列将第一文件中的共通元素与第二文件中的共通元素进行索引对齐后,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和所述第二文件中的更新元素。通过上述技术方案,能够不依赖于复杂算法实现文件之间的对比和共通内容的对齐,从而能够根据对齐的共通内容查找文件之间的更新内容,能够降低实现难度,易于实现。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种用于文件比较的更新查找方法的流程示意图;
图2是根据本公开一示例性实施例示出的另一种用于文件比较的更新查找方法的流程示意图;
图3是根据本公开一示例性实施例示出的另一种用于文件比较的更新查找方法的流程示意图;
图4是根据本公开一示例性实施例示出的一种更新行确定方法的示意图;
图5是根据本公开一示例性实施例示出的又一种用于文件比较的更新查找方法的流程示意图;
图6是根据本公开一示例性实施例示出的又一种用于文件比较的更新查找方法的流程示意图;
图7是根据本公开一示例性实施例示出的一种更新行的标记方法的示意图;
图8是根据本公开一示例性实施例示出的一种用于文件比较的更新查找装置的框图;
图9是根据本公开一示例性实施例示出的一种更新确定模块的框图;
图10是根据本公开一示例性实施例示出的一种第一更新识别模块的框图;
图11是根据本公开一示例性实施例示出的一种第二更新识别模块的框图;
图12是根据一示例性实施例示出的一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
图1是根据本公开一示例性实施例示出的一种用于文件比较的更新查找方法的流程示意图,如图1所示,该方法包括:
步骤101,在第一文件和第二文件中以每个预设单位的内容作为一个元素,对第一文件和所述第二文件进行对比,以获取第一文件与第二文件的最长公共子序列。
其中,在进行第一文件和第二文件的对比之前,首先需要将第一文件和第二文件进行序列化,序列化可以理解为是在文件中以每个预设单位的内容作为一个元素,从而一个文件就可以看作是由多个上述元素按顺序组成的一个元素序列。示例的,上述第一文件和第二文件可以是记录有文字或者代码的文件,该预设单位内容可以是词语、句子、行或段落等等,其可以根据需要来设置,即可以将一个词、一句话、一行或一段作为一个整体看待,当作一个元素。
步骤102,在根据最长公共子序列将第一文件中的共通元素与第二文件中的共通元素进行索引对齐后,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和第二文件中的更新元素。
其中,该共通元素间隙指两个共通元素之间的间隙,还包括首个共通元素之前的位置,以及最后一个共通元素之后的位置。
示例的,由于将该第一文件和第二文件以每个预设单位的内容作为一个元素,则可以得到第一文件对应的元素序列,以及第二文件对应的元素序列。然后按照第一文件对应的元素序列,以及第二文件对应的元素序列,对该第一文件和该第二文件进行对比可以确定第一文件与第二文件的最长公共子序列。其中,该最长公共子序列为该第一文件和该第二文件中的元素排列顺序一致的最大公共部分。
举例来说,假设以行作为该预设单位,则第一文件和第二文件中的每行就是上述的一个元素,如果用一个字母表示一行,则假设完成序列化的第一文件和第二文件可以分别表示为以下的序列:
第一文件=AAACCGTGAFTTATTCGTTCTAGA
第二文件=CACCCCTAAGGTACCTTTGGTT
其中,上述第一文件和第二文件中的每个字母均表示文件中的一行,字母在序列中的顺序就表示了该字母所表示的行在文件中的顺序。通过对比第一文件的序列和第二文件的序列即可确定,第一文件和第二文件的最长公共子序列。该最长公共子序列,即第一文件和第二文件中所拥有的行内容相同,且排列顺序一致的最长共有序列,因此可以确定该最长公共子序列,也即第一文件与第二文件的最长公共子序列为:S=ACCTAGTACTTTG。上述的上述预设单位也可以是词语、句子、行或段落,其确定最长公共子序列与行为单位时的方法相同,不再赘述。
而最长公共子序列中的元素就是第一文件和第二文件中的共通元素(可以标记为Common元素),第一文件中除了共通元素外的其他元素为删除元素(可以标记为Omitted元素),第二文件中除了共通元素外的其他元素为添加元素(可以标记为Added元素)。在确定了共通元素、删除元素和添加元素后,可以对第一文件和第二文件的共通元素进行对齐(也称为拉手)。在共通元素对齐后,也就能够确定第一文件和第二文件的共通元素间隙的位置对应关系,即确定了第一文件中的每个共通元素间隙在第二文件中对应的共通元素间隙,从而可以根据第一文件和第二文件的共通元素间隙中的元素来确定更新元素(可以标记为Changed元素)。
在本公开的各个实施例中,如果第一文件的某一共通元素间隙中存在至少一个删除元素,而第二文件的位置对应的共通元素间隙中存在至少一个添加元素,那么该删除元素和添加元素即为上述的更新元素。
进一步的,如图2所示,该方法还可以包括:
步骤103,将第一文件和第二文件中位置对应的每对共通元素进行字符对比,以确定每对共通元素是否完全相同。
其中,由于在进行文件对比时,通常是先忽略字符的属性的,因此共通元素是内容相同的元素,元素中的字符是否也是相同的尚未确定,因此在确定了两个文件共通元素后,可以将每对共通元素中的字符进行对比,当每对共通元素中的两个共通元素的字符的属性也完全相同时,可以将这对共通元素确定为完全相同(可以标记为Identical),如果这两个共通元素中存在至少一个字符的属性不同时,将这对共通元素确定为属性更新(可以标记为Updated)。其中,位置对应的一对共通元素是指第一文件和第二文件中已经索引对齐(即索引已建立对应关系)的两个共通元素。
步骤104,将第一文件和第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
示例的,基于上述步骤中的说明可知,一对共通元素间隙即指第一文件和第二文件中位置对应的两个共通元素间隙,更新元素是指是这两个文件中位置对应的两个共通元素间隙中存在的一组删除元素和添加元素,能够被确定为更新元素说明这一组元素中包括的删除元素和添加元素可能不同,或不完全相同。例如,以上述预设单位为行来举例,假设以A表示第一文件中的任一共通行间隙中的删除行,以B表示第二文件中与A位置对应(即在第一文件中A所在的共通行间隙与第二文件中B所在的共通行间隙是对应的)的添加行,则在确定A和B为更新行后,可以进一步将A中的每个字符与B中的对应位置的字符逐个进行对比,对比过程与上述在进行文件对比时所采用的方法相同,首先将A和B以字符为单位进行对比,获取A和B以字符为单位的最长公共子序列,最长公共子序列中的字符就是该A和B的共通字符,A中除了共通字符外的剩余字符就是删除字符,B中除了共通字符外的剩余字符就是添加字符,当A的某一共通字符间隙(指两个共通字符之间的缝隙,以及首个共通字符之前/最后一个共通字符之后的位置)中存在删除字符,且B中对应的共通字符间隙中存在添加字符,则这一组共通字符间隙中的删除字符和添加字符为更新字符。
通过上述技术方案,能够不依赖于复杂算法实现文件之间的对比和共通内容的对齐,从而能够根据对齐的共通内容查找文件之间的更新内容,能够降低实现难度,易于实现。
图3是根据本公开一示例性实施例示出的另一种用于文件比较的更新查找方法的流程示意图,如图3所示,步骤102所述的在根据最长公共子序列将第一文件中的共通元素与第二文件中的共通元素进行索引对齐后,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和第二文件中的更新元素的步骤,可以包括以下步骤:
步骤1021,根据最长公共子序列,确定第一文件中的共通元素和删除元素,以及第二文件中的共通元素和添加元素,删除元素为第一文件中除共通元素之外的其他元素,添加元素为第二文件中除共通元素之外的其他元素。
其中,该第一文件中的共通元素和第二文件中的共通元素就是该最长公共子序列,该删除元素为该第一文件中除该共通元素之外的其他元素,该添加元素为该第二文件中除该共通元素之外的其他元素。
还是以行作为上述的预设单位为例,则这里的共通元素为共通行,删除元素为删除行,添加元素为添加行,则以上述的第一文件的序列和第二文件的序列为例,第一文件和第二文件的共通行是:ACCTAGTACTTTG,则第一文件中的删除行是第一文件中的除了共通行之外的其他行,则删除行=AAGGTTTGCAA,第二文件中的添加行是第二文件中的除了共通行之外的其他行,则添加行=CCCAGCGTT。
步骤1022,通过将第一文件中的共通元素与第二文件中的共通元素建立索引对应关系,将第一文件中的共通元素与第二文件中的共通元素进行索引对齐。
在确定了共通元素、删除元素和添加元素后,可以对第一文件和第二文件的共通元素进行索引对齐(也称为拉手)。示例的,可以预先为第一文件和第二文件中的每个元素按照其在文件中的出现顺序设置索引号。例如,以行为上述预设单位为例,在第一文件中的为每行设置索引号(即行号),在第二文件中也为每行设置索引号。从而,在第一文件和第二文件中,每行都具备唯一的索引号。因此确定了第一文件和第二文件中的共通行后,通过将第一文件的共通行和第二文件中的共通行中的对应行(对应行可以理解为第一文件和第二文件的共通行中,出现顺序一致的行,例如第一文件的共通行ACCTAGTACTTTG中的第一个A对应第二文件的共通行ACCTAGTACTTTG中的第一个A)的索引号建立对应关系,即可实现第一文件与第二文件中的共通行的索引对齐。
步骤1023,在第一文件中的共通元素与第二文件中的共通元素索引对齐后,确定第一文件中共通元素间隙与第二文件中的共通元素间隙的位置对应关系。
步骤1024,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和所述第二文件中的更新元素。
在第一文件中的共通元素与第二文件中的共通元素进行对齐后,也就能够确定第一文件和第二文件的共通元素间隙的位置对应关系,即确定了第一文件中的每个共通元素间隙在第二文件中对应的共通元素间隙,从而可以根据第一文件和第二文件的共通元素间隙中的元素来确定更新元素。
其中,上述共通元素间隙可以包括:共通元素中任意两个元素之间的位置,共通元素的首个元素之前的位置,以及共通元素的最后一个元素之后的位置。共通元素间隙的位置对应关系可以理解为:如果在第一文件中的某个共通元素间隙的位置与第二文件中的某个共通元素间隙的位置是一致,就认为这两个间隙是对应的。因此,在确定第一文件中的删除元素,以及第二文件中的添加元素后,可以记录删除元素与相邻的共通元素之间的对应关系,以便记录删除元素所在的共通元素间隙,对于添加元素也是同理,可以以此记录添加元素所在的共通元素间隙。
在两个文件的位置对应的两个共通元素间隙中,如果只存在删除元素不存在添加元素,或者不存在删除元素只存在添加元素,对于这样的共通行间隙中的删除元素或添加元素不进行处理。而位置对应的共通元素间隙中既存在删除元素,又存在添加元素,那么可以确定为“更新”,即为我们需要确定的更新元素。
因此,步骤1024可以具体通过以下方式实现:
当在第一文件中的共通元素的第一间隙处存在n个删除元素,且在第二文件中的共通元素的第二间隙处存在m个添加元素时,将第一间隙中的n个删除元素和第二间隙中的m个添加元素确定为更新元素,该第一间隙是第一文件中的任一共通元素间隙,第二间隙是与第一间隙位置对应的共通元素间隙。并且,进一步的,可以将第一间隙中的n个删除元素的索引与第二间隙中的m个添加元素的索引建立对应关系,也就是将该n个删除元素与该m个添加元素作为更新元素进行拉手对齐。
以行为上述预设单位为例,则共通元素间隙为共通行间隙。例如,第一文件的共通行ACCTAGTACTTTG中的第一个A之前的位置与第二文件的共通行ACCTAGTACTTTG中的第一个A之前的位置对应,第一文件的共通行ACCTAGTACTTTG中的第一个A和第一个C之间的位置,与第二文件的共通行ACCTAGTACTTTG中的第一个A和第一个C之间的位置对应。
因此,根据第一文件=AAACCGTGAFTTATTCGTTCTAGA,和第二文件=CACCCCTAAGGTACCTTTGGTT来看,第一文件的共通行中的第一个A之前的位置中的删除行AA,与第二文件的共通行中的第一个A之前的位置中的添加行C在位置上是对应的,即删除行AA和添加行C处于位置对应的共通行间隙中。在第一文件的共通行中的第一个A和第一个C之间的位置中不存在删除行,第二文件的共通行中的第一个A和第一个C之间的位置中存在添加行CC,从而在共通行中的第一个A和第一个C之间的这个间隙中,不存在删除行,只存在添加行。以此类推,可以得到第一文件和第二文件的所有删除行和添加行在各个共通行间隙中之间的位置对应关系。
举例来说,图4是根据本公开一示例性实施例示出的一种更新行确定方法的示意图,如图4所示,在图中以每个字母表示一行,从而以序列的形式,分别示出了第一文件和第二文件,并且在第一文件对应的字母上方以及第二文件对应的字母下方,用“=”表示共通行“-”表示删除行,“+”表示添加行,“c”表示更新行(c表示change)。其中由于第一文件中的删除行和第二文件中的添加行无法对齐,因此不进行处理。根据第一文件和第二文件中的“c”符号可知,第一文件和第二文件中的更新行一共有三组,分别为AA和C,G和C,A和GTT。进一步的,可以将第一组中AA的索引与C的索引建立对应关系,将第二组中的G的索引和C的索引建立对应关系,将第三组中的A的索引和GTT的索引建立对应关系。
经过上述的步骤,就已经确定了第一文件和第二文件之间的共通元素、共通元素、删除元素、添加元素和更新元素。进一步的,可以通过步骤102来进一步对比共通元素是否完全相同。
图5是根据本公开一示例性实施例示出的又一种用于文件比较的更新查找方法的流程示意图,如图5所示,上述步骤103可以具体包括以下步骤:
步骤1031,将第一文件中的第一共通元素中的每个字符与第二文件中的第二共通元素中的对应字符进行属性对比,以确定第一共通元素与第二共通元素中是否存在属性不同的字符。
其中,该第一共通元素为第一文件中的任一共通元素,第二共通元素是第二文件中与第一共通元素索引对齐的共通元素。
步骤1032,当第一共通元素与第二共通元素中存在至少一个属性不同的字符时,将第一共通元素与第二共通元素确定为属性更新。
步骤1033,当第一共通元素与第二共通元素中不存在属性不同的字符时,将第一共通元素与第二共通元素确定为完全相同。
其中,字符的属性通常可以包括:字体、颜色、字号、是否加粗、是否有下划线、是否有字体特效(如有字体特效还包括特效类型)等等。例如,以上述的第一文件的共通行ACCTAGTACTTTG中的第一个A作为该第一共通元素,与第二文件的共通行ACCTAGTACTTTG中的第一个A为该第二共通元素为例,假设该第一共通元素和该第二共通元素的内容均为“123456789”,其中第一共通元素中的“2”颜色为红色,第二共通元素中的“2”颜色为蓝色,那么可以将该第一共通元素和该第二共通元素标记为属性更新;如果该第一共通元素和该第二共通元素中的“123456789”中的每个字符的字体类型、颜色、字号、是否有下划线、是否加粗等属性均完全一致时,可以将该第一共通元素和该第二共通元素标记为完全相同。
在另一方面,可以通过步骤104来进一步对比更新元素的字符,以找出一组更新元素之间的共通字符,删除字符,添加字符和更新字符。图6是根据本公开一示例性实施例示出的又一种用于文件比较的更新查找方法的流程示意图,如图6所示,上述步骤104可以包括:
步骤1041,将第一文件中的共通元素的第一间隙中的n个删除元素合并为第一元素。
步骤1042,将第二文件中的共通元素的第二间隙中的m个添加元素合并为第二元素。其中,该第一间隙是第一文件中的任一共通元素间隙,第二间隙是与第一间隙位置对应的共通元素间隙。
步骤1043,将第一元素和第二元素进行字符对比,以确定第一元素和第二元素的共通字符、删除字符、添加字符和更新字符。
可以理解的是,n个删除元素可以是一个或多个删除元素,m个添加元素可以是一个或多个添加元素,且n可能等于m,也可能n不等于m。
但是无论n和m是否相同,上述的将第一间隙中的n个删除元素与第二间隙中的m个添加元素的字符内容进行对比时,均可以采用以下方法:
首先,将n个删除元素合并为一个元素X,将m个添加元素也合并为一个元素Y,然后将元素X和元素Y以字符为单位,计算元素X和元素Y的最长公共子序列,该最长公共子序列中的字符就是元素X和元素Y的共通字符,X中除了共通字符外的剩余字符就是删除字符,Y中除了共通字符外的剩余字符就是添加字符,当X的某一共通字符间隙中存在删除字符,且Y中对应的共通字符间隙中存在添加字符,则这一组共通字符间隙中的删除字符和添加字符为更新字符。然后可以将共通字符、删除字符、添加字符和更新字符分别进行标记,以便在展示时提供更明显地对比效果。
示例性的,图7是根据本公开一示例性实施例示出的一种更新行的标记方法的示意图,如图7所示,分别示出了两个文件中的内容,以及对比后的识别结果,其中将第一文件和第二文件中存在不同的位置用方框框出,并用“<>”表示更新行(即表示Changed),用“!=”表示存在属性更新的共通行(即表示Updated),用“==”表示完全相同的共通行(即表示Identical)。则如图7所示,共通行用“==”进行标记。在确定了共通行之后,共通行间隙也就确定了,因此能够根据共通行间隙确定更新行的位置,如图7中所示,第一文件和第二文件的第1行的内容不同,因此在进行对比时第一文件和第二文件的第1行不会算在共通行中,也就是说第一文件的第1行属于删除行,第二文件的第1行属于添加行的情况,因此第一文件和第二文件的第1行属于更新行,因此将第一文件和第二文件的第1行标记为“<>”,第一文件和第二文件中的第2-3行、第6行、第8行以及第10-16行属于共通行,且字符内容及属性均为完全相同,因此标记为“==”,而第5行和第7行也属于共通行,但是由于第一文件和第二文件的第5行和第7行中存在属性不同的字符,因此记为“!=”。并且进一步的,可以在展示时,将内容不同,以及属性不同的字符用方框进行标记,如图7中所示。或者,可以在展示对比结果时,先隐藏内容不同和属性不同的字符处的标记,当用户触发(例如鼠标移动到了这些位置上)时,再显示该标记。
通过上述技术方案,能够不依赖于复杂算法实现文件之间的对比和共通内容的对齐,从而能够根据对齐的共通内容查找文件之间的更新内容,能够降低实现难度,易于实现。
图8是根据本公开一示例性实施例示出的一种用于文件比较的更新查找装置的框图,如图8所示,该装置100可以包括:
对比模块110,用于在第一文件和第二文件中以每个预设单位的内容作为一个元素,对第一文件和第二文件进行对比,以获取第一文件与第二文件的最长公共子序列;
更新确定模块120,用于在根据最长公共子序列将第一文件中的共通元素与第二文件中的共通元素进行索引对齐后,根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和第二文件中的更新元素。
可选的,该装置100还可以包括:
第一更新识别模块130,用于将第一文件和第二文件中位置对应的每对共通元素进行字符对比,以确定每对共通元素是否完全相同;
第二更新识别模块140,用于将第一文件和第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
可选的,图9是根据本公开一示例性实施例示出的一种更新确定模块的框图,如图9所示,该更新确定模块120,可以包括:
元素识别子模块121,用于根据最长公共子序列,确定第一文件中的共通元素和删除元素,以及第二文件中的共通元素和添加元素,删除元素为第一文件中除共通元素之外的其他元素,添加元素为第二文件中除共通元素之外的其他元素;
元素对齐子模块122,用于通过将第一文件中的共通元素与第二文件中的共通元素建立索引对应关系,将第一文件中的共通元素与第二文件中的共通元素进行索引对齐;
间隙对应子模块123,用于在第一文件中的共通元素与第二文件中的共通元素索引对齐后,确定第一文件中共通元素间隙与第二文件中的共通元素间隙的位置对应关系;
元素确定子模块124,用于根据第一文件中的删除元素所在的共通元素间隙与第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定第一文件和第二文件中的更新元素。
可选的,该元素确定子模块121,用于:
当在第一文件中的共通元素的第一间隙处存在n个删除元素,且在第二文件中的共通元素的第二间隙处存在m个添加元素时,将第一间隙中的n个删除元素和第二间隙中的m个添加元素确定为更新元素,第一间隙是第一文件中的任一共通元素间隙,第二间隙是与第一间隙位置对应的共通元素间隙;
将第一间隙中的n个删除元素的索引与第二间隙中的m个添加元素的索引建立对应关系。
可选的,图10是根据本公开一示例性实施例示出的一种第一更新识别模块的框图,如图10所示,该第一更新识别模块130,可以包括:
属性对比子模块131,用于将第一文件中的第一共通元素中的每个字符与第二文件中的第二共通元素中的对应字符进行属性对比,以确定第一共通元素与第二共通元素中是否存在属性不同的字符,第一共通元素为第一文件中的任一共通元素,第二共通元素是第二文件中与所述第一共通元素索引对齐的共通元素;
确定子模块132,用于当第一共通元素与第二共通元素中存在至少一个属性不同的字符时,将第一共通元素与第二共通元素确定为属性更新;
确定子模块132,还用于当第一共通元素与第二共通元素中不存在属性不同的字符时,将第一共通元素与第二共通元素确定为完全相同。
可选的,图11是根据本公开一示例性实施例示出的一种第二更新识别模块的框图,如图11所示,该第二更新识别模块140,可以包括:
合并子模块141,用于将第一文件中的共通元素的第一间隙中的n个删除元素合并为第一元素;
合并子模块141,还用于将第二文件中的共通元素的第二间隙中的m个添加元素合并为第二元素,第一间隙是第一文件中的任一共通元素间隙,第二间隙是与第一间隙位置对应的共通元素间隙;
字符对比子模块142,用于将第一元素和第二元素进行字符对比,以确定第一元素和第二元素的共通字符、删除字符、添加字符和更新字符。
通过上述技术方案,能够不依赖于复杂算法实现文件之间的对比和共通内容的对齐,从而能够根据对齐的共通内容查找文件之间的更新内容,能够降低实现难度,易于实现。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图12是根据一示例性实施例示出的一种电子设备的框图。如图12所示,该电子设备200可以包括:处理器201,存储器202。该电子设备200还可以包括多媒体组件203,输入/输出(I/O)接口204,以及通信组件205中的一者或多者。
其中,处理器201用于控制该电子设备200的整体操作,以完成上述的用于文件比较的更新查找方法中的全部或部分步骤。存储器202用于存储各种类型的数据以支持在该电子设备200的操作,这些数据例如可以包括用于在该电子设备200上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器202可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件203可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器202或通过通信组件205发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口204为处理器201和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件205用于该电子设备200与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G、4G、NB-IOT、eMTC、或其他5G等等,或它们中的一种或几种的组合,在此不做限定。因此相应的该通信组件207可以包括:Wi-Fi模块,蓝牙模块,NFC模块等等。
在一示例性实施例中,电子设备200可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的用于文件比较的更新查找方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的用于文件比较的更新查找方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器202,上述程序指令可由电子设备200的处理器201执行以完成上述的用于文件比较的更新查找方法。

Claims (9)

1.一种用于文件比较的更新查找方法,其特征在于,所述方法包括:
在第一文件和第二文件中以每个预设单位的内容作为一个元素,对所述第一文件和所述第二文件进行对比,以获取所述第一文件与所述第二文件的最长公共子序列;
在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素;
所述根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素,包括:
当在所述第一文件中的共通元素的第一间隙处存在n个删除元素,且在所述第二文件中的共通元素的第二间隙处存在m个添加元素时,将所述第一间隙中的所述n个删除元素和所述第二间隙中的所述m个添加元素确定为更新元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;
将所述第一间隙中的所述n个删除元素的索引与所述第二间隙中的所述m个添加元素的索引建立对应关系。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同;
通过将所述第一文件和所述第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定所述每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
3.根据权利要求1所述的方法,其特征在于,所述在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素,包括:
根据所述最长公共子序列,确定所述第一文件中的共通元素和删除元素,以及所述第二文件中的共通元素和添加元素,所述删除元素为所述第一文件中除所述共通元素之外的其他元素,所述添加元素为所述第二文件中除所述共通元素之外的其他元素;
通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐;
在所述第一文件中的共通元素与所述第二文件中的共通元素索引对齐后,确定所述第一文件中共通元素间隙与所述第二文件中的共通元素间隙的位置对应关系;
根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
4.根据权利要求2所述的方法,其特征在于,所述将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同,包括:
将所述第一文件中的第一共通元素中的每个字符与所述第二文件中的第二共通元素中的对应字符进行属性对比,以确定所述第一共通元素与所述第二共通元素中是否存在属性不同的字符,所述第一共通元素为所述第一文件中的任一共通元素,所述第二共通元素是所述第二文件中与所述第一共通元素索引对齐的共通元素;
当所述第一共通元素与所述第二共通元素中存在至少一个属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为属性更新;
当所述第一共通元素与所述第二共通元素中不存在属性不同的字符时,将所述第一共通元素与所述第二共通元素确定为完全相同。
5.一种用于文件比较的更新查找装置,其特征在于,所述装置包括:
对比模块,用于在第一文件和第二文件中以每个预设单位的内容作为一个元素,对所述第一文件和所述第二文件进行对比,以获取所述第一文件与所述第二文件的最长公共子序列;
更新确定模块,用于在根据所述最长公共子序列将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐后,根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素;所述根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素,包括:当在所述第一文件中的共通元素的第一间隙处存在n个删除元素,且在所述第二文件中的共通元素的第二间隙处存在m个添加元素时,将所述第一间隙中的所述n个删除元素和所述第二间隙中的所述m个添加元素确定为更新元素,所述第一间隙是所述第一文件中的任一共通元素间隙,所述第二间隙是与所述第一间隙位置对应的共通元素间隙;将所述第一间隙中的所述n个删除元素的索引与所述第二间隙中的所述m个添加元素的索引建立对应关系。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一更新识别模块,用于将所述第一文件和所述第二文件中位置对应的每对共通元素进行字符对比,以确定所述每对共通元素是否完全相同;
第二更新识别模块,用于将所述第一文件和第二文件中存在更新元素的位置对应的每对共通元素间隙中的更新元素进行字符对比,以确定所述每对共通元素间隙中的更新元素的共通字符、删除字符、添加字符和更新字符。
7.根据权利要求5所述的装置,其特征在于,所述更新确定模块,包括:
元素识别子模块,用于根据所述最长公共子序列,确定所述第一文件中的共通元素和删除元素,以及所述第二文件中的共通元素和添加元素,所述删除元素为所述第一文件中除所述共通元素之外的其他元素,所述添加元素为所述第二文件中除所述共通元素之外的其他元素;
元素对齐子模块,用于通过将所述第一文件中的共通元素与所述第二文件中的共通元素建立索引对应关系,将所述第一文件中的共通元素与所述第二文件中的共通元素进行索引对齐;
间隙对应子模块,用于在所述第一文件中的共通元素与所述第二文件中的共通元素索引对齐后,确定所述第一文件中共通元素间隙与所述第二文件中的共通元素间隙的位置对应关系;
元素确定子模块,用于根据所述第一文件中的删除元素所在的共通元素间隙与所述第二文件中的添加元素所在的共通元素间隙的位置对应关系,确定所述第一文件和所述第二文件中的更新元素。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4中任一项所述方法的步骤。
9.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-4中任一项所述方法的步骤。
CN201811625251.3A 2018-12-28 2018-12-28 用于文件比较的更新查找方法、装置、存储介质和设备 Active CN109740125B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811625251.3A CN109740125B (zh) 2018-12-28 2018-12-28 用于文件比较的更新查找方法、装置、存储介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811625251.3A CN109740125B (zh) 2018-12-28 2018-12-28 用于文件比较的更新查找方法、装置、存储介质和设备

Publications (2)

Publication Number Publication Date
CN109740125A CN109740125A (zh) 2019-05-10
CN109740125B true CN109740125B (zh) 2023-06-27

Family

ID=66361944

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811625251.3A Active CN109740125B (zh) 2018-12-28 2018-12-28 用于文件比较的更新查找方法、装置、存储介质和设备

Country Status (1)

Country Link
CN (1) CN109740125B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111104788B (zh) * 2019-12-05 2023-09-22 东软集团股份有限公司 文档差分内容的对齐方法、装置、存储介质、电子设备
CN114356245B (zh) * 2022-01-12 2023-09-22 济南点量软件有限公司 一种海量文件快速比对更新的方法及系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589838A (zh) * 2015-12-24 2016-05-18 中国电子科技集团公司第三十三研究所 一种基于文件比较的电子公文痕迹保留方法
CN106372040A (zh) * 2016-08-24 2017-02-01 长园深瑞继保自动化有限公司 智能变电站配置文件差异性比较系统
CN106469219A (zh) * 2016-09-09 2017-03-01 武汉长光科技有限公司 一种嵌入式设备配置文件同步比较的方法
CN107273359A (zh) * 2017-06-20 2017-10-20 北京四海心通科技有限公司 一种文本相似度确定方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105589838A (zh) * 2015-12-24 2016-05-18 中国电子科技集团公司第三十三研究所 一种基于文件比较的电子公文痕迹保留方法
CN106372040A (zh) * 2016-08-24 2017-02-01 长园深瑞继保自动化有限公司 智能变电站配置文件差异性比较系统
CN106469219A (zh) * 2016-09-09 2017-03-01 武汉长光科技有限公司 一种嵌入式设备配置文件同步比较的方法
CN107273359A (zh) * 2017-06-20 2017-10-20 北京四海心通科技有限公司 一种文本相似度确定方法

Also Published As

Publication number Publication date
CN109740125A (zh) 2019-05-10

Similar Documents

Publication Publication Date Title
CN113378061B (zh) 一种信息搜索方法、装置、计算机设备及存储介质
US20150293975A1 (en) Method and device for searching for contact object, and storage medium
CN105302626B (zh) Xps结构化数据的解析方法
US20130246380A1 (en) Learning support device, learning support method and storage medium in which learning support program is stored
CN109740125B (zh) 用于文件比较的更新查找方法、装置、存储介质和设备
CN111797594A (zh) 基于人工智能的字符串处理方法及相关设备
CN113849748A (zh) 信息展示方法、装置、电子设备及可读存储介质
US8271493B2 (en) Extensible mechanism for grouping search results
US9317189B1 (en) Method to input content in a structured manner with real-time assistance and validation
CN114297143A (zh) 一种搜索文件的方法、显示文件的方法、装置及移动终端
US20130322759A1 (en) Method and device for identifying font
JP5829330B2 (ja) フォントを識別するための方法および装置
CN102902751A (zh) 移动终端中的网页输入方法及装置、移动终端
CN111602129B (zh) 针对注释和墨迹的智能搜索
CN110134920A (zh) 绘文字兼容显示方法、装置、终端及计算机可读存储介质
CN109684437B (zh) 用于文件比较的内容对齐方法、装置、存储介质和设备
CN110941744A (zh) 一种数据列表添加器及添加方法
CN109815446B (zh) 页边界处理方法、装置、存储介质和电子设备
CN112149402B (zh) 文档对比方法、装置、电子设备和计算机可读存储介质
CN111723177B (zh) 信息提取模型的建模方法、装置及电子设备
CN109840080B (zh) 字符属性比较方法、装置、存储介质及电子设备
CN114610955A (zh) 一种智能检索方法、装置、电子设备及存储介质
US20150095314A1 (en) Document search apparatus and method
CN111104788B (zh) 文档差分内容的对齐方法、装置、存储介质、电子设备
CN106126048B (zh) 一种移动设备的联系人信息的查询方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant